JP2021500860A - 高効率標的in situゲノムワイドプロファイリング - Google Patents

高効率標的in situゲノムワイドプロファイリング Download PDF

Info

Publication number
JP2021500860A
JP2021500860A JP2020517134A JP2020517134A JP2021500860A JP 2021500860 A JP2021500860 A JP 2021500860A JP 2020517134 A JP2020517134 A JP 2020517134A JP 2020517134 A JP2020517134 A JP 2020517134A JP 2021500860 A JP2021500860 A JP 2021500860A
Authority
JP
Japan
Prior art keywords
dna
chromatin
run
cut
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020517134A
Other languages
English (en)
Other versions
JP2021500860A5 (ja
JP7241069B2 (ja
Inventor
スティーブン ヘニコフ,
スティーブン ヘニコフ,
オクル, ハティス セダ カヤ
オクル, ハティス セダ カヤ
テリー ドーン ブライソン,
テリー ドーン ブライソン,
ピーター ジェイムズ スキーン,
ピーター ジェイムズ スキーン,
Original Assignee
フレッド ハッチンソン キャンサー リサーチ センター
フレッド ハッチンソン キャンサー リサーチ センター
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=65811500&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2021500860(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by フレッド ハッチンソン キャンサー リサーチ センター, フレッド ハッチンソン キャンサー リサーチ センター filed Critical フレッド ハッチンソン キャンサー リサーチ センター
Publication of JP2021500860A publication Critical patent/JP2021500860A/ja
Publication of JP2021500860A5 publication Critical patent/JP2021500860A5/ja
Priority to JP2022184103A priority Critical patent/JP2023015327A/ja
Application granted granted Critical
Publication of JP7241069B2 publication Critical patent/JP7241069B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6872Intracellular protein regulatory factors and their receptors, e.g. including ion channels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/705Fusion polypeptide containing domain for protein-protein interaction containing a protein-A fusion
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Hematology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

透過処理された細胞または核と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、特異的結合剤は、不活性であるヌクレアーゼまたは活性化可能なトランスポソームに連結されている、ステップと;ヌクレアーゼまたはトランスポザーゼを活性化し、それによって、目的のクロマチン関連因子に結合しているクロマチンDNAの配列を切り出すステップと;切り出されたDNAを単離するステップと;切り出されたDNAの配列を決定し、それによって、細胞内のクロマチンDNAの配列への目的のクロマチン関連因子の結合を検出するステップとを含む、細胞内のクロマチンDNAの配列への目的のクロマチン関連因子の結合を検出するための方法。

Description

関連出願の相互参照
本出願は、2017年9月25日に出願された米国仮特許出願第62/562,918号の恩典を主張するものであり、その全体がこれにより参照により本明細書に具体的に組み込まれる。
技術分野
本開示は、クロマチンプロファイリングの方法に関する。具体的には、本開示は、転写因子およびヌクレオソームなどのDNA結合タンパク質をプロファイリングするための方法であって、トランスポザーゼまたはヌクレアーゼなどの酵素による、抗体標的化制御切断によって、DNAシーケンシングのための結合DNAが放出される、方法に関する。
背景
転写因子(TF)の、DNA上のそれらの結合部位における作用は、遺伝子発現パターンを推進し、そのためゲノムワイドTFマッピングは、個々の研究者らおよび大規模なインフラストラクチャープロジェクトの両方にとっての中心的目標になっている。TFプロファイリングは、30年以上前にそれが最初に導入されて以来ほとんど変化していないプロトコールである、クロマチン免疫沈降(ChIP)を使用して最もよく行われる(Solomon and Varshavsky, 1985)。細胞をホルムアルデヒドで架橋し、クロマチンを断片化および可溶化し、抗体を添加し、抗体に結合したクロマチンをDNA抽出のために回収する。DNAマッピング技術の継続的進歩は、X−ChIP(ホルムアルデヒド架橋ChIP)の使用に大変革をもたらしており、ChIP−seqとともに、TFの塩基対分解能マッピングが実現可能になった(Rhee and Pugh, 2011;Skene and Henikoff, 2015;He et al., 2015)。
転写因子および他のタンパク質との直接的物理的相互作用における特異的DNA部位を、クロマチン免疫沈降(immuneprecipitation)によって単離して、in vivoで目的のタンパク質に結合した標的DNA部位のライブラリーを産生し得る。超並列シーケンシングの到来とともに、ライブラリーを迅速に分析し得、全ゲノム配列データベースにマッピングして、任意のタンパク質とDNAとの相互作用パターン、または任意のエピジェネティッククロマチン修飾のパターンを判定し得る。これは、転写因子、ポリメラーゼおよび転写装置、構造タンパク質、タンパク質修飾、ならびにDNA修飾など、一連のChIP可能なタンパク質および修飾に適用され得る。ChIPシーケンシング(ChIP−seq)を使用して、例えば遺伝子発現を調節するために、どのようにタンパク質がDNAと相互作用するのかを判定し得る。ChIP−seq技術は、現在、主に、ハイブリダイゼーションアレイを必要とするChIPチップに代わるものとして見られている。アレイは固定数のプローブに制限されるので、これは必然的に何らかのバイアスを導入する。ChIP−seqへの向上は、ゲノム全体を断片化して免疫沈降のための可溶性抽出物を創出する間、in vivoパターンを保つ架橋ステップを保持する。しかしながら、架橋はエピトープマスキングを促進し得、偽陽性結合部位を生成し得る(Teytelman et al., 2013;Park et al., 2013;Jain et al., 2015;Baranello et al., 2016;Meyer and Liu, 2014)。ChIPは、静電接触を妨げないイオン条件を使用して、架橋なしでも実施され得る(Kasinathan et al., 2014)。「ネイティブ」ChIPは直接的なタンパク質−DNA相互作用のマップを提供し、感度および特異度トレードオフはX−ChIP法に勝るとも劣らない。ネイティブChIPは、エピトープマスキングに関する問題も最小限に抑え、X−ChIPと比べて効率を向上させ、したがって、出発細胞数が低い場合に、より適している(O'Neill et al., 2006;Brind'Amour et al., 2015)。しかし、タンパク質−DNA複合体の不完全な抽出効率、および結合の潜在的喪失に関する問題は残る。また、可溶化は、全クロマチンを抗体に曝露し、非特異的バックグラウンドをもたらし、それがシグナル対ノイズを限定し、特異的なクロマチン特質を見分ける余分なシーケンシングを必要とする。これらのバイアスおよび非効率性が理由で、ChIPは多数の細胞を必要とするので、例えば限定された数の初代細胞または少量の組織しかない場合には不適切である。ゆえに、新しくかつより優れた、ChIPに基づかない方法が必要とされる。本開示はそれらの必要性を満たす。
実施形態は、添付の図面と併せて後続の詳細な説明によってよりよく理解されるであろう。実施形態は、例として示されるものであり、添付の図面の図に限定する目的で示されるものではない。
Solomon MJ, Varshavsky A. 1985. Formaldehyde-mediated DNA-protein crosslinking: a probe for in vivo chromatin structures. PNAS 82:6470−6474. doi: 10.1073/pnas.82.19.6470, PMID: 2995966 Rhee HS, Pugh BF. 2011. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147:1408−1419. doi: 10.1016/j.cell.2011.11.013, PMID: 22153082 Skene PJ, Henikoff S. 2015. A simple method for generating high-resolution maps of genome-wide protein binding. eLife 4:e09225. doi: 10.7554/eLife.09225, PMID: 26079792 He Q, Johnston J, Zeitlinger J. 2015. ChIP-nexus enables improved detection of in vivo transcription factor binding footprints. Nature Biotechnology 33:395−401. doi: 10.1038/nbt.3121 Teytelman L, Thurtle DM, Rine J, van Oudenaarden A. 2013. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. PNAS 110:18602−18607. doi: 10.1073/pnas.1316064110, PMID: 24173036 Park D, Lee Y, Bhupindersingh G, Iyer VR. 2013. Widespread misinterpretable ChIP-seq bias in yeast. PLoS One 8:e83506. doi: 10.1371/journal.pone.0083506, PMID: 24349523 Jain D, Baldi S, Zabel A, Straub T, Becker PB. 2015. Active promoters give rise to false positive ’Phantom Peaks’ in ChIP-seq experiments. Nucleic Acids Research 43:6959−6968. doi: 10.1093/nar/gkv637, PMID: 26117547 Baranello L, Kouzine F, Sanford S, Levens D. 2016. ChIP bias as a function of cross-linking time. Chromosome Research 24:175−181. doi: 10.1007/s10577-015-9509-1, PMID: 26685864 Meyer CA, Liu XS. 2014. Identifying and mitigating bias in next-generation sequencing methods for chromatin biology. Nature Reviews Genetics 15:709−721. doi: 10.1038/nrg3788, PMID: 25223782 Kasinathan S, Orsi GA, Zentner GE, Ahmad K, Henikoff S. 2014. High-resolution mapping of transcription factor binding sites on native chromatin. Nature Methods 11:203−209. doi: 10.1038/nmeth.2766, PMID: 24336359 O’Neill LP, VerMilyea MD, Turner BM. 2006. Epigenetic characterization of the early embryo with a chromatin immunoprecipitation protocol applicable to small cell populations. Nature Genetics 38:835−841. doi: 10.1038/ ng1820, PMID: 16767102 Brind’Amour J, Liu S, Hudson M, Chen C, Karimi MM, Lorincz MC. 2015. An ultra-low-input native ChIP-seq protocol for genome-wide profiling of rare cell populations.
図1A〜1Dは、本明細書で開示されるCUT&RUN方法が、TF−DNA複合体の制限消化物を生じさせることを示す。図1A:CUT&RUN戦略の模式図。磁気ビーズに結合された核を、抗体で(または必要に応じて一次および二次抗体で)、および核膜孔を通って拡散するプロテインA−MNase(pA−MN)で、うまく処置することができる。MNase切断を活性化するためのCa++の添加後、断片が放出され、核から拡散する。上清から抽出されたDNAは、ペアードエンドシーケンシング用のライブラリーを調製するために使用される。図1B;CUT&RUNは、クロマチン粒子を切断し、S.cerevisiae核内に放出する。この核内の内在性H2A遺伝子をH2A−3XFLAGで置き換え、CUT&RUNに供し、0℃で、Ca++中で、示されている時間、インキュベートした。不溶性(ins)および可溶性(sol)画分両方から抽出したDNAを1%アガロースゲルで電気泳動した。10分間並行して、しかし一次マウス抗FLAG抗体を添加せずに、No1°Ab対照を消化した。図1C;示されているTF試料のシーケンシングからのマッピングされたペアードエンドリードのサイズ分布。H2Aサイズ分布が比較のために含まれている。データは、塩基対の各々の長さのステップでのポイント全ての合計が1になるように正規化されている。図1D;120bp未満のおよび150bpより長い断片長クラスを示す、Abf1およびReb1試料についてのタイムコースプロファイル(1トラック当たり約2,000,000〜3,000,000のマッピングされたペアードエンドリード)であって、ORGANIC ChIP−seq(マッピングされたペアードエンドリード約20,000,000〜30,000,000)および標準ChIP−seq(Paul et al., 2015)(Abf1にマッピングされたシングルエンド50bpリード約5,000,000、およびReb1にマッピングされたシングルエンド50bpリード約126,000,000)と比較したプロファイル。陰性対照トラックは、一次抗体の除外(No1°Ab)の結果を示す。各々のTFおよび断片サイズ群の中で、Y軸のスケールは、IGVにより自動スケーリングされて正規化されたカウントを示し、断片サイズクラスがスーパーインポーズされている。チェックマークは、有意なAbf1(上方)およびReb1(下方)モチーフの位置を示す。この領域は、3番染色体上のAbf1モチーフの最大クラスターを有するので選択した。
図2Aおよび2Bは、CUT&RUNの精度およびロバストネスが、ChIP−seqに引けを取らないことを示す。1”〜32”タイムコース試料をプールして120bp未満のサイズのクラスと150bpより大きいサイズのクラスに分ける(左側)単一の実験(20160630)からのCUT&RUNデータセットのAbf1(図2A)およびReb1(図2B)ヒートマップ。120bp未満のサイズクラスのORGANIC ChIP−seq(中央)および標準ChIP−seqデータセット(右側)も、示されている。Abf1は、約10bpの間隔を空けて2つのDNA結合ドメインを有する(Cho et al., 1995)が、Reb1は、単一のMyb様DNA結合ドメインを有する(Morrow et al., 1990)。MNase消化後のAbf1クロマチンの可溶化は、特異度と感度間の最高のトレードオフを達成するために600mM NaClを必要としたが、Reb1については、80mMで最高の結果が得られており(Kasinathan et al., 2014)、これらが比較に使用されたデータセットである。ORGANICとChIP−exoおよびChIP−チップとの以前の比較(Kasinathan et al., 2014)と同様に、全ての統計的に有意なAbf1およびReb1モチーフのセットは、感度(正しいTFによる部位の占有)および特異度(誤ったTFの部位からの排除)を判断するための「究極の判断基準」と考えられる。アラインメントされているプロファイリングデータは、表示のために(Abf1およびReb1部位が互いに50bp以内にある81部位を除去して)同じTFについての(上部)および他のTFについての(下部)モチーフを中心とし、方向性を持たせたものであり、Java(登録商標) Treeviewを使用してlogスケーリングおよびコントラスト=5で120bp未満のデータセットの−1kb〜+1kpスパンで平均画素密度により順序付けされたものである。順序付けは、CUT&RUN(120bp未満の断片に基づく)およびChIP−seqについて独立して行った。この場合、隣接領域に対する占有された部位のおおよその割合が明らかになり、上部パネル(正しいTF)と下部パネル(誤ったTF)の比較により、データセットについての感度/特異度トレードオフが示される。部位は、ChIP−seqデータに基づいて位置特異的スコア行列(PSSM)を使用してS.cerevisiaeゲノムのMAST検索により決定したが、CUT&RUNデータに基づいてPSSMを用いるMASTを使用しても同様の結果が得られた。
図3A〜3Cは、CUT&RUNが高分解能でTF結合部位をマッピングすることを示す。図3A;断片末端のマッピングは、組み合わせた1”〜32”データセット(図2参照)からの全ての正規化された塩基対カウントをプロットして、それらの方向性を持つアラインメントされたモチーフでゲノムワイドに平均したAbf1およびReb1 CUT&RUNデータセットについて、深い「穴」および急勾配の「壁」を明示する。下流および上流の「勾配」に明らかな約10bpの周期性がある鋸歯状パターンが、図3Aに示されている1bp分解能プロファイルと、11bpスライディングウインドウで平滑化された同じプロファイルとの間の差異の図3B自己相関分析により確認され、図3Bは、平均G+C含量(細い線)には対応する周期性がないことも示す。図3Cは、図3Aと同じであるが、11bpスライディングウインドウでの平滑化に供され、より大きいスケールで表示されている。Reb1周辺の勾配が+150および−150で落ち込みを示すことは、ORGANICインプットデータからの150bpより大きいサイズクラスに基づいて下(核、Y軸任意単位)に示されている、位相が定まったヌクレオソームの存在を表す可能性が高い(Kasinathan et al., 2014)。
図4A〜4Cは、CUT&RUNが大きい移動性クロマチン複合体を正確にマッピングすることを示す。図4A;2つのMNase消化時点についてのMot1 ORGANICデータ(2.5分および10分、1試料当たり平均22,000,000リード)(Zentner and Henikoff, 2013)とアラインメントされた、一次抗体なし(No1°Ab)陰性対照を含む、Mot1 CUT&RUNタイムコース実験(1試料当たり平均約3,000,000のペアードエンドリード)を示す代表トラック。点線として示されているTBP部位は、Mot1ピークがTBPピーク最大値のすぐ上流にあることを明示する。図4B;絶対定量を示す、スパイクイン正規化されたSth1 CUT&RUN消化についての120倍範囲にわたっての占有プロファイル。図4C;Sth1 ORGANICプロファイル(約15,000,000リード)は、CUT&RUN 5秒試料(約2,000,000リード)との一致を示す。同じ120bp未満のCUT&RUN 5秒プロファイルが、両方のパネル(図4B)および(図4C)に示されているが、異なるスケールで示されていることに留意されたい。
図5A〜5Dは、CUT&RUNが希少な高不溶性S.cerevisiae動原体複合体をマッピングすることを示す。図5A;示されている時間にわたっての消化を停止した後、試料を半分に分割し、可溶性画分と全DNAの両方を抽出した。大きい断片をライブラリー調製前にAMPureビーズで全DNAから除去した。正規化されたカウントがS.cerevisiaeの1番セントロメアについて示されており、ここでのCse4およびH2Aトラックは、同じY軸スケールのものである。セントロメアにわたって同様の最大値もゲノムワイドに見られた。図5Bは、図5Aと同じであるが、セントロメアの5kb区画を徐々に拡大したものである。図5C;それらの中点周辺でアラインメントされた、16のS.cerevisiaeセントロメア全ての中央値についてlog(不溶性)=log(合計)−log(可溶性)=log(合計/可溶性)と定義される、不溶性Cse4およびH2Aの占有率。公表されているX−ChIP−seqプロファイル(Pekgoz Altunkaya et al., 2016)が比較のために同じスケールで示されている(左側)。アスタリスク:2回の反復実験を平均したlog(ChIP/インプット)。図5D;示されている時間にわたって消化されたホルムアルデヒド架橋細胞に適用されたCse4およびH2A CUT&RUNの正規化されたカウントのプロファイル。
図6A〜6Cは、CUT&RUNがCTCFの高分解フットプリントをマッピングすることを示す。図6A;ENCODE CTCF ChIP(GSM749690)、CTCF ChIP−exo、およびCUT&RUNからの10,000,000のランダムにサンプリングされたリードについてのゲノム遺伝子座に関する代表シグナル。上部パネルでは、y軸は全データセットについて同じであり、これは、CUT&RUNについてのより高いダイナミックレンジを示す。下部パネルでは、y軸が個別に設定されている。図6B;ヒトK562細胞におけるCTCFについての、120bp未満のサイズクラス(断片末端を含む)と150bpより大きいサイズクラスに分けられたCUT&RUNプールデータセット(7.5分〜45分)の、ならびにENCODE X−ChIP−seqおよび高分解能X−ChIP−seq(Skene and Henikoff, 2015)の、ヒートマップ。DNase1高感受性部位内に見られ、ゲノム位置により順序付けされたCTCFモチーフに関するデータを中心とし、これらのデータに方向性を持たせた、偏りのないアプローチによって、部位を決定した。上流および下流ヌクレオソームの非対称放出は、モチーフの片側からのヌクレオソームへの接近を制御するエピトープ位置に起因する可能性が高い。図6C;上記のような部位を中心としたCUT&RUN消化タイムコースから得られる120bp未満の断片からの末端位置の平均プロット。データは、±1kb隣接領域内の最大シグナルのパーセンテージとして表されている。
図7Aおよび7Bは、CTCFが、全部位でのロバストなフットプリントにもかかわらずにCUT&RUNピークのサブセットに直接結合することを示す。図7A;クロマチンをネイティブ条件下で断片化し、可溶化し、ネイティブインプットとして直接シーケンシングしたか、またはCTCF結合クロマチンを免疫沈降し、シーケンシングした。ENCODE X−ChIP−seqを比較目的で分析した。CTCFモチーフとのベストマッチを用いて、ネイティブ条件下でのCTCF結合のピークを同定し、中心に据えた(JASPARデータベースMA0139.1、jaspar.genereg.net/)。データを、これらの部位(−1〜+1kb)に関してネイティブChIP DNA断片(20〜75bp)およびCUT&RUN(120bp未満)についてヒートマップとしてプロットし、ネイティブCTCF ChIP占有率(隣接部(−1000〜−700および+700〜+1000bp)の合計を引いた中心領域(−30〜+30bp)の合計)によって順序付けた。下のグラフは、ピークコール部位(−30〜+30bp)に関する、およびCTCFモチーフとの類似性によりランク付けされた、異なる技法についてのシーケンシングカウントの累積パーセントを示す。これは、ネイティブChIPピークにおけるクロマチンプロファイリング技法間での高度の一致を示す。ネイティブChIPおよびCUT&RUNについてのダイナミックレンジスケールが、ネイティブインプットおよびENCODE X−ChIPについてのものと比べて約30〜40倍高いことに留意されたく、これは、インプットおよびENCODEパターンを示すために必要であった。図7B;図7Aのように処理して、CUT&RUNのピークコール部位に関してプロットしたデータ。累積分布は、CUT&RUN部位についてより低いモチーフスコアへのシフトを示す(CUT&RUNとネイティブChIP間の分離を参照されたい)。
図8A〜8Cは、ネイティブChIPと組み合わせたCUT&RUNが直接的および間接的3D接触部位を識別できることを示す。図8A;CTCFについてのCUT&RUN(120bp未満)、ネイティブChIP(20〜75bp)データおよびCTCF ChIA−PET断片(GSM1872886;15より大きいスコア)を表示する、典型的なゲノム領域。ChIA−PET断片は、直接的相互作用(ネイティブChIPピークとオーバーラップする)または間接的相互作用(CUT&RUNピークのみとオーバーラップする)によると見なされた。図8B;ピークコール部位を、直接的(ネイティブChIPに存在する)または間接的(CUT&RUNにのみ存在する)のどちらかで分けた。直接的部位または同数のランダムゲノム位置と交差するHi−C断片を同定した。次いで、Hi−C相互作用断片を間接的部位と交差させ、CUT&RUNシグナルをHi−C生シグナルと比較した。データをCUT&RUNスコアによりランク付けし、1500のウインドウサイズで移動平均としてプロットした。図8C;直接的部位を含有するChIA−PET断片を同定し、上記のように相互作用断片を直接的ピーク、間接的ピークまたはランダム位置と交差させた。これらの部位とオーバーラップしない相互作用断片を、カテゴリー分けされないものとして分類した。ボックスプロットは、相互作用断片で観察された接触についてのCUT&RUNスコアを示す。
図9Aおよび9Bは、CUT&RUNによってタンパク質−DNA相互作用の簡易定量が可能になることを示す。図9A;CUT&RUNの消化タイムコースをK562細胞においてCTCFについて行った。放出された断片の定量を可能にするために、1ngのショウジョウバエDNAを切断反応後に添加した。120bp未満のシーケンシングされた断片の平均プロットは、DNaseI部位内に見られるCTCFモチーフを中心とするものであった。データを、flyリード数に対して正規化(スパイクイン正規化)または総ヒトリード数に対して正規化(標準正規化)した。図9B;出発材料の滴定を使用して、ゲノムワイドにCTCF結合をマッピングした。スパイクインまたは標準正規化を使用して、120bp未満のシーケンシングされた断片についてヒートマップおよび平均プロットを生成した。データは、DNaseI部位内に見られるCTCFモチーフを中心とするものであった。
図10は、CUT&RUNおよびORGANIC ChIPが、質的に類似したTF占有プロファイルを生じさせることを示す。1”〜32”および64”〜128”タイムコース試料からプールされたCUT&RUNデータ、ならびに≦120bpおよび≧150bp断片長のORGANIC、ならびに標準ChIP−seqについての、Abf1およびReb1プロファイルの代表例。MNase−seqプロファイルが灰色で示されている。チェックマークは、有意なAbf1(上方)およびReb1(下方)モチーフの位置を示す。Y軸を各々の領域内でIGVにより自動スケーリングした。
図11Aおよび11Bは、CUT&RUN DNA放出の動態を示す。図11A;この研究で説明される2つの酵母TFについての1%アガロースゲルでの電気泳動であって、0℃で1〜128秒消化時系列にわたってのペレット画分(1試料当たり10μL)からのDNAの電気泳動。これらの部位は、酵母ゲノム内で平均約10kb離れているので、Abf1とReb1の両方について1秒〜128秒の消化時間にともなって断片サイズの漸減を観察することができる。ヒトゲノム内のCTCF部位間の平均距離は長すぎて、従来のゲルアッセイを使用して切断を観察することができない。図11B;Picogreen蛍光測定値に基づくDNAの放出パーセント:[Supn]/([Supn]+[ペレット])100。総収量約500ng/試料。
図12A〜12Cは、上清中の結合TFの定量的回収を示す。図12A;AMPureビーズで大きい断片を除去した後に上清画分(可溶性)と全DNAを比較したことを除いて、本明細書に記載されるとおりの単一実験からのCUT&RUNデータのAbf1プロファイルとReb1プロファイルの比較。図12B;図12Aにおける高TF占有領域の拡大。図12C;CUT&RUN≦120bp消化データとモチーフとのヒートマップアラインメントおよびTF占有率による順序付けは、対数スケーリングおよびコントラスト=5(2を中心とする)を用いたことを除き、本明細書に記載のとおり行った。
図13A〜13Eは、CUT&RUNおよびORGANIC ChIP−seqに基づくAbf1およびReb1モチーフが類似していることを示す。MEMEモチーフ発見プログラムを、図13A〜Bの1”〜32”プールCUT&RUN≦120bpデータ、(図13C)600mM Abf1および(図13D)80mM Reb1 ORGANICデータに適用した。対数オッズ配列ロゴが示されている。CUT&RUNおよびORGANICを使用して判定されたモチーフ間の密接な対応に注目されたい。図13E;モチーフに関するピークコールのパーセンテージ。各々の≦120bpデータセットについて、閾値セットを使用してピークをコールして、同様のピーク数(ストリンジェント 約650、および緩和 約1100)を回収した。
図14は、CUT&RUNがin situでの切断動態を明らかにすることを示す。1”〜32”および64”〜128”タイムコース試料をプールして≦120bp(左側)および≧150bp(右側)サイズクラスに分けた単一の実験(20160630)からのCUT&RUNデータのAbf1ヒートマップ(左側)とReb1ヒートマップ(右側)の比較。モチーフのアラインメントおよびTF占有率による順序付けは、対数スケーリングおよびコントラスト=3でTreeviewを使用したことを除き、前に説明したように行った。消化時間の増加に伴って、より多くのTFが放出され、≧150bp断片の「穴」が深くなるが、ダイナミックレンジの顕著な変化が一切ないことに注目されたい。CUT&RUNは、粒子検出についてMNase−seqよりはるかに高いダイナミックレンジを示す(上部パネルと下部パネルを比較されたい)。
図15A〜15Bは、Mot1についてのCUT&RUNおよびORGANICプロファイルを示す。図15A;TBP部位の周辺でアラインメントし、各々部位の周囲の2kb領域にわたってのMot1占有率の増加によって順序付けた、2つのCUT&RUNおよび2つのORGANIC時点のヒートマップ。図15B;絶対定量を示す、スパイクイン正規化されたMot1 CUT&RUN消化についての120倍範囲にわたっての占有プロファイル。
図16A〜16Bは、Sth1についてのCUT&RUNおよびORGANICプロファイルを示す。図16A;曲線下面積が等しくなるように正規化された、Sth1 CUT&RUN AMPureビーズフィルター処理済み全DNA断片の長さ分布。均一な消化および放出が、このタイムコースで観察される。データは、2回の生物学的反復実験から組み合わせたものである。抗FLAG一次抗体なし(No Ab)。図16B;Gal4 UAS(UASg、Floer et al., 2010)へのRSCのマッピングとの一致を示すGal1〜Gal4領域(ChrII:276,000〜281,000)のトラック。
図17A〜17Cは、CUT&RUNが希少な高不溶性S.cerevisiae動原体複合体をマッピングすることを示す。図17A;抗体およびpA−MN添加後、試料を半分に分割し、pA−MNをカルシウムで活性化し、標準100mM NaCl緩衝剤(−)または2M NaClを含有する緩衝剤(+)のどちらかで反応を停止させた。トラックは、絶対回収率を表すためにスパイクイン正規化を使用して1番染色体について表示されたものである。図17B;Cse4のクローズアップ図ならびにCse4およびH2Aの高塩抽出断片の低塩抽出断片に対する対数比。図17C;それらの中点周辺でアラインメントされた16全てのS.cerevisiaeセントロメアの中央値についての高塩抽出断片の低塩抽出断片に対する対数比。
図18は、CUT&RUNが、X−ChIP−seqを再現するが、より高いダイナミックレンジを有することを示す。以前に同定されたCTCF結合部位におけるゲノムワイドなダイナミックレンジの直接比較のために、10,000,000リードをENCODE CTCF X−ChIP−seq(GSM749690)およびCUT&RUNデータセットからランダムに選択し、ENCODEピークコール部位(GSM749690_narrowPeak)でプロットした。上方のプロットは、これらの部位の平均の生カウント平均値を示し、下のヒートマップは、遺伝子位置により順序付けられている。
図19A〜19Dは、CUT&RUNが、氷上で行われたとき低いバックグラウンドを有することを示す。プロトコール最適化中に、ある温度範囲で切断反応を行った。図19A;最初に、37℃をMNase反応に使用した。しかし、データの注意深い分析は、低密度のゲノムワイドなバックグラウンドでのCTCFのその真の部位への明確なマッピングにもかかわらず、本発明者らがランダムDNase1部位に特異的なバックグラウンドを有したことも示した。特異的バックグラウンドは、核の周辺に拡散してクロマチンの接近可能な領域をカットするプロテインA−MNaseがなお結合している遊離クロマチン複合体から生じることが、理論的に説明された。図19B;この仮説を試験するために、CTCF抗体およびプロテインA−MNaseがin situで結合した後、核膜を限定超音波処理で破壊してクロマチンを大きい反応体積の中へ放出した。CUT&RUNを破壊条件下で行ったとき、この特異的バックグラウンドは、もはや観察されなかった。図19C;これらのクロマチン複合体の拡散を、室温で切断反応を行うことによって制限した。シグナル対ノイズ比は、低く始まったが経時的に上昇し、8分までにノイズはシグナルと区別不能になった。図19D;しかし、氷上で反応を保持することにより、シグナル対ノイズ比は、高く、時間に依存しなかった。したがって、切断反応の温度を制御することにより、低バックグラウンドをロバストに維持することができる。
図20A〜20Cは、CUT&RUNの高いシグナル対ノイズ比が、X−ChIP−seqでは可能でないDNA結合部位のロバストな同定を可能にすることを示す。CUT&RUNをK562細胞においてMycおよびMaxについて行い、ENCODE X−ChIP−seqデータセット(GSM935410;GSM935539)と比較した。データセットごとに10,000,000リードをランダムに選択した。(図20A)典型的なゲノム領域が示されている。Mycについては異なる抗体を使用したことに留意されたく、したがって、定量的比較ができない。図20B;CUT&RUNにより同定された、またはENCODEにより以前に同定された、Mycピークコール部位とMaxピークコール部位の間のオーバーラップを表示する、比例ベン図。図20C;Max CUT&RUNにより同定されたピークコール部位(n=20146)でプロットされた、CUT&RUNおよびENCODE X−ChIP−seqシグナルを示すヒートマップ。部位をMax CUT&RUNスコアによりランク付けした。ヒートマップのダイナミックレンジの変化に注目されたい。
図21は、CUT&RUNが、圧縮されたクロマチンを高ダイナミックレンジでマッピングすることができることを示す。CUT&RUNは、全てのDNAを消化後に抽出し、その後、サイズ選択を行うことによって、またはカットされた断片を核から拡散させることによって、K562細胞においてH3K27me3について行った。比較のために、ENCODE H3K27me3 X−ChIP−seq(GSM733658)データセットを分析した。データセットごとに10,000,000リードをランダムに選択した。典型的なゲノム領域が、等しくスケーリングして上方パネルに、およびENCODEデータセットについて再スケーリングして下方パネルに示されている。
図22Aおよび22Bは、改良ネイティブChIPプロトコールによって完全タンパク質抽出が可能になることを示す。図22A;様々なSDSおよび超音波処理条件を用いるネイティブ条件下でのRNAポリメラーゼII(RNAPII)およびCTCFの抽出効率を試験するためのウエスタンブロット。図22B;ネイティブ条件下でのCTCFの可能性のある再分布を試験するために、抽出物を、スコアの高いモチーフ(陽性)またはシャッフルされた配列(陰性)または601ヌクレオソームポジショニング配列を1細胞当たり1000コピーで95bp DNAプローブとともにインキュベートした。ChIPおよびDNA抽出の後、定量的PCRを使用して、ゲノム内のネイティブピークとの(ゲノム性の)またはDNAプローブとのCTCFの結合について試験した。
図23は、CUT&RUNにより同定されたピークが、ネイティブChIPからのピークより多様な範囲のモチーフスコアを有することを示す。ピークコーリングをネイティブCTCF ChIP(明確なピークを含有しない偽陽性を除去した)およびCUT&RUNで行った。基礎DNA配列を両方向に100bp伸長し、JASPAR位置頻度行列(MA0139.1)に対するベストマッチおよびスコアを算出した。ヒストグラムによりモチーフスコアの分布がプロットされている。
図24は、CUT&RUNが細胞からDNAまでに1日未満しか必要としないことを示す。CUT&RUNプロトコールの模式的概要。細胞を採取し、コンカナバリンA被覆磁気ビーズに結合させる。細胞膜をジギトニンで透過処理して特異的抗体によるその標的の発見を可能にする。抗体とのインキュベーション後、ビーズを短時間洗浄し、次いで、pA−MNとともにインキュベートする。細胞を0℃に冷却し、Ca2+の添加で消化が開始する。スパイクインDNAを含むキレート化により反応を停止させ、切断により溶液に放出されたDNA断片を上清から抽出する。
図25は、大量に存在するヒストンエピトープ(H3K27me3)の同日陽性対照としてのTapestation分析を示す。これらの試料の残りを使用してシーケンシング用のライブラリーを作製し、結果を図28に示した。
図26は、抗CTCF抗体を使用するCUT&RUN切断断片のTapestation分析を示す。これらの試料の残りを使用してシーケンシング用のライブラリーを作製し、結果を図29に示した。
図27は、収量が消化時間とともに増加し、シグナル対ノイズ比が殆ど変化しないことを示す。スパイクインDNAにスケーリングすることにより、切断DNA断片の量の定量的測定が可能になる。約20,000のCTCF CUT&RUN結合部位の平均シグナルが、陰性対照領域としての同数のオーバーラップしていない転写開始部位(TSS)と比較される。部位またはTSSの中央を中心とする−50〜+50bp領域のスケーリングされたスパイクインシグナルを合計した。
図28は、CUT&RUN H3K27me3が、ヒトPolycombクロマチンランドスケープをプロファイリングするために100細胞しか必要としないことを示す。様々な数のK562細胞をCUT&RUNによるH3K27me3のプロファイリングのための出発材料として使用した。ペアードエンド25×25bp Illuminaシーケンシングおよび重複除去の後、7,500,000リードをランダムに選択し、y軸に示されているような生カウントを表すベッドグラフを生成するために使用した。比較のために、ENCODE XChIP−seqデータ(GSM733658)を同様に分析した。
図29は、CUT&RUNが、ヒトCTCFピークを描くために1000細胞および4,000,000リードしか必要としないことを示す。CUT&RUNを使用して、様々な数のK562細胞におけるCTCF結合部位をマッピングした。ペアードエンドシーケンシングの後、4,000,000の非重複リードをランダムに選択し、y軸に示されているような生カウントを表すベッドグラフを生成するために使用した。比較のために、ENCODE X−ChIP−seqデータ(GSM749690)を同様に分析した。
図30は、スピンカラムDNA精製が大きい断片と小さい断片の両方をある程度排除することを示す。異なる長さのDNA断片を結合する点でのスピンカラムの効率を試験するために、2μgの10bpラダーをそのカラムによって精製し、インプットとしての2μgと比較した。DNAを10%ポリアクリルアミドゲル電気泳動により分割し、SYBRgoldで染色した。濃度測定が左側に示されている。CUT&RUNについては、大きい断片の除去は、バックグラウンドを低減するが、小さい断片の除去は、DNA結合タンパク質をプロファイリングするときの回収率に影響を及ぼす。したがって、スピンカラム精製(ステップ39〜46)は、ヌクレオソームには好ましいが、転写因子にはそれほど望ましくなく、非常に少ない細胞数になる可能性があり、その場合、代替PCIプロトコール(ステップ47〜58)が推奨される。
図31Aおよび31Bは、CUT&RUN.ChIPが多タンパク質複合体の成分を効率的にマッピングすることを示す。図31A;CUT&RUN上清に適用されたChIP。標的タンパク質および抗FLAG抗体(続いて、図示されていないが、ウサギ抗マウス二次抗体)上の3XFLAGタグを使用することにより、CUT&RUN上清中の回収されたpA−MN/抗体複合体は、FLAGペプチドの添加によりDNA−タンパク質複合体から競合により分離される。次いで、二次抗体が添加され、免疫沈降物がプロテインA磁気ビーズで捕捉される。図31B;S.cerevisiaeヌクレオソームに適用されたCUT&RUN.ChIP;11遺伝子に及ぶ領域の代表例が示されている。1.CUT&RUNを、先ず、3XFLAG−H2A.Z(緑色)または3XFLAG−H2B(青色)のどちらかを使用して行った。2.次いで、示されているような様々なヒストン修飾および対照(IgG)抗体を使用するChIP−seqにインプットおよび上清を供した。プロファイルが自動スケーリングされてランドスケープパターンを図示する。プロファイルの分析(示されていない)は、以前の研究と一致して、H2A.Zヒストンバリアントが、活性遺伝子のプロモーターと比較して濃縮されており、ヒストンH4アセチル化およびH3K4me3を多く含むが、H3K36me3を枯渇していることを示す。
図32Aおよび32Bは、多タンパク質複合体のタンパク質成分を同定するためのCUT&RUN.プロテオミクスを示す。図32A;pA−MN−6Hisのマップ。図32B;CUT&RUNにより放出された粒子のタンパク質精製およびプロテオーム解析のための戦略。
図33A〜33Dは、H3突然変異型DMGへのH3K27Mの組込みがH3バリアント依存性であることを示す。図33A;標的下切断およびヌクレアーゼを使用した放出(Cleavage Under Targets and Release Using Nuclease)(CUT&RUN)についてのプロトコールの概略図。図33B;異なるDMG細胞系においてH3K27M抗体を用いたCUT&RUNデータのIGV表現であって、上部パネルは、最高シグナルに対して自動スケーリングされたものであり、下部パネルは、個別に自動スケーリングされたものである。図33C;H3突然変異型DMG細胞系におけるH3K27me3およびH3K27acドメインに存在するH3K27M CUT&RUNシグナルの平均(上部)およびヒートマップ(下部)プロファイル。図33D上部:H3K27me3、H3K27MおよびIgG抗体を用いて行ったH3突然変異型DMG細胞系におけるCUT&RUN反応上清からのタンパク質抽出物中のH3K27MおよびH3K27me3についてのウエスタンブロット。
図34A〜34Cは、H3突然変異型DMGが特有のH3K27me3ドメインを提示することを示す。図34A;標識された遺伝子についての代表的IGVトラック。図34B;正規化を区別しないPearson相関および正規化を区別するLin相関を使用するDMG細胞系におけるH3K27me3 CUT&RUNのための相関行列。図34C;番号1〜6の関連クラスターに関する、DMG細胞系間の差異に基づいてドメインを分類するために階層的クラスタリングを使用する、H3K27me3ドメインに存在するH3K27me3 CUT&RUNのヒートマップ。図34Aに関して、WNT6はクラスター3に、WT1はクラスター5に、PRDM1はクラスター6に見られる。
図35A〜35Cは、H3K27me3が、H3突然変異型DMGにおいて原始幹細胞様の構成を採ることを示す。図35A;図34で同定された差異のあるH3K27me3ドメインのクラスターに存在する、この報告書で使用される全ての細胞系からのH3K27me3 CUT&RUNについての平均プロファイル(上部)およびヒートマップ(下部)。図35B;Lin相関を使用して、ヒストン野生型(VUMC)、神経幹細胞(CB660およびU5)、ES細胞(H1)および2つのH3突然変異型DMG細胞系におけるゲノムワイドなH3K27me3 CUT&RUNを比較する、相関行列。図35C;特定された細胞系に特異的なまたはそれらの細胞系により共有されるH3K27me3ドメインの数、クラスター6とオーバーラップするドメインの数、およびゲノム座標をランダムにシャッフルした後にクラスター6とオーバーラップする数を表示する棒グラフ。実験的オーバーラップとランダム化オーバーラップの間のカイ二乗により導出されたP値。
図36A〜36Bは、H3.3突然変異型DMGにおいてhESC遺伝子と神経特異的遺伝子の組合せに組み込まれたH3K27Mを示す。図36A;ヒストン野生型(VUMC)、神経幹細胞(CB660およびU5)、ES細胞(H1)および2つのH3突然変異型DMG細胞系におけるH3K27ac、ならびにヒストン突然変異型DMG系におけるH3K27Mについて、Pearson相関を使用して、ゲノムワイドにCUT&RUNを比較する相関行列。図36B;H3K27acが、hESCに特異的である(上部左側)か、hESCおよびNSCにおいて共有されている(下部左側)か、NSCに特異的である(下部右側)か、またはH3.3K27Mにのみ見られる(上部右側)、遺伝子座における、H3.3K27M中のH3K27MおよびH3.3K27M中のH3K27ac、H1、CB660ならびにU5についての、CUT&RUNシグナルの代表的IGVトラック。
図37A〜37Cは、H3K27MがDMGの際にPRC2を隔離しないことを示す。図37A;H3.3K27M細胞系で行われたH3K27me3、H3K27M、SUZ12およびMTF2抗体との反応からのCUT&RUNデータのIGV表現。図37B;H3.3K27M−DMGにおけるH3K27me3またはH3K27M濃縮領域内のH3K27me3、H3K27M、SUZ12およびMTF2 CUT&RUNの濃縮を示す平均プロファイル。図37C;H3.1K27M−DMG細胞系におけるH3K27me3濃縮領域およびH3K27M濃縮領域内のSUZ12およびMTF2の濃縮を示す平均プロファイル。
図38は、H3.3K27Mまたは野生型H3.3を発現する293T細胞のH3.3K27Mウエスタンブロットを示す。LV=レンチウイルスに感染した、P=トランスフェクトされた。数字は、FLAG−野生型H3.3を発現する293Tに対するパーセンテージとしての、H3に対して正規化されたH3K27me3バンド強度の濃度測定値を表す。
図39A〜39Bは、H3K27Mに対する感受性が、幹細胞様起始細胞、二次突然変異および発生状況に依存することを示すモデルを示す。図39A;神経膠腫形成の際の起始細胞、二次突然変異およびH3K27Mの間の協同性を示す概略図。図39B;H3K27MのPRC2ランドスケープへの寄与についてのモデル。野生型H3.1およびH3.3、H3.1K27M(アスタリスク付き)またはH3.3K27M(アスタリスク付き)のいずれかを含有するヌクレオソームが示されている。H3.1K27Mは、多くの幹細胞性および増殖促進遺伝子の抑制解除を促進するが、低レベルの残留PRC2活性が、遺伝子のサブセットをなおサイレンシングし得る。H3.3K27Mは、抑制性シグナルが存在するにもかかわらず幹細胞性遺伝子のサイレンシングを防止するが、野生型H3.1を含有するPRC2ドメインのロバストなサイレンシングを許す。
図40A〜40Bは、CUT&RUN.Saltが、別個のCENP−A/B/C複合体を放出することを示す。図40A;CENP−A、CENP−BおよびCENP−C CUT&RUN.Salt画分におけるD7Z1(左側)およびDXZ1(右側)にマッピングされたマージペアの断片長分析。図40B;CENP−A、CENP−BおよびCENP−C CUT&RUN.Salt 250bp×250bpマージペアのD5Z2、D7Z1およびDXZ1アレイへのマッピング。これらのコンティグからの2つのタンデムダイマーに及ぶ領域が提示されている。黒塗りボックスは、CENP−Bボックスを表す。
CENP−Bは、CENP−A/B/Cを安定させる。透過処理した細胞(Skene and Henikoff 2017a)を使用してCUT&RUNを行った。図41A;CENP−B CUT&RUN.SaltのSF1、D7Z1およびD7Z2配列へのマッピング。エッジ効果を回避するために、ペアードエンド25bp×25bpリードを、各々のコンティグを表すタンデム三反復型340bpダイマーコンセンサス配列にマッピングした。真ん中のダイマーに関する平均占有率が示されている。図41B;CUT&RUN.Salt画分におけるCENP−Bボックスモチーフスコア(ここで、1は、CENP−Bボックス中央15bpとの同一性を示し、0は、3つより多くのミスマッチを示す)とCENP−A/IgG濃縮倍率値の間の相関関係。2つの実験(消化時間10分および30分)の平均が示されている。図41C;1キロベース当たりのモチーフ密度についてのBと同じもの。図41D;CENP−A CUT&RUN.Salt濃縮倍率が、この実験で使用された女性K562細胞が非存在であるY染色体αサテライト(DYZ3)、反復配列がマスクされたHg19ゲノム、アノテーション付きβサテライト、およびCENP−Bボックスを欠いている均一なアレイからのαサテライト(D7Z2)について、示されている。データは、250bp×250bpのマッピングされたマージペアからのものである。
図42は、ヒトセントロメアにおけるCENP−A/B/Cの構造および立体配座多様性を示す。(上部パネル)D7Z1に関して平均化されたCENP CUT&RUN.Salt 250bp×250bpマージペアの高ストリンジェンシーマッピング。2つのタンデムダイマーのCENP CUT&RUN.SaltプロファイルがD7Z1コンティグの下に示されている。(下部パネル)CENP−AおよびCENP−B CUT&RUN.SaltならびにCENP−A N−ChIPにおけるどちらかの方向のCENP−A/B/Cの方向性を示すための、異なるダイマー単位からのCENP−Aプロファイルのオーバーレイ。
図43A〜43Bは、クロマチンタンパク質のハイスループットin situプロファイリングのための自動化プラットフォームを示す。図43A;AutoCUT&RUNワークフロー。(1)細胞または組織をコンカナバリンA被覆ビーズと結合させ、ジギトニンで透過処理し、クロマチンタンパク質を標的とする抗体とともにインキュベートする。(2)試料を96ウェルプレートに整列させ、(3)洗浄中の磁気分離のための96ウェル磁気プレート(α)と温度制御のための循環水浴(γ)へのルートが設けられているアルミニウム冷却ブロック(β)とを装着したBiomekロボットで処理する。(4)AutoCUT&RUNは、すぐにプールおよびシーケンシングすることができる最大96のライブラリーを2日で生じさせる。図43B;H1(オレンジ色)およびK562(紫色)細胞における活性(ピンク色)および抑制された(青色)クロマチンを示す、ヒストン−H3修飾のAutoCUT&RUNプロファイルの階層的にクラスタリングされた相関行列。Pearson相関は、ゲノム全体にわたって500bpビンに分割したリードカウントのlog2変換値を使用して算出した。
図44A〜44Dは、AutoCUT&RUNがH1およびK562細胞の予想されたクロマチンランドスケープを再現することを示す。図44A;H1細胞およびK562細胞におけるH3K27me3、H3K4me2およびH3K27acドメインに含まれるゲノムの相対量を示すスケーリングされたベン図。図44B;それぞれの遺伝子座(NODAL)での、H1細胞におけるH3K4me2とH3K27me3のオーバーラップならびにK562細胞におけるH3K27me3ドメインの拡大およびH3K4me2とのオーバーラップ喪失を示す、ゲノムブラウザトラック。図44C;単一プロモーターを伴う遺伝子のTSSを中心とし、5’から3’への転写方向に従って左から右への方向性を持たせ、RNA−seq値(FPKM)に従ってランクの順序付けがなされた、H1細胞におけるヒストン修飾のAutoCUT&RUNプロファイルの分布を示すヒートマップ。図44D;K562細胞における転写活性および抑制プロモーターに関するAutoCUT&RUNヒストン修飾プロファイルの分布を示すヒートマップ。
図45A〜45Eは、線形回帰モデルが細胞型特異的プロモーター活性を正確に予測することを示す。図45A;単一プロモーター遺伝子についてのRNA−seq値とK562データで訓練されたモデルにより予測されるK562プロモーターCREAMスコアとを比較する密度散布図。図45B;H1およびK562細胞における単一プロモーター遺伝子についてのCREAMスコアの散布図。色付きドットは、H1細胞またはK562細胞のどちらかにおいてCREAMスコアが≧2倍濃縮されていることを示す。図45C;H1細胞またはK562細胞のどちらかにおいて≧2倍濃縮されているプロモーターCREAMスコアの、それらの対応するRNA−seq値にマッピングされた、散布図。青色点線は、2倍差カットオフを示した。図45D;それらのプロモーターCREAMスコアに従ってまたはそれらのRNA発現値に従って細胞型特異的と呼ばれる遺伝子間のオーバーラップを示すスケーリングされたベン図。CREAM対RNA−seqに従って反対の細胞型特異性を有すると予想された遺伝子が示されている(スケーリングされた黒丸)。図45E;≧2kb離れている全てのプロモーターのH1およびK562 CREAMスコアを比較する散布図。H1およびK562細胞同一性の主要調節因子が色付きの丸として示されている。OTX2とTAL1の両方は、区別することができる2つのプロモーターを有する。
図46Aおよび46Bは、AutoCUT&RUNが、凍結腫瘍試料のクロマチンランドスケープのプロファイリングに好適であることを示す。図46A;DMG実験設定。脳幹の類似した領域に由来する2つのDMG細胞系を免疫不全マウスの脳において異種移植片として成長させ、腫瘍を形成し次第、摘出し、凍結した。異種移植片を解凍し、細胞培養から直接収集した対照DMG試料と並行してAutoCUT&RUNによって処理した。図46B;細胞培養(C.C.)でまたは異種移植片(Xeno)として成長させたVUMC−10およびSU−DIPG−XIII細胞における活性および抑制クロマチンを示す、ヒストン−H3修飾のAutoCUT&RUNプロファイルの階層的にクラスタリングされた相関行列。精度管理として、H3K27acも、これらの細胞系において異なる抗体を使用して手動でプロファイリングした()。Pearson相関は、ゲノム全体にわたって500bpビンに分割したリードカウントのlog2変換値を使用して算出した。
図47A〜47Cは、プロモーターCREAMスコアによりDMG試料における遺伝子活性が区別されることを示す。図47A;VUMC−10およびSU−DIPG−XIII細胞培養試料のプロモーターCREAMスコアを比較する散布図。腫瘍成長に関与するいくつかの細胞シグナル伝達成分のプロモーターの位置が、色つきの丸として示されている。図47B;VUMC−10細胞培養(C.C.)および異種移植片(Xeno)試料のプロモーターCREAMスコアを比較する散布図。388のプロモーターのみが、これらの試料間でCREAMスコアの≧2倍差を有する。図47C;細胞培養(C.C.)でまたは異種移植片(Xeno)として成長させたVUMC−10(V)およびSU−DIPG−XIII(S)細胞間の、ならびにH1およびK562細胞間の、プロモーターCREAMスコアのSpearman相関の階層的にクラスタリングされた行列。
図48A〜48Eは、autoCUT&RUNが細胞型特異的エンハンサーエレメントを同定することを示す。図48A;H1細胞における接近可能なクロマチン部位(ATAC−seqピーク)とH3K4me2 AutoCUT&RUNプロファイルでコールされたピークとのオーバーラップを示す、スケーリングされたベン図。図48B;全てのH3K4me2+/ATAC+TSSに関するH3K4me1、H3K4me2およびH3K4me3の濃縮平均値。図48C;全てのH3K4me2+/ATAC+遠位調節エレメント(DRE)に関するH3K4me1、H3K4me2およびH3K4me3の濃縮平均値。図48D;細胞培養(C.C.)でまたは異種移植片(Xeno)として成長させたVUMC−10(V)およびSU−DIPG−XIII(S)細胞、ならびにH1およびK562細胞における、エンハンサーCREAMスコアのSpearman相関の階層的にクラスタリングされた行列。図48E;それぞれの遺伝子座(SOX2)においてVUMC−10細胞(V)、両方のDMG細胞系(D)に特異的であるかまたはDMG細胞およびH1細胞(C)に共通している推定的エンハンサーエレメントの位置(矢じり)を示す、ゲノムブラウザトラック。
図49A〜49Eは、autoCUT&RUNが、NPATおよびCTCFならびにヒストンマークを正確にマッピングすることを示す。図49A;改良CUT&RUNプロトコールによって自動化が可能になる。ConAビーズ結合試料をクロマチンタンパク質特異的抗体とともにインキュベートし、逐次的洗浄、プロテインA−MNase融合タンパク質の繋留、およびCa2+添加によるDNAの切断のためにBiomek上に整列させる。消化されたDNAをライブラリー調製前に精製する必要を回避するために、Ca2+を特異的にキレート化するが適切なMg2+を残すEGTAのみのSTOP緩衝剤で、反応を停止させて、末端ポリッシングおよびクロマチン断片へのIllumina Yアダプターライゲーションを可能にする。次いで、クロマチンタンパク質をプロテイナーゼ−Kで消化し、Ampure磁気ビーズを使用してBiomekでインデックス付きCUT&RUNライブラリーを精製する。図49B;NPATがH1細胞とK562細胞の両方においてHIST1遺伝子クラスターのプロモーター位置に濃縮されていることを示す、NPATおよびCTCF AutoCUT&RUNのゲノムブラウザトラック。図49C;CTCFがHOXA遺伝子座のインスレーター領域と結合していることを確証する、ゲノムブラウザトラック。図49D;H1細胞における単一プロモーターを伴う遺伝子のTSS周辺の示されているヒストンマークのAutoCUT&RUNプロファイルとそれらの対応するRNA−seq値のAutoCUT&RUNプロファイルとの間のPearson相関についての表。図49E;H1細胞における単一プロモーターを伴う遺伝子のTSS周辺の示されているヒストンマークのAutoCUT&RUNプロファイルとそれらの対応するRNA−seq値のAutoCUT&RUNプロファイルとの間のPearson相関についての表。
図50A〜50Gは、シス調節エレメントの活性を予測するための線形回帰モデルの開発を示す。図50A;単一プロモーター遺伝子についてのH1 RNA−seq値とH1データで訓練されたモデルにより予測されたH1プロモーターCREAMスコアとを比較する密度散布図。図50B;単一プロモーター遺伝子についてのH1 RNA−seq値とK562データで訓練されたモデルにより予測されたH1プロモーターCREAMスコアとを比較する密度散布図。図50C;H1およびK562細胞における単一プロモーター遺伝子についてのRNA−seq値の散布図。ドットは、H1細胞またはK562細胞のどちらかにおいてRNA発現レベルが≧2倍濃縮されていることを示す。図50D;それらの対応するプロモーターCREAMスコアにマッピングされた、H1細胞またはK562細胞のどちらかにおいて≧2倍濃縮されているRNA−seq値を有する遺伝子の分布を示す散布図。点線は、2倍差カットオフを示した。図50E;CREAMスコアとRNA−seqの両方によって同定された細胞型特異的な単一プロモーター遺伝子の収集物において過剰提示された遺伝子オントロジー(GO)ターム。図50F;RNA−seqに従ってではなくプロモーターCREAMスコアに従って細胞型特異的と一意的に同定された単一プロモーター遺伝子の収集物(図45Dのベン図を参照されたい)において過剰提示されたGOターム。図50G;プロモーターCREAMスコアに従ってではなくRNA−seqに従って細胞型特異的と一意的に同定された単一プロモーター遺伝子の収集物において過剰提示されたGOターム。
図51は、DMG特異的SMAD3プロモーター活性を示す。細胞培養試料および異種移植片試料からのプロファイルの一致を示す、VUMC−10およびSU−DIPG−XIII細胞の代表的遺伝子座(SMAD3)におけるAutoCUT&RUNによりプロファイリングされたヒストンマークのゲノムブラウザトラック。SU−DIPG−XIII細胞におけるH3K27acシグナルはノイズが多いが、この問題は抗体特異的である。比較のために、代替抗体を使用して手動でH3K27acもプロファイリングした()。矢じりは、VUMC−10(V)またはSU−DIPG−XIII(S)細胞において特に活性であると予測されるプロモーターを示す。
図52A〜52Cは、プロモーターCREAMがDMG特異的遺伝子調節プログラムを同定することを示す。図52A;CREAM分析に従ってVUMC−10細胞において≧2倍濃縮されているプロモーターの収集物において過剰提示されるGOターム。図52B;CREAM分析に従ってSU−DIPG−XIII細胞において≧2倍濃縮されているプロモーターの収集物において過剰提示されるGOターム。図52C;SU−DIPG−XIII細胞培養(C.C.)および異種移植片(Xeno.)試料のプロモーターCREAMスコアを比較する散布図。1,619のプロモーターは、これらの試料間でCREAMスコアの≧2倍差を有する。
図53A〜53Dは、autoCUT&RUNが、近位シス調節エレメントと遠位シス調節エレメントとを区別するための高感度法であることを示す。図53A;H1細胞における接近可能なクロマチン部位(ATAC−seqピーク)とヒストンマークの様々なAutoCUT&RUNプロファイルでコールされたピークとのオーバーラップについての表。図53B;ATAC+またはATAC−のどちらかとしてコールされたH3K4me2ピークにおけるATACシグナルの濃縮平均値。図53C;ATAC+またはATAC−のどちらかとしてコールされたH3K4me2+TSSにおけるH3K27me3シグナルの濃縮平均値。図53D;全てのH3K4me2+/ATAC+TSSおよび遠位調節エレメント(DRE)に関する正規化されたH3K4me1、H3K4me2およびH3K4me3プロファイルの分布を示すヒートマップ。
図54は、CUT&RUNが、胎児型ガンマグロビンから成人型ベータグロビンへのスイッチを同定することを示す。
図55は、100細胞での高いCUT&RUNデータ品質を示す。様々な数のK562細胞をCUT&RUNによるH3K27me3のプロファイリングのための出発材料として使用した。ペアードエンド25×25bp Illuminaシーケンシングおよび重複除去の後、7,500,000断片をランダムに選択し、生カウントを表すトラックを生成するために使用した。完全プロファイル(最上部トラック)についての、およびCUT&RUNとの比較のための7,500,000のランダムに選択されたサブセットについての、ENCODE X−ChIP−seqデータが示されている。
図56は、内胚葉に分化したヒトES細胞の自動化CUT&RUNプロファイリングを示す。「活性」(H3K4me3)および「抑制性」(H3K27me3)ヒストン修飾についてのならびにH1胚性幹細胞のおよびH1細胞培養に由来する分化内胚葉細胞(DE)のCTCFについての反復CUT&RUNプロファイルを示すスクリーンショット。POLD1転写単位が右側に拡大されており(枠で囲まれた領域)、これは、分化中のプロモーターに関する活性修飾から抑制性修飾へのスイッチを示す。POLD1は、ラギング鎖DNAポリメラーゼの触媒性サブユニット(Pol−デルタ)をコードし、これは、複製機構のプロモーター活性クロマチン状態からプロモーター抑制性クロマチン状態へのスイッチが細胞周期からの退出に相当することを示唆する。
図57は、高Ca++/低塩消化との一貫性向上を示す。高Ca++/低塩プロトコールまたは標準プロトコールのどちらかを使用して、示されているような20秒〜27分範囲にわたっての消化と2つの異なる抗体を用いてCUT&RUNを行った。4つのタイムコース系列実験から17のH3K27acデータセットをプールし、MACS2を使用して74,906ピークをコールした。ピーク位置をデータセットごとにスコア化し、ピークベクトル間の相関(R)を算出した。
図58Aおよび58Bは、アダプターのin situライゲーションを用いるH3K27ac CUT&RUNを示す。図58A;代表的20Mb領域が示されている。図58B;断片のヒートマップは、MACS2スコアによってランクの順序付けがなされた74,906のH3K27acピークの±1kbをカウントする。
図59A〜59Dは、無傷組織およびFACS単離細胞のCUT&RUNプロファイリングを示す。図59A;脳および羽成虫原基を10匹の幼虫から切除し、無傷の未固定材料をジギトニンで軽度に透過処理し、CUT&RUN用の抗体およびpAMNase溶液に浸漬する。図59B;痕跡(vg)遺伝子を発現する細胞においてvg−Qエンハンサーを使用してGFPを生じさせ、原基を切除し、10,000のGFP陽性細胞をFACSにより単離した。図59C;Polycomb抑制ANTP複合体にわたっての無傷組織およびFACS単離細胞からのH3K27me3のCUT&RUNプロファイル。アンテナペディア(Antp)遺伝子は、脳では抑制され、メチル化されるが、羽成虫原基では発現され、メチル化されない。Antpの抑制解除は、高いシグナル/バックグラウンド比を有するFACS単離細胞においても明白である。図59D;脳におけるvg遺伝子(脳ではそれが抑制される)、羽成虫原基におけるvg遺伝子(羽成虫原基では、細胞の約20%がvgを発現し、残りは発現しない)、およびFACS単離vg発現細胞におけるvg遺伝子にわたっての、H3K27me3プロファイル。
図60Aおよび60Bは、CUT&RUNデータにおけるサイズに基づくピーク頂点検出を示す。図60A;頂点検出の方法論。濃縮領域内に含まれるCUT&RUN断片を、断片オフセット対断片長散布図にマッピングし、LOESS曲線をデータから導出し、曲線の極小値が存在する単一塩基対位置を頂点として報告する。図60B;単一塩基対CTCFピーク頂点を、二成分ガウス混合モデルを使用して予測断片サイズにより分割し、2つのコホートの各々についての頂点の周囲20bpウインドウに濃縮されたモチーフを、MEMEを使用して検出した。
図61は、CUT&RUN用の改善されたベクターのプラスミドマップである。
図62は、プロテインA−Tn5発現ベクターを示す。プロテインAのC末端が26残基の柔軟なリンカーペプチド(pA−Tn5)によりトランスポザーゼから離隔されている高活性Tn5トランスポザーゼバージョンを構築した。ブドウ球菌プロテインAの2つのIgG結合ドメインをpK19pA−MNベクター(Schmid et al. 2004)からPCR増幅し、発現ベクターpTXB1−Tn5(Picelli et al, 2014)内の高活性Tn5対立遺伝子(E54K、L372P)にC末端を融合させた。DDDKEF(GGGGS)(配列番号1)で構成されている柔軟なリンカーをプロテインAとTn5の間に含めた。プロテインAのN末端に3つのタンデムFLAGエピトープタグを挿入することにより3XFLAGタグ付きバージョン(pAf−Tn5)も構築した。lacオペレーターの下流の配列を効率的リボソーム結合部位で置き換えた。
図63Aおよび63Bは、ITIS戦略、および少ない細胞数への適用を示す。図63A;遊離19mer Tn5末端DNA二重鎖を担持させてpA−Tn5トランスポゾームを形成すると、pA−MNをChIC(クロマチン免疫切断)およびCUT&RUNに使用することができるのと同様に、pA−Tn5をタグメンテーションに使用することができる。タグメンテーションでは、トランスポゾンのモザイクエンド配列と、使用されるシーケンシングプラットフォームと適合するアダプターオーバーハングとに対応する2つの末端二重鎖DNAを担持した非配列特異的トランスポザーゼが、カットアンドペースト反応を実行し、結果として、トランスポゾン末端配列およびアダプターオーバーハングでカット部位の両末端がキャップされる。CUT&RUNとは異なり、粒子の放出はなく、むしろ、タグメンテーション後に、DNAが、抽出され、3’にモザイクエンドに相補的な配列および5’側にシーケンシングアダプターに相補的な配列を有するプライマーを使用するPCRに供される。図63B;可変細胞数実験からのTapestationリードアウトの例。
図64は、異なるpA−Tn5構築物からのITISライブラリーを示す。陰性対照に対する抗体(IgG、モルモット抗ウサギIgG)、CTCF DNA結合タンパク質に対する抗体(ウサギモノクローナル抗体)、RNAポリメラーゼC末端ドメインセリン−5リン酸(PolIIS5)に対する抗体(マウスモノクローナル抗体)、およびヒストンH3リシン27トリメチル(H3K27me3)に対する抗体(ウサギモノクローナル抗体)を含む、様々な抗体とともに使用されたとき、ライブラリーは、12サイクルのPCR後に特徴的なサイズ分布を示した。類似の結果が、pA−Tn5と3XFLAG−pA−Tn5(pAf−Tn5)の両方に関して見られたが、pAf−Tn5調製物中のより多くのE.coli DNAの存在が原因で、ライブラリー断片の不鮮明なバックグラウンドが生じた。
図65は、CUT&RUNプロファイルに引けを取らないITISプロファイルを示す。上部:ITISにより生成される断片のマッピングは、≦120bp断片が、RNAPIIの転写開始形態を表す尖ったスパイクを示す、同じRNAポリメラーゼII(RNAPII)Ser5マウスモノクローナル抗体を使用するCUT&RUNと比較して、データ品質が向上されることを示す。過剰な消化が接近可能な領域での切断をもたらし得る(27分のトラックと9分のトラックを比較されたい)、CUT&RUNとは異なり、pA−Tn5の各々の分子は、単一末端に対するカットアンドペーストしかできず、したがって、この分子がその担持物を送達してしまうと、この分子は、さらに反応することができない。結果として、バックグラウンドは、CUT&RUNで可能であるのよりさらにいっそう低減される。下部:H3K27me3についてのITISとCUT&RUNの間の対応は、CUT&RUNについての25,000,000と比較して6,500,000〜6,900,000であるITIS試料についてのはるかに少ないマッピングされるリード数にもかかわらず、非常に密接である。ITISとCUT&RUNの両方について、プロファイルは、示されているプロファイルを生成するための56,000,000リードを必要としたENCODE ChIP−seqより、著しく明確である。左から右へ、パネルは、同じ領域の逐次的3倍拡大を示す。
図66Aは、ヒストン修飾についてのITISとCUT&RUNの間の密接な対応を示す。相関プロットを、Janssens et al. (2018)に記載のITISおよびCUT&RUNデータセットから構築した。同じ抗体をITISとCUT&RUNの両方に使用した:H3K27me3(Cell Signaling Technology カタログ番号9733)、H3K4ジメチル(「2」、Millipore カタログ番号07−030)、H3K4トリメチル(「3」、Active Motif カタログ番号39159)、およびH3K27ac(Millipore カタログ番号MABE647)。
図66Bは、CTD−セリン−リン酸化RNAPIIについてのITISとCUT&RUNの間の密接な対応を示す。相関プロットを、Janssens et al. (2018)に記載のITISおよびCUT&RUNデータセットから構築した。丸括弧内の数字は、CTDヘプタマー残基を示し、「m」は、マウスモノクローナル抗体(Abcam カタログ番号ab5408、続いてのAbcam カタログ番号ab46540 ウサギ抗マウス抗体)を示し、「p」は、Abcam カタログ番号5095 ウサギポリクローナル抗体を示す。同じ抗体をITISとCUT&RUNの両方に使用した。
図67は、pA−Tn5結合およびタグメンテーションに対するゲノムワイドな超高感受性が、塩濃度を上昇させることにより本質的に消失されることを示す。ATAC−seq MACS2ピークスコアにより順序付けされた選択データセットのヒートマップ表示は、ITISが、150mM NaCl条件下で、ATAC−seqピークスコアと強く相関することを示す。対照的に、ITISは、150mM条件下では、CUT&RUNで見られるものに類似した、ATAC−seqピークコールとのわずかな反相関を示し、超高感受性シグナルは、300mM NaClでpA−Tn5付加およびタグメンテーションを行うことにより本質的に消失される。このことにより、超高感受性が、繋留されていないTn5に起因すること、および塩の処置が、それを除去するのに有効であることが確証される。ATAC−seqピークコール(61,153)は、GSE31755(K562細胞)からのものである。ヒートマップは、Java(登録商標) TreeViewを使用して任意均等目盛りでプロットした。
図68は、ITIS断片が複数のサイズクラスに分類されることを示す。ITISライブラリーをペアードエンドシーケンシングに供したとき、小さい断片が転写因子を表し、大きい断片がモノヌクレオソームおよびより低レベルのジヌクレオソームを表す、予想されたプロファイルが得られた。約10bpの周期性は、繋留切断の厳しい制約を表す可能性が高い。
図69A〜69Bは、高濃度の塩が、非標的タグメンテーションを低減させ、小さい断片の回収率を低下させることを示す。図69A;マッピングされた断片の数が、百万単位で示されている。Ovは、CUT&RUN、続いての、NuGen Ovationライブラリー調製キットを使用するアダプターのin situライゲーションである。標的シグナルに対する超高感受性部位検出の相対的な大きさは、あったとしてもほんの少ししか超高感受性部位が検出されないCUT&RUNと比較することにより、H3K27me3トラックから推定することができる。超高感受性は、洗浄ステップの塩濃度を上昇させることにより低下されるように見える。このことにより、高感受性は、繋留されていないTn5に起因するが、条件を調整することにより低減または消失させることができることが確証される。図69B;異なる抗RNAPII抗体と、150mM NaClで行われる結合およびタグメンテーションを使用すると、2つの明確に異なるサイズクラスが見られる(上部パネル)が、300mM NaClでは小さい方のサイズクラスが、急減される。
図70は、pA−MNaseのE.coli DNA混入が、スパイクイン較正のプロキシとなり得ることを示す。H3K27me3(100〜6,000細胞)およびCTCF(1,000〜100,000細胞)についてのK562細胞CUT&RUNデータセット(GSE104550)からの断片を、S.cerevisiaeの反復配列がマスクされたゲノム、および完全ゲノムE.coliにマッピングした。
図71は、RNAPII−Ser5PについてのITISピークコールが転写開始部位に対応することを示す。ITISを検証するために、MACS2とデフォルトパラメータを使用してpA−Tn5 RNAPII−Ser5PデータセットとpA−3XFLAG−Tn5 RNAPII−Ser5Pデータセットの両方についてピークをコールし、各々約17,500ピークを得た。ヒトK562細胞についてのPRO−seqランオンからの処理済みデータセット(SRA GSM1480327)をピークコールにアラインメントした。ITIS MACS2スコアにより順序付けしたとき、PRO−seq占有率とPolII−Ser5 ITISスコアとの間の密接な対応が見られ、ここで、青色のヒートマップ値は、各々のピークコールの3’側のPRO−seq占有率を表し、黄色の値は、5’側のPRO−seq占有率を表す。
図72は、20の異なる抗体および2つの異なる細胞バッチ各々からの2つの細胞型についての単一96ウェルプレートで一緒に実行した96のITIS試料の階層的クラスタリングを示す、相関行列である。1または4.5時間の透過処理後、抗体を添加し(1:50)、4℃で一晩インキュベートした。次いで、8チャネルピペッターおよび96ウェルプレートハンドラーを使用してプレートをITISに供し、全てのウェルからほぼ等モルの試料をプールし、単一Illumina 2500 Rapidフローセル、1試料当たり平均して3,000,000のペアードエンドリードで、シーケンシングした。5つの異なるRNA PolII抗体を除いて、全ての生物学的反復実験は、他の抗体が結合した全ての試料を除いて一緒にクラスターを形成し、したがって、ハイスループットITISの顕著な再現度を実証した。
図73は、ITISを使用する少ない細胞数の断片の回収を示す。K562細胞を60,000細胞から下は20細胞に至るまで段階希釈し、H3K27me3およびRNAPII−Ser2+5についてITISを行った。断片のほぼ直線的な回収(対数スケールで)が、H3K27me3について下は20細胞に至るまでおよびRNAPIIについて下は60細胞に至るまで見られる。
図74は、CUT&RUNについて観察されたものに類似して、ITISについてのpA−Tn5調製物におけるE.coli混入のスパイクインプロキシとしての使用を確証する、反比例関係がヒト断片数とE.coli断片数の間にあることを示す。
図75は、下は20細胞に至る低いバックグラウンドでの高いCUT&RUNデータ品質を示す。
いくつかの実施形態の詳細な説明
A.用語および定義
以下の詳細な説明において、本明細書の一部を形成し、実践され得る実施形態が図解によって示されている添付の図面への言及がなされる。他の実施形態が利用され得、範囲から逸脱することなく構造的または論理的変化が加えられ得ることが理解されるべきである。それゆえ、以下の詳細な説明は、限定的な意味で取られるべきではなく、実施形態の範囲は、添付の特許請求の範囲およびそれらの等価物によって規定される。
様々な作業が、実施形態を理解するのに役立ち得るように、複数の個別の作業として順番に記載され得る;しかしながら、記載の順序は、これらの作業が順序依存的であることを暗示すると捉えられるべきではない。
説明の目的のために、「A/B」という形態または「Aおよび/またはB」という形態の語句は、(A)、(B)、または(AおよびB)を意味する。説明の目的のために、「A、B、およびCのうちの少なくとも1つ」という形態の語句は、(A)、(B)、(C)、(AおよびB)、(AおよびC)、(BおよびC)、または(A、B、およびC)を意味する。説明の目的のために、「(A)B」という形態の語句は、(B)または(AB)を意味し、すなわちAは必要に応じたエレメントである。
説明は、「実施形態(embodiment)」または「実施形態(embodiments)」という用語を使用し得、そのそれぞれは、同じまたは異なる実施形態のうちの1つまたは複数を指し得る。さらに、実施形態に関して使用される「含む(comprising)」、「含む(including)」、「有する(having)」等という用語は同義である。
説明は、「実施形態(embodiment)」または「実施形態(embodiments)」という用語を使用し得、そのそれぞれは、同じまたは異なる実施形態のうちの1つまたは複数を指し得る。さらに、実施形態に関して使用される「含む(comprising)」、「含む(including)」、「有する(having)」等という用語は同義であり、一般的に、「開かれた」用語として意図される(例えば、「含む(including)」という用語は「含むがそれらに限定されるわけではない」として解釈されるべきであり、「有する(having)」という用語は「少なくとも有する」と解釈されるべきであり、「含む(includes)」という用語は「含むがそれらに限定されるわけではない」と解釈されるべきである等)。
本明細書における任意の複数形および/または単数形の用語の使用に関して、当業者であれば、文脈および/または適用にとって適切であるように、複数形から単数形におよび/または単数形から複数形に翻訳し得る。明確性のために、様々な単数形/複数形の並べ替えが本明細書において明示的に示され得る。
別様に記されていない限り、技術的用語は従来の使用法に従って使用される。分子生物学における共通用語の定義は、Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008 (ISBN 0763752223);Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0632021829);およびRobert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 9780471185710);ならびに、他の同様の参考文献に見い出され得る。矛盾する場合には、本明細書における用語が支配する。
本開示の様々な実施形態についての概観を促すために、具体的な用語についての以下の説明が提供される。
抗体:少なくとも軽鎖または重鎖免疫グロブリン可変領域を含み、クロマチンDNAと会合したタンパク質上のエピトープなど、抗原のエピトープに特異的に結合する、ポリペプチドリガンド。抗体には、モノクローナル抗体、ポリクローナル抗体、または抗体の断片が含まれ得る。
抗原に関する「特異的に結合する」という用語は、抗体または他のリガンドと、クロマチンDNAに結合している特異的タンパク質、例えば転写因子などの特異的ポリペプチドとの、全体または一部においての選好的会合を指す。特異的結合剤は、特異的クロマチン関連因子などの規定の標的にのみ実質的に結合する。特異的結合剤などの分子と非標的ポリペプチドとの間に、わずかな程度の非特異的相互作用が生じ得ることは認識されている。それにもかかわらず、特異的結合は、抗原の特異的認識を介して媒介されるものとして区別され得る。選択的反応性抗体は抗原に結合するものの、それらは低い親和性でそうし得る。特異的結合は、非標的ポリペプチドなどと比較して、標的ポリペプチドへの結合抗体または他のリガンドの量(単位時間あたり)の2倍を上回る、例えば5倍を上回る、10倍を上回る、または100倍を上回る増加を典型的にもたらす。特定のタンパク質と特異的に免疫反応性である抗体を選択するのに、多様なイムノアッセイ形式が適している。例えば、固相ELISAイムノアッセイは、タンパク質と特異的に免疫反応性であるモノクローナル抗体を選択するためにルーチン的に使用される。特異的免疫反応性を判定するために使用され得るイムノアッセイの形式および条件の説明に関しては、Harlow & Lane, Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York (1988)を参照されたい。
抗体は重鎖および軽鎖から構成され得、そのそれぞれは、可変重鎖(VH)領域および可変軽鎖(VL)領域と称される可変領域を有する。一緒に、VH領域およびVL領域は、抗体によって認識される抗原に結合することに関与している。これには、無傷免疫グロブリン、ならびにFab’断片、F(ab)’2断片、一本鎖Fvタンパク質(「scFv」)、およびジスルフィド安定化Fvタンパク質(「dsFv」)ダイアボディ、ならびに他のすべての変形形態など、当技術分野において周知のそれらのバリアントおよび一部分が含まれる。用語には、キメラ抗体(例えば、ヒト化マウス抗体)、ヘテロコンジュゲート抗体(二特異性抗体など)など、組換え形態も含まれる。Pierce Catalog and Handbook, 1994-1995 (Pierce Chemical Co., Rockford, 111.);Kuby, Immunology, 3rd Ed., W.H. Freeman & Co., New York, 1997も参照されたい。
「モノクローナル抗体」とは、Bリンパ球の単一クローンによって、または単一抗体の軽鎖および重鎖遺伝子がトランスフェクトされている細胞によって産生される抗体である。モノクローナル抗体は、当業者に公知の方法によって、例えば骨髄腫細胞と免疫脾臓細胞との融合体からハイブリッド抗体形成細胞を作製することによって産生される。これら融合細胞およびそれらの子孫は、「ハイブリドーマ」と称される。モノクローナル抗体には、ヒト化モノクローナル抗体が含まれる。
増幅:本明細書において記載される方法によって同定されるおよび/または獲得される核酸など、核酸分子のコピーの数を増加させること。結果として生じる増幅産物は、「アンプリコン」と呼ばれる。核酸分子(DNAまたはRNA分子など)の増幅は、核酸分子(断片を含む)のコピーの数を増加させる技法の使用を指す。
増幅の例は、試料中の核酸鋳型へのプライマーのハイブリダイゼーションを可能にする条件下で試料とオリゴヌクレオチドプライマーのペアとを接触させる、ポリメラーゼ連鎖反応(PCR)である。プライマーは、適切な条件下で伸長し、鋳型から解離し、再アニールし、伸長し、および解離して、核酸のコピーの数を増幅する。このサイクルが反復され得る。増幅の産物は、電気泳動、制限エンドヌクレアーゼ切断パターン、オリゴヌクレオチドハイブリダイゼーションもしくはライゲーション、および/または核酸シーケンシングのような技法によって特徴付けられ得る。
in vitro増幅技法の他の例としては、数ある中でも、定量リアルタイムPCR;逆転写酵素PCR(RT−PCR);リアルタイムPCR(rt PCR);リアルタイム逆転写酵素PCR(rt RT−PCR);ネステッドPCR;鎖置換増幅(米国特許第5,744,311号を参照されたい);転写フリー等温増幅(米国特許第6,033,881号を参照されたい、修復連鎖反応増幅(WO90/01069を参照されたい);リガーゼ連鎖反応増幅(欧州特許公開第EP−A−320 308号を参照されたい);ギャップ充填リガーゼ連鎖反応増幅(米国特許第5,427,930号を参照されたい);連動したリガーゼ検出およびPCR(米国特許第6,027,889号を参照されたい);ならびにNASBA(商標)RNA転写フリー増幅(米国特許第6,025,134号を参照されたい)が挙げられる。
結合または安定結合:一方の核酸分子の、別のものもしくはそれ自身へのハイブリダイゼーション、抗体とペプチドとの会合、またはタンパク質と別のタンパク質(例えば、補因子への転写因子の結合)もしくは核酸分子(例えば、クロマチンDNAなどの核酸への転写因子の結合)との会合など、2つの物質または分子の間の会合。
結合部位:他の分子が安定に結合する、タンパク質、DNA、またはRNA上の領域。一例において、結合部位は、転写因子などのクロマチン関連因子が結合する、クロマチンDNAなどのDNA分子上の部位である(転写因子結合部位と称される)。
接触:例えば固体形態および/または液体形態の両方での、直接的な物理的会合のもとに置くこと。接触は、in situでは単離された細胞、例えば透過処理された細胞と生じ得、またはin vivoでは対象に投与することによって生じ得る。
対照:参照標準。対照は、基礎のレベルまたは量を指し示す既知の値または値の範囲であり得る、あるいは組織もしくは細胞またはその集団に存在し得る。対照は、細胞対照または組織対照、例えば罹患していない状態由来の組織でもあり得る。試験試料と対照との間の差は、増加または反対に減少であり得る。差は、定性的な差または定量的な差、例えば統計的に有意な差であり得る。一部の実施形態では、対照は、スパイクインDNAおよび/または混入DNAなど、添加されたDNAである。
相補的:二本鎖DNAまたはRNA鎖は、塩基対の2本の相補鎖からなる。一方の核酸分子の塩基がもう一方の核酸分子の塩基への水素結合を形成した場合に、相補的結合が生じる。通常、塩基アデニン(A;はチミジン(T)およびウラシル(U)に相補的であり、一方でシトシン(C)はグアニン(G)に相補的である。例えば、一方のssDNA分子の配列5’−ATCG−3’は、もう一方のssDNAの3’−TAGC−5’に結合して、dsDNAを形成し得る。この例において、配列5’−ATCG−3’は、3’−TAGC−5’の逆相補体である。
核酸分子は、各分子のすべての塩基の完全な水素結合がなくても、互いに相補的であり得る。例えば、相補的核酸配列とのハイブリダイゼーションは、相補体がすべてではなく一部のヌクレオチド位置で結合する種々のストリンジェンシーの条件下で生じ得る。
共有連結した:原子間で電子対を共有することにより特徴付けられる共有結合の形成による、原子間の共有連結を指す。一例において、共有連結は、核酸鎖の骨格におけるホスホジエステル結合など、酸素とリンとの間の結合である。別の例において、共有連結は、抗体と酵素、例えばトランスポザーゼに対する抗体またはヌクレアーゼに対する抗体など、核酸と、1つのタンパク質および/または2つもしくはそれを上回る数のタンパク質あるいはその断片との間のものである。
架橋剤:一方の分子のもう一方の分子への付着を促す化学薬剤または一様の光。架橋剤は、タンパク質−核酸架橋剤、核酸−核酸架橋剤、および/またはタンパク質−タンパク質架橋剤であり得る。そのような薬剤の例は、当技術分野において公知である。一部の実施形態では、架橋剤は可逆的架橋剤である。一部の実施形態では、架橋剤は非可逆的架橋剤である。
検出可能な標識:別の分子に直接的または間接的にコンジュゲートされて、その分子の検出を促す化合物または組成物。標識の具体的かつ非限定的な例としては、蛍光タグ、酵素連結、および放射性同位体が挙げられる。一部の例において、標識を抗体または核酸に付着させて、抗体または核酸が特異的に結合する分子の検出を促す。
DNAシーケンシング:所与のDNA分子のヌクレオチド順序を決定する工程。一般的に、シーケンシングは、自動サンガーシーケンシング(AB 13730×1ゲノムアナライザー)、固体担体上でのパイロシーケンシング(454シーケンシング、Roche)、可逆的終結を用いた合成時シーケンシング(sequencing−by−synthesis)(ILLUMINA(登録商標)ゲノムアナライザー)、ライゲーションによるシーケンシング(ABI SOLiD(登録商標))、またはバーチャルターミネーターを用いた合成時シーケンシング(HELISCOPE(登録商標))を使用して実施され得る。開示される方法との使用のための他の次世代シーケンシング技法としては、超並列シグネチャーシーケンシング(MPSS)、ポロニーシーケンシング、イオントレント半導体シーケンシング、DNAナノボールシーケンシング、Heliscope単分子シーケンシング、単分子リアルタイム(SMRT)シーケンシング、およびナノポアDNAシーケンシングが挙げられる。
ハイスループット技法:ロボット工学、データ処理および制御ソフトウェア、液体取扱デバイス、ならびに検出器の組合せにより、ハイスループット技法は、短時間での、例えば24時間未満、12時間未満、6時間未満、または1時間未満でさえの、潜在的な試薬、条件、または標的の迅速なスクリーニングを可能にする。
ハイブリダイゼーション:オリゴヌクレオチドおよびそれらのアナログは、相補的塩基間での、ワトソン−クリック、フーグスティーン型または逆フーグスティーン型水素結合を含む水素結合によってハイブリダイズする。一般的に、核酸は、ピリミジン(シトシン(C)、ウラシル(U)、およびチミン(T))またはプリン(アデニン(A)およびグアニン(G))のいずれかである窒素塩基からなる。これらの窒素塩基は、ピリミジンとプリンとの間で水素結合を形成し、プリンへのピリミジンの結合は「塩基対合」と称される。より具体的には、AはTまたはUに水素結合し、GはCに結合する。「相補的」とは、2つの別個の核酸配列間または同じ核酸配列の2つの別個の領域間で生じる塩基対合を指す。
「特異的にハイブリダイズ可能」および「特異的に相補的」とは、オリゴヌクレオチド(またはそのアナログ)とDNAまたはRNAとの間で安定的かつ特異的な結合が生じるような、十分な程度の相補性を示す用語である。オリゴヌクレオチドまたはオリゴヌクレオチドアナログは、特異的にハイブリダイズ可能であるために、その標的配列に100%相補的である必要はない。特異的結合が所望される条件下での非標的配列へのオリゴヌクレオチドまたはアナログの非特異的結合を回避するのに十分な程度の相補性がある場合に、オリゴヌクレオチドまたはアナログは特異的にハイブリダイズ可能である。このような結合は、特異的ハイブリダイゼーションと呼ばれる。
単離された:「単離された」生体構成要素は、構成要素が天然に存在する生物の細胞内の他の生体構成要素、例えばクロマチン外DNAおよびRNA、タンパク質、ならびに細胞小器官から実質的に分離されているまたは精製されている。「単離されて」いる核酸およびタンパク質には、標準的な精製法によって精製された核酸およびタンパク質が含まれる。用語は、宿主細胞における組換え発現によって調製された核酸およびタンパク質、ならびに化学合成された核酸も包含する。「単離された」という用語は、生体構成要素に微量の混入もないことを暗示するわけではなく、少なくとも75%、80%、90%、95%、98%、99%、またはさらに100%単離されているなど、少なくとも50%単離されている核酸分子を含み得ると理解される。
質量分析:試料から気相イオンを生成し、次いでそれらをそれらの質量電荷比(m/z)に従って分離しおよび検出することによって試料を分析する方法。試料から気相イオンを生成する方法としては、エレクトロスプレーイオン化(ESI)、マトリックス支援レーザー脱離イオン化(MALDI)、表面エンハンス型レーザー脱離イオン化(SELDI)、化学イオン化、および電子衝突イオン化(EI)が挙げられる。それらのm/z比に従ったイオンの分離は、四重極型質量分析計(Q)、飛行時間型(TOF)質量分析計、磁場セクター型質量分析計、3Dおよびリニアイオントラップ(IT)、フーリエ変換イオンサイクロトロン共鳴(FT−ICR)分析計、ならびにそれらの組合せ(例えば、四重極−飛行時間型分析計またはQ−TOF分析計)を含めた、任意のタイプの質量分析計を用いて達成され得る。分離の前に、試料を、1次元またはそれを上回る次元のクロマトグラフィー分離、例えば1次元またはそれを上回る次元の液体クロマトグラフィーまたはサイズ排除クロマトグラフィーに供し得る。
核酸(分子または配列):限定されることなく、cDNA、mRNA、ゲノムDNA、および合成(化学合成されたなどの)DNAもしくはRNAまたはそのハイブリッドを含めた、デオキシリボヌクレオチドまたはリボヌクレオチドポリマー。核酸は、二本鎖(ds)または一本鎖(ss)であり得る。一本鎖の場合、核酸は、センス鎖またはアンチセンス鎖であり得る。核酸は、天然ヌクレオチド(A、T/U、C、およびGなど)を含み得、標識されたヌクレオチドなど、天然ヌクレオチドのアナログも含み得る。核酸の一部の例には、本明細書において開示されるプローブが含まれる。DNAの主なヌクレオチドは、デオキシアデノシン5’−三リン酸(dATPまたはA)、デオキシグアノシン5’−三リン酸(dGTPまたはG)、デオキシシチジン5’−三リン酸(dCTPまたはC)、およびデオキシチミジン5’−三リン酸(dTTPまたはT)である。RNAの主なヌクレオチドは、アデノシン5’−三リン酸(ATPまたはA)、グアノシン5’−三リン酸(GTPまたはG)、シチジン5’−三リン酸(CTPまたはC)、およびウリジン5’−三リン酸(UTPまたはU)である。ヌクレオチドには、例えばNazarenkoらへの米国特許第5,866,336号に記載される、修飾塩基、修飾糖部分、および修飾リン酸骨格を含有するそうしたヌクレオチドが含まれる。ヌクレオチドをその構造上の任意の位置で修飾するために使用され得る修飾塩基部分の例としては、それらに限定されるわけではないが、数ある中でも、5−フルオロウラシル、5−ブロモウラシル、5−クロロウラシル、5−ヨードウラシル、ヒポキサンチン、キサンチン、アセチルシトシン、5−(カルボキシヒドロキシルメチル)ウラシル、5−カルボキシメチルアミノメチル−2−チオウリジン、5−カルボキシメチルアミノメチルウラシル、ジヒドロウラシル、ベータ−D−ガラクトシルクエオシン、イノシン、N〜6−イソペンテニルアデニン(sopentenyladenine)、1−メチルグアニン、1−メチルイノシン、2,2−ジメチルグアニン、2−メチルアデニン、2−メチルグアニン、3−メチルシトシン、5−メチルシトシン、N6−アデニン、7−メチルグアニン、5−メチルアミノメチルウラシル、メトキシアミノメチル(methoxyarninomethyl)−2−チオウラシル、ベータ−D−マンノシルクエオシン、5’−メトキシカルボキシメチルウラシル、5−メトキシウラシル、2−メチルチオ−N6−イソペンテニルアデニン、ウラシル−5−オキシ酢酸、シュードウラシル(pseudouracil)、クエオシン、2−チオシトシン、5−メチル−2−チオウラシル、2−チオウラシル、4−チオウラシル、5−メチルウラシル、ウラシル−5−オキシ酢酸メチルエステル、ウラシル−S−オキシ酢酸、5−メチル−2−チオウラシル、3−(3−アミノ−3−N−2−カルボキシプロピル)ウラシル、2,6−ジアミノプリン、およびビオチン化アナログが挙げられる。ヌクレオチドをその構造上の任意の位置で修飾するために使用され得る修飾糖部分の例としては、それらに限定されるわけではないが、アラビノース、2−フルオロアラビノース、キシロース、およびヘキソース、またはリン酸骨格の修飾成分、例えばホスホロチオエート、ホスホロジチオエート、ホスホロアミドチオエート、ホスホロアミデート、ホスホロジアミデート、メチルホスホネート、アルキルホスホトリエステル、もしくはホルムアセタール(formacetal)、またはそのアナログが挙げられる。
ペプチド/タンパク質/ポリペプチド:これら用語のすべては、ペプチド結合またはペプチド結合模倣体によってつながっているアミノ酸および/またはアミノ酸アナログのポリマーを指す。当技術分野において公知の、20種の天然に存在するアミノ酸ならびにそれらの1文字および3文字の名称。
試料:植物または動物などの生物またはその一部から獲得された生体材料(核酸など)を含む、生体試料などの試料。特定の実施形態では、生体試料は、ヒト対象などの動物対象から獲得される。生体試料とは、限定されることなく、数ある中でも細菌、酵母、原生動物、およびアメーバなどの単細胞生物、多細胞生物(健常なもしくは見かけ上健常なヒト対象由来、または診断されるもしくは検査されるべき状態もしくは疾患の影響を受けたヒト患者由来の試料を含めた、植物または動物など)を含めた、任意の生きた生物から獲得される、それによって排出される、またはそれによって分泌される任意の固体または流体試料である。例えば、生体試料は、骨髄、組織生検、全血、血清、血漿、血液細胞、内皮細胞、循環腫瘍細胞、リンパ液、腹水、間質液(「細胞外液」としても公知で、とりわけ歯肉溝滲出液(gingival cervicular fluid)を含めた、細胞間の空間に見い出される流体を包含する)、脳脊髄液(CSF)、唾液、粘液、痰、汗、尿、もしくは」他の任意の分泌物、排出物、または他の体液であり得る。
配列同一性/類似性:2つもしくはそれを上回る数の核酸配列間、または2つもしくはそれを上回る数のアミノ酸配列間の同一性/類似性は、配列間の同一性または類似性という観点で表現される。配列同一性は、同一性パーセンテージという観点で測定され得;パーセンテージが高ければ高いほど、配列はより同一である。核酸またはアミノ酸配列のホモログまたはオルソログは、標準的方法を使用してアラインした場合、比較的高い程度の配列同一性/類似性を持つ。
比較のための配列のアライメントの方法は、当技術分野において周知である。様々なプログラムおよびアライメントアルゴリズムが、Smith & Waterman, Adv. Appl. Math. 2:482, 1981;Needleman & Wunsch, J. Mol. Biol. 48:443, 1970;Pearson & Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988;Higgins & Sharp, Gene, 73:237-44, 1988;Higgins & Sharp, CABIOS 5: 151-3, 1989;Corpet et al, Nuc. Acids Res. 16: 10881-90, 1988;Huang et al. Computer Appls. in the Biosciences 8, 155-65, 1992;およびPearson et al, Meth. Mol. Bio. 24:307-31, 1994に記載されている。Altschul et al, J. Mol. Biol. 215:403-10, 1990は、配列アライメント法および相同性算出の詳細な検討を提示している。
NCBIの基本的な局所的アライメント検索ツール(BLAST:Basic Local Alignment Search Tool)(Altschul et al, J. Mol. Biol. 215:403-10, 1990)は、配列分析プログラムのblastp、blastn、blastx、tblastn、およびtblastxと関連した使用のために、国立生物工学情報センター(NCBI:National Center for Biological Information、National Library of Medicine、Building 38A、Room 8N805、Bethesda、Md.20894)を含めたいくつかの発信元からおよびインターネットで利用可能である。blastnは核酸配列を比較するために使用され、一方でblastpはアミノ酸配列を比較するために使用される。さらなる情報は、NCBIウェブサイトに見い出され得る。
アラインすると、同一のヌクレオチドまたはアミノ酸残基が両配列において提示されている位置の数をカウントすることによって、合致の数が決定される。配列同一性パーセントは、同定された配列に示される配列の長さによってまたは分節された長さ(同定された配列に示される配列由来の100個の連続したヌクレオチドまたはアミノ酸残基など)によって合致の数を割り、その後に、結果として生じる値に100を掛けることによって決定される。例えば、1554個のヌクレオチドを有する試験配列とアラインした場合に1166個の合致を有する核酸配列は、試験配列と75.0パーセント同一である(1166÷1554*100=75.0)。配列同一性パーセント値は、小数第1位に丸められる。例えば、75.11、75.12、75.13、および75.14は75.1に切り捨てられ、一方で75.15、75.16、75.17、75.18、および75.19は75.2に切り上げられる。長さの値は、常に整数である。別の例において、同定された配列由来の20個の連続したヌクレオチドとアラインする、20ヌクレオチド領域を含有する標的配列は、以下のように、その同定された配列と75パーセントの配列同一性を共有する領域を含有する(すなわち、15±20*100=75)。
2つの核酸分子が近縁関係にあるという1つの兆候は、2つの分子がストリンジェントな条件下で互いにハイブリダイズすることである。ストリンジェントな条件は配列依存的であり、種々の環境パラメーターの下で異なる。
特異的結合剤:タンパク質、酵素、多糖類、オリゴヌクレオチド、DNA、RNA、組換えベクター、または小分子など、規定の標的にのみ実質的にまたは選好的に結合する薬剤。核酸特異的結合剤は、DNAなどの規定の核酸にのみ、または核酸内の特異的領域にのみ実質的に結合する。一部の実施形態では、特異的結合剤は、目的の標的核酸に特異的に結合するプローブまたはプライマーである。一部の実施形態では、特異的結合剤は、クロマチンDNAなどの目的の標的核酸に特異的に結合する転写因子である。タンパク質特異的結合剤は、規定のタンパク質にのみ、またはタンパク質内の特異的領域にのみ実質的に結合する。例えば、「特異的結合剤」には、指定のポリペプチドに実質的に結合する抗体および他の薬剤が含まれる。抗体は、ポリペプチドに特異的であるモノクローナルまたはポリクローナル抗体、およびその免疫学的に有効な部分(「断片」)であり得る。特定の薬剤が特異的ポリペプチドにのみ実質的に結合するという判定は、ルーチン手順を使用するまたは適応させることによって容易に行われ得る。1つの適切なin vitroアッセイは、ウエスタンブロッティング手順(Harlow and Lane, Using Antibodies: A Laboratory Manual, CSHL, New York, 1999を含めた、多くの標準的なテキストに記載される)を使用する。一部の実施形態では、特異的結合剤は抗体である。
転写因子:転写を調節するタンパク質。とくに、転写因子は、RNAポリメラーゼの結合、および転写の開始を調節する。転写因子は、上流または下流に結合して、RNAポリメラーゼ結合を支援するまたは遮断することによって遺伝子の転写を増強するまたは抑える。転写因子という用語には、不活性のおよび活性化された転写因子の両方が含まれる。
転写因子は、典型的に、遺伝子発現の調節に影響を及ぼすモジュラータンパク質である。例示的な転写因子としては、それらに限定されるわけではないが、数ある中でも、AAF、abl、ADA2、ADA−NF1、AF−1、AFP1、AhR、AIIN3、ALL−1、アルファ−CBF、アルファ−CP1、アルファ−CP2a、アルファ−CP2b、アルファHo、アルファH2−アルファH3、Alx−4、aMEF−2、AML1、AMLla、AMLlb、AMLlc、AMLlデルタN、AML2、AML3、AML3a、AML3b、AMY−1L、A−Myb、ANF、AP−1、AP−2アルファA、AP−2アルファB、AP−2ベータ、AP−2ガンマ、AP−3(1)、AP−3(2)、AP−4、AP−5、APC、AR、AREB6、Arnt、Arnt(774M型)、ARP−1、ATBF1−A、ATBF1−B、ATF、ATF−1、ATF−2、ATF−3、ATF−3デルタZIP、ATF−a、ATF−aデルタ、ATPF1、Barhll、Barhl2、Barxl、Barx2、Bcl−3、BCL−6、BD73、ベータ−カテニン、Binl、B−Myb、BP1、BP2、ブラフマ(brahma)、BRCA1、Brn−3a、Brn−3b、Brn−4、BTEB、BTEB2、B−TFIID、C/EBPアルファ、C/EBPベータ、C/EBPデルタ、CACC結合因子、Cart−1、CBF(4)、CBF(5)、CBP、CCAAT結合因子、CCMT結合因子、CCF、CCG1、CCK−la、CCK−lb、CD28RC、cdk2、cdk9、Cdx−1、CDX2、Cdx−4、CFF、ChxlO、CLIMI、CLIM2、CNBP、CoS、COUP、CPl、CPIA、CPIC、CP2、CPBP、CPE結合タンパク質、CREB、CREB−2、CRE−BPl、CRE−BPa、CREMアルファ、CRF、Crx、CSBP−1、CTCF、CTF、CTF−1、CTF−2、CTF−3、CTF−5、CTF−7、CUP、CUTL1、Cx、サイクリンA、サイクリンTl、サイクリンT2、サイクリンT2a、サイクリンT2b、DAP、DAX1、DB1、DBF4、DBP、DbpA、DbpAv、DbpB、DDB、DDB−1、DDB−2、DEF、デルタCREB、デルタMax、DF−1、DF−2、DF−3、Dlx−1、Dlx−2、Dlx−3、DIx4(長いアイソフォーム)、Dlx−4(短いアイソフォーム、Dlx−5、Dlx−6、DP−1、DP−2、DSIF、DSIF−p14、DSIF−pl60、DTF、DUX1、DUX2、DUX3、DUX4、E、El2、E2F、E2F+E4、E2F+pl07、E2F−1、E2F−2、E2F−3、E2F−4、E2F−5、E2F−6、E47、E4BP4、E4F、E4F1、E4TF2、EAR2、EBP−80、EC2、EF1、EF−C、EGR1、EGR2、EGR3、EIIaE−A、EIIaE−B、EIIaE−Cアルファ、EIIaE−Cベータ、EivF、EIf−1、EIk−1、Emx−1、Emx−2、Emx−2、En−1、En−2、ENH−bind.prot、ENKTF−1、EPASl、エプシロンFl、ER、Erg−1、Erg−2、ERR1、ERR2、ETF、Ets−1、Ets−1デルタVil、Ets−2、Evx−1、F2F、第2因子、因子名(Factor name)、FBP、f−EBP、FKBP59、FKHL18、FKHRL1P2、Fli−1、Fos、FOXB1、FOXC1、FOXC2、FOXD1、FOXD2、FOXD3、FOXD4、FOXE1、FOXE3、FOXF1、FOXF2、FOXGla、FOXG1b、FOXGlc、FOXH1、FOXI1、FOXJla、FOXJlb、FOXJ2(長いアイソフォーム)、FOXJ2(短いアイソフォーム)、FOXJ3、FOXKla、FOXKlb、FOXKlc、FOXL1、FOXMla、FOXMlb、FOXMlc、FOXN1、FOXN2、FOXN3、FOXOla、FOXOlb、FOX02、FOX03a、FOX03b、FOX04、FOXP1、FOXP3、Fra−1、Fra−2、FTF、FTS、G因子、G6因子、GABP、GABP−アルファ、GABP−ベータl、GABP−ベータ2、GADD153、GAF、ガンマCMT、ガンマCACl、ガンマCAC2、GATA−1、GATA−2、GATA−3、GATA−4、GATA−5、GATA−6、Gbx−1、Gbx−2、GCF、GCMa、GCNS、GF1、GLI、GLI3、GRアルファ、GRベータ、GRF−1、Gsc、Gscl、GT−IC、GT−IIA、GT−IIBアルファ、GT−IIBベータ、H1TF1、H1TF2、H2RIIBP、H4TF−1、H4TF−2、HAND1、HAND2、HB9、HDAC1、HDAC2、HDAC3、hDaxx、熱誘導性因子、HEB、HEBl−p67、HEBl−p94、HEF−1B、HEF−1T、HEF−4C、HEN1、HEN2、Hesxl、Hex、HIF−1、HIF−lアルファ、HIF−lベータ、HiNF−A、HiNF−B、HINF−C、HINF−D、HiNF−D3、HiNF−E、HiNF−P、HIP1、HIV−EP2、Hlf、HLTF、HLTF(Metl23)、HLX、HMBP、HMG I、HMG I(Y)、HMG Y、HMGI−C、HNF−IA、HNF−IB、HNF−IC、HNF−3、HNF−3アルファ、HNF−3ベータ、HNF−3ガンマ、HNF4、HNF−4アルファ、HNF4アルファl、HNF−4アルファ2、HNF−4アルファ3、HNF−4アルファ4、HNF4ガンマ、HNF−6アルファ、hnRNP K、HOX11、HOXAl、HOXAIO、HOXAIO PL2、HOXA11、HOXA13、HOXA2、HOXA3、HOXA4、HOXA5、HOXA6、HOXA7、HOXA9A、HOXA9B、HOXB−1、HOXB13、HOXB2、HOXB3、HOXB4、HOXBS、HOXB6、HOXA5、HOXB7、HOXB8、HOXB9、HOXC10、HOXC11、HOXC12、HOXC13、HOXC4、HOXC5、HOXC6、HOXC8、HOXC9、HOXD10、HOXD11、HOXD12、HOXD13、HOXD3、HOXD4、HOXD8、HOXD9、Hp55、Hp65、HPX42B、HrpF、HSF、HSF1(長)、HSF1(短)、HSF2、hsp56、Hsp90、IBP−1、ICER−II、ICER−Iiガンマ、ICSBP、Idl、Idl H’、Id2、Id3、Id3/Heir−1、IF1、IgPE−1、IgPE−2、IgPE−3、IカッパB、IカッパB−アルファ、IカッパB−ベータ、IカッパBR、II−l RF、IL−6 RE−BP、11−6 RF、INSAF、IPF1、IRF−1、IRF−2、B、IRX2a、Irx−3、Irx−4、ISGF−1、ISGF−3、ISGF3アルファ、ISGF−3ガンマ、1st−1、ITF、ITF−1、ITF−2、JRF、Jun、JunB、JunD、kappay因子、KBP−1、KER1、KER−1、Koxl、KRF−1、Ku自己抗原、KUP、LBP−1、LBP−la、LBXl、LCR−Fl、LEF−1、LEF−IB、LF−A1、LHX1、LHX2、LHX3a、LHX3b、LHXS、LHX6.1a、LHX6.1b、LIT−1、Lmol、Lmo2、LMX1A、LMX1B、L−Myl(長い形態)、L−Myl(短い形態)、L−My2、LSF、LXRアルファ、LyF−1、Lyl−l、M因子、Madl、MASH−1、Maxl、Max2、MAZ、MAZ1、MB67、MBF1、MBF2、MBF3、MBP−1(1)、MBP−1(2)、MBP−2、MDBP、MEF−2、MEF−2B、MEF−2C(433AA型)、MEF−2C(465AA型)、MEF−2C(473M型)、MEF−2C/デルタ32(441AA型)、MEF−2D00、MEF−2D0B、MEF−2DA0、MEF−2DAO、MEF−2DAB、MEF−2DA’B、Meis−1、Meis−2a、Meis−2b、Meis−2c、Meis−2d、Meis−2e、Meis3、Meoxl、Meoxla、Meox2、MHox(K−2)、Mi、MIF−1、Miz−1、MM−1、MOP3、MR、Msx−1、Msx−2、MTB−Zf、MTF−1、mtTF1、Mxil、Myb、Myc、Myc1、Myf−3、Myf−4、Myf−5、Myf−6、MyoD、MZF−1、NCI、NC2、NCX、NELF、NER1、Net、NF Ill−a、NF NF−1、NF−1A、NF−1B、NF−1X、NF−4FA、NF−4FB、NF−4FC、NF−A、NF−AB、NFAT−1、NF−AT3、NF−Atc、NF−Atp、NF−Atx、Nf etaA、NF−CLEOa、NF−CLEOb、NFデルタE3A、NFデルタE3B、NFデルタE3C、NFデルタE4A、NFデルタE4B、NFデルタE4C、Nfe、NF−E、NF−E2、NF−E2 p45、NF−E3、NFE−6、NF−Gma、NF−GMb、NF−IL−2A、NF−IL−2B、NF−jun、NF−カッパB、NF−カッパB(様)、NF−カッパBl、NF−カッパB1、前駆体、NF−カッパB2、NF−カッパB2(p49)、NF−カッパB2前駆体、NF−カッパEl、NF−カッパE2、NF−カッパE3、NF−MHCIIA、NF−MHCIIB、NF−muEl、NF−muE2、NF−muE3、NF−S、NF−X、NF−X1、NF−X2、NF−X3、NF−Xc、NF−YA、NF−Zc、NF−Zz、NHP−1、NHP−2、NHP3、NHP4、NKX2−5、NKX2B、NKX2C、NKX2G、NKX3A、NKX3A vl、NKX3A v2、NKX3A v3、NKX3A v4、NKX3B、NKX6A、Nmi、N−Myc、N−Oct−2アルファ、N−Oct−2ベータ、N−Oct−3、N−Oct−4、N−Oct−5a、N−Oct−5b、NP−TCII、NR2E3、NR4A2、Nrf1、Nrf−1、Nrf2、NRF−2ベータl、NRF−2ガンマl、NRL、NRSF 1型、NRSF 2型、NTF、02、OCA−B、Oct−1、Oct−2、Oct−2.1、Oct−2B、Oct−2C、Oct−4A、Oct4B、Oct−5、Oct−6、オクタ因子、八量体結合因子、oct−B2、oct−B3、Otxl、Otx2、OZF、pl07、pl30、p28モジュレーター、p300、p38erg、p45、p49erg、−p53、p55、p55erg、p65デルタ、p67、Pax−1、Pax−2、Pax−3、Pax−3A、Pax−3B、Pax−4、Pax−5、Pax−6、Pax−6/Pd−5a、Pax−7、Pax−8、Pax−8a、Pax−8b、Pax−8c、Pax−8d、Pax−8e、Pax−8f、Pax−9、Pbx−la、Pbx−lb、Pbx−2、Pbx−3a、Pbx−3b、PC2、PC4、PC5、PEA3、PEBP2アルファ、PEBP2ベータ、Pit−1、PITX1、PITX2、PITX3、PKNOX1、PLZF、PO−B、Pontin52、PPARアルファ、PPARベータ、PPARガンマl、PPARガンマ2、PPUR、PR、PR A、pRb、PRD1−BF1、PRDI−BFc、Prop−1、PSE1、P−TEFb、PTF、PTFアルファ、PTFベータ、PTFデルタ、PTFガンマ、Puボックス結合因子、Puボックス結合因子(BJA−B)、PU.1、PuF、Pur因子、Rl、R2、RAR−アルファl、RAR−ベータ、RAR−ベータ2、RAR−ガンマ、RAR−ガンマ1、RBP60、RBP−Jカッパ、Rel、RelA、RelB、RFX、RFX1、RFX2、RFX3、RFXS、RF−Y、RORアルファl、RORアルファ2、RO
Rアルファ3、RORベータ、RORガンマ、Rox、RPF1、RPGアルファ、RREB−1、RSRFC4、RSRFC9、RVF、RXR−アルファ、RXR−ベータ、SAP−la、SAPlb、SF−1、SHOX2a、SHOX2b、SHOXa、SHOXb、SHP、SIII−pl lO、SIII−pl5、SIII−pl8、SIM’、Six−1、Six−2、Six−3、Six−4、Six−5、Six−6、SMAD−1、SMAD−2、SMAD−3、SMAD−4、SMAD−5、SOX−11、SOX−12、Sox−4、Sox−5、SOX−9、Spl、Sp2、Sp3、Sp4、Sph因子、Spi−B、SPIN、SRCAP、SREBP−la、SREBP−lb、SREBP−lc、SREBP−2、SRE−ZBP、SRF、SRY、SRPl、Staf−50、STATlアルファ、STATlベータ、STAT2、STAT3、STAT4、STAT6、T3R、T3R−アルファl、T3R−アルファ2、T3R−ベータ、TAF(I)110、TAF(I)48、TAF(I)63、TAF(II)100、TAF(II)125、TAF(II)135、TAF(II)170、TAF(II)18、TAF(II)20、TAF(II)250、TAF(II)250デルタ、TAF(II)28、TAF(II)30、TAF(II)31、TAF(II)55、TAF(II)70−アルファ、TAF(II)70−ベータ、TAF(II)70−ガンマ、TAF−I、TAF−II、TAF−L、Tal−1、Tal−lベータ、Tal−2、TAR因子、TBP、TBX1A、TBX1B、TBX2、TBX4、TBXS(長いアイソフォーム)、TBXS(短いアイソフォーム)、TCF、TCF−1、TCF−1A、TCF−1B、TCF−1C、TCF−1D、TCF−1E、TCF−1F、TCF−1G、TCF−2アルファ、TCF−3、TCF−4、TCF−4(K)、TCF−4B、TCF−4E、TCFベータl、TEF−1、TEF−2、tel、TFE3、TFEB、TFIIA、TFIIA−アルファ/ベータ前駆体、TFIIA−アルファ/ベータ前駆体、TFIIA−ガンマ、TFIIB、TFIID、TFIIE、TFIIE−アルファ、TFIIE−ベータ、TFIIF、TFIIF−アルファ、TFIIF−ベータ、TFIIH、TFIIH*、TFIIH−CAK、TFIIH−サイクリンH、TFIIH−ERCC2/CAK、TFIIH−MAT1、TFIIH−M015、TFIIH−p34、TFIIH−p44、TFIIH−p62、TFIIH−p80、TFIIH−p90、TFII−I、Tf−LFl、Tf−LF2、TGIF、TGIF2、TGT3、THRAl、TIF2、TLE1、TLX3、TMF、TR2、TR2−11、TR2−9、TR3、TR4、TRAP、TREB−1、TREB−2、TREB−3、TREFl、TREF2、TRF(2)、TTF−1、TXRE BP、TxREF、UBF、UBP−1、UEF−1、UEF−2、UEF−3、UEF−4、USF1、USF2、USF2b、Vav、Vax−2、VDR、vHNF−lA、vHNF−lB、vHNF−lC、VITF、WSTF、WT1、WT1I、WT1 I−KTS、WT1 I−del2、WT1−KTS、WTl−del2、X2BP、XBP−1、XW−V、XX、YAF2、YB−1、YEBP、YY1、ZEB、ZF1、ZF2、ZFX、ZHX1、ZIC2、ZID、ZNF174が挙げられる。
活性化された転写因子とは、転写因子の状態の測定可能な変化をもたらす刺激、例えばリン酸化、メチル化などの翻訳後修飾によって活性化されている転写因子である。転写因子の活性化は、特定のDNA配列に対する親和性、または別の転写因子および/もしくは補因子などの特定のタンパク質の親和性の変化をもたらし得る。
トランスポソーム:トランスポザーゼ−トランスポゾン複合体。トランスポゾン突然変異誘発のための従来のやり方は、通常、プラスミドにトランスポザーゼを置く。「トランスポソーム」と称される一部のそのようなシステムにおいて、トランスポザーゼは、転移反応を触媒し得る、トランスポゾン認識部位との機能的複合体を形成し得る。トランスポザーゼまたはインテグラーゼは、トランスポザーゼ認識部位に結合し得、「タグメンテーション」と称されることもある工程において、標的核酸にトランスポザーゼ認識部位を挿入し得る。
結合を可能にする条件下:所望の活性を可能にする任意の環境、例えば核酸分子および/もしくはタンパク質分子などの2つまたはそれを上回る数の分子が結合し得る条件を記載するために使用される語句。そのような条件には、分子の結合を促す塩および/または他の化学物質の特異的濃度が含まれ得る。
本開示の実践または試験のための適切な方法および材料が下に記載される。そのような方法および材料は単なる例示であり、限定的であることが意図されるわけではない。本明細書において記載されるものと同様のまたは等価の他の方法および材料が使用され得る。例えば、本開示が関連する技術分野において周知の従来の方法は、例えばSambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, 1989;Sambrook et al., Molecular Cloning: A Laboratory Manual, 3d ed., Cold Spring Harbor Press, 2001;Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates, 1992 (and Supplements to 2000);Ausubel et al., Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, 4th ed., Wiley & Sons, 1999;Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1990;およびHarlow and Lane, Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999を含めた、様々な一般的およびより具体的な参考文献に記載されている。加えて、材料、方法、および例は単なる例示であり、限定的であることが意図されるわけではない。
B.序論
ChIPにおける組織的バイアスおよびアーチファクトによって引き起こされる不確実性は、異なる原理に基づく方法の必要性を強調している。非ChIPマッピング法の1つのクラスは、キメラ融合体によるDNA結合タンパク質への酵素の繋留、および局所近傍におけるDNAに対する酵素の作用を伴う。例えば、DamID(van Steensel et al., 2001)および関連方法(Southall et al., 2013;Hass et al., 2015)では、Escherichia coli DamメチルトランスフェラーゼがTFに繋留され、in vivoにおけるGATC部位でアデニンのN6−メチル化を触媒する。部位は、N6−メチル指向性制限酵素を使用してゲノムワイドでマッピングされ得る。しかしながら、DamIDの分解能はGATC部位の分布によって限定されるので、DamIDは、シーケンシングリードアウトを使用して潜在的に到達可能な高い分解能を得ることができない(Aughey and Southall, 2016)。代替的な酵素繋留法であるクロマチン内因性切断(ChEC)は、TFにエンド−エキソヌクレアーゼであるミクロコッカスヌクレアーゼ(MNase)を繋留する(Schmid et al., 2004)。ChECにおいて、MNaseは、細胞を透過処理することおよび制御された切断のためにカルシウムを添加することによって活性化される。最近、IlluminaシーケンシングリードアウトがChECに適用され(ChEC−seq)、塩基対分解能をほぼ達成した(Zentner et al., 2015)。酵素繋留法はin vivo(DamID)またはin situ(ChEC)で行われ、DNAの抽出は生きたまたは透過処理された細胞から直接なされ、ゆえにクロマチンを可溶化および回収する必要性が排除されるので、酵素繋留法はChIPとは根本的に異なる。DamIDおよびChECの両方とも、マッピングされる対象となる各TFに対して、異なるキメラ融合構築物を産生することを必要とし、これは、例えば動物モデル、患者生検、および翻訳後修飾へのそれらの移行可能性を限定する。もともとのクロマチン免疫切断(ChIC)法では、架橋された細胞由来の粗核がまずTF特異的抗体で処置され、その後に、プロテインAとMNaseとの間のキメラ融合体(pA−MN)の添加、およびカルシウムによる活性化が続く(Schmid et al., 2004)。プロテインAは免疫グロブリンGに特異的に結合し、それにより融合タンパク質の必要性がなくなる。
C.例示的な実施形態の説明
酵素繋留法の利点を保持し、一方でそれが他の既存の方法論を置き換えるに至るほど、その適用可能性および使いやすさを伸ばす、ChICの大きな進展が本明細書において開示される。開示される方法の固有の特質は、架橋の非存在下で、TFの両側でのカルシウム誘導性MNase切断などの誘導性切断の数秒後に、TF−DNA複合体が溶液中に放出され、遠心分離およびDNA抽出だけによってシーケンシングのための純粋なTF結合DNA断片の回収を可能にすることである。さらに、一部の例において、磁気ビーズ上で手順を行うことによって、開示される「標的下切断およびヌクレアーゼを使用した放出(CUT&RUN:Cleavage Under Targets and Release Using Nuclease)」法は、ChIP−seqよりも簡単であり、一方でin situの方法の利点を保持する。CUT&RUNによる標的消化は、ChIPに対する完全なゲノム断片化と比べてバックグラウンドを大幅に低下させ、標準的ChIP法の約1/10のシーケンシング深度しか必要としない。さらに、単一のスパイクイン対照により、他の方法によっては可能でない、タンパク質結合の精確な定量が可能となる。開示される方法は、低い出発細胞数を可能にし、ロボット自動化は、磁気ビーズ上で反応を実施することによって可能である。
標的下切断およびヌクレアーゼを使用した放出(CUT&RUN)は、例えばミクロコッカスヌクレアーゼによる、抗体標的化制御切断によって、ペアードエンドDNAシーケンシングのための特異的タンパク質−DNA複合体が上清に放出される、エピゲノムプロファイリングストラテジーである。標的断片のみが溶液中に入り、DNAの圧倒的多数は取り残されるので、CUT&RUNは、クロマチン結合をプローブするための他の技法と比較して、並外れて低いバックグラウンドレベルを有する。CUT&RUNは、最も広く使用されているクロマチン免疫沈降(ChIP)プロトコールを、分解能、シグナル対ノイズ、および必要とされるシーケンシングの深度の点で優れている。ChIPとは対照的に、CUT&RUNは、溶解性およびDNA接近性アーチファクトがなく、不溶性クロマチンをプロファイルするためにおよび架橋なしで長距離3D接触を検出するために使用され得る。さらに、核の単離を必要とせず、ヒストン修飾についてはわずか1または2個のみの細胞および転写因子マッピングについては1000個の細胞から出発して高品質データを提供する、改良CUT&RUNプロトコールが本明細書において開示される。細胞から精製DNAまで、CUT&RUNは、ラボラトリーベンチで1日未満しか必要としない。
細胞(または細胞の集団)内のDNAの配列への目的のクロマチン関連因子の結合を検出するための方法が本明細書において開示される。ある特定の実施形態では、開示される方法は、約4℃未満の温度で、架橋されていない透過処理された細胞と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、特異的結合剤は、例えばカチオンなどのイオンの添加によって、不活性でありかつ活性化可能であるヌクレアーゼ、または必要に応じて不活性でありかつ活性化可能であるトランスポザーゼを含むトランスポソームに連結されている、ステップを含む。ある特定の実施形態では、細胞および/または細胞の核は、細胞と、界面活性剤、例えばTritonおよび/もしくはNP−40、またはジギトニンなどの別の薬剤など、細胞を透過処理する(permeablize)薬剤とを接触させることによって透過処理される。無傷の細胞または核を使用することによって、開示される方法は、そうでなければ断片化および他の処理ステップによって変更され得るであろう自然のままのクロマチン構造を見るという、ChIP法に勝る利点を有する。実施形態では、ヌクレアーゼまたはトランスポザーゼは、例えば外因性アクチベーターを使用して活性化される。活性化されると、ヌクレアーゼまたはトランスポザーゼは、目的のクロマチン関連因子に結合しているDNAの配列を切り出し得る。ある特定の実施形態では、目的のクロマチン関連因子に結合しているDNAを切り出すのに十分な時間であるが、ヌクレアーゼまたはトランスポザーゼが拡散して接近可能なDNAを非特異的にカットしないような十分に短い時間、反応を進ませる。ある特定の実施形態では、この時間は約1秒間〜約4時間である。
ヌクレアーゼを使用する場合、時間は、目的の特異的クロマチン関連因子に対して選択され得る。例えば、非常に豊富なタンパク質に関しては、10分間でさえ長すぎる可能性がある。経時的にタンパク質は放出され、ゲノムにおける接近可能なDNAを噛みちぎるからであり、これは、制約されることなく(without being bound)、濃度とともにおそらく線形である望ましくない副作用である。ヌクレアーゼを不活性化した後、目的のクロマチン関連因子に結合している切り出されたDNAを回収する。この切り出されたクロマチンを単離しおよび調査して、切り出されたDNAの配列を決定し、それによって、細胞(または細胞の集団)内のDNAの配列への目的のクロマチン関連因子の結合を検出することができる。
上記の限定は、トランスポザーゼの使用に関しては当てはまらないであろう。トランスポザーゼを使用する場合、断片は結合したままである。トランスポザーゼはタグメンテーションの間に放出されないので、これはトランスポザーゼの場合は問題ではなく、このことは、方法の大きな利点である。実際、Tn5がそのペイロードを挿入する場合、それは他の場所で損傷を引き起こし得ず、「一度で終わり」である。それゆえ、これらの方法を用いると、時間変動は重要なパラメーターではなく、すべての因子に対する完了(37℃で約1時間)までのただのタグ付けである。これは大きな利点である。ゆえに、免疫繋留型挿入シーケンシング(ImmunoTethered Insertion Sequencing)(ITISまたはIT−seq)と称されるCUT&RUNの改良が本明細書においてさらに開示される。標準的なCUT&RUNは、データ品質の大きな低下を伴わずに100〜1000個の細胞に適用され得るが、ハイスループット単一細胞適用は、標的断片を含有する上清を、ゲノムの残りを含有する細胞から分離する必要があるので複雑である。さらに、常磁性ビーズ上に細胞を固定化することによってもたらされる容易なワークフローに続いて、DNAシーケンシングライブラリー調製を行わなければならず、これにより、手順全体の時間、コスト、および労力が大幅に増す。下記の実施例に開示されるように、本発明者らは、高活性Tn5トランスポザーゼなどのトランスポザーゼをプロテインAに融合させ、シーケンシングプラットフォーム適合性モザイクエンド(Mosaic End)オリゴヌクレオチドを担持したプロテインA/Tn5複合体によりpA−MNの添加を置換することによって、CUT&RUNの力を拡大している。Mg++を用いたTn5の活性化は、バルクおよび単一細胞適用の両方でのPCR増幅にすぐにでも用いることができる抗体標的化タグメンテーションを生じさせる。本明細書において開示されるITIS法は、生きた細胞由来の増幅配列対応ライブラリーを1日で提供し、これは、方法の魅力的な特質である。
ある特定の実施形態では、DNAはクロマチンDNAである。ある特定の実施形態では、細胞および/または核は架橋に供され得る。他の実施形態では、細胞は架橋に供されない。
ChIC、ChEC、およびChEC−seqは、切断を標的化すること、および標的部位に近いこれらの切断をマッピングすることに基づく。対照的に、開示される方法は、DNA−タンパク質複合体が上清に放出されるのに十分なほど互いに近くにおける切断のペアを用いる。開示される方法では、放出されたDNA−タンパク質複合体由来のDNAを精製し、ライブラリー調製およびシーケンシングに供する。開示される方法の他の実施形態では、上清を抽出するのではなく、むしろさらなる分析方法論、例えば:1)塩分画(CUT&RUN.塩);2)CUT&RUNからの上清をインプットとして使用したChIP−seq(CUT&RUN.ChIP);3)上清中の粒子のタンパク質補体の特徴付け、に供する。CUT&RUNのこれら発展の3つすべては、上清へのDNA−タンパク質複合体の放出を必要とするので、それらはCUT&RUNの固有の革新である。実施形態では、方法は、細胞から拡散した切り出されたDNAを塩分画に供するステップを含む。実施形態では、方法は、上清をChIP−seqに供するステップを含む。実施形態では、方法は、目的のクロマチン関連因子と会合した1つまたは複数のタンパク質の素性を判定するステップを含む。実施形態では、タンパク質の素性を判定するステップは、抗体の使用を含む。実施形態では、タンパク質の素性を判定するステップは、質量分析を含む。
ある特定の実施形態では、抗体などの特異的結合剤に連結されているおよび/または繋留されているヌクレアーゼを使用して、クロマチンDNAを切断する。ゆえに、実施形態では、開示される方法は、クロマチンDNAへのトランスポゾンの組込みを可能にする条件下で、架橋されていない透過処理された細胞と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、特異的結合剤は、少なくとも1つの人工トランスポソームに連結されている、ステップを含む。ある特定の実施形態では、ヌクレアーゼは、ミクロコッカスヌクレアーゼ(MNase)などのエンドデオキシリボヌクレアーゼである。活性化可能によって、それは、ヌクレアーゼを不活性状態から活性状態に切り替え得ることを意味する。この切り替えは、エフェクターの添加によってまたは条件を変化させることによって開始され得る。ある特定の実施形態では、エフェクターは、Ca2+またはMg++イオンなど、小分子または原子である。使用され得るヌクレアーゼは、この活性が活性化され得るという条件で、一本鎖または好ましくは二本鎖切断部位のいずれかを問わず、DNA内に切断部位を誘導し得る任意のタンパク質である。開示される方法において使用されるヌクレアーゼは、一般的にヌクレオソームリンカー領域でおよびヌクレアーゼ高感受性部位で、大部分は配列非依存的様式でDNAを切断し得る。しかしながら、多くのヌクレアーゼは、配列特異的様式でDNAを切断し、すなわち切断は、いくつかのヌクレオチドの認識配列で主に生じる。不活性状態によって、それは、ヌクレアーゼの活性がモニターされるには低すぎる、または活性時のその最大率の10%未満、好ましくは4%未満、もしくは1%未満であることを意味する。不活性状態から活性状態への遷移は、例えば化学的化合物の添加によってまたは温度を切り替えることによって誘発され得る。とくに有用なヌクレアーゼは、その活性がCa2+イオンにストリンジェントに依存するミクロコッカスヌクレアーゼ(MN)である。この酵素は、ヌクレオソームリンカー領域でおよびヌクレアーゼ高感受性(HS)部位で、クロマチンにDNA二本鎖切断を導入する。とくに有用なMNaseの例は、ヌクレアーゼAの成熟鎖(Genbank P00644のアミノ酸83〜231(2017年9月25日に利用可能なものとして、これにより参照により本明細書に組み込まれる)をコードする配列である。Genbank P00644のアミノ酸83〜231と少なくとも70%、80%、90%、95%、またはさらに99%の同一性という配列同一性を有するものなど、活性を保持するバリアントも企図される。
本開示の酵素、例えばヌクレアーゼを、好ましくは配列特異的部位である規定の部位でクロマチンに結合するクロマチンタンパク質に繋留する。目的のこのクロマチンタンパク質に酵素を繋留することによって、これまで非特異的な酵素(例えば、ヌクレアーゼ)が、繋留されたクロマチンタンパク質によって規定される特異的配列に導かれる。
本開示の好ましい実施形態では、ヌクレアーゼ(または他の酵素活性)をタグ付けする。使用されるタグは、任意のタイプのタグ、例えばタンパク質の精製を容易にするHisタグ、またはヘマグルチニン(HA)エピトープのようなエピトープ、またはアビジン、ストレプトアビジン、もしくはビオチンであり得る。
好ましい実施形態によれば、ヌクレアーゼは、融合タンパク質のX−ヌクレアーゼまたはヌクレアーゼ−Xの一部であり、Xはペプチドドメインである。Xはエピトープまたは抗体であり得、Xは、例えばビオチンに対する、親和性ドメインでもあり得る。適用の文脈において、抗体によって、それは、完全抗体、または相互作用を指揮するのに十分な抗体の部分のいずれかを意味する。そのような部分は、好ましくは抗体の可変領域Fabである。
一部の実施形態では、抗体は、少なくとも1つのトランスポソームに間接的にカップリングされている。一部の実施形態では、トランスポザーゼは、抗体に特異的に結合する特異的結合剤に連結されている。一部の実施形態では、特異的結合剤は、プロテインA、プロテインG、または抗体に特異的に結合する二次抗体を含む。一部の実施形態では、抗体は一次抗体であり、方法は、細胞と、一次抗体に特異的に結合する二次抗体とを接触させるステップであって、トランスポザーゼが、二次抗体に特異的に結合する特異的結合剤に連結されている、ステップをさらに含む。一部の実施形態では、特異的結合剤は、プロテインAもしくはプロテインG、または二次抗体に特異的に結合する三次抗体を含む。一部の実施形態では、クロマチンDNAの配列への目的のクロマチン関連因子の結合は直接的である。
ヌクレアーゼおよび/またはトランスポザーゼは、スタフィロコッカスプロテインA(pA)のすべてもしくは一部に、またはスタフィロコッカスプロテインG(pG)のすべてもしくは一部に、またはpAおよびpGの両方(pAG)に融合もされ得る。これらのタンパク質は、ウサギおよびマウスIgGに対する実に異なる親和性を有する。ヌクレアーゼは、抗体に対する親和性を有する他の任意のタンパク質またはタンパク質部分、例えばpAもしくはpGの誘導体にも融合され得る。本開示の好ましい実施形態は、実施例において詳説される融合タンパク質pAG−MNである。この場合、pA部分は、スタフィロコッカスプロテインAの2つのIgG結合ドメイン、すなわちGenbank AAA26676のアミノ酸186〜327(2017年9月25日に利用可能なものとして、これにより参照により本明細書に組み込まれる)を含有する。Genbank AAA26676のアミノ酸186〜327と少なくとも70%、80%、90%、95%、またはさらに99%の同一性という配列同一性を有するものなど、活性を保持するバリアントも企図される。しかしながら、本開示は、この特異的融合タンパク質に限定されるわけではない。あるいは、酵素、例えばヌクレアーゼは、ペプチド結合以外の結合によってXドメインに化学的に連結され得る。
ヌクレアーゼ活性化の時間は、反応が生じる温度に大きく依存する。酵素反応が氷上にてゼロ度で行われるべきである場合、活性化の時間を状況に応じて適応させ、つまり、約10℃、約9℃、約8℃、約7℃、約6℃、約5℃、約4℃、約3℃、約2℃、約1℃、または約0℃を下回る、しかし約−4℃を上回る温度など、約10℃を下回る温度で行われる同じ酵素反応を基準として延ばされる。
ヌクレアーゼまたはトランスポザーゼなどの酵素を連結するおよび/または繋留する方法は従来的であり、例えば、その全体がこれにより参照により本明細書に組み込まれる、米国特許第7,790,379号に見い出され得る。ある特定の実施形態では、ヌクレアーゼまたはトランスポザーゼは、融合タンパク質の一部である。ある特定の実施形態では、融合タンパク質は、スタフィロコッカスプロテインA(pA)、スタフィロコッカスプロテインG(pG)、pAとpGとの間の融合体(pAG)、または抗体を含む。
ある特定の実施形態では、特異的結合剤には、抗体またはその特異的結合断片が含まれる。クロマチン関連因子、またはその断片もしくは保存的バリアントを使用して、免疫反応性であるまたは受容体ポリペプチドのエピトープに結合する抗体を産生し得る。ポリクローナルまたはモノクローナル抗体、ならびにFab、F(ab’)2、およびFv断片などのモノクローナル抗体の断片、さらには、クロマチン関連因子に由来するペプチドに特異的に結合し得る他の任意の薬剤を産生し得る。最適には、クロマチン関連因子に対して作られた抗体は、目的のクロマチン関連因子に特異的に結合するであろう。つまり、そのような抗体は、上記タンパク質を認識しおよび結合するであろうが、他のタンパク質を実質的に認識しないまたは結合しないであろう。抗体が目的の標的または内在化受容体ポリペプチドに特異的に結合するという判定は、いくつかの標準的イムノアッセイ法のうちのいずれか1つ;例えば、ウエスタンブロッティング技法(Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.)によって行われる。
免疫原としての使用に適した実質的に純粋な標的または内在化受容体ポリペプチドは、精製または組換え発現によって単離される。あるいは、抗体は合成標的に対して作られ得る。
ポリクローナル抗体の調製は当業者に公知である。例えば、Green et al., "Production of Polyclonal Antisera," in Immunochemical Protocols pages 1-5, Manson, ed., Humana Press 1992;Coligan et al., "Production of Polyclonal Antisera in Rabbits, Rats, Mice and Hamsters," in: Current Protocols in Immunology, section 2.4.1, 1992を参照されたい。モノクローナル抗体の調製は同じように従来的である。例えば、Kohler & Milstein, Nature 256:495, 1975;Coligan et al., sections 2.5.1-2.6.7;およびHarlow et al., in: Antibodies: a Laboratory Manual, page 726, Cold Spring Harbor Pub., 1988を参照されたい。記載されるように同定されおよび単離された標的または内在化受容体ポリペプチドのエピトープに対するモノクローナル抗体は、KohlerおよびMilstein(Nature 256:495, 1975)の古典的方法またはその派生法に従ってマウスハイブリドーマから調製され得る。特異的抗体は、ヒトに近い霊長類抗体にも由来し得る。ヒヒにおいて治療上有用な抗体を作るための一般的な技法は、例えばWO91/11465、1991年およびLosman et al., Int. J. Cancer 46:310, 1990に見い出され得る。あるいは、クロマチン関連因子に特異的に結合する抗体は、ヒト化モノクローナル抗体に由来し得る。ヒト化モノクローナル抗体は、マウス免疫グロブリンの重可変鎖および軽可変鎖由来のマウス相補性決定領域をヒト可変ドメインに移入し、次いでマウス対応物のフレームワーク領域にヒト残基を代入することによって産生される。抗体は、コンビナトリアル免疫グロブリンライブラリーから単離されたヒト抗体断片に由来し得る。例えば、Barbas et al., in: Methods: a Companion to Methods in Enzymology, Vol. 2, page 119, 1991;Winter et al., Ann. Rev. Immunol. 12:433, 1994を参照されたい。ヒト免疫グロブリンファージライブラリーを産生するのに有用であるクローニングベクターおよび発現ベクターは、例えばSTRATAGENE(登録商標)クローニングシステム(La Jolla、Calif.)から獲得され得る。抗体には、無傷分子、ならびにエピトープ決定基に結合し得るFab、F(ab’)、およびFvなど、その断片が含まれる。これら断片を作製する方法は当技術分野において公知である。(例えば、Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, New York, 1988を参照されたい)。エピトープとは、抗体のパラトープが結合する、抗原上の任意の抗原決定基である。エピトープ決定基は、通常、アミノ酸または糖側鎖など、分子の化学的に活性な表面群からなり、通常、特異的な3次元構造特徴および特異的電荷特徴を有する。
酵素などの分子、例えばヌクレアーゼおよびトランスポザーゼは、当業者に公知の任意の数の手段を使用して、一緒に連結され得る。リンカーは、分子を別の分子につなげるために使用される任意の分子であり得る。連結される対象となる分子および検出の方法が実施される条件のような因子に応じて、リンカーは、柔軟性、安定性、ならびにある特定の化学的および/または温度パラメーターへの耐性のような特性を最適化するために、長さおよび組成が様々に異なり得る。リンカーは、連結された分子がクロマチン関連因子に結合し得および酵素がクロマチンDNAを切断するのを可能にする、十分な長さのものであるべきである。
ある特定の実施形態では、クロマチンDNAの配列への目的のクロマチン関連因子の結合は直接的である。言い換えれば、目的のクロマチン関連因子は、DNA結合転写因子によくあるであろうように、クロマチンDNAと直接接触する、例えばクロマチンDNAと直接的に物理的に接触している。ゆえに、一部の実施形態では、目的のクロマチン関連因子は転写因子である。他の実施形態では、クロマチンDNAの配列への目的のクロマチン関連因子の結合は間接的である。言い換えれば、接触は、複合体のメンバーを介してなど、間接的であり得る。このように、より長期にわたる相互作用が解明され得る。
ある特定の実施形態では、クロマチン結合剤と相互作用するタンパク質も検出され得、それらの素性が判定され得る。そのようなタンパク質は、免疫親和性アッセイと連動した質量分析アッセイによって、2次元ポリアクリルアミドゲル電気泳動(2D−PAGE)によって分離されたタンパク質の、マトリックス支援レーザー脱離/イオン化飛行時間型(MALDI−TOF)質量マッピングおよび液体クロマトグラフィー/四重極飛行時間型エレクトロスプレーイオン化タンデム質量分析(LC/Q−TOF−ESI−MS/MS)配列タグ(Kiernan et al., Anal. Biochem., 301: 49-56, 2002;Poutanen et al., Mass Spectrom., 15: 1685-1692, 2001)、エレクトロスプレーイオン化(ESI)、表面エンハンス型レーザー脱離−イオン化(SELDI)、化学イオン化、および電子衝突イオン化(EI)の使用によって検出され得る。それらのm/z比に従ったイオンの分離は、四重極型質量分析計(Q)、飛行時間型(TOF)質量分析計、磁場セクター型質量分析計、3Dおよびリニアイオントラップ(IT)、フーリエ変換イオンサイクロトロン共鳴(FT−ICR)分析計、ならびにそれらの組合せ(例えば、四重極−飛行時間型分析計またはQ−TOF分析計)を含めた、任意のタイプの質量分析計を用いて達成され得る。分離の前に、試料を、1次元またはそれを上回る次元のクロマトグラフィー分離、例えば1次元またはそれを上回る次元の液体クロマトグラフィーまたはサイズ排除クロマトグラフィーに供し得る。
SELDIなどの質量分光法を使用して、試料中のタンパク質を分析しおよび同定し得る。一例において、表面エンハンス型レーザー脱離−イオン化飛行時間型(SELDI−TOF)質量分析を使用して、例えばProteinChip(商標)(Ciphergen Biosystems、Palo Alto、CA)を使用することによって、タンパク質発現を検出する。そのような方法は当技術分野において周知である(例えば、米国特許第5,719,060号;米国特許第6,897,072号;および米国特許第6,881,586号を参照されたい)。SELDIは、分析物の捕捉または脱離を増強する表面上のエネルギーストリームに分析物を提示する、脱離のための固相法である。
一部の実施形態では、細胞またはその集団を、固体表面、例えばビーズ、またはマイクロタイタープレートの壁に固定化する。そのような固体表面に細胞をカップリングする方法は、当技術分野において、例えばハイスループット技法の背景において公知である。
実施形態では、DNAタグなどのタグを、切り出されたクロマチンDNAに、例えば切り出されたクロマチンDNAの一方または両方の末端で付加し得る。多様なタグ配列を、開示される方法の工程において、切り出されたクロマチンDNAに共有結合的に付加し得る。本明細書で使用される場合、「タグ」という用語は、別の核酸に付着して、核酸に何らかの機能性を提供するヌクレオチド配列を意味する。タグの例としては、バーコード、プライマー部位、親和性タグ、およびレポーター部分、またはそれらの任意の組合せが挙げられる。
一部の実施形態では、タグは核酸タグである。一部の実施形態では、核酸タグにはバーコードが含まれる。これらの核酸バーコードを使用して、例えば試料起源についての情報を保ちながら複数の試料が同時に分析され得るように、例えば試料、生物等により、切り出されたクロマチンDNAにタグ付けし得る。一般的に、バーコードは、1つまたは複数の特定の核酸を同定するために使用され得る1つまたは複数のヌクレオチド配列を含み得る。バーコードは人工配列であっても、天然に存在する配列であってもよい。バーコードは、少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個、またはそれを上回る数の連続したヌクレオチドを含み得る。一部の実施形態では、バーコードは、少なくとも約4、10、20、30、40、50、60、70、80、90、100個、またはそれを上回る数の連続したヌクレオチドを含む。一部の実施形態では、バーコードを含む核酸の集団におけるバーコードの少なくとも一部分は異なる。一部の実施形態では、バーコードの少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%は異なる。さらなるそのような実施形態では、バーコードのすべてが異なる。バーコードを含む核酸の集団における異なるバーコードの多様性は、例えば吐き出す−プールする(spit−pool)方法論を使用して、ランダムに生成され得るまたは非ランダムに生成され得る。一部の実施形態では、膨大な数の利用可能なバーコードは、タグ付けされた切り出された各クロマチンDNA分子が一意的識別を含むことを可能にすると理解されるであろう。鋳型核酸の混合物における各分子の一意的識別をいくつかの適用において使用して、例えばハプロタイプシーケンシング、親対立遺伝子判別、メタゲノムシーケンシング、およびゲノムの試料シーケンシングにおいて、複数の染色体、ゲノム、細胞、細胞タイプ、細胞疾患状態、および種を有する試料における個々の核酸分子を同定し得る。
一部の実施形態では、核酸タグはシーケンシングアダプターを含む。シーケンシングアダプターは、切り出されたクロマチンDNAの各末端で同じであっても異なっていてもよい。配列アダプターの包含は、例えばペアードエンドおよび/またはアレイに基づくシーケンシングなどの次世代シーケンシングを使用して産生される、断片化されたDNAのシーケンシングを容易にする。
一部の実施形態では、核酸タグはユニバーサルプライミング部位を含む。ユニバーサルプライミング部位の包含は、例えばPCRに基づく増幅を使用して産生される、断片化されたDNAの増幅を容易にする。一実施形態では、プライマー配列は、増幅に使用されるプライマーと相補的であり得る。別の実施形態では、プライマー配列は、シーケンシングに使用されるプライマーと相補的であり得る。ある特定の実施形態では、クロマチンDNAをタグ付けし、例えばトランスポザーゼを使用して同時に切断する。ゆえに、実施形態では、開示される方法は、クロマチンDNAへのトランスポゾンの組込みを可能にする条件下で、架橋されていない透過処理された細胞と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、特異的結合剤は、少なくとも1つの人工トランスポソームに連結されている、ステップを含む。
一部の実施形態では、方法は、細胞内のDNA配列への目的のクロマチン関連因子の結合部位を決定するためのin situの方法である。一部の実施形態では、方法は、透過処理された細胞と、目的のクロマチン関連因子に特異的に結合する一次抗体とを接触させるステップであって、一次抗体は、2、3、4、5、6、7、8個、またはさらにそれを上回る数、例えば2〜4個またはさらに2〜10個、およびその間のいずれかなど、複数のトランスポソームにカップリングされている、ステップを含む。実施形態では、複数のトランスポソームのそれぞれは、少なくとも1種のトランスポザーゼ、ならびに第1のトランスポザーゼ認識部位を含む第1のDNA分子、および第2のトランスポザーゼ認識部位を含む第2のDNA分子を含むトランスポゾンを含む。実施形態では、方法は、トランスポザーゼを例えばMg2+などの2価カチオンで活性化し、それによって、目的のクロマチン関連因子に結合しているDNAの配列を切り出し、およびDNAタグでタグ付けするステップであって、少なくとも1種のトランスポザーゼは、クロマチンDNAに第1および第2のDNA分子を組み込み、それによって、クロマチンDNAを切断し、ならびに第1および第2のDNA分子でタグ付けする、ステップを含む。実施形態では、方法は、切り出されたDNAを単離するステップを含む。実施形態では、方法は、切り出されたDNAの配列を決定し、それによって、細胞内のDNAの1つまたは複数の配列への目的のクロマチン関連因子の結合をマッピングするステップを含む。実施形態では、抗体は、少なくとも1種のトランスポザーゼに間接的にカップリングされている。実施形態では、トランスポザーゼは、一次抗体に特異的に結合する特異的結合剤に連結されている。実施形態では、方法は、細胞と、一次抗体に特異的に結合する二次抗体とを接触させるステップであって、トランスポザーゼが、二次抗体に特異的に結合する特異的結合剤に連結されている、ステップをさらに含む。実施形態では、方法は、細胞と、一次抗体に特異的に結合する二次抗体とを接触させるステップと;細胞と、二次抗体に特異的に結合する三次抗体とを接触させるステップであって、トランスポザーゼが、三次抗体に特異的に結合する特異的結合剤に連結されている、ステップとをさらに含む。
ある特定の実施形態では、方法は、架橋されていない透過処理された細胞と、目的のクロマチン関連因子に特異的に結合する抗体とを接触させるステップであって、抗体は、少なくとも1つのトランスポソームにカップリングされている、ステップを含む。ある特定の実施形態では、少なくとも1つのトランスポソームは、少なくとも1種のトランスポザーゼ;ならびに第1のトランスポザーゼ認識部位を含む第1のDNA分子;および第2のトランスポザーゼ認識部位を含む第2のDNA分子を含むトランスポゾンを含む。ある特定の実施形態では、方法は、トランスポザーゼを例えば2価カチオンの添加で活性化し、それによって、目的のクロマチン関連因子に結合しているDNAの配列を切り出し、およびDNAタグでタグ付けするステップであって、少なくとも1種のトランスポザーゼは、クロマチンDNAに第1および第2のDNA分子を組み込む、ステップを含む。実施形態では、方法は、切り出されたDNAを単離するステップ;および切り出されたDNAの配列を決定し、それによって、細胞内のDNAの1つまたは複数の配列への目的のクロマチン関連因子の結合をマッピングするステップを含み得る。人工トランスポソームは、少なくとも1種のトランスポザーゼおよびトランスポゾンを含む。トランスポゾンは、第1のトランスポザーゼ認識部位を含む第1のDNA分子、および第2のトランスポザーゼ認識部位を含む第2のDNA分子を含む。トランスポゾン(または、実際には、切断したトランスポゾンの2つの部分)の組込みは、断片化部位のいずれかの側に組み込まれた第1および第2のDNA分子を有する、切断された(または断片化された)DNAを産出する。このように、クロマチンDNAは、断片化されるとともに、断片化部位でタグ付けされる。一部の例において、トランスポザーゼ認識部位は同じ配列を有し、一方で他の例において、トランスポザーゼ認識部位は異なる配列を有する。クロマチンDNA全体にわたる複数の挿入により、DNAは、次世代シーケンシング法による分析に適した小さな断片に有効に断片化される。一部の実施形態では、クロマチンDNAと少なくとも2つの異なるトランスポソームとを接触させ、異なるトランスポソームは異なるDNA配列を含む。ゆえに、タグ付けされたクロマチンDNAは、異なるトランスポゾン配列により5’および3’末端でタグ付けされ得る。
トランスポゾンの第1および第2のDNA分子は、開示される方法の工程において断片に共有結合的に付加され得る、多様なタグ配列をさらに含み得る。本明細書で使用される場合、「タグ」という用語は、別の核酸に付着して、核酸に何らかの機能性を提供するヌクレオチド配列を意味する。タグの例としては、上に記載されたものなど、バーコード、プライマー部位、親和性タグ、およびレポーター部分、またはそれらの任意の組合せが挙げられる。
開示される方法は、任意のトランスポザーゼを使用し得る。一部の実施形態は、高活性Tn5トランスポザーゼおよびTn5タイプトランスポザーゼ認識部位(Goryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998))、またはMuAトランスポザーゼならびにR1およびR2末端配列を含むMuトランスポザーゼ認識部位(Mizuuchi, K., Cell, 35: 785, 1983;Savilahti, H, et al, EMBO J., 14: 4893, 1995)の使用を含み得る。高活性Tn5トランスポザーゼ(例えば、EZ−Tn5(商標)トランスポザーゼ)と複合体を形成する、例示的なトランスポザーゼ認識部位。本明細書において提供されるある特定の実施形態とともに使用され得る転移システムのさらなる例としては、Staphylococcus aureus Tn552(Colegio et al, J. Bacteriol, 183: 2384-8, 2001;Kirby C et al, Mol. Microbiol, 43: 173-86, 2002)、Tyl(Devine & Boeke, Nucleic Acids Res., 22: 3765-72, 1994、および国際公開WO95/23875)、トランスポゾンTn7(Craig, N L, Science. 271: 1512, 1996;Craig, N L, Review in: Curr Top Microbiol Immunol, 204:27-48, 1996)、Tn/OおよびIS10(Kleckner N, et al, Curr Top Microbiol Immunol, 204:49-82, 1996)、Marinerトランスポザーゼ(Lampe D J, et al, EMBO J., 15: 5470-9, 1996)、Tel(Plasterk R H, Curr. Topics Microbiol. Immunol, 204: 125-43, 1996)、Pエレメント(Gloor, G B, Methods Mol. Biol, 260: 97-114, 2004)、Tn3(Ichikawa & Ohtsubo, J Biol. Chem. 265: 18829-32, 1990)、細菌性挿入配列(Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996)、レトロウイルス(Brown, et al, Proc Natl Acad Sci USA, 86:2525-9, 1989)、ならびに酵母のレトロトランスポゾン(Boeke & Corces, Annu Rev Microbiol. 43 :403-34, 1989)が挙げられる。さらなる例としては、IS5、TnlO、Tn903、IS91 1、およびトランスポザーゼファミリー酵素の改変型(Zhang et al, (2009) PLoS Genet. 5:e1000689. Epub 2009 Oct 16;Wilson C. et al (2007) J. Microbiol. Methods 71 :332-5)、ならびに米国特許第5,925,545号;第5,965,443号;第6,437,109号;第6,159,736号;第6,406,896号;第7,083,980号;第7,316,903号;第7,608,434号;第6,294,385号;第7,067,644号;第7,527,966号;ならびに国際特許公開第WO2012103545号に記載されるものが挙げられ、それらのすべてはそれらの全体が参照により本明細書に具体的に組み込まれる。一部の実施形態では、トランスポザーゼは、Tn5トランスポザーゼまたはその高活性変異体である。一部の実施形態では、トランスポザーゼはMuトランスポゾンである。
ある特定の実施形態では、切り出されたクロマチンDNAを固定化するのに適した親和性分子でコーティングされている、ビーズ、膜、または表面(例えば、ウェルまたは管)などの基板上に断片を固定化することによって、切り出されたクロマチンDNA断片を精製する。ある特定の実施形態では、親和性分子は、シリカまたはカルボキシルがコーティングされた磁気ビーズ(SPRIビーズ)である。ある特定の実施形態では、ライブラリー(例えば、Illumina(登録商標)シーケンシング(Illumina(登録商標)Inc.、San Diego、CA)など、次世代シーケンシング適用のための)を磁気粒子上で構築する。次いで、同じDNA吸収磁気ビーズを使用して、結果として生じるライブラリーを精製し得る。一部の実施形態では、ウェルにおいてまたはビーズ、例えば磁気ビーズとして親和性表面を提供するさらなる利点は、開示される方法が、出発クロマチン材料からシーケンシングライブラリーの構築および精製の終わりまで、96ウェル形式またはマイクロ流体プラットフォームにおいてなど、多数の試料の並行処理に適応され得ることである。ある特定の実施形態では、切り出されたクロマチンDNAは、核酸断片が結合した特異的クロマチン関連因子および/または抗体からそれらが放出された後に精製される。
一部の実施形態では、切り出されたクロマチンDNAの素性を、超並列シーケンシングなどのDNAシーケンシングによって判定する。一部の技術は、固体フローセル基板上での、アダプターがライゲーションされた切り出されたクロマチンDNAのクラスター増幅を使用し得る。結果として生じるフローセル表面上の鋳型クラスターの高密度アレイは、次いで、例えば蛍光標識された可逆的ターミネーターヌクレオチドを並行して使用した、合成時シーケンシングに出され得る。
鋳型は、各読み取りの間、塩基ごとにシーケンスされ得る。ある特定の実施形態では、結果として生じるデータは、データ収集、および試料配列を公知のゲノム配列にアラインする分析ソフトウェアを使用して分析され得る。この技術の感度は、シーケンシングランの深度(例えば、マッピングされた配列タグの数)、ゲノムのサイズ、および標的因子の分布などの因子に依存し得る。多数の短いリードを統合することによって、非常に正確な結合部位の位置決めが獲得され得る。ある特定の実施形態では、データを使用して、現実のタンパク質結合部位の数十塩基対以内に結合部位の位置を決定し得、結合部位におけるタグ密度により、種々のDNA部位に対するタンパク質の結合親和性の定量および比較が可能となり得る。
一般的に、シーケンシングは、自動サンガーシーケンシング(AB 13730×1ゲノムアナライザー)、固体担体上でのパイロシーケンシング(454シーケンシング、Roche)、可逆的終結を用いた合成時シーケンシング(ILLUMINA(登録商標)ゲノムアナライザー)、ライゲーションによるシーケンシング(ABI SOLiD(登録商標))、またはバーチャルターミネーターを用いた合成時シーケンシング(HELISCOPE(登録商標))を使用して実施され得る。開示される方法との使用のための他の次世代シーケンシング技法としては、超並列シグネチャーシーケンシング(MPSS)、ポロニーシーケンシング、イオントレント半導体シーケンシング、DNAナノボールシーケンシング、Heliscope単分子シーケンシング、単分子リアルタイム(SMRT)シーケンシング、およびナノポアDNAシーケンシングが挙げられる。一部の実施形態では、切り出されたクロマチンDNAは、例えばヌクレオチド配列を決定することによって分析される。一部の例において、ヌクレオチド配列は、増幅の有無にかかわらず、シーケンシングまたはハイブリダイゼーション技法を使用して決定される。
ある特定の実施形態では、方法は容易に行われ得、データは再現性よく獲得され得る。ある特定の実施形態では、これらの方法を使用して、多数のDNA結合タンパク質および/またはクロマチン修飾因子をスクリーニングする。ある特定の実施形態では、提供される方法を使用して、5、10、50、100、200、500、750、もしくは1000個、またはそれを上回る数のDNA結合タンパク質および/またはクロマチン調節因子(CR)、ならびにそれらの修飾形態をスクリーニングする。修飾形態としては、それらに限定されるわけではないが、変異体、ならびに翻訳後修飾されたDNA結合タンパク質および/またはクロマチン修飾因子が挙げられる。
ある特定の実施形態では、提供される方法を使用して、以下のDNA結合タンパク質および/またはクロマチン修飾因子ならびにそれらの修飾形態のうちの1つまたは複数をスクリーニングする:AAF、abl、ADA2、ADA−NFl、AF−1、AFPl、AhR、AIIN3、ALL−1、アルファ−CBF、アルファ−CP1、アルファ−CP2a、アルファ−CP2b、アルファHo、アルファH2−アルファFB、Alx−4、aMEF−2、AMLl、AMLla、AMLlb、AMLlc、AMLlデルタN、AML2、AML3、AML3a、AML3b、AMY−lL、A−Myb、ANF、AP−1、AP−2アルファA、AP−2アルファB、AP−2ベータ、AP−2ガンマ、AP−3(1)、AP−3(2)、AP−4、AP−5、APC、AR、AREB6、Arnt、Arnt(774M型)、ARP−1、ATBFl−A、ATBFl−B、ATF、ATF−1、ATF−2、ATF−3、ATF−3デルタZIP、ATF−a、ATF−aデルタ、ATPFl、Barhll、Barhl2、Barxl、Barx2、Bcl−3、BCL−6、BD73、ベータ−カテニン、Binl、B−Myb、BPl、BP2、ブラフマ、BRCAl、Brn−3a、Brn−3b、Brn−4、BTEB、BTEB2、B−TFIID、C/EBPアルファ、C/EBPベータ、C/EBPデルタ、CACC結合因子、Cart−1、CBF(4)、CBF(5)、CBP、CCAAT結合因子、CCMT結合因子、CCF、CCGl、CCK−la、CCK−lb、CD28RC、cdk2、cdk9、Cdx−1、CDX2、Cdx−4、CFF、ChxlO、CLIMl、CLIM2、CNBP、CoS、COUP、CPl、CPlA、CPlC、CP2、CPBP、CPE結合タンパク質、CREB、CREB−2、CRE−BPl、CRE−BPa、CREMアルファ、CRF、Crx、CSBP−1、CTCF、CTF、CTF−1、CTF−2、CTF−3、CTF−5、CTF−7、CUP、CUTLl、Cx、サイクリンA、サイクリンTl、サイクリンT2、サイクリンT2a、サイクリンT2b、DAP、DAXl、DBl、DBF4、DBP、DbpA、DbpAv、DbpB、DDB、DDB−1、DDB−2、DEF、デルタCREB、デルタMax、DF−1、DF−2、DF−3、Dlx−1、Dlx−2、Dlx−3、DIx4(長いアイソフォーム)、Dlx−4(短いアイソフォーム、Dlx−5、Dlx−6、DP−1、DP−2、DSIF、DSIF−pl4、DSIF−pl60、DTF、DUXl、DUX2、DUX3、DUX4、E、E12、E2F、E2F+E4、E2F+pl07、E2F−1、E2F−2、E2F−3、E2F−4、E2F−5、E2F−6、E47、E4BP4、E4F、E4Fl、E4TF2、EAR2、EBP−80、EC2、EFl、EF−C、EGRl、EGR2、EGR3、EIIaE−A、EIIaE−B、EIIaE−Cアルファ、EIIaE−Cベータ、EivF、EIf−1、EIk−1、Emx−1、Emx−2、Emx−2、En−1、En−2、ENH−bind.prot.、ENKTF−1、EPAS1、エプシロンF1、ER、Erg−1、Erg−2、ERRl、ERR2、ETF、Ets−1、Ets−1デルタVil、Ets−2、Evx−1、F2F、第2因子、因子名、FBP、f−EBP、FKBP59、FKHL18、FKHRL1P2、Fli−1、Fos、FOXBl、FOXCl、FOXC2、FOXDl、FOXD2、FOXD3、FOXD4、FOXEl、FOXE3、FOXFl、FOXF2、FOXGla、FOXGlb、FOXGlc、FOXHl、FOXIl、FOXJla、FOXJlb、FOXJ2(長いアイソフォーム)、FOXJ2(短いアイソフォーム)、FOXJ3、FOXKla、FOXKlb、FOXKlc、FOXLl、FOXMla、FOXMlb、FOXMlc、FOXNl、FOXN2、FOXN3、FOXOla、FOXOlb、FOX02、FOX03a、FOX03b、FOX04、FOXPl、FOXP3、Fra−1、Fra−2、FTF、FTS、G因子、G6因子、GABP、GABP−アルファ、GABP−ベータl、GABP−ベータ2、GADD153、GAF、ガンマCMT、ガンマCACl、ガンマCAC2、GATA−1、GATA−2、GATA−3、GATA−4、GATA−5、GATA−6、Gbx−1、Gbx−2、GCF、GCMa、GCNS、GFl、GLI、GLI3、GRアルファ、GRベータ、GRF−1、Gsc、Gscl、GT−IC、GT−IIA、GT−IIBアルファ、GT−IIBベータ、HlTFl、H1TF2、H2RIIBP、H4TF−1、H4TF−2、HAND1、HAND2、HB9、HDACl、HDAC2、HDAC3、hDaxx、熱誘導性因子、HEB、HEB1−p67、HEB1−p94、HEF−1B、HEF−lT、HEF−4C、HENl、HEN2、Hesxl、Hex、HIF−1、HIF−lアルファ、HIF−lベータ、HiNF−A、HiNF−B、HINF−C、HINF−D、HiNF−D3、HiNF−E、HiNF−P、HIPl、HIV−EP2、Hlf、HLTF、HLTF(Met123)、HLX、HMBP、HMG I、HMG I(Y)、HMG Y、HMGI−C、HNF−lA、HNF−IB、HNF−lC、HNF−3、HNF−3アルファ、HNF−3ベータ、HNF−3ガンマ、HNF4、HNF−4アルファ、HNF4アルファl、HNF−4アルファ2、HNF−4アルファ3、HNF−4アルファ4、HNF4ガンマ、HNF−6アルファ、hnRNP K、HOX11、HOXAl、HOXAl0、HOXAl0 PL2、HOXA11、HOXA13、HOXA2、HOXA3、HOXA4、HOXA5、HOXA6、HOXA7、HOXA9A、HOXA9B、HOXB−1、HOXB13、HOXB2、HOXB3、HOXB4、HOXBS、HOXB6、HOXA5、HOXB7、HOXB8、HOXB9、HOXC10、HOXC11、HOXC12、HOXC13、HOXC4、HOXC5、HOXC6、HOXC8、HOXC9、HOXD10、HOXD11、HOXD12、HOXD13、HOXD3、HOXD4、HOXD8、HOXD9、Hp55、Hp65、HPX42B、HrpF、HSF、HSFl(長)、HSFl(短)、HSF2、hsp56、Hsp90、IBP−1、ICER−II、ICER−Iiガンマ、ICSBP、Idl、Idl H’、Id2、Id3、Id3/Heir−1、IF1、IgPE−1、IgPE−2、IgPE−3、IカッパB、IカッパB−アルファ、IカッパB−ベータ、IカッパBR、II−1 RF、IL−6 RE−BP、11−6 RF、INSAF、IPFl、IRF−1、IRF−2、B、IRX2a、Irx−3、Irx−4、ISGF−1、ISGF−3、ISGF3アルファ、ISGF−3ガンマ、1st−1、ITF、ITF−1、ITF−2、JRF、Jun、JunB、JunD、kappay因子、KBP−1、KERl、KER−1、Koxl、KRF−1、Ku自己抗原、KUP、LBP−1、LBP−la、LBXl、LCR−F1、LEF−1、LEF−1B、LF−A1、LHX1、LHX2、LHX3a、LHX3b、LHXS、LHX6.1a、LHX6.1b、LIT−1、Lmo1、Lmo2、LMX1A、LMX1B、L−Myl(長い形態)、L−Myl(短い形態)、L−My2、LSF、LXRアルファ、LyF−1、Lyl−1、M因子、Madl、MASH−1、Max1、Max2、MAZ、MAZl、MB67、MBFl、MBF2、MBF3、MBP−1(1)、MBP−1(2)、MBP−2、MDBP、MEF−2、MEF−2B、MEF−2C(433AA型)、MEF−2C(465AA型)、MEF−2C(473M型)、MEF−2C/デルタ32(441AA型)、MEF−2D00、MEF−2D0B、MEF−2DA0、MEF−2DAO、MEF−2DAB、MEF−2DA’B、Meis−1、Meis−2a、Meis−2b、Meis−2c、Meis−2d、Meis−2e、Meis3、Meoxl、Meoxla、Meox2、MHox(K−2)、Mi、MIF−1、Miz−1、MM−1、MOP3、MR、Msx−1、Msx−2、MTB−Zf、MTF−1、mtTF1、Mxil、Myb、Myc、Myc1、Myf−3、Myf−4、Myf−5、Myf−6、MyoD、MZF−1、NCI、NC2、NCX、NELF、NER1、Net、NF Ill−a、NF NF−1、NF−1A、NF−1B、NF−1X、NF−4FA、NF−4FB、NF−4FC、NF−A、NF−AB、NFAT−1、NF−AT3、NF−Atc、NF−Atp、NF−Atx、NfベータA、NF−CLEOa、NF−CLEOb、NFデルタE3A、NFデルタE3B、NFデルタE3C、NFデルタE4A、NFデルタE4B、NFデルタE4C、Nfe、NF−E、NF−E2、NF−E2 p45、NF−E3、NFE−6、NF−Gma、NF−GMb、NF−IL−2A、NF−IL−2B、NF−jun、NF−カッパB、NF−カッパB(様)、NF−カッパBl、NF−カッパBl、前駆体、NF−カッパB2、NF−カッパB2(p49)、NF−カッパB2前駆体、NF−カッパEl、NF−カッパE2、NF−カッパE3、NF−MHCIIA、NF−MHCIIB、NF−muEl、NF−muE2、NF−muE3、NF−S、NF−X、NF−X1、NF−X2、NF−X3、NF−Xc、NF−YA、NF−Zc、NF−Zz、NHP−1、NHP−2、NHP3、NHP4、NKX2−5、NKX2B、NKX2C、NKX2G、NKX3A、NKX3A vl、NKX3A v2、NKX3A v3、NKX3A v4、NKX3B、NKX6A、Nmi、N−Myc、N−Oct−2アルファ、N−Oct−2ベータ、N−Oct−3、N−Oct−4、N−Oct−5a、N−Oct−5b、NP−TCII、NR2E3、NR4A2、Nrf1、Nrf−1、Nrf2、NRF−2ベータl、NRF−2ガンマl、NRL、NRSF 1型、NRSF 2型、NTF、02、OCA−B、Oct−1、Oct−2、Oct−2.1、Oct−2B、Oct−2C、Oct−4A、Oct4B、Oct−5、Oct−6、オクタ因子、八量体結合因子、oct−B2、oct−B3、Otxl、Otx2、OZF、pl07、pl30、p28モジュレーター、p300、p38erg、p45、p49erg、−p53、p55、p55erg、p65デルタ、p67、Pax−1、Pax−2、Pax−3、Pax−3A、Pax−3B、Pax−4、Pax−5、Pax−6、Pax−6/Pd−5a、Pax−7、Pax−8、Pax−8a、Pax−8b、Pax−8c、Pax−8d、Pax−8e、Pax−8f、Pax−9、Pbx−la、Pbx−lb、Pbx−2、Pbx−3a、Pbx−3b、PC2、PC4、PC5、PEA3、PEBP2アルファ、PEBP2ベータ、Pit−1、PITX1、PITX2、PITX3、PKNOX1、PLZF、PO−B、Pontin52、PPARアルファ、PPARベータ、PPARガンマl、PPARガンマ2、PPUR、PR、PR A、pRb、PRD1−BF1、PRDI−BFc、Prop−1、PSE1、P−TEFb、PTF、PTFアルファ、PTFベータ、PTFデルタ、PTFガンマ、Puボックス結合因子、Puボックス結合因子(BJA−B)、PU.1、PuF、Pur因子、R1、R2、RAR−アルファl、RAR−ベータ、RAR−ベータ2、RAR−ガンマ、RAR−ガンマl、RBP60、RBP−Jカッパ、Rel、RelA、RelB、RFX、RFX1、RFX2、RFX3、RFXS、RF−Y、RORアルファl、RORアルファ2、RORアルファ3、ROR
ベータ、RORガンマ、Rox、RPF1、RPGアルファ、RREB−1、RSRFC4、RSRFC9、RVF、RXR−アルファ、RXR−ベータ、SAP−la、SAPlb、SF−1、SHOX2a、SHOX2b、SHOXa、SHOXb、SHP、SIII−pl1O、SIII−p15、SIII−pl8、SIM’、Six−1、Six−2、Six−3、Six−4、Six−5、Six−6、SMAD−1、SMAD−2、SMAD−3、SMAD−4、SMAD−5、SOX−11、SOX−12、Sox−4、Sox−5、SOX−9、Spl、Sp2、Sp3、Sp4、Sph因子、Spi−B、SPIN、SRCAP、SREBP−la、SREBP−lb、SREBP−lc、SREBP−2、SRE−ZBP、SRF、SRY、SRP1、Staf−50、STATlアルファ、STATlベータ、STAT2、STAT3、STAT4、STAT6、T3R、T3R−アルファl、T3R−アルファ2、T3R−ベータ、TAF(I)l10、TAF(I)48、TAF(I)63、TAF(II)100、TAF(II)125、TAF(II)135、TAF(II)170、TAF(II)18、TAF(II)20、TAF(II)250、TAF(II)250デルタ、TAF(II)28、TAF(II)30、TAF(II)31、TAF(II)55、TAF(II)70−アルファ、TAF(II)70−ベータ、TAF(II)70−ガンマ、TAF−I、TAF−II、TAF−L、Tal−1、Tal−lベータ、Tal−2、TAR因子、TBP、TBXIA、TBXIB、TBX2、TBX4、TBXS(長いアイソフォーム)、TBXS(短いアイソフォーム)、TCF、TCF−1、TCF−1A、TCF−1B、TCF−1C、TCF−1D、TCF−1E、TCF−1F、TCF−1G、TCF−2アルファ、TCF−3、TCF−4、TCF−4(K)、TCF−4B、TCF−4E、TCFベータl、TEF−1、TEF−2、tel、TFE3、TFEB、TFIIA、TFIIA−alpl^eta前駆体、TFIIA−アルファ/ベータ前駆体、TFIIA−ガンマ、TFIIB、TFIID、TFIIE、TFIIE−アルファ、TFIIE−ベータ、TFIIF、TFIIF−アルファ、TFIIF−ベータ、TFIIH、TFIIH*、TFIIH−CAK、TFIIH−サイクリンH、TFIIH−ERCC2/CAK、TFIIH−MAT1、TFIIH−M015、TFIIH−p34、TFIIH−p44、TFIIH−p62、TFIIH−p80、TFIIH−p90、TFII−I、Tf−LFl、Tf−LF2、TGIF、TGIF2、TGT3、THRA1、TIF2、TLE1、TLX3、TMF、TR2、TR2−11、TR2−9、TR3、TR4、TRAP、TREB−1、TREB−2、TREB−3、TREF1、TREF2、TRF(2)、TTF−1、TXRE BP、TxREF、UBF、UBP−1、UEF−1、UEF−2、UEF−3、UEF−4、USF1、USF2、USF2b、Vav、Vax−2、VDR、vHNF−1A、vHNF−1B、vHNF−1C、VITF、WSTF、WT1、WT1I、WT1I−KTS、WT1I−del2、WT1−KTS、WT1−del2、X2BP、XBP−1、XW−V、XX、YAF2、YB−1、YEBP、YYl、ZEB、ZF1、ZF2、ZFX、ZHX1、ZIC2、ZID、ZNF174、ASH1L、ASH2、ATF2、ASXL1、BAP1、bcllO、Bmil、BRG1、CARM1、KAT3A/CBP、CDC73、CHD1、CHD2、CTCF、DNMT1、DOTL1、EHMT1、ESET、EZH1、EZH2、FBXL10、FRP(Plu−1)、HD AC1、HDAC2、HMGA1、hnRNPA1、HP1ガンマ、Hsetlb、JaridlA、Jarid1C、KIAA1718 JHDM1D、KAT5、KMT4、LSD1、NFKB P100、NSD2、MBD2、MBD3、MLL2、MLL4、P300、pRB、RbAP46/48、RBP1、RbBP5、RING IB、RNApolII P S2、RNApolII P S5、ROC1、sap30、setDB1、Sf3bl、SIRT1、Sirt6、SMYD1、SP1、SUV39H1、SUZ12、TCF4、TET1、TRRAP、TRX2、WDR5、WDR77、および/またはYYl。これらDNA結合タンパク質および/またはクロマチン修飾因子に対する抗体は市販されている。
本明細書において使用される場合、クロマチン関連因子とは、クロマチン上の1つもしくは複数の部位に見い出され得る、および/または一過性の様式でクロマチンと会合し得る因子である。低い存在量のクロマチン関連因子の例としては、それらに限定されるわけではないが、転写因子(例えば、腫瘍抑制因子、がん遺伝子、細胞周期調節因子、発生および/または分化因子、基本転写因子(TF))、ATP依存性クロマチンリモデラー(例えば、(P)BAF、MOT1、ISWI、INO80、CHD1)、アクチベーター(例えば、ヒストンアセチルトランスフェラーゼ(HAT))複合体、リプレッサー(例えば、ヒストンデアセチラーゼ(HDAC))複合体、コアクチベーター、コリプレッサー、他のクロマチンリモデラー、例えばヒストン(デ)メチラーゼ、DNAメチラーゼ、複製因子等が挙げられる。そのような因子は、ある特定の環境信号があると(例えば、成長および他の刺激シグナル、DNA損傷シグナル、細胞死シグナル)、トランスフェクションおよび一過性のもしくは安定な発現があると(例えば、組換え因子)、または感染があると(例えば、ウイルス因子)、細胞周期の特定の段階(例えば、Gl、S、G2、M期)でクロマチン(DNA、ヒストン)と相互作用し得る。
豊富な因子は、クロマチンの構成成分、例えばヒストンおよびそれらのバリアントである。ヒストンは翻訳後修飾によりヒストン尾部で修飾され得るが、これは、DNAおよび核タンパク質とのそれらの相互作用を変更し、例えば遺伝子調節、DNA修復、および染色体凝縮に影響を与える。H3およびH4ヒストンは、例えばメチル化、アセチル化、リン酸化、ユビキチン化、SUMO化、シトルリン化、およびADP−リボシル化によって共有結合的に修飾され得る、ヌクレオソームから突き出た長い尾部を有する。ヒストンH2AおよびH2Bのコアも修飾され得る。
ある特定の実施形態では、ハイスループットな様式で試料処理を可能にする、開示される方法が提供される。例えば、10、50、100、200、500、750、1000個、またはそれを上回る数のクロマチン関連因子および/またはクロマチン修飾が、並行して免疫沈降され得および/または分析され得る。一実施形態では、例えば96ウェルプレートを使用して、最高で96個の試料が一度に処理され得る。他の実施形態では、例えば6ウェル、12ウェル、32ウェル、384ウェル、または1536ウェルプレートを使用して、より少ないまたはより多くの試料が処理され得る。一部の実施形態では、提供される方法は、例えば一般の0.5ml、1.5ml、または2.0mlサイズの管など、管内で行われ得る。これらの管は、管ラック、浮き、または他の保持デバイスに並べられ得る。
特定の実施形態では、試料は、約1個の細胞、約2個の細胞、約3個の細胞、約5個の細胞、約10個の細胞、約25個、約50個の細胞、約100個の細胞、約150個の細胞、約200個の細胞、約300個の細胞、約400個の細胞、約500個の細胞、約1000個の細胞、約2000個の細胞、約3000個の細胞、約4000個の細胞、約5000個の細胞、約10,000個の細胞、約20,000個の細胞、約30,000個の細胞、約40,000個の細胞、約50,000個の細胞、約100,000個の細胞、約200,000個の細胞、約300,000個の細胞、約400,000個の細胞、約500,000個の細胞、または約1,000,000個の細胞を含み得る。一部の実施形態では、試料は、約1個の細胞〜約10,000個の細胞もしくは約10,000個の細胞〜約100,000個の細胞、またはそれを上回る数を含み得る。
転写因子、およびヒストンなどの他のタンパク質と直接的な物理的相互作用の状態にある特異的DNA部位を、in vivoでタンパク質によって結合された標的DNA部位のライブラリーを産生することによって単離し得る。一部の実施形態では、超並列配列分析を全ゲノム配列データベースとともに使用して、目的のタンパク質(例えば、転写因子、ポリメラーゼ、もしくは転写装置)とDNAとの相互作用パターンを分析し得る、または目的のエピジェネティッククロマチン修飾(例えば、ヒストン修飾もしくはDNA修飾)のパターンを分析し得る。
開示される方法は、生物、例えば植物、または哺乳類対象、例えばヒト対象などの動物対象における疾患状態など、疾患状態をモニタリングすることにも特に適している。ある特定の疾患状態は、in vivoにおけるクロマチンDNAへのタンパク質および/または核酸の示差的結合によって引き起こされ得および/または特徴づけされ得る。例えば、ある特定の相互作用は、罹患細胞に生じ得るが、正常細胞には生じ得ない。他の例において、ある特定の相互作用は、正常細胞に生じ得るが、罹患細胞には生じ得ない。ゆえに、開示される方法を使用して、in vivo間の相互作用のプロファイルを疾患状態と関連付けし得る。
したがって、開示される方法の態様は、標的核酸とタンパク質および/または核酸との相互作用を、疾患状態、例えばがん、またはウイルスもしくは細菌感染症などの感染症と関連付けすることに関する。疾患状態への関連付けは、限定されることなく、植物、およびヒトなどの動物を含めた、任意の生物に対して行われ得るであろうことが理解される。
疾患と関連付けされた相互作用プロファイルを「フィンガープリント」として使用して、同様の「フィンガープリント」を有することを理由に、細胞における疾患を同定し得および/または診断し得る。クロマチン関連因子およびクロマチンDNAのプロファイルを使用して、がんなどの疾患状態に関係している結合タンパク質および/または核酸を同定し得、例えば潜在的な診断用および/または治療用標的として、特定のタンパク質および/または核酸を同定し得る。加えて、プロファイルを使用して、疾患状態をモニターし得、例えば療法への応答、疾患進行をモニターし得、および/または対象に対する処置決定を行い得る。
相互作用プロファイルを獲得する能力は、例えば、試料に存在するプロファイルと、特異的疾患状態と関連付けされたものとの比較による、疾患状態の診断を可能にし、プロファイルの類似性は特定の疾患状態を示す。
したがって、開示される方法の態様は、疾患状態、例えばがん、またはウイルスもしくは細菌感染症などの感染症と関連付けされた相互作用プロファイルに基づき、疾患状態を診断することに関する。疾患状態の診断は、限定されることなく、植物、およびヒトなどの動物を含めた、任意の生物に対して行われ得るであろうことが理解される。
本開示の態様は、環境ストレスまたは状態と相互作用プロファイルとの関連付けに関し、例えば生物全体、または細胞の試料などの試料、例えば細胞の培養物を、熱ショック、浸透圧、低酸素状態、冷却、酸化ストレス、放射線、飢餓、化学物質(例えば、治療剤または潜在的治療剤)などであるがそれらに限定されない環境ストレスに曝露し得る。ストレスを適用した後、代表的な試料を、例えば様々な時点で分析に供し得、生物もしくは細胞由来の試料、例えば生物由来の細胞、または標準値などの対照と比較し得る。
一部の実施形態では、開示される方法を使用して、相互作用プロファイルをモジュレートする、例えば、相互作用プロファイルを、例えば疾患状態に関連付けされた異常なものから、無病状態を示すものに変更する薬剤について、化学物質ライブラリーをスクリーニングし得る。細胞、組織、またはさらに動物全体を化学物質ライブラリーの種々のメンバーに曝露し、および本明細書において記載される方法を実施することによって、化学物質ライブラリーの種々のメンバーを、例えばハイスループット法を使用して、比較的短時間で相互作用プロファイルに対するそれらの効果について同時にスクリーニングし得る。
一部の実施形態では、試験薬剤のスクリーニングは、多数の潜在的モジュレーター化合物を含有するコンビナトリアルライブラリーを試験することを伴う。コンビナトリアル化学物質ライブラリーは、試薬などの多数の化学的「ビルディングブロック」を組み合わせることによる、化学合成または生物学的合成のいずれかによって生成された多様な化学的化合物の収集物であり得る。例えば、ポリペプチドライブラリーなどの線形コンビナトリアル化学物質ライブラリーは、所与の化合物の長さ(例えば、ポリペプチド化合物におけるアミノ酸の数)に対してあらゆる考え得るやり方で、一連の化学的ビルディングブロック(アミノ酸)を組み合わせることによって形成される。化学的ビルディングブロックのそのようなコンビナトリアル混合により、数百万種の化学的化合物が合成され得る。
適当な薬剤がライブラリーに、例えば合成または天然化合物がコンビナトリアルライブラリーに含有され得る。数々のライブラリーが市販されておりまたは容易に産生され得;アンチセンスオリゴヌクレオチドおよびオリゴペプチドなど、ランダム化オリゴヌクレオチドの発現を含めた、多種多様な有機化合物および生体分子のランダム合成および指向性合成のための手段も公知である。あるいは、細菌、真菌、植物、および動物抽出物の形態にある天然化合物のライブラリーが利用可能であるまたは容易に産生され得る。加えて、天然のまたは合成により産生されたライブラリーおよび化合物は、従来の化学的、物理的、および生化学的な手段により容易に修飾され、コンビナトリアルライブラリーを産生するために使用され得る。そのようなライブラリーは、多数の異なる化合物のスクリーニングに有用である。
ライブラリーは、最高で約100員のメンバーなど、最高で約1,000員のメンバーなど、最高で約5,000員のメンバーなど、最高で約10,000員のメンバーなど、最高で約100,000員のメンバーなど、最高で約500,000員のメンバーなど、またはさらに500,000員を上回る数のメンバーの、様々に異なる数の組成物(メンバー)を含み得る。一例において、方法は、多数の潜在的治療用化合物を含有するコンビナトリアル化学物質またはペプチドライブラリーを提供することを伴い得る。次いで、そのようなコンビナトリアルライブラリーを本明細書において開示される方法によってスクリーニングして、所望の特徴的活性を呈するそれらのライブラリーメンバー(特に、化学種またはサブクラス)を同定する。
本明細書において開示される方法を使用して同定された化合物は、従来の「リード化合物」として働き得る、または潜在的もしくは現実の治療薬としてそれ自体が使用され得る。一部の例において、候補薬剤のプールを同定しおよびさらにスクリーニングして、収集物(collective)におけるどの個々のまたはサブプールの薬剤が所望の活性を有するかを判定し得る。
対照反応は、ライブラリーとの組合せで実施され得る。必要に応じたそのような対照反応が適切であり、スクリーニングの信頼性を増加させ得る。したがって、開示される方法は、そのような対照反応を含み得る。対照反応は、転写モジュレーターとは無関係の転写因子活性を測定する陰性対照反応であり得る。対照反応は、公知の転写モジュレーターを考慮した転写因子活性を測定する陽性対照反応でもあり得る。
開示される方法によって同定された化合物を、多様な状態に対する治療薬または薬物開発のためのリード化合物として使用し得る。遺伝子発現は、細胞の分裂、成長、複製、分化、修復、細胞の感染等を含めたすべての生物学的工程における基本であるので、転写因子活性をモニターしおよびそれらの活性をモジュレートする(modulator)化合物を同定する能力を使用して、新生物、炎症、アレルギー性過敏症、代謝性疾患、遺伝性疾患、ウイルス感染症、細菌感染症、真菌感染症等を含めた、多様な状態に対する薬物リードを同定し得る。加えて、ウイルス、真菌、農業害虫などの非所望の生物における転写因子を特異的に標的にする同定された化合物は、殺真菌剤、殺細菌剤、除草剤、殺虫剤等として働き得る。ゆえに、転写因子活性に関係している状態の範囲には、ヒトおよび他の動物における、ならびに農業適用などの植物における状態が含まれる。
本明細書において開示される方法における使用のための適切な試料には、植物、動物、細菌などの生物またはその一部から獲得された任意の従来の生体試料が含まれる(健常なもしくは見かけ上健常なヒト対象由来、またはがんなど、診断されるもしくは検査されるべき状態もしくは疾患の影響を受けたヒト患者由来の試料を含めた、植物または動物など)。試料は、任意の臓器もしくは組織(腫瘍生検など、生検または剖検検体を含む)から獲得された試料でもあり得る、または細胞(初代細胞か培養細胞かにかかわらず)、組織、もしくは臓器を含み得る。例示的な試料としては、限定されることなく、細胞、組織生検(例えば、腫瘍生検)、細針吸引物、ならびに/または組織切片(例えば、クリオスタット組織切片および/もしくはパラフィン包埋組織切片)が挙げられる。他の例において、試料には、循環腫瘍細胞(細胞表面マーカーによって同定され得る)が含まれる。特定の例において、試料は直接使用される(例えば、新鮮なまたは凍結した)、または例えば固定(例えば、ホルマリンを使用した)および/もしくはワックス中に包埋すること(ホルマリン固定パラフィン包埋(FFPE)組織試料など)によって、使用前に操作され得る。対象から組織を獲得する任意の方法が利用され得ること、および使用される方法の選択は、組織のタイプ、対象の年齢、または実践者に利用可能な手順など、様々な因子に依存するであろうことが解されるであろう。
以下の実施例は、ある特定の特質および/または実施形態を例証するために提供される。この実施例は、記載される特定の特質または実施形態に本発明を限定すると捉えられるべきではない。
(実施例1)
クロマチン免疫切断(ChIC)には、TF特異的抗体を使用して、MNaseを繋留し、結合部位でのみ切断するという利点がある。ディープシーケンシングにChICを適応させるために、本開示の方法を開発して、そうしなければディープシーケンシングライブラリーより優位であるDNAのバックグラウンド切断の提示を低減させた。核の軽度のMNase処置は、モノヌクレオソームおよびTF−DNA複合体を遊離させ、その結果、オリゴヌクレオソームが残ることが観察された。TFの両側を標的とした切断は、さらにTF−DNA複合体を上清に放出し、その結果、ペレット状の核内にゲノムの残りが残るだろう。氷上で短時間の消化反応を行うことにより、TFに結合したMNaseがゲノム周辺に拡散して接近可能なクロマチンを切断する前にTF−DNA複合体を上清から回収できることを発見した。この理論的根拠に基づいて、最初のCUT&RUNプロトコール(図1A)を開発し、洗練した。
一例では、プロトコールは、以下のステップを含む:
(1)未固定の核をレクチン被覆磁気ビーズ上に固定化する;
(2)抗体およびプロテインA−MNase(pA−MN)とともに逐次的にインキュベートし、続いて最小限の洗浄を行うステップ:
(3)氷上でCa++と混合して切断反応を開始させ、次いで、数秒から数分後にキレート化により切断反応を停止させる;そして
(4)遠心分離して、放出されたTF−DNA複合体を含有する上清を回収する。次いで、DNAを上清から抽出し、シーケンシングライブラリー調製に直接使用する。
CUT&RUNは、クロマチン複合体の限定消化を生じさせる。
CUT&RUNプロトコールを、最初は粗酵母核を使用して行った。CUT&RUNとChIP−seqを厳密に比較するために、同じFLAGタグ付きTF株、同じ核調製プロトコール、同じマウス抗FLAGモノクローナル抗体、ならびに同じIlluminaライブラリー調製およびペアードエンドシーケンシング手順を使用した(Kasinathan et al., 2014)。マウスプロテインAはマウスIgGと弱くしか結合しないので、ウサギ抗マウス二次抗体をCUT&RUNに使用した。CUT&RUNの効率を試験するために、ヌクレオソーム断片をゲノムワイドに放出すると予想された、3XFLAGタグ付きヒストンH2Aを発現するSaccharomyces cerevisiae株を使用した。実際、0℃で100倍の消化時間の経過にともなって、漸進的切断が観察され、下はモノヌクレオソームサイズに至るまでの断片の放出は、一次抗体の存在に完全に依存した(図1B)。
次いで、CUT&RUNを、ARS結合因子1(Abf1)およびrDNAエンハンサー結合タンパク質1(Reb1)という、構造が明確に異なる2つのS.cerevisiae TFに適用して、1試料当たり約2,000,000〜3,000,000のマッピングされたペアードエンドリードを得た。マッピングされた断片のサイズ分布は、4秒〜128秒の間の時点について、事実上、約150bp未満ではスーパーインポーズ可能であることが判明した(図1C)。32倍範囲にわたっての時点間のこのほぼ一致は、TF結合断片の制限消化が、Ca++を添加すると迅速に発生することを示唆し、消化時間が重要なパラメーターではないことを実証する。
マッピングされたTF断片サイズは、約150bpでピークに達するH2A断片とは対照的に、約100bpでピークに達した。TF複合体は、約100bpより小さく、ヌクレオソームは約150bpであると予想され、それ故、120bp未満の断片および150bpより大きい断片を別々にマッピングした。時点プロファイルは、各々の領域の各々のTFモチーフについて120bp未満のサイズクラス内の鮮明なCUT&RUNピークを示す(図1Dおよび図10)。スパイクイン対照に対して正規化したときのピーク占有率の緩徐で単調な増加(図11A〜11B)を除いて、1秒〜128秒の区画内で時点間の一貫した差異は観察されず、これにより、TF−DNA複合体の漸進的放出は制限消化反応を生じさせることが確証された。小さい断片の全DNA抽出および精製は、ほぼ同一の結果を生じさせた(図12A〜12C)。これは、上清からのDNAの抽出が、TF結合断片を定量的に回収すること実証する。
CUT&RUNは、in situで酵母TF結合部位を高分解能でロバストにマッピングする。
120bp未満の断片がTF結合部位周辺での切断を示すことを検証するために、ゲノム内の全ての優位なAbf1およびReb1モチーフを同定し、CUT&RUNデータに基づくモチーフとORGANICデータに基づくモチーフとがほぼ同一であることを見出した(図13A〜13D)。ORGANIC導出モチーフを使用して酵母ゲノムをスキャンし、これにより、本発明者らは、CUT&RUNの完全に独立して決定された1899のAbf1モチーフおよび1413のReb1モチーフの包括的リストを得た。ピークコールの大多数が各々のデータセットについてのモチーフとオーバーラップすることが確認され、Abf1についてはORGANICよりCUT&RUNの性能のほうが多少良好であり、逆にReb1についてはCUT&RUNよりORGANICの性能のほうが多少良好であった(図13E)。≦120bpおよび≧150bpプロファイルは、これらのモチーフを中心としたものであり、ヒートマップを構築した。Abf1およびReb1モチーフ各々を中心とする2kb区画の占有率によりランク付けしたとき、TF部位の>90%は、隣接領域と比較して対応するモチーフで断片により占有されることが観察された(図2A〜2Bおよび図14上部パネル)。これは、真陽性を表す可能性が高い。Abf1およびReb1モチーフのCUT&RUN占有は、ヌクレアーゼ接近可能性と比較して高いダイナミックレンジを示し(図14、下方パネル)、これが、ヒートマップにおいてCUT&RUNについてバックグラウンドより上のより高いコントラストとして見られた。対照的に、Abf1断片は、オーバーラップしていないReb1部位の占有をほとんど示さず、逆にReb1断片は、オーバーラップしていないAbf1部位の占有をほとんど示さなかった(図2A〜2Bおよび図14中央パネル)。TFモチーフの存在およびTFの占有率と、異なるTF部位における一般的非存在との間のほぼ完全な対応は、CUT&RUNが、TF結合に対する感度も特異度も高いことを含意する。
CUT&RUNを高分解能ChIP−seqと直接比較するために、「ORGANIC」ChIP−seqデータをAbf1およびReb1モチーフに同様に並べた。以前に報告された(Kasinathan et al., 2014)ように、ORGANIC ChIP−seqは、ゲノム全体にわたってAbf1の真陽性モチーフの大多数とほぼ全てのReb1モチーフとを検出した(図2A〜2B、上部中央パネル)。最良Reb1データは、80mM NaCl抽出で得られ、最良Abf1データは、600mM NaClで得られたが、Reb1のダイナミックレンジは、偽陽性占有の頻度が高いAbf1のダイナミックレンジより常に良好であった(図2A〜2B、下部中央パネル)。対照的に、CUT&RUNは、約10分の1のペアードエンドリードで、両方のTFについて同じ消化時点範囲で同じダイナミックレンジを示した。これは、CUT&RUNが、ORGANIC ChIP−seqよりロバストであることを実証する。これらの高分解能法(Kasinathan et al., 2014)と比較して、架橋および超音波処理を使用する標準ChIP−seqは、劣った感度および特異度を示した(図2A〜2B、右側パネル)。したがって、CUT&RUNは、ChIP−seqと比較して感度/特異度トレードオフが改善されたロバストなTF占有マップを提供する。
CUT&RUNの分解能を推定するために、モチーフ中点周辺の各々のTFの「フットプリント」を断片末端の平均密度としてプロットした。Abf1とReb1の両方について、ほぼ塩基対分解能で、これらの転写因子がモチーフを中心とする約20bpを保護することを示す鋭い20bp幅のフットプリントが観察された(図3A)。興味深いことに、切断マップにおける上流および下流の「勾配」は、>100bpにわたって約10bp離れた「歯」間距離を有する鋸歯状パターンをAbf1モチーフとReb1モチーフ両方の片側に示し、この鋸歯状パターンは、塩基組成に依存しないことが自己相関分析により確認された(図3B)。このような10bpの周期的切断選好性は、B型DNAの10bp/ターンの周期性とマッチし、これは、これらの結合されたTFの片側のDNAが、繋留されたMNaseがDNA二重らせんの片面に優先的に接近するように空間配向されていることを示唆する。MNaseのTFへの繋留は、MNaseを、ヌクレオソームの表面にあったとしても隣接するDNAを切断するように拘束し、これは、クロマチン線維の柔軟性を示唆する(図3C)。したがって、0℃で観察される非常に急速な反応速度は、繋留部位付近で切断する態勢が整っている固定化されたMNaseに起因する。
CUT&RUNはクロマチン関連複合体を正確にマッピングする
クロマチンランドスケープの移動性成分の高分解能マッピングは、ChIPに基づく方法には困難であり得る。例えば、約1メガダルトンの17サブユニットRSCヌクレオソームリモデリング複合体は、この複合体が一時的に取り込むヌクレオソームを動的にスライドさせ(Lorch et al., 2010;Ramachandran et al., 2015)、Mot1 DNAトランスロカーゼは、TATA結合タンパク質(TBP)を高親和性結合部位から動的に除去する(Zentner and Henikoff, 2013;Auble et al., 1997)。X−ChIPは、ヌクレオソームリモデリング複合体をそれらの一番近くにあるヌクレオソームと架橋させるが、ネイティブChIPは、酵母クロマチンリモデラーをヌクレオソーム非存在領域(NDR)内およびヌクレオソーム上両方のそれらの作用部位でうまく捕捉する(Zentner et al., 2013)。CUT&RUNがそのような大きいクロマチン関連複合体をプロファイリングするために、大きすぎて核膜孔を通って拡散することができない可能性がある、CUT&RUNによりin situで可溶化されるクロマチンではなく、全DNAを抽出するのが最適であることが判明した。それ故、全てのDNAを抽出し、大きいDNA断片をAMPureビーズで優先的に除去した。この改良プロトコールを、>2桁の消化範囲にわたってMot1に適用したとき、ORGANICプロファイリングを使用して得られるものに非常に類似しているクロマチンプロファイルが、しかしそのペアードエンドリード数のたった約15%で、観察された(図4A)。TBP結合部位の上流側のMot1ピークは、CUT&RUNプロファイルとORGANICプロファイルの両方に見られ、これは、Mot1が、in vitroでする(Wollmann et al., 2011)ように、in vivoで上流側からTBPに接近すること(Zentner and Henikoff, 2013)を確証する。ヒートマップおよび平均プロット分析は、≦120bp断片がTBP部位と近接した軌道を辿り、その一方で≧150bp断片が局所近傍に拡散的に分布することを示し、これは、おそらくMot1の移動動態を表す(図15A〜15B)。CUT&RUNを、RSC複合体の触媒成分であるSth1にも適用した。RSCは、NDRでヌクレオソームをスライドさせるように作用し、酵母遺伝子が転写開始部位のすぐ下流の+1ヌクレオソームの推測二回対称軸でアラインメントされた(Ramachandran et al., 2015)。均一な消化が、5秒〜30分の時間にわたって観察され(図16A)、GAL4 UAS上の直接的RSCの存在量の確認によって観察された(図16B)(Floer et al., 2010)。Sth1ピークは、NDR内で最も存在量が多く、CUT&RUNプロファイルは、5秒〜10分の間の消化時間で収量の漸増を示し(図4B)、これは、CUT&RUNプロトコールを使用して定量的制限消化が達成されることを示す。最大消化時間について並行して処置した、3XFLAG−Sth1核に由来する、しかし一次抗FLAG抗体を含めなかった、陰性対照について、ほぼ平坦な線が観察された。Sth1 CUT&RUNの結果は、Sth1 ORGANICプロファイリングの結果(Ramachandran et al., 2015)と同様であるが、収量がはるかに高い(図4C)。CUT&RUNは、クロマチン関連複合体の効率的高分解能マッピングを、非常に大きく動的なクロマチン関連複合体であっても、提供するという結論に達した。
CUT&RUNには、希少な不溶性DNA結合タンパク質複合体に対する分解能がある。
Abf1およびReb1は、比較的大量に存在するTFであるが、目的の多くのDNA結合タンパク質は希少であり、そのためChIPによりプロファイリングするのは困難であり得る。出芽酵母には1染色体当たり1つしかセントロメアヌクレオソームがなく、これは、Abf1またはReb1のモル存在量の約1%に過ぎない。H3の代わりにCenH3(Cse4)ヒストンバリアントを含有するセントロメアヌクレオソームを研究するためのさらなる課題は、それが、細胞周期全体にわたって何メガダルトンもの動原体複合体の一部であり(Akiyoshi et al., 2010)、このことが、それを高不溶性にさせる(Krassovsky et al., 2012)ことである。CUT&RUNによりCse4ヌクレオソームをプロファイリングするために、試料を消化後に分割し、1つのアリコートから上清のみを抽出し、他のアリコートから全DNAを抽出した。このようにして、可溶性および不溶性動原体複合体の回収率を比較することができた。並行して、ヒストンH2Aを同様にプロファイリングした。全クロマチンと可溶性クロマチンの間の差を取ることにより、不溶性ペレット中の各ヒストンの占有率を推測することができる。不溶性動原体について予想されたとおり、染色体上の最高Cse4占有率は、セントロメアに見られる(図5A)。際だったことに、ゲノム全体にわたってあらゆるヌクレオソームに存在する不溶性H2Aの占有率もまた、セントロメアで最大である。実際、16の酵母セントロメア全てで、本発明者らは、消化タイムコースで約120bpの機能性セントロメアに限定されるCse4およびH2Aの非常に類似した濃縮を、標準X−ChIPのものより4倍良好である分解能で観察した(図5B)。本発明者らはまた、CUT&RUNを適用する前にホルムアルデヒド架橋させた細胞に由来するビーズ結合クロマチンから全DNAを抽出し、同様の結果を得た(図5C)。興味深いことに、架橋によって、より明確に異なるプロファイルが得られ、片側に位相が定まったヌクレオソームが出現する結果となり、これらは、架橋によるクロマチンの柔軟性の低下と解釈される一方で、基本戦略を架橋細胞に適用することができることを実証する。
CUT&RUN上清と全DNAとの間で観察される差異が、動原体クロマチンの差異のある溶解度に起因することを確認するために、試料を消化前に分割し、1つのアリコートについて切断反応を2M NaClで停止させ、シーケンシングのために上清を回収した。同様の結果が、全DNAについて高塩画分に関して観察された(図17A〜17C)。セントロメアヌクレオソーム中の不溶性H2Aの明白な存在は、その組成に関する継続中の議論(Wisniewski et al., 2014;Henikoff et al., 2014;Aravamudhan et al., 2013;Shivaraju et al., 2012)に直接対処する。さらに、酵母セントロメアヌクレオソームには、>90%A+TであるDNAが巻き付いている(Krassovsky et al., 2012)ので、>100倍の消化タイムコースでセントロメア粒子が無傷であること(図5)は、CUT&RUNがATリッチDNAに対するMNaseの固有の選好性によるバイアスを受けないこと(Chung et al., 2010;McGhee and Felsenfeld, 1983)を実証する。CUT&RUNは、大きいDNA結合複合体を、希少であり、不溶性であり、ATリッチであるものであったとしても、マッピングすることができるという結論に達した。
CUT&RUNは、隣接するクロマチンを探索する。
≧150bpプロファイル(図1Dおよび図4A〜4C)の調査は、結合部位の周辺の幅広ピークを明示し、これらのピークは、消化時間に伴って深くなる、この部位自体に対応する「ノッチ」を有することもある。このパターンを、1つの末端がTF−DNA複合体周辺での切断、および可溶性断片を生じさせるのに十分なほどTF結合部位に近接している第2の切断の結果として生じる、断片の漸進的放出を表すと解釈した。≧150bp断片のヒートマップ分析は、片側に約0.5kb伸長しているそれらのそれぞれの結合モチーフにおけるAbf1およびReb1断片の占有率も示した(図2A〜2B)。このような伸長した局所的切断は、DamIDの>1kbのリーチ(van Steensel et al., 2001)を連想させ、これは、テザーの柔軟性の結果として隣接するクロマチンが探索されることを示唆する。
CUT&RUNは、ヒト転写因子結合部位を高分解能でマッピングする。
単純な、よく研究されたゲノムにおいて原理証明を確立することにより、CUT&RUNをヒトK562細胞のCCCTC結合因子(CTCF)に適用した。様々な方法の効率を直接比較するために、10,000,000リードを各々の技法についてランダムに選択し、生スコアを、シーケンシングされたリードごとに情報内容の表示としてプロットした。酵母TFの場合と同様に、CTCF CUT&RUNは、標準X−ChIP−seqおよびChIP−exoを含む他のプロファイリング方法より高いダイナミックレンジを示した(図6A)。DNaseI超高感受性部位または以前に同定された結合部位内に見られるCTCFモチーフとアラインメントしたとき、CUT&RUN CTCFヒートマップとX−ChIP−seq CTCFヒートマップは、強い対応を示し、CUT&RUNのほうが高いダイナミックレンジを有した(図6B)。CUT&RUNを低温で行ったとき(図19A〜19D)、抗体なし対照は、検出不能なバックグラウンドを示した(図18)。出芽酵母TFの場合と同様に、CTCF部位に直接隣接する位相が定まったヌクレオソームに対応する、隣接する断片の放出が観察された。繋留されたMNaseの切断位置である、短いCUT&RUN断片のまさに末端位置をプロットすることにより、顕著な「トラム−トラック」が、CTCFモチーフに対して定義された位置に44bp離隔して観察された。さらに、この正確な切断パターンは、約300倍タイムコース消化範囲にわたって一致し、主要な単一の塩基対カット部位がCTCF結合部位の片側にあり、これにより、達成された制限消化が強調される(図6C)。このパターンは、切断位置が正確であることおよび細胞集団内で高度に均一であることを示す。これらの結果は、CUT&RUNが、同じ実験でTFもそれらの隣接するクロマチンも正確にマッピングすることを示唆する。CTCFは、11のジンクフィンガーを有し、それ故、並外れて安定したタンパク質−DNA相互作用を示すことができる。それ故、短いEボックスモチーフと結合し、b滞留時間を有する、塩基性ループ−ヘリックスタンパク質である、MycおよびMax(Phair et al., 2004)を使用して、CUT&RUNを試験した。CUT&RUNは、MycとMaxの両方の高分解能でのマッピングに成功した(図20A)。Maxの場合、ENCODE ChIP−seqデータとの定量的比較が、同じ抗体を使用すると可能であり、ここで、CUT&RUNは、はるかに高いダイナミックレンジを有したため、はるかに多い数のMax結合部位をロバストに同定することができた(図20B)。DNAのEボックスに結合するために、Mycは、Maxと、Maxが他の結合パートナーを有すること(Ayer and Eisenman, 1993)に加えてだが、ヘテロダイマーを形成する(Blackwood et al., 1991)。予想どおり、ほぼ全てのMyc結合部位に存在するMaxとの非常に高度なオーバーラップが見られた。対照的に、MycおよびMaxについてENCODE X−ChIP−seqによって以前の同定された結合部位間のオーバーラップは、10分の1のMax部位が同定されたので、不良である。しかし、Max ENCODE X−ChIP−seqデータをMax CUT&RUN部位に並べると、高い占有率(図20C)が見られ、これは、CUT&RUNと比較してX−ChIP−seqのより低いダイナミックレンジが、X−ChIP−seqによってこれらのMax結合部位を同定できないことの原因となることを示唆した。
CUT&RUNは、圧縮されたクロマチンにおけるヒストン修飾をマッピングする
抗体繋留MNaseを高等真核生物における高度に圧縮されたヘテロクロマチン領域から排除することができる可能性、したがって、CUT&RUNをユークロマチン領域内のタンパク質−DNA相互作用の分析に限定することができる可能性を、考慮した。それ故、CUT&RUNを抑制性ヒストンマークH3K27me3について実施した。CUT&RUNおよびENCODE X−ChIP−seqからの10,000,000のリードを分析して、CUT&RUNのほうがはるかに高いダイナミックレンジでだが、同様のH3K27me3ランドスケープが観察された。これは、プロテインA−MNaseが、圧縮されたクロマチンに接近することができることを実証する(図21)。さらに、H3K27me3切断クロマチンは、無傷の核から可溶性画分へ容易に放出され、これは、CUT&RUNを、圧縮されたクロマチンにおけるタンパク質−DNA相互作用の探索に適用可能であることを示す。
CUT&RUNは方向性をもって長距離ゲノム接触をマッピングする
TFに隣接するヌクレオソームサイズの断片は、TF含有断片とともに放出されるので、3D隣接物も切断および放出される可能性があるのかどうかを問うた。染色体−立体配座−捕捉(3C)法、例えば、Hi−CおよびChIA−PET(Tang et al., 2015;Lieberman- Aiden et al., 2009)は、3Dゲノムワイド接触をマッピングするための好ましい技法である。これらの方法は、X−ChIPと同じホルムアルデヒド架橋プロトコールを使用して、3D相互作用、例えば、エンハンサーに結合したTFと、共活性化因子を介したプロモーターとのその接触との間の3D相互作用を同定する。この実施例では、X−ChIPにより同定されるタンパク質の結合部位は、プロモーターとエンハンサーの両方を、たとえ相互作用の1つが、ホルムアルデヒドにより架橋された間接的タンパク質間相互作用によるものであったとしても、含むことになる。しかし、X−ChIPにも、3Cに基づくマッピングにも、直接的部位と間接的部位とを区別するための系統的方法がない。それ故、タンパク質間相互作用の一過的性質に起因して、TF特異的DNA結合モチーフを含有する直接的結合部位のみをマッピングする結果となることが以前に示されている(Kasinathan et al., 2014)、ネイティブChIPを使用して、CTCF結合部位のマッピングを試みた。タンパク質再分布の証拠のないほぼ完全なタンパク質抽出を達成する(図22A〜22B)、新たなネイティブChIPプロトコール(下記参照)を開発した。ネイティブ条件下で、高いモチーフスコアを有する2298部位を同定した。対照的に、CTCFのCUT&RUNマッピングは、多様な範囲のモチーフスコアを有する、X−ChIPにも存在する約22,000部位を検出した(図23)。予想どおり、ネイティブChIPにより同定された全ての部位は、CUT&RUNおよびX−ChIPによってもロバストに検出され、したがって、同様のシグナル分布を示した(図7A)。有意なネイティブChIPシグナルを欠いているCUT&RUN部位は、それにもかかわらず、ネイティブChIPインプットでロバストなフットプリントを同様のカウント累積分布で示し(図7B)、3Dゲノム相互作用について予想されるような未知の結合因子の存在を示した。これは、X−ChIPと同様に、CUT&RUNが、直接的クロマチン相互作用(ネイティブCTCFピーク)と間接的クロマチン相互作用(CUT&RUNピークのみ)の両方を高分解能で発見できることを示す。
ネイティブChIPによって観察されないCTCF CUT&RUN部位が接触部位に対応することを確認するために、直接的部位および間接的部位を、ChIA−PETによって観察される接触部位と比較した。CTCF ChIA−PETは、CTCFによって媒介される相互作用ゲノム領域を同定するが、直接的にCTCFに結合している領域と間接的に結合している相互作用領域とを識別することができない。典型的な約1Mbゲノム領域については、高スコアを有するChIA−PET断片の全てが、直接的および間接的部位とオーバーラップする(図8A)。マッピングされたCTCF ChIA−PET融合断片は、使用した6カッターの制限酵素についての部位間の距離により判定して数kb範囲にあるが、直接的CUT&RUN CTCF部位と間接的CUT&RUN CTCF部位の両方が、ほぼ塩基対分解能でマッピングされる。さらに、直接的部位の91%がCTCF ChIA−PETデータに存在し、これらのChIA−PET断片の43%は、間接的部位と相互作用し、残りは、高CUT&RUNシグナルを含有する(図8C)。これは、これらの部位が、ピークコール閾値のすぐ下の複数の接触に関与する間接的部位であることを示す。
CUT&RUNは間接的接触相互作用を検出することができるというさらなる証拠として、高頻度のHi−C相互作用が直接的部位と間接的部位の間に見られ、間接的部位におけるHi−CスコアとCUT&RUNシグナルの間に定量的相関が見られた(図8B)。それ故、CUT&RUNとネイティブChIPを比較することによって、他の方法によって実行可能でない、接触部位をほぼ塩基対分解能でマッピングすること、直接的タンパク質結合部位を長距離のゲノム相互作用の結果として生じる間接的タンパク質結合部位と区別すること、およびこれらの接触に対する方向性を決定することが可能である。
CUT&RUNは少ない細胞数での定量的測定を可能にする
典型的なChIP−seq実験は、多数の細胞を必要とし、少ない細胞数のChIPは、存在量の多いタンパク質に限定されている(Kasinathan et al., 2014; Brind'Amour et al., 2015)。CTCF CUT&RUNを、600,000〜10,000,000の範囲の出発K562細胞数で出発して行った。データセット間の絶対占有率を比較するために、タンパク質占有率の正確な定量的測定を可能にするスパイクイン戦略を使用した(下記の材料および方法を参照されたい)。スパイクインDNAに対して正規化したとき、切断事象の数は、出発細胞数に比例することが観察された(図9A〜9B)。さらに、データを、ヒトゲノムとアラインメントするリードの総数に対して正規化したとき、試料に明らかな差はなく、これは、高いデータ品質が少ないインプット材料で維持されることを示す。
考察
簡易なクロマチンプロファイリング方法
CUT&RUNは、Laemmliおよび共同研究者のChIC抗体繋留ヌクレアーゼ戦略(Schmid et al., 2004)に基づく。ChICをゲノムワイドなプロファイリング法に適応させるために、5つの重要な改良を加えた。第1に、CUT&RUNを1日で行うために、およびCUT&RUNが自動化に好適であるように、迅速かつ効率的な溶液の変化を可能にする磁気ビーズに透過処理された細胞または粗核を固定化した。第2に、抗体およびpA−MNaseを、エピトープが保存され、エピトープに接近可能である、ネイティブ未固定核と、結合させた。第3に、固定化されたMNaseによる切断はゼロ次反応であるので、消化を、放出された断片の拡散を制限し、ひいてはバックグラウンドを低減させる氷冷温度で、行った。切断された断片を溶解度に基づいて分画することができるネイティブクロマチン(Sanders, 1978; Teves and Henikoff, 2012; Jahan et al., 2016)を使用して、第4に、放出されたクロマチン複合体を特異的に濃縮した。不溶性バルククロマチンを除去した。粒子の両側で切断されたクロマチン断片のみが上清に入る。第5に、DNA抽出後、これらの可溶性断片をIlluminaライブラリー調製およびペアードエンドDNAシーケンシングに使用した。CUT&RUNは、簡易性、分解能、ロバストネス、効率、データ品質、および高不溶性複合体への適用性に関して、ChIP−seqと同様にまたはそれより良好に機能する。CUT&RUNは、反応をin situで行うことにより達成される本質的に低いバックグラウンドのため、他の高分解能方法論のシーケンシング深度の約1/10しか必要としない。MNaseが活性化されるとき核は無傷であるので、CUT&RUNは、標的部位周辺の局所的環境を探索することができる。実際、CUT&RUNは、ヒト細胞において、比較的低いシーケンシング深度で、塩基対分解能で3D接触部位を回収する。
CUT&RUNは広く応用できる
ChICは、サザンブロットを使用する基本的マッピング法として12年前に記載されたが、本発明者らは、それを使用する公表文献を1つも知らない。その一方で、ChIP−seqは単独で、ヒストン修飾を含むほぼ全てのタイプのクロマチン成分、転写因子およびクロマチン関連タンパク質のプロファイリングについて、約30,000の公表文献で言及されている。ChIPと同様に、CUT&RUNは、抗体に基づくものであり、したがって、クロマチン上の任意のエピトープに適用することができるため、ChIPのために開発された大規模抗体産生基盤を利用するクロマチンプロファイリングの一般的方法とされている。CUT&RUNは、ChIP−seqおよびCUT&RUNデータセットの処理および比較のための本発明者らのカスタムソフトウェアにより実行される標準およびスパイクイン正規化選択肢で定量的占有プロファイルを提供する。CUT&RUNの唯一の非標準的特徴は、>100,000の試料のプロファイリングに十分なpA−MNを生じさせる細菌培養からのバッチで産生および精製することができるpA−MN融合タンパク質の要求である。CUT&RUNは、ChIPとは異なる原理に基づくので、架橋関連問題、超音波処理関連問題および可溶化関連問題を解決することができる。切断が結合部位の周辺でしか起こらないのでCUT&RUNに伴うバックグラウンドは低いが、ChIPは、最初に全ゲノムを細かい小片の状態にし、これらの断片は、なおシーケンシングしなければならないゲノムワイドなバックグラウンドノイズに寄与する。本発明者らが使用した短時間の低温条件下で検出可能なバックグラウンドがほぼ存在しないこと、接近可能なまたはATリッチなDNAに対する選好性が欠如していること、および酵母ゲノム内の本質的に全てのAbf1およびReb1モチーフが回収されることは、CUT&RUNが、時としてChIPを悩ませてきたタイプのアーチファクトを被らないことを示唆する(Teytelman et al., 2013;Park et al., 2013; Jain et al., 2015;Baranello et al., 2016;Kasinathan et al., 2014)。さらに、CUT&RUN抗体結合は、免疫蛍光顕微鏡法のための条件に似ている無傷核環境で起こり、したがって、細胞学的に検証されている抗体については、ChIPで失敗するものであっても、成功するはずである。CUT&RUNは、標的切断反応後にのみクロマチンを可溶化するので、古典的なクロマチン塩の分画(Sanders, 1978;Teves and Henikoff, 2012;Jahan et al., 2016)の特定のTFおよびクロマチン複合体への拡大適用に適している。
CUT&RUNは長距離接触を正確にマッピングする
CUT&RUNのための無傷核の使用の結果は、抗体繋留MNaseの長いリーチが局所的環境を探索できることである。酵母では、切断は、TFに隣接するDNAの1面で観察され、距離に伴って徐々に減少した。ヒト細胞では、切断は、CTCFの接触部位として以前に同定された部位で観察された。最近、Hi−C接触部位は、CTCF結合部位を考慮して高い信頼度でコンピュータにより予測されている(Sanborn et al., 2015)。CUT&RUNは、CTCF結合部位と相互作用の両方をマッピングし、ネイティブChIPプロトコールは、直接TF結合している部位を同定するので、それは、ゲノムの完全な高分解能1Dマップを提供し、その上、直接的TF結合部位と間接的TF結合部位を高分解能で区別してその3D接触マップを強化することができる。
低バックグラウンドレベルはシーケンシングコストを低下させる
ChIP−seq分析は、試料間で異なるリード数を補償するための正規化を概して含む。ChIP−seqでは、全ゲノム断片化は、例えば野生型およびノックダウン細胞系と比較して、正規化の基礎となる一定した低密度のゲノムワイドなバックグラウンドを招く。正規化は、存在量の多いタンパク質ではうまくいかないが、これをスパイクイン対照の使用により補正することができる(Bonhoure et al., 2014;Chen et al., 2015;Orlando et al., 2014)。しかし、厳密なスパイクイン戦略は、異なる種からの細胞の添加を必要とし、定量は、抗体の交差反応に依存している(Orlando et al., 2014)。CUT&RUNにおける低いバックグラウンドにもかかわらず試料間で正規化するために、異なる種からの一定した少量の断片化スパイクインDNAの添加は、タンパク質占有率の正確な定量に十分であり、タンパク質占有率の正確な定量を可能にする。CUT&RUNでの切断の低いバックグラウンドレベルによって、ピークを簡潔に定義するために必要とされるリードがより少ない。例えば、低分解能ChIP−seqの要件と同様の、およびCTCFに約100,000,000リードを必要としたChIP−exoよりはるかに少ない、約10,000,000のペアードエンドリードしか、各々のCTCF時点に必要とされなかった(Rhee and Pugh, 2011)。さらに、MaxおよびH3K27me3の場合、CUT&RUNの10,000,000リードは、非常に高いダイナミックレンジを提供したが、10,000,000リードは、Max ENCODE X−ChIP−seqからのピークのコールには不十分であった。この対費用効果のため、CUT&RUNは、特にシーケンシングの深度が限定的であるChIP−seqの代替として魅力的である。CUT&RUNの高い効率は、in situプロファイリングとChIPの間の根本的な相違に起因し得る:CUT&RUNは、in vivoで3D立体配座を保持するため、抗体は一次結合反応において露出面にしか接近しないが、ChIPでは、抗体は、細かい小片の状態の細胞または核の可溶化可能なゲノムワイドな内容物と相互作用する。さらに、CUT&RUN切断は、事実上、ゼロ次反応であり、その結果、ゲノム内の全ての結合エピトープについて短時間の低温タイムコースの間に定常的に粒子を放出することになる。エピトープ存在量を説明すると、600,000細胞を用いる約22,000の直接的および間接的CTCF部位のマッピングは、約5000細胞を用いるH3K27me3などの存在量の多いヒストン修飾に概して限定される超低インプットChIP−seqプロトコールの感度に匹敵すると推定される(Brind'Amour et al., 2015)。超低インプットChIPは、約2kbの分解能しか提供しないが、CUT&RUNは、ほぼ塩基対分解能を提供する。開示する方法の固有のロバストネス、高度な情報内容、少ないインプットおよびシーケンシング要求ならびに自動化の適格性は、CTCFおよび他のTFのCUT&RUNプロファイリングがエピゲノム診断に応用される可能性があることを示す。まとめると、CUT&RUNには、ChIPおよびその派生物を超えるいくつかの実用面での利点がある:低いシーケンシング深度(sequence depth)要求をもたらす低いバックグラウンドに伴って、使用の容易さが、CUT&RUNをロボットによる自動化に適用可能なものにし、その上、簡易なスパイクイン戦略での正確な定量を可能にする。したがって、全ての重要な点において、CUT&RUNは、ChIPに基づく戦略の魅力的な代替となる。
材料および方法
Flagタグ付きH2A(SBY2688)、Cse4(SBY5146)、Abf1およびReb1をそれらのそれぞれの内在性プロモーターの制御下で保有する、生物学的W1588−4C S.cerevisiae株は、以前に記載されている(Kasinathan et al., 2014;Krassovsky et al., 2012;Gelbart et al., 2001)。酵母核を記載されているように調製し(Kasinathan et al., 2014)、0.5〜0.6mlアリコートで急速凍結し、−80℃で保管した。ヒトK562細胞を標準条件下で培養した。標準プロトコールを電気泳動ゲル分析および免疫ブロット法に使用した。使用した抗体は、マウス抗FLAG(M2、Sigma、St.Louis、MO、カタログ番号F1804)、ウサギ抗マウス(Abcam、Cambridge、UK、カタログ番号ab46540)、CTCF(Millipore Billerica、MA、カタログ番号07−729)、H3K27me3(Millipore カタログ番号07−449)、c−Myc(Cell Signaling Technology Beverly、MA、カタログ番号D3N8F)、Max(Santa Cruz Biotechnology、Dallas、TX、カタログ番号sc−197)およびRNA Pol II(8WG16、Abcam カタログ番号ab817)であった。pK19pA−MNプラスミドは、Ulrich Laemmliからの寄贈品であり、pA−MNタンパク質は、記載されているように(Schmid et al., 2004)E.coli細胞から調製した。酵母核CUT&RUNのためのCUT&RUNは、公表されている手順に従って調製した粗核を用いて始める。後続のプロトコールを段階的形式で提供する(下記参照)。核を約0.7のOD600の約5×10細胞から記載されているように調製し(Orsi et al., 2015)、10個の600mLアリコートに分割し、急速凍結し、−80℃で保持し、その後、使用前に氷上で解凍した。Bio−Mag Plus Concanavalin A(レクチン)被覆ビーズを、MgCl2、CaCl2およびMnCl2各々1mMを補足したHNT(20mM HEPES pH7.5、100mM NaClおよび0.1%Tween 20)と平衡させた。レクチンを活性化するために必要なのはCa++およびMn++のみであり、MgCl2を含めなくても、透過処理した細胞のビーズへの結合に影響しなかった。ビーズ(300mL)を解凍した核アリコートと迅速に混合し、室温(RT)で≧5分保持し、透明になるまで磁気スタンド上に置き(<1分)、磁気スタンド上でデカントした。次いで、3%ウシ血清アルブミン(BSA)および2mM EDTA pH8を含有する、プロテアーゼ阻害剤(Roche Completeタブレット)と1mMフッ化フェニルメチルスルホニル(PMSF)とを補足したHNT(=HNT−PPi)中で、5分、室温でビーズをインキュベートし、次いで、HNT−PPi+0.1%BSA(ブロッキング緩衝剤)とともに5分インキュベートして、磁気スタンドを使用してデカントした。ビーズをマウス抗FLAG抗体(1:200〜1:350)とともに2時間、4℃でインキュベートし、デカントし、HNT+PMSFで1回洗浄し、次いで、ブロッキング緩衝剤中のウサギ抗マウスIgG抗体(1:200)とともに1時間、4℃でインキュベートした。ビーズをHNT+PMSFで1回洗浄し、次いで、ブロッキング緩衝剤中のpA−MN(600mg/ml、1:200)とともに1時間、4℃でインキュベートした。ビーズをHNT+PMSFで2回洗浄し、Sth1およびMot1のための10%ポリエチレングリコール8000を必要に応じて含む、20mM HEPES pH7.5、100mM NaCl(消化緩衝剤)で1回洗浄した。ビーズを1.2mlの消化緩衝剤に懸濁し、8×150mLアリコートに分割し、0℃に平衡させ、次いで、CaClと迅速に混合し、150mLの2XSTOP[ホルムアルデヒド架橋MNase処置ショウジョウバエクロマチンから抽出した5〜50pg/mlのほぼモノヌクレオソームサイズの異種DNA断片をスパイクインとして含有する、200mM NaCl、20mM EDTA、4mM EGTA、50mg/mlのRNase A(Thermo Scientific、Waltham、MA、カタログ番号EN0531)および40mg/mlのグリコーゲン(Sigma、カタログ番号10901393001)]で反応を停止させた。37℃で20分間インキュベートした後、ビーズを5分、13,000rpmで4℃で遠心分離し、上清を磁気スタンドで除去し、3mLの10%SDSおよび2mLのプロテイナーゼK(Invitrogen、Carlsbad、CA、カタログ番号25530049)と混合し、70℃で10分インキュベートし、次いで、室温で1回、緩衝フェノール−クロロホルム−イソアミルアルコール(25:24:1、Sigma P2069)で抽出し、フェーズロック管(Qiagen、Hilden、Germany、カタログ番号129046)に移し、1体積のCHClで再抽出し、2mLの2mg/mlのグリコーゲンを含有する新たな管に移し、2〜2.5体積のエタノールの添加により沈殿させ、氷で冷却し、10分、13,000rpmで4℃で遠心分離した。ペレットを100%エタノールですすぎ、空気乾燥させ、25mLの0.1×TE8(=1mM Tris pH8、0.1mM EDTA)に溶解した。高塩抽出にCUT&RUNを拡大適用するために、消化を50mL体積で行い、50mLの2XSTOPで停止させ、このSTOPにはRNaseを含めず、標準200mM NaClの代わりに4M NaClを使用した。37℃で20分後、200mLの67mg/mlのRNase Aを添加し、20分インキュベートし、次いで、13,000rpmで遠心分離して上清を清澄化した。哺乳動物細胞ヒトK562のためのCUT&RUNは、ATCC(Manassas、VA、カタログ番号CCL−243)から購入した。遠心分離に基づくプロトコールを使用してCUT&RUNを行った。10,000,000細胞を遠心分離(600g、スインギングバケットローターで3分)により収集し、氷冷リン酸緩衝食塩水(PBS)で洗浄した。核を、5分間、氷上での1mlのNE1(20mM HEPES−KOH pH7.9;10mM KCl;1mM MgCl2;0.1%Triton X−100;20%グリセロール)への低張溶解によって単離し、その後、上記のとおり遠心分離した(一部の細胞中のヌクレアーゼは、Mg++依存性のDNA分解を引き起こした。その場合、0.5mM スペルミジンを1mM MgCl2の代わりに使用することができる)。核を1.5mlの緩衝剤1(20mM HEPES pH7.5;150mM NaCl;2mM EDTA;0.5mMスペルミジン;0.1%BSA)で短時間洗浄し、次いで、1.5mlの緩衝剤2(20mM HEPES pH7.5;150mM NaCl;0.5mMスペルミジン;0.1%BSA)で洗浄した。核を500mlの緩衝剤2に再懸濁させ、10mlの抗体を添加し、4℃で2時間インキュベートした。核を1mlの緩衝剤2で3回洗浄して未結合の抗体を除去した。核を300mlの緩衝剤2に再懸濁させ、5mlのpA−MNを添加し、4℃で1時間インキュベートした。核を0.5mlの緩衝剤2で3回洗浄して未結合のpA−MNを除去した。管を氷水中の金属ブロック内に配置し、100mMのCaCl2と迅速に混合して2mMの最終濃度にした。EDTAおよびEGTAをそれぞれ10mMおよび20mMの最終濃度になるまで添加することにより反応をクエンチし、ショウジョウバエDNAからの1ngのモノヌクレオソームサイズのDNA断片をスパイクインとして添加した。核を4℃で1時間インキュベートすることにより、切断された断片を上清に遊離させ、核を上記のとおりの遠心分離によりペレット化した。DNA断片を上清から抽出し、シーケンシングライブラリーの構築に使用した。このプロトコールを磁気ビーズとの使用(下に示す)に適用することもできる。TF ChIP−seqデータセットにおけるスパイクイン正規化ゲノムワイドバックグラウンドは、通常は、ライブラリー調製およびシーケンシングにおける試料間の可変性を補償するための正規化のために一定したバックグラウンドレベルを提供するのに十分な高さのものである。標準的正規化のために、ゲノム内の各々の塩基位置に対応する断片末端の数を、マッピングされたリード末端の総数で割った。しかし、CUT&RUNのもともと低いバックグラウンドレベルは、定量的比較のためにスパイクイン対照を必要とする(Hu et al., 2014)。ヒトCUT&RUNのスパイクイン正規化のために、少ない一定量のDrosophila melanogaster DNAを各々の反応に添加した。ペアードエンドリードをヒトゲノムとハエゲノムの両方にマッピングして、ヒトプロファイルをハエリード数に対して正規化した(図9A〜9B)。内部正規化を使用することにより、切断の増加は、消化タイムコースで観察されなかった。しかし、ハエスパイクインDNAへの正規化により、経時的な切断レベルの約4倍の増加が観察された。しかるが故に、CUT&RUNは、タンパク質−DNA相互作用の正確な定量に適用可能である。ライブラリー調製、シーケンシング、およびシーケンシングライブラリーのデータ処理は、サイズ選択を伴わないこと、KAPA DNAポリメラーゼライブラリー調製キットプロトコール(www.kapabiosystems.com/product-applications/products/next-generation-sequencing-2/dna-library-preparation/kapa-hyper-prep-kits/)に従ったこと、および8サイクルまたはそれより多くのサイクルにわたって増幅したことを除いて、記載されているように(Kasinathan et al., 2014; Henikoff et al., 2011)DNA断片から調製した。不溶性クロマチンに由来する大きい断片の全DNA試料を枯渇させるために、試料をAgencourt AMPure XPビーズの1/2体積と混合し、5〜10分保持し、磁気スタンド上に配置し、上清を保持してビーズを廃棄した。残存する大きい断片の上清を低減させるために、KAPAポリメラーゼライブラリー調製方法を使用するPCRサイクル数を14サイクルに増加させ、それに応じてアダプター濃度を上昇させた。PCRサイクル数の増加は、長すぎてポリメラーゼが完全に通過できない断片の線形増幅よりも、より短い断片の指数関数的増幅のほうに有利に働く。Illumina HiSeq 2500を用いてペアードエンドモードで25サイクルにわたってライブラリーをシーケンシングした。ペアードエンド断片を、sacCer3/V64ゲノムおよびビルドに、ならびにSAMファイルを生成するためにNovoalign(Novocraft)を記載されているように使用してFlyBaseから得たリリースr5.51(2013年5月)のD.melanogasterゲノム配列に、マッピングした。ヒト試料については、Bowtie2を使用してペアードエンド断片をhg19にマッピングした。データ処理用のカスタムスクリプトは、Supplementary Softwareから提供されており、github.com/peteskeneからダウンロードすることができる。比較分析のために、NCBI SRAアーカイブからダウンロードした公開されているデータセットは、ERR718799(Abf1)、SRR2568522(Reb1)、GSM749690(CTCF;1%の偽発見率を有する、ゲノム全体にわたっての20bpステップでの150bpスライディングウインドウ)であり、CTCF ChIP−exo BAMファイルは、Frank Pughにより好意的に提供されたものであった。CUT&RUNピークへのバイアスがかかっていないTF特異的モチーフのセットを得るために、MEMEモ
チーフ発見プログラムを酵母ORGANIC ChIP−seqピークコールに適用した。得られた対数オッズ位置特異的スコア行列(PSSM)を、S.cerevisiaeゲノムのMAST検索に使用して、有意な対数オッズモチーフスコアを有する部位を同定した。これは、1899のAbf1部位および1413のReb1部位を同定した。以前の研究に従って、そのTFについてのモチーフへの酵母TF結合部位の対応を、真陽性コールの「究極の判断基準」であるように使用した(Rhee and Pugh, 2011;Kasinathan et al., 2014;Zentner et al., 2015;Ganapathi et al., 2011)。Kasinathanらの閾値法(Kasinathan et al., 2014)を使用してコールされたピークから対数オッズPSSMを構築するためにMEMEを使用した。ピークコーリングカットオフは、ピーク間距離=100、最小ピーク幅=50、および最大ピーク幅=1000である、プールされた1秒〜32秒の≦120bpのAbf1およびReb1データセットについての正規化されたカウントの99.5パーセンタイルであった。CUT&RUNモチーフ回収率とORGANICモチーフ回収率を比較するために、同様のピーク数を報告するようにピークコール閾値を調整した。対数オッズ配列ロゴは、PWMTools(ccg.vital-it.ch/pwmtools/)を使用して生成した。トラックスクリーンショットは、IGV(Thorvaldsdottir et al., 2013)を使用して生成した。
実施例1のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)。
Akiyoshi B, Sarangapani KK, Powers AF, Nelson CR, Reichow SL, Arellano-Santoyo H, Gonen T, Ranish JA, Asbury CL, Biggins S. 2010. Tension directly stabilizes reconstituted kinetochore-microtubule attachments. Nature 468:576−579. doi: 10.1038/nature09594, PMID: 21107429
Aravamudhan P, Felzer-Kim I, Joglekar AP. 2013. The budding yeast point centromere associates with two Cse4 molecules during mitosis. Current Biology 23:770−774. doi: 10.1016/j.cub.2013.03.042, PMID: 23623551
Auble DT, Wang D, Post KW, Hahn S. 1997. Molecular analysis of the SNF2/SWI2 protein family member MOT1, an ATP-driven enzyme that dissociates TATA-binding protein from DNA. Molecular and Cellular Biology 17: 4842−4851. doi: 10.1128/MCB.17.8.4842
Aughey GN, Southall TD. 2016. Dam it’s good! DamID profiling of protein-DNA interactions. Wiley Interdisciplinary Reviews: Developmental Biology 5:25−37. doi: 10.1002/wdev.205, PMID: 26383089
Ayer DE, Eisenman RN. 1993. A switch from Myc:Max to Mad:Max heterocomplexes accompanies monocyte/macrophage differentiation. Genes & Development 7:2110−2119. doi: 10.1101/gad.7.11.2110, PMID: 8224841
Baranello L, Kouzine F, Sanford S, Levens D. 2016. ChIP bias as a function of cross-linking time. Chromosome Research 24:175−181. doi: 10.1007/s10577-015-9509-1, PMID: 26685864
Blackwood EM, Eisenman RN. 1991. Max: a helix-loop-helix zipper protein that forms a sequence-specific DNA-binding complex with Myc. Science 251:1211−1217. doi: 10.1126/science.2006410, PMID: 2006410
Bonhoure N, Bounova G, Bernasconi D, Praz V, Lammers F, Canella D, Willis IM, Herr W, Hernandez N, Delorenzi M, CycliX Consortium. 2014. Quantifying ChIP-seq data: a spiking method providing an internal reference for sample-to-sample normalization. Genome Research 24:1157−1168. doi: 10.1101/gr.168260.113, PMID: 24709819
Brind’Amour J, Liu S, Hudson M, Chen C, Karimi MM, Lorincz MC. 2015. An ultra-low-input native ChIP-seq protocol for genome-wide profiling of rare cell populations.
Nature Communications 6:6033. doi: 10.1038/ncomms7033, PMID: 25607992 Chen K, Hu Z, Xia Z, Zhao D, Li W, Tyler JK. 2015. The overlooked fact: Fundamental need for Spike-In control for virtually all Genome-Wide analyses. Molecular and Cellular Biology 36:662−667. doi: 10.1128/MCB.00970- 14, PMID: 26711261
Cho G, Kim J, Rho HM, Jung G. 1995. Structure-function analysis of the DNA binding domain of Saccharomyces cerevisiae ABF1. Nucleic Acids Research 23:2980−2987. doi: 10.1093/nar/23.15.2980, PMID: 7659521
Chung HR, Dunkel I, Heise F, Linke C, Krobitsch S, Ehrenhofer-Murray AE, Sperling SR, Vingron M. 2010. The effect of micrococcal nuclease digestion on nucleosome positioning data. PLoS One 5:e15754. doi: 10.1371/ journal.pone.0015754, PMID: 21206756
Floer M, Wang X, Prabhu V, Berrozpe G, Narayan S, Spagna D, Alvarez D, Kendall J, Krasnitz A, Stepansky A, Hicks J, Bryant GO, Ptashne M. 2010. A RSC/nucleosome complex determines chromatin architecture and facilitates activator binding. Cell 141:407−418. doi: 10.1016/j.cell.2010.03.048, PMID: 20434983
Ganapathi M, Palumbo MJ, Ansari SA, He Q, Tsui K, Nislow C, Morse RH. 2011. Extensive role of the general regulatory factors, Abf1 and Rap1, in determining genome-wide chromatin structure in budding yeast. Nucleic Acids Research 39:2032−2044. doi: 10.1093/nar/gkq1161, PMID: 21081559
Gelbart ME, Rechsteiner T, Richmond TJ, Tsukiyama T. 2001. Interactions of Isw2 chromatin remodeling complex with nucleosomal arrays: analyses using recombinant yeast histones and immobilized templates. Molecular and Cellular Biology 21:2098−2106. doi: 10.1128/MCB.21.6.2098-2106.2001, PMID: 11238944
Hass MR, Liow HH, Chen X, Sharma A, Inoue YU, Inoue T, Reeb A, Martens A, Fulbright M, Raju S, Stevens M, Boyle S, Park JS, Weirauch MT, Brent MR, Kopan R. 2015. SpDamID: Marking DNA bound by protein complexes identifies Notch-Dimer responsive enhancers. Molecular Cell 59:685−697. doi: 10.1016/j.molcel. 2015.07.008, PMID: 26257285
He Q, Johnston J, Zeitlinger J. 2015. ChIP-nexus enables improved detection of in vivo transcription factor binding footprints. Nature Biotechnology 33:395−401. doi: 10.1038/nbt.3121
Henikoff JG, Belsky JA, Krassovsky K, MacAlpine DM, Henikoff S. 2011. Epigenome characterization at single base-pair resolution. PNAS 108:18318−18323. doi: 10.1073/pnas.1110731108, PMID: 22025700
Henikoff S, Ramachandran S, Krassovsky K, Bryson TD, Codomo CA, Brogaard K, Widom J, Wang JP, Henikoff JG. 2014. The budding yeast centromere DNA element II wraps a stable Cse4 hemisome in either orientation in vivo. eLife 3:e01861. doi: 10.7554/eLife.01861, PMID: 24737863
Hu Z, Chen K, Xia Z, Chavez M, Pal S, Seol JH, Chen CC, Li W, Tyler JK. 2014. Nucleosome loss leads to global transcriptional up-regulation and genomic instability during yeast aging. Genes & Development 28:396−408. doi: 10.1101/gad.233221.113, PMID: 24532716
Jahan S, Xu W, He S, Gonzalez C, Delcuve GP, Davie JR. 2016. The chicken erythrocyte epigenome. Epigenetics & Chromatin 9:19. doi: 10.1186/s13072-016-0068-2, PMID: 27226810
Jain D, Baldi S, Zabel A, Straub T, Becker PB. 2015. Active promoters give rise to false positive ’Phantom Peaks’ in ChIP-seq experiments. Nucleic Acids Research 43:6959−6968. doi: 10.1093/nar/gkv637, PMID: 26117547
Kasinathan S, Orsi GA, Zentner GE, Ahmad K, Henikoff S. 2014. High-resolution mapping of transcription factor binding sites on native chromatin. Nature Methods 11:203−209. doi: 10.1038/nmeth.2766, PMID: 24336359
Krassovsky K, Henikoff JG, Henikoff S. 2012. Tripartite organization of centromeric chromatin in budding yeast. PNAS 109:243−248. doi: 10.1073/pnas.1118898109, PMID: 22184235
Lieberman-Aiden E, van Berkum NL, Williams L, Imakaev M, Ragoczy T, Telling A, Amit I, Lajoie BR, Sabo PJ, Dorschner MO, Sandstrom R, Bernstein B, Bender MA, Groudine M, Gnirke A, Stamatoyannopoulos J, Mirny LA, Lander ES, Dekker J. 2009. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 326:289−293. doi: 10.1126/science.1181369, PMID: 19815776
Lorch Y, Maier-Davis B, Kornberg RD. 2010. Mechanism of chromatin remodeling. PNAS 107:3458−3462. doi: 10.1073/pnas.1000398107, PMID: 20142505
McGhee JD, Felsenfeld G. 1983. Another potential artifact in the study of nucleosome phasing by chromatin digestion with micrococcal nuclease. Cell 32:1205−1215. doi: 10.1016/0092-8674(83)90303-3, PMID: 6301684
Meyer CA, Liu XS. 2014. Identifying and mitigating bias in next-generation sequencing methods for chromatin biology. Nature Reviews Genetics 15:709−721. doi: 10.1038/nrg3788, PMID: 25223782
Morrow BE, Ju Q, Warner JR. 1990. Purification and characterization of the yeast rDNA binding protein REB1. The Journal of Biological Chemistry 265:20778−20783. PMID: 2249986
O’Neill LP, VerMilyea MD, Turner BM. 2006. Epigenetic characterization of the early embryo with a chromatin immunoprecipitation protocol applicable to small cell populations. Nature Genetics 38:835−841. doi: 10.1038/ ng1820, PMID: 16767102
Orlando DA, Chen MW, Brown VE, Solanki S, Choi YJ, Olson ER, Fritz CC, Bradner JE, Guenther MG. 2014. Quantitative ChIP-Seq normalization reveals global modulation of the epigenome. Cell Reports 9:1163−1170. doi: 10.1016/j.celrep.2014.10.018, PMID: 25437568
Orsi GA, Kasinathan S, Zentner GE, Henikoff S, Ahmad K. 2015. Mapping regulatory factors by immunoprecipitation from native chromatin. Current Protocols in Molecular Biology 110:21.31.1−21.3121 . doi: 10.1002/0471142727.mb2131s110
Park D, Lee Y, Bhupindersingh G, Iyer VR. 2013. Widespread misinterpretable ChIP-seq bias in yeast. PLoS One 8:e83506. doi: 10.1371/journal.pone.0083506, PMID: 24349523
Paul E, Tirosh I, Lai W, Buck MJ, Palumbo MJ, Morse RH. 2015. Chromatin mediation of a transcriptional memory effect in yeast. G3(Bethesda) 5:829−838. doi: 10.1534/g3.115.017418, PMID: 25748434
Pekgoz Altunkaya G, Malvezzi F, Demianova Z, Zimniak T, Litos G, Weissmann F, Mechtler K, Herzog F, Westermann S. 2016. CCAN Assembly configures composite binding interfaces to promote Cross-Linking of Ndc80 complexes at the kinetochore. Current Biology 26:2370−2378. doi: 10.1016/j.cub.2016.07.005, PMID: 27524485
Phair RD, Scaffidi P, Elbi C, Vecerova´ J, Dey A, Ozato K, Brown DT, Hager G, Bustin M, Misteli T. 2004. Global nature of dynamic protein-chromatin interactions in vivo: three-dimensional genome scanning and dynamic interaction networks of chromatin proteins. Molecular and Cellular Biology 24:6393−6402. doi: 10.1128/MCB. 24.14.6393-6402.2004, PMID: 15226439
Ramachandran S, Zentner GE, Henikoff S. 2015. Asymmetric nucleosomes flank promoters in the budding yeast genome. Genome Research 25:381−390. doi: 10.1101/gr.182618.114, PMID: 25491770
Rhee HS, Pugh BF. 2011. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147:1408−1419. doi: 10.1016/j.cell.2011.11.013, PMID: 22153082
Sanborn AL, Rao SS, Huang SC, Durand NC, Huntley MH, Jewett AI, Bochkov ID, Chinnappan D, Cutkosky A, Li J, Geeting KP, Gnirke A, Melnikov A, McKenna D, Stamenova EK, Lander ES, Aiden EL. 2015. Chromatin extrusion explains key features of loop and domain formation in wild-type and engineered genomes. PNAS 112:E6456−E6465. doi: 10.1073/pnas.1518552112, PMID: 26499245
Sanders MM. 1978. Fractionation of nucleosomes by salt elution from micrococcal nuclease-digested nuclei. The Journal of Cell Biology 79:97−109. doi: 10.1083/jcb.79.1.97, PMID: 701381
Schmid M, Durussel T, Laemmli UK. 2004. ChIC and ChEC; genomic mapping of chromatin proteins. Molecular Cell 16:147−157. doi: 10.1016/j.molcel.2004.09.007, PMID: 15469830
Shivaraju M, Unruh JR, Slaughter BD, Mattingly M, Berman J, Gerton JL. 2012. Cell-cycle-coupled structural oscillation of centromeric nucleosomes in yeast. Cell 150:304−316. doi: 10.1016/j.cell.2012.05.034, PMID: 22 817893
Skene PJ, Henikoff S. 2015. A simple method for generating high-resolution maps of genome-wide protein binding. eLife 4:e09225. doi: 10.7554/eLife.09225, PMID: 26079792
Solomon MJ, Varshavsky A. 1985. Formaldehyde-mediated DNA-protein crosslinking: a probe for in vivo chromatin structures. PNAS 82:6470−6474. doi: 10.1073/pnas.82.19.6470, PMID: 2995966
Southall TD, Gold KS, Egger B, Davidson CM, Caygill EE, Marshall OJ, Brand AH. 2013. Cell-type-specific profiling of gene expression and chromatin binding without cell isolation: assaying RNA Pol II occupancy in neural stem cells. Developmental Cell 26:101−112. doi: 10.1016/j.devcel.2013.05.020, PMID: 23792147
Tang Z, Luo OJ, Li X, Zheng M, Zhu JJ, Szalaj P, Trzaskoma P, Magalska A, Wlodarczyk J, Ruszczycki B, Michalski P, Piecuch E, Wang P, Wang D, Tian SZ, Penrad-Mobayed M, Sachs LM, Ruan X, Wei CL, Liu ET, et al. 2015. CTCF-Mediated human 3D genome architecture reveals chromatin topology for transcription. Cell 163:1611− 1627. doi: 10.1016/j.cell.2015.11.024, PMID: 26686651
Teves SS, Henikoff S. 2012. Salt fractionation of nucleosomes for genome-wide profiling. Methods in Molecular Biology 833:421−432. doi: 10.1007/978-1-61779-477-3_25, PMID: 22183608
Teytelman L, Thurtle DM, Rine J, van Oudenaarden A. 2013. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. PNAS 110:18602−18607. doi: 10.1073/pnas.1316064110, PMID: 24173036
Thorvaldsdo´ ttir H, Robinson JT, Mesirov JP. 2013. Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics 14:178−192. doi: 10.1093/bib/bbs017, PMID: 22517427
van Steensel B, Delrow J, Henikoff S. 2001. Chromatin profiling using targeted DNA adenine methyltransferase. Nature Genetics 27:304−308. doi: 10.1038/85871, PMID: 11242113
Wisniewski J, Hajj B, Chen J, Mizuguchi G, Xiao H, Wei D, Dahan M, Wu C. 2014. Imaging the fate of histone Cse4 reveals de novo replacement in S phase and subsequent stable residence at centromeres. eLife 3:e02203. doi: 10.7554/eLife.02203, PMID: 24844245
Wollmann P, Cui S, Viswanathan R, Berninghausen O, Wells MN, Moldt M, Witte G, Butryn A, Wendler P, Beckmann R, Auble DT, Hopfner KP. 2011. Structure and mechanism of the Swi2/Snf2 remodeller Mot1 in complex with its substrate TBP. Nature 475:403−407. doi: 10.1038/nature10215, PMID: 21734658
Zentner GE, Henikoff S. 2013. Mot1 redistributes TBP from TATA-containing to TATA-less promoters. Molecular and Cellular Biology 33:4996−5004. doi: 10.1128/MCB.01218-13, PMID: 24144978
Zentner GE, Kasinathan S, Xin B, Rohs R, Henikoff S. 2015. ChEC-seq kinetics discriminates transcription factor binding sites by DNA sequence and shape in vivo. Nature Communications 6:8733. doi: 10.1038/ncomms9733, PMID: 26490019
Zentner GE, Tsukiyama T, Henikoff S. 2013. ISWI and CHD chromatin remodelers bind promoters but act in gene bodies. PLoS Genetics 9:e1003317. doi: 10.1371/journal.pgen.1003317, PMID: 23468649.
酵母核についてのCUT&RUNプロトコール:約0.7のOD600で約5×10のS.cerevisiae細胞から(Orsi et al., 2015)。核を調製するための他の方法は、同等の結果をもたらすと予想される。Bio−Mag Plus Concanavalin A被覆ビーズは、Polysciences,Inc.(Warrington、PA、カタログ番号86057)から購入することができる。消化緩衝剤(150ml) 3ml 1M HEPES pH7.5 20mM 3ml 5M NaCl 100mM 水で150mlに。1mMフッ化フェニルメタニルスルホニル(PMSF、エタノール中の100mMストック)を使用直前に添加し、添加後、氷上に保持する。HNT洗浄緩衝剤(100ml) 100ml消化緩衝剤 100mL Tween 20 0.1% 1mM PMSF 使用直前に(=HNT−Pi)。ビーズを調製するために。HNT++=HNT+1mM CaCl、+1mM MnCl。Ca++およびMn++は、レクチンを活性化するために必要である。製造業者は、1mM MgClも推奨するが、これは、DNA分解を引き起こすことがあり、MgClを含めなくても、透過処理した核のビーズへの結合に影響しなかった。HNT−PPiブロッキング緩衝剤(20ml):20ml HNT洗浄緩衝剤 67mL 30% BSA 0.1% 2 mini−Complete Ultra(Roche)プロテアーゼ阻害剤タブレット 1mM PMSF 使用直前に HNT−プレブロック(1ml当たり) 900mL HNT−PPi 100mL 30%BSA 3% 4mL 0.5M EDTA 2mM 1mM PMSF 使用直前に 2XSTOP(10ml) 400ml 5M NaCl 200mM 400mL 0.5M EDTA 20mM 200mL 0.2M EGTA 4mM+50mL Thermo RNase A(10mg/ml) 50mg/ml+20mLグリコーゲン(20mg/ml) 40_g/ml 水で10mlに。スパイクインについては、約10pg/mlのスパイクインDNA(例えば、ホルムアルデヒド架橋ショウジョウバエS2細胞のMNase消化からのモノヌクレオソームサイズの断片)を添加する。1XSTOP(10ml) 200ml 5M NaCl 100mM 200mL 0.5M EDTA 10mM 100mL 0.2M EGTA 2mM 水で10mlに。
手順:
プレブロッキング:1ml HNT−プレブロックを穏やかなピペット操作で添加する。5分静置させ、次いで、磁気スタンド上に配置し、上清を吸引除去し、次のステップに続ける。抗体結合:1mlのブロッキング緩衝剤(0.1%BSAを伴うHNT−PPi)中で5分間ブロッキングする。磁気スタンド上に配置し、上清を吸引除去し、500mLのブロッキング緩衝剤に懸濁する。穏やかにボルテックスしながら、500mLの抗FLAG(5mLのSigma M2マウス抗FLAG抗体を含有する−最終1:200)を添加する。ローターを用いて2時間、4℃でインキュベートする。回転させ、1mlのHNT−Pi洗浄緩衝剤で1回洗浄する。
二次抗体結合(必要に応じた):マウスモノクローナル抗体を使用した場合、pA−MN結合の高い特異度を得るためにウサギ抗マウス二次抗体(例えば、Abcam ab46540)が必要である。二次抗体の使用は、切断速度を1〜2桁増幅する。1時間インキュベートすることを除いてステップ3と同じ手順に従う。
pA−MNを結合させる:上清を吸引除去し、500mLのブロッキング緩衝剤に懸濁する。ボルテックスしながら、5mLのpA−MN(600mg/ml)を含有する500mLのブロッキング緩衝剤を添加する。ローテーターを用いて1時間、4℃でインキュベートする。回転させ、1mlのHNT−Pi洗浄緩衝剤で2回洗浄する。
消化:デカントし、1mlの消化緩衝剤で1回洗浄し、1.2mlの消化緩衝剤に懸濁し、各々を8×150mLの時点用アリコートに分割し、直接、管の底部に配置する。氷水中の1.7ml管に適したブロック上で0℃で平衡させる。3mLの100mM CaCl(2mMまで)を各々の管の側面に滴下する。タイムコースを得るために、管をボルテックスすることおよび氷水ホルダー内に再配置することにより、消化を開始する。150mLの2XSTOPの添加(必要に応じて、スパイクインDNAを添加して)により停止させる。全DNA抽出について:3mLの10%SDS(0.1%まで)、および2.5mLのプロテイナーゼK(20mg/ml)を試料に添加し、ボルテックスする。70℃で10分間、混合のために時折反転させてインキュベートする。(ホルムアルデヒド架橋細胞についは、4時間、65℃でインキュベートして、架橋を逆行させる)。300mLのフェノール−クロロホルム−イソアミルと混合し、回転させ(5分 13krpm)、新たな管にデカントする。1/2体積(150mL)AMPureビーズを添加し、よく混合する。10分静置させ、磁気スタンド上に配置する。上清を新たな管に移して残存ビーズを除去し、次いで、上清を1mlのエタノールで沈殿させ、冷却し、回転させる。1mlの100%エタノールで洗浄し、ライブラリー調製のために25mLの0.1×TE8に懸濁する。クロマチン関連複合体について:全DNA抽出手順に従う。HMT、消化およびSTOP緩衝剤に0.5mMスペルミジンを含める。塩分画について:消化スラリーの体積を150mLから50mLに低減させ、2XSTOP(この場合、4M NaClで200mM NaClを置換し、RNaseを省く)で反応を停止させる。37℃でのインキュベーション後、水中の200mLのRNase(100mg/ml)を添加し、20分、37℃でインキュベートし、次いで、5分の13,000rpm回転を続けて上清をペレットから分離する。
切り出された断片の単離:インキュベート(37℃ 20分)する。回転させ(5分 13,000rpm 4℃)、磁気スタンド上に配置し、新たな管へ上清を吸引除去する。ビーズペレットを300mLの1XSTOP(RNaseもグリコーゲンもなし)に懸濁する。3mLの10%SDS(0.1%まで)を添加し、ボルテックスし、2.5mLのプロテイナーゼK(20mg/ml)を試料に添加する。70℃で10分間、混合のために時折反転させてインキュベートする。
ライブラリー用の上清DNAを抽出する:300mLのフェノール−クロロホルム−イソアミルアルコールと混合し、フェーズロック管に移し、回転させ、次いで、300mLのクロロホルムで抽出する。新たな管へと除去し、この管には添加の前に2mLの2mg/mlのグリコーゲンが入っている。750mLのエタノールを添加し、冷却し、回転させる。ペレットを1mlの100%エタノールで洗浄し、空気乾燥させ、25mLの0.1×TE8に溶解する。DNAの一部は、約1%ほどの高分子量DNAを示し、このDNAは、可溶化することになるが、ライブラリー調製中に感知できるほど増幅しないであろう。
ゲル分析用のペレット画分を抽出する(必要に応じた):300mLのフェノール−クロロホルム−イソアミルアルコールと混合し、回転させ(5分 13,000rpm)、約5分間、磁気スタンド上に置き、吸引除去する。水性層を新たな管へと除去し、この管には添加の前に2mLの2mg/mlのグリコーゲンが入っている。750mLのエタノールを添加し、冷却し、回転させる。ペレットを1mlの100%エタノールで洗浄し、空気乾燥させ、25mLの0.1×TE8に溶解し、次いで遠心分離(10分 13krpm)して、ビーズから外れた不溶性褐色材料の大部分をペレット化する。プロトコールを使用して、ヒトK562細胞においてCTCF、Myc、MaxおよびH3K27me3をマッピングした。非常に低いバックグラウンドが観察された。このプロトコールは、無傷核から反応体積へと「浸出する」、カットされたクロマチン断片に依存する。無傷核を実験の最後に遠心沈降させ、上清画分からDNAを抽出する。これは、遊離したクロマチン断片を単離し、したがって、さらなるサイズ選択を必要としない。このプロトコールは、各々のステップで核を単離するために遠心分離(600g;3分:スイングバケットローター)またはコンカナバリンA被覆磁気ビーズ(BioMag Plus #86057)のどちらかを使用し得る。
典型的な実験試料:(1反応当たり10×10細胞):i.抗体なし;遊離pA−MNase(すなわち、PA−MNaseが洗浄除去されない);ii.抗体なし+pA−MNase(バックグラウンドMNase活性についての対照);iii.抗体+pA−MNase(実験試料)。本発明者らは、CaCl添加前の少量のQC試料(「インプット」)および反応を停止させた後の少量のQC試料(「エンド」)を利用して、分画の前にMNase反応がどれ程進行したのかをアッセイする。プロテアーゼ阻害剤(Roche 完全EDTA不含)を50×ストックから1×の最終濃度で緩衝剤に添加する。
1. 必要に応じた:ビーズを調製する(10×10当たり50mlのビーズを使用する)。3体積の結合緩衝剤で3回洗浄する。1体積の結合緩衝剤に再懸濁させる。
2. 細胞を収集する;600gで3分、スイングバケットローターで遠心沈降させる(典型的には1試料当たり10,000,000細胞)。
3. 穏やかなピペット操作によって1mlの冷リン酸緩衝食塩水(10,000,000細胞より多い場合はスケールアップする)に再懸濁させることにより、細胞を洗浄する。上記のとおり遠心沈降させる。
4. 穏やかなピペット操作により細胞を1mlのNE1(10,000,000細胞より多い場合はスケールアップする)に再懸濁させる。10分間、氷の上に置く。
磁気ビーズ:上記のとおり遠心沈降させ、NE1に再懸濁させる。穏やかにピペット操作で、ビーズを、再懸濁させた核に直接添加する。室温で混合プラットフォームで5分。磁石と約2分結合させ、上清を廃棄するか、または遠心分離:核を600gで3分、スイングバケットローターでペレット化する。
5. 穏やかなピペット操作により1.7mlのCUT&RUN緩衝剤1に再懸濁させ、1.7mlエッペンドルフ管に移す。氷上に5分間置く。上記のように磁石または遠心分離によって核を収集する。
6. 穏やかなピペット操作により1.5mlのCUT&RUN緩衝剤2に再懸濁させる。上記のように磁石または遠心分離によって核を収集する。
7. 穏やかなピペット操作によりCUT&RUN緩衝剤2に再懸濁させる。0.5mlエッペンドルフ管の中で500ml体積の10,000,000細胞を使用する。必要に応じて二次抗体を含む、抗体を添加する。2時間、4℃の混合プラットフォーム上に置く(0.5ml管は、遠心分離のためより密なペレットを生じさせ、インキュベーション中の液体のスロッシングを低減させて核の完全性を維持する)。
8. 4℃の混合プラットフォーム上で500mlのCUT&RUN緩衝剤2での5分の洗浄3回。上記のように磁石または遠心分離によって核を収集する。
9. 300mlのCUT&RUN緩衝剤2に再懸濁させる。3mgのプロテインA−MNase融合体(600ng/mlで5ml、または360ng/mlで8.3ml)を添加する。1時間、4℃の混合プラットフォーム上に置く(300mlの反応体積は、1.7ml管の中での上清画分の容易な抽出/EtOH pptを可能にする)。
10. 4℃の混合プラットフォーム上で300mlのCUT&RUN緩衝剤2での5分の洗浄3回。遊離MNase試料についてはしない(混合プラットフォーム上に保持する)。上記のように磁石または遠心分離によって核を収集する。
11. 300mlのCUT&RUN緩衝剤2に再懸濁させる。12mlを「インプット」として採取し、288mLのDNA抽出緩衝剤に入れる。
12. 管を湿潤氷に入れる(消化を0℃で行うことが不可欠である−好ましくは、アルミニウムブロックを使用して温度を維持する)。CaClを2mMの最終の濃度(6mlの100mM CaCl)まで添加する。反転させることにより迅速に混合し、湿潤氷上に置く。所望される時間(例えば、15分)インキュベートする。通常は、遊離MNase試料を37℃で5分置く。これによって、消化をアガロースゲル電気泳動により評価することが可能になる。
13. 10mMまでのEDTAと20mMまでのEGTAのマスターミックスを添加することにより停止させる。反転させることにより迅速に混合し、氷上に置く。12mlを「エンド」として採取し、288mLのDNA抽出緩衝剤に入れる。選択肢:スパイクインDNAを添加する。
選択肢A
14. 1時間、4℃の混合プラットフォーム上に置いて、クロマチン画分を浸出させる。600g 3分 SWローターで(たとえ、磁気ビーズアプローチを使用する場合であっても)遠心沈降させる。上清を採取する。
15. 3mlの10%SDS(最終濃度0.1%)、10mg/mlでの5mlのプロテイナーゼK、1mg/mlでの2mlのRNaseA、および5mlの5M NaCl(最終濃度300mM)を添加することにより、上清からDNAを抽出する。ボルテックスし、1時間、55℃で置く。フェノール抽出し、EtOH沈殿させ(1mlグリコーゲンを添加して)、EtOH洗浄する。20mlのH2Oに再懸濁させる。
選択肢B
14. 全てのDNAを抽出し、次いで、非常に簡易なサイズ選択を使用して、ゲノムのカットされていない大きい断片を小さいフットプリントから分離する。これは、核膜孔を通って拡散できない可能性がある、大きい、潜在的に不溶性のタンパク質複合体にとって有利であり得る。
全反応からDNAを抽出する:3mlの10%SDS(最終濃度0.1%)、10mg/mlでの5mlのプロテイナーゼK、1mg/mlでの2mlのRNaseA、および5mlの5M NaCl(最終濃度300mM)。ボルテックスし、1時間、55℃で置く。フェノール抽出し、次いで、EtOH沈殿させ(1mlグリコーゲンを添加して)、EtOH洗浄、150mlのH2Oに再懸濁させる。
15. Beckmann Agencourt AMPure XPビーズ(A63881)を使用するカットされた断片(_約700bp)のサイズ選択
使用前にビーズを放置して室温に温める;
75mlのビーズを添加し、ピペット操作10回により混合する;
室温で5分間インキュベートする;
2分間、磁石の上に置く;
上清画分を採取する(ビーズに結合したいかなる高MW DNAも採取しないことが不可欠であり、上清画分を遠心沈降させてビーズについてチェックすることができる)。
700mlのEtOHおよび1mlのグリコーゲンを添加することにより沈殿させる(必要とされる追加の塩なし);
70%EtOH洗浄する;
20mlのHOに再懸濁させる。
緩衝剤:
水中の50×ストックからの1×に添加したプロテアーゼ阻害剤(Roche 完全EDTA不含)
結合緩衝剤
1×PBS;
1mM CaCl
1mM MgCl
1mM MnCl
NB:本発明者らは、一部の細胞中のヌクレアーゼがDNAのMg++依存性分解を引き起こすことを見出した。結合緩衝剤中のMg++の存在は製造業者の推奨に従うものであるが、レクチンを活性化するためにCa++およびMn++しか必要としない。MgClを含めなくても、透過処理した細胞のビーズへの結合に影響しなかった。
NE1:
20mM Hepes−KOH pH7.9;
10mM KCl;
1mM MgCl
0.1%Triton X−100;および
20%グリセロール。
NB:本発明者らは、0.5mMスペルミジンでの1mM MgClの置換を使用してMg++依存性DNA分解を回避することができることを見出す。
CUT&RUN緩衝剤1:
20mM Hepes pH7.5;
150mM NaCl;
2mM EDTA;
0.5mMスペルミジン;
0.1%BSA。
CUT&RUN緩衝剤2:
20mM Hepes pH7.5;
150mM NaCl;
0.5mMスペルミジン;
0.1%BSA。
他の試薬:
100mM CaCl
10%SDS;
5M NaCl;
500mM EDTA;
プロテイナーゼK;
500mM EGTA;
RNaseA;
抽出緩衝剤。
12mlのQC試料についてのDNA抽出を以下のプロトコールの間に行う:
フェノール抽出する;
エタノール沈殿させる;
エタノール洗浄する;
20mLのHOに再懸濁させる;
RNase処置する;
0.7%アガロースゲルで電気泳動する。
(実施例2)
標的下切断およびヌクレアーゼを使用した放出(CUT&RUN)は、ミクロコッカスヌクレアーゼによる抗体標的化制御切断が、ペアードエンドDNAシーケンシングのための特異的タンパク質−DNA複合体を上清に放出させるエピゲノムプロファイリング戦略である。標的断片のみが溶液中に入り、DNAの圧倒的多数が取り残されるので、CUT&RUNは、並外れて低いバックグラウンドレベルを有する。CUT&RUNは、最も広く使用されているクロマチン免疫沈降(ChIP)プロトコールより、分解能、シグナル対ノイズおよび必要とされるシーケンシング深度の点で優れている。ChIPとは対照的に、CUT&RUNは、溶解度およびDNA接近可能性アーチファクトがなく、不溶性クロマチンをプロファイリングするために、および架橋なしで長距離3D接触を検出するために使用され得る。ここで、本発明者らは、核の単離を必要とせず、ヒストン修飾については100細胞および転写因子については1000細胞のみから出発して高品質データを提供する、改良CUT&RUNプロトコールを提示する。細胞から精製DNAまで、CUT&RUNは、ラボラトリーベンチで1日未満しか必要としない。
序論
プロトコールの開発
多細胞生物の全ての細胞は、同じゲノム配列を有するが、異なる遺伝子発現パターンが組織特定を支えている。遺伝子発現の差異は、転写因子(TF)の結合、およびヌクレオソームを修飾して可動化するクロマチン関連複合体のそれらの動員から生じる。結果として、TF、クロマチン関連複合体、ならびにヒストンバリアントおよび翻訳後修飾(PTM)を含むクロマチン状態のゲノムワイドなマッピングが、研究の大きな焦点となってきた。30年より長きにわたって、クロマチン免疫沈降(ChIP)は、タンパク質−DNA相互作用をマッピングするための主な方法となっている。ChIPでは、細胞をホルムアルデヒドで架橋させ、次いで、全細胞内容物を可溶化してクロマチン線維を断片化し、抗体を添加して目的のクロマチン断片を単離する。ChIPについてのリードアウト戦略は、ゲル電気泳動から大規模並行シーケンシング2、3へと30年かけて進化したが、ChIPの基礎は、依然としてほとんど変わっていない。ChIP−seqは、TFの塩基対レベルでの分解能のマッピングを可能にする4、5が、感度を制限する高いバックグラウンド、多数の細胞の要求、ならびに架橋および可溶化に起因するアーチファクトに関する問題が、いまだにある6〜10。ChIPとは異なる原理に基づく代替方法なしで、真陽性を偽陽性アーチファクトのミスリードと区別することは困難であった。ChIPのこれらの制限の一部に対処することができる代替戦略が、タンパク質−DNA相互作用のゲノムワイドマッピングに使用されてきた。例えば、DNase1フットプリント法(footpinting)11、FAIRE−seq12、Sono−seq13、MNase−seq14、15およびATAC−seq16を含む、いくつかの方法が、シーケンシングリードアウトを使用してゲノムワイドにTF結合をマッピングするために使用されている。しかし、これらのアプローチは、特定のタンパク質に標的化されないので、いずれか1つのTFに特異的なものではない。さらに、それらを使用して、健常状態と病状を臨床的に区別するために使用することができる特定のクロマチン状態、例えば、ヒストンPTMにより画定されるものを、マッピングすることができない17。他の方法は、DamIDの場合は目的のタンパク質と周囲のDNAをメチル化する酵素との融合体を遺伝子操作により作製すること18により、またはクロマチン内因性切断(ChEC)の場合はタンパク質のフットプリントの標的切断19により、標的特異的マッピングを提供する。酵素繋留アプローチは、クロマチンを断片化および可溶化する必要なく、in vivo(DamID)またはin situ(ChEC)で行われる。しかし、それらはトランスジェニックアプローチを必要とするので、この必要により、ENCODEなどの大きい基礎構造コンソーシアムへの拡張性、および臨床の場への移行性が制限される。加えて、これらの方法は、ヒストンPTMをマッピングすることができない。これらの制限は、架橋された細胞からの粗核を先ずTF特異的抗体で処置し、次いで、カルシウムイオンにより活性化され得る、プロテインAとミクロコッカスヌクレアーゼとの融合タンパク質(pA−MN)で処置する、クロマチン免疫切断(ChIC)法によって、ある程度、克服された19。しかし、ChICは、サザンブロットリードアウトを使用して開発されたため、ゲノムワイドなプロファイリングへのその適用性は、10年より長きにわたって不明確なままである。本発明者らは、最近、ChIC戦略を開発し、本発明者らは、これをCUT&RUN(標的下切断およびヌクレアーゼを使用した放出;図24)20と名付けた。開示するプロトコールは、簡易な取扱いを可能にするために、未固定の核を利用し、コンカナバリンA被覆磁気ビーズを使用してそれらを固体支持体に結合させた。抗体およびpA−MNをin situで標的タンパク質と特異的に結合させた後、0℃でカルシウムへの曝露から数秒後、TFの片側で切断が起こった。非架橋核を使用したので、2カットで放出された切断断片は核外へ自由に拡散し、そのため、無傷核の簡易なペレット化により、放出されたクロマチン断片を含有する上清を使用してシーケンシング用のDNAを直接抽出した。0℃でCa2+依存性消化反応を行うことは、切断されたクロマチン複合体の拡散を制限するために必須であり、そうしなければ、接近可能なDNAを切断して放出することになることを、発見した。全体的としては、CUT&RUNは、架橋ChIP−seqよりはるかに高いシグナル対ノイズ比を有することによって、以前には不明であったゲノムの特徴の同定を可能にすることが明らかになった。CUT&RUNは、哺乳動物TFの塩基対分解能をたった10,000,000のシーケンシングされたリードで達成した。
タンパク質−DNA相互作用の定量的マッピングの必要性が、ますます明らかになってきた21。しかし、クロマチンのゲノムワイドな可溶化と免疫沈降とを伴うChIPの複雑さのため、抗体交差反応性を有する異なる種からの固定数の細胞がスパイクインされる込み入った定量戦略が必要とされる22。保存エピトープの要求は、一般的適用性を制限する。対照的に、CUT&RUNの固有の簡易性のため、結合事象を正確に定量するために、異種DNAを用いる単純なスパイクイン戦略で十分であった。まとめると、CUT&RUNには、ChIP−seqに比べていくつかの利点がある:(1)この方法は、非架橋細胞においてin situで行われ、クロマチンの断片化も可溶化も必要としない;(2)本質的に低いバックグラウンドが、ChIPでは読み取れない低いシーケンシング深度(sequence depth)および少ないシグナルゲノム特徴の同定を可能にする;(3)この簡易な手順は、1日以内に完了することができ、ロボットによる自動化に好適である;(4)この方法を既存の方法論と比較して少ない細胞数で使用することができる;(5)簡易なスパイクイン戦略をタンパク質−DNA相互作用の正確な定量に使用することができる。しかるが故に、CUT&RUNは、生物学的研究において最も評判のよい方法の1つであるChIPseqの魅力的な代替となる。
実験計画
クロマチン複合体のin situでの標的切断および放出のためのCUT&RUN法は、単純であり、標準的な実験室装置を使用して1日未満で完了することができる。詳細なプロトコール、およびこのプロトコールを特定の状況に合せるために使用され得る様々な選択肢を本明細書で提供する。CUT&RUNの強みの1つは、抗体およびpA−MNが核内に自由に拡散する反応全体をin situで行うことである。元々のプロトコールは、低張溶解とTriton X−100での細胞の処置との組合せにより調製した核を使用した。これは、いくつかの細胞系で成功したが、本発明者らは、最近、このプロトコールを、ChEC−seq23およびATAC−seq24を含む他のin situ法において使用に成功している非イオン性界面活性剤ジギトニンにより透過処理された細胞を使用するように構成した。ジギトニンは、膜に分配され、コレステロールを抽出する。コレステロールを欠いている膜は、ジギトニンによる影響をほとんど受けない25、26。核膜は、原形質膜と比較してコレステロールを相対的に欠いている。しかるが故に、ジギトニンでの細胞の処置は、核の完全性を損なうことなく細胞を透過処理するロバストな方法に相当する26。ここに記載するプロトコールはジギトニンを使用するが、個々の実験状況が他の手段による無傷核の生成を要求する可能性があり、そのような核を好適な方法により調製し、コンカナバリンA被覆ビーズに結合させ、その後、下記のプロトコールのステップ10に入ることができる20。本質的に低いバックグラウンドを有し、少ない細胞数に適用可能である、プロトコールの制限の1つは、回収されるDNAの量が非常に少なく、したがって、高感度キャピラリー電気泳動またはピコグリーンアッセイ(例えば、Agilent TapestationおよびQubit)による分析であっても、分析に問題があることである。加えて、約50bpのPCRアンプリコンを設計することが一般に可能でないので、最小のフットプリントを切断する高分解能マッピング技法は、公知の結合遺伝子座のPCRに基づく分析には適さない。しかるが故に、存在量の多いエピトープを標的とする陽性対照抗体であって、それ故、DNAを容易に検出することができる陽性対照抗体を使用することを推奨する。H3K27me3に対して産生されたウサギモノクローナル抗体は、使用に成功しており、キャピラリー電気泳動は、切断された断片の量に関して出発細胞の数に比例することを示す。ヌクレオソームラダーは、Tapestationまたは他の高感度電気泳動分析法によって予想され(図25)、モノクローナル抗体の使用は、トラブルシューティングを複雑にし得る潜在的ロット間変動を回避する。CTCFなどの存在量の少ないエピトープについては、切断された断片を検出することが、高感度電気泳動分析法によっても、より困難である(図26)。予想される消化DNAパターンが、H3K37me3などの陽性対照についてキャピラリー電気泳動により観察されれば、この試料をシーケンシングする必要はない。陰性対照としては、配列バイアスのない低効率でクロマチンをランダムに被覆することになる非特異的ウサギIgG抗体の使用を推奨する。繋留の欠如は、pA−MNのわずかなキャリーオーバーが、非常に接近しやすいDNAの優先的断片化を生じさせる結果となる可能性を増大させるので、抗体なし対照は、推奨しない。標的切断は、Ca2+イオンを添加して数秒以内に起こることが明らかになり、立体的に調節された繋留型反応のおかげで、切断パターンは経時的に一定していた。しかし、消化時間が長いほど、シグナル対ノイズ比の明らかな変化を伴わずに多くの材料が放出される(図27)。それ故、エピトープ存在量および抗体濃度に基づいて合せることができる出発点として、30分間消化することを推奨する。方法CUT&RUNの適用には、全てのChIPに基づく適用の代替となる可能性がある。ChIP−seqが現在使用されている典型的な研究プロジェクトについて、CUT&RUNへの移行を効率的に行うことができる。大部分の分子生物学研究室に既に存在する標準的な装置を使用してベンチトップでCUT&RUNを全面的に行うことができるからである。さらに、CUT&RUNは、磁気ビーズ、被覆プレートまたはスライドガラスなどの、固体支持体に容易に結合させることができる透過処理された細胞においてin situで行われるので、この方法は、細胞からシーケンシングライブラリーへのハイスループットを可能にするロボット工学へ容易に移行するであろう。CUT&RUNからロボット工学へは、ChIP−seqについての場合より単純であるはずである。CUT&RUNは、超音波処理装置などの装置も、自動化が困難である不溶性材料を除去するための高速回転ステップも、必要としないからである。標準的な架橋ChIPプロトコールは、蛍光活性化細胞選別もしくは解離後にまたは臨床の場で得られることが多い、少ない細胞数には適さない。この制限を踏まえて、ATAC−seqは、下は5000個に至る細胞を使用している24。しかし、ATAC−seqは、クロマチンの接近可能な領域にあるTFの非特異的同定に限定され、ヒストンPTMにより画定されるクロマチン状態を区別することができない。低効率につながる架橋ChIPにおけるエピトープマスキングの問題は、TFには適用されなかったが存在量の多いヌクレオソームエピトープについて5000ほどの少ない細胞で高品質データを提供することが示されたネイティブChIP戦略27を使用することにより、軽減することができる。ここで、CUT&RUNは、H3K27me3をプロファイリングするために100細胞への適用、またはCTCF配列特異的DNA結合タンパク質のための1000細胞への適用に好適であることを示す。それ故、CUT&RUNは、希少な細胞型についてのタンパク質−DNA相互作用の標的化されたゲノムワイドなマッピングを可能にする。単一細胞ゲノム分析の最近の進歩は、スプリットプールバーコーディングを使用して多数の個々の無傷細胞を一意的に標識し、個々の単離細胞上での反応を行う必要が全くない、単一細胞コンビナトリアルインデキシング(「sci」)である。このアプローチは、単一細胞においてトランスクリプトーム28、クロマチン接近可能性(sci−ATAC−seq29)、および3D相互作用(sci−Hi−C30)をプロファイリングするための使用に成功している。ChIPとは異なり、CUT&RUNは、無傷の透過処理された細胞内で行われ、それ故、単一細胞エピトープ特異的エピゲノムランドスケープをマッピングするためのコンビナトリアルバーコーディングに適用可能である。このプロトコールのさらなる開発は、タンパク質複合体内のサブユニットの占有をマッピングするための逐次的ChIPの代替を含む。逐次的ChIP−seqは、通常は困難であり、第2の免疫沈降ステップ後の非常に低い収量のため、存在量の多いクロマチン複合体にしか適さない。しかし、CUT&RUNを最初に行うことにより、高効率で上清に遊離される切断されたクロマチン複合体を二次抗体で免疫沈降することができた。この応用により、ゲノムワイドなクロマチン複合体の組成分析およびマッピングが可能になる。in situでの切断アプローチであるCUT&RUNおよびクロマチン線維の固有の柔軟性のおかげで、隣接ヌクレオソームおよび3D接触を含む局所的クロマチン構造を探索することが可能であることが明らかになった。3D核構成のゲノムワイドなマッピングのための評判のよい技術であるHi−C、ChIA−PETおよびHi−ChIPは、タンパク質間相互作用を安定させるためにホルムアルデヒド架橋に頼る31〜33。しかるが故に、非常に大きい核構造が架橋され得るので、これらの技法には正のゲノム相互作用をマッピングするための形式的距離拘束がない。対照的に、TSA−seq34およびゲノムの編成状態のマッピング35には距離拘束があり、それ故、反応種の限定拡散または細胞の凍結切片作製のどちらかによって細胞学的距離を測定する。同様に、CUT&RUNでは、プロテインA−MNaseのリーチにより、切断が起こり得るエピトープからの距離に対して、したがって、2つの相互作用DNA遺伝子座をそれらの一方への繋留により切断するために必要なそれらの近接度に対して、固有の制限が課される。CUT&RUNと近接に基づくライゲーション法とを組み合わせることにより、核内構造の因子特異的高分解能マップを生成することが可能である。他の新規応用も構想することができる。抗体が利用できるいずれのエピトープも、CUT&RUNを使用するプロファイリングに供することができる可能性があり、lncRNAのCUT&RUN in situマッピングは、DRIP−seq36の魅力的な代替であるように思われる。加えて、不溶性クロマチンをプロファイリングするCUT&RUNの能力20は、CUT&RUNと塩分画を組み合わせることにより、エピゲノムマップを、古典的な「活性」クロマチンを定義するために伝統的に使用されてきたクロマチン溶解度37〜39に基づくようにすることが可能になることを示す。このようにして、プロファイリングされる各々のDNA結合タンパク質またはクロマチンの特徴を、肝要な物理的特性であるその溶解度についての情報で強化することができる。塩分画をMNaseに基づくChIP−seq39で行うことができるが、高濃度の塩は、複合体を破壊し、抗体結合の前にエピトープの喪失を引き起こすことがあり、これに対してCUT&RUNでは、抗体が結合して断片が切断された後にしか塩分画を行わない。
他の方法との比較
表1は、CUT&RUN、ならびにX−ChIP−seq、ChIP−exoおよびNChIP−seq40という3つのChIP−seq法についてのメトリクスを収載するものである。3つのChIP−seq法と比較して、CUT&RUNは、より少ない細胞およびより少ないリードを必要とし、より高いシグナル対ノイズ比を有し、断片化バイアスを有さず、より速く、定量のためのスパイクインに適している。
ChIPに基づく技術の重要な進歩は、次世代シーケンシングを利用して、タンパク質−DNA相互作用についての塩基対分解能のゲノムワイドなマップを生成したことであった41。超音波処理を使用して最低約200bpの断片にクロマチンを断片化する標準的な架橋ChIPとは対照的に、ChIP−exoでのエキソヌクレアーゼ処置または高分解能X−ChIP−seqもしくはネイティブChIPアプローチでのMNase消化は、制限消化またはほぼ制限消化を可能にする4、5、20、40、42。しかし、架橋戦略における分解能のこの改善は、必要とされるシーケンシング深度(sequence depth)および細胞数の増加というかなりの犠牲を強いられることが多い。例えば、ChIP−exoでは、標的タンパク質だけではなくそれ以上のもの、例えば、隣接するヌクレオソームを含有する、超音波処理されたあらゆる断片が、エキソヌクレアーゼが最小のTFフットプリントを生成する障害となり、しかるが故に、見かけの局所バックグラウンドに寄与し、その結果、高分解ピークペアをコールするための細胞数およびシーケンシング深度の増加が必要になる。ネイティブChIPは、これらの関連する問題を被らないことが多いが、刺激の強い界面活性剤の非存在下で可溶性クロマチン抽出物を生成する必要があるため一般的適用性が限られており、したがって、安定的に結合しているタンパク質に最もよく適しており、個別的に最適化を必要とすることがある。架橋ChIP法に使用されるものなどの超音波処理がランダムでなく、それ故、断片化バイアスを受けることは、以前に示されている5、43。CUT&RUNは、断片化のない無傷の細胞または核を用いて行われるので、CUT&RUNを使用して全てのゲノム区画を探索することができる。ゲノムワイドな消化にMNaseを使用する技術は、酵素のA/Tバイアスを被ることがあり44、オープンクロマチンを優先的に消化することになる。対照的に、CUT&RUNは、立体的に調節された切断反応を伴うものあり、本発明者らは、CUT&RUNが、いかなる検出可能なA/TバイアスもDNA接近可能性バイアスも被らないことを証明した20
ChIPの場合と同様に、CUT&RUNの成功は、大部分、その結合に使用される条件下での抗体のその標的に対する親和性および特異性に依存する。抗体は、CUT&RUNを使用する固体状態でそれらのエピトープと結合するため、免疫蛍光(IF)による特異性の試験に成功した抗体は、一般にIFが固定を伴うことを条件として、CUT&RUNで機能するが、ホルムアルデヒド固定は、CUT&RUNの効率を低下させる可能性が高い。標準CUT&RUNプロトコールでは、本発明者らは、切断されたクロマチン複合体を核から拡散させることによって、無傷核内に保持された未消化ゲノムを有する上清画分からのカットされたDNAの簡易な単離を可能にすることを推奨する。しかし、クロマチン複合体が大きすぎて拡散することができない可能性があり、またはタンパク質間相互作用が切断された複合体を保持する可能性がある。そのような場合には、全DNAを消化後に抽出することができる。約700bp未満の断片が選択されることになる、常磁性カルボキシル化ビーズ(例えば、Agencourt AMPure XPビーズ)の体積を使用する非常に簡易なサイズ選択を行うことによって。この戦略は、約1MDa酵母RSC複合体について成功する20
材料
試薬
細胞懸濁液。ヒトK562細胞、ショウジョウバエS2細胞を使用し、脳および成虫原基(imaginal disk)などのショウジョウバエ組織を切除し、酵母をスフェロプラスト化した。
コンカナバリン被覆磁気ビーズ(Bangs Laboratories、カタログ番号BP531)
目的のエピトープに対する抗体。例えば、CUT&RUNによる1Dおよび3D相互作用のマッピングのためのウサギα−CTCFポリクローナル抗体(Millipore 07−729)
存在量の多いエピトープに対する陽性対照抗体、例えば、α−H3K27me3ウサギモノクローナル抗体(Cell Signaling Technology、カタログ番号9733)
非存在エピトープに対する陰性対照抗体、例えば、モルモットα−ウサギ抗体
5%ジギトニン(EMD Millipore、カタログ番号300410)
プロテインA−ミクロコッカスヌクレアーゼ(pA−MNase)融合タンパク質。−20℃で保管する。
スパイクインDNA(例えば要請に応じて著者らにより提供される、Saccharomyces cerevisiaeミクロコッカスヌクレアーゼ処置クロマチンからのもの)
蒸留、脱イオンまたはRNAse不含H2O(dH2O、例えば、Promega、カタログ番号P1197)
1M塩化マンガン(MnCl2;Sigma−Aldrich、カタログ番号203734)
1M塩化カルシウム(CaCl2;Fisher、カタログ番号BP510)
1M塩化カリウム(KCl;Sigma−Aldrich、カタログ番号P3911)
1Mヒドロキシエチルピペラジンエタンスルホン酸pH7.5(HEPES(Na+);Sigma−Aldrich、カタログ番号H3375)
1Mヒドロキシエチルピペラジンエタンスルホン酸pH7.9(HEPES(K+);Sigma−Aldrich、カタログ番号H3375)
5M塩化ナトリウム(NaCl;Sigma−Aldrich、カタログ番号S5150−1L)
0.5Mエチレンジアミン四酢酸(EDTA;Research Organics、カタログ番号3002E)
0.2Mエチレングリコール−ビス(β−アミノエチルエーテル)−N,N,N’,N’−四酢酸(EGTA;Sigma−Aldrich、カタログ番号E3889)
2Mスペルミジン(Sigma−Aldrich、カタログ番号S2501)
Roche完全プロテアーゼ阻害剤EDTA不含タブレット(Sigma−Aldrich、カタログ番号5056489001)
2mg/mlのグリコーゲン(Sigma−Aldrich、カタログ番号10930193001の1:10希釈物)
RNase A、DNaseおよびプロテアーゼ不含(10mg/ml;Thermo Fisher Scientific、カタログ番号EN0531)
ゲルおよびPCRクリーンアップキット(Macherey−Nagel NucleoSpinR、カタログ番号740609.250)
Agencourt AMPure XP磁気ビーズ(Beckman Coulter、カタログ番号A63880)
10%ドデシル硫酸ナトリウム(SDS;Sigma−Aldrich、カタログ番号L4509)
プロテイナーゼK(Thermo Fisher Scientific、カタログ番号EO0492)
フェノール−クロロホルム−イソアミルアルコール 25:24:1(PCI;Invitrogen、カタログ番号15593049)
クロロホルム(Sigma、カタログ番号366919−1L)
1M Tris−HCl pH8.0
エタノール(Decon Labs、カタログ番号2716)
Qubit dsDNA HSキット(Life Technologies、カタログ番号Q32851)
試薬準備
5%ジギトニン:実験のための十分なジギトニンを復元するために、粉末を2ml微小遠心管に計り入れ、小型ビーカーの中の水を電子レンジで沸騰させ、ピペットに吸上げ、吐き出して1000μLピペットチップを加温した。ジギトニン粉末が入っている管にピペットで熱水を移して5%(w/v)にし、蓋を閉め、ジギトニンが完全に溶解するまでフルで迅速にボルテックスした。冷蔵した場合、このストックを1週間以内に使用することができるが、ジギトニンは徐々に沈殿するので再加熱が必要になる。ジギトニンの有効性はバッチ間で異なるため、細胞型に使用するための濃度を決定するためにトリパンブルーの透過性を試験することを推奨する。K562細胞について0.02〜0.1%ジギトニンで優れた結果を得た。
ジギトニンは毒性であり、特に粉末を計量するときには注意を払うべきである。ジギトニンストックは、ジメチルスルホキシド(DMSO)に溶解することにより調製してもよいが、DMSOが皮膚を通して吸収され得ることに注意されたい。
結合緩衝剤:400μLの1M HEPES−KOH pH7.9と、200μLの1M KClと、20μLの1M CaCl2と、20μLの1M MnCl2とを混合し、dH2Oで20mlの最終体積にする。その緩衝剤を4℃で6カ月間保管する。
コンカナバリンA被覆ビーズ:穏やかに再懸濁させ、各々の最終試料および/または消化時点に10μLがあるために十分なスラリーを抜き取る。2ml管の中の1.5ml結合緩衝剤に移入する。管を磁気スタンド上に配置して清浄化する(30秒〜2分)。液体を抜き取り、磁気スタンドから除去する。1.5mlの結合緩衝剤を添加し、反転または穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。ビーズスラリーの体積(1最終試料当たり10μL)と等しい体積の結合緩衝剤に再懸濁させる。洗浄緩衝剤:1mlの1M HEPES pH7.5と、1.5mlの5M NaClと、12.5μLの2M スペルミジンとを混合し、dH2Oで50mlの最終体積にし、1個のRoche完全プロテアーゼ阻害剤EDTA不含タブレットを添加する。その緩衝剤を4℃で最大1週間の間、保管する。Dig洗浄緩衝剤:160〜800μLの5%ジギトニンを40mlの洗浄緩衝剤と混合する。ジギトニンの有効性はバッチ間で異なるため、使用するための濃度を決定するためにトリパンブルーの透過性を判定することを推奨する。K562細胞について0.02〜0.1%ジギトニンで優れた結果を得た。その緩衝剤を4℃で最大1日の間、保管する。
抗体緩衝剤:8μLの0.5M EDTAを2mlのDig洗浄緩衝剤と混合し、氷上に配置する。各々の抗体用のアリコートに分割し、抗体溶液または血清を1:100の最終濃度までまたは免疫蛍光のための製造業者の推奨濃度まで添加する。2XSTOP:4.2mlのdH2Oに、340μlの5M NaCl、200μLの0.5M EDTA、100μLの0.2M EGTA、20μLの5%ジギトニン、25μLのRNase A、125μLの2mg/mlのグリコーゲン、および2pg/mlの異種スパイクインDNAを添加する。その緩衝剤を4℃で最大1週間の間、保管する。
較正用の異種スパイクインDNAは、下は約200bpに至る平均サイズに断片化するべきであり、例えばモノヌクレオソームサイズの断片のMNase処置試料であるべきである。本発明者らは、マッピングされたリードの総数を正規化因子としてしか使用しないので、必要とするスパイクインDNAは非常に少ない。例えば、1.5pgの添加は、1,000,000〜10,000,000のマッピングされる実験リードに対して(反比例して)1,000〜10,000のマッピングされるスパイクインリードをもたらす。
手順
ビーズへの細胞の結合
タイミング 30分
抗体の添加の前の全てのステップは、細胞に対するストレスを最小にするために室温で行う。プロトコール全体を通してDNA切断を最小にすることは極めて重要であるので、本発明者らは、再懸濁中のキャビテーションおよび激しいボルテックスを避けることを推奨する。
1)室温で新鮮培養物を収集し、細胞をカウントする。同じプロトコールを、1試料および/または消化時点当たり100〜250,000の哺乳動物細胞に使用することができる。
一時停止ポイント:必要に応じて、Mr.Frostyイソプロピルアルコールチャンバを使用して細胞を10%DMSO中で凍結保存することができる。急速凍結は、推奨しない。これは、最終的なデータ品質に影響を及ぼす可能性があるバックグラウンドDNA切断の原因となり得るからである。
2)室温で3分600×g遠心分離し、液体を抜き取る。
3)穏やかなピペット操作により1.5mlの室温洗浄緩衝剤に再懸濁させ、必要に応じて2ml管に移す。
4)室温で3分600×g遠心分離し、液体を抜き取る。
5)ステップ3および4を繰り返す。
6)穏やかなピペット操作により1mlの室温洗浄緩衝剤に再懸濁させる。
7)室温で細胞を穏やかにボルテックスしながら、ビーズスラリーを添加する。
8)5〜10分、室温で回転させる。
9)使用する抗体ごとに1つの1.5ml管内のアリコートに分割する。
ライブラリー調製の必要のなくこの手順の成功を評価するために、並行して陽性対照抗体(例えば、α−H3K27me3)および陰性対照抗体(例えば、α−ウサギ)を含める。抗体なし対照を含めない。繋留の欠如により、いずれかの未結合pA−MNが、「時限爆弾」として作用し、接近可能なDNAを消化することが可能になり、その結果、DNA接近可能部位のバックグラウンドが生じるからである。
(一次)抗体を結合させる
タイミング 15分〜一晩であり、インキュベーションが長いほど高い収量が得られる
10)磁気スタンド上に配置して清浄化し、液体を吸引除去する。
低残留ピペットチップは、溶液を正確に移すのに好ましいが、デカント中のビーズの喪失を回避するために従来の(低接着性でない)微小遠心管のみを使用する。
11)低(約1100rpm)に設定したボルテックスミキサーに各々の管を低角度で配置し、側面に沿って50μLの抗体緩衝剤(1試料および/または消化時点当たり)を吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
ビーズからのCa++キャリーオーバーは、pA−MNの添加後に時期尚早に鎖切断を開始することがあるため、抗体処置中のEDTAの存在が、ConAの活性化に使用される過剰な二価カチオンを除去する。細胞を透過処理する際の二価カチオンのキレート化も、代謝プロセスの迅速な停止および内因性DNAse活性の防止に役立つ。pA−MN添加前のEDTAの洗浄除去は、酵素の不活性化を回避する。洗浄緩衝剤中のスペルミジンは、そうしなければクロマチンの特性に影響を及ぼす可能性があるMg++の除去を補償することを目的としたものである。
12)4℃で約2時間、または室温で5〜10分間、チューブローテーターにかける。
一時停止ポイント 抗体インキュベーションは、一晩、4℃で継続する。
13)微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。
14)磁気スタンド上に配置して清浄化し(約30秒)、液体の全てを吸引除去する。
15)1mlのDig洗浄緩衝剤を添加し、反転により、または塊が残存する場合には1mlチップを使用する穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。二次抗体に結合する(必要に応じて)
タイミング 15分〜1.5時間
プロテインAの一次抗体への結合効率は、宿主種およびIgGアイソタイプに依存する。例えば、プロテインAは、ウサギおよびモルモットIgGとはよく結合するが、マウスおよびヤギIgGとはそれほど結合せず、そのため、後者の抗体については、ウサギα−マウスなどの二次抗体を推奨する。
16)磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
17)低(約1100rpm)に設定したボルテックスミキサーに各々の管を低角度で配置し、側面に沿って50μLのDig洗浄緩衝剤(1試料および/または消化時点当たり)を吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
18)1:100の最終濃度までまたは免疫蛍光のための製造業者の推奨濃度まで二次抗体に混ぜ入れる。
19)4℃で約1時間、または室温で5〜10分間、チューブローテーターにかける。
20)微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。
21)磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
22)1mlのDig洗浄緩衝剤を添加し、反転により、または塊が残存する場合には穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体をおよび除去する。
プロテインA−MNase融合タンパク質を結合させる
タイミング 15分〜1.5時間
23)磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
24)低(約1100rpm)に設定したボルテックスミキサーに各々の管を低角度で配置し、側面に沿って50μLのDig洗浄緩衝剤(1試料および/または消化時点当たり)を吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
25)約700ng/mlの最終濃度までpA−MNaseに混ぜ入れる(例えば、要請に応じて提供される140μg/mlのグリセロールストックの1:10希釈物50μL当たり2.5μL)。
26)4℃で約1時間、または室温で5〜10分間、チューブローテーターにかける。
27)微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。
28)磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
29)1mlのDig洗浄緩衝剤を添加し、反転により、または塊が残存する場合には穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。
30)Dig洗浄ステップ28〜29を繰り返す。
標的消化
タイミング 45分
31)磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
32)低(約1100rpm)に設定したボルテックスミキサーに各々の管を低角度で配置し、側面に沿って100μLのDig洗浄緩衝剤(1試料および/または消化時点当たり)を添加し、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
33)湿潤氷の中に置かれているヒーターブロックの1.5mlウェルに管を挿入にして0℃に冷却する。
34)各々の管をブロックから除去し、穏やかにボルテックスしながら2μLの100mM CaCl2(1Mストックから1:10希釈した)に混ぜ入れ、直ちに管を0℃ブロックに戻す。
35)0℃で所望の消化時間、インキュベートする(デフォルトは30分である)。
MNaseは、DNAに結合するが、Ca++が存在するときにのみ切断し、したがって、消化はゼロ次反応である、この反応は、ゲノムの接近可能な領域を消化することができる放出されたpA−MNase結合粒子のその後の拡散より温度依存性が低いようである。細胞集団の大部分における粒子の切断および放出を0℃で達成することができ、その上、拡散に起因するバックグラウンド切断を最小にすることができる。本発明者らは、周囲温度またはそれより高い温度での消化が許容し難いバックグラウンド切断レベルを生じさせる結果となることを見出した。
36)100μLの2XSTOPを添加し、穏やかにボルテックスすることにより混合する。複数の時点がある場合、100μLの2XSTOPに対して100μLを除去し、穏やかにボルテックスすることにより混合する。
異種スパイクインDNAは、DNA量を較正するために、例えば、処置または消化時点を比較するために、2XSTOP中に存在すべきである。これは、CUT&RUNにとって特に重要である。試料の正規化のためのバックグラウンド切断が少なすぎるからである。
標的クロマチンの放出
タイミング 20分
37)10分37℃インキュベートして、不溶性核クロマチンからCUT&RUN断片を放出させる。
38)5分4℃16,000×g遠心分離し、磁気スタンド上に配置する。
選択肢A:スピンカラムによる高速DNA抽出
タイミング 20分
39)スピンカラムを採取用の管内に配置し、400μLの緩衝剤NT1(NucleoSpinキットまたは等価物から)を添加する。
40)ペレットからの上清を清浄にデカントし、スピンカラムのNT1に移し、ピペットで穏やかに吸上げ、吐き出して混合する。
41)30秒、11,000×gで遠心分離する。フロースルーを廃棄する。
42)700μLの緩衝剤NT3を添加する。30秒、11,000×gで遠心分離する。フロースルーを廃棄する。
43)700μLの緩衝剤NT3を添加する。30秒、11,000×gで遠心分離する。フロースルーを廃棄し、ローターに戻す。
44)1分間、11,000×g、遠心分離する。5分乾燥させる。
45)新たな管に入れ、20〜40μLの緩衝剤NEを膜に添加する。
46)1分後、1分間、11,000×gで遠心分離する。
選択肢B:代替DNA抽出(≦80bp断片の定量的回収に好ましい)
タイミング 1.5時間
47)ペレットから上清を清浄にデカントし、新たな1.5ml微小遠心管に移す。
48)各々の試料に2μLの10%SDS(0.1%まで)および2.5μLのプロテイナーゼK(20mg/ml)を添加する。反転により混合し、インキュベート(10分、70℃)する。
49)300μLのPCIを添加し、約2秒、最高速度でボルテックスすることにより混合する。
50)フェーズロック管に移し、5分、室温、16,000×gで遠心分離する。
51)300μLのクロロホルムを添加し、約10回反転させて混合する。
52)液体を、ピペット操作により、2μLの2mg/mlのグリコーゲンが入っている新たな管へと除去する。
53)750μLの100%エタノールを添加し、ボルテックスすることまたは管を反転させることにより混合する
54)氷で冷却し、10分、4℃、16,000×gで遠心分離する。
55)液体を捨て、ペーパータオルで液分を切る。
56)1mlの100%エタノールでペレットをすすぎ、1分、4℃、16,000×gで遠心分離する。
57)液体を注意深く捨て、ペーパータオルで液分を切る。空気乾燥。
58)ペレットが乾いたら、25〜50μLの1mM Tris−HCl pH8 0.1mM EDTAに溶解する。
ライブラリー調製およびシーケンシング
タイミング 2〜4日
59)必要に応じた:1〜2μLを、例えばQubit計器での蛍光検出を使用して、定量する。
60)必要に応じた:切断された断片の存在およびサイズ分布を、例えばTapestation計器を使用して、キャピラリー電気泳動と蛍光検出により評価する。
一部の長い未消化DNAは漏出することになり、これは、典型的な転写因子のCUT&RUNのQubit蛍光に影響を及ぼすことになるものである。これらについては、回収される標的DNAは、量が少なすぎておよびサイズが小さすぎて、ゲル分析によっても、さらにはTapestationによっても、検出することができない。そのような場合、TapestationまたはBioanalyzer分析により定量するためにPCR増幅ライブラリーを作製する必要があり得る。
61)シングルチューブプロトコールを使用するTru−SeqアダプターでのIlluminaシーケンシング用のバーコード化ライブラリーを製造業者の使用説明書に従って調製する。高速PCRサイクルは、ポリメラーゼが長すぎて完了することができない大きいDNA断片の線形増幅より、所望のCUT&RUN断片の指数関数的増幅に有利に働く。
大きいDNA断片の寄与を最小にするために、PCRサイクルは、好ましくは、10秒、60℃のアニール/伸長複合ステップを伴う、少なくとも12〜14サイクルであるべきである。良好な結果は、Hyper−prepキット(KAPA Biosystems)で得られた。
62)QubitなどのdsDNA特異的アッセイを使用してライブラリー収量を定量する。
63)Agilent 4200 TapeStation分析によりライブラリーのサイズ分布を判定する。
64)バーコードライブラリーを用いるペアードエンドIlluminaシーケンシングを製造業者の使用説明書に従って行う。
CUT&RUNでの非常に低いバックグラウンドのため、転写因子またはヌクレオソーム修飾について、さらにはヒトゲノムについて、通常は5,000,000のペアードエンドリードで十分である。最大の経済性のために、本発明者らは、2レーンフローセルを用いて1レーン当たり最大24のバーコード化試料を混合し、ペアードエンド25×25bpシーケンシングを行った。シングルエンドシーケンシングは、転写因子と隣接ヌクレオソームの間の分解能および識別を犠牲にするので、CUT&RUNには推奨しない。
データ処理および分析
タイミング 1日(可変)
65)本発明者らは、Bowtie2バージョン2.2.5を、オプション:−−local−very sensitive−local−−no−unal−−no−mixed−−no−discordant−−phred33−I 10−X 700で使用して、ペアードエンドリードのアラインメントを行う。スパイクイン断片のマッピングには、本発明者らは、実験ゲノムとスパイクインDNAのものとの交差マッピングを回避するために、−−no−overlap−−no−dovetailオプションも使用する。
シーケンシングされた断片の≦120bpサイズクラスと≧150bpサイズクラスへの分離によって、DNA結合タンパク質の局所近傍のマッピングが達成されるが、これは、繋留MNaseによるDNAへの立体的接近によって変わり得る。シングルエンドシーケンシングは、転写因子と隣接ヌクレオソームの間の分解能および識別を犠牲にするので、CUT&RUNには推奨しない。
66)ワールドワイドウェブにおいてドメイン名github.com/peteskeneで入手できるスクリプトを、CUT&RUNデータの処理、スパイクイン較正および分析用にカスタマイズする。
結果
ヒトK562細胞を37℃で培養し、カウントし、低速遠心分離により1×10細胞/mlで収集し、再懸濁させ、洗浄緩衝剤で2回ペレット化し、次いで、希釈し、300μL体積で洗浄緩衝剤と混合して、50〜6,000個の間の細胞の2倍系列を得た。結合緩衝剤中の10μLのCa2+洗浄およびMn2+洗浄ConA被覆磁気ビーズスラリーを、穏やかにボルテックスしながら各々の細胞懸濁液に添加した。10分後、細胞を磁気スタンドで回収し、デカントし、抗H3K27me3(1:100、CST #9733)と2mM EDTAと0.05%ジギトニンとを含有する50μLの抗体緩衝剤に再懸濁させ、4℃で15時間インキュベートした。磁気スタンドでビーズを回収し、1mlの冷Dig洗浄液で1回洗浄した後、細胞をDig洗浄液中の100μLのpA−MN(1:500、360μg/ml)に再懸濁させ、4℃で1時間インキュベートした。ビーズを磁気スタンドで回収し、1mlのDig洗浄液で2回洗浄し、150μLのDig洗浄液に再懸濁させ、0℃に冷却した。3μLの100mM CaClを添加し、0℃インキュベーションを30分間継続した。反応を1体積の2XSTOPで終了させ、37℃で20分間インキュベートし、4℃で5分、16,000×gで遠心分離した。上清とペレットの両方を、ステップ47〜58に従って抽出した。ペレットからのDNAをQubit蛍光により定量した。選択した上清画分からのDNAをTapestation分析(図26)により分解し、Illumina PE25×25シーケンシングに供した。典型的なChIP−seq実験は、多い出発細胞数を使用し、その結果、免疫沈降される特有の超音波処理された断片が多数生じることになる。対照的に、CUT&RUNは、少ない細胞数を可能にし、比較的低いバックグラウンドを有するので、特有の断片の数は、典型的な配列深度未満である。したがって、少ない細胞数の実験からの高いシーケンシング深度は、PCRデュプリケートの冗長なシーケンシングをもたらす。推定PCRデュプリケートを除去し、マッピングされた断片を置換せずにランダムにサンプリングし、その結果、1試料当たり7,500,000の特有のリードを得、積層リードから正規化されたカウントとして表示した(図28)。比較のために、7,500,000の特有のリードの試料をK562細胞におけるH3K27me3についてのENCODEデータセットからサンプリングした。下は100細胞に至る細胞数の低減に伴って起こったデータ品質の低下が極めて少ないことは明らかである。対照的に、同じ深度でサンプリングしたENCODEプロファイルは、ChIPに固有の高いバックグラウンドのせいで不鮮明なプロファイルを示す。抗CTCF抗体(1:100、Millipore 07−729)を使用してCUT&RUNを同様に行って、下は1000細胞に至るまでデータ品質をほとんど損なうことなくプロファイルを得た(図29)。スピンカラム抽出(ステップ39〜46)は、簡易であり、ヌクレオソームの範囲内での断片の良好な回収率を迅速にもたらし、その上、ライブラリー調製に干渉し得る非常に大きい断片の濃度を低下させる(図30)。したがって、このDNA抽出選択肢は、CUT&RUNのほとんどの応用に好ましい。しかし、少ない細胞数でのTFのCUT&RUNについては、有機抽出(ステップ47〜58)のほうが、小さい断片のより良好な回収率のために好ましい。
実施例2のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)
1. Solomon, M.J. & Varshavsky, A. Formaldehyde-mediated DNA-protein crosslinking: a probe for in vivo chromatin structures. Proc Natl Acad Sci U S A 82, 6470-4 (1985).
2. Johnson, D.S., Mortazavi, A., Myers, R.M. & Wold, B. Genome-wide mapping of in vivo protein-DNA interactions. Science 316, 1497-502 (2007).
3. Barski, A. et al. High-resolution profiling of histone methylations in the human genome. Cell 129, 823-37 (2007).
4. Rhee, H.S. & Pugh, B.F. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147, 1408-19 (2011).
5. Skene, P.J. & Henikoff, S. A simple method for generating high-resolution maps of genome-wide protein binding. eLife 4, e09225 (2015).
6. Teytelman, L., Thurtle, D.M., Rine, J. & van Oudenaarden, A. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. Proceedings of the National Academy of Sciences of the United States of America 110, 18602-7 (2013).
7. Park, D., Lee, Y., Bhupindersingh, G. & Iyer, V.R. Widespread misinterpretable ChIP-seq bias in yeast. PloS one 8, e83506 (2013).
8. Jain, D., Baldi, S., Zabel, A., Straub, T. & Becker, P.B. Active promoters give rise to false positive 'Phantom Peaks' in ChIP-seq experiments. Nucleic Acids Res 43, 6959-68 (2015).
9. Baranello, L., Kouzine, F., Sanford, S. & Levens, D. ChIP bias as a function of cross-linking time. Chromosome Res 24, 175-81 (2016).
10. Meyer, C.A. & Liu, X.S. Identifying and mitigating bias in next-generation sequencing methods for chromatin biology. Nat Rev Genet 15, 709-21 (2014).
11. Crawford, G.E. et al. Genome-wide mapping of DNase hypersensitive sites using massively parallel signature sequencing (MPSS). Genome Res 16, 123-31 (2006).
12. Giresi, P.G., Kim, J., McDaniell, R.M., Iyer, V.R. & Lieb, J.D. FAIRE (Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin. Genome Res 17, 877-85 (2007).
13. Auerbach, R.K. et al. Mapping accessible chromatin regions using Sono-Seq. Proc Natl Acad Sci U S A 106, 14926-31 (2009).
14. Kent, N.A., Adams, S., Moorhouse, A. & Paszkiewicz, K. Chromatin particle spectrum analysis: a method for comparative chromatin structure analysis using paired-end mode next-generation DNA sequencing. Nucleic Acids Res 39, e26 (2011).
15. Henikoff, J.G., Belsky, J.A., Krassovsky, K., Macalpine, D.M. & Henikoff, S. Epigenome characterization at single base-pair resolution. Proc Natl Acad Sci U S A 108, 18318-23 (2011).
16. Buenrostro, J.D., Giresi, P.G., Zaba, L.C., Chang, H.Y. & Greenleaf, W.J. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNAbinding proteins and nucleosome position. Nat Methods 10, 1213-8 (2013).
17. Bernt, K.M. et al. MLL-rearranged leukemia is dependent on aberrant H3K79 methylation by DOT1L. Cancer Cell 20, 66-78 (2011).
18. van Steensel, B., Delrow, J. & Henikoff, S. Chromatin profiling using targeted DNA adenine methyltransferase. Nat Genet 27, 304-8 (2001).
19. Schmid, M., Durussel, T. & Laemmli, U.K. ChIC and ChEC; genomic mapping of chromatin proteins. Mol Cell 16, 147-57 (2004).
20. Skene, P.J. & Henikoff, S. An efficient targeted nuclease strategy for high-resolution mapping of DNA binding sites. Elife 6(2017).
21. Hu, Z. et al. Nucleosome loss leads to global transcriptional up-regulation and genomic instability during yeast aging. Genes & development 28, 396-408 (2014).
22. Orlando, D.A. et al. Quantitative ChIP-Seq normalization reveals global modulation of the epigenome. Cell Rep 9, 1163-70 (2014).
23. Zentner, G.E., Kasinathan, S., Xin, B., Rohs, R. & Henikoff, S. ChEC-seq kinetics discriminate transcription factor binding sites by DNA sequence and shape in vivo. Nature Communications 6, 8733 (2015).
24. Corces, M.R. et al. Lineage-specific and single-cell chromatin accessibility charts human hematopoiesis and leukemia evolution. Nat Genet 48, 1193-203 (2016).
25. Liu, X. & Fagotto, F. A method to separate nuclear, cytosolic, and membrane-associated signaling molecules in cultured cells. Sci Signal 4, pl2 (2011).
26. Adam, S.A., Marr, R.S. & Gerace, L. Nuclear protein import in permeabilized mammalian cells requires soluble cytoplasmic factors. J Cell Biol 111, 807-16 (1990).
27. Brind'Amour, J. et al. An ultra-low-input native ChIP-seq protocol for genome-wide profiling of rare cell populations. Nat Commun 6, 6033 (2015).
28. Porreca, G.J. et al. Multiplex amplification of large sets of human exons. Nat Methods 4, 931-6 (2007).
29. Cusanovich, D.A. et al. Multiplex single cell profiling of chromatin accessibility by combinatorial cellular indexing. Science 348, 910-4 (2015).
30. Ramani, V. et al. Massively multiplex single-cell Hi-C. Nat Methods 14, 263-266 (2017).
31. Lieberman-Aiden, E. et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 326, 289-93 (2009).
32. Tang, Z. et al. CTCF-Mediated Human 3D Genome Architecture Reveals Chromatin Topology for Transcription. Cell 163, 1611-27 (2015).
33. Mumbach, M.R. et al. HiChIP: efficient and sensitive analysis of protein-directed genome architecture. Nat Methods 13, 919-922 (2016).
34. Chen, Y.B., A. "TSA-Seq": a novel proximity mapping approach for studying three dimensional genome organization and function. (2016).
35. Beagrie, R.A. et al. Complex multi-enhancer contacts captured by genome architecture mapping. Nature 543, 519-524 (2017).
36. Wahba, L., Costantino, L., Tan, F.J., Zimmer, A. & Koshland, D. S1-DRIP-seq identifies high expression and polyA tracts as major contributors to R-loop formation. Genes Dev 30, 1327-38 (2016).
37. Sanders, M.M. Fractionation of nucleosomes by salt elution from micrococcal nucleasedigested nuclei. J Cell Biol 79, 97-109 (1978).
38. Davie, J.R. & Saunders, C.A. Chemical composition of nucleosomes among domains of calf thymus chromatin differing in micrococcal nuclease accessibility and solubility properties. J Biol Chem 256, 12574-80 (1981).
39. Henikoff, S., Henikoff, J.G., Sakai, A., Loeb, G.B. & Ahmad, K. Genome-wide profiling of salt fractions maps physical properties of chromatin. Genome Res 19, 460-9 (2009).
40. Kasinathan, S., Orsi, G.A., Zentner, G.E., Ahmad, K. & Henikoff, S. High-resolution mapping of transcription factor binding sites on native chromatin. Nature methods 11, 203-9 (2014).
41. Zentner, G.E. & Henikoff, S. High-resolution digital profiling of the epigenome. Nat Rev Genet 15, 814-27 (2014).
42. Fan, X., Lamarre-Vincent, N., Wang, Q. & Struhl, K. Extensive chromatin fragmentation improves enrichment of protein binding sites in chromatin immunoprecipitation experiments. Nucleic acids research 36, e125 (2008).
43. Teytelman, L. et al. Impact of chromatin structures on DNA processing for genomic analyses. PloS one 4, e6700 (2009).
44. Chung, H.R. et al. TFfhe effect of micrococcal nuclease digestion on nucleosome positioning data. PLoS One 5, e15754 (2010).
(実施例3)
シーケンシャルChIPの高効率代替としてのCUT&RUN.ChIP。
クロマチン因子は、複合体を形成してDNAに結合するが、共占有を同定するための現行の方法は、シーケンシャルChIPの効率の悪さにより大幅に制限される。シーケンシャルChIPは、第1の架橋ChIP反応後に第2のChIPプルダウンのインプットとして回収されるクロマチン免疫沈降物を使用して行われる。しかし、架橋ChIPの効率の悪さのため、第2のChIP後に回収される材料の量は、ほとんどゼロに等しいことがあり、その結果、シーケンシャルChIPは通常はPCRに限定されることになり、そもそもシーケンシャルChIP−seqにゲノムワイドな応用が可能であったとしても極めて稀である。例えば、[6]において、本発明者らは、ヒト動原体複合体でのシーケンシャルChIP−seqの実施に成功したが、何故かと言えば、この複合体が、セントロメアに何千ものコピーで存在するタンデム反復α−サテライト配列上にあるからに過ぎない。しかし、CUT&RUNは、ChIPよりはるかに効率的であるので、本発明者らは、CUT&RUN上清をChIPのインプットとして使用することができると推論した。本発明者らは、CUT&RUNの高効率を使用してクロマチン粒子を放出したところ、この材料を第2のクロマチン成分のために有するChIPのほうが、無視できるほどのバックグラウンドではるかに高効率であることを見出した。
CUT&RUN.ChIPを試験するために、本発明者らは、CUT&RUNをFLAGタグ付きヒストンに適用して、FLAGペプチドを使用して上清に存在する粒子からpA−MN結合抗体を競合より分離し、CUT&RUN上清のネイティブChIPについての他のヒストンマークに二次抗体を添加した(図31A)。代表的なヌクレオソームランドスケープは、プロモーター近接ヌクレオソームに関して、全てのヌクレオソームのマーカーであるH2Bと比較して、ヒストンバリアントH2Aが、H4アセチル化およびH3K4トリメチル化については濃縮されおり、H3K36トリメチル化については枯渇している(図31B)ことを示し、これは、ChIPを使用してこれらの修飾をマッピングする以前の研究[7、8]と一致している。単一ChIP研究により、プロモーター近接ヌクレオソームがこれらの修飾について濃縮または枯渇していることは既に確立されていたが、それらが同じヌクレオソーム上に存在する程度は確立されていなかった。このCUT&RUN.ChIP手順を、例えば、プロモーターにおける二価クロマチン状態のステータスを定義するために使用して、哺乳動物細胞において発生学的に調節されている遺伝子における転写準備(transcriptional poising)の機序に取り組むことができる[9]。
(実施例4)
CUT&RUNタンパク質同定
CUT&RUN.ChIPは、DNA−タンパク質複合体のタンパク質成分を、それらが前もって分かっており、抗体が利用できる場合にのみ同定することができるが、複合体中の未知の成分を同定するためには異なる戦略が必要である。ChIPの低い効率のため、タンパク質同定を行うのに十分な免疫沈降物を得ることは困難であるが、CUT&RUN上清への粒子放出の高い効率によって下流のプロテオミクス分析に十分な材料が得られる。しかし、本発明者らは、放出された粒子が、CUT&RUN上清に放出された全材料の一部しか含まないことを見出し、そのため、本発明者らは、下流のプロテオミクス分析のためのpA−MN/抗体結合複合体の精製に使用することができる、6−Hisタグを有するバージョンのプロテインA−MNase(図32A)を設計し、産生した。手順は、CUT&RUN上清に放出された粒子を、ニッケル−アガロース(例えば、Qiagenおよび他の供給業者から入手可能なNi−NTAアガロース)などの親和性マトリックスと結合させることである。製造業者の推奨に従って洗浄し、溶出した後、複合体のタンパク質成分の銀染色SDS−PAGE分析および液体クロマトグラフィー−質量分析による判定のために十分な量の純粋な複合体が、得られるはずである(図32B)。
実施例4のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)
1.Schmid, M., Durussel, T., and Laemmli, U.K. (2004). ChIC and ChEC; genomic mapping of chromatin proteins. Mol. Cell 16, 147−157.
2.Zentner, G.E., Kasinathan, S., Xin, B., Rohs, R., and Henikoff, S. (2015). ChEC−seq kinetics discriminate transcription factor binding sites by DNA sequence and shape in vivo. Nat Commun 6, 8733.
3.Skene, P.J., and Henikoff, S. (2017). An efficient targeted nuclease strategy for high−resolution mapping of DNA binding sites. eLife 6.
4.Skene, P.J., and Henikoff, S. (2017). CUT&RUN: Targeted in situ genome−wide profiling with high efficiency for low cell numbers. Submitted for publication.
5.Henikoff, S., Henikoff, J.G., Sakai, A., Loeb, G.B., and Ahmad, K. (2009). Genome−wide profiling of salt fractions maps physical properties of chromatin. Genome Res. 19, 460−469.
6.Thakur, J., and Henikoff, S. (2016). CENPT bridges adjacent CENPA nucleosomes on young human alpha−satellite dimers. Genome Res. 26, 1178−1187.
7.Weiner, A., Hughes, A., Yassour, M., Rando, O.J., and Friedman, N. (2010). High−resolution nucleosome mapping reveals transcription−dependent promoter packaging. Genome Res. 20, 90−100.
8.Luk, E., Ranjan, A., Fitzgerald, P.C., Mizuguchi, G., Huang, Y., Wei, D., and Wu, C. (2010). Stepwise histone replacement by SWR1 requires dual activation with histone H2A.Z and canonical nucleosome. Cell 143, 725−736.
9.Shema, E., Jones, D., Shoresh, N., Donohue, L., Ram, O., and Bernstein, B.E. (2016). Single−molecule decoding of combinatorially modified nucleosomes. Science 352, 717−721.
(実施例5)
幹細胞様PRC2活性と活性化発生プログラムとの共存は、びまん性正中神経膠腫クロマチンランドスケープを規定する
序論
びまん性正中神経膠腫は、5歳全生存率が<5%である致死性小児CNS腫瘍である(Mackay et al. 2017)。これらの腫瘍のおおよそ80%は、ヒストン3.1またはH3.3のどちらかをコードする遺伝子の突然変異を有し、そのうち最も顕著なのは、リシン27のメチオニンへの「オンコヒストン」突然変異(H3K27M)である(Schwartzentruber et al. 2012;Wu et al. 2012)。突然変異型ヒストンH3は細胞内の全H3の約5〜15%を構成するにもかかわらず、これらの腫瘍は、Polycomb抑制性複合体2(PRC2)メチルトランスフェラーゼEZH2により触媒され、転写が抑制されているクロマチンに関連するH3テール修飾であるリシン27トリメチル化(H3K27me3)レベルが低い(Chan et al. 2013;Lewis et al. 2013)。H3K27Mテールが、EZH2活性部位に結合し、その触媒活性を阻害することを実証するin vitro研究(Bender et al. 2013;Lewis et al. 2013;Justin et al. 2016)、それがPRC2ランドスケープが包括的に再プログラムし得ることを示すH3K27Mの異所性発現研究(Bender et al. 2013;Chan et al. 2013)、およびDMG患者試料における低い全H3K27me3の発見(Chan et al. 2013;Lewis et al. 2013)は、H3K27MによるEZH2活性の包括的阻害が神経膠腫形成をもたらすことを仮定するモデルにつながった(Morgan and Shilatifard 2013;Weinberg et al. 2017)。
つい最近の結果は、このモデルに疑問を投げかけている。第1に、再構築されたヌクレオソームモデルでは、PRC2は、野生型ヌクレオソームと同様の親和性でH3K27M含有ヌクレオソームに結合した。これは、H3K27Mに対して高い親和性を有するEZH2と矛盾する(Wang et al. 2017)。第2に、1,000の患者試料の大規模ゲノム分析によって、包括的PRC阻害剤を表現型コピーするEZH2突然変異は同定されなかった(Mackay et al. 2017)。最後に、DMGに関する最近のChIP−Seqアッセイは、驚くべき残留H3K27me3ドメインを明示し、それらの一部は、ヒストン野生型のDMGより多くのH3K27me3を含有した(Mohammad et al. 2017;Piunti et al. 2017)。PRC2阻害剤の存在にもかかわらず特定のPRC2ドメインを保持することの基礎となる調節の論理は、いまだ不明である(Weinberg et al. 2017;Funato and Tabar 2018)。H3K27Mが、腫瘍形成を促進するために特定の発生の手がかりまたは二次突然変異を必要とし得ることも、明らかになった。例えば、単独でのH3K27Mは、非常に狭い発生ウインドウ内でのものを除いて、マウスモデルにおいて神経膠腫を誘導するには不十分である(Pathania et al. 2017)。加えて、DMG細胞集団からの単細胞RNA−seq分析は、特定の未分化前駆起始細胞が腫瘍を生じさせることを示唆する(Filbin et al. 2018)。さらに、H3.1K27MでのACVR1突然変異とH3.3K27MでのPDGFRA増幅の観察される同時存在は、H3突然変異が発がんに寄与するために遺伝的修飾因子を必要とすることを示す。DMGにおけるクロマチンランドスケープに対する発生の手がかりおよび二次変異の影響は、まだ十分に解明されていない。
H3K27M含有DMGにおいて観察される罹患クロマチンランドスケープをよりよく理解するために、本発明者らは、タンパク質:DNA相互作用をゲノムワイドにマッピングするための最近記載された方法(Skene and Henikoff 2017; Skene et al. 2018)である、標的下切断およびヌクレアーゼを使用した放出(CUT&RUN)を、ヒストン突然変異を欠いているかまたはH3.1もしくはH3.3のH3テールの27位におけるリシンのメチオニンへの置換を含有する、患者由来DMG細胞系のパネルに適用した(図33A)。この方法は、高分解能での突然変異型H3K27Mヒストンのゲノムワイドな局在のプロファイリングを可能にし、正規化対照としての外来性細胞スパイクインの使用によってゲノムワイドなH3K27me3占有率の高度に定量的な比較を提供する。DMG細胞系および非形質転換幹細胞の代表パネルへの定量的CUT&RUNの適用は、DMGが幹様細胞マーカーと分化細胞マーカーの混合を同時に発現するにもかかわらず、ヒストン突然変異型DMGにおける残留PRC2活性が、胚性幹細胞におけるPRC2活性と高度に一致することを明示する。これらの結果は、分化の手がかりおよび低減されたPRC2活性にもかかわらず原始幹細胞様PRC2ランドスケープの保持が、H3K27M−DMGの特徴およびこれらの致死性小児腫瘍に対する潜在的脆弱性を規定していることを示す。
結果
DMGにおけるH3K27M堆積は、H3バリアント依存性である
本発明者らは、先ず、H3.1またはH3.3のどちらかにK27M突然変異を有する患者DMG細胞系におけるH3K27Mオンコヒストンのゲノムワイドな局在の分析を模索した。H3.1は、複製依存的方法でクロマチンに堆積し、その結果、ゲノム全体にわたって均一に分布している、ヒストンバリアントである(Maze et al. 2014)。対照的に、H3.3バリアントは、複製非依存的方法で堆積し、高ヒストン代謝回転部位に蓄積する(Maze et al. 2014)。H3.1K27M−DMGおよびH3.3K27M−DMGにおけるH3K27Mのゲノムワイドな局在を評定するために、H3K27Mに対する抗体を、SU−DIPG−IV(H3.1K27M)、SU−DIPG−XIII(H3.3K27M)およびVUMC−10(MYCN増幅された、H3野生型)という3種のDMG細胞系においてCUT&RUN反応に使用した。抗H3K27M抗体は、H3K27Mに高特異的であるが、H3.1K27MとH3.3K27Mとを区別することができない(Piunti et al. 2017;Fang et al. 2018)。H3.3K27M DMG細胞のH3K27M CUT&RUNプロファイルは、H3.3K27Mが、定義されたドメインに蓄積することを示す(図33B)。さらに、本発明者らが、同じ細胞系においてH3K27me3およびH3K27ac CUT&RUNでH3K27Mを比較したとき、活性ヒストン代謝回転部位へのH3.3の組込みと一致して、H3.3K27Mピークは、H3K27acピークと密接に相関し、H3K27me3ドメインとほとんどオーバーラップを有さなかった(図33C)。H3.3K27M細胞におけるH3K27Mのゲノムワイドな局在の分析は、PTN(図33B)、H3F3AおよびMYCを含む、DMG発がんに重要な役割を有するいくつかの遺伝子における蓄積を示す(Mackay et al. 2017; Qin et al. 2017)。加えて、H3.3K27Mは、原子起始細胞を示唆する、ESC再プログラム化因子Sox2およびMYCを含む胚性幹細胞(ESC)において、転写的に活性である遺伝子座に存在する(Takahashi and Yamanaka 2006)。DHH、SUFU、PTCH1、GLI1およびGLI2を含む、SHHシグナル伝達経路の成分もまた、H3K27M蓄積部位であり、これは、ヘッジホッグ経路の活性化を示す(Monje et al. 2011)。
H3.3K27Mとは対照的に、H3.1K27M細胞系においてH3K27M抗体を用いるCUT&RUNプロファイリングは、複製依存性組込みと一致して、定義された濃縮ドメインを伴わないゲノム全体にわたる均一な分布を示す(図33B、33C)。H3.1K27MおよびH3.3K27Mは同様のレベルで発現されるので、H3.1K27M細胞系における同定可能なピークの欠如は、発現に起因するものではない(図33D)。H3.3K27MおよびH3.1K27Mのヒートマップは、H3.3K27M−DMG細胞系では定義されたピークを明らかに実証する(図33C)が、H3.1K27M系では実証しない。これらのデータは、H3.1K27Mが、H3.3K27Mバックグラウンドで観察されるバックグラウンドより上のレベルで存在することも実証し、これは、ゲノムワイドに検出可能な組込みを示す(図33C)。対照として、H3K27M抗体をVUMC−10におけるCUT&RUN反応に使用した。有意なシグナルは観察されず、H3K27M抗体の特異性を検証するウエスタンブロットにおいてもシグナルは観察されなかった(図33C、33D)。
H3K27M−DMGは、野生型神経膠腫には非存在である特有のH3K27me3ドメインを含有する
H3.1K27MおよびH3.3K27M DMG細胞系における異なるH3K27M局在パターンの発見は、H3K27MとH3K27me3局在の間の関係を調査する機会を与えた。H3K27Mは、直接EZH2に結合してEZH2活性を阻害する(Weinberg et al. 2017;Funato and Tabar 2018)という説が出されており、これは、H3K27me3およびH3K27Mが大きいドメインを共占有しないはずであることを含意する。H3K27me3およびH3K27Mが、大きいドメイン内で相互排他的であるかどうかを判定するために、本発明者らは、DMG細胞系においてH3K27me3特異的抗体を用いてCUT&RUNを行った。本発明者らはまた、外来性スパイクインによって大いに異なるH3K27me3含量を有するDMG細胞系にわたってPRC2ドメインサイズおよびロバストネスを定量的に測定するためにCUT&RUNの能力をフルに活用した。本発明者らは、ショウジョウバエS2細胞をCUT&RUN反応にヒト細胞1×10対ショウジョウバエ細胞5×10の固定比で加えた。H3K27me3抗体は、ショウジョウバエH3K27me3とヒトH3K27me3の両方を認識するので、ヒトおよびショウジョウバエリードのシーケンシングにより、一致した対照への正規化およびヒト試料間の直接比較を行うことができた。スパイクインリードは、本発明者らの定量的正規化戦略の妥当性を確証する、細胞系間の定量的ウエスタンブロット結果と近いトラックを示した。興味深いことに、H3K27me3含量は、DMG細胞系間で有意に異なった(図33D)が、H3K27me3ドメインは、ほぼ検出不能なレベルのH3K27me3を有すると以前に報告されている(Grasso et al. 2015;Piunti et al. 2017)H3.1K27M細胞系とH3.3K27M細胞系の両方を含む、DMG細胞系の全てにおいて同定された(図34A)。Pearson相関分析は、DMGのゲノミクスおよびトランスクリプトミクス分析で観察された同様の関係(Mackay et al. 2017)と一致して、H3.1K27M腫瘍とH3.3K27M腫瘍間のH3K27me3分布に関してそれらの野生型対応物でのものより高い類似性を明示する(図34B)。しかし、分布およびシグナル強度の複合的差異を観察するための、正規化を区別するLin相関を使用する相関分析は、H3.3とH3.1の分離を示し、これは、H3.1K27M DMG細胞系におけるH3K27me3堆積低減の結果である(図34B)。本発明者らは、ヒストン変異型DMGにおいて目的の非常に多数の遺伝子座に、腫瘍抑制因子WT1を含む多くの濃縮領域を見出した(図34A)。CDKN2aなどの公知の腫瘍抑制因子は、H3.3K27Mおよびヒストン野生型細胞系ではPRC2標的であるが、H3.1K27M細胞系ではそうではなく、これは、以前の報告(Piunti et al. 2017)と一致する。
各々の細胞系に特有の特異的H3K27me3領域を決定するために、本発明者らは、系統ごとにゲノムワイドに正規化されたシグナルを使用してゲノム内のあらゆる塩基対における任意の2つの系統間のシグナルの最大差を定義し、高度な差異のあるシグナルの連続領域に基づいて「ピーク」と呼んだ。次いで、本発明者らは、k平均法クラスタリングを使用して、各々の細胞系におけるH3K27me3シグナルに基づいて差異のあるH3K27me3ピークを群に分け、その結果、6クラスターを含有する最適な解を得た。異なるDMG細胞系における差異のあるH3K27me3ドメインの比較は、H3.1K27MおよびH3.3K27M細胞系に存在しない、野生型細胞系に存在するPRC2ドメインのいくつかのクラスターを示す(図34C)。差異のあるH3K27me3領域の大多数(上位4クラスター)は、野生型に特異的であるが、H3.3K27M細胞内にH3K27me3を保持する数百の領域(クラスター5)、ならびに野生型における任意の濃縮の非存在下でH3.3K27MにH3K27me3が重度に濃縮されているさらにいくつかの領域(クラスター6)が残存する(図34C)。クラスター6ドメインは、非常に多くのTボックス、フォークヘッドおよびディスタルレスファミリーメンバーを含む、細胞型特異的転写因子とオーバーラップし、これは、ヒストン野生型腫瘍との起始細胞の差を示唆する。クラスター6は、血液学的および卵巣悪性病変においてそれぞれ突然変異されることが多い、PRDM1およびVGLL3を含む、いくつかの公知の腫瘍抑制因子も含有する(図34A)(Mandelbaum et al. 2010;Karube et al. 2011)。
H3.1K27M細胞系における非常に少ない残留H3K27me3ドメインの同定は、H3K27Mがこれらの細胞においてゲノムワイドに堆積されることを考えると興味深い(図33C、34A)。この結果は、PRC2がH3.1K27Mの局所的存在下で効率は低いが活性であることを示唆する。本発明者らは、PRC2ドメインにおいてH3.1K27Mを欠く領域を見出さなかったが、H3.1の一部を、局所的に退去させ、PRC2ドメインの回復を可能にする好適なEZH2基質である野生型H3.3によって置き換えることができる可能性もある。この可能性を調査するために、H3.1K27M細胞系における野生型H3.3局在を、CUT&RUNを使用して評定した。K27me3ドメインにおけるH3.3の濃縮は見られない。H3.1K27M細胞系におけるH3.1K27Mの均一な分布およびPRC2ドメイン内で観察される一貫したシグナルを考えると、これらのデータは、H3K27MおよびH3K27me3がクロマチンにおいて局所的に共存することができることを示唆する。
H3K27M−DMGは、原始幹細胞様H3K27me3構成を有する
野生型神経膠腫に非存在であるH3K27M−DMGに特異的に保持されるH3K27me3ドメインの同定、およびH3K27M含有遺伝子座とH3K27me3含有遺伝子座の共存は、DMGクロマチンランドスケープが、EZH2活性に対するH3K27Mの影響によって専ら決定されるものでない可能性があることを示す。ヒストン突然変異型DMGにおいて観察される特有のH3K27me3パターンは、それよりむしろ、腫瘍の起始細胞に由来する可能性がある。このことを調査するために、本発明者らは、DMGにおけるH3K27me3ドメインと、DMGの推定前駆体が生じた可能性が高い人工発生トラジェクトリーを示す神経幹細胞(NSC)およびESCのパネルにおけるものとの定量的比較を模索した。ESCは、少ないH3K27me3を有し、以前にH3K27M神経膠腫形成のモデルとしての機能を果たしており(Funato et al. 2014)、したがって、H3突然変異型DMGとの相対的比較に役立ち、その一方で、胎児前脳由来NSCは、神経膠芽腫のために確立された対照である(Pollard et al. 2009)。
本発明者らは、非形質転換H1 ESCおよびNSC系CB660およびU5におけるH3K27me3についてのCUT&RUNを、定量的比較を可能にするための上記スパイクイン戦略を使用して行った。ロバストなPRC2ドメインが全ての細胞型において同定された(図35A)。H3.1K27MおよびH3.3K27M細胞系におけるH3K27me3についてのゲノムワイドなプロファイルは、ヒストン野生型DMGとよりもESCおよびNSC系と一貫して高度に相関する。際だったことに、Lin相関による絶対H3K27me3レベルを組み入れる定量的比較は、ESC系とH3.3K27Mとの間の高度な関連性を明示し、これは、H3.3K27MにおけるH3K27me3ドメインの原始幹細胞様構成を示唆する(図35B)。特有のH3K27me3ドメインをさらに調査するために、本発明者らは、以前のH3K27me3差分分析からのヒストン突然変異型DMG特異的クラスター(クラスター6)に含有されるH3K27me3濃縮領域に焦点を合せた。ESC系とNSC系の間のクラスター6のH3K27me3ドメインの比較は、それらがH3.3K27M細胞系におけるクラスター6で同定されたドメインとのかなりのオーバーラップを有することを示す(図35C)。これは、全体的なH3K27me3がESCにおいて少ないことを考えると興味深く、これらが、原始幹細胞状態の維持にとって重要な部位であることを示す。加えて、相互排他的分化経路に関連する相当な数の転写因子がクラスター6の中に存在し、これらは、DMG前駆細胞に既に存在する可能性が高いかまたは二次突然変異の蓄積中に新規に生じる、一連のPRC2標的に相当する。DMGに特異的であるが非形質転換幹細胞には非存在であるクラスター6遺伝子には、腫瘍抑制因子遺伝子PRDM1およびVGLL3ならびに他の組織特異的転写因子が含まれる。
H3K27M−DMGは、活性化発生経路のクロマチンシグネチャーを含有する
H3K27me3プロファイリングは、H3K27M−DMGが、原始幹細胞様状態を有することを示した;したがって、本発明者らは、DMGにおけるH3K27acおよびH3.3K27M濃縮が幹細胞様プロファイルも表すかどうかを判定することを模索した。本発明者らは、ESC、NSCおよびDMGにおけるH3K27acピークとDMGにおけるH3.3K27Mピークを比較する相関行列を生成して、異なる細胞系間の活性クロマチンプロファイルの類似性を同定した。H3.3K27M DMG細胞系におけるH3K27acおよびH3K27Mは、0.76および0.81の高い相関係数を有した(Piunti et al. 2017)(図36A)。ヒストン野生型DMG系は、異なる一連の二次突然変異および推定的に異なる起始細胞(Mackay et al. 2017)と一致して、他のDMG細胞系との不良な相関を明示した(図36A)。興味深いことに、H3突然変異型DMG系は、ESCよりNSC系と密接に関連していた(図36A)。これは、H3突然変異型DMGにおけるH3K27me3ドメインがNSCよりESCに類似していたという発見(図35B)と対照をなす。H3.3突然変異型DMG細胞におけるH3.3K27M濃縮は、ESCよりNSCにおけるH3K27ac濃縮と大きく一致していた。これは、H3.3K27Mが、全体としてNSCとより類似している活性クロマチン環境に組み込まれることを示す。
H3突然変異型DMG試料に存在する共通のH3K27M/H3K27acピークは、U5細胞系と最も密接に共有される、Olig1、Olig2(図36B)およびGFAPなどのグリア成熟に関与する遺伝子、ならびに両方のNSC系と共有される一般的な神経調整因子NEUROD1およびNESを含む。さらに、ESCまたはNSC間で共有されないH3K27M/H3K27acピークは、ソニックヘッジホグおよびWNTシグナル伝達経路の成分、ならびにPDGFRAなどのオリゴデンドロサイト前駆体特異的活性遺伝子を含み(図36B)、これは、NSCの発生的に下流の遺伝子の活性化を示す(Filbin et al. 2018)。POU5F1などのhESC特異的調節因子は、DMG H3K27ac/H3K27Mピークを欠いているが、それらは、ESCとNSCの両方において強力に活性である、SOX2およびMYC遺伝子座に存在する(図36B)。考え合わせると、これらのデータは、分化を試みるが、幹細胞特異的クロマチン調節機序を停止することができず、その結果、幹細胞関連遺伝子と分化関連活性遺伝子の分化停止および異常な共存が生じる、原始DMG前駆細胞と一致する。
H3.3K27Mは、PRC2ランドスケープを全体的に変えない
ここで提示するデータは、幹細胞様起始細胞および二次突然変異がDMGにおけるクロマチンランドスケープの主要決定因子であるモデルと一致する。以前の研究は、H3K27Mの発現が、H3K27me3レベルをヒストン変異型DMGで観察されるレベルに低下させ、PRC2分布を再形成することができるが、H3K27me3減少の程度および時間枠は、大きく異なることを示唆した(Bender et al. 2013;Chan et al. 2013;Lewis et al. 2013)。加えて、ESCを使用する、より最近の報告は、H3.3K27MがEZH2をクロマチンに直接動員して、一部の遺伝子座のEZH2を阻害し、その一方で、他の遺伝子座でのPRC2活性を助長することを見出した(Fang et al. 2018)。本発明者らのDMGパネルにおけるPRC2局在を調査するために、本発明者らは、偏性PRC2サブユニットSUZ12および代替サブユニットMTF2に対する抗体をCUT&RUN反応において使用した。SUZ12およびMTF2シグナルは、EZH2によるH3K27me3の堆積を媒介するPRC2成分と一致して、両方のH3突然変異型DMG細胞系におけるH3K27me3ピークの中で高度に濃縮されていた(図37A、37B)。しかし、SUZ12およびMTF2は、H3.3K27M細胞系においてH3K27me3濃縮ドメイン(図37B)と比較してH3K27M濃縮ドメインとそれほど共局在しなかった。さらに、SUZ12およびMTF2シグナルは、H3K27M分布と対照をなすことに、H3K27me3ドメインにおけるそれらの濃縮が、ランダムにサンプリングされた領域を上回って有意に上昇しているので、H3K27M媒介動員によって期待されるゲノムワイドな分布の証拠を、H3.1K27M細胞系では示さなかった(図37C)。さらに、SUZ12およびMTF2シグナルは、どちらの細胞系においてもH3K27M領域においてH3K27Mシグナルとあまり相関せず、これは、SUZ12およびMTF2が、H3K27M依存的様式でゲノムと相互作用する可能性が低いことを示す。本発明者らは、H3K27MがPRC2を隔離する可能性は低いという結論に達した。
本発明者らのデータは、H3.3K27Mが、生理レベルで発現されたときEZH2活性を強く阻害しないはずであることを示す。この仮説を試験するために、本発明者らは、低MOIのレンチウイルス形質導入システムとプラスミドベースのトランスフェクションシステムの両方を使用して、DMGにおいて見られるものに類似したレベルでH3.3K27Mを293T細胞に導入した。抗生物質選択を使用して、全ての細胞が適切な構築物を含有することを確実にした。ウエスタンブロットは、6日の発現後、H3.3K27MがH3.1K27MおよびH3.3K27M細胞系で観察されるものと同様のレベルで存在することを明示する(図38)。重要なこととして、全H3レベルと比較すると、異所性H3.3K27Mは、全H3の極一部に相当し、これは、1つのH3F3AまたはHIST1H3b対立遺伝子からの生理的H3レベルと一致する(図38)。H3.3K27Mのロバストな発現にもかかわらず、H3K27me3レベルのわずかな低減が見られる(図38)。これらのデータは、全体としてEZH2を強力に阻害するH3.3K27Mと一致せず、それどころか、DMGにおけるPRC2ランドスケープが起始細胞と二次突然変異の組合せによって形作られるモデルをさらに支持する(図39A)。
考察
DMGは、処置選択肢がほとんどない、発生的に限定された致死性小児CNS腫瘍である。これらの腫瘍におけるクロマチンランドスケープの特徴付けは、新たな治療戦略につながり得るが、患者由来の試料および細胞系の少なさにより制限されてきた。単一細胞トランスクリプトミクス分析を使用する最近の報告は、DMGが、オリゴデンドロサイト前駆細胞と最も転写的に類似しているが、それらが幹細胞と成熟グリアの両方のマーカーを異常に発現することを実証した(Filbin et al. 2018)。発生トラジェクトリーの別の重要な調節因子であるPRC2活性も、DMGにおける原始状態と成熟状態の機能障害性の組合せを表すかどうかは不明であった。ここで、本発明者らは、CUT&RUNを使用して、DMG細胞系および非形質転換幹細胞の代表パネルにおいてクロマチンランドスケープをプロファイリングした。本発明者らのデータは、H3K27M−DMGに存在する低い残留PRC2活性レベルが、ESC PRC2ランドスケープと最もよく似ていることを示す。クロマチンの転写活性領域の探索は、GFAPを含む成熟グリアのマーカーと並行してSOX2およびMYCの発現を示す。考え合わせると、本発明者らのデータは、発達プログラムの活性化およびH3K27Mの存在にもかかわらずES様PRC2活性を駆動する幹細胞特異的クロマチン調節ネットワークと一致する。
本発明者らのCUT&RUNアプローチによって、本発明者らは、DMGにおけるPRC2ランドスケープへのH3.1K27MおよびH3.3K27Mの寄与についての現行のモデルを詳細に分析することもできた。これらの一部は、H3K27Mに対するEZH2の親和性増大を中心としたものである(Weinberg et al. 2017;Fang et al. 2018;Funato and Tabar 2018)。最近の研究は、H3.3K27Mが、マウスESCにおいて一部の見込みのあるエンハンサーではEZH2を不適切に隔離し、阻害し得る一方で他の遺伝子座ではPRC2活性を助長し得ることを示唆した(Fang et al. 2018)。それらのモデルによって、PRC2成分は、隔離に起因して、H3.3K27M−DMG細胞系のH3K27M部位の大きいサブセットに局在するはずであり、そうでなければPRC2活性は有意には変更されないことになることが予測される。本発明者らのデータセットは、H3K27M濃縮部位とPRC2成分の間にほとんどオーバーラップがないことを観察した。これは、隔離と矛盾する。さらに、本発明者らは、293TにおけるH3.3K27Mの生理レベルの異所性発現が、H3K27me3レベルを低下させないことも見出した。これは、全体的にEZH2を強く阻害するH3.3K27Mの概念(Weinberg et al. 2017)を支持しない。本発明者らのデータは、H3.3K27MのEZH2との相互作用が、H3.3K27M−DMGに見られるPRC2活性低下の主要決定因子である可能性が低いことを示す。
H3.1突然変異型DMGにおけるPRC2ランドスケープに対するH3.1K27Mの影響は、不明である。本発明者らは、H3.1K27M−DMGで観察された異常なクロマチンランドスケープをよりよく理解するために本発明者らのH3K27me3、H3K27MおよびH3K27acデータを使用した。H3.1突然変異型DMGの本発明者らのプロファイリングは、H3.1K27Mが複製依存的様式でゲノムワイドに堆積されることを明示した。定量的CUT&RUNは、特別低い残留PRC2活性およびH3.1K27Mとの共存を明らかにした。PRC2活性の残存部位は、H3.3K27M−DMGおよびESCに存在するものと同様であった。本発明者らはまた、隔離モデルの別の予測である、H3.1K27Mにより動員されるPRC2成分のゲノムワイドな堆積の証拠を観察しなかった。代わりに、本発明者らのデータは、クロマチン関連H3K27Mが、PRC2活性を局所的に阻害し、しかし幹細胞特異的PRC2動員機序が、遺伝子座のサブセットにおけるH3K27M阻害を克服し、WT1などの腫瘍抑制因子遺伝子座を抑制することにより腫瘍形成を助長することと一致する(図39B)。
H3K27Mが、DMGに見られる異常なPRC2ランドスケープの主要決定因子でないとすれば、それらはどのようにして生じるのか。本発明者らのデータは、起始細胞、発生状況および二次突然変異が相乗的に作用して、DMGにおいてH3K27Mが作用するPRC2ランドスケープを決定付けることを示す(図39A)。これらのデータは、起始細胞に既に存在することもあり、または二次突然変異により媒介される脱分化中に獲得されることもあるH3.3K27Mが原始幹細胞様クロマチン構成を有する細胞においてその効果を発揮するモデルも支持する。H3K27Mが神経膠腫形成の初期の事象であることを実証する系統発生学的分析は、腫瘍形成を助長するために、二次突然変異の獲得および発生学的に調節されているシグナル伝達カスケードの活性化の前にH3K27Mが存在する必要があること(Nikbakht et al. 2016)を主張している。H3.3K27Mは、SOX2およびMYCなどの、分化中にサイレンシングを必要とする転写活性遺伝子座に組み込まれているときに新たなPRC2ドメインが発生するのを防止して、幹細胞調節ネットワークの活性化を保存するが、分化の手がかりに対する応答を可能にすることによって、発がんに寄与する可能性が高い(図39B)。対照的に、H3.1K27Mのゲノムワイドな分布は、クロマチンをPRC2活性に対して非応答性にして、ある特定の増殖促進性遺伝子のサイレンシングを防止し、その一方で、幹細胞特異的PRC2動員機序は、腫瘍抑制因子の不十分だが有効な抑制を助長する(図39B)。最近の報告は、H3.3K27Mが、Cbx7とクロマチンの会合を低減させること(Tatavosian et al. 2018)、およびCbxタンパク質には、発生学的に調節されているPRC2ドメインの確立において十分に実証された役割を果たすこと(Morey et al. 2012)を示したので、本発明者らは、クロモドメイン含有タンパク質がH3K27Mの標的であり得ると推測した。
H3K27Mが、ある特定のクロマチン状況でしか腫瘍形成に寄与することができないことを示唆する本発明のモデルは、細胞型および発生期に依存するH3K27Mに対する差異のある感受性を示す他の研究(Funato et al. 2014; Pathania et al. 2017)によって裏づけられる。さらに、H3K27M突然変異型DMGと同様のH3K27me3レベルでの乳児上衣腫および放射状グリアの最近の同定により、H3K27突然変異は、異常に低いレベルのPRC2活性を促進するために必要でないことが示された(Bayliss et al. 2016)。加えて、RUNX1突然変異との組合せでのみ見出される急性骨髄性白血病のサブセットにおけるH3K27Mの最近の同定は、H3K27Mの影響が、少ないH3K27me3により定義される幹細胞様クロマチン状態において最も顕著であるモデルを、さらに支持する(Lehnertz et al. 2017)。その報告書において、単独でのRUNX1突然変異は、RUNX1野生型芽細胞より低いH3K27me3レベルを有し、RUNX1突然変異とH3.1K27Mの組合せは、RUNX1突然変異型ヒストン野生型細胞より低いレベルを有した。ACVR1突然変異およびPDGFRA増幅は、DMGにおいて、AMLにおけるRUNX1突然変異に類似した役割を果たして、細胞をH3K27Mの効果に感作させることができる。考え合わせると、これらの発見は、二次突然変異と発生状況が、PRC2活性を低下させて、H3K27Mオンコヒストンがそれらの効果を発揮する環境を提供するのに十分なものであり得ることを実証する。
DMGにおける活性化発生プログラムと共存する幹細胞様PRC2ランドスケープの発見は、臨床的および治療的意味も持つ。EZH2阻害剤またはHDAC阻害剤などの、幹細胞様PRC2活性の分解を助長し得るクロマチン修飾酵素の小分子阻害剤と組み合わせた、レチノイン酸などの従来の戦略での分化の誘導は、どちらかの単独療法としての使用より効果的である可能性がある。ここで提示するモデルはまた、DMGは、原始幹細胞より高レベルのH3K27me3を有するPRC2ドメインのサブセットを含有するので、EZH2阻害剤単剤療法に対するDMGの感受性が、他の原始幹細胞の感受性より高い可能性が低いことを示唆する。CNS腫瘍のEZH2阻害剤を受けた小児患者において発生する続発性T細胞リンパ腫についての最近の報告は、EZH2阻害剤に対する幹細胞感受性と一致しており、分化を助長する一方でPRC2媒介抑制を軽減するコンビナトリアル療法の利点を主張している。DMGにおける分化誘導およびクロマチン修飾剤と組み合わせた、チロシンキナーゼ阻害剤でのPDGFRA増幅などの二次突然変異の標的化もまた、これらの例外なく致命的な小児悪性疾患のための実りの多い治療アプローチであり得る。
材料および方法 細胞培養
SU−DIPG−IV(H3.1K27M)、SU−DIPG−VI(H3.3K27M)およびSU−DIPG−XIII(H3.3K27M)細胞は、寛大にもスタンフォード大学のM.Monje研究室によって提供されたものである。VUMC−10細胞を入手した。ペニシリン/ストレプトマイシンを補足した、20ng/mLのヒトEGFと20ng/mLのヒトbFGFとを補足したNeuroCult培地(StemCell Technologies、Vancouver、BC)で、細胞を成長させた。解離のためにアキュターゼを用いて、細胞を継代させた。18mMのL−グルタミンを補足したHYQ−SFX昆虫培地(ThermoFisher)でショウジョウバエS2細胞を対数期まで成長させ、擦過により収集した。10%ウシ胎仔血清と2mMのL−グルタミンとを補足したDMEM(ThermoFisher)で293T細胞を成長させた。
全細胞溶解物調製:
試料ごとに、約3〜5×106細胞をペレット化し、PBSで1回洗浄し、200μLの標準タンパク質試料緩衝剤をペレットに添加した。試料をボルテックスし、5分間1000Cで沸騰させ、室温に冷却した。ベンゾナーゼ(1μL)を添加し、試料を室温で5分間インキュベートした後、さらなる使用のために凍結した。
CUT&RUN
CUT&RUNは、記載されているように行った(Skene et al. 2018)。使用した抗体は、H3K27me3(Cell Signaling Technologies 9733)、H3K27M(Abcam ab190631)、H3K27ac(Millipore MABE647)、H3(Abcam ab24834)、H3.3(Abnova)、MTF2(ThermoFisher)、SUZ12(Abcam ab12073)およびウサギIgGアイソタイプ対照EPR25A(Abcam ab172730)を含む。CUT&RUN反応のために、1:50で使用したSUZ12およびMTF2を除いて、全ての抗体を1:100希釈で使用した。スパイクイン正規化は、ViCell(ThermoFisher)によってカウントして、ヒト細胞1,000,000個対S2細胞50,000個の比でショウジョウバエS2細胞を用いて行った。
ライブラリー調製およびシーケンシング
抽出されたDNAをKAPA Hyper−prepライブラリー調製キットプロトコール(Roche,Inc.)に供し、記載されているような(Lu et al Orkin Cell 2018)、小さい断片を保存するために末端修復反応およびポリAテーリング反応を<60℃で行う改良を加えて、以前に記載された(Skene and Henikoff 2017)ように増幅した。Bowtie2を使用して、ヒトリードをhg19とアラインメントした。IgG対照と比較して濃縮部位を同定するためのカスタムスクリプトは、github.com/Henikoff/Cut-and-Runで入手可能である。
データ分析
シーケシングリードを、Bowtie2(Langmead et al. 2012)を使用して構築したhg19ゲノムにマッピングし、BedTool(Quinlan and Hall 2010)を使用してペアードエンド断片BEDファイルおよびスパイク正規化bedGraphを生成した。hg19ゲノムに及ぶ10kbウインドウにマッピングする正規化された断片カウントを使用して、R(www.r-project.org)で相関ヒートマップを生成した。カスタムスクリプトを使用して、濃縮領域および領域頂点をコールした。Rのggplotユーティリティー(ggplot2.tidyverse.org)を使用して、CUT&RUN散布図を生成した。deepTool(Ramirez et al. 2014)を使用して、CUT&RUNシグナルヒートマップおよびメタプロットプロファイルを生成した。BedTool intersectユーティリティーを使用して、濃縮領域共通部分を定量した。Integrative Genomics Viewer(Robinson et al. 2011)を使用して、データセットを可視化した。
実施例5のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)
Bayliss J, Mukherjee P, Lu C, Jain SU, Chung C, Martinez D, Sabari B, Margol AS, Panwalkar P, Parolia A et al. 2016. Lowered H3K27me3 and DNA hypomethylation define poorly prognostic pediatric posterior fossa ependymomas. Sci Transl Med 8: 366ra161.
Bender S, Tang Y, Lindroth AM, Hovestadt V, Jones DT, Kool M, Zapatka M, Northcott PA, Sturm D, Wang W et al. 2013. Reduced H3K27me3 and DNA hypomethylation are major drivers of gene expression in K27M mutant pediatric high−grade gliomas. Cancer Cell 24: 660− 672.
Chan KM, Fang D, Gan H, Hashizume R, Yu C, Schroeder M, Gupta N, Mueller S, James CD, Jenkins R et al. 2013. The histone H3.3K27M mutation in pediatric glioma reprograms H3K27 methylation and gene expression. Genes Dev 27: 985−990.
Fang D, Gan H, Cheng L, Lee JH, Zhou H, Sarkaria JN, Daniels DJ, Zhang Z. 2018. H3.3K27M mutant proteins reprogram epigenome by sequestering the PRC2 complex to poised enhancers. Elife 7.
Filbin MG, Tirosh I, Hovestadt V, Shaw ML, Escalante LE, Mathewson ND, Neftel C, Frank N, Pelton K, Hebert CM et al. 2018. Developmental and oncogenic programs in H3K27M gliomas dissected by single−cell RNA−seq. Science 360: 331−335.
Funato K, Major T, Lewis PW, Allis CD, Tabar V. 2014. Use of human embryonic stem cells to model pediatric gliomas with H3.3K27M histone mutation. Science 346: 1529−1533.
Funato K, Tabar V. 2018. Histone Mutations in Cancer. Annual Review of Cancer Biology 2: 337− 351.
Grasso CS, Tang Y, Truffaux N, Berlow NE, Liu L, Debily MA, Quist MJ, Davis LE, Huang EC, Woo PJ et al. 2015. Functionally defined therapeutic targets in diffuse intrinsic pontine glioma. Nat Med 21: 555−559.
Justin N, Zhang Y, Tarricone C, Martin SR, Chen S, Underwood E, De Marco V, Haire LF, Walker PA, Reinberg D et al. 2016. Structural basis of oncogenic histone H3K27M inhibition of human polycomb repressive complex 2. Nat Commun 7: 11316.
Karube K, Nakagawa M, Tsuzuki S, Takeuchi I, Honma K, Nakashima Y, Shimizu N, Ko YH, Morishima Y, Ohshima K et al. 2011. Identification of FOXO3 and PRDM1 as tumor− suppressor gene candidates in NK−cell neoplasms by genomic and functional analyses. Blood 118: 3195−3204.
Lehnertz B, Zhang YW, Boivin I, Mayotte N, Tomellini E, Chagraoui J, Lavallee VP, Hebert J, Sauvageau G. 2017. H3(K27M/I) mutations promote context−dependent transformation in acute myeloid leukemia with RUNX1 alterations. Blood 130: 2204−2214.
Lewis PW, Muller MM, Koletsky MS, Cordero F, Lin S, Banaszynski LA, Garcia BA, Muir TW, Becher OJ, Allis CD. 2013. Inhibition of PRC2 activity by a gain−of−function H3 mutation found in pediatric glioblastoma. Science 340: 857−861.
Mackay A, Burford A, Carvalho D, Izquierdo E, Fazal−Salom J, Taylor KR, Bjerke L, Clarke M, Vinci M, Nandhabalan M et al. 2017. Integrated Molecular Meta−Analysis of 1,000 Pediatric High−Grade and Diffuse Intrinsic Pontine Glioma. Cancer Cell 32: 520−537 e525.
Mandelbaum J, Bhagat G, Tang H, Mo T, Brahmachary M, Shen Q, Chadburn A, Rajewsky K, Tarakhovsky A, Pasqualucci L et al. 2010. BLIMP1 is a tumor suppressor gene frequently disrupted in activated B cell−like diffuse large B cell lymphoma. Cancer Cell 18: 568−579.
Maze I, Noh KM, Soshnev AA, Allis CD. 2014. Every amino acid matters: essential contributions of histone variants to mammalian development and disease. Nat Rev Genet 15: 259−271.
Mohammad F, Weissmann S, Leblanc B, Pandey DP, Hojfeldt JW, Comet I, Zheng C, Johansen JV, Rapin N, Porse BT et al. 2017. EZH2 is a potential therapeutic target for H3K27M−mutant pediatric gliomas. Nat Med 23: 483−492.
Monje M, Mitra SS, Freret ME, Raveh TB, Kim J, Masek M, Attema JL, Li G, Haddix T, Edwards MS et al. 2011. Hedgehog−responsive candidate cell of origin for diffuse intrinsic pontine glioma. Proc Natl Acad Sci U S A 108: 4453−4458.
Morey L, Pascual G, Cozzuto L, Roma G, Wutz A, Benitah SA, Di Croce L. 2012. Nonoverlapping functions of the Polycomb group Cbx family of proteins in embryonic stem cells. Cell Stem Cell 10: 47−62.
Morgan MA, Shilatifard A. 2013. Medicine. (Poly)combing the pediatric cancer genome for answers. Science 340: 823−824.
Nikbakht H, Panditharatna E, Mikael LG, Li R, Gayden T, Osmond M, Ho CY, Kambhampati M, Hwang EI, Faury D et al. 2016. Spatial and temporal homogeneity of driver mutations in diffuse intrinsic pontine glioma. Nat Commun 7: 11185.
Pathania M, De Jay N, Maestro N, Harutyunyan AS, Nitarska J, Pahlavan P, Henderson S, Mikael LG, Richard−Londt A, Zhang Y et al. 2017. H3.3(K27M) Cooperates with Trp53 Loss and PDGFRA Gain in Mouse Embryonic Neural Progenitor Cells to Induce Invasive High− Grade Gliomas. Cancer Cell 32: 684−700 e689.
Piunti A, Hashizume R, Morgan MA, Bartom ET, Horbinski CM, Marshall SA, Rendleman EJ, Ma Q, Takahashi YH, Woodfin AR et al. 2017. Therapeutic targeting of polycomb and BET bromodomain proteins in diffuse intrinsic pontine gliomas. Nat Med 23: 493−500.
Pollard SM, Yoshikawa K, Clarke ID, Danovi D, Stricker S, Russell R, Bayani J, Head R, Lee M, Bernstein M et al. 2009. Glioma stem cell lines expanded in adherent culture have tumor−specific phenotypes and are suitable for chemical and genetic screens. Cell Stem Cell 4: 568−580.
Qin EY, Cooper DD, Abbott KL, Lennon J, Nagaraja S, Mackay A, Jones C, Vogel H, Jackson PK, Monje M. 2017. Neural Precursor−Derived Pleiotrophin Mediates Subventricular Zone Invasion by Glioma. Cell 170: 845−859 e819.
Schwartzentruber J, Korshunov A, Liu XY, Jones DT, Pfaff E, Jacob K, Sturm D, Fontebasso AM, Quang DA, Tonjes M et al. 2012. Driver mutations in histone H3.3 and chromatin remodelling genes in paediatric glioblastoma. Nature 482: 226−231.
Skene PJ, Henikoff JG, Henikoff S. 2018. Targeted in situ genome−wide profiling with high efficiency for low cell numbers. Nat Protoc 13: 1006−1019.
Skene PJ, Henikoff S. 2017. An efficient targeted nuclease strategy for high−resolution mapping of DNA binding sites. Elife 6.
Takahashi K, Yamanaka S. 2006. Induction of pluripotent stem cells from mouse embryonic and adult fibroblast cultures by defined factors. Cell 126: 663−676.
Tatavosian R, Duc HN, Huynh TN, Fang D, Schmitt B, Shi X, Deng Y, Phiel C, Yao T, Zhang Z et al.
2018. Live−cell single−molecule dynamics of PcG proteins imposed by the DIPG H3.3K27M mutation. Nat Commun 9: 2080.
Wang X, Paucek RD, Gooding AR, Brown ZZ, Ge EJ, Muir TW, Cech TR. 2017. Molecular analysis of PRC2 recruitment to DNA in chromatin and its inhibition by RNA. Nat Struct Mol Biol 24: 1028−1038.
Weinberg DN, Allis CD, Lu C. 2017. Oncogenic Mechanisms of Histone H3 Mutations. Cold Spring Harb Perspect Med 7.
Wu G, Broniscer A, McEachron TA, Lu C, Paugh BS, Becksfort J, Qu C, Ding L, Huether R, Parker M et al. 2012. Somatic histone H3 alterations in pediatric diffuse intrinsic pontine gliomas and non−brainstem glioblastomas. Nat Genet 44: 251−253.
(実施例6)
ヒトセントロメアクロマチン複合体の予期せぬ立体配座多様性
染色体分離の忠実度は、セントロメアと呼ばれる特異的染色体遺伝子座でアセンブリするタンパク質性動原体を介した紡錘微小管による染色体の効率的捕捉に依存する。ヒトセントロメアは、約170塩基対(bp)α−サテライト反復単位の0.5〜5Mb長タンデムアレイを含む(Alexandrov et al.2001)。α−サテライトDNAは、霊長類系統で生まれ、それ以来、反復伸長により進化し続け、その結果、高均一若年アレイがコアに生じ、より分岐したα−サテライト配列がセントロメアエッジを占有している。連続マップへのこれらの均一α−サテライトアレイのアセンブリは、既存の配列アセンブリ技術に重大な課題を提示してきた。この問題に対処するために本発明者らは、機能性セントロメアαサテライトの新規同定のために、セントロメアタンパク質により結合された配列のボトムアップ階層的クラスタリングを最近使用した。本発明者らは、最も存在量の多いα−サテライトアレイが、αサテライトの以前に特徴付けられたSF1およびSF2超染色体ファミリー(Alexandrov et al. 2001)にそれぞれ属する基本340bpまたは342bpダイマー単位(Henikoff et al. 2015)を含有することを見出した。
セントロメアαサテライトは、カノニカルヒストンH3が、セントロメアプロテインA(CENP−A)と呼ばれるそのcenH3バリアントによって置き換えられている、特殊化したクロマチンに含まれる(Palmer et al. 1987;Fukagawa and Earnshaw 2014)。CENP−Aは、CENP−B、CENP−C、CENP−N、CENP−T、CENP−W、CENP−SおよびCENP−Xを含む、構成的セントロメア関連ネットワーク(CCAN)複合体の一部である(Hori et al. 2008)。ネイティブChIP(N−ChIP)、架橋ChIP(X−ChIP)およびシーケンシャルChIP(ReChIP)を含むDNAシーケンシング(ChiP−seq)戦略での比較クロマチン免疫沈降(ChIP)を使用して、本発明者らは、CENP−B、CENP−CおよびCENP−Tが、物理的に一体化し、CENP−Aヌクレオソームとのコヒーレント複合体を形成することを以前に示した。CENP−A、CENP−CおよびCENPT X−ChIPのミクロコッカスヌクレアーゼ(MNase)消化は、α−サテライトダイマーに対して>165bp保護を生じさせる結果となった(Thakur and Henikoff 2016)が、ネイティブ条件下では、MNase消化は、約100〜約135bpの範囲のより短いCENP−A結合α−サテライト断片を主として生じさせる結果となった(Hasson et al. 2013;Henikoff et al. 2015;Nechemia-Arbely et al. 2017)。
本発明者らおよび他者は、セントロメアクロマチンが、350〜500mM NaClで抽出したとき安定していることを見出した(Zhang et al. 2012;Hasson et al. 2013;Henikoff et al. 2015)。本発明者らはまた、500mM NaClが、低塩条件(Thakur and Henikoff 2016)と比較してセントロメアクロマチンの回収率を上昇させることを見出し、これにより、回収率の差異が、セントロメアクロマチンの性質の質的差異を表すのかという疑問が生じた。古典的クロマチン塩分画は、異なる物理的特性(Sanders 1978)、機能(Rocha et al. 1984)およびゲノムワイドな分布(Henikoff et al. 2009;Jahan et al. 2016)を有するヌクレオソームを分離するために使用されているので、本発明者らは、セントロメアクロマチンの大部分が、ネイティブMNase−ChIP研究において典型的に回収される可溶性画分には非存在であるCCAN成分の存在により不溶性にされているのではないかと思った。
ネイティブ条件下での差異のある溶解度が、セントロメアクロマチンの質的差異を表す可能性に取り組むために、本発明者らは、塩分画したクロマチンをセントロメアタンパク質のN−ChIPに供した。本発明者らは、さらに、本発明者らが最近開発したCUT&RUN(標的下切断およびヌクレアーゼを使用した放出)in situ標的化マッピング法を特定のセントロメア成分をプロファイリングするのに適用することにより、塩溶解度の差異を詳しく調査した。本発明者らは、同じα−サテライトサブファミリーに属するダイマー反復配列間のわずかな配列差異が、セントロメアタンパク質結合と複合体自体の構造の両方の差異に対応することを見出した。
結果および考察
CUT&RUN塩分画(CUT&RUN.Salt)は、別個のCENP−A含有複合体を放出する
ChIPは、30年より長きの間、特異的タンパク質−DNA相互作用をマッピングするための主要な方法となっているが、ChIP−seqアーチファクトについての最近の報告(Park et al. 2013;Teytelman et al. 2013;Jain et al. 2015)は、非ChIP法を使用する検証の重要性を強調している(Zentner et al. 2015)。セントロメア研究に関して特に懸念されるのは、N−ChIPに使用されるMNaseのニブリングおよび内部切断を引き起こす傾向(Brogaard et al. 2012)であり、これにより、粒子に完全に巻き付いているのか、部分的に巻き付いているのかについての不確実性が生じる(Hasson et al. 2013)。本発明者らは、ゲノムの残りを可溶化することなく無傷抗体標的化粒子の正確な切断および放出を引き起こすことからChIPとは無関係である効率的標的化ヌクレアーゼ法である、CUT&RUNを最近導入した(Skene and Henikoff 2017b)。本発明者らの最新のCUT&RUNプロトコール(Skene and Henikoff 2017a)では、磁気ビーズと結合した透過処理済み細胞に抗体を添加し、その後、その抗体に結合する、MNaseとプロテインAとの融合タンパク質(pA−MN)を添加する。MNaseをカルシウムにより活性化し、次いで、175mM NaClの存在下でのEDTAおよびEGTAとのキレート化により停止させる。MNaseをCUT&RUNで特定の部位に繋留した場合、高ATリッチDNAについてであっても、消化時間の2桁を超える範囲にわたって検出可能なニブリングも、接近可能性バイアスも、内部切断もない。さらに、クロマチン可溶化がないため、不溶性ペレットから抽出されたDNAのCUT&RUN切断パターンもプロファイリングすることができる(Skene and Henikoff 2017b)。塩分画へのCUT&RUNの適用(CUT&RUN.Salt)のために、RNaseを含まないキレート化STOP緩衝剤を添加し、上清を除去した後、本発明者らは、細胞/ビーズペレットを500mM NaClとともにインキュベートした。次いで、本発明者らは、低塩および高塩上清ならびに最終ペレットからDNAを抽出した(図49A)。ChIPでは、抗体認識またはDNA回収は、粒子一体性の喪失などの、塩により誘導される粒子立体配座変化による影響を受けることがあるが、CUT&RUNは、DNAが切断される前に抗体認識が起こることから塩分画によく適している。3つの画分全てについて、本発明者らは、CENP−A、CENP−BおよびCENP−CからのDNAに関するqPCRアッセイにおいてセントロメアαサテライトの明確な濃縮を観察したが、陰性対照H3K27me3 CUT&RUN.Saltシーケンシングライブラリーではそれが観察されなかった(図49B)。本発明者らのN−ChIP結果と一致して、クロマチンの大多数(約70%〜80%)が高塩CUT&RUN.Salt画分で増幅された(図49C)。
ペアードエンド25bp×25bp DNAシーケンシングに供し、コンセンサスα−サテライトアレイにマッピングしたとき、3つの画分全てが、バックグラウンド対照と比較して均一なダイマーαサテライト(SFI、D5Z2、D7Z1およびSF2)より強いCENP−A、CENP−BおよびCENP−C濃縮、ならびに非セントロメアαサテライト(D5Z1およびD7Z2)より弱い濃縮を示した。ペリセントリックヒストンマーク(H3K9me2およびH3K9me3)は、予想どおりαサテライトより弱い濃縮を示したが、ユークロマチンマーク(H3K27me2およびH3K27me3)は強い枯渇を示した。
CUT&RUN.Salt断片の断片長分布を分析するために、本発明者らは、CUT&RUN.Salt画分を用いてペアードエンド250bp×250bpシーケンシングを行い、マージペアを活性セントロメアα−サテライトコンティグにマッピングした。N−ChIP塩画分間で見られた不均一なサイズ分布とは対照的に、本発明者らは、低塩CUT&RUN.Salt画分と高塩CUT&RUN.Salt画分の間ではるかに均一なサイズ分布を観察した(図40A)。CENP−A、CENPBおよびCENP−CCUT&RUN.Saltについては、3つの画分全てが、約160〜185bpに主ピークを示し、約340bpに副ピークを示した。α−サテライトコンティグに関するCENP−A CUT&RUN.Saltプロファイルは、低塩、高塩およびペレット画分において、X−ChIPを使用して観察されたもの(Thakur and Henikoff 2016)に類似した別個のCCAN複合体を明示した(図40B)。したがって、CUT&RUN.Saltは、ネイティブ条件下で無傷CENP−A/B/C複合体を放出する(それによって、潜在的架橋アーチファクトを回避する)ばかりでなく、未繋留のMNaseが100bpサブ粒子を生じさせるN−ChIPとは対照的に、粒子の破壊を防ぎもする。
強い高密度のCENP−Bボックスは、CENP−A/B/C複合体を安定させる
CENP−A N−ChIPについての上記から分かるように、CENP−A、CENP−BおよびCENP−C CUT&RUN.Saltについての差異のある溶解度は、これらのα−サテライトコンティグに関して塩の増加に伴って占有率の増加が見られるが、CENP−Bボックスに関して最も明らかである。興味深いことに、複数の340bp単位を平均したとき、CENP−B CUT&RUN占有率ピークは、高塩およびペレット画分ではCENP−Bボックスではっきりと観察されたが、低塩画分では観察されなかった(図41A)。CUT&RUNにおけるCCAN粒子の保護と考え合せると、平均ピークのこの非存在は、破壊に耐えてCENP−Bが濃縮される安定した粒子と、CENP−Bが枯渇するより不安定な粒子という、粒子の2つの明確に異なるクラスがあることを示す。
本発明者らは、CUT&RUN.Saltによって測定した場合のCCAN一体性が、CENP−Bの安定させる役割を表すのではないかと思った。ヒトセントロメアにおける相違度の勾配を有するα−サテライト配列の存在は、この可能性を試験する機会を与える(Henikoff et al.2015)。ごく最近拡張した存在量の多いCENP−Aが濃縮されたα−サテライトダイマーアレイは、高密度のCENP−Bボックス(340bpダイマー1つ当たりCENP−Bおおよそ1つ)を含有する。より老年のαサテライトは、進化の時間とともにランダム突然変異の蓄積に起因してより相違度が大きくなり、これは、CENP−Bボックスの完全喪失または変性につながる。本発明者らは、祖先モチーフとのCENP−Bボックス配列の相違度が、CENP−A/B/Cに結合するαサテライトの能力、したがってセントロメアを形成する能力に対応するのかどうかを問うた。
この疑問に取り組むために、本発明者らは、先ず、17bp CENP−Bボックスの中央の15bpを祖先のものとして同定した。それは、均一なSF1(例えば、D5Z2)、SF2(例えば、Cen13様)およびSF3(例えば、DXZ1)α−サテライトコンティグの大多数に規則正しい間隔で存在するからである。次いで、本発明者らは、モチーフアラインメント・検索ツール(MAST)を使用してこのモチーフの統計的に有意な出現率を特定し、それらに0(3つより多いミスマッチ)と1(同一)の間のスコアを付けた。本発明者らは、CENP−Bモチーフスコアの増加が、非特異的IgG CUT&RUN占有率に対するCENP−Aの濃縮と相関することを見出した(図41B)。具体的には、2回の生物学的反復実験を平均したとき、本発明者らは、3つの塩画分全てについてr=0.66〜0.83のPearson相関を観察した。本発明者らは、強いCENP−Bボックスの存在がCENP−A/B/Cの安定化に関連すると結論付ける。
CENP−Bボックス密度は、ダイマーアレイでの最高から不均一モノマーアレイでの最低まで幅がある。CENP−Bは、配列依存的様式でCENP−Bボックスと結合するので、CENP−Bタンパク質密度も、より若年の均一アレイでより高くなると予想される。本発明者らは、老年配列からのCENP−Bボックスの喪失(CENP−Bボックス密度の低下)度が、これらの配列に対するCENP−A結合の低下と相関するかどうかを試験した。本発明者らは、より長いα−サテライトコンティグに関するCENP−A濃縮に対してCENP−B密度をプロットし、CENP−Bモチーフ密度とCENP−A濃縮の間に強い相関(r=0.62〜0.75)を観察した(図41C)。これは、強い高密度のCENP−Bボックスの維持が、α−サテライトセントロメアへのCENP−A/B/C結合効率を上昇させることを示す。均一な機能性α−サテライトアレイの中のCENP−Bボックスが進化して常在CENP−A/B/C粒子を安定させるという本発明者らの証拠は、CENP−BがCENP−Cを安定させることにより分離の忠実度に寄与するという提案(Fachinetti et al. 2015)を支持する。
異なるαサテライトがCENPAアセンブリ能力を多少保持する
最高のCENP−A濃縮は、高密度CENP−Bボックスを有する高均一アレイで起こったが、qPCRアッセイは、CUT&RUN.Saltおよび塩分画N−ChIP実験においてCENP−Bボックスをほとんどまたは全く含有しない異なる配列上に少量のCENP−Aも明示した(図41C)。異なるαサテライト上での低レベルのCENP−Aの細胞学的検出は、CENP−Aで明るく染色される均一ダイマーの検出と比較して、それらの少ないコピー数のため困難である。例えば、均一D7Z1(1.5〜3.8Mb)は、CENP−Aとの強い細胞学的共局在を示すが、異なるD7Z2(0.1〜0.5Mb)は、CENP−Aに対して陰性であると報告された(Slee et al. 2012)。本発明者らは、不均一モノマーαサテライトにおけるCUT&RUN.Salt試料におけるCENP−A濃縮を、βサテライト−68〜69bpペリセントリックタンデム反復配列アレイを含む、非セントロメア配列と比較した。本発明者らは、反復配列がマスクされたゲノムと比較して、およびβ−サテライトアレイと比較して(図41D)、D7Z2において3倍を超えるCENP−A濃縮を見出した。これは、CENP−Bモチーフを完全に欠いている異なるα−サテライトアレイであってもCENP−Aアセンブリ能力を多少保持することを示す。
ほぼ均一なα−サテライトアレイ上でのCENP−A/B/Cの予期せぬ構造および立体配座多様性
完璧に均一なα−サテライトアレイを標準シーケンシングリードから一意的にアセンブリすることはできないが、約5%の相違度は、多少のシーケンシングされたリードをコンティグにアセンブリするには十分である。本発明者らは、非常に均一なアレイの全てのコピーが同一のパターンを示すと予想したので、隣接する反復配列間の大きな差異を、250bp×250bpマージペアをそれらにマッピングしたとき、見出して驚いた。本発明者らは、アノテーション付きBACクローンおよびゲノムコンティグに対応する均一なアレイ内に3つの主要なタイプの多様性を観察した(図42):(1)CENP−A/B/Cによる個々のダイマーの差異のある占有率。本発明者らは、単一アレイ内の最低占有ダイマーと最高占有ダイマー間に濃縮の最大約50倍の差を観察した。(2)CENP−Bボックスに対するCENP−A/B/Cの方向性。SF1 α−サテライトダイマーアレイ内の2つのCENP−Bボックス間の距離は、ヘッドからテールの形での一方向の方向性を持つ340bpである。したがって、CENPA/B/C含有複合体の方向性は、一方向性であると予想される。この予想に反して、本発明者らは、CENPA/B/Cが、単一の連続したα−サテライトコンティグ内であってもCENP−Bボックスに対する方向性(図42の赤色矢印)を片側に持ち得ることを観察した。(3)構造多様性。本発明者らは、340bpダイマー全体にわたってダイマーの両方のモノマーにCENP−A/B/Cがほぼ同等に結合している対称複合体、またはダイマーの1つのモノマーを優先的に占有する非対称複合体のどちらかを含む、異なるCENP−A/B/C構成を、これらのコンティグ上に観察した。α−サテライトダイマー上のCENP−A含有粒子のそのような極端な構造多様性が、配列の驚くほど少ない差異を伴って観察された。例えば、図42の下部のパネルに重ねて示す4つの隣接する340bp D7Z1反復配列は、ペアワイズ比較で88%〜96%同一であり、それにもかかわらず、4つ全てが、CCAN構造では互いに異なる。したがって、わずかなα−サテライト配列多様性が、CENP−A含有複合体の結合挙動に影響を与えるように見える。見たところでは、複数のCCAN形態が外側動原体を動員するが、単一の構造形態にしか動員能力がない可能性がある。これらの差異は、CCANが結合する配列に固有であり得、またはショウジョウバエD1、GAGA因子、およびProdタンパク質と類似した、非ヒストンサテライトDNA結合タンパク質による排除(Levinger and Varshavsky 1982; Raff et al. 1994; Torok et al. 1997)を表し得る。
塩分画を使用するCENP−A/B/Cの本発明者らのマッピングは、均一なα−サテライトアレイが、CENP−A、CENP−B、CENP−CおよびCENP−Tを含有する単一のコヒーレントCCAN複合体により占有されることを本発明者らが示した本発明者らの以前の報告(Thakur and Henikoff 2016)を確証する。CENP−Bボックスに関するCENP−T部分複合体の本発明者らのマッピングから、各々のα−サテライトダイマー単位が巻き付いており2つのCENP−A/H4/H2A/H2Bサブヌクレオソーム間にCENP−TWSXサブ粒子を中心とする右手性超らせんキラリティーがあるモデルを本発明者らは提案した。非架橋CCANのMNase消化に対する感受性は、一つには、DNA保護の差異の主な原因となり得、したがって、CENP−Aヌクレオソームの構造についての結論と矛盾することになる。しかし、塩分画を伴うN−ChIPを続けて行うことにより、本発明者らは、低塩条件を使用して観察されたCENP−A粒子(Lacoste et al. 2014;Nechemia-Arbely et al. 2017)が、ゲノムワイドに全CENP−Aの極一部しか構成しないことを今や示す。対照的に、N−ChIP塩の大画分は、はるかに大きいDNA断片を保護する粒子からなり、これは、無傷CCAN複合体の存在と一致する。均一なα−サテライトアレイにおけるCENP−BボックスへのCENP−B結合は、CCAN一体性を促進するという本発明者らの証拠は、CENP−Bの特異な役割の証拠を与えるものである。加えて、CENP−Bボックスを欠いており、CENP−Bの濃縮を示さない、D7Z2 α−サテライトアレイに、CCAN成分が低レベルで動員されるという本発明者らの発見は、CENP−Bの非存在下であっても固有のCCAN動員の可能性があることを示唆する。したがって、CCAN占有率をα−サテライト配列によって決定するが、アレイへのCENP−B結合によって向上させることができる。
材料および方法
細胞系、抗体およびプライマー
塩分画N−ChIPアッセイは、CENP−A Flagタグ付きHT1080−1b細胞系(Thakur and Henikoff 2016)で行い、CUT&RUN.Salt実験は、K562細胞系で行った。使用した抗体は、抗CENP−A(Abcam、ab13939)、抗CENP−B(Abcam、ab25734)、抗CENP−C(Abcam、ab33034)、ヒストンH3K27me3(Cell Signaling Technologies、9733)、IgG(Antibodies Online、ABIN102961)およびMTPOL(GeneTex、GTX105137)であった。
CUT&RUN.Salt
ヒトK562細胞または核のCUT&RUNは、消化後に、塩分画が可能になるようにプロトコールを改良したことを除いて、本質的には記載されている(Skene and Henikoff 2017b)ように行った。図41に示す実験は、核ではなく、透過処理した細胞を使用した(Skene and Henikoff 2017a)。ペアードエンド250bp×250bpまたは25bp×25bpシーケンシングを行った。
配列分析
記載されている(Henikoff et al. 2015)ようなパラメーター:-q25−L25−o15を用いてSeqPrepを使用して、ペアードエンド250bp×250bpリードをトリミングし、マージした。Bowtie2を使用して次のパラメーター:−−end−to−end−−very−sensitive−−no−mixed−−no−discordant−q−−phred33−I 10−X700を用いて、マージペアおよびペアードエンド25bp×25bpリードをマッピングした。CUT&RUN.Saltについては、記載されている(Skene and Henikoff 2017b)ようにスパイクイン対照を使用してリードカウントを較正した。濃縮値は、特異的抗体の較正リードカウントの、非特異的IgG対照の較正リードカウントに対する比を表す。モチーフ強度および密度を推定するために、本発明者らは、15bp CENP−Bボックスモチーフが祖先のものであると推論した。それは、最も均一なSF1(例えば、Cen1様)、SF2(例えば、Cen13様)およびSF3(例えば、DXZ1)α−サテライトアレイに規則正しい間隔で存在するからである。本発明者らは、記載されている(Zentner et al. 2015)ような統計的に有意な出現についてコンティグをスキャンして、CENP−Bモチーフを同定し、CENP−Bボックスミスマッチおよび密度を算出した。本発明者らは、モチーフスコアを、0(有意なモチーフなし)〜1(完璧なモチーフ)の尺度について、15のうちの15のマッチが1であり、3より多いミスマッチが0であり、各々のミスマッチから0.25の値を引く、15bpコンセンサスに対する同一性度として定義する。
実施例6のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)
Alexandrov I, Kazakov A, Tumeneva I, Shepelev V, Yurov Y. 2001. α−Satellite DNA of primates: old and new families. Chromosoma 110: 253-266.
Brogaard KR, Xi L, Wang JP, Widom J. 2012. A chemical approach to mapping nucleosomes at base pair resolution in yeast. Methods Enzymol 513: 315-334.
CherejiRV,OcampoJ,Clark DJ. 2017.MNase−sensitivecomplexes in yeast: nucleosomes and non−histone barriers. Mol Cell 65: 565-577.e563.
Fachinetti D, Han JS, McMahon MA, Ly P, Abdullah A, Wong AJ, Cleveland DW. 2015. DNA sequence−specific binding of CENP−B enhances the fidelity of human centromere function. Dev Cell 33: 314-327.
Fukagawa T, Earnshaw WC. 2014. The centromere: chromatin foundation for the kinetochore machinery. Dev Cell 30: 496-508.
Hasson D, Panchenko T, Salimian KJ, Salman MU, Sekulic N, Alonso A, Warburton PE, Black BE. 2013. The octamer is the major form of CENP−A nucleosomes at human centromeres. Nat Struct Mol Biol 20: 687-695.
Henikoff S, Henikoff JG, Sakai A, Loeb GB, Ahmad K. 2009. Genome−wide profiling of salt fractions maps physical properties of chromatin. Genome Res 19: 460-469.
Henikoff JG, Thakur J, Kasinathan S, Henikoff S. 2015. A unique chromatin complex occupies young α−satellite arrays of human centromeres. Sci Adv 1: e1400234.
Hori T, Amano M, Suzuki A, Backer CB, Welburn JP, Dong Y, McEwen BF, Shang WH, Suzuki E, Okawa K, et al. 2008. CCAN makes multiple contacts with centromeric DNA to provide distinct pathways to the outer kinetochore. Cell 135: 1039-1052.
Jahan S, XuW, He S, Gonzalez C, DelcuveGP, Davie JR. 2016. The chicken erythrocyte epigenome. Epigenetics Chromatin 9: 19. Jain D, Baldi S, Zabel A, Straub T, Becker PB. 2015. Active promoters give rise to false positive ‘phantompeaks’ in ChIP−seq experiments. Nucleic Acids Res 43: 6959-6968.
Lacoste N, Woolfe A, Tachiwana H, Garea AV, Barth T, Cantaloube S, Kurumizaka H, Imhof A, Almouzni G. 2014. Mislocalization of the centromeric histone variant CenH3/CENP−A in human cells depends on the chaperone DAXX. Mol Cell 53: 631-644.
Levinger L, Varshavsky A. 1982. Protein D1 preferentially binds A+T−rich DNA in vitro and is a component of Drosophila melanogaster nucleosomes containing A+T−rich satellite DNA. Proc Natl Acad Sci 79: 7152-7156.
McNulty SM, Sullivan LL, Sullivan BA. 2017. Human centromeres produce chromosome−specific and array−specific α satellite transcripts that are complexed with CENP−A and CENP−C. Dev Cell 42: 226-240.e226.
Mieczkowski J, Cook A, Bowman SK, Mueller B, Alver BH, Kundu S, Deaton AM, Urban JA, Larschan E, Park PJ, et al. 2016. MNase titration reveals differences between nucleosome occupancy and chromatin accessibility. Nat Commun 7: 11485.
Nechemia−Arbely Y, Fachinetti D, Miga KH, Sekulic N, SoniGV, Kim DH, Wong AK, Lee AY, Nguyen K, Dekker C, et al. 2017. Human centromeric CENP−A chromatin is a homotypic, octameric nucleosome at all cell cycle points. J Cell Biol 216: 607-621.
Palmer DK, O’Day K, Wener MH, Andrews BS, Margolis RL. 1987. A 17− kD centromere protein (CENP−A) copurifies with nucleosome core particles and with histones. J Cell Biol 104: 805-815.
Park D, Lee Y, Bhupindersingh G, Iyer VR. 2013. Widespread misinterpretable ChIP−seq bias in yeast. PLoS One 8: e83506. Raff JW, Kellum R, Alberts B. 1994. The Drosophila GAGA transcription factor is associated with specific regions of heterochromatin throughout the cell cycle. EMBO J 13: 5977-5983.
Rocha E, Davie JR, van Holde KE, Weintraub H. 1984. Differential salt fractionation of active and inactive genomic domains in chicken erythrocyte. J Biol Chem 259: 8558-8563.
SandersMM. 1978. Fractionation of nucleosomes by salt elution from micrococcal nuclease−digested nuclei. J Cell Biol 79: 97-109.
Skene PJ, Henikoff S. 2017a. CUT&RUN: targeted in situ genome−wide profiling with high efficiency for low cell numbers. bioRxiv doi: 10.1101/193219.
Skene PJ, Henikoff S. 2017b. An efficient targeted nuclease strategy for high−resolution mapping of DNA binding sites. eLife 6: e21856.
Slee RB, Steiner CM, Herbert BS, Vance GH, Hickey RJ, Schwarz T, Christan S, Radovich M, Schneider BP, Schindelhauer D, et al. 2012. Cancer−associated alteration of pericentromeric heterochromatin may contribute to chromosome instability. Oncogene 31: 3244- 3253.
Teytelman L, Thurtle DM, Rine J, van Oudenaarden A. 2013. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. Proc Natl Acad Sci 110: 18602-18607.
Thakur J, Henikoff S. 2016. CENPT bridges adjacent CENPA nucleosomes on young human α−satellite dimers. Genome Res 26: 1178-1187. Torok T, Harvle PD, Buratovich M, Bryant PJ. 1997. The product of proliferation disrupter is concentrated at centromeres and required for mitotic chromosome condensation and cell proliferation in Drosophila. Genes Dev 11: 213-225.
Xi Y, Yao J, Chen R, Li W, He X. 2011. Nucleosome fragility reveals novel functional states of chromatin and poises genes for activation. Genome Res 21: 718-724.
Zentner GE, Kasinathan S, Xin B, Rohs R, Henikoff S. 2015. ChEC−seq kinetics discriminate transcription factor binding sites by DNA sequence and shape in vivo. Nat Commun 6: 8733.
ZhangW, Colmenares SU, Karpen GH. 2012. Assembly of Drosophila centromeric nucleosomes requires CID dimerization. Mol Cell 45: 263-269.
(実施例7)
クロマチン修飾の自動化in situプロファイリングには、細胞型および遺伝子調節プログラムに対する分解能がある
序論
細胞は、それらの明確に異なる素性および機能特性を、遺伝子発現を制御するシス調節DNAエレメントの活性を変化させることにより、同定する1、2。プロモーターエレメントは、全ての遺伝子の5’転写開始部位(TSS)付近に位置するが、遠位シス調節エレメント、例えばエンハンサーは、DNAの長いストレッチを架橋して、選ばれたプロモーターと相互作用し、細胞型特異的遺伝子発現を指示することが多い1、2。それらの遺伝物質(すなわち、DNA配列)に加えて、本発明者らの細胞は、これらの明確に異なるシス調節の確立を遺伝性エピジェネティック情報の形態で細胞分裂を通して伝達し、それによって、それらは、それらの特有の細胞の素性を伝えることができる3、4。これらのシス調節エレメントを認識する核タンパク質の欠陥が、特定の組織および細胞型に現れることが多い多くのヒト疾患の根底にある5〜9。患者試料の分子診断の基準を提供するために、人体の細胞の包括的アトラスを作成するための努力が進められている10、11。健常細胞および罹患細胞における細胞型特異的クロマチンランドスケープの特徴付けは、このアトラスに不可欠であるが、技術的な限界が、このプロジェクトに必要な大規模なスケールでのクロマチンタンパク質のゲノムワイドなプロファイリングのための旧来のアプローチの実行を妨げてきた。
エピジェネティックな機能不全は多くのヒト疾患の根底にあるという認識の高まり12にもかかわらず、患者試料のエピゲノムをプロファイリングするために利用できる方法は非常に少ない。エピゲノム技術の臨床的可能性の実現には、多数の患者試料を並行してプロファイリングすることができるロバストな拡張性のあるアプローチが必要である。ハイスループットシーケンシングと組み合わせた抗原特異的抗体でのクロマチン免疫沈降は、クロマチンプロファイリングに広く使用されてきたが、この方法は、労働集約的であり、アーチファクトを生じやすく13、弱いシグナルをゲノムバックグラウンドノイズと区別するために高度なシーケンシング深度を必要とするため、それを臨床応用のスケールにするのは困難である。最近、本発明者らは、因子特異的抗体を使用してミクロコッカスヌクレアーゼ(MNase)をゲノム結合部位に繋留する代替クロマチンプロファイリング技法としてCUT&RUNを導入した14、15。標的ヌクレアーゼが結合部位周辺でクロマチンを切断し、放出されたDNAは、標準的なライブラリー調製技術を使用して容易にシーケンシングされ、その結果、タンパク質−DNA相互作用が効率的にマッピングされる。CUT&RUNは、非常に低いバックグラウンドを有し、これは、一般に、高品質なゲノムワイドなプロファイルを得るために必要とされる試料の量およびシーケンシングコストを大いに低下させる14、16
ここで、本発明者らは、液体ハンドリングロボットを用いて96ウェル形式でクロマチンタンパク質および修飾をプロファイリングするようにCUT&RUNプロトコールを改良する。この方法をH1ヒト胚性幹細胞(hESC)系およびK562白血病細胞系に適用することにより、本発明者らは、細胞型を比較してそれらの明確に異なる遺伝子調節プログラムを特定するためのロバストな定量的メトリクスを開発する。加えて、本発明者らは、この方法が、凍結腫瘍試料からクロマチンの特徴を定義してそれらの細胞の素性を決定することができることを示す。AutoCUT&RUNは、クロマチンに基づく遺伝子調節のハイスループット研究にとって理想的であり、患者試料のクロマチンランドスケープの検査を診療所における日常的なものにすることができるだろう。
結果
クロマチンタンパク質のゲノムワイドなプロファイリングのための自動化プラットフォーム
自動化形式にCUT&RUNを適応させるために、本発明者らは、磁気分離および温度制御を助長するためのBeckman Biomek FX液体ハンドリングロボットを装備した(図43A)。先ず、細胞をコンカナバリンA被覆磁気ビーズに結合させ、それによって、後続の全ての洗浄を磁気分離により行うことを可能にする。次いで、ビーズ被覆試料を抗体とともにインキュベートし、最大96の試料をプレートに整列させる(図43A)。逐次的な洗浄、プロテインA−MNase融合タンパク質の繋留、DNAの切断、および切断されたクロマチン断片の試料上清への放出を、Biomekで行う(図49A)。ゲノミクスプロトコールの自動化の大きな障害は、それらが、通常は、ライブラリー調製の前に少量の核酸の精製を必要とすることである。この障害を克服するために、本発明者らは、Illuminaライブラリーアダプターの直接ライゲーションのためにクロマチン断片におけるDNA末端をポリッシングする方法を開発した(図49A)。次いで、インデックス付きCUT&RUNライブラリーを、PCR濃縮の前にも後にもAmpure XP磁気ビーズを使用してBiomeckで精製する。末端ポリッシング、アダプターライゲーションおよびPCR濃縮反応を別々のサーモサイクラーで行う。このAutoCUT&RUNプロトコールは、単一オペレーターによる、すぐにプールしてシーケンシングすることができる最大96のライブラリーの2日での生成を可能にする(図43A)。
AutoCUT&RUNの有効性を試験するために、本発明者らは、活性クロマチン状態を示す4つのヒストン修飾(H3K4me1、H3K4me2、H3K4me3およびH3K27ac)および1つの抑制性修飾(H3K27me3)を標的とする抗体を使用するH1 hESCおよびK562細胞の2つの生物学的反復実験を同時にプロファイリングした。各々のヒストンマークについてのリードの全体的分布を比較することにより、本発明者らは、試料が、それらの生物学的反復と高度に相関し、バイアスのない階層行列で一緒にクラスターを形成することを見出した(図43B)。加えて、活性ヒストンマークのゲノムワイドなプロファイルは、所与の細胞型の中で一緒にクラスターを形成し、抑制性ヒストンマークH3K27me3から分離した(図43B)。これらのプロファイルは、IgG陰性対照とそれほど相関しないので、抗体特異的シグナルを表す。まとめると、これらの結果は、AutoCUT&RUNクロマチンプロファイリングは、ヒストンマークの細胞型特異的分布を再現可能に捕捉することを示す。
ヒストンは、クロマチンの中でDNAと密に会合しているため、本発明者らは、AutoCUT&RUNを、より短い滞留時間を有するDNA結合転写因子のマッピングに適用することができるかどうかも調査した。本発明者らは、ヒストン遺伝子座特異的遺伝子調節因子NPATと、インスレータータンパク質CTCFという、2つの転写因子を用いて、AutoCUT&RUNの性能を試験した17、18。NPATとCTCFの両方のAutoCUT&RUNプロファイルは、H1細胞とK562細胞の両方においてそれらの予想標的に対して非常に特異的であり(図49B、49C)、K562細胞におけるCTCFのシグナル感度は、本発明者らの以前の結果15に匹敵した。したがって、AutoCUT&RUNは、多様なDNA結合タンパク質のハイスループットでゲノムワイドなプロファイリングに好適である。
それらの発生上の可塑性を維持するために、hESCは、オーバーラップしているH3K27me3およびH3K4メチル化によって示される、条件的ヘテロクロマチンの抑制ドメインとともに散在している開放された、高アセチル化されたクロマチンランドスケープを一般に有する19〜22。AutoCUT&RUNは、hESCにおけるこれらの特徴を再現する;本発明者らは、H1細胞が、系統限定K562細胞系と比較して増加されたH3K27acを有し、その一方で、抑制性ヒストンマークH3K27me3のドメインが、H1細胞では稀だがK562細胞では高頻度に見られることを観察した(図44A)。本発明者らはまた、H1細胞においてH3K27me3シグナルとH3K4me2シグナルとの広範なオーバーラップを観察したが、K562細胞では観察されなかった(図44A、44B)。したがって、Auto CUT&RUNプロファイルは、hESCに見られる特殊化したクロマチンの特徴と一致する。
H3ヒストンテールに対する翻訳後修飾が転写活性と密接に相関することは文書で十分に裏づけられている。ヒストン修飾の本発明者らのAutoCUT&RUNプロファイルが、シス調節エレメントの転写活性を示すかどうかを判定するために、本発明者らは、RNA−seq発現データに従ってランクの順序付けがなされた、遺伝子の転写開始部位(TSS)周辺の5つのヒストンマークの分布を調査した(図44C、44D)23。本発明者らは、活性マークH3K4me3が、両方の細胞型における発現と最も高度に相関し(H1およびK562について、それぞれ、r=0.70および0.81)、それにH3K4me2およびH3K27acが続くことを見出す(図49D、49E)。抑制性ヒストンマークH3K27me3は、発現と反相関する(H1およびK562について、それぞれ、r=−0.16および−0.53)(図49D、49E)。本発明者らは、これらの5つのマークについてのAutoCUT&RUNが転写活性を広く再現し、したがって、細胞型特異的遺伝子調節プログラムを同定するための戦略をもたらすと結論付ける。
簡易なクロマチンメトリクスには、AutoCUT&RUNデータからの遺伝子発現プログラムに対する分解能がある
本発明者らは、細胞型を比較してそれらの遺伝子調節プログラムを区別するためにAutoCUT&RUNデータに適用することができる定量的メトリクスを開発したかった。H3K4メチル化およびH3K27acは、主として活性プロモーターを示すが、H3K27me3は、遺伝子抑制度を示すため、本発明者らは、これらのマークを組み合わせて単一のモデルにすることにより、遺伝子活性についてのよりロバストなメトリクスを開発することができると推論した。RNA−seqは、細胞型特異的遺伝子発現プログラムを同定するために広範に使用されている23ため、本発明者らは、正規化されたH3K4me2、H3K27acおよびH3K27me3リードカウントを、プロモーターに関連活性スコアを割り当てるシス調節要素活性モデル(CREAM)に組み込む、重み付き線形回帰モデルを訓練するための基準として、RNA−seqデータを使用した。H3K4me3およびH3K4me1よりもH3K4me2を選択したのは、H3K4me3およびH3K4me1が相互依存性であるため、ならびにH3K4me2が近位シス調節エレメントと遠位シス調節エレメントの両方の活性のモデリングに一意的に適用可能であるためである(下記参照)。K562細胞のプロモーターに適用したとき、CREAMスコアは、RNA−seq値と非常によく相関し(r=0.83)(図45A)、したがって、ChIP−seqによりマッピングされた最大39のヒストン修飾を使用する類似のモデル(r=0.81)24に匹敵する遺伝子発現予測力を提供する。加えて、K562細胞で訓練した重み付きCREAMは、H1細胞に適用したときにもよく機能し(図50A、50B)、これは、このモデルおよびデータ品質が、特徴づけられていない細胞型にプロモータースコアを割り当てるために十分ロバストなものであることを示す。
このモデルを使用して、本発明者らは、AutoCUT&RUNが細胞型特異的活性を有するプロモーターを正確に同定するかどうかを調査した。最初に、本発明者らは、RNA−seq値を明確に割り当てることおよびCREAMスコアがH1またはK562細胞のどちらかにおいて2倍より高く濃縮されたプロモーターをコールすることができる、単一のTSSを有する遺伝子に、本発明者らの分析の焦点を合せた(図45B)。比較のために、本発明者らは、H1またはK562細胞のどちらかにおいてそれらのRNA−seq発現値に従って2倍より高く濃縮された遺伝子もコールした(図50C)。RNA−seq値から生成したプロットを用いてCREAMスコアにより同定したH1およびK562特異的遺伝子を表示することにより、本発明者らは、CREAMスコアにより細胞特異的と同定される遺伝子の多くが、RNA−seqにより見落とされ(図45B、45C)、逆もまた真である(図50C、50D)であることを見出し、これは、これらの方法が、非常に多くの遺伝子についての発現の変化に対して差異のある感度を示すことを示唆する。心強いことに、CREAMスコアとRNA−seqの両方に従って細胞型特異的とコールされる865の遺伝子には、発生調節因子が高度に濃縮されており、単独のCREAMスコアまたはRNA−seqによりコールされる遺伝子には、発生GOタームが濃縮されていない(図45D、50E〜50G)。加えて、CREAMにより細胞型特異的とコールされた2014の遺伝子のうち35個のみが、RNA−seqに従って反対の細胞型特異性を有する(図45D)。したがって、AutoCUT&RUNを適用して、細胞型特異的発生調節因子を正確に同定することができる。
AutoCUT&RUNデータが、高度に特徴付けされた転写因子の細胞型特異性を再現するかどうかを判定するために、本発明者らは、全てのプロモーターを含むように本発明者らのCREAM分析を拡張した。本発明者らは、hESC多能性ネットワークの成分(NANOG、SOX2、SALL4およびOTX2)がH1細胞において高度に濃縮されており、その一方で、造血前駆細胞運命の調節因子(PU.1、TAL1、GATA1およびGATA2)がK562細胞において高度に濃縮されていることを見出す(図45E)25、26。興味深いことに、この方法は、代替プロモーター活性(例えば、OTX2およびTAL1)の差異も同定し、したがって、所与の細胞型において発現される特定の遺伝子アイソフォームを示し(図45E)、これは、RNA−seqを使用する場合は可能でない特徴である。本発明者らは、AutoCUT&RUNが、細胞の素性の主要調節因子の同定を可能にし、したがって、細胞型をハイスループット形式で特徴付けるための強力なツールを提供すると結論付ける。
AutoCUT&RUNによる腫瘍のプロファイリング
タンパク質−DNA相互作用をプロファイリングするための旧来の方法(例えば、ChIP−seq)は、少量の出発材料を含有することが多く、急速凍結されていることが多い、臨床的に意義のある試料を、取り扱うことが一般にできない。AutoCUT&RUNが、凍結された腫瘍検体のプロファイリングに好適であるかどうかを試験するために、本発明者らは、脳幹の同様の領域から剖検されたが、それらの発がん性バックグラウンドの点で異なる、2つのびまん性正中神経膠腫(DMG)患者由来細胞系(VUMC−10およびSU−DIPG−XIII)を入手した27。これらのDMG細胞系の両方はマウスモデルにおいて異種移植片を容易に形成し、本発明者らは、AutoCUT&RUNを適用して、典型的な臨床条件下でマウスの脳に播種され、腫瘍が形成され次第摘出され凍結されたVUMC−10およびSU−DIPG−XIII異種移植片において、ヒストン修飾をプロファイリングした(図46A)。比較のために、本発明者らは、これらのDMGを細胞培養から直接採取し、それらを同じAutoCUT&RUNプレートでプロファイリングした(図46A)。この場合もやはり、本発明者らは、反復実験が極めて類似していることを見出したため、本発明者らは、それらをさらなる解析のために組み合わせた。重要なこととして、細胞培養試料は、対応する凍結異種移植片においてプロファイリングされた同じマークと高度に相関し、異種移植片組織および細胞培養試料でのAutoCUT&RUNは、同様のデータ品質を生じさせた(図46B、図51)。したがって、AutoCUT&RUNは、凍結組織試料からゲノムワイドなクロマチンプロファイルを確実に生成する。
がん患者の有効な処置群への層別化は、同じ組織に由来する腫瘍亜型の区別を必要とするため、VUMC−10およびSU−DIPG−XIII試料は、AutoCUT&RUNの診断可能性を詳しく調査するために理想的である。これらの試料にCREAMを適用することにより、本発明者らは、VUMC−10細胞とSU−DIPG−XIII細胞の間で差異のある活性を示す5,006のプロモーターを同定した(図47A)。これらの腫瘍の神経細胞起源と一致して、VUMC−10特異的プロモーターとSU−DIPG−XIII特異的プロモーターの両方には、神経発生に関与する遺伝子が有意に濃縮されている(図52A、52B)。細胞シグナル伝達に関与する遺伝子も、SU−DIPG−XIII細胞を過剰提示し(図52B);例えば、PDGFR遺伝子のプロモーターならびにそのリガンドPDGFは、SU−DIPG−XIII細胞において高度に活性である(図47A)。これは、DMGが、腫瘍成長を促進する、PDGFR−αの活性化突然変異を含有することが多いという観察と一致する。加えて、TGF−βシグナル伝達経路の成分である28、SMAD3遺伝子の1つのプロモーターは、SU−DIPG−XIII細胞において特に活性であるのに対して、2つの異なるSMAD3プロモーターは、VUMC−10細胞において活性である(図47A、図51)。これは、AutoCUT&RUNを適用して、腫瘍成長を駆動し得るシグナル伝達経路および治療剤に対する潜在的な感受性の判定の指標となる、腫瘍特異的活性を表示するプロモーターを同定することができることを示唆する。
診断ツールとして、本発明者らは、CREAMを伴うAutoCUT&RUNを使用して、細胞型および組織試料を定量的に評定し、健常および罹患細胞型の予め定義された基準マップの中にそれらを配置することができると推論した。この考えと一致して、CREAMスコアは、5,006の遺伝子プロモーターが、VUMC−10とSU−DIPG−XIIIの間で差異のある活性を表示する(図47A)のに対して、388のプロモーターしか、VUMC−10凍結異種移植片とVUMC−10培養細胞の間で差異のある活性を示さず(図47B)、1,619のプロモーターしか、SU−DIPG−XIII異種移植片とSU−DIPG−XIII培養細胞の間で差異のある活性を示さない(図52C)ことを示す。加えて、本発明者らは、H1およびK562細胞に関して4つのDMG試料のプロモーターCREAMスコアを比較したとき、DMG異種移植片は、それらの対応する細胞培養試料と群を抜いて類似していることを見出す(図47C)。本発明者らは、Auto CUT&RUNを、細胞の素性を凍結腫瘍試料に割り当てるための信頼性のある方法として使用することができると結論付ける。
細胞型特異的エンハンサーのハイスループットマッピング
遺伝子プロモーターの細胞型特異的活性は、エンハンサーなどの遠位シス調節エレメントからのシグナルを組み込むことにより確立されることが多い1、2。プロモーターと同様に、エンハンサーもH3K4me2を表示し29、活性エンハンサーは、H3K27acによって通常は示されるのに対して、抑制エンハンサーは、H3K27me3によって示される22、30、31。これは、プロモーターCREAMスコアを割り当てるために本発明者らが使用したAutoCUT&RUNプロファイルが、細胞型特異的エンハンサーの同定も可能にするはずであることを示唆する。この可能性を調査するために、本発明者らは、先ず、本発明者らのH1データを、活性プロモーターとエンハンサーの両方が濃縮されている、ATAC−seqにより生成された利用可能なクロマチン接近可能性マップと比較した32、33。本発明者らがプロファイリングしたマークのうち、本発明者らは、H3K4me2ピークが、ATAC−seqと最高のオーバーラップ(図48A、図53A)を示し、36,725/52,270のATAC−seqピーク(約70%)を同定することを見出す。興味深いことに、H3K4me2はまた、ATAC−seqプロファイルでピークとしてコールされなかった追加の71,397部位において高頻度に見られる(図48A、図53A)。これらのH3K4me2特異的部位の多くは、低いが検出可能なATAC−seqシグナルを示し(図53B)、これは、それらが、抑制プロモーターおよびエンハンサーに対応し得ることを示す。この解釈と一致して、平均してH3K4me2+/ATAC−TSSはATAC+TSSより高いH3K27me3シグナルを有する(図53)。H3K4me2+/ATAC+ピークを、注釈付きTSSとオーバーラップするものと、オーバーラップしないものとに分割することによって、本発明者らは、H3K4me3がプロモーターにおいてはるかに濃縮されている一方で、H3K4me1が遠位調節エレメントにおいてより濃縮されている(図48B、48C、図53D)ことを見出し、これは、これらの遠位調節エレメントにはエンハンサーが濃縮されている可能性が高いことを示唆する22、34。したがって、AutoCUT&RUNによるH3K4me2の部位のマッピングは、遺伝子発現プログラムを制御する活性および抑制シス調節エレメントのレパートリーを定義するための高感度法を提供する。
最後に、本発明者らは、AutoCUT&RUNを使用して細胞型特異的エンハンサーを同定することができるかどうかを調査した。推定的エンハンサー部位の数を拡張するために、本発明者らは、本発明者らの全ての試料からH3K4me2プロファイルに関してコールされた非TSSピークのリストをコンパイルした。本発明者らの線形回帰モデルを使用して、次いで、本発明者らは、これらのエレメントにエンハンサーCREAMスコアを割り当て、異なる細胞型間のそれらの相関を調査した。本発明者らは、DMG細胞培養試料のエンハンサーCREAMスコアと異種移植片のエンハンサーCREAMスコアが、高度に相関し(SU−DIPG−XIIIおよびVUMC−10細胞において、それぞれ、r=0.75および0.87)(図48D)、およびSU−DIPG−XIII細胞のエンハンサーCREAMスコアが、VUMC−10細胞と弱い正の相関(例えば、r=0.19)を示すことを見出し、これは、それらの共通の神経起源にもかかわらず細胞型特異的な差異を表す可能性が高い。例えば、SOX2多能性遺伝子座におけるエンハンサーは、以前に示唆されている35ように、VUMC−10細胞より原始的な神経幹細胞型に似ているSU−DIPG−XIII細胞と一致して、SU−DIPG−XIII細胞とVUMC−10細胞の間で差異を表示する(図48E)。したがって、AutoCUT&RUNは、細胞型および組織試料を層別化するためのストリンジェントな方法を提供する。
考察
本発明者らは、Illuminaライブラリー調製のためのクロマチン断片の直接ライゲーションを開発することにより、CUT&RUN技法を自動化プラットフォームに適応させ、洗浄ステップおよびライブラリー精製のために磁気分離を実行した。AutoCUT&RUNは、抗体標的化クロマチンタンパク質の96のゲノムワイドなプロファイルをちょうど2日で生成し、したがって、クロマチンランドスケープを調べるための研究のスループットおよび可能なスケールを劇的に増大させる。本発明者らは、3つのヒストン修飾(H3K27ac、H3K27me3およびH3K4me2)のプロファイリングだけで、プロモーターおよびエンハンサーの細胞型特異的活性を判定するのに十分であることを示し、したがって、異なる細胞型のエピジェネティックな調節を比較するための強力な定量的メトリクスを提供する。自動化ワークフローは、実験間の技術的なばらつきを低減させて、生物学的反復実験からおよび異なる試料タイプから一貫したプロファイルを生成する。
AutoCUT&RUNの最適化を継続するために、ハードウェア変更およびコンピュータによる開発を構想することができるだろう。様々な抗体収集物をスクリーニングすることにより、AutoCUT&RUNを使用して効率的にプロファイリングすることができる核タンパク質のレパートリーを劇的に拡張することになる。加えて、現行のAutoCUT&RUNプロトコールを、人気のある液体ハンドリングロボット用に最適化するが、可逆的磁気サーモサイクラーブロックを組み込んでいるカスタムロボットは、CUT&RUN反応およびライブラリー調製を適所で行うことを可能にし、したがって、さらにいっそうプロトコールを簡素化することになる。最後に、細胞型を区別するメトリクスを、データのさらなる態様を組み込むことによって、例えば、エンハンサー活性とプロモーター活性の両方の組合せを使用することによって、向上させることができるだろう。
AutoCUT&RUNによる凍結組織試料のプロファイリングの卓越した再現性には、エピジェネティック医学分野を変換する可能性がある12。患者診断に現在使用されている他のゲノミクスアプローチと比較して、AutoCUT&RUNには、罹患細胞内のクロマチンタンパク質をプロファイリングする特有の能力がある。例えば、クロマチンタンパク質中の発がん性融合体によって引き起こされるがんを、AutoCUT&RUNによってプロファイリングして、それらのクロマチンランドスケープに基づく分子診断を提供することができ、それと同時に、新規突然変異タンパク質により破壊される遺伝子座をマッピングすることができるだろう。これは、患者層別化の強力なツールを提供し、クロマチンをモジュレートする治療薬、例えば、ヒストンデアセチラーゼまたはヒストンメチルトランスフェラーゼ阻害剤が、それらの所期の効果を有しているかどうかについての直接的リードアウトも提供する。
方法
AutoCUT&RUN
手短に述べると、細胞または組織試料をコンカナバリンA被覆磁気ビーズ(Bangs Laboratories、カタログ番号BP531)に結合させ、ジギトニンで透過処理し、以前に記載された14ようなタンパク質特異的抗体と結合させる。次いで、試料を96ウェルプレートに整列させ、洗浄ステップ中に試料を磁気分離するための96S Super Magnet Plate(Alpaqua SKU A001322)と、冷却ユニットへのルートが設けられているPCRプレート用のAluminum Heat Block Insert(V&P Scientific,Inc.VP741I6A)とを装備したBeckman Biomek FX液体ハンドリングロボットで処理して、2mM CaClの添加後に0〜4℃でMNase消化反応を行う。次いで、後続の酵素的反応のためのMg2+添加を可能にするEGTAの添加によって、9分後にMNase消化反応を停止させる。このステップによって、ライブラリー調製前のDNA精製の必要が回避される。次いで、消化中に上清に放出されたクロマチン断片を、末端修復およびバーコード化Yアダプターとのライゲーションのための基質として使用する。ライゲーションの前に、A−テーリングステップを58℃で行って、ライブラリー内のサブヌクレオソーム断片を保存する36、37。末端修復およびアダプターライゲーション反応を別々のサーモサイクラーで行った。次いで、クロマチンタンパク質をプロテイナーゼKで消化し、アダプターとライゲーションされたDNA断片を、PCR前Ampureビーズクリーンアップとサイズ選択のラウンドを2ラウンド使用してBiomeck FXで精製した。KAPA PCRキット(KAPA カタログ番号KK2502)を使用してサーモサイクラーでPCR濃縮反応を行った。Biomeck FXでPCR後Ampureビーズクリーンアップとサイズ選択のラウンドを2ラウンド行って、望ましくないタンパク質および自己ライゲーションしたアダプターを除去した。AutoCUT&RUNライブラリーのサイズ分布をAgilent 4200 TapeStationで分析し、ライブラリー収量をQubit Fluorometer(Life Technologies)によって定量した。Fred Hutchinson Cancer Research Center Genomics Shared ResourceでのIllumina HiSeq 2500プラットフォームを用いる2レーンフローセルでのペアードエンド25×25bpシーケンシングのために、等モル濃度でレーンごとに最大24のバーコード化AutoCUT&RUNライブラリーをプールした。
抗体
本発明者らは、ウサギ抗CTCF(1:100、Millipore カタログ番号07−729)、ウサギ抗NPAT(1:100、Thermo Fisher カタログ番号PA5−66839)、ウサギ抗H3K4me1(1:100、Abcam カタログ番号ab8895)、ウサギ抗H3K4me2(1:100、Millipore カタログ番号07−030)、ウサギ抗H3K4me3(1:100、Active Motif カタログ番号39159)、ウサギ抗H3K27me3(1:100、Cell Signaling Tech カタログ番号9733S)を使用した。pAMNaseは、多くのマウス抗体と効率的に結合しないので、本発明者らは、ウサギ抗マウスIgG(1:100、Abcam、カタログ番号ab46540)をアダプターとして使用した。ウサギ抗H3K27ac(1:50、Millipore カタログ番号MABE647)を使用して、H1およびK562細胞においてAutoCUT&RUNによって、ならびにVUMC−10およびSU−DIPG−XIII細胞系において手動で、H3K27acをプロファイリングした。ウサギ抗H3K27ac(1:100、Abcam カタログ番号ab45173)を使用して、VUMC−10およびSU−DIPG−XIII細胞系および異種移植片において、H3K27acをAutoCUT&RUNによってプロファイリングした。
細胞培養
ヒトK562細胞をATCC(Manassas、VA、カタログ番号CCL−243)から購入し、供給業者のプロトコールに従って培養した。H1 hESCを、WiCell(カタログ番号WA01−ロット番号WB35186)から入手し、Matrigel(商標)(Corning)被覆プレートにおいてmTeSR(商標)1サプリメント(STEMCELL Technologies カタログ番号85852)を含有するmTeSR(商標)1基本培地(STEMCELL Technologies カタログ番号85851)で培養した。小児DMG細胞系VUMC−DIPG−10(Esther Hulleman、VU University Medical Center、Amsterdam、Netherlands)およびSU−DIPG−XIII(Michelle Monje、Stanford University、CA)を、関連機関から研究試料提供契約で入手した。NS−A増殖サプリメント(STEMCELL Technologies、カタログ番号05751)、100U/mLのペニシリン/ストレプトマイシン、20ng/mLの上皮増殖因子(PeproTech、カタログ番号AF−100−15)および20ng/mLの線維芽細胞増殖因子(PeproTech、カタログ番号100−18B)を含有する、NeuroCult NS−A基本培地中で、細胞を維持した。
患者由来異種移植片
全てのマウス研究は、Institute of Animal Care and Use Committeeによって承認されたプロトコールに従って行った。NSGマウスは、社内で飼育し、腫瘍発生前に2〜3月齢であった。頭蓋内異種移植片を、3uLに懸濁させた100,000細胞の人字縫合の側方2mmおよび後方1mmへの定位注射によって樹立した。有症状マウスを安楽死させ、それらの腫瘍を分析のために切除した。
アノテーションおよびデータ分析
本発明者らは、Bowtie2バージョン2.2.5を、オプション:−−local−−very−sensitive−local−−no−unal−−no−mixed−−no−discordant−−phred33−I 10−X700で使用して、ペアードエンドリードのアラインメントを行う。スパイクイン断片のマッピングには、本発明者らは、実験ゲノムとスパイクインDNAのものとの交差マッピングを回避するために、−−no−overlap−−no−dovetailオプションも使用する。BedToolおよびUCSC bedGraphToBigWigプログラムを使用して、ファイルを処理した。
様々な試料のゲノムワイドな分布間の相関関係を調査するために、ゲノムの500bpのビンを生成して、おおよそ6,000,000のエントリーを有するアレイを作成した。各々のビンにおけるリードをカウントし、これらのビンカウントのlog2変換した値を使用して、異なる実験間のPearson相関スコアを決定した。次いで、階層的クラスタリングをPearsonスコア行列で行った。
プロモーター周辺のヒストンマークプロファイルの分布を調査するために、ビルドhg19についての遺伝子の基準リストをUCSCテーブルブラウザ(genome.ucsc.edu/cgi-bin/hgTables)からダウンロードし、さらなる分析のために遺伝子転写の方向性に従って方向性を持たせた。互いに1kb以内にTSSを有する遺伝子を除去し、ミトコンドリアゲノムにマッピングする遺伝子も除去して、32,042のTSSのリストを作成した。RNAシーケンシングデータは、H1およびK562細胞のENCODEプロジェクト(ENCSR537BCGおよびENCSR000AEL)から得た。featureCounts(http://bioinf.wehi.edu.au/featureCounts/)を使用してRNAリードをカウントし、マッピングされたリード1,000,000当たりの1キロベース当たり断片(Fragments Per Kilobase per Million mapped reads)(FPKM)に変換し、対応するTSSに遺伝子発現値として割り当てた。H1細胞についてのATACシーケンシングデータをGene Omnibus Expression(GEO)(GSE85330)から入手し、Bowtie2を使用してhg19にマッピングした。ミトコンドリアDNAは、リードの約50%を占め、この研究ではそれを除去した。
CREAMアルゴリズムの訓練
プロモーターにおけるヒストン修飾データのRNA−seq値へのフィッティングの精度を保証するために、1つより多くのプロモーターを有する遺伝子を、前に生成したTSSリストから除去した。遺伝子RPPH1およびRMRPは、H1細胞において極めて高レベルで発現されため、外れ値とみなし、回帰を歪ませることを回避するために除去し、その結果、n=12,805遺伝子のリストを得た。
Cによって示される、各々のヒストンマークについてのこれらのプロモーターに、関連CUT&RUNシグナルを割り当てるために、TSSの+/−1kbの塩基対リードカウントを、スコア化するプロモーターに関するシーケンシング深度と調査したプロモーターの総数の両方によって正規化した。前者の正規化は、シーケンシング深度と抗体間の感度の相違の両方の考慮であり、後者の正規化は、各々のエレメントの相対的な重みを変化させることなく異なる数のシス調節エレメントにモデルを適用することができるように含まれる。FPKM値をRNA−seqに使用した。
RNA−seq発現値にフィッティングしたヒストンデータの線形結合:y=C+・・・+C(式中、Cは、各々のヒストン修飾についての重みであり、xは、x=ln(C+α)によって示され、ここで、Cは、上記の正規化塩基対カウントであり、αは、発現のない遺伝子に対応するための擬似カウントである)を使用して、線形モデルをトレーニングした。RNA−seq値を、同様に、y=ln(FPKM+αy,i)として同様に変換した。対数変換を使用してデータを線形化した。次いで、最小化ステップを行って、擬似カウントと、CUT&RUNデータとRNA−seq間の回帰線を最大化する各々のヒストン修飾についての重みとを算出した。
本発明者らは、ヒストンマークH3K27ac、H3K27me3およびH3K4me2が最少冗長情報を与えると予想した。K562についての最適化した3つのヒストンマークモデルは、
=0.858ln(CH3K27ac+0.058)−0.615ln(CH3K27me3+0.0816)+1.609ln(CH3K4me2+0.054)
によって記述される。この方程式を使用して、全てのCREAMスコアを生成した。
クロマチンドメインのコーリング
H1およびK562細胞の全体的クロマチンランドスケープを比較するために、IgG CUT&RUN対照と比較して領域が濃縮されたカスタムスクリプトを使用して、クロマチンドメインをコールした。マーク間の濃縮領域を比較し、BedToolの交差を使用してオーバーラップを同定した。オーバーラップしている濃縮領域内の塩基対の数によって、オーバーラップしている領域を定量し、これらを使用してベン図を生成した。
ベン図
全てのベン図は、Whitehead Institute(barc.wi.mit.edu/tools/venn/)から公表されているBaRCウェブツールを使用して、生成した。
CREAMスコアを使用する細胞型特異的プロモーター活性の算出
生プロモーターCREAMスコアは、一般に、−10〜10の範囲に入り、ここで、数が小さいほど、小さい転写活性を示す。異なる細胞型を比較する際にデータ中の外れ値を考慮するために、標準偏差2以内のCREAMスコアをz正規化した。負およびゼロの値は、変化倍率の算出を複雑にするため、データを、最も負である値によってxおよびy方向にシフトさせた。様々な細胞型についてのプロモーターCREAMスコア間の倍率差を、逆log10正規化CREAMスコアを互いに割ることにより算出した。いずれの場合も保守的な2倍カットオフを使用して細胞型特異的プロモーターを決定した(図45B、45E、47A、47B)。遺伝子の各々のリストを遺伝子オントロジー(geneontology.org/)により分類して、統計的に濃縮された生物学的プロセスを同定した。
細胞型間の相対的類似性をそれらのプロモーター活性に基づいて調査するために、>1kb離れている全てのプロモーターについてのCREAMスコアを使用してアレイを生成し、試料のペアワイズ相関ごとにSpearman相関を算出した。Spearman相関値の階層的クラスタリングを使用して、細胞型間の相対的類似性を可視化した。
AutoCUT&RUNおよびATAC−seqデータに関するピークコーリング
AutoCUT&RUNによってプロファイリングした生物学的反復実験は、高度に相関することが明らかになった(図43B)ため、反復実験を結合した後、ピークをコールした。ツールMACS2を使用してピークをコールし、次のコマンドをコマンドライン上で使用した:「macs2 callpeak−t file−f BEDPE−n name−q 0.01−−keep−dup all−g 3.137e9」。0.01のFDRカットオフを使用した。
CREAMスコアからの細胞型特異的DRE活性の算出
ヒトゲノムにおける遠位シス調節エレメントのリストをアセンブリするために、本発明者らは、「AutoCUT&RUNおよびATAC−seqに関するピークコーリング」方法セクションで説明した同じフラグを使用してMACS2を使用して、本発明者らの試料の各々からのH3K4me2プロファイルに関してピークをコールした。TSSと推定的エンハンサーとを区別するために、アノテーション付きTSSから<2.5bp離れているピークを除去し、プロモーター活性を予測するためにトレーニングしたアルゴリズムを使用してこれらの推定的エンハンサー周辺+/−1kbのウインドウにCREAMスコアを割り当てた。試料間のエンハンサーCREAMスコアを比較する相関行列を、試料間のプロモーターCREAMスコアを比較する相関行列と同じ方法で生成した。
実施例7のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)
1 Levine, M., Cattoglio, C. & Tjian, R. Looping back to leap forward: transcription enters a new era. Cell 157, 13−25, doi:10.1016/j.cell.2014.02.009 (2014).
2 Heinz, S., Romanoski, C. E., Benner, C. & Glass, C. K. The selection and function of cell type−specific enhancers. Nat Rev Mol Cell Biol 16, 144−154, doi:10.1038/nrm3949 (2015).
3 Reinberg, D. & Vales, L. D. Chromatin domains rich in inheritance. Science 361, 33−34, doi:10.1126/science.aat7871 (2018).
4 Henikoff, S. & Greally, J. M. Epigenetics, cellular memory and gene regulation. Curr Biol 26, R644−648, doi:10.1016/j.cub.2016.06.011 (2016).
5 Schwartzentruber, J. et al. Driver mutations in histone H3.3 and chromatin remodelling genes in paediatric glioblastoma. Nature 482, 226−231, doi:10.1038/nature10833 (2012).
6 Hu, D. & Shilatifard, A. Epigenetics of hematopoiesis and hematological malignancies. Genes Dev 30, 2021−2041, doi:10.1101/gad.284109.116 (2016).
7 Mackay, A. et al. Integrated Molecular Meta−Analysis of 1,000 Pediatric High−Grade and Diffuse Intrinsic Pontine Glioma. Cancer Cell 32, 520−537 e525, doi:10.1016/j.ccell.2017.08.017 (2017).
8 Cotney, J. et al. The autism−associated chromatin modifier CHD8 regulates other autism risk genes during human neurodevelopment. Nat Commun 6, 6404, doi:10.1038/ncomms7404 (2015).
9 Lambert, S. A. et al. The Human Transcription Factors. Cell 172, 650−665, doi:10.1016/j.cell.2018.01.029 (2018).
10 Regev, A. et al. The Human Cell Atlas. Elife 6, doi:10.7554/eLife.27041 (2017).
11 Rozenblatt−Rosen, O., Stubbington, M. J. T., Regev, A. & Teichmann, S. A. The Human Cell Atlas: from vision to reality. Nature 550, 451−453, doi:10.1038/550451a (2017).
12 Feinberg, A. P. The Key Role of Epigenetics in Human Disease Prevention and Mitigation. N Engl J Med 378, 1323−1334, doi:10.1056/NEJMra1402513 (2018).
13 Teytelman, L., Thurtle, D. M., Rine, J. & van Oudenaarden, A. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. Proc Natl Acad Sci U S A 110, 18602−18607, doi:10.1073/pnas.1316064110 (2013).
14 Skene, P. J., Henikoff, J. G. & Henikoff, S. Targeted in situ genome−wide profiling with high efficiency for low cell numbers. Nat Protoc 13, 1006−1019, doi:10.1038/nprot.2018.015 (2018).
15 Skene, P. J. & Henikoff, S. An efficient targeted nuclease strategy for high−resolution mapping of DNA binding sites. Elife 6, doi:10.7554/eLife.21856 (2017).
16 Hainer, S. J., Boskovic, A., Rando, O. J. & Fazzio, T. G. Profiling of pluripotency factors in individual stem cells and early embryos. bioRxiv, doi:doi.org/10.1101/286351 (2018).
17 Zhao, J. et al. NPAT links cyclin E−Cdk2 to the regulation of replication−dependent histone gene transcription. Genes Dev 14, 2283−2297 (2000).
18 Narendra, V. et al. CTCF establishes discrete functional chromatin domains at the Hox clusters during differentiation. Science 347, 1017−1021, doi:10.1126/science.1262088 (2015).
19 Hawkins, R. D. et al. Distinct epigenomic landscapes of pluripotent and lineage−committed human cells. Cell Stem Cell 6, 479−491, doi:10.1016/j.stem.2010.03.018 (2010).
20 Gaspar−Maia, A., Alajem, A., Meshorer, E. & Ramalho−Santos, M. Open chromatin in pluripotency and reprogramming. Nat Rev Mol Cell Biol 12, 36−47, doi:10.1038/nrm3036 (2011).
21 Bernstein, B. E. et al. A bivalent chromatin structure marks key developmental genes in embryonic stem cells. Cell 125, 315−326, doi:10.1016/j.cell.2006.02.041 (2006).
22 Rada−Iglesias, A. et al. A unique chromatin signature uncovers early developmental enhancers in humans. Nature 470, 279−283, doi:10.1038/nature09692 (2011).
23 Consortium, E. P. An integrated encyclopedia of DNA elements in the human genome. Nature 489, 57−74, doi:10.1038/nature11247 (2012).
24 Karlic, R., Chung, H. R., Lasserre, J., Vlahovicek, K. & Vingron, M. Histone modification levels are predictive for gene expression. Proc Natl Acad Sci U S A 107, 2926−2931, doi:10.1073/pnas.0909344107 (2010).
25 Martello, G. & Smith, A. The nature of embryonic stem cells. Annu Rev Cell Dev Biol 30, 647−675, doi:10.1146/annurev−cellbio−100913−013116 (2014).
26 Gottgens, B. Regulatory network control of blood stem cells. Blood 125, 2614−2620, doi:10.1182/blood−2014−08−570226 (2015).
27 Nagaraja, S. et al. Transcriptional Dependencies in Diffuse Intrinsic Pontine Glioma. Cancer Cell 31, 635−652 e636, doi:10.1016/j.ccell.2017.03.011 (2017).
28 Massague, J. & Chen, Y. G. Controlling TGF−beta signaling. Genes Dev 14, 627−644 (2000).
29 Heintzman, N. D. et al. Distinct and predictive chromatin signatures of transcriptional promoters and enhancers in the human genome. Nat Genet 39, 311−318, doi:10.1038/ng1966 (2007).
30 Creyghton, M. P. et al. Histone H3K27ac separates active from poised enhancers and predicts developmental state. Proc Natl Acad Sci U S A 107, 21931−21936, doi:10.1073/pnas.1016071107 (2010).
31 Heintzman, N. D. et al. Histone modifications at human enhancers reflect global cell−type−specific gene expression. Nature 459, 108−112, doi:10.1038/nature07829 (2009).
32 Liu, Q. et al. Genome−Wide Temporal Profiling of Transcriptome and Open Chromatin of Early Cardiomyocyte Differentiation Derived From hiPSCs and hESCs. Circ Res 121, 376−391, doi:10.1161/CIRCRESAHA.116.310456 (2017).
33 Andersson, R. et al. An atlas of active enhancers across human cell types and tissues. Nature 507, 455−461, doi:10.1038/nature12787 (2014).
34 Calo, E. & Wysocka, J. Modification of enhancer chromatin: what, how, and why? Mol Cell 49, 825−837, doi:10.1016/j.molcel.2013.01.038 (2013).
35 Filbin, M. G. et al. Developmental and oncogenic programs in H3K27M gliomas dissected by single−cell RNA−seq. Science 360, 331−335, doi:10.1126/science.aao4750 (2018).
36 Liu, N. et al. Direct Promoter Repression by BCL11A Controls the Fetal to Adult Hemoglobin Switch. Cell 173, 430−442 e417, doi:10.1016/j.cell.2018.03.016 (2018).
37 Neiman, M. et al. Library preparation and multiplex capture for massive parallel sequencing applications made efficient and easy. PLoS One 7, e48616, doi:10.1371/journal.pone.0048616 (2012).
(実施例8)
単一細胞CUT&RUNでの複合組織のエピゲノムプロファイリング
単一細胞分析は、発生の分子的特徴付けのための主要なアプローチになりつつあり、単一細胞バーコード化技術の最近の進歩は、複合組織の遺伝子発現およびDNA接近可能性プロファイリングに応用されている。しかし、RNA−seqは、調節エレメントを特徴付けることもマッピングすることもできず、ATAC−seqは、非常に接近しやすいDNAの部位に限定され、ChIP−seqは、単一細胞戦略を真剣に探求するには効率が悪すぎる。しかし、CUT&RUN抗体繋留ヌクレアーゼ法は、効率および分解能の点でChIP−seqを何桁も上回ってきている。これは、ITISにも当てはまる。本明細書で開示するように、元々のCUT&RUN法は、組織全体および選別された細胞に拡大適用でき、したがって、ほんの100細胞で高いデータ品質を達成するため、本発明者らは、ハイスループット自動化パイプラインを開発した。
単一細胞技術の最近の進歩を活用するために、2つの明確に異なる単一細胞CUT&RUN(scCUT&RUN)戦略を開発する。第1に、市販の自動化ナノウェルプレートシステムを、scCUT&RUN用の何千もの無傷細胞の整列、バーコード化および増幅に適応させる。この戦略を適用するために、繋留MNaseにより生成された断片を無傷細胞内のシーケンシングアダプターにライゲーションし、続いて単一細胞インデキシング用のナノウェルプレート上に整列させる。第2に、本発明者らは、バルク細胞集団のスプリットプール化を適用して、96ウェルプレートプールで細胞のコンビナトリアルバーコード化を達成する。プレートからの細胞をプールし、それらを新たな96ウェルプレートに再整列させた後、バーコードライゲーション、再プール化および再整列の1ラウンドまたはそれより多くのラウンドを行う。CUT&RUNを両方の人気のある単一細胞バーコード戦略に適応させることにより、本発明者らは、クロマチンプロファイリングの状況下で単一細胞プロファイリングについてのそれらの明確に異なる利点を比較することができる。評価のために、ヒトK562細胞およびショウジョウバエS2細胞を使用し、選択されたヒストン修飾に対する、RNAポリメラーゼII修飾に対する、および構成的転写因子に対する抗体も使用する。予備研究では、両方の戦略は、Illuminaアダプターのネイティブin situライゲーションにより、個々の核内にDNA断片を保持しつつ、CUT&RUNに従って機能することを示した。核の完全性を維持することにより、本発明者らは、個々の細胞からの断片へのインデキシングが可能になり、一連の特有のバーコードが、プールドシーケンシングから単一細胞ランドスケープを構築する。
均一細胞系から不均一細胞集団および複合組織に移行して、scCUT&RUNをヒトCD34+初代造血細胞およびショウジョウバエ精巣に適用する。本発明者らの基本CUT&RUNプロトコールの改良は、無傷ショウジョウバエ成虫原基および脳を十分に透過処理し、したがって、データ品質を低下させる可能性があり得る組織処理からの損傷を回避することが分かる。FACS単離の後、高いデータ品質でCUT&RUNを行うことができる。CD34+リンパ系細胞のFACS単離部分集団、ならびに無傷ショウジョウバエ生殖系列組織とフロー選別されたショウジョウバエ生殖系列組織の両方を、CUT&RUNおよびアダプターライゲーションに使用し、その後、ナノ分注もしくはスプリットプール化または両方をインデキシングのために行う。調節エレメントおよび遺伝子発現の発生上の変化をこれら2つのシステムで評定することができる。
切断の塩基対予測を活用するCUT&RUNデータ用の計算ツールを開発する。1つは、ピーク頂点をコールするために断片長を使用し、切断の塩基対分解能を維持するため、平滑化のない、濃縮を判定するための経験的な手順を使用する、新規ピークコーリングアルゴリズムの最適化および評価であろう。第2のツールは、CUT&RUNプロファイリングにより同定可能なヌクレオソーム破壊の一般的なクロマチンシグネチャーについての本発明者らの最近の記述に基づく、エンハンサーおよびプロモーター活性を予測するために断片長情報を使用するアルゴリズムの開発であろう。これらの方法は、DNA断片長に固有の構造情報の活用を可能にする。本発明者らは、細胞型を区別するためにRNA−seqに広く使用されている単一細胞次元圧縮ツールを使用することとし、エンハンサー−プロモーター−遺伝子の組合せを同定するためにカスタム分析ソフトウェアを開発することとする。
ヒト遺伝子調節エレメントは、明らかにされないままである。ヒトゲノムによりコードされるタンパク質の約10%は転写因子(TF)であり、これらは、それらの作業部位への配列特異的結合により遺伝子を調節する。調節エレメントへの転写因子の結合は、発生および重要な生理プロセスを制御する遺伝子調節階層の頂点に立つ。TF結合の異常調節は、多くのヒト疾患の肝要な駆動因子であり、TF結合部位(TFBS)を編集する現行の努力は、疾患介入に向けた有望な道筋である。しかし、TFBSのマッピングの現行の制約は、これらのツールの臨床応用に支障を来し得る。例えば、鎌状赤血球貧血およびβ−サラセミアを有する患者を処置するための強力な戦略は、欠陥成人型ベータグロビン発現により引き起こされる症状を軽減するために胎児型ガンマグロビン遺伝子を「再び目覚めさせる」ことであろう。ガンマグロビン遺伝子とベータグロビン遺伝子の間の発生上のスイッチを担当する抑制性転写因子の結合部位を編集することによって、これを果たすことができよう。ごく最近まで、TFをマッピングするための人気のある方法の制約のため、リプレッサーTF BCL11Aの結合部位を同定することができなかった。その肝要な結合部位が、BCL11AのCUT&RUNマッピングによって容易に同定された[1];これは、最も多く見られるヒト遺伝性疾患の1つについての症状を軽減するための編集戦略を直ちに可能にし、実際、この結合部位の突然変異を有する鎌状赤血球症患者は、赤血球の鎌状赤血球化の減弱を示す。
調節エレメントのChIP−seqマッピングの制約。クロマチン免疫沈降(ChIP)は、クロマチン生物学において最も広く使用されている技法の1つとなっている。しかし、ChIPを行う方法は、30年よりもっと昔に初めて記載されて以来、ほとんど変わっていない[3]。それどころか、ChIPを使用する莫大な成功は、リードアウト技術の驚異的な向上に起因した。リードアウトプラットフォームは、サザンブロット法から、定量的PCRへ、マイクロアレイへ、およびこの10年をかけてハイスループットシーケンシング(ChIP−seq)へと進化してきた[4〜7]。単独のENCODEプロジェクトを構成する2000を超えるChIP−seq実験を伴う、ChIP−seqが、ゲノム配列を理解するための基本的戦略になってきた。
この巨額の投資にもかかわらず、ChIPに使用されるクロマチン架橋およびせん断戦略には3つの大きな制約がある[8〜12]。1)架橋は、エピトープマスキングにつながり、これは、免疫沈降効率を低下させ、シグナル対ノイズ比を低下させる。例えば、NIH Protein Capture Reagents Program(PCRP)は、1406の高度に検証された、免疫沈降および/または免疫ブロット法グレードの、マウスモノクローナル抗体(mAb)〜736のヒト転写因子の収集物を生成した[13]。このコンソーシアムは、一次検証ツールとしてHuProtヒトタンパク質マイクロアレイを使用して、それらのコグネイト標的に対して高い特異性を有するmAbを同定した。
それにもかかわらず、305のmAbの試料のうちの50(16%)しか、ENCODE基準に基づいてChIP−seqは良好であると判定されなかった。2)架橋はクロマチンを不溶性にするため、ChIPは、通常は、クロマチンをせん断するために超音波処理を使用する。超音波処理は、200〜300bpのクロマチン断片を生じさせるが、典型的なクロマチン関連タンパク質のフットプリントは約20bpであるため、実際の結合部位は、ChIPマッピングからコンピュータによって推測しなければならない。したがって、ChIPの最も広く使用されているプロトコールは、シーケンシングリードアウトで可能な塩基対分解能の活用には遠く及ばない。3)超音波処理による架橋クロマチンの可溶化は、劇的にバイアスを受ける。ChIPを注意深く評定したとき、多くの「高ChIP可能」領域[8]、「ファントム」ピーク[10]、および他の偽陽性アーチファクトが、一般に見出される[9、12]。手短に述べると、ChIP−seqは、低い信頼度、不良な収量、低い分解能、および低い精度によって阻まれる。ChIPの最新バージョンは、エキソヌクレアーゼ処置で向上した分解能を有する(ChIP−exo[4]およびChIP−nexus[7])が、これらの方法は、面倒であり、非効率的である。ChIPに伴うこれらの問題は、代替エピゲノムマッピング方法論の必要性を強調する。
CUT&RUN。新たなエピゲノムプロファイリング戦略の開発によるChIP−seqの制限[5、14〜16]。CUT&RUNとともに、因子特異的抗体を使用してミクロコッカスヌクレアーゼ(MNase)をクロマチンに繋留する。次いで、MNaseを活性化してTFBS周辺でDNAを切断し、その結果、DNAがペアードエンドDNAシーケンシング用の上清に放出される(図1A)。CUT&RUNは、可溶化および免疫沈降ステップを排除し、したがって、ChIPに勝る固有の利点を有する。クロマチン因子への結合およびDNA切断のためのステップ全てを無傷核内で行い、その後、簡易なDNA精製を行うので、CUT&RUNの収量および特異性は、ChIP−seqについてのものよりはるかに高い。CUT&RUNは、簡易であり、効率的であり、対費用効果が高く、ChIP−seqに完全に置き換わる可能性がある。
CUT&RUNの範囲の拡張。本発明者らは、先ず、CUT&RUNを使用して、酵母およびヒトクロマチンタンパク質およびTFの結合部位を同定し、不溶性出芽酵母セントロメアのヒストン組成を決定し、架橋もライゲーションも用いずにCTCF架橋部位を正確にマッピングした[16]。その後、本発明者らは、他のトピックを調査するためにCUT&RUNの範囲を拡張してきた。これらは、高等真核生物のセントロメア、クロマチン構造および転写調節を含む:1)CUT&RUNに続いて塩分画を用いて、本発明者らは、ヒトセントロメアが、高均一アレイ内の異なるα−サテライトダイマー単位上の内部動原体複合体の予想外の構造および立体配座多様性を示すことを発見した[18]。2)本発明者らはまた、CUT&RUNを使用して、CENP−Bの結合部位を欠いている、旧世界ザルのα−サテライトモノマー内の機能性セントロメア(「CENP−Bパラドックス」[19])を同定した。3)転写により産生されるヌクレオソームの非対称巻き戻しを説明する中で、本発明者らは、調節エレメントにおいてCUT&RUNにより生成される断片を使用して、細胞およびさらには無細胞ヒト血漿DNAにおいてヌクレオソーム巻き戻しの同じシグネチャーがヌクレオソームリモデリングにより生成され得ることを示した[20]。断片位置および断片長に基づく調節エレメントの本発明者らの同定は、CUT&RUNの肝要な特徴である。
多くのBCL11A抗体は何年にもわたってChIP−seqについては不成功に終わり、その結果、胎児型から成人型へのスイッチが、遺伝子座制御領域(LCR)内のはるか上流に存在するモデルに至った。著者らは、リプレッサーが、ChIP−seqがタンパク質結合マイクロアレイによって同定した同じTGACCAモチーフに優先的に結合したことを、ChIP−seqが示すことができなかった抗体(図54、上部)およびそれが、胎児型ガンマグロビンプロモーター内で21bpしか離れていない2つのモチーフのうちの1つに結合したことを、ChIP−seqが示すことができなかった抗体(図54、中央)とともに、CUT&RUNを使用した。このモチーフは、遺伝性高胎児ヘモグロビンの良性状態を有する個体では突然変異しており、著者らは、この部位が、それを編集することおよびBCL11Aがもはや結合していなことを示すことによって、抑制を制御することを、さらに証明した(図54、下部)。
単一細胞における調節エレメントを同定するために、単一細胞ナノウェルインデキシングおよびスプリットプールコンビナトリアルインデキシングという、2つの明確に異なるバーコード化戦略を使用することができ、これらの戦略は、両方とも、単一細胞RNA−seq(scRNA−seq)のための使用に大いに成功している[28、29]。
CUT&RUNのChIP−seqとの比較。本発明者らは、エピゲノムマッピング法の性能を、1)因子結合部位に対するそれらの分解能、および2)それらのシグナル対ノイズ比によって比較する。シグナル対ノイズ比は、精度および結合部位のリコールの決定、ならびに必要とされるディープシーケンシングのカバー率、およびしたがって、実験コストの決定において、特に重要である。ChIP法には2つの大きな制約がある:第1に、可溶性クロマチン調製物を生成するために、全ゲノムをクロマチン断片に破断する必要があり、これは、ゲノムワイドなバックグラウンドノイズの一因となる。第2に、定義により、全てのChIP法は、クロマチン粒子の溶解度およびそれらの回収率を最適化しなければならない、免疫沈降に依存する。対照的に、開示するCUT&RUN技術は、DNA切断部位のみを無傷核における因子結合部位に標的化することに基づくので、ChIPとは次元を異にするものである[16]。この戦略は、可溶性クロマチン調製の必要性を除去し、単にシーケンシングカットDNAだけによって結合部位における特異的シグナルを与える。
本発明者らは、迅速かつ効率的な溶液変化のためにコンカナバリンA(ConA)被覆磁気ビーズを使用して細胞の取り扱いを最適化した。本発明者らは、エピトープが保存されておりエピトープに接近可能であるネイティブ未固定核に、抗体およびプロテインA−MNaseを結合させる。粒子の両側で切断されたクロマチン断片のみが上清に入るので、本発明者らは、不溶性バルククロマチンの残りを単に除去するだけである。非特異的DNAの圧倒的多数が残るため、CUT&RUNは、ChIPと比較してコストを劇的に低下させる非常に低いバックグラウンドレベルを有し、この場合、細胞の可溶化内容物全体が抗体に曝露される。スパイクイン対照は、現在、好ましい正規化方法である[30]ので、本発明者らは、CUT&RUNデータを正規化するための簡易な戦略を実行した:本発明者らは、少ない固定量の断片化された酵母DNAを、ビーズに結合された無傷抗体試料に、切断反応後に添加する。次いで、DNAを一緒に抽出し、ライブラリーを調製し、シーケンシングする。酵母ゲノムアセンブリへのリードのマッピングを使用して、実験間の試料リードカウントを正規化する。
本発明者らは、CUT&RUNが、簡易性、分解能、ロバストネス、効率、データ品質、および不溶性複合体への適用可能性に関してChIP−seqより優れている[16]。CUT&RUNは、反応をin situで行うことにより達成される本質的に低いバックグラウンドのため、ChIP−seqのシーケンシング深度の約1/10しか必要としない。
哺乳動物ゲノムにおけるCUT&RUNの性能を試験するために、本発明者らは、ヒトK562細胞においてCTCFをマッピングした[2]。切断フットプリントは、約300倍消化範囲にわたって一致しており、主要な単一の塩基対カット部位が片側にあり、これは、CUT&RUNが、結合している因子の最小フットプリントを明示する制限消化を達成することを強調する(図6C)。図6A、下方パネルは、ENCODE ChIP−seq、ChIP−exoおよびCUT&RUNデータセットからサンプリングした10,000,000断片についての結果を比較する。プロファイリングは、CUT&RUNが、尖ったピークを規定することを示し、これらのピークは、ENCODE ChIP−seqで検出されるピークと合致する。ChIP−exoは、これらのピークの一部を検出するが、多くの部位は、通常はコンピュータによって洗練されるリード末端の幅広分布を有する。CUT&RUNは、限られたDNA切断からの固有の低いバックグラウンドに主として起因して、他の方法論より低いシーケンシング深度を必要とした。これは、より良好なデータ品質で、実験コストを大幅に低下させる。CTCF部位に隣接するヌクレオソームも特異的に放出され、DNA断片の特徴的サイズとして現れる。
少ない細胞数でのCUT&RUNの性能。標準的なChIP−seqプロトコールは、FACSもしくは解離後にまたは臨床の場で得られることが多い少ない細胞数には適さない。ATAC−seqは、5000ほどの少数の細胞を有する試料のプロファイリングに使用されてきたが、ATAC−seqは、クロマチンの接近可能領域内にあるTFの非特異的同定に限定される。本発明者らは、最近、CUT&RUNが少ない細胞数で高いデータ品質を提供することを示した([2]、図55)。H3K27me3について6,000から下は100細胞への細胞数の低下に伴って起こる品質データ低下は、あったとしてもごくわずかである。対照的に、同じ深度でサンプリングしたENCODEプロファイルは、ChIPに固有の高いバックグラウンドのせいで不鮮明である。はるかに少ない細胞数が、試薬体積およびライブラリー調製ステップに少し改良を加えることによりHainerらによって達成された[23]。それ故、CUT&RUNは、少ない細胞数の適用に対するタンパク質−DNA相互作用の標的化されたゲノムワイドなマッピングを可能にする。
バルク細胞および組織の低コストプロファイリングのための自動化CUT&RUN。本発明者らは、上清中のタンパク質−DNA粒子を末端ポリッシングおよびライゲーションに使用して、細胞からライブラリーまでの全てのステップをロボットで行うことを可能にする、本発明者らが「直接ライゲーション」と呼ぶ、CUT&RUNプロトコールを改良した。自動化CUT&RUNのために、本発明者らは、細胞をConA被覆磁気ビーズと混合し、透過処理用界面活性剤(ジギトニン)および抗体を、活性プロセスを停止させるための2mM EDTAとともに添加した。4℃で一晩のインキュベーション後、本発明者らは、ビーズ/細胞スラリーを96ウェルプレートのウェルに移す。CUT&RUNを、アダプターのライゲーションおよびAmpureビーズクリーンアップによってロボットで行い、その後、プレートを増幅のためにPCRサイクラーに移し、次いで、最終バーコードライブラリーのクリーンアップのためにロボットに戻す。NIH 4Dヌクレオソームプロジェクト用に調製したデータセットの例は、最終的な内皮へのヒト胚性幹細胞(H1)の分化が、肝要なDNA複製遺伝子であるPOLD1に関するプロモーターヌクレオソームのH3K4me3修飾からH3K27me3へのスイッチを伴うことを示す(図56)。
in situライゲーションを伴うCUT&RUN。sciRNA−seq(単一細胞コンビナトリアルインデキシングRNAシーケンシング)[31]およびSplit−seq(スプリットプールライゲーションに基づくトランスクリプトームシーケンシング)[28]は、RNAをバルク細胞または核においてin situでcDNAに変換し、その後、バーコード化アダプターをcDNA末端にライゲーションする戦略である。細胞を固定して、cDNA合成およびライゲーション中のRNAの漏出を防止する。しかし、本発明者らは、固定せずにDNA漏出を防止する簡易なネイティブ手順を開発した。ヌクレオソームコア粒子が低塩/高二価カチオン条件で凝集するという観察[32]に基づいて、本発明者らは、10mM CaCl2および3.5mM HEPES pH7.5で消化を行う。これらの条件下でのほうが、断片は、3倍速い速度で切断し、上清への断片の検出可能な放出がない(データを示さない)。上清を磁石で除去し、150mM NaClと20mM EGTAとを含む溶出緩衝液を添加することにより、反応を停止させ、これは、小さいDNA断片を上清に放出し、自動化CUT&RUNに使用される直接末端ポリッシングおよびアダプターライゲーションと適合する。この改良プロトコールを使用する消化から生じるライブラリーは、タイムコースデータについてのH3K27acピークの一貫性を向上させた(図57)。これは、おそらく、消化中の粒子の放出を防止することによって、それらの粒子が接近可能なDNAを人為現象的に消化し得る、核内でのそれらの粒子の分散が未然に防がれたことに起因する。したがって、CUT&RUNの本発明者らの簡易な改良は、データ品質を向上させもし、固定せずにナノウェル分注およびスプリットプールバーコード化の準備を整えもする。
この改良CUT&RUNプロトコールをin situライゲーションに適応させるために、本発明者らは、20mM EGTAと、10mM MgCl2と、3.5mM HEPESとを含有する緩衝液のビーズ/細胞への添加により、反応を停止させた。これらの条件下では、低塩および高Mg++条件が凝集クロマチン状態を維持し、その一方でEGTAがマグネシウムよりカルシウムと優先的にキレート化して切断を停止させる。末端ポリッシングおよびライゲーション試薬をバーコード化Illuminaアダプターとともに添加した後、全DNAを抽出し、Illuminaプライマーを使用してPCR増幅を行い、シーケンシングする。断片の大部分は、アダプターダイマーであるが、本発明者らは、それにもかかわらず、H3K27ac CUT&RUN実験のためのゲノムワイドパターンを確認するために十分なマッピングされたリードがあることを見出した(図58A)。この実験ではたった約300,000の断片で、プロファイルは、ランク順H3K27ac CUT&RUNピークへの密接な対応により確認して、同じAbcam ab4729抗体を使用するCUT&RUNの30倍多い断片(約9,000,000)でのプロファイルおよびENCODE ChIP−seqの130倍多い断片(約40,000,000)でのプロファイルと同様である(図58B)。これらの結果は、in situアダプターライゲーションが機能し、その結果、scCUT&RUNインデキシング戦略への適用の準備が整っていることを実証する。
in situライゲーションの最適化。この最初のin situライゲーション実験からの本発明者らの予備的概念実証の結果は有望であるが、平滑末端ライゲーションの効率は非常に低かったためライブラリー調製は、アダプターダイマーにより支配される。1つの可能な解決策は、追加のAmpureビーズ選択ステップを含めることであるが、これは、全般的収量を低下させることになる。もう1つの解決策は、A−テーリングステップの追加、および突出3’T塩基を有するアダプターの使用である。本発明者らは、ループ内にデオキシウラシルを有するヘアピンアダプターを合成することによりアダプターダイマーの形成を防止することもできる。ライゲーション処置後のウラシル−N−デグリコシラーゼでの消化は、ナノウェルでのバーコード化増幅に適切な突出末端またはスプリットプール化の第1ラウンドに適切な突出末端を形成する。別の解決策は、ライゲーション中に制限酵素を含めることであり、これは、平滑末端アダプターを、それらがライゲーションするたびに再生することになる。
ナノウェルバーコード化。元々は埋め込まれたオリゴでのRNA−seqのために設計されたTakara SMARTer ICELL8 Single−Cell Systemが、つい最近、ATAC−seqに適応された[33]ため、本発明者らは、クロマチンプロファイリングの類似のインデキシング戦略に従うこととする。磁気ビーズの使用を省いて、アダプターライゲーションステップにより、大量にCUT&RUNを行うこととする。本発明者らは、洗浄と洗浄の間に穏やかな遠心分離でのジギトニン透過性処理細胞を使用する本発明者らのオリジナルプロトコール[26]に従うこととし、密でない細胞ペレットを、穏やかなピペット処理および/またはボルテックスによって単一細胞に分散させる。単一細胞をICELL8チップの個々のナノウェルに分注し、イメージングすることとし、各々のナノウェルを、72の異なるバーコード化Illumina i5プライマーの横列への分注および72の異なるi7プライマーの縦列への分注によりインデキシングすることとし、プレート上の5184のナノウェル全てをバーコードにより区別する。ICELL8システムイメージングステーションが、単一細胞を有するウェルを自動的に同定し、シーケンシング後分析のために細胞の形態を分類することとする。通常は、ICELL8チップ上の5184のナノウェルの約1/3が単一細胞を受け取り、したがって、プレートをイメージングすることによって、1細胞につき約1ドルの材料の総コストのために本発明者らは播種されたナノウェルのみを使用することが可能になる。ナノウェルプレートを封止し、プレートを、標準的CUT&RUNについて行われるように14サイクルのPCRに供することとする。次いで、バーコード化され増幅された断片を手動DNA抽出用にプールすることとする。
Ampureビーズクリーンアップ、および単一細胞バーコードによって読み込むために十分なペアードエンドDNAシーケンシング。本発明者らは、プールされた試料の150,000,000のペアードエンド断片、または1細胞当たり約100,000くらいのリードを予想する。本発明者らが本発明者らの少細胞数実験において十分なヒストン修飾を得た収量(例えば、図55)に基づいて。
スプリットプールライゲーション。アレイに基づくコンビナトリアルバーコード化は、何千もの細胞のディーププロファイリングに特によく適している。しかし、スプリットプール化は、特殊な装置を必要とせず、簡易な手動方法を使用して行うことができ、したがって、この迅速改良クラスの単一細胞戦略は、様々な直接単一細胞戦略と依然として強度に競合する。本発明者らは、記載されている[28]のと同様のスプリットプール化戦略に従うこととする。手短に述べると、本発明者らは、低塩高二価カチオン条件下で大量にCUT&RUNを行うこととする。本発明者らは、5’末端が平滑であり、3’末端に粘着オーバーハングを有する、ユニバーサルリンカーを使用して、in situライゲーションを行うこととする。リンカーの5’末端を、CUT&RUNにより生成されるポリッシングされたDNA断片末端とライゲーションすることとし、その一方で、3’粘着末端は、96の一意的タグの5’末端と相補的であり、このタグを奇数タグと呼ぶこととする。これらの奇数タグの他方の末端は、96の一意的タグの異なるセットの5’末端と相補的であり、これらのタグを偶数タグと呼ぶこととする。細胞をプールし、96ウェルプレート全体にわたって繰り返し分割することとする。各々のラウンドにおいて、96ウェルの各々に分配した一意的タグをDNA末端にライゲーションすることとする。粘着末端ライゲーションは、第1のステップで行う平滑末端ライゲーションより効率が高いため、大部分のまたは全ての捕捉CUT&RUN末端は、有効にバーコード化されるはずである。各々の細胞が、一連の一意的なタグ(バーコード)を有することを確認するために、本発明者らは、偶数および奇数タグの同じセットを再使用して複数のスプリットプール化サイクルを実行することとする。最終的に、全ての細胞をプールし、Illuminaアダプターを含有する末端タグをライゲーションすることとする。プールされた細胞の全DNA抽出の後、ライブラリー調製およびAmpureビーズクリーンアップを行うこととする。各々の細胞はこの時点でその独自のバーコードを既に有するので、異なるインデックスプライマーを使用する必要はない。付加させたバーコードの長さに依存して少なくとも100×100bpでリードペアを生成することとする。
scCUT&RUNの細胞系への適用。scCUT&RUNの複合組織への適用の準備段階として、本発明者らは、両方の単一細胞戦略をENCODE Tier 1のヒトK562細胞およびmodENCODEショウジョウバエS2細胞に適用することとする。本発明者らは、選択したヒストン修飾(H3K4me1、H3K27ac、H3K27me3およびH3K36me3)に対する抗体、およびRNAポリメラーゼII(CTD−Ser5PおよびCTD−Ser2P)に対する抗体をヒト細胞とショウジョウバエ細胞の両方に使用し、ヒトについてのCTCFおよびショウジョウバエについてのGAGA因子などの、存在量の多い構成的TFも使用することとする。K562およびS2は、均一な細胞系であり、遺伝子発現、クロマチンランドスケープ、および活性エンハンサーの機能的マッピングについて詳しく特徴付けられている。各々の抗体を本発明者らのバルクCUT&RUN実験で検証した。本発明者らは、in situライゲーションの効率が個々の細胞の特徴のカバー率を決定すると予測し、本発明者らは、単一細胞プロファイルをバルクプロファイルと比較して、本発明者らの細胞ごとのカバー率、細胞ごとに必要とされる最適なシーケンシング深度、および整列プロファイリング戦略のスプリットプール化戦略に対する有効性を判定することとする。本発明者らは、単一細胞プラットフォームでのエピトープの組合せのプロファイリングを活用して、プロモーター−エンハンサー−遺伝子の組合せを同定することとする。これは、単一因子抗体を用いておよびペアでCUT&RUNを行うこと、ならびに個々の細胞における2つのエピトープの同時性により相互作用調節エレメントを定義することを含む。
核の完全性およびクロマチン一体性は、本発明者らの予備研究で使用した低塩/高二価カチオン濃度で維持されるが、後続の操作が損傷を与えることになる可能性があり、しかし新たな末端は、インデキシングアダプターと競合しない。本発明者らの予備研究におけるin situライゲーションの低い効率は、平滑末端ライゲーション中のプライマーダイマーの優位性に起因するため、本発明者らは、提案するような修飾アダプターの使用が、効率を大いに向上させると予想する。効率が高い場合には、本発明者らは、ナノウェル戦略を選ぶ。なぜなら、たった約1000細胞ででも、個々の細胞における何万もの調節エレメントを同定するのに十分なカバー率、および細胞型を効率的にクラスタリングするのに十分なカバー率となるからである。カバー率が高いほど、必要となる細胞は少ないため、本発明者らは、その結果、8つほども多い異なる抗体または組織試料を単一チップでアッセイすることができると予測する。しかし、ライゲーション効率が低い場合には、細胞型のクラスタリングは、より多くの個々の細胞を必要とすることになり、スプリットプールバーコード化のほうが、スプリットプールラウンドごとに一意的バーコードの数が96倍になるので、魅力的になる。ショウジョウバエゲノムの20分の1のより小さいサイズについては、各々の細胞における比例的に少ないDNA断片によって、本発明者らは、同じ量のシーケンシングでより多くの細胞をプロファイリングすることが可能となり、したがって、ショウジョウバエにはスプリットプールバーコード化のほうが有利である。
無傷ハエ成虫原基でのCUT&RUN。CUT&RUNの効率は、組織および単離された細胞型におけるクロマチンプロファイリングを可能にする。小さな改良を加えて、本発明者らは、本発明者らの細胞系プロトコールを、ショウジョウバエ幼虫からの無傷組織を処理するように、またはFACS選別細胞を処理するように適応させた。本発明者らは、幼虫の脳および羽成虫原基を3齢幼虫から切除し(図59A)、未固定組織をジギトニンで透過処理し、次いで、無傷組織をConAビーズで軽度に覆った。これらのステップは、緩衝剤を単に交換するだけで組織に試薬を吸収させることができ、全ての組織取扱いは、緩衝剤交換に磁石を使用して管の中で行う。本発明者らは、ブロッキング、抗体、およびpA−MNase繋留ステップにおいてクロマチンが分解しないように保護するために2mM EDTAおよび5mMスペルミジンを含め、組織およびDNAが2日の手順を通して無傷のままであることを見出した。本発明者らは、10匹の幼虫からの羽成虫原基が約600,000の羽円板細胞(脳からはより多く)をもたらし、これにより、ヒストン修飾およびクロマチン因子を高いデータ品質でプロファイリングするために十分な材料が得られると推定する。本発明者らは、先ず、幼虫の脳および羽円板におけるH3K27me3をプロファイリングして、Polycomb抑制領域と比較した。代表領域を示す(図59C)。ANTP複合体は、ショウジョウバエのセグメントアイデンティティーホメオボックス遺伝子の多くを含有し、これらの遺伝子は、一部はPolycomb抑制によって調節される。アンテナペディア(Antp)遺伝子は、幼虫の脳の大部分の細胞においてサイレンシングされ、羽成虫原基の全ての細胞において発現される。H3K27me3パターンの対応する変化は、Antp遺伝子全体にわたって明らかであり、脳試料ではH3K27トリメチル化されているが、羽組織では大部分がメチル化されていない。ANTP複合体の外側の低いバックグラウンド、およびH3K27トリメチル化領域内の高いシグナルは、組織間のクロマチン状態が異なる領域の同定を容易にする。同様に、本発明者らは、組織試料における複数ヒストン修飾およびクロマチン因子(H3K27Ac、H3K27me2およびPolycombを含む)を、細胞培養試料と同様のデータ品質でプロファイリングした。これは、本発明者らが、少量の無傷材料からクロマチン状態を十分に特徴付けることができることを実証する。これは、組織が限られている突然変異動物のプロファイリングに特に有用である。
無傷組織は、様々な細胞型を含有する。本発明者らは、FACS単離をCUT&RUNと組み合わせて、羽成虫原基からの細胞のサブセットをプロファイリングした。本発明者らは、痕跡遺伝子の特徴付けられているエンハンサーを使用して羽成虫原基の増殖ポーチにおいてGFPを産生し(図59B)、次いで、細胞表面の糖タンパク質を分解しないことを本発明者らが見出したAccutase(Innovative Cell Technologies,Inc)を使用した。これにより、本発明者らは、細胞をFACS選別後にConAビーズに結合させ、本発明者らの標準的バルクCUT&RUNプロトコールにより細胞を処理することができる。本発明者らは、20分のFACS後にインプット材料の9%に相当する約10,000のGFP陽性細胞を回収し、これは、H3K27me3プロファイリングに十分なものであり、ゲノム全体にわたって無傷羽成虫原基と同様の結果を伴う。痕跡遺伝子自体は、細胞培養においておよび幼虫脳試料においてH3K27me3ドメインに含まれる(図59D)。H3K27me3は、羽成虫原基試料では低減されるように見えるが、この組織は、痕跡発現を伴う細胞と伴わない細胞の混合である。対照的に、FACS単離痕跡発現細胞は、痕跡遺伝子全体にわたって少ないH3K27me3メチル化を示す。これらの結果は、本発明者らの標準プロトコールに少し改良を加えて、本発明者らが、無傷組織からの細胞またはFACS単離未固定細胞からの細胞を正確にプロファイリングすることができることを確証する。組織を磁気的に操作するので、全組織CUT&RUNをロボットにより、アダプターライゲーションおよびクリーンアップ、その直ぐ後の解離および数ラウンドのスプリットプールバーコードライゲーションによって、容易に行うことができる。
スプリットプール化を用いる初代細胞および無傷組織でのscCUT&RUN。scCUT&RUNプロトコールを開発するために、本発明者らは、単一細胞レベルで詳しく特徴付けられている2つのモデルシステムにCUT&RUNを適用することとする。先ず、本発明者らは、ヒト造血細胞におけるヒストン修飾およびクロマチン因子をプロファイリングし、単一細胞クロマチンプロファイリングをこれらの細胞の転写多様性と比較することとする。第2に、本発明者らは、生殖系列幹細胞から減数分裂後精子までの全発生過程が存在するショウジョウバエ精巣におけるクロマチンをプロファイリングすることとする。ヒトと比較して20分の1のショウジョウバエのゲノムサイズは、この技術開発プロジェクトについてのシーケンシングコストも低下させる。これら2つの系を使用して、細胞状態についてのクロマチンプロファイリングの精度を評定することとし、単一細胞クロマチンプロファイリングについてのコンピュータによるクラスタリングの枠組みを開発することとする。
ヒト造血細胞でのscCUT&RUN。骨髄からの多能性CD34+細胞は、表面マーカーにより区別される、10の血液細胞カテゴリーへと分化する。これらの細胞型の転写多様性は、大量に、FACS単離されたもので、および単一細胞アンサンブルで、詳しく特徴付けられている。本発明者らは、このシステムを使用して、ヒストン修飾のscCUT&RUNプロファイリングがCD34+細胞集団における多様性をどの程度正確に再現するかを評定することとする。本発明者らは、FACS単離ヒトCD34+初代造血細胞を健常個体の骨髄から得る。本発明者らは、ナノウェルへの分注のためにおよび逐次的スプリットプール化ステップのためにCUT&RUNおよびアダプターライゲーションステップを大量に行って、個々の細胞をインデキシングすることとする。
本発明者らは、CD34+細胞における2つのRNAPII修飾(CTD−S5PおよびCTD−S2P)、3つのヒストン修飾(H3K27Ac、H3K27me3およびH3K4me1)および2つのクロマチン因子(CTCFおよび造血性TF PU.1)をプロファイリングする。RNAPIIのプロファイルによって、見込みのある活性遺伝子プロモーターが同定されることとなり、H3K27AcおよびH3K4me1は、活性プロモーターおよびエンハンサーを、ならびにH3K27me3は、Polycomb抑制クロマチンを報告することになる。これらのプロファイルを使用して、1000〜2000細胞の転写ステータスを同定することになる。全てのデータを併せて、100,000,000のペアードエンドリードが、CD34+細胞におけるバルククロマチンランドスケープを再現するはずであるため、本発明者らは、これらのプロファイルの深度を標準CUT&RUNプロファイリングと比較して効率を評定することとする。次いで、本発明者らは、個々のバーコード化細胞における遺伝子プロモーターにおける断片カバー率を調査することとする。効率的回収で、10,000〜100,000の独立した断片は、1細胞実験における特徴をカバーするはずである。本発明者らは、さらに多くの細胞を処理して、各々のCD34+サブタイプからの断片を徹底的に捕捉することができる。多くの遺伝子にわたってわずかなカバー率であっても、細胞型のクラスタリングおよび区別には十分である。本発明者らは、scCUT&RUNデータセットから導出したクラスターを、同じ10細胞型について、単一細胞ATAC−seqおよびRNA−seqデータセットから導出したクラスターと比較することにより、プロファイルを比較して、細胞型間のストリンジェントの区別に必要な細胞数およびシーケンシング深度を評価する[33]。H3K27Acもまたエンハンサーに大量に存在するため、プロモーターから遠位の断片が部位を推定的に同定する。
ハエ精巣でのscCUT&RUN。本発明者らは、固形組織を用いる単一細胞CUT&RUNのモデルシステムとしてショウジョウバエ精巣を使用することとする。ショウジョウバエ卵巣および精巣は、最大の成体器官であり、腹部から容易に切除される。しかし、卵巣は、高倍数体ナース細胞であり、これに対して精巣は、上皮体細胞、嚢胞体細胞および生殖系列細胞で構成されている。この生殖系列集団は6〜10の生殖系列幹細胞、有糸分裂増殖中の生殖原細胞、成長中の初代精母細胞、減数分裂細胞、および分化中の精子細胞とともに、精子形成の全ての発生期を含む。したがって、精巣の単一細胞プロファイリングによって、本発明者らは、生殖系列発生のクロマチン配列のクラスタリングおよび順序付けをすることができることになる。これらのステージの全ては、未染色核の顕微鏡検査によって容易に区別され、これは、ナノウェルのイメージングは、プロファイルを明確に異なる細胞型に割り当てるのに有用であるであろうという理由で、本発明者らがアレイに基づくインデキシングの方を選ぶ1つの状況である。本発明者らは、生殖系列特異的遺伝子発現プログラムの活性化と、調節の染色体ワイドな変化の両方を追跡することとする。ショウジョウバエ精子形成は、精母細胞期に開始して代替遺伝子プロモーターを幅広く活性化および調節するために精巣特異的TBP関連因子(tTAF)を使用する。本発明者らは、TAF5(体細胞および初期生殖系列TFIID成分[36])、その主要精母細胞バリアントキャノンボール(Can)[37]、ならびにH3K27AcおよびH3K27me3ヒストン修飾をプロファイリングするために利用可能な抗体を使用することになる。TAF5およびキャノンボールプロファイリングは、代替プロモーターにおけるこれらのtTAFの結合部位が後期生殖系列細胞と比較して体細胞と初期生殖系列細胞間に特有であるので、ヒストン修飾プロファイリングからの単一細胞クラスタリングの情報を得るために使用することとする。最後に、遺伝子の小収集物が、減数分裂後細胞にのみ発現されることは公知である[38]ため、これらの遺伝子のリードを使用してこれらの細胞からのバーコードをクラスタリングすることとする。
精子形成中には2つの大きな染色体ワイドなリモデリング事象がある。第1に、成長中の初代精母細胞において、メガベースサイズのY染色体遺伝子が活性化され、全X染色体は、通常より早期に不活性化されるいくつかの証拠もある。第2に、大部分のコアヒストンが分化中の精子細胞のクロマチンから剥奪され、プロタミンおよび精子特異的非ヒストンタンパク質で置き換えられる。哺乳動物精子形成におけるX染色体不活性化とヒストン/プロタミン置換の両方が、H3.3およびH2A.Zヒストンバリアントによるクロマチンリモデリングを伴うため、本発明者らは、___これらの保存バリアントをプロファイリングすることとする。
ショウジョウバエ精巣。本発明者らの予備細胞学的特徴付けは、通常より早期のX不活性化は、ショウジョウバエにおけるこのバリアントにも関わり得るという考えと一致して、ショウジョウバエH2A.Zホモログが、初代精母細胞ではX染色体上に中等度に濃縮されていることを示す(データは示さない)。どの系においても、ヒストンバリアントが、生殖系列染色体不活性化中にX染色体全体にわたってまたは特定の部位もしくは遺伝子に濃縮されるかどうかは不明である;単一細胞クロマチンプロファイリングは、これに対処することになる。
ピークコーリングの基礎としてのCUT&RUN断片長。現在、特定の遺伝子座におけるエピゲノムデータの濃縮の分析は通常、特定の標的についての報告されている役割(例えば、サイレンシングにおけるH3K27me3、もしくは活性遺伝子発現におけるH3K4me3)に基づく推測、または目的の領域における複数のプロファイルのオーバーラップの分析に基づく推測を含む。このアプローチは、10年より長きにわたるエピゲノムデータ分析においてほとんど変わっておらず、標的洗練およびパラメーター最適化のための複雑な方法(例えば、[14])を必要とし、これらの方法は、バルク集団においてさえ実行が困難である。したがって、本発明者らは、CUT&RUNから得た特有の情報を利用して標準分析パラダイムを改善することを模索した。ChIP−seqのスタイルでのゲノムワイドなエピゲノムプロファイルの生成に加えて、CUT&RUNは、MNase−seqと同様に、しかし特定の標的エピトープについての、塩基対分解能でシーケンシングされた断片長に関する情報を保存する。断片長は、単一分子レベルでタンパク質結合の性質を解明することができる;例えば、TFは、小さいフットプリントを保護し、80bp未満の短い断片を残すことが多いが、ヌクレオソームは、その2つのラップでおよそ150bpのDNAを保護する。本発明者らの研究所は、過去のMNase−seqデータからの断片長情報を使用して、遠位調節エレメントにおけるTF結合、および活性転写部位における部分的に破壊されたヌクレオソームの存在を推測した[20、39]。これに端を発して、本発明者らは、CUT&RUNピークの中の調節活性部位を塩基対分解能で予測するために断片サイズを使用する計算法を開発した。本発明者らは、結合または調節活性の最高尤度を示す本発明者らのVプロット法[39]と類似している、断片長に対するピーク中心からの断片オフセットの分布のLOESS回帰を使用して、予測断片サイズが最小化されるピーク内の単一塩基対を同定した(図60A)。本発明者らは、K562細胞におけるCTCFを標的とする実験からのCUT&RUNデータに本発明者らの方法を適用したとき、CTCF結合モチーフとのオーバーラップが高度に濃縮されている小さい断片の集団と、ヌクレオソームに概して有利に働くGCリッチ配列とオーバーラップしている大きい断片の集団という、2つの主集団に対応する頂点を検出した[40](図60B)。これらの結果は、小さいDNA断片の頂点が、CTCF結合部位をより正確に規定し、その結果、それらが切断領域内の隣接するヌクレオソームと区別されることを示す。したがって、断片サイズを層別化することは、高い分解能で因子結合部位を同定するのに有効な方法である。
調節エレメントを同定するためのCUT&RUN断片長の使用。
CUT&RUNデータでのピークコーリングアルゴリズムの比較。エピゲノムデータを処理するため既存の分析ソフトウェアパッケージは、ChIP−seqを特に念頭において書かれたものであり、それ故、高ノイズデータからシグナルを抽出するように設計される。これらの方法は通常、ゲノム全体にわたってバックグラウンドリードカウントを推定し、次いで、より高いシグナルを、直接結合の唯一の指標として使用する。CUT&RUNは、極めて低いバックグラウンドを有するため、これらのアプローチは、ピークコーリングにそれほど適さない。しかし、CUT&RUNデータは、TF結合部位が、概して、短いDNA断片として出現し、隣接ヌクレオソーム(これらもCUT&RUNでは放出される[16])は、約150bp断片として出現するため、ChIP−seqが欠けているDNA断片サイズ情報を含有する。本発明者らは、一般的なピークコーリングアルゴリズムと本発明者らの断片サイズに基づくアルゴリズムとを直接比較して性能を判定し、断片サイズ情報を使用する有効なアルゴリズムを開発することとする。本発明者らは、ENCODEプロジェクトに標準として使用される2つの主要ピークコーリングパッケージである、MACS2およびSPPアルゴリズムを試験することとする。本発明者らは、先ず、バルク実験からのCTCFについてのCUT&RUNデータを使用することとする。CTCFは、明確に定義されたDNA結合モチーフを有し、これが、各々のアルゴリズムのリコールおよび分解能を試験するための「究極の判断基準」になる。各々のアルゴリズムの感度を判定するために、本発明者らは、CTCFモチーフとオーバーラップする検出ピーク数をアルゴリズムごとに比較することとする。分解能を判定するために、本発明者らは、各々のピーク頂点までのCTCFモチーフまでの距離についての累積分布関数(CDF)曲線を作成することとする。断片サイズに基づく結合部位検出に関して上で説明した本発明者らの予備研究により、本発明者らは、本発明者らの方法がCUT&RUNデータを用いて現行のピークコーラーを上回る働きをすることができることを確信する。
scCUT&RUNデータを用いる断片長に基づくピークコーリング。単一細胞シーケンシング技術は、試料内不均一性についての重要な情報を伝えることができる。これは、例えば、t分布型確率的近傍埋め込み法(tSNE)[31]および均一多様体近似と投影(UMAP)[41]などの次元圧縮戦略によって達成される。これらのクラスタリング法は、多くのデジタル次元(例えば、単一細胞からの遺伝子発現値)を使用して細胞状態を区別する。細胞型間の発生トラジェクトリーまたは遷移状態をクラスターの擬似時間構成により推測することができる。数百の個々の細胞からの次元の疎サンプリングであってもクラスタリングを駆動するのに十分であるように何千もの次元を提供する、scRNA−seqデータを使用するそのような方法は、ロバストである。しかし、scRNA−seqは、発現の定量的測定値としてリードカウントを使用する一方で、データセットは、存在量の多い転写物により支配され、高いノイズにより制限され、これにより、PCR増幅アーチファクトを排除するための精緻な方法が必要となる。つい最近、scATAC−seqにより単一細胞において測定されたDNA接近可能性が、CD34+リンパ球を分類するために使用された[42]。この方法で、推定的調節エレメントを同定することができるが、どのようなクロマチン因子が各々の特定の部位に結合するのかは不明であり、scATAC−seqは、DNAモチーフを使用して部位における因子を推測する。細胞型がどのように制御されるのかを理解するために、調節エレメントに対する因子結合を直接調べることにより、調節エレメントの変化および決定TFの結合の変化に基づいて細胞型のトラジェクトリーが生成されることになる。しかし、ChIPに基づくプロファイリングには、単一細胞に対する感度が欠如している。さらに、細胞におけるDNA分子の少ないコピー数(G1期二倍体では2コピー)のため、いずれの単一細胞エピゲノムプロファイリング技術も、各々の次元の二進値により制約される。
本発明者らは、単一細胞エピゲノムプロファイリング分析に対する2つの改良を提案する。本発明者らは、1)CUT&RUNの感度、および2)断片サイズ情報を使用して、単一細胞分析に有益な次元としてのコールされる部位の数を最大化することとする。Hainerら[23]は最近、scCUT&RUNの感度がscATAC−seqの感度より1桁高いことを示した。これは、CUT&RUNが次元圧縮戦略の優れたインプットを提供することになることを含意する。CUT&RUNプロファイリングにおけるDNA断片サイズは、直接TF結合に有益であるので、断片サイズは、単一細胞クロマチンプロファイリングにおけるノイズを低下させるための理想的なメトリクスに相当する。本発明者らは、先ず、バルク細胞集団からの結合部位を定義し、次いで、個々の細胞における各々の部位をその部位でのDNA断片サイズとして表すこととする。これらの値を次元圧縮戦略のインプットとして使用することとする。主成分分析(PCA)がscATAC−seqデータについて実行されているため、先ず、本発明者らは、H3K27AcおよびH3K27me3修飾およびPU.1 TFについてのリンパ系細胞から生成したscCUT&RUNデータセットとともにPCAを使用して、単一細胞データの大部分の変動を捕捉する肝要な部位を定義することとする。次いで、本発明者らは、tSNEまたはUMAPアルゴリズムをscCUT&RUNデータとともにまたはPCAで定義されたサブセットとともに使用することとする。これは、既知リンパ系部分集団の検出に使用するための最適な次元数を試験することになる。次いで、本発明者らは、DNA断片サイズを考慮することが全ての断片をプールするに匹敵する程度を比較することとする。本発明者らは、決定転写因子を含む、幹細胞から分化中の精子への生殖系列細胞の発生トラジェクトリーが明確に定義されている、ショウジョウバエ精巣からの単一細胞の類似の分析を行うこととする。本発明者らは、ステージ特異的エンハンサーの活性化および遺伝子発現の変化を順序付けすることができると予想する。これらの研究は、意義がある。なぜなら、それらの研究によって、本発明者らは、因子特異的マッピングが、ヒストン修飾の(scCUT&RUNによる)、DNA接近可能性の(scATAC−seqによる)、および遺伝子発現の(scRNA−seqによる)より一般的な遺伝子マッピングに匹敵する程度を評価することが可能になるからである。
scCUT&RUNからの単一細胞におけるエンハンサーおよび遺伝子発現の定義。クロマチンを介してのRNAポリメラーゼの結合および進行は、in vivoで動的ヌクレオソーム中間体を生成する。本発明者らは、特徴的なサブヌクレオソーム長のDNA断片が活性遺伝子のプロモーターに見られることを以前に示した[20]。サブヌクレオソーム断片は、MNase切断後、およびCUT&RUN〜H3K27Ac修飾後に出現する。これらのサブヌクレオソーム断片は、患者血清に見られる無細胞DNAにおけるものでも、遺伝子発現に関して報告するために使用することができ、したがって、mRNAを得ることが困難または不可能である状況で起始細胞型を定義するのに有用である[20]。重要なこととして、サブヌクレオソーム断片は、転写活性プロモーターに限定されず、TF結合がヌクレオソームと競合するCTCF結合部位に特有である。これは、エンハンサーを同定するための特有の戦略を提供し、ここで、本発明者らは、あらゆるTFの結合がヌクレオソームと競合して特徴的なサブヌクレオソーム断片を生成することとなると予想する。先ず、本発明者らは、___のために生成したヒトK562細胞およびハエS2細胞においてH3K27AcについてのCUT&RUNデータを使用することとする;H3K27AcについてのCUT&RUNは、ゲノムにおける活性調節性エレメントについてのデータを有効に富化する。訓練実験において、本発明者らは、細胞の集団内のヌクレオソーム位置を導出し、本発明者らの断片長ピークコーラーアルゴリズムを使用してサブヌクレオソーム断片の頻度を判定して、可能性のある因子結合部位を定義することとする。本発明者らは、RNA−seqおよびSTARR−seqによってそれぞれ定義された、これらの細胞系における遺伝子発現およびエンハンサーの公知レパートリーを使用して、これらの細胞の性能を試験することとする。
この戦略の利点は、サブヌクレオソーム長のシングルリードが、活性調節エレメントの一意的診断に役立つはずであり、したがって、個々の細胞におけるエンハンサーを調べる方法を提供することである。本発明者らは、遺伝子プロモーターでのサブヌクレオソーム断片を有する、および断片がプロモーターからより遠く離れている、リンパ系細胞型にアノテーションを付与して、プロモーターおよび調節エレメントの細胞型特異的マップを提供することとする。最後に、本発明者らは、プロモーターを個々の細胞のエンハンサーと連結させて、調節エレメント使用の推測を開始することを目指す。本発明者らは、scCUT&RUN後に個々の細胞のゲノム全体にわたってサブヌクレオソーム断片にアノテーションを付与することにより、これを行うこととする。本発明者らはまた、同じ実験でヒストン修飾に対する抗体を使用することによりエンハンサーおよびプロモーターのカバー率の上昇を評価することとする。例えば、pA−MNaseを、H3K27Acに対する抗体およびH3K4me1ヒストン修飾に対する抗体の両方と繋留することで、両方を有するおよびどちらかのヒストン修飾を有するエンハンサーを捕捉することができる(本発明者らは、どの部位が、単一抗体実験からのどの修飾に起因する可能性が高いかについて、畳み込みを解くことができる)。これらの実験の目標は、どの部位のペアが個々の細胞において同時に会合しているのかを問うことであり、これは、いかなる技術によっても現在は不可能である推測である。このアプローチが有望である場合、特に関心のあるペアは、活性エンハンサーとH3K4me1に対する抗体とを、および会合しているプロモーターとRNAPII−CTD−S5Pに対する抗体とを、同時にマッピングすることになる。十分なカバー率で、この組合せによって、標的プロモーターがRNAPIIと会合しているときに遺伝子に対する複数の活性エンハンサーが結合しているかどうか、またはエンハンサー−プロモーター相互作用がより動的であるかどうかの評定が可能になる。
実施例8のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)
1. Liu, N., Hargreaves, V.V., Zhu, Q., Kurland, J.V., Hong, J., Kim, W., Sher, F., Macias-Trevino, C., Rogers, J.M., Kurita, R., et al. (2018). Direct Promoter Repression by BCL11A Controls the Fetal to Adult Hemoglobin Switch. Cell 173, 430-442 e417.
2. Skene, P.J., Henikoff, J.G., and Henikoff, S. (2018). Targeted in situ genome-wide profiling with high efficiency for low cell numbers. Nat Protoc 13, 1006-1019.
3. Solomon, M.J., and Varshavsky, A. (1985). Formaldehyde-mediated DNA-protein crosslinking: a probe for in vivo chromatin structures. Proc. Natl. Acad. Sci. U. S. A. 82, 6470-6474.
4. Rhee, H.S., and Pugh, B.F. (2011). Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147, 1408-1419.
5. Skene, P.J., and Henikoff, S. (2015). A simple method for generating high-resolution maps of genome wide protein binding. eLife 4, e09225.
6. Zentner, G.E., and Henikoff, S. (2014). High-resolution digital profiling of the epigenome. Nat. Rev. Genet. 15, 814-827.
7. He, Q., Johnston, J., and Zeitlinger, J. (2015). ChIP-nexus enables improved detection of in vivo transcription factor binding footprints. Nature biotechnology 33, 395-401.
8. Teytelman, L., Thurtle, D.M., Rine, J., and van Oudenaarden, A. (2013). Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. Proc. Natl. Acad. Sci. U. S. A. 110, 18602-18607.
9. Park, D., Lee, Y., Bhupindersingh, G., and Iyer, V.R. (2013). Widespread misinterpretable ChIP-seq bias in yeast. PLoS One 8, e83506.
10. Jain, D., Baldi, S., Zabel, A., Straub, T., and Becker, P.B. (2015). Active promoters give rise to false positive 'Phantom Peaks' in ChIP-seq experiments. Nucleic Acids Res 43, 6959-6968.
11. Baranello, L., Kouzine, F., Sanford, S., and Levens, D. (2016). ChIP bias as a function of cross-linking time. Chromosome Res 24, 175-181.
12. Meyer, C.A., and Liu, X.S. (2014). Identifying and mitigating bias in next-generation sequencing methods for chromatin biology. Nat Rev Genet 15, 709-721.
13. Venkataraman, A., Yang, K., Irizarry, J., Mackiewicz, M., Mita, P., Kuang, Z., Xue, L., Ghosh, D., Liu, S., Ramos, P., et al. (2018). A toolbox of immunoprecipitation-grade monoclonal antibodies to human transcription factors. Nat Methods.
14. Kasinathan, S., Orsi, G.A., Zentner, G.E., Ahmad, K., and Henikoff, S. (2014). High-resolution mapping of transcription factor binding sites on native chromatin. Nature Methods 11, 203-209.
15. Zentner, G.E., Kasinathan, S., Xin, B., Rohs, R., and Henikoff, S. (2015). ChEC-seq kinetics discriminate transcription factor binding sites by DNA sequence and shape in vivo. Nat Commun 6, 8733.
16. Skene, P.J., and Henikoff, S. (2017). An efficient targeted nuclease strategy for high-resolution mapping of DNA binding sites. eLife 6, e21856.
17. Schmid, M., Durussel, T., and Laemmli, U.K. (2004). ChIC and ChEC; genomic mapping of chromatin proteins. Mol. Cell 16, 147-157.
18. Thakur, J., and Henikoff, S. (2018). Unexpected conformational variations of the human centromeric chromatin complex. Genes Dev. 32, 20-25.
19. Kasinathan, S., and Henikoff, S. (2018). Non-B-Form DNA Is Enriched at Centromeres. Mol. Biol. Evol.
20. 35, 949-962.
21. Ramachandran, S., Ahmad, K., and Henikoff, S. (2017). Transcription and Remodeling Produce Asymmetrically Unwrapped Nucleosomal Intermediates. Mol. Cell 68, 1038-1053 e1034.
22. Chereji, R.V., Ocampo, J., and Clark, D.J. (2017). MNase-Sensitive Complexes in Yeast: Nucleosomes and Non-histone Barriers. Mol. Cell 65, 565-577 e563.
23. Kubik, S., Bruzzone, M.J., Albert, B., and Shore, D. (2017). A Reply to "MNase-Sensitive Complexes in Yeast: Nucleosomes and Non-histone Barriers," by Chereji et al. Mol. Cell 65, 578-580.
24. Hainer, S.J., Boskovic, A., Rando, O.J., and Fazzio, T.G. (2018). Profiling of pluripotency factors in individual stem cells and early embryos. bioRxiv.
25. van Steensel, B., and Henikoff, S. (2000). Identification of in vivo DNA targets of chromatin proteins using tethered Dam methyltransferase. Nat. Biotechnol. 18, 424-428.
26. van Steensel, B., Delrow, J., and Henikoff, S. (2001). Chromatin profiling using targeted DNA adenine methyltransferase. Nat. Genet. 27, 304-308.
27. Skene, P.J., and Henikoff, S. (2017). CUT&RUN: Targeted in situ genome-wide profiling with high efficiency for low cell numbers. biorxiv www.biorxiv.org/content/early/2017/09/24/193219.
28. Roth, T.L., Puig-Saus, C., Yu, R., Shifrut, E., Carnevale, J., Hiatt, J., Saco, J., Li, H., Li, J., Tobin, V., et al. (2017). Reprogramming human T cell function and specificity with non-viral genome targeting. bioRxiv.
29. Rosenberg, A.B., Roco, C.M., Muscat, R.A., Kuchina, A., Sample, P., Yao, Z., Graybuck, L.T., Peeler, D.J., Mukherjee, S., Chen, W., et al. (2018). Single-cell profiling of the developing mouse brain and spinal cord with split-pool barcoding. Science 360, 176-182.
30. Goldstein, L.D., Chen, Y.J., Dunne, J., Mir, A., Hubschle, H., Guillory, J., Yuan, W., Zhang, J., Stinson, J., Jaiswal, B., et al. (2017). Massively parallel nanowell-based single-cell gene expression profiling. BMC Genomics 18, 519.
31. Chen, K., Hu, Z., Xia, Z., Zhao, D., Li, W., and Tyler, J.K. (2015). The Overlooked Fact: Fundamental Need for Spike-In Control for Virtually All Genome-Wide Analyses. Mol. Cell. Biol. 36, 662-667.
32. Cao, J., Packer, J.S., Ramani, V., Cusanovich, D.A., Huynh, C., Daza, R., Qiu, X., Lee, C., Furlan, S.N., Steemers, F.J., et al. (2017). Comprehensive single-cell transcriptional profiling of a multicellular organism. Science 357, 661-667.
33. de Frutos, M., Raspaud, E., Leforestier, A., and Livolant, F. (2001). Aggregation of nucleosomes by divalent cations. Biophys. J. 81, 1127-1132.
34. Mezger, A., Klemm, S., Mann, I., Brower, K., Mir, A., Bostick, M., Farmer, A., Fordyce, P., Linnarsson, S., and Greenleaf, W. (2018). High-throughput chromatin accessibility profiling at single-cell resolution. bioRxiv, http://dx.doi.org/10.1101/310284.
35. Svensson, V., Vento-Tormo, R., and Teichmann, S.A. (2018). Exponential scaling of single-cell RNA-seq in the past decade. Nat Protoc 13, 599-604.
36. Zheng, G.X., Terry, J.M., Belgrader, P., Ryvkin, P., Bent, Z.W., Wilson, R., Ziraldo, S.B., Wheeler, T.D., McDermott, G.P., Zhu, J., et al. (2017). Massively parallel digital transcriptional profiling of single cells. Nat Commun 8, 14049.
37. Wright, K.J., Marr, M.T., 2nd, and Tjian, R. (2006). TAF4 nucleates a core subcomplex of TFIID and mediates activated transcription from a TATA-less promoter. Proc. Natl. Acad. Sci. U. S. A. 103, 12347-12352.
38. Chen, X., Hiller, M., Sancak, Y., and Fuller, M.T. (2005). Tissue-specific TAFs counteract Polycomb to turn on terminal differentiation. Science 310, 869-872.
39. Barreau, C., Benson, E., Gudmannsdottir, E., Newton, F., and White-Cooper, H. (2008). Post-meiotic transcription in Drosophila testes. Development 135, 1897-1902.
40. Henikoff, J.G., Belsky, J.A., Krassovsky, K., Macalpine, D.M., and Henikoff, S. (2011). Epigenome characterization at single base-pair resolution. Proc. Natl. Acad. Sci. U. S. A. 108, 18318-18323.
41. Kaplan, N., Moore, I.K., Fondufe-Mittendorf, Y., Gossett, A.J., Tillo, D., Field, Y., LeProust, E.M., Hughes, T.R., Lieb, J.D., Widom, J., et al. (2009). The DNA-encoded nucleosome organization of a eukaryotic genome. Nature 458, 362-366.
42. Becht, E., Dutertre, C.-A., Kwok, I.W.H., Ng, L.G., Ginhoux, F., and Newell, E.W. (2018). Evaluation of UMAP as an alternative to t-SNE for single-cell data. biorxiv, doi.org/10.1101/298430.
43. Buenrostro, J.D., Corces, M.R., Lareau, C.A., Wu, B., Schep, A.N., Aryee, M.J., Majeti, R., Chang, H.Y., and Greenleaf, W.J. (2018). Integrated Single-Cell Analysis Maps the Continuous Regulatory Landscape of Human Hematopoietic Differentiation. Cell.
44. Regev, A., Teichmann, S.A., Lander, E.S., Amit, I., Benoist, C., Birney, E., Bodenmiller, B., Campbell, P., Carninci, P., Clatworthy, M., et al. (2017). The Human Cell Atlas. eLife 6.
45. Buenrostro, J.D., Giresi, P.G., Zaba, L.C., Chang, H.Y., and Greenleaf, W.J. (2013). Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat Methods 10, 1213-1218.
46. Corces, M.R., Buenrostro, J.D., Wu, B., Greenside, P.G., Chan, S.M., Koenig, J.L., Snyder, M.P., Pritchard, J.K., Kundaje, A., Greenleaf, W.J., et al. (2016). Lineage-specific and single-cell chromatin accessibility charts human hematopoiesis and leukemia evolution. Nat. Genet. 48, 1193-1203.
47. Cusanovich, D.A., Daza, R., Adey, A., Pliner, H.A., Christiansen, L., Gunderson, K.L., Steemers, F.J., Trapnell, C., and Shendure, J. (2015). Epigenetics. Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing. Science 348, 910-914.
48. Kester, L., and van Oudenaarden, A. (2018). Single-Cell Transcriptomics Meets Lineage Tracing. Cell Stem Cell.
49. Henikoff, S., Ahmad, K., and Malik, H.S. (2001). The centromere paradox: Stable inheritance with rapidly evolving DNA. Science 293, 1098-1102.
(実施例9)
改良CUT&RUNベクター
最近まで、本発明者らが本明細書で開示するようなCUT&RUNに使用した全てのpA−MNaseは、元々のpK19−pA−MNベクター(Schmid et al., 2004)から誘導したものであった。しかし、この構築物により産生される融合タンパク質は、IgGカラムを使用するE.coli過剰発現細胞の溶解物からの精製を必要とし、低pHでの溶出、続いての中和が、バッチ間変動を生じさせる結果となった。この精製プロトコールを改良するために、本発明者らは、pK19−pA−MNに6−Hisタグを加えた(Bornhorst and Falke, 2000)。これは、ニッケル樹脂カラムでの簡易で穏やかな精製を可能にする(図61を参照されたい)。加えて、本発明者らは、市販の6−His−コバルト樹脂キット(Pierce(商標)Pull−Down PolyHis Protein:Protein Interaction Kit、カタログ番号21277)も、非常に清浄で活性の高い酵素をもたらすことを見出した。
6−Hisタグを、原理上は、CUT&RUN上清からのクロマチンプルダウンに使用することができるが、実際には、これは、6−Hisタグを樹脂から放出させるためにキレート剤を必要とするため複雑である。それ故、本発明者らは、CUT&RUN.ChIPに適用することができるHA(赤血球凝集素)タグも加えた(Brahma and Henikoff, 2018)。これによって、CUT&RUN上清を過剰なTag特異的ペプチドで処置して抗体を放出させ、その結果、クロマチン免疫沈降のための二次抗体による結合が可能になる。MNase融合構築物上のHAタグによって、本発明者らは、HAまたは3XFLAGなどのエピトープタグに対する抗体だけでなく、任意の抗体を用いて、CUT&RUN.ChIPを行うことを可能にすることにより、本方法の多用途性を増大させる。
プロテインAは、マウスIgGと弱くしか結合しないため、マウス抗体にはプロテインGを一般に使用する。MNase融合タンパク質の多用途性をさらに向上させるために、本発明者らは、pK19−pA−MNにおけるプロテインAドメインに隣接して単一のプロテインGドメインを付加させた。この結果、二次抗体を必要とすることなく、ほぼ全ての市販の抗体と強く結合する融合タンパク質を得た(Eliasson et al., 1988)。加えて、本発明者らは、ウサギ抗体に対する結合をさらに増加させるために、プロテインGコード配列における3つの残基を突然変異させた(Jha et al., 2014)。
得られたpA/G−MNase構築物のマップを図に示す。本発明者らは、通常のCUT&RUN応用について、それは、pA−MNaseと非常に類似に挙動するが、より容易に精製され、より用途が広く、例えば、マウス一次モノクローナル抗体に対する二次抗体を必要とすることなくCUT&RUNを行うことを可能にすることを見出した。
実施例9のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)
Bornhorst, J.A., and Falke, J.J. (2000). Purification of proteins using polyhistidine affinity tags. Methods Enzymol 326, 245-254.
Brahma, S., and Henikoff, S. (2018). RSC-associated Subnucleosomes Define MNase-sensitive Promoters in Yeast. In revision.
Eliasson, M., Olsson, A., Palmcrantz, E., Wiberg, K., Inganas, M., Guss, B., Lindberg, M., and Uhlen, M. (1988). Chimeric IgG-binding receptors engineered from staphylococcal protein A and streptococcal protein G. J Biol Chem 263, 4323-4327.
Jha, R.K., Gaiotto, T., Bradbury, A.R., and Strauss, C.E. (2014). An improved Protein G with higher affinity for human/rabbit IgG Fc domains exploiting a computationally designed polar network. Protein engineering, design & selection : PEDS 27, 127-134.
Schmid, M., Durussel, T., and Laemmli, U.K. (2004). ChIC and ChEC; genomic mapping of chromatin proteins. Mol Cell 16, 147-157.
(実施例10)
免疫繋留型挿入シーケンシングによる迅速標的エピゲノムプロファイリング
序論
大規模並行シーケンシングの出現、および1塩基当たりのコストの劇的低下は、ゲノミクス革命を急速に加速させたが、エピゲノムプロファイリングの十分な裏づけは、ゲノムへのクロマチン断片のマッピングに使用される方法論における制約のため遅れている。シーケンシングを伴うクロマチン免疫沈降(ChIP−seq)は、クロマチンプロファイリングに現在最も広く使用されている方法である。しかし、ChIP−seqは、超音波処理断片の数百塩基対サイズによって分解能が制限されるが、ChIP−exo、MNase−X−ChIP−seqおよびORGANICなどの変形形態は、シーケンシングプラットフォームを十分に活用するための塩基対分解能を提供する。それにもかかわらず、架橋に関する問題が依然としてあり、架橋法のためのエピトープマスキングおよびアーチファクトならびに低い収率のため多数の細胞が必要になる2、6〜9。ChIPの代替法、特に、目的の特定のタンパク質をin situで標的化し、次いでゲノムワイドのプロファイリングする、DamID10、ChEC−seqおよびCUT&RUN11、12を含む、酵素繋留法も、進展している。例えば、Laemmliのクロマチン免疫切断(ChIC)戦略13に基づくCUT&RUNは、架橋を伴わない、透過処理された細胞への特定の抗体およびプロテインA/ミクロコッカスヌクレアーゼ(pA−MNase)融合タンパク質の逐次的付加により、クロマチンタンパク質、または目的の修飾を標的とする11。MNaseは、カルシウムの添加により活性化され、断片が、DNAの抽出、ライブラリー調製およびペアードエンドシーケンシングのために上清に放出される。CUT&RUNは、ChIP−seqよりはるかに低いバックグラウンドレベルで特定のクロマチン成分の塩基対分解能を提供し、したがって、ゲノムワイドなプロファイリングのコストを劇的に低下させる。CUT&RUNは、データ品質の大きな低下を伴わずに100〜1000細胞に適用することができる12、14が、ハイスループット単一細胞適用は、標的断片を含有する上清を、ゲノムの残りを含有する細胞から分離する必要があるので複雑である。さらに、細胞を常磁性ビーズに固定化することによりもたらされる容易なワークフローに続いて、DNAシーケンシングライブラリー調製を行わなければならず、これにより、手順全体の時間、コストおよび努力が大幅に増す。
ここで、本発明者らは、高活性Tn5トランスポサーゼ15をプロテインAに融合させること、およびIllumina適合性モザイクエンドオリゴヌクレオチドを担持したプロテインA/Tn5複合体によりpA−MNの添加を置換することによって、ChIP−seqおよびCUT&RUNの制約を克服する。Mg++でのTn5の活性化は、バルク細胞適用と単一細胞適用の両方のためのPCR増幅にすぐにでも用いることができる、抗体標的化タグメンテーションを生じさせる結果となる。生細胞で開始して、本発明者らのシングルチューブ免疫繋留型挿入シーケンシング(ITIS)プロトコールは、いつでも配列を増幅することができるライブラリーを1日で提供する。
方法
材料
試薬
・細胞懸濁液。本発明者らは、ヒトK562細胞を使用した。
・コンカナバリン被覆磁気ビーズ(Bangs Laboratories、カタログ番号BP531)
・目的のエピトープに対する抗体。例えば、CUT&RUNによる1Dおよび3D相互作用のマッピングのためのウサギα−CTCFポリクローナル抗体(Millipore 07−729)
・存在量の多いエピトープに対する陽性対照抗体、例えば、α−H3K27me3ウサギモノクローナル抗体(Cell Signaling Technology、カタログ番号9733)
・二次抗体、例えば、モルモットα−ウサギ抗体
・5%ジギトニン(EMD Millipore、カタログ番号300410)
・プロテインA−Tn5(pA−Tn5)融合タンパク質。−20℃で保管する。
・Illumina適合性オーバーハングを有するモザイクエンド二本鎖オリゴヌクレオチド(配列情報は参考文献16から得、Eurofinsを通して注文したものであり、TE緩衝液中100μM)
モザイクエンド_リバース[PHO]CTGTCTCTTATACACATCT(配列番号2)
モザイクエンド_アダプターA TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG((配列番号3)
モザイクエンド_アダプターB GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG (配列番号4)
・蒸留、脱イオンまたはRNAse不含HO(dHO、例えば、Promega、カタログ番号P1197)
・1M塩化マンガン(MnCl;Sigma−Aldrich、カタログ番号203734)
・1M塩化カルシウム(CaCl;Fisher、カタログ番号BP510)
・1M塩化カリウム(KCl;Sigma−Aldrich、カタログ番号P3911)
・1M塩化マグネシウム(MgCl
・1Mヒドロキシエチルピペラジンエタンスルホン酸pH7.5(HEPES(Na);Sigma−Aldrich、カタログ番号H3375)
・1Mヒドロキシエチルピペラジンエタンスルホン酸pH7.9(HEPES(K);Sigma−Aldrich、カタログ番号H3375)
・5M塩化ナトリウム(NaCl;Sigma−Aldrich、カタログ番号S5150−1L)
・0.5Mエチレンジアミン四酢酸(EDTA;Research Organics、カタログ番号3002E)
・2Mスペルミジン(Sigma−Aldrich、カタログ番号S2501)
・Roche完全プロテアーゼ阻害剤EDTA不含タブレット(Sigma−Aldrich、カタログ番号5056489001)
・2mg/mlのグリコーゲン(Sigma−Aldrich、カタログ番号10930193001の1:10希釈物)
・RNase A、DNaseおよびプロテアーゼ不含(10mg/ml;Thermo Fisher Scientific、カタログ番号EN0531)
・10%ドデシル硫酸ナトリウム(SDS;Sigma−Aldrich、カタログ番号L4509)
・プロテイナーゼK(Thermo Fisher Scientific、カタログ番号EO0492)
・Agencourt AMPure XP常磁性ビーズ(Beckman Coulter、カタログ番号A63880)
・1M Tris−HCl pH8.0
・エタノール(Decon Labs、カタログ番号2716)
・NEBNext HiFi 2× PCRマスターミックス
・PCRプライマー(一意的インデックスを有するカスタムPCRプライマーの配列は、参考文献17および18から得た)
装置
・Centrifuge Eppendorf 5810、スイングバケット
・Centrifuge Eppendorf 5424、固定角ローター
・Centrifuge Eppendorf 5415R、冷却固定角ローター
・Macsimag磁気分離機(Miltenyi、カタログ番号130−092−168)、1.7および2ml微量遠心管の底部からの液体の清浄な抜き取りが可能。
・ボルテックスミキサー(例えば、VWR Vortex Genie)
・微量遠心分離機(例えば、VWR Model V)
・1.5ml微小遠心管(Genesee、カタログ番号22−282)
・2ml微小遠心管(Axygen、カタログ番号MCT−200−C)
・チューブローテーター(Labquake、Thermo Fisher)
・1.5ml微小遠心管用のウェルを有するヒーターブロック
・水浴(37℃、55℃および70℃に設定される)
・MaXtractフェーズロック微小遠心管(Qiagen、カタログ番号139046)
・キャピラリー電気泳動装置(例えば、Agilent Tapestation 4200)
・Qubit蛍光光度計(Life Technologies、カタログ番号Q33216)
試薬準備
5%ジギトニン:ジギトニン粉末(Calbiochem)をDMSOに溶解して5%(w/v)にする。
結合緩衝剤:400μLの1M HEPES−KOH pH7.9、200μLの1M KCl、20μLの1M CaClおよび20μLの1M MnClを混合し、dHOで20mlの最終体積にする。その緩衝剤を4℃で6カ月間保管する。
コンカナバリンA被覆ビーズ:穏やかに再懸濁させ、各々の最終試料および/または消化時点に10μLがあるために十分なスラリーを抜き取る。2ml管の中の1.5ml結合緩衝剤に移入する。管を磁気スタンド上に配置して清浄化する(30秒〜2分)。液体を抜き取り、磁気スタンドから除去する。1.5mlの結合緩衝剤を添加し、反転または穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。ConAビーズスラリーの体積(1試料当たり10μL)と等しい体積の結合緩衝剤に再懸濁させる。
Tn5−アダプター複合体:モザイクエンドアダプターA(ME−A)およびモザイクエンドアダプターB(ME−B)オリゴヌクレオチドの各々をモザイクエンド逆オリゴヌクレオチドとアニールする。アニール済みのME−AオリゴヌクレオチドとME−Bオリゴヌクレオチドの16ulの100uM等モル混合物を100ulの5.5uMプロテインA−Tn5融合タンパク質と混合する。混合物を回転プラットフォーム上で1時間、室温でインキュベートし、その後、−20℃で保管する。
洗浄緩衝剤:1mlの1M HEPES pH7.5と、1.5mlの5M NaClと、12.5μLの2M スペルミジンとを混合し、dHOで50mlの最終体積にし、1個のRoche完全プロテアーゼ阻害剤EDTA不含タブレットを添加する。その緩衝剤を4℃で最大1週間の間、保管する。
Dig洗浄緩衝剤:400μLの5%ジギトニンを40mlの洗浄緩衝剤と混合する。その緩衝剤を4℃で最大1日の間、保管する。
抗体緩衝剤:8μLの0.5M EDTAを2mlのDig洗浄緩衝剤と混合し、使用するまで氷上に置く。
Dig−med緩衝剤:20mlのDig洗浄緩衝剤を600μLの5M NaClと混合する。その緩衝剤を4℃で最大1日の間、保管する。
タグメンテーション緩衝剤:20μLの1M MgClを2mlのDig−med緩衝剤と混合し、使用するまで氷上に置く。
手順
細胞透過処理および一次抗体インキュベーション
・タイミング 1.5時間〜数日
1)室温で新鮮培養物を収集し、細胞をカウントする。同じプロトコールを、1試料当たり最大500,000の哺乳動物細胞に使用することができる。
・一時停止ポイント:必要に応じて、Mr.Frostyイソプロピルアルコールチャンバを使用して細胞を10%DMSO中で凍結保存することができる。本発明者らは、急速凍結を推奨しない。これは、最終的なデータ品質に影響を及ぼす可能性があるバックグラウンドDNA切断の原因となり得るからである。
2)3分、600×g、室温で遠心分離し、液体を抜き取る。
3)穏やかなピペット操作により1.5mlの室温洗浄緩衝剤に再懸濁させ、必要に応じて2ml管に移す。
4)3分、600×g、室温で遠心分離し、液体を抜き取る。
5)ステップ3および4を繰り返す。
6)低(約1100rpm)に設定したボルテックス上に配置し、1mlの冷抗体緩衝剤に再懸濁させる。
7)使用する抗体ごとに1つの、1.5ml管内の100μLアリコートに細胞スラリーを分割する。
8)1〜2μLの抗体を添加する。
9)室温で1〜2時間、または4℃で最大数日、回転させる。
二次抗体を結合させる
・タイミング 1時間
10)低(約1100rpm)に設定したボルテックスミキサー上に各々の管を配置し、10μLの活性化ConAビーズスラリーをゆっくりと添加する。
11)室温で章動または回転させて結合させる(5〜10分)。
12)100μLのDig−洗浄液当たり1〜2μLの二次抗体(例えば、ウサギ一次に対するモルモット抗ウサギ)を混合する。
13)微量遠心分離機でのクイックパルスで蓋および側面から液体を除去し、管を磁気スタンド上に配置して清浄化する。
14)全ての液体を吸引除去し、低(約1100rpm)に設定したボルテックスミキサーに各々の管を低角度で配置し、100μLの二次抗体ミックスを吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
15)室温で約30分間、章動または回転させる。
16)高速回転させ、磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
17)1mlのDig洗浄緩衝剤を添加し、反転により、または塊が残存する場合には穏やかなピペット操作により混合する。
18)ステップ16〜17を2回繰り返す。
プロテインA−Tn5融合タンパク質を結合させる
・タイミング 1.5時間
19)1試料当たり100μLについて1:200の最終濃度までpA−Tn5複合体をDig−med緩衝剤に混ぜ入れる。
20)磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
21)低(約1100rpm)に設定したボルテックスミキサーに各々の管を低角度で配置し、100μLのpA−Tn5ミックスを吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
22)管をニューテータ・ローテータ−上に室温で1時間置く。
23)高速回転させ、磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
24)1mlのDig−med緩衝剤を添加し、反転により、または塊が残存する場合には穏やかなピペット操作により混合する。
25)ステップ23〜24を2回繰り返す。
タグメンテーション
・タイミング 1.2時間
26)高速回転させ、磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
27)低(約1100rpm)に設定したボルテックスミキサーに各々の管を低角度で配置し、1試料当たり100μLのタグメンテーション緩衝剤を側面に沿って添加し、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
28)37℃で1時間、インキュベートする。
タグメンテーション停止およびDNA抽出
・タイミング 1.5時間
29)各々の試料に室温で4.5μLの0.5M EDTA、5.5μLの10%SDSおよび1μLの20mg/mlのプロテイナーゼKを添加する。
30)インキュベート(30分、55℃)して、消化する。
31)インキュベート(20分、70℃)して、プロテイナーゼKを不活性化する。
32)1.1体積(122μL)AMPure XP常磁性ビーズを添加し、短時間、フルでボルテックスする。
33)高速回転させ、室温で10〜15分間、静置させる。
34)磁石の上に配置し、透明になるまで放置した後、液体を注意深く抜き取る。
35)磁石の上で、ビーズを乱すことなく、1mlの80%エタノールを添加する。
36)管の底に1mlピペットを入れて液体を抜き取り、1mlの80%エタノールを添加する。
37)1mlピペットで液体を抜き取る。
38)残存する液体を20μLピペットで除去し、4〜5分放置して乾燥させる。
39)磁気スタンドを取り外し、30μLの10mM Tris−HCl pH8を添加し、フルでボルテックスする。
40)5分後、磁気スタンド上に配置して、透明になるまで放置する。
41)ピペットで液体を新たな管へと除去する。
PCR
・タイミング 1時間
42)21μLのDNA+2μLのカスタムAd1_noMX i5+2μLのv2_Ad2?を混合する。試料ごとに異なるバーコードを使用して、i7プライマーをバーコード化する。
43)25μLのNEBNext HiFi 2× PCRマスターミックスを添加する。
44)混合し、高速回転させ、サーモサイクラー内に配置し、HEATED LIDでのサイクリングプログラムを開始する。
45)サイクル1:5分間72℃(ギャップ充填)
46)サイクル2:30秒間98℃
47)サイクル3:10秒間98℃
48)サイクル4:30秒間63℃
49)サイクル3〜4を13回繰り返す。
50)1分間72℃、そして8℃で保持する。
・大きいDNA断片および過剰なプライマーの寄与を最小にするために、PCRサイクルは、好ましくは、10秒、60〜63℃のアニール/伸長複合ステップを伴う、少なくとも12〜14サイクルであるべきである。
PCR後クリーンアップ
51)管が冷めた後、サイクラーを取り外し、1.1体積(55μL)Ampure XPビーズを添加し、短時間、フルでボルテックスする。
52)高速回転させ、室温で10〜15分間、静置させる。
53)磁石の上に配置し、透明になるまで放置した後、液体を注意深く抜き取る。磁石の上で、ビーズを乱すことなく、200μLの80%エタノールを添加する。
54)管の底にピペットを入れて液体を抜き取り、200μLの80%エタノールを添加する。
55)液体を抜き取り、残存する液体を20μLピペットで除去し、4〜5分放置して乾燥させる。
56)磁気スタンドを取り外し、30μLの10mM Tris−HCl pH8を添加し、フルでボルテックスする。
57)5分後、磁気スタンド上に配置して、透明になるまで放置する。
58)ピペットで液体を新たな管へと除去する。
DNAシーケンシングおよびデータ処理
59)Agilent 4200 TapeStation分析によりライブラリーのサイズ分布を判定する。
60)製造業者の推奨どおりの最終濃度を目指して、所望通りの等しい表現を達成するようにライブラリーを混合する。
61)バーコードライブラリーを用いるペアードエンドIlluminaシーケンシングを製造業者の使用説明書に従って行う。
62)本発明者らは、Bowtie2バージョン2.2.5を、オプション:−−local−−very−sensitive−local−−no−unal−−no−mixed−−no−discordant−−phred33−I 10−X700で使用して、ペアードエンドリードのアラインメントを行う。較正のための断片のマッピングには、本発明者らは、実験ゲノムとスパイクインDNAのものとの交差マッピングを回避するために、−−no−overlap−−no−dovetailオプションも使用する。
結果および考察
本発明者らの基本ITISプロトコールは、(1)細胞を透過処理すること、(2)一次抗体を添加して、インキュベートすること、(3)コンカナバリンA被覆常磁性ビーズ上に固定化すること、(4)二次抗体を添加し、インキュベートし、洗浄すること、(5)pA−Tn5を添加し(図62)、洗浄すること、(6)Mg++と共にインキュベートすること、(7)反応を停止させ、プロテイナーゼKで消化すること、および(8)Ampure XPビーズを常磁性クリーンアップのために添加すること(図63A)を含む。全ての操作は、単一の管またはマイクロタイタープレートのウェルの中で行い、磁気ビーズからの水性溶出によって、いつでもPCRすることができるDNAライブラリーを得る。14サイクルのPCR後、10%アリコートのTapestation表示は、2つの異なるpA−Tn5構築物を使用すると、RNAPII−Ser5およびH3K27me3について断片−アダプターのラダーを示すが、IgG対照については示さないことを示す(図64)。ラダーは、6,000〜400,000の範囲の細胞数について見られる(図63B)。プロファイルは、H3K27me3については下は6,000に至るおよびRNAポリメラーゼ IIセリン−5(RNAPII−Ser5)については下は20,000に至る細胞数に関してほぼ同一であり、小さい断片(<100bp+両末端の61bpアダプター)、モノヌクレオソーム(約170bp+アダプター)およびオリゴヌクレオソームを示す。ヌクレオソームエピトープと非ヌクレオソームエピトープの両方について類似のヌクレオソームラダーがCUT&RUNについて見られ、両側のリンカー領域内の切断による隣接ヌクレオソームの放出と解釈した。より少ない細胞数では、小さい断片およびモノヌクレオソームの低減ならびにオリゴヌクレオソームの増加に伴って、断片の平均長の顕著な増加がある。本発明者らは、細胞数に伴うサイズ分布のこれらの差異は、一次抗体の限られた量の結果として生じると解釈し、したがって、より多い細胞数では、全ての利用可能なエピトープに結合するために十分な抗体がなく、これは、本発明者らが以前に報告したCUT&RUNについての制約12である。細胞数の減少に伴って、部位のほぼ全てが抗体で飽和されるため、ドメイン内に存在量が多いH3K27me3において、および転写開始部位および遺伝子にわたって存在量が多いRNAPII−Ser5において粒子間での断片放出の可能性が高くなる。抗体の等濃度を仮定すると、枯渇は、H3K27me3についての細胞でのほうがRNAPII−Ser5についての細胞より多く起こることになる。なぜなら、ヌクレオソーム1つ当たりのH3K27me3のコピー数は多くとも2つであるが、RNAPII複合体1つ当たりのC末端ドメイン(CTD)ヘプタマーのコピー数は52ほどもある19からである。本発明者らは、数日間の一次抗体のインキュベーションがITIS収量に影響を与えないことを見出した。
本発明者らは、先ず、RNAPIIのプロファイリングについてITISをCUT&RUNと比較した。CUT&RUNでは、消化の長さが断片の収量を決定する。過少消化では、細胞の集団内の部位のほんの一部が標的粒子の両側で切断されて上清に断片を放出し、低いシグナルを生じさせる結果となる。過剰消化は、pA−MN結合断片を放出し、その結果、非標的消化が生じることがあり、これは、RNAPIIおよびH3K27acなどの非常に大量に存在するエピトープについて深刻になる問題である。CUT&RUNに伴う非標的消化を低減させるために、本発明者らは、ヌクレオソームコア粒子の沈殿をもたらすことが以前に示されている低塩および高二価カチオン濃度を使用して消化を行うように、プロトコールを改良した。実際、3.5mM HEPES pH7.5および10mM CaClをCUT&RUN消化に使用して、本発明者らは、消化中にH3K27ac標的化クロマチンの放出を検出しなかったが、150mM NaClの添加時には定量的放出を検出した。この手順は、相関行列分析により時点間の変動を大幅に低下させた(図57)ため、本発明者らは、それ以来、この改良CUT&RUNプロトコールを全ての適用に採用してきた。それにもかかわらず、本発明者らの改良CUT&RUNプロトコールを抗RNAPII−Ser5抗体を使用するRNAPIIからの開始形態に適用したとき、本発明者らは、0℃で1分〜27分の時間経過にわたって過少消化と過剰消化の両方を観察した(図65)。対照的に、同じ抗体および2つの異なるpA−Tn5構築物を異なる濃度で使用するITISは、プロモーターに関して尖ったピークと、遺伝子本体における低い幅広ドメイン、および最良のCUT&RUN時点(9分)より低いバックグラウンドを示した。本発明者らは、RNAPIIエピトープ(Ser−2、Ser5、Ser2+Ser5およびSer7)に対する4つの追加の抗体を使用して、RNAPII CUT&RUNの一貫性を確認した。相関行列分析は、生物学的反復がクラスタリングして同じ実験内で異なる抗体が排除されることなく、5つ全ての抗体が高度に一致するプロファイルをゲノムワイドに与えることを示すのに対して、本発明者らの最良の実験についてのCUT&RUNプロファイルは、同じインキュベーション混合物から逐次的に時点をとった事実にもかかわらず、より低い全般的一致を示す(図66B)。本発明者らは、ITISが、本発明者らの改良CUT&RUNプロトコールを使用して見られる低いバックグラウンドで、RNAPIIのロバストなプロファイリングを提供すると結論付ける。本発明者らは、異なって使用してサイレンシング(H3K27me3)および活性(H3K4me2およびH3K27me3)ヒストン修飾のITSプロファイリングについて、同様に高いロバストネスおよび一致を観察した(図66A)。
Tn5を使用するタグメンテーションは、高感受性部位検出のための人気のあるATAC−seq法に従って非標的化方式で以前に適用されており17、ITISの課題は、抗体標的化プロファイリングと交絡することになる非標的化タグメンテーションを回避することである。非標的化タグメンテーション度をアッセイするために、本発明者らは、CUT&RUN陽性対照として本発明者らが使用したH3K27me3に対するウサギモノクローナル抗体を使用した。なぜなら、このエピトープは、本質的に超高感受性部位を欠いているゲノムのサイレンシングされた領域に排他的に見られるからである。ヒトK562における超高感受性部位を同定するために、本発明者らは、現在リリースされているATAC−seqデータセット(GSM2695561)の61,153ピークコールのセットをダウンロードした。超高感受性部位の位置として各々のピークの中点を使用して、本発明者らは、pA−Tn5複合体添加中および/または後の細胞の様々な処置の後に、H3K27me3 ITISにより生成された断片をアラインメントした。本発明者らは、結合、洗浄およびタグメンテーションのために300mM NaClを使用して除去したが、pA−Tn5結合の後に500mM塩洗浄液を短時間使用して軽度に還元した生理的(約150mM)NaClを使用してITISの超高感受性部位の高い占有率を見出した(図69A)。61,153全てのATAC−seq部位をスコアにより順序付けしたとき、CUT&RUNは、ATAC−seqスコアとの弱い負の相関を示したが、その一方で、150mM NaClおよびほんの短時間の500mM NaClを使用するITISは、強く相関したヒートマップを生じさせる結果となった(図67)ことにより、pA−Tn5が、インキュベーション中に超高感受性部位とゲノムワイドに結合すること、および活性酵素複合体の相当な量が、洗浄およびタグメンテーション中に残存することが確証される。際だったことに、500mM NaClでの長時間洗浄は、ATAC−seq部位に関する占有率をCUT&RUNに見られるレベルまで低下させた。超高感受性部位占有率のさらなる低下が、pA−Tn5結合、洗浄およびタグメンテーション中に300mMのNaCl濃度を使用することにより、得られた。本発明者らは、これは、超高感受性部位が埋め込まれているH3K27me3ドメイン内の高濃度のエピトープであって、H3K27me3不含ドメインに埋め込まれている部位と比較してこれらの部位に隣接するH3K27me3ヌクレオソームと結合しているpA−Tn5によるバックグラウンド断片の優先的放出を生じさせる結果となる高濃度のエピトープとの弱い反相関に起因すると考える。これらの結果は、1セットのアダプターと複合体化している未繋留Tn5とインキュベートし、続いての異なるアダプターセットと複合体化しているpA−Tn5とインキュベートして、高塩処理を省くことにより、ITISとATAC−seqの両方を同じ試料で行うことができることも示唆する。
本発明者らは、イオン濃度がITIS断片のサイズ分布に影響を与え得ることを見出す。ITISは、転写因子に相当する小さい断片(≦120bp)と、低いジヌクレオソームレベルを伴うモノヌクレオソームに主として相当する大きい断片(≧150bp)を生じさせる(図68)。約10bpの周期性は、酵母転写因子のCUT&RUNに見られるそれほど顕著でない周期性に類似して、繋留切断の厳しい制約を表す可能性が高く、これを、本発明者らは、DNA二重らせんの片面への酵素の接近を表すと解釈した11。塩濃度を上昇させて非標的化pA−Tn5を消失させることにより、本発明者らは、小さい断片サイズの集団の低減も観察した(図69B)。加えて、本発明者らは、下の表におけるE.coliゲノムをマッピングする断片の数の減少を観察した。
300mM NaClでのTn5結合およびタグメンテーションは、ヒトK562細胞におけるE.coli DNA混入を低減させる。

2つの異なるITIS実験からのマッピングされたペアードエンドリードカウント。第1の実験では、150mM NaClをpA−Tn5結合に使用し、その後、500mMの短時間の洗浄を2回、次いで150mM NaCl中でのタグメンテーションを行った。第2の実験では、300mM NaClをpA−Tn5結合に使用し、その後、3回の短時間の洗浄およびタグメンテーションを行った。精製中に、Tn5トランスポサーゼは、E.coli DNAの利用可能な断片と結合し、その一部は、精製プロセスを通して結合したままである。トランスポサーゼのいずれのバッチについても、反応に持ち込まれるE.coli DNA混入物のパーセンテージは、「非侵襲性」スパイクインプロキシとして役立ち、このプロキシを試料を較正するために使用することができ、したがって、それらを定量的に比較することができる。
この混入物は、Tn5をコードする遺伝子が、E.coliにおける高い発現レベルに誘導されて、E.coliゲノムDNAと結合する高濃度の酵素を産生し、その一部が、精製プロセスを乗り切り、細胞DNAとともに同時にタグメンテーションされるために発生する。精製中のこの混入物の除去のためのプロトコールはあるが、本発明者らは、本発明者らの300mM NaClプロトコールがE.coli DNAを有意でないレベルに低下させることを見出した。本発明者らは、CTCFなどの相対的に稀なエピトープが、ヒストン修飾などのより存在量の多いエピトープより高い混入レベルを示し、低い均一なバックグラウンドのみをもたらすIgGが、非常に高い混入を示すことに気付いた。これは、本発明者らが、較正のためのスパイクインの「非侵襲性」プロキシとしてE.coli混入を使用することができることを示す。スパイクイン較正には試料を比較することが不可欠であり20、バックグラウンドレベルが低すぎて較正に使用することができないCUT&RUNおよびITISなどの方法を使用する場合には、特にそうである。E.coli DNAの混入をスパイクインのプロキシとして使用することができるか否かを試験するために、本発明者らは、S.cerevisiae酵母DNAスパイクインを含む、H3K27me3(100〜6,000細胞)およびCTCF(1,000〜100,000細胞)についてプロファイリングされた段階希釈細胞からのK562細胞データセットを使用して、E.coliゲノムに断片をマッピングした。実際、両方の細胞数範囲について、酵母スパイクインとE.coli混入との間の相関は、起こり得る測定誤差の範囲内にあるのと同じほど密接であった(R=0.96、図70)。したがって、pA−MNaseに混入するE.coli DNAを使用して、スパイクインの必要を除去してCUT&RUNを較正することができ、これは、pA−Tn5に混入するE.coli DNAがITISの好適なスパイクインプロキシとして役立つという本発明者らの証拠を裏づける。E.coli混入のスパイクインプロキシとしての使用は、不均一なスパイクインに有利である。なぜなら、CUT&RUN試料へのpA−MNaseの添加は、停止緩衝剤への不均一なスパイクインDNAの添加より先に行われ、そのため、CUT&RUNプロセスにおけるより早い段階における試料間変動の対照となり、これらの利点がITISに及ぶからである。E.coliゲノムは、CUT&RUNスパイクインに使用される酵母またはショウジョウバエゲノムより単純であり、反復配列マスキングを必要とせず、それは、全ての真核生物にとって異種であるので、事実上、全てのITIS適用に十分なものであるはずである。
本発明者らは、RNAPII−Ser5データセットを使用してITISを検証した。RNAPIIは、PRO−seqを使用してK562細胞においてプロファイリングされており、このPRO−seqは、RNAPIIの活性部位における新生鎖をマッピングする、転写ランオン方法であり、そのため、ChIP−seq、CUT&RUNおよびITISなどのクロマチンに基づく方法とは次元を異にする。デフォルトパラメータでMACS2を用いてpA−Tn5データセットとpA−3XFLAG−Tn5データセットの両方(図64、PolIIIS5)についてピークをコールし、各々約17,500ピークを得た。ヒトK562細胞についての処理済みPRO−seqデータセット(SRA GSM1480327)をピークコールにアラインメントした。ITIS MACS2スコアにより順序付けすると、PRO−seq占有量とPolII−Ser5 ITSスコアとの間の密接な対応が見られ、ここで、青色のヒートマップ値は、各々のピークコールの3’側のPRO−seq占有量を表し、黄色の値は、5’側のPRO−seq占有量を表す(図71)。これは、PolII−Ser5 ITISが、いずれの外部アノテーションを参照する必要なくRNAPIIの初期形態をマッピングすることができることの直接的確証を与える。非常に類似したPRO−seqヒートマップが、両方の形態のpA−Tn5に対するピークコールから生成される。本発明者らは、ITISがRNAPIIの正確なマップを提供すると結論付ける。
ITISをエピゲノム成分により一般的に使用することができるかどうかを判定するために、およびそのプロトコールをハイスループットに適応させるために、本発明者らは、反応物の体積を半減させ、収集して透過処理したK562ヒト胚性幹細胞とH1ヒト胚性幹細胞の両方について各々2つのバッチを96ウェルマイクロタイタープレートの個々のウェルに分注した。各々の試料に、本発明者らは、合計96試料に対して一連の20の抗体のうちの1つを1:50濃度で添加した。4℃で一晩のインキュベーション後、ITISをそのプレートで行い、Ampureビーズを添加し、溶出液を、96の異なるバーコードを使用する14サイクルで増幅し、その後、プールした。Tapestaion分析に基づくサイズ分布、およびQubit読み込みに基づく濃度を使用して、おおよそ等モル量の96全ての試料を混合し、単一2レーンフローセルでシーケンシングした。本発明者らは、平均で約3,000,000のペアードエンドリードをヒトゲノムにマッピングした。相関行列分析のために階層的クラスタリングを使用して、本発明者らは、K562細胞とH1細胞の両方についての全ての生物学的反復実験が例外なく一緒にクラスターを形成することを見出した(図72)。そのような卓越した再現性は、ITISのロバストネスを確証する一方で、ヒストン修飾(H3K4me1〜me3、K27acおよびme3)およびバリアント(H2A.Z)、転写因子(CTCF、Myc Sox2、Oct4およびNPAT)ならびにクロマチン関連複合体(PolII、Med1、Suz12およびRing1B)についてのものを含む、多種多様なエピトープにITISが好適であることを実証する。
まとめると、本発明者らは、繋留された酵素の抗体標的化と、生細胞からすぐにシーケンシングできるライブラリーまで1日しか必要としないタグメンテーションとを併用する新規方法を説明した。ITISは、RNAPIIのプロファイリングに関して本発明者らのCUT&RUN方法より優れており、ヒストンおよびCTCF転写因子のプロファイリングに関しては同様の結果を達成する。ITISのワークフローは、CUT&RUNと似ているが、より簡易であるので、ハイスループットに、ならびに組織および腫瘍試料への応用に容易に適応させることができる21。さらに、ITISは、単一細胞ChIT/ATAC−seqを含む、単一細胞ATAC−seqに適用した同じプロトコール18、22〜25に従って単一細胞応用に容易に適応可能である。ITISは、ベンチトップ、ハイスループットパイプライン、およびゆくゆくは診療所用の、クロマチンランドスケープの特定の成分をプロファイリングするための最初の方法として、ChIP−seqの代替となる可能性がある。
実施例10のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)
1. Zentner, G.E. & Henikoff, S. High-resolution digital profiling of the epigenome. Nat Rev Genet 15, 814-27 (2014).
2. Policastro, R.A. & Zentner, G.E. Enzymatic methods for genome-wide profiling of protein binding sites. Brief Funct Genomics 17, 138-145 (2018).
3. Rhee, H.S. & Pugh, B.F. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147, 1408-19 (2011).
4. Skene, P.J. & Henikoff, S. A simple method for generating high-resolution maps of genome wide protein binding. eLife 4, e09225 (2015).
5. Kasinathan, S., Orsi, G.A., Zentner, G.E., Ahmad, K. & Henikoff, S. High-resolution mapping of transcription factor binding sites on native chromatin. Nature Methods 11, 203-9 (2014).
6. Teytelman, L., Thurtle, D.M., Rine, J. & van Oudenaarden, A. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. Proc Natl Acad Sci U S A 110, 18602-7 (2013).
7. Zentner, G.E., Kasinathan, S., Xin, B., Rohs, R. & Henikoff, S. ChEC-seq kinetics discriminate transcription factor binding sites by DNA sequence and shape in vivo. Nature Communications 6, 8733 (2015).
8. Park, D., Lee, Y., Bhupindersingh, G. & Iyer, V.R. Widespread misinterpretable ChIP-seq bias in yeast. PLoS One 8, e83506 (2013).
9. Venkataraman, A. et al. A toolbox of immunoprecipitation-grade monoclonal antibodies to human transcription factors. Nat Methods (2018).
10. van Steensel, B., Delrow, J. & Henikoff, S. Chromatin profiling using targeted DNA adenine methyltransferase. Nature Genetics 27, 304-308 (2001).
11. Skene, P.J. & Henikoff, S. An efficient targeted nuclease strategy for high-resolution mapping of DNA binding sites. Elife 6, e21856 (2017).
12. Skene, P.J., Henikoff, J.G. & Henikoff, S. Targeted in situ genome-wide profiling with high efficiency for low cell numbers. Nat Protoc 13, 1006-1019 (2018).
13. Schmid, M., Durussel, T. & Laemmli, U.K. ChIC and ChEC; genomic mapping of chromatin proteins. Mol Cell 16, 147-57 (2004).
14. Hainer, S.J., Boskovic, A., Rando, O.J. & Fazzio, T.G. Profiling of pluripotency factors in individual stem cells and early embryos. bioRxiv (2018).
15. Reznikoff, W.S. Tn5 as a model for understanding DNA transposition. Mol Microbiol 47, 1199-206 (2003).
16. Picelli, S. et al. Tn5 transposase and tagmentation procedures for massively scaled sequencing projects. Genome Res 24, 2033-40 (2014).
17. Buenrostro, J.D., Giresi, P.G., Zaba, L.C., Chang, H.Y. & Greenleaf, W.J. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat Methods 10, 1213-8 (2013).
18. Buenrostro, J.D. et al. Single-cell chromatin accessibility reveals principles of regulatory variation. Nature 523, 486-90 (2015).
19. Zaborowska, J., Egloff, S. & Murphy, S. The pol II CTD: new twists in the tail. Nat Struct Mol Biol 23, 771-7 (2016).
20. Chen, K. et al. The Overlooked Fact: Fundamental Need for Spike-In Control for Virtually All Genome-Wide Analyses. Mol Cell Biol 36, 662-7 (2015).
21. Janssens, D.H. et al. Automated in situ profiling of chromatin modifications resolves cell types and gene regulatory programs. biorxiv doi.org/10.1101/41868 (2018).
22. Corces, M.R. et al. Lineage-specific and single-cell chromatin accessibility charts human hematopoiesis and leukemia evolution. Nat Genet 48, 1193-203 (2016).
23. Buenrostro, J.D. et al. Integrated Single-Cell Analysis Maps the Continuous Regulatory Landscape of Human Hematopoietic Differentiation. Cell 173, 1535-1548 e16 (2018).
24. Mezger, A. et al. High-throughput chromatin accessibility profiling at single-cell resolution. Nat Commun 9, 3647 (2018).
25. Cusanovich, D.A. et al. The cis-regulatory dynamics of embryonic development at single-cell resolution. Nature 555, 538-542 (2018).
(実施例11)
免疫標的化挿入シーケンシングでの少細胞および単一細胞エピゲノムプロファイリング
ChIP−seqの大きな制約は、それが、数千未満の細胞を必要とする応用にはあまりにも非効率的であることである(Brind'Amour et al., 2015)。本発明者らは、CUT&RUNが、データ品質の低下を伴うことなく100ほども少ない細胞に好適であることを示した(Skene et al., 2018)。ITISを用いる本発明者らの実験の大部分において、本発明者らは、50,000〜500,000のヒトK562またはH1 ES細胞を使用してきた。ITISを少ない細胞数に適用することもできるかどうかを判定するために、本発明者らは、下は20細胞に至るまでK562細胞を段階希釈し、本発明者らの標準プロトコールに従って14サイクルを使用してH3K27me3およびRNAPII−Ser2+5についてITISを行った。Tapestaion分析に基づいて、本発明者らは、線形回収率(対数スケールで)をH3K27me3について下は20細胞に至るまでおよびRNAPIIについて下は60細胞に至るまで観察した(図73)。したがって、ITISは、少ない細胞数を必要とする応用に使用することができる。
本発明者らは、試料をシーケンシングし、ヒトの数およびE.coli断片の数をプロットした(図74)。本発明者らは、細胞数と放出される断片数の間に、最低細胞数(20〜200細胞)についてほぼ直線の、単調な関係(R=0.46)を観察する。本発明者らはまた、ヒトの数とE.coli断片の数の間に反比例関係を観察する。これは、E.coli混入が、本発明者らがCUT&RUNについて観察したのに類似した、下は少ない細胞数に至るまでITISのスパイクインプロキシとして役立ち得ることを確証する。
少ない細胞数のH27me3 ITISプロファイルを調査し、CUT&RUNプロファイルと比較したとき、本発明者らは、下は200細胞に至るまでデータ品質の低下を観察せず、60細胞についてはシグナル対ノイズ比のほんのわずかな低下しか観察しなかったが、それにもかかわらず、100細胞を用いてCUT&RUNについて得られたのより良好であることを観察した(図75)。本発明者らは、ITISは、少ない細胞数に好適であると結論付ける。
細胞型の区別などのいくつかの応用は、単一細胞を必要とし、この場合、断片の希薄さにより、畳み込みを解くために十分な情報を提供するために数百〜数千の個々の単一細胞ライブラリーが必要となる(Buenrostro et al., 2015;Cusanovich et al., 2018;Rosenberg et al., 2018)。単一細胞への応用のために、本発明者らは、最近ATAC−seqを適用してTakara ICELL8システムでITISを評価した(Mezger et al., 2018)。ICELL8は、個々の細胞を単一ウェルに選別するディスペンサーを含む、72×72アレイのナノウェルを使用する。ナノディスペンサーは、単一細胞をウェルのサブセット内にのみ堆積させ、他のものは、細胞を獲得しないか、または複数の細胞を獲得する。したがって、ICELL8は、蛍光顕微鏡を使用してアレイをイメージングし、単一細胞を有するウェルを認識し、単一細胞を有するウェルのみに試薬およびプライマーを分注する。ICELL8は、細胞がタグメンテーションステップを通して無傷のままであることからITISと適合性であるため、in situタグメンテーションによってアダプターを挿入した後に分注することができる。これに続いて、水平および垂直にそれぞれ整列させた72 i7および72 i5バーコードプライマーで増幅させて、シングルナノウェルから、それらの内容物がペアードエンドシーケンシング中に各々の末端から読み取られる多重化i7およびi5インラインバーコードを使用するシーケンシングのために組み合わせられた後、得られるDNA断片を区別する。
単一細胞ITISは、タグメンテーション後にPCR増幅しか必要としないので、他のプラットフォームに容易に適応される。ATAC−seqは、細胞選別(Buenrostro et al., 2015)およびICELL8ナノ分注(Mezger et al., 2018)による分注を使用して実行されており、原則的に、液滴カプセル化(Zheng et al., 2017)に直接適応させることができる。本発明者らは、ICELL8について概要を述べたのと同じステップを使用して、これらおよび他の単一細胞プラットフォームに同様にコンビナトリアルバーコード化を含むITISを適応させることができると予測する。
各々の細胞を較正するために、本発明者らは、抗体により特異的に結合される部位とスーパーインポーズする超高感受性部位を得るために塩処置を省く。塩処置の非存在は、混入E.coli DNAの高いタグメンテーションレベルも生じさせる結果となる。超高感受性部位断片の総数の、E.coli断片の総数に対する比を利用することにより、本発明者らは、倍数性を推測することができる。超高感受性部位が倍数性部位でスケーリングされる一方で、E.coli断片が細胞成分でスケーリングされるからである。この倍数性較正は細胞周期ステージおよびS期進行の情報を与える。G2は、G1の2倍の比を有し、S期は、細胞が収集された時点でのその特定の細胞においてゲノムがどの程度複製されているのか依存してそれらの間となるからである。超高感受性部位断片カウントは、抗体標的化ITIS部位も較正する。両方とも細胞倍数性でスケーリングされるからである。このように、別様に望ましくないタグメンテ−ションされた断片を除去しないことにより、本発明者らは、単一細胞プロファイリング力を向上させることができる有用な細胞特異的情報を得ることができる。
ITISの単一細胞への適応は、抗体の多重化を可能にし、バルク集団にも適用可能である。例えば、RNAPIIおよびH3K27アセチル化のための抗体に関する多重化によって、RNA−seqおよびATAC−seqを使用して達成されたもの(Cusanovich et al., 2018)に類似した、単一細胞におけるプロモーターおよびエンハンサーに関する情報が得られることになる。マルチITISについての組合せの可能性は、異なるエピゲノムの特徴に対する抗体の入手可能性によってのみ制限され、これに対して、各々のマルチOMIC法は、単一の特徴ペア専用である。さらに、マルチITISには、「マルチOMIC」戦略に必要とされる完全に異なる2つの基質を使用する不均一性に起因する固有の複雑さなしに同じゲノムリードアウトが得られるという利点がある。多重化戦略の例は、1)初代ウサギ抗体;2)モルモット抗ウサギ二次抗体および洗浄液;3)1つのアダプターセットと複合体化したpA−Tn5および洗浄液;4)初代マウス抗体;5)ウサギ抗マウス二次抗体および洗浄液;6)第2のアダプターセットと複合体化したpA−Tn5および洗浄液の逐次的添加であり、ここで、第1のpA−Tn5での飽和は、ウサギ一次抗体およびモルモット二次IgGエピトープを吸蔵し、pA−Tn5が結合するために利用可能なウサギ抗マウス二次IgGのみが残る。タグメンテ−ションを通常はMg++の添加によって行い、細胞を別々のプラットフォーム用にナノ分注または調製する。ステップ1〜3は、本発明者らの現行のプロトコールと同一であり、ステップ4〜6は、異なるIgG分子を使用することを除いてステップ1〜3と同一である。したがって、それを、ITISおよびCUT&RUNに既に使用した材料(モルモット抗ウサギおよびウサギ抗マウス二次抗体)を用いて行うことができる。原則的には、この手順を、ストレプトアビジン/ビオチンなどの、他の親和性システムに適応させることができ、これによってさらなる多重化が可能になる。
多重化戦略の例は、抗体+pA−Tn5+インデックス付きアダプター複合体を調製すること、およびこれらの複合体の標的への結合と標的特異的インデックスでのタグメンテーションの逐次的ラウンドを行うことであり、その結果、各々の標的は、一意的バーコードによって標識されることになる。モザイクエンドとシーケンサーアダプターの間へのバーコード配列の挿入は、第1の一次抗体を第2のものと区別するのに十分であろう。所望の数の異なるエピトープを標的化した後、細胞を別のプラットフォーム用にナノ分注または調製する。
ITISの別の特有の応用は、同じDNA上の2つの異なるタンパク質またはヒストン修飾の相互作用または極近接性を検出することができる。上で説明したように、抗体+pA−Tn5+インデックス付きアダプターの複合体、またはより単純な抗体A+pA−Tn5+P5アダプターもしくは抗体B+pA−Tn5+P7アダプター複合体をin vitroで作製し、これらの複合体を、透過処理された無傷細胞に逐次的に導入することができる。アダプター交換を回避するために、第2の複合体を、第1のタグメンテーションが完了した後に導入することとなる。P5アダプターとP7アダプターを各々の末端に有する断片のみをライブラリー調製中に増幅させることができ、そのため両方のタンパク質を有するDNA分子がライブラリー内に濃縮されることになる。このアプローチは、DNA上の2つの標的タンパク質の相対的方向性に関する情報も提供することとなる。このアプローチの可能性のある応用としては、H3K27me3ヒストンマークとH3K4me3ヒストンマークの両方を有する二価ヌクレオソーム、パイオニア転写因子および協同転写因子などが挙げられる。
また、Tn5は、DNAをタグメンテーションする能力ばかりでなく、幅広いサイズ範囲のDNA挿入物を挿入する能力も有する。したがって、それをクロマチンの一体性を保存することを望む応用およびDNAの断片化を防止する必要がある応用に使用することができる。
実施例11のための参考文献(これらの各々は、その全体が参照により本明細書に組み込まれる)
Brind'Amour, J., Liu, S., Hudson, M., Chen, C., Karimi, M.M., and Lorincz, M.C. (2015). An ultra-low-input native ChIP-seq protocol for genome-wide profiling of rare cell populations. Nat Commun 6, 6033.
Buenrostro, J.D., Wu, B., Litzenburger, U.M., Ruff, D., Gonzales, M.L., Snyder, M.P., Chang, H.Y., and Greenleaf, W.J. (2015). Single-cell chromatin accessibility reveals principles of regulatory variation. Nature 523, 486-490.
Cusanovich, D.A., Reddington, J.P., Garfield, D.A., Daza, R.M., Aghamirzaie, D., Marco-Ferreres, R., Pliner, H.A., Christiansen, L., Qiu, X., Steemers, F.J., et al. (2018). The cis-regulatory dynamics of embryonic development at single-cell resolution. Nature 555, 538-542.
Mezger, A., Klemm, S., Mann, I., Brower, K., Mir, A., Bostick, M., Farmer, A., Fordyce, P., Linnarsson, S., and Greenleaf, W. (2018). High-throughput chromatin accessibility profiling at single-cell resolution. Nat Commun 9, 3647.
Rosenberg, A.B., Roco, C.M., Muscat, R.A., Kuchina, A., Sample, P., Yao, Z., Graybuck, L.T., Peeler, D.J., Mukherjee, S., Chen, W., et al. (2018). Single-cell profiling of the developing mouse brain and spinal cord with split-pool barcoding. Science 360, 176-182.
Skene, P.J., Henikoff, J.G., and Henikoff, S. (2018). Targeted in situ genome-wide profiling with high efficiency for low cell numbers. Nat Protoc 13, 1006-1019.
Zheng, G.X., Terry, J.M., Belgrader, P., Ryvkin, P., Bent, Z.W., Wilson, R., Ziraldo, S.B., Wheeler, T.D., McDermott, G.P., Zhu, J., et al. (2017). Massively parallel digital transcriptional profiling of single cells. Nat Commun 8, 14049.
ある特定の実施形態を本明細書で例証し、説明したが、同じ目的を達成するために計画される多種多様な代替および/または均等実施形態またはインプリメンテーションを、示した実施形態の代わりに、本範囲を逸脱することなく使用することができることは、当業者には理解されるであろう。実施形態を非常に多種多様な方法で実行することができることは、当業者には容易に理解されるであろう。本出願は、本明細書で論じる実施形態のあらゆる適応形態および変形形態を包含することを意図している。したがって、実施形態は、特許請求の範囲およびその均等物によってのみ限定されることを明らかに意図したものである。

Claims (67)

  1. 透過処理された細胞と、目的のクロマチン関連因子に特異的に結合する一次抗体とを接触させるステップであって、前記一次抗体は複数のトランスポソームにカップリングされており、前記複数のトランスポソームのそれぞれは、
    少なくとも1種のトランスポザーゼ;ならびに
    第1のトランスポザーゼ認識部位を含む第1のDNA分子;および
    第2のトランスポザーゼ認識部位を含む第2のDNA分子
    を含むトランスポゾンを含む、ステップと;
    前記トランスポザーゼを活性化し、それによって、前記目的のクロマチン関連因子に結合しているDNAの配列を切り出し、およびDNAタグでタグ付けするステップであって、前記少なくとも1種のトランスポザーゼは、クロマチンDNAに前記第1および第2のDNA分子を組み込み、それによって、クロマチンDNAを切断し、ならびに前記第1および第2のDNA分子でタグ付けする、ステップと;
    前記切り出されたDNAを単離するステップと;
    前記切り出されたDNAの配列を決定し、それによって、前記細胞内のDNAの1つまたは複数の配列への目的のクロマチン関連因子の結合をマッピングするステップと
    を含む、細胞内のDNA配列への目的のクロマチン関連因子の結合部位を決定するためのin situの方法。
  2. 前記抗体が、前記少なくとも1種のトランスポザーゼに間接的にカップリングされている、請求項1に記載の方法。
  3. 前記トランスポザーゼが、前記一次抗体に特異的に結合する特異的結合剤に連結されている、請求項2に記載の方法。
  4. 前記細胞と、前記一次抗体に特異的に結合する二次抗体とを接触させるステップであって、前記トランスポザーゼは、前記二次抗体に特異的に結合する特異的結合剤に連結されている、ステップ
    をさらに含む、請求項1に記載の方法。
  5. 前記細胞と、前記一次抗体に特異的に結合する二次抗体とを接触させるステップと;
    前記細胞と、前記二次抗体に特異的に結合する三次抗体とを接触させるステップであって、
    前記トランスポザーゼは、前記三次抗体に特異的に結合する特異的結合剤に連結されている、ステップと
    をさらに含む、請求項1に記載の方法。
  6. 前記特異的結合剤が、プロテインAもしくはプロテインG、または前記一次抗体、前記二次抗体、および/もしくは前記三次抗体に特異的に結合する三次抗体を含む、請求項3から5のいずれか一項に記載の方法。
  7. クロマチンDNAの配列への前記目的のクロマチン関連因子の結合が直接的である、請求項1に記載の方法。
  8. 前記目的のクロマチン関連因子が転写因子である、請求項1から7のいずれか一項に記載の方法。
  9. 前記細胞が固体表面に固定化されている、請求項1から8のいずれか一項に記載の方法。
  10. 前記固体表面が、ビーズ、またはマイクロタイタープレートの壁を構成する、請求項9に記載の方法。
  11. 前記第1および/または第2のDNA分子がバーコードをさらに含む、請求項1から10のいずれか一項に記載の方法。
  12. 前記第1および/または第2のDNA分子がシーケンシングアダプターをさらに含む、請求項1から11のいずれか一項に記載の方法。
  13. 前記第1および/または第2のDNA分子がユニバーサルプライミング部位をさらに含む、請求項1から12のいずれか一項に記載の方法。
  14. 前記少なくとも1種のトランスポザーゼがTn5トランスポザーゼを含む、請求項1から13のいずれか一項に記載の方法。
  15. 前記少なくとも1種のトランスポザーゼがMuトランスポザーゼを含む、請求項1から13のいずれか一項に記載の方法。
  16. 前記少なくとも1種のトランスポザーゼがIS5またはIS91トランスポザーゼを含む、請求項1から13のいずれか一項に記載の方法。
  17. 前記少なくとも1種のトランスポソームが少なくとも2つの異なるトランスポソームを含み、前記異なるトランスポソームは、前記クロマチンDNAに異なるDNA配列を組み込む、請求項1から13のいずれか一項に記載の方法。
  18. 産生されたDNA断片を単離するステップをさらに含む、請求項1から17のいずれか一項に記載の方法。
  19. 単離された核酸断片を分析するステップをさらに含む、請求項18に記載の方法。
  20. 前記単離された核酸断片を分析するステップが、ヌクレオチド配列を決定するステップを含む、請求項19に記載の方法。
  21. 前記ヌクレオチド配列が、増幅の有無にかかわらず、シーケンシングまたはハイブリダイゼーション技法を使用して決定される、請求項20に記載の方法。
  22. 前記細胞が原核細胞である、請求項1から21のいずれか一項に記載の方法。
  23. 細胞が真核細胞である、請求項1から21のいずれか一項に記載の方法。
  24. 前記細胞がヒト細胞である、請求項23に記載の方法。
  25. 前記細胞および/または前記細胞の核を、前記細胞とジギトニンとを接触させることによって透過処理する、請求項1から24のいずれか一項に記載の方法。
  26. 前記切り出されたDNAを塩分画に供するステップをさらに含む、請求項1から25のいずれか一項に記載の方法。
  27. 前記目的のクロマチン関連因子と会合した1つまたは複数のタンパク質の素性を判定するステップをさらに含む、請求項1から26のいずれか一項に記載の方法。
  28. 少なくとも1つのトランスポソームのごく一部が既知の量の混入DNAを含み、前記混入DNAは較正に使用され得る、請求項1から27のいずれか一項に記載の方法。
  29. 請求項1から28のいずれか一項に記載の方法を含む、切り出されたクロマチンDNAのライブラリーを調製するための方法。
  30. 架橋されていない透過処理された細胞と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、前記特異的結合剤は、不活性状態にあるヌクレアーゼまたはトランスポザーゼに連結されている、ステップと;
    前記ヌクレアーゼまたはトランスポザーゼを活性化し、それによって、前記目的のクロマチン関連因子に結合しているDNAを切り出すステップと;
    前記細胞から拡散する前記切り出されたDNAを単離するステップと;
    前記切り出されたDNAの配列を決定し、それによって、前記細胞内のDNAの配列への目的のクロマチン関連因子の結合をマッピングするステップと
    を含む、細胞内のクロマチンDNAの配列への目的のクロマチン関連因子の結合を検出するための方法。
  31. 前記クロマチンDNAの配列への前記目的のクロマチン関連因子の結合が間接的である、請求項30に記載の方法。
  32. 前記クロマチンDNAの配列への前記目的のクロマチン関連因子の結合が直接的である、請求項30に記載の方法。
  33. 前記目的のクロマチン関連因子が転写因子である、請求項30から32のいずれか一項に記載の方法。
  34. 前記細胞が固体表面に固定化されている、請求項30から33のいずれか一項に記載の方法。
  35. 前記固体表面が、ビーズ、またはマイクロタイタープレートの壁を構成する、請求項34に記載の方法。
  36. 前記切り出されたクロマチンDNAを核酸タグでタグ付けするステップをさらに含む、請求項30から35のいずれか一項に記載の方法。
  37. 前記核酸タグがシーケンシングアダプターを含む、請求項36に記載の方法。
  38. 前記核酸タグがバーコードを含む、請求項36または37に記載の方法。
  39. 前記核酸タグがユニバーサルプライミング部位を含む、請求項36から38のいずれか一項に記載の方法。
  40. 前記ヌクレアーゼが、活性化された場合、前記クロマチン関連因子の結合部位のいずれかの側でDNA配列を切断する、請求項30から39のいずれか一項に記載の方法。
  41. 前記ヌクレアーゼが2価カチオンの添加によって活性化可能である、請求項30から40のいずれか一項に記載の方法。
  42. 前記ヌクレアーゼがMNaseである、請求項30から41のいずれか一項に記載の方法。
  43. 前記ヌクレアーゼがCa2+イオンによって活性化される、請求項30から42のいずれか一項に記載の方法。
  44. 前記ヌクレアーゼ活性がキレート剤の添加によってクエンチされる、請求項30から43のいずれか一項に記載の方法。
  45. トランスポソームが、
    少なくとも1種のトランスポザーゼ;ならびに
    第1のトランスポザーゼ認識部位を含む第1のDNA分子;および
    第2のトランスポザーゼ認識部位を含む第2のDNA分子
    を含むトランスポゾンを含み、前記少なくとも1種のトランスポザーゼは、クロマチンDNAに前記第1および第2のDNA分子を組み込み、それによって、クロマチンDNAを切断し、ならびに前記第1および第2のDNA分子でタグ付けする、
    請求項30から39のいずれか一項に記載の方法。
  46. 前記第1および/または第2のDNA分子がバーコードをさらに含む、請求項45に記載の方法。
  47. 前記第1および/または第2のDNA分子がシーケンシングアダプターをさらに含む、請求項45または46に記載の方法。
  48. 前記第1および/または第2のDNA分子がユニバーサルプライミング部位をさらに含む、請求項45から47のいずれか一項に記載の方法。
  49. 前記少なくとも1種のトランスポザーゼが、Tn5トランスポザーゼ、Muトランスポザーゼ、IS5もしくはIS91トランスポザーゼ、またはそれらの組合せを含む、請求項45から48のいずれか一項に記載の方法。
  50. 前記特異的結合剤が抗体である、請求項30から49のいずれか一項に記載の方法。
  51. 産生されたDNA断片を単離するステップをさらに含む、請求項30から50のいずれか一項に記載の方法。
  52. 前記DNA断片がサイズに基づいて単離される、請求項51に記載の方法。
  53. 単離された核酸断片を分析するステップをさらに含む、請求項52に記載の方法。
  54. 前記単離された核酸断片を分析するステップが、ヌクレオチド配列を決定するステップを含む、請求項53に記載の方法。
  55. 前記ヌクレオチド配列が、増幅の有無にかかわらず、シーケンシングまたはハイブリダイゼーション技法を使用して決定される、請求項54に記載の方法。
  56. 前記ヌクレアーゼまたは前記トランスポザーゼが融合タンパク質の一部である、請求項30から55のいずれか一項に記載の方法。
  57. 前記ヌクレアーゼまたは前記トランスポザーゼが、リンカーを用いて前記特異的結合剤に連結されている、請求項30から56のいずれか一項に記載の方法。
  58. 前記細胞が原核細胞である、請求項30から57のいずれか一項に記載の方法。
  59. 前記細胞が真核細胞である、請求項30から58のいずれか一項に記載の方法。
  60. 前記細胞がヒト細胞である、請求項59に記載の方法。
  61. 前記細胞および/または前記細胞の核を、前記細胞とジギトニンとを接触させることによって透過処理する、請求項30から60のいずれか一項に記載の方法。
  62. 前記切り出されたDNAを塩分画に供するステップをさらに含む、請求項30から61のいずれか一項に記載の方法。
  63. 上清をChIP−seqに供するステップをさらに含む、請求項30から62のいずれか一項に記載の方法。
  64. 前記目的のクロマチン関連因子と会合した1つまたは複数のタンパク質の素性を判定するステップをさらに含む、請求項30から63のいずれか一項に記載の方法。
  65. 前記タンパク質の前記素性を決定するステップが抗体の使用を含む、請求項64に記載の方法。
  66. 前記タンパク質の前記素性を決定するステップが質量分析を含む、請求項65に記載の方法。
  67. 請求項30から66のいずれか一項に記載の方法を含む、切り出されたクロマチンDNAのライブラリーを調製するための方法。
JP2020517134A 2017-09-25 2018-09-25 高効率標的in situゲノムワイドプロファイリング Active JP7241069B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022184103A JP2023015327A (ja) 2017-09-25 2022-11-17 高効率標的in situゲノムワイドプロファイリング

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762562918P 2017-09-25 2017-09-25
US62/562,918 2017-09-25
PCT/US2018/052707 WO2019060907A1 (en) 2017-09-25 2018-09-25 HIGH PERFORMANCE TARGETED IN SITU PANGENOMIC PROFILING

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022184103A Division JP2023015327A (ja) 2017-09-25 2022-11-17 高効率標的in situゲノムワイドプロファイリング

Publications (3)

Publication Number Publication Date
JP2021500860A true JP2021500860A (ja) 2021-01-14
JP2021500860A5 JP2021500860A5 (ja) 2021-11-04
JP7241069B2 JP7241069B2 (ja) 2023-03-16

Family

ID=65811500

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020517134A Active JP7241069B2 (ja) 2017-09-25 2018-09-25 高効率標的in situゲノムワイドプロファイリング
JP2022184103A Pending JP2023015327A (ja) 2017-09-25 2022-11-17 高効率標的in situゲノムワイドプロファイリング

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022184103A Pending JP2023015327A (ja) 2017-09-25 2022-11-17 高効率標的in situゲノムワイドプロファイリング

Country Status (11)

Country Link
US (2) US11733248B2 (ja)
EP (3) EP4060041B1 (ja)
JP (2) JP7241069B2 (ja)
KR (1) KR20200066648A (ja)
CN (1) CN111727248A (ja)
AU (1) AU2018335575A1 (ja)
CA (1) CA3077270A1 (ja)
DK (2) DK4060041T3 (ja)
ES (1) ES2924185T3 (ja)
FI (1) FI4060041T3 (ja)
WO (1) WO2019060907A1 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
AU2013226081B2 (en) 2012-02-27 2018-06-14 Becton, Dickinson And Company Compositions and kits for molecular counting
WO2015031691A1 (en) 2013-08-28 2015-03-05 Cellular Research, Inc. Massively parallel single cell analysis
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
SG11201901733PA (en) 2016-09-26 2019-04-29 Cellular Res Inc Measurement of protein expression using reagents with barcoded oligonucleotide sequences
WO2019084043A1 (en) 2017-10-26 2019-05-02 10X Genomics, Inc. METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS
EP3752832A1 (en) 2018-02-12 2020-12-23 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
EP3788171B1 (en) * 2018-05-03 2023-04-05 Becton, Dickinson and Company High throughput multiomics sample analysis
US11932899B2 (en) 2018-06-07 2024-03-19 10X Genomics, Inc. Methods and systems for characterizing nucleic acid molecules
US11639517B2 (en) 2018-10-01 2023-05-02 Becton, Dickinson And Company Determining 5′ transcript sequences
US11845983B1 (en) 2019-01-09 2023-12-19 10X Genomics, Inc. Methods and systems for multiplexing of droplet based assays
ES2945227T3 (es) 2019-01-23 2023-06-29 Becton Dickinson Co Oligonucleótidos asociados con anticuerpos
US11467153B2 (en) 2019-02-12 2022-10-11 10X Genomics, Inc. Methods for processing nucleic acid molecules
SG11202108788TA (en) 2019-02-12 2021-09-29 10X Genomics Inc Methods for processing nucleic acid molecules
US20220267759A1 (en) * 2019-07-12 2022-08-25 New York Genome Center, Inc. Methods and compositions for scalable pooled rna screens with single cell chromatin accessibility profiling
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
EP4055160B1 (en) 2019-11-08 2024-04-10 Becton Dickinson and Company Using random priming to obtain full-length v(d)j information for immune repertoire sequencing
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
EP3872190A1 (en) 2020-02-26 2021-09-01 Antibodies-Online GmbH A method of using cut&run or cut&tag to validate crispr-cas targeting
EP4150118A1 (en) 2020-05-14 2023-03-22 Becton Dickinson and Company Primers for immune repertoire profiling
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
WO2022056309A1 (en) * 2020-09-11 2022-03-17 Fred Hutchinson Cancer Research Center Improved high efficiency targeted in situ genome-wide profiling
EP4001429A1 (en) * 2020-11-16 2022-05-25 Antibodies-Online GmbH Analysis of crispr-cas binding and cleavage sites followed by high-throughput sequencing (abc-seq)
EP4247967A1 (en) 2020-11-20 2023-09-27 Becton, Dickinson and Company Profiling of highly expressed and lowly expressed proteins
CN112553695B (zh) * 2021-02-23 2021-05-11 翌圣生物科技(上海)有限公司 鉴定靶蛋白染色质结合图谱的快速建库方法
CN113025731A (zh) * 2021-03-04 2021-06-25 宁夏医科大学总医院 一种基于靶向扩增子富集策略的高通量病原菌检测试剂盒
CN112795563A (zh) * 2021-03-23 2021-05-14 上海欣百诺生物科技有限公司 生物素化的转座体在回收CUT&Tag或ATAC-seq产物中的用途及方法
KR20220141246A (ko) * 2021-04-09 2022-10-19 주식회사 셀레믹스 간소화된 차세대 염기서열 분석 라이브러리 전처리 방법
CN113046381A (zh) * 2021-04-12 2021-06-29 南华大学 用于分离生物体内特异性蛋白-dna复合体的方法、融合蛋白及其制备方法
EP4347884A1 (en) * 2021-05-24 2024-04-10 University of Essex Enterprises Limited Method and system for identifying genomic regions with condition sensitive occupancy/positioning of nucleosomes and/or chromatin
WO2023277763A1 (en) * 2021-06-28 2023-01-05 Chen Xingqi Method of preparing dna from formalin-fixed-paraffin-embedded (ffpe) tissue samples
CN113801915B (zh) * 2021-07-30 2023-01-24 生物岛实验室 获取目标rna结合蛋白靶rna的方法
WO2023018730A1 (en) * 2021-08-11 2023-02-16 Illumina, Inc. Detection of analytes using targeted epigenetic assays, proximity-induced tagmentation, strand invasion, restriction, or ligation
CN114106196A (zh) * 2021-10-29 2022-03-01 陈凯 抗体-转座酶融合蛋白及其制备方法和应用
WO2023081243A1 (en) * 2021-11-03 2023-05-11 Toreador Therapeutics, Inc. Methods and systems for super-resolution study of therapies
WO2023212580A1 (en) * 2022-04-25 2023-11-02 Fred Hutchinson Cancer Center Profiling rna at chromatin targets in situ by antibody-targeted tagmentation
WO2024008891A1 (en) * 2022-07-07 2024-01-11 Cambridge Enterprise Limited Methods for mapping binding sites of compounds
WO2024049928A1 (en) * 2022-08-30 2024-03-07 Northeastern University Epigenetic analysis after single cell interactions using microfluidics
CN117385478A (zh) * 2023-04-28 2024-01-12 南京诺唯赞生物科技股份有限公司 一种组合物及研究蛋白质-dna互作基因文库的构建方法
CN117106857B (zh) * 2023-10-24 2024-02-09 北京大学 一种血浆游离染色质的检测方法、试剂盒及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014190214A1 (en) * 2013-05-22 2014-11-27 Active Motif, Inc. Targeted transposition for use in epigenetic studies
JP2016518860A (ja) * 2013-05-23 2016-06-30 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 個別的エピゲノミクスのための天然クロマチンへの転移
WO2017025594A1 (en) * 2015-08-12 2017-02-16 Cemm Forschungszentrum Für Molekulare Medizin Gmbh Methods for studying nucleic acids

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1323293C (en) 1987-12-11 1993-10-19 Keith C. Backman Assay using template-dependent nucleic acid probe reorganization
ATE138106T1 (de) 1988-07-20 1996-06-15 David Segev Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen
EP0438803B1 (en) 1990-01-26 1997-03-12 Immunomedics, Inc. Vaccines against cancer and infectious diseases
US5427930A (en) 1990-01-26 1995-06-27 Abbott Laboratories Amplification of target nucleic acids using gap filling ligase chain reaction
CA2163426C (en) 1993-05-28 2005-11-01 T. William Hutchens Method and apparatus for desorption and ionization of analytes
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
AU711115B2 (en) 1994-07-15 1999-10-07 Akzo Nobel N.V. Use of RNA polymerase to improve nucleic acid amplification process
AT402203B (de) 1995-06-13 1997-03-25 Himmler Gottfried Dipl Ing Dr Verfahren zur transkriptionsfreien amplifizierung von nucleinsäuren
EP1736554B1 (en) 1996-05-29 2013-10-09 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
US5866336A (en) 1996-07-16 1999-02-02 Oncor, Inc. Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon
US5925545A (en) 1996-09-09 1999-07-20 Wisconsin Alumni Research Foundation System for in vitro transposition
US5965443A (en) 1996-09-09 1999-10-12 Wisconsin Alumni Research Foundation System for in vitro transposition
NZ516848A (en) 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
US6159736A (en) 1998-09-23 2000-12-12 Wisconsin Alumni Research Foundation Method for making insertional mutations using a Tn5 synaptic complex
EP1173878B1 (en) 1999-04-27 2011-04-06 Bio-Rad Laboratories, Inc. Probes for a gas phase ion spectrometer
US6406896B1 (en) 1999-08-02 2002-06-18 Wisconsin Alumni Research Foundation Transposase enzyme and method for use
WO2001068807A2 (en) 2000-03-16 2001-09-20 Fred Hutchinson Cancer Research Center Identification of in vivo dna binding loci of chromatin proteins using a tethered nucleotide modification enzyme
AU2002225888A1 (en) 2000-12-05 2002-06-18 Wisconsin Alumni Research Foundation. Double transposition methods for manipulating nucleic acids
US7527966B2 (en) 2002-06-26 2009-05-05 Transgenrx, Inc. Gene regulation in transgenic animals using a transposon-based vector
US7316903B2 (en) 2003-03-28 2008-01-08 United States Of America As Represented By The Department Of Health And Human Services Detection of nucleic acid sequence variations using phase Mu transposase
US7083980B2 (en) 2003-04-17 2006-08-01 Wisconsin Alumni Research Foundation Tn5 transposase mutants and the use thereof
US7608434B2 (en) 2004-08-04 2009-10-27 Wisconsin Alumni Research Foundation Mutated Tn5 transposase proteins and the use thereof
US7790379B2 (en) 2005-05-19 2010-09-07 Universite De Geneve Mapping of proteins along chromatin by chromatin cleavage
CA2821559C (en) 2011-01-28 2017-01-31 Illumina, Inc. Oligonucleotide replacement for di-tagged and directional libraries
WO2013078470A2 (en) * 2011-11-22 2013-05-30 MOTIF, Active Multiplex isolation of protein-associated nucleic acids
US20160208323A1 (en) 2013-06-21 2016-07-21 The Broad Institute, Inc. Methods for Shearing and Tagging DNA for Chromatin Immunoprecipitation and Sequencing
AU2015247779B2 (en) * 2014-04-15 2021-06-24 Illumina, Inc. Modified transposases for improved insertion sequence bias and increased DNA input tolerance
CA2949952C (en) 2014-05-23 2021-03-23 Fluidigm Corporation Haploidome determination by digitized transposons
AU2016219328B2 (en) * 2015-02-10 2022-04-21 Illumina, Inc. Methods and compositions for analyzing cellular components
WO2016156469A1 (en) * 2015-03-31 2016-10-06 Max-Delbrück-Centrum für Molekulare Medizin Genome architecture mapping on chromatin
WO2017156336A1 (en) * 2016-03-10 2017-09-14 The Board Of Trustees Of The Leland Stanford Junior University Transposase-mediated imaging of the accessible genome

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014190214A1 (en) * 2013-05-22 2014-11-27 Active Motif, Inc. Targeted transposition for use in epigenetic studies
JP2016518860A (ja) * 2013-05-23 2016-06-30 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 個別的エピゲノミクスのための天然クロマチンへの転移
WO2017025594A1 (en) * 2015-08-12 2017-02-16 Cemm Forschungszentrum Für Molekulare Medizin Gmbh Methods for studying nucleic acids

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
P. J SKENE, ET AL., ELIFE, vol. 6:e21856, JPN6022024693, 2017, pages 1 - 35, ISSN: 0004801724 *

Also Published As

Publication number Publication date
JP2023015327A (ja) 2023-01-31
AU2018335575A1 (en) 2020-04-16
JP7241069B2 (ja) 2023-03-16
CA3077270A1 (en) 2019-03-28
EP4060041A1 (en) 2022-09-21
EP4339298A2 (en) 2024-03-20
CN111727248A (zh) 2020-09-29
DK3688157T3 (da) 2022-07-04
EP3688157A1 (en) 2020-08-05
US11885814B2 (en) 2024-01-30
EP3688157A4 (en) 2021-05-26
EP4060041B1 (en) 2023-12-27
US20220214356A1 (en) 2022-07-07
EP4339298A3 (en) 2024-04-17
WO2019060907A1 (en) 2019-03-28
FI4060041T3 (fi) 2024-03-26
US11733248B2 (en) 2023-08-22
ES2924185T3 (es) 2022-10-05
US20220228203A1 (en) 2022-07-21
EP3688157B1 (en) 2022-04-27
KR20200066648A (ko) 2020-06-10
DK4060041T3 (da) 2024-04-02

Similar Documents

Publication Publication Date Title
JP7241069B2 (ja) 高効率標的in situゲノムワイドプロファイリング
JP6697070B2 (ja) 核酸の研究方法
US20230272452A1 (en) Combinatorial single molecule analysis of chromatin
Alvarez-Dominguez et al. The super-enhancer-derived alncRNA-EC7/bloodlinc potentiates red blood cell development in trans
US20230332213A1 (en) Improved high efficiency targeted in situ genome-wide profiling
JP2023539980A (ja) シークエンシングによる標的タグメンテーションからのrna発現およびdnaに関する個々の細胞の並行解析
Thompson et al. Extensive co-binding and rapid redistribution of NANOG and GATA6 during emergence of divergent lineages
Petryk et al. Genome-wide and sister chromatid-resolved profiling of protein occupancy in replicated chromatin with ChOR-seq and SCAR-seq
Marr et al. Whole-genome methods to define DNA and histone accessibility and long-range interactions in chromatin
Marr Probing Genome-Wide Native Chromatin Structure via Histone Surface Accessibilities
Karabacak Calviello Characterization of cis-regulatory elements via open chromatin profiling
US20190345545A1 (en) Methods of genome sequencing and epigenetic analysis

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210921

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220617

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220630

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230111

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20230111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230306

R150 Certificate of patent or registration of utility model

Ref document number: 7241069

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150