JP2021500860A

JP2021500860A - 高効率標的ｉｎｓｉｔｕゲノムワイドプロファイリング

Info

Publication number: JP2021500860A
Application number: JP2020517134A
Authority: JP
Inventors: スティーブンヘニコフ，; オクル，ハティスセダカヤ; テリードーンブライソン，; ピータージェイムズスキーン，
Original assignee: フレッドハッチンソンキャンサーリサーチセンター
Priority date: 2017-09-25
Filing date: 2018-09-25
Publication date: 2021-01-14
Anticipated expiration: 2038-09-25
Also published as: JP2023015327A; AU2018335575A1; JP7241069B2; CA3077270A1; EP4060041A1; EP4339298A2; CN111727248A; DK3688157T3; EP3688157A1; US11885814B2; EP3688157A4; EP4060041B1; US20220214356A1; EP4339298A3; WO2019060907A1; FI4060041T3; US11733248B2; ES2924185T3; US20220228203A1; EP3688157B1

Abstract

透過処理された細胞または核と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、特異的結合剤は、不活性であるヌクレアーゼまたは活性化可能なトランスポソームに連結されている、ステップと；ヌクレアーゼまたはトランスポザーゼを活性化し、それによって、目的のクロマチン関連因子に結合しているクロマチンＤＮＡの配列を切り出すステップと；切り出されたＤＮＡを単離するステップと；切り出されたＤＮＡの配列を決定し、それによって、細胞内のクロマチンＤＮＡの配列への目的のクロマチン関連因子の結合を検出するステップとを含む、細胞内のクロマチンＤＮＡの配列への目的のクロマチン関連因子の結合を検出するための方法。

Description

関連出願の相互参照
本出願は、２０１７年９月２５日に出願された米国仮特許出願第６２／５６２，９１８号の恩典を主張するものであり、その全体がこれにより参照により本明細書に具体的に組み込まれる。

技術分野
本開示は、クロマチンプロファイリングの方法に関する。具体的には、本開示は、転写因子およびヌクレオソームなどのＤＮＡ結合タンパク質をプロファイリングするための方法であって、トランスポザーゼまたはヌクレアーゼなどの酵素による、抗体標的化制御切断によって、ＤＮＡシーケンシングのための結合ＤＮＡが放出される、方法に関する。

背景
転写因子（ＴＦ）の、ＤＮＡ上のそれらの結合部位における作用は、遺伝子発現パターンを推進し、そのためゲノムワイドＴＦマッピングは、個々の研究者らおよび大規模なインフラストラクチャープロジェクトの両方にとっての中心的目標になっている。ＴＦプロファイリングは、３０年以上前にそれが最初に導入されて以来ほとんど変化していないプロトコールである、クロマチン免疫沈降（ＣｈＩＰ）を使用して最もよく行われる（Solomon and Varshavsky, 1985）。細胞をホルムアルデヒドで架橋し、クロマチンを断片化および可溶化し、抗体を添加し、抗体に結合したクロマチンをＤＮＡ抽出のために回収する。ＤＮＡマッピング技術の継続的進歩は、Ｘ−ＣｈＩＰ（ホルムアルデヒド架橋ＣｈＩＰ）の使用に大変革をもたらしており、ＣｈＩＰ−ｓｅｑとともに、ＴＦの塩基対分解能マッピングが実現可能になった（Rhee and Pugh, 2011；Skene and Henikoff, 2015；He et al., 2015）。

転写因子および他のタンパク質との直接的物理的相互作用における特異的ＤＮＡ部位を、クロマチン免疫沈降（immuneprecipitation）によって単離して、ｉｎｖｉｖｏで目的のタンパク質に結合した標的ＤＮＡ部位のライブラリーを産生し得る。超並列シーケンシングの到来とともに、ライブラリーを迅速に分析し得、全ゲノム配列データベースにマッピングして、任意のタンパク質とＤＮＡとの相互作用パターン、または任意のエピジェネティッククロマチン修飾のパターンを判定し得る。これは、転写因子、ポリメラーゼおよび転写装置、構造タンパク質、タンパク質修飾、ならびにＤＮＡ修飾など、一連のＣｈＩＰ可能なタンパク質および修飾に適用され得る。ＣｈＩＰシーケンシング（ＣｈＩＰ−ｓｅｑ）を使用して、例えば遺伝子発現を調節するために、どのようにタンパク質がＤＮＡと相互作用するのかを判定し得る。ＣｈＩＰ−ｓｅｑ技術は、現在、主に、ハイブリダイゼーションアレイを必要とするＣｈＩＰチップに代わるものとして見られている。アレイは固定数のプローブに制限されるので、これは必然的に何らかのバイアスを導入する。ＣｈＩＰ−ｓｅｑへの向上は、ゲノム全体を断片化して免疫沈降のための可溶性抽出物を創出する間、ｉｎｖｉｖｏパターンを保つ架橋ステップを保持する。しかしながら、架橋はエピトープマスキングを促進し得、偽陽性結合部位を生成し得る（Teytelman et al., 2013；Park et al., 2013；Jain et al., 2015；Baranello et al., 2016；Meyer and Liu, 2014）。ＣｈＩＰは、静電接触を妨げないイオン条件を使用して、架橋なしでも実施され得る（Kasinathan et al., 2014）。「ネイティブ」ＣｈＩＰは直接的なタンパク質−ＤＮＡ相互作用のマップを提供し、感度および特異度トレードオフはＸ−ＣｈＩＰ法に勝るとも劣らない。ネイティブＣｈＩＰは、エピトープマスキングに関する問題も最小限に抑え、Ｘ−ＣｈＩＰと比べて効率を向上させ、したがって、出発細胞数が低い場合に、より適している（O'Neill et al., 2006；Brind'Amour et al., 2015）。しかし、タンパク質−ＤＮＡ複合体の不完全な抽出効率、および結合の潜在的喪失に関する問題は残る。また、可溶化は、全クロマチンを抗体に曝露し、非特異的バックグラウンドをもたらし、それがシグナル対ノイズを限定し、特異的なクロマチン特質を見分ける余分なシーケンシングを必要とする。これらのバイアスおよび非効率性が理由で、ＣｈＩＰは多数の細胞を必要とするので、例えば限定された数の初代細胞または少量の組織しかない場合には不適切である。ゆえに、新しくかつより優れた、ＣｈＩＰに基づかない方法が必要とされる。本開示はそれらの必要性を満たす。
実施形態は、添付の図面と併せて後続の詳細な説明によってよりよく理解されるであろう。実施形態は、例として示されるものであり、添付の図面の図に限定する目的で示されるものではない。

Solomon MJ, Varshavsky A. 1985. Formaldehyde-mediated DNA-protein crosslinking: a probe for in vivo chromatin structures. PNAS 82:6470−6474. doi: 10.1073/pnas.82.19.6470, PMID: 2995966 Rhee HS, Pugh BF. 2011. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147:1408−1419. doi: 10.1016/j.cell.2011.11.013, PMID: 22153082 Skene PJ, Henikoff S. 2015. A simple method for generating high-resolution maps of genome-wide protein binding. eLife 4:e09225. doi: 10.7554/eLife.09225, PMID: 26079792 He Q, Johnston J, Zeitlinger J. 2015. ChIP-nexus enables improved detection of in vivo transcription factor binding footprints. Nature Biotechnology 33:395−401. doi: 10.1038/nbt.3121 Teytelman L, Thurtle DM, Rine J, van Oudenaarden A. 2013. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. PNAS 110:18602−18607. doi: 10.1073/pnas.1316064110, PMID: 24173036 Park D, Lee Y, Bhupindersingh G, Iyer VR. 2013. Widespread misinterpretable ChIP-seq bias in yeast. PLoS One 8:e83506. doi: 10.1371/journal.pone.0083506, PMID: 24349523 Jain D, Baldi S, Zabel A, Straub T, Becker PB. 2015. Active promoters give rise to false positive ’Phantom Peaks’ in ChIP-seq experiments. Nucleic Acids Research 43:6959−6968. doi: 10.1093/nar/gkv637, PMID: 26117547 Baranello L, Kouzine F, Sanford S, Levens D. 2016. ChIP bias as a function of cross-linking time. Chromosome Research 24:175−181. doi: 10.1007/s10577-015-9509-1, PMID: 26685864 Meyer CA, Liu XS. 2014. Identifying and mitigating bias in next-generation sequencing methods for chromatin biology. Nature Reviews Genetics 15:709−721. doi: 10.1038/nrg3788, PMID: 25223782 Kasinathan S, Orsi GA, Zentner GE, Ahmad K, Henikoff S. 2014. High-resolution mapping of transcription factor binding sites on native chromatin. Nature Methods 11:203−209. doi: 10.1038/nmeth.2766, PMID: 24336359 O’Neill LP, VerMilyea MD, Turner BM. 2006. Epigenetic characterization of the early embryo with a chromatin immunoprecipitation protocol applicable to small cell populations. Nature Genetics 38:835−841. doi: 10.1038/ ng1820, PMID: 16767102 Brind’Amour J, Liu S, Hudson M, Chen C, Karimi MM, Lorincz MC. 2015. An ultra-low-input native ChIP-seq protocol for genome-wide profiling of rare cell populations.

図１Ａ〜１Ｄは、本明細書で開示されるＣＵＴ＆ＲＵＮ方法が、ＴＦ−ＤＮＡ複合体の制限消化物を生じさせることを示す。図１Ａ：ＣＵＴ＆ＲＵＮ戦略の模式図。磁気ビーズに結合された核を、抗体で（または必要に応じて一次および二次抗体で）、および核膜孔を通って拡散するプロテインＡ−ＭＮａｓｅ（ｐＡ−ＭＮ）で、うまく処置することができる。ＭＮａｓｅ切断を活性化するためのＣａ＋＋の添加後、断片が放出され、核から拡散する。上清から抽出されたＤＮＡは、ペアードエンドシーケンシング用のライブラリーを調製するために使用される。図１Ｂ；ＣＵＴ＆ＲＵＮは、クロマチン粒子を切断し、Ｓ．ｃｅｒｅｖｉｓｉａｅ核内に放出する。この核内の内在性Ｈ２Ａ遺伝子をＨ２Ａ−３ＸＦＬＡＧで置き換え、ＣＵＴ＆ＲＵＮに供し、０℃で、Ｃａ^＋＋中で、示されている時間、インキュベートした。不溶性（ｉｎｓ）および可溶性（ｓｏｌ）画分両方から抽出したＤＮＡを１％アガロースゲルで電気泳動した。１０分間並行して、しかし一次マウス抗ＦＬＡＧ抗体を添加せずに、Ｎｏ１°Ａｂ対照を消化した。図１Ｃ；示されているＴＦ試料のシーケンシングからのマッピングされたペアードエンドリードのサイズ分布。Ｈ２Ａサイズ分布が比較のために含まれている。データは、塩基対の各々の長さのステップでのポイント全ての合計が１になるように正規化されている。図１Ｄ；１２０ｂｐ未満のおよび１５０ｂｐより長い断片長クラスを示す、Ａｂｆ１およびＲｅｂ１試料についてのタイムコースプロファイル（１トラック当たり約２，０００，０００〜３，０００，０００のマッピングされたペアードエンドリード）であって、ＯＲＧＡＮＩＣＣｈＩＰ−ｓｅｑ（マッピングされたペアードエンドリード約２０，０００，０００〜３０，０００，０００）および標準ＣｈＩＰ−ｓｅｑ（Paul et al., 2015）（Ａｂｆ１にマッピングされたシングルエンド５０ｂｐリード約５，０００，０００、およびＲｅｂ１にマッピングされたシングルエンド５０ｂｐリード約１２６，０００，０００）と比較したプロファイル。陰性対照トラックは、一次抗体の除外（Ｎｏ１°Ａｂ）の結果を示す。各々のＴＦおよび断片サイズ群の中で、Ｙ軸のスケールは、ＩＧＶにより自動スケーリングされて正規化されたカウントを示し、断片サイズクラスがスーパーインポーズされている。チェックマークは、有意なＡｂｆ１（上方）およびＲｅｂ１（下方）モチーフの位置を示す。この領域は、３番染色体上のＡｂｆ１モチーフの最大クラスターを有するので選択した。

図２Ａおよび２Ｂは、ＣＵＴ＆ＲＵＮの精度およびロバストネスが、ＣｈＩＰ−ｓｅｑに引けを取らないことを示す。１”〜３２”タイムコース試料をプールして１２０ｂｐ未満のサイズのクラスと１５０ｂｐより大きいサイズのクラスに分ける（左側）単一の実験（２０１６０６３０）からのＣＵＴ＆ＲＵＮデータセットのＡｂｆ１（図２Ａ）およびＲｅｂ１（図２Ｂ）ヒートマップ。１２０ｂｐ未満のサイズクラスのＯＲＧＡＮＩＣＣｈＩＰ−ｓｅｑ（中央）および標準ＣｈＩＰ−ｓｅｑデータセット（右側）も、示されている。Ａｂｆ１は、約１０ｂｐの間隔を空けて２つのＤＮＡ結合ドメインを有する（Cho et al., 1995）が、Ｒｅｂ１は、単一のＭｙｂ様ＤＮＡ結合ドメインを有する（Morrow et al., 1990）。ＭＮａｓｅ消化後のＡｂｆ１クロマチンの可溶化は、特異度と感度間の最高のトレードオフを達成するために６００ｍＭＮａＣｌを必要としたが、Ｒｅｂ１については、８０ｍＭで最高の結果が得られており（Kasinathan et al., 2014）、これらが比較に使用されたデータセットである。ＯＲＧＡＮＩＣとＣｈＩＰ−ｅｘｏおよびＣｈＩＰ−チップとの以前の比較（Kasinathan et al., 2014）と同様に、全ての統計的に有意なＡｂｆ１およびＲｅｂ１モチーフのセットは、感度（正しいＴＦによる部位の占有）および特異度（誤ったＴＦの部位からの排除）を判断するための「究極の判断基準」と考えられる。アラインメントされているプロファイリングデータは、表示のために（Ａｂｆ１およびＲｅｂ１部位が互いに５０ｂｐ以内にある８１部位を除去して）同じＴＦについての（上部）および他のＴＦについての（下部）モチーフを中心とし、方向性を持たせたものであり、Ｊａｖａ（登録商標）Ｔｒｅｅｖｉｅｗを使用してｌｏｇ^２スケーリングおよびコントラスト＝５で１２０ｂｐ未満のデータセットの−１ｋｂ〜＋１ｋｐスパンで平均画素密度により順序付けされたものである。順序付けは、ＣＵＴ＆ＲＵＮ（１２０ｂｐ未満の断片に基づく）およびＣｈＩＰ−ｓｅｑについて独立して行った。この場合、隣接領域に対する占有された部位のおおよその割合が明らかになり、上部パネル（正しいＴＦ）と下部パネル（誤ったＴＦ）の比較により、データセットについての感度／特異度トレードオフが示される。部位は、ＣｈＩＰ−ｓｅｑデータに基づいて位置特異的スコア行列（ＰＳＳＭ）を使用してＳ．ｃｅｒｅｖｉｓｉａｅゲノムのＭＡＳＴ検索により決定したが、ＣＵＴ＆ＲＵＮデータに基づいてＰＳＳＭを用いるＭＡＳＴを使用しても同様の結果が得られた。

図３Ａ〜３Ｃは、ＣＵＴ＆ＲＵＮが高分解能でＴＦ結合部位をマッピングすることを示す。図３Ａ；断片末端のマッピングは、組み合わせた１”〜３２”データセット（図２参照）からの全ての正規化された塩基対カウントをプロットして、それらの方向性を持つアラインメントされたモチーフでゲノムワイドに平均したＡｂｆ１およびＲｅｂ１ＣＵＴ＆ＲＵＮデータセットについて、深い「穴」および急勾配の「壁」を明示する。下流および上流の「勾配」に明らかな約１０ｂｐの周期性がある鋸歯状パターンが、図３Ａに示されている１ｂｐ分解能プロファイルと、１１ｂｐスライディングウインドウで平滑化された同じプロファイルとの間の差異の図３Ｂ自己相関分析により確認され、図３Ｂは、平均Ｇ＋Ｃ含量（細い線）には対応する周期性がないことも示す。図３Ｃは、図３Ａと同じであるが、１１ｂｐスライディングウインドウでの平滑化に供され、より大きいスケールで表示されている。Ｒｅｂ１周辺の勾配が＋１５０および−１５０で落ち込みを示すことは、ＯＲＧＡＮＩＣインプットデータからの１５０ｂｐより大きいサイズクラスに基づいて下（核、Ｙ軸任意単位）に示されている、位相が定まったヌクレオソームの存在を表す可能性が高い（Kasinathan et al., 2014）。

図４Ａ〜４Ｃは、ＣＵＴ＆ＲＵＮが大きい移動性クロマチン複合体を正確にマッピングすることを示す。図４Ａ；２つのＭＮａｓｅ消化時点についてのＭｏｔ１ＯＲＧＡＮＩＣデータ（２．５分および１０分、１試料当たり平均２２，０００，０００リード）（Zentner and Henikoff, 2013）とアラインメントされた、一次抗体なし（Ｎｏ１°Ａｂ）陰性対照を含む、Ｍｏｔ１ＣＵＴ＆ＲＵＮタイムコース実験（１試料当たり平均約３，０００，０００のペアードエンドリード）を示す代表トラック。点線として示されているＴＢＰ部位は、Ｍｏｔ１ピークがＴＢＰピーク最大値のすぐ上流にあることを明示する。図４Ｂ；絶対定量を示す、スパイクイン正規化されたＳｔｈ１ＣＵＴ＆ＲＵＮ消化についての１２０倍範囲にわたっての占有プロファイル。図４Ｃ；Ｓｔｈ１ＯＲＧＡＮＩＣプロファイル（約１５，０００，０００リード）は、ＣＵＴ＆ＲＵＮ５秒試料（約２，０００，０００リード）との一致を示す。同じ１２０ｂｐ未満のＣＵＴ＆ＲＵＮ５秒プロファイルが、両方のパネル（図４Ｂ）および（図４Ｃ）に示されているが、異なるスケールで示されていることに留意されたい。

図５Ａ〜５Ｄは、ＣＵＴ＆ＲＵＮが希少な高不溶性Ｓ．ｃｅｒｅｖｉｓｉａｅ動原体複合体をマッピングすることを示す。図５Ａ；示されている時間にわたっての消化を停止した後、試料を半分に分割し、可溶性画分と全ＤＮＡの両方を抽出した。大きい断片をライブラリー調製前にＡＭＰｕｒｅビーズで全ＤＮＡから除去した。正規化されたカウントがＳ．ｃｅｒｅｖｉｓｉａｅの１番セントロメアについて示されており、ここでのＣｓｅ４およびＨ２Ａトラックは、同じＹ軸スケールのものである。セントロメアにわたって同様の最大値もゲノムワイドに見られた。図５Ｂは、図５Ａと同じであるが、セントロメアの５ｋｂ区画を徐々に拡大したものである。図５Ｃ；それらの中点周辺でアラインメントされた、１６のＳ．ｃｅｒｅｖｉｓｉａｅセントロメア全ての中央値についてｌｏｇ_２（不溶性）＝ｌｏｇ_２（合計）−ｌｏｇ_２（可溶性）＝ｌｏｇ_２（合計／可溶性）と定義される、不溶性Ｃｓｅ４およびＨ２Ａの占有率。公表されているＸ−ＣｈＩＰ−ｓｅｑプロファイル（Pekgoz Altunkaya et al., 2016）が比較のために同じスケールで示されている（左側）。アスタリスク：２回の反復実験を平均したｌｏｇ_２（ＣｈＩＰ／インプット）。図５Ｄ；示されている時間にわたって消化されたホルムアルデヒド架橋細胞に適用されたＣｓｅ４およびＨ２ＡＣＵＴ＆ＲＵＮの正規化されたカウントのプロファイル。

図６Ａ〜６Ｃは、ＣＵＴ＆ＲＵＮがＣＴＣＦの高分解フットプリントをマッピングすることを示す。図６Ａ；ＥＮＣＯＤＥＣＴＣＦＣｈＩＰ（ＧＳＭ７４９６９０）、ＣＴＣＦＣｈＩＰ−ｅｘｏ、およびＣＵＴ＆ＲＵＮからの１０，０００，０００のランダムにサンプリングされたリードについてのゲノム遺伝子座に関する代表シグナル。上部パネルでは、ｙ軸は全データセットについて同じであり、これは、ＣＵＴ＆ＲＵＮについてのより高いダイナミックレンジを示す。下部パネルでは、ｙ軸が個別に設定されている。図６Ｂ；ヒトＫ５６２細胞におけるＣＴＣＦについての、１２０ｂｐ未満のサイズクラス（断片末端を含む）と１５０ｂｐより大きいサイズクラスに分けられたＣＵＴ＆ＲＵＮプールデータセット（７．５分〜４５分）の、ならびにＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑおよび高分解能Ｘ−ＣｈＩＰ−ｓｅｑ（Skene and Henikoff, 2015）の、ヒートマップ。ＤＮａｓｅ１高感受性部位内に見られ、ゲノム位置により順序付けされたＣＴＣＦモチーフに関するデータを中心とし、これらのデータに方向性を持たせた、偏りのないアプローチによって、部位を決定した。上流および下流ヌクレオソームの非対称放出は、モチーフの片側からのヌクレオソームへの接近を制御するエピトープ位置に起因する可能性が高い。図６Ｃ；上記のような部位を中心としたＣＵＴ＆ＲＵＮ消化タイムコースから得られる１２０ｂｐ未満の断片からの末端位置の平均プロット。データは、±１ｋｂ隣接領域内の最大シグナルのパーセンテージとして表されている。

図７Ａおよび７Ｂは、ＣＴＣＦが、全部位でのロバストなフットプリントにもかかわらずにＣＵＴ＆ＲＵＮピークのサブセットに直接結合することを示す。図７Ａ；クロマチンをネイティブ条件下で断片化し、可溶化し、ネイティブインプットとして直接シーケンシングしたか、またはＣＴＣＦ結合クロマチンを免疫沈降し、シーケンシングした。ＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑを比較目的で分析した。ＣＴＣＦモチーフとのベストマッチを用いて、ネイティブ条件下でのＣＴＣＦ結合のピークを同定し、中心に据えた（ＪＡＳＰＡＲデータベースＭＡ０１３９．１、jaspar.genereg.net/）。データを、これらの部位（−１〜＋１ｋｂ）に関してネイティブＣｈＩＰＤＮＡ断片（２０〜７５ｂｐ）およびＣＵＴ＆ＲＵＮ（１２０ｂｐ未満）についてヒートマップとしてプロットし、ネイティブＣＴＣＦＣｈＩＰ占有率（隣接部（−１０００〜−７００および＋７００〜＋１０００ｂｐ）の合計を引いた中心領域（−３０〜＋３０ｂｐ）の合計）によって順序付けた。下のグラフは、ピークコール部位（−３０〜＋３０ｂｐ）に関する、およびＣＴＣＦモチーフとの類似性によりランク付けされた、異なる技法についてのシーケンシングカウントの累積パーセントを示す。これは、ネイティブＣｈＩＰピークにおけるクロマチンプロファイリング技法間での高度の一致を示す。ネイティブＣｈＩＰおよびＣＵＴ＆ＲＵＮについてのダイナミックレンジスケールが、ネイティブインプットおよびＥＮＣＯＤＥＸ−ＣｈＩＰについてのものと比べて約３０〜４０倍高いことに留意されたく、これは、インプットおよびＥＮＣＯＤＥパターンを示すために必要であった。図７Ｂ；図７Ａのように処理して、ＣＵＴ＆ＲＵＮのピークコール部位に関してプロットしたデータ。累積分布は、ＣＵＴ＆ＲＵＮ部位についてより低いモチーフスコアへのシフトを示す（ＣＵＴ＆ＲＵＮとネイティブＣｈＩＰ間の分離を参照されたい）。

図８Ａ〜８Ｃは、ネイティブＣｈＩＰと組み合わせたＣＵＴ＆ＲＵＮが直接的および間接的３Ｄ接触部位を識別できることを示す。図８Ａ；ＣＴＣＦについてのＣＵＴ＆ＲＵＮ（１２０ｂｐ未満）、ネイティブＣｈＩＰ（２０〜７５ｂｐ）データおよびＣＴＣＦＣｈＩＡ−ＰＥＴ断片（ＧＳＭ１８７２８８６；１５より大きいスコア）を表示する、典型的なゲノム領域。ＣｈＩＡ−ＰＥＴ断片は、直接的相互作用（ネイティブＣｈＩＰピークとオーバーラップする）または間接的相互作用（ＣＵＴ＆ＲＵＮピークのみとオーバーラップする）によると見なされた。図８Ｂ；ピークコール部位を、直接的（ネイティブＣｈＩＰに存在する）または間接的（ＣＵＴ＆ＲＵＮにのみ存在する）のどちらかで分けた。直接的部位または同数のランダムゲノム位置と交差するＨｉ−Ｃ断片を同定した。次いで、Ｈｉ−Ｃ相互作用断片を間接的部位と交差させ、ＣＵＴ＆ＲＵＮシグナルをＨｉ−Ｃ生シグナルと比較した。データをＣＵＴ＆ＲＵＮスコアによりランク付けし、１５００のウインドウサイズで移動平均としてプロットした。図８Ｃ；直接的部位を含有するＣｈＩＡ−ＰＥＴ断片を同定し、上記のように相互作用断片を直接的ピーク、間接的ピークまたはランダム位置と交差させた。これらの部位とオーバーラップしない相互作用断片を、カテゴリー分けされないものとして分類した。ボックスプロットは、相互作用断片で観察された接触についてのＣＵＴ＆ＲＵＮスコアを示す。

図９Ａおよび９Ｂは、ＣＵＴ＆ＲＵＮによってタンパク質−ＤＮＡ相互作用の簡易定量が可能になることを示す。図９Ａ；ＣＵＴ＆ＲＵＮの消化タイムコースをＫ５６２細胞においてＣＴＣＦについて行った。放出された断片の定量を可能にするために、１ｎｇのショウジョウバエＤＮＡを切断反応後に添加した。１２０ｂｐ未満のシーケンシングされた断片の平均プロットは、ＤＮａｓｅＩ部位内に見られるＣＴＣＦモチーフを中心とするものであった。データを、ｆｌｙリード数に対して正規化（スパイクイン正規化）または総ヒトリード数に対して正規化（標準正規化）した。図９Ｂ；出発材料の滴定を使用して、ゲノムワイドにＣＴＣＦ結合をマッピングした。スパイクインまたは標準正規化を使用して、１２０ｂｐ未満のシーケンシングされた断片についてヒートマップおよび平均プロットを生成した。データは、ＤＮａｓｅＩ部位内に見られるＣＴＣＦモチーフを中心とするものであった。

図１０は、ＣＵＴ＆ＲＵＮおよびＯＲＧＡＮＩＣＣｈＩＰが、質的に類似したＴＦ占有プロファイルを生じさせることを示す。１”〜３２”および６４”〜１２８”タイムコース試料からプールされたＣＵＴ＆ＲＵＮデータ、ならびに≦１２０ｂｐおよび≧１５０ｂｐ断片長のＯＲＧＡＮＩＣ、ならびに標準ＣｈＩＰ−ｓｅｑについての、Ａｂｆ１およびＲｅｂ１プロファイルの代表例。ＭＮａｓｅ−ｓｅｑプロファイルが灰色で示されている。チェックマークは、有意なＡｂｆ１（上方）およびＲｅｂ１（下方）モチーフの位置を示す。Ｙ軸を各々の領域内でＩＧＶにより自動スケーリングした。

図１１Ａおよび１１Ｂは、ＣＵＴ＆ＲＵＮＤＮＡ放出の動態を示す。図１１Ａ；この研究で説明される２つの酵母ＴＦについての１％アガロースゲルでの電気泳動であって、０℃で１〜１２８秒消化時系列にわたってのペレット画分（１試料当たり１０μＬ）からのＤＮＡの電気泳動。これらの部位は、酵母ゲノム内で平均約１０ｋｂ離れているので、Ａｂｆ１とＲｅｂ１の両方について１秒〜１２８秒の消化時間にともなって断片サイズの漸減を観察することができる。ヒトゲノム内のＣＴＣＦ部位間の平均距離は長すぎて、従来のゲルアッセイを使用して切断を観察することができない。図１１Ｂ；Ｐｉｃｏｇｒｅｅｎ蛍光測定値に基づくＤＮＡの放出パーセント：［Ｓｕｐｎ］／（［Ｓｕｐｎ］＋［ペレット］）^＊１００。総収量約５００ｎｇ／試料。

図１２Ａ〜１２Ｃは、上清中の結合ＴＦの定量的回収を示す。図１２Ａ；ＡＭＰｕｒｅビーズで大きい断片を除去した後に上清画分（可溶性）と全ＤＮＡを比較したことを除いて、本明細書に記載されるとおりの単一実験からのＣＵＴ＆ＲＵＮデータのＡｂｆ１プロファイルとＲｅｂ１プロファイルの比較。図１２Ｂ；図１２Ａにおける高ＴＦ占有領域の拡大。図１２Ｃ；ＣＵＴ＆ＲＵＮ≦１２０ｂｐ消化データとモチーフとのヒートマップアラインメントおよびＴＦ占有率による順序付けは、対数スケーリングおよびコントラスト＝５（２を中心とする）を用いたことを除き、本明細書に記載のとおり行った。

図１３Ａ〜１３Ｅは、ＣＵＴ＆ＲＵＮおよびＯＲＧＡＮＩＣＣｈＩＰ−ｓｅｑに基づくＡｂｆ１およびＲｅｂ１モチーフが類似していることを示す。ＭＥＭＥモチーフ発見プログラムを、図１３Ａ〜Ｂの１”〜３２”プールＣＵＴ＆ＲＵＮ≦１２０ｂｐデータ、（図１３Ｃ）６００ｍＭＡｂｆ１および（図１３Ｄ）８０ｍＭＲｅｂ１ＯＲＧＡＮＩＣデータに適用した。対数オッズ配列ロゴが示されている。ＣＵＴ＆ＲＵＮおよびＯＲＧＡＮＩＣを使用して判定されたモチーフ間の密接な対応に注目されたい。図１３Ｅ；モチーフに関するピークコールのパーセンテージ。各々の≦１２０ｂｐデータセットについて、閾値セットを使用してピークをコールして、同様のピーク数（ストリンジェント約６５０、および緩和約１１００）を回収した。

図１４は、ＣＵＴ＆ＲＵＮがｉｎｓｉｔｕでの切断動態を明らかにすることを示す。１”〜３２”および６４”〜１２８”タイムコース試料をプールして≦１２０ｂｐ（左側）および≧１５０ｂｐ（右側）サイズクラスに分けた単一の実験（２０１６０６３０）からのＣＵＴ＆ＲＵＮデータのＡｂｆ１ヒートマップ（左側）とＲｅｂ１ヒートマップ（右側）の比較。モチーフのアラインメントおよびＴＦ占有率による順序付けは、対数スケーリングおよびコントラスト＝３でＴｒｅｅｖｉｅｗを使用したことを除き、前に説明したように行った。消化時間の増加に伴って、より多くのＴＦが放出され、≧１５０ｂｐ断片の「穴」が深くなるが、ダイナミックレンジの顕著な変化が一切ないことに注目されたい。ＣＵＴ＆ＲＵＮは、粒子検出についてＭＮａｓｅ−ｓｅｑよりはるかに高いダイナミックレンジを示す（上部パネルと下部パネルを比較されたい）。

図１５Ａ〜１５Ｂは、Ｍｏｔ１についてのＣＵＴ＆ＲＵＮおよびＯＲＧＡＮＩＣプロファイルを示す。図１５Ａ；ＴＢＰ部位の周辺でアラインメントし、各々部位の周囲の２ｋｂ領域にわたってのＭｏｔ１占有率の増加によって順序付けた、２つのＣＵＴ＆ＲＵＮおよび２つのＯＲＧＡＮＩＣ時点のヒートマップ。図１５Ｂ；絶対定量を示す、スパイクイン正規化されたＭｏｔ１ＣＵＴ＆ＲＵＮ消化についての１２０倍範囲にわたっての占有プロファイル。

図１６Ａ〜１６Ｂは、Ｓｔｈ１についてのＣＵＴ＆ＲＵＮおよびＯＲＧＡＮＩＣプロファイルを示す。図１６Ａ；曲線下面積が等しくなるように正規化された、Ｓｔｈ１ＣＵＴ＆ＲＵＮＡＭＰｕｒｅビーズフィルター処理済み全ＤＮＡ断片の長さ分布。均一な消化および放出が、このタイムコースで観察される。データは、２回の生物学的反復実験から組み合わせたものである。抗ＦＬＡＧ一次抗体なし（ＮｏＡｂ）。図１６Ｂ；Ｇａｌ４ＵＡＳ（ＵＡＳｇ、Floer et al., 2010）へのＲＳＣのマッピングとの一致を示すＧａｌ１〜Ｇａｌ４領域（ＣｈｒＩＩ：２７６，０００〜２８１，０００）のトラック。

図１７Ａ〜１７Ｃは、ＣＵＴ＆ＲＵＮが希少な高不溶性Ｓ．ｃｅｒｅｖｉｓｉａｅ動原体複合体をマッピングすることを示す。図１７Ａ；抗体およびｐＡ−ＭＮ添加後、試料を半分に分割し、ｐＡ−ＭＮをカルシウムで活性化し、標準１００ｍＭＮａＣｌ緩衝剤（−）または２ＭＮａＣｌを含有する緩衝剤（＋）のどちらかで反応を停止させた。トラックは、絶対回収率を表すためにスパイクイン正規化を使用して１番染色体について表示されたものである。図１７Ｂ；Ｃｓｅ４のクローズアップ図ならびにＣｓｅ４およびＨ２Ａの高塩抽出断片の低塩抽出断片に対する対数比。図１７Ｃ；それらの中点周辺でアラインメントされた１６全てのＳ．ｃｅｒｅｖｉｓｉａｅセントロメアの中央値についての高塩抽出断片の低塩抽出断片に対する対数比。

図１８は、ＣＵＴ＆ＲＵＮが、Ｘ−ＣｈＩＰ−ｓｅｑを再現するが、より高いダイナミックレンジを有することを示す。以前に同定されたＣＴＣＦ結合部位におけるゲノムワイドなダイナミックレンジの直接比較のために、１０，０００，０００リードをＥＮＣＯＤＥＣＴＣＦＸ−ＣｈＩＰ−ｓｅｑ（ＧＳＭ７４９６９０）およびＣＵＴ＆ＲＵＮデータセットからランダムに選択し、ＥＮＣＯＤＥピークコール部位（ＧＳＭ７４９６９０＿ｎａｒｒｏｗＰｅａｋ）でプロットした。上方のプロットは、これらの部位の平均の生カウント平均値を示し、下のヒートマップは、遺伝子位置により順序付けられている。

図１９Ａ〜１９Ｄは、ＣＵＴ＆ＲＵＮが、氷上で行われたとき低いバックグラウンドを有することを示す。プロトコール最適化中に、ある温度範囲で切断反応を行った。図１９Ａ；最初に、３７℃をＭＮａｓｅ反応に使用した。しかし、データの注意深い分析は、低密度のゲノムワイドなバックグラウンドでのＣＴＣＦのその真の部位への明確なマッピングにもかかわらず、本発明者らがランダムＤＮａｓｅ１部位に特異的なバックグラウンドを有したことも示した。特異的バックグラウンドは、核の周辺に拡散してクロマチンの接近可能な領域をカットするプロテインＡ−ＭＮａｓｅがなお結合している遊離クロマチン複合体から生じることが、理論的に説明された。図１９Ｂ；この仮説を試験するために、ＣＴＣＦ抗体およびプロテインＡ−ＭＮａｓｅがｉｎｓｉｔｕで結合した後、核膜を限定超音波処理で破壊してクロマチンを大きい反応体積の中へ放出した。ＣＵＴ＆ＲＵＮを破壊条件下で行ったとき、この特異的バックグラウンドは、もはや観察されなかった。図１９Ｃ；これらのクロマチン複合体の拡散を、室温で切断反応を行うことによって制限した。シグナル対ノイズ比は、低く始まったが経時的に上昇し、８分までにノイズはシグナルと区別不能になった。図１９Ｄ；しかし、氷上で反応を保持することにより、シグナル対ノイズ比は、高く、時間に依存しなかった。したがって、切断反応の温度を制御することにより、低バックグラウンドをロバストに維持することができる。

図２０Ａ〜２０Ｃは、ＣＵＴ＆ＲＵＮの高いシグナル対ノイズ比が、Ｘ−ＣｈＩＰ−ｓｅｑでは可能でないＤＮＡ結合部位のロバストな同定を可能にすることを示す。ＣＵＴ＆ＲＵＮをＫ５６２細胞においてＭｙｃおよびＭａｘについて行い、ＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑデータセット（ＧＳＭ９３５４１０；ＧＳＭ９３５５３９）と比較した。データセットごとに１０，０００，０００リードをランダムに選択した。（図２０Ａ）典型的なゲノム領域が示されている。Ｍｙｃについては異なる抗体を使用したことに留意されたく、したがって、定量的比較ができない。図２０Ｂ；ＣＵＴ＆ＲＵＮにより同定された、またはＥＮＣＯＤＥにより以前に同定された、Ｍｙｃピークコール部位とＭａｘピークコール部位の間のオーバーラップを表示する、比例ベン図。図２０Ｃ；ＭａｘＣＵＴ＆ＲＵＮにより同定されたピークコール部位（ｎ＝２０１４６）でプロットされた、ＣＵＴ＆ＲＵＮおよびＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑシグナルを示すヒートマップ。部位をＭａｘＣＵＴ＆ＲＵＮスコアによりランク付けした。ヒートマップのダイナミックレンジの変化に注目されたい。

図２１は、ＣＵＴ＆ＲＵＮが、圧縮されたクロマチンを高ダイナミックレンジでマッピングすることができることを示す。ＣＵＴ＆ＲＵＮは、全てのＤＮＡを消化後に抽出し、その後、サイズ選択を行うことによって、またはカットされた断片を核から拡散させることによって、Ｋ５６２細胞においてＨ３Ｋ２７ｍｅ３について行った。比較のために、ＥＮＣＯＤＥＨ３Ｋ２７ｍｅ３Ｘ−ＣｈＩＰ−ｓｅｑ（ＧＳＭ７３３６５８）データセットを分析した。データセットごとに１０，０００，０００リードをランダムに選択した。典型的なゲノム領域が、等しくスケーリングして上方パネルに、およびＥＮＣＯＤＥデータセットについて再スケーリングして下方パネルに示されている。

図２２Ａおよび２２Ｂは、改良ネイティブＣｈＩＰプロトコールによって完全タンパク質抽出が可能になることを示す。図２２Ａ；様々なＳＤＳおよび超音波処理条件を用いるネイティブ条件下でのＲＮＡポリメラーゼＩＩ（ＲＮＡＰＩＩ）およびＣＴＣＦの抽出効率を試験するためのウエスタンブロット。図２２Ｂ；ネイティブ条件下でのＣＴＣＦの可能性のある再分布を試験するために、抽出物を、スコアの高いモチーフ（陽性）またはシャッフルされた配列（陰性）または６０１ヌクレオソームポジショニング配列を１細胞当たり１０００コピーで９５ｂｐＤＮＡプローブとともにインキュベートした。ＣｈＩＰおよびＤＮＡ抽出の後、定量的ＰＣＲを使用して、ゲノム内のネイティブピークとの（ゲノム性の）またはＤＮＡプローブとのＣＴＣＦの結合について試験した。

図２３は、ＣＵＴ＆ＲＵＮにより同定されたピークが、ネイティブＣｈＩＰからのピークより多様な範囲のモチーフスコアを有することを示す。ピークコーリングをネイティブＣＴＣＦＣｈＩＰ（明確なピークを含有しない偽陽性を除去した）およびＣＵＴ＆ＲＵＮで行った。基礎ＤＮＡ配列を両方向に１００ｂｐ伸長し、ＪＡＳＰＡＲ位置頻度行列（ＭＡ０１３９．１）に対するベストマッチおよびスコアを算出した。ヒストグラムによりモチーフスコアの分布がプロットされている。

図２４は、ＣＵＴ＆ＲＵＮが細胞からＤＮＡまでに１日未満しか必要としないことを示す。ＣＵＴ＆ＲＵＮプロトコールの模式的概要。細胞を採取し、コンカナバリンＡ被覆磁気ビーズに結合させる。細胞膜をジギトニンで透過処理して特異的抗体によるその標的の発見を可能にする。抗体とのインキュベーション後、ビーズを短時間洗浄し、次いで、ｐＡ−ＭＮとともにインキュベートする。細胞を０℃に冷却し、Ｃａ^２＋の添加で消化が開始する。スパイクインＤＮＡを含むキレート化により反応を停止させ、切断により溶液に放出されたＤＮＡ断片を上清から抽出する。

図２５は、大量に存在するヒストンエピトープ（Ｈ３Ｋ２７ｍｅ３）の同日陽性対照としてのＴａｐｅｓｔａｔｉｏｎ分析を示す。これらの試料の残りを使用してシーケンシング用のライブラリーを作製し、結果を図２８に示した。

図２６は、抗ＣＴＣＦ抗体を使用するＣＵＴ＆ＲＵＮ切断断片のＴａｐｅｓｔａｔｉｏｎ分析を示す。これらの試料の残りを使用してシーケンシング用のライブラリーを作製し、結果を図２９に示した。

図２７は、収量が消化時間とともに増加し、シグナル対ノイズ比が殆ど変化しないことを示す。スパイクインＤＮＡにスケーリングすることにより、切断ＤＮＡ断片の量の定量的測定が可能になる。約２０，０００のＣＴＣＦＣＵＴ＆ＲＵＮ結合部位の平均シグナルが、陰性対照領域としての同数のオーバーラップしていない転写開始部位（ＴＳＳ）と比較される。部位またはＴＳＳの中央を中心とする−５０〜＋５０ｂｐ領域のスケーリングされたスパイクインシグナルを合計した。

図２８は、ＣＵＴ＆ＲＵＮＨ３Ｋ２７ｍｅ３が、ヒトＰｏｌｙｃｏｍｂクロマチンランドスケープをプロファイリングするために１００細胞しか必要としないことを示す。様々な数のＫ５６２細胞をＣＵＴ＆ＲＵＮによるＨ３Ｋ２７ｍｅ３のプロファイリングのための出発材料として使用した。ペアードエンド２５×２５ｂｐＩｌｌｕｍｉｎａシーケンシングおよび重複除去の後、７，５００，０００リードをランダムに選択し、ｙ軸に示されているような生カウントを表すベッドグラフを生成するために使用した。比較のために、ＥＮＣＯＤＥＸＣｈＩＰ−ｓｅｑデータ（ＧＳＭ７３３６５８）を同様に分析した。

図２９は、ＣＵＴ＆ＲＵＮが、ヒトＣＴＣＦピークを描くために１０００細胞および４，０００，０００リードしか必要としないことを示す。ＣＵＴ＆ＲＵＮを使用して、様々な数のＫ５６２細胞におけるＣＴＣＦ結合部位をマッピングした。ペアードエンドシーケンシングの後、４，０００，０００の非重複リードをランダムに選択し、ｙ軸に示されているような生カウントを表すベッドグラフを生成するために使用した。比較のために、ＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑデータ（ＧＳＭ７４９６９０）を同様に分析した。

図３０は、スピンカラムＤＮＡ精製が大きい断片と小さい断片の両方をある程度排除することを示す。異なる長さのＤＮＡ断片を結合する点でのスピンカラムの効率を試験するために、２μｇの１０ｂｐラダーをそのカラムによって精製し、インプットとしての２μｇと比較した。ＤＮＡを１０％ポリアクリルアミドゲル電気泳動により分割し、ＳＹＢＲｇｏｌｄで染色した。濃度測定が左側に示されている。ＣＵＴ＆ＲＵＮについては、大きい断片の除去は、バックグラウンドを低減するが、小さい断片の除去は、ＤＮＡ結合タンパク質をプロファイリングするときの回収率に影響を及ぼす。したがって、スピンカラム精製（ステップ３９〜４６）は、ヌクレオソームには好ましいが、転写因子にはそれほど望ましくなく、非常に少ない細胞数になる可能性があり、その場合、代替ＰＣＩプロトコール（ステップ４７〜５８）が推奨される。

図３１Ａおよび３１Ｂは、ＣＵＴ＆ＲＵＮ．ＣｈＩＰが多タンパク質複合体の成分を効率的にマッピングすることを示す。図３１Ａ；ＣＵＴ＆ＲＵＮ上清に適用されたＣｈＩＰ。標的タンパク質および抗ＦＬＡＧ抗体（続いて、図示されていないが、ウサギ抗マウス二次抗体）上の３ＸＦＬＡＧタグを使用することにより、ＣＵＴ＆ＲＵＮ上清中の回収されたｐＡ−ＭＮ／抗体複合体は、ＦＬＡＧペプチドの添加によりＤＮＡ−タンパク質複合体から競合により分離される。次いで、二次抗体が添加され、免疫沈降物がプロテインＡ磁気ビーズで捕捉される。図３１Ｂ；Ｓ．ｃｅｒｅｖｉｓｉａｅヌクレオソームに適用されたＣＵＴ＆ＲＵＮ．ＣｈＩＰ；１１遺伝子に及ぶ領域の代表例が示されている。１．ＣＵＴ＆ＲＵＮを、先ず、３ＸＦＬＡＧ−Ｈ２Ａ．Ｚ（緑色）または３ＸＦＬＡＧ−Ｈ２Ｂ（青色）のどちらかを使用して行った。２．次いで、示されているような様々なヒストン修飾および対照（ＩｇＧ）抗体を使用するＣｈＩＰ−ｓｅｑにインプットおよび上清を供した。プロファイルが自動スケーリングされてランドスケープパターンを図示する。プロファイルの分析（示されていない）は、以前の研究と一致して、Ｈ２Ａ．Ｚヒストンバリアントが、活性遺伝子のプロモーターと比較して濃縮されており、ヒストンＨ４アセチル化およびＨ３Ｋ４ｍｅ３を多く含むが、Ｈ３Ｋ３６ｍｅ３を枯渇していることを示す。

図３２Ａおよび３２Ｂは、多タンパク質複合体のタンパク質成分を同定するためのＣＵＴ＆ＲＵＮ．プロテオミクスを示す。図３２Ａ；ｐＡ−ＭＮ−６Ｈｉｓのマップ。図３２Ｂ；ＣＵＴ＆ＲＵＮにより放出された粒子のタンパク質精製およびプロテオーム解析のための戦略。

図３３Ａ〜３３Ｄは、Ｈ３突然変異型ＤＭＧへのＨ３Ｋ２７Ｍの組込みがＨ３バリアント依存性であることを示す。図３３Ａ；標的下切断およびヌクレアーゼを使用した放出（Cleavage Under Targets and Release Using Nuclease）（ＣＵＴ＆ＲＵＮ）についてのプロトコールの概略図。図３３Ｂ；異なるＤＭＧ細胞系においてＨ３Ｋ２７Ｍ抗体を用いたＣＵＴ＆ＲＵＮデータのＩＧＶ表現であって、上部パネルは、最高シグナルに対して自動スケーリングされたものであり、下部パネルは、個別に自動スケーリングされたものである。図３３Ｃ；Ｈ３突然変異型ＤＭＧ細胞系におけるＨ３Ｋ２７ｍｅ３およびＨ３Ｋ２７ａｃドメインに存在するＨ３Ｋ２７ＭＣＵＴ＆ＲＵＮシグナルの平均（上部）およびヒートマップ（下部）プロファイル。図３３Ｄ上部：Ｈ３Ｋ２７ｍｅ３、Ｈ３Ｋ２７ＭおよびＩｇＧ抗体を用いて行ったＨ３突然変異型ＤＭＧ細胞系におけるＣＵＴ＆ＲＵＮ反応上清からのタンパク質抽出物中のＨ３Ｋ２７ＭおよびＨ３Ｋ２７ｍｅ３についてのウエスタンブロット。

図３４Ａ〜３４Ｃは、Ｈ３突然変異型ＤＭＧが特有のＨ３Ｋ２７ｍｅ３ドメインを提示することを示す。図３４Ａ；標識された遺伝子についての代表的ＩＧＶトラック。図３４Ｂ；正規化を区別しないＰｅａｒｓｏｎ相関および正規化を区別するＬｉｎ相関を使用するＤＭＧ細胞系におけるＨ３Ｋ２７ｍｅ３ＣＵＴ＆ＲＵＮのための相関行列。図３４Ｃ；番号１〜６の関連クラスターに関する、ＤＭＧ細胞系間の差異に基づいてドメインを分類するために階層的クラスタリングを使用する、Ｈ３Ｋ２７ｍｅ３ドメインに存在するＨ３Ｋ２７ｍｅ３ＣＵＴ＆ＲＵＮのヒートマップ。図３４Ａに関して、ＷＮＴ６はクラスター３に、ＷＴ１はクラスター５に、ＰＲＤＭ１はクラスター６に見られる。

図３５Ａ〜３５Ｃは、Ｈ３Ｋ２７ｍｅ３が、Ｈ３突然変異型ＤＭＧにおいて原始幹細胞様の構成を採ることを示す。図３５Ａ；図３４で同定された差異のあるＨ３Ｋ２７ｍｅ３ドメインのクラスターに存在する、この報告書で使用される全ての細胞系からのＨ３Ｋ２７ｍｅ３ＣＵＴ＆ＲＵＮについての平均プロファイル（上部）およびヒートマップ（下部）。図３５Ｂ；Ｌｉｎ相関を使用して、ヒストン野生型（ＶＵＭＣ）、神経幹細胞（ＣＢ６６０およびＵ５）、ＥＳ細胞（Ｈ１）および２つのＨ３突然変異型ＤＭＧ細胞系におけるゲノムワイドなＨ３Ｋ２７ｍｅ３ＣＵＴ＆ＲＵＮを比較する、相関行列。図３５Ｃ；特定された細胞系に特異的なまたはそれらの細胞系により共有されるＨ３Ｋ２７ｍｅ３ドメインの数、クラスター６とオーバーラップするドメインの数、およびゲノム座標をランダムにシャッフルした後にクラスター６とオーバーラップする数を表示する棒グラフ。実験的オーバーラップとランダム化オーバーラップの間のカイ二乗により導出されたＰ値。

図３６Ａ〜３６Ｂは、Ｈ３．３突然変異型ＤＭＧにおいてｈＥＳＣ遺伝子と神経特異的遺伝子の組合せに組み込まれたＨ３Ｋ２７Ｍを示す。図３６Ａ；ヒストン野生型（ＶＵＭＣ）、神経幹細胞（ＣＢ６６０およびＵ５）、ＥＳ細胞（Ｈ１）および２つのＨ３突然変異型ＤＭＧ細胞系におけるＨ３Ｋ２７ａｃ、ならびにヒストン突然変異型ＤＭＧ系におけるＨ３Ｋ２７Ｍについて、Ｐｅａｒｓｏｎ相関を使用して、ゲノムワイドにＣＵＴ＆ＲＵＮを比較する相関行列。図３６Ｂ；Ｈ３Ｋ２７ａｃが、ｈＥＳＣに特異的である（上部左側）か、ｈＥＳＣおよびＮＳＣにおいて共有されている（下部左側）か、ＮＳＣに特異的である（下部右側）か、またはＨ３．３Ｋ２７Ｍにのみ見られる（上部右側）、遺伝子座における、Ｈ３．３Ｋ２７Ｍ中のＨ３Ｋ２７ＭおよびＨ３．３Ｋ２７Ｍ中のＨ３Ｋ２７ａｃ、Ｈ１、ＣＢ６６０ならびにＵ５についての、ＣＵＴ＆ＲＵＮシグナルの代表的ＩＧＶトラック。

図３７Ａ〜３７Ｃは、Ｈ３Ｋ２７ＭがＤＭＧの際にＰＲＣ２を隔離しないことを示す。図３７Ａ；Ｈ３．３Ｋ２７Ｍ細胞系で行われたＨ３Ｋ２７ｍｅ３、Ｈ３Ｋ２７Ｍ、ＳＵＺ１２およびＭＴＦ２抗体との反応からのＣＵＴ＆ＲＵＮデータのＩＧＶ表現。図３７Ｂ；Ｈ３．３Ｋ２７Ｍ−ＤＭＧにおけるＨ３Ｋ２７ｍｅ３またはＨ３Ｋ２７Ｍ濃縮領域内のＨ３Ｋ２７ｍｅ３、Ｈ３Ｋ２７Ｍ、ＳＵＺ１２およびＭＴＦ２ＣＵＴ＆ＲＵＮの濃縮を示す平均プロファイル。図３７Ｃ；Ｈ３．１Ｋ２７Ｍ−ＤＭＧ細胞系におけるＨ３Ｋ２７ｍｅ３濃縮領域およびＨ３Ｋ２７Ｍ濃縮領域内のＳＵＺ１２およびＭＴＦ２の濃縮を示す平均プロファイル。

図３８は、Ｈ３．３Ｋ２７Ｍまたは野生型Ｈ３．３を発現する２９３Ｔ細胞のＨ３．３Ｋ２７Ｍウエスタンブロットを示す。ＬＶ＝レンチウイルスに感染した、Ｐ＝トランスフェクトされた。数字は、ＦＬＡＧ−野生型Ｈ３．３を発現する２９３Ｔに対するパーセンテージとしての、Ｈ３に対して正規化されたＨ３Ｋ２７ｍｅ３バンド強度の濃度測定値を表す。

図３９Ａ〜３９Ｂは、Ｈ３Ｋ２７Ｍに対する感受性が、幹細胞様起始細胞、二次突然変異および発生状況に依存することを示すモデルを示す。図３９Ａ；神経膠腫形成の際の起始細胞、二次突然変異およびＨ３Ｋ２７Ｍの間の協同性を示す概略図。図３９Ｂ；Ｈ３Ｋ２７ＭのＰＲＣ２ランドスケープへの寄与についてのモデル。野生型Ｈ３．１およびＨ３．３、Ｈ３．１Ｋ２７Ｍ（アスタリスク付き）またはＨ３．３Ｋ２７Ｍ（アスタリスク付き）のいずれかを含有するヌクレオソームが示されている。Ｈ３．１Ｋ２７Ｍは、多くの幹細胞性および増殖促進遺伝子の抑制解除を促進するが、低レベルの残留ＰＲＣ２活性が、遺伝子のサブセットをなおサイレンシングし得る。Ｈ３．３Ｋ２７Ｍは、抑制性シグナルが存在するにもかかわらず幹細胞性遺伝子のサイレンシングを防止するが、野生型Ｈ３．１を含有するＰＲＣ２ドメインのロバストなサイレンシングを許す。

図４０Ａ〜４０Ｂは、ＣＵＴ＆ＲＵＮ．Ｓａｌｔが、別個のＣＥＮＰ−Ａ／Ｂ／Ｃ複合体を放出することを示す。図４０Ａ；ＣＥＮＰ−Ａ、ＣＥＮＰ−ＢおよびＣＥＮＰ−ＣＣＵＴ＆ＲＵＮ．Ｓａｌｔ画分におけるＤ７Ｚ１（左側）およびＤＸＺ１（右側）にマッピングされたマージペアの断片長分析。図４０Ｂ；ＣＥＮＰ−Ａ、ＣＥＮＰ−ＢおよびＣＥＮＰ−ＣＣＵＴ＆ＲＵＮ．Ｓａｌｔ２５０ｂｐ×２５０ｂｐマージペアのＤ５Ｚ２、Ｄ７Ｚ１およびＤＸＺ１アレイへのマッピング。これらのコンティグからの２つのタンデムダイマーに及ぶ領域が提示されている。黒塗りボックスは、ＣＥＮＰ−Ｂボックスを表す。

ＣＥＮＰ−Ｂは、ＣＥＮＰ−Ａ／Ｂ／Ｃを安定させる。透過処理した細胞（Skene and Henikoff 2017a）を使用してＣＵＴ＆ＲＵＮを行った。図４１Ａ；ＣＥＮＰ−ＢＣＵＴ＆ＲＵＮ．ＳａｌｔのＳＦ１、Ｄ７Ｚ１およびＤ７Ｚ２配列へのマッピング。エッジ効果を回避するために、ペアードエンド２５ｂｐ×２５ｂｐリードを、各々のコンティグを表すタンデム三反復型３４０ｂｐダイマーコンセンサス配列にマッピングした。真ん中のダイマーに関する平均占有率が示されている。図４１Ｂ；ＣＵＴ＆ＲＵＮ．Ｓａｌｔ画分におけるＣＥＮＰ−Ｂボックスモチーフスコア（ここで、１は、ＣＥＮＰ−Ｂボックス中央１５ｂｐとの同一性を示し、０は、３つより多くのミスマッチを示す）とＣＥＮＰ−Ａ／ＩｇＧ濃縮倍率値の間の相関関係。２つの実験（消化時間１０分および３０分）の平均が示されている。図４１Ｃ；１キロベース当たりのモチーフ密度についてのＢと同じもの。図４１Ｄ；ＣＥＮＰ−ＡＣＵＴ＆ＲＵＮ．Ｓａｌｔ濃縮倍率が、この実験で使用された女性Ｋ５６２細胞が非存在であるＹ染色体αサテライト（ＤＹＺ３）、反復配列がマスクされたＨｇ１９ゲノム、アノテーション付きβサテライト、およびＣＥＮＰ−Ｂボックスを欠いている均一なアレイからのαサテライト（Ｄ７Ｚ２）について、示されている。データは、２５０ｂｐ×２５０ｂｐのマッピングされたマージペアからのものである。

図４２は、ヒトセントロメアにおけるＣＥＮＰ−Ａ／Ｂ／Ｃの構造および立体配座多様性を示す。（上部パネル）Ｄ７Ｚ１に関して平均化されたＣＥＮＰＣＵＴ＆ＲＵＮ．Ｓａｌｔ２５０ｂｐ×２５０ｂｐマージペアの高ストリンジェンシーマッピング。２つのタンデムダイマーのＣＥＮＰＣＵＴ＆ＲＵＮ．ＳａｌｔプロファイルがＤ７Ｚ１コンティグの下に示されている。（下部パネル）ＣＥＮＰ−ＡおよびＣＥＮＰ−ＢＣＵＴ＆ＲＵＮ．ＳａｌｔならびにＣＥＮＰ−ＡＮ−ＣｈＩＰにおけるどちらかの方向のＣＥＮＰ−Ａ／Ｂ／Ｃの方向性を示すための、異なるダイマー単位からのＣＥＮＰ−Ａプロファイルのオーバーレイ。

図４３Ａ〜４３Ｂは、クロマチンタンパク質のハイスループットｉｎｓｉｔｕプロファイリングのための自動化プラットフォームを示す。図４３Ａ；ＡｕｔｏＣＵＴ＆ＲＵＮワークフロー。（１）細胞または組織をコンカナバリンＡ被覆ビーズと結合させ、ジギトニンで透過処理し、クロマチンタンパク質を標的とする抗体とともにインキュベートする。（２）試料を９６ウェルプレートに整列させ、（３）洗浄中の磁気分離のための９６ウェル磁気プレート（α）と温度制御のための循環水浴（γ）へのルートが設けられているアルミニウム冷却ブロック（β）とを装着したＢｉｏｍｅｋロボットで処理する。（４）ＡｕｔｏＣＵＴ＆ＲＵＮは、すぐにプールおよびシーケンシングすることができる最大９６のライブラリーを２日で生じさせる。図４３Ｂ；Ｈ１（オレンジ色）およびＫ５６２（紫色）細胞における活性（ピンク色）および抑制された（青色）クロマチンを示す、ヒストン−Ｈ３修飾のＡｕｔｏＣＵＴ＆ＲＵＮプロファイルの階層的にクラスタリングされた相関行列。Ｐｅａｒｓｏｎ相関は、ゲノム全体にわたって５００ｂｐビンに分割したリードカウントのｌｏｇ２変換値を使用して算出した。

図４４Ａ〜４４Ｄは、ＡｕｔｏＣＵＴ＆ＲＵＮがＨ１およびＫ５６２細胞の予想されたクロマチンランドスケープを再現することを示す。図４４Ａ；Ｈ１細胞およびＫ５６２細胞におけるＨ３Ｋ２７ｍｅ３、Ｈ３Ｋ４ｍｅ２およびＨ３Ｋ２７ａｃドメインに含まれるゲノムの相対量を示すスケーリングされたベン図。図４４Ｂ；それぞれの遺伝子座（ＮＯＤＡＬ）での、Ｈ１細胞におけるＨ３Ｋ４ｍｅ２とＨ３Ｋ２７ｍｅ３のオーバーラップならびにＫ５６２細胞におけるＨ３Ｋ２７ｍｅ３ドメインの拡大およびＨ３Ｋ４ｍｅ２とのオーバーラップ喪失を示す、ゲノムブラウザトラック。図４４Ｃ；単一プロモーターを伴う遺伝子のＴＳＳを中心とし、５’から３’への転写方向に従って左から右への方向性を持たせ、ＲＮＡ−ｓｅｑ値（ＦＰＫＭ）に従ってランクの順序付けがなされた、Ｈ１細胞におけるヒストン修飾のＡｕｔｏＣＵＴ＆ＲＵＮプロファイルの分布を示すヒートマップ。図４４Ｄ；Ｋ５６２細胞における転写活性および抑制プロモーターに関するＡｕｔｏＣＵＴ＆ＲＵＮヒストン修飾プロファイルの分布を示すヒートマップ。

図４５Ａ〜４５Ｅは、線形回帰モデルが細胞型特異的プロモーター活性を正確に予測することを示す。図４５Ａ；単一プロモーター遺伝子についてのＲＮＡ−ｓｅｑ値とＫ５６２データで訓練されたモデルにより予測されるＫ５６２プロモーターＣＲＥＡＭスコアとを比較する密度散布図。図４５Ｂ；Ｈ１およびＫ５６２細胞における単一プロモーター遺伝子についてのＣＲＥＡＭスコアの散布図。色付きドットは、Ｈ１細胞またはＫ５６２細胞のどちらかにおいてＣＲＥＡＭスコアが≧２倍濃縮されていることを示す。図４５Ｃ；Ｈ１細胞またはＫ５６２細胞のどちらかにおいて≧２倍濃縮されているプロモーターＣＲＥＡＭスコアの、それらの対応するＲＮＡ−ｓｅｑ値にマッピングされた、散布図。青色点線は、２倍差カットオフを示した。図４５Ｄ；それらのプロモーターＣＲＥＡＭスコアに従ってまたはそれらのＲＮＡ発現値に従って細胞型特異的と呼ばれる遺伝子間のオーバーラップを示すスケーリングされたベン図。ＣＲＥＡＭ対ＲＮＡ−ｓｅｑに従って反対の細胞型特異性を有すると予想された遺伝子が示されている（スケーリングされた黒丸）。図４５Ｅ；≧２ｋｂ離れている全てのプロモーターのＨ１およびＫ５６２ＣＲＥＡＭスコアを比較する散布図。Ｈ１およびＫ５６２細胞同一性の主要調節因子が色付きの丸として示されている。ＯＴＸ２とＴＡＬ１の両方は、区別することができる２つのプロモーターを有する。

図４６Ａおよび４６Ｂは、ＡｕｔｏＣＵＴ＆ＲＵＮが、凍結腫瘍試料のクロマチンランドスケープのプロファイリングに好適であることを示す。図４６Ａ；ＤＭＧ実験設定。脳幹の類似した領域に由来する２つのＤＭＧ細胞系を免疫不全マウスの脳において異種移植片として成長させ、腫瘍を形成し次第、摘出し、凍結した。異種移植片を解凍し、細胞培養から直接収集した対照ＤＭＧ試料と並行してＡｕｔｏＣＵＴ＆ＲＵＮによって処理した。図４６Ｂ；細胞培養（Ｃ．Ｃ．）でまたは異種移植片（Ｘｅｎｏ）として成長させたＶＵＭＣ−１０およびＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞における活性および抑制クロマチンを示す、ヒストン−Ｈ３修飾のＡｕｔｏＣＵＴ＆ＲＵＮプロファイルの階層的にクラスタリングされた相関行列。精度管理として、Ｈ３Ｋ２７ａｃも、これらの細胞系において異なる抗体を使用して手動でプロファイリングした（^＊）。Ｐｅａｒｓｏｎ相関は、ゲノム全体にわたって５００ｂｐビンに分割したリードカウントのｌｏｇ２変換値を使用して算出した。

図４７Ａ〜４７Ｃは、プロモーターＣＲＥＡＭスコアによりＤＭＧ試料における遺伝子活性が区別されることを示す。図４７Ａ；ＶＵＭＣ−１０およびＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞培養試料のプロモーターＣＲＥＡＭスコアを比較する散布図。腫瘍成長に関与するいくつかの細胞シグナル伝達成分のプロモーターの位置が、色つきの丸として示されている。図４７Ｂ；ＶＵＭＣ−１０細胞培養（Ｃ．Ｃ．）および異種移植片（Ｘｅｎｏ）試料のプロモーターＣＲＥＡＭスコアを比較する散布図。３８８のプロモーターのみが、これらの試料間でＣＲＥＡＭスコアの≧２倍差を有する。図４７Ｃ；細胞培養（Ｃ．Ｃ．）でまたは異種移植片（Ｘｅｎｏ）として成長させたＶＵＭＣ−１０（Ｖ）およびＳＵ−ＤＩＰＧ−ＸＩＩＩ（Ｓ）細胞間の、ならびにＨ１およびＫ５６２細胞間の、プロモーターＣＲＥＡＭスコアのＳｐｅａｒｍａｎ相関の階層的にクラスタリングされた行列。

図４８Ａ〜４８Ｅは、ａｕｔｏＣＵＴ＆ＲＵＮが細胞型特異的エンハンサーエレメントを同定することを示す。図４８Ａ；Ｈ１細胞における接近可能なクロマチン部位（ＡＴＡＣ−ｓｅｑピーク）とＨ３Ｋ４ｍｅ２ＡｕｔｏＣＵＴ＆ＲＵＮプロファイルでコールされたピークとのオーバーラップを示す、スケーリングされたベン図。図４８Ｂ；全てのＨ３Ｋ４ｍｅ２＋／ＡＴＡＣ＋ＴＳＳに関するＨ３Ｋ４ｍｅ１、Ｈ３Ｋ４ｍｅ２およびＨ３Ｋ４ｍｅ３の濃縮平均値。図４８Ｃ；全てのＨ３Ｋ４ｍｅ２＋／ＡＴＡＣ＋遠位調節エレメント（ＤＲＥ）に関するＨ３Ｋ４ｍｅ１、Ｈ３Ｋ４ｍｅ２およびＨ３Ｋ４ｍｅ３の濃縮平均値。図４８Ｄ；細胞培養（Ｃ．Ｃ．）でまたは異種移植片（Ｘｅｎｏ）として成長させたＶＵＭＣ−１０（Ｖ）およびＳＵ−ＤＩＰＧ−ＸＩＩＩ（Ｓ）細胞、ならびにＨ１およびＫ５６２細胞における、エンハンサーＣＲＥＡＭスコアのＳｐｅａｒｍａｎ相関の階層的にクラスタリングされた行列。図４８Ｅ；それぞれの遺伝子座（ＳＯＸ２）においてＶＵＭＣ−１０細胞（Ｖ）、両方のＤＭＧ細胞系（Ｄ）に特異的であるかまたはＤＭＧ細胞およびＨ１細胞（Ｃ）に共通している推定的エンハンサーエレメントの位置（矢じり）を示す、ゲノムブラウザトラック。

図４９Ａ〜４９Ｅは、ａｕｔｏＣＵＴ＆ＲＵＮが、ＮＰＡＴおよびＣＴＣＦならびにヒストンマークを正確にマッピングすることを示す。図４９Ａ；改良ＣＵＴ＆ＲＵＮプロトコールによって自動化が可能になる。ＣｏｎＡビーズ結合試料をクロマチンタンパク質特異的抗体とともにインキュベートし、逐次的洗浄、プロテインＡ−ＭＮａｓｅ融合タンパク質の繋留、およびＣａ^２＋添加によるＤＮＡの切断のためにＢｉｏｍｅｋ上に整列させる。消化されたＤＮＡをライブラリー調製前に精製する必要を回避するために、Ｃａ^２＋を特異的にキレート化するが適切なＭｇ^２＋を残すＥＧＴＡのみのＳＴＯＰ緩衝剤で、反応を停止させて、末端ポリッシングおよびクロマチン断片へのＩｌｌｕｍｉｎａＹアダプターライゲーションを可能にする。次いで、クロマチンタンパク質をプロテイナーゼ−Ｋで消化し、Ａｍｐｕｒｅ磁気ビーズを使用してＢｉｏｍｅｋでインデックス付きＣＵＴ＆ＲＵＮライブラリーを精製する。図４９Ｂ；ＮＰＡＴがＨ１細胞とＫ５６２細胞の両方においてＨＩＳＴ１遺伝子クラスターのプロモーター位置に濃縮されていることを示す、ＮＰＡＴおよびＣＴＣＦＡｕｔｏＣＵＴ＆ＲＵＮのゲノムブラウザトラック。図４９Ｃ；ＣＴＣＦがＨＯＸＡ遺伝子座のインスレーター領域と結合していることを確証する、ゲノムブラウザトラック。図４９Ｄ；Ｈ１細胞における単一プロモーターを伴う遺伝子のＴＳＳ周辺の示されているヒストンマークのＡｕｔｏＣＵＴ＆ＲＵＮプロファイルとそれらの対応するＲＮＡ−ｓｅｑ値のＡｕｔｏＣＵＴ＆ＲＵＮプロファイルとの間のＰｅａｒｓｏｎ相関についての表。図４９Ｅ；Ｈ１細胞における単一プロモーターを伴う遺伝子のＴＳＳ周辺の示されているヒストンマークのＡｕｔｏＣＵＴ＆ＲＵＮプロファイルとそれらの対応するＲＮＡ−ｓｅｑ値のＡｕｔｏＣＵＴ＆ＲＵＮプロファイルとの間のＰｅａｒｓｏｎ相関についての表。

図５０Ａ〜５０Ｇは、シス調節エレメントの活性を予測するための線形回帰モデルの開発を示す。図５０Ａ；単一プロモーター遺伝子についてのＨ１ＲＮＡ−ｓｅｑ値とＨ１データで訓練されたモデルにより予測されたＨ１プロモーターＣＲＥＡＭスコアとを比較する密度散布図。図５０Ｂ；単一プロモーター遺伝子についてのＨ１ＲＮＡ−ｓｅｑ値とＫ５６２データで訓練されたモデルにより予測されたＨ１プロモーターＣＲＥＡＭスコアとを比較する密度散布図。図５０Ｃ；Ｈ１およびＫ５６２細胞における単一プロモーター遺伝子についてのＲＮＡ−ｓｅｑ値の散布図。ドットは、Ｈ１細胞またはＫ５６２細胞のどちらかにおいてＲＮＡ発現レベルが≧２倍濃縮されていることを示す。図５０Ｄ；それらの対応するプロモーターＣＲＥＡＭスコアにマッピングされた、Ｈ１細胞またはＫ５６２細胞のどちらかにおいて≧２倍濃縮されているＲＮＡ−ｓｅｑ値を有する遺伝子の分布を示す散布図。点線は、２倍差カットオフを示した。図５０Ｅ；ＣＲＥＡＭスコアとＲＮＡ−ｓｅｑの両方によって同定された細胞型特異的な単一プロモーター遺伝子の収集物において過剰提示された遺伝子オントロジー（ＧＯ）ターム。図５０Ｆ；ＲＮＡ−ｓｅｑに従ってではなくプロモーターＣＲＥＡＭスコアに従って細胞型特異的と一意的に同定された単一プロモーター遺伝子の収集物（図４５Ｄのベン図を参照されたい）において過剰提示されたＧＯターム。図５０Ｇ；プロモーターＣＲＥＡＭスコアに従ってではなくＲＮＡ−ｓｅｑに従って細胞型特異的と一意的に同定された単一プロモーター遺伝子の収集物において過剰提示されたＧＯターム。

図５１は、ＤＭＧ特異的ＳＭＡＤ３プロモーター活性を示す。細胞培養試料および異種移植片試料からのプロファイルの一致を示す、ＶＵＭＣ−１０およびＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞の代表的遺伝子座（ＳＭＡＤ３）におけるＡｕｔｏＣＵＴ＆ＲＵＮによりプロファイリングされたヒストンマークのゲノムブラウザトラック。ＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞におけるＨ３Ｋ２７ａｃシグナルはノイズが多いが、この問題は抗体特異的である。比較のために、代替抗体を使用して手動でＨ３Ｋ２７ａｃもプロファイリングした（^＊）。矢じりは、ＶＵＭＣ−１０（Ｖ）またはＳＵ−ＤＩＰＧ−ＸＩＩＩ（Ｓ）細胞において特に活性であると予測されるプロモーターを示す。

図５２Ａ〜５２Ｃは、プロモーターＣＲＥＡＭがＤＭＧ特異的遺伝子調節プログラムを同定することを示す。図５２Ａ；ＣＲＥＡＭ分析に従ってＶＵＭＣ−１０細胞において≧２倍濃縮されているプロモーターの収集物において過剰提示されるＧＯターム。図５２Ｂ；ＣＲＥＡＭ分析に従ってＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞において≧２倍濃縮されているプロモーターの収集物において過剰提示されるＧＯターム。図５２Ｃ；ＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞培養（Ｃ．Ｃ．）および異種移植片（Ｘｅｎｏ．）試料のプロモーターＣＲＥＡＭスコアを比較する散布図。１，６１９のプロモーターは、これらの試料間でＣＲＥＡＭスコアの≧２倍差を有する。

図５３Ａ〜５３Ｄは、ａｕｔｏＣＵＴ＆ＲＵＮが、近位シス調節エレメントと遠位シス調節エレメントとを区別するための高感度法であることを示す。図５３Ａ；Ｈ１細胞における接近可能なクロマチン部位（ＡＴＡＣ−ｓｅｑピーク）とヒストンマークの様々なＡｕｔｏＣＵＴ＆ＲＵＮプロファイルでコールされたピークとのオーバーラップについての表。図５３Ｂ；ＡＴＡＣ＋またはＡＴＡＣ−のどちらかとしてコールされたＨ３Ｋ４ｍｅ２ピークにおけるＡＴＡＣシグナルの濃縮平均値。図５３Ｃ；ＡＴＡＣ＋またはＡＴＡＣ−のどちらかとしてコールされたＨ３Ｋ４ｍｅ２＋ＴＳＳにおけるＨ３Ｋ２７ｍｅ３シグナルの濃縮平均値。図５３Ｄ；全てのＨ３Ｋ４ｍｅ２＋／ＡＴＡＣ＋ＴＳＳおよび遠位調節エレメント（ＤＲＥ）に関する正規化されたＨ３Ｋ４ｍｅ１、Ｈ３Ｋ４ｍｅ２およびＨ３Ｋ４ｍｅ３プロファイルの分布を示すヒートマップ。

図５４は、ＣＵＴ＆ＲＵＮが、胎児型ガンマグロビンから成人型ベータグロビンへのスイッチを同定することを示す。

図５５は、１００細胞での高いＣＵＴ＆ＲＵＮデータ品質を示す。様々な数のＫ５６２細胞をＣＵＴ＆ＲＵＮによるＨ３Ｋ２７ｍｅ３のプロファイリングのための出発材料として使用した。ペアードエンド２５×２５ｂｐＩｌｌｕｍｉｎａシーケンシングおよび重複除去の後、７，５００，０００断片をランダムに選択し、生カウントを表すトラックを生成するために使用した。完全プロファイル（最上部トラック）についての、およびＣＵＴ＆ＲＵＮとの比較のための７，５００，０００のランダムに選択されたサブセットについての、ＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑデータが示されている。

図５６は、内胚葉に分化したヒトＥＳ細胞の自動化ＣＵＴ＆ＲＵＮプロファイリングを示す。「活性」（Ｈ３Ｋ４ｍｅ３）および「抑制性」（Ｈ３Ｋ２７ｍｅ３）ヒストン修飾についてのならびにＨ１胚性幹細胞のおよびＨ１細胞培養に由来する分化内胚葉細胞（ＤＥ）のＣＴＣＦについての反復ＣＵＴ＆ＲＵＮプロファイルを示すスクリーンショット。ＰＯＬＤ１転写単位が右側に拡大されており（枠で囲まれた領域）、これは、分化中のプロモーターに関する活性修飾から抑制性修飾へのスイッチを示す。ＰＯＬＤ１は、ラギング鎖ＤＮＡポリメラーゼの触媒性サブユニット（Ｐｏｌ−デルタ）をコードし、これは、複製機構のプロモーター活性クロマチン状態からプロモーター抑制性クロマチン状態へのスイッチが細胞周期からの退出に相当することを示唆する。

図５７は、高Ｃａ＋＋／低塩消化との一貫性向上を示す。高Ｃａ＋＋／低塩プロトコールまたは標準プロトコールのどちらかを使用して、示されているような２０秒〜２７分範囲にわたっての消化と２つの異なる抗体を用いてＣＵＴ＆ＲＵＮを行った。４つのタイムコース系列実験から１７のＨ３Ｋ２７ａｃデータセットをプールし、ＭＡＣＳ２を使用して７４，９０６ピークをコールした。ピーク位置をデータセットごとにスコア化し、ピークベクトル間の相関（Ｒ^２）を算出した。

図５８Ａおよび５８Ｂは、アダプターのｉｎｓｉｔｕライゲーションを用いるＨ３Ｋ２７ａｃＣＵＴ＆ＲＵＮを示す。図５８Ａ；代表的２０Ｍｂ領域が示されている。図５８Ｂ；断片のヒートマップは、ＭＡＣＳ２スコアによってランクの順序付けがなされた７４，９０６のＨ３Ｋ２７ａｃピークの±１ｋｂをカウントする。

図５９Ａ〜５９Ｄは、無傷組織およびＦＡＣＳ単離細胞のＣＵＴ＆ＲＵＮプロファイリングを示す。図５９Ａ；脳および羽成虫原基を１０匹の幼虫から切除し、無傷の未固定材料をジギトニンで軽度に透過処理し、ＣＵＴ＆ＲＵＮ用の抗体およびｐＡＭＮａｓｅ溶液に浸漬する。図５９Ｂ；痕跡（ｖｇ）遺伝子を発現する細胞においてｖｇ−Ｑエンハンサーを使用してＧＦＰを生じさせ、原基を切除し、１０，０００のＧＦＰ陽性細胞をＦＡＣＳにより単離した。図５９Ｃ；Ｐｏｌｙｃｏｍｂ抑制ＡＮＴＰ複合体にわたっての無傷組織およびＦＡＣＳ単離細胞からのＨ３Ｋ２７ｍｅ３のＣＵＴ＆ＲＵＮプロファイル。アンテナペディア（Ａｎｔｐ）遺伝子は、脳では抑制され、メチル化されるが、羽成虫原基では発現され、メチル化されない。Ａｎｔｐの抑制解除は、高いシグナル／バックグラウンド比を有するＦＡＣＳ単離細胞においても明白である。図５９Ｄ；脳におけるｖｇ遺伝子（脳ではそれが抑制される）、羽成虫原基におけるｖｇ遺伝子（羽成虫原基では、細胞の約２０％がｖｇを発現し、残りは発現しない）、およびＦＡＣＳ単離ｖｇ発現細胞におけるｖｇ遺伝子にわたっての、Ｈ３Ｋ２７ｍｅ３プロファイル。

図６０Ａおよび６０Ｂは、ＣＵＴ＆ＲＵＮデータにおけるサイズに基づくピーク頂点検出を示す。図６０Ａ；頂点検出の方法論。濃縮領域内に含まれるＣＵＴ＆ＲＵＮ断片を、断片オフセット対断片長散布図にマッピングし、ＬＯＥＳＳ曲線をデータから導出し、曲線の極小値が存在する単一塩基対位置を頂点として報告する。図６０Ｂ；単一塩基対ＣＴＣＦピーク頂点を、二成分ガウス混合モデルを使用して予測断片サイズにより分割し、２つのコホートの各々についての頂点の周囲２０ｂｐウインドウに濃縮されたモチーフを、ＭＥＭＥを使用して検出した。

図６１は、ＣＵＴ＆ＲＵＮ用の改善されたベクターのプラスミドマップである。

図６２は、プロテインＡ−Ｔｎ５発現ベクターを示す。プロテインＡのＣ末端が２６残基の柔軟なリンカーペプチド（ｐＡ−Ｔｎ５）によりトランスポザーゼから離隔されている高活性Ｔｎ５トランスポザーゼバージョンを構築した。ブドウ球菌プロテインＡの２つのＩｇＧ結合ドメインをｐＫ１９ｐＡ−ＭＮベクター（Schmid et al. 2004）からＰＣＲ増幅し、発現ベクターｐＴＸＢ１−Ｔｎ５（Picelli et al, 2014）内の高活性Ｔｎ５対立遺伝子（Ｅ５４Ｋ、Ｌ３７２Ｐ）にＣ末端を融合させた。ＤＤＤＫＥＦ（ＧＧＧＧＳ）_４（配列番号１）で構成されている柔軟なリンカーをプロテインＡとＴｎ５の間に含めた。プロテインＡのＮ末端に３つのタンデムＦＬＡＧエピトープタグを挿入することにより３ＸＦＬＡＧタグ付きバージョン（ｐＡｆ−Ｔｎ５）も構築した。ｌａｃオペレーターの下流の配列を効率的リボソーム結合部位で置き換えた。

図６３Ａおよび６３Ｂは、ＩＴＩＳ戦略、および少ない細胞数への適用を示す。図６３Ａ；遊離１９ｍｅｒＴｎ５末端ＤＮＡ二重鎖を担持させてｐＡ−Ｔｎ５トランスポゾームを形成すると、ｐＡ−ＭＮをＣｈＩＣ（クロマチン免疫切断）およびＣＵＴ＆ＲＵＮに使用することができるのと同様に、ｐＡ−Ｔｎ５をタグメンテーションに使用することができる。タグメンテーションでは、トランスポゾンのモザイクエンド配列と、使用されるシーケンシングプラットフォームと適合するアダプターオーバーハングとに対応する２つの末端二重鎖ＤＮＡを担持した非配列特異的トランスポザーゼが、カットアンドペースト反応を実行し、結果として、トランスポゾン末端配列およびアダプターオーバーハングでカット部位の両末端がキャップされる。ＣＵＴ＆ＲＵＮとは異なり、粒子の放出はなく、むしろ、タグメンテーション後に、ＤＮＡが、抽出され、３’にモザイクエンドに相補的な配列および５’側にシーケンシングアダプターに相補的な配列を有するプライマーを使用するＰＣＲに供される。図６３Ｂ；可変細胞数実験からのＴａｐｅｓｔａｔｉｏｎリードアウトの例。

図６４は、異なるｐＡ−Ｔｎ５構築物からのＩＴＩＳライブラリーを示す。陰性対照に対する抗体（ＩｇＧ、モルモット抗ウサギＩｇＧ）、ＣＴＣＦＤＮＡ結合タンパク質に対する抗体（ウサギモノクローナル抗体）、ＲＮＡポリメラーゼＣ末端ドメインセリン−５リン酸（ＰｏｌＩＩＳ５）に対する抗体（マウスモノクローナル抗体）、およびヒストンＨ３リシン２７トリメチル（Ｈ３Ｋ２７ｍｅ３）に対する抗体（ウサギモノクローナル抗体）を含む、様々な抗体とともに使用されたとき、ライブラリーは、１２サイクルのＰＣＲ後に特徴的なサイズ分布を示した。類似の結果が、ｐＡ−Ｔｎ５と３ＸＦＬＡＧ−ｐＡ−Ｔｎ５（ｐＡｆ−Ｔｎ５）の両方に関して見られたが、ｐＡｆ−Ｔｎ５調製物中のより多くのＥ．ｃｏｌｉＤＮＡの存在が原因で、ライブラリー断片の不鮮明なバックグラウンドが生じた。

図６５は、ＣＵＴ＆ＲＵＮプロファイルに引けを取らないＩＴＩＳプロファイルを示す。上部：ＩＴＩＳにより生成される断片のマッピングは、≦１２０ｂｐ断片が、ＲＮＡＰＩＩの転写開始形態を表す尖ったスパイクを示す、同じＲＮＡポリメラーゼＩＩ（ＲＮＡＰＩＩ）Ｓｅｒ５マウスモノクローナル抗体を使用するＣＵＴ＆ＲＵＮと比較して、データ品質が向上されることを示す。過剰な消化が接近可能な領域での切断をもたらし得る（２７分のトラックと９分のトラックを比較されたい）、ＣＵＴ＆ＲＵＮとは異なり、ｐＡ−Ｔｎ５の各々の分子は、単一末端に対するカットアンドペーストしかできず、したがって、この分子がその担持物を送達してしまうと、この分子は、さらに反応することができない。結果として、バックグラウンドは、ＣＵＴ＆ＲＵＮで可能であるのよりさらにいっそう低減される。下部：Ｈ３Ｋ２７ｍｅ３についてのＩＴＩＳとＣＵＴ＆ＲＵＮの間の対応は、ＣＵＴ＆ＲＵＮについての２５，０００，０００と比較して６，５００，０００〜６，９００，０００であるＩＴＩＳ試料についてのはるかに少ないマッピングされるリード数にもかかわらず、非常に密接である。ＩＴＩＳとＣＵＴ＆ＲＵＮの両方について、プロファイルは、示されているプロファイルを生成するための５６，０００，０００リードを必要としたＥＮＣＯＤＥＣｈＩＰ−ｓｅｑより、著しく明確である。左から右へ、パネルは、同じ領域の逐次的３倍拡大を示す。

図６６Ａは、ヒストン修飾についてのＩＴＩＳとＣＵＴ＆ＲＵＮの間の密接な対応を示す。相関プロットを、Janssens et al. (2018)に記載のＩＴＩＳおよびＣＵＴ＆ＲＵＮデータセットから構築した。同じ抗体をＩＴＩＳとＣＵＴ＆ＲＵＮの両方に使用した：Ｈ３Ｋ２７ｍｅ３（ＣｅｌｌＳｉｇｎａｌｉｎｇＴｅｃｈｎｏｌｏｇｙカタログ番号９７３３）、Ｈ３Ｋ４ジメチル（「２」、Ｍｉｌｌｉｐｏｒｅカタログ番号０７−０３０）、Ｈ３Ｋ４トリメチル（「３」、ＡｃｔｉｖｅＭｏｔｉｆカタログ番号３９１５９）、およびＨ３Ｋ２７ａｃ（Ｍｉｌｌｉｐｏｒｅカタログ番号ＭＡＢＥ６４７）。

図６６Ｂは、ＣＴＤ−セリン−リン酸化ＲＮＡＰＩＩについてのＩＴＩＳとＣＵＴ＆ＲＵＮの間の密接な対応を示す。相関プロットを、Janssens et al. (2018)に記載のＩＴＩＳおよびＣＵＴ＆ＲＵＮデータセットから構築した。丸括弧内の数字は、ＣＴＤヘプタマー残基を示し、「ｍ」は、マウスモノクローナル抗体（Ａｂｃａｍカタログ番号ａｂ５４０８、続いてのＡｂｃａｍカタログ番号ａｂ４６５４０ウサギ抗マウス抗体）を示し、「ｐ」は、Ａｂｃａｍカタログ番号５０９５ウサギポリクローナル抗体を示す。同じ抗体をＩＴＩＳとＣＵＴ＆ＲＵＮの両方に使用した。

図６７は、ｐＡ−Ｔｎ５結合およびタグメンテーションに対するゲノムワイドな超高感受性が、塩濃度を上昇させることにより本質的に消失されることを示す。ＡＴＡＣ−ｓｅｑＭＡＣＳ２ピークスコアにより順序付けされた選択データセットのヒートマップ表示は、ＩＴＩＳが、１５０ｍＭＮａＣｌ条件下で、ＡＴＡＣ−ｓｅｑピークスコアと強く相関することを示す。対照的に、ＩＴＩＳは、１５０ｍＭ条件下では、ＣＵＴ＆ＲＵＮで見られるものに類似した、ＡＴＡＣ−ｓｅｑピークコールとのわずかな反相関を示し、超高感受性シグナルは、３００ｍＭＮａＣｌでｐＡ−Ｔｎ５付加およびタグメンテーションを行うことにより本質的に消失される。このことにより、超高感受性が、繋留されていないＴｎ５に起因すること、および塩の処置が、それを除去するのに有効であることが確証される。ＡＴＡＣ−ｓｅｑピークコール（６１，１５３）は、ＧＳＥ３１７５５（Ｋ５６２細胞）からのものである。ヒートマップは、Ｊａｖａ（登録商標）ＴｒｅｅＶｉｅｗを使用して任意均等目盛りでプロットした。

図６８は、ＩＴＩＳ断片が複数のサイズクラスに分類されることを示す。ＩＴＩＳライブラリーをペアードエンドシーケンシングに供したとき、小さい断片が転写因子を表し、大きい断片がモノヌクレオソームおよびより低レベルのジヌクレオソームを表す、予想されたプロファイルが得られた。約１０ｂｐの周期性は、繋留切断の厳しい制約を表す可能性が高い。

図６９Ａ〜６９Ｂは、高濃度の塩が、非標的タグメンテーションを低減させ、小さい断片の回収率を低下させることを示す。図６９Ａ；マッピングされた断片の数が、百万単位で示されている。Ｏｖは、ＣＵＴ＆ＲＵＮ、続いての、ＮｕＧｅｎＯｖａｔｉｏｎライブラリー調製キットを使用するアダプターのｉｎｓｉｔｕライゲーションである。標的シグナルに対する超高感受性部位検出の相対的な大きさは、あったとしてもほんの少ししか超高感受性部位が検出されないＣＵＴ＆ＲＵＮと比較することにより、Ｈ３Ｋ２７ｍｅ３トラックから推定することができる。超高感受性は、洗浄ステップの塩濃度を上昇させることにより低下されるように見える。このことにより、高感受性は、繋留されていないＴｎ５に起因するが、条件を調整することにより低減または消失させることができることが確証される。図６９Ｂ；異なる抗ＲＮＡＰＩＩ抗体と、１５０ｍＭＮａＣｌで行われる結合およびタグメンテーションを使用すると、２つの明確に異なるサイズクラスが見られる（上部パネル）が、３００ｍＭＮａＣｌでは小さい方のサイズクラスが、急減される。

図７０は、ｐＡ−ＭＮａｓｅのＥ．ｃｏｌｉＤＮＡ混入が、スパイクイン較正のプロキシとなり得ることを示す。Ｈ３Ｋ２７ｍｅ３（１００〜６，０００細胞）およびＣＴＣＦ（１，０００〜１００，０００細胞）についてのＫ５６２細胞ＣＵＴ＆ＲＵＮデータセット（ＧＳＥ１０４５５０）からの断片を、Ｓ．ｃｅｒｅｖｉｓｉａｅの反復配列がマスクされたゲノム、および完全ゲノムＥ．ｃｏｌｉにマッピングした。

図７１は、ＲＮＡＰＩＩ−Ｓｅｒ５ＰについてのＩＴＩＳピークコールが転写開始部位に対応することを示す。ＩＴＩＳを検証するために、ＭＡＣＳ２とデフォルトパラメータを使用してｐＡ−Ｔｎ５ＲＮＡＰＩＩ−Ｓｅｒ５ＰデータセットとｐＡ−３ＸＦＬＡＧ−Ｔｎ５ＲＮＡＰＩＩ−Ｓｅｒ５Ｐデータセットの両方についてピークをコールし、各々約１７，５００ピークを得た。ヒトＫ５６２細胞についてのＰＲＯ−ｓｅｑランオンからの処理済みデータセット（ＳＲＡＧＳＭ１４８０３２７）をピークコールにアラインメントした。ＩＴＩＳＭＡＣＳ２スコアにより順序付けしたとき、ＰＲＯ−ｓｅｑ占有率とＰｏｌＩＩ−Ｓｅｒ５ＩＴＩＳスコアとの間の密接な対応が見られ、ここで、青色のヒートマップ値は、各々のピークコールの３’側のＰＲＯ−ｓｅｑ占有率を表し、黄色の値は、５’側のＰＲＯ−ｓｅｑ占有率を表す。

図７２は、２０の異なる抗体および２つの異なる細胞バッチ各々からの２つの細胞型についての単一９６ウェルプレートで一緒に実行した９６のＩＴＩＳ試料の階層的クラスタリングを示す、相関行列である。１または４．５時間の透過処理後、抗体を添加し（１：５０）、４℃で一晩インキュベートした。次いで、８チャネルピペッターおよび９６ウェルプレートハンドラーを使用してプレートをＩＴＩＳに供し、全てのウェルからほぼ等モルの試料をプールし、単一Ｉｌｌｕｍｉｎａ２５００Ｒａｐｉｄフローセル、１試料当たり平均して３，０００，０００のペアードエンドリードで、シーケンシングした。５つの異なるＲＮＡＰｏｌＩＩ抗体を除いて、全ての生物学的反復実験は、他の抗体が結合した全ての試料を除いて一緒にクラスターを形成し、したがって、ハイスループットＩＴＩＳの顕著な再現度を実証した。

図７３は、ＩＴＩＳを使用する少ない細胞数の断片の回収を示す。Ｋ５６２細胞を６０，０００細胞から下は２０細胞に至るまで段階希釈し、Ｈ３Ｋ２７ｍｅ３およびＲＮＡＰＩＩ−Ｓｅｒ２＋５についてＩＴＩＳを行った。断片のほぼ直線的な回収（対数スケールで）が、Ｈ３Ｋ２７ｍｅ３について下は２０細胞に至るまでおよびＲＮＡＰＩＩについて下は６０細胞に至るまで見られる。

図７４は、ＣＵＴ＆ＲＵＮについて観察されたものに類似して、ＩＴＩＳについてのｐＡ−Ｔｎ５調製物におけるＥ．ｃｏｌｉ混入のスパイクインプロキシとしての使用を確証する、反比例関係がヒト断片数とＥ．ｃｏｌｉ断片数の間にあることを示す。

図７５は、下は２０細胞に至る低いバックグラウンドでの高いＣＵＴ＆ＲＵＮデータ品質を示す。

いくつかの実施形態の詳細な説明
Ａ．用語および定義
以下の詳細な説明において、本明細書の一部を形成し、実践され得る実施形態が図解によって示されている添付の図面への言及がなされる。他の実施形態が利用され得、範囲から逸脱することなく構造的または論理的変化が加えられ得ることが理解されるべきである。それゆえ、以下の詳細な説明は、限定的な意味で取られるべきではなく、実施形態の範囲は、添付の特許請求の範囲およびそれらの等価物によって規定される。

様々な作業が、実施形態を理解するのに役立ち得るように、複数の個別の作業として順番に記載され得る；しかしながら、記載の順序は、これらの作業が順序依存的であることを暗示すると捉えられるべきではない。

説明の目的のために、「Ａ／Ｂ」という形態または「Ａおよび／またはＢ」という形態の語句は、（Ａ）、（Ｂ）、または（ＡおよびＢ）を意味する。説明の目的のために、「Ａ、Ｂ、およびＣのうちの少なくとも１つ」という形態の語句は、（Ａ）、（Ｂ）、（Ｃ）、（ＡおよびＢ）、（ＡおよびＣ）、（ＢおよびＣ）、または（Ａ、Ｂ、およびＣ）を意味する。説明の目的のために、「（Ａ）Ｂ」という形態の語句は、（Ｂ）または（ＡＢ）を意味し、すなわちＡは必要に応じたエレメントである。

説明は、「実施形態（ｅｍｂｏｄｉｍｅｎｔ）」または「実施形態（ｅｍｂｏｄｉｍｅｎｔｓ）」という用語を使用し得、そのそれぞれは、同じまたは異なる実施形態のうちの１つまたは複数を指し得る。さらに、実施形態に関して使用される「含む（ｃｏｍｐｒｉｓｉｎｇ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」、「有する（ｈａｖｉｎｇ）」等という用語は同義である。

説明は、「実施形態（ｅｍｂｏｄｉｍｅｎｔ）」または「実施形態（ｅｍｂｏｄｉｍｅｎｔｓ）」という用語を使用し得、そのそれぞれは、同じまたは異なる実施形態のうちの１つまたは複数を指し得る。さらに、実施形態に関して使用される「含む（ｃｏｍｐｒｉｓｉｎｇ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」、「有する（ｈａｖｉｎｇ）」等という用語は同義であり、一般的に、「開かれた」用語として意図される（例えば、「含む（ｉｎｃｌｕｄｉｎｇ）」という用語は「含むがそれらに限定されるわけではない」として解釈されるべきであり、「有する（ｈａｖｉｎｇ）」という用語は「少なくとも有する」と解釈されるべきであり、「含む（ｉｎｃｌｕｄｅｓ）」という用語は「含むがそれらに限定されるわけではない」と解釈されるべきである等）。

本明細書における任意の複数形および／または単数形の用語の使用に関して、当業者であれば、文脈および／または適用にとって適切であるように、複数形から単数形におよび／または単数形から複数形に翻訳し得る。明確性のために、様々な単数形／複数形の並べ替えが本明細書において明示的に示され得る。

別様に記されていない限り、技術的用語は従来の使用法に従って使用される。分子生物学における共通用語の定義は、Benjamin Lewin, Genes IX, published by Jones and Bartlet, 2008 (ISBN 0763752223)；Kendrew et al. (eds.), The Encyclopedia of Molecular Biology, published by Blackwell Science Ltd., 1994 (ISBN 0632021829)；およびRobert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 9780471185710)；ならびに、他の同様の参考文献に見い出され得る。矛盾する場合には、本明細書における用語が支配する。

本開示の様々な実施形態についての概観を促すために、具体的な用語についての以下の説明が提供される。

抗体：少なくとも軽鎖または重鎖免疫グロブリン可変領域を含み、クロマチンＤＮＡと会合したタンパク質上のエピトープなど、抗原のエピトープに特異的に結合する、ポリペプチドリガンド。抗体には、モノクローナル抗体、ポリクローナル抗体、または抗体の断片が含まれ得る。

抗原に関する「特異的に結合する」という用語は、抗体または他のリガンドと、クロマチンＤＮＡに結合している特異的タンパク質、例えば転写因子などの特異的ポリペプチドとの、全体または一部においての選好的会合を指す。特異的結合剤は、特異的クロマチン関連因子などの規定の標的にのみ実質的に結合する。特異的結合剤などの分子と非標的ポリペプチドとの間に、わずかな程度の非特異的相互作用が生じ得ることは認識されている。それにもかかわらず、特異的結合は、抗原の特異的認識を介して媒介されるものとして区別され得る。選択的反応性抗体は抗原に結合するものの、それらは低い親和性でそうし得る。特異的結合は、非標的ポリペプチドなどと比較して、標的ポリペプチドへの結合抗体または他のリガンドの量（単位時間あたり）の２倍を上回る、例えば５倍を上回る、１０倍を上回る、または１００倍を上回る増加を典型的にもたらす。特定のタンパク質と特異的に免疫反応性である抗体を選択するのに、多様なイムノアッセイ形式が適している。例えば、固相ＥＬＩＳＡイムノアッセイは、タンパク質と特異的に免疫反応性であるモノクローナル抗体を選択するためにルーチン的に使用される。特異的免疫反応性を判定するために使用され得るイムノアッセイの形式および条件の説明に関しては、Harlow & Lane, Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York (1988)を参照されたい。

抗体は重鎖および軽鎖から構成され得、そのそれぞれは、可変重鎖（ＶＨ）領域および可変軽鎖（ＶＬ）領域と称される可変領域を有する。一緒に、ＶＨ領域およびＶＬ領域は、抗体によって認識される抗原に結合することに関与している。これには、無傷免疫グロブリン、ならびにＦａｂ’断片、Ｆ（ａｂ）’２断片、一本鎖Ｆｖタンパク質（「ｓｃＦｖ」）、およびジスルフィド安定化Ｆｖタンパク質（「ｄｓＦｖ」）ダイアボディ、ならびに他のすべての変形形態など、当技術分野において周知のそれらのバリアントおよび一部分が含まれる。用語には、キメラ抗体（例えば、ヒト化マウス抗体）、ヘテロコンジュゲート抗体（二特異性抗体など）など、組換え形態も含まれる。Pierce Catalog and Handbook, 1994-1995 (Pierce Chemical Co., Rockford, 111.)；Kuby, Immunology, 3rd Ed., W.H. Freeman & Co., New York, 1997も参照されたい。

「モノクローナル抗体」とは、Ｂリンパ球の単一クローンによって、または単一抗体の軽鎖および重鎖遺伝子がトランスフェクトされている細胞によって産生される抗体である。モノクローナル抗体は、当業者に公知の方法によって、例えば骨髄腫細胞と免疫脾臓細胞との融合体からハイブリッド抗体形成細胞を作製することによって産生される。これら融合細胞およびそれらの子孫は、「ハイブリドーマ」と称される。モノクローナル抗体には、ヒト化モノクローナル抗体が含まれる。

増幅：本明細書において記載される方法によって同定されるおよび／または獲得される核酸など、核酸分子のコピーの数を増加させること。結果として生じる増幅産物は、「アンプリコン」と呼ばれる。核酸分子（ＤＮＡまたはＲＮＡ分子など）の増幅は、核酸分子（断片を含む）のコピーの数を増加させる技法の使用を指す。

増幅の例は、試料中の核酸鋳型へのプライマーのハイブリダイゼーションを可能にする条件下で試料とオリゴヌクレオチドプライマーのペアとを接触させる、ポリメラーゼ連鎖反応（ＰＣＲ）である。プライマーは、適切な条件下で伸長し、鋳型から解離し、再アニールし、伸長し、および解離して、核酸のコピーの数を増幅する。このサイクルが反復され得る。増幅の産物は、電気泳動、制限エンドヌクレアーゼ切断パターン、オリゴヌクレオチドハイブリダイゼーションもしくはライゲーション、および／または核酸シーケンシングのような技法によって特徴付けられ得る。

ｉｎｖｉｔｒｏ増幅技法の他の例としては、数ある中でも、定量リアルタイムＰＣＲ；逆転写酵素ＰＣＲ（ＲＴ−ＰＣＲ）；リアルタイムＰＣＲ（ｒｔＰＣＲ）；リアルタイム逆転写酵素ＰＣＲ（ｒｔＲＴ−ＰＣＲ）；ネステッドＰＣＲ；鎖置換増幅（米国特許第５，７４４，３１１号を参照されたい）；転写フリー等温増幅（米国特許第６，０３３，８８１号を参照されたい、修復連鎖反応増幅（ＷＯ９０／０１０６９を参照されたい）；リガーゼ連鎖反応増幅（欧州特許公開第ＥＰ−Ａ−３２０３０８号を参照されたい）；ギャップ充填リガーゼ連鎖反応増幅（米国特許第５，４２７，９３０号を参照されたい）；連動したリガーゼ検出およびＰＣＲ（米国特許第６，０２７，８８９号を参照されたい）；ならびにＮＡＳＢＡ（商標）ＲＮＡ転写フリー増幅（米国特許第６，０２５，１３４号を参照されたい）が挙げられる。

結合または安定結合：一方の核酸分子の、別のものもしくはそれ自身へのハイブリダイゼーション、抗体とペプチドとの会合、またはタンパク質と別のタンパク質（例えば、補因子への転写因子の結合）もしくは核酸分子（例えば、クロマチンＤＮＡなどの核酸への転写因子の結合）との会合など、２つの物質または分子の間の会合。

結合部位：他の分子が安定に結合する、タンパク質、ＤＮＡ、またはＲＮＡ上の領域。一例において、結合部位は、転写因子などのクロマチン関連因子が結合する、クロマチンＤＮＡなどのＤＮＡ分子上の部位である（転写因子結合部位と称される）。

接触：例えば固体形態および／または液体形態の両方での、直接的な物理的会合のもとに置くこと。接触は、ｉｎｓｉｔｕでは単離された細胞、例えば透過処理された細胞と生じ得、またはｉｎｖｉｖｏでは対象に投与することによって生じ得る。

対照：参照標準。対照は、基礎のレベルまたは量を指し示す既知の値または値の範囲であり得る、あるいは組織もしくは細胞またはその集団に存在し得る。対照は、細胞対照または組織対照、例えば罹患していない状態由来の組織でもあり得る。試験試料と対照との間の差は、増加または反対に減少であり得る。差は、定性的な差または定量的な差、例えば統計的に有意な差であり得る。一部の実施形態では、対照は、スパイクインＤＮＡおよび／または混入ＤＮＡなど、添加されたＤＮＡである。

相補的：二本鎖ＤＮＡまたはＲＮＡ鎖は、塩基対の２本の相補鎖からなる。一方の核酸分子の塩基がもう一方の核酸分子の塩基への水素結合を形成した場合に、相補的結合が生じる。通常、塩基アデニン（Ａ；はチミジン（Ｔ）およびウラシル（Ｕ）に相補的であり、一方でシトシン（Ｃ）はグアニン（Ｇ）に相補的である。例えば、一方のｓｓＤＮＡ分子の配列５’−ＡＴＣＧ−３’は、もう一方のｓｓＤＮＡの３’−ＴＡＧＣ−５’に結合して、ｄｓＤＮＡを形成し得る。この例において、配列５’−ＡＴＣＧ−３’は、３’−ＴＡＧＣ−５’の逆相補体である。

核酸分子は、各分子のすべての塩基の完全な水素結合がなくても、互いに相補的であり得る。例えば、相補的核酸配列とのハイブリダイゼーションは、相補体がすべてではなく一部のヌクレオチド位置で結合する種々のストリンジェンシーの条件下で生じ得る。

共有連結した：原子間で電子対を共有することにより特徴付けられる共有結合の形成による、原子間の共有連結を指す。一例において、共有連結は、核酸鎖の骨格におけるホスホジエステル結合など、酸素とリンとの間の結合である。別の例において、共有連結は、抗体と酵素、例えばトランスポザーゼに対する抗体またはヌクレアーゼに対する抗体など、核酸と、１つのタンパク質および／または２つもしくはそれを上回る数のタンパク質あるいはその断片との間のものである。

架橋剤：一方の分子のもう一方の分子への付着を促す化学薬剤または一様の光。架橋剤は、タンパク質−核酸架橋剤、核酸−核酸架橋剤、および／またはタンパク質−タンパク質架橋剤であり得る。そのような薬剤の例は、当技術分野において公知である。一部の実施形態では、架橋剤は可逆的架橋剤である。一部の実施形態では、架橋剤は非可逆的架橋剤である。

検出可能な標識：別の分子に直接的または間接的にコンジュゲートされて、その分子の検出を促す化合物または組成物。標識の具体的かつ非限定的な例としては、蛍光タグ、酵素連結、および放射性同位体が挙げられる。一部の例において、標識を抗体または核酸に付着させて、抗体または核酸が特異的に結合する分子の検出を促す。

ＤＮＡシーケンシング：所与のＤＮＡ分子のヌクレオチド順序を決定する工程。一般的に、シーケンシングは、自動サンガーシーケンシング（ＡＢ１３７３０×１ゲノムアナライザー）、固体担体上でのパイロシーケンシング（４５４シーケンシング、Ｒｏｃｈｅ）、可逆的終結を用いた合成時シーケンシング（ｓｅｑｕｅｎｃｉｎｇ−ｂｙ−ｓｙｎｔｈｅｓｉｓ）（ＩＬＬＵＭＩＮＡ（登録商標）ゲノムアナライザー）、ライゲーションによるシーケンシング（ＡＢＩＳＯＬｉＤ（登録商標））、またはバーチャルターミネーターを用いた合成時シーケンシング（ＨＥＬＩＳＣＯＰＥ（登録商標））を使用して実施され得る。開示される方法との使用のための他の次世代シーケンシング技法としては、超並列シグネチャーシーケンシング（ＭＰＳＳ）、ポロニーシーケンシング、イオントレント半導体シーケンシング、ＤＮＡナノボールシーケンシング、Ｈｅｌｉｓｃｏｐｅ単分子シーケンシング、単分子リアルタイム（ＳＭＲＴ）シーケンシング、およびナノポアＤＮＡシーケンシングが挙げられる。

ハイスループット技法：ロボット工学、データ処理および制御ソフトウェア、液体取扱デバイス、ならびに検出器の組合せにより、ハイスループット技法は、短時間での、例えば２４時間未満、１２時間未満、６時間未満、または１時間未満でさえの、潜在的な試薬、条件、または標的の迅速なスクリーニングを可能にする。

ハイブリダイゼーション：オリゴヌクレオチドおよびそれらのアナログは、相補的塩基間での、ワトソン−クリック、フーグスティーン型または逆フーグスティーン型水素結合を含む水素結合によってハイブリダイズする。一般的に、核酸は、ピリミジン（シトシン（Ｃ）、ウラシル（Ｕ）、およびチミン（Ｔ））またはプリン（アデニン（Ａ）およびグアニン（Ｇ））のいずれかである窒素塩基からなる。これらの窒素塩基は、ピリミジンとプリンとの間で水素結合を形成し、プリンへのピリミジンの結合は「塩基対合」と称される。より具体的には、ＡはＴまたはＵに水素結合し、ＧはＣに結合する。「相補的」とは、２つの別個の核酸配列間または同じ核酸配列の２つの別個の領域間で生じる塩基対合を指す。

「特異的にハイブリダイズ可能」および「特異的に相補的」とは、オリゴヌクレオチド（またはそのアナログ）とＤＮＡまたはＲＮＡとの間で安定的かつ特異的な結合が生じるような、十分な程度の相補性を示す用語である。オリゴヌクレオチドまたはオリゴヌクレオチドアナログは、特異的にハイブリダイズ可能であるために、その標的配列に１００％相補的である必要はない。特異的結合が所望される条件下での非標的配列へのオリゴヌクレオチドまたはアナログの非特異的結合を回避するのに十分な程度の相補性がある場合に、オリゴヌクレオチドまたはアナログは特異的にハイブリダイズ可能である。このような結合は、特異的ハイブリダイゼーションと呼ばれる。

単離された：「単離された」生体構成要素は、構成要素が天然に存在する生物の細胞内の他の生体構成要素、例えばクロマチン外ＤＮＡおよびＲＮＡ、タンパク質、ならびに細胞小器官から実質的に分離されているまたは精製されている。「単離されて」いる核酸およびタンパク質には、標準的な精製法によって精製された核酸およびタンパク質が含まれる。用語は、宿主細胞における組換え発現によって調製された核酸およびタンパク質、ならびに化学合成された核酸も包含する。「単離された」という用語は、生体構成要素に微量の混入もないことを暗示するわけではなく、少なくとも７５％、８０％、９０％、９５％、９８％、９９％、またはさらに１００％単離されているなど、少なくとも５０％単離されている核酸分子を含み得ると理解される。

質量分析：試料から気相イオンを生成し、次いでそれらをそれらの質量電荷比（ｍ／ｚ）に従って分離しおよび検出することによって試料を分析する方法。試料から気相イオンを生成する方法としては、エレクトロスプレーイオン化（ＥＳＩ）、マトリックス支援レーザー脱離イオン化（ＭＡＬＤＩ）、表面エンハンス型レーザー脱離イオン化（ＳＥＬＤＩ）、化学イオン化、および電子衝突イオン化（ＥＩ）が挙げられる。それらのｍ／ｚ比に従ったイオンの分離は、四重極型質量分析計（Ｑ）、飛行時間型（ＴＯＦ）質量分析計、磁場セクター型質量分析計、３Ｄおよびリニアイオントラップ（ＩＴ）、フーリエ変換イオンサイクロトロン共鳴（ＦＴ−ＩＣＲ）分析計、ならびにそれらの組合せ（例えば、四重極−飛行時間型分析計またはＱ−ＴＯＦ分析計）を含めた、任意のタイプの質量分析計を用いて達成され得る。分離の前に、試料を、１次元またはそれを上回る次元のクロマトグラフィー分離、例えば１次元またはそれを上回る次元の液体クロマトグラフィーまたはサイズ排除クロマトグラフィーに供し得る。

核酸（分子または配列）：限定されることなく、ｃＤＮＡ、ｍＲＮＡ、ゲノムＤＮＡ、および合成（化学合成されたなどの）ＤＮＡもしくはＲＮＡまたはそのハイブリッドを含めた、デオキシリボヌクレオチドまたはリボヌクレオチドポリマー。核酸は、二本鎖（ｄｓ）または一本鎖（ｓｓ）であり得る。一本鎖の場合、核酸は、センス鎖またはアンチセンス鎖であり得る。核酸は、天然ヌクレオチド（Ａ、Ｔ／Ｕ、Ｃ、およびＧなど）を含み得、標識されたヌクレオチドなど、天然ヌクレオチドのアナログも含み得る。核酸の一部の例には、本明細書において開示されるプローブが含まれる。ＤＮＡの主なヌクレオチドは、デオキシアデノシン５’−三リン酸（ｄＡＴＰまたはＡ）、デオキシグアノシン５’−三リン酸（ｄＧＴＰまたはＧ）、デオキシシチジン５’−三リン酸（ｄＣＴＰまたはＣ）、およびデオキシチミジン５’−三リン酸（ｄＴＴＰまたはＴ）である。ＲＮＡの主なヌクレオチドは、アデノシン５’−三リン酸（ＡＴＰまたはＡ）、グアノシン５’−三リン酸（ＧＴＰまたはＧ）、シチジン５’−三リン酸（ＣＴＰまたはＣ）、およびウリジン５’−三リン酸（ＵＴＰまたはＵ）である。ヌクレオチドには、例えばNazarenkoらへの米国特許第５，８６６，３３６号に記載される、修飾塩基、修飾糖部分、および修飾リン酸骨格を含有するそうしたヌクレオチドが含まれる。ヌクレオチドをその構造上の任意の位置で修飾するために使用され得る修飾塩基部分の例としては、それらに限定されるわけではないが、数ある中でも、５−フルオロウラシル、５−ブロモウラシル、５−クロロウラシル、５−ヨードウラシル、ヒポキサンチン、キサンチン、アセチルシトシン、５−（カルボキシヒドロキシルメチル）ウラシル、５−カルボキシメチルアミノメチル−２−チオウリジン、５−カルボキシメチルアミノメチルウラシル、ジヒドロウラシル、ベータ−Ｄ−ガラクトシルクエオシン、イノシン、Ｎ〜６−イソペンテニルアデニン（sopentenyladenine）、１−メチルグアニン、１−メチルイノシン、２，２−ジメチルグアニン、２−メチルアデニン、２−メチルグアニン、３−メチルシトシン、５−メチルシトシン、Ｎ６−アデニン、７−メチルグアニン、５−メチルアミノメチルウラシル、メトキシアミノメチル（methoxyarninomethyl）−２−チオウラシル、ベータ−Ｄ−マンノシルクエオシン、５’−メトキシカルボキシメチルウラシル、５−メトキシウラシル、２−メチルチオ−Ｎ６−イソペンテニルアデニン、ウラシル−５−オキシ酢酸、シュードウラシル（ｐｓｅｕｄｏｕｒａｃｉｌ）、クエオシン、２−チオシトシン、５−メチル−２−チオウラシル、２−チオウラシル、４−チオウラシル、５−メチルウラシル、ウラシル−５−オキシ酢酸メチルエステル、ウラシル−Ｓ−オキシ酢酸、５−メチル−２−チオウラシル、３−（３−アミノ−３−Ｎ−２−カルボキシプロピル）ウラシル、２，６−ジアミノプリン、およびビオチン化アナログが挙げられる。ヌクレオチドをその構造上の任意の位置で修飾するために使用され得る修飾糖部分の例としては、それらに限定されるわけではないが、アラビノース、２−フルオロアラビノース、キシロース、およびヘキソース、またはリン酸骨格の修飾成分、例えばホスホロチオエート、ホスホロジチオエート、ホスホロアミドチオエート、ホスホロアミデート、ホスホロジアミデート、メチルホスホネート、アルキルホスホトリエステル、もしくはホルムアセタール（ｆｏｒｍａｃｅｔａｌ）、またはそのアナログが挙げられる。

ペプチド／タンパク質／ポリペプチド：これら用語のすべては、ペプチド結合またはペプチド結合模倣体によってつながっているアミノ酸および／またはアミノ酸アナログのポリマーを指す。当技術分野において公知の、２０種の天然に存在するアミノ酸ならびにそれらの１文字および３文字の名称。

試料：植物または動物などの生物またはその一部から獲得された生体材料（核酸など）を含む、生体試料などの試料。特定の実施形態では、生体試料は、ヒト対象などの動物対象から獲得される。生体試料とは、限定されることなく、数ある中でも細菌、酵母、原生動物、およびアメーバなどの単細胞生物、多細胞生物（健常なもしくは見かけ上健常なヒト対象由来、または診断されるもしくは検査されるべき状態もしくは疾患の影響を受けたヒト患者由来の試料を含めた、植物または動物など）を含めた、任意の生きた生物から獲得される、それによって排出される、またはそれによって分泌される任意の固体または流体試料である。例えば、生体試料は、骨髄、組織生検、全血、血清、血漿、血液細胞、内皮細胞、循環腫瘍細胞、リンパ液、腹水、間質液（「細胞外液」としても公知で、とりわけ歯肉溝滲出液（gingival cervicular fluid）を含めた、細胞間の空間に見い出される流体を包含する）、脳脊髄液（ＣＳＦ）、唾液、粘液、痰、汗、尿、もしくは」他の任意の分泌物、排出物、または他の体液であり得る。

配列同一性／類似性：２つもしくはそれを上回る数の核酸配列間、または２つもしくはそれを上回る数のアミノ酸配列間の同一性／類似性は、配列間の同一性または類似性という観点で表現される。配列同一性は、同一性パーセンテージという観点で測定され得；パーセンテージが高ければ高いほど、配列はより同一である。核酸またはアミノ酸配列のホモログまたはオルソログは、標準的方法を使用してアラインした場合、比較的高い程度の配列同一性／類似性を持つ。

比較のための配列のアライメントの方法は、当技術分野において周知である。様々なプログラムおよびアライメントアルゴリズムが、Smith & Waterman, Adv. Appl. Math. 2:482, 1981；Needleman & Wunsch, J. Mol. Biol. 48:443, 1970；Pearson & Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988；Higgins & Sharp, Gene, 73:237-44, 1988；Higgins & Sharp, CABIOS 5: 151-3, 1989；Corpet et al, Nuc. Acids Res. 16: 10881-90, 1988；Huang et al. Computer Appls. in the Biosciences 8, 155-65, 1992；およびPearson et al, Meth. Mol. Bio. 24:307-31, 1994に記載されている。Altschul et al, J. Mol. Biol. 215:403-10, 1990は、配列アライメント法および相同性算出の詳細な検討を提示している。

ＮＣＢＩの基本的な局所的アライメント検索ツール（ＢＬＡＳＴ：ＢａｓｉｃＬｏｃａｌＡｌｉｇｎｍｅｎｔＳｅａｒｃｈＴｏｏｌ）（Altschul et al, J. Mol. Biol. 215:403-10, 1990）は、配列分析プログラムのｂｌａｓｔｐ、ｂｌａｓｔｎ、ｂｌａｓｔｘ、ｔｂｌａｓｔｎ、およびｔｂｌａｓｔｘと関連した使用のために、国立生物工学情報センター（ＮＣＢＩ：ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｌｏｇｉｃａｌＩｎｆｏｒｍａｔｉｏｎ、ＮａｔｉｏｎａｌＬｉｂｒａｒｙｏｆＭｅｄｉｃｉｎｅ、Ｂｕｉｌｄｉｎｇ３８Ａ、Ｒｏｏｍ８Ｎ８０５、Ｂｅｔｈｅｓｄａ、Ｍｄ．２０８９４）を含めたいくつかの発信元からおよびインターネットで利用可能である。ｂｌａｓｔｎは核酸配列を比較するために使用され、一方でｂｌａｓｔｐはアミノ酸配列を比較するために使用される。さらなる情報は、ＮＣＢＩウェブサイトに見い出され得る。

アラインすると、同一のヌクレオチドまたはアミノ酸残基が両配列において提示されている位置の数をカウントすることによって、合致の数が決定される。配列同一性パーセントは、同定された配列に示される配列の長さによってまたは分節された長さ（同定された配列に示される配列由来の１００個の連続したヌクレオチドまたはアミノ酸残基など）によって合致の数を割り、その後に、結果として生じる値に１００を掛けることによって決定される。例えば、１５５４個のヌクレオチドを有する試験配列とアラインした場合に１１６６個の合致を有する核酸配列は、試験配列と７５．０パーセント同一である（１１６６÷１５５４＊１００＝７５．０）。配列同一性パーセント値は、小数第１位に丸められる。例えば、７５．１１、７５．１２、７５．１３、および７５．１４は７５．１に切り捨てられ、一方で７５．１５、７５．１６、７５．１７、７５．１８、および７５．１９は７５．２に切り上げられる。長さの値は、常に整数である。別の例において、同定された配列由来の２０個の連続したヌクレオチドとアラインする、２０ヌクレオチド領域を含有する標的配列は、以下のように、その同定された配列と７５パーセントの配列同一性を共有する領域を含有する（すなわち、１５±２０＊１００＝７５）。

２つの核酸分子が近縁関係にあるという１つの兆候は、２つの分子がストリンジェントな条件下で互いにハイブリダイズすることである。ストリンジェントな条件は配列依存的であり、種々の環境パラメーターの下で異なる。

特異的結合剤：タンパク質、酵素、多糖類、オリゴヌクレオチド、ＤＮＡ、ＲＮＡ、組換えベクター、または小分子など、規定の標的にのみ実質的にまたは選好的に結合する薬剤。核酸特異的結合剤は、ＤＮＡなどの規定の核酸にのみ、または核酸内の特異的領域にのみ実質的に結合する。一部の実施形態では、特異的結合剤は、目的の標的核酸に特異的に結合するプローブまたはプライマーである。一部の実施形態では、特異的結合剤は、クロマチンＤＮＡなどの目的の標的核酸に特異的に結合する転写因子である。タンパク質特異的結合剤は、規定のタンパク質にのみ、またはタンパク質内の特異的領域にのみ実質的に結合する。例えば、「特異的結合剤」には、指定のポリペプチドに実質的に結合する抗体および他の薬剤が含まれる。抗体は、ポリペプチドに特異的であるモノクローナルまたはポリクローナル抗体、およびその免疫学的に有効な部分（「断片」）であり得る。特定の薬剤が特異的ポリペプチドにのみ実質的に結合するという判定は、ルーチン手順を使用するまたは適応させることによって容易に行われ得る。１つの適切なｉｎｖｉｔｒｏアッセイは、ウエスタンブロッティング手順（Harlow and Lane, Using Antibodies: A Laboratory Manual, CSHL, New York, 1999を含めた、多くの標準的なテキストに記載される）を使用する。一部の実施形態では、特異的結合剤は抗体である。

転写因子：転写を調節するタンパク質。とくに、転写因子は、ＲＮＡポリメラーゼの結合、および転写の開始を調節する。転写因子は、上流または下流に結合して、ＲＮＡポリメラーゼ結合を支援するまたは遮断することによって遺伝子の転写を増強するまたは抑える。転写因子という用語には、不活性のおよび活性化された転写因子の両方が含まれる。

転写因子は、典型的に、遺伝子発現の調節に影響を及ぼすモジュラータンパク質である。例示的な転写因子としては、それらに限定されるわけではないが、数ある中でも、ＡＡＦ、ａｂｌ、ＡＤＡ２、ＡＤＡ−ＮＦ１、ＡＦ−１、ＡＦＰ１、ＡｈＲ、ＡＩＩＮ３、ＡＬＬ−１、アルファ−ＣＢＦ、アルファ−ＣＰ１、アルファ−ＣＰ２ａ、アルファ−ＣＰ２ｂ、アルファＨｏ、アルファＨ２−アルファＨ３、Ａｌｘ−４、ａＭＥＦ−２、ＡＭＬ１、ＡＭＬｌａ、ＡＭＬｌｂ、ＡＭＬｌｃ、ＡＭＬｌデルタＮ、ＡＭＬ２、ＡＭＬ３、ＡＭＬ３ａ、ＡＭＬ３ｂ、ＡＭＹ−１Ｌ、Ａ−Ｍｙｂ、ＡＮＦ、ＡＰ−１、ＡＰ−２アルファＡ、ＡＰ−２アルファＢ、ＡＰ−２ベータ、ＡＰ−２ガンマ、ＡＰ−３（１）、ＡＰ−３（２）、ＡＰ−４、ＡＰ−５、ＡＰＣ、ＡＲ、ＡＲＥＢ６、Ａｒｎｔ、Ａｒｎｔ（７７４Ｍ型）、ＡＲＰ−１、ＡＴＢＦ１−Ａ、ＡＴＢＦ１−Ｂ、ＡＴＦ、ＡＴＦ−１、ＡＴＦ−２、ＡＴＦ−３、ＡＴＦ−３デルタＺＩＰ、ＡＴＦ−ａ、ＡＴＦ−ａデルタ、ＡＴＰＦ１、Ｂａｒｈｌｌ、Ｂａｒｈｌ２、Ｂａｒｘｌ、Ｂａｒｘ２、Ｂｃｌ−３、ＢＣＬ−６、ＢＤ７３、ベータ−カテニン、Ｂｉｎｌ、Ｂ−Ｍｙｂ、ＢＰ１、ＢＰ２、ブラフマ（ｂｒａｈｍａ）、ＢＲＣＡ１、Ｂｒｎ−３ａ、Ｂｒｎ−３ｂ、Ｂｒｎ−４、ＢＴＥＢ、ＢＴＥＢ２、Ｂ−ＴＦＩＩＤ、Ｃ／ＥＢＰアルファ、Ｃ／ＥＢＰベータ、Ｃ／ＥＢＰデルタ、ＣＡＣＣ結合因子、Ｃａｒｔ−１、ＣＢＦ（４）、ＣＢＦ（５）、ＣＢＰ、ＣＣＡＡＴ結合因子、ＣＣＭＴ結合因子、ＣＣＦ、ＣＣＧ１、ＣＣＫ−ｌａ、ＣＣＫ−ｌｂ、ＣＤ２８ＲＣ、ｃｄｋ２、ｃｄｋ９、Ｃｄｘ−１、ＣＤＸ２、Ｃｄｘ−４、ＣＦＦ、ＣｈｘｌＯ、ＣＬＩＭＩ、ＣＬＩＭ２、ＣＮＢＰ、ＣｏＳ、ＣＯＵＰ、ＣＰｌ、ＣＰＩＡ、ＣＰＩＣ、ＣＰ２、ＣＰＢＰ、ＣＰＥ結合タンパク質、ＣＲＥＢ、ＣＲＥＢ−２、ＣＲＥ−ＢＰｌ、ＣＲＥ−ＢＰａ、ＣＲＥＭアルファ、ＣＲＦ、Ｃｒｘ、ＣＳＢＰ−１、ＣＴＣＦ、ＣＴＦ、ＣＴＦ−１、ＣＴＦ−２、ＣＴＦ−３、ＣＴＦ−５、ＣＴＦ−７、ＣＵＰ、ＣＵＴＬ１、Ｃｘ、サイクリンＡ、サイクリンＴｌ、サイクリンＴ２、サイクリンＴ２ａ、サイクリンＴ２ｂ、ＤＡＰ、ＤＡＸ１、ＤＢ１、ＤＢＦ４、ＤＢＰ、ＤｂｐＡ、ＤｂｐＡｖ、ＤｂｐＢ、ＤＤＢ、ＤＤＢ−１、ＤＤＢ−２、ＤＥＦ、デルタＣＲＥＢ、デルタＭａｘ、ＤＦ−１、ＤＦ−２、ＤＦ−３、Ｄｌｘ−１、Ｄｌｘ−２、Ｄｌｘ−３、ＤＩｘ４（長いアイソフォーム）、Ｄｌｘ−４（短いアイソフォーム、Ｄｌｘ−５、Ｄｌｘ−６、ＤＰ−１、ＤＰ−２、ＤＳＩＦ、ＤＳＩＦ−ｐ１４、ＤＳＩＦ−ｐｌ６０、ＤＴＦ、ＤＵＸ１、ＤＵＸ２、ＤＵＸ３、ＤＵＸ４、Ｅ、Ｅｌ２、Ｅ２Ｆ、Ｅ２Ｆ＋Ｅ４、Ｅ２Ｆ＋ｐｌ０７、Ｅ２Ｆ−１、Ｅ２Ｆ−２、Ｅ２Ｆ−３、Ｅ２Ｆ−４、Ｅ２Ｆ−５、Ｅ２Ｆ−６、Ｅ４７、Ｅ４ＢＰ４、Ｅ４Ｆ、Ｅ４Ｆ１、Ｅ４ＴＦ２、ＥＡＲ２、ＥＢＰ−８０、ＥＣ２、ＥＦ１、ＥＦ−Ｃ、ＥＧＲ１、ＥＧＲ２、ＥＧＲ３、ＥＩＩａＥ−Ａ、ＥＩＩａＥ−Ｂ、ＥＩＩａＥ−Ｃアルファ、ＥＩＩａＥ−Ｃベータ、ＥｉｖＦ、ＥＩｆ−１、ＥＩｋ−１、Ｅｍｘ−１、Ｅｍｘ−２、Ｅｍｘ−２、Ｅｎ−１、Ｅｎ−２、ＥＮＨ−ｂｉｎｄ．ｐｒｏｔ、ＥＮＫＴＦ−１、ＥＰＡＳｌ、エプシロンＦｌ、ＥＲ、Ｅｒｇ−１、Ｅｒｇ−２、ＥＲＲ１、ＥＲＲ２、ＥＴＦ、Ｅｔｓ−１、Ｅｔｓ−１デルタＶｉｌ、Ｅｔｓ−２、Ｅｖｘ−１、Ｆ２Ｆ、第２因子、因子名（Ｆａｃｔｏｒｎａｍｅ）、ＦＢＰ、ｆ−ＥＢＰ、ＦＫＢＰ５９、ＦＫＨＬ１８、ＦＫＨＲＬ１Ｐ２、Ｆｌｉ−１、Ｆｏｓ、ＦＯＸＢ１、ＦＯＸＣ１、ＦＯＸＣ２、ＦＯＸＤ１、ＦＯＸＤ２、ＦＯＸＤ３、ＦＯＸＤ４、ＦＯＸＥ１、ＦＯＸＥ３、ＦＯＸＦ１、ＦＯＸＦ２、ＦＯＸＧｌａ、ＦＯＸＧ１ｂ、ＦＯＸＧｌｃ、ＦＯＸＨ１、ＦＯＸＩ１、ＦＯＸＪｌａ、ＦＯＸＪｌｂ、ＦＯＸＪ２（長いアイソフォーム）、ＦＯＸＪ２（短いアイソフォーム）、ＦＯＸＪ３、ＦＯＸＫｌａ、ＦＯＸＫｌｂ、ＦＯＸＫｌｃ、ＦＯＸＬ１、ＦＯＸＭｌａ、ＦＯＸＭｌｂ、ＦＯＸＭｌｃ、ＦＯＸＮ１、ＦＯＸＮ２、ＦＯＸＮ３、ＦＯＸＯｌａ、ＦＯＸＯｌｂ、ＦＯＸ０２、ＦＯＸ０３ａ、ＦＯＸ０３ｂ、ＦＯＸ０４、ＦＯＸＰ１、ＦＯＸＰ３、Ｆｒａ−１、Ｆｒａ−２、ＦＴＦ、ＦＴＳ、Ｇ因子、Ｇ６因子、ＧＡＢＰ、ＧＡＢＰ−アルファ、ＧＡＢＰ−ベータｌ、ＧＡＢＰ−ベータ２、ＧＡＤＤ１５３、ＧＡＦ、ガンマＣＭＴ、ガンマＣＡＣｌ、ガンマＣＡＣ２、ＧＡＴＡ−１、ＧＡＴＡ−２、ＧＡＴＡ−３、ＧＡＴＡ−４、ＧＡＴＡ−５、ＧＡＴＡ−６、Ｇｂｘ−１、Ｇｂｘ−２、ＧＣＦ、ＧＣＭａ、ＧＣＮＳ、ＧＦ１、ＧＬＩ、ＧＬＩ３、ＧＲアルファ、ＧＲベータ、ＧＲＦ−１、Ｇｓｃ、Ｇｓｃｌ、ＧＴ−ＩＣ、ＧＴ−ＩＩＡ、ＧＴ−ＩＩＢアルファ、ＧＴ−ＩＩＢベータ、Ｈ１ＴＦ１、Ｈ１ＴＦ２、Ｈ２ＲＩＩＢＰ、Ｈ４ＴＦ−１、Ｈ４ＴＦ−２、ＨＡＮＤ１、ＨＡＮＤ２、ＨＢ９、ＨＤＡＣ１、ＨＤＡＣ２、ＨＤＡＣ３、ｈＤａｘｘ、熱誘導性因子、ＨＥＢ、ＨＥＢｌ−ｐ６７、ＨＥＢｌ−ｐ９４、ＨＥＦ−１Ｂ、ＨＥＦ−１Ｔ、ＨＥＦ−４Ｃ、ＨＥＮ１、ＨＥＮ２、Ｈｅｓｘｌ、Ｈｅｘ、ＨＩＦ−１、ＨＩＦ−ｌアルファ、ＨＩＦ−ｌベータ、ＨｉＮＦ−Ａ、ＨｉＮＦ−Ｂ、ＨＩＮＦ−Ｃ、ＨＩＮＦ−Ｄ、ＨｉＮＦ−Ｄ３、ＨｉＮＦ−Ｅ、ＨｉＮＦ−Ｐ、ＨＩＰ１、ＨＩＶ−ＥＰ２、Ｈｌｆ、ＨＬＴＦ、ＨＬＴＦ（Ｍｅｔｌ２３）、ＨＬＸ、ＨＭＢＰ、ＨＭＧＩ、ＨＭＧＩ（Ｙ）、ＨＭＧＹ、ＨＭＧＩ−Ｃ、ＨＮＦ−ＩＡ、ＨＮＦ−ＩＢ、ＨＮＦ−ＩＣ、ＨＮＦ−３、ＨＮＦ−３アルファ、ＨＮＦ−３ベータ、ＨＮＦ−３ガンマ、ＨＮＦ４、ＨＮＦ−４アルファ、ＨＮＦ４アルファｌ、ＨＮＦ−４アルファ２、ＨＮＦ−４アルファ３、ＨＮＦ−４アルファ４、ＨＮＦ４ガンマ、ＨＮＦ−６アルファ、ｈｎＲＮＰＫ、ＨＯＸ１１、ＨＯＸＡｌ、ＨＯＸＡＩＯ、ＨＯＸＡＩＯＰＬ２、ＨＯＸＡ１１、ＨＯＸＡ１３、ＨＯＸＡ２、ＨＯＸＡ３、ＨＯＸＡ４、ＨＯＸＡ５、ＨＯＸＡ６、ＨＯＸＡ７、ＨＯＸＡ９Ａ、ＨＯＸＡ９Ｂ、ＨＯＸＢ−１、ＨＯＸＢ１３、ＨＯＸＢ２、ＨＯＸＢ３、ＨＯＸＢ４、ＨＯＸＢＳ、ＨＯＸＢ６、ＨＯＸＡ５、ＨＯＸＢ７、ＨＯＸＢ８、ＨＯＸＢ９、ＨＯＸＣ１０、ＨＯＸＣ１１、ＨＯＸＣ１２、ＨＯＸＣ１３、ＨＯＸＣ４、ＨＯＸＣ５、ＨＯＸＣ６、ＨＯＸＣ８、ＨＯＸＣ９、ＨＯＸＤ１０、ＨＯＸＤ１１、ＨＯＸＤ１２、ＨＯＸＤ１３、ＨＯＸＤ３、ＨＯＸＤ４、ＨＯＸＤ８、ＨＯＸＤ９、Ｈｐ５５、Ｈｐ６５、ＨＰＸ４２Ｂ、ＨｒｐＦ、ＨＳＦ、ＨＳＦ１（長）、ＨＳＦ１（短）、ＨＳＦ２、ｈｓｐ５６、Ｈｓｐ９０、ＩＢＰ−１、ＩＣＥＲ−ＩＩ、ＩＣＥＲ−Ｉｉガンマ、ＩＣＳＢＰ、Ｉｄｌ、ＩｄｌＨ’、Ｉｄ２、Ｉｄ３、Ｉｄ３／Ｈｅｉｒ−１、ＩＦ１、ＩｇＰＥ−１、ＩｇＰＥ−２、ＩｇＰＥ−３、ＩカッパＢ、ＩカッパＢ−アルファ、ＩカッパＢ−ベータ、ＩカッパＢＲ、ＩＩ−ｌＲＦ、ＩＬ−６ＲＥ−ＢＰ、１１−６ＲＦ、ＩＮＳＡＦ、ＩＰＦ１、ＩＲＦ−１、ＩＲＦ−２、Ｂ、ＩＲＸ２ａ、Ｉｒｘ−３、Ｉｒｘ−４、ＩＳＧＦ−１、ＩＳＧＦ−３、ＩＳＧＦ３アルファ、ＩＳＧＦ−３ガンマ、１ｓｔ−１、ＩＴＦ、ＩＴＦ−１、ＩＴＦ−２、ＪＲＦ、Ｊｕｎ、ＪｕｎＢ、ＪｕｎＤ、ｋａｐｐａｙ因子、ＫＢＰ−１、ＫＥＲ１、ＫＥＲ−１、Ｋｏｘｌ、ＫＲＦ−１、Ｋｕ自己抗原、ＫＵＰ、ＬＢＰ−１、ＬＢＰ−ｌａ、ＬＢＸｌ、ＬＣＲ−Ｆｌ、ＬＥＦ−１、ＬＥＦ−ＩＢ、ＬＦ−Ａ１、ＬＨＸ１、ＬＨＸ２、ＬＨＸ３ａ、ＬＨＸ３ｂ、ＬＨＸＳ、ＬＨＸ６．１ａ、ＬＨＸ６．１ｂ、ＬＩＴ−１、Ｌｍｏｌ、Ｌｍｏ２、ＬＭＸ１Ａ、ＬＭＸ１Ｂ、Ｌ−Ｍｙｌ（長い形態）、Ｌ−Ｍｙｌ（短い形態）、Ｌ−Ｍｙ２、ＬＳＦ、ＬＸＲアルファ、ＬｙＦ−１、Ｌｙｌ−ｌ、Ｍ因子、Ｍａｄｌ、ＭＡＳＨ−１、Ｍａｘｌ、Ｍａｘ２、ＭＡＺ、ＭＡＺ１、ＭＢ６７、ＭＢＦ１、ＭＢＦ２、ＭＢＦ３、ＭＢＰ−１（１）、ＭＢＰ−１（２）、ＭＢＰ−２、ＭＤＢＰ、ＭＥＦ−２、ＭＥＦ−２Ｂ、ＭＥＦ−２Ｃ（４３３ＡＡ型）、ＭＥＦ−２Ｃ（４６５ＡＡ型）、ＭＥＦ−２Ｃ（４７３Ｍ型）、ＭＥＦ−２Ｃ／デルタ３２（４４１ＡＡ型）、ＭＥＦ−２Ｄ００、ＭＥＦ−２Ｄ０Ｂ、ＭＥＦ−２ＤＡ０、ＭＥＦ−２ＤＡＯ、ＭＥＦ−２ＤＡＢ、ＭＥＦ−２ＤＡ’Ｂ、Ｍｅｉｓ−１、Ｍｅｉｓ−２ａ、Ｍｅｉｓ−２ｂ、Ｍｅｉｓ−２ｃ、Ｍｅｉｓ−２ｄ、Ｍｅｉｓ−２ｅ、Ｍｅｉｓ３、Ｍｅｏｘｌ、Ｍｅｏｘｌａ、Ｍｅｏｘ２、ＭＨｏｘ（Ｋ−２）、Ｍｉ、ＭＩＦ−１、Ｍｉｚ−１、ＭＭ−１、ＭＯＰ３、ＭＲ、Ｍｓｘ−１、Ｍｓｘ−２、ＭＴＢ−Ｚｆ、ＭＴＦ−１、ｍｔＴＦ１、Ｍｘｉｌ、Ｍｙｂ、Ｍｙｃ、Ｍｙｃ１、Ｍｙｆ−３、Ｍｙｆ−４、Ｍｙｆ−５、Ｍｙｆ−６、ＭｙｏＤ、ＭＺＦ−１、ＮＣＩ、ＮＣ２、ＮＣＸ、ＮＥＬＦ、ＮＥＲ１、Ｎｅｔ、ＮＦＩｌｌ−ａ、ＮＦＮＦ−１、ＮＦ−１Ａ、ＮＦ−１Ｂ、ＮＦ−１Ｘ、ＮＦ−４ＦＡ、ＮＦ−４ＦＢ、ＮＦ−４ＦＣ、ＮＦ−Ａ、ＮＦ−ＡＢ、ＮＦＡＴ−１、ＮＦ−ＡＴ３、ＮＦ−Ａｔｃ、ＮＦ−Ａｔｐ、ＮＦ−Ａｔｘ、ＮｆｅｔａＡ、ＮＦ−ＣＬＥＯａ、ＮＦ−ＣＬＥＯｂ、ＮＦデルタＥ３Ａ、ＮＦデルタＥ３Ｂ、ＮＦデルタＥ３Ｃ、ＮＦデルタＥ４Ａ、ＮＦデルタＥ４Ｂ、ＮＦデルタＥ４Ｃ、Ｎｆｅ、ＮＦ−Ｅ、ＮＦ−Ｅ２、ＮＦ−Ｅ２ｐ４５、ＮＦ−Ｅ３、ＮＦＥ−６、ＮＦ−Ｇｍａ、ＮＦ−ＧＭｂ、ＮＦ−ＩＬ−２Ａ、ＮＦ−ＩＬ−２Ｂ、ＮＦ−ｊｕｎ、ＮＦ−カッパＢ、ＮＦ−カッパＢ（様）、ＮＦ−カッパＢｌ、ＮＦ−カッパＢ１、前駆体、ＮＦ−カッパＢ２、ＮＦ−カッパＢ２（ｐ４９）、ＮＦ−カッパＢ２前駆体、ＮＦ−カッパＥｌ、ＮＦ−カッパＥ２、ＮＦ−カッパＥ３、ＮＦ−ＭＨＣＩＩＡ、ＮＦ−ＭＨＣＩＩＢ、ＮＦ−ｍｕＥｌ、ＮＦ−ｍｕＥ２、ＮＦ−ｍｕＥ３、ＮＦ−Ｓ、ＮＦ−Ｘ、ＮＦ−Ｘ１、ＮＦ−Ｘ２、ＮＦ−Ｘ３、ＮＦ−Ｘｃ、ＮＦ−ＹＡ、ＮＦ−Ｚｃ、ＮＦ−Ｚｚ、ＮＨＰ−１、ＮＨＰ−２、ＮＨＰ３、ＮＨＰ４、ＮＫＸ２−５、ＮＫＸ２Ｂ、ＮＫＸ２Ｃ、ＮＫＸ２Ｇ、ＮＫＸ３Ａ、ＮＫＸ３Ａｖｌ、ＮＫＸ３Ａｖ２、ＮＫＸ３Ａｖ３、ＮＫＸ３Ａｖ４、ＮＫＸ３Ｂ、ＮＫＸ６Ａ、Ｎｍｉ、Ｎ−Ｍｙｃ、Ｎ−Ｏｃｔ−２アルファ、Ｎ−Ｏｃｔ−２ベータ、Ｎ−Ｏｃｔ−３、Ｎ−Ｏｃｔ−４、Ｎ−Ｏｃｔ−５ａ、Ｎ−Ｏｃｔ−５ｂ、ＮＰ−ＴＣＩＩ、ＮＲ２Ｅ３、ＮＲ４Ａ２、Ｎｒｆ１、Ｎｒｆ−１、Ｎｒｆ２、ＮＲＦ−２ベータｌ、ＮＲＦ−２ガンマｌ、ＮＲＬ、ＮＲＳＦ１型、ＮＲＳＦ２型、ＮＴＦ、０２、ＯＣＡ−Ｂ、Ｏｃｔ−１、Ｏｃｔ−２、Ｏｃｔ−２．１、Ｏｃｔ−２Ｂ、Ｏｃｔ−２Ｃ、Ｏｃｔ−４Ａ、Ｏｃｔ４Ｂ、Ｏｃｔ−５、Ｏｃｔ−６、オクタ因子、八量体結合因子、ｏｃｔ−Ｂ２、ｏｃｔ−Ｂ３、Ｏｔｘｌ、Ｏｔｘ２、ＯＺＦ、ｐｌ０７、ｐｌ３０、ｐ２８モジュレーター、ｐ３００、ｐ３８ｅｒｇ、ｐ４５、ｐ４９ｅｒｇ、−ｐ５３、ｐ５５、ｐ５５ｅｒｇ、ｐ６５デルタ、ｐ６７、Ｐａｘ−１、Ｐａｘ−２、Ｐａｘ−３、Ｐａｘ−３Ａ、Ｐａｘ−３Ｂ、Ｐａｘ−４、Ｐａｘ−５、Ｐａｘ−６、Ｐａｘ−６／Ｐｄ−５ａ、Ｐａｘ−７、Ｐａｘ−８、Ｐａｘ−８ａ、Ｐａｘ−８ｂ、Ｐａｘ−８ｃ、Ｐａｘ−８ｄ、Ｐａｘ−８ｅ、Ｐａｘ−８ｆ、Ｐａｘ−９、Ｐｂｘ−ｌａ、Ｐｂｘ−ｌｂ、Ｐｂｘ−２、Ｐｂｘ−３ａ、Ｐｂｘ−３ｂ、ＰＣ２、ＰＣ４、ＰＣ５、ＰＥＡ３、ＰＥＢＰ２アルファ、ＰＥＢＰ２ベータ、Ｐｉｔ−１、ＰＩＴＸ１、ＰＩＴＸ２、ＰＩＴＸ３、ＰＫＮＯＸ１、ＰＬＺＦ、ＰＯ−Ｂ、Ｐｏｎｔｉｎ５２、ＰＰＡＲアルファ、ＰＰＡＲベータ、ＰＰＡＲガンマｌ、ＰＰＡＲガンマ２、ＰＰＵＲ、ＰＲ、ＰＲＡ、ｐＲｂ、ＰＲＤ１−ＢＦ１、ＰＲＤＩ−ＢＦｃ、Ｐｒｏｐ−１、ＰＳＥ１、Ｐ−ＴＥＦｂ、ＰＴＦ、ＰＴＦアルファ、ＰＴＦベータ、ＰＴＦデルタ、ＰＴＦガンマ、Ｐｕボックス結合因子、Ｐｕボックス結合因子（ＢＪＡ−Ｂ）、ＰＵ．１、ＰｕＦ、Ｐｕｒ因子、Ｒｌ、Ｒ２、ＲＡＲ−アルファｌ、ＲＡＲ−ベータ、ＲＡＲ−ベータ２、ＲＡＲ−ガンマ、ＲＡＲ−ガンマ１、ＲＢＰ６０、ＲＢＰ−Ｊカッパ、Ｒｅｌ、ＲｅｌＡ、ＲｅｌＢ、ＲＦＸ、ＲＦＸ１、ＲＦＸ２、ＲＦＸ３、ＲＦＸＳ、ＲＦ−Ｙ、ＲＯＲアルファｌ、ＲＯＲアルファ２、ＲＯ
Ｒアルファ３、ＲＯＲベータ、ＲＯＲガンマ、Ｒｏｘ、ＲＰＦ１、ＲＰＧアルファ、ＲＲＥＢ−１、ＲＳＲＦＣ４、ＲＳＲＦＣ９、ＲＶＦ、ＲＸＲ−アルファ、ＲＸＲ−ベータ、ＳＡＰ−ｌａ、ＳＡＰｌｂ、ＳＦ−１、ＳＨＯＸ２ａ、ＳＨＯＸ２ｂ、ＳＨＯＸａ、ＳＨＯＸｂ、ＳＨＰ、ＳＩＩＩ−ｐｌｌＯ、ＳＩＩＩ−ｐｌ５、ＳＩＩＩ−ｐｌ８、ＳＩＭ’、Ｓｉｘ−１、Ｓｉｘ−２、Ｓｉｘ−３、Ｓｉｘ−４、Ｓｉｘ−５、Ｓｉｘ−６、ＳＭＡＤ−１、ＳＭＡＤ−２、ＳＭＡＤ−３、ＳＭＡＤ−４、ＳＭＡＤ−５、ＳＯＸ−１１、ＳＯＸ−１２、Ｓｏｘ−４、Ｓｏｘ−５、ＳＯＸ−９、Ｓｐｌ、Ｓｐ２、Ｓｐ３、Ｓｐ４、Ｓｐｈ因子、Ｓｐｉ−Ｂ、ＳＰＩＮ、ＳＲＣＡＰ、ＳＲＥＢＰ−ｌａ、ＳＲＥＢＰ−ｌｂ、ＳＲＥＢＰ−ｌｃ、ＳＲＥＢＰ−２、ＳＲＥ−ＺＢＰ、ＳＲＦ、ＳＲＹ、ＳＲＰｌ、Ｓｔａｆ−５０、ＳＴＡＴｌアルファ、ＳＴＡＴｌベータ、ＳＴＡＴ２、ＳＴＡＴ３、ＳＴＡＴ４、ＳＴＡＴ６、Ｔ３Ｒ、Ｔ３Ｒ−アルファｌ、Ｔ３Ｒ−アルファ２、Ｔ３Ｒ−ベータ、ＴＡＦ（Ｉ）１１０、ＴＡＦ（Ｉ）４８、ＴＡＦ（Ｉ）６３、ＴＡＦ（ＩＩ）１００、ＴＡＦ（ＩＩ）１２５、ＴＡＦ（ＩＩ）１３５、ＴＡＦ（ＩＩ）１７０、ＴＡＦ（ＩＩ）１８、ＴＡＦ（ＩＩ）２０、ＴＡＦ（ＩＩ）２５０、ＴＡＦ（ＩＩ）２５０デルタ、ＴＡＦ（ＩＩ）２８、ＴＡＦ（ＩＩ）３０、ＴＡＦ（ＩＩ）３１、ＴＡＦ（ＩＩ）５５、ＴＡＦ（ＩＩ）７０−アルファ、ＴＡＦ（ＩＩ）７０−ベータ、ＴＡＦ（ＩＩ）７０−ガンマ、ＴＡＦ−Ｉ、ＴＡＦ−ＩＩ、ＴＡＦ−Ｌ、Ｔａｌ−１、Ｔａｌ−ｌベータ、Ｔａｌ−２、ＴＡＲ因子、ＴＢＰ、ＴＢＸ１Ａ、ＴＢＸ１Ｂ、ＴＢＸ２、ＴＢＸ４、ＴＢＸＳ（長いアイソフォーム）、ＴＢＸＳ（短いアイソフォーム）、ＴＣＦ、ＴＣＦ−１、ＴＣＦ−１Ａ、ＴＣＦ−１Ｂ、ＴＣＦ−１Ｃ、ＴＣＦ−１Ｄ、ＴＣＦ−１Ｅ、ＴＣＦ−１Ｆ、ＴＣＦ−１Ｇ、ＴＣＦ−２アルファ、ＴＣＦ−３、ＴＣＦ−４、ＴＣＦ−４（Ｋ）、ＴＣＦ−４Ｂ、ＴＣＦ−４Ｅ、ＴＣＦベータｌ、ＴＥＦ−１、ＴＥＦ−２、ｔｅｌ、ＴＦＥ３、ＴＦＥＢ、ＴＦＩＩＡ、ＴＦＩＩＡ−アルファ／ベータ前駆体、ＴＦＩＩＡ−アルファ／ベータ前駆体、ＴＦＩＩＡ−ガンマ、ＴＦＩＩＢ、ＴＦＩＩＤ、ＴＦＩＩＥ、ＴＦＩＩＥ−アルファ、ＴＦＩＩＥ−ベータ、ＴＦＩＩＦ、ＴＦＩＩＦ−アルファ、ＴＦＩＩＦ−ベータ、ＴＦＩＩＨ、ＴＦＩＩＨ＊、ＴＦＩＩＨ−ＣＡＫ、ＴＦＩＩＨ−サイクリンＨ、ＴＦＩＩＨ−ＥＲＣＣ２／ＣＡＫ、ＴＦＩＩＨ−ＭＡＴ１、ＴＦＩＩＨ−Ｍ０１５、ＴＦＩＩＨ−ｐ３４、ＴＦＩＩＨ−ｐ４４、ＴＦＩＩＨ−ｐ６２、ＴＦＩＩＨ−ｐ８０、ＴＦＩＩＨ−ｐ９０、ＴＦＩＩ−Ｉ、Ｔｆ−ＬＦｌ、Ｔｆ−ＬＦ２、ＴＧＩＦ、ＴＧＩＦ２、ＴＧＴ３、ＴＨＲＡｌ、ＴＩＦ２、ＴＬＥ１、ＴＬＸ３、ＴＭＦ、ＴＲ２、ＴＲ２−１１、ＴＲ２−９、ＴＲ３、ＴＲ４、ＴＲＡＰ、ＴＲＥＢ−１、ＴＲＥＢ−２、ＴＲＥＢ−３、ＴＲＥＦｌ、ＴＲＥＦ２、ＴＲＦ（２）、ＴＴＦ−１、ＴＸＲＥＢＰ、ＴｘＲＥＦ、ＵＢＦ、ＵＢＰ−１、ＵＥＦ−１、ＵＥＦ−２、ＵＥＦ−３、ＵＥＦ−４、ＵＳＦ１、ＵＳＦ２、ＵＳＦ２ｂ、Ｖａｖ、Ｖａｘ−２、ＶＤＲ、ｖＨＮＦ−ｌＡ、ｖＨＮＦ−ｌＢ、ｖＨＮＦ−ｌＣ、ＶＩＴＦ、ＷＳＴＦ、ＷＴ１、ＷＴ１Ｉ、ＷＴ１Ｉ−ＫＴＳ、ＷＴ１Ｉ−ｄｅｌ２、ＷＴ１−ＫＴＳ、ＷＴｌ−ｄｅｌ２、Ｘ２ＢＰ、ＸＢＰ−１、ＸＷ−Ｖ、ＸＸ、ＹＡＦ２、ＹＢ−１、ＹＥＢＰ、ＹＹ１、ＺＥＢ、ＺＦ１、ＺＦ２、ＺＦＸ、ＺＨＸ１、ＺＩＣ２、ＺＩＤ、ＺＮＦ１７４が挙げられる。

活性化された転写因子とは、転写因子の状態の測定可能な変化をもたらす刺激、例えばリン酸化、メチル化などの翻訳後修飾によって活性化されている転写因子である。転写因子の活性化は、特定のＤＮＡ配列に対する親和性、または別の転写因子および／もしくは補因子などの特定のタンパク質の親和性の変化をもたらし得る。

トランスポソーム：トランスポザーゼ−トランスポゾン複合体。トランスポゾン突然変異誘発のための従来のやり方は、通常、プラスミドにトランスポザーゼを置く。「トランスポソーム」と称される一部のそのようなシステムにおいて、トランスポザーゼは、転移反応を触媒し得る、トランスポゾン認識部位との機能的複合体を形成し得る。トランスポザーゼまたはインテグラーゼは、トランスポザーゼ認識部位に結合し得、「タグメンテーション」と称されることもある工程において、標的核酸にトランスポザーゼ認識部位を挿入し得る。

結合を可能にする条件下：所望の活性を可能にする任意の環境、例えば核酸分子および／もしくはタンパク質分子などの２つまたはそれを上回る数の分子が結合し得る条件を記載するために使用される語句。そのような条件には、分子の結合を促す塩および／または他の化学物質の特異的濃度が含まれ得る。

本開示の実践または試験のための適切な方法および材料が下に記載される。そのような方法および材料は単なる例示であり、限定的であることが意図されるわけではない。本明細書において記載されるものと同様のまたは等価の他の方法および材料が使用され得る。例えば、本開示が関連する技術分野において周知の従来の方法は、例えばSambrook et al., Molecular Cloning: A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, 1989；Sambrook et al., Molecular Cloning: A Laboratory Manual, 3d ed., Cold Spring Harbor Press, 2001；Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing Associates, 1992 (and Supplements to 2000)；Ausubel et al., Short Protocols in Molecular Biology: A Compendium of Methods from Current Protocols in Molecular Biology, 4th ed., Wiley & Sons, 1999；Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1990；およびHarlow and Lane, Using Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, 1999を含めた、様々な一般的およびより具体的な参考文献に記載されている。加えて、材料、方法、および例は単なる例示であり、限定的であることが意図されるわけではない。
Ｂ．序論

ＣｈＩＰにおける組織的バイアスおよびアーチファクトによって引き起こされる不確実性は、異なる原理に基づく方法の必要性を強調している。非ＣｈＩＰマッピング法の１つのクラスは、キメラ融合体によるＤＮＡ結合タンパク質への酵素の繋留、および局所近傍におけるＤＮＡに対する酵素の作用を伴う。例えば、ＤａｍＩＤ（van Steensel et al., 2001）および関連方法（Southall et al., 2013；Hass et al., 2015）では、ＥｓｃｈｅｒｉｃｈｉａｃｏｌｉＤａｍメチルトランスフェラーゼがＴＦに繋留され、ｉｎｖｉｖｏにおけるＧＡＴＣ部位でアデニンのＮ６−メチル化を触媒する。部位は、Ｎ６−メチル指向性制限酵素を使用してゲノムワイドでマッピングされ得る。しかしながら、ＤａｍＩＤの分解能はＧＡＴＣ部位の分布によって限定されるので、ＤａｍＩＤは、シーケンシングリードアウトを使用して潜在的に到達可能な高い分解能を得ることができない（Aughey and Southall, 2016）。代替的な酵素繋留法であるクロマチン内因性切断（ＣｈＥＣ）は、ＴＦにエンド−エキソヌクレアーゼであるミクロコッカスヌクレアーゼ（ＭＮａｓｅ）を繋留する（Schmid et al., 2004）。ＣｈＥＣにおいて、ＭＮａｓｅは、細胞を透過処理することおよび制御された切断のためにカルシウムを添加することによって活性化される。最近、ＩｌｌｕｍｉｎａシーケンシングリードアウトがＣｈＥＣに適用され（ＣｈＥＣ−ｓｅｑ）、塩基対分解能をほぼ達成した（Zentner et al., 2015）。酵素繋留法はｉｎｖｉｖｏ（ＤａｍＩＤ）またはｉｎｓｉｔｕ（ＣｈＥＣ）で行われ、ＤＮＡの抽出は生きたまたは透過処理された細胞から直接なされ、ゆえにクロマチンを可溶化および回収する必要性が排除されるので、酵素繋留法はＣｈＩＰとは根本的に異なる。ＤａｍＩＤおよびＣｈＥＣの両方とも、マッピングされる対象となる各ＴＦに対して、異なるキメラ融合構築物を産生することを必要とし、これは、例えば動物モデル、患者生検、および翻訳後修飾へのそれらの移行可能性を限定する。もともとのクロマチン免疫切断（ＣｈＩＣ）法では、架橋された細胞由来の粗核がまずＴＦ特異的抗体で処置され、その後に、プロテインＡとＭＮａｓｅとの間のキメラ融合体（ｐＡ−ＭＮ）の添加、およびカルシウムによる活性化が続く（Schmid et al., 2004）。プロテインＡは免疫グロブリンＧに特異的に結合し、それにより融合タンパク質の必要性がなくなる。
Ｃ．例示的な実施形態の説明

酵素繋留法の利点を保持し、一方でそれが他の既存の方法論を置き換えるに至るほど、その適用可能性および使いやすさを伸ばす、ＣｈＩＣの大きな進展が本明細書において開示される。開示される方法の固有の特質は、架橋の非存在下で、ＴＦの両側でのカルシウム誘導性ＭＮａｓｅ切断などの誘導性切断の数秒後に、ＴＦ−ＤＮＡ複合体が溶液中に放出され、遠心分離およびＤＮＡ抽出だけによってシーケンシングのための純粋なＴＦ結合ＤＮＡ断片の回収を可能にすることである。さらに、一部の例において、磁気ビーズ上で手順を行うことによって、開示される「標的下切断およびヌクレアーゼを使用した放出（ＣＵＴ＆ＲＵＮ：ＣｌｅａｖａｇｅＵｎｄｅｒＴａｒｇｅｔｓａｎｄＲｅｌｅａｓｅＵｓｉｎｇＮｕｃｌｅａｓｅ）」法は、ＣｈＩＰ−ｓｅｑよりも簡単であり、一方でｉｎｓｉｔｕの方法の利点を保持する。ＣＵＴ＆ＲＵＮによる標的消化は、ＣｈＩＰに対する完全なゲノム断片化と比べてバックグラウンドを大幅に低下させ、標準的ＣｈＩＰ法の約１／１０のシーケンシング深度しか必要としない。さらに、単一のスパイクイン対照により、他の方法によっては可能でない、タンパク質結合の精確な定量が可能となる。開示される方法は、低い出発細胞数を可能にし、ロボット自動化は、磁気ビーズ上で反応を実施することによって可能である。

標的下切断およびヌクレアーゼを使用した放出（ＣＵＴ＆ＲＵＮ）は、例えばミクロコッカスヌクレアーゼによる、抗体標的化制御切断によって、ペアードエンドＤＮＡシーケンシングのための特異的タンパク質−ＤＮＡ複合体が上清に放出される、エピゲノムプロファイリングストラテジーである。標的断片のみが溶液中に入り、ＤＮＡの圧倒的多数は取り残されるので、ＣＵＴ＆ＲＵＮは、クロマチン結合をプローブするための他の技法と比較して、並外れて低いバックグラウンドレベルを有する。ＣＵＴ＆ＲＵＮは、最も広く使用されているクロマチン免疫沈降（ＣｈＩＰ）プロトコールを、分解能、シグナル対ノイズ、および必要とされるシーケンシングの深度の点で優れている。ＣｈＩＰとは対照的に、ＣＵＴ＆ＲＵＮは、溶解性およびＤＮＡ接近性アーチファクトがなく、不溶性クロマチンをプロファイルするためにおよび架橋なしで長距離３Ｄ接触を検出するために使用され得る。さらに、核の単離を必要とせず、ヒストン修飾についてはわずか１または２個のみの細胞および転写因子マッピングについては１０００個の細胞から出発して高品質データを提供する、改良ＣＵＴ＆ＲＵＮプロトコールが本明細書において開示される。細胞から精製ＤＮＡまで、ＣＵＴ＆ＲＵＮは、ラボラトリーベンチで１日未満しか必要としない。

細胞（または細胞の集団）内のＤＮＡの配列への目的のクロマチン関連因子の結合を検出するための方法が本明細書において開示される。ある特定の実施形態では、開示される方法は、約４℃未満の温度で、架橋されていない透過処理された細胞と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、特異的結合剤は、例えばカチオンなどのイオンの添加によって、不活性でありかつ活性化可能であるヌクレアーゼ、または必要に応じて不活性でありかつ活性化可能であるトランスポザーゼを含むトランスポソームに連結されている、ステップを含む。ある特定の実施形態では、細胞および／または細胞の核は、細胞と、界面活性剤、例えばＴｒｉｔｏｎおよび／もしくはＮＰ−４０、またはジギトニンなどの別の薬剤など、細胞を透過処理する（permeablize）薬剤とを接触させることによって透過処理される。無傷の細胞または核を使用することによって、開示される方法は、そうでなければ断片化および他の処理ステップによって変更され得るであろう自然のままのクロマチン構造を見るという、ＣｈＩＰ法に勝る利点を有する。実施形態では、ヌクレアーゼまたはトランスポザーゼは、例えば外因性アクチベーターを使用して活性化される。活性化されると、ヌクレアーゼまたはトランスポザーゼは、目的のクロマチン関連因子に結合しているＤＮＡの配列を切り出し得る。ある特定の実施形態では、目的のクロマチン関連因子に結合しているＤＮＡを切り出すのに十分な時間であるが、ヌクレアーゼまたはトランスポザーゼが拡散して接近可能なＤＮＡを非特異的にカットしないような十分に短い時間、反応を進ませる。ある特定の実施形態では、この時間は約１秒間〜約４時間である。

ヌクレアーゼを使用する場合、時間は、目的の特異的クロマチン関連因子に対して選択され得る。例えば、非常に豊富なタンパク質に関しては、１０分間でさえ長すぎる可能性がある。経時的にタンパク質は放出され、ゲノムにおける接近可能なＤＮＡを噛みちぎるからであり、これは、制約されることなく（without being bound）、濃度とともにおそらく線形である望ましくない副作用である。ヌクレアーゼを不活性化した後、目的のクロマチン関連因子に結合している切り出されたＤＮＡを回収する。この切り出されたクロマチンを単離しおよび調査して、切り出されたＤＮＡの配列を決定し、それによって、細胞（または細胞の集団）内のＤＮＡの配列への目的のクロマチン関連因子の結合を検出することができる。

上記の限定は、トランスポザーゼの使用に関しては当てはまらないであろう。トランスポザーゼを使用する場合、断片は結合したままである。トランスポザーゼはタグメンテーションの間に放出されないので、これはトランスポザーゼの場合は問題ではなく、このことは、方法の大きな利点である。実際、Ｔｎ５がそのペイロードを挿入する場合、それは他の場所で損傷を引き起こし得ず、「一度で終わり」である。それゆえ、これらの方法を用いると、時間変動は重要なパラメーターではなく、すべての因子に対する完了（３７℃で約１時間）までのただのタグ付けである。これは大きな利点である。ゆえに、免疫繋留型挿入シーケンシング（ＩｍｍｕｎｏＴｅｔｈｅｒｅｄＩｎｓｅｒｔｉｏｎＳｅｑｕｅｎｃｉｎｇ）（ＩＴＩＳまたはＩＴ−ｓｅｑ）と称されるＣＵＴ＆ＲＵＮの改良が本明細書においてさらに開示される。標準的なＣＵＴ＆ＲＵＮは、データ品質の大きな低下を伴わずに１００〜１０００個の細胞に適用され得るが、ハイスループット単一細胞適用は、標的断片を含有する上清を、ゲノムの残りを含有する細胞から分離する必要があるので複雑である。さらに、常磁性ビーズ上に細胞を固定化することによってもたらされる容易なワークフローに続いて、ＤＮＡシーケンシングライブラリー調製を行わなければならず、これにより、手順全体の時間、コスト、および労力が大幅に増す。下記の実施例に開示されるように、本発明者らは、高活性Ｔｎ５トランスポザーゼなどのトランスポザーゼをプロテインＡに融合させ、シーケンシングプラットフォーム適合性モザイクエンド（ＭｏｓａｉｃＥｎｄ）オリゴヌクレオチドを担持したプロテインＡ／Ｔｎ５複合体によりｐＡ−ＭＮの添加を置換することによって、ＣＵＴ＆ＲＵＮの力を拡大している。Ｍｇ^＋＋を用いたＴｎ５の活性化は、バルクおよび単一細胞適用の両方でのＰＣＲ増幅にすぐにでも用いることができる抗体標的化タグメンテーションを生じさせる。本明細書において開示されるＩＴＩＳ法は、生きた細胞由来の増幅配列対応ライブラリーを１日で提供し、これは、方法の魅力的な特質である。

ある特定の実施形態では、ＤＮＡはクロマチンＤＮＡである。ある特定の実施形態では、細胞および／または核は架橋に供され得る。他の実施形態では、細胞は架橋に供されない。

ＣｈＩＣ、ＣｈＥＣ、およびＣｈＥＣ−ｓｅｑは、切断を標的化すること、および標的部位に近いこれらの切断をマッピングすることに基づく。対照的に、開示される方法は、ＤＮＡ−タンパク質複合体が上清に放出されるのに十分なほど互いに近くにおける切断のペアを用いる。開示される方法では、放出されたＤＮＡ−タンパク質複合体由来のＤＮＡを精製し、ライブラリー調製およびシーケンシングに供する。開示される方法の他の実施形態では、上清を抽出するのではなく、むしろさらなる分析方法論、例えば：１）塩分画（ＣＵＴ＆ＲＵＮ．塩）；２）ＣＵＴ＆ＲＵＮからの上清をインプットとして使用したＣｈＩＰ−ｓｅｑ（ＣＵＴ＆ＲＵＮ．ＣｈＩＰ）；３）上清中の粒子のタンパク質補体の特徴付け、に供する。ＣＵＴ＆ＲＵＮのこれら発展の３つすべては、上清へのＤＮＡ−タンパク質複合体の放出を必要とするので、それらはＣＵＴ＆ＲＵＮの固有の革新である。実施形態では、方法は、細胞から拡散した切り出されたＤＮＡを塩分画に供するステップを含む。実施形態では、方法は、上清をＣｈＩＰ−ｓｅｑに供するステップを含む。実施形態では、方法は、目的のクロマチン関連因子と会合した１つまたは複数のタンパク質の素性を判定するステップを含む。実施形態では、タンパク質の素性を判定するステップは、抗体の使用を含む。実施形態では、タンパク質の素性を判定するステップは、質量分析を含む。

ある特定の実施形態では、抗体などの特異的結合剤に連結されているおよび／または繋留されているヌクレアーゼを使用して、クロマチンＤＮＡを切断する。ゆえに、実施形態では、開示される方法は、クロマチンＤＮＡへのトランスポゾンの組込みを可能にする条件下で、架橋されていない透過処理された細胞と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、特異的結合剤は、少なくとも１つの人工トランスポソームに連結されている、ステップを含む。ある特定の実施形態では、ヌクレアーゼは、ミクロコッカスヌクレアーゼ（ＭＮａｓｅ）などのエンドデオキシリボヌクレアーゼである。活性化可能によって、それは、ヌクレアーゼを不活性状態から活性状態に切り替え得ることを意味する。この切り替えは、エフェクターの添加によってまたは条件を変化させることによって開始され得る。ある特定の実施形態では、エフェクターは、Ｃａ^２＋またはＭｇ^＋＋イオンなど、小分子または原子である。使用され得るヌクレアーゼは、この活性が活性化され得るという条件で、一本鎖または好ましくは二本鎖切断部位のいずれかを問わず、ＤＮＡ内に切断部位を誘導し得る任意のタンパク質である。開示される方法において使用されるヌクレアーゼは、一般的にヌクレオソームリンカー領域でおよびヌクレアーゼ高感受性部位で、大部分は配列非依存的様式でＤＮＡを切断し得る。しかしながら、多くのヌクレアーゼは、配列特異的様式でＤＮＡを切断し、すなわち切断は、いくつかのヌクレオチドの認識配列で主に生じる。不活性状態によって、それは、ヌクレアーゼの活性がモニターされるには低すぎる、または活性時のその最大率の１０％未満、好ましくは４％未満、もしくは１％未満であることを意味する。不活性状態から活性状態への遷移は、例えば化学的化合物の添加によってまたは温度を切り替えることによって誘発され得る。とくに有用なヌクレアーゼは、その活性がＣａ^２＋イオンにストリンジェントに依存するミクロコッカスヌクレアーゼ（ＭＮ）である。この酵素は、ヌクレオソームリンカー領域でおよびヌクレアーゼ高感受性（ＨＳ）部位で、クロマチンにＤＮＡ二本鎖切断を導入する。とくに有用なＭＮａｓｅの例は、ヌクレアーゼＡの成熟鎖（ＧｅｎｂａｎｋＰ００６４４のアミノ酸８３〜２３１（２０１７年９月２５日に利用可能なものとして、これにより参照により本明細書に組み込まれる）をコードする配列である。ＧｅｎｂａｎｋＰ００６４４のアミノ酸８３〜２３１と少なくとも７０％、８０％、９０％、９５％、またはさらに９９％の同一性という配列同一性を有するものなど、活性を保持するバリアントも企図される。

本開示の酵素、例えばヌクレアーゼを、好ましくは配列特異的部位である規定の部位でクロマチンに結合するクロマチンタンパク質に繋留する。目的のこのクロマチンタンパク質に酵素を繋留することによって、これまで非特異的な酵素（例えば、ヌクレアーゼ）が、繋留されたクロマチンタンパク質によって規定される特異的配列に導かれる。

本開示の好ましい実施形態では、ヌクレアーゼ（または他の酵素活性）をタグ付けする。使用されるタグは、任意のタイプのタグ、例えばタンパク質の精製を容易にするＨｉｓタグ、またはヘマグルチニン（ＨＡ）エピトープのようなエピトープ、またはアビジン、ストレプトアビジン、もしくはビオチンであり得る。

好ましい実施形態によれば、ヌクレアーゼは、融合タンパク質のＸ−ヌクレアーゼまたはヌクレアーゼ−Ｘの一部であり、Ｘはペプチドドメインである。Ｘはエピトープまたは抗体であり得、Ｘは、例えばビオチンに対する、親和性ドメインでもあり得る。適用の文脈において、抗体によって、それは、完全抗体、または相互作用を指揮するのに十分な抗体の部分のいずれかを意味する。そのような部分は、好ましくは抗体の可変領域Ｆａｂである。

一部の実施形態では、抗体は、少なくとも１つのトランスポソームに間接的にカップリングされている。一部の実施形態では、トランスポザーゼは、抗体に特異的に結合する特異的結合剤に連結されている。一部の実施形態では、特異的結合剤は、プロテインＡ、プロテインＧ、または抗体に特異的に結合する二次抗体を含む。一部の実施形態では、抗体は一次抗体であり、方法は、細胞と、一次抗体に特異的に結合する二次抗体とを接触させるステップであって、トランスポザーゼが、二次抗体に特異的に結合する特異的結合剤に連結されている、ステップをさらに含む。一部の実施形態では、特異的結合剤は、プロテインＡもしくはプロテインＧ、または二次抗体に特異的に結合する三次抗体を含む。一部の実施形態では、クロマチンＤＮＡの配列への目的のクロマチン関連因子の結合は直接的である。

ヌクレアーゼおよび／またはトランスポザーゼは、スタフィロコッカスプロテインＡ（ｐＡ）のすべてもしくは一部に、またはスタフィロコッカスプロテインＧ（ｐＧ）のすべてもしくは一部に、またはｐＡおよびｐＧの両方（ｐＡＧ）に融合もされ得る。これらのタンパク質は、ウサギおよびマウスＩｇＧに対する実に異なる親和性を有する。ヌクレアーゼは、抗体に対する親和性を有する他の任意のタンパク質またはタンパク質部分、例えばｐＡもしくはｐＧの誘導体にも融合され得る。本開示の好ましい実施形態は、実施例において詳説される融合タンパク質ｐＡＧ−ＭＮである。この場合、ｐＡ部分は、スタフィロコッカスプロテインＡの２つのＩｇＧ結合ドメイン、すなわちＧｅｎｂａｎｋＡＡＡ２６６７６のアミノ酸１８６〜３２７（２０１７年９月２５日に利用可能なものとして、これにより参照により本明細書に組み込まれる）を含有する。ＧｅｎｂａｎｋＡＡＡ２６６７６のアミノ酸１８６〜３２７と少なくとも７０％、８０％、９０％、９５％、またはさらに９９％の同一性という配列同一性を有するものなど、活性を保持するバリアントも企図される。しかしながら、本開示は、この特異的融合タンパク質に限定されるわけではない。あるいは、酵素、例えばヌクレアーゼは、ペプチド結合以外の結合によってＸドメインに化学的に連結され得る。

ヌクレアーゼ活性化の時間は、反応が生じる温度に大きく依存する。酵素反応が氷上にてゼロ度で行われるべきである場合、活性化の時間を状況に応じて適応させ、つまり、約１０℃、約９℃、約８℃、約７℃、約６℃、約５℃、約４℃、約３℃、約２℃、約１℃、または約０℃を下回る、しかし約−４℃を上回る温度など、約１０℃を下回る温度で行われる同じ酵素反応を基準として延ばされる。

ヌクレアーゼまたはトランスポザーゼなどの酵素を連結するおよび／または繋留する方法は従来的であり、例えば、その全体がこれにより参照により本明細書に組み込まれる、米国特許第７，７９０，３７９号に見い出され得る。ある特定の実施形態では、ヌクレアーゼまたはトランスポザーゼは、融合タンパク質の一部である。ある特定の実施形態では、融合タンパク質は、スタフィロコッカスプロテインＡ（ｐＡ）、スタフィロコッカスプロテインＧ（ｐＧ）、ｐＡとｐＧとの間の融合体（ｐＡＧ）、または抗体を含む。

ある特定の実施形態では、特異的結合剤には、抗体またはその特異的結合断片が含まれる。クロマチン関連因子、またはその断片もしくは保存的バリアントを使用して、免疫反応性であるまたは受容体ポリペプチドのエピトープに結合する抗体を産生し得る。ポリクローナルまたはモノクローナル抗体、ならびにＦａｂ、Ｆ（ａｂ’）２、およびＦｖ断片などのモノクローナル抗体の断片、さらには、クロマチン関連因子に由来するペプチドに特異的に結合し得る他の任意の薬剤を産生し得る。最適には、クロマチン関連因子に対して作られた抗体は、目的のクロマチン関連因子に特異的に結合するであろう。つまり、そのような抗体は、上記タンパク質を認識しおよび結合するであろうが、他のタンパク質を実質的に認識しないまたは結合しないであろう。抗体が目的の標的または内在化受容体ポリペプチドに特異的に結合するという判定は、いくつかの標準的イムノアッセイ法のうちのいずれか１つ；例えば、ウエスタンブロッティング技法（Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.）によって行われる。

免疫原としての使用に適した実質的に純粋な標的または内在化受容体ポリペプチドは、精製または組換え発現によって単離される。あるいは、抗体は合成標的に対して作られ得る。

ポリクローナル抗体の調製は当業者に公知である。例えば、Green et al., "Production of Polyclonal Antisera," in Immunochemical Protocols pages 1-5, Manson, ed., Humana Press 1992；Coligan et al., "Production of Polyclonal Antisera in Rabbits, Rats, Mice and Hamsters," in: Current Protocols in Immunology, section 2.4.1, 1992を参照されたい。モノクローナル抗体の調製は同じように従来的である。例えば、Kohler & Milstein, Nature 256:495, 1975；Coligan et al., sections 2.5.1-2.6.7；およびHarlow et al., in: Antibodies: a Laboratory Manual, page 726, Cold Spring Harbor Pub., 1988を参照されたい。記載されるように同定されおよび単離された標的または内在化受容体ポリペプチドのエピトープに対するモノクローナル抗体は、KohlerおよびMilstein（Nature 256:495, 1975）の古典的方法またはその派生法に従ってマウスハイブリドーマから調製され得る。特異的抗体は、ヒトに近い霊長類抗体にも由来し得る。ヒヒにおいて治療上有用な抗体を作るための一般的な技法は、例えばＷＯ９１／１１４６５、１９９１年およびLosman et al., Int. J. Cancer 46:310, 1990に見い出され得る。あるいは、クロマチン関連因子に特異的に結合する抗体は、ヒト化モノクローナル抗体に由来し得る。ヒト化モノクローナル抗体は、マウス免疫グロブリンの重可変鎖および軽可変鎖由来のマウス相補性決定領域をヒト可変ドメインに移入し、次いでマウス対応物のフレームワーク領域にヒト残基を代入することによって産生される。抗体は、コンビナトリアル免疫グロブリンライブラリーから単離されたヒト抗体断片に由来し得る。例えば、Barbas et al., in: Methods: a Companion to Methods in Enzymology, Vol. 2, page 119, 1991；Winter et al., Ann. Rev. Immunol. 12:433, 1994を参照されたい。ヒト免疫グロブリンファージライブラリーを産生するのに有用であるクローニングベクターおよび発現ベクターは、例えばＳＴＲＡＴＡＧＥＮＥ（登録商標）クローニングシステム（ＬａＪｏｌｌａ、Ｃａｌｉｆ．）から獲得され得る。抗体には、無傷分子、ならびにエピトープ決定基に結合し得るＦａｂ、Ｆ（ａｂ’）_２、およびＦｖなど、その断片が含まれる。これら断片を作製する方法は当技術分野において公知である。（例えば、Harlow and Lane, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, New York, 1988を参照されたい）。エピトープとは、抗体のパラトープが結合する、抗原上の任意の抗原決定基である。エピトープ決定基は、通常、アミノ酸または糖側鎖など、分子の化学的に活性な表面群からなり、通常、特異的な３次元構造特徴および特異的電荷特徴を有する。

酵素などの分子、例えばヌクレアーゼおよびトランスポザーゼは、当業者に公知の任意の数の手段を使用して、一緒に連結され得る。リンカーは、分子を別の分子につなげるために使用される任意の分子であり得る。連結される対象となる分子および検出の方法が実施される条件のような因子に応じて、リンカーは、柔軟性、安定性、ならびにある特定の化学的および／または温度パラメーターへの耐性のような特性を最適化するために、長さおよび組成が様々に異なり得る。リンカーは、連結された分子がクロマチン関連因子に結合し得および酵素がクロマチンＤＮＡを切断するのを可能にする、十分な長さのものであるべきである。

ある特定の実施形態では、クロマチンＤＮＡの配列への目的のクロマチン関連因子の結合は直接的である。言い換えれば、目的のクロマチン関連因子は、ＤＮＡ結合転写因子によくあるであろうように、クロマチンＤＮＡと直接接触する、例えばクロマチンＤＮＡと直接的に物理的に接触している。ゆえに、一部の実施形態では、目的のクロマチン関連因子は転写因子である。他の実施形態では、クロマチンＤＮＡの配列への目的のクロマチン関連因子の結合は間接的である。言い換えれば、接触は、複合体のメンバーを介してなど、間接的であり得る。このように、より長期にわたる相互作用が解明され得る。

ある特定の実施形態では、クロマチン結合剤と相互作用するタンパク質も検出され得、それらの素性が判定され得る。そのようなタンパク質は、免疫親和性アッセイと連動した質量分析アッセイによって、２次元ポリアクリルアミドゲル電気泳動（２Ｄ−ＰＡＧＥ）によって分離されたタンパク質の、マトリックス支援レーザー脱離／イオン化飛行時間型（ＭＡＬＤＩ−ＴＯＦ）質量マッピングおよび液体クロマトグラフィー／四重極飛行時間型エレクトロスプレーイオン化タンデム質量分析（ＬＣ／Ｑ−ＴＯＦ−ＥＳＩ−ＭＳ／ＭＳ）配列タグ（Kiernan et al., Anal. Biochem., 301: 49-56, 2002；Poutanen et al., Mass Spectrom., 15: 1685-1692, 2001）、エレクトロスプレーイオン化（ＥＳＩ）、表面エンハンス型レーザー脱離−イオン化（ＳＥＬＤＩ）、化学イオン化、および電子衝突イオン化（ＥＩ）の使用によって検出され得る。それらのｍ／ｚ比に従ったイオンの分離は、四重極型質量分析計（Ｑ）、飛行時間型（ＴＯＦ）質量分析計、磁場セクター型質量分析計、３Ｄおよびリニアイオントラップ（ＩＴ）、フーリエ変換イオンサイクロトロン共鳴（ＦＴ−ＩＣＲ）分析計、ならびにそれらの組合せ（例えば、四重極−飛行時間型分析計またはＱ−ＴＯＦ分析計）を含めた、任意のタイプの質量分析計を用いて達成され得る。分離の前に、試料を、１次元またはそれを上回る次元のクロマトグラフィー分離、例えば１次元またはそれを上回る次元の液体クロマトグラフィーまたはサイズ排除クロマトグラフィーに供し得る。

ＳＥＬＤＩなどの質量分光法を使用して、試料中のタンパク質を分析しおよび同定し得る。一例において、表面エンハンス型レーザー脱離−イオン化飛行時間型（ＳＥＬＤＩ−ＴＯＦ）質量分析を使用して、例えばＰｒｏｔｅｉｎＣｈｉｐ（商標）（ＣｉｐｈｅｒｇｅｎＢｉｏｓｙｓｔｅｍｓ、ＰａｌｏＡｌｔｏ、ＣＡ）を使用することによって、タンパク質発現を検出する。そのような方法は当技術分野において周知である（例えば、米国特許第５，７１９，０６０号；米国特許第６，８９７，０７２号；および米国特許第６，８８１，５８６号を参照されたい）。ＳＥＬＤＩは、分析物の捕捉または脱離を増強する表面上のエネルギーストリームに分析物を提示する、脱離のための固相法である。

一部の実施形態では、細胞またはその集団を、固体表面、例えばビーズ、またはマイクロタイタープレートの壁に固定化する。そのような固体表面に細胞をカップリングする方法は、当技術分野において、例えばハイスループット技法の背景において公知である。

実施形態では、ＤＮＡタグなどのタグを、切り出されたクロマチンＤＮＡに、例えば切り出されたクロマチンＤＮＡの一方または両方の末端で付加し得る。多様なタグ配列を、開示される方法の工程において、切り出されたクロマチンＤＮＡに共有結合的に付加し得る。本明細書で使用される場合、「タグ」という用語は、別の核酸に付着して、核酸に何らかの機能性を提供するヌクレオチド配列を意味する。タグの例としては、バーコード、プライマー部位、親和性タグ、およびレポーター部分、またはそれらの任意の組合せが挙げられる。

一部の実施形態では、タグは核酸タグである。一部の実施形態では、核酸タグにはバーコードが含まれる。これらの核酸バーコードを使用して、例えば試料起源についての情報を保ちながら複数の試料が同時に分析され得るように、例えば試料、生物等により、切り出されたクロマチンＤＮＡにタグ付けし得る。一般的に、バーコードは、１つまたは複数の特定の核酸を同定するために使用され得る１つまたは複数のヌクレオチド配列を含み得る。バーコードは人工配列であっても、天然に存在する配列であってもよい。バーコードは、少なくとも約１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０個、またはそれを上回る数の連続したヌクレオチドを含み得る。一部の実施形態では、バーコードは、少なくとも約４、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００個、またはそれを上回る数の連続したヌクレオチドを含む。一部の実施形態では、バーコードを含む核酸の集団におけるバーコードの少なくとも一部分は異なる。一部の実施形態では、バーコードの少なくとも約１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％は異なる。さらなるそのような実施形態では、バーコードのすべてが異なる。バーコードを含む核酸の集団における異なるバーコードの多様性は、例えば吐き出す−プールする（ｓｐｉｔ−ｐｏｏｌ）方法論を使用して、ランダムに生成され得るまたは非ランダムに生成され得る。一部の実施形態では、膨大な数の利用可能なバーコードは、タグ付けされた切り出された各クロマチンＤＮＡ分子が一意的識別を含むことを可能にすると理解されるであろう。鋳型核酸の混合物における各分子の一意的識別をいくつかの適用において使用して、例えばハプロタイプシーケンシング、親対立遺伝子判別、メタゲノムシーケンシング、およびゲノムの試料シーケンシングにおいて、複数の染色体、ゲノム、細胞、細胞タイプ、細胞疾患状態、および種を有する試料における個々の核酸分子を同定し得る。

一部の実施形態では、核酸タグはシーケンシングアダプターを含む。シーケンシングアダプターは、切り出されたクロマチンＤＮＡの各末端で同じであっても異なっていてもよい。配列アダプターの包含は、例えばペアードエンドおよび／またはアレイに基づくシーケンシングなどの次世代シーケンシングを使用して産生される、断片化されたＤＮＡのシーケンシングを容易にする。

一部の実施形態では、核酸タグはユニバーサルプライミング部位を含む。ユニバーサルプライミング部位の包含は、例えばＰＣＲに基づく増幅を使用して産生される、断片化されたＤＮＡの増幅を容易にする。一実施形態では、プライマー配列は、増幅に使用されるプライマーと相補的であり得る。別の実施形態では、プライマー配列は、シーケンシングに使用されるプライマーと相補的であり得る。ある特定の実施形態では、クロマチンＤＮＡをタグ付けし、例えばトランスポザーゼを使用して同時に切断する。ゆえに、実施形態では、開示される方法は、クロマチンＤＮＡへのトランスポゾンの組込みを可能にする条件下で、架橋されていない透過処理された細胞と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、特異的結合剤は、少なくとも１つの人工トランスポソームに連結されている、ステップを含む。

一部の実施形態では、方法は、細胞内のＤＮＡ配列への目的のクロマチン関連因子の結合部位を決定するためのｉｎｓｉｔｕの方法である。一部の実施形態では、方法は、透過処理された細胞と、目的のクロマチン関連因子に特異的に結合する一次抗体とを接触させるステップであって、一次抗体は、２、３、４、５、６、７、８個、またはさらにそれを上回る数、例えば２〜４個またはさらに２〜１０個、およびその間のいずれかなど、複数のトランスポソームにカップリングされている、ステップを含む。実施形態では、複数のトランスポソームのそれぞれは、少なくとも１種のトランスポザーゼ、ならびに第１のトランスポザーゼ認識部位を含む第１のＤＮＡ分子、および第２のトランスポザーゼ認識部位を含む第２のＤＮＡ分子を含むトランスポゾンを含む。実施形態では、方法は、トランスポザーゼを例えばＭｇ２＋などの２価カチオンで活性化し、それによって、目的のクロマチン関連因子に結合しているＤＮＡの配列を切り出し、およびＤＮＡタグでタグ付けするステップであって、少なくとも１種のトランスポザーゼは、クロマチンＤＮＡに第１および第２のＤＮＡ分子を組み込み、それによって、クロマチンＤＮＡを切断し、ならびに第１および第２のＤＮＡ分子でタグ付けする、ステップを含む。実施形態では、方法は、切り出されたＤＮＡを単離するステップを含む。実施形態では、方法は、切り出されたＤＮＡの配列を決定し、それによって、細胞内のＤＮＡの１つまたは複数の配列への目的のクロマチン関連因子の結合をマッピングするステップを含む。実施形態では、抗体は、少なくとも１種のトランスポザーゼに間接的にカップリングされている。実施形態では、トランスポザーゼは、一次抗体に特異的に結合する特異的結合剤に連結されている。実施形態では、方法は、細胞と、一次抗体に特異的に結合する二次抗体とを接触させるステップであって、トランスポザーゼが、二次抗体に特異的に結合する特異的結合剤に連結されている、ステップをさらに含む。実施形態では、方法は、細胞と、一次抗体に特異的に結合する二次抗体とを接触させるステップと；細胞と、二次抗体に特異的に結合する三次抗体とを接触させるステップであって、トランスポザーゼが、三次抗体に特異的に結合する特異的結合剤に連結されている、ステップとをさらに含む。

ある特定の実施形態では、方法は、架橋されていない透過処理された細胞と、目的のクロマチン関連因子に特異的に結合する抗体とを接触させるステップであって、抗体は、少なくとも１つのトランスポソームにカップリングされている、ステップを含む。ある特定の実施形態では、少なくとも１つのトランスポソームは、少なくとも１種のトランスポザーゼ；ならびに第１のトランスポザーゼ認識部位を含む第１のＤＮＡ分子；および第２のトランスポザーゼ認識部位を含む第２のＤＮＡ分子を含むトランスポゾンを含む。ある特定の実施形態では、方法は、トランスポザーゼを例えば２価カチオンの添加で活性化し、それによって、目的のクロマチン関連因子に結合しているＤＮＡの配列を切り出し、およびＤＮＡタグでタグ付けするステップであって、少なくとも１種のトランスポザーゼは、クロマチンＤＮＡに第１および第２のＤＮＡ分子を組み込む、ステップを含む。実施形態では、方法は、切り出されたＤＮＡを単離するステップ；および切り出されたＤＮＡの配列を決定し、それによって、細胞内のＤＮＡの１つまたは複数の配列への目的のクロマチン関連因子の結合をマッピングするステップを含み得る。人工トランスポソームは、少なくとも１種のトランスポザーゼおよびトランスポゾンを含む。トランスポゾンは、第１のトランスポザーゼ認識部位を含む第１のＤＮＡ分子、および第２のトランスポザーゼ認識部位を含む第２のＤＮＡ分子を含む。トランスポゾン（または、実際には、切断したトランスポゾンの２つの部分）の組込みは、断片化部位のいずれかの側に組み込まれた第１および第２のＤＮＡ分子を有する、切断された（または断片化された）ＤＮＡを産出する。このように、クロマチンＤＮＡは、断片化されるとともに、断片化部位でタグ付けされる。一部の例において、トランスポザーゼ認識部位は同じ配列を有し、一方で他の例において、トランスポザーゼ認識部位は異なる配列を有する。クロマチンＤＮＡ全体にわたる複数の挿入により、ＤＮＡは、次世代シーケンシング法による分析に適した小さな断片に有効に断片化される。一部の実施形態では、クロマチンＤＮＡと少なくとも２つの異なるトランスポソームとを接触させ、異なるトランスポソームは異なるＤＮＡ配列を含む。ゆえに、タグ付けされたクロマチンＤＮＡは、異なるトランスポゾン配列により５’および３’末端でタグ付けされ得る。

トランスポゾンの第１および第２のＤＮＡ分子は、開示される方法の工程において断片に共有結合的に付加され得る、多様なタグ配列をさらに含み得る。本明細書で使用される場合、「タグ」という用語は、別の核酸に付着して、核酸に何らかの機能性を提供するヌクレオチド配列を意味する。タグの例としては、上に記載されたものなど、バーコード、プライマー部位、親和性タグ、およびレポーター部分、またはそれらの任意の組合せが挙げられる。

開示される方法は、任意のトランスポザーゼを使用し得る。一部の実施形態は、高活性Ｔｎ５トランスポザーゼおよびＴｎ５タイプトランスポザーゼ認識部位（Goryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998)）、またはＭｕＡトランスポザーゼならびにＲ１およびＲ２末端配列を含むＭｕトランスポザーゼ認識部位（Mizuuchi, K., Cell, 35: 785, 1983；Savilahti, H, et al, EMBO J., 14: 4893, 1995）の使用を含み得る。高活性Ｔｎ５トランスポザーゼ（例えば、ＥＺ−Ｔｎ５（商標）トランスポザーゼ）と複合体を形成する、例示的なトランスポザーゼ認識部位。本明細書において提供されるある特定の実施形態とともに使用され得る転移システムのさらなる例としては、ＳｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓＴｎ５５２（Colegio et al, J. Bacteriol, 183: 2384-8, 2001；Kirby C et al, Mol. Microbiol, 43: 173-86, 2002）、Ｔｙｌ（Devine & Boeke, Nucleic Acids Res., 22: 3765-72, 1994、および国際公開ＷＯ９５／２３８７５）、トランスポゾンＴｎ７（Craig, N L, Science. 271: 1512, 1996；Craig, N L, Review in: Curr Top Microbiol Immunol, 204:27-48, 1996）、Ｔｎ／ＯおよびＩＳ１０（Kleckner N, et al, Curr Top Microbiol Immunol, 204:49-82, 1996）、Ｍａｒｉｎｅｒトランスポザーゼ（Lampe D J, et al, EMBO J., 15: 5470-9, 1996）、Ｔｅｌ（Plasterk R H, Curr. Topics Microbiol. Immunol, 204: 125-43, 1996）、Ｐエレメント（Gloor, G B, Methods Mol. Biol, 260: 97-114, 2004）、Ｔｎ３（Ichikawa & Ohtsubo, J Biol. Chem. 265: 18829-32, 1990）、細菌性挿入配列（Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996）、レトロウイルス（Brown, et al, Proc Natl Acad Sci USA, 86:2525-9, 1989）、ならびに酵母のレトロトランスポゾン（Boeke & Corces, Annu Rev Microbiol. 43 :403-34, 1989）が挙げられる。さらなる例としては、ＩＳ５、ＴｎｌＯ、Ｔｎ９０３、ＩＳ９１１、およびトランスポザーゼファミリー酵素の改変型（Zhang et al, (2009) PLoS Genet. 5:e1000689. Epub 2009 Oct 16；Wilson C. et al (2007) J. Microbiol. Methods 71 :332-5）、ならびに米国特許第５，９２５，５４５号；第５，９６５，４４３号；第６，４３７，１０９号；第６，１５９，７３６号；第６，４０６，８９６号；第７，０８３，９８０号；第７，３１６，９０３号；第７，６０８，４３４号；第６，２９４，３８５号；第７，０６７，６４４号；第７，５２７，９６６号；ならびに国際特許公開第ＷＯ２０１２１０３５４５号に記載されるものが挙げられ、それらのすべてはそれらの全体が参照により本明細書に具体的に組み込まれる。一部の実施形態では、トランスポザーゼは、Ｔｎ５トランスポザーゼまたはその高活性変異体である。一部の実施形態では、トランスポザーゼはＭｕトランスポゾンである。

ある特定の実施形態では、切り出されたクロマチンＤＮＡを固定化するのに適した親和性分子でコーティングされている、ビーズ、膜、または表面（例えば、ウェルまたは管）などの基板上に断片を固定化することによって、切り出されたクロマチンＤＮＡ断片を精製する。ある特定の実施形態では、親和性分子は、シリカまたはカルボキシルがコーティングされた磁気ビーズ（ＳＰＲＩビーズ）である。ある特定の実施形態では、ライブラリー（例えば、Ｉｌｌｕｍｉｎａ（登録商標）シーケンシング（Ｉｌｌｕｍｉｎａ（登録商標）Ｉｎｃ．、ＳａｎＤｉｅｇｏ、ＣＡ）など、次世代シーケンシング適用のための）を磁気粒子上で構築する。次いで、同じＤＮＡ吸収磁気ビーズを使用して、結果として生じるライブラリーを精製し得る。一部の実施形態では、ウェルにおいてまたはビーズ、例えば磁気ビーズとして親和性表面を提供するさらなる利点は、開示される方法が、出発クロマチン材料からシーケンシングライブラリーの構築および精製の終わりまで、９６ウェル形式またはマイクロ流体プラットフォームにおいてなど、多数の試料の並行処理に適応され得ることである。ある特定の実施形態では、切り出されたクロマチンＤＮＡは、核酸断片が結合した特異的クロマチン関連因子および／または抗体からそれらが放出された後に精製される。

一部の実施形態では、切り出されたクロマチンＤＮＡの素性を、超並列シーケンシングなどのＤＮＡシーケンシングによって判定する。一部の技術は、固体フローセル基板上での、アダプターがライゲーションされた切り出されたクロマチンＤＮＡのクラスター増幅を使用し得る。結果として生じるフローセル表面上の鋳型クラスターの高密度アレイは、次いで、例えば蛍光標識された可逆的ターミネーターヌクレオチドを並行して使用した、合成時シーケンシングに出され得る。

鋳型は、各読み取りの間、塩基ごとにシーケンスされ得る。ある特定の実施形態では、結果として生じるデータは、データ収集、および試料配列を公知のゲノム配列にアラインする分析ソフトウェアを使用して分析され得る。この技術の感度は、シーケンシングランの深度（例えば、マッピングされた配列タグの数）、ゲノムのサイズ、および標的因子の分布などの因子に依存し得る。多数の短いリードを統合することによって、非常に正確な結合部位の位置決めが獲得され得る。ある特定の実施形態では、データを使用して、現実のタンパク質結合部位の数十塩基対以内に結合部位の位置を決定し得、結合部位におけるタグ密度により、種々のＤＮＡ部位に対するタンパク質の結合親和性の定量および比較が可能となり得る。

一般的に、シーケンシングは、自動サンガーシーケンシング（ＡＢ１３７３０×１ゲノムアナライザー）、固体担体上でのパイロシーケンシング（４５４シーケンシング、Ｒｏｃｈｅ）、可逆的終結を用いた合成時シーケンシング（ＩＬＬＵＭＩＮＡ（登録商標）ゲノムアナライザー）、ライゲーションによるシーケンシング（ＡＢＩＳＯＬｉＤ（登録商標））、またはバーチャルターミネーターを用いた合成時シーケンシング（ＨＥＬＩＳＣＯＰＥ（登録商標））を使用して実施され得る。開示される方法との使用のための他の次世代シーケンシング技法としては、超並列シグネチャーシーケンシング（ＭＰＳＳ）、ポロニーシーケンシング、イオントレント半導体シーケンシング、ＤＮＡナノボールシーケンシング、Ｈｅｌｉｓｃｏｐｅ単分子シーケンシング、単分子リアルタイム（ＳＭＲＴ）シーケンシング、およびナノポアＤＮＡシーケンシングが挙げられる。一部の実施形態では、切り出されたクロマチンＤＮＡは、例えばヌクレオチド配列を決定することによって分析される。一部の例において、ヌクレオチド配列は、増幅の有無にかかわらず、シーケンシングまたはハイブリダイゼーション技法を使用して決定される。

ある特定の実施形態では、方法は容易に行われ得、データは再現性よく獲得され得る。ある特定の実施形態では、これらの方法を使用して、多数のＤＮＡ結合タンパク質および／またはクロマチン修飾因子をスクリーニングする。ある特定の実施形態では、提供される方法を使用して、５、１０、５０、１００、２００、５００、７５０、もしくは１０００個、またはそれを上回る数のＤＮＡ結合タンパク質および／またはクロマチン調節因子（ＣＲ）、ならびにそれらの修飾形態をスクリーニングする。修飾形態としては、それらに限定されるわけではないが、変異体、ならびに翻訳後修飾されたＤＮＡ結合タンパク質および／またはクロマチン修飾因子が挙げられる。

ある特定の実施形態では、提供される方法を使用して、以下のＤＮＡ結合タンパク質および／またはクロマチン修飾因子ならびにそれらの修飾形態のうちの１つまたは複数をスクリーニングする：ＡＡＦ、ａｂｌ、ＡＤＡ２、ＡＤＡ−ＮＦｌ、ＡＦ−１、ＡＦＰｌ、ＡｈＲ、ＡＩＩＮ３、ＡＬＬ−１、アルファ−ＣＢＦ、アルファ−ＣＰ１、アルファ−ＣＰ２ａ、アルファ−ＣＰ２ｂ、アルファＨｏ、アルファＨ２−アルファＦＢ、Ａｌｘ−４、ａＭＥＦ−２、ＡＭＬｌ、ＡＭＬｌａ、ＡＭＬｌｂ、ＡＭＬｌｃ、ＡＭＬｌデルタＮ、ＡＭＬ２、ＡＭＬ３、ＡＭＬ３ａ、ＡＭＬ３ｂ、ＡＭＹ−ｌＬ、Ａ−Ｍｙｂ、ＡＮＦ、ＡＰ−１、ＡＰ−２アルファＡ、ＡＰ−２アルファＢ、ＡＰ−２ベータ、ＡＰ−２ガンマ、ＡＰ−３（１）、ＡＰ−３（２）、ＡＰ−４、ＡＰ−５、ＡＰＣ、ＡＲ、ＡＲＥＢ６、Ａｒｎｔ、Ａｒｎｔ（７７４Ｍ型）、ＡＲＰ−１、ＡＴＢＦｌ−Ａ、ＡＴＢＦｌ−Ｂ、ＡＴＦ、ＡＴＦ−１、ＡＴＦ−２、ＡＴＦ−３、ＡＴＦ−３デルタＺＩＰ、ＡＴＦ−ａ、ＡＴＦ−ａデルタ、ＡＴＰＦｌ、Ｂａｒｈｌｌ、Ｂａｒｈｌ２、Ｂａｒｘｌ、Ｂａｒｘ２、Ｂｃｌ−３、ＢＣＬ−６、ＢＤ７３、ベータ−カテニン、Ｂｉｎｌ、Ｂ−Ｍｙｂ、ＢＰｌ、ＢＰ２、ブラフマ、ＢＲＣＡｌ、Ｂｒｎ−３ａ、Ｂｒｎ−３ｂ、Ｂｒｎ−４、ＢＴＥＢ、ＢＴＥＢ２、Ｂ−ＴＦＩＩＤ、Ｃ／ＥＢＰアルファ、Ｃ／ＥＢＰベータ、Ｃ／ＥＢＰデルタ、ＣＡＣＣ結合因子、Ｃａｒｔ−１、ＣＢＦ（４）、ＣＢＦ（５）、ＣＢＰ、ＣＣＡＡＴ結合因子、ＣＣＭＴ結合因子、ＣＣＦ、ＣＣＧｌ、ＣＣＫ−ｌａ、ＣＣＫ−ｌｂ、ＣＤ２８ＲＣ、ｃｄｋ２、ｃｄｋ９、Ｃｄｘ−１、ＣＤＸ２、Ｃｄｘ−４、ＣＦＦ、ＣｈｘｌＯ、ＣＬＩＭｌ、ＣＬＩＭ２、ＣＮＢＰ、ＣｏＳ、ＣＯＵＰ、ＣＰｌ、ＣＰｌＡ、ＣＰｌＣ、ＣＰ２、ＣＰＢＰ、ＣＰＥ結合タンパク質、ＣＲＥＢ、ＣＲＥＢ−２、ＣＲＥ−ＢＰｌ、ＣＲＥ−ＢＰａ、ＣＲＥＭアルファ、ＣＲＦ、Ｃｒｘ、ＣＳＢＰ−１、ＣＴＣＦ、ＣＴＦ、ＣＴＦ−１、ＣＴＦ−２、ＣＴＦ−３、ＣＴＦ−５、ＣＴＦ−７、ＣＵＰ、ＣＵＴＬｌ、Ｃｘ、サイクリンＡ、サイクリンＴｌ、サイクリンＴ２、サイクリンＴ２ａ、サイクリンＴ２ｂ、ＤＡＰ、ＤＡＸｌ、ＤＢｌ、ＤＢＦ４、ＤＢＰ、ＤｂｐＡ、ＤｂｐＡｖ、ＤｂｐＢ、ＤＤＢ、ＤＤＢ−１、ＤＤＢ−２、ＤＥＦ、デルタＣＲＥＢ、デルタＭａｘ、ＤＦ−１、ＤＦ−２、ＤＦ−３、Ｄｌｘ−１、Ｄｌｘ−２、Ｄｌｘ−３、ＤＩｘ４（長いアイソフォーム）、Ｄｌｘ−４（短いアイソフォーム、Ｄｌｘ−５、Ｄｌｘ−６、ＤＰ−１、ＤＰ−２、ＤＳＩＦ、ＤＳＩＦ−ｐｌ４、ＤＳＩＦ−ｐｌ６０、ＤＴＦ、ＤＵＸｌ、ＤＵＸ２、ＤＵＸ３、ＤＵＸ４、Ｅ、Ｅ１２、Ｅ２Ｆ、Ｅ２Ｆ＋Ｅ４、Ｅ２Ｆ＋ｐｌ０７、Ｅ２Ｆ−１、Ｅ２Ｆ−２、Ｅ２Ｆ−３、Ｅ２Ｆ−４、Ｅ２Ｆ−５、Ｅ２Ｆ−６、Ｅ４７、Ｅ４ＢＰ４、Ｅ４Ｆ、Ｅ４Ｆｌ、Ｅ４ＴＦ２、ＥＡＲ２、ＥＢＰ−８０、ＥＣ２、ＥＦｌ、ＥＦ−Ｃ、ＥＧＲｌ、ＥＧＲ２、ＥＧＲ３、ＥＩＩａＥ−Ａ、ＥＩＩａＥ−Ｂ、ＥＩＩａＥ−Ｃアルファ、ＥＩＩａＥ−Ｃベータ、ＥｉｖＦ、ＥＩｆ−１、ＥＩｋ−１、Ｅｍｘ−１、Ｅｍｘ−２、Ｅｍｘ−２、Ｅｎ−１、Ｅｎ−２、ＥＮＨ−ｂｉｎｄ．ｐｒｏｔ．、ＥＮＫＴＦ−１、ＥＰＡＳ１、エプシロンＦ１、ＥＲ、Ｅｒｇ−１、Ｅｒｇ−２、ＥＲＲｌ、ＥＲＲ２、ＥＴＦ、Ｅｔｓ−１、Ｅｔｓ−１デルタＶｉｌ、Ｅｔｓ−２、Ｅｖｘ−１、Ｆ２Ｆ、第２因子、因子名、ＦＢＰ、ｆ−ＥＢＰ、ＦＫＢＰ５９、ＦＫＨＬ１８、ＦＫＨＲＬ１Ｐ２、Ｆｌｉ−１、Ｆｏｓ、ＦＯＸＢｌ、ＦＯＸＣｌ、ＦＯＸＣ２、ＦＯＸＤｌ、ＦＯＸＤ２、ＦＯＸＤ３、ＦＯＸＤ４、ＦＯＸＥｌ、ＦＯＸＥ３、ＦＯＸＦｌ、ＦＯＸＦ２、ＦＯＸＧｌａ、ＦＯＸＧｌｂ、ＦＯＸＧｌｃ、ＦＯＸＨｌ、ＦＯＸＩｌ、ＦＯＸＪｌａ、ＦＯＸＪｌｂ、ＦＯＸＪ２（長いアイソフォーム）、ＦＯＸＪ２（短いアイソフォーム）、ＦＯＸＪ３、ＦＯＸＫｌａ、ＦＯＸＫｌｂ、ＦＯＸＫｌｃ、ＦＯＸＬｌ、ＦＯＸＭｌａ、ＦＯＸＭｌｂ、ＦＯＸＭｌｃ、ＦＯＸＮｌ、ＦＯＸＮ２、ＦＯＸＮ３、ＦＯＸＯｌａ、ＦＯＸＯｌｂ、ＦＯＸ０２、ＦＯＸ０３ａ、ＦＯＸ０３ｂ、ＦＯＸ０４、ＦＯＸＰｌ、ＦＯＸＰ３、Ｆｒａ−１、Ｆｒａ−２、ＦＴＦ、ＦＴＳ、Ｇ因子、Ｇ６因子、ＧＡＢＰ、ＧＡＢＰ−アルファ、ＧＡＢＰ−ベータｌ、ＧＡＢＰ−ベータ２、ＧＡＤＤ１５３、ＧＡＦ、ガンマＣＭＴ、ガンマＣＡＣｌ、ガンマＣＡＣ２、ＧＡＴＡ−１、ＧＡＴＡ−２、ＧＡＴＡ−３、ＧＡＴＡ−４、ＧＡＴＡ−５、ＧＡＴＡ−６、Ｇｂｘ−１、Ｇｂｘ−２、ＧＣＦ、ＧＣＭａ、ＧＣＮＳ、ＧＦｌ、ＧＬＩ、ＧＬＩ３、ＧＲアルファ、ＧＲベータ、ＧＲＦ−１、Ｇｓｃ、Ｇｓｃｌ、ＧＴ−ＩＣ、ＧＴ−ＩＩＡ、ＧＴ−ＩＩＢアルファ、ＧＴ−ＩＩＢベータ、ＨｌＴＦｌ、Ｈ１ＴＦ２、Ｈ２ＲＩＩＢＰ、Ｈ４ＴＦ−１、Ｈ４ＴＦ−２、ＨＡＮＤ１、ＨＡＮＤ２、ＨＢ９、ＨＤＡＣｌ、ＨＤＡＣ２、ＨＤＡＣ３、ｈＤａｘｘ、熱誘導性因子、ＨＥＢ、ＨＥＢ１−ｐ６７、ＨＥＢ１−ｐ９４、ＨＥＦ−１Ｂ、ＨＥＦ−ｌＴ、ＨＥＦ−４Ｃ、ＨＥＮｌ、ＨＥＮ２、Ｈｅｓｘｌ、Ｈｅｘ、ＨＩＦ−１、ＨＩＦ−ｌアルファ、ＨＩＦ−ｌベータ、ＨｉＮＦ−Ａ、ＨｉＮＦ−Ｂ、ＨＩＮＦ−Ｃ、ＨＩＮＦ−Ｄ、ＨｉＮＦ−Ｄ３、ＨｉＮＦ−Ｅ、ＨｉＮＦ−Ｐ、ＨＩＰｌ、ＨＩＶ−ＥＰ２、Ｈｌｆ、ＨＬＴＦ、ＨＬＴＦ（Ｍｅｔ１２３）、ＨＬＸ、ＨＭＢＰ、ＨＭＧＩ、ＨＭＧＩ（Ｙ）、ＨＭＧＹ、ＨＭＧＩ−Ｃ、ＨＮＦ−ｌＡ、ＨＮＦ−ＩＢ、ＨＮＦ−ｌＣ、ＨＮＦ−３、ＨＮＦ−３アルファ、ＨＮＦ−３ベータ、ＨＮＦ−３ガンマ、ＨＮＦ４、ＨＮＦ−４アルファ、ＨＮＦ４アルファｌ、ＨＮＦ−４アルファ２、ＨＮＦ−４アルファ３、ＨＮＦ−４アルファ４、ＨＮＦ４ガンマ、ＨＮＦ−６アルファ、ｈｎＲＮＰＫ、ＨＯＸ１１、ＨＯＸＡｌ、ＨＯＸＡｌ０、ＨＯＸＡｌ０ＰＬ２、ＨＯＸＡ１１、ＨＯＸＡ１３、ＨＯＸＡ２、ＨＯＸＡ３、ＨＯＸＡ４、ＨＯＸＡ５、ＨＯＸＡ６、ＨＯＸＡ７、ＨＯＸＡ９Ａ、ＨＯＸＡ９Ｂ、ＨＯＸＢ−１、ＨＯＸＢ１３、ＨＯＸＢ２、ＨＯＸＢ３、ＨＯＸＢ４、ＨＯＸＢＳ、ＨＯＸＢ６、ＨＯＸＡ５、ＨＯＸＢ７、ＨＯＸＢ８、ＨＯＸＢ９、ＨＯＸＣ１０、ＨＯＸＣ１１、ＨＯＸＣ１２、ＨＯＸＣ１３、ＨＯＸＣ４、ＨＯＸＣ５、ＨＯＸＣ６、ＨＯＸＣ８、ＨＯＸＣ９、ＨＯＸＤ１０、ＨＯＸＤ１１、ＨＯＸＤ１２、ＨＯＸＤ１３、ＨＯＸＤ３、ＨＯＸＤ４、ＨＯＸＤ８、ＨＯＸＤ９、Ｈｐ５５、Ｈｐ６５、ＨＰＸ４２Ｂ、ＨｒｐＦ、ＨＳＦ、ＨＳＦｌ（長）、ＨＳＦｌ（短）、ＨＳＦ２、ｈｓｐ５６、Ｈｓｐ９０、ＩＢＰ−１、ＩＣＥＲ−ＩＩ、ＩＣＥＲ−Ｉｉガンマ、ＩＣＳＢＰ、Ｉｄｌ、ＩｄｌＨ’、Ｉｄ２、Ｉｄ３、Ｉｄ３／Ｈｅｉｒ−１、ＩＦ１、ＩｇＰＥ−１、ＩｇＰＥ−２、ＩｇＰＥ−３、ＩカッパＢ、ＩカッパＢ−アルファ、ＩカッパＢ−ベータ、ＩカッパＢＲ、ＩＩ−１ＲＦ、ＩＬ−６ＲＥ−ＢＰ、１１−６ＲＦ、ＩＮＳＡＦ、ＩＰＦｌ、ＩＲＦ−１、ＩＲＦ−２、Ｂ、ＩＲＸ２ａ、Ｉｒｘ−３、Ｉｒｘ−４、ＩＳＧＦ−１、ＩＳＧＦ−３、ＩＳＧＦ３アルファ、ＩＳＧＦ−３ガンマ、１ｓｔ−１、ＩＴＦ、ＩＴＦ−１、ＩＴＦ−２、ＪＲＦ、Ｊｕｎ、ＪｕｎＢ、ＪｕｎＤ、ｋａｐｐａｙ因子、ＫＢＰ−１、ＫＥＲｌ、ＫＥＲ−１、Ｋｏｘｌ、ＫＲＦ−１、Ｋｕ自己抗原、ＫＵＰ、ＬＢＰ−１、ＬＢＰ−ｌａ、ＬＢＸｌ、ＬＣＲ−Ｆ１、ＬＥＦ−１、ＬＥＦ−１Ｂ、ＬＦ−Ａ１、ＬＨＸ１、ＬＨＸ２、ＬＨＸ３ａ、ＬＨＸ３ｂ、ＬＨＸＳ、ＬＨＸ６．１ａ、ＬＨＸ６．１ｂ、ＬＩＴ−１、Ｌｍｏ１、Ｌｍｏ２、ＬＭＸ１Ａ、ＬＭＸ１Ｂ、Ｌ−Ｍｙｌ（長い形態）、Ｌ−Ｍｙｌ（短い形態）、Ｌ−Ｍｙ２、ＬＳＦ、ＬＸＲアルファ、ＬｙＦ−１、Ｌｙｌ−１、Ｍ因子、Ｍａｄｌ、ＭＡＳＨ−１、Ｍａｘ１、Ｍａｘ２、ＭＡＺ、ＭＡＺｌ、ＭＢ６７、ＭＢＦｌ、ＭＢＦ２、ＭＢＦ３、ＭＢＰ−１（１）、ＭＢＰ−１（２）、ＭＢＰ−２、ＭＤＢＰ、ＭＥＦ−２、ＭＥＦ−２Ｂ、ＭＥＦ−２Ｃ（４３３ＡＡ型）、ＭＥＦ−２Ｃ（４６５ＡＡ型）、ＭＥＦ−２Ｃ（４７３Ｍ型）、ＭＥＦ−２Ｃ／デルタ３２（４４１ＡＡ型）、ＭＥＦ−２Ｄ００、ＭＥＦ−２Ｄ０Ｂ、ＭＥＦ−２ＤＡ０、ＭＥＦ−２ＤＡＯ、ＭＥＦ−２ＤＡＢ、ＭＥＦ−２ＤＡ’Ｂ、Ｍｅｉｓ−１、Ｍｅｉｓ−２ａ、Ｍｅｉｓ−２ｂ、Ｍｅｉｓ−２ｃ、Ｍｅｉｓ−２ｄ、Ｍｅｉｓ−２ｅ、Ｍｅｉｓ３、Ｍｅｏｘｌ、Ｍｅｏｘｌａ、Ｍｅｏｘ２、ＭＨｏｘ（Ｋ−２）、Ｍｉ、ＭＩＦ−１、Ｍｉｚ−１、ＭＭ−１、ＭＯＰ３、ＭＲ、Ｍｓｘ−１、Ｍｓｘ−２、ＭＴＢ−Ｚｆ、ＭＴＦ−１、ｍｔＴＦ１、Ｍｘｉｌ、Ｍｙｂ、Ｍｙｃ、Ｍｙｃ１、Ｍｙｆ−３、Ｍｙｆ−４、Ｍｙｆ−５、Ｍｙｆ−６、ＭｙｏＤ、ＭＺＦ−１、ＮＣＩ、ＮＣ２、ＮＣＸ、ＮＥＬＦ、ＮＥＲ１、Ｎｅｔ、ＮＦＩｌｌ−ａ、ＮＦＮＦ−１、ＮＦ−１Ａ、ＮＦ−１Ｂ、ＮＦ−１Ｘ、ＮＦ−４ＦＡ、ＮＦ−４ＦＢ、ＮＦ−４ＦＣ、ＮＦ−Ａ、ＮＦ−ＡＢ、ＮＦＡＴ−１、ＮＦ−ＡＴ３、ＮＦ−Ａｔｃ、ＮＦ−Ａｔｐ、ＮＦ−Ａｔｘ、ＮｆベータＡ、ＮＦ−ＣＬＥＯａ、ＮＦ−ＣＬＥＯｂ、ＮＦデルタＥ３Ａ、ＮＦデルタＥ３Ｂ、ＮＦデルタＥ３Ｃ、ＮＦデルタＥ４Ａ、ＮＦデルタＥ４Ｂ、ＮＦデルタＥ４Ｃ、Ｎｆｅ、ＮＦ−Ｅ、ＮＦ−Ｅ２、ＮＦ−Ｅ２ｐ４５、ＮＦ−Ｅ３、ＮＦＥ−６、ＮＦ−Ｇｍａ、ＮＦ−ＧＭｂ、ＮＦ−ＩＬ−２Ａ、ＮＦ−ＩＬ−２Ｂ、ＮＦ−ｊｕｎ、ＮＦ−カッパＢ、ＮＦ−カッパＢ（様）、ＮＦ−カッパＢｌ、ＮＦ−カッパＢｌ、前駆体、ＮＦ−カッパＢ２、ＮＦ−カッパＢ２（ｐ４９）、ＮＦ−カッパＢ２前駆体、ＮＦ−カッパＥｌ、ＮＦ−カッパＥ２、ＮＦ−カッパＥ３、ＮＦ−ＭＨＣＩＩＡ、ＮＦ−ＭＨＣＩＩＢ、ＮＦ−ｍｕＥｌ、ＮＦ−ｍｕＥ２、ＮＦ−ｍｕＥ３、ＮＦ−Ｓ、ＮＦ−Ｘ、ＮＦ−Ｘ１、ＮＦ−Ｘ２、ＮＦ−Ｘ３、ＮＦ−Ｘｃ、ＮＦ−ＹＡ、ＮＦ−Ｚｃ、ＮＦ−Ｚｚ、ＮＨＰ−１、ＮＨＰ−２、ＮＨＰ３、ＮＨＰ４、ＮＫＸ２−５、ＮＫＸ２Ｂ、ＮＫＸ２Ｃ、ＮＫＸ２Ｇ、ＮＫＸ３Ａ、ＮＫＸ３Ａｖｌ、ＮＫＸ３Ａｖ２、ＮＫＸ３Ａｖ３、ＮＫＸ３Ａｖ４、ＮＫＸ３Ｂ、ＮＫＸ６Ａ、Ｎｍｉ、Ｎ−Ｍｙｃ、Ｎ−Ｏｃｔ−２アルファ、Ｎ−Ｏｃｔ−２ベータ、Ｎ−Ｏｃｔ−３、Ｎ−Ｏｃｔ−４、Ｎ−Ｏｃｔ−５ａ、Ｎ−Ｏｃｔ−５ｂ、ＮＰ−ＴＣＩＩ、ＮＲ２Ｅ３、ＮＲ４Ａ２、Ｎｒｆ１、Ｎｒｆ−１、Ｎｒｆ２、ＮＲＦ−２ベータｌ、ＮＲＦ−２ガンマｌ、ＮＲＬ、ＮＲＳＦ１型、ＮＲＳＦ２型、ＮＴＦ、０２、ＯＣＡ−Ｂ、Ｏｃｔ−１、Ｏｃｔ−２、Ｏｃｔ−２．１、Ｏｃｔ−２Ｂ、Ｏｃｔ−２Ｃ、Ｏｃｔ−４Ａ、Ｏｃｔ４Ｂ、Ｏｃｔ−５、Ｏｃｔ−６、オクタ因子、八量体結合因子、ｏｃｔ−Ｂ２、ｏｃｔ−Ｂ３、Ｏｔｘｌ、Ｏｔｘ２、ＯＺＦ、ｐｌ０７、ｐｌ３０、ｐ２８モジュレーター、ｐ３００、ｐ３８ｅｒｇ、ｐ４５、ｐ４９ｅｒｇ、−ｐ５３、ｐ５５、ｐ５５ｅｒｇ、ｐ６５デルタ、ｐ６７、Ｐａｘ−１、Ｐａｘ−２、Ｐａｘ−３、Ｐａｘ−３Ａ、Ｐａｘ−３Ｂ、Ｐａｘ−４、Ｐａｘ−５、Ｐａｘ−６、Ｐａｘ−６／Ｐｄ−５ａ、Ｐａｘ−７、Ｐａｘ−８、Ｐａｘ−８ａ、Ｐａｘ−８ｂ、Ｐａｘ−８ｃ、Ｐａｘ−８ｄ、Ｐａｘ−８ｅ、Ｐａｘ−８ｆ、Ｐａｘ−９、Ｐｂｘ−ｌａ、Ｐｂｘ−ｌｂ、Ｐｂｘ−２、Ｐｂｘ−３ａ、Ｐｂｘ−３ｂ、ＰＣ２、ＰＣ４、ＰＣ５、ＰＥＡ３、ＰＥＢＰ２アルファ、ＰＥＢＰ２ベータ、Ｐｉｔ−１、ＰＩＴＸ１、ＰＩＴＸ２、ＰＩＴＸ３、ＰＫＮＯＸ１、ＰＬＺＦ、ＰＯ−Ｂ、Ｐｏｎｔｉｎ５２、ＰＰＡＲアルファ、ＰＰＡＲベータ、ＰＰＡＲガンマｌ、ＰＰＡＲガンマ２、ＰＰＵＲ、ＰＲ、ＰＲＡ、ｐＲｂ、ＰＲＤ１−ＢＦ１、ＰＲＤＩ−ＢＦｃ、Ｐｒｏｐ−１、ＰＳＥ１、Ｐ−ＴＥＦｂ、ＰＴＦ、ＰＴＦアルファ、ＰＴＦベータ、ＰＴＦデルタ、ＰＴＦガンマ、Ｐｕボックス結合因子、Ｐｕボックス結合因子（ＢＪＡ−Ｂ）、ＰＵ．１、ＰｕＦ、Ｐｕｒ因子、Ｒ１、Ｒ２、ＲＡＲ−アルファｌ、ＲＡＲ−ベータ、ＲＡＲ−ベータ２、ＲＡＲ−ガンマ、ＲＡＲ−ガンマｌ、ＲＢＰ６０、ＲＢＰ−Ｊカッパ、Ｒｅｌ、ＲｅｌＡ、ＲｅｌＢ、ＲＦＸ、ＲＦＸ１、ＲＦＸ２、ＲＦＸ３、ＲＦＸＳ、ＲＦ−Ｙ、ＲＯＲアルファｌ、ＲＯＲアルファ２、ＲＯＲアルファ３、ＲＯＲ
ベータ、ＲＯＲガンマ、Ｒｏｘ、ＲＰＦ１、ＲＰＧアルファ、ＲＲＥＢ−１、ＲＳＲＦＣ４、ＲＳＲＦＣ９、ＲＶＦ、ＲＸＲ−アルファ、ＲＸＲ−ベータ、ＳＡＰ−ｌａ、ＳＡＰｌｂ、ＳＦ−１、ＳＨＯＸ２ａ、ＳＨＯＸ２ｂ、ＳＨＯＸａ、ＳＨＯＸｂ、ＳＨＰ、ＳＩＩＩ−ｐｌ１Ｏ、ＳＩＩＩ−ｐ１５、ＳＩＩＩ−ｐｌ８、ＳＩＭ’、Ｓｉｘ−１、Ｓｉｘ−２、Ｓｉｘ−３、Ｓｉｘ−４、Ｓｉｘ−５、Ｓｉｘ−６、ＳＭＡＤ−１、ＳＭＡＤ−２、ＳＭＡＤ−３、ＳＭＡＤ−４、ＳＭＡＤ−５、ＳＯＸ−１１、ＳＯＸ−１２、Ｓｏｘ−４、Ｓｏｘ−５、ＳＯＸ−９、Ｓｐｌ、Ｓｐ２、Ｓｐ３、Ｓｐ４、Ｓｐｈ因子、Ｓｐｉ−Ｂ、ＳＰＩＮ、ＳＲＣＡＰ、ＳＲＥＢＰ−ｌａ、ＳＲＥＢＰ−ｌｂ、ＳＲＥＢＰ−ｌｃ、ＳＲＥＢＰ−２、ＳＲＥ−ＺＢＰ、ＳＲＦ、ＳＲＹ、ＳＲＰ１、Ｓｔａｆ−５０、ＳＴＡＴｌアルファ、ＳＴＡＴｌベータ、ＳＴＡＴ２、ＳＴＡＴ３、ＳＴＡＴ４、ＳＴＡＴ６、Ｔ３Ｒ、Ｔ３Ｒ−アルファｌ、Ｔ３Ｒ−アルファ２、Ｔ３Ｒ−ベータ、ＴＡＦ（Ｉ）ｌ１０、ＴＡＦ（Ｉ）４８、ＴＡＦ（Ｉ）６３、ＴＡＦ（ＩＩ）１００、ＴＡＦ（ＩＩ）１２５、ＴＡＦ（ＩＩ）１３５、ＴＡＦ（ＩＩ）１７０、ＴＡＦ（ＩＩ）１８、ＴＡＦ（ＩＩ）２０、ＴＡＦ（ＩＩ）２５０、ＴＡＦ（ＩＩ）２５０デルタ、ＴＡＦ（ＩＩ）２８、ＴＡＦ（ＩＩ）３０、ＴＡＦ（ＩＩ）３１、ＴＡＦ（ＩＩ）５５、ＴＡＦ（ＩＩ）７０−アルファ、ＴＡＦ（ＩＩ）７０−ベータ、ＴＡＦ（ＩＩ）７０−ガンマ、ＴＡＦ−Ｉ、ＴＡＦ−ＩＩ、ＴＡＦ−Ｌ、Ｔａｌ−１、Ｔａｌ−ｌベータ、Ｔａｌ−２、ＴＡＲ因子、ＴＢＰ、ＴＢＸＩＡ、ＴＢＸＩＢ、ＴＢＸ２、ＴＢＸ４、ＴＢＸＳ（長いアイソフォーム）、ＴＢＸＳ（短いアイソフォーム）、ＴＣＦ、ＴＣＦ−１、ＴＣＦ−１Ａ、ＴＣＦ−１Ｂ、ＴＣＦ−１Ｃ、ＴＣＦ−１Ｄ、ＴＣＦ−１Ｅ、ＴＣＦ−１Ｆ、ＴＣＦ−１Ｇ、ＴＣＦ−２アルファ、ＴＣＦ−３、ＴＣＦ−４、ＴＣＦ−４（Ｋ）、ＴＣＦ−４Ｂ、ＴＣＦ−４Ｅ、ＴＣＦベータｌ、ＴＥＦ−１、ＴＥＦ−２、ｔｅｌ、ＴＦＥ３、ＴＦＥＢ、ＴＦＩＩＡ、ＴＦＩＩＡ−ａｌｐｌ＾ｅｔａ前駆体、ＴＦＩＩＡ−アルファ／ベータ前駆体、ＴＦＩＩＡ−ガンマ、ＴＦＩＩＢ、ＴＦＩＩＤ、ＴＦＩＩＥ、ＴＦＩＩＥ−アルファ、ＴＦＩＩＥ−ベータ、ＴＦＩＩＦ、ＴＦＩＩＦ−アルファ、ＴＦＩＩＦ−ベータ、ＴＦＩＩＨ、ＴＦＩＩＨ＊、ＴＦＩＩＨ−ＣＡＫ、ＴＦＩＩＨ−サイクリンＨ、ＴＦＩＩＨ−ＥＲＣＣ２／ＣＡＫ、ＴＦＩＩＨ−ＭＡＴ１、ＴＦＩＩＨ−Ｍ０１５、ＴＦＩＩＨ−ｐ３４、ＴＦＩＩＨ−ｐ４４、ＴＦＩＩＨ−ｐ６２、ＴＦＩＩＨ−ｐ８０、ＴＦＩＩＨ−ｐ９０、ＴＦＩＩ−Ｉ、Ｔｆ−ＬＦｌ、Ｔｆ−ＬＦ２、ＴＧＩＦ、ＴＧＩＦ２、ＴＧＴ３、ＴＨＲＡ１、ＴＩＦ２、ＴＬＥ１、ＴＬＸ３、ＴＭＦ、ＴＲ２、ＴＲ２−１１、ＴＲ２−９、ＴＲ３、ＴＲ４、ＴＲＡＰ、ＴＲＥＢ−１、ＴＲＥＢ−２、ＴＲＥＢ−３、ＴＲＥＦ１、ＴＲＥＦ２、ＴＲＦ（２）、ＴＴＦ−１、ＴＸＲＥＢＰ、ＴｘＲＥＦ、ＵＢＦ、ＵＢＰ−１、ＵＥＦ−１、ＵＥＦ−２、ＵＥＦ−３、ＵＥＦ−４、ＵＳＦ１、ＵＳＦ２、ＵＳＦ２ｂ、Ｖａｖ、Ｖａｘ−２、ＶＤＲ、ｖＨＮＦ−１Ａ、ｖＨＮＦ−１Ｂ、ｖＨＮＦ−１Ｃ、ＶＩＴＦ、ＷＳＴＦ、ＷＴ１、ＷＴ１Ｉ、ＷＴ１Ｉ−ＫＴＳ、ＷＴ１Ｉ−ｄｅｌ２、ＷＴ１−ＫＴＳ、ＷＴ１−ｄｅｌ２、Ｘ２ＢＰ、ＸＢＰ−１、ＸＷ−Ｖ、ＸＸ、ＹＡＦ２、ＹＢ−１、ＹＥＢＰ、ＹＹｌ、ＺＥＢ、ＺＦ１、ＺＦ２、ＺＦＸ、ＺＨＸ１、ＺＩＣ２、ＺＩＤ、ＺＮＦ１７４、ＡＳＨ１Ｌ、ＡＳＨ２、ＡＴＦ２、ＡＳＸＬ１、ＢＡＰ１、ｂｃｌｌＯ、Ｂｍｉｌ、ＢＲＧ１、ＣＡＲＭ１、ＫＡＴ３Ａ／ＣＢＰ、ＣＤＣ７３、ＣＨＤ１、ＣＨＤ２、ＣＴＣＦ、ＤＮＭＴ１、ＤＯＴＬ１、ＥＨＭＴ１、ＥＳＥＴ、ＥＺＨ１、ＥＺＨ２、ＦＢＸＬ１０、ＦＲＰ（Ｐｌｕ−１）、ＨＤＡＣ１、ＨＤＡＣ２、ＨＭＧＡ１、ｈｎＲＮＰＡ１、ＨＰ１ガンマ、Ｈｓｅｔｌｂ、ＪａｒｉｄｌＡ、Ｊａｒｉｄ１Ｃ、ＫＩＡＡ１７１８ＪＨＤＭ１Ｄ、ＫＡＴ５、ＫＭＴ４、ＬＳＤ１、ＮＦＫＢＰ１００、ＮＳＤ２、ＭＢＤ２、ＭＢＤ３、ＭＬＬ２、ＭＬＬ４、Ｐ３００、ｐＲＢ、ＲｂＡＰ４６／４８、ＲＢＰ１、ＲｂＢＰ５、ＲＩＮＧＩＢ、ＲＮＡｐｏｌＩＩＰＳ２、ＲＮＡｐｏｌＩＩＰＳ５、ＲＯＣ１、ｓａｐ３０、ｓｅｔＤＢ１、Ｓｆ３ｂｌ、ＳＩＲＴ１、Ｓｉｒｔ６、ＳＭＹＤ１、ＳＰ１、ＳＵＶ３９Ｈ１、ＳＵＺ１２、ＴＣＦ４、ＴＥＴ１、ＴＲＲＡＰ、ＴＲＸ２、ＷＤＲ５、ＷＤＲ７７、および／またはＹＹｌ。これらＤＮＡ結合タンパク質および／またはクロマチン修飾因子に対する抗体は市販されている。

本明細書において使用される場合、クロマチン関連因子とは、クロマチン上の１つもしくは複数の部位に見い出され得る、および／または一過性の様式でクロマチンと会合し得る因子である。低い存在量のクロマチン関連因子の例としては、それらに限定されるわけではないが、転写因子（例えば、腫瘍抑制因子、がん遺伝子、細胞周期調節因子、発生および／または分化因子、基本転写因子（ＴＦ））、ＡＴＰ依存性クロマチンリモデラー（例えば、（Ｐ）ＢＡＦ、ＭＯＴ１、ＩＳＷＩ、ＩＮＯ８０、ＣＨＤ１）、アクチベーター（例えば、ヒストンアセチルトランスフェラーゼ（ＨＡＴ））複合体、リプレッサー（例えば、ヒストンデアセチラーゼ（ＨＤＡＣ））複合体、コアクチベーター、コリプレッサー、他のクロマチンリモデラー、例えばヒストン（デ）メチラーゼ、ＤＮＡメチラーゼ、複製因子等が挙げられる。そのような因子は、ある特定の環境信号があると（例えば、成長および他の刺激シグナル、ＤＮＡ損傷シグナル、細胞死シグナル）、トランスフェクションおよび一過性のもしくは安定な発現があると（例えば、組換え因子）、または感染があると（例えば、ウイルス因子）、細胞周期の特定の段階（例えば、Ｇｌ、Ｓ、Ｇ２、Ｍ期）でクロマチン（ＤＮＡ、ヒストン）と相互作用し得る。

豊富な因子は、クロマチンの構成成分、例えばヒストンおよびそれらのバリアントである。ヒストンは翻訳後修飾によりヒストン尾部で修飾され得るが、これは、ＤＮＡおよび核タンパク質とのそれらの相互作用を変更し、例えば遺伝子調節、ＤＮＡ修復、および染色体凝縮に影響を与える。Ｈ３およびＨ４ヒストンは、例えばメチル化、アセチル化、リン酸化、ユビキチン化、ＳＵＭＯ化、シトルリン化、およびＡＤＰ−リボシル化によって共有結合的に修飾され得る、ヌクレオソームから突き出た長い尾部を有する。ヒストンＨ２ＡおよびＨ２Ｂのコアも修飾され得る。

ある特定の実施形態では、ハイスループットな様式で試料処理を可能にする、開示される方法が提供される。例えば、１０、５０、１００、２００、５００、７５０、１０００個、またはそれを上回る数のクロマチン関連因子および／またはクロマチン修飾が、並行して免疫沈降され得および／または分析され得る。一実施形態では、例えば９６ウェルプレートを使用して、最高で９６個の試料が一度に処理され得る。他の実施形態では、例えば６ウェル、１２ウェル、３２ウェル、３８４ウェル、または１５３６ウェルプレートを使用して、より少ないまたはより多くの試料が処理され得る。一部の実施形態では、提供される方法は、例えば一般の０．５ｍｌ、１．５ｍｌ、または２．０ｍｌサイズの管など、管内で行われ得る。これらの管は、管ラック、浮き、または他の保持デバイスに並べられ得る。

特定の実施形態では、試料は、約１個の細胞、約２個の細胞、約３個の細胞、約５個の細胞、約１０個の細胞、約２５個、約５０個の細胞、約１００個の細胞、約１５０個の細胞、約２００個の細胞、約３００個の細胞、約４００個の細胞、約５００個の細胞、約１０００個の細胞、約２０００個の細胞、約３０００個の細胞、約４０００個の細胞、約５０００個の細胞、約１０，０００個の細胞、約２０，０００個の細胞、約３０，０００個の細胞、約４０，０００個の細胞、約５０，０００個の細胞、約１００，０００個の細胞、約２００，０００個の細胞、約３００，０００個の細胞、約４００，０００個の細胞、約５００，０００個の細胞、または約１，０００，０００個の細胞を含み得る。一部の実施形態では、試料は、約１個の細胞〜約１０，０００個の細胞もしくは約１０，０００個の細胞〜約１００，０００個の細胞、またはそれを上回る数を含み得る。

転写因子、およびヒストンなどの他のタンパク質と直接的な物理的相互作用の状態にある特異的ＤＮＡ部位を、ｉｎｖｉｖｏでタンパク質によって結合された標的ＤＮＡ部位のライブラリーを産生することによって単離し得る。一部の実施形態では、超並列配列分析を全ゲノム配列データベースとともに使用して、目的のタンパク質（例えば、転写因子、ポリメラーゼ、もしくは転写装置）とＤＮＡとの相互作用パターンを分析し得る、または目的のエピジェネティッククロマチン修飾（例えば、ヒストン修飾もしくはＤＮＡ修飾）のパターンを分析し得る。

開示される方法は、生物、例えば植物、または哺乳類対象、例えばヒト対象などの動物対象における疾患状態など、疾患状態をモニタリングすることにも特に適している。ある特定の疾患状態は、ｉｎｖｉｖｏにおけるクロマチンＤＮＡへのタンパク質および／または核酸の示差的結合によって引き起こされ得および／または特徴づけされ得る。例えば、ある特定の相互作用は、罹患細胞に生じ得るが、正常細胞には生じ得ない。他の例において、ある特定の相互作用は、正常細胞に生じ得るが、罹患細胞には生じ得ない。ゆえに、開示される方法を使用して、ｉｎｖｉｖｏ間の相互作用のプロファイルを疾患状態と関連付けし得る。

したがって、開示される方法の態様は、標的核酸とタンパク質および／または核酸との相互作用を、疾患状態、例えばがん、またはウイルスもしくは細菌感染症などの感染症と関連付けすることに関する。疾患状態への関連付けは、限定されることなく、植物、およびヒトなどの動物を含めた、任意の生物に対して行われ得るであろうことが理解される。

疾患と関連付けされた相互作用プロファイルを「フィンガープリント」として使用して、同様の「フィンガープリント」を有することを理由に、細胞における疾患を同定し得および／または診断し得る。クロマチン関連因子およびクロマチンＤＮＡのプロファイルを使用して、がんなどの疾患状態に関係している結合タンパク質および／または核酸を同定し得、例えば潜在的な診断用および／または治療用標的として、特定のタンパク質および／または核酸を同定し得る。加えて、プロファイルを使用して、疾患状態をモニターし得、例えば療法への応答、疾患進行をモニターし得、および／または対象に対する処置決定を行い得る。

相互作用プロファイルを獲得する能力は、例えば、試料に存在するプロファイルと、特異的疾患状態と関連付けされたものとの比較による、疾患状態の診断を可能にし、プロファイルの類似性は特定の疾患状態を示す。

したがって、開示される方法の態様は、疾患状態、例えばがん、またはウイルスもしくは細菌感染症などの感染症と関連付けされた相互作用プロファイルに基づき、疾患状態を診断することに関する。疾患状態の診断は、限定されることなく、植物、およびヒトなどの動物を含めた、任意の生物に対して行われ得るであろうことが理解される。

本開示の態様は、環境ストレスまたは状態と相互作用プロファイルとの関連付けに関し、例えば生物全体、または細胞の試料などの試料、例えば細胞の培養物を、熱ショック、浸透圧、低酸素状態、冷却、酸化ストレス、放射線、飢餓、化学物質（例えば、治療剤または潜在的治療剤）などであるがそれらに限定されない環境ストレスに曝露し得る。ストレスを適用した後、代表的な試料を、例えば様々な時点で分析に供し得、生物もしくは細胞由来の試料、例えば生物由来の細胞、または標準値などの対照と比較し得る。

一部の実施形態では、開示される方法を使用して、相互作用プロファイルをモジュレートする、例えば、相互作用プロファイルを、例えば疾患状態に関連付けされた異常なものから、無病状態を示すものに変更する薬剤について、化学物質ライブラリーをスクリーニングし得る。細胞、組織、またはさらに動物全体を化学物質ライブラリーの種々のメンバーに曝露し、および本明細書において記載される方法を実施することによって、化学物質ライブラリーの種々のメンバーを、例えばハイスループット法を使用して、比較的短時間で相互作用プロファイルに対するそれらの効果について同時にスクリーニングし得る。

一部の実施形態では、試験薬剤のスクリーニングは、多数の潜在的モジュレーター化合物を含有するコンビナトリアルライブラリーを試験することを伴う。コンビナトリアル化学物質ライブラリーは、試薬などの多数の化学的「ビルディングブロック」を組み合わせることによる、化学合成または生物学的合成のいずれかによって生成された多様な化学的化合物の収集物であり得る。例えば、ポリペプチドライブラリーなどの線形コンビナトリアル化学物質ライブラリーは、所与の化合物の長さ（例えば、ポリペプチド化合物におけるアミノ酸の数）に対してあらゆる考え得るやり方で、一連の化学的ビルディングブロック（アミノ酸）を組み合わせることによって形成される。化学的ビルディングブロックのそのようなコンビナトリアル混合により、数百万種の化学的化合物が合成され得る。

適当な薬剤がライブラリーに、例えば合成または天然化合物がコンビナトリアルライブラリーに含有され得る。数々のライブラリーが市販されておりまたは容易に産生され得；アンチセンスオリゴヌクレオチドおよびオリゴペプチドなど、ランダム化オリゴヌクレオチドの発現を含めた、多種多様な有機化合物および生体分子のランダム合成および指向性合成のための手段も公知である。あるいは、細菌、真菌、植物、および動物抽出物の形態にある天然化合物のライブラリーが利用可能であるまたは容易に産生され得る。加えて、天然のまたは合成により産生されたライブラリーおよび化合物は、従来の化学的、物理的、および生化学的な手段により容易に修飾され、コンビナトリアルライブラリーを産生するために使用され得る。そのようなライブラリーは、多数の異なる化合物のスクリーニングに有用である。

ライブラリーは、最高で約１００員のメンバーなど、最高で約１，０００員のメンバーなど、最高で約５，０００員のメンバーなど、最高で約１０，０００員のメンバーなど、最高で約１００，０００員のメンバーなど、最高で約５００，０００員のメンバーなど、またはさらに５００，０００員を上回る数のメンバーの、様々に異なる数の組成物（メンバー）を含み得る。一例において、方法は、多数の潜在的治療用化合物を含有するコンビナトリアル化学物質またはペプチドライブラリーを提供することを伴い得る。次いで、そのようなコンビナトリアルライブラリーを本明細書において開示される方法によってスクリーニングして、所望の特徴的活性を呈するそれらのライブラリーメンバー（特に、化学種またはサブクラス）を同定する。

本明細書において開示される方法を使用して同定された化合物は、従来の「リード化合物」として働き得る、または潜在的もしくは現実の治療薬としてそれ自体が使用され得る。一部の例において、候補薬剤のプールを同定しおよびさらにスクリーニングして、収集物（collective）におけるどの個々のまたはサブプールの薬剤が所望の活性を有するかを判定し得る。

対照反応は、ライブラリーとの組合せで実施され得る。必要に応じたそのような対照反応が適切であり、スクリーニングの信頼性を増加させ得る。したがって、開示される方法は、そのような対照反応を含み得る。対照反応は、転写モジュレーターとは無関係の転写因子活性を測定する陰性対照反応であり得る。対照反応は、公知の転写モジュレーターを考慮した転写因子活性を測定する陽性対照反応でもあり得る。

開示される方法によって同定された化合物を、多様な状態に対する治療薬または薬物開発のためのリード化合物として使用し得る。遺伝子発現は、細胞の分裂、成長、複製、分化、修復、細胞の感染等を含めたすべての生物学的工程における基本であるので、転写因子活性をモニターしおよびそれらの活性をモジュレートする（modulator）化合物を同定する能力を使用して、新生物、炎症、アレルギー性過敏症、代謝性疾患、遺伝性疾患、ウイルス感染症、細菌感染症、真菌感染症等を含めた、多様な状態に対する薬物リードを同定し得る。加えて、ウイルス、真菌、農業害虫などの非所望の生物における転写因子を特異的に標的にする同定された化合物は、殺真菌剤、殺細菌剤、除草剤、殺虫剤等として働き得る。ゆえに、転写因子活性に関係している状態の範囲には、ヒトおよび他の動物における、ならびに農業適用などの植物における状態が含まれる。

本明細書において開示される方法における使用のための適切な試料には、植物、動物、細菌などの生物またはその一部から獲得された任意の従来の生体試料が含まれる（健常なもしくは見かけ上健常なヒト対象由来、またはがんなど、診断されるもしくは検査されるべき状態もしくは疾患の影響を受けたヒト患者由来の試料を含めた、植物または動物など）。試料は、任意の臓器もしくは組織（腫瘍生検など、生検または剖検検体を含む）から獲得された試料でもあり得る、または細胞（初代細胞か培養細胞かにかかわらず）、組織、もしくは臓器を含み得る。例示的な試料としては、限定されることなく、細胞、組織生検（例えば、腫瘍生検）、細針吸引物、ならびに／または組織切片（例えば、クリオスタット組織切片および／もしくはパラフィン包埋組織切片）が挙げられる。他の例において、試料には、循環腫瘍細胞（細胞表面マーカーによって同定され得る）が含まれる。特定の例において、試料は直接使用される（例えば、新鮮なまたは凍結した）、または例えば固定（例えば、ホルマリンを使用した）および／もしくはワックス中に包埋すること（ホルマリン固定パラフィン包埋（ＦＦＰＥ）組織試料など）によって、使用前に操作され得る。対象から組織を獲得する任意の方法が利用され得ること、および使用される方法の選択は、組織のタイプ、対象の年齢、または実践者に利用可能な手順など、様々な因子に依存するであろうことが解されるであろう。

以下の実施例は、ある特定の特質および／または実施形態を例証するために提供される。この実施例は、記載される特定の特質または実施形態に本発明を限定すると捉えられるべきではない。

（実施例１）

クロマチン免疫切断（ＣｈＩＣ）には、ＴＦ特異的抗体を使用して、ＭＮａｓｅを繋留し、結合部位でのみ切断するという利点がある。ディープシーケンシングにＣｈＩＣを適応させるために、本開示の方法を開発して、そうしなければディープシーケンシングライブラリーより優位であるＤＮＡのバックグラウンド切断の提示を低減させた。核の軽度のＭＮａｓｅ処置は、モノヌクレオソームおよびＴＦ−ＤＮＡ複合体を遊離させ、その結果、オリゴヌクレオソームが残ることが観察された。ＴＦの両側を標的とした切断は、さらにＴＦ−ＤＮＡ複合体を上清に放出し、その結果、ペレット状の核内にゲノムの残りが残るだろう。氷上で短時間の消化反応を行うことにより、ＴＦに結合したＭＮａｓｅがゲノム周辺に拡散して接近可能なクロマチンを切断する前にＴＦ−ＤＮＡ複合体を上清から回収できることを発見した。この理論的根拠に基づいて、最初のＣＵＴ＆ＲＵＮプロトコール（図１Ａ）を開発し、洗練した。

一例では、プロトコールは、以下のステップを含む：
（１）未固定の核をレクチン被覆磁気ビーズ上に固定化する；
（２）抗体およびプロテインＡ−ＭＮａｓｅ（ｐＡ−ＭＮ）とともに逐次的にインキュベートし、続いて最小限の洗浄を行うステップ：
（３）氷上でＣａ^＋＋と混合して切断反応を開始させ、次いで、数秒から数分後にキレート化により切断反応を停止させる；そして
（４）遠心分離して、放出されたＴＦ−ＤＮＡ複合体を含有する上清を回収する。次いで、ＤＮＡを上清から抽出し、シーケンシングライブラリー調製に直接使用する。

ＣＵＴ＆ＲＵＮは、クロマチン複合体の限定消化を生じさせる。

ＣＵＴ＆ＲＵＮプロトコールを、最初は粗酵母核を使用して行った。ＣＵＴ＆ＲＵＮとＣｈＩＰ−ｓｅｑを厳密に比較するために、同じＦＬＡＧタグ付きＴＦ株、同じ核調製プロトコール、同じマウス抗ＦＬＡＧモノクローナル抗体、ならびに同じＩｌｌｕｍｉｎａライブラリー調製およびペアードエンドシーケンシング手順を使用した（Kasinathan et al., 2014）。マウスプロテインＡはマウスＩｇＧと弱くしか結合しないので、ウサギ抗マウス二次抗体をＣＵＴ＆ＲＵＮに使用した。ＣＵＴ＆ＲＵＮの効率を試験するために、ヌクレオソーム断片をゲノムワイドに放出すると予想された、３ＸＦＬＡＧタグ付きヒストンＨ２Ａを発現するＳａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ株を使用した。実際、０℃で１００倍の消化時間の経過にともなって、漸進的切断が観察され、下はモノヌクレオソームサイズに至るまでの断片の放出は、一次抗体の存在に完全に依存した（図１Ｂ）。

次いで、ＣＵＴ＆ＲＵＮを、ＡＲＳ結合因子１（Ａｂｆ１）およびｒＤＮＡエンハンサー結合タンパク質１（Ｒｅｂ１）という、構造が明確に異なる２つのＳ．ｃｅｒｅｖｉｓｉａｅＴＦに適用して、１試料当たり約２，０００，０００〜３，０００，０００のマッピングされたペアードエンドリードを得た。マッピングされた断片のサイズ分布は、４秒〜１２８秒の間の時点について、事実上、約１５０ｂｐ未満ではスーパーインポーズ可能であることが判明した（図１Ｃ）。３２倍範囲にわたっての時点間のこのほぼ一致は、ＴＦ結合断片の制限消化が、Ｃａ^＋＋を添加すると迅速に発生することを示唆し、消化時間が重要なパラメーターではないことを実証する。

マッピングされたＴＦ断片サイズは、約１５０ｂｐでピークに達するＨ２Ａ断片とは対照的に、約１００ｂｐでピークに達した。ＴＦ複合体は、約１００ｂｐより小さく、ヌクレオソームは約１５０ｂｐであると予想され、それ故、１２０ｂｐ未満の断片および１５０ｂｐより大きい断片を別々にマッピングした。時点プロファイルは、各々の領域の各々のＴＦモチーフについて１２０ｂｐ未満のサイズクラス内の鮮明なＣＵＴ＆ＲＵＮピークを示す（図１Ｄおよび図１０）。スパイクイン対照に対して正規化したときのピーク占有率の緩徐で単調な増加（図１１Ａ〜１１Ｂ）を除いて、１秒〜１２８秒の区画内で時点間の一貫した差異は観察されず、これにより、ＴＦ−ＤＮＡ複合体の漸進的放出は制限消化反応を生じさせることが確証された。小さい断片の全ＤＮＡ抽出および精製は、ほぼ同一の結果を生じさせた（図１２Ａ〜１２Ｃ）。これは、上清からのＤＮＡの抽出が、ＴＦ結合断片を定量的に回収すること実証する。

ＣＵＴ＆ＲＵＮは、ｉｎｓｉｔｕで酵母ＴＦ結合部位を高分解能でロバストにマッピングする。

１２０ｂｐ未満の断片がＴＦ結合部位周辺での切断を示すことを検証するために、ゲノム内の全ての優位なＡｂｆ１およびＲｅｂ１モチーフを同定し、ＣＵＴ＆ＲＵＮデータに基づくモチーフとＯＲＧＡＮＩＣデータに基づくモチーフとがほぼ同一であることを見出した（図１３Ａ〜１３Ｄ）。ＯＲＧＡＮＩＣ導出モチーフを使用して酵母ゲノムをスキャンし、これにより、本発明者らは、ＣＵＴ＆ＲＵＮの完全に独立して決定された１８９９のＡｂｆ１モチーフおよび１４１３のＲｅｂ１モチーフの包括的リストを得た。ピークコールの大多数が各々のデータセットについてのモチーフとオーバーラップすることが確認され、Ａｂｆ１についてはＯＲＧＡＮＩＣよりＣＵＴ＆ＲＵＮの性能のほうが多少良好であり、逆にＲｅｂ１についてはＣＵＴ＆ＲＵＮよりＯＲＧＡＮＩＣの性能のほうが多少良好であった（図１３Ｅ）。≦１２０ｂｐおよび≧１５０ｂｐプロファイルは、これらのモチーフを中心としたものであり、ヒートマップを構築した。Ａｂｆ１およびＲｅｂ１モチーフ各々を中心とする２ｋｂ区画の占有率によりランク付けしたとき、ＴＦ部位の＞９０％は、隣接領域と比較して対応するモチーフで断片により占有されることが観察された（図２Ａ〜２Ｂおよび図１４上部パネル）。これは、真陽性を表す可能性が高い。Ａｂｆ１およびＲｅｂ１モチーフのＣＵＴ＆ＲＵＮ占有は、ヌクレアーゼ接近可能性と比較して高いダイナミックレンジを示し（図１４、下方パネル）、これが、ヒートマップにおいてＣＵＴ＆ＲＵＮについてバックグラウンドより上のより高いコントラストとして見られた。対照的に、Ａｂｆ１断片は、オーバーラップしていないＲｅｂ１部位の占有をほとんど示さず、逆にＲｅｂ１断片は、オーバーラップしていないＡｂｆ１部位の占有をほとんど示さなかった（図２Ａ〜２Ｂおよび図１４中央パネル）。ＴＦモチーフの存在およびＴＦの占有率と、異なるＴＦ部位における一般的非存在との間のほぼ完全な対応は、ＣＵＴ＆ＲＵＮが、ＴＦ結合に対する感度も特異度も高いことを含意する。

ＣＵＴ＆ＲＵＮを高分解能ＣｈＩＰ−ｓｅｑと直接比較するために、「ＯＲＧＡＮＩＣ」ＣｈＩＰ−ｓｅｑデータをＡｂｆ１およびＲｅｂ１モチーフに同様に並べた。以前に報告された（Kasinathan et al., 2014）ように、ＯＲＧＡＮＩＣＣｈＩＰ−ｓｅｑは、ゲノム全体にわたってＡｂｆ１の真陽性モチーフの大多数とほぼ全てのＲｅｂ１モチーフとを検出した（図２Ａ〜２Ｂ、上部中央パネル）。最良Ｒｅｂ１データは、８０ｍＭＮａＣｌ抽出で得られ、最良Ａｂｆ１データは、６００ｍＭＮａＣｌで得られたが、Ｒｅｂ１のダイナミックレンジは、偽陽性占有の頻度が高いＡｂｆ１のダイナミックレンジより常に良好であった（図２Ａ〜２Ｂ、下部中央パネル）。対照的に、ＣＵＴ＆ＲＵＮは、約１０分の１のペアードエンドリードで、両方のＴＦについて同じ消化時点範囲で同じダイナミックレンジを示した。これは、ＣＵＴ＆ＲＵＮが、ＯＲＧＡＮＩＣＣｈＩＰ−ｓｅｑよりロバストであることを実証する。これらの高分解能法（Kasinathan et al., 2014）と比較して、架橋および超音波処理を使用する標準ＣｈＩＰ−ｓｅｑは、劣った感度および特異度を示した（図２Ａ〜２Ｂ、右側パネル）。したがって、ＣＵＴ＆ＲＵＮは、ＣｈＩＰ−ｓｅｑと比較して感度／特異度トレードオフが改善されたロバストなＴＦ占有マップを提供する。

ＣＵＴ＆ＲＵＮの分解能を推定するために、モチーフ中点周辺の各々のＴＦの「フットプリント」を断片末端の平均密度としてプロットした。Ａｂｆ１とＲｅｂ１の両方について、ほぼ塩基対分解能で、これらの転写因子がモチーフを中心とする約２０ｂｐを保護することを示す鋭い２０ｂｐ幅のフットプリントが観察された（図３Ａ）。興味深いことに、切断マップにおける上流および下流の「勾配」は、＞１００ｂｐにわたって約１０ｂｐ離れた「歯」間距離を有する鋸歯状パターンをＡｂｆ１モチーフとＲｅｂ１モチーフ両方の片側に示し、この鋸歯状パターンは、塩基組成に依存しないことが自己相関分析により確認された（図３Ｂ）。このような１０ｂｐの周期的切断選好性は、Ｂ型ＤＮＡの１０ｂｐ／ターンの周期性とマッチし、これは、これらの結合されたＴＦの片側のＤＮＡが、繋留されたＭＮａｓｅがＤＮＡ二重らせんの片面に優先的に接近するように空間配向されていることを示唆する。ＭＮａｓｅのＴＦへの繋留は、ＭＮａｓｅを、ヌクレオソームの表面にあったとしても隣接するＤＮＡを切断するように拘束し、これは、クロマチン線維の柔軟性を示唆する（図３Ｃ）。したがって、０℃で観察される非常に急速な反応速度は、繋留部位付近で切断する態勢が整っている固定化されたＭＮａｓｅに起因する。

ＣＵＴ＆ＲＵＮはクロマチン関連複合体を正確にマッピングする

クロマチンランドスケープの移動性成分の高分解能マッピングは、ＣｈＩＰに基づく方法には困難であり得る。例えば、約１メガダルトンの１７サブユニットＲＳＣヌクレオソームリモデリング複合体は、この複合体が一時的に取り込むヌクレオソームを動的にスライドさせ（Lorch et al., 2010；Ramachandran et al., 2015）、Ｍｏｔ１ＤＮＡトランスロカーゼは、ＴＡＴＡ結合タンパク質（ＴＢＰ）を高親和性結合部位から動的に除去する（Zentner and Henikoff, 2013；Auble et al., 1997）。Ｘ−ＣｈＩＰは、ヌクレオソームリモデリング複合体をそれらの一番近くにあるヌクレオソームと架橋させるが、ネイティブＣｈＩＰは、酵母クロマチンリモデラーをヌクレオソーム非存在領域（ＮＤＲ）内およびヌクレオソーム上両方のそれらの作用部位でうまく捕捉する（Zentner et al., 2013）。ＣＵＴ＆ＲＵＮがそのような大きいクロマチン関連複合体をプロファイリングするために、大きすぎて核膜孔を通って拡散することができない可能性がある、ＣＵＴ＆ＲＵＮによりｉｎｓｉｔｕで可溶化されるクロマチンではなく、全ＤＮＡを抽出するのが最適であることが判明した。それ故、全てのＤＮＡを抽出し、大きいＤＮＡ断片をＡＭＰｕｒｅビーズで優先的に除去した。この改良プロトコールを、＞２桁の消化範囲にわたってＭｏｔ１に適用したとき、ＯＲＧＡＮＩＣプロファイリングを使用して得られるものに非常に類似しているクロマチンプロファイルが、しかしそのペアードエンドリード数のたった約１５％で、観察された（図４Ａ）。ＴＢＰ結合部位の上流側のＭｏｔ１ピークは、ＣＵＴ＆ＲＵＮプロファイルとＯＲＧＡＮＩＣプロファイルの両方に見られ、これは、Ｍｏｔ１が、ｉｎｖｉｔｒｏでする（Wollmann et al., 2011）ように、ｉｎｖｉｖｏで上流側からＴＢＰに接近すること（Zentner and Henikoff, 2013）を確証する。ヒートマップおよび平均プロット分析は、≦１２０ｂｐ断片がＴＢＰ部位と近接した軌道を辿り、その一方で≧１５０ｂｐ断片が局所近傍に拡散的に分布することを示し、これは、おそらくＭｏｔ１の移動動態を表す（図１５Ａ〜１５Ｂ）。ＣＵＴ＆ＲＵＮを、ＲＳＣ複合体の触媒成分であるＳｔｈ１にも適用した。ＲＳＣは、ＮＤＲでヌクレオソームをスライドさせるように作用し、酵母遺伝子が転写開始部位のすぐ下流の＋１ヌクレオソームの推測二回対称軸でアラインメントされた（Ramachandran et al., 2015）。均一な消化が、５秒〜３０分の時間にわたって観察され（図１６Ａ）、ＧＡＬ４ＵＡＳ上の直接的ＲＳＣの存在量の確認によって観察された（図１６Ｂ）（Floer et al., 2010）。Ｓｔｈ１ピークは、ＮＤＲ内で最も存在量が多く、ＣＵＴ＆ＲＵＮプロファイルは、５秒〜１０分の間の消化時間で収量の漸増を示し（図４Ｂ）、これは、ＣＵＴ＆ＲＵＮプロトコールを使用して定量的制限消化が達成されることを示す。最大消化時間について並行して処置した、３ＸＦＬＡＧ−Ｓｔｈ１核に由来する、しかし一次抗ＦＬＡＧ抗体を含めなかった、陰性対照について、ほぼ平坦な線が観察された。Ｓｔｈ１ＣＵＴ＆ＲＵＮの結果は、Ｓｔｈ１ＯＲＧＡＮＩＣプロファイリングの結果（Ramachandran et al., 2015）と同様であるが、収量がはるかに高い（図４Ｃ）。ＣＵＴ＆ＲＵＮは、クロマチン関連複合体の効率的高分解能マッピングを、非常に大きく動的なクロマチン関連複合体であっても、提供するという結論に達した。

ＣＵＴ＆ＲＵＮには、希少な不溶性ＤＮＡ結合タンパク質複合体に対する分解能がある。

Ａｂｆ１およびＲｅｂ１は、比較的大量に存在するＴＦであるが、目的の多くのＤＮＡ結合タンパク質は希少であり、そのためＣｈＩＰによりプロファイリングするのは困難であり得る。出芽酵母には１染色体当たり１つしかセントロメアヌクレオソームがなく、これは、Ａｂｆ１またはＲｅｂ１のモル存在量の約１％に過ぎない。Ｈ３の代わりにＣｅｎＨ３（Ｃｓｅ４）ヒストンバリアントを含有するセントロメアヌクレオソームを研究するためのさらなる課題は、それが、細胞周期全体にわたって何メガダルトンもの動原体複合体の一部であり（Akiyoshi et al., 2010）、このことが、それを高不溶性にさせる（Krassovsky et al., 2012）ことである。ＣＵＴ＆ＲＵＮによりＣｓｅ４ヌクレオソームをプロファイリングするために、試料を消化後に分割し、１つのアリコートから上清のみを抽出し、他のアリコートから全ＤＮＡを抽出した。このようにして、可溶性および不溶性動原体複合体の回収率を比較することができた。並行して、ヒストンＨ２Ａを同様にプロファイリングした。全クロマチンと可溶性クロマチンの間の差を取ることにより、不溶性ペレット中の各ヒストンの占有率を推測することができる。不溶性動原体について予想されたとおり、染色体上の最高Ｃｓｅ４占有率は、セントロメアに見られる（図５Ａ）。際だったことに、ゲノム全体にわたってあらゆるヌクレオソームに存在する不溶性Ｈ２Ａの占有率もまた、セントロメアで最大である。実際、１６の酵母セントロメア全てで、本発明者らは、消化タイムコースで約１２０ｂｐの機能性セントロメアに限定されるＣｓｅ４およびＨ２Ａの非常に類似した濃縮を、標準Ｘ−ＣｈＩＰのものより４倍良好である分解能で観察した（図５Ｂ）。本発明者らはまた、ＣＵＴ＆ＲＵＮを適用する前にホルムアルデヒド架橋させた細胞に由来するビーズ結合クロマチンから全ＤＮＡを抽出し、同様の結果を得た（図５Ｃ）。興味深いことに、架橋によって、より明確に異なるプロファイルが得られ、片側に位相が定まったヌクレオソームが出現する結果となり、これらは、架橋によるクロマチンの柔軟性の低下と解釈される一方で、基本戦略を架橋細胞に適用することができることを実証する。

ＣＵＴ＆ＲＵＮ上清と全ＤＮＡとの間で観察される差異が、動原体クロマチンの差異のある溶解度に起因することを確認するために、試料を消化前に分割し、１つのアリコートについて切断反応を２ＭＮａＣｌで停止させ、シーケンシングのために上清を回収した。同様の結果が、全ＤＮＡについて高塩画分に関して観察された（図１７Ａ〜１７Ｃ）。セントロメアヌクレオソーム中の不溶性Ｈ２Ａの明白な存在は、その組成に関する継続中の議論（Wisniewski et al., 2014；Henikoff et al., 2014；Aravamudhan et al., 2013；Shivaraju et al., 2012）に直接対処する。さらに、酵母セントロメアヌクレオソームには、＞９０％Ａ＋ＴであるＤＮＡが巻き付いている（Krassovsky et al., 2012）ので、＞１００倍の消化タイムコースでセントロメア粒子が無傷であること（図５）は、ＣＵＴ＆ＲＵＮがＡＴリッチＤＮＡに対するＭＮａｓｅの固有の選好性によるバイアスを受けないこと（Chung et al., 2010；McGhee and Felsenfeld, 1983）を実証する。ＣＵＴ＆ＲＵＮは、大きいＤＮＡ結合複合体を、希少であり、不溶性であり、ＡＴリッチであるものであったとしても、マッピングすることができるという結論に達した。

ＣＵＴ＆ＲＵＮは、隣接するクロマチンを探索する。

≧１５０ｂｐプロファイル（図１Ｄおよび図４Ａ〜４Ｃ）の調査は、結合部位の周辺の幅広ピークを明示し、これらのピークは、消化時間に伴って深くなる、この部位自体に対応する「ノッチ」を有することもある。このパターンを、１つの末端がＴＦ−ＤＮＡ複合体周辺での切断、および可溶性断片を生じさせるのに十分なほどＴＦ結合部位に近接している第２の切断の結果として生じる、断片の漸進的放出を表すと解釈した。≧１５０ｂｐ断片のヒートマップ分析は、片側に約０．５ｋｂ伸長しているそれらのそれぞれの結合モチーフにおけるＡｂｆ１およびＲｅｂ１断片の占有率も示した（図２Ａ〜２Ｂ）。このような伸長した局所的切断は、ＤａｍＩＤの＞１ｋｂのリーチ（van Steensel et al., 2001）を連想させ、これは、テザーの柔軟性の結果として隣接するクロマチンが探索されることを示唆する。

ＣＵＴ＆ＲＵＮは、ヒト転写因子結合部位を高分解能でマッピングする。

単純な、よく研究されたゲノムにおいて原理証明を確立することにより、ＣＵＴ＆ＲＵＮをヒトＫ５６２細胞のＣＣＣＴＣ結合因子（ＣＴＣＦ）に適用した。様々な方法の効率を直接比較するために、１０，０００，０００リードを各々の技法についてランダムに選択し、生スコアを、シーケンシングされたリードごとに情報内容の表示としてプロットした。酵母ＴＦの場合と同様に、ＣＴＣＦＣＵＴ＆ＲＵＮは、標準Ｘ−ＣｈＩＰ−ｓｅｑおよびＣｈＩＰ−ｅｘｏを含む他のプロファイリング方法より高いダイナミックレンジを示した（図６Ａ）。ＤＮａｓｅＩ超高感受性部位または以前に同定された結合部位内に見られるＣＴＣＦモチーフとアラインメントしたとき、ＣＵＴ＆ＲＵＮＣＴＣＦヒートマップとＸ−ＣｈＩＰ−ｓｅｑＣＴＣＦヒートマップは、強い対応を示し、ＣＵＴ＆ＲＵＮのほうが高いダイナミックレンジを有した（図６Ｂ）。ＣＵＴ＆ＲＵＮを低温で行ったとき（図１９Ａ〜１９Ｄ）、抗体なし対照は、検出不能なバックグラウンドを示した（図１８）。出芽酵母ＴＦの場合と同様に、ＣＴＣＦ部位に直接隣接する位相が定まったヌクレオソームに対応する、隣接する断片の放出が観察された。繋留されたＭＮａｓｅの切断位置である、短いＣＵＴ＆ＲＵＮ断片のまさに末端位置をプロットすることにより、顕著な「トラム−トラック」が、ＣＴＣＦモチーフに対して定義された位置に４４ｂｐ離隔して観察された。さらに、この正確な切断パターンは、約３００倍タイムコース消化範囲にわたって一致し、主要な単一の塩基対カット部位がＣＴＣＦ結合部位の片側にあり、これにより、達成された制限消化が強調される（図６Ｃ）。このパターンは、切断位置が正確であることおよび細胞集団内で高度に均一であることを示す。これらの結果は、ＣＵＴ＆ＲＵＮが、同じ実験でＴＦもそれらの隣接するクロマチンも正確にマッピングすることを示唆する。ＣＴＣＦは、１１のジンクフィンガーを有し、それ故、並外れて安定したタンパク質−ＤＮＡ相互作用を示すことができる。それ故、短いＥボックスモチーフと結合し、ｂ滞留時間を有する、塩基性ループ−ヘリックスタンパク質である、ＭｙｃおよびＭａｘ（Phair et al., 2004）を使用して、ＣＵＴ＆ＲＵＮを試験した。ＣＵＴ＆ＲＵＮは、ＭｙｃとＭａｘの両方の高分解能でのマッピングに成功した（図２０Ａ）。Ｍａｘの場合、ＥＮＣＯＤＥＣｈＩＰ−ｓｅｑデータとの定量的比較が、同じ抗体を使用すると可能であり、ここで、ＣＵＴ＆ＲＵＮは、はるかに高いダイナミックレンジを有したため、はるかに多い数のＭａｘ結合部位をロバストに同定することができた（図２０Ｂ）。ＤＮＡのＥボックスに結合するために、Ｍｙｃは、Ｍａｘと、Ｍａｘが他の結合パートナーを有すること（Ayer and Eisenman, 1993）に加えてだが、ヘテロダイマーを形成する（Blackwood et al., 1991）。予想どおり、ほぼ全てのＭｙｃ結合部位に存在するＭａｘとの非常に高度なオーバーラップが見られた。対照的に、ＭｙｃおよびＭａｘについてＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑによって以前の同定された結合部位間のオーバーラップは、１０分の１のＭａｘ部位が同定されたので、不良である。しかし、ＭａｘＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑデータをＭａｘＣＵＴ＆ＲＵＮ部位に並べると、高い占有率（図２０Ｃ）が見られ、これは、ＣＵＴ＆ＲＵＮと比較してＸ−ＣｈＩＰ−ｓｅｑのより低いダイナミックレンジが、Ｘ−ＣｈＩＰ−ｓｅｑによってこれらのＭａｘ結合部位を同定できないことの原因となることを示唆した。

ＣＵＴ＆ＲＵＮは、圧縮されたクロマチンにおけるヒストン修飾をマッピングする

抗体繋留ＭＮａｓｅを高等真核生物における高度に圧縮されたヘテロクロマチン領域から排除することができる可能性、したがって、ＣＵＴ＆ＲＵＮをユークロマチン領域内のタンパク質−ＤＮＡ相互作用の分析に限定することができる可能性を、考慮した。それ故、ＣＵＴ＆ＲＵＮを抑制性ヒストンマークＨ３Ｋ２７ｍｅ３について実施した。ＣＵＴ＆ＲＵＮおよびＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑからの１０，０００，０００のリードを分析して、ＣＵＴ＆ＲＵＮのほうがはるかに高いダイナミックレンジでだが、同様のＨ３Ｋ２７ｍｅ３ランドスケープが観察された。これは、プロテインＡ−ＭＮａｓｅが、圧縮されたクロマチンに接近することができることを実証する（図２１）。さらに、Ｈ３Ｋ２７ｍｅ３切断クロマチンは、無傷の核から可溶性画分へ容易に放出され、これは、ＣＵＴ＆ＲＵＮを、圧縮されたクロマチンにおけるタンパク質−ＤＮＡ相互作用の探索に適用可能であることを示す。

ＣＵＴ＆ＲＵＮは方向性をもって長距離ゲノム接触をマッピングする

ＴＦに隣接するヌクレオソームサイズの断片は、ＴＦ含有断片とともに放出されるので、３Ｄ隣接物も切断および放出される可能性があるのかどうかを問うた。染色体−立体配座−捕捉（３Ｃ）法、例えば、Ｈｉ−ＣおよびＣｈＩＡ−ＰＥＴ（Tang et al., 2015；Lieberman- Aiden et al., 2009）は、３Ｄゲノムワイド接触をマッピングするための好ましい技法である。これらの方法は、Ｘ−ＣｈＩＰと同じホルムアルデヒド架橋プロトコールを使用して、３Ｄ相互作用、例えば、エンハンサーに結合したＴＦと、共活性化因子を介したプロモーターとのその接触との間の３Ｄ相互作用を同定する。この実施例では、Ｘ−ＣｈＩＰにより同定されるタンパク質の結合部位は、プロモーターとエンハンサーの両方を、たとえ相互作用の１つが、ホルムアルデヒドにより架橋された間接的タンパク質間相互作用によるものであったとしても、含むことになる。しかし、Ｘ−ＣｈＩＰにも、３Ｃに基づくマッピングにも、直接的部位と間接的部位とを区別するための系統的方法がない。それ故、タンパク質間相互作用の一過的性質に起因して、ＴＦ特異的ＤＮＡ結合モチーフを含有する直接的結合部位のみをマッピングする結果となることが以前に示されている（Kasinathan et al., 2014）、ネイティブＣｈＩＰを使用して、ＣＴＣＦ結合部位のマッピングを試みた。タンパク質再分布の証拠のないほぼ完全なタンパク質抽出を達成する（図２２Ａ〜２２Ｂ）、新たなネイティブＣｈＩＰプロトコール（下記参照）を開発した。ネイティブ条件下で、高いモチーフスコアを有する２２９８部位を同定した。対照的に、ＣＴＣＦのＣＵＴ＆ＲＵＮマッピングは、多様な範囲のモチーフスコアを有する、Ｘ−ＣｈＩＰにも存在する約２２，０００部位を検出した（図２３）。予想どおり、ネイティブＣｈＩＰにより同定された全ての部位は、ＣＵＴ＆ＲＵＮおよびＸ−ＣｈＩＰによってもロバストに検出され、したがって、同様のシグナル分布を示した（図７Ａ）。有意なネイティブＣｈＩＰシグナルを欠いているＣＵＴ＆ＲＵＮ部位は、それにもかかわらず、ネイティブＣｈＩＰインプットでロバストなフットプリントを同様のカウント累積分布で示し（図７Ｂ）、３Ｄゲノム相互作用について予想されるような未知の結合因子の存在を示した。これは、Ｘ−ＣｈＩＰと同様に、ＣＵＴ＆ＲＵＮが、直接的クロマチン相互作用（ネイティブＣＴＣＦピーク）と間接的クロマチン相互作用（ＣＵＴ＆ＲＵＮピークのみ）の両方を高分解能で発見できることを示す。

ネイティブＣｈＩＰによって観察されないＣＴＣＦＣＵＴ＆ＲＵＮ部位が接触部位に対応することを確認するために、直接的部位および間接的部位を、ＣｈＩＡ−ＰＥＴによって観察される接触部位と比較した。ＣＴＣＦＣｈＩＡ−ＰＥＴは、ＣＴＣＦによって媒介される相互作用ゲノム領域を同定するが、直接的にＣＴＣＦに結合している領域と間接的に結合している相互作用領域とを識別することができない。典型的な約１Ｍｂゲノム領域については、高スコアを有するＣｈＩＡ−ＰＥＴ断片の全てが、直接的および間接的部位とオーバーラップする（図８Ａ）。マッピングされたＣＴＣＦＣｈＩＡ−ＰＥＴ融合断片は、使用した６カッターの制限酵素についての部位間の距離により判定して数ｋｂ範囲にあるが、直接的ＣＵＴ＆ＲＵＮＣＴＣＦ部位と間接的ＣＵＴ＆ＲＵＮＣＴＣＦ部位の両方が、ほぼ塩基対分解能でマッピングされる。さらに、直接的部位の９１％がＣＴＣＦＣｈＩＡ−ＰＥＴデータに存在し、これらのＣｈＩＡ−ＰＥＴ断片の４３％は、間接的部位と相互作用し、残りは、高ＣＵＴ＆ＲＵＮシグナルを含有する（図８Ｃ）。これは、これらの部位が、ピークコール閾値のすぐ下の複数の接触に関与する間接的部位であることを示す。

ＣＵＴ＆ＲＵＮは間接的接触相互作用を検出することができるというさらなる証拠として、高頻度のＨｉ−Ｃ相互作用が直接的部位と間接的部位の間に見られ、間接的部位におけるＨｉ−ＣスコアとＣＵＴ＆ＲＵＮシグナルの間に定量的相関が見られた（図８Ｂ）。それ故、ＣＵＴ＆ＲＵＮとネイティブＣｈＩＰを比較することによって、他の方法によって実行可能でない、接触部位をほぼ塩基対分解能でマッピングすること、直接的タンパク質結合部位を長距離のゲノム相互作用の結果として生じる間接的タンパク質結合部位と区別すること、およびこれらの接触に対する方向性を決定することが可能である。

ＣＵＴ＆ＲＵＮは少ない細胞数での定量的測定を可能にする

典型的なＣｈＩＰ−ｓｅｑ実験は、多数の細胞を必要とし、少ない細胞数のＣｈＩＰは、存在量の多いタンパク質に限定されている（Kasinathan et al., 2014; Brind'Amour et al., 2015）。ＣＴＣＦＣＵＴ＆ＲＵＮを、６００，０００〜１０，０００，０００の範囲の出発Ｋ５６２細胞数で出発して行った。データセット間の絶対占有率を比較するために、タンパク質占有率の正確な定量的測定を可能にするスパイクイン戦略を使用した（下記の材料および方法を参照されたい）。スパイクインＤＮＡに対して正規化したとき、切断事象の数は、出発細胞数に比例することが観察された（図９Ａ〜９Ｂ）。さらに、データを、ヒトゲノムとアラインメントするリードの総数に対して正規化したとき、試料に明らかな差はなく、これは、高いデータ品質が少ないインプット材料で維持されることを示す。

考察

簡易なクロマチンプロファイリング方法

ＣＵＴ＆ＲＵＮは、Laemmliおよび共同研究者のＣｈＩＣ抗体繋留ヌクレアーゼ戦略（Schmid et al., 2004）に基づく。ＣｈＩＣをゲノムワイドなプロファイリング法に適応させるために、５つの重要な改良を加えた。第１に、ＣＵＴ＆ＲＵＮを１日で行うために、およびＣＵＴ＆ＲＵＮが自動化に好適であるように、迅速かつ効率的な溶液の変化を可能にする磁気ビーズに透過処理された細胞または粗核を固定化した。第２に、抗体およびｐＡ−ＭＮａｓｅを、エピトープが保存され、エピトープに接近可能である、ネイティブ未固定核と、結合させた。第３に、固定化されたＭＮａｓｅによる切断はゼロ次反応であるので、消化を、放出された断片の拡散を制限し、ひいてはバックグラウンドを低減させる氷冷温度で、行った。切断された断片を溶解度に基づいて分画することができるネイティブクロマチン（Sanders, 1978; Teves and Henikoff, 2012; Jahan et al., 2016）を使用して、第４に、放出されたクロマチン複合体を特異的に濃縮した。不溶性バルククロマチンを除去した。粒子の両側で切断されたクロマチン断片のみが上清に入る。第５に、ＤＮＡ抽出後、これらの可溶性断片をＩｌｌｕｍｉｎａライブラリー調製およびペアードエンドＤＮＡシーケンシングに使用した。ＣＵＴ＆ＲＵＮは、簡易性、分解能、ロバストネス、効率、データ品質、および高不溶性複合体への適用性に関して、ＣｈＩＰ−ｓｅｑと同様にまたはそれより良好に機能する。ＣＵＴ＆ＲＵＮは、反応をｉｎｓｉｔｕで行うことにより達成される本質的に低いバックグラウンドのため、他の高分解能方法論のシーケンシング深度の約１／１０しか必要としない。ＭＮａｓｅが活性化されるとき核は無傷であるので、ＣＵＴ＆ＲＵＮは、標的部位周辺の局所的環境を探索することができる。実際、ＣＵＴ＆ＲＵＮは、ヒト細胞において、比較的低いシーケンシング深度で、塩基対分解能で３Ｄ接触部位を回収する。

ＣＵＴ＆ＲＵＮは広く応用できる

ＣｈＩＣは、サザンブロットを使用する基本的マッピング法として１２年前に記載されたが、本発明者らは、それを使用する公表文献を１つも知らない。その一方で、ＣｈＩＰ−ｓｅｑは単独で、ヒストン修飾を含むほぼ全てのタイプのクロマチン成分、転写因子およびクロマチン関連タンパク質のプロファイリングについて、約３０，０００の公表文献で言及されている。ＣｈＩＰと同様に、ＣＵＴ＆ＲＵＮは、抗体に基づくものであり、したがって、クロマチン上の任意のエピトープに適用することができるため、ＣｈＩＰのために開発された大規模抗体産生基盤を利用するクロマチンプロファイリングの一般的方法とされている。ＣＵＴ＆ＲＵＮは、ＣｈＩＰ−ｓｅｑおよびＣＵＴ＆ＲＵＮデータセットの処理および比較のための本発明者らのカスタムソフトウェアにより実行される標準およびスパイクイン正規化選択肢で定量的占有プロファイルを提供する。ＣＵＴ＆ＲＵＮの唯一の非標準的特徴は、＞１００，０００の試料のプロファイリングに十分なｐＡ−ＭＮを生じさせる細菌培養からのバッチで産生および精製することができるｐＡ−ＭＮ融合タンパク質の要求である。ＣＵＴ＆ＲＵＮは、ＣｈＩＰとは異なる原理に基づくので、架橋関連問題、超音波処理関連問題および可溶化関連問題を解決することができる。切断が結合部位の周辺でしか起こらないのでＣＵＴ＆ＲＵＮに伴うバックグラウンドは低いが、ＣｈＩＰは、最初に全ゲノムを細かい小片の状態にし、これらの断片は、なおシーケンシングしなければならないゲノムワイドなバックグラウンドノイズに寄与する。本発明者らが使用した短時間の低温条件下で検出可能なバックグラウンドがほぼ存在しないこと、接近可能なまたはＡＴリッチなＤＮＡに対する選好性が欠如していること、および酵母ゲノム内の本質的に全てのＡｂｆ１およびＲｅｂ１モチーフが回収されることは、ＣＵＴ＆ＲＵＮが、時としてＣｈＩＰを悩ませてきたタイプのアーチファクトを被らないことを示唆する（Teytelman et al., 2013；Park et al., 2013; Jain et al., 2015；Baranello et al., 2016；Kasinathan et al., 2014）。さらに、ＣＵＴ＆ＲＵＮ抗体結合は、免疫蛍光顕微鏡法のための条件に似ている無傷核環境で起こり、したがって、細胞学的に検証されている抗体については、ＣｈＩＰで失敗するものであっても、成功するはずである。ＣＵＴ＆ＲＵＮは、標的切断反応後にのみクロマチンを可溶化するので、古典的なクロマチン塩の分画（Sanders, 1978；Teves and Henikoff, 2012；Jahan et al., 2016）の特定のＴＦおよびクロマチン複合体への拡大適用に適している。

ＣＵＴ＆ＲＵＮは長距離接触を正確にマッピングする

ＣＵＴ＆ＲＵＮのための無傷核の使用の結果は、抗体繋留ＭＮａｓｅの長いリーチが局所的環境を探索できることである。酵母では、切断は、ＴＦに隣接するＤＮＡの１面で観察され、距離に伴って徐々に減少した。ヒト細胞では、切断は、ＣＴＣＦの接触部位として以前に同定された部位で観察された。最近、Ｈｉ−Ｃ接触部位は、ＣＴＣＦ結合部位を考慮して高い信頼度でコンピュータにより予測されている（Sanborn et al., 2015）。ＣＵＴ＆ＲＵＮは、ＣＴＣＦ結合部位と相互作用の両方をマッピングし、ネイティブＣｈＩＰプロトコールは、直接ＴＦ結合している部位を同定するので、それは、ゲノムの完全な高分解能１Ｄマップを提供し、その上、直接的ＴＦ結合部位と間接的ＴＦ結合部位を高分解能で区別してその３Ｄ接触マップを強化することができる。

低バックグラウンドレベルはシーケンシングコストを低下させる

ＣｈＩＰ−ｓｅｑ分析は、試料間で異なるリード数を補償するための正規化を概して含む。ＣｈＩＰ−ｓｅｑでは、全ゲノム断片化は、例えば野生型およびノックダウン細胞系と比較して、正規化の基礎となる一定した低密度のゲノムワイドなバックグラウンドを招く。正規化は、存在量の多いタンパク質ではうまくいかないが、これをスパイクイン対照の使用により補正することができる（Bonhoure et al., 2014；Chen et al., 2015；Orlando et al., 2014）。しかし、厳密なスパイクイン戦略は、異なる種からの細胞の添加を必要とし、定量は、抗体の交差反応に依存している（Orlando et al., 2014）。ＣＵＴ＆ＲＵＮにおける低いバックグラウンドにもかかわらず試料間で正規化するために、異なる種からの一定した少量の断片化スパイクインＤＮＡの添加は、タンパク質占有率の正確な定量に十分であり、タンパク質占有率の正確な定量を可能にする。ＣＵＴ＆ＲＵＮでの切断の低いバックグラウンドレベルによって、ピークを簡潔に定義するために必要とされるリードがより少ない。例えば、低分解能ＣｈＩＰ−ｓｅｑの要件と同様の、およびＣＴＣＦに約１００，０００，０００リードを必要としたＣｈＩＰ−ｅｘｏよりはるかに少ない、約１０，０００，０００のペアードエンドリードしか、各々のＣＴＣＦ時点に必要とされなかった（Rhee and Pugh, 2011）。さらに、ＭａｘおよびＨ３Ｋ２７ｍｅ３の場合、ＣＵＴ＆ＲＵＮの１０，０００，０００リードは、非常に高いダイナミックレンジを提供したが、１０，０００，０００リードは、ＭａｘＥＮＣＯＤＥＸ−ＣｈＩＰ−ｓｅｑからのピークのコールには不十分であった。この対費用効果のため、ＣＵＴ＆ＲＵＮは、特にシーケンシングの深度が限定的であるＣｈＩＰ−ｓｅｑの代替として魅力的である。ＣＵＴ＆ＲＵＮの高い効率は、ｉｎｓｉｔｕプロファイリングとＣｈＩＰの間の根本的な相違に起因し得る：ＣＵＴ＆ＲＵＮは、ｉｎｖｉｖｏで３Ｄ立体配座を保持するため、抗体は一次結合反応において露出面にしか接近しないが、ＣｈＩＰでは、抗体は、細かい小片の状態の細胞または核の可溶化可能なゲノムワイドな内容物と相互作用する。さらに、ＣＵＴ＆ＲＵＮ切断は、事実上、ゼロ次反応であり、その結果、ゲノム内の全ての結合エピトープについて短時間の低温タイムコースの間に定常的に粒子を放出することになる。エピトープ存在量を説明すると、６００，０００細胞を用いる約２２，０００の直接的および間接的ＣＴＣＦ部位のマッピングは、約５０００細胞を用いるＨ３Ｋ２７ｍｅ３などの存在量の多いヒストン修飾に概して限定される超低インプットＣｈＩＰ−ｓｅｑプロトコールの感度に匹敵すると推定される（Brind'Amour et al., 2015）。超低インプットＣｈＩＰは、約２ｋｂの分解能しか提供しないが、ＣＵＴ＆ＲＵＮは、ほぼ塩基対分解能を提供する。開示する方法の固有のロバストネス、高度な情報内容、少ないインプットおよびシーケンシング要求ならびに自動化の適格性は、ＣＴＣＦおよび他のＴＦのＣＵＴ＆ＲＵＮプロファイリングがエピゲノム診断に応用される可能性があることを示す。まとめると、ＣＵＴ＆ＲＵＮには、ＣｈＩＰおよびその派生物を超えるいくつかの実用面での利点がある：低いシーケンシング深度（sequence depth）要求をもたらす低いバックグラウンドに伴って、使用の容易さが、ＣＵＴ＆ＲＵＮをロボットによる自動化に適用可能なものにし、その上、簡易なスパイクイン戦略での正確な定量を可能にする。したがって、全ての重要な点において、ＣＵＴ＆ＲＵＮは、ＣｈＩＰに基づく戦略の魅力的な代替となる。

材料および方法

Ｆｌａｇタグ付きＨ２Ａ（ＳＢＹ２６８８）、Ｃｓｅ４（ＳＢＹ５１４６）、Ａｂｆ１およびＲｅｂ１をそれらのそれぞれの内在性プロモーターの制御下で保有する、生物学的Ｗ１５８８−４ＣＳ．ｃｅｒｅｖｉｓｉａｅ株は、以前に記載されている（Kasinathan et al., 2014；Krassovsky et al., 2012；Gelbart et al., 2001）。酵母核を記載されているように調製し（Kasinathan et al., 2014）、０．５〜０．６ｍｌアリコートで急速凍結し、−８０℃で保管した。ヒトＫ５６２細胞を標準条件下で培養した。標準プロトコールを電気泳動ゲル分析および免疫ブロット法に使用した。使用した抗体は、マウス抗ＦＬＡＧ（Ｍ２、Ｓｉｇｍａ、Ｓｔ．Ｌｏｕｉｓ、ＭＯ、カタログ番号Ｆ１８０４）、ウサギ抗マウス（Ａｂｃａｍ、Ｃａｍｂｒｉｄｇｅ、ＵＫ、カタログ番号ａｂ４６５４０）、ＣＴＣＦ（ＭｉｌｌｉｐｏｒｅＢｉｌｌｅｒｉｃａ、ＭＡ、カタログ番号０７−７２９）、Ｈ３Ｋ２７ｍｅ３（Ｍｉｌｌｉｐｏｒｅカタログ番号０７−４４９）、ｃ−Ｍｙｃ（ＣｅｌｌＳｉｇｎａｌｉｎｇＴｅｃｈｎｏｌｏｇｙＢｅｖｅｒｌｙ、ＭＡ、カタログ番号Ｄ３Ｎ８Ｆ）、Ｍａｘ（ＳａｎｔａＣｒｕｚＢｉｏｔｅｃｈｎｏｌｏｇｙ、Ｄａｌｌａｓ、ＴＸ、カタログ番号ｓｃ−１９７）およびＲＮＡＰｏｌＩＩ（８ＷＧ１６、Ａｂｃａｍカタログ番号ａｂ８１７）であった。ｐＫ１９ｐＡ−ＭＮプラスミドは、ＵｌｒｉｃｈＬａｅｍｍｌｉからの寄贈品であり、ｐＡ−ＭＮタンパク質は、記載されているように（Schmid et al., 2004）Ｅ．ｃｏｌｉ細胞から調製した。酵母核ＣＵＴ＆ＲＵＮのためのＣＵＴ＆ＲＵＮは、公表されている手順に従って調製した粗核を用いて始める。後続のプロトコールを段階的形式で提供する（下記参照）。核を約０．７のＯＤ６００の約５×１０^８細胞から記載されているように調製し（Orsi et al., 2015）、１０個の６００ｍＬアリコートに分割し、急速凍結し、−８０℃で保持し、その後、使用前に氷上で解凍した。Ｂｉｏ−ＭａｇＰｌｕｓＣｏｎｃａｎａｖａｌｉｎＡ（レクチン）被覆ビーズを、ＭｇＣｌ２、ＣａＣｌ２およびＭｎＣｌ２各々１ｍＭを補足したＨＮＴ（２０ｍＭＨＥＰＥＳｐＨ７．５、１００ｍＭＮａＣｌおよび０．１％Ｔｗｅｅｎ２０）と平衡させた。レクチンを活性化するために必要なのはＣａ＋＋およびＭｎ＋＋のみであり、ＭｇＣｌ２を含めなくても、透過処理した細胞のビーズへの結合に影響しなかった。ビーズ（３００ｍＬ）を解凍した核アリコートと迅速に混合し、室温（ＲＴ）で≧５分保持し、透明になるまで磁気スタンド上に置き（＜１分）、磁気スタンド上でデカントした。次いで、３％ウシ血清アルブミン（ＢＳＡ）および２ｍＭＥＤＴＡｐＨ８を含有する、プロテアーゼ阻害剤（ＲｏｃｈｅＣｏｍｐｌｅｔｅタブレット）と１ｍＭフッ化フェニルメチルスルホニル（ＰＭＳＦ）とを補足したＨＮＴ（＝ＨＮＴ−ＰＰｉ）中で、５分、室温でビーズをインキュベートし、次いで、ＨＮＴ−ＰＰｉ＋０．１％ＢＳＡ（ブロッキング緩衝剤）とともに５分インキュベートして、磁気スタンドを使用してデカントした。ビーズをマウス抗ＦＬＡＧ抗体（１：２００〜１：３５０）とともに２時間、４℃でインキュベートし、デカントし、ＨＮＴ＋ＰＭＳＦで１回洗浄し、次いで、ブロッキング緩衝剤中のウサギ抗マウスＩｇＧ抗体（１：２００）とともに１時間、４℃でインキュベートした。ビーズをＨＮＴ＋ＰＭＳＦで１回洗浄し、次いで、ブロッキング緩衝剤中のｐＡ−ＭＮ（６００ｍｇ／ｍｌ、１：２００）とともに１時間、４℃でインキュベートした。ビーズをＨＮＴ＋ＰＭＳＦで２回洗浄し、Ｓｔｈ１およびＭｏｔ１のための１０％ポリエチレングリコール８０００を必要に応じて含む、２０ｍＭＨＥＰＥＳｐＨ７．５、１００ｍＭＮａＣｌ（消化緩衝剤）で１回洗浄した。ビーズを１．２ｍｌの消化緩衝剤に懸濁し、８×１５０ｍＬアリコートに分割し、０℃に平衡させ、次いで、ＣａＣｌ_２と迅速に混合し、１５０ｍＬの２ＸＳＴＯＰ［ホルムアルデヒド架橋ＭＮａｓｅ処置ショウジョウバエクロマチンから抽出した５〜５０ｐｇ／ｍｌのほぼモノヌクレオソームサイズの異種ＤＮＡ断片をスパイクインとして含有する、２００ｍＭＮａＣｌ、２０ｍＭＥＤＴＡ、４ｍＭＥＧＴＡ、５０ｍｇ／ｍｌのＲＮａｓｅＡ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ、Ｗａｌｔｈａｍ、ＭＡ、カタログ番号ＥＮ０５３１）および４０ｍｇ／ｍｌのグリコーゲン（Ｓｉｇｍａ、カタログ番号１０９０１３９３００１）］で反応を停止させた。３７℃で２０分間インキュベートした後、ビーズを５分、１３，０００ｒｐｍで４℃で遠心分離し、上清を磁気スタンドで除去し、３ｍＬの１０％ＳＤＳおよび２ｍＬのプロテイナーゼＫ（Ｉｎｖｉｔｒｏｇｅｎ、Ｃａｒｌｓｂａｄ、ＣＡ、カタログ番号２５５３００４９）と混合し、７０℃で１０分インキュベートし、次いで、室温で１回、緩衝フェノール−クロロホルム−イソアミルアルコール（２５：２４：１、ＳｉｇｍａＰ２０６９）で抽出し、フェーズロック管（Ｑｉａｇｅｎ、Ｈｉｌｄｅｎ、Ｇｅｒｍａｎｙ、カタログ番号１２９０４６）に移し、１体積のＣＨＣｌ_３で再抽出し、２ｍＬの２ｍｇ／ｍｌのグリコーゲンを含有する新たな管に移し、２〜２．５体積のエタノールの添加により沈殿させ、氷で冷却し、１０分、１３，０００ｒｐｍで４℃で遠心分離した。ペレットを１００％エタノールですすぎ、空気乾燥させ、２５ｍＬの０．１×ＴＥ８（＝１ｍＭＴｒｉｓｐＨ８、０．１ｍＭＥＤＴＡ）に溶解した。高塩抽出にＣＵＴ＆ＲＵＮを拡大適用するために、消化を５０ｍＬ体積で行い、５０ｍＬの２ＸＳＴＯＰで停止させ、このＳＴＯＰにはＲＮａｓｅを含めず、標準２００ｍＭＮａＣｌの代わりに４ＭＮａＣｌを使用した。３７℃で２０分後、２００ｍＬの６７ｍｇ／ｍｌのＲＮａｓｅＡを添加し、２０分インキュベートし、次いで、１３，０００ｒｐｍで遠心分離して上清を清澄化した。哺乳動物細胞ヒトＫ５６２のためのＣＵＴ＆ＲＵＮは、ＡＴＣＣ（Ｍａｎａｓｓａｓ、ＶＡ、カタログ番号ＣＣＬ−２４３）から購入した。遠心分離に基づくプロトコールを使用してＣＵＴ＆ＲＵＮを行った。１０，０００，０００細胞を遠心分離（６００ｇ、スインギングバケットローターで３分）により収集し、氷冷リン酸緩衝食塩水（ＰＢＳ）で洗浄した。核を、５分間、氷上での１ｍｌのＮＥ１（２０ｍＭＨＥＰＥＳ−ＫＯＨｐＨ７．９；１０ｍＭＫＣｌ；１ｍＭＭｇＣｌ２；０．１％ＴｒｉｔｏｎＸ−１００；２０％グリセロール）への低張溶解によって単離し、その後、上記のとおり遠心分離した（一部の細胞中のヌクレアーゼは、Ｍｇ＋＋依存性のＤＮＡ分解を引き起こした。その場合、０．５ｍＭスペルミジンを１ｍＭＭｇＣｌ２の代わりに使用することができる）。核を１．５ｍｌの緩衝剤１（２０ｍＭＨＥＰＥＳｐＨ７．５；１５０ｍＭＮａＣｌ；２ｍＭＥＤＴＡ；０．５ｍＭスペルミジン；０．１％ＢＳＡ）で短時間洗浄し、次いで、１．５ｍｌの緩衝剤２（２０ｍＭＨＥＰＥＳｐＨ７．５；１５０ｍＭＮａＣｌ；０．５ｍＭスペルミジン；０．１％ＢＳＡ）で洗浄した。核を５００ｍｌの緩衝剤２に再懸濁させ、１０ｍｌの抗体を添加し、４℃で２時間インキュベートした。核を１ｍｌの緩衝剤２で３回洗浄して未結合の抗体を除去した。核を３００ｍｌの緩衝剤２に再懸濁させ、５ｍｌのｐＡ−ＭＮを添加し、４℃で１時間インキュベートした。核を０．５ｍｌの緩衝剤２で３回洗浄して未結合のｐＡ−ＭＮを除去した。管を氷水中の金属ブロック内に配置し、１００ｍＭのＣａＣｌ２と迅速に混合して２ｍＭの最終濃度にした。ＥＤＴＡおよびＥＧＴＡをそれぞれ１０ｍＭおよび２０ｍＭの最終濃度になるまで添加することにより反応をクエンチし、ショウジョウバエＤＮＡからの１ｎｇのモノヌクレオソームサイズのＤＮＡ断片をスパイクインとして添加した。核を４℃で１時間インキュベートすることにより、切断された断片を上清に遊離させ、核を上記のとおりの遠心分離によりペレット化した。ＤＮＡ断片を上清から抽出し、シーケンシングライブラリーの構築に使用した。このプロトコールを磁気ビーズとの使用（下に示す）に適用することもできる。ＴＦＣｈＩＰ−ｓｅｑデータセットにおけるスパイクイン正規化ゲノムワイドバックグラウンドは、通常は、ライブラリー調製およびシーケンシングにおける試料間の可変性を補償するための正規化のために一定したバックグラウンドレベルを提供するのに十分な高さのものである。標準的正規化のために、ゲノム内の各々の塩基位置に対応する断片末端の数を、マッピングされたリード末端の総数で割った。しかし、ＣＵＴ＆ＲＵＮのもともと低いバックグラウンドレベルは、定量的比較のためにスパイクイン対照を必要とする（Hu et al., 2014）。ヒトＣＵＴ＆ＲＵＮのスパイクイン正規化のために、少ない一定量のＤｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒＤＮＡを各々の反応に添加した。ペアードエンドリードをヒトゲノムとハエゲノムの両方にマッピングして、ヒトプロファイルをハエリード数に対して正規化した（図９Ａ〜９Ｂ）。内部正規化を使用することにより、切断の増加は、消化タイムコースで観察されなかった。しかし、ハエスパイクインＤＮＡへの正規化により、経時的な切断レベルの約４倍の増加が観察された。しかるが故に、ＣＵＴ＆ＲＵＮは、タンパク質−ＤＮＡ相互作用の正確な定量に適用可能である。ライブラリー調製、シーケンシング、およびシーケンシングライブラリーのデータ処理は、サイズ選択を伴わないこと、ＫＡＰＡＤＮＡポリメラーゼライブラリー調製キットプロトコール（www.kapabiosystems.com/product-applications/products/next-generation-sequencing-2/dna-library-preparation/kapa-hyper-prep-kits/）に従ったこと、および８サイクルまたはそれより多くのサイクルにわたって増幅したことを除いて、記載されているように（Kasinathan et al., 2014; Henikoff et al., 2011）ＤＮＡ断片から調製した。不溶性クロマチンに由来する大きい断片の全ＤＮＡ試料を枯渇させるために、試料をＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰビーズの１／２体積と混合し、５〜１０分保持し、磁気スタンド上に配置し、上清を保持してビーズを廃棄した。残存する大きい断片の上清を低減させるために、ＫＡＰＡポリメラーゼライブラリー調製方法を使用するＰＣＲサイクル数を１４サイクルに増加させ、それに応じてアダプター濃度を上昇させた。ＰＣＲサイクル数の増加は、長すぎてポリメラーゼが完全に通過できない断片の線形増幅よりも、より短い断片の指数関数的増幅のほうに有利に働く。ＩｌｌｕｍｉｎａＨｉＳｅｑ２５００を用いてペアードエンドモードで２５サイクルにわたってライブラリーをシーケンシングした。ペアードエンド断片を、ｓａｃＣｅｒ３／Ｖ６４ゲノムおよびビルドに、ならびにＳＡＭファイルを生成するためにＮｏｖｏａｌｉｇｎ（Ｎｏｖｏｃｒａｆｔ）を記載されているように使用してＦｌｙＢａｓｅから得たリリースｒ５．５１（２０１３年５月）のＤ．ｍｅｌａｎｏｇａｓｔｅｒゲノム配列に、マッピングした。ヒト試料については、Ｂｏｗｔｉｅ２を使用してペアードエンド断片をｈｇ１９にマッピングした。データ処理用のカスタムスクリプトは、ＳｕｐｐｌｅｍｅｎｔａｒｙＳｏｆｔｗａｒｅから提供されており、github.com/peteskeneからダウンロードすることができる。比較分析のために、ＮＣＢＩＳＲＡアーカイブからダウンロードした公開されているデータセットは、ＥＲＲ７１８７９９（Ａｂｆ１）、ＳＲＲ２５６８５２２（Ｒｅｂ１）、ＧＳＭ７４９６９０（ＣＴＣＦ；１％の偽発見率を有する、ゲノム全体にわたっての２０ｂｐステップでの１５０ｂｐスライディングウインドウ）であり、ＣＴＣＦＣｈＩＰ−ｅｘｏＢＡＭファイルは、ＦｒａｎｋＰｕｇｈにより好意的に提供されたものであった。ＣＵＴ＆ＲＵＮピークへのバイアスがかかっていないＴＦ特異的モチーフのセットを得るために、ＭＥＭＥモ
チーフ発見プログラムを酵母ＯＲＧＡＮＩＣＣｈＩＰ−ｓｅｑピークコールに適用した。得られた対数オッズ位置特異的スコア行列（ＰＳＳＭ）を、Ｓ．ｃｅｒｅｖｉｓｉａｅゲノムのＭＡＳＴ検索に使用して、有意な対数オッズモチーフスコアを有する部位を同定した。これは、１８９９のＡｂｆ１部位および１４１３のＲｅｂ１部位を同定した。以前の研究に従って、そのＴＦについてのモチーフへの酵母ＴＦ結合部位の対応を、真陽性コールの「究極の判断基準」であるように使用した（Rhee and Pugh, 2011；Kasinathan et al., 2014；Zentner et al., 2015；Ganapathi et al., 2011）。Kasinathanらの閾値法（Kasinathan et al., 2014）を使用してコールされたピークから対数オッズＰＳＳＭを構築するためにＭＥＭＥを使用した。ピークコーリングカットオフは、ピーク間距離＝１００、最小ピーク幅＝５０、および最大ピーク幅＝１０００である、プールされた１秒〜３２秒の≦１２０ｂｐのＡｂｆ１およびＲｅｂ１データセットについての正規化されたカウントの９９．５パーセンタイルであった。ＣＵＴ＆ＲＵＮモチーフ回収率とＯＲＧＡＮＩＣモチーフ回収率を比較するために、同様のピーク数を報告するようにピークコール閾値を調整した。対数オッズ配列ロゴは、ＰＷＭＴｏｏｌｓ（ccg.vital-it.ch/pwmtools/）を使用して生成した。トラックスクリーンショットは、ＩＧＶ（Thorvaldsdottir et al., 2013）を使用して生成した。

実施例１のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）。

Akiyoshi B, Sarangapani KK, Powers AF, Nelson CR, Reichow SL, Arellano-Santoyo H, Gonen T, Ranish JA, Asbury CL, Biggins S. 2010. Tension directly stabilizes reconstituted kinetochore-microtubule attachments. Nature 468:576−579. doi: 10.1038/nature09594, PMID: 21107429

Aravamudhan P, Felzer-Kim I, Joglekar AP. 2013. The budding yeast point centromere associates with two Cse4 molecules during mitosis. Current Biology 23:770−774. doi: 10.1016/j.cub.2013.03.042, PMID: 23623551

Auble DT, Wang D, Post KW, Hahn S. 1997. Molecular analysis of the SNF2/SWI2 protein family member MOT1, an ATP-driven enzyme that dissociates TATA-binding protein from DNA. Molecular and Cellular Biology 17: 4842−4851. doi: 10.1128/MCB.17.8.4842

Aughey GN, Southall TD. 2016. Dam it’s good! DamID profiling of protein-DNA interactions. Wiley Interdisciplinary Reviews: Developmental Biology 5:25−37. doi: 10.1002/wdev.205, PMID: 26383089

Ayer DE, Eisenman RN. 1993. A switch from Myc:Max to Mad:Max heterocomplexes accompanies monocyte/macrophage differentiation. Genes & Development 7:2110−2119. doi: 10.1101/gad.7.11.2110, PMID: 8224841

Baranello L, Kouzine F, Sanford S, Levens D. 2016. ChIP bias as a function of cross-linking time. Chromosome Research 24:175−181. doi: 10.1007/s10577-015-9509-1, PMID: 26685864

Blackwood EM, Eisenman RN. 1991. Max: a helix-loop-helix zipper protein that forms a sequence-specific DNA-binding complex with Myc. Science 251:1211−1217. doi: 10.1126/science.2006410, PMID: 2006410

Bonhoure N, Bounova G, Bernasconi D, Praz V, Lammers F, Canella D, Willis IM, Herr W, Hernandez N, Delorenzi M, CycliX Consortium. 2014. Quantifying ChIP-seq data: a spiking method providing an internal reference for sample-to-sample normalization. Genome Research 24:1157−1168. doi: 10.1101/gr.168260.113, PMID: 24709819

Brind’Amour J, Liu S, Hudson M, Chen C, Karimi MM, Lorincz MC. 2015. An ultra-low-input native ChIP-seq protocol for genome-wide profiling of rare cell populations.

Nature Communications 6:6033. doi: 10.1038/ncomms7033, PMID: 25607992 Chen K, Hu Z, Xia Z, Zhao D, Li W, Tyler JK. 2015. The overlooked fact: Fundamental need for Spike-In control for virtually all Genome-Wide analyses. Molecular and Cellular Biology 36:662−667. doi: 10.1128/MCB.00970- 14, PMID: 26711261

Cho G, Kim J, Rho HM, Jung G. 1995. Structure-function analysis of the DNA binding domain of Saccharomyces cerevisiae ABF1. Nucleic Acids Research 23:2980−2987. doi: 10.1093/nar/23.15.2980, PMID: 7659521

Chung HR, Dunkel I, Heise F, Linke C, Krobitsch S, Ehrenhofer-Murray AE, Sperling SR, Vingron M. 2010. The effect of micrococcal nuclease digestion on nucleosome positioning data. PLoS One 5:e15754. doi: 10.1371/ journal.pone.0015754, PMID: 21206756

Floer M, Wang X, Prabhu V, Berrozpe G, Narayan S, Spagna D, Alvarez D, Kendall J, Krasnitz A, Stepansky A, Hicks J, Bryant GO, Ptashne M. 2010. A RSC/nucleosome complex determines chromatin architecture and facilitates activator binding. Cell 141:407−418. doi: 10.1016/j.cell.2010.03.048, PMID: 20434983

Ganapathi M, Palumbo MJ, Ansari SA, He Q, Tsui K, Nislow C, Morse RH. 2011. Extensive role of the general regulatory factors, Abf1 and Rap1, in determining genome-wide chromatin structure in budding yeast. Nucleic Acids Research 39:2032−2044. doi: 10.1093/nar/gkq1161, PMID: 21081559

Gelbart ME, Rechsteiner T, Richmond TJ, Tsukiyama T. 2001. Interactions of Isw2 chromatin remodeling complex with nucleosomal arrays: analyses using recombinant yeast histones and immobilized templates. Molecular and Cellular Biology 21:2098−2106. doi: 10.1128/MCB.21.6.2098-2106.2001, PMID: 11238944

Hass MR, Liow HH, Chen X, Sharma A, Inoue YU, Inoue T, Reeb A, Martens A, Fulbright M, Raju S, Stevens M, Boyle S, Park JS, Weirauch MT, Brent MR, Kopan R. 2015. SpDamID: Marking DNA bound by protein complexes identifies Notch-Dimer responsive enhancers. Molecular Cell 59:685−697. doi: 10.1016/j.molcel. 2015.07.008, PMID: 26257285

He Q, Johnston J, Zeitlinger J. 2015. ChIP-nexus enables improved detection of in vivo transcription factor binding footprints. Nature Biotechnology 33:395−401. doi: 10.1038/nbt.3121

Henikoff JG, Belsky JA, Krassovsky K, MacAlpine DM, Henikoff S. 2011. Epigenome characterization at single base-pair resolution. PNAS 108:18318−18323. doi: 10.1073/pnas.1110731108, PMID: 22025700

Henikoff S, Ramachandran S, Krassovsky K, Bryson TD, Codomo CA, Brogaard K, Widom J, Wang JP, Henikoff JG. 2014. The budding yeast centromere DNA element II wraps a stable Cse4 hemisome in either orientation in vivo. eLife 3:e01861. doi: 10.7554/eLife.01861, PMID: 24737863

Hu Z, Chen K, Xia Z, Chavez M, Pal S, Seol JH, Chen CC, Li W, Tyler JK. 2014. Nucleosome loss leads to global transcriptional up-regulation and genomic instability during yeast aging. Genes & Development 28:396−408. doi: 10.1101/gad.233221.113, PMID: 24532716

Jahan S, Xu W, He S, Gonzalez C, Delcuve GP, Davie JR. 2016. The chicken erythrocyte epigenome. Epigenetics & Chromatin 9:19. doi: 10.1186/s13072-016-0068-2, PMID: 27226810

Jain D, Baldi S, Zabel A, Straub T, Becker PB. 2015. Active promoters give rise to false positive ’Phantom Peaks’ in ChIP-seq experiments. Nucleic Acids Research 43:6959−6968. doi: 10.1093/nar/gkv637, PMID: 26117547

Kasinathan S, Orsi GA, Zentner GE, Ahmad K, Henikoff S. 2014. High-resolution mapping of transcription factor binding sites on native chromatin. Nature Methods 11:203−209. doi: 10.1038/nmeth.2766, PMID: 24336359

Krassovsky K, Henikoff JG, Henikoff S. 2012. Tripartite organization of centromeric chromatin in budding yeast. PNAS 109:243−248. doi: 10.1073/pnas.1118898109, PMID: 22184235

Lieberman-Aiden E, van Berkum NL, Williams L, Imakaev M, Ragoczy T, Telling A, Amit I, Lajoie BR, Sabo PJ, Dorschner MO, Sandstrom R, Bernstein B, Bender MA, Groudine M, Gnirke A, Stamatoyannopoulos J, Mirny LA, Lander ES, Dekker J. 2009. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 326:289−293. doi: 10.1126/science.1181369, PMID: 19815776

Lorch Y, Maier-Davis B, Kornberg RD. 2010. Mechanism of chromatin remodeling. PNAS 107:3458−3462. doi: 10.1073/pnas.1000398107, PMID: 20142505

McGhee JD, Felsenfeld G. 1983. Another potential artifact in the study of nucleosome phasing by chromatin digestion with micrococcal nuclease. Cell 32:1205−1215. doi: 10.1016/0092-8674(83)90303-3, PMID: 6301684

Meyer CA, Liu XS. 2014. Identifying and mitigating bias in next-generation sequencing methods for chromatin biology. Nature Reviews Genetics 15:709−721. doi: 10.1038/nrg3788, PMID: 25223782

Morrow BE, Ju Q, Warner JR. 1990. Purification and characterization of the yeast rDNA binding protein REB1. The Journal of Biological Chemistry 265:20778−20783. PMID: 2249986

O’Neill LP, VerMilyea MD, Turner BM. 2006. Epigenetic characterization of the early embryo with a chromatin immunoprecipitation protocol applicable to small cell populations. Nature Genetics 38:835−841. doi: 10.1038/ ng1820, PMID: 16767102

Orlando DA, Chen MW, Brown VE, Solanki S, Choi YJ, Olson ER, Fritz CC, Bradner JE, Guenther MG. 2014. Quantitative ChIP-Seq normalization reveals global modulation of the epigenome. Cell Reports 9:1163−1170. doi: 10.1016/j.celrep.2014.10.018, PMID: 25437568

Orsi GA, Kasinathan S, Zentner GE, Henikoff S, Ahmad K. 2015. Mapping regulatory factors by immunoprecipitation from native chromatin. Current Protocols in Molecular Biology 110:21.31.1−21.3121 . doi: 10.1002/0471142727.mb2131s110

Park D, Lee Y, Bhupindersingh G, Iyer VR. 2013. Widespread misinterpretable ChIP-seq bias in yeast. PLoS One 8:e83506. doi: 10.1371/journal.pone.0083506, PMID: 24349523

Paul E, Tirosh I, Lai W, Buck MJ, Palumbo MJ, Morse RH. 2015. Chromatin mediation of a transcriptional memory effect in yeast. G3(Bethesda) 5:829−838. doi: 10.1534/g3.115.017418, PMID: 25748434

Pekgoz Altunkaya G, Malvezzi F, Demianova Z, Zimniak T, Litos G, Weissmann F, Mechtler K, Herzog F, Westermann S. 2016. CCAN Assembly configures composite binding interfaces to promote Cross-Linking of Ndc80 complexes at the kinetochore. Current Biology 26:2370−2378. doi: 10.1016/j.cub.2016.07.005, PMID: 27524485

Phair RD, Scaffidi P, Elbi C, Vecerova´ J, Dey A, Ozato K, Brown DT, Hager G, Bustin M, Misteli T. 2004. Global nature of dynamic protein-chromatin interactions in vivo: three-dimensional genome scanning and dynamic interaction networks of chromatin proteins. Molecular and Cellular Biology 24:6393−6402. doi: 10.1128/MCB. 24.14.6393-6402.2004, PMID: 15226439

Ramachandran S, Zentner GE, Henikoff S. 2015. Asymmetric nucleosomes flank promoters in the budding yeast genome. Genome Research 25:381−390. doi: 10.1101/gr.182618.114, PMID: 25491770

Rhee HS, Pugh BF. 2011. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147:1408−1419. doi: 10.1016/j.cell.2011.11.013, PMID: 22153082

Sanborn AL, Rao SS, Huang SC, Durand NC, Huntley MH, Jewett AI, Bochkov ID, Chinnappan D, Cutkosky A, Li J, Geeting KP, Gnirke A, Melnikov A, McKenna D, Stamenova EK, Lander ES, Aiden EL. 2015. Chromatin extrusion explains key features of loop and domain formation in wild-type and engineered genomes. PNAS 112:E6456−E6465. doi: 10.1073/pnas.1518552112, PMID: 26499245

Sanders MM. 1978. Fractionation of nucleosomes by salt elution from micrococcal nuclease-digested nuclei. The Journal of Cell Biology 79:97−109. doi: 10.1083/jcb.79.1.97, PMID: 701381

Schmid M, Durussel T, Laemmli UK. 2004. ChIC and ChEC; genomic mapping of chromatin proteins. Molecular Cell 16:147−157. doi: 10.1016/j.molcel.2004.09.007, PMID: 15469830

Shivaraju M, Unruh JR, Slaughter BD, Mattingly M, Berman J, Gerton JL. 2012. Cell-cycle-coupled structural oscillation of centromeric nucleosomes in yeast. Cell 150:304−316. doi: 10.1016/j.cell.2012.05.034, PMID: 22 817893

Skene PJ, Henikoff S. 2015. A simple method for generating high-resolution maps of genome-wide protein binding. eLife 4:e09225. doi: 10.7554/eLife.09225, PMID: 26079792

Solomon MJ, Varshavsky A. 1985. Formaldehyde-mediated DNA-protein crosslinking: a probe for in vivo chromatin structures. PNAS 82:6470−6474. doi: 10.1073/pnas.82.19.6470, PMID: 2995966

Southall TD, Gold KS, Egger B, Davidson CM, Caygill EE, Marshall OJ, Brand AH. 2013. Cell-type-specific profiling of gene expression and chromatin binding without cell isolation: assaying RNA Pol II occupancy in neural stem cells. Developmental Cell 26:101−112. doi: 10.1016/j.devcel.2013.05.020, PMID: 23792147

Tang Z, Luo OJ, Li X, Zheng M, Zhu JJ, Szalaj P, Trzaskoma P, Magalska A, Wlodarczyk J, Ruszczycki B, Michalski P, Piecuch E, Wang P, Wang D, Tian SZ, Penrad-Mobayed M, Sachs LM, Ruan X, Wei CL, Liu ET, et al. 2015. CTCF-Mediated human 3D genome architecture reveals chromatin topology for transcription. Cell 163:1611− 1627. doi: 10.1016/j.cell.2015.11.024, PMID: 26686651

Teves SS, Henikoff S. 2012. Salt fractionation of nucleosomes for genome-wide profiling. Methods in Molecular Biology 833:421−432. doi: 10.1007/978-1-61779-477-3_25, PMID: 22183608

Teytelman L, Thurtle DM, Rine J, van Oudenaarden A. 2013. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. PNAS 110:18602−18607. doi: 10.1073/pnas.1316064110, PMID: 24173036

Thorvaldsdo´ ttir H, Robinson JT, Mesirov JP. 2013. Integrative Genomics Viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics 14:178−192. doi: 10.1093/bib/bbs017, PMID: 22517427

van Steensel B, Delrow J, Henikoff S. 2001. Chromatin profiling using targeted DNA adenine methyltransferase. Nature Genetics 27:304−308. doi: 10.1038/85871, PMID: 11242113

Wisniewski J, Hajj B, Chen J, Mizuguchi G, Xiao H, Wei D, Dahan M, Wu C. 2014. Imaging the fate of histone Cse4 reveals de novo replacement in S phase and subsequent stable residence at centromeres. eLife 3:e02203. doi: 10.7554/eLife.02203, PMID: 24844245

Wollmann P, Cui S, Viswanathan R, Berninghausen O, Wells MN, Moldt M, Witte G, Butryn A, Wendler P, Beckmann R, Auble DT, Hopfner KP. 2011. Structure and mechanism of the Swi2/Snf2 remodeller Mot1 in complex with its substrate TBP. Nature 475:403−407. doi: 10.1038/nature10215, PMID: 21734658

Zentner GE, Henikoff S. 2013. Mot1 redistributes TBP from TATA-containing to TATA-less promoters. Molecular and Cellular Biology 33:4996−5004. doi: 10.1128/MCB.01218-13, PMID: 24144978

Zentner GE, Kasinathan S, Xin B, Rohs R, Henikoff S. 2015. ChEC-seq kinetics discriminates transcription factor binding sites by DNA sequence and shape in vivo. Nature Communications 6:8733. doi: 10.1038/ncomms9733, PMID: 26490019

Zentner GE, Tsukiyama T, Henikoff S. 2013. ISWI and CHD chromatin remodelers bind promoters but act in gene bodies. PLoS Genetics 9:e1003317. doi: 10.1371/journal.pgen.1003317, PMID: 23468649.

酵母核についてのＣＵＴ＆ＲＵＮプロトコール：約０．７のＯＤ６００で約５×１０^８のＳ．ｃｅｒｅｖｉｓｉａｅ細胞から（Orsi et al., 2015）。核を調製するための他の方法は、同等の結果をもたらすと予想される。Ｂｉｏ−ＭａｇＰｌｕｓＣｏｎｃａｎａｖａｌｉｎＡ被覆ビーズは、Ｐｏｌｙｓｃｉｅｎｃｅｓ，Ｉｎｃ．（Ｗａｒｒｉｎｇｔｏｎ、ＰＡ、カタログ番号８６０５７）から購入することができる。消化緩衝剤（１５０ｍｌ）３ｍｌ１ＭＨＥＰＥＳｐＨ７．５２０ｍＭ３ｍｌ５ＭＮａＣｌ１００ｍＭ水で１５０ｍｌに。１ｍＭフッ化フェニルメタニルスルホニル（ＰＭＳＦ、エタノール中の１００ｍＭストック）を使用直前に添加し、添加後、氷上に保持する。ＨＮＴ洗浄緩衝剤（１００ｍｌ）１００ｍｌ消化緩衝剤１００ｍＬＴｗｅｅｎ２００．１％１ｍＭＰＭＳＦ使用直前に（＝ＨＮＴ−Ｐｉ）。ビーズを調製するために。ＨＮＴ＋＋＝ＨＮＴ＋１ｍＭＣａＣｌ_２、＋１ｍＭＭｎＣｌ_２。Ｃａ^＋＋およびＭｎ^＋＋は、レクチンを活性化するために必要である。製造業者は、１ｍＭＭｇＣｌ_２も推奨するが、これは、ＤＮＡ分解を引き起こすことがあり、ＭｇＣｌ_２を含めなくても、透過処理した核のビーズへの結合に影響しなかった。ＨＮＴ−ＰＰｉブロッキング緩衝剤（２０ｍｌ）：２０ｍｌＨＮＴ洗浄緩衝剤６７ｍＬ３０％ＢＳＡ０．１％２ｍｉｎｉ−ＣｏｍｐｌｅｔｅＵｌｔｒａ（Ｒｏｃｈｅ）プロテアーゼ阻害剤タブレット１ｍＭＰＭＳＦ使用直前にＨＮＴ−プレブロック（１ｍｌ当たり）９００ｍＬＨＮＴ−ＰＰｉ１００ｍＬ３０％ＢＳＡ３％４ｍＬ０．５ＭＥＤＴＡ２ｍＭ１ｍＭＰＭＳＦ使用直前に２ＸＳＴＯＰ（１０ｍｌ）４００ｍｌ５ＭＮａＣｌ２００ｍＭ４００ｍＬ０．５ＭＥＤＴＡ２０ｍＭ２００ｍＬ０．２ＭＥＧＴＡ４ｍＭ＋５０ｍＬＴｈｅｒｍｏＲＮａｓｅＡ（１０ｍｇ／ｍｌ）５０ｍｇ／ｍｌ＋２０ｍＬグリコーゲン（２０ｍｇ／ｍｌ）４０＿ｇ／ｍｌ水で１０ｍｌに。スパイクインについては、約１０ｐｇ／ｍｌのスパイクインＤＮＡ（例えば、ホルムアルデヒド架橋ショウジョウバエＳ２細胞のＭＮａｓｅ消化からのモノヌクレオソームサイズの断片）を添加する。１ＸＳＴＯＰ（１０ｍｌ）２００ｍｌ５ＭＮａＣｌ１００ｍＭ２００ｍＬ０．５ＭＥＤＴＡ１０ｍＭ１００ｍＬ０．２ＭＥＧＴＡ２ｍＭ水で１０ｍｌに。

手順：

プレブロッキング：１ｍｌＨＮＴ−プレブロックを穏やかなピペット操作で添加する。５分静置させ、次いで、磁気スタンド上に配置し、上清を吸引除去し、次のステップに続ける。抗体結合：１ｍｌのブロッキング緩衝剤（０．１％ＢＳＡを伴うＨＮＴ−ＰＰｉ）中で５分間ブロッキングする。磁気スタンド上に配置し、上清を吸引除去し、５００ｍＬのブロッキング緩衝剤に懸濁する。穏やかにボルテックスしながら、５００ｍＬの抗ＦＬＡＧ（５ｍＬのＳｉｇｍａＭ２マウス抗ＦＬＡＧ抗体を含有する−最終１：２００）を添加する。ローターを用いて２時間、４℃でインキュベートする。回転させ、１ｍｌのＨＮＴ−Ｐｉ洗浄緩衝剤で１回洗浄する。

二次抗体結合（必要に応じた）：マウスモノクローナル抗体を使用した場合、ｐＡ−ＭＮ結合の高い特異度を得るためにウサギ抗マウス二次抗体（例えば、Ａｂｃａｍａｂ４６５４０）が必要である。二次抗体の使用は、切断速度を１〜２桁増幅する。１時間インキュベートすることを除いてステップ３と同じ手順に従う。

ｐＡ−ＭＮを結合させる：上清を吸引除去し、５００ｍＬのブロッキング緩衝剤に懸濁する。ボルテックスしながら、５ｍＬのｐＡ−ＭＮ（６００ｍｇ／ｍｌ）を含有する５００ｍＬのブロッキング緩衝剤を添加する。ローテーターを用いて１時間、４℃でインキュベートする。回転させ、１ｍｌのＨＮＴ−Ｐｉ洗浄緩衝剤で２回洗浄する。

消化：デカントし、１ｍｌの消化緩衝剤で１回洗浄し、１．２ｍｌの消化緩衝剤に懸濁し、各々を８×１５０ｍＬの時点用アリコートに分割し、直接、管の底部に配置する。氷水中の１．７ｍｌ管に適したブロック上で０℃で平衡させる。３ｍＬの１００ｍＭＣａＣｌ_２（２ｍＭまで）を各々の管の側面に滴下する。タイムコースを得るために、管をボルテックスすることおよび氷水ホルダー内に再配置することにより、消化を開始する。１５０ｍＬの２ＸＳＴＯＰの添加（必要に応じて、スパイクインＤＮＡを添加して）により停止させる。全ＤＮＡ抽出について：３ｍＬの１０％ＳＤＳ（０．１％まで）、および２．５ｍＬのプロテイナーゼＫ（２０ｍｇ／ｍｌ）を試料に添加し、ボルテックスする。７０℃で１０分間、混合のために時折反転させてインキュベートする。（ホルムアルデヒド架橋細胞についは、４時間、６５℃でインキュベートして、架橋を逆行させる）。３００ｍＬのフェノール−クロロホルム−イソアミルと混合し、回転させ（５分１３ｋｒｐｍ）、新たな管にデカントする。１／２体積（１５０ｍＬ）ＡＭＰｕｒｅビーズを添加し、よく混合する。１０分静置させ、磁気スタンド上に配置する。上清を新たな管に移して残存ビーズを除去し、次いで、上清を１ｍｌのエタノールで沈殿させ、冷却し、回転させる。１ｍｌの１００％エタノールで洗浄し、ライブラリー調製のために２５ｍＬの０．１×ＴＥ８に懸濁する。クロマチン関連複合体について：全ＤＮＡ抽出手順に従う。ＨＭＴ、消化およびＳＴＯＰ緩衝剤に０．５ｍＭスペルミジンを含める。塩分画について：消化スラリーの体積を１５０ｍＬから５０ｍＬに低減させ、２ＸＳＴＯＰ（この場合、４ＭＮａＣｌで２００ｍＭＮａＣｌを置換し、ＲＮａｓｅを省く）で反応を停止させる。３７℃でのインキュベーション後、水中の２００ｍＬのＲＮａｓｅ（１００ｍｇ／ｍｌ）を添加し、２０分、３７℃でインキュベートし、次いで、５分の１３，０００ｒｐｍ回転を続けて上清をペレットから分離する。

切り出された断片の単離：インキュベート（３７℃ ２０分）する。回転させ（５分１３，０００ｒｐｍ４℃）、磁気スタンド上に配置し、新たな管へ上清を吸引除去する。ビーズペレットを３００ｍＬの１ＸＳＴＯＰ（ＲＮａｓｅもグリコーゲンもなし）に懸濁する。３ｍＬの１０％ＳＤＳ（０．１％まで）を添加し、ボルテックスし、２．５ｍＬのプロテイナーゼＫ（２０ｍｇ／ｍｌ）を試料に添加する。７０℃で１０分間、混合のために時折反転させてインキュベートする。

ライブラリー用の上清ＤＮＡを抽出する：３００ｍＬのフェノール−クロロホルム−イソアミルアルコールと混合し、フェーズロック管に移し、回転させ、次いで、３００ｍＬのクロロホルムで抽出する。新たな管へと除去し、この管には添加の前に２ｍＬの２ｍｇ／ｍｌのグリコーゲンが入っている。７５０ｍＬのエタノールを添加し、冷却し、回転させる。ペレットを１ｍｌの１００％エタノールで洗浄し、空気乾燥させ、２５ｍＬの０．１×ＴＥ８に溶解する。ＤＮＡの一部は、約１％ほどの高分子量ＤＮＡを示し、このＤＮＡは、可溶化することになるが、ライブラリー調製中に感知できるほど増幅しないであろう。

ゲル分析用のペレット画分を抽出する（必要に応じた）：３００ｍＬのフェノール−クロロホルム−イソアミルアルコールと混合し、回転させ（５分１３，０００ｒｐｍ）、約５分間、磁気スタンド上に置き、吸引除去する。水性層を新たな管へと除去し、この管には添加の前に２ｍＬの２ｍｇ／ｍｌのグリコーゲンが入っている。７５０ｍＬのエタノールを添加し、冷却し、回転させる。ペレットを１ｍｌの１００％エタノールで洗浄し、空気乾燥させ、２５ｍＬの０．１×ＴＥ８に溶解し、次いで遠心分離（１０分１３ｋｒｐｍ）して、ビーズから外れた不溶性褐色材料の大部分をペレット化する。プロトコールを使用して、ヒトＫ５６２細胞においてＣＴＣＦ、Ｍｙｃ、ＭａｘおよびＨ３Ｋ２７ｍｅ３をマッピングした。非常に低いバックグラウンドが観察された。このプロトコールは、無傷核から反応体積へと「浸出する」、カットされたクロマチン断片に依存する。無傷核を実験の最後に遠心沈降させ、上清画分からＤＮＡを抽出する。これは、遊離したクロマチン断片を単離し、したがって、さらなるサイズ選択を必要としない。このプロトコールは、各々のステップで核を単離するために遠心分離（６００ｇ；３分：スイングバケットローター）またはコンカナバリンＡ被覆磁気ビーズ（ＢｉｏＭａｇＰｌｕｓ＃８６０５７）のどちらかを使用し得る。

典型的な実験試料：（１反応当たり１０×１０^６細胞）：ｉ．抗体なし；遊離ｐＡ−ＭＮａｓｅ（すなわち、ＰＡ−ＭＮａｓｅが洗浄除去されない）；ｉｉ．抗体なし＋ｐＡ−ＭＮａｓｅ（バックグラウンドＭＮａｓｅ活性についての対照）；ｉｉｉ．抗体＋ｐＡ−ＭＮａｓｅ（実験試料）。本発明者らは、ＣａＣｌ_２添加前の少量のＱＣ試料（「インプット」）および反応を停止させた後の少量のＱＣ試料（「エンド」）を利用して、分画の前にＭＮａｓｅ反応がどれ程進行したのかをアッセイする。プロテアーゼ阻害剤（Ｒｏｃｈｅ完全ＥＤＴＡ不含）を５０×ストックから１×の最終濃度で緩衝剤に添加する。

１．必要に応じた：ビーズを調製する（１０×１０^６当たり５０ｍｌのビーズを使用する）。３体積の結合緩衝剤で３回洗浄する。１体積の結合緩衝剤に再懸濁させる。

２．細胞を収集する；６００ｇで３分、スイングバケットローターで遠心沈降させる（典型的には１試料当たり１０，０００，０００細胞）。

３．穏やかなピペット操作によって１ｍｌの冷リン酸緩衝食塩水（１０，０００，０００細胞より多い場合はスケールアップする）に再懸濁させることにより、細胞を洗浄する。上記のとおり遠心沈降させる。

４．穏やかなピペット操作により細胞を１ｍｌのＮＥ１（１０，０００，０００細胞より多い場合はスケールアップする）に再懸濁させる。１０分間、氷の上に置く。

磁気ビーズ：上記のとおり遠心沈降させ、ＮＥ１に再懸濁させる。穏やかにピペット操作で、ビーズを、再懸濁させた核に直接添加する。室温で混合プラットフォームで５分。磁石と約２分結合させ、上清を廃棄するか、または遠心分離：核を６００ｇで３分、スイングバケットローターでペレット化する。

５．穏やかなピペット操作により１．７ｍｌのＣＵＴ＆ＲＵＮ緩衝剤１に再懸濁させ、１．７ｍｌエッペンドルフ管に移す。氷上に５分間置く。上記のように磁石または遠心分離によって核を収集する。

６．穏やかなピペット操作により１．５ｍｌのＣＵＴ＆ＲＵＮ緩衝剤２に再懸濁させる。上記のように磁石または遠心分離によって核を収集する。

７．穏やかなピペット操作によりＣＵＴ＆ＲＵＮ緩衝剤２に再懸濁させる。０．５ｍｌエッペンドルフ管の中で５００ｍｌ体積の１０，０００，０００細胞を使用する。必要に応じて二次抗体を含む、抗体を添加する。２時間、４℃の混合プラットフォーム上に置く（０．５ｍｌ管は、遠心分離のためより密なペレットを生じさせ、インキュベーション中の液体のスロッシングを低減させて核の完全性を維持する）。

８．４℃の混合プラットフォーム上で５００ｍｌのＣＵＴ＆ＲＵＮ緩衝剤２での５分の洗浄３回。上記のように磁石または遠心分離によって核を収集する。

９．３００ｍｌのＣＵＴ＆ＲＵＮ緩衝剤２に再懸濁させる。３ｍｇのプロテインＡ−ＭＮａｓｅ融合体（６００ｎｇ／ｍｌで５ｍｌ、または３６０ｎｇ／ｍｌで８．３ｍｌ）を添加する。１時間、４℃の混合プラットフォーム上に置く（３００ｍｌの反応体積は、１．７ｍｌ管の中での上清画分の容易な抽出／ＥｔＯＨｐｐｔを可能にする）。

１０．４℃の混合プラットフォーム上で３００ｍｌのＣＵＴ＆ＲＵＮ緩衝剤２での５分の洗浄３回。遊離ＭＮａｓｅ試料についてはしない（混合プラットフォーム上に保持する）。上記のように磁石または遠心分離によって核を収集する。

１１．３００ｍｌのＣＵＴ＆ＲＵＮ緩衝剤２に再懸濁させる。１２ｍｌを「インプット」として採取し、２８８ｍＬのＤＮＡ抽出緩衝剤に入れる。

１２．管を湿潤氷に入れる（消化を０℃で行うことが不可欠である−好ましくは、アルミニウムブロックを使用して温度を維持する）。ＣａＣｌ_２を２ｍＭの最終の濃度（６ｍｌの１００ｍＭＣａＣｌ_２）まで添加する。反転させることにより迅速に混合し、湿潤氷上に置く。所望される時間（例えば、１５分）インキュベートする。通常は、遊離ＭＮａｓｅ試料を３７℃で５分置く。これによって、消化をアガロースゲル電気泳動により評価することが可能になる。

１３．１０ｍＭまでのＥＤＴＡと２０ｍＭまでのＥＧＴＡのマスターミックスを添加することにより停止させる。反転させることにより迅速に混合し、氷上に置く。１２ｍｌを「エンド」として採取し、２８８ｍＬのＤＮＡ抽出緩衝剤に入れる。選択肢：スパイクインＤＮＡを添加する。

選択肢Ａ

１４．１時間、４℃の混合プラットフォーム上に置いて、クロマチン画分を浸出させる。６００ｇ３分ＳＷローターで（たとえ、磁気ビーズアプローチを使用する場合であっても）遠心沈降させる。上清を採取する。

１５．３ｍｌの１０％ＳＤＳ（最終濃度０．１％）、１０ｍｇ／ｍｌでの５ｍｌのプロテイナーゼＫ、１ｍｇ／ｍｌでの２ｍｌのＲＮａｓｅＡ、および５ｍｌの５ＭＮａＣｌ（最終濃度３００ｍＭ）を添加することにより、上清からＤＮＡを抽出する。ボルテックスし、１時間、５５℃で置く。フェノール抽出し、ＥｔＯＨ沈殿させ（１ｍｌグリコーゲンを添加して）、ＥｔＯＨ洗浄する。２０ｍｌのＨ２Ｏに再懸濁させる。

選択肢Ｂ

１４．全てのＤＮＡを抽出し、次いで、非常に簡易なサイズ選択を使用して、ゲノムのカットされていない大きい断片を小さいフットプリントから分離する。これは、核膜孔を通って拡散できない可能性がある、大きい、潜在的に不溶性のタンパク質複合体にとって有利であり得る。

全反応からＤＮＡを抽出する：３ｍｌの１０％ＳＤＳ（最終濃度０．１％）、１０ｍｇ／ｍｌでの５ｍｌのプロテイナーゼＫ、１ｍｇ／ｍｌでの２ｍｌのＲＮａｓｅＡ、および５ｍｌの５ＭＮａＣｌ（最終濃度３００ｍＭ）。ボルテックスし、１時間、５５℃で置く。フェノール抽出し、次いで、ＥｔＯＨ沈殿させ（１ｍｌグリコーゲンを添加して）、ＥｔＯＨ洗浄、１５０ｍｌのＨ２Ｏに再懸濁させる。

１５．ＢｅｃｋｍａｎｎＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰビーズ（Ａ６３８８１）を使用するカットされた断片（＿約７００ｂｐ）のサイズ選択
使用前にビーズを放置して室温に温める；
７５ｍｌのビーズを添加し、ピペット操作１０回により混合する；
室温で５分間インキュベートする；
２分間、磁石の上に置く；
上清画分を採取する（ビーズに結合したいかなる高ＭＷＤＮＡも採取しないことが不可欠であり、上清画分を遠心沈降させてビーズについてチェックすることができる）。
７００ｍｌのＥｔＯＨおよび１ｍｌのグリコーゲンを添加することにより沈殿させる（必要とされる追加の塩なし）；
７０％ＥｔＯＨ洗浄する；
２０ｍｌのＨ_２Ｏに再懸濁させる。
緩衝剤：
水中の５０×ストックからの１×に添加したプロテアーゼ阻害剤（Ｒｏｃｈｅ完全ＥＤＴＡ不含）
結合緩衝剤
１×ＰＢＳ；
１ｍＭＣａＣｌ_２；
１ｍＭＭｇＣｌ_２；
１ｍＭＭｎＣｌ_２；
ＮＢ：本発明者らは、一部の細胞中のヌクレアーゼがＤＮＡのＭｇ＋＋依存性分解を引き起こすことを見出した。結合緩衝剤中のＭｇ＋＋の存在は製造業者の推奨に従うものであるが、レクチンを活性化するためにＣａ＋＋およびＭｎ＋＋しか必要としない。ＭｇＣｌ_２を含めなくても、透過処理した細胞のビーズへの結合に影響しなかった。
ＮＥ１：
２０ｍＭＨｅｐｅｓ−ＫＯＨｐＨ７．９；
１０ｍＭＫＣｌ；
１ｍＭＭｇＣｌ_２；
０．１％ＴｒｉｔｏｎＸ−１００；および
２０％グリセロール。
ＮＢ：本発明者らは、０．５ｍＭスペルミジンでの１ｍＭＭｇＣｌ_２の置換を使用してＭｇ^＋＋依存性ＤＮＡ分解を回避することができることを見出す。
ＣＵＴ＆ＲＵＮ緩衝剤１：
２０ｍＭＨｅｐｅｓｐＨ７．５；
１５０ｍＭＮａＣｌ；
２ｍＭＥＤＴＡ；
０．５ｍＭスペルミジン；
０．１％ＢＳＡ。
ＣＵＴ＆ＲＵＮ緩衝剤２：
２０ｍＭＨｅｐｅｓｐＨ７．５；
１５０ｍＭＮａＣｌ；
０．５ｍＭスペルミジン；
０．１％ＢＳＡ。
他の試薬：
１００ｍＭＣａＣｌ_２；
１０％ＳＤＳ；
５ＭＮａＣｌ；
５００ｍＭＥＤＴＡ；
プロテイナーゼＫ；
５００ｍＭＥＧＴＡ；
ＲＮａｓｅＡ；
抽出緩衝剤。
１２ｍｌのＱＣ試料についてのＤＮＡ抽出を以下のプロトコールの間に行う：
フェノール抽出する；
エタノール沈殿させる；
エタノール洗浄する；
２０ｍＬのＨ_２Ｏに再懸濁させる；
ＲＮａｓｅ処置する；
０．７％アガロースゲルで電気泳動する。

（実施例２）

標的下切断およびヌクレアーゼを使用した放出（ＣＵＴ＆ＲＵＮ）は、ミクロコッカスヌクレアーゼによる抗体標的化制御切断が、ペアードエンドＤＮＡシーケンシングのための特異的タンパク質−ＤＮＡ複合体を上清に放出させるエピゲノムプロファイリング戦略である。標的断片のみが溶液中に入り、ＤＮＡの圧倒的多数が取り残されるので、ＣＵＴ＆ＲＵＮは、並外れて低いバックグラウンドレベルを有する。ＣＵＴ＆ＲＵＮは、最も広く使用されているクロマチン免疫沈降（ＣｈＩＰ）プロトコールより、分解能、シグナル対ノイズおよび必要とされるシーケンシング深度の点で優れている。ＣｈＩＰとは対照的に、ＣＵＴ＆ＲＵＮは、溶解度およびＤＮＡ接近可能性アーチファクトがなく、不溶性クロマチンをプロファイリングするために、および架橋なしで長距離３Ｄ接触を検出するために使用され得る。ここで、本発明者らは、核の単離を必要とせず、ヒストン修飾については１００細胞および転写因子については１０００細胞のみから出発して高品質データを提供する、改良ＣＵＴ＆ＲＵＮプロトコールを提示する。細胞から精製ＤＮＡまで、ＣＵＴ＆ＲＵＮは、ラボラトリーベンチで１日未満しか必要としない。

序論

プロトコールの開発

多細胞生物の全ての細胞は、同じゲノム配列を有するが、異なる遺伝子発現パターンが組織特定を支えている。遺伝子発現の差異は、転写因子（ＴＦ）の結合、およびヌクレオソームを修飾して可動化するクロマチン関連複合体のそれらの動員から生じる。結果として、ＴＦ、クロマチン関連複合体、ならびにヒストンバリアントおよび翻訳後修飾（ＰＴＭ）を含むクロマチン状態のゲノムワイドなマッピングが、研究の大きな焦点となってきた。３０年より長きにわたって、クロマチン免疫沈降（ＣｈＩＰ）は、タンパク質−ＤＮＡ相互作用をマッピングするための主な方法となっている。ＣｈＩＰでは、細胞をホルムアルデヒドで架橋させ、次いで、全細胞内容物を可溶化してクロマチン線維を断片化し、抗体を添加して目的のクロマチン断片を単離する。ＣｈＩＰについてのリードアウト戦略は、ゲル電気泳動^１から大規模並行シーケンシング^２、３へと３０年かけて進化したが、ＣｈＩＰの基礎は、依然としてほとんど変わっていない。ＣｈＩＰ−ｓｅｑは、ＴＦの塩基対レベルでの分解能のマッピングを可能にする^４、５が、感度を制限する高いバックグラウンド、多数の細胞の要求、ならびに架橋および可溶化に起因するアーチファクトに関する問題が、いまだにある^６〜１０。ＣｈＩＰとは異なる原理に基づく代替方法なしで、真陽性を偽陽性アーチファクトのミスリードと区別することは困難であった。ＣｈＩＰのこれらの制限の一部に対処することができる代替戦略が、タンパク質−ＤＮＡ相互作用のゲノムワイドマッピングに使用されてきた。例えば、ＤＮａｓｅ１フットプリント法（footpinting）^１１、ＦＡＩＲＥ−ｓｅｑ^１２、Ｓｏｎｏ−ｓｅｑ^１３、ＭＮａｓｅ−ｓｅｑ^{１４、１５}およびＡＴＡＣ−ｓｅｑ^１６を含む、いくつかの方法が、シーケンシングリードアウトを使用してゲノムワイドにＴＦ結合をマッピングするために使用されている。しかし、これらのアプローチは、特定のタンパク質に標的化されないので、いずれか１つのＴＦに特異的なものではない。さらに、それらを使用して、健常状態と病状を臨床的に区別するために使用することができる特定のクロマチン状態、例えば、ヒストンＰＴＭにより画定されるものを、マッピングすることができない^１７。他の方法は、ＤａｍＩＤの場合は目的のタンパク質と周囲のＤＮＡをメチル化する酵素との融合体を遺伝子操作により作製すること^１８により、またはクロマチン内因性切断（ＣｈＥＣ）の場合はタンパク質のフットプリントの標的切断^１９により、標的特異的マッピングを提供する。酵素繋留アプローチは、クロマチンを断片化および可溶化する必要なく、ｉｎｖｉｖｏ（ＤａｍＩＤ）またはｉｎｓｉｔｕ（ＣｈＥＣ）で行われる。しかし、それらはトランスジェニックアプローチを必要とするので、この必要により、ＥＮＣＯＤＥなどの大きい基礎構造コンソーシアムへの拡張性、および臨床の場への移行性が制限される。加えて、これらの方法は、ヒストンＰＴＭをマッピングすることができない。これらの制限は、架橋された細胞からの粗核を先ずＴＦ特異的抗体で処置し、次いで、カルシウムイオンにより活性化され得る、プロテインＡとミクロコッカスヌクレアーゼとの融合タンパク質（ｐＡ−ＭＮ）で処置する、クロマチン免疫切断（ＣｈＩＣ）法によって、ある程度、克服された^１９。しかし、ＣｈＩＣは、サザンブロットリードアウトを使用して開発されたため、ゲノムワイドなプロファイリングへのその適用性は、１０年より長きにわたって不明確なままである。本発明者らは、最近、ＣｈＩＣ戦略を開発し、本発明者らは、これをＣＵＴ＆ＲＵＮ（標的下切断およびヌクレアーゼを使用した放出；図２４）^２０と名付けた。開示するプロトコールは、簡易な取扱いを可能にするために、未固定の核を利用し、コンカナバリンＡ被覆磁気ビーズを使用してそれらを固体支持体に結合させた。抗体およびｐＡ−ＭＮをｉｎｓｉｔｕで標的タンパク質と特異的に結合させた後、０℃でカルシウムへの曝露から数秒後、ＴＦの片側で切断が起こった。非架橋核を使用したので、２カットで放出された切断断片は核外へ自由に拡散し、そのため、無傷核の簡易なペレット化により、放出されたクロマチン断片を含有する上清を使用してシーケンシング用のＤＮＡを直接抽出した。０℃でＣａ^２＋依存性消化反応を行うことは、切断されたクロマチン複合体の拡散を制限するために必須であり、そうしなければ、接近可能なＤＮＡを切断して放出することになることを、発見した。全体的としては、ＣＵＴ＆ＲＵＮは、架橋ＣｈＩＰ−ｓｅｑよりはるかに高いシグナル対ノイズ比を有することによって、以前には不明であったゲノムの特徴の同定を可能にすることが明らかになった。ＣＵＴ＆ＲＵＮは、哺乳動物ＴＦの塩基対分解能をたった１０，０００，０００のシーケンシングされたリードで達成した。

タンパク質−ＤＮＡ相互作用の定量的マッピングの必要性が、ますます明らかになってきた^２１。しかし、クロマチンのゲノムワイドな可溶化と免疫沈降とを伴うＣｈＩＰの複雑さのため、抗体交差反応性を有する異なる種からの固定数の細胞がスパイクインされる込み入った定量戦略が必要とされる^２２。保存エピトープの要求は、一般的適用性を制限する。対照的に、ＣＵＴ＆ＲＵＮの固有の簡易性のため、結合事象を正確に定量するために、異種ＤＮＡを用いる単純なスパイクイン戦略で十分であった。まとめると、ＣＵＴ＆ＲＵＮには、ＣｈＩＰ−ｓｅｑに比べていくつかの利点がある：（１）この方法は、非架橋細胞においてｉｎｓｉｔｕで行われ、クロマチンの断片化も可溶化も必要としない；（２）本質的に低いバックグラウンドが、ＣｈＩＰでは読み取れない低いシーケンシング深度（sequence depth）および少ないシグナルゲノム特徴の同定を可能にする；（３）この簡易な手順は、１日以内に完了することができ、ロボットによる自動化に好適である；（４）この方法を既存の方法論と比較して少ない細胞数で使用することができる；（５）簡易なスパイクイン戦略をタンパク質−ＤＮＡ相互作用の正確な定量に使用することができる。しかるが故に、ＣＵＴ＆ＲＵＮは、生物学的研究において最も評判のよい方法の１つであるＣｈＩＰｓｅｑの魅力的な代替となる。

実験計画

クロマチン複合体のｉｎｓｉｔｕでの標的切断および放出のためのＣＵＴ＆ＲＵＮ法は、単純であり、標準的な実験室装置を使用して１日未満で完了することができる。詳細なプロトコール、およびこのプロトコールを特定の状況に合せるために使用され得る様々な選択肢を本明細書で提供する。ＣＵＴ＆ＲＵＮの強みの１つは、抗体およびｐＡ−ＭＮが核内に自由に拡散する反応全体をｉｎｓｉｔｕで行うことである。元々のプロトコールは、低張溶解とＴｒｉｔｏｎＸ−１００での細胞の処置との組合せにより調製した核を使用した。これは、いくつかの細胞系で成功したが、本発明者らは、最近、このプロトコールを、ＣｈＥＣ−ｓｅｑ^２３およびＡＴＡＣ−ｓｅｑ^２４を含む他のｉｎｓｉｔｕ法において使用に成功している非イオン性界面活性剤ジギトニンにより透過処理された細胞を使用するように構成した。ジギトニンは、膜に分配され、コレステロールを抽出する。コレステロールを欠いている膜は、ジギトニンによる影響をほとんど受けない^{２５、２６}。核膜は、原形質膜と比較してコレステロールを相対的に欠いている。しかるが故に、ジギトニンでの細胞の処置は、核の完全性を損なうことなく細胞を透過処理するロバストな方法に相当する^２６。ここに記載するプロトコールはジギトニンを使用するが、個々の実験状況が他の手段による無傷核の生成を要求する可能性があり、そのような核を好適な方法により調製し、コンカナバリンＡ被覆ビーズに結合させ、その後、下記のプロトコールのステップ１０に入ることができる^２０。本質的に低いバックグラウンドを有し、少ない細胞数に適用可能である、プロトコールの制限の１つは、回収されるＤＮＡの量が非常に少なく、したがって、高感度キャピラリー電気泳動またはピコグリーンアッセイ（例えば、ＡｇｉｌｅｎｔＴａｐｅｓｔａｔｉｏｎおよびＱｕｂｉｔ）による分析であっても、分析に問題があることである。加えて、約５０ｂｐのＰＣＲアンプリコンを設計することが一般に可能でないので、最小のフットプリントを切断する高分解能マッピング技法は、公知の結合遺伝子座のＰＣＲに基づく分析には適さない。しかるが故に、存在量の多いエピトープを標的とする陽性対照抗体であって、それ故、ＤＮＡを容易に検出することができる陽性対照抗体を使用することを推奨する。Ｈ３Ｋ２７ｍｅ３に対して産生されたウサギモノクローナル抗体は、使用に成功しており、キャピラリー電気泳動は、切断された断片の量に関して出発細胞の数に比例することを示す。ヌクレオソームラダーは、Ｔａｐｅｓｔａｔｉｏｎまたは他の高感度電気泳動分析法によって予想され（図２５）、モノクローナル抗体の使用は、トラブルシューティングを複雑にし得る潜在的ロット間変動を回避する。ＣＴＣＦなどの存在量の少ないエピトープについては、切断された断片を検出することが、高感度電気泳動分析法によっても、より困難である（図２６）。予想される消化ＤＮＡパターンが、Ｈ３Ｋ３７ｍｅ３などの陽性対照についてキャピラリー電気泳動により観察されれば、この試料をシーケンシングする必要はない。陰性対照としては、配列バイアスのない低効率でクロマチンをランダムに被覆することになる非特異的ウサギＩｇＧ抗体の使用を推奨する。繋留の欠如は、ｐＡ−ＭＮのわずかなキャリーオーバーが、非常に接近しやすいＤＮＡの優先的断片化を生じさせる結果となる可能性を増大させるので、抗体なし対照は、推奨しない。標的切断は、Ｃａ^２＋イオンを添加して数秒以内に起こることが明らかになり、立体的に調節された繋留型反応のおかげで、切断パターンは経時的に一定していた。しかし、消化時間が長いほど、シグナル対ノイズ比の明らかな変化を伴わずに多くの材料が放出される（図２７）。それ故、エピトープ存在量および抗体濃度に基づいて合せることができる出発点として、３０分間消化することを推奨する。方法ＣＵＴ＆ＲＵＮの適用には、全てのＣｈＩＰに基づく適用の代替となる可能性がある。ＣｈＩＰ−ｓｅｑが現在使用されている典型的な研究プロジェクトについて、ＣＵＴ＆ＲＵＮへの移行を効率的に行うことができる。大部分の分子生物学研究室に既に存在する標準的な装置を使用してベンチトップでＣＵＴ＆ＲＵＮを全面的に行うことができるからである。さらに、ＣＵＴ＆ＲＵＮは、磁気ビーズ、被覆プレートまたはスライドガラスなどの、固体支持体に容易に結合させることができる透過処理された細胞においてｉｎｓｉｔｕで行われるので、この方法は、細胞からシーケンシングライブラリーへのハイスループットを可能にするロボット工学へ容易に移行するであろう。ＣＵＴ＆ＲＵＮからロボット工学へは、ＣｈＩＰ−ｓｅｑについての場合より単純であるはずである。ＣＵＴ＆ＲＵＮは、超音波処理装置などの装置も、自動化が困難である不溶性材料を除去するための高速回転ステップも、必要としないからである。標準的な架橋ＣｈＩＰプロトコールは、蛍光活性化細胞選別もしくは解離後にまたは臨床の場で得られることが多い、少ない細胞数には適さない。この制限を踏まえて、ＡＴＡＣ−ｓｅｑは、下は５０００個に至る細胞を使用している^２４。しかし、ＡＴＡＣ−ｓｅｑは、クロマチンの接近可能な領域にあるＴＦの非特異的同定に限定され、ヒストンＰＴＭにより画定されるクロマチン状態を区別することができない。低効率につながる架橋ＣｈＩＰにおけるエピトープマスキングの問題は、ＴＦには適用されなかったが存在量の多いヌクレオソームエピトープについて５０００ほどの少ない細胞で高品質データを提供することが示されたネイティブＣｈＩＰ戦略^２７を使用することにより、軽減することができる。ここで、ＣＵＴ＆ＲＵＮは、Ｈ３Ｋ２７ｍｅ３をプロファイリングするために１００細胞への適用、またはＣＴＣＦ配列特異的ＤＮＡ結合タンパク質のための１０００細胞への適用に好適であることを示す。それ故、ＣＵＴ＆ＲＵＮは、希少な細胞型についてのタンパク質−ＤＮＡ相互作用の標的化されたゲノムワイドなマッピングを可能にする。単一細胞ゲノム分析の最近の進歩は、スプリットプールバーコーディングを使用して多数の個々の無傷細胞を一意的に標識し、個々の単離細胞上での反応を行う必要が全くない、単一細胞コンビナトリアルインデキシング（「ｓｃｉ」）である。このアプローチは、単一細胞においてトランスクリプトーム^２８、クロマチン接近可能性（ｓｃｉ−ＡＴＡＣ−ｓｅｑ^２９）、および３Ｄ相互作用（ｓｃｉ−Ｈｉ−Ｃ^３０）をプロファイリングするための使用に成功している。ＣｈＩＰとは異なり、ＣＵＴ＆ＲＵＮは、無傷の透過処理された細胞内で行われ、それ故、単一細胞エピトープ特異的エピゲノムランドスケープをマッピングするためのコンビナトリアルバーコーディングに適用可能である。このプロトコールのさらなる開発は、タンパク質複合体内のサブユニットの占有をマッピングするための逐次的ＣｈＩＰの代替を含む。逐次的ＣｈＩＰ−ｓｅｑは、通常は困難であり、第２の免疫沈降ステップ後の非常に低い収量のため、存在量の多いクロマチン複合体にしか適さない。しかし、ＣＵＴ＆ＲＵＮを最初に行うことにより、高効率で上清に遊離される切断されたクロマチン複合体を二次抗体で免疫沈降することができた。この応用により、ゲノムワイドなクロマチン複合体の組成分析およびマッピングが可能になる。ｉｎｓｉｔｕでの切断アプローチであるＣＵＴ＆ＲＵＮおよびクロマチン線維の固有の柔軟性のおかげで、隣接ヌクレオソームおよび３Ｄ接触を含む局所的クロマチン構造を探索することが可能であることが明らかになった。３Ｄ核構成のゲノムワイドなマッピングのための評判のよい技術であるＨｉ−Ｃ、ＣｈＩＡ−ＰＥＴおよびＨｉ−ＣｈＩＰは、タンパク質間相互作用を安定させるためにホルムアルデヒド架橋に頼る^{３１〜３３}。しかるが故に、非常に大きい核構造が架橋され得るので、これらの技法には正のゲノム相互作用をマッピングするための形式的距離拘束がない。対照的に、ＴＳＡ−ｓｅｑ^３４およびゲノムの編成状態のマッピング^３５には距離拘束があり、それ故、反応種の限定拡散または細胞の凍結切片作製のどちらかによって細胞学的距離を測定する。同様に、ＣＵＴ＆ＲＵＮでは、プロテインＡ−ＭＮａｓｅのリーチにより、切断が起こり得るエピトープからの距離に対して、したがって、２つの相互作用ＤＮＡ遺伝子座をそれらの一方への繋留により切断するために必要なそれらの近接度に対して、固有の制限が課される。ＣＵＴ＆ＲＵＮと近接に基づくライゲーション法とを組み合わせることにより、核内構造の因子特異的高分解能マップを生成することが可能である。他の新規応用も構想することができる。抗体が利用できるいずれのエピトープも、ＣＵＴ＆ＲＵＮを使用するプロファイリングに供することができる可能性があり、ｌｎｃＲＮＡのＣＵＴ＆ＲＵＮｉｎｓｉｔｕマッピングは、ＤＲＩＰ−ｓｅｑ^３６の魅力的な代替であるように思われる。加えて、不溶性クロマチンをプロファイリングするＣＵＴ＆ＲＵＮの能力^２０は、ＣＵＴ＆ＲＵＮと塩分画を組み合わせることにより、エピゲノムマップを、古典的な「活性」クロマチンを定義するために伝統的に使用されてきたクロマチン溶解度^{３７〜３９}に基づくようにすることが可能になることを示す。このようにして、プロファイリングされる各々のＤＮＡ結合タンパク質またはクロマチンの特徴を、肝要な物理的特性であるその溶解度についての情報で強化することができる。塩分画をＭＮａｓｅに基づくＣｈＩＰ−ｓｅｑ^３９で行うことができるが、高濃度の塩は、複合体を破壊し、抗体結合の前にエピトープの喪失を引き起こすことがあり、これに対してＣＵＴ＆ＲＵＮでは、抗体が結合して断片が切断された後にしか塩分画を行わない。

他の方法との比較

表１は、ＣＵＴ＆ＲＵＮ、ならびにＸ−ＣｈＩＰ−ｓｅｑ^３、ＣｈＩＰ−ｅｘｏ^４およびＮＣｈＩＰ−ｓｅｑ^４０という３つのＣｈＩＰ−ｓｅｑ法についてのメトリクスを収載するものである。３つのＣｈＩＰ−ｓｅｑ法と比較して、ＣＵＴ＆ＲＵＮは、より少ない細胞およびより少ないリードを必要とし、より高いシグナル対ノイズ比を有し、断片化バイアスを有さず、より速く、定量のためのスパイクインに適している。

ＣｈＩＰに基づく技術の重要な進歩は、次世代シーケンシングを利用して、タンパク質−ＤＮＡ相互作用についての塩基対分解能のゲノムワイドなマップを生成したことであった^４１。超音波処理を使用して最低約２００ｂｐの断片にクロマチンを断片化する標準的な架橋ＣｈＩＰとは対照的に、ＣｈＩＰ−ｅｘｏでのエキソヌクレアーゼ処置または高分解能Ｘ−ＣｈＩＰ−ｓｅｑもしくはネイティブＣｈＩＰアプローチでのＭＮａｓｅ消化は、制限消化またはほぼ制限消化を可能にする^{４、５、２０、４０、４２}。しかし、架橋戦略における分解能のこの改善は、必要とされるシーケンシング深度（sequence depth）および細胞数の増加というかなりの犠牲を強いられることが多い。例えば、ＣｈＩＰ−ｅｘｏでは、標的タンパク質だけではなくそれ以上のもの、例えば、隣接するヌクレオソームを含有する、超音波処理されたあらゆる断片が、エキソヌクレアーゼが最小のＴＦフットプリントを生成する障害となり、しかるが故に、見かけの局所バックグラウンドに寄与し、その結果、高分解ピークペアをコールするための細胞数およびシーケンシング深度の増加が必要になる。ネイティブＣｈＩＰは、これらの関連する問題を被らないことが多いが、刺激の強い界面活性剤の非存在下で可溶性クロマチン抽出物を生成する必要があるため一般的適用性が限られており、したがって、安定的に結合しているタンパク質に最もよく適しており、個別的に最適化を必要とすることがある。架橋ＣｈＩＰ法に使用されるものなどの超音波処理がランダムでなく、それ故、断片化バイアスを受けることは、以前に示されている^５、４３。ＣＵＴ＆ＲＵＮは、断片化のない無傷の細胞または核を用いて行われるので、ＣＵＴ＆ＲＵＮを使用して全てのゲノム区画を探索することができる。ゲノムワイドな消化にＭＮａｓｅを使用する技術は、酵素のＡ／Ｔバイアスを被ることがあり^４４、オープンクロマチンを優先的に消化することになる。対照的に、ＣＵＴ＆ＲＵＮは、立体的に調節された切断反応を伴うものあり、本発明者らは、ＣＵＴ＆ＲＵＮが、いかなる検出可能なＡ／ＴバイアスもＤＮＡ接近可能性バイアスも被らないことを証明した^２０。

ＣｈＩＰの場合と同様に、ＣＵＴ＆ＲＵＮの成功は、大部分、その結合に使用される条件下での抗体のその標的に対する親和性および特異性に依存する。抗体は、ＣＵＴ＆ＲＵＮを使用する固体状態でそれらのエピトープと結合するため、免疫蛍光（ＩＦ）による特異性の試験に成功した抗体は、一般にＩＦが固定を伴うことを条件として、ＣＵＴ＆ＲＵＮで機能するが、ホルムアルデヒド固定は、ＣＵＴ＆ＲＵＮの効率を低下させる可能性が高い。標準ＣＵＴ＆ＲＵＮプロトコールでは、本発明者らは、切断されたクロマチン複合体を核から拡散させることによって、無傷核内に保持された未消化ゲノムを有する上清画分からのカットされたＤＮＡの簡易な単離を可能にすることを推奨する。しかし、クロマチン複合体が大きすぎて拡散することができない可能性があり、またはタンパク質間相互作用が切断された複合体を保持する可能性がある。そのような場合には、全ＤＮＡを消化後に抽出することができる。約７００ｂｐ未満の断片が選択されることになる、常磁性カルボキシル化ビーズ（例えば、ＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰビーズ）の体積を使用する非常に簡易なサイズ選択を行うことによって。この戦略は、約１ＭＤａ酵母ＲＳＣ複合体について成功する^２０。

材料

試薬

^＊細胞懸濁液。ヒトＫ５６２細胞、ショウジョウバエＳ２細胞を使用し、脳および成虫原基（imaginal disk）などのショウジョウバエ組織を切除し、酵母をスフェロプラスト化した。

^＊コンカナバリン被覆磁気ビーズ（ＢａｎｇｓＬａｂｏｒａｔｏｒｉｅｓ、カタログ番号ＢＰ５３１）

^＊目的のエピトープに対する抗体。例えば、ＣＵＴ＆ＲＵＮによる１Ｄおよび３Ｄ相互作用のマッピングのためのウサギα−ＣＴＣＦポリクローナル抗体（Ｍｉｌｌｉｐｏｒｅ０７−７２９）

^＊存在量の多いエピトープに対する陽性対照抗体、例えば、α−Ｈ３Ｋ２７ｍｅ３ウサギモノクローナル抗体（ＣｅｌｌＳｉｇｎａｌｉｎｇＴｅｃｈｎｏｌｏｇｙ、カタログ番号９７３３）

^＊非存在エピトープに対する陰性対照抗体、例えば、モルモットα−ウサギ抗体

^＊５％ジギトニン（ＥＭＤＭｉｌｌｉｐｏｒｅ、カタログ番号３００４１０）

^＊プロテインＡ−ミクロコッカスヌクレアーゼ（ｐＡ−ＭＮａｓｅ）融合タンパク質。−２０℃で保管する。

^＊スパイクインＤＮＡ（例えば要請に応じて著者らにより提供される、Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅミクロコッカスヌクレアーゼ処置クロマチンからのもの）

^＊蒸留、脱イオンまたはＲＮＡｓｅ不含Ｈ２Ｏ（ｄＨ２Ｏ、例えば、Ｐｒｏｍｅｇａ、カタログ番号Ｐ１１９７）

^＊１Ｍ塩化マンガン（ＭｎＣｌ２；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号２０３７３４）

^＊１Ｍ塩化カルシウム（ＣａＣｌ２；Ｆｉｓｈｅｒ、カタログ番号ＢＰ５１０）

^＊１Ｍ塩化カリウム（ＫＣｌ；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｐ３９１１）

^＊１Ｍヒドロキシエチルピペラジンエタンスルホン酸ｐＨ７．５（ＨＥＰＥＳ（Ｎａ＋）；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｈ３３７５）

^＊１Ｍヒドロキシエチルピペラジンエタンスルホン酸ｐＨ７．９（ＨＥＰＥＳ（Ｋ＋）；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｈ３３７５）

^＊５Ｍ塩化ナトリウム（ＮａＣｌ；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｓ５１５０−１Ｌ）

^＊０．５Ｍエチレンジアミン四酢酸（ＥＤＴＡ；ＲｅｓｅａｒｃｈＯｒｇａｎｉｃｓ、カタログ番号３００２Ｅ）

^＊０．２Ｍエチレングリコール−ビス（β−アミノエチルエーテル）−Ｎ，Ｎ，Ｎ’，Ｎ’−四酢酸（ＥＧＴＡ；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｅ３８８９）

^＊２Ｍスペルミジン（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｓ２５０１）

^＊Ｒｏｃｈｅ完全プロテアーゼ阻害剤ＥＤＴＡ不含タブレット（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号５０５６４８９００１）

^＊２ｍｇ／ｍｌのグリコーゲン（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号１０９３０１９３００１の１：１０希釈物）

^＊ＲＮａｓｅＡ、ＤＮａｓｅおよびプロテアーゼ不含（１０ｍｇ／ｍｌ；ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号ＥＮ０５３１）

^＊ゲルおよびＰＣＲクリーンアップキット（Ｍａｃｈｅｒｅｙ−ＮａｇｅｌＮｕｃｌｅｏＳｐｉｎＲ、カタログ番号７４０６０９．２５０）

^＊ＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰ磁気ビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、カタログ番号Ａ６３８８０）

^＊１０％ドデシル硫酸ナトリウム（ＳＤＳ；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｌ４５０９）

^＊プロテイナーゼＫ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号ＥＯ０４９２）

^＊フェノール−クロロホルム−イソアミルアルコール２５：２４：１（ＰＣＩ；Ｉｎｖｉｔｒｏｇｅｎ、カタログ番号１５５９３０４９）

^＊クロロホルム（Ｓｉｇｍａ、カタログ番号３６６９１９−１Ｌ）

^＊１ＭＴｒｉｓ−ＨＣｌｐＨ８．０

^＊エタノール（ＤｅｃｏｎＬａｂｓ、カタログ番号２７１６）

^＊ＱｕｂｉｔｄｓＤＮＡＨＳキット（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、カタログ番号Ｑ３２８５１）

試薬準備

５％ジギトニン：実験のための十分なジギトニンを復元するために、粉末を２ｍｌ微小遠心管に計り入れ、小型ビーカーの中の水を電子レンジで沸騰させ、ピペットに吸上げ、吐き出して１０００μＬピペットチップを加温した。ジギトニン粉末が入っている管にピペットで熱水を移して５％（ｗ／ｖ）にし、蓋を閉め、ジギトニンが完全に溶解するまでフルで迅速にボルテックスした。冷蔵した場合、このストックを１週間以内に使用することができるが、ジギトニンは徐々に沈殿するので再加熱が必要になる。ジギトニンの有効性はバッチ間で異なるため、細胞型に使用するための濃度を決定するためにトリパンブルーの透過性を試験することを推奨する。Ｋ５６２細胞について０．０２〜０．１％ジギトニンで優れた結果を得た。

ジギトニンは毒性であり、特に粉末を計量するときには注意を払うべきである。ジギトニンストックは、ジメチルスルホキシド（ＤＭＳＯ）に溶解することにより調製してもよいが、ＤＭＳＯが皮膚を通して吸収され得ることに注意されたい。

結合緩衝剤：４００μＬの１ＭＨＥＰＥＳ−ＫＯＨｐＨ７．９と、２００μＬの１ＭＫＣｌと、２０μＬの１ＭＣａＣｌ２と、２０μＬの１ＭＭｎＣｌ２とを混合し、ｄＨ２Ｏで２０ｍｌの最終体積にする。その緩衝剤を４℃で６カ月間保管する。

コンカナバリンＡ被覆ビーズ：穏やかに再懸濁させ、各々の最終試料および／または消化時点に１０μＬがあるために十分なスラリーを抜き取る。２ｍｌ管の中の１．５ｍｌ結合緩衝剤に移入する。管を磁気スタンド上に配置して清浄化する（３０秒〜２分）。液体を抜き取り、磁気スタンドから除去する。１．５ｍｌの結合緩衝剤を添加し、反転または穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。ビーズスラリーの体積（１最終試料当たり１０μＬ）と等しい体積の結合緩衝剤に再懸濁させる。洗浄緩衝剤：１ｍｌの１ＭＨＥＰＥＳｐＨ７．５と、１．５ｍｌの５ＭＮａＣｌと、１２．５μＬの２Ｍスペルミジンとを混合し、ｄＨ２Ｏで５０ｍｌの最終体積にし、１個のＲｏｃｈｅ完全プロテアーゼ阻害剤ＥＤＴＡ不含タブレットを添加する。その緩衝剤を４℃で最大１週間の間、保管する。Ｄｉｇ洗浄緩衝剤：１６０〜８００μＬの５％ジギトニンを４０ｍｌの洗浄緩衝剤と混合する。ジギトニンの有効性はバッチ間で異なるため、使用するための濃度を決定するためにトリパンブルーの透過性を判定することを推奨する。Ｋ５６２細胞について０．０２〜０．１％ジギトニンで優れた結果を得た。その緩衝剤を４℃で最大１日の間、保管する。

抗体緩衝剤：８μＬの０．５ＭＥＤＴＡを２ｍｌのＤｉｇ洗浄緩衝剤と混合し、氷上に配置する。各々の抗体用のアリコートに分割し、抗体溶液または血清を１：１００の最終濃度までまたは免疫蛍光のための製造業者の推奨濃度まで添加する。２ＸＳＴＯＰ：４．２ｍｌのｄＨ２Ｏに、３４０μｌの５ＭＮａＣｌ、２００μＬの０．５ＭＥＤＴＡ、１００μＬの０．２ＭＥＧＴＡ、２０μＬの５％ジギトニン、２５μＬのＲＮａｓｅＡ、１２５μＬの２ｍｇ／ｍｌのグリコーゲン、および２ｐｇ／ｍｌの異種スパイクインＤＮＡを添加する。その緩衝剤を４℃で最大１週間の間、保管する。

較正用の異種スパイクインＤＮＡは、下は約２００ｂｐに至る平均サイズに断片化するべきであり、例えばモノヌクレオソームサイズの断片のＭＮａｓｅ処置試料であるべきである。本発明者らは、マッピングされたリードの総数を正規化因子としてしか使用しないので、必要とするスパイクインＤＮＡは非常に少ない。例えば、１．５ｐｇの添加は、１，０００，０００〜１０，０００，０００のマッピングされる実験リードに対して（反比例して）１，０００〜１０，０００のマッピングされるスパイクインリードをもたらす。

手順

ビーズへの細胞の結合

^＊タイミング３０分

抗体の添加の前の全てのステップは、細胞に対するストレスを最小にするために室温で行う。プロトコール全体を通してＤＮＡ切断を最小にすることは極めて重要であるので、本発明者らは、再懸濁中のキャビテーションおよび激しいボルテックスを避けることを推奨する。

１）室温で新鮮培養物を収集し、細胞をカウントする。同じプロトコールを、１試料および／または消化時点当たり１００〜２５０，０００の哺乳動物細胞に使用することができる。

^＊一時停止ポイント：必要に応じて、Ｍｒ．Ｆｒｏｓｔｙイソプロピルアルコールチャンバを使用して細胞を１０％ＤＭＳＯ中で凍結保存することができる。急速凍結は、推奨しない。これは、最終的なデータ品質に影響を及ぼす可能性があるバックグラウンドＤＮＡ切断の原因となり得るからである。

２）室温で３分６００×ｇ遠心分離し、液体を抜き取る。

３）穏やかなピペット操作により１．５ｍｌの室温洗浄緩衝剤に再懸濁させ、必要に応じて２ｍｌ管に移す。

４）室温で３分６００×ｇ遠心分離し、液体を抜き取る。

５）ステップ３および４を繰り返す。

６）穏やかなピペット操作により１ｍｌの室温洗浄緩衝剤に再懸濁させる。

７）室温で細胞を穏やかにボルテックスしながら、ビーズスラリーを添加する。

８）５〜１０分、室温で回転させる。

９）使用する抗体ごとに１つの１．５ｍｌ管内のアリコートに分割する。

ライブラリー調製の必要のなくこの手順の成功を評価するために、並行して陽性対照抗体（例えば、α−Ｈ３Ｋ２７ｍｅ３）および陰性対照抗体（例えば、α−ウサギ）を含める。抗体なし対照を含めない。繋留の欠如により、いずれかの未結合ｐＡ−ＭＮが、「時限爆弾」として作用し、接近可能なＤＮＡを消化することが可能になり、その結果、ＤＮＡ接近可能部位のバックグラウンドが生じるからである。

（一次）抗体を結合させる

^＊タイミング１５分〜一晩であり、インキュベーションが長いほど高い収量が得られる

１０）磁気スタンド上に配置して清浄化し、液体を吸引除去する。

^＊低残留ピペットチップは、溶液を正確に移すのに好ましいが、デカント中のビーズの喪失を回避するために従来の（低接着性でない）微小遠心管のみを使用する。

１１）低（約１１００ｒｐｍ）に設定したボルテックスミキサーに各々の管を低角度で配置し、側面に沿って５０μＬの抗体緩衝剤（１試料および／または消化時点当たり）を吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。

ビーズからのＣａ＋＋キャリーオーバーは、ｐＡ−ＭＮの添加後に時期尚早に鎖切断を開始することがあるため、抗体処置中のＥＤＴＡの存在が、ＣｏｎＡの活性化に使用される過剰な二価カチオンを除去する。細胞を透過処理する際の二価カチオンのキレート化も、代謝プロセスの迅速な停止および内因性ＤＮＡｓｅ活性の防止に役立つ。ｐＡ−ＭＮ添加前のＥＤＴＡの洗浄除去は、酵素の不活性化を回避する。洗浄緩衝剤中のスペルミジンは、そうしなければクロマチンの特性に影響を及ぼす可能性があるＭｇ＋＋の除去を補償することを目的としたものである。

１２）４℃で約２時間、または室温で５〜１０分間、チューブローテーターにかける。

^＊一時停止ポイント抗体インキュベーションは、一晩、４℃で継続する。

１３）微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。

１４）磁気スタンド上に配置して清浄化し（約３０秒）、液体の全てを吸引除去する。

１５）１ｍｌのＤｉｇ洗浄緩衝剤を添加し、反転により、または塊が残存する場合には１ｍｌチップを使用する穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。二次抗体に結合する（必要に応じて）

^＊タイミング１５分〜１．５時間

プロテインＡの一次抗体への結合効率は、宿主種およびＩｇＧアイソタイプに依存する。例えば、プロテインＡは、ウサギおよびモルモットＩｇＧとはよく結合するが、マウスおよびヤギＩｇＧとはそれほど結合せず、そのため、後者の抗体については、ウサギα−マウスなどの二次抗体を推奨する。

１６）磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。

１７）低（約１１００ｒｐｍ）に設定したボルテックスミキサーに各々の管を低角度で配置し、側面に沿って５０μＬのＤｉｇ洗浄緩衝剤（１試料および／または消化時点当たり）を吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。

１８）１：１００の最終濃度までまたは免疫蛍光のための製造業者の推奨濃度まで二次抗体に混ぜ入れる。

１９）４℃で約１時間、または室温で５〜１０分間、チューブローテーターにかける。

２０）微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。

２１）磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。

２２）１ｍｌのＤｉｇ洗浄緩衝剤を添加し、反転により、または塊が残存する場合には穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体をおよび除去する。

プロテインＡ−ＭＮａｓｅ融合タンパク質を結合させる

^＊タイミング１５分〜１．５時間

２３）磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。

２４）低（約１１００ｒｐｍ）に設定したボルテックスミキサーに各々の管を低角度で配置し、側面に沿って５０μＬのＤｉｇ洗浄緩衝剤（１試料および／または消化時点当たり）を吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。

２５）約７００ｎｇ／ｍｌの最終濃度までｐＡ−ＭＮａｓｅに混ぜ入れる（例えば、要請に応じて提供される１４０μｇ／ｍｌのグリセロールストックの１：１０希釈物５０μＬ当たり２．５μＬ）。

２６）４℃で約１時間、または室温で５〜１０分間、チューブローテーターにかける。

２７）微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。

２８）磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。

２９）１ｍｌのＤｉｇ洗浄緩衝剤を添加し、反転により、または塊が残存する場合には穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。

３０）Ｄｉｇ洗浄ステップ２８〜２９を繰り返す。

標的消化

^＊タイミング４５分

３１）磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。

３２）低（約１１００ｒｐｍ）に設定したボルテックスミキサーに各々の管を低角度で配置し、側面に沿って１００μＬのＤｉｇ洗浄緩衝剤（１試料および／または消化時点当たり）を添加し、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。

３３）湿潤氷の中に置かれているヒーターブロックの１．５ｍｌウェルに管を挿入にして０℃に冷却する。

３４）各々の管をブロックから除去し、穏やかにボルテックスしながら２μＬの１００ｍＭＣａＣｌ２（１Ｍストックから１：１０希釈した）に混ぜ入れ、直ちに管を０℃ブロックに戻す。

３５）０℃で所望の消化時間、インキュベートする（デフォルトは３０分である）。

ＭＮａｓｅは、ＤＮＡに結合するが、Ｃａ＋＋が存在するときにのみ切断し、したがって、消化はゼロ次反応である、この反応は、ゲノムの接近可能な領域を消化することができる放出されたｐＡ−ＭＮａｓｅ結合粒子のその後の拡散より温度依存性が低いようである。細胞集団の大部分における粒子の切断および放出を０℃で達成することができ、その上、拡散に起因するバックグラウンド切断を最小にすることができる。本発明者らは、周囲温度またはそれより高い温度での消化が許容し難いバックグラウンド切断レベルを生じさせる結果となることを見出した。

３６）１００μＬの２ＸＳＴＯＰを添加し、穏やかにボルテックスすることにより混合する。複数の時点がある場合、１００μＬの２ＸＳＴＯＰに対して１００μＬを除去し、穏やかにボルテックスすることにより混合する。

異種スパイクインＤＮＡは、ＤＮＡ量を較正するために、例えば、処置または消化時点を比較するために、２ＸＳＴＯＰ中に存在すべきである。これは、ＣＵＴ＆ＲＵＮにとって特に重要である。試料の正規化のためのバックグラウンド切断が少なすぎるからである。

標的クロマチンの放出

^＊タイミング２０分

３７）１０分３７℃インキュベートして、不溶性核クロマチンからＣＵＴ＆ＲＵＮ断片を放出させる。

３８）５分４℃１６，０００×ｇ遠心分離し、磁気スタンド上に配置する。

選択肢Ａ：スピンカラムによる高速ＤＮＡ抽出

^＊タイミング２０分

３９）スピンカラムを採取用の管内に配置し、４００μＬの緩衝剤ＮＴ１（ＮｕｃｌｅｏＳｐｉｎキットまたは等価物から）を添加する。

４０）ペレットからの上清を清浄にデカントし、スピンカラムのＮＴ１に移し、ピペットで穏やかに吸上げ、吐き出して混合する。

４１）３０秒、１１，０００×ｇで遠心分離する。フロースルーを廃棄する。

４２）７００μＬの緩衝剤ＮＴ３を添加する。３０秒、１１，０００×ｇで遠心分離する。フロースルーを廃棄する。

４３）７００μＬの緩衝剤ＮＴ３を添加する。３０秒、１１，０００×ｇで遠心分離する。フロースルーを廃棄し、ローターに戻す。

４４）１分間、１１，０００×ｇ、遠心分離する。５分乾燥させる。

４５）新たな管に入れ、２０〜４０μＬの緩衝剤ＮＥを膜に添加する。

４６）１分後、１分間、１１，０００×ｇで遠心分離する。

選択肢Ｂ：代替ＤＮＡ抽出（≦８０ｂｐ断片の定量的回収に好ましい）

^＊タイミング１．５時間

４７）ペレットから上清を清浄にデカントし、新たな１．５ｍｌ微小遠心管に移す。

４８）各々の試料に２μＬの１０％ＳＤＳ（０．１％まで）および２．５μＬのプロテイナーゼＫ（２０ｍｇ／ｍｌ）を添加する。反転により混合し、インキュベート（１０分、７０℃）する。

４９）３００μＬのＰＣＩを添加し、約２秒、最高速度でボルテックスすることにより混合する。

５０）フェーズロック管に移し、５分、室温、１６，０００×ｇで遠心分離する。

５１）３００μＬのクロロホルムを添加し、約１０回反転させて混合する。

５２）液体を、ピペット操作により、２μＬの２ｍｇ／ｍｌのグリコーゲンが入っている新たな管へと除去する。

５３）７５０μＬの１００％エタノールを添加し、ボルテックスすることまたは管を反転させることにより混合する

５４）氷で冷却し、１０分、４℃、１６，０００×ｇで遠心分離する。

５５）液体を捨て、ペーパータオルで液分を切る。

５６）１ｍｌの１００％エタノールでペレットをすすぎ、１分、４℃、１６，０００×ｇで遠心分離する。

５７）液体を注意深く捨て、ペーパータオルで液分を切る。空気乾燥。

５８）ペレットが乾いたら、２５〜５０μＬの１ｍＭＴｒｉｓ−ＨＣｌｐＨ８０．１ｍＭＥＤＴＡに溶解する。

ライブラリー調製およびシーケンシング

^＊タイミング２〜４日

５９）必要に応じた：１〜２μＬを、例えばＱｕｂｉｔ計器での蛍光検出を使用して、定量する。

６０）必要に応じた：切断された断片の存在およびサイズ分布を、例えばＴａｐｅｓｔａｔｉｏｎ計器を使用して、キャピラリー電気泳動と蛍光検出により評価する。

一部の長い未消化ＤＮＡは漏出することになり、これは、典型的な転写因子のＣＵＴ＆ＲＵＮのＱｕｂｉｔ蛍光に影響を及ぼすことになるものである。これらについては、回収される標的ＤＮＡは、量が少なすぎておよびサイズが小さすぎて、ゲル分析によっても、さらにはＴａｐｅｓｔａｔｉｏｎによっても、検出することができない。そのような場合、ＴａｐｅｓｔａｔｉｏｎまたはＢｉｏａｎａｌｙｚｅｒ分析により定量するためにＰＣＲ増幅ライブラリーを作製する必要があり得る。

６１）シングルチューブプロトコールを使用するＴｒｕ−ＳｅｑアダプターでのＩｌｌｕｍｉｎａシーケンシング用のバーコード化ライブラリーを製造業者の使用説明書に従って調製する。高速ＰＣＲサイクルは、ポリメラーゼが長すぎて完了することができない大きいＤＮＡ断片の線形増幅より、所望のＣＵＴ＆ＲＵＮ断片の指数関数的増幅に有利に働く。

大きいＤＮＡ断片の寄与を最小にするために、ＰＣＲサイクルは、好ましくは、１０秒、６０℃のアニール／伸長複合ステップを伴う、少なくとも１２〜１４サイクルであるべきである。良好な結果は、Ｈｙｐｅｒ−ｐｒｅｐキット（ＫＡＰＡＢｉｏｓｙｓｔｅｍｓ）で得られた。

６２）ＱｕｂｉｔなどのｄｓＤＮＡ特異的アッセイを使用してライブラリー収量を定量する。

６３）Ａｇｉｌｅｎｔ４２００ＴａｐｅＳｔａｔｉｏｎ分析によりライブラリーのサイズ分布を判定する。

６４）バーコードライブラリーを用いるペアードエンドＩｌｌｕｍｉｎａシーケンシングを製造業者の使用説明書に従って行う。

ＣＵＴ＆ＲＵＮでの非常に低いバックグラウンドのため、転写因子またはヌクレオソーム修飾について、さらにはヒトゲノムについて、通常は５，０００，０００のペアードエンドリードで十分である。最大の経済性のために、本発明者らは、２レーンフローセルを用いて１レーン当たり最大２４のバーコード化試料を混合し、ペアードエンド２５×２５ｂｐシーケンシングを行った。シングルエンドシーケンシングは、転写因子と隣接ヌクレオソームの間の分解能および識別を犠牲にするので、ＣＵＴ＆ＲＵＮには推奨しない。

データ処理および分析

^＊タイミング１日（可変）

６５）本発明者らは、Ｂｏｗｔｉｅ２バージョン２．２．５を、オプション：−−ｌｏｃａｌ−ｖｅｒｙｓｅｎｓｉｔｉｖｅ−ｌｏｃａｌ−−ｎｏ−ｕｎａｌ−−ｎｏ−ｍｉｘｅｄ−−ｎｏ−ｄｉｓｃｏｒｄａｎｔ−−ｐｈｒｅｄ３３−Ｉ１０−Ｘ７００で使用して、ペアードエンドリードのアラインメントを行う。スパイクイン断片のマッピングには、本発明者らは、実験ゲノムとスパイクインＤＮＡのものとの交差マッピングを回避するために、−−ｎｏ−ｏｖｅｒｌａｐ−−ｎｏ−ｄｏｖｅｔａｉｌオプションも使用する。

シーケンシングされた断片の≦１２０ｂｐサイズクラスと≧１５０ｂｐサイズクラスへの分離によって、ＤＮＡ結合タンパク質の局所近傍のマッピングが達成されるが、これは、繋留ＭＮａｓｅによるＤＮＡへの立体的接近によって変わり得る。シングルエンドシーケンシングは、転写因子と隣接ヌクレオソームの間の分解能および識別を犠牲にするので、ＣＵＴ＆ＲＵＮには推奨しない。

６６）ワールドワイドウェブにおいてドメイン名github.com/peteskeneで入手できるスクリプトを、ＣＵＴ＆ＲＵＮデータの処理、スパイクイン較正および分析用にカスタマイズする。

結果

ヒトＫ５６２細胞を３７℃で培養し、カウントし、低速遠心分離により１×１０^６細胞／ｍｌで収集し、再懸濁させ、洗浄緩衝剤で２回ペレット化し、次いで、希釈し、３００μＬ体積で洗浄緩衝剤と混合して、５０〜６，０００個の間の細胞の２倍系列を得た。結合緩衝剤中の１０μＬのＣａ^２＋洗浄およびＭｎ^２＋洗浄ＣｏｎＡ被覆磁気ビーズスラリーを、穏やかにボルテックスしながら各々の細胞懸濁液に添加した。１０分後、細胞を磁気スタンドで回収し、デカントし、抗Ｈ３Ｋ２７ｍｅ３（１：１００、ＣＳＴ＃９７３３）と２ｍＭＥＤＴＡと０．０５％ジギトニンとを含有する５０μＬの抗体緩衝剤に再懸濁させ、４℃で１５時間インキュベートした。磁気スタンドでビーズを回収し、１ｍｌの冷Ｄｉｇ洗浄液で１回洗浄した後、細胞をＤｉｇ洗浄液中の１００μＬのｐＡ−ＭＮ（１：５００、３６０μｇ／ｍｌ）に再懸濁させ、４℃で１時間インキュベートした。ビーズを磁気スタンドで回収し、１ｍｌのＤｉｇ洗浄液で２回洗浄し、１５０μＬのＤｉｇ洗浄液に再懸濁させ、０℃に冷却した。３μＬの１００ｍＭＣａＣｌ_２を添加し、０℃インキュベーションを３０分間継続した。反応を１体積の２ＸＳＴＯＰで終了させ、３７℃で２０分間インキュベートし、４℃で５分、１６，０００×ｇで遠心分離した。上清とペレットの両方を、ステップ４７〜５８に従って抽出した。ペレットからのＤＮＡをＱｕｂｉｔ蛍光により定量した。選択した上清画分からのＤＮＡをＴａｐｅｓｔａｔｉｏｎ分析（図２６）により分解し、ＩｌｌｕｍｉｎａＰＥ２５×２５シーケンシングに供した。典型的なＣｈＩＰ−ｓｅｑ実験は、多い出発細胞数を使用し、その結果、免疫沈降される特有の超音波処理された断片が多数生じることになる。対照的に、ＣＵＴ＆ＲＵＮは、少ない細胞数を可能にし、比較的低いバックグラウンドを有するので、特有の断片の数は、典型的な配列深度未満である。したがって、少ない細胞数の実験からの高いシーケンシング深度は、ＰＣＲデュプリケートの冗長なシーケンシングをもたらす。推定ＰＣＲデュプリケートを除去し、マッピングされた断片を置換せずにランダムにサンプリングし、その結果、１試料当たり７，５００，０００の特有のリードを得、積層リードから正規化されたカウントとして表示した（図２８）。比較のために、７，５００，０００の特有のリードの試料をＫ５６２細胞におけるＨ３Ｋ２７ｍｅ３についてのＥＮＣＯＤＥデータセットからサンプリングした。下は１００細胞に至る細胞数の低減に伴って起こったデータ品質の低下が極めて少ないことは明らかである。対照的に、同じ深度でサンプリングしたＥＮＣＯＤＥプロファイルは、ＣｈＩＰに固有の高いバックグラウンドのせいで不鮮明なプロファイルを示す。抗ＣＴＣＦ抗体（１：１００、Ｍｉｌｌｉｐｏｒｅ０７−７２９）を使用してＣＵＴ＆ＲＵＮを同様に行って、下は１０００細胞に至るまでデータ品質をほとんど損なうことなくプロファイルを得た（図２９）。スピンカラム抽出（ステップ３９〜４６）は、簡易であり、ヌクレオソームの範囲内での断片の良好な回収率を迅速にもたらし、その上、ライブラリー調製に干渉し得る非常に大きい断片の濃度を低下させる（図３０）。したがって、このＤＮＡ抽出選択肢は、ＣＵＴ＆ＲＵＮのほとんどの応用に好ましい。しかし、少ない細胞数でのＴＦのＣＵＴ＆ＲＵＮについては、有機抽出（ステップ４７〜５８）のほうが、小さい断片のより良好な回収率のために好ましい。

実施例２のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）

1. Solomon, M.J. & Varshavsky, A. Formaldehyde-mediated DNA-protein crosslinking: a probe for in vivo chromatin structures. Proc Natl Acad Sci U S A 82, 6470-4 (1985).

2. Johnson, D.S., Mortazavi, A., Myers, R.M. & Wold, B. Genome-wide mapping of in vivo protein-DNA interactions. Science 316, 1497-502 (2007).

3. Barski, A. et al. High-resolution profiling of histone methylations in the human genome. Cell 129, 823-37 (2007).

4. Rhee, H.S. & Pugh, B.F. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147, 1408-19 (2011).

5. Skene, P.J. & Henikoff, S. A simple method for generating high-resolution maps of genome-wide protein binding. eLife 4, e09225 (2015).

6. Teytelman, L., Thurtle, D.M., Rine, J. & van Oudenaarden, A. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. Proceedings of the National Academy of Sciences of the United States of America 110, 18602-7 (2013).

7. Park, D., Lee, Y., Bhupindersingh, G. & Iyer, V.R. Widespread misinterpretable ChIP-seq bias in yeast. PloS one 8, e83506 (2013).

8. Jain, D., Baldi, S., Zabel, A., Straub, T. & Becker, P.B. Active promoters give rise to false positive 'Phantom Peaks' in ChIP-seq experiments. Nucleic Acids Res 43, 6959-68 (2015).

9. Baranello, L., Kouzine, F., Sanford, S. & Levens, D. ChIP bias as a function of cross-linking time. Chromosome Res 24, 175-81 (2016).

10. Meyer, C.A. & Liu, X.S. Identifying and mitigating bias in next-generation sequencing methods for chromatin biology. Nat Rev Genet 15, 709-21 (2014).

11. Crawford, G.E. et al. Genome-wide mapping of DNase hypersensitive sites using massively parallel signature sequencing (MPSS). Genome Res 16, 123-31 (2006).

12. Giresi, P.G., Kim, J., McDaniell, R.M., Iyer, V.R. & Lieb, J.D. FAIRE (Formaldehyde-Assisted Isolation of Regulatory Elements) isolates active regulatory elements from human chromatin. Genome Res 17, 877-85 (2007).

13. Auerbach, R.K. et al. Mapping accessible chromatin regions using Sono-Seq. Proc Natl Acad Sci U S A 106, 14926-31 (2009).

14. Kent, N.A., Adams, S., Moorhouse, A. & Paszkiewicz, K. Chromatin particle spectrum analysis: a method for comparative chromatin structure analysis using paired-end mode next-generation DNA sequencing. Nucleic Acids Res 39, e26 (2011).

15. Henikoff, J.G., Belsky, J.A., Krassovsky, K., Macalpine, D.M. & Henikoff, S. Epigenome characterization at single base-pair resolution. Proc Natl Acad Sci U S A 108, 18318-23 (2011).

16. Buenrostro, J.D., Giresi, P.G., Zaba, L.C., Chang, H.Y. & Greenleaf, W.J. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNAbinding proteins and nucleosome position. Nat Methods 10, 1213-8 (2013).

17. Bernt, K.M. et al. MLL-rearranged leukemia is dependent on aberrant H3K79 methylation by DOT1L. Cancer Cell 20, 66-78 (2011).

18. van Steensel, B., Delrow, J. & Henikoff, S. Chromatin profiling using targeted DNA adenine methyltransferase. Nat Genet 27, 304-8 (2001).

19. Schmid, M., Durussel, T. & Laemmli, U.K. ChIC and ChEC; genomic mapping of chromatin proteins. Mol Cell 16, 147-57 (2004).

20. Skene, P.J. & Henikoff, S. An efficient targeted nuclease strategy for high-resolution mapping of DNA binding sites. Elife 6(2017).

21. Hu, Z. et al. Nucleosome loss leads to global transcriptional up-regulation and genomic instability during yeast aging. Genes & development 28, 396-408 (2014).

22. Orlando, D.A. et al. Quantitative ChIP-Seq normalization reveals global modulation of the epigenome. Cell Rep 9, 1163-70 (2014).

23. Zentner, G.E., Kasinathan, S., Xin, B., Rohs, R. & Henikoff, S. ChEC-seq kinetics discriminate transcription factor binding sites by DNA sequence and shape in vivo. Nature Communications 6, 8733 (2015).

24. Corces, M.R. et al. Lineage-specific and single-cell chromatin accessibility charts human hematopoiesis and leukemia evolution. Nat Genet 48, 1193-203 (2016).

25. Liu, X. & Fagotto, F. A method to separate nuclear, cytosolic, and membrane-associated signaling molecules in cultured cells. Sci Signal 4, pl2 (2011).

26. Adam, S.A., Marr, R.S. & Gerace, L. Nuclear protein import in permeabilized mammalian cells requires soluble cytoplasmic factors. J Cell Biol 111, 807-16 (1990).

27. Brind'Amour, J. et al. An ultra-low-input native ChIP-seq protocol for genome-wide profiling of rare cell populations. Nat Commun 6, 6033 (2015).

28. Porreca, G.J. et al. Multiplex amplification of large sets of human exons. Nat Methods 4, 931-6 (2007).

29. Cusanovich, D.A. et al. Multiplex single cell profiling of chromatin accessibility by combinatorial cellular indexing. Science 348, 910-4 (2015).

30. Ramani, V. et al. Massively multiplex single-cell Hi-C. Nat Methods 14, 263-266 (2017).

31. Lieberman-Aiden, E. et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 326, 289-93 (2009).

32. Tang, Z. et al. CTCF-Mediated Human 3D Genome Architecture Reveals Chromatin Topology for Transcription. Cell 163, 1611-27 (2015).

33. Mumbach, M.R. et al. HiChIP: efficient and sensitive analysis of protein-directed genome architecture. Nat Methods 13, 919-922 (2016).

34. Chen, Y.B., A. "TSA-Seq": a novel proximity mapping approach for studying three dimensional genome organization and function. (2016).

35. Beagrie, R.A. et al. Complex multi-enhancer contacts captured by genome architecture mapping. Nature 543, 519-524 (2017).

36. Wahba, L., Costantino, L., Tan, F.J., Zimmer, A. & Koshland, D. S1-DRIP-seq identifies high expression and polyA tracts as major contributors to R-loop formation. Genes Dev 30, 1327-38 (2016).

37. Sanders, M.M. Fractionation of nucleosomes by salt elution from micrococcal nucleasedigested nuclei. J Cell Biol 79, 97-109 (1978).

38. Davie, J.R. & Saunders, C.A. Chemical composition of nucleosomes among domains of calf thymus chromatin differing in micrococcal nuclease accessibility and solubility properties. J Biol Chem 256, 12574-80 (1981).

39. Henikoff, S., Henikoff, J.G., Sakai, A., Loeb, G.B. & Ahmad, K. Genome-wide profiling of salt fractions maps physical properties of chromatin. Genome Res 19, 460-9 (2009).

40. Kasinathan, S., Orsi, G.A., Zentner, G.E., Ahmad, K. & Henikoff, S. High-resolution mapping of transcription factor binding sites on native chromatin. Nature methods 11, 203-9 (2014).

41. Zentner, G.E. & Henikoff, S. High-resolution digital profiling of the epigenome. Nat Rev Genet 15, 814-27 (2014).

42. Fan, X., Lamarre-Vincent, N., Wang, Q. & Struhl, K. Extensive chromatin fragmentation improves enrichment of protein binding sites in chromatin immunoprecipitation experiments. Nucleic acids research 36, e125 (2008).

43. Teytelman, L. et al. Impact of chromatin structures on DNA processing for genomic analyses. PloS one 4, e6700 (2009).

44. Chung, H.R. et al. TFfhe effect of micrococcal nuclease digestion on nucleosome positioning data. PLoS One 5, e15754 (2010).

（実施例３）

シーケンシャルＣｈＩＰの高効率代替としてのＣＵＴ＆ＲＵＮ．ＣｈＩＰ。

クロマチン因子は、複合体を形成してＤＮＡに結合するが、共占有を同定するための現行の方法は、シーケンシャルＣｈＩＰの効率の悪さにより大幅に制限される。シーケンシャルＣｈＩＰは、第１の架橋ＣｈＩＰ反応後に第２のＣｈＩＰプルダウンのインプットとして回収されるクロマチン免疫沈降物を使用して行われる。しかし、架橋ＣｈＩＰの効率の悪さのため、第２のＣｈＩＰ後に回収される材料の量は、ほとんどゼロに等しいことがあり、その結果、シーケンシャルＣｈＩＰは通常はＰＣＲに限定されることになり、そもそもシーケンシャルＣｈＩＰ−ｓｅｑにゲノムワイドな応用が可能であったとしても極めて稀である。例えば、［６］において、本発明者らは、ヒト動原体複合体でのシーケンシャルＣｈＩＰ−ｓｅｑの実施に成功したが、何故かと言えば、この複合体が、セントロメアに何千ものコピーで存在するタンデム反復α−サテライト配列上にあるからに過ぎない。しかし、ＣＵＴ＆ＲＵＮは、ＣｈＩＰよりはるかに効率的であるので、本発明者らは、ＣＵＴ＆ＲＵＮ上清をＣｈＩＰのインプットとして使用することができると推論した。本発明者らは、ＣＵＴ＆ＲＵＮの高効率を使用してクロマチン粒子を放出したところ、この材料を第２のクロマチン成分のために有するＣｈＩＰのほうが、無視できるほどのバックグラウンドではるかに高効率であることを見出した。

ＣＵＴ＆ＲＵＮ．ＣｈＩＰを試験するために、本発明者らは、ＣＵＴ＆ＲＵＮをＦＬＡＧタグ付きヒストンに適用して、ＦＬＡＧペプチドを使用して上清に存在する粒子からｐＡ−ＭＮ結合抗体を競合より分離し、ＣＵＴ＆ＲＵＮ上清のネイティブＣｈＩＰについての他のヒストンマークに二次抗体を添加した（図３１Ａ）。代表的なヌクレオソームランドスケープは、プロモーター近接ヌクレオソームに関して、全てのヌクレオソームのマーカーであるＨ２Ｂと比較して、ヒストンバリアントＨ２Ａが、Ｈ４アセチル化およびＨ３Ｋ４トリメチル化については濃縮されおり、Ｈ３Ｋ３６トリメチル化については枯渇している（図３１Ｂ）ことを示し、これは、ＣｈＩＰを使用してこれらの修飾をマッピングする以前の研究［７、８］と一致している。単一ＣｈＩＰ研究により、プロモーター近接ヌクレオソームがこれらの修飾について濃縮または枯渇していることは既に確立されていたが、それらが同じヌクレオソーム上に存在する程度は確立されていなかった。このＣＵＴ＆ＲＵＮ．ＣｈＩＰ手順を、例えば、プロモーターにおける二価クロマチン状態のステータスを定義するために使用して、哺乳動物細胞において発生学的に調節されている遺伝子における転写準備（transcriptional poising）の機序に取り組むことができる［９］。

（実施例４）

ＣＵＴ＆ＲＵＮタンパク質同定

ＣＵＴ＆ＲＵＮ．ＣｈＩＰは、ＤＮＡ−タンパク質複合体のタンパク質成分を、それらが前もって分かっており、抗体が利用できる場合にのみ同定することができるが、複合体中の未知の成分を同定するためには異なる戦略が必要である。ＣｈＩＰの低い効率のため、タンパク質同定を行うのに十分な免疫沈降物を得ることは困難であるが、ＣＵＴ＆ＲＵＮ上清への粒子放出の高い効率によって下流のプロテオミクス分析に十分な材料が得られる。しかし、本発明者らは、放出された粒子が、ＣＵＴ＆ＲＵＮ上清に放出された全材料の一部しか含まないことを見出し、そのため、本発明者らは、下流のプロテオミクス分析のためのｐＡ−ＭＮ／抗体結合複合体の精製に使用することができる、６−Ｈｉｓタグを有するバージョンのプロテインＡ−ＭＮａｓｅ（図３２Ａ）を設計し、産生した。手順は、ＣＵＴ＆ＲＵＮ上清に放出された粒子を、ニッケル−アガロース（例えば、Ｑｉａｇｅｎおよび他の供給業者から入手可能なＮｉ−ＮＴＡアガロース）などの親和性マトリックスと結合させることである。製造業者の推奨に従って洗浄し、溶出した後、複合体のタンパク質成分の銀染色ＳＤＳ−ＰＡＧＥ分析および液体クロマトグラフィー−質量分析による判定のために十分な量の純粋な複合体が、得られるはずである（図３２Ｂ）。

実施例４のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）

１．Ｓｃｈｍｉｄ，Ｍ．，Ｄｕｒｕｓｓｅｌ，Ｔ．，ａｎｄＬａｅｍｍｌｉ，Ｕ．Ｋ．（２００４）．ＣｈＩＣａｎｄＣｈＥＣ；ｇｅｎｏｍｉｃｍａｐｐｉｎｇｏｆｃｈｒｏｍａｔｉｎｐｒｏｔｅｉｎｓ．Ｍｏｌ．Ｃｅｌｌ１６，１４７−１５７．

２．Ｚｅｎｔｎｅｒ，Ｇ．Ｅ．，Ｋａｓｉｎａｔｈａｎ，Ｓ．，Ｘｉｎ，Ｂ．，Ｒｏｈｓ，Ｒ．，ａｎｄＨｅｎｉｋｏｆｆ，Ｓ．（２０１５）．ＣｈＥＣ−ｓｅｑｋｉｎｅｔｉｃｓｄｉｓｃｒｉｍｉｎａｔｅｔｒａｎｓｃｒｉｐｔｉｏｎｆａｃｔｏｒｂｉｎｄｉｎｇｓｉｔｅｓｂｙＤＮＡｓｅｑｕｅｎｃｅａｎｄｓｈａｐｅｉｎｖｉｖｏ．ＮａｔＣｏｍｍｕｎ６，８７３３．

３．Ｓｋｅｎｅ，Ｐ．Ｊ．，ａｎｄＨｅｎｉｋｏｆｆ，Ｓ．（２０１７）．Ａｎｅｆｆｉｃｉｅｎｔｔａｒｇｅｔｅｄｎｕｃｌｅａｓｅｓｔｒａｔｅｇｙｆｏｒｈｉｇｈ−ｒｅｓｏｌｕｔｉｏｎｍａｐｐｉｎｇｏｆＤＮＡｂｉｎｄｉｎｇｓｉｔｅｓ．ｅＬｉｆｅ６．

４．Ｓｋｅｎｅ，Ｐ．Ｊ．，ａｎｄＨｅｎｉｋｏｆｆ，Ｓ．（２０１７）．ＣＵＴ＆ＲＵＮ：Ｔａｒｇｅｔｅｄｉｎｓｉｔｕｇｅｎｏｍｅ−ｗｉｄｅｐｒｏｆｉｌｉｎｇｗｉｔｈｈｉｇｈｅｆｆｉｃｉｅｎｃｙｆｏｒｌｏｗｃｅｌｌｎｕｍｂｅｒｓ．Ｓｕｂｍｉｔｔｅｄｆｏｒｐｕｂｌｉｃａｔｉｏｎ．

５．Ｈｅｎｉｋｏｆｆ，Ｓ．，Ｈｅｎｉｋｏｆｆ，Ｊ．Ｇ．，Ｓａｋａｉ，Ａ．，Ｌｏｅｂ，Ｇ．Ｂ．，ａｎｄＡｈｍａｄ，Ｋ．（２００９）．Ｇｅｎｏｍｅ−ｗｉｄｅｐｒｏｆｉｌｉｎｇｏｆｓａｌｔｆｒａｃｔｉｏｎｓｍａｐｓｐｈｙｓｉｃａｌｐｒｏｐｅｒｔｉｅｓｏｆｃｈｒｏｍａｔｉｎ．ＧｅｎｏｍｅＲｅｓ．１９，４６０−４６９．

６．Ｔｈａｋｕｒ，Ｊ．，ａｎｄＨｅｎｉｋｏｆｆ，Ｓ．（２０１６）．ＣＥＮＰＴｂｒｉｄｇｅｓａｄｊａｃｅｎｔＣＥＮＰＡｎｕｃｌｅｏｓｏｍｅｓｏｎｙｏｕｎｇｈｕｍａｎａｌｐｈａ−ｓａｔｅｌｌｉｔｅｄｉｍｅｒｓ．ＧｅｎｏｍｅＲｅｓ．２６，１１７８−１１８７．

７．Ｗｅｉｎｅｒ，Ａ．，Ｈｕｇｈｅｓ，Ａ．，Ｙａｓｓｏｕｒ，Ｍ．，Ｒａｎｄｏ，Ｏ．Ｊ．，ａｎｄＦｒｉｅｄｍａｎ，Ｎ．（２０１０）．Ｈｉｇｈ−ｒｅｓｏｌｕｔｉｏｎｎｕｃｌｅｏｓｏｍｅｍａｐｐｉｎｇｒｅｖｅａｌｓｔｒａｎｓｃｒｉｐｔｉｏｎ−ｄｅｐｅｎｄｅｎｔｐｒｏｍｏｔｅｒｐａｃｋａｇｉｎｇ．ＧｅｎｏｍｅＲｅｓ．２０，９０−１００．

８．Ｌｕｋ，Ｅ．，Ｒａｎｊａｎ，Ａ．，Ｆｉｔｚｇｅｒａｌｄ，Ｐ．Ｃ．，Ｍｉｚｕｇｕｃｈｉ，Ｇ．，Ｈｕａｎｇ，Ｙ．，Ｗｅｉ，Ｄ．，ａｎｄＷｕ，Ｃ．（２０１０）．ＳｔｅｐｗｉｓｅｈｉｓｔｏｎｅｒｅｐｌａｃｅｍｅｎｔｂｙＳＷＲ１ｒｅｑｕｉｒｅｓｄｕａｌａｃｔｉｖａｔｉｏｎｗｉｔｈｈｉｓｔｏｎｅＨ２Ａ．Ｚａｎｄｃａｎｏｎｉｃａｌｎｕｃｌｅｏｓｏｍｅ．Ｃｅｌｌ１４３，７２５−７３６．

９．Ｓｈｅｍａ，Ｅ．，Ｊｏｎｅｓ，Ｄ．，Ｓｈｏｒｅｓｈ，Ｎ．，Ｄｏｎｏｈｕｅ，Ｌ．，Ｒａｍ，Ｏ．，ａｎｄＢｅｒｎｓｔｅｉｎ，Ｂ．Ｅ．（２０１６）．Ｓｉｎｇｌｅ−ｍｏｌｅｃｕｌｅｄｅｃｏｄｉｎｇｏｆｃｏｍｂｉｎａｔｏｒｉａｌｌｙｍｏｄｉｆｉｅｄｎｕｃｌｅｏｓｏｍｅｓ．Ｓｃｉｅｎｃｅ３５２，７１７−７２１．

（実施例５）

幹細胞様ＰＲＣ２活性と活性化発生プログラムとの共存は、びまん性正中神経膠腫クロマチンランドスケープを規定する

序論

びまん性正中神経膠腫は、５歳全生存率が＜５％である致死性小児ＣＮＳ腫瘍である（Mackay et al. 2017）。これらの腫瘍のおおよそ８０％は、ヒストン３．１またはＨ３．３のどちらかをコードする遺伝子の突然変異を有し、そのうち最も顕著なのは、リシン２７のメチオニンへの「オンコヒストン」突然変異（Ｈ３Ｋ２７Ｍ）である（Schwartzentruber et al. 2012；Wu et al. 2012）。突然変異型ヒストンＨ３は細胞内の全Ｈ３の約５〜１５％を構成するにもかかわらず、これらの腫瘍は、Ｐｏｌｙｃｏｍｂ抑制性複合体２（ＰＲＣ２）メチルトランスフェラーゼＥＺＨ２により触媒され、転写が抑制されているクロマチンに関連するＨ３テール修飾であるリシン２７トリメチル化（Ｈ３Ｋ２７ｍｅ３）レベルが低い（Chan et al. 2013；Lewis et al. 2013）。Ｈ３Ｋ２７Ｍテールが、ＥＺＨ２活性部位に結合し、その触媒活性を阻害することを実証するｉｎｖｉｔｒｏ研究（Bender et al. 2013；Lewis et al. 2013；Justin et al. 2016）、それがＰＲＣ２ランドスケープが包括的に再プログラムし得ることを示すＨ３Ｋ２７Ｍの異所性発現研究（Bender et al. 2013；Chan et al. 2013）、およびＤＭＧ患者試料における低い全Ｈ３Ｋ２７ｍｅ３の発見（Chan et al. 2013；Lewis et al. 2013）は、Ｈ３Ｋ２７ＭによるＥＺＨ２活性の包括的阻害が神経膠腫形成をもたらすことを仮定するモデルにつながった（Morgan and Shilatifard 2013；Weinberg et al. 2017）。

つい最近の結果は、このモデルに疑問を投げかけている。第１に、再構築されたヌクレオソームモデルでは、ＰＲＣ２は、野生型ヌクレオソームと同様の親和性でＨ３Ｋ２７Ｍ含有ヌクレオソームに結合した。これは、Ｈ３Ｋ２７Ｍに対して高い親和性を有するＥＺＨ２と矛盾する（Wang et al. 2017）。第２に、１，０００の患者試料の大規模ゲノム分析によって、包括的ＰＲＣ阻害剤を表現型コピーするＥＺＨ２突然変異は同定されなかった（Mackay et al. 2017）。最後に、ＤＭＧに関する最近のＣｈＩＰ−Ｓｅｑアッセイは、驚くべき残留Ｈ３Ｋ２７ｍｅ３ドメインを明示し、それらの一部は、ヒストン野生型のＤＭＧより多くのＨ３Ｋ２７ｍｅ３を含有した（Mohammad et al. 2017；Piunti et al. 2017）。ＰＲＣ２阻害剤の存在にもかかわらず特定のＰＲＣ２ドメインを保持することの基礎となる調節の論理は、いまだ不明である（Weinberg et al. 2017；Funato and Tabar 2018）。Ｈ３Ｋ２７Ｍが、腫瘍形成を促進するために特定の発生の手がかりまたは二次突然変異を必要とし得ることも、明らかになった。例えば、単独でのＨ３Ｋ２７Ｍは、非常に狭い発生ウインドウ内でのものを除いて、マウスモデルにおいて神経膠腫を誘導するには不十分である（Pathania et al. 2017）。加えて、ＤＭＧ細胞集団からの単細胞ＲＮＡ−ｓｅｑ分析は、特定の未分化前駆起始細胞が腫瘍を生じさせることを示唆する（Filbin et al. 2018）。さらに、Ｈ３．１Ｋ２７ＭでのＡＣＶＲ１突然変異とＨ３．３Ｋ２７ＭでのＰＤＧＦＲＡ増幅の観察される同時存在は、Ｈ３突然変異が発がんに寄与するために遺伝的修飾因子を必要とすることを示す。ＤＭＧにおけるクロマチンランドスケープに対する発生の手がかりおよび二次変異の影響は、まだ十分に解明されていない。

Ｈ３Ｋ２７Ｍ含有ＤＭＧにおいて観察される罹患クロマチンランドスケープをよりよく理解するために、本発明者らは、タンパク質：ＤＮＡ相互作用をゲノムワイドにマッピングするための最近記載された方法（Skene and Henikoff 2017; Skene et al. 2018）である、標的下切断およびヌクレアーゼを使用した放出（ＣＵＴ＆ＲＵＮ）を、ヒストン突然変異を欠いているかまたはＨ３．１もしくはＨ３．３のＨ３テールの２７位におけるリシンのメチオニンへの置換を含有する、患者由来ＤＭＧ細胞系のパネルに適用した（図３３Ａ）。この方法は、高分解能での突然変異型Ｈ３Ｋ２７Ｍヒストンのゲノムワイドな局在のプロファイリングを可能にし、正規化対照としての外来性細胞スパイクインの使用によってゲノムワイドなＨ３Ｋ２７ｍｅ３占有率の高度に定量的な比較を提供する。ＤＭＧ細胞系および非形質転換幹細胞の代表パネルへの定量的ＣＵＴ＆ＲＵＮの適用は、ＤＭＧが幹様細胞マーカーと分化細胞マーカーの混合を同時に発現するにもかかわらず、ヒストン突然変異型ＤＭＧにおける残留ＰＲＣ２活性が、胚性幹細胞におけるＰＲＣ２活性と高度に一致することを明示する。これらの結果は、分化の手がかりおよび低減されたＰＲＣ２活性にもかかわらず原始幹細胞様ＰＲＣ２ランドスケープの保持が、Ｈ３Ｋ２７Ｍ−ＤＭＧの特徴およびこれらの致死性小児腫瘍に対する潜在的脆弱性を規定していることを示す。

結果

ＤＭＧにおけるＨ３Ｋ２７Ｍ堆積は、Ｈ３バリアント依存性である

本発明者らは、先ず、Ｈ３．１またはＨ３．３のどちらかにＫ２７Ｍ突然変異を有する患者ＤＭＧ細胞系におけるＨ３Ｋ２７Ｍオンコヒストンのゲノムワイドな局在の分析を模索した。Ｈ３．１は、複製依存的方法でクロマチンに堆積し、その結果、ゲノム全体にわたって均一に分布している、ヒストンバリアントである（Maze et al. 2014）。対照的に、Ｈ３．３バリアントは、複製非依存的方法で堆積し、高ヒストン代謝回転部位に蓄積する（Maze et al. 2014）。Ｈ３．１Ｋ２７Ｍ−ＤＭＧおよびＨ３．３Ｋ２７Ｍ−ＤＭＧにおけるＨ３Ｋ２７Ｍのゲノムワイドな局在を評定するために、Ｈ３Ｋ２７Ｍに対する抗体を、ＳＵ−ＤＩＰＧ−ＩＶ（Ｈ３．１Ｋ２７Ｍ）、ＳＵ−ＤＩＰＧ−ＸＩＩＩ（Ｈ３．３Ｋ２７Ｍ）およびＶＵＭＣ−１０（ＭＹＣＮ増幅された、Ｈ３野生型）という３種のＤＭＧ細胞系においてＣＵＴ＆ＲＵＮ反応に使用した。抗Ｈ３Ｋ２７Ｍ抗体は、Ｈ３Ｋ２７Ｍに高特異的であるが、Ｈ３．１Ｋ２７ＭとＨ３．３Ｋ２７Ｍとを区別することができない（Piunti et al. 2017；Fang et al. 2018）。Ｈ３．３Ｋ２７ＭＤＭＧ細胞のＨ３Ｋ２７ＭＣＵＴ＆ＲＵＮプロファイルは、Ｈ３．３Ｋ２７Ｍが、定義されたドメインに蓄積することを示す（図３３Ｂ）。さらに、本発明者らが、同じ細胞系においてＨ３Ｋ２７ｍｅ３およびＨ３Ｋ２７ａｃＣＵＴ＆ＲＵＮでＨ３Ｋ２７Ｍを比較したとき、活性ヒストン代謝回転部位へのＨ３．３の組込みと一致して、Ｈ３．３Ｋ２７Ｍピークは、Ｈ３Ｋ２７ａｃピークと密接に相関し、Ｈ３Ｋ２７ｍｅ３ドメインとほとんどオーバーラップを有さなかった（図３３Ｃ）。Ｈ３．３Ｋ２７Ｍ細胞におけるＨ３Ｋ２７Ｍのゲノムワイドな局在の分析は、ＰＴＮ（図３３Ｂ）、Ｈ３Ｆ３ＡおよびＭＹＣを含む、ＤＭＧ発がんに重要な役割を有するいくつかの遺伝子における蓄積を示す（Mackay et al. 2017; Qin et al. 2017）。加えて、Ｈ３．３Ｋ２７Ｍは、原子起始細胞を示唆する、ＥＳＣ再プログラム化因子Ｓｏｘ２およびＭＹＣを含む胚性幹細胞（ＥＳＣ）において、転写的に活性である遺伝子座に存在する（Takahashi and Yamanaka 2006）。ＤＨＨ、ＳＵＦＵ、ＰＴＣＨ１、ＧＬＩ１およびＧＬＩ２を含む、ＳＨＨシグナル伝達経路の成分もまた、Ｈ３Ｋ２７Ｍ蓄積部位であり、これは、ヘッジホッグ経路の活性化を示す（Monje et al. 2011）。

Ｈ３．３Ｋ２７Ｍとは対照的に、Ｈ３．１Ｋ２７Ｍ細胞系においてＨ３Ｋ２７Ｍ抗体を用いるＣＵＴ＆ＲＵＮプロファイリングは、複製依存性組込みと一致して、定義された濃縮ドメインを伴わないゲノム全体にわたる均一な分布を示す（図３３Ｂ、３３Ｃ）。Ｈ３．１Ｋ２７ＭおよびＨ３．３Ｋ２７Ｍは同様のレベルで発現されるので、Ｈ３．１Ｋ２７Ｍ細胞系における同定可能なピークの欠如は、発現に起因するものではない（図３３Ｄ）。Ｈ３．３Ｋ２７ＭおよびＨ３．１Ｋ２７Ｍのヒートマップは、Ｈ３．３Ｋ２７Ｍ−ＤＭＧ細胞系では定義されたピークを明らかに実証する（図３３Ｃ）が、Ｈ３．１Ｋ２７Ｍ系では実証しない。これらのデータは、Ｈ３．１Ｋ２７Ｍが、Ｈ３．３Ｋ２７Ｍバックグラウンドで観察されるバックグラウンドより上のレベルで存在することも実証し、これは、ゲノムワイドに検出可能な組込みを示す（図３３Ｃ）。対照として、Ｈ３Ｋ２７Ｍ抗体をＶＵＭＣ−１０におけるＣＵＴ＆ＲＵＮ反応に使用した。有意なシグナルは観察されず、Ｈ３Ｋ２７Ｍ抗体の特異性を検証するウエスタンブロットにおいてもシグナルは観察されなかった（図３３Ｃ、３３Ｄ）。

Ｈ３Ｋ２７Ｍ−ＤＭＧは、野生型神経膠腫には非存在である特有のＨ３Ｋ２７ｍｅ３ドメインを含有する

Ｈ３．１Ｋ２７ＭおよびＨ３．３Ｋ２７ＭＤＭＧ細胞系における異なるＨ３Ｋ２７Ｍ局在パターンの発見は、Ｈ３Ｋ２７ＭとＨ３Ｋ２７ｍｅ３局在の間の関係を調査する機会を与えた。Ｈ３Ｋ２７Ｍは、直接ＥＺＨ２に結合してＥＺＨ２活性を阻害する（Weinberg et al. 2017；Funato and Tabar 2018）という説が出されており、これは、Ｈ３Ｋ２７ｍｅ３およびＨ３Ｋ２７Ｍが大きいドメインを共占有しないはずであることを含意する。Ｈ３Ｋ２７ｍｅ３およびＨ３Ｋ２７Ｍが、大きいドメイン内で相互排他的であるかどうかを判定するために、本発明者らは、ＤＭＧ細胞系においてＨ３Ｋ２７ｍｅ３特異的抗体を用いてＣＵＴ＆ＲＵＮを行った。本発明者らはまた、外来性スパイクインによって大いに異なるＨ３Ｋ２７ｍｅ３含量を有するＤＭＧ細胞系にわたってＰＲＣ２ドメインサイズおよびロバストネスを定量的に測定するためにＣＵＴ＆ＲＵＮの能力をフルに活用した。本発明者らは、ショウジョウバエＳ２細胞をＣＵＴ＆ＲＵＮ反応にヒト細胞１×１０^６対ショウジョウバエ細胞５×１０^４の固定比で加えた。Ｈ３Ｋ２７ｍｅ３抗体は、ショウジョウバエＨ３Ｋ２７ｍｅ３とヒトＨ３Ｋ２７ｍｅ３の両方を認識するので、ヒトおよびショウジョウバエリードのシーケンシングにより、一致した対照への正規化およびヒト試料間の直接比較を行うことができた。スパイクインリードは、本発明者らの定量的正規化戦略の妥当性を確証する、細胞系間の定量的ウエスタンブロット結果と近いトラックを示した。興味深いことに、Ｈ３Ｋ２７ｍｅ３含量は、ＤＭＧ細胞系間で有意に異なった（図３３Ｄ）が、Ｈ３Ｋ２７ｍｅ３ドメインは、ほぼ検出不能なレベルのＨ３Ｋ２７ｍｅ３を有すると以前に報告されている（Grasso et al. 2015；Piunti et al. 2017）Ｈ３．１Ｋ２７Ｍ細胞系とＨ３．３Ｋ２７Ｍ細胞系の両方を含む、ＤＭＧ細胞系の全てにおいて同定された（図３４Ａ）。Ｐｅａｒｓｏｎ相関分析は、ＤＭＧのゲノミクスおよびトランスクリプトミクス分析で観察された同様の関係（Mackay et al. 2017）と一致して、Ｈ３．１Ｋ２７Ｍ腫瘍とＨ３．３Ｋ２７Ｍ腫瘍間のＨ３Ｋ２７ｍｅ３分布に関してそれらの野生型対応物でのものより高い類似性を明示する（図３４Ｂ）。しかし、分布およびシグナル強度の複合的差異を観察するための、正規化を区別するＬｉｎ相関を使用する相関分析は、Ｈ３．３とＨ３．１の分離を示し、これは、Ｈ３．１Ｋ２７ＭＤＭＧ細胞系におけるＨ３Ｋ２７ｍｅ３堆積低減の結果である（図３４Ｂ）。本発明者らは、ヒストン変異型ＤＭＧにおいて目的の非常に多数の遺伝子座に、腫瘍抑制因子ＷＴ１を含む多くの濃縮領域を見出した（図３４Ａ）。ＣＤＫＮ２ａなどの公知の腫瘍抑制因子は、Ｈ３．３Ｋ２７Ｍおよびヒストン野生型細胞系ではＰＲＣ２標的であるが、Ｈ３．１Ｋ２７Ｍ細胞系ではそうではなく、これは、以前の報告（Piunti et al. 2017）と一致する。

各々の細胞系に特有の特異的Ｈ３Ｋ２７ｍｅ３領域を決定するために、本発明者らは、系統ごとにゲノムワイドに正規化されたシグナルを使用してゲノム内のあらゆる塩基対における任意の２つの系統間のシグナルの最大差を定義し、高度な差異のあるシグナルの連続領域に基づいて「ピーク」と呼んだ。次いで、本発明者らは、ｋ平均法クラスタリングを使用して、各々の細胞系におけるＨ３Ｋ２７ｍｅ３シグナルに基づいて差異のあるＨ３Ｋ２７ｍｅ３ピークを群に分け、その結果、６クラスターを含有する最適な解を得た。異なるＤＭＧ細胞系における差異のあるＨ３Ｋ２７ｍｅ３ドメインの比較は、Ｈ３．１Ｋ２７ＭおよびＨ３．３Ｋ２７Ｍ細胞系に存在しない、野生型細胞系に存在するＰＲＣ２ドメインのいくつかのクラスターを示す（図３４Ｃ）。差異のあるＨ３Ｋ２７ｍｅ３領域の大多数（上位４クラスター）は、野生型に特異的であるが、Ｈ３．３Ｋ２７Ｍ細胞内にＨ３Ｋ２７ｍｅ３を保持する数百の領域（クラスター５）、ならびに野生型における任意の濃縮の非存在下でＨ３．３Ｋ２７ＭにＨ３Ｋ２７ｍｅ３が重度に濃縮されているさらにいくつかの領域（クラスター６）が残存する（図３４Ｃ）。クラスター６ドメインは、非常に多くのＴボックス、フォークヘッドおよびディスタルレスファミリーメンバーを含む、細胞型特異的転写因子とオーバーラップし、これは、ヒストン野生型腫瘍との起始細胞の差を示唆する。クラスター６は、血液学的および卵巣悪性病変においてそれぞれ突然変異されることが多い、ＰＲＤＭ１およびＶＧＬＬ３を含む、いくつかの公知の腫瘍抑制因子も含有する（図３４Ａ）（Mandelbaum et al. 2010；Karube et al. 2011）。

Ｈ３．１Ｋ２７Ｍ細胞系における非常に少ない残留Ｈ３Ｋ２７ｍｅ３ドメインの同定は、Ｈ３Ｋ２７Ｍがこれらの細胞においてゲノムワイドに堆積されることを考えると興味深い（図３３Ｃ、３４Ａ）。この結果は、ＰＲＣ２がＨ３．１Ｋ２７Ｍの局所的存在下で効率は低いが活性であることを示唆する。本発明者らは、ＰＲＣ２ドメインにおいてＨ３．１Ｋ２７Ｍを欠く領域を見出さなかったが、Ｈ３．１の一部を、局所的に退去させ、ＰＲＣ２ドメインの回復を可能にする好適なＥＺＨ２基質である野生型Ｈ３．３によって置き換えることができる可能性もある。この可能性を調査するために、Ｈ３．１Ｋ２７Ｍ細胞系における野生型Ｈ３．３局在を、ＣＵＴ＆ＲＵＮを使用して評定した。Ｋ２７ｍｅ３ドメインにおけるＨ３．３の濃縮は見られない。Ｈ３．１Ｋ２７Ｍ細胞系におけるＨ３．１Ｋ２７Ｍの均一な分布およびＰＲＣ２ドメイン内で観察される一貫したシグナルを考えると、これらのデータは、Ｈ３Ｋ２７ＭおよびＨ３Ｋ２７ｍｅ３がクロマチンにおいて局所的に共存することができることを示唆する。

Ｈ３Ｋ２７Ｍ−ＤＭＧは、原始幹細胞様Ｈ３Ｋ２７ｍｅ３構成を有する

野生型神経膠腫に非存在であるＨ３Ｋ２７Ｍ−ＤＭＧに特異的に保持されるＨ３Ｋ２７ｍｅ３ドメインの同定、およびＨ３Ｋ２７Ｍ含有遺伝子座とＨ３Ｋ２７ｍｅ３含有遺伝子座の共存は、ＤＭＧクロマチンランドスケープが、ＥＺＨ２活性に対するＨ３Ｋ２７Ｍの影響によって専ら決定されるものでない可能性があることを示す。ヒストン突然変異型ＤＭＧにおいて観察される特有のＨ３Ｋ２７ｍｅ３パターンは、それよりむしろ、腫瘍の起始細胞に由来する可能性がある。このことを調査するために、本発明者らは、ＤＭＧにおけるＨ３Ｋ２７ｍｅ３ドメインと、ＤＭＧの推定前駆体が生じた可能性が高い人工発生トラジェクトリーを示す神経幹細胞（ＮＳＣ）およびＥＳＣのパネルにおけるものとの定量的比較を模索した。ＥＳＣは、少ないＨ３Ｋ２７ｍｅ３を有し、以前にＨ３Ｋ２７Ｍ神経膠腫形成のモデルとしての機能を果たしており（Funato et al. 2014）、したがって、Ｈ３突然変異型ＤＭＧとの相対的比較に役立ち、その一方で、胎児前脳由来ＮＳＣは、神経膠芽腫のために確立された対照である（Pollard et al. 2009）。

本発明者らは、非形質転換Ｈ１ＥＳＣおよびＮＳＣ系ＣＢ６６０およびＵ５におけるＨ３Ｋ２７ｍｅ３についてのＣＵＴ＆ＲＵＮを、定量的比較を可能にするための上記スパイクイン戦略を使用して行った。ロバストなＰＲＣ２ドメインが全ての細胞型において同定された（図３５Ａ）。Ｈ３．１Ｋ２７ＭおよびＨ３．３Ｋ２７Ｍ細胞系におけるＨ３Ｋ２７ｍｅ３についてのゲノムワイドなプロファイルは、ヒストン野生型ＤＭＧとよりもＥＳＣおよびＮＳＣ系と一貫して高度に相関する。際だったことに、Ｌｉｎ相関による絶対Ｈ３Ｋ２７ｍｅ３レベルを組み入れる定量的比較は、ＥＳＣ系とＨ３．３Ｋ２７Ｍとの間の高度な関連性を明示し、これは、Ｈ３．３Ｋ２７ＭにおけるＨ３Ｋ２７ｍｅ３ドメインの原始幹細胞様構成を示唆する（図３５Ｂ）。特有のＨ３Ｋ２７ｍｅ３ドメインをさらに調査するために、本発明者らは、以前のＨ３Ｋ２７ｍｅ３差分分析からのヒストン突然変異型ＤＭＧ特異的クラスター（クラスター６）に含有されるＨ３Ｋ２７ｍｅ３濃縮領域に焦点を合せた。ＥＳＣ系とＮＳＣ系の間のクラスター６のＨ３Ｋ２７ｍｅ３ドメインの比較は、それらがＨ３．３Ｋ２７Ｍ細胞系におけるクラスター６で同定されたドメインとのかなりのオーバーラップを有することを示す（図３５Ｃ）。これは、全体的なＨ３Ｋ２７ｍｅ３がＥＳＣにおいて少ないことを考えると興味深く、これらが、原始幹細胞状態の維持にとって重要な部位であることを示す。加えて、相互排他的分化経路に関連する相当な数の転写因子がクラスター６の中に存在し、これらは、ＤＭＧ前駆細胞に既に存在する可能性が高いかまたは二次突然変異の蓄積中に新規に生じる、一連のＰＲＣ２標的に相当する。ＤＭＧに特異的であるが非形質転換幹細胞には非存在であるクラスター６遺伝子には、腫瘍抑制因子遺伝子ＰＲＤＭ１およびＶＧＬＬ３ならびに他の組織特異的転写因子が含まれる。

Ｈ３Ｋ２７Ｍ−ＤＭＧは、活性化発生経路のクロマチンシグネチャーを含有する

Ｈ３Ｋ２７ｍｅ３プロファイリングは、Ｈ３Ｋ２７Ｍ−ＤＭＧが、原始幹細胞様状態を有することを示した；したがって、本発明者らは、ＤＭＧにおけるＨ３Ｋ２７ａｃおよびＨ３．３Ｋ２７Ｍ濃縮が幹細胞様プロファイルも表すかどうかを判定することを模索した。本発明者らは、ＥＳＣ、ＮＳＣおよびＤＭＧにおけるＨ３Ｋ２７ａｃピークとＤＭＧにおけるＨ３．３Ｋ２７Ｍピークを比較する相関行列を生成して、異なる細胞系間の活性クロマチンプロファイルの類似性を同定した。Ｈ３．３Ｋ２７ＭＤＭＧ細胞系におけるＨ３Ｋ２７ａｃおよびＨ３Ｋ２７Ｍは、０．７６および０．８１の高い相関係数を有した（Piunti et al. 2017）（図３６Ａ）。ヒストン野生型ＤＭＧ系は、異なる一連の二次突然変異および推定的に異なる起始細胞（Mackay et al. 2017）と一致して、他のＤＭＧ細胞系との不良な相関を明示した（図３６Ａ）。興味深いことに、Ｈ３突然変異型ＤＭＧ系は、ＥＳＣよりＮＳＣ系と密接に関連していた（図３６Ａ）。これは、Ｈ３突然変異型ＤＭＧにおけるＨ３Ｋ２７ｍｅ３ドメインがＮＳＣよりＥＳＣに類似していたという発見（図３５Ｂ）と対照をなす。Ｈ３．３突然変異型ＤＭＧ細胞におけるＨ３．３Ｋ２７Ｍ濃縮は、ＥＳＣよりＮＳＣにおけるＨ３Ｋ２７ａｃ濃縮と大きく一致していた。これは、Ｈ３．３Ｋ２７Ｍが、全体としてＮＳＣとより類似している活性クロマチン環境に組み込まれることを示す。

Ｈ３突然変異型ＤＭＧ試料に存在する共通のＨ３Ｋ２７Ｍ／Ｈ３Ｋ２７ａｃピークは、Ｕ５細胞系と最も密接に共有される、Ｏｌｉｇ１、Ｏｌｉｇ２（図３６Ｂ）およびＧＦＡＰなどのグリア成熟に関与する遺伝子、ならびに両方のＮＳＣ系と共有される一般的な神経調整因子ＮＥＵＲＯＤ１およびＮＥＳを含む。さらに、ＥＳＣまたはＮＳＣ間で共有されないＨ３Ｋ２７Ｍ／Ｈ３Ｋ２７ａｃピークは、ソニックヘッジホグおよびＷＮＴシグナル伝達経路の成分、ならびにＰＤＧＦＲＡなどのオリゴデンドロサイト前駆体特異的活性遺伝子を含み（図３６Ｂ）、これは、ＮＳＣの発生的に下流の遺伝子の活性化を示す（Filbin et al. 2018）。ＰＯＵ５Ｆ１などのｈＥＳＣ特異的調節因子は、ＤＭＧＨ３Ｋ２７ａｃ／Ｈ３Ｋ２７Ｍピークを欠いているが、それらは、ＥＳＣとＮＳＣの両方において強力に活性である、ＳＯＸ２およびＭＹＣ遺伝子座に存在する（図３６Ｂ）。考え合わせると、これらのデータは、分化を試みるが、幹細胞特異的クロマチン調節機序を停止することができず、その結果、幹細胞関連遺伝子と分化関連活性遺伝子の分化停止および異常な共存が生じる、原始ＤＭＧ前駆細胞と一致する。

Ｈ３．３Ｋ２７Ｍは、ＰＲＣ２ランドスケープを全体的に変えない

ここで提示するデータは、幹細胞様起始細胞および二次突然変異がＤＭＧにおけるクロマチンランドスケープの主要決定因子であるモデルと一致する。以前の研究は、Ｈ３Ｋ２７Ｍの発現が、Ｈ３Ｋ２７ｍｅ３レベルをヒストン変異型ＤＭＧで観察されるレベルに低下させ、ＰＲＣ２分布を再形成することができるが、Ｈ３Ｋ２７ｍｅ３減少の程度および時間枠は、大きく異なることを示唆した（Bender et al. 2013；Chan et al. 2013；Lewis et al. 2013）。加えて、ＥＳＣを使用する、より最近の報告は、Ｈ３．３Ｋ２７ＭがＥＺＨ２をクロマチンに直接動員して、一部の遺伝子座のＥＺＨ２を阻害し、その一方で、他の遺伝子座でのＰＲＣ２活性を助長することを見出した（Fang et al. 2018）。本発明者らのＤＭＧパネルにおけるＰＲＣ２局在を調査するために、本発明者らは、偏性ＰＲＣ２サブユニットＳＵＺ１２および代替サブユニットＭＴＦ２に対する抗体をＣＵＴ＆ＲＵＮ反応において使用した。ＳＵＺ１２およびＭＴＦ２シグナルは、ＥＺＨ２によるＨ３Ｋ２７ｍｅ３の堆積を媒介するＰＲＣ２成分と一致して、両方のＨ３突然変異型ＤＭＧ細胞系におけるＨ３Ｋ２７ｍｅ３ピークの中で高度に濃縮されていた（図３７Ａ、３７Ｂ）。しかし、ＳＵＺ１２およびＭＴＦ２は、Ｈ３．３Ｋ２７Ｍ細胞系においてＨ３Ｋ２７ｍｅ３濃縮ドメイン（図３７Ｂ）と比較してＨ３Ｋ２７Ｍ濃縮ドメインとそれほど共局在しなかった。さらに、ＳＵＺ１２およびＭＴＦ２シグナルは、Ｈ３Ｋ２７Ｍ分布と対照をなすことに、Ｈ３Ｋ２７ｍｅ３ドメインにおけるそれらの濃縮が、ランダムにサンプリングされた領域を上回って有意に上昇しているので、Ｈ３Ｋ２７Ｍ媒介動員によって期待されるゲノムワイドな分布の証拠を、Ｈ３．１Ｋ２７Ｍ細胞系では示さなかった（図３７Ｃ）。さらに、ＳＵＺ１２およびＭＴＦ２シグナルは、どちらの細胞系においてもＨ３Ｋ２７Ｍ領域においてＨ３Ｋ２７Ｍシグナルとあまり相関せず、これは、ＳＵＺ１２およびＭＴＦ２が、Ｈ３Ｋ２７Ｍ依存的様式でゲノムと相互作用する可能性が低いことを示す。本発明者らは、Ｈ３Ｋ２７ＭがＰＲＣ２を隔離する可能性は低いという結論に達した。

本発明者らのデータは、Ｈ３．３Ｋ２７Ｍが、生理レベルで発現されたときＥＺＨ２活性を強く阻害しないはずであることを示す。この仮説を試験するために、本発明者らは、低ＭＯＩのレンチウイルス形質導入システムとプラスミドベースのトランスフェクションシステムの両方を使用して、ＤＭＧにおいて見られるものに類似したレベルでＨ３．３Ｋ２７Ｍを２９３Ｔ細胞に導入した。抗生物質選択を使用して、全ての細胞が適切な構築物を含有することを確実にした。ウエスタンブロットは、６日の発現後、Ｈ３．３Ｋ２７ＭがＨ３．１Ｋ２７ＭおよびＨ３．３Ｋ２７Ｍ細胞系で観察されるものと同様のレベルで存在することを明示する（図３８）。重要なこととして、全Ｈ３レベルと比較すると、異所性Ｈ３．３Ｋ２７Ｍは、全Ｈ３の極一部に相当し、これは、１つのＨ３Ｆ３ＡまたはＨＩＳＴ１Ｈ３ｂ対立遺伝子からの生理的Ｈ３レベルと一致する（図３８）。Ｈ３．３Ｋ２７Ｍのロバストな発現にもかかわらず、Ｈ３Ｋ２７ｍｅ３レベルのわずかな低減が見られる（図３８）。これらのデータは、全体としてＥＺＨ２を強力に阻害するＨ３．３Ｋ２７Ｍと一致せず、それどころか、ＤＭＧにおけるＰＲＣ２ランドスケープが起始細胞と二次突然変異の組合せによって形作られるモデルをさらに支持する（図３９Ａ）。

考察

ＤＭＧは、処置選択肢がほとんどない、発生的に限定された致死性小児ＣＮＳ腫瘍である。これらの腫瘍におけるクロマチンランドスケープの特徴付けは、新たな治療戦略につながり得るが、患者由来の試料および細胞系の少なさにより制限されてきた。単一細胞トランスクリプトミクス分析を使用する最近の報告は、ＤＭＧが、オリゴデンドロサイト前駆細胞と最も転写的に類似しているが、それらが幹細胞と成熟グリアの両方のマーカーを異常に発現することを実証した（Filbin et al. 2018）。発生トラジェクトリーの別の重要な調節因子であるＰＲＣ２活性も、ＤＭＧにおける原始状態と成熟状態の機能障害性の組合せを表すかどうかは不明であった。ここで、本発明者らは、ＣＵＴ＆ＲＵＮを使用して、ＤＭＧ細胞系および非形質転換幹細胞の代表パネルにおいてクロマチンランドスケープをプロファイリングした。本発明者らのデータは、Ｈ３Ｋ２７Ｍ−ＤＭＧに存在する低い残留ＰＲＣ２活性レベルが、ＥＳＣＰＲＣ２ランドスケープと最もよく似ていることを示す。クロマチンの転写活性領域の探索は、ＧＦＡＰを含む成熟グリアのマーカーと並行してＳＯＸ２およびＭＹＣの発現を示す。考え合わせると、本発明者らのデータは、発達プログラムの活性化およびＨ３Ｋ２７Ｍの存在にもかかわらずＥＳ様ＰＲＣ２活性を駆動する幹細胞特異的クロマチン調節ネットワークと一致する。

本発明者らのＣＵＴ＆ＲＵＮアプローチによって、本発明者らは、ＤＭＧにおけるＰＲＣ２ランドスケープへのＨ３．１Ｋ２７ＭおよびＨ３．３Ｋ２７Ｍの寄与についての現行のモデルを詳細に分析することもできた。これらの一部は、Ｈ３Ｋ２７Ｍに対するＥＺＨ２の親和性増大を中心としたものである（Weinberg et al. 2017；Fang et al. 2018；Funato and Tabar 2018）。最近の研究は、Ｈ３．３Ｋ２７Ｍが、マウスＥＳＣにおいて一部の見込みのあるエンハンサーではＥＺＨ２を不適切に隔離し、阻害し得る一方で他の遺伝子座ではＰＲＣ２活性を助長し得ることを示唆した（Fang et al. 2018）。それらのモデルによって、ＰＲＣ２成分は、隔離に起因して、Ｈ３．３Ｋ２７Ｍ−ＤＭＧ細胞系のＨ３Ｋ２７Ｍ部位の大きいサブセットに局在するはずであり、そうでなければＰＲＣ２活性は有意には変更されないことになることが予測される。本発明者らのデータセットは、Ｈ３Ｋ２７Ｍ濃縮部位とＰＲＣ２成分の間にほとんどオーバーラップがないことを観察した。これは、隔離と矛盾する。さらに、本発明者らは、２９３ＴにおけるＨ３．３Ｋ２７Ｍの生理レベルの異所性発現が、Ｈ３Ｋ２７ｍｅ３レベルを低下させないことも見出した。これは、全体的にＥＺＨ２を強く阻害するＨ３．３Ｋ２７Ｍの概念（Weinberg et al. 2017）を支持しない。本発明者らのデータは、Ｈ３．３Ｋ２７ＭのＥＺＨ２との相互作用が、Ｈ３．３Ｋ２７Ｍ−ＤＭＧに見られるＰＲＣ２活性低下の主要決定因子である可能性が低いことを示す。

Ｈ３．１突然変異型ＤＭＧにおけるＰＲＣ２ランドスケープに対するＨ３．１Ｋ２７Ｍの影響は、不明である。本発明者らは、Ｈ３．１Ｋ２７Ｍ−ＤＭＧで観察された異常なクロマチンランドスケープをよりよく理解するために本発明者らのＨ３Ｋ２７ｍｅ３、Ｈ３Ｋ２７ＭおよびＨ３Ｋ２７ａｃデータを使用した。Ｈ３．１突然変異型ＤＭＧの本発明者らのプロファイリングは、Ｈ３．１Ｋ２７Ｍが複製依存的様式でゲノムワイドに堆積されることを明示した。定量的ＣＵＴ＆ＲＵＮは、特別低い残留ＰＲＣ２活性およびＨ３．１Ｋ２７Ｍとの共存を明らかにした。ＰＲＣ２活性の残存部位は、Ｈ３．３Ｋ２７Ｍ−ＤＭＧおよびＥＳＣに存在するものと同様であった。本発明者らはまた、隔離モデルの別の予測である、Ｈ３．１Ｋ２７Ｍにより動員されるＰＲＣ２成分のゲノムワイドな堆積の証拠を観察しなかった。代わりに、本発明者らのデータは、クロマチン関連Ｈ３Ｋ２７Ｍが、ＰＲＣ２活性を局所的に阻害し、しかし幹細胞特異的ＰＲＣ２動員機序が、遺伝子座のサブセットにおけるＨ３Ｋ２７Ｍ阻害を克服し、ＷＴ１などの腫瘍抑制因子遺伝子座を抑制することにより腫瘍形成を助長することと一致する（図３９Ｂ）。

Ｈ３Ｋ２７Ｍが、ＤＭＧに見られる異常なＰＲＣ２ランドスケープの主要決定因子でないとすれば、それらはどのようにして生じるのか。本発明者らのデータは、起始細胞、発生状況および二次突然変異が相乗的に作用して、ＤＭＧにおいてＨ３Ｋ２７Ｍが作用するＰＲＣ２ランドスケープを決定付けることを示す（図３９Ａ）。これらのデータは、起始細胞に既に存在することもあり、または二次突然変異により媒介される脱分化中に獲得されることもあるＨ３．３Ｋ２７Ｍが原始幹細胞様クロマチン構成を有する細胞においてその効果を発揮するモデルも支持する。Ｈ３Ｋ２７Ｍが神経膠腫形成の初期の事象であることを実証する系統発生学的分析は、腫瘍形成を助長するために、二次突然変異の獲得および発生学的に調節されているシグナル伝達カスケードの活性化の前にＨ３Ｋ２７Ｍが存在する必要があること（Nikbakht et al. 2016）を主張している。Ｈ３．３Ｋ２７Ｍは、ＳＯＸ２およびＭＹＣなどの、分化中にサイレンシングを必要とする転写活性遺伝子座に組み込まれているときに新たなＰＲＣ２ドメインが発生するのを防止して、幹細胞調節ネットワークの活性化を保存するが、分化の手がかりに対する応答を可能にすることによって、発がんに寄与する可能性が高い（図３９Ｂ）。対照的に、Ｈ３．１Ｋ２７Ｍのゲノムワイドな分布は、クロマチンをＰＲＣ２活性に対して非応答性にして、ある特定の増殖促進性遺伝子のサイレンシングを防止し、その一方で、幹細胞特異的ＰＲＣ２動員機序は、腫瘍抑制因子の不十分だが有効な抑制を助長する（図３９Ｂ）。最近の報告は、Ｈ３．３Ｋ２７Ｍが、Ｃｂｘ７とクロマチンの会合を低減させること（Tatavosian et al. 2018）、およびＣｂｘタンパク質には、発生学的に調節されているＰＲＣ２ドメインの確立において十分に実証された役割を果たすこと（Morey et al. 2012）を示したので、本発明者らは、クロモドメイン含有タンパク質がＨ３Ｋ２７Ｍの標的であり得ると推測した。

Ｈ３Ｋ２７Ｍが、ある特定のクロマチン状況でしか腫瘍形成に寄与することができないことを示唆する本発明のモデルは、細胞型および発生期に依存するＨ３Ｋ２７Ｍに対する差異のある感受性を示す他の研究（Funato et al. 2014; Pathania et al. 2017）によって裏づけられる。さらに、Ｈ３Ｋ２７Ｍ突然変異型ＤＭＧと同様のＨ３Ｋ２７ｍｅ３レベルでの乳児上衣腫および放射状グリアの最近の同定により、Ｈ３Ｋ２７突然変異は、異常に低いレベルのＰＲＣ２活性を促進するために必要でないことが示された（Bayliss et al. 2016）。加えて、ＲＵＮＸ１突然変異との組合せでのみ見出される急性骨髄性白血病のサブセットにおけるＨ３Ｋ２７Ｍの最近の同定は、Ｈ３Ｋ２７Ｍの影響が、少ないＨ３Ｋ２７ｍｅ３により定義される幹細胞様クロマチン状態において最も顕著であるモデルを、さらに支持する（Lehnertz et al. 2017）。その報告書において、単独でのＲＵＮＸ１突然変異は、ＲＵＮＸ１野生型芽細胞より低いＨ３Ｋ２７ｍｅ３レベルを有し、ＲＵＮＸ１突然変異とＨ３．１Ｋ２７Ｍの組合せは、ＲＵＮＸ１突然変異型ヒストン野生型細胞より低いレベルを有した。ＡＣＶＲ１突然変異およびＰＤＧＦＲＡ増幅は、ＤＭＧにおいて、ＡＭＬにおけるＲＵＮＸ１突然変異に類似した役割を果たして、細胞をＨ３Ｋ２７Ｍの効果に感作させることができる。考え合わせると、これらの発見は、二次突然変異と発生状況が、ＰＲＣ２活性を低下させて、Ｈ３Ｋ２７Ｍオンコヒストンがそれらの効果を発揮する環境を提供するのに十分なものであり得ることを実証する。

ＤＭＧにおける活性化発生プログラムと共存する幹細胞様ＰＲＣ２ランドスケープの発見は、臨床的および治療的意味も持つ。ＥＺＨ２阻害剤またはＨＤＡＣ阻害剤などの、幹細胞様ＰＲＣ２活性の分解を助長し得るクロマチン修飾酵素の小分子阻害剤と組み合わせた、レチノイン酸などの従来の戦略での分化の誘導は、どちらかの単独療法としての使用より効果的である可能性がある。ここで提示するモデルはまた、ＤＭＧは、原始幹細胞より高レベルのＨ３Ｋ２７ｍｅ３を有するＰＲＣ２ドメインのサブセットを含有するので、ＥＺＨ２阻害剤単剤療法に対するＤＭＧの感受性が、他の原始幹細胞の感受性より高い可能性が低いことを示唆する。ＣＮＳ腫瘍のＥＺＨ２阻害剤を受けた小児患者において発生する続発性Ｔ細胞リンパ腫についての最近の報告は、ＥＺＨ２阻害剤に対する幹細胞感受性と一致しており、分化を助長する一方でＰＲＣ２媒介抑制を軽減するコンビナトリアル療法の利点を主張している。ＤＭＧにおける分化誘導およびクロマチン修飾剤と組み合わせた、チロシンキナーゼ阻害剤でのＰＤＧＦＲＡ増幅などの二次突然変異の標的化もまた、これらの例外なく致命的な小児悪性疾患のための実りの多い治療アプローチであり得る。

材料および方法細胞培養

ＳＵ−ＤＩＰＧ−ＩＶ（Ｈ３．１Ｋ２７Ｍ）、ＳＵ−ＤＩＰＧ−ＶＩ（Ｈ３．３Ｋ２７Ｍ）およびＳＵ−ＤＩＰＧ−ＸＩＩＩ（Ｈ３．３Ｋ２７Ｍ）細胞は、寛大にもスタンフォード大学のＭ．Ｍｏｎｊｅ研究室によって提供されたものである。ＶＵＭＣ−１０細胞を入手した。ペニシリン／ストレプトマイシンを補足した、２０ｎｇ／ｍＬのヒトＥＧＦと２０ｎｇ／ｍＬのヒトｂＦＧＦとを補足したＮｅｕｒｏＣｕｌｔ培地（ＳｔｅｍＣｅｌｌＴｅｃｈｎｏｌｏｇｉｅｓ、Ｖａｎｃｏｕｖｅｒ、ＢＣ）で、細胞を成長させた。解離のためにアキュターゼを用いて、細胞を継代させた。１８ｍＭのＬ−グルタミンを補足したＨＹＱ−ＳＦＸ昆虫培地（ＴｈｅｒｍｏＦｉｓｈｅｒ）でショウジョウバエＳ２細胞を対数期まで成長させ、擦過により収集した。１０％ウシ胎仔血清と２ｍＭのＬ−グルタミンとを補足したＤＭＥＭ（ＴｈｅｒｍｏＦｉｓｈｅｒ）で２９３Ｔ細胞を成長させた。

全細胞溶解物調製：

試料ごとに、約３〜５×１０６細胞をペレット化し、ＰＢＳで１回洗浄し、２００μＬの標準タンパク質試料緩衝剤をペレットに添加した。試料をボルテックスし、５分間１０００Ｃで沸騰させ、室温に冷却した。ベンゾナーゼ（１μＬ）を添加し、試料を室温で５分間インキュベートした後、さらなる使用のために凍結した。

ＣＵＴ＆ＲＵＮ

ＣＵＴ＆ＲＵＮは、記載されているように行った（Skene et al. 2018）。使用した抗体は、Ｈ３Ｋ２７ｍｅ３（ＣｅｌｌＳｉｇｎａｌｉｎｇＴｅｃｈｎｏｌｏｇｉｅｓ９７３３）、Ｈ３Ｋ２７Ｍ（Ａｂｃａｍａｂ１９０６３１）、Ｈ３Ｋ２７ａｃ（ＭｉｌｌｉｐｏｒｅＭＡＢＥ６４７）、Ｈ３（Ａｂｃａｍａｂ２４８３４）、Ｈ３．３（Ａｂｎｏｖａ）、ＭＴＦ２（ＴｈｅｒｍｏＦｉｓｈｅｒ）、ＳＵＺ１２（Ａｂｃａｍａｂ１２０７３）およびウサギＩｇＧアイソタイプ対照ＥＰＲ２５Ａ（Ａｂｃａｍａｂ１７２７３０）を含む。ＣＵＴ＆ＲＵＮ反応のために、１：５０で使用したＳＵＺ１２およびＭＴＦ２を除いて、全ての抗体を１：１００希釈で使用した。スパイクイン正規化は、ＶｉＣｅｌｌ（ＴｈｅｒｍｏＦｉｓｈｅｒ）によってカウントして、ヒト細胞１，０００，０００個対Ｓ２細胞５０，０００個の比でショウジョウバエＳ２細胞を用いて行った。

ライブラリー調製およびシーケンシング

抽出されたＤＮＡをＫＡＰＡＨｙｐｅｒ−ｐｒｅｐライブラリー調製キットプロトコール（Ｒｏｃｈｅ，Ｉｎｃ．）に供し、記載されているような（Lu et al Orkin Cell 2018）、小さい断片を保存するために末端修復反応およびポリＡテーリング反応を＜６０℃で行う改良を加えて、以前に記載された（Skene and Henikoff 2017）ように増幅した。Ｂｏｗｔｉｅ２を使用して、ヒトリードをｈｇ１９とアラインメントした。ＩｇＧ対照と比較して濃縮部位を同定するためのカスタムスクリプトは、github.com/Henikoff/Cut-and-Runで入手可能である。

データ分析

シーケシングリードを、Ｂｏｗｔｉｅ２（Langmead et al. 2012）を使用して構築したｈｇ１９ゲノムにマッピングし、ＢｅｄＴｏｏｌ（Quinlan and Hall 2010）を使用してペアードエンド断片ＢＥＤファイルおよびスパイク正規化ｂｅｄＧｒａｐｈを生成した。ｈｇ１９ゲノムに及ぶ１０ｋｂウインドウにマッピングする正規化された断片カウントを使用して、Ｒ（www.r-project.org）で相関ヒートマップを生成した。カスタムスクリプトを使用して、濃縮領域および領域頂点をコールした。Ｒのｇｇｐｌｏｔユーティリティー（ggplot2.tidyverse.org）を使用して、ＣＵＴ＆ＲＵＮ散布図を生成した。ｄｅｅｐＴｏｏｌ（Ramirez et al. 2014）を使用して、ＣＵＴ＆ＲＵＮシグナルヒートマップおよびメタプロットプロファイルを生成した。ＢｅｄＴｏｏｌｉｎｔｅｒｓｅｃｔユーティリティーを使用して、濃縮領域共通部分を定量した。ＩｎｔｅｇｒａｔｉｖｅＧｅｎｏｍｉｃｓＶｉｅｗｅｒ（Robinson et al. 2011）を使用して、データセットを可視化した。

実施例５のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）

ＢａｙｌｉｓｓＪ，ＭｕｋｈｅｒｊｅｅＰ，ＬｕＣ，ＪａｉｎＳＵ，ＣｈｕｎｇＣ，ＭａｒｔｉｎｅｚＤ，ＳａｂａｒｉＢ，ＭａｒｇｏｌＡＳ，ＰａｎｗａｌｋａｒＰ，ＰａｒｏｌｉａＡｅｔａｌ．２０１６．ＬｏｗｅｒｅｄＨ３Ｋ２７ｍｅ３ａｎｄＤＮＡｈｙｐｏｍｅｔｈｙｌａｔｉｏｎｄｅｆｉｎｅｐｏｏｒｌｙｐｒｏｇｎｏｓｔｉｃｐｅｄｉａｔｒｉｃｐｏｓｔｅｒｉｏｒｆｏｓｓａｅｐｅｎｄｙｍｏｍａｓ．ＳｃｉＴｒａｎｓｌＭｅｄ８：３６６ｒａ１６１．

ＢｅｎｄｅｒＳ，ＴａｎｇＹ，ＬｉｎｄｒｏｔｈＡＭ，ＨｏｖｅｓｔａｄｔＶ，ＪｏｎｅｓＤＴ，ＫｏｏｌＭ，ＺａｐａｔｋａＭ，ＮｏｒｔｈｃｏｔｔＰＡ，ＳｔｕｒｍＤ，ＷａｎｇＷｅｔａｌ．２０１３．ＲｅｄｕｃｅｄＨ３Ｋ２７ｍｅ３ａｎｄＤＮＡｈｙｐｏｍｅｔｈｙｌａｔｉｏｎａｒｅｍａｊｏｒｄｒｉｖｅｒｓｏｆｇｅｎｅｅｘｐｒｅｓｓｉｏｎｉｎＫ２７Ｍｍｕｔａｎｔｐｅｄｉａｔｒｉｃｈｉｇｈ−ｇｒａｄｅｇｌｉｏｍａｓ．ＣａｎｃｅｒＣｅｌｌ２４：６６０− ６７２．

ＣｈａｎＫＭ，ＦａｎｇＤ，ＧａｎＨ，ＨａｓｈｉｚｕｍｅＲ，ＹｕＣ，ＳｃｈｒｏｅｄｅｒＭ，ＧｕｐｔａＮ，ＭｕｅｌｌｅｒＳ，ＪａｍｅｓＣＤ，ＪｅｎｋｉｎｓＲｅｔａｌ．２０１３．ＴｈｅｈｉｓｔｏｎｅＨ３．３Ｋ２７ＭｍｕｔａｔｉｏｎｉｎｐｅｄｉａｔｒｉｃｇｌｉｏｍａｒｅｐｒｏｇｒａｍｓＨ３Ｋ２７ｍｅｔｈｙｌａｔｉｏｎａｎｄｇｅｎｅｅｘｐｒｅｓｓｉｏｎ．ＧｅｎｅｓＤｅｖ２７：９８５−９９０．

ＦａｎｇＤ，ＧａｎＨ，ＣｈｅｎｇＬ，ＬｅｅＪＨ，ＺｈｏｕＨ，ＳａｒｋａｒｉａＪＮ，ＤａｎｉｅｌｓＤＪ，ＺｈａｎｇＺ．２０１８．Ｈ３．３Ｋ２７ＭｍｕｔａｎｔｐｒｏｔｅｉｎｓｒｅｐｒｏｇｒａｍｅｐｉｇｅｎｏｍｅｂｙｓｅｑｕｅｓｔｅｒｉｎｇｔｈｅＰＲＣ２ｃｏｍｐｌｅｘｔｏｐｏｉｓｅｄｅｎｈａｎｃｅｒｓ．Ｅｌｉｆｅ７．

ＦｉｌｂｉｎＭＧ，ＴｉｒｏｓｈＩ，ＨｏｖｅｓｔａｄｔＶ，ＳｈａｗＭＬ，ＥｓｃａｌａｎｔｅＬＥ，ＭａｔｈｅｗｓｏｎＮＤ，ＮｅｆｔｅｌＣ，ＦｒａｎｋＮ，ＰｅｌｔｏｎＫ，ＨｅｂｅｒｔＣＭｅｔａｌ．２０１８．ＤｅｖｅｌｏｐｍｅｎｔａｌａｎｄｏｎｃｏｇｅｎｉｃｐｒｏｇｒａｍｓｉｎＨ３Ｋ２７Ｍｇｌｉｏｍａｓｄｉｓｓｅｃｔｅｄｂｙｓｉｎｇｌｅ−ｃｅｌｌＲＮＡ−ｓｅｑ．Ｓｃｉｅｎｃｅ３６０：３３１−３３５．

ＦｕｎａｔｏＫ，ＭａｊｏｒＴ，ＬｅｗｉｓＰＷ，ＡｌｌｉｓＣＤ，ＴａｂａｒＶ．２０１４．ＵｓｅｏｆｈｕｍａｎｅｍｂｒｙｏｎｉｃｓｔｅｍｃｅｌｌｓｔｏｍｏｄｅｌｐｅｄｉａｔｒｉｃｇｌｉｏｍａｓｗｉｔｈＨ３．３Ｋ２７Ｍｈｉｓｔｏｎｅｍｕｔａｔｉｏｎ．Ｓｃｉｅｎｃｅ３４６：１５２９−１５３３．

ＦｕｎａｔｏＫ，ＴａｂａｒＶ．２０１８．ＨｉｓｔｏｎｅＭｕｔａｔｉｏｎｓｉｎＣａｎｃｅｒ．ＡｎｎｕａｌＲｅｖｉｅｗｏｆＣａｎｃｅｒＢｉｏｌｏｇｙ２：３３７− ３５１．

ＧｒａｓｓｏＣＳ，ＴａｎｇＹ，ＴｒｕｆｆａｕｘＮ，ＢｅｒｌｏｗＮＥ，ＬｉｕＬ，ＤｅｂｉｌｙＭＡ，ＱｕｉｓｔＭＪ，ＤａｖｉｓＬＥ，ＨｕａｎｇＥＣ，ＷｏｏＰＪｅｔａｌ．２０１５．Ｆｕｎｃｔｉｏｎａｌｌｙｄｅｆｉｎｅｄｔｈｅｒａｐｅｕｔｉｃｔａｒｇｅｔｓｉｎｄｉｆｆｕｓｅｉｎｔｒｉｎｓｉｃｐｏｎｔｉｎｅｇｌｉｏｍａ．ＮａｔＭｅｄ２１：５５５−５５９．

ＪｕｓｔｉｎＮ，ＺｈａｎｇＹ，ＴａｒｒｉｃｏｎｅＣ，ＭａｒｔｉｎＳＲ，ＣｈｅｎＳ，ＵｎｄｅｒｗｏｏｄＥ，ＤｅＭａｒｃｏＶ，ＨａｉｒｅＬＦ，ＷａｌｋｅｒＰＡ，ＲｅｉｎｂｅｒｇＤｅｔａｌ．２０１６．ＳｔｒｕｃｔｕｒａｌｂａｓｉｓｏｆｏｎｃｏｇｅｎｉｃｈｉｓｔｏｎｅＨ３Ｋ２７Ｍｉｎｈｉｂｉｔｉｏｎｏｆｈｕｍａｎｐｏｌｙｃｏｍｂｒｅｐｒｅｓｓｉｖｅｃｏｍｐｌｅｘ２．ＮａｔＣｏｍｍｕｎ７：１１３１６．

ＫａｒｕｂｅＫ，ＮａｋａｇａｗａＭ，ＴｓｕｚｕｋｉＳ，ＴａｋｅｕｃｈｉＩ，ＨｏｎｍａＫ，ＮａｋａｓｈｉｍａＹ，ＳｈｉｍｉｚｕＮ，ＫｏＹＨ，ＭｏｒｉｓｈｉｍａＹ，ＯｈｓｈｉｍａＫｅｔａｌ．２０１１．ＩｄｅｎｔｉｆｉｃａｔｉｏｎｏｆＦＯＸＯ３ａｎｄＰＲＤＭ１ａｓｔｕｍｏｒ− ｓｕｐｐｒｅｓｓｏｒｇｅｎｅｃａｎｄｉｄａｔｅｓｉｎＮＫ−ｃｅｌｌｎｅｏｐｌａｓｍｓｂｙｇｅｎｏｍｉｃａｎｄｆｕｎｃｔｉｏｎａｌａｎａｌｙｓｅｓ．Ｂｌｏｏｄ１１８：３１９５−３２０４．

ＬｅｈｎｅｒｔｚＢ，ＺｈａｎｇＹＷ，ＢｏｉｖｉｎＩ，ＭａｙｏｔｔｅＮ，ＴｏｍｅｌｌｉｎｉＥ，ＣｈａｇｒａｏｕｉＪ，ＬａｖａｌｌｅｅＶＰ，ＨｅｂｅｒｔＪ，ＳａｕｖａｇｅａｕＧ．２０１７．Ｈ３（Ｋ２７Ｍ／Ｉ）ｍｕｔａｔｉｏｎｓｐｒｏｍｏｔｅｃｏｎｔｅｘｔ−ｄｅｐｅｎｄｅｎｔｔｒａｎｓｆｏｒｍａｔｉｏｎｉｎａｃｕｔｅｍｙｅｌｏｉｄｌｅｕｋｅｍｉａｗｉｔｈＲＵＮＸ１ａｌｔｅｒａｔｉｏｎｓ．Ｂｌｏｏｄ１３０：２２０４−２２１４．

ＬｅｗｉｓＰＷ，ＭｕｌｌｅｒＭＭ，ＫｏｌｅｔｓｋｙＭＳ，ＣｏｒｄｅｒｏＦ，ＬｉｎＳ，ＢａｎａｓｚｙｎｓｋｉＬＡ，ＧａｒｃｉａＢＡ，ＭｕｉｒＴＷ，ＢｅｃｈｅｒＯＪ，ＡｌｌｉｓＣＤ．２０１３．ＩｎｈｉｂｉｔｉｏｎｏｆＰＲＣ２ａｃｔｉｖｉｔｙｂｙａｇａｉｎ−ｏｆ−ｆｕｎｃｔｉｏｎＨ３ｍｕｔａｔｉｏｎｆｏｕｎｄｉｎｐｅｄｉａｔｒｉｃｇｌｉｏｂｌａｓｔｏｍａ．Ｓｃｉｅｎｃｅ３４０：８５７−８６１．

ＭａｃｋａｙＡ，ＢｕｒｆｏｒｄＡ，ＣａｒｖａｌｈｏＤ，ＩｚｑｕｉｅｒｄｏＥ，Ｆａｚａｌ−ＳａｌｏｍＪ，ＴａｙｌｏｒＫＲ，ＢｊｅｒｋｅＬ，ＣｌａｒｋｅＭ，ＶｉｎｃｉＭ，ＮａｎｄｈａｂａｌａｎＭｅｔａｌ．２０１７．ＩｎｔｅｇｒａｔｅｄＭｏｌｅｃｕｌａｒＭｅｔａ−Ａｎａｌｙｓｉｓｏｆ１，０００ＰｅｄｉａｔｒｉｃＨｉｇｈ−ＧｒａｄｅａｎｄＤｉｆｆｕｓｅＩｎｔｒｉｎｓｉｃＰｏｎｔｉｎｅＧｌｉｏｍａ．ＣａｎｃｅｒＣｅｌｌ３２：５２０−５３７ｅ５２５．

ＭａｎｄｅｌｂａｕｍＪ，ＢｈａｇａｔＧ，ＴａｎｇＨ，ＭｏＴ，ＢｒａｈｍａｃｈａｒｙＭ，ＳｈｅｎＱ，ＣｈａｄｂｕｒｎＡ，ＲａｊｅｗｓｋｙＫ，ＴａｒａｋｈｏｖｓｋｙＡ，ＰａｓｑｕａｌｕｃｃｉＬｅｔａｌ．２０１０．ＢＬＩＭＰ１ｉｓａｔｕｍｏｒｓｕｐｐｒｅｓｓｏｒｇｅｎｅｆｒｅｑｕｅｎｔｌｙｄｉｓｒｕｐｔｅｄｉｎａｃｔｉｖａｔｅｄＢｃｅｌｌ−ｌｉｋｅｄｉｆｆｕｓｅｌａｒｇｅＢｃｅｌｌｌｙｍｐｈｏｍａ．ＣａｎｃｅｒＣｅｌｌ１８：５６８−５７９．

ＭａｚｅＩ，ＮｏｈＫＭ，ＳｏｓｈｎｅｖＡＡ，ＡｌｌｉｓＣＤ．２０１４．Ｅｖｅｒｙａｍｉｎｏａｃｉｄｍａｔｔｅｒｓ：ｅｓｓｅｎｔｉａｌｃｏｎｔｒｉｂｕｔｉｏｎｓｏｆｈｉｓｔｏｎｅｖａｒｉａｎｔｓｔｏｍａｍｍａｌｉａｎｄｅｖｅｌｏｐｍｅｎｔａｎｄｄｉｓｅａｓｅ．ＮａｔＲｅｖＧｅｎｅｔ１５：２５９−２７１．

ＭｏｈａｍｍａｄＦ，ＷｅｉｓｓｍａｎｎＳ，ＬｅｂｌａｎｃＢ，ＰａｎｄｅｙＤＰ，ＨｏｊｆｅｌｄｔＪＷ，ＣｏｍｅｔＩ，ＺｈｅｎｇＣ，ＪｏｈａｎｓｅｎＪＶ，ＲａｐｉｎＮ，ＰｏｒｓｅＢＴｅｔａｌ．２０１７．ＥＺＨ２ｉｓａｐｏｔｅｎｔｉａｌｔｈｅｒａｐｅｕｔｉｃｔａｒｇｅｔｆｏｒＨ３Ｋ２７Ｍ−ｍｕｔａｎｔｐｅｄｉａｔｒｉｃｇｌｉｏｍａｓ．ＮａｔＭｅｄ２３：４８３−４９２．

ＭｏｎｊｅＭ，ＭｉｔｒａＳＳ，ＦｒｅｒｅｔＭＥ，ＲａｖｅｈＴＢ，ＫｉｍＪ，ＭａｓｅｋＭ，ＡｔｔｅｍａＪＬ，ＬｉＧ，ＨａｄｄｉｘＴ，ＥｄｗａｒｄｓＭＳｅｔａｌ．２０１１．Ｈｅｄｇｅｈｏｇ−ｒｅｓｐｏｎｓｉｖｅｃａｎｄｉｄａｔｅｃｅｌｌｏｆｏｒｉｇｉｎｆｏｒｄｉｆｆｕｓｅｉｎｔｒｉｎｓｉｃｐｏｎｔｉｎｅｇｌｉｏｍａ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１０８：４４５３−４４５８．

ＭｏｒｅｙＬ，ＰａｓｃｕａｌＧ，ＣｏｚｚｕｔｏＬ，ＲｏｍａＧ，ＷｕｔｚＡ，ＢｅｎｉｔａｈＳＡ，ＤｉＣｒｏｃｅＬ．２０１２．ＮｏｎｏｖｅｒｌａｐｐｉｎｇｆｕｎｃｔｉｏｎｓｏｆｔｈｅＰｏｌｙｃｏｍｂｇｒｏｕｐＣｂｘｆａｍｉｌｙｏｆｐｒｏｔｅｉｎｓｉｎｅｍｂｒｙｏｎｉｃｓｔｅｍｃｅｌｌｓ．ＣｅｌｌＳｔｅｍＣｅｌｌ１０：４７−６２．

ＭｏｒｇａｎＭＡ，ＳｈｉｌａｔｉｆａｒｄＡ．２０１３．Ｍｅｄｉｃｉｎｅ．（Ｐｏｌｙ）ｃｏｍｂｉｎｇｔｈｅｐｅｄｉａｔｒｉｃｃａｎｃｅｒｇｅｎｏｍｅｆｏｒａｎｓｗｅｒｓ．Ｓｃｉｅｎｃｅ３４０：８２３−８２４．

ＮｉｋｂａｋｈｔＨ，ＰａｎｄｉｔｈａｒａｔｎａＥ，ＭｉｋａｅｌＬＧ，ＬｉＲ，ＧａｙｄｅｎＴ，ＯｓｍｏｎｄＭ，ＨｏＣＹ，ＫａｍｂｈａｍｐａｔｉＭ，ＨｗａｎｇＥＩ，ＦａｕｒｙＤｅｔａｌ．２０１６．Ｓｐａｔｉａｌａｎｄｔｅｍｐｏｒａｌｈｏｍｏｇｅｎｅｉｔｙｏｆｄｒｉｖｅｒｍｕｔａｔｉｏｎｓｉｎｄｉｆｆｕｓｅｉｎｔｒｉｎｓｉｃｐｏｎｔｉｎｅｇｌｉｏｍａ．ＮａｔＣｏｍｍｕｎ７：１１１８５．

ＰａｔｈａｎｉａＭ，ＤｅＪａｙＮ，ＭａｅｓｔｒｏＮ，ＨａｒｕｔｙｕｎｙａｎＡＳ，ＮｉｔａｒｓｋａＪ，ＰａｈｌａｖａｎＰ，ＨｅｎｄｅｒｓｏｎＳ，ＭｉｋａｅｌＬＧ，Ｒｉｃｈａｒｄ−ＬｏｎｄｔＡ，ＺｈａｎｇＹｅｔａｌ．２０１７．Ｈ３．３（Ｋ２７Ｍ）ＣｏｏｐｅｒａｔｅｓｗｉｔｈＴｒｐ５３ＬｏｓｓａｎｄＰＤＧＦＲＡＧａｉｎｉｎＭｏｕｓｅＥｍｂｒｙｏｎｉｃＮｅｕｒａｌＰｒｏｇｅｎｉｔｏｒＣｅｌｌｓｔｏＩｎｄｕｃｅＩｎｖａｓｉｖｅＨｉｇｈ− ＧｒａｄｅＧｌｉｏｍａｓ．ＣａｎｃｅｒＣｅｌｌ３２：６８４−７００ｅ６８９．

ＰｉｕｎｔｉＡ，ＨａｓｈｉｚｕｍｅＲ，ＭｏｒｇａｎＭＡ，ＢａｒｔｏｍＥＴ，ＨｏｒｂｉｎｓｋｉＣＭ，ＭａｒｓｈａｌｌＳＡ，ＲｅｎｄｌｅｍａｎＥＪ，ＭａＱ，ＴａｋａｈａｓｈｉＹＨ，ＷｏｏｄｆｉｎＡＲｅｔａｌ．２０１７．ＴｈｅｒａｐｅｕｔｉｃｔａｒｇｅｔｉｎｇｏｆｐｏｌｙｃｏｍｂａｎｄＢＥＴｂｒｏｍｏｄｏｍａｉｎｐｒｏｔｅｉｎｓｉｎｄｉｆｆｕｓｅｉｎｔｒｉｎｓｉｃｐｏｎｔｉｎｅｇｌｉｏｍａｓ．ＮａｔＭｅｄ２３：４９３−５００．

ＰｏｌｌａｒｄＳＭ，ＹｏｓｈｉｋａｗａＫ，ＣｌａｒｋｅＩＤ，ＤａｎｏｖｉＤ，ＳｔｒｉｃｋｅｒＳ，ＲｕｓｓｅｌｌＲ，ＢａｙａｎｉＪ，ＨｅａｄＲ，ＬｅｅＭ，ＢｅｒｎｓｔｅｉｎＭｅｔａｌ．２００９．Ｇｌｉｏｍａｓｔｅｍｃｅｌｌｌｉｎｅｓｅｘｐａｎｄｅｄｉｎａｄｈｅｒｅｎｔｃｕｌｔｕｒｅｈａｖｅｔｕｍｏｒ−ｓｐｅｃｉｆｉｃｐｈｅｎｏｔｙｐｅｓａｎｄａｒｅｓｕｉｔａｂｌｅｆｏｒｃｈｅｍｉｃａｌａｎｄｇｅｎｅｔｉｃｓｃｒｅｅｎｓ．ＣｅｌｌＳｔｅｍＣｅｌｌ４：５６８−５８０．

ＱｉｎＥＹ，ＣｏｏｐｅｒＤＤ，ＡｂｂｏｔｔＫＬ，ＬｅｎｎｏｎＪ，ＮａｇａｒａｊａＳ，ＭａｃｋａｙＡ，ＪｏｎｅｓＣ，ＶｏｇｅｌＨ，ＪａｃｋｓｏｎＰＫ，ＭｏｎｊｅＭ．２０１７．ＮｅｕｒａｌＰｒｅｃｕｒｓｏｒ−ＤｅｒｉｖｅｄＰｌｅｉｏｔｒｏｐｈｉｎＭｅｄｉａｔｅｓＳｕｂｖｅｎｔｒｉｃｕｌａｒＺｏｎｅＩｎｖａｓｉｏｎｂｙＧｌｉｏｍａ．Ｃｅｌｌ１７０：８４５−８５９ｅ８１９．

ＳｃｈｗａｒｔｚｅｎｔｒｕｂｅｒＪ，ＫｏｒｓｈｕｎｏｖＡ，ＬｉｕＸＹ，ＪｏｎｅｓＤＴ，ＰｆａｆｆＥ，ＪａｃｏｂＫ，ＳｔｕｒｍＤ，ＦｏｎｔｅｂａｓｓｏＡＭ，ＱｕａｎｇＤＡ，ＴｏｎｊｅｓＭｅｔａｌ．２０１２．ＤｒｉｖｅｒｍｕｔａｔｉｏｎｓｉｎｈｉｓｔｏｎｅＨ３．３ａｎｄｃｈｒｏｍａｔｉｎｒｅｍｏｄｅｌｌｉｎｇｇｅｎｅｓｉｎｐａｅｄｉａｔｒｉｃｇｌｉｏｂｌａｓｔｏｍａ．Ｎａｔｕｒｅ４８２：２２６−２３１．

ＳｋｅｎｅＰＪ，ＨｅｎｉｋｏｆｆＪＧ，ＨｅｎｉｋｏｆｆＳ．２０１８．Ｔａｒｇｅｔｅｄｉｎｓｉｔｕｇｅｎｏｍｅ−ｗｉｄｅｐｒｏｆｉｌｉｎｇｗｉｔｈｈｉｇｈｅｆｆｉｃｉｅｎｃｙｆｏｒｌｏｗｃｅｌｌｎｕｍｂｅｒｓ．ＮａｔＰｒｏｔｏｃ１３：１００６−１０１９．

ＳｋｅｎｅＰＪ，ＨｅｎｉｋｏｆｆＳ．２０１７．Ａｎｅｆｆｉｃｉｅｎｔｔａｒｇｅｔｅｄｎｕｃｌｅａｓｅｓｔｒａｔｅｇｙｆｏｒｈｉｇｈ−ｒｅｓｏｌｕｔｉｏｎｍａｐｐｉｎｇｏｆＤＮＡｂｉｎｄｉｎｇｓｉｔｅｓ．Ｅｌｉｆｅ６．

ＴａｋａｈａｓｈｉＫ，ＹａｍａｎａｋａＳ．２００６．Ｉｎｄｕｃｔｉｏｎｏｆｐｌｕｒｉｐｏｔｅｎｔｓｔｅｍｃｅｌｌｓｆｒｏｍｍｏｕｓｅｅｍｂｒｙｏｎｉｃａｎｄａｄｕｌｔｆｉｂｒｏｂｌａｓｔｃｕｌｔｕｒｅｓｂｙｄｅｆｉｎｅｄｆａｃｔｏｒｓ．Ｃｅｌｌ１２６：６６３−６７６．

ＴａｔａｖｏｓｉａｎＲ，ＤｕｃＨＮ，ＨｕｙｎｈＴＮ，ＦａｎｇＤ，ＳｃｈｍｉｔｔＢ，ＳｈｉＸ，ＤｅｎｇＹ，ＰｈｉｅｌＣ，ＹａｏＴ，ＺｈａｎｇＺｅｔａｌ．

２０１８．Ｌｉｖｅ−ｃｅｌｌｓｉｎｇｌｅ−ｍｏｌｅｃｕｌｅｄｙｎａｍｉｃｓｏｆＰｃＧｐｒｏｔｅｉｎｓｉｍｐｏｓｅｄｂｙｔｈｅＤＩＰＧＨ３．３Ｋ２７Ｍｍｕｔａｔｉｏｎ．ＮａｔＣｏｍｍｕｎ９：２０８０．

ＷａｎｇＸ，ＰａｕｃｅｋＲＤ，ＧｏｏｄｉｎｇＡＲ，ＢｒｏｗｎＺＺ，ＧｅＥＪ，ＭｕｉｒＴＷ，ＣｅｃｈＴＲ．２０１７．ＭｏｌｅｃｕｌａｒａｎａｌｙｓｉｓｏｆＰＲＣ２ｒｅｃｒｕｉｔｍｅｎｔｔｏＤＮＡｉｎｃｈｒｏｍａｔｉｎａｎｄｉｔｓｉｎｈｉｂｉｔｉｏｎｂｙＲＮＡ．ＮａｔＳｔｒｕｃｔＭｏｌＢｉｏｌ２４：１０２８−１０３８．

ＷｅｉｎｂｅｒｇＤＮ，ＡｌｌｉｓＣＤ，ＬｕＣ．２０１７．ＯｎｃｏｇｅｎｉｃＭｅｃｈａｎｉｓｍｓｏｆＨｉｓｔｏｎｅＨ３Ｍｕｔａｔｉｏｎｓ．ＣｏｌｄＳｐｒｉｎｇＨａｒｂＰｅｒｓｐｅｃｔＭｅｄ７．

ＷｕＧ，ＢｒｏｎｉｓｃｅｒＡ，ＭｃＥａｃｈｒｏｎＴＡ，ＬｕＣ，ＰａｕｇｈＢＳ，ＢｅｃｋｓｆｏｒｔＪ，ＱｕＣ，ＤｉｎｇＬ，ＨｕｅｔｈｅｒＲ，ＰａｒｋｅｒＭｅｔａｌ．２０１２．ＳｏｍａｔｉｃｈｉｓｔｏｎｅＨ３ａｌｔｅｒａｔｉｏｎｓｉｎｐｅｄｉａｔｒｉｃｄｉｆｆｕｓｅｉｎｔｒｉｎｓｉｃｐｏｎｔｉｎｅｇｌｉｏｍａｓａｎｄｎｏｎ−ｂｒａｉｎｓｔｅｍｇｌｉｏｂｌａｓｔｏｍａｓ．ＮａｔＧｅｎｅｔ４４：２５１−２５３．

（実施例６）

ヒトセントロメアクロマチン複合体の予期せぬ立体配座多様性

染色体分離の忠実度は、セントロメアと呼ばれる特異的染色体遺伝子座でアセンブリするタンパク質性動原体を介した紡錘微小管による染色体の効率的捕捉に依存する。ヒトセントロメアは、約１７０塩基対（ｂｐ）α−サテライト反復単位の０．５〜５Ｍｂ長タンデムアレイを含む（Alexandrov et al.2001）。α−サテライトＤＮＡは、霊長類系統で生まれ、それ以来、反復伸長により進化し続け、その結果、高均一若年アレイがコアに生じ、より分岐したα−サテライト配列がセントロメアエッジを占有している。連続マップへのこれらの均一α−サテライトアレイのアセンブリは、既存の配列アセンブリ技術に重大な課題を提示してきた。この問題に対処するために本発明者らは、機能性セントロメアαサテライトの新規同定のために、セントロメアタンパク質により結合された配列のボトムアップ階層的クラスタリングを最近使用した。本発明者らは、最も存在量の多いα−サテライトアレイが、αサテライトの以前に特徴付けられたＳＦ１およびＳＦ２超染色体ファミリー（Alexandrov et al. 2001）にそれぞれ属する基本３４０ｂｐまたは３４２ｂｐダイマー単位（Henikoff et al. 2015）を含有することを見出した。

セントロメアαサテライトは、カノニカルヒストンＨ３が、セントロメアプロテインＡ（ＣＥＮＰ−Ａ）と呼ばれるそのｃｅｎＨ３バリアントによって置き換えられている、特殊化したクロマチンに含まれる（Palmer et al. 1987；Fukagawa and Earnshaw 2014）。ＣＥＮＰ−Ａは、ＣＥＮＰ−Ｂ、ＣＥＮＰ−Ｃ、ＣＥＮＰ−Ｎ、ＣＥＮＰ−Ｔ、ＣＥＮＰ−Ｗ、ＣＥＮＰ−ＳおよびＣＥＮＰ−Ｘを含む、構成的セントロメア関連ネットワーク（ＣＣＡＮ）複合体の一部である（Hori et al. 2008）。ネイティブＣｈＩＰ（Ｎ−ＣｈＩＰ）、架橋ＣｈＩＰ（Ｘ−ＣｈＩＰ）およびシーケンシャルＣｈＩＰ（ＲｅＣｈＩＰ）を含むＤＮＡシーケンシング（ＣｈｉＰ−ｓｅｑ）戦略での比較クロマチン免疫沈降（ＣｈＩＰ）を使用して、本発明者らは、ＣＥＮＰ−Ｂ、ＣＥＮＰ−ＣおよびＣＥＮＰ−Ｔが、物理的に一体化し、ＣＥＮＰ−Ａヌクレオソームとのコヒーレント複合体を形成することを以前に示した。ＣＥＮＰ−Ａ、ＣＥＮＰ−ＣおよびＣＥＮＰＴＸ−ＣｈＩＰのミクロコッカスヌクレアーゼ（ＭＮａｓｅ）消化は、α−サテライトダイマーに対して＞１６５ｂｐ保護を生じさせる結果となった（Thakur and Henikoff 2016）が、ネイティブ条件下では、ＭＮａｓｅ消化は、約１００〜約１３５ｂｐの範囲のより短いＣＥＮＰ−Ａ結合α−サテライト断片を主として生じさせる結果となった（Hasson et al. 2013；Henikoff et al. 2015；Nechemia-Arbely et al. 2017）。

本発明者らおよび他者は、セントロメアクロマチンが、３５０〜５００ｍＭＮａＣｌで抽出したとき安定していることを見出した（Zhang et al. 2012；Hasson et al. 2013；Henikoff et al. 2015）。本発明者らはまた、５００ｍＭＮａＣｌが、低塩条件（Thakur and Henikoff 2016）と比較してセントロメアクロマチンの回収率を上昇させることを見出し、これにより、回収率の差異が、セントロメアクロマチンの性質の質的差異を表すのかという疑問が生じた。古典的クロマチン塩分画は、異なる物理的特性（Sanders 1978）、機能（Rocha et al. 1984）およびゲノムワイドな分布（Henikoff et al. 2009；Jahan et al. 2016）を有するヌクレオソームを分離するために使用されているので、本発明者らは、セントロメアクロマチンの大部分が、ネイティブＭＮａｓｅ−ＣｈＩＰ研究において典型的に回収される可溶性画分には非存在であるＣＣＡＮ成分の存在により不溶性にされているのではないかと思った。

ネイティブ条件下での差異のある溶解度が、セントロメアクロマチンの質的差異を表す可能性に取り組むために、本発明者らは、塩分画したクロマチンをセントロメアタンパク質のＮ−ＣｈＩＰに供した。本発明者らは、さらに、本発明者らが最近開発したＣＵＴ＆ＲＵＮ（標的下切断およびヌクレアーゼを使用した放出）ｉｎｓｉｔｕ標的化マッピング法を特定のセントロメア成分をプロファイリングするのに適用することにより、塩溶解度の差異を詳しく調査した。本発明者らは、同じα−サテライトサブファミリーに属するダイマー反復配列間のわずかな配列差異が、セントロメアタンパク質結合と複合体自体の構造の両方の差異に対応することを見出した。

結果および考察

ＣＵＴ＆ＲＵＮ塩分画（ＣＵＴ＆ＲＵＮ．Ｓａｌｔ）は、別個のＣＥＮＰ−Ａ含有複合体を放出する

ＣｈＩＰは、３０年より長きの間、特異的タンパク質−ＤＮＡ相互作用をマッピングするための主要な方法となっているが、ＣｈＩＰ−ｓｅｑアーチファクトについての最近の報告（Park et al. 2013；Teytelman et al. 2013；Jain et al. 2015）は、非ＣｈＩＰ法を使用する検証の重要性を強調している（Zentner et al. 2015）。セントロメア研究に関して特に懸念されるのは、Ｎ−ＣｈＩＰに使用されるＭＮａｓｅのニブリングおよび内部切断を引き起こす傾向（Brogaard et al. 2012）であり、これにより、粒子に完全に巻き付いているのか、部分的に巻き付いているのかについての不確実性が生じる（Hasson et al. 2013）。本発明者らは、ゲノムの残りを可溶化することなく無傷抗体標的化粒子の正確な切断および放出を引き起こすことからＣｈＩＰとは無関係である効率的標的化ヌクレアーゼ法である、ＣＵＴ＆ＲＵＮを最近導入した（Skene and Henikoff 2017b）。本発明者らの最新のＣＵＴ＆ＲＵＮプロトコール（Skene and Henikoff 2017a）では、磁気ビーズと結合した透過処理済み細胞に抗体を添加し、その後、その抗体に結合する、ＭＮａｓｅとプロテインＡとの融合タンパク質（ｐＡ−ＭＮ）を添加する。ＭＮａｓｅをカルシウムにより活性化し、次いで、１７５ｍＭＮａＣｌの存在下でのＥＤＴＡおよびＥＧＴＡとのキレート化により停止させる。ＭＮａｓｅをＣＵＴ＆ＲＵＮで特定の部位に繋留した場合、高ＡＴリッチＤＮＡについてであっても、消化時間の２桁を超える範囲にわたって検出可能なニブリングも、接近可能性バイアスも、内部切断もない。さらに、クロマチン可溶化がないため、不溶性ペレットから抽出されたＤＮＡのＣＵＴ＆ＲＵＮ切断パターンもプロファイリングすることができる（Skene and Henikoff 2017b）。塩分画へのＣＵＴ＆ＲＵＮの適用（ＣＵＴ＆ＲＵＮ．Ｓａｌｔ）のために、ＲＮａｓｅを含まないキレート化ＳＴＯＰ緩衝剤を添加し、上清を除去した後、本発明者らは、細胞／ビーズペレットを５００ｍＭＮａＣｌとともにインキュベートした。次いで、本発明者らは、低塩および高塩上清ならびに最終ペレットからＤＮＡを抽出した（図４９Ａ）。ＣｈＩＰでは、抗体認識またはＤＮＡ回収は、粒子一体性の喪失などの、塩により誘導される粒子立体配座変化による影響を受けることがあるが、ＣＵＴ＆ＲＵＮは、ＤＮＡが切断される前に抗体認識が起こることから塩分画によく適している。３つの画分全てについて、本発明者らは、ＣＥＮＰ−Ａ、ＣＥＮＰ−ＢおよびＣＥＮＰ−ＣからのＤＮＡに関するｑＰＣＲアッセイにおいてセントロメアαサテライトの明確な濃縮を観察したが、陰性対照Ｈ３Ｋ２７ｍｅ３ＣＵＴ＆ＲＵＮ．Ｓａｌｔシーケンシングライブラリーではそれが観察されなかった（図４９Ｂ）。本発明者らのＮ−ＣｈＩＰ結果と一致して、クロマチンの大多数（約７０％〜８０％）が高塩ＣＵＴ＆ＲＵＮ．Ｓａｌｔ画分で増幅された（図４９Ｃ）。

ペアードエンド２５ｂｐ×２５ｂｐＤＮＡシーケンシングに供し、コンセンサスα−サテライトアレイにマッピングしたとき、３つの画分全てが、バックグラウンド対照と比較して均一なダイマーαサテライト（ＳＦＩ、Ｄ５Ｚ２、Ｄ７Ｚ１およびＳＦ２）より強いＣＥＮＰ−Ａ、ＣＥＮＰ−ＢおよびＣＥＮＰ−Ｃ濃縮、ならびに非セントロメアαサテライト（Ｄ５Ｚ１およびＤ７Ｚ２）より弱い濃縮を示した。ペリセントリックヒストンマーク（Ｈ３Ｋ９ｍｅ２およびＨ３Ｋ９ｍｅ３）は、予想どおりαサテライトより弱い濃縮を示したが、ユークロマチンマーク（Ｈ３Ｋ２７ｍｅ２およびＨ３Ｋ２７ｍｅ３）は強い枯渇を示した。

ＣＵＴ＆ＲＵＮ．Ｓａｌｔ断片の断片長分布を分析するために、本発明者らは、ＣＵＴ＆ＲＵＮ．Ｓａｌｔ画分を用いてペアードエンド２５０ｂｐ×２５０ｂｐシーケンシングを行い、マージペアを活性セントロメアα−サテライトコンティグにマッピングした。Ｎ−ＣｈＩＰ塩画分間で見られた不均一なサイズ分布とは対照的に、本発明者らは、低塩ＣＵＴ＆ＲＵＮ．Ｓａｌｔ画分と高塩ＣＵＴ＆ＲＵＮ．Ｓａｌｔ画分の間ではるかに均一なサイズ分布を観察した（図４０Ａ）。ＣＥＮＰ−Ａ、ＣＥＮＰＢおよびＣＥＮＰ−ＣＣＵＴ＆ＲＵＮ．Ｓａｌｔについては、３つの画分全てが、約１６０〜１８５ｂｐに主ピークを示し、約３４０ｂｐに副ピークを示した。α−サテライトコンティグに関するＣＥＮＰ−ＡＣＵＴ＆ＲＵＮ．Ｓａｌｔプロファイルは、低塩、高塩およびペレット画分において、Ｘ−ＣｈＩＰを使用して観察されたもの（Thakur and Henikoff 2016）に類似した別個のＣＣＡＮ複合体を明示した（図４０Ｂ）。したがって、ＣＵＴ＆ＲＵＮ．Ｓａｌｔは、ネイティブ条件下で無傷ＣＥＮＰ−Ａ／Ｂ／Ｃ複合体を放出する（それによって、潜在的架橋アーチファクトを回避する）ばかりでなく、未繋留のＭＮａｓｅが１００ｂｐサブ粒子を生じさせるＮ−ＣｈＩＰとは対照的に、粒子の破壊を防ぎもする。

強い高密度のＣＥＮＰ−Ｂボックスは、ＣＥＮＰ−Ａ／Ｂ／Ｃ複合体を安定させる

ＣＥＮＰ−ＡＮ−ＣｈＩＰについての上記から分かるように、ＣＥＮＰ−Ａ、ＣＥＮＰ−ＢおよびＣＥＮＰ−ＣＣＵＴ＆ＲＵＮ．Ｓａｌｔについての差異のある溶解度は、これらのα−サテライトコンティグに関して塩の増加に伴って占有率の増加が見られるが、ＣＥＮＰ−Ｂボックスに関して最も明らかである。興味深いことに、複数の３４０ｂｐ単位を平均したとき、ＣＥＮＰ−ＢＣＵＴ＆ＲＵＮ占有率ピークは、高塩およびペレット画分ではＣＥＮＰ−Ｂボックスではっきりと観察されたが、低塩画分では観察されなかった（図４１Ａ）。ＣＵＴ＆ＲＵＮにおけるＣＣＡＮ粒子の保護と考え合せると、平均ピークのこの非存在は、破壊に耐えてＣＥＮＰ−Ｂが濃縮される安定した粒子と、ＣＥＮＰ−Ｂが枯渇するより不安定な粒子という、粒子の２つの明確に異なるクラスがあることを示す。

本発明者らは、ＣＵＴ＆ＲＵＮ．Ｓａｌｔによって測定した場合のＣＣＡＮ一体性が、ＣＥＮＰ−Ｂの安定させる役割を表すのではないかと思った。ヒトセントロメアにおける相違度の勾配を有するα−サテライト配列の存在は、この可能性を試験する機会を与える（Henikoff et al.2015）。ごく最近拡張した存在量の多いＣＥＮＰ−Ａが濃縮されたα−サテライトダイマーアレイは、高密度のＣＥＮＰ−Ｂボックス（３４０ｂｐダイマー１つ当たりＣＥＮＰ−Ｂおおよそ１つ）を含有する。より老年のαサテライトは、進化の時間とともにランダム突然変異の蓄積に起因してより相違度が大きくなり、これは、ＣＥＮＰ−Ｂボックスの完全喪失または変性につながる。本発明者らは、祖先モチーフとのＣＥＮＰ−Ｂボックス配列の相違度が、ＣＥＮＰ−Ａ／Ｂ／Ｃに結合するαサテライトの能力、したがってセントロメアを形成する能力に対応するのかどうかを問うた。

この疑問に取り組むために、本発明者らは、先ず、１７ｂｐＣＥＮＰ−Ｂボックスの中央の１５ｂｐを祖先のものとして同定した。それは、均一なＳＦ１（例えば、Ｄ５Ｚ２）、ＳＦ２（例えば、Ｃｅｎ１３様）およびＳＦ３（例えば、ＤＸＺ１）α−サテライトコンティグの大多数に規則正しい間隔で存在するからである。次いで、本発明者らは、モチーフアラインメント・検索ツール（ＭＡＳＴ）を使用してこのモチーフの統計的に有意な出現率を特定し、それらに０（３つより多いミスマッチ）と１（同一）の間のスコアを付けた。本発明者らは、ＣＥＮＰ−Ｂモチーフスコアの増加が、非特異的ＩｇＧＣＵＴ＆ＲＵＮ占有率に対するＣＥＮＰ−Ａの濃縮と相関することを見出した（図４１Ｂ）。具体的には、２回の生物学的反復実験を平均したとき、本発明者らは、３つの塩画分全てについてｒ＝０．６６〜０．８３のＰｅａｒｓｏｎ相関を観察した。本発明者らは、強いＣＥＮＰ−Ｂボックスの存在がＣＥＮＰ−Ａ／Ｂ／Ｃの安定化に関連すると結論付ける。

ＣＥＮＰ−Ｂボックス密度は、ダイマーアレイでの最高から不均一モノマーアレイでの最低まで幅がある。ＣＥＮＰ−Ｂは、配列依存的様式でＣＥＮＰ−Ｂボックスと結合するので、ＣＥＮＰ−Ｂタンパク質密度も、より若年の均一アレイでより高くなると予想される。本発明者らは、老年配列からのＣＥＮＰ−Ｂボックスの喪失（ＣＥＮＰ−Ｂボックス密度の低下）度が、これらの配列に対するＣＥＮＰ−Ａ結合の低下と相関するかどうかを試験した。本発明者らは、より長いα−サテライトコンティグに関するＣＥＮＰ−Ａ濃縮に対してＣＥＮＰ−Ｂ密度をプロットし、ＣＥＮＰ−Ｂモチーフ密度とＣＥＮＰ−Ａ濃縮の間に強い相関（ｒ＝０．６２〜０．７５）を観察した（図４１Ｃ）。これは、強い高密度のＣＥＮＰ−Ｂボックスの維持が、α−サテライトセントロメアへのＣＥＮＰ−Ａ／Ｂ／Ｃ結合効率を上昇させることを示す。均一な機能性α−サテライトアレイの中のＣＥＮＰ−Ｂボックスが進化して常在ＣＥＮＰ−Ａ／Ｂ／Ｃ粒子を安定させるという本発明者らの証拠は、ＣＥＮＰ−ＢがＣＥＮＰ−Ｃを安定させることにより分離の忠実度に寄与するという提案（Fachinetti et al. 2015）を支持する。

異なるαサテライトがＣＥＮＰＡアセンブリ能力を多少保持する

最高のＣＥＮＰ−Ａ濃縮は、高密度ＣＥＮＰ−Ｂボックスを有する高均一アレイで起こったが、ｑＰＣＲアッセイは、ＣＵＴ＆ＲＵＮ．Ｓａｌｔおよび塩分画Ｎ−ＣｈＩＰ実験においてＣＥＮＰ−Ｂボックスをほとんどまたは全く含有しない異なる配列上に少量のＣＥＮＰ−Ａも明示した（図４１Ｃ）。異なるαサテライト上での低レベルのＣＥＮＰ−Ａの細胞学的検出は、ＣＥＮＰ−Ａで明るく染色される均一ダイマーの検出と比較して、それらの少ないコピー数のため困難である。例えば、均一Ｄ７Ｚ１（１．５〜３．８Ｍｂ）は、ＣＥＮＰ−Ａとの強い細胞学的共局在を示すが、異なるＤ７Ｚ２（０．１〜０．５Ｍｂ）は、ＣＥＮＰ−Ａに対して陰性であると報告された（Slee et al. 2012）。本発明者らは、不均一モノマーαサテライトにおけるＣＵＴ＆ＲＵＮ．Ｓａｌｔ試料におけるＣＥＮＰ−Ａ濃縮を、βサテライト−６８〜６９ｂｐペリセントリックタンデム反復配列アレイを含む、非セントロメア配列と比較した。本発明者らは、反復配列がマスクされたゲノムと比較して、およびβ−サテライトアレイと比較して（図４１Ｄ）、Ｄ７Ｚ２において３倍を超えるＣＥＮＰ−Ａ濃縮を見出した。これは、ＣＥＮＰ−Ｂモチーフを完全に欠いている異なるα−サテライトアレイであってもＣＥＮＰ−Ａアセンブリ能力を多少保持することを示す。

ほぼ均一なα−サテライトアレイ上でのＣＥＮＰ−Ａ／Ｂ／Ｃの予期せぬ構造および立体配座多様性

完璧に均一なα−サテライトアレイを標準シーケンシングリードから一意的にアセンブリすることはできないが、約５％の相違度は、多少のシーケンシングされたリードをコンティグにアセンブリするには十分である。本発明者らは、非常に均一なアレイの全てのコピーが同一のパターンを示すと予想したので、隣接する反復配列間の大きな差異を、２５０ｂｐ×２５０ｂｐマージペアをそれらにマッピングしたとき、見出して驚いた。本発明者らは、アノテーション付きＢＡＣクローンおよびゲノムコンティグに対応する均一なアレイ内に３つの主要なタイプの多様性を観察した（図４２）：（１）ＣＥＮＰ−Ａ／Ｂ／Ｃによる個々のダイマーの差異のある占有率。本発明者らは、単一アレイ内の最低占有ダイマーと最高占有ダイマー間に濃縮の最大約５０倍の差を観察した。（２）ＣＥＮＰ−Ｂボックスに対するＣＥＮＰ−Ａ／Ｂ／Ｃの方向性。ＳＦ１ α−サテライトダイマーアレイ内の２つのＣＥＮＰ−Ｂボックス間の距離は、ヘッドからテールの形での一方向の方向性を持つ３４０ｂｐである。したがって、ＣＥＮＰＡ／Ｂ／Ｃ含有複合体の方向性は、一方向性であると予想される。この予想に反して、本発明者らは、ＣＥＮＰＡ／Ｂ／Ｃが、単一の連続したα−サテライトコンティグ内であってもＣＥＮＰ−Ｂボックスに対する方向性（図４２の赤色矢印）を片側に持ち得ることを観察した。（３）構造多様性。本発明者らは、３４０ｂｐダイマー全体にわたってダイマーの両方のモノマーにＣＥＮＰ−Ａ／Ｂ／Ｃがほぼ同等に結合している対称複合体、またはダイマーの１つのモノマーを優先的に占有する非対称複合体のどちらかを含む、異なるＣＥＮＰ−Ａ／Ｂ／Ｃ構成を、これらのコンティグ上に観察した。α−サテライトダイマー上のＣＥＮＰ−Ａ含有粒子のそのような極端な構造多様性が、配列の驚くほど少ない差異を伴って観察された。例えば、図４２の下部のパネルに重ねて示す４つの隣接する３４０ｂｐＤ７Ｚ１反復配列は、ペアワイズ比較で８８％〜９６％同一であり、それにもかかわらず、４つ全てが、ＣＣＡＮ構造では互いに異なる。したがって、わずかなα−サテライト配列多様性が、ＣＥＮＰ−Ａ含有複合体の結合挙動に影響を与えるように見える。見たところでは、複数のＣＣＡＮ形態が外側動原体を動員するが、単一の構造形態にしか動員能力がない可能性がある。これらの差異は、ＣＣＡＮが結合する配列に固有であり得、またはショウジョウバエＤ１、ＧＡＧＡ因子、およびＰｒｏｄタンパク質と類似した、非ヒストンサテライトＤＮＡ結合タンパク質による排除（Levinger and Varshavsky 1982; Raff et al. 1994; Torok et al. 1997）を表し得る。

塩分画を使用するＣＥＮＰ−Ａ／Ｂ／Ｃの本発明者らのマッピングは、均一なα−サテライトアレイが、ＣＥＮＰ−Ａ、ＣＥＮＰ−Ｂ、ＣＥＮＰ−ＣおよびＣＥＮＰ−Ｔを含有する単一のコヒーレントＣＣＡＮ複合体により占有されることを本発明者らが示した本発明者らの以前の報告（Thakur and Henikoff 2016）を確証する。ＣＥＮＰ−Ｂボックスに関するＣＥＮＰ−Ｔ部分複合体の本発明者らのマッピングから、各々のα−サテライトダイマー単位が巻き付いており２つのＣＥＮＰ−Ａ／Ｈ４／Ｈ２Ａ／Ｈ２Ｂサブヌクレオソーム間にＣＥＮＰ−ＴＷＳＸサブ粒子を中心とする右手性超らせんキラリティーがあるモデルを本発明者らは提案した。非架橋ＣＣＡＮのＭＮａｓｅ消化に対する感受性は、一つには、ＤＮＡ保護の差異の主な原因となり得、したがって、ＣＥＮＰ−Ａヌクレオソームの構造についての結論と矛盾することになる。しかし、塩分画を伴うＮ−ＣｈＩＰを続けて行うことにより、本発明者らは、低塩条件を使用して観察されたＣＥＮＰ−Ａ粒子（Lacoste et al. 2014；Nechemia-Arbely et al. 2017）が、ゲノムワイドに全ＣＥＮＰ−Ａの極一部しか構成しないことを今や示す。対照的に、Ｎ−ＣｈＩＰ塩の大画分は、はるかに大きいＤＮＡ断片を保護する粒子からなり、これは、無傷ＣＣＡＮ複合体の存在と一致する。均一なα−サテライトアレイにおけるＣＥＮＰ−ＢボックスへのＣＥＮＰ−Ｂ結合は、ＣＣＡＮ一体性を促進するという本発明者らの証拠は、ＣＥＮＰ−Ｂの特異な役割の証拠を与えるものである。加えて、ＣＥＮＰ−Ｂボックスを欠いており、ＣＥＮＰ−Ｂの濃縮を示さない、Ｄ７Ｚ２ α−サテライトアレイに、ＣＣＡＮ成分が低レベルで動員されるという本発明者らの発見は、ＣＥＮＰ−Ｂの非存在下であっても固有のＣＣＡＮ動員の可能性があることを示唆する。したがって、ＣＣＡＮ占有率をα−サテライト配列によって決定するが、アレイへのＣＥＮＰ−Ｂ結合によって向上させることができる。

材料および方法

細胞系、抗体およびプライマー

塩分画Ｎ−ＣｈＩＰアッセイは、ＣＥＮＰ−ＡＦｌａｇタグ付きＨＴ１０８０−１ｂ細胞系（Thakur and Henikoff 2016）で行い、ＣＵＴ＆ＲＵＮ．Ｓａｌｔ実験は、Ｋ５６２細胞系で行った。使用した抗体は、抗ＣＥＮＰ−Ａ（Ａｂｃａｍ、ａｂ１３９３９）、抗ＣＥＮＰ−Ｂ（Ａｂｃａｍ、ａｂ２５７３４）、抗ＣＥＮＰ−Ｃ（Ａｂｃａｍ、ａｂ３３０３４）、ヒストンＨ３Ｋ２７ｍｅ３（ＣｅｌｌＳｉｇｎａｌｉｎｇＴｅｃｈｎｏｌｏｇｉｅｓ、９７３３）、ＩｇＧ（ＡｎｔｉｂｏｄｉｅｓＯｎｌｉｎｅ、ＡＢＩＮ１０２９６１）およびＭＴＰＯＬ（ＧｅｎｅＴｅｘ、ＧＴＸ１０５１３７）であった。

ＣＵＴ＆ＲＵＮ．Ｓａｌｔ

ヒトＫ５６２細胞または核のＣＵＴ＆ＲＵＮは、消化後に、塩分画が可能になるようにプロトコールを改良したことを除いて、本質的には記載されている（Skene and Henikoff 2017b）ように行った。図４１に示す実験は、核ではなく、透過処理した細胞を使用した（Skene and Henikoff 2017a）。ペアードエンド２５０ｂｐ×２５０ｂｐまたは２５ｂｐ×２５ｂｐシーケンシングを行った。

配列分析

記載されている（Henikoff et al. 2015）ようなパラメーター：-ｑ２５−Ｌ２５−ｏ１５を用いてＳｅｑＰｒｅｐを使用して、ペアードエンド２５０ｂｐ×２５０ｂｐリードをトリミングし、マージした。Ｂｏｗｔｉｅ２を使用して次のパラメーター：−−ｅｎｄ−ｔｏ−ｅｎｄ−−ｖｅｒｙ−ｓｅｎｓｉｔｉｖｅ−−ｎｏ−ｍｉｘｅｄ−−ｎｏ−ｄｉｓｃｏｒｄａｎｔ−ｑ−−ｐｈｒｅｄ３３−Ｉ１０−Ｘ７００を用いて、マージペアおよびペアードエンド２５ｂｐ×２５ｂｐリードをマッピングした。ＣＵＴ＆ＲＵＮ．Ｓａｌｔについては、記載されている（Skene and Henikoff 2017b）ようにスパイクイン対照を使用してリードカウントを較正した。濃縮値は、特異的抗体の較正リードカウントの、非特異的ＩｇＧ対照の較正リードカウントに対する比を表す。モチーフ強度および密度を推定するために、本発明者らは、１５ｂｐＣＥＮＰ−Ｂボックスモチーフが祖先のものであると推論した。それは、最も均一なＳＦ１（例えば、Ｃｅｎ１様）、ＳＦ２（例えば、Ｃｅｎ１３様）およびＳＦ３（例えば、ＤＸＺ１）α−サテライトアレイに規則正しい間隔で存在するからである。本発明者らは、記載されている（Zentner et al. 2015）ような統計的に有意な出現についてコンティグをスキャンして、ＣＥＮＰ−Ｂモチーフを同定し、ＣＥＮＰ−Ｂボックスミスマッチおよび密度を算出した。本発明者らは、モチーフスコアを、０（有意なモチーフなし）〜１（完璧なモチーフ）の尺度について、１５のうちの１５のマッチが１であり、３より多いミスマッチが０であり、各々のミスマッチから０．２５の値を引く、１５ｂｐコンセンサスに対する同一性度として定義する。

実施例６のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）

ＡｌｅｘａｎｄｒｏｖＩ，ＫａｚａｋｏｖＡ，ＴｕｍｅｎｅｖａＩ，ＳｈｅｐｅｌｅｖＶ，ＹｕｒｏｖＹ．２００１． α−ＳａｔｅｌｌｉｔｅＤＮＡｏｆｐｒｉｍａｔｅｓ：ｏｌｄａｎｄｎｅｗｆａｍｉｌｉｅｓ．Ｃｈｒｏｍｏｓｏｍａ１１０：２５３-２６６．

ＢｒｏｇａａｒｄＫＲ，ＸｉＬ，ＷａｎｇＪＰ，ＷｉｄｏｍＪ．２０１２．Ａｃｈｅｍｉｃａｌａｐｐｒｏａｃｈｔｏｍａｐｐｉｎｇｎｕｃｌｅｏｓｏｍｅｓａｔｂａｓｅｐａｉｒｒｅｓｏｌｕｔｉｏｎｉｎｙｅａｓｔ．ＭｅｔｈｏｄｓＥｎｚｙｍｏｌ５１３：３１５-３３４．

ＣｈｅｒｅｊｉＲＶ，ＯｃａｍｐｏＪ，ＣｌａｒｋＤＪ．２０１７．ＭＮａｓｅ−ｓｅｎｓｉｔｉｖｅｃｏｍｐｌｅｘｅｓｉｎｙｅａｓｔ：ｎｕｃｌｅｏｓｏｍｅｓａｎｄｎｏｎ−ｈｉｓｔｏｎｅｂａｒｒｉｅｒｓ．ＭｏｌＣｅｌｌ６５：５６５-５７７．ｅ５６３．

ＦａｃｈｉｎｅｔｔｉＤ，ＨａｎＪＳ，ＭｃＭａｈｏｎＭＡ，ＬｙＰ，ＡｂｄｕｌｌａｈＡ，ＷｏｎｇＡＪ，ＣｌｅｖｅｌａｎｄＤＷ．２０１５．ＤＮＡｓｅｑｕｅｎｃｅ−ｓｐｅｃｉｆｉｃｂｉｎｄｉｎｇｏｆＣＥＮＰ−Ｂｅｎｈａｎｃｅｓｔｈｅｆｉｄｅｌｉｔｙｏｆｈｕｍａｎｃｅｎｔｒｏｍｅｒｅｆｕｎｃｔｉｏｎ．ＤｅｖＣｅｌｌ３３：３１４-３２７．

ＦｕｋａｇａｗａＴ，ＥａｒｎｓｈａｗＷＣ．２０１４．Ｔｈｅｃｅｎｔｒｏｍｅｒｅ：ｃｈｒｏｍａｔｉｎｆｏｕｎｄａｔｉｏｎｆｏｒｔｈｅｋｉｎｅｔｏｃｈｏｒｅｍａｃｈｉｎｅｒｙ．ＤｅｖＣｅｌｌ３０：４９６-５０８．

ＨａｓｓｏｎＤ，ＰａｎｃｈｅｎｋｏＴ，ＳａｌｉｍｉａｎＫＪ，ＳａｌｍａｎＭＵ，ＳｅｋｕｌｉｃＮ，ＡｌｏｎｓｏＡ，ＷａｒｂｕｒｔｏｎＰＥ，ＢｌａｃｋＢＥ．２０１３．ＴｈｅｏｃｔａｍｅｒｉｓｔｈｅｍａｊｏｒｆｏｒｍｏｆＣＥＮＰ−Ａｎｕｃｌｅｏｓｏｍｅｓａｔｈｕｍａｎｃｅｎｔｒｏｍｅｒｅｓ．ＮａｔＳｔｒｕｃｔＭｏｌＢｉｏｌ２０：６８７-６９５．

ＨｅｎｉｋｏｆｆＳ，ＨｅｎｉｋｏｆｆＪＧ，ＳａｋａｉＡ，ＬｏｅｂＧＢ，ＡｈｍａｄＫ．２００９．Ｇｅｎｏｍｅ−ｗｉｄｅｐｒｏｆｉｌｉｎｇｏｆｓａｌｔｆｒａｃｔｉｏｎｓｍａｐｓｐｈｙｓｉｃａｌｐｒｏｐｅｒｔｉｅｓｏｆｃｈｒｏｍａｔｉｎ．ＧｅｎｏｍｅＲｅｓ１９：４６０-４６９．

ＨｅｎｉｋｏｆｆＪＧ，ＴｈａｋｕｒＪ，ＫａｓｉｎａｔｈａｎＳ，ＨｅｎｉｋｏｆｆＳ．２０１５．Ａｕｎｉｑｕｅｃｈｒｏｍａｔｉｎｃｏｍｐｌｅｘｏｃｃｕｐｉｅｓｙｏｕｎｇ α−ｓａｔｅｌｌｉｔｅａｒｒａｙｓｏｆｈｕｍａｎｃｅｎｔｒｏｍｅｒｅｓ．ＳｃｉＡｄｖ１：ｅ１４００２３４．

ＨｏｒｉＴ，ＡｍａｎｏＭ，ＳｕｚｕｋｉＡ，ＢａｃｋｅｒＣＢ，ＷｅｌｂｕｒｎＪＰ，ＤｏｎｇＹ，ＭｃＥｗｅｎＢＦ，ＳｈａｎｇＷＨ，ＳｕｚｕｋｉＥ，ＯｋａｗａＫ，ｅｔａｌ．２００８．ＣＣＡＮｍａｋｅｓｍｕｌｔｉｐｌｅｃｏｎｔａｃｔｓｗｉｔｈｃｅｎｔｒｏｍｅｒｉｃＤＮＡｔｏｐｒｏｖｉｄｅｄｉｓｔｉｎｃｔｐａｔｈｗａｙｓｔｏｔｈｅｏｕｔｅｒｋｉｎｅｔｏｃｈｏｒｅ．Ｃｅｌｌ１３５：１０３９-１０５２．

ＪａｈａｎＳ，ＸｕＷ，ＨｅＳ，ＧｏｎｚａｌｅｚＣ，ＤｅｌｃｕｖｅＧＰ，ＤａｖｉｅＪＲ．２０１６．Ｔｈｅｃｈｉｃｋｅｎｅｒｙｔｈｒｏｃｙｔｅｅｐｉｇｅｎｏｍｅ．ＥｐｉｇｅｎｅｔｉｃｓＣｈｒｏｍａｔｉｎ９：１９．ＪａｉｎＤ，ＢａｌｄｉＳ，ＺａｂｅｌＡ，ＳｔｒａｕｂＴ，ＢｅｃｋｅｒＰＢ．２０１５．Ａｃｔｉｖｅｐｒｏｍｏｔｅｒｓｇｉｖｅｒｉｓｅｔｏｆａｌｓｅｐｏｓｉｔｉｖｅ ‘ｐｈａｎｔｏｍｐｅａｋｓ’ ｉｎＣｈＩＰ−ｓｅｑｅｘｐｅｒｉｍｅｎｔｓ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ４３：６９５９-６９６８．

ＬａｃｏｓｔｅＮ，ＷｏｏｌｆｅＡ，ＴａｃｈｉｗａｎａＨ，ＧａｒｅａＡＶ，ＢａｒｔｈＴ，ＣａｎｔａｌｏｕｂｅＳ，ＫｕｒｕｍｉｚａｋａＨ，ＩｍｈｏｆＡ，ＡｌｍｏｕｚｎｉＧ．２０１４．ＭｉｓｌｏｃａｌｉｚａｔｉｏｎｏｆｔｈｅｃｅｎｔｒｏｍｅｒｉｃｈｉｓｔｏｎｅｖａｒｉａｎｔＣｅｎＨ３／ＣＥＮＰ−ＡｉｎｈｕｍａｎｃｅｌｌｓｄｅｐｅｎｄｓｏｎｔｈｅｃｈａｐｅｒｏｎｅＤＡＸＸ．ＭｏｌＣｅｌｌ５３：６３１-６４４．

ＬｅｖｉｎｇｅｒＬ，ＶａｒｓｈａｖｓｋｙＡ．１９８２．ＰｒｏｔｅｉｎＤ１ｐｒｅｆｅｒｅｎｔｉａｌｌｙｂｉｎｄｓＡ＋Ｔ−ｒｉｃｈＤＮＡｉｎｖｉｔｒｏａｎｄｉｓａｃｏｍｐｏｎｅｎｔｏｆＤｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒｎｕｃｌｅｏｓｏｍｅｓｃｏｎｔａｉｎｉｎｇＡ＋Ｔ−ｒｉｃｈｓａｔｅｌｌｉｔｅＤＮＡ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉ７９：７１５２-７１５６．

ＭｃＮｕｌｔｙＳＭ，ＳｕｌｌｉｖａｎＬＬ，ＳｕｌｌｉｖａｎＢＡ．２０１７．Ｈｕｍａｎｃｅｎｔｒｏｍｅｒｅｓｐｒｏｄｕｃｅｃｈｒｏｍｏｓｏｍｅ−ｓｐｅｃｉｆｉｃａｎｄａｒｒａｙ−ｓｐｅｃｉｆｉｃ α ｓａｔｅｌｌｉｔｅｔｒａｎｓｃｒｉｐｔｓｔｈａｔａｒｅｃｏｍｐｌｅｘｅｄｗｉｔｈＣＥＮＰ−ＡａｎｄＣＥＮＰ−Ｃ．ＤｅｖＣｅｌｌ４２：２２６-２４０．ｅ２２６．

ＭｉｅｃｚｋｏｗｓｋｉＪ，ＣｏｏｋＡ，ＢｏｗｍａｎＳＫ，ＭｕｅｌｌｅｒＢ，ＡｌｖｅｒＢＨ，ＫｕｎｄｕＳ，ＤｅａｔｏｎＡＭ，ＵｒｂａｎＪＡ，ＬａｒｓｃｈａｎＥ，ＰａｒｋＰＪ，ｅｔａｌ．２０１６．ＭＮａｓｅｔｉｔｒａｔｉｏｎｒｅｖｅａｌｓｄｉｆｆｅｒｅｎｃｅｓｂｅｔｗｅｅｎｎｕｃｌｅｏｓｏｍｅｏｃｃｕｐａｎｃｙａｎｄｃｈｒｏｍａｔｉｎａｃｃｅｓｓｉｂｉｌｉｔｙ．ＮａｔＣｏｍｍｕｎ７：１１４８５．

Ｎｅｃｈｅｍｉａ−ＡｒｂｅｌｙＹ，ＦａｃｈｉｎｅｔｔｉＤ，ＭｉｇａＫＨ，ＳｅｋｕｌｉｃＮ，ＳｏｎｉＧＶ，ＫｉｍＤＨ，ＷｏｎｇＡＫ，ＬｅｅＡＹ，ＮｇｕｙｅｎＫ，ＤｅｋｋｅｒＣ，ｅｔａｌ．２０１７．ＨｕｍａｎｃｅｎｔｒｏｍｅｒｉｃＣＥＮＰ−Ａｃｈｒｏｍａｔｉｎｉｓａｈｏｍｏｔｙｐｉｃ，ｏｃｔａｍｅｒｉｃｎｕｃｌｅｏｓｏｍｅａｔａｌｌｃｅｌｌｃｙｃｌｅｐｏｉｎｔｓ．ＪＣｅｌｌＢｉｏｌ２１６：６０７-６２１．

ＰａｌｍｅｒＤＫ，Ｏ’ＤａｙＫ，ＷｅｎｅｒＭＨ，ＡｎｄｒｅｗｓＢＳ，ＭａｒｇｏｌｉｓＲＬ．１９８７．Ａ１７− ｋＤｃｅｎｔｒｏｍｅｒｅｐｒｏｔｅｉｎ（ＣＥＮＰ−Ａ）ｃｏｐｕｒｉｆｉｅｓｗｉｔｈｎｕｃｌｅｏｓｏｍｅｃｏｒｅｐａｒｔｉｃｌｅｓａｎｄｗｉｔｈｈｉｓｔｏｎｅｓ．ＪＣｅｌｌＢｉｏｌ１０４：８０５-８１５．

ＰａｒｋＤ，ＬｅｅＹ，ＢｈｕｐｉｎｄｅｒｓｉｎｇｈＧ，ＩｙｅｒＶＲ．２０１３．ＷｉｄｅｓｐｒｅａｄｍｉｓｉｎｔｅｒｐｒｅｔａｂｌｅＣｈＩＰ−ｓｅｑｂｉａｓｉｎｙｅａｓｔ．ＰＬｏＳＯｎｅ８：ｅ８３５０６．ＲａｆｆＪＷ，ＫｅｌｌｕｍＲ，ＡｌｂｅｒｔｓＢ．１９９４．ＴｈｅＤｒｏｓｏｐｈｉｌａＧＡＧＡｔｒａｎｓｃｒｉｐｔｉｏｎｆａｃｔｏｒｉｓａｓｓｏｃｉａｔｅｄｗｉｔｈｓｐｅｃｉｆｉｃｒｅｇｉｏｎｓｏｆｈｅｔｅｒｏｃｈｒｏｍａｔｉｎｔｈｒｏｕｇｈｏｕｔｔｈｅｃｅｌｌｃｙｃｌｅ．ＥＭＢＯＪ１３：５９７７-５９８３．

ＲｏｃｈａＥ，ＤａｖｉｅＪＲ，ｖａｎＨｏｌｄｅＫＥ，ＷｅｉｎｔｒａｕｂＨ．１９８４．Ｄｉｆｆｅｒｅｎｔｉａｌｓａｌｔｆｒａｃｔｉｏｎａｔｉｏｎｏｆａｃｔｉｖｅａｎｄｉｎａｃｔｉｖｅｇｅｎｏｍｉｃｄｏｍａｉｎｓｉｎｃｈｉｃｋｅｎｅｒｙｔｈｒｏｃｙｔｅ．ＪＢｉｏｌＣｈｅｍ２５９：８５５８-８５６３．

ＳａｎｄｅｒｓＭＭ．１９７８．Ｆｒａｃｔｉｏｎａｔｉｏｎｏｆｎｕｃｌｅｏｓｏｍｅｓｂｙｓａｌｔｅｌｕｔｉｏｎｆｒｏｍｍｉｃｒｏｃｏｃｃａｌｎｕｃｌｅａｓｅ−ｄｉｇｅｓｔｅｄｎｕｃｌｅｉ．ＪＣｅｌｌＢｉｏｌ７９：９７-１０９．

ＳｋｅｎｅＰＪ，ＨｅｎｉｋｏｆｆＳ．２０１７ａ．ＣＵＴ＆ＲＵＮ：ｔａｒｇｅｔｅｄｉｎｓｉｔｕｇｅｎｏｍｅ−ｗｉｄｅｐｒｏｆｉｌｉｎｇｗｉｔｈｈｉｇｈｅｆｆｉｃｉｅｎｃｙｆｏｒｌｏｗｃｅｌｌｎｕｍｂｅｒｓ．ｂｉｏＲｘｉｖｄｏｉ：１０．１１０１／１９３２１９．

ＳｋｅｎｅＰＪ，ＨｅｎｉｋｏｆｆＳ．２０１７ｂ．Ａｎｅｆｆｉｃｉｅｎｔｔａｒｇｅｔｅｄｎｕｃｌｅａｓｅｓｔｒａｔｅｇｙｆｏｒｈｉｇｈ−ｒｅｓｏｌｕｔｉｏｎｍａｐｐｉｎｇｏｆＤＮＡｂｉｎｄｉｎｇｓｉｔｅｓ．ｅＬｉｆｅ６：ｅ２１８５６．

ＳｌｅｅＲＢ，ＳｔｅｉｎｅｒＣＭ，ＨｅｒｂｅｒｔＢＳ，ＶａｎｃｅＧＨ，ＨｉｃｋｅｙＲＪ，ＳｃｈｗａｒｚＴ，ＣｈｒｉｓｔａｎＳ，ＲａｄｏｖｉｃｈＭ，ＳｃｈｎｅｉｄｅｒＢＰ，ＳｃｈｉｎｄｅｌｈａｕｅｒＤ，ｅｔａｌ．２０１２．Ｃａｎｃｅｒ−ａｓｓｏｃｉａｔｅｄａｌｔｅｒａｔｉｏｎｏｆｐｅｒｉｃｅｎｔｒｏｍｅｒｉｃｈｅｔｅｒｏｃｈｒｏｍａｔｉｎｍａｙｃｏｎｔｒｉｂｕｔｅｔｏｃｈｒｏｍｏｓｏｍｅｉｎｓｔａｂｉｌｉｔｙ．Ｏｎｃｏｇｅｎｅ３１：３２４４- ３２５３．

ＴｅｙｔｅｌｍａｎＬ，ＴｈｕｒｔｌｅＤＭ，ＲｉｎｅＪ，ｖａｎＯｕｄｅｎａａｒｄｅｎＡ．２０１３．ＨｉｇｈｌｙｅｘｐｒｅｓｓｅｄｌｏｃｉａｒｅｖｕｌｎｅｒａｂｌｅｔｏｍｉｓｌｅａｄｉｎｇＣｈＩＰｌｏｃａｌｉｚａｔｉｏｎｏｆｍｕｌｔｉｐｌｅｕｎｒｅｌａｔｅｄｐｒｏｔｅｉｎｓ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉ１１０：１８６０２-１８６０７．

ＴｈａｋｕｒＪ，ＨｅｎｉｋｏｆｆＳ．２０１６．ＣＥＮＰＴｂｒｉｄｇｅｓａｄｊａｃｅｎｔＣＥＮＰＡｎｕｃｌｅｏｓｏｍｅｓｏｎｙｏｕｎｇｈｕｍａｎ α−ｓａｔｅｌｌｉｔｅｄｉｍｅｒｓ．ＧｅｎｏｍｅＲｅｓ２６：１１７８-１１８７．ＴｏｒｏｋＴ，ＨａｒｖｌｅＰＤ，ＢｕｒａｔｏｖｉｃｈＭ，ＢｒｙａｎｔＰＪ．１９９７．ＴｈｅｐｒｏｄｕｃｔｏｆｐｒｏｌｉｆｅｒａｔｉｏｎｄｉｓｒｕｐｔｅｒｉｓｃｏｎｃｅｎｔｒａｔｅｄａｔｃｅｎｔｒｏｍｅｒｅｓａｎｄｒｅｑｕｉｒｅｄｆｏｒｍｉｔｏｔｉｃｃｈｒｏｍｏｓｏｍｅｃｏｎｄｅｎｓａｔｉｏｎａｎｄｃｅｌｌｐｒｏｌｉｆｅｒａｔｉｏｎｉｎＤｒｏｓｏｐｈｉｌａ．ＧｅｎｅｓＤｅｖ１１：２１３-２２５．

ＸｉＹ，ＹａｏＪ，ＣｈｅｎＲ，ＬｉＷ，ＨｅＸ．２０１１．Ｎｕｃｌｅｏｓｏｍｅｆｒａｇｉｌｉｔｙｒｅｖｅａｌｓｎｏｖｅｌｆｕｎｃｔｉｏｎａｌｓｔａｔｅｓｏｆｃｈｒｏｍａｔｉｎａｎｄｐｏｉｓｅｓｇｅｎｅｓｆｏｒａｃｔｉｖａｔｉｏｎ．ＧｅｎｏｍｅＲｅｓ２１：７１８-７２４．

ＺｅｎｔｎｅｒＧＥ，ＫａｓｉｎａｔｈａｎＳ，ＸｉｎＢ，ＲｏｈｓＲ，ＨｅｎｉｋｏｆｆＳ．２０１５．ＣｈＥＣ−ｓｅｑｋｉｎｅｔｉｃｓｄｉｓｃｒｉｍｉｎａｔｅｔｒａｎｓｃｒｉｐｔｉｏｎｆａｃｔｏｒｂｉｎｄｉｎｇｓｉｔｅｓｂｙＤＮＡｓｅｑｕｅｎｃｅａｎｄｓｈａｐｅｉｎｖｉｖｏ．ＮａｔＣｏｍｍｕｎ６：８７３３．

ＺｈａｎｇＷ，ＣｏｌｍｅｎａｒｅｓＳＵ，ＫａｒｐｅｎＧＨ．２０１２．ＡｓｓｅｍｂｌｙｏｆＤｒｏｓｏｐｈｉｌａｃｅｎｔｒｏｍｅｒｉｃｎｕｃｌｅｏｓｏｍｅｓｒｅｑｕｉｒｅｓＣＩＤｄｉｍｅｒｉｚａｔｉｏｎ．ＭｏｌＣｅｌｌ４５：２６３-２６９．

（実施例７）

クロマチン修飾の自動化ｉｎｓｉｔｕプロファイリングには、細胞型および遺伝子調節プログラムに対する分解能がある

序論

細胞は、それらの明確に異なる素性および機能特性を、遺伝子発現を制御するシス調節ＤＮＡエレメントの活性を変化させることにより、同定する^１、２。プロモーターエレメントは、全ての遺伝子の５’転写開始部位（ＴＳＳ）付近に位置するが、遠位シス調節エレメント、例えばエンハンサーは、ＤＮＡの長いストレッチを架橋して、選ばれたプロモーターと相互作用し、細胞型特異的遺伝子発現を指示することが多い^１、２。それらの遺伝物質（すなわち、ＤＮＡ配列）に加えて、本発明者らの細胞は、これらの明確に異なるシス調節の確立を遺伝性エピジェネティック情報の形態で細胞分裂を通して伝達し、それによって、それらは、それらの特有の細胞の素性を伝えることができる^３、４。これらのシス調節エレメントを認識する核タンパク質の欠陥が、特定の組織および細胞型に現れることが多い多くのヒト疾患の根底にある^５〜９。患者試料の分子診断の基準を提供するために、人体の細胞の包括的アトラスを作成するための努力が進められている^{１０、１１}。健常細胞および罹患細胞における細胞型特異的クロマチンランドスケープの特徴付けは、このアトラスに不可欠であるが、技術的な限界が、このプロジェクトに必要な大規模なスケールでのクロマチンタンパク質のゲノムワイドなプロファイリングのための旧来のアプローチの実行を妨げてきた。

エピジェネティックな機能不全は多くのヒト疾患の根底にあるという認識の高まり^１２にもかかわらず、患者試料のエピゲノムをプロファイリングするために利用できる方法は非常に少ない。エピゲノム技術の臨床的可能性の実現には、多数の患者試料を並行してプロファイリングすることができるロバストな拡張性のあるアプローチが必要である。ハイスループットシーケンシングと組み合わせた抗原特異的抗体でのクロマチン免疫沈降は、クロマチンプロファイリングに広く使用されてきたが、この方法は、労働集約的であり、アーチファクトを生じやすく^１３、弱いシグナルをゲノムバックグラウンドノイズと区別するために高度なシーケンシング深度を必要とするため、それを臨床応用のスケールにするのは困難である。最近、本発明者らは、因子特異的抗体を使用してミクロコッカスヌクレアーゼ（ＭＮａｓｅ）をゲノム結合部位に繋留する代替クロマチンプロファイリング技法としてＣＵＴ＆ＲＵＮを導入した^{１４、１５}。標的ヌクレアーゼが結合部位周辺でクロマチンを切断し、放出されたＤＮＡは、標準的なライブラリー調製技術を使用して容易にシーケンシングされ、その結果、タンパク質−ＤＮＡ相互作用が効率的にマッピングされる。ＣＵＴ＆ＲＵＮは、非常に低いバックグラウンドを有し、これは、一般に、高品質なゲノムワイドなプロファイルを得るために必要とされる試料の量およびシーケンシングコストを大いに低下させる^{１４、１６}。

ここで、本発明者らは、液体ハンドリングロボットを用いて９６ウェル形式でクロマチンタンパク質および修飾をプロファイリングするようにＣＵＴ＆ＲＵＮプロトコールを改良する。この方法をＨ１ヒト胚性幹細胞（ｈＥＳＣ）系およびＫ５６２白血病細胞系に適用することにより、本発明者らは、細胞型を比較してそれらの明確に異なる遺伝子調節プログラムを特定するためのロバストな定量的メトリクスを開発する。加えて、本発明者らは、この方法が、凍結腫瘍試料からクロマチンの特徴を定義してそれらの細胞の素性を決定することができることを示す。ＡｕｔｏＣＵＴ＆ＲＵＮは、クロマチンに基づく遺伝子調節のハイスループット研究にとって理想的であり、患者試料のクロマチンランドスケープの検査を診療所における日常的なものにすることができるだろう。

結果

クロマチンタンパク質のゲノムワイドなプロファイリングのための自動化プラットフォーム

自動化形式にＣＵＴ＆ＲＵＮを適応させるために、本発明者らは、磁気分離および温度制御を助長するためのＢｅｃｋｍａｎＢｉｏｍｅｋＦＸ液体ハンドリングロボットを装備した（図４３Ａ）。先ず、細胞をコンカナバリンＡ被覆磁気ビーズに結合させ、それによって、後続の全ての洗浄を磁気分離により行うことを可能にする。次いで、ビーズ被覆試料を抗体とともにインキュベートし、最大９６の試料をプレートに整列させる（図４３Ａ）。逐次的な洗浄、プロテインＡ−ＭＮａｓｅ融合タンパク質の繋留、ＤＮＡの切断、および切断されたクロマチン断片の試料上清への放出を、Ｂｉｏｍｅｋで行う（図４９Ａ）。ゲノミクスプロトコールの自動化の大きな障害は、それらが、通常は、ライブラリー調製の前に少量の核酸の精製を必要とすることである。この障害を克服するために、本発明者らは、Ｉｌｌｕｍｉｎａライブラリーアダプターの直接ライゲーションのためにクロマチン断片におけるＤＮＡ末端をポリッシングする方法を開発した（図４９Ａ）。次いで、インデックス付きＣＵＴ＆ＲＵＮライブラリーを、ＰＣＲ濃縮の前にも後にもＡｍｐｕｒｅＸＰ磁気ビーズを使用してＢｉｏｍｅｃｋで精製する。末端ポリッシング、アダプターライゲーションおよびＰＣＲ濃縮反応を別々のサーモサイクラーで行う。このＡｕｔｏＣＵＴ＆ＲＵＮプロトコールは、単一オペレーターによる、すぐにプールしてシーケンシングすることができる最大９６のライブラリーの２日での生成を可能にする（図４３Ａ）。

ＡｕｔｏＣＵＴ＆ＲＵＮの有効性を試験するために、本発明者らは、活性クロマチン状態を示す４つのヒストン修飾（Ｈ３Ｋ４ｍｅ１、Ｈ３Ｋ４ｍｅ２、Ｈ３Ｋ４ｍｅ３およびＨ３Ｋ２７ａｃ）および１つの抑制性修飾（Ｈ３Ｋ２７ｍｅ３）を標的とする抗体を使用するＨ１ｈＥＳＣおよびＫ５６２細胞の２つの生物学的反復実験を同時にプロファイリングした。各々のヒストンマークについてのリードの全体的分布を比較することにより、本発明者らは、試料が、それらの生物学的反復と高度に相関し、バイアスのない階層行列で一緒にクラスターを形成することを見出した（図４３Ｂ）。加えて、活性ヒストンマークのゲノムワイドなプロファイルは、所与の細胞型の中で一緒にクラスターを形成し、抑制性ヒストンマークＨ３Ｋ２７ｍｅ３から分離した（図４３Ｂ）。これらのプロファイルは、ＩｇＧ陰性対照とそれほど相関しないので、抗体特異的シグナルを表す。まとめると、これらの結果は、ＡｕｔｏＣＵＴ＆ＲＵＮクロマチンプロファイリングは、ヒストンマークの細胞型特異的分布を再現可能に捕捉することを示す。

ヒストンは、クロマチンの中でＤＮＡと密に会合しているため、本発明者らは、ＡｕｔｏＣＵＴ＆ＲＵＮを、より短い滞留時間を有するＤＮＡ結合転写因子のマッピングに適用することができるかどうかも調査した。本発明者らは、ヒストン遺伝子座特異的遺伝子調節因子ＮＰＡＴと、インスレータータンパク質ＣＴＣＦという、２つの転写因子を用いて、ＡｕｔｏＣＵＴ＆ＲＵＮの性能を試験した^{１７、１８}。ＮＰＡＴとＣＴＣＦの両方のＡｕｔｏＣＵＴ＆ＲＵＮプロファイルは、Ｈ１細胞とＫ５６２細胞の両方においてそれらの予想標的に対して非常に特異的であり（図４９Ｂ、４９Ｃ）、Ｋ５６２細胞におけるＣＴＣＦのシグナル感度は、本発明者らの以前の結果^１５に匹敵した。したがって、ＡｕｔｏＣＵＴ＆ＲＵＮは、多様なＤＮＡ結合タンパク質のハイスループットでゲノムワイドなプロファイリングに好適である。

それらの発生上の可塑性を維持するために、ｈＥＳＣは、オーバーラップしているＨ３Ｋ２７ｍｅ３およびＨ３Ｋ４メチル化によって示される、条件的ヘテロクロマチンの抑制ドメインとともに散在している開放された、高アセチル化されたクロマチンランドスケープを一般に有する^{１９〜２２}。ＡｕｔｏＣＵＴ＆ＲＵＮは、ｈＥＳＣにおけるこれらの特徴を再現する；本発明者らは、Ｈ１細胞が、系統限定Ｋ５６２細胞系と比較して増加されたＨ３Ｋ２７ａｃを有し、その一方で、抑制性ヒストンマークＨ３Ｋ２７ｍｅ３のドメインが、Ｈ１細胞では稀だがＫ５６２細胞では高頻度に見られることを観察した（図４４Ａ）。本発明者らはまた、Ｈ１細胞においてＨ３Ｋ２７ｍｅ３シグナルとＨ３Ｋ４ｍｅ２シグナルとの広範なオーバーラップを観察したが、Ｋ５６２細胞では観察されなかった（図４４Ａ、４４Ｂ）。したがって、ＡｕｔｏＣＵＴ＆ＲＵＮプロファイルは、ｈＥＳＣに見られる特殊化したクロマチンの特徴と一致する。

Ｈ３ヒストンテールに対する翻訳後修飾が転写活性と密接に相関することは文書で十分に裏づけられている。ヒストン修飾の本発明者らのＡｕｔｏＣＵＴ＆ＲＵＮプロファイルが、シス調節エレメントの転写活性を示すかどうかを判定するために、本発明者らは、ＲＮＡ−ｓｅｑ発現データに従ってランクの順序付けがなされた、遺伝子の転写開始部位（ＴＳＳ）周辺の５つのヒストンマークの分布を調査した（図４４Ｃ、４４Ｄ）^２３。本発明者らは、活性マークＨ３Ｋ４ｍｅ３が、両方の細胞型における発現と最も高度に相関し（Ｈ１およびＫ５６２について、それぞれ、ｒ＝０．７０および０．８１）、それにＨ３Ｋ４ｍｅ２およびＨ３Ｋ２７ａｃが続くことを見出す（図４９Ｄ、４９Ｅ）。抑制性ヒストンマークＨ３Ｋ２７ｍｅ３は、発現と反相関する（Ｈ１およびＫ５６２について、それぞれ、ｒ＝−０．１６および−０．５３）（図４９Ｄ、４９Ｅ）。本発明者らは、これらの５つのマークについてのＡｕｔｏＣＵＴ＆ＲＵＮが転写活性を広く再現し、したがって、細胞型特異的遺伝子調節プログラムを同定するための戦略をもたらすと結論付ける。

簡易なクロマチンメトリクスには、ＡｕｔｏＣＵＴ＆ＲＵＮデータからの遺伝子発現プログラムに対する分解能がある

本発明者らは、細胞型を比較してそれらの遺伝子調節プログラムを区別するためにＡｕｔｏＣＵＴ＆ＲＵＮデータに適用することができる定量的メトリクスを開発したかった。Ｈ３Ｋ４メチル化およびＨ３Ｋ２７ａｃは、主として活性プロモーターを示すが、Ｈ３Ｋ２７ｍｅ３は、遺伝子抑制度を示すため、本発明者らは、これらのマークを組み合わせて単一のモデルにすることにより、遺伝子活性についてのよりロバストなメトリクスを開発することができると推論した。ＲＮＡ−ｓｅｑは、細胞型特異的遺伝子発現プログラムを同定するために広範に使用されている^２３ため、本発明者らは、正規化されたＨ３Ｋ４ｍｅ２、Ｈ３Ｋ２７ａｃおよびＨ３Ｋ２７ｍｅ３リードカウントを、プロモーターに関連活性スコアを割り当てるシス調節要素活性モデル（ＣＲＥＡＭ）に組み込む、重み付き線形回帰モデルを訓練するための基準として、ＲＮＡ−ｓｅｑデータを使用した。Ｈ３Ｋ４ｍｅ３およびＨ３Ｋ４ｍｅ１よりもＨ３Ｋ４ｍｅ２を選択したのは、Ｈ３Ｋ４ｍｅ３およびＨ３Ｋ４ｍｅ１が相互依存性であるため、ならびにＨ３Ｋ４ｍｅ２が近位シス調節エレメントと遠位シス調節エレメントの両方の活性のモデリングに一意的に適用可能であるためである（下記参照）。Ｋ５６２細胞のプロモーターに適用したとき、ＣＲＥＡＭスコアは、ＲＮＡ−ｓｅｑ値と非常によく相関し（ｒ＝０．８３）（図４５Ａ）、したがって、ＣｈＩＰ−ｓｅｑによりマッピングされた最大３９のヒストン修飾を使用する類似のモデル（ｒ＝０．８１）^２４に匹敵する遺伝子発現予測力を提供する。加えて、Ｋ５６２細胞で訓練した重み付きＣＲＥＡＭは、Ｈ１細胞に適用したときにもよく機能し（図５０Ａ、５０Ｂ）、これは、このモデルおよびデータ品質が、特徴づけられていない細胞型にプロモータースコアを割り当てるために十分ロバストなものであることを示す。

このモデルを使用して、本発明者らは、ＡｕｔｏＣＵＴ＆ＲＵＮが細胞型特異的活性を有するプロモーターを正確に同定するかどうかを調査した。最初に、本発明者らは、ＲＮＡ−ｓｅｑ値を明確に割り当てることおよびＣＲＥＡＭスコアがＨ１またはＫ５６２細胞のどちらかにおいて２倍より高く濃縮されたプロモーターをコールすることができる、単一のＴＳＳを有する遺伝子に、本発明者らの分析の焦点を合せた（図４５Ｂ）。比較のために、本発明者らは、Ｈ１またはＫ５６２細胞のどちらかにおいてそれらのＲＮＡ−ｓｅｑ発現値に従って２倍より高く濃縮された遺伝子もコールした（図５０Ｃ）。ＲＮＡ−ｓｅｑ値から生成したプロットを用いてＣＲＥＡＭスコアにより同定したＨ１およびＫ５６２特異的遺伝子を表示することにより、本発明者らは、ＣＲＥＡＭスコアにより細胞特異的と同定される遺伝子の多くが、ＲＮＡ−ｓｅｑにより見落とされ（図４５Ｂ、４５Ｃ）、逆もまた真である（図５０Ｃ、５０Ｄ）であることを見出し、これは、これらの方法が、非常に多くの遺伝子についての発現の変化に対して差異のある感度を示すことを示唆する。心強いことに、ＣＲＥＡＭスコアとＲＮＡ−ｓｅｑの両方に従って細胞型特異的とコールされる８６５の遺伝子には、発生調節因子が高度に濃縮されており、単独のＣＲＥＡＭスコアまたはＲＮＡ−ｓｅｑによりコールされる遺伝子には、発生ＧＯタームが濃縮されていない（図４５Ｄ、５０Ｅ〜５０Ｇ）。加えて、ＣＲＥＡＭにより細胞型特異的とコールされた２０１４の遺伝子のうち３５個のみが、ＲＮＡ−ｓｅｑに従って反対の細胞型特異性を有する（図４５Ｄ）。したがって、ＡｕｔｏＣＵＴ＆ＲＵＮを適用して、細胞型特異的発生調節因子を正確に同定することができる。

ＡｕｔｏＣＵＴ＆ＲＵＮデータが、高度に特徴付けされた転写因子の細胞型特異性を再現するかどうかを判定するために、本発明者らは、全てのプロモーターを含むように本発明者らのＣＲＥＡＭ分析を拡張した。本発明者らは、ｈＥＳＣ多能性ネットワークの成分（ＮＡＮＯＧ、ＳＯＸ２、ＳＡＬＬ４およびＯＴＸ２）がＨ１細胞において高度に濃縮されており、その一方で、造血前駆細胞運命の調節因子（ＰＵ．１、ＴＡＬ１、ＧＡＴＡ１およびＧＡＴＡ２）がＫ５６２細胞において高度に濃縮されていることを見出す（図４５Ｅ）^{２５、２６}。興味深いことに、この方法は、代替プロモーター活性（例えば、ＯＴＸ２およびＴＡＬ１）の差異も同定し、したがって、所与の細胞型において発現される特定の遺伝子アイソフォームを示し（図４５Ｅ）、これは、ＲＮＡ−ｓｅｑを使用する場合は可能でない特徴である。本発明者らは、ＡｕｔｏＣＵＴ＆ＲＵＮが、細胞の素性の主要調節因子の同定を可能にし、したがって、細胞型をハイスループット形式で特徴付けるための強力なツールを提供すると結論付ける。

ＡｕｔｏＣＵＴ＆ＲＵＮによる腫瘍のプロファイリング

タンパク質−ＤＮＡ相互作用をプロファイリングするための旧来の方法（例えば、ＣｈＩＰ−ｓｅｑ）は、少量の出発材料を含有することが多く、急速凍結されていることが多い、臨床的に意義のある試料を、取り扱うことが一般にできない。ＡｕｔｏＣＵＴ＆ＲＵＮが、凍結された腫瘍検体のプロファイリングに好適であるかどうかを試験するために、本発明者らは、脳幹の同様の領域から剖検されたが、それらの発がん性バックグラウンドの点で異なる、２つのびまん性正中神経膠腫（ＤＭＧ）患者由来細胞系（ＶＵＭＣ−１０およびＳＵ−ＤＩＰＧ−ＸＩＩＩ）を入手した^２７。これらのＤＭＧ細胞系の両方はマウスモデルにおいて異種移植片を容易に形成し、本発明者らは、ＡｕｔｏＣＵＴ＆ＲＵＮを適用して、典型的な臨床条件下でマウスの脳に播種され、腫瘍が形成され次第摘出され凍結されたＶＵＭＣ−１０およびＳＵ−ＤＩＰＧ−ＸＩＩＩ異種移植片において、ヒストン修飾をプロファイリングした（図４６Ａ）。比較のために、本発明者らは、これらのＤＭＧを細胞培養から直接採取し、それらを同じＡｕｔｏＣＵＴ＆ＲＵＮプレートでプロファイリングした（図４６Ａ）。この場合もやはり、本発明者らは、反復実験が極めて類似していることを見出したため、本発明者らは、それらをさらなる解析のために組み合わせた。重要なこととして、細胞培養試料は、対応する凍結異種移植片においてプロファイリングされた同じマークと高度に相関し、異種移植片組織および細胞培養試料でのＡｕｔｏＣＵＴ＆ＲＵＮは、同様のデータ品質を生じさせた（図４６Ｂ、図５１）。したがって、ＡｕｔｏＣＵＴ＆ＲＵＮは、凍結組織試料からゲノムワイドなクロマチンプロファイルを確実に生成する。

がん患者の有効な処置群への層別化は、同じ組織に由来する腫瘍亜型の区別を必要とするため、ＶＵＭＣ−１０およびＳＵ−ＤＩＰＧ−ＸＩＩＩ試料は、ＡｕｔｏＣＵＴ＆ＲＵＮの診断可能性を詳しく調査するために理想的である。これらの試料にＣＲＥＡＭを適用することにより、本発明者らは、ＶＵＭＣ−１０細胞とＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞の間で差異のある活性を示す５，００６のプロモーターを同定した（図４７Ａ）。これらの腫瘍の神経細胞起源と一致して、ＶＵＭＣ−１０特異的プロモーターとＳＵ−ＤＩＰＧ−ＸＩＩＩ特異的プロモーターの両方には、神経発生に関与する遺伝子が有意に濃縮されている（図５２Ａ、５２Ｂ）。細胞シグナル伝達に関与する遺伝子も、ＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞を過剰提示し（図５２Ｂ）；例えば、ＰＤＧＦＲ遺伝子のプロモーターならびにそのリガンドＰＤＧＦは、ＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞において高度に活性である（図４７Ａ）。これは、ＤＭＧが、腫瘍成長を促進する、ＰＤＧＦＲ−αの活性化突然変異を含有することが多いという観察^７と一致する。加えて、ＴＧＦ−βシグナル伝達経路の成分である^２８、ＳＭＡＤ３遺伝子の１つのプロモーターは、ＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞において特に活性であるのに対して、２つの異なるＳＭＡＤ３プロモーターは、ＶＵＭＣ−１０細胞において活性である（図４７Ａ、図５１）。これは、ＡｕｔｏＣＵＴ＆ＲＵＮを適用して、腫瘍成長を駆動し得るシグナル伝達経路および治療剤に対する潜在的な感受性の判定の指標となる、腫瘍特異的活性を表示するプロモーターを同定することができることを示唆する。

診断ツールとして、本発明者らは、ＣＲＥＡＭを伴うＡｕｔｏＣＵＴ＆ＲＵＮを使用して、細胞型および組織試料を定量的に評定し、健常および罹患細胞型の予め定義された基準マップの中にそれらを配置することができると推論した。この考えと一致して、ＣＲＥＡＭスコアは、５，００６の遺伝子プロモーターが、ＶＵＭＣ−１０とＳＵ−ＤＩＰＧ−ＸＩＩＩの間で差異のある活性を表示する（図４７Ａ）のに対して、３８８のプロモーターしか、ＶＵＭＣ−１０凍結異種移植片とＶＵＭＣ−１０培養細胞の間で差異のある活性を示さず（図４７Ｂ）、１，６１９のプロモーターしか、ＳＵ−ＤＩＰＧ−ＸＩＩＩ異種移植片とＳＵ−ＤＩＰＧ−ＸＩＩＩ培養細胞の間で差異のある活性を示さない（図５２Ｃ）ことを示す。加えて、本発明者らは、Ｈ１およびＫ５６２細胞に関して４つのＤＭＧ試料のプロモーターＣＲＥＡＭスコアを比較したとき、ＤＭＧ異種移植片は、それらの対応する細胞培養試料と群を抜いて類似していることを見出す（図４７Ｃ）。本発明者らは、ＡｕｔｏＣＵＴ＆ＲＵＮを、細胞の素性を凍結腫瘍試料に割り当てるための信頼性のある方法として使用することができると結論付ける。

細胞型特異的エンハンサーのハイスループットマッピング

遺伝子プロモーターの細胞型特異的活性は、エンハンサーなどの遠位シス調節エレメントからのシグナルを組み込むことにより確立されることが多い^１、２。プロモーターと同様に、エンハンサーもＨ３Ｋ４ｍｅ２を表示し^２９、活性エンハンサーは、Ｈ３Ｋ２７ａｃによって通常は示されるのに対して、抑制エンハンサーは、Ｈ３Ｋ２７ｍｅ３によって示される^{２２、３０、３１}。これは、プロモーターＣＲＥＡＭスコアを割り当てるために本発明者らが使用したＡｕｔｏＣＵＴ＆ＲＵＮプロファイルが、細胞型特異的エンハンサーの同定も可能にするはずであることを示唆する。この可能性を調査するために、本発明者らは、先ず、本発明者らのＨ１データを、活性プロモーターとエンハンサーの両方が濃縮されている、ＡＴＡＣ−ｓｅｑにより生成された利用可能なクロマチン接近可能性マップと比較した^{３２、３３}。本発明者らがプロファイリングしたマークのうち、本発明者らは、Ｈ３Ｋ４ｍｅ２ピークが、ＡＴＡＣ−ｓｅｑと最高のオーバーラップ（図４８Ａ、図５３Ａ）を示し、３６，７２５／５２，２７０のＡＴＡＣ−ｓｅｑピーク（約７０％）を同定することを見出す。興味深いことに、Ｈ３Ｋ４ｍｅ２はまた、ＡＴＡＣ−ｓｅｑプロファイルでピークとしてコールされなかった追加の７１，３９７部位において高頻度に見られる（図４８Ａ、図５３Ａ）。これらのＨ３Ｋ４ｍｅ２特異的部位の多くは、低いが検出可能なＡＴＡＣ−ｓｅｑシグナルを示し（図５３Ｂ）、これは、それらが、抑制プロモーターおよびエンハンサーに対応し得ることを示す。この解釈と一致して、平均してＨ３Ｋ４ｍｅ２＋／ＡＴＡＣ−ＴＳＳはＡＴＡＣ＋ＴＳＳより高いＨ３Ｋ２７ｍｅ３シグナルを有する（図５３）。Ｈ３Ｋ４ｍｅ２＋／ＡＴＡＣ＋ピークを、注釈付きＴＳＳとオーバーラップするものと、オーバーラップしないものとに分割することによって、本発明者らは、Ｈ３Ｋ４ｍｅ３がプロモーターにおいてはるかに濃縮されている一方で、Ｈ３Ｋ４ｍｅ１が遠位調節エレメントにおいてより濃縮されている（図４８Ｂ、４８Ｃ、図５３Ｄ）ことを見出し、これは、これらの遠位調節エレメントにはエンハンサーが濃縮されている可能性が高いことを示唆する^{２２、３４}。したがって、ＡｕｔｏＣＵＴ＆ＲＵＮによるＨ３Ｋ４ｍｅ２の部位のマッピングは、遺伝子発現プログラムを制御する活性および抑制シス調節エレメントのレパートリーを定義するための高感度法を提供する。

最後に、本発明者らは、ＡｕｔｏＣＵＴ＆ＲＵＮを使用して細胞型特異的エンハンサーを同定することができるかどうかを調査した。推定的エンハンサー部位の数を拡張するために、本発明者らは、本発明者らの全ての試料からＨ３Ｋ４ｍｅ２プロファイルに関してコールされた非ＴＳＳピークのリストをコンパイルした。本発明者らの線形回帰モデルを使用して、次いで、本発明者らは、これらのエレメントにエンハンサーＣＲＥＡＭスコアを割り当て、異なる細胞型間のそれらの相関を調査した。本発明者らは、ＤＭＧ細胞培養試料のエンハンサーＣＲＥＡＭスコアと異種移植片のエンハンサーＣＲＥＡＭスコアが、高度に相関し（ＳＵ−ＤＩＰＧ−ＸＩＩＩおよびＶＵＭＣ−１０細胞において、それぞれ、ｒ＝０．７５および０．８７）（図４８Ｄ）、およびＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞のエンハンサーＣＲＥＡＭスコアが、ＶＵＭＣ−１０細胞と弱い正の相関（例えば、ｒ＝０．１９）を示すことを見出し、これは、それらの共通の神経起源にもかかわらず細胞型特異的な差異を表す可能性が高い。例えば、ＳＯＸ２多能性遺伝子座におけるエンハンサーは、以前に示唆されている^３５ように、ＶＵＭＣ−１０細胞より原始的な神経幹細胞型に似ているＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞と一致して、ＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞とＶＵＭＣ−１０細胞の間で差異を表示する（図４８Ｅ）。したがって、ＡｕｔｏＣＵＴ＆ＲＵＮは、細胞型および組織試料を層別化するためのストリンジェントな方法を提供する。

考察

本発明者らは、Ｉｌｌｕｍｉｎａライブラリー調製のためのクロマチン断片の直接ライゲーションを開発することにより、ＣＵＴ＆ＲＵＮ技法を自動化プラットフォームに適応させ、洗浄ステップおよびライブラリー精製のために磁気分離を実行した。ＡｕｔｏＣＵＴ＆ＲＵＮは、抗体標的化クロマチンタンパク質の９６のゲノムワイドなプロファイルをちょうど２日で生成し、したがって、クロマチンランドスケープを調べるための研究のスループットおよび可能なスケールを劇的に増大させる。本発明者らは、３つのヒストン修飾（Ｈ３Ｋ２７ａｃ、Ｈ３Ｋ２７ｍｅ３およびＨ３Ｋ４ｍｅ２）のプロファイリングだけで、プロモーターおよびエンハンサーの細胞型特異的活性を判定するのに十分であることを示し、したがって、異なる細胞型のエピジェネティックな調節を比較するための強力な定量的メトリクスを提供する。自動化ワークフローは、実験間の技術的なばらつきを低減させて、生物学的反復実験からおよび異なる試料タイプから一貫したプロファイルを生成する。

ＡｕｔｏＣＵＴ＆ＲＵＮの最適化を継続するために、ハードウェア変更およびコンピュータによる開発を構想することができるだろう。様々な抗体収集物をスクリーニングすることにより、ＡｕｔｏＣＵＴ＆ＲＵＮを使用して効率的にプロファイリングすることができる核タンパク質のレパートリーを劇的に拡張することになる。加えて、現行のＡｕｔｏＣＵＴ＆ＲＵＮプロトコールを、人気のある液体ハンドリングロボット用に最適化するが、可逆的磁気サーモサイクラーブロックを組み込んでいるカスタムロボットは、ＣＵＴ＆ＲＵＮ反応およびライブラリー調製を適所で行うことを可能にし、したがって、さらにいっそうプロトコールを簡素化することになる。最後に、細胞型を区別するメトリクスを、データのさらなる態様を組み込むことによって、例えば、エンハンサー活性とプロモーター活性の両方の組合せを使用することによって、向上させることができるだろう。

ＡｕｔｏＣＵＴ＆ＲＵＮによる凍結組織試料のプロファイリングの卓越した再現性には、エピジェネティック医学分野を変換する可能性がある^１２。患者診断に現在使用されている他のゲノミクスアプローチと比較して、ＡｕｔｏＣＵＴ＆ＲＵＮには、罹患細胞内のクロマチンタンパク質をプロファイリングする特有の能力がある。例えば、クロマチンタンパク質中の発がん性融合体によって引き起こされるがんを、ＡｕｔｏＣＵＴ＆ＲＵＮによってプロファイリングして、それらのクロマチンランドスケープに基づく分子診断を提供することができ、それと同時に、新規突然変異タンパク質により破壊される遺伝子座をマッピングすることができるだろう。これは、患者層別化の強力なツールを提供し、クロマチンをモジュレートする治療薬、例えば、ヒストンデアセチラーゼまたはヒストンメチルトランスフェラーゼ阻害剤が、それらの所期の効果を有しているかどうかについての直接的リードアウトも提供する。

方法

ＡｕｔｏＣＵＴ＆ＲＵＮ

手短に述べると、細胞または組織試料をコンカナバリンＡ被覆磁気ビーズ（ＢａｎｇｓＬａｂｏｒａｔｏｒｉｅｓ、カタログ番号ＢＰ５３１）に結合させ、ジギトニンで透過処理し、以前に記載された^１４ようなタンパク質特異的抗体と結合させる。次いで、試料を９６ウェルプレートに整列させ、洗浄ステップ中に試料を磁気分離するための９６ＳＳｕｐｅｒＭａｇｎｅｔＰｌａｔｅ（ＡｌｐａｑｕａＳＫＵＡ００１３２２）と、冷却ユニットへのルートが設けられているＰＣＲプレート用のＡｌｕｍｉｎｕｍＨｅａｔＢｌｏｃｋＩｎｓｅｒｔ（Ｖ＆ＰＳｃｉｅｎｔｉｆｉｃ，Ｉｎｃ．ＶＰ７４１Ｉ６Ａ）とを装備したＢｅｃｋｍａｎＢｉｏｍｅｋＦＸ液体ハンドリングロボットで処理して、２ｍＭＣａＣｌ_２の添加後に０〜４℃でＭＮａｓｅ消化反応を行う。次いで、後続の酵素的反応のためのＭｇ^２＋添加を可能にするＥＧＴＡの添加によって、９分後にＭＮａｓｅ消化反応を停止させる。このステップによって、ライブラリー調製前のＤＮＡ精製の必要が回避される。次いで、消化中に上清に放出されたクロマチン断片を、末端修復およびバーコード化Ｙアダプターとのライゲーションのための基質として使用する。ライゲーションの前に、Ａ−テーリングステップを５８℃で行って、ライブラリー内のサブヌクレオソーム断片を保存する^{３６、３７}。末端修復およびアダプターライゲーション反応を別々のサーモサイクラーで行った。次いで、クロマチンタンパク質をプロテイナーゼＫで消化し、アダプターとライゲーションされたＤＮＡ断片を、ＰＣＲ前Ａｍｐｕｒｅビーズクリーンアップとサイズ選択のラウンドを２ラウンド使用してＢｉｏｍｅｃｋＦＸで精製した。ＫＡＰＡＰＣＲキット（ＫＡＰＡカタログ番号ＫＫ２５０２）を使用してサーモサイクラーでＰＣＲ濃縮反応を行った。ＢｉｏｍｅｃｋＦＸでＰＣＲ後Ａｍｐｕｒｅビーズクリーンアップとサイズ選択のラウンドを２ラウンド行って、望ましくないタンパク質および自己ライゲーションしたアダプターを除去した。ＡｕｔｏＣＵＴ＆ＲＵＮライブラリーのサイズ分布をＡｇｉｌｅｎｔ４２００ＴａｐｅＳｔａｔｉｏｎで分析し、ライブラリー収量をＱｕｂｉｔＦｌｕｏｒｏｍｅｔｅｒ（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）によって定量した。ＦｒｅｄＨｕｔｃｈｉｎｓｏｎＣａｎｃｅｒＲｅｓｅａｒｃｈＣｅｎｔｅｒＧｅｎｏｍｉｃｓＳｈａｒｅｄＲｅｓｏｕｒｃｅでのＩｌｌｕｍｉｎａＨｉＳｅｑ２５００プラットフォームを用いる２レーンフローセルでのペアードエンド２５×２５ｂｐシーケンシングのために、等モル濃度でレーンごとに最大２４のバーコード化ＡｕｔｏＣＵＴ＆ＲＵＮライブラリーをプールした。

抗体

本発明者らは、ウサギ抗ＣＴＣＦ（１：１００、Ｍｉｌｌｉｐｏｒｅカタログ番号０７−７２９）、ウサギ抗ＮＰＡＴ（１：１００、ＴｈｅｒｍｏＦｉｓｈｅｒカタログ番号ＰＡ５−６６８３９）、ウサギ抗Ｈ３Ｋ４ｍｅ１（１：１００、Ａｂｃａｍカタログ番号ａｂ８８９５）、ウサギ抗Ｈ３Ｋ４ｍｅ２（１：１００、Ｍｉｌｌｉｐｏｒｅカタログ番号０７−０３０）、ウサギ抗Ｈ３Ｋ４ｍｅ３（１：１００、ＡｃｔｉｖｅＭｏｔｉｆカタログ番号３９１５９）、ウサギ抗Ｈ３Ｋ２７ｍｅ３（１：１００、ＣｅｌｌＳｉｇｎａｌｉｎｇＴｅｃｈカタログ番号９７３３Ｓ）を使用した。ｐＡＭＮａｓｅは、多くのマウス抗体と効率的に結合しないので、本発明者らは、ウサギ抗マウスＩｇＧ（１：１００、Ａｂｃａｍ、カタログ番号ａｂ４６５４０）をアダプターとして使用した。ウサギ抗Ｈ３Ｋ２７ａｃ（１：５０、Ｍｉｌｌｉｐｏｒｅカタログ番号ＭＡＢＥ６４７）を使用して、Ｈ１およびＫ５６２細胞においてＡｕｔｏＣＵＴ＆ＲＵＮによって、ならびにＶＵＭＣ−１０およびＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞系において手動で、Ｈ３Ｋ２７ａｃをプロファイリングした。ウサギ抗Ｈ３Ｋ２７ａｃ（１：１００、Ａｂｃａｍカタログ番号ａｂ４５１７３）を使用して、ＶＵＭＣ−１０およびＳＵ−ＤＩＰＧ−ＸＩＩＩ細胞系および異種移植片において、Ｈ３Ｋ２７ａｃをＡｕｔｏＣＵＴ＆ＲＵＮによってプロファイリングした。

細胞培養

ヒトＫ５６２細胞をＡＴＣＣ（Ｍａｎａｓｓａｓ、ＶＡ、カタログ番号ＣＣＬ−２４３）から購入し、供給業者のプロトコールに従って培養した。Ｈ１ｈＥＳＣを、ＷｉＣｅｌｌ（カタログ番号ＷＡ０１−ロット番号ＷＢ３５１８６）から入手し、Ｍａｔｒｉｇｅｌ（商標）（Ｃｏｒｎｉｎｇ）被覆プレートにおいてｍＴｅＳＲ（商標）１サプリメント（ＳＴＥＭＣＥＬＬＴｅｃｈｎｏｌｏｇｉｅｓカタログ番号８５８５２）を含有するｍＴｅＳＲ（商標）１基本培地（ＳＴＥＭＣＥＬＬＴｅｃｈｎｏｌｏｇｉｅｓカタログ番号８５８５１）で培養した。小児ＤＭＧ細胞系ＶＵＭＣ−ＤＩＰＧ−１０（ＥｓｔｈｅｒＨｕｌｌｅｍａｎ、ＶＵＵｎｉｖｅｒｓｉｔｙＭｅｄｉｃａｌＣｅｎｔｅｒ、Ａｍｓｔｅｒｄａｍ、Ｎｅｔｈｅｒｌａｎｄｓ）およびＳＵ−ＤＩＰＧ−ＸＩＩＩ（ＭｉｃｈｅｌｌｅＭｏｎｊｅ、ＳｔａｎｆｏｒｄＵｎｉｖｅｒｓｉｔｙ、ＣＡ）を、関連機関から研究試料提供契約で入手した。ＮＳ−Ａ増殖サプリメント（ＳＴＥＭＣＥＬＬＴｅｃｈｎｏｌｏｇｉｅｓ、カタログ番号０５７５１）、１００Ｕ／ｍＬのペニシリン／ストレプトマイシン、２０ｎｇ／ｍＬの上皮増殖因子（ＰｅｐｒｏＴｅｃｈ、カタログ番号ＡＦ−１００−１５）および２０ｎｇ／ｍＬの線維芽細胞増殖因子（ＰｅｐｒｏＴｅｃｈ、カタログ番号１００−１８Ｂ）を含有する、ＮｅｕｒｏＣｕｌｔＮＳ−Ａ基本培地中で、細胞を維持した。

患者由来異種移植片

全てのマウス研究は、ＩｎｓｔｉｔｕｔｅｏｆＡｎｉｍａｌＣａｒｅａｎｄＵｓｅＣｏｍｍｉｔｔｅｅによって承認されたプロトコールに従って行った。ＮＳＧマウスは、社内で飼育し、腫瘍発生前に２〜３月齢であった。頭蓋内異種移植片を、３ｕＬに懸濁させた１００，０００細胞の人字縫合の側方２ｍｍおよび後方１ｍｍへの定位注射によって樹立した。有症状マウスを安楽死させ、それらの腫瘍を分析のために切除した。

アノテーションおよびデータ分析

本発明者らは、Ｂｏｗｔｉｅ２バージョン２．２．５を、オプション：−−ｌｏｃａｌ−−ｖｅｒｙ−ｓｅｎｓｉｔｉｖｅ−ｌｏｃａｌ−−ｎｏ−ｕｎａｌ−−ｎｏ−ｍｉｘｅｄ−−ｎｏ−ｄｉｓｃｏｒｄａｎｔ−−ｐｈｒｅｄ３３−Ｉ１０−Ｘ７００で使用して、ペアードエンドリードのアラインメントを行う。スパイクイン断片のマッピングには、本発明者らは、実験ゲノムとスパイクインＤＮＡのものとの交差マッピングを回避するために、−−ｎｏ−ｏｖｅｒｌａｐ−−ｎｏ−ｄｏｖｅｔａｉｌオプションも使用する。ＢｅｄＴｏｏｌおよびＵＣＳＣｂｅｄＧｒａｐｈＴｏＢｉｇＷｉｇプログラムを使用して、ファイルを処理した。

様々な試料のゲノムワイドな分布間の相関関係を調査するために、ゲノムの５００ｂｐのビンを生成して、おおよそ６，０００，０００のエントリーを有するアレイを作成した。各々のビンにおけるリードをカウントし、これらのビンカウントのｌｏｇ２変換した値を使用して、異なる実験間のＰｅａｒｓｏｎ相関スコアを決定した。次いで、階層的クラスタリングをＰｅａｒｓｏｎスコア行列で行った。

プロモーター周辺のヒストンマークプロファイルの分布を調査するために、ビルドｈｇ１９についての遺伝子の基準リストをＵＣＳＣテーブルブラウザ（genome.ucsc.edu/cgi-bin/hgTables）からダウンロードし、さらなる分析のために遺伝子転写の方向性に従って方向性を持たせた。互いに１ｋｂ以内にＴＳＳを有する遺伝子を除去し、ミトコンドリアゲノムにマッピングする遺伝子も除去して、３２，０４２のＴＳＳのリストを作成した。ＲＮＡシーケンシングデータは、Ｈ１およびＫ５６２細胞のＥＮＣＯＤＥプロジェクト（ＥＮＣＳＲ５３７ＢＣＧおよびＥＮＣＳＲ０００ＡＥＬ）から得た。ｆｅａｔｕｒｅＣｏｕｎｔｓ（http://bioinf.wehi.edu.au/featureCounts/）を使用してＲＮＡリードをカウントし、マッピングされたリード１，０００，０００当たりの１キロベース当たり断片（Fragments Per Kilobase per Million mapped reads）（ＦＰＫＭ）に変換し、対応するＴＳＳに遺伝子発現値として割り当てた。Ｈ１細胞についてのＡＴＡＣシーケンシングデータをＧｅｎｅＯｍｎｉｂｕｓＥｘｐｒｅｓｓｉｏｎ（ＧＥＯ）（ＧＳＥ８５３３０）から入手し、Ｂｏｗｔｉｅ２を使用してｈｇ１９にマッピングした。ミトコンドリアＤＮＡは、リードの約５０％を占め、この研究ではそれを除去した。

ＣＲＥＡＭアルゴリズムの訓練

プロモーターにおけるヒストン修飾データのＲＮＡ−ｓｅｑ値へのフィッティングの精度を保証するために、１つより多くのプロモーターを有する遺伝子を、前に生成したＴＳＳリストから除去した。遺伝子ＲＰＰＨ１およびＲＭＲＰは、Ｈ１細胞において極めて高レベルで発現されため、外れ値とみなし、回帰を歪ませることを回避するために除去し、その結果、ｎ＝１２，８０５遺伝子のリストを得た。

Ｃによって示される、各々のヒストンマークについてのこれらのプロモーターに、関連ＣＵＴ＆ＲＵＮシグナルを割り当てるために、ＴＳＳの＋／−１ｋｂの塩基対リードカウントを、スコア化するプロモーターに関するシーケンシング深度と調査したプロモーターの総数の両方によって正規化した。前者の正規化は、シーケンシング深度と抗体間の感度の相違の両方の考慮であり、後者の正規化は、各々のエレメントの相対的な重みを変化させることなく異なる数のシス調節エレメントにモデルを適用することができるように含まれる。ＦＰＫＭ値をＲＮＡ−ｓｅｑに使用した。

ＲＮＡ−ｓｅｑ発現値にフィッティングしたヒストンデータの線形結合：ｙ＝Ｃ_１ｘ_１＋・・・＋Ｃ_ｎｘ_ｎ（式中、Ｃ_ｉは、各々のヒストン修飾についての重みであり、ｘ_ｉは、ｘ_ｉ＝ｌｎ（Ｃ_ｉ＋α_ｉ）によって示され、ここで、Ｃは、上記の正規化塩基対カウントであり、αは、発現のない遺伝子に対応するための擬似カウントである）を使用して、線形モデルをトレーニングした。ＲＮＡ−ｓｅｑ値を、同様に、ｙ_ｉ＝ｌｎ（ＦＰＫＭ_ｉ＋α_ｙ，ｉ）として同様に変換した。対数変換を使用してデータを線形化した。次いで、最小化ステップを行って、擬似カウントと、ＣＵＴ＆ＲＵＮデータとＲＮＡ−ｓｅｑ間の回帰線を最大化する各々のヒストン修飾についての重みとを算出した。

本発明者らは、ヒストンマークＨ３Ｋ２７ａｃ、Ｈ３Ｋ２７ｍｅ３およびＨ３Ｋ４ｍｅ２が最少冗長情報を与えると予想した。Ｋ５６２についての最適化した３つのヒストンマークモデルは、
＝０．８５８ｌｎ（Ｃ_{Ｈ３Ｋ２７ａｃ}＋０．０５８）−０．６１５ｌｎ（Ｃ_{Ｈ３Ｋ２７ｍｅ３}＋０．０８１６）＋１．６０９ｌｎ（Ｃ_{Ｈ３Ｋ４ｍｅ２}＋０．０５４）
によって記述される。この方程式を使用して、全てのＣＲＥＡＭスコアを生成した。

クロマチンドメインのコーリング

Ｈ１およびＫ５６２細胞の全体的クロマチンランドスケープを比較するために、ＩｇＧＣＵＴ＆ＲＵＮ対照と比較して領域が濃縮されたカスタムスクリプトを使用して、クロマチンドメインをコールした。マーク間の濃縮領域を比較し、ＢｅｄＴｏｏｌの交差を使用してオーバーラップを同定した。オーバーラップしている濃縮領域内の塩基対の数によって、オーバーラップしている領域を定量し、これらを使用してベン図を生成した。

ベン図

全てのベン図は、Whitehead Institute（barc.wi.mit.edu/tools/venn/）から公表されているＢａＲＣウェブツールを使用して、生成した。

ＣＲＥＡＭスコアを使用する細胞型特異的プロモーター活性の算出

生プロモーターＣＲＥＡＭスコアは、一般に、−１０〜１０の範囲に入り、ここで、数が小さいほど、小さい転写活性を示す。異なる細胞型を比較する際にデータ中の外れ値を考慮するために、標準偏差２以内のＣＲＥＡＭスコアをｚ正規化した。負およびゼロの値は、変化倍率の算出を複雑にするため、データを、最も負である値によってｘおよびｙ方向にシフトさせた。様々な細胞型についてのプロモーターＣＲＥＡＭスコア間の倍率差を、逆ｌｏｇ１０正規化ＣＲＥＡＭスコアを互いに割ることにより算出した。いずれの場合も保守的な２倍カットオフを使用して細胞型特異的プロモーターを決定した（図４５Ｂ、４５Ｅ、４７Ａ、４７Ｂ）。遺伝子の各々のリストを遺伝子オントロジー（geneontology.org/）により分類して、統計的に濃縮された生物学的プロセスを同定した。

細胞型間の相対的類似性をそれらのプロモーター活性に基づいて調査するために、＞１ｋｂ離れている全てのプロモーターについてのＣＲＥＡＭスコアを使用してアレイを生成し、試料のペアワイズ相関ごとにＳｐｅａｒｍａｎ相関を算出した。Ｓｐｅａｒｍａｎ相関値の階層的クラスタリングを使用して、細胞型間の相対的類似性を可視化した。

ＡｕｔｏＣＵＴ＆ＲＵＮおよびＡＴＡＣ−ｓｅｑデータに関するピークコーリング

ＡｕｔｏＣＵＴ＆ＲＵＮによってプロファイリングした生物学的反復実験は、高度に相関することが明らかになった（図４３Ｂ）ため、反復実験を結合した後、ピークをコールした。ツールＭＡＣＳ２を使用してピークをコールし、次のコマンドをコマンドライン上で使用した：「ｍａｃｓ２ｃａｌｌｐｅａｋ−ｔｆｉｌｅ−ｆＢＥＤＰＥ−ｎｎａｍｅ−ｑ０．０１−−ｋｅｅｐ−ｄｕｐａｌｌ−ｇ３．１３７ｅ９」。０．０１のＦＤＲカットオフを使用した。

ＣＲＥＡＭスコアからの細胞型特異的ＤＲＥ活性の算出

ヒトゲノムにおける遠位シス調節エレメントのリストをアセンブリするために、本発明者らは、「ＡｕｔｏＣＵＴ＆ＲＵＮおよびＡＴＡＣ−ｓｅｑに関するピークコーリング」方法セクションで説明した同じフラグを使用してＭＡＣＳ２を使用して、本発明者らの試料の各々からのＨ３Ｋ４ｍｅ２プロファイルに関してピークをコールした。ＴＳＳと推定的エンハンサーとを区別するために、アノテーション付きＴＳＳから＜２．５ｂｐ離れているピークを除去し、プロモーター活性を予測するためにトレーニングしたアルゴリズムを使用してこれらの推定的エンハンサー周辺＋／−１ｋｂのウインドウにＣＲＥＡＭスコアを割り当てた。試料間のエンハンサーＣＲＥＡＭスコアを比較する相関行列を、試料間のプロモーターＣＲＥＡＭスコアを比較する相関行列と同じ方法で生成した。

実施例７のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）

１Ｌｅｖｉｎｅ，Ｍ．，Ｃａｔｔｏｇｌｉｏ，Ｃ．＆Ｔｊｉａｎ，Ｒ．Ｌｏｏｐｉｎｇｂａｃｋｔｏｌｅａｐｆｏｒｗａｒｄ：ｔｒａｎｓｃｒｉｐｔｉｏｎｅｎｔｅｒｓａｎｅｗｅｒａ．Ｃｅｌｌ１５７，１３−２５，ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１４．０２．００９（２０１４）．

２Ｈｅｉｎｚ，Ｓ．，Ｒｏｍａｎｏｓｋｉ，Ｃ．Ｅ．，Ｂｅｎｎｅｒ，Ｃ．＆Ｇｌａｓｓ，Ｃ．Ｋ．Ｔｈｅｓｅｌｅｃｔｉｏｎａｎｄｆｕｎｃｔｉｏｎｏｆｃｅｌｌｔｙｐｅ−ｓｐｅｃｉｆｉｃｅｎｈａｎｃｅｒｓ．ＮａｔＲｅｖＭｏｌＣｅｌｌＢｉｏｌ１６，１４４−１５４，ｄｏｉ：１０．１０３８／ｎｒｍ３９４９（２０１５）．

３Ｒｅｉｎｂｅｒｇ，Ｄ．＆Ｖａｌｅｓ，Ｌ．Ｄ．Ｃｈｒｏｍａｔｉｎｄｏｍａｉｎｓｒｉｃｈｉｎｉｎｈｅｒｉｔａｎｃｅ．Ｓｃｉｅｎｃｅ３６１，３３−３４，ｄｏｉ：１０．１１２６／ｓｃｉｅｎｃｅ．ａａｔ７８７１（２０１８）．

４Ｈｅｎｉｋｏｆｆ，Ｓ．＆Ｇｒｅａｌｌｙ，Ｊ．Ｍ．Ｅｐｉｇｅｎｅｔｉｃｓ，ｃｅｌｌｕｌａｒｍｅｍｏｒｙａｎｄｇｅｎｅｒｅｇｕｌａｔｉｏｎ．ＣｕｒｒＢｉｏｌ２６，Ｒ６４４−６４８，ｄｏｉ：１０．１０１６／ｊ．ｃｕｂ．２０１６．０６．０１１（２０１６）．

５Ｓｃｈｗａｒｔｚｅｎｔｒｕｂｅｒ，Ｊ．ｅｔａｌ．ＤｒｉｖｅｒｍｕｔａｔｉｏｎｓｉｎｈｉｓｔｏｎｅＨ３．３ａｎｄｃｈｒｏｍａｔｉｎｒｅｍｏｄｅｌｌｉｎｇｇｅｎｅｓｉｎｐａｅｄｉａｔｒｉｃｇｌｉｏｂｌａｓｔｏｍａ．Ｎａｔｕｒｅ４８２，２２６−２３１，ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ１０８３３（２０１２）．

６Ｈｕ，Ｄ．＆Ｓｈｉｌａｔｉｆａｒｄ，Ａ．Ｅｐｉｇｅｎｅｔｉｃｓｏｆｈｅｍａｔｏｐｏｉｅｓｉｓａｎｄｈｅｍａｔｏｌｏｇｉｃａｌｍａｌｉｇｎａｎｃｉｅｓ．ＧｅｎｅｓＤｅｖ３０，２０２１−２０４１，ｄｏｉ：１０．１１０１／ｇａｄ．２８４１０９．１１６（２０１６）．

７Ｍａｃｋａｙ，Ａ．ｅｔａｌ．ＩｎｔｅｇｒａｔｅｄＭｏｌｅｃｕｌａｒＭｅｔａ−Ａｎａｌｙｓｉｓｏｆ１，０００ＰｅｄｉａｔｒｉｃＨｉｇｈ−ＧｒａｄｅａｎｄＤｉｆｆｕｓｅＩｎｔｒｉｎｓｉｃＰｏｎｔｉｎｅＧｌｉｏｍａ．ＣａｎｃｅｒＣｅｌｌ３２，５２０−５３７ｅ５２５，ｄｏｉ：１０．１０１６／ｊ．ｃｃｅｌｌ．２０１７．０８．０１７（２０１７）．

８Ｃｏｔｎｅｙ，Ｊ．ｅｔａｌ．Ｔｈｅａｕｔｉｓｍ−ａｓｓｏｃｉａｔｅｄｃｈｒｏｍａｔｉｎｍｏｄｉｆｉｅｒＣＨＤ８ｒｅｇｕｌａｔｅｓｏｔｈｅｒａｕｔｉｓｍｒｉｓｋｇｅｎｅｓｄｕｒｉｎｇｈｕｍａｎｎｅｕｒｏｄｅｖｅｌｏｐｍｅｎｔ．ＮａｔＣｏｍｍｕｎ６，６４０４，ｄｏｉ：１０．１０３８／ｎｃｏｍｍｓ７４０４（２０１５）．

９Ｌａｍｂｅｒｔ，Ｓ．Ａ．ｅｔａｌ．ＴｈｅＨｕｍａｎＴｒａｎｓｃｒｉｐｔｉｏｎＦａｃｔｏｒｓ．Ｃｅｌｌ１７２，６５０−６６５，ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１８．０１．０２９（２０１８）．

１０Ｒｅｇｅｖ，Ａ．ｅｔａｌ．ＴｈｅＨｕｍａｎＣｅｌｌＡｔｌａｓ．Ｅｌｉｆｅ６，ｄｏｉ：１０．７５５４／ｅＬｉｆｅ．２７０４１（２０１７）．

１１Ｒｏｚｅｎｂｌａｔｔ−Ｒｏｓｅｎ，Ｏ．，Ｓｔｕｂｂｉｎｇｔｏｎ，Ｍ．Ｊ．Ｔ．，Ｒｅｇｅｖ，Ａ．＆Ｔｅｉｃｈｍａｎｎ，Ｓ．Ａ．ＴｈｅＨｕｍａｎＣｅｌｌＡｔｌａｓ：ｆｒｏｍｖｉｓｉｏｎｔｏｒｅａｌｉｔｙ．Ｎａｔｕｒｅ５５０，４５１−４５３，ｄｏｉ：１０．１０３８／５５０４５１ａ（２０１７）．

１２Ｆｅｉｎｂｅｒｇ，Ａ．Ｐ．ＴｈｅＫｅｙＲｏｌｅｏｆＥｐｉｇｅｎｅｔｉｃｓｉｎＨｕｍａｎＤｉｓｅａｓｅＰｒｅｖｅｎｔｉｏｎａｎｄＭｉｔｉｇａｔｉｏｎ．ＮＥｎｇｌＪＭｅｄ３７８，１３２３−１３３４，ｄｏｉ：１０．１０５６／ＮＥＪＭｒａ１４０２５１３（２０１８）．

１３Ｔｅｙｔｅｌｍａｎ，Ｌ．，Ｔｈｕｒｔｌｅ，Ｄ．Ｍ．，Ｒｉｎｅ，Ｊ．＆ｖａｎＯｕｄｅｎａａｒｄｅｎ，Ａ．ＨｉｇｈｌｙｅｘｐｒｅｓｓｅｄｌｏｃｉａｒｅｖｕｌｎｅｒａｂｌｅｔｏｍｉｓｌｅａｄｉｎｇＣｈＩＰｌｏｃａｌｉｚａｔｉｏｎｏｆｍｕｌｔｉｐｌｅｕｎｒｅｌａｔｅｄｐｒｏｔｅｉｎｓ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１１０，１８６０２−１８６０７，ｄｏｉ：１０．１０７３／ｐｎａｓ．１３１６０６４１１０（２０１３）．

１４Ｓｋｅｎｅ，Ｐ．Ｊ．，Ｈｅｎｉｋｏｆｆ，Ｊ．Ｇ．＆Ｈｅｎｉｋｏｆｆ，Ｓ．Ｔａｒｇｅｔｅｄｉｎｓｉｔｕｇｅｎｏｍｅ−ｗｉｄｅｐｒｏｆｉｌｉｎｇｗｉｔｈｈｉｇｈｅｆｆｉｃｉｅｎｃｙｆｏｒｌｏｗｃｅｌｌｎｕｍｂｅｒｓ．ＮａｔＰｒｏｔｏｃ１３，１００６−１０１９，ｄｏｉ：１０．１０３８／ｎｐｒｏｔ．２０１８．０１５（２０１８）．

１５Ｓｋｅｎｅ，Ｐ．Ｊ．＆Ｈｅｎｉｋｏｆｆ，Ｓ．Ａｎｅｆｆｉｃｉｅｎｔｔａｒｇｅｔｅｄｎｕｃｌｅａｓｅｓｔｒａｔｅｇｙｆｏｒｈｉｇｈ−ｒｅｓｏｌｕｔｉｏｎｍａｐｐｉｎｇｏｆＤＮＡｂｉｎｄｉｎｇｓｉｔｅｓ．Ｅｌｉｆｅ６，ｄｏｉ：１０．７５５４／ｅＬｉｆｅ．２１８５６（２０１７）．

１６Ｈａｉｎｅｒ，Ｓ．Ｊ．，Ｂｏｓｋｏｖｉｃ，Ａ．，Ｒａｎｄｏ，Ｏ．Ｊ．＆Ｆａｚｚｉｏ，Ｔ．Ｇ．Ｐｒｏｆｉｌｉｎｇｏｆｐｌｕｒｉｐｏｔｅｎｃｙｆａｃｔｏｒｓｉｎｉｎｄｉｖｉｄｕａｌｓｔｅｍｃｅｌｌｓａｎｄｅａｒｌｙｅｍｂｒｙｏｓ．ｂｉｏＲｘｉｖ，ｄｏｉ：ｄｏｉ．ｏｒｇ／１０．１１０１／２８６３５１（２０１８）．

１７Ｚｈａｏ，Ｊ．ｅｔａｌ．ＮＰＡＴｌｉｎｋｓｃｙｃｌｉｎＥ−Ｃｄｋ２ｔｏｔｈｅｒｅｇｕｌａｔｉｏｎｏｆｒｅｐｌｉｃａｔｉｏｎ−ｄｅｐｅｎｄｅｎｔｈｉｓｔｏｎｅｇｅｎｅｔｒａｎｓｃｒｉｐｔｉｏｎ．ＧｅｎｅｓＤｅｖ１４，２２８３−２２９７（２０００）．

１８Ｎａｒｅｎｄｒａ，Ｖ．ｅｔａｌ．ＣＴＣＦｅｓｔａｂｌｉｓｈｅｓｄｉｓｃｒｅｔｅｆｕｎｃｔｉｏｎａｌｃｈｒｏｍａｔｉｎｄｏｍａｉｎｓａｔｔｈｅＨｏｘｃｌｕｓｔｅｒｓｄｕｒｉｎｇｄｉｆｆｅｒｅｎｔｉａｔｉｏｎ．Ｓｃｉｅｎｃｅ３４７，１０１７−１０２１，ｄｏｉ：１０．１１２６／ｓｃｉｅｎｃｅ．１２６２０８８（２０１５）．

１９Ｈａｗｋｉｎｓ，Ｒ．Ｄ．ｅｔａｌ．Ｄｉｓｔｉｎｃｔｅｐｉｇｅｎｏｍｉｃｌａｎｄｓｃａｐｅｓｏｆｐｌｕｒｉｐｏｔｅｎｔａｎｄｌｉｎｅａｇｅ−ｃｏｍｍｉｔｔｅｄｈｕｍａｎｃｅｌｌｓ．ＣｅｌｌＳｔｅｍＣｅｌｌ６，４７９−４９１，ｄｏｉ：１０．１０１６／ｊ．ｓｔｅｍ．２０１０．０３．０１８（２０１０）．

２０Ｇａｓｐａｒ−Ｍａｉａ，Ａ．，Ａｌａｊｅｍ，Ａ．，Ｍｅｓｈｏｒｅｒ，Ｅ．＆Ｒａｍａｌｈｏ−Ｓａｎｔｏｓ，Ｍ．Ｏｐｅｎｃｈｒｏｍａｔｉｎｉｎｐｌｕｒｉｐｏｔｅｎｃｙａｎｄｒｅｐｒｏｇｒａｍｍｉｎｇ．ＮａｔＲｅｖＭｏｌＣｅｌｌＢｉｏｌ１２，３６−４７，ｄｏｉ：１０．１０３８／ｎｒｍ３０３６（２０１１）．

２１Ｂｅｒｎｓｔｅｉｎ，Ｂ．Ｅ．ｅｔａｌ．Ａｂｉｖａｌｅｎｔｃｈｒｏｍａｔｉｎｓｔｒｕｃｔｕｒｅｍａｒｋｓｋｅｙｄｅｖｅｌｏｐｍｅｎｔａｌｇｅｎｅｓｉｎｅｍｂｒｙｏｎｉｃｓｔｅｍｃｅｌｌｓ．Ｃｅｌｌ１２５，３１５−３２６，ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２００６．０２．０４１（２００６）．

２２Ｒａｄａ−Ｉｇｌｅｓｉａｓ，Ａ．ｅｔａｌ．Ａｕｎｉｑｕｅｃｈｒｏｍａｔｉｎｓｉｇｎａｔｕｒｅｕｎｃｏｖｅｒｓｅａｒｌｙｄｅｖｅｌｏｐｍｅｎｔａｌｅｎｈａｎｃｅｒｓｉｎｈｕｍａｎｓ．Ｎａｔｕｒｅ４７０，２７９−２８３，ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０９６９２（２０１１）．

２３Ｃｏｎｓｏｒｔｉｕｍ，Ｅ．Ｐ．ＡｎｉｎｔｅｇｒａｔｅｄｅｎｃｙｃｌｏｐｅｄｉａｏｆＤＮＡｅｌｅｍｅｎｔｓｉｎｔｈｅｈｕｍａｎｇｅｎｏｍｅ．Ｎａｔｕｒｅ４８９，５７−７４，ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ１１２４７（２０１２）．

２４Ｋａｒｌｉｃ，Ｒ．，Ｃｈｕｎｇ，Ｈ．Ｒ．，Ｌａｓｓｅｒｒｅ，Ｊ．，Ｖｌａｈｏｖｉｃｅｋ，Ｋ．＆Ｖｉｎｇｒｏｎ，Ｍ．Ｈｉｓｔｏｎｅｍｏｄｉｆｉｃａｔｉｏｎｌｅｖｅｌｓａｒｅｐｒｅｄｉｃｔｉｖｅｆｏｒｇｅｎｅｅｘｐｒｅｓｓｉｏｎ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１０７，２９２６−２９３１，ｄｏｉ：１０．１０７３／ｐｎａｓ．０９０９３４４１０７（２０１０）．

２５Ｍａｒｔｅｌｌｏ，Ｇ．＆Ｓｍｉｔｈ，Ａ．Ｔｈｅｎａｔｕｒｅｏｆｅｍｂｒｙｏｎｉｃｓｔｅｍｃｅｌｌｓ．ＡｎｎｕＲｅｖＣｅｌｌＤｅｖＢｉｏｌ３０，６４７−６７５，ｄｏｉ：１０．１１４６／ａｎｎｕｒｅｖ−ｃｅｌｌｂｉｏ−１００９１３−０１３１１６（２０１４）．

２６Ｇｏｔｔｇｅｎｓ，Ｂ．Ｒｅｇｕｌａｔｏｒｙｎｅｔｗｏｒｋｃｏｎｔｒｏｌｏｆｂｌｏｏｄｓｔｅｍｃｅｌｌｓ．Ｂｌｏｏｄ１２５，２６１４−２６２０，ｄｏｉ：１０．１１８２／ｂｌｏｏｄ−２０１４−０８−５７０２２６（２０１５）．

２７Ｎａｇａｒａｊａ，Ｓ．ｅｔａｌ．ＴｒａｎｓｃｒｉｐｔｉｏｎａｌＤｅｐｅｎｄｅｎｃｉｅｓｉｎＤｉｆｆｕｓｅＩｎｔｒｉｎｓｉｃＰｏｎｔｉｎｅＧｌｉｏｍａ．ＣａｎｃｅｒＣｅｌｌ３１，６３５−６５２ｅ６３６，ｄｏｉ：１０．１０１６／ｊ．ｃｃｅｌｌ．２０１７．０３．０１１（２０１７）．

２８Ｍａｓｓａｇｕｅ，Ｊ．＆Ｃｈｅｎ，Ｙ．Ｇ．ＣｏｎｔｒｏｌｌｉｎｇＴＧＦ−ｂｅｔａｓｉｇｎａｌｉｎｇ．ＧｅｎｅｓＤｅｖ１４，６２７−６４４（２０００）．

２９Ｈｅｉｎｔｚｍａｎ，Ｎ．Ｄ．ｅｔａｌ．Ｄｉｓｔｉｎｃｔａｎｄｐｒｅｄｉｃｔｉｖｅｃｈｒｏｍａｔｉｎｓｉｇｎａｔｕｒｅｓｏｆｔｒａｎｓｃｒｉｐｔｉｏｎａｌｐｒｏｍｏｔｅｒｓａｎｄｅｎｈａｎｃｅｒｓｉｎｔｈｅｈｕｍａｎｇｅｎｏｍｅ．ＮａｔＧｅｎｅｔ３９，３１１−３１８，ｄｏｉ：１０．１０３８／ｎｇ１９６６（２００７）．

３０Ｃｒｅｙｇｈｔｏｎ，Ｍ．Ｐ．ｅｔａｌ．ＨｉｓｔｏｎｅＨ３Ｋ２７ａｃｓｅｐａｒａｔｅｓａｃｔｉｖｅｆｒｏｍｐｏｉｓｅｄｅｎｈａｎｃｅｒｓａｎｄｐｒｅｄｉｃｔｓｄｅｖｅｌｏｐｍｅｎｔａｌｓｔａｔｅ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１０７，２１９３１−２１９３６，ｄｏｉ：１０．１０７３／ｐｎａｓ．１０１６０７１１０７（２０１０）．

３１Ｈｅｉｎｔｚｍａｎ，Ｎ．Ｄ．ｅｔａｌ．Ｈｉｓｔｏｎｅｍｏｄｉｆｉｃａｔｉｏｎｓａｔｈｕｍａｎｅｎｈａｎｃｅｒｓｒｅｆｌｅｃｔｇｌｏｂａｌｃｅｌｌ−ｔｙｐｅ−ｓｐｅｃｉｆｉｃｇｅｎｅｅｘｐｒｅｓｓｉｏｎ．Ｎａｔｕｒｅ４５９，１０８−１１２，ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０７８２９（２００９）．

３２Ｌｉｕ，Ｑ．ｅｔａｌ．Ｇｅｎｏｍｅ−ＷｉｄｅＴｅｍｐｏｒａｌＰｒｏｆｉｌｉｎｇｏｆＴｒａｎｓｃｒｉｐｔｏｍｅａｎｄＯｐｅｎＣｈｒｏｍａｔｉｎｏｆＥａｒｌｙＣａｒｄｉｏｍｙｏｃｙｔｅＤｉｆｆｅｒｅｎｔｉａｔｉｏｎＤｅｒｉｖｅｄＦｒｏｍｈｉＰＳＣｓａｎｄｈＥＳＣｓ．ＣｉｒｃＲｅｓ１２１，３７６−３９１，ｄｏｉ：１０．１１６１／ＣＩＲＣＲＥＳＡＨＡ．１１６．３１０４５６（２０１７）．

３３Ａｎｄｅｒｓｓｏｎ，Ｒ．ｅｔａｌ．Ａｎａｔｌａｓｏｆａｃｔｉｖｅｅｎｈａｎｃｅｒｓａｃｒｏｓｓｈｕｍａｎｃｅｌｌｔｙｐｅｓａｎｄｔｉｓｓｕｅｓ．Ｎａｔｕｒｅ５０７，４５５−４６１，ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ１２７８７（２０１４）．

３４Ｃａｌｏ，Ｅ．＆Ｗｙｓｏｃｋａ，Ｊ．Ｍｏｄｉｆｉｃａｔｉｏｎｏｆｅｎｈａｎｃｅｒｃｈｒｏｍａｔｉｎ：ｗｈａｔ，ｈｏｗ，ａｎｄｗｈｙ？ＭｏｌＣｅｌｌ４９，８２５−８３７，ｄｏｉ：１０．１０１６／ｊ．ｍｏｌｃｅｌ．２０１３．０１．０３８（２０１３）．

３５Ｆｉｌｂｉｎ，Ｍ．Ｇ．ｅｔａｌ．ＤｅｖｅｌｏｐｍｅｎｔａｌａｎｄｏｎｃｏｇｅｎｉｃｐｒｏｇｒａｍｓｉｎＨ３Ｋ２７Ｍｇｌｉｏｍａｓｄｉｓｓｅｃｔｅｄｂｙｓｉｎｇｌｅ−ｃｅｌｌＲＮＡ−ｓｅｑ．Ｓｃｉｅｎｃｅ３６０，３３１−３３５，ｄｏｉ：１０．１１２６／ｓｃｉｅｎｃｅ．ａａｏ４７５０（２０１８）．

３６Ｌｉｕ，Ｎ．ｅｔａｌ．ＤｉｒｅｃｔＰｒｏｍｏｔｅｒＲｅｐｒｅｓｓｉｏｎｂｙＢＣＬ１１ＡＣｏｎｔｒｏｌｓｔｈｅＦｅｔａｌｔｏＡｄｕｌｔＨｅｍｏｇｌｏｂｉｎＳｗｉｔｃｈ．Ｃｅｌｌ１７３，４３０−４４２ｅ４１７，ｄｏｉ：１０．１０１６／ｊ．ｃｅｌｌ．２０１８．０３．０１６（２０１８）．

３７Ｎｅｉｍａｎ，Ｍ．ｅｔａｌ．Ｌｉｂｒａｒｙｐｒｅｐａｒａｔｉｏｎａｎｄｍｕｌｔｉｐｌｅｘｃａｐｔｕｒｅｆｏｒｍａｓｓｉｖｅｐａｒａｌｌｅｌｓｅｑｕｅｎｃｉｎｇａｐｐｌｉｃａｔｉｏｎｓｍａｄｅｅｆｆｉｃｉｅｎｔａｎｄｅａｓｙ．ＰＬｏＳＯｎｅ７，ｅ４８６１６，ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｏｎｅ．００４８６１６（２０１２）．

（実施例８）

単一細胞ＣＵＴ＆ＲＵＮでの複合組織のエピゲノムプロファイリング

単一細胞分析は、発生の分子的特徴付けのための主要なアプローチになりつつあり、単一細胞バーコード化技術の最近の進歩は、複合組織の遺伝子発現およびＤＮＡ接近可能性プロファイリングに応用されている。しかし、ＲＮＡ−ｓｅｑは、調節エレメントを特徴付けることもマッピングすることもできず、ＡＴＡＣ−ｓｅｑは、非常に接近しやすいＤＮＡの部位に限定され、ＣｈＩＰ−ｓｅｑは、単一細胞戦略を真剣に探求するには効率が悪すぎる。しかし、ＣＵＴ＆ＲＵＮ抗体繋留ヌクレアーゼ法は、効率および分解能の点でＣｈＩＰ−ｓｅｑを何桁も上回ってきている。これは、ＩＴＩＳにも当てはまる。本明細書で開示するように、元々のＣＵＴ＆ＲＵＮ法は、組織全体および選別された細胞に拡大適用でき、したがって、ほんの１００細胞で高いデータ品質を達成するため、本発明者らは、ハイスループット自動化パイプラインを開発した。

単一細胞技術の最近の進歩を活用するために、２つの明確に異なる単一細胞ＣＵＴ＆ＲＵＮ（ｓｃＣＵＴ＆ＲＵＮ）戦略を開発する。第１に、市販の自動化ナノウェルプレートシステムを、ｓｃＣＵＴ＆ＲＵＮ用の何千もの無傷細胞の整列、バーコード化および増幅に適応させる。この戦略を適用するために、繋留ＭＮａｓｅにより生成された断片を無傷細胞内のシーケンシングアダプターにライゲーションし、続いて単一細胞インデキシング用のナノウェルプレート上に整列させる。第２に、本発明者らは、バルク細胞集団のスプリットプール化を適用して、９６ウェルプレートプールで細胞のコンビナトリアルバーコード化を達成する。プレートからの細胞をプールし、それらを新たな９６ウェルプレートに再整列させた後、バーコードライゲーション、再プール化および再整列の１ラウンドまたはそれより多くのラウンドを行う。ＣＵＴ＆ＲＵＮを両方の人気のある単一細胞バーコード戦略に適応させることにより、本発明者らは、クロマチンプロファイリングの状況下で単一細胞プロファイリングについてのそれらの明確に異なる利点を比較することができる。評価のために、ヒトＫ５６２細胞およびショウジョウバエＳ２細胞を使用し、選択されたヒストン修飾に対する、ＲＮＡポリメラーゼＩＩ修飾に対する、および構成的転写因子に対する抗体も使用する。予備研究では、両方の戦略は、Ｉｌｌｕｍｉｎａアダプターのネイティブｉｎｓｉｔｕライゲーションにより、個々の核内にＤＮＡ断片を保持しつつ、ＣＵＴ＆ＲＵＮに従って機能することを示した。核の完全性を維持することにより、本発明者らは、個々の細胞からの断片へのインデキシングが可能になり、一連の特有のバーコードが、プールドシーケンシングから単一細胞ランドスケープを構築する。

均一細胞系から不均一細胞集団および複合組織に移行して、ｓｃＣＵＴ＆ＲＵＮをヒトＣＤ３４＋初代造血細胞およびショウジョウバエ精巣に適用する。本発明者らの基本ＣＵＴ＆ＲＵＮプロトコールの改良は、無傷ショウジョウバエ成虫原基および脳を十分に透過処理し、したがって、データ品質を低下させる可能性があり得る組織処理からの損傷を回避することが分かる。ＦＡＣＳ単離の後、高いデータ品質でＣＵＴ＆ＲＵＮを行うことができる。ＣＤ３４＋リンパ系細胞のＦＡＣＳ単離部分集団、ならびに無傷ショウジョウバエ生殖系列組織とフロー選別されたショウジョウバエ生殖系列組織の両方を、ＣＵＴ＆ＲＵＮおよびアダプターライゲーションに使用し、その後、ナノ分注もしくはスプリットプール化または両方をインデキシングのために行う。調節エレメントおよび遺伝子発現の発生上の変化をこれら２つのシステムで評定することができる。

切断の塩基対予測を活用するＣＵＴ＆ＲＵＮデータ用の計算ツールを開発する。１つは、ピーク頂点をコールするために断片長を使用し、切断の塩基対分解能を維持するため、平滑化のない、濃縮を判定するための経験的な手順を使用する、新規ピークコーリングアルゴリズムの最適化および評価であろう。第２のツールは、ＣＵＴ＆ＲＵＮプロファイリングにより同定可能なヌクレオソーム破壊の一般的なクロマチンシグネチャーについての本発明者らの最近の記述に基づく、エンハンサーおよびプロモーター活性を予測するために断片長情報を使用するアルゴリズムの開発であろう。これらの方法は、ＤＮＡ断片長に固有の構造情報の活用を可能にする。本発明者らは、細胞型を区別するためにＲＮＡ−ｓｅｑに広く使用されている単一細胞次元圧縮ツールを使用することとし、エンハンサー−プロモーター−遺伝子の組合せを同定するためにカスタム分析ソフトウェアを開発することとする。

ヒト遺伝子調節エレメントは、明らかにされないままである。ヒトゲノムによりコードされるタンパク質の約１０％は転写因子（ＴＦ）であり、これらは、それらの作業部位への配列特異的結合により遺伝子を調節する。調節エレメントへの転写因子の結合は、発生および重要な生理プロセスを制御する遺伝子調節階層の頂点に立つ。ＴＦ結合の異常調節は、多くのヒト疾患の肝要な駆動因子であり、ＴＦ結合部位（ＴＦＢＳ）を編集する現行の努力は、疾患介入に向けた有望な道筋である。しかし、ＴＦＢＳのマッピングの現行の制約は、これらのツールの臨床応用に支障を来し得る。例えば、鎌状赤血球貧血およびβ−サラセミアを有する患者を処置するための強力な戦略は、欠陥成人型ベータグロビン発現により引き起こされる症状を軽減するために胎児型ガンマグロビン遺伝子を「再び目覚めさせる」ことであろう。ガンマグロビン遺伝子とベータグロビン遺伝子の間の発生上のスイッチを担当する抑制性転写因子の結合部位を編集することによって、これを果たすことができよう。ごく最近まで、ＴＦをマッピングするための人気のある方法の制約のため、リプレッサーＴＦＢＣＬ１１Ａの結合部位を同定することができなかった。その肝要な結合部位が、ＢＣＬ１１ＡのＣＵＴ＆ＲＵＮマッピングによって容易に同定された［１］；これは、最も多く見られるヒト遺伝性疾患の１つについての症状を軽減するための編集戦略を直ちに可能にし、実際、この結合部位の突然変異を有する鎌状赤血球症患者は、赤血球の鎌状赤血球化の減弱を示す。

調節エレメントのＣｈＩＰ−ｓｅｑマッピングの制約。クロマチン免疫沈降（ＣｈＩＰ）は、クロマチン生物学において最も広く使用されている技法の１つとなっている。しかし、ＣｈＩＰを行う方法は、３０年よりもっと昔に初めて記載されて以来、ほとんど変わっていない［３］。それどころか、ＣｈＩＰを使用する莫大な成功は、リードアウト技術の驚異的な向上に起因した。リードアウトプラットフォームは、サザンブロット法から、定量的ＰＣＲへ、マイクロアレイへ、およびこの１０年をかけてハイスループットシーケンシング（ＣｈＩＰ−ｓｅｑ）へと進化してきた［４〜７］。単独のＥＮＣＯＤＥプロジェクトを構成する２０００を超えるＣｈＩＰ−ｓｅｑ実験を伴う、ＣｈＩＰ−ｓｅｑが、ゲノム配列を理解するための基本的戦略になってきた。

この巨額の投資にもかかわらず、ＣｈＩＰに使用されるクロマチン架橋およびせん断戦略には３つの大きな制約がある［８〜１２］。１）架橋は、エピトープマスキングにつながり、これは、免疫沈降効率を低下させ、シグナル対ノイズ比を低下させる。例えば、ＮＩＨＰｒｏｔｅｉｎＣａｐｔｕｒｅＲｅａｇｅｎｔｓＰｒｏｇｒａｍ（ＰＣＲＰ）は、１４０６の高度に検証された、免疫沈降および／または免疫ブロット法グレードの、マウスモノクローナル抗体（ｍＡｂ）〜７３６のヒト転写因子の収集物を生成した［１３］。このコンソーシアムは、一次検証ツールとしてＨｕＰｒｏｔヒトタンパク質マイクロアレイを使用して、それらのコグネイト標的に対して高い特異性を有するｍＡｂを同定した。

それにもかかわらず、３０５のｍＡｂの試料のうちの５０（１６％）しか、ＥＮＣＯＤＥ基準に基づいてＣｈＩＰ−ｓｅｑは良好であると判定されなかった。２）架橋はクロマチンを不溶性にするため、ＣｈＩＰは、通常は、クロマチンをせん断するために超音波処理を使用する。超音波処理は、２００〜３００ｂｐのクロマチン断片を生じさせるが、典型的なクロマチン関連タンパク質のフットプリントは約２０ｂｐであるため、実際の結合部位は、ＣｈＩＰマッピングからコンピュータによって推測しなければならない。したがって、ＣｈＩＰの最も広く使用されているプロトコールは、シーケンシングリードアウトで可能な塩基対分解能の活用には遠く及ばない。３）超音波処理による架橋クロマチンの可溶化は、劇的にバイアスを受ける。ＣｈＩＰを注意深く評定したとき、多くの「高ＣｈＩＰ可能」領域［８］、「ファントム」ピーク［１０］、および他の偽陽性アーチファクトが、一般に見出される［９、１２］。手短に述べると、ＣｈＩＰ−ｓｅｑは、低い信頼度、不良な収量、低い分解能、および低い精度によって阻まれる。ＣｈＩＰの最新バージョンは、エキソヌクレアーゼ処置で向上した分解能を有する（ＣｈＩＰ−ｅｘｏ［４］およびＣｈＩＰ−ｎｅｘｕｓ［７］）が、これらの方法は、面倒であり、非効率的である。ＣｈＩＰに伴うこれらの問題は、代替エピゲノムマッピング方法論の必要性を強調する。

ＣＵＴ＆ＲＵＮ。新たなエピゲノムプロファイリング戦略の開発によるＣｈＩＰ−ｓｅｑの制限［５、１４〜１６］。ＣＵＴ＆ＲＵＮとともに、因子特異的抗体を使用してミクロコッカスヌクレアーゼ（ＭＮａｓｅ）をクロマチンに繋留する。次いで、ＭＮａｓｅを活性化してＴＦＢＳ周辺でＤＮＡを切断し、その結果、ＤＮＡがペアードエンドＤＮＡシーケンシング用の上清に放出される（図１Ａ）。ＣＵＴ＆ＲＵＮは、可溶化および免疫沈降ステップを排除し、したがって、ＣｈＩＰに勝る固有の利点を有する。クロマチン因子への結合およびＤＮＡ切断のためのステップ全てを無傷核内で行い、その後、簡易なＤＮＡ精製を行うので、ＣＵＴ＆ＲＵＮの収量および特異性は、ＣｈＩＰ−ｓｅｑについてのものよりはるかに高い。ＣＵＴ＆ＲＵＮは、簡易であり、効率的であり、対費用効果が高く、ＣｈＩＰ−ｓｅｑに完全に置き換わる可能性がある。

ＣＵＴ＆ＲＵＮの範囲の拡張。本発明者らは、先ず、ＣＵＴ＆ＲＵＮを使用して、酵母およびヒトクロマチンタンパク質およびＴＦの結合部位を同定し、不溶性出芽酵母セントロメアのヒストン組成を決定し、架橋もライゲーションも用いずにＣＴＣＦ架橋部位を正確にマッピングした［１６］。その後、本発明者らは、他のトピックを調査するためにＣＵＴ＆ＲＵＮの範囲を拡張してきた。これらは、高等真核生物のセントロメア、クロマチン構造および転写調節を含む：１）ＣＵＴ＆ＲＵＮに続いて塩分画を用いて、本発明者らは、ヒトセントロメアが、高均一アレイ内の異なるα−サテライトダイマー単位上の内部動原体複合体の予想外の構造および立体配座多様性を示すことを発見した［１８］。２）本発明者らはまた、ＣＵＴ＆ＲＵＮを使用して、ＣＥＮＰ−Ｂの結合部位を欠いている、旧世界ザルのα−サテライトモノマー内の機能性セントロメア（「ＣＥＮＰ−Ｂパラドックス」［１９］）を同定した。３）転写により産生されるヌクレオソームの非対称巻き戻しを説明する中で、本発明者らは、調節エレメントにおいてＣＵＴ＆ＲＵＮにより生成される断片を使用して、細胞およびさらには無細胞ヒト血漿ＤＮＡにおいてヌクレオソーム巻き戻しの同じシグネチャーがヌクレオソームリモデリングにより生成され得ることを示した［２０］。断片位置および断片長に基づく調節エレメントの本発明者らの同定は、ＣＵＴ＆ＲＵＮの肝要な特徴である。

多くのＢＣＬ１１Ａ抗体は何年にもわたってＣｈＩＰ−ｓｅｑについては不成功に終わり、その結果、胎児型から成人型へのスイッチが、遺伝子座制御領域（ＬＣＲ）内のはるか上流に存在するモデルに至った。著者らは、リプレッサーが、ＣｈＩＰ−ｓｅｑがタンパク質結合マイクロアレイによって同定した同じＴＧＡＣＣＡモチーフに優先的に結合したことを、ＣｈＩＰ−ｓｅｑが示すことができなかった抗体（図５４、上部）およびそれが、胎児型ガンマグロビンプロモーター内で２１ｂｐしか離れていない２つのモチーフのうちの１つに結合したことを、ＣｈＩＰ−ｓｅｑが示すことができなかった抗体（図５４、中央）とともに、ＣＵＴ＆ＲＵＮを使用した。このモチーフは、遺伝性高胎児ヘモグロビンの良性状態を有する個体では突然変異しており、著者らは、この部位が、それを編集することおよびＢＣＬ１１Ａがもはや結合していなことを示すことによって、抑制を制御することを、さらに証明した（図５４、下部）。

単一細胞における調節エレメントを同定するために、単一細胞ナノウェルインデキシングおよびスプリットプールコンビナトリアルインデキシングという、２つの明確に異なるバーコード化戦略を使用することができ、これらの戦略は、両方とも、単一細胞ＲＮＡ−ｓｅｑ（ｓｃＲＮＡ−ｓｅｑ）のための使用に大いに成功している［２８、２９］。

ＣＵＴ＆ＲＵＮのＣｈＩＰ−ｓｅｑとの比較。本発明者らは、エピゲノムマッピング法の性能を、１）因子結合部位に対するそれらの分解能、および２）それらのシグナル対ノイズ比によって比較する。シグナル対ノイズ比は、精度および結合部位のリコールの決定、ならびに必要とされるディープシーケンシングのカバー率、およびしたがって、実験コストの決定において、特に重要である。ＣｈＩＰ法には２つの大きな制約がある：第１に、可溶性クロマチン調製物を生成するために、全ゲノムをクロマチン断片に破断する必要があり、これは、ゲノムワイドなバックグラウンドノイズの一因となる。第２に、定義により、全てのＣｈＩＰ法は、クロマチン粒子の溶解度およびそれらの回収率を最適化しなければならない、免疫沈降に依存する。対照的に、開示するＣＵＴ＆ＲＵＮ技術は、ＤＮＡ切断部位のみを無傷核における因子結合部位に標的化することに基づくので、ＣｈＩＰとは次元を異にするものである［１６］。この戦略は、可溶性クロマチン調製の必要性を除去し、単にシーケンシングカットＤＮＡだけによって結合部位における特異的シグナルを与える。

本発明者らは、迅速かつ効率的な溶液変化のためにコンカナバリンＡ（ＣｏｎＡ）被覆磁気ビーズを使用して細胞の取り扱いを最適化した。本発明者らは、エピトープが保存されておりエピトープに接近可能であるネイティブ未固定核に、抗体およびプロテインＡ−ＭＮａｓｅを結合させる。粒子の両側で切断されたクロマチン断片のみが上清に入るので、本発明者らは、不溶性バルククロマチンの残りを単に除去するだけである。非特異的ＤＮＡの圧倒的多数が残るため、ＣＵＴ＆ＲＵＮは、ＣｈＩＰと比較してコストを劇的に低下させる非常に低いバックグラウンドレベルを有し、この場合、細胞の可溶化内容物全体が抗体に曝露される。スパイクイン対照は、現在、好ましい正規化方法である［３０］ので、本発明者らは、ＣＵＴ＆ＲＵＮデータを正規化するための簡易な戦略を実行した：本発明者らは、少ない固定量の断片化された酵母ＤＮＡを、ビーズに結合された無傷抗体試料に、切断反応後に添加する。次いで、ＤＮＡを一緒に抽出し、ライブラリーを調製し、シーケンシングする。酵母ゲノムアセンブリへのリードのマッピングを使用して、実験間の試料リードカウントを正規化する。

本発明者らは、ＣＵＴ＆ＲＵＮが、簡易性、分解能、ロバストネス、効率、データ品質、および不溶性複合体への適用可能性に関してＣｈＩＰ−ｓｅｑより優れている［１６］。ＣＵＴ＆ＲＵＮは、反応をｉｎｓｉｔｕで行うことにより達成される本質的に低いバックグラウンドのため、ＣｈＩＰ−ｓｅｑのシーケンシング深度の約１／１０しか必要としない。

哺乳動物ゲノムにおけるＣＵＴ＆ＲＵＮの性能を試験するために、本発明者らは、ヒトＫ５６２細胞においてＣＴＣＦをマッピングした［２］。切断フットプリントは、約３００倍消化範囲にわたって一致しており、主要な単一の塩基対カット部位が片側にあり、これは、ＣＵＴ＆ＲＵＮが、結合している因子の最小フットプリントを明示する制限消化を達成することを強調する（図６Ｃ）。図６Ａ、下方パネルは、ＥＮＣＯＤＥＣｈＩＰ−ｓｅｑ、ＣｈＩＰ−ｅｘｏおよびＣＵＴ＆ＲＵＮデータセットからサンプリングした１０，０００，０００断片についての結果を比較する。プロファイリングは、ＣＵＴ＆ＲＵＮが、尖ったピークを規定することを示し、これらのピークは、ＥＮＣＯＤＥＣｈＩＰ−ｓｅｑで検出されるピークと合致する。ＣｈＩＰ−ｅｘｏは、これらのピークの一部を検出するが、多くの部位は、通常はコンピュータによって洗練されるリード末端の幅広分布を有する。ＣＵＴ＆ＲＵＮは、限られたＤＮＡ切断からの固有の低いバックグラウンドに主として起因して、他の方法論より低いシーケンシング深度を必要とした。これは、より良好なデータ品質で、実験コストを大幅に低下させる。ＣＴＣＦ部位に隣接するヌクレオソームも特異的に放出され、ＤＮＡ断片の特徴的サイズとして現れる。

少ない細胞数でのＣＵＴ＆ＲＵＮの性能。標準的なＣｈＩＰ−ｓｅｑプロトコールは、ＦＡＣＳもしくは解離後にまたは臨床の場で得られることが多い少ない細胞数には適さない。ＡＴＡＣ−ｓｅｑは、５０００ほどの少数の細胞を有する試料のプロファイリングに使用されてきたが、ＡＴＡＣ−ｓｅｑは、クロマチンの接近可能領域内にあるＴＦの非特異的同定に限定される。本発明者らは、最近、ＣＵＴ＆ＲＵＮが少ない細胞数で高いデータ品質を提供することを示した（［２］、図５５）。Ｈ３Ｋ２７ｍｅ３について６，０００から下は１００細胞への細胞数の低下に伴って起こる品質データ低下は、あったとしてもごくわずかである。対照的に、同じ深度でサンプリングしたＥＮＣＯＤＥプロファイルは、ＣｈＩＰに固有の高いバックグラウンドのせいで不鮮明である。はるかに少ない細胞数が、試薬体積およびライブラリー調製ステップに少し改良を加えることによりHainerらによって達成された［２３］。それ故、ＣＵＴ＆ＲＵＮは、少ない細胞数の適用に対するタンパク質−ＤＮＡ相互作用の標的化されたゲノムワイドなマッピングを可能にする。

バルク細胞および組織の低コストプロファイリングのための自動化ＣＵＴ＆ＲＵＮ。本発明者らは、上清中のタンパク質−ＤＮＡ粒子を末端ポリッシングおよびライゲーションに使用して、細胞からライブラリーまでの全てのステップをロボットで行うことを可能にする、本発明者らが「直接ライゲーション」と呼ぶ、ＣＵＴ＆ＲＵＮプロトコールを改良した。自動化ＣＵＴ＆ＲＵＮのために、本発明者らは、細胞をＣｏｎＡ被覆磁気ビーズと混合し、透過処理用界面活性剤（ジギトニン）および抗体を、活性プロセスを停止させるための２ｍＭＥＤＴＡとともに添加した。４℃で一晩のインキュベーション後、本発明者らは、ビーズ／細胞スラリーを９６ウェルプレートのウェルに移す。ＣＵＴ＆ＲＵＮを、アダプターのライゲーションおよびＡｍｐｕｒｅビーズクリーンアップによってロボットで行い、その後、プレートを増幅のためにＰＣＲサイクラーに移し、次いで、最終バーコードライブラリーのクリーンアップのためにロボットに戻す。ＮＩＨ４Ｄヌクレオソームプロジェクト用に調製したデータセットの例は、最終的な内皮へのヒト胚性幹細胞（Ｈ１）の分化が、肝要なＤＮＡ複製遺伝子であるＰＯＬＤ１に関するプロモーターヌクレオソームのＨ３Ｋ４ｍｅ３修飾からＨ３Ｋ２７ｍｅ３へのスイッチを伴うことを示す（図５６）。

ｉｎｓｉｔｕライゲーションを伴うＣＵＴ＆ＲＵＮ。ｓｃｉＲＮＡ−ｓｅｑ（単一細胞コンビナトリアルインデキシングＲＮＡシーケンシング）［３１］およびＳｐｌｉｔ−ｓｅｑ（スプリットプールライゲーションに基づくトランスクリプトームシーケンシング）［２８］は、ＲＮＡをバルク細胞または核においてｉｎｓｉｔｕでｃＤＮＡに変換し、その後、バーコード化アダプターをｃＤＮＡ末端にライゲーションする戦略である。細胞を固定して、ｃＤＮＡ合成およびライゲーション中のＲＮＡの漏出を防止する。しかし、本発明者らは、固定せずにＤＮＡ漏出を防止する簡易なネイティブ手順を開発した。ヌクレオソームコア粒子が低塩／高二価カチオン条件で凝集するという観察［３２］に基づいて、本発明者らは、１０ｍＭＣａＣｌ２および３．５ｍＭＨＥＰＥＳｐＨ７．５で消化を行う。これらの条件下でのほうが、断片は、３倍速い速度で切断し、上清への断片の検出可能な放出がない（データを示さない）。上清を磁石で除去し、１５０ｍＭＮａＣｌと２０ｍＭＥＧＴＡとを含む溶出緩衝液を添加することにより、反応を停止させ、これは、小さいＤＮＡ断片を上清に放出し、自動化ＣＵＴ＆ＲＵＮに使用される直接末端ポリッシングおよびアダプターライゲーションと適合する。この改良プロトコールを使用する消化から生じるライブラリーは、タイムコースデータについてのＨ３Ｋ２７ａｃピークの一貫性を向上させた（図５７）。これは、おそらく、消化中の粒子の放出を防止することによって、それらの粒子が接近可能なＤＮＡを人為現象的に消化し得る、核内でのそれらの粒子の分散が未然に防がれたことに起因する。したがって、ＣＵＴ＆ＲＵＮの本発明者らの簡易な改良は、データ品質を向上させもし、固定せずにナノウェル分注およびスプリットプールバーコード化の準備を整えもする。

この改良ＣＵＴ＆ＲＵＮプロトコールをｉｎｓｉｔｕライゲーションに適応させるために、本発明者らは、２０ｍＭＥＧＴＡと、１０ｍＭＭｇＣｌ２と、３．５ｍＭＨＥＰＥＳとを含有する緩衝液のビーズ／細胞への添加により、反応を停止させた。これらの条件下では、低塩および高Ｍｇ^＋＋条件が凝集クロマチン状態を維持し、その一方でＥＧＴＡがマグネシウムよりカルシウムと優先的にキレート化して切断を停止させる。末端ポリッシングおよびライゲーション試薬をバーコード化Ｉｌｌｕｍｉｎａアダプターとともに添加した後、全ＤＮＡを抽出し、Ｉｌｌｕｍｉｎａプライマーを使用してＰＣＲ増幅を行い、シーケンシングする。断片の大部分は、アダプターダイマーであるが、本発明者らは、それにもかかわらず、Ｈ３Ｋ２７ａｃＣＵＴ＆ＲＵＮ実験のためのゲノムワイドパターンを確認するために十分なマッピングされたリードがあることを見出した（図５８Ａ）。この実験ではたった約３００，０００の断片で、プロファイルは、ランク順Ｈ３Ｋ２７ａｃＣＵＴ＆ＲＵＮピークへの密接な対応により確認して、同じＡｂｃａｍａｂ４７２９抗体を使用するＣＵＴ＆ＲＵＮの３０倍多い断片（約９，０００，０００）でのプロファイルおよびＥＮＣＯＤＥＣｈＩＰ−ｓｅｑの１３０倍多い断片（約４０，０００，０００）でのプロファイルと同様である（図５８Ｂ）。これらの結果は、ｉｎｓｉｔｕアダプターライゲーションが機能し、その結果、ｓｃＣＵＴ＆ＲＵＮインデキシング戦略への適用の準備が整っていることを実証する。

ｉｎｓｉｔｕライゲーションの最適化。この最初のｉｎｓｉｔｕライゲーション実験からの本発明者らの予備的概念実証の結果は有望であるが、平滑末端ライゲーションの効率は非常に低かったためライブラリー調製は、アダプターダイマーにより支配される。１つの可能な解決策は、追加のＡｍｐｕｒｅビーズ選択ステップを含めることであるが、これは、全般的収量を低下させることになる。もう１つの解決策は、Ａ−テーリングステップの追加、および突出３’Ｔ塩基を有するアダプターの使用である。本発明者らは、ループ内にデオキシウラシルを有するヘアピンアダプターを合成することによりアダプターダイマーの形成を防止することもできる。ライゲーション処置後のウラシル−Ｎ−デグリコシラーゼでの消化は、ナノウェルでのバーコード化増幅に適切な突出末端またはスプリットプール化の第１ラウンドに適切な突出末端を形成する。別の解決策は、ライゲーション中に制限酵素を含めることであり、これは、平滑末端アダプターを、それらがライゲーションするたびに再生することになる。

ナノウェルバーコード化。元々は埋め込まれたオリゴでのＲＮＡ−ｓｅｑのために設計されたＴａｋａｒａＳＭＡＲＴｅｒＩＣＥＬＬ８Ｓｉｎｇｌｅ−ＣｅｌｌＳｙｓｔｅｍが、つい最近、ＡＴＡＣ−ｓｅｑに適応された［３３］ため、本発明者らは、クロマチンプロファイリングの類似のインデキシング戦略に従うこととする。磁気ビーズの使用を省いて、アダプターライゲーションステップにより、大量にＣＵＴ＆ＲＵＮを行うこととする。本発明者らは、洗浄と洗浄の間に穏やかな遠心分離でのジギトニン透過性処理細胞を使用する本発明者らのオリジナルプロトコール［２６］に従うこととし、密でない細胞ペレットを、穏やかなピペット処理および／またはボルテックスによって単一細胞に分散させる。単一細胞をＩＣＥＬＬ８チップの個々のナノウェルに分注し、イメージングすることとし、各々のナノウェルを、７２の異なるバーコード化Ｉｌｌｕｍｉｎａｉ５プライマーの横列への分注および７２の異なるｉ７プライマーの縦列への分注によりインデキシングすることとし、プレート上の５１８４のナノウェル全てをバーコードにより区別する。ＩＣＥＬＬ８システムイメージングステーションが、単一細胞を有するウェルを自動的に同定し、シーケンシング後分析のために細胞の形態を分類することとする。通常は、ＩＣＥＬＬ８チップ上の５１８４のナノウェルの約１／３が単一細胞を受け取り、したがって、プレートをイメージングすることによって、１細胞につき約１ドルの材料の総コストのために本発明者らは播種されたナノウェルのみを使用することが可能になる。ナノウェルプレートを封止し、プレートを、標準的ＣＵＴ＆ＲＵＮについて行われるように１４サイクルのＰＣＲに供することとする。次いで、バーコード化され増幅された断片を手動ＤＮＡ抽出用にプールすることとする。

Ａｍｐｕｒｅビーズクリーンアップ、および単一細胞バーコードによって読み込むために十分なペアードエンドＤＮＡシーケンシング。本発明者らは、プールされた試料の１５０，０００，０００のペアードエンド断片、または１細胞当たり約１００，０００くらいのリードを予想する。本発明者らが本発明者らの少細胞数実験において十分なヒストン修飾を得た収量（例えば、図５５）に基づいて。

スプリットプールライゲーション。アレイに基づくコンビナトリアルバーコード化は、何千もの細胞のディーププロファイリングに特によく適している。しかし、スプリットプール化は、特殊な装置を必要とせず、簡易な手動方法を使用して行うことができ、したがって、この迅速改良クラスの単一細胞戦略は、様々な直接単一細胞戦略と依然として強度に競合する。本発明者らは、記載されている［２８］のと同様のスプリットプール化戦略に従うこととする。手短に述べると、本発明者らは、低塩高二価カチオン条件下で大量にＣＵＴ＆ＲＵＮを行うこととする。本発明者らは、５’末端が平滑であり、３’末端に粘着オーバーハングを有する、ユニバーサルリンカーを使用して、ｉｎｓｉｔｕライゲーションを行うこととする。リンカーの５’末端を、ＣＵＴ＆ＲＵＮにより生成されるポリッシングされたＤＮＡ断片末端とライゲーションすることとし、その一方で、３’粘着末端は、９６の一意的タグの５’末端と相補的であり、このタグを奇数タグと呼ぶこととする。これらの奇数タグの他方の末端は、９６の一意的タグの異なるセットの５’末端と相補的であり、これらのタグを偶数タグと呼ぶこととする。細胞をプールし、９６ウェルプレート全体にわたって繰り返し分割することとする。各々のラウンドにおいて、９６ウェルの各々に分配した一意的タグをＤＮＡ末端にライゲーションすることとする。粘着末端ライゲーションは、第１のステップで行う平滑末端ライゲーションより効率が高いため、大部分のまたは全ての捕捉ＣＵＴ＆ＲＵＮ末端は、有効にバーコード化されるはずである。各々の細胞が、一連の一意的なタグ（バーコード）を有することを確認するために、本発明者らは、偶数および奇数タグの同じセットを再使用して複数のスプリットプール化サイクルを実行することとする。最終的に、全ての細胞をプールし、Ｉｌｌｕｍｉｎａアダプターを含有する末端タグをライゲーションすることとする。プールされた細胞の全ＤＮＡ抽出の後、ライブラリー調製およびＡｍｐｕｒｅビーズクリーンアップを行うこととする。各々の細胞はこの時点でその独自のバーコードを既に有するので、異なるインデックスプライマーを使用する必要はない。付加させたバーコードの長さに依存して少なくとも１００×１００ｂｐでリードペアを生成することとする。

ｓｃＣＵＴ＆ＲＵＮの細胞系への適用。ｓｃＣＵＴ＆ＲＵＮの複合組織への適用の準備段階として、本発明者らは、両方の単一細胞戦略をＥＮＣＯＤＥＴｉｅｒ１のヒトＫ５６２細胞およびｍｏｄＥＮＣＯＤＥショウジョウバエＳ２細胞に適用することとする。本発明者らは、選択したヒストン修飾（Ｈ３Ｋ４ｍｅ１、Ｈ３Ｋ２７ａｃ、Ｈ３Ｋ２７ｍｅ３およびＨ３Ｋ３６ｍｅ３）に対する抗体、およびＲＮＡポリメラーゼＩＩ（ＣＴＤ−Ｓｅｒ５ＰおよびＣＴＤ−Ｓｅｒ２Ｐ）に対する抗体をヒト細胞とショウジョウバエ細胞の両方に使用し、ヒトについてのＣＴＣＦおよびショウジョウバエについてのＧＡＧＡ因子などの、存在量の多い構成的ＴＦも使用することとする。Ｋ５６２およびＳ２は、均一な細胞系であり、遺伝子発現、クロマチンランドスケープ、および活性エンハンサーの機能的マッピングについて詳しく特徴付けられている。各々の抗体を本発明者らのバルクＣＵＴ＆ＲＵＮ実験で検証した。本発明者らは、ｉｎｓｉｔｕライゲーションの効率が個々の細胞の特徴のカバー率を決定すると予測し、本発明者らは、単一細胞プロファイルをバルクプロファイルと比較して、本発明者らの細胞ごとのカバー率、細胞ごとに必要とされる最適なシーケンシング深度、および整列プロファイリング戦略のスプリットプール化戦略に対する有効性を判定することとする。本発明者らは、単一細胞プラットフォームでのエピトープの組合せのプロファイリングを活用して、プロモーター−エンハンサー−遺伝子の組合せを同定することとする。これは、単一因子抗体を用いておよびペアでＣＵＴ＆ＲＵＮを行うこと、ならびに個々の細胞における２つのエピトープの同時性により相互作用調節エレメントを定義することを含む。

核の完全性およびクロマチン一体性は、本発明者らの予備研究で使用した低塩／高二価カチオン濃度で維持されるが、後続の操作が損傷を与えることになる可能性があり、しかし新たな末端は、インデキシングアダプターと競合しない。本発明者らの予備研究におけるｉｎｓｉｔｕライゲーションの低い効率は、平滑末端ライゲーション中のプライマーダイマーの優位性に起因するため、本発明者らは、提案するような修飾アダプターの使用が、効率を大いに向上させると予想する。効率が高い場合には、本発明者らは、ナノウェル戦略を選ぶ。なぜなら、たった約１０００細胞ででも、個々の細胞における何万もの調節エレメントを同定するのに十分なカバー率、および細胞型を効率的にクラスタリングするのに十分なカバー率となるからである。カバー率が高いほど、必要となる細胞は少ないため、本発明者らは、その結果、８つほども多い異なる抗体または組織試料を単一チップでアッセイすることができると予測する。しかし、ライゲーション効率が低い場合には、細胞型のクラスタリングは、より多くの個々の細胞を必要とすることになり、スプリットプールバーコード化のほうが、スプリットプールラウンドごとに一意的バーコードの数が９６倍になるので、魅力的になる。ショウジョウバエゲノムの２０分の１のより小さいサイズについては、各々の細胞における比例的に少ないＤＮＡ断片によって、本発明者らは、同じ量のシーケンシングでより多くの細胞をプロファイリングすることが可能となり、したがって、ショウジョウバエにはスプリットプールバーコード化のほうが有利である。

無傷ハエ成虫原基でのＣＵＴ＆ＲＵＮ。ＣＵＴ＆ＲＵＮの効率は、組織および単離された細胞型におけるクロマチンプロファイリングを可能にする。小さな改良を加えて、本発明者らは、本発明者らの細胞系プロトコールを、ショウジョウバエ幼虫からの無傷組織を処理するように、またはＦＡＣＳ選別細胞を処理するように適応させた。本発明者らは、幼虫の脳および羽成虫原基を３齢幼虫から切除し（図５９Ａ）、未固定組織をジギトニンで透過処理し、次いで、無傷組織をＣｏｎＡビーズで軽度に覆った。これらのステップは、緩衝剤を単に交換するだけで組織に試薬を吸収させることができ、全ての組織取扱いは、緩衝剤交換に磁石を使用して管の中で行う。本発明者らは、ブロッキング、抗体、およびｐＡ−ＭＮａｓｅ繋留ステップにおいてクロマチンが分解しないように保護するために２ｍＭＥＤＴＡおよび５ｍＭスペルミジンを含め、組織およびＤＮＡが２日の手順を通して無傷のままであることを見出した。本発明者らは、１０匹の幼虫からの羽成虫原基が約６００，０００の羽円板細胞（脳からはより多く）をもたらし、これにより、ヒストン修飾およびクロマチン因子を高いデータ品質でプロファイリングするために十分な材料が得られると推定する。本発明者らは、先ず、幼虫の脳および羽円板におけるＨ３Ｋ２７ｍｅ３をプロファイリングして、Ｐｏｌｙｃｏｍｂ抑制領域と比較した。代表領域を示す（図５９Ｃ）。ＡＮＴＰ複合体は、ショウジョウバエのセグメントアイデンティティーホメオボックス遺伝子の多くを含有し、これらの遺伝子は、一部はＰｏｌｙｃｏｍｂ抑制によって調節される。アンテナペディア（Ａｎｔｐ）遺伝子は、幼虫の脳の大部分の細胞においてサイレンシングされ、羽成虫原基の全ての細胞において発現される。Ｈ３Ｋ２７ｍｅ３パターンの対応する変化は、Ａｎｔｐ遺伝子全体にわたって明らかであり、脳試料ではＨ３Ｋ２７トリメチル化されているが、羽組織では大部分がメチル化されていない。ＡＮＴＰ複合体の外側の低いバックグラウンド、およびＨ３Ｋ２７トリメチル化領域内の高いシグナルは、組織間のクロマチン状態が異なる領域の同定を容易にする。同様に、本発明者らは、組織試料における複数ヒストン修飾およびクロマチン因子（Ｈ３Ｋ２７Ａｃ、Ｈ３Ｋ２７ｍｅ２およびＰｏｌｙｃｏｍｂを含む）を、細胞培養試料と同様のデータ品質でプロファイリングした。これは、本発明者らが、少量の無傷材料からクロマチン状態を十分に特徴付けることができることを実証する。これは、組織が限られている突然変異動物のプロファイリングに特に有用である。

無傷組織は、様々な細胞型を含有する。本発明者らは、ＦＡＣＳ単離をＣＵＴ＆ＲＵＮと組み合わせて、羽成虫原基からの細胞のサブセットをプロファイリングした。本発明者らは、痕跡遺伝子の特徴付けられているエンハンサーを使用して羽成虫原基の増殖ポーチにおいてＧＦＰを産生し（図５９Ｂ）、次いで、細胞表面の糖タンパク質を分解しないことを本発明者らが見出したＡｃｃｕｔａｓｅ（ＩｎｎｏｖａｔｉｖｅＣｅｌｌＴｅｃｈｎｏｌｏｇｉｅｓ，Ｉｎｃ）を使用した。これにより、本発明者らは、細胞をＦＡＣＳ選別後にＣｏｎＡビーズに結合させ、本発明者らの標準的バルクＣＵＴ＆ＲＵＮプロトコールにより細胞を処理することができる。本発明者らは、２０分のＦＡＣＳ後にインプット材料の９％に相当する約１０，０００のＧＦＰ陽性細胞を回収し、これは、Ｈ３Ｋ２７ｍｅ３プロファイリングに十分なものであり、ゲノム全体にわたって無傷羽成虫原基と同様の結果を伴う。痕跡遺伝子自体は、細胞培養においておよび幼虫脳試料においてＨ３Ｋ２７ｍｅ３ドメインに含まれる（図５９Ｄ）。Ｈ３Ｋ２７ｍｅ３は、羽成虫原基試料では低減されるように見えるが、この組織は、痕跡発現を伴う細胞と伴わない細胞の混合である。対照的に、ＦＡＣＳ単離痕跡発現細胞は、痕跡遺伝子全体にわたって少ないＨ３Ｋ２７ｍｅ３メチル化を示す。これらの結果は、本発明者らの標準プロトコールに少し改良を加えて、本発明者らが、無傷組織からの細胞またはＦＡＣＳ単離未固定細胞からの細胞を正確にプロファイリングすることができることを確証する。組織を磁気的に操作するので、全組織ＣＵＴ＆ＲＵＮをロボットにより、アダプターライゲーションおよびクリーンアップ、その直ぐ後の解離および数ラウンドのスプリットプールバーコードライゲーションによって、容易に行うことができる。

スプリットプール化を用いる初代細胞および無傷組織でのｓｃＣＵＴ＆ＲＵＮ。ｓｃＣＵＴ＆ＲＵＮプロトコールを開発するために、本発明者らは、単一細胞レベルで詳しく特徴付けられている２つのモデルシステムにＣＵＴ＆ＲＵＮを適用することとする。先ず、本発明者らは、ヒト造血細胞におけるヒストン修飾およびクロマチン因子をプロファイリングし、単一細胞クロマチンプロファイリングをこれらの細胞の転写多様性と比較することとする。第２に、本発明者らは、生殖系列幹細胞から減数分裂後精子までの全発生過程が存在するショウジョウバエ精巣におけるクロマチンをプロファイリングすることとする。ヒトと比較して２０分の１のショウジョウバエのゲノムサイズは、この技術開発プロジェクトについてのシーケンシングコストも低下させる。これら２つの系を使用して、細胞状態についてのクロマチンプロファイリングの精度を評定することとし、単一細胞クロマチンプロファイリングについてのコンピュータによるクラスタリングの枠組みを開発することとする。

ヒト造血細胞でのｓｃＣＵＴ＆ＲＵＮ。骨髄からの多能性ＣＤ３４＋細胞は、表面マーカーにより区別される、１０の血液細胞カテゴリーへと分化する。これらの細胞型の転写多様性は、大量に、ＦＡＣＳ単離されたもので、および単一細胞アンサンブルで、詳しく特徴付けられている。本発明者らは、このシステムを使用して、ヒストン修飾のｓｃＣＵＴ＆ＲＵＮプロファイリングがＣＤ３４＋細胞集団における多様性をどの程度正確に再現するかを評定することとする。本発明者らは、ＦＡＣＳ単離ヒトＣＤ３４＋初代造血細胞を健常個体の骨髄から得る。本発明者らは、ナノウェルへの分注のためにおよび逐次的スプリットプール化ステップのためにＣＵＴ＆ＲＵＮおよびアダプターライゲーションステップを大量に行って、個々の細胞をインデキシングすることとする。

本発明者らは、ＣＤ３４＋細胞における２つのＲＮＡＰＩＩ修飾（ＣＴＤ−Ｓ５ＰおよびＣＴＤ−Ｓ２Ｐ）、３つのヒストン修飾（Ｈ３Ｋ２７Ａｃ、Ｈ３Ｋ２７ｍｅ３およびＨ３Ｋ４ｍｅ１）および２つのクロマチン因子（ＣＴＣＦおよび造血性ＴＦＰＵ．１）をプロファイリングする。ＲＮＡＰＩＩのプロファイルによって、見込みのある活性遺伝子プロモーターが同定されることとなり、Ｈ３Ｋ２７ＡｃおよびＨ３Ｋ４ｍｅ１は、活性プロモーターおよびエンハンサーを、ならびにＨ３Ｋ２７ｍｅ３は、Ｐｏｌｙｃｏｍｂ抑制クロマチンを報告することになる。これらのプロファイルを使用して、１０００〜２０００細胞の転写ステータスを同定することになる。全てのデータを併せて、１００，０００，０００のペアードエンドリードが、ＣＤ３４＋細胞におけるバルククロマチンランドスケープを再現するはずであるため、本発明者らは、これらのプロファイルの深度を標準ＣＵＴ＆ＲＵＮプロファイリングと比較して効率を評定することとする。次いで、本発明者らは、個々のバーコード化細胞における遺伝子プロモーターにおける断片カバー率を調査することとする。効率的回収で、１０，０００〜１００，０００の独立した断片は、１細胞実験における特徴をカバーするはずである。本発明者らは、さらに多くの細胞を処理して、各々のＣＤ３４＋サブタイプからの断片を徹底的に捕捉することができる。多くの遺伝子にわたってわずかなカバー率であっても、細胞型のクラスタリングおよび区別には十分である。本発明者らは、ｓｃＣＵＴ＆ＲＵＮデータセットから導出したクラスターを、同じ１０細胞型について、単一細胞ＡＴＡＣ−ｓｅｑおよびＲＮＡ−ｓｅｑデータセットから導出したクラスターと比較することにより、プロファイルを比較して、細胞型間のストリンジェントの区別に必要な細胞数およびシーケンシング深度を評価する［３３］。Ｈ３Ｋ２７Ａｃもまたエンハンサーに大量に存在するため、プロモーターから遠位の断片が部位を推定的に同定する。

ハエ精巣でのｓｃＣＵＴ＆ＲＵＮ。本発明者らは、固形組織を用いる単一細胞ＣＵＴ＆ＲＵＮのモデルシステムとしてショウジョウバエ精巣を使用することとする。ショウジョウバエ卵巣および精巣は、最大の成体器官であり、腹部から容易に切除される。しかし、卵巣は、高倍数体ナース細胞であり、これに対して精巣は、上皮体細胞、嚢胞体細胞および生殖系列細胞で構成されている。この生殖系列集団は６〜１０の生殖系列幹細胞、有糸分裂増殖中の生殖原細胞、成長中の初代精母細胞、減数分裂細胞、および分化中の精子細胞とともに、精子形成の全ての発生期を含む。したがって、精巣の単一細胞プロファイリングによって、本発明者らは、生殖系列発生のクロマチン配列のクラスタリングおよび順序付けをすることができることになる。これらのステージの全ては、未染色核の顕微鏡検査によって容易に区別され、これは、ナノウェルのイメージングは、プロファイルを明確に異なる細胞型に割り当てるのに有用であるであろうという理由で、本発明者らがアレイに基づくインデキシングの方を選ぶ１つの状況である。本発明者らは、生殖系列特異的遺伝子発現プログラムの活性化と、調節の染色体ワイドな変化の両方を追跡することとする。ショウジョウバエ精子形成は、精母細胞期に開始して代替遺伝子プロモーターを幅広く活性化および調節するために精巣特異的ＴＢＰ関連因子（ｔＴＡＦ）を使用する。本発明者らは、ＴＡＦ５（体細胞および初期生殖系列ＴＦＩＩＤ成分［３６］）、その主要精母細胞バリアントキャノンボール（Ｃａｎ）［３７］、ならびにＨ３Ｋ２７ＡｃおよびＨ３Ｋ２７ｍｅ３ヒストン修飾をプロファイリングするために利用可能な抗体を使用することになる。ＴＡＦ５およびキャノンボールプロファイリングは、代替プロモーターにおけるこれらのｔＴＡＦの結合部位が後期生殖系列細胞と比較して体細胞と初期生殖系列細胞間に特有であるので、ヒストン修飾プロファイリングからの単一細胞クラスタリングの情報を得るために使用することとする。最後に、遺伝子の小収集物が、減数分裂後細胞にのみ発現されることは公知である［３８］ため、これらの遺伝子のリードを使用してこれらの細胞からのバーコードをクラスタリングすることとする。

精子形成中には２つの大きな染色体ワイドなリモデリング事象がある。第１に、成長中の初代精母細胞において、メガベースサイズのＹ染色体遺伝子が活性化され、全Ｘ染色体は、通常より早期に不活性化されるいくつかの証拠もある。第２に、大部分のコアヒストンが分化中の精子細胞のクロマチンから剥奪され、プロタミンおよび精子特異的非ヒストンタンパク質で置き換えられる。哺乳動物精子形成におけるＸ染色体不活性化とヒストン／プロタミン置換の両方が、Ｈ３．３およびＨ２Ａ．Ｚヒストンバリアントによるクロマチンリモデリングを伴うため、本発明者らは、＿＿＿これらの保存バリアントをプロファイリングすることとする。

ショウジョウバエ精巣。本発明者らの予備細胞学的特徴付けは、通常より早期のＸ不活性化は、ショウジョウバエにおけるこのバリアントにも関わり得るという考えと一致して、ショウジョウバエＨ２Ａ．Ｚホモログが、初代精母細胞ではＸ染色体上に中等度に濃縮されていることを示す（データは示さない）。どの系においても、ヒストンバリアントが、生殖系列染色体不活性化中にＸ染色体全体にわたってまたは特定の部位もしくは遺伝子に濃縮されるかどうかは不明である；単一細胞クロマチンプロファイリングは、これに対処することになる。

ピークコーリングの基礎としてのＣＵＴ＆ＲＵＮ断片長。現在、特定の遺伝子座におけるエピゲノムデータの濃縮の分析は通常、特定の標的についての報告されている役割（例えば、サイレンシングにおけるＨ３Ｋ２７ｍｅ３、もしくは活性遺伝子発現におけるＨ３Ｋ４ｍｅ３）に基づく推測、または目的の領域における複数のプロファイルのオーバーラップの分析に基づく推測を含む。このアプローチは、１０年より長きにわたるエピゲノムデータ分析においてほとんど変わっておらず、標的洗練およびパラメーター最適化のための複雑な方法（例えば、［１４］）を必要とし、これらの方法は、バルク集団においてさえ実行が困難である。したがって、本発明者らは、ＣＵＴ＆ＲＵＮから得た特有の情報を利用して標準分析パラダイムを改善することを模索した。ＣｈＩＰ−ｓｅｑのスタイルでのゲノムワイドなエピゲノムプロファイルの生成に加えて、ＣＵＴ＆ＲＵＮは、ＭＮａｓｅ−ｓｅｑと同様に、しかし特定の標的エピトープについての、塩基対分解能でシーケンシングされた断片長に関する情報を保存する。断片長は、単一分子レベルでタンパク質結合の性質を解明することができる；例えば、ＴＦは、小さいフットプリントを保護し、８０ｂｐ未満の短い断片を残すことが多いが、ヌクレオソームは、その２つのラップでおよそ１５０ｂｐのＤＮＡを保護する。本発明者らの研究所は、過去のＭＮａｓｅ−ｓｅｑデータからの断片長情報を使用して、遠位調節エレメントにおけるＴＦ結合、および活性転写部位における部分的に破壊されたヌクレオソームの存在を推測した［２０、３９］。これに端を発して、本発明者らは、ＣＵＴ＆ＲＵＮピークの中の調節活性部位を塩基対分解能で予測するために断片サイズを使用する計算法を開発した。本発明者らは、結合または調節活性の最高尤度を示す本発明者らのＶプロット法［３９］と類似している、断片長に対するピーク中心からの断片オフセットの分布のＬＯＥＳＳ回帰を使用して、予測断片サイズが最小化されるピーク内の単一塩基対を同定した（図６０Ａ）。本発明者らは、Ｋ５６２細胞におけるＣＴＣＦを標的とする実験からのＣＵＴ＆ＲＵＮデータに本発明者らの方法を適用したとき、ＣＴＣＦ結合モチーフとのオーバーラップが高度に濃縮されている小さい断片の集団と、ヌクレオソームに概して有利に働くＧＣリッチ配列とオーバーラップしている大きい断片の集団という、２つの主集団に対応する頂点を検出した［４０］（図６０Ｂ）。これらの結果は、小さいＤＮＡ断片の頂点が、ＣＴＣＦ結合部位をより正確に規定し、その結果、それらが切断領域内の隣接するヌクレオソームと区別されることを示す。したがって、断片サイズを層別化することは、高い分解能で因子結合部位を同定するのに有効な方法である。

調節エレメントを同定するためのＣＵＴ＆ＲＵＮ断片長の使用。

ＣＵＴ＆ＲＵＮデータでのピークコーリングアルゴリズムの比較。エピゲノムデータを処理するため既存の分析ソフトウェアパッケージは、ＣｈＩＰ−ｓｅｑを特に念頭において書かれたものであり、それ故、高ノイズデータからシグナルを抽出するように設計される。これらの方法は通常、ゲノム全体にわたってバックグラウンドリードカウントを推定し、次いで、より高いシグナルを、直接結合の唯一の指標として使用する。ＣＵＴ＆ＲＵＮは、極めて低いバックグラウンドを有するため、これらのアプローチは、ピークコーリングにそれほど適さない。しかし、ＣＵＴ＆ＲＵＮデータは、ＴＦ結合部位が、概して、短いＤＮＡ断片として出現し、隣接ヌクレオソーム（これらもＣＵＴ＆ＲＵＮでは放出される［１６］）は、約１５０ｂｐ断片として出現するため、ＣｈＩＰ−ｓｅｑが欠けているＤＮＡ断片サイズ情報を含有する。本発明者らは、一般的なピークコーリングアルゴリズムと本発明者らの断片サイズに基づくアルゴリズムとを直接比較して性能を判定し、断片サイズ情報を使用する有効なアルゴリズムを開発することとする。本発明者らは、ＥＮＣＯＤＥプロジェクトに標準として使用される２つの主要ピークコーリングパッケージである、ＭＡＣＳ２およびＳＰＰアルゴリズムを試験することとする。本発明者らは、先ず、バルク実験からのＣＴＣＦについてのＣＵＴ＆ＲＵＮデータを使用することとする。ＣＴＣＦは、明確に定義されたＤＮＡ結合モチーフを有し、これが、各々のアルゴリズムのリコールおよび分解能を試験するための「究極の判断基準」になる。各々のアルゴリズムの感度を判定するために、本発明者らは、ＣＴＣＦモチーフとオーバーラップする検出ピーク数をアルゴリズムごとに比較することとする。分解能を判定するために、本発明者らは、各々のピーク頂点までのＣＴＣＦモチーフまでの距離についての累積分布関数（ＣＤＦ）曲線を作成することとする。断片サイズに基づく結合部位検出に関して上で説明した本発明者らの予備研究により、本発明者らは、本発明者らの方法がＣＵＴ＆ＲＵＮデータを用いて現行のピークコーラーを上回る働きをすることができることを確信する。

ｓｃＣＵＴ＆ＲＵＮデータを用いる断片長に基づくピークコーリング。単一細胞シーケンシング技術は、試料内不均一性についての重要な情報を伝えることができる。これは、例えば、ｔ分布型確率的近傍埋め込み法（ｔＳＮＥ）［３１］および均一多様体近似と投影（ＵＭＡＰ）［４１］などの次元圧縮戦略によって達成される。これらのクラスタリング法は、多くのデジタル次元（例えば、単一細胞からの遺伝子発現値）を使用して細胞状態を区別する。細胞型間の発生トラジェクトリーまたは遷移状態をクラスターの擬似時間構成により推測することができる。数百の個々の細胞からの次元の疎サンプリングであってもクラスタリングを駆動するのに十分であるように何千もの次元を提供する、ｓｃＲＮＡ−ｓｅｑデータを使用するそのような方法は、ロバストである。しかし、ｓｃＲＮＡ−ｓｅｑは、発現の定量的測定値としてリードカウントを使用する一方で、データセットは、存在量の多い転写物により支配され、高いノイズにより制限され、これにより、ＰＣＲ増幅アーチファクトを排除するための精緻な方法が必要となる。つい最近、ｓｃＡＴＡＣ−ｓｅｑにより単一細胞において測定されたＤＮＡ接近可能性が、ＣＤ３４＋リンパ球を分類するために使用された［４２］。この方法で、推定的調節エレメントを同定することができるが、どのようなクロマチン因子が各々の特定の部位に結合するのかは不明であり、ｓｃＡＴＡＣ−ｓｅｑは、ＤＮＡモチーフを使用して部位における因子を推測する。細胞型がどのように制御されるのかを理解するために、調節エレメントに対する因子結合を直接調べることにより、調節エレメントの変化および決定ＴＦの結合の変化に基づいて細胞型のトラジェクトリーが生成されることになる。しかし、ＣｈＩＰに基づくプロファイリングには、単一細胞に対する感度が欠如している。さらに、細胞におけるＤＮＡ分子の少ないコピー数（Ｇ１期二倍体では２コピー）のため、いずれの単一細胞エピゲノムプロファイリング技術も、各々の次元の二進値により制約される。

本発明者らは、単一細胞エピゲノムプロファイリング分析に対する２つの改良を提案する。本発明者らは、１）ＣＵＴ＆ＲＵＮの感度、および２）断片サイズ情報を使用して、単一細胞分析に有益な次元としてのコールされる部位の数を最大化することとする。Hainerら［２３］は最近、ｓｃＣＵＴ＆ＲＵＮの感度がｓｃＡＴＡＣ−ｓｅｑの感度より１桁高いことを示した。これは、ＣＵＴ＆ＲＵＮが次元圧縮戦略の優れたインプットを提供することになることを含意する。ＣＵＴ＆ＲＵＮプロファイリングにおけるＤＮＡ断片サイズは、直接ＴＦ結合に有益であるので、断片サイズは、単一細胞クロマチンプロファイリングにおけるノイズを低下させるための理想的なメトリクスに相当する。本発明者らは、先ず、バルク細胞集団からの結合部位を定義し、次いで、個々の細胞における各々の部位をその部位でのＤＮＡ断片サイズとして表すこととする。これらの値を次元圧縮戦略のインプットとして使用することとする。主成分分析（ＰＣＡ）がｓｃＡＴＡＣ−ｓｅｑデータについて実行されているため、先ず、本発明者らは、Ｈ３Ｋ２７ＡｃおよびＨ３Ｋ２７ｍｅ３修飾およびＰＵ．１ＴＦについてのリンパ系細胞から生成したｓｃＣＵＴ＆ＲＵＮデータセットとともにＰＣＡを使用して、単一細胞データの大部分の変動を捕捉する肝要な部位を定義することとする。次いで、本発明者らは、ｔＳＮＥまたはＵＭＡＰアルゴリズムをｓｃＣＵＴ＆ＲＵＮデータとともにまたはＰＣＡで定義されたサブセットとともに使用することとする。これは、既知リンパ系部分集団の検出に使用するための最適な次元数を試験することになる。次いで、本発明者らは、ＤＮＡ断片サイズを考慮することが全ての断片をプールするに匹敵する程度を比較することとする。本発明者らは、決定転写因子を含む、幹細胞から分化中の精子への生殖系列細胞の発生トラジェクトリーが明確に定義されている、ショウジョウバエ精巣からの単一細胞の類似の分析を行うこととする。本発明者らは、ステージ特異的エンハンサーの活性化および遺伝子発現の変化を順序付けすることができると予想する。これらの研究は、意義がある。なぜなら、それらの研究によって、本発明者らは、因子特異的マッピングが、ヒストン修飾の（ｓｃＣＵＴ＆ＲＵＮによる）、ＤＮＡ接近可能性の（ｓｃＡＴＡＣ−ｓｅｑによる）、および遺伝子発現の（ｓｃＲＮＡ−ｓｅｑによる）より一般的な遺伝子マッピングに匹敵する程度を評価することが可能になるからである。

ｓｃＣＵＴ＆ＲＵＮからの単一細胞におけるエンハンサーおよび遺伝子発現の定義。クロマチンを介してのＲＮＡポリメラーゼの結合および進行は、ｉｎｖｉｖｏで動的ヌクレオソーム中間体を生成する。本発明者らは、特徴的なサブヌクレオソーム長のＤＮＡ断片が活性遺伝子のプロモーターに見られることを以前に示した［２０］。サブヌクレオソーム断片は、ＭＮａｓｅ切断後、およびＣＵＴ＆ＲＵＮ〜Ｈ３Ｋ２７Ａｃ修飾後に出現する。これらのサブヌクレオソーム断片は、患者血清に見られる無細胞ＤＮＡにおけるものでも、遺伝子発現に関して報告するために使用することができ、したがって、ｍＲＮＡを得ることが困難または不可能である状況で起始細胞型を定義するのに有用である［２０］。重要なこととして、サブヌクレオソーム断片は、転写活性プロモーターに限定されず、ＴＦ結合がヌクレオソームと競合するＣＴＣＦ結合部位に特有である。これは、エンハンサーを同定するための特有の戦略を提供し、ここで、本発明者らは、あらゆるＴＦの結合がヌクレオソームと競合して特徴的なサブヌクレオソーム断片を生成することとなると予想する。先ず、本発明者らは、＿＿＿のために生成したヒトＫ５６２細胞およびハエＳ２細胞においてＨ３Ｋ２７ＡｃについてのＣＵＴ＆ＲＵＮデータを使用することとする；Ｈ３Ｋ２７ＡｃについてのＣＵＴ＆ＲＵＮは、ゲノムにおける活性調節性エレメントについてのデータを有効に富化する。訓練実験において、本発明者らは、細胞の集団内のヌクレオソーム位置を導出し、本発明者らの断片長ピークコーラーアルゴリズムを使用してサブヌクレオソーム断片の頻度を判定して、可能性のある因子結合部位を定義することとする。本発明者らは、ＲＮＡ−ｓｅｑおよびＳＴＡＲＲ−ｓｅｑによってそれぞれ定義された、これらの細胞系における遺伝子発現およびエンハンサーの公知レパートリーを使用して、これらの細胞の性能を試験することとする。

この戦略の利点は、サブヌクレオソーム長のシングルリードが、活性調節エレメントの一意的診断に役立つはずであり、したがって、個々の細胞におけるエンハンサーを調べる方法を提供することである。本発明者らは、遺伝子プロモーターでのサブヌクレオソーム断片を有する、および断片がプロモーターからより遠く離れている、リンパ系細胞型にアノテーションを付与して、プロモーターおよび調節エレメントの細胞型特異的マップを提供することとする。最後に、本発明者らは、プロモーターを個々の細胞のエンハンサーと連結させて、調節エレメント使用の推測を開始することを目指す。本発明者らは、ｓｃＣＵＴ＆ＲＵＮ後に個々の細胞のゲノム全体にわたってサブヌクレオソーム断片にアノテーションを付与することにより、これを行うこととする。本発明者らはまた、同じ実験でヒストン修飾に対する抗体を使用することによりエンハンサーおよびプロモーターのカバー率の上昇を評価することとする。例えば、ｐＡ−ＭＮａｓｅを、Ｈ３Ｋ２７Ａｃに対する抗体およびＨ３Ｋ４ｍｅ１ヒストン修飾に対する抗体の両方と繋留することで、両方を有するおよびどちらかのヒストン修飾を有するエンハンサーを捕捉することができる（本発明者らは、どの部位が、単一抗体実験からのどの修飾に起因する可能性が高いかについて、畳み込みを解くことができる）。これらの実験の目標は、どの部位のペアが個々の細胞において同時に会合しているのかを問うことであり、これは、いかなる技術によっても現在は不可能である推測である。このアプローチが有望である場合、特に関心のあるペアは、活性エンハンサーとＨ３Ｋ４ｍｅ１に対する抗体とを、および会合しているプロモーターとＲＮＡＰＩＩ−ＣＴＤ−Ｓ５Ｐに対する抗体とを、同時にマッピングすることになる。十分なカバー率で、この組合せによって、標的プロモーターがＲＮＡＰＩＩと会合しているときに遺伝子に対する複数の活性エンハンサーが結合しているかどうか、またはエンハンサー−プロモーター相互作用がより動的であるかどうかの評定が可能になる。

実施例８のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）

1. Liu, N., Hargreaves, V.V., Zhu, Q., Kurland, J.V., Hong, J., Kim, W., Sher, F., Macias-Trevino, C., Rogers, J.M., Kurita, R., et al. (2018). Direct Promoter Repression by BCL11A Controls the Fetal to Adult Hemoglobin Switch. Cell 173, 430-442 e417.

2. Skene, P.J., Henikoff, J.G., and Henikoff, S. (2018). Targeted in situ genome-wide profiling with high efficiency for low cell numbers. Nat Protoc 13, 1006-1019.

3. Solomon, M.J., and Varshavsky, A. (1985). Formaldehyde-mediated DNA-protein crosslinking: a probe for in vivo chromatin structures. Proc. Natl. Acad. Sci. U. S. A. 82, 6470-6474.

4. Rhee, H.S., and Pugh, B.F. (2011). Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147, 1408-1419.

5. Skene, P.J., and Henikoff, S. (2015). A simple method for generating high-resolution maps of genome wide protein binding. eLife 4, e09225.

6. Zentner, G.E., and Henikoff, S. (2014). High-resolution digital profiling of the epigenome. Nat. Rev. Genet. 15, 814-827.

7. He, Q., Johnston, J., and Zeitlinger, J. (2015). ChIP-nexus enables improved detection of in vivo transcription factor binding footprints. Nature biotechnology 33, 395-401.

8. Teytelman, L., Thurtle, D.M., Rine, J., and van Oudenaarden, A. (2013). Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. Proc. Natl. Acad. Sci. U. S. A. 110, 18602-18607.

9. Park, D., Lee, Y., Bhupindersingh, G., and Iyer, V.R. (2013). Widespread misinterpretable ChIP-seq bias in yeast. PLoS One 8, e83506.

10. Jain, D., Baldi, S., Zabel, A., Straub, T., and Becker, P.B. (2015). Active promoters give rise to false positive 'Phantom Peaks' in ChIP-seq experiments. Nucleic Acids Res 43, 6959-6968.

11. Baranello, L., Kouzine, F., Sanford, S., and Levens, D. (2016). ChIP bias as a function of cross-linking time. Chromosome Res 24, 175-181.

12. Meyer, C.A., and Liu, X.S. (2014). Identifying and mitigating bias in next-generation sequencing methods for chromatin biology. Nat Rev Genet 15, 709-721.

13. Venkataraman, A., Yang, K., Irizarry, J., Mackiewicz, M., Mita, P., Kuang, Z., Xue, L., Ghosh, D., Liu, S., Ramos, P., et al. (2018). A toolbox of immunoprecipitation-grade monoclonal antibodies to human transcription factors. Nat Methods.

14. Kasinathan, S., Orsi, G.A., Zentner, G.E., Ahmad, K., and Henikoff, S. (2014). High-resolution mapping of transcription factor binding sites on native chromatin. Nature Methods 11, 203-209.

15. Zentner, G.E., Kasinathan, S., Xin, B., Rohs, R., and Henikoff, S. (2015). ChEC-seq kinetics discriminate transcription factor binding sites by DNA sequence and shape in vivo. Nat Commun 6, 8733.

16. Skene, P.J., and Henikoff, S. (2017). An efficient targeted nuclease strategy for high-resolution mapping of DNA binding sites. eLife 6, e21856.

17. Schmid, M., Durussel, T., and Laemmli, U.K. (2004). ChIC and ChEC; genomic mapping of chromatin proteins. Mol. Cell 16, 147-157.

18. Thakur, J., and Henikoff, S. (2018). Unexpected conformational variations of the human centromeric chromatin complex. Genes Dev. 32, 20-25.

19. Kasinathan, S., and Henikoff, S. (2018). Non-B-Form DNA Is Enriched at Centromeres. Mol. Biol. Evol.

20. 35, 949-962.

21. Ramachandran, S., Ahmad, K., and Henikoff, S. (2017). Transcription and Remodeling Produce Asymmetrically Unwrapped Nucleosomal Intermediates. Mol. Cell 68, 1038-1053 e1034.

22. Chereji, R.V., Ocampo, J., and Clark, D.J. (2017). MNase-Sensitive Complexes in Yeast: Nucleosomes and Non-histone Barriers. Mol. Cell 65, 565-577 e563.

23. Kubik, S., Bruzzone, M.J., Albert, B., and Shore, D. (2017). A Reply to "MNase-Sensitive Complexes in Yeast: Nucleosomes and Non-histone Barriers," by Chereji et al. Mol. Cell 65, 578-580.

24. Hainer, S.J., Boskovic, A., Rando, O.J., and Fazzio, T.G. (2018). Profiling of pluripotency factors in individual stem cells and early embryos. bioRxiv.

25. van Steensel, B., and Henikoff, S. (2000). Identification of in vivo DNA targets of chromatin proteins using tethered Dam methyltransferase. Nat. Biotechnol. 18, 424-428.

26. van Steensel, B., Delrow, J., and Henikoff, S. (2001). Chromatin profiling using targeted DNA adenine methyltransferase. Nat. Genet. 27, 304-308.

27. Skene, P.J., and Henikoff, S. (2017). CUT&RUN: Targeted in situ genome-wide profiling with high efficiency for low cell numbers. biorxiv www.biorxiv.org/content/early/2017/09/24/193219.

28. Roth, T.L., Puig-Saus, C., Yu, R., Shifrut, E., Carnevale, J., Hiatt, J., Saco, J., Li, H., Li, J., Tobin, V., et al. (2017). Reprogramming human T cell function and specificity with non-viral genome targeting. bioRxiv.

29. Rosenberg, A.B., Roco, C.M., Muscat, R.A., Kuchina, A., Sample, P., Yao, Z., Graybuck, L.T., Peeler, D.J., Mukherjee, S., Chen, W., et al. (2018). Single-cell profiling of the developing mouse brain and spinal cord with split-pool barcoding. Science 360, 176-182.

30. Goldstein, L.D., Chen, Y.J., Dunne, J., Mir, A., Hubschle, H., Guillory, J., Yuan, W., Zhang, J., Stinson, J., Jaiswal, B., et al. (2017). Massively parallel nanowell-based single-cell gene expression profiling. BMC Genomics 18, 519.

31. Chen, K., Hu, Z., Xia, Z., Zhao, D., Li, W., and Tyler, J.K. (2015). The Overlooked Fact: Fundamental Need for Spike-In Control for Virtually All Genome-Wide Analyses. Mol. Cell. Biol. 36, 662-667.

32. Cao, J., Packer, J.S., Ramani, V., Cusanovich, D.A., Huynh, C., Daza, R., Qiu, X., Lee, C., Furlan, S.N., Steemers, F.J., et al. (2017). Comprehensive single-cell transcriptional profiling of a multicellular organism. Science 357, 661-667.

33. de Frutos, M., Raspaud, E., Leforestier, A., and Livolant, F. (2001). Aggregation of nucleosomes by divalent cations. Biophys. J. 81, 1127-1132.

34. Mezger, A., Klemm, S., Mann, I., Brower, K., Mir, A., Bostick, M., Farmer, A., Fordyce, P., Linnarsson, S., and Greenleaf, W. (2018). High-throughput chromatin accessibility profiling at single-cell resolution. bioRxiv, http://dx.doi.org/10.1101/310284.

35. Svensson, V., Vento-Tormo, R., and Teichmann, S.A. (2018). Exponential scaling of single-cell RNA-seq in the past decade. Nat Protoc 13, 599-604.

36. Zheng, G.X., Terry, J.M., Belgrader, P., Ryvkin, P., Bent, Z.W., Wilson, R., Ziraldo, S.B., Wheeler, T.D., McDermott, G.P., Zhu, J., et al. (2017). Massively parallel digital transcriptional profiling of single cells. Nat Commun 8, 14049.

37. Wright, K.J., Marr, M.T., 2nd, and Tjian, R. (2006). TAF4 nucleates a core subcomplex of TFIID and mediates activated transcription from a TATA-less promoter. Proc. Natl. Acad. Sci. U. S. A. 103, 12347-12352.

38. Chen, X., Hiller, M., Sancak, Y., and Fuller, M.T. (2005). Tissue-specific TAFs counteract Polycomb to turn on terminal differentiation. Science 310, 869-872.

39. Barreau, C., Benson, E., Gudmannsdottir, E., Newton, F., and White-Cooper, H. (2008). Post-meiotic transcription in Drosophila testes. Development 135, 1897-1902.

40. Henikoff, J.G., Belsky, J.A., Krassovsky, K., Macalpine, D.M., and Henikoff, S. (2011). Epigenome characterization at single base-pair resolution. Proc. Natl. Acad. Sci. U. S. A. 108, 18318-18323.

41. Kaplan, N., Moore, I.K., Fondufe-Mittendorf, Y., Gossett, A.J., Tillo, D., Field, Y., LeProust, E.M., Hughes, T.R., Lieb, J.D., Widom, J., et al. (2009). The DNA-encoded nucleosome organization of a eukaryotic genome. Nature 458, 362-366.

42. Becht, E., Dutertre, C.-A., Kwok, I.W.H., Ng, L.G., Ginhoux, F., and Newell, E.W. (2018). Evaluation of UMAP as an alternative to t-SNE for single-cell data. biorxiv, doi.org/10.1101/298430.

43. Buenrostro, J.D., Corces, M.R., Lareau, C.A., Wu, B., Schep, A.N., Aryee, M.J., Majeti, R., Chang, H.Y., and Greenleaf, W.J. (2018). Integrated Single-Cell Analysis Maps the Continuous Regulatory Landscape of Human Hematopoietic Differentiation. Cell.

44. Regev, A., Teichmann, S.A., Lander, E.S., Amit, I., Benoist, C., Birney, E., Bodenmiller, B., Campbell, P., Carninci, P., Clatworthy, M., et al. (2017). The Human Cell Atlas. eLife 6.

45. Buenrostro, J.D., Giresi, P.G., Zaba, L.C., Chang, H.Y., and Greenleaf, W.J. (2013). Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat Methods 10, 1213-1218.

46. Corces, M.R., Buenrostro, J.D., Wu, B., Greenside, P.G., Chan, S.M., Koenig, J.L., Snyder, M.P., Pritchard, J.K., Kundaje, A., Greenleaf, W.J., et al. (2016). Lineage-specific and single-cell chromatin accessibility charts human hematopoiesis and leukemia evolution. Nat. Genet. 48, 1193-1203.

47. Cusanovich, D.A., Daza, R., Adey, A., Pliner, H.A., Christiansen, L., Gunderson, K.L., Steemers, F.J., Trapnell, C., and Shendure, J. (2015). Epigenetics. Multiplex single-cell profiling of chromatin accessibility by combinatorial cellular indexing. Science 348, 910-914.

48. Kester, L., and van Oudenaarden, A. (2018). Single-Cell Transcriptomics Meets Lineage Tracing. Cell Stem Cell.
49. Henikoff, S., Ahmad, K., and Malik, H.S. (2001). The centromere paradox: Stable inheritance with rapidly evolving DNA. Science 293, 1098-1102.

（実施例９）

改良ＣＵＴ＆ＲＵＮベクター

最近まで、本発明者らが本明細書で開示するようなＣＵＴ＆ＲＵＮに使用した全てのｐＡ−ＭＮａｓｅは、元々のｐＫ１９−ｐＡ−ＭＮベクター（Schmid et al., 2004）から誘導したものであった。しかし、この構築物により産生される融合タンパク質は、ＩｇＧカラムを使用するＥ．ｃｏｌｉ過剰発現細胞の溶解物からの精製を必要とし、低ｐＨでの溶出、続いての中和が、バッチ間変動を生じさせる結果となった。この精製プロトコールを改良するために、本発明者らは、ｐＫ１９−ｐＡ−ＭＮに６−Ｈｉｓタグを加えた（Bornhorst and Falke, 2000）。これは、ニッケル樹脂カラムでの簡易で穏やかな精製を可能にする（図６１を参照されたい）。加えて、本発明者らは、市販の６−Ｈｉｓ−コバルト樹脂キット（Ｐｉｅｒｃｅ（商標）Ｐｕｌｌ−ＤｏｗｎＰｏｌｙＨｉｓＰｒｏｔｅｉｎ：ＰｒｏｔｅｉｎＩｎｔｅｒａｃｔｉｏｎＫｉｔ、カタログ番号２１２７７）も、非常に清浄で活性の高い酵素をもたらすことを見出した。

６−Ｈｉｓタグを、原理上は、ＣＵＴ＆ＲＵＮ上清からのクロマチンプルダウンに使用することができるが、実際には、これは、６−Ｈｉｓタグを樹脂から放出させるためにキレート剤を必要とするため複雑である。それ故、本発明者らは、ＣＵＴ＆ＲＵＮ．ＣｈＩＰに適用することができるＨＡ（赤血球凝集素）タグも加えた（Brahma and Henikoff, 2018）。これによって、ＣＵＴ＆ＲＵＮ上清を過剰なＴａｇ特異的ペプチドで処置して抗体を放出させ、その結果、クロマチン免疫沈降のための二次抗体による結合が可能になる。ＭＮａｓｅ融合構築物上のＨＡタグによって、本発明者らは、ＨＡまたは３ＸＦＬＡＧなどのエピトープタグに対する抗体だけでなく、任意の抗体を用いて、ＣＵＴ＆ＲＵＮ．ＣｈＩＰを行うことを可能にすることにより、本方法の多用途性を増大させる。

プロテインＡは、マウスＩｇＧと弱くしか結合しないため、マウス抗体にはプロテインＧを一般に使用する。ＭＮａｓｅ融合タンパク質の多用途性をさらに向上させるために、本発明者らは、ｐＫ１９−ｐＡ−ＭＮにおけるプロテインＡドメインに隣接して単一のプロテインＧドメインを付加させた。この結果、二次抗体を必要とすることなく、ほぼ全ての市販の抗体と強く結合する融合タンパク質を得た（Eliasson et al., 1988）。加えて、本発明者らは、ウサギ抗体に対する結合をさらに増加させるために、プロテインＧコード配列における３つの残基を突然変異させた（Jha et al., 2014）。

得られたｐＡ／Ｇ−ＭＮａｓｅ構築物のマップを図に示す。本発明者らは、通常のＣＵＴ＆ＲＵＮ応用について、それは、ｐＡ−ＭＮａｓｅと非常に類似に挙動するが、より容易に精製され、より用途が広く、例えば、マウス一次モノクローナル抗体に対する二次抗体を必要とすることなくＣＵＴ＆ＲＵＮを行うことを可能にすることを見出した。

実施例９のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）

Bornhorst, J.A., and Falke, J.J. (2000). Purification of proteins using polyhistidine affinity tags. Methods Enzymol 326, 245-254.

Brahma, S., and Henikoff, S. (2018). RSC-associated Subnucleosomes Define MNase-sensitive Promoters in Yeast. In revision.

Eliasson, M., Olsson, A., Palmcrantz, E., Wiberg, K., Inganas, M., Guss, B., Lindberg, M., and Uhlen, M. (1988). Chimeric IgG-binding receptors engineered from staphylococcal protein A and streptococcal protein G. J Biol Chem 263, 4323-4327.

Jha, R.K., Gaiotto, T., Bradbury, A.R., and Strauss, C.E. (2014). An improved Protein G with higher affinity for human/rabbit IgG Fc domains exploiting a computationally designed polar network. Protein engineering, design & selection : PEDS 27, 127-134.

Schmid, M., Durussel, T., and Laemmli, U.K. (2004). ChIC and ChEC; genomic mapping of chromatin proteins. Mol Cell 16, 147-157.

（実施例１０）

免疫繋留型挿入シーケンシングによる迅速標的エピゲノムプロファイリング

序論

大規模並行シーケンシングの出現、および１塩基当たりのコストの劇的低下は、ゲノミクス革命を急速に加速させたが、エピゲノムプロファイリングの十分な裏づけは、ゲノムへのクロマチン断片のマッピングに使用される方法論における制約のため遅れている^１。シーケンシングを伴うクロマチン免疫沈降（ＣｈＩＰ−ｓｅｑ）は、クロマチンプロファイリングに現在最も広く使用されている方法である^２。しかし、ＣｈＩＰ−ｓｅｑは、超音波処理断片の数百塩基対サイズによって分解能が制限されるが、ＣｈＩＰ−ｅｘｏ^３、ＭＮａｓｅ−Ｘ−ＣｈＩＰ−ｓｅｑ^４およびＯＲＧＡＮＩＣ^５などの変形形態は、シーケンシングプラットフォームを十分に活用するための塩基対分解能を提供する。それにもかかわらず、架橋に関する問題が依然としてあり、架橋法のためのエピトープマスキングおよびアーチファクトならびに低い収率のため多数の細胞が必要になる^{２、６〜９}。ＣｈＩＰの代替法、特に、目的の特定のタンパク質をｉｎｓｉｔｕで標的化し、次いでゲノムワイドのプロファイリングする、ＤａｍＩＤ^１０、ＣｈＥＣ−ｓｅｑ^７およびＣＵＴ＆ＲＵＮ^{１１、１２}を含む、酵素繋留法も、進展している。例えば、Ｌａｅｍｍｌｉのクロマチン免疫切断（ＣｈＩＣ）戦略^１３に基づくＣＵＴ＆ＲＵＮは、架橋を伴わない、透過処理された細胞への特定の抗体およびプロテインＡ／ミクロコッカスヌクレアーゼ（ｐＡ−ＭＮａｓｅ）融合タンパク質の逐次的付加により、クロマチンタンパク質、または目的の修飾を標的とする^１１。ＭＮａｓｅは、カルシウムの添加により活性化され、断片が、ＤＮＡの抽出、ライブラリー調製およびペアードエンドシーケンシングのために上清に放出される。ＣＵＴ＆ＲＵＮは、ＣｈＩＰ−ｓｅｑよりはるかに低いバックグラウンドレベルで特定のクロマチン成分の塩基対分解能を提供し、したがって、ゲノムワイドなプロファイリングのコストを劇的に低下させる。ＣＵＴ＆ＲＵＮは、データ品質の大きな低下を伴わずに１００〜１０００細胞に適用することができる^{１２、１４}が、ハイスループット単一細胞適用は、標的断片を含有する上清を、ゲノムの残りを含有する細胞から分離する必要があるので複雑である。さらに、細胞を常磁性ビーズに固定化することによりもたらされる容易なワークフローに続いて、ＤＮＡシーケンシングライブラリー調製を行わなければならず、これにより、手順全体の時間、コストおよび努力が大幅に増す。

ここで、本発明者らは、高活性Ｔｎ５トランスポサーゼ^１５をプロテインＡに融合させること、およびＩｌｌｕｍｉｎａ適合性モザイクエンドオリゴヌクレオチドを担持したプロテインＡ／Ｔｎ５複合体によりｐＡ−ＭＮの添加を置換することによって、ＣｈＩＰ−ｓｅｑおよびＣＵＴ＆ＲＵＮの制約を克服する。Ｍｇ^＋＋でのＴｎ５の活性化は、バルク細胞適用と単一細胞適用の両方のためのＰＣＲ増幅にすぐにでも用いることができる、抗体標的化タグメンテーションを生じさせる結果となる。生細胞で開始して、本発明者らのシングルチューブ免疫繋留型挿入シーケンシング（ＩＴＩＳ）プロトコールは、いつでも配列を増幅することができるライブラリーを１日で提供する。

方法

材料

試薬
・細胞懸濁液。本発明者らは、ヒトＫ５６２細胞を使用した。
・コンカナバリン被覆磁気ビーズ（ＢａｎｇｓＬａｂｏｒａｔｏｒｉｅｓ、カタログ番号ＢＰ５３１）
・目的のエピトープに対する抗体。例えば、ＣＵＴ＆ＲＵＮによる１Ｄおよび３Ｄ相互作用のマッピングのためのウサギα−ＣＴＣＦポリクローナル抗体（Ｍｉｌｌｉｐｏｒｅ０７−７２９）
・存在量の多いエピトープに対する陽性対照抗体、例えば、α−Ｈ３Ｋ２７ｍｅ３ウサギモノクローナル抗体（ＣｅｌｌＳｉｇｎａｌｉｎｇＴｅｃｈｎｏｌｏｇｙ、カタログ番号９７３３）
・二次抗体、例えば、モルモットα−ウサギ抗体
・５％ジギトニン（ＥＭＤＭｉｌｌｉｐｏｒｅ、カタログ番号３００４１０）
・プロテインＡ−Ｔｎ５（ｐＡ−Ｔｎ５）融合タンパク質。−２０℃で保管する。
・Ｉｌｌｕｍｉｎａ適合性オーバーハングを有するモザイクエンド二本鎖オリゴヌクレオチド（配列情報は参考文献^１６から得、Ｅｕｒｏｆｉｎｓを通して注文したものであり、ＴＥ緩衝液中１００μＭ）
モザイクエンド＿リバース［ＰＨＯ］ＣＴＧＴＣＴＣＴＴＡＴＡＣＡＣＡＴＣＴ（配列番号２）
モザイクエンド＿アダプターＡＴＣＧＴＣＧＧＣＡＧＣＧＴＣＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧ（（配列番号３）
モザイクエンド＿アダプターＢＧＴＣＴＣＧＴＧＧＧＣＴＣＧＧＡＧＡＴＧＴＧＴＡＴＡＡＧＡＧＡＣＡＧ（配列番号４）
・蒸留、脱イオンまたはＲＮＡｓｅ不含Ｈ_２Ｏ（ｄＨ_２Ｏ、例えば、Ｐｒｏｍｅｇａ、カタログ番号Ｐ１１９７）
・１Ｍ塩化マンガン（ＭｎＣｌ_２；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号２０３７３４）
・１Ｍ塩化カルシウム（ＣａＣｌ_２；Ｆｉｓｈｅｒ、カタログ番号ＢＰ５１０）
・１Ｍ塩化カリウム（ＫＣｌ；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｐ３９１１）
・１Ｍ塩化マグネシウム（ＭｇＣｌ_２）
・１Ｍヒドロキシエチルピペラジンエタンスルホン酸ｐＨ７．５（ＨＥＰＥＳ（Ｎａ^＋）；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｈ３３７５）
・１Ｍヒドロキシエチルピペラジンエタンスルホン酸ｐＨ７．９（ＨＥＰＥＳ（Ｋ^＋）；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｈ３３７５）
・５Ｍ塩化ナトリウム（ＮａＣｌ；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｓ５１５０−１Ｌ）
・０．５Ｍエチレンジアミン四酢酸（ＥＤＴＡ；ＲｅｓｅａｒｃｈＯｒｇａｎｉｃｓ、カタログ番号３００２Ｅ）
・２Ｍスペルミジン（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｓ２５０１）
・Ｒｏｃｈｅ完全プロテアーゼ阻害剤ＥＤＴＡ不含タブレット（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号５０５６４８９００１）
・２ｍｇ／ｍｌのグリコーゲン（Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号１０９３０１９３００１の１：１０希釈物）
・ＲＮａｓｅＡ、ＤＮａｓｅおよびプロテアーゼ不含（１０ｍｇ／ｍｌ；ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号ＥＮ０５３１）
・１０％ドデシル硫酸ナトリウム（ＳＤＳ；Ｓｉｇｍａ−Ａｌｄｒｉｃｈ、カタログ番号Ｌ４５０９）
・プロテイナーゼＫ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号ＥＯ０４９２）
・ＡｇｅｎｃｏｕｒｔＡＭＰｕｒｅＸＰ常磁性ビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ、カタログ番号Ａ６３８８０）
・１ＭＴｒｉｓ−ＨＣｌｐＨ８．０
・エタノール（ＤｅｃｏｎＬａｂｓ、カタログ番号２７１６）
・ＮＥＢＮｅｘｔＨｉＦｉ２× ＰＣＲマスターミックス
・ＰＣＲプライマー（一意的インデックスを有するカスタムＰＣＲプライマーの配列は、参考文献^１７および^１８から得た）

装置
・ＣｅｎｔｒｉｆｕｇｅＥｐｐｅｎｄｏｒｆ５８１０、スイングバケット
・ＣｅｎｔｒｉｆｕｇｅＥｐｐｅｎｄｏｒｆ５４２４、固定角ローター
・ＣｅｎｔｒｉｆｕｇｅＥｐｐｅｎｄｏｒｆ５４１５Ｒ、冷却固定角ローター
・Ｍａｃｓｉｍａｇ磁気分離機（Ｍｉｌｔｅｎｙｉ、カタログ番号１３０−０９２−１６８）、１．７および２ｍｌ微量遠心管の底部からの液体の清浄な抜き取りが可能。
・ボルテックスミキサー（例えば、ＶＷＲＶｏｒｔｅｘＧｅｎｉｅ）
・微量遠心分離機（例えば、ＶＷＲＭｏｄｅｌＶ）
・１．５ｍｌ微小遠心管（Ｇｅｎｅｓｅｅ、カタログ番号２２−２８２）
・２ｍｌ微小遠心管（Ａｘｙｇｅｎ、カタログ番号ＭＣＴ−２００−Ｃ）
・チューブローテーター（Ｌａｂｑｕａｋｅ、ＴｈｅｒｍｏＦｉｓｈｅｒ）
・１．５ｍｌ微小遠心管用のウェルを有するヒーターブロック
・水浴（３７℃、５５℃および７０℃に設定される）
・ＭａＸｔｒａｃｔフェーズロック微小遠心管（Ｑｉａｇｅｎ、カタログ番号１３９０４６）
・キャピラリー電気泳動装置（例えば、ＡｇｉｌｅｎｔＴａｐｅｓｔａｔｉｏｎ４２００）
・Ｑｕｂｉｔ蛍光光度計（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、カタログ番号Ｑ３３２１６）

試薬準備

５％ジギトニン：ジギトニン粉末（Ｃａｌｂｉｏｃｈｅｍ）をＤＭＳＯに溶解して５％（ｗ／ｖ）にする。

結合緩衝剤：４００μＬの１ＭＨＥＰＥＳ−ＫＯＨｐＨ７．９、２００μＬの１ＭＫＣｌ、２０μＬの１ＭＣａＣｌ_２および２０μＬの１ＭＭｎＣｌ_２を混合し、ｄＨ_２Ｏで２０ｍｌの最終体積にする。その緩衝剤を４℃で６カ月間保管する。

コンカナバリンＡ被覆ビーズ：穏やかに再懸濁させ、各々の最終試料および／または消化時点に１０μＬがあるために十分なスラリーを抜き取る。２ｍｌ管の中の１．５ｍｌ結合緩衝剤に移入する。管を磁気スタンド上に配置して清浄化する（３０秒〜２分）。液体を抜き取り、磁気スタンドから除去する。１．５ｍｌの結合緩衝剤を添加し、反転または穏やかなピペット操作により混合し、微量遠心分離機でのクイックパルスで蓋および側面から液体を除去する。ＣｏｎＡビーズスラリーの体積（１試料当たり１０μＬ）と等しい体積の結合緩衝剤に再懸濁させる。

Ｔｎ５−アダプター複合体：モザイクエンドアダプターＡ（ＭＥ−Ａ）およびモザイクエンドアダプターＢ（ＭＥ−Ｂ）オリゴヌクレオチドの各々をモザイクエンド逆オリゴヌクレオチドとアニールする。アニール済みのＭＥ−ＡオリゴヌクレオチドとＭＥ−Ｂオリゴヌクレオチドの１６ｕｌの１００ｕＭ等モル混合物を１００ｕｌの５．５ｕＭプロテインＡ−Ｔｎ５融合タンパク質と混合する。混合物を回転プラットフォーム上で１時間、室温でインキュベートし、その後、−２０℃で保管する。

洗浄緩衝剤：１ｍｌの１ＭＨＥＰＥＳｐＨ７．５と、１．５ｍｌの５ＭＮａＣｌと、１２．５μＬの２Ｍスペルミジンとを混合し、ｄＨ_２Ｏで５０ｍｌの最終体積にし、１個のＲｏｃｈｅ完全プロテアーゼ阻害剤ＥＤＴＡ不含タブレットを添加する。その緩衝剤を４℃で最大１週間の間、保管する。

Ｄｉｇ洗浄緩衝剤：４００μＬの５％ジギトニンを４０ｍｌの洗浄緩衝剤と混合する。その緩衝剤を４℃で最大１日の間、保管する。

抗体緩衝剤：８μＬの０．５ＭＥＤＴＡを２ｍｌのＤｉｇ洗浄緩衝剤と混合し、使用するまで氷上に置く。

Ｄｉｇ−ｍｅｄ緩衝剤：２０ｍｌのＤｉｇ洗浄緩衝剤を６００μＬの５ＭＮａＣｌと混合する。その緩衝剤を４℃で最大１日の間、保管する。

タグメンテーション緩衝剤：２０μＬの１ＭＭｇＣｌ_２を２ｍｌのＤｉｇ−ｍｅｄ緩衝剤と混合し、使用するまで氷上に置く。

手順

細胞透過処理および一次抗体インキュベーション
・タイミング１．５時間〜数日
１）室温で新鮮培養物を収集し、細胞をカウントする。同じプロトコールを、１試料当たり最大５００，０００の哺乳動物細胞に使用することができる。
・一時停止ポイント：必要に応じて、Ｍｒ．Ｆｒｏｓｔｙイソプロピルアルコールチャンバを使用して細胞を１０％ＤＭＳＯ中で凍結保存することができる。本発明者らは、急速凍結を推奨しない。これは、最終的なデータ品質に影響を及ぼす可能性があるバックグラウンドＤＮＡ切断の原因となり得るからである。
２）３分、６００×ｇ、室温で遠心分離し、液体を抜き取る。
３）穏やかなピペット操作により１．５ｍｌの室温洗浄緩衝剤に再懸濁させ、必要に応じて２ｍｌ管に移す。
４）３分、６００×ｇ、室温で遠心分離し、液体を抜き取る。
５）ステップ３および４を繰り返す。
６）低（約１１００ｒｐｍ）に設定したボルテックス上に配置し、１ｍｌの冷抗体緩衝剤に再懸濁させる。
７）使用する抗体ごとに１つの、１．５ｍｌ管内の１００μＬアリコートに細胞スラリーを分割する。
８）１〜２μＬの抗体を添加する。
９）室温で１〜２時間、または４℃で最大数日、回転させる。

二次抗体を結合させる
・タイミング１時間
１０）低（約１１００ｒｐｍ）に設定したボルテックスミキサー上に各々の管を配置し、１０μＬの活性化ＣｏｎＡビーズスラリーをゆっくりと添加する。
１１）室温で章動または回転させて結合させる（５〜１０分）。
１２）１００μＬのＤｉｇ−洗浄液当たり１〜２μＬの二次抗体（例えば、ウサギ一次に対するモルモット抗ウサギ）を混合する。
１３）微量遠心分離機でのクイックパルスで蓋および側面から液体を除去し、管を磁気スタンド上に配置して清浄化する。
１４）全ての液体を吸引除去し、低（約１１００ｒｐｍ）に設定したボルテックスミキサーに各々の管を低角度で配置し、１００μＬの二次抗体ミックスを吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
１５）室温で約３０分間、章動または回転させる。
１６）高速回転させ、磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
１７）１ｍｌのＤｉｇ洗浄緩衝剤を添加し、反転により、または塊が残存する場合には穏やかなピペット操作により混合する。
１８）ステップ１６〜１７を２回繰り返す。

プロテインＡ−Ｔｎ５融合タンパク質を結合させる
・タイミング１．５時間
１９）１試料当たり１００μＬについて１：２００の最終濃度までｐＡ−Ｔｎ５複合体をＤｉｇ−ｍｅｄ緩衝剤に混ぜ入れる。
２０）磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
２１）低（約１１００ｒｐｍ）に設定したボルテックスミキサーに各々の管を低角度で配置し、１００μＬのｐＡ−Ｔｎ５ミックスを吹きかけ、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
２２）管をニューテータ・ローテータ−上に室温で１時間置く。
２３）高速回転させ、磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
２４）１ｍｌのＤｉｇ−ｍｅｄ緩衝剤を添加し、反転により、または塊が残存する場合には穏やかなピペット操作により混合する。
２５）ステップ２３〜２４を２回繰り返す。

タグメンテーション
・タイミング１．２時間
２６）高速回転させ、磁気スタンド上に配置して清浄化し、液体の全てを吸引除去する。
２７）低（約１１００ｒｐｍ）に設定したボルテックスミキサーに各々の管を低角度で配置し、１試料当たり１００μＬのタグメンテーション緩衝剤を側面に沿って添加し、その間、その溶液によるビーズの大部分または全てを取り除くことを可能にするために穏やかにボルテックスする。軽く叩いて残りのビーズを取り除く。
２８）３７℃で１時間、インキュベートする。

タグメンテーション停止およびＤＮＡ抽出
・タイミング１．５時間
２９）各々の試料に室温で４．５μＬの０．５ＭＥＤＴＡ、５．５μＬの１０％ＳＤＳおよび１μＬの２０ｍｇ／ｍｌのプロテイナーゼＫを添加する。
３０）インキュベート（３０分、５５℃）して、消化する。
３１）インキュベート（２０分、７０℃）して、プロテイナーゼＫを不活性化する。
３２）１．１体積（１２２μＬ）ＡＭＰｕｒｅＸＰ常磁性ビーズを添加し、短時間、フルでボルテックスする。
３３）高速回転させ、室温で１０〜１５分間、静置させる。
３４）磁石の上に配置し、透明になるまで放置した後、液体を注意深く抜き取る。
３５）磁石の上で、ビーズを乱すことなく、１ｍｌの８０％エタノールを添加する。
３６）管の底に１ｍｌピペットを入れて液体を抜き取り、１ｍｌの８０％エタノールを添加する。
３７）１ｍｌピペットで液体を抜き取る。
３８）残存する液体を２０μＬピペットで除去し、４〜５分放置して乾燥させる。
３９）磁気スタンドを取り外し、３０μＬの１０ｍＭＴｒｉｓ−ＨＣｌｐＨ８を添加し、フルでボルテックスする。
４０）５分後、磁気スタンド上に配置して、透明になるまで放置する。
４１）ピペットで液体を新たな管へと除去する。

ＰＣＲ
・タイミング１時間
４２）２１μＬのＤＮＡ＋２μＬのカスタムＡｄ１＿ｎｏＭＸｉ５＋２μＬのｖ２＿Ａｄ２？を混合する。試料ごとに異なるバーコードを使用して、ｉ７プライマーをバーコード化する。
４３）２５μＬのＮＥＢＮｅｘｔＨｉＦｉ２× ＰＣＲマスターミックスを添加する。
４４）混合し、高速回転させ、サーモサイクラー内に配置し、ＨＥＡＴＥＤＬＩＤでのサイクリングプログラムを開始する。
４５）サイクル１：５分間７２℃（ギャップ充填）
４６）サイクル２：３０秒間９８℃
４７）サイクル３：１０秒間９８℃
４８）サイクル４：３０秒間６３℃
４９）サイクル３〜４を１３回繰り返す。
５０）１分間７２℃、そして８℃で保持する。
・大きいＤＮＡ断片および過剰なプライマーの寄与を最小にするために、ＰＣＲサイクルは、好ましくは、１０秒、６０〜６３℃のアニール／伸長複合ステップを伴う、少なくとも１２〜１４サイクルであるべきである。

ＰＣＲ後クリーンアップ
５１）管が冷めた後、サイクラーを取り外し、１．１体積（５５μＬ）ＡｍｐｕｒｅＸＰビーズを添加し、短時間、フルでボルテックスする。
５２）高速回転させ、室温で１０〜１５分間、静置させる。
５３）磁石の上に配置し、透明になるまで放置した後、液体を注意深く抜き取る。磁石の上で、ビーズを乱すことなく、２００μＬの８０％エタノールを添加する。
５４）管の底にピペットを入れて液体を抜き取り、２００μＬの８０％エタノールを添加する。
５５）液体を抜き取り、残存する液体を２０μＬピペットで除去し、４〜５分放置して乾燥させる。
５６）磁気スタンドを取り外し、３０μＬの１０ｍＭＴｒｉｓ−ＨＣｌｐＨ８を添加し、フルでボルテックスする。
５７）５分後、磁気スタンド上に配置して、透明になるまで放置する。
５８）ピペットで液体を新たな管へと除去する。

ＤＮＡシーケンシングおよびデータ処理
５９）Ａｇｉｌｅｎｔ４２００ＴａｐｅＳｔａｔｉｏｎ分析によりライブラリーのサイズ分布を判定する。
６０）製造業者の推奨どおりの最終濃度を目指して、所望通りの等しい表現を達成するようにライブラリーを混合する。
６１）バーコードライブラリーを用いるペアードエンドＩｌｌｕｍｉｎａシーケンシングを製造業者の使用説明書に従って行う。
６２）本発明者らは、Ｂｏｗｔｉｅ２バージョン２．２．５を、オプション：−−ｌｏｃａｌ−−ｖｅｒｙ−ｓｅｎｓｉｔｉｖｅ−ｌｏｃａｌ−−ｎｏ−ｕｎａｌ−−ｎｏ−ｍｉｘｅｄ−−ｎｏ−ｄｉｓｃｏｒｄａｎｔ−−ｐｈｒｅｄ３３−Ｉ１０−Ｘ７００で使用して、ペアードエンドリードのアラインメントを行う。較正のための断片のマッピングには、本発明者らは、実験ゲノムとスパイクインＤＮＡのものとの交差マッピングを回避するために、−−ｎｏ−ｏｖｅｒｌａｐ−−ｎｏ−ｄｏｖｅｔａｉｌオプションも使用する。

結果および考察

本発明者らの基本ＩＴＩＳプロトコールは、（１）細胞を透過処理すること、（２）一次抗体を添加して、インキュベートすること、（３）コンカナバリンＡ被覆常磁性ビーズ上に固定化すること、（４）二次抗体を添加し、インキュベートし、洗浄すること、（５）ｐＡ−Ｔｎ５を添加し（図６２）、洗浄すること、（６）Ｍｇ^＋＋と共にインキュベートすること、（７）反応を停止させ、プロテイナーゼＫで消化すること、および（８）ＡｍｐｕｒｅＸＰビーズを常磁性クリーンアップのために添加すること（図６３Ａ）を含む。全ての操作は、単一の管またはマイクロタイタープレートのウェルの中で行い、磁気ビーズからの水性溶出によって、いつでもＰＣＲすることができるＤＮＡライブラリーを得る。１４サイクルのＰＣＲ後、１０％アリコートのＴａｐｅｓｔａｔｉｏｎ表示は、２つの異なるｐＡ−Ｔｎ５構築物を使用すると、ＲＮＡＰＩＩ−Ｓｅｒ５およびＨ３Ｋ２７ｍｅ３について断片−アダプターのラダーを示すが、ＩｇＧ対照については示さないことを示す（図６４）。ラダーは、６，０００〜４００，０００の範囲の細胞数について見られる（図６３Ｂ）。プロファイルは、Ｈ３Ｋ２７ｍｅ３については下は６，０００に至るおよびＲＮＡポリメラーゼＩＩセリン−５（ＲＮＡＰＩＩ−Ｓｅｒ５）については下は２０，０００に至る細胞数に関してほぼ同一であり、小さい断片（＜１００ｂｐ＋両末端の６１ｂｐアダプター）、モノヌクレオソーム（約１７０ｂｐ＋アダプター）およびオリゴヌクレオソームを示す。ヌクレオソームエピトープと非ヌクレオソームエピトープの両方について類似のヌクレオソームラダーがＣＵＴ＆ＲＵＮについて見られ、両側のリンカー領域内の切断による隣接ヌクレオソームの放出と解釈した。より少ない細胞数では、小さい断片およびモノヌクレオソームの低減ならびにオリゴヌクレオソームの増加に伴って、断片の平均長の顕著な増加がある。本発明者らは、細胞数に伴うサイズ分布のこれらの差異は、一次抗体の限られた量の結果として生じると解釈し、したがって、より多い細胞数では、全ての利用可能なエピトープに結合するために十分な抗体がなく、これは、本発明者らが以前に報告したＣＵＴ＆ＲＵＮについての制約^１２である。細胞数の減少に伴って、部位のほぼ全てが抗体で飽和されるため、ドメイン内に存在量が多いＨ３Ｋ２７ｍｅ３において、および転写開始部位および遺伝子にわたって存在量が多いＲＮＡＰＩＩ−Ｓｅｒ５において粒子間での断片放出の可能性が高くなる。抗体の等濃度を仮定すると、枯渇は、Ｈ３Ｋ２７ｍｅ３についての細胞でのほうがＲＮＡＰＩＩ−Ｓｅｒ５についての細胞より多く起こることになる。なぜなら、ヌクレオソーム１つ当たりのＨ３Ｋ２７ｍｅ３のコピー数は多くとも２つであるが、ＲＮＡＰＩＩ複合体１つ当たりのＣ末端ドメイン（ＣＴＤ）ヘプタマーのコピー数は５２ほどもある^１９からである。本発明者らは、数日間の一次抗体のインキュベーションがＩＴＩＳ収量に影響を与えないことを見出した。

本発明者らは、先ず、ＲＮＡＰＩＩのプロファイリングについてＩＴＩＳをＣＵＴ＆ＲＵＮと比較した。ＣＵＴ＆ＲＵＮでは、消化の長さが断片の収量を決定する。過少消化では、細胞の集団内の部位のほんの一部が標的粒子の両側で切断されて上清に断片を放出し、低いシグナルを生じさせる結果となる。過剰消化は、ｐＡ−ＭＮ結合断片を放出し、その結果、非標的消化が生じることがあり、これは、ＲＮＡＰＩＩおよびＨ３Ｋ２７ａｃなどの非常に大量に存在するエピトープについて深刻になる問題である。ＣＵＴ＆ＲＵＮに伴う非標的消化を低減させるために、本発明者らは、ヌクレオソームコア粒子の沈殿をもたらすことが以前に示されている低塩および高二価カチオン濃度を使用して消化を行うように、プロトコールを改良した。実際、３．５ｍＭＨＥＰＥＳｐＨ７．５および１０ｍＭＣａＣｌ_２をＣＵＴ＆ＲＵＮ消化に使用して、本発明者らは、消化中にＨ３Ｋ２７ａｃ標的化クロマチンの放出を検出しなかったが、１５０ｍＭＮａＣｌの添加時には定量的放出を検出した。この手順は、相関行列分析により時点間の変動を大幅に低下させた（図５７）ため、本発明者らは、それ以来、この改良ＣＵＴ＆ＲＵＮプロトコールを全ての適用に採用してきた。それにもかかわらず、本発明者らの改良ＣＵＴ＆ＲＵＮプロトコールを抗ＲＮＡＰＩＩ−Ｓｅｒ５抗体を使用するＲＮＡＰＩＩからの開始形態に適用したとき、本発明者らは、０℃で１分〜２７分の時間経過にわたって過少消化と過剰消化の両方を観察した（図６５）。対照的に、同じ抗体および２つの異なるｐＡ−Ｔｎ５構築物を異なる濃度で使用するＩＴＩＳは、プロモーターに関して尖ったピークと、遺伝子本体における低い幅広ドメイン、および最良のＣＵＴ＆ＲＵＮ時点（９分）より低いバックグラウンドを示した。本発明者らは、ＲＮＡＰＩＩエピトープ（Ｓｅｒ−２、Ｓｅｒ５、Ｓｅｒ２＋Ｓｅｒ５およびＳｅｒ７）に対する４つの追加の抗体を使用して、ＲＮＡＰＩＩＣＵＴ＆ＲＵＮの一貫性を確認した。相関行列分析は、生物学的反復がクラスタリングして同じ実験内で異なる抗体が排除されることなく、５つ全ての抗体が高度に一致するプロファイルをゲノムワイドに与えることを示すのに対して、本発明者らの最良の実験についてのＣＵＴ＆ＲＵＮプロファイルは、同じインキュベーション混合物から逐次的に時点をとった事実にもかかわらず、より低い全般的一致を示す（図６６Ｂ）。本発明者らは、ＩＴＩＳが、本発明者らの改良ＣＵＴ＆ＲＵＮプロトコールを使用して見られる低いバックグラウンドで、ＲＮＡＰＩＩのロバストなプロファイリングを提供すると結論付ける。本発明者らは、異なって使用してサイレンシング（Ｈ３Ｋ２７ｍｅ３）および活性（Ｈ３Ｋ４ｍｅ２およびＨ３Ｋ２７ｍｅ３）ヒストン修飾のＩＴＳプロファイリングについて、同様に高いロバストネスおよび一致を観察した（図６６Ａ）。

Ｔｎ５を使用するタグメンテーションは、高感受性部位検出のための人気のあるＡＴＡＣ−ｓｅｑ法に従って非標的化方式で以前に適用されており^１７、ＩＴＩＳの課題は、抗体標的化プロファイリングと交絡することになる非標的化タグメンテーションを回避することである。非標的化タグメンテーション度をアッセイするために、本発明者らは、ＣＵＴ＆ＲＵＮ陽性対照として本発明者らが使用したＨ３Ｋ２７ｍｅ３に対するウサギモノクローナル抗体を使用した。なぜなら、このエピトープは、本質的に超高感受性部位を欠いているゲノムのサイレンシングされた領域に排他的に見られるからである。ヒトＫ５６２における超高感受性部位を同定するために、本発明者らは、現在リリースされているＡＴＡＣ−ｓｅｑデータセット（ＧＳＭ２６９５５６１）の６１，１５３ピークコールのセットをダウンロードした。超高感受性部位の位置として各々のピークの中点を使用して、本発明者らは、ｐＡ−Ｔｎ５複合体添加中および／または後の細胞の様々な処置の後に、Ｈ３Ｋ２７ｍｅ３ＩＴＩＳにより生成された断片をアラインメントした。本発明者らは、結合、洗浄およびタグメンテーションのために３００ｍＭＮａＣｌを使用して除去したが、ｐＡ−Ｔｎ５結合の後に５００ｍＭ塩洗浄液を短時間使用して軽度に還元した生理的（約１５０ｍＭ）ＮａＣｌを使用してＩＴＩＳの超高感受性部位の高い占有率を見出した（図６９Ａ）。６１，１５３全てのＡＴＡＣ−ｓｅｑ部位をスコアにより順序付けしたとき、ＣＵＴ＆ＲＵＮは、ＡＴＡＣ−ｓｅｑスコアとの弱い負の相関を示したが、その一方で、１５０ｍＭＮａＣｌおよびほんの短時間の５００ｍＭＮａＣｌを使用するＩＴＩＳは、強く相関したヒートマップを生じさせる結果となった（図６７）ことにより、ｐＡ−Ｔｎ５が、インキュベーション中に超高感受性部位とゲノムワイドに結合すること、および活性酵素複合体の相当な量が、洗浄およびタグメンテーション中に残存することが確証される。際だったことに、５００ｍＭＮａＣｌでの長時間洗浄は、ＡＴＡＣ−ｓｅｑ部位に関する占有率をＣＵＴ＆ＲＵＮに見られるレベルまで低下させた。超高感受性部位占有率のさらなる低下が、ｐＡ−Ｔｎ５結合、洗浄およびタグメンテーション中に３００ｍＭのＮａＣｌ濃度を使用することにより、得られた。本発明者らは、これは、超高感受性部位が埋め込まれているＨ３Ｋ２７ｍｅ３ドメイン内の高濃度のエピトープであって、Ｈ３Ｋ２７ｍｅ３不含ドメインに埋め込まれている部位と比較してこれらの部位に隣接するＨ３Ｋ２７ｍｅ３ヌクレオソームと結合しているｐＡ−Ｔｎ５によるバックグラウンド断片の優先的放出を生じさせる結果となる高濃度のエピトープとの弱い反相関に起因すると考える。これらの結果は、１セットのアダプターと複合体化している未繋留Ｔｎ５とインキュベートし、続いての異なるアダプターセットと複合体化しているｐＡ−Ｔｎ５とインキュベートして、高塩処理を省くことにより、ＩＴＩＳとＡＴＡＣ−ｓｅｑの両方を同じ試料で行うことができることも示唆する。

本発明者らは、イオン濃度がＩＴＩＳ断片のサイズ分布に影響を与え得ることを見出す。ＩＴＩＳは、転写因子に相当する小さい断片（≦１２０ｂｐ）と、低いジヌクレオソームレベルを伴うモノヌクレオソームに主として相当する大きい断片（≧１５０ｂｐ）を生じさせる（図６８）。約１０ｂｐの周期性は、酵母転写因子のＣＵＴ＆ＲＵＮに見られるそれほど顕著でない周期性に類似して、繋留切断の厳しい制約を表す可能性が高く、これを、本発明者らは、ＤＮＡ二重らせんの片面への酵素の接近を表すと解釈した^１１。塩濃度を上昇させて非標的化ｐＡ−Ｔｎ５を消失させることにより、本発明者らは、小さい断片サイズの集団の低減も観察した（図６９Ｂ）。加えて、本発明者らは、下の表におけるＥ．ｃｏｌｉゲノムをマッピングする断片の数の減少を観察した。

３００ｍＭＮａＣｌでのＴｎ５結合およびタグメンテーションは、ヒトＫ５６２細胞におけるＥ．ｃｏｌｉＤＮＡ混入を低減させる。

２つの異なるＩＴＩＳ実験からのマッピングされたペアードエンドリードカウント。第１の実験では、１５０ｍＭＮａＣｌをｐＡ−Ｔｎ５結合に使用し、その後、５００ｍＭの短時間の洗浄を２回、次いで１５０ｍＭＮａＣｌ中でのタグメンテーションを行った。第２の実験では、３００ｍＭＮａＣｌをｐＡ−Ｔｎ５結合に使用し、その後、３回の短時間の洗浄およびタグメンテーションを行った。精製中に、Ｔｎ５トランスポサーゼは、Ｅ．ｃｏｌｉＤＮＡの利用可能な断片と結合し、その一部は、精製プロセスを通して結合したままである。トランスポサーゼのいずれのバッチについても、反応に持ち込まれるＥ．ｃｏｌｉＤＮＡ混入物のパーセンテージは、「非侵襲性」スパイクインプロキシとして役立ち、このプロキシを試料を較正するために使用することができ、したがって、それらを定量的に比較することができる。

この混入物は、Ｔｎ５をコードする遺伝子が、Ｅ．ｃｏｌｉにおける高い発現レベルに誘導されて、Ｅ．ｃｏｌｉゲノムＤＮＡと結合する高濃度の酵素を産生し、その一部が、精製プロセスを乗り切り、細胞ＤＮＡとともに同時にタグメンテーションされるために発生する。精製中のこの混入物の除去のためのプロトコールはあるが、本発明者らは、本発明者らの３００ｍＭＮａＣｌプロトコールがＥ．ｃｏｌｉＤＮＡを有意でないレベルに低下させることを見出した。本発明者らは、ＣＴＣＦなどの相対的に稀なエピトープが、ヒストン修飾などのより存在量の多いエピトープより高い混入レベルを示し、低い均一なバックグラウンドのみをもたらすＩｇＧが、非常に高い混入を示すことに気付いた。これは、本発明者らが、較正のためのスパイクインの「非侵襲性」プロキシとしてＥ．ｃｏｌｉ混入を使用することができることを示す。スパイクイン較正には試料を比較することが不可欠であり^２０、バックグラウンドレベルが低すぎて較正に使用することができないＣＵＴ＆ＲＵＮおよびＩＴＩＳなどの方法を使用する場合には、特にそうである。Ｅ．ｃｏｌｉＤＮＡの混入をスパイクインのプロキシとして使用することができるか否かを試験するために、本発明者らは、Ｓ．ｃｅｒｅｖｉｓｉａｅ酵母ＤＮＡスパイクインを含む、Ｈ３Ｋ２７ｍｅ３（１００〜６，０００細胞）およびＣＴＣＦ（１，０００〜１００，０００細胞）についてプロファイリングされた段階希釈細胞からのＫ５６２細胞データセットを使用して、Ｅ．ｃｏｌｉゲノムに断片をマッピングした。実際、両方の細胞数範囲について、酵母スパイクインとＥ．ｃｏｌｉ混入との間の相関は、起こり得る測定誤差の範囲内にあるのと同じほど密接であった（Ｒ^２＝０．９６、図７０）。したがって、ｐＡ−ＭＮａｓｅに混入するＥ．ｃｏｌｉＤＮＡを使用して、スパイクインの必要を除去してＣＵＴ＆ＲＵＮを較正することができ、これは、ｐＡ−Ｔｎ５に混入するＥ．ｃｏｌｉＤＮＡがＩＴＩＳの好適なスパイクインプロキシとして役立つという本発明者らの証拠を裏づける。Ｅ．ｃｏｌｉ混入のスパイクインプロキシとしての使用は、不均一なスパイクインに有利である。なぜなら、ＣＵＴ＆ＲＵＮ試料へのｐＡ−ＭＮａｓｅの添加は、停止緩衝剤への不均一なスパイクインＤＮＡの添加より先に行われ、そのため、ＣＵＴ＆ＲＵＮプロセスにおけるより早い段階における試料間変動の対照となり、これらの利点がＩＴＩＳに及ぶからである。Ｅ．ｃｏｌｉゲノムは、ＣＵＴ＆ＲＵＮスパイクインに使用される酵母またはショウジョウバエゲノムより単純であり、反復配列マスキングを必要とせず、それは、全ての真核生物にとって異種であるので、事実上、全てのＩＴＩＳ適用に十分なものであるはずである。

本発明者らは、ＲＮＡＰＩＩ−Ｓｅｒ５データセットを使用してＩＴＩＳを検証した。ＲＮＡＰＩＩは、ＰＲＯ−ｓｅｑを使用してＫ５６２細胞においてプロファイリングされており、このＰＲＯ−ｓｅｑは、ＲＮＡＰＩＩの活性部位における新生鎖をマッピングする、転写ランオン方法であり、そのため、ＣｈＩＰ−ｓｅｑ、ＣＵＴ＆ＲＵＮおよびＩＴＩＳなどのクロマチンに基づく方法とは次元を異にする。デフォルトパラメータでＭＡＣＳ２を用いてｐＡ−Ｔｎ５データセットとｐＡ−３ＸＦＬＡＧ−Ｔｎ５データセットの両方（図６４、ＰｏｌＩＩＩＳ５）についてピークをコールし、各々約１７，５００ピークを得た。ヒトＫ５６２細胞についての処理済みＰＲＯ−ｓｅｑデータセット（ＳＲＡＧＳＭ１４８０３２７）をピークコールにアラインメントした。ＩＴＩＳＭＡＣＳ２スコアにより順序付けすると、ＰＲＯ−ｓｅｑ占有量とＰｏｌＩＩ−Ｓｅｒ５ＩＴＳスコアとの間の密接な対応が見られ、ここで、青色のヒートマップ値は、各々のピークコールの３’側のＰＲＯ−ｓｅｑ占有量を表し、黄色の値は、５’側のＰＲＯ−ｓｅｑ占有量を表す（図７１）。これは、ＰｏｌＩＩ−Ｓｅｒ５ＩＴＩＳが、いずれの外部アノテーションを参照する必要なくＲＮＡＰＩＩの初期形態をマッピングすることができることの直接的確証を与える。非常に類似したＰＲＯ−ｓｅｑヒートマップが、両方の形態のｐＡ−Ｔｎ５に対するピークコールから生成される。本発明者らは、ＩＴＩＳがＲＮＡＰＩＩの正確なマップを提供すると結論付ける。

ＩＴＩＳをエピゲノム成分により一般的に使用することができるかどうかを判定するために、およびそのプロトコールをハイスループットに適応させるために、本発明者らは、反応物の体積を半減させ、収集して透過処理したＫ５６２ヒト胚性幹細胞とＨ１ヒト胚性幹細胞の両方について各々２つのバッチを９６ウェルマイクロタイタープレートの個々のウェルに分注した。各々の試料に、本発明者らは、合計９６試料に対して一連の２０の抗体のうちの１つを１：５０濃度で添加した。４℃で一晩のインキュベーション後、ＩＴＩＳをそのプレートで行い、Ａｍｐｕｒｅビーズを添加し、溶出液を、９６の異なるバーコードを使用する１４サイクルで増幅し、その後、プールした。Ｔａｐｅｓｔａｉｏｎ分析に基づくサイズ分布、およびＱｕｂｉｔ読み込みに基づく濃度を使用して、おおよそ等モル量の９６全ての試料を混合し、単一２レーンフローセルでシーケンシングした。本発明者らは、平均で約３，０００，０００のペアードエンドリードをヒトゲノムにマッピングした。相関行列分析のために階層的クラスタリングを使用して、本発明者らは、Ｋ５６２細胞とＨ１細胞の両方についての全ての生物学的反復実験が例外なく一緒にクラスターを形成することを見出した（図７２）。そのような卓越した再現性は、ＩＴＩＳのロバストネスを確証する一方で、ヒストン修飾（Ｈ３Ｋ４ｍｅ１〜ｍｅ３、Ｋ２７ａｃおよびｍｅ３）およびバリアント（Ｈ２Ａ．Ｚ）、転写因子（ＣＴＣＦ、ＭｙｃＳｏｘ２、Ｏｃｔ４およびＮＰＡＴ）ならびにクロマチン関連複合体（ＰｏｌＩＩ、Ｍｅｄ１、Ｓｕｚ１２およびＲｉｎｇ１Ｂ）についてのものを含む、多種多様なエピトープにＩＴＩＳが好適であることを実証する。

まとめると、本発明者らは、繋留された酵素の抗体標的化と、生細胞からすぐにシーケンシングできるライブラリーまで１日しか必要としないタグメンテーションとを併用する新規方法を説明した。ＩＴＩＳは、ＲＮＡＰＩＩのプロファイリングに関して本発明者らのＣＵＴ＆ＲＵＮ方法より優れており、ヒストンおよびＣＴＣＦ転写因子のプロファイリングに関しては同様の結果を達成する。ＩＴＩＳのワークフローは、ＣＵＴ＆ＲＵＮと似ているが、より簡易であるので、ハイスループットに、ならびに組織および腫瘍試料への応用に容易に適応させることができる^２１。さらに、ＩＴＩＳは、単一細胞ＣｈＩＴ／ＡＴＡＣ−ｓｅｑを含む、単一細胞ＡＴＡＣ−ｓｅｑに適用した同じプロトコール^{１８、２２〜２５}に従って単一細胞応用に容易に適応可能である。ＩＴＩＳは、ベンチトップ、ハイスループットパイプライン、およびゆくゆくは診療所用の、クロマチンランドスケープの特定の成分をプロファイリングするための最初の方法として、ＣｈＩＰ−ｓｅｑの代替となる可能性がある。

実施例１０のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）

1. Zentner, G.E. & Henikoff, S. High-resolution digital profiling of the epigenome. Nat Rev Genet 15, 814-27 (2014).

2. Policastro, R.A. & Zentner, G.E. Enzymatic methods for genome-wide profiling of protein binding sites. Brief Funct Genomics 17, 138-145 (2018).

3. Rhee, H.S. & Pugh, B.F. Comprehensive genome-wide protein-DNA interactions detected at single-nucleotide resolution. Cell 147, 1408-19 (2011).

4. Skene, P.J. & Henikoff, S. A simple method for generating high-resolution maps of genome wide protein binding. eLife 4, e09225 (2015).

5. Kasinathan, S., Orsi, G.A., Zentner, G.E., Ahmad, K. & Henikoff, S. High-resolution mapping of transcription factor binding sites on native chromatin. Nature Methods 11, 203-9 (2014).

6. Teytelman, L., Thurtle, D.M., Rine, J. & van Oudenaarden, A. Highly expressed loci are vulnerable to misleading ChIP localization of multiple unrelated proteins. Proc Natl Acad Sci U S A 110, 18602-7 (2013).

7. Zentner, G.E., Kasinathan, S., Xin, B., Rohs, R. & Henikoff, S. ChEC-seq kinetics discriminate transcription factor binding sites by DNA sequence and shape in vivo. Nature Communications 6, 8733 (2015).

8. Park, D., Lee, Y., Bhupindersingh, G. & Iyer, V.R. Widespread misinterpretable ChIP-seq bias in yeast. PLoS One 8, e83506 (2013).

9. Venkataraman, A. et al. A toolbox of immunoprecipitation-grade monoclonal antibodies to human transcription factors. Nat Methods (2018).

10. van Steensel, B., Delrow, J. & Henikoff, S. Chromatin profiling using targeted DNA adenine methyltransferase. Nature Genetics 27, 304-308 (2001).

11. Skene, P.J. & Henikoff, S. An efficient targeted nuclease strategy for high-resolution mapping of DNA binding sites. Elife 6, e21856 (2017).

12. Skene, P.J., Henikoff, J.G. & Henikoff, S. Targeted in situ genome-wide profiling with high efficiency for low cell numbers. Nat Protoc 13, 1006-1019 (2018).

13. Schmid, M., Durussel, T. & Laemmli, U.K. ChIC and ChEC; genomic mapping of chromatin proteins. Mol Cell 16, 147-57 (2004).

14. Hainer, S.J., Boskovic, A., Rando, O.J. & Fazzio, T.G. Profiling of pluripotency factors in individual stem cells and early embryos. bioRxiv (2018).

15. Reznikoff, W.S. Tn5 as a model for understanding DNA transposition. Mol Microbiol 47, 1199-206 (2003).

16. Picelli, S. et al. Tn5 transposase and tagmentation procedures for massively scaled sequencing projects. Genome Res 24, 2033-40 (2014).

17. Buenrostro, J.D., Giresi, P.G., Zaba, L.C., Chang, H.Y. & Greenleaf, W.J. Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin, DNA-binding proteins and nucleosome position. Nat Methods 10, 1213-8 (2013).

18. Buenrostro, J.D. et al. Single-cell chromatin accessibility reveals principles of regulatory variation. Nature 523, 486-90 (2015).

19. Zaborowska, J., Egloff, S. & Murphy, S. The pol II CTD: new twists in the tail. Nat Struct Mol Biol 23, 771-7 (2016).

20. Chen, K. et al. The Overlooked Fact: Fundamental Need for Spike-In Control for Virtually All Genome-Wide Analyses. Mol Cell Biol 36, 662-7 (2015).

21. Janssens, D.H. et al. Automated in situ profiling of chromatin modifications resolves cell types and gene regulatory programs. biorxiv doi.org/10.1101/41868 (2018).

22. Corces, M.R. et al. Lineage-specific and single-cell chromatin accessibility charts human hematopoiesis and leukemia evolution. Nat Genet 48, 1193-203 (2016).

23. Buenrostro, J.D. et al. Integrated Single-Cell Analysis Maps the Continuous Regulatory Landscape of Human Hematopoietic Differentiation. Cell 173, 1535-1548 e16 (2018).

24. Mezger, A. et al. High-throughput chromatin accessibility profiling at single-cell resolution. Nat Commun 9, 3647 (2018).

25. Cusanovich, D.A. et al. The cis-regulatory dynamics of embryonic development at single-cell resolution. Nature 555, 538-542 (2018).

（実施例１１）
免疫標的化挿入シーケンシングでの少細胞および単一細胞エピゲノムプロファイリング

ＣｈＩＰ−ｓｅｑの大きな制約は、それが、数千未満の細胞を必要とする応用にはあまりにも非効率的であることである（Brind'Amour et al., 2015）。本発明者らは、ＣＵＴ＆ＲＵＮが、データ品質の低下を伴うことなく１００ほども少ない細胞に好適であることを示した（Skene et al., 2018）。ＩＴＩＳを用いる本発明者らの実験の大部分において、本発明者らは、５０，０００〜５００，０００のヒトＫ５６２またはＨ１ＥＳ細胞を使用してきた。ＩＴＩＳを少ない細胞数に適用することもできるかどうかを判定するために、本発明者らは、下は２０細胞に至るまでＫ５６２細胞を段階希釈し、本発明者らの標準プロトコールに従って１４サイクルを使用してＨ３Ｋ２７ｍｅ３およびＲＮＡＰＩＩ−Ｓｅｒ２＋５についてＩＴＩＳを行った。Ｔａｐｅｓｔａｉｏｎ分析に基づいて、本発明者らは、線形回収率（対数スケールで）をＨ３Ｋ２７ｍｅ３について下は２０細胞に至るまでおよびＲＮＡＰＩＩについて下は６０細胞に至るまで観察した（図７３）。したがって、ＩＴＩＳは、少ない細胞数を必要とする応用に使用することができる。

本発明者らは、試料をシーケンシングし、ヒトの数およびＥ．ｃｏｌｉ断片の数をプロットした（図７４）。本発明者らは、細胞数と放出される断片数の間に、最低細胞数（２０〜２００細胞）についてほぼ直線の、単調な関係（Ｒ^２＝０．４６）を観察する。本発明者らはまた、ヒトの数とＥ．ｃｏｌｉ断片の数の間に反比例関係を観察する。これは、Ｅ．ｃｏｌｉ混入が、本発明者らがＣＵＴ＆ＲＵＮについて観察したのに類似した、下は少ない細胞数に至るまでＩＴＩＳのスパイクインプロキシとして役立ち得ることを確証する。

少ない細胞数のＨ２７ｍｅ３ＩＴＩＳプロファイルを調査し、ＣＵＴ＆ＲＵＮプロファイルと比較したとき、本発明者らは、下は２００細胞に至るまでデータ品質の低下を観察せず、６０細胞についてはシグナル対ノイズ比のほんのわずかな低下しか観察しなかったが、それにもかかわらず、１００細胞を用いてＣＵＴ＆ＲＵＮについて得られたのより良好であることを観察した（図７５）。本発明者らは、ＩＴＩＳは、少ない細胞数に好適であると結論付ける。

細胞型の区別などのいくつかの応用は、単一細胞を必要とし、この場合、断片の希薄さにより、畳み込みを解くために十分な情報を提供するために数百〜数千の個々の単一細胞ライブラリーが必要となる（Buenrostro et al., 2015；Cusanovich et al., 2018；Rosenberg et al., 2018）。単一細胞への応用のために、本発明者らは、最近ＡＴＡＣ−ｓｅｑを適用してＴａｋａｒａＩＣＥＬＬ８システムでＩＴＩＳを評価した（Mezger et al., 2018）。ＩＣＥＬＬ８は、個々の細胞を単一ウェルに選別するディスペンサーを含む、７２×７２アレイのナノウェルを使用する。ナノディスペンサーは、単一細胞をウェルのサブセット内にのみ堆積させ、他のものは、細胞を獲得しないか、または複数の細胞を獲得する。したがって、ＩＣＥＬＬ８は、蛍光顕微鏡を使用してアレイをイメージングし、単一細胞を有するウェルを認識し、単一細胞を有するウェルのみに試薬およびプライマーを分注する。ＩＣＥＬＬ８は、細胞がタグメンテーションステップを通して無傷のままであることからＩＴＩＳと適合性であるため、ｉｎｓｉｔｕタグメンテーションによってアダプターを挿入した後に分注することができる。これに続いて、水平および垂直にそれぞれ整列させた７２ｉ７および７２ｉ５バーコードプライマーで増幅させて、シングルナノウェルから、それらの内容物がペアードエンドシーケンシング中に各々の末端から読み取られる多重化ｉ７およびｉ５インラインバーコードを使用するシーケンシングのために組み合わせられた後、得られるＤＮＡ断片を区別する。

単一細胞ＩＴＩＳは、タグメンテーション後にＰＣＲ増幅しか必要としないので、他のプラットフォームに容易に適応される。ＡＴＡＣ−ｓｅｑは、細胞選別（Buenrostro et al., 2015）およびＩＣＥＬＬ８ナノ分注（Mezger et al., 2018）による分注を使用して実行されており、原則的に、液滴カプセル化（Zheng et al., 2017）に直接適応させることができる。本発明者らは、ＩＣＥＬＬ８について概要を述べたのと同じステップを使用して、これらおよび他の単一細胞プラットフォームに同様にコンビナトリアルバーコード化を含むＩＴＩＳを適応させることができると予測する。

各々の細胞を較正するために、本発明者らは、抗体により特異的に結合される部位とスーパーインポーズする超高感受性部位を得るために塩処置を省く。塩処置の非存在は、混入Ｅ．ｃｏｌｉＤＮＡの高いタグメンテーションレベルも生じさせる結果となる。超高感受性部位断片の総数の、Ｅ．ｃｏｌｉ断片の総数に対する比を利用することにより、本発明者らは、倍数性を推測することができる。超高感受性部位が倍数性部位でスケーリングされる一方で、Ｅ．ｃｏｌｉ断片が細胞成分でスケーリングされるからである。この倍数性較正は細胞周期ステージおよびＳ期進行の情報を与える。Ｇ２は、Ｇ１の２倍の比を有し、Ｓ期は、細胞が収集された時点でのその特定の細胞においてゲノムがどの程度複製されているのか依存してそれらの間となるからである。超高感受性部位断片カウントは、抗体標的化ＩＴＩＳ部位も較正する。両方とも細胞倍数性でスケーリングされるからである。このように、別様に望ましくないタグメンテ−ションされた断片を除去しないことにより、本発明者らは、単一細胞プロファイリング力を向上させることができる有用な細胞特異的情報を得ることができる。

ＩＴＩＳの単一細胞への適応は、抗体の多重化を可能にし、バルク集団にも適用可能である。例えば、ＲＮＡＰＩＩおよびＨ３Ｋ２７アセチル化のための抗体に関する多重化によって、ＲＮＡ−ｓｅｑおよびＡＴＡＣ−ｓｅｑを使用して達成されたもの（Cusanovich et al., 2018）に類似した、単一細胞におけるプロモーターおよびエンハンサーに関する情報が得られることになる。マルチＩＴＩＳについての組合せの可能性は、異なるエピゲノムの特徴に対する抗体の入手可能性によってのみ制限され、これに対して、各々のマルチＯＭＩＣ法は、単一の特徴ペア専用である。さらに、マルチＩＴＩＳには、「マルチＯＭＩＣ」戦略に必要とされる完全に異なる２つの基質を使用する不均一性に起因する固有の複雑さなしに同じゲノムリードアウトが得られるという利点がある。多重化戦略の例は、１）初代ウサギ抗体；２）モルモット抗ウサギ二次抗体および洗浄液；３）１つのアダプターセットと複合体化したｐＡ−Ｔｎ５および洗浄液；４）初代マウス抗体；５）ウサギ抗マウス二次抗体および洗浄液；６）第２のアダプターセットと複合体化したｐＡ−Ｔｎ５および洗浄液の逐次的添加であり、ここで、第１のｐＡ−Ｔｎ５での飽和は、ウサギ一次抗体およびモルモット二次ＩｇＧエピトープを吸蔵し、ｐＡ−Ｔｎ５が結合するために利用可能なウサギ抗マウス二次ＩｇＧのみが残る。タグメンテ−ションを通常はＭｇ^＋＋の添加によって行い、細胞を別々のプラットフォーム用にナノ分注または調製する。ステップ１〜３は、本発明者らの現行のプロトコールと同一であり、ステップ４〜６は、異なるＩｇＧ分子を使用することを除いてステップ１〜３と同一である。したがって、それを、ＩＴＩＳおよびＣＵＴ＆ＲＵＮに既に使用した材料（モルモット抗ウサギおよびウサギ抗マウス二次抗体）を用いて行うことができる。原則的には、この手順を、ストレプトアビジン／ビオチンなどの、他の親和性システムに適応させることができ、これによってさらなる多重化が可能になる。

多重化戦略の例は、抗体＋ｐＡ−Ｔｎ５＋インデックス付きアダプター複合体を調製すること、およびこれらの複合体の標的への結合と標的特異的インデックスでのタグメンテーションの逐次的ラウンドを行うことであり、その結果、各々の標的は、一意的バーコードによって標識されることになる。モザイクエンドとシーケンサーアダプターの間へのバーコード配列の挿入は、第１の一次抗体を第２のものと区別するのに十分であろう。所望の数の異なるエピトープを標的化した後、細胞を別のプラットフォーム用にナノ分注または調製する。

ＩＴＩＳの別の特有の応用は、同じＤＮＡ上の２つの異なるタンパク質またはヒストン修飾の相互作用または極近接性を検出することができる。上で説明したように、抗体＋ｐＡ−Ｔｎ５＋インデックス付きアダプターの複合体、またはより単純な抗体Ａ＋ｐＡ−Ｔｎ５＋Ｐ５アダプターもしくは抗体Ｂ＋ｐＡ−Ｔｎ５＋Ｐ７アダプター複合体をｉｎｖｉｔｒｏで作製し、これらの複合体を、透過処理された無傷細胞に逐次的に導入することができる。アダプター交換を回避するために、第２の複合体を、第１のタグメンテーションが完了した後に導入することとなる。Ｐ５アダプターとＰ７アダプターを各々の末端に有する断片のみをライブラリー調製中に増幅させることができ、そのため両方のタンパク質を有するＤＮＡ分子がライブラリー内に濃縮されることになる。このアプローチは、ＤＮＡ上の２つの標的タンパク質の相対的方向性に関する情報も提供することとなる。このアプローチの可能性のある応用としては、Ｈ３Ｋ２７ｍｅ３ヒストンマークとＨ３Ｋ４ｍｅ３ヒストンマークの両方を有する二価ヌクレオソーム、パイオニア転写因子および協同転写因子などが挙げられる。

また、Ｔｎ５は、ＤＮＡをタグメンテーションする能力ばかりでなく、幅広いサイズ範囲のＤＮＡ挿入物を挿入する能力も有する。したがって、それをクロマチンの一体性を保存することを望む応用およびＤＮＡの断片化を防止する必要がある応用に使用することができる。

実施例１１のための参考文献（これらの各々は、その全体が参照により本明細書に組み込まれる）

Brind'Amour, J., Liu, S., Hudson, M., Chen, C., Karimi, M.M., and Lorincz, M.C. (2015). An ultra-low-input native ChIP-seq protocol for genome-wide profiling of rare cell populations. Nat Commun 6, 6033.

Buenrostro, J.D., Wu, B., Litzenburger, U.M., Ruff, D., Gonzales, M.L., Snyder, M.P., Chang, H.Y., and Greenleaf, W.J. (2015). Single-cell chromatin accessibility reveals principles of regulatory variation. Nature 523, 486-490.

Cusanovich, D.A., Reddington, J.P., Garfield, D.A., Daza, R.M., Aghamirzaie, D., Marco-Ferreres, R., Pliner, H.A., Christiansen, L., Qiu, X., Steemers, F.J., et al. (2018). The cis-regulatory dynamics of embryonic development at single-cell resolution. Nature 555, 538-542.

Mezger, A., Klemm, S., Mann, I., Brower, K., Mir, A., Bostick, M., Farmer, A., Fordyce, P., Linnarsson, S., and Greenleaf, W. (2018). High-throughput chromatin accessibility profiling at single-cell resolution. Nat Commun 9, 3647.

Rosenberg, A.B., Roco, C.M., Muscat, R.A., Kuchina, A., Sample, P., Yao, Z., Graybuck, L.T., Peeler, D.J., Mukherjee, S., Chen, W., et al. (2018). Single-cell profiling of the developing mouse brain and spinal cord with split-pool barcoding. Science 360, 176-182.

Skene, P.J., Henikoff, J.G., and Henikoff, S. (2018). Targeted in situ genome-wide profiling with high efficiency for low cell numbers. Nat Protoc 13, 1006-1019.

Zheng, G.X., Terry, J.M., Belgrader, P., Ryvkin, P., Bent, Z.W., Wilson, R., Ziraldo, S.B., Wheeler, T.D., McDermott, G.P., Zhu, J., et al. (2017). Massively parallel digital transcriptional profiling of single cells. Nat Commun 8, 14049.

ある特定の実施形態を本明細書で例証し、説明したが、同じ目的を達成するために計画される多種多様な代替および／または均等実施形態またはインプリメンテーションを、示した実施形態の代わりに、本範囲を逸脱することなく使用することができることは、当業者には理解されるであろう。実施形態を非常に多種多様な方法で実行することができることは、当業者には容易に理解されるであろう。本出願は、本明細書で論じる実施形態のあらゆる適応形態および変形形態を包含することを意図している。したがって、実施形態は、特許請求の範囲およびその均等物によってのみ限定されることを明らかに意図したものである。

Claims

透過処理された細胞と、目的のクロマチン関連因子に特異的に結合する一次抗体とを接触させるステップであって、前記一次抗体は複数のトランスポソームにカップリングされており、前記複数のトランスポソームのそれぞれは、
少なくとも１種のトランスポザーゼ；ならびに
第１のトランスポザーゼ認識部位を含む第１のＤＮＡ分子；および
第２のトランスポザーゼ認識部位を含む第２のＤＮＡ分子
を含むトランスポゾンを含む、ステップと；
前記トランスポザーゼを活性化し、それによって、前記目的のクロマチン関連因子に結合しているＤＮＡの配列を切り出し、およびＤＮＡタグでタグ付けするステップであって、前記少なくとも１種のトランスポザーゼは、クロマチンＤＮＡに前記第１および第２のＤＮＡ分子を組み込み、それによって、クロマチンＤＮＡを切断し、ならびに前記第１および第２のＤＮＡ分子でタグ付けする、ステップと；
前記切り出されたＤＮＡを単離するステップと；
前記切り出されたＤＮＡの配列を決定し、それによって、前記細胞内のＤＮＡの１つまたは複数の配列への目的のクロマチン関連因子の結合をマッピングするステップと
を含む、細胞内のＤＮＡ配列への目的のクロマチン関連因子の結合部位を決定するためのｉｎｓｉｔｕの方法。
前記抗体が、前記少なくとも１種のトランスポザーゼに間接的にカップリングされている、請求項１に記載の方法。
前記トランスポザーゼが、前記一次抗体に特異的に結合する特異的結合剤に連結されている、請求項２に記載の方法。
前記細胞と、前記一次抗体に特異的に結合する二次抗体とを接触させるステップであって、前記トランスポザーゼは、前記二次抗体に特異的に結合する特異的結合剤に連結されている、ステップ
をさらに含む、請求項１に記載の方法。
前記細胞と、前記一次抗体に特異的に結合する二次抗体とを接触させるステップと；
前記細胞と、前記二次抗体に特異的に結合する三次抗体とを接触させるステップであって、
前記トランスポザーゼは、前記三次抗体に特異的に結合する特異的結合剤に連結されている、ステップと
をさらに含む、請求項１に記載の方法。
前記特異的結合剤が、プロテインＡもしくはプロテインＧ、または前記一次抗体、前記二次抗体、および／もしくは前記三次抗体に特異的に結合する三次抗体を含む、請求項３から５のいずれか一項に記載の方法。
クロマチンＤＮＡの配列への前記目的のクロマチン関連因子の結合が直接的である、請求項１に記載の方法。
前記目的のクロマチン関連因子が転写因子である、請求項１から７のいずれか一項に記載の方法。
前記細胞が固体表面に固定化されている、請求項１から８のいずれか一項に記載の方法。
前記固体表面が、ビーズ、またはマイクロタイタープレートの壁を構成する、請求項９に記載の方法。
前記第１および／または第２のＤＮＡ分子がバーコードをさらに含む、請求項１から１０のいずれか一項に記載の方法。
前記第１および／または第２のＤＮＡ分子がシーケンシングアダプターをさらに含む、請求項１から１１のいずれか一項に記載の方法。
前記第１および／または第２のＤＮＡ分子がユニバーサルプライミング部位をさらに含む、請求項１から１２のいずれか一項に記載の方法。
前記少なくとも１種のトランスポザーゼがＴｎ５トランスポザーゼを含む、請求項１から１３のいずれか一項に記載の方法。
前記少なくとも１種のトランスポザーゼがＭｕトランスポザーゼを含む、請求項１から１３のいずれか一項に記載の方法。
前記少なくとも１種のトランスポザーゼがＩＳ５またはＩＳ９１トランスポザーゼを含む、請求項１から１３のいずれか一項に記載の方法。
前記少なくとも１種のトランスポソームが少なくとも２つの異なるトランスポソームを含み、前記異なるトランスポソームは、前記クロマチンＤＮＡに異なるＤＮＡ配列を組み込む、請求項１から１３のいずれか一項に記載の方法。
産生されたＤＮＡ断片を単離するステップをさらに含む、請求項１から１７のいずれか一項に記載の方法。
単離された核酸断片を分析するステップをさらに含む、請求項１８に記載の方法。
前記単離された核酸断片を分析するステップが、ヌクレオチド配列を決定するステップを含む、請求項１９に記載の方法。
前記ヌクレオチド配列が、増幅の有無にかかわらず、シーケンシングまたはハイブリダイゼーション技法を使用して決定される、請求項２０に記載の方法。
前記細胞が原核細胞である、請求項１から２１のいずれか一項に記載の方法。
細胞が真核細胞である、請求項１から２１のいずれか一項に記載の方法。
前記細胞がヒト細胞である、請求項２３に記載の方法。
前記細胞および／または前記細胞の核を、前記細胞とジギトニンとを接触させることによって透過処理する、請求項１から２４のいずれか一項に記載の方法。
前記切り出されたＤＮＡを塩分画に供するステップをさらに含む、請求項１から２５のいずれか一項に記載の方法。
前記目的のクロマチン関連因子と会合した１つまたは複数のタンパク質の素性を判定するステップをさらに含む、請求項１から２６のいずれか一項に記載の方法。
少なくとも１つのトランスポソームのごく一部が既知の量の混入ＤＮＡを含み、前記混入ＤＮＡは較正に使用され得る、請求項１から２７のいずれか一項に記載の方法。
請求項１から２８のいずれか一項に記載の方法を含む、切り出されたクロマチンＤＮＡのライブラリーを調製するための方法。
架橋されていない透過処理された細胞と、目的のクロマチン関連因子を特異的に認識する特異的結合剤とを接触させるステップであって、前記特異的結合剤は、不活性状態にあるヌクレアーゼまたはトランスポザーゼに連結されている、ステップと；
前記ヌクレアーゼまたはトランスポザーゼを活性化し、それによって、前記目的のクロマチン関連因子に結合しているＤＮＡを切り出すステップと；
前記細胞から拡散する前記切り出されたＤＮＡを単離するステップと；
前記切り出されたＤＮＡの配列を決定し、それによって、前記細胞内のＤＮＡの配列への目的のクロマチン関連因子の結合をマッピングするステップと
を含む、細胞内のクロマチンＤＮＡの配列への目的のクロマチン関連因子の結合を検出するための方法。
前記クロマチンＤＮＡの配列への前記目的のクロマチン関連因子の結合が間接的である、請求項３０に記載の方法。
前記クロマチンＤＮＡの配列への前記目的のクロマチン関連因子の結合が直接的である、請求項３０に記載の方法。
前記目的のクロマチン関連因子が転写因子である、請求項３０から３２のいずれか一項に記載の方法。
前記細胞が固体表面に固定化されている、請求項３０から３３のいずれか一項に記載の方法。
前記固体表面が、ビーズ、またはマイクロタイタープレートの壁を構成する、請求項３４に記載の方法。
前記切り出されたクロマチンＤＮＡを核酸タグでタグ付けするステップをさらに含む、請求項３０から３５のいずれか一項に記載の方法。
前記核酸タグがシーケンシングアダプターを含む、請求項３６に記載の方法。
前記核酸タグがバーコードを含む、請求項３６または３７に記載の方法。
前記核酸タグがユニバーサルプライミング部位を含む、請求項３６から３８のいずれか一項に記載の方法。
前記ヌクレアーゼが、活性化された場合、前記クロマチン関連因子の結合部位のいずれかの側でＤＮＡ配列を切断する、請求項３０から３９のいずれか一項に記載の方法。
前記ヌクレアーゼが２価カチオンの添加によって活性化可能である、請求項３０から４０のいずれか一項に記載の方法。
前記ヌクレアーゼがＭＮａｓｅである、請求項３０から４１のいずれか一項に記載の方法。
前記ヌクレアーゼがＣａ^２＋イオンによって活性化される、請求項３０から４２のいずれか一項に記載の方法。
前記ヌクレアーゼ活性がキレート剤の添加によってクエンチされる、請求項３０から４３のいずれか一項に記載の方法。
トランスポソームが、
少なくとも１種のトランスポザーゼ；ならびに
第１のトランスポザーゼ認識部位を含む第１のＤＮＡ分子；および
第２のトランスポザーゼ認識部位を含む第２のＤＮＡ分子
を含むトランスポゾンを含み、前記少なくとも１種のトランスポザーゼは、クロマチンＤＮＡに前記第１および第２のＤＮＡ分子を組み込み、それによって、クロマチンＤＮＡを切断し、ならびに前記第１および第２のＤＮＡ分子でタグ付けする、
請求項３０から３９のいずれか一項に記載の方法。
前記第１および／または第２のＤＮＡ分子がバーコードをさらに含む、請求項４５に記載の方法。
前記第１および／または第２のＤＮＡ分子がシーケンシングアダプターをさらに含む、請求項４５または４６に記載の方法。
前記第１および／または第２のＤＮＡ分子がユニバーサルプライミング部位をさらに含む、請求項４５から４７のいずれか一項に記載の方法。
前記少なくとも１種のトランスポザーゼが、Ｔｎ５トランスポザーゼ、Ｍｕトランスポザーゼ、ＩＳ５もしくはＩＳ９１トランスポザーゼ、またはそれらの組合せを含む、請求項４５から４８のいずれか一項に記載の方法。
前記特異的結合剤が抗体である、請求項３０から４９のいずれか一項に記載の方法。
産生されたＤＮＡ断片を単離するステップをさらに含む、請求項３０から５０のいずれか一項に記載の方法。
前記ＤＮＡ断片がサイズに基づいて単離される、請求項５１に記載の方法。
単離された核酸断片を分析するステップをさらに含む、請求項５２に記載の方法。
前記単離された核酸断片を分析するステップが、ヌクレオチド配列を決定するステップを含む、請求項５３に記載の方法。
前記ヌクレオチド配列が、増幅の有無にかかわらず、シーケンシングまたはハイブリダイゼーション技法を使用して決定される、請求項５４に記載の方法。
前記ヌクレアーゼまたは前記トランスポザーゼが融合タンパク質の一部である、請求項３０から５５のいずれか一項に記載の方法。
前記ヌクレアーゼまたは前記トランスポザーゼが、リンカーを用いて前記特異的結合剤に連結されている、請求項３０から５６のいずれか一項に記載の方法。
前記細胞が原核細胞である、請求項３０から５７のいずれか一項に記載の方法。
前記細胞が真核細胞である、請求項３０から５８のいずれか一項に記載の方法。
前記細胞がヒト細胞である、請求項５９に記載の方法。
前記細胞および／または前記細胞の核を、前記細胞とジギトニンとを接触させることによって透過処理する、請求項３０から６０のいずれか一項に記載の方法。
前記切り出されたＤＮＡを塩分画に供するステップをさらに含む、請求項３０から６１のいずれか一項に記載の方法。
上清をＣｈＩＰ−ｓｅｑに供するステップをさらに含む、請求項３０から６２のいずれか一項に記載の方法。
前記目的のクロマチン関連因子と会合した１つまたは複数のタンパク質の素性を判定するステップをさらに含む、請求項３０から６３のいずれか一項に記載の方法。
前記タンパク質の前記素性を決定するステップが抗体の使用を含む、請求項６４に記載の方法。
前記タンパク質の前記素性を決定するステップが質量分析を含む、請求項６５に記載の方法。
請求項３０から６６のいずれか一項に記載の方法を含む、切り出されたクロマチンＤＮＡのライブラリーを調製するための方法。