JP2017537640A - ゲノムアーキテクチャマッピング - Google Patents

ゲノムアーキテクチャマッピング Download PDF

Info

Publication number
JP2017537640A
JP2017537640A JP2017531604A JP2017531604A JP2017537640A JP 2017537640 A JP2017537640 A JP 2017537640A JP 2017531604 A JP2017531604 A JP 2017531604A JP 2017531604 A JP2017531604 A JP 2017531604A JP 2017537640 A JP2017537640 A JP 2017537640A
Authority
JP
Japan
Prior art keywords
loci
segregation
locus
genome
chromatin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017531604A
Other languages
English (en)
Other versions
JP6837970B2 (ja
Inventor
アナ・ポンボ
ポール・エドワーズ
マリオ・ニコデミ
アントニオ・シャルドーネ
ロバート・ビーグリー
Original Assignee
マックス−デルブリュック−ツェントルム フューア モレキュラーレ メディツィン イン デア ヘルムホルツ−ゲマインシャフト
マックス−デルブリュック−ツェントルム フューア モレキュラーレ メディツィン イン デア ヘルムホルツ−ゲマインシャフト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by マックス−デルブリュック−ツェントルム フューア モレキュラーレ メディツィン イン デア ヘルムホルツ−ゲマインシャフト, マックス−デルブリュック−ツェントルム フューア モレキュラーレ メディツィン イン デア ヘルムホルツ−ゲマインシャフト filed Critical マックス−デルブリュック−ツェントルム フューア モレキュラーレ メディツィン イン デア ヘルムホルツ−ゲマインシャフト
Publication of JP2017537640A publication Critical patent/JP2017537640A/ja
Application granted granted Critical
Publication of JP6837970B2 publication Critical patent/JP6837970B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Ecology (AREA)
  • Physiology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、ゲノムの三次元構造の解析の分野、すなわち、ゲノムアーキテクチャマッピング(GAM)に関する。本発明は、細胞核のような区画における複数の核酸座位の空間的近接を決定する方法であって、区画における局在化に応じて互いの核酸座位の分離により特定される、その区画の画分中の共分離を利用して、例えば、区画の凍結切片化または例えば凍結粉砕により、画分のコレクションを得て;該画分内の該複数の座位の存在または不存在を決定し;そして、該複数の座位の共分離を決定する、方法を提供する。次いで、共分離を、空間的近接を決定するための統計的方法で解析し得る。本方法を、例えば、複数の座位間の物理的距離の決定;および例えば、核における座位および/またはゲノムアーキテクチャのマッピング;空間的接触により特定の遺伝子の発現を支持する制御領域の特定;核における外来性核酸の核位置の特定および/または座位の共分離の乱れと関係する疾患の診断に使用できる。

Description

本発明は、ゲノムの三次元構造の解析の分野、すなわち、ゲノムアーキテクチャマッピング(GAM)に関する。本発明は、細胞核のような区画における複数の核酸座位の空間的近接を決定する方法であって、区画における局在化に応じて互いの核酸座位の分離により特定される、その区画の画分中の共分離(co-segregation)を利用して、例えば、区画の凍結切片化または例えば凍結粉砕により、画分のコレクションを得て;該画分内の該複数の座位の存在または不存在を決定し;そして、該複数の座位の共分離を決定する、方法を提供する。次いで、共分離を、空間的近接を決定するための統計的方法で解析し得る。本方法は、例えば、複数の座位間の物理的距離の決定;および例えば、核における座位および/またはゲノムアーキテクチャのマッピング;空間的接触により特定の遺伝子の発現を支持する制御領域の特定;核における外来性核酸の核内位置の特定;クロマチン凝縮の決定および/または座位の共分離の乱れと関係する疾患の診断に使用できる。
ゲノムおよびクロマチン相互作用の機構を解析するためにいくつかの試みがなされている。直線的ゲノム距離は、シークエンシング、例えばショットガン・シークエンシングによりしばしば解析される。ゲノムにおける局在配列での、特に、反復配列の場合の、問題は、例えば、HAPPYマッピングにより取り組むことができ、これは、無作為画分化およびゲノムDNA希釈後の座位共分離の頻度に基づき座位間の直線的ゲノム距離を測定し、約200kb直線距離まで機能する。
クロマチンの三次元構造に関する情報も、特に、制御領域と遺伝子プロモーターの接触を発見するために、極めて興味深い。遺伝子発現に影響する染色体相互作用の一例は、エンハンサーと転写因子を、遺伝子のすぐ近くにもってくるために折りたたまれ得る、染色体領域である。染色体の構造的性質および空間的構成の研究は、遺伝子発現、DNA複製および修復ならびに組換えの制御の理解および評価のために重要である。染色体の折りたたみおよびそれらの接触は、例えば、癌または先天性疾患における、疾患機構および治療アプローチのための標的の解明に重要な意味を有する。
クロマチンは、相互作用および非相互作用状態で存在する。相互作用状態は、相互作用に関与する結合部位の特徴、すなわち(a)それらの数、距離および分布、(b)それらの結合因子に係る特異性および親和性および(c)結合手の濃度および特異性により、種々の性質を有する。クロマチン相互作用は、同時に結合する種々の座位の数も関与し得る(相互作用の多重性)。
蛍光インサイチュハイブリダイゼーション(FISH)は、ゲノム座位間の空間的距離を直接的に測定するために顕微鏡法を使用するが、同じ核の少数のゲノム領域での同時検討にしか適用できない(例えば、Pombo A. 2003. Cellular genomics: which genes are transcribed when and where? Trends Biochem. Sci. 28, 6)。同じ細胞または組織切片を異なるプローブセットで再プローブすることは理論的には可能であるが、例えば座位の人工的凝集(接触)(すなわち相対的なおよび核目印、例えば核ラミナに対するサブゲノム領域再配置)を誘発する、例えばプローブの後のセットを解離するために必要なDNA変性により、反復再プロービングが構造的アーチファクトを生じるとの懸念がある。より凝縮された(かつ予想されるように安定な)クロマチンを代表する中期染色体の場合、再プロービングは、最高6回反復できるが(Pauciullo A et al., 2014, Development of a sequential multicolor-FISH approach with 13 chromosome-specific painting probes for the rapid identification of river buffalo (Bubalus bubalis, 2n=50) chromosomes. J Appl Genet. 55(3):397-401)、染色体形態の分解に関する懸念は、2回目のプロービング後にすでに見られることがあり、これは、染色体または核の喪失に至り得る(Heslop-Harrison JS, Harrison GE, Leitch IJ (1992) Reprobing of DNA: DNA in situ hybridization preparations. Trends Genet 8: 372-373)。RNA−FISHは、DNA変性が関与しない穏やかなFISHアプローチであるが、活発に転写されている遺伝子(サイレント遺伝子ではない)の核位置の決定にしか使用できない。機能的クロマチン接触が最もしばしばマップされる細胞周期の静止期にある細胞からのサンプルは、構造の保持は詳細には検定されていないが、約3回しかRNA−FISHのために再プローブできない。DNA−またはRNA−FISHで同時に適用できるプローブ数は、識別可能な蛍光マーカーにより限定され、例えば原則として5つの色、4つの色彩比および異なる2つの色強度レベルの組み合わせにより181バーコードを得ることが可能である(Pombo A. 2003. Cellular genomics: which genes are transcribed when and where? Trends Biochem. Sci. 28, 6)。しかしながら、このアプローチ(蛍光色素多重化)は、解析する座位が、1プローブにおける蛍光色の組み合わせが、他の組み合わせと識別可能ではなく、それゆえに、空間的に近位である座位の特定に適さないほど空間的に近いときは、機能しない。さらに、各特定座位に対する標識プローブの必要性により、FISHは、目的の既知座位の相互作用の解析にしか使用できず、例えば、事前に、例えばウイルスサブタイプ組込み位置および外来性DNAの正確な配列が知られていない限り、内在性または外来性DNA配列の検出は機能しない。FISHはまた、直線的ゲノム構成の事前の推定によって混乱し、これは、例えばヒトサンプルにおいて、例えば生物集団におけるゲノム配列の自然変異の影響が主題であるとき、FISHが、事前のプローブ設計またはサンプルの事前のゲノム全体のシークエンシングと続くプローブ設計なしでは、コピー数変動またはゲノム再配列のような配列変動を本質的に検出しないため、クロマチン配置特性、例えばクロマチン接触の試験では許容されない。
INGRID(IN-Gel Replication of Interacting DNA segments; Gavrilov, A.A. et al., 2014 Quantitative analysis of genomic element interactions by molecular colony technique. Nucl. Acids Res. 42 (5):e36)と呼ばれる別のアプローチにおいて、架橋クロマチンフラグメントは、ポリアクリルアミドゲル層の広範囲にわたり広げられ、続いて、分離したおよび結合した要素は、それぞれ、選択DNAフラグメントのゲル内増幅中に産生された単および多成分分子コロニーの形で可視化され、これらは、分子ビーコンテクノロジーにより可視化される(Chetverin AB, Chetverina HV. Molecular colony technique: a new tool for biomedical research and clinical practice. Prog. Nucleic Acid Res. Mol. Biol. 2008;82:219-255)。このテクノロジーもまたゲノム構成の事前の知識に頼り、DNA配列変動、その空間的構成およびそれがゲノム全体の空間的構成にどのように影響するかを本質的に検出しない。
ゲノムの三次元構造を解析するための別の現在のアプローチは、主に染色体コンフォメーションキャプチャ(3C)技術に基づき、多くの現行版および改訂版がある(図4)。3Cベースの方法は、一般にゲノム接触に介在するタンパク質の弱い化学的架橋から出発する。クロマチン抽出後、DNAの架橋画分をDNA画分化のために制限酵素で処理する。続くリガーゼ添加が、DNAの2画分を接続(ライゲート)する。3Cの種々の異形が、このようなライゲーション事象の検出に種々の方法を使用しており、一般的な一つはシークエンシング(Hi−C、4C−seq)である。
これらのテクノロジーの限界は図4に記載され、文献で論じられている(例えば、Belmont A.S., 2014. Large scale chromatin organization: the good, the surprising, and the still perplexing. Curr Op Cell Biol 26, 69; O’Sullivan J.M. et al., 2013. The statistical-mechanics of chromosome conformation capture. Nucleus 4, 390; Williamson, I. et al. 2014. Spatial genome organization: contrasting views from chromosome conformation capture and fluorescence in situ hybridization. Genes Dev. 28, 2778-2791.)。
現時点で、不偏の方法でゲノムワイドな結合部位の特定は不可能であり、その結果、どの核成分が、染色体アーキテクチャの様々な側面を確立し、どれだけ長距離のクロマチン接触がゲノム安定性の維持を助け、ゲノム機能(例えば遺伝子発現)に影響するか理解していない。それゆえに、結合部位の特定および結合部位が互いに相互作用する頻度の決定が、現在の大きな課題である。
本発明者らは、核酸相互作用の検出のための画分化核酸のライゲーションに基づくバイアスを避け、数個の高多重性相互作用(各々2を超える座位が関与)、特に、2を超える相互作用の同時の解析を、ある態様において、ゲノム内の実質的に全ての核酸相互作用およびそれらの相互依存の同時解析を可能にする、改善された核酸の空間的近接を決定する方法の提供という課題に取り組んだ。この課題は、下記および特許請求の範囲に記載する本発明の方法により解決される。この方法を、ゲノムアーキテクチャマッピング(GAM)と呼ぶ。
本発明は、区画における複数の核酸座位の空間的近接を決定する方法であって、
(a)画分のコレクションを得るために、核酸をそれらの区画における局在化に応じて互いに分離し;
(b)該画分における複数の座位の存在または不存在を決定し;そして
(c)該複数の座位の共分離を決定する
ことを含む、方法を提供する。
座位(複数座位)は、遺伝子、DNA配列の特定の位置または染色体上の位置である(Wikipedia)。各染色体は多くの遺伝子を担持し、一倍体ヒトゲノムにおけるタンパク質コード化遺伝子は、23の異なる染色体上、20,000〜25,000と概算される。ある座位に位置する類似DNA配列のバリアントは、アレルと呼ばれる。本発明においては、核酸は、例えば、活発に転写されている遺伝子と他のゲノム領域の間の相互作用を解析する場合、DNAでもRNAでも両者の組み合わせでもよい。通常、DNAの共分離を、本発明の方法で解析する。座位の共分離は、真核細胞の核、ミトコンドリアまたは原核細胞のような、核酸を含むあらゆる細胞または臓器区画で解析され得る。通常、真核細胞の核における核酸座位、特に、DNA座位の共分離が解析される。本発明の方法は、それゆえに、分画された核における共分離の頻度の測定により、核における座位近接を解析するための解決を包含する。
区画が由来する細胞は、細菌、原生動物、植物細胞、真菌細胞または動物細胞、例えば、疾患または障害を有するもしくは障害を診断するための、患者(好ましくは、ヒト患者)または健常対象からの細胞のような哺乳動物細胞である。細胞は、例えば、腫瘍細胞または、例えば、ヒト組織の再プログラムにより産生された誘導多能性幹細胞のような幹細胞であり得る。このような細胞を使用して、有利にヒト発達障害または先天性疾患を研究するために、GAMを適用できる。細胞が胚性幹細胞であるならば、好ましくは、ヒト胚破壊を含む方法では産生されない。
哺乳動物は、好ましくはヒトであるが、大腸菌、酵母、シロイヌナズナ、線虫、アフリカツメガエル、ゼブラフィッシュ、キイロショウジョウバエ、マウス、ラットまたは霊長類のような他の生物のゲノムアーキテクチャを研究し、場合によっては、比較するのも有意義であり得る。
細胞は細胞培養に由来するかまたは生存生物または死亡した、すなわち、死後の生物の特定の組織からまたは実験生物全体(例えばキイロショウジョウバエ胚または線虫全体)からエクスビボで解析できる。解析に使用する細胞は、好ましくは、例えば、細胞周期が共通の期にあるようにまたは特定の発生系譜または細胞型(例えばヒト臓器の1生検の)に属する細胞のみを解析するように選択する。例えば、膵臓中、インスリン産生β細胞のみを解析し得る。このアプローチは(a)これらのアプローチが、目的の区画における核酸の配置を、その測定前に変えることができ、そして(b)下流解析で問題となり得る小数の細胞しか生じない(例えばサイズが限られた生検)ため、細胞周期の特定の期に細胞を同調させるか、特定の細胞型を捕捉するために例えば蛍光活性化細胞選別により細胞を選別するのが好ましい。同調化細胞または例えば蛍光活性化細胞選別により選別された細胞も本発明で使用できる。マーカーが、例えば、目的の細胞型または細胞分裂期で特異的に発現されるタンパク質に特異的な、若しくは、例えば目的の細胞型に特異的に発現される、特定の、例えばmRNAまたは他のRNAを検出する核酸プローブを用いるインサイチュハイブリダイゼーションにより検出される、抗体、または特定の遺伝子の発現または特定の期にの特徴を示すGFPのような蛍光マーカーが、細胞選択に役立つように使用できる。例えば、Pitx3転写因子のプロモーター制御下のGFP導入遺伝子を使用して、ドーパミン発現神経細胞をマークできる(Maxwell et al., 2005, Pitx3 regulates tyrosine hydroxylase expression in the substantia nigra and identifies a subgroup of mesencephalic dopaminergic progenitor neurons during mouse development, Dev. Biol., 282 (2): 467-479)。細胞を、例えば、座位の共分離または座位の配置に対する薬物の効果を試験するための薬剤で前処理できる。
核、細胞、組織または生物全体を、工程(a)実施前に好ましくは架橋剤で処理する。好ましくは、架橋剤はホルムアルデヒドまたはDNA抽出に適合性の他の安定化剤を含み得る。ホルムアルデヒドを、好ましくは、例えば、pH7.0〜8.0、好ましくは哺乳動物細胞のためにpH7.6〜7.8の250mM HEPES−NaOHの緩衝化溶液中、0.5〜8%、好ましくは、1〜8%、2〜8%または最も好ましくは、4〜8%(全てw/w)の濃度で、10分〜24時間、好ましくは4%で10分、続いて8%で2時間、使用する。例えば、実験生物の場合、組織全体を、HEPES緩衝化ホルムアルデヒド溶液(例えば、4%)で、好ましくは少なくとも30分かん流することにより架橋し、続いて氷冷4%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液で30分〜1時間、続いて氷冷8%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液で1〜3時間、組織解体(dissection)する(Moeller et al., 2012, Proteomic analysis of mitotic RNA polymerase II complexes reveals novel interactors and association with proteins dysfunctional in disease. Mol. Cell. Proteomics 11(6):M111.011767)。
懸濁液中の細胞(例えばヒト白血球、ショウジョウバエS2細胞または懸濁液中の他の単離細胞)の場合、細胞を遠心(例えば哺乳動物細胞について150〜300×g)により沈降させ、その後細胞沈渣(ペレット)を、例えば4%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液に再懸濁する。細胞を、遠心(例えば哺乳動物細胞について150〜300×g)により沈降させ、その後細胞ペレットを壊すことなく、上清をデカントした後、8%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液を添加する。細胞ペレットを、例えば1時間架橋させる。細胞ペレットを、遠心力を上げながら(例えば500×g、1000×g、2000×g、4000×g、8000×gおよびある細胞型では最大10000×gまで段階的に;各2分、最終工程5〜10分)、遠心することにより徐々に圧縮小型化する。上記のような8%濃縮固定液の総時間は、最大24時間、好ましくは約2時間である。運搬(例えば病院と臨床検査室の間)または短期保存(1時間〜1週間)のために、8%ホルムアルデヒド上清を最後の遠心で除き、細胞ペレットを壊すことなく、1%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液に置き換える。長時間の保存は推奨されないが、新鮮ホルムアルデヒド(例えば1%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液)の補充により短時間は可能である。表面に接着して増殖する細胞(例えばヒト皮膚線維芽細胞、ヒト筋肉細胞)の固定のために、細胞培養培地をデカントし、その後例えば4%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液ですすぎ、続いて例えば4%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液を新たに添加し、例えば10分インキュベーションする。固定液をデカントし、例えば8%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液に置き換える。好ましくは1時間後、細胞を穏やかに削り取り、チューブに集める。150〜300×gで遠心後、細胞ペレットを、懸濁液細胞について上記のように、力を上げながら遠心することにより小型化する。輸送または短期保存のために、固定細胞または組織を、例えば1%ホルムアルデヒドの250mM HEPES−NaOH pH7.6溶液中、理想的にはしばしば、例えば連日または隔日、新鮮溶液に置き換えて保存できる。固定液非存在下または新鮮固定液の補充無しでの保存は、ホルムアルデヒド架橋の逆転により、核酸位置または品質の構造的変質を生じ得る。
架橋剤は、タンパク質相互および核酸とタンパク質の連鎖を誘発する。本発明の方法は、現在の3Cベースの方法に適合性であるものより強い架橋条件を、それゆえに核構造の良好な保持を可能とする。核酸のシークエンシングが、核酸を細胞内構造の最適構造的保存に適合する架橋工程に付した後もなお可能であったことは、発明者らにとって驚きであった。本方法はまた、核の分画がガラス化細胞の切片化(例えばDubochet et al., 1988. Cryo-electron microscopy of vitrified specimens. Q. Rev. Biophys. 21: 129に記載のとおり)またはガラス化細胞の凍結粉砕(Oeffinger M, Wei KE, Rogers R, DeGrasse JA, Chait BT, Aitchison JD, Rout MP, 2007 Comprehensive analysis of diverse ribonucleoprotein complexes. Nat Methods. 4, 951-6; Hakhverdyan et al. 2015. Rapid, optimized interactomic screening. Nature Methods 12, 553)により可能であるために、理論上は架橋工程無しで可能である。いずれの場合も、細胞超微細構造保持のためのガラス化(すなわち急速凍結)の使用が、化学的架橋剤(例えばホルムアルデヒド)の適用により導入される可能性のある何らかのアーチファクトを避ける。例えば、化学的架橋剤、例えばホルムアルデヒドでの処理は、相対的におよび/または核目印、例えば核ラミナに対してサブゲノム領域の再配置をもたらし得るが、再配置のこの可能性はガラス化サンプルでは生じない。ガラス化を使用して構造的に保存されるこのような細胞または組織サンプルは、3Cベースの方法またはFISH法でアッセイできない。
工程(a)における、複数の画分を得るための、区画における局在化に応じて、核酸を互いに分離する方法は、区画の切片化、好ましくは、区画の凍結超薄切片化により実施する。切片化を含む本発明の方法は、sGAMとも称する。あるいは、分離を、凍結粉砕により実施できる(Oeffinger M, Wei KE, Rogers R, DeGrasse JA, Chait BT, Aitchison JD, Rout MP, 2007 Comprehensive analysis of diverse ribonucleoprotein complexes. Nat Methods. 4, 951-6; Hakhverdyan et al. 2015. Rapid, optimized interactomic screening. Nature Methods 12, 553)。
核凍結切片は、樹脂包埋なしで、例えば、Tokuyasu法(Tokuyasu, K. T., 1973, J. Cell Biol. 57, 551-65, A technique for ultracryotomy of cell suspensions and tissues.)により産生し、これは、0℃〜25℃の温度、好ましくは、室温(20〜25℃)で少なくとも約30分または少なくとも約2時間または少なくとも約1日または最大1週間または約4℃での、飽和スクロース溶液中の包埋を使用する固定組織の凍結保護を含み、例えば、2時間、室温または2時間、室温が、1日〜1週間までの約4℃での短期保存に続く。包埋に続いて、スクロース包埋細胞ペレットまたは組織または生物を、例えば、サンプルホルダーとして役立つ金属スタブに置き、その後液体窒素で凍結し、好ましくは−80〜−110℃で、組織によって、例えば、約−100℃で切片化する。わずかに改変された方法(Guillot PV, Xie SQ, Hollinshead M, Pombo A (2004) Fixation-induced redistribution of hyperphosphorylated RNA polymerase II in the nucleus of human cells. Exp. Cell Res. 295, 460-468; Pombo A, Hollinshead M, Cook PR (1999) Bridging the resolution gap: Imaging the same transcription factories in cryosections by light and electron microscopy. J. Histochem. Cytochem. 47, 471-480)が良好な結果を提供することが示されている。これらの方法は、非固定凍結切片で観察されるのと同等に細胞アーキテクチャを保存し、活性RNAポリメラーゼおよび核アーキテクチャの最適保存を提供する。Chen et al., 2014, Small 10:3267の方法を別法として使用できる。非固定切片は、例えば、Lucic V., et al., 2013. J. Cell Biol. 202 (3), 407に記載のように製造できる。
例えば、核の切片は、5〜15マイクロメートル直径の核について、約70nm〜約1000nm、好ましくは、150〜220nmまたは180〜200nmの厚さを有し得る。本発明者らは、例えば、確立されたプロトコールにより、マウス胚性幹(ES)細胞(mESC;9μm直径核を有する)を220nmの厚さに凍結切片化した(図5a、b)。固定細胞のためのスクロース媒体中の凍結切片化のための市販装置が利用可能である(例えば、Leica UltraCut UCT 52ウルトラクリオミクロトーム)。
切片作製により画分のコレクション、すなわち複数の画分が生じる。切片の最適な厚さは区画のサイズにより、これは、工程(a)において、下に詳細に説明するように、マウスまたはヒト細胞核(または類似のサイズを有する核)で適切であることが判明している、好ましくは5〜300画分、10〜100画分、より好ましくは、40〜60画分または約45〜50画分に分けられる。画分の厚さは解析全体で均一でなければならない。
本発明のある態様において、1区画の、特に、1核の全切片を本発明の方法で解析し、単一細胞のゲノムアーキテクチャの解析を可能とする。しかしながら、これは必要ではなく、解析画分は、目的の細胞の集団の全域にわたり、複数の区画、例えば、複数の核からサンプリングされ得る。本発明の方法を使用して、好ましくは、180を超える画分が解析され、例えば、約180〜約10000画分、好ましくは、約200〜5000、約220〜4000、約230〜3500、約250〜3000、300〜2000または500〜1000画分を解析でき、ここで、これらの画分は複数の細胞(または核酸含有細胞区画)から得てよい。
単一核プロファイル(NP)が、例えば、レーザーマイクロダイセクションにより、切片から単離される(図5c)。
工程(b)において、複数の座位の存在または不存在は、非顕微鏡的方法、例えば、シークエンシング、好ましくは、次世代シークエンシングにより決定し得る。例えば、単一細胞全ゲノム増幅(WGA)を使用し得る。好ましくは、画分における座位の核酸が、実質的にまたは完全に配列決定される。これは、本方法が、研究の場で種々の座位間の相互作用の可能性を検出するために実施されたときおよび使用する生理学的条件での目的の細胞型で“正常”共分離パターンがまだ確立されていないとき、特に興味深い。本発明の方法は、故に、未知および/または不特定座位での空間的近接(および結果として相互作用)の解析に使用され得る。
例えば、DNAのような核酸を画分から抽出し(例えば、単一核プロファイルから)、画分化し、単一細胞全ゲノム増幅(WGA)を使用して増幅する(図5d)。WGA増幅DNAを、例えば、Illumina HiSeqテクノロジーを使用して、配列決定し得る。単一NPからのトラックの目視検査は、薄い核切片のクロマチン出入りから予測されるとおり、各々が、亜染色体領域の異なる補体を含むことを示す(図2a)。さらに、各NPは、染色体の限定されたサブセットのみ含む。
しかしながら、特定の相互作用(共分離)の存在または不存在が以前に調査され、目的の相互作用座位がすでに知られている状況があるかもしれない。特に診断の現場において、相互作用座位の顕著な差異が、種々の患者群(例えば、健常対象と腫瘍または先天性疾患のような疾患を有する対象)で判明しているかもしれない。このような状況において、目的の2(またはそれを超える)座位の存在または不存在も、特定のPCRにより決定でき、または、例えば次世代シークエンシングのためのIDT標的捕捉(IDT, Coralville, Iowa, USA)により、目的の座位を網羅する核酸の選択後、例えば、サザンブロットまたはIllumina HiSeqテクノロジーにより、その存在にすいて他に特異的に確認できる。
sGAMは、ゆえに、好ましくは凍結超薄切片化とDNA検出(例えば全ゲノム増幅および次世代シークエンシングによる)を合わせる。薄凍結切片が個々の核全体にわたり切断されたら、核空間で互いに近い(しかし必ずしも直線的ゲノムでは近くない)座位は、遠い座位よりもより頻繁に同じ切片で見られる(すなわちより頻繁に共分離する、図1b)。次いで、ゲノム座位間の核距離を、個々の核にわたる切片の数から、座位の存在または不存在をスコア化することにより推測できる(図1c)。得られた表を使用して、他の全ての座位に対する各座位の共分離頻度を計算し(図1d)、座位間の推測相対距離のマトリクスを作成する。それゆえにGAMは、ゲノムワイドのクロマチン接触の計算を可能とする。
共分離を、空間的近接を決定するための統計的手法で解析し得る(例えばWeibel, E.R., 1979. Stereological Methods: Practical Methods for Biological Morphometry. Vol.1 Academic Press, London, UK; Weibel, E.R., 1980. Stereological Methods: Theoretical Foundations. Vol. 2. Academic Press, London, UK)。密接な空間的近接は、座位の特定の相互作用のサインであり得る。座位の特定の相互作用は、ゆえに、統計的手法を用いる共分離の解析により決定し得る。本発明の方法において使用する統計手法は、例えば、推測統計法であり得る。実施例で使用する統計的手法も本発明の方法に使用して、例えば、ここに記載するように、異なる起源のサンプルおよび/または異なる目的の座位についてサンプルを解析できる。
好ましくは、染色体上の直線的ゲノム距離から予測されるよりも高頻度で共分離されるとき、これらの座位は、互いに近位であるかまたは特異的に相互作用すると決定される。統計的手法は、例えば、診断用の設定において、クロマチンの特定の相互作用および一般的凝集および/または核体積の減少も区別できる。GAMを相対距離の決定に使用できる。絶対的距離は、相対距離を核のサイズと関連付けることにより計算できる。GAMを使用して、例えば球形区画における、目的の区画中の目的の座位放射状位置を評価でき、切片化は、多様性が大きなDNA座位を含む赤道切片および多様性が小さなDNA座位を含む頂点切片を生じ、ゆえに球形区画における座位の放射状位置は、検出する場所の切片における複雑なDNA座位から推測できる。DNA座位の放射状配置における変化は、例えばヒト疾患と関係する(例えばMaeburn K.J. et al. 2009 Disease-specific gene repositioning in breast cancer. J. Cell Biol. 187(6):801-12; Kubben N. et al. 2012. Mapping of lamin A- and progerin-interacting genome regions. Chromosoma 121(5): 447-64)。あるゲノム(直線状)距離でのゲノムの座位の全ての可能な対が考慮され、それらの核(3D)距離が測定されたら、相互作用しない座位の対は、2座位間のゲノム距離およびクロマチンの凝縮の程度により、およそ平均3D距離での分布が見られる。対照的に、相互作用対は、その特定の細胞型の核におけるゲノム距離の平均よりしばしば互いに近接していることが判明する。より複雑な議論も考慮されるが(下記参照)、相互作用は、非無作為行動への何らかの付加的寄与因子を考慮に入れながら、クロマチン線維の無作為配置からの逸脱として最も単純に定義できる。
GAMは、同一核プロファイルにおける2座位共分離の頻度を測定し、全ゲノム座位の共分離を同時に測定でき、(a)他のゲノム領域とより頻繁に相互作用するゲノム座標の特定だけでなく、(b)ある無作為(予測)行動を超える座位相互作用の可能性を計算する広範な数学的処理を受けやすい定量的情報を生じる。
座位の共分離のゲノムワイドなマップは特定の物理的相互作用ならびに無作為接触に起因し、これらは、座位間の直線的ゲノム距離に高度に依存し、また共分離頻度に影響する。GAMは、あるゲノム距離の座位の非無作為接触を予測無作為行動と区別する統計モデルを適用することにより、無作為レベルを有意に超える相互作用をする座位を特定する可能性を有する。これは、例えばSLICE計算プラットフォーム(StatisticaL Inference of locus Co-sEgregation;図11参照)により達成できる。SLICEは、無作為近接効果を、異なるクロマチン領域および染色体テリトリー位置で見られる異なる凝縮レベルのような他の効果と同様最大に考慮して、マトリクスと統計的に有意な直接相互作用を返す。SLICEはまた同時、三方向相互作用(トリプレット)、より一般に数座位間の多価接触の可能性を精査する。GAMパイプライン内のSLICE解析はまた、ウィンドウ分割および検出能の効果を考慮に入れて、ある閾値を超えるクロマチン相互作用の堅固な検出を達成するのに必要な理想的な切片厚およびチューブあたりの核プロファイルの最小数ならびにチューブ数のような目的の特定の適用下の費用および効率を最適化するための実験法の微調整に必要な対照パラメータの最適値の概算にも利用できる。
数学的には、最も単純なアプローチは、あるゲノム距離にある座位が、クロマチンが核内に均一に分布との仮説から計算される最大距離まで、3D空間中無作為に分布している無作為例を考慮することである。しかしながら、より高度な数学的計算はGAMおよびSLICEで完全に互換性であり、これは、例えば他の空間的パラメータを考慮に入れることができ、そのいくつかを実験的に測定できまたはGAMデータ自体から推測できる。例えば、染色体、亜染色体領域または単一座位が目的の核内で占める体積は、各その座位が核プロファイル(NP)において見られる頻度に比例する。
複数の座位は、同時に解析される、2以上の座位、所望により、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも15、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500または少なくとも1000座位および最大数百万または数十億座位を意味する。例えば、5kb分解能でのヒト細胞のアレル特異的解析は、130万座位の同時の解析を必要とする。一つの選択肢において、区画における実質的に全ての座位または全ての座位を、本発明の方法で、例えば、区画における実質的に全ての核酸、好ましくは、全DNAのシークエンシングにより解析する。解析する座位は、バイアスのある方法で(例えばヒト細胞における全23000タンパク質コード化遺伝子の選択により)または不偏の方法で、例えばゲノムを一定サイズのウィンドウ、例えば、100bp〜10Mbのウィンドウ、好ましくは、1kb〜1Mb、5kb〜50kbまたは10kb〜30kbウィンドウに分割することにより決定し得る。さらに、本発明の方法は、異なるアレルを区別しない(例えば正常ヒト細胞に存在する遺伝子の2相同コピー)方法で適用でき、あるいは、同一細胞の座位における2(または例えば多倍数体性両生類細胞の場合それより多い)アレルの区別に使用できる。
本発明の方法は、複数共分離座位、特に、2を超える共分離座位、好ましくは、3を超える、4を超える、8を超えるまたは20を超える、共分離座位の検出を可能とする。対照的に、3Cベースの方法を使用する複数相互作用の特定が試みられており、無効かつ高度のバイアスがあることが示されている(Sexton et al., 2012, Cell 148:458-72)。3Cベースの方法でのこれらの実験的限界は、徐々の改善に係わらず、克服できないままであることを示す数学的証拠がある(O’Sullivan J.M. et al., 2013, Nucleus 4:390-8)。特に、3Cベースの方法における相互作用の特定のための基盤としての画分化DNA分子 − 2末端しか有しない − の互いのライゲーションは、高次多重性相互作用の検出が、同時に相互作用する座位の数が、3相互作用座位を超えると、より困難になる現象を起こす。しかしながら、活性遺伝子がしばしば3またはそれより多くのエンハンサーと相互作用すること(Markenscoff-Papadimitriou E et al., 2014. Enhancer Interaction Networks as a Means for Singular Olfactory Receptor Expression. Cell 159: 543-557)および活性遺伝子が互いに相互作用すること(Schoenfelder et al., 2010. Preferential associations between co-regulated genes reveal a transcriptional interactome in erythroid cells. Nat. Genet. 42: 53-61)が知られている。さらに、制限部位はゲノムに無作為に分布しておらず、検出におけるバイアスを生じる。ライゲーションの効率はDNAフラグメントの長さの違いに影響され、これは、3Cベースの結果にさらにバイアスをかける。本発明の方法は、好ましくはこれらのバイアスに影響されないかまたは実質的に影響されない(図10)。
先行技術の3Cベースの方法とは対照的に、核酸の制限消化は、区画の切片化を含むGAM法では必要ない。本発明の全工程または方法において、区画に元々存在した核酸間でライゲーションは生じず、特に、ライゲーションを工程(b)の前に行う必要はない。しかしながら、例えば、外部リンカーとのライゲーションは、例えば、増幅またはシークエンシングのために、核酸座位の存在または不存在を検出する状況で可能である。互いの区画に由来する核酸の制限消化およびライゲーションの両者を避けることは、3Cベースの方法の構造的バイアスを克服する。
この意味では、GAMは、ある切片に存在する全座位を同時に特定でき(これは、FISHでは技術的に不可能である)、3を超える座位相互作用が同時にある座位相互作用の多重性同時の検出と共に、相互作用しているときおよびしていないときの両者で座位の近接を特定できるため(3Cベースの方法では不可能である)、競合テクノロジーと比較して独特である。本方法の実施前には知られていなかった座位の空間的近接の特定に使用できる、すなわち、相互作用が新しく発見されたまたは定義されていない座位の間で特定できるのも、本発明の方法の利点の一つである。例えば、本発明の方法を使用して、特定の目的の座位と相互作用する全座位を特定でき、ここで、これらの座位のいずれかが解析実施前に知られている必要はない。
FISHの最も重要な制限は、ゲノムのどの領域が興味深いかを前もって知っておく必要があるが、一方GAMは、どれが興味深いかを前もって知ることなく全配列のマッピングを可能とする。これは、重要な遺伝子再配列が、しばしば多くのバリアントを有するため、研究および診断の状況の両方で重要なである。例えば、ETS遺伝子ファミリーの全前立腺癌メンバーの約半分から3/4が、ゲノム再配列により種々の遺伝子プロモーターに連結し、これは、診断上重要であり(Mehra et al 2007. “Comprehensive Assessment of TMPRSS2 and ETS Family Gene Aberrations in Clinically Localized Prostate Cancer.” Modern Pathology 20 (5): 538-44). In any one case, the ETS gene can be ERG, ETV1, ETV4, ETV5 and probably others (Brenner et al, 2009, Translocations in Epithelial Cancers. Biochimica Et Biophysica Acta 1796 (2): 201-15)、そしてETS遺伝子はTMPRSS2、SLC45A3、KLK2および他の遺伝子に連結でき(Brenner et al, 2009)、これは種々の再配列により達成され得る(Clark et al, 2008, Complex Patterns of ETS Gene Alteration Arise During Cancer Development in the Human Prostate. Oncogene 27 (14): 1993-2003)。その結果、FISHは特定の選択した再配列で検出できるが(Clark et al, 2008)、FISHによる全ての既知組み合わせの試験は実際的ではなく、一方GAMは、全既知例を見つけるのみならず、新規患者特異的バリアントを発見する。類似する例は、治療標的である肺癌のキナーゼ遺伝子融合であり、治療標的である肺癌におけるEML4とALK遺伝子の融合は、FISHにより通常検出されるが、常には検出されず(Maus et al, 2012, Identification of Novel Variant of EML4-ALK Fusion Gene in NSCLC: Potential Benefits of the RT-PCR Method. International Journal of Biomedical Science 8: 1-6)、しかし、ALKは、KIF5B、TFG、KLC1、PTPN3およびSTRNを含む多くの他の遺伝子と融合でき(Hallberg & Palmer, 2013, Mechanistic Insight Into ALK Receptor Tyrosine Kinase in Human Cancer Biology. Nature Reviews Cancer 13 (10): 685-700)、少なくとも5パートナーと融合するROS1を含む、融合する他のキナーゼが存在する(Takeuchi et al 2012. RET, ROS1 and ALK Fusions in Lung Cancer. Nature Medicine 18 (3): 378-81)。
本発明はまた、次のための本発明の方法の使用も提供する:
(a)複数の座位間の物理的距離の決定。工程(a)における分画が、区画における座位の物理的距離によるため、距離を計算できる。画分が作製された区画の平均サイズならびに区画が分割された画分数を知ることが必要である;
(b)区画における座位および/またはゲノムアーキテクチャのマッピング。マップは、決定した物理的距離に基づき、特定の座位または染色体アーキテクチャについて作成できる;
(c)複数の座位間の相互作用の可能性の決定。記載するとおり、本発明の方法を使用して特定の相互作用を決定でき、先導相互作用とバイスタンダー相互作用を区別できる;
(d)区画における座位または染色体の末梢または中枢位置の決定。染色体および単一座位の放射状位置は、ある染色体からの配列が、異なる染色体からしばしば少ない他のウィンドウと共に見られ、この理由のために赤道(中枢)ではなく、頂点(末梢)の核プロファイルで見られる可能性が高い(およびその逆)か否かを問うことにより推測できる;
(e)プロモーター、エンハンサー、例えば、転写に関係する酵素、転位性要素、転写因子結合部位、リプレッサー、遺伝子体、スプライシングシグナルまたはRNAからなる群から選択される異なる機能的要素の相互作用の解析;
(f)特定の遺伝子の発現を制御する制御領域の特定;
(g)座位の共分離に影響し得る薬物の標的および/または効果の特定;
(h)座位の共分離に対する遺伝子治療の効果の解析。遺伝子治療または他の遺伝子工学アプローチによる染色体挿入または単に核酸の存在はゲノムアーキテクチャに英子湯し得て、例えば、制御領域と特定のプロモーターの相互作用を増強または阻止し、そうして、“無関係”遺伝子の転写に影響し得る。本発明の方法は、異なる座位間の相互作用のレベルに対する遺伝子治療または遺伝子工学の影響の評価を可能にする;
(i)例えば再配列のクローン進化を研究するための、特定の組織下細胞集団を含む、例えば、癌における染色体再配列(例えば転座、欠失、縦列重複、逆位)のマッピング;
(j)疾患における座位の共分離の乱れの解析;
(k)座位の共分離の乱れと関係する疾患の診断;
(l)特定の疾患を有する患者のある座位または染色体の近接または位置に応じた、特定の薬物処置に応答する可能性が高いまたは低いサブグループへの層別化;
(m)単位体積あたりの塩基数として定義される、クロマチンの凝縮の決定。特に、試験座位でのクロマチンの凝縮のグレードは、本発明の方法での各座位により占拠される体積の測定により決定され得る;および/または
(n)内在性座位と相互作用する、外来性核酸(例えばウイルスまたは細菌由来)上の、例えば、外来性DNAまたはRNA上の座位の特定または外来性核酸の座位と相互作用する内在性座位の特定。
本発明は、ゆえに、患者における座位の共分離の乱れと関係する疾患を診断する方法であって、該患者から採ったサンプルにおいて、患者における複数の座位の共分離を解析し、該共分離と該疾患を有することがすでに診断されている対象における該座位の共分離を比較することを含み、ここで、共分離は好ましくは健常対象における共分離とも比較される、方法も提供する。あるいは、座位の共分離を、同一患者から由来し得る特定の細胞サブグループ、例えば、腫瘍細胞と正常組織で比較し得る。本発明の状況において、単数表現は、他に特に断らない限り、“少なくとも1”を意味する。
本発明を患者における座位の共分離の乱れ、すなわち、クロマチンミスフォールディングの研究に使用できるため、クロマチンミスフォールディングと関係する疾患を有する患者が、本発明の方法での診断後、クロマチンミスフォールディングを正すための処置に付され得るため、このような患者の処置にも貢献し得る(Deng et al., 2014, Curr Op Genet Dev. 25:1-7)。
例えば、ヒト疾患は、エンハンサーの通常制御しない遺伝子の近接空間的近接への不適切な局在化である、“エンハンサー養子縁組”により誘発され得る(Lettice et al., 2011, Hum Mutat. 32:1492-1499)。本発明の方法を使用して、例えば、特定のサブタイプの癌を有する患者を診断するために、患者由来組織におけるエンハンサーの空間的近接を試験し得る(Nortcott et al. 2014, Nature 511:428-434)。あるいは、患者が、通常特定の遺伝子の過発現により引き起こされる症状を呈するならば、本発明の方法を使用して、目的の遺伝子の近位に局在化されているエンハンサーを特定でき、それゆえに治療介入のための可能性のある標的を提供し得る。他の状況において、ある遺伝子のコーディング領域における疾患関連遺伝子バリアントが、疾患表現型を直接説明するが、クロマチン接触の不偏のマッピングによってのみ明らかにされる誤制御クロマチン接触の発見を混乱させる、その遺伝子の遺伝子発現改変をもたらし得る(Smemo et al. 2014 Obesity-associated variants within FTO form long-range functional connections with IRX3. Nature 507, 371)。本発明の方法を、ゆえに、例えば、癌または遺伝的な肥満の素因の診断に使用できる。
臨床遺伝学の多くは、発達遅滞児(Cooper, G.M., et al. 2011. A copy number variation morbidity map of developmental delay. Nat. Genet. 43, 838-846)または統合失調症(Cook, E.H., Jr., and Scherer, S.W. 2008. Copy-number variations associated with neuropsychiatric conditions. Nature 455, 919-923)のような遺伝子疾患の診断であり、これらは、しばしば、欠失および染色体転座のようなゲノムにおける構造的変異が原因である。大部分は、細胞遺伝学が再配列の一部を検出できても、細胞遺伝学の能力を超え(Gribble et al, 2005. The Complex Nature of Constitutional De Novo Apparently Balanced Translocations in Patients Presenting with Abnormal Phenotypes. Journal of Medical Genetics 42 (1): 8-16; De Gregori, M., et al. 2007. Cryptic Deletions Are a Common Finding in ‘Balanced’ Reciprocal and Complex Chromosome Rearrangements: a Study of 59 Patients. Journal of Medical Genetics 44 (12): 750-62)、症例の大多数において、候補遺伝子はない − ゲノムのほとんどあらゆる部分が改変され得る− したがってFISHは価値がない。ゲノム全体のシークエンシングは、候補再配列接合部を発見し得るが、全てが検出されるわけではなく、ある再配列接合部はアーチファクトであり、欠失、挿入または転座の点で見られた接合部の解釈は堅固なものではなく、確認が困難である。GAMは、ゲノムの大きなストレッチの異常近接に関する情報を提供し、少なくともこれはゲノム全体のシークエンシングを補完し、実質的構造的変化の発見のための良好な最初のアプローチである可能性が高い。
本発明は、ある単一態様における放射状位置、クロマチン接触およびクロマチンの凝縮に関する統合されたゲノムワイドな情報を提供し、これは、疾患状態のより精密化された予測マーカーを提供する可能性を有する。現在、別々のアプローチを使用して、3パラメータが独立して試験されている。例えば、特定のゲノム座位の座位特異的放射状再配置が、前立腺癌および/または肥大と関係して特定されており、これは、疾患進行中の座位特異的再構築および患者層別化の可能性を示す(Leshner M et al. 2015. Locus-specific gene repositioning in prostate cancer. Mol Biol Cell. 2015. pii: mbc.E15-05-0280. [印刷前のEpub])。特定のゲノム座位の改変された放射状位置は、正常乳房組織と比較してヒト浸潤性乳癌で特定されており、これは、ゲノム不安定性と無関係である(Meaburn KJ et al. 2009 Disease-specific gene repositioning in breast cancer. J Cell Biol.;187(6):801-12. doi: 10.1083/jcb.200909127)。2つの異なる染色体間および亜染色体領域間の接触減少のような改変されたクロマチン接触は、異なる乳癌進行段階と関係して見られている(Barutcu AR et al. 2015. Chromatin interaction analysis reveals changes in small chromosome and telomere clustering between epithelial and breast cancer cells. Genome Biol. 16(1):214. doi: 10.1186/s13059-015-0768-0)。
次の実施例は、本発明を説明するために包含され、その範囲を限定するものではない。実施例で使用するサンプル調製および解析の方法および/または統計法を本発明の方法においても使用し、例えば、ここに記載するように、異なる起源のサンプルおよび/または異なる目的の座位の解析にも使用し得る。引用する文献は、全ての目的で、本明細書に完全に包含させる。
ゲノムアーキテクチャマッピングは、核切片における共分離の測定により、座位の核近接を測定できる。a、直線的ゲノムに沿って近接である座位は必ずしも核のすぐ近くにはなく、それゆえに、核空間における座位間の距離を測定する方法が必要である。b、薄切片を、核を通して取ったとき(核プロファイルまたはNP)、核空間で互いに近い座位は、より頻繁に同一NPで見られる。c、原則として、DNA検出の任意の方法(PCR、次世代シークエンシングなど)を、各NPにおける座位存在または不存在のスコア化に使用できる。d、座位が、十分に大きな数のNPでスコア化されたとき、座位の共分離を使用して、座位の対間の核距離を示す共分離マトリクスを作成できる。
GAMは、Hi−C試験で先に見られたゲノムアーキテクチャの特性を独立して再現する。a、個々のNPからのシークエンシングトラックは、薄切片内外でクロマチン線維ルーピングと一致するパターンを示す。b、単一HiSeqレーン上の48NPの多重化により得たシークエンシング深度は、各サンプルにおける30kbウィンドウの検出を飽和させるのに十分である。さらに、ほとんど全てのNPにおいて特定されたゲノム30kbウィンドウのパーセンテージは、9μm直径球の220nm切片から予測される核体積のパーセンテージの範囲内である。c、GAMおよびFISHは、HoxB座位における3個の約40kb領域で類似の検出効率を示す。d、GAMおよびHi−Cは、PCAにより1Mb分解能で類似のAおよびB区画を特定する(65%区画重複)。e、GAMは、Hi−Cで特定されたのに類似する形態的に関係するドメインを特定する。
単純モデリングアプローチにより抽出される相互作用確率マトリクスを、エンハンサーと活性遺伝子間の接触について富化する。a、無作為クロマチンフォールディングにより予測されるより近い核空間にある座位を、座位が無作為例に従い分布している細胞の大集団およびより近い相互作用を示す細胞の小亜集団としてモデルかできる。このモデルは、それゆえに核距離の二峰性分布を仮定する。b、強く相互作用するまたは無作為に折りたたまれた状態の混合物としての座位の対のモデリングは、Pou5f1座位における別々の相互作用焦点を特定する。c、30kbウィンドウ重複エンハンサーまたは活性遺伝子内および間の相互作用の統計的富化を、2つの特定の特性が重複する全30kbウィンドウ間(例えば活性遺伝子および重複エンハンサーが重複する全ウィンドウ間)のSLICEで概算した平均相互作用確率の計算およびマトリクス対角線の無作為化後に得られた同一値の比較により、特定した。
クロマチン接触測定に関する現在のゲノムワイドな方法の制限。a、クロマチン相互作用を測定するための現在のゲノムワイドな方法を挙げ、それらの種々の制限を比較する表。b、GAMは、ゲノムアーキテクチャマッピングのための現在のゲノムワイドな方法に影響する制限をほとんど受けない。
GAM法の概要。a、本発明の提示する態様において、GAMは、新規な一連の工程において凍結切片化、レーザー捕捉マイクロダイセクション、全ゲノム増幅および次世代シークエンシングの既存のテクノロジーを組み合わせる。b、凍結切片化は、核の領域をとおして、極めて薄い切片厚で切片を生じる。c、個々のNPは、レーザー捕捉マイクロダイセクションを使用して凍結切片から特定および単離される。d、全ゲノム増幅を使用して、マイクロダイセクションを経て単離されたNPからDNAを抽出および増幅する。hgDNA、ヒトゲノムDNA。e、次世代シークエンシングは、マウスゲノムのどの座位が各最初のNPに存在したかを特定する。無作為切片化から予測されるとおり、各NPは、その中に異なる補数の染色体および亜染色体座位を含み、全ての染色体が各NPにおいて特定されるわけではない。
GAMデータセットの品質管理。a、マウスゲノムにマッピングされた解読のパーセンテージおよび特定されたウィンドウの総数は、陰性対照の最良の弁別子であることが判明した。同日に集め、一緒に処理したNPの群間で、これらのパラメータでバッチ効果は特定されなかった。マウスゲノムにマップされた解読が<15%のNPをさらに処理する前に廃棄した。b、30kb〜1Mbの分解能でのほとんど全てのゲノムウィンドウが少なくとも1つのNP(灰色棒)で検出される。いくつかのウィンドウは、mm9アセンブリ(例えばセントロメアで)で定義された配列を有さず、それゆえに検出されない(黒色線)。少なくとも一つのNPで検出されるウィンドウの比率は、ゲノム分解能の減少(すなわちウィンドウサイズ増加)により増加する。c、各染色体の平均6%が単一NPで見られ、この比率は、染色体をとおして一定である。
座位検出頻度の差異を説明するための共分離マトリクスの正規化。a、個々の30kbウィンドウの検出頻度の分布は、全ての座位が独立して検出されるならば予測される二項式分布からわずかに逸脱する。b、30kbウィンドウの検出頻度は、大部分そのGC含量またはゲノム反復としてアノテートされるウィンドウの画分と無関係である。検出頻度はマッピング能と相関する。c、座位間の検出頻度の差異は、共分離マトリクスに微妙に影響するが、正規化連鎖不平衡の計算により補正され得る。
408個のNPが、30kb分解能での座位の対の共分離に関する情報の大部分の抽出に十分である。a、品質管理を通過した408個のNPデータセットの最初のバッチを6回縮小し、各回無作為に68個のNPを除去した。次いで、マウス染色体12上のEsrrb座位の共分離マトリクスを、NP数を増加させながらプロットした。マトリクスの構造は、少なくとも約200個のNPが包含されるとき、安定化に近づく。b、共分離マトリクスの同じ安定化が、大きな領域で観察される(30Mb、パネルaからの小さなEsrrb座位は右下角に対応)。c、縮小データセットの各々と408 NP完全データセットの各々のピアソン相関係数(PCA)のプロットは、共分離マトリクスが、約200個のNPの採取後に飽和され始めることを示す。
GAMは、先に特定されたTAD境界周囲の非対角接触の顕著な欠乏を再現する。a、非対角接触を、マトリクス対角線から2のオフセットで移動させた3x3ボックスにおける平均正規化連鎖として定量した。この平均正規化連鎖は、Hi−Cで特定されたTAD境界周囲で低減した(Dixon J.R. et al., 2012. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature 485, 376-380)。b、非対角欠乏を、マウスES細胞(mESC)におけるTAD境界の先に公開された一覧における各TAD境界について計算し、これらの境界の中央欠乏は、TAD境界の5000の無作為にシャッフルした任意のリストで見られるより大きいことが判明した。c、全TAD境界にわたり平均化した非対角相互作用のプロファイルは、境界での大きな欠乏を示す。シャッフルした境界の5000リストで観察された最大欠乏を比較用に示す。
正規化前および後のHi−CおよびGAMデータにおけるクロマチン接触強度の測定におけるバイアス。生Hi−Cデータは、生GAMデータよりもa、制限部位密度、b、GC含量、c、マッピング能、d、複製時間およびe、反復被覆率に関して高いバイアスレベルを示す。Hi−Cデータの正規化(ICE)はバイアスを一部しか除かず、一方GAMデータにおけるバイアスは、正規化後効果的に除かれる。バイアスの各々の可能性のある源について、我々は、マウスゲノムにおける全50kbウィンドウを、可能性のある問題のバイアスに基づき、10の等しい群(またはHindIII部位密度の場合9群)に分けた。各群の平均±上部および下部四分位点を、上部左棒グラフに示す。次いで、我々は、10群の各々におけるウィンドウ間の観察されるクロマチン接触(生Hi−C:ライゲーション頻度、正規化Hi−C:ICE正規化ライゲーション頻度、生GAM:共分離頻度、正規化GAM:正規化連鎖不平衡)を計算し、各観察値を、ゲノム距離により分離した全ウィンドウの平均値で除した(予測値)。ヒートマップは、群の各対間の平均観察/予測値を示す。上段(%正バイアス)は、ゲノム距離を考慮して、予測クロマチン接触より高い群の組み合わせを示し、下段(%負バイアス)は、予測接触より低い群の組み合わせを示す。下右ボックスプロットは、群の全ての可能な組泡得にわたる絶対的バイアス(すなわち正および負バイアス両者)を要約する。
GAMデータから顕著に相互作用する座位対を検出するためのSLICE統計法。a)本発明者らの座位対共分離の統計モデリングを、SLICE(Statistical Inference of Co-segregation)と呼ぶ。ゲノムにわたる座位対(各相同コピー)は、相互作用または非相互作用状態で存在する。核全体の切片は、両座位を含む(M)、一座位のみを含む(M)または座位を含まない(M)ものであり得る。相互作用または非相互作用座位対は、核の集団にわたり、異なる切片共分離頻度を有する。最初の集団における任意の2座位の相互作用の確率(Pi)は、観察される共分離頻度から概算される。b)SLICEは、異なる例における座位対の予測共分離頻度、すなわち、対における0座位、1座位または2座位が、相互作用(t,t,t)または非相互作用状態(u,u,u)にあるとき共分離される確率を導く。一例として、我々は、本明細書で、距離dにあり、分布ρで核に位置する座位の対に対する切片V切片(z)におけるuの式を提供する。c)ゆえに、NPの予測数は、核状態P、PおよびPの確率が定義されたら、Piの関数として導き、観察データと比較できる。
SLICE統計モデルにより特定されたクロマチン相互作用は多くの異なるゲノム特性を含み、大きなゲノム距離にわたり伸長する。a、遺伝子が重複するまたは重複しない30kbウィンドウが関与する有意な相互作用の数。b、各ウィンドウに存在する重複特性による有意な相互作用の数。c、重複特性により有意な相互作用を有するウィンドウの対間のゲノム距離。d、エンハンサーまたは活性遺伝子重複30kbウィンドウ内および間の相互作用に対する統計的富化は、正規化連鎖不平衡マトリクスからの各ゲノム距離での座位の上位5%相互作用対を特定し、次いで、2つの特定の特性(例えば活性遺伝子および重複エンハンサー重複ウィンドウ間で特定される上位5%相互作用の数)が重複するウィンドウが関与するこれらの相互作用の数を計数することにより、SLICE解析なしで再現された。次いで、富化を、相互作用位置無作為化後に得た同一値との比較により計算した。
SLICEにより特定された顕著に相互作用する座位対は、全ゲノム距離にわたり、非相互作用座位対より頻繁に共分離する。SLICEにより特定された顕著に相互作用するウィンドウの対の平均共分離頻度(黒色線)は、広範なゲノム距離にわたり、一貫して非相互作用ウィンドウの平均共分離頻度(破線)±標準偏差(斜線領域)より高い。
スーパーエンハンサーは、GAMにより特定された最も高度に相互作用するTADトリプレットで高度に富化される。a、2D相互作用マトリクスは、3領域間の重複接触を示すことができ、これは、単一の同時のトリプレット相互作用として誤って解釈され得る。対での接触データ単独で、同時例は、別の対での事象(または2者の複雑な混合物)と識別不可能である。b、TADを特定する戦略は、真に同時の、3方向相互作用に関与している可能性が最も高い。下部グラフは、トリプレット相互作用スコアによるTADトリプレットの最終順位を示し、そのTADトリプレットを超える閾値の位を真に同時に相互作用するとして解釈した。c、染色体1上のTAD間の三方向相互作用例。マトリクスは、領域全体にわたり顕著な対での相互作用を示し、挿入図は、3個のTAD間の有意な相互作用の拡大表示である。TADの分類を下に示す。d、ゲノム領域が重複すする非隣接上位5%TADトリプレットを示す。各垂直線は、(NPの集団にわたるその頻繁な共分離により)同時に相互作用する可能性のある3個のTADを結ぶ。e、TADの分類。スーパーエンハンサーと重複するTADをSEと呼ぶ。非SE TADを、そのGRO−seq被覆率が下位25%四分位にあるとき低転写または上位25%にあるとき高転写と呼ぶ。f、TADクラスによる上位5%トリプレット相互作用のゲノム全長。g、上位5%トリプレットは、SE領域を含むTADおよび高度転写TADについて高度に濃縮されており、3個のSE TAD間の相互作用は、唯一かつ最大の富化組み合わせである。赤色または青色で示す棒は、それぞれ、トリプレット位置の無作為シャッフル後に得られた値に比して富化または枯渇されている。h、Peric-Hupkes et al.(2010)50からのラミナ結合ドメイン(LAD)と重複する各クラスにおけるTADのパーセンテージ。i、最小トリプレット接触を形成する高度に転写されたTADとSE TADは、最大トリプレット接触由来のTADと比較して、高頻度にLADと重複するかまたは近い。
トリプレットで相互作用するTADの解析。a、図14gにおけるような富化解析は、さらに、他のクラスのいずれにも入らないTAD(中央TAD)を示す。b、各30kbウィンドウ内の、5kb分解能での平均連鎖の特定による特異的結合部位の発見を精密化するための戦略。活性またはエンハンサークラスにおける30kbウィンドウを接続するSLICEにより特定された各顕著な相互作用について、我々は、特定の大きな30kbウィンドウ内のサブウィンドウが、パートナー30kbウィンドウと最高連鎖を示したかを問うた。特に、我々は、例えば活性遺伝子プロモーター(またはTSS、転写開始部位)または活性遺伝子TES(転写終了部位)またはエンハンサーを重複する5kbウィンドウが、パートナー30kbウィンドウと最も頻繁に共分離されるか否かを問うことに興味を持った。c、顕著に相互作用する活性30kbウィンドウ(黒色線)またはエンハンサー30kbウィンドウ(破線)への平均連鎖は、活性遺伝子TSS(左)、活性遺伝子TES(中央)またはエンハンサー(右)と重複する5kbウィンドウについて、これらの特性の15kb上流または下流にある全5kbウィンドウと比較して富化される。この富化は、同様に活性遺伝子TSS、TESまたはエンハンサーと重複するが、同一活性30kbウィンドウと顕著に相互作用しない(対照ウィンドウ;点線)、他の全5kbウィンドウでは見られない。d、40kb分解能で平均三方向連鎖を特定するための戦略。3スーパーエンハンサー(SE)TADを結合する各上位トリプレット相互作用について、我々は、TAD全体内で、直接スーパーエンハンサーを重複する40kbウィンドウが、他の2個の相互作用スーパーエンハンサーTADと最高三方向連鎖を示すか否かを問うた。e、上位トリプレット(黒色線)を形成する2個の他のスーパーエンハンサーTADとの平均三方向連鎖は、スーパーエンハンサーの120kb上流または下流の40kbウィンドウと比較して、スーパーエンハンサーと直接重複する40kbウィンドウについて富化される。この富化は、上位トリプレット(破線)を形成するスーパーエンハンサー(SE)と、2個の高度に発現される(高)TADの間でも、スーパーエンハンサーと、上位トリプレットに関与しない2個の他のスーパーエンハンサーTADの間でも観察されない(点線)。
GAMはまた座位放射状配置および凝縮に関する情報も提供する。a、核内の中央に位置する座位は、大きな体積を有する赤道NPに、より頻繁に見られる。対照的に、核末梢に近接して位置する座位は、小さな体積を有する頂点切片に、より頻繁に見られる。b、NPあたり網羅されるゲノムの平均パーセンテージ(NP体積の代理として)は、放射状位置データが入手可能な5マウス常染色体における放射状配置と負に相関する。c、大きな体積を有するより脱小型化された座位は、大きな体積を有する対応する小型化座位よりも頻繁に交差する(すなわち多くのNPで検出される)。d、検出頻度の高位四分位点における30kbウィンドウは、より小型のクロマチンは到達しにくいため、検出頻度がクロマチンの凝縮の指標であるならば、予測とおり、大きな平均DNaseシグナル(局所クロマチン到達性の指標)を示す。e、検出頻度の高位四分位点における30kbウィンドウはまたGRO−seqにより高い被覆率を示し、活性転写の高いレベルを示す。これは、活発に転写しているクロマチン領域一般的脱凝縮と一致し、検出頻度の体積誘発増加に至る。
薄核凍結切片を、飽和スクロース溶液への包埋を使用する固定組織の凍結保護、続いて液体窒素での凍結および−100℃での切片化を含む、改変Tokuyasu法(Tokuyasu, K. T., 1973, J. Cell Biol. 57, 551-65, A technique for ultracryotomy of cell suspensions and tissues; Guillot PV, Xie SQ, Hollinshead M, Pombo A (2004) Fixation-induced redistribution of hyperphosphorylated RNA polymerase II in the nucleus of human cells. Exp. Cell Res. 295, 460-468; Pombo A, Hollinshead M, Cook PR (1999) Bridging the resolution gap: Imaging the same transcription factories in cryosections by light and electron microscopy. J. Histochem. Cytochem. 47, 471-480)により、樹脂包埋を行わずに産生した。凍結切片化材料からのDNA抽出および検出の実行可能性を試験した。mESCを、確立されたプロトコールに従い220nmの厚さで凍結切片化した(図5a、b)。単一核プロファイル(NP)を、レーザーマイクロダイセクションにより切片から単離した(図5c)。次いで、DNAを抽出し、画分化し、単一細胞全ゲノム増幅(WGA)を使用して増幅した(図5d)。
単一NPからのWGA増幅DNAを、Illumina HiSeqテクノロジーを使用して配列決定した。単一NPからのトラックの目視検査は、薄い核切片のクロマチン出入りから予測されるとおり、各々が、亜染色体領域の異なる補体を含むことを示す(図5a)。さらに、各NPは、染色体の限定されたサブセットのみを含んだ(平均、NPあたり7染色体;図5e)。
ゲノムワイドなシークエンシング方法によるDNAの抽出および検出の実行可能性確認後、マウスゲノムを、その共分離測定のために等サイズのウィンドウに分けた。適切なゲノム分解能(ウィンドウサイズ)を決定するために、10kb〜1Mb範囲のサイズにわたる規則的ゲノムウィンドウを規定し、先に記載された負の二項式アプローチの適応を使用して、個々のNPにおけるこれらのウィンドウの存在を検出した。シークエンシング解読の逐次的収縮処理を使用して、各サンプルにおける正のウィンドウの検出を飽和させるのに必要なシークエンシングの深度を決定した(図2b)。600kの独特な解読が試験サンプルの>95%について30kbウィンドウの検出に十分であり、これは、単一HiSeqレーン上の48個のNPの多重化を可能とする。
GAMを使用するクロマチン接触マッピング
GAMを使用してゲノムワイドにクロマチン接触をマッピングするために、490個の独立したNPを配列決定した。各データセットの品質を、マッピングされた解読のパーセンテージを含む基準の組み合わせに基づき評価した。サンプルを、最大48個のNPの15バッチで厚め、品質管理計量基準は、独立して集めたバッチ間で再現可能であった(図6a)。少数の単一NPデータセット(82サンプル)を、マウスゲノムにマッピングされた解読のパーセンテージの低さ(<15%)に基づき、品質管理後のさらなる処置から除いた。
408個のNPの本発明者らのデータセットで達成されたゲノム被覆率の程度を探索するために、データセット全体にわたる異なるゲノム領域および各NPの検出の程度を算出した。全ゲノム30kbウィンドウの96%が、少なくとも1NPで検出された(図6b)。単一NPは、30kbウィンドウの平均6±4%を含んだ。これは、mESC核が9μmの平均直径を有し、切片が0.22μm厚であるため、単一NPに含まれると予測される核体積の範囲内である。NPにわたる富化ウィンドウの平均画分は、異なる染色体間で一定であった(図6c)。まとめると、これらの結果は、WGAとIlluminaシークエンシングの組み合わせによる、単一NPからの堅固なDNA抽出および検出を示す。
検出の堅固性をさらに試験するために、単一座位の検出頻度を約40kb分解能でGAMと蛍光インサイチュ・ハイブリダイゼーション(FISH)で比較した。HoxB座位にわたる3ゲノムウィンドウを試験し、FISHとGAMで卓越した一致が判明し、両者の方法で3個の40kbウィンドウについて7〜12%の検出頻度であった(図2c)。次に、座位検出のゲノムワイドな頻度を、NPのデータセット全体にわたり測定した。予想どおり、座位検出頻度の分布は、二項式分布により良好に近似される(図7a)。この分布からの軽微な逸脱はGC含量またはゲノム反復により被覆されるウィンドウの画分と弱くしか相関せず、マッピング能と最も強く相関する(図7b)。このような逸脱は、おそらく、座位間の検出確率の不完全な独立性を引き越す、あるNPにおける互いに相互作用する座位の小さな比率に起因するものである。結論として、3Cベースの方法とは対照的に、GAMデータセットは、異なるゲノムウィンドウの検出における体系的バイアスによる影響が最小である(図10)。これは、おそらく、3Cベースの方法が、特定の制限酵素部位に近接する少数の解読の正確なマッピングを利用することによるものであり、一方GAMは、はるかに大きなゲノム領域内のあらゆる核酸画分を検出できる。
GAMにより測定されたクロマチン接触をマッピングするために、NPコホート全体にわたる座位共分離のマトリクスを、各個々の染色体についてプロットした。個々の座位の検出に影響するわずかな体系的バイアスは検出されたが、それにもかかわらず、ある座位は、単純に無作為配向でのNP切断の確率的性質によってのみ、他よりも高頻度で検出される。異なる座位の検出頻度のこれらの差異は、先に記載されたように、連鎖不平衡の正規化バージョンを使用するために、補正された(図7c、図10)。408個のNPが、それより少ないNPを使用して得た共分離マトリクスが、約280個のNPから劇的差異を示さなかったため、ゲノムアーキテクチャ探索開始に十分である(図8a)。この観察は、408個のNPの完全データセットと縮小データセットの間の相関の計算により確認され、ピアソン相関係数が約300個のNPで飽和することが判明した(図8b)。
408個のNPデータセットに基づき、接近したゲノム距離にある座位は、一般に同一核プロファイルでより頻繁に見られ、3D空間におけるこれらの接近した距離を反映する。GAMは、先に記載された位相的ドメインに似たクロマチン接触の局所優先傾向を特定した。座位間の近い物理的近接を示す高共分離頻度も、染色体全体の長さまでの、極めて大きなゲノム距離で観察された(図2d、e)。これらの相互作用は、Hi−Cデータセットではあまり明瞭であはなく、2アプローチ間の何らかの方法論的差異により説明され得る(図4)。
GAMデータセットを、mESCからの先に公開されたHi−Cデータセットと比較した。目視比較は、特に小さい長さの規模での両データセットの類似パターンを確認した(図2d,e)。Hi−CおよびGAMデータセットを全体的相関係数0.63および0.43〜0.71の範囲の個々の染色体間の対での相関(スピアマンの順位相関係数)で、1Mb分解能で相関させた。
先のHi−C試験は、接触に基づき、全ゲノム座位を2区画に分けるために主成分分析(PCA)を使用している。同じアプローチを適用して、GAMデータセットにおける区画AおよびBを特定した(図2d)。1Mbウィンドウの66%がGAMおよびHi−Cの両者で同一区画に割り当てられたため、区画の良好な重複が見られた。
GAMデータセットにおいて、Hi−Cにおいて特定された位相的ドメインと類似するように見える、高度に自己相互作用する領域を視覚的に特定することが可能であった。“ムービング・ボックス”アプローチ(図9a)を使用して、非対角接触の高度に有意な欠乏が、マウスmESCにおける先に特定されたTAD境界で観察され、本発明者らデータセットにおけるTADの存在を確認する(図9b,c)。
SLICEを用いるGAMデータからの相互作用確率(頻度)の抽出
DNA FISH試験は、クロマチンフォールディングが、細胞をとおして均一ではないことを示しており、2個の定義された座位間の相互作用を顕微鏡下に直接試験するとき、それらは通常細胞の小亜集団においてしか見られない(Simonis M., et al. 2006. Nuclear organisation of active and inactive chromatin domains uncovered by chromosome conformation capture-on-chip (4C). Nat. Genet. 38 (11): 1348-54)。共局在化の測定は、それゆえに集団平均を表す。相互作用の強度の生物学的に最も適切な尺度は、それが起こる細胞の集団の分数であると考えられる。細胞集団に適用したとき、配座捕捉ベースの方法は、予測よりも高頻度で互いに接触する座位を特定できるが、単一細胞におけるこれらの接触の頻度に関する定量的情報はアクセスできない。
個々の細胞で生じる相互作用の可能性を概算するために、単純統計モデルが本発明者らにより開発された(SLICE計算プラットフォーム、Statistical Inference of Co-segregation)。極めて接近して(<100nm)相互作用するまたは無作為に折りたたまれた座位対を有する細胞の集団の混合を考慮する。データを最良に描写する相互作用の確率(Pi)は、数個の単純化仮説下の数学的アプローチにより導かれ、核体積は球により近似され、異なる染色体上のアレル間の相互作用は、無視できると考慮され、2座位の物理的距離をそれらのゲノム距離でスケーリングする。座位の大部分が非相互作用である(あるゲノム距離の座位間の平均相互作用確率は小さい)ことも仮定して、このスケーリングを、あるゲノム距離での全座位対の平均共分離により近似できる。このタイプのモデリングアプローチは、測定パラメータ(ライゲーション頻度)が距離の直接の関数ではないため、Hi−Cデータでは極めて困難である。この基本的モデリングアプローチのさらなる精緻化を使用して、“先導的”クロマチン相互作用を、隣接または近隣座位の“先導的”相互作用により生じる“後続的”相互作用と切り離し得る。
本モデルを、座位のカップル間の相互作用マトリクスの概算に適用した。統計的に決定した閾値を、次いでデータセットに適用して、統計的信頼をもたらすのに十分高い頻度である相互作用のみを保持した。
SLICEモデルを使用して、ゲノム距離から予測されるよりも核空間において短い物理的距離(<100nm)により高頻度で位置する全座位対を特定し、細胞の集団にわたる座位相互作用の頻度を概算した。100nmを、FISHにより最近測定されたように、特定の接触の厳格な距離として選択した(Williamson et al. 201458)。最初に、同一染色体の座位の全ての可能性のある対について、Piを概算した。次いで、本発明者らは、偶然予測より大きなPiを有するものを意味する、顕著な相互作用を有する座位のみを選択した。
SLICEにより特定された最も顕著な相互作用は、同一切片で最もしばしば共分離される座位対に対応した(図13)。例えば、10Mb離れた座位は、平均408個のNP中、5.3共分離された(1.29%)。対照的に、10Mb離れた顕著に相互作用する座位は、408個のNP中、10.1共分離された(2.47%)。このアプローチは、Hi−CまたはGAM共分離マトリクスとも遙かに同種性ではないパターンを有する相互作用マトリクスを生じる(図3b)。マップは、はるかに多くの別々のスポットを含み、これは、ある閾値を超える相互作用により形成されたクロマチンループの特定の塩基(座位)を意味する。
このモデルが確立されると、SLICEを使用して、種々の分解能で検出効率を概算した。このアプローチは、30kb分解能で検出効率が80%であることを示唆し、このデータセットの最適分解能として30kbを確認し、GAMとcryoFISHの比較から概算した効率とよく一致する。本モデルを、各チューブへの1を超えるNPの切断および異なる厚さの範囲で切片を切断する可能性の考慮にも使用した。220nmの厚さで、チューブあたり1NPが、本目的のためには最適であったが、はるかに大きなまたは小さな核を有する生物の研究には最良の選択ではないかもしれず、1を超える、好ましくは2、3またはそれより多いNPを単一チューブで同時に解析し得る。
Piマトリクスにおける相互作用の性質を探索するために、異なるゲノム要素を含む30kbウィンドウの相互作用確率を探索した。本発明者らは、SLICEを使用して1000万高信頼度常染色体相互作用(可能性のある1億8900万の染色体内対から)を特定し、その中の720万が遺伝子領域に関与した(図12a)。平均、254個の顕著な相互作用が、各30kbウィンドウで特定された(±183標準偏差;図12b)。特定された相互作用数は、予想とおり、ゲノム距離により低減したが、数十Mbに及んだ。例えば、活性遺伝子が関与する450万の顕著な相互作用の中で、300万が60Mb未満に広がり、一方150万が60Mbを超えて広がった(図12c)。
先に公開されたmESCにおけるmRNA−seqおよびChIP−seq11を使用して、遺伝子を3クラスに分けた:活性(FPKM>1)、ポリコーム抑制(FPKM<1、H3K27me3+および/またはH3Aub1+)または不活性(FPKM<1、H3K27me3またはH3Aub1なし)。予測されるエンハンサーの一覧も先の研究12から取り込んだ。遺伝子またはエンハンサーと重複する全30kbウィンドウをスコア化し、異なる遺伝子/エンハンサーカテゴリー間の顕著な相互作用数を、無作為予測値と比較した。相互作用マトリクスが、特に高い数の活性遺伝子およびエンハンサーカテゴリー内およびそれらの間の顕著な相互作用を含むことが判明した(図3c)。例えば、活性遺伝子を含むウィンドウは、無作為対照よりも、他の活性遺伝子含有ウィンドウと有意に多く接触する。対照的に、不活性遺伝子間の接触は、偶然から予想されるとおりの頻度で起こる。類似結果が、SLICE解析を用いずに、連鎖データにおける各距離での相互作用の上位5%に適用することにより、富化解析により得られ(図12d)、これらがGAMデータセットに固有の特性であることが示される。これは、制御要素とその同族遺伝子の間の相互作用を特定するGAM法の有効性を強調する。GAMが機能的ゲノム領域間の接触を検出する特異性は、GAMが、ゲノムフォールディングおよび誤制御遺伝子発現における特定のSNPと他のゲノムバリアントの切り離しのための強力な方法であることを示す。
相互作用トリプレット検出
GAMは、多価クロマチン相互作用(2、3以上のゲノム領域が関与する相互作用)、染色体および亜染色体領域の放射状分布およびクロマチンの凝縮のようなゲノムワイドなクロマチン空間的構成の多くのさらなる面を捕捉する可能性がある。本発明者らは、mESC−400データセットが、3以上の座位間の多価相互作用を明らかにするための十分な情報を保っていることを示した。GAM統計の詳細な解析は、現在のmESC−400データセットが、TADのクロマチン構成レベルに匹敵する、数百キロベースの分解能でトリプレット接触の検出を可能にすることを示す。
対での接触マトリクスは、同一細胞で生じない同時のトリプレット相互作用と、独立した対での事象を区別できない(図14a)。真のトリプレット相互作用を特定するために、本発明者らは、SLICEをトリプレットの考慮に拡大し、3TAD内の全ての可能性のあるウィンドウの組み合わせについて、<100nmの同一の厳格な空間的距離での同時、三方向相互作用(Pi)の確率を計算した(図14b)。顕著な対での相互作用により接続されるTADのトリプレットのみを使用し、公開されたTAD定義と分解能をマッチさせるために40kbウィンドウを使用した(Dixon et al., 2012)(方法)。次いで、候補TADトリプレットを、構成する40kbウィンドウの平均Piによりランク付けし(図14c、図15a)、最高相互作用スコアを有する上位5%のTADトリプレットを保持した。これらの上位5%は、マウス常染色体にわたる170,000の高度に相互作用するトリプレットを表す(図14d)。
単一分子トラッキング実験による生存mESC核におけるエンハンサー結合Sox2転写因子の顕著なクラスタリングの最近の観察を考慮して(Liu et al., 2014)、多能性転写因子結合について富化された高密度の制御要素を含むTADが、上位相互作用TADトリプレット内に入るか否かを試験した。それゆえに、全TADを、ストロング、ストレッチまたはスーパーエンハンサー(SE)のように様々に呼ばれている、転写因子Oct4、Sox2およびNanogが高占拠率であるクラスター化エンハンサーの存在によりbun類した(Whyte et al., 2013)。SEを含まなかったTADを、転写活性の指標としての公開されたゲノムRun−On(GRO−seq)データセット(Min et al., 2011)を使用してその転写レベルにより細分化した(図14e)。注目すべきことに、本発明者らは、SE、低転写および高転写TADが、広範なゲノム距離(例えば、SEが関与する41982トリプレット中、19%は、30Mb未満のゲノム距離に広がり、81%は30〜116Mbに広がる)にわたり、最も高度に相互作用するトリプレットのセットに存在することを発見した(図14f)。
次に、本発明者らは、特定のクラス間の相互作用が上位の相互作用するTADトリプレットを統計的に富化するか否かを試験した。際立つのは、最も高度に相互作用するTADトリプレットが、3個のSE含有TADを接続するトリプレットについて有意に富化されていることを発見した(図14g、図15a)。これは、直線的染色体においてクラスター化されているエンハンサーのこれらのアレイが、mESCにおいて高多重性で3D空間でも団結し、生存mESCの単一分子画像化によるクロマチン結合Sox2の核クラスタリング(Liu et al., 2014)およびHi−Cにより検出されるスーパーエンハンサー間の対での接触(Ing-Simmons et al., 2015)の最近の観察を拡張する結果である。注目すべきことに、本発明者らはまた、高度転写TAD間またはSEと高度転写TADの組み合わせで形成されるトリプレットの富化が、活性遺伝子が共局在化する先の観察と一致する(Pombo et al., 1999; Osborne et al., 2004)。対照的に、最小転写TADからなるトリプレットは、偶然による予測より少なく生じ、これは、核ラミナとの優先的結合の可能性である可能性がある(Peric-Hupkes et al., 2010)(図14h)。興味深いことに、ラミナ結合ドメイン(LAD)と重複または近接するSEおよび高転写TADも、3方向相互作用への関与が少なく、隣接TADのラミナ結合が活性領域を抑制し、より中枢のエンハンサークラスターへのそれらのアクセスを制限することを示唆する(図14i)。
これらの解析は、染色体フォールディングの主要決定因子としてウィンドウ重複エンハンサーおよび活性遺伝子を特定する。相互作用が相互作用ウィンドウ内の活性遺伝子および/またはエンハンサーにより核で発生するはずであるか否かを試験するために、本発明者らは、5kb分解能で正規化連鎖を計算した(図15b)。活性遺伝子のエンハンサー、プロモーター(TSS)または転写終了部位(TES)と重複する5kbウィンドウは、これらの特性の15kb上流または下流の5kbウィンドウより、顕著に相互作用している活性30kbウィンドウと高い平均連鎖を有する。この富化は、エンハンサー30kbウィンドウとの相互作用でも見られたが、30kb分解能では相互作用しない活性ウィンドウではなかった(図15c)。同様に、上位トリプレットを形成するSE TAD間の平均三方向連鎖は、120kb上流または下流の40kbウィンドウと比較して、スーパーエンハンサーと直接重複する40kbウィンドウについて富化されることが判明した(図15d,e)。
放射状配置および凝縮を探索するためのGAMの使用
GAMは、3D核空間でクロマチン構成のさらなる空間的特性を探索する力を有する。本発明者らは、mESC−400データセットを使用するGAM法の2個の立体解析学的適用を探索した。核に対する切片化の無作為配向の結果として、核の異なる緯度から生じるNPのDNA含量を使用して、ゲノム領域の放射状分布を概算できる。例えば、核近接から末梢までを通して切断したNPは、定義上は、赤道NPより核の体積(またはDNA含量;Branco et al., 2008)の比率が小さい(図16a)。それゆえに、核NPにより網羅されるゲノムのパーセンテージを、最も赤道のNPと相対的な緯度の代理として使用できた。実際、本発明者らは、染色体が小さいNPで検出される頻度は、その放射状位置(mESCにおける5染色体で先に測定(Mayer et al., 2005))と相関し、より末梢位置に対応して低い平均DNA含量であることを発見した(図16b)。
本発明者らは、さらに原則としてまたGAMによって評価できる、クロマチンフォールディングのより局所的特性を探索した。本発明者らは、脱凝縮ゲノム座位は、より凝縮された座位より大きな体積を占拠する(またはより伸長した高次構造を取る)と判断した。より脱凝縮された座位は、それゆえに小さいまたはより球状の座位より高頻度で交差する(そして無作為に配向された核プロファイルにおいてより高頻度で検出される)はずである(図16c)。脱凝縮されたクロマチンは、例えば、DNAse Iを使用する酵素開裂により到達可能であるはずであり、本発明者らは、公開されたDNase−seqデータセットにおける30kbウィンドウの被覆率が、GAM mESC−400データセットにおける検出頻度と相関することを発見した(スピアマンのr=0.47、p≦10−6;図16d)。転写活性は、構造的タンパク質の過発現後、個々の座位についてまたは包括的にクロマチン脱凝集と相関することが示されている。本発明者らは、さらにGRO−seq被覆率(Min et al., 2011)により測定した30kbゲノムウィンドウの転写活性が、単一NPにおける検出頻度と正に相関することを発見した(スピアマンのr=0.27、p≦10−6;図16d)。これらの結果は、マウスESCにおける30kb分解能での転写レベルとクロマチン体積(凝集)の間のゲノムワイドな結合を初めて報告することを可能とさせた。これらの解析は、すでに、現在まで到達不可能であり、ゲノムワイドな規模では未探索のままであった、核構成の特性を試験するGAMの可能性を説明する。
考察
GAMは、3Dゲノム位相幾何学および配置の測定に使用された他の全ての現在のテクノロジーとは無関係の、不偏の方法でクロマチン接触を捕捉するための新規の、無ライゲーション方法である。GAMは、機能的ゲノム領域が特異的クロマチン接触で根底にある、mESCにおけるクロマチンの3D構造の複雑な構成を明らかにする。特に注目すべきは、エンハンサー要素および転写している領域内および間の対でのクロマチン相互作用についての富化である。複数の強いエンハンサーおよび高度に転写された領域が同時に同一核内で結合する、TAD間の豊富な3方向相互作用の特定は、高次接触からの制御要素が大きなゲノム領域にわたることを確認する。対照的に、核ラミナの近接は、より中枢のエンハンサークラスターへのアクセスの制限によりまたは複数接触の形成に利用可能な表面の制限により、高度転写TADが関与する高い複雑性の接触の形成を抑える。
重要なことに、GAMにより得た結果は、5C/Hi−Cによる優先的に自己結合するゲノム領域(TAD)の特定および生存細胞画像化における転写因子Sox2(エンハンサーマーカー)によりクロマチン結合される観察されるクラスタリングを含む、他の方法を使用してなした発見をどく利敵に確認する。同時に、GAMのゲノムワイドな規模および位置的情報の異なる面(接触、放射状配置および凝縮)の統合されたコレクションは、先の技術が提供し得なかった新しい解析の機会を加える。
SLICEの開発は、GAMデータセットからクロマチン相互作用に関する定量的情報を抽出できる、GAMのための一般的統計モデルを提供する。これは、ゲノム距離を考慮した、卓越した対でのおよび三方向接触の特定を可能にする。大きなGAMデータセットで、SLICEを、異なる核または染色体形状または体積、核末梢への結合および核アーキテクチャの他の特性を統合するように拡張でき、高分解能で特異的に相互作用するクロマチン領域の検出を増強する。
数千NPを含む大きなGAMデータセットは、対での、トリプレットでのおよびより高次の多重性接触の高い分解能定量化、ゲノムワイドな体積および放射状配置ならびに異なる接触の相互依存を含む、さらなる解析的可能性の探索を可能にするはずである(図4)。重要なことに、GAMは、これらの解析を、貴重な組織サンプル、例えば個々の患者の生検により得たものからのマイクロダイセクションにより特異的に選択された稀な細胞型に向けることができる。さらに、GAMは、単一細胞における特異的クロマチン接触および活性転写の同時の検出に適合性であるはずであり(Dey et al., 2015. Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3): 285-289)、これは、因果関係精査に極めて重要である。
要約すると、GAMは、ゲノム生物学者のレパートリーに強力な新規ツールを追加し、3次元クロマチン構造を細かく精査する我々の能力を顕著に拡大させ、広範なモデル系、細胞型および価値あるヒトサンプルにおいて多くの以前は回答不可能であった問題を実験的に扱いやすくする。稀な細胞型における染色体フォールディングの試験に対するGAMの独特な適合性は、ヒト疾患における天然の配列変動の役割の精査に貴重である。
方法
細胞培養
本実験に使用したマウスES細胞(mESC)は、E14tg2aのSox1−GFP誘導体である46C系統13であり、Domingos Henrique(Institute of Molecular Medicine, Lisbon, Portugal)から恵与された。mESC培養を、先に記載のとおり実施した14。簡潔にいうと、細胞を、37℃で5%COインキュベーター中、0.1%ゼラチン被覆皿の、10%ウシ胎児血清、2ng/ml LIFおよび1mM 2−メルカプトエタノール添加グラスゴー改変イーグル培地で増殖させた。細胞を隔日で継代した。採取24時間前の最後の継代後、mESCを無血清ESGROComplete Clonal Grade培地(Millipore Inc.)に再播種した。代わりに他の細胞を使用し得る。
凍結切片の調製
細胞を、先に記載するとおり凍結切片化のために調製した。簡潔にいうと、細胞を、250mM HEPES−NaOH中4%および8%パラホルムアルデヒドで固定し(pH7.6;それぞれ10分および2時間)、ペレット化し、2.1M スクロースのPBS溶液で包埋し(2時間)、液体窒素で凍結させた。凍結細胞を液体窒素で無限に保存できる。超薄凍結切片を、UltraCut UCT 52凍結超ミクロトーム(Leica, Milton Keynes, UK)を使用して、約220nm厚で切断した。切片を、スクロース溶液的に捕捉し、レーザーマイクロダイセクション(Leica, Milton Keynes, UK)用1mm厚PEN膜被覆グラスガラスに移した。スクロース包埋媒体を除去するために、スライドを、0.2μm濾過分子生物学グレードPBS(各5分)(3×)、次いで濾過超高純度HO(各5分)(3×)で洗浄し、15分乾燥させた。数例で、三回目のPBS洗浄を、分子生物学グレードヨウ化プロピジウム(1μg/mlのPBS溶液)での5分染色に置き換えた。
核プロファイルの単離
個々のNPを、PALM Microbeam Laserマイクロダイセクション顕微鏡(Carl Zeiss, Jena, Germany)を使用するレーザーマイクロダイセクションにより、凍結切片から単離した。核を、明視野画像化下に特定し、レーザーを使用して、各核を囲むスライド膜を切断した。次いで、切断NPを、不透明粘着性材料を満たしたPCR Cap Stripに、Laser Pressure Catapultを使用して発射した。8個の各ストリップにおける1ウェルを空のままにし、陰性対照としてWGA処理に使用した。これらの陰性対照中5個をまた品質管理目的でのシークエンシングライブラリー作成に使用した(図6a)。
全ゲノム増幅
WGA4キット(Sigma)を使用する全ゲノム増幅を、先に記載されたプロトコールをわずかに改変して実施した。水(13μl)を、単離NPを含む上に向けたPCRふたの各々に添加した(このおよび続く工程において、緩衝液の体積は、PCRキャップふたの内部表面全体を覆うように、提供業者のプロトコールに比して増加させている)。PKマスターミックス(8μl プロテイナーゼK溶液、128μl 10×単一細胞溶解および画分化緩衝液)を各ふたに添加し(1.4μl/ふた)および1μlのヒトゲノムDNAを、陽性対照として作用する核プロファイルを用いず、一ふたに添加した。ふたを96ウェルPCRプレートに押しつけ、50℃で4時間、倒置してインキュベートした。
インキュベーション後、PCRプレートを室温で5分冷まし、その後、倒置させ、800×gで3分遠心分離した。プレートを99℃で4分、PCR機中で熱不活性化させ、氷上で2分冷却させた。2.9μl 1×単一細胞ライブラリー調製緩衝液および1.4μl ライブラリー安定化溶液を各ウェルに添加し、プレートを95℃で4分インキュベートし、続いて氷上で2分冷却した。1.4μlのライブラリー調製酵素を各反応物に添加し、次いでプレートをPCR機で16℃で20分、24℃で20分、37℃で20分、最後に75℃で5分インキュベートした。
WGAライブラリー調製後、PCRプレートを、800×gで3分遠心分離した。10×増幅マスターミックス(10.8μl)、水(69.8μl)およびWGA DNAポリメラーゼ(7.2μl)を各ウェルに添加し、サンプルを、業者により提供されたプログラムを使用してPCR増幅した。
全ゲノム増幅を、一般に一日で実施したが、数例において、サンプルをプロトコールの途中で一夜、−20℃で保存し、この変数についての制御された試験におけるDNA検出で検出可能な再はなかった。
ハイスループットシークエンシングのためのライブラリー調製
WGA増幅DNAをQiagen MinElute PCR Purification Kitを使用して精製し、50μlの提供された溶出緩衝液に溶出した。各サンプルの濃度を、PicoGreen定量化により測定した。次いで、シークエンシングライブラリーをIllumina TruSeq DNA HT Sample Prep KitまたはTruSeq Nano DNA HTキットのいずれかを使用して製造した。いずれの場合も、サンプルを再懸濁緩衝液で55μlとした。DNA HTキットについて、最大1.1μg DNAを各反応物に添加し、一方Nanoキットでは、最大200ngを使用した。ライブラリーを、製造業者の指示に従い調製した。DNA HTキットについて、サンプルを、Pippin Prep機(Sage Science, Beverly, MA, USA)を無EtBr1.5%アガロースカセットと共に使用して、300〜500ヌクレオチドにサイズ選択した。Nanoキットで調製したサンプルは、ビーズベースの選択プロトコールを使用して350ヌクレオチドサイズに選択した。
ライブラリー調製後、ライブラリー濃度を、Qubit 2.0蛍光光度計(Thermo Fisher Scientific, Waltham, MA, USA)を使用して概算し、ライブラリーを、96のバッチに一緒にプールした。各ライブラリープールを、ラピッドランモードのIllumina HiSeq機の2レーンでの単一末端、100bpランで配列決定した。全解読の両端の30bp WGAアダプターの存在により、各ランの最初の30bpを、Illuminaにより提供されたカスタム・ラン・レシピを使用して、フローセル画像化なしに実施した(これらは暗サイクルとして知られる)。
ハイスループットシークエンシングデータ解析
解読を、Bowtie2を使用するマウスゲノムのmm9アセンブリにマッピングした15。一意的にマッピングされなかった、20未満の品質スコアを有したまたはPCRデュプリケートであった解読は除いた。
GAMサンプルにおける正のウィンドウの呼び出し
マウスゲノムを、bedtools16を使用して等サイズウィンドウに分け、bedtools multibamcovを使用して、各ゲノムウィンドウで重複する各核プロファイルにおける解読数を計算した。PandasおよびNumPy pythonパッケージ17を、各ウィンドウで重複する解読数からヒストグラムを計算するのに使用し、SciPyからのfmin関数を使用して、陰性二項式分布(シークエンシングノイズを表す)および対数正規分布(真のシグナルを表す)を深度ヒストグラムにフィットさせた。二項式分布へのフィットのためのパラメータを使用して、単一ゲノムウィンドウへのx解読マッピングを観察する確率が0.001未満であった、解読xの閾値数を決定した。このような閾値は、ゆえに、各サンプルで独立して決定され、ウィンドウを、配列決定解読の数が決定した閾値より大きかったならば、正としてスコア化した。
サンプル品質管理
低品質データセットを解析から除くために、多数の品質計量基準を各サンプルで測定した。マッピングした解読のパーセンテージおよび非PCRデュプリケート解読のパーセンテージを、カスタムpythonスクリプトにより測定した。シークエンシング品質計量基準を、FastQC(bioinformatics.babraham.ac.uk/projects/fastqc)を使用して各サンプルについて決定し、カスタム・スクリプトを、FastQCアプトプットファイルからの塩基あたりの平均シークエンシング品質スコア、ジヌクレオチド反復数および単一ヌクレオチド反復数の抽出に使用した。サンプル汚染の可能性をFastq-screen(bioinformatics.babraham.ac.uk/projects/fastq_screen)を使用して確認した。核をとおした薄切片は、全ゲノムの特徴を含み、クラスターに組織化され、全常染色体性染色体を含まないと予測された。それゆえに、カスタムpythonスクリプトを、正とスコア化されたウィンドウの総数、他の正のウィンドウのすぐ隣の正のウィンドウの数および各サンプルに対する正の染色体の数を測定するために開発した。これらの品質計量基準の全ては、Principle Components Analysisに供給され、5個の陰性対照を最良に区別する成分を探索した。この解析は、マッピングした解読のパーセンテージが、最も予測的な計量基準であることを決定した。陰性対照は、最大で2%のマッピングした解読を有し、ゆえに、マッピングした解読が<15%である全サンプルを保存的閾値として除外した。
シークエンシング深度飽和点計算
NumPyを使用して、サンプルあたりウィンドウあたりの解読深度のマトリクスから解読を収縮処理した。13の新マトリクスを、10%〜95%の収縮処理率で作成し、正のウィンドウを、縮小データセットの各々のために呼び出した。各サンプルを縮小データセットにわたり比較して、特定された正のウィンドウ数が収縮処理後残っている解読のパーセンテージに対してプロットされる、飽和曲線を得た。サンプルを、飽和曲線を2部に分け、2部の線形回帰を全曲線と比較することにより飽和または不飽和として分類した。推定飽和点は、2部フィットからのR二乗値の平均が最高であった点として定義した。サンプルを、2部の二つ目の勾配が最初の勾配未満であるならば(すなわち、特定されたさらなる正のウィンドウの数が、高い解読深度でよりゆっくり増加するならば)および2部フィットの平均R二乗が、曲線全体に対する直線的フィットのR二乗より0.25を超えて大きいならば(すなわち、曲線が直線と有意に異なるならば)、飽和として分類した。
蛍光インサイチュハイブリダイゼーション
DNA FISHを、先に記載のとおり実施した18。マウスES−OS25細胞(W. Bickmoreから恵与)を、先に記載のとおり増殖させた36。HoxB13、HoxB1−3およびSkap1座位を、フォスミドプローブ(それぞれG135P6799B3、G135P67637D6およびG135P60674A4)で検出した。フォスミドプローブは、BACPAC Resources(California, USA)から得た。フォスミドプローブの特異性を、特定のプライマーを使用するPCRで確認した(示していない)。プローブをニックトランスレーション(Roche)によりジゴキシゲニン−11−dUTP、フルオレセイン−12−dUTPまたはテトラメチル−ローダミン−5−dUTPで標識し、MicroBioSpin P-30クロマトグラフィーカラム(BioRad, Hertfordshire, UK)を使用して、取り込まれていないヌクレオチドと分けた。ローダミン標識プローブのシグナルを、ウサギ抗ローダミン抗体(2時間;1:500;Invitrogen)およびウサギIgGに対するCya93接合ロバ抗体(1時間;1:1000;Jackson ImmunoResearch Laboratories)で増幅させた。ジゴキシゲニンで標識されたプローブをヒツジ抗ジゴキシゲニンFabフラグメント(2時間;1:200;Roche)およびヒツジIgGに対するAlexaFluor555ロバ抗体(1時間;1:1000;Invitrogen)で検出した。FITCで標識したプローブは、FITCに対するマウス抗体(1時間、1:500;Jackson ImmunoResearch Laboratories)およびマウスIgGに対するAlexaFluor488ロバ抗体(1時間、1:1000;Invitrogen)で検出した。核をDAPIで染色し、カバーガラスをVectaShield(Vector Laboratories)を用いてマウントして、画像化した。405nmダイオードおよびアルゴン(488nm)、HeNe(543nm)およびHeNe(633nm)レーザーを備えた共焦点レーザー走査型顕微鏡(Leica TCS SP5; 63x oil objective, NA 1.4)で、1 Airyディスクと等価なピンホールを使用して画像を得た。異なるチャネルからの画像を、蛍光表面滲みを防止するために逐次的に回収した。生画像(TIFFファイル)をImageJで統合し、Adobe Photoshopで二値化せずにコントラストを拡張した。
連鎖マトリクスの計算
定義ゲノム領域の連鎖マトリクスを計算するために、目的の領域と重複する各サンプルからのゲノムウィンドウをまず抽出した。ウィンドウが重複するウィンドウの全ての可能性のある対について、共分離は、両ウィンドウが核プロファイルの総数で除して正としてスコア化される核プロファイルの数である。
連鎖不平衡(D)および正規化連鎖不平衡(D’)を先に定義されたとおり計算した。簡潔には、2ゲノムウィンドウAおよびB間の連鎖を、AおよびBの共分離(上記参照)から限界的検出頻度の積を減じたものとして定義した。Aの限界的検出頻度は、単にAが核プロファイルの総数の除算により検出される核プロファイルの数である。2ゲノムウィンドウAおよびB間の正規化連鎖は、AおよびB間の可能性のある最高連鎖で除したAおよびBの連鎖として定義した(Dmax)。連鎖>0であるならば、Dmaxは、min((marg(A)*(1−marg(B)))、(marg(B)*(1−marg(A))))として計算され、式中、marg(A)はAの限界的検出頻度である。連鎖<0であるならば、Dmaxはmin((marg(A)*marg(B))、((1−marg(A))*(1−marg(B))))として計算される。
ここで、marg(A)はAの限界的検出頻度である。同一染色体上の全領域間の連鎖のヒートマップを結合マトリクスL(i,j)から計算し、ここで、各エントリーは、iおよびjの正規化連鎖である。これらの計算を、座位数の考察に拡張できるのは自明である。例えば、3座位間の連鎖を、A、BおよびCの共分離から、A、BおよびCの限界的検出頻度の積を減じたものとして計算する。
相互作用データセットからの区画AおよびBの定義
区画AおよびBを、GAMおよび先に公開された方法8,23によるHi−Cについて計算した。各染色体は、各エントリーが座位iと座位j間の観察される相互作用を記録するマトリクスO(i,j)として表される。各エントリーが、iとjの間と等距離のマトリクスOにおける全位置についての相互作用の平均数である、新規マトリクスE(i,j)を作成した。OをEで除して、予測値を超えた観察値のマトリクスであるK(i,j)を得た。次いで、各位置が、マトリクスKのカラムiとカラムjの間の相関である、最終マトリクスC(i,j)を計算した。主成分分析を相関マトリクスC上で行い、最大偏差を説明する3成分を次いで抽出した。これらの3成分で、GC含量と最良の相関を有するものをAおよびB区画の定義に使用する。
GAM/Hi−Cマトリクスにおけるバイアスの概算
GAMおよびHi−Cでバイアスを比較するために、50kbゲノムウィンドウを、平均GC含量に基づき、10個の等しい群に割り当てた。次いで、予測値を超える観察値(OE)マトリクスを、50kb分解能でGAMおよびHi−Cデータ両者からの染色体について計算した(“相互作用データセットからの区画AおよびBの定義”参照)。2GC含量群の各組み合わせについて、2群のウィンドウ間の接触について平均OE値を取り、GC含量による平均OE値のヒートマップを得た。次いで同じアプローチを繰り返し、平均マッピング能、含まれるHindIII部位数、平均複製時間またはアノテートゲノム反復と重複する各50kbウィンドウのパーセンテージにより50kbウィンドウを層別化した。
形態的に関係するドメインの特定
形態的に関係するドメイン境界の一覧を、mESCにおける先の研究から得た。平均正規化連鎖不平衡を、非対角相互作用の指標としての連鎖マトリクスの対角線からの2ウィンドウのオフセットとして移動させた3x3ボックスにおいて測定した。先に記載された位相的ドメイン境界での非対角相互作用と、ドメイン境界の150kb上流および下流の非対角相互作用の比較により、非対角相互作用の欠乏が、データセットにおけるこれらの先に定義された境界について測定された。この欠乏の統計的有意性を、観察される非対角欠乏と、5000の無作為にシャッフルしたTADセットで測定された欠乏を比較することにより評価した。
SLICE法を使用するGAMデータからの相互作用確率の抽出
2座位を含むチューブ数と座位対の少なくとも1メンバーを含むチューブ数の比率を、マウスゲノムにおける30kbウィンドウの全対について測定した。次いで、同一ゲノム距離での座位の全対にわたるこの比の平均を取り、各染色体について別々に計算した。このゲノム平均と、各個々の座位対について観察される比の比較により、同一染色体で同じ距離の座位の平均対より高頻度で共分離される座位の対を特定することが可能であった。数学的モデルを使用して、この比率の観察される値を生じるために、近接(<100nm)相互作用を有する必要があるであろう細胞の比を概算した。次いで、観察される比が、そのゲノム距離での非相互作用座位について予測される比率の第95パーセンタイル内であったあらゆる座位を廃棄した。
トリプレットで相互作用するTADの解析
同時に相互作用するTADのトリプレットを特定するために、全3個のTADが、SLICEにより特定して顕著な対での相互作用を示した、3個のTADのセットをまず特定した。全てのこのようなトリプレットについて、TADを構成する40kbウィンドウ全てのPiを、SLICEを使用して計算した。40kbウィンドウを、ここでは、Dixon et al. (2012)が40kb分解能で示したTAD位置として使用した。最後に、全トリプレットを、平均Piによりランク付けし、上位5%を富化解析のために選択した。TADを、先に定義したスーパーエンハンサー(SE;Whyte et al., 2013)のいずれかと重複するならば、SE TADとして定義した。SEと重複しないTADを、GRO−seq被覆率が、それぞれ第一四分位であるか第三四分位を超えるならば、低転写または高転写として分類した。被覆率の2四分位点の中間にあるTADを、中位転写として分類した。富化を、各TADトリプレットクラス(例えばSE/SE/SE)の観察される数をTADトリプレットの平均500を超える無作為に並べ換えた一覧で除して計算し、観察されるカウントが、無作為に並べ換えた値の全てより大きいかまたは小さいとき、有意と呼称した。
トリプレット形成に対する核ラミナ結合の影響を解析するために、mESC細胞におけるLAD領域の一覧(Peric-Hupkes, D. et al. Molecular Maps of the Reorganization of Genome-Nuclear Lamina Interactions during Differentiation. Mol. Cell 38, 603-613 (2010))を使用した。TADを、TADを含む上位5%におけるトリプレットの数により、最高(上位15%)および最小(下位15%)トリプレット形成に分類した。各カテゴリーにおけるTADのLADへの距離を、closestBEDツール(Quinlan et al., 2010)を使用して計算した。
5kb分解能での平均連鎖の解析
30kbウィンドウでのクロマチン相互作用が、それらが含む特性(TSS、TESおよびエンハンサー)の中心であるかを定義するために、エンハンサーまたは活性遺伝子(FPKM>1;長さ>120kb)のTSS/TESの正確に1個と重複するが、他の遺伝子またはエンハンサーとはしない各30kbウィンドウを、6非重複5kbウィンドウに細分した。続いて、他の相互作用“エンハンサー”または“活性”30kbウィンドウとの正規化連鎖不平衡(包含30kbウィンドウ対相互作用30kbウィンドウのSLICE p値=0.05)を、目的の特性と重複する5kbウィンドウ±3 5kbウィンドウ上流/下流について計算した。これにより、各列が30kbウィンドウ間の単一相互作用を表し、行が目的の5kbウィンドウ±3 5kbウィンドウ上流/下流の連鎖を表す、マトリクスを得た。距離効果について正規化するために、各裂をその平均で除した。次に、各行の平均を取って、目的の5kbウィンドウからの各距離で平均連鎖を得た。最後に、これらの平均値を、最初および最後の行の平均で除して、15kb上流/下流に対するTSSでの平均富化を得た。対照として、同一特性(エンハンサー、TSS、TES)を含む非相互作用(SLICE p値>0.05)30kbウィンドウ対を使用した。類似の距離分布を確実にするために、各ゲノム距離範囲についてのビンカウントは同じであるように、真の相互作用をゲノム距離により10ビンにソートし、対照群を無作為に減少させた。
40kb分解能での平均三方向連鎖の解析
全てスーパーエンハンサー(“SE/SE/SE”)を含む3ウィンドウ間のトリプレットクロマチン接触が、含まれるスーパーエンハンサーについて中央に置かれるか否かを決定するために、40kb長未満であった単一SEを含む全TADを選択した。40kbウィンドウは、SEならびに±3 40kbウィンドウ上流/下流について中央に置かれた。TAD境界がこれらの40kbウィンドウ内に入ったTADを廃棄した。次に、選択したTADに関与する全“SE/SE/SE”トリプレットに基づき、SE含有40kbウィンドウおよび2パートナーSE TADにおける全40kbウィンドウ間の平均三方向正規化連鎖不平衡を計算した。これを、選択したSE含有40kbウィンドウの40kbウィンドウ上流/下流について繰り返した。対での平均結合について上に記載するとおり、各得られた列をその平均で除し、次いで、各行について平均を取り、最後に、結果を最初/最後の行の平均で除した。全プロセスを、“SE/高/高”TADに対応する上位トリプレットの一覧における選択したSE−TADとこれらのパートナー高度転写(高)TADの同一セットおよび同一ゲノム距離に伸長した非相互作用“SE/SE/SE”トリプレットTAD(対照)で繰り返した。
GAMデータからの染色体放射状位置の概算
核中心に対する各NPの緯度の近似として、各染色体の被覆率を、各NPについてのMbあたりの解読の平均数として計算した。各染色体について、その染色体が被覆率の上位四分位にあった全てのNPを取り、正であった全ゲノム1Mbウィンドウのパーセンテージを計算した。NPのパーセンテージ被覆率は、その半径の指標であり(Branco et al., 2008)、それゆえにある染色体を含むNPの平均パーセンテージ被覆率は、その染色体がNPにおいて大きな半径(より中枢に位置する染色体として予測される)で出現する優先度の指標である。本発明者らは、染色体1、2、9、11および14を含むNPの平均パーセンテージ被覆率を、Mayer et al. (2005)において先に測定された放射状位置と相関させ、より末梢の染色体が、NPで低ゲノム被覆率で見られるとの傾向を発見した。
GAMデータからの座位体積の概算
マウスゲノムを30kbウィンドウに分け、各ウィンドウが検出されたNPの数を計算した(その検出頻度)。この値は、各30kbウィンドウにわたり、先に公開されたGRO−seqデータセットの平均被覆率(Min et al., 2011)およびDNAse−seqの平均被覆率(ヌクレオソームレベルでのクロマチン解放の指標;Yue, F. et al. 2014. Nature 515, 355-364)。
引用文献
1. Dear, P. H. & Cook, P. R. Happy mapping: a proposal for linkage mapping the human genome. Nucleic Acids Res. 17, 6795-807 (1989).
2. Guillot, P. V, Xie, S. Q., Hollinshead, M. & Pombo, A. Fixation-induced redistribution of hyperphosphorylated RNA polymerase II in the nucleus of human cells. Exp. Cell Res. 295, 460-8 (2004).
3. Branco, M. R. & Pombo, A. Intermingling of chromosome territories in interphase suggests role in translocations and transcription-dependent associations. PLoS Biol. 4, e138 (2006).
4. Emmert-Buck, M. R. et al. Laser capture microdissection. Science 274, 998-1001 (1996).
5. Baslan, T. et al. Genome-wide copy number analysis of single cells. Nat. Protoc. 7, 1024-41 (2012).
6. Lewontin, R. C. The Interaction of Selection and Linkage. I. General Considerations; Heterotic Models. Genetics 49, 49-67 (1964).
7. Dixon, J. R. et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature 485, 376-380 (2012).
8. Lieberman-Aiden, E. et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science 326, 289-93 (2009).
9. Khalil, A. et al. Chromosome territories have a highly nonspherical morphology and nonrandom positioning. Chromosome Res. 15, 899-916 (2007).
10. Mateos-Langerak, J. et al. Spatially confined folding of chromatin in the interphase nucleus. Proc. Natl. Acad. Sci. U. S. A. 106, 3812-7 (2009).
11. Brookes, E. et al. Polycomb Associates Genome-wide with a Specific RNA Polymerase II Variant, and Regulates Metabolic Genes in ESCs. Cell Stem Cell 10, 157-70 (2012).
12. Chen, C., Morris, Q. & Mitchell, J. a. Enhancer identification in mouse embryonic stem cells using integrative modeling of chromatin and genomic features. BMC Genomics 13, 152 (2012).
13. Ying, Q.-L., Stavridis, M., Griffiths, D., Li, M. & Smith, A. Conversion of embryonic stem cells into neuroectodermal precursors in adherent monoculture. Nat. Biotechnol. 21, 183-6 (2003).
14. Abranches, E. et al. Neural differentiation of embryonic stem cells in vitro: a road map to neurogenesis in the embryo. PLoS One 4, e6286 (2009).
15. Langmead, B. & Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nat. Methods 9, 357-9 (2012).
16. Quinlan, A. R. & Hall, I. M. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics 26, 841-2 (2010).
17. Oliphant, T. E. Python for Scientific Computing. Comput. Sci. Eng. 9, 10-20 (2007).
18. Ferrai, C. et al. Poised transcription factories prime silent uPA gene prior to activation. PLoS Biol. 8, e1000270 (2010).
19. O’Sullivan, J. M., Hendy, M. D., Pichugina, T., Wake, G. C. & Langowski, J. The statistical-mechanics of chromosome conformation capture. Nucleus 4, 390-8 (2013).
20. Sexton, T. et al. Three-dimensional folding and functional organization principles of the Drosophila genome. Cell 148, 458-72 (2012).
21. Gavrilov, A. a et al. Disclosure of a structural milieu for the proximity ligation reveals the elusive nature of an active chromatin hub. Nucleic Acids Res. 41, 3563-75 (2013).
22. Yaffe, E. & Tanay, A. Probabilistic modeling of Hi-C contact maps eliminates systematic biases to characterize global chromosomal architecture. Nat. Genet. 1-9 (2011). doi:10.1038/ng.947
23. Imakaev, M. et al. Iterative correction of Hi-C data reveals hallmarks of chromosome organization. Nat. Methods 9, 999-1003 (2012).
24. Hu, M. et al. HiCNorm: removing biases in Hi-C data via Poisson regression. Bioinformatics 28, 3131-3133 (2012).
25. Kruse, K., Sewitz, S. & Babu, M. M. A complex network framework for unbiased statistical analyses of DNA-DNA contact maps. Nucleic Acids Res. 41, 701-710 (2012).
26. Van Berkum, N. L. et al. Hi-C: a method to study the three-dimensional architecture of genomes. J. Vis. Exp. e1869 (2010). doi:10.3791/1869
27. Barbieri, M. et al. Complexity of chromatin folding is captured by the strings and binders switch model. Proc. Natl. Acad. Sci. U. S. A. 109, 16173-8 (2012).
28. Pombo A. 2003. Cellular genomics: which genes are transcribed when and where? Trends Biochem. Sci. 28, 6
29. Belmont A.S., 2014. Large scale chromatin organization: the good, the surprising, and the still perplexing. Curr Op Cell Biol 26, 69
30. Chen et al., 2014. Nano-Dissection and Sequencing of DNA at Single Sub-Nuclear Structures. Small 10:3267.
31. Lucic V., et al., 2013. Cryo-electron tomography: The challenge of doing structural biology in situ. J Cell Biol 202 (3), 407.
32. Deng et al., 2014. Manipulating nuclear architecture. Curr Op Genet Dev. 25:1-7.
33. Chetverin AB, Chetverina HV, 2008. Molecular colony technique: a new tool for biomedical research and clinical practice. Prog. Nucleic Acid Res. Mol. Biol 82:219-255.
34. Pombo A, et al. 1999. Bridging the resolution gap: Imaging the same transcription factories in cryosections by light and electron microscopy. J. Histochem. Cytochem. 47, 471-480.
35. Maxwell S, et al. 2005. Pitx3 regulates tyrosine hydroxylase expression in the substantia nigra and identifies a subgroup of mesencephalic dopaminergic progenitor neurons during mouse development. Dev. Biol., 282(2):467-479
36. Stock JK, et al. (2007) Ring1-mediated ubiquitination of H2A restrains poised RNA polymerase II at bivalent genes in mouse ES cells. Nat. Cell Biol. 9: 1428-35
37. Gavrilov AA, et al. 2014. Quantitative analysis of genomic element interactions by molecular colony technique. Nucl. Acids Res. 42 (5):e36
38. Maeburn KJ, et al. 2009. Disease-specific gene repositioning in breast cancer. J. Cell Biol. 187(6):801-12;
39. Kubben N, et al.2012. Mapping of lamin A- and progerin-interacting genome regions. Chromosoma 121(5): 447-64
40. Simonis M, et al. 2006. Nuclear organisation of active and inactive chromatin domains uncovered by chromosome conformation capture-on-chip (4C). Nat. Genet. 38 (11): 1348-54
41. Dubochet J, et al. 1988. Cryo-electron microscopy of vitrified specimens. Q. Rev. Biophys. 21: 129
42. Markenscoff-Papadimitriou E, et al. 2014. Enhancer Interaction Networks as a Means for Singular Olfactory Receptor Expression. Cell 159: 543-557
43. Schoenfelder S, et al. 2010. Preferential associations between co-regulated genes reveal a transcriptional interactome in erythroid cells. Nat. Genet. 42: 53-61
44. Min, I. M. et al. Regulating RNA polymerase pausing and transcription elongation in embryonic stem cells. Genes Dev. 25, 742-54 (2011).
45. Whyte, W. a et al. Master transcription factors and mediator establish super-enhancers at key cell identity genes. Cell 153, 307-19 (2013).
46. Mayer, R. et al. Common themes and cell type specific variations of higher order chromatin arrangements in the mouse. BMC Cell Biol. 6, 44-66 (2005).
47. Liu, Z. et al. 3D imaging of Sox2 enhancer clusters in embryonic stem cells. Elife 3, 1-29 (2014).
48. Pombo, a et al. Regional specialization in human nuclei: visualization of discrete sites of transcription by RNA polymerase III. EMBO J. 18, 2241-53 (1999).
49. Osborne, C. S. et al. Active genes dynamically colocalize to shared sites of ongoing transcription. Nat. Genet. 36, 1065-71 (2004).
50. Peric-Hupkes, D. et al. Molecular Maps of the Reorganization of Genome-Nuclear Lamina Interactions during Differentiation. Mol. Cell 38, 603-613 (2010).
51. Branco, M. R., Branco, T., Ramirez, F. & Pombo, A. Changes in chromosome organization during PHA-activation of resting human lymphocytes measured by cryo-FISH. Chromosome Res. 16, 413-26 (2008).
52. Dey, S. S., et al. Integrated genome and transcriptome sequencing from the same cell. Nat. Biotechnol. 33, 285-289 (2015).
53. Binder, K. Applications of Monte Carlo methods to statistical physics. Reports Prog. Phys. 60, 487-559 (1999)
54. Northcott P A. et al. Enhancer hijacking activates GFI1 family oncogenes in medulloblastoma. Nature 511, 428-434 (2014).
55. Lettice L A, et al. Enhancer-adoption as a mechanism of human developmental disease. Hum. Mutat. 32, 1492-9 (2011)
56. Ing-Simmons et al. Spatial enhancer clustering and regulation of enhancer-proximal genes by cohesin. Genome Res. 25: 504-513 (2015)
57. Smemo et al. 2014 Obesity-associated variants within FTO form long-range functional connections with IRX3. Nature 507, 371
58. Williamson, I. et al. 2014. Spatial genome organization: contrasting views from chromosome conformation capture and fluorescence in situ hybridization. Genes Dev. 28, 2778-2791
59. Oeffinger M, et al, 2007 Comprehensive analysis of diverse ribonucleoprotein complexes. Nat Methods. 4, 951-6;
60. Hakhverdyan et al. 2015. Rapid, optimized interactomic screening. Nature Methods 12, 553
61. Pauciullo A, et al. 2014 Development of a sequential multicolor-FISH approach with 13 chromosome-specific painting probes for the rapid identification of river buffalo (Bubalus bubalis, 2n=50) chromosomes. J Appl Genet. 55(3):397-401. doi: 10.1007/s13353-014-0207-z.
62. Leshner M, et al. Locus-specific gene repositioning in prostate cancer. Mol Biol Cell. 2015. pii: mbc.E15-05-0280. [印刷前のEpub]
63. Meaburn KJ, et al. 2009 Disease-specific gene repositioning in breast cancer. J Cell Biol.;187(6):801-12. doi: 10.1083/jcb.200909127.
64. Barutcu AR, et al. 2015. Chromatin interaction analysis reveals changes in small chromosome and telomere clustering between epithelial and breast cancer cells. Genome Biol. 16(1):214. doi: 10.1186/s13059-015-0768-0).
65. Yue, F. et al. A comparative encyclopedia of DNA elements in the mouse genome. Nature 515, 355-364 (2014).

Claims (15)

  1. 区画における複数の核酸座位の空間的近接を決定する方法であって、
    (a)区画における局在化に応じて、互いの核酸座位を凍結切片化または凍結粉砕により、好ましくは、凍結切片化により分離して、画分のコレクションを得て;
    (b)該画分における複数の座位の存在または不存在を決定し;そして
    (c)該複数の座位の共分離を決定する、
    工程を含む、方法。
  2. 核酸がDNAおよび/またはRNA、好ましくは、DNAである、請求項1に記載の方法。
  3. 区画が真核細胞、ミトコンドリアまたは原核細胞の核である、請求項1または2に記載の方法。
  4. 工程(a)の前にホルムアルデヒドでの架橋がある、請求項1〜3のいずれかに記載の方法。
  5. 工程(a)における分離を、区画の凍結超薄切片化により行う、請求項1〜4のいずれかに記載の方法。
  6. 工程(a)において1区画が約5〜300画分、好ましくは、約40〜60画分に分けられる、請求項1〜5のいずれかに記載の方法。
  7. 画分のコレクションが180を超える画分を含む、請求項1〜6のいずれかに記載の方法。
  8. 画分のコレクションを複数の区画から得る、請求項1〜7のいずれかに記載の方法。
  9. 複数の座位が、2座位乃至区画における全核酸座位である、請求項1〜8のいずれかに記載の方法。
  10. 少なくとも3個の共分離座位の検出が可能である、請求項1〜9のいずれかに記載の方法。
  11. 複数の座位の存在または不存在を非顕微鏡的方法を使用して検出する、請求項1〜10のいずれかに記載の方法。
  12. 複数の座位の存在または不存在をシークエンシング、好ましくは、次世代シークエンシングにより決定する、請求項1〜11のいずれかに記載の方法。
  13. 空間的近接が、座位が、好ましくは染色体上のそれらの直線的ゲノム距離から予測されるより高い頻度で共分離されるとき、空間において近位であると決定される、推計統計法を含む群から選択される統計法での共分離の解析により決定される、請求項1〜12のいずれかに記載の方法。
  14. (a)複数の座位間の物理的距離の決定;
    (b)区画における座位および/またはゲノムアーキテクチャのマッピング;
    (c)複数の座位間の相互作用の可能性の決定;
    (d)区画における座位または染色体の末梢または中枢位置の決定;
    (e)プロモーター、エンハンサー、例えば、転写に関係する酵素、RNA、転位性要素、転写因子結合部位、リプレッサー、遺伝子体、スプライシングシグナルからなる群から選択される異なる機能的要素の相互作用の解析;
    (f)特定の遺伝子の発現を制御する制御領域の特定;
    (g)座位の共分離に影響し得る薬物の標的および/または効果の特定;
    (h)座位の共分離に対する遺伝子治療の効果の解析;
    (i)疾患における共分離の乱れの解析;
    (j)染色体再配列マッピング;
    (k)座位の共分離の乱れと関係する疾患の診断;
    (l)特定の疾患を有する患者のある座位の近接に応じた、特定の薬物処置に応答する可能性が高いまたは低いサブグループへの層別化;
    (m)クロマチンの凝縮決定;および/または
    (n)内在性座位と相互作用する外来性核酸上の座位の特定
    のための、請求項1〜13のいずれかに記載の方法の使用。
  15. 患者における乱れた座位の共分離、放射状配置またはクロマチンの凝縮と関係する疾患を診断する方法であって、該患者から採取したサンプルにおいて、請求項1〜13のいずれかに記載の方法で患者における複数の座位の共分離または座位の検出頻度を解析し、該共分離または検出の頻度と、該疾患を有するとすでに診断されている対象における該座位の共分離または検出頻度を比較することを含み、ここで、共分離は好ましくはまた健常対象における共分離も含み、
    所望により、患者における座位の共分離の乱れと関係する疾患を診断する方法でもあり、該患者から採取したサンプルにおいて、請求項1〜13のいずれかに記載の方法で患者における複数の座位の共分離を解析し、該共分離と、該疾患を有するとすでに診断されている対象における該座位の共分離を比較することを含み、ここで、共分離は好ましくはまた健常対象における共分離も含む、方法。
JP2017531604A 2014-12-11 2015-12-11 ゲノムアーキテクチャマッピング Active JP6837970B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14197405.5A EP3031929A1 (en) 2014-12-11 2014-12-11 Genome architecture mapping
EP14197405.5 2014-12-11
PCT/EP2015/079413 WO2016092070A1 (en) 2014-12-11 2015-12-11 Genome architecture mapping

Publications (2)

Publication Number Publication Date
JP2017537640A true JP2017537640A (ja) 2017-12-21
JP6837970B2 JP6837970B2 (ja) 2021-03-03

Family

ID=52102530

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017531604A Active JP6837970B2 (ja) 2014-12-11 2015-12-11 ゲノムアーキテクチャマッピング

Country Status (8)

Country Link
US (1) US10526639B2 (ja)
EP (2) EP3031929A1 (ja)
JP (1) JP6837970B2 (ja)
CN (1) CN107406873B (ja)
CA (1) CA2968629C (ja)
DK (1) DK3230465T3 (ja)
IL (1) IL252591B (ja)
WO (1) WO2016092070A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2019008227A (es) 2017-01-10 2020-08-17 Juno Therapeutics Inc Analisis epigenetico de terapia celular y metodos relacionados.
CN110582578B (zh) * 2017-02-10 2024-02-02 洛克菲勒大学 用于细胞类型特异性谱分析以鉴定药物靶标的方法
CN108647492B (zh) * 2018-05-02 2019-04-16 中国人民解放军军事科学院军事医学研究院 一种染色质拓扑相关结构域的表征方法及装置
CN109448783B (zh) * 2018-08-07 2022-05-13 清华大学 一种染色质拓扑结构域边界的分析方法
CN115485391A (zh) 2020-02-17 2022-12-16 10X基因组学有限公司 染色质相互作用的原位分析
AU2021258994A1 (en) * 2020-04-23 2022-11-03 Koninklijke Nederlandse Akademie Van Wetenschappen Structural variation detection in chromosomal proximity experiments
EP3988669A1 (en) * 2020-10-22 2022-04-27 Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft Method for nucleic acid detection by oligo hybridization and pcr-based amplification

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500031A (ja) * 2005-07-04 2009-01-08 エラスムス ユニバーシティ メディカル センター 染色体コンフォメーションキャプチャ−オン−チップ(4c)アッセイ

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7625697B2 (en) * 1994-06-17 2009-12-01 The Board Of Trustees Of The Leland Stanford Junior University Methods for constructing subarrays and subarrays made thereby
GB0810051D0 (en) * 2008-06-02 2008-07-09 Oxford Biodynamics Ltd Method of diagnosis
SG171916A1 (en) * 2008-12-02 2011-07-28 Bio Rad Laboratories Chromatin structure detection
AU2012211957B2 (en) * 2011-02-04 2017-02-23 The Trustees Of The University Of Pennsylvania A method for detecting chromosome structure and gene expression simultaneously in single cells
US20140073520A1 (en) * 2011-12-23 2014-03-13 California Institute Of Technology Imaging chromosome structures by super-resolution fish with single-dye labeled oligonucleotides
CA2909972A1 (en) * 2013-05-23 2014-11-27 The Board Of Trustees Of The Leland Stanford Junior University Transposition into native chromatin for personal epigenomics

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500031A (ja) * 2005-07-04 2009-01-08 エラスムス ユニバーシティ メディカル センター 染色体コンフォメーションキャプチャ−オン−チップ(4c)アッセイ

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
BRANCO, M.R., ET AL., CHROMOSOME RESEARCH, vol. 16, JPN6019037957, 2008, pages 413 - 426, ISSN: 0004260965 *
BRANCO, M.R., ET AL., PLOS ONE, vol. 4, no. 5, JPN6019037956, May 2006 (2006-05-01), pages 138 - 780, ISSN: 0004260964 *
CHEN, B.K., ET AL., SMALL, vol. 10, no. 16, JPN6019037958, 3 May 2014 (2014-05-03), pages 3267 - 3274, ISSN: 0004260966 *
COMBS, P.A., ET AL., PLOS ONE, vol. 8, no. 8, JPN6019037959, August 2013 (2013-08-01), pages 71820 - 1, ISSN: 0004260967 *
JUNKER, J.P., ET AL., CELL, vol. 159, JPN6019037961, 23 October 2014 (2014-10-23), pages 662 - 675, ISSN: 0004260968 *

Also Published As

Publication number Publication date
CA2968629C (en) 2023-01-03
EP3031929A1 (en) 2016-06-15
EP3230465A1 (en) 2017-10-18
IL252591A0 (en) 2017-07-31
CA2968629A1 (en) 2016-06-16
US20170342462A1 (en) 2017-11-30
WO2016092070A1 (en) 2016-06-16
JP6837970B2 (ja) 2021-03-03
US10526639B2 (en) 2020-01-07
CN107406873A (zh) 2017-11-28
CN107406873B (zh) 2021-07-09
DK3230465T3 (da) 2020-01-27
IL252591B (en) 2022-01-01
EP3230465B1 (en) 2019-10-16

Similar Documents

Publication Publication Date Title
Beagrie et al. Complex multi-enhancer contacts captured by genome architecture mapping
US11519032B1 (en) Transposition of native chromatin for personal epigenomics
JP6837970B2 (ja) ゲノムアーキテクチャマッピング
US20240076637A1 (en) Transposase-mediated imaging of the accessible genome
Dong et al. Identification of balanced chromosomal rearrangements previously unknown among participants in the 1000 Genomes Project: implications for interpretation of structural variation in genomes and the future of clinical cytogenetics
Cabili et al. Localization and abundance analysis of human lncRNAs at single-cell and single-molecule resolution
Bouwman et al. Genome-wide detection of DNA double-strand breaks by in-suspension BLISS
Troll et al. Structural variation detection by proximity ligation from formalin-fixed, paraffin-embedded tumor tissue
Wang et al. Spatial transcriptomics: recent developments and insights in respiratory research
Cattaneo et al. DOT1L regulates chamber-specific transcriptional networks during cardiogenesis and mediates postnatal cell cycle withdrawal
Marti-Marimon et al. Major reorganization of chromosome conformation during muscle development in pig
Perez-Rodriguez et al. Somatic CNV Detection by Single-Cell Whole-Genome Sequencing in Postmortem Human Brain
Troll et al. Structural variation detection by proximity ligation from FFPE tumor tissue
Darbellay et al. Pre-hypertrophic chondrogenic enhancer landscape of limb and axial skeleton development
Darbellay et al. Chondrogenic Enhancer Landscape of Limb and Axial Skeleton Development
Alexander et al. Single-nucleus multiomics reveals the gene-regulatory networks underlying sex determination of murine primordial germ cells
Kribelbauer et al. Context-dependent gene regulation by transcription factor complexes

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20180228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20180228

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200811

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210210

R150 Certificate of patent or registration of utility model

Ref document number: 6837970

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250