JP2016537029A - 三次元dna構造におけるヌクレオチド配列の相互作用を分析する方法 - Google Patents

三次元dna構造におけるヌクレオチド配列の相互作用を分析する方法 Download PDF

Info

Publication number
JP2016537029A
JP2016537029A JP2016553748A JP2016553748A JP2016537029A JP 2016537029 A JP2016537029 A JP 2016537029A JP 2016553748 A JP2016553748 A JP 2016553748A JP 2016553748 A JP2016553748 A JP 2016553748A JP 2016537029 A JP2016537029 A JP 2016537029A
Authority
JP
Japan
Prior art keywords
dna
interaction
restriction enzyme
nucleotide sequence
restriction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016553748A
Other languages
English (en)
Other versions
JP2016537029A5 (ja
Inventor
グロスヴェルド,フランク
クノッホ,トビアス
Original Assignee
エラスムス ユニベルジテート メディッシュ セントルム ロッテルダム
エラスムス ユニベルジテート メディッシュ セントルム ロッテルダム
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エラスムス ユニベルジテート メディッシュ セントルム ロッテルダム, エラスムス ユニベルジテート メディッシュ セントルム ロッテルダム filed Critical エラスムス ユニベルジテート メディッシュ セントルム ロッテルダム
Publication of JP2016537029A publication Critical patent/JP2016537029A/ja
Publication of JP2016537029A5 publication Critical patent/JP2016537029A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/682Signal amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/301Endonuclease
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/101Crosslinking agents, e.g. psoralen
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/133Detection mode being characterised by the assay principle conformational analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/501Detection characterised by immobilisation to a surface being an array of oligonucleotides

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Chemical & Material Sciences (AREA)

Abstract

本発明は、三次元DNA構造における1つ以上の目的領域に由来する1つ以上のヌクレオチド配列の、他のヌクレオチド配列との相互作用を分析する方法であって、(a)架橋されたDNAのサンプルを提供するステップ、(b)該架橋されたDNAを第1の制限酵素で消化するステップ、(c)架橋されたヌクレオチド配列をライゲートするステップ、(d)架橋を解消する(reverse)ステップ、(e)(d)に由来するライゲートされた分子を断片化するステップ、(f)ステップ(c)において別のヌクレオチド配列にライゲートされたヌクレオチド配列の末端について富化するために、(e)に由来する断片を、第1の制限酵素の切断部位に隣接する配列を表す1つ以上のオリゴヌクレオチドにハイブリダイズさせるステップ、及び(g)相互作用に関与するヌクレオチド配列を同定するために、富化された断片のヌクレオチド配列を分析するステップ、を含む、方法を提供する。【選択図】図1

Description

本発明は、クロマチンなどの三次元DNA構造におけるヌクレオチド配列の相互作用を分析する方法に関する。
最近の研究のいくつかは、ゲノムが、リンカー領域によって隔てられているいくつかの自己会合ドメインにおいて構成されていることを示している。これらのいわゆる「トポロジカル(topological)ドメイン」は、一般的に300キロ塩基対(kb)から1メガ塩基対(1Mb)の範囲にある。トポロジカルドメインは、一連のクロマチンループで構成されており、ここで、ループは、クロマチンの2つの部分を近接させ、領域間の相互作用を可能にするものと定義されるが、この後者は必ずしも当てはまらない。これらのループは、動的であり、CTCF及びコヒージョン(cohesion)、並びにドメイン内の遺伝子の制御に必要な一連の転写因子、を含めた、多くのタンパク質に依存する。ドメイン内のいくつかのループは、純粋に構造的である、すなわち、別々のドメインを生じるゲノムの折り畳みを可能にすると考えられているが、一方、他のループは、遺伝子の発現において機能を有する。後者のタイプのループ(クロマチン近接)は、トポロジカルドメイン内でよく生じ、異なるトポロジカルドメインに位置するクロマチン間ではそれほどよく生じない。
調節性DNAエレメントは、互いに、及びドメイン内の遺伝子と相互作用し、複雑な相互作用ネットワークを形成する。これらのエレメント内の変化及びそれらの相互作用は(遺伝子の突然変異に加えて)、遺伝子発現の変化に関与し、それは、次いで、種の個体間の差異又は疾患の原因に関与する。したがって、これらのエレメントは、疾患の診断及び治療に重要になってきている。しかし、かなりの努力が、最近、その機能の解明に置かれているものの、これらの調節性ネットワークは、まだ比較的分かっていない。
調節性エレメントは、遺伝子を活性化又は抑制する転写因子のための1つ又はそれ以上の結合部位を含有する短い断片である。調節性エレメントは、しばしば、それらの標的遺伝子から離れて位置し、それらは、p300などの特定の因子の結合又はクロマチン修飾によって認識され得るが、それらが相互作用する遺伝子は多くの場合明らかではない。ゲノムの空間的構造において、それらは、それらの標的遺伝子と近接している。例えば、多指症では、影響を受けているエンハンサーは、ゲノムの直鎖状マップ上で、影響を受けている増殖因子遺伝子Shhから約1Mbp離れて位置しているが、それは、核の3D空間ではこの遺伝子と密接に結び付いている。
調節性エレメントがループ化によって遺伝子を調節することは既に明らかであったが、染色体コンホメーション捕捉(3C)は、このような相互作用の迅速な同定を可能にすることにより、この分野に革命をもたらした。3C技術の基本原理は、核空間内のDNA断片の近接が、架橋と、その後の制限酵素消化、ライゲーション及びライゲートした産物の増幅によって検出できるということである。相互作用、及び遺伝子が調節される方法についてより多くの情報を提供するいくつかの3C型の技術が続いて開発されている: 3C/3C-qPCR; 3C-seq/4C-seq; 4C(チップ上の3C(3C-on-a chip); 5C(3Cカーボンコピー); 及びHi-C。
これらの方法の各々は、様々な利点及び欠点(表1)を伴う。3C及び4C技術は、かなり面倒であり、遺伝子座の事前の知識を必要とし、特定の視点から相互作用を検出することに制限されている。いくつかの相互作用を分析するために、別々の分析を必要とするいくつかの異なる視点を使用する必要がある。3C及び4C技術は、ゲノムワイドなデータをもたらさない。
5C及びHiC技術はより進んでいる。5Cは、プライマー設計における要求が非常に厳しく、いくつかの別々の相互作用の分析を可能にするが、ゲノムワイドなカバレージ(coverage)を与えない。HiCは、高分解能分析(通常は40Kbp)を提供することなく、全ゲノムを分析するために、非常に大量の配列決定を必要とするため、非常に高価である。分析の最新のHiC法は、新しいアルゴリズムを使用し、10Kbpの分解能を提供する。しかし、それは、膨大な量の配列決定を必要とする(6個の生物学的複製からの34億個のマッピングされたペアエンド(paired-end)読み取り)。この規模での配列決定は、ほとんどの研究グループに利用可能ではない。また、関心は、非常に多くの場合、限られたセットの特定の遺伝子座又はドメイン、例えば、疾患においてゲノム変更に関与する領域、を伴う特定の問題に関連する。このことは、HiC法によって行われる配列決定のかなりの割合は、これらの適用のためには余分であることを意味する。
したがって、上記の制限を受けない、三次元クロマチン構造におけるヌクレオチド配列の相互作用を分析するための改良された方法に対する必要性がある。
Figure 2016537029
本発明者らは、5CとHiCの欠点を克服するために、「標的化クロマチン捕捉(Targeted-Chromatin Capture)」(T2C)と命名した新しい技術を開発した。
T2Cは、ドメイン内の相互作用、及びゲノムの1つ若しくはいくつかの特定の領域の区画化を同定するために、1つ以上の目的領域からの3Cライゲーション産物の選択的富化を用いる。目的領域は、大きな(例えば、多くのメガベースサイズの)連続的なゲノム領域であってもよいし、又は代替的に、より小さな領域(それぞれ数メガベース)の集合であってもよい。
全ての捕捉された制限断片は、「視点(viewpoint)」として使用され、三次元ゲノム構造においてその配列と相互作用するヌクレオチド配列を同定することができる。T2Cの出力は、制限断片レベルの分解能を有する局所的相互作用マップを提供する。この方法は、Hi-C法よりも、かなり少ない配列決定労力及びあまり複雑でないバイオインフォマティクス分析を伴う。この方法はまた、5C法の制限によって妨げられない。これは、T2Cが、標的化領域(複数可)内の断片の、標的化領域(複数可)外の領域との相互作用も同定するためである。
したがって、第1の態様において、本発明は、三次元DNA構造における1つ以上の目的領域に由来する1つ以上のヌクレオチド配列の、他のヌクレオチド配列との相互作用を分析する方法であって、
(a)架橋されたDNAのサンプルを提供するステップ、
(b)該架橋されたDNAを第1の制限酵素で消化するステップ、
(c)架橋されたヌクレオチド配列をライゲートするステップ、
(d)架橋を解消する(reverse)ステップ、
(e)(d)に由来するライゲートされた分子を断片化するステップ、
(f)ステップ(c)において別のヌクレオチド配列にライゲートされたヌクレオチド配列の末端について富化するために、(e)に由来する断片を、第1の制限酵素の切断部位に隣接する配列を表す1つ以上のオリゴヌクレオチドにハイブリダイズさせるステップ、及び
(g)相互作用に関与するヌクレオチド配列を同定するために、富化された断片のヌクレオチド配列を分析するステップ、
を含む、前記方法を提供する。
この方法は、三次元クロマチン構造における1つ以上の目的ゲノム領域に由来する1つ以上のヌクレオチド配列の、他のヌクレオチド配列との相互作用を分析するために使用し得る。
第1の制限酵素は、6〜8bpの認識部位を認識する任意の制限酵素であってよい。
第1の制限酵素は、BglII、HindIII、EcoRI、BamHI、SpeI、PstI及びNdeIからなる群から選択され得る。
この方法のステップ(e)において、ライゲートされた分子は、第2の制限酵素、例えば4若しくは5bpのヌクレオチド配列認識部位又は2ヌクレオチド配列までもを認識する酵素、による消化によって断片化されてもよい。
第2の制限酵素は、TspEI、MaeII、AluI、NlaIII、HpaII、FnuDII、MaeI、DpnI、MboI、HhaI、HaeIII、RsaI、TaqI、CviRI、MseI、Sth132I、AciI、DpnII、Sau3AI及びMnlIからなる群から選択されてもよい。
あるいは、ステップ(e)において、ライゲートされた分子は、機械的手段、例えばせん断又は超音波処理、によって断片化されてもよい。
あるいは、第1の制限酵素は、4〜6塩基対の認識部位(ここで6bpは縮重配列である)を認識する任意の制限酵素であってよく、その場合、第2の制限酵素は、非特異的ヌクレアーゼ又はせん断の機械的手段によって置き換えられる。これは、ハイブリダイゼーションのためのより多くの数のオリゴヌクレオチド(以下参照)及び相互作用のより高い分解能をもたらす。より多くの一次制限断片があるためである。
ステップ(f)において、1つ以上のオリゴヌクレオチドプローブは、マイクロアレイ上にスポットされてもよく、又はビーズ上に捕捉されてもよく、あるいは溶液中に存在し、後にビーズ上に捕捉されてもよい。
オリゴヌクレオチドプローブ(複数可)は、第1の制限酵素の制限部位に隣接する配列、例えば、第1の制限酵素の制限部位の100bp以内の配列を認識し得る。
ステップ(f)において、ヌクレオチド配列断片は、複数のオリゴヌクレオチドを含むオリゴヌクレオチドプローブのセットにハイブリダイズされてよく、この複数のオリゴヌクレオチドのそれぞれは、目的ゲノム領域に由来するヌクレオチド配列上の第1の制限酵素の消化部位に隣接する配列にハイブリダイズする。
オリゴヌクレオチドプローブのセットは、第1の制限酵素を用いて目的ゲノム領域(複数可)を処理することによって得ることができる実質的に全ての制限断片に特異的なプローブを含む。
ライゲートされたヌクレオチド配列断片が、ハイブリダイゼーションによってアレイ上に捕捉され、増幅され、及び/若しくは配列決定され得るように、又はオリゴヌクレオチドプローブの同じセットにハイブリダイズした異なるサンプルの区別を可能にし得るように、アダプター配列は、ステップ(f)の前にステップ(e)に由来するヌクレオチド配列断片の一方の末端又は両方の末端にライゲートされ得る。アダプターは、1つのサンプルが別のサンプルから識別されることを可能にする特定のアドレス配列を含有し得る。特定のアドレス配列を有する全ての配列は、その後、1つの特定のサンプルに由来することが分かる。
この方法のステップ(g)は、富化されたヌクレオチド配列断片のハイスループット配列決定を含み得る。
ステップ(g)の後に、バイオインフォマティクス分析、及び/又は相互作用(複数可)の可視化が続いてもよい。
目的領域(例えば、目的ゲノム領域)は、目的の遺伝子座を含んでもよい。
目的領域は、全体で約1〜50MBの長さであってもよい。
遺伝的要素との相互作用(複数可)に関与するヌクレオチド配列(複数可)を同定するために、ステップ(g)において、特定の遺伝的要素を含む富化されたヌクレオチド配列断片の配列のみが分析される場合、本発明の方法は、三次元構造における特定の遺伝的要素の、他のヌクレオチド配列との相互作用を分析するために使用され得る。
遺伝的要素は、転写因子の結合部位又はインシュレーター(insulator)若しくはバリヤー(barrier)要素を含み得る。
遺伝的要素は、目的領域中にあってよく、例えば、疾患において再配置される又は削除されるゲノム領域に関与する、又はその領域の近くにあることが多い要素であってよい。
本発明の方法はまた、遺伝子を含む目的領域における相互作用の数、種類又は密度を分析することによって、遺伝子の発現状態を決定するために使用してもよい。
この方法は、両サンプルを分析し、目的領域における相互作用の数、種類又は密度を比較することによって、2つのサンプル間の遺伝子の活性を比較するために使用してもよい。
この方法は、どのタンパク質、例えば転写因子が特定の相互作用に関与しているかを同定するために使用してもよい。
サンプルは、例えば、同じ被験体からの異なる組織に由来しても、異なる時点にわたる単一の被験体に由来しても、異なる被験体(例えば、健康な/罹患している/罹患していることが疑われる被験体)からの同等の組織に由来してもよい。
この方法は、罹患細胞及び非罹患細胞に由来する架橋DNAのサンプルを分析することによって、特定の疾患状態を示す1つ以上のDNA-DNA相互作用を同定するために使用してよく、DNA-DNA相互作用又はDNA-DNA相互作用のパターンを示す罹患細胞及び非罹患細胞に由来するDNA配列間の三次元クロマチン構造におけるヌクレオチド配列の相互作用間の差異は、特定の疾患状態を示す。
本発明の方法は、DNA-DNA相互作用の変化によって引き起こされるか又はそれに関連する、疾患又は症候群の診断又は予後診断に使用してもよい。この点において、ステップ(a)は、被験体に由来する架橋されたDNAのサンプルを提供するステップを含み、ステップ(g)は、DNA配列間の相互作用を、影響を受けていない対照のものと比較するステップを含み、対照と被験体の間の差異が、被験体が疾患若しくは症候群に罹患していることを示すか、又は被験体が疾患若しくは症候群に罹患するであろうことを示す。
疾患は、遺伝性の遺伝子疾患、又は体細胞の遺伝子疾患、例えばガンであってもよい。
第2の態様において、本発明はまた、DNAの三次元構造をモジュレートする1つ以上の薬剤を同定するためのアッセイ方法であって、
(a)サンプルを1つ以上の薬剤と接触させるステップ、及び
(b)本発明の第1の態様の方法を実行するステップであって、ステップ(a)が、サンプルに由来する架橋されたDNAを提供することを含む、ステップ、
を含み、(i)薬剤の存在下でのDNA相互作用と(ii)薬剤の非存在下でのDNA相互作用の間の差異が、DNAの三次元構造をモジュレートする薬剤を示す、方法を提供する。
T2Cは、公知の5C又はHiC法に対して例えば以下の顕著な利点を提供する:
・全ての制限断片は、5Cとは対照的に、「視点」として機能することができ、全てのそれらの相互作用は、短い若しくは長い距離にわたるものであれ、又は他の染色体に対するものであれ、同定され得る
・ゲノムの区画化は、HiCに必要であった大きな配列決定の労力を必要とすることなく、目的領域において同定され得、そのため、コストを大幅に低減する
・他の技術と比較した場合、遺伝子座のより良いカバレージ及び分解能が得られる。T2Cの分解能は、使用される制限酵素に基づくが、多くの場合、約1〜10Kb(6bp認識制限酵素では平均4〜5kb)である。これは、通常のHiCを用いて得られた通常の40Kbpビンよりも顕著に良好な分解能を提供する。
T2C手順の概要。単離された架橋クロマチンが、消化され、近接した制限断片間の結合を好むように希釈条件下でライゲートされる。脱架橋及び第2の消化後、オーバーハングは、修復され、アダプターライゲーションが続く。アダプターは、配列決定法、例えば、ペアエンドイルミナ(paired end Illumina)のために必要な配列又は場合により、短いアドレス配列を含有する。異なるアドレスは、多重化(オリゴヌクレオチドプローブの同じセットへの、異なるサンプルのハイブリダイゼーション)を可能にするように異なるサンプルで使用され、ここで、アドレス配列は、配列の、それが由来したサンプルとのマッチングを可能にする。得られたライブラリー(複数可)は、アレイ上の固有のオリゴヌクレオチドプローブのセット、又はビーズ上に捕捉することができる溶液中のオリゴヌクレオチドプローブにハイブリダイズされる。固有のオリゴヌクレオチドプローブ(緑色の波線)は、第1の制限部位のできるだけ近くに配置される。ハイブリダイズされたDNAは、溶出され、ゲノムの選択領域からの全ての相互作用のライブラリーを含有し、Illumina HiSeq2000上でペアエンド配列決定され、バイオインフォマティクス分析、及び相互作用(すなわち、近接した配列)の可視化が続く。縦の黒い線は、一次制限酵素切断部位を示す。オレンジ色の小さな縦線は、二次制限酵素切断部位を示す。 ヒトchr11p15.5領域についてのT2Cによって検出された相互作用の、Hi-Cデータ及び4Cデータとの比較。(A)40Kbp分解能で提示される、目的のH19/IGF2領域をカバーするIMR90細胞について生成されたHi-Cデータ(印刷中のZuin et al(2013))。(B)HB2細胞でT2Cによって観察された相互作用は、(A)と同じ40kbpビン(bin)を用いて提示される。2つの方法により観察された全体的なトポロジカルドメインパターンは類似している。(C)断片レベルでそれらの実際の分解能で提示されるT2Cデータ。右側のカラーバーは、少数(青色)から多数(黄色)の読み取りまでの各相互作用についての配列読み取りの頻度を与える。読み取りの数は、2つの断片間のライゲーションの頻度を表し、したがって、核の三次元空間におけるそれらの断片間の相互作用を表す。(D)T2Cによって、この特定の視点について観察された相互作用と比較した、IGF2遺伝子の近くの1つの視点についての4C相互作用データ(太い赤線)。この視点はまた、(C)に示され、方法間の直接的比較を可能にする。細い赤線は、比較を容易にするため、いくつかの相互作用断片を示す。 β-グロビン遺伝子座についての区画化及び相互作用の比較。T2Cを、E12.5マウス由来のマウス初代赤血球細胞(A)及びマウス胎児脳細胞(B)についてβ-グロビン遺伝子座の周囲の約2MB領域で行った。異なる生物学的材料間のトポロジカルドメインパターンは、2つの生物学的サンプル中の相互作用の異なる数とは独立に、同じであるように見える。E12.5マウス由来のマウス初代赤血球細胞(C)及びマウス胎児脳細胞(D)についてのβ-グロビン遺伝子座の周囲の相互作用に対する拡大。白線は、β-グロビン遺伝子座において特に関心のある領域(3'HS1、β-グロビンプロモーター及びLCRのように)を示す。LCR、β-グロビンプロモーター及び3'HS1の間の相互作用は、マウス脳細胞では失われる。全ての相互作用は、同じカラーコードに対して正規化される。遺伝子座の直鎖状表示は、赤血球細胞におけるLDB1及びCTCFの結合部位を伴い最下部に示される。 LDB1又はCTCF結合部位を含有する断片の相互作用の比較。E12.5マウス由来のマウス初代赤血球細胞(A)、(C)及びマウス胎児脳細胞(B)、(D)についてのLDB1(A)、(B)又はCTCF(C)、(D)に結合する断片についてのβ-グロビン遺伝子座の周囲の約2MB領域にわたる相互作用。β-グロビン遺伝子座の周囲のトポロジカルドメインは、マウス脳細胞と比較した場合、マウス肝細胞で明らかに示される。マウス初代赤血球細胞(E)、(G)及びマウス脳細胞(F)、(H)についてのβ-グロビン遺伝子座の周囲のLDB1結合断片(E)、(F)及びCTCF結合断片(G)、(H)の間の相互作用の拡大表示。白線は、β-グロビン遺伝子座において特に関心のある領域(3'HS1、β-グロビンプロモーター及びLCRのように)を示す。LCR、β-グロビンプロモーター及び3'HS1の間の胎児肝臓相互作用は、マウス脳細胞では失われる。全ての相互作用は、同じカラーコードに対して正規化される。最下部は、赤血球細胞におけるLDB1及びCTCFの結合部位を有するβ-グロビン遺伝子座の直鎖状表示を示す。 断片のみを含有するLDB1又はCTCFについての平均値、中央値及び相互作用の数。LDB1(A)及びCTCF(B)相互作用の数は、初代赤血球細胞と比較した場合、マウス胎児脳においてより少ない。さらに、LDB1(C)又はCTCF(D)のいずれかの相互作用パートナー間の距離の平均値及び中央値は、マウス初代赤血球細胞と比較した場合、マウス胎児脳細胞においてより小さい。 全て約2Mbp領域についての、及び可視化に対数頻度範囲と虹色コードを使用した、マウス胎児脳(図6)細胞についての相互作用マトリックスの可視化。図は、T2Cの優れた分解能及び質、そして直接の視覚的読み出しで、ゲノムが、ループ凝集体/ロゼットを形成するクロマチンループからなる、サブ染色体(subchromosomal)ドメインに組織化されることを明らかに示す。これは、種特異的であり(図6及び7を図8〜10と比較)、組織/細胞特異的であり(図6及び7並びに図8〜10)、遺伝子の活性(図6、7、8及び9)、及びコヒーシン(cohesin)などの構造的に関連するタンパク質の存在(図8及び9)に依存する。したがって、構造はまた、遺伝的又は構造的な変化が相互作用を変化させる疾患状態に依存する(図6及び7、又は図9及び10)。 全て約2Mbp領域についての、及び可視化に対数頻度範囲と虹色コードを使用した、マウス胎児肝臓(図7)細胞についての相互作用マトリックスの可視化。図は、T2Cの優れた分解能及び質、そして直接の視覚的読み出しで、ゲノムが、ループ凝集体/ロゼットを形成するクロマチンループからなる、サブ染色体(subchromosomal)ドメインに組織化されることを明らかに示す。これは、種特異的であり(図6及び7を図8〜10と比較)、組織/細胞特異的であり(図6及び7並びに図8〜10)、遺伝子の活性(図6、7、8及び9)、及びコヒーシン(cohesin)などの構造的に関連するタンパク質の存在(図8及び9)に依存する。したがって、構造はまた、遺伝的又は構造的な変化が相互作用を変化させる疾患状態に依存する(図6及び7、又は図9及び10)。 全て約2Mbp領域についての、及び可視化に対数頻度範囲と虹色コードを使用した、ヒトHB2(図8)細胞についての相互作用マトリックスの可視化。図は、T2Cの優れた分解能及び質、そして直接の視覚的読み出しで、ゲノムが、ループ凝集体/ロゼットを形成するクロマチンループからなる、サブ染色体(subchromosomal)ドメインに組織化されることを明らかに示す。これは、種特異的であり(図6及び7を図8〜10と比較)、組織/細胞特異的であり(図6及び7並びに図8〜10)、遺伝子の活性(図6、7、8及び9)、及びコヒーシン(cohesin)などの構造的に関連するタンパク質の存在(図8及び9)に依存する。したがって、構造はまた、遺伝的又は構造的な変化が相互作用を変化させる疾患状態に依存する(図6及び7、又は図9及び10)。 全て約2Mbp領域についての、及び可視化に対数頻度範囲と虹色コードを使用した、ヒトTEV(図9)細胞についての相互作用マトリックスの可視化。図は、T2Cの優れた分解能及び質、そして直接の視覚的読み出しで、ゲノムが、ループ凝集体/ロゼットを形成するクロマチンループからなる、サブ染色体(subchromosomal)ドメインに組織化されることを明らかに示す。これは、種特異的であり(図6及び7を図8〜10と比較)、組織/細胞特異的であり(図6及び7並びに図8〜10)、遺伝子の活性(図6、7、8及び9)、及びコヒーシン(cohesin)などの構造的に関連するタンパク質の存在(図8及び9)に依存する。したがって、構造はまた、遺伝的又は構造的な変化が相互作用を変化させる疾患状態に依存する(図6及び7、又は図9及び10)。 全て約2Mbp領域についての、及び可視化に対数頻度範囲と虹色コードを使用した、ヒトHEV(図10)細胞についての相互作用マトリックスの可視化。図は、T2Cの優れた分解能及び質、そして直接の視覚的読み出しで、ゲノムが、ループ凝集体/ロゼットを形成するクロマチンループからなる、サブ染色体(subchromosomal)ドメインに組織化されることを明らかに示す。これは、種特異的であり(図6及び7を図8〜10と比較)、組織/細胞特異的であり(図6及び7並びに図8〜10)、遺伝子の活性(図6、7、8及び9)、及びコヒーシン(cohesin)などの構造的に関連するタンパク質の存在(図8及び9)に依存する。したがって、構造はまた、遺伝的又は構造的な変化が相互作用を変化させる疾患状態に依存する(図6及び7、又は図9及び10)。 免疫グロブリン重鎖遺伝子座及びプラダー-ウィリー/アンジェルマン症候群(Prader-Willi/Angelmann Syndrome)領域における、シミュレートされたクロマチンモデルの説明、及びゲノムマーカー間の空間的距離の関係/評価: a、シミュレートされたランダム-ウォーク/ジャイアント-ループ(Random-Walk/Giant-Loop)及びマルチ-ループ-サブコンパートメントモデル(Multi-Loop-Subcompartment Model)のボリュームレンダリング画像。中期染色体の形態及びサイズを有する開始コンホメーションとして(上図)、ロゼットを積層した(α)。このような開始構成から、熱力学的平衡にある間期染色体を、モンテ-カルロ(Monte-Carlo)及び緩和ブラウン動力学ステップ(relaxing Brownian Dynamics step)によって脱凝縮した。大きなループ(5Mbp)を含有する、シミュレートされたランダム-ウォーク/ジャイアント-ループモデルのボリュームレンダリング画像を示す(左; β)。大きなループは、区別できる構造を形成しないが、自由に混ざることに留意されたい(左; β)。対照的に、126kbpのサイズのループ及びリンカーを含有する、シミュレートされたマルチ-ループ-サブコンパートメントモデルのボリュームレンダリング画像では、ロゼットは、ループが自由に混ざらない、区別できるクロマチン領域を形成する(中央; γ)。126kbpループ及び63kbpリンカーを含有するシミュレートされたRW/GLモデルの画像では、再び、区別できるクロマチン領域が形成されるが、これは、サブコンパートメントが形成しないMLSモデルとは対照的である(右; δ)。B: ランダム-ウォークジャイアントループ及びマルチ-ループ-サブコンパートメントモデル: 大きなループが非DNA骨格に付着しているRW/GLモデルが、ループ間にクロマチンリンカーを含有するシミュレートされたモデルを示すことを示す。126kbpループ及びリンカーを含有するMLSモデルは、1〜2Mbpに及ぶ個々のロゼットを用いて示される。 クロマチンモデルの説明のための異なる架橋確率(di: 相互作用の距離)についてのシミュレートされた相互作用マップ、及び様々なマルチ-ループ-サブコンパートメントモデルのための空間的距離の関係/評価(モデルパラメーター: ループサイズ/リンカーサイズ/モデル名)。 クロマチンモデルの説明のための異なる架橋確率(di: 相互作用の距離)についてのシミュレートされた相互作用マップ、及び様々なランダム-ウォーク/ジャイアント-ループモデルのための空間的距離の関係/評価(モデルパラメーター: ループサイズ/リンカーサイズ/モデル名)。
本発明は、三次元DNA構造におけるヌクレオチド配列間の相互作用を分析する方法に関する。
三次元DNA構造
用語「三次元DNA構造」は、タンパク質分子中のアミノ酸配列の高次構造に類似した、DNA二重らせんが形成する高次構造、例えばループ及び折り畳みを有する、DNAを含む構造を意味する。構造は、DNAのみから成ってもよく、又はそれに加えてタンパク質などの他の分子を含んでもよい。クロマチンは、DNAとタンパク質の間の複合体の一例である。
本発明の方法は、ゲノムの三次元クロマチン構造の分析のために理想的に適している。
クロマチンの主要な機能は、(1)細胞内に収まるように、DNAを小さな体積にパッケージすること、(2)有糸分裂を可能にするために、DNA上のアンカーポイントを提供すること、及び(4)遺伝子発現、DNA複製及び修復を制御することである。クロマチンの最も豊富なタンパク質成分は、DNAを凝縮させるヒストンである。
クロマチンの構造は、いくつかの要因に依存する。全体的な構造は、細胞周期の段階に依存する: 間期の間、クロマチンは、転写し、DNAを複製する、RNA及びDNAポリメラーゼへのアクセスを可能にするように、構造的に緩んでいる。間期の間のクロマチンの局所的構造は、DNA上に存在する遺伝子に依存する: 活発に転写される遺伝子をコードするDNAは、より緩やかにパッケージされ、RNAポリメラーゼと結合していることが見出されているが(ユークロマチンと称される)、一方、不活性遺伝子をコードするDNAは、構造タンパク質と結合していることが見出され、よりしっかりとパッケージされている(ヘテロクロマチン)。クロマチンにおける構造タンパク質のエピジェネティックな化学修飾はまた、特にメチル化及びアセチル化によるヒストンタンパク質の化学修飾は、局所的クロマチン構造を変化させる。細胞が分裂するための準備をすると、すなわち、有糸分裂又は減数分裂に入ると、後期の間の染色体の分離を容易にするように、クロマチンは、よりしっかりとパッケージする。
真核細胞の核では、間期染色体は、区別できる染色体領域を占める。最近、「トポロジカルドメイン」と称される、大きなメガベースサイズの局所的クロマチン相互作用ドメインが同定されている(Dixon et al (2012, Nature 485, 376-380))。これらのドメインは、ヘテロクロマチンの広がりを制限するゲノムの領域と相関する。このドメインは、異なる細胞型にわたって安定であり、種を超えて高度に保存されており、このことは、トポロジカルドメインが、哺乳動物のゲノムの固有の特性であることを示す。
トポロジカルドメインはまた、互いに相互作用し、このことは、一連のロゼット様構造へのゲノムの高次構造の可能性を示唆する。
本発明の方法は、ゲノム、染色体又はその部分内でトポロジカルドメイン又は高次構造を同定し、特徴付けるために使用し得る。
ゲノムの空間的構造は、その生物学的機能と密接に関連し、そのため、高次ゲノム構造を理解することが重要である。
本発明の方法は、ゲノムの三次元クロマチン構造の分析に理想的に適しているが、それは、任意の三次元構造におけるヌクレオチド配列相互作用を分析するために適用することができる。
DNAなどの核酸は、それ自体、他の核酸、及び他の分子、例えばタンパク質と、「四次構造」を自発的に形成することができる。本発明の方法は、任意の核酸含有構造の三次元構造を分析するために使用し得る。例えば、この方法は、DNAナノテクノロジーで使用される人工的な核酸ビルディングブロックの階層的アセンブリを調べ、確認するために使用し得る。
目的領域
本発明は、目的領域におけるヌクレオチド配列(複数可)と他のヌクレオチド配列の間の相互作用を分析することを含む。
目的領域は、1つ(又はそれ以上)の染色体内の目的ゲノム領域であってもよい。
目的領域は、特定の目的遺伝子座を含んでよい。遺伝子座は、染色体上の遺伝子又はDNA配列又は位置の特定の場所である。目的ゲノム領域は、特定の遺伝子座、例えば特定の遺伝子の配列を、一方又は両方の隣接領域と共に含んでよい。目的領域は、例えば、遺伝子の両側の約1、2、3又は4MBの配列を含んでよい。
「他のヌクレオチド配列」、すなわち、目的領域内のヌクレオチド配列が相互作用するヌクレオチド配列は、それ自体、目的領域に位置してもよく、又はそれらは、他の領域、例えば同じ染色体(複数可)の他の部分、若しくは異なる染色体に由来するものであってもよい。このような領域との相互作用は、遺伝子の調節が変化した又は遺伝子が失われた疾患の場合に変化し得る。
DNA
3D DNA構造は、1つ以上のゲノム遺伝子座からなる又はそれを含む、ゲノムDNAを含み得る。
方法
本発明の方法は以下のステップを含む:
(a)架橋されたDNAのサンプルを提供するステップ、
(b)該架橋されたDNAを第1の制限酵素で消化するステップ、
(c)架橋されたヌクレオチド配列をライゲートするステップ、及び
(d)架橋を解消する(reverse)ステップ。
本発明の方法のこれらの最初の4つのステップは、Dekker et al (2002) Science 295:1306に記載される染色体コンホメーション捕捉(Chromosome Conformation Capture、3C)及びWO 2007/004057に記載される4C(共局在クロマチンの捕捉及び特徴付け(Capture and Characterise Colocalised Chromatin))のものと類似している。
3C様鋳型は、公知の方法、例えばSplinter et al., (2004) Methods Enzymol. 375, 493-507に記載の方法を用いて調製され得る。簡潔には、サンプル、例えば細胞、組織又は核を、ホルムアルデヒドなどの架橋剤を用いて固定する。次いで、一次制限酵素消化を行い、DNAを架橋された核の関連で消化する。次いで、分子内ライゲーションを、低DNA濃度で行い、これは、非架橋DNA断片間のライゲーション(すなわち、分子間又はランダムライゲーション)に対して、架橋DNA断片間のライゲーション(すなわち、分子内ライゲーション)を好む。次に、架橋を解消し、DNAを精製し得る。得られた3C鋳型は、核空間において元々近くにあったためにライゲートされる制限断片を含有する。
一次制限酵素は、分子内ライゲーションステップの前にDNAを消化するために使用されるため、一次制限酵素の酵素認識部位は、第1の(標的)ヌクレオチド配列、及びライゲートされたヌクレオチド配列を分離する。したがって、一次制限酵素認識部位は、第1の(標的)ヌクレオチド配列と、ライゲートされたヌクレオチド配列(すなわち、ライゲートされた第2の配列)の間に位置する。
架橋
架橋剤、例えばホルムアルデヒドは、タンパク質を、他の近隣のタンパク質及び核酸に架橋するために使用し得る。したがって、2つ以上のヌクレオチド配列は、これらのヌクレオチド配列(の1つ)に結合したタンパク質を介して架橋され得る。ヌクレオチド配列を直接架橋する架橋剤を含む、ホルムアルデヒド以外の架橋剤もまた、本発明において使用し得る。DNAを架橋する薬剤の例としては、限定されないが、UV光、マイトマイシンC、ナイトロジェンマスタード、メルファラン、1,3-ブタジエンジエポキシド、シス-ジアミンジクロロ白金(II)及びシクロホスファミドが挙げられる。
好適には、架橋剤は、比較的短い距離、例えば約2Åを橋渡しする架橋を形成し、それによって、解消され得る密接な相互作用を選択する。
架橋は、例えば、室温で、2%ホルムアルデヒド中で細胞をインキュベートすることによって、例えば、室温で10分間、2%ホルムアルデヒドを補充したDMEM-10%FCSの10ml中で1×107細胞をインキュベートすることによって行ってもよい。
制限酵素による消化
架橋されたDNAは、第1の制限酵素で消化される。
制限エンドヌクレアーゼは、DNAの糖-リン酸骨格を切断する酵素である。最も実用的な設定では、所与の制限酵素は、わずか数塩基のストレッチ内の二重鎖DNAの両方の鎖を切断する。制限酵素の基質は、認識部位/配列と呼ばれる二本鎖DNAの配列である。
制限認識部位の長さは、使用される制限酵素に応じて変化する。認識配列の長さは、酵素がDNAの配列において切断する頻度を指示する。
DNAの4bp配列を認識する制限酵素は、それらの制限部位と共に、以下を含む: AATT(TspEI)、ACGT(MaeII)、AGCT(AluI)、CATG(NlaIII)、CCGG(HpaII)、CGCG(FnuDII)、CTAG(MaeI)、GATC(DpnI、DpnII、Sau3AI及びMboI)、GCGC(HhaI)、GGCC(HaeIII)、GTAC(RsaI)、TCGA(TaqI)、TGCA(CviRI)、TTAA(MseI)、CCCG(Sth132I)、CCGC(AciI)及びCCTC(MnlI)。
DNAの6bp配列を認識する制限酵素は、それらの制限部位と共に、以下を含む: AACGTT(AclI)、AAGCTT(HindIII)、AATATT(SspI)、ACATGT(BspLU11I)、ACCGGT(AgeI)、ACGCGT(MluI)、ACTAGT(SpeI)、AGATCT(BglII)、AGCGCT(Eco47III)、AGGCCT(StuI)、AGTACT(ScaI)、ATCGAT(ClaI)、ATGCAT(AvaIII)、ATTAAT(VspI)、CAATTG(MfeI)、CACGTG(PmaCI)、CAGCTG(PvuII)、CATATG(NdeI)、CCATGG(NcoI)、CCCGGG(SmaI)、CCGCGG(SacII)、CCTAGG(AvrII)、CGATCG(PvuI)、CGGCCG(XmaIII)、CGTACG(SplI)、CTCGAG(XhoI)、CTGCAG(PstI)、CTTAAG(AflII)、GAATTC(EcoRI)、GACGTC(AatII)、GAGCTC(SacI)、GATATC(EcoRV)、GCATGC(SphI)、GCCGGC(NaeI)、GCGCGC(BsePI)、GCTAGC(NheI)、GGATCC(BamHI)、GGCGCC(NarI)、GGGCCC(ApaI)、GGTACC(KpnI)、GTATAC(SnaI)、GTCGAC(SalI)、GTGCAC(ApaLI)、GTTAAC(HpaI)、TACGTA(SnaBI)、TCATGA(BspHI)、TCCGGA(BspMII)、TCGCGA(NruI)、TCTAGA(XbaI)、TGATCA(BclI)、TGCGCA(MstI)、TGGCCA(BalI)、TGTACA(Bsp1407I)、TTATAA(PsiI)、TTCGAA(AsuII)及びTTTAAA(AhaIII)。
DNAの7bp配列を認識する制限酵素は、それらの制限部位と共に、以下を含む: CCTNAGG(SauI)、GCTNAGC(EspI)、GGTNACC BstEII及びTCCNGGA PfoI。
DNAの8bp配列を認識する制限酵素は、それらの制限部位と共に、以下を含む: ATTTAAAT(SwaI)、CCTGCAGG(Sse8387I)、CGCCGGCG(Sse232I)、CGTCGACG(SgrDI)、GCCCGGGC(SrfI)、GCGATCGC(SgfI)、GCGGCCGC(NotI)、GGCCGGCC(FseI)、GGCGCGCC(AscI)、GTTTAAAC(PmeI)及びTTAATTAA(PacI)。
縮重配列を認識する制限酵素もあり、これは、2つ以上の塩基が、認識配列における特定の位置において可能であり、認識されるDNAの3又は5bp配列を効果的にもたらすことを意味する。2bpを効果的に認識する酵素の組み合わせ、例えば、2bp配列CGを効果的に認識するHpyCH21V、MspI、HinPII及びTaqIの組み合わせを使用することもできる。
第1の制限酵素(又は酵素の組み合わせ)は、DNAの2、4、5、6、7、又は8bp配列を認識し得る。
第1の制限酵素は、特に、6-カッター、例えばHindIII又はBglIIであってもよい。
第2の制限酵素(又は酵素の組み合わせ)は、DNAの2又は4bp配列を認識してよく、又は非特異的ヌクレアーゼ(その場合は限定的消化のみが適用される)若しくは機械的断片化によって置き換えられてもよい。
ライゲーション及び架橋の解消(reversal)
次いで、消化ステップの後に、分子内相互作用及び適合性末端を介したDNAの接続を好む希釈条件下でのライゲーションが続く。
ライゲーションは、リガーゼ酵素の添加によって誘導され得る。
ライゲーション反応は、低DNA濃度、例えば約1〜5ng/μlで行われ得る。
架橋は、プロテイナーゼKなどの薬剤の添加によって解消され得る。
方法のさらなるステップ
本発明の方法はまた、以下を含んでもよい:
(e)ライゲートされたDNAを、例えば第2の制限酵素(例えば4bp認識酵素)若しくは他のヌクレアーゼで、又は機械的せん断によって、断片化するステップ。後者の場合、DNA末端は、アダプター配列の付加を可能にするように、平滑末端化するように修復されてもよい。
(f)サンプル間の区別を可能にする(他のサンプルは異なる特定の配列を有するリンカーを含有する)特定の配列、及び/又はハイスループット配列決定を可能にする配列、を含有するアダプター配列にライゲートするステップ。
(g)ライゲートされたサンプルを、1つ以上のゲノム遺伝子座を表す1つのオリゴヌクレオチドプローブ又はオリゴヌクレオチドプローブのセットにハイブリダイズさせるステップ。1つのオリゴヌクレオチド又はオリゴヌクレオチドのセットは、ステップ(a)における第1の制限部位へのそれらの近接及びそれらのハイブリダイゼーション温度に基づいて選択される。後者は、それらの長さ及び塩基組成に依存する。セットにおける異なるオリゴヌクレオチドプローブは、類似したハイブリダイゼーション/融解温度を有するべきである。さらに、それらは、反復的DNAのハイブリダイゼーションを防ぐため、固有であるべきである。オリゴヌクレオチドプローブは、固体表面に付着されることができ、又は固体表面、好ましくはストレプトアビジンビーズ上への捕捉を可能にするビオチンなどのタグを含有することができる。
(h)ハイブリダイゼーション後にハイブリダイズされた固体表面をストリンジェントに洗浄し、ハイブリダイズしていない材料を除去するステップ。
(i)ハイブリダイズされた材料を溶出するステップ。
(j)ハイブリダイズされた材料を、例えばペアエンドイルミナ配列決定(paired end Illumina sequencing)によって配列決定するステップ。
(k)バイオインフォマティクスを使用して、ゲノムに戻って配列をマッピングし、相互作用のマトリックスを生成するステップ。
断片化
ライゲートされたDNA分子は、当技術分野で公知の種々の方法、例えば第2の制限酵素又は他のヌクレアーゼでの消化によって; 放射線若しくは重イオンを用いて; 又は超音波処理若しくはせん断などの機械的手段によって、断片化されてもよい。
第2の制限酵素は、本方法のステップ(b)で用いられる第1の制限酵素よりも頻繁にDNAを切断するべきである。第2の制限酵素は、第1の制限酵素よりも短い又はより一般的なDNAのストレッチ(認識部位)を認識し得る。
第1の制限酵素が6〜8bpカッターである場合、第2の制限酵素は、例えば、2又は4-カッターであってもよい。
第2の制限酵素は、例えば、Dpn II又はNlaIIIなどの4-カッターであってもよい。
第2の制限酵素(又は酵素の組み合わせ)は、DNAの2又は4bp配列を認識してよく、又は非特異的ヌクレアーゼ(その場合、限定的消化のみが適用される)若しくは機械的断片化によって置き換えられてもよい。ミクロコッカスヌクレアーゼ又はDNaseIなどの多数の非配列特異的ヌクレアーゼがある。
せん断、非特異的ヌクレアーゼ、又は放射線若しくは重イオンを用いた処理などの機械的方法に続いて、ヌクレオチド配列の末端は、次のステップを可能にするために、標準的な方法によって「修復」される必要があるかもしれない。
アダプター
アダプターは、配列決定目的のために、すなわち、イルミナ法などの方法のための配列分析を可能にするために、ステップ(e)に由来する断片の末端にライゲートされてもよい。
アダプターは、アドレス配列を含んでもよい。異なるアドレス配列は、多重化(オリゴヌクレオチドプローブの同じセットに対する異なるサンプルのハイブリダイゼーション)を可能にするために、異なるサンプルについて使用され、ここで、アドレス配列は、配列の、それが由来したサンプルとマッチングを可能にする。アドレス配列は、複数のサンプル又は内部スパイク(internal spiking)が使用される場合、有用である。
アダプター配列は、ハイブリダイゼーションの前に付加されることが好ましい。ハイブリダイゼーション後のライゲーションによってそれらを付加することが可能であるが、DNAが一本鎖DNAとしてハイブリダイゼーションから離れるために、あまり効率的でない可能性ある。
ハイブリダイゼーション
本方法のステップ(f)において、ヌクレオチド配列断片は、相互作用するヌクレオチド配列を含む断片について富化するために、1つ以上のオリゴヌクレオチドプローブにハイブリダイズされる。
オリゴヌクレオチドプローブは、固体支持体、例えばアレイ又はビーズ(下記参照)に付着しているか、又はその上に捕捉され得る。
オリゴヌクレオチドプローブは、第1の制限酵素の制限部位の位置を念頭に置いて、目的領域に由来する配列(複数可)に基づいて設計される。
各オリゴヌクレオチドプローブは、第1の制限部位の近くに位置する配列に対応する。本発明の方法のステップ(d)で作られたライゲートされたDNA分子は、第1の制限酵素の制限部位で接続された、異なるヌクレオチド配列を含む。異なるヌクレオチド配列は、三次元構造において「相互作用」していた(すなわち、架橋されるのに十分に近接していた)。ライゲートされた分子が断片化される場合、いくつかの断片は、内部断片化(例えば、第2の制限酵素による内部消化)に由来する、単一のヌクレオチド配列に由来する。他の断片は、相互作用するヌクレオチド配列の両方に由来する。
第1の制限部位の近くに位置する配列を有する断片を選択することによって、断片は、「相互作用断片」を表すものについて富化され、すなわち、ライゲーションステップ(e)によって第1の制限酵素の制限部位で接続された2つのヌクレオチド配列の一部を含む。
オリゴヌクレオチドプローブ
好適には、オリゴヌクレオチドプローブは、少なくとも15、20、25、30又は40ヌクレオチドの長さである。
オリゴヌクレオチドプローブは、第1の制限酵素の制限酵素認識部位に可能な限り近くなるように設計される。用語「隣接する(adjacent to)」は、オリゴヌクレオチドプローブが、第1の制限酵素認識部位から約100ヌクレオチド、例えば約90、80、70、60、50、40、30、20、10、9、8、7、6、5、4、3、2、又は1ヌクレオチド以内の部位を認識するように設計されることを意味する。
目的領域が、第1の制限酵素(RE1)のX個の認識部位を有する場合、RE1による消化は、X+1個の断片を生成する。これらの断片は、両端にRE1認識部位を有するため、目的領域における全ての断片を包含するために2X個のオリゴヌクレオチドプローブを設計する必要がある。
オリゴヌクレオチドプローブのライブラリーは、第1の制限酵素を用いて目的領域(複数可)を処理することにより得られる実質的に全ての制限断片に特異的なオリゴヌクレオチドを含み得る。「実質的に全て」とは、この文脈において、制限断片フランキング部位の少なくとも60、70、80、90、95又は99%を意味する。
時折、末端の一方を表すオリゴヌクレオチドプローブを設計することが不可能であり、例えば、
(i)配列が反復的であり得る
(ii)第2の認識酵素部位(RE2)が、RE1部位に近すぎる
(iii)2つのRE1部位間にRE2部位がない(非特異的ヌクレアーゼ又は機械的断片化が使用される場合、これは適用されない)。
上記の制限のいずれかが適用される場合、その特定のRE1制限断片又はその末端に対するオリゴヌクレオチドプローブは、オリゴヌクレオチドプローブのセットから除外されてもよいが、オリゴヌクレオチドのセットは、依然として、RE1フランキング部位の「実質的に全て」に対するオリゴヌクレオチドプローブを含有する。
分析
断片が、「相互作用」を表すものについて富化されると、相互作用に関与するヌクレオチド配列は、配列決定によって特徴付けられ得る。
ペアエンド配列決定は、イルミナシステムなどの公知の技術を用いて実施され得る。
アダプター配列は、ライゲートされたヌクレオチド配列断片が、アレイ上に捕捉され、増幅され及び/又は配列決定され得るように、(e)からの、好ましくはステップ(f)の前の、又はあまり好ましくなくはステップ(f)の後の、ヌクレオチド配列断片の一方又は両方の末端にライゲートされ得る。アダプター配列は、いくつかのサンプルが同じアレイ上で分析される場合、すなわち多重化の場合、サンプルを認識するためのアドレスを提供し得る。現在1レーン当たり±1.5億個の配列読み取りをもたらすイルミナ装置の1レーンにおいて8個のサンプルを多重化することが可能である。
より詳細には、断片は、末端修復され、A-テイル化(A-tailed)され、インデックス付きアダプターがA-テイル化DNA断片にライゲートされてもよい。
得られたアダプター修飾DNAライブラリーは、捕捉され、溶出され、PCR増幅されてもよい。本発明の方法では、断片は、富化ステップ(ステップ(f))の前にPCR増幅されなくてもよい。
次いで、クラスター生成及びハイスループット配列決定が、公知の技術によって(例えば、イルミナクラスター試薬及びHiSeq 2000シーケンサーを使用して)行われ得る。
相互作用頻度は、以前に記載されたように(Liberman-Aiden et al (Science 2009 326:289-293; Dixon et al (2012、上記))、二次元ヒートマップを作製することによって可視化され得る。任意の2つの遺伝子座の間の相互作用頻度は、連鎖不平衡(linkage disequilibrium)プロットと同様にして、各遺伝子座由来の対角線が交わる軸から離れた点を同定することによって可視化され得る。
マップ上の各点は、2つの断片(近接した2つの断片)の間の相互作用点を表す。マップ上の各相互作用点の強度は、それが表す断片の相互作用/近接の頻度に関連している。対角線上の点は、自己ライゲーション作用だけでなく、すぐ隣りの断片へのライゲーションを表す。可視化は、基本的にマトリックス分析である。
サンプル
サンプルは、架橋される又は架橋されることが可能であるDNAを含む任意の物理的実体であってよい。サンプルは、生物学的材料であってもよく、又はそれに由来してもよい。
サンプルは、1つ以上の細胞、一つ以上の核、若しくは1つ以上の組織サンプルであってもよく、又はそれらに由来してもよい。実体は、DNA、例えばクロマチンが存在している任意の実体であってよく、又はそれから誘導可能であってよい。サンプルは、1つ以上の単離された細胞、若しくは1つ以上の単離された組織サンプル、若しくは1つ以上の単離された核であってもよく、又はそれらに由来してもよい。
サンプルは、生細胞及び/若しくは死細胞及び/若しくは核溶解物及び/若しくは単離されたクロマチンであってもよく、又はそれらに由来してもよい。
サンプルは、罹患した及び/若しくは罹患していない被験体の細胞であってもよく、又はそれに由来してもよい。
サンプルは、疾患に罹患していることが疑われる被験体であってもよく、又はそれに由来してもよい。
サンプルは、将来疾患に罹患する可能性について試験される被験体であってもよく、又はそれに由来してもよい。
サンプルは、生存若しくは非生存患者材料であってもよく、又はそれに由来してもよい。
標準サンプルを、スパイクサンプル(spiking sample)の配列読み取りを使用してサンプルを正規化し得るように、異なるサンプル間のより良い比較を可能にするために、各実験サンプルに添加してもよい(スパイク)。スパイクサンプルは、第1のステップにおいて細胞の形態でスパイクを可能にするように、実験サンプルとは異なる種に由来するものであってもよく、又は代わりに、スパイクサンプルは、その独自のアドレスを有してもよく、又は手順の後期にスパイクする場合、異なる種に由来するものであってもよい。
アレイ
典型的に、オリゴヌクレオチドプローブのセットは、支持体上に固定されるか、又はビーズなどの固体支持体上に捕捉される。支持体(例えば、固体支持体)は、様々な材料、例えば、ガラス、シリカ、プラスチック、ナイロン又はニトロセルロースで作製され得る。固体支持体に付着された場合、それは好ましくは硬く、平坦な表面を有する。典型的には、支持体は、約1〜10,000,000個の別々の空間的にアドレス可能な領域、又はセルを有する。約10〜1,000,000又は約100〜100,000又は約1000〜100,000個のセルを有する支持体が一般的である。セルの密度は、典型的に、平方センチメートル内に少なくとも約1000、10,000、100,000、又は1,000,000セルである。いくつかの支持体では、全てのセルを、オリゴヌクレオチドプローブのプールされた混合物又はオリゴヌクレオチドプローブのセットが占める。他の支持体では、いくつかのセルを、プローブのプールされた混合物又はオリゴヌクレオチドプローブのセットが占め、他のセルを、少なくとも合成方法により得ることができる純度の程度まで、オリゴヌクレオチドの単一の種類が占める。
>6bp認識配列を認識する制限酵素については、約2×750,000オリゴヌクレオチドプローブの単一アレイを使用して、例えば、各制限部位の各側に1つのオリゴヌクレオチドプローブを有して、完全ヒト又はマウスゲノムをカバーすることができる。
溶液中のオリゴヌクレオチドプローブ
溶液中のオリゴヌクレオチドプローブは、固体表面上に捕捉され得る部分を含有してよく、例えば、オリゴヌクレオチドは、ストレプトアビジンビーズによって捕捉され得るビオチンを含有し得る。溶液中でのハイブリダイゼーションは、より効率的であり得る。
捕捉は、ハイブリダイゼーション後に行い得る。
ハイブリダイゼーション
用語「ハイブリダイゼーション」は、本明細書で使用する場合、「核酸の鎖が塩基対を通して相補鎖と結合するプロセス」を含む。
選択的ハイブリダイゼーションが可能なヌクレオチド配列は、一般的に、オリゴヌクレオチドプローブの長さにわたって、対応する相補的なヌクレオチド配列と少なくとも75%、85%、90%、95%又は98%相同である。選択性は、ハイブリダイゼーション中の塩及び温度条件によって決定される。
「特異的ハイブリダイゼーション」は、ストリンジェントな条件下(例えば、65℃及び0.1×SSC{1×SSC=0.15M NaCl、0.015M クエン酸Na pH7.0})における特定のヌクレオチド配列のみへの分子の結合、二重化、又はハイブリダイズを指す。ストリンジェントな条件は、オリゴヌクレオチドプローブがその標的配列にハイブリダイズするが、他の配列にハイブリダイズしない条件である。ストリンジェントな条件は、配列依存的であり、異なる状況において異なる。より長い配列は、より高い温度で特異的にハイブリダイズする。一般的に、非常にストリンジェントな条件は、規定のイオン強度及びpHにおける特定の配列に対する熱融点(Tm)より約5℃低くなるように選択される。ハイブリダイゼーション温度は、融解温度(Tm)未満の温度であり、ハイブリダイゼーション温度がTmに近いほど、ハイブリダイゼーションはよりストリンジェントになり、このことは、ミスマッチDNA配列が互いにハイブリダイズしないことを意味する。オリゴヌクレオチド配列は、効率的な、好ましくは完全な、それにより定量的なハイブリダイゼーションを確実にするために、ゲノムDNAより過剰であるべきである。典型的に、ストリンジェントな条件は、pH7.0〜8.3における少なくとも約0.01〜1.0M Naイオン濃度(又は他の塩)の塩濃度を含む。ストリンジェントな条件はまた、ホルムアミド又はテトラアルキルアンモニウム塩などの不安定化剤の添加によって達成され得る。
本発明は、本発明の実施において当業者を補助するのに役立つように意図され、本発明の範囲を限定することは意図されない実施例によってさらに説明される。
[実施例1]
T2Cは、公知の長距離の相互作用を同定する
この方法を試験し、これを他の方法と比較するために、本発明者らは、まず、染色体長距離相互作用についてコヒージョン(cohesion)及びCTCFの役割を研究するために以前使用され、Hi-C及び4Cデータが比較のために既に利用可能である、ヒト第11番染色体上のIGF/H19領域を選択した(図2)。
アレイベースのオリゴヌクレオチドのセットを、H19遺伝子座の約2.1Mbp領域をカバーする全てのBglII断片の末端の近くにマッピングして設計し、合計で、344個のBglII断片に対応する524個のオリゴヌクレオチドになった。BglII断片のいくつかは、末端の一方を表すオリゴヌクレオチドの設計を可能にしなかった。これは、配列が、反復的であったか、又は、4bp認識酵素部位(NlaIII)が、BglII部位に近すぎたか、若しくはBglII断片に全く存在しなかったためである。架橋されたBglII制限DNAを、ライゲートし、脱架橋し、NlaIII酵素で消化し、脱架橋後にオリゴヌクレオチドアレイにハイブリダイズさせた(方法を参照のこと)。
HiCに使用されたゲノムの40kbビニング(binning)を最初に有する配列決定されたライゲーション産物の分析は、T2Cが、IMR90細胞について、Dixonら((2012)上記)によって観察されたのと同様の全体的相互作用パターンを明らかにすることを実証した(エリア外の又は他の染色体との相互作用も観察されるが、示さない)。これはまた、異なる細胞株の間のトポロジカルドメインのような、以前に観察された全体的な構造特性の保存と一致する(図2A+B)。
しかし、T2Cを用いて、制限断片分解能での相互作用マップ(図2C)を得て、領域の一般的クロマチン構造、及び遺伝子とそれらの調節性エレメントの間の接触に関してより詳細を明らかにした。T2Cのこのクロマチン構造情報を比較するために、データを4Cデータと比較し、特定のCTCF視点に対して得られた4Cデータを、T2Cデータに存在する同じ視点について観察された相互作用データの隣にプロットした(図2D)。
個々の相互作用の読み取り範囲(read coverage)にいくつかのバリエーションがあるが、同じ相互作用が、4C及びT2Cによって観察できる。したがって、T2C法は、再現性のある結果をもたらし、相互作用する(又は近接している)断片を忠実に検出し、トポロジカルドメインにおける全体的なゲノム構造を明らかに再現し、6bp認識制限断片に対して予想される約4〜5kbpの分解能を与える。
[実施例2]
T2Cは、異なる生物学的材料に基づいて、異なる相互作用ネットワークを同定する
異なる遺伝子発現状態を、異なるクロマチン相互作用を有する異なる生物学的組織において検出できるどうかを試験するために、T2Cを、マウス胎児肝臓に由来するin vivoマウス初代赤血球細胞及びE12.5マウスに由来する脳細胞に適用した。よく研究されたβ-グロビン遺伝子座を、この遺伝子の周囲約2MBの領域における例として使用した。β-グロビンが、胎児脳細胞と比較して、初代赤血球細胞においてより高度に発現されることは十分に確立され、この細胞型においてこの遺伝子の周囲、及びこの遺伝子とその遺伝子座制御領域(LCR)の間に、より高密度の数の相互作用が予想される。β-グロビン領域を、6bp酵素としてHindIIIで消化し、799個のオリゴヌクレオチドプローブを、遺伝子座におけるHindIII断片(724個の断片、その多くは反復的である)の末端をカバーするように設計し、架橋後にDpnIIで再消化した。
DpnIIで切断後のハイブリダイズした断片の分析は、各トポロジカルドメイン内の多くの相互作用を有する、マウス初代赤血球細胞及びマウス胎児脳細胞の両方における目的領域(約2MB)における5個のトポロジカルドメインを示した。トポロジカルドメインはまた互いに相互作用し、このことは、一連のロゼット様構造へのゲノムの高次構造の可能性を示唆する。異なる生物学的材料間のトポロジカルドメインの数は同じように見えるが、トポロジカルドメイン内及びトポロジカルドメイン間の相互作用は、マウス胎児脳細胞において、マウス初代赤血球細胞と比較して、より密度が低いように見える(図3)。全β-グロビン領域の拡大は、胎児肝臓材料におけるβ-グロビン遺伝子座内の全ての周知の相互作用を示す。β-グロビンプロモーターとLCRの間、及びLCR-3'HS1間などの相互作用が明らかにを可視化される(図3)。これらは、胎児脳サンプルには存在しない。さらに、β-グロビンプロモーターについてこれまで報告されたものとはさらに離れた新しい追加的な相互作用を同定することが可能である。これらは、β-グロビンプロモーターから約1Mbp遠くに位置している。
胎児肝細胞における重要な調節性転写因子、LDB1複合体又は構造因子CTCF、の結合部位の相互作用も比較した。LDB1は、胎児脳細胞と比較した場合、マウス初代赤血球細胞において、β-グロビン遺伝子座及びそのLCR上で高度に富化されている。ChIP-seq(例えば、Soler et al (2010) Genes Dev;24(3):277-89)によって決定されるLDB1又はCTCF転写因子結合部位を含有する制限断片のみを可視化することによって、全ての相互作用のうちどの相互作用がLDB1複合体又はCTCFを含むかを直ちに推論することが可能である(図4)。マウス脳細胞と比較した場合、マウス初代赤血球細胞において、より多くのLDB1によって占有される制限断片が、その遺伝子座における他の位置との相互作用を有することも明らかである(図4)。さらに、近接した2つの断片間の距離の平均値は、胎児肝細胞においてより大きく、このことは、ゲノムのこの領域が、胎児脳と比較した場合、胎児肝臓において凝縮が少ないことを示唆する(図5)。
したがって、T2Cは、例えば初代胎児肝細胞における活性なβ-グロビン遺伝子座、対、胎児脳における同じサイレント遺伝子座など、遺伝子の発現状態に依存して、トポロジカルドメイン、及びドメイン内の異なる相互作用を検出するための有用なツールである。さらに、高レベルの相互作用の分解能は、β-グロビン遺伝子座LDB1結合部位及びループのサイズについて示されるように、新規の観察を可能にする。例えばDNA欠失によって引き起こされるβ-サラセミアにおけるような、遺伝子座内の欠失は、相互作用シグナルの変化を通して直ちに目に見える。
考察
遺伝子の調節におけるクロマチン相互作用の役割の重要性は十分に確立されている。しかし、相互作用及びゲノムの区画化についての情報を提供するための、迅速、簡便且つ手頃な価格の技術の必要性が高まっている。T2Cは、これらのニーズを満たす。全ての制限断片は、「視点」として機能することができ、全てのそれらの相互作用は、短くても若しくは長くても又は他の染色体に対するものであっても(ここには示さず)、同定できる。したがって、複数の3C-seq、4C又は5Cの実験を行う必要はない。さらに、コストを大幅に増加させる、HiCについて必要であった大きな配列決定労力を必要とすることなく、T2Cを用いて、ゲノムの区画化を目的領域において同定することができる。
他の技術と比較した場合、T2Cの設計に起因して、遺伝子座のより良好なカバレージ及び分解能が得られる。T2Cの分解能は、使用した制限酵素に基づく。HindIII又はBglIIによる初代赤血球細胞及びHB2細胞に由来する架橋クロマチンの消化は、それぞれ、2.9Kb及び6.1Kbの平均分解能をもたらした。これは、HiCを用いて得られた通常の40Kbpビンよりも顕著に良好な分解能を提供する。さらに、配列決定目的のために断片(第2の切断後、ハイブリダイゼーション前)にライゲートされたオリゴヌクレオチドにおける適切なアドレスの付加は、アドレス配列がそれが由来するサンプルを識別するため、同じセットのオリゴヌクレオチドに対する異なるサンプルの多重化を可能にする。多重化は、T2Cのコストをさらに削減する。
さらに、T2Cを、Igf2遺伝子座について3C-seq及びHiCと、β-グロビン遺伝子座について以前に公開された3C-qPCRデータと比較し、同じトポロジカルドメイン及び相互作用ネットワークが同定される。これらは全て、ゲノムの特定の領域の全ての相互作用及び区画化を同定するためのツールとして、T2Cの強みを明らかにする。
したがって、T2Cは、面倒な手順又は大規模な配列決定労力を必要とせずに、ゲノム及びクロマチン相互作用の局所的空間構造を調査するための手頃な価格の、且つ費用対効果の高いツールである。
実施例1及び2についての材料及び方法
クロマチン単離及びライブラリー調製
マウス胎児肝臓E12.5由来のマウス初代赤血球細胞、マウス胎児脳細胞及びヒト胸部内皮細胞株(human breast endothel cell line、HB2)からの核を、単離し、架橋した。クロマチンを、6-カッター(マウス細胞についてHindIII及びHB2細胞についてBglII)で消化し、ライゲートし、脱架橋した。得られたライブラリーから、50μgのDNAを頻度の高い4-カッター(マウス細胞についてDpnII又はNlaIII、HB2細胞についてNlaIII)で消化した。これらのステップは全て、以前に記載された3C-seqプロトコールに従って行った(Stadhouders, R. et al. Nat Protoc 8, 509-524 (2013))。
β-グロビン遺伝子座についてのマイクロアレイを、この遺伝子(chr7: 109875617-111971734, mm9)の周囲の約2MBに及ぶHindIII制限部位にできるだけ近い固有のオリゴヌクレオチドを含有して設計した。Igf2遺伝子座について、約2.1MBの領域に及ぶBglII制限部位(ch11: 1091427-3228670, hg19)の近くに、固有のオリゴヌクレオチドを設計した。マイクロアレイ上のハイブリダイゼーションによって富化されるライゲーション産物を、それぞれ第1及び第2の設計について1億個を超える固有の読み取り対をもたらすペアエンド配列決定によって配列決定した。
最終的なライブラリーは、改変したイルミナTruSeq DNAプロトコール(www.illumina.com)に従うイルミナクラスターステーション(Illumina Cluster Station)及びHiSeq 2000シーケンサーでの分析のために調製される。要するに、20μgの消化されたライブラリーを、AMPure XPビーズ(Beckman Coulter)を用いて精製し、末端修復した。ここで平滑末端化された断片を、ATPの存在下でクレノウエキソ酵素を使用してA-テイル化し、AMPure XPビーズを使用して再度精製した。インデックス付きアダプター(Illumina)をA-テイル化DNA断片にライゲートし、AMPure XPビーズを使用してその後精製した。
アレイ捕捉
得られたアダプター修飾DNAライブラリーを、NimbleGenハイブリダイゼーションシステム上でNimbleGen配列捕捉アレイプロトコール(NimbleGen Sequence Capture array protocol)(www.nimblegen.com/seqcapez)に従ってカスタムメイドNimbleGen配列捕捉2.1M捕捉アレイ(NimbleGen Sequence Capture 2.1M capture array)上で42℃で64時間ハイブリダイズさせた。捕捉されたDNA断片を、ハイブリダイズさせたアレイから溶出し、MinEluteカラム(Qiagen)を用いて精製する。捕捉されたDNA断片を、以下のようにPhusionポリメラーゼを用いたPCRによって増幅する: 98℃で30秒、24サイクルの(98℃で10秒、60℃で30秒、72℃で30秒)、72℃で5分最終伸長。PCR産物を、AMPure XPビーズを用いて精製し、30μlの再懸濁緩衝液中に溶出する。1μlを、DNA 1000アッセイを用いたAgilent Technologies 2100 Bioanalyzer上にロードし、ライブラリー濃度を決定し、質を確認する。
クラスター生成及びハイスループット配列決定
クラスター生成は、イルミナクラスター試薬調製プロトコール(Illumina Cluster Reagents preparation protocol)(www.illumina.com)に従って行われる。簡単に述べると、1μlの10nM TruSeq DNAライブラリーストックをNaOHで変性させ、9〜10pMに希釈し、フローセル上にハイブリダイズさせる。ハイブリダイズされた断片を、イルミナペアエンド配列決定(Illumina Paired-end Sequencing)ユーザーガイドプロトコールに従って、順次増幅し、直鎖化し、末端ブロックする。配列決定プライマーのハイブリダイゼーションの後、合成による配列決定(sequencing-by-synthesis)を、製造業者のプロトコールに従って、101サイクルプロトコールを用いてHiSeq 2000シーケンサーを用いて行う。配列決定された断片を、HiSeq 2000を用いてNaOHで変性させ、インデックス・プライマーを断片にハイブリダイズさせた。インデックスを、7サイクルプロトコールで配列決定した。断片を、NaOHで変性し、順次増幅し、直鎖化し、末端ブロックする。配列決定プライマーのハイブリダイゼーションの後、3回目の読み取りの合成による配列決定(sequencing-by-synthesis)を、101サイクルプロトコールを用いてHiSeq 2000シーケンサーを用いて行う。
[実施例3]
ゲノムの3D構造の決定
ゲノムの動的三次元クロマチン構造、及びその機能に対する明らかな共進化的関連-遺伝情報の保存及び発現-は、約130年の集中的な研究の後、依然として、我々の時代の中心的課題の1つである。この実施例では、マウス及びヒトのゲノムの詳細な3D構造が、全ての物理的ゲノム相互作用の新規な優れた選択的ハイスループット高分解能染色体相互作用捕捉(HRHTiCIC2)、スケーリング(scaling)分析、及びポリマーシミュレーションを組み合わせる既に目に見える手段によって、数塩基対〜メガ塩基対レベルで初めて直接決定され得る: 明らかに存在し、且つ異なって凝縮されるクロマチン繊維は、リンカーによって接続された約500〜1500kbpの明確なループ凝集体/ロゼット(サブ染色体ドメイン(sub-chromosomal domain))を形成する約30〜150kbpのループに折り畳まれる。複雑な(らせん状の)ループ及びループ-ループ構造が存在し、相互作用は、異なる細胞型又は機能的状態の間でほんのわずかではあるが有意な程度に変化する。さらに、スケーリング分析は、DNA配列とゲノム構造の間の緊密な進化の絡み合いを示して証明する。その結果、これは最終的に、ゲノムの詳細な構造的「配列決定」、及びしたがって、「ゲノム不確定性原理」の限界における真のシステムゲノミクスへの道を開き、これら全ては、ゲノム理解、並びに診断及び治療のR&Dのために根本的に重要である。
ゲノムの構造と機能が、遺伝情報の物理的な保存及び発現を可能にする不可分なシステムとして明らかに共進化したという事実にもかかわらず、ゲノムの動的三次元高次構造も、その空間的及び時間的改変も、機能的な多次元相互作用及び調節ネットワークとのその関係も、17世紀のA. van Leeuwenhoekによる細胞核の発見、及び多くの他のより最近の画期的結果: C. W. Nagli(1842)/W. Hofmeister(1848)による中期染色体、Miescher(1869)によるDNA、R. E. Franklin、L. C. Pauling、J. D. Watson及びF. H. Crick(1953)によるDNA二重らせん、R. Kornberg(1973)/A. Olins & D. Olins(1974)によるヌクレオソーム、K. Luger(1997)によるヌクレオソームの3D構造の発見/記述以降、ミレニアムの変わり目の全ヒトゲノムの配列決定まで、詳細に決定されていない。さらに、ゲノム構造及び機能が、実際に、遺伝子発現及びしたがって個体間の内在する差異、及びそれらの病歴、並びに機能的環境的ゲノム変更の受け手(receiver)及びしたがって最終的に外部疾患原因に関与するシステムゲノミック(Knoch, 2003)実体を構築していることが明らかになった。
ゲノムのサイズ、構造、及び複雑さは、10-9〜10-5m及び10-10〜105sのスケールに及び、したがって、大きな実験的課題をもたらす。既に、ヌクレオソームがどのように間隔を置いて配置されるか、ヌクレオソームがどのように位置付けられ、リモデリングされるか、及びヌクレオソーム鎖が生理的塩濃度で繊維に折りたたまれるかどうか/どのように折りたたまれるのかは、継続的議論の問題である。例えば、Finch及びKlug(1976)は、規則的なソレノイドを提案し、in vivo中性子散乱実験は、優勢な核の特徴として30±5nmの繊維直径を明らかにし、一方、最近では全く凝縮していないか、又は高度に多形的且つ動的な機能依存的構造であり、これなしでは、ヌクレオソーム濃度分布、高分子の拡散などの動的及び機能的特性、並びにDNA配列のスケーリングは説明がつかない。
高次クロマチン構造は、一世紀を超えてさらに大きな論争の種となっている。Rabl(1885)及びBoveri(1909)による光学顕微鏡研究は、階層的自己相似モデルにつながり、これは領域的構造を示唆し、その後、電子顕微鏡が、Comings(1968, 1978)及びVogel & Schroeder(1974)のモデルにおけるように、よりランダムな間期構造を示唆した。Paulson & Laemmli(1980)の放射状-ループ-足場モデルでは、核マトリックス/足場に付着したクロマチンループは、中期染色体の凝縮の程度を説明するはずである。Pienta & Coffey(1977、発行1984)によると、これらのループは間期に残り、中期に積層ロゼットを形成した。C. Cremer & T. Cremer(1974,1982)によるマイクロ照射は既に有しており、C. Cremer & T. Cremer(2001)、P. Lichter(1988)による蛍光in situハイブリダイゼーション(FISH)及びその後の文献は、間期の染色体、それらのアーム、及びサブ染色体ドメインの領域的構造を、中期(脱)凝縮の間のそれらの構造的持続性を含めて、最終的に確認した(約850のG、Q、R及びCのイデオグラムバンド(ideogram band)は、約2500のサブ染色体ドメインに分割する)。一方、クロマチンロゼットは、電子顕微鏡により可視化されたが、西半球では真剣に受け取られず(Erenpreisa, 1989)、Belmont & Bruce(1994)はまた、電子顕微鏡に基づいて、領域内(下)折り畳み(intra-(sub-territorial folding)について、らせん状階層的染色糸繊維(helical hierarchy chromonema fiber)(CF)モデルを提唱した。同じ頃、小さなFISH標識遺伝子領域間の空間距離の測定は、構造「破壊」に起因して、Sachs(1995; Yokota, 1995; Yokota, 1997; Knoch, 1998; Knoch, 2002)による最初の分析的ループ化ポリマー記述を有する、ランダム-ウォーク/ジャイアント-ループ(RW/GL)モデルを導き、ここでは、1〜5Mbpループが非タンパク質骨格に付着している。その後、構造保持FISH技術を用いた距離測定、高分解能顕微鏡、及び染色体と全細胞核の巨大な並列ポリマーシミュレーションの組み合わせのみが、ロゼットのマルチ-ループ-サブコンパートメント(MLS)モデルをもたらすことができ、これでは、60〜120kbpループが類似したリンカーによって接続されたロゼットを形成する。再び、ヌクレオソーム濃度分布のin vivo測定、並びに巨大分子の拡散としての動的及び機能的特性は、クロマチン折り畳みのような小さなループ凝集体/ロゼットとのみ適合性があり、DNA配列のスケーリングはまた、ここで見られたパターンが他の方法では説明できないため、これを予測する。
さらに、物理的な相互作用が、機能的な化学反応の、及びしたがって、過程連鎖の中心にあるため、転写因子のためのいくつかの結合部位を含有する短い調節性エレメントが、多くの場合巨大なゲノム分離を介して遺伝子転写を調節し、したがって、それらの(物理的)相互作用の可能性における、結果として起こる変化が、遺伝子発現の変化に関与することが明らかになった。これは、予め形成された構造、又はそのような構造、例えばループの修飾若しくは新たな形成のいずれかが、空間的に近接して結合し、したがって相互作用の確率を変化させるためである。これらの構造の形成において、転写カスケードの因子が、例えばCTCF又はコヒージョンとして、直接又は二重若しくは多重使用ケースとして主要な役割を果たすようであることも、論理的推論によって既に明らかであるようである。その結果、共に、ゲノム構造及び機能的調節が、転写カスケードを介してゲノム的に原因となるシステムであり、個体とその病歴との間の内在する差異の原因であるだけでなく、機能的環境的ゲノム変更の受け手であり、したがって、最終的に外部疾患原因であることが明らかとなった。
(i)局所的により多く凝縮され又はより少なく凝縮されたクロマチン繊維が、(ii)ループ凝集体/ロゼットに折り畳まれて存在するかどうか(これらの全ての実験と、及び数塩基対レベル〜メガ塩基対レベルのゲノム「生(live)」サイクルに関する全ての機能的要求と一致して)、(iii)この構造の一般的スケーリング挙動があるかどうか、(iv)DNS配列自体の長距離相関と一致して、及び(v)これが新規in vivo測定と一致しているかどうか、を決定するために、全ての物理的ゲノム相互作用(全てとの全て)の新規な選択的高分解能のハイスループットな染色体相互作用捕捉アプローチを開発し、これはHRHTiCIC2であり、これはまた、診断及び治療のためのゲノムの効率的且つ安価な構造配列決定への道を開き、要するに(Sup. 方法を参照のこと)、(i)約107個の培養/調製細胞で開始し、(ii)細胞をホルムアルデヒド固定し(すなわち、DNA-DNA、RNA-RNA、DNA-RNA、タンパク質-タンパク質、DNA-タンパク質、RNA-タンパク質、及びより複雑なゲノム架橋を形成し)、(iii)第1の制限酵素での核内制限を可能にするために、透過処理し、(iv)主にこれらの複合体内の再ライゲーションを可能にするために、架橋された断片の抽出による大きな希釈、その後の(v)脱架橋、精製、及び第2の高頻度制限酵素による又は超音波処理(最高分解能のため)によるサイズ<500bpへのDNAキメラ断片の最終的短縮。次いで、(vi)清浄した(cleaned)領域的HRHTiCIC2 DNA相互作用断片ライブラリーを、固有の且つハイブリダイゼーション最適化したオリゴ当たり約109〜1010個の分子(すなわち、捕捉は常に線形レジームであり、飽和からは遠い)を用いたDNA捕捉アレイを使用して作製し、これは順次、第1の制限酵素の隣に直接配置される。(vii)ハイスループット配列決定の後、得られた配列を、第1の制限酵素までの配列断片のみを含有するようにトリミングし、次いで、全参照ゲノムに対してまずマッピングし、2つの制限酵素を用いた場合には、第1の制限酵素と第2の制限酵素の間の領域のみを含有するマスクされた配列に対してもマッピングし、最終的に100%の固有にマッピングされた配列のみを使用する。
この新規な選択的HRHTiCIC2アプローチは、大きな利点を有する: (i)他の相互作用捕捉技術と比較した制限要因は、現在、配列決定能力/コストだけであり、第1の制限酵素の分解能、捕捉された領域のサイズ、相互作用頻度範囲、及び多重化実験の数の間の選択された関係: 例えば、約500bp断片分解能、2Mbp領域において、1〜106相互作用頻度範囲、及び10〜100倍の多重化が、10〜100レーンの配列決定で容易に達成できる(注記: いくつかの領域がまた、1つの捕捉アレイ上に存在し得る)。(ii)オリゴ位置の設計により、最小限の配列決定で最大のデータ清浄度、及びしたがって最大の相互作用情報が到達される。(iii)さらに、全体のプロセスが構造保存について最適化されており(Sup. 方法を参照のこと)、これは、既にわずかな違いが、異なる染色体モデルに歴史的につながっている、高分解能FISHにおいてもポイントである。これはまた、各ステップにおける歪み(distortion)及びDNA損失の最小化を含み、これは多くの場合、繊細/微妙な実験室/ベンチハンドリングによって達成される。注目すべきことに、ここで、配列決定まで、公知の構造の歪み、(コストドライブな(cost driving)プライマー)、又はPCRステップは伴わない。
さらに、50〜100bpに至るまでの可能な断片長を用いて(遊離DNAの平均持続長(persistence length)約50nm又は約140bp; 典型的なタンパク質/ヌクレオソーム結合領域約200〜500bp)、この方法の根本的な制限は、到達されるだけでなく、より重要なことに、所定の瞬間での各細胞における固有の個別の確率的断片設定/条件/環境とのそれぞれの高分解相互作用の個別性(individuality)に由来する、ゲノム不確定性原理としてここで導入されるものであり、これは、測定によって破壊され、したがって、不確定性原理の古典的定義は以下である: (i)既に細胞集団は、細胞の状態及び機能的差異の分布を有し、(ii)各断片は、多かれ少なかれ動的な(したがって安定な又は可変の)個々のDNA、RNA、タンパク質、制限結合(restriction association)を有し、したがって全体の架橋、制限、及び再ライゲーションは、異なる個々の効率を有し、且つ、当然ながら、(iii)オリゴハイブリダイゼーション捕捉、配列決定、及びマッピングに関するDNA配列はまた、これに追加する。したがって、最終的には、確率論的解析及びステートメント(statement)のみが、一般的には量子メゾスコピック系(quantum mesoscopic system)から知られたものとして、及び古典的な光二重スリット実験からよく知られたものとして引き出され得る。現在、また、合理的な(sensible)補正のための手段は存在しない。これは、少なくとも現在、影響因子/パラメータの実際の状態が、無数であり、計算できず(特に、それらの非直線性に起因して)、全ての単一の断片について異なり、それに加えて、測定により破壊されるためである。効果は低分解能によって平均化されたが(それにもかかわらず不合理(senseless)であるが、その効果において有害でない補正を可能にする)、これは、任意の相互作用捕捉の種類について常に当てはまっており、しかし、現在根本的制限が到達される。これは、前例のない洞察力を持ってこの基本的なレベルでその完全性及び美しさにおいて全てのこれらの効果の上に統合された相互作用情報を理解する機会を開く。
必要な分解能及び生物学的影響を用いてクロマチン繊維コンホフォメーション及び3D構造を調べるために、ヒト染色体11p 15.5-15.4、すなわちIGF/H19領域、及びマウス染色体7qE3-F1、すなわちβ-グロビン領域を選択した。両者の約2.1Mbp領域は古典的にFISHによってよく研究され、エピジェネティックな及び局所的な制御領域調節の3C例であるためである。第1の制限酵素としてBgl II及びHind III、第2の制限酵素としてNlaIIIを使用することによって、これは、それぞれ6121及び2915bpの平均を有する約200〜500bpに至るまでの多くの断片をもたらす。さらに高い分解能で研究するために、次いで、クロマチン繊維コンホフォメーションを、全般に高分解能で分析し、本発明者らはまた、約50〜500bpを有し、549bpの平均断片サイズまでの、10個の異なるマウス染色体上の合計99.5Mbpの15個の領域を大ざっぱに(そして低配列カバレージで)調査した。したがって、本発明者らは、分子及びヌクレオソーム(平均ヌクレオソーム反復長約200bp、したがって3〜6kbpは平均約15〜30個のヌクレオソームに対応する)及びさらにはサブヌクレオソーム分解能、及びしたがってすなわちゲノム不確定性原理のレベルに達する。種、細胞株間の差異、及び機能的/構造的差異を調べるために、ヒトHB2細胞株及びコヒーシン切断可能なTEV/HRV RAD21-eGFP細胞株システム(未切断及び切断されたコヒーシン、Zuin et al 2013 PNAS、印刷中)及びマウス胎児脳(β-グロビン不活性)及び胎児肝臓(β-グロビン活性)細胞を使用した。クロマチン繊維形成を調べるために、胎児肝細胞も使用した。配列決定に関する約107個の入力細胞を用いて、対応する材料(例えば2つの異なる状態)を、等しい条件を保証するために、捕捉アレイ上に多重化した。1つ又は2つのレーンを、同じ配列決定ラン又は異なるランのいずれかで配列決定した。様々な効果に起因して、合理的なミスマッチ率(参照ゲノムに対する及びそれにおける配列決定の差異/エラーを説明するための)を有してゲノム全体において固有の配列のみが、第1及び第2の制限部位間にマッピングする配列のみについて清浄化された。
したがって、対数及び虹色の頻度範囲を有する直立平方(upright squared)相互作用マトリックス(2つのミラー化された三角形半分)における領域的相互作用の選別及びプロットは、実験自体の妥当性、及び一般に6桁に及び、対角線を除き4〜5桁に及ぶ前例のない頻度範囲分布を直接示す。したがって、10-4〜10-5の頻度を有する稀な相互作用も、領域サイズ、断片分解能、及び配列決定労力のこの設定で可視化することができる。これは、この関係を変更して2〜4桁容易に増加させることができる。さらに、約10兆個の入力細胞に関連した断片当たりの平均累積エントリーの関係は、HRHTiCIC2の推定約0.1〜1.0%の効率を示す。さらにパターンは、統計的制限において不確定性原理が安定した確率的なレベルに達したレベルが達成されることを明らかに示す。多重であるか否かにかかわらず、同じ実験についての異なる配列決定レーンからの画像がわずかな統計的偏差のみを示すためである。
T2Cからの視覚的手段による3D構造の決定
配列読み取りの高い数にもかかわらず、そして非若しくは自己ライゲートした断片のエントリーを示し、したがって、捕捉オリゴが存在し、働いたことを実証する大部分の対角線エレメントにもかかわらず、異なる実験の全ての相互作用マトリックスが、再現可能であり、再現可能に多かれ少なかれ空である(empty)、すなわち、顕著な均一なノイズ又はバックグラウンドは存在しない。「空であること(emptiness)」はまた、明確に構造化され、偶然のものではなく、細部の極めて高度まで反復して同じに見える、すなわち、相互作用は統計学的に突然出現しているのではなく、より顕著な相互作用に近い場所で統計的にクラスター化されてもいない。したがって、確かに>104細胞が手順を生き残り、ノイズが原理的に手順のどの段階でも現れ得ることからの情報を考慮し、さらには例えば相互作用に対する通常の分散型ノイズシグナルの起こりそうもなく高度に偏った歪みを仮定すると、ノイズに対するシグナルの比は、>105〜106である必要がある。
さらに驚くべきことは、既に視覚的に相互作用自体が、ゲノム分離の全てのスケールにおいて明確に区別できるパターンの出現に関して、及びパターンが一貫して他のスケールにおいて再出現し又はしていない(ゲノムはスケールを橋渡しするシステムであるためそれらがしなければならない)という事実にさえ関して、一層より特筆すべきであり、また、そのようなパターンが生じる機会は考えられないほど小さいため、関与するパラメーターが多く、そして非線形であるにもかかわらず、全T2C手順が実際に働くことを即座に示す。既知の視点に対する最初の比較は、T2Cでは相互作用のPCR拡大が出現しないため、同じ断片分布に対するはるかによりきれいな且つはっきりとした相互作用を伴うが、例えば3CとのT2Cの一致を明らかにする。結果として、詳細な相互作用パターンは、現在さらにより容易に解釈することができる。
目視検査によるクロマチン繊維のコンホメーションの決定:
最小のゲノムスケールにおいて、より大きなゲノム分離と比較して、ゲノム分離<5〜10kbp(すなわち<25〜50ヌクレオソーム)についての対角線に並行なバンドにおける密度のより高い相互作用パターンが明らかに存在する。このパターンは、局所的断片分解能とは無関係に変化し(それにもかかわらず、考慮される必要がある)、間にある相互作用しない「ギャップ」との明らかな相互作用からなり、増加したゲノム分離に対して減少する、均一な、例えばガウス(Gaussian)様の相互作用「スミア(smear)」とは対照的である。したがって、結果として、目視検査は、このスケール-DNA/ヌクレオソームのスケール-で、安定で、規定された相互作用が存在することを既に直接的に示し、したがって、これらの相互作用は空間的近接の結果であるため、ヌクレオソームの不規則であるがそれにもかかわらず局所的に規定された構造への凝縮が存在することを示し、すなわち、繊維の概念が適用され、これは、一般的な用語で、そのバリエーションに起因して、平均密度等を有する「疑似繊維(quasi-fiber)」と呼ぶことができる。明らかに、らせん状クロマチン繊維モデルによって提案されるように、構造的にどこでも全く同じで均一な繊維は、対照的に、均一なバンド状のサブパターンにつながり、ヌクレオソームの常に動的なランダムウォークはまた、ゲノム分離に応じたレイリー分布(Reighley distributed)相互作用減少を有する均一な相互作用パターンをもたらす。したがって、目視検査によって、クロマチン「疑似繊維」の存在、その局所的相互作用、及びしたがってT2C手順境界(procedural boundary)全体にわたって自然に平均化された凝縮構造を直接的に読み出すことができる。
目視検査によるサブ染色体構造ドメインの決定:
最大のスケールにおいて、シャープな境界及び他のドメインとの相互作用を有する、数百から約1〜1.5Mbpの範囲での四角様ドメインの出現がまた、いくつかの顕著な一般的特徴を伴ってすぐに目に見える(マウスの場合と比較してヒトではより顕著であるが)。まず、それらのサブ構造を無視する瞬間についてのドメイン内の相互作用頻度は、一般に平均的な均一な高さを有し、サブドメイン間の相互作用を規定する別の均一な高さへと端において落ちる。したがって、増加するゲノム分離、及び他のドメインとの明確ではっきりした相互作用を伴うしばしば考えられる一般的な連続的相互作用減少とは対照的に、相互作用の階段様の挙動がある。第二に、対角線の近くではまた、クロマチン疑似繊維は活動し始め、さらに、リンカーは構造的観点では非常に柔軟であるため、ドメイン間の相互作用は特に強く複雑であるが、ドメインの境界には、明らかな遷移(transition)又はリンカー領域がある。したがって、これらの結果は、再び、構造的に安定なサブ染色体単位の存在を証明し、これは、歴史的概要に記載されているように、比較的安定であり、それらの境界において特によく互いに相互作用する。さらに、既にこのレベルにおいて、ドメイン内の平均的に均一な相互作用及び端での急激な低下は、リンカーによって接続されたドメインのループ-凝集体及びさらにはロゼット様構造に向けて既に非常に明確に示す。1つの大きなループ、ランダムウォーク、又はフラクタル小球(fractal globule)様折り畳みは、全て、ここで見られた鋭い端及び規定の挙動を導かないためである。
目視検査によるクロマチン高次構造、すなわち染色体のループ/凝集体/ロゼット折り畳みのコンホメーションの決定
中間のスケール、及びしたがってサブ染色体ドメインレベルでは、相互作用パターンは、交差した直鎖状又は格子様パターンで配置される、相互作用間の再び明確に区別できるギャップによって特徴付けられる。興味深いことに、直鎖状パターンはサブ染色体ドメインの外側に続き、次のサブ染色体ドメインから生じる直鎖状パターンとそこで「交差」する。さらに、ドメインの外側の一般的な、より低い一般的相互作用頻度レベル、及びそこで見られるあまり複雑でない相互作用パターンは、直鎖状パターンに従ってドメインに戻ることを可能にし、これは、外側のはるかにより簡単で/明確なパターンが、ドメイン内にも明らかに存在するが、さらなる相互作用によってそこで富化されより複雑であることを明らかにする。そのような線に従い対角線に戻り、次の関連する相互作用に垂直方向に従ってこれを開始視点と受け取ることがここでできる(外側からドメインへ水平方向に従うことが再びできる)。次いで、対角線上の相互作用点を再び水平方向に見つけ出す。これを繰り返すことは、対角線上の第2の相互作用点を与え、ここで、ほとんどの場合、この第2の相互作用はまた、第1の及びしたがって開始点と相互作用することを証明することができる。したがって、手動で、相互作用の格子を構築することができる。これは、垂直方向及び水平方向に相互作用を投影することによって向上させることができ、これは、染色体配列に沿ってピーク様パターンをもたらし、このピークは、交差した直鎖状パターンと一致する。これは、マウスの場合と比較して、ヒトにおいてより顕著である。数万塩基対のスケールでの相互作用は、特にクロマチンループ化とみなされ、また、そのようにみなすことのみができるため、これは、そのループ塩基が相互作用よって可視化されるいくつかの連続するループが、一致するループ塩基、すなわち、コアを有するループ凝集体、及びしたがって、多かれ少なかれ明確なコアを有するループのロゼットも有することを意味する。相互作用と格子様パターンとの間のギャップはまた、ランダム-ウォークジャイアントループ、染色糸様、又はフラクタル小球パターンのような他の折り畳みが、それらは全て、明確なドメイン境界を持たず、区別できるドメイン境界を明らかに持たない、均一な相互作用パターンをもたらすため、その起源であり得ないことを示す。これはまた、多数のヌクレオソーム構造が予測する、疑似クロマチン繊維への非凝縮に当てはまり、これは、巨大で、非常に動的な相互作用の可能性をもたらす。注目すべきことに、異なるスケールでのデータ構造はまた、全てのスケールにおいて相互作用が実際にクロスリンクし、異なる、根底にある架橋可能薬剤に依存し得るという仮定がまた正しいこと、及びしたがって特定のDNA位置又はタンパク質などの間の架橋がこのようなパターンを作製するという仮定がほとんどあり得ないことをを証明する。さらに、単純なパターンは、クロマチンの凝縮密度のバリエーション、及び、ループ内で様々な形態のさらなる相互作用が生じるという事実に起因して、より複雑である: 大きなスケールでは、単純ループ又は超らせん様パターンさえありそうに思われるが、一方、低いスケールでは、主要なループ塩基相互作用の周りのパターンは、ロゼットコアの構造、及び局所的クロマチン凝縮、及びそこでの両者の絡み合いを示す。最高分解能での実験は、一般的には、より詳細にクロマチン繊維コンホメーションを調べるためになされ、したがって、あまり深くない配列決定を伴ったが、これらのデータの全体的な評価は、実際に、ループ凝集体/ロゼットに、及び特別な相互作用パターンを導く、ループ内及びループ外部の詳細なコア構造に起因し得る、いくつかのこのような構造を見出す結果となった。ドメインとそれらのパターンとの間の相互作用は、したがって、2つの起源に帰することができる: 一方では、その後のドメインのループ凝集体/ロゼットコアは、比較的低い数のループ及びしたがって密度に起因することができ、ループダイナミクスは非常に容易に相互作用する。他方では、細胞集団において、凝縮度が当然非常に高い有糸分裂染色体もある。したがって、パターンは、細胞周期を通して構造及びそのダイナミクスの両方を一貫して説明し、再び、これは、凝縮したクロマチン繊維でのみ可能である。そうでなければ、凝集体/ロゼットコア間のコア相互作用は、ポリマー繊維の排除によって遮断されるためである。
異なる細胞型に応じた目視検査による3D構造の決定、又は細胞若しくは疾患状態の処置:
制御、又は意図的なシステムの歪みに起因した、一般的に、種、細胞型、領域的、機能的若しくは構造的差異に応じた構造変化を調べるために、ヒトHB2及びTEV/HEV細胞、並びにマウス胎児脳(FB)及び肝臓(FL)細胞において、ヒトIGF/H19 11p 15.5-15.4領域を調査し、マウスβ-グロビン7qE3-F1を調査した。一般的な一般的なドメインは、HB2、TEV、HEV、並びにFB及びFL細胞において、したがって、同じ種の異なる細胞型において明らかに同じであるが、選択した領域に少なくとも起因してヒトとマウスの間では異なる。詳細のより細かい程度では、ヒトHB2細胞は、TEV/HEVシステムと比較して、ドメイン内のより多くの、より密な相互作用パターンを示すようである。FBをFL細胞と比較すると、このような明らかな差を示さない: 以前の実験から予測されるように、追加のループが形成されるβ-グロビン遺伝子座について示され得るように、実際に、差異は、単一又は小グループの相互作用に属することが多い非常に微妙なものである。それにもかかわらず、ここでの小(small)という用語は、相対的なものである。なぜならば、そのような単一のループ形成は、実際にβ-グロビン転写、すなわち全体の経路を活性化し、したがって、細胞の全体の特性が変更され得るからである。さらに、しかし、TEV/HEVシステムにおいてコヒージョン(ゲノム構造において主要な構成的役割を果たすと言われている)を切断することは、また、劇的な変化を導かず、十分実際にはわずかにより多くの均等に広がった相互作用を導き、これは、わずかにより高い柔軟な/動的構造であるが、ゲノムワイド解析において以前考えられていたほど大きくないことを示唆する。したがって、コヒージョンは、単一の、及び間違いなく主要/単一成分原因物質ではあり得ず、代わりに、ゲノム構造に影響を与える/形成する、明らかないくつかの成分の一つであり、ゲノム構造の柔軟性と安定性の間の進化的バランスを示す。その結果、これらのバリエーションは、異なる条件下でのT2C及びその分析の再現性のある質、及び明確な一般的ゲノム構造が存在することを示すだけでなく、全ての細部における局所的に、本質的に、ゲノム不確定性原理の到達レベルが、システムを微調整するために考慮すべき大きなテーマのバリエーションであることを示す。したがって、明らかに、約2Mbpのみの大きなゲノム領域において、慎重に詳細に分析するための、大量の相互作用データが存在する。
T2Cと比較した、モンテ-カルロ(Moten-Carlo)及びブラウン動力学(Brownian-Dynamics)シミュレーションによる3Dクロマチン高次構造の決定
予め設定された条件を用いて独立してより明確な方法で全てのスケールでこの挙動を探求し、理解するために、三次元ゲノム構成に関する一般的実験結果、設計及び仮説を評価するために(フィットさせるようにではなく)、最近、ポリマーモデルが開発されている。そこでは、分解能が、伸縮可能な、屈曲可能なポリマーセグメントに基づき、体積排除(volume exclusion)は、約1〜2.5kbpと同等の分解能を持ち、大きなループ(0.5〜5.0Mbp)が柔軟な骨格に似ているリンカーによって連結されているランダム-ウォーク/ジャイアント-ループモデルを特徴とし、及び可変サイズ(60〜250kbp)のリンカーによって連結されたより小さいループ(60〜250kbp)を有するロゼット様凝集体(0.5〜2Mbp)を用いたマルチ-ループサブコンパートメント(MLS)モデルを特徴とする。これらのシミュレーションは増強され、初めて、二次元空間距離及び相互作用マップ(異なる架橋確率及び程度について)が、極めて高い統計的妥当性を用いて計算された。視覚的比較は、全ての上述の効果解釈が、シミュレーションと一致していることをすぐに明らかにし、さらに、相互作用は、ヌクレオソームがここでモデル化されていないことを考慮すると、わずかな詳細においてさえ、全てのモデルパラメーターの関数である: (i)一般的に相互作用の程度は、相互作用及び架橋確率に依存し、(ii)ドメインサイズ、ドメイン分離、及びループの間隔は、それらのサイズに比例し、(iii)ドメイン間の相互作用は、リンカーサイズ、ループのサイズ及び数、すなわちロゼットの密度に依存する。したがって、ロゼットの密度の微妙な組み合わせは、ループサイズ、ループ数、クロマチン繊維持続に起因し、こうして得られた排除効果は、最終的に、高い数が広がることを導き、ロゼットの遮断効果、及びドメイン全体の間の相互作用パターンに対する微妙な影響をもたらす。ドメイン間のリンカー及びドメイン間相互作用に対するその比例性は、本発明者らが凝集体/ロゼット境界におけるループの相互作用の理解及び類似効果を作製するためにここで意図的に示す、非平衡効果と同様に、明らかに目に見える。また、相互作用マトリックスの一般に大きな空虚(emptiness)及び専用の(dedicated)クロマチン繊維の存在に対するリンクは、明らかであり、また、関係が明確にフィット可能ではない複雑すぎるパラメーターセットを含有するためであるが、架橋確率、範囲(radius)及び頻度が、比較的低いと推定され得ることを示す。最高分解能を有する実験は、様々なこのような構造が存在するが、将来、はるかにさらに詳細に調査する必要があることを示すが、モデルはまた、ロゼットのループ塩基における特別な挙動を明らかに示し、これは、現実には、凝縮のバリエーションに起因して、現実にはより複雑であり得る。
相互作用間の遺伝的距離に応じた、並びにモンテ-カルロ及びブラウン動力学シミュレーションのスケーリング挙動、及びDNA自体における長距離相関のスケーリングと比較した、相互作用の頻度のスケーリング挙動からの、T2Cのスケーリング挙動の決定による、3Dクロマチン高次構造の決定:
統一されたスケール-橋渡し様式で、数塩基対のスケールから、メガ塩基対及びサブドメインレベルを介して、染色体全体及びしたがって核のスケールまで(10-9〜10-5mのスケールに及ぶ)の挙動を調べるために、本発明者らは、スケーリング分析を導入し、その能力を示した: 異なるシミュレートされたモデルによって与えられるゲノム分離に応じた相互作用頻度のスケーリングは、(i)一般的相互作用減少、すなわち、空間的距離増加、(ii)サブ染色体ドメイン様構造、(iii)サブドメインにおける凝集したループ/ロゼット様構造、に起因する、微細構造を有する多重スケーリング挙動を有する、長距離スケーリングを明らかに示す。全てのパラメーターバリエーションは、ここでスケールにおける変更されたスケーリング挙動において再び見出され得る。これは、スケーリングの他の手段と一致している。したがって、例えば、全てのスケールを橋渡しする自己相似フラクタルにおいて見られるような、及び全てのスケールにおいて同じである、統一スケーリングはないが、その偏差は、ドメイン及びループ内の下部構造を示す。
異なる領域のスケーリング挙動は、比較において、染色体のサブセットのスケーリング挙動であり、したがって、一般的なスケーリング挙動からの局所的構造偏差によって支配され、またここで使用される相互作用の量によって損なわれる(compromised)。それにもかかわらず、スケーリング挙動は、(i)微細構造を有する長距離多重スケーリング挙動を示し、(ii)微妙ではあるが、一般的ではない、様々な種、細胞型、機能/歪みの違いについての差異を示す。
全ゲノム上の異なる公開された実験のそれらのゲノム分離に応じた相互作用頻度のスケーリング挙動はまた、(i)微細構造を有する長距離多重スケーリング挙動を示し、(ii)微妙ではあるが、一般的ではない、様々な種、細胞型、機能/歪みの違いについての差異を示す。
しかし、実験上の及びモデル化されたスケーリング挙動の両方は、可変サイズ(60〜250kbp)のリンカーによって連結されたより小さいループ(60〜250kbp)を有するループ凝集体(0.5〜2Mbp)を有するループ凝集体/ロゼット様ゲノム構造でのみ一致する。
物理的空間において近いものは、DNA配列空間においても近くであるはずであるため、あらゆる種類の変異はゲノム構造自体によって偏りを受けるため、本発明者らは、また、可能な最も単純な相関分析、すなわち、2つの異なるヒト及びマウスの全体が配列決定された株についての異なるサイズのウィンドウ内の塩基対組成の平均二乗偏差、によってDNA配列の相関挙動を調べた: (i)大部分の全体の観察可能なスケール上で相関分析を使用して、長距離べき乗(power-law)相関が見い出され、(ii)数塩基対のスケールで、ランダムに近い相関を有する種特異的な多重スケーリング挙動を示す局所的相関係数で、40〜3400bpの第1の最大、及び105〜3×105bpの第2の最大、(iii)さらなる微細構造は、第1及び第2の最大に存在する。一般的に及び詳細に、挙動は、マウスの場合と比較して、ヒトでより強いが、異なる染色体内では、ほぼ同一であり、やや大きな程度まで特定の染色体について外れているだけである。全てのスケールでの挙動は、詳細なゲノム構造の長距離多重スケーリングと同等であるだけでなく、正しいスケールにおけるものでもある。したがって、見い出された第2の最大は、サイズ及び位置において、サブ染色体ドメインに対応する。特に、微細構造レベルで、第1の一般的最大でのヌクレオソーム結合との、以前に既に証明されている関連は、ここで、第2の最大まで同様に拡張されることができ、以前に予測されたようにそこでループ化構造と関連付けられることができる。
さらに、最高分解能での相互作用スケーリングは、同じ最大中のDNA配列のスケーリング挙動と、異なる染色体にわたって同じ挙動を示す: 実験上の分解能に起因して微細構造を見出すことはできないが、広いピークを有する一般的挙動及び約4kbpを超えるスケールでのより強い相互作用の減少は、相互作用の実験とDNA配列の両方において、凝縮されたクロマチン繊維が実際に存在することを強く示唆する。
T2Cの詳細な説明を有する実施例3の方法:
HB2細胞株及び細胞培養
HB2細胞(1-7HB2、ヒト乳腺管腔上皮細胞株MTSV1-7のクローン誘導体)を、0.2mM L-グルタミン、100単位/ml ペニシリン、100mg/ml ストレプトマイシン、10%FCS、5μg/ml ヒドロキシコルチゾン、及び10μg/ml ヒトインスリンを補充したDMEM中で培養した。以前3C研究において、本発明者らは、核型、及びいくつかの領域のDNAメチル化を確認した。
TEV/HRV細胞株システム及び細胞培養
切断可能なTEV/HRV RAD21-eGFP細胞株システムは、HEK293T細胞株システムであり、これは、切断可能なRAD21-eGFP融合タンパク質、及び内因性RAD21ノックダウンのためのsiRNAをコードするpRTS-1ベクターでトランスフェクトされた。両者は、間にある双方向プロモーターのドキシサイクリン誘導活性化によって、したがって同時に発現される。RAD2-eGFP融合タンパク質について、第1のRAD21-セパレース(separase)切断部位が、PCRベースの突然変異誘発を用いて、ヒトライノウイルスの3Cプロテアーゼ(HRVプロテアーゼ)のもので置き換えられている(第2の切断部位は少ない細胞の細胞障害性を確保するために変化しないままであった)、切断可能RAD21をeGFPの前に挿入した。タバコエッチウイルスプロテアーゼ(TEVプロテアーゼ)はHRV切断部位を認識せず、したがって、コントロールとして作用し得る。内因性RAD21ノックダウン配列は、次の3'UTRに向けたsiRNAを用いてノックダウンを可能にする:
5'-ACUCAGACUUCAGUGUAUA-3'(Scc1-1)、
5'-AGGACAGACUGAUGGGAAA-3'(Scc1-2)。
TEV/HRV RAD21-eGFP細胞株システムの生成のため、元のHEK293T細胞株を、0.2mM L-グルタミン、100単位/ml ペニシリン、100mg/ml ストレプトマイシン、10%FCSを補充したDMEM中で培養し、37℃及び5%CO2にて増殖させた。トランスフェクションのために、製造業者の説明書に従ってリポフェクタミン2000(Invitrogen)を使用した。ベクターを有する細胞を、150μg/ml ハイグロマイシンを含有する培地中での増殖によって選択した。単一クローンを採取し、2μg/ml ドキシサイクリンを用いた誘導の3日後に、RAD21cv及びRAD21wt構築物の発現及び内因性RAD21の枯渇について分析した。得られたTEV/HRV RAD21-eGFP細胞株を、37℃及び5%CO2にて0.2mM L-グルタミンを補充したDMEM中で同様に培養した。
実験のために、そしてHRV(又はコントロールとして機能するTEV、したがってトランスフェクションは起こるが切断は起こらない)で導入遺伝子発現を活性化するために、細胞を、2μg/ml ドキシサイクリンの存在下で3日間培養した。その後、細胞を分割し、50%コンフルエンシーまで再播種し、再び製造業者の説明書に従ってリポフェクタミン2000(Invitrogen)を用いてHRV又はTEVベクターでトランスフェクトした。プロテアーゼトランスフェクションの24時間後、細胞を実験に使用した。
マウスからの細胞の調製
マウス胎児肝臓及び胎児脳細胞について、1〜2個のトランスジェニックFVB/Nマウスの妊娠12.5日目の約10個の胚を、十分複雑な細胞集団及び最後に配列決定される十分なDNAを有するために、実験で必要とされる約1000万個の細胞のために使用した。マウスを70%EtOHで洗浄し、腹部を開いて、胚を含有する頸部を取り出し、その後、それらを切り離し、卵黄嚢及び胎盤からそれらを取り出した。小さく、未発達の胚を廃棄した。胚を、0.5mlの10%FCS/PBSを有する氷上のペトリ皿中で収集する。次いで、胎児肝臓及び脳を胚から切断し、再び500μlの10%FCS/PBSを含有する氷上のチューブ(1ml)中に収集した。次いで、細胞を、P1000/1mlプラスチックピペットチップを用いて再懸濁し、結合組織を、25□lの2.5%コラゲナーゼストック(0.125%最終濃度)を添加することにより消化し、37℃で約45分間インキュベートした。その後、細胞懸濁液を、室温で12mlの10%FCS/PBSを有するファルコンチューブに移し、その後、再びP1000/1mlプラスチックピペットチップを用いて、6ウェルプレートの内部に配置されたスクレーパーメッシュを通して穏やかにつぶした。メッシュを、室温で2mlの10%FCS/PBSで洗浄し、メッシュから全ての細胞を得た。得られた単一細胞懸濁液を、室温で12mlの10%FCS/PBSの最終体積を有するファルコンチューブに再び回収した。注目すべきことに、本発明者らは、細胞核への損傷を避けるために、細胞のストレスを最小限に維持しようとした。再懸濁、コラゲナーゼ処理後、及び/又は胎児肝臓及び脳材料/細胞のスクレーピング後の両者を、スライドガラス上にスポットし、DAPIでの核の染色(又は最終的には任意の他の免疫蛍光若しくは蛍光in situハブリダイゼーション)あり又はなしで、顕微鏡によって細胞の、及び特に核の完全性を確認した。
細胞のHRHTiCIC2架橋/固定
ゲノム及び細胞全体の架橋/固定のため、細胞を、最初に計数し、それらの濃度を、室温で12mlの10%FCS/PBS中で1000万個に調整し、15mlポリプロピレンチューブ(細胞培養に使用され、したがって、管壁に過度に細胞を吸収/固定しない、Greiner Bio One)に入れた。次いで、650μlの37%ホルムアルデヒドPBS溶液を、細胞凝集を回避するために穏やかに転がしながら10分間室温で加え、すなわち、ホルムアルデヒドの1.9%の最終濃度を架橋/固定のために使用する。注記: この段階での架橋/固定のためのホルムアルデヒドの濃度は、次のステップのために、及び本発明者らがここで使用したヒト及びマウス細胞の細胞/核完全性に関して理想的である; これは一般的に適用できるかもしれないが、他の濃度及びインキュベーション時間がより良い結果を達成する場合が知られている。このように、チューブを氷上に置き(これからは、本発明者らは、材料のいずれもの損傷を避けるために、DNAの第1制限(下記参照)まで全てを氷上に保持した)、PBS中の1.6mlの冷1M グリシンを、架橋/固定反応を停止するために加えた。その後、細胞を4℃で1300rpmで8分間スピンダウンし、得られたペレットを氷冷PBSで洗浄し、1ml最初に取り、その後、14mlのPBSまで加え、次いで、再び4℃で1300rpmで8分間スピンダウンした。本発明者らは、溶解及び第1制限にすぐに続けることを勧めるが、上清を廃棄した後、ペレットはここで保存のために凍結することもできる。再び細胞を、スライドガラス上にスポットし、DAPIでの核の染色あり/なしで、顕微鏡によって細胞の、特に核の完全性を確認した(注記: 再び最終的には任意の他の免疫蛍光若しくは蛍光in situハブリダイゼーション実験のために細胞をここで使用することもできる)。
細胞核の調製及び第1の核ゲノムDNA制限
細胞の溶解のため、及び細胞核を調製するために、本発明者らは、10mM Tris pH8.0(50μl 1M)、10mM NaCl(10μl 5M)、0.2%NP-40(100μl 10%)、100μlの50×コンプリートprot. Inhib.(50×=1mlのPBS中に1錠)からなる、5mlの新鮮な(完全な活性のため)溶解緩衝液を氷上で(!)常に調製し、5mlまでMilliQで充填した(4.74ml)。架橋/固定の最後のステップで調製されたペレットを、1mlのこの溶解緩衝液中に取り、再懸濁し、別の4mlで合計5mlまで充填し、氷上で10分間インキュベートした。ここで遊離の細胞核を4℃で1800rpmにて5分間スピンダウンし、ペレットを0.5mlの氷冷PBSセーフロックチューブ中に取り、4℃で2600rpmにて1分間遠心した。再びここで、上清を除去及びスナップ凍結後に、-80℃で核を保存することができる。確認のために、本発明者らは常に、核をスライドガラス上にスポットし、顕微鏡及び/又はDAPIでの核の染色によって核の完全性を確認した。
第1の制限のために、核をここで1.2×制限緩衝液(60□l制限緩衝液、440μl MilliQ、及び必要に応じてBSAについて調整)を有する0.5ml/チューブ中に再懸濁し、1.5mlセーフロックチューブに移した。次いで、核ラミナを穏やかに透過処理するために、チューブを37℃に入れ、7.5□lの20%SDS(0.3%最終濃度)を添加し、900rpmで振とうしながら、1時間37℃でインキュベートした。核ラミナをさらに穏やかに透過処理するために50μlのTriton-X-100(2%最終濃度)を添加した後、核を再び900rpmで振とうしながら1時間37℃でインキュベートした。注記: SDS及びTriton-X-100のステップは共に、任意の脱架橋を避けるために、細心の注意を払って行う必要がある。再び本発明者らは、DAPI染色あり及び/又はなしで核を顕微鏡で確認することによってそれを確認した。未消化材料の将来のコントロールのため(いわゆる第1非制限コントロール)、ここで5μlのアリコートを採取し、-20℃で保存した。次いで、400単位の選択された制限酵素を添加し、37℃で一晩(約20時間)インキュベートした。ヒト細胞について、全ての場合に、制限酵素BglII(Roche)を使用した。マウス細胞について、本発明者らは、HindIII(Roche)又はApoI(New England Biolabs)のいずれかを使用した。注記: ApoIについて最適温度は50℃であるが、サンプルの部分的脱架橋を防止するために37℃を使用すべきである。そして再び制限の将来のコントロールのために、ここで5μlのアリコートを採取し、-20℃で保存した(いわゆる第1制限コントロール)。第1の制限後、制限を停止するために残りのサンプルに40μlの20%SDS(最終濃度1.6%)を添加し、核ラミナのさらなる分解のために900rpmで振とうしながら20〜25分間65℃でインキュベートした。
希釈、再ライゲーション、及び制限されたゲノムDNAの脱架橋
その後、完全に消化された核材料を、50mlファルコンチューブへ移し、6.125mlの1.15×ライゲーション緩衝液(6.125ml: 5421ml MilliQ+704μlライゲーション緩衝液)を添加することによって希釈した。次いで、375μlの20%Triton-X-100(最終濃度1.0%)を加え、手で10分毎に振とうしながら、1時間、37℃の水浴中でインキュベートした。次いで、20μlのリガーゼHC 5U/□l(合計で100U、Roche)を添加し、一晩(約20時間)16℃でインキュベートし、その後、室温でさらに30分間インキュベートした。ライゲートしていないDNA及びライゲートしたDNAを脱架橋するために、30μlの10mg/mlプロテイナーゼKを添加し、一晩(約20時間)水浴中で65℃でインキュベートした。再び、再ライゲーション及び脱架橋の将来のコントロールのために、ここで5μlのアリコートを採取し、-20℃で保存した(いわゆる再ライゲーション/脱架橋コントロール)。
DNA精製及び第2の(再ライゲートされた)DNA制限/超音波処理
サンプルのさらなる処理のために、まず、DNAを、30μlの10mg/ml RNAse(合計300μg)を添加し、30〜45分間37℃でインキュベートすることによって精製し、その後、室温まで短く冷却し、7mlのフェノール−クロロホルムを添加し、激しく振とうした。次いで、サンプルを、15分間4,000rpm(2200xg)で遠心分離し、その後、上相を新しい50mlチューブに入れ、7mlのMilliQ、及び1ml当たり1μlのグリコーゲン、1.5mlの2M酢酸ナトリウムpH5.6を加え、精製を増強するために35mlの100%エタノールを加え、穏やかであるが完全に混合し、その後、1.5〜3時間-80℃に入れた。この後に、15分間4,000rpm(2200xg)の直接遠心分離、上清除去、10mlの70%EtOHの添加、再懸濁、及び15分間4℃での4,000rpm(2200xg)での再びの遠心分離が続いた。上清を除去した後、ペレットを20分間乾燥させ、30分間37℃で150□lの10mM Tris pH7.5に溶解した。再び再ライゲーション及び脱架橋の将来のコントロールのために、ここで5μlのアリコートを採取し、-20℃で保存した(いわゆる第1精製コントロール)。
その後、得られた再ライゲートされ、脱架橋され精製された材料を、第2の制限によって短かくした: まず、この段階でのDNAの量を制御するために、1μlのアリコートを、2%アガロースゲル上で既知濃度の種をマッチさせたゲノムDNAの参照サンプルと一緒に流した。次いで、DNAを、100ng/μlの濃度に0.5ml/チューブ中に調整し、DNA1μg当たり1Uの選択された制限酵素を添加することによって第2の制限酵素で制限し、37℃で一晩(約20時間)インキュベートした。ヒト細胞について、全ての場合において、制限酵素NlaII(New England Biolabs)を使用した。マウス細胞について、本発明者らは、HindIIIを第1の制限酵素として使用した場合にはDpnII(New England Biolabs)を、又はApoIを第1の制限酵素として使用した場合には15秒オン及び45秒オフの10サイクルを有する超音波処理のいずれかを使用した。
様々なDNAコントロールの処理
様々な段階でのDNAの完全性のコントロールのために、次のコントロールを使用した: (i)第1非制限コントロール、(ii)第1制限コントロール、(iii)再ライゲーション/脱架橋コントロール、(iv)第1精製コントロール、及び(v)第2制限/最終精製コントロール。これらのサンプルを、外部制限コントロールとして一緒に制限し、再ライゲートし、精製された対応するプラスミドDNAと共に2%アガロースゲル上でコントロールした。(i)〜(iii)のコントロールについて、アリコートを、少なくとも1時間、65℃で90μlの10mM Tris pH7.5中で10μlのプロテイナーゼK(10mg/ml)と共にインキュベートした。DNAを3μlの10mg/ml RNAseを添加し、30〜45分間37℃でのインキュベーションによって精製し、その後、室温まで短く冷却し、500μlまでMilliQ(約400ml)を添加し、500μlのフェノール−クロロホルムを添加し、激しく振とうした。次いで、コントロールを、15分間13,200rpmで遠心分離し、1ml当たり2μlのグリコーゲン、50μlの2M酢酸ナトリウムpH5.6及び850μlの100%EtOHを加え、穏やかであるが完全に混合し、スナップ凍結し、その後、20分間13,200rpmの直接遠心分離処理を行い、次いで、上清除去、1mlの70 EtOHの添加、4℃での13,200rpmでの遠心分離、新たな上清除去、20分間のペレット乾燥、及び30分間37℃にて20μlの10mM Tris pH7.5中の溶解が続いた。
T2C一般的DNA全ゲノム配列決定ライブラリー調製
一般に、DNA T2C断片ライブラリーを、本発明者らからの増強改変を有するIllumina TruSeq DNAプロトコールに従ってイルミナクラスターステーション(Illumina Cluster Station)及びHiSeq 2000シークエンサー上での配列決定分析のために調製した(www.illumina.com、TruSeq DNAサンプル調製LSプロトコール; パート#15026489 Rev. C); (i)DNA断片の精製、(ii)平滑末端状態に達するための末端修復、(iii)キメラを回避するための3'末端アデニル化、(iv)最終的な多重化ステップを含む、配列決定アダプターライゲーション、及び最後の(v)T2C全ゲノム配列決定DNA断片ライブラリーの精製。
したがって、まず、T2C DNA断片ライブラリーの濃度を、Quant-it dsDNA広範囲アッセイキットを用いて1μlの材料を使用して、微調整のために再び測定した。その後、サンプルをそれぞれ5μgのT2C DNA断片ライブラリーの4セットに分け、以下の完全な手順をこれらの4セットの材料のそれぞれについて行った:
(i)第2制限後、T2C DNAライブラリーを精製するために、AMPure XPビーズ(Beckman Coulter)を、消化されたDNA1.0μl当たり1.8μlのAMPure XPビーズを添加することによって使用した。これを、5分間室温でインキュベートし、磁気スタンド上に置き、5分間室温でインキュベートし、そして上清を、ビーズを乱さずに廃棄した。ビーズを新たに調製した70%エタノールで2回洗浄し、ビーズを乾燥させるために5分間37℃に置いた。次いで、ビーズを50μlのPCRグレード水に再懸濁し、5分間室温でインキュベートし、5分間磁気スタンド上に置き、最後に50μlの上清を新しいチューブに移した。精製された消化されたDNAの質を決定するために、1μlを、最終的に、DNA 1000アッセイを用いてAgilent Technologies 2100 Bioanalyzerにロードした。
(ii)T2CライブラリーDNA断片の末端修復のために、それらは以前に制限されたか又は超音波処理され突出末端を有するため、4材料セットを、それぞれ50μlにおいて96ウェルプレートに移した。材料の混入を避けるためにインライン(in-line)コントロール試薬を使用しなかったため、10μlの再懸濁緩衝液を添加し、その後、40μlの末端修復ミックスが続き、全体の体積を上下に10回穏やかにピペッティングすることによって完全に混合した。次いで、プレートを、マイクロシール「B」粘着シールで覆い、30分間30℃にて予備加熱したサーマルサイクラー上に置いた。プレートから粘着シールを除去した後、まず、それらが十分に分散するまで、AMPure XPビーズをボルテックスし、そして160μl(24μlのPCRグレード水と混合した136μlのAMPure XPビーズからなる)をウェルに添加し、全体の体積を10回上下に完全にではあるが穏やかに再びピペッティングした。15分のインキュベーション後、プレートを、液体が透明に見えるまで、さらに15分間室温で磁気スタンド上に置いた。次に2回127.5μlの上清を除去し、その後、200μlの新たに調製した80%EtOHをビーズを乱すことなくプレートのウェルに充填し、30秒間室温でインキュベートし、ビーズを乱すことなく再び廃棄した。これを2回繰り返し、その後、15分間プレートを乾燥した。その後初めて、プレートを磁気スタンドから取り出し、ペレットを17.5μlの再懸濁緩衝液で再懸濁し、その後、10回上下にピペッティングすることによって10回完全にではあるが穏やかに10回混合した。2分間室温でインキュベートした後、プレートを、液体が透明に見えるまで再び5分間室温で磁気スタンドに戻し、その後、次のステップでの3'末端アデニル化の準備ができている末端修復材料を含有する15μlの透明な上清を取り出した。
(iii)末端修復HRHTiCIC DNA断片ライブラリーの3'末端アデニル化のために、すなわち、平滑末端が互いにライゲートすることを防止し、したがって、ステップ(iv)におけるアダプターライゲーション反応中の低い割合のキメラ(連結された鋳型)形成を確実にするために、ATPの存在下でクレノウエキソ酵素を使用した。アダプターの3'末端の対応する単一の「T」ヌクレオチドは、アダプターを断片にライゲートするための相補的オーバーハングを提供した。
したがって、15μlの末端修復T2C DNA断片ライブラリーを、新しい0.3mlのPCRプレートに移した。材料の混入を避けるためにインライン(in-line)コントロール試薬をここでも使用しなかったため、2.5μlの再懸濁緩衝液を添加し、その後、12.5μlの解凍したA-テイル化(A-tailing)ミックスが続き、上下に10回完全にではあるが穏やかにピペッティングした。次いで、プレートを、マイクロシール「B」粘着シールで密封し、30分間37℃にて予備加熱したサーマルサイクラー上に置いた。プレートをサーマルサイクラーから取り出した直後に、アダプターライゲーションを行った。
(iv)インデックス付きアダプター#6及び#12が提供されるイルミナを使用して配列決定アダプターをライゲートするために、DNAアダプターチューブ及び停止ライゲーション緩衝液を使用し、5秒間600 xgまで遠心分離した。使用直前に、Illuminaにより推奨されるように、ライゲーションミックスを含有するチューブを-25℃保存から取り出した。材料の混入を避けるためにインライン(in-line)コントロール試薬をここでも使用しなかったため、2.5μlの再懸濁緩衝液を別のPCRプレートのウェルに添加し、2.5μlのライゲーションミックスを同様に添加した。次いで、適切なアダプターチューブからの2.5μlを添加し、上下に10回完全にではあるが穏やかにピペッティングした。次いで、プレートを、マイクロシール「B」粘着シールで再び密封し、プレートを1分間280xgまで遠心分離した。その後、プレートを、10分間30℃にて予備加熱したサーマルサイクラー上でインキュベートし、プレートをサイクラーから降ろし、粘着シールを除去し、5μlの停止ライゲーション緩衝液を加え、上下に10回完全にではあるが穏やかにピペッティングした。
(v)シーケンサー適合性T2C DNA断片ライブラリーを精製するために、再びAMPure XPビーズを使用した。したがって、それらが十分に分散するまで、AMPure XPビーズを遠心分離し、42.5μlの混合したAMPure XPビーズをウェルに加え、上下に10回完全にではあるが穏やかにピペッティングし、その後15分間室温でインキュベートした。次いで、液体が透明に見えるまで、プレートを、最小5分間又はそれ以上、室温で磁気スタンド上に置いた。次いで、80μlの上清をプレートの各ウェルから除去し、プレートを磁気スタンド上に残しながら、200μlの新たに調製した80%EtOHをビーズを乱さずに加え、30秒間室温でインキュベートした。次いで、完全に上清を除去した。このエタノール洗浄を2回行い、その後、まだ磁気スタンド上にあるプレートを、15分間室温で空気乾燥した。磁気スタンドから取り出した後、乾燥したペレットを52.5μlの再懸濁緩衝液を使用して再懸濁し、上下に10回完全にではあるが穏やかにピペッティングした。2分間のインキュベーションの後、液体が透明に見えるまで、プレートを、最低5分間又はそれ以上、室温で磁気スタンドに戻した。次いで、50μlの透明な上清を、第2のクリーンアップのために新しい0.3. PCRプレートに移し、50μlのボルテックスしたAMPure XPビーズを加え、上下に10回完全にではあるが穏やかにピペッティングした。次いで、プレートを15分間室温で再びインキュベートし、液体が透明に見えるまで、プレートを、最低5分間又はそれ以上、室温で磁気スタンド上に再び置いた。プレートをまだ磁気スタンド上に残しながら、95μlの上清を除去し、200μlの新たに調製した80%EtOHをビーズを乱すことなく各ウェルに加え、30秒間室温でインキュベートした。完全に上清を除去した。このEtOH洗浄を再び2回行い、その後、まだ磁気スタンド上にあるプレートを、15分間室温で空気乾燥した。磁気スタンドから取り出した後、乾燥したペレットを22.5μlの再懸濁緩衝液を使用して再懸濁し、上下に10回完全にではあるが穏やかにピペッティングした。2分間のインキュベーションの後再び、液体が透明に見えるまで、プレートを、最小5分間又はそれ以上、室温で磁気スタンドに戻した。最後に、プレートの各ウェルからの20μlの透明な上清を採取し、4つの並列で処理されたT2C DNA断片ライブラリー分割のそれぞれからの材料をプールした。
領域的DNA配列決定捕捉マイクロアレイ設計
高分解能を達成し、ハイスループット多重化配列決定を可能にし、したがって、高度に関連性ある局所的相互作用マッピングを達成するために、すなわち、高品質のT2C2を達成するために、特別な捕捉アレイを、不要なバックグラウンドの配列決定を回避し、目的ゲノム領域について特異的に選択するように、すなわち、第1の制限後の再ライゲートされたDNA片の選択について、すなわち、特異的且つ比較的小さなゲノム領域のみにおける相互作用について直接的に、最適化された領域的DNA配列決定ライブラリーを作製するように、設計した。したがって、NimbleGenとの緊密な協力の下で、本発明者らは、2.1M捕捉アレイ、すなわち、同じ量の異なるオリゴを用いて210万個の異なるゲノム配列を原理的には捕ることが可能な捕捉マイクロアレイ、についてのDNAオリゴを設計した。真の高品質な結果を達成するために、核全ゲノム制限に使用した第1の制限部位のできるだけ近くに、T2Cの1つのみ(!)のオリゴを上流に、1つを下流に配置した。この第1の制限の再ライゲーション後の各側の配列決定に関心があるためである。オリゴを、72±3bpのオリゴ長、全ゲノムにおける固有の出現(ミスマッチは許容されない)を有するゲノム構築(builts)mm9及びHG19を用いて、並びにマイクロアレイ上の最良且つ類似の、すなわち、類似のハイブリダイゼーションの、捕捉に関して、ヒト及びマウスのゲノムの選択された領域について、NimbleGen及び本発明者らが設計した。次いで、オリゴをさらに選択した: 配列決定のために再ライゲートしたDNAライブラリーを短くするための第2の制限酵素を用いる場合、オリゴは第1の制限部位と第2の制限部位の間に位置しなければならなかった。再ライゲートしたDNAを短くするために超音波処理を用いる場合、第1の制限部位の150bp以内のオリゴのみを選択した。第1の制限部位又は第2の制限部位又は両制限部位さえのいずれかを交差した1つだけのオリゴが存在した場合、オリゴの開始又は終了の合計で10%以下での切断のみが許容され、すなわち、オリゴは、特異性及び類似のハイブリダイゼーション効率を保証するために、最小62bpを有するDNA片を確かに捕捉することができた。同じ条件を、第1の制限側について、超音波処理の場合に適用した。その後、本発明者らは、ゲノム上にオリゴをマッピングし、条件が満たされたかどうか、及びオリゴが他のゲノムの特徴に関して適切に配置されたかどうかを手動で制御した。マイクロアレイの製造のために、210万個の可能な異なるオリゴの数Oアレイを、選択されたオリゴの数O選択によって除算し、その後、選択された各オリゴを、NimbleGenによる捕捉マイクロアレイの製造プロセスの間に実際の捕捉アレイ上にNスポット回、スポットした(Nスポット=Abs(Oアレイ/O選択))。したがって、第1の制限酵素及び第2の制限酵素を使用して捕捉(下記参照)のために使用されるオリゴの数を用いて、本発明者らは、マイクロアレイ上にそれぞれ異なるオリゴについて約1010個のオリゴ分子を必ず有することができ、したがって、本発明者らが入力として使用する107個の細胞を用いて、本発明者らは、>105〜106倍、アレイの飽和から離れている。約250倍多くのオリゴ及びカバーされる合計約50倍多くのゲノム領域を用いる超音波処理を使用する実験の場合、捕捉アレイまでの実験手順における損失を考慮すれば、それは依然として>102である。
第1の制限酵素及び第2の制限酵素を用いる実験に関して、選択された領域サイズ、相互作用マトリックスの得られたサイズ、すなわち、この領域内の全ての制限断片間の全ての可能性のある相互作用、及びそれぞれの可能性のある相互作用について最小4〜5桁(本発明者らは2〜3桁の平均を想定し、それは4〜5桁の広がりをもたらす)の高頻度範囲を達成する配列決定能力の間のバランスを算出した。したがって、約3億及び5億個の配列の、すなわち、可能性のある相互作用事象の3億及び5億個の配列決定の、2つの配列決定レーンにおける配列決定能力について、相互作用毎に平均100〜1,000個の配列決定事象を達成する目的で、500〜1,000個のオリゴ及びしたがって相互作用断片が最適である。次いで、カバーされるゲノム領域は、分解能、すなわち、ゲノム内の第1の制限酵素の平均間隔、のみに依存する。
第1及び第2の制限酵素の場合、本発明者らは、オリゴ及び捕捉アレイを以下のように選択した: ヒトの場合、これを、塩基対位置約1,110,650〜約3,216,350の第11番染色体上のH19/IGF2領域、すなわち2,105,700bpのサイズの領域、及び525個のオリゴについて行った。マウスの場合、これを、塩基対位置約109,876,350〜111,966,600の第7番染色体上のβ-グロビン領域、すなわち2,090,250bpのサイズの領域、及び800個のオリゴについて行った。
HRHTiCIC2領域的DNA配列決定ライブラリーの調製-マイクロアレイ捕捉
T2C全ゲノムDNA断片配列決定ライブラリーから下位選択された領域的T2C DNA断片配列決定ライブラリーを作製するために、配列決定アダプターのライゲーション後のプールされたDNAライブラリーを、(www.nimblegen.com/seqcapez、NimbleGenアレイユーザーズガイド、配列捕捉アレイデリバリー(Sequence Capture Array Delivery)バージョン3.2)からの増強改変を有するNimbleGenアレイ捕捉プロトコール及びハイブリダイゼーションシステムを用いた、上述の新たに且つ特異的に開発された捕捉マイクロアレイを使用した下位選択に供した。全手順は、(i)マイクロアレイハイブリダイゼーション、(ii)洗浄、その後の(iii)捕捉された領域的DNAライブラリーのマイクロアレイからの溶出からなった。
(i)したがって、捕捉の3時間前に、ハイブリダイゼーションシステムを42℃に設定し、第1のヒートブロックを95℃に設定し、別のものを70℃に設定し、平衡化した。次いで、ハイブリダイゼーション混合物を、配列決定アダプターのライゲーション後にプールされたDNAライブラリーに、300μlの1mg/ml Cot-1 DNAを加えることによって調製した。多重化されたサンプルを使用する場合、4セットの材料をプールしただけでなく、多重化されたサンプルをプールした。これは、マイクロアレイのキャパシティを節約し、捕捉されるDNAの量はマイクロアレイの飽和から遠いため、これは、使用されるDNAの量、濃度、及び方法に依存して、最大10〜100個のサンプルを多重化するための余地を残す。ここで、多重化は、2つの異なる材料をプールすることによってダウン(down)しただけであった。次いで、サンプルを約30〜45分間60℃でSpeedVac中で乾燥し、VWR水11.2μlを再水和のために添加し、ボルテックスし、30秒間最高速度で遠心分離し、その後、DNAを完全に可溶化するために10分間70℃のヒートブロック上に置いた。2回目のボルテックス及び再度30秒間最大速度での遠心分離後、18.5μlの2X SCハイブリダイゼーション緩衝液及びSCハイブリダイゼーション成分Aを添加し、その後再び、ボルテックス及び再度30秒間最大速度での遠心分離が続いた。その後、DNAを変性させるために、サンプルを、10分間95℃のヒートブロック上に置き、その後、30秒間最高速度でさらに遠心分離した。その後、サンプルを42℃に置き、そこから直ちにマイクロアレイハイブリダイゼーションチャンバーにロードし(完全なマイクロアレイシステムを並行して調製した)、64時間42℃でハイブリダイズした。
(ii)マイクロアレイ上に捕捉された領域的T2C DNAライブラリーを洗浄するために、まず、溶出チャンバーをNimbleGenアレイユーザーガイドに従って組み立てた。したがって、マイクロアレイスライドを42℃NimbleGenハイブリダイゼーションシステムから取り出し、47.5℃に加熱した100mlのSC洗浄緩衝液IIを含有する分解ベースン(disassembly basin)に直接入れた。平衡化に用いた約10秒後、ミキサーを離し、スライドを47.5℃でSC洗浄緩衝液IIを含有する第2の洗浄チューブに移し、密閉した洗浄チューブを、毎秒1反転の速度で10回反転した。次いで、スライドを47.5℃で32mlのストリンジェント洗浄緩衝液を含有する新しい洗浄チューブに移し、密閉したチューブを毎秒1反転の速度で10回反転し、その後、5分間47.5℃に置き、再び毎秒1反転の速度で10回反転した。次いで、スライドを47.5℃で32mlのストリンジェント洗浄緩衝液を含有する新しいチューブに移し、密閉したチューブを毎秒1反転の速度で10回反転し、その後、5分間47.5℃に置き、再び毎秒1反転の速度で10回反転した。次いで、スライドを、室温で32mlのSC洗浄緩衝液Iを含有する新しいチューブに再び移し、密閉したチューブを2分間毎秒1反転の速度で反転した。次いで、スライドを、室温で32mlのSC洗浄緩衝液IIを含有する新しいチューブに再び移し、密閉したチューブを1分間毎秒1反転の速度で反転した。次いで、スライドを、室温で32mlのSC洗浄緩衝液IIIを含有する新しいチューブに再び移し、密閉したチューブを毎秒1反転の速度で10回反転した。
(iii)捕捉された領域的T2C DNA断片配列決定ライブラリーをマイクロアレイから溶出するために、スライドを室温でNimbleGen EL1溶出システムに移した。次いで、約900μlの125mM NaOHをいっぱいになるまで溶出チャンバーに添加し、10分間インキュベートした。溶出された領域的DNA断片配列決定ライブラリーを1.5mlチューブにピペットで移し、900μlの125mM NaOHまで充填し、その後、1.5mlチューブに予め調製された16μlの20%酢酸溶液及び500μlのQiagen緩衝液PBIの十分に混合した溶液516μlを含有する2つの新しいチューブに等しく分割した。次いで、混合物を遠心分離機上の単一のMinEluteカラムに移し、それぞれ700μlのいくつかのステップでカラムを通して溶液を引き出した。次いで、750μlの緩衝液PEをカラムに入れ、遠心分離して流した。次いで、MinEluteカラムを2ml回収チューブに入れ、残留する緩衝液PEを除去するために最高速度で1分間遠心分離した。フロースルーを廃棄し、その後、MinEluteカラムをきれいな1.5mlチューブ中に入れ、25μlの緩衝液EBをカラムに添加し、1分間インキュベートし、最高速度で1分間遠心分離した。
T2C増幅、クラスター生成、及びペアエンドハイスループット配列決定
まず、ペアエンド配列決定のために、T2C領域的DNA断片配列決定ライブラリーを、最初に、98℃で30秒、12サイクルの(98℃で10秒、60℃で30秒、72℃で30秒)、72℃で5分間の最終伸長を使用するPhusionポリメラーゼを用いたPCRにより、配列決定のために富化した。各1μgのT2C領域的DNA断片ライブラリーについて、5μlのPCRプライマーカクテル及び25μlのPCRマスターミックスをPCRプレートに添加した。精製のために、AMPure XPビーズ(Beckman Coulter)を、1.0μlのDNA当たり1.8μlのAMPure XPビーズを添加することによって使用した。これを5分間室温でインキュベートし、磁気スタンド上に置き、5分間室温でインキュベートし、上清をビーズを乱さずに廃棄した。ビーズを新たに調製した70%エタノールで2回洗浄し、ビーズを乾燥させるために5分間37℃に置いた。次いで、ビーズを30μlの再懸濁緩衝液に再懸濁し、5分間室温でインキュベートし、5分間磁気スタンド上に置き、最後に50μlの上清を新しいチューブに移した。精製された消化されたDNAの質を決定するために、1μlを、DNA 1000アッセイを用いてAgilent Technologies 2100バイオアナライザー上に最終的にロードした。
クラスタ生成を、イルミナcBotユーザーガイド(www.illumina.com、パート#15006165 RevE)に従って行った。簡単に言えば、1μlの10nM TruSeq DNAライブラリーストックDNAを、NaOHで変性し、10pMに希釈し、フローセル上にハイブリダイズした。ハイブリダイズした断片を、イルミナペアエンド配列決定ユーザーガイドプロトコールに従って、順次増幅し、直鎖化し、末端ブロックする。配列決定プライマーのハイブリダイゼーションの後、合成による配列決定(sequencing-by-synthesis)を、製造業者の説明書に従って、101サイクルプロトコールを用いてHiSeq 2000シーケンサーを用いて行った。配列決定された断片を、HiSeq 2000を用いてNaOHで変性し、インデックスプライマーを断片にハイブリダイズさせた。インデックスを7サイクルプロトコールを用いて配列決定した。断片を、NaOHで変性し、順次増幅し、直鎖化し、末端ブロックする。配列決定プライマーのハイブリダイゼーションの後、3回目の読み取りの合成による配列決定(sequencing-by-synthesis)を、101サイクルプロトコールを用いてHiSeq 2000シーケンサーを用いて行った。
HRHTiCIC2配列マッピング及び分類
生配列読み取りを、配列決定方向における第1の制限酵素認識配列の存在について確認した。最初の酵素認識部位の後の配列を除去した。オーバーハング後の認識部位の塩基がはっきりしていなかった場合、読み取りを、オーバーハングの末端後の全ての塩基を除去することにより、トリミングした。次いで、これらのトリミングされた配列を、全ヒトゲノムNCBI36/hg18アセンブリーに対して、及びマウスNCBI37/mm9アセンブリーに対してBurrows-Wheelerアライメント(BWA)ツールを使用してアラインさせた。したがって、以下のデフォルトパラメータセットを(括弧[]内のパラメーターの値を用いて)使用した:
Figure 2016537029
第2の制限酵素を用いる場合(したがって超音波処理の場合ではない)、次いで、固有の配列を、第2の制限酵素間の配列部分を除外した、第1の酵素認識部位を含有しなかったマスクされたゲノムに対して第2のステップにおいてアラインさせた。最終的に、全体及びマスクされたゲノム参照配列の両方において固有のアラインメントを示した配列のみを、SAMtoolsを用いて対合させ、ペアエンドバイナリーアライメント/マップ(BAM)ファイルを生成した。注記: アラインメントは固有であるが、それにもかかわらず、配列決定エラーに起因するか又は参照ゲノムに対する本発明者らの細胞/マウスの違いを示唆する、ミスマッチなどを含有する。残念ながら、また、偽陽性又は偽陰性のアライメントを識別する方法はない。その結果、得られたペアエンド配列は、配列決定のエラー率、参照配列の質、及びこの参照ゲノムに対する本発明者らの細胞/マウスのDNA配列の差異によって決定されるエラー率を有する相互作用情報を含有する。既知のエラー率を用いるこのプロセスの終了時におけるミスマッチのない固有の配列についての偽陽性及び偽陰性結果の概算は、エラーが、エラーの蓄積及び本発明者らの手順によるエラーの低減後1%より小さいことを示す。これはまた、最終的な結果までのプロセス全体を通した初期の生配列からの配列対の減少から推定することができる。
上記明細書で言及した全ての刊行物は、参照により本明細書中に組み込まれる。本発明の記載された方法及びシステムの種々の改変及び変形は、本発明の範囲及び精神から逸脱することなく当業者には明らかである。本発明は特定の好ましい実施形態に関連して説明されてきたが、特許請求される本発明は、このような具体的な実施形態に不当に限定されるべきではないことを理解すべきである。実際、分子生物学又は関連分野の当業者に明らかである本発明を実施するための記載された様式の種々の改変は、以下の特許請求の範囲内にあることが意図される。

Claims (43)

  1. 三次元DNA構造における1つ以上の目的領域に由来する1つ以上のヌクレオチド配列の、他のヌクレオチド配列との相互作用を分析する方法であって、
    (a)架橋されたDNAのサンプルを提供するステップ、
    (b)該架橋されたDNAを第1の制限酵素で消化するステップ、
    (c)架橋されたヌクレオチド配列をライゲートするステップ、
    (d)架橋を解消する(reverse)ステップ、
    (e)(d)に由来するライゲートされた分子を断片化するステップ、
    (f)ステップ(c)において別のヌクレオチド配列にライゲートされたヌクレオチド配列の末端について富化するために、(e)に由来する断片を、第1の制限酵素の切断部位に隣接する配列を表す1つ以上のオリゴヌクレオチドにハイブリダイズさせるステップ、及び
    (g)相互作用に関与するヌクレオチド配列を同定するために、富化された断片のヌクレオチド配列を分析するステップ、
    を含む、方法。
  2. 三次元クロマチン構造における1つ以上の目的ゲノム領域に由来する1つ以上のヌクレオチド配列の、他のヌクレオチド配列との相互作用を分析するための、請求項1に記載の方法。
  3. 第1の制限酵素が、6〜8bpの認識部位を認識する制限酵素である、請求項1又は2に記載の方法。
  4. 第1の制限酵素が、BglII、HindIII、EcoRI、BamHI、SpeI、PstI及びNdeIからなる群から選択される、請求項3に記載の方法。
  5. ステップ(e)において、ライゲートされた分子が、第2の制限酵素による消化によって断片化される、請求項1〜4のいずれか一項に記載の方法。
  6. 第2の制限酵素が、4又は5bpのヌクレオチド配列認識部位を認識する、請求項5に記載の方法。
  7. 第2の制限酵素が、TspEI、MaeII、AluI、NlaIII、HpaII、FnuDII、MaeI、DpnI、MboI、HhaI、HaeIII、RsaI、TaqI、CviRI、MseI、Sth132I、AciI、DpnII、Sau3AI及びMnlIからなる群から選択される、請求項6に記載の方法。
  8. ステップ(e)において、ライゲートされた分子が、機械的手段によって断片化される、請求項1〜4のいずれか一項に記載の方法。
  9. ステップ(e)において、ライゲートされた分子が、せん断によって断片化される、請求項8に記載の方法。
  10. ステップ(e)において、ライゲートされた分子が、2bp酵素を認識する制限酵素若しくは制限酵素の組み合わせを使用して、又は一般的ヌクレアーゼによる限定的消化を使用して断片化される、請求項1〜74のいずれか一項に記載の方法。
  11. ステップ(e)において、ライゲートされた分子が、放射線又は重イオンを用いて断片化される、請求項1〜4のいずれか一項に記載の方法。
  12. ステップ(e)の後、断片化された分子のDNA末端が、修復される、請求項1〜11のいずれか一項に記載の方法。
  13. ステップ(e)の後、アダプターが、配列決定目的のためにライゲートされる、請求項1〜12のいずれか一項に記載の方法。
  14. アダプターが、アドレス配列を含む、請求項13に記載の方法。
  15. 多重化の場合に異なるサンプルの識別を可能にするために、異なるサンプルにおいて複数のアドレス配列を含む、複数のオリゴヌクレオチドが使用される、請求項14に記載の方法。
  16. ステップ(f)において、1つ以上のオリゴヌクレオチドプローブが、マイクロアレイ上にスポットされるか若しくはビーズ上に捕捉されるか、又は溶液中に存在し、後にビーズ上に捕捉される、請求項1〜15のいずれか一項に記載の方法。
  17. オリゴヌクレオチドプローブが、第1の制限酵素の制限部位に隣接する配列を認識する、請求項1〜16のいずれか一項に記載の方法。
  18. オリゴヌクレオチドプローブが、第1の制限酵素の制限部位の100bp以内の配列を認識する、請求項17に記載の方法。
  19. ステップ(f)において、ヌクレオチド配列断片が、複数のオリゴヌクレオチドを含むオリゴヌクレオチドプローブのセットにハイブリダイズされ、この複数のオリゴヌクレオチドのそれぞれは、目的ゲノム領域に由来するヌクレオチド配列上の第1の制限酵素の消化部位に隣接する配列にハイブリダイズする、請求項1〜18のいずれか一項に記載の方法。
  20. オリゴヌクレオチドプローブのセットが、第1の制限酵素を用いて目的ゲノム領域を処理することによって得ることができる実質的に全ての制限断片に特異的なプローブを含む、請求項19に記載の方法。
  21. ステップ(g)が、富化されたヌクレオチド配列断片のハイスループット配列決定を含む、請求項1〜20のいずれか一項に記載の方法。
  22. ステップ(g)の後に、バイオインフォマティクス分析、及び相互作用の可視化が続く、請求項1〜21のいずれか一項に記載の方法。
  23. 目的ゲノム領域が、目的の遺伝子座を含む、請求項2に記載の方法。
  24. 目的領域が、1〜10MBである、請求項1〜23のいずれか一項に記載の方法。
  25. 三次元構造における特定の遺伝的要素の、他のヌクレオチド配列との相互作用を分析する方法であって、請求項1〜24のいずれか一項に記載のステップ(a)〜(g)を実施するステップを含み、遺伝的要素との相互作用に関与するヌクレオチド配列を同定するために、ステップ(g)において、特定の遺伝的要素を含む富化されたヌクレオチド配列断片の配列のみが分析される、方法。
  26. 遺伝的要素が、転写因子の結合部位又はインシュレーター(insulator)若しくはバリヤー(barrier)要素を含む、請求項25に記載の方法。
  27. 遺伝的要素が、目的領域中にある、請求項25又は26に記載の方法。
  28. 遺伝子の発現状態を決定する方法であって、請求項1〜24のいずれか一項に記載のステップ(a)〜(g)を実施するステップ、及び遺伝子を含む目的領域における相互作用の数、種類又は密度を分析するステップを含む、方法。
  29. 2つのサンプル間の遺伝子の活性を比較する方法であって、両サンプルについて請求項1〜24のいずれか一項に記載のステップ(a)〜(g)を実施するステップ、及び目的領域における相互作用の数、種類又は密度を比較するステップを含む、方法。
  30. サンプルが、同じ被験体からの異なる組織に由来する; 異なる時点にわたる単一の被験体に由来する; 異なる被験体からの同等の組織に由来する、請求項29に記載の方法。
  31. 特定の疾患状態を示す1つ以上のDNA-DNA相互作用を同定する方法であって、請求項1〜24のいずれか一項に記載のステップ(a)〜(g)を実施するステップを含み、ステップ(a)において、架橋されたDNAのサンプルが罹患細胞及び非罹患細胞から提供され、罹患細胞及び非罹患細胞に由来するDNA配列間の三次元クロマチン構造におけるヌクレオチド配列の相互作用間の差異は、DNA-DNA相互作用又はDNA-DNA相互作用のパターンが特定の疾患状態を示すものであることを示す、方法。
  32. DNA-DNA相互作用の変化によって引き起こされるか又はそれに関連する、疾患又は症候群の診断又は予後診断の方法であって、請求項1〜24のいずれか一項に記載のステップ(a)〜(g)を実施するステップを含み、ステップ(a)は、被験体に由来する架橋されたDNAのサンプルを提供するステップを含み、ステップ(f)は、DNA配列間の相互作用を、影響を受けていない対照のものと比較するステップを含み、対照と被験体の間の差異が、被験体が疾患若しくは症候群に罹患していることを示すか、又は被験体が疾患若しくは症候群に罹患するであろうことを示す、方法。
  33. 疾患が、遺伝子疾患である、請求項32に記載の方法。
  34. 疾患が、ガンである、請求項32又は33に記載の方法。
  35. DNAの三次元構造をモジュレートする1つ以上の薬剤を同定するためのアッセイ方法であって、
    (a)サンプルを1つ以上の薬剤と接触させるステップ、及び
    (b)請求項1〜24のいずれか一項に記載のステップ(a)〜(g)を実施するステップであって、ステップ(a)が、サンプルに由来する架橋されたDNAを提供することを含む、ステップ、
    を含み、(i)薬剤の存在下でのDNA相互作用と(ii)薬剤の非存在下でのDNA相互作用の間の差異が、DNAの三次元構造をモジュレートする薬剤を示す、方法。
  36. 本明細書に実質的に記載され、実施例又は図面のいずれかに関連する、方法又はアッセイ。
  37. 目視検査により10kbpより小さい分解能でゲノムの3D構造を同定するための、請求項1〜24のいずれか一項に記載の方法。
  38. 目視検査により10kbpより小さい分解能でクロマチン繊維コンホメーションを同定及び決定するための、請求項1〜24のいずれか一項に記載の方法。
  39. 目視検査により10kbpより小さい分解能で染色体のサブ染色体ドメイン構造を同定するための、請求項1〜24のいずれか一項に記載の方法。
  40. 目視検査により10kbpより小さい分解能で染色体のサブ染色体ドメイン構造を同定するための、請求項1〜24のいずれか一項に記載の方法。
  41. 目視検査により10kbpより小さい分解能で染色体のループ凝集体/ロゼット構造を同定するための、請求項1〜24のいずれか一項に記載の方法。
  42. モンテ-カルロ(Monte-Carlo)及びブラウン動力学(Brownian-Dynamics)シミュレーションと比較した場合、10kbpより小さい分解能で染色体のループ凝集体/ロゼット構造を同定するための、請求項1〜24のいずれか一項に記載の方法。
  43. 相互作用間の遺伝的距離に応じて、及びモンテ-カルロ及びブラウン動力学シミュレーションからのスケーリング挙動、及びDNA自体における長距離相関のスケーリングと比較して、相互作用の頻度のスケーリング挙動から、10kbpより小さい分解能で染色体のループ凝集体/ロゼット構造を同定するための、請求項1〜24のいずれか一項に記載の方法。
JP2016553748A 2013-11-18 2014-11-18 三次元dna構造におけるヌクレオチド配列の相互作用を分析する方法 Pending JP2016537029A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1320351.8 2013-11-18
GBGB1320351.8A GB201320351D0 (en) 2013-11-18 2013-11-18 Method
PCT/IB2014/002485 WO2015071748A1 (en) 2013-11-18 2014-11-18 Method for analysing the interaction of nucleotide sequences in a three-dimensional dna structure

Publications (2)

Publication Number Publication Date
JP2016537029A true JP2016537029A (ja) 2016-12-01
JP2016537029A5 JP2016537029A5 (ja) 2017-10-19

Family

ID=49883800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016553748A Pending JP2016537029A (ja) 2013-11-18 2014-11-18 三次元dna構造におけるヌクレオチド配列の相互作用を分析する方法

Country Status (9)

Country Link
US (1) US10934575B2 (ja)
EP (1) EP3071710B1 (ja)
JP (1) JP2016537029A (ja)
KR (1) KR102332522B1 (ja)
CN (1) CN105992825A (ja)
AU (1) AU2014349817B2 (ja)
CA (1) CA2928012C (ja)
GB (1) GB201320351D0 (ja)
WO (1) WO2015071748A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020525046A (ja) * 2017-06-26 2020-08-27 フェーズ ジェノミクス インコーポレイテッド Dna配列のクラスター化のための方法

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016154540A1 (en) * 2015-03-26 2016-09-29 Dovetail Genomics Llc Physical linkage preservation in dna storage
US11795496B2 (en) * 2015-06-24 2023-10-24 Oxford BioDynamics PLC Epigenetic chromosome interactions
EP3366818B1 (en) * 2015-10-19 2021-04-14 Zhejiang Annoroad Bio-Technology Co., Ltd. Method for constructing high-resolution single cell hi-c library with a lot of information
SG11201804086VA (en) * 2015-12-04 2018-06-28 10X Genomics Inc Methods and compositions for nucleic acid analysis
GB201608000D0 (en) * 2016-05-06 2016-06-22 Oxford Biodynamics Ltd Chromosome detection
CN108300767B (zh) * 2017-10-27 2021-08-20 清华大学 一种核酸复合体中核酸区段相互作用的分析方法
CN108197431B (zh) * 2018-01-24 2022-04-05 清华大学 染色质相互作用差异的分析方法和系统
AU2019214956A1 (en) * 2018-01-31 2020-08-27 Dovetail Genomics, Llc Sample prep for DNA linkage recovery
WO2020234608A1 (en) * 2019-05-22 2020-11-26 Oxford Nanopore Technologies Limited Protocol for detecting interactions within one or more dna molecules within a cell
US20220033383A1 (en) 2020-07-20 2022-02-03 Enanta Pharmaceuticals, Inc. Functionalized peptides as antiviral agents
US11352363B1 (en) 2020-11-23 2022-06-07 Enanta Pharmaceuticals, Inc. Spiropyrrolidine derived antiviral agents
US11384090B2 (en) 2020-11-23 2022-07-12 Enanta Pharmaceuticals, Inc. Spiropyrrolidine derived antiviral agents
MX2023005983A (es) 2020-11-23 2023-08-15 Enanta Pharm Inc Nuevos agentes antivirales derivados de la espiropirrolidina.
CN113215141A (zh) * 2021-02-23 2021-08-06 华南农业大学 细菌hi-c基因组及质粒构象捕获方法
US11319325B1 (en) 2021-05-11 2022-05-03 Enanta Pharmaceuticals, Inc. Macrocyclic spiropyrrolidine derived antiviral agents
US11339170B1 (en) 2021-07-23 2022-05-24 Enanta Pharmaceuticals, Inc. Spiropyrrolidine derived antiviral agents
US11325916B1 (en) 2021-07-29 2022-05-10 Enanta Pharmaceuticals, Inc. Spiropyrrolidine derived antiviral agents
GB202111195D0 (en) * 2021-08-03 2021-09-15 Cergentis B V Method for targeted sequencing
CN113946730B (zh) * 2021-10-19 2023-03-17 四川大学 一种基于基因数据的染色质层次结构分析的可视化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500031A (ja) * 2005-07-04 2009-01-08 エラスムス ユニバーシティ メディカル センター 染色体コンフォメーションキャプチャ−オン−チップ(4c)アッセイ
JP2010515449A (ja) * 2007-01-11 2010-05-13 エラスムス ユニバーシティ メディカル センター 環状染色体コンホメーション捕捉(4c)
JP2013530709A (ja) * 2010-07-09 2013-08-01 セルゲンティス ビー.ブイ. 対象の3−dゲノム領域配列決定戦略
WO2014168575A1 (en) * 2013-04-11 2014-10-16 Sahlén Pelin Targeted chromosome conformation capture

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7348178B1 (en) * 1994-03-14 2008-03-25 New York University Medical Center Recombinant adenoviral vector system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009500031A (ja) * 2005-07-04 2009-01-08 エラスムス ユニバーシティ メディカル センター 染色体コンフォメーションキャプチャ−オン−チップ(4c)アッセイ
JP2010515449A (ja) * 2007-01-11 2010-05-13 エラスムス ユニバーシティ メディカル センター 環状染色体コンホメーション捕捉(4c)
JP2013530709A (ja) * 2010-07-09 2013-08-01 セルゲンティス ビー.ブイ. 対象の3−dゲノム領域配列決定戦略
WO2014168575A1 (en) * 2013-04-11 2014-10-16 Sahlén Pelin Targeted chromosome conformation capture

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NAT PROTOC, vol. 8, no. 3, JPN6018031485, February 2013 (2013-02-01), pages 509 - 524, ISSN: 0003857322 *
NATURE GENETICS, vol. 38, no. 11, JPN6018031484, 2006, pages 1348 - 1354, ISSN: 0004020272 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020525046A (ja) * 2017-06-26 2020-08-27 フェーズ ジェノミクス インコーポレイテッド Dna配列のクラスター化のための方法
JP7277058B2 (ja) 2017-06-26 2023-05-18 フェーズ ジェノミクス インコーポレイテッド Dna配列のクラスター化のための方法
US11753637B2 (en) 2017-06-26 2023-09-12 Phase Genomics Inc. Method for the clustering of DNA sequences

Also Published As

Publication number Publication date
US20160289738A1 (en) 2016-10-06
EP3071710A1 (en) 2016-09-28
AU2014349817A1 (en) 2016-05-19
CA2928012C (en) 2023-05-16
KR20160079120A (ko) 2016-07-05
EP3071710B1 (en) 2019-05-15
GB201320351D0 (en) 2014-01-01
CA2928012A1 (en) 2015-05-21
AU2014349817B2 (en) 2020-11-12
CN105992825A (zh) 2016-10-05
WO2015071748A1 (en) 2015-05-21
KR102332522B1 (ko) 2021-11-29
US10934575B2 (en) 2021-03-02

Similar Documents

Publication Publication Date Title
JP2016537029A (ja) 三次元dna構造におけるヌクレオチド配列の相互作用を分析する方法
JP5690068B2 (ja) 環状染色体コンホメーション捕捉(4c)
Szalaj et al. Three-dimensional organization and dynamics of the genome
Goel et al. The macro and micro of chromosome conformation capture
US10900974B2 (en) Methods for identifying macromolecule interactions
US11370810B2 (en) Methods and compositions for preparing nucleic acids that preserve spatial-proximal contiguity information
WO2016154540A1 (en) Physical linkage preservation in dna storage
CN109641933A (zh) 染色质相互作用的全基因组鉴定
US20230032136A1 (en) Method for determination of 3d genome architecture with base pair resolution and further uses thereof
US20220033807A1 (en) Method for capturing rna in situ higher-order structures and interactions
US20110269647A1 (en) Method
Knoch A Guided Protocol for Array Based T2C: A High‐Quality Selective High‐Resolution High‐Throughput Chromosome Interaction Capture
Key Molecular genetics, recombinant DNA, & genomic technology
US20240150830A1 (en) Phased genome scale epigenetic maps and methods for generating maps
Smith Genetic and Epigenetic Identity of Centromeres
Franke The role of higher-order chromatin organization at the SOX9 locus in gene regulation and disease
Belaghzal et al. HI-C 2.0: An Optimized Hi-C Procedure for High-Resolution Genome-Wide Mapping of Chromosome Conformation [preprint]
US20240067959A1 (en) Library preparation from fixed samples
Class et al. Patent application title: CIRCULAR CHROMOSOME CONFORMATION CAPTURE (4C) Inventors: Wouter De Laat (Rotterdam, NL) Frank Grosveld (Rotterdam, NL) Assignees: Erasmus University Medical Center
Belaghzal Let us know how access to this document benefits you.
Granner et al. Molecular Genetics, Recombinant DNA, & Genomic Technology

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20170208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170908

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170908

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180814

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181107

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190108

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190508