JP7189020B2

JP7189020B2 - 癌のエピジェネティックプロファイリング

Info

Publication number: JP7189020B2
Application number: JP2018543192A
Authority: JP
Inventors: パトリックタン; ウェンフォンオオイ
Original assignee: エイジェンシー・フォー・サイエンス，テクノロジー・アンド・リサーチ
Priority date: 2016-02-16
Filing date: 2017-02-16
Publication date: 2022-12-13
Anticipated expiration: 2037-02-16
Also published as: JP2019514344A; CN109072312A; EP3417076B1; EP3417076A1; SG10202007867PA; SG11201806945SA; US20210223249A1; EP3417076A4; KR20180108820A; WO2017142485A1; JP2023029945A

Description

関連出願の相互参照
この出願は、シンガポール出願第１０２０１６０１１４１Ｘ号、２０１６年２月１６日出願およびシンガポール出願第１０２０１６０６８２８Ｐ号、２０１６年８月１６日出願の優先権の利益を主張し、これらの内容は、すべての目的で参照によりその全体が本明細書に組み込まれる。

技術分野
本発明は、癌、特に、癌における調節エレメントに関する。

異常な遺伝子発現パターンは、増殖、浸潤および転移のような臨床的に重要な形質を生じさせるヒト悪性腫瘍の普遍的なホールマークである。体細胞変異、コピー数変化、および構造多型を含むＤＮＡ配列ベースの変化は、シグナリング分子および転写因子（ＴＦ：ｔｒａｎｓｃｒｉｐｔｉｏｎｆａｃｔｏｒ）の活性および発現を変化させることによって癌トランスクリプトームを再プログラムする能力を有する。タンパク質コード遺伝子に加えて、非コード・ゲノム領域におけるシス調節エレメント、例えば、エンハンサーもＴＦアクセシビリティを促進または制限することによって転写プログラムに影響を及ぼすことができる。

エンハンサーは、プロモーターおよび転写開始点（ＴＳＳ：ｔｒａｎｓｃｒｉｐｔｉｏｎｓｔａｒｔｓｉｔｅ）より遠位に局在化された調節エレメントである。エンハンサーは、ヒトゲノムのうちの１０～１５％を占め、遠い距離（＞１Ｍｂ）にある１つ以上の遺伝子を調節することによって細胞アイデンティティーおよび組織特異的な発現に重要な役割を果たすことが示された。エンハンサーは、ヒト疾患において重要な役割を果たし、それらの重要性は、異なる細胞タイプおよび病状におけるエンハンサーのカタログに対するニーズを高める。癌における調節エレメントをプロファイリングするための研究が存在したが、現在までのこれらの研究の大部分は、インビトロで培養された癌細胞株に依存し、２つの限界を有する。第１に、インビトロの細胞株は、継代の繰り返し後に実質的なエピゲノム変化を経験することが知られている。第２に、多くの癌細胞株では、対応する（ｍａｔｃｈｅｄ）正常カウンターパートがしばしば入手できず、真の体細胞変化を同定する能力を複雑化させる。従って、上記の不利点の１つ以上を克服または少なくとも寛解する癌における調節エレメントをプロファイリングする方法が必要である。

一態様において、非癌生体試料と比較して、癌生体試料における少なくとも１つのスーパーエンハンサーの存在または非存在を判定するための方法であって、
ａ）被験者から得られた癌生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体と接触させるステップと、
ｂ）癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域を備える、単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーをヒストン修飾Ｈ３Ｋ２７ａｃのシグナル強度に基づいてマッピングするステップであって、少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、マッピングするステップと、
ｄ）癌生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップと、
ｅ）癌生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも１つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
ｆ）癌生体試料における少なくとも１つのスーパーエンハンサーの存在または非存在を少なくとも１つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える、方法が提供される。

一態様において、被験者における少なくとも１つの癌関連スーパーエンハンサーの存在を判定するための方法であって、
ａ）被験者から得られた癌生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体と接触させるステップと、
ｂ）癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域を備える、単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーをヒストン修飾Ｈ３Ｋ２７ａｃのシグナル強度に基づいてマッピングするステップであって、少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、マッピングするステップと、
ｄ）癌生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップと、
ｅ）癌生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも１つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
ｆ）被験者における少なくとも１つの癌関連スーパーエンハンサーの存在を少なくとも１つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも１つのスーパーエンハンサーの増加したシグナル強度は、少なくとも１つの癌関連スーパーエンハンサーの存在を示す、方法が提供される。

一態様において、被験者における癌を検出するためのバイオマーカーであって、バイオマーカーは、正常非癌生体試料と比較して癌生体試料におけるＨ３Ｋ２７ａｃの増加したシグナル強度を有する少なくとも１つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも１つのスーパーエンハンサー、または両方を備える、バイオマーカーが提供される。

一態様において、被験者における癌の予後を判定するための方法であって、
ａ）被験者から得られた癌生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体と接触させるステップと、
ｂ）癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域を備える、単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーをヒストン修飾Ｈ３Ｋ２７ａｃのシグナルに基づいてマッピングするステップであって、少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、マッピングするステップと、
ｄ）癌生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップと、
ｅ）癌生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも１つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
ｆ）被験者における少なくとも１つの癌関連スーパーエンハンサーの存在または非存在を、非癌生体試料と比較して、癌生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも１つの癌関連スーパーエンハンサーの存在または非存在は、被験者における癌の予後を示す、方法が提供される。

一態様において、癌または胃腸疾患に対する被験者の感受性を判定する方法であって、
ａ）被験者から得られた生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体と接触させるステップと、
ｂ）生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域を備える、単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーをヒストン修飾Ｈ３Ｋ２７ａｃのシグナル強度に基づいてマッピングするステップであって、少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、マッピングするステップと、
ｄ）生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップと、
ｅ）生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度を対照生体試料から得られた少なくとも１つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
ｆ）少なくとも１つのスーパーエンハンサーの存在または非存在を少なくとも１つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
ｇ）少なくとも１つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連ＳＮＰを備える参照ゲノム配列に対してマッピングするステップと
を備え、１つ以上の癌または胃腸疾患関連ＳＮＰと関連付けられた少なくとも１つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法が提供される。

一態様において、細胞における少なくとも１つの癌関連スーパーエンハンサーの活性を調節するための方法であって、ＣＤＸ２および／またはＨＮＦ４αの阻害薬を細胞へ投与するステップを備える、方法が提供される。

一態様において、正常非癌生体試料と比較して、癌生体試料におけるＨ３Ｋ２７ａｃの増加したシグナル強度を有する少なくとも１つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも１つのスーパーエンハンサー、または両方を備える、被験者における癌の検出に用いるためのバイオマーカーが提供される。

一態様において、正常非癌生体試料と比較して癌生体試料におけるＨ３Ｋ２７ａｃの増加したシグナル強度を有する少なくとも１つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも１つのスーパーエンハンサー、または両方を備えるバイオマーカーの被験者における癌を検出するための薬物の製造における使用が提供される。

一態様において、細胞における少なくとも１つの癌関連スーパーエンハンサーの活性を調節するのに用いるためのＣＤＸ２および／またはＨＮＦ４αの阻害薬が提供される。

一態様において、細胞における少なくとも１つの癌関連スーパーエンハンサーの活性を調節するための薬物の製造におけるＣＤＸ２および／またはＨＮＦ４αの阻害薬の使用が提供される。

一態様において、被験者から得られた癌生体試料における癌細胞生存期間または癌細胞生存率を予測する方法であって、
ａ）癌生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体と接触させるステップと、
ｂ）癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域を備える、単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーをヒストン修飾Ｈ３Ｋ２７ａｃのシグナル強度に基づいてマッピングするステップであって、少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、マッピングするステップと、
ｄ）癌生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップと、
ｅ）癌生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも１つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
ｆ）被験者における少なくとも１つの癌関連スーパーエンハンサーの存在を少なくとも１つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも１つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、方法が提供される。

定義
本明細書に用いられる以下の単語および用語は、示された意味を有するものとする。

用語「スーパーエンハンサー」は、互いに近接して発生するＤＮＡエンハンサーエレメントのクラスターを指す。ＤＮＡエンハンサーエレメントは、エフェクター遺伝子発現プログラムを調節するために多様な細胞およびシグナル伝達入力を統合することが可能なＤＮＡの領域である。典型的なエンハンサーと比較して、スーパーエンハンサーは、サイズが大きくてよく、高い転写因子結合密度を示してよく、遺伝子座調節領域（ＬＣＲ：ｌｏｃｕｓｃｏｎｔｒｏｌｒｅｇｉｏｎ）、ＤＮＡメチル化バレー（ｍｅｔｈｙｌａｔｉｏｎｖａｌｌｅｙ）、転写開始プラットフォームおよび伸長エンハンサー（ｓｔｒｅｔｃｈｅｎｈａｎｃｅｒ）と同様に、主要な細胞アイデンティティー・レギュレーターとさらに強く関連付けられうる。スーパーエンハンサーは、疾患関連遺伝子変異体に濃縮されてもよく、癌細胞によって主要な癌遺伝子中に獲得されてよく、治療上の擾乱に対してさらに感受性がありうる。

用語「ヒストン修飾」は、ヒストンタンパク質の共有結合修飾を指す。ヒストン修飾は、メチル化、リン酸化、アセチル化、ユビキチン化およびＳＵＭＯ化を含むが、それらには限定されない。ヒストンの修飾は、クロマチン構造を変化させて、遺伝子発現に影響を及ぼしうる。ヒストンの修飾は、１つ以上のヒストン中の１つ以上のアミノ酸において発生しうると一般に理解されている。

用語「アノテートされたゲノム配列」は、コードおよび非コード領域、調節領域またはモチーフ、転写開始点および遺伝子を含むがそれらには限定されない情報が同定されたゲノム配列を指す。用語「アノテートされた転写開始点」は、同定された転写開始点を指す。

用語「参照」、「対照」または「標準」は、本明細書では比較が行われうる試料または被験者を指す。「参照」、「対照」または「標準」の例は、同じ被験者から得られた非癌試料、非転移腫瘍から得られた試料、癌を有さない被験者から得られた試料、または異なる癌サブタイプを有する被験者から得られた試料を含む。用語「参照」、「対照」または「標準」は、本明細書ではクロマチン修飾の平均シグナル強度も指してよい。用語「参照」、「対照」または「標準」は、本明細書では癌を患っていない被験者、または異なるタイプの癌を患う被験者も指してよい。用語「参照」、「対照」または「標準」は、本明細書では比較が行われうる核酸配列も指してよい。例えば、参照もしくは対照または標準は、トランスフェクトされない細胞であってもよい。

用語「癌の（ｃａｎｃｅｒｏｕｓ）」は、本明細書では癌特有の異常によって影響されるかまたはそれらの異常を示すことに関する。

用語「抗体」または「複数の抗体」は、本明細書では免疫グロブリンのようなドメインをもつ分子を指し、抗原結合フラグメント、モノクロナール、リコンビナント、ポリクローナル、キメラ、完全ヒト、ヒト化、二重特異性、およびヘテロ共役抗体；単一可変ドメイン、単一鎖Ｆｖ、ドメイン抗体、免疫学的に効果的なフラグメントおよび二重特異性抗体を含む。

用語「単離された（ｉｓｏｌａｔｅｄ）」または「単離する（ｉｓｏｌａｔｉｎｇ）」は、本明細書では、構成要素がその中で天然に発生する生物の細胞における他の生体構成要素、すなわち、他の染色体および染色体外ＤＮＡおよびＲＮＡ、タンパク質ならびに細胞小器官から実質的に分離または精製された生体構成要素（例えば、核酸分子、タンパク質または細胞小器官）に関する。「単離された」核酸およびタンパク質は、標準的な精製方法によって精製された核酸およびタンパク質を含む。この用語は、宿主細胞における組み換え発現によって調製された核酸およびタンパク質ならびに化学的に合成された核酸も包含する。

用語「核酸」は、本明細書では、一本鎖または二重鎖のいずれかの形態におけるデオキシリボヌクレオチドまたはリボヌクレオチドポリマーを指し、別に限定されない限り、天然に発生するヌクレオチドと同様の仕方で核酸へハイブリダイズする、天然ヌクレオチドの既知の類似体を包含する。「ヌクレオチド」は、以下には限定されないが、ピリミジン、プリンもしくはそれらの合成類似体のような、糖に連結された塩基、またはペプチド核酸（ＰＮＡ：ｐｅｐｔｉｄｅｎｕｃｌｅｉｃａｃｉｄ）におけるように、アミノ酸に連結された塩基を含むモノマーを含む。ヌクレオチドは、ポリヌクレオチドにおける１つのモノマーである。ヌクレオチド配列は、ポリヌクレオチドにおける塩基の配列を指す。

用語「バイオマーカー」は、本明細書では、生物学的状態または状況の指標を指す。

用語「試料」または「生体試料」は、本明細書では、被験者から得られた、被験者から除去もしくは単離された１つ以上の細胞、細胞のフラグメント、組織または流体を指す。用語「から得られるまたは由来する（ｏｂｔａｉｎｅｄｏｒｄｅｐｒｉｖｅｄｆｒｏｍ）」は、本明細書では、包含的に用いられることを意味する。すなわち、生体試料から直接に単離されたいずれかのヌクレオチド配列または試料に由来するいずれかのヌクレオチド配列を包含することが意図される。試料の例は、腫瘍組織バイオプシーである。試料は、凍結新鮮組織、パラフィン包埋組織、またはホルマリン固定パラフィン包埋組織（ＦＦＰＥ：ｆｏｒｍａｌｉｎｆｉｘｅｄｐａｒａｆｆｉｎｅｍｂｅｄｄｅｄｔｉｓｓｕｅ）であってもよい。生体試料または流体試料の例は、以下には限定されないが、血液、糞便、血清、唾液、尿、脳脊髄液および骨髄液を含む。

用語「予後」、またはその文法的変異形は、本明細書では、臨床状態または疾患の確からしい経過およびアウトカムの予測を指す。患者の予後は、通常、疾患の好ましい、もしくは好ましくない経過またはアウトカムを示す疾患の要因または症状を評価することによって行われる。用語「予後」は、状態の経過またはアウトカムを１００％の精度で予測する能力を指すものではない。その代わりに、用語「予後」は、ある特定の経過またはアウトカムが発生するであろう確率、すなわち、所与の状態を示す患者にある経過またはアウトカムが生じることが、その状態を示していない患者と比較したときに、より確からしい確率の増加を指す。

用語「癌への感受性」は、本明細書では、被験者が癌を発生させるであろう尤度または確率を指す。癌に感受性が高い被験者は、癌をすでに患っていてもいなくてもよく、異なるタイプの癌を患っていてもよい。

用語「阻害薬」は、本明細書では生物活性を減少させるかまたは抑制する薬剤を指す。例えば、阻害薬は、遺伝子の発現を減少またはサイレンスさせうる。阻害薬は、タンパク質、酵素または転写因子の活性も減少させうる。阻害薬の例は、以下には限定されないが、オリゴヌクレオチド、小分子または化合物を含む。オリゴヌクレオチドは、以下には限定されないが、低分子干渉ＲＮＡ（ｓｉＲＮＡ：ｓｍａｌｌｉｎｔｅｒｆｅｒｉｎｇＲＮＡ）または低分子ヘアピン型ＲＮＡ（ｓｈＲＮＡ：ｓｈｏｒｔｈａｉｒｐｉｎＲＮＡ）を含めて、干渉ＲＮＡ（ｉＲＮＡ：ｉｎｔｅｒｆｅｒｉｎｇＲＮＡ）であってよい。小分子は、当技術分野では低分子量を有する化合物として一般に理解されるであろう。阻害薬の別の例は、クラスター化され、規則的に間隔が置かれた短いパリンドローム・リピート（ＣＲＩＳＰＲ：ｃｌｕｓｔｅｒｅｄｒｅｇｕｌａｒｌｙｉｎｔｅｒｓｐａｃｅｄｓｈｏｒｔｐａｌｉｎｄｒｏｍｉｃｒｅｐｅａｔ）ゲノム編集システムであってもよい。ＣＲＩＳＰＲゲノム編集システムは、ＣＲＩＳＰＲ／Ｃａｓシステムであってよい。ＣＲＩＳＰＲ／Ｃａｓシステムは、ゲノムを修飾することによって遺伝子発現を阻害しうる。ゲノムの修飾は、以下には限定されないが、ヌクレオチドの欠失、挿入または置換を含む。ＣＲＩＳＰＲ／Ｃａｓシステムは、さらに、１つ以上のヒストンの翻訳後修飾によって遺伝子発現を阻害しうる。いくつかの実施形態において、ＣＲＩＳＰＲ／Ｃａｓシステムは、ＣＲＩＳＰＲ／Ｃａｓ９であってよい。

この開示を通じて、ある実施形態は、範囲形式で開示されてよい。範囲形式における開示は、専ら便利さおよび簡潔さのためであり、開示される範囲の視野に対する融通性のない限定として解釈されるべきではないことを理解されたい。従って、範囲の記述は、具体的に開示されるすべての可能な部分的範囲ならびにその範囲内の個々の数値を有すると見做されるべきである。例えば、１～６のような範囲の記述は、１～３、１～４、１～５、２～４、２～６、３～６などのような具体的に開示された部分的範囲、ならびにその範囲内の個々の数、例えば、１、２、３、４、５、および６を有すると見做されるべきである。このことが範囲の幅に係わらず適用される。

本明細書ではいくつかの実施形態が概括的かつ一般的に記載されてもよい。属の開示の範囲内にあるより狭い種および亜属集団の各々も本開示の一部を形成する。これは、削除される材料が本明細書に具体的に列挙されるか否かに係わらず、属からいずれかの対象を除く但し書きまたは否定的限定を伴う実施形態の属の記載を含む。

文脈が別の解釈を必要とするか、または具体的に逆に明記されない限り、本明細書に単数の整数、ステップまたは要素として列挙される本発明の整数、ステップ、または要素は、列挙される整数、ステップまたは要素の単数および複数の両方の形態を明確に包含する。

単語「実質的に」は、「完全に」を除外せず、例えば、Ｙが「実質的に」ない組成物は、Ｙが完全になくてもよい。必要なところでは、単語「実質的に」が本発明の定義から省略されてよい。

本明細書に例示的に記載される本発明は、本明細書に具体的には開示されないいずれかの１つまたは複数の要素、１つまたは複数の限定の存在なしに適切に実行されてもよい。従って、例えば、用語「備える（ｃｏｍｐｒｉｓｉｎｇ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」、「含む（ｃｏｎｔａｉｎｉｎｇ）などは、拡張的に限定なしに読まれるものとする。加えて、本明細書に採用された用語および表現は、限定ではなく説明の用語として用いられ、かかる用語および表現の使用には、図示され、記載された特徴またはそれらの部分のいずれかの均等物を排除する意図はないが、請求される本発明の範囲内で様々な変更が可能であることが認識される。従って、本発明は、好ましい実施形態および随意的な特徴によって具体的に開示されたが、本明細書に開示され、そこに具現された本発明の変更形態および変形形態が当業者によって用いられてもよく、かかる変更形態および変形形態がこの発明の範囲内にあると見做されることを理解されたい。

本発明は、本明細書に広く一般的に記載された。属の開示の範囲内にあるより狭い種および亜族集団の各々も本発明の一部を形成する。これは、削除される材料が本明細書に具体的に列挙されるか否かに係わらず、属からいずれかの対象を除く但し書きまたは否定的限定を伴う本発明の属の記載を含む。

他の実施形態は、添付される特許請求の範囲および非限定例の範囲内にある。加えて、本発明の特徴または態様がマーカッシュ群の観点から記載されるところでは、本発明がそれによってマーカッシュ群のいずれかの個々のメンバーまたはメンバーのサブグループの観点からも記載されることを当業者は認識するであろう。

本発明は、詳細な記載を参照し、非限定例および添付図面と併せて考察したときにさらによく理解されるであろう。

図１は、ＧＣ細胞株の遠位予測エンハンサー（ＤｉｓｔａｌＰｒｅｄｉｃｔｅｄＥｎｈａｎｃｅｒ）の景観を示す。図１ａでは、ＯＣＵＭ－１およびＮＣＣ５９ＧＣ細胞のヒストンプロファイルがＤＤＸ４７転写開始点（ＴＳＳ）の周りのＨ３Ｋ２７ａｃおよびＨ３Ｋ４ｍｅ３の濃縮を示す。Ｈ３Ｋ２７ａｃ濃縮を示し、かつＤＤＸ４７ＴＳＳから２．５Ｋｂ超離れた予測エンハンサーエレメントを同定した。上位２０００個の予測エンハンサーの活性を視覚化した、１１個のＧＣ細胞株のうちの４個における遠位Ｈ３Ｋ２７ａｃプロファイルのスナップショット、および予測エンハンサーの周りのゲノムワイド平均Ｈ３Ｋ２７ａｃシグナル。予測エンハンサーの周りのゲノムワイド平均Ｈ３Ｋ４ｍｅ３シグナルおよびＧＣ細胞株における活性ＴＳＳ。２個以上の胃癌細胞株において見出した共通調節エレメントの、細胞株の数の関数としてのパーセンテージ（エンハンサー－濃灰色、プロモーター－薄灰色）。予測エンハンサー対ランダム選択領域のクロマチンアクセシビリティ。正常胃組織^４２からのＤＮａｓｅＩ高感受性（ＤＨＳ：ＤＮａｓｅＩｈｙｐｅｒｓｅｎｓｉｔｉｖｉｔｙ）データをサロゲートとして用いた。ＤＨＳシグナルの分布をウェルチの片側ｔ検定を用いて統計的有意性について試験した。９個の異なる組織／細胞カテゴリー起源の５０個のエピゲノムプロファイルからの、予測エンハンサーと、クロマチンアクセス可能領域（ＤＨＳ＋、ｘ軸として示す）および活性な調節エレメント（Ｈ３Ｋ２７ａｃ＋，ｙ軸として示す）との間の重複のパーセンテージ。ＥＰ３００および転写因子結合部位と重複した予測エンハンサーのパーセンテージ。予測エンハンサーおよびランダム選択領域における最高Ｐｈａｓｔスコアの分布（ＤＮＡ配列保存の尺度）。図２は、ＧＣ細胞株由来の予測スーパーエンハンサーを示す。図２ａでは、Ｈ３Ｋ２７ａｃＣｈＩＰ－ｓｅｑシグナルの分布が不均一に高いＨ３Ｋ２７ａｃシグナルを示す予測スーパーエンハンサーの位置を明らかにする。予測スーパーエンハンサーに近位の既知の癌関連遺伝子を示す。２つの細胞株を示す。ＧＣ細胞株の増加する数にわたってランダム選択領域を上回る（＞９９％）Ｈ３Ｋ２７ａｃ濃縮を示す、遠位調節エレメントのパーセンテージ（予測典型エンハンサー－薄灰色、予測スーパーエンハンサー－濃灰色）。ＭＡＬＡＴ１遺伝子座におけるＨ３Ｋ２７ａｃＣｈＩＰ－ｓｅｑシグナルは、高いＨ３Ｋ２７ａｃシグナルをもつ予測スーパーエンハンサー（塗り潰し四角）に対応する、予測エンハンサーの区間を示す。反復性遠位調節エレメント（予測スーパーエンハンサーおよび上位の予測典型エンハンサー）と関連付けられた、上位の有意に関連付けられた生体プロセスの例。ＧＯｒｉｌｌａから負の対数変換を行った未加工のｐ値を用いた。図３は、１次ＧＣおよび対応する正常試料における体細胞予測スーパーエンハンサーを示す。図３ａは、１９個の１次腫瘍および対応する正常試料における細胞株由来の予測スーパーエンハンサーの活性を示す。Ｈ３Ｋ２７ａｃ予測スーパーエンハンサーシグナル（ｚスコア）を列変換したＲＰＫＭ値の単位で視覚化した。インビトロのＧＣ株における活性な予測スーパーエンハンサーの頻度が上部のヒストグラム（黒、ヒートマップより上）として提示される。予測スーパーエンハンサーは、体細胞増加、体細胞欠失、非変化および不活性にカテゴリー化した。各カテゴリーでは、予測スーパーエンハンサーを腫瘍と正常試料との間でそれらの減少する平均差によって（左から右へ）順序付けた。反復性体細胞増加予測スーパーエンハンサー・シグナルを用いた主成分分析は、腫瘍と正常試料との間の分離を確立する。５つの腫瘍および対応する正常試料からのＨ３Ｋ４ｍｅ１プロファイルを用いた、３つの予測スーパーエンハンサー・カテゴリー：体細胞増加、体細胞欠失および非変化におけるＨ３Ｋ４ｍｅ１（Ｔ－Ｎ）シグナル（ＲＰＫＭ）差。^＊Ｐ＜２．２×１０^－１６、ウェルチ片側ｔ検定（ｏｎｅ－ｓｉｄｅｄＷｅｌｃｈｔ－ｔｅｓｔ）。腫瘍と対応する正常試料との間の予測スーパーエンハンサーにおける差次的なβ値がメチル化の状態：高メチル化（＞０）または低メチル化（＜０）を示す。ＡＢＬＩＭ２遺伝子座の体細胞増加予測スーパーエンハンサーにおけるＤＮＡ低メチル化。ＳＬＣ１Ａ２遺伝子座の体細胞欠失予測スーパーエンハンサーにおけるＤＮＡ高メチル化。図４は、体細胞予測スーパーエンハンサーと遺伝子発現およびクロマチン相互作用との間の関連付けを示す。図４ａは、予測スーパーエンハンサーの異なるクラス（非変化、体細胞増加、体細胞欠失）間の遺伝子発現における対数変換した倍率変化と、予測標的遺伝子発現との間の相関を示す。１２個の体細胞増加予測スーパーエンハンサーをカバーする２０個のキャプチャポイントからの相互作用ヒートマップ。各リングは、黒矢印で示す単一のキャプチャポイントからのプロファイルを表す。予測スーパーエンハンサーの位置を各リング中の遺伝子座によって示す。１００ｋｂビン中のゲノムにわたってゲノムワイドな相互作用シグナルを計算した。キャプチャポイントに隣接する２００万塩基以内の領域におけるシグナルを視覚化した。ＣＬＤＮ４遺伝子座における体細胞増加予測スーパーエンハンサーおよび隣接遺伝子との相互作用の例。体細胞増加活性は、１次ＧＣにおけるＣＬＤＮ４ならびに隣接遺伝子（ＣＬＤＮ３およびＡＢＨＤ１１）の上方制御と関連付けられる。ＳＮＵ１６細胞では２つのキャプチャポイント、＃３３および＃３４を用いてＣａｐｔｕｒｅ－Ｃにより相互作用を検出した。集約した相互作用（Ｑ＜０.０５、ｒ３Ｃｓｅｑ）を最終トラックとして提示する。ＳＮＵ１６細胞では２つの構成要素である予測エンハンサーｅ１およびｅ２をＣＲＩＳＰＲ／Ｃａｓ９ゲノム編集を用いて独立に欠失させた。予測スーパーエンハンサー活性と長距離相互作用との間の相関。ＳＮＵ１６およびＯＣＵＭ－１細胞ではＳＬＣ３５Ｄ３プロモーターに対する長距離相互作用（薄灰色三角）を活性な予測スーパーエンハンサーを用いて検出した。予測スーパーエンハンサーを検出しなかったＫＡＴＯ－ＩＩＩ細胞ではかかる相互作用も観測されなかった。図５では体細胞予測スーパーエンハンサーが患者生存および疾患リスクを知らせる。図５ａは、反復性体細胞増加、反復性体細胞欠失および非変化Ｈ３Ｋ２７ａｃシグナルを示す予測スーパーエンハンサーを用いた癌ホールマーク解析を示す。フィシャーの片側正確検定から負の対数変換を行ったｐ値を用いた。患者群を、上位の反復性体細胞増加予測スーパーエンハンサーと関連付けられた遺伝子からの低（薄灰色）および高（濃灰色）発現を示す試料と比較した生存解析。８４８人のＧＣ患者の編集物において、シグネチャーは、予後であり（Ｐ＝１．８×１０^－２，ログランク検定）、腫瘍が高シグネチャー発現を有する患者についてより悪い予後を観測した（ハザード比，９５％信頼区間：１．３０（１．０５～１．６１）；段階、年齢、患者地域性およびローレンの組織学的サブタイプを補正した後のコックス回帰ｐ値＝４．４×１０^－２）。生存データを１０カ月ごとに示す。予測スーパーエンハンサーにおける疾患関連ＳＮＰの濃縮。予測スーパーエンハンサーの２つのクラス：反復性体細胞変化および非変化予測スーパーエンハンサーに対してカイ二乗検定を用いて濃縮を試験した。すべての予測スーパーエンハンサーで見出された少なくとも１０個のＳＮＰをもつ疾患／形質のみを解析した。結腸直腸癌関連ＳＮＰ有りまたは無しの予測スーパーエンハンサーにおける差次的なＨ３Ｋ２７ａｃシグナル。このＳＮＰ有りまたは無しの患者の総数を丸括弧内に示す。ウェルチ片側ｔ検定を用いて２つの群間の差を試験した。図６ではＧＣにおける体細胞増加予測スーパーエンハンサーがＣＤＸ２およびＨＮＦ４α占有と関連付けられる。図６ａは、ＲｅＭａｐデータベースを用いた、反復性体細胞増加予測スーパーエンハンサーおよび非変化予測スーパーエンハンサーにおける上位１０個の転写因子の結合濃縮を示す。非変化予測スーパーエンハンサーと比較した、反復性体細胞増加予測スーパーエンハンサーにおけるＲｅＭａｐ転写因子の濃縮または枯渇。ＣＤＸ２結合部位およびｄｅｎｏｖｏＨＯＭＥＲモチーフ同定を用いた候補ＣＤＸ２結合パートナーの検出。１９個の１次腫瘍および対応する正常試料からのＲＮＡ－ｓｅｑを用いた、ＣＤＸ２と上位２０個のＣＤＸ２候補結合パートナーとの対発現の相関。ＯＣＵＭ－１細胞における５００ｂｐのウィンドウ内でＨＮＦ４α結合部位と同時発生するＣＤＸ２結合部位のパーセンテージ。反復性体細胞増加予測スーパーエンハンサーと非変化予測スーパーエンハンサーとの間の差次的なＣＤＸ２（左）およびＨＮＦ４α（右）平均結合シグナル解析。予測スーパーエンハンサーは、ＯＣＵＭ－１でも活性であった。ＯＣＵＭ－１細胞における、シングルおよびダブルＴＦサイレンシングに対する、体細胞増加予測スーパーエンハンサーと予測典型エンハンサーとの間のＨ３Ｋ２７ａｃ枯渇の大きさの分布。ウィルコクソン片側順位和検定を用いて統計学的有意性を評価した。ＣＤＸ２、ＨＮＦ４αまたはＣＤＸ２／ＨＮＦ４α共結合（ｃｏ－ｂｉｎｄｉｎｇ）部位に対する、体細胞増加予測スーパーエンハンサーにおけるＨ３Ｋ２７ａｃサブ領域枯渇の間の関連付け。距離は、結合部位に対して３つのカテゴリー：近い、中間、遠位に均一に分布した。ウィルコクソン片側順位和検定を用いて統計学的有意性を評価した。図７は、異なるマッピング品質フィルター（ＭＡＰＱ≧１０およびＭＡＰＱ≧２０）間の比較を示す。図７ａは、ＭＡＰＱ≧１０を用いた全マッピングリードと比較した、ＭＡＰＱ≧２０を用いて検出したマッピングリードのパーセンテージを示す。ＭＡＰＱ≧１０を用いたＣｈＩＰ濃縮ピークの総数と比較した、ＭＡＰＱ≧２０を用いて発見されたＣｈＩＰ濃縮ピークのパーセンテージ。ＫＡＴＯ－ＩＩＩ細胞からの生物学的レプリケート（ｂｉｏｌｏｇｉｃａｌｒｅｐｌｉｃａｔｅ）におけるＨ３Ｋ２７ａｃ濃縮ピークの一致。レプリケート１および２は、Ｎａｎｏ－ＣｈＩＰｓｅｑを用いて生成し、一方でＢａｅｋｅｔａｌ．Ｏｎｃｏｔａｒｇｅｔ（２０１６）からのデータは、従来のＣｈＩＰｓｅｑ法を用いて作成した。レプリケート１および２からのマッピングリードの総数は、Ｂａｅｋらのデータより１０倍超多く、それゆえに、本発明者らのレプリケートではより多くのピークを検出した。レプリケートからのピークをＢＥＤＴｏｏｌｓを用いてマージした。このアプローチを用いて、３０，７３４個のユニークなピークを同定した。レプリケートで見出した重複ピークのパーセンテージをユニークなピークの総数（ｔｏｔａｌｎｕｍｂｅｒｕｎｉｑｕｅｐｅａｋｓ）と比較して計算した。胃癌細胞株における遠位予測エンハンサーおよび活性ＴＳＳに隣接するゲノムワイドＨ３Ｋ４ｍｅ１シグナル。図１０は、ＧＣ細胞株における予測スーパーエンハンサーを示す。図１０ａは、それぞれ、ＯＣＵＭ－１およびＮＣＣ５９におけるＫＬＦ５およびＭＹＣ関連予測スーパーエンハンサーを示す。上位の反復性予測スーパーエンハンサー（濃灰色）および予測典型エンハンサー（薄灰色）に連結された遺伝子の発現レベル（複数の細胞株にわたって、パーセンタイル単位）。ランダムに選んだ同一数の遺伝子（黒）を参照として用いた。遺伝子をパーセンタイルにより最高から最低への順序でソートした。公開データセットを用いた反復性予測スーパーエンハンサー／遺伝子相互作用の検証。パーセンテージ値は、元の予測スーパーエンハンサー／遺伝子の割り当てを反映する（結果および方法を参照）。ＧＲＥＡＴ解析ツールを用いた、反復性予測スーパーエンハンサーと関連付けられた生物学的プロセス。黒矢印によって強調表示したプロセスは、ＧＯｒｉｌｌａ（結果を参照）およびＧＲＥＡＴの両方によって観測したプロセスを指す。図１３は、１次試料からのヒストンＨ３Ｋ２７ａｃプロファイルを用いた、細胞株由来の予測スーパーエンハンサーのカテゴリー化を示す。図１３ａは、３つの腫瘍（Ｔ）／対応する正常（Ｎ）対におけるＧＣＮＴ４遺伝子座の体細胞欠失予測スーパーエンハンサーを示す。Ｔ／Ｎ２００２０７２０、Ｔ／Ｎ２００１２０６およびＴ／Ｎ９８０４０１におけるＣＭＩＰ遺伝子座の非変化予測スーパーエンハンサー。ＦＵ９７およびＹＣＣ２２ＧＣ細胞において検出した予測スーパーエンハンサーは、３つのＴ／Ｎ対におけるＺＮＦ３２６遺伝子座の不活性状態を示す。図１４は、コピー数変化と予測スーパーエンハンサーとの間の関連付けを示す。図１４ａは、コピー数中立領域で検出した体細胞増加予測スーパーエンハンサーの例を示す。ＫＡＴＯ－ＩＩＩ細胞において体細胞コピー数増加の領域で検出したＦＧＦＲ２－関連予測スーパーエンハンサー。Ｔ／Ｎ９８０４４７においてコピー数増加を伴う領域で検出した体細胞増加予測スーパーエンハンサー。高反復性体細胞増加（Ｈ３Ｋ２７ａｃ）予測スーパーエンハンサーをＣＬＤＮ４遺伝子座において検出した。この領域は、コピー数増加とは関連付けられなかった。Ｃａｐｔｕｒｅ－Ｃ技術を用いた、ＴＭ４ＳＦ１遺伝子座における予測スーパーエンハンサー（黒四角）と、ＯＣＵＭ－１細胞において検出したＴＭ４ＳＦ４プロモーターとの間の長距離相互作用。下部トラックは、キャプチャポイント＃１７から集約した相互作用を示す。図１６は、Ｃａｐｔｕｒｅ－Ｃ相互作用プロファイルを示す。図１６ａは、ＥＨＢＰ１予測スーパーエンハンサー（黒四角）からＴＭＥＭ１およびＥＨＢＰ１遺伝子のプロモーターへの相互作用を示す。この予測スーパーエンハンサーは、ＯＣＵＭ－１細胞において検出され、１次腫瘍Ｔ２００２０７２０では体細胞増加を示し、ＴＭＥＭ１およびＥＢＨＰ１の上方制御された発現と関連付けられる。ＹＷＨＡＺ遺伝子座における予測スーパーエンハンサー（黒四角）からＹＷＨＡＺのプロモーターへの相互作用。予測スーパーエンハンサーは、ＳＮＵ１６細胞において検出され、１次腫瘍試料Ｔ９９０２７５では体細胞増加を示し、ＹＷＨＡＺの上方制御された発現と関連付けられる。図１７は、４Ｃ相互作用プロファイルを示す。図１７ａは、ＥＬＦ３遺伝子座における体細胞増加予測スーパーエンハンサー、および近接遺伝子、例えば、ＥＬＦ３、ＲＮＰＥＰ、ＡＲＬ８ＡおよびＬＭＯＤ１との相互作用の例を示す。体細胞増加活性は、１次ＧＣにおけるＥＬＦ３の上方制御と関連付けられる。ＯＣＵＭ－１細胞において４Ｃを用いて相互作用（Ｑ＜０．０５，ｒ３Ｃｓｅｑ）を検出した。Ｂａｓｉｃ４ＣＳｅｑパッケージを用いて４Ｃシグナル・プロット（ＲＰＭ単位）を生成した。ＯＣＵＭ－１細胞においてＣＲＩＳＰＲ／Ｃａｓ９ゲノム編集技術を用いて２つの構成要素であるエンハンサーｅ３およびｅ４を独立に欠失させた。ＯＣＵＭ－１細胞においてＫＬＦ５遺伝子座における予測スーパーエンハンサーとＫＬＦ５プロモーターとの間の長距離相互作用を検出した。１次腫瘍（Ｔ７６６２９５４３）における体細胞増加活性は、対応する試料におけるＫＬＦ５発現の上方制御と関連付けられる。ＣＡＢＬＥＳ１遺伝子座における予測スーパーエンハンサーの、ＣＡＢＬＥＳ１およびＲＩＯＫ３を含んだ、遺伝子の近接する非コード領域およびプロモーターへの相互作用。図１８は、Ｃａｐｔｕｒｅ－Ｃおよび４Ｃからの相互作用プロファイルを比較する。図１８ａでは、ベン図がＯＣＵＭ－１およびＳＮＵ１６細胞からの２つの生物学的レプリケート間の（４Ｃからの）予測スーパーエンハンサー／遺伝子相互作用の重複を示す。同定したすべての相互作用に関して、レプリケート間の一致を計算した（丸括弧内のパーセンテージ）。図１８ｂでは、ベン図は、（Ｃａｐｔｕｒｅ－Ｃからの）予測スーパーエンハンサー／遺伝子相互作用の、同じ細胞における４Ｃからの相互作用の一致セットとの重複を示す。Ｃａｐｔｕｒｅ－Ｃを用いることによって同定した相互作用のうちの７５～８０％を４Ｃを用いた結果において再発見した。予測スーパーエンハンサー活性と長距離相互作用の存在との間の相関の例。ＯＣＵＭ－１およびＫＡＴＯ－ＩＩＩ細胞において活性な予測スーパーエンハンサー（黒四角）を用いてＥＨＢＰ１プロモーターへの長距離相互作用（薄灰色三角）を検出した。予測スーパーエンハンサーを検出しなかったＳＮＵ１６細胞ではかかる相互作用も観測されなかった。図２０は、ＣＲＩＳＰＲ／Ｃａｓ９欠失を用いた予測エンハンサーの欠失を示す。ＯＣＵＭ－１およびＳＮＵ１６細胞においてＲＴ－ｑＰＣＲを用いて以下のＰＣＲ解析を行った。プールした細胞を解析した。＊Ｐ＜０．０５、＃Ｐ＝０．０５５、片側ｔ検定；ｗｔ：野生型；ｌａｄ：ＤＮＡラダー（ＢｉｏｌｉｎｅＨｙｐｅｒｌａｄｄｅｒＩ）；ｃ１～ｃ３：ＧＡＰＤＨプライマーを用いた野生型細胞。図２０ａは、ＳＮＵ１６における構成要素であるエンハンサーｅ１のＣＲＩＳＰＲ／Ｃａｓ９欠失のＰＣＲ解析を示す。ＯＣＵＭ－１における構成要素であるエンハンサーｅ２のＣＲＩＳＰＲ／Ｃａｓ９欠失のＰＣＲ解析を示す。ＯＣＵＭ－１における構成要素であるエンハンサー、ｅ３およびｅ４のＣＲＩＳＰＲ／Ｃａｓ９欠失のＰＣＲ解析を示す。（１つのエンハンサー欠失を伴う）突然変異体と野生型細胞との間の差次的な遺伝子発現のＰＣＲ解析を示す。（１つのエンハンサー欠失を伴う）突然変異体と野生型細胞との間の差次的な遺伝子発現のＰＣＲ解析を示す。（１つのエンハンサー欠失を伴う）突然変異体と野生型細胞との間の差次的な遺伝子発現のＰＣＲ解析を示す。他の細胞および組織タイプにおけるＧＣ関連予測スーパーエンハンサーの景観。８６個の細胞および組織試料において検出したスーパーエンハンサーと重複する、ＧＣにおいて同定した反復性体細胞増加予測スーパーエンハンサーを、ランダムに選択した領域と比較した濃縮比。癌細胞株をアスタリスクでラベル付けて、濃縮比が統計学的に有意でない（Ｐ＞０．００１）試料は、灰色である。図２２は、ヒストン修飾および遺伝子発現に対する転写因子サイレンシングの結果を示す。図２２ａは、反復性細胞増加予測スーパーエンハンサーと非変化予測スーパーエンハンサーとの間の差次的なＣＤＸ２（左）およびＨＮＦ４α（右）平均結合シグナル解析を示す。予測スーパーエンハンサーは、ＳＮＵ１６においても活性であった。１つまたは２つの転写因子を同時にサイレンスさせた後のＨ３Ｋ２７ａｃにおける全体的な変化（濃灰色）。バックグラウンドの変化は、２つの対照（ＮＴ_ＣＤＸ２およびＮＴ_{ＨＮＦ４α}）間の差から作成する。ＯＣＵＭ－１細胞における転写因子（単数または複数）のサイレンシング後のＨ３Ｋ２７ａｃ枯渇の大きさ。ＯＣＵＭ－１細胞におけるＣＤＸ２サイレンシング後のＦＧＬ１遺伝子座の予測スーパーエンハンサーにおけるＨ３Ｋ２７ａｃ枯渇を示す視覚的な例。ＳＮＵ１６細胞におけるＣＤＸ２またはＨＮＦ４α結合部位に対する、体細胞増加予測スーパーエンハンサー中のＨ３Ｋ２７ａｃ枯渇の間の関連付け。距離は、結合部位に対して３つのカテゴリー：近い、中間および遠位に均一に分布し、分類された。ウィルコクソン片側順位和検定を用いて統計学的有意性を評価した。ＯＣＵＭ－１において体細胞増加予測スーパーエンハンサーと関連付けられた遺伝子発現をシングルまたはダブル転写因子を同時にサイレンスした後に（ＮＴ－ｓｉＴＦ）調べた。発現における変化（下方制御としてＦＰＫＭ差＞０；上方制御として＜０）を示す遺伝子のパーセンテージを示す。下方制御された遺伝子の比率を経験的アプローチ（方法を参照）を用いて試験した。図２３は、ウエスタンブロッティングおよびリアルタイム（ＲＴ：ｒｅａｌｔｉｍｅ）ＰＣＲによるＣＤＸ２、ＨＮＦ４αノックダウン効率を示す。図２３ａは、ＳＮＵ１６およびＯＣＵＭ－１細胞におけるＣＤＸ２ノックダウン前（ｓｉＮＴ）および後（ｓｉＣＤＸ２）のＣＤＸ２タンパク質存在量を測定したウエスタンブロットを示す。対照としてＧＡＤＰＨタンパク質存在量を用いた。ＳＮＵ１６およびＯＣＵＭ－１細胞におけるＨＮＦ４αノックダウン前（ｓｉＮＴ）および後（ｓｉＨＮＦ４α）のＨＮＦ４αタンパク質存在量を測定したウエスタンブロット。対照としてＧＡＤＰＨタンパク質存在量を用いた。ＯＣＵＭ－１細胞において対照に対するＣＤＸ２の相対的ＲＮＡ存在量をＲＴ－ＰＣＲを用いて２つのレプリケート中で測定した。ＯＣＵＭ－１細胞において対照に対するＨＮＦ４αの相対的ＲＮＡ存在量をＲＴ－ＰＣＲを用いて３つのレプリケート中で測定した。ＣＬＤＮ４ｅ１のＣＲＩＳＰＲ欠失に対するＧＣ細胞の耐性。Ｈ１ＥＳ対ＳＮＵ１６細胞においてより高い割合（２０％対１％）のｅ１ホモ接合型欠失を観測した。ＣＬＤＮ４ｅ１サブ領域がＳＮＵ１６における２倍体であることを確認した。図２５は、ＰＣＲを用いた、ＳＮＵ１６細胞からの９１個のクローンにおけるエンハンサーｅ１欠失の確認を示す。図２５ａは、外部プライマーを用いた結果として生じたＰＣＲバンドを示す。内部プライマーを用いた結果として生じたＰＣＲバンド。ホモ接合型欠失を伴うクローンは、外部プライマーを用いると約４５０ｂｐのバンドを示し、内部プライマーを用いるとバンドがなく、ヘテロ接合型欠失を伴うクローンは、外部および内部プライマーを用いると４５０ｂｐのバンドを示す。図２６は、ＰＣＲを用いた、Ｈ１細胞からの４８個のクローンにおけるエンハンサーｅ１欠失の確認を示す。図２６ａは、外部プライマーを用いた結果として生じたＰＣＲバンドを示す。内部プライマーを用いた結果として生じたＰＣＲバンド。ホモ接合型欠失を伴うクローンは、外部プライマーを用いると約４５０ｂｐのバンドを示し、内部プライマーを用いるとバンドがなく、ヘテロ接合型欠失を伴うクローンは、外部および内部プライマーを用いると４５０ｂｐのバンドを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、Ｈ１ＥＳ細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、ＳＮＵ１６細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、ＳＮＵ１６細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。サンガーシークエンシングを用いた、ＳＮＵ１６細胞における両方の対立遺伝子中のホモ接合型ｅ１欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、ｓｇＲＮＡを示す。

一態様において、本発明は、非癌生体試料と比較して、癌生体試料における少なくとも１つのスーパーエンハンサーの存在または非存在を判定するための方法に関し、方法は、
ａ）被験者から得られた癌生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体または複数の抗体と接触させるステップと、
ｂ）癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域または複数の領域を備える、単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーをヒストン修飾Ｈ３Ｋ２７ａｃのシグナル強度に基づいてマッピングするステップであって、少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、マッピングするステップと、
ｄ）癌生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップと、
ｅ）癌生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも１つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
ｆ）癌生体試料における少なくとも１つのスーパーエンハンサーの存在または非存在を少なくとも１つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える。

一実施形態において、癌および非癌生体試料は、単一の細胞、複数の細胞、細胞のフラグメント、体液または組織を備えてよい。一実施形態において、癌および非癌生体試料は、同じ被験者から得られてよい。

一実施形態において、癌および非癌生体試料は、各々が異なる被験者から得られてもよい。

本明細書に記載されるような方法による接触させるステップは、ヒストン修飾に対して特異的な少なくとも１つの抗体を備えてよい。ヒストン修飾の例は、以下には限定されないが、Ｈ３Ｋ２７ａｃ、Ｈ３Ｋ４ｍｅ３、Ｈ３Ｋ４ｍｅ１およびＨ２ＢＫ２０ａｃを含む。ある好ましい実施形態では、ヒストン修飾は、Ｈ３Ｋ２７ａｃである。

本明細書に記載されるような方法による単離ステップは、クロマチンの免疫沈降によって核酸を癌生体試料から単離するステップを備えてよい。一実施形態において、単離された核酸は、ヒストン修飾に特異的な少なくとも１つの領域を備える。ヒストン修飾の例は、以下には限定されないが、Ｈ３Ｋ２７ａｃ、Ｈ３Ｋ４ｍｅ３、Ｈ３Ｋ４ｍｅ１およびＨ２ＢＫ２０ａｃを含む。ある好ましい実施形態では、ヒストン修飾に特異的な少なくとも１つの領域は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な領域である。

本明細書に記載されるような方法によるマッピングするステップは、ヒストン修飾のシグナル強度に基づいてアノテートされたゲノム配列を用いるステップを備えてよい。一実施形態において、ヒストン修飾は、Ｈ３２７ａｃである。一実施形態において、アノテートされたゲノム配列は、公的に利用可能な配列である。一実施形態において、アノテートされたゲノム配列は、エピゲノムロードマップである。別の実施形態では、アノテートされたゲノム配列は、ＧＥＮＣＯＤＥｖ１９である。

本明細書に記載されるような方法によるマッピングするステップは、アノテートされた転写開始点から少なくとも１ｋｂ、少なくとも１．５ｋｂ、少なくとも２ｋｂ、少なくとも２．５ｋｂ、少なくとも３ｋｂ、少なくとも３．５ｋｂ、少なくとも４ｋｂ、少なくとも４．５ｋｂ、少なくとも５ｋｂ、少なくとも５．５ｋｂ、少なくとも６ｋｂ、少なくとも６．５ｋｂ、少なくとも７ｋｂ、少なくとも７．５ｋｂ、少なくとも８ｋｂ、少なくとも８．５ｋｂ、少なくとも９ｋｂ、少なくとも９．５ｋｂまたは少なくとも１０ｋｂにある少なくとも１つのエンハンサーも備えてよい。

方法は、癌生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップをさらに備えてよい。

いくつかの実施形態において、少なくとも１つの参照核酸配列は、ｉ）アノテートされたゲノム配列、ｉｉ）ｄｅｎｏｖｏトランスクリプトームアセンブリ、および／またはｉｉｉ）非癌核酸配列ライブラリまたはデータベースに由来する核酸配列を備えてよい。

一実施形態において、少なくとも１つの参照核酸配列は、少なくとも１つの癌細胞株から得られる。

一実施形態において、少なくとも１つのスーパーエンハンサーのシグナル強度は、ヒストン修飾Ｈ３Ｋ２７ａｃのＲｅａｄｓＰｅｒＫｉｌｏｂａｓｅｏｆｔｒａｎｓｃｒｉｐｔｐｅｒｍｉｌｌｉｏｎ（ＲＰＫＭ：１００万当たり、トランスクリプトのキロベース当たりのリード）値に基づく。一実施形態において、少なくとも１つのスーパーエンハンサーのシグナル強度は、ヒストン修飾Ｈ３Ｋ２７ａｃのＦｒａｇｍｅｎｔｓＰｅｒＫｉｌｏｂａｓｅｏｆｔｒａｎｓｃｒｉｐｔｐｅｒＭｉｌｌｉｏｎ（ＦＰＫＭ：１００万当たり、トランスクリプトのキロベース当たりのフラグメント）値に基づく。

一実施形態において、癌生体試料におけるその少なくとも１つのスーパーエンハンサーは、ＲＯＳＥ（ＲａｎｋｉｎｇｏｆＳｕｐｅｒＥｎｈａｎｃｅｒ：エンハンサーのランキング）アルゴリズムを用いて同定される。

いくつかの実施形態において、癌生体試料における少なくとも１つのスーパーエンハンサーは、少なくとも１つの参照核酸試料における少なくとも１つのエンハンサーと重複している、少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個または少なくとも１０個の核酸塩基対を備える。

ある好ましい実施形態において、癌生体試料における少なくとも１つのスーパーエンハンサーは、少なくとも１つの参照核酸試料における少なくとも１つのエンハンサーと重複している少なくとも１つの核酸塩基対を備える。

一実施形態において、少なくとも１つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体における少なくとも１つのスーパーエンハンサーに対するＲＰＫＭ値が、ｉ）非癌生体試料から得られた少なくとも１つのスーパーエンハンサーのＲＰＫＭ値と比較して、ＲＰＫＭ値における１．５倍より大きい倍率変化、２倍より大きい倍率変化、３倍より大きい倍率変化、４倍より大きい倍率変化、５倍より大きい倍率変化、６倍より大きい倍率変化、７倍より大きい倍率変化、８倍より大きい倍率変化、９倍より大きい倍率変化または１０倍より大きい倍率変化、およびｉｉ）非癌生体試料から得られた少なくとも１つのスーパーエンハンサーのＲＰＫＭ値と比較して、０．５ＲＰＫＭより大きい、１．０ＲＰＫＭより大きい、１．５ＲＰＫＭより大きい、２．０ＲＰＫＭより大きい、２．５ＲＰＫＭより大きい、３．０ＲＰＫＭより大きい、３．５ＲＰＫＭより大きい、４．０ＲＰＫＭより大きい、４．５ＲＰＫＭより大きいかまたは５．０ＲＰＫＭより大きい絶対値差分であることを判定するステップを備えてよい。

ある好ましい実施形態において、少なくとも１つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体試料における少なくとも１つのスーパーエンハンサーに対するＲＰＫＭ値が、ｉ）非癌生体試料から得られた少なくとも１つのスーパーエンハンサーのＲＰＫＭ値と比較して、ＲＰＫＭ値における２より大きい倍率変化、およびｉｉ）非癌生体試料から得られた少なくとも１つのスーパーエンハンサーのＲＰＫＭ値と比較して、０．５ＲＰＫＭより大きい絶対値差分であることを判定するステップを備える。

一実施形態において、非癌生体試料のＲＰＫＭ値と比較して、癌生体試料からのＲＰＫＭ値における増加は、癌生体試料における少なくとも１つのスーパーエンハンサーの存在を示す。

一実施形態において、非癌生体試料のＲＰＫＭ値と比較して、癌生体試料からのＲＰＫＭ値における減少は、癌生体試料における少なくとも１つのスーパーエンハンサーの非存在を示す。

いくつかの実施形態において、少なくとも１つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体における少なくとも１つのスーパーエンハンサーに対するＦＫＰＭ値が、ｉ）非癌生体試料から得られた少なくとも１つのスーパーエンハンサーのＦＰＫＭ値と比較して、ＦＰＫＭ値における１．５より大きい倍率変化、２より大きい倍率変化、３より大きい倍率変化、４より大きい倍率変化、５より大きい倍率変化、６より大きい倍率変化、７より大きい倍率変化、８より大きい倍率変化、９より大きい倍率変化かまたは１０より大きい倍率変化、およびｉｉ）非癌生体試料から得られた少なくとも１つのスーパーエンハンサーのＦＰＫＭ値と比較して、０．５ＦＰＫＭより大きい、１．０ＦＰＫＭより大きい、１．５ＦＰＫＭより大きい、２．０ＦＰＫＭより大きい、２．５ＦＰＫＭより大きい、３．０ＦＰＫＭより大きい、３．５ＦＰＫＭより大きい、４．０ＦＰＫＭより大きい、４．５ＦＰＫＭより大きいかまたは５．０ＲＰＫＭより大きい絶対値差分であることを判定するステップを備えてよい。

ある好ましい実施形態において、少なくとも１つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体試料における少なくとも１つのスーパーエンハンサーに対するＦＫＰＭ値が、ｉ）非癌生体試料から得られた少なくとも１つのスーパーエンハンサーのＦＰＫＭ値と比較して、ＦＰＫＭ値における２より大きい倍率変化、およびｉｉ）非癌生体試料から得られた少なくとも１つのスーパーエンハンサーのＦＰＫＭ値と比較して、０．５ＦＰＫＭより大きい絶対値差分であることを判定するステップを備える。

一実施形態において、非癌生体試料のＦＰＫＭ値と比較して、癌生体試料からのＦＰＫＭ値における増加は、癌生体試料における少なくとも１つのスーパーエンハンサーの存在を示す。

一実施形態において、非癌生体試料のＦＰＫＭ値と比較して、癌生体試料からのＦＰＫＭ値における減少は、癌生体試料における少なくとも１つのスーパーエンハンサーの非存在を示す。

いくつかの実施形態において、少なくとも１つのスーパーエンハンサーは、遺伝子転写開始点に対して５００ｋｂ、６００ｋｂ、７００ｋｂ、８００ｋｂ、９００ｋｂ、１０００ｋｂ、１１００ｋｂ、１２００ｋｂ、１３００ｋｂ、１４００ｋｂ、１５００ｋｂまたは２０００ｋｂ以内に配置される。ある好ましい実施形態では、少なくとも１つのスーパーエンハンサーは、遺伝子転写開始点に対して１０００ｋｂ以内に配置される。

一実施形態において、遺伝子は、癌関連遺伝子、血管新生遺伝子、細胞増殖遺伝子、細胞浸潤遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞死抵抗性遺伝子、細胞エナジェティクス遺伝子（ｃｅｌｌｕｌａｒｅｎｅｒｇｅｔｉｃｓｇｅｎｅ）、細胞周期遺伝子または腫瘍促進遺伝子である。

いくつかの実施形態において、遺伝子は、ＣＬＤＮ４、ＡＢＨＤ１１、ＷＢＳＣＲ２８、ＡＴＡＤ２、ＫＬＨ３８、ＷＤＹＨＶ１、ＣＤＨ１７、ＣＣＡＴ１、ＣＬＤＮ１、ＳＭＵＲＦ１、ＧＤＰＤ５、ＡＤＡＭＴＳ１２、ＡＳＣＬ２、ＡＳＰＭ、ＡＴＰ１１Ａ、ＡＵＲＫＡ、ＣＡＭＫ２Ｎ１、ＣＢＸ２、ＣＣＮＥ１、ＣＤ９、ＣＤＣ２５Ｂ、ＣＤＣＡ７、ＣＤＫ１、ＣＸＣＬ１、Ｅ２Ｆ７、ＥＣＴ２、ＬＡＭＣ２、ＮＩＤ２、ＰＭＥＰＡ１、ＲＡＲＲＥＳ１、ＲＦＣ３、ＳＬＣ３９Ａ１０、ＴＦＡＰ２Ａ、ＴＭＥＭ１５８、ＬＩＮＣ００２９９およびそれらの組み合わせからなる群から選択される。

一実施形態において、癌生体試料は、胃癌である。

本発明の別の態様において、被験者における少なくとも１つの癌関連スーパーエンハンサーの存在を判定するための方法であって、
ａ）被験者から得られた癌生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体または複数の抗体と接触させるステップと、
ｂ）癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域または複数の領域を備える、単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーをヒストン修飾Ｈ３Ｋ２７ａｃのシグナル強度に基づいてマッピングするステップであって、少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、マッピングするステップと、
ｄ）癌生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップと、
ｅ）癌生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも１つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
ｆ）被験者における少なくとも１つの癌関連スーパーエンハンサーの存在を少なくとも１つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも１つのスーパーエンハンサーの増加したシグナル強度は、少なくとも１つの癌関連スーパーエンハンサーの存在を示す、方法が提供される。

本発明の別の態様において、被験者における癌を検出するためのバイオマーカーであって、バイオマーカーは、正常非癌生体試料と比較して癌生体試料におけるＨ３Ｋ２７ａｃの増加したシグナル強度の有する少なくとも１つをスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも１つのスーパーエンハンサー、または両方を備える、被験者における癌を検出するためのバイオマーカーが提供される。いくつかの実施形態において、癌関連転写因子結合部位は、胃癌関連転写因子結合部位である。

いくつかの実施形態において、胃癌関連転写因子は、ＣＤＸ２、ＫＬＦ５およびＨＮＦ４αからなる群から選択される。いくつかの実施形態において、胃癌関連転写因子は、ＣＤＸ２、ＫＬＦ５、ＨＮＦ４αおよびそれらの組み合わせからなる群から選択される。

本発明の別の態様において、被験者における癌の予後を判定するための方法であって、
ａ）被験者から得られた癌生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体または複数の抗体と接触させるステップと、
ｂ）癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域または複数の領域を備える、単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーをヒストン修飾Ｈ３Ｋ２７ａｃのシグナルに基づいてマッピングするステップであって、少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、マッピングするステップと、
ｄ）癌生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップと、
ｅ）癌生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも１つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
ｆ）被験者における少なくとも１つの癌関連スーパーエンハンサーの存在または非存在を、非癌生体試料と比較して、癌生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも１つの癌関連スーパーエンハンサーの存在または非存在は、被験者における癌の予後を示す、方法が提供される。

一実施形態において、癌生体試料における少なくとも１つの癌関連スーパーエンハンサーの存在は、被験者における癌生存の予後不良を示す。

一実施形態において、癌生体試料における少なくとも１つの癌関連スーパーエンハンサーの非存在は、被験者における癌生存の予後改善を示す。

一実施形態において、少なくとも１つの癌関連スーパーエンハンサーは、細胞浸潤遺伝子、血管新生遺伝子または細胞死抵抗性遺伝子、癌関連遺伝子、細胞増殖遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞エナジェティクス遺伝子、細胞周期遺伝子または腫瘍促進遺伝子のうちの１つ以上と関連付けられる。

一実施形態において、少なくとも１つの癌関連スーパーエンハンサーは、ＣＬＤＮ４、ＡＢＨＤ１１、ＷＢＳＣＲ２８、ＡＴＡＤ２、ＫＬＨ３８、ＷＤＹＨＶ１、ＣＤＨ１７、ＣＣＡＴ１、ＣＬＤＮ１、ＳＭＵＲＦ１、ＧＤＰＤ５、ＡＤＡＭＴＳ１２、ＡＳＣＬ２、ＡＳＰＭ、ＡＴＰ１１Ａ、ＡＵＲＫＡ、ＣＡＭＫ２Ｎ１、ＣＢＸ２、ＣＣＮＥ１、ＣＤ９、ＣＤＣ２５Ｂ、ＣＤＣＡ７、ＣＤＫ１、ＣＸＣＬ１、Ｅ２Ｆ７、ＥＣＴ２、ＬＡＭＣ２、ＮＩＤ２、ＰＭＥＰＡ１、ＲＡＲＲＥＳ１、ＲＦＣ３、ＳＬＣ３９Ａ１０、ＴＦＡＰ２Ａ、ＴＭＥＭ１５８、ＬＩＮＣ００２９９およびそれらの組み合わせからなる群から選択された遺伝子と関連付けられる。

本発明の別の態様において、癌または胃腸疾患に対する被験者の感受性を判定する方法であって、
ａ）被験者から得られた生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体または複数の抗体と接触させるステップと、
ｂ）生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域または複数の領域を備える、単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーをヒストン修飾Ｈ３Ｋ２７ａｃのシグナル強度に基づいてマッピングするステップであって、少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、マッピングするステップと、
ｄ）生体試料における少なくとも１つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つのエンハンサーに対してマッピングするステップと、
ｅ）生体試料における少なくとも１つのスーパーエンハンサーのシグナル強度を対照生体試料から得られた少なくとも１つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
ｆ）少なくとも１つのスーパーエンハンサーの存在または非存在を少なくとも１つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
ｇ）少なくとも１つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連ＳＮＰを備える参照ゲノム配列に対してマッピングするステップと
を備え、１つ以上の癌または胃腸疾患関連ＳＮＰと関連付けられた少なくとも１つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法が提供される。

一実施形態において、胃腸疾患は、アカラシア、バレット食道、肝硬変、胆汁性肝硬変、セリアック病、結腸直腸ポリープ、クローン病、憩室症、憩室炎、脂肪肝、胆石、胃炎、ヘリコバクター・ピロリ、ヘモクロマトーシス、肝炎、過敏性腸症候群、顕微鏡的大腸炎、食道癌、膵炎、消化性潰瘍、逆流性食道炎、潰瘍性大腸炎、大腸癌および便秘のうちの１つ以上から選択される。

一実施形態において、癌は、胃癌、食道癌、結腸直腸癌、乳癌および前立腺癌のうちの１つ以上から選択される。

本発明の別の態様では、細胞における少なくとも１つの癌関連スーパーエンハンサーの活性を調節するための方法であって、ＣＤＸ２および／またはＨＮＦ４αの阻害薬を細胞へ投与するステップを備える、方法が提供される。

一実施形態において、阻害薬は、低分子干渉ＲＮＡ（ｓｉＲＮＡ）である。別の実施形態では、阻害薬は、低分子ヘアピン型ＲＮＡ（ｓｈＲＮＡ）である。

一実施形態において、阻害薬は、小分子または抗体である。

一実施形態において、阻害薬は、メトホルミンである。

一実施形態において、細胞における少なくとも１つの癌関連スーパーエンハンサーの活性は、ＣＲＩＳＰＲゲノム編集システムによって調節されうる。別の実施形態では、ＣＲＩＳＰＲゲノム編集システムは、ＣＲＩＳＰＲ／Ｃａｓ９である。

一実施形態において、細胞における少なくとも１つの癌関連スーパーエンハンサーの活性は、ＣＲＩＳＰＲゲノム編集システムによって阻害されうる。別の実施形態では、ＣＲＩＳＰＲゲノム編集システムは、ＣＲＩＳＰＲ／Ｃａｓ９である。

本発明の別の態様では、正常非癌生体試料と比較して、癌生体試料におけるＨ３ＫH２７ａｃの増加したシグナル強度を有する少なくとも１つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも１つのスーパーエンハンサー、または両方を備える、被験者における癌の検出に用いるためのバイオマーカーが提供される。

本発明の別の態様では、正常非癌生体試料と比較して癌生体試料におけるＨ３Ｋ２７ａｃの増加したシグナル強度を有する少なくとも１つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも１つのスーパーエンハンサー、または両方を備えるバイオマーカーの被験者における癌を検出するための薬物の製造における使用が提供される。

本発明の別の態様では、細胞における少なくとも１つの癌関連スーパーエンハンサーの活性を調節するのに用いるためのＣＤＸ２および／またはＨＮＦ４αの阻害薬が提供される。

本発明の別の態様では、細胞における少なくとも１つの癌関連スーパーエンハンサーの活性を調節するための薬物の製造におけるＣＤＸ２および／またはＨＮＦ４αの阻害薬の使用が提供される。

本発明の範囲を何らか限定すると解釈されるべきではない具体的な実施例を参照することによって、本発明の非限定例および比較例がさらにより詳細に記載される。

方法
１次組織試料および細胞株
１次患者試料は、ＳｉｎｇＨｅａｌｔｈＣｅｎｔｒａｌｉｓｅｄＩｎｓｔｉｔｕｔｉｏｎａｌＲｅｖｉｅｗＢｏａｒｄからの認可および患者署名入りインフォームド・コンセントを伴ってＳｉｎｇＨｅａｌｔｈ組織リポジトリから得た。この研究に用いた「正常」（すなわち、非悪性）試料は、胃から、腫瘍から遠く離れ、外科的評価の際に腫瘍または腸上皮化生／異形成の視認できる証拠を示していない部位から収集した試料を指す。腫瘍試料は、４０％超の腫瘍細胞を含むことを凍結切片によって確認した。ＦＵ９７、ＭＫＮ７、ＯＣＵＭ－１およびＲＥＲＦ－ＧＣ－１Ｂ細胞は、ＪａｐａｎＨｅａｌｔｈＳｃｉｅｎｃｅＲｅｓｅａｒｃｈＢａｎｋ（ヒューマンサイエンス研究資源バンク）から得た。ＫＡＴＯ－ＩＩＩおよびＳＮＵ１６細胞は、ＡｍｅｒｉｃａｎＴｙｐｅＣｕｌｔｕｒｅＣｏｌｌｅｃｔｉｏｎから得た。ＮＣＣ－５９は、ＫｏｒｅａｎＣｅｌｌＬｉｎｅＢａｎｋから得た。ＹＣＣ３、ＹＣＣ７、ＹＣＣ２１、ＹＣＣ２２は、ＹｏｎｓｅｉＣａｎｃｅｒＣｅｎｔｒｅ，韓国から贈られた。細胞株の同一性は、ＣｅｎｔｒｅｆｏｒＴｒａｎｓｌａｔｉｏｎａｌＲｅｓｅａｒｃｈａｎｄＤｉａｇｎｏｓｔｉｃｓ（ＣａｎｃｅｒＳｃｉｅｎｃｅＩｎｓｔｉｔｕｔｅｏｆＳｉｎｇａｐｏｒｅ，シンガポール）で行ったＳＴＲＤＮＡプロファイリングによって確認した。ＳＴＲプロファイルを標準ＡＮＳＩ／ＡＴＣＣＡＳＮ－０００２－２０１１命名法に従って評価し、本発明者らの細胞株のプロファイルは、参照データベースに対して８０％超の類似性を示した。ＭＫＮ７細胞－ＩＣＬＡＣ（ｈｔｔｐ：／／ｉｃｌａｃ．ｏｒｇ／ｄａｔａｂａｓｅｓ／ｃｒｏｓｓ－ｃｏｎｔａｍｉｎａｔｉｏｎｓ／）により概して誤認される１つの株は、ＪａｐａｎｅｓｅＣｏｌｌｅｃｔｉｏｎｏｆＲｅｓｅａｒｃｈＢｉｏｒｅｓｏｕｒｃｅｓＣｅｌｌＢａｎｋ（ＪＣＲＢ細胞バンク）におけるＭＫＮ７参照プロファイルとの完全な一致（１００％）を示すことによってこれを確認した。マイコプラズマ汚染を検出するために、ＭｙｃｏＡｌｅｒｔ（登録商標）ＭｙｃｏｐｌａｓｍａＤｅｔｅｃｔｉｏｎＫｉｔ（Ｌｏｎｚａ）およびＭｙｃｏＳｅｎｓｏｒｑＰＣＲアッセイキット（アジレント・テクノロジー）を用いた。すべての細胞株がマイコプラズマ汚染について陰性であった。この研究のために、ＯＣＵＭ－１およびＳＮＵ１６細胞を２つの理由で主要細胞株モデルとして選択した。第１に、ＯＣＵＭ－１およびＳＮＵ１６細胞は、低分化胃腺癌をもつ患者から元々単離され、この研究における１次ＧＣの過半数が低分化である（６３％）。第２に、ＯＣＵＭ－１およびＳＮＵ１６は、これまでに多くの他の公表された研究で胃癌（ＧＣ）モデルとして用いられ、従って、この分野で受け入れられたＧＣモデルであると見做される。従って、Ｃａｐｔｕｒｅ－Ｃ、４Ｃ、エンハンサーＣＲＩＳＰＲ、転写因子結合、および転写因子ノックダウンを含めて、いくつかの実験のための一貫した細胞株モデルとしてＯＣＵＭ－１およびＳＮＵ１６を用いた。

ＮａｎｏＣｈＩＰｓｅｑ
ＮａｎｏＣｈＩＰｓｅｑをわずかな修正を伴って記載したように行った。１次組織については、ＣｈＩＰごとに約５ｍｇサイズの小片を得るために、剃刀の刃を用いて新鮮冷凍癌および正常組織を液体窒素中で切開した。組織片を室温において１０分間、１％ホルムアルデヒト／ＰＢＳバッファー中で固定した。グリシンを１２５ｍＭの最終濃度まで添加することによって固定を停止した。組織片をＴＢＳＥバッファーで３回洗浄した。細胞株ついては、１００万個の新鮮な収集細胞を室温において１０分（ｍｉｎ）間、１％ホルムアルデヒト／溶媒バッファー中で固定した。グリシンを１２５ｍＭの最終濃度まで添加することによって固定を停止した。固定した細胞をＴＢＳＥバッファーで３回洗浄して、遠心分離した（５，０００ｒ．ｐ．ｍ．，５分）。ペレット状の細胞および粉砕した組織を１００μｌの１％ＳＤＳ溶解バッファー中に溶解して、Ｂｉｏｒｕｐｔｏｒ（Ｄｉａｇｅｎｏｄｅ）を用いて３００～５００ｂｐへ超音波処理した。ＣｈＩＰは、次の抗体：Ｈ３Ｋ４ｍｅ３（０７－４７３，ミリポア）、Ｈ３Ｋ４ｍｅ１（ａｂ８８９５，アブカム）、Ｈ３Ｋ２７ａｃ（ａｂ４７２９，アブカム）を用いて行った。

ＣｈＩＰおよび入力ＤＮＡの回収後に、ＷＧＡ４キット（シグマ・アルドリッチ）およびＢｐｍＩ－ＷＧＡプライマーを用いて全ゲノム増幅を行った。増幅したＤＮＡをＰＣＲ精製カラム（ＱＩＡＧＥＮ）を用いて精製し、ＷＧＡアダプターを除去するためにＢｐｍＩ（ニュー・イングランド・バイオラボ）で消化した。増幅したＤＮＡのうちの３０ｎｇを各シークエンシングライブラリ調製（ニュー・イングランド・バイオラボ）のために用いた。８つのライブラリを多重化（ニュー・イングランド・バイオラボ）して、Ｈｉｓｅｑ２５００（イルミナ）の２つのレーン上でライブラリごとに２，０００～３，０００万リードの平均深さへシークエンシングした。

配列マッピングおよびＣｈＩＰ－ｓｅｑ濃度解析
アラインメント前に最初および最後の１０個の塩基をトリミングした後に、Ｂｕｒｒｏｗｓ－ＷｈｅｅｌｅｒＡｌｉｇｎｅｒ（ＢＷＡ－ＭＥＭ，バージョン０．７．０）を用いて配列リードをヒト参照ゲノム（ｈｇ１９）に対してマッピングした。高品質のマッピングリード（ＭＡＰＱ≧１０）のみを下流解析のために維持した。ＭＡＰＱ値（≧１０）を選んだが、その理由は、ｉ）この値が、良好／確信的なリードマッピングに用いるのに良い値であることが先に報告され、ｉｉ）ＭＡＰＱ≧１０が、彼らのソフトウェアを用いた確信的なマッピングに用いるのに適した閾値であることもＢＷＡアルゴリズムの開発者らによって示され、ｉｉｉ）リードアラインメントに関する様々なアルゴリズムを評価する研究が、マッピング品質スコアは、リードマッピングが真／正確である尤度と良好には相関付けられないことも示し、かつマッピング精度について得られる精度のレベルが１０～１２ＭＡＰＱの閾値間で横這いになることを示したためである。この研究は、複数の試料で確実に検出され、解析のロバスト性を高める反復性予測エンハンサーおよびスーパーエンハンサーに焦点を合わせる。配列カバレッジは、ウィンドウサイズが５０ｂｐで、リード長を２００ｂｐに延長したＭＥＤＩＰＳを用いて計算した。入力ライブラリと比較して著しいＣｈＩＰ濃縮（ＦＤＲ＜５％）を伴うピークをＣＣＡＴ（バージョン３）を用いて検出した。ライブラリおよび領域サイズによって正規化したマッピングリードの総数、キロベース当たり、１００万マッピングリード当たりのリード（ＲＰＫＭ）と等価なメトリックをカウントすることによって、領域内のピーク密度を計算した。この正規化法は、リードが長い方の領域に入る確率が高くなることによるバイアスを調整し、これまでの研究に適用されてきた。この研究は、研究を他の研究と比較可能にするためにＲＰＫＭベースの正規化を適用することを選んだ。バックグラウンド・シグナルを考慮するために、各ＣｈＩＰライブラリのリード密度を対応する入力ライブラリに対して補正した。ＣＯＭＢＡＴを用い、試料変動を確実に等しくするために、複数の試料にわたってリード密度を潜在的なバッチ効果（例えば、ＣｈＩＰアッセイのデータ）について補正した。２つ以上の細胞株で検出した１７，３６０個の反復性予測エンハンサーのうちで、９８％が少なくとも１つの１次試料（正常またはＧＣ）中に存在した。

Ｎａｎｏ－ＣｈＩＰｓｅｑデータの品質管理評価
２つの異なる方法を用いて、ＣｈＩＰライブラリ（Ｈ３Ｋ２７ａｃ、Ｈ３Ｋ４ｍｅ３およびＨ３Ｋ４ｍｅ１）の品質を評価した。第１に、ＣｈＩＰ品質、特にＨ３Ｋ２７ａｃおよびＨ３Ｋ４ｍｅ３をタンパク質コード遺伝子のアノテートされたプロモーターにおけるそれらの濃縮レベルを調べることによって推定した。具体的には、本研究は、高発現タンパク質コード遺伝子と関連付けられた１，０００個のプロモーターにおける入力および入力補正ＣｈＩＰシグナルのメジアン・リード密度を計算した。試料ごとに、データ品質のサロゲートとしてＨ３Ｋ２７ａｃ割る入力のリード密度比を比較し、Ｈ３Ｋ２７ａｃ／入力比が４倍より大きかった試料のみを維持した。この基準を用いると、５０個のＨ３Ｋ２７ａｃ試料（ＧＣ株および１次試料）のうち４８個が４倍より大きい濃縮を示し、好結果の濃縮を示した。Ｈ３Ｋ４ｍｅ３ライブラリ（プロモーターマーク）についても同様の解析を行い、すべての４２個のライブラリがこの品質管理基準を満たした。第２に、ＣＨＡＮＣＥ（ＣＨｉｐ－ｓｅｑＡｎａｌｙｔｉｃｓａｎｄＣｏｎｆｉｄｅｎｃｅＥｓｔｉｍａｔｉｏｎ（ＣＨｉｐ－ｓｅｑアナリティクスおよび信頼推定））、ＣＨｉｐ－ｓｅｑ品質管理および好結果または弱い濃縮を用いたことをライブラリが示すかどうかを指示するプロトコル最適化のためのソフトウェアを用いた。本研究における試料の大多数（８５％）がＣＨＡＮＣＥによって評価した通り好結果の濃縮を示すことがわかった。両方の方法によって評価した、ライブラリごとの評価状況を表１に報告する。

本研究は、ＫＡＴＯ－ＩＩＩ細胞を用いてＨ３Ｋ２７ａｃＮａｎｏ－ＣｈＩＰ－ｓｅｑの第２の生物学的レプリケートを実験的に発生させて、さらに通常のＣｈＩＰ－ｓｅｑプロトコルから発生させた独立したＨ３Ｋ２７ａｃＫＡＴＯ－ＩＩＩデータに対して結果を比較した。配列トリミングを除いて、公開されたシークエンシングリードをＮａｎｏＣｈＩＰ－ｓｅｑライブラリと同様に処理した。ＣＣＡＴによって検出したピークをＦＤＲ＜５％で比較した。

クロマチンアクセシビリティ、保存および結合濃縮
エピゲノムロードマップ正常胃組織のクロマチンアクセシビリティ・プロファイルは、ＧｅｎｅＥｘｐｒｅｓｓｉｏｎＯｍｎｉｂｕｓから得た（ＧＳＭ１０２７３２５，ＧＳＭ１０２７３２０）。クロマチンアクセシビリティ・プロファイルのリード密度を予測エンハンサー領域について計算し、ＲＰＫＭ単位で１００，０００個のランダムに選択した領域に対して比較した。本研究は、２５個のロードマップ・クロマチンアクセシビリティおよびＨ３Ｋ２７ａｃプロファイルから、オープンクロマチン領域（．ｎａｒｒｏｗＰｅａｋ）および活性な調節エレメント（Ｈ３Ｋ２７ａｃ，．ｇａｐｐｅｄＰｅａｋ）と重複する予測エンハンサーの割合も計算した。転写因子結合濃縮解析については、ＥＮＣＯＤＥ（ｗｇＥｎｃｏｄｅＲｅｇＴｆｂｓＣｌｕｓｔｅｒｅｄＶ３．ｂｅｄ）によってキュレートしたＰ３００および他の転写因子の結合座標をＵＣＳＣゲノムブラウザからダウンロードした。ＢＥＤＴｏｏｌｓ交差を用いて少なくとも１ｂｐの重複を同定した。進化的塩基配列保存性（ｅｖｏｌｕｔｉｏｎａｒｙｓｅｑｕｅｎｃｅｃｏｎｓｅｒｖａｔｉｏｎ）のレベルをＰｈａｓｔＣｏｎｓｔスコア（ＣａｓｔｅｌｏＲ．ｐｈａｓｔＣｏｎｓ１００ｗａｙ．ＵＣＳＣ．ｈｇ１９：ＵＣＳＣｐｈａｓｔＣｏｎｓｃｏｎｓｅｒｖａｔｉｏｎｓｃｏｒｅｓｆｏｒｈｇ１９．Ｒｐａｃｋａｇｅｖｅｒｓｉｏｎ３．２．０）を用いて評価した。エンハンサー中間点から５００ｂｐ以内の最高スコアをエンハンサー保存スコアとして用いた。予め検出したエンハンサー領域を除いて、１０，０００個のランダムに選択した領域についても保存スコアを計算した。

予測スーパーエンハンサーの同定
予測エンハンサーは、アノテートされた転写開始点（ＴＳＳ）から少なくとも２.５ｋｂにあり、Ｈ３Ｋ４ｍｅ１の濃縮およびＨ３Ｋ４ｍｅ３の枯渇も示す、濃縮されたＨ３Ｋ２７ａｃの領域として定義した。この研究のためのＴＳＳアノテーションは、ＧＥＮＣＯＤＥバージョン１９に由来した。Ｈ３Ｋ４ｍｅ３／Ｈ３Ｋ４ｍｅ１対数比をＧＣ細胞株および１次試料から集約したＨ３Ｋ４ｍｅ３およびＨ３Ｋ４ｍｅ１シグナルを用いて計算した。高いＨ３Ｋ２７ａｃシグナルを示すが、高いＨ３Ｋ４ｍｅ３／Ｈ３Ｋ４ｍｅ１対数比（＞２．４）を示す遠位予測エンハンサーは、誤った予測として分類し、従って、解析から除外した。次に、ＲＯＳＥアルゴリズムを用いて、予測エンハンサーを予測スーパーエンハンサーまたは典型エンハンサーへ再分割した。複数のＧＣ株にわたって少なくとも１つの塩基重複をもつ予測スーパーエンハンサー領域をＢＥＤＴｏｏｌｓを用いてマージし、予測スーパーエンハンサー領域とは別個の領域に局在している予測エンハンサーを予測典型エンハンサーと名付けた。個々の試料における予測典型または予測スーパーエンハンサーの存在をバックグラウンド超のＨ３Ｋ２７ａｃ濃縮のレベル（Ｐ＜０．０１，経験的検定）によって判定し、このレベルは、１００,０００個のランダムに選択した領域からのＨ３Ｋ２７ａｃシグナル（ＲＰＫＭ単位）であった。予測エンハンサー／スーパーエンハンサーを遺伝子へ割り当てるために、予測エンハンサー／スーパーエンハンサー中心から、ランダムに選んだ領域を超えるＨ３Ｋ２７ａｃ濃縮を伴うプロモーター（ＴＳＳにおける５００ｂｐのフランキング）として定義される、最近接の活性な転写開始点（ＴＳＳ）への距離を算出した。反復性予測スーパーエンハンサーと関連付けられた遺伝子をフィシャーの片側正確検定を用いて癌遺伝子濃縮について試験した。上位５００個の癌遺伝子を用いた。反復性予測エンハンサーおよび予測スーパーエンハンサーを同定するために、各ＧＣ株における領域をシグナル強度に従ってランク付けした。ランクプロダクト（ｒａｎｋｐｒｄｕｃｔ）を計算するために、複数の株にわたって各予測エンハンサー／スーパーエンハンサーのランクを乗算した。ランクプロダクトの統計学的有意性を判定するために、観測したランクプロダクトを帰無分布に対して比較し－各株におけるランクをリシャッフルして、ランクプロダクトを計算した。１０，０００回の反復についてリシャッフル手順を繰り返した。帰無分布未満の観測したランクプロダクトを統計学的に有意であると見做した。

予測相互作用の検証
スーパーエンハンサー／遺伝子の割り当ては、３つの直交する相互作用データセットを用いて検証した。これらは、以下を含んだ。
ｉ）１２個の細胞株からＰｒｅＳＴＩＧＥによって検出した所定の相互作用。シス調節エレメントおよび標的遺伝子を含む、ＰｒｅＳＴＩＧＥ相互作用データは、ＰｒｅＳＴＩＧＥウェブサイト（ｐｒｅｓｔｉｇｅ．ｃａｓｅ．ｅｄｕ）からダウンロードした。
ｉｉ）デフォルト・パラメータを用いたＧＲＥＡＴによるシス調節エレメント／遺伝子の割り当て
ｉｉｉ）Ｋ５６２、ＨＣＴ－１１６、ＮＢ４、ＭＣＦ－７、ＨｅＬａ－Ｓ３およびＧＭ１２８７８細胞におけるＲＮＡＰＩＩＣｈＩＡ－ＰＥＴ研究からのエンハンサー－プロモーター相互作用の参照セット。ＣｈＩＡ－ＰＥＴ相互作用データは、ｅｎｃｏｄｅｐｒｏｊｅｃｔ．ｏｒｇおよびＧＳＥ７２８１６からダウンロードした。各生物学的レプリケートで同定したすべての相互作用を検証のために考慮した。これらの相互作用は、２つの遺伝子座（アンカー）を含み、一方は、ＴＳＳの２．５ｋｂ以内にあり、他方のアンカーは、本発明者らの研究において見出した予測スーパーエンハンサー領域と重複する。

ｉ）～ｉｉｉ）に加えて、ＧＣ株に対してＣａｐｔｕｒｅ－Ｃ解析を用いて追加の検証を行った（図４を参照）。

機能的濃縮解析
反復性予測スーパーエンハンサー／遺伝子プロモーターまたは予測典型エンハンサー／遺伝子プロモーター相互作用において強化された生物学的プロセスを同定するために、ＧＯｒｉｌｌａ（遺伝子オントロジー・アノテーション）を用いた。デフォルトＧＯｒｉｌｌａパラメータを用い、ＧＥＮＣＯＤＥｖ１９からの遺伝子をバックグラウンドとして用いた。比較可能性を確保するために、反復性予測スーパーエンハンサーと同数に一致させるべく、複数の細胞株にわたって最も高いＨ３Ｋ２７ａｃをもつ予測典型エンハンサーを選択した。前者を選択するために、予測典型エンハンサーを各株でランク付けして、ランクプロダクト・スコアに基づいてそれらを選んだ。次に、反復性予測スーパーエンハンサーと関連付けられた最も有意な項目（１．５倍超の濃縮）を上位の予測典型エンハンサーと関連付けられた濃縮レベルに対して比較した。より大きい遺伝子間領域が隣接する遺伝子に対してはＧＲＥＡＴが補正を提供するため、ＧＯＲｉｌｌａに加えて、デフォルト・パラメータを用いたＧＲＥＡＴを利用して、反復性予測スーパーエンハンサーおよび上位の予測典型エンハンサーと関連付けられた機能的濃縮をさらに調べた。有意な（濃縮も１．５倍超の）項目を二項ｐ値（Ｂｉｎｏｍｉａｌｐ－ｖａｌｕｅ）に基づいて順序付けた。

１次試料における細胞株由来スーパーエンハンサー
２倍以上のＨ３Ｋ２７ａｃ濃縮または枯渇を示し、絶対値差分が０．５ＲＰＫＭより大きい領域は、ＧＣと対応する正常試料との間で差次的に存在すると見做した。主成分分析（ＰＣＡ：ｐｒｉｎｃｉｐｌｅｃｏｍｐｏｎｅｎｔａｎａｌｙｓｉｓ）のために、２人以上の患者において体細胞増加を示す予測スーパーエンハンサーからのシグナルを用いた。ＰＣＡ分析は、Ｒを用いて行い、「ｐｃａ３ｄ」パッケージを用いてプロットした。腫瘍および正常試料からの１００個の予測スーパーエンハンサー（表２）の平均シグナルに基づいて、検定力８０％および第１種の誤り５％（ｈｔｔｐ：／／ｐｏｗｅｒａｎｄｓａｍｐｌｅｓｉｚｅ．ｃｏｍ／）を達成するために必要なサンプルサイズを推定した。この結果は、推奨サンプルサイズ１３（平均）をもたらし、本研究（１９Ｎ／Ｔ）ではこれを満たした。１次試料に基づいて、３つのクラスの予測スーパーエンハンサー：ｉ）体細胞増加、ｉｉ）体細胞欠失、およびｉｉｉ）非変化を定義した。ｉ）、ｉｉ）およびｉｉｉ）と関連付けられた遺伝子を先にＨｎｉｓｚ，２０１３において報告された遺伝子群へマッピングし、各遺伝子群がいくつかの遺伝子オントロジー・カテゴリーの編集物であり、様々な癌ホールマークの代わりとして用いられる。Ｒにおいてフィシャーの片側正確検定を用いて統計学的有意性を計算した。反復的に増加する体細胞予測スーパーエンハンサーの系列特異性を異なる組織タイプにわたって評価するために、胃の予測スーパーエンハンサー間の重複を他の非胃組織に対して計算した。観測した全重複対偶然による全重複に基づいて、各非胃組織との濃縮比を計算した。

Ｃａｐｔｕｒｅ－Ｃおよびデータ解析
Ｃａｐｔｕｒｅ－Ｃを先に簡潔に記載したように行い、１×１０^７個の細胞を２％ホルムアルデヒドによって架橋し、溶解、均質化、ＤｐｎＩＩ消化、ライゲーションおよび解架橋がそれに続いた。オリゴキャプチャに適したＤＮＡを生成するためにＣｏｖａｒｉｓを用いてＤＮＡを１５０～２００ｂｐへ超音波処理した。シークエンシングライブラリ調製（ニュー・イングランド・バイオラボ）のために３μｇの剪断ＤＮＡを用いた。カスタマイズしたビオチン標識オリゴ（ＩＤＴ，表３）への逐次的ハイブリダイゼーションおよびＤｙｎａｂｅａｄｓ（ＬｉｆｅＴｅｃｈ）を用いた濃縮により、予測スーパーエンハンサー配列のダブルキャプチャ（ｄｏｕｂｌｅｃａｐｔｕｒｅｄ）を行った。キャプチャしたＤＮＡをＩｌｌｕｍｉｎａＭｉＳＥＱ上で１５０ｂｐペアエンド構成を用いてシークエンシングした。

アダプター配列を除去するために生のリードの前処理を行い（ｔｒｉｍ＿ｇａｌｏｒｅ，ｈｔｔｐ：／／ｗｗｗ．ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．ｂａｂｒａｈａｍ．ａｃ．ｕｋ／ｐｒｏｊｅｃｔｓ／ｔｒｉｍ＿ｇａｌｏｒｅ／）、ＦＬＡＳＨを用いて重複リードをマージした。ｈｇ１９参照ゲノムへのショートリード・マッピングを達成するために、前処理の結果として生じたリードを、次に、ＤｐｎＩＩによってインシリコで消化し、Ｂｏｗｔｉｅ（ｐ１，ｍ２，ｂｅｓｔ，およびｓｔｒａｔａ設定）を用いてアラインした。アラインしたリードは、Ｃａｐｔｕｒｅ－Ｃ解析を用いてそれらを処理し、（ｉ）ＰＣＲデュプリケートを除去して、（ｉｉ）サブフラグメントがキャプチャフラグメント内に含まれた場合にはそれらを「キャプチャ」として、それらがキャプチャフラグメントのいずれかの側の１ｋｂ以内にあった場合には「近接性除外（ｐｒｏｘｉｍｉｔｙｅｘｃｌｕｓｉｏｎ）」として、またはそれらが「キャプチャ」および「近接性除外」の外部にあった場合には「レポータ」として分類した。加えて、この研究は、スケーリングしたバックグラウンドに対するビューポイントの有意な相互作用（Ｑ＜０．０５，ＦＤＲ）を同定し、さらに、異なる細胞株間で相互作用プロファイルを比較するために、キャプチャおよびレポーター・フラグメントに対してｒ３Ｃｓｅｑパッケージを用いた。

４Ｃ－ｓｅｑおよびデータ解析
４Ｃテンプレートをわずかな修正を伴う先に公表されたプロトコルを用いて調製した。手短かに言えば、培養細胞を単一細胞の懸濁物中に希釈し、クロマチンを室温において１０分間、１％ホルムアルデヒトで架橋した。細胞を溶解し、架橋したＤＮＡを主要な制限酵素ＨｉｎｄＩＩＩ－ＨＦ［Ｒ３１０４Ｌ，ニュー・イングランド・バイオラボ（ＮＥＢ）］で消化した。次に、ＨｉｎｄＩＩＩ－で消化したＤＮＡがＴ４ＤＮＡリガーゼ（ＥＬ００１３，サーモサイエンティフィック）を用いた近接性ライゲーション（ｐｒｏｘｉｍｉｔｙｌｉｇａｔｉｏｎ）を受けて、ＰｒｏｔｅｉｎａｓｅＫ（ＡＭ２５４６，アンビオン）を用いた架橋除去がそれに続き、３Ｃライブラリをもたらした。３Ｃライブラリは、次に、ＤｐｎＩＩ（Ｒ０５４３Ｌ，ＮＥＢ）を用いた第２の制限酵素消化を受けて、Ｔ４ＤＮＡリガーゼを用いた環状化反応がそれに続いた。ビューポイントごとに、スケールアップ・インバース、ネステッドＰＣＲ（ｓｃａｌｅ－ｕｐｉｎｖｅｒｓｅ，ｎｅｓｔｅｄＰＣＲ）（表４）を行うために３．２μｇの結果として生じた４Ｃテンプレートを用いて、そのうちの３２個の反応（各々が１００ｎｇ）をプールし、ＭｉｎＥｌｕｔｅＰＣＲＰｕｒｉｆｉｃａｔｉｏｎｋｉｔ（Ｑｉａｇｅｎ）を用いて精製した。１０μｇのＰＣＲ産物を、次に、４～２０％ＴＢＥＰＡＧＥゲル上に流した（ウェル当たり５μｇ）。ゲル上で、２００ｂｐ～６００ｂｐのスメアを切り取り、不要なＰＣＲ産物のバンドを除去した。次に、ＩｌｌｕｍｉｎａＭｉＳｅｑ上の次世代シークエンシングのために、切り取ったゲル片からＤＮＡを抽出した（２ｘ２５０ｂｐ）。

インバースプライマー（ｉｎｖｅｒｓｅｐｒｉｍｅｒ）をビューポイントの概念に従って設計した。関心領域の位置を決めるためにＵＣＳＣゲノムブラウザ［ａｓｓｅｍｂｌｙ：Ｆｅｂ．２００９（ＧＲＣｈ３７／ｈｇ１９）］を用いた。ＨｉｎｄＩＩＩおよびＤｐｎＩＩトラックの追加の際に、関心領域に隣接する２つＨｉｎｄＩＩＩ制御部位を同定して、最近接のＨｉｎｄＩＩＩおよびＤｐｎＩＩ制限部位間の配列をビューポイント領域として選択した。この領域に基づいて、デフォルト設定に対する以下のアダプテーション、すなわち、５８℃の最適プライマー融解温度、最低５５℃および最高６０℃；３９および６０％の間のＧＣ含有量とともに、Ｐｒｉｍｅｒ－ＢＬＡＳＴプログラム［ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（ＮＣＢＩ）］を用いて、プライマーの２つの対（アウターおよびネステッド）を設計した。次に、適切なアダプター（Ｎｅｘｔｅｒａ（登録商標）ＩｎｄｅｘＫｉｔ－ＰＣＲプライマー，Ｎｅｘｔｅｒａ（登録商標）トランスポサーゼ配列）およびインデックス配列をネステッドプライマー対に追加した。この研究に用いたアウターおよびネステッドプライマーをそれぞれ表５および表４に提示する。

シークエンシングリードの５’末端におけるプライマー配列をＴａｇＤｕｓｔ２を用いてトリミングして、Ｂｏｗｔｉｅ２（２．２．６）を用いて参照ゲノム（ｈｇ１９）へマッピングした。アラインされないリードは、それらを参照ゲノムへリアラインする前に、最初の５０個の塩基対でトリミングした。ＭＡＰＱ≧３０によるユニークなマッピングリードのみを下流解析に用いた。非重複ウィンドウ・アプローチ（ウィンドウサイズ＝５ｋｂ）を使用したｒ３Ｃｓｅｑを用いて、統計学的に有意な相互作用（Ｑ＜０．０５，ＦＤＲ）を検出した。Ｂａｓｉｃ４ＣＳｅｑを用いて４Ｃデータのシグナル・プロットを生成した。ＤＮＡ増幅領域内で検出した相互作用は、除外した。次に、相互作用と重複するプロモーター（ＧＥＮＣＯＤＥｖ１９からのアノテートされた転写開始点から＋／－２．５ｋｂ）を用いて、相互作用を遺伝子に対してマッピングした。

ＣＲＩＳＰＲ／Ｃａｓ９エンハンサー欠失
ＦｅｎｇＺｈａｎｇ研究室によって作成されたオンラインソフトウェア（ｈｔｔｐ：／／ｔｏｏｌｓ．ｇｅｎｏｍｅ－ｅｎｇｉｎｅｅｒｉｎｇ．ｏｒｇ）を用いてＣＲＩＳＰＲｓｇＲＮＡ標的検索を行った。ｓｇＲＮＡ対は、欠失について同定したエンハンサーに隣接する配列を標的とするように設計した。端的には、エンハンサーの５’末端の１００ｂｐ上流／２０ｂｐ下流に対応する配列、およびエンハンサーの３’末端の２０ｂｐ上流／１００ｂｐ下流に対応する配列を検索のために用いた。コード領域オフターゲット（ｏｆｆ－ｔａｒｇｅｔ）予測の最低レベルとのトップヒットを選んだ。ｓｇＲＮＡをｐＳｐＣａｓ９（ＢＢ）－２Ａ－ＧＦＰまたは－Ｐｕｒｏベクター（Ａｄｄｇｅｎｅ）へクローニングした。端的には、オリゴヌクレオチドの対をＣＲＩＳＰＲ標的ごとに設計して、ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ，Ｉｎｃ．から調達した。次に、クローニングを容易にするために両側にオーバーハングを含むＤＮＡデューレックスを形成すべくオリゴヌクレオチド対をアニールした。個々のエンハンサーの５’末端を標的とするために用いるガイドＲＮＡをＢｂｓＩ－消化ｐＳｐＣａｓ９（ＢＢ）－２Ａ－ＧＦＰベクター中へクローニングし、一方で各エンハンサーの３’末端を標的とするｓｇＲＮＡをＢｂｓＩ消化ｐＳｐＣａｓ９（ＢＢ）－２Ａ－Ｐｕｒｏベクター中へクローニングした。インサートおよびベクターをＴ４ＤＮＡリガーゼ（ニュー・イングランド・バイオラボ）を用いて連結した。ＤＨ５α細胞をライゲーション産物により形質転換して、アンピシリンを補充したＬＢ寒天上に蒔いた。コロニーを選び取り、培養して、ＷｉｚａｒｄＰｌｕｓＳＶＭｉｎｉｐｒｅｐｓＤＮＡＰｕｒｉｆｉｃａｔｉｏｎＳｙｓｔｅｍ（プロメガ）を用いてプラスミドを抽出した。サンガーシークエンシングを行うことによってプラスミドの配列を確認した。これらの実験に用いたオリゴヌクレオチドを表６にリストする。

ＳＮＵ１６およびＯＣＵＭ－１細胞を１０％ＦＢＳ、１×Ｐ／Ｓおよび０．５×ＮＥＡＡを補充したＲＰＭＩ中で８０～９０％のコンフルエンスへ成長させた。細胞を収集し、遠心沈殿させて、３７度で５分間Ｔｙｐｓｉｎを用いて処理し、単一細胞の懸濁物を達成するためにピペッティングによって再懸濁した。細胞数をカウントし、細胞をＲｅｓｕｓｐｅｎｓｉｏｎ（再懸濁）バッファー（Ｒ）中に１×１０^７細胞／ｍｌで再懸濁する前に１×ＰＢＳで一回洗浄した。１ｍｌのＲｅｓｕｓｐｅｎｓｉｏｎバッファー中の１×１０^７細胞ごとに、２５μｇのｐＣａｓ９－ＧＦＰ－ｓｇＲＮＡおよび２５μｇのｐＣａｓ９－Ｐｕｒｏ－ｓｇＲＮＡプラスミドをＳＮＵ１６またはＯＣＵＭ－１細胞と混合した。３ｍｌのＥｌｅｃｔｒｏｌｙｔｉｃＢｕｆｆｅｒ（電解質バッファー）（Ｅ２）を含んだＮｅｏｎチューブ中で１００μｌのＮｅｏｎピペットを用いて１００μｌの各細胞懸濁物のエレクトロポレーションを行った。エレクトロポレーション条件は、Ｐｕｌｓｅ，Ｖ１０５０，ＭＳ３０，Ｎｕｍｂｅｒ２であった。エレクトロポレーション後に、１０％ＦＢＳ、１×Ｐ／Ｓおよび０．５×ＮＥＡＡを補充した８ｍｌのＲＰＭＩ上に細胞を蒔いた。最初のトランスフェクションの２４時間後に、細胞を１０μｇのピュロマイシンで４８時間処理して、残りのＧＦＰ陽性細胞をＦＡＣＳを用いてソートした。次に、残りの生存細胞（ＧＦＰ陽性およびピュロマイシン耐性の両方）をノックアウト効率を推定するためにｑＰＣＲを用いて引き続き解析した。

ＣＲＩＳＰＲ／Ｃａｓ９標的細胞における個々のエンハンサーの欠失の効率を判定するために、定量的ＰＣＲ（ｑＰＣＲ：ＱｕａｎｔｉｔａｔｉｖｅＰＣＲ）を行った。標的および（プールした）非標的細胞のゲノムＤＮＡをＡｌｌＰｒｅｐＤＮＡＭｉｃｒｏＫｉｔ（ＱＩＡＧＥＮ）を用いて抽出し、ＣＦＸ９６ＴｏｕｃｈリアルタイムＰＣＲ検出システム（バイオ・ラッドラボラトリーズ社）上でＫＡＰＡＳＹＢＲＦＡＳＴｑＰＣＲＭａｓｔｅｒＭｉｘ（ＫａｐａＢｉｏｓｙｓｔｅｍｓ）を用いてテクニカルトリプリケート（ｔｅｃｈｎｉｃａｌｔｒｉｐｌｉｃａｔｅｓ）でｑＰＣＲに供した。これらの反応に用いたプライマーを表６にリストする（それらの名前に「Ｉｎｔ」が付いたプライマーをこの目的に用いた）。ＧＡＰＤＨ遺伝子に対して正規化して非標的化細胞と比較した、比較ＣＴ（ΔΔＣＴ）法を用いてゲノムＤＮＡ試料中に存在する特異的標的化領域の相対量を算出した。

前述のプロトコルを用いて、ソートした細胞からゲノムＤＮＡを抽出した。端的には、細胞を０．５×Ｄｉｒｅｃｔ－Ｌｙｓｅバッファー（１０ｍＭＴｒｉｓｐＨ８．０，２．５ｍＭＥＤＴＡ，０．２ＭＮａＣｌ，０．１５％ＳＤＳ，０．３％Ｔｗｅｅｎ－２０）中で粉砕して、６５℃３０秒間、８℃３０秒間、６５℃１．５分間、９７℃３分間、８℃１分間、６５℃３分間、９７℃１分間、６５℃１分間、および８０℃１０分間の加熱冷却プログラムに供した。その後、ライセートを水中でおよそ４倍に希釈し、ＴａｑＤＮＡポリメラーゼ（ライフテクノロジーズ）を用いて２０μｌのＰＣＲ反応を行うために３μｌの稀釈したライセートを用いた。用いたプライマーは、表６中にある（エンハンサーごとに「５’Ｆ」および「３’Ｒ」のプライマー対）。

遺伝子発現レベルを測定するためのＲＴ－ｑＰＣＲ
ＧＦＰ陽性細胞に対して細胞をＦＡＣＳソートし、ＡｌｌＰｒｅｐＤＮＡ／ＲＮＡＭｉｃｒｏＫｉｔ（ＱＩＡＧＥＮ）を用いて細胞からすべてのＲＮＡを抽出した。ｉＳｃｒｉｐｔＳｅｌｅｃｔｃＤＮＡＳｙｎｔｈｅｓｉｓＫｉｔ（バイオ・ラッド）をランダムプライマーとともに用いて、プールした細胞に対して逆転写を行った。ＣＦＸ３８４ＴｏｕｃｈリアルタイムＰＣＲ解析システム（バイオ・ラッド）上でＴａｑＭａｎＧｅｎｅＥｘｐｒｅｓｓｉｏｎＭａｓｔｅｒＭｉｘおよびＴａｑＭａｎプローブ（アプライドバイオシステムズ）を用いてｑＰＣＲを実施した。すべてのｑＰＣＲ実験をトリプリケートで実行し、ｍＲＮＡレベルを判定するために平均値を用いた。参照遺伝子としてＧＡＰＤＨおよび式２－ΔΔＣＴを用いた比較ＣＴ法を利用して相対的定量化を行った。

コピー数変化およびＤＮＡメチル化
胃腫瘍および対応する正常胃組織からのゲノムＤＮＡをＡｆｆｙｍｅｔｒｉｘＳＮＰ６．０アレイ上でハイブリダイズした。（Ａｆｆｙｍｅｔｒｉｘ，サンタクララ，カリフォルニア，米国）。．ＣＥＬフォーマットのデータを以下の順序で処理した、（１）正規化：ＡｆｆｙｍｅｔｒｉｘＧｅｎｏｔｙｐｉｎｇＣｏｎｓｏｌｅ４．２を用いて、生の．ＣＥＬファイルを処理した。ハイブリダイゼーション・バッチによる正常胃組織のＳＮＰ６．０プロファイルから参照モデルを作成した。１次正常試料からの参照モデルを用いて、細胞株および１次腫瘍試料におけるコピー数の変化を判定した。（２）セグメンテーション：ＤＮＡｃｏｐｙＲパッケージに実装されたｃｉｒｃｕｌａｒｂｉｎａｒｙｓｅｇｍｅｎｔａｔｉｏｎ（ＣＢＳ）アルゴリズムを用いて、コピー数のセグメンテーション・データを生成した。変化点を検出するためのｐ値カットオフが０．０１、順列数が１０，０００であった。コピー数増加および欠失領域を、それぞれ、平均対数比＞０．６および＜－１．０を示すために定義した。ＤＮＡメチル化レベルをアッセイするために、さらにＩｌｌｕｍｉｎａＨｕｍａｎＭｅｔｈｙｌａｔｉｏｎ４５０（ＨＭ４５０）ＩｎｆｉｎｉｕｍＤＮＡメチル化アレイを用いた。ｍｅｔｈｙｌｕｍｉＲＢｉｏＣｏｎｄｕｃｔｏｒパッケージを用いて、メチル化β値を算出し、バックグラウンドを補正した。ＢＭＩＱ法（Ｒにおけるｗａｔｅｒｍｅｌｏｎパッケージ）を用いて正規化を行った。

ＲＮＡｓｅｑおよび解析
すべてのＲＮＡをＱｉａｇｅｎＲＮｅａｓｙＭｉｎｉキットを用いて抽出した。ＲＮＡ－ｓｅｑライブラリを、製造業者の使用説明書に従って、ＩｌｌｕｍｉｎａＳｔｒａｎｄｅｄＴｏｔａｌＲＮＡＳａｍｐｌｅＰｒｅｐＫｉｔｖ２（イルミナ，サンディエゴ，カリフォルニア，米国）、Ｒｉｂｏ－ＺｅｒｏＧｏｌｄオプション（Ｅｐｉｃｅｎｔｒｅ，マジソン，ウィスコンシン，米国）および１μｇトータルＲＮＡを用いて構築した。完成したライブラリをＡｇｉｌｅｎｔＢｉｏａｎａｌｙｚｅｒ（アジレント・テクノロジー，パロアルト，カリフォルニア）を用いて検証し、ＩｌｌｕｍｉｎａＣｌｕｓｔｅｒＳｔａｔｉｏｎを介してＩｌｌｕｍｉｎａフローセルへ適用した。ペアードエンド１０１ｂｐリードオプションを用いてシークエンシングを行った。ＴｏｐＨａｔ２－２．０．１２（デフォルト・パラメータおよび－－ｌｉｂｒａｒｙ－ｔｙｐｅｆｒ－ｆｉｒｓｔｓｔｒａｎｄ）を用いて、ＲＮＡ－ｓｅｑリードをヒトゲノム（ｈｇ１９）へアラインした。マッピングリードの塩基配列ごとの品質および配列ごとの品質スコアをＦａｓｔＱＣバージョン０．１０．１（ｈｔｔｐ：／／ｗｗｗ．ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．ｂａｂｒａｈａｍ．ａｃ．ｕｋ／ｐｒｏｊｅｃｔｓ／ｆａｓｔｑｃ／）を用いて評価した。遺伝子レベルにおける転写物存在量をＣｕｆｆｌｉｎｋｓによって推定した。ゼロより大きい変動を示す１次サンプルからの遺伝子発現をＣｏｍＢａｔを用いて潜在的なバッチ効果に対して補正した。遺伝子発現値は、ＦＰＫＭ単位で測定した。群間の差次的な発現を少なくとも２倍変化した発現および０．５ＦＰＫＭの絶対値差分を示す遺伝子として同定した。

生存解析
ｋ－ｍｅｄｏｉｄｓアプローチを用いて７つの独立した研究からのＧＣ試料をクラスター化した。すべての７つの研究において発現値をもつ遺伝子のみを解析に用いた。アウトカム・メトリック（ｏｕｔｃｏｍｅｍｅｔｒｉｃ）として全生存期間を用いたカプランマイヤー生存解析を採用した。カプランマイヤー曲線の有意性を評価するためにログランク検定を用いた。コックス回帰を用いて、年齢、腫瘍段階、Ｌａｕｒｅｎの組織学的サブタイプおよび地域性（アジア人対非アジア人）のような、追加変数を伴う多変量解析を行った。

疾患関連ＳＮＰ解析
形質関連ＳＮＰをゲノムワイド関連研究（２０１５年８月２７日）のＵＣＳＣブラウザからダウンロードした。この研究のために、本発明者らは、非コード領域で発生するＳＮＰに焦点を合わせて、コード領域内のＳＮＰを除外した。各形質／疾患からのＳＮＰと体細胞予測スーパーエンハンサーとの間の重複をＢＥＤｔｏｏｌｓ‘ｉｎｔｅｒｓｅｃｔ（交差）’を用いて計算し（ｎＧＷＡＳ）、ｎＧＷＡＳを予測スーパーエンハンサーの外部の疾患関連ＳＮＰの総数（ｎＧＷＡＳ’）に対して比較した。追加の対照として、一般に用いられる２つのＳＮＰアレイ（ＩｌｌｕｍｉｎａＨｕｍａｎＨａｐ５５０およびＡｆｆｙｍｅｔｒｉｘＳＮＰ６）からのすべてのＳＮＰのセットを用いて、「ＳＮＰバックグラウンド」モデルを作成した。予測スーパーエンハンサーと重複するＳＮＰバックグラウンドからのＳＮＰの数を算出して（ｎＢａｃｋｇｒｏｕｎｄ）、予測スーパーエンハンサーの外部のバックグラウンドＳＮＰの総数（ｎＢａｃｋｇｒｏｕｎｄ’）に対して比較した。予測スーパーエンハンサーにおける正常ＳＮＰの比をｎＢａｃｋｇｒｏｕｎｄ／ｎＢａｃｋｇｒｏｕｎｄ’として計算した。予測スーパーエンハンサーにおける疾患関連ＳＮＰ数の増加がこれらの領域におけるＳＮＰの高出現率と関連付けられると予想すると、本発明者らの帰無仮説は、結果として、疾患関連ＳＮＰの比と正常ＳＮＰの比（濃縮比）との間に何も差がないということである。統計学的に有意と見做される濃縮ｐ値＜０．０１を用いて、カイ二乗検定を実施した。リスク関連ＳＮＰとヒストン修飾との間の関係を理解するために、本研究は、少なくとも２つの独立した研究において疾患と関連付けられるがわかった胃腸疾患（例えば、潰瘍性大腸炎および結腸直腸癌）で検証されたＳＮＰを同定した。ＧＡＴＫＵｎｉｆｉｅｄＧｅｎｏｔｙｐｅｒを用いて、試料を疾患関連ＳＮＰの存在に基づいて２つの群に分類した。疾患関連ＳＮＰ有りまたは無しの試料において腫瘍と、対応する正常との間でＨ３Ｋ２７ａｃシグナルの差を比較した。

転写因結合モチーフ解析
本研究は、ＲｅＭａｐデータベースを用いて、体細胞増加予測スーパーエンハンサーおよび非変化予測スーパーエンハンサーにおける転写因子の濃縮を調べた。予測スーパーエンハンサーと少なくとも６０％が重複した転写因子部位をカウントして、上位１０個の最も濃縮された転写因子のランクを比較した。転写因子の結合密度は、領域の１００万塩基対（Ｍｂｐ）の単位のトータルサイズで除した、その領域で検出した全結合部位として計算した。ＣＤＸ２については、他の転写因子の近接した結合を予測するために、ＨＯＭＥＲをデフォルト・パラメータとともに用いて反復的に増加する体細胞予測スーパーエンハンサーにおいてＣＤＸ２結合部位を検査した。ＨＯＭＥＲ出力から同定した上位２０個の転写因子を発現相関解析のために用いた。加えて、ＰＳｃａｎＣｈＩＰをＪＡＳＰＡＲ２０１６とともに用いてＣＤＸ２共結合モチーフも同定した。ＣＤＸ２と潜在的な共結合パートナーとの間の発現相関（スピアマンの相関）を評価した。

ｓｉＲＮＡトランスフェクション
製造業者の使用説明書に従って、Ｄｈａｒｍａｆｅｃｔ１トランスフェクト剤を用い、６ウェルプレートにおいて細胞（２×１０^５）に５０ｎＭでトランスフェクトするために、ＯＮ－ＴＡＲＧＥＴｐｌｕｓＨｕｍａｎｓｉＲＮＡＳＭＡＲＴｐｏｏｌｓ（ＨＮＦ４αおよびＣＤＸ２）、ｉｎｄｉｖｉｄｕａｌＯＮ－ＴＡＲＧＥＴｐｌｕｓＨｕｍａｎｉｎｄｉｖｉｄｕａｌｓｉＲＮＡｓ（ＨＮＦ４α）ならびにＯＮ－ＴＡＲＧＥＴｐｌｕｓＮｏｎ－ｔａｒｇｅｔｉｎｇｓｉＲＮＡ対照（Ｄｈａｒｍａｃｏｎ／サーモフィッシャーサイエンティフィック）を用いた。定量的ＲＴ－ＰＣＲおよび／またはウエスタンブロット解析を用いて、７２時間のＲＮＡｉ処理後のノックダウン効率を検査した（図２３）。

ウエスタンブロッティング
細胞（２×１０^５）をＲＩＰＡバッファー（シグマ）中に収集して、氷上で１０分間溶解させた。ＰｉｅｒｃｅＢＣＡタンパク質アッセイ（サーモサイエンティフィック）を用いて上清の濃度を測定した。ライセートを探索するために、ＣＤＸ２（１：５００；ＭＵ３９２Ａ－ＵＣ，Ｂｉｏｇｅｎｅｘ），ＨＮＦ４α（１：１０００；ｓｃ－８９８７，ＳａｎｔａＣｒｕｚＢｉｏｔｅｃｈｎｏｌｏｇｙ）およびＧＡＰＤＨ（１：３０００；６０００４－１－Ｉｇ，ＰｒｏｔｅｉｎｔｅｃｈＧｒｏｕｐ）抗体を用いた。

定量的ＲＴ－ＰＣＲ
すべてのＲＮＡをＲＮｅａｓｙＭｉｎｉＫｉｔ（Ｑｉａｇｅｎ）を用いて単離して、ＤＮＡをＲＮａｓｅ－ＦｒｅｅＤＮａｓｅＳｅｔ（Ｑｉａｇｅｎ）を用いて除去した。ＳｕｐｅｒｓｃｒｉｐｔＩＩＩＦｉｒｓｔＳｔｒａｎｄＳｙｎｔｈｅｓｉｓＳｙｓｔｅｍ（Ｉｎｖｉｔｒｏｇｅｎ）を用いて２ｕｇのＲＮＡを逆転写し、相補的ＤＮＡをＳＹＢＲＧｒｅｅｎＰＣＲＭａｓｔｅｒＭｉｘ（アプライドバイオシステムズ）を用いて増幅した。倍率変化をＧＡＰＤＨへ正規化した。プライマー配列は、次の通りである。ＨＮＦ４α：Ｆ１－５’ＧＴＧＣＧＧＡＡＧＡＡＣＣＡＣＡＴＧＴＡＣＴＣ３’（ＳＥＱＩＤＮＯ：１４３）、Ｒ１－５’ＣＧＧＡＡＧＣＡＴＴＴＣＴＴＧＡＧＣＣＴＧ３’（ＳＥＱＩＤＮＯ：１４４）、Ｆ２－５’ＣＴＧＣＡＧＧＣＴＣＡＡＧＡＡＡＴＧＣＴＴ３’（ＳＥＱＩＤＮＯ：１４５）、Ｒ２－５’ＴＣＡＴＴＣＴＧＧＡＣＧＧＣＴＴＣＣＴＴ３’（ＳＥＱＩＤＮＯ：１４６）、Ｆ３－５’ＴＧＴＣＣＣＧＡＣＡＧＡＴＣＡＣＣＴＣ３’（ＳＥＱＩＤＮＯ：１４７）、Ｒ３－５’ＣＡＣＴＣＡＡＣＧＡＧＡＡＣＣＡＧＣＡＧ３’（ＳＥＱＩＤＮＯ：１４８）；ＣＤＸ２：Ｆ１－５’ＧＣＡＧＣＣＡＡＧＴＧＡＡＡＡＣＣＡＧＧ３’（ＳＥＱＩＤＮＯ：１４９）、Ｒ１－５’ＣＣＴＣＣＧＧＡＴＧＧＴＧＡＴＧＴＡＧＣ３’（ＳＥＱＩＤＮＯ：１５０）、Ｆ２－５’ＡＧＴＣＧＣＴＡＣＡＴＣＡＣＣＡＴＣＣＧ３’（ＳＥＱＩＤＮＯ：１５１）、Ｒ２－５’ＴＴＣＣＴＣＴＣＣＴＴＴＧＣＴＣＴＧＣＧ３’（ＳＥＱＩＤＮＯ：１５２）；ＧＡＰＤＨ：Ｆ－５’ＣＣＡＧＧＧＣＴＧＣＴＴＴＴＡＡＣＴＣ３’（ＳＥＱＩＤＮＯ：１５３）、Ｒ－５’ＧＣＴＣＣＣＣＣＣＴＧＣＡＡＡＴＧＡ３’（ＳＥＱＩＤＮＯ：１５４）。

ＣＤＸ２およびＨＮＦ４α ＣｈＩＰ－ｓｅｑおよび解析
細胞を室温において１０分間、１％ホルムアルデヒトで架橋し、０．２Ｍの最終濃度までグリシンを添加することにより停止した。クロマチンを抽出して、５００ｂｐへ超音波処理した。クロマチン免疫沈澱（ＣｈＩＰ）のために、ＣＤＸ２（ＭＵ３９２Ａ－ＵＣ，Ｂｉｏｇｅｎｅｘ）およびＨＮＦ４α（ｓｃ－８９８７，ＳａｎｔａＣｒｕｚＢｉｏｔｅｃｈｎｏｌｏｇｙ）抗体を用いた。ＣｈＩＰのために、製造業者のプロトコル（ニュー・イングランド・バイオラボ）に従ってＣｈＩＰｅｄＤＮＡ（１０ｎｇ）をＤＮＡシークエンシング（ＣｈＩＰ－ｓｅｑ）ライブラリ・コンストラクション（ｌｉｂｒａｒｙｃｏｎｓｔｒｕｃｔｉｏｎ）とともに用いた。ＣｈＩＰ－ｓｅｑピーク抽出（ｐｅａｋｃａｌｌｉｎｇ）を正規化するために、免疫沈降前の細胞からの入力ＤＮＡを用いた。シークエンシング前に、陽性および陰性対照ＣｈＩＰ領域が線形範囲内で増幅したことを検証するためにｑＰＣＲを用いた。バイオアナライザー（アジレント・エクノロジー）を用いて、ライブラリ試料のサイズ分布をチェックした。腸型およびびまん型ＧＣ（腸型１０個，びまん６個）に特異的な反復的に増加する予測スーパーエンハンサーを比較した最初の解析では、２つのサブタイプ間でＣＤＸ２結合における有意差は何も観測されなかった。しかしながら、ＣＤＸ２発現には同じサブタイプの個々の腫瘍間で高いサブタイプ内の変動性があることをより深い解析が明らかにし、これは、ＣＤＸ２発現が腸サブタイプＧＣと絶対的に関連付けられるわけではないというこれまでの報告と一貫性がある。従って、この研究は、ＧＣをそれらの個々のＣＤＸ２発現レベルによって順序付けて調べる、相補的な解析を行った。次に、高（ｎ＝８）および低（ｎ＝８）ＣＤＸ２発現を示したＧＣ試料において同定した反復性体細胞増加予測スーパーエンハンサーにおけるＣＤＸ２結合密度を計算した。差次的な結合シグナル解析は、１次試料において体細胞増加を示すか、もしくは何も変化を示さず、ＯＣＵＭ－１またはＳＮＵ１６細胞株においても検出されたそれらの予測スーパーエンハンサーに跨る２００ビンについてＣＤＸ２およびＨＮＦ４αに対する結合シグナルを計算した。シグナルは、ＲＰＫＭ単位で測定した。Ｈ３Ｋ２７ａｃ強度に対する転写因子（ＴＦ）ノックダウンの効果を推定するために、独立した野生型（ＷＴ：ｗｉｌｄｔｙｐｅ）試料間で観測したＨ３Ｋ２７ａｃシグナル変動を備える内部標準を定義した。ＴＦサイレンスした（ｓｉＣＤＸ２、ｓｉＨＮＦ４α、およびダブルＴＦ）試料に対するＷＴ試料間の差を測定し、次に、それらの差をこのバックグラウンド変動に対して比較した。バックグラウンド変動の差＞９９％のサブ領域をＨ３Ｋ２７ａｃ枯渇と称し、一方でバックグラウンド変動の差＜１％をＨ３Ｋ２７ａｃ増加と称した。予測スーパーエンハンサーに対応するＨ３Ｋ２７ａｃ枯渇サブ領域の統計学的な濃縮をフィシャーの片側正確検定を用いて実施した。差次的な領域と、近接するＣＤＸ２／ＨＮＦ４α結合部位へのそれらの距離との関係を調べるために、領域をそれらの距離分布に基づいて３つのカテゴリー（近い、中間、遠位）にさらに分離した。Ｈ３Ｋ２７ａｃ枯渇サブ領域と、ＣＤＸ２－ＨＮＦ４α共結合部位との間の距離を解析するために、ＣＤＸ２およびＨＮＦ４α頂点間の中点位置を用いた。ＴＦサイレンスした細胞における遺伝子発現と体細胞増加予測スーパーエンハンサーとの間の関連付けを調べるために、本発明者らは、１次試料においてＨ３Ｋ２７ａｃ予測スーパーエンハンサー・シグナルと有意な正の発現相関を示し（ｒ＞０．４；Ｐ＜０．０５；両側ｔ検定）、ＧＣ細胞株においても観測した予測スーパーエンハンサーに連結された遺伝子を選択した。予測スーパーエンハンサー標的遺伝子発現に対する転写因子ノックダウンの有意性を評価するために、順列アプローチを用いた。具体的には、ＴＦサイレンシング後にＨ３Ｋ２７ａｃ枯渇を示す予測スーパーエンハンサーに焦点を合わせて、本発明者らは、遺伝子への実際のスーパーエンハンサーの割り当てを１０，０００回並べ替えた。次に、並べ替えた遺伝子／スーパーエンハンサー・セットにおける下方制御された遺伝子の数が、実際の遺伝子／スーパーエンハンサー・セットにおける下方制御された遺伝子の実験的に観測した数を超過する回数をカウントすることによって、経験的なＰ値を導出した。

データ利用可能性
本研究の間に発生させたヒストンＮａｎｏＣｈＩＰ－ｓｅｑ（ＧＳＥ７６１５３およびＧＳＥ７５８９８）、ＳＮＰアレイ（ＧＳＥ８５４６６）、ＲＮＡ－ｓｅｑ（ＧＳＥ８５４６５）およびＤＮＡメチル化データ（ＧＳＥ８５４６４）は、ＧｅｎｅＥｘｐｒｅｓｓｉｏｎＯｍｎｉｂｕｓに寄託した。先に寄託し、この研究に用いたヒストンＣｈＩＰ－ｓｅｑ（ＧＳＥ５１７７６およびＧＳＥ７５５９５）ならびにＳＮＰアレイ（ＧＳＥ３１１６８およびＧＳＥ３６１３８）は、ＧｅｎｅＥｘｐｒｅｓｓｉｏｎＯｍｎｉｂｕｓにおいて入手可能である。エピゲノムロードマップからの正常胃組織のクロマチンアクセシビリティ・プロファイルは、ＧｅｎｅＥｘｐｒｅｓｓｉｏｎＯｍｎｉｂｕｓ（ＧＳＭ１０２７３２５、ＧＳＭ１０２７３２０）から得た。この研究において解析したＲＮＡＰＩＩＣｈＩＡ－ＰＥＴデータは、ｅｎｃｏｄｅｐｒｏｊｅｃｔ．ｏｒｇおよびＧｅｎｅＥｘｐｒｅｓｓｉｏｎＯｍｎｉｂｕｓ（ＧＳＥ７２８１６）から得た。

結果
ＧＣ細胞株の遠位予測エンハンサーの景観
Ｎａｎｏ－ＣｈＩＰｓｅｑを用いて、１９個の１次ＧＣ、１９個の対応する正常胃組織、および複数のヒストンＨ３修飾（Ｈ３Ｋ２７ａｃ、Ｈ３Ｋ４ｍｅ３、Ｈ３Ｋ４ｍｅ１）をカバーする１１個のＧＣ細胞株から１１０個のクロマチン・プロファイル（プロファイル当たり平均約３．３×１０^７リード）を発生させた。１次ＧＣの臨床情報および分子分類を表８に、シークエンシング統計データを表１に、ＧＣ株に関する臨床病理学的詳細を表９に提示する。このシリーズは、腺癌を形成する１０個の腺（５３％、腸型）、高浸潤性孤立細胞をもつ６個の試料（３２％、びまん型）および混合組織の３個のＧＣ試料（１５％）を含んだ。腫瘍（ｎ＝１２）のうちの６０％超がステージ３以上（ＡＪＣＣ第７版）であった。マッピング品質フィルターにおける変更、生物学的レプリケートおよびプロモーターＣｈＩＰ濃縮の解析、ならびに品質管理ソフトウェアＣＨＡＮＣＥ（ＣＨｉｐ－ｓｅｑＡＮａｌｙｔｉｃｓａｎｄＣｏｎｆｉｄｅｎｃｅＥｓｔｉｍａｔｉｏｎ）による評価を含めて、Ｎａｎｏ－ＣｈＩＰｓｅｑデータの広範な品質管理解析を行った。マッピング閾値の厳しさを（ＭＡＰＱ≧１０から２０へ）増加させても、マッピング統計を感知できるほど変化させることはなく－全マッピングリードのうちの９０％超が維持されて、それぞれ、ＣｈＩＰ濃縮ピークのうちの８５％および予測エンハンサーのうちの９８％を再発見した（図７）。Ｎａｎｏ－ＣｈＩＰｓｅｑによって発生させたＫＡＴＯ－ＩＩＩ細胞の生物学的レプリケート間の、さらに従来のＣｈＩＰ－ｓｅｑによって発生させた独立したＫＡＴＯ－ＩＩＩＨ３Ｋ２７ａｃデータに対する、ヒストンピークの一致は、高い再現性（約８５％および約９０％の重複）（図８）を確認した。高発現タンパク質コード遺伝子と関連付けられた１，０００個のプロモーターにおける入力および入力で補正したＨ３Ｋ２７ａｃならびにＨ３Ｋ４ｍｅ３シグナルの比較は、それぞれ、５０個のうちの４８個（９６％）のＨ３Ｋ２７ａｃおよび４２個のうちの４２個（１００％）のＨ３Ｋ４ｍｅ３ライブラリにおける好結果の濃縮を明らかにした。ＣｈＩＰ濃縮のＣＨＡＮＣＥ解析は、特に（プロモーターにおいて枯渇した）Ｈ３Ｋ４ｍｅ１について、試料の大多数（８５％）が好結果の濃縮を示すことを明らかにした（方法）。これらの結果は、Ｎａｎｏ－ＣｈＩＰｓｅｑコホートの良好な技術的品質を実証する。Ｎａｎｏ－ＣｈＩＰｓｅｑに加えて、さらに、ＤＮＡメチル化解析（ＩｎｆｉｎｉｕｍＨｕｍａｎＭｅｔｈｙｌａｔｉｏｎ４５０ＫＢｅａｄＣｈｉｐアレイ）、コピー数解析（ＡｆｆｙｍｅｔｒｉｘＳＮＰアレイ）およびＩｌｌｕｍｉｎａＲＮＡ－シークエンシングのために試料を処理した。

一次組織における間質性汚染がゲノム結果に影響を及ぼしかねないことをこれまでの研究が示し、細胞株が本質的に純粋に上皮性であり、最も高いデータ品質を有することから、ＧＣにおける癌関連遠位エンハンサーを発見するための発見コホートとしてＧＣ細胞株を選んだ。本研究は、複数のＧＣ試料中に存在し、個別化された細胞株の特徴と関連付けられた「プライベートな」エピジェネティック変化の導入を低減する、反復性エピジェネティック変化にも焦点を合わせる。第１に、活性なプロモーターおよびエンハンサーをマークすることがこれまでに示されたＨ３Ｋ２７ａｃシグナルに基づいて、ゲノムワイド・シス調節エレメントをマッピングした。エンハンサーエレメントを濃縮するために、本研究は、既知のアノテートされた転写開始点（図１ａ）から遠く離れた位置にある（ＴＳＳ；＞２．５ｋｂ）Ｈ３Ｋ２７ａｃシグナルに焦点を合わせた。本研究は、次に、集約したＨ３Ｋ４ｍｅ１およびＨ３Ｋ４ｍｅ３データを用い、高Ｈ３Ｋ４ｍｅ３／Ｈ３Ｋ４ｍｅ１対数比（＞２．４）を示す予測エンハンサーを解析から除外して、エンハンサー予測をさらに精緻化した。このアプローチを用いて、ＧＣ株において３，０１７～１４，３３８個の推定上の遠位エンハンサーを同定し（図１ｂ）、平均ゲノムフットプリントは、２５Ｍｂ／株であった。

合計すると、本研究は、約１４０Ｍｂまたはヒトゲノムのおよそ５％に及ぶ、３６，９７３個の予測遠位エンハンサー領域を検出した。予測エンハンサーは、二峰性Ｈ３Ｋ２７ａｃシグナル分布（図１ｂ）を示し、Ｈ３Ｋ４ｍｅ３が枯渇し、Ｈ３Ｋ４ｍｅ１シグナル（図１ｃおよび図９）が濃縮された。これらのＨ３Ｋ２７ａｃ濃縮領域の目視比較は、いくつかの領域が複数の株において活性（「反復性」）であり、一方で他の領域は、１つの株のみで活性（「プライベート」）であることを明らかにした。予測エンハンサーのうちのおよそ４７％が反復性であり、少なくとも２つのＧＣ細胞株において活性を示した（図１ｄ）。反復性エンハンサーのパーセンテージは、プロモーターと比較して著しくより低く（６７％対４７％，Ｐ＜２．２×１０^－１６，片側比率検定）、エンハンサー活性が複数のＧＣ細胞株にわたって非常に可変的であることを示す。

予測エンハンサーを公的に利用可能なエピゲノム・データセットを統合することによって検証した。エピゲノムロードマップからの正常胃組織のＤＮａｓｅＩ高感受性データを用いると、予測エンハンサーではＤＨＳシグナル分布（ｌｏｇ変換したＲＰＫＭ）がランダムに選択した領域より著しくより大きく（Ｐ＜２．２×１０^－１６，ウェルチの片側ｔ検定；図１ｅ，方法）、予測エンハンサーがオープンクロマチンと関連付けられることを示すことがわかった。９個の異なる組織および細胞カテゴリーのＤＨＳおよびＨ３Ｋ２７ａｃデータに対して比較したときに、予測エンハンサーは、消化および上皮組織（胎児の腸、胃、および小腸）からのＤＨＳ陽性およびＨ３Ｋ２７ａｃ陽性領域と最も高い重複を示し、血液またはＴ細胞のような非上皮組織タイプとは別個であった（図１ｆ）。それらの調節潜在力を支持して、予測エンハンサーのうちの５４％（ｎ＝２０，１２７）がＥＰ３００結合部位と関連付けられ（図１ｇ；Ｐ＜０.００１、経験的検定）、９２％が転写因子（ＴＦ）結合部位と関連付けられた。ＤＮＡ配列レベルでは、予測エンハンサー配列のうちの６３％が進化的に保存されていた（図１ｈ；Ｐ＜０.０００１、経験的検定）。

スーパーエンハンサーは、癌シグネチャー（ｃａｎｃｅｒｓｉｇｎａｔｕｒｅ）中に濃縮される
ＲＯＳＥアルゴリズムを用いて、全体として３，７５９個の非冗長予測スーパーエンハンサーを包含する、ＧＣ株当たり１３３～１，３１８個の予測スーパーエンハンサーを同定した（図２ａ）。従って、ＧＣ細胞株の予測エンハンサーのうちの約１０％が予測スーパーエンハンサー活性と関連付けられると推定される。予測典型エンハンサーと比較して、予測スーパーエンハンサーは、反復性が著しくより強い傾向を示し（図２ｂ；片側比率検定，Ｐ＜２．２×１０^－１６）、３，３４５個の予測スーパーエンハンサーが少なくとも２つのＧＣ細胞株において活性であった。注目したのは、既知のタンパク質コードＧＣ癌遺伝子（例えば、ＭＹＣおよびＫＬＦ５；図１０ａ）と関連付けられた予測スーパーエンハンサー、さらに、長鎖非コードＲＮＡ（ｌｎｃＲＮＡ：ｌｏｎｇ－ｎｏｎｃｏｄｉｎｇＲＮＡ）をコードする、ＭＡＬＡＴ１遺伝子座（図２ｃ）のような非タンパク質コード遺伝子領域にある予測スーパーエンハンサーがＧＣ増殖を促進することが最近示されたことである。

最近接の活性ＴＳＳを示す領域（プロモーターにおいて、アノテートされたＴＳＳの５００ｂｐ以内におけるＨ３Ｋ２７ａｃ濃縮として定義される）に基づいて、予測スーパーエンハンサーを標的遺伝子へ割り当てた。予測スーパーエンハンサー／遺伝子相互作用のうちの５３％のみが最も近い近位遺伝子（ｃｌｏｓｅｓｔｐｒｏｘｉｍａｌｇｅｎｅ）を伴った（方法を参照、平均距離７６ｋｂ）。予測スーパーエンハンサー／遺伝子の割り当ては、３つの直交する相互作用データセット：（ｉ）ＰｒｅＳＴＩＧＥによって予測された所定の相互作用、（ｉｉ）ＧＲＥＡＴ、および（ｉｉｉ）公表されたＲＮＡＰＩＩＣｈＩＰ－ＰＥＴデータ（ｅｎｃｏｄｅｐｒｏｊｅｃｔ．ｏｒｇ，ＧＳＥ７２８１６）を用いて検証した。タンパク質コード遺伝子との２，６７７個の予測相互作用のうちで、８８％がこれら３つのデータセットのうちの少なくとも１つによって支持された（図１１）。ｉ）～ｉｉｉ）における後者の検証データのための生体試料が胃組織を含まなかったので（後続セクションを参照）、この数は、下限値であると思われる。予測スーパーエンハンサーと関連付けられた生物学的テーマを理解するために、本研究は、ＧＯｒｉｌｌａパスウェイ解析を適用し、癌発生とおそらく関係する生物学的プロセス、例えば、シグナル伝達、プログラム細胞死、および細胞増殖が予測スーパーエンハンサー連結遺伝子と強く関連付けられることを見出した（ｐ値６．７×１０^－２２～２．３×１０^－１３，ＧＯｒｉｌｌａによる超幾何検定）（図２ｄ）。これらのプロセスの多く（例えば、プログラム細胞死、細胞増殖の調節）は、反復性予測スーパーエンハンサーをＧＲＥＡＴによって解析したときに有意に関連付けられたままであり、これらの濃縮は、大きい遺伝子間領域が隣接した遺伝子に対するバイアスには起因しないことを示した（図１２）。上位の予測典型エンハンサーに連結された遺伝子を採用した同様の解析は、より少ない度合いの濃縮をもたらした（図２ｄ）。予測スーパーエンハンサー関連遺伝子は、癌遺伝子についても濃縮された（Ｐ＝１．７×１０^－８，フィシャーの片側正確検定）。遺伝子発現へ相関付けられたときには、反復性予測スーパーエンハンサーおよび典型エンハンサーと関連付けられた遺伝子がいずれもＲＮＡ発現と有意に相関付けられた（図１０ｂ）。

１次腫瘍におけるスーパーエンハンサーの異質性
どの細胞株の予測スーパーエンハンサーが体細胞変化とも関連付けられるかをインビボで判定するために、本研究は、１９個の１次ＧＣおよび対応する正常胃組織にわたってＨ３Ｋ２７ａｃ濃縮レベルをこれらの領域について比較した。これまでの研究が、限られた標本サイズに起因して、ＧＣの個別的な分子サブタイプの存在を示唆したのに対して、現在の研究は、対応する正常組織と比較して、複数のＧＣ組織中に保存された予測エンハンサーの差に焦点を合わることを選んだ（考察を参照）。解析の前に、公表されたプロファイルに対する相関付け（セクション「エピゲノムロードマップに対する１次胃非悪性試料の比較」を参照）によって、１次胃正常試料が胃上皮を確かに反映していることを確認した。３，７５９個の細胞株の予測スーパーエンハンサーのうちで、３分の２が腫瘍と対応する正常試料との間で差次的な濃縮を示した（図３ａ、表２、以降は体細胞が変化したと称する）。予測スーパーエンハンサーのうちの半数近く（ｎ＝１，７４８；４７％）が２つ以上の１次ＧＣにおいて体細胞増加（腫瘍における２倍超の濃縮，最小０．５ＲＰＫＭの差）を示し、これらの増加した予測スーパーエンハンサーを用いた主成分分析（ＰＣＡ）は、ＧＣと対応する正常組織との間の分離を確認した（図３ｂ）。これらの結果の一貫性を支持して、すべての品質管理基準に合格したそれらの正常／腫瘍（Ｎ／Ｔ）１次対（１４対、前を参照）のみを用いたときに、これらの反復性体細胞増加予測スーパーエンハンサーのうちの圧倒的多数（８５％、１．５超の倍率変化閾値）を再発見した。予想外に、癌細胞株におけるそれらの活性にも係わらず、予測スーパーエンハンサーのうちの実質的な比率（１８％）が、１次ＧＣにおける増加ではなく、むしろ体細胞欠失と関連付けられた（図３ａ）。これらの後者の領域は、１次腫瘍ではエピジェネティックにサイレンスされたが、インビトロ培養の間に細胞株中で再活性化された領域を表すかもしれない可能性がある（図１３ａ）。予測スーパーエンハンサーのうちの１１％（ｎ＝４１６）は、ＧＣおよび正常組織間で変化しないＨ３Ｋ２７ａｃレベルを示し（図３ａ、図１３ｂ）、これらの領域は、癌関連ではないが「ハウスキーピング」または一般的な組織機能に関係することと一貫性があった。最後に、細胞株の予測スーパーエンハンサーのうちの２１％（ｎ＝８０８）は、解析のための１次試料において十分なＨ３Ｋ２７ａｃ濃縮を示さなかった（ＲＰＫＭ＜０．５）（図１３ｃ）。興味深いことに、このクラスは、ＧＣ株における低反復性とも関連付けられた（図３ａ－黒いヒストグラム）。全体として解釈すると、これらの結果は、細胞株に由来する予測スーパーエンハンサーを１次腫瘍および対応する正常対照からのヒストン修飾データを用いて少なくとも３つのカテゴリー－体細胞増加、体細胞欠失、および非変化へさらに下位分類できることを実証する。上位１００個の体細胞予測スーパーエンハンサーのリストを表２に提示する。

それらの生物学的特殊性を支持して、３つのカテゴリーに属する予測スーパーエンハンサーは、インビボで他のエピジェネティックな差も示す。例えば、Ｈ３Ｋ２７ａｃにおける予測スーパーエンハンサーの変化は、Ｈ３Ｋ４ｍｅａ１のエンハンサーマークの変化と同様に相関付けられ（図３ｃ）、ＤＮＡメチル化レベルにおいては体細胞増加予測スーパーエンハンサーが著しくより低いＤＮＡメチル化レベルを示し、一方で体細胞欠失スーパーエンハンサーは、増加したＤＮＡメチル化を示した（Ｐ＝３．８×１０^－２２９、ウェルチ片側ｔ検定）。非変化予測スーパーエンハンサーは、中間領域を占めた（図３ｄ）。視覚的な例として、ＡＢＬＩＭ２遺伝子座において体細胞増加予測スーパーエンハンサーへマッピングした、ＧＣＴ２０００７２１ではその対応する正常（Ｎ２０００７２１）と比較して減少したＤＮＡメチル化（より低いベータ値によって示される）を観測した（図３ｅ）。対照的に、Ｔ２０００６３９ではＳＬＣ１Ａ２予測スーパーエンハンサーにおけるＨ３Ｋ２７ａｃシグナルの体細胞欠失がＮ２０００６３９と比較して増加したＤＮＡメチル化を示した（図３ｆ）。これらの結果は、胃組織における予測スーパーエンハンサーの生物学的および分子的異質性をさらに支持する。

スーパーエンハンサーは、複雑なクロマチン相互作用を示す
コピー数データとの統合は、体細胞予測スーパーエンハンサーのうちの過半数がコピー数中立領域に局在化されることを明らかにした（図１４ａ～ｃ、「胃癌におけるコピー数変化と予測スーパーエンハンサーとの間の関連付け」と題するセクション）。予測スーパーエンハンサーと遺伝子発現との間の関連付けを検討するために、本研究は、先のパスウェイ解析（図２）と同じ予測スーパーエンハンサー／遺伝子の割り当てを用いて、同じ１次試料からのＲＮＡ－ｓｅｑ情報を調べた。体細胞増加予測スーパーエンハンサーは、対応する正常試料と比較して、高められた遺伝子発現と関連付けられ、一方で体細胞欠失予測スーパーエンハンサーは、減少した発現と関連付けられた（Ｐ＜２．２×１０^－１６、ウェルチ片側ｔ検定；図４ａ）。

これまでの調査は、エンハンサーが複数の遺伝子の発現に影響を及ぼしうる長距離クロマチン相互作用にしばしば関与することも示した。ＧＣにおける体細胞予測スーパーエンハンサーと関連付けられた長距離相互作用を同定するために、本研究は、１次腫瘍試料では反復性体細胞増加を示し、さらにＧＣ株では活性を実証する領域から選択した、３６個の予測スーパーエンハンサーについて相互作用を調査すべく、Ｃａｐｔｕｒｅ－Ｃ技術を適用した。３つのＧＣ細胞株（ＯＣＵＭ－１，ＳＮＵ１６，ＫＡＴＯ－ＩＩＩ）を解析し、３６個の予測スーパーエンハンサーにわたって複数のゲノム位置（ｎ＝９２，「キャプチャポイント」と呼ばれる）を探索して、有意な相互作用を伴う８８個のキャプチャポイントを同定した（Ｑ＜０.０５，ｒ３Ｃｓｅｑパッケージ）。図４ｂは、２０個のキャプチャポイントをカバーする１２個の代表的な予測スーパーエンハンサーを示す。平均すると、各予測スーパーエンハンサーは、それぞれ他のゲノム位置およびプロモーターとの２０～２６および５～７の相互作用を示した。キャプチャポイントと検出した相互作用との間の平均距離は、およそ１７．０ｋｂ（標準偏差：３０．５ｋｂ）であった。本研究は、ＯＣＵＭ－１細胞における約１００ｋｂの距離のＴＭ４ＳＦ４プロモーターとの予測スーパーエンハンサー相互作用を含めて、より長距離の相互作用も同定した（図１５）。注目すべきことに、情報を与える相互作用データをもつ領域については、実験的なＣａｐｔｕｒｅ－Ｃ情報の利用可能性が元の予測スーパーエンハンサー／遺伝子相互作用のうちの９３％（ｎ＝６２）のさらなる検証も許容する。細胞株からの発現データの統合は、相互作用するプロモーターのうちの約７０％が検出可能な遺伝子発現（ＦＰＫＭ＞０）と関連付けられることを明らかにした。

代表的な例として、図４ｃは、ＳＮＵ１６細胞におけるＣＬＤＮ４ゲノム領域の長距離相互作用の景観（他の例については図１６）を示す。ＣＬＤＮ４発現がＧＣの進行および予後とこれまでに関連付けられていたので、この領域を選択し、ＣＬＤＮ４予測スーパーエンハンサーの反復性の増加を複数の１次ＧＣにおいて観測した（図１４ｄ）。具体的には、本研究は、高いＨ３Ｋ２７ａｃシグナルと、さらにＣＤＸ２およびＨＮＦ４α共結合（以下を参照）とを示す２つの予測サブ・スーパーエンハンサー領域を伴う相互作用を検討することを目指した。ＣＬＤＮ４プロモーターとの相互作用に加えて、他の遠位プロモーター（約１００ｋｂまで）、例えば、ＷＢＳＣＲ２７、ＣＬＤＮ３、ＡＢＨＤ１１およびＡＢＨＤ１１－ＡＳ１との相互作用も検出した。ＡＢＨＤ１１－ＡＳ１は、長い非コードＲＮＡであり、胃癌において高発現することがこれまでに示された。Ｃａｐｔｕｒｅ－Ｃデータを検証するために、本研究は、２つのＧＣ株（ＯＣＵＭ－１，ＳＮＵ１６）における４つの選択された予測スーパーエンハンサーに対して環状染色体コンフォメーション・キャプチャアッセイ）（４Ｃ：ｃｉｒｃｕｌａｒｉｚｅｄｃｈｒｏｍｏｚｏｍｅｃｏｎｆｏｒｍａｔｉｏｎｃａｐｔｕｒｅａｓａｙｓ）も行った（図１７）。４Ｃ実験レプリケート間の一致率と同様の、Ｃａｐｔｕｒｅ－Ｃおよび４Ｃデータ間の７５％の一致を観測した（図１８）。４Ｃシークエンシングが著しくより奥深いことに起因して、さらなる相互作用、例えば、約３５０ｋｂの距離における予測スーパーエンハンサーとＫＬＦ５プロモーターとの間の長距離相互作用（図１７ｂ）も検出した。

これまでの報告は、いくつかの長距離相互作用がスーパーエンハンサー活性と関連付けられ、一方では他の相互作用がより不変で細胞系譜を反映することを示唆した。これらの知見と一致して、ＧＣ株間で差次的な活性を呈する（３６個からの）２２個の予測スーパーエンハンサーのうちで、４個の予測スーパーエンハンサーは、予測スーパーエンハンサー活性と長距離相互作用の存在との間の良好な相関を示した（図４ｄおよび図１９）。残りの１８個の予測スーパーエンハンサーについては、予測スーパーエンハンサー活性とは独立して長距離相互作用を観測した。

予測スーパーエンハンサーと遺伝子発現との間の因果的役割を検討するために、本研究は、ＣＬＤＮ４予測スーパーエンハンサー領域内の２つのエンハンサー領域（ｅ１およびｅ２；図４ｃを参照）を欠失させるべくＣＲＩＳＰＲ／Ｃａｓ９ゲノム編集を用いた。ＯＣＵＭ－１およびＳＮＵ１６細胞におけるＣＲＩＳＰＲ欠失効率を確認した後に（図２０ａ～ｃ）、エンハンサー欠失および野生型細胞間の予測標的遺伝子発現レベルをＲＴ－ｑＰＣＲによって比較した。両方の細胞株において、ｅ１のＣＲＩＳＰＲ欠失は、ＡＢＨＤ１１、ＣＬＤＮ３、およびＣＬＤＮ４（ＳＮＵ１６細胞におけるＣＬＤＮ４，図２０ｄ）を含めて、複数のＣＬＤＮ４座位遺伝子の下方制御を生じさせた。同様の仕方で、本研究は、ＯＣＵＭ－１細胞におけるｅ２欠失後に、ＡＢＨＤ１１、ＣＬＤＮ３、およびＣＬＤＮ４の下方制御も観測した（ｅ２欠失ＳＮＵ１６細胞は生存可能ではなく、従って遺伝子発現解析ができなかった；図２０ｅ）。これらの結果を拡張するために、本研究は、ＥＬＦ３がいくつかの悪性腫瘍における癌遺伝子としては報告されていることから、次に、ＯＣＵＭ－１細胞におけるＥＬＦ３予測スーパーエンハンサーから２つの他の予測エンハンサーエレメント（ｅ３およびｅ４）をＣＲＩＳＰＲ失欠させた（図１７ａ，図２０ｃ）。ｅ３およびｅ４の欠失は、いずれもＡＲＬ８Ａ、ＥＬＦ３、ＲＮＰＥＰおよびＴＩＭＭ１７Ａを含めて複数のＦＬＦ３座位遺伝子の下方制御をもたらした（図２０ｆ）。全体として解釈すると、これらの結果は、予測スーパーエンハンサー活性と腫瘍遺伝子発現との間の因果的関係を支持する。

体細胞スーパーエンハンサーおよび臨床的アウトカム
予測スーパーエンハンサーの異質性の生物学的および臨床的関連性をさらに探索すべく、本研究は、体細胞修飾状況（増加、欠失、非変化）によってカテゴリー化した癌ホールマーク解析を行った。１０個の癌ホールマークのうちで、体細胞増加予測スーパーエンハンサーは、浸潤（Ｐ＝８．６×１０^－１１，フィシャーの片側正確検定）、血管新生（Ｐ＝２．４×１０^－４，フィシャーの片側正確検定）、細胞死抵抗性（Ｐ＝７．８×１０^－３，フィシャーの片側正確検定）に関係する遺伝子中で著しく濃縮されて、体細胞欠失および予測非変化スーパーエンハンサーを１桁超過した（図５ａ）。これらの結果は、体細胞増加予測スーパーエンハンサーが進行性ＧＣと関連付けられた形質に関与しうることを示唆する。８６個の細胞および組織試料の予測スーパーエンハンサー・プロファイルに対して比較したときに、ＧＣにおける体細胞増加予測スーパーエンハンサーのうちの６０％超が高組織特異性を示した。他の癌タイプ、例えば、結腸直腸癌、乳癌、子宮頸管癌および膵臓癌においてこれまでに記載された予測スーパーエンハンサーとの有意な重複（図２１）（Ｐ＜０.００１，経験的検定）も観測し、いくつかのＧＣ関連予測スーパーエンハンサーが他の癌タイプにおいても活性でありうることを示唆した。

本研究は、次に、体細胞増加予測スーパーエンハンサーと関連付けられた遺伝子発現パターンがＧＣ患者の生存と関連付けられうるかどうかを尋ねた。複数のＧＣ患者において両方の反復性体細胞増加を示し、標的遺伝子発現との最も高い相関も示す領域から、上位５０個の予測スーパーエンハンサーと関連付けられた遺伝子を選択した。このアプローチの妥当性を支持して、このように選択したいくつかの遺伝子、例えば、ＣＤＨ１７およびＣＣＡＴ１がＧＣにおいて過剰発現されることがこれまでに示されたことに注目した。遺伝子リストは、潜在的に新規なＧＣ関連遺伝子、例えば、ＳＭＵＲＦ１およびＬＩＮＣ００２９９も含んだ（表１０）。

生存解析は、８４８人のＧＣ患者からなる３つの非アジア人ＧＣおよび４つのアジア人ＧＣコホートにわたって行った。予測スーパーエンハンサー関連遺伝子が高発現を示すＧＣをもつ患者は、これらの遺伝子が比較的低く発現されるＧＣ試料と比較して劣る全生存期間を示した（図５ｂ，Ｐ＝１．８×１０^－２，ログランク検定）。この関連付けのロバスト性を支持して、患者生存との関係は、予測スーパーエンハンサーの数を変化させた後でも有意なままであった（ｎ＝３０，Ｐ＝０．０２，ログランク検定；ｎ＝６０，Ｐ＝０．０３，ログランク検定）。多変量解析では、さらに他のリスク要因、例えば、年齢、段階、患者地域性および組織学的サブタイプについて調整した後でも、生存期間との関連付けが統計学的に有意なままであった（Ｐ＝０．０４４，ワルド検定）。このデータは、ＧＣにおいて体細胞増加予測スーパーエンハンサーによって駆動される遺伝子が臨床的に重要でありうることを示す。

異なる予測スーパーエンハンサー・カテゴリーと疾患リスクとの間の関係を扱うために、疾患関連一塩基多型（ＳＮＰ：ｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍ）が調節エレメントにおいて濃縮されること示す、これまでのゲノムワイド関連研究（ＧＷＡＳ：ｇｅｎｏｍｅ－ｗｉｄｅａｓｓｏｃｉａｔｉｏｎｓｔｕｄｉｅｓ）（ｓｔｕｄｉｅｓ（ＧＷＡＳ）ｓｔｕｄｉｅｓ）を考慮した。本研究は、１４７０件のゲノムワイド関連研究から報告された疾患関連ＳＮＰのカタログを、反復性体細胞変化（増加または欠失）を示すそれらの予測スーパーエンハンサーまたは非変化予測スーパーエンハンサーに対してマッピングした。体細胞予測スーパーエンハンサーは、様々な癌（前立腺癌、結腸直腸癌、乳癌；濃縮比＝３．０～７．２；Ｐ＜４．４×１０^－３，カイ２乗検定）、および潰瘍性大腸炎のような胃腸疾患（濃縮比＝３．３；Ｐ＜５．２×１０^－４，カイ２乗検定）と関連付けられた疾患リスクＳＮＰに対して濃縮された（図５ｃ）。対照的に、非変化予測スーパーエンハンサーは、同様の濃縮を示さなかった。予想外に、本発明者らは、体細胞変化予測スーパーエンハンサーにおける多発性硬化症ＳＮＰの濃縮（濃縮比＝４．３；Ｐ＝１．８×１０^－７，カイ２乗検定）も観測し、これは、癌と自己免疫性応答との間の相互関連を示唆した。予測スーパーエンハンサーの疾患ＳＮＰがクロマチン修飾における局所的な変化と関連付けられうるかどうかを探索するために、本研究は、次に、少なくとも２つの研究において報告された結腸直腸癌と関連付けられ、さらにＧＣ患者のうちの少なくとも１／３において異型接合性を示すＳＮＰに焦点を合わせた（考察を参照）。２つのＳＮＰがこれらの基準を満たした（ｒｓ１０４１１２１０およびｒｓ１０５０５４７７）。ｒｓ１０４１１２１０ＳＮＰをもつ試料は、対応する正常なものに対して腫瘍では著しくより高いＨ３Ｋ２７ａｃシグナルを示し（図５ｄ；Ｐ＝０．０１，片側ウェルチの片側ｔ検定）、ｒｓ１０５０５４７７ＳＮＰをもつ試料においても同様の傾向を観測した（Ｐ＝０．０７，ウェルチの片側ｔ検定）。かかる関連付けは、疾患関連リスクＳＮＰと癌関連ヒストン修飾との間の関係を示唆する。

スーパーエンハンサーは、高密度の転写因子占有を示す
最後に、体細胞増加予測スーパーエンハンサーと関連付けられたトランス作用因子を探索した。ＧＣ予測スーパーエンハンサーは、他のゲノム領域と比較して、著しく濃縮されたＥＮＣＯＤＥＴＦ結合プロファイルを示し、ＴＦ「ホットスポット」としての前者を支持した（Ｐ＜２．２×１０^－１６，片側比率検定）。ＲｅＭａｐデータベースを調べて、本研究は、次に、異なる予測スーパーエンハンサー・カテゴリーと関連付けられた特異的なＴＦを同定した。体細胞増加および非変化予測スーパーエンハンサーの両方がＣＥＢＰＢ、ＭＹＣ、およびＦＯＸＡ１結合における濃縮を示した。しかしながら、上位１０個の濃縮されたＴＦの中で、ＣＤＸ２は、体細胞増加予測スーパーエンハンサーにおいて濃縮の上昇を示し（ランク#２）、非変化予測スーパーエンハンサー（ランク#８）と比較して結合密度がおよそ３０％増加した（図６ａおよび６ｂ）。

ＴＦは、しばしば協同的な仕方で機能するので、ＨＯＭＥＲ、ｄｅｎｏｖｏモチーフ発見アルゴリズムを用いることによって潜在的なＣＤＸ２パートナーを同定した。ＨＯＭＥＲ解析は、ＣＤＸ２結合と関連付けられたＨＮＦ４α、ＫＬＦ５、およびＧＡＴＡ４結合モチーフを同定した（図６ｃ）。本研究は、ＰＳｃａｎＣｈＩＰをＪＡＳＰＡＲ２０１６とともに用いてＣＤＸ２共結合モチーフも解析した。ＰＳｃａｎＣｈＩＰを用いて、本研究は、ＨＮＦ４α、ＫＬＦ５、およびＧＡＴＡ４を再び含む、潜在的なＣＤＸ２パートナーとして３６７個のタンパク質を予測した（表７）。遺伝子同時発現解析は、ＨＮＦ４α（スピアマン相関、ｒ＝０．８０）およびＫＬＦ５（ｒ＝０．５８）がＣＤＸ２発現と最も強く相関付けられた候補であることを明らかにして、ＨＮＦ４αおよびＫＬＦ５が確からしいＣＤＸ２パートナーでありうることを示唆した（図６ｄ）。とりわけ、ＣＤＸ２は、腸上皮化生のドライバーとしてこれまでにＧＣにおいて同定され、ＫＬＦ５およびＧＡＴＡ４／６は、ＨＮＦ４αを上方制御するために協同するＧＣにおける発癌性転写因子としてこれまでに報告された。

ＣＤＸ２のＨＮＦ４α（最も高く相関付けられた因子）とのゲノム共同専有（ｃｏ－ｏｃｃｕｐａｎｃｙ）を実験的に確認するために、ＣＤＸ２およびＨＮＦ４α ＣｈＩＰ－ｓｅｑをＯＣＭ－１胃細胞に対して行い、ＴＦ結合位置を予測スーパーエンハンサー位置と統合した。ＯＣＵＭ－１細胞では、ＣＤＸ２およびＨＮＦ４α結合頂点（ｂｉｎｄｉｎｇｓｕｍｍｉｔ）（ｑ＜０．０１，ＭＡＣＳ２）が高い共同専有（５００ｂｐウィンドウ）を示し、ＣＤＸ２結合のうちの７６％がＨＮＦ４αと同時に発生した（ＣＤＸ２／ＨＮＦ４α部位として知られる）（図６ｅ）。高ＣＤＸ２発現ＧＣのうちの上位５０％を下位５０％に対して比較して、本発明者らは、前者のサンプルでは、反復性体細胞増加予測スーパーエンハンサーが高い方のＣＤＸ２結合密度と確かに関連付けられることを見出した（１００万塩基対当たり１２３個の結合，Ｍｂｐ対９２Ｍｂｐ；方法を参照）。ＣＤＸ２／ＨＮＦ４α部位は、非変化予測スーパーエンハンサーと比較して、体細胞増加予測スーパーエンハンサーに選択的に局在化し（Ｐ＝２．４×１０^－４，カイ２乗検定）、ＣＤＸ２およびＨＮＦ４α結合シグナルの両方が、非変化予測スーパーエンハンサーと比較して、体細胞増加予測スーパーエンハンサーにおいて増加した（図６ｆ）。ＳＮＵ１６細胞においても同様のＣＤＸ２およびＨＮＦ４α ＣｈＩＰ－ｓｅｑ結果を得た（図２２ａ）。この結果は、ＧＣにおける体細胞増加予測スーパーエンハンサーがＣＤＸ２およびＨＮＦ４α占有と関連付けられることを示す。

ＣＤＸ２およびＨＮＦ４αがＧＣスーパーエンハンサーの維持に役割を果たしうるかどうかを試験するために、各ＴＦのサイレンシングを単独かあるいは両方の因子で同時に行い、ゲノムワイドなＨ３Ｋ２７ａｃのプロファイリングがその後に続いた。いずれかの因子の単独かあるいは組み合わせの枯渇は、ＯＣＵＭ－１細胞におけるＨ３Ｋ２７ａｃの全体的な変化は誘発しなかった（図２２ｂ）。しかしながら、ＣＤＸ２およびＨＮＦ４αのサイレンシングは、それぞれゲノムのうちの９．７Ｍｂおよび４．３Ｍｂにおける特異的なＨ３Ｋ２７ａｃの変化につながり、ダブルＴＦノックダウンは、著しくより大きいＨ３Ｋ２７ａｃ枯渇を誘発した（ＣＤＸ２およびＨＮＦ４α単独と比較してＰ＝３．４×１０^－２９および１．２×１０^－８８，ウィルコクソン片側順位和検定）（図２２ｃ）。シングルＴＦおよびダブルＴＦサイレンシングの両方に対して、Ｈ３Ｋ２７ａｃ枯渇は、予測典型エンハンサーと比較して、体細胞増加予測スーパーエンハンサーにおいてより顕著に発生し、ＴＦ枯渇に対するスーパーエンハンサー活性の感受性が高められたことを示唆する（図６ｇ，図２ｄ，表１１ａ～１１ｄ；それぞれＣＤＸ２，ＨＮＦ４αおよびＣＤＸ２／ＨＮＦ４αに対してＰ＝５．３×１０^－７；Ｐ＝１．８×１０^－１７；Ｐ＝１．５×１０^－１０，ウィルコクソン片側順位和検定）。これらの効果の特異性を支持して、予測スーパーエンハンサーにおけるＨ３Ｋ２７ａｃ枯渇は、ＣＤＸ２またはＨＮＦ４α結合部位に中心がある領域において、特に、両方の因子によって共同で専有された部位においてより顕著であった（図６ｈ）。ＳＮＵ１６細胞においても同様の結果を得た（図２２ｅ）。次に、予測スーパーエンハンサーと遺伝子発現との間の関係を評価するために、本研究は、ＴＦサイレンシング後にＨ３Ｋ２７ａｃ枯渇を示す予測スーパーエンハンサーに焦点を合わせた。予測スーパーエンハンサー標的遺伝子のうちの６０％超がＴＦサイレンシング後に発現の減少も示すことに注目した（ｓｉＣＤＸ２，Ｐ＝４×１０^－４，経験的検定；ｓｉＨＮＦ４α，Ｐ＜１×１０^－４，経験的検定；ｓｉ（ＣＤＸ２／ＨＮＦ４α），Ｐ＜１×１０^－４，経験的検定；図２２ｆ）。この比率は、順列解析（「方法」）によって評価されるような、偶然に予想される比率を著しく超過した。全体として解釈すると、これらの結果は、ＧＣスーパーエンハンサーの維持におけるＣＤＸ２およびＨＮＦ４αに対する機能要件を支持する。

癌における系譜特異的エンハンサーエレメント
いくつかのエンハンサーサブ領域が癌特異的な必須性を呈しうるというコンセプトの証明として、この研究は、ＧＣ細胞または正常ＥＳ細胞のいずれかにおいてＣＬＤＮ４サブエンハンサー領域（ｅ１）を欠失させることができる程度を試験した（図１５，１６；表１２）。図２４に示すように、ＣＬＤＮ４ｅ１エンハンサーサブ領域のホモ接合型欠失は、Ｈ１ＥＳ細胞（図２６，２７）では容易に達成されたが、ＳＮＵ１６ＧＣ細胞では達成されず（図２５，２８）、ＳＮＵ１６癌細胞の生存にとってＣＬＤＮ４ｅ１の１つのコピーの維持が必須でありうることを示唆した。

これは、ｃｈｒ７：７３，２６２，４００～７３，２６６，７００の周りの欠失を許容する。欠失のサイズは、実際の実験中に変動する。それゆえに、前述の欠失領域は、単にｓｇＲＮＡ設計に基づく推定である。ｓｇＲＮＡの配列を表１３に示す。

遺伝子発現と遠位予測調節エレメントとの間の相関
Ｎａｎｏ－ＣｈＩＰｓｅｑによって定義した遠位予測調節エレメントを遺伝子発現へ相関付けるために、複数の株にわたって高反復性を示す８０個の予測スーパーエンハンサーを同定した（Ｐ＜０．０００１，経験的検定）。高反復性予測典型エンハンサーを同定するためにも同じアプローチを用いた。予測スーパーエンハンサーおよび予測典型エンハンサーの両方に対して、遠位調節エレメントと関連付けられた遺伝子は、ランダムに選択された遺伝子より高発現（ｈｉｇｈｅｒｅｘｐｒｅｓｓｉｏｎｔｈａｔ）を示した（図１０ｂ）。予測スーパーエンハンサー／典型エンハンサー関連遺伝子の発現の比較は、予測スーパーエンハンサー関連遺伝子に対してより高い全体的な発現レベル（パーセンタイル単位）を明らかにした（Ｐ＝５．２×１０^－３，ウィルコクソン片側順位和検定）。これらの結果は、予測スーパーエンハンサーおよび予測典型エンハンサーにおけるＨ３Ｋ２７ａｃ濃縮と、標的遺伝子発現との間の正の関連付けを示唆する。

１次胃非悪性試料のエピゲノムロードマップとの比較
この研究における非悪性胃組織が筋肉、免疫細胞などではなく、胃上皮を確かに反映することを確認するために、この研究からの非悪性胃Ｈ３Ｋ２７ａｃプロファイルを先に公表された正常胃プロファイルと比較し、胃平滑筋プロファイルとも比較した。Ｎａｎｏ－ＣｈＩＰｓｅｑプロファイルごとに、Ｈ３Ｋ２７ａｃシグナルのうちの７０％（平均）が公表された正常胃プロファイルと重複し、一方で３４％（平均）のみが胃平滑筋と重複した。結果は、非悪性胃試料が胃平滑筋ではなく胃上皮を確かに反映することを示唆する。

胃癌におけるコピー数変化と予測スーパーエンハンサーとの間の関連付け
本研究は、反復性体細胞変化予測スーパーエンハンサーが体細胞コピー数の変化（ｓＣＮＡ：ｓｏｍａｔｉｃｃｏｐｙｎｕｍｂｅｒａｌｔｅｒａｔｉｏｎｓ）と関連付けられうる程度を検討した。予測スーパーエンハンサー間の重複、ならびに細胞株および１次ＧＣからのコピー数情報をインハウスで発生させたＡｆｆｙｍｅｔｒｉｘＳＮＰ６．０アレイデータを用いて計算した。ｓＣＮＡの領域を確信的に同定することを許容するために、解析を（平均ゲノムワイド・カバレッジより２倍高い）１０ｋｂ当たり少なくとも６個のＳＮＰプローブによってカバーした領域に制限した。ｓＣＮＡ解析の信頼性を確認し、後者において見出したＧＣ細胞株（ＦＵ９７，ＫＡＴＯ－ＩＩＩ，ＭＫＮ７，ＯＣＵＭ－１，ＲＥＲＦＧＣ１Ｂ，ＳＮＵ１６）について、解析における平均９８％のコピー数増加および８２％のコピー数欠失をＣａｎｃｅｒＣｅｌｌＬｉｎｅＥｎｃｙｃｌｏｐｅｄｉａにも報告した。

これらの細胞株では、予測スーパーエンハンサーのうちの５～６％（±６％標準偏差）のみがコピー数増加と関連付けられることがわかった（平均ｌｏｇ２比＞０．６）。例えば、ＫＡＴＯ－ＩＩＩにおいて検出したＦＧＦＲ２関連予測スーパーエンハンサーは、コピー数増加と重複し（図１４ｂ）、遺伝子座において観測したより高いＨ３Ｋ２７ａｃリード密度が領域的なゲノム増幅によって潜在的に駆動されたことを示唆する。他方では、ＧＣ細胞株において検出した予測スーパーエンハンサーのうちの過半数は、コピー数中立領域に局在して、予測スーパーエンハンサーの確立が体細胞コピー数事象から独立していることを示唆する。この割合は、ランダムな偶然によるより大きい（Ｐ＜０．０１，経験的検定）。

同様に、１次ＧＣにおいて、この研究は、１９個の１次Ｔ／Ｎ対における１，７４８個の反復性体細胞増加予測スーパーエンハンサーに対してＣＮＡ／ＳＥ補正を計算することが可能であった。体細胞増加予測スーパーエンハンサーのごく一部のみ（＜２％±３％ｓ．ｄ）がコピー数増加と重複し（図１４ｃ）、個々のＴ／Ｎ対において見出した体細胞増加予測スーパーエンハンサーのうちの９０％超がコピー数中立領域内で検出される（図１４ａ）ことがわかった。この結果は、予測スーパーエンハンサーにおけるＨ３Ｋ２７ａｃの体細胞増加とコピー数変化との間に強い関連付けがないこと、および腫瘍試料における予測スーパーエンハンサーでのＨ３Ｋ２７ａｃ獲得がおそらくコピー数変化とは別のメカニズムによって駆動されることを示唆する。

考察
ＧＣは、臨床的に異質性のある疾患であり、外科手術および化学療法に加えて、トラスツズマブ（抗ＨＥＲ２）およびラムシルマブ（抗ＶＥＧＦＲ２）のみが臨床的に認可され、他の分子標的剤は、現在まで不成功であることが判明している。胃腫瘍発生における重要なパスウェイとしてエピゲノム調節解除が出現して、ＧＣではクロマチン修飾遺伝子（例えば、ＡＲＩＤ１Ａ）が頻繁に変異し、エピジェネティックな変化が胃前悪性と関連付けられる。しかしながら、現在まで、ＧＣエピゲノム研究のうちの圧倒的多数が腫瘍抑制遺伝子のサイレンシングの文脈におけるプロモーターＤＮＡメチル化に焦点を合わせてきた。対照的に、ＧＣにおける遠位調節エレメント（すなわち、エンハンサー）については、現在、ごくわずかしか知られていない。

この研究は、１次胃腫瘍、対応する非悪性組織、およびＧＣ細胞株のマイクロスケール・ヒストン修飾プロファイリングを通じて同定した３５ｋ超の予測エンハンサーエレメントを解析した。小規模ＣｈＩＰプロトコルは、技術的にチャレンジングなものとして知られ、時として著しい試料間変動をもたらしかねない。安心させるように、本発明者らは、腫瘍および正常試料間のＮａｎｏ－ＣｈＩＰシグナルが、直交するＣｈＩＰ－ｑＰＣＲの結果と良好な一致を示すことを先に実証し、本研究において、本発明者らは、Ｎａｎｏ－ＣｈＩＰｓｅｑライブラリのうちの圧倒的多数（８５～１００％）が許容しうる品質であることを確認すべく、マッピングの厳しさの変化、生物学的レプリケート解析、プロモーターＣｈＩＰ濃縮およびＣＨＡＮＣＥ解析を含む、広範な品質管理解析をさらに行った。解析をプロモーター・ベースおよびＣＨＡＮＣＥ品質解析の両方をパスした「高品質」腫瘍／正常の対のみに限ったときには反復性体細胞増加予測スーパーエンハンサーのうちの８４％が依然として再発見されたという観測によって示されるように、複数の試料に存在する反復性エピゲノム変化に焦点を合わせることによって、生物学的結論がさらに確実にロバストになりうる。

この研究では、反復性予測スーパーエンハンサーは、主として、既知の癌遺伝子および発癌過程に関与している遺伝子に現れた（図２ｄ）。近位プロモーターエレメントを超える、個々の試料間の高レベルのエンハンサーの変動（図１ｄ）も観測した。他の組織および腫瘍タイプに対して比較したときに、ＧＣ予測スーパーエンハンサーのうちのほとんど６０％が組織特異的であった（図２１）。注目に値するのは、現研究ではＧＣを対応する非悪性胃組織に対する一般的なカテゴリーとして最大感受性について研究したことである。しかしながら、別個の病理組織学的および分子的ＧＣサブタイプが存在し、ＧＣの異なる組織学的サブタイプには別個のエンハンサー変化が存在しうることを示唆する。かかる知見は、エンハンサーエレメントの絶妙な組織特異的性質と、拡大する患者コホートおよび多くの異なる腫瘍タイプにおける包括的なエンハンサー・カタログを発生させる必然的なニーズとを反映する。

本研究において解析した試料のうちの過半数は、インビトロで培養した細胞株ではなく、患者に直接に由来する１次組織であった。予測エンハンサー活性（Ｈ３Ｋ２７ａｃ）を腫瘍と対応する正常なものとの間で比較することによって、細胞株の予測スーパーエンハンサーをそれらの体細胞変化状況（体細胞増加、体細胞欠失および非変化）に従ってさらに下位分類することが可能であった。それらの生物学的特殊性を支持して、サブカテゴリー化した予測スーパーエンハンサーは、エピゲノムパターン（Ｈ３Ｋ４ｍｅ１，ＤＮＡメチル化）、遺伝子転写、および癌ホールマークを含めて、他の直交する特徴における特異的差異も呈した。とりわけ、本発明者らのデータでは、体細胞増加予測スーパーエンハンサーのごく一部のみがコピー数増幅の領域に局在した。予測スーパーエンハンサーを真の体細胞増加または欠失に従って下位分類する能力が癌におけるスーパーエンハンサーの確立を担う発癌メカニズムを正確に指摘するための下流の試みを改善すると思われる。かかるアプローチは、おそらく他の病状にも拡張可能である。

先験的な考察から予測スーパーエンハンサーの異質性が疾患リスクと関連付けられた生殖系列変異体を解析するときにも有用であることがわかるであろう。これまでの知見は、疾患関連ＳＮＰが一般に調節エレメントにおいて過剰提示されることを報告したが、わかったことは、非変化予測スーパーエンハンサーではなく、体細胞変化予測スーパーエンハンサーが癌および炎症性胃腸疾患と関連付けられたＳＮＰ（胃腸癌に対する既知のリスクファクター）において特異的に濃縮されることである。これらの領域におけるＳＮＰは、ＴＦ結合モチーフの修飾、長距離クロマチン相互作用の調節、またはＨ３Ｋ２７ａｃレベルの変化を含めて、いくつかの非排他的メカニズムを通じて疾患リスクおよび癌発生を変化させうる。実際に、この研究では、結腸直腸癌（ＣＲＣ：ｃｏｌｏｒｅｃｔａｌｃａｎｃｅｒ）リスクと関連付けられた２つのＳＮＰ（ｒｓ１０５０５４７７およびｒｓ１０４１１２１０）が１次ＧＣにおけるクロマチン修飾の局所的な変化との関連付けられることに注目した。ＣＲＣリスクデータをＧＣと統合することが尤もないくつかの理由がある。第１に、これらのＣＲＣリスクＳＮＰのうちの少なくとも１つ（ｒｓ１０５０５４７７）が治療反応および患者生存の両方においてＧＣの臨床的アウトカムに影響を及ぼすことも報告されている。第２に、ＧＣ予測スーパーエンハンサーと関連付けられた主要な転写因子（ＣＤＸ２、ＨＮＦ４α）が結腸発生を調節することも知られている。第３に、ＧＣに対する前悪性リスクファクタとしての腸上皮化生（ＩＭ：ｉｎｔｅｓｔｉｎａｌｍｅｔａｐｌａｓｉａ）の役割がよく確立され、ＩＭでは胃上皮細胞が結腸上皮と同様の細胞アーキテクチャおよび外観を採る。これらの遺伝子変異体が、生殖系列ＤＮＡに存在する一方で、腫瘍におけるクロマチン構造および遺伝子発現に影響を及ぼしうるという観測がＣＲＣでも認められている。これらの結果は、疾患素因の根底にある生殖系列過程を本発明者らが精密に理解するために、異常なエピジェネティック状態を研究する重要性をさらに際立たせる。

本研究の結果は、ＧＣにおける個々のスーパーエンハンサーがシスおよびトランス作用転写機構とどのように相互作用しうるかに関していくつかの一般原理を示唆する。２つの別個の長距離クロマチン相互作用アッセイ（Ｃａｐｔｕｒｅ－Ｃおよび４Ｃ）を用いて、高められた腫瘍発現を示す近位および遠位遺伝子の両方に係わる体細胞増加予測スーパーエンハンサーのいくつかの例を観測した。体細胞増加予測スーパーエンハンサーに連結された遺伝子は、コヒーシン介在エンハンサー－プロモーターループを通じて確立された、同様のトポロジカルな会合ドメイン（ｔｏｐｏｌｏｇｉｃａｌａｓｓｏｃｉａｔｉｎｇｄｏｍａｉｎ）をおそらく占めることが提案された。近位および遠位遺伝子発現の両方に影響を及ぼす体細胞増加予測スーパーエンハンサーの能力は、予測スーパーエンハンサーを、疾患の進行および化学応答に寄与しうる、胃腫瘍における異常遺伝子発現の枢要なレギュレーターとして関係付ける（図５ｂ）。トランス・レベルでは、ＧＣにおける体細胞増加予測スーパーエンハンサーがＣＤＸ２およびＨＮＦ４α占有と関連付けられることをデータが明らかにした。これまでの研究は、胃における異常なＣＤＸ２の発現が粘膜上皮細胞の腸上皮化生、胃腫瘍形成の重要な初期事象と関連付けられること、およびＣＤＸ２がＧＣ癌遺伝子として機能する可能性を有することを示した。ＨＮＦ４αも、最近、ＧＣにおいて系譜特異的癌遺伝子ＫＬＦ５およびＧＡＴＡ因子の両方の標的として、ならびにＡＭＰＫシグナル伝達パスウェイとして関係付けられた。１次ヒト腫瘍における結果は、ＣＤＸ２が腸遺伝子発現を制御するためにＨＮＦ４α占有率を調節することがわかった、マウス小腸における最近の知見によって支持される。これらの研究を反映して、ＣＤＸ２／ＨＮＦ４α枯渇がＣＤＸ２および／またはＨＮＦ４α結合部位に濃縮された局所領域におけるクロマチンの変化に影響を与えることもわかった。

結論として、この研究は、予測スーパーエンハンサーにおける異質性に対する役割および生体調節（ｒｅｇｕｌａｔｏｒｙｂｉｏｌｏｇｙ）を分析するために１次組織および細胞株からのクロマチン・プロファイルを交差させる有用性を実証する。ＧＣ遠位エンハンサーのこの第１世代ロードマップは、ＧＣ予測エンハンサー（ｅＲＮＡ）と関連付けられた転写特徴を含み、予測スーパーエンハンサー活性を乱す体細胞調節変異を同定する将来の統合的な研究を今や可能にする。

Claims

対応する１次非癌生体試料と比較して、被験者から得られた１次癌生体試料における少なくとも１つの癌関連スーパーエンハンサーの存在または非存在を判定するための方法であって、
ａ）前記被験者から得られた前記１次癌生体試料をヒストン修飾Ｈ３Ｋ２７ａｃに対して特異的な少なくとも１つの抗体と接触させるステップと、
ｂ）前記１次癌生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾Ｈ３Ｋ２７ａｃに特異的な少なくとも１つの領域を備え、前記核酸は、前記ヒストン修飾Ｈ３Ｋ２７ａｃに特異的なクロマチンの免疫沈降によって前記癌生体試料から単離される、前記単離するステップと、
ｃ）アノテートされたゲノム配列を用いて、少なくとも１つのエンハンサーを前記ヒストン修飾Ｈ３Ｋ２７ａｃのシグナル強度に基づいてマッピングするステップであって、前記少なくとも１つのエンハンサーは、アノテートされた転写開始点から少なくとも２．５ｋｂにある、前記マッピングするステップと、
ｄ）前記１次癌生体試料における少なくとも１つの癌関連スーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも１つのエンハンサーを少なくとも１つの参照核酸配列中の少なくとも１つの癌関連エンハンサーに対してマッピングするステップと、
ｅ）前記１次癌生体試料における前記少なくとも１つの癌関連スーパーエンハンサーの前記シグナル強度を前記対応する１次非癌生体試料から得られた前記少なくとも１つの癌関連スーパーエンハンサーの参照シグナル強度に対して比較するステップであって、前記少なくとも１つの癌関連スーパーエンハンサーの前記シグナル強度は、前記ヒストン修飾Ｈ３Ｋ２７ａｃのＲｅａｄｓＰｅｒＫｉｌｏｂａｓｅｏｆｔｒａｎｓｃｒｉｐｔｐｅｒＭｉｌｌｉｏｎ（ＲＰＫＭ：１００万当たり、トランスクリプトのキロベース当たりのリード）値に基づいており、前記ＲＰＫＭの値はバッチ効果について補正される、前記比較するステップと、
ｆ）前記１次癌生体試料における前記少なくとも１つの癌関連スーパーエンハンサーの存在または非存在を前記少なくとも１つの癌関連スーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、を備え、
前記少なくとも１つの癌関連スーパーエンハンサーの存在または非存在を判定するステップは、前記１次癌生体試料における前記少なくとも１つの癌関連スーパーエンハンサーに対する前記ＲＰＫＭ値が、
ｉ）前記対応する１次非癌生体試料から得られた前記少なくとも１つの癌関連スーパーエンハンサーの前記ＲＰＫＭ値と比較して、ＲＰＫＭ値における２より大きい倍率変化、および
ｉｉ）前記対応する１次非癌生体試料から得られた前記少なくとも１つの癌関連スーパーエンハンサーの前記ＲＰＫＭ値と比較して、０．５ＲＰＫＭより大きい絶対値差分であることを判定するステップを備える、
方法。
前記１次癌および対応する１次非癌生体試料は、単一の細胞、複数の細胞、細胞のフラグメント、体液または組織を備える、請求項１に記載の方法。
前記１次癌および対応する１次非癌生体試料は、同じ被験者から得られる、請求項１～２のいずれか一項に記載の方法。
前記癌および非癌生体試料は、各々が異なる被験者から得られる、請求項１～３のいずれか一項に記載の方法。
前記核酸は、クロマチンの免疫沈降によって前記１次癌生体試料から単離される、請求項１～４のいずれか一項に記載の方法。
前記少なくとも１つの参照核酸配列は、少なくとも１つの癌細胞株から得られる、請求項１～５のいずれか一項に記載の方法。
前記１次癌生体試料における前記少なくとも１つのスーパーエンハンサーは、ＲＯＳＥ（ＲａｎｋｉｎｇｏｆＳｕｐｅｒＥｎｈａｎｃｅｒ）アルゴリズムを用いて同定される、請求項１～６のいずれか一項に記載の方法。
前記１次癌生体試料における前記少なくとも１つのスーパーエンハンサーは、前記少なくとも１つの参照核酸配列中の前記少なくとも１つのエンハンサーと重複する少なくとも１つの核酸塩基対を備える、請求項７に記載の方法。
前記対応する１次非癌生体試料の前記ＲＰＫＭ値と比較して、前記１次癌生体試料からのＲＰＫＭ値における増加は、前記１次癌生体試料における前記少なくとも１つのスーパーエンハンサーの存在を示す、請求項８に記載の方法。
前記対応する１次非癌生体試料の前記ＲＰＫＭ値と比較して、前記１次癌生体試料からのＲＰＫＭ値における減少は、前記１次癌生体試料における前記少なくとも１つのスーパーエンハンサーの非存在を示す、請求項８に記載の方法。
前記少なくとも１つのスーパーエンハンサーは、遺伝子転写開始点に対して１０００ｋｂ以内に配置される、請求項１～１０のいずれか１項に記載の方法。
前記遺伝子は、癌関連遺伝子、血管新生遺伝子、細胞増殖遺伝子、細胞浸潤遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞死抵抗性遺伝子、細胞エナジェティクス遺伝子、細胞周期遺伝子または腫瘍促進遺伝子のうちの１つ以上である、請求項１１に記載の方法。
前記遺伝子は、ＣＬＤＮ４、ＡＢＨＤ１１、ＷＢＳＣＲ２８、ＡＴＡＤ２、ＫＬＨ３８、ＷＤＹＨＶ１、ＣＤＨ１７、ＣＣＡＴ１、ＣＬＤＮ１、ＳＭＵＲＦ１、ＧＤＰＤ５、ＡＤＡＭＴＳ１２、ＡＳＣＬ２、ＡＳＰＭ、ＡＴＰ１１Ａ、ＡＵＲＫＡ、ＣＡＭＫ２Ｎ１、ＣＢＸ２、ＣＣＮＥ１、ＣＤ９、ＣＤＣ２５Ｂ、ＣＤＣＡ７、ＣＤＫ１、ＣＸＣＬ１、Ｅ２Ｆ７、ＥＣＴ２、ＬＡＭＣ２、ＮＩＤ２、ＰＭＥＰＡ１、ＲＡＲＲＥＳ１、ＲＦＣ３、ＳＬＣ３９Ａ１０、ＴＦＡＰ２Ａ、ＴＭＥＭ１５８、ＬＩＮＣ００２９９およびそれらの組み合わせからなる群から選択される、請求項１１に記載の方法。
前記１次癌生体試料は、胃癌である、請求項１～１３のいずれか一項に記載の方法。
前記対応する１次非癌生体試料と比較して、前記１次癌生体試料における前記少なくとも１つのスーパーエンハンサーの増加したシグナル強度は、少なくとも１つの癌関連スーパーエンハンサーの存在を示す、請求項１に記載の方法。
少なくとも１つの癌関連スーパーエンハンサーの存在または非存在は、前記被験者における前記癌の予後を示す、請求項１５に記載の方法。
前記１次癌生体試料における前記少なくとも１つの癌関連スーパーエンハンサーの存在は、被験者における癌生存の予後不良を示す、請求項１６に記載の方法。
前記１次癌生体試料における前記少なくとも１つの癌関連スーパーエンハンサーの非存在は、被験者における癌生存の予後改善を示す、請求項１６に記載の方法。
前記少なくとも１つの癌関連スーパーエンハンサーは、細胞浸潤遺伝子、血管新生遺伝子または細胞死抵抗性遺伝子、癌関連遺伝子、細胞増殖遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞エナジェティクス遺伝子、細胞周期遺伝子または腫瘍促進遺伝子のうちの１つ以上と関連付けられる、請求項１６に記載の方法。
前記少なくとも１つの癌関連スーパーエンハンサーは、ＣＬＤＮ４、ＡＢＨＤ１１、ＷＢＳＣＲ２８、ＡＴＡＤ２、ＫＬＨ３８、ＷＤＹＨＶ１、ＣＤＨ１７、ＣＣＡＴ１、ＣＬＤＮ１、ＳＭＵＲＦ１、ＧＤＰＤ５、ＡＤＡＭＴＳ１２、ＡＳＣＬ２、ＡＳＰＭ、ＡＴＰ１１Ａ、ＡＵＲＫＡ、ＣＡＭＫ２Ｎ１、ＣＢＸ２、ＣＣＮＥ１、ＣＤ９、ＣＤＣ２５Ｂ、ＣＤＣＡ７、ＣＤＫ１、ＣＸＣＬ１、Ｅ２Ｆ７、ＥＣＴ２、ＬＡＭＣ２、ＮＩＤ２、ＰＭＥＰＡ１、ＲＡＲＲＥＳ１、ＲＦＣ３、ＳＬＣ３９Ａ１０、ＴＦＡＰ２Ａ、ＴＭＥＭ１５８、ＬＩＮＣ００２９９およびそれらの組み合わせからなる群から選択された遺伝子と関連付けられる、請求項１６に記載の方法。
細胞における少なくとも１つの癌関連スーパーエンハンサーの活性を調節するのに用いるためのＣＤＸ２およびＨＮＦ４αの阻害薬であって、前記少なくとも１つの癌関連スーパーエンハンサーは、請求項１５に記載の方法によって検出され、ＣＤＸ２およびＨＮＦ４αの前記阻害薬は、ｓｉＲＮＡである、阻害薬。
前記対応する１次非癌生体試料と比較して、前記１次癌生体試料における前記少なくとも１つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、請求項１に記載の方法。