JP2019522285A - エピジェネティクス解析の為の方法及びシステム - Google Patents
エピジェネティクス解析の為の方法及びシステム Download PDFInfo
- Publication number
- JP2019522285A JP2019522285A JP2018566224A JP2018566224A JP2019522285A JP 2019522285 A JP2019522285 A JP 2019522285A JP 2018566224 A JP2018566224 A JP 2018566224A JP 2018566224 A JP2018566224 A JP 2018566224A JP 2019522285 A JP2019522285 A JP 2019522285A
- Authority
- JP
- Japan
- Prior art keywords
- genomic
- methylation
- genome
- sequencing
- subregion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Abstract
Description
本発明は、米国国立衛生研究所により授与された助成金番号 DP1ES022579、R01AG042187、R01CA054348 及び AG021334 及び国立科学財団により授与された助成金番号 CCF-1217213 の下での政府支援によりなされた。米国政府は本発明において一定の権利を有する。
本発明は、確率(stochasticity)と不確実性(uncertainty)の役割を考慮したエピジェネティック解析の方法を提供する。
ある実施形態では、本発明は、1 つ以上のゲノム・サンプル内のゲノム領域のエピジェネティック・ポテンシャル・エネルギー・ランドスケープ(potential energy landscape(PEL))、又は対応する同時確率分布(joint probability distribution)を計算することを含むエピジェネティック解析を実施するための方法を提供する。前記 PEL を計算することは以下を含む:a)ゲノムを別々のゲノム領域に分節すること;b)パラメトリック統計モデル(以下、ザ・モデル(The Model)と呼ぶ)を、個々のメチル化部位におけるメチル化状態間の依存性を考慮しているメチル化データに、ザ・モデルのパラメータの数をゲノム領域内のメチル化部位の数内で幾何学級数的よりも穏やかに増やしながら、合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び、c)前記ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内の PEL 又は対応する同時確率分布を計算及び解析し、それによってエピジェネティック解析を実行すること。
VX(x)=φ0−logPX(x) (1)
こで、φ0 はある定数で、PX(x)は前記ゲノム領域内のメチル化状態 x の同時確率である。結果として、PX(x)は統計物理学のボルツマン‐ギブス分布となり、
ポテンシャル VX(x)−φ0は、メチル化状態 x に関連する情報量を定量化し、−logPX(x)によって与えられる。
更に、前記パラメータ an及び cn を、
ここで、
は、CpG 部位 n を中心とした対称的な 1000 ヌクレオチドの近傍内の CpG 密度であり、
パラメータαは、ゲノム領域にわたって CpG のメチル化に一様に影響を及ぼす内因性因子を表し、一方、パラメータβは、CpG 密度がメチル化に与える影響を調節する。DNMT 酵素が DNA に沿ってより長く移動しなければならないほど、次の CpG 部位に到達する前に DNA から解離する確率がより高くなるから、2 つの連続した CpG 部位のメチル化の間の相関は、これらの 2 つの部位間の距離が増加するにつれて減少する、という期待値を、cnに関する先の表現は表している。この場合、ゲノム領域内の PEL は、
Z=Z1(0)+Z1(1) (9)
と示すことができる。
ここで、Z1は次の漸化式を使用して計算される:
を使用する、任意のメチル化状態の確率の評価が可能となる。
によって統計的に特徴付けられるが、これはゲノム・サブ領域内のメチル化状態の確率分布 Pr[X=x]から、次式
によって、計算において効率的な方法で行う。ここで、Z 及び Zn(xn)は式 (9) 及び (10) を使用して計算し、φn(xn,xn+1)は式 (11) を使用して計算し、Qr(xr)は次の漸化式によって計算する:
別の実施形態では、本発明は、ゲノムの平均メチル化状態の計算及び解析を含むエピジェネティック解析を実施するための方法を提供する。前記方法は以下を含む:a)前記ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;c)ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内の平均メチル化状態を定量化し、それによってエピジェネティック解析を実施すること。
更に別の実施形態では、本発明は、ゲノムのエピジェネティックの不確実性(epigenetic uncertainty)の計算及び解析を含むエピジェネティック解析を実施するための方法を提供する。前記解析は以下を含む:a)前記ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び c)前記ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内のメチル化の不確実性(methylation uncertainty)を定量化し、それによってエピジェネティック解析を実施すること。
別の実施形態において、本発明は、第 1 ゲノムと第 2 ゲノムとの間のエピジェネティックの不一致(epigenetic discordance)を解析すること(1 人以上の患者から入手したゲノムであり、正常状態と、がん等の疾患状態との間のエピジェネティックの不一致(epigenetic discordance)を解析することを含むがこれに限定されない)を含むエピジェネティック解析を実施するための方法を提供する。前記解析は以下を含む:a)第 1 及び第 2 ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルを各ゲノムのメチル化データに合わせることによって、第 1 及び第 2 ゲノムのゲノム領域内のメチル化状態を解析すること;及びc)第 1 と第 2 ゲノムとの間のゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域について、前記確率分布間及び/又はそこから導出される量間の差及び/又は距離を定量化すること;を含み、それによってエピジェネティック解析を行う。
は、相対エントロピー又はカルバック‐ライブラー・ダイバージェンス(Kullback-Leibler divergence)である。前記 JSD は、0 と 1 の間の値をとる標準化距離メトリック(normalized distance metric)であり、一方、平方 JSD は、2 つの確率分布 P 又は Q の一方から導き出されるメチル化レベルの値が分布の同一性について提供する平均の情報である。前記 JSD は、2 つの分布が同一である場合にのみ 0 に等しく、2 つの分布が重ならず、従って単一のゲノム・サンプルと完全に区別できる場合には、前記 JSD は、その最大値である 1 になる。
更に別の実施形態では、本発明は、メチル化レベルの確率分布の歪度及び/又は二峰性(bimodality)を検出すること、並びにゲノム領域の平均メチル化状態を、双安定性を含む別々のクラスに分類すること、を含むエピジェネティック解析を実施するための方法を提供する。検出及び分類は以下を含む:a)前記ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び、c)前記メチル化レベルの確率分布の歪度及び/又は二峰性(bimodality)を検出し、ゲノム領域の平均メチル化状態を、双安定性を含む別々のクラスに分類し、それによってエピジェネティック解析を実施すること。
更に別の実施形態では、本発明は、ゲノム領域内のメチル化の不確実性(methylation uncertainty)を別々のクラスに分類することを含むエピジェネティック解析を実施するための方法を提供する。分類は以下を含む:a)前記ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び、c)ゲノム領域のメチル化の不確実性(methylation uncertainty)を別々のクラスに分類し、それによってエピジェネティック解析を実施すること。
・高秩序: 0≦h≦0.28の場合
・中秩序:0.28<h≦0.44の場合
・弱秩序/無秩序:0.44<h<0.92の場合
・中無秩序: 0.92 ≦h<0.99 の場合
・高無秩序 0.99 ≦h≦1の場合。
別の実施形態において、本発明は、メチル化領域及びメチル化ブロックの計算を含むエピジェネティック解析を実施するための方法を提供する。計算は以下を含む:a)前記ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び、c)ゲノム全体にわたって、ゲノム領域のメチル化状態を分類すること;d)前記分類結果をメチル化領域及びメチル化ブロックにグループ化し、それによってエピジェネティック解析を実施すること。
更に別の実施形態では、本発明は、エントロピー領域及びエントロピー・ブロックの計算を含むエピジェネティック解析を実施するための方法を提供する。計算は以下を含む:a)前記ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;c)ゲノム全体にわたって、ゲノム領域のメチル化の不確実性(methylation uncertainty)を分類すること;及び、d)前記分類結果をエントロピー領域及びエントロピー・ブロックにグループ化し、それによってエピジェネティック解析を実施すること。
別の実施形態では、本発明は、メチル化チャネル(methylation channels)を介したエピジェネティック・メンテナンスの情報的特性を計算することを含むエピジェネティック解析を実施するための方法を提供する。前記解析は以下を含む:a)前記ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び、c)ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内のエピジェネティック・メンテナンスの情報的特性(メチル化チャネル(methylation channels)の容量及び相対散逸エネルギーを含むがこれらに限定されない)を定量化し、それによってエピジェネティック解析を実施すること。
ここで、Pn(1)は CpG 部位がメチル化されている確率である。前記 CGE は、周辺化(marginalization)を使用してイジング・モデルから計算される n 番目の CpG 部位がメチル化されている確率Pn(1) により、式 (26) を使用して、メチル化データから直接に計算される。
による伝達誤差の確率におよそ関連すると仮定される。ここで、kBはボルツマン定数で、Tn は CpG 部位の絶対温度である。比例係数はこの関係では知られていないので、相対散逸エネルギー(relative dissipated energy(RDE))
更に別の実施形態では、本発明は、ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内のメチル化システムの情報的/統計的特性(エントロピーを含むがこれに限定されない)の撹乱(perturbations)に対する感受性を計算することを含むエピジェネティック解析を実施するための方法を提供する。前記解析は以下を含む:a)前記ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び、c)ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内のメチル化システムの情報的/統計的特性(エントロピーを含むがこれに限定されない)の撹乱(perturbations)に対する感受性を定量化し、それによってエピジェネティック解析を実施すること。
別の実施形態では、本発明は、第 1 ゲノムと第 2 ゲノムとの間のメチル化状態において、より高次の統計的な差異(エントロピー又は情報距離を含むがこれらに限定されない)を示す一方で、平均に基づく解析には隠れている、潜在的に重要な生物学的機能(正常状態に対してがん等の疾患状態の調節を含むがこれらに限定されない)を有するゲノムの特徴(遺伝子プロモーターを含むがこれらに限定されない)を同定するエピジェネティック解析を実施するための方法を提供する。同定は以下を含む:a)第 1 及び第 2 ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルを各ゲノムのメチル化データに合わせることによって、第 1 ゲノム及び第 2 ゲノムについてゲノム領域内のメチル化状態を解析すること;及び、c)第 1 ゲノムと第 2 ゲノムとの間のより高次の統計量(エントロピー又は情報距離を含むがこれらに限定されない)において、比較的低い平均差であるが、比較的高いエピジェネティックの差異を有するゲノムの特徴(遺伝子プロモーターを含むがこれに限定されない)を同定し、それによってエピジェネティック解析を実施すること。
更に別の実施形態では、本発明は、メチル化における双安定性と潜在的に重要な生物学的機能を有するゲノムの特徴(遺伝子プロモーターを含むがこれに限定されない)との間の関係を同定するエピジェネティック解析を実施するための方法を提供する。前記解析は以下を含む:a)1 つ以上のゲノム・サンプル中のゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び、c)1 つ以上のゲノム・サンプル中のメチル化状態における高い双安定性に関連するゲノムの特徴(遺伝子プロモーターを含むがこれに限定されない)を同定し、それらを潜在的に重要な生物学的機能に関連付け、それによってエピジェネティック解析を実施すること。
別の実施形態において、本発明は、クロマチン実験を行わずに、ゲノムのトポロジカル関連ドメイン(topologically associating domains(TAD))の境界を検出する、エピジェネティック解析を実施するための方法を提供する。検出は以下を含む:a)1 つ以上のゲノム・サンプル中のゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、各ゲノムのゲノム領域内のメチル化状態を解析すること;及び、c)TAD 境界を位置決めし、それによってエピジェネティック解析を実施すること。
更に別の実施形態では、本発明は、メチル化データからユークロマチン/ヘテロクロマチン・ドメイン(ゲノムの 3 次元構造の区画 A 及び区画 B を含むがこれらに限定されない)を予測するエピジェネティック解析を実施するための方法を提供する。予測は以下を含む:a)前記ゲノムを別々のゲノム領域に分節すること;b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び、c)ユークロマチン/ヘテロクロマチン・ドメインの情報を以前に測定した、又は推定したデータに基づいてトレーニングした回帰モデル又は分類モデルを使用してユークロマチン/ヘテロクロマチン・ドメイン(A/B 区画の構成を含むがこれに限定されない)を推定するために、複数の領域からの結果を組み合わせ、それによってエピジェネティック解析を実施すること。
様々な実施形態において、ゲノムは、被験体から採取された生物学的サンプル中に存在する。前記生物学的サンプルは、実質的に任意の生物学的サンプル、特に被験体由来の DNA を含むサンプルであっても良い。前記生物学的サンプルは、生殖細胞系、幹細胞、リプログラム化した細胞、培養細胞、又は 1000 から約 10,000,000 個の細胞を含む組織サンプルであっても良い。しかしながら、PCR などの増幅プロトコルを利用する実施形態では、より少数の細胞(もっと言えば 1 個の細胞)を含むサンプルを得ることが可能である。前記サンプルは、ゲノムの 1 つ以上の領域内のメチル化状態を評価するのに十分な生物学的材料(例えば、DNA)を含む限り、損傷を受けていない細胞を含む必要はまったくない。前記サンプルはまた、ATAC-seq 又は同様の方法によって、ユークロマチン及びヘテロクロマチンを解析するためのクロマチンを含むことがある。
本発明はメチル化解析のための WGBS の使用を例示しているが、実際には、例えば、核酸増幅、ポリメラーゼ連鎖反応(PCR)、バイサルファイト・パイロシークエンシング(bisulfite pyrosequencing)、ナノポア・シークエンシング(nanopore sequencing)、454 シークエンシング、インサーション・タグド・シークエンシング(insertion tagged sequencing)等を含む、核酸シークエンシング又はメチル化状態若しくはクロマチン状態を解析するための多くの他の方法を使用しても良い。実施形態において、本発明の方法論は、イルミナ社(Illumina, Inc,)(HiSeq(登録商標)X10、HiSeq(登録商標)1000、HiSeq(登録商標)2000、HiSeq(登録商標)2500、Genome Analyzers(登録商標)、MiSeq(登録商標)システム)、アプライド・バイオシステムズ・ライフ・テクノロジー社(Applied Biosystems Life Technologies)(ABI PRISM(登録商標)シークエンス検出システム、SOLiD(登録商標)システム、Ion PGM(登録商標)シークエンサー、ion Proton(登録商標)シークエンサー)によって提供されるようなシステムを利用する。核酸解析はまた、オックスフォード・ナノポア・テクノロジー社(Oxford Nanopore Technologies)(GridiON(登録商標)、MiniON(登録商標))又はパシフィック・バイオサイエンス社(Pacific Biosciences)(Pacbio(登録商標)RS II)によって提供されるシステムによっても実施することができる。シークエンシングはまた、標準的なサンガー・ジデオキシ・ターミネーター・シークエンシング(Sanger dideoxy terminator sequencing)方法及び装置によって、又は他のシークエンシング機器上で、更に、例えば、米国特許及び特許出願 U.S. Pat. Nos. 5,888,737、6,175,002、5,695,934、6,140,489、5,863,722、2007/007991、2009/0247414、2010/01 11768 及び PCT 出願WO2007/123744 に記載の方法及び装置によっても実施することができ、これらはそれぞれ、その全体が参照により本明細書に組み込まれる。とりわけ重要なことに、実施形態では、バイサルファイト変換有り又は無しで、本明細書に記載の方法の何れかを使用してシークエンシングを行うことがある。
本明細書に記載した方法は、がんなどの疾患を予測、診断及び/又はモニターするための様々な方法で使用することがある。更に、前記方法を、様々な細胞タイプを互いに区別するために、並びに細胞年齢を測定するために利用することがある。これらの態様は、試験ゲノム(test genome)についてそれぞれのエピジェネティック解析の方法を実行し、そして得られたエピジェネティック尺度を、参照ゲノムについての対応する既知の尺度(即ち、既知の細胞タイプ又は疾患に対する尺度)と比較することによって、行うことがある。
本発明は、機能的構成要素及び様々な処理工程に関して部分的に説明されている。そのような機能構成要素及び処理工程は、指定した機能を実行し、様々な結果を達成するように設計した任意の数の構成要素、動作、及び技法によって実現することがある。例えば、本発明は、様々な生物学的サンプル、バイオマーカー、要素、材料、コンピュータ、データ・ソース、保存システム及びメディア、情報収集技術及び処理、データ処理基準、統計解析、回帰分析などを使用することがあり、これらは様々な機能を実施することがある。更に、本発明は医療診断の文脈で説明されているが、本発明を任意の数の用途、環境及びデータ解析と併せて実施することがある;即ち、本明細書に記載のシステムは、前記発明の単なる例示的な用途である。
この例では、十分に根拠のある生物学的仮定と統計物理学及び情報‐理論の原則を使用して、シャノンのエントロピー(Shannon’s entropy)とジェンセン‐シャノン距離(Jensen-Shannon distance)を使用して、ゲノム‐ワイドなメチル化の確率及びエピジェネティックの差異の定量化を可能にする、全ゲノム・バイサルファイト・シークエンシング・データから、ポテンシャル・エネルギー・ランドスケープ(potential energy landscapes)を導く。本実施例では、生殖細胞系列の「発生ホイール(developmental wheel)」の発見、並びに差分平均メチル化(differential mean methylation)は僅かだがエピジェネティックの差異は大きいことによって特徴づけられる、発生学的に重要な遺伝子を同定すること、メチル化レベルにおける双安定性とインプリンティングとの間の関係、エントロピー及びメチル化チャネル(methylation channels)の情報‐理論的な性質とクロマチン構造との間の関係、及びエピジェネティックの確率に与える環境の影響をエントロピー感受性解析を使用して定量化することの重要性、について詳述する。前記実施例は、本発明の主な可能性を説明し、健康及び疾患におけるエピジェネティック情報の解析及び分類のための強力な計算方法論及び計算システムを提供することによって、エピゲノムの情報‐理論的な性質を基本的に理解できるように使用される。
全ゲノム・バイサルファイト・シークエンシング・サンプル
10 種類のゲノム・サンプルに相当する、以前に公表された WGBS データを使用したが、それは、H1 ヒト胚性幹細胞、結腸由来の正常及び対応するがん細胞、肝臓由来の正常及び対応するがん細胞 、若年及び高齢者由来の日焼け防止をした部位の皮膚生検由来のケラチノサイト、及び EBV で不死化したリンパ芽球を含む(下記の補足表1)。肝臓及び肺由来の正常及び対応したがん細胞、前頭前野皮質、5 種の継代数の培養 HNF 線維芽細胞、並びに若年及び高齢者から選別した CD4+ T‐細胞を含む、25 種類のゲノム・サンプルに相当する追加のWGBSデータも生成したが、全て IRB の承認を得た(下記の補足表1)。前頭前野皮質サンプルは、メリーランド大学脳・組織バンク(University of Maryland Brain and Tissue Bank)から入手したが、これは NIH NeuroBioBank の脳・組織レジストリー(Brain and Tissue Repository)である。末梢血単核細胞(PBMCs)を健康な被検体から採取した末梢血から単離し、そしてフィコール密度勾配分離法(シグマ‐アルドリッチ社(Sigma-Aldrich))を使用することによって分離した。続いて、CD4+ T‐細胞を、MACS 磁気ビーズ技術(ミルテニ社(Miltenyi))を使用したポジティブ・セレクションにより PBMCs から単離した。分離後のフロー・サイトメトリーによれば CD4+ T‐細胞の純度は 97 %であると評価された。初代新生児皮膚線維芽細胞をロンザ社(Lonza)から入手し、15 % FBS(ジェミニ・バイオプロダクツ社(Gemini BioProducts))を添加したギブコ(Gibco)の DMEM 中で培養した。
ゲノム DNA は、Masterpure(登録商標)DNA Purification Kit(エピセンタ社(Epicentre))を使用してサンプルから抽出した。高分子量の抽出された DNA を、1 %アガロース・ゲルに流し、そしてNanodrop でサンプルの 260/280 及び 260/230 比を評価することによって確認した。濃度は、Qubit 2.0 Fluorometer(登録商標)(インビトロジェン社(Invitrogen))を使用して定量した。
全てのサンプルについて、1 %非メチル化 Lamda DNA(プロメガ社、カタログ番号 D1521(Promega, cat # D1521))をバイサルファイト変換効率をモニターするために添加した。Covaris S2(登録商標)ソニケーター(ウーバン、マサチューセッツ州(Woburn、MA))を使用してゲノム DNA を平均サイズ 350 塩基対にフラグメント化した。製造者の指示に従って、イルミナ TruSeq(登録商標) DNA ライブラリ調製キット(Illumina TruSeq(登録商標)DNA Library Preparation kit)のプロトコル(プライマーを含む)又はNEBNext Ultra(登録商標)(NEBNext Multiplex Oligos for Illumina モジュール、ニュー・イングランド・バイオラボ社、カタログ番号 E7535L(NEBNext Multiplex Oligos for Illumina module, New England BioLabs, cat # E7535L))を使用して、バイサルファイト・シークエンシング・ライブラリを構築した。両プロトコルとも、Kapa HiFi Uracil+ PCR システム(カパ・バイオシステムズ社、カタログ番号 KK2801(Kapa Biosystems, cat # KK2801))を使用している。
リード(reads)のシングル‐パスのアダプター‐及び品質‐トリミングを実行するために Trim Galore!(登録商標)v0.3.6(バブラハム研究所(Babraham Institute))を使用して、並びにシークエンシング・データの一般的な品質チェックのために FastQC(登録商標)v0.11.2 を実行して、FASTQ ファイルを処理した。次に、Bismark(登録商標)v0.12.3 及び Bowtie2(登録商標)v2.1.0 を使用して、リード(reads)を hg19/GRCh37 に並べ合わせた(aligned)。リード 1(read 1)とリード 2(read 2)の別々の mbias プロットを、“mbias_only”フラグ(flag)を使用する Bismark メチル化エクストラクター(methylation extractor)を動かすことによって生成する。これらのプロットを、リード(reads)の 5 ' 末端から除去する塩基数を決定するために使用した。5 ' 末端のトリミング量は 4 から 25 塩基対の範囲であり、最も一般的な値は約 10 塩基対であった。続いて、BAM ファイルを、ソート、マージ、重複削除、及びインデックス作成のために、Samtools(登録商標)v0.1.19 を使って、処理した。
ファイルとトラックは、hg19 のゲノム座標を持っている。CpG アイランド(CpG islands(CGIs))は [Wu, H. et al. Biostatistics 11, 499-514 (2010)] から得た。CGI ショア(CGI shores)をアイランド両側の 2000 塩基対の隣接する配列として、シェルフ(shelves)をショア(shores)両側の 2000 塩基対の隣接する配列として、そしてオープン・シー(open seas)をその他の全てとして定義した。R Bioconductor(登録商標)パッケージ「TxDb.Hsapiens.UCSC.hg19.knownGene」をエクソン、イントロン及び転写開始部位(TSSs)を定義するために使用した。プロモーター領域を TSSs の両側の 2000 塩基対の隣接する配列として定義した。少なくとも 3 つの独立したトランスジェニック胚において再現性のある発現を示す全てのヒト(hg19)ポジティブ・エンハンサーをダウンロードすることにより、VISTA(登録商標)エンハンサー・ブラウザ(VISTA(登録商標)Enhancer Browser(http://enhancer.lbl.gov))からキュレートした(curated)エンハンサーのリストを得た。低メチル化ブロック(結腸及び肺がん)は [Timp, W. et al. Genome Med. 6, 61 (2014)] から得た。H1 幹細胞 LOCKs 及びヒト肺線維芽細胞(HPF)LOCKs は [Wen, B. et al. BMC Genomics 13, 566 (2012)] から得た。胚性肺線維芽細胞由来の Tig3 細胞に関連する LAD トラックは [Guelen, L. et al. Nature 453, 948-951 (2008)] から得た。遺伝子の内部(gene bodies)は UCSC ゲノム・ブラウザから得た。H1 及び IMR90 のTAD 境界は http://chromosome.sdsc.edu/mouse/hi-c/download.html から得た。区画 A と区画 B の中へ処理された Hi-C データ用の BED ファイルは Fortin と Hansen(https://github.com/Jfortin1/HiC_AB_Compartments)によって提供された。CTCF 及び EZH2/SUZ12 結合データは UCSC ゲノム・ブラウザ [Transcription Factor ChIP-seq track (161 factors) from ENCODE] から得た。
生ファイルを、アクセッション番号 SRP072078, SRP072071, SRP072075, 及び SRP072141 として NCBI’s Sequencing Read Archive (SRA) に登録したが、これらは、その全体が参照により本明細書に取り込まれる。
確率的エピジェネティック変異及びポテンシャル・エネルギー・ランドスケープ(Stochastic Epigenetic Variation and Potential Energy Landscapes)
メチル化 PEL VX(x) を、例えば、幹細胞、結腸、肝臓、肺、及び脳組織由来の正常細胞、これら組織のうちの 3 つの組織由来のマッチした(matched)がん、5 種の継代数の培養線維芽細胞、若年者及び高齢者由来の CD4+ リンパ球及び皮膚ケラチノサイト、並びに EBV‐不死化リンパ芽球等を含む 35 ゲノム・サンプルに対応する WGBS データから推定した(下記の補足表1)。この目的のために、前記ゲノムをそれぞれ 3000 塩基対の長さの連続した重なりの無いゲノム領域に分節し、そして先に導入した最尤推定法(maximum-likelihood estimation)を使用して、各ゲノム領域内の PEL パラメータを推定した。この戦略は、各個々の CpG 部位における周辺確率を推定する慣習的なアプローチとは対照的に、複数のメチル化リードで利用可能な全情報、特に CpG 部位におけるメチル化間の相関、を適切に組み合わせることを利用する(図1A)。
前記 NME は、ゲノム・サブ領域内の個々の CpG 部位のメチル化平均の平均である、平均メチル化レベル(mean methylation level(MML))と供に、イジング・モデルを使用して低カバレッジ(low covelage)な WGBS データからゲノム‐ワイドに信頼性をもって計算することができる、メチル化の不確実性(methylation uncertainty)の有効な尺度である。MML 及び NME 値のゲノム‐ワイドな分布を計算し、ゲノム・サンプル間で比較する。以前の報告と一致して、幹細胞及び脳組織における MML は、正常結腸、肝臓、及び肺におけるよりも全体的に高く、そして同じことが CD4+ リンパ球及び皮膚ケラチノサイトについても当てはまった(図2A)。更に、前記 MML は、解析した 7 種のがん全てにおいて、それらのマッチした正常組織と比較して減少し(図2A、B)、そして培養線維芽細胞においても継代に従って失われた(図2A)。低 NME は幹細胞及び脳細胞、並びに若年の被験者に関連する CD4+ リンパ球及び皮膚ケラチノサイト、において観察され、肝臓がん以外の多くのがんにおいて NME の全体的な増加も観察され、肝臓がんはより少ないエントロピーのメチル化状態をもたらす著しい低メチル化を示した(図2及び3)。がんにおける NME の変化はしばしば MML の変化と関連していたが(図3A)、これはしばしばそうでないこともあった(図3B、C、D)。これは確率の変化が必ずしも平均メチル化の変化に関連しないことを示し、生物学的サンプルを調査する際には両方を評価することが必要である。
エピジェネティックの情報と表現型のばらつきとの関係を理解するために、ジェンセン‐シャノン距離(Jensen-Shannon distance(JSD))を使用して、ゲノム・サンプルのペア間のエピジェネティックの不一致(epigenetic discordance)を正確に定量化することを試みた。そして、この距離を、結腸、肺、及び肝臓を互いに、並びにマッチしたがん並びに幹細胞、脳、及び CD4+ リンパ球から区別するために使用できるかどうかを検討した。計算可能性のために、前記研究を 17 種の代表的な細胞及び組織サンプルに限定し、全 136 ペアのエピジェネティック距離をゲノム‐ワイドに計算した。その結果を多次元尺度法(multidimensional scaling)を実行することによって視覚化した。サンプルは、発生胚層(図6)に基づく明確なカテゴリーに分類され、外胚葉(脳)、中胚葉(CD4)、及び内胚葉(正常結腸、肺、及び肝臓)由来組織が幹細胞からほぼ等距離に位置した。一方、がん性組織は、それらの正常のマッチした組織、並びに幹細胞とは程遠いものであった(図6)。
メチル化における双安定性が重要な生物学的機能と関連しているかどうかを調べるために、その可能性のある富化(enrichment)をいくつかのゲノムの特徴の中で調べた。
また、TAD 境界を計算的に位置決めするために、前記 NME を有効に使用できるかどうかも調べた。
メチル化チャネル(methylations channels(MCs))の情報容量(information capacities(ICs))、相対散逸エネルギー(relative dissipated energies(RDEs))、及びCpG エントロピー(CpG entropies(CGEs))を個々のゲノム・サンプルで計算し、比較研究をゲノム‐ワイドに行った(図13)。結腸がん及び肺がんでは、IC 及び RDE が減少する全体的な傾向が観察され、CGE が全体的に増加することを伴ったが、これは肝臓がんには当てはまらなかった。更に、幹細胞は狭い範囲の比較的高い IC 及び RDE値を示し、一方、脳細胞、CD4+ リンパ球及び皮膚ケラチノサイトは高レベルの IC 及び RDE を示し、高齢者では顕著に減少していた。注目すべきことに、CpG アイランド(CpG islands(CGIs))及び転写開始部位(transcription start sites(TSSs))内のメチル化状態は、ショア(shores)、シェルフ(shelves)、オープン・シー(open seas)、エクソン、イントロン及び遺伝子間領域内(intergenic regions)よりも全体的にかなり高い容量の MCs によって維持されていて、これは有意により高いエネルギー消費によって成されている(図14A、B)。
WGBS データからメチル化チャネル(methylation channels(MCs))を計算し、結果を Hi-C 実験から得られた EBV 細胞の利用可能な A/B 区画トラック(A/B compartment tracks)と比較すると、区画 B 内に低 IC、高 NME、及び低 RDE が富化(enrichment)していることが明らかになり、それと反対のことが区画 A について全体的に観察された(図15A、B)。これらの結果から、メチル化メンテナンスの情報‐理論的な特性を区画 A 及び B の位置を予測するのに有効に使用できるという仮説、が導びかれた。この予測を試すために、ランダム・フォレスト回帰モデルを使用して、利用可能な「グラウンド・トゥルース(ground-truth)」データから区画 A/B の情報構造を学習した。それは、少ない利用可能な Hi-C データを含み、そのデータは EBV 及び IMR90 サンプルと関連し、[Dixon, J. R. et al. Nature 518, 331-336, (2015)] から得られ、並びに、結腸がん、肝臓がん及び肺がんサンプルに関連するプールされた 450k のアレイ・データから計算された長距離相関に基づいて、フォーティン(Fortin)及びハンセン(Hansen (FH))によって開発された方法[Fortin, J. P. & Hansen, K. D. Genome Biol. 16, 180, (2015)] を使用して、A/B トラックが生み出すものである。現在入手可能な Hi-C データが不足しているため、トレーニング・サンプル数を増やし、パフォーマンス評価の精度を向上させるために FH データを含めた。
DNA のメチル化の変化やクロマチンの翻訳後修飾等のエピジェネティックの変化は、外部及び内部の環境シグナルを遺伝的変異と統合して表現型を調節する。これに関して、メチル化エントロピーに与える環境変動の影響を定量化できるようにする感受性解析のアプローチに従うことにより、メチル化の確率に与える環境曝露の影響を調査することを試みた。この目的のために、環境変動を、メチル化 PEL パラメータに直接影響を及ぼすプロセスと見なし、パラメータ変動に対する NME の相対的尺度としてエントロピー感受性指数(entropic sensitivity index(ESI))の使用を可能にする確率的アプローチを開発した。単一の WGBS データからゲノム‐ワイドに ESI 値を計算することにより、個々のゲノム・サンプル並びに比較研究において、エピジェネティックの不確実性(epigenetic uncertainty)に与える環境的なゆらぎの影響を定量化することが可能になった(図20、21及び22)。例えば、結腸正常では、WNT1 に関連する CGI 内にかなりのエントロピー感受性が観察されたが、結腸がんでは、その CGI の一部でエントロピーが増加し及び感受性が減少した(図20A)。
この明細書では、統計物理学のイジング・モデルを使用して、全ゲノム・バイサルファイト・シークエンシングから、固有のエピジェネティックの確率(epigenetic stochasticity)を表すエピジェネティック・ポテンシャル・エネルギー・ランドスケープ(epigenetic potential energy landscapes(PELs))を導き出した。外部「ノイズ(noise)」という項を含むエピジェネティック・ランドスケープではなく、メチル化の処理能力、距離依存的な協同性、及び CpG 密度という生物学的に正しい原則を使用して、DNA のメチル化ランドスケープのモデリングに対する厳密なアプローチを構築した。このアプローチにより、低カバレッジ(low covelage)データから DNA のメチル化における確率をモデル化することができただけでなく、高解像度でシャノン(Shannon)のエントロピーをゲノム‐ワイドに解析することも可能となった。情報理論の基本原理をメチル化チャネル(methylation channels)のフレームワークに組み込むことによって、Hi-C 実験を行うこと無しに、単一の WGBS サンプルから高次クロマチン構造(high-order chromatin organization)を詳細に予測することも可能となった。
図1は、ポテンシャル・エネルギー・ランドスケープ(potential energy landscapes)に関するものである。1A:ゲノム遺伝子座内のメチル化状態の複数の WGBS リード(reads)を使用して、成分が各 CpG 部位のメチル化状態を表すメチル化行列を形成する(1:メチル化、0:非メチル化、ND:データなし)。メチル化解析のための多くの方法は、CpG 部位に関連する各列内のみのメチル化情報を使用することにより、個々の CpG 部位における周辺メチル化確率及び平均を推定するものである。本発明において提示される統計物理学アプローチは、メチル化行列の各行の尤度を決定し、行にわたるこの情報を平均尤度に組み合わせ、そしてこの尤度を PEL パラメータに関して最大化することによって、最も可能性の高い PEL を計算する。1B:結腸正常及び結腸がんにおける WNT1、並びに幹及び脳における EPHA4 の CpG アイランドに関連する PELs。点 (m, n) はメチル化状態を示し、(0, 0) は完全な非メチル化状態を示し、これは両方の例において基底状態(すなわち最低ポテンシャルの状態)でもある。1C:この研究で使用した全てのゲノム・サンプルについてのイジング PEL パラメータ分布の箱ひげ図。前記箱には25 %分位点、中央値、75 %分位点が表示されているが、各ひげの長さは1.5×四分位間範囲 である。
)内のゲノム‐ワイドな ESI 分布の箱ひげ図は、区画 B 内よりも区画 A 内のエントロピー感受性が高いことを示す。前記箱には 25 %分位点、中央値、75 %分位点が表示されているが、各ひげの長さは 1.5×四分位間範囲 である。
(1)Bandopadhayay, P. et al. MYB-QKI rearrangements in angiocentric glioma drive tumorigenicity through a tripartite mechanism. Nat. Genet. 48, 273-282, doi:10.1038/ng.3500 (2016).
(2)Baxter, R. J. Exactly Solved Models in Statistical Mechanics. Academic Press, doi: 10.1142/9789814415255_0002 (1982).
(3)Bennet, C. H. The thermodynamics of computation - a review. Int. J. Theor. Phys. 21, 905-940, doi:10.1007/BF02084158 (1982).
(4)Bergman, Y. & Cedar, H. DNA methylation dynamics in health and disease. Nat. Struct. Mol. Biol. 20, 274-281, doi:10.1038/nsmb.2518 (2013).
(5)Berman, B. P. et al. Regions of focal DNA hypermethylation and long-range hypomethylation in colorectal cancer coincide with nuclear lamina-associated domains. Nat. Genet. 44, 40-46, doi:10.1038/ng.969 (2012).
(6)Bickel, P. J. & Doksum, K. A. Mathematical Statistics: Basic Ideas and Selected Topics, Volume I. Prentice-Hall, doi: 10.2307/2286373 (2007).
(7)Boyes, J. & Bird, A. Repression of genes by DNA methylation depends on CpG density and promoter strength: evidence for involvement of a methyl-CpG binding protein. EMBO J. 11, 327-333 (1992).
(8)Cover, T. M. & Thomas, J.A. Elements of Information Theory. John Wiley & Sons, 10.1002/047174882X (2006).
(9)de la Cruz, C. C. et al. The polycomb group protein SUZ12 regulates histone H3 lysine 9 methylation and HP1 alpha distribution. Chromosome Res. 15, 299-314, doi:10.1007/s10577-007-1126-1 (2007).
(10)DeBaun, M. R. et al. Epigenetic alterations of H19 and LIT1 distinguish patients with Beckwith-Wiedemann syndrome with cancer and birth defects. Am. J. Hum. Genet. 70, 604-611, doi:10.1086/338934 (2002).
(11)Dekker, J., Marti-Renom, M. A. & Mirny, L. A. Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data. Nat. Rev. Genet. 14, 390-403, doi:10.1038/nrg3454 (2013).
(12)Dixon, J. R. et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature 485, 376-380, doi:10.1038/nature11082 (2012).
(13)Dixon, J. R. et al. Chromatin architecture reorganization during stem cell differentiation. Nature 518, 331-336, doi:10.1038/nature14222 (2015).
(14)Eden, E. et al. GOrilla: a tool for discovery and visualization of enriched GO terms in ranked gene lists. BMC Bioinformatics 10, 48, doi:10.1186/1471-2105-10-48 (2009).
(15)Feng, F. et al. Genomic landscape of human allele-specific DNA methylation. Proc. Natl. Acad. Sci. USA, 109, 7332-7337 (2012).
(16)Fashami, M. S., Atulasimha, J. & Bandyopadhyay, S. Energy dissipation and error probability in fault-tolerant binary switching. Sci. Rep. 3, 3204, doi:10.1038/srep03204 (2013).
(17)Favorov, A. et al. Exploring massive, genome scale datasets with the GenometriCorr package. PLoS Comput. Biol. 8, e1002529, doi:10.1371/journal.pcbi.1002529 (2012).
(18)Fortin, J. P. & Hansen, K. D. Reconstructing A/B compartments as revealed by Hi-C using long-range correlations in epigenetic data. Genome Biol. 16, 180, doi:10.1186/s13059-015-0741-y (2015).
(19)Friel, N. & Rue, H. Recursive computing and simulation-free inference for general factorizable models. Biometrika, 94, 661-672, doi: 10.1093/biomet/asm052 (2007).
(20)Fu, A. Q. et al. Statistical inference of transmission fidelity of DNA methylation patterns over somatic cell divisions in mammals. Ann. Appl. Stat. 4, 871-892, doi: 10.1214/09-AOAS297 (2010).
(21)Fu, A. Q. et al. Statistical inference of in vivo properties of human DNA methyltransferases from double-stranded methylation patterns, PLoS One, 7, e32225, doi:10.1371/journal.pone.0032225 (2012).
(22)Genereux, D. P. et al. A population-epigenetic model to infer site-specific methylation rates from double-stranded DNA methylation patterns, P. Natl. Acad. Sci. USA, 102, 16, 5802-5807, 10.1073/pnas.0502036102 (2005).
(23)Gibcus, J. H. & Dekker, J. The hierarchy of the 3D genome. Mol. Cell 49, 773-782, doi:10.1016/j.molcel.2013.02.011 (2013).
(24)Guelen, L. et al. Domain organization of human chromosomes revealed by mapping of nuclear lamina interactions. Nature 453, 948-951, doi:10.1038/nature06947 (2008).
(25)Hansen, K. D. et al. Increased methylation variation in epigenetic domains across cancer types. Nat. Genet. 43, 768-775, doi:10.1038/ng.865 (2011).
(26)Hansen, K. D. et al. Large-scale hypomethylated blocks associated with Epstein-Barr virus-induced B-cell immortalization. Genome Res. 24, 177-184, doi:10.1101/gr.157743.113 (2014).
(27)Huang, J., Marco, E., Pinello, L. & Yuan, G. C. Predicting chromatin organization using histone marks. Genome Biol. 16, 162, doi:10.1186/s13059-015-0740-z (2015).
(28)Huyer, W. & Neumaier, A. Global optimization by multilevel coordinate search. J. Global Optim. 14, 331-355 (1999).
(29)Illingworth, R. S. & Bird, A. P. CpG islands - ‘A rough guide’, FEBS Lett., 583, 1713-1720, doi 10.1016/j.febslet.2009.04.012 (2009).
(30)Kaneda, H. et al. FOXQ1 is overexpressed in colorectal cancer and enhances tumorigenicity and tumor growth. Cancer Res. 70, 2053-2063, doi:10.1158/0008-5472.CAN-09-2161 (2010).
(31)Kohli, R. M. & Zhang, Y. TET enzymes, TDG and the dynamics of DNA demethylation, Nature, 502, 472-479, doi:10.1038/nature12750 (2013).
(32)Lacey, M. R. & Ehrlich, M. Modeling dependence in methylation patterns with application to ovarian carcinomas, Stat. Appl. Genet. M. B. 8, 40, doi:10.2202/1544-6115.1489 (2009).
(33)Landan, G. et al. Epigenetic polymorphism and the stochastic formation of differentially methylated regions in normal and cancerous tissues. Nat. Genet. 44, 1207-1214, doi:10.1038/ng.2442 (2012).
(34)Landauer, R. Uncertainty principle and minimal energy dissipation in the computer. Int. J. Theor. Phys. 21, 283-297, doi:10.1007/BF01857731 (1982).
(35)Lewis, A. & Murrell, A. Genomic imprinting: CTCF protects the boundaries. Curr. Biol. 14, R284-286, doi:10.1016/j.cub.2004.03.026 (2004).
(36)Li, S. et al. Dynamic evolution of clonal epialleles revealed by methclone. Genome Biol. 15, 472, doi:10.1186/s13059-014-0472-5 (2014).
(37)Lin, J. Divergence measures based on the Shannon entropy. IEEE Trans. Inform. Theory 37, 145-151, doi: 10.1109/18.61115 (1991).
(38)Mannens, M. et al. Positional cloning of genes involved in the Beckwith-Wiedemann syndrome, hemihypertrophy, and associated childhood tumors. Med. Pediatr. Oncol. 27, 490-494, doi:10.1002/(SICI)1096-911X(199611)27:5<490::AID-MPO17>3.0.CO;2-E (1996).
(39)Margueron, R. & Reinberg, D. The Polycomb complex PRC2 and its mark in life. Nature 469, 343-349, doi:10.1038/nature09784 (2011).
(40)Marvan, M. The energy dissipation, the error probability and the time of duration of a logical operation. Kybernetika, 18, 345-355, doi: 10.1038/srep03204 (1982).
(41)Murtagh, F. & Legendre, P. Ward’s hierarchical agglomerative clustering method: Which algorithms implement Ward's criterion? J. Classif. 31, 274-295, doi: 10.1007/s00357-014-9161-z (2014).
(42)Nakamura, T. et al. Fusion of the nucleoporin gene NUP98 to HOXA9 by the chromosome translocation t(7;11)(p15;p15) in human myeloid leukaemia. Nat. Genet. 12, 154-158, doi:10.1038/ng0296-154 (1996).
(43)Nora, E. P. et al. Spatial partitioning of the regulatory landscape of the X-inactivation centre. Nature 485, 381-385, doi:10.1038/nature11049 (2012).
(44)Ogawa, O. et al. Relaxation of insulin-like growth factor II gene imprinting implicated in Wilms' tumour. Nature 362, 749-751, doi:10.1038/362749a0 (1993).
(45)Peng, H. et al. LIMD2 is a small LIM-only protein overexpressed in metastatic lesions that regulates cell motility and tumor progression by directly binding to and activating the integrin-linked kinase. Cancer Res. 74, 1390-1403, doi:10.1158/0008-5472.CAN-13-1275 (2014).
(46)Peters, M. J. et al. The transcriptional landscape of age in human peripheral blood. Nat Commun 6, 8570, doi:10.1038/ncomms9570 (2015).
(47)Pfeifer, G. P. et al. Polymerase chain reaction-aided genomic sequencing of an X chromosome-linked CpG island: methylation patterns suggest clonal inheritance, CpG site autonomy, and an explanation of activity state stability, Proc. Natl. Acad. Sci. USA, 87, 8252-8256 (1990).
(48)Press, W. H., Teukolsky, S.A., Vetterling, W.T. & Flannery, B.P. Numerical Recipes. The Art of Scientific Computing. Cambridge University Press, doi: 10.1145/1874391.187410 (2007).
(49)Pujadas, E. & Feinberg, A. P. Regulated noise in the epigenetic landscape of development and disease. Cell 148, 1123-1131, doi:10.1016/j.cell.2012.02.045 (2012).
(50)Rao, S. S. et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell 159, 1665-1680, doi:10.1016/j.cell.2014.11.021 (2014).
(51)Reeves, R. & Pettit, A. N. Efficient recursions for general factorisable models. Biometrika, 91, 751-757, doi:10.1093/biomet/91.3.751 (2004).
(52)Schlaeger, T. M. et al. A comparison of non-integrating reprogramming methods. Nat. Biotechnol. 33, 58-63, doi:10.1038/nbt.3070 (2015).
(53)Shipony, Z. et al. Dynamic and static maintenance of epigenetic memory in pluripotent and somatic cells. Nature 513, 115-119, doi:10.1038/nature13458 (2014).
(54)Sontag, L. B., Lorincz, M. C. & Luebeck, E. G. Dynamics, stability and inheritance of somatic DNA methylation imprints, J. Theor. Biol. 242, 890-899, doi:10.1016/j.jtbi.2006.05.012 (2006).
(55)Stoger, R. et al. Epigenetic variation illustrated by DNA methylation patterns of the fragile-X gene FMR1, Hum. Mol. Genet., 6, 1791-1801, doi:10.1093/hmg/6.11.1791 (1997).
(56)Storey, J. D. & Tibshirani, R. Statistical significance for genomewide studies. Proc. Natl. Acad. Sci. U. S. A. 100, 9440-9445, doi:10.1073/pnas.1530509100 (2003).
(57)Timp, W. & Feinberg, A. P. Cancer as a dysregulated epigenome allowing cellular growth advantage at the expense of the host. Nat. Rev. Cancer 13, 497-510, doi:10.1038/nrc3486 (2013).
(58)Timp, W. et al. Large hypomethylated blocks as a universal defining epigenetic alteration in human solid tumors. Genome Med. 6, 61, doi:10.1186/s13073-014-0061-y (2014).
(59)Vandiver, A. R. et al. Age and sun exposure-related widespread genomic blocks of hypomethylation in nonmalignant skin. Genome Biol. 16, 80, doi:10.1186/s13059-015-0644-y (2015).
(60)Visel, A., Minovitsky, S., Dubchak, I. & Pennacchio, L. A. VISTA Enhancer Browser - a database of tissue-specific human enhancers. Nucleic Acids Res. 35, D88-92, doi:10.1093/nar/gkl822 (2007).
(61)Waddington, C. H. The strategy of genes. Allen and Unwin (1957).
(62)Wen, B. et al. Large histone H3 lysine 9 dimethylated chromatin blocks distinguish differentiated from embryonic stem cells. Nat. Genet. 41, 246-250, doi:10.1038/ng.297 (2009).
(63)Wen, B. et al. Euchromatin islands in large heterochromatin domains are enriched for CTCF binding and differentially DNA-methylated regions. BMC Genomics 13, 566, doi:10.1186/1471-2164-13-566 (2012).
(64)Wu, H. et al. Redefining CpG islands using hidden Markov models. Biostatistics 11, 499-514, doi:10.1093/biostatistics/kxq005 (2010).
(65)Yamamoto, K. et al. Polycomb group suppressor of zeste 12 links heterochromatin protein 1alpha and enhancer of zeste 2. J. Biol. Chem. 279, 401-406, doi:10.1074/jbc.M307344200 (2004).
(66)Yang, G. et al. RNA-binding protein quaking, a critical regulator of colon epithelial differentiation and a suppressor of colon cancer. Gastroenterology 138, 231-240 e231-235, doi:10.1053/j.gastro.2009.08.001 (2010).
(67)Yu, H. et al. Tet3 regulates synaptic transmission and homeostatic plasticity via DNA oxidation and repair. Nat. Neurosci. 18, 836-843, doi:10.1038/nn.4008 (2015).
(68)Ziller, M. J. et al. Charting a dynamic DNA methylation landscape of the human genome. Nature 500, 477-481, doi:10.1038/nature12433 (2013).
<補足表1>
補足表1は、本明細書において使用される全ての WGBS ゲノム・サンプルのリストを提供する。
補足表2は、高いジェンセン‐シャノン距離(Jensen-Shannon distance(JSD))を特徴とするゲノム遺伝子座でのプロモーター及びエンハンサーと EZH2/SUZ12 結合タンパク質の相互作用についての統計解析の結果を提供する。
補足表3は、CGIs、ショア(shores)、プロモーター、及び遺伝子の内部(gene bodies)において、双安定性が富化(enrichment)していることのオッズ比(OR)解析の結果を提供する。
<補足データ1>
補足データ1は、差分メチル化レベル(differential methylation level(dMML))、ジェンセン‐シャノン距離(Jensen-Shannon distance(JSD))、及び相対ジェンセン‐シャノン距離(relative Jensen-Shannon distance(RJSD))の大きさに基づいた、いくつかのゲノム・サンプル・ペアの遺伝子ランキングを提供する。本明細書に添付した補足データ1は、代表的なサンプルとしての集合データ・セットの一部を含み、その全体が参照により本明細書に組み込まれる。
補足データ2は、差分メチル化レベル(differential methylation level(dMML))、ジェンセン‐シャノン距離(Jensen-Shannon distance(JSD))、及び相対ジェンセン‐シャノン距離(relative Jensen-Shannon distance(RJSD))の大きさに基づく遺伝子ランキングを使用した、いくつかのゲノム・サンプル・ペアについてのジーン・オントロジー(Gene Ontology(GO))アノテーションの結果を提供する。本明細書に 添付した補足データ2は、代表的なサンプルとしての集合データ・セットの一部を含み、その全体が参照により本明細書に組み込まれる。
補足データ3は、双安定性スコアに基づいてランク付けされた遺伝子のリスト、及びインプリンティングされた遺伝子のリスト(CPOE)並びに単一対立遺伝子性発現を示す遺伝子のリスト(monoallelic expression(MAE))との、その関連性を提供する。本明細書に添付した補足データ3は、代表的なサンプルとしての集合データ・セットの一部を含み、その全体が参照により本明細書に組み込まれる。
補足データ4は、34 種類のゲノム・サンプルの間の A/B 区画のスイッチング頻度(switching frequencies)の行列を示す。本明細書に 添付した補足データ4は、代表的なサンプルとしての集合データ・セットの一部を含み、その全体が参照により本明細書に組み込まれる。
補足データ5は、結腸正常を結腸がんと比較した場合の減少する差分エントロピー感受性指数(differential entropic sensitivity index(dESI))に基づいた遺伝子ランキングのリストを提供する。本明細書に 添付した補足データ5は、代表的なサンプルとしての集合データ・セットの一部を含み、その全体が参照により本明細書に組み込まれる。
Claims (181)
a)ゲノムを別々のゲノム領域に分節すること;
b)パラメトリック統計モデル(ザ・モデル(The Model))を、個々のメチル化部位におけるメチル化状態間の依存性を考慮し、及びその領域内のメチル化部位の数内で幾何学級数的よりも穏やかに増えるパラメータの数を有する、メチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び、
c)前記ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内の PEL 又は対応する同時確率分布を計算及び解析し、それによってエピジェネティック解析を実行すること;
を含む方法。
VX(x)=φ0−logPX(x)、
によって定義し、
ここで:
・VX(x)はゲノム領域内のPEL であり、
・PX(x)は、モデル化されたメチル化部位のメチル化状態を表し、前記ゲノム領域内の値 x をとる確率変数 X の同時確率であり、及び
・φ0 は定数である、
請求項1に記載の方法。
ここで:
・VX(x)はゲノム領域内のPEL であり、
・N は前記ゲノム領域内のモデル化されたメチル化部位の数であり、及び
・{a1、…、aN} 及び {c2、…、cN} は前記モデルのパラメータである、
請求項3に記載の方法。
及びcn=γ/dn と設定することによって指定し、ここで、
は n 番目のモデル化されたメチル化部位の CpG 密度であり、dnは n 番目のモデル化されたメチル化部位の、その「最近傍(nearest-neighbor)」のモデル化されたメチル化部位 n-1 からの距離である、請求項4に記載の方法。
ここで、
・PX(x)は、モデル化されたメチル化部位のメチル化状態を表し、前記ゲノム領域内の値 x をとる確率変数 X の同時確率であり、
・VX(x)はゲノム領域内のPEL であり、及び
・Z は再帰的方法で計算される分配関数である、
請求項1に記載の方法。
ここで、
・L はゲノム・サブ領域内のメチル化レベルであり、
・N はゲノム・サブ領域内のモデル化されたメチル化部位の数であり、及び
・Xn は、ゲノム・サブ領域の n 番目のモデル化されたメチル化部位がメチル化されていない場合は 0、前記部位がメチル化されている場合は 1 となる確率変数である、
請求項10に記載の方法。
ここで、
・PL(l)はメチル化レベルについての確率変数 L がゲノム・サブ領域内で値 l をとる確率であり、
・PX(x)は、モデル化されたメチル化部位のメチル化状態を表し、前記ゲノム領域内の値 x をとる確率変数 X の同時確率であり、請求項7の方法によって計算され、
・S(lN) は、正確に l×N個のモデル化されたメチル化部位がメチル化される、ゲノム・サブ領域内の全てのメチル化状態のセットであり、及び
・N はゲノム・サブ領域内のモデル化されたメチル化部位の数である、
請求項12に記載の方法。
a)前記ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;
c)前記ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内の平均メチル化状態を定量化し、それによってエピジェネティック分析を実施すること、
を含む方法。
ここで:
・E[L] はゲノム・サブ領域内のMML であり、
・N はゲノム・サブ領域内のモデル化されたメチル化部位の数であり、及び
・Pn(1) はゲノム・サブ領域内の n 番目のモデル化されたメチル化部位がメチル化される確率である、
請求項22に記載の方法。
a)ゲノム又は第 1 及び第 2 ゲノムの各ゲノム・サブ領域内のMML を計算すること;
b)ゲノムの各ゲノム・サブ領域内のMML の絶対値、又は第 1 及び第 2 ゲノムにおける平均メチル化レベル間の差(difference between the mean methylation levels(dMML))の絶対値を計算すること;
c)ゲノムの特徴と重なる全てのゲノム・サブ領域のMML 絶対値又はdMML 絶対値を組み合わせること(平均化を含むがこれに限定されない)によって、前記ゲノムの特徴をスコア化すること;
を含む、請求項30に記載の方法。
a)前記ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び
c)前記ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内のメチル化の不確実性(methylation uncertainty)を定量化し、それによってエピジェネティック解析を実施すること;
を含む方法。
ここで:
・h はゲノム・サブ領域内のNME であり、
・N はゲノム・サブ領域内のモデル化されたメチル化部位の数であり、及び
・PLはゲノム・サブ領域内のメチル化レベルの確率分布である、
請求項36に記載の方法。
a)ゲノム又は第 1 及び第 2 ゲノムの各ゲノム・サブ領域内のNME を計算すること;
b)第 1 及び第 2 ゲノムにおける各ゲノム・サブ領域内のNME 値の差(dNME)を計算すること;
c)ゲノムの特徴と重なる全てのゲノム・サブ領域のNME 又はdNME 値を組み合わせること(平均化を含むがこれに限定されない)によって、前記ゲノムの特徴をスコア化すること;
を含む、請求項44に記載の方法。
a)第 1 及び第 2 ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルを各ゲノムのメチル化データに合わせることによって、第 1 及び第 2 ゲノムのゲノム領域内のメチル化状態を解析すること;及び
c)第 1 と第 2 ゲノムとの間のゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域について、前記確率分布間及び/又はそこから導出される量間の差及び/又は距離(ジェンセン‐シャノン距離(Jensen-Shannon distance)を含むがこれらに限定されない)を定量化すること;
を含み、それによってエピジェネティック解析を実施するための方法。
ここで:
・DJS はジェンセン‐シャノン距離(Jensen-Shannon distance)であり、
・PL (1)は前記ゲノム・サブ領域内の第 1 ゲノムのメチル化レベルの確率分布であり、
・PL (2)は前記ゲノム・サブ領域内の第 2 ゲノムのメチル化レベルの確率分布であり、
請求項53に記載の方法。
a)第 1 及び第 2 ゲノムの各ゲノム・サブ領域内のJSD を計算すること;
b)ゲノムの特徴と重なる全てのゲノム・サブ領域のJSD 値を組み合わせること(平均化を含むがこれに限定されない)によって、前記ゲノムの特徴をスコア化すること;
を含む、請求項59に記載の方法。
a)前記ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること; 及び
c)ゲノム・サブ領域の平均メチル化状態を別々のクラス(双安定性を含むがこれに限定されない)に分類し、それによってエピジェネティック解析を実施すること;
を含む、方法。
a)ゲノム・サブ領域内のメチル化レベルを定量すること、
b)前記ゲノム・サブ領域内のメチル化レベルの確率分布を計算すること、及び
c)前記ゲノム・サブ領域を別々のクラスに分類すること、
を含む、請求項63に記載の方法。
によって行い、
ここで、前記ゲノム・サブ領域内のメチル化レベルの確率P1,P2,P3 及びP4 を請求項70に記載の方法を使用して計算する、
請求項68に記載の方法。
a)前記ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること; 及び
c)ゲノム・サブ領域のメチル化の不確実性(methylation uncertainty)を別々のクラスに分類し、それによってエピジェネティック解析を行うこと;
を含む方法。
a)ゲノム・サブ領域内のメチル化レベルを定量すること、
b)前記ゲノム・サブ領域内のメチル化レベルの確率分布を計算すること、
c)前記ゲノム・サブ領域内のNME を計算すること、及び
d)前記ゲノム・サブ領域を別々のクラスに分類すること、
を含む、請求項に76記載の方法。
・高秩序: 0≦h≦0.28 の場合
・中秩序: 0.28<h≦0.44 の場合
・弱秩序/無秩序: 0.44<h<0.92 の場合
・中無秩序:0.92≦h<0.99 の場合
・高無秩序 0.99≦h≦1 の場合、
によって行い、
ここで、h が前記ゲノム・サブ領域内の NME である、
請求項82に記載の方法。
a)前記ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;
c)ゲノム全体にわたって、ゲノム・サブ領域のメチル化状態を分類すること;及び
d)前記分類結果をMRs 及びMBs にグループ化し、それによってエピジェネティック解析を実施すること;
を含む方法。
a)ゲノムに沿って所与の長さのウィンドウをスライドさせること;
b)そのスライディング・ウィンドウと交差するあるパーセンテージのゲノム・サブ領域が部分的/高度にメチル化されている又は部分的に/高度に非メチル化されていると分類される場合、それぞれ前記スライディング・ウィンドウをメチル化又は非メチル化としてラベルすること;及び
c)最終的なコンセンサス・グルーピング(consensus groupings)を決定するために、ウィンドウの結合と交差の操作を使用して、全てのメチル化ウィンドウと非メチル化ウィンドウをグループ化すること;
によって、ゲノム・サブ領域の分類をグループ化することを含む、請求項88に記載の方法。
a)前記ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;
c)ゲノム全体にわたって、ゲノム・サブ領域のメチル化の不確実性(methylation uncertainty)を分類すること;及び
d)前記分類結果をER 及びEBs にグループ化し、それによってエピジェネティック解析を実施すること;
を含む方法。
a)ゲノムに沿って所与の長さのウィンドウをスライドさせること;
b)スライディング・ウィンドウと交差するあるパーセンテージのゲノム・サブ領域が中/高秩序又は中/高無秩序に分類される場合、それぞれ前記スライディング・ウィンドウを秩序又は無秩序としてラベルすること;及び
c)最終的なコンセンサス・グルーピング(consensus groupings)を決定するために、ウィンドウの結合と交差の操作を使用して、全ての秩序ウィンドウと無秩序ウィンドウをグループ化すること;
によって、ゲノム・サブ領域の分類をグループ化することを含む、請求項94に記載の方法。
d)前記ゲノムを別々のゲノム領域に分節すること;
e)ザ・モデルをメチル化データに合わせることによって、ゲノム領域内のメチル化状態を解析すること;及び
f)前記ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域のエピジェネティック・メンテナンス(epigenetic maintenance)の情報的特性(メチル化チャネル(methylation channels)の容量及び相対散逸エネルギーを含むがこれらに限定されない)を定量化し、それによってエピジェネティック解析を行うこと;
を含む方法。
a)メチル化チャネル(methylation channel)の情報容量(information capacity(IC));
b)前記メチル化チャネル(methylation channel)の相対散逸エネルギー(relative dissipated energy(RDE));及び
c)前記メチル化チャンネルのCG エントロピー(CG entropy(CGE))。
を計算することによって、ゲノム・サブ領域内のエピジェネティック・メンテナンス(epigenetic maintenance)の情報的特性を定量化することを含む、請求項100に記載の方法。
ここで、
・Cn はモデル化されたメチル化部位 n におけるメチル化チャンネルの IC であり、
・λn はメチル化部位 n の代謝回転率(turnover ratio)であり、
・ψ(x) は関数 - x log2(x) - (1 - x) log2(1 - x) である、
請求項102に記載の方法。
ここで
・Pn(1) はモデル化されたメチル化部位 n がメチル化される確率である、
請求項103に記載の方法。
によってメチル化チャネル(methylation channel)のRDE を計算することを含み、
ここで、
・εn はモデル化されたメチル化部位 n におけるメチル化チャネル(methylation channel)のRDE であり、及び
・λn は請求項104及び105の方法で計算したメチル化部位 n の代謝回転率(turnover ratio)である、
請求項102に記載の方法。
ここで:
・Sn はモデル化されたメチル化部位 n におけるメチル化チャンネル(methylation channel)のCGE であり、
・λn は請求項104及び105の方法で計算したメチル化部位 n の代謝回転率(turnover ratio)であり、及び
・ψ(x) は関数 - x log2(x) - (1 - x) log2(1 - x) である、
請求項102に記載の方法。
a)第 1 及び第 2 ゲノムの各ゲノム・サブ領域内のメチル化チャネル(methylation channel(MC))の情報容量(information capacity(IC))又は相対散逸エネルギー(relative dissipated energy(RDE))を計算すること;
b)ゲノムの特徴と重なる全てのゲノム・サブ領域のIC 又はRDE 値を組み合わせること(平均化を含むがこれに限定されない)によって、前記ゲノムの特徴をスコア化すること、
を含む、請求項113に記載の方法。
a)前記ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによってゲノム領域内のメチル化状態を解析すること;及び
c)ゲノム領域及び/若しくはそのサブ領域並びに/又は併合した超領域内のメチル化システムの情報的/統計的特性(エントロピーを含むがこれらに限定されない)の撹乱(perturbations)に対する感受性を定量化し、それによってエピジェネティック解析を行うこと;
を含む方法。
ここで:
・η は前記ゲノム・サブ領域のESI であり、
・h(0) は PEL パラメータθ を有するゲノム・サブ領域の NME であり、
・h(w) は「撹乱された(perturbed)」PEL パラメータ (1+ w ) x θ を有するゲノム・サブ領域の NME であり、
・w は小さなパラメータの撹乱(perturbations)である、
請求項119に記載の方法。
a)ゲノム又は第 1 及び第 2 ゲノムの各ゲノム・サブ領域内のESI を計算すること;
b)第 1 及び第 2 ゲノムからの 2 つのESI 値の間の絶対差(dESI)を計算すること;
c)ゲノムの特徴と重なる全てのゲノム・サブ領域のdESI 絶対値を組み合わせること(平均化を含むがこれに限定されない)によって、前記ゲノムの特徴をスコア化すること;
を含む、請求項131に記載の方法。
a)第 1及び第 2 ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルを各ゲノムのメチル化データに合わせることによって、第 1 及び第 2 ゲノムのゲノム領域内のメチル化状態を解析すること;及び
c)第 1 ゲノムと第 2 ゲノムとの間のメチル化状態の平均差は比較的小さいが、高次の不一致(ジェンセン‐シャノン距離(Jensen-Shannon distance)を含むがこれに限定されない)は比較的大きい、ゲノムの特徴(遺伝子プロモーターを含むがこれに限定されない)を同定すること;
を含む方法。
a)1 つ以上のゲノム・サンプルのゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによって、各ゲノムのゲノム領域内のメチル化状態を解析すること;及び
c)1 つ以上のゲノム・サンプル中のメチル化状態における高い双安定性に関連するゲノムの特徴(遺伝子プロモーターを含むがこれに限定されない)を同定し、それらを潜在的に重要な生物学的機能のゲノムの特徴に関連付け、それによってエピジェネティック解析を実施すること;
を含む方法。
a)1 つ以上のゲノム・サンプルのゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによって、各ゲノムのゲノム領域内のメチル化状態を解析すること;及び
c)TAD 境界を位置決めし、それによってエピジェネティック解析を実施すること;
を含む方法。
a)前記ゲノムを別々のゲノム領域に分節すること;
b)ザ・モデルをメチル化データに合わせることによって、ゲノムのゲノム領域内のメチル化状態を解析すること;
c)ユークロマチン/ヘテロクロマチン・ドメイン(ゲノムの区画 A 及び区画 B を含むがこれらに限定されない)を予測し、それによってエピジェネティック解析を実施すること;
を含む方法。
a)メチル化データを別々のゲノム・ビンに分節すること、
b)請求項167に記載の方法を使用して、各別々のゲノム・ビン内の特徴ベクトルを計算すること、及び
c)請求項169に記載の方法を使用して学習した 2 値判別関数(binary discriminant function)を使用することによって、ユークロマチン又はヘテロクロマチン・ドメイン(区画A/B を含むがこれらに限定されない)内にあるとして、別々のゲノム・ビンを分類すること、
を含む、請求項165に記載の方法。
a)第 1 及び第 2 ゲノム中のユークロマチン/ヘテロクロマチン・ドメイン(区画 A/B を含むがこれらに限定されない)を計算すること、及び
b)第 1 及び第 2 ゲノムとの間のユークロマチン又はヘテロクロマチン(区画 A/B を含むがこれらに限定されない)の状態に差異が観察されるゲノム・サブ領域を同定すること。
c)第 1 及び第 2 ゲノムの間でクロマチン構造の変化が観察されるゲノムの特徴(遺伝子プロモーターを含むがこれに限定されない)を同定すること、
を含む、請求項172に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662351056P | 2016-06-16 | 2016-06-16 | |
US62/351,056 | 2016-06-16 | ||
PCT/US2017/037900 WO2017218908A2 (en) | 2016-06-16 | 2017-06-16 | Methods and system for epigenetic analysis |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019522285A true JP2019522285A (ja) | 2019-08-08 |
JP2019522285A5 JP2019522285A5 (ja) | 2020-06-25 |
JP7066643B2 JP7066643B2 (ja) | 2022-05-13 |
Family
ID=60664277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018566224A Active JP7066643B2 (ja) | 2016-06-16 | 2017-06-16 | エピジェネティクス解析の為の方法及びシステム |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220076779A1 (ja) |
EP (1) | EP3472358B1 (ja) |
JP (1) | JP7066643B2 (ja) |
AU (1) | AU2017285496B2 (ja) |
ES (1) | ES2897550T3 (ja) |
WO (1) | WO2017218908A2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7429338B2 (ja) | 2017-01-10 | 2024-02-08 | ジュノー セラピューティクス インコーポレイテッド | 細胞療法および関連方法のエピジェネティック解析 |
CN110853706B (zh) * | 2018-08-01 | 2022-07-22 | 中国科学院深圳先进技术研究院 | 一种整合表观遗传组学的肿瘤克隆组成构建方法及系统 |
CN109213833A (zh) * | 2018-09-10 | 2019-01-15 | 成都四方伟业软件股份有限公司 | 二分类模型训练方法、数据分类方法及对应装置 |
CN110428319B (zh) * | 2019-08-05 | 2021-04-27 | 深圳乐信软件技术有限公司 | 一种数据比对平台、方法、设备和存储介质 |
US11795495B1 (en) * | 2019-10-02 | 2023-10-24 | FOXO Labs Inc. | Machine learned epigenetic status estimator |
US11887698B2 (en) | 2020-01-08 | 2024-01-30 | Samsung Electronics Co., Ltd. | Method and electronic device for building comprehensive genome scale metabolic model |
CN112102878B (zh) * | 2020-09-16 | 2024-01-26 | 张云鹏 | 一种LncRNA学习系统 |
CN114480655A (zh) * | 2022-03-03 | 2022-05-13 | 北京起源聚禾生物科技有限公司 | Dna甲基化标志物组合及应用、卵巢癌早期检测引物探针及试剂盒 |
EP4265738A1 (en) * | 2022-03-03 | 2023-10-25 | Beijing OriginPoly Bio-Tec Co., Ltd. | Dna methylation marker combination, use, primer probe for early detection of ovarian cancer and kit |
CN116642819B (zh) * | 2023-07-19 | 2023-10-10 | 江苏得康生物科技有限公司 | 细胞群的识别方法及其装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100143929A1 (en) * | 2008-12-04 | 2010-06-10 | Rush University Medical Center | Dna methylation based test for monitoring efficacy of treatment |
JP2014519319A (ja) * | 2011-05-12 | 2014-08-14 | ザ・ジョンズ・ホプキンス・ユニバーシティー | エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物 |
JP2015536639A (ja) * | 2012-09-20 | 2015-12-24 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 血漿による胎児または腫瘍のメチロームの非侵襲的決定 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5695934A (en) | 1994-10-13 | 1997-12-09 | Lynx Therapeutics, Inc. | Massively parallel sequencing of sorted polynucleotides |
US5888737A (en) | 1997-04-15 | 1999-03-30 | Lynx Therapeutics, Inc. | Adaptor-based sequence analysis |
GB0507835D0 (en) | 2005-04-18 | 2005-05-25 | Solexa Ltd | Method and device for nucleic acid sequencing using a planar wave guide |
US7514952B2 (en) | 2005-06-29 | 2009-04-07 | Altera Corporation | I/O circuitry for reducing ground bounce and VCC sag in integrated circuit devices |
CN101460953B (zh) | 2006-03-31 | 2012-05-30 | 索雷克萨公司 | 用于合成分析的序列的系统和装置 |
-
2017
- 2017-06-16 WO PCT/US2017/037900 patent/WO2017218908A2/en unknown
- 2017-06-16 EP EP17814184.2A patent/EP3472358B1/en active Active
- 2017-06-16 AU AU2017285496A patent/AU2017285496B2/en active Active
- 2017-06-16 JP JP2018566224A patent/JP7066643B2/ja active Active
- 2017-06-16 US US16/310,176 patent/US20220076779A1/en active Pending
- 2017-06-16 ES ES17814184T patent/ES2897550T3/es active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100143929A1 (en) * | 2008-12-04 | 2010-06-10 | Rush University Medical Center | Dna methylation based test for monitoring efficacy of treatment |
JP2014519319A (ja) * | 2011-05-12 | 2014-08-14 | ザ・ジョンズ・ホプキンス・ユニバーシティー | エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物 |
JP2015536639A (ja) * | 2012-09-20 | 2015-12-24 | ザ チャイニーズ ユニバーシティ オブ ホンコン | 血漿による胎児または腫瘍のメチロームの非侵襲的決定 |
Non-Patent Citations (1)
Title |
---|
MICHAEL STEVENS、ほか10名: "Estimating absolute methylation levels at single-CpG resolution from methylation enrichment and rest", GENOME RES. [ONLINE], vol. 第23巻, JPN6021019695, September 2013 (2013-09-01), pages 1541 - 1553, ISSN: 0004511683 * |
Also Published As
Publication number | Publication date |
---|---|
ES2897550T3 (es) | 2022-03-01 |
EP3472358A2 (en) | 2019-04-24 |
US20220076779A1 (en) | 2022-03-10 |
WO2017218908A3 (en) | 2018-01-18 |
AU2017285496B2 (en) | 2023-02-23 |
AU2017285496A1 (en) | 2019-01-24 |
WO2017218908A2 (en) | 2017-12-21 |
EP3472358B1 (en) | 2021-08-18 |
EP3472358A4 (en) | 2020-02-26 |
JP7066643B2 (ja) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7066643B2 (ja) | エピジェネティクス解析の為の方法及びシステム | |
US20200251180A1 (en) | Resolving genome fractions using polymorphism counts | |
Jenkinson et al. | Potential energy landscapes identify the information-theoretic nature of the epigenome | |
TWI661049B (zh) | 使用不含細胞之dna片段大小以測定複製數變異之方法 | |
US11274347B2 (en) | Non-invasive determination of type of cancer | |
CN109072300B (zh) | 区分复杂生物样品中的甲基化水平 | |
Moran et al. | Validation of a DNA methylation microarray for 850,000 CpG sites of the human genome enriched in enhancer sequences | |
JP2021521536A (ja) | 生体試料の多検体アッセイのための機械学習実装 | |
JP7299169B2 (ja) | 体細胞突然変異のクローン性を決定するための方法及びシステム | |
KR20220133868A (ko) | 패치 컨볼루션 신경망을 사용한 암 분류 | |
CN115667554A (zh) | 通过核酸甲基化分析检测结直肠癌的方法和系统 | |
Leistico et al. | Epigenomic tensor predicts disease subtypes and reveals constrained tumor evolution | |
US20240055073A1 (en) | Sample contamination detection of contaminated fragments with cpg-snp contamination markers | |
Tanić et al. | Performance comparison and in-silico harmonisation of commercial platforms for DNA methylome analysis by targeted bisulfite sequencing | |
Jenkinson et al. | Potential energy landscapes reveal the information-theoretic nature of the epigenome | |
Scherer | Computational solutions for addressing heterogeneity in DNA methylation data | |
TW202330933A (zh) | 用於癌症分類之汙染片段之樣品汙染偵測 | |
Liu | Accurate, Systematic and Integrated Inference of Omics Data Using Novel Bioinformatics Approaches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200430 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210525 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220308 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220401 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220427 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7066643 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |