JP2021003108A - 癌の状態を判定する方法とシステム - Google Patents
癌の状態を判定する方法とシステム Download PDFInfo
- Publication number
- JP2021003108A JP2021003108A JP2020128392A JP2020128392A JP2021003108A JP 2021003108 A JP2021003108 A JP 2021003108A JP 2020128392 A JP2020128392 A JP 2020128392A JP 2020128392 A JP2020128392 A JP 2020128392A JP 2021003108 A JP2021003108 A JP 2021003108A
- Authority
- JP
- Japan
- Prior art keywords
- cancer
- tumor
- biological sample
- methylation
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Epidemiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Zoology (AREA)
- Oncology (AREA)
- Microbiology (AREA)
- Hospice & Palliative Care (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
Description
本出願は配列表を含んでおり、これはEFS−WebによってASCIIフォーマットで提出されており、参照により全体として本明細書に組み込まれる。上記のASCIIコピーは2016年1月12日に作成され、49697−701.601_SL.txtと命名され、846キロバイトのサイズがある。
(a)プロセッサ、メモリモジュール、オペレーティングシステム、および、生体サンプルのセットからCpGメチル化データを生成するためのデータ収集アプリケーションを作成するためにプロセッサによって実行可能な命令を含むコンピュータプログラムを含む第1のコンピューティングデバイスを含み、
データ収集アプリケーションが、
(1)生体サンプルのセットからCpGメチル化データを生成するために配列決定装置を作動させるように構成された配列決定モジュールであって、上記セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、配列決定モジュールと、
(2)データ受信モジュールとを含み、
該データ受信モジュールは、
(i)第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットであって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルは同じ生体サンプル源に由来する、第1のペアのCpGメチル化データセット;
(ii)第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットであって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、第2のペアのCpGメチル化データセット;および、
(iii)第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットであって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、第3のペアのCpGメチル化データセットを、受け取るように構成され、
上記コンピューティングプラットフォームは、
(b)プロセッサ、メモリモジュール、オペレーティングシステム、および癌CpGメチル化プロファイルデータベースを生成するためのデータ分析アプリケーションを作成するためにプロセッサによって実行可能な命令を含むコンピュータプログラムを含む第2のコンピューティングデバイスを含み、
データ分析モジュールを含むデータ分析アプリケーションが、
(1)第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットからペアワイズのメチル化差異データセットを生成するように、および、
(2)癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析するように、構成され、
(i)機械学習法は、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、
(ii)癌CpGメチル化プロファイルデータベースはCpGメチル化プロファイルのセットを含み、CpGメチル化プロファイルはそれぞれ癌種を表す。
(a)以下を受け取るように構成されたデータ受信モジュール:
(1)第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットであって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、第1のペアのCpGメチル化データセット;
(2)第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットであって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、第2のペアのCpGメチル化データセット;および、
(3)第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットであって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、第3のペアのCpGメチル化データセット;ならびに、
(b)
(1)第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットからペアワイズのメチル化差異データセットを生成する;および、
(2)癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する、ように構成されたデータ分析モジュールを含み、
(i)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、
(ii)癌CpGメチル化プロファイルデータベースはCpGメチル化プロファイルのセットを含み、CpGメチル化プロファイルはそれぞれ癌種を表す。
該方法は、
a.配列決定方法によって生体サンプルのセットからCpGメチル化データを生成する工程であって、セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
b.第1のプロセッサを用いて、第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットを取得する工程であって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、工程と、
c.第1のコンピューティングデバイスを用いて、第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットを取得する工程であって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
d.第1のコンピューティングデバイスを用いて、第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットを取得する工程であって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、工程と、
e.第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットから、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成する工程と、
f.癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する工程を含み、
(1)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、および、
(2)癌CpGメチル化プロファイルデータベースは、CpGメチル化プロファイルのセットを含み、各CpGメチル化プロファイルは癌種を表す。
該方法は、
a.第1のプロセッサを用いて、第4の癌の生体サンプルと第4の正常な生体サンプルから生成された第4のペアのCpGメチル化データセットを取得する工程であって、第4の癌の生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第7のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第8のデータセットを形成し、および第4の癌の生体サンプルと第4の正常な生体サンプルが同じ生体サンプル源に由来する、工程、
b.第1のプロセッサを用いて、第5の正常な生体サンプルと第6の正常な生体サンプルから生成された第5のペアのCpGメチル化データセットを取得する工程であって、第5の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第9のデータセットを形成し、第6の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第10のデータセットを形成し、および第4の正常な生体サンプル、第5の正常な生体サンプル、および第6の正常な生体サンプルが異なる、工程、
c.第1のプロセッサを用いて、第5の癌の生体サンプルと第6の癌の生体サンプルから生成された第6のペアのCpGメチル化データセットを取得する工程であって、第5の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第11のデータセットを形成し、第6の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第12のデータセットを形成し、および第4の癌の生体サンプル、第5の癌の生体サンプル、および第6の癌の生体サンプルが異なる、工程、
d.第2のプロセッサを用いて、第4のペアのデータセット、第5のペアのデータセット、第6のペアのデータセットから第2のペアワイズのメチル化差異データセットを生成する工程、および、
e.上記の癌CpGメチル化プロファイルデータベースを用いて、第2のペアワイズのメチル化差異データセットを分析する工程であって、第2のペアワイズのメチル化差異データセットと癌CpGメチル化プロファイルデータベース内のCpGメチル化プロファイルとの間の相関は、個体の癌種を判定する、工程、を含む。
該方法は、
a.第1のプロセッサを用いて、第4の癌の生体サンプルと第4の正常な生体サンプルから生成された第4のペアのCpGメチル化データセットを取得する工程であって、第4の癌の生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第7のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第8のデータセットを形成し、および第4の癌の生体サンプルと第4の正常な生体サンプルが同じ生体サンプル源に由来する、工程、
b.第1のプロセッサを用いて、第5の正常な生体サンプルと第6の正常な生体サンプルから生成された第5のペアのCpGメチル化データセットを取得する工程であって、第5の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第9のデータセットを形成し、第6の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第10のデータセットを形成し、および第4の正常な生体サンプル、第5の正常な生体サンプル、および第6の正常な生体サンプルが異なる、工程、
c.第1のプロセッサを用いて、第5の癌の生体サンプルと第6の癌の生体サンプルから生成された第6のペアのCpGメチル化データセットを取得する工程であって、第5の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第11のデータセットを形成し、第6の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第12のデータセットを形成し、および第4の癌の生体サンプル、第5の癌の生体サンプル、および第6の癌の生体サンプルが異なる、工程、
d.第2のプロセッサを用いて、第4のペアのデータセット、第5のペアのデータセット、第6のペアのデータセットから第2のペアワイズのメチル化差異データセットを生成する工程、および、
e.上記の癌CpGメチル化プロファイルデータベースを用いて、第2のペアワイズのメチル化差異データセットを分析する工程であって、第2のペアワイズのメチル化差異データセットと癌CpGメチル化プロファイルデータベース内のCpGメチル化プロファイルとの間の相関は、個体において原発腫瘍を転移癌と区別する、工程、を含む。
該方法は、
a.第1のプロセッサを用いて、第4の癌の生体サンプルと第4の正常な生体サンプルから生成された第4のペアのCpGメチル化データセットを取得する工程であって、第4の癌の生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第7のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第8のデータセットを形成し、第4の癌の生体サンプルと第4の正常な生体サンプルが同じ生体サンプル源に由来する、工程、
b.第1のプロセッサを用いて、第5の正常な生体サンプルと第6の正常な生体サンプルから生成された第5のペアのCpGメチル化データセットを取得する工程であって、第5の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第9のデータセットを形成し、第6の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第10のデータセットを形成し、および第4の正常な生体サンプル、第5の正常な生体サンプル、および第6の正常な生体サンプルが異なる、工程、
c.第1のプロセッサを用いて、第5の癌の生体サンプルと第6の癌の生体サンプルから生成された第6のペアのCpGメチル化データセットを取得する工程であって、第5の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第11のデータセットを形成し、第6の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第12のデータセットを形成し、および第4の癌の生体サンプル、第5の癌の生体サンプル、および第6の癌の生体サンプルが異なる、工程、
d.第2のプロセッサを用いて、第4のペアのデータセット、第5のペアのデータセット、第6のペアのデータセットから第2のペアワイズのメチル化差異データセットを生成する工程、および、
e.上記の癌CpGメチル化プロファイルデータベースを用いて、第2のペアワイズのメチル化差異データセットを分析する工程であって、第2のペアワイズのメチル化差異データセットと癌CpGメチル化プロファイルデータベース内のCpGメチル化プロファイルとの間の相関は、個体において癌が進行しているかどうかを示す、工程を含む。
該方法は、
a.第1のプロセッサを用いて、第4の癌の生体サンプルと第4の正常な生体サンプルから生成された第4のペアのCpGメチル化データセットを取得する工程であって、第4の癌の生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第7のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第4のペアのデータセット内の第8のデータセットを形成し、第4の癌の生体サンプルと第4の正常な生体サンプルが同じ生体サンプル源に由来する、工程、
b.第1のプロセッサを用いて、第5の正常な生体サンプルと第6の正常な生体サンプルから生成された第5のペアのCpGメチル化データセットを取得する工程であって、第5の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第9のデータセットを形成し、第6の正常な生体サンプルから生成されたCpGメチル化データが第5のペアのデータセット内の第10のデータセットを形成し、および第4の正常な生体サンプル、第5の正常な生体サンプル、および第6の正常な生体サンプルが異なる、工程、
c.第1のプロセッサを用いて、第5の癌の生体サンプルと第6の癌の生体サンプルから生成された第6のペアのCpGメチル化データセットを取得する工程であって、第5の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第11のデータセットを形成し、第6の癌の生体サンプルから生成されたCpGメチル化データが第6のペアのデータセット内の第12のデータセットを形成し、および第4の癌の生体サンプル、第5の癌の生体サンプル、および第6の癌の生体サンプルが異なる、工程、
d.第2のプロセッサを用いて、第4のペアのデータセット、第5のペアのデータセット、第6のペアのデータセットから第2のペアワイズのメチル化差異データセットを生成する工程、および、
e.上記の癌CpGメチル化プロファイルデータベースを用いて、第2のペアワイズのメチル化差異データセットを分析する工程であって、第2のペアワイズのメチル化差異データセットと癌CpGメチル化プロファイルデータベース内のCpGメチル化プロファイルとの間の相関は、個体における癌の予後を決定する、工程を含む。
Aは第1の標的結合領域であり、
Bは第2の標的結合領域であり、および、
Lはリンカー領域であり、
Aは、SEQ ID NOs:1−1775から選択された配列の5’末端から位置1で始まる少なくとも30の連続的なヌクレオチドに対して少なくとも70%、80%、90%、95%、または99%の配列同一性を有し、
Bは、SEQ ID NOs:1−1775から選択された同じ配列の3’末端から位置1’で始まる少なくとも12の連続的なヌクレオチドに対して少なくとも70%、80%、90%、95%、または99%の配列同一性を有し、
LはAに結合し、および、
BはAまたはLのいずれかに結合する。
a.配列決定方法によって生体サンプルのセットからCpGメチル化データを生成する工程であって、セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
b.第1のプロセッサを用いて、第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットを取得する工程であって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、工程と、
c.第1のコンピューティングデバイスを用いて、第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットを取得する工程であって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
d.第1のコンピューティングデバイスを用いて、第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットを取得する工程であって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、工程と、
e.第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットから、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成する工程と、
f.癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する工程であって、
(1)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、および、
(2)癌CpGメチル化プロファイルデータベースは、CpGメチル化プロファイルのセットを含み、各CpGメチル化プロファイルは癌種を表す、工程。
本明細書で言及される全ての出版物、特許、および特許出願は、あたかも個々の出版物、特許、または特許出願が引用によって組み込まれるよう具体的かつ個別に示されるかのような同程度まで引用により本明細書に組み込まれる。
DNAメチル化は、ヌクレオチド塩基シトシンのC5位置とアデニンのN6位置でのメチル基の結合である。アデニンのメチル化は主として前核生物で生じるが、シトシンのメチル化は前核生物と真核生物の両方で生じる。例によっては、シトシンのメチル化はCpGジヌクレオチドモチーフで生じる。他の例では、Hがアデニン、シトシン、またはチミンである場合、シトシンメチル化は例えばCHGとCHHのモチーフで生じる。例によっては、1つ以上のCpGジヌクレオチドモチーフまたはCpG部位は、CpGジヌクレオチド中で豊富な短鎖DNA配列であるCpGアイランドを形成する。例によっては、CpGアイランドは、すべてのヒト遺伝子のおよそ2分の1の5’領域中にある。CpGアイランドは、常にではないが典型的には約0.2から約1kbの長さである。シトシンメチル化はさらに5−メチルシトシン(5−mCyt)と5−ヒドロキシメチルシトシンを含む。
いくつかの実施形態では、複数のCpGメチル化データが生成され、CpGメチル化プロファイルデータベースへ統合される。例によっては、CpGメチル化プロファイルデータベースは、本明細書に記載される方法、システム、非一時的なコンピュータ可読媒体、サービス、またはキットを用いる基準データベースとして利用される。例によっては、CpGメチル化プロファイルデータベースは、各CpGメチル化プロファイルが癌種(例えば乳癌、結腸直腸癌、脳癌など)と相関するCpGメチル化プロファイルのライブラリを含んでいる。場合によっては、各々の上記CpGメチル化プロファイルは、癌のサブタイプ(例えば、三種陰性の乳癌、結腸直腸腺癌、星状細胞腫など)にさらに相関する。
いくつかの実施形態では、正常な組織と比較されると、本明細書に記載されたバイオマーカー(またはマーカー)は癌において差次的にメチル化される。いくつかの実施形態では、バイオマーカーは、例えばCpGメチル化部位、メチル化状態、メチル化指標、メチル化プロファイルなどのメチル化シグネチャーを示すまたは表す。例によっては、バイオマーカーのパネルは、例えば、メチル化プロファイル、1つ以上の遺伝子のメチル化などの生成されるメチル化シグネチャーの一群を例証する。場合によっては、バイオマーカーは、診断のツールとして個々にまたはまとめて、あるいは、バイオマーカーパネルとして組み合わせるかまたは形質転換させて利用される。いくつかの実施形態では、バイオマーカーは、場合によっては基準メチル化プロファイルなどの1つ以上の遺伝子のメチル化プロファイルとさらに比較して、1つ以上の遺伝子内で評価され、これが癌状態の特徴付けをもたらす。
1031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930。いくつかの実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌の早期検出、癌の非侵襲的検出、癌の様々な段階の識別、癌の予後の判定、処置応答の予測、および/または処置応答のモニタリングのために、以下のバイオマーカーの1つ以上を使用する:cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930。いくつかの実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌種を判定するために、以下のバイオマーカーの1つ以上を使用する:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20
847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)。いくつかの実施形態では、本明細書に記載される方法、システム、または非一時的なコンピュータ可読媒体は、癌の早期検出、癌の非侵襲的検出、癌の様々な段階の識別、癌の予後の判定、処置応答の予測、および/または処置応答のモニタリングのために、以下のバイオマーカーの1つ以上を使用する:cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)。いくつかの実施形態では、癌種は、急性リンパ芽球性白血病、急性骨髄性白血病、膀胱癌、乳癌、脳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、結腸直腸癌、子宮内膜癌、食道癌、消化器癌、神経膠腫、神経膠芽腫、頭頚部癌、腎癌、肝臓癌、肺癌、リンパ性腫瘍形成、黒色腫、骨髄性腫瘍、卵巣癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、扁平上皮癌、精巣癌、胃癌、または甲状腺癌を含む。いくつかの実施形態では、癌種は、膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、または甲状腺癌を含む。
cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される1つ以上のバイオマーカーを含む。
30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。追加の実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の非侵襲的検出のための、表15、16、17、及び/又は18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。さらに追加の実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の異なるステージの識別のための、表15、16、17、及び/又は18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。他の実施形態では、本明細書に記載される方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体は、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのための、表15、16、17、及び/又は18から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。
30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、550、600、650、700、750、800、850、900、950、1000またはそれ以上のバイオマーカーを含むパネルを使用する。
cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)から選択される、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、 37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、またはそれ以上のバイオマーカーを含む。幾つかの事例では、CpGメチル化プロファイルのデータベースは、cg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555から選択される、1、2、3、4またはそれ以上のバイオマーカーを含む。
本明細書に記載されるメチル化プロファイルは、DNAの分子内の1つ以上のバイオマーカー(または遺伝子座)のメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、本明細書に記載されるメチル化プロファイルは、表15、16、17、及び/又は18の1つ以上のバイオマーカーのメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、本明細書に記載されるメチル化プロファイルは、1つ以上のバイオマーカーcg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930のメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、本明細書に記載されるメチル化プロファイルは、1つ以上のバイオマーカーcg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)のメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、本明細書に記載されるメチル化プロファイルは、1つ以上のバイオマーカーcg25574765、cg25490145、cg18384097、cg25922751、およびcg17126555のメチル化の状態またはレベルを表わす1セットのデータを指す。幾つかの事例では、DNAメチル化のデータは、限定されないが、CpG部位のメチル化指標、領域内のCpG部位のメチル化密度、隣接する領域にわたるCpG部位の分布、1つを超えるCpG部位を含む領域内の1つ以上の個々のCpG部位のためのメチル化のパターンまたはレベル、CpGメチル化の欠如、及び/又は非CpGメチル化を含む。幾つかの事例では、メチル化プロファイルは、1セットのCpG部位のメチル化指標、1セットの領域内のCpG部位のメチル化密度、1セットの隣接する領域にわたるCpG部位の分布、1セットの1つを超えるCpG部位を含む領域内の1つ以上の個々のCpG部位のメチル化のパターンまたはレベル、1セットのCpGメチル化の欠如、1セットの非CpGメチル化、またはそれらの組み合わせを含む。幾つかの事例では、メチル化プロファイルはまた、本明細書でメチル化フィンガープリントまたはメチル化シグネチャーとも呼ばれる。
、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含む少なくとも第2のメチル化プロファイルが、癌種を判定するために、および随意に癌の異なるステージの識別、癌の予後の判定、治療反応の予測、及び/又は治療反応のモニタリングのために、方法、システム、プラットフォーム、または非一時的コンピュータ可読媒体によって使用される。幾つかの事例では、第1のメチル化プロファイル及び/又は第2のメチル化プロファイルは、cg25922751、cg25432518、cg23612220、cg23130731、cg13911392、cg11334870、cg11252953、cg10542975、cg08098128、cg02874908、cg26769927、cg26769700、cg25574765、cg25490145、cg18384097、cg17126555、cg14247287、cg07420137、cg05098343、cg01903374、cg00907272、cg27125093、cg26112797、cg24166457、cg19300307、cg17122157、cg13555415、cg11436362、cg10673833、cg09866569、cg08075204、cg05614346、cg02053964、cg27377213、cg24480810、cg24301930、cg22513455、cg19693177、cg19675731、cg19252956、cg18856478、cg16509569、cg15797834、cg15698795、cg15341833、cg14556909、cg14083015、cg14058476、cg12192582、cg10590292、cg06787669、cg06439655、cg02522196、cg02233149、cg00558804、cg26680502、cg23013029、cg22552736、cg21376733、cg20847580、cg19704755、cg18842353、cg16622899、cg14999168、cg13925432、cg12967050、cg11105292、cg09419005、cg09153080、cg07380416、cg06825448、cg05596756、cg03891050、cg01681367、cg01456691、cg00015530、cg27410601、cg27366280、cg26683005、cg25666403、cg24706505、cg24107852、cg23824762、cg23021796、cg21122474、cg20336172、cg18610205、cg18456621、cg17518965、cg16748008、cg16191087、cg16061668、cg14642045、cg13924996、cg12353452、cg09335715、cg08858130、cg08480068、cg08052292、cg07428959、cg06153925、cg04147906、cg03431741、cg00282244、およびcg00025044(表20)から選択されるバイオマーカーのパネルのメチル化の状態またはレベルを含む。
本明細書に記載される様々な方法論は、値、レベル、特徴、特性、性質などを、適正な対照、対照サンプル、または対照として本明細書で交換可能に言及される、適切な対照と比較する工程を含む。幾つかの実施形態では、対照は、患者から得られた細胞、組織、臓器、またはサンプル中で判定された、値、レベル、特徴、特性、性質などである。幾つかの事例では、細胞、組織、臓器、またはサンプルは、正常な細胞、組織、臓器、またはサンプルである。幾つかの場合では、細胞、組織、臓器、またはサンプルは、癌の細胞、組織、臓器、またはサンプルである。例えば、本発明のバイオマーカーは、影響されない個体または正常な対照個体、あるいは被験体の影響されない家族からのサンプル中のそれらのメチル化レベルに関して分析される。別の実施形態では、対照は、患者に治療(例えば癌治療)を開始する前に、または治療レジメン間に判定された、値、レベル、特徴、特性、性質などである。さらなる実施形態では、対照は、予め定義された値、レベル、特徴、特性、性質などである。
幾つかの実施形態では、疾患または疾病(例えば癌)の進行においてバイオマーカー(つまり、DNAの領域/フラグメントまたはゲノムDNAの領域/フラグメント(例えば、CpGアイランドを含む領域/フラグメント))のメチル化の状態/レベルを測定し、検出し、判定し、特的し、および特徴づけ、それ故、疾患または疾病の発症、存在または状態を診断するために、多くの方法が利用される。
これらの技術に対するこれらの言及は、それら全体が引用によって本明細書に組み込まれる。
幾つかの事例では、プローブパネルの1つ以上のプローブが、上に記載された核酸配列決定の方法に使用される。幾つかの事例では、プローブパネルの1つ以上のプローブは式Iのプローブを含み:
Aは、第1の標的結合領域であり;
Bは、第2の標的結合領域であり;および
Lは、リンカー領域であり;
ここで、Aは、SEQ ID NO:1−1775から選択される配列の5’末端から位置1で始まる少なくとも30の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含み;Bは、SEQ ID NO:1−1775から選択される同じ配列の3’末端から位置1’で始まる少なくとも12の連続的なヌクレオチドに対する少なくとも70%、80%、90%、95%、または99%の配列同一性を含み;Lは、Aに結合され;およびBは、AまたはLのいずれかに結合される。
特定の実施形態では、バイオマーカーパネルのマーカーのために測定されたメチル化値は、数学的に組み合わされ、組み合わされた値は、基礎的な問診に関連づけられる。幾つかの事例では、メチル化されたバイオマーカー値は、任意の適切な技術水準の数学的方法によって組み合わせられる。マーカーの組み合わせを疾患状態に関連づけるための周知の数学的方法は、判別分析(DA)(例えば、線形、二次、正規化のDA)、判別関数分析(DFA)、カーネル法(例えばSVM)、多次元尺度構成法(MDS)、ノンパラメトリック法(例えばk最近傍分類器)、PLS(部分最小二乗)、ツリーベースの方法(Tree−Based Methods)(例えば、Logic Regression、CART、ランダムフォレスト法、ブースティング/バギング法(Boosting/Bagging Methods))、一般化線形モデル(例えばロジスティック回帰分析)、主成分ベースの方法(例えばSIMCA)、一般化加法モデル、ファジイ論理ベースの方法、ニューラルネットワークおよび遺伝的アルゴリズムベースの方法のような方法を利用する。当業者は、本発明のバイオマーカーの組み合わせを評価するために適切な方法を選択する際に問題はない。一実施形態では、例えば、CRCを診断するために、本発明のバイオマーカーの組み合わせの相関するメチル化状態において使用される方法は、DA(例えば、線形、二次、正規化の判別分析)、DFA、カーネル法(例えばSVM)、MDS、ノンパラメトリック法(例えばk最近傍分類器)、PLS(部分最小二乗)、ツリーベースの方法(例えばLogic Regression、CART、ランダムフォレスト法、ブースティング法)、または一般化線形モデル(例えばロジスティク回帰分析)、および主成分分析から選択される。これらの統計方法に関連する詳細は、以下の参考文献で見られる:Ruczinski et al., 12 J. OF COMPUTATIONAL AND GRAPHICAL STATISTICS 475−511 (2003); Friedman, J. H., 84 J. OF THE AMERICAN STATISTICAL ASSOCIATION 165−75 (1989); Hastie, Trevor, Tibshirani, Robert, Friedman, Jerome, The Elements of Statistical Learning, Springer Series in Statistics (2001); Breiman, L., Friedman, J. H., Olshen, R. A., Stone, C. J. Classification and regression trees, California: Wadsworth (1984); Breiman, L., 45 MACHINE LEARNING 5−32 (2001); Pepe, M. S., The Statistical Evaluation of Medical Tests for Classification and Prediction, Oxford Statistical Science Series, 28 (2003);およびDuda, R. O., Hart, P. E., Stork, D. O., Pattern Classification, Wiley Interscience, 2nd Edition (2001)。
状態を正確に予測する診断テストの力は、アッセイの感受性、アッセイの特異性、または受信者動作特性(「ROC」)曲線下面積として一般に測定される。感受性は、試験によって陽性と予測される真陽性のパーセンテージであり、特異性は、試験によって陰性と予測される真陰性のパーセンテージである。ROC曲線は、1−特異性に応じた試験の感受性を提供する。ROC曲線下面積が大きければ大きいほど、試験の予測値は強力である。試験の有用性の他の有用な尺度は、陽性適中率および陰性的中率である。陽性適中率は、実際に陽性であるという試験結果が出る人の割合である。陰性的中率は、実際に陰性であるという試験結果が出る人の割合である。
幾つかの実施形態では、本明細書には、癌を検出する、特徴づける、及び/又は予測するための、上に記載される1つ以上のバイオマーカーの使用が開示される。幾つかの事例では、バイオマーカーは、癌を判定する、特徴づける、認定する、及び/又は評価するために、診断テストにおいて使用される。幾つかの場合では、バイオマーカーは、表15、16、17、18及び/又は20に示されるものを含む。
特定の実施形態において、本明細書には、患者において癌を進行させるリスクを判定する方法が提供される。バイオマーカーのメチル化のパーセンテージ、量またはパターンは、様々なリスク状態(例えば高、中、または低)の特徴である。癌を進行させるリスクは、関連するバイオマーカーのメチル化状態を測定し、その後それらを分類アルゴリズムに提示する又はそれらを基準量、つまり、特定のリスクレベルと関連付けられるメチル化された(または非メチル化の)バイオマーカーの予め定義されたレベルまたはパターンと比較することによって、判定される。
別の実施形態において、本明細書には、患者における癌の重症度を判定する方法が提供される。癌の特定のステージまたは重症度は、バイオマーカーの高メチル化または低メチル化の特性レベルあるいは1セットのバイオマーカー(パターン)の相対的な高メチル化または低メチル化のレベルを有し得る。幾つかの場合では、癌の重症度は、関連するバイオマーカーのメチル化状態を測定し、その後それらを分類アルゴリズムに提示する又はそれらを基準量、つまり、特定のステージと関連付けられるメチル化されたバイオマーカーの予め定義されたメチル化のレベルまたはパターンと比較することによって、判定される。
一実施形態において、本明細書には、患者の癌の経過を判定する方法が提供され、癌経過は、癌進行(悪化)および癌退縮(改善)を含む、時間にわたる癌状態の変化を指す。時間とともに、バイオマーカーのメチル化の量か相対量(例えばパターン)は変わる。例えば、バイオマーカー「X」および「Y」の高メチル化または低メチル化は、癌を有する幾つかの事例において増加される。それ故、癌または非癌への時間にわたるメチル化の増加または減少いずれかの、これらのバイオマーカーの傾向は、疾患の経過を示す。したがって、この方法は、少なくとも2つの異なる時間点(例えば、第1時間および第2時間)で患者における1つ以上のバイオマーカーのメチル化のレベルまたは状態を測定する工程、およびもしある場合に変化を比較する工程を含む。癌の経過は、これらの比較に基づいて判定される。
癌状態を認定する方法の特定の実施形態では、方法はさらに、状態に基づいて患者の処置を管理する工程を含む。そのような管理は、癌状態の判定後に続く医師または臨床医の行動を含む。例えば、医師が癌の診断または予後を行う場合、モニタリングの特定のレジームが続く。その後、本発明の方法を使用する癌の経過の評価に、特定の癌治療レジメンが必要とされる。代替的に、非癌の診断には、患者が患う具体的な疾患を判定するための更なるテストが続く。随意に、診断テストが癌状態に関する不確定な結果を与える場合、更なるテストが要求される。
別の実施形態において、本明細書には、医薬品の治療上の有効性を判定する方法が提供される。これらの方法は、薬物の臨床試験を実行することの他に、薬物に関する患者の進行をモニタリングすることにも有用である。
幾つかの実施形態において、根本的な問診に関連付けられるバイオマーカーパネルのマーカーについて測定されたメチル化値を分析するのに、1以上のパターン認識方法が使用される。場合によっては、生体サンプルが、疾患の証拠が無い患者、全身性の癌を示す患者、又は生化学的な再発を示す患者に由来するものであるという可能性を絞り出すために、同様に、これら疾患の状況及びタイプ、特に原発腫瘍のタイプを区別するために、パターン認識方法は、メチル化レベルの線形結合、又はメチル化レベルの非線形結合を含む。場合によっては、モデル及び/又はアルゴリズムは、機械可読フォーマットで提供され、且つ、メチル化レベル又はメチル化プロファイルを疾患の状況と関連付けるために、及び/又は患者或いは患者の分類について治療法(treatment modality)を指定するために使用される。
幾つかの態様において、本明細書に記載されるものは、本明細書に記載される1以上の方法を実施するための手段が提供されるコンピュータシステム又はプラットフォームに関係する。幾つかの実施形態において、コンピュータシステムは、(a)方法を実施するためにコンピュータシステムの動作を制御するのに適用される少なくとも1つのコンピュータプログラムを含む少なくとも1つのメモリを含み、前記方法は、(i)DNAメチル化データ、例えば、CUPのメチル化プロファイル及び1以上の原発腫瘍のメチル化プロファイルを受け取る工程、(ii)CPUのメチル化プロファイルと原発腫瘍のメチル化プロファイルとの同一性の程度を判定する工程を含み、前記コンピュータシステムは更に、(b)コンピュータプログラムを実行するための少なくとも1つのプロセッサを含む。幾つかの実施形態において、プラットフォームは1以上のコンピュータシステムを含む。
幾つかの実施形態において、本明細書に提供される方法は、サーバー又はコンピュータサーバー上で処理される(図2)。幾つかの実施形態において、サーバー(401)は、シングルコアプロセッサ、マルチコアプロセッサ、又は、並行処理のための複数のプロセッサである、中央処理装置(CPU、「プロセッサ」とも称す)(405)を含む。幾つかの実施形態において、制御組立体の一部として使用されるプロセッサは、マイクロプロセッサである。幾つかの実施形態において、サーバー(401)はまた、メモリ(410)(例えば、ランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ);電子記憶装置ユニット(415)(例えばハードディスク);1以上の他のシステムと通信するための通信用インターフェース(420)(例えばネットワークアダプタ);及び、キャッシュ、他のメモリ、データストレージ、及び/又は電子表示装置アダプターを含む周辺機器(425)を含む。メモリ(410)、記憶装置ユニット(415)、インターフェース(420)、及び周辺機器(425)は、マザーボードなどの通信バス(実線)を介してプロセッサ(405)と通信状態にある。幾つかの実施形態において、記憶装置ユニット(415)は、データを保存するためのデータ記憶装置ユニットである。サーバー(401)は、通信用インターフェース(420)の補助によりコンピュータネットワーク(「ネットワーク」)(430)に動作自在につながれる。幾つかの実施形態において、追加のハードウェアの補助によりプロセッサも、ネットワークに動作自在につながれる。幾つかの実施形態において、ネットワーク(430)は、インターネット、イントラネット及び/又はエクストラネット、インターネットと通信状態にあるイントラネット及び/又はエクストラネット、テレコミュニケーション、又はデータネットワークである。幾つかの実施形態において、サーバー(401)の補助によりネットワーク(430)は、サーバー(401)につながれたデバイスがクライアント又はサーバーとして作用するのを可能にする、ピアツーピアのネットワークを実施する。幾つかの実施形態において、サーバーは、ネットワーク(430)を通って運ばれた電子信号を介して、コンピュータ可読命令(例えば、デバイス/システム動作プロトコル又はパラメータ)、又はデータ(例えば、センサー測定値、代謝物質の検出から得た生データ、代謝物質の検出から得た生データの解析、代謝物質の検出から得た生データの解釈など)を送受信することができる。更に、幾つかの実施形態において、ネットワークは例えば、国境線にわたってデータを送受信するために使用される。
別の態様において、本発明は、癌の状況を検出及び/又は特徴付け、及び/又はCpGメチル化プロファイルのデータベースの生成のためのキットを提供し、該キットは、本明細書に記載される1以上のサンプルのメチル化の状況/レベルを検出又は測定するために複数のプライマー又はプローブを含む。そのようなキットは、幾つかの例において、本発明のメチル化バイオマーカー配列の少なくとも1つをハイブリダイズする少なくとも1つのポリヌクレオチド、及び遺伝子メチル化の検出のための少なくとも1つの試薬を含む。メチル化の検出のための試薬は、例えば、硫酸水素ナトリウム、マーカー配列がメチル化されない場合にマーカー配列の生成物である配列にハイブリダイズするよう設計されたポリヌクレオチドの検出のための試薬(例えば、少なくとも1つのC−U変換を含む)、及び/又は、メチル化に敏感な又はメチル化に依存する制限酵素を含む。場合によっては、キットは、アッセイにおける使用に適したアッセイ機器の形態で固形支持体を提供する。幾つかの例において、キットは、キット中に、ポリヌクレオチド、例えばプローブに随意に結合される、検知可能なラベルを更に含む。
他に定義されない限り、本明細書で用いる全ての技術用語及び科学用語は、請求される主題が属する技術分野における当業者によって、一般に理解されるものと同じ意味を有する。前述の一般的な記載及び次の詳細な記載は、典型的且つ例示的なものにすぎず、請求された任意の内容を限定するものではないことが理解される。本出願において、単数形の使用は、特に別記しない限り複数を含む。明細書と添付の特許請求の範囲に使用されるように、単数形「a」、「an」、及び「the」は、他にその内容が明確に指示しない限り、複数の指示対象を含むということに留意しなければならない。本出願において、「又は」の使用は、特に明記しない限り、「及び/又は」を意味する。更に、用語「含んでいる(including)」の使用は、「含む(include)」、「含む(includes)」、及び「含まれる(included)」といった他の形態と同じく、制限はない。
<安定化及びストック>
<承認>
このプロジェクトはSYSUのIRB及びSichuan Universityにより承認されている。インフォームドコンセントを全患者から得る。患者がインフォームドコンセントに署名した後、腫瘍と正常組織を得る。
尿安定緩衝液を、尿DNA安定化及び無細胞DNAの保護により処方した。防腐剤は尿の中の細胞を安定させ、ゲノムDNAの放出を妨げて、高品質の無細胞DNAの分離を可能にする。尿安定緩衝液において集められたサンプルは室温で14日までの間、安定しており、好都合なサンプルの収集、移送、及び貯蔵を可能にする。
2.2%のクエン酸ナトリウム
0.8%のクエン酸
0.245%のデキストロース
500mMEGTA
1%のグルタルアルデヒド又は1%のホルムアルデヒド
尿サンプルを15分間、高速(例えば11,000xg)で遠心分離し、上清を核酸抽出のために使用する。これにより、サンプルから細胞物質及び細胞の核酸を除去する。
長期的なストックのために上清を−20から−80℃で維持する。
1.円錐管に40mlまでの尿を移す。
2.尿1mlごとに、50μlの尿安定緩衝液を加える。逆チューブにより10回より多く、尿混合物を十分に混合する。尿に尿安定緩衝液を加えて混合した後、尿を周囲温度で14日まで保存することができる。
3.15分間11000xgで遠心分離する。
4.ペレットをかき乱すことなく、新たな円錐管に尿の上清を注意深く移す。
5.その後、無細胞の尿(尿の上清)をストックとして−20から80℃で維持し、又はDNA抽出のために処理する。
4つの工程:溶解−結合−洗浄−溶出
尿サンプルをプロテイナーゼKとDNA溶解緩衝液の存在下、高温の非常に変性の条件下で溶解して、それと共に、DNaseの不活性化、及び結合タンパク質、脂質、及びベシクルから核酸の完全な放出を確実なものとする。
溶解後の尿から放出された核酸を、シリカ膜のカラム又はビーズへと選択的に結合する。
核酸は膜に結合したままである一方、汚染物質は3つの洗浄工程中に効率的に洗い流される。
高度に純粋な循環する核酸を、一回の工程で溶出緩衝液において溶出する。
Qubit ds DNA HSキット又は定量的な増幅方法を、収量の判定のために使用する。収量は、サンプルの容積と、サンプル中の循環する核酸の濃度に依存する。サンプルから得た循環するDNAとRNAの絶対収量は、サンプルと異なる個体との間でかなり変動し、また他の要因、例えば性別や特定の疾患状況に依存する。この手順を使用して精製された循環する核酸の粒度分布を、アガロースゲル電気泳動法により確認する。
QIAamp Circulating Nucleic Acid Kitを使用し、4mlの尿から、上清を尿安定緩衝液の混合物により処理して、上述のように遠心分離する。尿サンプルは新鮮である又は凍結されており、後に室温に釣り合う。
1.50mlのチューブ(提供されない)の中へ500μlのQIAGENプロテイナーゼKをピペットで移す。
2.50mlのチューブに4mlの尿を加える。
3.4mlの緩衝液ACL(必要とされるような担体RNAを含む)と1.0mlの緩衝液ATLを加え、キャップを締め、30秒間パルス攪拌により混合する。
4.60℃で30分間インキュベートする。
5.実験台上でチューブを配して、キャップを弛める。
6.溶解物に9.0mlの緩衝液ACBを加えて、キャップを締め、15−30秒間パルス攪拌により徹底的に混合する。
7.氷の上で5分間、溶解物−緩衝液ACBをインキュベートする。
8.QIAvac 24 Plus上で、VacConnectorにQIAamp Miniカラムを挿入する。開いたQIAamp Miniカラムに20mlのチューブ伸展具を挿入する。サンプルの漏出を回避するために、チューブ伸展具がQIAamp Miniカラムにしっかり挿入されていることを確かめる。
9.QIAamp Miniカラムのチューブ伸展具に、工程7の溶解物を注意深く適用する。真空ポンプのスイッチを入れる。全ての溶解物がカラムを通って完全に引き抜かれると、真空ポンプのスイッチを切り、圧力を0mbarにまで解放する。チューブ伸展具を注意深く除去且つ廃棄する。
10.QIAamp Miniカラムに600μlの緩衝液ACW1を適用する。カラムの蓋を開いた状態にし、真空ポンプのスイッチを入れる。全ての緩衝液ACW1がQIAamp Miniカラムを通って引き抜かれた後、真空ポンプのスイッチを切り、圧力を0mbarにまで解放する。
11.QIAamp Miniカラムに750μlの緩衝液ACW2を適用する。カラムの蓋を開いた状態にし、真空ポンプのスイッチを入れる。全ての緩衝液ACW2がQIAamp Miniカラムを通って引き抜かれた後、真空ポンプのスイッチを切り、圧力を0mbarにまで解放する。
12.QIAamp Miniカラムに750μlのエタノール(96−100%)を適用する。カラムの蓋を開いた状態にし、真空ポンプのスイッチを入れる。全てのエタノールがQIAamp Miniカラムを通って引き抜かれた後、真空ポンプのスイッチを切り、圧力を0mbarにまで解放する。
13.QIAamp Miniカラムの蓋を閉じ、それを真空マニホルドから除去し、VacConnectorを廃棄する。(工程8から取っておいた)きれいな2mlの収集チューブにQIAamp Miniカラムを入れ、3分間全速力で(20,000xg;14,000rpm)遠心分離する。
14.新しい2mlの収集チューブにQIAamp Miniカラムを入れ、蓋を開き、56℃で10分間アセンブリをインキュベートして、膜を完全に乾燥する。
15.きれいな1.5mlの溶出チューブにQIAamp Miniカラムを入れ、工程14の収集チューブを廃棄する。QIAamp Miniカラムの膜の中心に20−150μlの緩衝液AVEを注意深く適用する。蓋を閉じ、室温で3分間インキュベートする。
16.1分間全速力で(20,000xg;14,000rpm)遠心分離を行い、核酸を溶出する。
<データソース>
The Cancer Genome Atlas(TCGA)を含む様々なソースからDNAメチル化データを得た。Infinium 450Kのメチル化アレイを使用して、485,000の部位のメチル化状況を生成した。追加データは、以下のGSEデータセット:GSE46306、GSE50192、GSE58298、及びGSE41826からのものであった。腫瘍及びその対応する正常組織に関するメチル化プロファイルを分析した(表1)。
癌種に特異的なシグネチャーの識別を、特定の癌種とその周囲の正常組織との間の対でのメチル化差異、2つの異なる癌種間の差異、同様に、2つの異なる正常組織間の差異を比較することにより、達成した。全ての485,000CpGのメチル化部位を、1100の腫瘍サンプル及び231の一致した隣接する正常組織サンプルのトレーニングコホートにおいて調査した。
主成分分析を、統計環境における関数:prcomp()を使用して、各比較群における上位10のマーカーに適用し、各群の第1の主成分における加重値を抽出し、その加重値を各群において10の対応するマーカーと一致させた。マーカーを持つ加重値の190の群が存在する。
データにおけるサンプルの各々に関する190の変数を生成した。加重値/マーカーの組み合わせを使用して、各変数Vを、以下の方程式を用いて計算した:
上述のマトリックスを使用してサンプルを分類した。ロジスティック回帰、最近傍(NN)、及びサポートベクターマシン(SVM)を含む、本明細書で使用される様々な分類アルゴリズムがある。
1.誤った組織。これは結腸組織が肺組織として識別される場合に生じる。
2.偽陰性
3.偽陽性
4.正しい組織及び予後。誤った癌種。例えば、これは、腎臓の明細胞癌が腎臓の乳頭状の細胞癌として識別される時のものである。
1.サンプルを5等分に分け、そのうち4つをトレーニングに使用し、5番目の部分を使用して結果を試験した。
2.1つを除いて全てのサンプルがトレーニングに使用される場合、Leave one outのシナリオを使用した。one left outを試験に使用した。それらを全て試験するまで、各サンプルのためにこれを繰り返した。
3.2段階の複製研究において、プロセスの始めにサンプルを2つのセットに分けた。トレーニングセットにより、最も高いt検定スコアとのそれぞれの比較において10のマーカーを確認した。その後、これらマーカーを使用して主成分を生成し、次にこれら変数を使用してSVMを生成した。その後、得られたマーカーを試験セットに適用し、主成分とSVMの結果を生成した。
患者と組織の特徴:一致した隣接する正常組織を対照として使用した。これらの正常組織を、癌の証拠のない組織構造により確認した。
癌種に特異的なシグネチャーを識別するために、特定の癌種とその周囲の正常組織との間のメチル化の差異、異なる癌種間の差異、同様にペアワイズの様式で2つの正常組織間の差異を、比較した。肺癌(腺癌及び扁平上皮癌)及び結腸と直腸の癌の2つのNSCLC亜型を含む、12種類の癌の患者のトレーニングコホートのゲノムワイドDNAメチル化プロファイルを、Illumina 450,000 CpGメチル化マイクロアレイを使用して分析した。12の腫瘍群と9の正常組織群を含む、合計21の組織群により、合計21*20/2=210の固有のペアワイズの比較を、実行した。R遺伝子フィルタパッケージにおいてcolttests()関数を使用して、450kのマーカーを、1つの群からの群まで比較した。t−統計量によりマーカーを最低のp値にランク付けし、各群における各比較と上位10のマーカーとの間の平均メチル化画分における最大の差異を、再検証分析のために選択した。190の比較の後、958の固有の非冗長マーカーを全癌パネルとして生成した。統計環境における関数::prcomp()を使用して、主成分分析を各比較群における上位10のマーカーに適用することにより各マーカーに重みをかけ、各群の第1の主成分における加重値を抽出し、その加重値を各群において10の対応するマーカーと一致させた。これらのマーカーを使用して、ニューラルネットワーク、ロジスティック回帰、最近傍(NN)及びサポートベクターマシン(SVM)を含む様々なアルゴリズムによりサンプルを分類し、その全ては一貫した結果を生成した。SVMを使用する分析は、最も確固としていることが分かり、それ故、全ての後の分析に使用された。これら958の上位ランクのCpG部位を、癌及び正常なサンプルにおいて教師無し様式で示した。
DNAメチル化が遺伝子発現の不可欠な後成的レギュレータであるとすれば、コホートにおける遺伝子発現との、腫瘍対正常組織における部位遺伝子の差動的なメチル化の相関性を調査した。具体的に、上述のアルゴリズムにおける悪性腫瘍の存在を予測したメチル化部位が対象であった。癌種における高メチル化を示した上位のマーカーを、その一致した正常組織の相当物におけるものと比較した場合に選択し、乳房、肝臓、肺、及び結腸の癌におけるそれらの対応遺伝子を確認した。これらの遺伝子の差動的発現を計算するために発見コホートとしてTCGAからのRNA seqデータを利用し、癌組織収集物を検証コホートとして使用した。ほぼ全ての遺伝子は、正常なものに比べて提示された著しいCpGの高メチル化を選択し、減少された発現をこれら遺伝子の各々において観察した。ウィルコクソンの符号順位検定を使用して1.21x10−21のp値を判定した。幾つかの例において、選択された遺伝子は発癌性に関連していた。
8000のメチル化マーカーの検証及び癌患者の第2コホートにおけるそれらの検証後、早期癌を検出するためのそれらの使用を、血漿と尿における調査する無細胞腫瘍DNAにより調査した。
<承認>
The Cancer Genome Atlas(TCGA)のデータを、TCGAのウェブサイトからダウンロードした。このプロジェクトはSYSUのIRB及びSichuan Universityにより承認された。インフォームドコンセントを全患者から得た。患者がインフォームドコンセントに署名した後、腫瘍と正常組織を得た。
初期のトレーニングセット及び第1の試験セットからのDNAメチル化データを、The Cancer Genome Atlas(TCGA)から得た。1150の患者腫瘍及び一致した正常組織サンプルの検証コホートと同様に、4032の腫瘍及び一致した隣接する正常組織サンプルのトレーニングコホートに関するメチル化データを含む、臨床的特徴及び分子プロファイリングを、TCGAから得た。West China Hospital及びSun Yat−sen University Cancer Centerからの亜硫酸水素塩配列決定方法を使用して、810人の中国人の癌患者の別個の検証コホートを得た。研究コホートにおける患者の臨床的特徴を、表2、及び図37−図40に列挙する。一致した隣接する正常組織サンプルを、同じ患者から腫瘍と同時に集めて、組織構造により癌の証拠を持たないことを確認した。Infinium 450Kのメチル化アレイを使用して、485,000の部位のメチル化状況を生成した。追加データは、以下のGSEデータセット:GSE46306、GSE50192、GSE58298、及びGSE41826からのものであった。メチル化データファイルを、走査された各ビーズの比率値を備えたIDATフォーマットで得た。Bioconductorのminfiパッケージを使用して、これらデータファイルを、ベータ値と称されるスコアに変換した。全てのサンプルに関するベータ値を得た後、20のデータセット全てにわたり存在しなかったマーカーを排除した。
特定の癌種とその相当する正常組織との間のペアワイズのメチル化差異、2つの異なる癌種間の差異、同様に、2つの異なる正常組織間の差異を比較することにより、癌種に特異的なシグネチャーを識別し、合計12の組織群は6の腫瘍群と6の正常組織群とを含んでいる。患者のサンプルを、一致した隣接する正常組織を含む6つの異なる組織からのTCGAを表示する9つの癌種から、トレーニング及び検証のコホートへと、無作為に分けた。これを行うために、合計12*11/2=66の固有のペアワイズの比較を行なった。Illumina 450,000 CpGメチル化マイクロアレイを使用して、450kのマーカーを、R遺伝子フィルタパッケージにおいて[カラムt検定]colttests()関数を用いて群ごとに比較した。t−統計量により最低のp値を持つマーカー、及び各群における各比較間の平均メチル化画分における最大の差異をランク付けし、各群における上位10のマーカーを再検証分析のために選択した。450の比較の後、432の固有の非冗長マーカーを全癌パネルとして生成した。これら432の上位ランクのCpG部位を、各癌種及び正常なサンプルにおいて教師無し様式で示した(図8)。
主成分分析を、統計環境における関数:prcomp()を使用して、各比較群における上位10のマーカーに適用し、各群の第1の主成分における加重値を抽出し、各群において10の対応するマーカーと一致させた。マーカーを持つ加重値の45の群が存在する。これらのマーカーを使用して、ニューラルネットワーク、ロジスティック回帰、最近傍(NN)及びサポートベクターマシン(SVM)を含む様々なアルゴリズムによりサンプルを分類し、その全ては一貫した結果を生成した。SVMを使用する分析は、最も確固としていることが分かり、それ故、全ての後の分析に使用された。
遺伝子発現と相互に関連付けられた、腫瘍対正常組織における遺伝子中の部位の差動的なメチル化を更に調査した。正常組織において平均メチル化値が<5%であり、且つ癌組織においては>50%であるトップマーカーを選択し、これは癌と正常組織の両方におけるメチル化と遺伝子発現のレベルの優れた相関性を示した。TCGAからのRNA−seqデータを使用して、これら遺伝子の差動的発現を計算した(図15A)。CpG高メチル化は、正常なサンプルに比べて癌において観察され、対応遺伝子においては反対に発現が減少していた。新しく発見された腫瘍抑制因子機能により識別された遺伝子を更に試験した。ZSCAN18を選択して、癌の生物学に対するその機能的関連性を試験し、ZNF502は乳癌の病因に関係していた。ZNF502は、逆に遺伝子発現が減少している乳癌において高メチル化される(p=xx、p=xx)(図15A−図15E)。加えて、ZNF502発現は乳癌において抑止され、細胞培養物及びヌードマウスにおける腫瘍増殖を減少させると観察された(図15G)。同様に、FUZにおけるメチル化レベルは、逆に遺伝子発現レベルが減少した肝臓癌において増大し、細胞培養物とヌードマウスにおいて腫瘍増殖を阻害すると示された(図15F−図15J)。
データにおけるサンプルの各々に関する45の変数を生成した。加重値/マーカーの組み合わせを使用して、各変数Vを、以下の方程式を用いて計算した:
上述のマトリックスを使用してサンプルを分類した。ロジスティック回帰、最近傍(NN)、及びサポートベクターマシン(SVM)を含む、本明細書で使用される様々な分類アルゴリズムがある。全ての後の分析に、SVMを用いる分析を使用した。
1.不正確な組織;例えば結腸組織が肺組織として識別される。
2.偽陰性;例えば、肺癌は正常な肺として識別される。
3.偽陽性;例えば、正常な結腸は結腸癌として識別される。
4.正確な組織、不正確な癌種;例えば、腎臓の明細胞癌は、腎臓の乳頭状の細胞癌として識別される。
1.サンプルを5等分に分け、そのうち4つをトレーニングに使用し、5番目の部分を使用して結果を試験した。
2.1つを除いて全てのサンプルがトレーニングに使用される場合、Leave one outのシナリオを使用した。one left outを試験に使用した。それらを全て試験するまで、各サンプルのためにこれを繰り返した。
3.2段階の複製研究:プロセスの始めにサンプルを2つのセットに分けた。トレーニングセットにより、最も高いt検定スコアとのそれぞれの比較において10のマーカーを確認した。その後、これらマーカーを使用して主成分を生成し、次にこれら変数を使用してSVMを作成した。得られたマーカーを試験セットに適用し、主成分とSVMの結果を生成した。
新しく凍結した健全な又は癌の組織の片からのゲノムDNA抽出を、製造業者の推奨に従いQIAamp DNA Mini Kit(Qiagen)により行った。およそ0.5mgの組織を使用し、平均5μgのゲノムDNAを得た。DNAを−20℃で保存し、調製の1週間以内に分析した。
様々な修飾でQIAamp DNA FFPE Tissue Kitを使用して、凍結したFFPEサンプルからのゲノムDNAを抽出した。DNAを更なる分析のために−20℃で保存した。
製造業者のプロトコルに従いEZ DNA Methylation−Lightning(商標)キット(Zymo Research)を使用し、1μgのゲノムDNAをビス−DNAに変換した。結果として生じるビス−DNAは、〜200−3000bpの粒度分布を有しており、ピークは約〜500−1000bpであった。ビス−DNAの深い配列決定、及び、CH(非CG)ジヌクレオチドのT変換に対するCの比率の分析によって確認されるように、重亜硫酸塩変換の効率は、>99.8%であった。
癌組織と正常組織との比較の何れかにおいてメチル化レベルが著しく異なったCpGマーカーを使用して、配列決定のためのパッドロックプローブを設計した。パッドロック捕捉とビス−DNAの配列決定は、修飾によりG. Church and colleagues (Porreca GJ, Nat Methods. 2007 Nov; 4 (11):931−6.)及びK. Zhang and colleagues (Diep, D Nat Methods. 2012 Feb 5;9(3):270−2, Deng, J. et al. Nat. Biotechnol. 27, 353−360 (2009))によって開発された技術に基づく。
パッドロックプローブを、ppDesignerソフトウェア(Diep, D, Nat Methods. 2012 Feb 5;9(3):270−272)を使用して設計した。捕捉した領域の平均長は70bpであり、CpGマーカーは捕捉した領域の中心部に位置する。CpGマーカーの未知のメチル化状況により導入されたバイアスを妨げるために、CGジヌクレオチドを欠いた配列内に捕捉アームを排他的に位置付けた。アーム間のリンカー配列は、等しい長さのプローブを生成するために、Csの可変的な伸展により分離された増幅プライマーのための結合配列を含んでいた。プローブの平均長は91bpであった。プローブは、6−bpの固有の分子識別子(UMI)配列を組み込み、個々の分子捕捉事象の識別と、DNAメチル化レベルの正確なスコア付けを可能にした。
20ngの重亜硫酸塩に変換されたDNAを、1X Ampligase緩衝液(Epicentre)を含む20μlの反応物において、定められたモル比のパッドロックプローブと混合した。DNAに対するプローブの最適なモル比は、20,000:1であると実験的に判定した。蒸発を妨げるために、反応物を50μlの鉱油で覆いかぶせた。DNAに対してプローブをアニールするために、95℃で30秒の変性の後、毎秒0.02℃の割合で55℃にゆっくりと冷却した。ハイブリダイゼーションを、55℃で15時間にわたり放置することで完了させた。アニールされたアーム間の間隙を満たすために、以下の5μlの混合物を各反応物に加えた:2UのPfuTurboCxポリメラーゼ(95℃で3分間予め活性化した(Agilent))、0.5UのAmpligase(Epicentre)、及び1X Ampligase緩衝液中の250pmolの各dNTP。55℃で5時間のインキュベーションの後、反応物を94℃で2分間変性させて、氷の上で即座に冷却した。5μlのエキソヌクレアーゼ混合物(20UのExoI及び100UのExoIII、共にEpicentre由来)を加え、一本鎖DNA分解を37℃で2時間行い、その後、94℃で2分間酵素不活性化を行った。
本来のパイロット捕捉実験の深い配列決定は、最も効果的なプローブと非効果的なプローブにより捕捉された読み取りの数の間の有意差を示した(>0.2の平均の範囲を持つ捕捉領域の60−65%)。これを改善するために、相対的な効率を配列決定データから計算し、プローブを調整されたモル比で混合した。これにより捕捉均一性を、>0.2の平均範囲で領域の85%に増大させた。
幾つかの修飾と共にソフトウェアツールbisReadMapper (Diep, D, Nat Methods. 2012 Feb 5;9(3):270−272)を使用して、配列決定の読み取りのマッピングを行った。初めに、各配列決定の読み取りからUMIを抽出し、添付して、D.D.により豊富に提供されるカスタムスクリプトを用いてFASTQファイル内のヘッダーを読み取った。Bowtie2を使用して、あたかもCが全てメチル化されず、且つヒトゲノムのインシリコで変換されたDNA鎖へとマッピングされたかのように、また、あたかもCが全てメチル化されなかったかのように、読み取りを飛行中に変換した(Langmead B, Salzberg S. Fast gapped−read alignment with Bowtie 2. Nature Methods. 2012, 9:357−359)。本来の読み取りを単一のUMIのために統合且つフィルタ処理し、即ち、同じUMIを運ぶ読み取りを廃棄して、1つの読み取りを残した。パッドロックプローブが設計される全てのCpGマーカーのために、メチル化頻度を抽出した。任意のサンプルにおける20未満の読み取りを持つマーカーを分析から除外した。この結果、メチル化レベルが約5%以上の精度で判定される〜600CpGのマーカーがもたらされた。
腫瘍及び相当する遠くの部位のサンプルを、外科的腫瘍切除を受ける患者から得て、使用するまでサンプルを−80℃で冷凍保存した。サンプルからのDNAとRNAの分離を、AllPrep DNA/RNA Miniキット(Qiagen,Valencia,CA)を使用して実行し、RNAをオンカラムのDNase消化にさらした。Nanodrop 2000を使用してRNAを定量化し、製造業者の指示に従いiScript cDNA合成キット(Bio−rad,Inc)を使用して、各サンプルの200ngのRNAを相補DNA合成のために使用した。簡潔に、サンプルを、25℃で5分間、42℃で30分間、その後85℃で5分間、インキュベートした。7500 Real Time PCRシステム(Applied Biosystems)の上で遺伝子特異的なプライマー(表9)とPower SYBR Green PCR Master Mixを使用して、40のサイクル増幅によりqPCRを実行した。測定を三通りに行い、内因的なACTBレベルに標準化した。発現における相対的な倍率変化を、ΔΔCT方法(サイクル閾値<30))を使用して計算した。3つの複製に基づいてデータを平均±s.dとして示す。
制度上及び国際的な動物の規則に従い、全ての動物研究を行った。Sun Yat− Sen University Cancer Center及びWest China HospitalのInstitutional Animal Care and Use Committeeにより、動物プロトコルは承認された。メスの無胸腺BALB/cヌードマウス(4−5週齢、18−20g)を、供給業者(Guangdong Province Laboratory Animal Center, Guangzhou, China)から購入した。腫瘍細胞を100μlの無血清培地において懸濁し、マウスに皮下注射した。最大の腫瘍の大きさが10mm以上として定められる腫瘍量に到達するまで、腫瘍の増殖を3日ごとに診察によりモニタリングした。キャリパーを使用して腫瘍の大きさを測定し、腫瘍容積を以下の方程式に従って計算した:腫瘍容積(mm3)=(長さ(mm)×幅(mm)2)×0.5。典型的なデータを、1つの実験群当たり5匹のマウスから得た。一元の繰返し測定ANOVAにより統計分析を行った。
<承認>
Sun Yat−Sen University Cancer Center及びWest China HospitalのIRBにより、この計画は承認された。インフォームドコンセントを全患者から得た。患者がインフォームドコンセントに署名した後、腫瘍と正常組織を得た。
未知の起原の転移性腺癌の患者をこの研究に登録した。患者は、進行性の体重減少、疲労、及び虚弱を提示した。精密検査は、詳細な履歴、骨盤、直腸、精巣組織を含む完全な検査、CBC、CMP、UA、便潜血を含む研究所試験、組織検査、撮像、内視鏡検査を含んでいた。
目的は結腸癌とその転移を診断することであったので、肝臓と肺が転移の最も頻繁な部位である場合、結腸癌に加えて肝臓癌と肺腺癌のための正確な癌シグネチャーを生成することが必要とされた。それ故、2487の癌患者及び正常な患者を研究した(表10と図21)。同じ患者に由来する隣接した正常組織を対照として使用した。これら正常組織を、癌の証拠の無い組織構造により確認した。患者の特徴を図44A−図44Bに要約する。
癌種の特異的なシグネチャーを識別するために、比較を行い、特定の癌種と、肝臓癌及び肺癌に関するその周囲の正常組織との間のメチル化差異を識別する。3つのペアワイズの比較解析を、癌に特異的及び組織に特異的なメチル化シグネチャーの生成のために行った:1)特定の癌種と、その相当する正常組織との間のペアワイズのメチル化差異、2)2つの異なる癌種間の差異、及び3)2つの異なる正常組織間の差異。3の腫瘍群と3の正常組織群を含む、合計6の組織群により、合計15の固有のペアワイズの比較(6*5/2)を、実行した。Illumina 470,000 CpGメチル化マイクロアレイを使用して、450,000のマーカーを、R遺伝子フィルタパッケージにおいて[カラムt検定]colttests()関数を用いて1つの比較ごとに使用した。マーカーを、t−統計量試験により判定されるように最低のp値、及び各比較の間の平均メチル化画分における最大の差異の両方によりランク付けし、再検証分析のために各群における上位10のマーカーを選択した。15の比較の後、127の固有の非冗長マーカーを全癌パネルとして生成した。
主成分分析を、統計環境におけるprcomp()関数を使用して、各比較群における上位10のマーカーに適用し、各群の第1の主成分における加重値を抽出し、各群において10の対応するマーカーを持つ加重値と一致させた。全体でマーカーを持つ加重値の45の群が存在する。これらのマーカーを使用して、ニューラルネットワーク、ロジスティック回帰、最近傍(NN)及びサポートベクターマシン(SVM)を含む様々なアルゴリズムによりサンプルを分類し、その全ては一貫した結果を生成した。SVMを使用する分析は、最も確固としていることが分かり、それ故、全ての後の分析に使用された。
DNAメチル化データを、The Cancer Genome Atlas(TCGA)、Infinium 450Kメチル化アレイを使用して生成された485,000の部位の分析、及び以下のGSEデータセットからの追加データを含む、様々なソースから得た:GSE46306、GSE50192、GSE58298、及びGSE41826。腫瘍及びその対応する正常組織に関するメチル化プロファイルを分析した。メチル化データファイルを、走査された各ビーズの比率値を備えたIDATフォーマットで得た。Bioconductorのminfiパッケージを使用して、これらデータファイルを、ベータ値と称されるスコアに変換した。全20のデータセットにわたり存在していない任意のマーカーに関するベータ値を排除した。
データにおけるサンプルの各々に関する45の変数を生成した。加重値/マーカーの組み合わせを使用して、各変数Vを、以下の方程式を用いて計算した:
上述のマトリックスを使用してサンプルを分類した。ロジスティック回帰、最近傍(NN)、及びサポートベクターマシン(SVM)を含む、本明細書で使用される様々な分類アルゴリズムがある。その全てが、一貫した結果を生成した。しかし、SVMを使用する分析はかなり優れており、より堅固なものであり、それ故、全ての後の分析に使用された。
1.不正確な組織;例えば結腸組織が肺組織として識別される。
2.偽陰性;
3.偽陽性;
4.正確な組織及び予後、不正確な癌種。
1.サンプルを5等分に分けた。4つの部分をトレーニング用に使用し、5番目の部分を結果の試験のために使用した。
2.1つを除いて全てのサンプルがトレーニングに使用されるleave one outシナリオを利用して、除外された群を試験した。それらを全て試験するまで、各サンプルのためにこれを繰り返した。
3.2段階の複製研究:プロセスの始めにサンプルを2つのセットに分けた。トレーニングセットにより、最も高いt検定スコアとのそれぞれの比較において10のマーカーを選択した。その後、これらマーカーを使用して主成分を生成し、結果として生じる変数を使用してSVMを作成した。次に、得られたマーカーを試験セットに適用し、主成分とSVMの結果を生成した。
約0.5mgの組織から始めて、ゲノムDNAを、製造業者のプロトコルに従いQIAamp DNA Mini Kit(Qiagen)を使用して抽出した。腫瘍及び相当する正常且つ転移した組織サンプルの両方を使用し、平均で5μgの総DNAを得た。DNAを−20℃で保存し、調製の1週間以内に分析した。
様々な修飾でQIAamp DNA FFPE Tissue Kitを使用して、FFPEサンプルからのゲノムDNAを抽出した。DNAを−20℃で保存し、調製の1週間以内に分析した。
製造業者のプロトコルに従いEZ DNA Methylation−Lightning(商標)キット(Zymo Research)を使用し、健康な組織、腫瘍組織、及び転移組織からの1μgのゲノムDNAをビス−DNAに変換した。Tape Station分析(Agilent)に基づき、結果として生じるビス−DNAは、〜200−3000bpの粒度分布を有しており、ピークは約〜500−1000bpであった。ビス−DNAの深い配列決定、及び、CH(非CG)ジヌクレオチドのT変換に対するCの比率の分析によって確認されるように、重亜硫酸塩変換の効率は、>99.8%であった。
癌組織と正常組織との比較の何れかにおいてメチル化レベルが著しく異なったCpGマーカーを使用して、配列決定のためのパッドロックプローブを設計した。パッドロック捕捉とビス−DNAの配列決定は、修飾によりG. Church and colleagues (Porreca GJ, Nat Methods. 2007 Nov; 4 (11):931−6.)及びK. Zhang and colleagues (Diep, D Nat Methods. 2012 Feb 5;9(3):270−2, Deng, J. et al. Nat. Biotechnol. 27, 353−360 (2009))によって開発された技術に基づく。
パッドロックプローブを、70bpの平均捕捉領域長さによりppDesignerソフトウェア(Diep, D, Nat Methods. 2012 Feb 5;9(3):270−272)を使用して設計した。CpGマーカーは、捕捉した領域の中心部内に位置していた。外部CpGマーカーの未知のメチル化状況により導入された意図しないバイアスを妨げるために、捕捉アームは、CGジヌクレオチドを欠いた領域内に排他的に位置していた。増幅プライマーのための結合配列を含んでいたリンカー配列により、捕捉アームを接続した。Csを繰り返す可変的な伸展を、長さが平均91bpであるプローブを生成するためにプライマー部位の間に挿入した。プローブは、6−bpの固有の分子識別子(UMI)配列を組み込み、個々の分子捕捉事象の識別と、DNAメチル化レベルの正確なスコア付けを可能にした。
20ngの重亜硫酸塩に変換されたDNAを、1X Ampligase緩衝液(Epicentre)を含む20μlの反応物において、定められたモル比のパッドロックプローブ(実験的に定められるように、1:20,000)と混合した。その後、蒸発を妨げるために、反応物を50μlの鉱油(Sigma)で覆いかぶせた。DNAを95℃で30秒間変性させ、その後、1秒につき0.02℃の割合で55℃に冷却し、プローブがDNAに対してアニールすることを可能にした。ハイブリダイゼーションを、55℃で15時間にわたり放置することで完了させた。捕捉領域を重合するために、以下の5μlの混合物を各反応物に加えた:2UのPfuTurboCxポリメラーゼ(95℃で3分間予め活性化したC(Agilent))、0.5UのAmpligase(Epicentre)、及び1X Ampligase緩衝液中の250pmolの各dNTP。55℃で5時間のインキュベーションの後、反応物を94℃で2分間変性させて、氷の上で即座に冷却した。5μlのエキソヌクレアーゼ混合物(20UのExoI及び100UのExoIII、共にEpicentre由来)を加え、一本鎖DNA分解を37℃で2時間行い、その後、94℃で2分間酵素不活性化を行った。
本来のパイロット捕捉実験の深い配列決定は、最も効果的なプローブと非効果的なプローブにより捕捉された読み取りの数の間の有意差を示した(>0.2の平均の範囲を持つ捕捉領域の60−65%)。これを改善するために、相対的な効率を配列決定データから計算し、プローブを調整されたモル比で混合した。これにより捕捉均一性を、>0.2の平均範囲で領域の85%に増大させた。
幾つかの修飾と共にソフトウェアツールbisReadMapper(Diep, D, Nat Methods. 2012 Feb 5;9(3):270−272)を使用して、配列決定の読み取りをマッピングした。初めに、各配列決定の読み取りからUMIを抽出し、添付して、D.D.により豊富に提供されるカスタムスクリプトを用いてFASTQファイル内のヘッダーを読み取った。Bowtie2を使用して、あたかもCが全てメチル化されず、且つヒトゲノムのインシリコで変換されたDNA鎖へとマッピングされたかのように、また、あたかもCが全てメチル化されなかったかのように、読み取りを飛行中に変換した(Langmead B, Salzberg S. Fast gapped−read alignment with Bowtie 2. Nature Methods. 2012, 9:357−359)。本来の読み取りを単一のUMIのために統合且つフィルタ処理し、即ち、同じUMIを運ぶ読み取りを廃棄して、二重の読み取りを除外した。パッドロックプローブが設計される全てのCpGマーカーのために、メチル化頻度を抽出した。任意のサンプルにおける20未満の読み取りを持つマーカーを分析から除外した。この結果、メチル化レベルが約5%以上の精度で判定される〜600CpGのマーカーがもたらされた。
腫瘍及び相当する遠くの部位のサンプルを、外科的腫瘍切除を受ける患者から得て、使用するまでサンプルを−80℃で冷凍保存した。サンプルからのDNAとRNAの分離を、製造業者の推奨に従いAllPrep DNA/RNA Miniキット(Qiagen,Valencia,CA)を使用して実行し、RNAをオンカラムのDNase消化にさらした。Nanodrop 2000(Thermo Scientific)を使用してRNAを定量化した。製造業者の指示に従いiScript cDNA合成キット(Bio−rad,Inc)を使用して、各サンプルの200ngのRNAをcDNA合成のために使用した。7500 Real Time PCRシステム(Applied Biosystems)の上で遺伝子特異的なプライマー(表9及び12)とPower SYBR Green PCR Master Mixを使用して、標準40サイクルの増幅プロトコルによりqPCRを実行した。実験を三通りに行い、内因的なACTBレベルに標準化した。発現における相対的な倍率変化を、ΔΔCT方法(サイクル閾値<30))を使用して計算した。3つの複製に基づいてデータを平均±s.dとして示す。
ヒト結腸直腸癌株DLD−1をATCCから得た。この細胞株をトランスフェクトして、GFP、又は所望のGFP融合構成物、及び純度で分類されるFACSを安定して発現させた。10%のFBS、1%のペニシリン−ストレプトマイシン、及び1%の非必須アミノ酸で補われたDMEMにおいて、細胞を維持した。
上述の培養条件下で増殖した細胞をトリプシン処理し、自動細胞計数器を使用して計数した。500の細胞を、6−ウェルプレートの各ウェルに蒔き、コロニーの形成を可能にした。7−10日後、細胞を10%のv/v酢酸/メタノールに固定し、0.1%のクリスタルバイオレットで染色した。三重のウェルから計数するマニュアルにより、コロニーの数を判定した。
1%のノーブル寒天(Gifco)を、42℃で20%のFBS、2%のPen−Strep、及び2%の非必須アミノ酸により、各細胞株についてそれぞれ2Xの培地において0.5%に希釈した。0.5%の寒天培養培地の混合物1.5mLを、6−ウェル皿の各ウェルに播種し、45分間室温で冷却した。上述の培養条件下で増殖された細胞をトリプシン処理し、自動細胞計数器を使用して計数し、2X培地において4000の細胞/mLに希釈した。0.6%のノーブル寒天を、0.3%の終末濃度になるまで、42℃で等量の希釈された細胞と混合した。1.5mLを、下の寒天層の上にある各ウェルに播種し、45分間室温で冷却した。プレートを37℃で増殖させ、100μLの培地を週に2回加えた。3週間後、コロニーを10%のv/v酢酸/メタノールで固定し、0.005%のクリスタルバイオレットで染色した。各細胞株の構築物について三重のウェルから計数するマニュアルにより、コロニーの数を判定した。
制度上及び国際的な動物の規則に従い、全ての動物研究を行った。Sun Yat−Sen University及びWest China HospitalのInstitutional Animal Care and Use Committeeにより、動物プロトコルは承認された。メスの無胸腺BALB/cヌードマウス(4−5週齢、18−20g)を、供給業者(Guangdong Province Laboratory Animal Center, Guangzhou, China)から購入した。腫瘍細胞を100μlの無血清培地において懸濁し、マウスに皮下注射した。腫瘍の増殖を3日ごとに診察によりモニタリングした。キャリパーを使用して腫瘍の大きさを測定し、腫瘍容積を以下の方程式に従って計算した:腫瘍容積(mm3)=(長さ(mm)×幅(mm)2)×0.5。3−4週後に、全ての動物を屠殺し、異種移植片を採取した。典型的なデータを、1つの実験群当たり5匹のマウスから得た。一元の繰返し測定ANOVAにより統計分析を行った。
<承認>
The Cancer Genome Atlas(TCGA)のデータを、TCGAのウェブサイトからダウンロードした。このプロジェクトは、Guangzhou Women and Children Center, west China hospitalのIRBにより承認された。インフォームドコンセントを全患者から得た。患者がインフォームドコンセントに署名した後、腫瘍と正常組織を得た。
臨床的特徴と分子プロファイリングは、232のAML 161 ALL及び647の正常な血液サンプルを含む研究コホートに関するメチル化データを含む。研究コホートにおける患者の臨床的特徴を表13に列挙する。
初期のトレーニングセット及び第1の試験セットからのDNAメチル化データを、The Cancer Genome Atlas(TCGA)から得た。Infinium 450Kのメチル化アレイを使用して、470,000の部位のメチル化状況を生成した。中国人癌患者の第2のコホートのDNAメチル化データを、重亜硫酸塩配列決定方法を使用して得た。
主成分分析を、統計環境における関数:prcomp()を使用して、各比較群における上位10のマーカーに適用し、各群の第1の主成分における加重値を抽出し、各群において10の対応するマーカーと一致させた。マーカーを持つ加重値の45の群が存在する。これらのマーカーを使用して、ニューラルネットワーク、ロジスティック回帰、最近傍(NN)及びサポートベクターマシン(SVM)を含む様々なアルゴリズムによりサンプルを分類し、その全ては一貫した結果を生成した。SVMを使用する分析は、最も確固としていることが分かり、それ故、全ての後の分析に使用された。
上述の機械学習方法を使用して、ALL、AML、及び正常な血液サンプルを分類した。ロジスティック回帰、最近傍(NN)、及びサポートベクタマシン(SVM)を含む、本明細書で使用される様々な分類アルゴリズムがある。その全てが、一貫した結果を生成した。全ての後の分析に、SVMを用いる分析を更に使用した。
1.不正確な組織;
2.偽陰性;例えば、ALLは正常な血液として識別される。
3.偽陽性;例えば、正常な血液はALL又はAMLとして識別される。
4.正確な組織、不正確な白血病のタイプ;例えば、ALLはAMLとして識別される。
新しく凍結した健全な又は癌の組織の片からのゲノムDNA抽出を、製造業者の推奨に従いQIAamp DNA Mini Kit(Qiagen)により行った。およそ0.5mgの組織を使用し、平均5μgのゲノムDNAを得た。DNAを−20℃で保存し、調製の1週間以内に分析した。
製造業者のプロトコルに従いEZ DNA Methylation−Lightning(商標)キット(Zymo Research)を使用し、1μgのゲノムDNAをビス−DNAに変換した。結果として生じるビス−DNAは、〜200−3000bpの粒度分布を有しており、ピークは約〜500−1000bpであった。ビス−DNAの深い配列決定、及び、CH(非CG)ジヌクレオチドのT変換に対するCの比率の分析によって確認されるように、重亜硫酸塩変換の効率は、>99.8%であった。
癌組織と正常組織との比較の何れかにおいてメチル化レベルが異なったCpGマーカーを使用して、配列決定のためのパッドロックプローブを設計した。パッドロック捕捉とビス−DNAの配列決定は、修飾によりG. Church and colleagues (Porreca GJ, Nat Methods. 2007 Nov; 4 (11):931−6.)及びK. Zhang and colleagues (Diep, D Nat Methods. 2012 Feb 5;9(3):270−2, Deng, J. et al. Nat. Biotechnol. 27, 353−360 (2009))によって開発された技術に基づく。
パッドロックプローブを、ppDesignerソフトウェアを使用して設計した。捕捉した領域の平均長は70bpであり、CpGマーカーは捕捉した領域の中心部に位置する。CpGマーカーの未知のメチル化状況により導入されたバイアスを妨げるために、CGジヌクレオチドを欠いた配列内に捕捉アームを排他的に位置付けた。アーム間のリンカー配列は、等しい長さのプローブを生成するために、Csの可変的な伸展により分離された増幅プライマーのための結合配列を含んでいた。プローブの平均長は91bpであった。プローブは、6−bpの固有の分子識別子(UMI)配列を組み込み、個々の分子捕捉事象の識別と、DNAメチル化レベルの正確なスコア付けを可能にした。
20ngの重亜硫酸塩に変換されたDNAを、1X Ampligase緩衝液(Epicentre)を含む20μlの反応物において、定められたモル比のパッドロックプローブと混合した。DNAに対するプローブの最適なモル比は、20,000:1であると実験的に判定した。蒸発を妨げるために、反応物を50μlの鉱油で覆いかぶせた。DNAに対してプローブをアニールするために、95℃で30秒の変性の後、毎秒0.02℃の割合で55℃にゆっくりと冷却した。ハイブリダイゼーションを、55℃で15時間にわたり放置することで完了させた。アニールされたアーム間の間隙を満たすために、以下の5μlの混合物を各反応物に加えた:2UのPfuTurboCxポリメラーゼ(95℃で3分間予め活性化したC(Agilent))、0.5UのAmpligase(Epicentre)、及び1X Ampligase緩衝液中の250pmolの各dNTP。55℃で5時間のインキュベーションの後、反応物を94℃で2分間変性させて、氷の上で即座に冷却した。5μlのエキソヌクレアーゼ混合物(20UのExoI及び100UのExoIII、共にEpicentre由来)を加え、一本鎖DNA分解を37℃で2時間行い、その後、94℃で2分間酵素不活性化を行った。
本来のパイロット捕捉実験の深い配列決定は、最も効果的なプローブと非効果的なプローブにより捕捉された読み取りの数の間の有意差を示した(>0.2の平均の範囲を持つ捕捉領域の60−65%)。これを改善するために、相対的な効率を配列決定データから計算し、プローブを調整されたモル比で混合した。これにより捕捉均一性を、>0.2の平均範囲で領域の85%に増大させた。
幾つかの修飾によりソフトウェアツールを使用して、配列決定の読み取りのマッピングを行った。初めに、各配列決定の読み取りからUMIを抽出し、添付して、D.D.により豊富に提供されるカスタムスクリプトを用いてFASTQファイル内のヘッダーを読み取った。Bowtie2を使用して、あたかもCが全てメチル化されておらず、ヒトゲノムのインシリコで変換されたDNA鎖にマッピングされたかのように、また、あたかもCが全てメチル化されないかのように、読み取りを飛行中に変換した。本来の読み取りを単一のUMIのために統合且つフィルタ処理し、即ち、同じUMIを運ぶ読み取りを廃棄して、1つの読み取りを残した。パッドロックプローブが設計される全てのCpGマーカーのために、メチル化頻度を抽出した。任意のサンプルにおける20未満の読み取りを持つマーカーを分析から除外した。この結果、メチル化レベルが5%以上の精度で判定される〜600CpGのマーカーがもたらされた。
白血病のタイプに特異的なシグネチャーを識別するために、ALL又はAMLと、正常な血液サンプルとの間の全ゲノムのメチル化差異を、ペアワイズの様式で比較した。最も大きなメチル化差異を持つCpGマーカーをランク付けした。これら50の上位ランクのCpG部位を、AML対正常な血液サンプルにおいて教師無し様式で示した(図24)。AMLを正常な血液サンプルから分化させた(図24、表14A)。研究成果を、中国人AMLコホートにおいて更に繰り返した(図25と表14C)。同様に、ALLを正常な血液サンプルから分化させた(図26、表14B)。総合すると、これらのデータは、CpG部位の差動的メチル化が、特異性及び感受性により特定の白血病のタイプを正常な血液と区別することができたことを実証した(表14)。総合感受性は約98%であり、特異性は約97%であった。全体として、これらの結果は、白血病の特定のタイプの存在を識別する際に、これらメチル化パターンの堅固な性質を実証する。
この方法は、白血病の特定のタイプと正常な血液サンプルとを区別する能力を有しており、それ故、ALL及びAMLに関して骨髄から生じる白血病癌の異なるタイプ(ALL及びAML)を区別するアルゴリズムの能力を調査した(表14C)。各腫瘍の亜型を、90%より上の感受性と特異性により区別した(図27)。共に、これらの結果は、組織学的な亜型の正確な癌診断のためにメチル化パターンを使用する効果を実証する。
主成分分析(PCA)を使用して各白血病の亜型(AMLとALL)を分析し、生存(具体的に診断から5年での生存vs死亡)を予測したメチル化シグネチャーを識別した。
<無細胞DNAサンプルのプロセス>
血漿サンプルを4℃で5分間、1500gで遠心分離して、細胞残屑を除去した。遠心分離後、製造業者のプロトコルに従いQIAamp Blood DNA Mini Kit(Qiagent)を使用して、リンパ球の無いDNA(cfDNA)を上清から抽出した。
新しく凍結した健全な又は癌の組織の片からのゲノムDNA抽出を、製造業者の推奨に従いQIAamp DNA Mini Kit(Qiagen)により行った。およそ0.5mgの組織を使用し、平均5μgのゲノムDNAを得た。DNAを−20℃で保存し、調製の1週間以内に分析した。
製造業者の推奨(Bio−Rad)に従いQX200(商標)液滴デジタルPCRシステムを使用して、液滴デジタルPCR(ddPCR)を実行した。ddPCRを、Bio−Radの推奨された2工程の熱循環プロトコルにより実行した。プライマー及びプローブの配列を表17−18に示す。約1ngから約20ngのビス−DNAサンプルを、約0.4−0.8μMのフォワード及びリバースプライマー、及び約0.2μMの各プローブとの反応それぞれのために使用した。QuantaSoft(Bio−Rad)を使用してデータ分析を行った。
結腸癌組織と正常な結腸組織サンプル(Farsite)の両方で4つの典型的なCpG部位(cg06747543、cg15536663、cg22129276、およびcg07418387)のメチル化比率を、図29に示す。各バーは平均24のサンプルを表わす。CpG部位cg14519356と共に、これらの4つのCpG部位を、肺に転移した結腸癌組織サンプルにおいて更に分析した。図30は、転移性結腸癌組織サンプル、原発性結腸癌標準サンプル、及び正常リンパ球ゲノムDNA標準サンプルにおける、これらの5つのCpG部位のメチル化比率を示す。cg15536663とcg14519356のメチル化比率は、それぞれの原発性結腸癌標準サンプルに対する転移性結腸癌サンプル間の比較において同様である。しかし、cg06747543、cg22129276、及びcg07418387のメチル化比率は、それぞれの原発性結腸癌標準サンプルに対する転移性結腸癌サンプル間の比較において異なる。同様に、これら5つのCpG部位のメチル化比率はまた、それぞれの正常リンパ球ゲノムDNA標準サンプルに対する転移性結腸癌サンプル間の比較においても異なる。5つのCpG部位のメチル化比率は、転移性結腸癌、原発性結腸癌、及び正常リンパ球のサンプルの間の異なるメチル化パターンを示す。
血漿サンプルを実施例7に記載されるように処理した。図46は、2つの異なる結腸癌プローブ(Cob−2とCob−9)を使用して、2つの例示的なCpG部位(CpG部位1とCpG部位2)のメチル化プロファイルの変化を例証する。図47は、外科手術後の4人の患者のサンプル(患者2045021、2044629、2044645、及び2045021)における結腸癌プローブCob−2とCob−9に関するメチル化プロファイルの変化を例証する。4人の患者のサンプルのメチル化プロファイルは、正常なcfDNAサンプルのメチル化プロファイルと比較した場合、cob−2プローブを使用して別個のプロファイルを示す。cob−9プローブについて、メチル化プロファイルは、4人の患者サンプルと正常なcfDNAサンプルとの間で類似したままである。
血漿サンプルを実施例7に記載されるように処理した。図48は、様々な癌の段階のサンプルにおける結腸癌プローブcob−2とcob−9についてのメチル化プロファイルの変化を例証する。
血漿サンプルを実施例7に記載されるように処理した。図49A−図49Jは、19の様々な癌種と正常な血液サンプルについての10の例示のCpG部位(cg02874908、cg08098128、cg10542975、cg11252953、cg11334870、cg13911392、cg23130731、cg23612220、cg25432518、及びcg25922751)のメチル化プロファイルの変化を例証する。癌種は膀胱癌、乳癌、子宮頚部癌、胆管細胞癌(CHOL)、結腸癌、食道癌、頭頚部癌、腎癌、肝臓癌、肺癌、膵癌、褐色細胞腫と傍神経節腫(PCPG)、前立腺癌、直腸癌、肉腫、皮膚癌、胃癌、及び甲状腺癌を含んでいる。
表15と16は、本明細書に記載される方法、システム、非一時的なコンピュータ可読媒体、又はキットの1つ以上と共に使用されるCpG部位を示す。
Claims (56)
- 個体における癌の存在を判定する方法であって、
該方法は、
(a)脱アミノされたヌクレオチドを含む処置されたゲノムDNAを生成するために、抽出されたゲノムDNAを脱アミノ化剤で処理する工程であって、抽出されたゲノムDNAが個体からの生体サンプルから得られる、工程、
(b)処置されたゲノムDNAからの表20から選択された1つ以上のバイオマーカーを含むメチル化プロファイルを生成する工程、および、
(c)メチル化プロファイルを対照と比較する工程であって、メチル化プロファイルと対照との間の相関が個体における癌の存在を判定する、工程、を含む、方法。 - メチル化プロファイルは、表15−18から選択された1つ以上のバイオマーカーをさらに含む、請求項1に記載の方法。
- メチル化プロファイルは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択された1つ以上のバイオマーカーをさらに含む、請求項1または2に記載の方法。
- 比較する工程は、
(i)第1の正常なサンプルのメチル化プロファイルと処置されたゲノムDNAのメチル化プロファイルとの間の第1の差;
(ii)第2の正常なサンプルのメチル化プロファイルと第3の正常なサンプルのメチル化プロファイルとの間の第2の差;および、
(iii)第1の原発性癌サンプルのメチル化プロファイルと第2の原発性癌サンプルのメチル化プロファイルとの間の第3の差、
を含むペアワイズのメチル化差異データセットを生成する工程をさらに含む、請求項1に記載の方法。 - 比較する工程は、メチル化プロファイルを生成するために機械学習法により対照を用いてペアワイズのメチル化差異データセットを分析する工程をさらに含む、請求項1または4に記載の方法。
- 比較する工程は、個体の癌種を判定する工程をさらに含む、請求項1、4、または5のいずれか1つに記載の方法。
- 機械学習法は、主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデルの1つ以上から選択されたアルゴリズムを利用する、請求項1−6のいずれか1つに記載の方法。
- 生成する工程は、プローブを用いて1つ以上のバイオマーカーの各々を交配させ、および、1つ以上のバイオマーカーの各々のメチル化を定量化するためにDNA配列決定反応を行う工程をさらに含む、請求項1−7のいずれか1つに記載の方法。
- 癌種は固形癌タイプまたは血液系悪性癌種である、請求項1−8のいずれか1つに記載の方法。
- 癌種は転移癌種、または再発性あるいは難治性癌種である、請求項1−9のいずれか1つに記載の方法。
- 癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍 びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸腺癌(READ)などの直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む、請求項1−10のいずれか1つに記載の方法。
- 生体サンプルは循環腫瘍DNAサンプルまたは組織サンプルを含む、請求項1−11のいずれか1つに記載の方法。
- 癌を抱える個体の治療を選択する方法であって、該方法は、(a)請求項1−12の方法に従って個体の癌種を識別する工程と、(b)工程(a)に基づいて、癌種に適した治療を選択する工程とを含む、方法。
- 癌CpGメチル化プロファイルデータベースの生成のためにCpG癌メチル化データを利用するためのコンピューティングプラットフォームであって、
前記コンピューティングプラットフォームは、
(a)プロセッサ、メモリモジュール、オペレーティングシステム、および、生体サンプルのセットからCpGメチル化データを生成するためのデータ収集アプリケーションを作成するためにプロセッサによって実行可能な命令を含むコンピュータプログラムを含む第1のコンピューティングデバイスを含み、
データ収集アプリケーションが、
(1)生体サンプルのセットからCpGメチル化データを生成するために配列決定装置を作動させるように構成された配列決定モジュールであって、前記セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、配列決定モジュールと、
(2)データ受信モジュールとを含み、
該データ受信モジュールが、
(i)第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットであって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、第1のペアのCpGメチル化データセット;
(ii)第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットであって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、第2のペアのCpGメチル化データセット;および、
(iii)第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットであって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、第3のペアのCpGメチル化データセット、を受け取るように構成され、
前記コンピューティングプラットフォームは、
(b)プロセッサ、メモリモジュール、オペレーティングシステム、および癌CpGメチル化プロファイルデータベースを生成するためのデータ分析アプリケーションを作成するためにプロセッサによって実行可能な命令を含むコンピュータプログラムを含む第2のコンピューティングデバイスを含み、
データ分析モジュールを含むデータ分析アプリケーションが、
(1)第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットからペアワイズのメチル化差異データセットを生成するように、および、
(2)癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析するように、構成され、
(i)機械学習法は、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、
(ii)癌CpGメチル化プロファイルデータベースはCpGメチル化プロファイルのセットを含み、CpGメチル化プロファイルはそれぞれ癌種を表す、コンピューティングプラットフォーム。 - ペアワイズのメチル化差異データセットを生成することは、
(a)第1のペアのデータセット内の第1のデータセットと第2のデータセットとの間の差を算出すること、
(b)第2のペアのデータセット内の第3のデータセットと第4のデータセットとの間の差を算出すること、および
(c)第3のペアのデータセット内の第5のデータセットと第6のデータセットとの間の差を算出すること、を含む、請求項14に記載のコンピューティングプラットフォーム。 - 機械学習法は、主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデルの1つ以上から選択されたアルゴリズムを利用する、請求項14または15に記載のコンピューティングプラットフォーム。
- CpGメチル化データは、脱アミノ化剤で処置された抽出されたゲノムDNAから生成される、請求項14−16に記載のコンピューティングプラットフォーム。
- 配列決定装置は、CpGメチル化データを生成するために次世代配列決定方法によって抽出されたゲノムDNAを分析するようにさらに構成される、請求項14−17のいずれか1つに記載のコンピューティングプラットフォーム。
- 次世代配列決定方法は、デジタルPCR配列決定方法である、請求項18に記載のコンピューティングプラットフォーム。
- メチル化プロファイルは、表15−18からなる群から選択された、少なくとも10、20、30、40、50、100、200、またはそれ以上のバイオマーカーを含む、請求項14−19のいずれか1つに記載の方法。
- メチル化プロファイルは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される少なくとも10、20、30、40、50、100、または200以上のバイオマーカーを含む、請求項14−20のいずれか1つに記載のコンピューティングプラットフォーム。
- メチル化プロファイルは、表20から選択された、少なくとも1、2、3、4、5、10、20、30、40、50、100またはそれ以上のバイオマーカーを含む、請求項14−21のいずれか1つに記載のコンピューティングプラットフォーム。
- 癌種は固形癌タイプまたは血液系悪性癌種である、請求項14−22のいずれか1つに記載のコンピューティングプラットフォーム。
- 癌種は転移癌種、または再発性あるいは難治性癌種である、請求項14−23のいずれか1つに記載のコンピューティングプラットフォーム。
- 癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍 びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む、請求項14−24のいずれか1つに記載のコンピューティングプラットフォーム。
- 対照データセットはメチル化プロファイルのセットを含み、各々の前記メチル化プロファイルは、知られている癌種から得られた生体サンプルから生成される、請求項14−25のいずれか1つに記載のコンピューティングプラットフォーム。
- 生体サンプルは循環腫瘍DNAサンプルまたは組織サンプルを含む、請求項14−26のいずれか1つに記載のコンピューティングプラットフォーム。
- 癌CpGメチル化プロファイルデータベースを生成するためのコンピューターにより実施される方法であって、
前記方法は、
a.配列決定方法によって生体サンプルのセットからCpGメチル化データを生成する工程であって、セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
b.第1のプロセッサを用いて、第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットを取得する工程であって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、工程と、
c.第1のコンピューティングデバイスを用いて、第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットを取得する工程であって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
d.第1のコンピューティングデバイスを用いて、第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットを取得する工程であって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、工程と、
e.第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットから、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成する工程と、
f.癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する工程を含み、
(1)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、および、
(2)癌CpGメチル化プロファイルデータベースは、CpGメチル化プロファイルのセットを含み、各CpGメチル化プロファイルは癌種を表す、コンピューターにより実施される方法。 - 工程e)はさらに、
(a)第1のペアのデータセット内の第1のデータセットと第2のデータセットとの間の差を算出すること、
(b)第2のペアのデータセット内の第3のデータセットと第4のデータセットとの間の差を算出すること、および
(c)第3のペアのデータセット内の第5のデータセットと第6のデータセットとの間の差を算出すること、を含む、請求項28に記載のコンピューターにより実施される方法。 - 機械学習法は、主成分分析、ロジスティック回帰分析、最近傍分析、サポートベクターマシン、およびニューラルネットワークモデルの1つ以上から選択されたアルゴリズムを利用する、請求項28または29に記載のコンピューターにより実施される方法。
- CpGメチル化データは、脱アミノ化剤で処置された抽出されたゲノムDNAから生成される、請求項28−30のいずれか1つに記載のコンピューターにより実施される方法。
- メチル化プロファイルは、表15−18からなる群から選択された、少なくとも10、20、30、40、50、100、200、またはそれ以上のバイオマーカーを含む、請求項28−31のいずれか1つに記載のコンピューターにより実施される方法。
- メチル化プロファイルは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される少なくとも10、20、30、40、50、100、または200以上のバイオマーカーを含む、請求項28−32のいずれか1つに記載のコンピューターにより実施される方法。
- メチル化プロファイルは、表20から選択された、少なくとも1、2、3、4、5、10、20、30、40、50、100またはそれ以上のバイオマーカーを含む、請求項28−33のいずれか1つに記載のコンピューターにより実施される方法。
- 癌種は固形癌タイプまたは血液系悪性癌種である、請求項28−34のいずれか1つに記載のコンピューターにより実施される方法。
- 癌種は再発性または難治性の癌種である、請求項28−35のいずれか1つに記載のコンピューターにより実施される方法。
- 癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍 びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む、請求項28−36のいずれか1つに記載のコンピューターにより実施される方法。
- 生体サンプルは循環腫瘍DNAサンプルまたは組織サンプルを含む、請求項28−37のいずれか1つに記載のコンピューターにより実施される方法。
- 複数のプローブを含むプローブパネルであって、各プローブは式Iのプローブであり、
Aは第1の標的結合領域であり、
Bは第2の標的結合領域であり、および、
Lはリンカー領域であり、
Aは、SEQ ID NOs:1−1775から選択された配列の5’末端から位置1で始まる少なくとも30の連続的なヌクレオチドに対して少なくとも70%、80%、90%、95%、または99%の配列同一性を有し、
Bは、SEQ ID NOs:1−1775から選択された同じ配列の3’末端から位置1’で始まる少なくとも12の連続的なヌクレオチドに対して少なくとも70%、80%、90%、95%、または99%の配列同一性を有し、
LはAに結合し、および、
BはAまたはLのいずれかに結合する、プローブパネル。 - LはAに結合し、BはLに結合する、請求項39に記載のプローブパネル。
- 複数のプローブは少なくとも10、20、30、50、または100以上のプローブを含む、請求項39または40に記載のプローブパネル。
- 複数のプローブは、CpGメチル化データを生成するために溶液ベースの次世代の配列決定反応に使用される、請求項39−41のいずれか1つに記載のプローブパネル。
- 溶液ベースの次世代の配列決定反応は、小滴デジタルPCR配列決定方法である、請求項42に記載のプローブパネル。
- Lは10−60、15−55、20−50、25−45、ならびに30−40のヌクレオチド長さである、請求項39−43のいずれか1つに記載のプローブパネル。
- Lはさらに各プローブを識別するためのアダプター領域を含む、請求項39−44のいずれか1つに記載のプローブパネル。
- 命令が保存される非一時的なコンピューター可読媒体であって、
前記非一時的なコンピューター可読媒体は、プロセッサによって実行されるとき:
a.配列決定方法によって生体サンプルのセットからCpGメチル化データを生成する工程であって、セットが第1の癌の生体サンプル、第2の癌の生体サンプル、第3の癌の生体サンプル、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルを含み、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なり、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
b.第1のプロセッサを用いて、第1の癌の生体サンプルと第1の正常な生体サンプルから生成された第1のペアのCpGメチル化データセットを取得する工程であって、第1の癌の生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第1のデータセットを形成し、第1の正常な生体サンプルから生成されたCpGメチル化データが第1のペアのデータセット内の第2のデータセットを形成し、第1の癌の生体サンプルと第1の正常な生体サンプルが同じ生体サンプル源に由来する、工程と、
c.第1のコンピューティングデバイスを用いて、第2の正常な生体サンプルと第3の正常な生体サンプルから生成された第2のペアのCpGメチル化データセットを取得する工程であって、第2の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第3のデータセットを形成し、第3の正常な生体サンプルから生成されたCpGメチル化データが第2のペアのデータセット内の第4のデータセットを形成し、第1の正常な生体サンプル、第2の正常な生体サンプル、および第3の正常な生体サンプルが異なる、工程と、
d.第1のコンピューティングデバイスを用いて、第2の癌の生体サンプルと第3の癌の生体サンプルから生成された第3のペアのCpGメチル化データセットを取得する工程であって、第2の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第5のデータセットを形成し、第3の癌の生体サンプルから生成されたCpGメチル化データが第3のペアのデータセット内の第6のデータセットを形成し、第1の癌の生体サンプル、第2の癌の生体サンプル、および第3の癌の生体サンプルが異なる、工程と、
e.第1のペアのデータセット、第2のペアのデータセット、および第3のペアのデータセットから、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成する工程と、
f.癌CpGメチル化プロファイルデータベースを生成するために機械学習法によって対照データセットを用いてペアワイズのメチル化差異データセットを分析する工程であって、
(1)機械学習法が、トップスコアに基づいて複数のマーカーと複数の加重値を識別し、複数のマーカーと複数の加重値に基づいてサンプルを分類する工程を含み、および、
(2)癌CpGメチル化プロファイルデータベースは、CpGメチル化プロファイルのセットを含み、各CpGメチル化プロファイルは癌種を表す、工程、
含む工程を行う、非一時的なコンピューター可読媒体。 - 工程e)はさらに、
a.第1のペアのデータセット内の第1のデータセットと第2のデータセットとの間の差を算出すること、
b.第2のペアのデータセット内の第3のデータセットと第4のデータセットとの間の差を算出すること、および
c.第3のペアのデータセット内の第5のデータセットと第6のデータセットとの間の差を算出すること、を含む、請求項46に記載の非一時的なコンピューター可読媒体。 - 工程e)は、第1のペアのデータセットの算出された差から、第2のペアのデータセットの算出された差から、および第3のペアのデータセットの算出された差から、第2のプロセッサを用いて、ペアワイズのメチル化差異データセットを生成することをさらに含む、請求項46または47に記載の非一時的なコンピューター可読媒体。
- CpGメチル化データは、脱アミノ化剤で処置された抽出されたゲノムDNAから生成される、請求項46−48のいずれか1つに記載の非一時的なコンピューター可読媒体。
- メチル化プロファイルは、表15−18からなる群から選択された、少なくとも10、20、30、40、50、100、200、またはそれ以上のバイオマーカーを含む、請求項46−49のいずれか1つに記載の非一時的なコンピューター可読媒体。
- メチル化プロファイルは、cg20468939、cg24790419、cg26836479、cg16911583、cg15139596、cg16927606、cg12967050、cg21122474、cg06064964、cg11779113、cg12042264、cg27377213、cg26680502、cg12504877、cg21913888、cg26683005、cg24166457、cg27141915、cg17122157、cg09844573、cg03087897、cg24706505、cg17126555、cg13911392、cg18901104、cg25982880、cg15797834、cg27125093、cg17518965、cg20695297、cg04858553、cg09419005、cg25490145、cg11252953、cg18456621、cg07058988、cg17864646、cg06153925、cg27410601、cg03297901、cg06853339、cg12900649、cg27219182、cg15759721、cg27023597、cg02782634、cg18942579、cg01409343、cg10530767、cg26112797、cg00253248、cg01722297、cg22589778、cg07137244、cg04147906、cg23878564、cg07860918、cg00206490、cg07644807、cg00558804、cg05304979、cg27598656、cg03549146、cg22190721、cg01660934、cg02358862、cg23093496、cg07641284、cg01681367、cg26769927、cg08480068、cg02914427、cg03653601、cg01990910、cg00933696、cg09866569、cg20357538、cg22460896、cg07116712、cg10186131、cg06380123、cg18610205、cg12353452、cg10590292、cg00037681、cg05596756、cg03569637、cg02522196、cg11655490、cg19693177、cg26363363、cg21249754、cg23147227、cg01657186、cg23764129、cg04514998、cg07332880、cg16061668、cg25574765、cg14088196、cg03758697、cg05398700、cg14058476、cg18158859、cg19300307、cg18842353、cg10732611、cg24480810、cg02053964、cg25922751、cg25954028、cg14642045、cg24165921、cg18215449、cg16402452、cg21376733、cg16509569、cg08075204、cg14556909、cg07119472、cg14999168、cg09399878、cg02874908、cg10542975、cg15698795、cg11791526、cg00862408、cg16260696、cg00220455、cg20826709、cg11436362、cg13924996、cg07420137、cg24301930、cg13395086、cg20136100、cg09153080、cg09902130、cg07380416、cg27284288、cg13912307、cg10511890、cg00242035、cg04314978、cg25225070、cg20411756、cg24247537、cg04330884、cg23130731、cg04888360、cg00907272、cg05979232、cg00025044、cg04441857、cg09684112、cg27388962、cg05931497、cg13408086、cg13555415、cg22552736、cg16191087、cg13925432、cg13464240、cg14633252、cg19252956、cg00015530、cg08632810、cg12737392、cg26769700、cg03218479、cg02609337、cg10351284、cg23554164、cg19021985、cg21031128、cg19421584、cg17984956、cg05177060、cg24107852、cg25652701、cg00282244、cg18887230、cg08486903、cg09335715、cg12629796、cg16454130、cg26433975、cg10673833、cg06787669、cg12192582、cg05098343、cg07573366、cg11105292、cg05287480、cg16748008、cg16644023、cg06488150、cg09450197、cg20336172、cg08858130、cg12098228、cg26811313、cg25432518、cg16622899、cg12359001、cg01209642、cg14564351、cg23429794、cg26401541、cg20046343、cg20847580、cg03431741、cg07417146、cg09001226、cg06482498、cg03891050、cg00899907、cg13597051、cg18113826、cg04859102、cg01620360、cg14083015、cg15046123、cg03190513、cg01456691、cg17207512、cg20510285、cg01149192、cg05614346、cg06439655、cg11334870、cg08912922、cg23021796、cg24835948、cg10393744、cg07428959、cg17694130、cg03956042、cg19266387、cg13512830、cg19982684、cg22513455、cg07186032、cg08052292、cg27366280、cg06825448、cg25451702、cg08098128、cg13821008、cg27405400、cg09366118、cg15341833、cg02233149、cg14247287、cg23824762、cg01604601、cg05656900、cg08132573、cg24686918、cg05352688、cg18384097、cg16266227、cg19675731、cg21461981、cg25765104、cg26394055、cg20685713、cg23589035、cg01903374、cg23612220、cg26315985、cg18856478、cg23229016、cg21004490、cg24742520、cg23013029、cg19704755、cg07589991、cg10055231、およびcg26017930から選択される少なくとも10、20、30、40、50、100、または200以上のバイオマーカーを含む、請求項46−50のいずれか1つに記載の非一時的なコンピューター可読媒体。
- メチル化プロファイルは、表20から選択された、少なくとも1、2、3、4、5、10、20、30、40、50、100またはそれ以上のバイオマーカーを含む、請求項46−51のいずれか1つに記載の非一時的なコンピューター可読媒体。
- 癌種は固形癌タイプまたは血液系悪性癌種である、請求項46−52のいずれか1つに記載の非一時的なコンピューター可読媒体。
- 癌種は再発性または難治性の癌種である、請求項46−53のいずれか1つに記載の非一時的なコンピューター可読媒体。
- 癌種は、急性骨髄性白血病(LAMLまたはAML)、急性リンパ芽球性白血病(ALL)、副腎皮質癌(ACC)、膀胱の尿路上皮癌(BLCA)、脳幹神経膠腫、脳の軽度の神経膠腫(LGG)、脳腫瘍、乳癌(BRCA)、気管支腫瘍、バーキットリンパ腫、未知の原発部位の癌、カルチノイド腫瘍、未知の原発部位の癌腫、中枢神経系の非定型奇形腫/ラブドイド腫瘍、中枢神経系胚芽腫、子宮頚部の扁平上皮癌、子宮頚内膜の腺癌(CESC)癌、小児癌、胆管細胞癌(CHOL)、脊索腫、慢性リンパ性白血病、慢性骨髄性白血病、慢性骨髄増殖症候群、結腸(腺癌)癌(COAD)、結腸直腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、膵内分泌部膵島腫瘍、子宮内膜癌、上衣芽腫、脳室上衣細胞腫、食道癌(ESCA)、感覚神経芽腫、ユーイング肉腫、頭蓋外胚細胞性腫瘍、性腺外胚細胞性腫瘍、肝臓外胆管癌、胆嚢癌、胃癌、消化管カルチノイド腫瘍、消化管間質腫瘍、胃腸間質性腫瘍(GIST)、栄養膜腫瘍、多形神経膠芽腫(GBM、ヘアリーセル白血病、頭頚部癌(HNSD)、心臓癌、ホジキンリンパ腫、下咽頭癌、眼球内黒色腫、膵島腫瘍、カポジ肉腫、腎癌、ランゲルハンス細胞組織球症、喉頭癌、口唇癌、肝臓癌、リンパ系腫瘍 びまん性大細胞型B細胞リンパ腫(DLBCL)、悪性線維性組織球腫骨癌、髄芽腫、髄上皮腫、黒色腫、メルケル細胞癌、メルケル細胞皮膚癌、中皮腫(MESO)、原発不明の転移性の扁平上皮頚部癌、口腔癌、多発性内分泌腺腫瘍症候群、多発性骨髄腫、多発性骨髄腫/形質細胞腫瘍、菌状息肉腫、骨髄異形成症候群、骨髄増殖性疾患、鼻腔癌、上咽頭癌、神経芽腫、非ホジキンリンパ腫、非黒色腫皮膚癌、非小細胞肺癌、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、他の脳と脊髄の腫瘍、卵巣癌、卵巣上皮癌、卵巣胚細胞性腫瘍、低悪性度卵巣腫瘍、膵癌、乳頭腫、副鼻腔癌、副甲状腺癌、骨盤癌、陰茎癌、咽頭癌、褐色細胞腫および傍神経節腫(PCPG)、中間分化型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍/多発性骨髄腫、胸膜肺芽細胞腫、原発性の中枢神経系(CNS)リンパ腫、原発性の肝細胞性肝臓癌、前立腺腺癌(PRAD)などの前立腺癌、直腸癌、腎癌、腎細胞(腎臓)癌、腎細胞癌、気道癌、網膜芽細胞腫、横紋筋肉腫、唾液腺癌、肉腫(SARC)、セザリー症候群、皮膚黒色腫(SKCM)、小細胞肺癌、小腸癌、軟部組織肉腫、扁平上皮癌、扁平頚部癌、胃癌、テント上原始神経外胚葉性腫瘍、T細胞性リンパ腫、精巣癌、精巣胚細胞腫瘍(TGCT)、咽喉癌、胸腺癌、胸腺腫(THYM)、甲状腺癌(THCA)、移行上皮癌、腎盂および尿管移行上皮癌、絨毛性腫瘍、尿管癌、尿道癌、子宮癌、子宮癌、ブドウ膜黒色腫(UVM)、膣癌、外陰癌、ワルデンシュトレームマクログロブリン血症、またはウィルムス腫瘍を含む、請求項46−54のいずれか1つに記載の非一時的なコンピューター可読媒体。
- 生体サンプルは循環腫瘍DNAサンプルまたは組織サンプルを含む、請求項46−55のいずれか1つに記載の非一時的なコンピューター可読媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022024038A JP2022078120A (ja) | 2015-01-18 | 2022-02-18 | 癌の状態を判定する方法とシステム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562104785P | 2015-01-18 | 2015-01-18 | |
US62/104,785 | 2015-01-18 | ||
US14/986,520 | 2015-12-31 | ||
US14/986,520 US9984201B2 (en) | 2015-01-18 | 2015-12-31 | Method and system for determining cancer status |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017556781A Division JP2018508228A (ja) | 2015-01-18 | 2016-01-15 | 癌の状態を判定する方法とシステム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022024038A Division JP2022078120A (ja) | 2015-01-18 | 2022-02-18 | 癌の状態を判定する方法とシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021003108A true JP2021003108A (ja) | 2021-01-14 |
Family
ID=56406499
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017556781A Pending JP2018508228A (ja) | 2015-01-18 | 2016-01-15 | 癌の状態を判定する方法とシステム |
JP2020128392A Pending JP2021003108A (ja) | 2015-01-18 | 2020-07-29 | 癌の状態を判定する方法とシステム |
JP2022024038A Pending JP2022078120A (ja) | 2015-01-18 | 2022-02-18 | 癌の状態を判定する方法とシステム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017556781A Pending JP2018508228A (ja) | 2015-01-18 | 2016-01-15 | 癌の状態を判定する方法とシステム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022024038A Pending JP2022078120A (ja) | 2015-01-18 | 2022-02-18 | 癌の状態を判定する方法とシステム |
Country Status (14)
Country | Link |
---|---|
US (2) | US9984201B2 (ja) |
EP (1) | EP3245604B1 (ja) |
JP (3) | JP2018508228A (ja) |
KR (1) | KR20170120595A (ja) |
CN (2) | CN113724786A (ja) |
AU (1) | AU2016206505B2 (ja) |
CA (1) | CA2974097A1 (ja) |
EA (1) | EA036566B1 (ja) |
HK (1) | HK1248285A1 (ja) |
IL (1) | IL253546A0 (ja) |
MX (1) | MX2017009351A (ja) |
SG (2) | SG11201705878VA (ja) |
TW (2) | TW202011416A (ja) |
WO (1) | WO2016115530A1 (ja) |
Families Citing this family (102)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11060149B2 (en) | 2014-06-18 | 2021-07-13 | Clear Gene, Inc. | Methods, compositions, and devices for rapid analysis of biological markers |
DK3543356T3 (da) | 2014-07-18 | 2021-10-11 | Univ Hong Kong Chinese | Analyse af methyleringsmønster af væv i DNA-blanding |
US9984201B2 (en) | 2015-01-18 | 2018-05-29 | Youhealth Biotech, Limited | Method and system for determining cancer status |
AU2016369603A1 (en) | 2015-12-18 | 2018-07-05 | Clear Gene, Inc. | Methods, compositions, kits and devices for rapid analysis of biological markers |
US11499196B2 (en) | 2016-06-07 | 2022-11-15 | The Regents Of The University Of California | Cell-free DNA methylation patterns for disease and condition analysis |
EP3907300A1 (en) | 2016-06-08 | 2021-11-10 | University Of Iowa Research Foundation | Compositions for detecting predisposition to cardiovascular disease |
US20190203303A1 (en) * | 2016-06-29 | 2019-07-04 | Sameer Chopra | Classification of subtypes of kidney tumors using dna methylation |
CN107847515B (zh) * | 2016-07-06 | 2021-01-29 | 优美佳生物技术有限公司 | 实体瘤甲基化标志物及其用途 |
US10093986B2 (en) | 2016-07-06 | 2018-10-09 | Youhealth Biotech, Limited | Leukemia methylation markers and uses thereof |
EP3535422A2 (en) * | 2016-11-07 | 2019-09-11 | Grail, Inc. | Methods of identifying somatic mutational signatures for early cancer detection |
KR20230062684A (ko) | 2016-11-30 | 2023-05-09 | 더 차이니즈 유니버시티 오브 홍콩 | 소변 및 기타 샘플에서의 무세포 dna의 분석 |
CA3046007A1 (en) | 2016-12-22 | 2018-06-28 | Guardant Health, Inc. | Methods and systems for analyzing nucleic acid molecules |
CN106544341A (zh) * | 2017-01-17 | 2017-03-29 | 上海亿康医学检验所有限公司 | 高效检测样本中的ctDNA的方法 |
BR112019018272A2 (pt) * | 2017-03-02 | 2020-07-28 | Youhealth Oncotech, Limited | marcadores metilação para diagnosticar hepatocelular carcinoma e câncer |
CA3060555A1 (en) | 2017-04-19 | 2018-10-25 | Singlera Genomics, Inc. | Compositions and methods for library construction and sequence analysis |
US20200048697A1 (en) * | 2017-04-19 | 2020-02-13 | Singlera Genomics, Inc. | Compositions and methods for detection of genomic variance and DNA methylation status |
EP3622091A4 (en) * | 2017-05-12 | 2021-02-17 | President and Fellows of Harvard College | UNIVERSAL EARLY CANCER DIAGNOSIS |
EP3635138B1 (en) * | 2017-05-15 | 2024-07-03 | Katholieke Universiteit Leuven | Method for analysing cell-free nucleic acids |
WO2019010564A1 (en) * | 2017-07-12 | 2019-01-17 | University Health Network | DETECTION AND CLASSIFICATION OF CANCER USING METHYLOME ANALYSIS |
WO2019055829A1 (en) | 2017-09-15 | 2019-03-21 | Nazarian Javad | METHODS OF DETECTION OF CANCER BIOMARKERS |
US11851711B2 (en) * | 2017-09-29 | 2023-12-26 | Arizona Board Of Regents On Behalf Of The University Of Arizona | DNA methylation biomarkers for cancer diagnosing |
WO2019071161A1 (en) * | 2017-10-06 | 2019-04-11 | Youhealth Biotech, Limited | METHYLATION MARKERS FOR THE DIAGNOSIS OF CANCER |
US10748040B2 (en) * | 2017-11-20 | 2020-08-18 | Kavya Venkata Kota Sai KOPPARAPU | System and method for automatic assessment of cancer |
US11961589B2 (en) | 2017-11-28 | 2024-04-16 | Grail, Llc | Models for targeted sequencing |
WO2019157214A2 (en) * | 2018-02-07 | 2019-08-15 | Ai Technologies Inc. | Deep learning-based diagnosis and referral of diseases and disorders |
TWI834642B (zh) * | 2018-03-13 | 2024-03-11 | 美商格瑞爾有限責任公司 | 異常片段偵測及分類 |
CA3094717A1 (en) | 2018-04-02 | 2019-10-10 | Grail, Inc. | Methylation markers and targeted methylation probe panels |
WO2019200404A2 (en) * | 2018-04-13 | 2019-10-17 | Grail, Inc. | Multi-assay prediction model for cancer detection |
EP3802830A4 (en) * | 2018-05-31 | 2022-03-09 | The Regents of the University of California, A California Corporation | DNA METHYLATION-BASED BIOMARKERS OF IRRITABLE BOWEL SYNDROME AND IRRITABLE BOWEL DISEASE |
EP3801623A4 (en) * | 2018-06-01 | 2022-03-23 | Grail, LLC | NEURAL CONVOLUTIONAL NETWORK SYSTEMS AND DATA CLASSIFICATION METHODS |
CN108866192B (zh) * | 2018-07-26 | 2021-06-22 | 上海奕谱生物科技有限公司 | 基于甲基化修饰的肿瘤标记物stamp-ep1 |
CN110791563B (zh) * | 2018-08-01 | 2024-02-09 | 立森印迹诊断技术(无锡)有限公司 | 一种用于检测甲状腺肿瘤良恶性程度的分级模型及其应用 |
CN109022556A (zh) * | 2018-08-29 | 2018-12-18 | 天津智鱼生物科技有限公司 | 一种dna甲基化程度的定量方法及应用 |
CA3110455A1 (en) * | 2018-09-04 | 2020-03-12 | 3M Innovative Properties Company | Visualization of social determinants of health |
CN113286881A (zh) | 2018-09-27 | 2021-08-20 | 格里尔公司 | 甲基化标记和标靶甲基化探针板 |
TWI687937B (zh) * | 2018-10-05 | 2020-03-11 | 中國醫藥大學附設醫院 | 染色體異常檢測模型之建立方法、染色體異常檢測系統及染色體異常檢測方法 |
CN109182526A (zh) * | 2018-10-10 | 2019-01-11 | 杭州翱锐生物科技有限公司 | 用于早期肝癌辅助诊断的试剂盒及其检测方法 |
WO2020102043A1 (en) * | 2018-11-15 | 2020-05-22 | Ampel Biosolutions, Llc | Machine learning disease prediction and treatment prioritization |
GB201819452D0 (en) * | 2018-11-29 | 2019-01-16 | Ucl Business Plc | Differential methylation |
CA3119328A1 (en) * | 2018-12-19 | 2020-06-25 | Grail, Inc. | Cancer tissue source of origin prediction with multi-tier analysis of small variants in cell-free dna samples |
WO2020132544A1 (en) * | 2018-12-21 | 2020-06-25 | Grail, Inc. | Anomalous fragment detection and classification |
KR102211240B1 (ko) * | 2018-12-28 | 2021-02-01 | 아주대학교산학협력단 | 허혈성 심장질환에 대한 보조 의사 시스템에 의해 수행되는 허혈성 심장질환 진단 방법 |
CN113728115A (zh) * | 2019-01-25 | 2021-11-30 | 格里尔公司 | 侦测癌症、癌症来源组织及/或癌症细胞类型 |
CA3127894A1 (en) * | 2019-02-05 | 2020-08-13 | Grail, Inc. | Detecting cancer, cancer tissue of origin, and/or a cancer cell type |
KR102068310B1 (ko) * | 2019-02-28 | 2020-01-20 | 주식회사 레피다인 | 간암 재발 예측용 dna 메틸화 마커 및 이의 용도 |
CN113498436A (zh) * | 2019-03-01 | 2021-10-12 | 国立大学法人佐賀大学 | 成人t细胞白血病/淋巴瘤的检测方法 |
CN114026644A (zh) * | 2019-03-28 | 2022-02-08 | 相位基因组学公司 | 通过测序进行核型分析的系统和方法 |
US11773450B2 (en) | 2019-04-03 | 2023-10-03 | Grail, Llc | Methylation-based false positive duplicate marking reduction |
CN110157804A (zh) * | 2019-04-04 | 2019-08-23 | 广州优泽生物技术有限公司 | 用于肺癌诊断、疗效预测或预后的甲基化位点、检测引物及试剂盒 |
US12009061B2 (en) | 2019-04-10 | 2024-06-11 | University of Pittsburgh—of the Commonwealth System of Higher Education | Computational filtering of methylated sequence data for predictive modeling |
CN110163102A (zh) * | 2019-04-18 | 2019-08-23 | 麦克奥迪(厦门)医疗诊断系统有限公司 | 一种基于卷积神经网络的宫颈细胞图像分类识别方法 |
AU2020263307B2 (en) * | 2019-04-22 | 2024-02-29 | Behavioral Diagnostics, Llc | Compositions and methods for correcting for cellular admixture in epigenetic analyses |
US20220218847A1 (en) * | 2019-04-23 | 2022-07-14 | The Broad Institute, Inc. | Compositions and methods characterizing metastasis |
JP2022532892A (ja) * | 2019-05-13 | 2022-07-20 | グレイル, インコーポレイテッド | モデルベースの特徴量化および分類 |
EP3830285A4 (en) * | 2019-05-31 | 2022-04-27 | Freenome Holdings, Inc. | METHODS AND SYSTEMS FOR HIGH DEPTH METHYLATED NUCLEIC ACID SEQUENCING |
CN111204867B (zh) * | 2019-06-24 | 2021-12-10 | 北京工业大学 | 膜生物反应器-mbr膜污染智能决策方法 |
TWI765262B (zh) * | 2019-06-26 | 2022-05-21 | 長佳智能股份有限公司 | 根據仿真分離重疊染色體之分離模型的訓練方法及利用該分離模型分離重疊染色體的方法及系統 |
US20220290245A1 (en) * | 2019-09-11 | 2022-09-15 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Servic | Cancer detection and classification |
US11891653B2 (en) | 2019-09-30 | 2024-02-06 | Guardant Health, Inc. | Compositions and methods for analyzing cell-free DNA in methylation partitioning assays |
US11795495B1 (en) * | 2019-10-02 | 2023-10-24 | FOXO Labs Inc. | Machine learned epigenetic status estimator |
WO2021096932A1 (en) * | 2019-11-13 | 2021-05-20 | Memorial Sloan Kettering Cancer Center | Classifier models to predict tissue of origin from targeted tumor dna sequencing |
CN110867254A (zh) * | 2019-11-18 | 2020-03-06 | 北京市商汤科技开发有限公司 | 预测方法及装置、电子设备和存储介质 |
AU2021213150A1 (en) | 2020-01-30 | 2022-08-04 | Prognomiq Inc | Lung biomarkers and methods of use thereof |
JP2023512698A (ja) * | 2020-02-06 | 2023-03-28 | オンコホスト リミテッド | 治療法応答の機械学習予測 |
US11211147B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Estimation of circulating tumor fraction using off-target reads of targeted-panel sequencing |
US11211144B2 (en) | 2020-02-18 | 2021-12-28 | Tempus Labs, Inc. | Methods and systems for refining copy number variation in a liquid biopsy assay |
US11475981B2 (en) | 2020-02-18 | 2022-10-18 | Tempus Labs, Inc. | Methods and systems for dynamic variant thresholding in a liquid biopsy assay |
CN112662765A (zh) * | 2020-03-17 | 2021-04-16 | 博尔诚(北京)科技有限公司 | 一种检测6种中国高发癌症的探针组合物 |
JP2023524627A (ja) * | 2020-03-31 | 2023-06-13 | フリーノム ホールディングス,インク. | 核酸のメチル化分析による結腸直腸癌を検出するための方法およびシステム |
CN111334572B (zh) * | 2020-04-26 | 2020-10-27 | 江苏大学附属医院 | Ctsz基因甲基化的新用途 |
WO2021226110A1 (en) * | 2020-05-05 | 2021-11-11 | The Board Of Trustees Of The Leland Stanford Junior University | Cell-free dna biomarkers and their use in diagnosis, monitoring response to therapy, and selection of therapy for prostate cancer |
WO2021227950A1 (zh) * | 2020-05-09 | 2021-11-18 | 广州燃石医学检验所有限公司 | 癌症预后方法 |
CN112391466A (zh) * | 2020-05-19 | 2021-02-23 | 广州市基准医疗有限责任公司 | 用于检测乳腺癌的甲基化生物标记物或其组合和应用 |
CN111863138B (zh) * | 2020-05-26 | 2024-07-30 | 浙江大学 | 人子宫组织细胞组成分析模型及其建立方法和应用 |
US11255762B1 (en) * | 2020-08-11 | 2022-02-22 | Specialty Diagnostic (SDI) Laboratories, Inc. | Method and system for classifying sample data for robotically extracted samples |
KR102461582B1 (ko) * | 2020-08-11 | 2022-10-31 | 한림대학교 산학협력단 | 인공지능을 활용하여 검진 정보에 대응하는 진단 정보를 제공하기 위한 컴퓨터 프로그램 |
JP2023539128A (ja) * | 2020-08-19 | 2023-09-13 | マヨ ファウンデーション フォア メディカル エデュケーション アンド リサーチ | 非ホジキンリンパ腫の検出 |
EP4208570A1 (en) * | 2020-09-04 | 2023-07-12 | Cardio Diagnostics, Inc. | Methods and compositions for predicting and/or monitoring cardiovascular disease and treatments therefor |
WO2022061080A1 (en) * | 2020-09-17 | 2022-03-24 | The Regents Of The University Of Colorado, A Body Corporate | Signatures in cell-free dna to detect disease, track treatment response, and inform treatment decisions |
EP4244353A1 (en) | 2020-11-13 | 2023-09-20 | Triplebar Bio, Inc. | Multiparametric discovery and optimization platform |
KR102507489B1 (ko) * | 2020-12-24 | 2023-03-08 | 가톨릭대학교 산학협력단 | 진단 분류 장치 및 방법 |
CN113095376A (zh) * | 2021-03-24 | 2021-07-09 | 四川大学 | 一种基于深度学习的口腔上皮异常增生判别与分级设备及系统 |
CN117858954A (zh) * | 2021-04-21 | 2024-04-09 | 赫利奥健康公司 | 细胞异质性调整的克隆甲基化(chalm):甲基化定量方法 |
CN113376199A (zh) * | 2021-05-12 | 2021-09-10 | 兰立生物科技(苏州)有限公司 | 一种用于癌症检测的生化分析检测系统 |
US20240229158A1 (en) | 2021-05-21 | 2024-07-11 | Ophiomics - Investigação E Desenvolvimento Em Biotecnologia | Dna methylation biomarkers for hepatocellular carcinoma |
US20240339216A1 (en) * | 2021-07-14 | 2024-10-10 | The Regents Of The University Of California | Mycobiome in cancer |
US20240321421A1 (en) * | 2021-07-23 | 2024-09-26 | Kaohsiung Medical University | Clinical therapeutic drug prediction and recommendation system and method for evaluating efficacy of second-generation hormone drug in treatment of prostate cancer |
US11908560B2 (en) | 2021-08-11 | 2024-02-20 | OncoHost Ltd. | Cancer process evaluation |
AU2022339065A1 (en) | 2021-09-06 | 2024-03-14 | Christian-Albrechts-Universität Zu Kiel | Method for the diagnosis and/or classification of a disease in a subject |
JP2024534992A (ja) | 2021-09-13 | 2024-09-26 | プログノミック インコーポレイテッド | 生体分子の増強された検出および定量 |
JPWO2023063049A1 (ja) * | 2021-10-15 | 2023-04-20 | ||
CN114003752B (zh) * | 2021-11-24 | 2022-11-15 | 重庆邮电大学 | 基于粒球人脸聚类图像质量评估的数据库精简方法及系统 |
KR20230085834A (ko) | 2021-12-07 | 2023-06-14 | 한양대학교 에리카산학협력단 | 필터와 다중 진입점 구조를 이용한 캐싱 방법 및 장치 |
CN114657247B (zh) * | 2022-02-28 | 2022-12-02 | 北京莱盟君泰国际医疗技术开发有限公司 | 用于早期肝癌检测的dna甲基化生物标记物或组合及其应用 |
US12073920B2 (en) * | 2022-07-18 | 2024-08-27 | Grail, Llc | Dynamically selecting sequencing subregions for cancer classification |
WO2024025831A1 (en) * | 2022-07-25 | 2024-02-01 | Grail, Llc | Sample contamination detection of contaminated fragments with cpg-snp contamination markers |
WO2024137041A2 (en) * | 2022-10-28 | 2024-06-27 | Cedars-Sinai Medical Center | Methods and systems of multi-omic approach for molecular profiling of tumors |
CN115627541B (zh) * | 2022-12-01 | 2023-03-28 | 中国医学科学院肿瘤医院 | 从微量DNA建立cfDNA库的方法、系统和应用 |
PL444001A1 (pl) * | 2023-03-07 | 2024-09-09 | Pomorski Uniwersytet Medyczny W Szczecinie | Sposób realizowany komputerowo i powiązane produkty programów komputerowych do określania wieku biologicznego oraz przewidywania stanu zdrowia osobnika z wykorzystaniem informacji o modyfikacjach epigenetycznych |
PL443998A1 (pl) * | 2023-03-07 | 2024-09-09 | Pomorski Uniwersytet Medyczny W Szczecinie | Sposoby, systemy i powiązane produkty programów komputerowych do rozróżniania typu próbki biologicznej z organizmu z wykorzystaniem informacji o modyfikacjach epigenetycznych |
PL444000A1 (pl) * | 2023-03-07 | 2024-09-09 | Pomorski Uniwersytet Medyczny W Szczecinie | Sposób leczenia i diagnozowania nowotworu z wykorzystaniem informacji o modyfikacjach epigenetycznych |
PL443999A1 (pl) * | 2023-03-07 | 2024-09-09 | Pomorski Uniwersytet Medyczny W Szczecinie | Sposób realizowany komputerowo i platforma obliczeniowa do charakteryzowania badanej próbki od osobnika z wykorzystaniem informacji o zmianie epigenetycznej |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018508228A (ja) * | 2015-01-18 | 2018-03-29 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 癌の状態を判定する方法とシステム |
Family Cites Families (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US5525462A (en) | 1991-05-02 | 1996-06-11 | Toyo Boseki Kabushiki Kaisha | Nucleic acid sequence amplification method, detection method, and reagent kit therefor |
US6033854A (en) | 1991-12-16 | 2000-03-07 | Biotronics Corporation | Quantitative PCR using blocking oligonucleotides |
WO1995006137A1 (en) | 1993-08-27 | 1995-03-02 | Australian Red Cross Society | Detection of genes |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
GB9517955D0 (en) | 1995-07-25 | 1995-11-08 | Univ Strathclyde | Nucleotide sequence detection and analysis |
US5985557A (en) | 1996-01-24 | 1999-11-16 | Third Wave Technologies, Inc. | Invasive cleavage of nucleic acids |
US6852487B1 (en) | 1996-02-09 | 2005-02-08 | Cornell Research Foundation, Inc. | Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays |
CA2255774C (en) | 1996-05-29 | 2008-03-18 | Cornell Research Foundation, Inc. | Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions |
US5786146A (en) | 1996-06-03 | 1998-07-28 | The Johns Hopkins University School Of Medicine | Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids |
US6017704A (en) | 1996-06-03 | 2000-01-25 | The Johns Hopkins University School Of Medicine | Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids |
US5858665A (en) | 1996-07-25 | 1999-01-12 | Navix, Inc. | Homogeneous diagnostic assay method utilizing simultaneous target and signal amplification |
CA2268069A1 (en) | 1996-10-04 | 1998-04-09 | Chronix Biomedical | Diagnostic detection of nucleic acids |
JPH10253632A (ja) | 1997-03-10 | 1998-09-25 | Nissui Pharm Co Ltd | 分析方法、キット及び装置 |
US6558901B1 (en) | 1997-05-02 | 2003-05-06 | Biomerieux Vitek | Nucleic acid assays |
US6054276A (en) | 1998-02-23 | 2000-04-25 | Macevicz; Stephen C. | DNA restriction site mapping |
US6780591B2 (en) | 1998-05-01 | 2004-08-24 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
WO1999057321A1 (en) | 1998-05-01 | 1999-11-11 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and dna molecules |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
US7700324B1 (en) | 1998-11-03 | 2010-04-20 | The Johns Hopkins University School Of Medicine | Methylated CpG island amplification (MCA) |
US6331393B1 (en) | 1999-05-14 | 2001-12-18 | University Of Southern California | Process for high-throughput DNA methylation analysis |
US6180349B1 (en) | 1999-05-18 | 2001-01-30 | The Regents Of The University Of California | Quantitative PCR method to enumerate DNA copy number |
US7611869B2 (en) | 2000-02-07 | 2009-11-03 | Illumina, Inc. | Multiplexed methylation detection methods |
DE10130800B4 (de) | 2001-06-22 | 2005-06-23 | Epigenomics Ag | Verfahren zum Nachweis von Cytosin-Methylierung mit hoher Sensitivität |
WO2003064700A2 (en) | 2002-01-30 | 2003-08-07 | Epigenomics Ag | Identification of cell differentiation states based on methylation patterns |
EP2339025B1 (en) | 2002-06-26 | 2013-10-09 | Cold Spring Harbor Laboratory | Methods for determining the methylation profiles |
ATE425265T1 (de) | 2003-07-31 | 2009-03-15 | Sequenom Inc | Verfahren für multiplex- polymerasekettenreaktionen auf hohem niveau und homogenen massenverlängerungsreaktionen zur genotypisierung von polymorphismen |
US20060183128A1 (en) | 2003-08-12 | 2006-08-17 | Epigenomics Ag | Methods and compositions for differentiating tissues for cell types using epigenetic markers |
JP4917891B2 (ja) | 2003-10-21 | 2012-04-18 | オリオン ゲノミクス エルエルシー | 差次的酵素的断片化の方法 |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
CA2548528A1 (en) * | 2003-12-01 | 2005-06-16 | Epigenomics Ag | Methods and nucleic acids for the analysis of gene expression associated with the development of prostate cell proliferative disorders |
US7459274B2 (en) | 2004-03-02 | 2008-12-02 | Orion Genomics Llc | Differential enzymatic fragmentation by whole genome amplification |
JP2005328709A (ja) | 2004-05-18 | 2005-12-02 | Toyobo Co Ltd | 高速dnaポリメラーゼを用いた高速pcr |
EP1812589A2 (en) * | 2004-09-30 | 2007-08-01 | Epigenomics AG | Epigenetic methods and nucleic acids for the detection of lung cell proliferative disorders |
US7643818B2 (en) | 2004-11-22 | 2010-01-05 | Seven Networks, Inc. | E-mail messaging to/from a mobile terminal |
AU2005308918B2 (en) | 2004-11-29 | 2012-09-27 | Sequenom, Inc. | Means and methods for detecting methylated DNA |
US20080261217A1 (en) | 2006-10-17 | 2008-10-23 | Melnikov Anatoliy A | Methylation Profile of Cancer |
GB0700374D0 (en) | 2007-01-09 | 2007-02-14 | Oncomethylome Sciences S A | NDRG family methylation markers |
US20090075262A1 (en) * | 2007-02-02 | 2009-03-19 | Orion Genomics Llc | Gene Methylation In Endometrial Cancer Diagnosis |
US8911937B2 (en) | 2007-07-19 | 2014-12-16 | Brainreader Aps | Method for detecting methylation status by using methylation-independent primers |
WO2009021141A1 (en) | 2007-08-07 | 2009-02-12 | The Johns Hopkins University | Comprehensive high throughput arrays for relative methylation |
EP2053131A1 (en) | 2007-10-19 | 2009-04-29 | Ludwig-Maximilians-Universität München | Method for determining methylation at deoxycytosine residues |
CN101970692B (zh) * | 2008-03-14 | 2017-02-01 | 基因特力株式会社 | 使用肺癌特异性甲基化标记基因检测肺癌的方法 |
WO2012031329A1 (en) | 2010-09-10 | 2012-03-15 | Murdoch Childrens Research Institute | Assay for detection and monitoring of cancer |
WO2012098215A1 (en) | 2011-01-20 | 2012-07-26 | Université Libre de Bruxelles | Epigenetic portraits of human breast cancers |
GB201102014D0 (en) | 2011-02-04 | 2011-03-23 | Ucl Business Plc | Method for predicting risk of developing cancer |
US20140094380A1 (en) | 2011-04-04 | 2014-04-03 | The Board Of Trustees Of The Leland Stanford Junior University | Methylation Biomarkers for Diagnosis of Prostate Cancer |
WO2012149171A1 (en) | 2011-04-27 | 2012-11-01 | The Regents Of The University Of California | Designing padlock probes for targeted genomic sequencing |
CA2845179A1 (en) | 2011-08-31 | 2013-03-07 | Genentech, Inc. | Diagnostic markers |
US8846316B2 (en) | 2012-04-30 | 2014-09-30 | Industrial Technology Research Institute | Biomarker for human liver cancer |
WO2013174432A1 (en) * | 2012-05-24 | 2013-11-28 | Fundació Institut D'investigació Biomèdica De Bellvitge (Idibell) | Method for the identification of the origin of a cancer of unknown primary origin by methylation analysis |
WO2014046199A1 (ja) * | 2012-09-19 | 2014-03-27 | シスメックス株式会社 | 脳腫瘍に関する情報の取得方法、ならびに脳腫瘍に関する情報を取得するためのマーカーおよびキット |
US9732390B2 (en) | 2012-09-20 | 2017-08-15 | The Chinese University Of Hong Kong | Non-invasive determination of methylome of fetus or tumor from plasma |
US20140271455A1 (en) * | 2013-03-14 | 2014-09-18 | City Of Hope | Dna methylation biomarkers for small cell lung cancer |
-
2015
- 2015-12-31 US US14/986,520 patent/US9984201B2/en active Active
-
2016
- 2016-01-15 EP EP16738013.8A patent/EP3245604B1/en active Active
- 2016-01-15 KR KR1020177022935A patent/KR20170120595A/ko not_active Application Discontinuation
- 2016-01-15 AU AU2016206505A patent/AU2016206505B2/en active Active
- 2016-01-15 CN CN202110186616.2A patent/CN113724786A/zh active Pending
- 2016-01-15 CA CA2974097A patent/CA2974097A1/en not_active Abandoned
- 2016-01-15 EA EA201791569A patent/EA036566B1/ru unknown
- 2016-01-15 JP JP2017556781A patent/JP2018508228A/ja active Pending
- 2016-01-15 CN CN201680004125.9A patent/CN108064314B/zh active Active
- 2016-01-15 WO PCT/US2016/013716 patent/WO2016115530A1/en active Application Filing
- 2016-01-15 SG SG11201705878VA patent/SG11201705878VA/en unknown
- 2016-01-15 MX MX2017009351A patent/MX2017009351A/es unknown
- 2016-01-15 SG SG10202010694PA patent/SG10202010694PA/en unknown
- 2016-01-18 TW TW108114775A patent/TW202011416A/zh unknown
- 2016-01-18 TW TW105101456A patent/TW201638815A/zh unknown
-
2017
- 2017-07-18 IL IL253546A patent/IL253546A0/en unknown
-
2018
- 2018-01-08 US US15/865,152 patent/US20180341745A1/en active Pending
- 2018-06-19 HK HK18107857.7A patent/HK1248285A1/zh unknown
-
2020
- 2020-07-29 JP JP2020128392A patent/JP2021003108A/ja active Pending
-
2022
- 2022-02-18 JP JP2022024038A patent/JP2022078120A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018508228A (ja) * | 2015-01-18 | 2018-03-29 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 癌の状態を判定する方法とシステム |
Also Published As
Publication number | Publication date |
---|---|
AU2016206505B2 (en) | 2022-03-10 |
TW201638815A (zh) | 2016-11-01 |
WO2016115530A1 (en) | 2016-07-21 |
CN108064314B (zh) | 2021-03-09 |
US20180341745A1 (en) | 2018-11-29 |
AU2016206505A1 (en) | 2017-08-31 |
JP2018508228A (ja) | 2018-03-29 |
SG10202010694PA (en) | 2020-12-30 |
CN113724786A (zh) | 2021-11-30 |
CN108064314A (zh) | 2018-05-22 |
BR112017015413A2 (pt) | 2018-08-07 |
KR20170120595A (ko) | 2017-10-31 |
HK1248285A1 (zh) | 2018-10-12 |
IL253546A0 (en) | 2017-09-28 |
EP3245604A1 (en) | 2017-11-22 |
MX2017009351A (es) | 2017-10-24 |
JP2022078120A (ja) | 2022-05-24 |
TW202011416A (zh) | 2020-03-16 |
US9984201B2 (en) | 2018-05-29 |
EP3245604B1 (en) | 2022-03-02 |
CA2974097A1 (en) | 2016-07-21 |
EA036566B1 (ru) | 2020-11-24 |
US20160210403A1 (en) | 2016-07-21 |
EA201791569A1 (ru) | 2018-01-31 |
SG11201705878VA (en) | 2017-08-30 |
EP3245604A4 (en) | 2018-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2021003108A (ja) | 癌の状態を判定する方法とシステム | |
US20230348992A1 (en) | Methylation markers for diagnosing hepatocellular carcinoma and lung cancer | |
CN111742062B (zh) | 用于诊断癌症的甲基化标志物 | |
US20200299776A1 (en) | Solid tumor methylation markers and uses thereof | |
US11396678B2 (en) | Breast and ovarian cancer methylation markers and uses thereof | |
US20190300964A1 (en) | Colon cancer methylation markers and uses thereof | |
US10829821B2 (en) | Leukemia methylation markers and uses thereof | |
US20190300965A1 (en) | Liver cancer methylation markers and uses thereof | |
US20240209453A1 (en) | Liver cancer methylation and protein markers and their uses | |
BR112017015413B1 (pt) | Plataforma de computação para utilização de dados de metilação de cpg de câncer, método para a geração de um banco de dados de perfil de metilação de cpg de câncer, método de determinação da presença de câncer em um indivíduo necessitado e método de seleção de uma terapia para um indivíduo que possui um câncer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200828 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210819 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20211119 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220413 |