JP2023528533A - 循環腫瘍核酸分子のマルチモーダル分析 - Google Patents

循環腫瘍核酸分子のマルチモーダル分析 Download PDF

Info

Publication number
JP2023528533A
JP2023528533A JP2022577358A JP2022577358A JP2023528533A JP 2023528533 A JP2023528533 A JP 2023528533A JP 2022577358 A JP2022577358 A JP 2022577358A JP 2022577358 A JP2022577358 A JP 2022577358A JP 2023528533 A JP2023528533 A JP 2023528533A
Authority
JP
Japan
Prior art keywords
cancer
cell
dna
nucleic acid
free
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022577358A
Other languages
English (en)
Inventor
ブラットマン,スコット・ヴィクター
バーゲナー,ジャスティン・マシュー
ディニーズ・デ・カルヴァロ,ダニエル
Original Assignee
ユニバーシティー ヘルス ネットワーク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニバーシティー ヘルス ネットワーク filed Critical ユニバーシティー ヘルス ネットワーク
Publication of JP2023528533A publication Critical patent/JP2023528533A/ja
Priority to JP2024099692A priority Critical patent/JP2024126029A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2522/00Reaction characterised by the use of non-enzymatic proteins
    • C12Q2522/10Nucleic acid binding proteins
    • C12Q2522/101Single or double stranded nucleic acid binding proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2523/00Reactions characterised by treatment of reaction samples
    • C12Q2523/10Characterised by chemical treatment
    • C12Q2523/125Bisulfite(s)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/164Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)

Abstract

態様において、対象のがん細胞からctDNAが存在することを検出する方法であって、(a)対象からセルフリーDNAの試料を得る工程、(b)試料をライブラリ調製に供して、セルフリーメチル化DNAのその後の配列決定を可能にする工程、(c)第1の量のフィラーDNAが試料に添加されていてもよく、フィラーDNAの少なくとも一部がメチル化され、次いで、さらに、試料を変性されていてもよい工程、(d)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNAを捕捉する工程、(e)捕捉されたセルフリーメチル化DNAを配列決定する工程、(f)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用いて、捕捉されたセルフリーメチル化DNAの配列を比較する工程、(g)捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来のセルフリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来のDNAの存在を同定する工程を含み、捕捉する工程、比較する工程または同定する工程の少なくとも1つにおいて、対象のセルフリーメチル化DNAは、断片の長さのメトリックに従って亜集団に限定される、方法が提供される。【選択図】図4

Description

相互参照
本願は、2020年6月19日に出願された米国仮特許出願第63/041,151号の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。
循環腫瘍DNA(ctDNA)は、日常的な臨床的な使用のための非侵襲的な腫瘍特異的バイオマーカーとしての可能性をいっそう実証している。ctDNAは、主に細胞死を経ている腫瘍細胞に由来し、血液を含む様々な体液の循環に放出される。ほとんどのがん患者において、血液由来のセルフリーDNAの大部分は末梢血白血球(PBL)に由来する。したがって、ctDNAの検出および定量には、腫瘍由来の遺伝的およびエピジェネティックな変化の同定が必要である。さらに、観察されたctDNAの画分は、腫瘍の原発部位および疾患の負荷を含むいくつかの因子に応じて、診断時の全セルフリーDNAの0.1%未満~90%の範囲であり得る。ctDNAは、腫瘍の分子状況および疾患の負荷に対する非侵襲的なアクセスをもたらしている。特に、低い存在量のctDNAを有する対象において、高感度でctDNAを検出する方法が、必要である。
参照による組み込み
個々の刊行物、特許、または特許出願が具体的かつ個別に参照により組み込まれることを示しているかのように、それと同程度に、本明細書にて言及されるすべての刊行物、特許、および特許出願は、参照により本明細書に組み込まれる。
態様において、対象のがん細胞からctDNAが存在することを検出する方法であって、
(a)対象からセルフリーDNAの試料を得る工程、
(b)試料をライブラリ調製に供して、セルフリーメチル化DNAのその後の配列決定を可能にする工程、
(c)第1の量のフィラーDNAが試料に添加されていてもよく、フィラーDNAの少なくとも一部がメチル化され、次いで、さらに、試料を変性されていてもよい工程、
(d)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNAを捕捉する工程、
(e)捕捉されたセルフリーメチル化DNAを配列決定する工程、
(f)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用いて、捕捉されたセルフリーメチル化DNAの配列を比較する工程、
(g)捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来のセルフリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来のDNAの存在を同定する工程
を含み、捕捉する工程、比較する工程または同定する工程の少なくとも1つにおいて、対象のセルフリーメチル化DNAは、断片の長さのメトリックに従って亜集団に限定される、方法が提供される。
態様として、本開示は、対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定する方法を提供する。方法は、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルからなる群から選択される少なくとも1つのプロファイルを生成するために対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、および前記対象が前記疾患を有するかまたは疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ナノグラム(ng)/ミリリットル(ml)未満の複数の核酸分子を含む、処理する工程を含む。
いくつかの実施形態では、セルフリー核酸試料は、10ng/ml未満の前記複数の核酸分子を含む。いくつかの実施形態では、セルフリー核酸試料は、5ng/ml未満の前記複数の核酸分子を含む。いくつかの実施形態では、セルフリー核酸試料は、1ng/ml未満の前記複数の核酸分子を含む。いくつかの実施形態では、(a)に供する工程が、(i)、(ii)および(iii)からなる群から選択される少なくとも2つのプロファイルを生成する。いくつかの実施形態では、少なくとも2つのプロファイルは、前記メチル化プロファイルおよび前記断片の長さプロファイルを含む。
いくつかの実施形態では、少なくとも2つのプロファイルは、前記変異プロファイルおよび前記断片の長さプロファイルを含む。いくつかの実施形態では、少なくとも2つのプロファイルは、前記メチル化プロファイルおよび前記変異プロファイルを含む。いくつかの実施形態では、(a)を供する工程が、前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを生成する。
別の態様では、本開示は、対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有するリスクがあるかどうかを判定する方法を提供する。方法は、複数の核酸分子を含む前記セルフリー核酸試料を得る工程、前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リードを生成する工程、前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、および前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを使用する工程を含む。
いくつかの実施形態では、疾患はがんを含む。いくつかの実施形態では、がんが、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍、扁平上皮癌、および頭頸部扁平上皮癌からなる群から選択されるがんからなる群から選択される。いくつかの実施形態では、がんは扁平上皮癌である。いくつかの実施形態では、がんは頭頸部扁平上皮癌である。
いくつかの実施形態では、複数のセルフリー核酸分子は、循環腫瘍核酸分子を含む。いくつかの実施形態では、循環腫瘍核酸は循環腫瘍DNAを含む。いくつかの実施形態では、循環腫瘍核酸は循環腫瘍RNAを含む。いくつかの実施形態では、メチル化プロファイルは、複数の差次的メチル化領域(DMR)を含む。いくつかの実施形態では、複数のDMRはctDNA由来である。いくつかの実施形態では、末梢血白血球に由来する複数のDMRがメチル化プロファイルから除去される。いくつかの実施形態では、複数のDMRが、正常で健常な対象からの対応するゲノム領域と比較して低メチル化レベルを有する少なくとも約56のゲノム領域を含む。いくつかの実施形態では、複数のDMRは、正常で健常な対象からの対応するゲノム領域と比較して、過剰メチル化レベルを有する少なくとも約941のゲノム領域を含む。いくつかの実施形態では、DMRは、少なくとも約300bpのサイズを含む。いくつかの実施形態では、DMRは、少なくとも約100bp~少なくとも約200bpのサイズを含む。いくつかの実施形態では、DMRは、少なくとも約100bp~少なくとも約150bpのサイズを含む。いくつかの実施形態では、DMRが少なくとも8のCpGゲノムアイランドを含む。いくつかの実施形態では、正常で健常な対象は、前記対象と同じリスク因子のセットを含む。
いくつかの実施形態では、変異プロファイルは、ミスセンス変異体、ナンセンス変異体、欠失変異体、挿入変異体、重複変異体、逆位変異体、フレームシフト変異体、または反復伸長変異体を含む。いくつかの実施形態では、複数の末梢血白血球から得られたゲノムDNA試料に存在する任意の変異体であって、前記複数の末梢血白血球が前記対象から得られ、前記変異プロファイルから除去される、変異体。いくつかの実施形態では、クローン造血に由来する任意の変異体が前記変異プロファイルから除去される。いくつかの実施形態では、変異プロファイルが、遺伝子DNMT3A、TET2、またはASXL1の変異体を含まない。いくつかの実施形態では、変異プロファイルは、標準的ながんドライバ遺伝子を含まない。いくつかの実施形態では、変異プロファイルが非標準的がんドライバ遺伝子を含み、前記非標準的遺伝子がGRIN3AまたはMYCである。
いくつかの実施形態では、断片の長さプロファイルは、少なくとも約80bp~170bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む。いくつかの実施形態では、断片の長さプロファイルは、少なくとも約100bp~150bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む。いくつかの実施形態では、循環腫瘍核酸分子が濃縮される。
いくつかの実施形態では、方法は、前記セルフリー核酸試料をフィラーDNA分子と混合してDNA混合物を生じることをさらに含む。いくつかの実施形態では、フィラーDNA分子は、約50bp~800bpの長さを含む。いくつかの実施形態では、フィラーDNA分子は、約100bp~600bpの長さを含む。いくつかの実施形態では、フィラーDNA分子は、少なくとも約5%のメチル化フィラーDNA分子を含む。いくつかの実施形態では、フィラーDNA分子は、少なくとも約20%のメチル化フィラーDNAを含む。いくつかの実施形態では、フィラーDNA分子は、少なくとも約30%のメチル化フィラーDNAを含む。いくつかの実施形態では、フィラーDNA分子は、少なくとも約50%のメチル化フィラーDNAを含む。
いくつかの実施形態では、方法は、前記DNA混合物を、メチル化ヌクレオチドに結合するように構成された結合剤とインキュベートして濃縮試料を生成することをさらに含む。いくつかの実施形態では、結合剤は、メチル-CpG結合ドメインを含むタンパク質を含む。いくつかの実施形態では、タンパク質はMBD2タンパク質である。いくつかの実施形態では、結合剤は抗体を含む。いくつかの実施形態では、抗体は5-MeC抗体である。いくつかの実施形態では、抗体は5-ヒドロキシメチルシトシン抗体である。いくつかの実施形態では、配列決定は亜硫酸水素塩配列決定を含まない。いくつかの実施形態では、セルフリー核酸試料は血液試料を含む。いくつかの実施形態では、血液試料は血漿試料を含む。いくつかの実施形態では、方法は、がん組織の起源を検出することをさらに含む。
いくつかの実施形態では、方法は、前記対象の生存率の予後を含む報告を生成することをさらに含む。いくつかの実施形態では、方法は、前記対象に治療を与えることをさらに含む。いくつかの実施形態では、前記疾患の治療に続いて、方法は、前記治療が有効であるかどうかを示す第2の報告を与えることをさらに含む。
別の態様において、本開示は、対象が状態を有するか、または状態を有するリスクがあるかどうかを判定するための方法であって、前記対象からの試料の少なくとも一部から得たセルフリー核酸分子をアッセイする工程、表5に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工程、および少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、前記表5に列挙されたDMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと比較する工程を含む、方法を提供する。
いくつかの実施形態では、セルフリー核酸分子はctDNAを含む。いくつかの実施形態では、方法は、配列決定分析を実施することを含み、前記配列決定分析がcell-free Methylated DNA ImmunoPrecipitation(cfMeDIP)配列決定を含む。いくつかの実施形態では、検出する工程が、表5に列挙される6つ以上、10以上、15以上、20以上、30以上、40以上、50以上、60以上、70以上、80以上、90以上、または100以上のDMRに含まれる前記核酸分子の少なくとも一部のメチル化レベルを測定することを含む。
別の態様では、本開示は、対象が疾患の治療を受けた後により高い生存率を有するかどうかを判定する方法であって、前記対象からの試料の少なくとも一部からのセルフリー核酸分子をアッセイする工程、表6に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工程、および少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、表6に列挙される前記DMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルに処理することを含む方法を提供する。
いくつかの実施形態では、セルフリー核酸分子はctDNAを含む。いくつかの実施形態では、検出する工程は、複合体メチル化スコア(CMS)を提供することを含む。いくつかの実施形態では、CMSは、表6に列挙されたDMRのβ値の合計を含む。いくつかの実施形態では、より高いCMSは、前記対象の生存率がより低いことを示す。いくつかの実施形態では、CMSは、ctDNAの存在量に依存しない。いくつかの実施形態では、疾患は扁平上皮癌である。いくつかの実施形態では、がんは頭頸部扁平上皮癌である。
別の態様では、本開示は、対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するためのシステムであって、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルのうちの少なくとも1つのプロファイルを生成するために前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、および前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ng/ml未満の前記複数の核酸分子を含む、処理する工程を含むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサを含むシステムを提供する。
別の態様では、本開示は、対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有するリスクがあるかどうかを判定するシステムであって、複数の核酸分子を含む前記セルフリー核酸試料を得る工程、前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リードを生成する工程、前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、および前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを使用する工程を含むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサを含む、システムを提供する。
本発明の好ましい実施形態のこれらおよび他の特徴は、添付の図面を参照する以下の詳細な説明においてより明らかになるであろう。
CAPP-SeqによるctDNAの検出のためのPBLフィルタリングの利用。A)一致した患者の血漿および/またはPBLにおいて同定された候補のSNVの変異対立遺伝子画分。ピアソンの相関を、一致した患者の血漿およびPBLの両方に厳密に見出されるSNVに対して行った。患者の血漿にのみ見られる候補SNVを破線の赤い箱の内部に示す。B)一致した患者の血漿およびPBLの両方において同定された候補SNVの発症。上段のヒストグラムは、患者ごとのSNVの数を示し、右側のヒストグラムは、特定の遺伝子が変異している患者の数を示す。C)PBL関連SNVの除去前後のHNSCC患者のcfDNA(赤色円)およびPBL(青色円)にわたる候補SNVの平均MAF。PBLフィルタリング後に存在しないSNVを有する患者は、ctDNAの偽陽性検出を示す。E)20/32のHNSCC患者において同定された選択されたPBLフィルタリングされたSNVの発症。上のヒストグラムおよび右のヒストグラムは、(B)で前述したようなヒストグラムを示す。F)すべてのHNSCC患者にわたるPBL濾過されたSNVの平均変異対立遺伝子のパーセンテージ。患者ごとの各SNVについて、変異対立遺伝子のパーセンテージを、SNV塩基対の位置と重複するネイティブ配列を含むリードと比較して、目的のSNVを含むリードの画分によって計算した。 CAPP-SeqによるctDNAの検出のためのPBLフィルタリングの利用。B)一致した患者の血漿および/またはPBLにおいて同定された候補のSNVの変異対立遺伝子画分。ピアソンの相関を、一致した患者の血漿およびPBLの両方に厳密に見出されるSNVに対して行った。患者の血漿にのみ見られる候補SNVを破線の赤い箱の内部に示す。C)一致した患者の血漿およびPBLの両方において同定された候補SNVの発症。上段のヒストグラムは、患者ごとのSNVの数を示し、右側のヒストグラムは、特定の遺伝子が変異している患者の数を示す。D)PBL関連SNVの除去前後のHNSCC患者のcfDNA(赤色円)およびPBL(青色円)にわたる候補SNVの平均MAF。PBLフィルタリング後に存在しないSNVを有する患者は、ctDNAの偽陽性検出を示す。E)20/32のHNSCC患者において同定された選択されたPBLフィルタリングされたSNVの発症。上のヒストグラムおよび右のヒストグラムは、(B)で前述したようなヒストグラムを示す。F)すべてのHNSCC患者にわたるPBL濾過されたSNVの平均変異対立遺伝子のパーセンテージ。患者ごとの各SNVについて、変異対立遺伝子のパーセンテージを、SNV塩基対の位置と重複するネイティブ配列を含むリードと比較して、目的のSNVを含むリードの画分によって、計算した。 cfMeDIP-seqによるctDNAの検出のための情報領域の同定。B)FaDuゲノムDNA(gDNA)[1×1×52の比較]、一致しないPBLのgDNA[1×51×52の比較]、および一致するPBLのgDNA[1×1×52の比較]MeDIP-seqプロファイルに対する、患者および健常なドナー由来の8以上のCpGとの300bpの非重複ウィンドウのピアソンの相関(n=52)。C)健常なドナー(右)およびHNSCC(左)のPBL MeDIP-seqプロファイルにおけるインシリコのPBL枯渇のパフォーマンス。絶対的なメチル化スコアを、MeDIP-seqカウントからMeDEStrand(方法)によって計算した。PBL枯渇前の300bpの非重複ウィンドウ(青色)は、8以上のCpGを有する1番染色体から22番染色体までのすべてのウィンドウに対応する(n=702,488)。PBL枯渇後の300bpの非重複ウィンドウ(赤色)は、健常なドナーのPBLにわたる絶対的なメチル化の中央値が<0.1である追加のフィルターを含む(n=99,997)。D)HNSCCおよび健常なドナーのcfMeDIP-seqプロファイルの差次的メチル化分析によるctDNA検出のワークフロー。HNSCC関連cfDNAメチル化を同定するために、CAPP-Seq(すなわち、CAPP-Seq陽性、n=20)による検出可能なSNVを有するHNSCC患者からのcfMeDIP-seqプロファイルを、PBL枯渇ウィンドウ内で健常なドナー(n=20)と比較した。過剰メチル化領域および低メチル化領域は、FDR<10%で健常なドナーと比較して、HNSCCコホートにおいてメチル化がより高いまたはより低い領域として示される。E)CpG部位によって注釈付けされた過剰メチル化領域の順列分析(n=10,000の全順列)。有意な濃縮/枯渇は、0.05未満のp値により観察されたzスコアとして示される。F、TCGA由来の腫瘍特異的メチル化シトシン内の過剰メチル化領域の順列分析(n=合計1000の順列)。有意な濃縮/枯渇は、0.05未満のp値により観察されたzスコアとして示される。 CAPP-SeqプロファイルとcfMeDIP-seqプロファイルとの間のctDNA検出および存在量の一致。A)CAPP-seqによるHNSCC患者にわたる検出されたSNVの断片の長さの中央値。各患者について、各SNVおよび一致する参照対立遺伝子の断片の長さの中央値を測定した。各変異または一致した参照対立遺伝子についての断片の長さの中央値の分布を患者ごとに示す。箱および中心線の端部は、それぞれ上側および下側の四分位および中央値を定義する。単一のSNVを有する場合、色付きの線は、それぞれSNVまたは一致した参照対立遺伝子を含む断片の長さの中央値を示す。B)cfMeDIP-seqによるHNSCC過剰メチル化領域内の断片の長さの分布。健常なドナー由来の断片の長さを分析前にプールし、その後の各箱は個々のHNSCCのcfMeDIP-seqプロファイルを示す。箱および中心線の端部は、それぞれ上側および下側の四分位および中央値を定義する。個々のHNSCC試料は、過剰メチル化領域内のメチル化(RPKM)の平均の増加に基づいて並べられる。破線の青色線は、すべての健常なドナーにわたる断片の長さの中央値を定義する。C)100~220bpの断片による過剰DMR領域の濃縮と比較した、100~150bpの断片による過剰DMR領域の濃縮の比。比率は、解釈を容易にするために増加/減少パーセントに変換した。D)100~220bpの断片による過剰DMR領域の濃縮と比較した、100~150bpの断片による過剰DMR領域の濃縮の比。+の符号は、CAPP-Seqによって検出可能なctDNAを有するHNSCC患者を示す(CAPP-Seq陽性)。E)HNSCCの過剰メチル化領域にわたる対数変換されたRPKMの値による、100bp~150bpに限定されたcfMeDIP-seqプロファイルの教師あり階層的分類。各cfMeDIP-seqプロファイルのRPKMの値を、ユークリッド変換の前にlog2変換し、Wardの方法を使用してクラスター化した。メチル化クラスターは、k=4の閾値で定義された。F)それぞれCAPP-seqおよびcfMeDIP-seq(100~150bpに限定)による、同定されたSNVおよび過剰メチル化領域からの変異対立遺伝子頻度の平均およびRPKMの平均の関係。点は、HNSCCまたは健常なドナーの血漿由来の個々の試料を示す。実線の赤色線および影付きの灰色領域は、それぞれフィッティングされた線形回帰モデルおよび関連する95%信頼区間を示す。G)HNSCCを健常なドナーのcfMeDIP-seqプロファイルと比較する、HNSCCの過剰メチル化領域内のメチル化の値(100~150bpに限定)に基づくAUROC分析。ctDNAの検出は、メチル化の平均が健常なドナーにわたる最大値を超えた場合と定義した。H)メチル化クラスター4と比較した、メチル化クラスター1+2+3内の患者の全生存のカプラン・マイヤー曲線分析。I+J)CAPP-SeqおよびcfMeDIP-seqプロファイルからの断片の長さの中央値(I)と、CAPP-Seqからの断片の長さの中央値と、cfMeDIP-seqプロファイルからの100~150:151~220bpの比(J)との比較。点は、メチル化クラスター1および2内部の個々のHNSCC試料を定義した。実線の赤色線および網掛けの灰色領域は、それぞれフィッティングされた線形回帰モデルおよび95%信頼区間を示す。 cfMeDIP-seqによって検出されるctDNA内の特定のメチル化領域の予後の有用性。A)それぞれCAPP-seqおよびcfMeDIP-seq(100~150bpに限定)による、同定された変異および過剰メチル化領域からの変異対立遺伝子画分の平均およびRPKMの平均の関係。点は、HNSCCまたは健常対照血漿からの個々の試料を示す。実線の赤線:フィッティングされた線形回帰モデル。灰色の境界:95%信頼区間。B)CAPP-SeqおよびcfMeDIP-seqの両方による検出可能なctDNAを有する患者の全生存を示すカプラン・マイヤー解析(過剰DMR内での健常対照を上回るメチル化の平均)C)TCGAによって提示されるHNSCC原発腫瘍にわたる多変量コックス比例ハザード回帰分析による疾患特異的生存に基づく予後領域の同定(n=520)。領域は、前述のように300bpウィンドウとして定義した。ヒトメチル化の450KのデータをTCGAから得て、各領域と重複するプローブIDからのβ値を平均した。予後解析のための候補領域を、固形の隣接する正常組織(n=50)と比較した原発腫瘍(n=520)にわたるメチル化の上昇に基づいて選択した(ウィルコクソン検定、調整されたp値<0.05、log2FC>1)。G~H)特定の300bp領域(箱)のメチル化から特定の転写産物のRNA発現までのスピアマンの相関。絶対的なR値が0.3以上の領域(灰色の破線で示す)を有意な関連性としてラベル付けした。TCGAによって提示されるHNSCC患者の疾患特異的生存についての予後予測であったメチル化領域(n=520)は、赤い輪郭で示されている。RNA発現にさらに関連した予後領域を実線の赤色で示す。RNA発現に関連する予後メチル化領域の例;(G)OSR1、(H)LINC01391を備える。E)それぞれZNF323/ZSCAN1、LINC01391、GATA-AS1、OSR1、およびSTK3/MST2の発現に影響を及ぼす5つの領域にわたる全メチル化に基づくHNSCC-TCGA患者の全生存期間のカプラン・マイヤー曲線。すべての原発腫瘍にわたって(D)で以前に同定された5つの領域の全メチル化の中央値より下(Blw med.青)または上(Abv med.赤)のいずれかであることに基づいて、患者を層別化した。F)CAPP-Seqによる検出可能なctDNAを有するHNSCC血漿コホートについての(E)に記載されるような全生存のカプラン・マイヤー曲線。予後との関連性を有する5つの遺伝子にわたる総メチル化を計算するために、RPKMの値を、生存分析の前に先行して同定されたすべての過剰DMR領域にわたって適宜スケーリングした。 長期モニタリングのためのcfMeDIP-seqによるctDNA検出の臨床的有用性。A)ctDNA動態は、典型的には、治療全体を通して患者にわたって観察される。完全なクリアランスを、診断時の検出されたctDNAから、最初に利用可能な治療中/治療後の時点での検出閾値(すなわち、0.2%)未満のctDNA存在量の減少への変化と定義した。部分クリアランスは、診断時の検出されたctDNAから、最初に利用可能な治療中/治療後の時点で検出閾値を超えるctDNA存在量の減少(90%以上)への変化と定義した。クリアランスなしは、診断時と比較した、治療中/治療後試料におけるctDNA存在量の増加と定義した。lastFU=最後のフォローアップ時の試料採取、RT=放射線療法。B)診断時のctDNA存在量の、HNSCC患者にわたる最初に利用可能な治療中/治療後の時点までの変化(n=30)。赤い線はクリアランスなしの動態を示した患者、灰色の線はクリアランス/部分クリアランスの動態を有する患者を表示する。C、無再発生存のカプラン・マイヤー曲線。クリアランスの動態(すなわち、クリアランスなし対クリアランス/部分クリアランス)に基づいて患者を層別化した。 すべてのまたはctDNAが濃縮された断片に対して行われたcfMeDIP-seq分析の比較。ctDNA濃縮断片は、長さが100~150bpの範囲の断片として定義される。A)すべての断片(左)またはctDNA濃縮断片(右)を含むcfMeDIP-seqプロファイルにおける以前に同定されたHNSCCの過剰DMRのCAPP-Seq対RPKMの平均値によって同定された変異の変異対立遺伝子頻度。B)健常なドナーに対するHNSCCのcfMeDIP-seqプロファイル(CAPP-Seq陽性のみ:赤色、CAPP-Seq陽性および陰性:青色)におけるctDNA検出についての曲線下面積分析(AUROC)。CAPP-Seq陽性患者を用いた交差検証分析の結果も示す(反復=50)。すべての断片(左)またはctDNA濃縮断片(右)を用いたcfMeDIP-seqプロファイルについて分析を示す。C)すべての断片(左)またはctDNA濃縮断片を用いた縦断的cfMeDIP-seqプロファイリングに基づく無再発生存のカプラン・マイヤー分析。患者は、以前に同定された0.2%を超える過剰DMR内のメチル化存在量を実証した場合、治療後のctDNAについて陽性であると分類された。 本明細書で提供される方法を実施するようにプログラムさもなければ構成することができるコンピュータシステムを示す。 HNSCCおよび健常なドナーから単離されたセルフリーDNAの試料の特性。A)血液単離の時点を定義する概略図。B)HNSCC患者ならびに健常なドナー(すなわち、「正常」)についての諸時点にわたる(血漿1mLあたりに対して正規化された)cfDNA収量。 CAPP-SeqセレクタによってカバーされるHNSCC患者ごとのSNVの数の分析であって、HNSCのTCGAコホートにおける364名すべての患者の中で評価されるか(青色の菱形)、または一個抜き交差検証(LOOCV;赤い四角)を使用して評価される分析。 20/32のHNSCC患者において同定されたすべてのPBLフィルタリングされたSNVの発症(図2Eに関連)。 情報領域を同定するための関連性のある図である(図3Bおよび図3Cに関連)。A)n個以上のCpGに基づくゲノムワイド(染色体1~22)300bpの重複しないビンのRPKMの中央値。B)図2Bおよび方法に記載されるようなPBL枯渇ウィンドウ内のHNSCCと健常なドナーのPBLとの間における差次的メチル化分析。低メチル化領域(すなわち、健常なドナーのPBLにおいてメチル化が上昇している領域)を青色で示す。 PBL枯渇ウィンドウ内のHNSCCと健常なドナーのcfDNA試料との間の差次的メチル化分析の結果に関連する図(図2D)。A)DMRは、初期分析に使用した元の300bpの非重複ウィンドウに基づいて定義した。互いに直接隣接するDMRをそれぞれの幅(すなわち、2つの300bpウィンドウは、それぞれ独立して、600bpの長さを有すると定義される)にビニングした。B)低メチル化領域に基づく、図2Eに定義されるCpG特徴の順列分析。 がん特異的な差次的メチル化シトシンの同定に基づくTCGA原発腫瘍の教師あり階層的クラスター化。Cancer_type(列)は、各原発腫瘍またはPBL試料の分類を指し、cancer_DMCs(行)は、各がんタイプについて同定されたがん特異的な差次的メチル化シトシン(PBLは除外される)を指す。 図4と関連性のある図である。A)平均変異対立遺伝子画分と比較した、患者ごとのCAPP-Seqによる同定されたSNVSの断片の長さの中央値。B)過剰DMRのRPKMの平均と比較した、患者ごとのcfMeDIP-seqによる過剰DMRS内の断片の長さの中央値。 CAPP-SeqおよびcfMeDIP-seq一致分析の関連性のある図である(図4E)。A)CAPP-Seq陽性HNSCCのcfDNA試料と健常なドナーとの間の差次的メチル化領域呼び出しの交差検証分析(n=50)から得られた曲線下面積の値。B)CAPP-SeqによるctDNAの検出に基づくHNSCC患者の全生存のカプラン-ミール分析。C)およびD)メチル化クラスターに基づいて層別化されたHNSCC患者の試料のRPKMの平均および変異対立遺伝子画分の平均(図4D)。 潜在的な臨床的有用性の領域の同定(図6に関連)。A)TCGA内のHNSCC原発腫瘍ならびに本発明者らのHNSCCコホートからの血漿由来過剰DMRと重複する市販の液体生検試験で現在使用されている遺伝子のゲノムトラック。矢印を有する下の濃い青色のバーは、特定の遺伝子の転写の方向を示す。赤色のバーは、本発明者らのHNSCCコホートの血漿由来の過剰DMRならびにTCGA由来の原発性腫瘍と重複する300bpのウィンドウの位置を示す。B~D)特定の300bp領域(箱)のメチル化から特定の転写産物のRNA発現までのスピアマンの相関。絶対的なR値が0.3以上の領域(灰色の破線で示す)を有意な関連性としてラベル付けした。TCGAによって提示されるHNSCC患者の疾患特異的生存についての予後予測であったメチル化領域(n=520)は、赤い輪郭で示されている。RNA発現にさらに関連した予後領域を実線の赤色で示す。RNA発現に関連する、予後メチル化領域を含む5つすべての遺伝子について図を作成した。(B)GATA2-AS1、(C)ZNF323、(D)、STK3。 すべてのHNSCC患者についての治療全体にわたる、cfMeDIP-seqによるctDNA存在量の変化を示す、図6Aの拡大図である(n=32)。
以下の説明では、本発明の完全な理解をもたらすために、多数の具体的な詳細が記載される。しかし、本発明は、これらの具体的な詳細がなくとも実施され得ることが理解される。
本開示は、高感度および/または高い特異度で、対象ががんを有する可能性を判定する際のctDNAのマルチモーダル分析のための方法、システムおよびキットを提供する。さらに、本開示は、がんの治療後の微小残存病変(MRD)を検出し、そのようながんの治療が治療上有効であるかどうかを評価するための方法、システムおよびキットを提供する。
治療前にctDNAから特定の分子的特徴を同定することは、予後について知らせることができ、および/または治療に対する予測応答であり得るが、治療後のctDNAの検出は、MRDの同定を促し、再発および/または死亡のリスクが高い患者の同定を補助し得る。安定した感度を成し遂げるために、ほとんどの臨床研究は、少数の領域を調べるctDNA検出方法、一致した腫瘍プロファイリング、および/または高いctDNA存在量の事例を利用している。しかし、低レベルのctDNAを有するか、または患者全体で共通する/既知の異常を欠くがんについては、似た程度の感受性を達成するために、追加の戦略を利用し得る。ゲノムワイドなプロファイリング技術は、極めて多くの領域を網羅することにより、感度を改善するのに役立ち得る。しかし、1%未満の断片の検出を達成するために必要なセルフリーDNAの量および配列決定深度は、法外なコストを要してきた。
高感度のctDNA検出が可能な2つの個別化ゲノムワイドプロファイリング技術が記載されている。1つ目のCAncer Personalized Profiling by deep Sequencing(CAPP-Seq)は、100を超える遺伝子を標的とする広範なハイブリッド捕捉プローブを利用して、対立遺伝子の低頻度変異を同定する。第2の、cell-free Methylated DNA ImmunoPrecipitation sequencing(cfMeDIP-seq)は、抗5-メチルシトシン(抗5mC)抗体を使用することによって、メチル化cfDNA断片を濃縮する。これらのそれぞれの方法による変異または高メチル化事象の同定は、それぞれの利点を有する。適切なエラー抑制ツールが使用され、クローン造血からの変異のいずれかの寄与が考慮されるならば、変異は、それらの不可逆的な性質のためにctDNAをセルフリーDNAの健常な源と区別することができる。DNA高メチル化事象は、潜在的に、がんにおけるより多い数の再発性ゲノム領域に影響を及ぼし、セルフリーDNA分析によって腫瘍の起源を知らせるそれらの能力に寄与する。さらに、がんドライバ遺伝子の近傍での高メチル化事象は、それらの発現に影響を及ぼし、それによって潜在的にがんの挙動を反映し、予後の値を提示し得る。現在までのところ、変異に基づく方法とメチル化に基づく方法との両方の組み合わせを、限局性のがんにおけるctDNAの腫瘍ナイーブでの検出および特性評価の改善に利用した研究はない。
予後の判定、リスク層別化、および疾患の監視のための流体ベースのバイオマーカーの利用は、侵襲的腫瘍サンプリングを必要とせずに治療の決定を導くことによって、患者の転帰を改善し得る。循環腫瘍(ct)DNAは、特に液体生検ツールとして有望であることが示されているが、限局性非転移性がんを有する患者などの疾患の負荷が低い患者では、対の腫瘍プロファイリングが頻繁に必要とされる。本発明者らは、血漿のセルフリーDNA由来の遺伝的およびエピジェネティックな特徴のマルチモーダル解析が、腫瘍ナイーブctDNAプロファイリングの広範な適用を可能にし得ると仮定した。変異およびメチル化に基づくプロファイリングにより、限局性頭頸部がん患者の65%において、ctDNAが同定された。両方のアプローチからの結果は定量的であり、強く相関しており、それらを組み合わせた分析により、腫瘍由来DNA断片の共通の特徴が明らかになった。さらに、ctDNAメチルームは、腫瘍組織学、推定予後バイオマーカー、および治療の応答の動的なパターンを明らかにした。これらの知見は、将来の非侵襲的バイオマーカー発見の取り組みを助け、限局性のがんに対するctDNAの臨床的実施について知らせる。
セルフリーメチル化DNAを捕捉する特定の方法は、本出願人の国際公開第2017/190215号パンフレットおよび国際公開第2019/010564号パンフレットに記載されており、両方とも参照により組み込まれる。
具体的には、本発明者らは、CAPP-SeqおよびcfMeDIP-seqの両方を利用して、限局性頭頸部扁平上皮癌(HNSCC)患者のコホート内で、腫瘍ナイーブctDNA検出を行う。HNSCCは、根治的治療後に頻繁に再発する臨床的に不均一な疾患であり、治療の決定および疾患の管理をより良く知らせるために、ctDNA検出から大きく利益を得ることができる33。本発明者らは、両方の方法を並行して利用すること、ならびに一致したPBLプロファイリングが、高信頼性の腫瘍ナイーブctDNA検出を達成し得ることを実証する。さらに、本発明者らは、組み合わせせた分析が腫瘍由来のDNA断片の共通する分子的な特徴を明らかにすることを示す。最後に、本発明者らは、ctDNAメチルームが腫瘍組織学、推定予後バイオマーカー、および治療反応の動的なパターンを明らかにし、他の疾患の状況での将来のバイオマーカー研究のための青写真を授けることを示す。
態様において、対象のがん細胞からctDNAが存在することを検出する方法であって、
(a)対象からセルフリーDNAの試料を得る工程、
(b)試料をライブラリ調製に供して、セルフリーメチル化DNAのその後の配列決定を可能にする工程、
(c)第1の量のフィラーDNAが試料に添加されていてもよく、フィラーDNAの少なくとも一部がメチル化され、次いで、さらに、試料を変性されていてもよい工程、
(d)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNAを捕捉する工程、
(e)捕捉されたセルフリーメチル化DNAを配列決定する工程、
(f)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用いて、捕捉されたセルフリーメチル化DNAの配列を比較する工程、
(g)捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来のセルフリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来のDNAの存在を同定する工程
を含み、捕捉する工程、比較する工程または同定する工程の少なくとも1つにおいて、対象のセルフリーメチル化DNAは、断片の長さのメトリックに従って亜集団に限定される、方法が提供される。
ポリメラーゼ連鎖反応(PCR)やそれに続くサンガーシーケンシングなどの様々なシーケンシング技術が当業者に公知である。また、ハイスループット配列決定としても知られる次世代配列決定(NGS)技術も利用可能であり、これには様々な配列決定技術が含まれる、Illumina(Solexa)配列決定、Roche 454配列決定、Ion torrent:Proton/PGM配列決定、SOLiD配列決定、ロングリードシーケンシング(Oxford NanoporeおよびPactbio)が含まれる。NGSは、以前に使用されていたサンガー配列決定よりもはるかに迅速かつ安価にDNAおよびRNAの配列決定を可能にする。いくつかの実施形態では、前記配列決定は、ショートリードシーケンシングのために最適化される。
本明細書で使用される場合、「対象」という用語は、動物界の任意のメンバーを指す。したがって、方法および本明細書に記載されるのは、ヒトおよび獣医学疾患ならびに動物モデルの両方に適用可能である。好ましい対象は、「患者」、すなわち、疾患または状態のために治療または医療が必要であるかどうかを判定するために調査されている、または疾患もしくは状態(例えば、がん)のための医療を受けている、生きているヒトである。
本明細書で使用される場合、「ゲノム」という用語は、一般に、例えば、対象の遺伝情報の少なくとも一部または全体であり得る、対象由来のゲノム情報を指す。ゲノムは、DNAまたはRNAのいずれかにコードされ得る。ゲノムは、コード領域(例えば、タンパク質をコードする)ならびに非コード領域を含み得る。ゲノムは、生物においてすべての染色体の配列を一緒に含むことができる。例えば、ヒトゲノムは、通常、合計46本の染色体を有する。これらのすべての配列が一緒になってヒトゲノムを構成し得る。
本明細書で使用される場合、「核酸」という用語は、2つ以上のヌクレオチド、すなわちデオキシリボヌクレオチド(dNTP)もしくはリボヌクレオチド(rNTP)のいずれか、またはそれらの類似体の任意の長さのヌクレオチドのポリマー形態を含むポリヌクレオチドを指す。核酸の非限定的な例としては、デオキシリボ核酸(DNA)、リボ核酸(RNA)、遺伝子または遺伝子断片のコード領域または非コード領域、連鎖解析から定義される遺伝子座、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、短鎖干渉RNA(siRNA)、短鎖ヘアピンRNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換え核酸、分枝核酸、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、核酸プローブおよびプライマーが挙げられる。核酸は、メチル化ヌクレオチドおよびヌクレオチド類似体などの1つまたは複数の修飾ヌクレオチドを含み得る。存在する場合、ヌクレオチド構造に対する修飾は、核酸の構築の前または後に行われ得る。核酸のヌクレオチドの配列は、非ヌクレオチド成分によって中断される場合がある。核酸は、重合後に、例えばレポーター因子とのコンジュゲーションまたは結合によってさらに修飾され得る。「変異体」核酸は、少なくとも1つのヌクレオチドがそれぞれ修飾、例えば欠失、挿入または置換されていることを除いて、その元の核酸と同一のヌクレオチド配列を有するポリヌクレオチドである。変異体は、元の核酸のヌクレオチド配列に対し少なくとも約80%、90%、95%、または99%の同一性のヌクレオチド配列を有し得る。
セルフリーメチル化DNAは、血流を自由に循環するDNAであり、DNAの様々な領域でメチル化されている。試料、例えば血漿試料を採取して、セルフリーメチル化DNAを分析し得る。諸研究が、血液の循環核酸の多くが壊死細胞またはアポトーシス細胞から生じ、アポトーシスからの核酸のレベルの大幅な上昇が、がんなどの疾患で観察されることを明らかにしている。特に、循環DNAががん遺伝子の変異を含む疾患の特徴となる証を有するがんの場合、マイクロサテライト変化、および特定のがんの場合、血漿のウイルスゲノム配列、DNAまたはRNAは、疾患の潜在的なバイオマーカーとしていっそう研究されるようになっている。例えば、全循環DNA中の低レベルの循環腫瘍DNAの定量的アッセイは、臨床的に使用される標準的なバイオマーカーであるがん胎児性抗原と比較して、結腸直腸がんの再発を検出するためのより良好なマーカーとして役立ち得る。循環cfDNAは、循環腫瘍DNA(ctDNA)を含み得る。
本明細書で使用される場合、「ライブラリ調製」は、リスト末端修復、Aテーリング、アダプターライゲーション、またはDNAのその後の配列決定を可能にするためにセルフリーDNAに対して行われる任意の他の調製を含む。
本明細書で使用される場合、「フィラーDNA」は非コードDNAであり得るか、またはアンプリコンからなり得る。
いくつかの実施形態では、断片の長さのメトリックは断片の長さである。いくつかの好ましい実施形態では、対象のセルフリーメチル化DNAは、<170bp、<165bp、<160bp、<155bp、<150bp、<145bp、<140bp、<135bp、<130bp、<125bp、<120bp、<115bp、<110bp、<105bp、または<100bpの長さを有する断片に限定される。他の好ましい実施形態では、対象のセルフリーメチル化DNAは、約100~約150bp、110~140bpまたは120~130bpの長さを有する断片に限定される。
いくつかの実施形態では、断片の長さのメトリックは、対象のセルフリーメチル化DNAの断片の長さの分布である。いくつかの好ましい実施形態では、対象のセルフリーメチル化DNAは、長さに基づいて下位50、45、40、35、30、25、20、15または10パーセンタイル内の断片に限定される。
いくつかの実施形態では、対象のセルフリーメチル化DNAは、差次的メチル化領域(DMR)の断片にさらに限定される。
いくつかの実施形態では、対象のセルフリーメチル化DNAの制限は、捕捉工程の間である。
いくつかの実施形態では、対象のセルフリーメチル化DNAの限定は、比較工程の間である。
いくつかの実施形態では、対象のセルフリーメチル化DNAの制限は、同定工程の間である。
いくつかの実施形態では、比較工程は、統計的分類器を使用した適合に基づく。DNAメチル化データを使用する統計的分類器は、試料をがんのタイプまたはサブタイプなどの特定の疾患状態に割り当てるために使用され得る。がんのタイプまたはサブタイプの分類という目的のために、分類器は、統計的モデル内の1つまたは複数のDNAメチル化変数(すなわち、特徴)からなり、統計的モデルの出力は、異なる疾患状態を区別するための1つまたは複数の閾値を有する。統計的分類器で使用される特定の(1つまたは複数の)特徴および(1つまたは複数の)閾値は、がんのタイプまたはサブタイプの事前の知識から、最も情報がある可能性が高い特徴の事前の知識から、機械学習から、またはこれらのアプローチの2つ以上の組み合わせから導出され得る。
いくつかの実施形態では、分類器は機械学習によって導出される。好ましくは、分類器は、弾性ネット分類器、ラッソ、サポートベクターマシン、ランダムフォレスト、またはニューラルネットワークである。
分析されるゲノム空間は、ゲノムワイドであり得るか、または好ましくは調節領域(すなわち、FANTOM5エンハンサー、CpGアイランド、CpGショア、およびCpG Shelf)に限定され得る。
好ましくは、回収されたスパイクインメチル化DNAのパーセンテージは、プルダウン効率変動を制御するための共変量として含まれる。
複数のがんのタイプ(またはサブタイプ)を互いに区別することができる分類器の場合、分類器は、好ましくは、目的の各タイプ(またはサブタイプ)の対の比較に由来する差次的メチル化領域からなる。
いくつかの実施形態では、健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列は、健常な個体とがんの個体との間の差次的メチル化領域(DMR)のデータベースに含まれる。
いくつかの実施形態では、健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列は、血清、脳脊髄液、尿便、痰、胸水、腹水、涙、汗、パップスメア液、内視鏡ブラシリング液など、好ましくは血漿由来の体液から得たセルフリーDNAに由来するDNAにおいて、健常な個体とがんの個体との間として、差次的にメチル化される対照セルフリーメチル化DNA配列に限定される。
試料
試料は、対象から単離された任意の生物学的試料であり得る。例えば、試料は、限定されないが、体液、全血、血小板、血清、血漿、便、赤血球、白血球、内皮細胞、組織生検物、滑液、リンパ液、腹水液、間質液または細胞外液、細胞間の空間の流体、例えば歯肉縁液、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿、鼻ブラッシングからの液、ペップスミアからの液、または任意の他の体液を含み得る。体液は、唾液、血液、または血清を含み得る。試料はまた、腫瘍試料であり得、これは、静脈穿刺、排泄、射精、マッサージ、生検、針吸引、洗浄、掻き取り、外科的切開、または介入もしくは他のアプローチを含むがこれらに限定されない様々なアプローチによって、対象から得ることができる。試料はセルフリー試料(例えば、細胞を実質的に含まない)であり得る。DNA試料は、例えば、十分な熱を使用して変性させることができる。
いくつかの実施形態では、本開示は、1つ以上の生物学的試料を含むかまたは使用するシステム、方法、またはキットを提供する。本明細書で使用される1つ以上の試料は、核酸を含有するかまたは含有すると推定される任意の物質を含み得る。試料は、対象から得られた生物学的試料を含み得る。いくつかの実施形態では、生物学的試料は液体試料である。
いくつかの実施形態では、試料は、約100ng、90ng、80ng、75ng、70ng、60ng、50ng、40ng、30ng、20ng、10ng、5ng、1ng未満、またはセルフリー核酸分子の数の間の任意の量を含む。さらに、いくつかの実施形態では、試料は、約1pg未満、約5pg未満、約10pg未満、約20pg未満、約30pg未満、約40pg未満、約50pg未満、約100pg未満、約200pg未満、約500pg未満、約1ng未満、約5ng未満、約10ng未満、約20ng未満、約30ng未満、約40ng未満、約50ng未満、約100ng未満、約200ng未満、約500ng未満、約1000ng未満、またはセルフリー核酸分子の数の間の任意の量を含む。
いくつかの実施形態では、本開示は、試料にある量のフィラーDNAを充填して混合物試料を生成するための方法およびシステムを含み、混合物試料は、少なくとも約50ng、55ng、60ng、65ng、70ng、75ng、80ng、85ng、90ng、95ng、100ng、120ng、140ng、160ng、180ng、200ng、または核酸混合物の総量の数の間にある任意の量を含む。いくつかの実施形態では、フィラーDNAは、少なくとも約5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、または100%のメチル化フィラーDNAを含み、残りは非メチル化フィラーDNAであり、好ましくは5%~50%、10%~40%、または15%~30%のメチル化フィラーDNAである。いくつかの実施形態では、混合物試料は、20ng~100ng、好ましくは30ng~100ng、より好ましくは50ng~100ngの量のフィラーDNAを含む。いくつかの実施形態では、試料から得たセルフリーDNAおよび第1の量のフィラーDNAは、合わせて少なくとも50ngの総DNA、好ましくは少なくとも100ngの総DNAを含む。
いくつかの実施形態では、フィラーDNAは、50bp~800bpの長さ、好ましくは100bp~600bpの長さ、より好ましくは200bp~600bpの長さである。いくつかの実施形態では、フィラーDNAは二本鎖である。フィラーDNAは二本鎖である。例えば、フィラーDNAはジャンクDNAであり得る。また、フィラーDNAは、内因性または外因性のDNAであってもよい。例えば、フィラーDNAは非ヒトDNAであり、好ましい実施形態ではλDNAである。本明細書で使用される場合、「λDNA」は、腸内細菌ファージλDNAを指す。いくつかの実施形態では、フィラーDNAは、ヒトDNAと整合していない。
いくつかの実施形態では、試料は、疾患または障害を有する対象の治療の前および/または後に採取され得る。試料は、治療または治療レジメンの最中に対象から得ることができる。治療の効果を経時的にモニターするために、対象から複数の試料を得ることができる。試料は、臨床試験によって確定的な陽性または陰性の診断が得られない疾患または障害を有することが知られているまたは疑われる対象から採取され得る。試料は、疾患または障害を有すると疑われる対象から採取され得る。試料は、疲労、吐き気、体重減少、痛みおよび疼痛、衰弱または出血などの説明できない症状を経験している対象から採取され得る。試料は、説明されている症状を有する対象から採取され得る。試料は、家族歴、年齢、高血圧または高血圧前症、糖尿病または糖尿病前症、過体重または肥満、環境への曝露、生活習慣リスク因子(例えば、喫煙、アルコール摂取、または薬物使用)、または他のリスク因子の存在などの因子によって疾患または障害を発症するリスクがある対象から採取され得る。
いくつかの実施形態では、試料は、第1の時点で採取され、配列決定され得、次いで、別の試料が、その後の時点で採取され、配列決定され得る。そのような方法は、例えば、疾患の発症または進行を追跡するため長期モニタリングする目的のために使用され得る。いくつかの実施形態では、治療の有効性を判定するために、治療前、治療後、または治療の経過中に疾患の進行を追跡することができる。例えば、本明細書に記載の方法は、医学的治療に応じて疾患の進行または退縮を測定するために、医学的治療の前および後に対象に対して実施され得る。
対象から試料を得た後、試料を処理して、対象の疾患または障害を示すデータセットを生成することができる。例えば、がん関連ゲノム遺伝子座または微生物関連遺伝子座のパネルでの試料のセルフリー核酸分子(例えば、ctDNA分子)の有無または定量的評価は、対象のがんを示し得る。対象から得られた試料を処理することは、(i)複数のセルフリー核酸分子を単離、濃縮または抽出するのに十分な条件に試料を供すること、および(ii)データセット(例えば、核酸配列)を生成するために複数のセルフリー核酸分子をアッセイすることを含み得る。いくつかの実施形態では、複数のセルフリー核酸分子が試料から抽出され、配列決定に供されて、複数の配列決定リードが生成される。
いくつかの実施形態では、セルフリー核酸分子は、セルフリーリボ核酸(cfRNA)またはセルフリーデオキシリボ核酸(cfDNA)を含み得る。セルフリー核酸分子(例えば、cfRNAまたはcfDNA)は、様々な方法によって試料から抽出され得る。セルフリー核酸分子は、がん関連ゲノム遺伝子座のパネルに対応する核酸(例えば、RNAまたはDNA)分子を濃縮するように構成された複数のプローブによって濃縮され得る。プローブは、がん関連ゲノム遺伝子座のパネルの1つ以上からの核酸配列との配列相補性を有し得る。がん関連ゲノム遺伝子座のパネルは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、少なくとも約25、少なくとも約30、少なくとも約35、少なくとも約40、少なくとも約45、少なくとも約50、少なくとも約55、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、少なくとも約90、少なくとも約95、少なくとも約100、またはそれより多く、異なるがん関連ゲノム遺伝子座を含み得る。プローブは、1つまたは複数のゲノム遺伝子座(例えば、がん関連ゲノム遺伝子座)の核酸配列(例えば、RNAまたはDNA)と配列相補性を有する核酸分子(例えば、RNAまたはDNA)であり得る。これらの核酸分子は、プライマーまたは濃縮配列であり得る。1つまたは複数のゲノム遺伝子座(例えば、がん関連ゲノム遺伝子座または微生物関連遺伝子座)に対して選択的なプローブを使用する試料のアッセイは、アレイハイブリダイゼーション、ポリメラーゼ連鎖反応(PCR)または核酸配列決定(例えば、RNA配列決定またはDNA配列決定)の使用を含み得る。
核酸分子の配列決定
本開示は、1つまたは複数のポリヌクレオチドのヌクレオチド塩基の配列を決定するための方法および技術を提供する。ポリヌクレオチドは、例えば、デオキシリボ核酸(DNA)またはリボ核酸(RNA)などの核酸分子であり得、その変異体または誘導体(例えば、一本鎖DNA)を含む。配列決定は、Illumina(登録商標)、Pacific Biosciences(PacBio(登録商標))、Oxford Nanopore(登録商標)またはLife Technologies(Ion Torrent(登録商標))による配列決定システムなどの現在利用可能な様々なシステムによって行うことができるが、これらに限定されない。さらに、対の末端の配列決定といった断片の長さを示す任意の配列決定方法を利用することができる。これに代えて、またはこれに加えて、配列決定は、核酸増幅、ポリメラーゼ連鎖反応(PCR)(例えば、デジタルPCR、定量的PCR、またはリアルタイムPCR)、または等温増幅を用いて行われ得る。そのようなシステムは、対象により与えられた試料からシステムによって生成されるように、対象の遺伝情報(例えば、ヒト)に対応する複数の生の遺伝データを提供することができる。いくつかの例において、そのようなシステムは、配列決定リード(本明細書では「リード」とも)を提供する。リードは、配列決定された核酸分子の配列に対応する一連の核酸塩基を含み得る。いくつかの状況では、本明細書で提供されるシステムおよび方法は、プロテオームの情報と共に使用され得る。
いくつかの実施形態では、配列決定リードは、次世代配列決定法または次・次世代配列決定法によって得られる。いくつかの実施形態では、配列決定法は、がんの循環DNA(ctDNA)を定量化するために使用される次世代配列決定ベースの方法である、CAncer Personalized Profiling by deep Sequencing(CAPP-Seq)を含む。この方法は、再発性変異を有することが知られている任意のがんのタイプに対して一般化され得、10,000分子の健常なDNAの変異体DNAの一分子を検出し得る。いくつかの実施形態では、配列決定法は、その全体が本明細書に組み込まれる、Shen et al.,sensitive tumor detection and classification using plasma cell-free DNA methylomes,(2018)Natureによって記載されているようなcfMeDIP配列決定を含む。いくつかの実施形態では、配列決定は亜硫酸水素塩配列決定を含む。
いくつかの実施形態では、配列決定は、例えばバーコード、固有の分子識別子(UMI)、または別のタグを核酸分子またはその断片にライゲーションすることによる、核酸分子またはその断片の修飾を含む。核酸分子またはその断片の一端にバーコード、UMIまたはタグをライゲーションすることにより、配列決定後の核酸分子またはその断片の分析を容易にすることができる。いくつかの実施形態では、バーコードは固有のバーコード(例えば、UMI)である。いくつかの実施形態では、バーコードは固有ではなく、バーコードの配列は、標的核酸の開始配列および停止配列などの内因性配列情報に関連して使用され得る(例えば、標的核酸はバーコードに隣接し、バーコードの配列は、標的核酸の開始部および終了部の配列に関連して、固有にタグ付けされた分子を生成する)。バーコード、UMI、またはタグは、ポリヌクレオチドまたはその断片を入力または標的核酸分子またはその断片と関連付けるために使用される既知の配列であり得る。バーコード、UMI、またはタグは、天然ヌクレオチドまたは非天然(例えば、修飾された)ヌクレオチド(例えば、本明細書に記載されるようなもの)を含み得る。バーコードの配列は、バーコードの配列が配列決定リード内に含まれ得るように、アダプター配列内に含まれ得る。バーコードの配列は、少なくとも4、5、6、7、8、9、10、11、12、13、14、15、16個、またはそれを超えるヌクレオチドの長さを含み得る。場合によっては、バーコードの配列は、十分な長さであってもよく、関連するバーコードの配列に基づいて試料の識別を可能にするために別のバーコードの配列と十分に異なっていてもよい。バーコードの配列、またはバーコードの配列の組み合わせを使用して、「元の」核酸分子またはその断片(例えば、対象から得た試料に存在する核酸分子またはその断片)をタグ付けし、続いて識別することができる。いくつかの場合、バーコードの配列またはバーコードの配列の組み合わせを内因性配列情報と併せて使用して、元の核酸分子またはその断片を同定する。例えば、バーコードの配列、またはバーコードの配列の組み合わせを、バーコード、UMI、またはタグ(例えば、内因性配列の開始および終了)に隣接する内因性配列と共に使用することができる。
核酸分子またはその断片を処理することは、核酸の増幅を行うことを含み得る。例えば、任意のタイプの核酸増幅反応を使用して、標的核酸分子またはその断片を増幅し、増幅産物を生成することができる。核酸増幅方法の非限定的な例としては、逆転写、プライマー伸長、ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応、非対称増幅、ローリングサークル増幅、および多置換増幅(MDA)が挙げられる。PCRの例としては、限定されずに、定量的PCR、リアルタイムPCR、デジタルPCR、エマルジョンPCR、ホットスタートPCR、マルチプレックスPCR、非対称PCR、ネステッドPCR、およびアセンブリPCRが挙げられる。核酸の増幅は、1つ以上のプライマー、プローブ、ポリメラーゼ、緩衝液、酵素、およびデオキシリボヌクレオチドなどの1つ以上の試薬を含み得る。核酸の増幅は等温であってもよく、または熱サイクルを含んでもよい。および/または内因性配列の長さを有する。
メチル化プロファイル
本開示は、疾患/状態を有するかまたはそのような疾患/状態を有すると疑われる対象のメチル化プロファイルを生成するための方法、システムおよびキットを提供し、メチル化プロファイルは、対象が疾患/状態を有するかまたは疾患/状態を有するリスクがあるかどうかを判定するために使用され得る。cfMeDIP-seqを使用する前に、本明細書に開示される試料をライブラリ調製に供する。手短に言えば、末端修復およびAテーリングの後、試料を核酸アダプターにライゲートし、酵素を用いて消化する。試料の項で上述したように、調製したライブラリをフィラー核酸(例えば、フィラーλDNA)と組み合わせて、調製したライブラリの低い存在量のctDNAの影響を最小限に抑え、混合試料を作製することができる。いくつかの実施形態では、疾患/状態が局所的な(非転移性)がんである場合、ctDNAの量は少なく、容易かつ正確に測定および定量化され得ない。混合試料を少なくとも約50ng、80ng、100ng、120ng、150ngまたは200ngにして、さらなる濃縮に供する。
本明細書に記載の方法、システム、およびキットは、それだけに限ることなく、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍を含む様々ながんに適用できる。実施形態では、がんは頭頸部扁平上皮癌である。
結合剤を使用して混合試料を濃縮することができる。いくつかの実施形態では、結合剤は、メチル-CpG結合ドメインを含むタンパク質である。そのような例示的なタンパク質の1つは、MBD2タンパク質である。本明細書で使用される場合、「メチル-CpG結合ドメイン(MBD)」は、約70残基の長さであり、1つまたは複数の対称的にメチル化されたCpGを含むDNAに結合するタンパク質および酵素の特定のドメインを指す。MeCP2、MBD1、MBD2、MBD4およびBAZ2のMBDは、DNAへの結合を媒介し、MeCP2、MBD1およびMBD2の場合、優先的にはメチル化CpGへの結合を媒介する。ヒトタンパク質MECP2、MBD1、MBD2、MBD3、およびMBD4は、メチル-CpG結合ドメイン(MBD)のそれぞれに存在することによって関連する核タンパク質のファミリーを含む。これらのタンパク質の各々は、MBD3を除いて、メチル化DNAに特異的に結合することができる。
他の実施形態では、結合剤は抗体であり、セルフリーメチル化DNAを捕捉することは、抗体を使用してセルフリーメチル化DNAを免疫沈降させることを含む。本明細書で使用される場合、「免疫沈降」は、その特定の抗原に特異的に結合する抗体を使用して抗原(ポリペプチドおよびヌクレオチドなど)を溶液から沈殿させる技術を指す。このプロセスは、試料から特定のタンパク質またはDNAを単離および濃縮するために使用され得、手順のある時点で抗体が固体の基材に結合されることを必要とする。固体の基材は、例えばビーズ、例えば磁気ビーズを含む。他の種類のビーズおよび固体の基材を使用してもよい。
1つの例示的抗体は5-MeC抗体である。免疫沈降手順のために、いくつかの実施形態では、少なくとも0.05μgの抗体を試料に添加する。一方、より好ましい実施形態では、少なくとも0.16μgの抗体を試料に添加する。免疫沈降反応を確認するために、いくつかの実施形態では、本明細書に記載の方法は、第2の量の対照DNAを試料に添加する工程をさらに含む。
濃縮された試料をさらに増幅し、精製し、配列決定して、複数の配列リードを生成する。複数の配列リードを分析して、複数の差次的メチル化領域(DMR)を同定する。いくつかの実施形態では、複数のDMRは、末梢血白血球(PBL)に由来するセルフリー核酸分子に由来するDMRを含む。いくつかの実施形態では、複数のDMRは、少なくとも約75万個の重複しない約300bpの核酸断片ウィンドウを含む。これらの断片は、8個以上のCpGアイランドを含む。いくつかの実施形態では、DMRは、疾患/状態を有する患者から得られた試料から生成された配列リードを、健常な対照から得られた試料から生成された配列リードと比較することによって、同定される。いくつかの実施形態では、健常な対照は、疾患/状態を発症するための同じリスク因子のセットを含む。いくつかの実施形態では、複数のDMRは、少なくとも約997個のDMR、HNSCCにおける約941個の過剰メチル化およびHNSCCにおける56個の低メチル化を含む(表5)。本明細書において同じ開示のアプローチを使用して、過剰メチル化DMRを異なるがん(例えば、肺がん、膵臓がん、結腸直腸がん)について検出することができ、低メチル化DMRを異なるがんについて検出することができる。
Figure 2023528533000002
Figure 2023528533000003
Figure 2023528533000004
Figure 2023528533000005
Figure 2023528533000006
Figure 2023528533000007
Figure 2023528533000008
Figure 2023528533000009
Figure 2023528533000010
Figure 2023528533000011
Figure 2023528533000012
Figure 2023528533000013
Figure 2023528533000014
Figure 2023528533000015
Figure 2023528533000016
Figure 2023528533000017
Figure 2023528533000018
Figure 2023528533000019
Figure 2023528533000020
Figure 2023528533000021
Figure 2023528533000022
Figure 2023528533000023
Figure 2023528533000024
Figure 2023528533000025
Figure 2023528533000026
Figure 2023528533000027
Figure 2023528533000028
ゲノム変異プロファイル
本開示は、疾患/状態を有するかまたはそのような疾患/状態を有すると疑われる対象の変異プロファイルを生成するための方法、システムおよびキットを提供し、メチル化プロファイルは、対象が疾患/状態を有するかまたは疾患/状態を有するリスクがあるかどうかを判定するために使用され得る。本明細書に開示される試料は、ライブラリ調製および次世代ディープシーケンシング(例えば、CAPP-Seq)に供される。複数の配列決定リードが生成され、分析される。いくつかの実施形態では、ディープシーケンシングは、疾患/状態に関連するゲノム変異の同定を最大化するように構成され得る。例えば、限定することを意図するものではないが、頭頸部扁平上皮癌(HNSCC)については、標準的なHNSCCドライバ遺伝子のパネルをCAPP-seqのセレクタに含めることができる。さらに、肺がんの場合、肺がん駆動遺伝子のパネルがCAPP-seqのセレクタに含まれ得る。さらに、膵臓がんの場合、膵臓がん駆動遺伝子のパネルは、CAPP-seqのためのセレクタに含まれ得る。いくつかの実施形態では、CAPP-seqのセレクタに特定のがんのタイプにおける既知のドライバ効果のない遺伝子を含めることにより、ctDNA検出の感度を高めることができる。
いくつかの実施形態では、ctDNA存在量の相対的な尺度は、平均変異対立遺伝子画分(MAF)から計算される。いくつかの実施形態では、変異の平均MAFは、対象を同定し、その変異プロファイルに含まれるのは、少なくとも約0.01%~少なくとも約10%の範囲である。本明細書に開示される試料のctDNA画分は、少なくとも約0.01%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0.08%、0.09%、0.1%、0.15%、0.2%、0.5%、1%、1.5%、2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%、6%、6.5%、7%、7.5%、8%、8.5%、9%、9.5%、10%、またはその間の任意の割合である。
いくつかの実施形態では、対象の生成された変異プロファイルは、PBLに由来するセルフリー核酸分子に由来する変異の変異体を含まない。いくつかの実施形態では、変異プロファイルは、ミスセンス変異体、ナンセンス変異体、欠失変異体、挿入変異体、重複変異体、逆位変異体、フレームシフト変異体、または反復伸長変異体などの遺伝子多型を含む。いくつかの実施形態では、変異プロファイルは、特定のサイズ範囲のセルフリー核酸分子の画分に由来する変異の変異体を含み得る。
断片の長さプロファイル
いくつかの実施形態では、ctDNA断片の長さは、健常な対象に由来するセルフリー核酸分子よりも短い。いくつかの実施形態では、少なくとも1つの変異を含むctDNAの長さは、対応する参照対立遺伝子を含むセルフリー核酸分子の長さよりも短い。いくつかの実施形態では、少なくとも1つのDMRを含有するctDNA断片の長さは、対応するゲノム領域を含有するセルフリー核酸分子の断片よりも短い。
いくつかの実施形態では、配列決定は、ctDNA断片の分解を引き起こし、ctDNAの長さの分布の保存を妨げるので、亜硫酸水素塩配列を利用しない。いくつかの実施形態では、ctDNAの断片の長さは、少なくとも60~500bp、80~300bp、90~250bp、80~170bp、または100~150bpである。いくつかの実施形態では、本開示は、特定のサイズのセルフリー分子の選択に基づいて、セルフリー核酸試料の濃縮をもたらす。いくつかの実施形態では、マルチモーダル解析は、複数の核酸分子をそれらの断片の長さに基づいて変異プロファイルに選択的に含めることによって、本明細書に記載の変異プロファイルおよび断片の長さプロファイルを利用することを含む。いくつかの実施形態では、マルチモーダル解析は、複数の核酸分子をそれらの断片の長さに基づいてメチル化プロファイルに選択的に含めることによって、本明細書に記載のメチル化プロファイルおよび断片の長さプロファイルを利用することを含む。いくつかの実施形態では、マルチモーダル解析は、複数の核酸分子をそれらの断片の長さに基づいて変異プロファイルに選択的に含めることによって、および複数の核酸分子をそれらの断片の長さにそれぞれ基づいてメチル化プロファイルに選択的に含めることによって、変異プロファイル、メチル化プロファイル、および断片の長さプロファイルを一緒に利用することを含む。
がんを検出し、腫瘍の起源の組織を決定し、予後を提供するための方法およびシステム
本開示は、対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するための方法およびシステムを提供し、この方法およびシステムは、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルのうちの少なくとも1つのプロファイルを生成するために前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、および前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ng/ml未満の前記複数の核酸分子を含む、処理する工程を含む。いくつかの実施形態では、感度は、少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパーセンテージである。いくつかの実施形態では、特異度は、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパーセンテージである。
いくつかの実施形態では、方法およびシステムは、前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子を配列決定に供して、(i)メチル化プロファイル、(ii)変異プロファイルおよび(iii)断片の長さプロファイルのうちの少なくとも2つのプロファイルを生成させる工程を含む。方法は、少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパーセンテージの感度をもたらす。いくつかの実施形態では、2つのプロファイルを使用する場合の感度は、1つのプロファイルを使用する場合の感度と比較して、任意の数字の間で少なくとも約0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、またはパーセンテージだけ増加する。いくつかの実施形態では、3つのプロファイルを使用する場合の感度は、2つのプロファイルを使用する場合の感度と比較して、任意の数字の間で少なくとも約0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、またはパーセンテージだけ増加する。
さらに、方法は、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパーセンテージの特異度をもたらす。いくつかの実施形態では、2つのプロファイルを使用する場合の特異度は、1つのプロファイルを使用する場合の特異度と比較して、任意の数字の間で少なくとも約0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、またはパーセンテージだけ増加する。いくつかの実施形態では、3つのプロファイルを使用する場合の特異度は、2つのプロファイルを使用する場合の特異度と比較して、任意の数字の間で少なくとも約0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、またはパーセンテージだけ増加する。
本開示は、対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有するリスクがあるかどうかを判定する方法およびシステムであって、複数の核酸分子を含む前記セルフリー核酸試料を得る工程、前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リードを生成する工程、前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、および前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを使用する工程を含む、方法およびシステムを提供する。いくつかの実施形態では、方法は、少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパーセンテージの感度をもたらす。方法は、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパーセンテージの特異度をもたらす。
本開示は、複数の差次的メチル化領域(DMR)を同定することを含む、腫瘍の組織の起源を決定するための方法およびシステムを提供し、複数のDMRは、特定のがん(例えば、乳がん、結腸がん、前立腺がん、HSNCC)に特異的であり、セルフリー核酸分子の画分に由来する。いくつかの実施形態では、セルフリー核酸分子の画分はctDNAに由来する。いくつかの実施形態では、方法は少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパーセンテージの感度をもたらす。方法は、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパーセンテージの特異度をもたらす。
本開示は、疾患/状態の治療を受けた後に対象に対して予後を得るための方法およびシステムを記載する。例えば、治療は、腫瘍の外科的除去、特定の種類のがんのために設計された化学療法、放射線療法、または免疫療法(例えば、TCR、CARなど)を含む。いくつかの実施形態では、方法またはシステムは、前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子を配列決定に供して、(i)メチル化プロファイル、(ii)変異プロファイルおよび(iii)断片の長さプロファイルのうちの少なくとも1つのプロファイルを生成させること、および少なくとも1つのプロファイルに少なくとも基づいて微小残存病変(MRD)をモニタリングまたは検出することを含む。
本開示は、対象からの試料の少なくとも一部からのセルフリー核酸分子をアッセイすることによって、前記対象が疾患/状態を有するかどうかを判定するため、表5に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出するため、また少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、前記表5に列挙されたDMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと比較するための方法およびシステムを提供する。いくつかの実施形態では、表5に列挙される少なくとも約6個以上、10個以上、15個以上、20個以上、30個以上、40個以上、50個以上、60個以上、70個以上、80個以上、90個以上、または100個以上、200個以上、300個以上、400個以上、500個以上、600個以上、または700個以上のDMRのメチル化レベルが測定され、本明細書で論じられる健常な対象の対応するDMRのメチル化レベルと比較される。
対象が正確に診断され、外科的除去、化学療法、放射線療法などのがんを治療するための治療を受けるたら、治療の有効性をモニタリングし、患者の生存率を予測することが重要である。さらに、がん細胞の最小限の残存疾患を検出することが重要である。本開示は、前記対象が疾患の治療を受けた後に生存率が高いかどうかを判定するための方法およびシステムを提供し、この方法およびシステムは、前記対象からの試料の少なくとも一部からのセルフリー核酸分子をアッセイすること、表6に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出すること、また少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、表6に列挙された前記DMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと比較することを含む。いくつかの実施形態では、表6に列挙されるDMRは、遺伝子ZSCAN31、LINC01391、GATA2-AS1、STK3、およびOSR1に関連する領域を表す。
Figure 2023528533000029
いくつかの実施形態では、方法は、免疫沈降反応を確認するために第2の量の対照DNAを試料に添加する工程をさらに含む。
本明細書で使用される場合、「対照」は、陽性対照と陰性対照の両方、または少なくとも陽性対照を含み得る。
いくつかの実施形態では、方法は、セルフリーメチル化DNAの捕捉を確認するために、第2の量の対照DNAを試料に添加する工程をさらに含む。
いくつかの実施形態では、がん細胞由来のDNAが存在することを同定することは、がん細胞の起源の組織を同定することをさらに含む。
いくつかの例では、腫瘍組織サンプリングは困難であるか、または重大なリスクを伴う可能性があり、その場合、腫瘍組織サンプリングを必要とせずにがんを診断および/またはサブタイプに分けることが望ましい場合がある。例えば、肺腫瘍組織サンプリングは、縦隔鏡検査、開胸、または経皮的針生検などの侵襲的処置を必要とし得る。これらの処置は、入院、胸腔チューブ、機械での換気、抗生物質、または他の医学的介入の必要性をもたらし得る。一部の個体は、医学的併存症のために、または優先度のために、腫瘍組織サンプリングに必要な侵襲的処置を受けないことがある。いくつかの例では、腫瘍組織調達の実際の手順は、疑われているがんのサブタイプに依存し得る。他の例では、がんのサブタイプは、同じ個体の体内で経時的に進展し得、侵襲性腫瘍組織サンプリング処置による連続的な評価は、多くの場合非現実的であり、患者が十分に忍容できない。したがって、血液検査による非侵襲性がんのサブタイプ分類は、臨床腫瘍学の実施において多くの有利な用途を有し得る。
したがって、いくつかの実施形態では、がん細胞の起源の組織を同定することは、がんのサブタイプを同定することをさらに含む。好ましくは、がんのサブタイプは、ステージ(例えば、外科手術で治療された早期肺がん対化学療法で治療された後期肺がん)、組織学(例えば、肺がんにおける小細胞癌対腺癌対扁平上皮癌)、遺伝子発現パターンまたは転写因子活性(例えば、乳がんにおけるER状態)、コピー数の異常(例えば、乳がんにおけるHER2の状態)、特異的再編成(例えば、AMLにおけるFLT3)、特異的遺伝子点変異状態(例えば、IDH遺伝子点変異)、およびDNAのメチル化パターン(例えば、脳がんにおけるMGMT遺伝子プロモーターのメチル化)に基づいてがんを区別する。
いくつかの実施形態では、工程(f)における比較は、ゲノムワイドで行われる。
他の実施形態では、工程(f)における比較は、ゲノムワイドから、限定されないが、FANTOM5エンハンサー、CpGアイランド、CpGショア、CpG Shelfまたは前述の任意の組み合わせなどの特定の調節領域に制限される。
いくつかの実施形態では、本明細書の方法は、がんの検出に使用するためのものである。
いくつかの実施形態では、本明細書の方法は、がんの治療のモニタリングに使用するためのものである。
データ分析システムおよび方法
本明細書に開示される方法およびシステムは、アルゴリズムまたはその使用を含むことができる。1つまたは複数のアルゴリズムは、1つまたは複数の対象から1つまたは複数の試料を分類するために使用され得る。1つまたは複数のアルゴリズムは、1つまたは複数の試料からのデータに適用され得る。データはバイオマーカー発現データを含み得る。本明細書に開示される方法は、1人または複数の対象からの1つまたは複数の試料に分類を割り当てることを含み得る。分類を試料に割り当てることは、メチル化プロファイル、変異プロファイルおよび断片の長さプロファイルにアルゴリズムを適用することを含み得る。場合によっては、少なくとも1つのプロファイルは、対象から得られた試料を疾患または軽微な損傷を有すると分類するための訓練されたアルゴリズムを含むデータ分析システムに入力される。
データ分析システムは、訓練されたアルゴリズムであってもよい。アルゴリズムは、線形分類器を含み得る。場合によっては、線形分類器は、線形判別分析、フィッシャー線形判別、ナイーブベイズ分類器、ロジスティック回帰、パーセプトロン、サポートベクターマシン、またはそれらの組み合わせのうちの1つまたは複数を含む。線形分類器は、サポートベクターマシン(SVM)のアルゴリズムであってもよい。アルゴリズムは、双方向分類器を含み得る。双方向分類器は、1つまたは複数の決定木、ランダムフォレスト、ベイジアンネットワーク、サポートベクターマシン、ニューラルネットワーク、またはロジスティック回帰アルゴリズムを含み得る。
アルゴリズムは、1つまたは複数の線形判別分析(LDA)、基本パーセプトロン、弾性ネット、ロジスティック回帰、(カーネル)サポートベクターマシン(SVM)、対角線形判別分析(DLDA)、ゴルビン分類器、パーゼンベース、(カーネル)フィッシャー判別分類器、k近傍法、反復RELIEF、分類木、最尤分類器、ランダムフォレスト、最近接重心、マイクロアレイの予測分析(PAM)、k中間クラスタリング、ファジーC平均クラスタリング、ガウス混合モデル、勾配応答(GR)、勾配ブースティング法(GBM)、楕円ネットロジスティック回帰、ロジスティック回帰、またはそれらの組み合わせを含み得る。アルゴリズムは、対角線形判別分析(DLDA)のアルゴリズムを含み得る。アルゴリズムは、最近接重心のアルゴリズムを含み得る。アルゴリズムは、ランダムフォレストのアルゴリズムを含み得る。いくつかの実施形態では、子癇前症および非子癇前症を識別するために、ロジスティック回帰、ランダムフォレスト、および勾配ブースティング法(GBM)のパフォーマンスは、線形判別分析(LDA)、ニューラルネットワーク、およびサポートベクターマシン(SVM)のパフォーマンスよりも優れている。
キット
本開示は、対象の疾患または障害(例えば、がん)を同定またはモニタリングするためのキットを提供する。キットは、対象の試料のがん関連ゲノム遺伝子座のパネルの各々における配列の定量的尺度(例えば、存在、非存在、または相対的な量を示す)を同定するためのプローブを含み得る。試料のがん関連ゲノム遺伝子座のパネルの各々における配列の定量的尺度(例えば、存在、非存在、または相対的な量を示す)は、対象の疾患または障害(例えば、がん)を示し得る。プローブは、試料のがん関連ゲノム遺伝子座(例えば、表3、5および6に列挙されるDMR)のパネルにおける配列に対して選択的であり得る。キットは、プローブを使用して試料を処理し、対象の試料のがん関連ゲノム遺伝子座のパネルのそれぞれにおける配列の定量的尺度(例えば、存在、非存在、または相対的な量を示す)を示すデータセットを生成するための説明書を含み得る。
キットにあるプローブは、試料のがん関連ゲノム遺伝子座のパネルにおける配列に対して選択的であり得る。キットにあるプローブは、がん関連ゲノム遺伝子座のパネルに対応する核酸(例えば、RNAまたはDNA)分子を選択的に濃縮するように構成され得る。キットにあるプローブは核酸プライマーであり得る。キットにあるプローブは、がん関連ゲノム遺伝子座またはゲノム領域のパネルの1つ以上からの核酸配列との配列相補性を有し得る。がん関連ゲノム遺伝子座または微生物関連ゲノム遺伝子座またはゲノム領域のパネルは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少なくとも20、またはそれより異なるがん関連ゲノム遺伝子座またはゲノム領域のパネルを含み得る。
キットの説明書は、セルフリー生物学的試料のがん関連ゲノム遺伝子座のパネルにおける配列に対して選択的であるプローブを使用して、試料をアッセイするための説明書を含み得る。これらのプローブは、がん関連ゲノム遺伝子座の複数のパネルのうちの1つ以上由来の核酸配列(例えば、RNAまたはDNA)との配列相補性を有する核酸分子(例えば、RNAまたはDNA)であり得る。これらの核酸分子は、プライマーまたは濃縮配列であり得る。セルフリー生物試料をアッセイするための説明書は、アレイハイブリダイゼーション、ポリメラーゼ連鎖反応(PCR)、または核酸の配列決定(例えば、DNAの配列決定またはRNAの配列決定)を実施して試料を処理し、試料のがん関連ゲノム遺伝子座のパネルのそれぞれにおける配列の定量的尺度を示す(例えば、存在、非存在、または相対的な量を示す)データセットを生成するための導入を含み得る。試料のがん関連ゲノム遺伝子座のパネルの各々における配列の定量的尺度(例えば、存在、非存在、または相対的な量を示す)は、疾患または障害(例えば、がん)を示し得る。
キットの説明書は、アッセイ読み出し値を測定および解釈するための説明書を含み得、それは、試料のがん関連ゲノム遺伝子座のパネルの各々における配列の定量的尺度を示す(例えば、存在、非存在、または相対的な量を示す)データセットを生成するために、がん関連ゲノム遺伝子座のパネルの1つまたは複数において定量化され得る。例えば、がん関連ゲノム遺伝子座のパネルに対応するアレイハイブリダイゼーションまたはポリメラーゼ連鎖反応(PCR)の定量化は、試料のがん関連ゲノム遺伝子座のパネルの各々における配列の定量的尺度を示す(例えば、存在、非存在、または相対的な量を示す)データセットを生成し得る。アッセイ読み取り値は、定量的PCR(qPCR)値、デジタルPCR(dPCR)値、デジタル液滴PCR(ddPCR)値、蛍光の値など、またはそれらの正規化された値を含み得る。
コンピュータシステム
いくつかの実施形態では、特定の工程は、コンピュータプロセッサによって実行される。本システムおよび方法は、様々な実施形態で実施することができる。適切に構成されたコンピュータデバイス、ならびに関連する通信ネットワーク、デバイス、ソフトウェアおよびファームウェアは、上述の1つまたは複数の実施形態を可能にするためのプラットフォームを提供することができる。例として、図8は、記憶ユニット104およびランダムアクセスメモリ106に接続された中央処理装置(「CPU」)102を含むことができる汎用コンピュータデバイス100を示す。CPU102は、オペレーティングシステム101、アプリケーションプログラム103、およびデータ123を処理することができる。必要に応じて、オペレーティングシステム101、アプリケーションプログラム103、およびデータ123を記憶ユニット104に格納し、メモリ106にロードすることができる。コンピュータデバイス100は、CPU102およびメモリ106に動作可能に接続され、CPU102からの集中的な画像処理計算をオフロードし、CPU102と並列にこれらの計算を実行するグラフィック処理ユニット(GPU)122を、さらに含むことができる。オペレータ107は、ビデオインターフェース105によって接続されたビデオディスプレイ108、およびI/Oインターフェース109によって接続されたキーボード115、マウス112、およびディスクドライブまたはソリッドステートドライブ114などの様々な入出力デバイスを使用して、コンピュータデバイス100と対話することができる。マウス112は、ビデオディスプレイ108のカーソルの移動を制御し、マウスのボタンでビデオディスプレイ108に表示される様々なグラフィカルユーザインターフェース(GUI)の制御を操作するように構成することができる。ディスクドライブまたはソリッドステートドライブ114は、コンピュータ可読媒体116を受け入れるように構成され得る。コンピュータデバイス100は、ネットワークインターフェース111を介してネットワークの一部を形成することができ、コンピュータデバイス100が他の適切に構成されたデータ処理システム(図示せず)と通信することを可能にする。様々なソースからの入力を受信するために、1つまたは複数の異なるタイプのセンサ135を使用することができる。
本システムおよび方法は、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、またはワイヤレスハンドヘルドを含む実質的に任意の方式のコンピュータデバイスで実施することができる。本システムおよび方法はまた、1つまたは複数のコンピュータデバイスが本発明による方法における様々なプロセス工程の各々を実施することを可能にするためのコンピュータプログラムコードを含むコンピュータ可読/使用可能媒体として実施されてもよい。複数のコンピュータデバイスが動作全体を実行する場合、コンピュータデバイスはネットワーク接続されて動作の様々な工程を分配する。コンピュータ可読媒体またはコンピュータ使用可能媒体という用語は、プログラムコードの任意のタイプの物理的実施形態の1つまたは複数を含むことが理解される。特に、コンピュータ可読/使用可能媒体は、1つまたは複数の可搬型記憶製品(例えば、光ディスク、磁気ディスク、テープなど)、コンピュータおよび/または記憶システムに関連するメモリなどのコンピューティングデバイスの1つまたは複数のデータ記憶部に組み込まれたプログラムコードを含むことができる。
本明細書で使用される場合、「プロセッサ」は、任意のタイプのプロセッサ、例えば、任意のタイプの汎用マイクロプロセッサまたはマイクロコントローラ(例えば、Intel(商標)x86、PowerPC(商標)、ARM(商標)プロセッサなど)、デジタル信号処理(DSP)プロセッサ、集積回路、フィールドプログラマブルゲートアレイ(FPGA)、またはそれらの任意の組み合わせであってもよい。
本明細書で使用される場合、「メモリ」は、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、コンパクトディスク読み出し専用メモリ(CDROM)、電気光学メモリ、光磁気メモリ、消去可能プログラマブル読み出し専用メモリ(EPROM)、および電気的消去可能プログラマブル読み出し専用メモリ(EEPROM)など、内部または外部のいずれかに配置された任意のタイプのコンピュータメモリの適切な組み合わせを含むことができる。メモリ102の一部は、従来のファイルシステムを使用して編成され、デバイスの全体的な動作を管理するオペレーティングシステムによって制御および管理され得る。
本明細書で使用される場合、「コンピュータ可読記憶媒体」(機械可読媒体、プロセッサ可読媒体、またはコンピュータ可読プログラムコードが具現化されたコンピュータ使用可能媒体とも呼ばれる)は、コンピュータまたは機械によって読み取り可能なフォーマットで、データを記憶することができる媒体である。機械可読媒体は、ディスケット、コンパクトディスク読み出し専用メモリ(CD-ROM)、メモリデバイス(揮発性または不揮発性)、または同様の記憶機構を含む磁気、光学、または電気記憶媒体を含む、任意の適切な有形の非一時的媒体であってもよい。コンピュータ可読記憶媒体は、実行されるとき、プロセッサに、本開示の実施形態による方法の工程を実行させる様々な命令セット、コードシーケンス、構成情報、または他のデータを含むことができる。当業者は、記載された実施態様を実施するために必要な他の命令および動作がまた、コンピュータ可読記憶媒体に記憶され得ることを理解するであろう。コンピュータ可読記憶媒体に記憶された命令は、プロセッサまたは他の適切な処理デバイスによって実行され得て、記載されたタスクを実行するための回路とインターフェースすることができる。
本明細書で使用される場合、「データ構造」は、コンピュータのデータを編成してそれが効率的に使用され得るようにする特定の方法である。データ構造は、1つまたは複数の特定の抽象データ型(ADT)を実装することができ、それは、データ構造に対して実行され得る操作、およびそれらの操作の計算の複雑度を明示する。比較すると、データ構造は、ADTにより得られる仕様の具体的な実装である。
本発明の利点は、以下の実施例によってさらに説明される。本明細書に記載の実施例およびそれらの特定の細部は、例示のために提示されているにすぎず、本発明の特許請求の範囲を限定するものとして解釈されるべきではない。
[実施例]
材料および方法
HNSCCおよび健常なドナーの末梢血白血球(PBL)ならびに血漿の獲得
2014年~2016年の間にHNSCCと診断された患者が、前向きなAnthology of Clinical Outcomes(Wong K.et al.2010)から同定された。すべての研究は、University Health NetworkのResearch Ethics Boardによって承認された。HNSCC患者の試料は、以下の基準、1)診断時の限局性疾患の提示、2)診断時、および少なくとも1つの処置後の時点での血液の採取、3)診断後2年の最小フォローアップ時間に基づいて、Princess Margaret Cancer CentreのHNC Translational Researchプログラムから得た。すべての患者は、アジュバント放射線療法を伴うまたは伴わない手術からなる、治癒を意図した治療を受けた。年齢、性別および現在の喫煙状態が一致する健常なドナーを、前向き肺がんスクリーニングプログラムから同定した。5~10mLの血液をエチレン-ジアミン-四酢酸(EDTA)チューブに採取した。HNSCC患者については、血液を、診断時(ベースライン、BL)ならびに一次手術の3ヶ月後(3M)に採取した。適用可能な場合、追加の血液を、補助放射線療法(PreRT)、中間補助放射線療法(MidRT)の前、および/または一次手術の12ヶ月後(12M)に採取した。血漿を採取の1時間以内に血液から単離し、さらなる処理まで-80℃で保存した。診断時のHNSCC患者または健常なドナーに対する同じ採血から、末梢血白血球がまた単離された。
細胞培養
HPV陰性HNSCC細胞株FaDuは、Bradly Wouters博士(Princess Margaret Cancer Center)の厚意により提供され、10%ウシ胎児血清および1%ペニシリン/ストレプトマイシンが補充されたDMEM(Gibco)で培養された。FaDu細胞培養物を、5%CO2を含有する加湿雰囲気において37℃でインキュベートした。STRプロファイリングにより、FaDu細胞の同一性を確認した。使用前に細胞をマイコプラズマ試験e-MycoTMVALiD Mycoplasma PCR Detection Kit、Intron Bio)に供した。
セルフリーDNA(cfDNA)およびPBLゲノムDNA(gDNA)の単離
製造業者の指示に従ってQIAamp Circulating Nucleic Acid Kit(Qiagen)を使用して、総血漿からcfDNAを単離した。ゲノムDNAをPBLから単離し、Covaris M220集束超音波処理装置を用いて150~200塩基対に剪断し、AMPure XP磁気ビーズ(Beckman Coulter)によってサイズ選択して、300塩基対を超える断片を除去した。単離されたcfDNAおよび剪断されたPBLゲノムDNAを、ライブラリ生成前にQubitによって定量した(図9Aおよび図9B)。
配列決定ライブラリの調製
それぞれ5~10ngまたは10~20ngのDNAをcfMeDIP-seqまたはCAPP-seqのインプットとして使用した。いくつかの改変を加えたKAPA HyperPrep Kit(KAPA Biosystems)を使用して、ライブラリ生成のためにインプットDNAを調製した。ライゲーション時にインプットDNAの両鎖に隣接するランダムな2bpの配列とそれに続く一定の1bpのT配列5’とを組み込むライブラリアダプターを利用した。ライゲーション中のアダプター二量体化を最小限に抑えるために、ライブラリアダプターを100:1というアダプター:DNAのモル比(10ngのcfDNAあたり約0.07uM)で添加し、4℃で17時間一晩インキュベートした。ライゲーション後の浄化後、ライブラリ生成の前に、インプットDNAを40μLの溶出緩衝液(EB、10mMのTris-HCl、pH8.0~8.5)で溶出した。
CAPP-seqライブラリの生成
CAPP-seqライブラリの作製を、いくつかの修正を加えてNewman et al.2014に記載されているように行った。ライブラリを10サイクルでPCR増幅し、最大12のインデックス付き増幅ライブラリを500~1000ngで一緒にプールした。COT DNAおよびブロッキングオリゴを添加した後、プールしたライブラリをSpeedVac処理してすべての液体を蒸発させ、13μLの再懸濁混合物(8.5μLの2Xハイブリダイゼーション緩衝液、3.4μLのハイブリダイゼーション成分A、1.1μLのヌクレアーゼ非含有水)に再懸濁した。ハイブリダイゼーションの前に、4μLのハイブリダイゼーションプローブ(すなわち、HNSCCセレクタ)を合計17μLにわたって再懸濁混合物に添加した。ハイブリダイゼーションおよびPCR増幅/浄化の後、ライブラリを30μLのIDTE、pH8.0(1×TE溶液)で溶出した。多重化ライブラリを、Illumina NextSeq/NovaSeq/HiSeq4000でそれぞれ2×75/100/125の対の試行で配列決定した。HNSCCセレクタの設計は、COSMICデータベースからのHNSCCならびにHPV-16ゲノムのE6およびE7領域における頻繁に繰り返されるゲノム変化を組み込んだ(図11)。
CAPP-seqライブラリのアライメントおよび質の管理
組み込まれたランダムの分子バーコードに対応する、アラインメントされていない対になったリードの各5’末端の最初の2塩基対を抽出し、照合して4bp分子識別子(UMI)を生成した。第3のT塩基対スペーサーもアライメント前に除去した。対になったリードを、BWA-memによってヒトゲノム(ゲノムアセンブリGRCh37/hg19)にアラインメントし、SAMtools(v 1.3.1)によってソートおよびインデックス付けし、Genome Analysis ToolKit(GATK)BaseRecalibrator(v 3.8)を使用して、最良の実践(参照)に従って、塩基の質のスコアについて再較正した。BAMファイルから得た重複配列をそれらのUMIに基づいて折り畳み、ConsensusCruncherによってシングルトン、単一鎖コンセンサス配列(SSCS)または重複コンセンサス配列(DCS)として標識した44。各ライブラリの質の管理を、FastQC(Babraham Bioinformatics)から得られた様々なメトリック、ならびに捕捉効率(CollectHsMetrics、Picard 2.10.9)、カバレッジの深度(DepthOfCoverage、GATK 3.8)および塩基対位置誤り率(ides-bgreport.pl、Newmanら、2016)を得るための様々なスクリプトによって評価した。
体細胞ヌクレオチド変異体(SNV)の検出およびctDNAの定量
Newmanら2016に記載されているように、統合デジタルエラー抑制(iDES)によって潜在的な配列決定エラーの除去を行った。バックグラウンド研磨を、20名の健常なドナーのcfDNAの試料を訓練コホートとして利用することによって、行った(図12)。下流の分析に外れ値が影響を与えるのを防ぐために、HNSCC cfDNAまたはPBL gDNA試料にわたる配列決定の深度(1500倍以下、5000倍以上)の下位15または上位85パーセンタイルの候補SNV、ならびに平均の配列決定の深度が500倍以下の遺伝子を分析から除外した。クローン造血を説明するために、非生殖系列変異は、血漿に10%未満の変異対立遺伝子画分を有すると定義された。HNSCCのcfDNA試料の候補SNVは、一致したPBLのgDNA試料の二重鎖のサポートおよび完全な非存在でリードをサポートする、3以上の基準に基づいて同定された。同定されたSNVの変異対立遺伝子画分(MAF)を、代替対立遺伝子に対応するリードの数を、代替対立遺伝子および参照対立遺伝子に対応するリードの合計で割ることによって計算した。同定可能なSNVを有するHNSCCのcfDNAの試料各々について、SNVにわたる平均MAFを計算し、ctDNAの存在量の尺度として使用した。1つのみの同定可能なSNVを有するcfDNA試料では、計算されたMAFを使用した。検出可能ながん由来の変異の多くはホモ接合性でなくても、腫瘍の内部でクローン性でなくてもよく、これらの理由から、平均MAFはセルフリーDNA内の真のctDNAの存在量を過小評価したものであり得る。
cfMeDIP-seqライブラリの生成
「Sequencing Library Preparation」に記載されているようにライブラリ調製工程を変更して、Shenら2019に記載されているように、cfMeDIP-seqプロトコルを実施した。多重化ライブラリを、Illumina NextSeq/NovaSeq/HiSeq4000でそれぞれ2×75/100/125の対の試行で配列決定した。一般化の可能性のために、cfMeDIP-seqライブラリは、供給源(すなわち、cfDNA、gDNA)にかかわりなく、5~10ngのインプットDNAを利用する任意のMeDIP-seq調製方法として記載されている。
cfMeDIP-seqライブラリのアラインメントおよび質の管理
CAPP-seqライブラリのアラインメントおよび質の管理において、前に記載されたように、アラインメントされていない対のリードを処理し、アラインメントし、ソートし、インデックス付けした。BAMファイルからの重複配列をSAMtoolsによって崩壊させた。各ライブラリの質の管理は、FastQC(Babraham Bioinformatics)から得られた様々なメトリック、ならびにCpGカバレッジ(MEDIPS.seqCoverage)および濃縮(MEDIPS.CpGenrich)を含むRパッケージMEDIPS(参照)から得られた様々なメトリックによって評価した。
cfMeDIP-seqプロファイルにおける情報領域の選択
cfMeDIP-seqライブラリのペアリードから生成された断片を、MEDIPS(MEDIPS.createSet)によって重複しない300塩基対ウィンドウ内でカウントし、Reads Per Kilobase per Million(RPKM)によってスケーリングし、WIGフォーマット(MEDIPS.exportWIG)としてエクスポートした。各試料から得たWIGファイルをRによってインポートし、マトリックスとして照合した。分析は、非疾患状況の中での適用を可能にするために、20人の健常なドナーの試料から得たcfDNAおよびPBLの試料に限定された。情報領域は、CpGの密度、およびcfDNAと一致したPBLとの間でのRPKM値の相関の基準に基づいた。CpGの密度(≧nのCpG)に基づくスライディングウィンドウを使用して、≧8個のCpGの最小閾値を選択した。
cfMeDIP-seqライブラリからの絶対的なメチル化の計算
cfMeDIP-seqライブラリの対にしたリードから得た断片を、Selection of Informative Regions in cfMeDIP-seq Profilesに以前に記載されたようにカウントし、MeDEStrand Rパッケージによって絶対的なメチル化レベルにスケーリングした。カウントから絶対的なメチル化を計算するために、ロジスティック回帰モデルを使用して、CpGの密度(すなわち、CpG密度バイアス)に基づいてDNAプルダウンのバイアスを推定した(MeDEStrand.calibrationCurve)。推定されたCpG密度バイアスに基づいて、各ウィンドウ内部のメチル化を、陽性および陰性のDNA鎖からの断片について補正した。補正された断片を有するウィンドウを対数変換し、絶対的なメチル化(MeDEStrand.binMethyl)を表すために、0~1の値にスケーリングした。各cfMeDIP-seq試料からの絶対的なメチル化レベルを、WIG様ファイル(すなわち、トラックラインのないWIGファイルフォーマット)としてエクスポートした。
インシリコのPBL枯渇の設計およびパフォーマンスの評価
疾患状況内のウィンドウを濃縮するために、PBLからのメチル化を「インシリコのPBL枯渇」と呼ばれるプロセスによって除去した。分析は、非がん特異的状況の中での適用を可能にするために、20人の健常なドナーの試料のコホートから得たPBL試料に限定された。インシリコのPBL枯渇のための本発明者らの戦略を以下のように実行した:
1.cfMeDIP-seqプロファイルにおける情報領域の選択において記載される各情報ウィンドウについて、健常なドナーのPBL試料にわたる絶対的なメチル化の中央値を計算する。
2.絶対的なメチル化の中央値<0.1の基準に基づいて、PBL枯渇ウィンドウを定義する。
3.PBL枯渇ウィンドウ内部のcfDNA試料の分析を制限する。
インシリコのPBL枯渇戦略のパフォーマンスを、訓練セットとして使用した健常なドナーのコホートから得た枯渇前後のPBL試料の絶対的なメチル化分布を検証セットとして使用したHNSCCコホートと比較することによって、評価した。
差次的メチル化分析
HNSCC関連の差次的メチル化領域(DMR)のロバストな検出を可能にするために、分析を、CAPP-seqによる血漿の検出可能なSNVを有するHNSCC患者に限定した(n=20/32)。差次的メチル化分析は、インシリコのPBL枯渇後の情報領域に限定された。cfMeDIP-seqプロファイルにおける情報領域の選択において前に記載されたように作製された、HNSCCおよび健常なドナーcfDNA試料からのビニングされた断片数の照合されたマトリックスを、DESeq2 RパッケージによるDMRの同定のために利用した。すべてのcfDNA試料にわたって<10カウントの領域を除去することによってプレフィルタリングを行った。条件(HNSCC対健常なドナー)として定義される単一因子を、差次的メチル化分析中のコントラストに使用した。簡潔には、サイズ因子および分散推定値に基づいて試料をスケーリングし、続いて負の二項一般線形モデルをフィッティングすることによって、差次的メチル化分析を行った。各ウィンドウについて、Wald検定によってHNSCCと健常なドナーの状態との間でP値を計算した。デフォルトのCookの距離カットオフを超える領域内のP値は、調整されたP値の計算から省かれた(Benjamini-Hochberg)。HNSCCのcfDNA試料の有意な過剰メチル化または低メチル化領域(過剰DMR/低DMR)は、調整されたP値<0.1を有するウィンドウとして定義される。
HNSCCのcfDNA過剰メチル化領域内のCpG特徴の濃縮
アイランド、ショア、shelf、およびopen sea(interCGI)などのCpG特徴は、AnnotationHub Rパッケージ(参照)(hg19_cpgsアノテーション)に定義されている。「annotatr」および「GenomicRanges」Rパッケージを利用する社内Rパッケージを使用して、PBL枯渇領域内の各過剰メチル化ウィンドウ(すなわち、「chr.start.end」)のID座標を、重複するCpG特徴でラベル付けした(図13)。
観察された特徴の重なり対ヌル分布の濃縮確率を判定するために、1000回のランダムサンプリングを行った。各サンプリングについて、CpGの同一の分布を維持しながら、過剰メチル化ウィンドウの数に基づいて、等しい数のビンを選択した。サンプリング全体の各CpG特徴について、観察された重複数を使用して、それぞれのヌル分布を生成し、続いてzスコアスケールに変換した。各CpG特徴について観察された過剰メチル化領域の重複もzスコア化変換し、ヌル分布から略式の統計を導出した。過剰メチル化ウィンドウから得た観察された重複の推定されるP値を、ヌル分布の観察された重複以上/以下の重複を有するランダムサンプリングの数として、計算した。
腫瘍がんゲノムアトラス(TCGA)からのがん特異的過剰メチル化シトシンによるcfDNA過剰メチル化領域のHNSCCの濃縮
乳房(BRCA)、結腸直腸(COAD)、頭頸部(HNSC)、前立腺(PRAD)、膵臓(PAAD)、肺アデノ(LUAD)、および肺扁平上皮(LUSC)からのすべての原発腫瘍の公的に利用可能なhm450kのプロファイル由来のファイル情報をTCGAからダウンロードした。本発明者らのHNSCCコホートの大部分が口腔の腫瘍を呈することに起因して、HNSC群からのファイルは、「口腔底部」に原発部位を有する患者に限定された(n=55)。同数のhm450kファイルを、残りのがんのタイプのそれぞれから、ならびに健常なPBLの別個のデータベース(GEOシリーズGSE67393)からランダムに選択した。ダウンロードされたファイルのマニフェストが、(図14)に提供される。
「腫瘍特異的」過剰メチル化シトシンを生成するために、limmaによる差次的メチル化分析を各々のがんのタイプについて行い、他のがんのタイプならびにPBL(すなわち、造影剤)と個々に比較した。所与のコントラストについて、残差分散および試料β値を組み込んだ各プローブ対象シトシンについて線形モデルをフィッティングし、次いで、コントラスト間の観察された差のP値を、経験的ベイズ平滑化によって計算する。個々の比較に対して所与のがんのタイプにおいてメチル化が上昇した過剰メチル化シトシンを、対数倍率変化0.25以上および調整P値(Benjamini-Hochberg)0.01未満によって定義した。個々のがんのタイプに固有の過剰メチル化シトシンを「腫瘍特異的」と命名した。LUSC、LUADおよびPAADの場合については、腫瘍特異的な過剰メチル化シトシンが全くまたはほとんど同定されなかったので(0、15、18)、その後の分析から省いた。cfMeDIP-seqライブラリとの比較のために、腫瘍特異的過剰メチル化シトシンからの塩基対の位置を、Design of In-silico PBL Depletion and Evaluation of Performanceに記載されているように、インシリコのPBL枯渇後の情報ウィンドウと重ねた。
TCGA由来の腫瘍特異的領域とのHNSCC cfDNA過剰メチル化領域についての重複の濃縮を、HNSCCのcfDNA過剰メチル化領域内のCpG特徴の濃縮に記載されているのと同じ方法を使用した10,000回のランダムサンプリングによって評価した。
cfMeDIP-seqによるctDNA検出の感度および特異度
32個のHNSCCおよび20個の健常なドナーのcfDNA試料のコホートからのcfMeDIP-seqライブラリについて、ctDNA検出を、健常なドナーのcfDNA試料にわたる最大RPKMの平均値よりも大きい個々のHNSCCのcfDNA試料のHNSCCのcfDNA過剰メチル化領域にわたるRPKMの平均値の観察に基づいて、定義した。この定義に基づくctDNA検出の感度および特異度を、受信者動作特性(ROC)曲線分析によって評価した。患者のサブセットにおけるctDNA放出の潜在的な欠如に起因するいかなる交絡的な結果も最小限に抑えるために、ROC曲線分析がまた、CAPP-seqによる検出可能なctDNAを有する32個のHNSCC cfDNA試料のうちの20個のみにおいて行われた。DMR分析によるctDNA検出の精度を評価するための交差検証を行った。手短に言えば、CAPP-Seq陽性患者および健常なドナーを、訓練セット(60%、n=24)および検証セット(40%、n=16)に無作為に割り当て、一方、両方のセットの間で同様のctDNAの存在量(CAPP-Seqによって決定される)を維持した。訓練セットの中のHNSCCと健常なドナーの試料との間の差次的メチル化分析によって、過剰DMRを同定した。これらの過剰DMR内のctDNA検出の感度を、AUROCの値を得るために検証セット内で前述のように評価した(図2C)。ランダムサンプリングを合計50回行った。
CAPP-seqおよびcfMeDIP-seqによって検出されたctDNAの断片の長さの分析
各HNSCC cfDNA CAPP-seqライブラリについて、明示されたSNV(すなわち、シングルトン、SCS、DCS)のすべてのサポート対リードおよび参照対立遺伝子を含む対のリードからの断片の長さの中央値を測定した。断片の長さの中央値が、1を超えるSNVの患者について報告された場合、各SNVからの断片の長さの中央値にわたる中央値を計算した。各HNSCCのcfDNA、cfMeDIP-seqライブラリについて、以前に決定されたHNSCCのcfDNA過剰メチル化領域にマッピングするすべての断片からの断片の長さの中央値を計算した。20人の健常なドナーのコホートの中にメチル化が相対的に存在しないため、各健常なドナーのcfMeDIP-seqライブラリの断片の長さを、いずれかの計算の前に照合した。両方のタイプのライブラリにおいて、断片の長さの分析は、1番目のピーク内のcfDNAに限定された(すなわち、<220塩基対)。
過剰DMR内の断片(100~150bpまたは100~220bp)の濃縮を以下のように計算した。以前に設計したPBL枯渇ウィンドウ内のランダムな300bpビンから、合計30回のサンプリングから、同一の数およびCpG密度分布で、予想されるカウントのヌル分布を生成した。各試料について観察されたカウントを、過剰DMRにわたるリードカウントに基づいて決定した。各試料について、平均観察数を平均予想数で割ることに基づいて、濃縮度を計算した。
教師付き階層クラスタリング
クラスタリングの前に、log2変換を可能にするために、0.1の擬似カウントをcfMeDIP-seqライブラリのすべてのRPKM値に追加した。値をユークリッド変換によってスケーリングし、ウォードの方法によってクラスタリングした。3つの別個のクラスターの任意の数を選択し(k=3)、メチル化クラスター1~3と命名し、その後の分析に使用した。
HNSCC患者の臨床転帰に対するctDNA検出および定量化のメトリック
ctDNA検出の潜在的な臨床的有用性を、3つのメトリックによって評価した。1)CAPP-seqによるSNVの検出、2)cfMeDIP-seqによる過剰メチル化領域における増加した平均RPKMの検出。比較分析のために、患者を以下の基準に基づいて層別化した。1)SNVの有無、2)メチル化クラスター1対メチル化クラスター2+3。患者の特徴を表1に記載する。
Figure 2023528533000030
Figure 2023528533000031
Figure 2023528533000032
cfMeDIP-seq分析によるctDNA由来メチル化の交差検証
ctDNA由来メチル化を同定するためのcfMeDIP-seqのロバスト性を評価するために、受信者動作特性(ROC)曲線分析を行った。ctDNA低/欠如に起因した交絡する結果を最小限に抑えるために、分析を、CAPP-seqによる検出可能なctDNAを有するHNSCC患者に限定した。患者および健常対照のcfMeDIP-seqプロファイルを訓練セット(HNSCC:n=12/20;健常対照:n=12/20)および試験セット(HNSCC:n=8/20;健常対照:n=8/20)に分割した。訓練セットおよび試験セットは、CAPP-Seq分析によって判定されるctDNAの存在量についてバランスを取るようにした。各反復で実行されたROC曲線分析を用いて、合計50回の分割を実行した。
TCGA分析によるHNSCCの予後領域の同定
一致したレガシーhm450kおよびRNA発現データを有するTCGAからのすべての利用可能なHNSCCの症例を選択した(n=520)。生存データをJianfangらから得た。hm450kのデータに関して、特定の領域のプローブID間で平均β値を計算することによって、前述のようにメチル化を300bp領域にまとめた。隣接する正常組織と比較してHNSCC原発腫瘍において過剰メチル化された領域を同定するために、独立したウィルコクソン検定を各領域について行った。隣接する正常組織と比較して、原発腫瘍において、調整されたp値<0.05(Holms法)ならびにlog倍数変化1以上である領域を、その後の分析のために選択した。予後と関連する過剰メチル化領域を同定するために、年齢、性別および臨床病期を考慮して、p値<0.05の領域を選択して、多変量Cox回帰を行った。生存分析は、HNSCC cfDNAコホート内で観察されたことを反映して、診断後5年の最大追跡期間に限定された。遺伝子発現の変化に関連する予後の領域をさらに同定するために、スピアマンの相関を、各領域のhm450k原発性腫瘍プロファイルについて、2Kbウィンドウ内の転写物の一致したRNA発現プロファイルに対して計算した。絶対的なRho値>0.3および偽発見率<0.05を有する領域を選択し、ZNF323/ZSCAN31、LINC01395、GATA2-AS1、OSR1、およびSTK3/MST2の発現に関連する5つの予後領域の最終的な同定をもたらした。TCGA患者プロファイルについては、複合メチル化スコア(CMS)を、5つすべての予後領域にわたるβ値の合計を計算することによって得た。cfMeDIP-seqプロファイルの場合、943個すべての過剰DMRにわたるRPKM値を合計1にスケーリングし、CMSを、5つすべての予後領域にわたるこれらのスケーリングされたRPKM値の合計を計算することによって得た。
cfMeDIP-seqによる治療後の血漿試料の長期モニタリング
30/32の患者についてcfMeDIP-seqライブラリの生成に成功した(図17A~図17D)。残りの2人の患者については、不十分な材料が血漿から単離され、および/または質のメトリックを満たさなかった。治療後のcfMeDIP-seqライブラリのctDNA定量化を前述のように行い、差次的メチル化分析によって同定された過剰メチル化領域にわたるRPKMの平均値を計算した。解釈を容易にするために、処理前および処理後の両方のcfMeDIP-seqライブラリを、一致したCAPP-Seqプロファイルによって計算された平均MAFに対する線形回帰に基づいて、パーセントのDNAの値に変換した。残留疾患の高い信頼性の検出を達成するために、0.2%の最小ctDNA画分が、治療後の試料で必要であり、これはすべての健常対照にわたって観察されたRPKMの平均値の最大値に対応した。
結果および考察
局在化したHNSCCにおけるセルフリーDNAのマルチモーダルプロファイリング
限局性がんの状況においてctDNAを特性評価するためのマルチモーダルプロファイリングの能力を調べるために、本発明者らは、末梢血試料を連続した時点で収集した前向き観察試験に、32人のHNSCC患者を募集した(図9A、表1)。すべての患者は手術で治療され、サブセットはアジュバント放射線療法(n=14)または化学放射線療法(n=11)を受けた。追跡調査の中央値が43.2ヶ月で、9/32の患者(28%)が再発をした(保険統計2年の無再発生存率:88%)。
大部分の患者は、体細胞組織のゲノム/エピゲノムランドスケープを変化させ、前がん病変に寄与することが十分に記載されている重度の喫煙歴を示したので、本発明者らはまた、以前に肺がんスクリーニングプログラムに登録された20人のリスクが適合する健常なドナーからの血液試料を分析した34~37。血漿由来のセルフリーDNAおよびPBL由来のゲノムDNA(gDNA)を血液から共単離し、定量および分析に供した(補足図1A)。健常対照と比較して、転移性疾患における総血漿のセルフリーDNAの有意に上昇したレベルを実証した他の研究とは対照的に、HNSCCコホートと健常なドナーとの間に有意差は認められなかった38~41(補足図1B)。
患者および健常対照からのセルフリーDNAおよびPBLのgDNAのマルチモーダルプロファイリングを行った(図1)。同じ試料を変異およびメチロームプロファイリングの両方に供することによって、本発明者らは、ctDNAの腫瘍ナイーブ検出および特性評価へのそれらの寄与を評価することができた。変異およびメチル化を、それぞれCAncer Personalized Profiling by deep Sequencing(CAPP-Seq)およびcell-free Methylated DNA ImmunoPrecipitationおよびハイスループットシーケンシング(cfMeDIP-seq)を使用して独立してプロファイリングした。さらに、配列決定されたセルフリーDNA断片の長さを得るために、ペアードエンドシーケンシングを両方の方法論に利用した。
治療前の血漿からの変異ベースのctDNAの腫瘍ナイーブ検出
本発明者らは、最初に、一致した腫瘍試料内での確認なしでの変異ベースのctDNA検出の信頼性を改善するためのアプローチを評価した。最近の研究は、TP53などのctDNA検出のために頻繁に標的化される遺伝子が、クローンで拡大されたPBLに由来する変異を有し得ることを示している。さらに、ctDNAは腫瘍の遺伝的特徴およびエピジェネティックの特徴の両方を含むので、本発明者らは、患者のセルフリーDNAにおける両方の特徴の直交解析がctDNA検出の信頼性を高め得ると推論した。したがって、低い存在量のctDNAの腫瘍ナイーブ検出を高い信頼性で達成するために、cfDNAおよび一致したPBLの両方について、CAPP-SeqおよびcfMeDIP-seqによってそれぞれ変異およびメチル化を独立してプロファイリングした。
腫瘍から得る事前の知識なしにHPV陰性HNSCCにおけるctDNA検出の感度を評価するために、本発明者らはまず、ベースライン血漿試料における変異の存在量を測定した(図2A)。CAPP-Seqを、HNSCC関連変異の数を最大化するように設計された配列決定パネルを用いて行った(表3および図10)。本発明者らはまた、バックグラウンド塩基置換エラーを除去するために、確立されたエラー抑制方法論を採用した。
Figure 2023528533000033
Figure 2023528533000034
Figure 2023528533000035
Figure 2023528533000036
Figure 2023528533000037
Figure 2023528533000038
Figure 2023528533000039
Figure 2023528533000040
Figure 2023528533000041
Figure 2023528533000042
Figure 2023528533000043
Figure 2023528533000044
Figure 2023528533000045
Figure 2023528533000046
Figure 2023528533000047
Figure 2023528533000048
Figure 2023528533000049
Figure 2023528533000050
10~30ngのインプットDNAを利用する、CAPP-Seqによる診断時のHNSCC患者および健常なドナーからの血漿およびPBL試料をプロファイリングした。低い存在量でのctDNAの高感度検出を達成するために、本発明者らは、HNSCCにおける検出された変異の数を最大化するように最適化されたCAPP-Seqセレクタを適用した(表2および図10)。本発明者らは、統合デジタルエラー抑制(iDES)によって分析感度をさらに改善し、カスタム分子バーコードを組み込み、健常なドナー血漿試料(方法)内で同定されたバックグラウンド塩基置換エラーを除去した。
Figure 2023528533000051
Figure 2023528533000052
Figure 2023528533000053
血漿プロファイリングおよび可能性のある生殖系列変異の除去に基づいて候補の体細胞一塩基変異体(SNV)を選択した後、本発明者らは、適合したPBLプロファイルとの比較によってクローン造血(CH)による潜在的偽陽性を特性評価した。同定可能な候補のSNVを有する24人の患者のうち、10人が、高度に相関する変異対立遺伝子画分(MAF)を有する一致したPBLプロファイル内で同一のSNVを示した(R=0.94、p=1.392e-07、図2B)。PIK3CAを除いて、これらのSNVを有する遺伝子は各患者に固有であった(図2C)。DNMT3A、TET2、およびASXL1などのCHによって一般に影響を受ける遺伝子はCAPP-Seqセレクタ内に含まれなかったので、一致したcfDNAおよびPBL試料内の患者固有のSNVの本発明者らの知見は、遺伝子レベルフィルタリングよりもこのアプローチの利点をさらに強調する。4人の患者から得た血漿試料は、CHに由来するSNVについて厳密に陽性であり(図2D)、一致したPBLプロファイリングが、低い存在量のctDNAの偽陽性検出を大幅に最小化し得ることを示唆している。
CHを潜在的に反映する候補のSNVを除去した後、ctDNAを20人の患者の血漿内で検出した(中央値[範囲]:患者1人あたり3[1~10]のSNV)。これらのSNVの妥当性を評価するために、本発明者らは、結果を、The Cancer Genome Atlas(TCGA)によって公表された279個のHNSCC腫瘍からの全エクソーム解析データと比較して45、TP53(65%対72%)、PIK3CA(20%対21%)、FAT1(15%対23%)およびNOTCH1(10%対19%)を含む高頻度変異遺伝子における類似性を観察した(図2E)。興味深いことに、2人の患者は、これらの遺伝子の中で見られない単一のSNVを示し(GRIN3AおよびMYC、図11)、ctDNAの検出感度を高めるための未知/非ドライバ効果の遺伝子プロファイリングの付加的な有用性を実証した。
SNVの平均MAFに基づいてctDNA存在量を計算すると、ctDNAレベルは0.14%~4.83%の範囲であった(図2F)。この検出下限は、約0.14%と推定される、腫瘍ナイーブCAPP-Seq分析を利用する他の者によって以前に記載されたものと類似している。検出不能なctDNAを有する患者を含めて、本発明者らのHNSCCコホートにわたるctDNA存在量の中央値は0.49%であり、CAPP-Seqによって限局性NSCLCにおいて観察されたものと類似していた。
ベースライン血漿からのメチル化ベースのctDNAの腫瘍ナイーブ検出
次に、本発明者らは、HNSCCおよび健常対照試料におけるctDNA関連メチル化パターンを定義しようとした。CAPP-Seqの結果は、PBLから生じる偽陽性変異の影響を示したので、本発明者らは、偽陽性ctDNA関連メチル化の減少が、PBL由来のDNAメチル化シグナルの除去によって達成され得ると推論した。したがって、本発明者らは、セルフリーDNAメチル化シグナルへの寄与を抑制するために、HNSCCおよび健常対照試料からの一致したPBL MeDIP-seqプロファイルを使用し(図3A)、一致したPBLの分析がまた、メチル化ベースのctDNA検出も可能にし得るかどうかを評価した(図3A)。治療前のHNSCCおよび健常なドナーの血漿ならびにPBLを、5~10ngのインプットDNAを利用し、cfMeDIP-seqによって、プロファイリングした。前に記載されたように、メチル化の存在量を、100万あたりのキロベース(RPKM)(方法)のリードに対して正規化されたリードカウントで、染色体1~22にわたる重複しない300bpウィンドウ(n=9,603,454ウィンドウ)で定義した。
メチル化プルダウンのために利用される抗5mC抗体は、CpGアイランドを含む増加するCpG密度でDNA断片に優先的に結合するので、本発明者らは、この相互作用を最初に特性評価して、cfMeDIP-seqデータ内で高度に表される可能性が高い領域を同定した。本発明者らはまた、MeDIP-seqをHNSCC細胞株FaDuに適用して、がん由来メチル化DNA断片の優先的な結合を評価した。様々な数のCpGを有するウィンドウにわたってDNA断片プルダウン存在量(RPKMの中央値)を比較すると、本発明者らは、PBLおよびFaDuの両方について最大8CpG以上の濃縮の増加を観察した(図12Aおよび図12B)。FaDuは、300bpウィンドウあたり8CpG以上で、PBLと比較してより大きな濃縮を示した。この結果は、FaDuを含むがん細胞におけるCpGアイランドの過剰メチル化の確立された現象と一致している。これらの観察に基づいて、本発明者らは、8以上のCpG(n=702,488)を有するウィンドウがctDNA検出に最も情報があり得、そのためその後のすべての分析に利用されたと判定した。
限局性がんを有する患者の場合、血漿のセルフリーDNAの大部分はPBLに由来する。したがって、本発明者らは、セルフリーDNAシグナルへのこの寄与を生物情報学的に抑制するためにPBL MeDIP-seqプロファイルを利用しようとした。本発明者らは、HNSCCおよび健常なドナーcfDNAから作製されたcfMeDIP-seqプロファイル内の各ウィンドウについてのRPKMの値を、FaDu(1×1の比較)、対になっていないPBL(1×51の比較)または対になったPBL(1×1の比較)から作製されたMeDIP-seqプロファイルと比較した。血漿のセルフリーDNAの主な寄与因子であるPBLによれば、ゲノムワイドのメチル化プロファイルは、血漿のセルフリーDNAと、対になったまたは対になっていないPBLとの間で高度に相関していた(それぞれ最頻値R=0.92およびR=0.91)。これらの相関の強さは、血漿のcfDNAに対するPBLの既知のサイズ外の寄与を反映している可能性が高い。対照的に、血漿のセルフリーDNAとFaDuとの間の相関はより弱かった(最頻値R=0.78)(図3B)。
優先的プルダウンを考慮しながら、PBLにわたるメチル化の減少の閾値を選択するために、本発明者らは、MeDEStrand Rパッケージ(方法)によるロジスティック回帰モデリングに基づいて、PBL cfMeDIP-seqプロファイルを絶対的なメチル化レベル(0~1)にスケーリングおよび正規化した。本発明者らは、健常なドナーのPBLにわたって0.1未満の絶対的なメチル化の中央値を示す99,997個のウィンドウを選択した。これらのウィンドウを、除外されたHNSCC PBLに適用したとき、本発明者らは、利用された健常なドナーのPBLの絶対的なメチル化分布と同様の絶対的なメチル化分布を観察し(図3B)、このアプローチの一般化の可能性を実証した。同様に、これらのウィンドウのいずれも個々には、健常なドナーのPBLと比較してHNSCCのPBLにわたって有意に高いメチル化を示さず(図3Cおよび図12B)、ctDNA検出を混乱させ得るHNSCC特異的PBLメチル化のあらゆる供給源を制限した。換言すれば、これらの結果は、対照および局所的に限定されたHPV陰性HNSCC血漿の両方におけるcfDNAメチル化の主な源がPBLに由来し、PBL由来のメチル化の生物情報学的除去がctDNAの定量化を混乱させたシグナルを制限し得ることを確認する。
治療前のメチル化ベースのctDNAの腫瘍ナイーブ検出
HNSCCコホート内の一般的なctDNA由来の過剰メチル化領域を同定するために、本発明者らは、HNSCC患者と、CAPP-Seqによる検出可能なctDNA(n=20)とを、健常なドナーと比較する、差次的メチル化分析を行った。PBLにおけるメチル化のために枯渇される99,994個の300bpウィンドウを利用して、本発明者らは、20人のHNSCC患者をCAPP-Seq-検出可能なctDNAと20人の健常対照と比較することによって、ctDNA由来の差次的メチル化領域(DMR)を同定した。総じて、本発明者らは、HNSCC試料全体で997個の差次的メチル化領域(DMR)(過剰メチル化:941、低メチル化:56)を同定した(図3C)。過剰メチル化領域(過剰DMR)の半分程度が互いに直接隣接していることが見出され、過剰メチル化のブロックは最大1800塩基対の長さに及んだ(図13A)。これらのデータは、同定された過剰DMR内のCpGアイランドが存在することを示唆している。逆に、隣接する低メチル化領域(低DMR)は観察されなかった。300bpの過剰DMRのうち、47.5%は、長さが1800bpにまで及ぶ過剰メチル化シグナルの連続したブロックに存在し(図13A)、典型的には長さが300~3000bpに及ぶCpGアイランドを示した。実際、CpGアイランドは、過剰DMRについて有意に濃縮されていた(図3E)。対照的に、低DMRについてはCpGアイランドが有意に枯渇した(図13B)。
これらの過剰DMRが実際にCpGアイランドについて濃縮されているかどうかを判定するために、本発明者らは次に、置換分析(方法)によってCpGアイランド、ショア、shelf、およびopen seaについて、過剰DMRの濃縮を評価した。予想されるように、CpGアイランドの有意な濃縮、ならびにショアおよびopen seaの有意な枯渇が、過剰DMR内で観察された(図3E)。対照的に、低DMRは、がん全体で頻繁に観察されるCpG-スパース領域の低メチル化に従って、open seaが有意に濃縮され、CpGアイランドが枯渇していた(補足図5B)。
最後に、特定の領域のメチル化は、cfMeDIP-seqを使用して以前に記載されたように起源の組織を区別し得るので、本発明者らはまた、過剰DMRがHNSCCまたは他のがんに特異的な領域を含むかどうかを調べた。腫瘍特異的メチル化領域を同定するために、本発明者らは、TCGA(方法)によってもたらされる原発腫瘍から生成されたHumanMethylation450K(hm450k)のデータを利用した。浸潤性乳癌(BRCA)、結腸腺癌(COAD)、肺扁平上皮癌(LUSC)、前立腺腺癌(PRAD)、HNSCC、膵臓腺癌(PAAD)、およびPBL由来の原発腫瘍を比較して、本発明者らは、BRCA、COAD、PRAD、およびHNSCC(方法)に特異的な十分な過剰メチル化CpG(≧50)を同定した(図14)。予想通り、本発明者らは、HNSC特異的過剰メチル化CpGと重複する血漿由来DMRの有意な濃縮、ならびにBRCA、COADおよびPRAD特異的過剰メチル化CpGにわたる重複の有意な枯渇を観察し(図3F)、このことは、過剰DMRが、様々な他のがんのタイプと比較した場合にHNSCC起源に特異的な領域を含むことを示唆している。
変異ベースとメチル化ベースのctDNA検出は特に一致している
いっそう多くの研究が、血漿のセルフリーDNAの健常な源と比較して、減少した断片の長さに関連するctDNAを記載しており、ロバストな腫瘍ナイーブ検出のためのさらなるメトリックが得られている。標的化された配列決定が、低下した断片の長さでctDNAを検出することが以前に示されているので、本発明者らはまず、本発明者らのCAPP-Seqプロファイルを利用して、本発明者らがHNSCC患者において同様の傾向を観察し得るかどうかを判定した。患者ごとに同定された各SNV(図2E)について、SNV対立遺伝子ならびに重複する参照対立遺伝子を含む断片の長さの中央値を測定した。患者の試料の中で複数のSNVが同定された場合については、すべてのSNVおよびそれらの参照対立遺伝子にわたる中央値を使用した。以前の知見によれば、本発明者らは、患者全体で健常なセルフリーDNAと比較してctDNA断片のサイズの一貫した減少を観察した(中央値[範囲]Δ=-17.5[1~58]bp)(図4A)。これらの変異の平均MAFと断片の長さとの間に有意な関連はなかった(図15A)。
亜硫酸水素塩ベースのDNAメチル化アプローチとは異なり、cfMeDIP-seqはDNAの分解を引き起こさず、したがって元の断片サイズ分布を維持する。これは、DNAメチル化および断片の長さを同時にマッピングする新規な機会を提供する。各患者について以前に同定された血漿由来過剰DMR内の断片の長さの分布を評価した。これらの領域が本発明者らの健常なドナーにわたる低いメチル化を有するという性質のために、ドナーにわたるDNA断片を、比較のために組み合わせた。変異に基づく分析と同様に、本発明者らは、グループ化された健常対照と比較して、19/20のCAPP-Seq陽性患者からの断片の長さの減少を観察した(中央値[範囲]Δ=-7[1~21]bp)(図4B)。これは、おそらく過剰DMR内のセルフリーDNA断片の健常な組織による部分的な寄与のために、変異ベースの分析と比較して断片の長さの減少が小さいことを示した。この考えを裏付けて、最も短い過剰DMR断片を有する試料は、より高いメチル化ctDNA存在量(ピアソンr=-0.64、p=0.002)を示した(図15B)。小さい断片(100bp~150bp)対大きい断片(151bp~220bp)の比を本発明者らの過剰DMR、ctDNAを濃縮するための以前に記載されたアプローチ、のために使用したとき、本発明者らは、大部分のCAPP-Seq陽性HNSCC試料にわたってctDNAの濃縮の同様の傾向を観察した(中央値[範囲]=28[-8~63]%)(図4C)。
本発明者らのHNSCCコホートにおいて同定された血漿のセルフリーDNA過剰DMRがこれらの小さな断片(100~150bp)内の個体にわたりどのように異なり得るかを評価するために、本発明者らは最初に階層的クラスタリングを行った。4つの主要なクラスターがConsensusClusterPlus Rパッケージを利用して出現し、それぞれが過剰DMRにわたって異なるレベルのメチル化を有した(図4Eおよび図16C)。同様に、3つのクラスターは、CAPP-Seq(図16D)によって判定されるような別個のctDNA存在量によって定義され、これは、過剰DMRメチル化の平均と変異に基づくctDNAの存在量との間の潜在的な関係を示唆している。
次に、本発明者らは、断片の長さがCAPP-SeqおよびcfMeDIP-seqの両方によって同定されたctDNA分子間で一致するかどうかを調査し、本発明者らのマルチモーダルアプローチに対する検証のさらなる層を潜在的にもたらす。バックグラウンドDNA断片がcfMeDIP-seqプロファイル内のctDNAの計算された断片の長さを混同させる可能性を最小限に抑えるために、本発明者らは、過剰DMR全体でメチル化レベルの中央値を超える患者(n=10人のHNSCC患者)に分析を限定した。驚くべきことに、完全に異なるゲノム領域がこれらの2つのプロファイリング手法を用いて表されているにもかかわらず、ctDNA断片の長さは、各患者についての対となったCAPP-SeqプロファイルとcfMeDIP-seqプロファイルとの間で非常に一致していた(図4C)(ピアソンr=0.86、p=0.0016)(CAPP-Seq:43個の異なる変異、cfMeDIP-seq:941個の過剰DMR)。
過剰DMRメチル化レベルと変異ベースのctDNA存在量との間の関係をさらに特性評価するために、本発明者らは、941の過剰DMRにわたるRPKMの平均値を、各患者についてCAPP-Seqによって判定されたMAFの平均値と比較した。メチル化クラスター間で観察された傾向と同様に、本発明者らは有意な正の相関(ピアソン相関、R=0.85、p=5e-10)を観察した(図4F)。cfMeDIP-seqによるこれらの過剰DMR内のctDNA検出の感度を評価するために、本発明者らは、本発明者らのHNSCCコホートと健常なドナーとの間のRPKMの平均値を比較した。CAPP-Seq陽性患者(n=20)については、ctDNA検出は特に一致しており(AUC=0.998)、CAPP-Seq陰性患者(n=12)の組み込み時にパフォーマンスがわずかに低下した(AUC=0.944)(図4G)。CAPP-Seq陽性患者および健常なドナーにわたる交差検証(n=50サンプリング)の結果、0.984のAUC中央値がもたらされ(図16A)、本明細書に開示されるアプローチのロバスト性が実証された。
これらの観察に基づいて、本発明者らは、短縮された長さのセルフリーDNA断片に分析を限定することによって、cfMeDIP-seqプロファイル内でctDNAを濃縮し得るかどうかを評価した。本発明者らは、非メチル化ベースのアプローチを使用してctDNAを濃縮する同様の方法が記載されているので、小さい(100~150bp)断片からなる過剰DMR内のセルフリーDNA断片の割合を評価した。実際、これにより、CAPP-Seq陽性HNSCC試料の大部分(中央値[範囲]=28[-8~63]%)にわたってctDNA濃縮がもたらされたが、健常対照のいずれについてももたらされなかった(図4D)。したがって、セルフリーDNA断片のインシリコのサイズ選択は、cfMeDIP-seqライブラリ内のctDNAを濃縮し、腫瘍ナイーブマルチモーダルctDNA分析に寄与し得る。
限局性非転移性がんを有する患者において、診断時のCAPP-SeqによるctDNAの検出は、予後不良に関連することが以前に記載されている。同様に、SHOX2およびSEPT9のメチル化によって評価されるctDNAのレベルは、HNSCCにおける予後不良と関連している。したがって、本発明者らは、診断時のCAPP-SeqおよびcfMeDIP-seqによるctDNAの検出または定量化が本発明者らのHNSCCコホート内の臨床転帰と関連するかどうかを尋ねた。実際、CAPP-Seq(すなわち、CAPP-Seq陽性対CAPP-Seq陰性)によるctDNAの検出(ハザード比[HR]=7.6、ログランクp=0.026;補足図8D)、ならびに本発明者らが以前に同定した過剰DMR内のメチル化の増加(すなわち、メチル化クラスター1+2+3対メチル化クラスター4)(HR=4.51、p=0.038;図4G)は、生存期間の短縮と相関していた。この知見と一致して、過剰DMRにわたる平均RPKMは、がんのステージと相関した(補足図8E)。
次に、本発明者らは、変異またはメチル化に基づくプロファイリングのいずれかによって同定されたctDNAの断片の長さの中央値を比較した。バックグラウンドDNA断片がcfMeDIP-seqプロファイル内のctDNAの計算された断片の長さを混同させる可能性を最小限に抑えるために、本発明者らは、階層的クラスタリングによって定義されるように高いctDNA存在量を有する患者を選択した(すなわち、メチル化クラスター1および2、図4D、補足図8A~B)。このアプローチでは、完全に異なるゲノム領域がこれらの2つのプロファイリング手法を用いて表されているにもかかわらず、ctDNA断片の長さは、各患者について対となったCAPP-SeqプロファイルとcfMeDIP-seqプロファイルとの間で特に一致していた(R=0.83、p=0.0016)(図4H)。さらに、すべての長さの断片を用いた本発明者らの分析と同様に、本発明者らは、CAPP-Seq(R=-0.79、p=0.0038)による小さい断片比とctDNA断片の長さとの間で同じ関係を観察した(図4I)。
これらの結果は、CAPP-SeqおよびcfMeDIP-seqによって検出されるctDNAから観察される断片の長さの同様の減少が、ゲノム領域によるのではなく、腫瘍の固有の特性の結果であり得ること、およびより短い断片の長さを利用することがctDNAのより特異的な同定に寄与し得ることを示唆している。
予後の判定のためのマルチモーダルctDNA検出の適用
腫瘍ナイーブマルチモーダルctDNA分析の潜在的な臨床応用を評価するために、本発明者らは、HNSCCコホートにおいてctDNAを臨床転帰と比較した。断片の長さの情報に基づくcfMeDIP-seqプロファイルは、一致したCAPP-SeqプロファイルにおいてMAFと強く関連し(ピアソンr=0.85、p=3×10-9)、941個の過剰DMR内のメチル化強度が実際にctDNAの存在量を反映していることを示唆した(図5C)。重要なことに、交差検証分析により、ctDNAを検出するためのこれらの過剰DMRのロバスト性が確認された(図16C)。変異およびメチル化に基づく方法の両方によってベースラインの血漿において検出されたctDNAを有する患者(n=19)は、検出可能なctDNAを有していない患者(n=8/13)と比較した場合、進行した疾患(すなわち、ステージIII-IVA)を有する可能性が有意に高く(n=18/19)(フィッシャーの正確検定p=0.028)、劇的に不良な全生存率を示した(ハザード比[HR]=7.55、95%信頼区間[CI]=[0.95~59.94]、ログランクp=0.025)(図5G)。比較すると、ステージのみでは、より不良な全生存(HR=2.59、95%CI=[0.32~20.46]、ログランクp=0.35)の患者を予測することができず(図16D)、マルチモーダルctDNAプロファイリングの潜在的な臨床的有用性がさらに実証された。
がんドライバの遺伝子発現および結果として生じる機能活性に対するDNAメチル化の既知の効果のために、本発明者らは、特定の遺伝子座におけるctDNAメチル化パターンがctDNA存在量とは無関係に予後の有意性を有し得ると推論した。本発明者らの以前に同定された過剰DMRが、ctDNA存在量とは無関係に予後と関連する特定の領域を含むかどうかを評価するために、本発明者らは、入手可能なすべてのHNSCC患者(n=520)についてTCGAによって得られるDNAメチル化、RNA発現および臨床転帰データを調べた(図5C)。最初に、本発明者らは、TCGA hm450kメチル化アレイデータから異なる300bpウィンドウ内に含まれるすべてのCpGにわたるβの平均値を計算した。分析を、血漿由来過剰DMRと重複するプローブhm450k領域(n=764/941)に限定して、本発明者らが隣接する正常組織(n=50)と比較して原発腫瘍(n=520)の483個の過剰メチル化領域を同定した(ウィルコクソン検定、FDR<0.05、log2FC>1)。本発明者らは、HNSCCならびにTWIST1およびONECUT2で以前に評価されたSEPT9およびSHOX2を含む、市販のメチル化ベースのctDNA診断試験によってプロファイリングされた遺伝子内のCpGの近くに、これらの過剰メチル化領域のいくつかが重複しているかまたは位置していることを観察した(図17A)。これらの結果から、本発明者らの血漿由来過剰DMRの潜在的な臨床的関連性を支持するさらなる証拠が得られる。
本発明者らのHNSCCコホートおよびTCGAのHNSC hm450kのプロファイルによって共通して保持されるこれらの過剰メチル化領域の潜在的な臨床的有用性をさらに調べるために、本発明者らは、利用可能なhm450kのプロファイルおよび疾患特異的生存(DSS)転帰であるすべてのTCGAのHNSCC患者にわたって単変量コックス比例ハザード回帰を行った(n=493/520)。本発明者らは、DSSと有意に関連する33の領域を同定した(p<0.05)。腫瘍形成において機能的役割を有する可能性が高い予後領域をさらに選択するために、本発明者らは、各領域(n=33)のメチル化レベルを2kb内の周囲の遺伝子転写物の発現と比較した。次に、本発明者らは、TCGAのHNSCCコホートを使用して、(1)多変量Cox回帰における予後および(2)隣接遺伝子転写物の発現に関連する483個のDMRのサブセットを同定した。5つの領域が両方の基準を満たすように同定され、各領域のメチル化が増加すると、ZNF323/ZSCAN31、LINC01391、およびGATA2-AS1のより高い発現がもたらされ(図5G、図17A~図17C、またSTK3/MST2およびOSR1のそれぞれのより低い発現がもたらされた(図5H)(図5D)。メチル化の結果としての発現の減少および増加に関連する領域は、それぞれプロモーターまたは第1のエクソン/イントロンおよび遺伝子本体内に存在することが見出された。本発明者らは、これらの5つの領域から複合メチル化スコア(CMS)を構築し(表6)、このスコアに従ってTCGAのHNSCCコホートを層別化した(図5E)。より高いCMSは、劣った生存転帰と有意に関連していた(HR=1.67、95%CI=[1.25,2.21]、ログランクp=3.4×10-4)。
最後に、本発明者らは、ctDNAに適用した場合にCMSかた同様の予後情報が得られるかどうかも評価した。ctDNAを濃縮するために、cfMeDIP-seqライブラリの分析を、上記のように100~150bpの長さの断片に限定した(図4E)。5つの推定予後マーカーによって得られるctDNAメチル化レベルの相対的な寄与を説明するために、本発明者らは、これらの領域からのcfMeDIP-seqのRPKMの値を941個の過剰DMR全体に正規化した。これは、より高いCMSがより不良な生存とわずかに関連するという同様の傾向をもたらし(ログランクp=0.1;HR=3.06)(図5F)、このことは、TCGAから同定されたこれらの推定予後領域のメチル化の増加がまた、cfMeDIP-seqプロファイル内で情報があり得ることを示唆している。さらに、これらの結果は、バイオマーカー発見のために、血漿のセルフリーDNAメチロームプロファイリングを既存のマルチオミックのがんデータベースと組み合わせてどのように活用できるかを強調している。
cfMeDIP-seqによる最終治療後の疾患の監視
cfMeDIP-seqがHNSCC患者において高感度かつ定量的なctDNA検出を達成したので、本発明者らは、CAPP-seqと同様に、cfMeDIP-seqもctDNA存在量の治療関連変化をモニタリングすることができる可能性があると推論した。治療後のcfMeDIP-seqプロファイル内のctDNAのパーセントを定量するために、本発明者らは、以前に同定された血漿由来の過剰DMR(n=941)にわたって平均RPKMの線形変換を適用し、ctDNAをさらに濃縮するために100~150bpの間の断片のサイズを制限した。すべての健常対照にわたって観察されたRPKMの平均値の最大値に基づいて、0.2%のctDNAの検出閾値を計算した。1つまたは複数の利用可能な治療後試料のCAPP-Seq陽性のHNSCC患者(n=20)については、10ngのインプットcfDNAを利用してcfMeDIP-seqを行った。
治療全体にわたるctDNA存在量の変化を測定すると、本発明者らは、完全クリアランス(CC)、部分クリアランス(PC;90%を超える低下)またはクリアランスなし(NC)を示す様々な動態を観察した(図6A 補足図10)。18人の適格患者のうち、5人(28%)がクリアランスなしを示した(図6B)。クリアランスなしの患者は、完全または部分的クリアランスの患者と比較して、疾患の再発を経験する可能性が高かった(HR=8.73、95%CI=[1.5、50.92]、ログランクp=0.0046)(図6C)。興味深いことに、診断時と比較して、最後の試料採取時にctDNA存在量がより多いすべての患者が、疾患の再発を示した。さらに、この群内で疾患の再発が実証されなかった唯一の患者が、追跡不能になったが、原因不明で治療後1年以内に死亡した。cfMeDIP-seqによる検出不能な処置後ctDNAを有する13名の患者については、9名が無病のままであり、追跡調査の中央値は44.4ヶ月であった(最低値=12.2、最大値=58.7)。他の4人の患者のうち、一人は所属リンパ節内に持続性疾患を有し、他の人は最後の採取後3.5~7.7ヶ月(中央値7.4ヶ月)で再発を経験した。注目すべきことに、検出不能な治療後ctDNAを有する患者間のこれらの再発は、最後の収集後に検出可能な治療後ctDNA(中央値[範囲]:3.0[1.7~5.2]ヶ月)を有する患者間の4つの再発と比較してかなり遅延した。まとめると、これらの結果は、cfMeDIP-seqによる血漿のセルフリーDNAメチロームプロファイリングを使用して、根治的治療に対する応答を評価し、急速な再発のリスクが高い患者を同定することができることを実証している。
考察
臨床現場におけるctDNAの広範な実施は、患者全体におよび腫瘍物質の非存在下で適用することができる方法によって加速され得る。記載される研究において、本発明者らは、低ctDNAのHNSCC患者の探索コホート内でのctDNAの腫瘍ナイーブ検出のためのマルチモーダルゲノムワイドセルフリーDNAプロファイリング技術の能力を評価した。本発明者らは、一致したPBLの取り込みが、両方の変異(すなわち、CAPP-Seq)ならびにDNAメチル化(すなわち、cfMeDIP-seq)を使用してctDNA検出を改善することを示す。さらに、検出可能および検出不可能なctDNAを有する患者を層別化するために、CAPP-Seqを利用することによって、本発明者らは、ctDNA由来のメチル化パターンのロバストな同定を達成した。本発明者らは、腫瘍起源(すなわち、断片の長さの短縮)を反映する血漿のセルフリーDNAの生物物理学的特性が分子異常および検出プラットフォームにわたって保存されていることを初めて示した。腫瘍ナイーブctDNA検出および定量化は複数の臨床用途を見出し、ctDNAの存在量およびメチル化パターンの予後関連を調査する。
腫瘍ナイーブctDNA検出は、現在、低いctDNA存在量のためにいくつかの制限に遭遇する。最近の研究では、ctDNAの偽陽性検出の主な原因であるクローン造血に由来する変異を同定するために、対になったPBLおよび/または健常対照血漿がプロファイリングされている。しかし、直交メトリックの組み込みは、精度および臨床適用性をさらに改善することができる。ここで、本発明者らは、低いctDNA存在量を有するHNSCC患者のコホート内での腫瘍ナイーブctDNA検出のためのマルチモーダルゲノムワイドセルフリーDNAプロファイリング技術の能力を評価した。本発明者らは、変異ベースおよびメチル化ベースのプロファイリング方法によって検出されたctDNAメトリック(存在量および断片の長さ)間の高度な一致を実証した。さらに、本発明者らは、腫瘍ナイーブマルチモーダルctDNAプロファイリングが、ctDNA存在量とは無関係の推定予後バイオマーカーを同定することによって、ならびに連続試料中のctDNA存在量をモニタリングすることによって値を提示し得ることを示した。
ctDNAの腫瘍ナイーブ検出は、研究および臨床の両方の状況において多くの実用的な利点を有する。最近の研究では、感度を改善するために、初期疾患における低い存在量で同定されたctDNA由来領域の検証のために一致した腫瘍プロファイリングが利用されている。しかし、これらのアプローチの1つの制限は、腫瘍のサンプリング不均一性に起因して失われる情報領域の数であり、これは、以前にサンプリングされていないサブクローンに由来する処置後ctDNAに適用された場合にさらに悪化し得る。さらに、これらの腫瘍の情報に基づく検出方法の臨床的利点は、非侵襲性液体生検の主な強度の1つを回避して、生検によって容易に入手可能ながんに限定される。腫瘍ナイーブマルチモーダルプロファイリング戦略を利用することによって、本発明者らは、腫瘍の情報に基づく方法の欠点なしに早期がんにおいて同様の結果を達成した。
これは、限局性がん患者のコホートからのctDNAの包括的検出のために変異およびメチル化プロファイリングを利用する最初の研究である。このマルチモーダルプロファイリングアプローチを他のがんのタイプおよび疾患状況に拡張することは、液体生検の継続的な開発にとって重要である。さらに、HNSCCにおける多数のctDNA研究が、変異、メチル化またはHPVプロファイリングに基づく検出方法を利用して記載されているが、本発明者らは、これまでに知られている標的(すなわち、TP53変異またはSEPT9/SHOX2メチル化)を同定するゲノムワイド変異/メチル化プロファイリング法の最初の適用を、より少ない/未調査の標的に加えて記載した。
ctDNAの腫瘍ナイーブ検出は、研究および臨床の両方の状況において多くの実用的な利点を有している。腫瘍変異プロファイリングは、低い存在量でctDNA検出のための患者特異的マーカーを同定することができるが、そのような個別化アプローチは、十分な変異の負荷を有するがんのタイプから得る高純度腫瘍試料に依存する。個別化アッセイ設計のための変異プロファイリングは、費用および時間がかかる可能性があり、また、原発腫瘍内または転移性クローンにわたるゲノム不均一性の説明をとなることがまれである。さらに、腫瘍組織へのアクセスに依存するctDNA検出方法は、非侵襲性液体生検の重要な利点を減少させる。独立したセルフリーDNA特性を統合することにより、本発明者らは、腫瘍の情報に基づく方法の欠点なしに、初期段階のがんにおける高感度のctDNAの検出を達成した。
本発明者らの分析では、本発明者らは、cfMeDIP-seqを使用してctDNA由来のメチル化パターンを同定するために、CAPP-Seqによって、検出可能なctDNAを有する患者を選択した。このアプローチにより、本発明者らのコホートにおける血漿のセルフリーDNAの腫瘍由来の性質のさらなる検証がなされた。ctDNAメチル化パターンは、ctDNA変異と同様の方法でctDNAの存在量を定量することができた。さらに、メチル化パターンは、腫瘍起源を明らかにし、推定予後および動的バイオマーカーを同定した。CAPP-SeqとcfMeDIP-seqとの組み合わせは、低い存在量ctDNAの詳細な分子的な特性評価を可能にした。変異に基づくctDNA定量化は、血漿中のHNSCC特異的過剰DMRの発見に寄与し、その一部はctDNA存在量を調整した後でも予後であることが確認された。したがって、変異およびメチル化の同時プロファイリングは、定量的、組織特異的、および予後のctDNAバイオマーカーを明らかにすることによって、互いに補完することができる。さらに、メチロームプロファイリングは、再発性またはクローン性変異がほとんどないがんのタイプにおいて特に有用であることを判明し得る。
以前の研究と同様に、本発明者らはまた、変異およびメチル化ベースのアプローチの両方を使用して、健常なドナーのセルフリーDNAと比較しながら、ctDNA断片の長さの減少を観察した。一貫して平均的な約166~167bpである健常なセルフリーDNAとは異なり、患者間のctDNAの長さは非常に可変であり得る。ctDNA断片の長さに影響を及ぼす因子としては、位置依存的断片化49、転移性疾患対非転移性疾患73、ならびに健常なセルフリーDNA断片化に関与する様々な細胞内/細胞外DNaseの調節不全動態74が挙げられ得る。興味深いことに、本発明者らは、両方の技術が異なる領域および腫瘍由来の異常を探査しているにもかかわらず、CAPP-SeqおよびcfMeDIP-seqによって同定されたctDNAの断片の長さ間の高い一致を、適格な患者について観察した。これらの説得力のあるデータで、がん患者における血漿のセルフリーDNA断片化の関連性および再現性に関するさらなる証拠が得られる。
本発明者らは、CAPP-Seqによる検出可能なctDNAまたはcfMeDIP-seqによる上昇したctDNA存在量が、本発明者らのHNSCCコホート内の予後不良と関連することを観察した。これらの結果は、メチル化によるctDNAの検出56、ならびにコピー数収差による存在量の増加75またはHPV検出76が高いリスクの患者を同定した以前のHNSCC ctDNA研究に従っている。腫瘍病期との不完全な関連があり、腫瘍生物学の他の測定されていない特徴がctDNA存在量に寄与し得ることを示唆している。
本発明者らの知る限りでは、ctDNA検出/存在量とは無関係に、おそらく部分的には一般的に使用されるctDNA検出方法の制限のために、HNSCCのセルフリーDNAにおける予後領域を以前に同定した研究はない。本発明者らは、セルフリーDNAメチロームプロファイルが、TCGAデータと併せて、HNSCCにおける新規予後メチル化バイオマーカーを同定する発見ツールとして役立ち得ることを実証した。5つのDMRから構成される複合体メチル化スコアは、メチル化検出プラットフォーム(hm450kおよびcfMeDIP-seq)およびバイオスペシメンタイプ(腫瘍組織および血漿のセルフリーDNA)にわたって一貫した予後関連性を実証した。本発明者らの知見を検証するためには将来より大きなコホートが必要であるが、この研究は、cfMeDIP-seqによるメチル化領域のゲノムワイドな同定が、新規の予後バイオマーカーの発見を可能にし得ることを示している。
cfMeDIP-seqのパフォーマンスを、疾患の予後と関連して評価した。治療後約0.2%超のctDNAのストリンジェントな閾値を検出可能な疾患として適用することにより、本発明者らは9人の患者のうち4人について疾患の再発を予測することができた。検出可能なctDNAを治療後に有することができなかった再発した(n=4)または持続性疾患を有した(n=1)残りの5人の患者について、本発明者らは典型的には再発までの時間がより長いことを観察し、これらの時点でのctDNAの画分がcfMeDIP-seqの検出の下限を下回っていた可能性があることを示唆した。腫瘍ナイーブ疾患の監視のためにcfMeDIP-seqを利用するその後の研究では、治療後のより頻繁な血漿の収集が、これらの限界に対処するのに役立ち得る。
本発明者らは、限局性疾患およびHNSCCにおけるマルチモーダルプロファイリングの潜在的な臨床的有用性を実証しているので、これらの方法は、様々ながんのタイプを有する患者のための将来のバイオマーカー発見および最終的には臨床的有用性に寄与する。この研究は、複数の顕著な貢献をしている。第1に、セルフリーDNA変異、メチル化および断片の長さの分析を組み合わせていることである。さらに、本発明者らは、HNSCC患者およびリスクが一致する健常対照の両方からの血漿試料および対にされたPBLを、体系的にプロファイリングした。これらの分析は、ctDNAの検出および特性評価のためのマルチモーダルプロファイリングの最適な取り扱いに関する重要な洞察を明らかにした。例えば、寄与するメチル化シグナルを白血球から除去し、断片の長さの特性を使用して腫瘍由来のメチル化を濃縮する本発明者らの独自のアプローチは、将来の研究にとって有用なものであることが判明するであろう。
結論として、本発明者らは、ctDNAの腫瘍ナイーブCAPP-Seqプロファイリングが、cfMeDIP-seqによるctDNA由来のメチル化の高い信頼性の同定を可能にすることを実証する。cfMeDIP-seqによるエピジェネティックプロファイリングの強度を利用して、本発明者らはさらに、これらのctDNA由来メチル化領域が腫瘍の起源、予後、および治療の反応のマーカーとしての可能性を実証することを示す。本発明者らがHNSCCにおけるcfMeDIP-seqによるctDNA検出の改善された感度について記載したいくつかのアプローチ、例えばPBL枯渇ウィンドウおよび短い断片への分析の制限を組み込むことがまた、臨床的利益のために、様々な他の限局性がんに適用され得る。開示されたフレームワークは、腫瘍組織の利用可能性が制限される他の臨床状況に広く適用可能である。
本発明の好ましい実施形態を本明細書で説明したが、本発明の精神または添付の特許請求の範囲から逸脱することなく、本発明に変更を加えることができることは当業者には理解されよう。以下の参考文献にあるものを含む、本明細書に開示されるすべての文書は、参照により組み込まれる。
本発明の好ましい実施形態を本明細書で説明したが、本発明の精神または添付の特許請求の範囲から逸脱することなく、本発明に変更を加えることができることは当業者には理解されよう。以下の参考文献にあるものを含む、本明細書に開示されるすべての文書は、参照により組み込まれる。
本発明は一態様において、下記を提供する。
[項目1]
対象のがん細胞から循環腫瘍デオキシリボ核酸(ctDNA)が存在することを検出する方法であって、
(a)前記対象からセルフリーデオキシリボ核酸(DNA)の試料を得る工程、
(b)前記試料をライブラリ調製に供して、前記セルフリーメチル化DNAのその後の配列決定を可能にする工程、
(c)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNAを捕捉する工程、
(d)前記捕捉されたセルフリーメチル化DNAを配列決定する工程、
(e)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用いて、前記捕捉されたセルフリーメチル化DNAの前記配列をコンピュータ処理する工程、および
(f)前記捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来のセルフリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来のDNAの前記存在を同定する工程を含み、
(d)、(f)および(g)の少なくとも1つにおいて、前記対象のセルフリーメチル化DNAは、断片の長さのメトリックに従って亜集団に限定される、方法。
[項目2]
第1の量のフィラーDNAを前記試料に添加することをさらに含み、前記フィラーDNAの少なくとも一部がメチル化され、次いでさらに前記試料を変性させていてもよい、項目1に記載の方法。
[項目3]
前記断片の長さのメトリックが断片の長さである、項目1に記載の方法。
[項目4]
前記対象のセルフリーメチル化DNAが、<170塩基対(bp)、<165bp、<160bp、<155bp、<150bp、<145bp、<140bp、<135bp、<130bp、<125bp、<120bp、<115bp、<110bp、<105bp、または<100bpの長さを有する断片に限定される、項目2に記載の方法。
[項目5]
前記対象のセルフリーメチル化DNAが、約100~約150bp、110~140bpまたは120~130bpの長さを有する断片に限定される、項目2に記載の方法。
[項目6]
前記断片の長さのメトリックが、前記対象のセルフリーメチル化DNAの前記断片の長さの分布である、項目1に記載の方法。
[項目7]
前記対象のセルフリーメチル化DNAが、長さに基づいて下位50、45、40、35、30、25、20、15または10パーセンタイル内の断片に限定される、項目5に記載の方法。
[項目8]
前記対象のセルフリーメチル化DNAが、差次的メチル化領域(DMR)内の断片にさらに限定される、項目1~6のいずれか一項に記載の方法。
[項目9]
前記対象のセルフリーメチル化DNAがさらに制限される、前記捕捉する工程の間である、項目1~7のいずれか一項に記載の方法。
[項目10]
前記対象のセルフリーメチル化DNAがさらに制限される、前記比較する工程の間である、項目1~7のいずれか一項に記載の方法。
[項目11]
前記限定することが、前記同定することの間である、項目1~7のいずれか一項に記載の方法。
[項目12]
前記試料が前記対象の血液または血漿に由来する、項目1~10のいずれか一項に記載の方法。
[項目13]
(f)が統計的分類器を使用することを含む、項目1~11のいずれか一項に記載の方法。
[項目14]
前記分類器が機械学習によって導出される、項目12に記載の方法。
[項目15]
健常な個体およびがんの個体由来の前記対照のセルフリーメチル化DNA配列は、健常な個体とがんの個体との間の差次的メチル化領域(DMR)のデータベースに含まれる、項目1~14のいずれか一項に記載の方法。
[項目16]
健常な個体およびがんの個体由来の前記対照のセルフリーメチル化DNA配列が、セルフリーDNAに由来するDNAにおいて健常な個体とがんの個体との間として差次的にメチル化されているその対照のセルフリーメチル化DNA配列に限定される、項目1~15のいずれか一項に記載の方法。
[項目17]
前記対照のセルフリーメチル化DNA配列が、血漿に由来するDNAにおいて健常な個体とがんの個体との間として差次的にメチル化される、項目16に記載の方法。
[項目18]
前記試料が、100ng、75ngまたは50ng未満のセルフリーDNAを有する、項目1~17のいずれか一項に記載の方法。
[項目19]
前記フィラーDNAの第1の量は、少なくとも約5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、または100%のメチル化フィラーDNAを含み、残りは非メチル化フィラーDNAであり、好ましくは5%~50%、10%~40%、または15%~30%のメチル化フィラーDNAである、項目1~18のいずれか一項に記載の方法。
[項目20]
前記フィラーDNAの第1の量が、20ng~100ng、好ましくは30ng~100ng、より好ましくは50ng~100ngである、項目1~18のいずれか一項に記載の方法。
[項目21]
前記試料から得た前記セルフリーDNAおよび前記第1の量のフィラーDNAは、合わせて少なくとも50ngの総DNA、好ましくは少なくとも100ngの総DNAを含む、項目1~20のいずれか一項に記載の方法。
[項目22]
前記フィラーDNAが、50bp~800bpの長さ、好ましくは100bp~600bpの長さ、より好ましくは200bp~600bpの長さである、項目1~21のいずれか一項に記載の方法。
[項目23]
前記フィラーDNAが二本鎖である、項目1~22のいずれか一項に記載の方法。
[項目24]
前記フィラーDNAがジャンクDNAである、項目1~11のいずれか一項に記載の方法。
[項目25]
前記フィラーDNAが内因性または外因性DNAである、項目1~12のいずれか一項に記載の方法。
[項目26]
前記フィラーDNAが非ヒトDNA、好ましくはλDNAである、項目25に記載の方法。
[項目27]
前記フィラーDNAがヒトDNAとアライメントしていない、項目1~26のいずれか一項に記載の方法。
[項目28]
前記結合剤が、メチル-CpG結合ドメインを含むタンパク質である、項目1~27のいずれか一項に記載の方法。
[項目29]
前記タンパク質がMBD2タンパク質である、項目1~28のいずれか一項に記載の方法。
[項目30]
(d)が、抗体を使用して前記セルフリーメチル化DNAを免疫沈降させることを含む、項目1~29のいずれか一項に記載の方法。
[項目31]
免疫沈降のために少なくとも0.05μg、好ましくは少なくとも0.16μgの前記抗体を前記試料に添加することを含む、項目30に記載の方法。
[項目32]
前記抗体が5-MeC抗体である、項目30に記載の方法。
[項目33]
前記免疫沈降反応を確認するために、(c)の後に第2の量の対照DNAを前記試料に添加することをさらに含む、項目30に記載の方法。
[項目34]
セルフリーメチル化DNAの前記捕捉を確認するために、(c)の後に第2の量の対照DNAを前記試料に添加することをさらに含む、項目1~32のいずれか一項に記載の方法。
[項目35]
がん細胞由来のDNAが前記存在することを同定することは、がん細胞の起源の組織を同定することをさらに含む、項目1~34のいずれか一項に記載の方法。
[項目36]
前記がん細胞の起源の組織を同定することは、がんのサブタイプを同定することをさらに含む、項目35に記載の方法。
[項目37]
前記がんのサブタイプが、ステージ、組織学、遺伝子発現パターン、コピー数異常、再編成、または点変異状態に基づいて前記がんを区別する、項目36に記載の方法。
[項目38]
(f)がゲノムワイドに行われる、項目1~37のいずれか一項に記載の方法。
[項目39]
(f)がゲノムワイドから特定の調節領域に制限される、項目1~37のいずれか一項に記載の方法。
[項目40]
前記調節領域が、FANTOM5エンハンサー、CpGアイランド、CpGショア、CpG Shelf、または前述物の任意の組み合わせである、項目39に記載の方法。
[項目41]
工程(f)および(g)がコンピュータプロセッサによって実行される、項目1~40のいずれか一項に記載の方法。
[項目42]
前記がんが、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍からなる群から選択される、項目1~41のいずれか一項に記載の方法。
[項目43]
前記がんが頭頸部扁平上皮癌である、項目1~41のいずれか一項に記載の方法。
[項目44]
前記がんの前記検出に使用するための、項目1~43のいずれか一項に記載の方法。
[項目45]
前記がんの治療のモニタリングに使用するための、項目1~43のいずれか一項に記載の方法。
[項目46]
対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するための方法であって、
(a)(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルからなる群から選択される少なくとも1つのプロファイルを生成するために前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、および
(b)前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ナノグラム(ng)/ミリリットル(ml)未満の前記複数の核酸分子を含む、処理する工程を含む、方法。
[項目47]
前記セルフリー核酸試料が10ng/ml未満の前記複数の核酸分子を含む、項目46に記載の方法。
[項目48]
前記セルフリー核酸試料が5ng/ml未満の前記複数の核酸分子を含む、項目46に記載の方法。
[項目49]
前記セルフリー核酸試料が1ng/ml未満の前記複数の核酸分子を含む、項目46に記載の方法。
[項目50]
(a)に前記供する工程が、(i)、(ii)および(iii)からなる群から選択される少なくとも2つのプロファイルを生成する、項目46に記載の方法。
[項目51]
前記少なくとも2つのプロファイルが、前記メチル化プロファイルおよび前記断片の長さプロファイルを含む、項目50に記載の方法。
[項目52]
前記少なくとも2つのプロファイルが、前記変異プロファイルおよび前記断片の長さプロファイルを含む、項目50に記載の方法。
[項目53]
前記少なくとも2つのプロファイルが、前記メチル化プロファイルおよび前記変異プロファイルを含む、項目50に記載の方法。
[項目54]
(a)を前記供する工程が、前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを生成する、項目46に記載の方法。
[項目55]
対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有するリスクがあるかどうかを判定する方法であって、
(a)複数の核酸分子を含む前記セルフリー核酸試料を得る工程、
(b)前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リードを生成する工程、
(c)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、および
(d)前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを使用する工程を含む、方法。
[項目56]
前記疾患ががんを含む、項目46~55のいずれか一項に記載の方法。
[項目57]
前記がんが、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍、扁平上皮癌、および頭頸部扁平上皮癌からなる群から選択される前記がんからなる群から選択される、項目56に記載の方法。
[項目58]
前記がんが扁平上皮癌である、項目57に記載の方法。
[項目59]
前記がんが頭頸部扁平上皮癌である、項目58に記載の方法。
[項目60]
前記複数のセルフリー核酸分子が循環腫瘍核酸分子を含む、項目46~56のいずれか一項に記載の方法。
[項目61]
前記循環腫瘍核酸が循環腫瘍DNAを含む、項目60に記載の方法。
[項目62]
前記循環腫瘍核酸が循環腫瘍RNAを含む、項目60に記載の方法。
[項目63]
前記メチル化プロファイルが、複数の差次的メチル化領域(DMR)を含む、項目46~62のいずれかに記載の方法。
[項目64]
前記複数のDMRがctDNA由来である、項目63に記載の方法。
[項目65]
末梢血白血球に由来する複数のDMRが前記メチル化プロファイルから除去される、項目63に記載の方法。
[項目66]
前記複数のDMRが、正常で健常な対象からの対応するゲノム領域と比較して低メチル化レベルを有する少なくとも約56のゲノム領域を含む、項目63に記載の方法。
[項目67]
前記複数のDMRが、正常で健常な対象からの対応するゲノム領域と比較して、過剰メチル化レベルを有する少なくとも約941のゲノム領域を含む、項目54に記載の方法。
[項目68]
DMRが少なくとも約300bpのサイズを含む、項目63に記載の方法。
[項目69]
DMRが、少なくとも約100bp~少なくとも約200bpのサイズを含む、項目68に記載の方法。
[項目70]
DMRが、少なくとも約100bp~少なくとも約150bpのサイズを含む、項目68に記載の方法。
[項目71]
DMRが少なくとも8のCpGゲノムアイランドを含む、項目63に記載の方法。
[項目72]
前記正常で健常な対象が、前記対象と同じリスク因子のセットを含む、項目66または67のいずれかに記載の方法。
[項目73]
前記変異プロファイルが、ミスセンス変異体、ナンセンス変異体、欠失変異体、挿入変異体、重複変異体、逆位変異体、フレームシフト変異体、または反復伸長変異体を含む、項目45~72のいずれかに記載の方法。
[項目74]
複数の末梢血白血球から得られたゲノムDNA試料に存在する任意の変異体であって、前記複数の末梢血白血球が前記対象から得られ、前記変異プロファイルから除去される、項目45~72のいずれかに記載の方法。
[項目75]
クローン造血に由来するいずれかの変異体が前記変異プロファイルから除去される、項目45~72のいずれかに記載の方法。
[項目76]
前記変異プロファイルが、遺伝子DNMT3A、TET2、またはASXL1の変異体を含まない、項目75に記載の方法。
[項目77]
前記変異プロファイルが標準的がんドライバ遺伝子を含まない、項目75に記載の方法。
[項目78]
前記変異プロファイルが非標準的がんドライバ遺伝子を含み、前記非標準的遺伝子がGRIN3AまたはMYCである、項目75に記載の方法。
[項目79]
前記断片の長さプロファイルが、少なくとも約80bp~170bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む、項目46~78のいずれかに記載の方法。
[項目80]
前記断片の長さプロファイルが、少なくとも約100bp~150bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む、項目46~78のいずれかに記載の方法。
[項目81]
前記循環腫瘍核酸分子が濃縮されている、項目79または80のいずれかに記載の方法。
[項目82]
前記セルフリー核酸試料をフィラーDNA分子と混合してDNA混合物を生じることをさらに含む、項目46~81のいずれかに記載の方法。
[項目83]
前記フィラーDNA分子が約50bp~800bpの長さを含む、項目82に記載の方法。
[項目84]
前記フィラーDNA分子が約100bp~600bpの長さを含む、項目82に記載の方法。
[項目85]
前記フィラーDNA分子が、少なくとも約5%のメチル化フィラーDNA分子を含む、項目82に記載の方法。
[項目86]
前記フィラーDNA分子が、少なくとも約20%のメチル化フィラーDNAを含む、項目82に記載の方法。
[項目87]
前記フィラーDNA分子が、少なくとも約30%のメチル化フィラーDNAを含む、項目82に記載の方法。
[項目88]
前記フィラーDNA分子が、少なくとも約50%のメチル化フィラーDNAを含む、項目82に記載の方法。
[項目89]
前記DNA混合物を、メチル化ヌクレオチドに結合するように構成された結合剤とインキュベートして濃縮試料を生成することをさらに含む、項目46~88のいずれかに記載の方法。
[項目90]
前記結合剤が、メチル-CpG結合ドメインを含むタンパク質を含む、項目89に記載の方法。
[項目91]
前記タンパク質がMBD2タンパク質である、項目89に記載の方法。
[項目92]
前記結合剤が抗体を含む、項目89に記載の方法。
[項目93]
前記抗体が5-MeC抗体である、項目89に記載の方法。
[項目94]
前記抗体が5-ヒドロキシメチルシトシン抗体である、項目89に記載の方法。
[項目95]
前記配列決定が亜硫酸水素塩配列決定を含まない、項目46~94のいずれかに記載の方法。
[項目96]
前記セルフリー核酸試料が血液試料を含む、項目46~94のいずれかに記載の方法。
[項目97]
前記血液試料が血漿試料を含む、項目96に記載の方法。
[項目98]
がん組織の起源を検出することをさらに含む、項目46~97のいずれかに記載の方法。
[項目99]
前記対象の生存率の予後を含む報告を生成することをさらに含む、項目46~97のいずれかに記載の方法。
[項目100]
前記対象に治療を与えることをさらに含む、項目46~97のいずれかに記載の方法。
[項目101]
前記疾患の治療に続いて、前記治療が有効であるかどうかを示す第2の報告を与えることをさらに含む、項目46~97のいずれかに記載の方法。
[項目102]
対象が状態を有するか、または状態を有するリスクがあるかどうかを判定するための方法であって、
(a)前記対象からの試料の少なくとも一部から得たセルフリー核酸分子をアッセイする工程、
(b)表5に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工程、および
(c)少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、前記表5に列挙されたDMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと比較する工程を含む、方法。
[項目103]
前記セルフリー核酸分子がctDNAを含む、項目102に記載の方法。
[項目104]
前記配列決定分析を実施することを含み、前記配列決定分析がcell-free Methylated DNA ImmunoPrecipitation(cfMeDIP)配列決定を含む、項目102に記載の方法。
[項目105]
前記検出する工程が、表5に列挙される6つ以上、10以上、15以上、20以上、30以上、40以上、50以上、60以上、70以上、80以上、90以上、または100以上のDMRに含まれる前記核酸分子の少なくとも一部のメチル化レベルを測定することを含む、項目102に記載の方法。
[項目106]
対象が疾患の治療を受けた後により高い生存率を有するかどうかを判定する方法であって、
(a)前記対象からの試料の少なくとも一部から得たセルフリー核酸分子をアッセイする工程、
(b)表6に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工程、および
(c)少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、前記表6に列挙されたDMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと処理する工程を含む、方法。
[項目107]
前記セルフリー核酸分子がctDNAを含む、項目106に記載の方法。
[項目108]
前記検出する工程が、複合体メチル化スコア(CMS)を提示することを含む、項目106に記載の方法。
[項目109]
前記CMSが、表6に列挙されたDMRのβ値の合計を含む、項目107に記載の方法。
[項目110]
CMSがより高いことが、前記対象の生存率がより低いことを示す、項目107に記載の方法。
[項目111]
前記CMSがctDNAの存在量に依存しない、項目107に記載の方法。
[項目112]
前記疾患が扁平上皮癌である、項目102~111のいずれかに記載の方法。
[項目113]
前記がんが頭頸部扁平上皮癌である、項目112に記載の方法。
[項目114]
少なくとも約80bp~170bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することをさらに含む、項目102~113のいずれか一項に記載の方法。
[項目115]
対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するためのシステムであって、
(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルのうちの少なくとも1つのプロファイルを生成するために前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、および
前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ng/ml未満の前記複数の核酸分子を含む、処理する工程
を含むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサを含む、システム。
[項目116]
対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有するリスクがあるかどうかを判定するシステムであって、
(a)複数の核酸分子を含む前記セルフリー核酸試料を得る工程、
(b)前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リードを生成する工程、
(c)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、および
(d)前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを使用する工程を含むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサを含む、システム。
本発明の好ましい実施形態を本明細書で説明したが、本発明の精神または添付の特許請求の範囲から逸脱することなく、本発明に変更を加えることができることは当業者には理解されよう。以下の参考文献にあるものを含む、本明細書に開示されるすべての文書は、参照により組み込まれる。
本発明は一態様において、下記を提供する。
[項目1]
対象のがん細胞から循環腫瘍デオキシリボ核酸(ctDNA)が存在することを検出する方法であって、
(a)前記対象からセルフリーデオキシリボ核酸(DNA)の試料を得る工程、
(b)前記試料をライブラリ調製に供して、前記セルフリーメチル化DNAのその後の配列決定を可能にする工程、
(c)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNAを捕捉する工程、
(d)前記捕捉されたセルフリーメチル化DNAを配列決定する工程、
(e)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用いて、前記捕捉されたセルフリーメチル化DNAの前記配列をコンピュータ処理する工程、および
(f)前記捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来のセルフリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来のDNAの前記存在を同定する工程を含み、
(d)、(f)および(g)の少なくとも1つにおいて、前記対象のセルフリーメチル化DNAは、断片の長さのメトリックに従って亜集団に限定される、方法。
[項目2]
第1の量のフィラーDNAを前記試料に添加することをさらに含み、前記フィラーDNAの少なくとも一部がメチル化され、次いでさらに前記試料を変性させていてもよい、項目1に記載の方法。
[項目3]
前記断片の長さのメトリックが断片の長さである、項目1に記載の方法。
[項目4]
前記対象のセルフリーメチル化DNAが、<170塩基対(bp)、<165bp、<160bp、<155bp、<150bp、<145bp、<140bp、<135bp、<130bp、<125bp、<120bp、<115bp、<110bp、<105bp、または<100bpの長さを有する断片に限定される、項目2に記載の方法。
[項目5]
前記対象のセルフリーメチル化DNAが、約100~約150bp、110~140bpまたは120~130bpの長さを有する断片に限定される、項目2に記載の方法。
[項目6]
前記断片の長さのメトリックが、前記対象のセルフリーメチル化DNAの前記断片の長さの分布である、項目1に記載の方法。
[項目7]
前記対象のセルフリーメチル化DNAが、長さに基づいて下位50、45、40、35、30、25、20、15または10パーセンタイル内の断片に限定される、項目5に記載の方法。
[項目8]
前記対象のセルフリーメチル化DNAが、差次的メチル化領域(DMR)内の断片にさらに限定される、項目1~6のいずれか一項に記載の方法。
[項目9]
前記対象のセルフリーメチル化DNAがさらに制限される、前記捕捉する工程の間である、項目1~7のいずれか一項に記載の方法。
[項目10]
前記対象のセルフリーメチル化DNAがさらに制限される、前記比較する工程の間である、項目1~7のいずれか一項に記載の方法。
[項目11]
前記限定することが、前記同定することの間である、項目1~7のいずれか一項に記載の方法。
[項目12]
前記試料が前記対象の血液または血漿に由来する、項目1~10のいずれか一項に記載の方法。
[項目13]
(f)が統計的分類器を使用することを含む、項目1~11のいずれか一項に記載の方法。
[項目14]
前記分類器が機械学習によって導出される、項目12に記載の方法。
[項目15]
健常な個体およびがんの個体由来の前記対照のセルフリーメチル化DNA配列は、健常な個体とがんの個体との間の差次的メチル化領域(DMR)のデータベースに含まれる、項目1~14のいずれか一項に記載の方法。
[項目16]
健常な個体およびがんの個体由来の前記対照のセルフリーメチル化DNA配列が、セルフリーDNAに由来するDNAにおいて健常な個体とがんの個体との間として差次的にメチル化されているその対照のセルフリーメチル化DNA配列に限定される、項目1~15のいずれか一項に記載の方法。
[項目17]
前記対照のセルフリーメチル化DNA配列が、血漿に由来するDNAにおいて健常な個体とがんの個体との間として差次的にメチル化される、項目16に記載の方法。
[項目18]
前記試料が、100ng、75ngまたは50ng未満のセルフリーDNAを有する、項目1~17のいずれか一項に記載の方法。
[項目19]
前記フィラーDNAの第1の量は、少なくとも約5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、または100%のメチル化フィラーDNAを含み、残りは非メチル化フィラーDNAであり、好ましくは5%~50%、10%~40%、または15%~30%のメチル化フィラーDNAである、項目1~18のいずれか一項に記載の方法。
[項目20]
前記フィラーDNAの第1の量が、20ng~100ng、好ましくは30ng~100ng、より好ましくは50ng~100ngである、項目1~18のいずれか一項に記載の方法。
[項目21]
前記試料から得た前記セルフリーDNAおよび前記第1の量のフィラーDNAは、合わせて少なくとも50ngの総DNA、好ましくは少なくとも100ngの総DNAを含む、項目1~20のいずれか一項に記載の方法。
[項目22]
前記フィラーDNAが、50bp~800bpの長さ、好ましくは100bp~600bpの長さ、より好ましくは200bp~600bpの長さである、項目1~21のいずれか一項に記載の方法。
[項目23]
前記フィラーDNAが二本鎖である、項目1~22のいずれか一項に記載の方法。
[項目24]
前記フィラーDNAがジャンクDNAである、項目1~11のいずれか一項に記載の方法。
[項目25]
前記フィラーDNAが内因性または外因性DNAである、項目1~12のいずれか一項に記載の方法。
[項目26]
前記フィラーDNAが非ヒトDNA、好ましくはλDNAである、項目25に記載の方法。
[項目27]
前記フィラーDNAがヒトDNAとアライメントしていない、項目1~26のいずれか一項に記載の方法。
[項目28]
前記結合剤が、メチル-CpG結合ドメインを含むタンパク質である、項目1~27のいずれか一項に記載の方法。
[項目29]
前記タンパク質がMBD2タンパク質である、項目1~28のいずれか一項に記載の方法。
[項目30]
(d)が、抗体を使用して前記セルフリーメチル化DNAを免疫沈降させることを含む、項目1~29のいずれか一項に記載の方法。
[項目31]
免疫沈降のために少なくとも0.05μg、好ましくは少なくとも0.16μgの前記抗体を前記試料に添加することを含む、項目30に記載の方法。
[項目32]
前記抗体が5-MeC抗体である、項目30に記載の方法。
[項目33]
前記免疫沈降反応を確認するために、(c)の後に第2の量の対照DNAを前記試料に添加することをさらに含む、項目30に記載の方法。
[項目34]
セルフリーメチル化DNAの前記捕捉を確認するために、(c)の後に第2の量の対照DNAを前記試料に添加することをさらに含む、項目1~32のいずれか一項に記載の方法。
[項目35]
がん細胞由来のDNAが前記存在することを同定することは、がん細胞の起源の組織を同定することをさらに含む、項目1~34のいずれか一項に記載の方法。
[項目36]
前記がん細胞の起源の組織を同定することは、がんのサブタイプを同定することをさらに含む、項目35に記載の方法。
[項目37]
前記がんのサブタイプが、ステージ、組織学、遺伝子発現パターン、コピー数異常、再編成、または点変異状態に基づいて前記がんを区別する、項目36に記載の方法。
[項目38]
(f)がゲノムワイドに行われる、項目1~37のいずれか一項に記載の方法。
[項目39]
(f)がゲノムワイドから特定の調節領域に制限される、項目1~37のいずれか一項に記載の方法。
[項目40]
前記調節領域が、FANTOM5エンハンサー、CpGアイランド、CpGショア、CpG Shelf、または前述物の任意の組み合わせである、項目39に記載の方法。
[項目41]
工程(f)および(g)がコンピュータプロセッサによって実行される、項目1~40のいずれか一項に記載の方法。
[項目42]
前記がんが、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍からなる群から選択される、項目1~41のいずれか一項に記載の方法。
[項目43]
前記がんが頭頸部扁平上皮癌である、項目1~41のいずれか一項に記載の方法。
[項目44]
前記がんの前記検出に使用するための、項目1~43のいずれか一項に記載の方法。
[項目45]
前記がんの治療のモニタリングに使用するための、項目1~43のいずれか一項に記載の方法。
[項目46]
対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するための方法であって、
(a)(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルからなる群から選択される少なくとも1つのプロファイルを生成するために前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、および
(b)前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ナノグラム(ng)/ミリリットル(ml)未満の前記複数の核酸分子を含む、処理する工程を含む、方法。
[項目47]
前記セルフリー核酸試料が10ng/ml未満の前記複数の核酸分子を含む、項目46に記載の方法。
[項目48]
前記セルフリー核酸試料が5ng/ml未満の前記複数の核酸分子を含む、項目46に記載の方法。
[項目49]
前記セルフリー核酸試料が1ng/ml未満の前記複数の核酸分子を含む、項目46に記載の方法。
[項目50]
(a)に前記供する工程が、(i)、(ii)および(iii)からなる群から選択される少なくとも2つのプロファイルを生成する、項目46に記載の方法。
[項目51]
前記少なくとも2つのプロファイルが、前記メチル化プロファイルおよび前記断片の長さプロファイルを含む、項目50に記載の方法。
[項目52]
前記少なくとも2つのプロファイルが、前記変異プロファイルおよび前記断片の長さプロファイルを含む、項目50に記載の方法。
[項目53]
前記少なくとも2つのプロファイルが、前記メチル化プロファイルおよび前記変異プロファイルを含む、項目50に記載の方法。
[項目54]
(a)を前記供する工程が、前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを生成する、項目46に記載の方法。
[項目55]
対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有するリスクがあるかどうかを判定する方法であって、
(a)複数の核酸分子を含む前記セルフリー核酸試料を得る工程、
(b)前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リードを生成する工程、
(c)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、および
(d)前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを使用する工程を含む、方法。
[項目56]
前記疾患ががんを含む、項目46~55のいずれか一項に記載の方法。
[項目57]
前記がんが、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍、扁平上皮癌、および頭頸部扁平上皮癌からなる群から選択される前記がんからなる群から選択される、項目56に記載の方法。
[項目58]
前記がんが扁平上皮癌である、項目57に記載の方法。
[項目59]
前記がんが頭頸部扁平上皮癌である、項目58に記載の方法。
[項目60]
前記複数のセルフリー核酸分子が循環腫瘍核酸分子を含む、項目46~56のいずれか一項に記載の方法。
[項目61]
前記循環腫瘍核酸が循環腫瘍DNAを含む、項目60に記載の方法。
[項目62]
前記循環腫瘍核酸が循環腫瘍RNAを含む、項目60に記載の方法。
[項目63]
前記メチル化プロファイルが、複数の差次的メチル化領域(DMR)を含む、項目46~62のいずれかに記載の方法。
[項目64]
前記複数のDMRがctDNA由来である、項目63に記載の方法。
[項目65]
末梢血白血球に由来する複数のDMRが前記メチル化プロファイルから除去される、項目63に記載の方法。
[項目66]
前記複数のDMRが、正常で健常な対象からの対応するゲノム領域と比較して低メチル化レベルを有する少なくとも約56のゲノム領域を含む、項目63に記載の方法。
[項目67]
前記複数のDMRが、正常で健常な対象からの対応するゲノム領域と比較して、過剰メチル化レベルを有する少なくとも約941のゲノム領域を含む、項目54に記載の方法。
[項目68]
DMRが少なくとも約300bpのサイズを含む、項目63に記載の方法。
[項目69]
DMRが、少なくとも約100bp~少なくとも約200bpのサイズを含む、項目68に記載の方法。
[項目70]
DMRが、少なくとも約100bp~少なくとも約150bpのサイズを含む、項目68に記載の方法。
[項目71]
DMRが少なくとも8のCpGゲノムアイランドを含む、項目63に記載の方法。
[項目72]
前記正常で健常な対象が、前記対象と同じリスク因子のセットを含む、項目66または67のいずれかに記載の方法。
[項目73]
前記変異プロファイルが、ミスセンス変異体、ナンセンス変異体、欠失変異体、挿入変異体、重複変異体、逆位変異体、フレームシフト変異体、または反復伸長変異体を含む、項目45~72のいずれかに記載の方法。
[項目74]
複数の末梢血白血球から得られたゲノムDNA試料に存在する任意の変異体であって、前記複数の末梢血白血球が前記対象から得られ、前記変異プロファイルから除去される、項目45~72のいずれかに記載の方法。
[項目75]
クローン造血に由来するいずれかの変異体が前記変異プロファイルから除去される、項目45~72のいずれかに記載の方法。
[項目76]
前記変異プロファイルが、遺伝子DNMT3A、TET2、またはASXL1の変異体を含まない、項目75に記載の方法。
[項目77]
前記変異プロファイルが標準的がんドライバ遺伝子を含まない、項目75に記載の方法。
[項目78]
前記変異プロファイルが非標準的がんドライバ遺伝子を含み、前記非標準的遺伝子がGRIN3AまたはMYCである、項目75に記載の方法。
[項目79]
前記断片の長さプロファイルが、少なくとも約80bp~170bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む、項目46~78のいずれかに記載の方法。
[項目80]
前記断片の長さプロファイルが、少なくとも約100bp~150bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む、項目46~78のいずれかに記載の方法。
[項目81]
前記循環腫瘍核酸分子が濃縮されている、項目79または80のいずれかに記載の方法。
[項目82]
前記セルフリー核酸試料をフィラーDNA分子と混合してDNA混合物を生じることをさらに含む、項目46~81のいずれかに記載の方法。
[項目83]
前記フィラーDNA分子が約50bp~800bpの長さを含む、項目82に記載の方法。
[項目84]
前記フィラーDNA分子が約100bp~600bpの長さを含む、項目82に記載の方法。
[項目85]
前記フィラーDNA分子が、少なくとも約5%のメチル化フィラーDNA分子を含む、項目82に記載の方法。
[項目86]
前記フィラーDNA分子が、少なくとも約20%のメチル化フィラーDNAを含む、項目82に記載の方法。
[項目87]
前記フィラーDNA分子が、少なくとも約30%のメチル化フィラーDNAを含む、項目82に記載の方法。
[項目88]
前記フィラーDNA分子が、少なくとも約50%のメチル化フィラーDNAを含む、項目82に記載の方法。
[項目89]
前記DNA混合物を、メチル化ヌクレオチドに結合するように構成された結合剤とインキュベートして濃縮試料を生成することをさらに含む、項目46~88のいずれかに記載の方法。
[項目90]
前記結合剤が、メチル-CpG結合ドメインを含むタンパク質を含む、項目89に記載の方法。
[項目91]
前記タンパク質がMBD2タンパク質である、項目89に記載の方法。
[項目92]
前記結合剤が抗体を含む、項目89に記載の方法。
[項目93]
前記抗体が5-MeC抗体である、項目89に記載の方法。
[項目94]
前記抗体が5-ヒドロキシメチルシトシン抗体である、項目89に記載の方法。
[項目95]
前記配列決定が亜硫酸水素塩配列決定を含まない、項目46~94のいずれかに記載の方法。
[項目96]
前記セルフリー核酸試料が血液試料を含む、項目46~94のいずれかに記載の方法。
[項目97]
前記血液試料が血漿試料を含む、項目96に記載の方法。
[項目98]
がん組織の起源を検出することをさらに含む、項目46~97のいずれかに記載の方法。
[項目99]
前記対象の生存率の予後を含む報告を生成することをさらに含む、項目46~97のいずれかに記載の方法。
[項目100]
前記対象に治療を与えることをさらに含む、項目46~97のいずれかに記載の方法。
[項目101]
前記疾患の治療に続いて、前記治療が有効であるかどうかを示す第2の報告を与えることをさらに含む、項目46~97のいずれかに記載の方法。
[項目102]
対象が状態を有するか、または状態を有するリスクがあるかどうかを判定するための方法であって、
(a)前記対象からの試料の少なくとも一部から得たセルフリー核酸分子をアッセイする工程、
(b)表5に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工程、および
(c)少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、前記表5に列挙されたDMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと比較する工程を含む、方法。
[項目103]
前記セルフリー核酸分子がctDNAを含む、項目102に記載の方法。
[項目104]
前記配列決定分析を実施することを含み、前記配列決定分析がcell-free Methylated DNA ImmunoPrecipitation(cfMeDIP)配列決定を含む、項目102に記載の方法。
[項目105]
前記検出する工程が、表5に列挙される6つ以上、10以上、15以上、20以上、30以上、40以上、50以上、60以上、70以上、80以上、90以上、または100以上のDMRに含まれる前記核酸分子の少なくとも一部のメチル化レベルを測定することを含む、項目102に記載の方法。
[項目106]
対象が疾患の治療を受けた後により高い生存率を有するかどうかを判定する方法であって、
(a)前記対象からの試料の少なくとも一部から得たセルフリー核酸分子をアッセイする工程、
(b)表6に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工程、および
(c)少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、前記表6に列挙されたDMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと処理する工程を含む、方法。
[項目107]
前記セルフリー核酸分子がctDNAを含む、項目106に記載の方法。
[項目108]
前記検出する工程が、複合体メチル化スコア(CMS)を提示することを含む、項目106に記載の方法。
[項目109]
前記CMSが、表6に列挙されたDMRのβ値の合計を含む、項目107に記載の方法。
[項目110]
CMSがより高いことが、前記対象の生存率がより低いことを示す、項目107に記載の方法。
[項目111]
前記CMSがctDNAの存在量に依存しない、項目107に記載の方法。
[項目112]
前記疾患が扁平上皮癌である、項目102~111のいずれかに記載の方法。
[項目113]
前記がんが頭頸部扁平上皮癌である、項目112に記載の方法。
[項目114]
少なくとも約80bp~170bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することをさらに含む、項目102~113のいずれか一項に記載の方法。
[項目115]
対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するためのシステムであって、
(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルのうちの少なくとも1つのプロファイルを生成するために前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、および
前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ng/ml未満の前記複数の核酸分子を含む、処理する工程
を含むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサを含む、システム。
[項目116]
対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有するリスクがあるかどうかを判定するシステムであって、
(a)複数の核酸分子を含む前記セルフリー核酸試料を得る工程、
(b)前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リードを生成する工程、
(c)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、および
(d)前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを使用する工程を含むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサを含む、システム。

Claims (116)

  1. 対象のがん細胞から循環腫瘍デオキシリボ核酸(ctDNA)が存在することを検出する方法であって、
    (a)前記対象からセルフリーデオキシリボ核酸(DNA)の試料を得る工程、
    (b)前記試料をライブラリ調製に供して、前記セルフリーメチル化DNAのその後の配列決定を可能にする工程、
    (c)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNAを捕捉する工程、
    (d)前記捕捉されたセルフリーメチル化DNAを配列決定する工程、
    (e)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用いて、前記捕捉されたセルフリーメチル化DNAの前記配列をコンピュータ処理する工程、および
    (f)前記捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来のセルフリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来のDNAの前記存在を同定する工程を含み、
    (d)、(f)および(g)の少なくとも1つにおいて、前記対象のセルフリーメチル化DNAは、断片の長さのメトリックに従って亜集団に限定される、方法。
  2. 第1の量のフィラーDNAを前記試料に添加することをさらに含み、前記フィラーDNAの少なくとも一部がメチル化され、次いでさらに前記試料を変性させていてもよい、請求項1に記載の方法。
  3. 前記断片の長さのメトリックが断片の長さである、請求項1に記載の方法。
  4. 前記対象のセルフリーメチル化DNAが、<170塩基対(bp)、<165bp、<160bp、<155bp、<150bp、<145bp、<140bp、<135bp、<130bp、<125bp、<120bp、<115bp、<110bp、<105bp、または<100bpの長さを有する断片に限定される、請求項2に記載の方法。
  5. 前記対象のセルフリーメチル化DNAが、約100~約150bp、110~140bpまたは120~130bpの長さを有する断片に限定される、請求項2に記載の方法。
  6. 前記断片の長さのメトリックが、前記対象のセルフリーメチル化DNAの前記断片の長さの分布である、請求項1に記載の方法。
  7. 前記対象のセルフリーメチル化DNAが、長さに基づいて下位50、45、40、35、30、25、20、15または10パーセンタイル内の断片に限定される、請求項5に記載の方法。
  8. 前記対象のセルフリーメチル化DNAが、差次的メチル化領域(DMR)内の断片にさらに限定される、請求項1~6のいずれか一項に記載の方法。
  9. 前記対象のセルフリーメチル化DNAがさらに制限される、前記捕捉する工程の間である、請求項1~7のいずれか一項に記載の方法。
  10. 前記対象のセルフリーメチル化DNAがさらに制限される、前記比較する工程の間である、請求項1~7のいずれか一項に記載の方法。
  11. 前記限定することが、前記同定することの間である、請求項1~7のいずれか一項に記載の方法。
  12. 前記試料が前記対象の血液または血漿に由来する、請求項1~10のいずれか一項に記載の方法。
  13. (f)が統計的分類器を使用することを含む、請求項1~11のいずれか一項に記載の方法。
  14. 前記分類器が機械学習によって導出される、請求項12に記載の方法。
  15. 健常な個体およびがんの個体由来の前記対照のセルフリーメチル化DNA配列は、健常な個体とがんの個体との間の差次的メチル化領域(DMR)のデータベースに含まれる、請求項1~14のいずれか一項に記載の方法。
  16. 健常な個体およびがんの個体由来の前記対照のセルフリーメチル化DNA配列が、セルフリーDNAに由来するDNAにおいて健常な個体とがんの個体との間として差次的にメチル化されているその対照のセルフリーメチル化DNA配列に限定される、請求項1~15のいずれか一項に記載の方法。
  17. 前記対照のセルフリーメチル化DNA配列が、血漿に由来するDNAにおいて健常な個体とがんの個体との間として差次的にメチル化される、請求項16に記載の方法。
  18. 前記試料が、100ng、75ngまたは50ng未満のセルフリーDNAを有する、請求項1~17のいずれか一項に記載の方法。
  19. 前記フィラーDNAの第1の量は、少なくとも約5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、または100%のメチル化フィラーDNAを含み、残りは非メチル化フィラーDNAであり、好ましくは5%~50%、10%~40%、または15%~30%のメチル化フィラーDNAである、請求項1~18のいずれか一項に記載の方法。
  20. 前記フィラーDNAの第1の量が、20ng~100ng、好ましくは30ng~100ng、より好ましくは50ng~100ngである、請求項1~18のいずれか一項に記載の方法。
  21. 前記試料から得た前記セルフリーDNAおよび前記第1の量のフィラーDNAは、合わせて少なくとも50ngの総DNA、好ましくは少なくとも100ngの総DNAを含む、請求項1~20のいずれか一項に記載の方法。
  22. 前記フィラーDNAが、50bp~800bpの長さ、好ましくは100bp~600bpの長さ、より好ましくは200bp~600bpの長さである、請求項1~21のいずれか一項に記載の方法。
  23. 前記フィラーDNAが二本鎖である、請求項1~22のいずれか一項に記載の方法。
  24. 前記フィラーDNAがジャンクDNAである、請求項1~11のいずれか一項に記載の方法。
  25. 前記フィラーDNAが内因性または外因性DNAである、請求項1~12のいずれか一項に記載の方法。
  26. 前記フィラーDNAが非ヒトDNA、好ましくはλDNAである、請求項25に記載の方法。
  27. 前記フィラーDNAがヒトDNAとアライメントしていない、請求項1~26のいずれか一項に記載の方法。
  28. 前記結合剤が、メチル-CpG結合ドメインを含むタンパク質である、請求項1~27のいずれか一項に記載の方法。
  29. 前記タンパク質がMBD2タンパク質である、請求項1~28のいずれか一項に記載の方法。
  30. (d)が、抗体を使用して前記セルフリーメチル化DNAを免疫沈降させることを含む、請求項1~29のいずれか一項に記載の方法。
  31. 免疫沈降のために少なくとも0.05μg、好ましくは少なくとも0.16μgの前記抗体を前記試料に添加することを含む、請求項30に記載の方法。
  32. 前記抗体が5-MeC抗体である、請求項30に記載の方法。
  33. 前記免疫沈降反応を確認するために、(c)の後に第2の量の対照DNAを前記試料に添加することをさらに含む、請求項30に記載の方法。
  34. セルフリーメチル化DNAの前記捕捉を確認するために、(c)の後に第2の量の対照DNAを前記試料に添加することをさらに含む、請求項1~32のいずれか一項に記載の方法。
  35. がん細胞由来のDNAが前記存在することを同定することは、がん細胞の起源の組織を同定することをさらに含む、請求項1~34のいずれか一項に記載の方法。
  36. 前記がん細胞の起源の組織を同定することは、がんのサブタイプを同定することをさらに含む、請求項35に記載の方法。
  37. 前記がんのサブタイプが、ステージ、組織学、遺伝子発現パターン、コピー数異常、再編成、または点変異状態に基づいて前記がんを区別する、請求項36に記載の方法。
  38. (f)がゲノムワイドに行われる、請求項1~37のいずれか一項に記載の方法。
  39. (f)がゲノムワイドから特定の調節領域に制限される、請求項1~37のいずれか一項に記載の方法。
  40. 前記調節領域が、FANTOM5エンハンサー、CpGアイランド、CpGショア、CpG Shelf、または前述物の任意の組み合わせである、請求項39に記載の方法。
  41. 工程(f)および(g)がコンピュータプロセッサによって実行される、請求項1~40のいずれか一項に記載の方法。
  42. 前記がんが、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍からなる群から選択される、請求項1~41のいずれか一項に記載の方法。
  43. 前記がんが頭頸部扁平上皮癌である、請求項1~41のいずれか一項に記載の方法。
  44. 前記がんの前記検出に使用するための、請求項1~43のいずれか一項に記載の方法。
  45. 前記がんの治療のモニタリングに使用するための、請求項1~43のいずれか一項に記載の方法。
  46. 対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するための方法であって、
    (a)(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルからなる群から選択される少なくとも1つのプロファイルを生成するために前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、および
    (b)前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ナノグラム(ng)/ミリリットル(ml)未満の前記複数の核酸分子を含む、処理する工程を含む、方法。
  47. 前記セルフリー核酸試料が10ng/ml未満の前記複数の核酸分子を含む、請求項46に記載の方法。
  48. 前記セルフリー核酸試料が5ng/ml未満の前記複数の核酸分子を含む、請求項46に記載の方法。
  49. 前記セルフリー核酸試料が1ng/ml未満の前記複数の核酸分子を含む、請求項46に記載の方法。
  50. (a)に前記供する工程が、(i)、(ii)および(iii)からなる群から選択される少なくとも2つのプロファイルを生成する、請求項46に記載の方法。
  51. 前記少なくとも2つのプロファイルが、前記メチル化プロファイルおよび前記断片の長さプロファイルを含む、請求項50に記載の方法。
  52. 前記少なくとも2つのプロファイルが、前記変異プロファイルおよび前記断片の長さプロファイルを含む、請求項50に記載の方法。
  53. 前記少なくとも2つのプロファイルが、前記メチル化プロファイルおよび前記変異プロファイルを含む、請求項50に記載の方法。
  54. (a)を前記供する工程が、前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを生成する、請求項46に記載の方法。
  55. 対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有するリスクがあるかどうかを判定する方法であって、
    (a)複数の核酸分子を含む前記セルフリー核酸試料を得る工程、
    (b)前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リードを生成する工程、
    (c)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、および
    (d)前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを使用する工程を含む、方法。
  56. 前記疾患ががんを含む、請求項46~55のいずれか一項に記載の方法。
  57. 前記がんが、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍、扁平上皮癌、および頭頸部扁平上皮癌からなる群から選択される前記がんからなる群から選択される、請求項56に記載の方法。
  58. 前記がんが扁平上皮癌である、請求項57に記載の方法。
  59. 前記がんが頭頸部扁平上皮癌である、請求項58に記載の方法。
  60. 前記複数のセルフリー核酸分子が循環腫瘍核酸分子を含む、請求項46~56のいずれか一項に記載の方法。
  61. 前記循環腫瘍核酸が循環腫瘍DNAを含む、請求項60に記載の方法。
  62. 前記循環腫瘍核酸が循環腫瘍RNAを含む、請求項60に記載の方法。
  63. 前記メチル化プロファイルが、複数の差次的メチル化領域(DMR)を含む、請求項46~62のいずれかに記載の方法。
  64. 前記複数のDMRがctDNA由来である、請求項63に記載の方法。
  65. 末梢血白血球に由来する複数のDMRが前記メチル化プロファイルから除去される、請求項63に記載の方法。
  66. 前記複数のDMRが、正常で健常な対象からの対応するゲノム領域と比較して低メチル化レベルを有する少なくとも約56のゲノム領域を含む、請求項63に記載の方法。
  67. 前記複数のDMRが、正常で健常な対象からの対応するゲノム領域と比較して、過剰メチル化レベルを有する少なくとも約941のゲノム領域を含む、請求項54に記載の方法。
  68. DMRが少なくとも約300bpのサイズを含む、請求項63に記載の方法。
  69. DMRが、少なくとも約100bp~少なくとも約200bpのサイズを含む、請求項68に記載の方法。
  70. DMRが、少なくとも約100bp~少なくとも約150bpのサイズを含む、請求項68に記載の方法。
  71. DMRが少なくとも8のCpGゲノムアイランドを含む、請求項63に記載の方法。
  72. 前記正常で健常な対象が、前記対象と同じリスク因子のセットを含む、請求項66または67のいずれかに記載の方法。
  73. 前記変異プロファイルが、ミスセンス変異体、ナンセンス変異体、欠失変異体、挿入変異体、重複変異体、逆位変異体、フレームシフト変異体、または反復伸長変異体を含む、請求項45~72のいずれかに記載の方法。
  74. 複数の末梢血白血球から得られたゲノムDNA試料に存在する任意の変異体であって、前記複数の末梢血白血球が前記対象から得られ、前記変異プロファイルから除去される、請求項45~72のいずれかに記載の方法。
  75. クローン造血に由来するいずれかの変異体が前記変異プロファイルから除去される、請求項45~72のいずれかに記載の方法。
  76. 前記変異プロファイルが、遺伝子DNMT3A、TET2、またはASXL1の変異体を含まない、請求項75に記載の方法。
  77. 前記変異プロファイルが標準的がんドライバ遺伝子を含まない、請求項75に記載の方法。
  78. 前記変異プロファイルが非標準的がんドライバ遺伝子を含み、前記非標準的遺伝子がGRIN3AまたはMYCである、請求項75に記載の方法。
  79. 前記断片の長さプロファイルが、少なくとも約80bp~170bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む、請求項46~78のいずれかに記載の方法。
  80. 前記断片の長さプロファイルが、少なくとも約100bp~150bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む、請求項46~78のいずれかに記載の方法。
  81. 前記循環腫瘍核酸分子が濃縮されている、請求項79または80のいずれかに記載の方法。
  82. 前記セルフリー核酸試料をフィラーDNA分子と混合してDNA混合物を生じることをさらに含む、請求項46~81のいずれかに記載の方法。
  83. 前記フィラーDNA分子が約50bp~800bpの長さを含む、請求項82に記載の方法。
  84. 前記フィラーDNA分子が約100bp~600bpの長さを含む、請求項82に記載の方法。
  85. 前記フィラーDNA分子が、少なくとも約5%のメチル化フィラーDNA分子を含む、請求項82に記載の方法。
  86. 前記フィラーDNA分子が、少なくとも約20%のメチル化フィラーDNAを含む、請求項82に記載の方法。
  87. 前記フィラーDNA分子が、少なくとも約30%のメチル化フィラーDNAを含む、請求項82に記載の方法。
  88. 前記フィラーDNA分子が、少なくとも約50%のメチル化フィラーDNAを含む、請求項82に記載の方法。
  89. 前記DNA混合物を、メチル化ヌクレオチドに結合するように構成された結合剤とインキュベートして濃縮試料を生成することをさらに含む、請求項46~88のいずれかに記載の方法。
  90. 前記結合剤が、メチル-CpG結合ドメインを含むタンパク質を含む、請求項89に記載の方法。
  91. 前記タンパク質がMBD2タンパク質である、請求項89に記載の方法。
  92. 前記結合剤が抗体を含む、請求項89に記載の方法。
  93. 前記抗体が5-MeC抗体である、請求項89に記載の方法。
  94. 前記抗体が5-ヒドロキシメチルシトシン抗体である、請求項89に記載の方法。
  95. 前記配列決定が亜硫酸水素塩配列決定を含まない、請求項46~94のいずれかに記載の方法。
  96. 前記セルフリー核酸試料が血液試料を含む、請求項46~94のいずれかに記載の方法。
  97. 前記血液試料が血漿試料を含む、請求項96に記載の方法。
  98. がん組織の起源を検出することをさらに含む、請求項46~97のいずれかに記載の方法。
  99. 前記対象の生存率の予後を含む報告を生成することをさらに含む、請求項46~97のいずれかに記載の方法。
  100. 前記対象に治療を与えることをさらに含む、請求項46~97のいずれかに記載の方法。
  101. 前記疾患の治療に続いて、前記治療が有効であるかどうかを示す第2の報告を与えることをさらに含む、請求項46~97のいずれかに記載の方法。
  102. 対象が状態を有するか、または状態を有するリスクがあるかどうかを判定するための方法であって、
    (a)前記対象からの試料の少なくとも一部から得たセルフリー核酸分子をアッセイする工程、
    (b)表5に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工程、および
    (c)少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、前記表5に列挙されたDMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと比較する工程を含む、方法。
  103. 前記セルフリー核酸分子がctDNAを含む、請求項102に記載の方法。
  104. 前記配列決定分析を実施することを含み、前記配列決定分析がcell-free Methylated DNA ImmunoPrecipitation(cfMeDIP)配列決定を含む、請求項102に記載の方法。
  105. 前記検出する工程が、表5に列挙される6つ以上、10以上、15以上、20以上、30以上、40以上、50以上、60以上、70以上、80以上、90以上、または100以上のDMRに含まれる前記核酸分子の少なくとも一部のメチル化レベルを測定することを含む、請求項102に記載の方法。
  106. 対象が疾患の治療を受けた後により高い生存率を有するかどうかを判定する方法であって、
    (a)前記対象からの試料の少なくとも一部から得たセルフリー核酸分子をアッセイする工程、
    (b)表6に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工程、および
    (c)少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベルを、前記表6に列挙されたDMRに含まれる前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと処理する工程を含む、方法。
  107. 前記セルフリー核酸分子がctDNAを含む、請求項106に記載の方法。
  108. 前記検出する工程が、複合体メチル化スコア(CMS)を提示することを含む、請求項106に記載の方法。
  109. 前記CMSが、表6に列挙されたDMRのβ値の合計を含む、請求項107に記載の方法。
  110. CMSがより高いことが、前記対象の生存率がより低いことを示す、請求項107に記載の方法。
  111. 前記CMSがctDNAの存在量に依存しない、請求項107に記載の方法。
  112. 前記疾患が扁平上皮癌である、請求項102~111のいずれかに記載の方法。
  113. 前記がんが頭頸部扁平上皮癌である、請求項112に記載の方法。
  114. 少なくとも約80bp~170bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することをさらに含む、請求項102~113のいずれか一項に記載の方法。
  115. 対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するためのシステムであって、
    (i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルのうちの少なくとも1つのプロファイルを生成するために前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、および
    前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ng/ml未満の前記複数の核酸分子を含む、処理する工程
    を含むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサを含む、システム。
  116. 対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有するリスクがあるかどうかを判定するシステムであって、
    (a)複数の核酸分子を含む前記セルフリー核酸試料を得る工程、
    (b)前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リードを生成する工程、
    (c)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、および
    (d)前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロファイルを使用する工程を含むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複数のコンピュータプロセッサを含む、システム。
JP2022577358A 2020-06-19 2021-06-18 循環腫瘍核酸分子のマルチモーダル分析 Pending JP2023528533A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024099692A JP2024126029A (ja) 2020-06-19 2024-06-20 循環腫瘍核酸分子のマルチモーダル分析

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063041151P 2020-06-19 2020-06-19
US63/041,151 2020-06-19
PCT/CA2021/050842 WO2021253138A1 (en) 2020-06-19 2021-06-18 Multimodal analysis of circulating tumor nucleic acid molecules

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2024099692A Division JP2024126029A (ja) 2020-06-19 2024-06-20 循環腫瘍核酸分子のマルチモーダル分析

Publications (1)

Publication Number Publication Date
JP2023528533A true JP2023528533A (ja) 2023-07-04

Family

ID=79268880

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2022577358A Pending JP2023528533A (ja) 2020-06-19 2021-06-18 循環腫瘍核酸分子のマルチモーダル分析
JP2024099692A Pending JP2024126029A (ja) 2020-06-19 2024-06-20 循環腫瘍核酸分子のマルチモーダル分析

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2024099692A Pending JP2024126029A (ja) 2020-06-19 2024-06-20 循環腫瘍核酸分子のマルチモーダル分析

Country Status (9)

Country Link
US (1) US20230212690A1 (ja)
EP (1) EP4168574A4 (ja)
JP (2) JP2023528533A (ja)
KR (2) KR20230025895A (ja)
CN (1) CN116157539A (ja)
AU (2) AU2021291586B2 (ja)
CA (1) CA3182321A1 (ja)
IL (1) IL299157A (ja)
WO (1) WO2021253138A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024097257A1 (en) * 2022-10-31 2024-05-10 Gritstone Bio, Inc. Combination panel cell-free dna monitoring
WO2024168401A1 (en) * 2023-02-17 2024-08-22 EG BioMed Co., Ltd. Methods for early prediction, treatment response, recurrence and prognosis monitoring of pancreatic cancer
WO2024192294A1 (en) * 2023-03-15 2024-09-19 Adela, Inc. Methods and systems for generating sequencing libraries

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019010564A1 (en) * 2017-07-12 2019-01-17 University Health Network DETECTION AND CLASSIFICATION OF CANCER USING METHYLOME ANALYSIS

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3080215A1 (en) * 2017-11-03 2019-05-09 University Health Network Cancer detection, classification, prognostication, therapy prediction and therapy monitoring using methylome analysis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019010564A1 (en) * 2017-07-12 2019-01-17 University Health Network DETECTION AND CLASSIFICATION OF CANCER USING METHYLOME ANALYSIS

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BRATMAN, S.V. ET AL., EXPERT REVIEW OF MOLECULAR DIAGNOSTICS, vol. 15(6), JPN6023024650, 2015, pages 715 - 719, ISSN: 0005087985 *
BURGENER,JM ET AL.: "ABSTRACT PR13: COMPREHENSIVE DETECTION OF CTDNA IN LOCALIZED HEAD AND NECK CANCER BY GENOME- AND MET", CLIN. CANCER RES., vol. 26(11 SUPPL.), JPN6023024651, 1 June 2020 (2020-06-01), pages 13, ISSN: 0005087983 *
MUHANNA, N. ET AL., SCIENTIFIC REPORTS, vol. 7 16723, JPN6023024652, 2017, pages 1 - 11, ISSN: 0005087984 *

Also Published As

Publication number Publication date
IL299157A (en) 2023-02-01
CA3182321A1 (en) 2021-12-23
US20230212690A1 (en) 2023-07-06
CN116157539A (zh) 2023-05-23
AU2024203201A1 (en) 2024-05-30
KR20230025895A (ko) 2023-02-23
KR20240104202A (ko) 2024-07-04
EP4168574A1 (en) 2023-04-26
AU2021291586B2 (en) 2024-02-15
JP2024126029A (ja) 2024-09-19
WO2021253138A1 (en) 2021-12-23
EP4168574A4 (en) 2024-02-28
AU2021291586A1 (en) 2023-02-02

Similar Documents

Publication Publication Date Title
CN110603329B (zh) 用于诊断肝细胞癌和肺癌的甲基化标志物
CN108064314B (zh) 判定癌症状态之系统
CN111742062B (zh) 用于诊断癌症的甲基化标志物
JP2022539443A (ja) メチル化核酸の高深度シーケンシングのための方法とシステム
AU2021291586B2 (en) Multimodal analysis of circulating tumor nucleic acid molecules
Pass et al. Biomarkers and molecular testing for early detection, diagnosis, and therapeutic prediction of lung cancer
JP2014525269A (ja) 卵巣新生物に対する易罹患性及び/又は卵巣がんの予後若しくは悪性度を予測する方法
WO2019064063A1 (en) BIOMARKERS FOR DETECTION OF COLORECTAL CANCER
US20240229158A1 (en) Dna methylation biomarkers for hepatocellular carcinoma
US20240182983A1 (en) Cell-free dna methylation test
US20220298565A1 (en) Method Of Determining PIK3CA Mutational Status In A Sample
EP4234720A1 (en) Epigenetic biomarkers for the diagnosis of thyroid cancer
Michel et al. Non-invasive multi-cancer diagnosis using DNA hypomethylation of LINE-1 retrotransposons
WO2024216205A1 (en) Methods and systems for cell-free nucleic acid processing
WO2023230289A1 (en) Methods and systems for cell-free nucleic acid processing
WO2024192294A1 (en) Methods and systems for generating sequencing libraries
CN118679267A (zh) 生成测序文库的方法和系统
WO2023107709A1 (en) Methods and systems for generating sequencing libraries
Burgener Multimodal Profiling of Cell-Free DNA for Detection and Characterization of Circulating Tumour DNA in Low Tumour Burden Settings
WO2024047250A1 (en) Sensitive and specific determination of dna methylation profiles
CN118139987A (zh) 用于cfrna和cftna靶向ngs测序的组合物和方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230228

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230220

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230220

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230620

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231220

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240620

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240731