CN109983134A - 尿液和其他样品中无细胞dna的分析 - Google Patents

尿液和其他样品中无细胞dna的分析 Download PDF

Info

Publication number
CN109983134A
CN109983134A CN201780070814.4A CN201780070814A CN109983134A CN 109983134 A CN109983134 A CN 109983134A CN 201780070814 A CN201780070814 A CN 201780070814A CN 109983134 A CN109983134 A CN 109983134A
Authority
CN
China
Prior art keywords
cancer
dna
urine
methylation
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780070814.4A
Other languages
English (en)
Inventor
卢煜明
赵慧君
陈君赐
江培勇
郑华哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Publication of CN109983134A publication Critical patent/CN109983134A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/493Physical analysis of biological material of liquid biological material urine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

可以通过分析无细胞DNA来检测特定器官的疾病(例如,癌症)。一些实施方案可以使用来自特定器官或通过特定器官的器官相关样品,例如可以在尿液、唾液、血液和粪便样品中进行。在一些实施方案中,可以测量样品中的无细胞DNA的甲基化水平。组织特异性甲基化模式可用于确定来自不同组织类型的分数贡献。在其他实施方案中,可以测量器官相关的无细胞DNA的大小。大小分布的统计测量表明,与非健康组织比较,无细胞DNA片段总体上比具有健康组织的受试者所预期的要长。在其它实施方案中,可以分析两个不同的样品以确定特定器官是否患有癌症。可以分析血液样品和器官相关样品中的无细胞DNA,以鉴定表现出拷贝数异常的染色体区域。

Description

尿液和其他样品中无细胞DNA的分析
相关申请的交叉引用
本申请要求2016年11月30日提交的标题为“尿液和其他样品中无细胞DNA的分析”的美国临时申请第62/427,999号的优先权,其全部内容出于所有目的通过引用并入本文中。
背景技术
在人体体液中发现的细胞外DNA的短片段在凋亡和坏死期间从濒死细胞释放(1)。来源于胎儿(2)、肿瘤细胞(3)和移植同种异体移植物(4)的循环血浆中的无细胞(cf)DNA的分析使得能够开发非侵入性产前检查(5)、‘液体活检’评估肿瘤(6,7)和监测移植器官的临床状态(8)。
尿液分析是真正的非侵入性并且了解尿cfDNA的来源对于指导其临床用作“液体活检”的形式是有用的。从无细胞尿液上清液中分离的DNA可大致归类为来自肾前、肾脏或肾后系统。使用输血(9)、妊娠(9–11)、造血干细胞移植(12)、非泌尿恶性肿瘤(13,14)、肾移植(15)、和膀胱癌(16,17)作为模型系统,多个研究组已经证明,从全身循环、肾脏和肾后尿路上皮得出尿cfDNA的比例。
以前的研究集中于在一个时间从所关注的单个源检测cfDNA,并且从特定源得出的尿cfDNA量有大的变化。每个组织来源对总尿cfDNA的比例贡献是未知的,并且在一些研究中,感兴趣来源的cfDNA的浓度极低,或者甚至检测不到(15,16,18)。因此,难以使用尿液(或除血液之外的非侵入性活组织检查,例如唾液或粪便样品)来检测癌症或其他疾病。
其他技术分析点突变监测先前诊断有癌症患者。然而,这些技术不易于修改为无症状患者的广泛适用的筛查技术以诊断癌症。必须在检测到癌症之前鉴定特定的点突变。因此,可能仅筛选众所周知的点突变用于筛选,或者必须通过先前针对先前检测器肿瘤的侵入性活检来鉴定患者的特定点突变。
发明内容
实施方案可以分析用于特定器官的疾病检测(例如癌症)的无细胞DNA。一些实施方案可以使用来自特定器官或通过特定器官的器官相关样品,例如可以在尿液、唾液、血液和粪便样品中进行。可以以各种方式进行分析。
在一些实施方案中,无细胞DNA的甲基化水平可以在样品中进行测定。组织特异性甲基化模式可用于确定来自不同组织类型的分数贡献。一种组织类型可以是特定器官的特定疾病的患病组织类型。患病组织类型的分数贡献可用于确定样品中特定疾病的水平(分类)。例如,可以使用甲基化模式确定癌性膀胱衬细胞的百分比,并且该百分比可以用于确定癌症水平。
在其它实施方案中,器官相关的无细胞DNA的大小可以被测量。在使用从膀胱排泄的尿液样品的实例中,可以测量天然存在于尿液中的无细胞DNA片段的大小分布。大小分布的统计测量可以表明无细胞DNA片段总体上比具有健康膀胱组织的受试者预期的长。较长片段的指示可用于鉴定受试者中的膀胱癌。在使用尿液样品的另一个实例中,尿液样品可以从肾盂中取出。可以基于统计测量来确定肾脏是否发炎,该统计测量表明无细胞DNA片段总体上比具有未发炎的肾脏的受试者预期的长。
在其它实施方案中,两个不同的样品可以被分析以确定特定器官是否患有癌症。可以分析血液样品和器官相关样品(例如,尿液、唾液或粪便样品)中的无细胞DNA,以鉴定表现出拷贝数异常的染色体区域。如果血液样品不指示癌症并且器官相关样品指示癌症,那么可以将受试者鉴定为在与样品相关的器官中患有癌症。例如,对于尿液样品,可以将受试者鉴定为患有膀胱癌。还可以检测其他癌症,例如泌尿道癌症、由尿路上皮引起的移行细胞癌和肾癌。
其它实施例涉及与本文描述的方法相关联的系统和计算机可读介质。
参考以下详细描述和附图,可以更好地理解本发明实施方案的性质和优点。
附图说明
图1显示了根据本发明实施方案从肾、尿路上皮、B细胞、T细胞和嗜中性粒细胞鉴定的19,418个差异甲基化区域中的甲基化密度。每条垂直线代表基于甲基化密度进行颜色编码的单个差异甲基化区域。具有高甲基化密度的差异甲基化区域(DMR)用红色表示,而具有低甲基化密度的基因座用黄色表示。
图2是显示根据本发明实施方案的在膀胱肿瘤、B细胞、尿路上皮、肾、嗜中性粒细胞和T细胞中27,371个差异甲基化区域(DMR)的甲基化密度的热图。
图3显示了根据本发明实施方案的来自造血干细胞移植(HSCT)(三角形)和肾移植(圆点)患者的31个尿样中来自血细胞和肾的cfDNA的比例贡献。
图4A-4C显示了根据本发明的实施方案,使用不同组织特异性甲基化模式定义的分数的膀胱癌病例和无癌对照的甲基化反卷积图,包括正常尿路上皮细胞(图4A)、作为单一组织特异性甲基化模式的尿路上皮和膀胱癌细胞(图4B)和作为单独的组织特异性甲基化模式的尿路上皮和膀胱癌细胞(图4C)。
图5是说明根据本发明的实施方案使用患病组织类型的组织特异性甲基化模式分析生物的生物样品的方法500的流程图。
图6A显示了根据本发明实施方案的六种膀胱癌病例和六种对照的每毫升尿液的基因组当量(GE)的总cfDNA浓度。
图6B显示了根据本发明实施方案的六种膀胱癌病例和六种对照的膀胱肿瘤GE指数值。
图7A和7B显示了根据本发明实施方案的来自代表性HSCT患者(图7A)和肾移植患者(图7B)的受体和供体DNA的尿cfDNA大小分布。
图8A和8B显示了根据本发明实施方案的来自右肾(其由于结石而被阻塞)的肾盂和来自左肾的排泄尿液的cfDNA的大小分布。
图9A和9B是根据本发明的实施方案,在37℃体外孵育0、3和6小时时来自肾盂尿液的cfDNA的大小分布。
图10A和10B显示了根据本发明的实施方案,与温育(a)3小时和(b)6小时的肾盂尿液相比,排泄尿液的大小分布。
图11A和11B是显示根据本发明实施方案的31种HSCT与肾移植尿液样品的cfDNA片段大小参数之间的关系的图。
图12A和12B显示了根据本发明实施方案的来自肾盂(图12A)和排泄尿(图12B)的尿液的37℃体外温育实验期间尿cfDNA的浓度。
图13A-13D.根据本发明的实施方案,在37℃下从0至12小时体外孵育排泄尿液cfDNA的大小分布。
图14是根据本发明的实施方案的分析来自生物体肾脏的肾盂的尿液样品以确定器官损伤程度(例如,炎症水平)的方法1400的流程图。
图15A和15B显示了根据本发明实施方案的来自两例肌肉侵入性膀胱癌的手术前和手术后尿样的大小分布。
图16A-16C显示了根据本发明实施方案的来自患有膀胱癌的患者的三个排泄尿样的大小分布。
图17A-17C显示根据本发明的实施方案,来自三名接受TURBT的非肌肉侵入性膀胱癌患者的三个术前尿样的大小分布。
图18显示了根据本发明的实施方案,使用尿液cfDNA的大小分析生物体的尿液样品以检测膀胱癌的方法1800的流程图。
图19A和19B显示了根据本发明实施方案,在对照、具有Ta-T1疾病的膀胱癌患者和患有T2-T4疾病的膀胱癌患者中尿液cfDNA片段的比例长于70bp(P>70bp)的箱线图。
图20显示了Circos图,其显示了根据本发明实施方案的尿cfDNA和膀胱癌组织之间的全局甲基化和拷贝数异常的一致性。
图21A-21E显示了根据本发明实施方案的来自五个膀胱癌患者(A-E)的尿cfDNA的全局甲基化和拷贝数异常的Circos图。
图22A和22B显示了根据本发明实施方案的T22的膀胱癌肿瘤(19A)和cf尿液(19B)的Circos图。
图23A显示了根据本发明实施方案的膀胱癌病例和对照中总体高甲基化密度的箱线图。
图23B显示了根据本发明实施方案的使用高甲基化密度检测癌症的接受者操作特征(ROC)曲线。
图24A-24D示出了根据本发明实施方案的两个进行根治性膀胱切除术的膀胱癌患者(T22和T23)的术前(图24A和图24C)和术后(图24B和图24D)cf尿液。
图25A-25D显示了根据本发明实施方案的两名患者的全局甲基化和CNA的术前和术后Circos图。
图26是显示根据本发明实施方案的具有低恶性潜能的非侵入性(Ta)乳头状尿路上皮肿瘤(PUNLMP)的膀胱癌患者中的甲基化和拷贝数异常的Circos图。
图27A和27B显示了根据本发明实施方案的从相同排泄尿液获得的来自膀胱癌患者(T23)的cf尿液(图27A)和尿液沉淀(图27B)的Circos图。
图28A-28D显示了根据本发明实施方案的来自两个膀胱癌患者(T22和T23)的cf尿液(图28A和图28C)和血浆(图28B和图28D)的Circos图。
图29A和29B显示了根据本发明实施方案的两个膀胱癌病例T22和T23的基因组中1MB组的百分比,其显示CNA或低甲基化的证据。
图30是示出根据本发明的实施方案的通过分析受试者的尿液样品和血液样品来识别受试者中的膀胱癌的方法的流程图。
图31A-31C显示了根据本发明实施方案的46个膀胱癌患者和39个对照的具有低甲基化的1mb组的百分比、具有拷贝数异常的1mb去的百分比和来自甲基化反卷积的膀胱肿瘤贡献的箱线图。
图31D-31F显示了根据本发明实施方案的低甲基化、CNA和膀胱肿瘤贡献的接受者操作特征(ROC)曲线。
图32A-32C显示了根据本发明实施方案的非侵袭性(Ta)低级疾病的17个膀胱癌患者和39个对照的具有低甲基化的1mb组的百分比、具有拷贝数异常的1mb去的百分比和来自甲基化反卷积的膀胱肿瘤贡献的箱线图。
图32D-32F显示了根据本发明实施方案的低甲基化、CNA和膀胱肿瘤贡献的接受者操作特征(ROC)曲线。
图33显示了根据本发明的实施方案分析生物体的尿液样品的方法。
图34A是根据本发明实施方案的49个膀胱癌病例和39个对照中具有一个错配的读段百分比的箱线图。
图34B是根据本发明的实施方案的图34A的相应ROC曲线分析。
图35显示了根据本发明的实施方案分析生物的生物样品的方法。
图36是显示根据本发明实施方案的三种膀胱癌病例和五种对照的不同微生物种类的相对丰度的热图。
图37显示了根据本发明的实施方案分析人的尿液样品的方法。
图38说明根据本发明的实施方案的系统3800。
图39示出可与根据本发明的实施方案的系统和方法一起使用的实例计算机系统的框图。
术语
“生物样品”是指取自受试者(例如,人类,如孕妇、患有癌症的个人、或疑似患有癌症的个人、器官移植接受者或疑似患有涉及器官的疾病过程(例如心肌梗塞的心脏、中风的大脑、或贫血的造血系统)的受试者)且含有一个或多个感兴趣的核酸分子的任何样品。生物样品可以是体液,如血液、血浆、血清、尿液、阴道液、水囊肿(例如,睾丸)液、阴道冲洗液、胸膜液、腹水液、脑脊髓液、唾液、汗液、泪液、痰液、支气管肺泡灌洗液、乳头排出液、来自身体不同部位(例如,甲状腺、乳房)的吸入液等。也可以使用粪便样品。在各种实施例中,已经富集无细胞DNA的生物样品(例如,通过离心方案获得的血浆样品)中的大部分可以是无细胞的,例如,大于50%、60%、70%、80%、90%、95%或99%的DNA可以是无细胞的。离心方案可以包含,例如,3,000g×10分钟下获得流体部分,并在例如,30,000g下再离心另外10分钟以除去残留的细胞。
如本文所使用的,术语“基因座”或其复数形式“基因座”是任何长度的核苷酸(或碱基对)的位置或地址,其具有跨基因组的变异。“序列读段”是指从核酸分子的任何部分或全部测序的一串核苷酸。举例来说,序列读段可以是从核酸片段测序的短核苷酸串(例如,20-150个)、在核酸片段的一个或两个末端处的短核苷酸串,或生物样品中存在的整个核酸片段的测序。序列读段可以通过多种方式获得,例如,使用测序技术或使用探针,例如,通过杂交阵列或捕获探针或扩增技术,如聚合酶链反应(PCR)或使用单引物的线性扩增或等温扩增。
术语“大小分布”一般涉及生物样品中的DNA片段的大小。大小分布可以是直方图,其提供各种大小的DNA片段的数量的分布。各种统计参数(也称为大小参数或恰参数)可以用于将一种大小分布与另一种大小分布区分开。一个参数是相对于所有DNA片段或相对于另一个大小或范围的DNA片段的特定大小或大小范围的DNA片段的百分比。
如本文所使用的术语“分类”是指与样品的特定性质相关联的任何一个或多个数字或其它一个或多个字符。举例来说,“+”符号(或词语“正”)可以表示样品归类为具有缺失或扩增。分类可以是二进制(例如,正或负)或具有更多的分类水平(例如,从1到10或0到1的标度)。
术语“截止值”和“阈值”是指在操作中使用的预定数量。例如,截止大小指的是不包括片段的大小。阈值可以是高于或低于进行特定分类的值。这些术语中的任一个可以在这些背景中的任一背景下使用。
哺乳动物基因组中的“DNA甲基化”通常是指在CpG二核苷酸中向胞嘧啶残基的5'碳(即5-甲基胞嘧啶)添加甲基基团。DNA甲基化可以发生于其它背景中的胞嘧啶中,例如CHG和CHH,其中H是腺嘌呤、胞嘧啶或胸腺嘧啶。胞嘧啶甲基化还可以呈5-羟甲基胞嘧啶形式。还报道了非胞嘧啶甲基化,例如N6-甲基腺嘌呤。
“位点”与单个位点对应,其可以是单个碱基位置或一组相关碱基位置,例如,CpG位点。“基因座”可以对应于包括多个位点的区域。基因座可以仅包括一个位点,此将使得所述基因座在此背景下相当于一个位点。
“甲基化组”提供了基因组中多个位点或基因座处的DNA甲基化量的量度。甲基化组可以对应于所有基因组、基因组的大部分或基因组的相对较小部分。“肿瘤甲基化组”与生物体(例如,人)的肿瘤的甲基化组对应。可以使用母体血浆中的肿瘤组织或无细胞肿瘤DNA来确定肿瘤甲基化组。感兴趣的组织特异性甲基化组的其它实例是器官(例如,脑细胞、骨骼、肺、心脏、肌肉和肾脏的甲基化组等)的甲基化组,其可以将DNA贡献到体液(例如,血浆、血清、汗液、唾液、尿液、生殖器分泌物、精液、粪便液、腹泻液、脑脊液、胃肠道分泌物、腹水、胸膜液、眼内液、鞘膜积液(如睾丸)、囊肿液体、胰腺分泌物、肠道分泌物、痰液、眼泪、乳房和甲状腺的吸入液等)中。器官可以是移植器官。
“组织”对应于一组相同类型的细胞。不同类型的组织可由不同类型的细胞(例如,肝细胞、肺泡细胞或血细胞)组成,而且可对应于来自不同生物体(母亲对比胎儿)的组织或对应于健康细胞对比肿瘤细胞。“参考组织”对应于用于确定组织特异性甲基化水平的组织。可以利用来自不同个体的相同组织类型的多个样品确定这种组织类型的组织特异性甲基化水平。
每个基因组位点(例如,CpG位点)的“甲基化指数”是指在所述位点显示甲基化的序列读段与覆盖所述位点的读段总数的比例。区域的“甲基化密度”是显示甲基化的区域内的位点的读段数除以覆盖所述区域中的位点的读段总数。位点可以具有具体的特征,例如是CpG位点。因此,区域的“CpG甲基化密度”是指显示CpG甲基化的读段数除以覆盖所述区域中的CpG位点(例如,特定CpG位点、CpG岛内或更大区域内的CpG位点)的读段总数。举例来说,人类基因组中每个100-kb组(bin)的甲基化密度可以利用亚硫酸氢盐处理之后的CpG位点处未转化的胞嘧啶(其对应于甲基化胞嘧啶)总数占映射到100kb区域的序列读段所覆盖的所有CpG位点的比例来确定。此分析还可以针对其它组距大小,例如,50-kb或1-Mb等进行。区域可以是整个基因组或染色体或染色体的一部分(例如,染色体臂)。当一个区域仅包括一个CpG位点时,那个CpG位点的甲基化指数与所述区域的甲基化密度相同。“甲基化的胞嘧啶比例”是指区域中在分析的胞嘧啶残基,即包含CpG背景外的胞嘧啶的总数内显示被甲基化(例如,在亚硫酸氢盐转化之后未转化)的胞嘧啶位点“C’s”的数量。甲基化指数、甲基化密度和甲基化的胞嘧啶的比例是“甲基化程度”的实例。
术语“疾病的水平”或“病况的水平”可指是否疾病(例如癌症)存在、该疾病的阶段、当疾病是癌症时的肿瘤大小、是否存在转移、身体的总肿瘤负担和/或疾病严重程度的其他度量。疾病的水平可以是数字或其他标记,例如符号、字母和颜色。水平可以是零。癌症水平还包括与突变或许多突变相关的恶化前或癌前病症(状态)。可以以各种方式使用疾病水平。举例来说,筛选可以检查先前不知道患有病症的某人是否存在病症。评定可以研究已经被诊断为患有病症的某人以监测病症随时间推移的发展、研究疗法的效用或确定预后。在一个实施例中,预后可表示为患者死于病症的可能性或所述病症在特定持续时间后进展的可能性或者癌症转移的概率。检测可以意指‘筛选’或可以意指检查具有病症的潜在特征(例如,症状或其它阳性测试)的某人是否患有病症。
基因组基因座(标记)的“类型”对应于组织类型的基因座的特定属性。给定类型的基因座可以在组织类型的甲基化水平上具有特定的统计学变化。基因组基因座(标记)的“类别”对应于相同组织类型的不同个体的基因座的甲基化水平的特定变化。一组基因组基因座(标记)可以由任何数量的各种类型和/或类别的基因座组成。因此,一组基因座对应于为特定测量选择的基因座,并且不表示该组中基因座的任何特定性质。该描述主要涉及I型基因座和II型基因座。一组基因组位点可能不具有特定组织类型的特定甲基化标记,例如,在特定组织类型中仅有或主要是甲基化。这样的组被称为II型位点。这些基因组位点可以与具有特定特征的基因组位点组合使用,其被称为I型位点。
“器官相关样品”可以指这样的样品,其由特定器官产生(例如由肾脏产生的尿液)或通过特定器官(例如通过膀胱的尿液),例如在尿液、唾液、胸膜液、血液和粪便中可能发生的。样品包括无细胞DNA,可以是无细胞DNA和细胞DNA的混合物。
膀胱上皮(或尿路上皮)是“移行上皮”的一个例子。上皮的类型衬在大部分泌尿道上,泌尿道包括肾盂、输尿管、膀胱和尿道的部分。
具体实施方式
尿无细胞(CF)DNA,以及其它器官相关的样品,有着巨大的潜力作为液体活检完全非侵入性的形式,或其它非侵入性活组织检查,如粪便样品。通过组织来源对cfDNA组成的了解可用于指导其临床应用。然而,这些样品的组成可以是高度可变的,从而限制了用作活组织检查的广泛适用性。例如,来自任何特定器官的经腺DNA的量可以在不同样品之间变化很大,从而使得来自肾脏的无细胞DNA的百分比也变化。
CpG位点甲基化是表观遗传调控和甲基化特征的一个重要形式,可以被识别用于不同的组织(19,20)和细胞类型(21)。我们最近证明了不同组织的血浆cfDNA的比例贡献可以使用全基因组亚硫酸盐测序和测序数据的反卷积分析来确定(22)。
本发明通过采用甲基化反卷积——其使用组织特异性甲基化模式(也称为参考模式)——来推断不同组织的尿cfDNA的比例贡献,分析尿cfDNA的组成。这种分析可涉及使用疾病组织类型例如癌性尿路上皮细胞的甲基化模式。使用这种反卷积的技术可以确定相关疾病的水平。结果显示,对来自膀胱癌患者的尿液cfDNA进行分析,使用甲基化反卷积法来鉴定膀胱肿瘤的cfDNA比例增加。
还分析了片段大小、肿瘤相关拷贝数和甲基化水平的其它变化。例如,排泄尿液的大小分布用于识别受试者是否患有膀胱癌。此外,来自肾盂的尿液的大小分布用于识别肾脏是否发炎。
另外,拷贝数异常可用于使用血液检测癌症,例如,如在美国专利8,741,811中所述,其通过引用以其整体并入本文。然而,可能不知道哪个器官具有肿瘤,因为血液包括来自许多器官的组织并因此与许多器官相关联。可以分析通常具有来自较少器官的组织的尿液或其他样品,但是具有拷贝数异常的经腺DNA仍然可以来自各种器官。因此,鉴定具有肿瘤的特定器官可能是具有挑战性的。解决此问题的一种方法涉及本文所述的技术,其中来自器官相关样品(例如,唾液、胸膜液、尿液或粪便样品)和血液样品的无细胞DNA的拷贝数分析以获得癌症水平的单独测定。如果血液样品未指示癌症且排泄样品确实存在,则可以将癌症鉴定为来自与排泄样品相关的器官,例如尿液对应膀胱癌。
I.使用患病组织参考模式进行反卷积
样品(例如,血液和尿液)可包括多种组织类型,每种贡献无细胞DNA的不同级分。由于不同类型组织的DNA通常具有不同的甲基化模式,因此在特定样品中测量的甲基化水平可用于确定样品中多种组织类型中的每一种的分数贡献。反卷积过程可以使用组织特异性甲基化模式来确定分数贡献,例如,如美国专利公开2016/0017419中所述,其通过引用整体并入。
分数贡献的变化可以用于检测异常。然而,当某些样品在分数贡献中具有高度可变性时(例如尿液中),可能会出现问题。一些实施方案可以通过使用与患病组织特异性对应的组织特异性甲基化模式来解决该问题,这与使用从器官的健康组织确定的甲基化模式相反。首先,讨论尿液作为样品的问题,以及关于反卷积的细节。
A.尿液作为样品
虽然造血细胞一致地是血浆cfDNA的主要贡献者,血浆cfDNA以相对稳定的浓度(22,27)存在,但尿cfDNA的量和组成变化很大。例如,肾脏对cfDNA的贡献可以在临床稳定的肾移植患者中从4.2-94%或104-3,970GE/ml尿液变化。这种程度的组成变化会影响尿液中总cfDNA浓度的变化(来自移植患者的225-25,710GE/ml尿液)并且可以解释为什么仅针对单一来源cfDNA的灵敏检测的测定可能会遇到具有无法检测水平的样品。这可以突出维持在稳态平衡的血浆含量之间的差异,而排泄尿液的含量是一次单向通过泌尿系统后的稳态需求的排泄副产物。虽然不同的水合状态可以想象地影响总的cfDNA浓度,但稀释效应不能解释每个组织的比例贡献的变化。
尿cfDNA的调查由于以下事实复杂化:大多数尿cfDNA片段是短的(<100bp)以及DNaseI(主要的分泌DNA水解酶)在肾脏和膀胱中高度表达(http://www.proteinatlas.org/)和在尿液中存在(Ito等人,1984)以及是高度活性的(Nadano等人,1993)。可从每个组织来源检测到的cfDNA量的变化要求通过来源组织来增强对尿cfDNA组成的了解,以及cfDNA在其下行泌尿道时可能经历的变化。
因此,确定尿中cfDNA组成的挑战在于以下事实:尿cfDNA比血浆中的短(在尿中的约50个碱基和在血浆中的150个),以及尿DNA在通过泌尿道时会不断降解。此外,由于存在DNaseI,从尿液提取无细胞DNA比从血浆更困难。因此,不清楚甲基化反卷积是否适用于那么短的片段。
我们假设血细胞、肾和尿路上皮分别对于肾前、肾和肾后cfDNA释放到尿液中是主要贡献者。血浆中80%左右的cfDNA来自造血细胞(27)并因此如果显著量血浆cfDNA能够通过肾脏过滤到尿中,这些DNA片段可能具有造血细胞的特征。然而,来自各种组织的肾上腺DNA的组成在尿液中是可变的。
我们使用全基因组硫酸氢盐测序进行尿cfDNA组成的全局调查。将DNA片段映射到Watson和Crick链上。每个样品使用一个泳道,我们实现了中位数为8000万个独特可映射的非重复读段,在整个基因组的CpG位点的平均测序深度为2.42。我们使用组织特异性甲基化特征和甲基化反卷积来推断每个组织的比例贡献。
我们表明,我们能够确定尿液中无细胞和细胞DNA的贡献比例。来自甲基化反卷积的比例贡献与在造血干细胞和肾移植受体的尿液中使用同种异体移植物来源的供体特异性遗传标记计算的那些高度相关。我们发现来自不同组织的比例贡献的变化很大。与排泄尿液相比,从肾盂获得的尿液中的cfDNA具有更高比例的较长片段。尿液cfDNA在37℃体外孵育以模拟体内降解,结果显示尿液cfDNA的绝对浓度降低,半衰期为3.5-4.9小时。尽管体内降解,但使用肾和骨髓移植患者的排泄尿液的验证显示甲基化反卷积和供体特异性SNP之间的比例贡献高度相关。
将从无细胞尿和尿沉淀物的DNA甲基化与从不同正常和病理组织(包括构成泌尿道的组织)的参考甲基化组相比较。来自膀胱癌患者的尿液cfDNA的甲基化反卷积确定了癌症的比例贡献增加。这种尿液cfDNA也表现出大小分布、拷贝数和整体低甲基化和/或高甲基化的异常。
该泌尿cfDNA的整体调查加深了对尿道中cfDNA的组成、降解和变化的了解,并为利用全基因组尿cfDNA测序作为分子诊断工具奠定了基础。
B.甲基化反卷积
可使用单一甲基化基因组位点(甲基化标记物),以确定来自生物体的DNA混合物的组成,说明甲基化反卷积的原理。生物体可以是动物,包括哺乳动物或人。假设组织A对于基因组位点是完全甲基化的,即甲基化密度(MD)为100%,组织B完全未甲基化,即MD为0%。在该实例中,甲基化密度是指胞嘧啶残基的百分比,其中CpG二核苷酸的背景在感兴趣的区域中被甲基化。
如果DNA混合物C由组织A和组织B组成并且DNA混合物C的整体甲基化密度是60%,我们可以根据下式推断出组织A和B对DNA混合物C的比例贡献:
MDC=MDA×a+MDB×b,
其中MDA、MDB、MDC分别代表组织A、组织B和DNA混合物C的MD;a和b是组织A和B对DNA混合物C的比例贡献。在该具体实例中,假设组织A和B是DNA混合物中仅有的两种成分。因此,a+b=100%。因此,计算出组织A和B分别对DNA混合物贡献60%和40%。
在组织A和组织B中的甲基化密度可以从生物体的样品或从来自相同类型的其它生物(例如,其他人,可能是相同亚群)的样品获得。如果使用来自其他生物的样品,则可以使用组织A样品的甲基化密度的统计分析(例如,平均值、中值、几何平均值)来获得甲基化密度MDA,并且类似地用于MDB
基因组位点可以被选择为具有最小的个体间差异,例如,小于变化的特定绝对量或在正在测试基因组位点的最低部分内。例如,对于最低部分,实施方案可以仅选择在测试的一组基因组位点中具有最低10%变异的基因组位点。其他生物可以来自健康人,以及具有特定生理条件的人(例如孕妇,或具有不同年龄或特定性别的人),这可能对应于包括当前被检测生物体的特定亚群。
亚群的其它生物体也可以具有其他病理情况(例如肝炎或糖尿病等患者)。这种亚群可能具有改变的各种组织的组织特异性甲基化模式。除了使用正常组织的甲基化模式之外,在这种疾病状态下的组织的甲基化模式可以用于反卷积分析。当用这些条件从这样的亚群测试生物体时,这种反卷积分析可能更准确。例如,与正常肝脏和正常肾脏相比,肝硬化肝脏或纤维化肾脏可能分别具有不同的甲基化模式。因此,如果对患有肝硬化的患者进行其他疾病筛查,则将肝硬化肝脏包括作为向血浆DNA贡献DNA的候选者之一连同其他组织类型的健康组织可能更准确。
当有更多的潜在的候选组织时,更多的基因组位点(例如,10个或更多)可以被用来确定DNA混合物的组成。估计DNA混合物的比例组成的准确性取决于许多因素,包括基因组位点的数量、基因组位点(也称为“位点”)对特定组织的特异性、以及跨越不同候选组织和跨越不同个体的位点用于确定参考组织特异性水平的可变性。位点对组织的特异性是指特定组织与其他组织类型之间的基因组位点的甲基化密度的差异。
它们的甲基化密度之间的差越大,则位点对特定组织将更特异性。例如,如果位点在肝脏中完全甲基化(甲基化密度=100%)并且在所有其他组织中完全未甲基化(甲基化密度=0%),则该位点对肝脏具有高度特异性。然而,不同组织的位点的可变性可以通过例如但不限于不同类型组织中位点的甲基化密度的范围或标准偏差来反映。更大范围或更高的标准偏差将允许在数学上更精确和准确地确定不同器官对DNA混合物的相对贡献。这些因素对估计候选组织对DNA混合物的比例贡献的准确性的影响在本申请的后面部分中说明。
这里,我们使用数学方程式来说明不同器官对DNA混合物的比例贡献的推导。DNA混合物中不同位点的甲基化密度与不同组织中相应位点的甲基化密度之间的数学关系可表示为:
其中代表DNA混合物中位点i的甲基化密度;pk表示组织k对DNA混合物的比例贡献;MDik表示组织k中位点i的甲基化密度。当位点的数量等于或大于器官的数量时,可以确定各个pk的值。组织特异性甲基化密度可以从其他个体获得,并且可以选择具有最小个体间变异的位点,如上所述。
另外的标准可以包括在算法中以提高精确度。例如,所有组织的集合贡献可以被约束为100%,即
kpk=100%。
此外,所有器官的贡献都可以要求是非负的:
由于生物变异,观察到的整体甲基化模式可能不完全等同于从组织的甲基化推导出的甲基化模式。在这种情况下,需要数学分析来确定个体组织的最可能的比例贡献。在这方面,观察到的DNA中的甲基化模式与来自组织的推导的甲基化模式之间的差异由W表示。
其中O是观察到的DNA混合物的甲基化模式,Mk是单个组织k的甲基化模式。pk是组织k对DNA混合物的比例贡献。每个pk的最可能值可以通过最小化W来确定,W是观察到的和推断的甲基化模式之间的差异。该等式可以使用数学算法来解,例如通过但不限于使用二次编程、线性/非线性回归、期望最大化(EM)算法、最大似然算法、最大后验估计和最小二乘法。
C.鉴定用于尿液cfDNA组织映射的差异甲基化区域
参考甲基化组可以基于公开可用甲基化组并且还有从不同组织获得的正常和病理样品的全基因组亚硫酸氢盐测序组装。样品组织可以衍生自组织,包括但不限于肾皮质、肾髓质、输尿管、膀胱尿道上皮、膀胱肌、前列腺(腔、中央和外周)和精囊。可以在手术中获得样品的组织和细胞组成,并通过大体解剖确定。
我们的目的是表征血细胞(嗜中性粒细胞、T细胞和B细胞)、肾和尿路上皮中的甲基化组,以便识别可以在这些组织之间进行区分的甲基化特征。我们利用血细胞的可公开获得的全基因组亚硫酸氢盐测序数据(Human Epigenome Atlas,www.genboree.org/epigenomeatlas/index.rhtml,(28)),并且我们从进行肾移植或泌尿外科手术的患者获得肾脏和尿路上皮组织,以进行全基因组亚硫酸氢盐测序,覆盖范围为35-40X。
跨越多个CpG位点具有类似的甲基化密度的组织可以被分组在一起,并且可以识别是信息性的差异甲基化区域(DMR)。使用肾、尿路上皮、中性粒细胞、B细胞和T细胞,鉴定出19,418个DMR用作甲基化标记物。这包括3,549个1型标记,其中DMR的甲基化密度在一个组织中与其他4个组织相比显著不同(Z-得分>3),和15,869个2型标记,其中甲基化密度显示不同组织的变化。
图1是显示嗜中性粒细胞、B细胞、T细胞、肾和尿路上皮中19,418个差异甲基化区域(DMR)的甲基化密度的热图。每条垂直线代表DMR,高至低甲基化密度由红色(例如,部分102)至黄色(例如,部分104)表示。分层聚类显示血细胞中这些DMR的甲基化模式与肾和尿路上皮细胞中的甲基化模式大不相同。
在亚硫酸氢盐处理后对尿cfDNA进行测序,并将在DMR在cfDNA片段中观察到的甲基化模式与在五个参考组织中的甲基化的特征进行比较,并使用如前面描述的甲基化反卷积算法(22)。然后我们推断出中性粒细胞、B细胞、T细胞、肾和尿路上皮的比例贡献。图1显示血细胞、肾和尿路上皮是正常尿液cfDNA的组成。
使用41×2配对末端亚硫酸氢盐测序,我们对共46个膀胱癌病例和39个对照测序,中值为29.2M唯一可映射读段。膀胱癌病例的范围从非侵入性极低等级(Ta PUNLMP)到T4高级别疾病。所有对照均有uristix血液或肉眼血尿。作为常规临床护理的一部分,对8名对照进行uristix中持续性血液或肉眼血尿进行了灵活的膀胱镜检查,并被确认为恶性肿瘤阴性。使用15个对照来建立甲基化和拷贝数的基线水平。其余24个对照用于测试组。
图2是显示在膀胱肿瘤、B细胞、尿路上皮、肾、嗜中性粒细胞和T细胞中27,371个差异甲基化区域(DMR)的甲基化密度的热图。每条垂直线代表基于甲基化密度的DMR颜色代码。图2中的DMR略微不同于图1中的DMR。垂直线按甲基化水平排序。仅包括常染色体中的DMR。低甲基化被着色为红色(例如,部分202),并且高甲基化被着色为黄色(例如,部分204)。这些DMR用于甲基化反卷积以鉴定每个尿液样品中由膀胱肿瘤贡献的尿液cfDNA的比例。将膀胱肿瘤组织测序至单倍体基因组的8.5×覆盖度以鉴定用于甲基化反卷积的DMR。图2显示可以检测膀胱肿瘤DNA。可以在其他生理或病理条件下检测具有异常甲基化组的任何组织。
全基因组亚硫酸氢盐测序可以用于纵向监测膀胱癌患者,如通过手术前和后的尿液样品所证明的。
D.造血干细胞和肾移植患者的甲基化反卷积和使用供体特异性基因型的验证
我们分别对从肾脏和HSCT患者的26个和5个尿样的cfDNA进行了全基因组亚硫酸氢盐测序。基因组中19,418DMR的甲基化密度使我们能够确定源自肾、尿路上皮、B细胞、T细胞和中性粒细胞的DNA的比例。供体特异性SNP使我们能够识别每个尿样中来自肾和血细胞的DNA片段的比例,并将甲基化反卷积的准确性与供体特异性SNP确定的金标准进行比较。来自甲基化反卷积的血细胞的比例贡献是B细胞、T细胞和嗜中性粒细胞的总和。
我们对HSCT和肾移植患者使用Illumina OMNI 2M SNP阵列确定供体和受体生殖系的基因型信息。我们收集了31份尿液样品用于亚硫酸氢盐测序。我们为每个样品平均获得了8,000万个独特的映射读段,并且鉴定含有供体和受体特异性SNP的片段允许精确计算来自供体组织的cfDNA片段的比例。
图3显示了根据本发明实施方案的来自HSCT(三角形)和肾移植(圆点)患者的31个尿样中来自血细胞和肾的cfDNA的比例贡献。x轴显示从供体特异性SNP计算的供体器官的百分比贡献,y轴显示由甲基化反卷积推断的供体器官的百分比贡献。通过甲基化反卷积确定的供体组织的比例贡献和使用供体和受体特异性基因型确定的比例高度相关(R2=0.97)。
这些结果证实甲基化反卷积在良好的动态范围内确定不同组织的比例贡献于尿cfDNA的能力。使用供体特异性SNP,供体造血细胞对尿液cfDNA的贡献比例在6-78%之间变化,供体肾脏贡献的比例在1-94%之间变化。31例移植尿样的完整尿液cfDNA甲基化反卷积结果列于表1中。
表1. 31例HSCT和肾移植样品的甲基化反卷积结果。显示每个样品的肾、尿路上皮、中性粒细胞、T细胞和B细胞的百分比贡献。
这些结果表明,血细胞、肾、尿路上皮和的贡献在不同样品之间是高度可变的。在一些样品中,来自同一个体在不同天取出的尿液样品中特定组织的比例贡献存在很大的变化(例如T45和T86)。这些组织中的每一种的比例贡献可以低至0%,并且对于血细胞、肾和尿路上皮分别可以上升至93%、100%和64%。在31份尿液样品中,对血细胞、肾脏和尿路上皮使用甲基化反卷积测量的比例贡献的中位数和四分位数范围分别为52%(0-84%)、32%(7-100%)和5%(0-12%)。
E.使用甲基化反卷积测定癌症
本节描述使用尿路上皮和膀胱肿瘤DNA的甲基化组的尿cfDNA的甲基化反卷积。反卷积可以解释来自不同组织的DNA的绝对量的可变性。但是,如上所述,尿液中不同组织的贡献存在高度可变性。因此,如果来自一个源的贡献低或高,则不一定是异常的。
图4A-4C显示了根据本发明的实施方案,使用不同组织特异性甲基化模式(也称为参考模式)定义的分数的膀胱癌病例和无癌对照的甲基化解卷积图,包括正常尿路上皮细胞(图4A)、作为单一组织特异性甲基化模式的尿路上皮和膀胱癌细胞(图4B)和作为单独的组织特异性甲基化模式的尿路上皮和膀胱癌细胞(图4C)。来自甲基化反卷积的比例贡献显示在y轴上。
1.使用正常尿路上皮作为参考
绝大多数膀胱癌是从尿道上皮细胞产生的移行细胞癌。然而,膀胱肿瘤衍生的DNA的甲基化可能类似于正常的尿路上皮,或者可能显示出完全不同且独特的甲基化模式。我们研究了,与无癌对照组相比尿道上皮细胞对膀胱癌患者尿液cfDNA的比例贡献,推测膀胱肿瘤细胞更新可能增加并且可以释放类似于正常尿路上皮的cfDNA片段。
图4A显示当组织特异性甲基化模式在甲基化反卷积中包括肾、正常尿路上皮、B细胞、T细胞和嗜中性粒细胞时,正常尿路上皮的分数贡献。正常尿路上皮在非癌症和膀胱癌病例中的百分比贡献是可变的并且在很大程度上重叠,两组之间没有显著差异(Mann-Whitney U检验p=0.15)。因此,甲基化反卷积发现膀胱癌患者和无肿瘤对照之间的尿路上皮贡献没有显著差异。这表明cfDNA没有显著增加,类似于膀胱癌患者尿液中的正常尿路上皮。
2.使用在正常和癌症之间具有共同甲基化的位点
由于膀胱癌被认为从已经历恶性改变的尿路上皮细胞产生,我们测序了膀胱肿瘤样品至8.5倍覆盖,以在膀胱肿瘤和正常尿路上皮的甲基化之间识别异同。我们鉴定了7,201个DMR,其中膀胱肿瘤和正常尿路上皮的甲基化密度相似(<10%差异)。然后,我们进行了甲基化反卷积,其定义为尿路上皮,肾脏,B细胞,T细胞和中性粒细胞。
图4B显示当组织特异性甲基化模式包括根据本发明实施方案在膀胱癌中保守的肾、B细胞、T细胞、嗜中性粒细胞和尿路上皮标志物时尿路上皮的分数贡献。由正常尿路上皮和膀胱癌中保守的DMR定义的尿路上皮贡献在非癌症(0-67%)和膀胱癌患者(13-86%)中是高度可变的。使用在正常尿路上皮和膀胱癌中保守的甲基化标记物,与对照相比,膀胱癌受试者的尿路上皮贡献增加(Mann-Whitney U检验P=0.003)。与对照相比,膀胱癌受试者的尿路上皮中位数贡献增加4.5倍。对照的中位数为10.34,膀胱癌受试者的中位数为48.9。
3.使用肿瘤尿路上皮作为单独的参考
最后,我们包括膀胱肿瘤甲基化组作为单独的参考模式,连同嗜中性粒细胞、T细胞、B细胞、肾、和正常尿路上皮。因此,正常和肿瘤尿路上皮被视为单独的组织。基于活检的肿瘤确定肿瘤尿路上皮。可基于一种或多种此类活检肿瘤确定肿瘤参考模式。当使用多个活组织检查时,肿瘤参考模式可以限于在所有或特定百分比(例如,大于50%)的活组织检查中发生的DMR。不同的肿瘤活组织检查也可以被认为是具有不同参考模式的独立组织,从而允许对特定肿瘤细胞组进行分类。我们在六个细胞/组织中鉴定了DMR,并在甲基化反卷积中使用鉴定的DMR。
图4C显示了根据本发明实施方案当组织特异性甲基化模式包括肾、尿路上皮、B细胞、T细胞、嗜中性粒细胞和膀胱癌时膀胱肿瘤细胞的分数贡献。我们发现膀胱癌病例的中位膀胱肿瘤的贡献增加了14倍,而非癌症对照的膀胱肿瘤贡献水平非常低。非癌症病例具有非常低的膀胱肿瘤贡献(0-11%),而膀胱癌病例具有高达84%的膀胱肿瘤贡献。Mann-Whitney U检验显示两组之间存在显著差异(p=0.0002)。对照的中值贡献为4.13,膀胱癌受试者的中值贡献为57.45。
因此,约20的截断值将提供癌症水平的精确分类。接近20的其他值将提供类似的灵敏度和特异性。对于其他疾病或癌症,具体的截止值可能会有所不同。
膀胱癌患者与正常对照的尿液中膀胱肿瘤的百分比贡献之间的显著差异表明,膀胱肿瘤贡献可以用于区分膀胱癌患者与非癌症对照。由于膀胱癌甲基化组基于来自一个膀胱肿瘤的DNA确定,这表明存在来自不同患者的膀胱癌DNA中共享的甲基化模式。
对于进行根治性胆囊切除术的肌层侵入性膀胱癌的两例,使用了小肠的部分以形成回肠或新膀胱,以便代替膀胱排尿和存储。由于小肠与尿液直接接触,我们在术前和术后尿样中对膀胱肿瘤和小肠进行了甲基化反卷积,以确定我们是否能够检测到膀胱肿瘤贡献的减少和小肠贡献的增加。两种术后膀胱癌样品均显示膀胱肿瘤对正常对照观察到的水平的显著降低(表2)。在术后样品中,中性粒细胞和小肠的贡献也显著增加。
表2.甲基化反卷积结果显示了比例组织贡献,使用中性粒细胞、T细胞、B细胞、肾、尿路上皮、膀胱肿瘤和小肠作为术前和术后尿样中的参考。两名患者A和B分别对应于图15A和15B中的大小分布。
比较手术前和后的结果,膀胱肿瘤的贡献降低,小肠和嗜中性粒细胞的贡献增加。手术后即可预期中性粒细胞的增加。因此,在来自五个膀胱癌患者的术前样品中,实施方案能够使用甲基化反卷积来检测从膀胱肿瘤细胞到尿液的cfDNA贡献的显著增加,但是癌症病例和正常对照之间正常尿路上皮细胞的贡献没有显著差异。这表明膀胱肿瘤甲基化组与正常尿路上皮细胞严重不同,并且实施方案可以使用单个膀胱肿瘤参考甲基化组来鉴定来自不同膀胱癌患者的尿cfDNA中增加的肿瘤贡献。目前的结果表明,代表性的膀胱癌甲基化组可以用作检测增加的贡献的参考。
对于被用作用于疾病检测和监测的“液体活检”的泌尿cfDNA,了解尿cfDNA的来源和其在泌尿道中经历的变化是有用的。在这里,我们证明尿cfDNA的全基因组亚硫酸氢盐测序允许识别不同组织特征的甲基化特征,因此允许通过组织类型全面调查尿cfDNA的组成。虽然以前的研究一般集中在从单一来源识别尿液cfDNA,但尿液样品中cfDNA的全局调查显示了每种组织类型的比例贡献,并允许同时比较不同尿液样品中不同的组织贡献。使用甲基化标记来检测cfDNA的来源具有优于基于遗传变异的方法的优点,所述遗传变异需要供体特异性等位基因的先前知识,或者对于每个患者可能是独特的肿瘤特异性体细胞突变。
F.使用患病组织作为参考确定疾病的方法
图5是说明根据本发明的实施方案使用患病组织类型的组织特异性甲基化模式分析生物的生物样品的方法500的流程图。生物样品包括来自多种组织类型的无细胞DNA分子的混合物,多种组织类型包括第一组织类型。方法500可用于确定特定器官中疾病的水平,例如,对应于该器官的患病细胞的组织特异性甲基化模式用于反卷积。可以使用计算机系统来执行方法500。
在框510处,N个基因组位点被识别用于分析,其中N是整数。N个基因组位点可以具有各种属性,例如,如在II部分中更详细描述的,其描述了I型和II型基因组位点。例如,N个基因组位点可仅包括I型或II型位点,或两者的组合。可以基于对一种或多种其他样品的分析来鉴定基因组位点,例如,基于从数据库获得的关于在各种个体中测量的甲基化水平的数据。在一些实施方案中,N个基因组位点的至少10个是II型。N个基因组位点还可以包括I型位点(例如,至少10个)。
可以测量一个样品或一组样品的基因组基因座的这些甲基化。该组样品可以用于包括测试的本发明生物的生物亚群,例如,具有与本发明生物共有的特定性状的亚群。这些其他样品可称为参考组织,并且可从不同样品使用不同的参考组织。
在框520,在N个基因组位点对于每个M组织类型获得N个组织特异性的甲基化水平。N大于或等于M,因此组织特异性甲基化水平可用于反卷积以确定分数百分比。组织特异性甲基化水平可以形成维度N×M的矩阵A。矩阵A的每列可以对应于特定组织类型的甲基化模式,其中模式在N个基因组位点具有甲基化水平。
对于检测器官的特定疾病,M个组织类型中的一个可以对应于相应于第一器官的第一疾病的第一患病组织类型。M个组织类型的第二组织类型可以对应于第一器官的健康组织。在各种实施方案中,组织特异性甲基化模式可以从公共数据库或先前的研究中检索。这些组织特异性甲基化模式可用于鉴定用于反卷积分析的N个基因组位点。
在框530处,接收包括来自M个组织类型的无细胞DNA分子的混合物的生物样品。可以以多种方式从患者生物体获得生物样品。获得这种样品的方式可以是非侵入性的或侵入性的。非侵入性获得的样品的实例包括某些类型的流体(例如血浆或血清或尿液)或粪便。例如,血浆和尿液包括来自多个器官组织的无细胞DNA分子,因此可用于通过一个样品分析多个器官。
在一些实例中,所述生物样品可包括细胞DNA。例如,对于尿样,生物样品可包括来自尿沉淀的细胞DNA。细胞DNA通常比无细胞DNA长,并且片段化方法(例如超声处理)可用于产生较短片段以进行短读取测序。
在框540处,分析来自生物样品的无细胞DNA分子,以鉴定它们在对应于所述生物体的参照基因组中的位置。例如,可以对无细胞DNA分子进行测序以获得序列读段,并且可以将序列读段与参考基因组映射(比对)。如果生物体是人类,则参考基因组将是参考人类基因组,可能来自特定亚群。作为另一个实例,可以用不同探针分析无细胞DNA分子(例如,在PCR或其他扩增后),其中每个探针对应于不同的基因组位点。在一些实施方案中,无细胞DNA分子的分析可以通过接收对应于无细胞DNA分子的序列读段或其他实验数据,然后分析实验数据来进行。
可以分析统计学显著数量的无细胞DNA分子,以提供精确的反卷积,以便用于确定M个组织类型的分数贡献。在一些实施方案中,分析至少1,000个无细胞DNA分子。在其他实施方案中,可以分析至少10,000或50,000或100,000或500,000或1,000,000或5,000,000个无细胞DNA分子或更多。要分析的分子总数可以取决于M和N,以及所需的精度(准确度)。
在框550处,N个混合物的甲基化水平使用无细胞DNA分子的第一组(集)在N个基因组位点测量,其每一个位于参考基因组的N个基因组位点的任何一个处。N个混合物的甲基化水平是指生物样品的混合物中的甲基化水平。例如,如果来自混合物的无细胞DNA分子位于N个基因组位点之一,则该位点处该分子的甲基化指数可包括在该位点的总甲基化密度中。N个混合物的甲基化水平可以形成长度为N的甲基化向量b,其中b对应于可以确定组织类型的分数贡献的观察值。
在一个实施方案中,DNA混合物中的基因组位点的甲基化水平可以使用全基因组亚硫酸氢盐测序法来确定。在其它实施方案中,基因组位点的甲基化水平可以使用甲基化微阵列分析,例如Illumina HumanMethylation450系统,或通过使用甲基化免疫沉淀(例如,使用抗甲基胞嘧啶抗体)或用甲基化结合蛋白处理,随后进行微阵列分析或DNA测序,或通过使用甲基化敏感性限制酶处理,随后进行微阵列或DNA测序,或通过使用甲基化感知测序,例如使用单分子测序方法(例如,通过纳米孔测序(Schreiber等人,Proc Natl AcadSci 2013;110:18910-18915)或通过Pacific Biosciences单分子实时分析(Flusberg等人,Nat Methods 2010;7:461-465))。组织特异性甲基化水平可以用相同方式测量。作为其他实例,靶向亚硫酸氢盐测序、甲基化特异性PCR、基于非亚硫酸氢盐的甲基化感知测序(例如通过单分子测序平台(Powers等人,Efficient and accurate whole genome assemblyand methylome profiling of E.coli,BMC Genomics,2013;14:675)可用于分析血浆DNA的甲基化水平,用于血浆DNA甲基化反卷积分析。因此,可以以多种方式获得甲基化感知测序结果。
在方框560中,使用N个第一甲基化水平,以及每个所述M个组织类型的N个组织特异性甲基化水平,确定在混合物中第一患病组织类型的分数贡献。在一些实施方案中,可以确定组成向量的M值。每个M值对应于M个组织类型的特定组织类型对DNA混合物的分数贡献。在给定NxM组织特异性甲基化水平的情况下,可以求解组成向量的M值以提供N个混合物的甲基化水平(例如,甲基化向量b)。M个分数贡献可以对应于通过求解Ax=b确定的向量x,其可以以各种方式求解(例如,矩阵分解和/或反演,或通过优化过程),如本领域技术人员理解的。当N大于M时,解决方案可以涉及最小化误差,例如,使用最小二乘法。
组成向量可以用于确定每个混合物中的所述M个组织类型的量。组成向量的M值可以直接作为M个组织类型的分数贡献。在一些实施方案中,M值可转换为百分比。误差项可用于将M值移至更高或更低的值。组成向量的每个值可以被认为是分量,并且特定分量可以对应于特定组织类型。
在方框570中,第一患病组织类型的分数贡献被用于确定生物体第一器官的第一疾病的水平。可以将分数贡献与截止值(阈值)进行比较。例如,在图4C中,截止值可以是20。可以使用来自对组织类型健康并且对组织类型患病的生物样品来确定截止值。除了患有或没有患有第一种疾病之外,样品可以具有各种水平的第一疾病。本领域技术人员将理解如何基于从具有已知水平的第一疾病的样品测量的数据来确定期望的截止值。
第一器官的例子可以是一个肾(例如,当尿是样品时)、膀胱(例如,当尿是样品时)、肝脏(例如,当血浆或血清是样品时)或唾液腺(例如,当唾液是样品时)。第一种疾病的实例可以是癌症,当第一器官是肾时的肾小球肾炎,或当第一种器官是肾时的肾病综合征。
在一些实施方案中,参考模式可以被用于多个患病组织,其可能来自相同器官或不同器官。以这种方式,可以同时测量多种疾病类型。
在一些实施方案中,分数贡献可以被用来确定指数值,其可以与截止值比较。分数贡献限于特定范围,并且贡献总和将等于100%。因此,当贡献增加时,它是以牺牲其他贡献为代价的。指数值可以具有更大的范围,并且不依赖于其他组织类型的贡献。指数值可以是分数贡献乘以每毫升尿液的总cfDNA基因组当量(GE),称为膀胱肿瘤GE指数。
如图6A所示,6个病例和6个对照显示在以GE/ml测量的尿液中总无细胞DNA浓度之间没有统计学差异。如图6B所示,当确定的膀胱肿瘤组织的分数贡献乘以总GE/ml(膀胱肿瘤GE指数)以计算指数值时,与对照相比,膀胱癌病例中的指数值显著更高。
在一些实施方案中,分数贡献可以被用来调整CNA和/或尿液中识别的甲基化不足的数量和振幅来计算新的指数值。
II.尿液CFDNA的大小
cfDNA片段的长度可被确定,使用全基因组测序的单碱基对分辨率。具体地,尿cfDNA的长度可以使用成对的末端大规模平行测序以单碱基对分辨率确定,并且在不同片段长度的频率的大小分布图中可视化。大多数尿液cfDNA片段相对较短。在正常对照的排泄尿液中,cfDNA片段长度的中值为65-80bp。在大小分布分布分析中可视化不同长度的cfDNA片段的频率揭示了cfDNA片段<100bp的明显10bp周期性,其中峰的频率高达谷的频率的三倍。
如下讨论,来自肾盂和排泄尿的成对样品的数据表明,在上尿路中长cfDNA片段的比例较大。体外孵育实验表明cfDNA在一级动力学下在泌尿道中降解。这通过减小比例的长片段和50-80bp范围内10bp周期的加重反映在大小分布中。在尿cfDNA中观察到的10bp的周期性使人想起在血浆所见的(36,37),尽管与血浆相比,尿中振幅更大。虽然这种降解过程影响全局甲基化密度并且还引起甲基化反卷积结果的波动,但是在移植患者的排泄尿中观察到的高度相关性表明,尽管体内降解,甲基化反卷积过程仍然是稳健的。
A.HSCT和肾移植患者中尿液cfDNA的大小
我们以前的研究表明,胎儿来源的尿cfDNA片段比母本来源的片段短(Tsui等人PLos One 2012)。在这里,我们调查移植尿液cfDNA片段的大小,特别是如果同源移植物来源的cfDNA与受体来源的片段相比将是不同的大小分布。
图7A和7B显示了根据本发明实施方案的来自代表性HSCT患者(图7A)和肾移植患者(图7B)的受体和供体DNA的尿cfDNA大小分布。x轴以单碱基对分辨率显示大小,y轴显示每个长度的频率。供体和受体大小分布分别用蓝色和红色着色。
来自31个HSCT和肾移植患者的尿样品显示了类似的模式,具有81个碱基的中值长度,明显的10bp的周期性在长度是10的倍数处,特别是在50-80bp范围内。在从HSCT(图7A)和肾移植(图7B)患者中分离供体和受体特异性大小分布后,源自供体血液和尿组织的尿cfDNA的大小与受体组织之间没有可观察到差异。因此,来自同种异体造血细胞和肾的供体特异性cfDNA的大小分布与来自受体的cfDNA的大小分布几乎相同。
这可能表明从造血和肾脏组织释放的cfDNA具有与受体组织相似的大小,或者,泌尿道的降解环境导致从不同组织释放的cfDNA在一段时间后呈现常见大小分布。尽管造血细胞来源和胎儿来源的cfDNA都通过肾脏过滤血浆对尿液有贡献,但泌尿道中的造血细胞可能直接将cfDNA贡献到尿液中,从而解释了它们的大小分布之间的差异。
B.肾盂尿液与尿液排尿中尿cfDNA的大小和组成
血浆cfDNA的大小和组成表现在循环期间达到平衡,并保持与外周血重复采样大体一致。相反,尿液在肾脏中产生,并且它通过输尿管单向下降到膀胱中,在排尿之前储存在膀胱。
由于DNaseI在肾脏和膀胱中高度表达(http://www.proteinatlas.org/)以及在脲中存在(29)和高度活性(30),我们调查了肾盂中与排泄尿相比cfDNA片段是否具有不同大小。我们从患有2厘米输尿管结石的患者取得尿液样品,结石导致右侧泌尿系统完全阻塞,并需要插入经皮肾造口术(管子进入形成尿液的肾盂),直接从肾盂排出尿液。左侧肾脏产生正常的尿液,通过泌尿道排尿。结石完全阻塞了右侧。我们同时从右肾肾盂和排泄尿中收集尿液两次,发现肾盂尿液有较大比例的长片段。第二种情况是肾盂炎症减少后。
图8A和8B显示了根据本发明实施方案的来自右肾(其由于结石而被阻塞)的肾盂和来自左肾的排泄尿液的cfDNA的大小分布。尿液cfDNA的大小分布来自肾盂和排泄尿的成对样品,间隔37天2次。图8A表示经皮肾镜取石术(PCN)插入后5天收集的肾盂和排泄尿。图8B表示在PCN插入后42天收集的尿样,其是在患者恢复后。X轴以单碱基对分辨率显示大小,Y轴显示特定长度的独特可映射片段的频率。线802和806表示由左肾产生的排泄尿。线804和808表示同时收集的来自右肾盂的尿液。
在两个场合,肾盂尿与排泄尿比较,存在更大比例的长尿cfDNA片段,并且在50-80bp范围周期性的幅度减小。此外,初始样品的尿cfDNA片段的平均长度(图8A)长于发生在右肾炎症减少后的后面样品中尿液cfDNA片段的平均长度(图8B)。
肾盂与排泄尿的甲基化反卷积结果表明,在所有四个尿液样品中存在来自嗜中性粒细胞的显著贡献,肾盂尿中与排泄尿中相比,具有更高的比例贡献(表3)。带有嗜中性粒细胞甲基化特征的CfDNA片段既可以是来自血浆的肾前来源,也可以来自肾盂中的白细胞聚集体。与排泄尿液相比,肾盂尿液中CpG位点的全局甲基化密度也更高。
表3.
表3表显示通过甲基化反卷积的每个组织的比例贡献和来自肾盂和排泄尿的cfDNA在CpG位点的全局甲基化密度。A和B对应于图8A和8B中显示的成对的右肾盂和排泄尿样。
C.肾盂尿液cfDNA的大小分布随时间的变化
通过从尿道的不同部分取样尿,我们发现长cfDNA片段在肾盂中比例较大。随着尿液下行泌尿道,cfDNA的绝对浓度降低,并且短片段的比例增加,具有特征性10碱基对(bp)周期性,其在50-80bp之间最显著。
1.肾盂尿液随时间的孵育
在肾盂尿和排泄尿之间观察到的一些差异可能是由于cfDNA的体内降解。在第一次观察肾盂和排泄尿液之间的差异后(图8A),对于第二次收集(图8B),我们收集了更大量的肾盂尿液并将额外的尿液放入密封容器中并在37℃下孵育。肾盂尿液的体外孵育模拟泌尿道中尿液的体内通道和膀胱中的储存。将尿液从容器中抽出并在孵育3小时、6小时和24小时处理。
图9A和9B是在37℃体外孵育0、3和6小时时来自肾盂尿液的cfDNA的大小分布。图9A显示每个碱基对长度的频率,图9B显示累积频率。线902和908表示收集时cfDNA的大小分布。线904和910表示孵育3小时后的大小分布。线906和912表示孵育6小时后的大小分布。这些图表说明了10bp周期的幅度的增加和体外孵育的长cfDNA片段的比例的减少。可以看出,在孵育3和6小时后,这些样品的大小分布显示长片段的比例逐渐减少,并且50-80bp区域中10bp周期的幅度增加。来自肾盂尿液的cfDNA的体外孵育显示,即使在没有与泌尿道接触的情况下,在37℃孵育也会导致cfDNA浓度降低、短cfDNA的较大比例和10bp周期性的增加。在37℃下孵育3至6小时后,肾盂尿的大小分布类似于排泄尿液的大小分布。
图10A和10B显示了与温育(a)3小时和(b)6小时的肾盂尿液相比,排泄尿液的大小分布。线1002代表肾盂尿液孵育3小时。线1004和1008表示排泄尿液。线1006代表肾盂尿液孵育6小时。可以看出,排泄尿液的大小分布与孵育3小时和6小时的肾盂高度相似。这些数据表明,在尿液从肾盂向泌尿道体内通过的过程中,可能存在降低cfDNA浓度并缩短cfDNA片段长度的降解过程。
2.不同大小参数相互之间的关系
单一尿样品的尿cfDNA片段的长度,从而尿cfDNA的降解程度可使用若干量化测量来表征:中值长度、长超过70bp的片段的比例(标记为P>70bp)和片段化(周期性)指数。长度超过70bp(P>70bp)的片段比例可以确定为长于70bp的片段数除以片段总数并以百分比表示。
10bp的周期性在50和80个碱基之间最明显,并且周期性的幅度可以通过在50、60和70bp的峰值长度和在55、65和75bp的谷值长度之间的频率差表示。这可以表示为周期性指数(PI)。周期性指数可以表示大小分布中的多个峰长度处的DNA片段的频率与大小分布中的多个谷值长度处的DNA片段的频率的差异。多个峰值长度可以以规则大小间隔存在。多个谷值长度可以以与多个峰值长度偏移的规则大小间隔存在。例如,规则大小间隔可以是10bp,但是谷值长度可以与峰值长度偏移(或异相)5bp。周期性指数的实例可以如下计算:
PI=(F(50)+F(60)+F(70))–(F(55)+F(65)+F(75))
其中F50,F60F70,F55,F65和F75代表该特定长度的cfDNA片段的频率。高周期性指数表示峰处的cfDNA片段与谷值相比的频率差异大,因此周期性幅度较大。如图10A和10B所示,10bp周期性在50和80bp之间最明显,并且周期性的幅度可以由50、60和70bp处的峰值长度和55、65和75bp处的谷值长度和之间的频率之和的差异表示。
图11A和11B是显示31种HSCT与肾移植尿液样品的cfDNA片段大小参数之间的关系的图。参数为中位数(bp)、比例>70bp(P>70)和周期指数(PI)。图11A显示中值长度与P>70之间存在强烈的正相关。图11B显示在中值和PI之间存在负(反)相关性,因此P>70bp。后一种观察强化了cfDNA片段的长度和周期性相关的概念,并表示每个样品的降解程度。
在大小分布中所见的孵育的肾盂尿中观察到的变化由减小的中位数、减小的P>70bp和PI增加反映出(表4)。在孵育3-6小时后,肾盂尿液的中位数、P>70bp和PI与配对的排泄尿液的非常相当。
表4
表4示出了肾盂尿液cfDNA、在37℃体外孵育期间的和配对排泄尿液的碱基对(bp)中值、超过70bp(P>70)的片段的比例和周期性指数(PI)的形式的总结大小统计。肾盂尿液、排泄尿液和在37℃下体外培养3小时和6小时的肾盂尿液之间的比较表明,与排泄尿液相比,肾盂尿液具有更高的中位数P>70和更低的FI。肾盂尿液如果保持在37℃就会降解,使得较短片段的比例增加,并且更明显的周期性可以看作50-75bp处峰值和谷值之间的较大差异。由于来自肾盂的尿液在体外孵育期间片段化,因此中值P>70逐渐减小并且PI增加。
体外孵育结果解释了在排泄尿中通常观察到的大小分布,并且提供的证据表明cfDNA片段的碎片化在尿道发生。这告诉我们尿液cfDNA的大小和浓度可能受以下因素影响:i)尿液收集位点,以及ii)尿液在体内的持续时间。
3.随时间的甲基化和组成
有趣的是,全局CpG位点甲基化密度在肾盂尿中与排泄尿相比更高,并且随着肾盂在37℃孵育,全局CpG位点甲基化密度逐渐降低。考虑到体外孵育期间尿液cfDNA的绝对浓度、片段大小和全局CpG位点甲基化密度的变化,我们评估了这些因子是否会影响甲基化反卷积。肾盂中尿液cfDNA甲基化反卷积的不同组织的总甲基化密度和比例贡献在37℃体外孵育期间波动,但血细胞、肾脏和尿路上皮的比例贡献在排名方面保持不变(表5)。
表5.甲基化反卷积导致肾盂尿液、在37℃体外孵育期间肾盂尿液以及成对的排泄尿液中的中性粒细胞、T细胞、B细胞、肾和尿路上皮的比例贡献。
表5显示通过甲基化反卷积的每个组织的比例贡献和来自37℃体外孵育期间的cfDNA在CpG位点的全局甲基化密度。全局甲基化密度在6小时内从74.1%降低至68.9%,并且甲基化反卷积贡献存在波动。然而,就排名而言,血细胞(嗜中性粒细胞、T细胞和B细胞)、肾和尿路上皮的比例贡献保持不变。
体外孵育期间肾盂尿甲基化反卷积结果表明,在0、3和6小时血细胞(中性粒细胞)是主要的贡献者,不同组织的贡献百分率有轻微波动。配对的排泄尿液的甲基化反卷积结果也显示主要的中性粒细胞贡献,与肾盂尿液样品相比,尿路上皮的贡献略高。较高的尿路上皮贡献可能反映尿液从更长的泌尿道延伸获得尿路上皮细胞cfDNA。
D.尿液cfDNA浓度随时间的变化
由于尿cfDNA片段在肾盂中的大小分布有较高比例的较长片段,我们研究在37℃下肾盂尿的体外孵育的影响。通过PCN收集肾盂尿并保持在37℃,在不同时间点取等分试样以通过qPCR确定绝对cfDNA浓度,并且还确定每个时间点的大小分布。
使用qPCR为62bp LEP基因区域对肾盂尿cfDNA浓度进行定量,并且量化在时间零点以及对于每一孵育时间点进行。总DNA浓度随时间降低,在初始时间段内降低幅度较大(图12A)。如果拟合指数衰减曲线,则估计尿cfDNA的半衰期为4.9小时,平均寿命为7.0小时。
然后,我们评估如果对照排泄尿保持在37℃,在肾盂尿中观察到的降解和片段化模式是否也可以在对照排泄尿中观察到。我们从当天的第二次尿液排泄中收集约200ml尿液,并在37℃下将尿液体外孵育长达12小时。正常对照中cfDNA的浓度是可变的。在这里,我们显示具有最高cfDNA浓度的对照尿液样品的尿液孵育结果。排泄尿液中cfDNA的浓度随着时间的推移以与肾盂尿液相似的方式降低,并且指数衰减曲线可以拟合R2为0.92,估计半衰期为3.5小时,平均寿命为5.1小时(图12B)。
因此,cfDNA片段的体外温育期间的缩短也反映在cfDNA浓度随时间的减少,如通过qPCR定量的(图12A)。在正常受试者的排泄尿液的体外温育中观察到类似的指数减少模式(图12B),表明cfDNA以时间依赖性方式片段化,半衰期为3.5-4.9小时。
图12A和12B显示了来自肾盂(图12A)和排泄尿(图12B)的尿液的37℃体外温育实验期间尿cfDNA的浓度。x轴是以对数标度显示的GE/ml尿液中cfDNA的浓度,y轴是以小时计的孵育时间。在肾盂和排泄尿液中,cfDNA似乎在一级动力学下降解,半衰期为3.5-4.9小时。个体之间的降解速度可能不同。
E.排泄尿液cfDNA的大小随着时间的变化
对排泄尿随时间的大小变化进行了研究。对于非亚硫酸氢盐测序,以3小时的间隔收集足够的DNA。令人惊讶的是,0至12小时的cfDNA的连续大小分布保持静止,并且是排泄尿液的典型值。对照受试者的排泄cfDNA的大小分布在37℃孵育长达12小时保持恒定的事实表明在某一点之后保持稳定的大小分布。这种稳定的大小分布是在排泄尿液样品中最常见的模式。
图13A-13D.排泄尿液cfDNA的大小分布,在37℃体外孵育0至12小时。将尿液从孵育容器中等分并以3小时的间隔处理。图13A-13D显示通过qPCR测量的cfDNA浓度的同时降低。图13A显示0和3小时的大小分布。图13B显示3和6小时的大小分布。图13C显示6和9小时的大小分布。图13D显示了9和12小时的大小分布。尽管在图12B中的cfDNA浓度中观察到指数衰减,但这些尿液样品的大小分布在12小时孵育期间保持恒定。
因此,在肾盂尿的孵育中平行大小分布显示长片段的比例降低和10bp周期性的加强(图9A)。然而,排泄尿液孵育的平行大小分布表明典型的排泄尿液大小分布(图13A-13D)似乎代表稳定的终点。在此之后,不同长度的cfDNA片段以相似的速率降解,并且尽管总cfDNA持续减少,但大小分布仍保持恒定。
F.从长片段确定炎症的方法
成像可以能够识别肾结石,但它难以从成像例如MRI或CT扫描确定肾的炎症水平。
图14是根据本发明的实施方案的分析来自生物体肾脏的肾盂的尿液样品以确定器官损伤程度(例如,炎症水平)的方法1400的流程图。尿样中至少有一些DNA是无细胞的。方法1400可以完全或部分地用计算机系统执行,如本文所述的某些其他方法确定的。
方法1400可以使用大小分布确定炎症的水平(病况的水平的一个例子)。血浆DNA的大小分布可以通过以下确定,例如,但不限于使用实时PCR、电泳和质谱分析。在各种实施方案中,测量的大小可以是:长度、分子质量或与长度或质量成比例的所测参数,如电泳图中的迁移率和在电泳或质谱仪中行进固定距离所需的时间。在另一个实例中,人们可以用如溴化乙锭或SYBR Green等嵌入荧光染料染色DNA,其中染料量将与DNA分子的长度成比例。当UV光照射在样品上时,人们可以通过所发射的荧光的强度确定结合的染料量。
在方框1410中,测量对应于各种大小的DNA片段的量。对于多种大小的每种大小,可以测量来自尿液样品的与该大小相对应的多个DNA片段的量。例如,可以测量长度为140个碱基的DNA片段的数量。数量可以保存为直方图。在一个实施方案中,测量来自生物样品的多种核酸中的每一种的大小,其可以基于个体进行(例如,通过单分子测序或配对末端测序和与参照比对)或基于组进行(例如,通过电泳)。大小可以对应于范围。因此,量可以是具有特定范围内的大小的DNA片段。
可随意选择多个DNA片段。例如,DNA片段可以随机测序。在一些实施方案中,可以将由DNA片段产生的一对序列读段与对应于受试者的基因组(例如,参考人类基因组)比对,以确定DNA片段的长度。在各种实施方案中,大小可以是质量、长度或其他合适大小度量。如本文所述,可以以各种方式执行测量。例如,可以进行DNA片段的配对末端测序和比对,或者可以使用电泳。可以测量统计学上显著数量的DNA片段以提供生物样品的准确大小分布。统计学上显著数量的DNA片段的实例包括大于100,000;1,000,000;2,000,000,或其他合适的值,这可能取决于所需的精度。
在一个实施方案中,从物理测量获得的数据,诸如配对末端测序或电泳,可在计算机处接收和分析来实现DNA片段的大小的测量。例如,可以分析来自配对末端测序的序列读段(例如,通过比对)以确定大小。作为另一个例子,可以分析由电泳产生的电泳图以确定大小。在一个实施方案中,DNA片段的分析确实包括测序或使DNA片段经历电泳的实际过程,而其他实施方案可仅执行对所得数据的分析。
在方框1420中,基于DNA片段的多种大小的量,计算第一参数的第一值。在一个方面,第一参数提供生物样品中DNA片段的大小分布(例如,直方图)的统计测量。该参数可以称为大小参数,因为它是根据多个DNA片段的大小确定的。在一个实施方案中,第一参数随着DNA片段大小的增加而增加。
第一参数可以是各种形式。这样的参数是特定大小的多个DNA片段除以片段的总数,其可以从直方图(提供特定大小的片段的绝对或相对计数的任何数据结构)获得。作为另一个例子,参数可以是特定大小或特定范围内的多个片段的数量除以另一个大小或范围的片段的数量。该除以可以作为归一化来解释针对不同样品分析的不同数量的DNA片段。通过分析每个样品的相同数量的DNA片段可以实现归一化,这有效地提供与除以所分析的总片段数量相同的结果。参数的其他示例在美国专利公开2013/0237431中描述,其通过引用整体并入。
在框1430,将第一值与参考值比较。参考值的示例包括正常值和截止值,该截止值是与正常值的指定距离(例如,以标准偏差为单位)。参考值可以从来自相同生物体的不同样品确定(例如,当已知生物体是健康的时)。因此,参考值可以对应于当假定生物体没有炎症时从样品确定的第一参数的值。在一个实施方案中,生物样品在治疗后从生物体获得,并且参考值对应于从治疗前采集的样品确定的第一参数的值。参考值也可以从其他健康生物的样品中确定。
在方框1440中,肾脏的炎症水平的分类基于所述比较来确定。在各种实施方案中,分类可以是数字、文本或任何其他指示符。分类可以提供关于炎症、概率或其他分数的是或否的二元结果,其可以是绝对值或相对值,例如,相对于较早时间的生物体的先前分类。在一种实施方案中,分类是肾脏没有炎症或炎症水平降低。在另一个实施方案中,分类是肾确实具有炎症或炎症水平增加。在一个实施方案中,当第一值大于参考值时,可以确定第一肾脏发炎。
如本文中所描述的,炎症水平可包括炎症的存在。例如,第一值是否超过(例如,大于或小于,取决于第一参数如何定义)可用于确定是否存在炎症,或至少可能性(例如,可能性百分比)。高于阈值的程度可以提供增加的可能性,这可以导致使用多个阈值。另外,上述程度可对应于不同程度的炎症。因此,实施方案可以诊断、分期、预测或监测肾脏中炎症水平的进展。
基于肾脏炎症水平,可以设计治疗计划。炎症可以通过药物、饮食、疗法或手术来治疗。在一些情况下,可以比没有本文描述的方法更早地治疗炎症,因为可以更早地检测炎症的存在。由于检测方法,可降低并发症(包括死亡)的风险。
III.使用尿液CFDNA大小检测膀胱癌
从癌症释放的cfDNA已经被证明与从非癌细胞释放的cfDNA相比是具有不同的长度(31,32)。我们选择了两例肌肉侵入性膀胱癌,推测从下尿路肿瘤释放大量cfDNA可能会产生足够的不同大小的cfDNA片段,从而扰乱排泄尿液的整体大小分布。我们收集了这两名接受根治性膀胱切除术的患者的术前和术后尿液样品,用于全基因组亚硫酸氢盐测序,以评估这些样品的大小和甲基化模式。结果显示膀胱癌病例的尿液cfDNA具有较大比例的长片段。
A.分析
图15A和15B显示来自两例肌肉侵入性膀胱癌的手术前和手术后尿液样品的大小分布。术前样品由线1502和1506表示。术后样品由线1504和1508表示。两种术前样品均显示具有较大比例的长片段的异常大小分布,并且大小分布在术后样品中是正常的。这也反映在具有以下的总结大小统计中:图15A的术前样品:中值131bp,P>70 90.1%,PI 0.10;图15B的术前样品:中位数143bp,P>70 96.2%,PI 0.04;图15A的术后样品:中位数80bp,P>7060.0%,PI 1.6;以及图15B的术后样品:中值93bp,P>70 72.7%,PI 1.61。
除了P>70,可以使用长cfDNA片段>100bp或其它长度的比例。图15A和15B显示大小参数可用于区分具有癌症的样品(术前)和未患癌症的样品(术后)。
在手术后的尿液中的大小分布的归一化表明,手术前观察到的大比例长片段源自切除的肿瘤。这表明所见的较大片段是来自膀胱癌样品的术前样品。从甲基化反卷积可以看出进一步的建议,显示56.2%和78.8%的cfDNA片段来源于术前样品中的膀胱肿瘤。因此,长DNA片段的比例可用于筛选膀胱癌或监测复发。对于图15A和15B,术后膀胱肿瘤的贡献率分别为4.9%和3.1%,其证实了长DNA片段与肿瘤贡献之间的关系。
图16A-16C显示了来自患有膀胱癌的患者的三个排泄尿样的大小分布。所有三名患者均患有肌肉侵入性膀胱癌。对于所有三个样品,长片段的比例增加,并且这也反映在大小汇总统计中(图16A)中值131,P>70 90.1%,FI 0.10;(图16B)中值143,P>70 96.2%,FI0.04;(图16C)中值114,P>70 83.7%,FI 0.16。膀胱癌患者的尿液大小分布中位数为114-143bp,F>70为83-96%,FI小于0.2。这反映了来自膀胱癌患者的尿液具有较大比例的长cfDNA片段,并且大小分布缺乏通常在50-75bp范围内看到的周期性。
我们还测序了经历膀胱肿瘤的经尿道切除术(TURBT)的进行了非肌肉侵入性疾病治疗的另外三个膀胱癌病例的术前尿。一个病例显示了具有较长片段的严重异常大小分布,而另外两个显示正常大小分布。
图17A-17C显示来自三名接受TURBT的非肌肉侵入性膀胱癌患者的三个术前尿样的大小分布。TBR413中长片段的比例增加。汇总大小统计数据为:中位数114bp,P>7083.7%,PI 0.16。另外两个尿液大小分布(TBR406和TBR419)显示了排泄尿的典型大小分布。TBR413被认为在手术前具有非肌肉浸润,但在TURBT后被发现具有肌肉侵入性疾病,并且随后需要根治性膀胱切除术。因此,可以区分癌症的类型,并且异常的大小分布(例如,长片段的统计值高于阈值)可以表明更晚期的疾病。图17A对应于与16C相同的样品。
发现具有异常大小分布的病例(TBR413)具有广泛的膀胱肿瘤,大小为14厘米,这是具有肌肉侵袭的高级别,随后需要根治性膀胱切除。组织学上证实另外两例病例(TBR406和409)具有非肌肉侵入性疾病,在TURBT后没有疾病复发。这些结果表明,具有大肿瘤负荷的肌肉侵入性膀胱癌可能更有可能释放足够的肿瘤DNA以引起异常的尿液大小分布。
B.使用长尿cfDNA检测膀胱癌的方法
图18显示了根据本发明的实施方案,使用尿液cfDNA的大小分析生物体的尿液样品以检测膀胱癌的方法1800的流程图。尿液样品包括源自正常细胞和可能来自与癌症相关的细胞的DNA。在尿样中至少有一些DNA是无细胞的。
在方框1810中,测量对应于各种大小的DNA片段的量。对于多种大小的每种大小,可以测量来自尿液样品的与该大小相对应的多个DNA片段的量。可以以与图14的方框1410类似的方式进行方框1810。
在方框1820中,基于DNA片段的多种大小的量,计算第一参数的第一值。在一个方面,第一参数提供生物样品中DNA片段的大小分布(例如,直方图)的统计测量。在一个实施方案中,第一参数随着DNA片段大小的增加而增加。大小可包括大于50、55、60、65、70、75、80、85、90、95、100、105、110、115或120bp的片段。可以以与图14的方框1420类似的方式进行方框1820。
在框1830,将第一值与参考值比较。可以以与图14的方框1430类似的方式进行方框1830。
在方框1840中,膀胱癌水平的分类基于所述比较来确定。例如,当第一值大于参考值时,可以确定生物体患有膀胱癌。该确定可以是特定水平的癌症,例如,癌症是否是肌肉侵入性的。
如上述结果所示,尿cfDNA的大小分布分析可以识别具有出乎意料的大比例长片段的尿液样品,并且甲基化反卷积能够识别cfDNA片段的来源。在尿路上皮癌的情况下,我们能够鉴定大的cfDNA片段,并且使用甲基化反卷积来确定尿路上皮癌的这种病例的尿路上皮肿瘤来源的片段增加。
基于癌症的水平,可以设计治疗计划。可以通过化疗、药物、饮食、疗法和/或手术来治疗癌症。在一些情况下,可以比没有本文描述的方法更早地治疗癌症,因为可以更早地检测癌症的存在。由于检测方法,可降低并发症(包括死亡)的风险。手术切除原发肿瘤后,膀胱癌的复发率高达70%。如果定期进行无创尿检,该检测可以更早发现复发,也可以减少监测膀胱镜检查的需要或频率,这与不适和尿路感染风险有关。
C.使用cfDNA片段大小来识别晚期侵入性肿瘤
除了检测膀胱癌,可以分析cfDNA片段的大小来指示肿瘤阶段。侵入性高级尿路上皮癌与较大比例的长片段相关。
图19A是显示在对照和具有非肌肉侵入性Ta-T1疾病的膀胱癌患者以及患有肌肉侵入性T2-T4疾病的膀胱癌患者中尿液cfDNA片段的比例长于70bp(P>70bp)的箱线图。对照和患有Ta-T1疾病的膀胱癌患者P>70bp之间无显著差异。患有T2-T4疾病的膀胱癌患者显示较大比例的长尿cfDNA片段(Mann Whitney U检验P=0.03)。因此,长于70bp的片段的比例可用于区分具有T2-T4疾病的那些和没有疾病的那些。
图19B是显示了在对照和具有Ta-T1疾病的膀胱癌患者以及患有T2-T4疾病的膀胱癌患者中尿液cfDNA片段的比例长于105bp(P>105bp)的箱线图。对照和患有非肌肉侵入性(Ta-T1)疾病的膀胱癌患者P>105bp之间无显著差异。肌肉侵入性膀胱(T2-T4)疾病显示较大比例的长尿cfDNA片段(Mann Whitney U检验P=0.005)。因此,长于105bp的片段的比例可用于区分具有T2-T4疾病的那些和没有疾病的那些。
IV.比较血浆和尿液中的异常
癌症可以通过全局低甲基化(33)和拷贝数异常(34)来表征,并已在癌症患者的血浆检测到这些变化(7)。全基因组亚硫酸氢盐测序可以通过1MB组(或可以具有预定长度和/或位置的其他大小区域)确定基因组中的甲基化密度,并基于映射到基因组中的基因座的片段的数量确定是否存在拷贝数变化。可以基于对来自无癌样品的cfDNA测序来确定正常对照中的甲基化密度和拷贝数。如果与对照相比存在大于3的Z-得分差异(或者例如基于期望的灵敏度和特异性选择的其他值),则可以认为CNA和甲基化变化是显著的。可以确定尿液样品的特定阈值,其不同于其他样品(例如血浆)的阈值。
A.尿中的异常反映了肿瘤中的甲基化和CNA变化
我们获得了来自具有肌肉侵入性疾病的膀胱癌患者的成对的肿瘤组织和排泄尿。在尿液cfDNA和原发性膀胱肿瘤中均观察到全面的低甲基化。膀胱肿瘤还显示整个基因组的拷贝数异常。尿cfDNA的增益和损失的位置反映了在肿瘤中看到的那些(图20)。这些结果表明,尿液cfDNA中可观察到的低甲基化和拷贝数异常代表了原发性膀胱癌中出现的异常。
图20显示了Circos图,其显示了根据本发明实施方案的尿cfDNA和膀胱癌组织之间的全局甲基化和拷贝数异常的一致性。染色体位置以顺时针方向以升序表示。从中心到外周的四个环代表:1)膀胱肿瘤甲基化(环2002),2)尿cfDNA甲基化(环2004),3)膀胱肿瘤拷贝数(环2006),和4)尿cfDNA拷贝数(环2008)。1Mb组中的全局甲基化密度在环2002和环2004中表示,显著的低甲基化和高甲基化分别由红色和绿色点表示。这些样品中不存在高甲基化。拷贝数变化在两个外环中表示。拷贝数损失由红点(例如,点2010)表示并且朝向环的中心。拷贝数增加由绿点(例如,点2012)表示并且远离环的中心。灰点(例如,点2014)表示与对照没有显著偏差。
图21A-21E显示了根据本发明实施方案的来自五个膀胱癌患者(A-E)的尿cfDNA的全局甲基化和拷贝数异常的Circos图。内环(例如,环2102)代表甲基化密度,外环(例如,环2104)代表拷贝数变化。低甲基化和拷贝数损失被着色为红色(例如,点2106)并且朝向环的中心,而高甲基化和拷贝数增益被着色为绿色(例如,点2108)并且远离环的中心。灰点(例如,点2110)表示与对照没有显著偏差。图21A中的数据对应于图20中尿液cfDNA环中的数据。
我们在四个样品(图21A、21B、21D、21E)发现在尿cfDNA中全局甲基化的证据,和在所有五个样品中拷贝数异常。值得注意的是,术前确认患有肌肉侵入性疾病的两个病例在超过一半的染色体中显示出大的拷贝数变化(图21A和21B)。图21B除低甲基化之外还显示高甲基化。随后证实在TURBT后具有广泛的肌肉侵入性疾病的病例(图21D)也在染色体1q、9和10q中显示出明显的全局低甲基化和大的拷贝数增加和损失。图21A示出了患者T22的结果,其对应于图15A中的术前大小分布。图21B示出了患者T23的结果,其对应于图15B中的术前大小分布。图21C显示来自图17B中的TBR406的患者的结果。图21D显示来自图17A中的TBR413的患者的结果。图21E显示来自图17C中的TBR419的患者的结果。图21C、图21D和图21E,具有非肌肉侵入性疾病的三个病例显示出轻微的低甲基化和数量和幅度方面的拷贝数差异的相对微弱的证据。
全基因组亚硫酸氢盐测序允许与膀胱癌相关的异常cfDNA大小分布、拷贝数和全局甲基化改变的同时分析。尽管在亚硫酸氢盐转化过程中体内降解和cfDNA损失,尿液cfDNA中检测到的整体低甲基化和拷贝数异常与原发肿瘤组织中看到的变化密切相关。因此,该方法提供了用于评估代表膀胱肿瘤的甲基化状态和拷贝数变异的非侵入性方法。
在膀胱癌中通常观察到拷贝数异常(38)。在来自膀胱癌患者的所有五个尿液样品中都可观察到这些变化。拷贝数异常也可以检测到非常低等级的疾病。
此外,具有肌肉侵入性疾病和高肿瘤负荷的病例更可能显示大小分布、拷贝数和全局低甲基化的突出扰动。从单个亚硫酸氢盐测序运行中实现这些分析的组合可以促进膀胱癌病例的检测,并且还能够区分具有更晚期疾病的病例。甲基化反卷积检测膀胱肿瘤和小肠贡献的相应变化的能力也表明,该方法可以扩展用于检测释放cfDNA的细胞增加的贡献,其具有独特的甲基组学模式,用于检测其他泌尿系统、肾脏或全身状况。
我们测序尿的cfDNA,并且还有从膀胱肿瘤(3级尿路上皮癌,T3)提取的DNA,并且发现在尿中观察到的CNA和全局1MB低甲基化与膀胱肿瘤的变化高度相当。
图22A和22B显示了T22的膀胱癌肿瘤(22A)和cf尿液(22B)的Circos图。内环(例如,环2202)代表甲基化密度,外环(例如,环2204)代表拷贝数变化。低甲基化和拷贝数损失被着色为红色(例如,点2206)并且朝向环的中心,而高甲基化和拷贝数增益被着色为绿色(例如,点2208)并且远离环的中心。灰点(例如,点2210)表示与对照没有显著偏差。比较膀胱癌肿瘤和cf尿液的circos图,两者都有全局低甲基化。膀胱肿瘤和尿液中也存在大量CNA,这两种异常的位置几乎相同。由于相似性,可以使用cf尿液异常来检测膀胱肿瘤。图22B对应于用于图20的相同样品。
B.膀胱癌可使高甲基化升高
通过分析cfDNA的甲基化检测癌症不是常规的,但我们发现,高甲基化也可以用于确定癌症水平的分类。我们鉴定了1,082,774个CpG位点,这些位点在导致尿液cfDNA的正常组织(血细胞、肾脏、尿路上皮)中始终未甲基化(例如<2%)。未甲基化可以指甲基化少于2%、5%或10%的位点。这些位点在肿瘤中更常被甲基化,因此与正常组织相比是高甲基化的。例如,高甲基化位点可以超过30%、40%、50%、60%、70%、80%或90%甲基化。我们计算了来自膀胱癌病例和对照的尿样中这些CpG位点的总甲基化密度。
图23A显示了膀胱癌病例和对照中在这些1,082,774个CpG位点的总体高甲基化密度的箱线图。与对照相比,膀胱癌病例显示出更高的总甲基化密度。图23B显示使用高甲基化密度检测癌症的ROC曲线。AUC为0.814。
C.术后尿液中不存在术前尿液中的CNA和低甲基化
图24A-24D示出了两个进行根治性膀胱切除术的膀胱癌患者(T22和T23)的术前(图24A和图24C)和术后(图24B和图24D)cf尿液。内环(例如,环2402)代表甲基化密度,外环(例如,环2404)代表拷贝数变化。低甲基化和拷贝数损失被着色为红色(例如,点2406)并且朝向环的中心,而高甲基化和拷贝数增益被着色为绿色(例如,点2408)并且远离环的中心。灰点(例如,点2410)表示与对照没有显著偏差。在术前尿液中可清楚观察到与膀胱癌相关的CNA和低甲基化(图24A和24C),而术后样品中的cf尿液(图24B和24D)正常,拷贝数和甲基化水平与无癌对照相当。
图25A-25D显示了两名患者的全局甲基化和CNA的术前和术后Circos图。图25A和图25B是患有3cm T1HG疾病的患者的手术前和手术后的circos图。术后Circos图显示术前样品中所见的全局低甲基化和CNA的清除。病理学证实了尿路上皮肿瘤的明显边缘,并且患者未发生复发,获得了术后样品。
图25C和图25D是患有T3a HG疾病的患者的术前和术后circos图。术后circos图显示全局低甲基化和CNA的持续存在。病理学报告证实存在肌肉侵入性疾病,肿瘤存在于切除边缘并且存在残留疾病。因此,可以使用全基因组亚硫酸氢盐测序来寻找残留疾病的存在,并且可以用于对经历膀胱癌治疗的患者中的肿瘤衍生的cfDNA进行纵向监测。
甲基化水平和拷贝数异常的分析可有助于评估癌症治疗(包括手术)的成功。此外,分析可以监测癌症的缓解、进展或严重程度。
D.可在无细胞尿液和尿液沉淀中检测CNA和低甲基化
图26是显示具有低恶性潜能的非侵入性(Ta)乳头状尿路上皮肿瘤(PUNLMP)的膀胱癌患者中的甲基化和拷贝数异常的Circos图。内环表示甲基化密度,外环表示拷贝数变化。低甲基化和拷贝数损失被着色为红色并且朝向环的中心,而高甲基化和拷贝数增益被着色为绿色并且远离环的中心。灰点表示与对照没有显著偏差。图中的数据来自对患者的尿液进行测序。染色体10中的拷贝数增加(部分2602)可以在具有低等级疾病和低级别组织学的患者中看到。因此,可以使用拷贝数异常来识别低级别疾病或早期癌症。
通过离心,尿样可被分离成细胞和无细胞部分,无细胞部分进一步经受滤波。大多数尿液样品都有小但可见的尿液沉淀,可以从中提取DNA。尿沉淀可以是在3000xg离心后在管底部的内容物,并且可以包括细胞材料。我们从膀胱癌尿液样品中提取DNA以进行全基因组亚硫酸氢盐测序。
图27A和27B显示了从相同排泄尿液获得的来自膀胱癌患者(T23)的cf尿液(图27A)和尿液沉淀(图27B)的Circos图。内环(例如,环2702)代表甲基化密度,外环(例如,环2704)代表拷贝数变化。低甲基化和拷贝数损失被着色为红色(例如,点2706)并且朝向环的中心,而高甲基化和拷贝数增益被着色为绿色(例如,点2708)并且远离环的中心。灰点(例如,点2710)表示与对照没有显著偏差。当存在并且提取大量DNA时,可以对尿沉淀进行测序以显示反映膀胱癌的全局低甲基化和CNA。尿沉淀中CNA的低甲基化和位置与cf尿液中的变化相当。
尿沉淀大小在不同样品之间变化。一些尿液样品在离心后没有可见的尿沉淀(即,低细胞含量)。在图27A和27B中,与无细胞DNA相比,尿沉淀中的CNA和低甲基化的幅度更高,这表明基于沉淀的CNA在某些情况下可能更敏感。当存在尿沉淀时,在某些情况下来自肿瘤细胞的比例贡献可能更高。
尿沉淀分析通过细胞学正常进行分析。在实施方案中,可以对尿沉淀进行测序。尿沉淀可以与cfDNA类似地测序。在一些情况下,尿沉淀DNA可以被片段化(例如,超声处理)以形成较小大小的DNA,以通过与cfDNA相同或相似的技术进行测序。因此,尿液沉淀的分析可以以与cf尿液相同或相似的方式用于检测疾病。当与尿液分析结合时,尿液沉淀的分析可以增加特异性和/或敏感性。
E.可以在尿液但不是血浆中检测CNA和整体低甲基化
在两名没有转移证据的膀胱癌患者中,CNA和低甲基化是在尿cfDNA而不是血浆cfDNA中检测。
图28A-28D显示了来自两个膀胱癌患者(T22和T23)的cf尿液(图28A和图28C)和血浆(图28B和图28D)的Circos图。内环表示甲基化密度,外环表示拷贝数变化。低甲基化和拷贝数损失被着色为红色并且朝向环的中心,而高甲基化和拷贝数增益被着色为绿色并且远离环的中心。灰点表示与对照没有显著偏差。同时获得尿液和血浆样品。这些图表明,与血浆的cfDNA相比,尿液的cfDNA中基于甲基化水平或拷贝数检测膀胱癌将更容易,因为甲基化水平和拷贝数异常在血浆中没有显示或没有明显显示。
图29A和29B显示了两个膀胱癌病例T22和T23的基因组中1MB组的百分比,其显示CNA或低甲基化的证据。对于T23,存在血浆中CNA的证据,例如在染色体5p处。这种拷贝数增加在尿液的cfDNA中也可见,但与血浆相比,尿液中的其他CNA和全局低甲基化更明显。T23完成新辅助化疗疗程但随后在根治性膀胱切除术后约6个月发生脑转移。这些图表还显示,与血浆的cfDNA相比,尿液的cfDNA中基于甲基化水平或拷贝数检测膀胱癌将更容易,因为更多的组显示尿液中的CNA或低甲基化而不是血浆。
F.识别特定器官中的癌症的方法
图30是示出根据本发明的实施方案的通过分析受试者的第一样品和血液样品来识别受试者的第一器官中的癌症的方法的流程图。当第一样品离开生物体并且不同于血液样品时,第一样品来自第一器官或通过第一器官。第一样品和血液样品都包括源自正常细胞和可能来自与癌症相关的细胞的DNA。在第一样品和血液样品中,至少一些DNA是无细胞的。第一样品的实例是尿液、唾液或粪便。
在方框3010中,分析多个来自所述生物样品的DNA分子。DNA分子的分析可包括鉴定DNA分子在生物体基因组中的位置,并任选地(例如,当进行甲基化分析时)确定DNA分子是否在一个或多个位点甲基化。甲基化状态可包括特定胞嘧啶残基是5-甲基胞嘧啶还是5-羟甲基胞嘧啶。
可以通过从甲基化感知测序接收序列读段来执行该分析,并且可以只对预先从DNA获得的数据进行分析。在其他实施方案中,分析可以包括实际测序或者获得数据的其他有效步骤。序列读段可以从各种测序技术、PCR技术、阵列和用于鉴定片段序列的其他合适技术中获得。可以如本文所述获得序列读取位点的甲基化状态。
甲基化感知排序的一个例子包括用亚硫酸氢钠处理DNA,然后进行DNA测序。在另一个实例中,可以在不使用亚硫酸氢钠的情况下进行甲基化感知测序,使用单分子测序平台,其将允许直接阐明DNA分子(包括N6-甲基腺嘌呤、5-甲基胞嘧啶和5-羟甲基胞嘧啶)的甲基化状态而没有亚硫酸氢盐转化(AB Flusberg等人,2010Nat Methods;7:461-465;JShim等人,2013Sci Rep;3:1389.doi:10.1038/srep01389);或通过甲基化胞嘧啶的免疫沉淀(例如,通过使用针对甲基胞嘧啶的抗体或通过使用甲基化DNA结合蛋白或肽(LGAcevedo等人,2011Epigenomics;3:93-101),然后进行测序;或通过使用甲基化-敏感性限制酶,然后测序。在另一个实施方案中,使用非测序技术,例如阵列、数字PCR和质谱。
对于受试者的多个染色体区域中的每个染色体区域,重复方框3020-3050。多个染色体区域可以是非重叠的。基因组可以分成长度为1兆碱基(Mb)的区域,或其他区段长度,例如500Kb或2Mb。一个区域的大小可以是1Mb,或者其他一些相等大小。然后,整个基因组可以包括大约3,000个区域,每个区域可以具有预定的大小和位置。而且,如上所述,这样的预定区域可以变化以适应特定染色体的长度或要使用的特定数量的区域,以及本文提到的任何其他标准。如果区域具有不同的长度,则可以使用这样的长度来归一化结果,例如,如本文所述。
在框3020,对每个第一样品和血液样品,确定染色体区域是否表现出拷贝数异常或低甲基化的分类。可以通过执行框3030-3050来实现框3020。关于检测拷贝数异常或低甲基化的进一步细节可以在美国专利号8,741,811和9,121,069以及PCT公开WO2014/043763中找到,其通过引用整体并入。
在方框3030,基于所识别的位置,将各样品的DNA分子的相应组识别为来自所述染色体区域。各组包括位于染色体区域的多个基因座中的每一个的至少一个DNA分子。在一个实施方案中,所述组可以是与染色体区域的特定单倍型对齐的片段,例如,如美国专利号9,121,069中所述,其通过引用整体并入。在另一个实施方案中,该组可以是与染色体区域对齐的任何片段,例如,如美国专利号9,121,069中所述。
在方框3040,计算机系统计算DNA分子的相应组中的相应值。各自的值定义了各组DNA分子的性质。该性质可以是甲基化水平、第一相应组的DNA分子的量,或第一相应组的DNA分子的大小分布的统计值。作为量的示例,相应值也可以是归一化值,例如,区域的标签计数除以样品的标签计数的总数或参考区域的标签计数的数量。相应的值也可以是与另一个值的差或比率(例如,对于另一个单倍型),从而提供该区域的差异性质。
在框3050,将相应的值与参考值比较,以确定第一染色体区域是否表现出异常的分类,例如,缺失或扩增的拷贝数异常、低甲基化或高甲基化的甲基化异常、或错配。该参考值可以是本文描述的任何阈值或参考值。例如,参考值可以是针对正常样品确定的阈值。当使用单倍型之间的差异时,相应的值可以是两种单倍型的标签计数的差异或比率,并且参考值可以是用于确定存在统计学上显著的偏差的阈值。作为另一个例子,参考值可以是另一个单倍型或区域的标签计数或大小值,并且比较可以包括取差异或比率(或其函数),然后确定差异或比率是否大于阈值。
参考值可基于其他区域的结果。例如,如果相邻区域也显示偏差(尽管与一个阈值相比较小,例如,z得分为3),则可以使用较低的阈值。例如,如果三个连续区域都高于第一阈值,则癌症可能更可能。因此,第一阈值可以低于从非连续区域识别癌症所需的另一阈值。具有甚至具有小偏差的三个区域(或多于三个)可以具有足够低的机会效应概率,从而可以保持灵敏度和特异性。
在框3060,癌症的第一水平基于分类为表现出第一样品异常的染色体区域的第一量是否高于第一阈值来确定。作为实例,对应于癌症第一水平的分类可以是生物体是否患有癌症、癌症的阶段和癌症的预后。在一个实施方案中,对所有异常区域进行计数,并且使用单个阈值而不管区域出现在何处。在另一个实施方案中,阈值可以基于计数的区域的位置和大小而变化。例如,可以将特定染色体或染色体的臂上的区域的量与该特定染色体(或臂)的阈值进行比较。可以使用多个阈值。例如,特定染色体(或臂)上的异常区域的量必须大于第一阈值,并且基因组中的异常区域的总量必须大于第二阈值。
在框3070,癌症的第二水平基于分类为表现出血液样品异常的染色体区域的第二量是否高于第二阈值来确定。方框3070可以以与方框3060类似的方式进行。
在方框3080中,当癌症的第一水平表示受试者患有癌症和癌症的第二水平表明受试者没有癌症时确定确定受试者具有第一器官的癌症。这种情况在图28A-28D中举例说明。因此,全基因组亚硫酸氢盐测序还能够鉴定尿路上皮癌患者的无细胞尿液和尿沉淀中的整体低甲基化和拷贝数异常(CNA)。这些变化对应于在膀胱肿瘤中看到的变化,并且在体循环中是不可检测的。
在癌症确定后,可以设计治疗计划。可以通过化疗、药物、饮食、疗法和/或手术来治疗癌症。在一些情况下,可以比没有本文描述的方法更早地治疗癌症,因为可以更早地检测癌症的存在。由于检测方法,可降低并发症(包括死亡)的风险。
G.针对CNA确定癌症水平
在方框3060和3070的区域的量的阈值可取决于不平衡对于计数的区域有多强。例如,用作确定癌症分类的阈值的区域的量可以取决于用于检测每个区域中的异常的特异性和灵敏度(异常阈值)。例如,如果异常阈值低(例如,z得分为2),则可以将量阈值选择为高(例如,150)。但是,如果异常阈值高(例如,z得分为3),则量阈值可以低(例如,50)。显示异常的区域的量也可以是加权值,例如,显示高不平衡的一个区域可以被加权高于仅显示稍微不平衡的区域(即,对于异常存在更多的分类而不仅仅是正的和负的)。
因此,显示归一化标签计数(或该组的其它性质的相应值)的显著过度或不足表示的染色体区域的量(其可以包括数目和/或大小)可用于反映疾病的严重程度。具有异常归一化标签计数的染色体区域的量可以通过两个因素确定,即肿瘤组织中染色体异常的数量(或大小)和生物样品(例如血浆)中肿瘤衍生DNA的分数浓度。更晚期的癌症倾向于表现出更多(和更大)的染色体异常。因此,在样品(例如血浆)中可能检测到更多与癌症相关的染色体异常。在患有更晚期癌症的患者中,更高的肿瘤负荷将导致血浆中肿瘤衍生的DNA的更高分数浓度。结果,在血浆样品中更容易检测到肿瘤相关的染色体异常。
在癌症筛查或检测的情况下,显示出归一化标签计数(或其它值)的过度或不足表示的染色体区域的量可被用于确定受试者患有癌症的可能性。使用±2(即z得分>2或<-2)的截止值,预期测试区域的大约5%的z得分仅由于偶然从对照受试者的平均值显著偏离。当整个基因组被分成1个Mb区段时,整个基因组将有大约3,000个区段。因此,预计大约150个区段具有>2或<-2的z得分。
因此,对于具有z得分>2或<-2的区段数量的截止(阈值)值150可用于确定癌症是否存在。可以选择具有异常z得分(例如,100、125、175、200、250和300)的区段的数量的其他截止值以适合诊断目的。较低的截止值,例如100,将导致更灵敏的测试,但更低的特异性和更高的截止值将更具特异性但不太敏感。可以通过增加z得分的截止值来减少假阳性分类的数量。例如,如果截止值增加到3,那么只有0.3%的区段会错误地为正。在这种情况下,可以使用超过3个具有异常z得分的区段来指示癌症的存在。也可以选择其他截止值,例如1、2、4、5、10、20和30,以适应不同的诊断目的。然而,检测癌症相关染色体异常的灵敏度会随着诊断所需的异常区段数量的增加而降低。
用于提高灵敏度而不牺牲特异性的一个可能的方法是考虑相邻的染色体段的结果。在一个实施方案中,z得分的截止值保持>2且<-2。然而,仅当两个连续区段显示相同类型的异常时,例如,两个区段的z得分>2,染色体区域才被分类为潜在异常。如果归一化标签计数的偏差是随机误差,则在相同方向上具有两个连续区段错误地为正的概率将是0.125%(5%x 5%/2)。另一方面,如果染色体异常包含两个连续的区段,则较低的截止值将使得对血浆样品中的区段的过度或不足表示的检测更敏感。由于归一化标签计数(或其他值)与对照受试者的平均值的偏差不是由于随机误差,因此连续分类要求不会对灵敏度产生显著的不利影响。在其他实施方案中,可以使用更高的截止值将相邻区段的z得分加在一起。例如,可以对三个连续区段的z得分求和,并且可以使用截止值5。这个概念可以扩展到三个以上的连续区段。
量和异常阈值的组合也可以取决于分析的目的,以及生物体的任何在先知识(或其缺乏)。例如,如果筛查正常健康人群的癌症,那么通常会使用高特异性,可能在区域数量方面(即区域数量的高阈值)和当区域被识别为具有异常时在异常阈值方面。但是,对于风险较高的患者(例如患者抱怨肿块或家族史、吸烟者、HPV病毒、肝炎病毒或其他病毒),则阈值可能会降低,以便具有更高的敏感性(更少的假阴性)。
在一个实施方案中,如果采用1-MB分辨率和肿瘤来源的DNA的6.3%的检测下限用于检测染色体异常,则每1-Mb段中分子数量需要为60,000。这将被转化为全基因组的大约1.8亿(60,000读段/Mb×3,000Mb)可比对读段。
H.针对甲基化确定癌症水平
对于甲基化,方面可以与CNA相同。在一个实施方案中,可以确定所有区域的甲基化水平并将其与阈值进行比较。
在一些实施方案中,第一甲基化水平可以对应于其甲基化水平超过参考值的区域数量。例如,可以鉴定生物体基因组的多个区域。可以使用本文提到的标准例如某些长度或某些位点数量来识别这些区域。可以在每个区域内识别一个或多个位点(例如CpG位点)。可以为每个区域计算区域甲基化水平。第一甲基化水平针对第一区域。将每个区域甲基化水平与相应的区域截止值进行比较,所述区域截止值可以相同或在区域之间变化。第一区域的区域截止值是第一截止值。相应的区域截止值可以是来自参考甲基化水平的指定量(例如,0.5),从而仅计数与参考具有显著差异的区域,可以从非癌症受试者确定所述参考。
其区域的甲基化水平超过相应区域截止值的区域的第一数量可以被确定,并与阈值比较以确定分类。在一个执行方式中,阈值是百分比。将第一数量与阈值进行比较可以包括在与阈值进行比较之前将第一数量的区域除以第二数量的区域(例如,所有区域),例如,作为归一化过程的一部分。
如上所述,在生物样品中的肿瘤DNA的浓度分数可以用来计算第一截断值。可以简单地估计分数浓度大于最小值,而可以标记分数浓度低于最小值的样品例如为不适合分析。可以基于肿瘤的甲基化水平相对于参考甲基化水平的预期差异来确定最小值。例如,如果差异是0.5(例如,用作截止值),则需要某个肿瘤浓度足够高以观察到这种差异。
V.CNA、全局甲基化和肿瘤贡献的组合
全基因组亚硫酸氢盐测序允许由甲基化反卷积同时评估全局甲基化状态、拷贝数异常(CNA)以及膀胱肿瘤的贡献。我们评估了这些分析方法在46名膀胱癌患者和39名对照中检测膀胱癌的能力。我们根据对照的平均值加上三个标准偏差建立了正常的上限。使用这些标准没有对照测试呈阳性,特异性为100%。
A.参数组合的灵敏度和特异性结果
图31A-31C分别显示了46个膀胱癌患者和39个对照的具有低甲基化的1mb组的百分比、具有拷贝数异常的1mb组的百分比和来自甲基化反卷积的膀胱肿瘤贡献的箱线图。图31D-31F显示了低甲基化的相应ROC曲线,其中,图31D示出了对应于图31A的ROC曲线,图31E示出了对应于图31B的ROC曲线,图31F示出了对应于图31C的ROC曲线。使用组织特异性甲基化特征以及在不同组织中变化的非组织特异性甲基化特征来获得膀胱肿瘤贡献。
具有低甲基化(图31A)、CNA(图31B)和膀胱肿瘤贡献(图31C)的1mb组的比例在膀胱癌的情况下与对照组相比显著更高(Mann Whitney U检验P<0.001)。使用平均值加上对照的三个标准偏差作为正常的上限,没有对照测试为阳性。使用相同的截止值,可以用三个参数中的至少一个鉴定46个膀胱癌病例中的43个。
使用具有显著低甲基化的1mb组的百分比,我们能够以71.7%的灵敏度检测膀胱癌(ROC AUC=0.93)(图31D)。使用具有显著CNA的1mb组的百分比,我们能够以63.0%检测膀胱癌(ROC AUC=0.90)(图31E)。使用来自甲基化反卷积的膀胱肿瘤贡献,我们能够以78.3%的灵敏度检测膀胱癌(ROC AUC=0.93)(图31F)。如果三个参数中的任何一个指示癌症,则可以通过考虑检测到癌症来组合这三个参数。通过组合所有三个参数,对于测试三个参数中的至少一个为阳性的膀胱癌病例,灵敏度增加至93.4%。特异性为100%。通过结合所有三个参数,可以检测到所有29个病例具有高级别或侵入性疾病(T1或以上)。
如果参数的任何组合指示癌症,可以通过考虑检测的癌症组合参数。在一些实施方案中,可能需要最少数量的参数来检测癌症。例如,可能需要两个、三个或更多个参数。一些实施方案可能需要某些参数(例如,CNA、低甲基化或反卷积)来指示癌症以便检测癌症。表6显示了组合参数时的检测结果:
表6.使用不同参数组合的灵敏度结果。
这些结果可与尿细胞学、目前的护理标准进行比较。46例膀胱癌患者中有42例在泌尿外科手术前6个月内将1至3份尿样送去进行尿液细胞学检查,作为常规治疗的一部分。42例膀胱癌患者中只有4例(9.5%)尿细胞学阳性。尿细胞学阳性的4例病例均为侵袭性(T2b-4)高级别疾病。尿细胞学检测膀胱癌的准确性低于使用低甲基化、CNA和/或膀胱肿瘤贡献。
作为一个例子,我们测定了17例患有非侵袭性低级别疾病(Ta LG)的膀胱癌病例。我们评估了分析方法检测低级别疾病的能力。
图32A、32B和32C分别显示了患有非侵袭性(Ta)低级别疾病的17个膀胱癌患者和39个对照的具有低甲基化的1mb组的百分比、具有拷贝数异常的1mb组的百分比和来自甲基化反卷积的膀胱肿瘤贡献的箱线图。图32D示出了图32A的相应ROC曲线。图32E示出了图32B的相应ROC曲线。图32F示出了图32C的相应ROC曲线。使用三个参数中的至少一个,可以鉴定17名患有非侵袭性低级别疾病的患者中的14名。
使用具有显著低甲基化的1mb组的百分比,我们能够以41.1%的灵敏度检测膀胱癌(ROC AUC=0.89)(图32D)。使用具有显著CNA的1mb组的百分比,我们能够以17.6%检测膀胱癌(ROC AUC=0.78)(图32E)。使用来自甲基化反卷积的膀胱肿瘤贡献,我们能够以47.0%的灵敏度检测膀胱癌(ROC AUC=0.81)(图32F)。通过组合所有三个参数,对于测试三个参数中的至少一个为阳性的膀胱癌病例,灵敏度增加至82.4%。特异性为100%。
也可以使用多于三个参数。表7显示了使用不同截止值和组合的多达五个参数的灵敏度和特异性:低甲基化、CNA、反卷积、高甲基化、使用1个错配的突变负荷。显示的截止值是对照的平均值加上3个标准差(SD)和对照的平均值加2SD。参数可以使用“或”组合(如果在至少一个参数中为阳性,则测试为阳性)或使用“与”(如果在所有5个参数中为阳性则测试为阳性)。
表7.使用五个参数的不同组合的灵敏度结果。
使用对照的平均加2SD为截止值,并使用“或”组合五个参数,可以实现95.7%的灵敏度和82.1%的特异性。或者,使用逻辑回归模型,基于留一分析,可以实现91.3%的灵敏度和89.7%的特异性。
留一分析可以用来测试逻辑回归模型的性能。在这种分析中,一个样品用作测试样品。所有其他样品用作训练集以拟合逻辑回归模型,从而获得模型的参数(例如,系数和阈值)。然后将第二个样品用作测试样品,并将所有其他样品用作训练集以确定系数。然后依次对每个样品重复该过程。
在一些实施方案中,对于患有癌症,使用基于0.5的概率为截止值的逻辑回归,患有癌症的概率=1-1/(1+exp[-(-0.4413124*低甲基化-0.68652846*CNA-0.44981374*肿瘤分数贡献+1.02332221*高甲基化+0.07711755*错配负荷+1.35436873)])。
通过调节截止值到平均值加3SD,可以实现95.7%的灵敏度和100%的特异性。在其他实施方案中,可以使用其他分类算法,例如但不限于决策树、支持者向量机、朴素贝叶斯分类器、K最近邻、随机森林树和所有其他机器学习算法。因此,本文描述的分析方法可用于检测低级疾病。
B.使用CNA、全局甲基化和肿瘤贡献分析尿样的方法
图33显示了分析生物体的尿液样品的方法3300。生物体可以是本文描述的任何生物体。尿液样品可包括源自正常细胞且可能来自与癌症相关的细胞的DNA。至少一些DNA在尿液样品中可以是无细胞的。
在方框3310中,分析多个来自尿液样品的DNA分子。分析DNA分子可以包括鉴定DNA分子在生物体基因组中的位置。鉴定位置可以通过计算机系统。
在框3320,确定针对多个染色体区域中的每个染色体区域分类染色体区域是否表现出拷贝数异常或甲基化异常中的至少一种。甲基化异常可以是低甲基化或高甲基化。在一些实施方案中,异常可以仅包括低甲基化或高甲基化中的一种。例如,异常可以是拷贝数异常或低甲基化中的至少一种。在一些实施方案中,确定染色体区域是否表现出错配的异常的分类。
在框3330,可以基于所识别的位置通过识别尿样的一组DNA分子为来自染色体区域来确定分类。该组可包括位于染色体区域的多个基因座中的每一个的至少一个DNA分子。
在框3340,分类还可以通过用计算机系统计算该组DNA分子的值来确定。各自的值可定义各组DNA分子的性质。该性质可以是拷贝数或甲基化水平中的至少一种。任选地,该性质可以是错配突变负载,如本文所述。
在框3350,分类还可以通过比较值与参考值进一步确定。参考值可以确定正常值与异常值之间的截止值。参考值可以基于z得分为3。例如,参考值可以是拷贝数的值,超过该值将被认为是拷贝数异常。在一些实例中,参考值可以是甲基化水平的值,超过该值,该区域将被认为是高甲基化或低甲基化的。
在框3360,癌症的第一水平可以基于分类为表现出尿液样品拷贝数异常的染色体区域的第一量是否高于第一阈值来确定。第一阈值可以将已知患有癌症的生物与可能患有或可能不患有癌症的生物分开。在其他实施方案中,第一阈值可以将已知不患有癌症的生物体与可能患有或可能不患有癌症的生物体分开。
在框3370,癌症的第二水平可以基于分类为表现出尿液样品低甲基化或高甲基化的染色体区域的第二量是否高于第二阈值来确定。第二阈值可以类似于第一阈值,除了第二阈值可以应用于甲基化水平而不是拷贝数。
在框3380,癌症的第三水平可以基于肿瘤组织的分数贡献是否高于第三阈值来确定。方法3300还可以包括确定肿瘤组织的分数贡献。在各种实施方案中,可以通过使用肿瘤特异性体细胞突变、肿瘤特异性甲基化标记、肿瘤特异性片段末端模式或片段大小分析来确定分数贡献(例如,肿瘤DNA在统计学上比非肿瘤DNA长)。关于使用肿瘤特异性体细胞突变确定分数贡献的进一步细节描述于美国专利公开号2014/0100121中。关于使用肿瘤特异性甲基化标记的进一步细节描述于美国专利公开号2014/0080715和2016/0017319以及PCT专利公开号WO2014/043763中。关于使用肿瘤特异性片段末端模式的进一步细节描述于美国专利公开号2017/0024513中。使用片段大小分析的进一步细节描述于美国专利公开号2016/0201142中。出于所有目的,所有这些专利申请的内容通过引用并入本文。肿瘤组织的分数贡献也可以通过本文描述的反卷积方法确定。第三阈值可以类似于第一阈值或第二阈值,除了第三阈值可以应用于分数贡献而不是拷贝数或甲基化水平。
附加阈值可以是癌症的附加水平。例如,可以基于分类为表现出错配的染色体区域的量是否高于阈值来确定癌症水平。
在框3390,当癌症的第一水平、癌症的第二水平或癌症的第三水平中的至少一个指示生物体患有癌症时可确定生物体具有癌症。当至少两个水平或三个水平表明该生物体患有癌症时,可以确定该生物体患有癌症。可以使用癌症的附加水平。当至少一个水平表明生物体患有癌症时,可以确定该生物体患有癌症。在一些实施方案中,当所有水平表明生物体患有癌症时,可以确定生物体患有癌症。在其他实施方案中,当超过50%、60%、70%、80%或90%的水平表明该生物体患有癌症时,可以确定该生物体患有癌症。
方法3300可包括以本文描述的任何方式治疗生物体。
VI.使用错配和浅深度测序估计肿瘤负荷
我们利用具有一个错配的读取的比例来使用浅深度测序估计肿瘤负荷。这可用于区分膀胱癌病例和正常对照。尿路上皮癌的特征在于体细胞突变的积累。膀胱癌可能具有高的体细胞突变率(每兆碱基约8个突变)(Glaser等,Nat.Rev.Urol.,2017)。源自膀胱癌患者的膀胱肿瘤的尿液cfDNA可能具有与参考基因组相比显示错配的片段的比例增加。由于种系变异、体细胞突变或测序错误,与参考基因组相比可能出现错配。尽管可以评估与参考基因组相比具有错配的读段的数量,但是在人类基因组的小于1X覆盖率的全基因亚硫酸氢盐测序不足以准确鉴定体细胞突变。来自膀胱癌病例和对照的尿液cfDNA将具有共同的种系变异,其可以被检测为与参考基因组的错配。除此之外,与人参考基因组相比,膀胱癌病例中体细胞突变的较高发生率可导致较大比例的具有单一错配的读段。
图34A是49个膀胱癌病例和39个对照中具有一个错配的读段百分比的箱线图。箱线图显示,与对照组相比,膀胱癌病例的具有一个错配的读段百分比较高(Mann Whitney U检验P<0.001)。图34B显示ROC曲线的AUC为0.79。具有错配的读段的比例可用于检测膀胱癌。
图35显示了分析生物的生物样品的方法3500。生物样品可包括源自正常细胞且可能来自与癌症相关的细胞的DNA。至少一些DNA在生物样品中可以是无细胞的。生物样品可以是尿液样品。
在方框3510,接收对应于生物样品的DNA分子的多个序列读段。序列读段可以来自全基因组亚硫酸氢盐测序。序列读段可以是低于1X、1X至2X、2X至3X、3X至5X或5X至10X的深度覆盖。多个序列读段可以少于8千万个唯一可映射的读段,包括少于5千万个唯一可映射的读段,少于4千万个唯一可映射的读段,少于3千万个唯一可映射的读段,或少于2千万个唯一可映射的读段。
在框3520,确定序列读段的基因组位置,例如,如本文所述。例如,可以基于参考基因组,使用计算机确定基因组位置。参考基因组可以是群体的参考基因组或对应于生物体(例如人)的代表。在另一个实施方案中,参考基因组可以通过包括生物体的种系(组成)基因组而对受试者具有特异性。
在框3530,将序列读段与参照基因组进行比较,以确定与参照基因组具有一个错配的序列读段。作为实例,错配可以是体细胞突变、测序错误或天然错配的结果(例如,由受试者的种系基因组和参考基因组的差异导致的多态性)。可以使用每个序列读段的多个错配,但是性能可能比仅使用一个错配更差。每个DNA分子通常小于100bp,并且在短的DNA片段中观察到两个或更多真实体细胞突变的可能性很低。
在方框3540,基于与参照基因组具有一个错配的序列读段的计数来确定参数。在一些实施方案中,序列读段的计数可以是具有不超过一个错配的序列读段。在其他实施方案中,序列读段的计数可包括具有一个或多个错配的序列读段,例如,两个、三个或更多个错配。参数可以是具有一个错配的序列读段的归一化计数。例如,参数可以是具有一个错配的序列读段的密度、浓度或百分比。在一些情况下,参数可以等于具有一个错配的序列读段的计数。
在框3550,将参数与阈值进行比较。可以使用关于健康生物的错配的数据和/或关于具有癌症的生物的错配的数据来确定阈值。例如,阈值可以设置为高于健康生物群体的平均参数的1、2或3个标准偏差。
在框3560,使用参数与阈值的比较来确定癌症水平的分类。如果参数高于阈值,则癌症水平的分类可以是生物体患有癌症。如本文所述,可以使用另外的分类。例如,癌症水平的其他分类可以使用拷贝数异常、低甲基化、高甲基化或肿瘤贡献,其可以根据本文描述的方法确定。例如,检测癌症可以包括基于错配的参数以外的参数。
方法3500可以不包括确定错配是否是序列错误。通过不确定错配的原因,确定癌症水平的分类可以更有效,而不会显著降低准确性。
方法3500可以包括通过本文描述的任何技术治疗癌症。
VII.尿液宏基因组分析可以识别膀胱癌病例和对照
泌尿菌群的研究已经提出,在泌尿道的微生物除了尿路感染以外还与泌尿系统疾病相关联。我们对未映射到人类基因组的测序的cfDNA读段进行了宏基因组分析。未映射的读段被映射到病原体中存在的1M标记基因的参考。病原体可包括~13,500个细菌和古细菌基因组和~3,500个病毒基因组,并可使用BSMap进行映射。每个样品平均可以将25,000个读段映射到标记基因参考。Metaphlan2用于鉴定丰富物种表中不同微生物的比例贡献。
图36是显示三种膀胱癌病例和五种对照的不同微生物种类的相对丰度的热图。相对丰度可以定义为映射到特定物种的读段/映射到宏基因组数据库的读段总数除以特定微生物的大小×1e9(RPKM)。三种膀胱癌病例为T188、T179和TBR1875。五个对照是TBR532、T159、T56、T59和T29。每条垂直线代表一个物种。颜色表示每个物种的对数百分比丰度,使得红色(例如,部分3602)表示高,而蓝色(例如,部分3604)表示低比例贡献。图36显示膀胱癌病例和对照可以分开。膀胱癌病例比对照组更丰富的物种包括:Halonotius、嗜热球菌、氨氧化古菌和放线菌。在对照中比在膀胱癌病例中更丰富的物种包括:短杆菌属和诺卡氏菌属。因此,未映射到人类基因组的cfDNA读段可用于检测膀胱癌。
显示膀胱癌病例中与对照中相比差异相对丰度的顶部微生物包括以下细菌:Granulicella、Actinobaculum schaalii、结核分枝杆菌/牛分枝杆菌/非洲分枝杆菌/卡氏分枝杆菌、放线菌、Ilumatobacter coccineus、Candidatus Koribacter、Mobiluncuscurtisii、氧化亚铁微酸菌、嗜热氯酸假丝酵母、Candidatus Korarchaeum cryptofilum、甲烷杆菌、海洋放线菌、Methanocella conradii、短杆菌和结核分枝杆菌。
顶部微生物还包括以下古细菌:甲烷囊菌、甲烷球菌、Methanolinea tarda、火山热原体、Methanosphaerula palustris、嗜酸热硫化叶菌、Methanosphaera stadtmanae、Methanoplanus petrolearius、Methanocella arvoryzae、Methanofollis liminatans、和风沙甲烷球菌。
图37显示了分析人尿样的方法3700。尿液样品可包括源自正常细胞且可能来自与癌症相关的细胞的DNA。至少一些DNA在尿液样品中可以是无细胞的。
在方框3710,获得对应于尿样品的DNA分子的多个序列读段。可以以与本文描述的其他样品测量步骤类似的方式执行框3710。
在框3720,对于多个序列读段中的每个序列读段,可以通过计算机系统将序列读段与人参照基因组比对。当序列读段与人参考基因组对齐时,该序列读段被分类为人读段。当每次读取少于或等于两个错配时,可以认为序列读段是对齐的。在某些情况下,可以允许更多数量的错配。人参考基因组可以来自提供尿样的人的相同种族或种族群体(例如,东亚、欧洲)。参考基因组可以来自公共数据库(例如,NCBI或UCSC)。参考基因组也可以是从中获得尿样的人的从头组装。换句话说,可以使用当已知人没有癌症时的个人参考基因组。
在框3730,对于多个序列读段中的每个序列读段,可以通过计算机系统将序列读段与对应于第一病原体的种或属的第一种病原体参考基因组比对。当序列读段与第一病原体参考基因组对齐时,序列读段被分类为第一病原体读段。可以测试多种病原体参考基因组,包括细菌、病毒和古细菌参考基因组。要使用的特定病原体参考基因组可以取决于特定种或属的流行程度,以及不同种是否表示膀胱癌的不同分类。例如,如果所有种都表明膀胱癌并且患病率相对较低,则可以从该属的种的基因组的同源部分构建属参考。
方法3700可以包括将序列读段分类为对应于两个或更多个不同类型的病原体读段。例如,序列读段可以与第一细菌参考基因组比对,也可以与第二细菌参照基因组比对。与一种以上病原体参考基因组的这种比对可以由在不同病原体中是同源的基因导致。比对和分类可以针对不同类型的细菌、古细菌或病毒参考基因组。在各种实施方案中,如果序列读段与多种病原体对齐,则可以选择具有最佳比对的病原体。如果序列读段与多种病原体同等对齐,那么可以丢弃序列读段,分配给每种病原体,或分配给包括病原体的属。
方法3700可以包括分类多个序列读段至多种类型的病原体读段。例如,多个序列读段的第一序列读段可以与第一古菌参考基因组对齐,从而将序列读段分类为第一病原体读段,并且多个序列读段的第二序列读段可以与第二古菌序列参考基因组对齐,从而将序列读段分类为第二病原体读段。与病原体参考基因组对齐的任何序列读段可以被分类为非人读段。
在框3740,方法3700可以包括基于病原体读段的量确定参数。病原体读段的量可以是与病原体参考基因组(例如,第一病原体读段、第二病原体读段)对齐的所有读段的总和,例如,没有与多个病原体参考基因组比对的双重计数序列读段。在一些实施方案中,第一病原体读段的量可以是与特定病原体参考基因组比对的序列读段的量。作为实例,参数可以是原始计数、浓度、分数或第一病原体读段的百分比。
方法3700可以包括针对与不同的病原体参考基因组比对的读段,基于第二病原体读段的第二量确定第二参数。作为实例,第二参数可以是原始计数、浓度、分数或第二病原体读段的百分比。第二参数可以是在与第一参数的对应方法中计算的参数。病原体参考基因组可包括来自Halonotius、嗜热球菌、氨氧化古菌和放线菌或本文所述的任何病原体的基因组。另外,病原体参考基因组可以不包括来自本文描述的任何病原体的任何基因组。病原体参考基因组可包括或排除细菌基因组、病毒基因组和古细菌基因组。
病原体参基因组考可以包括来自分枝杆菌、嗜盐菌、放线菌、棒状杆菌、或念珠菌的至少一种的参考基因组。参考基因组可包括分枝杆菌、嗜盐菌、放线菌、棒状杆菌、或念珠菌的任何一种、两种、三种或四种。
在框3750,方法3700可以包括将参数与截止值比较。如果基于不同类型的病原体读段的量确定几种类型的参数,则可以将每种类型的量与一个或多个截止值进行比较。作为实例,可以将几种类型的参数中的每个参数与单个截止值进行比较。在其他实例中,将每种类型的参数与特定于参数类型的截止值进行比较。在一些实例中,可以将具有由不同类型的参数指定的坐标的多维点与截止值进行比较,该截止值可以是线、平面或更高维平面。一个或多个截止值可以从具有膀胱癌的第一组参考样品和不具有膀胱癌的第二组对照样品中确定。
在框3760,方法3700可以包括使用所述比较确定膀胱癌的水平的分类。方法3700可以包括如果第一病原体的量高于截止值则确定人患有膀胱癌。如果确定了基于不同类型的病原体读段的量的几个参数,则确定人患有膀胱癌可以是多个参数是否大于一个或多个截止值。在一些实施方案中,如果参数的特定百分比(例如,50%、60%、70%、80%、90%或100%)超过一个或多个截止值,则可以确定膀胱癌。癌症的严重程度可以通过将参数与截止值进行比较的程度来确定。在一些实施方案中,癌症的严重程度可以通过多少参数大于一个或多个截止值来确定。
方法3700可以包括用于本文中所描述的癌症的任何治疗。在一些情况下,方法3700可以应用于生物样品,而不仅仅是尿液样品。在一些情况下,方法3700可以包括确定癌症水平,而不仅仅是膀胱癌。
VIII.材料和方法
下面描述用于上面提供的某些结果的某些技术。用于一个实施例的这种技术可以用于其他实施例。
A.移植患者的样品收集和处理
对于移植数据,从临床上稳定的11个肾移植和两个造血干细胞移植(HSCT)患者收集尿液样品。还从患有肾结石的患者和从五名膀胱癌患者收集尿液样品。在上午诊断或手术前上午收集尿液样品,尽可能避免早晨尿液样品。将30-50毫升的尿液收集在普通无菌瓶中,贮存于4℃,并如先前所述在收集的一个小时内处理(12,23)。通过离心和过滤上清液分离尿液的无细胞部分。
B.文库制备、亚硫酸氢盐转化和大规模并行DNA测序
用高达500纳克尿cfDNA,根据制造商的说明书,使用KAPA HTP文库制备试剂盒(Kapa Biosystems)制备DNA文库(7)。亚硫酸氢盐和非亚硫酸氢盐DNA测序如前所述进行(24,25),采用使用75bp的配对末端模式的Illumina HiSeq 2500测序器。碱基调用和质量控制之后,数据随后通过甲基化数据分析管道Methy-Pipe处理(26)。
最多500ng尿cfDNA被用于文库制备。使用KAPA HTP文库制备试剂盒(KapaBiosystems),按照制造商的说明制备DNA文库(7)。亚硫酸氢盐和非亚硫酸氢盐DNA测序如先前所描述进行(24,25)。仅当用于亚硫酸氢盐测序的DNA不足时,非亚硫酸氢盐测序用于大小分布分析。使用Illumina HiSeq 2500测序仪,使用75bp配对末端模式对DNA文库进行测序。在碱基调用后,去除了衔接子序列和低质量碱基(即质量分数<5)。FASTQ格式的修整后的读段然后通过甲基化数据分析管道Methy-Pipe处理(26)。每个尿液样品使用一个测序通道,我们获得了映射到人参考基因组的中位数为8000万个独特的非重复读段。
C.提取和量化
对于泌尿cfDNA的提取和定量,如前所述(11,12,23)提取并定量尿液cfDNA。对于大多数样品而言,30-50mL尿液和至多250mL是体外孵育实验所需的。简而言之,在普通无菌瓶中收集新鲜尿液,并使用Siemens Multistix 10SG系统测试等分试样并使用RocheCobas 8000测定肌酸酐浓度。对于其余的尿样,在10毫摩尔/L的终EDTA浓度中加入在pH 8的0.5摩尔/L EDTA(Invitrogen)来抑制核酸酶活性(9)。EDTA对应于乙二胺四乙酸。
然后尿液在4℃下离心10分钟,并通过0.45μm的过滤器(MILEX-GV;Millipore)过滤上清液以分离无细胞组分。然后将无细胞尿液储存在-80℃或立即提取。对于每10mL处理过的尿液,我们加入15mL的6mol/L硫氰酸胍(Sigma-Aldrich)和1mL树脂(Wizard PlusMinipreps DNA纯化系统;Promega),将混合物在室温下孵育2小时。然后使用Wizard PlusMinipreps DNA纯化系统按照制造商的说明分离、洗涤和洗脱树脂-DNA复合物。在尿cfDNA的尿液的洗脱中使用大约100μL,以收集每10mL的尿液。
提取的cfDNA使用实时qPCR定量,其中62bp扩增子靶向LEP基因(11)。使用11点DNA标准物测定绝对DNA浓度,其范围为1.25至4000GE/uL,并且所有尿液cfDNA浓度以尿液的GE/mL表示。
可如下进行来自外周血白细胞和组织的基因组DNA的提取和定量。使用QiagenDNA Blood Mini Kit处理血沉棕黄层样品,并使用Qiagen DNA Mini Kit按照制造商的方案处理组织样品。
D.使用SNP阵列确定供体和受体特异性基因型
对于所有的肾移植和HSCT患者,根据制造商的方案,利用Illumina Omni 2.5SNP阵列询问约250万个供体和受体SNP。从血沉棕黄层、口腔拭子或肾组织获得供体和受体种系DNA。这使我们能够确定每个移植病例的供体和受体特异性SNP。对供体和受体特异性等位基因的了解与大规模平行测序结果一起使用,这使我们能够准确地确定供体和受体特异性cfDNA片段在尿液中的比例。
E.鉴定差异甲基化区域作为尿DNA组织映射的甲基化标记。
使用来自不同的人组织的全基因组硫酸氢盐测序数据构造用于甲基化反卷积的参考甲基化。我们假设正常样品中尿液cfDNA的主要贡献者是血细胞(血浆cfDNA的主要成分,也可能在肾脏后系统中释放)、肾脏和整个泌尿道衬里的尿路上皮。嗜中性粒细胞、B细胞和T细胞的全基因组亚硫酸氢盐测序数据从公开可用资源(Human Epigenome Atlas,www.genboree.org/epigenomeatlas/index.rhtml)获得(28)。当我们开始这项研究时,没有全基因组甲基化数据可用于肾脏或尿路上皮;因此,我们通过从尸体肾移植病例和接受肾输尿管切除术和根治性膀胱切除术的患者的相邻正常组织获得组织来构建我们自己的参考甲基化组。使用来自6名患者的皮质和髓质肾组织的亚硫酸氢盐测序数据汇编肾脏参考,并测序至35X单倍体基因组覆盖率。尿路上皮参考包括从6个患者的输尿管和膀胱获得的尿路上皮,测序为40X单倍体基因组覆盖率。膀胱癌参考基于在根治性膀胱切除术期间获得的膀胱肿瘤并且测序为8.5X单倍体基因组覆盖率。
如先前所述选择甲基化标记(22)。将常染色体CpG岛和海岸细分为非重叠的500bp单位,并确定每个参考组织的每个单位的甲基化密度。差异甲基化区域用于鉴定I型和II型标记。I型标记指的是甲基化密度的任何基因组基因座,与所有其他参考组织的平均水平相比,在一个组织中高或低3个SD。II型标记是这样的基因组基因座,其在所有组织类型中表现出高度可变的甲基化密度。当(A)最高甲基化组织的甲基化密度比最低甲基化组织的甲基化密度高至少20%,和(B)当除以该组的平均甲基化密度(即变异系数)时所有组织类型的甲基化密度的SD至少为0.25时,基因座被认为是高度可变的。
F.甲基化反卷积法测定尿液cfDNA中不同组织的比例贡献
甲基化反卷积的目的是要确定在尿cfDNA每个组织的比例贡献。如Sun等人(22)中所述进行甲基化反卷积。简而言之,在特定标记物处观察到的甲基化密度受每个组织的比例贡献和每个组织中该标记物的甲基化密度的影响。
二次规划(Quadratic programming)(39)被用来求解联立方程。编制矩阵,其包括组织组及其相应的甲基化密度,用于I型和II型标记的组合列表上的每个甲基化标记(总共19,418个标记)。参考甲基化组由肾、尿路上皮、中性粒细胞和淋巴细胞组成,所有组织的比例贡献总和为100%。选择这些组织类型作为它们中的每一种,除了尿路上皮之外,可以通过肾移植或HSCT验证。当评估膀胱癌患者的术前和术后尿液样品时,将来自膀胱癌和小肠甲基化组的甲基化标记物添加到参照组中。
G.鉴定尿液cfDNA中的低甲基化和拷贝数异常
使用从8种正常对照的尿cfDNA数据确定全基因组甲基化密度和1Mb组的拷贝数。甲基化密度或拷贝数的显著增加或减少被定义为与正常对照的平均值相比大于3的z得分。使用circos曲线图呈现全局甲基化密度和拷贝数变化(35)。
IX.实例系统
图38说明根据本发明的实施例的系统3800。所示系统包含样品3805,如样品固持器3810内的无细胞DNA分子,其中样品3805可以与测试剂3808接触以提供物理特征信号3815。样品架的实例可以是流动槽,其包括分析的探针和/或引物或液滴通过其移动的管(液滴包括分析)。如荧光强度值等来自样品的物理特征3815由检测器3820检测。检测器可以间隔(例如,周期性间隔)进行测量以获得构成数据信号的数据点。在一个实施例中,模数转换器多次将来自检测器的模拟信号转换成数字形式。数据信号3825从检测器3820发送到逻辑系统3830。数据信号3825可以存储在本地存储器3835、外部存储器3840或存储装置3845中。
逻辑系统3830可以是或可以包括:计算机系统、ASIC、微处理器等。其还可包括显示器(例如,监测器、LED显示器等)和用户输入装置(例如,鼠标、键盘、按钮等)或与其耦接。逻辑系统3830和其它组件可以是独立或网络连接的计算机系统的一部分,或者其可以直接连接或结合在热循环仪装置中。逻辑系统3830还可以包括在处理器3850中执行的优化软件。
本文提及的计算机系统中的任何一种可以利用任何合适数量的子系统。此类子系统的实例如图39所示在计算机系统10中。在一些实施例中,计算机系统包括单个计算机设备,其中子系统可以是计算机设备的组件。在其它实施例中,计算机系统可以包括具有内部组件的多个计算机设备,每个计算机设备是子系统。计算机系统可以包括台式计算机和膝上型计算机、平板电脑、移动电话和其它移动设备。
图39中所示的子系统通过系统总线75互连。示出了附加的子系统,诸如打印机74、键盘78、存储设备79、耦合到显示适配器82的监视器76等等。耦合到I/O控制器71的外围设备和输入/输出(I/O)设备可以通过本领域已知的各种方式(诸如输入/输出(I/O)端口77(例如,USB,))连接到计算机系统。举例来说,可以使用I/O端口77或外部接口81(例如,以太网、Wi-Fi等)将计算机系统10连接到广域网(例如因特网)、鼠标输入装置或扫描仪。通过系统总线75的互连允许中央处理器73与每个子系统通信并且控制来自系统存储器72或存储装置79(例如,固定磁盘,如硬盘驱动器或光盘)的多个指令的执行,以及子系统之间的信息交换。系统存储器72和/或一个或多个存储装置79可以体现为计算机可读介质。另一个子系统是数据收集设备85,诸如相机、麦克风、加速计等等。本文提及的数据中的任何一种可以从一个组件输出到另一个组件,并且可以输出给用户。
计算机系统可以包括例如通过外部接口81、通过内部接口或经由可将一个部件连接至另一个部件和从中移除的可移除存储设备连接在一起的多个相同的组件或子系统。在一些实施例中,计算机系统、子系统或设备可以通过网络进行通信。在此类情况下,一台计算机可以被认为是客户机,而另一台计算机可以被认为是服务器,其中每台计算机可以是同一计算机系统的一部分。客户机和服务器可以各自包括多个系统、子系统或组件。
实施例的各方面可以使用硬件的控制逻辑(例如,专用集成电路或现场可编程门阵列)的形式和/或使用具有通用可编程处理器的计算机软件以模块或集成方式来实施。如本文所使用的,处理器包括单核处理器、在同一集成芯片上的多核处理器,或者在单个电路板上或联网的多个处理单元。基于本文提供的公开内容和教导,本领域普通技术人员将知道并且意识到使用硬件以及硬件和软件的组合来实现本发明的实施例的其它方式和/或方法。
本申请中描述的软件组件或功能中的任何一种可以作为使用例如常规的或面向对象的技术、使用任何合适的计算机语言(例如Java、C、C++、C#、Objective-C、Swift)或脚本语言(诸如Perl或Python)由处理器执行的软件代码而实现。软件代码可以存储为用于存储和/或传输的计算机可读介质上的一系列指令或命令。适合的非暂时性计算机可读介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、如硬盘驱动器或软盘的磁性媒体或如光盘(CD)或DVD(数字通用光盘)的光学媒体、快闪存储器等。计算机可读介质可以是此类存储或传输设备的任何组合。
也可以使用适合于经由符合各种协议的有线、光学和/或无线网络(包括因特网)传输的载波信号来编码和传输此类程序。因此,计算机可读介质可以使用以这些程序编码的数据信号产生。用程序代码编码的计算机可读介质可与兼容装置一起封装或与其它装置分开提供(例如,通过因特网下载)。任何这样的计算机可读介质可以驻留在单个计算机产品(例如,硬盘驱动器、CD或整个计算机系统)上或内部,并且可以存在于系统或网络内的不同计算机产品上或内部。计算机系统可以包括用于向用户提供本文提及的任何一个结果的监视器、打印机或其它合适的显示器。
可以利用包括一个或多个处理器的计算机系统来完全或部分地执行本文描述的任何一种方法,所述一个或多个处理器可以被配置成执行这些步骤。因此,实施例可以涉及被配置成执行本文描述的任何一种方法的步骤的计算机系统,所述计算机系统潜在地具有执行相应步骤或相应的一组步骤的不同组件。尽管以编号的步骤呈现,但是可以在同一时间或以不同的顺序执行本文的方法的步骤。另外,这些步骤的一部分可以与其它方法的其它步骤的一部分一起使用。而且,步骤的全部或部分可以是任选的。另外,任何方法的任何步骤都可以用模块、单元、电路或用于执行这些步骤的其它装置来执行。
在不脱离本发明的实施例的精神和范围的情况下,可以以任何合适的方式组合特定实施例的具体细节。然而,本发明的其它实施例可以涉及与每个单独方面或这些单独方面的具体组合有关的具体实施例。
为了说明和描述的目的,已经呈现了本发明的示例性实施例的以上描述。这并不意味着是穷举的并且并不意味着将本发明限制为所描述的精确形式,并且鉴于以上教导,许多修改和变化是可能的。
在前面的描述中,出于解释的目的,许多细节已经被阐述以便提供对本技术的各个实施方案的理解。然而,对于本领域技术人员显而易见的是,某些实施方案可以在没有这些细节中的一些或者具有附加细节的情况下实施。
已描述了若干实施方案,但是本领域的技术人员将认识到,可使用各种修改、替代构造和等同物而不脱离本发明的精神。另外,没有描述许多众所周知的过程和元件,以避免不必要地模糊本发明。另外,任何特定实施方案的细节可能并不总是存在于该实施方案的变型中,或者可以添加到其他实施方案中。
当提供数值的范围时,应理解,也具体公开了在该范围的上限和下限之间的每个中间值,到下限单位的十分之一,除非上下文清楚地另有指示。包括在所述范围内的任何陈述值或中间值与所述范围内的任何其他陈述值或中间值之间的每个较小范围。这些较小范围的上限和下限可以独立地包括在该范围内或排除在该范围内,并且在较小范围内包括任一个限值、两个限值都不包括或两个限值都包括的每个范围也包括在本发明内,除了任何具体排除的所述范围内的限值限制。如果所述的范围包括一个或两个限值,则还包括排除这些限值中的一个或两个的范围。
“一”、“一个”或“该”的叙述旨在表示“一个或多个”,除非特别地有相反指示。“或”的使用旨在表示“包含性的或”,而不是“排除性的或”,除非特别地有相反指示。对“第一”组件的引用不一定要求提供第二组件。此外,除非明确说明,否则对“第一”或“第二”组件的引用不将所引用的组件限制到特定位置。术语“基于”旨在表示“至少部分地基于”。
出于所有目的,本文提及的所有专利、专利申请、出版物和描述的全部内容通过引用并入。没有一篇被承认是现有技术。
X.参考文献
1.Stroun M,Maurice P,Vasioukhin V,Lyautey J,Lederrey C,Lefort F等人,The origin and mechanism of circulating DNA.Ann N Y Acad Sci 2000;906:161–8。
2.Lo YM,Corbetta N,Chamberlain PF,Rai V,Sargent IL,Redman CW等人,Presence of fetal DNA in maternal plasma and serum Lancet 1997;350:485–7。
3.Chen XQ,Stroun M,Magnenat JL,Nicod LP,Kurt AM,Lyautey J等人,Microsatellite alterations in plasma DNA of small cell lung cancer patientsNat Med 1996;2:1033–5。
4.Lo YM,Tein MS,Pang CC,Yeung CK,Tong KL,Hjelm NM Presence of donor-specific DNA in plasma of kidney and liver-transplant recipients.Lancet 1998;351:1329–30。
5.Chiu RWK,Chan KCA,Gao Y,Lau VYM,Zheng W,Leung TY等人,Noninvasiveprenatal diagnosis of fetal chromosomal aneuploidy by massively parallelgenomic sequencing of DNA in maternal plasma.Proc Natl Acad Sci U S A 2008;105:20458–63。
6.Leary RJ,Sausen M,Kinde I,Papadopoulos N,Carpten JD,Craig D等人,Detection of chromosomal alterations in the circulation of cancer patientswith whole-genome sequencing.Sci Transl Med 2012;4:162ra154。
7.Chan KCA,Jiang P,Chan CWM,Sun K,Wong J,Hui EP等人,Noninvasivedetection of cancer-associated genome-wide hypomethylation and copy numberaberrations by plasma DNA bisulfite sequencing.Proc Natl Acad Sci U S A 2013;110:18761–8。
8.De Vlaminck I,Valantine HA,Snyder TM,Strehl C,Cohen G,Luikart H等人,Circulating cell-free DNA enables noninvasive diagnosis of hearttransplant rejection.Sci Transl Med 2014;6:241ra77。
9.Botezatu I,Serdyuk O,Potapova G,Shelepov V,Alechina R,Molyaka Y等人,Genetic analysis of DNA excreted in urine:a new approach for detectingspecific genomic DNA sequences from cells dying in an organism.Clin Chem2000;46:1078–84。
10.Al-Yatama MK,Mustafa AS,Ali S,Abraham S,Khan Z,Khaja N.Detectionof Y chromosome-specific DNA in the plasma and urine of pregnant women usingnested polymerase chain reaction.Prenat Diagn 2001;21:399–402。
11.Tsui NBY,Jiang P,Chow KCK,Su X,Leung TY,Sun H等人,High resolutionsize analysis of fetal DNA in the urine of pregnant women by paired-endmassively parallel sequencing.PLoS One 2012;7:e48319。
12.Hung ECW,Shing TKF,Chim SSC,Yeung PC,Chan RWY,Chik KW等人,Presenceof donor-derived DNA and cells in the urine of sex-mismatched hematopoieticstem cell transplant recipients:implication for the transrenalhypothesis.Clin Chem 2009;55:715–22。
13.Su Y-H,Wang M,Brenner DE,Norton PA,Block TM.Detection of mutatedK-ras DNA in urine,plasma,and serum of patients with colorectal carcinoma oradenomatous polyps.Ann N Y Acad Sci 2008;1137:197–206。
14.Chan KCA,Leung SF,Yeung SW,Chan ATC,Lo YMD.Quantitative analysisof the transrenal excretion of circulating EBV DNA in nasopharyngealcarcinoma patients.Clin Cancer Res 2008;14:4809–13。
15.Zhang J,Tong K-L,Li PKT,Chan AYW,Yeung C-K,Pang CCP等人,Presenceof Donor-and Recipient-derived DNA in Cell-free Urine Samples of RenalTransplantation Recipients:Urinary DNA Chimerism.Clin Chem 1999;45:1741–6。
16.Szarvas T,Kovalszky I,Bedi K,Szendroi A,Majoros A,Riesz P等人,Deletion analysis of tumor and urinary DNA to detect bladder cancer:urinesupernatant versus urine sediment.Oncol Rep 2007;18:405–9。
17. K,Nordentoft I,Christensen E,S,Reinert T,Vang S等人,Genomic Alterations in Liquid Biopsies from Patientswith Bladder Cancer.Eur Urol 2016;70:75–82。
18.Li Y,Zhong XY,Kang A,Troeger C,Holzgreve W,Hahn S.Inability todetect cell free fetal DNA in the urine of normal pregnant women nor in thoseaffected by preeclampsia associated HELLP syndrome.J Soc GynecolInvestig.2003;10:503–8。
19.Fernandez AF,Assenov Y,Martin-Subero JI,Balint B,Siebert R,Taniguchi H等人,A DNA methylation fingerprint of 1628human samples.Genome Res2012;22:407–19。
20.Consortium RE,Kundaje A,Meuleman W,Ernst J,Bilenky M,Yen A等人,Integrative analysis of 111reference human epigenomes.Nature 2015;518:317–30。
21.Houseman EA,Accomando WP,Koestler DC,Christensen BC,Marsit CJ,Nelson HH等人,DNA methylation arrays as surrogate measures of cell mixturedistribution.BMC Bioinformatics 2012;13:86。
22.Sun K,Jiang P,Chan KCA,Wong J,Cheng YKY,Liang RHS等人,Plasma DNAtissue mapping by genome-wide methylation sequencing for noninvasiveprenatal,cancer,and transplantation assessments.Proc Natl Acad Sci U S A2015;112:E5503-12。
23.Yu SCY,Lee SWY,Jiang P,Leung TY,Chan KCA,Chiu RWK等人,High-resolution profiling of fetal DNA clearance from maternal plasma by massivelyparallel sequencing.Clin Chem 2013;59:1228–37。
24.Chan KCA,Jiang P,Zheng YWL,Liao GJW,Sun H,Wong J等人,Cancer genomescanning in plasma:detection of tumor-associated copy numberaberrations,single-nucleotide variants,and tumoral heterogeneity by massively parallelsequencing.Clin Chem 2013;59:211–24。
25.Lun FMF,Chiu RWK,Sun K,Leung TY,Jiang P,Chan KCA等人,Noninvasiveprenatal methylomic analysis by genomewide bisulfite sequencing of maternalplasma DNA.Clin Chem 2013;59:1583–94。
26.Jiang P,Sun K,Lun FMF,Guo AM,Wang H,Chan KCA等人,Methy-Pipe:anintegrated bioinformatics pipeline for whole genome bisulfite sequencing dataanalysis.PLoS One 2014;9:e100360。
27.Lui YYN,Chik KW,Chiu RWK,Ho CY,Lam CWK,Lo YMD.Predominanthematopoietic origin of cell-free dna in plasma and serum after sex-mismatched bone marrow transplantation.Clin Chem 2002;48:421–7。
28.Hodges E,Molaro A,Dos Santos CO,Thekkat P,Song Q,Uren PJ等人,Directional DNA methylation changes and complex intermediate states accompanylineage specificity in the adult hematopoietic compartment.Mol Cell 2011;44:17–28。
29.Ito K,Minamiura N,Yamamoto T.Human urine DNase I:immunologicalidentity with human pancreatic DNase I,and enzymic and proteochemicalproperties of the enzyme.J Biochem 1984;95:1399–406。
30.Nadano D,Yasuda T,Kishi K.Measurement of deoxyribonuclease Iactivity in human tissues and body fluids by a single radial enzyme-diffusionmethod.ClinChem 1993;39:448–52。
31.Jiang P,Chan CWM,Chan KCA,Cheng SH,Wong J,Wong VW-S等人,Lengthening and shortening of plasma DNA in hepatocellular carcinomapatients.Proc Natl Acad Sci U S A 2015;112:E1317-25。
32.Underhill HR,Kitzman JO,Hellwig S,Welker NC,Daza R,Baker DN等人,Fragment Length of Circulating Tumor DNA.PLoS Genet 2016;12:e1006162。
33.Feinberg AP,Vogelstein B.Hypomethylation distinguishes genes ofsome human cancers from their normal counterparts.Nature 1983;301:89–92。
34.Beroukhim R,Mermel CH,Porter D,Wei G,Raychaudhuri S,Donovan J等人,The landscape of somatic copy-number alteration across human cancers.Nature2010;463:899–905。
35.Krzywinski M,Schein J,Birol I,Connors J,Gascoyne R,Horsman D等人,Circos:an information aesthetic for comparative genomics.Genome Res 2009;19:1639–45。
36.Lo YMD,Chan KCA,Sun H,Chen EZ,Jiang P,Lun FMF等人,Maternal plasmaDNA sequencing reveals the genome-wide genetic and mutational profile of thefetus.Sci Transl Med 2010;2:61ra91。
37.Snyder MW,Kircher M,Hill AJ,Daza RM,Shendure J.Cell-free DNAComprises an In Vivo Nucleosome Footprint that Informs Its Tissues-Of-Origin.Cell 2016;164:57–68。
38.The Cancer Genome Atlas Research Network.Comprehensive molecularcharacterization of urothelial bladder carcinoma.Nature 2014;507:315–22。
39.Meersche K Van den,Soetaert K,Oevelen D Van.xsample():An RFunction for Sampling Linear Inverse Problems.J Stat Softw 2009;30:1–15。

Claims (62)

1.一种分析生物体的生物样品的方法,所述生物样品包括来自包括第一组织类型的多种组织类型的无细胞DNA分子的混合物,所述方法包括:
鉴定N个基因组位点,N是大于或等于10的整数;
对于M个组织类型的每一个:
获得N个基因组位点处的N个组织特异性甲基化水平,N大于或等于M,其中所述组织特异性甲基化水平形成维度N×M的矩阵A,其中M个组织类型中的一个对应于第一患病组织类型,所述第一患病组织类型对应于第一器官的第一疾病;
通过计算机系统分析来自所述生物样品的多个无细胞DNA分子,所述多个无细胞DNA分子是至少1,000个无细胞DNA分子,其中分析无细胞DNA分子包括:
鉴定所述无细胞DNA分子在对应于所述生物体的参考基因组中的位置;
鉴定所述多个无细胞DNA分子中的一组,其每个均位于所述N个基因组位点中的任何一个处,
使用所述组的多个无细胞DNA分子测量所述N个基因组位点处的N个混合物的甲基化水平;
通过计算机系统,使用所述N个混合物的甲基化水平和所述M个组织类型的每一个的所述N个组织特异性甲基化水平,确定所述混合物中第一患病组织类型的第一分数贡献;和
使用第一患病组织类型的第一分数贡献确定所述生物体中第一器官的第一疾病的水平。
2.根据权利要求1所述的方法,其中所述M个组织类型中的第二个对应于第二患病组织类型,第二患病组织类型对应于第一器官的第二疾病,所述方法还包括:
通过计算机系统,使用所述N个混合物的甲基化水平和所述M个组织类型的每一个的所述N个组织特异性甲基化水平,确定所述混合物中第二患病组织类型的第二分数贡献;和
使用第二患病组织类型的第二分数贡献确定所述生物体中第一器官的第二疾病的水平。
3.根据权利要求1所述的方法,其中所述M个组织类型中的第二个对应于第二患病组织类型,第二患病组织类型对应于第二器官的第二疾病,所述方法还包括:
通过计算机系统,使用所述N个混合物的甲基化水平和所述M个组织类型的每一个的所述N个组织特异性甲基化水平,确定所述混合物中第二患病组织类型的第二分数贡献;和
使用第二患病组织类型的第二分数贡献确定所述生物体中第二器官的第二疾病的水平。
4.根据权利要求1所述的方法,其中所述M个组织类型中的第二组织类型对应于第一器官的健康组织。
5.根据权利要求1所述的方法,其中所述生物样品来自第一器官或当所述生物样品离开所述生物体时穿过第一器官。
6.根据权利要求1所述的方法,其中所述生物样品是尿,并且第一器官是膀胱。
7.根据权利要求1所述的方法,其中所述生物样品是尿,并且第一器官是肾脏。
8.根据权利要求7所述的方法,其中所述第一疾病是肾小球肾炎或肾病综合征。
9.根据权利要求1所述的方法,其中所述生物样品是唾液,并且第一器官是唾液腺。
10.根据权利要求1所述的方法,其中所述第一疾病是癌症。
11.根据权利要求1所述的方法,其中所述生物样品是尿液样品,所述方法还包括:
通过加入乙二胺四乙酸(EDTA)制备尿液样品。
12.根据权利要求1所述的方法,还包括确定所述生物样品中无细胞DNA和细胞DNA的比例贡献。
13.根据权利要求1所述的方法,其中所述N个基因组位点包括具有比个体间差异的阈值量小的位点。
14.根据权利要求1所述的方法,其中所述M个组织类型包括肾、尿路上皮、中性粒细胞、B细胞和T细胞。
15.根据权利要求1所述的方法,其中所述N个基因组位点包括在正常尿路上皮的甲基化组中的位点。
16.根据权利要求1所述的方法,其中所述N个基因组位点包括正常尿路上皮的甲基化组和肿瘤甲基化组共有的位点。
17.一种分析生物体的尿液样品的方法,所述尿液样品包括源自正常细胞和可能来自与癌症相关的细胞的DNA,其中所述尿液样品中的至少一些DNA是无细胞的,所述方法包括:
对于多种大小的每种大小:
测量所述尿液样品中与所述大小对应的DNA片段的量;
基于多种大小的DNA片段的量计算第一参数的第一值,所述第一参数提供所述尿液样品中DNA片段的大小分布的统计测量,其中第一参数随着DNA片段的大小增加而增加;
将第一值与参考值进行比较;和
基于所述比较确定膀胱癌水平的分类。
18.根据权利要求17所述的方法,其中所述参考值从分别已知具有膀胱癌和/或不具有膀胱癌的样品确定。
19.根据权利要求17所述的方法,其中:
第一参数包括周期性指数,所述周期性指数使用所述大小分布中的多个峰值处的DNA片段的量和所述大小分布中的多个谷值处的DNA片段的量的差异计算,
所述多个峰值以规则大小间隔存在,并且
所述多个谷值以规则大小间隔偏离所述多个峰值存在。
20.根据权利要求17所述的方法,其中确定膀胱癌水平的分类的步骤包括当所述第一值大于所述参考值时确定所述生物体具有膀胱癌。
21.根据权利要求17所述的方法,其中所述膀胱癌的水平包括膀胱癌的阶段。
22.根据权利要求17所述的方法,其中所述参考值在手术以从所述生物体的膀胱移除肿瘤之前从所述生物体确定。
23.一种分析来自生物体的肾脏的肾盂的尿液样品的方法,所述尿液样品包含DNA,其中至少一些DNA是无细胞的,所述方法包括:
对于多种大小的每种大小:
测量所述尿液样品中与所述大小对应的DNA片段的量;
基于多种大小的DNA片段的量计算第一参数的第一值,所述第一参数提供所述尿液样品中DNA片段的大小分布的统计测量;
将第一值与参考值进行比较;和
基于所述比较确定所述肾脏中炎症水平的分类。
24.根据权利要求23所述的方法,其中第一参数随着DNA片段大小的增加而增加。
25.根据权利要求23所述的方法,其还包括:
当第一值大于参考值时确定所述肾脏发炎。
26.根据权利要求23所述的方法,其还包括:
从所述肾脏的肾盂获得所述尿液样品。
27.根据权利要求23所述的方法,其中:
第一参数包括周期性指数,第一参数包括周期性指数,所述周期性指数使用所述大小分布中的多个峰值处的DNA片段的量和所述大小分布中的多个谷值处的DNA片段的量的差异计算,
所述多个峰值以规则大小间隔存在,并且
所述多个谷值以规则大小间隔偏离所述多个峰值存在。
28.根据权利要求23所述的方法,其中所述第一参数包括中值或具有阈值大小的DNA片段的比例。
29.根据权利要求23所述的方法,其中所述参考值从已知所述生物体健康时的所述生物体确定。
30.一种通过分析生物体的第一样品和血液样品,鉴定所述生物体的第一器官中的癌症的方法,所述第一样品和血液样品均包括源自正常细胞和可能来自与癌症相关的细胞的DNA,其中第一样品来自第一器官或当第一样品离开所述生物体时通过第一器官,并且不同于所述血液样品,并且其中第一样品和血液样品中的至少一些DNA是无细胞的,所述方法包括:
分析来自第一样品和血液样品的多个DNA分子,其中分析DNA分子包括:
鉴定DNA分子在所述生物体的基因组中的位置,并任选地确定DNA分子是否在一个或多个位点甲基化;
对于所述生物体的多个染色体区域的每个染色体区域:
通过以下方式确定对于第一样品和血液样品中的每一个,所述染色体区域是否表现出拷贝数异常或甲基化异常中的至少一种异常的分类:
基于鉴定的位置从相应的样品中鉴定来自所述染色体区域的DNA分子的相应组,所述相应组包括位于所述染色体区域的多个基因座中的每一个的至少一个DNA分子;
用计算机系统计算DNA分子的相应组的相应值,所述相应值限定所述相应组的DNA分子的性质,所述性质是拷贝数或甲基化水平中的至少一种;
将相应值与参考值进行比较;
基于分类为表现出第一样品的异常的染色体区域的第一量是否高于第一阈值,确定癌症的第一水平;
基于分类为表现出血液样品的异常的染色体区域的第二量是否高于第二阈值,确定癌症的第二水平;和
当癌症的第一水平表明所述生物体患有癌症并且癌症的第二水平表明所述生物体没有癌症时,确定所述生物体具有第一器官的癌症。
31.根据权利要求30所述的方法,其中所述甲基化异常包括低甲基化或高甲基化。
32.根据权利要求30所述的方法,其中所述第一样品是尿、唾液或粪便。
33.根据权利要求30所述的方法,其中所述多个染色体区域是不重叠的。
34.根据权利要求30所述的方法,其中所述血液样品为血浆或血清。
35.根据权利要求30所述的方法,其中分析所述DNA分子还包括确定所述DNA分子是否在一个或多个位点甲基化。
36.根据权利要求30所述的方法,其中所述参考值从正常样品确定。
37.根据权利要求30所述的方法,其中用于相应的染色体区域的参考值取决于所述相应值与相邻染色体区域的参考值的比较。
38.根据权利要求30所述的方法,其还包括:
确定所述DNA分子是否在一个或多个位点处被甲基化,
其中:
所述异常是低甲基化,和
所述性质是所述甲基化水平。
39.根据权利要求30所述的方法,其中:
所述异常是拷贝数异常,并且
所述性质是所述拷贝数。
40.根据权利要求30所述的方法,其中:
使用所述拷贝数和所述甲基化水平二者计算所述相应值。
41.一种分析生物体的尿液样品的方法,所述尿液样品包括源自正常细胞和可能来自与癌症相关的细胞的DNA,其中所述尿液样品中的至少一些DNA是无细胞的,所述方法包括:
分析来自所述尿液样品的多个DNA分子,其中分析DNA分子包括:
鉴定DNA分子在所述生物体的基因组中的位置;
对于所述生物体的多个染色体区域的每个染色体区域:
通过以下方式确定所述染色体区域是否表现出拷贝数异常或甲基化异常中的至少一种异常的分类:
基于鉴定的位置从所述尿液样品中鉴定来自所述染色体区域的一组DNA分子,所述组包括位于所述染色体区域的多个基因座中的每一个的至少一个DNA分子;
用计算机系统计算所述组的DNA分子的值,所述值限定所述组的DNA分子的性质,所述性质是拷贝数或甲基化水平中的至少一种;
将所述值与参考值进行比较;
基于被分类为表现出所述尿液样品的拷贝数异常的染色体区域的第一量是否高于第一阈值,确定癌症的第一水平;
基于被分类为表现出所述尿液样品的甲基化异常的染色体区域的第二量是否高于第二阈值,确定癌症的第二水平;
基于肿瘤组织的分数贡献是否高于第三阈值,确定癌症的第三水平;
当癌症的所述第一水平、癌症的所述第二水平或癌症的所述第三水平中的至少一个指示所述生物体患有癌症时确定所述生物体患有癌症。
42.根据权利要求41所述的方法,其中所述甲基化异常包括低甲基化或高甲基化。
43.根据权利要求41所述的方法,还包括确定所述肿瘤组织的分数贡献。
44.根据权利要求43所述的方法,其中确定所述肿瘤组织的分数贡献是通过使用肿瘤特异性体细胞突变、肿瘤特异性甲基化特征、肿瘤特异性片段末端模式或片段大小分析。
45.根据权利要求43所述的方法,其中确定所述肿瘤组织的分数贡献是通过从获得的组织特异性甲基化水平和在基因组位点测量的甲基化水平推导所述肿瘤组织的分数贡献。
46.根据权利要求43所述的方法,其中确定所述肿瘤组织的分数贡献是通过:
鉴定N个基因组位点,N是大于或等于10的整数;
对于M个组织类型的每一个:
获得N个基因组位点处的N个组织特异性甲基化水平,N大于或等于M,其中所述组织特异性甲基化水平形成维度N×M的矩阵A,其中M个组织类型中的一个对应于肿瘤组织,所述肿瘤组织对应于膀胱的癌症;
通过计算机系统分析来自所述尿液样品的多个无细胞DNA分子,所述多个无细胞DNA分子是至少1,000个无细胞DNA分子,其中分析无细胞DNA分子包括:
鉴定所述无细胞DNA分子在对应于所述生物体的参考基因组中的位置;
鉴定所述多个无细胞DNA分子中的一组,其每个均位于所述N个基因组位点中的任何一个处,
使用所述组的多个无细胞DNA分子测量所述N个基因组位点处的N个混合物的甲基化水平;和
通过计算机系统,使用所述N个混合物的甲基化水平和所述M个组织类型的每一个的所述N个组织特异性甲基化水平,确定所述混合物中肿瘤组织的分数贡献。
47.根据权利要求41所述的方法,其中当癌症的所述第一水平、癌症的所述第二水平或癌症的所述第三水平中的至少两个指示所述生物体患有癌症时,或者当癌症的所述第一水平、癌症的所述第二水平和癌症的所述第三水平指示所述生物体患有癌症时,确定所述生物体患有癌症。
48.一种分析生物体的生物样品的方法,所述生物样品包括源自正常细胞和可能来自与癌症相关的细胞的DNA,其中所述生物样品中的至少一些DNA是无细胞的,所述方法包括:
接收对应于所述生物样品的DNA分子的多个序列读段;
确定所述序列读段的基因组位置,
将所述序列读段与参考基因组进行比较,以确定与所述参考基因组具有一个错配的序列读段,从而基于与所述参考基因组具有一个错配的序列读段的计数确定参数;
将所述参数与阈值进行比较;
使用所述参数与所述阈值的比较确定癌症水平的分类。
49.根据权利要求48所述的方法,其中多个错配由体细胞突变和测序错误导致。
50.根据权利要求48所述的方法,其中所述序列读段的计数是正好具有一个错配的序列读段的计数。
51.根据权利要求48所述的方法,其中确定癌症水平的分类包括使用拷贝数异常、低甲基化、高甲基化或肿瘤贡献中的至少一个。
52.一种分析人的尿液样品的方法,所述尿液样品包括源自正常细胞和可能来自与癌症相关的细胞的DNA,其中所述尿液样品中的至少一些DNA是无细胞的,所述方法包括:
获得对应于所述尿液样品的DNA分子的多个序列读段;
对于所述多个序列读段的每个序列读段:
当所述序列读段由计算机系统对齐人参考基因组时,将所述序列读段分类为人读段,或
当所述序列读段与对应于第一病原体的种或属的第一病原体参考基因组对齐时,将所述序列读段分类为第一病原体读段;
基于所述第一病原体读段的量确定参数;
将所述参数与截止值进行比较,其中所述截止值从具有膀胱癌的第一组参考样品和不具有膀胱癌的第二组对照样品中确定;和
使用所述比较确定膀胱癌水平的分类。
53.根据权利要求52所述的方法,其中将所述序列读段分类为第一病原体读段包括将所述序列对数与一种或多种细菌基因组参考序列进行比对。
54.根据权利要求52所述的方法,其中所述第一病原体是细菌。
55.根据权利要求54所述的方法,其中所述细菌包括Halonotius、嗜热球菌、氨氧化古菌和放线菌。
56.根据权利要求52所述的方法,其还包括:
所述参数是第一参数,
所述截止值是第一截止值,
对于所述多个序列读段的每个序列读段:
当所述序列读段与对应于第二病原体的种或属的第二病原体参考基因组对齐时,将所述序列读段分类为第二病原体读段;
基于第二病原体读段的第二量确定第二参数,
将第二参数与第二截止值进行比较,
使用第一参数与第一截止值的比较以及第二参数与第二截止值的比较确定膀胱癌水平的分类。
57.根据权利要求52所述的方法,其中所述第一病原体包括分枝杆菌、嗜盐菌、放线菌、棒状杆菌或念珠菌。
58.一种计算机产品,其包括计算机可读介质,所述计算机可读介质存储用于控制计算机系统执行上述方法中的任何方法的操作多个指令。
59.一种系统,其包括;
根据权利要求58所述的计算机产品;以及
用于执行存储在所述计算机可读介质上的指令的一个或多个处理器。
60.一种系统,其包括用于执行上述方法中的任何方法的装置。
61.一种系统,其被配置为能执行上述方法中的任何方法。
62.一种系统,其包括分别执行上述方法中的任何方法的步骤的模块。
CN201780070814.4A 2016-11-30 2017-11-30 尿液和其他样品中无细胞dna的分析 Pending CN109983134A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662427999P 2016-11-30 2016-11-30
US62/427,999 2016-11-30
PCT/CN2017/113813 WO2018099418A1 (en) 2016-11-30 2017-11-30 Analysis of cell-free dna in urine and other samples

Publications (1)

Publication Number Publication Date
CN109983134A true CN109983134A (zh) 2019-07-05

Family

ID=62190770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780070814.4A Pending CN109983134A (zh) 2016-11-30 2017-11-30 尿液和其他样品中无细胞dna的分析

Country Status (9)

Country Link
US (2) US11435339B2 (zh)
EP (1) EP3548632A4 (zh)
JP (3) JP2020503003A (zh)
KR (2) KR102529113B1 (zh)
CN (1) CN109983134A (zh)
AU (3) AU2017369018B2 (zh)
CA (1) CA3039685A1 (zh)
IL (1) IL266347A (zh)
WO (1) WO2018099418A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833965A (zh) * 2019-11-08 2020-10-27 中国科学院北京基因组研究所 一种尿沉渣基因组dna的分类方法、装置和用途
CN112599189A (zh) * 2020-12-29 2021-04-02 北京优迅医学检验实验室有限公司 一种全基因组测序的数据质量评估方法及其应用
CN114686607A (zh) * 2020-12-31 2022-07-01 深圳华大生命科学研究院 棒状杆菌作为尿液微生物标志物在制备用于检测膀胱癌的相关检测产品中的应用
CN114898802A (zh) * 2022-07-14 2022-08-12 臻和(北京)生物科技有限公司 基于血浆游离dna甲基化测序数据的末端序列频率分布特征确定方法、评价方法及装置
CN111833965B (zh) * 2019-11-08 2024-06-04 中国科学院北京基因组研究所(国家生物信息中心) 一种尿沉渣基因组dna的分类方法、装置和用途

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3169813B1 (en) 2014-07-18 2019-06-12 The Chinese University Of Hong Kong Methylation pattern analysis of tissues in dna mixture
MX2020013994A (es) * 2018-06-22 2021-05-27 Bluestar Genomics Inc Análisis de hidroximetilación de muestras de ácido nucleico sin células para asignación de tejido de origen, y métodos relacionados de uso.
US20210239685A1 (en) * 2018-06-27 2021-08-05 The Trustees Of Indiana University Methods of analyzing dna in urine
WO2020010311A2 (en) * 2018-07-05 2020-01-09 Active Genomes Expressed Diagnostics, Inc Viral oncogene influences and gene expression patterns as indicators of early tumorigenesis
CA3123474A1 (en) * 2018-12-19 2020-06-25 The Chinese University Of Hong Kong Cell-free dna end characteristics
CN110739027B (zh) * 2019-10-23 2023-04-18 深圳吉因加医学检验实验室 一种基于染色质区域覆盖深度的癌症组织定位方法及系统
US20230042332A1 (en) * 2019-12-24 2023-02-09 Vib Vzw Disease Detection in Liquid Biopsies
CN111242161B (zh) * 2019-12-27 2023-08-25 国网山西省电力公司大同供电公司 一种基于智能学习的非侵入式非居民用户负荷辨识方法
JP2023540016A (ja) * 2020-08-19 2023-09-21 アキュラーゲン ホールディングス リミテッド 選択的セルフリー核酸分析の方法
JP2023553113A (ja) * 2020-12-08 2023-12-20 ザ チャイニーズ ユニバーシティ オブ ホンコン 尿及び他のdnaの特徴を使用する方法
CN113160889B (zh) * 2021-01-28 2022-07-19 人科(北京)生物技术有限公司 一种基于cfDNA组学特性的癌症无创早筛方法
US20230175064A1 (en) * 2021-02-09 2023-06-08 Illumina, Inc. Methods and systems for monitoring organ health and disease
WO2023004204A2 (en) * 2021-07-23 2023-01-26 Georgetown University Use of circulating cell-free methylated dna to detect tissue damage
US20230279498A1 (en) * 2021-11-24 2023-09-07 Centre For Novostics Limited Molecular analyses using long cell-free dna molecules for disease classification
WO2023144704A1 (en) * 2022-01-25 2023-08-03 Gene Solutions Joint Stock Company Systems and methods for detecting tumor dna in mammalian blood
WO2023245245A1 (en) * 2022-06-21 2023-12-28 Garvan Institute Of Medical Research Detection of cell damage

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105102634A (zh) * 2013-03-15 2015-11-25 伊穆科Gti诊治股份有限公司 使用尿的无细胞dna评价肾状态的方法和组合物
US20160017419A1 (en) * 2014-07-18 2016-01-21 The Chinese University Of Hong Kong Methylation pattern analysis of tissues in a dna mixture

Family Cites Families (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1328656A4 (en) 2000-09-29 2005-09-14 Univ Johns Hopkins Med METHOD FOR PREDICTING THE CLINICAL RESPONSE TO CHEMOTHERAPY WITH ALKYLATING AGENTS
ATE312946T1 (de) 2002-03-05 2005-12-15 Epigenomics Ag Verfahren und vorrichtung zur bestimmung der gewebespezifität von freier dna in körperflüssigkeiten
US8150626B2 (en) 2003-05-15 2012-04-03 Illumina, Inc. Methods and compositions for diagnosing lung cancer with specific DNA methylation patterns
US20060183128A1 (en) 2003-08-12 2006-08-17 Epigenomics Ag Methods and compositions for differentiating tissues for cell types using epigenetic markers
WO2005042713A2 (en) 2003-10-28 2005-05-12 The Johns Hopkins University Quantitative multiplex methylation-specific pcr
US7709194B2 (en) 2004-06-04 2010-05-04 The Chinese University Of Hong Kong Marker for prenatal diagnosis and monitoring
US7914982B2 (en) 2005-02-17 2011-03-29 Trovagene, Inc. Methods for detecting pathogen specific nucleic acids in urine
ITRM20050068A1 (it) 2005-02-17 2006-08-18 Istituto Naz Per Le Malattie I Metodo per la rivelazione di acidi nucleici di agenti patogeni batterici o di parassiti nelle urine.
ITRM20050067A1 (it) 2005-02-17 2006-08-18 Istituto Naz Per Le Malattie I Metodo per la rivelazione di acidi nucleici virali o di origine virale nelle urine.
ES2313143T3 (es) 2005-04-06 2009-03-01 Maurice Stroun Metodo para el diagnostico de cancer mediante la deteccion de adn y arn circulantes.
CA2606296C (en) 2005-04-15 2019-05-21 Epigenomics Ag Methods and nucleic acids for analyses of cellular proliferative disorders
WO2006128192A2 (en) 2005-05-27 2006-11-30 John Wayne Cancer Institute Use of free circulating dna for diagnosis, prognosis, and treatment of cancer
US20070141582A1 (en) 2005-12-15 2007-06-21 Weiwei Li Method and kit for detection of early cancer or pre-cancer using blood and body fluids
US9183349B2 (en) 2005-12-16 2015-11-10 Nextbio Sequence-centric scientific information management
US8768629B2 (en) 2009-02-11 2014-07-01 Caris Mpi, Inc. Molecular profiling of tumors
TWI335354B (en) 2006-09-27 2011-01-01 Univ Hong Kong Chinese Methods for the detection of the degree of the methylation of a target dna and kits
CA2668818C (en) 2006-10-10 2018-06-26 Xenomics, Inc. Compositions, methods and kits for isolating nucleic acids from body fluids using anion exchange media
US7899626B2 (en) 2007-01-10 2011-03-01 Illumina, Inc. System and method of measuring methylation of nucleic acids
JP5378687B2 (ja) 2007-03-02 2013-12-25 エフ.ホフマン−ラ ロシュ アーゲー Basp1遺伝子および/またはsrd5a2遺伝子中のメチル化シトシンを利用する、肝臓癌、肝臓癌発症リスク、肝臓癌再発リスク、肝臓癌悪性度および肝臓癌の経時的進展の検出方法
WO2008128198A2 (en) 2007-04-12 2008-10-23 Usc Stevens - University Of Southern California Dna methylation analysis by digital bisulfite genomic sequencing and digital methylight
EP2173897A2 (en) * 2007-06-19 2010-04-14 Oncomethylome Sciences SA Improved urine sample collecting and processing
US20100112590A1 (en) 2007-07-23 2010-05-06 The Chinese University Of Hong Kong Diagnosing Fetal Chromosomal Aneuploidy Using Genomic Sequencing With Enrichment
PT2183693E (pt) 2007-07-23 2014-01-14 Univ Hong Kong Chinese Diagnóstico de aneuploidia cromossómica fetal utilizando sequenciação genómica
JP5531367B2 (ja) 2007-08-01 2014-06-25 ダナ−ファーバー キャンサー インスチテュート 標的配列の濃縮
HUE019019T5 (en) 2007-08-22 2017-04-28 Trovagene Inc Methods for Using miRNA for In vivo Cell Death Detection
JP2010017179A (ja) 2008-06-11 2010-01-28 Sumitomo Chemical Co Ltd Dnaを定量又は検出する方法
CN105385784A (zh) 2008-10-31 2016-03-09 特罗瓦基因公司 用于检测人乳头瘤病毒的遗传标记
US20110028333A1 (en) 2009-05-01 2011-02-03 Brown University Diagnosing, prognosing, and early detection of cancers by dna methylation profiling
US20120221249A1 (en) 2009-05-15 2012-08-30 The Trustees of The Uniiversity of Pennsylvania Long Hepitype Distribution (LHD)
CN102021233B (zh) 2009-09-22 2014-06-04 复旦大学附属华山医院 一种定量检测akap12甲基化水平的方法及其应用
US20120208711A1 (en) 2009-10-02 2012-08-16 Centre For Addiction And Mental Health Method for Analysis of DNA Methylation Profiles of Cell-Free Circulating DNA in Bodily Fluids
EP2499262A4 (en) 2009-11-12 2015-01-07 Esoterix Genetic Lab Llc ANALYSIS OF THE NUMBER OF COPIES OF GENETIC LOCUS
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
EP2536854B1 (en) 2010-02-18 2017-07-19 The Johns Hopkins University Personalized tumor biomarkers
US10047397B2 (en) 2010-04-16 2018-08-14 Chronix Biomedical Breast cancer associated circulating nucleic acid biomarkers
KR102136041B1 (ko) 2010-04-29 2020-07-20 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 게놈 모델에 대한 데이터 통합을 이용하는 경로 인지 알고리즘 (paradigm)
PL2576837T3 (pl) 2010-06-04 2018-04-30 Chronix Biomedical Krążeniowe biomarkery typu kwasu nukleinowego związane z rakiem prostaty
EP2596127A2 (en) 2010-07-23 2013-05-29 Esoterix Genetic Laboratories, LLC Identification of differentially represented fetal or maternal genomic regions and uses thereof
WO2012031329A1 (en) 2010-09-10 2012-03-15 Murdoch Childrens Research Institute Assay for detection and monitoring of cancer
KR102185244B1 (ko) 2010-11-30 2020-12-02 더 차이니즈 유니버시티 오브 홍콩 암과 연관된 유전적 또는 분자적 이상들의 검출
WO2012103031A2 (en) 2011-01-25 2012-08-02 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
WO2012149171A1 (en) 2011-04-27 2012-11-01 The Regents Of The University Of California Designing padlock probes for targeted genomic sequencing
US20130059738A1 (en) 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
AU2012253525B2 (en) 2011-05-10 2016-09-22 Brunangelo Falini Hairy cell leukemia biomarkers and methods of using same
US20140178348A1 (en) 2011-05-25 2014-06-26 The Regents Of The University Of California Methods using DNA methylation for identifying a cell or a mixture of cells for prognosis and diagnosis of diseases, and for cell remediation therapies
WO2012178007A1 (en) 2011-06-22 2012-12-27 Yale University COMPOSITIONS AND METHODS OF DIAGNOSING DISEASES AND DISORDERS ASSOCIATED WITH β CELL DEATH
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
CA3067612A1 (en) 2011-09-22 2013-03-28 Lineage Biosciences, Inc. Compositions and methods for analyzing heterogeneous samples
ES2937410T3 (es) * 2011-09-26 2023-03-28 Qiagen Gmbh Método rápido para aislar ácidos nucleicos extracelulares
WO2013052907A2 (en) 2011-10-06 2013-04-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP2768985B1 (en) 2011-10-21 2019-03-20 Chronix Biomedical Colorectal cancer associated circulating nucleic acid biomarkers
WO2013060762A1 (en) 2011-10-25 2013-05-02 Roche Diagnostics Gmbh Method for diagnosing a disease based on plasma-dna distribution
US9845552B2 (en) 2011-10-27 2017-12-19 Verinata Health, Inc. Set membership testers for aligning nucleic acid samples
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
AU2012380717B2 (en) 2012-05-24 2018-08-16 Fundacio Institucio Catalana De Recerca I Estudis Avancats Method for the identification of the origin of a cancer of unknown primary origin by methylation analysis
US11261494B2 (en) 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
US20150197785A1 (en) 2012-08-10 2015-07-16 The Broad Institute, Inc. Methods and apparatus for analyzing and quantifying dna alterations in cancer
ES2906714T3 (es) 2012-09-04 2022-04-20 Guardant Health Inc Métodos para detectar mutaciones raras y variación en el número de copias
US20140066317A1 (en) 2012-09-04 2014-03-06 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
SG10201705198UA (en) 2012-09-20 2017-07-28 Univ Hong Kong Chinese Non-invasive determination of methylome of fetus or tumor from plasma
US9732390B2 (en) 2012-09-20 2017-08-15 The Chinese University Of Hong Kong Non-invasive determination of methylome of fetus or tumor from plasma
US20140274767A1 (en) 2013-01-23 2014-09-18 The Johns Hopkins University Dna methylation markers for metastatic prostate cancer
EP2971097B1 (en) 2013-03-15 2018-08-01 Verinata Health, Inc Generating cell-free dna libraries directly from blood
EP2997159B1 (en) 2013-05-13 2019-07-24 Rheinisch-Westfälische Technische Hochschule (RWTH) Aachen Method for determining a human individual's predisposition to contract a hematopoietic malignant myeloid disease
CN104250663B (zh) 2013-06-27 2017-09-15 北京大学 甲基化CpG岛的高通量测序检测方法
CN105555965B (zh) 2013-07-30 2020-06-05 深圳华大基因股份有限公司 确定核酸混合物中核酸组成的方法
EP3726213A1 (en) 2013-08-19 2020-10-21 Singular Bio Inc. Assays for single molecule detection and use thereof
WO2015061359A1 (en) 2013-10-21 2015-04-30 Verinata Health, Inc. Method for improving the sensitivity of detection in determining copy number variations
GB201319779D0 (en) 2013-11-08 2013-12-25 Cartagenia N V Genetic analysis method
WO2015077717A1 (en) 2013-11-25 2015-05-28 The Broad Institute Inc. Compositions and methods for diagnosing, evaluating and treating cancer by means of the dna methylation status
WO2015095225A1 (en) 2013-12-19 2015-06-25 The Board Of Trustees Of The Leland Stanford Junior University Quantification of mutant alleles and copy number variation using digital pcr with nonspecific dna-binding dyes
WO2015116837A1 (en) 2014-01-30 2015-08-06 The Regents Of The University Of California Methylation haplotyping for non-invasive diagnosis (monod)
GB2524948A (en) 2014-03-07 2015-10-14 Oxford Gene Technology Operations Ltd Detecting Increase or Decrease in the Amount of a Nucleic Acid having a Sequence of Interest
EP4306659A3 (en) 2014-04-14 2024-03-27 Yissum Research and Development Company of the Hebrew University of Jerusalem Ltd. A method and kit for determining the tissue or cell origin of dna
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
EP2942400A1 (en) 2014-05-09 2015-11-11 Lifecodexx AG Multiplex detection of DNA that originates from a specific cell-type
SG11201608993RA (en) * 2014-05-09 2016-11-29 Lifecodexx Ag Detection of dna that originates from a specific cell-type and related methods
CA2953469A1 (en) 2014-06-26 2015-12-30 10X Genomics, Inc. Analysis of nucleic acid sequences
WO2016015058A2 (en) 2014-07-25 2016-01-28 University Of Washington Methods of determining tissues and/or cell types giving rise to cell-free dna, and methods of identifying a disease or disorder using same
CN115029342A (zh) 2014-08-22 2022-09-09 分析生物科学有限公司 用于无细胞dna的定量遗传分析的方法
EP4092680A1 (en) 2014-09-12 2022-11-23 Illumina Cambridge Limited Detecting repeat expansions with short read sequencing data
EP3018213A1 (en) 2014-11-04 2016-05-11 Genesupport SA Method for determining the presence of a biological condition by determining total and relative amounts of two different nucleic acids
AU2015360298B2 (en) 2014-12-12 2018-06-07 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
US10011878B2 (en) 2014-12-12 2018-07-03 Exact Sciences Development Company Compositions and methods for performing methylation detection assays
ES2879964T3 (es) 2014-12-12 2021-11-23 Exact Sciences Dev Co Llc Composiciones y métodos para realizar ensayos de detección de metilación
US20170342500A1 (en) 2014-12-19 2017-11-30 Danmarks Tekniske Universitet Method for identification of tissue or organ localization of a tumour
EP3239302A4 (en) 2014-12-26 2018-05-23 Peking University Method for detecting differentially methylated cpg islands associated with abnormal state of human body
CN113930507A (zh) 2014-12-31 2022-01-14 夸登特健康公司 疾病的检测和治疗以及用于传送测试结果的系统和方法
US10364467B2 (en) 2015-01-13 2019-07-30 The Chinese University Of Hong Kong Using size and number aberrations in plasma DNA for detecting cancer
US9984201B2 (en) 2015-01-18 2018-05-29 Youhealth Biotech, Limited Method and system for determining cancer status
WO2016127944A1 (en) 2015-02-10 2016-08-18 The Chinese University Of Hong Kong Detecting mutations for cancer screening and fetal analysis
WO2016127844A1 (zh) 2015-02-12 2016-08-18 苏州晶云药物科技有限公司 IPI-145的晶型α及其制备方法
CN107750279A (zh) 2015-03-16 2018-03-02 个人基因组诊断公司 核酸分析系统和方法
EP3294906A1 (en) 2015-05-11 2018-03-21 Natera, Inc. Methods and compositions for determining ploidy
WO2016189288A1 (en) 2015-05-22 2016-12-01 Cambridge Epigenetix Ltd Nucleic acid sample enrichment
AU2016295712B2 (en) 2015-07-20 2022-06-02 The Chinese University Of Hong Kong Methylation pattern analysis of haplotypes in tissues in DNA mixture
JP6931236B2 (ja) 2015-07-23 2021-09-01 ザ チャイニーズ ユニバーシティ オブ ホンコン 無細胞dnaの断片化パターンの分析
CN115161390A (zh) 2016-05-30 2022-10-11 香港中文大学 使用血液中的无细胞dna检测血液病症

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105102634A (zh) * 2013-03-15 2015-11-25 伊穆科Gti诊治股份有限公司 使用尿的无细胞dna评价肾状态的方法和组合物
US20160017419A1 (en) * 2014-07-18 2016-01-21 The Chinese University Of Hong Kong Methylation pattern analysis of tissues in a dna mixture

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
AGNES BEERMANN等: "Methods for Separate Isolation of Cell-Free DNA and Cellular DNA from Urine-Application of Methylation-Specific PCR on both DNA Fractions", 《THE OPEN BIOMARKERS JOURNAL》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833965A (zh) * 2019-11-08 2020-10-27 中国科学院北京基因组研究所 一种尿沉渣基因组dna的分类方法、装置和用途
CN111833965B (zh) * 2019-11-08 2024-06-04 中国科学院北京基因组研究所(国家生物信息中心) 一种尿沉渣基因组dna的分类方法、装置和用途
CN112599189A (zh) * 2020-12-29 2021-04-02 北京优迅医学检验实验室有限公司 一种全基因组测序的数据质量评估方法及其应用
CN114686607A (zh) * 2020-12-31 2022-07-01 深圳华大生命科学研究院 棒状杆菌作为尿液微生物标志物在制备用于检测膀胱癌的相关检测产品中的应用
CN114686607B (zh) * 2020-12-31 2023-09-26 深圳华大生命科学研究院 棒状杆菌作为尿液微生物标志物在制备用于检测膀胱癌的相关检测产品中的应用
CN114898802A (zh) * 2022-07-14 2022-08-12 臻和(北京)生物科技有限公司 基于血浆游离dna甲基化测序数据的末端序列频率分布特征确定方法、评价方法及装置

Also Published As

Publication number Publication date
EP3548632A1 (en) 2019-10-09
EP3548632A4 (en) 2020-06-24
KR102529113B1 (ko) 2023-05-08
KR20230062684A (ko) 2023-05-09
US11435339B2 (en) 2022-09-06
AU2017369018B2 (en) 2021-02-25
AU2021203359A1 (en) 2021-06-24
US20220365067A1 (en) 2022-11-17
AU2024201498A1 (en) 2024-03-28
KR20190087418A (ko) 2019-07-24
JP2022058469A (ja) 2022-04-12
IL266347A (en) 2019-06-30
AU2021203359B2 (en) 2023-12-14
US20180149636A1 (en) 2018-05-31
AU2017369018A1 (en) 2019-05-02
JP2024028828A (ja) 2024-03-05
CA3039685A1 (en) 2018-06-07
JP2020503003A (ja) 2020-01-30
WO2018099418A1 (en) 2018-06-07

Similar Documents

Publication Publication Date Title
CN109983134A (zh) 尿液和其他样品中无细胞dna的分析
US11984195B2 (en) Methylation pattern analysis of tissues in a DNA mixture
Cheng et al. Genomewide bisulfite sequencing reveals the origin and time-dependent fragmentation of urinary cfDNA
CN104662168B (zh) 用于癌症检测的血浆dna突变分析
CN103789405B (zh) 作为检测日光照射、前列腺癌和其它癌症的诊断工具的线粒体突变及重排
ES2665273T5 (es) Determinación no invasiva de metiloma del feto o tumor de plasma
CN108138233B (zh) Dna混合物中组织的单倍型的甲基化模式分析
BR112020023587A2 (pt) método para determinar um perfil de fragmentação de dna livre de células (cfdna), método para identificar um mamífero como tendo câncer, método de identificação do tecido de origem de um câncer e método para tratar um mamífero com câncer
CN112602156A (zh) 用于检测残留疾病的系统和方法
EP4048809A1 (en) Systems and methods for predicting therapeutic sensitivity
CN106834468B (zh) Aim1和eme1易感snp位点检测试剂及其制备的试剂盒
TW202409295A (zh) Dna混合物中之組織甲基化模式分析

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40005557

Country of ref document: HK