CN115627541A - 从微量DNA建立cfDNA库的方法、系统和应用 - Google Patents

从微量DNA建立cfDNA库的方法、系统和应用 Download PDF

Info

Publication number
CN115627541A
CN115627541A CN202211526286.8A CN202211526286A CN115627541A CN 115627541 A CN115627541 A CN 115627541A CN 202211526286 A CN202211526286 A CN 202211526286A CN 115627541 A CN115627541 A CN 115627541A
Authority
CN
China
Prior art keywords
cfdna
library
tumor
concentration
pcr amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211526286.8A
Other languages
English (en)
Other versions
CN115627541B (zh
Inventor
袁祖阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cancer Hospital and Institute of CAMS and PUMC
Original Assignee
Cancer Hospital and Institute of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cancer Hospital and Institute of CAMS and PUMC filed Critical Cancer Hospital and Institute of CAMS and PUMC
Priority to CN202211526286.8A priority Critical patent/CN115627541B/zh
Publication of CN115627541A publication Critical patent/CN115627541A/zh
Application granted granted Critical
Publication of CN115627541B publication Critical patent/CN115627541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Theoretical Computer Science (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Evolutionary Biology (AREA)
  • Oncology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Medicinal Chemistry (AREA)
  • Hospice & Palliative Care (AREA)
  • General Chemical & Material Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及从微量DNA建立cfDNA库的方法、系统和应用,特别是用于从起始含量为1‑100 ng的cfDNA,例如ctDNA,特别是食管鳞状上皮细胞癌的ctDNA进行建库,使其具有较低PCR复制率(<30%)的技术。

Description

从微量DNA建立cfDNA库的方法、系统和应用
技术领域
本发明涉及对微量DNA进行建库的技术,特别是用于从起始含量为1-100 ng的cfDNA,例如ctDNA,特别是食管鳞状上皮细胞癌的ctDNA进行建库,使其具有较低PCR复制率(<30%)的技术。
背景技术
近年来,液态活检中的循环游离DNA(circulating cell-free DNA, cfDNA)检测技术已迅速成为一种重要的、微创的方法用于辅助组织活检技术诊断肿瘤疾病,甚至在某些情况下可以作为组织活检的替代方案用于肿瘤的诊断和治疗的监测,指导肿瘤的个性化用药和精准治疗。cfDNA正在成为一种极具前景的分子标志物用于肿瘤的分子诊断、肿瘤的早期发现和治疗监测以及洞悉肿瘤的异质性。cfDNA是存在于血液里的碎片化的双链DNA分子,于1948年由生物学家Mandel和Metais首次报道(例如见,Les acides nu-cléiques duplasma sanguin chez l’homme. C R Seances Soc Biol Fil, 1948, 142:241-243.)。研究表明,cfDNA来源于凋亡或坏死的细胞,其片段长度位于150-200个碱基对(bp),其在血循环里的半衰期约为1小时。cfDNA在正常人体内的含量非常微小,约为10-15ng/mL。但在肿瘤患者体内,cfDNA的含量远远高于正常人,且大多数来源于肿瘤细胞。那些来源于肿瘤细胞的cfDNA被称为循环肿瘤DNA(circulating tumor DNA, ctDNA),其携带的遗传信息往往与来源的肿瘤组织密切相关。肿瘤患者体内ctDNA的含量在cfDNA中的比例变化很大,可少于0.1%或大于90%。ctDNA含量的多少可能与肿瘤的病理类型、肿瘤负荷以及肿瘤的生物特性等有关(例如见,Circulating mutant DNA to assess tumor dynamics. NatureMedicine, 2008, 14:985- 90.; Detection of circulating tumor DNA in early- andlate-stage human malignancies. Science Translational Medicine, 2014, 6:224ra24)。通过采集肿瘤患者外周血液并分离血浆,采用专业的cfDNA提取试剂盒可以得到比较纯净的cfDNA。采用第二代高通量测序方法可以获取ctDNA中所携带的遗传信息,如肿瘤突变基因、单核苷酸变异(SNP)、拷贝数变异(CNV)、基因融合、DNA 甲基化改变,甚至是肿瘤亚克隆中的突变等。通过生物信息学分析技术,可以研究ctDNA在肿瘤诊断、治疗监测以及预后预测等方面的重要作用,使其成为一种可以实时反映肿瘤发生发展的分子标志物。
研究表明通过对比ctDNA与同一患者体内肿瘤组织的遗传信息发现,ctDNA所携带的肿瘤遗传信息与肿瘤组织的一致率可以高达70%以上(Circulating Tumor DNAAnalysis for Detection of Minimal Residual Disease After Chemoradiotherapyfor Localized Esophageal Cancer. Gastroenterology, 2019, pii: S0016-5085(19)41530-8.)。通过检测ctDNA的肿瘤突变负荷(tumor mutational burden, TMB), 可以有效预测肿瘤患者对免疫治疗的有效反应性。该研究还发现,ctDNA可以用于监测局部进展期食管癌放化疗后的肿瘤微残留病灶,并且可以比影像学早2.8个月监测到肿瘤的进展。说明ctDNA是一种很好的液态活检标志物。对于一些无法手术切除肿瘤或是无法获取肿瘤组织标本的癌症患者,ctDNA有望成为一种辅助或替代组织活检的新技术,对肿瘤进行分子分期诊断,实时反映患者体内的肿瘤遗传变化,为患者的抗肿瘤治疗提供指导信息。
cfDNA是来自正常细胞和肿瘤细胞的DNA片段的混合物,在大多数癌症患者中,ctDNA的比例极低(多为0.1%-5%,甚至一些转移癌患者<10%)。目前,许多临床研究已表明ctDNA作为一种液态活检标志物在许多肿瘤中(如肺癌、肝癌、胃癌、结直肠癌、乳腺癌和卵巢癌等)可以用于肿瘤的早期发现、分子诊断、疗效评价和预后监测等。由于某些癌症,例如食管鳞状上皮细胞癌((esophageal squamous cell carcinoma, ESCC))患者血浆中的cfDNA的浓度很低,ctDNA的比例很小(仅为0.1-5%),导致构建cfDNA测序文库的成功率低、测序数据背景干扰因素较多。欧美国家报道的少数针对ctDNA在食管腺癌(esophagealadenocarcinoma, EAC)中的研究,由于样本量小且不够系统、深入而不具有代表性(Thegenetics of gastroesophageal adenocarcinoma and the use of circulating cellfree DNA for disease detection and monitoring. Expert Review of MolecularDiagnostics, 2017, 17(5):459-470; 和Detection of circulating tumor DNA inplasma: a potential biomarker for esophageal adenocarcinoma. Annals ofThoracic Surgery, 2019, 108(2):343-349.)。并且,EAC和ESCC是两种完全不同的病理类型,在肿瘤遗传信息、临床病理特征、治疗方式和预后等方面均有较大差异。ESCC是一种中国特色的癌种,且具有早期诊断困难、疗效不佳和预后差等特点。
并且,ESCC的肿瘤异质性较强。肿瘤异质性和亚克隆突变造成肿瘤发生发展的不稳定,是导致ESCC早期发生淋巴结转移和对放化疗不敏感的重要原因之一(例如见,Multiple region whole-exome sequencing reveals dramatically evolvingintratumor genomic heterogeneity in esophageal squamous cell carcinoma.Oncogenesis, 2015, 30;4: e175;和Biological and therapeutic impact ofintratumor heterogeneity in cancer evolution. Cancer Cell, 2015, 27(1): 15-26)。肿瘤复发和远处转移仍是导致ESCC患者死亡的最主要原因(Esophagectomy for T1esophageal cancer: outcomes in 100 patients and implications for endoscopictherapy. Annals of Thoracic Surgery. 87(4): 1048-1054.)。
CN112020563A,其内容的特点主要是通过生物信息学方法去发现cfDNA中的遗传信息,即包括基因突变、靶基因检测等内容。属于对测序数据进行有效分析的方法学,即对测序数据的计算方法的改进。
CN113728116A聚焦于对cfDNA生物特性的研究方法,即通过与健康对照组比较,对cfDNA片段大小分布进行分析,从而发现来自癌症患者的cfDNA片段,进而用于癌症患者的早期检测。该专利聚焦于cfDNA的生物特性,即片段大小分布,不涉及DNA建库测序的内容。cfDNA的片段大小可以通过专门的实验技术予以测定,不需要建库测序。
CN114068008A阐述了一种食管癌临床决策、教学、科研辅助支持系统及方法,该系统和方法通过配套的医学和药学资料存储单元、诊疗参数存储单元、信息输入单元、比对处理器单元、诊疗结果输出单元和预警与操作记录单元,能根据患者疾病特异性信息参数值,为相关医务工作者提供切实可行的临床诊疗方案建议以及对应的临床研究与真实世界研究证据支撑。根据专利内容,可以大概推断这是一个有关帮助医生临床决策的互联网系统,类似于一种办公系统,用于解决医务工作者时间与精力难以跟上临床研究进展的矛盾。不涉及生物实验技术方面的内容。
CN115176034A聚焦基因甲基化的测序内容,并且构建了一种从DNA提取、文库构建、测序、数据分析、甲基化水平判定的一套完整的检测系统。其中,甲基化检测内容属于一种单独的DNA测序,主要检测DNA片段上的甲基化程度(即CpG岛的数量)。DNA甲基化检测的文库构建及测序与一般DNA测序不同。
而本申请还没有微量DNA建库技术,所述微量DNA建库技术能够用于DNA片段(主要是cfDNA)的全序列测序,包括全基因组测序(WES)和靶向测序(即目标基因panel测序)。
因此,需要能够有效从cfDNA的浓度很低的患者,例如食管鳞状上皮细胞癌(esophageal squamous cell carcinoma, ESCC)患者的血浆样品中建立cfDNA测序文库,并保证在较低PCR复制率(<30%)的情况下得到高质量的测序数据的方法和技术,从而保证对ESCC患者的诊断和治疗检测。
发明内容
为了解决现有技术中的上述问题,本发明人自主研发了一套微量DNA建库技术,专门针对cfDNA测序文库的构建,尤其是针对总量<10ng的cfDNA样本,并且保证在较低PCR复制率(<30%)的情况下得到高质量的测序数据,突破因DNA含量太低而无法成功构建高质量测序文库的技术瓶颈。
在本发明的一个方面,提供了一种从起始DNA含量为1-100 ng的样品进行cfDNA建库的方法,所述方法包括:
DNA片段的末端修复;
加A-尾;
连接接头,所述接头浓度为相对于所述cfDNA量所需接头浓度的5%-20%;
去除反应中的接头二聚体;
测序文库的PCR扩增,经过去除接头二聚体的反应体系进行PCR扩增进行,所述PCR反应条件包括:初始变性 ,中间的变性-退火-延长循环,和最终延长,其中中间的变性-退火-延长循环为10-15次。
在本发明所述方法的实施方式中,所述接头浓度为试剂盒说明书推荐使用浓度的8%-15%,或10%。
在本发明所述方法的实施方式中,所述PCR扩增中的中间的变性-退火-延长循环为12-15个循环。
在本发明所述方法的实施方式中,所述cfDNA为ctDNA。
在本发明的一个方面,提供了一种从起始DNA含量为1-100 ng的样品进行cfDNA建库的系统,所述系统包括以下模块:
DNA片段的末端修复模块,
加A-尾模块,
连接接头模块,所述模块使得所述接头浓度为相对于所述cfDNA量所需接头浓度的5%-20%;
去除反应中的接头二聚体模块,
测序文库的PCR扩增模块,所述模块使得PCR扩增中的中间的变性-退火-延长循环为10-15次。
在本发明的一个方面,提供了一种从起始DNA含量为1-100 ng的样品进行cfDNA建库的计算机执行方法,所述计算机执行方法包括以下步骤:
执行DNA片段的末端修复;
执行加A-尾;
执行连接接头,所述模块使得所述接头浓度为相对于所述cfDNA量所需接头浓度的5%-20%;
执行去除反应中的接头二聚体;
执行测序文库的PCR扩增,使得PCR扩增中的中间的变性-退火-延长循环为10-15次。
在本发明所述系统的实施方式或本发明所述计算机执行方法的实施方式中,
所述接头浓度为试剂盒说明书推荐使用浓度的8%-15%,或10%;和/或
在本发明所述系统的实施方式或本发明所述计算机执行方法的实施方式中,所述PCR扩增中的中间的变性-退火-延长循环为12-15个循环。
在本发明的一个方面,提供了一种从起始DNA含量为1-100 ng的样品构建的cfDNA文库在制造用于对ctDNA含量为1-100 ng的肿瘤进行诊断、预后和治疗监测的试剂盒中的应用,所述试剂盒包括进行上述本发明cfDNA建库的方法中所述的从起始DNA含量为1-100ng的样品进行cfDNA建库的方法所需的试剂,其中,所构建的ctDNA文库用于对肿瘤诊断、预后和治疗监测。
在本发明的一个方面,提供了一种计算机存储介质,该存储介质存储有对肿瘤进行诊断、预后和治疗监测的计算机执行程序,所述计算机执行程序包括以下步骤:
执行DNA片段的末端修复;
执行加A-尾;
执行连接接头,所述模块使得所述接头浓度为相对于所述cfDNA量所需接头浓度的5%-20%;
执行去除反应中的接头二聚体;
执行测序文库的PCR扩增,使得PCR扩增中的中间的变性-退火-延长循环为10-15次。
在本发明所述方法的实施方式或本发明计算机存储介质的实施方式中,所述肿瘤为食管鳞状上皮细胞癌。
附图说明
现在将仅以举例的方式并参考以下附图描述本发明的非限制性实施方式:
图1: 显示了本发明的微量建库法的基本步骤。
图2A、图2B和图2C:图2A和图2B Agilent 2100检测结果显示cfDNA的峰值位于160bp左右;图2C:琼脂凝胶电泳分析结果显示组织DNA无明显降解,无RNA及蛋白质污染。图中M-1为Trans 2k plus,上样2ul;M-2位trans 15k plus,上样2ul;S为标准品,上样2ul。序列1、9、10为原液上样0.5ul;序列3、6、7为原液上样3ul;其余序列为原液上样5ul。
图3:显示队列P-1中食管癌肿瘤组织及配对cfDNA中基因突变的类型统计,图3的A和B显示最常见的单核苷酸变异形式为C>T转变,图3的C显示最常见的单核苷酸变异类型为错义突变。
图4:显示在本发明实施方式的队列P-1的所有肿瘤样本中发现的694个突变基因中,有13个突变基因(即,图4左侧从上到下显示的13个基因)被既往研究证实与食管癌的发生发展相关。其中,
TP53在E102_1T、E102_2T、E102_3T、E102_4T中为剪接位点突变,在E110_1T、E110_3T、E110_4T为框内插入,CTNND2在E102_cfDNA、E102_1T、E102_2T、E102_4T中为框内缺失,NOTCH3在E102_cfDNA中为框内插入,在E110_cfDNA有多次打击突变,ATM在E102_3T、E102_4T中为框移缺失。其余突变基因(包括MUC16, DNAH9, EP300, SYNE1, RP1, TTN, KMT2D, NOTCH1, USH2A)在发现的样本中均表现为错义突变。
图5:显示在本发明实施方式中与5个重要癌基因通路(TP53、Hippo、WNT、RTK-RAS和NOTCH)有关的20个癌基因中,有12个基因(NOTCH3, NCOR2, SPEN, ARHGAP35, KSR1, DAB2IP, IRS1, DVL3, FRAT1, TAOK2, LLGL2, TEAD2)可在ctDNA中找到,发现率60%(12/20) 。其中,NOTCH3在E102_cfDNA中为无义突变,在E110_cfDNA有多次打击突变,NCOR2在E102_cfDNA中为框移突变,IRS1在E102_cfDNA中为框内缺失,RASGRF2在E110_3T中为框内缺失,TP53在E102_1T、E102_2T、E102_3T、E102_4T中为剪接位点突变,在E110_1T、E110_3T、E110_4T为框内插入。其余突变基因(包括EP300, NUMB, NOTCH1, SPEN, ARHGAP35, KSR1, DAB2IP, DVL1, DVL3, FRAT1, ZNRF3, TAOK2, LLGL2, TEAD2)为错义突变。
图6:显示队列P-2中食管癌肿瘤组织及配对cfDNA中基因突变的类型统计,图6的A和B显示最常见的单核苷酸变异形式仍然为C>T转变,图6的C显示最常见的单核苷酸变异类型为错义突变。
图7:显示E104、E111和E121三例cfDNA的VAF分布情况。
图8:显示队列P-2的32个突变基因(即,图8左侧从上至下显示的32个基因)的发生分布情况。其中,FBXW7在E121_1T、E121_2T和E121_3T中有无义突变,PTCH1在E104_cfDNA中有无义突变,LIFR在E104_1T中有无义突变,CSMD3在E104_1T中有无义突变,PTCH1在E111_1T、E111_2T和E111_3T中有剪接位点突变,NUP214在E121_1T、E121_2T中有剪接位点突变,SDHD在E121_1T有剪接位点突变,CSMD3在E104_2T中有剪接位点突变,ASXL1在E111_2T和E121_cfDNA中有移框突变,PRDM1在E111_3T中有移框突变,BRIP1在E104_1T中有移框突变,SDHD在E104_cfDNA中有移框突变,CSMD3在E104_cfDNA中有多次打击突变,KMT2D在E104_1T、E104_2T和E104_3T中有多次打击突变, TP53在E104_1T、E104_2T、E104_3T和E111_2T中有多次打击突变,BRCA2在E104_cfDNA和E111_3T中有多次打击突变,NFE2L2ATR在E111_cfDNA中有多次打击突变。其余在样本中发现的突变基因均为错义突变。
图9:显示E104、E111和E121的ctDNA中发现的食管癌相关突变基因也能在配对肿瘤组织中发现的概率分别为62.5%(10/16,包括:CSMD3, KMT2D, LRP1B, SYNE1, ATR, EP300, PRDM1, UBR5, FSTL5和LIFR,如图9的A),76.2%(16/21,包括:KMT2D, LRP1B, SYNE1, BRCA2, ATR, EP300, ASXL1, MTOR, PKHD1, PTCH1, UBR5, BRIP1, KMT2A, NUP214, NOTCH2CREBBP,如图9的B)和35.7%(5/14,包括:KMT2D, LRP1B, EP300, PKHD1 PRDM1,如图9的C)。而在不同肿瘤组织位点中发现的突变基因个数和种类也不相同。其中,T1, T2, T3分别代表了同一肿瘤组织的不同取样位点。
图10:显示ctDNA的VAF与配对肿瘤组织的VAF具有高度一致性。其中队列P-1的Pearson 相关系数r=0.78(如图10的A);队列P-2的Pearson相关系数r=0.92(如图10的B)。
具体实施方式
现在将在下文中参考附图更全面地描述本发明,在附图中示出了本发明的一些但不是全部实施方式。
所描述的本发明不应该限于所公开的特定实施方式,并且修改和其他实施方式也包括在本发明的范围内。尽管本文采用了特定术语,但是它们仅在一般性和描述性意义上使用,而不是出于限制的目的。
贯穿本说明书中,单数形式“一”、“一个”和“该”包括复数形式,除非上下文另有明确说明。
本文所使用的术语和措词是出于描述的目的,并且不应被视为限制。 本文使用的术语“包含”、“包括”、“具有”和“含有”及其变体的使用意在涵盖其后列出的项目及其等同物以及其他项目。
本发明针对起始DNA含量极低的样品进行建库,例如样品中启示DNA含量为1 ng以上、3 ng以上、5 ng以上或8 ng以上,并且为100 ng以下、80 ng以下,50 ng以下,30 ng以下,20 ng以下,或10 ng以下。尤其值得指出的是,本发明的方法对起始DNA含量为1 ng的样品可以有效地建库,实现了优于现有技术其他方法的建库效果。
例如,cfDNA在某些类型癌症患者(如食管癌,特别是食管鳞状上皮细胞癌)的血浆中含量较少,4mL血浆可以提取cfDNA 5-50ng。对于含量少于10ng的cfDNA样本,无法用一般的建库方法完成DNA文库构建。在本发明中,通过调整和改进现有技术中的构建DNA文库的技术方法,本发明人自主研发一套针对微量cfDNA的文库构建方法,成功实现微量cfDNA文库的构建,从而便于完成后续的深度测序工作。微量建库法的基本步骤如图1所示。例如,可采用KAPA Hyper Prep Kit(Kapa Biosystems)和SureSelect Target Enrichment System(Agilent Technologies)等试剂来进行本发明的cfDNA文库构建。
与标准的cfDNA文库构建方案相比,微量文库构建方案中cfDNA的起始量可为1-100ng。由于cfDNA的长度位于150-200bp,故无需额外片段化,提取的cfDNA可以直接用于文库构建。为提高DNA文库的质量,将连接步骤中使用的接头浓度降低为现有技术的10倍,即本发明反应体系中的接头浓度为现有技术的1/10,以减少接头二聚体的形成。此外,通过调整PCR反应的条件和时间,减少接头二聚体的扩增,并且确保Agencourt AMPure XP磁珠(Beckman Coulter)完全去除PCR扩增后的接头二聚体,以获得cfDNA文库构建的最佳结果。
在一方面,本发明涉及到从起始DNA含量极低的样品进行建库的方法,所述方法可以从任何样品中含量极低的DNA出发,制备出所需片段和/或序列的文库。
所述方法在用于涉及到疾病的样品的情况下,直接目的不是获得诊断结果或健康状况,而只是对已经脱离人体的样品进行建库的处理以获取作为用于进一步检测的文库,并且在根据现有技术的医学知识和本申请的构建文库的技术方案不能直接得出疾病的诊断结果或健康状况,因此是中间结果,不属于疾病的诊断方法。
在一方面本发明可用于不涉及疾病的样品,例如DNA含量极低的非疾病相关的样品。
在一个实施方式中,本发明的方法包括以下步骤,本实施方式中的以下试剂来自KAPA Hyper Prep Kit(Kapa Biosystems)或SureSelect Target Enrichment System(Agilent Technologies):
- DNA片段的末端修复,采用末端修复酶混合剂,及相应的缓冲体系进行,可以将反应混合物放入热循环器,先在25°C下孵育30分钟,然后在75°C下孵育20分钟(此步骤用于使酶失活)。
- 加A-尾,将DNA聚合酶及加A尾缓冲液加入到上述步骤得到的DNA末端修复反应产物中,在热循环仪上设定条件为先在37°C下孵育30分钟,然后在75°C下孵育10分钟(此步骤用于使酶失活)。
连接接头,按1:10比例将接头稀释,然后将DNA连接酶和相应缓冲液加入到包含经过末端修复和加A尾的DNA的PCR试管中,将设定热循环器条件为25°C下孵育15分钟。注意:在孵育过程中不要使用加热的盖子,以避免破坏连接酶的活性。
其中:每个连接反应只能使用一个接头。如果在同一测序过程中要对多个样本进行测序,则应使用包含6至8个唯一序列[即索引]的不同条形码接头来区分不同的样本。使用条形码接头时,每次只打开一个接头试剂管,并在加入不同的条形码接头时更换手套,以避免交叉污染。
- 去除反应中的接头二聚体,在每个连接反应中加入磁珠,以便DNA与磁珠结合,从而通过磁珠纯化DNA。
- 测序文库的PCR扩增,将来自以上磁珠纯化DNA步骤的文库DNA通过PCR扩增进行,所述PCR反应条件设定如表1所示:
表1
Figure 233853DEST_PATH_IMAGE001
- 纯化PCR产物,对于扩增产物,采用磁珠进行纯化。可使用Agilent BioAnalyzer2100评估纯化后的文库质量。检查文库片段的大小分布是否正确,以及是否有接头或接头二聚体残留。
检测合格的DNA文库在−20°C冰箱中保存(不超过1个月)或−80°C冰箱长期保存,用于后续的测序。
在本发明的文库构建方法中,连接接头步骤中的接头浓度为试剂盒说明书推荐使用浓度的5%-20%,优选为8%-15%,最优选为10%。接头浓度的降低可以减少接头二聚体的形成。
此外,通过调整PCR反应的条件和时间,减少接头二聚体的扩增。并且确保Agencourt AMPure XP磁珠(Beckman Coulter)完全去除PCR扩增后的接头二聚体,以获得cfDNA文库构建的最佳结果。
在本发明的文库构建方法中,测序文库的PCR扩增的循环数设定为10-15个循环,优选12-15个循环。如果循环数大于15,则提高PCR复制率,使其大于30%,而大于30%的PCR复制率不能得到用于后续测序的高质量数据。
PCR复制率低(小于30%)是衡量测序数据质量的标准之一,是数据指控的指标。PCR复制率低可以减少测序数据中无效复制,提高测序数据的质量,使得测序数据中有效数据的比例增高,从而提高后续ctDNA相关数据的阳性率。
在一方面,本发明涉及到从起始DNA含量极低的样品进行建库的系统。
在本发明的一个实施方式中,所述用于从起始DNA含量极低的样品进行建库的系统包括以下模块:
- DNA片段的末端修复模块,其执行上述建库方法中的“DNA片段的末端修复”步骤;
- 加A-尾模块,其执行上述建库方法中的“加A-尾”步骤;
- 连接接头模块,其执行上述建库方法中的“连接接头”步骤,所述模块使得接头浓度为试剂盒说明书推荐使用浓度的5%-20%,优选为8%-15%,最优选为10%;
- 去除反应中的接头二聚体模块,其执行上述建库方法中的“去除反应中的接头二聚体”步骤;
- 测序文库的PCR扩增模块,其执行上述建库方法中的“测序文库的PCR扩增”步骤,所述模块使得PCR扩增的循环数设定为10-15个循环,优选12-15个循环;
- 纯化PCR产物模块,其执行上述建库方法中的“纯化PCR产物”步骤。
另一方面,本发明涉及到从起始DNA含量极低的样品进行建库的计算机执行方法。
在本发明的一个实施方式中,本发明的所述计算机执行方法包括执行本发明的从起始DNA含量极低的样品进行建库的系统的计算机执行方法。
在本发明的一个实施方式中,本发明的所述计算机执行方法包括以下步骤:
- 执行DNA片段的末端修复模块,从而实现上述建库方法中的“DNA片段的末端修复”步骤;
- 执行加A-尾模块,从而实现上述建库方法中的“加A-尾”步骤;
- 执行连接接头模块,从而实现上述建库方法中的“连接接头”步骤,所述模块使得接头浓度为试剂盒说明书推荐使用浓度的5%-20%,优选为8%-15%,最优选为10%;
- 执行去除反应中的接头二聚体模块,从而实现上述建库方法中的“去除反应中的接头二聚体”步骤;
- 执行测序文库的PCR扩增模块,从而实现上述建库方法中的“测序文库的PCR扩增”步骤,所述模块使得PCR扩增的循环数设定为10-15个循环,优选12-15个循环;
- 执行纯化PCR产物模块,从而实现上述建库方法中的“纯化PCR产物”步骤。
又一方面,本发明涉及到对肿瘤,特别是对食管鳞状上皮细胞癌进行诊断、预后和治疗监测的方法,所述方法包括从起始DNA含量极低的样品进行建库的方法。
在一个具体实施方式中,本发明的对肿瘤,特别是对食管鳞状上皮细胞癌进行诊断、预后和治疗监测的方法包括:
- DNA片段的末端修复
- 加A-尾
- 连接接头,其中接头的使用浓度为常规建库方法的1/10。
- 可选的磁珠纯化
- 测序文库的PCR扩增
- 纯化PCR产物。
- 利用纯化的PCR产物进行肿瘤,例如食管鳞状上皮细胞癌的诊断、预后和治疗监测。
在本发明的肿瘤,例如食管鳞状上皮细胞癌的诊断、预后和治疗监测的方法中,连接接头步骤中的接头浓度为试剂盒说明书推荐使用浓度的5%-20%,优选为8%-15%,最优选为10%。接头浓度的降低可以减少接头二聚体的形成。
此外,通过调整PCR反应的条件和时间,减少接头二聚体的扩增。并且确保Agencourt AMPure XP磁珠(Beckman Coulter)完全去除PCR扩增后的接头二聚体,以获得cfDNA文库构建的最佳结果。
在本发明的肿瘤,例如食管鳞状上皮细胞癌的诊断、预后和治疗监测的方法中,测序文库的PCR扩增的循环数设定为10-15个循环,优选12-15个循环。如果循环数大于15,则提高PCR复制率,使其大于30%,而大于30%的PCR复制率不能得到用于后续测序的高质量数据。
在本发明的又一个方面,本发明涉及到一种计算机存储介质,该存储介质存储有对肿瘤,特别是对食管鳞状上皮细胞癌进行诊断、预后和治疗监测的计算机执行程序,所述计算机执行程序包括从起始DNA含量极低的样品进行建库的计算机执行程序。因此,本发明涉及到一种计算机存储介质,该存储介质存储有从起始DNA含量极低的样品进行建库的计算机执行程序。
在本发明的一个实施方式中,本发明的所述计算机执行方法包括执行本发明的从起始DNA含量极低的样品进行建库的系统的计算机执行方法。
在本发明的一个实施方式中,本发明的所述计算机执行方法包括以下步骤:
- 执行“DNA片段的末端修复”步骤;
- 执行“加A-尾”步骤;
- 执行“连接接头”步骤,所述模块使得接头浓度为试剂盒说明书推荐使用浓度的5%-20%,优选为8%-15%,最优选为10%;
- 执行“去除反应中的接头二聚体”步骤;
- 执行“测序文库的PCR扩增”步骤,所述模块使得PCR扩增的循环数设定为10-15个循环,优选12-15个循环;
- 执行“纯化PCR产物”步骤。
在本发明的各个实施方式中,由于食管癌患者外周血cfDNA中ctDNA含量很少(<0.1%)。因此,需要面对初始DNA含量低难以有效建库获得足够的检测对象的问题。另一方面,为了获得高质量的测序数据,所构建的文库需要保证低的PCR复制率(<30%)。本发明采用降低接头浓度至试剂盒说明书推荐使用浓度的5%-20%,优选为8%-15%,最优选为10%,并在测序文库的PCR扩增中,将PCR扩增的循环数设定为10-15个循环,优选12-15个循环,实现了上述两个要求之间的平衡,突破因DNA含量太低而无法成功构建高质量测序文库的技术瓶颈。
本发明采用的研究样本来自临床试验中的5位食管癌患者,所有患者样本采集之前均未进行任何治疗。每一位患者的血液标本和组织标本均在同一天采集完成。为了对比该实验技术在不同测序方法中的效果,实验分为两个队列人群P-1和P-2。其中,队列P-1包括2个患者(E102和E110)。2例患者的cfDNA和组织DNA采用全外显子(whole exomesequencing, WES 300X)。队列P-2的3例患者(E104、E111和E121)采用包含560个癌基因的All-in-one Cancer Panel进行靶向测序(Targeted capture sequencing, TCS 1000X)。队列P-1和队列P-2患者的临床病理信息见表2。
表2
Figure 682151DEST_PATH_IMAGE002
首先,对所提取的cfDNA和组织DNA进行质检。质检结果显示,cfDNA的峰值位于160bp左右,符合预期长度。4mL血浆中cfDNA的总量为:5-80ng。组织DNA无明显降解,无RNA及蛋白质污染(如图2C)。
队列P-1的E102和E110的cfDNA、肿瘤组织DNA和白细胞DNA采用全外显子(WES,300X)测序。生物信息学分析结果表明:肿瘤组织的突变个数范围从290到483(包括沉默和非同义突变),中位数342。E102和E110的cfDNA的突变个数分别为915个和863个。肿瘤组织的肿瘤突变负荷(tumor mutation burden, TMB)的范围从4.92到8.19个突变/M,而ctDNA的TMB范围从14.63到15.51个突变/M,明显高于肿瘤组织的TMB。在所有已发现的突变中,最常见的突变类型为C>T转变(如图3的A和B);最常见的变异类型为错义突变(如图3的C)。这一结果与既往有关食管癌基因突变的研究报道一致。
在队列P-1的所有肿瘤样本中发现的694个突变基因中,有13个突变基因被既往研究证实与食管癌的发生发展相关,包括:TP53, MUC16, CTNND2, DNAH9, EP300, NOTCH3, SYNE1, RP1, TTN, ATM, KMT2D, NOTCH1USH2A。其中,MUC16,CTNND2 NOTCH3 也被同时发现存在于配对的ctDNA中(如图4所示)。
其中,与5个重要癌基因通路(TP53、Hippo、WNT、RTK-RAS和NOTCH)有关的20个癌基因中,有12个基因可在ctDNA中找到,发现率60%(12/20)。这些信号通路中某些基因的表达直接或间接参与肿瘤对化疗的应答反应。说明ctDNA可以用于食管癌化疗敏感性相基因的发现(如图5所示)。
在队列P-1的食管癌的肿瘤组织中发现了MUC基因家族的MUC4MUC17,而在配对的ctDNA中同样发现了MUC家族中的MUC16。MUC基因家族已被报道与食管癌新辅助化疗敏感性有关(例如,见Somatic mutations in plasma cell-free DNA are diagnosticmarkers for esophageal squamous cell carcinoma recurrence,Oncotarget,2016 Sep20;7(38):62280-62291)。
根据队列P-1的研究结果,我们发现在食管癌的cfDNA中的ctDNA含量较少。为了进一步识别食管癌的cfDNA中的低频率的肿瘤相关突变,我们采用含有560个癌基因的All-in-one Cancer Panel对队列P-2的E104,E111和E121的cfDNA、肿瘤组织DNA和白细胞DNA进行靶向测序(Targeted capture sequencing, TCS),测序深度为1000X。分析结果表明,肿瘤组织的突变基因个数从107到194个,中位数为142。在三个食管癌患者的cfDNA中发现的突变基因个数分别为494、796和262个,明显高于肿瘤组织所发现的肿瘤相关突变基因。突变的类型仍然是C>T的转变(如图6的A和B);最主要的变异类型为错义突变(如图6的C),与队列P-1的研究结果一致。
为了识别和确认在cfDNA中的肿瘤突变基因(即ctDNA),我们在突变发现运算法则中设置VAFmin为0.1%。E104、E111和E121的第一和第三分位数分别为0.49-0.88%、0.44-0.77%和0.41-0.875%。共有14个突变的VAF大于5%。三例cfDNA的VAF分布情况如图7所示。
在队列P-2的所有测序样本中发现333个肿瘤相关突变基因。其中,32个突变基因被既往研究证实与食管癌的发生发展及治疗反应相关。 其中,在ctDNA和配对肿瘤组织中都发现的BRCA2 [Multi-region sequencing unveils novel actionable targets and spatial heterogeneity in esophageal squamous cell carcinoma,Nat Communactions. 2019 Apr 11;10(1):1670], NOTCH2, KMT2DKMT2A [Genomic characteristics in neoadjuvant chemoradiotherapy for locally advanced esophageal squamous cell carcinoma,J Gastrointest Oncol. 2020 Dec;11(6):1105- 1112]已被报道与食管癌化疗敏感性密切相关。32个突变基因的发生分布情况如图8所示。
通过分析比较发现,在ctDNA中发现的突变基因个数明显高于配对的肿瘤组织。E104、E111和E121的ctDNA中发现的食管癌相关突变基因也能在配对肿瘤组织中发现的概率分别为62.5%(10/16,包括:CSMD3, KMT2D, LRP1B, SYNE1, ATR, EP300, PRDM1, UBR5, FSTL5和LIFR,如图9的A),76.2%(16/21,包括:KMT2D, LRP1B, SYNE1, BRCA2, ATR, EP300, ASXL1, MTOR, PKHD1, PTCH1, UBR5, BRIP1, KMT2A, NUP214, NOTCH2CREBBP,如图9的B)和35.7%(5/14,包括:KMT2D, LRP1B, EP300, PKHD1 PRDM1,如图9的C)。而在不同肿瘤组织位点中发现的突变基因个数和种类也不相同(如图9)。
根据既往的研究报道和我们的研究结果,我们拟采用VAF作为评估ctDNA与配对肿瘤组织遗传特点一致性的变量。通过研究发现,ctDNA的VAF与配对肿瘤组织的VAF具有高度一致性。其中队列P-1的Pearson 相关系数r=0.78(如图10的A);队列P-2的Pearson 相关系数r=0.92(如图10的B)。
同时,我们也对食管癌的肿瘤异质性进行了分析。E104的三个不同位点的肿瘤组织共发现323个变异基因,其中只有27个是三个位点所共有的。其中,KMT2D被报道与食管癌化疗敏感性相关;E111的三个不同位点共发现423个变异基因,其中有39个为共有。其中,PIK3CA已被报道于食管癌化疗敏感性相关;E121发现的357个变异基因中有26个为三个组织位点所共有的。
提供下列实施例仅是举例说明而不是限制。
实施例1 食管鳞状上皮细胞癌的ctDNA文库构建
本实施例的以下试剂来自SureSelect Target Enrichment System(AgilentTechnologies):
- DNA片段的末端修复
(1)把所有试剂(指反应体系所需要的所有试剂,包含(2)里面的试剂。)放在冰上融化。一旦试剂解冻,通过快速搅拌将它们充分混合。
(2)在冰上制备用于末端修复反应的反应混合物,将以下试剂分配到PCR试管或PCR平板的孔中:
10μl cfDNA
2.5μl 10×末端修复缓冲液
2.0μl末端修复酶混合剂
10.5μl无核糖核酸酶的水
反应总体积为25μl
(3)彻底混匀。
(4)将上述反应混合物放入热循环器,热循环器的条件设定为先在25°C下孵育30分钟,然后在75°C下孵育20分钟(此步骤用于使酶失活)。
- 加A-尾
(5)将以下成分充分混匀,并加入到上述步骤(4)的DNA末端修复反应的PCR试管中:
3μl 10×加A尾缓冲液
3μl Klenow片段(3-5 exo-)。
反应体积为31μl
(6)彻底混匀。
(7)将上述反应体系放入热循环仪。设定条件为先在37°C下孵育30分钟,然后在75°C下孵育10分钟(此步骤用于使酶失活)。
连接接头
(8)首先用无核糖核酸酶水按1:10比例稀释接头液,然后将以下组分混匀后加入到包含经过末端修复和加A尾的DNA的PCR试管中,用于接头连接反应:
45μl 2×连接缓冲液
2.5μl接头(1:10稀释)
4μl T4 DNA连接酶(1:10稀释)
7.5μl无核糖核酸酶水
反应总体积为90μl
(注意:每个连接反应只能使用一个接头。如果在同一测序过程中要对多个样本进行测序,则应使用包含6至8个唯一序列[即索引]的不同条形码接头来区分不同的样本。使用条形码接头时,每次只打开一个接头试剂管,并在加入不同的条形码接头时更换手套,以避免交叉污染。)
(9)设定热循环器条件为25°C下孵育15分钟。
(注意:在孵育过程中不要使用加热的盖子,以避免破坏连接酶的活性。)
- 去除反应中的接头二聚体
(10)在每个连接反应中加入72μl Agencourt AMPure XP磁珠,确保磁珠和连接反应混合物充分混合。
(11)将混合物在室温下孵育5至15分钟,以便DNA与磁珠结合。
(12)将上述反应后的EP管放在磁力架上,等待液体清澈,然后小心地移走并丢弃上清液。
(13)将EP管放在磁架上,加入200μl的80%乙醇清洗珠子。
(14)在室温下孵育30至60秒。
(15)小心移除乙醇。
(16)重复步骤(13)~(15),在保证不接触磁珠的前提下尽可能多的移除乙醇。
(17)在室温下将珠子晾干(注意:为避免磁珠过度干燥,干燥时间不应超过15分钟)。
(18)将EP管从磁力架上移除。
(19)用25μl EB缓冲液重新混悬磁珠。
(20)将EP管在室温下孵育2分钟,使DNA从磁珠上洗脱下来。
(21)将EP管放回磁力架上以捕获珠子,等待至液体清澈,小心地将22μl上清液转移到新的EP管中(此步骤应使用低粘附性EP管)。
- 测序文库的PCR扩增
(22)将以下成分混匀,用于PCR扩增反应:
25μl 2× 高保真PCR 混合液
1.5μl引物混合液(每个引物10μM,所述引物为SureSelect Target EnrichmentSystem(Agilent Technologies)试剂盒中的通用引物,如下表4所示)
20μl文库DNA(步骤[21])
3.5μl无核糖核酸酶水
反应总体积50μl
(23)设定PCR反应条件如下(表3):
表3
Figure DEST_PATH_IMAGE003
表4本实验扩增中使用的通用引物
Figure 274938DEST_PATH_IMAGE004
- 纯化PCR产物
(24)在每个反应中加入50μl Agencourt AMPure XP磁珠,上下移液混匀,使磁珠与PCR反应物充分混匀。
(25)重复上述步骤(12)~(19)。
(26)用25μl EB缓冲液洗脱扩增和纯化后的文库。将EP管放回磁力架上以捕获珠子,等待至液体清澈,小心将22μl上清液转移到新的低粘附性EP管中。
(27)使用Agilent BioAnalyzer 2100评估纯化后的文库质量。检查文库片段的大小分布是否正确,以及是否有接头或接头二聚体残留。
(28)检测合格的DNA文库在−20°C冰箱中保存(不超过1个月)或−80°C冰箱长期保存,用于后续的测序。
实施例2 对所构建的ctDNA文库检验
本发明采用的研究样本来自临床试验中的5位食管癌患者,所有患者样本采集之前均未进行任何治疗。每一位患者的血液标本和组织标本均在同一天采集完成。为了对比该实验技术在不同测序方法中的效果,实验分为两个队列人群P-1和P-2。其中,队列P-1包括2个患者(E102和E110)。2例患者的cfDNA和组织DNA采用全外显子(whole exomesequencing, WES 300X)。队列P-2的3例患者(E104、E111和E121)采用包含560个癌基因的All-in-one Cancer Panel进行靶向测序(Targeted capture sequencing, TCS 1000X)。队列P-1和队列P-2患者的临床病理信息见下表(即,上表2)。
Figure DEST_PATH_IMAGE005
对所提取的cfDNA和组织DNA进行质检。质检结果如图2A和图2B显示,cfDNA的峰值位于160bp左右,符合预期长度。4mL血浆中cfDNA的总量为:5-80ng。图2C显示组织DNA无明显降解,无RNA及蛋白质污染。
队列P-1的E102和E110的cfDNA、肿瘤组织DNA和白细胞DNA采用全外显子(WES,300X)测序。生物信息学分析结果表明:肿瘤组织的突变个数范围从290到483(包括沉默和非同义突变),中位数342。E102和E110的cfDNA的突变个数分别为915个和863个。肿瘤组织的肿瘤突变负荷(tumor mutation burden, TMB)的范围从4.92到8.19个突变/M,而ctDNA的TMB范围从14.63到15.51个突变/M,明显高于肿瘤组织的TMB。在所有已发现的突变中,最常见的突变类型为C>T转变(如图3的A和B);最常见的变异类型为错义突变(如图3的C)。
在队列P-1的所有肿瘤样本中发现的694个突变基因中,有13个突变基因被既往研究证实与食管癌的发生发展相关,包括:TP53, MUC16, CTNND2, DNAH9, EP300, NOTCH3, SYNE1, RP1, TTN, ATM, KMT2D, NOTCH1USH2A。其中,MUC16,CTNND2 NOTCH3 也被同时发现存在于配对的ctDNA中(如图4所示)。
其中,与5个重要癌基因通路(TP53、Hippo、WNT、RTK-RAS和NOTCH)有关的20个癌基因中,有12个基因可在ctDNA中找到,发现率60%(12/20)。这些信号通路中某些基因的表达直接或间接参与肿瘤对化疗的应答反应。说明ctDNA可以用于食管癌化疗敏感性相基因的发现(如图5所示)。
在队列P-1的食管癌的肿瘤组织中发现了MUC基因家族的MUC4MUC17,而在配对的ctDNA中同样发现了MUC家族中的MUC16
根据队列P-1的研究结果,发现在食管癌的cfDNA中的ctDNA含量较少。为了进一步识别食管癌的cfDNA中的低频率的肿瘤相关突变,采用含有560个癌基因的All-in-oneCancer Panel对队列P-2的E104,E111和E121的cfDNA、肿瘤组织DNA和白细胞DNA 进行TCS,测序深度为1000X。分析结果表明,肿瘤组织的突变基因个数从107到194个,中位数为142。在三个食管癌患者的cfDNA中发现的突变基因个数分别为494、796和262个,明显高于肿瘤组织所发现的肿瘤相关突变基因。突变的类型仍然是C>T的转变(如图6的A和B);最主要的变异类型为错义突变(如图6的C),与队列P-1的研究结果一致。
为了识别和确认在cfDNA中的肿瘤突变基因(即ctDNA),我们在突变发现运算法则中设置VAFmin为0.1%。E104、E111和E121的第一和第三分位数分别为0.49-0.88%、0.44-0.77%和0.41-0.875%。共有14个突变的VAF大于5%。三例cfDNA的VAF分布情况如图7所示。
在队列P-2的所有测序样本中发现333个肿瘤相关突变基因。其中,32个突变基因被既往研究证实与食管癌的发生发展及治疗反应相关。 其中,在ctDNA和配对肿瘤组织中都发现的BRCA2 [Multi-region sequencing unveils novel actionable targets andspatial heterogeneity in esophageal squamous cell carcinoma,NatCommunactions. 2019 Apr 11;10(1):1670], NOTCH2, KMT2D和 KMT2A [Genomiccharacteristics in neoadjuvant chemoradiotherapy for locally advancedesophageal squamous cell carcinoma,J Gastrointest Oncol. 2020 Dec;11(6):1105-1112]已被报道与食管癌化疗敏感性密切相关。32个突变基因的发生分布情况如图8所示。
通过分析比较发现,在ctDNA中发现的突变基因个数明显高于配对的肿瘤组织。E104、E111和E121的ctDNA中发现的食管癌相关突变基因也能在配对肿瘤组织中发现的概率分别为62.5%(10/16,包括:CSMD3, KMT2D, LRP1B, SYNE1, ATR, EP300, PRDM1, UBR5, FSTL5和LIFR,如图9的A),76.2%(16/21,包括:KMT2D, LRP1B, SYNE1, BRCA2, ATR, EP300, ASXL1, MTOR, PKHD1, PTCH1, UBR5, BRIP1, KMT2A, NUP214, NOTCH2CREBBP,如图9的B)和35.7%(5/14,包括:KMT2D, LRP1B, EP300, PKHD1 PRDM1,如图9的C)。而在不同肿瘤组织位点中发现的突变基因个数和种类也不相同(如图9)。
根据既往的研究报道和我们的研究结果,我们拟采用VAF作为评估ctDNA与配对肿瘤组织遗传特点一致性的变量。通过研究发现,ctDNA的VAF与配对肿瘤组织的VAF具有高度一致性。其中队列P-1的Pearson 相关系数r=0.78(如图10的A);队列P-2的Pearson 相关系数r=0.92(如图10的B)。
同时,我们也对食管癌的肿瘤异质性进行了分析。E104的三个不同位点的肿瘤组织共发现323个变异基因,其中只有27个是三个位点所共有的。其中,KMT2D被报道与食管癌化疗敏感性相关;E111的三个不同位点共发现423个变异基因,其中有39个为共有。其中,PIK3CA已被报道于食管癌化疗敏感性相关;E121发现的357个变异基因中有26个为三个组织位点所共有的。

Claims (10)

1.一种从起始DNA含量为1-100 ng的样品进行cfDNA建库的方法,所述方法包括:
DNA片段的末端修复;
加A-尾;
连接接头,所述接头浓度为相对于所述cfDNA量所需接头浓度的5%-20%;
去除反应中的接头二聚体;
测序文库的PCR扩增,经过去除接头二聚体的反应体系进行PCR扩增进行,所述PCR反应条件包括:初始变性 ,中间的变性-退火-延长循环,和最终延长,其中中间的变性-退火-延长循环为10-15次。
2.如权利要求1所述的方法,其中,所述接头浓度为试剂盒说明书推荐使用浓度的8%-15%,或10%。
3.如权利要求1所述的方法,其中,所述PCR扩增中的中间的变性-退火-延长循环为12-15个循环。
4.如权利要求1所述的方法,其中,所述cfDNA为ctDNA。
5.一种从起始DNA含量为1-100 ng的样品进行cfDNA建库的系统,所述系统包括以下模块:
DNA片段的末端修复模块,
加A-尾模块,
连接接头模块,所述模块使得所述接头浓度为相对于所述cfDNA量所需接头浓度的5%-20%;
去除反应中的接头二聚体模块,
测序文库的PCR扩增模块,所述模块使得PCR扩增中的中间的变性-退火-延长循环为10-15次。
6.一种从起始DNA含量为1-100 ng的样品进行cfDNA建库的计算机执行方法,所述计算机执行方法包括以下步骤:
执行DNA片段的末端修复;
执行加A-尾;
执行连接接头,所述模块使得所述接头浓度为相对于所述cfDNA量所需接头浓度的5%-20%;
执行去除反应中的接头二聚体;
执行测序文库的PCR扩增,使得PCR扩增中的中间的变性-退火-延长循环为10-15次。
7.如权利要求5所述的系统或权利要求6所述的计算机执行方法,其中,
所述接头浓度为试剂盒说明书推荐使用浓度的8%-15%,或10%;和/或
如权利要求1所述的方法,其中,所述PCR扩增中的中间的变性-退火-延长循环为12-15个循环。
8.一种从起始DNA含量为1-100 ng的样品构建的cfDNA文库在制造用于对ctDNA含量为1-100 ng的肿瘤进行诊断、预后和治疗监测的试剂盒中的应用,所述试剂盒包括进行权利要求1所述的从起始DNA含量为1-100 ng的样品进行cfDNA建库的方法所需的试剂,其中,所构建的ctDNA文库用于对肿瘤诊断、预后和治疗监测。
9.一种计算机存储介质,该存储介质存储有对肿瘤进行诊断、预后和治疗监测的计算机执行程序,所述计算机执行程序包括以下步骤:
执行DNA片段的末端修复;
执行加A-尾;
执行连接接头,所述模块使得所述接头浓度为相对于所述cfDNA量所需接头浓度的5%-20%;
执行去除反应中的接头二聚体;
执行测序文库的PCR扩增,使得PCR扩增中的中间的变性-退火-延长循环为10-15次。
10.如权利要求8所述的应用或权利要求9所述的计算机存储介质,所述肿瘤为食管鳞状上皮细胞癌。
CN202211526286.8A 2022-12-01 2022-12-01 从微量DNA建立cfDNA库的方法、系统和应用 Active CN115627541B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211526286.8A CN115627541B (zh) 2022-12-01 2022-12-01 从微量DNA建立cfDNA库的方法、系统和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211526286.8A CN115627541B (zh) 2022-12-01 2022-12-01 从微量DNA建立cfDNA库的方法、系统和应用

Publications (2)

Publication Number Publication Date
CN115627541A true CN115627541A (zh) 2023-01-20
CN115627541B CN115627541B (zh) 2023-03-28

Family

ID=84909690

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211526286.8A Active CN115627541B (zh) 2022-12-01 2022-12-01 从微量DNA建立cfDNA库的方法、系统和应用

Country Status (1)

Country Link
CN (1) CN115627541B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107794256A (zh) * 2016-09-01 2018-03-13 埃提斯生物技术(上海)有限公司 cfDNA建库方法及试剂盒
CN108064314A (zh) * 2015-01-18 2018-05-22 加利福尼亚大学董事会 判定癌症状态之方法及系统
US20180363066A1 (en) * 2016-02-29 2018-12-20 Foundation Medicine, Inc. Methods and systems for evaluating tumor mutational burden
CN111139533A (zh) * 2019-09-27 2020-05-12 上海英基生物科技有限公司 稳定性增加的测序文库接头
CN111575347A (zh) * 2020-05-19 2020-08-25 清华大学 构建用于同时获得血浆中游离dna甲基化和片段化模式信息的文库的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108064314A (zh) * 2015-01-18 2018-05-22 加利福尼亚大学董事会 判定癌症状态之方法及系统
US20180363066A1 (en) * 2016-02-29 2018-12-20 Foundation Medicine, Inc. Methods and systems for evaluating tumor mutational burden
CN107794256A (zh) * 2016-09-01 2018-03-13 埃提斯生物技术(上海)有限公司 cfDNA建库方法及试剂盒
CN111139533A (zh) * 2019-09-27 2020-05-12 上海英基生物科技有限公司 稳定性增加的测序文库接头
CN111575347A (zh) * 2020-05-19 2020-08-25 清华大学 构建用于同时获得血浆中游离dna甲基化和片段化模式信息的文库的方法

Also Published As

Publication number Publication date
CN115627541B (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
JP6673562B2 (ja) 結腸直腸がんのエピジェネティックマーカー及び該マーカーを使用する診断法
US10590465B2 (en) Enrichment of nucleic acids by complementary capture
CN111575380B (zh) 多基因检测用的探针库、杂交试剂盒和多基因检测的方法
JP2011515091A (ja) 異常型ミトコンドリアdna、関連融合転写物およびそのハイブリダイゼーションプローブ
WO2023142630A1 (zh) 一种用于膀胱尿路上皮癌诊断的检测方法和试剂盒
CN111088365B (zh) 一种用于检测甲状腺癌ret基因突变及融合的引物及试剂盒
WO2010118559A1 (zh) 一种癌症筛检的方法
CN106498082B (zh) 卵巢癌易感基因变异文库构建方法
CN106757379A (zh) 肺癌多基因变异文库构建方法
CN114729399A (zh) 检测卵巢癌
CN110093423A (zh) 基因标志物在肺腺癌诊治中的用途
CN106480078A (zh) 一组胃癌腹膜转移标志物及其用途
CN106282361B (zh) 用于捕获血液病相关基因的基因捕获试剂盒
US11535897B2 (en) Composite epigenetic biomarkers for accurate screening, diagnosis and prognosis of colorectal cancer
CN115627541B (zh) 从微量DNA建立cfDNA库的方法、系统和应用
CN110791567B (zh) 一种单个位点dna甲基化检测试剂盒
US11542559B2 (en) Methylation-based biomarkers in breast cancer screening, diagnosis, or prognosis
CN109750098B (zh) Atp7b基因大片段缺失检测试剂盒及检测方法
JP2023515482A (ja) 核酸のメチル化の差を利用したマーカーの選別方法、メチルまたは脱メチルマーカー及びそのマーカーを利用した診断方法
EP2723896B1 (en) Mutations in pancreatic neoplasms
CN115851959B (zh) 一种用于食管鳞状细胞癌及癌前病变的诊断或辅助诊断的试剂及检测试剂盒
WO2023145754A1 (ja) 膀胱癌の存在を検出するためのプライマー及びプローブ
JP4698008B2 (ja) 癌疾患の予後判定法
WO2022105774A1 (zh) 一种用于检测肝癌的试剂组合,试剂盒及其用途
CN117363729A (zh) 用于体外检测肝癌的试剂盒及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant