CN110272985B - 基于外周血血浆游离dna高通量测序技术的肿瘤筛查试剂盒及其系统与方法 - Google Patents

基于外周血血浆游离dna高通量测序技术的肿瘤筛查试剂盒及其系统与方法 Download PDF

Info

Publication number
CN110272985B
CN110272985B CN201910563406.3A CN201910563406A CN110272985B CN 110272985 B CN110272985 B CN 110272985B CN 201910563406 A CN201910563406 A CN 201910563406A CN 110272985 B CN110272985 B CN 110272985B
Authority
CN
China
Prior art keywords
free dna
peripheral blood
sequencing
nucleosome
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910563406.3A
Other languages
English (en)
Other versions
CN110272985A (zh
Inventor
胥顺
李坤
杨学习
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Xiongji Bioinformatics Technology Co ltd
Original Assignee
Guangzhou Xiongji Bioinformatics Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Xiongji Bioinformatics Technology Co ltd filed Critical Guangzhou Xiongji Bioinformatics Technology Co ltd
Priority to CN201910563406.3A priority Critical patent/CN110272985B/zh
Publication of CN110272985A publication Critical patent/CN110272985A/zh
Application granted granted Critical
Publication of CN110272985B publication Critical patent/CN110272985B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种基于外周血血浆游离DNA高通量测序技术的肿瘤筛查试剂盒及其系统与方法;旨在提供一种采用外周血,实现高灵敏度、非突变位点和特定基因依赖、单一或多种肿瘤的早期筛查的试剂盒,该试剂盒包括:血浆游离DNA提取试剂、文库构建试剂、测序试剂、测序芯片,生物信息分析方法;通过对健康人与肿瘤患者外周血血浆游离DNA进行高通量测序,再经过测序数据的生物信息学分析获得游离DNA在全基因组范围内的核小体足迹定位信息及差异,进而根据核小体足迹差异实现肿瘤患者和健康对照人群的聚类分析,区分肿瘤患者和健康对照人群;上述筛查目的是获得中间结果的信息;属于生物技术领域。

Description

基于外周血血浆游离DNA高通量测序技术的肿瘤筛查试剂盒 及其系统与方法
技术领域
本发明公开了一种肿瘤筛查试剂盒,具体地说,是一种基于外周血血浆游离DNA高通量测序技术的肿瘤筛查试剂盒,本发明还公开了基于外周血血浆游离DNA高通量测序技术的肿瘤筛查试剂盒的方法。
背景技术
世界卫生组织癌症研究数据显示:2018年全球估计有1800万新增癌症病例以及960万癌症死亡病例。同时世界卫生组织提出只要早期发现,90%的癌症完全可以治愈。但我国各地医院的癌症首诊病人却仅占10%以下,90%以上都失去了获得良好疗效的宝贵时机。早期癌症一般没有明显症状,而当身体感觉到明显不适从而进行检测时一般都到了癌症的中晚期,因而癌症的早期筛查非常重要。
目前肿瘤检查的主要方法有影像学、组织活检、血清学、液体活检等方法。影像学筛查法主要基于CT、B超、钼靶、胃肠镜等影像学仪器进行检测,其检出时间的下限为已经产生一定大小的病变肿瘤组织块,其检测结果准确性和特异性均较好,可以作为诊断的金标准,但胃镜、肠镜令人疼痛难忍,给患者身心造成负担,不适合大规模的筛查;组织活检主要针对实体瘤,常规检查的样本来源于肿瘤组织,但由于肿瘤的异质性,组织活检本身存在许多局限性,比如取样创伤性大、不适宜多次连续取样、仅反应肿瘤过程的静态信息,不能动态检测等;血清学筛查法主要是基于AFP、CEA等多种血清标志物,但血清标志物假阳性高,检测效率低;基于外周血的液体活检因其方便、快捷、无创、特异、全面和便于实时监测等有点,成为肿瘤领域的研究热点。
目前的基础和临床研究中,液体活检的标志物主要包括循环肿瘤DNA(ctDNA)、循环肿瘤细胞(CTC)、循环RNA及外泌体等。美国的约翰斯·霍普金斯大学研发了一种CancerSEEK的液体活检技术采用16种肿瘤相关基因和8个肿瘤特异性蛋白,用计算机算法对结果进行分析。美国加州大学戴维斯分校综合癌症中心和基因泰克公司联合研究证实血浆中肿瘤突变负荷(bTMB)能够作为Tecentriq免疫治疗的潜在非侵入性生物标志。英国剑桥大学科学家Nitzan Rosenfeld及其团队发现血液中循环肿瘤DNA和非肿瘤DNA片段的长度分布特征,不同细胞释放的游离DNA的长度是不同的,这种片段长度的差异可以作为辨别肿瘤细胞和非肿瘤细胞的重要手段。现有研究表明液体活检具有肿瘤早期筛查的潜力,但目前的基础及临床研究方法都具有基因或位点依赖性,多能用于单一癌症的筛查。
外周血血浆游离DNA又称cfDNA(cell free DNA),是指外周血中游离于细胞外的DNA,主要来源于正常细胞、异常细胞(包括肿瘤细胞)或者外源的微生物(如病毒DNA),具体包括自身正常细胞代谢的凋亡小体、肿瘤细胞碎片、外泌体等。细胞死亡或者快速分裂时,会释放游离的DNA进入外周血,主要分布于血浆和血清中。在正常人中,游离DNA主要来源于造血细胞。由于细胞坏死或者细胞更新速度变快,感染、缺血、肿瘤、自身免疫性疾病、肥胖和怀孕时,体内游离DNA含量会增加。血浆游离DNA是细胞死亡后,染色质经酶切片段化后形成DNA片段,其半衰期很短,半小时就会被清除。游离DNA包括核小体解离而产生的裸露DNA和核小体固定的蛋白DNA复合体两种情形。其中被核小体固定的DNA序列因核小体保护而降解速度较慢,而裸露的DNA序列很快被降解,所以游离DNA长度一般为核小体固定长度的整数倍。正常人体外周血血浆DNA与肿瘤患者外周血血浆游离DNA,以及不同类型的肿瘤患者外周血血浆游离DNA中的核小体足迹是存在差异的。可以通过高通量测序技术对血浆cfDNA进行全基因组测序,通过生物信息学分析获得核小体足迹定位信息,再通过核小体足迹定位信息在正常对照人群和肿瘤患者中的差异信息进行聚类分析,实现对于单一类型肿瘤或多种类型肿瘤的无创筛查,该方法避免了现有液体活检技术的基因或位点依赖性,并可同时用于多种肿瘤的筛查。
发明内容
针对上述不足,本发明的第一个目的是提供一种采用外周血,实现高灵敏度、非突变位点和特定基因依赖、单一或多种肿瘤的早期筛查的试剂盒。
本发明的第二个目的是提供上述试剂盒的筛查系统。
本发明的第三个目的是提供上述试剂盒的筛查方法。
为此,本发明提供的第一个技术方案是这样的:
一种基于外周血血浆游离DNA高通量测序技术的肿瘤早期筛查试剂盒,包括血浆游离DNA提取试剂、文库构建试剂、测序试剂、测序芯片,生物信息分析方法说明。
进一步的,上述的基于外周血血浆游离DNA高通量测序技术的肿瘤筛查试剂盒,所述的文库构建试剂包括末端修复、接头连接、PCR扩增试剂。
进一步的,上述的基于外周血血浆游离DNA高通量测序技术的肿瘤筛查试剂盒,该试剂盒用于单一类型肿瘤或者多种类型肿瘤的无创筛查。
进一步的,上述的基于外周血血浆游离DNA高通量测序技术的肿瘤筛查试剂盒,所述的肿瘤包括乳腺癌、肺癌、肠癌。
本发明提供的第二个技术方案是:
一种基于外周血血浆游离DNA高通量测序技术的肿瘤早筛系统,其特征在于:该系统包括:
(1)核小体信息模块:所述核小体信息模块用于注释UCSC的RefSeq数据库中所有人类蛋白编码基因信息,获取每个基因的转录起始位点(TSSs)和转录终止位点(TTSs)上下游1Kb区域的基因组位置,构建核小体定位标准数据库;
(2)测序模块:所述测序模块用于检查者外周血血浆游离DNA进行高通量测序,获取各检查者序列在基因组上的位置信息;
(3)质控模块:所述质控模块用于根据核小体足迹定位的比对结果,去除由文库构建和高通量测序引起的PCR重复序列,去除低质量DNA片段序列、去除未比对到核小体足迹定位区域且在基因组中唯一比对的DNA片段序列,得到RPKM方法标准化后的值;
(4)分析模块:所述分析模块用于筛选核小体区域存在差异的基因,利用秩和检验非参数方法,并通过P值校正,得到两组间的变化倍数|log2fold change|>1且q-value值<0.1的差异基因转录起始位点(TSSs)和转录终止位点(TTSs)区域;
(5)聚类模块:所述聚类模块用于区分健康人群和肿瘤患者,根据Cluster软件对基因转录起始位点(TSSs)和转录终止位点(TTSs)区域覆盖度数据进行标准化后的等级聚类及R语言pheatmap包对数据的可视化结果,根据全基因组范围内TSSs区核小体的印记差异,将样品聚类为健康人、乳腺癌、非小细胞肺癌、结直肠癌。
本发明提供的第三个技术方案是这样的:
一种基于外周血血浆游离DNA高通量测序技术的肿瘤筛查方法,通过对健康人体外周血血浆DNA与肿瘤病人外周血血浆游离DNA进行高通量测序,再经过测序数据的生物信息学分析获得游离DNA在全基因组范围内的核小体足迹定位信息及差异,进而根据核小体足迹差异实现肿瘤患者和健康对照人群的聚类分析,区分肿瘤患者和健康对照人群;上述筛查目的是获得中间结果的信息。
进一步的,上述的基于外周血血浆游离DNA高通量测序技术的肿瘤筛查方法,所述的核小体足迹差异差异是外周血血浆游离DNA全基因组范围内每个基因转录起始位点TSSs区域的核小体分布与该基因其余区域的差异。
进一步的,上述的基于外周血血浆游离DNA高通量测序技术的肿瘤筛查方法,具体包括以下步骤:
(1)将健康人及肿瘤患者的外周血血浆进行血浆分离和游离DNA提取,通过建库试剂对血浆游离DNA进行末端修饰、接头连接、PCR扩增形成测序文库,然后使用测序试剂及芯片对文库进行高通量测序,每个样品至少获得6Million reads的数据量,又称数据获取。
(2)根据UCSC的RefSeq数据库中所有人类蛋白编码基因的注释信息,获得每个基因的转录起始位点TSSs上下游1Kb区域的基因组位置,又称核小体足迹定位。
(3)利用Bowtie软件将各样品测序所得的测序数据与步骤(2)中转录起始位点TSSs上下游1Kb区域的基因组位置进行比对分析,去除PCR重复序列,计算统计比对到上述区域的reads数,并对统计结果使用RPKM方法进行标准化,又称核小体足迹定位分析。
(4)利用Kruskal-Wallis非参数单因子方差分析筛选出正常人与不同类型的肿瘤患者核小体印记存在差异的基因,使用秩和检验方法对同一个基因在正常人和不同肿瘤患者核小体印记分析结果进行两两比较,利用Holm-Bonferroni法对p值进行矫正,筛选出q-value值小于0.1对基因启动子区域,又称核小体足迹差异分析。
(5)利用Cluster软件,对基因启动子区核小体印记差异的数据进行标准化处理。根据样本核小体印记的相关性,采用等级聚类法对标准化后的数据进行聚类分析,并用R语言pheatmap包对数据进行可视化展示。根据全基因组范围内TSSs区核小体的印记差异,将样品聚类为健康人、乳腺癌、非小细胞肺癌、结直肠癌。
其中步骤(1)根据常规的血浆游离DNA基因组高通量测序方法进行,最终获得>6Mreads的数据量;检测平台为ion torrent测序平台或其他高通量测序平台,步骤(2)-(5)通过自主建立的生物信息分析方法和系统可对多个样本进行批量分析。
与现有技术相比,本发明提供的技术方案具有如下技术优点:
1、本发明提供的技术方案有效解决的已有肿瘤筛查方法及试剂盒的局限性,本发明通过对血浆游离DNA高通量测序、生物信息学分析及深度机器学习,实现肿瘤的无创筛查。即通过对健康人体外周血血浆DNA与肿瘤病人外周血血浆游离DNA进行高通量测序,再经过测序数据的生物信息学分析获得游离DNA在全基因组范围内的核小体足迹定位信息及差异,进而根据核小体足迹差异实现肿瘤患者和健康对照人群的聚类分析,区分肿瘤患者和健康对照人群。
2、本发明提供的技术方案有效克服了肿瘤患者影像学发现多为中晚期患者;现有血清学筛查产品特异性和准确性不高的缺点;现有循环肿瘤DNA和粪便脱落细胞检测中的特定基因和位点依赖,大多只能筛查单一癌症类型的缺点。而本发明提供的技术方法的原材料为3-5ml外周血,实现高灵敏度、非突变位点和特定基因依赖、单一或多种肿瘤的无创早期筛查。
总而言之,本发明提供的技术方案可通过对血浆游离DNA高通量测序数据的生物信息学分析,获得血浆游离DNA中全基因组范围内核小体足迹信息,进而根据核小体足迹差异信息对健康人群与肿瘤患者(包括不同类型肿瘤患者)之间进行精准区分;其检测材料为外周血血浆,属于无创检测范畴,可用不同类型的肿瘤筛查。
附图说明
图1是基于外周血血浆游离DNA高通量测序技术的肿瘤筛查方法流程图
图2是肺癌与健康人外周血血浆游离DNA聚类图
图3是肠癌与健康人外周血血浆游离DNA聚类图
图4是乳腺癌与健康人外周血血浆游离DNA聚类图
图5是乳腺癌、肺癌、肠癌患者与健康人外周血血浆游离DNA聚类图。
具体实施方式
下面将以具体实施例对本发明有益效果作进一步说明,但本发明并不局限于这些实施例。
样本说明:样本包括乳腺癌样本35例、肠癌样本9例、肺癌样本11例、健康人样本38例。所收集的样本均经过临床病理学确认(见表1);
外周血血浆,较佳地为用EDTA抗凝管采集新鲜的外周全血标本经离心后获得的血浆标本,亦可为3个月内-70℃以下保存的血浆标本
实施例1本发明提供的基于外周血血浆游离DNA高通量测序技术的肿瘤筛查试剂盒,包括血浆游离DNA提取试剂(来源于MagaBio公司)、文库构建试剂(使用Ion PlusFragmentLibrary Kit以及Ion AmpliseqTMPrimer Pool试剂,来源于Life Technologies)、测序试剂(Ion PITM Hi-QTM OT2 200Kit,Ion PITM Hi-QTM Sequencing Kit来源于LifeTechnologies)、测序芯片(来源于Life Technologies),生物信息分析方法说明。
实施例2一种基于外周血血浆游离DNA高通量测序技术的肿瘤早筛系统,该系统包括:
(1)核小体信息模块:所述核小体信息模块用于注释UCSC的RefSeq数据库中所有人类蛋白编码基因信息,获取每个基因的转录起始位点(TSSs)和转录终止位点(TTSs)上下游1Kb区域的基因组位置,构建核小体定位标准数据库;
(2)测序模块:所述测序模块用于检查者外周血血浆游离DNA进行高通量测序,获取各检查者序列在基因组上的位置信息;
(3)质控模块:所述质控模块用于根据核小体足迹定位的比对结果,去除由文库构建和高通量测序引起的PCR重复序列,去除低质量DNA片段序列、去除未比对到核小体足迹定位区域且在基因组中唯一比对的DNA片段序列,得到RPKM方法标准化后的值;
(4)分析模块:所述分析模块用于筛选核小体区域存在差异的基因,利用秩和检验非参数方法,并通过P值校正,得到两组间的变化倍数|log2fold change|>1且q-value值<0.1的差异基因转录起始位点(TSSs)和转录终止位点(TTSs)区域;
(5)聚类模块:所述聚类模块用于区分健康人群和肿瘤患者,根据Cluster软件对基因转录起始位点(TSSs)和转录终止位点(TTSs)区域覆盖度数据进行标准化后的等级聚类及R语言pheatmap包对数据的可视化结果,根据全基因组范围内TSSs区核小体的印记差异,将样品聚类为健康人、乳腺癌、非小细胞肺癌、结直肠癌。
实验例1:肺癌患者组与健康人群对照组外周血血浆游离DNA高通量测序及结果分析
基于38例健康人、11例肺癌患者的外周血血浆,采用本发明试剂盒进行高通量测序,测序数据通过对TSSs区域的覆盖度差异分析,发现肺癌与健康人群对照组有差异的TSSs区域557个(见表2)。其中302个差异TSSs区域的覆盖度上调,255个差异TSSs区域的覆盖度下调。通过利用差异表达的基因进行无监督的等级聚类分析,结果发现基于557个差异基因能够将样本聚成肺癌和健康人2种类别,且分支间覆盖度差异基因的模式显著差异(见图2),提示该试剂盒可用于肺癌患者的筛查。具体步骤如下:
步骤1:血浆分离。使用两步离心法进行血浆分离(1)4℃,1600g离心10min将血浆与白细胞、血小板、红细胞进行分离,将血浆转移到2mL离心管中;(2)4℃,16000g离心10min去除残余细胞,将上清转移至2mL离心管中,即得到外周血血浆。
步骤2:血浆游离DNA提取。使用本发明试剂盒中的裂解液MLE和蛋白酶K处理样本血浆使DNA充分暴露在溶液中,加入磁珠使其与DNA特异性结合,洗涤后使用洗脱液Low TE将DNA从磁珠上洗脱并使用Qubit 3.0(来源于Life Technologies)进行浓度测定,所得DNA保存于-20℃。
步骤3:文库构建及定量。使用本发明试剂盒中的文库构建试剂对DNA进行末端修复,磁珠纯化后使用DNA连接酶在DNA两端添加上测序接头,连接产物进行磁珠纯化后进行扩增,磁珠纯化后即完成文库构建,使用Qubit 3.0进行浓度测定。根据浓度将每个文库稀释到100pM,使用ABI7500(Thermofisher)进行QPCR定量后,每10个文库等量进行混合,使其终浓度为100pM。
步骤4:高通量测序。使用本发明试剂盒中的测序试剂及测序芯片对混合文库进行高通量测序反应(flow数为300,每个样本数据量大于6M)。
步骤5:生物信息学分析
(1)核小体足迹分析。根据UCSC的RefSeq数据库中所有人类蛋白编码基因的注释信息,获取每个基因的转录起始位点TSSs上下游1Kb区域的基因组位置。利用Bowtie软件对原始测序文件进行比对并去除PCR重复序列,计算统计比对到上述区域的reads数,对统计结果使用RPKM方法进行标准化。
(2)核小体足迹差异分析。核小体缺失区域即在TSS位点较邻近区域明显降低的区域,为高表达基因,反之则为低表达基因。通过Kruskal-Wallis非参数单因子方差分析肺癌患者组和正常人对照组TSSs区域的覆盖度差异,发现肺癌与健康人群对照组有差异的TSSs区域557个。
(3)聚类分析。利用Cluster软件对差异表达的基因启动子覆盖度数据进行标准化,通过利用差异表达的基因进行无监督的等级聚类分析,结果发现基于557个差异基因能够将样本聚成肺癌和健康人2种类别,且分支间覆盖度差异基因的模式显著差异。
实验例2:肠癌患者组与健康人群对照组外周血血浆游离DNA高通量测序及结果分析
基于38例健康人、9例肠癌患者的外周血血浆,采用本发明试剂盒进行高通量测序,测序数据通过对TSSs区域的覆盖度差异分析,发现肠癌与健康人群对照组有差异的TSSs区域48个(见表3)。其中33个差异TSSs区域的覆盖度上调,15个差异TSSs区域的覆盖度下调。通过利用差异表达的基因进行无监督的等级聚类分析,结果发现基于48个差异基因能够将样本聚成肠癌和健康人2种类别,且分支间覆盖度差异基因的模式显著差异(见图3),提示该试剂盒可用于肠癌患者的筛查。具体步骤如下:
步骤1:血浆分离。使用两步离心法进行血浆分离(1)4℃,1600g离心10min将血浆与白细胞、血小板、红细胞进行分离,将血浆转移到2mL离心管中;(2)4℃,16000g离心10min去除残余细胞,将上清转移至2mL离心管中,即得到外周血血浆。
步骤2:血浆游离DNA提取。使用本发明试剂盒中的裂解液MLE和蛋白酶K处理样本血浆使DNA充分暴露在溶液中,加入磁珠使其与DNA特异性结合,洗涤后使用洗脱液Low TE将DNA从磁珠上洗脱并使用Qubit 3.0进行浓度测定,所得DNA保存于-20℃。
步骤3:文库构建及定量。使用本发明试剂盒中的文库构建试剂对DNA进行末端修复,磁珠纯化后使用DNA连接酶在DNA两端添加上测序接头,连接产物进行磁珠纯化后进行扩增,磁珠纯化后即完成文库构建,使用Qubit 3.0进行浓度测定。根据浓度将每个文库稀释到100pM,使用ABI7500(Thermofisher)进行QPCR定量后,每10个文库等量进行混合,使其终浓度为100pM。
步骤4:高通量测序。使用本发明试剂盒中的测序试剂及测序芯片对混合文库进行高通量测序反应(flow数为300,每个样本数据量大于5M)。
步骤5:生物信息学分析
(1)核小体印迹分析。根据UCSC的RefSeq数据库中所有人类蛋白编码基因的注释信息,获取每个基因的转录起始位点TSSs上下游1Kb区域的基因组位置。利用Bowtie软件对原始测序文件进行比对并去除PCR重复序列,计算统计比对到上述区域的reads数,对统计结果使用RPKM方法进行标准化。
(2)核小体印迹差异分析。核小体缺失区域即在TSS位点较邻近区域明显降低的区域,为高表达基因,反之则为低表达基因。通过Kruskal-Wallis非参数单因子方差分析肺癌患者组和正常人对照组TSSs区域的覆盖度差异,发现肠癌与健康人群对照组有差异的TSSs区域48个。
(3)聚类分析。利用Cluster软件对差异表达的基因启动子覆盖度数据进行标准化,通过利用差异表达的基因进行无监督的等级聚类分析,结果发现基于48个差异基因能够将样本聚成肠癌和健康人2种类别,且分支间覆盖度差异基因的模式显著差异。
实验例3乳腺癌患者组与健康人群对照组外周血血浆游离DNA高通量测序及结果分析。
基于38例健康人、35例乳腺癌患者的外周血血浆,采用本发明试剂盒进行高通量测序,测序数据通过对TSSs区域的覆盖度差异分析,发现肠癌与健康人群对照组有差异的TSSs区域469个(见表4)。其中249个差异TSSs区域的覆盖度上调,220个差异TSSs区域的覆盖度下调。通过利用差异表达的基因进行无监督的等级聚类分析,结果发现基于469个差异基因能够将样本聚成乳腺癌癌和健康人2种类别,且分支间覆盖度差异基因的模式显著差异(见图4),提示该试剂盒可用于乳腺癌患者的筛查。具体步骤如下:
步骤1:血浆分离。使用两步离心法进行血浆分离(1)4℃,1600g离心10min将血浆与白细胞、血小板、红细胞进行分离,将血浆转移到2mL离心管中;(2)4℃,16000g离心10min去除残余细胞,将上清转移至2mL离心管中,即得到外周血血浆。
步骤2:血浆游离DNA提取。使用本发明试剂盒中的裂解液MLE和蛋白酶K处理样本血浆使DNA充分暴露在溶液中,加入磁珠使其与DNA特异性结合,洗涤后使用洗脱液Low TE将DNA从磁珠上洗脱并使用Qubit 3.0进行浓度测定,所得DNA保存于-20℃。
步骤3:文库构建及定量。使用本发明试剂盒中的文库构建试剂对DNA进行末端修复,磁珠纯化后使用DNA连接酶在DNA两端添加上测序接头,连接产物进行磁珠纯化后进行扩增,磁珠纯化后即完成文库构建,使用Qubit 3.0进行浓度测定。根据浓度将每个文库稀释到100pM,使用ABI7500(Thermofisher)进行QPCR定量后,每10个文库等量进行混合,使其终浓度为100pM。
步骤4:高通量测序。使用本发明试剂盒中的测序试剂及测序芯片对混合文库进行高通量测序反应(flow数为300,每个样本数据量大于5M)。
步骤5:生物信息学分析
(1)核小体印迹分析。根据UCSC的RefSeq数据库中所有人类蛋白编码基因的注释信息,获取每个基因的转录起始位点TSSs上下游1Kb区域的基因组位置。利用Bowtie软件对原始测序文件进行比对并去除PCR重复序列,计算统计比对到上述区域的reads数,对统计结果使用RPKM方法进行标准化。
(2)核小体印迹差异分析。核小体缺失区域即在TSS位点较邻近区域明显降低的区域,为高表达基因,反之则为低表达基因。通过Kruskal-Wallis非参数单因子方差分析肺癌患者组和正常人对照组TSSs区域的覆盖度差异,发现乳腺癌与健康人群对照组有差异的TSSs区域48个。
(3)聚类分析。利用Cluster软件对差异表达的基因启动子覆盖度数据进行标准化,通过利用差异表达的基因进行无监督的等级聚类分析,结果发现基于48个差异基因能够将样本聚成乳腺癌和健康人2种类别,且分支间覆盖度差异基因的模式显著差异。
实验例4乳腺癌、肺癌、肠癌患者组与健康人群对照组外周血血浆游离DNA高通量测序及结果分析
基于38例健康人、35例乳腺癌、11例肺癌和9例肠癌患者的外周血血浆,采用本发明试剂盒进行高通量测序,测序数据通过对TSSs区域的覆盖度差异分析,发现肠癌、乳腺癌、肺癌患者组与健康人群对照组有差异的TSSs区域111个(见表5)。通过利用差异表达的基因进行无监督的等级聚类分析,结果发现基于111个差异基因能够将样本聚成乳腺癌癌、肺癌、肠癌和健康人4种类别,且分支间覆盖度差异基因的模式显著差异(见图5),提示该试剂盒可用于乳腺癌、肺癌、肠癌的多种肿瘤筛查,且能识别具体的肿瘤类型。具体步骤如下:
步骤1:血浆分离。使用两步离心法进行血浆分离(1)4℃,1600g离心10min将血浆与白细胞、血小板、红细胞进行分离,将血浆转移到2mL离心管中;(2)4℃,16000g离心10min去除残余细胞,将上清转移至2mL离心管中,即得到外周血血浆。
步骤2:血浆游离DNA提取。使用本发明试剂盒中的裂解液MLE和蛋白酶K处理样本血浆使DNA充分暴露在溶液中,加入磁珠使其与DNA特异性结合,洗涤后使用洗脱液Low TE将DNA从磁珠上洗脱并使用Qubit 3.0进行浓度测定,所得DNA保存于-20℃。
步骤3:文库构建及定量。使用本发明试剂盒中的文库构建试剂对DNA进行末端修复,磁珠纯化后使用DNA连接酶在DNA两端添加上测序接头,连接产物进行磁珠纯化后进行扩增,磁珠纯化后即完成文库构建,使用Qubit 3.0进行浓度测定。根据浓度将每个文库稀释到100pM,使用ABI7500(Thermofisher)进行QPCR定量后,每10个文库等量进行混合,使其终浓度为100pM。
步骤4:高通量测序。使用本发明试剂盒中的测序试剂及测序芯片对混合文库进行高通量测序反应(flow数为300,每个样本数据量大于5M)。
步骤5:生物信息学分析
(1)核小体印迹分析。根据UCSC的RefSeq数据库中所有人类蛋白编码基因的注释信息,获取每个基因的转录起始位点TSSs上下游1Kb区域的基因组位置。利用Bowtie软件对原始测序文件进行比对并去除PCR重复序列,计算统计比对到上述区域的reads数,对统计结果使用RPKM方法进行标准化。
(2)核小体印迹差异分析。核小体缺失区域即在TSS位点较邻近区域明显降低的区域,为高表达基因,反之则为低表达基因。通过Kruskal-Wallis非参数单因子方差分析肺癌患者组和正常人对照组TSSs区域的覆盖度差异,发现乳腺癌、肺癌、肠癌与健康人群对照组有差异的TSSs区域111个。
(3)聚类分析。利用Cluster软件对差异表达的基因启动子覆盖度数据进行标准化,通过利用差异表达的基因进行无监督的等级聚类分析,结果发现基于111个差异基因能够将样本聚成乳腺癌、肺癌、肠癌和健康人4种类别,且分支间覆盖度差异基因的模式显著差异。
表1.38例健康人、35例乳腺癌、11例肺癌以及9例肠癌患者外周血血浆标本信息及测序reads数、平均读长信息
Figure BDA0002108882490000101
Figure BDA0002108882490000111
表2肺癌患者与健康人差异基因信息
Figure BDA0002108882490000112
Figure BDA0002108882490000121
Figure BDA0002108882490000131
Figure BDA0002108882490000141
Figure BDA0002108882490000151
Figure BDA0002108882490000161
Figure BDA0002108882490000171
Figure BDA0002108882490000181
Figure BDA0002108882490000191
Figure BDA0002108882490000201
Figure BDA0002108882490000211
Figure BDA0002108882490000221
Figure BDA0002108882490000231
Figure BDA0002108882490000241
Figure BDA0002108882490000251
Figure BDA0002108882490000261
Figure BDA0002108882490000271
表3肠癌与健康人差异基因信息
Figure BDA0002108882490000272
Figure BDA0002108882490000281
表4乳腺癌癌与健康人差异基因信息
Figure BDA0002108882490000282
Figure BDA0002108882490000291
Figure BDA0002108882490000301
Figure BDA0002108882490000311
Figure BDA0002108882490000321
Figure BDA0002108882490000331
Figure BDA0002108882490000341
Figure BDA0002108882490000351
Figure BDA0002108882490000361
Figure BDA0002108882490000371
Figure BDA0002108882490000381
Figure BDA0002108882490000391
Figure BDA0002108882490000401
Figure BDA0002108882490000411
表5乳腺癌、肺癌、肠癌与健康人群差异基因列表
Figure BDA0002108882490000412
Figure BDA0002108882490000421
Figure BDA0002108882490000431
Figure BDA0002108882490000441

Claims (1)

1.一种基于外周血血浆游离DNA高通量测序技术的肿瘤早筛系统,其特征在于:该系统包括:(1)核小体信息模块,(2)测序模块,(3)质控模块,(4)分析模块和(5)聚类模块;
(1)核小体信息模块:所述核小体信息模块用于注释UCSC的RefSeq数据库中所有人类蛋白编码基因信息,获取每个基因的转录起始位点(TSSs)和转录终止位点(TTSs)上下游1Kb区域的基因组位置,构建核小体定位标准数据库;
(2)测序模块:所述测序模块用于检查者外周血血浆游离DNA进行高通量测序,获取各检查者序列在基因组上的位置信息;
所述的外周血血浆游离DNA进行高通量测序时用于分离和游离DNA提取试剂包括:血浆游离DNA提取试剂、文库构建试剂、测序试剂、测序芯片;所述的文库构建试剂包括末端修复、接头连接、PCR扩增试剂;
(3)质控模块:所述质控模块用于根据核小体足迹定位的比对结果,去除由文库构建和高通量测序引起的PCR重复序列,去除低质量DNA片段序列、去除未比对到核小体足迹定位区域且在基因组中唯一比对的DNA片段序列,得到RPKM方法标准化后的值;
(4)分析模块:所述分析模块用于筛选核小体区域存在差异的基因,利用秩和检验非参数方法,并通过P值校正,得到两组间的变化倍数|log2 fold change| > 1且q-value值<0.1的差异基因转录起始位点(TSSs)和转录终止位点(TTSs)区域;
(5)聚类模块:所述聚类模块用于区分健康人群和肿瘤患者,根据Cluster软件对基因转录起始位点(TSSs)和转录终止位点(TTSs)区域覆盖度数据进行标准化后的等级聚类及R语言pheatmap包对数据的可视化结果,根据全基因组范围内TSSs区核小体的印记差异,基于111个差异基因,将样品聚类为健康人、乳腺癌、非小细胞肺癌、结直肠癌;
所述的111个差异基因,如下:
Figure 248089DEST_PATH_IMAGE002
Figure 542060DEST_PATH_IMAGE003
Figure 993902DEST_PATH_IMAGE004
Figure 497433DEST_PATH_IMAGE005
CN201910563406.3A 2019-06-26 2019-06-26 基于外周血血浆游离dna高通量测序技术的肿瘤筛查试剂盒及其系统与方法 Active CN110272985B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910563406.3A CN110272985B (zh) 2019-06-26 2019-06-26 基于外周血血浆游离dna高通量测序技术的肿瘤筛查试剂盒及其系统与方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910563406.3A CN110272985B (zh) 2019-06-26 2019-06-26 基于外周血血浆游离dna高通量测序技术的肿瘤筛查试剂盒及其系统与方法

Publications (2)

Publication Number Publication Date
CN110272985A CN110272985A (zh) 2019-09-24
CN110272985B true CN110272985B (zh) 2021-08-17

Family

ID=67963372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910563406.3A Active CN110272985B (zh) 2019-06-26 2019-06-26 基于外周血血浆游离dna高通量测序技术的肿瘤筛查试剂盒及其系统与方法

Country Status (1)

Country Link
CN (1) CN110272985B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111549131A (zh) * 2020-05-06 2020-08-18 中国科学院合肥物质科学研究院 一种基于循环肿瘤dna和肿瘤标记物的亚洲人多肿瘤早筛系统
CN111968702B (zh) * 2020-08-24 2024-04-19 西安时代基因健康科技股份有限公司 一种基于循环肿瘤dna的恶性肿瘤早期筛查系统
CN112562785B (zh) * 2020-12-10 2024-06-14 哈尔滨医科大学附属第一医院 基于atac测序数据筛选子宫内膜癌关键基因的方法及应用
US20240068041A1 (en) * 2021-01-14 2024-02-29 Bgi Shenzhen Free dna-based disease prediction model and construction method therefor and application thereof
CN112862018B (zh) * 2021-04-19 2022-09-02 温州医科大学 基于5hmC修饰的lncRNA的肿瘤分类装置
CN113096728B (zh) * 2021-06-10 2021-08-20 臻和(北京)生物科技有限公司 一种微小残余病灶的检测方法、装置、存储介质及设备
CN113393901B (zh) * 2021-06-15 2023-10-31 南京医科大学 一种基于单核细胞采集肿瘤核酸的胶质瘤分检装置
CN113838533B (zh) * 2021-08-17 2024-03-12 福建和瑞基因科技有限公司 一种癌症检测模型及其构建方法和试剂盒
WO2023142311A1 (zh) * 2022-01-28 2023-08-03 深圳华大生命科学研究院 利用血浆游离dna预测孕期肿瘤组织来源的模型及其构建方法
CN117004744B (zh) * 2022-04-27 2024-05-24 数字碱基(南京)科技有限公司 一种基于血浆微生物dna特征的肺癌预后评估方法及模型
CN115019952A (zh) * 2022-05-09 2022-09-06 深圳湾实验室 一种基于游离dna的癌症诊断模型和应用
CN115691665B (zh) * 2022-12-30 2023-04-07 北京求臻医学检验实验室有限公司 基于转录因子的癌症早期筛查诊断方法
CN115831355A (zh) * 2023-01-09 2023-03-21 北京求臻医学检验实验室有限公司 多癌种wgs的肿瘤早期筛查方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105653898A (zh) * 2016-01-12 2016-06-08 江苏格致生命科技有限公司 一种基于大规模数据挖掘的癌症检测试剂盒及检测方法
CN107002122A (zh) * 2014-07-25 2017-08-01 华盛顿大学 确定导致无细胞dna的产生的组织和/或细胞类型的方法以及使用其鉴定疾病或紊乱的方法
CN109680049A (zh) * 2018-12-03 2019-04-26 东南大学 一种基于血液游离DNA高通量测序分析cfDNA所属个体生理状态的方法及其应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11384382B2 (en) * 2016-04-14 2022-07-12 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107002122A (zh) * 2014-07-25 2017-08-01 华盛顿大学 确定导致无细胞dna的产生的组织和/或细胞类型的方法以及使用其鉴定疾病或紊乱的方法
CN105653898A (zh) * 2016-01-12 2016-06-08 江苏格致生命科技有限公司 一种基于大规模数据挖掘的癌症检测试剂盒及检测方法
CN109680049A (zh) * 2018-12-03 2019-04-26 东南大学 一种基于血液游离DNA高通量测序分析cfDNA所属个体生理状态的方法及其应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Cell-Free DNA Provides a Good Representation of the Tumor Genome Despite Its Biased Fragmentation Patterns;Xiangyuan Ma等;《PLoS One》;20170103;第12卷(第1期);第e0169231页 *
Inferring expressed genes by whole-genome sequencing of plasma DNA;Peter Ulz等;《Nature Genetics》;20160829;第48卷(第10期);摘要,第1274页左栏第1段,第1274页右栏第1段,第1275页左栏第1段至第1276页右栏第1段,第1279页"方法"部分,图1-3 *
Nucleosome mapping in plasma DNA predicts cancer gene expression;Muhammed Murtaza等;《Nature Genetics》;20160928;第48卷(第10期);第1105页第2栏第1段,图1 *

Also Published As

Publication number Publication date
CN110272985A (zh) 2019-09-24

Similar Documents

Publication Publication Date Title
CN110272985B (zh) 基于外周血血浆游离dna高通量测序技术的肿瘤筛查试剂盒及其系统与方法
CN114736968B (zh) 血浆游离dna甲基化标志物在肺癌早筛中的用途以及肺癌早筛装置
CN104611410A (zh) 一种无创癌症检测方法及其试剂盒
CN108588230B (zh) 一种用于乳腺癌诊断的标记物及其筛选方法
CN109652513B (zh) 基于二代测序技术精确检测液体活检个体突变的方法和试剂盒
CN107022605A (zh) 一种活动性肺结核的生物标志物
CN114277139B (zh) 外泌体arpc5、snhg5等在肺癌诊断中的应用
CN114574587A (zh) 一种用于结直肠癌检测的标记物组合物及其应用
CN113724862A (zh) 一种结直肠癌生物标志物及其筛选方法和应用
CN116875721B (zh) 隐球菌的cfDNA在诊断隐球菌感染中的应用
CN115287353B (zh) 一种肝癌血浆游离dna来源的甲基化标志物及用途
CN110408706A (zh) 一种评估鼻咽癌复发的生物标志物及其应用
CN114657242B (zh) Gpr33基因在马尔尼菲篮状菌易感人群评估的应用
CN115927614A (zh) 基于Alu重复原件的肠癌早期筛查检测引物、检测方法和试剂盒
Wilmott et al. Tumour procurement, DNA extraction, coverage analysis and optimisation of mutation-detection algorithms for human melanoma genomes
CN115011695A (zh) 基于游离环状dna基因的多癌种识别标志物、试剂盒及应用
CN112391474A (zh) 一种基于瘤内具核梭杆菌预测食管鳞癌转移的方法
CN113811621A (zh) 确定rcc亚型的方法
CN115747217B (zh) 长链非编码rna pdxdc1-as1及其应用
CN111575377B (zh) 用于line-1的检测引物组及其应用
CN116751859A (zh) Nmibc预测模型及其构建方法和应用
CN117778566A (zh) 用于预测甲状腺癌转移的标志物及其应用
CN114107508A (zh) 唾液微生物标志物在诊断区分乙肝肝细胞癌和肝硬化中的应用
WO2018148903A1 (zh) 泌尿系统肿瘤的辅助诊断方法
CN113913521A (zh) 一种基因分型检测试剂盒及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant