CN110669830A

CN110669830A - 一种低质量ffpe dna的处理方法、装置和存储介质

Info

Publication number: CN110669830A
Application number: CN201911019643.XA
Authority: CN
Inventors: 李艳; 朱嘉麒; 罗喜鹏; 陈超; 聂新华
Original assignee: Yuze Medical Devices Jiangsu Co Ltd
Current assignee: Yuze Medical Devices Jiangsu Co Ltd
Priority date: 2019-10-24
Filing date: 2019-10-24
Publication date: 2020-01-10
Anticipated expiration: 2039-10-24
Also published as: CN110669830B

Abstract

本申请公开了一种低质量FFPE DNA的处理方法、装置和存储介质。本申请的处理方法包括，对FFPE DNA进行片段化处理，然后加热去除二级结构，再酶切消化；消化后末端修复、加poly A尾，并使用A碱基连接头；然后，进行PCR扩增，杂交捕获、测序，获得测序数据；将测序数据比对到人参考基因组，并从比对结果中过滤掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列。本申请的方法，通过加热和酶切消化，消除大部分单链，使其不能相互连接后在末端补平中形成稳定双链，减少了因单链残留造成后续突变检测的假阳性；通过数据比对和过滤，进一步去除单链干扰，提高了突变检测结果的准确性。

Description

一种低质量FFPE DNA的处理方法、装置和存储介质

技术领域

本申请涉及FFPE样本处理领域，特别是涉及一种低质量FFPE DNA的处理方法、装置和存储介质。

背景技术

福尔马林固定石蜡包埋(Formalin-Fixed and Paraffin-Embedded，缩写FFPE)的样本，即FFPE样本。福尔马林固定石蜡包埋是组织样品常规采用的保存方法，该方法在临床和科研领域的应用已有一个世纪。数量巨大的归档FFPE样本是回顾性研究、阐明疾病机制、发现治疗靶标和指示预后的宝贵实验材料。FFPE样本中的DNA(以下简称FFPE DNA)经过了福尔马林处理容易发生交联、高温浸蜡、高温解交联等，并且长期保存后，容易发生严重的断链、单链化、无碱基位点、氧化损伤等，导致基因组不完整，这类样本称为低质量FFPE样本，其DNA称为低质量FFPE DNA。研究显示，低质量FFPE样本或低质量FFPE DNA至少占临床样本的1/10。低质量FFPE DNA通常建库效率低、测序数据不佳，具体体现在突变个数比正常FFPE样本多出数倍。国际主流品牌的FFPE建库试剂盒，例如KAPA Hyper Prep Kit(KAPA)、

Ultra^TMII DNA Library Prep(Illumina)、GeneRead LibraryPrep Kits(Qiagen)、

2S DNAlibrAry Kits(Swiftbiosciences)、NEXTflex^TM RapidDNA-Seq Kit(Bioo scientific)，以及国内FFPE建库试剂盒Rapid Plus DNA Lib Prepkit等产品在打断以后末端修复的过程中，尝试对低质量FFPE DNA的损伤进行修复以降低假阳性突变的检测。但是低质量FFPE DNA样本中的单链残留、茎环结构、打断后单链区域互补配对的二聚体产物等，在这些产品的末端修复过程中并不会被消除，因而继续进入到建库测序，继而在测序结果中出现Watson和Crick链信息同时出现在一条read上的正向+反向序列嵌合现象，导致变异检测中产生大量的假阳性位点。现有的建库试剂盒或文库构建方法都没有提供配套的解决方案，也没有给出采取怎样的措施消除这种影响的建议。

因此，如何解决低质量FFPE样本中单链残留、茎环结构、打断后单链区域互补配对形成二聚体产物等造成的假阳性突变检测结果，是本领域的研究重点和难点。

发明内容

本申请的目的是提供一种改进的低质量FFPE DNA的处理方法、装置和存储介质。

为了实现上述目的，本申请采用了以下技术方案：

本申请的第一方面公开了一种低质量FFPE DNA的处理方法，其包括以下步骤：

片段化处理步骤，包括对提取的FFPE DNA进行片段化处理，获得片段化的DNA样本；

加热和消化处理步骤，包括对片段化的DNA样本进行加热，去除DNA的二级结构，然后再进行酶切消化；

末端修复和加接头步骤，包括对加热和消化处理步骤的产物进行末端修复，并加polyA尾，然后使用添加的A碱基连接接头；

文库构建步骤，包括对末端修复和加接头步骤的产物进行PCR扩增；

测序步骤，包括对文库构建步骤的产物进行杂交捕获，并对杂交捕获产物进行高通量测序，获得测序数据；

数据比对步骤，包括将测序数据比对到人参考基因组上，获得比对结果；

序列信息过滤步骤，包括从比对结果中去掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列，即从比对结果中去掉Watson和Crick链信息同时出现在一条read上的正向+反向序列嵌合的序列。

需要说明的是，本申请的低质量FFPE DNA处理方法，创造性的在片段化处理之后，并在末端修复和加接头之前，进行加热和消化处理步骤，该步骤首先加热去除DNA的二级结构，然后再进行酶切消化，消除低质量FFPE DNA样本中的单链残留、茎环结构以及打断后单链区域互补配对形成的二聚体，从而减小了因单链残留等问题造成的假阳性突变检测结果，提高了低质量FFPE DNA检测结果的准确性。并且，利用数据比对步骤和序列信息过滤步骤，显著地将低质量FFPE样本中DNA单链对结果准确性造成的干扰去除，进一步提高低质量FFPE DNA检测结果的准确性。本申请的一种实现方式中，具体采用Integrative GenomicsViewer查看的方法剔除假阳性突变，进一步提高了低质量FFPE DNA突变检测结果的准确性。本申请的处理方法，通过试验步骤和信息分析的双重保障可以达到去除低质量FFPEDNA中单链影响的效果，从而实现更加准确的检测点突变。

优选的，本申请的低质量FFPE DNA处理方法还包括核酸提取步骤；核酸提取步骤包括，提取FFPE样本的核酸，获得FFPE DNA，用于后续的片段化处理步骤。

优选的，片段化处理步骤中，具体采用超声打断，获得片段化的DNA样本。

优选的，加热和消化处理步骤中，对片段化的DNA样本进行加热，具体包括在65℃保温至少5min，然后置于冰上至少3min。

需要说明的是，对于本申请的片段化的DNA样本而言，65℃加热处理已经可以起到去除DNA二级结构的效果，保温至少5min是为了确保DNA二级结构被完全去除；可以理解，加热的温度和时间在不造成DNA变形的前提下可以根据具体的处理对象进行调整，只要能够有效去除DNA二级结构即可。另外，置于冰上的作用是确保消除的DNA二级结构不会恢复，原则上只要将加热后的产物立即置于0摄氏度左右的温度即可，置于冰上只是实验室的一种常规操作，替代性的，也可以立即置于冰箱中或其它类似的低温环境。至于放置冰上的时间，原则上以待处理对象完全冷却即可。

优选的，加热和消化处理步骤中，酶切消化采用的酶为DNA单链水解酶；该DNA单链水解酶为核酸内切酶、核酸外切酶和聚合酶中的至少一种；其中，聚合酶具有外切酶活性。

本申请中，DNA单链水解酶是指能够针对性的酶切消化单链DNA或DNA单链区域的酶；其中，DNA单链区域是指单双链DNA嵌合体中的单链区域。

需要说明的是，本申请进行酶切消化的目的是消除单链残留，因此，凡是水解单链DNA、单双链DNA嵌合体的单链区域的酶都可以用于本申请，包括但不仅限于核酸内切酶、核酸外切酶或者聚合酶。

优选的，本申请的一种实现方式中酶切消化采用的酶为核酸内切酶和/或核酸外切酶，酶切消化条件为在酶的反应温度下保温至少1min，然后65～90℃保温至少1min，酶切消化完成后进行纯化，获得用于后续试验的酶切消化产物。

优选的，本申请的一种实现方式中酶切消化采用的酶为聚合酶，酶切消化条件为在酶的反应温度下保温至少1min，直接获得用于后续试验的酶切消化产物。

其中，酶的反应温度是指酶的推荐反应温度或最佳反应温度，当然，也可以根据具体试验设计在酶的活性温度范围内进行反应，在此不作具体限定。

需要说明的是，本申请中，对于核酸内切酶和核酸外切酶，需要酶切反应后进行65～90℃的高温失活，然后再经过纯化后，才能用于后续试验；而聚合酶进行酶切反应后，不需要进行高温失活，也不需要进行纯化，直接用于后续试验。因为，聚合酶不仅在酶切消化时起作用，而且在后续的文库构建中也可以起作用；所以，如果采用聚合酶进行酶切消化处理，则省去了高温失活和纯化步骤，从而提高了实验效率，降低了实验成本。

优选的，核酸内切酶为S1 nuclease和/或Nuclease P1；核酸外切酶为Exonuclease I、Exonuclease VII和Exonuclease T中的至少一种；聚合酶为T4 DNApolymerase、T7 DNAPolymerase和Klenow fragment中的至少一种。

本申请的第二方面公开了一种低质量FFPE DNA处理的装置，包括核酸提取模块、片段化处理模块、加热和消化处理模块、末端修复和加接头模块、文库构建模块、测序模块、数据比对模块和序列信息过滤模块；

核酸提取模块，用于提取FFPE样本的核酸，获得FFPE DNA；

片段化处理模块，用于对提取的FFPE DNA进行片段化处理，获得片段化的DNA样本；

加热和消化处理模块，用于对片段化的DNA样本进行加热，去除DNA的二级结构，然后再进行酶切消化；

末端修复和加接头模块，用于对加热和消化处理模块的产物进行末端修复，并加polyA尾，然后使用添加的A碱基连接接头；

文库构建模块，用于对末端修复和加接头模块的产物进行PCR扩增，即PCR扩增连接上接头的DNA序列；

测序模块，用于对文库构建模块的产物进行杂交捕获，并对杂交捕获产物进行高通量测序，获得测序数据；

数据比对模块，用于将测序数据比对到人参考基因组上，获得比对结果；

序列信息过滤模块，用于从比对结果中去掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列，即从比对结果中去掉Watson和Crick链信息同时出现在一条read上的正向+反向序列嵌合的序列。

需要说明的是，本申请的低质量FFPE DNA处理装置中，各模块可以根据需求选择性的使用，例如在已经得到FFPE DNA的情况下，可以不使用核酸提取模块，直接由片段化处理模块开始进行后续处理。

还需要说明的是，本申请的低质量FFPE DNA处理装置，实际上就是通过各模块实现本申请的低质量FFPE DNA处理方法的各个步骤，因此，本申请处理装置中各模块的具体实现方式或参数条件可以参考本申请的处理方法，例如片段化处理模块具体采用超声打断，加热和消化处理模块中的加热条件、酶切消化所采用的酶及酶切消化条件等。

本申请的第三方面公开了一种低质量FFPE DNA处理的装置，该装置包括存储器和处理器；存储器，用于存储程序；处理器，用于通过执行存储器存储的程序以实现本申请的低质量FFPE DNA处理的方法。

本申请的第四方面公开了一种计算机可读存储介质，其包括程序，该程序能够被处理器执行以实现本申请的低质量FFPE DNA处理的方法。

由于采用以上技术方案，本申请的有益效果在于：

本申请的低质量FFPE DNA处理方法，通过加热和消化处理步骤，消除低质量FFPEDNA中的大部分单链，使其不能相互连接后在末端补平中形成稳定双链，减少了因单链残留造成后续突变检测的假阳性；并通过数据比对步骤和序列信息过滤步骤，去除单链对检测结果的干扰，进一步提高了低质量FFPE DNA突变检测结果的准确性。

附图说明

图1是本申请实施例中低质量FFPE DNA处理方法的试验原理图；

图2是本申请实施例中低质量FFPE DNA处理方法的流程框图；

图3是本申请实施例中低质量FFPE DNA处理装置的结构框图。

具体实施方式

下面通过具体实施方式结合附图对本申请作进一步详细说明。在以下的实施方式中，很多细节描述是为了使得本申请能被更好的理解。然而，本领域技术人员可以毫不费力的认识到，其中部分特征在不同情况下是可以省略的，或者可以由其他元件、材料、方法所替代。在某些情况下，本申请相关的一些操作并没有在说明书中显示或者描述，是为了避免本申请的核心部分被过多的描述所淹没，而对于本领域技术人员而言，详细描述这些相关操作并不是必要的，他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。

研究显示，低质量FFPE样本中存在大量单链DNA，(1)当单链DNA的末端可以与同一DNA片段的另一单链区域互补配对，例如有8bp左右的反向互补，则会形成茎环结构；或者(2)当单链DNA片段末端与另一单链DNA片段发生互补配对；在打断后和末端修复前，人为造成的互补配对仍存在的情况下，末端修复就会将对这种人为产生的模板作为建库模板，经过二代测序后数据将会出现(1)Watson和Crick链信息同时出现在一条read上的正向+反向序列嵌合现象；(2)基因组上不连贯的序列连贯地出现在同一条read上的现象，也即同一条read的信息比对到基因组出现了断裂的假性现象。

单链DNA造成干扰的主要原理，如图1所示，在常规二代测序的文库构建中，这些单链DNA在打断后末端补平前互相连接经过末端补平后形成两段同染色体近距离的DNA序列的结合体，在最后测序结果中体现为Watson和Crick链信息同时出现在一条read上的测序序列嵌合现象；这些单链DNA在打断后末端补平前互相连接经过末端补平后形成在基因组上不连贯DNA序列的结合体，即同一序列中一部分比对上参考基因组，另一部分未比对上同一基因组区段。这些未比对序列或是碱基在常规分析中无法与突变区分开，导致假阳性结果。而本申请正是针对单链DNA残留在片段化后增加加热和消化处理，减少低质量FFPE DNA中的大部分的单链DNA残留，从而减小其对检测结果的影响，如图1所示。图1表示受损严重的FFPE DNA样本正向+反向嵌合体序列的形成原理，以及该类错误的消除方法图解。灰色线条和黑色线条表示基因组上某区域的正义链和反义链。实心星号与空心星号代表同一条DNA链上可反向互补配对的序列。

如图1所示，S1为打断和单链酶消化过程。当DNA因损伤形成单链状态，互补配对序列可能形成茎环结构或者二聚体。被打断的位置如果在茎环结构5’端附近，最容易经过建库，形成正向+反向嵌合体序列。而经过DNA单链的消化处理过程，即可较大程度降低该类序列的形成。

S2为末端修复过程。打断之后未经修复的DNA打断产物的单链部分会被补平，由于部分产物是同一条链上的茎环、单链DNA片段自连等二级结构的产物，末端修复的模板已经是正义链+反义链嵌合体产物，从而产生信息不同于原基因组序列的文库。经修复的DNA打断产物在末端修复前信息同于原基因组序列，也将产生序列正确的文库。

S3为最终文库形态，打断后不修复的DNA建成的文库容易出现正向+反向嵌合体序列。

S4代表的是测序数据通过生信方法的IGV查看，去除多数正向+反向嵌合体序列，从而得到更准确的测序结果。

基于以上认识，本申请提出了一种改进的低质量FFPE DNA的处理方法，如图2所示，包括片段化处理步骤22、加热和消化处理步骤23、末端修复和加接头步骤24、文库构建步骤25、测序步骤26、数据比对步骤27和序列信息过滤步骤28。

片段化处理步骤22，包括对提取的FFPE DNA进行片段化处理，获得片段化的DNA样本。本例的一种实现方式中，采用Covaris M220打断仪和专用打断管对FFPE DNA进行物理打断；DNA采用的打断条件与打断仪型号以及跑胶检测结果为不同片段大小和弥散程度有关。

加热和消化处理步骤23，包括对片段化的DNA样本进行加热，去除DNA的二级结构，然后再进行酶切消化。其中，酶切消化采用的酶为DNA单链水解酶，例如核酸内切酶、核酸外切酶或者聚合酶，具体包括Exonuclease I、Exonuclease VII、Exonuclease T、S1nuclease、Nuclease P1、T4 DNApolymerase、T7 DNAPolymerase、Klenow fragment等。本申请的一种实现方式中，具体对片段化的DNA样本65℃加热5min，然后置于冰上3min，采用Exonuclease I于37℃消化30min，再80℃灭活20min，最后采用XP beads纯化消化产物，再用于后续步骤。

末端修复和加接头步骤24，包括对加热和消化处理步骤的产物进行末端修复，并加polyA尾，然后使用添加的A碱基连接接头，即完成末端修复和加接头步骤；末端修复和加接头步骤的产物用于后续的文库构建和测序。本申请的一种实现方式中，具体采用End-Repair&Adenylation进行末端修复并加A，然后采用PE Index adapter进行加接头。

可以理解，经过以上步骤，可以消除低质量FFPE DNA中的大部分的单链残留，从而提高检测结果的准确性。但是，DNA单链酶并不能完全去除这些单链，因此，本申请在信息分析过程中进一步通过数据比对和序列信息过滤等步骤，去掉单链对突变检测结果的影响。具体如下：

文库构建步骤25，包括对末端修复和加接头步骤的产物进行PCR扩增，即PCR扩增连接上接头的DNA序列。本申请的一种实现方式中，具体采用的是HiFi readyMIX和所添加接头的Index进行PCR扩增，获得可以直接用于后续测序的测序文库。

测序步骤26，包括对文库构建步骤的产物进行杂交捕获，并对杂交捕获产物进行高通量测序，获得测序数据，用于后续的数据比对步骤。本申请的一种实现方式中，采用Integrated DNATechnology Inc公司相应的杂交试剂盒及探针，进行杂交捕获，然后采用Nextseq550进行测序；或者采用艾吉泰康产品TargetSeq Enrichment kit(for ILM,探针+box1+box2)PE2.0-8b和Target Enrichment Kit-Box2进行杂交捕获，然后采用Novaseq测序平台测序。

数据比对步骤27，包括将测序数据比对到人参考基因组上，获得比对结果。本申请的一种实现方式中，测序数据使用公开软件soapnuke的默认参数去掉残留接头序列得到cleandata，使用公开比对软件bwa默认参数将包含cleandata的fastq文件比对到hg19人参考基因组上。

序列信息过滤步骤28，包括从比对结果中去掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列。本申请的一种实现方式中，具体的，统计正反序列占比，这里正反序列即同时比对上参考基因组两个地方，且比对方向相反，距离不超过500bp的序列，这里使用这种序列占总序列比例作为判断问题大小的指标。一般来说白细胞样本里比例为0。然后，直接使用公开软件samtools将含有截断的序列从比对文件中去除；并采用公开软件mutect进行点突变检测，输入上一步去除含截断的序列的比对文件和白细胞对照的比对文件，输出体细胞点突变检测结果。

另外，如图2所示，本申请的处理方法还可以选择性的包括核酸提取步骤21。核酸提取步骤21包括提取FFPE样本的核酸，获得FFPE DNA，用于后续的片段化处理步骤22。本申请的一种实现方式中，具体采用的是GeneRead DNA FFPE Kit试剂盒提取FFPE DNA，并采用1％琼脂糖凝胶电泳对40ng的FFPE DNA样本进行质检。可以理解，对于本申请的低质量FFPEDNA的处理方法而言，可以直接对已经提取的FFPE DNA进行后续处理，因此，核酸提取步骤21并非必须的步骤。

本申请的低质量FFPE DNA的处理方法，一方面，利用高温消除二级结构在打断后消除茎环结构等二聚体，再利用单链消化酶在建库过程中去掉大部分低质量FFPE样本中的单链，使其不能相互连接后在末端补平中形成稳定双链，然后进行后续的加接头步骤。另一方面，有的极端低质量的FFPE样品中，单链酶并不能完全去除这些单链，在信息分析过程中通过序列是否为一半比对上，另一半不能比对上这个信息，在点突变分析中去掉这部分序列造成的影响。经过实验建库加信息分析的双重保障可以达到低质量FFPE去掉单链影响以及准确检测点突变的效果。

本领域技术人员可以理解，上述实施方式方法的全部或部分功能可以通过硬件的方式实现，也可以通过计算机程序的方式实现。当上述实施方式中全部或部分功能通过计算机程序的方式实现时，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器、随机存储器、磁盘、光盘、硬盘等，通过计算机执行该程序以实现上述功能。例如，将程序存储在设备的存储器中，当通过处理器执行存储器中程序，即可实现上述全部或部分功能。另外，当上述实施方式中全部或部分功能通过计算机程序的方式实现时，该程序也可以存储在服务器、另一计算机、磁盘、光盘、闪存盘或移动硬盘等存储介质中，通过下载或复制保存到本地设备的存储器中，或对本地设备的系统进行版本更新，当通过处理器执行存储器中的程序时，即可实现上述实施方式中全部或部分功能。

因此，基于本申请的低质量FFPE DNA的处理方法，本申请提出了一种低质量FFPEDNA处理的装置，如图3所示，包括核酸提取模块31、片段化处理模块32、加热和消化处理模块33、末端修复和加接头模块34、文库构建模块35、测序模块36、数据比对模块37和序列信息过滤模块38。

其中，核酸提取模块31，包括用于提取FFPE样本的核酸，获得FFPE DNA；片段化处理模块32，包括用于对提取的FFPE DNA进行片段化处理，获得片段化的DNA样本；加热和消化处理模块33，包括用于对片段化的DNA样本进行加热，去除DNA的二级结构，然后再进行酶切消化；末端修复和加接头模块34，包括对加热和消化处理模块33的产物进行末端修复，并加polyA尾，然后使用添加的A碱基连接接头；文库构建模块35，包括用于对末端修复和加接头模块34的产物进行PCR扩增，即PCR扩增连接上接头的DNA序列；测序模块36，包括用于对文库构建模块35的产物进行杂交捕获，并对杂交捕获产物进行高通量测序，获得测序数据；数据比对模块37，包括用于将测序数据比对到人参考基因组上，获得比对结果；序列信息过滤模块38，包括用于从比对结果中去掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列。

本申请的低质量FFPE DNA处理的装置，利用各模块相互协调作用，能够实现对低质量FFPE DNA进行准确的检测，并且，一方面，通过加热和消化处理模块，消除低质量FFPEDNA中的大部分的残留单链，消除由此造成的对检测结果的影响；另一方面，利用数据比对模块和序列信息过滤模块，去除剩余的没有被加热和消化处理模块消除的单链残留对结果的影响，进一步提高了低质量FFPE DNA检测结果的准确性。

本申请的另一实现方式中还提供了一种低质量FFPE DNA处理的装置，该装置包括存储器和处理器；存储器，包括用于存储程序；处理器，包括用于通过执行存储器存储的程序以实现以下处理方法：核酸提取步骤，包括提取FFPE样本的核酸，获得FFPE DNA；片段化处理步骤，包括对提取的FFPE DNA进行片段化处理，获得片段化的DNA样本；加热和消化处理步骤，包括对片段化的DNA样本进行加热，去除DNA的二级结构，然后再进行酶切消化；末端修复和加接头步骤，包括对加热和消化处理步骤的产物进行末端修复，并加polyA尾，然后使用添加的A碱基连接接头；文库构建步骤，包括对末端修复和加接头步骤的产物进行PCR扩增，即PCR扩增连接上接头的DNA序列；测序步骤，包括对文库构建步骤的产物进行杂交捕获，并对杂交捕获产物进行高通量测序，获得测序数据；数据比对步骤，包括将测序数据比对到人参考基因组上，获得比对结果；序列信息过滤步骤，包括从比对结果中去掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列。

本申请另一种实现方式中还提供一种计算机可读存储介质，该存储介质中包括程序，该程序能够被处理器执行以实现如下方法：核酸提取步骤，包括提取FFPE样本的核酸，获得FFPE DNA；片段化处理步骤，包括对提取的FFPE DNA进行片段化处理，获得片段化的DNA样本；加热和消化处理步骤，包括对片段化的DNA样本进行加热，去除DNA的二级结构，然后再进行酶切消化；末端修复和加接头步骤，包括对加热和消化处理步骤的产物进行末端修复，并加polyA尾，然后使用添加的A碱基连接接头；文库构建步骤，包括对末端修复和加接头步骤的产物进行PCR扩增，即PCR扩增连接上接头的DNA序列；测序步骤，包括对文库构建步骤的产物进行杂交捕获，并对杂交捕获产物进行高通量测序，获得测序数据；数据比对步骤，包括将测序数据比对到人参考基因组上，获得比对结果；序列信息过滤步骤，包括从比对结果中去掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列。

下面通过具体实施例和附图对本申请作进一步详细说明。以下实施例仅对本申请进行进一步说明，不应理解为对本申请的限制。

实施例1

本例对相同的组织样本，分别采用进行或不进行加热和消化处理作为对照进行对比试验，即对照组不进行加热和消化处理步骤，标记为ffpe_sample1，试验组在片段化处理后进行加热和消化处理步骤，标记为ffpe_sample_Exo1。并且，对照组和试验组都设置一个作为组织对照的白细胞样本，标记为blood_sample1。

本例的对照组和的试验组的具体处理步骤如下：

1.对照组的常规建库和分析方案

1.1FFPE样本核酸的提取

本例采用GeneRead DNAFFPE Kit试剂盒(品牌：Qiagen；货号180134)提取FFPEDNA，具体步骤参考说明书，在此不累述。

1.2FFPE样本质控

本例采用1％琼脂糖凝胶电泳，在130V电压下电泳30min，对40ng的ffpe_sample1样本进行质检。结果显示，所提取的FFPE DNA的主峰介于250bp-750bp。

1.3片段化处理

本例采用Covaris打断仪M220及配套专用打断管对提取的FFPE DNA进行物理打断，打断参数为：Peakpower/W 75、Duty facter 20、Cycle/burst 200、Average power13.3、time 15s。

1.4末端修复和加A

向50μL的片段化处理的产物中加入End-Repair&Adenylation Buffer Mix 7μL以及End-Repair&Adenylation Enzyme Mix 3μL，混匀后置于PCR仪上进行反应。

反应条件为：热盖85℃，20℃30min，65℃30min，最后12℃hold。

1.5连接接头

向60μL的末端修复和加A的产物中加入20μM的PE Index adapter 3.75μL、NFwater 6.25μL、Ligase buffer 30μL以及Ligase enzyme 10μL，混匀后置于PCR仪上进行反应。

反应条件为：20℃30min，不盖热盖。

连接接头的产物采用132μL的XP beads纯化，最后采用21μL的Elution buffer洗脱。

1.6PCR扩增

反应体系为50μL，包括连接接头并纯化的产物20μL、HiFi ready MIX 25μL、20μM的Index 5μL。

反应条件为：105℃热盖，98℃预变性1min；然后进入35个循环：98℃15s、65℃30s、72℃30s；循环结束后72℃延伸5min，最后12℃待机。

PCR扩增产物采用50μL的XPbeads纯化，最后采用27μL的NF水洗脱。

1.7杂交捕获和测序

本例杂交捕获和洗脱的试剂盒采用：艾吉泰康产品TargetSeq Enrichment kit(for ILM,探针+box1+box2)PE2.0-8b和Target Enrichment Kit-Box 2(货号：T073V3)。捕获探针为艾吉泰康合成的Plus。测序平台为：Novaseq。

1.8数据比对

本例获得测序结果原始数据fastq文件，其中，FFPE DNA样本共4.602G，白细胞对照样本共4.102G，使用soapnuke软件去除原始数据中接头序列，得到cleandata分别为4.061G和3.961G的fastq文件。

使用bwa mem软件将上一步生成的cleandata比对上hg19人参考基因组，统计正反序列占比。

1.9点突变检测

使用mutect软件输入FFPE样本ffpe_sample1和对应白细胞样本blood_sample1的比对数据，输出点突变，一共有309个体细胞突变。使用IGV软件观察突变，一条reads上是反向互补的区段可以被查找到，这里则是发生正向+反向嵌合体reads的高发区，需进一步分析和甄别。

2.试验组的低质量FFPE DNA处理方法

2.1FFPE样本核酸的提取

2.2FFPE样本质控

本例采用1％琼脂糖凝胶电泳，在130V电压下电泳30min，对40ng的ffpe_sample1样本进行质检，主峰介于250-750bp。

2.3片段化处理

2.4加热和消化处理

首先对44μL的片段化处理的DNA样本进行65℃加热5min，然后置于冰上3min，再向其中加入NEB的Exonuclease I(E.coli)1μL、10×Exonuclease I Reaction Buffer(NEB)5μL，混匀后置于PCR仪上进行消化反应。

消化反应条件为：37℃30min，80℃20min，最后4℃hold。

消化反应结束后，采用50μL的XPbeads纯化消化产物，最终采用50μL的NF水洗脱。

2.5末端修复和加A

向50μL消化并纯化的产物中加入End-Repair&Adenylation BufferMix 7μL以及End-Repair&Adenylation Enzyme Mix 3μL，混匀后置于PCR仪上进行反应。

反应条件为：热盖85℃，20℃30min，65℃30min，最后12℃hold。

2.6连接接头

反应条件为：20℃30min，不盖热盖。

2.7PCR扩增

PCR扩增产物采用50μL的XPbeads纯化，最后采用27μL的NF水洗脱。

2.8杂交捕获和测序

本例杂交捕获和洗脱的试剂盒采用的是：艾吉泰康产品TargetSeq Enrichmentkit(for ILM,探针+box1+box2)PE2.0-8b和Target Enrichment Kit-Box2(货号：T073V3)。捕获探针为艾吉泰康合成的Plus。测序平台为：Novaseq。

2.9数据比对

本例获得测序结果原始数据fastq文件，其中，FFPE DNA样本共4.437G，白细胞对照样本共4.037G，使用soapnuke软件去除原始数据中接头序列，得到cleandata分别为4.199G和3.831G的fastq文件。

去掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列。本例一共丢掉0.6％的序列。

2.10点突变检测

使用mutect软件输入FFPE样本ffpe_sample1和对应白细胞样本blood_sample1的比对数据，输出点突变，一共有8个体细胞突变。通过软件IGV查看，这8个体细胞突变均没有类似问题出现，说明这里使用实验方法和信息方法去除了低质量FFPE样本中单链对分析造成的假阳性影响。

在以上试验的基础上，本例对比分析了对照组和试验组的质控情况，比对结果中的正反序列嵌合体占比，以及最终检测获得的体细胞突变个数，结果详见表1至表3。

表1对照组和试验组的FFPE样本质控表

Sample	Raw_Base(G)	Clean_Base(G)	Insert_size	Duplication_rate(％)	Capture_rate(％)
						blood_sample1	4.602	4.061	134	26.603	52.021
ffpe_sample1	4.437	4.199	170	47.164	64.951
						ffpe_sample1_Exo1	4,102	3.961	182	41.215	62.163

表2对照组和试验组的比对结果中正反序列嵌合体占比

表3对照组和试验组的体细胞突变个数

处理方式	样本类型	样本	体细胞突变个数
				对照	FFPE-VS-白细胞	ffpe-sample_-VS-blood_sample1	309
实验	FFPE-VS-白细胞	ffpe-sample_Exo1-VS-blood_sample1	8

表1至表3中，“对照”是指对照组，“实验”是指试验组。表2的结果显示，本例经过加热和消化处理步骤的试验组，相对于没有进行加热和消化处理的对照组而言，正反序列嵌合体占比明显减少，说明加热和消化处理能够减少低质量FFPE DNA中的大部分的单链残留。表3的结果显示，本例的低质量FFPE DNA处理方法，能够有效的去除假阳性检测结果，提高低质量FFPE DNA检测结果的准确性。

以上内容是结合具体的实施方式对本申请所作的进一步详细说明，不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干简单推演或替换。

Claims

1.一种低质量FFPE DNA的处理方法，其特征在于：包括以下步骤，

末端修复和加接头步骤，包括对所述加热和消化处理步骤的产物进行末端修复，并加polyA尾，然后使用添加的A碱基连接接头；

文库构建步骤，包括对所述末端修复和加接头步骤的产物进行PCR扩增；

测序步骤，包括对所述文库构建步骤的产物进行杂交捕获，并对杂交捕获产物进行高通量测序，获得测序数据；

数据比对步骤，包括将所述测序数据比对到人参考基因组上，获得比对结果；

序列信息过滤步骤，包括从所述比对结果中去掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列。

2.根据权利要求1所述的处理方法，其特征在于：还包括核酸提取步骤；

所述核酸提取步骤，包括提取FFPE样本的核酸，获得FFPE DNA，用于所述片段化处理步骤。

3.根据权利要求1所述的处理方法，其特征在于：所述片段化处理步骤，具体采用超声打断，获得片段化的DNA样本。

4.根据权利要求1所述的处理方法，其特征在于：所述加热和消化处理步骤中，对片段化的DNA样本进行加热，具体包括在65℃保温至少5min，然后置于冰上至少3min；酶切消化采用的酶为DNA单链水解酶；所述DNA单链水解酶为核酸内切酶、核酸外切酶和聚合酶中的至少一种；所述聚合酶具有外切酶活性。

5.根据权利要求4所述的处理方法，其特征在于：所述酶切消化采用的酶为核酸内切酶和/或核酸外切酶，酶切消化条件为在酶的反应温度下保温至少1min，然后65～90℃保温至少1min，酶切消化完成后进行纯化，获得用于后续试验的酶切消化产物。

6.根据权利要求4所述的处理方法，其特征在于：所述酶切消化采用的酶为聚合酶，酶切消化条件为在酶的反应温度下保温至少1min，直接获得用于后续试验的酶切消化产物。

7.根据权利要求4-6任一项所述的处理方法，其特征在于：所述核酸内切酶为S1nuclease和Nuclease P1中的至少一种；所述核酸外切酶为Exonuclease I、ExonucleaseVII和Exonuclease T中的至少一种；所述聚合酶为T4 DNA polymerase、T7 DNAPolymerase和Klenow fragment中的至少一种。

8.一种低质量FFPE DNA处理的装置，其特征在于：包括核酸提取模块、片段化处理模块、加热和消化处理模块、末端修复和加接头模块、文库构建模块、测序模块、数据比对模块和序列信息过滤模块；

所述核酸提取模块，用于提取FFPE样本的核酸，获得FFPE DNA；

所述片段化处理模块，用于对提取的FFPE DNA进行片段化处理，获得片段化的DNA样本；

所述加热和消化处理模块，用于对片段化的DNA样本进行加热，去除DNA的二级结构，然后再进行酶切消化；

所述末端修复和加接头模块，用于对所述加热和消化处理模块的产物进行末端修复，并加polyA尾，然后使用添加的A碱基连接接头；

所述文库构建模块，用于对所述末端修复和加接头模块的产物进行PCR扩增；

所述测序模块，用于对所述文库构建模块的产物进行杂交捕获，并对杂交捕获产物进行高通量测序，获得测序数据；

所述数据比对模块，用于将所述测序数据比对到人参考基因组上，获得比对结果；

所述序列信息过滤模块，用于从所述比对结果中去掉同时部分比对到同一染色体两个不同地方，且比对起始位置距离小于500bp的序列。

9.一种低质量FFPE DNA处理的装置，其特征在于：所述装置包括存储器和处理器；

所述存储器，包括用于存储程序；

所述处理器，包括用于通过执行所述存储器存储的程序以实现权利要求1-7任一项所述的处理方法。

10.一种计算机可读存储介质，其特征在于：所述存储介质中包括程序，所述程序能够被处理器执行以实现权利要求1-7任一项所述的处理方法。