CN115197999B

CN115197999B - 质控双端唯一标签接头合成串扰的方法及装置

Info

Publication number: CN115197999B
Application number: CN202210832154.1A
Authority: CN
Inventors: 胡玉刚; 曲燕; 章明晔; 蒋才; 汪彪; 吴强
Original assignee: Naonda Nanjing Biological Technology Co ltd
Current assignee: Naonda Nanjing Biological Technology Co ltd
Priority date: 2022-07-15
Filing date: 2022-07-15
Publication date: 2024-01-23
Anticipated expiration: 2042-07-15
Also published as: CN115197999A

Abstract

本发明公开了一种质控双端唯一标签接头合成串扰的方法及装置。该方法包括：包Lane测序：等量的超声打断基因组DNA构建文库，等比例混合N个文库后进行包lane测序，测序后分析正常双端标签组合和异常双端标签组合占比；和/或跨平台混合测序：等量的超声打断基因组DNA用第一测序平台的双端唯一标签接头构建文库，等比例混合N个文库再用第二测序平台的双端唯一标签接头建库；在第二测序平台进行测序获得测序数据；按照标签序列拆分后的测序数据进行第一测序平台的正常双端标签组合和异常双端标签组合占比分析。通过建立质控方法和标准，控制合成环节的串扰水平，实现双端唯一标签在后续应用过程中去除串扰的发生实现精准检测的目的。

Description

质控双端唯一标签接头合成串扰的方法及装置

技术领域

本发明涉及高通测序技术领域，具体而言，涉及一种质控双端唯一标签接头合成串扰的方法及装置。

背景技术

高通量测序是目前比较重要的获取医学诊断和科研信息的手段，其准确性非常重要。由于高通量测序产生的数据很多，仅一次测序就会产生大量的测序数据，例如，MGISeq-T7和Illumina NovaSeq6000单次测序就可以产生6Tb的测序数据。因为同一次测序要混合很多样本测序，由于混合操作和测序过程中样本之间会有一定的串扰，目前通常用双端标签建库接头方式消除样本之间的干扰，例如，专利CN111910258B公开了针对MGI测序平台解决串扰的双端标签的建库接头和CN113999893A公开了兼容双测序平台MGI和Illumina的双端标签建库接头。通过双端标签可以降低100倍的样本之间相互干扰，这样可以使医学检测的低频检测更准确，科学研究更严谨和可信。

在医学检测过程中，由于肿瘤样的占比和异质性，重要的靶向突变位点的频率在0-50％不等，或者检测的是病人样本的cfDNA(血液游离DNA)，检测到很低频率对被检测者都会很有意义，所以需要保证检测的准确性。在科学研究的过程中同样要求检测的准确性，比如在研究植物的miRNA过程中，由于一些miRNA的表达丰度很高，如果不同物种研究的小分子RNA测序混合在一次测序过程，如果是单标签测序，由于标签串扰导致的“重大科研发现”也会发生，导致这种现象的出现是因为不了解高通测序单端标签会导致测序串扰，会产生张冠李戴的结果。

虽然双端标签建库接头可以解决样本串扰问题，但是要在接头合成质量和产品生产时进行严格的质控，避免由于接头合成和纯化过程中已经导致的污染失去双端标签去除污染的效果。

本发明就是在生产过程中严格质控合成质控，保证双端标签能够有效去除串扰干扰。

发明内容

本发明旨在提供一种质控双端唯一标签接头合成串扰的方法及装置，以避免在合成过程中导致的污染使双端唯一标签接头失去去除样本之间混合测序串扰功能的技术问题。

为了实现上述目的，根据本发明的一个方面，提供了一种质控双端唯一标签接头合成串扰的方法。该方法包括以下步骤：包Lane测序：等量的超声打断基因组DNA用双端唯一标签接头构建文库，等比例混合N个文库后进行包lane测序，测序后分析正常双端标签组合和异常双端标签组合占比；和/或跨平台混合测序：等量的超声打断基因组DNA用第一测序平台的双端唯一标签接头构建文库，等比例混合N个文库再用第二测序平台的双端唯一标签接头建库；在第二测序平台进行测序获得测序数据；按照标签序列拆分后的测序数据进行第一测序平台的正常双端标签组合和异常双端标签组合占比分析。

进一步地，第一测序平台为MGI测序平台，第二测序平台为Illumina测序平台；或第一测序平台为Illumina测序平台，第二测序平台为MGI测序平台。

进一步地，N个文库为8m，其中，m为正数；优选N个文库为24个文库或48个文库。

进一步地，当大于96组双端唯一标签时，采用包Lane测序的方法进行；当小于96组双端唯一标签时，采用跨平台混合测序的方法进行。

进一步地，当正常双端标签组合的占比大于等于98.5％，异常双端标签组合单独一项不高于0.3％，且标签碱基缺失小于等于2.5％时，判断双端唯一标签接头合格。

根据本发明的另一个方面，提供一种质控双端唯一标签接头合成串扰的装置。该装置包括：包Lane测序单元：配置为等量的超声打断基因组DNA用双端唯一标签接头构建文库，等比例混合N个文库后进行包lane测序，测序后分析正常双端标签组合和异常双端标签组合占比；和/或跨平台混合测序单元：配置为等量的超声打断基因组DNA用第一测序平台的双端唯一标签接头构建文库，等比例混合N个文库再用第二测序平台的双端唯一标签接头建库；在第二测序平台进行测序获得测序数据；拆分后的测序数据进行第一测序平台的正常双端标签组合和异常双端标签组合占比分析。

进一步地，当大于96组双端唯一标签时，采用包Lane测序单元；当小于96组双端唯一标签时，采用跨平台混合测序单元。

应用本发明的技术方案，通过建立质控方法和标准，控制合成环节的串扰水平，实现双端唯一标签在后续应用过程中去除串扰的发生实现精准检测的目的。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1示出了双端标签比单端标签去除串扰的优势；

图2示出了通过质控可控制的因素；

图3示出了评估串扰的方法；

图4示出了通过包lane测序评估串扰的标准；

图5示出了合格的合成质控评估结果；

图6示出了不合格的合成质控评估结果；

图7示出了跨平台测序评估接头合成串扰；

图8示出了跨平台测序评估接头24种接头合格结果。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。

术语解释：

双端标签接头：在高通量建库过程中，被测目标片段两端都需要连接建库接头，不同文库之间是通过标签区分，双端标签接头是指文库中的两段6-10bp碱基序列区别序列组成。

接头串扰或标签跳跃：文库片段的双端标签的一端由于混合捕获或混合测序导致的样本标签交换的嵌合分子，出现了不应该有的接头标签组合形式。

WGS建库测序：WGS是全基因组建库测序简称，本发明中用的是人的标准品，经过超声打断，固定投入量建库，固定PCR扩增循环数，等比混合文库后进行直接测序。

包Lane测序：在高通量测序过程中，DNA文库都是在一个芯片的流动槽(flowcell)上进行，每个流动槽上有多个独立的泳道，一条用到就是一个独立的lane，每个独立的lane内可以混不同标签的文库，方便数据拆分，统一lane内文库的标签要保准唯一性，避免数据拆分出现错乱。

目前，主流二代测序仪平台有国产MGI测序仪和进口Illumina测序仪。为了降低测序成本这两个公司都推出了更高通量的测序仪MGIseq-T7和NovaSeq6000，所以这就要求有更多的样本混合在一起测序，由于文库标签接头的残留会导致在混合捕获和混合测序过程中标签接头的串扰。如果是同一种检测，突变比例高的会污染突变比例低的或者阴性检测的出现假阳性。在不同物种之间的检测，会导致植物、昆虫等的检测相互污染检测到跨物种的序列。如何避免上述情况的发生，目前解决的办法是用双端唯一标签建库接头的方法解决标签跳跃的问题。例如，专利CN111910258B公开了MGI测序平台解决串扰的双端标签的建库接头和CN113999893A公开了兼容双测序平台MGI和Illumina的建库双端标签建库接头，这两篇专利除了双端唯一的标签外，还设计了4个标签的碱基平衡，既能保证多样本混合的有效拆分，还能够保证少数样本混合时的深度测序。通过双端唯一标签可以减少100倍的标签串扰，比如如果单端标签有1％的跳跃，可以通过双端标签去除污染后变为0.01％，如图1所示，通过双端标签降低100倍的串扰。

虽然双端标签比单端标签可以减低100倍的标签串扰问题，这个前提是合成的双端标签接头质量有保证。如果合成环节和纯化环节已经污染，再加上后续环节的串扰就会失去排除功能。一般合成环节主要是环境影响，在干燥环节相互干扰；合成完的核酸序列通常要进行HPLC纯化去除合成质量不好的短序列，而纯化环节需要过色谱柱(色谱柱在本申请中也简称柱子)，由于色谱柱需要重复利用，这时如果重复利用的色谱柱清洗不干净就会污染下一个纯化的核酸序列。本发明旨在解决的核心问题就是如何质控合成接头的质量，保证较好的合成质量。如图2所示，通过控制合成和纯化环节的质量，在后续环节混合杂交和混合测序环节的串扰通过双端标签的方式去除，这样操作就能够保证测序数据的质量。

如何质控双端唯一标签接头的串扰水平是很重要的质控环节，一般的合成公司质控合成长度和纯度指标，但是对串扰是没有办法质控。而只有控制一定的串扰水平才能够保证双端标签在后续应用中发挥重要的去除串扰的功能。针对此，本发明在设计质控双端唯一标签接头时采用两种质控方案，方案一是包Lane测序：等量的超声打断基因组DNA用双端唯一标签接头构建文库(在一实施例中，超声打断基因组DNA建库的投入量可以是10ng或50ng建库)；等比例混合包lane测序；测序后分析正常双端标签组合和异常双端标签组合占比，如图3所示。方案二跨平台混合测序：等量的超声打断基因组DNA用测序MGI接头构建文库；等量(等比例)混合N个文库(N个文库为8m，其中，m为正数；优选N个文库为24个文库或48个文库，因为双端唯一标签都是4个一组平衡，同时操作时的排枪是8个一组，所以一般是这两个数的整数倍，利于用排枪操作)24个文库或48个文库再用Illumina接头建库；在Illumina测序平台测一定数量的数据；数据拆分后的数据进行MGI双端唯一标签的正确组合和异常组合占比。同样如果是质控的是Illumina平台的双端标签接头，等量的超声打断基因组DNA用测序Illumina接头构建文库；等量混合24个文库或48个文库再用MGI接头建库；在MGI测序平台测一定数量的数据；数据拆分后的数据进行Illumina双端唯一标签的正确组合和异常组合占比。

方案一适合规模比较大(例如大于96组，例如是384组)的双端唯一标签的质控中应用，例如，一次有384组需要质控，方案一是比较快速和可行的方案，该质控方案的特点是速度快，可以一次完成所以双端唯一标签的质控。在质控过程中除了需要有质控方案，还要有质控标准，本发明人在实际操作过程中制定了相应的质控标准，质控标准有两项指标：第一项指标是正确的组合(即正常双端标签组合)占比大于等于98.5％；第二项指标是异常组合(即异常双端标签组合)单独一项不能高于0.3％。设定这两项指标可以保证实际操作过程中的切实可行，又能提升产品质量。如图4所示就是设计质控标准的双端唯一标签对应正常和异常组合占比的阈值，图4中对角线部分是正常组合占比大于等于98.5％，在对角线外的异常占比小于0.3％，这两个条件都满足时是符合质控标准。如图5所示(图5中纵横坐标是文库标号，由于数据太多无法标注清楚，但不影响其结果的显示)，是包lane的方式质控合格的结果，对角线部分是正确组合占比大于98.5％，在非对角线部分异常组合都小于0.3％。如图6所示(图6中纵横坐标是文库标号，由于数据太多无法标注清楚，但不影响其结果的显示)是有很多不合格的双端标签不合格的合成质控，在前48组组合中，大部分的正确组合都低于98.5％，还有部分异常组合大于0.3％，虽然后48种组合大部分是合格，但是可以明显看出合成的双端唯一接头的污染具有一定的规律，可以推断纯化时共用了一个纯化管没有清洗干净导致。

方案二除了适合规模比较大的双端唯一标签的质控中应用，方案二还有下列优点：优点1，可以适合规模比较小的双端唯一标签质控，可以混合测序节省成本；优点2，如果发生串扰，可以直接确定污染者和被污染者；优点3，可以消除测序过程中带来的串扰干扰，评估合成更准确。通过两轮建库评估接头的串扰，既可以评估24组或48组内相互串扰，也可以评估同批次合成其它接头是否串扰到被评估组里面。如图7所示，1-24组对下线指标大于等于98.5％；其他位置小于0.3％，与被评测有潜在组合形式的都评估，没有潜在组合形式的不评估。通过这种方式可以快速经济的评估接头串扰水平，排除合成质量不合格的双端唯一标签接头。

综上所述，本发明优化了两种质控双端唯一标签接头的方法，通过质控方法，建立了质控标准，对不符合标准的接头不能够形成产品，这样保证双端唯一标签接头的产品质量，通过双端唯一标签接头去除混合捕获和混合测序过程中的标签串扰导致的检测不准确。本发明是通过建立质控方法和标准，控制合成环节的串扰水平，实现双端唯一标签在后续应用过程中去除串扰的发生实现精准检测的目的。

下面将结合具体的实施例来进一步说明本申请的有益效果。

实施例1

通过文库等比混合包lane的WGS测序评估串扰。

使用100ng gDNA input，按照(货号：1003721)DNA LibraryPreparation Module(for MGI)说明书操作，5个循环，平均文库产出>1μg。

步骤一:使用Covaris^TM M220 Focused-ultrasonicator超声打断promega公司的人标准品混合基因组(G3041)，打断目标片段主峰控制在200-300bp。

步骤二：末端修复&加A

1、取出End Repair&A-Tailing Buffer和End Repair&A-Tailing Enzyme置于冰上自然融解，混合均匀，瞬时离心备用。

2、按照下表1，在置于冰上的0.2ml PCR管中进行反应体系配制：

表1

3、混合均匀，瞬时离心使全部反应液置于PCR管底部。

4、在PCR仪上启动如下表2中的反应程序，等温度稳定至20℃时将反应管放进PCR仪：

表2

步骤三：接头连接

1、取出Ligation Buffer和DNA Ligase置于冰上自然融解，混合均匀，瞬时离心备用。

2、从PCR仪上取出步骤二PCR反应管，置于冰上，按照以下表3的体系进行接头连接反应体系配制：

表3

3、混合均匀，瞬时离心使全部反应液置于PCR管底部。

4、在PCR仪上启动如下表4中的反应程序，等温度稳定至20℃时将反应管放进PCR仪：

表4

步骤四：磁珠纯化

1、提前将NanoPrep^TM SP Beads取出涡旋混匀，室温平衡30min后使用。

2、向步骤三连接体系PCR管加入40μl NanoPrep^TM SP Beads，混合均匀，25℃孵育5～10min。

3、将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清，使用移液器吸取移弃上清。

4、沿PCR管侧壁缓慢加入150μl 80％乙醇，注意勿扰动磁珠，静置30s，使用移液器吸取移弃上清。

5、重复步骤4一次。

6、将PCR管瞬时离心后放置于磁力架上，使用10μl吸头移去少量残留乙醇，注意勿吸到磁珠。

7、打开PCR管管盖，并于室温静置约5min，至乙醇挥发完全。

注意：切勿过分干燥，否则会降低得率。

8、移出PCR管，向PCR管中加入21μl Nuclease Free Water，将磁珠悬浮均匀，25℃孵育2min。

9、将PCR管瞬时离心后放置于磁力架上2min至液体完全澄清，使用移液器吸取20μl上清，并转移至1个新的0.2ml PCR管中，置于冰上备用。

步骤五：PCR扩增

1、取出2×HiFi PCR Master Mix和Amplification Primer Mix置于冰上自然解冻，混合均匀，瞬时离心备用。

2、按照以下体系在置于冰上的PCR管中进行反应体系配制：

表5

将PCR管放入PCR仪中启动以下程序(表6)：

表6

步骤五：文库纯化、定量和质检

1、向PCR管加入60μl的NanoPrep^TM SP Beads混合均匀，25℃孵育5～10min。

2、将PCR管瞬时离心后放置于磁力架上5min，至液体完全澄清，使用移液器吸取移弃上清。

3、沿PCR管侧壁缓慢加入150μl 80％乙醇，注意勿扰动磁珠，静置30s，使用移液器吸取移弃上清。

4、重复步骤3一次。

5、PCR管瞬时离心，放置于磁力架上，使用10μl吸头移去少量残留乙醇，注意勿吸到磁珠。

6、打开PCR管管盖，并于室温静置约5min，至乙醇挥发完全。

注意：切勿过分干燥，否则会降低得率。

7、向PCR管加入20μl TE Solution，使用移液器将磁珠悬浮均匀，25℃孵育2min。

8、将PCR管瞬时离心后放置于磁力架上2min，至液体完全澄清，使用移液器小心将上清移取至一个新的0.2ml PCR管中进行保存，注意勿吸到磁珠。

9、使用Qubit对文库进行定量。

10、使用Bioanalyzer(Agilent)、Qsep100(Bioptic)等相关片段分析仪器进行文库片段分布检测。

步骤六：上机测序和数据分析

等比混合文库用MGI-2000测序仪包lane测定PE150。

分析时数据拆分出正常组合和异常组合数据占比(双端唯一标签，横纵分析，对角线部分是正确组合，其它都不是正确组合)，如图4所示的标准判断是否合格。

实施例1是测试等比混合包lane测WGS，测完数据进行拆分正常组合和异常组合占比，按照图4所示的标准进行衡量，正常组合各组在对角线位置大于等于98.5％，异常组合在非对角线位置要小于0.3％，这两个条件都满足才符合质控条件，不符合的要重新合成再次质控，不符合的重新合成的接头可以用方案2质控。图5所示是指控合格的测序结果，对角线对用的是正确测序数据拆分大于等于98.5％，非对角先异常数据占比小于0.3％，说明合成质量合格，符合质控要求，此批产品可以转产。图6所示的就是不合格的质控测序结果，对角线正确的组合小于98.5％，在非对角线部分单端串扰大于0.3％，部分都在0.5％-1％之间，这部分原材料购于IDT公司，经过质控本批次原材料不符合转产要求，不能进行生产。

实施例2

通过跨平台两次建库混lane测序评估合成双端唯一标签的合成串扰水平。使用100ng gDNA input，按照(货号：1003721)DNA Library Preparation Module(forMGI)说明书操作，5个循环，平均文库产出>1μg。等比混合24或48个文库再用/>DNALibrary Preparation Module(for Illumina)说明书操作建库(货号：##1002103)。

实验步骤：实施例2的建库步骤和实施例1完全一致，唯一的区别是实施例2建完MGI文库需要把24或48个文库等比混合再用Illumina平台接头建库，建库步骤参考DNA Library Preparation Module(for Illumina)说明书(货号：##1002103)。

上机测序：每个MGI混合构建的Illumina文库在Illumina测序平台上测2-5g的PE150的数据。

分析数据：分析测序服务商返回的数据，比对正常数据占比和异常数据占比，按照图7列出的标准衡量合成双端唯一标签接头串扰水平判断是否产品合格。

实施例2是通过跨平台两次建库混lane测序评估合成双端唯一标签的合成串扰水平测试。通过跨平台建库在完成质控的同时降低测序成本，加快上机速度，跨平台上机不需要包lane。跨平台两次建库可以评估的文库数量不受限制，评估效果和包lane标准一样。拆分数据可以按照图7制定的标准，正确组合形式对角线展示的标准大于等于98.5％；异常数据部分要小于0.3％，同时满足上面两个条件才能够放行生产，只要有一个指标不合格就不符合质控标准。图8所示就是24个双端唯一标签的MGI文库等比混合再用Illumina建库接头建库在Illumina测序平台混合测序，这里面仅展示了24组的结果，在实际操作过程中会有多组24种文库经过Illumina建库接头建库在Illumina测序平台混合测序实现质控过程，图8所示是真实合格的结果，图7所示是示意图，只有符合质控标准的检测结果才能够进行生产，不合格原材料都会被做报废处理，本发明就是通过严格的质控方案保证实现高质量的生产产品方案。

综上所述，本发明针对MGI和Illumina各自测序平台的双端唯一标签接头建立一整套评估方案和质控标准。本部分举例是用MGI双端唯一标签建库接头说明，在Illumina平台同样试用，既可以包lane评测384种双端唯一建库接头，也可以用Illumina建好的文库再建MGI文库在MGI测序平台评估Illumina平台双端唯一标签接头的合成串扰水平。本发明通过建立质控方法和质控标准来控制合成质量，最终目的是做到用双端唯一标签去除混合捕获和混合测序过程中产生的串扰使检测更精准和准确。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种质控双端唯一标签接头合成串扰的方法，其特征在于，包括以下步骤：

跨平台混合测序：等量的超声打断基因组DNA用第一测序平台的双端唯一标签接头构建文库，等比例混合N个文库再用第二测序平台的双端唯一标签接头建库；在所述第二测序平台进行测序获得测序数据；按照标签序列拆分后的测序数据进行所述第一测序平台的正常双端标签组合和异常双端标签组合占比分析；

所述第一测序平台为MGI测序平台，所述第二测序平台为Illumina测序平台；或所述第一测序平台为Illumina测序平台，所述第二测序平台为MGI测序平台。

2.根据权利要求1所述的方法，其特征在于，所述N个文库为8m，其中，m为正数。

3.根据权利要求2所述的方法，其特征在于，所述N个文库为24个文库或48个文库。

4.根据权利要求1所述的方法，其特征在于，当小于96组双端唯一标签时，采用所述跨平台混合测序的方法进行。

5.根据权利要求1至4中任一项所述的方法，其特征在于，当所述正常双端标签组合的占比大于等于98.5％，异常双端标签组合单独一项不高于0.3％，且标签碱基缺失小于等于2.5％时，判断所述双端唯一标签接头合格。