CN115798590A

CN115798590A - 一种样本溯源方法、样本保存器皿、设备及可读存储介质

Info

Publication number: CN115798590A
Application number: CN202211673080.8A
Authority: CN
Inventors: 丁韬力; 李团; 刘娜; 万成; 任军; 陆思嘉
Original assignee: Yikon Genomics Shanghai Co ltd
Current assignee: Yikon Genomics Shanghai Co ltd
Priority date: 2022-12-26
Filing date: 2022-12-26
Publication date: 2023-03-14

Abstract

本申请公开了一种样本溯源方法、样本保存器皿、设备及可读存储介质，该方法包括：将样本与外参物混合，得到溯源样本；外参物为具有编码序列的外源DNA分子；获取溯源样本的DNA序列信息；从DNA序列信息中获取外参物DNA序列；利用外参物DNA序列，对溯源样本进行溯源。在本申请中，通过将样本与外源DNA分子进行混合，可利用外源DNA分子的DNA序列作为标签，在建库、测序、分析过程中确保样本无污染，可实现临检样本全程可追踪溯源。

Description

一种样本溯源方法、样本保存器皿、设备及可读存储介质

技术领域

本申请涉及生物信息学技术领域，特别是涉及一种样本溯源方法、样本保存器皿、设备及可读存储介质。

背景技术

无论是在细胞学DNA检测过程，还是在胚胎移植等领域中，对样本保存的安全性都有较高的要求。例如，对于胚胎移植事关重大，需要特别关注安全性问题。

但是，在胚胎实验室及第三方检验实验室中，由于样本量大、操作繁复而导致的样本标记错误、样本污染等问题屡见不鲜。这类问题一旦出现往往难以溯源，给医院胚胎实验室、第三方医检所以及患者家庭带来极大风险及不便。

综上所述，如何有效地样本溯源等问题，是目前本领域技术人员急需解决的技术问题。

发明内容

本申请的目的是提供一种样本溯源方法、样本保存器皿、设备及可读存储介质，通过在样本中加入外源DNA分子，利用外源DNA分子的编码序列(即外参物编码序列)作为标签，在后续的建库、测序、分析过程中确保样本无污染，实现临检样本全程可追踪溯源。

为解决上述技术问题，本申请提供如下技术方案：

一种样本溯源方法，包括：

将样本与外参物混合，得到溯源样本；所述外参物为具有编码序列的外源DNA分子；

获取所述溯源样本的DNA序列信息；

从所述DNA序列信息中获取外参物DNA序列；

利用所述外参物DNA序列，对所述溯源样本进行溯源。

可选地，利用所述外参物DNA序列，对所述溯源样本进行溯源，包括：

判断所述外参物DNA序列是否仅与所述编码序列匹配；

如果是，则确定所述溯源样本未污染；

如果否，则确定所述溯源样本已污染。

可选地，在确定所述溯源样本已污染之后，还包括：

利用所述外参物DNA序列，确定污染信息。

可选地，利用所述外参物DNA序列，确定污染信息，包括：

确定与所述外参物DNA序列匹配的目标外参物；

查找外参物添加记录，确定混合有所述目标外参物的目标样本；

将所述目标样本确定为污染源；

从所述DNA序列信息中确定所述目标外参物对应的reads数，并利用所述reads数确定污染比例；

将所述污染比例和所述污染源确定为所述污染信息。

查找外参物添加记录，确定与所述外参物混合的样本记录信息；

将所述样本记录信息确定为所述样本的样本信息。

可选地，将样本与外参物混合，得到溯源样本，包括：

将至少一种所述外参物加入样本保存液；

将所述样本加入所述样本保存液，得到所述溯源样本；所述样本为细胞或核酸。

可选地，生成所述外参物的过程，包括：

构建所述外参物DNA序列；

基于所述外参物DNA序列生成所述外参物。

可选地，所述构建所述外参物DNA序列，包括：

分别构建引物互补序列、起始点位序列和所述编码序列；

组合所述构建引物互补序列、所述起始点位序列和所述编码序列，得到所述外参物DNA序列。

可选地，在基于所述外参物DNA序列生成所述外参物之前，还包括：

构建项目号序列和/或暗反应区序列；

相应地，组合所述构建引物互补序列、所述起始点位序列和所述编码序列，得到所述外参物DNA序列，包括：

对所述项目号序列和所述暗反应区序列中的至少一项，及所述构建引物互补序列、所述起始点位序列和所述编码序列进行组合，得到所述外参物DNA序列。

可选地，构建所述编码序列，包括：

随机生成若干个指定长度的DNA序列；

将不符合筛选条件的DNA序列剔除，从留下的所述DNA序列中选出一个确定为所述编码序列；

其中，所述筛选条件包括：

具有ATCG四种碱基；

相同碱基连续数量小于等指定连续数值；

CG比例符合指定比例区间；

序列信息熵值大于指定熵值；

需无法与待标记溯源的样本序列匹配；

按照编辑距离去除邻接序列。

一种样本保存器皿，包括：

在所述样本保存器皿内置有样本保存液和外参物；

所述样本保存器皿具有标签；所述标签为所述外参物的编码序列识别码；所述编码序列识别码与所述外参物的DNA序列一一对应；

基于所述样本保存器皿，能够实现如上述样本溯源方法的步骤。

一种电子设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现上述样本溯源方法的步骤。

一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述样本溯源方法的步骤。

应用本申请实施例所提供的方法，将样本与外参物混合，得到溯源样本；外参物为具有编码序列的外源DNA分子；获取溯源样本的DNA序列信息；从DNA序列信息中获取外参物DNA序列；利用外参物DNA序列，对溯源样本进行溯源。

在本申请中，将样本与外参物进行混合，从而得到溯源样本，其中，该外参物为具有编码序列的外援DNA分子。当需要对样本进行溯源时，则对溯源样本进行DNA提取，从而得到DNA序列信息。由于样本与外参物进行了混合，因而在无污染的情况下，该DNA序列信息中应当有该外参物的DNA序列。因而，可直接从DNA序列信息中获取外参物DNA序列，基于该外参物DNA序列即可对溯源样本进行溯源。即，在本申请中，通过将样本与外源DNA分子混合，可利用外源DNA分子的DNA序列作为标签，在建库、测序、分析过程中确保样本无污染，可实现临检样本全程可追踪溯源。

相应地，本申请实施例还提供了与上述样本溯源方法相对应的样本保存器皿、设备和可读存储介质，具有上述技术效果，在此不再赘述。

附图说明

为了更清楚地说明本申请实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例中一种样本溯源方法的实施流程图；

图2为本申请实施例中一种外参物添加示意图；

图3为本申请实施例中一种外参物编码序列示意图；

图4为本申请实施例中一种胶图；

图5为本申请实施例中另一种胶图；

图6为本申请实施例中一种电子设备的结构示意图；

图7为本申请实施例中一种电子设备的具体结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面结合附图和具体实施方式对本申请作进一步的详细说明。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参考图1，图1为本申请实施例中一种样本溯源方法的流程图，该方法包括以下步骤：

S101、将样本与外参物混合，得到溯源样本。

其中，外参物为具有编码序列的外源DNA分子。

其中，样本可以任意一种需要进行溯源的样本，例如样本可以为人体细胞、胚胎、生殖细胞等人相关样本，以及其他与人无关的样本。

在本申请中，可以预先设计外参物，然后将外参物与样本进行混合，从而得到溯源样本。

在本申请中，外参物可以设计出多种，在实际实施过程中，对同一个样本可以仅添加一种外参物，也可以添加两种或多种外参物。

其中，外参物的生成过程，包括：

步骤一、构建外参物DNA序列；

步骤二、基于外参物DNA序列生成外参物。

为便于描述，下面将上述两个步骤结合起来进行说明。

首先，需要构建出外参物DNA序列，然后，在基于所构建的外参物DNA序列生成该外参物。

其中，构建外参物DNA序列，可具体包括：

步骤1、分别构建引物互补序列、起始点位序列和编码序列；

步骤2、组合构建引物互补序列、起始点位序列和编码序列，得到外参物DNA序列。

进一步地，在基于外参物DNA序列生成外参物之前，还可以构建项目号序列和/或暗反应区序列；

相应地，组合构建引物互补序列、起始点位序列和编码序列，得到外参物DNA序列，包括：

对项目号序列和暗反应区序列中的至少一项，及构建引物互补序列、起始点位序列和编码序列进行组合，得到外参物DNA序列。

也就是说，在本实施例中，可区别不同的项目，设置不同的外参物DNA序列，还可为适配为适配华大测序仪，还可以构建出暗反应区序列。

其中，构建编码序列，包括：

步骤①、随机生成若干个指定长度的DNA序列；

步骤②、将不符合筛选条件的DNA序列剔除，从留下的DNA序列中选出一个确定为编码序列；

其中，筛选条件包括：

具有ATCG四种碱基；

相同碱基连续数量小于等指定连续数值；

CG比例符合指定比例区间；

序列信息熵值大于指定熵值；

需无法与待标记溯源的样本序列匹配；

按照编辑距离去除邻接序列。

即，在本申请实施例中，该外参物编码序列适应于ChromInst、Chromswift、ChromLong等试剂盒，适用的样本类型可以为gDNA、白细胞、胚胎活检细胞(TE)、培养液样本(SCM)等，并可实现以下目标：

1.区分不同的实验项目；

2.区分不同的样本；

3.识别样本间污染，并估计出大致的污染比例。

需要注意的是，对外参物编码序列的设计及相关实验需注意以下4条事项：

1、外参物编码序列不能比对到样本相关的基因组上，以免对正常样本的测序结果产生干扰。

例如，当样本为人体细胞、胚胎、生殖细胞等人相关样本时，则外参物编码序列不能与人基因组对应。

2、各个外参物编码序列之间需具备足够的差异性，可以通过测序进行区分。

3、外参物编码序列能够随样本DNA一同扩增，但其扩增效率又不能过高，以免影响正常样本的数据产出。

4、如果存在样本间污染，则可以同时测到多种外参物序列，且reads比例与污染比例大致成线性关系。

请参考图3，图3为本申请实施例中一种外参物编码序列示意图。该外参物编码序列的设计如图3所示，总长度为69bp(base pair，基因的单位，指示DNA碱基对数目。当然，在实际应用中，其长度还可以具体为其他数值，如12bp，仅需其满足上述6条筛选条件即可)。

其中5’与3’端可与ChromInst试剂盒的扩增引物结合，且5’与3’端可互补结合，5'端指5'羟基没有参与形成3',5'-磷酸二酯键的一端，3'端指3'羟基没有参与形成3',5'-磷酸二酯键的一端。如此，在退火或者预扩增第一轮的58℃时就能形成hairpin结构(发夹结构)从而尽量跳过WGA反应，直接进入指数扩增反应，达到既能对外参物进行扩增，又不会扩增太多以致影响样本正常数据的产出。

其中，发夹结构，即RNA是单链线形分子，只有局部区域为双链结构，这些结构是由于RNA单链分子通过自身回折使得互补的碱基对相遇，形成氢键结合而成的。

为适配华大测序仪，外参物编码序列中还可添加暗反应区。

起始位点的设计则是为了方便区分5’与3’端。2bp的项目编号(当然项目编号的长度还可以仅为1bp以或大于2bp)可对不同适配试剂盒进行区分。

例如：AT对应ChromInst试剂盒、AC对应ChromSwift试剂盒、AG对应ChromLong试剂盒。

16bp编码序列(其长度最短可以为12bp,最长不限制)则真正蕴含了样本识别信息，其设计按以下原则(与上文中的6个筛选条件相对应)进行：

1.GC含量在0.4-0.6；

2.包含ATCG四种碱基；

3.相同碱基连续最多允许5个；

4.信息熵大于1.2；

5.不能比对到人基因组；

6.各编码序列之间的差异碱基数大于等于3。

以样本对应人体细胞相关为例，在实际应用中，可按照以上6条原则通过软件程序进行外参物编码序列设计，首先由程序自动随机生成16bp的核酸序列，接着按以上6条原则过滤掉不满足要求的序列，最后再次确认得到的外参物编码序列无法比对到人基因组。具体实施流程如下：

步骤1、随机生成16bp长度的DNA序列，每个位置可以有ATCG四种碱基；

步骤2、按如下规则过滤DNA序列，不满足以下6条规则中的任一规则即被过滤掉：

规则1：序列要包含ATCG四种碱基；

规则2：序列中最长的重复序列不超过5个重复；

规则3：序列的CG比例在(0.4,0.6)区间内；

规则4：序列的信息熵值要大于等于1.2；

规则5：将序列比对到人参考基因组(版本是hg19)，将可以比对人参考基因组的序列过滤掉，保留未比对到人参考基因组的序列；

规则6：计算序列之间的编辑距离(edit distance)，并根据编辑距离构建一个邻接矩阵，如果两个序列的距离大于等于3，将这两个序列标记为不邻接，如果两个序列的距离小于3，将这两个序列标记为邻接；

按如下步骤移除序列；

步骤a：计算每个序列的邻接度，也就是每个序列邻接的其他序列的数目；

步骤b：将序列按邻接度从大到小排序；

步骤c：移除排序后最上方的一个序列，也就是邻接度最大的一个序列；

重复a、b、c三个步骤直到每个序列的邻接度都是0；

步骤3、余下序列都可以作为潜在的内标物序列。

经验证，按以上步骤设计后，共得到外参物编码序列457种。

例如：其中一种外参物编码序列为：GCTCTTCCGATCTATCGTAGCTCTACTCAAGCGATCGAATATCCGATTGGA ACGAAAGATCGGAAGAGC；

其中，“GCTCTTCCGATCT”和“AGATCGGAAGAGC”为5’端及3’端引物结合序列，“ATCCGATTGGAACGAA”为16bp编码序列，“ATCGTAGCTC”为10bp暗反应序列。

如果要适配其它试剂盒使用，需对外参物编码序列的5’端及3’端的引物结合序列进行调整。例如，如果搭配ChromSwift试剂盒使用，则外参物编码序列变为：

GTGAGTGATGGTTGAGGTAGTGTGGAGATCGTAGCTCTACTCAAGC GATCGAATATCCGATTGGAACGAAGTGAGTGATGGTTGAGGTAGTGTGG AG；

其中，“GTGAGTGATGGTTGAGGTAGTGTGGAG”和“GTGAGTGATGGTTGAGGTAGTGTGGAG”分别为5’端及3’端引物结合序列，由13bp的ChromInst引物序列变为27bp的ChromSwift引物序列，剩余部分无需变更。

经实验验证外参物编码序列的最适浓度为1*10⁹copies/uL，最低检出限约为1*10⁷copies/uL。本申请外参物编码序列适用于华大、illumina等多种测序平台，SE55即可满足要求。样本2Mreads，测序错误率为0情况下，外参物编码序列reads数在几百至几千左右，既能区分不同样本又不会占用过多数据量。

确定了外参物编码序列之后，便可生成对应的外参物。具体如何基于编码序列生成该编码序列对应的DNA序列实物，可参照相关实现方案，在此不再一一赘述。

在本申请中的一种具体实施方式中，将样本与外参物混合，得到溯源样本，包括：

步骤一、将至少一种外参物加入样本保存液；

步骤二、将样本加入样本保存液，得到溯源样本；样本为细胞或核酸。

如图2所示，本申请外参物编码序列可在生产过程中直接加入到样本保存液中，样本保存液管身上带有外参物编码序列识别码，可与序列信息一一对应。

S102、获取溯源样本的DNA序列信息。

将样本与外参物混合之后，当需要对该样本进行溯源时，则可直接进行裂解、扩增、建库、纯化等一系列操作，操作步骤可详见ChromInst、Chromswift、ChromLong试剂盒说明书，在此不再一一赘述。

当然，也可以对用qPCR(QuantitativeReal-time，实时荧光定量)等方法获取到该溯源样本的DNA序列信息。

S103、从DNA序列信息中获取外参物DNA序列。

由于样本保存液中具有外参物，因而，该DNA序列信息中具有对应所添加的外参物DNA序列。当然，若存在样本间污染等情况，则该DNA序列信息中还有其他样本所添加的外参物所对应的外参物DNA序列。当然，为了便于区别，在容易出现污染的样本间，各自添加的外参物是不同的，且能够被区别的。

在本实施例中，可以预先将各个备选外参物的编码序列进行保存，当检出样本对应的DNA序列信息之后，便可通过比对，从而得到外参物DNA序列。DNA序列与本文中的编码序列对应。

S104、利用外参物DNA序列，对溯源样本进行溯源。

具体的，可以根据外参物对应的标签，从而读取到该外参物的编码序列。通过比对该外参物DNA序列与该编码序列，则可确定外参物DNA序列是否仅与外参物匹配。

在本申请中的一种具体实施方式中，利用外参物DNA序列，对溯源样本进行溯源，包括：

步骤一、判断外参物DNA序列是否仅与编码序列匹配；

步骤二、如果是，则确定溯源样本未污染；

步骤三、如果否，则确定溯源样本已污染。

为便于描述，下面将上述三个步骤结合起来进行说明。

在正常情况下，若样本仅外参物混合而未被污染的情况下，每个溯源样本内只会包含有所添加的外参物编码序列。

如果发现溯源样本对应的外参物DNA序列只包含所添加的外参物编码序列则表明样本正常无污染；即当外参物DNA序列仅与外参物匹配，则表明该外参物DNA序列仅属于该外参物。即可确定该溯源样本中无其他样本，即未被污染。

如果一个溯源样本中发现多种外参物编码序列，且存在不属于正常所添加的外参物对应的外参物编码序列，则表明发生了样本间污染，且可以通过序列信息溯源是哪几种样本混合造成了污染，也可对污染的比例进行大致估计。

也就是说，如果确定在确定溯源已污染之后，还可以利用外参物DNA序列，确定污染信息。具体的实施过程，包括：

步骤一、确定与外参物DNA序列匹配的目标外参物；

步骤二、查找外参物添加记录，确定混合有目标外参物的目标样本；

步骤三、将目标样本确定为污染源；

步骤四、从DNA序列信息中确定目标外参物对应的reads数，并利用reads数确定污染比例；

步骤五、将污染比例和污染源确定为污染信息。

为便于描述，下面将上述五个步骤结合起来进行说明。

当外参物DNA序列并非仅与外参物匹配，即外参物DNA序列与其他外参物匹配，或该外参物DNA序列不仅与外参物匹配还与其他外参物匹配，则说明溯源样本已污染。

由于外参物在正常情况下，都是额外加入的，因而可以基于该外参物DNA序列，得到污染信息。

在本申请中实施例中，可预先将所有可能的外参物的DNA序列进行存档，然后通过遍历外参物的DNA序列，则可以找出当前检出的外参物DNA序列对应匹配的目标外参物。

然后，基于外参物添加记录，则可明确该目标外参物对应的目标样本。基于目标样本中添加了目标外参物，而溯源样本中又检出了该目标外参物，则可确定溯源样本被目标样本污染，即可确定目标样本为污染源。

需要注意的是，在本实施例中，对目标外参物的数量以及目标样本的数量均无限制，即在实际应用中，溯源样本可能被一种或多种目标样本所污染，即溯源样本被污染的情况下，对应存在一种或多种污染源。

在明确了污染源之后，可以从DNA序列信息中确定目标外参物对应的reads数，并利用reads数确定污染比例。由于外参物在DNA测序过程中会同比增加，因而reads比例与污染比例大致成线性关系，如此，基于reads数可以确定出污染比例。

需要说明的是，基于上述实施例，本申请实施例还提供了相应的改进方案。在优选/改进实施例中涉及与上述实施例中相同步骤或相应步骤之间可相互参考，相应的有益效果也可相互参照，在本文的优选/改进实施例中不再一一赘述。

步骤一、查找外参物添加记录，确定与外参物混合的样本记录信息；

步骤二、将样本记录信息确定为样本的样本信息。

当对样本本身不明确其样本信息之后，并在明确其未被污染的情况下，则可直接查找外参物添加记录，从而确定添加该外参物的样本记录信息，从而将该样本记录信息确定为该溯源样本的样本信息。

例如，可在盛放该溯源样本的样本保存液管上贴上所加外参物的标签。当确定样本未被污染之后，可通过查找外参物添加记录，从而确定被加了该外参物的溯源样本是何样本，及其他样本信息(如采样时间、样本用途等)。

相应于上面的方法实施例，本申请实施例还提供了一种样本保存器皿，下文描述的样本保存器皿与上文描述的样本溯源方法可相互对应参照。

具体的，在本申请中，在样本保存器皿内置有样本保存液和外参物；

样本保存器皿具有标签；标签为外参物的编码序列识别码；编码序列识别码与外参物的DNA序列一一对应；

基于样本保存器皿，能够实现如上述样本溯源方法的步骤。

具体的，该样本保存器皿可以具体为样本保存液管，也可以为样本保存试剂盒，还可以为其他具有具体形态，在此不再一一列举。

为便于本领域技术人员更好地理解和实施本申请实施例所提供的技术方案，下面对相关实验进行举例说明。

从上文可知，在本申请中，基于外参物可以区分不同样本。具体的，验证不同外参物(或称之为内标物)是否可以区分不同样本的具体实验方法如下：

样本设置如表1：

表1

将12种新设计、合成的内标物与gDNA样本混合后一起进行ChromInst并pooling上机测序。

相应结果如下所示：

跑胶结果显示，13号样本(NC)也可见较淡产物抹带，其余样本结果正常。详情可参见图4所示胶图。

Qubit结果显示，各内标物对样本扩增的影响无明显差别，13号(NC)浓度偏高。

其中，如表2所示，12种内标物均可正确比对，且无法比对到人基因组。

如上述样本3结果为例。

表2

其中，raw-reads：根据index分到的原始reads数；clean-reads：滤除低质量序列后的reads数；matched-reads：比对到内标物序列的reads数；mapped-reads：比对到人基因组的reads数；pattern：内标物种类；error-num：测序碱基错误数。

由此可见，12种内标物均可区分不同样本，且内标物序列不会比对到人基因组。

从上文可知，在本申请中，基于外参物可识别样本污染。具体的，验证内标物是否可以识别样本污染的实验方法如下：

样本设置如表3,将marker-1和marker-2按不同比例与gDNA混合，随后一同进行ChromInst并pooling上机测序。

表3

实验结果：如图5所示跑胶结果显示，8号样本(NC)无抹带，其余样本条带正常。Qubit结果显示，各样本浓度正常且差别不大，8号(NC)浓度符合预期。

10：1比例的污染即可产生可观的reads数，污染比例与reads数有大致的比例关系。结果如表4。

表4

由此可见，本申请所提供的方法可提示低至10：1比例的样本污染。

相应于上面的方法实施例，本申请实施例还提供了一种电子设备，下文描述的一种电子设备与上文描述的一种样本溯源方法可相互对应参照。

参见图6所示，该电子设备包括：

存储器332，用于存储计算机程序；

处理器322，用于执行计算机程序时实现上述方法实施例的样本溯源方法的步骤。

具体的，请参考图7，图7为本实施例提供的一种电子设备的具体结构示意图，该电子设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(centralprocessing units，CPU)322(例如，一个或一个以上处理器)和存储器332，存储器332存储有一个或一个以上的计算机应用程序342或数据344。其中，存储器332可以是短暂存储或持久存储。存储在存储器332的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地，中央处理器322可以设置为与存储器332通信，在电子设备301上执行存储器332中的一系列指令操作。

电子设备301还可以包括一个或一个以上电源326，一个或一个以上有线或无线网络接口350，一个或一个以上输入输出接口358，和/或，一个或一个以上操作系统341。

上文所描述的样本溯源方法中的步骤可以由电子设备的结构实现。

相应于上面的方法实施例，本申请实施例还提供了一种可读存储介质，下文描述的一种可读存储介质与上文描述的一种样本溯源方法可相互对应参照。

一种可读存储介质，可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述方法实施例的样本溯源方法的步骤。

该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似部分互相参见即可。对于实施例公开的样本保存器皿而言，由于其与实施例公开的方法相结合，所以描述的比较简单，相关之处参见方法部分说明即可。

本领域技术人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应该认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语包括、包含或者其他任何变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上，本说明书内容不应理解为对本申请的限制。

Claims

1.一种样本溯源方法，其特征在于，包括：

获取所述溯源样本的DNA序列信息；

从所述DNA序列信息中获取外参物DNA序列；

利用所述外参物DNA序列，对所述溯源样本进行溯源。

2.根据权利要求1所述的样本溯源方法，其特征在于，利用所述外参物DNA序列，对所述溯源样本进行溯源，包括：

判断所述外参物DNA序列是否仅与所述编码序列匹配；

如果是，则确定所述溯源样本未污染；

如果否，则确定所述溯源样本已污染。

3.根据权利要求2所述的样本溯源方法，其特征在于，在确定所述溯源样本已污染之后，还包括：

利用所述外参物DNA序列，确定污染信息。

4.根据权利要求3所述的样本溯源方法，其特征在于，利用所述外参物DNA序列，确定污染信息，包括：

确定与所述外参物DNA序列匹配的目标外参物；

将所述目标样本确定为污染源；

将所述污染比例和所述污染源确定为所述污染信息。

5.根据权利要求1所述的样本溯源方法，其特征在于，利用所述外参物DNA序列，对所述溯源样本进行溯源，包括：

将所述样本记录信息确定为所述样本的样本信息。

6.根据权利要求1所述的样本溯源方法，其特征在于，将样本与外参物混合，得到溯源样本，包括：

将至少一种所述外参物加入样本保存液；

7.根据权利要求1至6任一项所述的样本溯源方法，其特征在于，生成所述外参物的过程，包括：

构建所述外参物DNA序列；

基于所述外参物DNA序列生成所述外参物。

8.根据权利要求7所述的样本溯源方法，其特征在于，所述构建所述外参物DNA序列，包括：

分别构建引物互补序列、起始点位序列和所述编码序列；

9.根据权利要求8所述的样本溯源方法，其特征在于，在基于所述外参物DNA序列生成所述外参物之前，还包括：

构建项目号序列和/或暗反应区序列；

10.根据权利要求8所述的样本溯源方法，其特征在于，构建所述编码序列，包括：

随机生成若干个指定长度的DNA序列；

其中，所述筛选条件包括：

具有ATCG四种碱基；

相同碱基连续数量小于等指定连续数值；

CG比例符合指定比例区间；

序列信息熵值大于指定熵值；

需无法与待标记溯源的样本序列匹配；

按照编辑距离去除邻接序列。

11.一种样本保存器皿，其特征在于，包括：

在所述样本保存器皿内置有样本保存液和外参物；

所述样本保存器皿具有标签；所述标签为所述外参物的编码序列识别码；所述编码序列识别码与所述外参物的DNA序列一一对应；基于所述样本保存器皿，能够实现如权利要求1至10任一项所述样本溯源方法的步骤。

12.一种电子设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至10任一项所述样本溯源方法的步骤。

13.一种可读存储介质，其特征在于，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至13任一项所述样本溯源方法的步骤。