具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
本发明提出第一典型实施例,一种SNP分型方法,包括以下步骤:
A.将含待测SNP位点的核酸片段可寻址的固定在固相载体上;
B.对固定在固相载体上的含待测SNP位点的核酸片段进行测序,进而确定待测SNP位点的基因型;
所述含待测SNP位点的核酸片段是通过非单分子扩增获得的产物。
需要说明的是:
所述单分子扩增是指在扩增开始前,各模板分子以极微量甚至单分子的形式在空间上隔离(但这些模板分子整体上还是属于同一个反应体系),并且在各自的空间内实现扩增的方法,例如:乳液PCR、桥式PCR、乳液桥式PCR。
所述非单分子扩增是指在进行扩增时,各模板分子在同一个反应体系中进行扩增,且相互之间并未发生空间上的隔离,包括但不限于:普通PCR扩增、RT-PCR、多重PCR、不对称PCR、固相PCR、原位PCR、反转录PCR、巢式PCR、兼并引物PCR、免疫PCR、反向PCR和递减PCR等。
本发明所述步骤B中的测序方法可为第二代高通量基因测序技术,包括但不限于连接测序法或合成测序法。
所述连接测序法是基于连接酶在核酸片段之间进行连接反应的过程中的保真性来实现的,以待测序核酸片段为模板,锚定引物(又称测序引物,其与待测序核酸片段所在链互补)和寡核苷酸探针(该探针的特定位置上带有荧光标记)进行连接反应,通过检测连接产物上的荧光标记从而确定寡核苷酸探针上带有荧光标记的特定位置对应的序列的信息。目前,市场上常见的连接测序法有多种,包括但不限于:深圳华因康基因科技有限公司的Pstar连接测序法、ABI公司的连接测序法、Complete Genomics公司的连接测序法。
所述合成测序法是基于聚合酶在延伸核酸链过程中的保真性来实现的,以待测序核酸片段为模板,锚定引物(又称测序引物,其与待测序核酸片段所在链互补)互补结合至待测序核酸片段上,通过检测在延伸过程中产生的信号来确定待测序核酸片段上相应位置的序列信息。目前,市场上常见的合成测序法有多种,包括但不限于:Illumina公司的Solexa合成测序法、Roche公司的454合成测序法、Life Technologies公司的Ion torrent、Ion Proton合成测序法。
上述常见的测序方法的通量均在GB以上,能够同时对成百上千甚至上万个样本的成百上千甚至上万个SNP位点进行检测,且准确度均在99.9%以上。
所述可寻址的固定,是指能够确定位置信息的固定。即,固定载体上每一具体位置上所固定的含待测SNP位点的核酸片段与其它具体位置上所固定的含待测SNP位点的核酸片段是能够明确区分的。
本实施例中,非单分子扩增获得的产物(含待测SNP位点的核酸片段)可寻址的固定在固相载体上,然后通过测序反应测定非单分子扩增获得的产物中的SNP位点信息,避免了现有技术中基于芯片技术的SNP分型方法中不同探针之间的相互干扰,SNP位点的检测通量和准确性仅受限于所采用的测序技术,大大的提高了对SNP位点进行检测的通量;与现有技术相比,还能同时保证准确性保持在一个较高的水平,不因通量的增加而急剧下降。此外,与通过对单分子扩增产物进行测序获得SNP位点序列信息相比,非单分子扩增方法无需特殊的前处理步骤,更简单,且扩增效率更高、更快速(循环数更少),能够显著的提高SNP分型方法的效率。
优选的,所述非单分子扩增为普通PCR扩增、多重PCR、不对称PCR和巢式PCR。
其中,普通PCR扩增设计最为简单,扩增条件宽松,只需要通过简单的设计即可实现本发明;多重PCR可一次性扩增多个核酸片段,即可同时扩增多个不同的待测SNP位点,能显著提高扩增效率;不对称PCR能够实现待测SNP位点靶链的大量单链扩增;巢式PCR能够显著提高扩增的特异性,得到高质量的扩增产物,保证后续待测SNP位点检测的正确性。
其中,含待测SNP位点的核酸片段可通过直接或间接的方式可寻址的固定在固相载体上。
针对通过间接的方式实现含待测SNP位点的核酸片段的可寻址固定,本发明提出第一实施例:含待测SNP位点的核酸片段先固定在微球上,然后再将微球固定在固相载体上,从而实现含待测SNP位点的核酸片段的可寻址固定。
进一步的,所述步骤A包括以下步骤:
A1、利用特异性引物对对待测样本进行非单分子扩增,得含待测SNP位点的核酸片段;
A2、将含待测SNP位点的核酸片段固定在微球上,然后将微球可寻址的固定在固相载体上。
需要说明的是:
所述待测样本为含核酸的任意形式的样品,包括但不限于经纯化后的DNA、cDNA或RNA(包括但不限于mRNA和rRNA),或是含有核酸的石蜡包埋组织、全血、血清、血浆或细胞。
所述特异性引物对为用于扩增含待测SNP位点的核酸片段的PCR引物。
上述实施例中,所述步骤A2中含待测SNP位点的核酸片段同样可通过直接或间接的方式固定在微球上。
针对所述步骤A2中含待测SNP位点的核酸片段通过间接方式固定在微球上,本发明提出,提出第二实施例,所述步骤A2包括以下步骤:
A21、将含待测SNP位点的核酸片段与接头连接,得连接产物;
A22、将连接产物固定在微球上,然后将微球可寻址的固定在固相载体上。
针对所述步骤A2中含待测SNP位点的核酸片段直接固定在微球上的方法,本发明提出,提出第三实施例,所述步骤A2包括以下步骤:
A21、将含待测SNP位点的核酸片段与固定在微球上的接头连接,得被固定在微球上的连接产物;
A22、将固定有连接产物的微球可寻址的固定在固相载体上。
需要说明的是,在第二实施例和第三实施例中,所述接头上含有修饰标记,用于使其固定在微球上。
所述接头可采用多种形式,包括但不限于平末端接头、突出末端接头、分叉接头或含茎环结构的接头。
所述平末端接头是指双链之间完全互补配对的双链核酸接头。优选的,所述平末端接头的两条链的5’末端均不含磷酸基团,其可避免连接过程中接头自连现象的出现,减少对后续测序实验的干扰,提高SNP分型检测的准确率。
所述突出末端接头,是指双链核酸分子中的至少一端带有突出核苷酸序列,而其余核苷酸则完全互补的双链核酸接头。突出末端接头可为单突出末端(图1),也可以是含有两个突出末端的双突出末端,这两个突出末端可在一条核苷酸链上(图2a)或在不同的核苷酸链上(图2b)。所述突出末端接头能够避免连接过程中接头自连现象的出现,减少对后续测序实验的干扰,提高SNP分型检测的准确率。在本实施例的具体实施方式中,所述接头优选为单突出末端接头,且该突出末端为其所在链的3’末端,碱基为T;该接头能够与通过Taq酶扩增的含A尾的PCR扩增产物直接连接,提高连接效率。
所述分叉型接头包括互补区和分叉区,其基本结构如图3所示,互补区双链的核苷酸互补配对,配对的核苷酸对数不限。互补区末端可为平末端或突出末端。所述分叉型接头能够避免连接过程中接头自连现象的出现,减少对后续测序实验的干扰,提高SNP分型检测的准确率。在本实施例的具体实施方式中,所述接头优选为互补区的3’末端为突出末端,且突出末端最后一个碱基为T的T末端分叉接头;该接头能够与通过Taq酶扩增的含A尾的PCR扩增产物直接连接,提高连接效率。
所述带茎环结构的接头,如图4所示。该接头为单链核酸分子,该单链核酸分子包括第一互补配对区1、茎环区2和第二互补配对区3(图4a),第一互补配对区1能够与第二互补配对区3互补配对。如图4b所示,带茎环结构的接头还可带有突出末端4,该突出末端可位于单链核酸分子的3’端。突出末端4的存在能够防止接头自连现象的发生,减少对后续测序实验的干扰,提高SNP分型检测的准确率。该突出末端优选为T;该接头能够与通过Taq酶扩增的含A尾的PCR扩增产物直接连接,提高连接效率。
所述修饰标记可为生物素、亲和素、链霉亲和素、抗原、抗体、受体、配体、多聚组氨酸、纳米金、碘乙酰、巯基、氨基、醛基、羧基、异硫氰基、硅烷基或丙烯酰胺,它们均能特异性的与相对应的基团或分子结合。
与第二实施例相比,第三实施例中的接头被预先固定在微球上,减少了连接产物与微球连接的步骤,实验效率更高。固定有接头的微球的密度可能会与连接反应中的其他成分的密度不同,因此,在连接过程中,使整个连接反应体系周期性震荡,可有效提高固定在微球上的接头与含待测SNP位点的核酸片段的连接效率,避免连接反应体系中各成分分层而引起的连接效率低现象的出现。
针对含待测SNP位点的核酸片段的间接固定,本发明又提出第四实施例,所述步骤A包括以下步骤:
A1、利用特异性引物对对待测样本进行非单分子扩增,得固定有含待测SNP位点的核酸片段的微球;所述特异性引物对中仅有一种引物被预先固定在微球上;
A2、将固定有含待测SNP位点的核酸片段的微球可寻址的固定在固相载体上。
本实施例中通过将特异性引物对中的一种引物预先固定在微球上,使得含待测SNP位点的核酸片段在被扩增的同时直接固定在微球上,可直接进一步的进行可寻址固定,简化了实验步骤,提高了实验效率,同时微球的存在使得纯化扩增产物更为快速、便捷,效率高。如果,固定有引物的微球的密度往往会与扩增反应中的其他成分的密度不同,在扩增反应过程中,可使整个扩增反应体系周期性震荡,以有效提高扩增效率。
针对通过直接的方式实现含待测SNP位点的核酸片段的可寻址固定,本发明提出第五实施例,所述步骤A具体如下:
利用特异性引物对对待测样本进行非单分子扩增,从而将含待测SNP位点的核酸片段可寻址的固定在固相载体上;所述特异性引物对中的一种引物被预先固定在固相载体上。
需要说明的是,本方案通过预先将特异性引物对中的一种引物固定在固相载体上,只通过一步反应即实现了含待测SNP位点的核酸片段的扩增和固定,实验步骤简单,实验效率高。
在上述实施例中,当步骤B中对待测SNP位点进行测序反应时,对应的锚定引物一般可如图5所示,设计为:
a、接头中的一段序列;或
b、特异性引物对中的一段序列;或
c、特异性引物对中的一段序列的互补序列;或
d、接头的3’端的部分序列与特异性引物对中与之相连的5’端的部分序列;或
e、接头的3’端的部分序列与特异性引物对中与之相连的5’端的部分序列所组成的核酸链的互补序列;或
f、待测SNP位点所在位置的3’端的互补序列;或
g、待测SNP位点所在位置的5’端的互补序列。
其中,a、d、e方案适用于含待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案;b、c、f、g适用于所有的技术方案。
在含待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案中,当将锚定引物设计成接头中的一段序列时,为了避免接头序列对所述步骤B中测序反应的干扰,可使接头仅与含待测SNP位点的核酸片段的一端连接。为实现上述目的,优选的,所述特异性引物对中仅有一种引物(上游引物或下游引物)的5’端含有磷酸基团。更优选的,所述特异性引物对中仅将用于扩出待测SNP位点所在链的引物的5’端设计成含有磷酸基团的引物。
本发明可对多个SNP位点、多个样本或多个SNP位点和多个样本同时进行检测。
针对多个SNP位点的同时检测,本发明在第一典型实施例的基础上提出第二典型实施例,一种SNP分型方法,包括以下步骤:
A.将多种含不同待测SNP位点的核酸片段分别可寻址的固定在固相载体上;
B.对固定在固相载体上的含待测SNP位点的核酸片段进行测序,进而确定不同待测SNP位点各自的基因型;
所述多种含不同待测SNP位点的核酸片段均是通过非单分子扩增获得的产物。优选的,所述多种含不同待测SNP位点的核酸片段均连有第一标签序列;所述标签序列用于识别待测SNP位点的类型。
需要说明的是,所述可寻址的固定,是指能够确定位置信息的固定。所述分别可寻址的固定在固相载体上,是指在每一个具体位置上所固定的含待测SNP位点的核酸片段的种类是相同。即,固定载体上每一具体位置上所固定的含待测SNP位点的核酸片段的种类是能够确定的。
本实施例避免了现有技术中基于芯片技术的SNP分型方法中不同探针之间的相互干扰,SNP位点的检测通量和准确性仅受限于所采用的测序技术,大大的提高了对SNP位点进行检测的通量;与现有技术相比,还能同时保证准确性保持在一个较高的水平,不因通量的增加而急剧下降。此外,与通过对单分子扩增产物进行测序获得SNP位点序列信息相比,非单分子扩增方法无需特殊的前处理步骤,更简单,且扩增效率更高、更快速(循环数更少),能够显著的提高SNP分型方法的效率。
所述含待测SNP位点的核酸片段所连有的第一标签序列可以是在非单分子扩增过程中获得的,也可以是在所述步骤A的可寻址固定过程中获得。
针对所述含待测SNP位点的核酸片段所连有的第一标签序列是在非单分子扩增过程中获得的,本发明提出第六实施例,所述步骤A包括以下步骤:
A1、利用多种特异性引物对分别对待测样本进行非单分子扩增,得含不同待测SNP位点的核酸片段;
A2、将含不同待测SNP位点的核酸片段分别固定在微球上,然后将微球可寻址的固定在固相载体上;
所述多种特异性引物对均含有第一标签序列;所述第一标签序列用于识别待测SNP位点的类型。
需要说明的是:
所述待测样本为含核酸的任意形式的样品,包括但不限于经纯化后的DNA、cDNA或RNA(包括但不限于mRNA和rRNA),或是含有核酸的石蜡包埋组织、全血、血清、血浆或细胞。
所述多种特异性引物对为分别用于扩增含不同的待测SNP位点的核酸片段的PCR引物。
所述第一标签序列可设置在每个特异性引物对中的至少一种引物上。
通过上述设计,在步骤B中增加一个检测第一标签序列的步骤,即可实现对同一样本的不同SNP位点的同时检测,提高检测效率。
优选的,所述第一标签序列位于每个特异性引物对中的用于扩增待测SNP位点所在链的引物上。这样,在步骤B中的测序过程中,仅需锚定引物互补至对待测SNP位点所在链上进行测序反应,即可实现对待测SNP位点和标签序列的检测,进而确定不同待测样本来源的SNP位点的基因型;本方案还能减少后续数据处理过程中的步骤,例如:当第一标签序列位于待测SNP位点所在链的互补链时,步骤B中的测序反应获得的就是第一标签序列的互补序列,这样在后续的数据处理过程中就必须对这一部分数据进行转换。
更优选的,所述第一标签序列在其所在引物的5’端。
针对所述含待测SNP位点的核酸片段所连有的标签序列是在非单分子扩增过程中获得的,本发明又提出第七实施例,所述步骤A包括以下步骤:
A1、利用多种特异性引物对分别对待测样本进行非单分子扩增,得多种含不同待测SNP位点的核酸片段的微球;
A2、将多种含不同待测SNP位点的核酸片段的微球可寻址的固定在固相载体上;
所述多种特异性引物对含有第一标签序列,且所述多种特异性引物对中分别仅有一种引物被预先固定在微球上;所述第一标签序列分别被包含在各特异性引物对中的至少一种引物上,用于识别待测SNP位点的类型。
通过上述设计,在步骤B中增加一个检测第一标签序列的步骤,即可实现对同一样本的不同SNP位点的同时检测,提高检测效率。
优选的,所述第一标签序列位于每个特异性引物对中的用于扩增待测SNP位点所在链的引物上。这样,在步骤B中的测序过程中,仅需锚定引物互补至对待测SNP位点所在链上进行测序反应,即可实现对待测SNP位点和标签序列的检测,进而确定不同待测样本来源的SNP位点的基因型;本方案还能减少后续数据处理过程中的步骤,例如:当第一标签序列位于待测SNP位点所在链的互补链时,步骤B中的测序反应获得的就是第一标签序列的互补序列,这样在后续的数据处理过程中就必须对这一部分数据进行转换。
与第六实施例相比,本实施例中通过分别将各特异性引物对中的一种引物预先固定在微球上,使得含待测SNP位点的核酸片段在被扩增的同时直接固定在微球上,可直接进一步的进行可寻址固定,简化了实验步骤,提高了实验效率,同时微球的存在使得纯化扩增产物更为快速、便捷,效率高。此外,固定有引物的微球的密度可能会与扩增反应中的其他成分的密度不同,因此,在扩增反应过程中,可使整个扩增反应体系周期性震荡,以有效提高扩增效率。
针对所述含待测SNP位点的核酸片段所连有的第一标签序列是在所述步骤A的可寻址固定过程中获得,优选在连接接头的时候,通过带有标签序列的接头获得。本发明分别在第二、三实施例的基础上进行了进一步的改进,分别得第八、九实施例,具体如下所述。
在第七实施例中,所述步骤A2包括以下步骤:
A21、将含不同待测SNP位点的核酸片段分别与不同的接头连接,得多种连接产物;
A22、将多种连接产物分别固定在微球上,然后将微球可寻址的固定在固相载体上。
需要说明的是,本实施例中,所述不同的接头均含有修饰标记和第一标签序列;所述不同的接头之间的不同之处优选仅在于第一标签序列的不同;所述修饰标记,用于使其所在接头能被固定在微球上;所述第一标签序列用于识别不同的待测SNP位点类型。这样在步骤B中增加一个检测第一标签序列的步骤,同样可以实现对同一样本的多个SNP位点的同时检测,提高检测效率。
在第九实施例中,所述步骤A2包括以下步骤:
A21、将含不同待测SNP位点的核酸片段分别与不同的固定在微球上的接头连接,得多种被固定在微球上的连接产物;
A22、将多种固定有连接产物的微球可寻址的固定在固相载体上。
需要说明的是,本实施例中,所述不同的固定在微球上的接头均含有修饰标记和第一标签序列;所述不同的固定在微球上的接头之间的不同之处优选仅在于第一标签序列的不同;所述修饰标记,用于使其所在接头能被固定在微球上;所述第一标签序列用于识别待测SNP位点的类型。这样在步骤B中增加一个检测第一标签序列的步骤,同样可以实现对同一样本的多个SNP位点的同时检测,提高检测效率。
与第八实施例相比,第九实施例中的接头被预先固定在微球上,减少了连接产物与微球连接的步骤,实验效率更高。固定有接头的微球的密度可能会与连接反应中的其他成分的密度不同,因此,在连接过程中,使整个连接反应体系周期性震荡,可有效提高固定在微球上的接头与含待测SNP位点的核酸片段的连接效率,避免连接反应体系中各成分分层而引起的连接效率低现象的出现。
在第八实施例和第九实施例中,所述接头同前述一样,可采用多种形式,包括但不限于平末端接头、突出末端接头、分叉接头或含茎环结构的接头,在此不再赘述。不过需要特别指出的是,针对含不同待测SNP位点的核酸片段,所采用的接头可以是相同或不同的。这使得本方案的适用范围广,能够针对各种实际情况的不同,包括但不限于:待测样本的不同、含待测SNP位点的核酸片段的具体序列的不同,采用不同的技术方案,以实现最优配置。
针对通过直接的方式实现含待测SNP位点的核酸片段的可寻址固定,本发明提出第十实施例,所述步骤A具体如下:
利用多种特异性引物对对待测样本进行非单分子扩增,从而将含待测SNP位点的核酸片段可寻址的固定在固相载体上;所述每种特异性引物对中的一种引物被预先固定在固相载体上,且该引物上含有第一标签序列。
需要说明的是,本方案通过预先将特异性引物对中的一种引物固定在固相载体上,只通过一步反应即实现了含待测SNP位点的核酸片段的扩增和固定,实验步骤简单,实验效率高。
优选的,所述第一标签序列位于其所在引物的5’端。本方案降低了对非单分子扩增反应中引物设计的难度,减少了对非单分子扩增的影响。
在上述实施例中,当步骤B中对多个不同待测SNP位点进行测序反应时,对应的锚定引物一般可如图5所示,设计为:
a、接头中的一段序列;或
b、各特异性引物对中的一段序列;或
c、各特异性引物对中的一段序列的互补序列;或
d、接头的3’端的部分序列与各特异性引物对中与之相连的5’端的部分序列;或
e、接头的3’端的部分序列与各特异性引物对中与之相连的5’端的部分序列所组成的核酸链的互补序列;或
f、各待测SNP位点所在位置的3’端的互补序列;或
g、各待测SNP位点所在位置的5’端的互补序列。
其中,a、d、e方案适用于含待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案;b、c、f、g适用于所有的技术方案。
在各含待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案中,当将锚定引物设计成接头中的一段序列时,为了避免接头序列对所述步骤B中测序反应的干扰,可使接头仅与各含待测SNP位点的核酸片段的一端连接。为实现上述目的,优选的,所述多种特异性引物对中均仅有一种引物(上游引物或下游引物)的5’端含有磷酸基团。更优选的,所述多种特异性引物对中均仅将用于扩出待测SNP位点所在链的引物的5’端设计成含有磷酸基团的引物。
针对多样本的SNP位点检测,本发明在第一典型实施例的基础上提出第三典型实施例,一种SNP分型方法,包括以下步骤:
A.将不同待测样本来源的含待测SNP位点的核酸片段分别可寻址的固定在固相载体上;
B.对固定在固相载体上的含待测SNP位点的核酸片段进行测序,进而确定不同待测样本来源的待测SNP位点的基因型;
所述不同待测样本来源的含待测SNP位点的核酸片段均是通过非单分子扩增获得的产物,它们均连有标签序列;所述标签序列用于识别不同的待测样本。
需要说明的是,所述可寻址的固定,是指能够确定位置信息的固定。所述分别可寻址的固定在固相载体上,进一步指在每一个具体位置上所固定的含待测SNP位点的核酸片段的样本来源是相同。即,固定载体上每一具体位置上所固定的含待测SNP位点的核酸片段的样本来源是能够确定的。
本实施例避免了现有技术中基于芯片技术的SNP分型方法中不同探针之间的相互干扰,SNP位点的检测通量和准确性仅受限于所采用的测序技术,大大的提高了对SNP位点进行检测的通量;与现有技术相比,还能同时保证准确性保持在一个较高的水平,不因通量的增加而急剧下降。此外,与通过对单分子扩增产物进行测序获得SNP位点序列信息相比,非单分子扩增方法无需特殊的前处理步骤,更简单,且扩增效率更高、更快速(循环数更少),能够显著的提高SNP分型方法的效率。
所述含待测SNP位点的核酸片段所连有的标签序列可以是在非单分子扩增过程中获得的,也可以是在所述步骤A的可寻址固定过程中获得。
针对所述含待测SNP位点的核酸片段所连有的标签序列是在非单分子扩增过程中获得的,本发明提出第十一实施例,所述步骤A包括以下步骤:
A1、利用多种特异性引物对分别对不同的待测样本进行非单分子扩增,得不同待测样本来源的含待测SNP位点的核酸片段;
A2、将不同待测样本来源的含待测SNP位点的核酸片段分别固定在微球上,然后将微球可寻址的固定在固相载体上;
所述多种特异性引物对均含有第二标签序列,不同之处仅在于第二标签序列的不同;所述第二标签序列用于识别不同的待测样本。
需要说明的是:
所述待测样本为含核酸的任意形式的样品,包括但不限于经纯化后的DNA、cDNA或RNA(包括但不限于mRNA和rRNA),或是含有核酸的石蜡包埋组织、全血、血清、血浆或细胞。
所述特异性引物对为用于扩增含待测SNP位点的核酸片段的PCR引物。
所述第二标签序列可设置在每个特异性引物对中的至少一种引物上。
通过上述设计,在步骤B中增加一个检测第二标签序列的步骤,即可实现对多个样本的同一SNP位点的同时检测,提高检测效率。
优选的,所述第二标签序列位于每个特异性引物对中的用于扩增待测SNP位点所在链的引物上。这样,在步骤B中的测序过程中,仅需锚定引物互补至对待测SNP位点所在链上进行测序反应,即可实现对待测SNP位点和标签序列的检测,进而确定不同待测样本来源的SNP位点的基因型;本方案还能减少后续数据处理过程中的步骤,例如:当第二标签序列位于待测SNP位点所在链的互补链时,步骤B中的测序反应获得的就是第二标签序列的互补序列,这样在后续的数据处理过程中就必须对这一部分数据进行转换。
更优选的,所述第二标签序列在其所在引物的5’端。
针对所述含待测SNP位点的核酸片段所连有的标签序列是在非单分子扩增过程中获得的,本发明又提出了第十二实施例,所述步骤A包括以下步骤:
A1、利用多种特异性引物对分别对各待测样本进行非单分子扩增,得多种固定有含待测SNP位点的核酸片段的微球;
A2、将多种固定有含待测SNP位点的核酸片段的微球可寻址的固定在固相载体上;
所述多种特异性引物对含有第二标签序列,不同之处仅在于第二标签序列的不同,且所述多种特异性引物对中分别仅有一种引物被预先固定在微球上;所述第二标签序列分别被包含在各特异性引物对中的至少一种引物上,用于识别不同的待测样本。
通过上述设计,在步骤B中增加一个检测第二标签序列的步骤,即可实现对多个样本的同时检测,提高检测效率。
优选的,所述第二标签序列位于每个特异性引物对中的用于扩增待测SNP位点所在链的引物上。这样,在步骤B中的测序过程中,仅需锚定引物互补至对待测SNP位点所在链上进行测序反应,即可实现对待测SNP位点和标签序列的检测,进而确定不同待测样本来源的SNP位点的基因型;本方案还能减少后续数据处理过程中的步骤,例如:当第二标签序列位于待测SNP位点所在链的互补链时,步骤B中的测序反应获得的就是第二标签序列的互补序列,这样在后续的数据处理过程中就必须对这一部分数据进行转换。
与第十一实施例相比,本实施例中通过分别将各特异性引物对中的一种引物预先固定在微球上,使得含待测SNP位点的核酸片段在被扩增的同时直接固定在微球上,可直接进一步的进行可寻址固定,简化了实验步骤,提高了实验效率,同时微球的存在使得纯化扩增产物更为快速、便捷,效率高。此外,固定有引物的微球的密度可能会与扩增反应中的其他成分的密度不同,因此,在扩增反应过程中,可使整个扩增反应体系周期性震荡,以有效提高扩增效率。
针对所述含待测SNP位点的核酸片段所连有的标签序列是在所述步骤A的可寻址固定过程中获得,优选在连接接头的时候,通过带有标签序列的接头获得。本发明分别在第二、三实施例的基础上进行了进一步的改进,分别得第十三、十四实施例,具体如下所述。
在第十三实施例中,所述步骤A2包括以下步骤:
A21、将不同待测样本来源的含待测SNP位点的核酸片段分别与不同的接头连接,得多种连接产物;
A22、将多种连接产物分别固定在微球上,然后将微球可寻址的固定在固相载体上。
需要说明的是,本实施例中,所述不同的接头均含有修饰标记和第二标签序列;所述不同的接头之间的不同之处优选仅在于第二标签序列的不同;所述修饰标记,用于使其所在接头能被固定在微球上;所述第二标签序列用于识别不同的待测样本。这样在步骤B中增加一个检测第二标签序列的步骤,同样可以实现对多个样本的同时检测,提高检测效率。
在第十四实施例中,所述步骤A2包括以下步骤:
A21、将不同待测样本来源的含待测SNP位点的核酸片段分别与不同的固定在微球上的接头连接,得多种被固定在微球上的连接产物;
A22、将多种固定有连接产物的微球可寻址的固定在固相载体上。
需要说明的是,本实施例中,所述不同的固定在微球上的接头均含有修饰标记和第二标签序列;所述不同的固定在微球上的接头之间的不同之处优选仅在于第二标签序列的不同;所述修饰标记,用于使其所在接头能被固定在微球上;所述第二标签序列用于识别不同的待测样本。这样在步骤B中增加一个检测第二标签序列的步骤,同样可以实现对多个样本的同时检测,提高检测效率。
与第十三实施例相比,第十四实施例中的接头被预先固定在微球上,减少了连接产物与微球连接的步骤,实验效率更高。固定有接头的微球的密度可能会与连接反应中的其他成分的密度不同,因此,在连接过程中,使整个连接反应体系周期性震荡,可有效提高固定在微球上的接头与含待测SNP位点的核酸片段的连接效率,避免连接反应体系中各成分分层而引起的连接效率低现象的出现。
在第十三实施例和第十四实施例中,所述接头同前述一样,可采用多种形式,包括但不限于平末端接头、突出末端接头、分叉接头或含茎环结构的接头,在此不再赘述。不过需要特别指出的是,针对不同的样本来源的含待测SNP位点的核酸片段,所采用的接头可以是相同或不同的。这使得本方案的适用范围广,能够针对各种实际情况的不同,包括但不限于:待测样本的不同、含待测SNP位点的核酸片段的具体序列的不同,采用不同的技术方案,以实现最优配置。
其中,不同待测样本来源的含待测SNP位点的核酸片段同样可通过直接或间接的方式可寻址的固定在固相载体上。
进一步的,不同待测样本来源的含待测SNP位点的核酸片段可分别固定在微球上,然后再固定在同一固相载体上,从而实现不同待测样本来源的含待测SNP位点的核酸片段的可寻址固定。
针对不同待测样本来源的含待测SNP位点的核酸片段的间接固定,本发明已在上述的第十一至十四实施例中进行了一定的阐述,在此不再赘述。
针对不同待测样本来源的含待测SNP位点的核酸片段的直接固定,本发明提出第十五实施例,所述步骤A具体如下:
利用特异性引物对对待测样本进行非单分子扩增,从而将含待测SNP位点的核酸片段可寻址的固定在固相载体上;所述特异性引物对中有一种引物上含有标记基团,所述标记基团用于使其固定在固相载体上。
需要说明的是,本方案通过在各种特异性引物对中设置含有标记基团的引物,使得扩增产物中含有标记基团,进而通过该标记基团固定在固相载体上,实验步骤简单,实验效率高。
优选的,特异性引物对中的标记基团位于引物的5’端。所述标记基团可为生物素、亲和素、链霉亲和素、纳米金、碘乙酰、巯基、氨基、醛基、羧基、异硫氰基、硅烷基或丙烯酰胺。
优选的,所述特异性引物对中的一种引物被预先固定在固相载体上。
更优选的,所述种特异性引物对有多种,它们均含有第二标签序列;所述第二标签序列用于识别待测SNP位点的类型,所述第二标签序列位于标记基团所在的引物上。
本方案通过预先分别将多种特异性引物对中的含标记基团的引物分别可寻址固定在固相载体上,然后只通过一步反应即实现了含待测SNP位点的核酸片段的扩增和固定,实验步骤简单,实验效率高,且本方案可不仅仅通过对固相载体进行物理分区实现可寻址的固定,还可通过第二标签序列验证,提高检测的准确性。
在上述实施例中,当步骤B中对多个样本的待测SNP位点进行测序反应时,对应的锚定引物一般可如图5所示,设计为:
a、接头中的一段序列;或
b、各特异性引物对中的一段序列;或
c、各特异性引物对中的一段序列的互补序列;或
d、接头的3’端的部分序列与各特异性引物对中与之相连的5’端的部分序列;或
e、接头的3’端的部分序列与各特异性引物对中与之相连的5’端的部分序列所组成的核酸链的互补序列;或
f、各待测SNP位点所在位置的3’端的互补序列;或
g、各待测SNP位点所在位置的5’端的互补序列。
其中,a、d、e方案适用于含待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案;b、c、f、g适用于所有的技术方案。
在不同样本来源的含待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案中,当将锚定引物设计成接头中的一段序列时,为了避免接头序列对所述步骤B中测序反应的干扰,可使接头仅与各含待测SNP位点的核酸片段的一端连接。为实现上述目的,优选的,所述特异性引物对中仅有一种引物(上游引物或下游引物)的5’端含有磷酸基团。更优选的,所述特异性引物对中仅将用于扩出待测SNP位点所在链的引物的5’端设计成含有磷酸基团的引物。
针对多样本的多SNP位点检测,本发明在第一、二、三典型实施例的基础上提出第四典型实施例,一种SNP分型方法,包括以下步骤:
A.将多种不同待测样本来源的含不同待测SNP位点的核酸片段分别可寻址的固定在固相载体上;
B.对固定在固相载体上的含待测SNP位点的核酸片段进行测序,进而确定不同待测样本来源的待测SNP位点的基因型;
所述多种不同待测样本来源的含不同待测SNP位点的核酸片段均是通过非单分子扩增获得的产物,它们均连有标签序列;所述标签序列用于识别不同的待测样本和待测SNP位点的类型。
需要说明的是,所述可寻址的固定,是指能够确定位置信息的固定。所述分别可寻址的固定在固相载体上,进一步指在每一个具体位置上所固定的含待测SNP位点的核酸片段的样本来源是相同。即,固定载体上每一具体位置上所固定的含待测SNP位点的核酸片段的样本来源是能够确定的。
本实施例避免了现有技术中基于芯片技术的SNP分型方法中不同探针之间的相互干扰,SNP位点的检测通量和准确性仅受限于所采用的测序技术,大大的提高了对SNP位点进行检测的通量;与现有技术相比,还能同时保证准确性保持在一个较高的水平,不因通量的增加而急剧下降。此外,与通过对单分子扩增产物进行测序获得SNP位点序列信息相比,非单分子扩增方法无需特殊的前处理步骤,更简单,且扩增效率更高、更快速(循环数更少),能够显著的提高SNP分型方法的效率。
所述不同样本来源的含不同待测SNP位点的核酸片段所连有的标签序列可以是在非单分子扩增过程中获得的,也可以是在所述步骤A的可寻址固定过程中获得。
针对所述不同样本来源的含不同待测SNP位点的核酸片段所连有的标签序列是在非单分子扩增过程中获得的,本发明提出第十六实施例,所述步骤A包括以下步骤:
A1、利用多种特异性引物对分别对不同的待测样本进行非单分子扩增,得不同待测样本来源的含不同待测SNP位点的核酸片段;
A2、将不同待测样本来源的含不同待测SNP位点的核酸片段分别固定在微球上,然后将微球可寻址的固定在固相载体上;
所述多种特异性引物对均含有第三标签序列;所述第三标签序列用于识别不同的待测样本和待测SNP位点的类型。
需要说明的是:
所述待测样本为含核酸的任意形式的样品,包括但不限于经纯化后的DNA、cDNA或RNA(包括但不限于mRNA和rRNA),或是含有核酸的石蜡包埋组织、全血、血清、血浆或细胞。
所述多种特异性引物对为分别用于扩增含各种不同样本来源的不同的待测SNP位点的核酸片段的PCR引物。
所述第三标签序列可设置在每个特异性引物对中的至少一种引物上。
通过上述设计,在步骤B中增加一个检测第三标签序列的步骤,即可实现对多个样本的不同SNP位点的同时检测,提高检测效率。
优选的,所述第三标签序列位于每个特异性引物对中的用于扩增待测SNP位点所在链的引物上。这样,在步骤B中的测序过程中,仅需锚定引物互补至对待测SNP位点所在链上进行测序反应,即可实现对待测SNP位点和标签序列的检测,进而确定不同待测样本来源的SNP位点的基因型;本方案还能减少后续数据处理过程中的步骤,例如:当第三标签序列位于待测SNP位点所在链的互补链时,步骤B中的测序反应获得的就是第三标签序列的互补序列,这样在后续的数据处理过程中就必须对这一部分数据进行转换。
更优选的,所述第五标签序列在其所在引物的5’端。
针对所述不同样本来源的含不同待测SNP位点的核酸片段所连有的标签序列是在非单分子扩增过程中获得的,本发明又提出第十七实施例,所述步骤A包括以下步骤:
A1、利用多种特异性引物对分别对各待测样本进行非单分子扩增,得多种固定有含不同待测SNP位点的核酸片段的微球;
A2、将多种固定有含不同待测SNP位点的核酸片段的微球可寻址的固定在固相载体上;
所述多种特异性引物对均含有第三标签序列,且所述多种特异性引物对中分别仅有一种引物被预先固定在微球;所述第三标签序列分别被包含在各特异性引物对中的至少一种引物上,用于识别不同的待测样本和待测SNP位点的类型。
所述多种特异性引物对分别用于扩增各种不同样本来源的不同的待测SNP位点;针对同一待测SNP位点的特异性引物对的区别在于第三标签序列的不同;针对同一样本来源的不同待测SNP位点的特异性引物对的第三标签序列也不同。
所述第三标签序列可设置在每个特异性引物对中的至少一种引物上。
通过上述设计,在步骤B中增加一个检测第三标签序列的步骤,即可实现对多个样本的不同SNP位点的同时检测,提高检测效率。
优选的,所述第三标签序列位于每个特异性引物对中的用于扩增待测SNP位点所在链的引物上。这样,在步骤B中的测序过程中,仅需锚定引物互补至对待测SNP位点所在链上进行测序反应,即可实现对待测SNP位点和标签序列的检测,进而确定不同待测样本来源的SNP位点的基因型;本方案还能减少后续数据处理过程中的步骤,例如:当第三标签序列位于待测SNP位点所在链的互补链时,步骤B中的测序反应获得的就是第三标签序列的互补序列,这样在后续的数据处理过程中就必须对这一部分数据进行转换。
更优选的,所述第三标签序列在其所在引物的5’端。
与第十六实施例相比,本实施例中通过分别将各特异性引物对中的一种引物预先固定在微球上,使得含待测SNP位点的核酸片段在被扩增的同时直接固定在微球上,可直接进一步的进行可寻址固定,简化了实验步骤,提高了实验效率,同时微球的存在使得纯化扩增产物更为快速、便捷,效率高。此外,固定有引物的微球的密度可能会与扩增反应中的其他成分的密度不同,因此,在扩增反应过程中,可使整个扩增反应体系周期性震荡,以有效提高扩增效率。
针对所述含待测SNP位点的核酸片段所连有的标签序列是在所述步骤A的可寻址固定过程中获得,优选在连接接头的时候,通过带有标签序列的接头获得。本发明分别提出了第十八、十九实施例,具体如下所述。
在第十八实施例中,所述步骤A2包括以下步骤:
A21、将不同待测样本来源的含不同待测SNP位点的核酸片段分别与不同的接头连接,得多种连接产物;
A22、将多种连接产物分别固定在微球上,然后将微球可寻址的固定在固相载体上。
需要说明的是,本实施例中,所述不同的接头均含有修饰标记和第三标签序列;所述不同的接头之间的不同之处优选仅在于第三标签序列的不同;所述修饰标记,用于使其所在接头能被固定在微球上;所述第三标签序列用于识别不同的待测样本和待测SNP位点的类型。
在第十九实施例中,所述步骤A2包括以下步骤:
A21、将不同待测样本来源的含不同待测SNP位点的核酸片段分别与不同的固定在微球上的接头连接,得多种被固定在微球上的连接产物;
A22、将多种固定有连接产物的微球可寻址的固定在固相载体上。
需要说明的是,本实施例中,所述不同的固定在微球上的接头均含有修饰标记和第三标签序列;所述不同的固定在微球上的接头之间的不同之处优选仅在于第三标签序列的不同;所述修饰标记,用于使其所在接头能被固定在微球上;所述第三标签序列用于识别不同的待测样本和待测SNP位点的类型。
与第十八实施例相比,第十九实施例中的接头被预先固定在微球上,减少了连接产物与微球连接的步骤,实验效率更高。固定有接头的微球的密度可能会与连接反应中的其他成分的密度不同,因此,在连接过程中,使整个连接反应体系周期性震荡,可有效提高固定在微球上的接头与含待测SNP位点的核酸片段的连接效率,避免连接反应体系中各成分分层而引起的连接效率低现象的出现。
在第十八实施例和第十九实施例中,所述接头同前述一样,可采用多种形式,包括但不限于平末端接头、突出末端接头、分叉接头或含茎环结构的接头,在此不再赘述。不过需要特别指出的是,针对不同的样本来源的含待测SNP位点的核酸片段,所采用的接头可以是相同或不同的。这使得本方案的适用范围广,能够针对各种实际情况的不同,包括但不限于:待测样本的不同、含待测SNP位点的核酸片段的具体序列的不同,采用不同的技术方案,以实现最优配置。
其中,不同待测样本来源的含不同待测SNP位点的核酸片段同样可通过直接或间接的方式可寻址的固定在固相载体上。
进一步的,不同待测样本来源的含不同待测SNP位点的核酸片段可分别固定在微球上,然后再固定在同一固相载体上,从而实现不同待测样本来源的含待测SNP位点的核酸片段的可寻址固定。
针对不同待测样本来源的含不同待测SNP位点的核酸片段的间接固定,本发明已在上述的第十六至十九实施例中进行了一定的阐述,在此不再赘述。
针对不同待测样本来源的含不同待测SNP位点的核酸片段的直接固定,本发明提出第二十实施例,所述步骤A具体如下:
利用多种特异性引物对对不同待测样本进行非单分子扩增,得不同待测样本来源的含待测SNP位点的核酸片段,然后将不同待测样本来源的含待测SNP位点的核酸片段可寻址的固定在固相载体上;所述特异性引物对中有一种引物上含有标记基团,所述标记基团用于使其固定在固相载体上。
需要说明的是,本方案通过在各种特异性引物对中设置含有标记基团的引物,使得扩增产物中含有标记基团,进而通过该标记基团固定在固相载体上,实验步骤简单,实验效率高。
优选的,各特异性引物对中的标记基团位于引物的5’端。所述标记基团可为生物素、亲和素、链霉亲和素、纳米金、碘乙酰、巯基、氨基、醛基、羧基、异硫氰基、硅烷基或丙烯酰胺。
优选的,所述各特异性引物对中均有一种引物被预先固定在固相载体上。
更优选的,所述特异性引物对有多种,它们均含有第三标签序列;所述第三标签序列用于识别待测SNP位点的类型和不同的待测样本,所述第三标签序列位于标记基团所在的引物上。
本方案可通过预先分别将多种特异性引物对中的含标记基团的引物分别可寻址固定在固相载体上,然后只通过一步反应即实现了含物种特异性待测SNP位点的核酸片段的扩增和固定,实验步骤简单,实验效率高,且本方案可不仅仅通过对固相载体进行物理分区实现可寻址的固定,还可通过第三标签序列验证,提高检测的准确性。
优选的,所述第三标签序列位于其所在引物的5’端。本方案降低了对非单分子扩增反应中引物设计的难度,减少了对非单分子扩增的影响。
在上述实施例中,当步骤B中对多个样本的待测SNP位点进行测序反应时,对应的锚定引物一般可如图5所示,设计为:
a、接头中的一段序列;或
b、各特异性引物对中的一段序列;或
c、各特异性引物对中的一段序列的互补序列;或
d、接头的3’端的部分序列与各特异性引物对中与之相连的5’端的部分序列;或
e、接头的3’端的部分序列与各特异性引物对中与之相连的5’端的部分序列所组成的核酸链的互补序列;或
f、各待测SNP位点所在位置的3’端的互补序列;或
g、各待测SNP位点所在位置的5’端的互补序列。
其中,a、d、e方案适用于含待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案;b、c、f、g适用于所有的技术方案。
在不同样本来源的含不同待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案中,当将锚定引物设计成接头中的一段序列时,为了避免接头序列对所述步骤B中测序反应的干扰,可使接头仅与各含待测SNP位点的核酸片段的一端连接。为实现上述目的,优选的,所述各特异性引物对中均仅有一种引物(上游引物或下游引物)的5’端含有磷酸基团。更优选的,所述各特异性引物对中均仅将用于扩出待测SNP位点所在链的引物的5’端设计成含有磷酸基团的引物。
基于上述任一方案,尤其是当含待测SNP位点的核酸片段通过微球固定在固相载体上时,所述固相载体优选为玻片或硅片。玻片或硅片具有优良的特性,便于修饰以利于与微球的结合,所述玻片或硅片与微球之间的结合方式包括但不限于:生物素-亲和素/链霉亲和素、纳米金/碘乙酰-巯基、氨基-醛基/羧基/异硫氰基、硅烷基-丙烯酰胺。同时,玻片或硅片具有良好的透光性,有利于后续测序反应的顺利进行。
当采用合成测序法进行测序时,优选的,所述锚定引物的3’端距待测SNP位点1至9bp之间,更优选在1至4bp之间。本方案使得在步骤B中的测序反应仅需通过1个或数个延伸反应循环即可完成待测SNP位点检测,能有效提高检测效率,降低检测成本。
当采用连接测序法进行测序时,优选的,所述锚定引物上用于连接寡核苷酸探针的一端距待测SNP位点1至9bp之间,更优选在1至5bp之间。因为最为常见的连接酶——T4连接酶最大限度能保证6个碱基正确互补配对,所以,本方案使得所述步骤B中的测序反应仅需进行一轮连接反应即可实现待测SNP位点的检测,能有效提高检测效率,降低检测成本。
基于上述任一实施例,所述每个特异性引物对中的至少一种引物的3’端距待测SNP位点1至9bp。因为用于扩增待测SNP位点的特异性引物对的设计和锚定引物的设计有共通之处,均需要保证匹配的特异性,以避免非特异性扩增或非特异性互补配对。所以,在本方案中,可将锚定引物设计在特异性引物对中3’端距待测SNP位点1至9bp的引物上,这可有效提高实验设计效率,且使得步骤B中的测序反应仅需进行一轮连接反应即可实现待测SNP位点的检测,或仅需通过1个或数个延伸反应循环即可完成待测SNP位点检测,能有效提高检测效率,降低检测成本。
因为在步骤B的测序反应过程中,针对同一种待测SNP位点的锚定引物往往是相同的,但是针对不同待测SNP位点的锚定引物往往并不相同,这往往会使得测序过程中不同待测SNP位点的测序信号存在差异,影响SNP位点检测的准确性。
对此,发明人对本发明进行了进一步的改进:每个特异性引物对中的至少一种引物上含有第一归一化序列,并在步骤B中对第一归一化序列进行检测。所述第一归一化序列为一确定长度和序列的核苷酸序列,用于在测序过程中归一化不同SNP位点检测的测序信号。本方案通过在步骤B的测序反应过程中,对第一归一化序列进行检测,进而在后续的数据处理过程中,归一化各待测SNP位点检测所获得测序信号,从而提高测序的准确性。
优选的,所述第一归一化序列的长度在1至9bp之间;更优选在1至5bp之间。
当每个特异性引物对中的含有标签序列,所述标签序列用于识别不同的待测样本,或用于识别待测SNP位点的类型,或用于同时识别不同的待测样本和待测SNP位点的类型时,优选的,所述第一归一化序列与标签序列相连,可位于标签序列的5’端,也可位于标签序列的3’端,这样标签序列和第一归一化序列的检测可以使用同一个锚定引物,既减少了锚定引物的设计工作量,又提高了检测的效率。
此外,针对上述包括含待测SNP位点的核酸片段与接头连接步骤的方案,发明人还提出了另一方案:所述接头上含有第二归一化序列,并在步骤B中对第一归一化序列进行检测。所述第二归一化序列为一确定长度和序列的核苷酸序列,用于在测序过程中归一化不同SNP位点检测的测序信号。本方案通过在步骤B的测序反应过程中,对第二归一化序列进行检测,进而在后续的数据处理过程中,归一化各待测SNP位点检测所获得测序信号,从而提高测序的准确性。
优选的,所述第二归一化序列的长度在1至9bp之间;更优选在1至5bp之间。
当接头中含有标签序列,所述标签序列用于识别不同的待测样本,或用于识别待测SNP位点的类型,或用于同时识别不同的待测样本和待测SNP位点的类型时,优选的,所述第二归一化序列与标签序列相连,可位于标签序列的5’端,也可位于标签序列的3’端,这样标签序列和第二归一化序列的检测可以使用同一个锚定引物,既减少了锚定引物的设计工作量,又提高了检测的效率。
为了更好的解决本发明的技术问题,本发明还提供了一种SNP分型试剂盒,包括:特异性引物对和固相载体;所述特异性引物对用于通过非单分子扩增获得含待测SNP位点的核酸片段;所述固相载体用于可寻址固定含待测SNP位点的核酸片段。
本方案中,利用特异性引物对扩增所得的非单分子扩增产物(含待测SNP位点的核酸片段)能够可寻址的固定在固相载体上,然后可通过测序反应测定非单分子扩增获得的产物中的SNP位点信息,从而避免了现有技术中基于芯片技术的SNP分型方法中不同探针之间的相互干扰,SNP位点的检测通量和准确性仅受限于所采用的测序技术,大大的提高了对SNP位点进行检测的通量;与现有技术相比,还能同时保证准确性保持在一个较高的水平,不因通量的增加而急剧下降。此外,与通过单分子扩增引物进行单分子扩增,然后对单分子扩增产物进行测序获得SNP位点序列信息相比,非单分子扩增方法无需特殊的前处理步骤,更简单,且扩增效率更高、更快速(循环数更少),能够显著的提高SNP分型方法的效率。即,本方案中的试剂盒能够提供一种避免现有技术中基于芯片技术的SNP分型方法中不同探针之间的相互干扰,大大的提高了对SNP位点进行检测的通量的试剂盒,且该试剂盒在使用过程中无需特殊的前处理步骤,更简单,且扩增效率更高、更快速(循环数更少),能够显著的提高SNP分型方法的效率。
进一步的,所述SNP分型试剂盒还可包括接头,所述接头用于连接含待测SNP位点的核酸片段,所述接头上含有修饰标记,用于使含待测SNP位点的核酸片段通过接头间接固定在固相载体上。
所述接头可采用多种形式,包括但不限于平末端接头、突出末端接头、分叉接头或含茎环结构的接头。
所述平末端接头是指双链之间完全互补配对的双链核酸接头。优选的,所述平末端接头的两条链的5’末端均不含磷酸基团,其可避免连接过程中接头自连现象的出现,减少对后续测序实验的干扰,提高SNP分型检测的准确率。
所述突出末端接头,是指双链核酸分子中的至少一端带有突出核苷酸序列,而其余核苷酸则完全互补的双链核酸接头。突出末端接头可为单突出末端(图1),也可以是含有两个突出末端的双突出末端,这两个突出末端可在一条核苷酸链上(图2a)或在不同的核苷酸链上(图2b)。所述突出末端接头能够避免连接过程中接头自连现象的出现,减少对后续测序实验的干扰,提高SNP分型检测的准确率。在本实施例的具体实施方式中,所述接头优选为单突出末端接头,且该突出末端为其所在链的3’末端,碱基为T;该接头能够与通过Taq酶扩增的含A尾的PCR扩增产物直接连接,提高连接效率。
所述分叉型接头包括互补区和分叉区,其基本结构如图3所示,互补区双链的核苷酸互补配对,配对的核苷酸对数不限。互补区末端可为平末端或突出末端。所述分叉型接头能够避免连接过程中接头自连现象的出现,减少对后续测序实验的干扰,提高SNP分型检测的准确率。在本实施例的具体实施方式中,所述接头优选为互补区的3’末端为突出末端,且突出末端最后一个碱基为T的T末端分叉接头;该接头能够与通过Taq酶扩增的含A尾的PCR扩增产物直接连接,提高连接效率。
所述带茎环结构的接头,如图4所示。该接头为单链核酸分子,该单链核酸分子包括第一互补配对区1、茎环区2和第二互补配对区3(图4a),第一互补配对区1能够与第二互补配对区3互补配对。如图4b所示,带茎环结构的接头还可带有突出末端4,该突出末端可位于单链核酸分子的3’端。突出末端4的存在能够防止接头自连现象的发生,减少对后续测序实验的干扰,提高SNP分型检测的准确率。该突出末端优选为T;该接头能够与通过Taq酶扩增的含A尾的PCR扩增产物直接连接,提高连接效率。
所述修饰标记可为生物素、亲和素、链霉亲和素、抗原、抗体、受体、配体、多聚组氨酸、纳米金、碘乙酰、巯基、氨基、醛基、羧基、异硫氰基、硅烷基或丙烯酰胺,它们均能特异性的与相对应的基团或分子结合。
需要特别指出的是,针对不同的样本来源的含待测SNP位点的核酸片段,所采用的接头可以是相同或不同的。这使得本方案的适用范围广,能够针对各种实际情况的不同,包括但不限于:待测样本的不同、含待测SNP位点的核酸片段的具体序列的不同,采用不同的技术方案,以实现最优配置。
进一步的,所述SNP分型试剂盒还可包括锚定引物。根据利用本试剂盒获得的含待测SNP位点的核酸片段的可寻址固定方式的不同,所述锚定引物可采用不同的设计,具体如下:
a、接头中的一段序列;或
b、各特异性引物对中的一段序列;或
c、各特异性引物对中的一段序列的互补序列;或
d、接头的3’端的部分序列与各特异性引物对中与之相连的5’端的部分序列;或
e、接头的3’端的部分序列与各特异性引物对中与之相连的5’端的部分序列所组成的核酸链的互补序列;或
f、各待测SNP位点所在位点的3’端的互补序列;或
g、各待测SNP位点所在位点的5’端的互补序列。
其中,a、d、e方案适用于含待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案;b、c、f、g适用于所有的技术方案。
在不同样本来源的含待测SNP位点的核酸片段通过间接方式可寻址固定在固相载体的方案中,当将锚定引物设计成接头中的一段序列时,为了避免接头序列对所述步骤B中测序反应的干扰,可使接头仅与各含待测SNP位点的核酸片段的一端连接。为实现上述目的,优选的,所述特异性引物对中仅有一种引物(上游引物或下游引物)的5’端含有磷酸基团。更优选的,所述特异性引物对中仅将用于扩出待测SNP位点所在链的引物的5’端设计成含有磷酸基团的引物。
此外,根据利用本试剂盒获得的含待测SNP位点的核酸片段被可寻址固定后所采用的检测方法的不同,锚定引物还可进行进一步的设计。
当采用合成测序法进行测序时,优选的,所述锚定引物的3’端距待测SNP位点1至9bp之间,更优选在1至4bp之间。本方案使得在步骤B中的测序反应仅需通过1个或数个延伸反应循环即可完成待测SNP位点检测,能有效提高检测效率,降低检测成本。
当采用连接测序法进行测序时,优选的,所述锚定引物上用于连接寡核苷酸探针的一端距待测SNP位点1至9bp之间,更优选在1至5bp之间。因为最为常见的连接酶——T4连接酶最大限度能保证6个碱基正确互补配对,所以,本方案使得所述步骤B中的测序反应仅需进行一轮连接反应即可实现待测SNP位点的检测,能有效提高检测效率,降低检测成本。
基于上述任一实施例,所述每个特异性引物对中的至少一种引物的3’端距待测SNP位点1至9bp。因为用于扩增待测SNP位点的特异性引物对的设计和锚定引物的设计有共通之处,均需要保证匹配的特异性,以避免非特异性扩增或非特异性互补配对。所以,在本方案中,可将锚定引物设计在特异性引物对中3’端距待测SNP位点1至9bp的引物上,这可有效提高实验设计效率,且使得步骤B中的测序反应仅需进行一轮连接反应即可实现待测SNP位点的检测,或仅需通过1个或数个延伸反应循环即可完成待测SNP位点检测,能有效提高检测效率,降低检测成本。
因为在步骤B的测序反应过程中,针对同一种待测SNP位点的锚定引物往往是相同的,但是针对不同待测SNP位点的锚定引物往往并不相同,这往往会使得测序过程中不同待测SNP位点的测序信号存在差异,影响SNP位点检测的准确性。
对此,发明人对本发明进行了进一步的改进:每个特异性引物对中的至少一种引物上含有第一归一化序列。所述第一归一化序列为一确定长度和序列的核苷酸序列,用于在测序过程中归一化不同SNP位点检测的测序信号。本方案的试剂盒在使用中通过归一化各待测SNP位点检测所获得测序信号,从而提高测序的准确性。
优选的,所述第一归一化序列的长度在1至9bp之间;更优选在1至5bp之间。
此外,针对含待测SNP位点的核酸片段通过接头间接可寻址固定在固相载体上的方案,发明人还提出了另一方案:所述接头上含有第二归一化序列。所述第二归一化序列为一确定长度和序列的核苷酸序列,用于在测序过程中归一化不同SNP位点检测的测序信号。本方案的试剂盒在使用过程中通过归一化各待测SNP位点检测所获得测序信号,从而提高测序的准确性。
优选的,所述第二归一化序列的长度在1至9bp之间;更优选在1至5bp之间。
基于上述任一方案,尤其是当含待测SNP位点的核酸片段通过微球固定在固相载体上时,所述固相载体优选为玻片或硅片。玻片或硅片具有优良的特性,便于修饰以利于与微球的结合,所述玻片或硅片与微球之间的结合方式包括但不限于:生物素-亲和素/链霉亲和素、纳米金/碘乙酰-巯基、氨基-醛基/羧基/异硫氰基、硅烷基-丙烯酰胺。同时,玻片或硅片具有良好的透光性,有利于后续测序反应的顺利进行。
为了实现对多个样本的多个SNP位点的同时检测,本发明的试剂盒中的特异性引物对中可含有第三标签序列;所述第三标签序列可设置在每个特异性引物对中的至少一种引物上。所述第三标签序列用于识别不同的待测样本和待测SNP位点的类型。
本方案可实现对多个样本的不同SNP位点的同时检测,提高检测效率。
优选的,所述第三标签序列位于每个特异性引物对中的用于扩增待测SNP位点所在链的引物上。这样,在测序过程中,仅需锚定引物互补至对待测SNP位点所在链上进行测序反应,即可实现对待测SNP位点和标签序列的检测,进而确定不同待测样本来源的SNP位点的基因型;本方案还能减少后续数据处理过程中的步骤,例如:当第三标签序列位于待测SNP位点所在链的互补链时,测序反应获得的就是第三标签序列的互补序列,这样在后续的数据处理过程中就必须对这一部分数据进行转换。
更优选的,所述第三标签序列在其所在引物的5’端。
优选的,所述第一归一化序列与第三标签序列相连,可位于标签序列的5’端,也可位于标签序列的3’端,这样标签序列和第一归一化序列的检测可以使用同一个锚定引物,既减少了锚定引物的设计工作量,又提高了检测的效率。
当然,本发明的试剂盒还可通过在接头中设计第三标签序列而达到同时对多个样本进行检测的目的,或者更进一步实现对更多样本进行同时检测的目的。所述第三标签序列用于识别不同的待测样本和待测SNP位点的类型。针对不同的样本和待测SNP位点的类型组合,所使用的接头之间优选仅在于第三标签序列的不同。
优选的,所述第二归一化序列与第三标签序列相连,可位于标签序列的5’端,也可位于标签序列的3’端,这样标签序列和第二归一化序列的检测可以使用同一个锚定引物,既减少了锚定引物的设计工作量,又提高了检测的效率。
针对上述各技术方案,为进一步说明本发明所记载技术方案的技术效果及优越性,本发明给出下述具体实施例。
在一具体实施例中,以100个人的血液基因组DNA为模板,同时检测ALDH2基因的SNP位点rs671、rs441、rs4646777,CYP2E1基因的SNP位点rs2515641、rs59656378、rs2070276,LCT基因的rs386833833、rs4954449,MTHFR基因的SNP位点rs397507444、rs2274976。
其中,针对上述各SNP位点与相对应的PCR扩增引物的对应关系如表1所示:
表1 各SNP位点对应的引物
如表1所示,与上述各SNP位点相对应的PCR扩增引物均有两对,依次为外引物和内引物;在这些内引物和外引物中,只有内引物中的上游引物的5’端含有磷酸基团。在本具体实施例中,含待测SNP位点的核酸片段是通过巢式PCR获得的。
一、含待测SNP位点的核酸片段的获得
1、第一次PCR扩增
以100个人的血液基因组DNA为模板,利用表1中的外引物,分别对各SNP位点所在序列进行扩增,反应体系为:F引物(10μM),2μL;R引物(10μM),2μL;dNTP(各2.5mM),4μL;血液基因组DNA,50ng;Ex Taq(5U/μL),0.25μL;10×Ex Taq Buffer,5μL;ddH2O加至50μL。
PCR反应条件如下:95℃ 3min;94℃ 15s,58℃ 30s,72℃ 45s;重复20个循环;72℃ 3min。
利用PCR清洁试剂盒,分别对各样品的第一次扩增产物进行分离,除去未扩增的引物和dNTP,得第一次PCR扩增产物。
2、第二次PCR扩增
以第一次PCR扩增产物为模板,利用表1中的内引物,分别对各SNP位点所在序列进行扩增,反应体系为:F引物(10μM),2μL;R引物(10μM),2μL;dNTP(各2.5mM),4μL;第一次PCR扩增产物,100ng;Ex Taq(5U/μL),0.25μL;10×Ex Taq Buffer,5μL;ddH2O加至50μL。
PCR反应条件如下:95℃ 3min;94℃ 15s,58℃ 20s,72℃ 30s;重复15个循环;72℃ 3min。
利用PCR清洁试剂盒,分别对各样品的第二次扩增产物进行分离,除去未扩增的引物和dNTP,得第二次PCR扩增产物,即含待测SNP位点的核酸片段。
图7为随机抽取的4个样本(8、31、54、88)的3个SNP位点(rs397507444、rs441、rs386833833)分别进行第二次PCR扩增后所得产物的电泳结果,结果显示,上述4个样本的3个SNP位点的第二次PCR扩增产物条带单一,特异性好,扩增效率高。
图8为随机抽取的8个样本(1、6、22、56、77、80、93、99)的SNP位点(rs2515641)分别进行第二次PCR扩增后所得产物的电泳结果,结果显示,上述8个样本的第二次PCR扩增产物条带单一,特异性好,扩增效率高。
二、含待测SNP位点的核酸片段的可寻址固定
1、固定有接头的磁珠
为了在同时检测过程中能够区分不同的样本来源,本具体实施例在接头上设计了标签序列,接头的基本结构如图6所示,该接头为单突出末端接头,突出末端为T,NNNNNN为标签序列。该标签序列分为两部分,分别是标签序列一和标签序列二,分别对应SEQ ID NO:41上从5’端至3’端的头四个NNNN和后两个NN。标签序列一与样本来源的对应关系如表2所示。
表2 标签序列一与样本来源的对应关系
标签序列二与各SNP位点的对应关系如表3所示。
表3 标签序列二与各SNP位点的对应关系
将上述各接头分别与带有链霉亲和素修饰的Myone磁珠(Invitrogen)结合,使得上述各接头被分别固定在磁珠表面,反应体系及反应过程为:将200ng接头,0.1μL连接子(SEQ ID NO:53,1μM)与4μL(约4×107个磁珠)Myone磁珠螺旋振荡混匀,反应30min,以适量TE缓冲液(10mM Tris-HCl,pH8.0;1mM EDTA)清洗两次,离心分离,将得到的磁珠以4μL结合缓冲液(10mM Tris-HCl,pH7.5;1mM EDTA;1M NaCl;0.01% Triton X-100)重悬保存,得固定有接头的磁珠。
2、第二次PCR扩增产物与固定在磁珠上的接头的连接
将第二次PCR扩增产物按表2中的对应关系分别与上述步骤所得的固定有接头的磁珠混合,进行连接反应,得连接产物。连接体系为:第二次PCR扩增产物50ng;固定有接头的磁珠,0.2μL;10mM ATP,5μL;T4 DNA连接酶(30U/μL),0.2μL;10×T4连接酶缓冲液,2μL;加ddH2O至20μL。
16℃孵育4h以上,反应结束后用磁铁吸附磁珠,去上清,用5uL TE洗涤二次,并最终悬浮于1uL TE中,从而将含待测SNP位点的核酸片段固定在磁珠上。
3、固定在磁珠上的含待测SNP位点的核酸片段的可寻址固定
将得到的100个样本的固定在磁珠上的含待测SNP位点的核酸片段混合,然后将混合物点样至异硫氰基修饰的载样片(玻片),于37℃固定1h,即完固定在磁珠上的含待测SNP位点的核酸片段的可寻址固定。
三、测序
对步骤二所得的固定在固相载体上的含待测SNP位点的核酸片段进行测序。在本具体实施例中采用深圳华因康基因科技有限公司的高通量基因测序仪Pstar II plus测序仪,并采用连接测序法进行测序。测序过程中各SNP位点所对应使用的锚定引物如表4所示。另外,为了区分不同的样本来源,还需对接头上的标签序列进行检测,用于检测标签序列的锚定引物为SEQ ID NO:53。表3中的锚定引物及用于检测标签序列的锚定引物的5’端无磷酸基团,这可以避免通过连接测序法进行检测时探针与锚定引物的5’端的错误连接,以提高检测效率。
表4 各SNP位点对应的锚定引物
图9示出了在对各样本的SNP位点同时进行检测时的局部图像,图10示出了在对各样本的含待测SNP位点的核酸片段所连接头上的标签序列进行检测时的局部图像,通过综合分析图9、图10中分发光点的明亮情况即可获得各样本的各待测SNP位点的基因型。
在100个待测样本中,ALDH2基因的SNP位点检测结果为rs671中有63个样本为GG型,32个样本为GA型,5个样本为AA型;rs441中有65个样本为TT型,35个样本为TC型,CC型无;rs4646777中有7个为AA型,48个为AG型,45个为GG型。具体如表5所示。
表5 ALDH2基因SNP位点检测结果
100个待测样本中,CYP2E1基因的SNP位点检测结果为rs2515641中有33个为CC型,32个为CT型,35个为TT型;rs59656378中有48个为GG型,30个为GC型,22个为CC型;rs2070276中有56个为CC型,39个为CG型,5个为GG型。具体如表6所示。
表6 CYP2E1基因SNP位点检测结果
100个待测样本中,LCT基因的SNP位点检测结果为rs386833833中有67个为GG型,20个为GA型,13个为AA型;rs4954449中均为CC型。具体如表7所示。
表7 LCT基因SNP位点检测结果
100个待测样本中,MTHFR基因的SNP位点检测结果为rs397507444中有27个为AA型,62个为AC型,11个为CC型;rs2274976中有5个为AA型,23个为AG型,72个为GG型。具体如表8所示。
表8 MTHFR基因SNP位点检测结果
发明人还对100个样本的第二次PCR扩增产物分别进行了Sanger测序,所得结果与表4、5、6、7完全相同。
此外,发明人还利用100个样本的第二次PCR扩增产物为模板,进行乳液PCR扩增(EPCR),然后对乳液PCR的产物进行高通量测序,所用测序仪同样采用深圳华因康基因科技有限公司的高通量基因测序仪Pstar II plus测序仪,并采用连接测序法进行测序。所得测序结果与上述Sanger测序仪测序结果和本发明的测序结果完全相同。
综上,本发明的方法可以高效的同时对多个样品的多个SNP位点同时进行检测,并得到准确可信的结果。与Sanger测序法相比,本发明大大提高了测序的通量,同时能够给有效的对多个样品、多个SNP位点进行检测,并有效减少中间样品处理的步骤,提高实验效率。与高通量基因测序法相比,本发明的测序前样本处理步骤更为简单,且扩增效率更高、更快速(循环数更少),能够显著的提高SNP分型方法的效率。
需要进一步说明的是,上述具体实施例中的非单分子扩增为巢式PCR,通过2步PCR反应,高效且特异性的扩增得到了含待测SNP位点的扩增产物。上述具体实施例中的巢式PCR可用其他方法替换,只要能够特异性扩增得到含待测SNP位点的扩增产物即可。例如直接利用上述巢式PCR中的外引物、内引物、或内外引物中上下游引物的随机组合直接扩增的普通PCR扩增方法,或通过差异性的设计PCR扩增产物的大小而实现的多种PCR扩增方法,或不对称PCR方法。
其中,多重PCR扩增可同时扩增多个,甚至所有的含待测SNP位点的片段,然后通过进一步的纯化工作实现扩增产物的分离,进而在含待测SNP位点的核酸片段实现可寻址固定后完成待测SNP位点的检测。
其中,上述不对称PCR方法可按照如下方法进行,以上述具体实施例中的第一次PCR扩增产物为模板,然后对每一个待测SNP位点设计另一对特异性扩增引物进行第二次扩增,各特异性引物对中均仅有一条引物的5’端含有生物素标记,用于使第二次扩增获得含待测SNP位点的单链产物固定在固相载体(例如微球)上,且该引物所延伸成的链为待测SNP位点所在的链。需要说明的是,上述第二次扩增可以是时间、空间与第一次扩增完全不同的扩增反应,也可以仅是时间上与第一次扩增不同,而空间与第一次扩增相同的扩增反应。后面这种方法可通过将上述第二次扩增所用的特异性扩增引物对的退火温度设计的较第一次扩增所用的特异性引物对的退火温度更高而实现;优选高4℃以上。
需要进一步说明的是,本发明中的可寻址固定方法可参考专利CN201110222895.X、CN201110222894.5中的方法进行,本发明将上述两个专利中的可寻址固定方法全部引入。
上述具体实施例中的连接子为5’端带双生物素标记,3’端带有氨基末端的单链核苷酸分子。
上述具体实施例中的连接子的碱基序列不与锚定引物互补配对,优选为重复序列,包括但不限于CA、GT、GCAT。本方案中的连接子(重复序列)适用范围更广,能够避免与锚定引物的互补配对。
更进一步的,该连接子的碱基数在15至40之间,优选20至30之间,更优选为30。
上述具体实施中的锚定引物均设计在待测SNP位点所在链的5’端的互补序列,当然也可以设计待测SNP位点所在的3’端的互补序列,也可以是其他方案,具体可参考前述的锚定引物的设计部分。
为了使上述具体实施的方案具有更好的效果,本发明还设计了归一化序列,用于归一化测序反应过程中的信号。该归一化序列可设置在图6中的接头上,例如SEQ ID NO:41中从5’端起第34-36的序列——TCG,并将SEQ ID NO:54作为归一化序列的锚定引物,该锚定引物的5’端无磷酸基团,以避免通过连接测序法进行检测时探针与锚定引物的5’端的错误连接,以提高检测效率。优选的,上述归一化序列的锚定引物可以替代标签序列的锚定引物,以减少测序过程中锚定引物的种类,降低成本,并且能够连续测定归一化序列和标签序列,提高了检测效率。
另外,需要说明的是上述具体实施例中的待测SNP位点仅是示例,发明人还同时对ABCB1、ADH2、ADH3、APOB、APOE、CAT、CYBA、CYP1A1、ERCC2、LPL、MC1R、MCM6、MTR、MTRR、NOS3、OCA2、PARP1、PON1、SOD3、TYRP1、VDR和XRCC1等基因的以下SNP位点同时进行检测,同时检测的样本数为500个,并以Sanger测序法、现有的第二代高通量基因测序法为对照,所得结果完全一致。
上述SNP位点为:rs1128501、rs2229109、rs41309231、rs2066702、rs1041969、rs55882921、rs698、rs67420531、rs200253359、rs137852912、rs12713559、rs676210、rs7412、rs28931577、rs121918392、rs709932、rs28933687、rs72554659、rs4673、rs179363890、rs8053867、rs1048943、rs4646422、rs28399427、rs121913024、rs13181、rs134943096、rs268、rs1801177、rs118204075、rs1805005、rs2228479、rs2229617、rs1804609、rs61752701、rs140329818、rs121913578、rs121913579、rs121913582、rs137853061、rs2966952、rs79430644、rs1799983、rs148554851、rs3918232、rs1800407、rs121918168、rs1800414、rs1136410、rs1805415、rs1136410、rs662、rs12026、rs854560、rs1799895、rs144089452、rs372589226、rs3202399、rs41305645、rs41305647、rs28934606、rs121909793、rs121909800、rs25487、rs2307177、rs1799782。
参照上述具体实施例,本发明还进行了一些典型性实验,例如:
仅对上述样本1中的rs671进行检测,其结果如图11所示,仅G通道变亮,即样本1中rs671的基因型为GG。
同时对上述100个样本中的rs671进行检测,其结果如图12、13所示。具体实验结果与上述具体实施例完全相同。
同时对样本7的上述10个SNP位点进行检测,其结果如图14、15所示。具体实验结果同样与上述具体实施例完全相同。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
SEQUENCE LISTING
<110> 深圳华因康基因科技有限公司
<120> 一种SNP分型方法及试剂盒
<160> 54
<170> PatentIn version 3.3
<210> 1
<211> 22
<212> DNA
<213> 人工序列
<400> 1
tctcgtttca aattacaggg tc 22
<210> 2
<211> 22
<212> DNA
<213> 人工序列
<400> 2
caggcttaaa atgggaaatt ag 22
<210> 3
<211> 22
<212> DNA
<213> 人工序列
<400> 3
cctttggtgg ctacaagatg tc 22
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<400> 4
agaccctcaa gccccaacag 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<400> 5
agcctgagca acatagcaag 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<400> 6
taaatgggac ggagaaggag 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<400> 7
gaggttaagg caggaggatc 20
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<400> 8
tcacttagaa caacagtggg ttt 23
<210> 9
<211> 23
<212> DNA
<213> 人工序列
<400> 9
atcatgtcag atgccgatag tga 23
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<400> 10
ggttgaagaa cagggcgaag 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<400> 11
gcctggcctt gaaggtagcc 20
<210> 12
<211> 21
<212> DNA
<213> 人工序列
<400> 12
cccaccactg taagggttga t 21
<210> 13
<211> 22
<212> DNA
<213> 人工序列
<400> 13
tgaaagccca cattttgtta ac 22
<210> 14
<211> 21
<212> DNA
<213> 人工序列
<400> 14
agaaacaggg cacacagtga g 21
<210> 15
<211> 22
<212> DNA
<213> 人工序列
<400> 15
ccagaaaagt ttaagccaga ac 22
<210> 16
<211> 22
<212> DNA
<213> 人工序列
<400> 16
tctttctcac ctgtggaaaa tg 22
<210> 17
<211> 22
<212> DNA
<213> 人工序列
<400> 17
ctggggttaa tcctgtgaga ag 22
<210> 18
<211> 22
<212> DNA
<213> 人工序列
<400> 18
cctctgatct ttctcacctg tg 22
<210> 19
<211> 22
<212> DNA
<213> 人工序列
<400> 19
tgaaagccca cattttgtta ac 22
<210> 20
<211> 22
<212> DNA
<213> 人工序列
<400> 20
caggaagtgt tctggcttaa ac 22
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<400> 21
ggggttaatc ctgtgagaag 20
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<400> 22
tccagagttg gcactacgac 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<400> 23
cccctgactg ctttctatct 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<400> 24
ttaacaaaat gtgggctttc 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<400> 25
gctctcctct gctccctttg 20
<210> 26
<211> 19
<212> DNA
<213> 人工序列
<400> 26
ttcatgcatc tgcccttcc 19
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<400> 27
gtggctaaat ggctacacgg 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<400> 28
acctgatatg cagcagaagc 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<400> 29
cgtcagaggc taccttgtgg 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<400> 30
tgtaactgcc agcgtcattc 20
<210> 31
<211> 21
<212> DNA
<213> 人工序列
<400> 31
ccagaggaag ccttcaggga a 21
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<400> 32
agcagcagga ccacgagacc 20
<210> 33
<211> 22
<212> DNA
<213> 人工序列
<400> 33
actgccctct gtcaggagtg tg 22
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<400> 34
cacaggatgg ggaagtcaca g 21
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<400> 35
tgaagatgtg gggggaggag 20
<210> 36
<211> 22
<212> DNA
<213> 人工序列
<400> 36
ctccagcatc actcactttg tg 22
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<400> 37
tctggaaggt aaaggagccg 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<400> 38
gtcatggagc ctccgtttct 20
<210> 39
<211> 21
<212> DNA
<213> 人工序列
<400> 39
tgctgatgca gggtgtttat t 21
<210> 40
<211> 24
<212> DNA
<213> 人工序列
<400> 40
caggaagtag ttgtcgtgga tgta 24
<210> 41
<211> 46
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (37)..(42)
<223> n is a, c, g, or t
<400> 41
cctccctgca gtctctatgg gcacgtctgc tagtcgnnnn nntagt 46
<210> 42
<211> 45
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (4)..(9)
<223> n is a, c, g, or t
<400> 42
ctannnnnnc gactagcaga cgtgcccata gagactgcag ggagg 45
<210> 43
<211> 17
<212> DNA
<213> 人工序列
<400> 43
agtgtatgcc tgcagcc 17
<210> 44
<211> 17
<212> DNA
<213> 人工序列
<400> 44
ccgagtctct ctctggc 17
<210> 45
<211> 17
<212> DNA
<213> 人工序列
<400> 45
ggctggagcc acaacac 17
<210> 46
<211> 17
<212> DNA
<213> 人工序列
<400> 46
aactttccat tttcatt 17
<210> 47
<211> 17
<212> DNA
<213> 人工序列
<400> 47
agagtccaga gttggca 17
<210> 48
<211> 17
<212> DNA
<213> 人工序列
<400> 48
agttgaagga gttgctt 17
<210> 49
<211> 17
<212> DNA
<213> 人工序列
<400> 49
gttgttggta atgacct 17
<210> 50
<211> 17
<212> DNA
<213> 人工序列
<400> 50
tctgggaagc atttgcc 17
<210> 51
<211> 17
<212> DNA
<213> 人工序列
<400> 51
caaagacact ttcttca 17
<210> 52
<211> 17
<212> DNA
<213> 人工序列
<400> 52
gctcaatcca cagggca 17
<210> 53
<211> 17
<212> DNA
<213> 人工序列
<400> 53
cgactagcag acgtgcc 17
<210> 54
<211> 17
<212> DNA
<213> 人工序列
<400> 54
ctagcagacg tgcccat 17