基于高通量测序的诺如病毒测序引物、试剂盒及检测方法
技术领域
本发明涉及分子生物技术领域,具体涉及一种基于高通量测序的诺如病毒测序引物、试剂盒及检测方法。
背景技术
诺如病毒(norovirus,NoV)又称诺瓦克病毒,属于杯状病毒科诺如病毒属,是引起急性胃肠炎暴发的最主要病原。诺如病毒由于感染性强(约18-1000病毒颗粒即可感染)并且传播途径广(可通过水源、食物、物品、空气等传播)、传播迅速,极易在人群密集的场所如学校、医院等地引起暴发流行。根据WHO对全球食源性疾病的疾病负担评估,每年诺如病毒感染引起的急性肠胃炎病例达6亿多。由于缺乏有效的疫苗和药物,每年病毒感染引起死亡人数达21万,由此产生的直接经济损失高达42亿美元。因此,诺如病毒是威胁全球公共卫生的重要传染病病毒。近年来,我国诺如病毒感染病例数量和引起的疫情数量呈上升趋势,其中,GII诺如病毒是引起疫情的主要诺如病毒基因群。诺如病毒具有高度的遗传多样性,GII诺如病毒又可以进一步分为1-22种不同的基因型。不同的基因型的感染特性、抗原性以及流行趋势都存在差异。一些过去罕见的诺如病毒型别其变异及重组株分别于2015,2016,2017年在我国引起暴发疫情,并在全球范围内扩散。这些新的诺如病毒型别变异株由于人群普遍缺乏对其的抗体,在人群中引起更严重的诺如病毒疫情。因此,在诺如病毒监测、预警及防控中都急需能够快速、灵敏和全面检测诺如病毒基因型别的技术。
水体是诺如病毒重要的污染源,开发复杂水体样本中诺如病毒型别的检测技术一方面可以应用于暴发疫情中传染源的快速筛查和检测,另一方面通过对生活污水中诺如病毒的检测可以监测人群中循环流行的诺如病毒型别,并且可以通过实时定量分析结果发现人群中型别占比升高的诺如病毒型别,为诺如病毒疫情的预警和防控提供依据。但是,目前还缺乏系统地高通量地水体诺如病毒的检测方法。常用的荧光定量PCR的方法更是无法确认诺如病毒的具体基因型别。利用PCR结合分子克隆的方法可以发现水体中占比较高的诺如病毒型别,但此方法的显著缺陷在于分子克隆后的一代测序实验周期长、通量低、不灵敏。构建大量克隆仍然无法勾勒出水体中诺如病毒型别的完整分布,一些丰度较低的诺如病毒型别较难或无法通过传染的克隆方法监测到。
发明内容
基于此,本发明的目的在于提供一种基于高通量测序平台的多型别诺如病毒检测引物、试剂盒及高通量测序数据分析方法。
为实现上述目的,本发明提供了如下技术方案:
一种基于高通量测序平台用于诺如病毒分型检测的引物,包括第一引物、第二引物和第三引物;
所述第一引物的序列为:
CARGARBCNATGTTYAGRTGGATGAG;
所述第二引物的序列为:
CAGACGTGTGCTCTTCCGATCT(N)mTGGGAGGGCGATCGCAATC;
所述第三引物的序列为:
CCTACACGACGCTCTTCCGATCT(N)nCCWCCNGCRTRHCCRTTRTACAT;
其中,R表示碱基A或G,B表示碱基G或T或C,N表示碱基A或G或T或C,Y表示碱基C或T,W表示碱基A或T,H表示碱基A或T或C;
所述第二引物中的(N)m和所述第三引物中的(N)n为标签片段,其中,m、n分别选自6-10中的任一整数。
本发明还提供了一种用于诺如病毒分型检测的试剂盒,具体技术方案如下:
一种基于高通量测序的诺如病毒分型检测试剂盒,包含有上所述的引物。
本发明还提供了一种诺如病毒基因分型测序文库的构建方法,具体如下:
一种诺如病毒基因分型测序文库的构建方法,包括以下步骤:
(1)获得含病毒核酸的样本;
(2)以步骤(1)中提取的核酸为模板,以第一引物为上游引物,以第三引物为下游引物,进行第一轮PCR扩增;再以第二引物为上游引物,第三引物为下游引物,进行第二轮PCR扩增;
(3)对步骤(2)的扩增产物进行接头连接;
(4)纯化,得诺如病毒基因分型测序文库。
本发明还提供了一种基于高通量测序的诺如病毒分型与检测方法,具体如下:
一种基于高通量测序的诺如病毒分型与检测方法,将诺如病毒基因分型测序文库进行双端测序,所述诺如病毒基因分型测序文库由如上所述的诺如病毒基因分型测序文库的构建方法构建得到。
基于上述技术方案,本发明具有以下有益效果:
本发明基于对诺如病毒的分子进化分析,设计得到用于构建诺如病毒基因分型测序文库的引物,该引物扩增得到的片段能够有效体现诺如病毒的基因分型,且该引物扩增出的片段长度合适,可以无需进行基因片段打断,即可直接通过高通量测序平台进行双端测序,避免了需要进行打断测序时拼接过程中容易出现的同源性较高的病毒序列片段进行错误拼接而丢失正确序列的问题,使得分型测序更加高效、准确。
与传统的诺如病毒检测技术相比,本发明所述的诺如病毒检测方法不再需要分别使用特异性的引物有针对性的对某一型别进行一对一检测,而是通过建立测序文库的方法一次实验将水体中的各种诺如病毒型别进行准确区分鉴定,其准确率更高,且重复性更好;采取高深度测序,保证足够的检测深度,使假阴性更低。
附图说明
图1为利用二代高通量测序技术对环境水体中诺如病毒进行序列测定的流程图;
图2为信息学分析GII诺病毒1-22基因型病毒的序列相似性及依据保守区段设计多引物对;
图3为实施例2014-2016广州环境污水水体中检出的诺如病毒GII组的型别分布比例图;
图4为文库片段质控图;
图5为测序数据质量分析图。
具体实施方式
为了便于理解本发明,下面将参照实施例对本发明进行更全面的描述,以下给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。应理解,下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。实施例中所用到的各种常用试剂,均为市售产品。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明提供的一种用于诺如病毒分型检测的引物,包括第一引物、第二引物和第三引物;
所述第一引物的序列为:
CARGARBCNATGTTYAGRTGGATGAG;
所述第二引物的序列为:
CAGACGTGTGCTCTTCCGATCT(N)mTGGGAGGGCGATCGCAATC;
所述第三引物的序列为:
CCTACACGACGCTCTTCCGATCT(N)nCCWCCNGCRTRHCCRTTRTACAT;
所述第二引物中的(N)m和所述第三引物中的(N)n为标签片段,其中,m、n分别选自6-10中的任一整数。
R、B、N、Y、W、H均是指简并碱基,其是根据密码子的兼并性,常用一个符号代替某两个或者更多碱基。具体为:R表示碱基A或G,B表示碱基G或T或C,N表示碱基A或G或T或C,Y表示碱基C或T,W表示碱基A或T,H表示碱基A或T或C。
优选地,所述第二引物中的n选自7-9的任一整数。
更优选地,所述第二引物中的m为8,即标签片段的序列为:CAGACGTGTGCTCTTCCGATCTNNNNNNNNTGGGAGGGCGATCGCAATC。
进一步优选地,所述第二引物中的标签片段的序列选自:SEQ ID NO.4-9中的任一种。
优选地,所述第三引物的n选自7-9的任一整数。
更优选地,所述第三引物中的n为8,即标签片段的序列为:CCTACACGACGCTCTTCCGATCTNNNNNNNNCCWCCNGCRTRHCCRTTRTACAT。
进一步优选地,所述第三引物中的标签片段的序列选自:SEQ ID NO.10-SEQ IDNO.15中的任一种。
本发明的发明人前期做了大量诺如病毒的分子进化分析,发现诺如病毒340bp左右的VP1序列可以准确的进行诺如病毒基因分型,同时片段长度又保证了较高的PCR扩增效率,并且340bp左右的长度可以不打断直接通过Illumina NGS平台的PE250Hiseq进行双端测序,这大大减少了拼接过程中错误的发生。因为如果测序长度较长,则需要进行打断测序,测序数据在进行拼接过程中如同源性较高的病毒序列则可能进行错误拼接,人为产生错误的诺如病毒序列而丢失正确的序列。确认最适合的PCR产物长度后,发明人采集大量诺如病毒临床样本进行测序,同时收集已公开发表的诺如病毒基因序列,通过Aliview软件进行多重序列比对,利用Geneious软件分析GII组诺如病毒1-22个基因型VP1区域的保守区段。从而设计得到上述引物,设定PCR产物为300-450bp,设计40对PCR引物(图1),然后根据与多重比对序列的匹配度及反应条件筛选5对PCR引物利用阳性样本验证,最后筛选出灵敏度最高的3条引物用作巢式PCR扩增引物。由此,利用本发明的方法能够快速、简单且特异性扩增出GII诺如病毒VP1片段,且经实例比较灵敏度较常规的荧光PCR更高。
本发明通过对于第二引物和第三引物中标签序列的设计,采用上述优选的引物序列,在第二步扩增时,引入Barcode标签片段,其包括了36种不同的序列组合,将其进行建库,可以实现1-36任一数量的水样样本混合建库,优化了建库过程,保证数据量的同时大大降低了测序成本。
优选地,所述构建诺如病毒基因分型测序文库的引物,还包括特异性接头,所述特异性接头包括正向接头和反向接头,所述正向接头的序列为:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCGTACACGACGCTGTTCCGATCT
所述反向接头的序列为:
CAAGCAGAAGACGGCATACGAGAT(N)aGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT
所述反向接头的序列中(N)a为标签片段,其中,a选自6-10中的任一整数。
优选地,a选自6-8中的任一整数。
在其中一些实施例中,a为6。优选地,所述反向接头中的标签片段选自SEQ IDNO.18-SEQ ID NO.29。
本发明还提供了如上所述的引物在制备试剂盒中的应用,所述试剂盒为用于诺如病毒分型检测的试剂盒。具体可以为:用于构建诺如病毒基因分型测序文库和/或用于诺如病毒基因分型测序的试剂盒和/或用于检测诺如病毒的试剂盒。
本发明还提供了一种用于诺如病毒分型检测的试剂盒,其中包含有如上所述的引物。
本发明还提供了一种诺如病毒基因分型测序文库的构建方法,包括以下步骤:(1)获得病毒核酸样本;(2)以步骤(1)中提取的核酸为模板,以第一引物为上游引物,以第三引物为下游引物,进行第一轮PCR扩增;再以第二引物为上游引物,第三引物为下游引物,进行第二轮PCR扩增;(3)对步骤(2)的扩增产物进行接头连接;(4)纯化,得诺如病毒基因分型测序文库。
优选地,所述获得病毒核酸样本的步骤为:采集的待测样本经离心去除沉淀物后,加入MgCl2,再加入HCl调节pH至3.5-4.0;阴离子膜过滤,待测样本中的病毒吸附在阴离子膜上;洗脱吸附在阴离子膜上的病毒,提取核酸,即得。
在其中一些实施例中,所述获得病毒核酸是指获得水体中的病毒核酸。
优选地,所述获得水体中病毒核酸的步骤为:采集的水体样本经离心去除沉淀物后,加入MgCl2,再加入HCl调节pH至3.5-4.0;阴离子膜过滤,是水体样本中的病毒吸附在阴离子膜上;洗脱吸附在阴离子膜上的病毒,提取核酸,即得。
更优选地,所述获得水体中的病毒核酸的步骤中,所述离心为于3-8℃下2500r/min-3000r/min离心20-40min。更优选为于4℃、3000r/min离心30min。
优选的,所述加入MgCl2为边搅拌边缓慢加入2-3M的MgCl2溶液,使其终浓度为0.04-0.06M。更优选为2.5M的MgCl2溶液,使水体样本中MgCl2的终浓度为0.05M。
优选地,阴离子膜过滤的具体步骤为:将滤纸、阴离子膜先后放置于安装好的过滤器中,然后把上述调整好pH后的水样转移至过滤器中,连接过滤器与正压泵,调节进气阀和出气阀控制水样流速,使水样尽可能慢流出而病毒吸附在阴离子膜上。
优选地,洗脱吸附在阴离子膜上的病毒为:取出阴离子膜,剪碎后置于装有牛肉膏浸出液离心管中,超声洗脱吸附在阴离子膜上的病毒,然后经离心沉降洗脱液中的纸屑,取上清。
本发明还提供了一种非诊断目的的诺如病毒的检测方法,将诺如病毒基因分型测序文库进行双端测序,所述诺如病毒基因分型测序文库由如上所述的构建方法构建得到。
优选地,所述双端测序为采用采用Illumina平台进行双端测序。
优选地,所述诺如病毒基因分型测序文库的平均片段长度为400-450bp。所述双端测序的测序长度为PE250。诺如病毒基因分型测序文库中的平均片段长度为400-450bp时,基于此特征,可以使用PE250直接双端测序,克服了传统方法中对基因片段进行打断后可能由于序列相似性而无法准确拼接的难点。
本发明中,Illumina建库的插入片段设计为340bp左右,设置NGS平台的测序长度为PE250。具体的,可以进行PE250测序的NGS平台为Hiseq测序平台。本发明中,测序长度为PE250,文库片段为400-450bp;因此,在PE250的测序长度下通过双端测序可以准确的测定插入片段;不需要进行打断测序,并且测序结果也只要进行双端测序的配对拼接,简化步骤的同时避免了打断测序后由于同源性高引起的拼接错误。通过对测序数据进行信息分析,可以获得完整的扩增产物全长。
优选地,诺如病毒基因分型测序方法还包括对原始测序数据进行分析的步骤:数据过滤、序列拆分、两端连接、序列聚类、本地数据库比对以及诺如病毒型别注释及比例计算。
优选地,对原始测序数据进行分析的步骤,具体包括:去除接头污染序列;去除包含无法确定的碱基数目大于10的序列;去除测序质量小于Q30的reads;
结合Barcode序列对所有reads序列进行拆分;
双向测序的序列通过Flash进行拼接;
利用USsearch聚类,再利用本地数据库对诺如病毒型别进行比对和注释。
优选地,所述利用本地数据库对诺如病毒型别进行比对和注释包括以下步骤:利用GII诺如病毒代表序列构建本地数据库,规范化数据库中诺如病毒的型别分类名称;通过Blastn对聚类后的序列进行比对和注释,注释包括聚类序列的诺如病毒基因型、序列相似度、reads数量以及占所在水体样本中总GII诺如病毒的比例。本发明构建了本地诺如病毒基因数据库,通过编写脚本完成对测序数据进行批量的自动化信息分析,获得样本中诺如病毒的基因型别及其分布比例。
在其中一些实施例中,所述非诊断目的的诺如病毒的检测方法可以用于水体样本、食品样本、呕吐物或粪便样本。
本申请基于高通量的NGS平台对通用的PCR产物进行测序,相比于传统的分子克隆加Sanger测序方法,本申请的高通量测序及分析方法效率更高,并且,降低了时间和人工成本,解决了低质量DNA不能进行测序的问题,同时也能挖掘到Sanger测序不能获得的少见或罕见病毒型别。
本申请构建的诺如病毒的检测方法不但可以用于水体中诺如病毒检测,同时也可以应用于其它样本如食品中GII诺如病毒二代测序分析。信息分析包括数据过滤、序列拆分和两端连接、序列聚类、本地数据库比对以及诺如病毒型别注释及比例计算;所述数据过滤包括,a)去除接头污染序列,b)去除包含N数目大于10的序列,c)去除低质量reads(测序质量小于Q30的reads);所述序列拆分和两端连接包括,结合Barcode序列对所有reads序列进行拆分;双向测序的序列通过Flash进行拼接,针对诺如病毒PCR结果设定匹配序列大于10bp,不匹配位点/匹配位点比例小于0.2作为参数获得最优的拼接结果(平衡获取拼接的序列数量与正确拼接的序列数量);拼接后的序列利用USearch聚类,再利用本地数据库进行比对和注释,包括,a)利用GII诺如病毒代表序列构建本地数据库,规范化数据库中诺如病毒的型别分类名称,通过Blastn对聚类后的序列进行比对和注释,注释包括聚类序列的诺如病毒基因型、序列相似度、reads数量以及占所在水体样本中总GII诺如病毒的比例。
本发明所述的诺如病毒的检测方法,通过本申请特殊的信息分析,能够获得更加准确的全面的诺如病毒型别分布及其相对比例关系,为后续评判诺如病毒流行趋势及预警奠定了坚实的基础。
实施例1
1、病毒的浓缩与富集
采用阴离子膜吸附-超声波振荡法对环境水体中的病毒进行浓缩富集。具体实验操作步骤如下:
(1)将采集的污水标本经4℃、3000r/min离心30min,使标本中的悬浮物(包括泥砂、黏土及不溶于水的无机物、有机物、微生物等)沉降于瓶底;
(2)取上述上清液至装有转子的无菌大烧杯内,置于磁力搅拌器上,边搅拌边缓慢加入2.5M的MgCl2溶液,使其终浓度为0.05M;再加入0.5M的HCl调节PH值至3.5-4.0;
(3)将滤纸、阴离子膜先后放置于安装好的过滤器中,然后把上述调整好pH后的水样转移至过滤器中,连接过滤器与正压泵,调节进气阀和出气阀控制水样流速,使水样尽可能慢流出而病毒吸附在阴离子膜上;
(4)取出阴离子膜,用无菌剪刀剪碎后置于装有10ml 3%的牛肉膏浸出液离心管中,使用超声波振荡仪在冰上振荡1min,以洗脱吸附在阴离子膜上的病毒,然后经4℃、3000r/min离心30min沉降洗脱液中的纸屑;
(5)吸出上清液,以直径20nm滤膜过滤除去上清液中的细菌,置于-20℃保存。
2、病毒核酸提取
使用Fisher Scientific公司的LabSerb Prefilled Viral Total RNA Kit试剂盒(批号:KFRPF-805296)提取核酸,具体操作参照说明书程序进行,提取后冻存于-80℃待用。
3、PCR扩增与鉴定
扩增方法为巢式PCR法,反应条件如下:
第1轮扩增引物为引物1和引物3(引物序列见表1),反应体系为25ul,模板用量为5ul,扩增程序为:50℃30min;94℃2min;进入循环,94℃变性30s,52℃退火30s和72℃延伸1min,共40个循环;72℃延伸7min;
取第1轮反应物2ul用于第2轮,扩增引物为引物2和引物3(引物序列见表1),反应体系为50ul,扩增程序为:94℃5min;进入循环,94℃变性30s,52℃退火30s和72℃延伸30s,共35个循环;72℃延伸7min。
表1
其中,引物2包含三部分:3’端与GII诺如病毒VP1序列互补;5’端为22bp固定序列片段;两端由中间部分“NNNNNNNN”为8bp碱基组成的标签序列连接,标签序列用于辅助样本识别。
引物3包含三部分:3’端与GII诺如病毒VP1序列互补;5’端为23bp的固定序列片段;两端由中间部分“NNNNNNNN”为8bp碱基组成的标签序列连接,用于辅助样本识别。
标签序列选自如表2所示的序列:
表2引物2和引物3的标签序列
引物2的标签序列(5’→3’) |
SEQ ID NO. |
引物3的标签序列(5’→3’) |
SEQ ID NO. |
AGTCACTA |
4 |
CTCAATGA |
10 |
ATCCTGTA |
5 |
CTGAGCCA |
11 |
ATTGAGGA |
6 |
CTGGCATA |
12 |
CAACCACA |
7 |
GAATCTGA |
13 |
GACTAGTA |
8 |
CAAGACTA |
14 |
CAATGGAA |
9 |
GAGCTGAA |
15 |
4.接头连接
依据顺序依次加入试剂及样本,进行接头连接:PCR反应缓冲液,13.5μL;特异性接头,1-3μL;PCR纯化产物,1-10.5μL;无核酸酶水,补至25μL。
反应程序为:(I)95℃,5min;(II)95℃,15s;60℃,30s;72℃,30s;5-20个循环;(III)72℃,5min。
其中,上述特异性接头由P5上游引物和P7下游引物组成:
P5(SEQ ID NO.16):
AATGATACGGCGACCACCGAGATCTACACTCTTTCCGTACACGACGCTGTTCCGATCTP7:
CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC-s-T(SEQ ID NO.17)
其中,s是指硫代修饰,主要起封闭作用,用于反义实验中防止被核酸酶降。
其中,P7包含三部分,3’端和5’端中间部分“NNNNNN”6bp碱基组成的标签序列连接而成,标签序列用于样本识别。表现序列选自:
表3
5.磁珠纯化
取AMPure XP Beads(Beckman Coulter,Inc.)涡旋震荡使其悬浮,室温平衡30min;
转移PCR反应液至1.5mL离心管中,加入25μL(1X)悬浮的Agencourt AMPure XPBeads,用涡旋振荡器混匀或用移液器至少上下吹打10次;
室温静置5分钟;
将离心管放置于磁力架,静置5min,以分离磁珠和上清液。当溶液澄清后,去除上清(注意:不要碰到磁珠);
加入200μL新配的80%乙醇于管中,室温放置30秒,然后小心移除上清;
重复用80%乙醇清洗一次;
对离心管瞬时离心,将管放置于磁力架,打开管盖,风干5分钟(注意:不要过度风干磁珠,影响DNA得率);
离心管中加入23μL无菌水,用涡旋振荡器充分混匀或用移液器上下吹打,室温放置2分钟,溶液澄清后转移上清至新的PCR管中;
6.质检
采用Qubit 3.0和Qseq 100全自动核酸蛋白分析系统检测文库质量。
7.利用二代高通量测序技术对水体中诺如病毒进行序列测定和分析
上述PCR扩增产物,经过定性和定量检测,对于满足质量要求的可直接进入文库构建,利用Illumina Hiseq PE250进行测序。
获得原始测序数据后,通过FastQC对测序数据进行过滤,具体包括:a)去除接头污染序列,b)去除包含N数目大于10的序列,c)去除低质量reads(测序质量小于Q30的reads);然后序列拆分和两端连接包括,结合Barcode序列对所有reads序列进行拆分,针对诺如病毒PCR结果设定匹配序列大于10bp,不匹配位点/匹配位点比例小于0.2作为参数获得最优的拼接结果(平衡获取拼接的序列数量与正确拼接的序列数量);双向测序的序列通过Flash进行拼接;拼接后的序列利用USearch聚类,再利用本地数据库进行比对和注释,注释内容包括聚类序列的诺如病毒基因型、序列相似度、reads数量以及占所在水体样本中总GII诺如病毒的比例。
通过上述方法分析广州市环境污水2014-2016年每月诺如型别分布及其比例,通过与人群诺如病毒暴发疫情中的病毒型别分布比较,可以发现:(1)引起人群诺如病毒疫情的基因型在污水中占比也较高;(2)2016年11月新的变异型别GII.2在人群中暴发流行,通过本发明方法我们在8月份环境污水中检测出GII.2新变异的诺如型别,并在10月其比例大幅增加(图3)。因此,将本发明方法应用到环境水体诺如病毒的监测可以为诺如病毒的防控预警提供重要的科学依据。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 广东省公共卫生研究院
广东省疾病预防控制中心
<120> 基于高通量测序的诺如病毒测序引物、试剂盒及检测方法
<160> 29
<170> SIPOSequenceListing 1.0
<210> 1
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
cargarbcna tgttyagrtg gatgag 26
<210> 2
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
cagacgtgtg ctcttccgat ctnnnnnnnn tgggagggcg atcgcaatc 49
<210> 3
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
cctacacgac gctcttccga tctnnnnnnn nccwccngcr trhccrttrt acat 54
<210> 4
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
agtcacta 8
<210> 5
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
atcctgta 8
<210> 6
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
attgagga 8
<210> 7
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
caaccaca 8
<210> 8
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
gactagta 8
<210> 9
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
caatggaa 8
<210> 10
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ctcaatga 8
<210> 11
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
ctgagcca 8
<210> 12
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ctggcata 8
<210> 13
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gaatctga 8
<210> 14
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
caagacta 8
<210> 15
<211> 8
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gagctgaa 8
<210> 16
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
aatgatacgg cgaccaccga gatctacact ctttccgtac acgacgctgt tccgatct 58
<210> 17
<211> 64
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60
atct 64
<210> 18
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
cgtgat 6
<210> 19
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
acatcg 6
<210> 20
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
gcctaa 6
<210> 21
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tggtca 6
<210> 22
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
cactgt 6
<210> 23
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
attggc 6
<210> 24
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gatctg 6
<210> 25
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
tcaagt 6
<210> 26
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ctgagc 6
<210> 27
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
aagcta 6
<210> 28
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gtagcc 6
<210> 29
<211> 6
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
tacaag 6