一种检测STR位点的高通量测序文库构建方法
技术领域
本发明涉及生物技术领域,特别是涉及一种高通量测序文库的构建方法。
背景技术
短串联重复序列(short tandem repeat,STR)是广泛存在于人类基因组中的一类具有长度多态性的DNA序列,由2~6个碱基对构成核心序列,呈串联重复排列,其长度多态性主要由核心序列拷贝数目的变化而产生。由于核心序列重复次数的个体间差异,多数STR基因具有多态性。一般认为,人类基因组平均每6~10kb就有1个STR基因座,约占人基因组的10%,为法医个人识别和亲子鉴定提供了高信息基因座的丰富来源。基于多重PCR扩增和毛细管电泳(capillary electrophoresis,CE)的STR分析方法已经成为法医遗传学的金标准。
高通量测序(next generation sequencing,NGS)技术检测STR相比传统的STR分型技术而言,不仅能够获得扩增产物长度的信息,并且不受同一荧光标记的STR基因座片段不能重叠的限制,能同步对多个基因座进行DNA序列的测定。基于NGS平台的STR扩增产物片段长度相对较短,可以减少多重扩增中不同PCR模板长度差异导致的扩增偏差,并且能够提高对微量和降解检材的检验能力。另外,NGS技术通过在目的基因两端连接特异性的标签序列来识别不同样本,能够容纳多达数十上百个样本同时检测,大大提高检测效率,具有更大的高通量潜力。
NGS检测方法同时还能得到各STR位点重复区域及其侧翼区中所包含的亚重复序列数目变异、单核苷酸多态性(SNP)、插入/缺失多态性等序列变异信息,从而在等位基因长度分型基础上进一步增加了等位基因多态性,有利于混合样本和复杂亲缘关系鉴定等疑难案件的解决。
采用NGS对混合DNA样本进行分析,能够获得各STR基因座等位基因长度分型和序列变异信息,这些信息的综合应用可对部分与滑脱复制产生的序列重叠的等位基因以及主要组分与次要组分的共享等位基因进行区分。这为混合DNA样本的分析提供了一个新的研究方向,更有利于法医实际案件的解决。
基于以上优势,NGS有望成PCR-CE STR分型技术的一种替代或补充方法,以此来克服PCR-CE技术的局限性,从而获得更高的个体识别能力。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种高通量测序文库的构建方法,用于解决现有技术中的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种高通量测序文库的构建方法,包括:
1)提供基因组DNA;
2)扩增STR位点以产生所述高通量测序文库;
所述STR位点包括:D10S1208、D10S1239、D10S1425、D10S1426、D10S1427、D11S1997、D11S2362、D11S2364、D12S1064、D12S1300、D12S1301、D12S2078、D12S2080、D12S395、D14S1434、D14S588、D15S1507、D16S752、D17S1290、D17S1303、D17S2193、D17S968、D18S1364、D18S536、D18S851、D18S976、D19S1165、D1S1656、D1S2141、D1S3734、D1S549、D1S551、D21S226、D22S534、D2S405、D2S441、D3S1766、D3S1768、D3S2431、D3S2452、D3S2459、D3S2460、D3S3041、D4S1629、D4S2364、D4S2366、D4S2397、D4S2408、D4S2417、D4S3251、D5S1459、D5S820、D6S1021、D6S1266、D6S1275、D6S1277、D6S477、D7S1817、D7S1823、D7S3051、D7S3052、D8S1100、D8S1104、D8S1105、D8S1119、D8S1458、D8S1471、D9S2128、D9S2156。
本发明另一方面提供一种用于个体识别的方法,所述方法包括:
i)根据上述的高通量测序文库的构建方法构建高通量测序文库;
ii)对步骤i)所提供的高通量测序文库进行测序。
本发明另一方面提供一种高通量测序文库,由上述的高通量测序文库的构建方法构建获得。
本发明另一方面提供一种试剂盒,所述试剂盒包括适于进行上述的方法的试剂和/或组合物。
具体实施方式
为了使本发明的发明目的、技术方案和有益技术效果更加清晰,以下结合实施例对本发明进行进一步详细说明,熟悉此技术的人士可由本说明书所揭露的内容容易地了解本申请发明的其他优点及功效。
本发明发明人经过大量研究发现,对人类基因组上多态性高的STR位点通过特定的引物同时进行扩增并构建高通量测序文库,进行测序以后可以由测序数据进行个体识别,在此基础上完成了本发明。
本发明第一方面提供一种高通量测序文库的构建方法,包括:
1)提供基因组DNA;
2)扩增STR位点以产生所述高通量测序文库;
所述STR位点包括:D10S1208、D10S1239、D10S1425、D10S1426、D10S1427、D11S1997、D11S2362、D11S2364、D12S1064、D12S1300、D12S1301、D12S2078、D12S2080、D12S395、D14S1434、D14S588、D15S1507、D16S752、D17S1290、D17S1303、D17S2193、D17S968、D18S1364、D18S536、D18S851、D18S976、D19S1165、D1S1656、D1S2141、D1S3734、D1S549、D1S551、D21S226、D22S534、D2S405、D2S441、D3S1766、D3S1768、D3S2431、D3S2452、D3S2459、D3S2460、D3S3041、D4S1629、D4S2364、D4S2366、D4S2397、D4S2408、D4S2417、D4S3251、D5S1459、D5S820、D6S1021、D6S1266、D6S1275、D6S1277、D6S477、D7S1817、D7S1823、D7S3051、D7S3052、D8S1100、D8S1104、D8S1105、D8S1119、D8S1458、D8S1471、D9S2128、D9S2156。
本发明所提供的高通量测序文库的构建方法中,可以包括:提供基因组DNA。所述基因组DNA通常是人源的。合适的提供基因组DNA的方法对于本领域技术人员来说应该是已知的,例如,可以通过磁珠法、离心柱法、抽滤法和酚氯仿法等方法提供基因组DNA。
本发明所提供的高通量测序文库的构建方法中,可以包括:扩增STR位点以产生所述高通量测序文库。所述STR位点通常具有长度多态性,长度多态性来源于重复单元拷贝数的个体差异。STR多态性可以由其在人群中的杂合度来量化,杂合度指群体中某遗传标记所有基因型中杂合子所占的比例。本申请所选定的STR位点通常具有较高的杂合度,例如,杂合度可以大于0.5。通常来说,合适的扩增引物以及扩增策略可以有利于获得理想的高通量测序文库。
所述构建方法中,所述步骤2)中,扩增STR位点以产生所述高通量测序文库的方法可以包括:a)通过特异性针对STR位点的引物扩增STR位点,所述特异性针对STR位点的上游引物的5’端与第一接头序列互补、或与第一接头序列的3’端的部分序列互补,所述特异性针对STR位点的下游引物的5’端与第二接头序列互补、或与第二接头序列3’端的部分序列互补。所述接头通常用于锚定目标位点的扩增产物,以便于后续对扩增产物进行测序。上述扩增过程通常为一次扩增,且对各STR位点的扩增通常在同一扩增体系中进行,即可一次性同时检测多个STR位点,提高了检测通量,相对传统STR检测,大大缩短了检测周期。通常上述扩增获得的扩增产物可以通过接头引物,进一步扩增,以获得理想的高通量测序文库。合适的PCR扩增条件对于本领域技术人员来说应该是已知的,例如,所述步骤a)中,PCR扩增中,每一个循环通常包括DNA变性、退火、延伸等步骤,再例如,还可以包括预变性、最后延伸等步骤,再例如,所述步骤a)中,扩增体系可以包括基因组DNA、特异性针对STR位点的引物、水性介质、DNA聚合酶、镁离子、四种脱氧核糖核苷三磷酸等。所述步骤a)中,通常还可以对扩增产物进行纯化,合适的对PCR产物进行纯化的方法对于本领域技术人员来说应该是已知的,例如,可以使用磁珠法、胶回收法等。
在本发明一具体实施例中,所述步骤a)中,特异性针对D10S1208的上游引物的多核苷酸序列包括SEQ ID NO.1所示的序列,特异性针对D10S1208的下游引物的多核苷酸序列包括SEQ ID NO.2所示的序列;
所述步骤a)中,特异性针对D10S1239的上游引物的多核苷酸序列包括SEQ IDNO.3所示的序列,特异性针对D10S1239的下游引物的多核苷酸序列包括SEQ ID NO.4所示的序列;
所述步骤a)中,特异性针对D10S1425的上游引物的多核苷酸序列包括SEQ IDNO.5所示的序列,特异性针对D10S1425的下游引物的多核苷酸序列包括SEQ ID NO.6所示的序列;
所述步骤a)中,特异性针对D10S1426的上游引物的多核苷酸序列包括SEQ IDNO.7所示的序列,特异性针对D10S1426的下游引物的多核苷酸序列包括SEQ ID NO.8所示的序列;
所述步骤a)中,特异性针对D10S1427的上游引物的多核苷酸序列包括SEQ IDNO.9所示的序列,特异性针对D10S1427的下游引物的多核苷酸序列包括SEQ ID NO.10所示的序列;
所述步骤a)中,特异性针对D11S1997的上游引物的多核苷酸序列包括SEQ IDNO.11所示的序列,特异性针对D11S1997的下游引物的多核苷酸序列包括SEQ ID NO.12所示的序列;
所述步骤a)中,特异性针对D11S2362的上游引物的多核苷酸序列包括SEQ IDNO.13所示的序列,特异性针对D11S2362的下游引物的多核苷酸序列包括SEQ ID NO.14所示的序列;
所述步骤a)中,特异性针对D11S2364的上游引物的多核苷酸序列包括SEQ IDNO.15所示的序列,特异性针对D11S2364的下游引物的多核苷酸序列包括SEQ ID NO.16所示的序列;
所述步骤a)中,特异性针对D12S1064的上游引物的多核苷酸序列包括SEQ IDNO.17所示的序列,特异性针对D12S1064的下游引物的多核苷酸序列包括SEQ ID NO.18所示的序列;
所述步骤a)中,特异性针对D12S1300的上游引物的多核苷酸序列包括SEQ IDNO.19所示的序列,特异性针对D12S1300的下游引物的多核苷酸序列包括SEQ ID NO.20所示的序列;
所述步骤a)中,特异性针对D12S1301的上游引物的多核苷酸序列包括SEQ IDNO.21所示的序列,特异性针对D12S1301的下游引物的多核苷酸序列包括SEQ ID NO.22所示的序列;
所述步骤a)中,特异性针对D12S2078的上游引物的多核苷酸序列包括SEQ IDNO.23所示的序列,特异性针对D12S2078的下游引物的多核苷酸序列包括SEQ ID NO.24所示的序列;
所述步骤a)中,特异性针对D12S2080的上游引物的多核苷酸序列包括SEQ IDNO.25所示的序列,特异性针对D12S2080的下游引物的多核苷酸序列包括SEQ ID NO.26所示的序列;
所述步骤a)中,特异性针对D12S395的上游引物的多核苷酸序列包括SEQ IDNO.27所示的序列,特异性针对D12S395的下游引物的多核苷酸序列包括SEQ ID NO.28所示的序列;
所述步骤a)中,特异性针对D14S1434的上游引物的多核苷酸序列包括SEQ IDNO.29所示的序列,特异性针对D14S1434的下游引物的多核苷酸序列包括SEQ ID NO.30所示的序列;
所述步骤a)中,特异性针对D14S588的上游引物的多核苷酸序列包括SEQ IDNO.31所示的序列,特异性针对D14S588的下游引物的多核苷酸序列包括SEQ ID NO.32所示的序列;
所述步骤a)中,特异性针对D15S1507的上游引物的多核苷酸序列包括SEQ IDNO.33所示的序列,特异性针对D15S1507的下游引物的多核苷酸序列包括SEQ ID NO.34所示的序列;
所述步骤a)中,特异性针对D16S752的上游引物的多核苷酸序列包括SEQ IDNO.35所示的序列,特异性针对D16S752的下游引物的多核苷酸序列包括SEQ ID NO.36所示的序列;
所述步骤a)中,特异性针对D17S1290的上游引物的多核苷酸序列包括SEQ IDNO.37所示的序列,特异性针对D17S1290的下游引物的多核苷酸序列包括SEQ ID NO.38所示的序列;
所述步骤a)中,特异性针对D17S1303的上游引物的多核苷酸序列包括SEQ IDNO.39所示的序列,特异性针对D17S1303的下游引物的多核苷酸序列包括SEQ ID NO.40所示的序列;
所述步骤a)中,特异性针对D17S2193的上游引物的多核苷酸序列包括SEQ IDNO.41所示的序列,特异性针对D17S2193的下游引物的多核苷酸序列包括SEQ ID NO.42所示的序列;
所述步骤a)中,特异性针对D17S968的上游引物的多核苷酸序列包括SEQ IDNO.43所示的序列,特异性针对D17S968的下游引物的多核苷酸序列包括SEQ ID NO.44所示的序列;
所述步骤a)中,特异性针对D18S1364的上游引物的多核苷酸序列包括SEQ IDNO.45所示的序列,特异性针对D18S1364的下游引物的多核苷酸序列包括SEQ ID NO.46所示的序列;
所述步骤a)中,特异性针对D18S536的上游引物的多核苷酸序列包括SEQ IDNO.47所示的序列,特异性针对D18S536的下游引物的多核苷酸序列包括SEQ ID NO.48所示的序列;
所述步骤a)中,特异性针对D18S851的上游引物的多核苷酸序列包括SEQ IDNO.49所示的序列,特异性针对D18S851的下游引物的多核苷酸序列包括SEQ ID NO.50所示的序列;
所述步骤a)中,特异性针对D18S976的上游引物的多核苷酸序列包括SEQ IDNO.51所示的序列,特异性针对D18S976的下游引物的多核苷酸序列包括SEQ ID NO.52所示的序列;
所述步骤a)中,特异性针对D19S1165的上游引物的多核苷酸序列包括SEQ IDNO.53所示的序列,特异性针对D19S1165的下游引物的多核苷酸序列包括SEQ ID NO.54所示的序列;
所述步骤a)中,特异性针对D1S1656的上游引物的多核苷酸序列包括SEQ IDNO.55所示的序列,特异性针对D1S1656的下游引物的多核苷酸序列包括SEQ ID NO.56所示的序列;
所述步骤a)中,特异性针对D1S2141的上游引物的多核苷酸序列包括SEQ IDNO.57所示的序列,特异性针对D1S2141的下游引物的多核苷酸序列包括SEQ ID NO.58所示的序列;
所述步骤a)中,特异性针对D1S3734的上游引物的多核苷酸序列包括SEQ IDNO.59所示的序列,特异性针对D1S3734的下游引物的多核苷酸序列包括SEQ ID NO.60所示的序列;
所述步骤a)中,特异性针对D1S549的上游引物的多核苷酸序列包括SEQ ID NO.61所示的序列,特异性针对D1S549的下游引物的多核苷酸序列包括SEQ ID NO.62所示的序列;
所述步骤a)中,特异性针对D1S551的上游引物的多核苷酸序列包括SEQ ID NO.63所示的序列,特异性针对D1S551的下游引物的多核苷酸序列包括SEQ ID NO.64所示的序列;
所述步骤a)中,特异性针对D21S226的上游引物的多核苷酸序列包括SEQ IDNO.65所示的序列,特异性针对D21S226的下游引物的多核苷酸序列包括SEQ ID NO.66所示的序列;
所述步骤a)中,特异性针对D22S534的上游引物的多核苷酸序列包括SEQ IDNO.67所示的序列,特异性针对D22S534的下游引物的多核苷酸序列包括SEQ ID NO.68所示的序列;
所述步骤a)中,特异性针对D2S405的上游引物的多核苷酸序列包括SEQ ID NO.69所示的序列,特异性针对D2S405的下游引物的多核苷酸序列包括SEQ ID NO.70所示的序列;
所述步骤a)中,特异性针对D2S441的上游引物的多核苷酸序列包括SEQ ID NO.71所示的序列,特异性针对D2S441的下游引物的多核苷酸序列包括SEQ ID NO.72所示的序列;
所述步骤a)中,特异性针对D3S1766的上游引物的多核苷酸序列包括SEQ IDNO.73所示的序列,特异性针对D3S1766的下游引物的多核苷酸序列包括SEQ ID NO.74所示的序列;
所述步骤a)中,特异性针对D3S1768的上游引物的多核苷酸序列包括SEQ IDNO.75所示的序列,特异性针对D3S1768的下游引物的多核苷酸序列包括SEQ ID NO.76所示的序列;
所述步骤a)中,特异性针对D3S2431的上游引物的多核苷酸序列包括SEQ IDNO.77所示的序列,特异性针对D3S2431的下游引物的多核苷酸序列包括SEQ ID NO.78所示的序列;
所述步骤a)中,特异性针对D3S2452的上游引物的多核苷酸序列包括SEQ IDNO.79所示的序列,特异性针对D3S2452的下游引物的多核苷酸序列包括SEQ ID NO.80所示的序列;
所述步骤a)中,特异性针对D3S2459的上游引物的多核苷酸序列包括SEQ IDNO.81所示的序列,特异性针对D3S2459的下游引物的多核苷酸序列包括SEQ ID NO.82所示的序列;
所述步骤a)中,特异性针对D3S2460的上游引物的多核苷酸序列包括SEQ IDNO.83所示的序列,特异性针对D3S2460的下游引物的多核苷酸序列包括SEQ ID NO.84所示的序列;
所述步骤a)中,特异性针对D3S3041的上游引物的多核苷酸序列包括SEQ IDNO.85所示的序列,特异性针对D3S3041的下游引物的多核苷酸序列包括SEQ ID NO.86所示的序列;
所述步骤a)中,特异性针对D4S1629的上游引物的多核苷酸序列包括SEQ IDNO.87所示的序列,特异性针对D4S1629的下游引物的多核苷酸序列包括SEQ ID NO.88所示的序列;
所述步骤a)中,特异性针对D4S2364的上游引物的多核苷酸序列包括SEQ IDNO.89所示的序列,特异性针对D4S2364的下游引物的多核苷酸序列包括SEQ ID NO.90所示的序列;
所述步骤a)中,特异性针对D4S2366的上游引物的多核苷酸序列包括SEQ IDNO.91所示的序列,特异性针对D4S2366的下游引物的多核苷酸序列包括SEQ ID NO.92所示的序列;
所述步骤a)中,特异性针对D4S2397的上游引物的多核苷酸序列包括SEQ IDNO.93所示的序列,特异性针对D4S2397的下游引物的多核苷酸序列包括SEQ ID NO.94所示的序列;
所述步骤a)中,特异性针对D4S2408的上游引物的多核苷酸序列包括SEQ IDNO.95所示的序列,特异性针对D4S2408的下游引物的多核苷酸序列包括SEQ ID NO.96所示的序列;
所述步骤a)中,特异性针对D4S2417的上游引物的多核苷酸序列包括SEQ IDNO.97所示的序列,特异性针对D4S2417的下游引物的多核苷酸序列包括SEQ ID NO.98所示的序列;
所述步骤a)中,特异性针对D4S3251的上游引物的多核苷酸序列包括SEQ IDNO.99所示的序列,特异性针对D4S3251的下游引物的多核苷酸序列包括SEQ ID NO.100所示的序列;
所述步骤a)中,特异性针对D5S1459的上游引物的多核苷酸序列包括SEQ IDNO.101所示的序列,特异性针对D5S1459的下游引物的多核苷酸序列包括SEQ ID NO.102所示的序列;
所述步骤a)中,特异性针对D5S820的上游引物的多核苷酸序列包括SEQ IDNO.103所示的序列,特异性针对D5S820的下游引物的多核苷酸序列包括SEQ ID NO.104所示的序列;
所述步骤a)中,特异性针对D6S1021的上游引物的多核苷酸序列包括SEQ IDNO.105所示的序列,特异性针对D6S1021的下游引物的多核苷酸序列包括SEQ ID NO.106所示的序列;
所述步骤a)中,特异性针对D6S1266的上游引物的多核苷酸序列包括SEQ IDNO.107所示的序列,特异性针对D6S1266的下游引物的多核苷酸序列包括SEQ ID NO.108所示的序列;
所述步骤a)中,特异性针对D6S1275的上游引物的多核苷酸序列包括SEQ IDNO.109所示的序列,特异性针对D6S1275的下游引物的多核苷酸序列包括SEQ ID NO.110所示的序列;
所述步骤a)中,特异性针对D6S1277的上游引物的多核苷酸序列包括SEQ IDNO.111所示的序列,特异性针对D6S1277的下游引物的多核苷酸序列包括SEQ ID NO.112所示的序列;
所述步骤a)中,特异性针对D6S477的上游引物的多核苷酸序列包括SEQ IDNO.113所示的序列,特异性针对D6S477的下游引物的多核苷酸序列包括SEQ ID NO.114所示的序列;
所述步骤a)中,特异性针对D7S1817的上游引物的多核苷酸序列包括SEQ IDNO.115所示的序列,特异性针对D7S1817的下游引物的多核苷酸序列包括SEQ ID NO.116所示的序列;
所述步骤a)中,特异性针对D7S1823的上游引物的多核苷酸序列包括SEQ IDNO.117所示的序列,特异性针对D7S1823的下游引物的多核苷酸序列包括SEQ ID NO.118所示的序列;
所述步骤a)中,特异性针对D7S3051的上游引物的多核苷酸序列包括SEQ IDNO.119所示的序列,特异性针对D7S3051的下游引物的多核苷酸序列包括SEQ ID NO.120所示的序列;
所述步骤a)中,特异性针对D7S3052的上游引物的多核苷酸序列包括SEQ IDNO.121所示的序列,特异性针对D7S3052的下游引物的多核苷酸序列包括SEQ ID NO.122所示的序列;
所述步骤a)中,特异性针对D8S1100的上游引物的多核苷酸序列包括SEQ IDNO.123所示的序列,特异性针对D8S1100的下游引物的多核苷酸序列包括SEQ ID NO.124所示的序列;
所述步骤a)中,特异性针对D8S1104的上游引物的多核苷酸序列包括SEQ IDNO.125所示的序列,特异性针对D8S1104的下游引物的多核苷酸序列包括SEQ ID NO.126所示的序列;
所述步骤a)中,特异性针对D8S1105的上游引物的多核苷酸序列包括SEQ IDNO.127所示的序列,特异性针对D8S1105的下游引物的多核苷酸序列包括SEQ ID NO.128所示的序列;
所述步骤a)中,特异性针对D8S1119的上游引物的多核苷酸序列包括SEQ IDNO.129所示的序列,特异性针对D8S1119的下游引物的多核苷酸序列包括SEQ ID NO.130所示的序列;
所述步骤a)中,特异性针对D8S1458的上游引物的多核苷酸序列包括SEQ IDNO.131所示的序列,特异性针对D8S1458的下游引物的多核苷酸序列包括SEQ ID NO.132所示的序列;
所述步骤a)中,特异性针对D8S1471的上游引物的多核苷酸序列包括SEQ IDNO.133所示的序列,特异性针对D8S1471的下游引物的多核苷酸序列包括SEQ ID NO.134所示的序列;
所述步骤a)中,特异性针对D9S2128的上游引物的多核苷酸序列包括SEQ IDNO.135所示的序列,特异性针对D9S2128的下游引物的多核苷酸序列包括SEQ ID NO.136所示的序列;
所述步骤a)中,特异性针对D9S2156的上游引物的多核苷酸序列包括SEQ IDNO.137所示的序列,特异性针对D9S2156的下游引物的多核苷酸序列包括SEQ ID NO.138所示的序列。
所述构建方法中,所述步骤2)中,扩增STR位点以产生所述高通量测序文库的方法还可以包括:b)通过接头引物对步骤a)所提供的扩增产物进行扩增,以产生所述高通量测序文库,所述接头引物至少部分地与接头序列的5’端互补,且部分序列与illumina测序芯片上的oligo序列互补,经接头引物扩增后的文库才可以在illumina测序平台测序。所述接头引物通常包括正向接头引物和反向接头引物,所述正向接头引物可以至少部分地与第一接头序列的5’端互补,所述反向接头引物可以至少部分地与第二接头序列的5’端互补。通常来说,正向接头引物的3’端的序列通常还需要至少部分地与特异性针对STR位点的上游引物的5’端重合,反向接头引物的3’端的序列通常还需要至少部分地与特异性针对STR位点的下游引物的5’端重合。上述扩增过程通常为二次扩增,且对步骤a)所提供的各STR位点的扩增产物的扩增通常在同一扩增体系中进行,通过接头引物进行二次扩增,可以获得理想的高通量测序文库。合适的PCR扩增条件对于本领域技术人员来说应该是已知的,例如,所述步骤b)中,PCR扩增中,每一个循环通常包括DNA变性、退火、延伸等步骤。再例如,还可以包括预变性、最后延伸等步骤,再例如,所述步骤b)中,扩增体系可以包括步骤a)所提供的扩增产物、接头引物、水性介质、DNA聚合酶、镁离子、四种脱氧核糖核苷三磷酸等。所述步骤b)中,通常还可以对扩增产物进行纯化,合适的对PCR产物进行纯化的方法对于本领域技术人员来说应该是已知的,例如,可以使用磁珠法、胶回收法等。
在本发明一具体是实施例中,所述步骤b)中,所述正向接头引物的多核苷酸序列包括SEQ ID NO.139所示的序列,所述反向接头引物的多核苷酸序列包括SEQ ID NO.140所示的序列。
本发明所提供的高通量测序文库的构建方法中,所述高通量测序文库中,单个扩增子的覆盖深度不低于文库平均覆盖深度的10%,所述覆盖深度通常指扩增子实际所包括的碱基的个数,文库平均覆盖深度则指各扩增子的平均覆盖深度。例如,单个扩增子的覆盖深度通常可以大于50,再例如,文库平均覆盖深度通常可以大于500。单个扩增子较高的覆盖深度,可以保证STR分型的准确性,较高的文库平均覆盖深度,可以保证文库中每一个扩增子都有较高的覆盖深度。
本发明第二方面提供一种用于个体识别的方法,所述方法包括:
i)根据本发明第一方面所提供的高通量测序文库的构建方法构建高通量测序文库;
ii)对步骤i)所提供的高通量测序文库进行测序。如上所述,根据本发明所提供的高通量测序文库的构建方法可以构建获得高通量测序文库,对高通量测序文库进行测序即可获得各STR位点的具体测序结果。合适的对上述高通量测序文库进行测序的方法对于本领域技术人员来说应该是已知的,例如,可以通过illumina测序平台进行检测。
本发明所提供的用于个体识别的方法,还可以包括:根据步骤ii)所提供的测序结果,进行个体识别。如上所述,STR基因具有多态性,核心序列重复次数的个体间差异,所以根据STR基因的测序结果,可以有效地进行个体识别。例如,比较多个个体的STR基因的测序结果,可以判断个体之间的血缘关系,具体可以是亲缘关系鉴定等。
本发明第三方面提供一种高通量测序文库,由本发明第一方面所提供的高通量测序文库的构建方法构建获得。
本发明第四方面提供一种试剂盒,所述试剂盒包括适于本发明第一方面所提供的高通量测序文库的构建方法、或本发明第二方面所提供的用于个体识别的方法的试剂和/或组合物。
本发明所提供的试剂盒中,所述试剂盒通常可以包括用于特异性扩增STR位点的针对STR位点的引物,从而可以通过合适的扩增引物以及扩增策略获得理想的高通量测序文库。在本发明一具体实施例中,所述STR位点可以包括本发明第一方面所提供的各STR位点。在本发明另一具体实施例中,用于特异性扩增STR位点的针对STR位点的引物可以包括本发明第一方面所提供的各特异性针对STR位点的引物。
本发明所提供的高通量测序文库的构建方法及通过该方法构建获得的高通量测序文库,可以准确反映人类基因组上多态性高的STR位点的信息,进行测序以后可以由测序数据进行个体识别,具有效率高、准确性好等特点,具有良好的产业化前景。
下面通过实施例对本申请的发明予以进一步说明,但并不因此而限制本申请的范围。
除非另外说明,本发明中所公开的实验方法、检测方法、制备方法均采用本技术领域常规的分子生物学、生物化学、染色质结构和分析、分析化学、细胞培养、重组DNA技术及相关领域的常规技术。这些技术在现有文献中已有完善说明,具体可参见Sambrook等MOLECULAR CLONING:A LABORATORY MANUAL,Second edition,Cold Spring HarborLaboratory Press,1989and Third edition,2001;Ausubel等,CURRENT PROTOCOLS INMOLECULAR BIOLOGY,John Wiley&Sons,New York,1987and periodic updates;theseries METHODS IN ENZYMOLOGY,Academic Press,San Diego;Wolffe,CHROMATINSTRUCTURE AND FUNCTION,Third edition,Academic Press,San Diego,1998;METHODS INENZYMOLOGY,Vol.304,Chromatin(P.M.Wassarman and A.P.Wolffe,eds.),AcademicPress,San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,Vol.119,ChromatinProtocols(P.B.Becker,ed.)Humana Press,Totowa,1999等。
实施例1
(一)位点选择和引物设计:
选择了69个STR位点,并根据这些位点的上下游序列设计引物。所有位点的上下游引物序列均分为两部分,靠近5’端的一部分序列,与二代测序平台接头全部序列或3’端一部分序列互补,靠近3’端的一部分序列,与STR位点的上下游序列互补。69个STR位点及其上下游引物序列参见表1。引物合成后,将每条引物稀释并等比例混合。
表1
(二)STR位点多重扩增:
首先用天根血液基因组DNA提取试剂盒提取人类血液基因组DNA,然后取基因组DNA20-200ng,用引物混合液进行扩增。扩增体系如下:
试剂 |
体积(μL) |
基因组DNA(20-200ng) |
n |
引物混合液(每条引物浓度为0.2μM) |
4 |
2X KAPA2G Fast Multiplex Mix |
12.5 |
Nuclease-free water |
8.5-n |
Total |
25 |
扩增程序如下:
(三)多重扩增产物纯化:
1.向PCR反应液/酶促反应液加入0.6倍体积AMPure XP Beads,充分混匀,室温静置5分钟。
2.用强力磁铁或磁力架吸附磁珠2分钟,直至溶液澄清为止。用移液器小心吸取上清,保留上清,弃磁珠。
3.向PCR反应液/酶促反应液加入0.8倍体积AMPure XP Beads,充分混匀,室温静置5分钟。
4.用强力磁铁或磁力架吸附磁珠2分钟,直至溶液澄清为止。用移液器小心吸取上清,抛弃上清,保留磁珠。
5.加入40ul AMPure XP Beads上清,充分混匀,室温静置5分钟,用强力磁铁或磁力架吸附磁珠2分钟,直至溶液澄清为止。用移液器小心吸取上清,抛弃上清,保留磁珠。
6.加入100μL 80%乙醇,用磁力架反复在不同的两面来回吸附磁珠以充分悬浮磁珠便洗涤。
7.用磁铁或磁力架吸附磁珠,直至溶液澄清为止。用移液器小心去除上清,避免吸到磁珠。
8.室温放置,直至乙醇完全挥发。
9.等待乙醇挥发期间,可准备下一步扩增反应试剂。
(四)第二轮PCR:
在上一步骤带有磁珠的离心管中,加入以下PCR体系:
试剂 |
体积(μL) |
2X KAPA2G Fast Multiplex Mix |
15 |
Illumina测序平台接头引物F |
1 |
Illumina测序平台接头引物R |
1 |
Nuclease-free water |
13 |
Total |
30 |
其中,Illumina测序平台接头引物F序列为:AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC(SEQ ID NO.139),Illumina测序平台接头引物RCAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCCTTGGCACCCGAGAATTC(SEQ ID NO.140)(NNNNNN为index序列,用于下机数据中拆分每个文库的数据)。
扩增程序如下:
(五)第二轮PCR产物纯化:
1.PCR产物中加1.0倍体积AMPure XP Beads(30μL体系加30μL)用移液器上下吹打,使回收产物与AMPure XP Beads充分混匀。室温静置5-10分钟。用强力磁铁或磁力架吸附磁珠,直至溶液澄清为止。用移液器吸取上清,抛弃上清,保留磁珠。
2.加入40ul AMPure XP Beads洗液,充分混匀。室温静置5分钟,用强力磁铁或磁力架吸附磁珠2分钟,直至溶液澄清为止。用移液器小心吸取上清,抛弃上清,保留磁珠。
3.加入100μL 80%乙醇,用磁力架反复在不同的两面来回吸附磁珠以充分悬浮磁珠便洗涤。
4.用磁铁或磁力架吸附磁珠,直至溶液澄清为止。用移液器小心去除上清,避免吸到磁珠。
5.室温放置,直至乙醇挥发干净。本步骤磁珠亦可放于50度烘箱2分钟左右,快速蒸干乙醇。
6.加入20μL Elution Buffer,充分悬浮磁珠,室温静置2min以洗脱DNA。将磁珠用磁铁吸附,所得到的上清DNA溶液吸至新的1.5/0.5/0.2mL离心管/96孔PCR管。ElutionBuffer为10mM Tris-HCl,pH 8.0-8.5,也可以用TE代替。
(六)文库质检:
使用1%浓度的琼脂糖凝胶电泳检测文库条带。
(七)上机测序:
文库于illumina平台进行测序,测序读长单端不小于150bp。
实施例2
选择两个已知家系,家系编号为F44和F47。每个家系中都包含父本(B1)、母本(B2)和子代(C1)。每个样本的基因组DNA均按照STR检测试剂盒操作说明进行69个STR位点检测。
文库于illumina平台测序,测序数据中每个文库的平均覆盖深度和各扩增子的覆盖深度见下表。可见69个扩增子均扩增成功,且每个文库中所有扩增子的覆盖深度均不低于文库平均覆盖深度的百分之十,具体如表2所示。
表2
两个家系中每个样本在不同STR位点的两个等位基因的STR重复单元次数见下表(表3中,各位点的测量结果中,两个数字分别代表一对染色体上两个等位基因分别的重复单元个数),由表3中可见,每个家系中子代的两个STR基因座分别来自于父本和母本,检测结果具有良好的准确性。
表3
综上所述,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
序列表
<110> 上海韦翰斯生物医药科技有限公司
<120> 一种检测STR位点的高通量测序文库构建方法
<160> 140
<170> SIPOSequenceListing 1.0
<210> 1
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
acacgacgct cttccgatct ttaaatcaag gtctttcagt cttgatctag t 51
<210> 2
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ccttggcacc cgagaattcc acggtaagag aaatggctgc actcca 46
<210> 3
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
acacgacgct cttccgatct tgacagagtg agaccctgtt tcaattaa 48
<210> 4
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ccttggcacc cgagaattcc aacttgatag ctaaagtatt ctagggccat a 51
<210> 5
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
acacgacgct cttccgatct cactgtttta attgctgtag ttttccaa 48
<210> 6
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
ccttggcacc cgagaattcc aggagttgcg ttacttgatt tcttactat 49
<210> 7
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
acacgacgct cttccgatct tggccgatcc tgaagcaata gca 43
<210> 8
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ccttggcacc cgagaattcc agtcatcctc tttcatgact tgagaactgg g 51
<210> 9
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
acacgacgct cttccgatct ccttaactgg cgacatcata atcagtaaa 49
<210> 10
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
ccttggcacc cgagaattcc aaaggttact gagtcacaga ggatgaacat t 51
<210> 11
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
acacgacgct cttccgatct caccagtaag aaatgaatca tacttgcaat 50
<210> 12
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ccttggcacc cgagaattcc accaattgac agtggatttt tgactttaa 49
<210> 13
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
acacgacgct cttccgatct tcagaatgga ctataggacc cccttc 46
<210> 14
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
ccttggcacc cgagaattcc actagtatcc acttcctggg gtttccca 48
<210> 15
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
acacgacgct cttccgatct gtgtcctaca aatagaaact tcctatggtt c 51
<210> 16
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ccttggcacc cgagaattcc acacatatga tgctataagg cacacatctt 50
<210> 17
<211> 40
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
acacgacgct cttccgatct tcctgcttca agccctgaag 40
<210> 18
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ccttggcacc cgagaattcc attgctaccc tctctttctg aaacact 47
<210> 19
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
acacgacgct cttccgatct aaataatttc tacctcacac aatgttgtaa ggg 53
<210> 20
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ccttggcacc cgagaattcc atgtaacatc cgtgataaaa atagctcata t 51
<210> 21
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
acacgacgct cttccgatct cataatattg gacagtaaag aaacctgctg ta 52
<210> 22
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
ccttggcacc cgagaattcc acgtatatta gagatagata cacacagatg tgcatct 57
<210> 23
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
acacgacgct cttccgatct ccatccttct ttttatgaca tttatgtgtg t 51
<210> 24
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
ccttggcacc cgagaattcc agaccttttg aaatcttcca attggtgat 49
<210> 25
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
acacgacgct cttccgatct tgggtagggc aaggtatcaa tcagt 45
<210> 26
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ccttggcacc cgagaattcc agcataagag acttccttgt gttagataca ag 52
<210> 27
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
acacgacgct cttccgatct caatgggcaa taacttctaa gaatgaa 47
<210> 28
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
ccttggcacc cgagaattcc acactttacc tcgatgtaat gcacgtgt 48
<210> 29
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
acacgacgct cttccgatct agtgagccaa ttccttgtaa taactctacg a 51
<210> 30
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
ccttggcacc cgagaattcc atccggagca gtggtttaaa aaata 45
<210> 31
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
acacgacgct cttccgatct tgcttgggtt cgaatgcata cttgc 45
<210> 32
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
ccttggcacc cgagaattcc aggattgctg ccgaaagaaa gaaaa 45
<210> 33
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
acacgacgct cttccgatct aagatcacat ctgttggcca ttcttgt 47
<210> 34
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
ccttggcacc cgagaattcc aacatgcaca ctgcctactt actcatt 47
<210> 35
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
acacgacgct cttccgatct gaggattgga ggagggtgat tct 43
<210> 36
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
ccttggcacc cgagaattcc acaaccctgt ccctaaggat gctagaa 47
<210> 37
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
acacgacgct cttccgatct caacagagca agactgtcca gatagataga t 51
<210> 38
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
ccttggcacc cgagaattcc atctccctgt gccctctaat ctttagg 47
<210> 39
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
acacgacgct cttccgatct acacaaataa atatccataa gcatggtctt 50
<210> 40
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
ccttggcacc cgagaattcc atgttttatg gtaacttacc ttgagatgta catataa 57
<210> 41
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
acacgacgct cttccgatct gcatagatga tagtaagggc ctgaaaa 47
<210> 42
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
ccttggcacc cgagaattcc accagttatt cagagattct ctaatctgcc ca 52
<210> 43
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
acacgacgct cttccgatct ctgacttagc cttggaagcc atacgg 46
<210> 44
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
ccttggcacc cgagaattcc accctcatga aatgttaata ccaaagatgt attg 54
<210> 45
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
acacgacgct cttccgatct agggccccaa tacaggagaa aatatata 48
<210> 46
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
ccttggcacc cgagaattcc aagtctgtag aaagcaacaa ccctaatga 49
<210> 47
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
acacgacgct cttccgatct tgtgtgagcc agtccttcat aacat 45
<210> 48
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
ccttggcacc cgagaattcc actggtgtta gtcctctgta ttattcagga tt 52
<210> 49
<211> 62
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
acacgacgct cttccgatct aataaatata tagttataca cacacaaaca tctctttcta 60
tc 62
<210> 50
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
ccttggcacc cgagaattcc actttatgaa gcagtgatgc caatccatg 49
<210> 51
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
acacgacgct cttccgatct actccctgat ttttagctgg gcatataa 48
<210> 52
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
ccttggcacc cgagaattcc atcccctaat aaatgccctg tcatcta 47
<210> 53
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
acacgacgct cttccgatct agggagaatc actcttcatt atggcttc 48
<210> 54
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
ccttggcacc cgagaattcc acaacctggg caaaagagga agaccct 47
<210> 55
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
acacgacgct cttccgatct aatcactagg gaaccaaata tatatacata caattaa 57
<210> 56
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
ccttggcacc cgagaattcc agcctgtgtt gctcaagggt caact 45
<210> 57
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
acacgacgct cttccgatct tgtgggactt ggcatccata atc 43
<210> 58
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
ccttggcacc cgagaattcc agttagagtg ctcctaggaa aggaaacaa 49
<210> 59
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
acacgacgct cttccgatct gcttccgtaa ctacatgagc tggttcc 47
<210> 60
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
ccttggcacc cgagaattcc acatgtatta ggttctccag agaagcagaa 50
<210> 61
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
acacgacgct cttccgatct gtttgtgtgt gtaaaacata caagatacgt aa 52
<210> 62
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
ccttggcacc cgagaattcc accagcaatg ggtagtatgg gtatacttc 49
<210> 63
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
acacgacgct cttccgatct tgtgctcatt tttaactgaa taccagacat 50
<210> 64
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
ccttggcacc cgagaattcc atgccagaga atagggtgaa cagt 44
<210> 65
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
acacgacgct cttccgatct gaaaccactc taagacatat cttatcagat ttc 53
<210> 66
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
ccttggcacc cgagaattcc acttcccttg taggtacagt gtattttttt tc 52
<210> 67
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
acacgacgct cttccgatct tgagagatgg agtttgccgt aagccg 46
<210> 68
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
ccttggcacc cgagaattcc atggtaccat tcacaaacag agacatcacc 50
<210> 69
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
acacgacgct cttccgatct ggcagaagcg tggcagttta ttt 43
<210> 70
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
ccttggcacc cgagaattcc aacacagcca aaccacagct atct 44
<210> 71
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
acacgacgct cttccgatct ggctgtaaca agggctacag gaatca 46
<210> 72
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
ccttggcacc cgagaattcc aggagctaag tggctgtggt gtta 44
<210> 73
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
acacgacgct cttccgatct cttctcagcc tccatgacca catg 44
<210> 74
<211> 55
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
ccttggcacc cgagaattcc aaaattagta attatattaa tctgggctct ccaga 55
<210> 75
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
acacgacgct cttccgatct agaagaatgt gtttggtagt gacatgtgc 49
<210> 76
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 76
ccttggcacc cgagaattcc atgcactgtt ttatccatct atctgtcatc tg 52
<210> 77
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 77
acacgacgct cttccgatct cagaacattc tgctcgcact gtagtc 46
<210> 78
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 78
ccttggcacc cgagaattcc atgtttaaag ttacacggca aatagctgat a 51
<210> 79
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 79
acacgacgct cttccgatct aaagtgtatt agattagtca gggctcgc 48
<210> 80
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 80
ccttggcacc cgagaattcc acttggctcc catgattgca tc 42
<210> 81
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 81
acacgacgct cttccgatct gggaaacata ttatgtctaa tatatttacc tctatc 56
<210> 82
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 82
ccttggcacc cgagaattcc aaaactggtt tgggtctgtt atggatc 47
<210> 83
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 83
acacgacgct cttccgatct atagcattgc ttccccttta cctgagat 48
<210> 84
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 84
ccttggcacc cgagaattcc aagtgagtac agaaatactt atgttcaaga at 52
<210> 85
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 85
acacgacgct cttccgatct ccagacttcc acaatcacac tgactgat 48
<210> 86
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 86
ccttggcacc cgagaattcc aaagagaaac agatcaacag gatgtagaca gat 53
<210> 87
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 87
acacgacgct cttccgatct gttggttctg ctttttctct ccaa 44
<210> 88
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 88
ccttggcacc cgagaattcc aaacagacaa atgacaaatc tgtatcctaa tct 53
<210> 89
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 89
acacgacgct cttccgatct agaattgttg tctgtaggag ctgagaa 47
<210> 90
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 90
ccttggcacc cgagaattcc agatgtggga aggaaagtag gaatgaa 47
<210> 91
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 91
acacgacgct cttccgatct cctgacattc ctagggtgaa cttcaca 47
<210> 92
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 92
ccttggcacc cgagaattcc aagcaaaaca aatatggctc tatctatcgt ct 52
<210> 93
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 93
acacgacgct cttccgatct gaaacacttt tcattcctca ttttccac 48
<210> 94
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 94
ccttggcacc cgagaattcc aggcatggca tactatgcaa caaacc 46
<210> 95
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 95
acacgacgct cttccgatct aattcagcaa gttaagaact tctacattta aggt 54
<210> 96
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 96
ccttggcacc cgagaattcc atcaattcat ccactgaaat gactgaaaa 49
<210> 97
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 97
acacgacgct cttccgatct agtcctgaag acatcttgtg tctcaatg 48
<210> 98
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 98
ccttggcacc cgagaattcc agattaggag acaggtaggt acaaaaatga taga 54
<210> 99
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 99
acacgacgct cttccgatct gcttcatgtg tgaagtgcaa ataagatta 49
<210> 100
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 100
ccttggcacc cgagaattcc agctgtggga agttgaacac tgttcaaag 49
<210> 101
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 101
acacgacgct cttccgatct tggttcctgt aatatgattg gttgccta 48
<210> 102
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 102
ccttggcacc cgagaattcc aagaataaat gcaaatctat gctgcaaaaa t 51
<210> 103
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 103
acacgacgct cttccgatct aattgcataa gccaactcct taaaataaa 49
<210> 104
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 104
ccttggcacc cgagaattcc agctttaata atcagtgttc ttcagggaaa cag 53
<210> 105
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 105
acacgacgct cttccgatct ggacctataa atagcttgtc caggaatat 49
<210> 106
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 106
ccttggcacc cgagaattcc aagtttctaa gacaagattc ttacgtggaa aca 53
<210> 107
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 107
acacgacgct cttccgatct tcttttgctg gctctgcatt tacc 44
<210> 108
<211> 50
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 108
ccttggcacc cgagaattcc acattagaag cagatccatt tccactagct 50
<210> 109
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 109
acacgacgct cttccgatct tgagtacatt ctaggcaccc agaaca 46
<210> 110
<211> 53
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 110
ccttggcacc cgagaattcc accaacctca ctgtatcatc ttataattga ata 53
<210> 111
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 111
acacgacgct cttccgatct tcacagaact tacaagtgga tacacaatag a 51
<210> 112
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 112
ccttggcacc cgagaattcc attaaccctg ctaacaacaa aggaagc 47
<210> 113
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 113
acacgacgct cttccgatct gggctgatga ggtgaaatat ttgcaaa 47
<210> 114
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 114
ccttggcacc cgagaattcc actgggggat atctcaaaca acctcaac 48
<210> 115
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 115
acacgacgct cttccgatct tcccaaaacc acttaagtca ggacc 45
<210> 116
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 116
ccttggcacc cgagaattcc atgcaattac ttttgtacca acttaatgtc ta 52
<210> 117
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 117
acacgacgct cttccgatct agccagagta accctttaaa tgacatcag 49
<210> 118
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 118
ccttggcacc cgagaattcc agcagatcct cgtatgggag tgacc 45
<210> 119
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 119
acacgacgct cttccgatct tctgtatatg gacataacat atatatacat ctctctat 58
<210> 120
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 120
ccttggcacc cgagaattcc agagttccat ccctcctcca ttttctaga 49
<210> 121
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 121
acacgacgct cttccgatct ctttgatcaa tgcctcccca tttcatct 48
<210> 122
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 122
ccttggcacc cgagaattcc atgttgataa agtgagacta gcagatgtac tt 52
<210> 123
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 123
acacgacgct cttccgatct ggcagctatt tttgtaggaa ggtgttgt 48
<210> 124
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 124
ccttggcacc cgagaattcc atcctcttgg gtctgagttt catctggc 48
<210> 125
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 125
acacgacgct cttccgatct tcagctatga gaaaagttga atggttat 48
<210> 126
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 126
ccttggcacc cgagaattcc attgaccctt gtttgtgtac ggtatgc 47
<210> 127
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 127
acacgacgct cttccgatct gcaatatcaa acctggtgag tgtcaaa 47
<210> 128
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 128
ccttggcacc cgagaattcc acaaggacgc catgactgtc ttagtag 47
<210> 129
<211> 45
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 129
acacgacgct cttccgatct caaggagaaa tggaatgcct ctgta 45
<210> 130
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 130
ccttggcacc cgagaattcc accagcccag agtgaatttt gaaaaa 46
<210> 131
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 131
acacgacgct cttccgatct gcaggttttc caaagggact caa 43
<210> 132
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 132
ccttggcacc cgagaattcc agattaaaga agcattatga ggaatagcca tg 52
<210> 133
<211> 56
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 133
acacgacgct cttccgatct ttattgttat caatctcttt ctgtgtctaa tttaca 56
<210> 134
<211> 54
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 134
ccttggcacc cgagaattcc acacagatag tcctgaactt tatacaggct atgt 54
<210> 135
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 135
acacgacgct cttccgatct gtggttgaaa cactgaaact ataggtag 48
<210> 136
<211> 47
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 136
ccttggcacc cgagaattcc ataaggcaca cacaagaccg atgatct 47
<210> 137
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 137
acacgacgct cttccgatct tgtgtcatta tatgcacaca tgtatgtat 49
<210> 138
<211> 49
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 138
ccttggcacc cgagaattcc agtcaagctt tgagcctaac ttaccatac 49
<210> 139
<211> 57
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 139
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatc 57
<210> 140
<211> 61
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 140
caagcagaag acggcatacg agatnnnnnn gtgactggag ttccttggca cccgagaatt 60
c 61