一种基于高通量测序的感染线检测方法以及试剂盒
技术领域
本发明涉及一种基于高通量测序的感染线检测方法,属于高通量测序技术领域。
背景技术
新发突发传染病是人类面临的一个重要威胁,人口的增长、迅速的城市化、自然生态环境的改变、人和野生动物接触的机会增加、经济的全球化、跨国旅行人口数量的激增、跨国旅行速度的加快以及抗生素的滥用等大大增加了新发传染病的风险。根据WHO的研究报告,自1967年以来,至少有39种新的病原体被发现,重要的包括艾滋病毒、埃博拉病毒、马尔堡病毒、SARS病毒、禽流感病毒和猪流感病毒。新型疾病正以前所未有的速度(平均每年新增一种)出现,并跨越国境在全世界传播。新发传染病由于没有分析检测和诊断治疗手段,加之人群普遍缺乏免疫力,易造成重大社会影响。有些新发突发传染病可能造成重大的人员伤亡,严重影响社会稳定和经济发展。
因此加强重要新发突发传染病的防控对于国家安全和社会民生均具有重要意义。
针对新发突发传染病病原体进行快速鉴定,在最短的时间内获取病原体的信息,对于有效控制突发生物危害事件具有重要的指导意义。病原微生物的快速检测方法有很多种,包括基于抗原抗体的免疫学方法和基于核酸检测的方法。这些方法各有特点,而序列测定的方法是确定微生物最为准确可靠的方法之一。传统的序列测定方法耗时长、成本高、通量低,无法满足对于未知病原的分析。由于未知病原体的核酸序列未知,因此不能够采用PCR技术进行扩增和测序。
与传统的测序技术相比,第二代测序技术最大的创新之处是将片段化的DNA连上接头后固定于基质上,之后用不同方法在同一平面上进行大规模平行PCR,结合荧光标记的成像检测技术获得测试数据,经过计算机分析后,可以得到完整的序列信息。其最显著的特征是高通量,一次能得到几十万到几百万条DNA片段进行测序,使得对一个物种的转录组测序或者基因组深度测序,变得更加方便。
然而对于病原体感染的检测来说,样本中含有大量的来自人体的DNA片段,由于人类基因组远远比病原微生物基因组大,人类基因组片段会严重影响到对于病原微生物DNA检测的灵敏度,因此去除人类基因组片段的影响对提高高通量测序检测病原微生物的灵敏度和特异性至关重要。
发明内容
本发明提供了一种基于高通量测序的感染线检测方法,本检测方法是用于检测人体样本当中病原体的检出和鉴定,可以有效的检出已知和未知的病原体,同时还设计了用于与人源基因当中高重复片断进行特异性杂交结合的探针,可以有效的避免人源的DNA片段对检测过程灵敏性的干扰。
本发明的第一个方面,提供了:
一种基于高通量测序的感染线检测方法,包括如下步骤:
第1步,从人体样本当中提取DNA;
第2步,对DNA进行片段化处理后,在DNA片段两端加上接头,采用探针库对DNA样本中的人源DNA片段进行杂交捕获,并从样本中被去除;
第3步,对第2步当中剩下的DNA片段进行高通量测序,检测人体样本当中的病原体。
在一个实施方式中,所述的探针库中包含如SEQ ID NO.1-68所示的核苷酸序列。
在一个实施方式中,所述的探针库中不包含如SEQ ID NO.3、10、14、20、57和59所示的核苷酸序列。
在一个实施方式中,所述的杂交捕获过程中,采用链霉亲和素磁珠对杂交产物进行捕获,并对磁珠进行分离。
在一个实施方式中,所述的探针库中的探针采用生物素化处理。
在一个实施方式中,人体样本包括人的血液、分泌物、脑脊液、肺泡灌洗液、胸腹水、尿液、痰液、胆汁、关节液或者心包积液。
在一个实施方式中,所述的病原体包括细菌、病毒、真菌、原生生物、支原体、衣原体或者分支杆菌。
本发明的第二个方面,提供了:
一种探针组合,用于特异性结合人源基因的DNA片段。
本发明的第三个方面,提供了:
一种用于高通量测序的感染线检测试剂盒,所述的试剂盒包括有上述的探针库。
有益效果
本发明提供的方法也可以有效的利用高通量测序法对于病原体实现高灵敏度,高准确性的检测。
具体实施方式
本发明所要检测的病原体,只要能够提取其DNA/RNA反转录得到的cDNA,都适用于本发明的方法,没有特别的限定。优选的实例包括细菌、真菌、酵母和病毒等。细菌包括革兰氏阳性菌和革兰氏阴性菌二者。革兰氏阳性菌的实例包括葡萄球菌属(Staphylococcus)细菌如表皮葡萄球菌(Staphylococcusepidermidis)、链球菌属(Streptococcus)细菌如肺炎链球菌(Streptococcuspneumoniae)、李斯特菌属(Listeria)细菌如单核细胞增多性李斯特菌(Listeriamonocytogenes)、芽孢杆菌属(Bacillus)细菌如蜡状芽孢杆菌(Bacilluscereus)和炭疽芽胞杆菌(Bacillusanthracis)、分支杆菌属(Mycobacterium)细菌如结核分枝杆菌(Mycobacteriumtuberculosis)、牛分支杆菌(Mycobacteriumbovis)和鸟结核分枝杆菌(Mycobacteriumavium)和梭菌属(Clostridium)细菌如肉毒梭状芽孢杆菌(Clostridiumbotulinum)和产气荚膜梭状芽胞杆菌(Clostridiumperfringens)等。革兰氏阴性菌的实例包括肠细菌,其典型实例为埃希氏菌属(Escherichia)细菌如大肠杆菌(Escherichiacoli)、肠杆菌属(Enterobacter)细菌如阪崎肠杆菌、柠檬酸杆菌属细菌如克氏柠檬酸杆菌(Citrobacterkoseri)和克雷伯氏菌属细菌如产酸克雷伯氏菌(Klebsiellaoxytoca)以及沙门氏菌属细菌、弧菌属(Vibrio)细菌、假单胞菌属(Pseudomonas)细菌和军团菌属(Legionella)细菌等。病毒的实例包括具有包膜的病毒如流感病毒和不具有包膜而仅具有核壳体(nuleocapsids)的病毒如诺如病毒(noroviruses)、轮状病毒(rotaviruses)和腺病毒(adenoviruses)。
本发明当中适用于高通量测序法对样本当中的病原体进行检测,在本文中所使用的术语“高通量测序”、“下一代测序”等,指的是第二代高通量测序技术及之后发展的更高通量的测序方法。下一代测序平台包括但不限于Illumina(Miseq、Hiseq2000、Hiseq2500、Hiseq3000、Hiseq4000、HiseqX Ten等)、ABI-Solid和Roche-454测序平台等。随着测序技术的不断发展,本领域技术人员能够理解的是还可以采用其他方法的测序方法和装置进行本检测。根据本发明的具体示例,可以将根据本发明实施例的核酸标签用于Illumina、ABI-Solid和Roche-454测序平台等的至少一种进行测序。下一代测序技术,例如Illumina测序技术具有以下优势:(1)高灵敏度:下一代测序,例如Miseq的测序通量大,目前一次实验流程可以产生最多15G碱基数据,高的数据通量可以在测序序列数一定的情况下,使得每条序列获得更高的测序深度,所以可以检测到含量更低的突变,同时因其测序深度高,突变位点被多次覆盖,其测序结果也更为可靠。(2)高通量,低成本:利用根据本发明实施例的标签序列,通过一次测序可以检测上万份样本,从而大大降低了成本。
高通量测序主要的流程包括:对每个待测样本和正常样本的组织样本或者全血样本进行DNA提取,获取基因组DNA;对DNA片段过大的样本,通过超声破碎,将样本机械力打断至200-350碱基对;对片段化的DNA分子执行末端修复、添加腺嘌呤、文库接头连接等操作;获得的DNA文库与长度为120碱基的单链生物素标记DNA探针分子杂交,再以链霉亲和素包裹的磁珠分离捕获的DNA文库分子;在illumina下一代测序仪上进行测序。测序反应获得的数据通过生物信息学分析。在获得了相应的测序信息后,可以采用常规方法做数据预处理,这里的处理主要是对测序所得的每个样本序列分别进行过滤,以去除掉不合格的序列和接头序列,其中,样本包括目标样本(即,变异组织)和对照样本(即,正常组织);具体地,对高通量测序后的样本序列进行过滤,去除不合格的序列及接头序列,其中,不合格序列可以为下列情况中的至少一种:测序质量低于某一阈值的碱基个数超过整条序列碱基个数的一定比例(例如,50%)和序列中测序结果不确定的碱基(例如,IlluminaGA测序结果中的N)个数超过整条序列碱基个数的一定比例(例如,10%)。其中,高通量测序技术可以为IlluminaGA或者HiSeq测序技术,也可以为现有的其他高通量测序技术,低质量阈值可以由具体测序技术和测序环境确定。在对读段进行了预处理之后,将过滤后的每个样本序列分别比对到参考基因组序列,对比对后的每个样本序列分别进行筛选以得到唯一比对的样本序列,确定每个唯一比对的样本序列相对于参考基因组序列的位置信息,并对位置信息进行排序;具体地:(1)首先可以通过任何一种短序列映射程序(例如,短寡核苷酸分析包(Short Oligonucleotide Analysis Package,SOAP))将过滤得到的每个样本序列(即,由多个测序片段数据构成的序列)分别比对到参考基因组序列(例如,人类基因组参考序列)得到每个样本序列在参考基因组上的位置情况;(2)然后,对比对结果进行一系列的筛选,例如,去除比对到多个位置的序列(因为这个序列已无法准确唯一的提供比对位置信息)、去除重复出现的序列(因为这些序列可能是由于前期实验引入的误差,如由测序错误引起,为使检测结果更加精准,故去除),以得到唯一比对的序列结果。
本发明主要是对于人体样本当中的病原体进行高通量测序法的检测,这里所涉及到的人体样本包括人的血液、分泌物、脑脊液、肺泡灌洗液、胸腹水、尿液、痰液、胆汁、关节液、心包积液。
由于在人体样本当中含有大量的人源基因的DNA片段,会影响到对于病原体的DNA片段的捕获效果,使检测灵敏度受到较大的影响,在对样本进行杂交捕获时,采用了在5’端连接有生物素的探针,其可以用于磁珠进行特异性结合,使目标片段得到分离,这类探针用于特异性结合人类基因组重复序列的DNA片段,通过链霉亲和素与生物素的相互作用,将人类基因组去除。可以有效的避免人源基因的DNA对检测的影响,提高病原体DNA检测灵敏度,同时大大降低测序成本和周期。
本发明当中的样本的准备过程可以按照如下的方法进行:
一、准备DNA样本库
1.准备基因组DNA样本(采用此种方式获得的DNA样本库称为“源自全基因组的DNA样本库”)
1.1DNA提取
DNA提取,包括新鲜组织,新鲜血液和细胞,福尔马林固定石蜡包埋组织样本,商业化公司提取试剂盒。以上均按说明书指示方法操作。
使用分光光度定量仪以及凝胶电泳系统检测DNA模板质量和浓度。dsDNA模板260nm吸光率大于0.05以上,吸光率A260/A280比值在1.8到2之间为合格。
1.1DNA片段化
将3微克高质量的基因组DNA用TE缓冲液稀释至120微升。按照组织匀浆机使用说明书,将DNA片段化,片段长度为150~600bp、优选200bp或350bp。
DNA纯化,商业化公司纯化试剂盒。
1.2DNA样本库质量检测
用生物分析仪进行DNA定性定量分析,确认DNA片段长度峰值合理。
2.DNA末端修补
将DNA片段进行末端修复可以利用Klenow片段、T4DNA聚合酶和T4多核苷酸激酶进行,其中,所述Klenow片段具有5’-3”聚合酶活性和3’-5’聚合酶活性,但缺少5’-3’外切酶活性。由此,能够方便准确地对DNA片段进行末端修复。根据本发明的实施例,还可以进一步包括对经过末端修复的DNA片段进行纯化的步骤,由此能够方便地进行后续处理。
利用T4聚合酶及Klenow大肠杆菌聚合酶片断,对于DNA 5′突出粘末端补平以及3′突出粘末端打平,产生平末端,用于后续的平端连接。反应在PCR扩增仪中进行,20摄氏度,30分钟。
表1 DNA末端修复反应液组成
反应材料 |
体积 |
纯化后DNA样本库 |
50微升 |
磷酸化反应缓冲液 |
10微升 |
脱氧碱基混合物dNTP(每种10mM) |
4微升 |
T4 DNA聚合酶 |
5微升 |
Klenow大肠杆菌聚合酶片段 |
1微升 |
T4多聚核苷酸激酶 |
5微升 |
无核酸酶水 |
总体积补至100微升 |
DNA磁珠纯化,商业化公司纯化试剂盒。
4.在DNA样本3′末端加上碱基A
在经过末端修复的DNA片段的3’末端添加碱基A,以便获得具有粘性末端A的DNA片段。根据本发明的一个实施例,可以利用Klenow(3’-5’exo-),即具有3’-5’外切酶活性的Klenow,在经过末端修复的DNA片段的3’末端添加碱基A。由此,能够方便准确地将碱基A添加到经过末端修复的DNA片段的3’末端。根据本发明的实施例,还可以进一步包括对具有粘性末端A的DNA片段进行纯化的步骤,由此能够方便地进行后续处理。
反应在PCR扩增仪中进行,37℃,30分钟。
表2 末端加A反应液组成
反应材料 |
体积 |
DNA样本库 |
约30微升 |
10X Klenow大肠杆菌聚合酶缓冲液 |
5微升 |
脱氧碱基dATP(1mM) |
10微升 |
Klenow大肠杆菌聚合酶片段 |
3微升 |
无核酸酶水 |
总体积补至50微升 |
DNA磁珠纯化,商业化公司纯化试剂盒。
5.在DNA两端加上接头
表3 DNA两端加接头反应液组成
反应材料 |
体积 |
DNA样本库 |
约15微升 |
2X T4DNA连接酶缓冲液 |
5微升 |
DNA两端接头 |
6微升 |
T4 DNA连接酶 |
3微升 |
无核酸酶水 |
总体积补至50微升 |
DNA磁珠纯化,商业化公司纯化试剂盒。
6.扩增DNA模板
聚合酶链反应(PCR),在PCR扩增仪中进行。
表4 PCR反应液组成
反应材料 |
体积 |
加上接头后的DNA样本库 |
约30微升 |
10X高准确率超保真DNA聚合酶缓冲液 |
5微升 |
高准确率超保真DNA聚合酶 |
1微升 |
接头正引物 |
1微升 |
接头反引物 |
1微升 |
无核酸酶水 |
总体积补至50微升 |
PCR条件:置于PCR扩增仪中,98℃预变性30秒,98℃变性30秒,65℃退火30秒,72℃延伸30秒,共循环4~6次。最后在72℃延伸5分钟。
PCR扩增产物过柱纯化,商业化公司纯化试剂盒。
8.扩增后DNA样本库质量检测
使用生物分析仪,进行DNA定性定量分析,并确认纯化后片段长度峰值合理,约200bp。
对于得到的DNA样本库,如果DNA浓度小于150纳克/微升,须将样品经过真空浓缩机低温干燥(低于45℃),再用无核酸酶水溶解至所需浓度。
二、准备探针库
本领域技术人员知晓:捕获的特异性受各种因素影响,如捕获探针的设计不佳,捕获条件不理想,基因组DNA中重复序列的封闭不充分及基因组DNA与捕获探针的比例不合适等因素都会影响捕获的特异性、敏感性、测序覆盖率等诸多结果。为了实现目标基因的高度富集和低脱靶率,本领域技术人员需要对探针的捕获序列、杂交条件等进行大量实验摸索,需要通过创造性的探索工作才能够获得最佳的参数组合,没有在相应的证据证明下,其是否能够达到相同的效果,是本领域技术人员无法预期的。
构建一个基于杂交原理的目标序列捕获系统,有两点需要考虑,即探针的长度和探针的合成成本。一般来说一个8碱基的探针就有了足够的杂交特异性,而探针越长,杂交的特异性就越高。目前商业试剂盒的探针长度都在60nt到200nt之间,这其中的一个重要考虑是,杂交的特异性限定(或者说杂交的错配容忍度)。如果探针太短,会降低其特异性,增加脱靶率。如果探针太长,容易形成二级结构,也对富集效率不利。对不同长度的探针进行了系统的测试,最后优选了120bp长度的探针。通过对primer软件的改进,对设计的探针进行分析,以准确的知道探针的退火温度、GC成分连续重复单基数量(如CCCCCCC)。使用每个探针分别对全基因组进行了富集和扩增并根据结果进行筛选。通过IDT DNATechnologies,单独合成了每一个探针并用质谱分析保证质量,用于特异性结合人源基因DNA片段的探针,在5’端连有生物素(Biotin)以用于链霉亲和素磁珠富集。
三、DNA捕获探针杂交
1.将DNA样本库与生物素化的DNA探针库杂交
将DNA样本库与杂交缓冲液混合,反应条件为95℃5分钟,之后保持在欲使用杂交温度上。反应在PCR扩增仪中进行。
然后将该混合物与探针库混合(混合1)。将杂交反应置于PCR扩增仪中,进行孵育,分别在58℃、62℃、65℃的条件下进行孵育,并在每个相应的孵育温度下,测试分别孵育4小时、8小时、16小时、24小时,在一个优选实施例中采用65℃孵育8小时。
四、去除人类了基因组相关基因片段
1.准备链霉亲和素(Streptavidin-Coated)磁珠
使用Dynabeads链霉亲和素磁珠或者其它商业化公司链霉亲和素磁珠。将磁珠置于混匀仪上混匀,每个样本需要50微升磁珠。
磁珠洗涤:混合50微升磁珠和200微升结合缓冲液,在混匀仪上混匀(混合2),使用Dynal磁选机或者其它商业化公司磁选机,将磁珠与缓冲液分离纯化,缓冲液弃掉不用。重复三次,每次加入200微升结合缓冲液。
2.分离杂交产物
混合1中的杂交反应混合物与2中的链霉亲和素磁珠,反复颠倒试管5次。在室温下振摇30分钟。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离纯化。
然后向磁珠中加入500微升洗涤缓冲液,在65℃孵育10分钟,每隔5分钟混匀一次。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离纯化。丢弃磁珠,保留上清液。
将上清液过柱纯化,商业化公司纯化试剂盒。
五、PCR扩增与纯化
因人类基因组DNA含量较大,去除后剩余DNA较少,第二扩增能使剩余DNA片段获得再次扩增以满足上机测序和质控检测的要求。本发明的这一文库构建方法特别适用于总游离核酸不低于10ng或者常规组织基因组DNA不低于1μg的样本的测序文库构建。
将富集DNA样本库进一步扩增,为测序仪器上样做准备。
表5 富集过程反应液组成
反应材料 |
体积 |
富集DNA样本库 |
约30微升 |
10X高准确率超保真DNA聚合酶缓冲液 |
5微升 |
高准确率超保真DNA聚合酶 |
1微升 |
正引物 |
1微升 |
反引物 |
1微升 |
无核酸酶水 |
总体积补至50微升 |
PCR条件:置于PCR扩增仪中,98℃预变性30秒,98℃变性30秒,65℃退火30秒,72℃延伸30秒,共循环4-6次。最后在72℃延伸5分钟。
PCR扩增产物过柱纯化,商业化公司纯化试剂盒。
六、采用下一代测序技术检测病原体
使用下一代商业化的测序仪器进行测序,如Roche 454、Illumina Hiseq等。测序结果用已有的测序软件分析包进行分析。
示例性地,使用TruSeq PE Cluster Kit v3-cBot-HS,使用桥式PCR对DNA样本库模板进行扩增:每个DNA样本片段将会在芯片上形成克隆簇,每条泳道上产生数百万这样的克隆簇。使用Illumina HiSeq4000下一代测序系统,PE-75bp其原理是边合成边测序。和传统Sanger方法相比,利用“可逆性末端终结反应”技术,四种dNTP碱基末端被保护基团封闭,并分别以不同颜色荧光标记。
实施例1
本实施例当中,示例性地说明对肺炎克雷伯菌(细菌)作为潜在病原体进行检测。
为了避免人源DNA的影响,高通量测序流程中额外加了一个反向富集步骤,主要针对会对检测过程灵敏度有影响的、重复性较高的人源基因组DNA片段进行探针设计,捕获并去除人源DNA片段。
人源基因组包括蛋白编码序列和非编码序列,其中蛋白编码序列只占基因组大小的1.5%左右。目前商品化探针主要有2种,一种是全外显子组探针,覆盖人类2万多个基因的外显子,可以去除蛋白编码序列;一种是定制化的探针组合(Panel),覆盖范围从几十个基因到几百个基因。但是全外显子组探针和Panel的覆盖范围最大也才占到基因组的1.5%,去除的人源基因组较少。
为了去除更多的人源基因组序列,我们对人类基因组序列进行分析,发现其中存在大量的重复性序列,我们以120bp作为探针大小,与整个基因组进行比对,找到占比最多的探针序列,共发现68个序列在人类基因组出现的次数较多,在基因组占比较大。序列如下:
表6
根据以上的68条重复性较高的片段,并结合探针的设计思路,经过反复调整之后,得到以下68条探针序列,探针序列如SEQ ID NO.1~68所示。
重复性序列一般为进化中较为保守的序列,人类和微生物可能会有类似序列出现,在去除人源基因组的同时可能会把同源微生物序列也一起去除。为了避免这种情况的发生,所以我们建立了微生物数据库,使用以上68条探针序列与微生物数据库进行比对,确定这些探针序列与微生物序列是否会有同源序列。
数据库概况如下:
表7
分类 |
Name |
物种数(所有) |
细菌 |
Bacteria |
4,248 |
病毒 |
Virus |
9,563 |
原生生物 |
Protozoa |
107 |
真菌 |
Fungi |
599 |
支原体/衣原体 |
Mycoplasma/chlamydia |
62 |
分枝杆菌 |
Mycobacterium |
56 |
比对结果如下:
表8
序列3/10/14/20/57/59在微生物序列库种有匹配到微生物序列,为了验证以上探针对微生物检测可能造成的潜在影响,我们进一步分析了具体匹配的微生物序列,进而定位到具体的微生物。结果如下
以上6个探针捕获到的微生物主要包括镰刀菌和弓形虫,考虑到这两种致病微生物的重要性,我们对这两种探针的捕获实验做了验证。最终的探针库不包括以上6个序列。
本步骤中,采用对血液进行DNA样本的提取。
一、准备待检测的DNA样本库
1.提取患病血浆样本中ctDNA
1.1 DNA提取
一例患者的临床血液样本经采集后,立即于2700xg,10min,收集上层血清于干净的tube管中,-80℃保存备用,采用QIAGEND Neasy Blood&Tissue Kit(QIAGEN,Hilden,Germany)抽提外周血DNA,QIAamp Circulating Nucleic Acid Kit抽提循环肿瘤DNA。按说明书指示方法操作。
使用分光光度定量仪以及凝胶电泳系统检测DNA的质量和浓度。DNA的260nm吸光率大于0.05以上,吸光率A260/A280比值在1.8到2之间为合格。
1.2 DNA样本库质量检测
用生物分析仪进行DNA定性定量分析,确认DNA片段长度峰值合理。
2.DNA末端修补
利用T4聚合酶及Klenow大肠杆菌聚合酶片断,对于DNA 5′突出粘末端补平以及3′突出粘末端打平,产生平末端,用于后续的平端连接。反应在PCR扩增仪中进行,20摄氏度,30分钟。
表9 末端修补反应液组成
反应材料 |
体积 |
纯化后DNA样本库 |
50微升 |
磷酸化反应缓冲液 |
10微升 |
脱氧碱基混合物dNTP(每种10mM) |
4微升 |
T4 DNA聚合酶 |
5微升 |
Klenow大肠杆菌聚合酶片段 |
1微升 |
T4多聚核苷酸激酶 |
5微升 |
无核酸酶水 |
总体积补至100微升 |
使用Beckman Coulter Ampure Beads试剂盒将DNA过柱纯化。
3.在DNA样本3′末端加上碱基A
反应在PCR扩增仪中进行,37℃,30分钟。
表10 末端加A反应液组成
反应材料 |
体积 |
DNA样本库 |
约30微升 |
10X Klenow大肠杆菌聚合酶缓冲液 |
5微升 |
脱氧碱基dATP(1mM) |
10微升 |
Klenow大肠杆菌聚合酶片段 |
3微升 |
无核酸酶水 |
总体积补至50微升 |
使用Beckman Coulter Ampure Beads试剂盒(货号:A63880)将DNA过柱纯化。
4.在DNA两端加上接头
表11 DNA两端加接头反应液组成
反应材料 |
体积 |
DNA样本库 |
约15微升 |
2X T4 DNA连接酶缓冲液 |
5微升 |
DNA两端接头 |
6微升 |
T4 DNA连接酶 |
3微升 |
无核酸酶水 |
总体积补至50微升 |
使用Beckman Coulter Ampure Beads试剂盒(货号:A63880)将DNA过柱纯化。
5.扩增步骤4获得的DNA片段样本库
聚合酶链反应(PCR),在PCR扩增仪中进行。
表12 PCR反应液组成
反应材料 |
体积 |
加上接头后的DNA样本库 |
约30微升 |
10X高准确率超保真DNA聚合酶缓冲液 |
5微升 |
高准确率超保真DNA聚合酶 |
1微升 |
接头正引物 |
1微升 |
接头反引物 |
1微升 |
无核酸酶水 |
总体积补至50微升 |
PCR条件:置于PCR扩增仪中,98℃预变性30秒,98℃变性30秒,65℃退火30秒,72℃延伸30秒,共循环4-6次(DNA样本库)。最后在72℃延伸5分钟。
使用Beckman Coulter Ampure Beads试剂盒(货号:A63880)将PCR扩增产物过柱纯化。
6.扩增后DNA样本库的质量检测
使用生物分析仪,进行DNA定性定量分析,并确认纯化后片段长度峰值合理,约200bp。因此,分别获得了DNA样本库。
对于得到的DNA样本库,如果DNA浓度小于150纳克/微升,须将样品经过真空浓缩机低温干燥(低于45℃),再用无核酸酶水溶解至所需浓度。本实施例的下文将采用获得的源自全基因组的DNA样本库进行富集和检测。
二、将DNA样本库与DNA探针库杂交
将DNA样本库与杂交缓冲液(Nimblegen的SeqCap Hybridization and wash kit)混合(混合后,DNA样本库浓度至多不超过50ng/ul),反应条件为95℃5分钟,之后保持在65℃。反应在PCR扩增仪中进行。
然后将3pmole探针库加入上述混合物,反应条件为65℃5分钟。将杂交反应置于PCR扩增仪中,65℃孵育8小时。
三、得到经杂交富集的基因片段
1.准备链霉亲和素磁珠
使用Dynabeads(Life technologies,货号:11206D)链霉亲和素磁珠或者其它商业化公司链霉亲和素磁珠。将磁珠置于混匀仪上混匀。
磁珠洗涤:混合50微升磁珠和200微升结合缓冲液(Nimblegen的SeqCapHybridization and wash kit),在混匀仪上混匀,使用Dynal磁选机或者其它商业化公司磁选机,将磁珠与缓冲液分离纯化,缓冲液弃掉不用。重复三次,每次加入200微升结合缓冲液。
2.分离杂交产物
混合步骤三中得到的杂交反应混合物与步骤四的1中得到的链霉亲和素磁珠,反复颠倒试管5次。在室温下振摇30分钟。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离纯化。
然后向磁珠中加入500微升洗涤缓冲液(Nimblegen的SeqCap Hybridization andwash kit),在65℃孵育10分钟,每隔5分钟混匀一次。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离纯化。以上步骤重复三次。
3.DNA富集样本释放
将磁珠与50微升洗脱缓冲液(10mM氢氧化钠溶液)混合,室温孵化10分钟,每隔5分钟混匀一次。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离弃掉。此时上清液中即含有富集过的MSI相关基因片段DNA样本库。
使用Beckman Coulter Ampure Beads试剂盒将样本库过柱纯化。
四、PCR扩增与纯化
将富集DNA样本库进一步扩增,为测序仪器上样做准备。
表13 富集过程反应液组成
反应材料 |
体积 |
富集DNA样本库 |
约30微升 |
10X高准确率超保真DNA聚合酶缓冲液 |
5微升 |
高准确率超保真DNA聚合酶 |
1微升 |
正引物 |
1微升 |
反引物 |
1微升 |
无核酸酶水 |
总体积补至50微升 |
PCR条件:置于PCR扩增仪中,98℃预变性30秒,98℃变性30秒,65℃退火30秒,72℃延伸30秒,共循环4-6次(DNA样本库)。最后在72℃延伸5分钟。
使用Beckman Coulter Ampure Beads试剂盒(货号:A63880)将PCR扩增产物过柱纯化。五、采用下一代测序技术检测病原体的基因片段
使用TruSeqPEClusterKitv3-cBot-HS,使用桥式PCR对DNA样本库模板进行扩增:每个DNA样本片段将会在芯片上形成克隆簇,每条泳道上产生数百万这样的克隆簇。使用IlluminaHiSeq4000下一代测序系统,PE-150bp其原理是边合成边测序。
测序产生两个配对末端fastq格式序列文件,大小为1.5Gb,含10M条150bp长的reads。用fastx-toolkits软件包中的fastx_trimmer去除reads5’端的接头及引物序列,随后用该软件包中的fastx_clipper去除接头序列。用velvet软件进行paired-end拼接,将拼接好的序列与未被拼接的reads与本地病毒基因序列数据库进行比对。结果发现:共有901条reads比对到肺炎克雷伯菌基因组上。
由于本发明的关键是加入了特异性结合人源基因组的探针,可以去除部分人类基因组,从而降低测序成本,减少测序时间,同时提高了灵敏度。从下表可知,测序数据量从每个样本1.5G,降低到1.2G,同时测序时间从15个小时,减少到12.5个小时。
表14
|
下机数据G/样本 |
测序时间h/样本 |
直接测序(未采用探针去除人源基因) |
1.5 |
15 |
探针去除人源基因后的测序 |
1.2 |
12.5 |
验证试验1
另外基于以上方法,与苏州大学附属第一医院开展合作,进行方法学验证。以临床上常用的微生物培养为金标准,验证高通量测序方法的灵敏度。具体方案为,取59个感染患者的痰液样本,将样本分成3部分,一份做微生物培养,一份使用探针法高通量测序,一份是未加入探针的高通量测序。痰液样本用于进行微生物直接培养后,采用医用自动微生物分析系统进行检测,获得样本中的病原菌进行鉴定;通过两种NGS检测方法对比至微生物数据库中,分析出主要的感染微生物是否存在以及种类,并将两种NGS方法得到的病原体与对微生物培养为金标准进行对比,考察NGS方法的灵敏性和特异性,并考察结果是否与金标准方法完全一致(当检查到的病原体完全相同时,认为是一致性)。
加入人源探针和未加入人源探针检测结果如下:
加入结合人源DNA探针NGS检测与微生物培养的一致性对比表
表15
加入结合人源DNA探针的高通量测序检测结果相对于微生物培养,敏感性可高达95.9%,特异性可达90%,整体一致性94.9%。
未加入结合人源DNA探针NGS检测与微生物培养的一致性对比表
表16
未加入结合人源DNA探针的高通量测序检测结果相对于微生物培养,敏感性为85.7%,特异性为70%,整体一致性83.1%。
加入结合人源DNA探针NGS检测与未加入结合人源DNA探针NGS检测的对比
表17
|
加入了结合人源DNA的探针 |
未加入结合人源DNA的探针 |
敏感性 |
95.9% |
85.7% |
特异性 |
90% |
70% |
总体一致性 |
94.9% |
83.1% |
加入结合人源DNA的探针,相比于未加入结合人源DNA的探针,与微生物培养相比的敏感性从85.7%提高到96%,特异性从70%提到90%,总体一致性从83.1%提高到94.9%。
验证试验2
考虑到序列3/10/14/20/57/59在微生物序列库种有匹配到微生物序列,我们考察了在SEQIDNO1.-68探针库中包含/去除这6种探针对检测结果的影响,对加入这6种序列探针库(组合1)和不加入6种序列探针库(组合2)做了对比。
采用的实验方法沿用了验证试验1中的样本和检测方法,采用微生物自动检测仪对痰液样本中是否含有镰刀菌、弓形虫,再采用SEQIDNO1.-68探针库以及删除了3/10/14/20/57/59探针的探针库对样本进行NGS检测,主要目的是验证镰刀菌、弓形虫等检出率是否存在差异。结果如下:
表18
通过以上的测试可以看到加入结合人源DNA探针的高通量测序敏感性较高,并且去掉匹配到微生物序列的探针后,检测性能再次得到提高,性能与微生物培养相当。但是微生物培养在临床上有一些限制因素,如培养成功率低,有可能培养的结果出现污染等情况,导致结果的假阳性和假阴性,并且培养能鉴定的微生物种类有限,而目前已知潜在致病的微生物已达20000多种。另外就是培养周期长。高通量测序的特点是通量大,一次可对所有的微生物DNA进行检测,在去除人源DNA影响的基础上,可大幅度提高检测灵敏度,同时检测周期较短。临床应用潜力巨大。
序列表
<110> 南京世和基因生物技术有限公司
南京世和医疗器械有限公司
<120> 一种基于高通量测序的感染线检测方法以及试剂盒
<130> 无
<160> 68
<170> SIPOSequenceListing 1.0
<210> 1
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
cgggcgcggt ggctcacgcc tgtaatccca gcactttggg aggctgaggc gggcggatca 60
cgaggtcagg agatcgagac catcctggct aacacggcga aaccccgtct ctactaaaaa 120
<210> 2
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
aatcccagca ctttgggagg ccgaggcggg tggatcatga ggtcaggaga tcgagaccat 60
cctggctaac aaggtgaaac cccgtctcta ctaaaaatac aaaaaattag ccgggcgcgg 120
<210> 3
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
gggcgcggtg gctcacgcct gtaatcccag cactttggga ggccgaggcg ggcggatcac 60
gaggtcagga gatcgagacc atcccggcta aaacggtgaa accccgtctc tactaaaaat 120
<210> 4
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
cgcccggcta attttttttt tttgtatttt tagtagagac ggggtttcac cgtgttagcc 60
aggatggtct cgatctcctg acctcgtgat ccgcccgcct cggcctccca aagtgctggg 120
<210> 5
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gtaatcccag cactttggga ggccgagatg ggcggatcac gaggtcagga gatcgagacc 60
atcctggcta acacggtgaa accccgtctc tactaaaaat acaaaaatta gccgggcatg 120
<210> 6
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
tttttgtatt tttagtagag atggggtttc accgtgttag ccaggatagt ctcgatctcc 60
tgacctcgtg atccggccgc ctcggcctcc caaagtgctg ggattacagg cgtgagccac 120
<210> 7
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
ggcgcggtgg ctcacgcctg taatcccagc actttgggag gccgaggcgg gcggatcacg 60
aggtcaggag atcgagacca tcccggctaa aacggtgaaa ccccgtctct actaaaacta 120
<210> 8
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
tcgagaccac ggtgaaaccc cgtctctact aaaaatacaa aaagttagcc gggcgcagtg 60
gcgggtgcct gtagtcccag ctactcggga ggctgaggca ggagaatggc gtgaacccgg 120
<210> 9
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
ctctgtcacc caggctggag tgcagtggcg cgatctcggc tcactgcaag ctccgcctcc 60
tgggttcaca ccattctcct gcctcagcct ctccgagtag ctgggactac aggcgcccgc 120
<210> 10
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
catacgtgtg catgtgtctt tatagcagca tgatttatag tcctttgggt atatacccag 60
taatgggatg gctgggtcaa atggtatttc tagttctaga tccctgagga atcgccacac 120
<210> 11
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
tggacatttg ggttggttcc aagtctttcc tattgtgaat agtgccgcaa taaacatacg 60
tgtacatgtg tctttatagc agcatgattt ataatccttt gggtatatac ccagtaatgg 120
<210> 12
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gattcctcag ggatctagaa ctagaaatac catttgaccc agccatccca ttactgggta 60
tatacccaaa tgagtataaa tcatgctgct ataaagacac atgcacacgt atgtttattg 120
<210> 13
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
aaaacaccaa aagcaatggc aacaaaagac aaaattgaca aatgggatct aattaaacta 60
aagagcttct gcacagcaaa agaaactacc atcagagtga acaggcaacc tacaacatgg 120
<210> 14
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
agtcaatcct aagccaaaag aacaaagctg gaggcatcac actacctgac ttcaaactat 60
actacaaggc tacagtaacc aaaacagcat ggtactggta ccaaaacaga gatatagatc 120
<210> 15
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
gccaagtcaa tcctaagcca aaagaacaaa gctggaggca tcacactacc tgacttcaaa 60
ctatactaca aggctacagt aaccaaaaca gcatggtact gctaccaaaa cagagatata 120
<210> 16
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tgagcagtgg tttgtagttc tccttgaaga ggtccttcac atcccttgta agttggattc 60
ctagatattt tattctcttt gaagcaattg tgaatgggag ttcactcatg atttggctct 120
<210> 17
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gcggtggctc atgcctataa tcccagcact ttgggaggca gaggcgggtg gatcatgaag 60
ttgggagatc gagaccatcc tggctaacac ggtgaaaccc cgtctctact taaaaaaaaa 120
<210> 18
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
ctcagcccaa aatctcctta agctgataag caacttcagc aaagtctcag gatacaaaat 60
caatgtacaa aaatcacaag cattcttata cacgaacaac agacaaacag agagccaaat 120
<210> 19
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
atctctgagc atttgcttgt ctgtaaagta ttttatttct ccttcactta tgaagcttag 60
tttggctgga tatgaaattc tgggttgaaa attcttttgt ttaagaatgt tgaatattgg 120
<210> 20
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
ataaatgtaa tccagcatat aaacagagcc aaagacaaaa accacatgat tatctcaata 60
gatgcagaaa aagcctttga caaaattcaa caacccttca tgctaaaaac tctcaataaa 120
<210> 21
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
ttttggatct ttcctgcttt ctcttgtggg catttagtgc tataaatttc cctctacaca 60
ctgctttgaa tgcgtcccag agattctggt atgttgtgtc ttgttctcgt tggtttcaaa 120
<210> 22
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tgataaaaca gactttaaac caacaaagat caaaagagac aaagaaggcc attacataat 60
ggtaaaggga tcaattcaac aagaggagct aactatccta aatatttatg cacccaatac 120
<210> 23
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tttagggcag gcctggtggt gacaaaatgt ctcagcattt gcttgtctgt aaaggatttt 60
atttctcctt cacttatgaa gcttagtttg gctggatatg aaattctgtg ttgaaaattc 120
<210> 24
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
tgggggccaa tattcaacat tcttaaagaa aagaattttc aacccagaat ttcatattca 60
gccaaactaa gcttcataag tgaaggagaa ataaaatact ttatagacaa gcaaatgctg 120
<210> 25
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
ttccaacact atgttgaata ggagtggtga gagagggcat ccctgtcttg tgccagtttt 60
caaagggaat gcttccagta tttgtccatt cagtatggac tgtgggtttg tcatagatag 120
<210> 26
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
gcgaggtggc gggcacctgt agtcccagct acgcgggagg ctgaggcagg agaatagcgt 60
gaaccccagg gggcggagcc tgtagtgagc cgagatcgcg ccactgcact ccagcctggg 120
<210> 27
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
atgaatctgg gtgctcctgt attgggtgca tatatattta ggacagttag ttcttcttgt 60
tgaattgatc cctttaccat tatgtaatgg ccttctttgt ctcttttgat ctttactggt 120
<210> 28
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gtgtgtagag ggaaatttat agcactaaat gcctacaaga gaaagcagga aagatccaaa 60
attgacaccc taacatcaca attaaaagaa ctagaaaagc aagagcaaac acattcaaaa 120
<210> 29
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ttgacaaaat tcaacaacgc ttcatgctaa aaactctcaa taaattaggt attgatgtat 60
ttcaaaataa taagagctat ctatgacaaa cccacagcca atatcatact gaatgggcaa 120
<210> 30
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
gtggctcacg cctgtaatcc cagcactttg gaaggccgag gcaagtggat cacttgaggt 60
caggagtttg agactagcct ggccaacacg gtgaaacctc gtctctactg aaaatacaaa 120
<210> 31
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
gttacatatg tatacatgtg ccatgctggt gcactgcacc cactaactcg tcatctagca 60
ttaggtatat ctcccaatgc tatccctccc ccctcccccg accccaccac agtccccaga 120
<210> 32
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
aacctacaaa atgggagaaa atttttgcaa cctactcatc tgagaaaggg cttatatcca 60
gaatctacaa tgaactcaaa caaatttaca agaaaaaaac aaacaacccc atcaaaaagt 120
<210> 33
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
agctactgga ttcattgatt tttttgaagg gttttttgca tctctatctc cttcagttct 60
gctctgatct tagttatttc ttgccttctg ctagcttttg aatttgtttg ctcttgcttc 120
<210> 34
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
gagtgagaac gtgcagtgtt tagttttctg tccttgtgat attttgctga gaatgatggt 60
ttccagcttc atccatgtcc ctgcaaagga catgaactca tccttttttt tgtggctgca 120
<210> 35
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
cagcggatct ctcggcagaa accctacaag ccagaagaga gtgggggcca atattcaaca 60
ttcttaaaca aaagaatttt caacccagaa tttcatatcc agccaaacta agcttcataa 120
<210> 36
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
cagtgtaaaa gcattcttat ttctccacat tctctctagc atctgttgtt tcctgacttt 60
ttaatgattg ccattctaac tggcatgagg tggtatctca ttgtggtttt aatttgcatt 120
<210> 37
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
tcaatgttca tcaaggatat tggtctaaaa ttctcttttt tggttgtgtc tctgtccggc 60
tttggtatca gaatgatgct ggcctcataa aatgagttag ggaggattcc ctctttttct 120
<210> 38
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
gtcattgatt ttttgaaggg ttttttgtgt ctctatttcc ttcagttctg ctttgatctt 60
agttatttct tgccttctgc tagcttttga atgtgtttgc tcttgcttct ctagttcttt 120
<210> 39
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
ttcttttggc ttaggattga cttggcaatg tgggctcttc tttggtccca tatgaacttt 60
aaagtagttt ttccaattct gtgaagaaag tcattggtgg cttgatgggg atggcattga 120
<210> 40
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
tgggaggctg aggcaggaga atggcgtgaa cctgggaggc ggagcttgca gtgagccgag 60
attgtgccac tgcaatctgg cctaggctaa agagcgggac tccgtctcaa aaaaaaaaaa 120
<210> 41
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
ctcactcaaa agcactcaac tacatggaaa ctgaacaacc tgctcctgaa tgactactgg 60
gtacataact aaatgaaggc agaaataaag atgttctttg aaaccaacga gaacaaagac 120
<210> 42
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
tccctttacc attatgtaat ggccttcttt gtctcttttg atctttgttg gtttaaagtc 60
tgttttatca gagactagga ttgcaactcc tgcctttttt tgttttccat ttgcttggta 120
<210> 43
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
aatctagaag aaatggataa attcctcgac acatacaccc tcccaagact aaaccaggaa 60
gaagttgaat ctctgaatag accaataaca ggagctgaaa ttgtggcaat aatcaatagc 120
<210> 44
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
actgtggtgg ggtcggggga ggggggaggg atagcattgg gagatatacc taatgctaga 60
tgacacatta gtgggtgcag cgcaccagca tggcacatgt atacatatgt aactaacctg 120
<210> 45
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
cgcctggcta atttttgtat ttttagtaga gtcagggttt ccatcatggc caggctggtc 60
ttgaactcct gacctcgtga tccacccgtc ttggcctccc aaagtgctgg gattacaggt 120
<210> 46
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
gtccatcctg gccaacaggg tgaaaccccg tctctactaa aaatacaaaa attagctggg 60
cctggtggca cgtgcctata atcccagcta ctcaggaggc tgagtcagca gaattgcttg 120
<210> 47
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
atggacacag gaaggggaac atcacactct ggggactgtt gtggggtggg ggaggcggga 60
gggatagcat tgggagataa acctaatgct agatgacgag ttagtgggtg cagcacacca 120
<210> 48
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
agttagctct tcttgttgca ttgattcctt taccattatg taatggtctt ctttgtctct 60
tttgatcttt gttggtttaa agtctgtttt atcagagact aggattgcaa cccctacttt 120
<210> 49
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
taaatgtctt cttttgagaa gtgtctattc atatccttcg cttacttttt gatggggttt 60
tttgtttttt tcttgtaaat ttatttgagt tcattgtaga ttctggatat tagccctttg 120
<210> 50
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
gcctccttat cctgtgccgg ttttcaaagg gaatgcttcc agtttttgcc cattcaatat 60
gatattggct gtgggtttgt cataaacagc tctttttatt ttgagataca ttccatcaat 120
<210> 51
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
ttctggtttc aagttattct cctgcctcag cctcctgagt agctgagatt acaggcaccc 60
gccaccacgc ctggctaatt tttgtacttt tagtagagac agggtttcat catgttggcc 120
<210> 52
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
cactgcaagc tcctcctccc gggttcacgc cattctccgg cctcagcctc ccaagtagct 60
gggactacag gcgcccgcct ccacacccgg ctaatttttt tctatttttc ggtctcctga 120
<210> 53
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
atcctcatgg atagaaagaa ttaatattgt gaaaatggcc atactgccca aggtaattta 60
tagattcaat gcaatcccta tcaagttacc aatgactttt ttcacagaat tggaaaaaac 120
<210> 54
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
tagtttcaga aggaatggta ccagctcctc tttgtacctc tggtagaatt cggctgtgaa 60
tccatctggt cctggacttt ttctggttgg taggctatta attattgcat caatttcaga 120
<210> 55
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
gagaatggtg tgaacccggg aggcggagct tgcagtgagc tgagatagcg ccactgcact 60
ctggcctggg tgaaagagcg agactccatc tcaaaaaaaa aaacaaaaaa aaaacaaaaa 120
<210> 56
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
cctaggtttt cttctagggt ttttatagtt ttaggtctaa catttaagtc tttaatccat 60
cttgaattga tttttgtata aggtgtaagg gagggatcca gtttcagctt cctacatatg 120
<210> 57
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
ggaggaagat ctaccaagca aatggaaaac aaaaaaaggc aggggttgca atcctagtct 60
ctgataaaac agactttaaa ccaacaaaga tcaaaagaga caaagaaggc cattacataa 120
<210> 58
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
acctccacct cctgggttca agcgattctc ctgcctcagc ctctcaagta gctgggatta 60
caggtgcacg ccaccacacc cagctaattt tgtattttta gtagagatga ggtttcacca 120
<210> 59
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
ctcccaagac taaaccagga agaagttgaa tctctgaata gaccaataac aggctctgaa 60
attgtggcaa taatcaatag tttaccaacc aaaaagagtc caggaccaga tggattcaca 120
<210> 60
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
tggcgggcgc ctgtagtccc agctacttgg gaggccgagg caggagaatg gcgtgaaccc 60
ggaaggcgga gcttgcagtg agcggagatc gcgccacagc actcccgcct gggcgacaga 120
<210> 61
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
gacgcctgta atcccagtac tttgggaggc tgtggtgggt ggatcacctg tggtcaggag 60
atctagacca gcctggtcaa catggtgaaa ccctgtctct actaaaaata caaaaaagcc 120
<210> 62
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
tgaggtcggg agttcgagac cagcctgacc aacatagaga aaccccatct ctactaaaaa 60
tacaaaatta gccaggcatg gcggcggatg cctgtaatcc cagctactca gaaggctgaa 120
<210> 63
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
ggtatcagga tgatgctagc ctcataaaat gagttaggga ggattccttc tttttctatt 60
gtttggaata atttcagaag gaatggtacc agctcctctt tgtacctgtg gtagaatttg 120
<210> 64
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
agagtgtttt ccaacttggt tccattctcc ccgtcacttt caggtacacc aattagacgt 60
agattttgtc ttttcacata gtcccatatt tcttggaggc tttgttcatt tctttttatt 120
<210> 65
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
ggcgtggtgg ctcacgcctg taatcccagc actttgggag gctgaggcgg gcagatcacc 60
agaggtcggg agttcaagac cgccctggcc aacgtgttga aaccccgtct ctactaaaaa 120
<210> 66
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
tacatatctg ttttggtacc agtattatgc tgttttggtt actgtggcct tatagtatag 60
tttgaagtca ggtagcgtga tgcctccagc tttgttcttt ttgcttagga ttgtcttggc 120
<210> 67
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
ccattctccc catcactttc aggtacacca atcagacgta gatttggtct tttcacatag 60
tcccatattt cttggaggct ttgctcattt ccttttattc ttttttctct aaacttccct 120
<210> 68
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
agcgagaagg gaagtttaga gaaaaaagaa taaaaagaaa tgagcaaagc ctccaagaaa 60
tatgggacta tgtgaaaaga ccaaatctac gtctgattgg tgtacctgaa agtgatgtgg 120