CN113168889B - 标签序列的检测方法 - Google Patents

标签序列的检测方法 Download PDF

Info

Publication number
CN113168889B
CN113168889B CN201880099610.8A CN201880099610A CN113168889B CN 113168889 B CN113168889 B CN 113168889B CN 201880099610 A CN201880099610 A CN 201880099610A CN 113168889 B CN113168889 B CN 113168889B
Authority
CN
China
Prior art keywords
tag
dna
sequence
artificial sequence
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880099610.8A
Other languages
English (en)
Other versions
CN113168889A (zh
Inventor
赵霞
赵静
章文蔚
陈奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Publication of CN113168889A publication Critical patent/CN113168889A/zh
Application granted granted Critical
Publication of CN113168889B publication Critical patent/CN113168889B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种标签序列的检测方法,包括:使用一组模板序列与一组待测标签序列进行匹配建库得到一组标签文库,模板序列是扩增或人工合成的不同基因序列,不同的模板序列在序列上彼此不同,模板序列与待测标签序列具有一对一或多对一的对应关系;对标签文库进行测序,得到每个标签文库的测序读长序列;将测序读长序列与全部待测标签序列进行比对,统计比对到每个待测标签序列上的测序读长序列的数量;根据数量计算每个待测标签序列中含有其他标签序列的污染率。该方法由于模板序列在序列上彼此不同,无需担心由于多次PCR扩增带来的序列错误而无法区分不同模板的情况。

Description

标签序列的检测方法
技术领域
本发明涉及测序技术领域,具体涉及一种标签序列的检测方法。
背景技术
在高通量二代测序中,通过给文库加入已知序列的文库标签(barcode),可以将多个文库混合在一起测序,后期根据文库标签将不同样品的信息分开。
标签文库有多种类型。第一种是单标签文库,可通过在接头上加上标签序列或在PCR引物上加上标签序列,再分别通过接头连接或PCR扩增的方式在文库中加上标签序列。第二种是双标签文库,可通过三种方式将双标签序列加入文库。第一种是在接头上加第一个标签序列,PCR引物上加第二个标签序列,通过加接头和PCR依次将两个标签加入文库中。第二种是两个标签序列分别加在PCR引物(聚合酶链式反应引物,Polymerase ChainReaction primer)的F引物(正向扩增引物,Forward primer)和R引物(反向扩增引物,Reverse primer)上,通过PCR扩增同时将两个标签加入文库中。第三种是两个标签分别加在接头序列的顶链(top chain)和底链(bottom chain)上,通过加接头同时将两个标签加入文库中。综上可见,构建标签文库的寡核苷酸(oligo)可分为标签接头、标签引物两大类。
虽然理论上标签混合(barcode pooling)文库(不同文库标签的单个文库混合在一起的文库)中一个标签只对应一个样本,但事实上有很多原因导致一个标签对应上了2个甚至是多个样本,造成测序数据之间的交叉污染。带文库标签的寡核苷酸(Barcode oligo)合成及纯化过程中引入的标签污染是原因之一。为此,在标准NGS(新一代测序,Next-Generation Sequencing)过程中,带文库标签的寡核苷酸的污染检测是必不可少的一个重要环节,在寡核苷酸投产之前,通过质检杜绝合成有污染的寡核苷酸投入使用,可从源头降低标签污染产生的概率。
目前寡核苷酸合成供应商标准的寡核苷酸QC(质量控制,Quality Control)方法主要包括OD(光密度,optical density)值检测、色谱检测、质谱检测,这些方法都不能检测寡核苷酸合成碱基的准确性,例如计划合成AATTCCGGA,而实际合成的寡核苷酸中有1%合成成了AATTCCGGT,有1%合成成了GATTCCGGA,这种合成错误的碱基如果位于测序引物的3’端,将直接影响测序引物杂交成功率和测序成功率,导致有效测序模板数降低或测序错误。
如图1-4所示,现有技术一直以来使用的检测寡核苷酸污染率的方法是以从质粒DNA上扩增出来的一段带10bp样本标签(index)序列的180bp的扩增DNA为模板,让其与待测寡核苷酸进行匹配NGS建库,通过NGS测序来分辨与样本标签序列匹配的文库标签序列的读长(reads)数,从而计算不匹配的其他标签的污染率。但该方法因模板DNA中只有10bp的碱基序列不一样,若是要进行read2测序,因碱基不平衡,二链测序质量得不到保证,故不能通过二链测序质量来间接检测寡核苷酸与二链引物杂交序列的碱基的合成准确性。
检测寡核苷酸碱基合成准确性,主要是通过PCR扩增寡核苷酸序列全长并加上A碱基之后做T-A克隆,Sanger测序寡核苷酸构建的单克隆文库,一般每个寡核苷酸需要测序至少100个单克隆文库。
另外,Eurofins公司采用质谱或液相色谱的方法来检测寡核苷酸合成质量,这些方法只能检测寡核苷酸纯度,不能检测合成碱基的准确性。2014年,Quail等报道了SASI-Seq(Sample Assurance Spike-In sequencing)的方法,采用带11nt的标签的Y构型特异引物,从PhiX 174中扩增384个带标签的Spike产物,用于质控混合文库的交叉污染及防止样本间混淆。但该方法未用于质控建库标签接头的标签合成污染率及合成碱基的准确性。
目前寡核苷酸合成出厂之前,一般都会对合成纯度及定量有一个质控过程,而对合成过程产生的寡核苷酸之间的交叉污染、合成的碱基准确性没有质控。NGS用户在拿到合成寡核苷酸之后,通常会对寡核苷酸(特别是标签接头或标签引物)进行污染率测试和合成碱基质量检测,一般两种检测不能在同一个实验中完成。
发明内容
本发明提供一种标签序列的检测方法,该方法包括:
使用一组模板序列与一组待测标签序列进行匹配建库得到一组标签文库,上述模板序列是扩增或人工合成的不同基因序列,不同的模板序列在序列上彼此不同,上述模板序列与上述待测标签序列具有一对一或多对一的对应关系;
对上述标签文库进行测序,得到每个标签文库的测序读长序列;
将每个标签文库的测序读长序列与全部上述待测标签序列进行比对,统计比对到每个待测标签序列上的测序读长序列的数量;
根据上述数量计算每个待测标签序列中含有其他标签序列的污染率;
在优选实施例中,上述模板序列是从基因组DNA中扩增得到的不同基因序列。
在优选实施例中,上述一组模板序列的数量是N,N=4X,X是大于等于1的整数。
在优选实施例中,上述一组模板序列的数量是96个。
在优选实施例中,上述模板序列的大小是50-1000bp,优选180bp。
在优选实施例中,全部上述模板序列的大小相等。
在优选实施例中,上述模板序列满足其5’端和3’端与测序读长相同的碱基序列范围内A、T、C、G任意一种碱基占比至少不低于可保证四种碱基信号平衡的碱基占比值。
在优选实施例中,上述模板序列的5’端和3’端与测序读长相同的碱基序列范围是5’端和3’端20bp至200bp范围,优选30bp内。
在优选实施例中,上述碱基占比值是10%至30%,优选15%。
在优选实施例中,上述模板序列的数量是上述待测标签序列的数量的N倍,N是大于等于1的整数,上述模板序列分成相当于上述待测标签序列的数量的亚组数,每亚组上述模板序列包含N个模板序列。
在优选实施例中,上述待测标签序列是标签接头和/或标签引物。
在优选实施例中,上述待测标签序列是单标签接头。
在优选实施例中,上述匹配建库包括:将上述模板序列与上述单标签接头按照一对一或多对一的对应方式进行接头连接,然后用通用引物进行PCR扩增得到用于上机的单标签文库。
在优选实施例中,上述待测标签序列是单标签引物。
在优选实施例中,上述匹配建库包括:将上述模板序列与通用接头连接得到连接产物,然后与单标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的单标签文库。
在优选实施例中,上述待测标签序列是标签接头和标签引物组成的双标签序列。
在优选实施例中,上述匹配建库包括:将上述模板序列与上述标签接头按照一对一或多对一的对应方式进行接头连接,然后与上述标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的双标签文库。
在优选实施例中,上述待测标签序列是两个标签引物组成的双标签引物。
在优选实施例中,上述匹配建库包括:将上述模板序列与通用接头连接得到连接产物,然后与上述双标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的双标签文库。
在优选实施例中,上述待测标签序列是两个标签接头组成的双标签接头。
在优选实施例中,上述匹配建库包括:将上述模板序列与上述双标签接头按照一对一或多对一的对应方式连接得到连接产物,然后与通用引物PCR扩增得到用于上机的双标签文库。
在优选实施例中,上述测序是双末端测序。
在优选实施例中,上述测序是PE30+10测序。
在优选实施例中,全部上述待测标签序列是同一批合成的全部标签序列。
在优选实施例中,上述方法还包括根据上述测序读长序列获得二链(read2)的测序质量评估结果;以及
任选地,通过上述评估结果来间接判断上述标签文库或上述标签文库的混合标签文库与二链测序相关接头的5’端碱基合成质量。
在优选实施例中,上述模板序列通过SEQ ID NO:1~192所示的96对引物对扩增人基因组得到。
本发明使用一组模板序列与待测标签序列进行匹配建库来检测标签序列,模板序列一旦制备成功,即可进行多次的扩增后再扩增,节省模板序列制备成本;由于模板序列在序列上彼此不同,无需担心由于多次PCR扩增带来的序列错误而无法区分不同模板的情况。
此外,优选技术方案通过检测二链测序质量来间接检测标签接头或与二链测序相关接头的5’端碱基合成质量。可通过一个实验实现标签污染率和与测序引物相关的寡核苷酸合成质量的同时检测,节省质控的人力和成本。
附图说明
图1为现有技术中模板DNA的制备流程图;
图2为现有技术中单标签接头质控方法中的建库流程示意图;
图3为现有技术中单标签接头质控方法中的测序原理示意图;
图4为现有技术中单标签接头质控方法中的污染率计算原理图;
图5为本发明实施例中模板DNA制备方法示意图;
图6为本发明实施例中质检单标签接头的建库流程示意图;
图7为本发明实施例中质检单标签引物的建库流程示意图;
图8为本发明实施例中质检单标签序列的测序原理示意图;
图9为本发明实施例中质检单标签序列的文库测序后污染率和二链测序质量评估结果ESR;
图10为本发明实施例中质检标签接头+标签引物的建库流程示意图;
图11为本发明实施例中质检双标签引物的建库流程示意图;
图12为本发明实施例中质检双标签接头的建库流程示意图;
图13为本发明实施例中质检双标签序列的文库测序原理示意图;
图14为本发明实施例中质检双标签序列的文库测序后污染率和二链测序质量评估结果ESR;
图15为本发明实施例中ESR二链不提升和ESR二链提升的主带为160bp的文库SE200测序之后得到的接头序列统计结果;
图16为本发明实施例中不同厂家及不同批次标签接头构建的单标签混合文库的ESR统计结果图;
图17为本发明实施例中琼脂糖凝胶电泳鉴定扩增产物图;
图18为本发明实施例中180bp特异性产物再纯化扩增产物电泳图;
图19为本发明实施例中PCR产物琼脂糖凝胶电泳;
图20为本发明实施例中环化产物TBU-PAGE胶电泳结果图;
图21为本发明实施例中混合文库的ESR结果图。
图22为本发明实施例中所有待检8个标签接头构建文库ESR拆分结果图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他材料、方法所替代。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。
定义
标签序列寡核苷酸(barcode oligo),本文中也称为“标签序列”(barcode),或“寡核苷酸”(oligo),是指文库(例如测序文库)构建中使用的具有区分不同样本来源和/或分子来源功能的核苷酸序列,包括标签接头和标签引物等。这些标签序列通过人工合成获得。
标签接头,含有标签的接头,指文库(例如测序文库)构建中使用的具有区分不同样本来源和/或分子来源功能的接头序列,包括单标签接头和双标签接头,其中双标签接头由两个单个的标签接头组成。
标签引物,含有标签的引物,指文库(例如测序文库)构建中使用的具有区分不同样本来源和/或分子来源功能的引物序列,包括单标签引物和双标签引物,其中双标签引物由两个单个的标签引物组成。
标签文库,是指通过文库构建方法得到的包含本发明的标签序列的文库,特别是测序文库。标签文库包括单标签文库和双标签文库。其中,单标签文库包含单标签接头或单标签引物。双标签文库包含双标签接头或双标签引物。
模板序列,是指本发明中用于与标签序列进行匹配建库的序列,不同的模板序列在序列上彼此不同。在优选实施例中,模板序列是从基因组DNA中扩增得到的不同基因序列。这样的模板序列,由于模板序列之间每个位置的序列都不一样,无需担心由于多次PCR扩增带来的序列错误而无法区分不同模板的情况。
测序,是指测定核酸序列的方法,本发明中尤其是指测定标签文库序列的方法,包括单端测序和双端测序,本发明优选双端测序,特别是PE30+10测序,即包括两端30bp测序长度和10bp标签序列长度的测序策略。
本发明可在一个实验中同时完成标签序列寡核苷酸(barcode oligo)合成污染率质控及与测序质量相关的寡核苷酸碱基合成质量的间接质控,为标签序列寡核苷酸的质检提供新方法。本发明的检测方法不仅适用于单标签序列寡核苷酸,也适合于双标签序列寡核苷酸。
如图5所示,本发明一个实施例中,以从人或其他任一物种基因组DNA中扩增N(N=4X,X≥1)个(如96个)固定碱基个数(包括50-1000bp之间的任一片段大小,优选测序仪测序质量相对较佳的片段大小,优选180bp)的基因序列,该基因序列需要满足其5’和3’末端与测序读长相同的碱基序列范围内(如5’和3’端20bp至200bp范围,优选30bp内)A/T/C/G任意一种碱基占比至少不低于一个设定值,这样可保证A/T/C/G碱基信号平衡,该设定值例如可以是10%至30%范围内的某一百分值,例如15%等,以保证标签序列测序(如PE30+10)的插入片段碱基平衡,即保证测序质量不受模板碱基不平衡的影响。用PCR切胶回收得到的PCR纯化产物做为种子PCR模板,进行扩增后再扩增(PCR on PCR)来得到大量的测试模板DNA。
当有N个标签序列寡核苷酸待检时,将测试模板DNA均分成N组,然后再将分组之后的模板DNA分别混合之后,与待测标签序列寡核苷酸进行匹配建库。例如,当有8个标签接头需要用制备好的96个模板DNA进行质检时,则将1-96个模板DNA分成8组,1-12号模板DNA等质量比例混合之后与标签序列1(Barcode1)进行匹配建库,13-24号模板DNA等质量比例混合之后与标签序列2(Barcode2)进行匹配建库,以此类推到85-96号模板DNA等质量比例混合之后与标签序列8(Barcode8)进行匹配建库。通过PE30+10测序来分辨与模板DNA匹配的标签序列的读长(reads)数,从而计算不匹配的其他标签序列的污染率,同时通过二链测序质量,如DNB测序中二链ESR(Effective Spot Rate,有效测序位点比率)提升情况,来间接检测标签序列寡核苷酸与二链引物杂交序列的碱基合成准确性。又如,当有96个标签接头需要用制备好的96个模板DNA片段进行质检时,则按照1个DNA模板对应1个标签接头进行匹配建库,通过PE30+10测序来进行标签序列污染率和标签序列寡核苷酸合成准确性间接检测。标签序列寡核苷酸可以是单标签建库的寡核苷酸,也可以是双标签建库的寡核苷酸。需要说明的是,虽然在待检的标签序列少于测试模板DNA(例如96个)的情况下,理论上可以仅采用部分测试模板DNA,然而,考虑到需要保证模板序列在选定的测序策略(例如PE30测序策略)下每个测序位置的碱基平衡,采用全部测试模板DNA(例如96个)有利于保证这一点。
当标签序列寡核苷酸是单标签建库的寡核苷酸,即单标签接头或单标签引物时,其质检方法如图6-9所示。如图6所示,当有N(N=4X,X≥1)个单标签接头(如标签1至标签N接头)需要用制备好的N个模板DNA片段(如模板DNA A至模板DNA N,或基因A片段至基因N片段)进行质检时,则按照DNA和标签接头一一对应的方式进行接头连接,再用通用引物进行PCR扩增得到用于上机的单标签文库。或者,如图7所示,当有N(N=4X,X≥1)个单标签引物(如标签1引物至标签N引物)需要用制备好的N个模板DNA片段(如模板DNA A至模板DNA N,或基因A片段至基因N片段)进行质检时,则按照DNA模板与通用接头连接之后得到DNA连接产物与标签引物一一对应的方式进行PCR扩增得到用于上机的单标签文库。
如图8所示,每个文库等比例混合之后,通过PE30+10测序来获得每个模板DNA(如基因A片段至基因N片段)的测序读长对应到不同标签(如标签1至标签N)的读长数,如图9中4995,4,X,1,0,4998,Y,2,2,8,Z,4990等数值。根据读长个数按照标签污染率公式,可计算出每个标签接头/引物中包含其他标签接头/引物的污染率,如图9中标签1接头的污染率为(4+X+1)/(4+X+1+4995)*100%,标签2接头的污染率为(0+Y+2)/(0+Y+2+4998)*100%,标签N接头的污染率为(2+8+Z)/(2+8+Z+4990)*100%。同时,通过下机报告,可获得二链(read2)的测序质量评估结果(如图9中ESR结果),通过评估结果来间接判断混合单标签文库与二链测序相关接头的5’端碱基合成质量。进一步通过下机数据的拆分分析,可获得每个单标签的测序质量评估结果(图中未示出)。
当标签序列寡核苷酸是双标签建库的寡核苷酸,即标签接头+标签引物、双标签引物或双标签接头时,其质检方法如图10-14所示。如图10所示,当有N(N=4X,X≥1)个标签接头(如标签1至标签N接头)和N个标签引物(如标签1至标签N引物)需要用制备好的N个模板DNA片段(如模板DNA A至模板DNA N,或基因A片段至基因N片段)进行质检时,则按照DNA和标签接头一一对应的方式进行接头连接,再用标签引物一一对应进行PCR得到用于上机的双标签文库。如图11所示,当有N(N=4X,X≥1)个标签引物F(如标签1至标签N引物F)和N个标签引物R(如标签1至标签N引物R)需要用制备好的N个模板DNA片段(如图中模板DNA A至模板DNA N,或基因A片段至基因N片段)进行质检时,则按照DNA模板与通用接头连接之后得到DNA连接产物与双标签引物一一对应的方式进行PCR扩增得到用于上机的双标签文库。如图12所示,当有N(N=4X,X≥1)个标签接头顶链(top)和N个标签接头底链(bottom)(如标签1+标签1至标签N+标签N接头)需要用制备好的N个模板DNA片段(如图中模板DNA A至模板DNA N,或基因A片段至基因N片段)进行质检时,则按照DNA模板与双标签接头一一对应连接之后得到DNA连接产物与通用引物PCR扩增得到用于上机的双标签文库。
如图13所示,每个文库等比例混合之后,通过PE30+10测序来获得每个模板DNA(如图中基因A片段至基因N片段)的测序读长对应到不同标签接头或标签引物F或标签接头顶链(如标签1至标签N)的读长数(如图14中4995,4,X,1,0,4998,Y,2,2,8,Z,4990)和不同标签引物或标签引物R或标签接头底链的读长数(如图14中4990,10,X,0,3,4995,Y,2,3,12,Z,4985)。通过读长数按照标签污染率公式可计算出每个标签接头或标签引物F或标签接头顶链中包含其他标签接头或标签引物F或标签接头顶链的污染率,如图14中第一个表格中标签1接头或标签1引物F或标签1接头顶链的污染率为(4+X+1)/(4+X+1+4995)*100%,标签2的污染率为(0+Y+2)/(0+Y+2+4998)*100%,标签N的污染率为(2+8+Z)/(2+8+Z+4990)*100%,如图14中第二个表格中标签1引物或标签1引物R或标签1接头底链的污染率为(10+X+0)/(10+X+0+4990)*100%,标签2引物或标签2引物R或标签2接头底链的污染率为(3+Y+2)/(3+Y+2+4995)*100%,标签N引物或标签N引物R或标签N接头底链的污染率为(3+12+Z)/(3+12+Z+4985)*100%。同时,通过下机报告,可获得二链(read2)的测序质量评估结果(如图中ESR结果),通过评估结果来间接判断混合双标签文库与二链测序相关接头的5’端碱基合成质量。进一步通过下机数据的拆分分析,可获得每个单标签的测序质量评估结果(图中未示出)。
本发明的特点包括:(1)模板DNA的设计需遵循碱基平衡的原则,以保证测序质量不受模板DNA因碱基不平衡而产生影响。(2)模板DNA一旦制备成功,即可进行多次的扩增后再扩增(PCR on PCR),节省模板DNA制备成本。由于模板DNA之间每个位置的序列都不一样,不用担心由于多次PCR扩增带来的序列错误而无法区分不同模板的情况,PCR带来的少量错误可以通过适当容错来解决。而现有技术由于只有10bp序列不一样,不宜进行扩增后再扩增(PCR on PCR)的模板制备。(3)若制备的模板DNA有X个,则可检测标签寡核苷酸(标签oligo)待检个数在4-X之间的标签寡核苷酸,实验安排不受待检标签寡核苷酸个数的影响。(4)创新性地发明了通过检测二链测序质量来间接检测标签接头或与二链测序相关接头的5’端碱基合成质量的方法。(5)可通过一个质控系统实现标签污染率和与测序引物相关的寡核苷酸合成质量的同时检测,节省质控的人力和成本。(6)本发明的方法可满足各种类型标签文库构建的标签寡核苷酸质检,灵活方便。
本发明中,通过检测二链测序质量来间接检测与二链测序引物杂交寡核苷酸的合成质量的方法,是通过一系列测试调查之后产生的。首先,通过测通ESR二链不提升(质量差)和提升(质量好)的文库的接头区域,发现ESR二链不提升的接头序列碱基完全正确的比率低于ESR二链提升的,从而推测接头合成质量或建库质量影响了接头序列的正确性从而影响二链的测序质量。如图15所示,本发明的一个实施例中,ESR二链不提升和ESR二链提升的主带为160bp的文库SE200测序之后得到的接头序列统计结果显示,图中示出接头序列(adapterSeq)主带为160bp的文库SE200测序之后得到的接头序列,数量(number)是每条序列对应的读长数,百分比(percent%)是每条序列占总序列的占比百分值。第一行序列是正确的接头序列,其他行序列是含有错误碱基(图中框中的碱基)的接头序列,可见ESR二链不提升文库的正确接头序列的占比低于ESR二链提升文库的正确接头序列的占比。
本发明中,进而又通过一系列的对比调查测试,发现ESR二链不提升(质量差)的主要原因是接头合成质量的影响,如图16所示,上图中对比了厂家A和厂家B两个不同厂家的单标签97至单标签104混合文库的ESR结果,可见厂家A单标签97-104接头混合文库的二链ESR有明显提升(图中厂家A 97~104曲线),而厂家B单标签97-104接头混合文库的二链ESR没有明显提升(图中厂家B 97~104曲线)。下图中对比了不同批次(第一批、第二批、第三批)采购的厂家B的单标签49-56接头混合文库的ESR结果,可见不同批次的单标签49-56接头混合文库的二链ESR有1批有明显提升,有2批没有明显提升。因此,确立了通过检测二链ESR是否提升来判断与二链测序引物杂交的接头序列5’端碱基合成的质量好坏。
以下通过实施例详细说明本发明的技术方案,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。
实施例1:检测DNA纳米球(DNB)测序平台8个单标签接头的标签污染率和接头合成质量
1. 96个180bp模板DNA制备
1.1设计96套特异性扩增人基因组上涉及23对染色体的180bp片段,分别来自于96个基因,引物如SEQ ID NO:1~192所示,其中每两条序列组成扩增一个基因的引物对,例如,SEQ ID NO:1~2是扩增第1个基因的引物对,SEQ ID NO:3~4是扩增第2个基因的引物对,以此类推,SEQ ID NO:191~192是扩增第96个基因的引物对。扩增产物序列如SEQ IDNO:193~288所示,其中每条序列表示一个基因的扩增产物,其中SEQ ID NO:193~240表示1-48号基因的扩增产物序列,SEQ ID NO:241~288表示49-96号基因的扩增产物序列。
1.2利用人源NA12878 DNA作为模板,扩增96个180bp特异性产物。其中,扩增体系及程序如下表1和表2所示。
表1扩增体系
Figure GDA0004102918220000081
表2扩增程序
Figure GDA0004102918220000082
Figure GDA0004102918220000091
1.3利用琼脂糖凝胶电泳鉴定扩增产物片段正确性及特异性:
1.3.1配制2.5%的TAE琼脂糖胶:胶的大小取决于需要检查的样品数量,通常每100mL1×TAE缓冲液中加入2.5g的琼脂糖,加热煮沸至胶粉完全溶解;在温水浴中冷却2min后,加入2μL GelStain(全式金),轻轻混匀,倒入胶板里,放入宽孔胶梳后,常温放置20-30min待胶凝固便可以使用。
1.3.2取10μL扩增后的DNA到点样板里,加入3μL的6×上样缓冲液,吹打混匀,全部点到胶孔里。
1.3.3电泳条件:150V,30min。
1.3.4电泳完成后拍照并存储照片,部分琼脂糖凝胶电泳鉴定扩增产物结果如图17所示。
1.4 180bp特异性产物切胶纯化回收
1.4.1将配制回收胶用的胶板、胶板架、梳子及跑回收胶用的电泳槽用清水洗涤干净,再用纯水润洗2-3次,晾干待用。
1.4.2配制2.5%的TAE琼脂糖胶:胶的大小取决于需要检查的样品数量,通常每100mL1×TAE缓冲液中加入2.5g的琼脂糖(BIO-RAD Megabase Agrose),加热煮沸至胶粉完全溶解,溶液中不含有任何固体不溶物;在温水浴中冷却2min后,不加任何染料,倒入胶板里,放入宽孔胶梳,常温放置20-30min待胶凝固便可以使用,注意琼脂糖溶液中不要有气泡。
1.4.3取上一步扩增的25-30μL DNA产物到点样板里,加入6μL的6×溴酚黄,吹打混匀,全部点到胶孔里。
1.4.4上样2μL 50bp ladder(Tiangen和NEB),点样孔为凝胶外侧的两个孔,远离回收样品点样孔,避免交叉污染。
1.4.5电泳条件:100V,2h-2.5h,溴酚黄跑到胶底端即可。
1.4.6电泳结束,将琼脂糖胶放入EB染料的TAE中染色30min。
1.4.7准备切胶用品:UV防护眼镜、头套、鞋套、手套、切胶刀片、承装回收胶EP管和EP管架。
1.4.8取一块干净的保鲜膜或PE手套,将染好的凝胶放在暗读器(Dark Reader)上切胶,在对应分子量180bp的位置用刀片切下目标条带,注意四个面,每切一个面换一个刀片,目标条带为180bp,所在位置为150-200bp之间。
1.4.9将切下的胶块放入干净的EP管中,称重并计算出所切胶的重量,做好标记。
1.4.10用QIAquick Gel Extraction kit进行胶纯化回收。
1.4.11取1μL纯化后产物用Qubit HS定量检测,记录每个样品的浓度。
1.5 180bp产物再扩增纯化
1.5.1取5ng的胶回收后产物进行再扩增纯化,反应体系及反应条件如下表3和表4所示:
表3扩增体系
Figure GDA0004102918220000101
表4扩增程序
Figure GDA0004102918220000102
1.5.2取5μL扩增产物跑琼脂糖凝胶检测,部分琼脂糖凝胶电泳鉴定扩增产物结果如图18所示。
1.5.3提前至少30分钟将AmpureXP磁珠从冰箱中取出,室温平衡,充分混匀待用。
1.5.4配制75%乙醇,可保存3天。
1.5.5用KingFisher进行纯化,每管样品加入90μL AmpureXP磁珠。
1.5.6纯化后用30μL TE重悬磁珠,准备进行下一步反应或保存于-20℃。
1.5.7取1μL纯化后产物用Qubit HS定量检测,记录每个样品的浓度,由于每套引物的扩增效率不同,若出现产物产量不足建库需求,重复步骤3扩增足量产物,每个产物浓度不小于1.67ng/μL,从而产物可以多次使用。所有96个产物中,产量相对较低的分别为#3、6、11、13、14、15、88和97,扩增是循环数可增加到22。
2.标签接头制备及接头退火操作
2.1寡核苷酸合成
合成如下表5所示的寡核苷酸序列,合成过程中避免寡核苷酸之间互相污染。
表5
Figure GDA0004102918220000111
2.2寡核苷酸溶解
寡核苷酸合成后,进行如下溶解操作:
2.2.1打开超净工作台电源,打开紫外灯,进行工作台、移液器、吸头、TE等待用物品的灭菌。
2.2.2核对:核对寡核苷酸合成单上的碱基序列、管子标签上的名称与订购的是否一致。
2.2.3离心:4℃,12000rpm,离心10min;注意保证寡核苷酸粉末聚集在管底部,离心后轻拿轻放,防止粉末飘起。
2.2.4关闭超净工作台的紫外灯,适当通风,在超净工作台里进行寡核苷酸的溶解:
a)关闭风机,小心开启管盖,注意不要让粉末飘出!打开一管寡核苷酸,根据管壁上的nmol数,加入(nmol数*10)μL的TE溶液,溶解粉末,成为终浓度为100nmol/μL(即100μM)的母液,盖紧管盖。
b)打开风机,通风约10秒后,再溶解下一管寡核苷酸。溶解每一管寡核苷酸之前,都需通风10秒左右,再溶解下一管。
c)溶解后,充分震荡混匀,短暂离心后室温放置1小时。
d)管盖标记清楚母液浓度100μM。
e)-20℃保存母液。
2.3退火
2.3.1打开超净工作台电源,打开紫外灯,进行工作台、移液器、吸头、TE等待用物品的灭菌。
2.3.2从-20℃取出寡核苷酸母液后,待完全融化后,震荡混匀,快速离心。关闭超净工作台的紫外灯,通风,在超净工作台里,按照下表6,取等体积的顶链和底链的母液,2×接头缓冲液(表7)进行混合,室温放置1小时,管盖标记清楚浓度25μM。
表6
组分 用量
顶链(100μM) 25μL
底链(100μM) 25μL
接头缓冲液(2×) 50μL
总量 100μL
表7 2×接头缓冲液配方
试剂名称 体积
5M NaCl 4μL
1M Tris HCl 4μL
2mM EDTA 20μL
172μL
总量 200μL
2.3.3稀释至10μM工作液:100μL 25μM的接头溶液加入150μL TE缓冲液,充分震荡混匀,快速离心。
2.3.4 -20℃保存工作液。
3.标签接头质量及污染率质检建库
3.1为检测标签501-508 8个标签接头,将96个180bp特异性产物按照1-96编号,均分成8组(编号分别为1-12,13-24,25-36,37-48,49-60,61-72,73-84,85-96),每组等质量混合之后,取50ng依次与标签501-508进行匹配建库。
3.2加A尾(A-tailing):
3.2.1提前将保持于-20℃的试剂取出并于冰上融解,缓冲液和ATP等试剂需要振荡充分混匀,低速离心。
3.2.2提前5min左右准备末端修复混合液,如果反应数较少,可将dATP稀释至10mM,加1μL使用,反应混合物配制完成后置于常温,如果需要配制多个反应,照15%损耗进行配制,配制反应体系如下表8:
表8
组分 用量
23.9μL
10×PNK buffer 4μL
dATP(100mM) 0.1μL
PNK(10U/μL) 1μL
rTaq(5U/μL) 1μL
总量 30μL
3.2.3在上一步骤10μL(体积不足用TE补充)180bp特异性产物中加入30μL配制好的末端修复混合液,混匀,离心。
3.2.4将产物置于PCR仪中,反应条件如下表9:
表9
温度 时间
37℃ 30min
65℃ 15min
4℃ 保持
热盖105℃  
3.2.5反应后产物可进行下一步反应或保存于-20℃冰箱。
3.3接头连接:
3.3.1将上一步产物40μL补水至50μL,与下面反应体系混匀,离心。
3.3.2配制反应体系如下表10:
表10
Figure GDA0004102918220000131
Figure GDA0004102918220000141
3.3.3将反应样品置入PCR仪中反应,反应条件如下表11:
表11
温度 时间
23℃ 20min
4℃ 保持
热盖105℃  
3.3.4纯化:
a)反应结束后,向80μL连接产物中加入40μL AmpureXP磁珠,振荡混匀,室温静置10min;
b)瞬时离心后置于磁力架,静置至液体澄清,小心吸弃上清;
c)向管中加入150μL 75%乙醇,静置30s吸弃上清,重复1次,用小量程的移液器尽可能弃掉残留的乙醇,室温晾干;
d)用23μL TE重悬磁珠,震荡混匀后室温结合5min,之后置于磁力架上至液体澄清,小心吸取23μL上清至PCR管中,准备进行下一步反应或保存于-20℃。
3.4PCR
3.4.1配制反应体系如下表12:
表12
组分 用量
Kapa 2×HotStart ReadyMix 25μL
AD153-PCR2-1(20μM) 2μL
AD153-PCR2-2(20μM) 2μL
总量 29μL
3.4.2将29μL反应体系加入上步骤21μL连接产物中,混匀。
3.4.3将反应样品置入PCR仪中反应,反应条件如下表13:
表13
Figure GDA0004102918220000142
Figure GDA0004102918220000151
3.4.4反应结束后,向50μL PCR产物中加入50μL Ampure XP磁珠进行纯化,32μLTE溶液进行回溶。
3.5PCR后的检测
3.5.1定量:取1μL纯化后的产物用Qubit HS定量检测,记录每个样品的浓度。
3.5.2琼脂糖电泳检测:
质控标准:主带在250-300bp之间。如图19所示,主带上方会有一些模板自连产物,实验验证表明其不会对结果产生影响,环化消化后自连产物便会消失。
3.6热变性单链分离
3.6.1根据96个PCR产物的浓度定量,每个等质量(每个取1.7ng)混合至160ng,用TE溶液补至48μL,加入5μL 10μM介导序列(splint oligo)。
3.6.2将样品置于PCR仪反应,程序如下表14:
表14
温度 时间
95℃ 3min
4℃ 10min
4℃ 维持
热盖105℃  
3.7环化
3.7.1提前5分钟准备反应混合液,配制如下表15所示:
表15
组分 用量
10×TA buffer 6μL
ATP(100mM) 0.6μL
T4 DNA连接酶(600U/μL) 0.2μL
总量 6.8μL
3.7.2在样品中加入环化反应混合液6.8μL,混匀。
3.7.3置于PCR仪上反应,其程序如下表16:
表16
温度 时间
37℃ 30min
4℃ 保持
热盖105℃  
3.8酶切消化
3.8.1提前5分钟准备反应混合液,Exo III酶先用储存缓冲液稀释10倍,配制如下表17:
表17
组分 用量
1μL
10×TA buffer 0.4μL
Exo I(20U/μL) 2μL
Exo III(10U/μL,10×稀释) 0.7μL
总量 4.1μL
3.8.2置于PCR仪上反应,37℃反应30min。
3.8.3反应完成后,离心,向每个样品中加入3μL 0.5M EDTA,混匀,离心,如需保存可将反应终止样品置于-20℃冰箱。
3.8.4纯化:用168μL AmpureXP磁珠进行纯化,25μL TE溶液进行回溶;准备进行下一步反应或保存至-20℃冰箱。
3.8.5单链环定量(ssCircle Quant)
将线性消化的单链环产物用Qubit单链分析试剂盒(Qubit ssDNA Assay Kit)定量。缓冲液与染料比例为199:1混匀后涡旋,并离心混合备用,取两份190μL稀释后染料工作液分别加入10μL的两种标准品涡旋并离心混合备用,取199μL稀释后染料工作液加入1μL样品,涡旋后并离心进行Qubit仪器定量。
跑6% TBU-PAGE胶检测线性DNA是否消化干净。若跑胶结果如图20中的泳道1-泳道3,则表示线性消化完全,如图20中泳道4,如果还有线性DNA残留,建议重新环化。
上述实施例中所用的试剂及物料如下表18所示:
表18
Figure GDA0004102918220000161
Figure GDA0004102918220000171
Figure GDA0004102918220000181
4.标签接头质量及污染率质检测序
将混合的文库送测BGISEQ-500平台进行PE30+10策略的测序。
5.信息分析
用ESR(有效测序位点比率)和接头污染分析流程进行结果分析。
6.数据结果
6.1ESR:
如图21为混合文库的ESR结果,可见这批501-508标签接头的总体5’端合成质量良好,二链有提升。
如图22为所有待检8个标签接头构建文库取用6个FOV的数据时,ESR拆分结果。
6.2接头污染率:
分别统计了8组模板DNA(1-12,13-24,25-36,37-48,49-60,61-72,73-84,85-96)分别测到标签501、502、503、504、505、506、507、508的读长(reads)数,然后根据匹配对应关系,计算标签匹配率和标签污染率,结果如下表19所示。其中标签504的污染率高于1%,判定为不合格。
表19
标签编号 标签匹配率 标签污染率
501 99.97% 0.03%
502 99.95% 0.05%
503 99.96% 0.04%
504 98.70% 1.30%
505 99.96% 0.04%
506 99.96% 0.04%
507 99.86% 0.14%
508 99.97% 0.03%
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
SEQUENCE LISTING
<110> 深圳华大生命科学研究院
<120> 标签序列的检测方法
<130> 18P27119
<160> 297
<170> PatentIn version 3.3
<210> 1
<211> 21
<212> DNA
<213> 人工序列
<400> 1
gccacaaaat acccaccaac c 21
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<400> 2
agggcgatgt cattcgtgtt 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<400> 3
ctatttgcgg tcctcctgct 20
<210> 4
<211> 21
<212> DNA
<213> 人工序列
<400> 4
ccctcagtcg ttctcatctg g 21
<210> 5
<211> 21
<212> DNA
<213> 人工序列
<400> 5
acactgagaa agaagcggtg a 21
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<400> 6
attgagttgg cctctgtccc 20
<210> 7
<211> 24
<212> DNA
<213> 人工序列
<400> 7
ccttcctcgg gttcctatat cttc 24
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<400> 8
gcacccttgg gagtcatgat ttg 23
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<400> 9
cctaaaggca acaacggcag 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<400> 10
acgtgattga tgtcgggtgg 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<400> 11
atagcgttcc cctagcctct 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<400> 12
ggagactgtg gagactcacg 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<400> 13
aggaactgct cttggcactc 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<400> 14
tgaacattct gggcggtacg 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<400> 15
gggctggcat tagggagttt 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<400> 16
gagatgagga gtccaagcgg 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<400> 17
gggctacccg attggtgaat 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<400> 18
ctagacacga ccctgacccc 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<400> 19
ttggtgaaaa gggcccatgc 20
<210> 20
<211> 24
<212> DNA
<213> 人工序列
<400> 20
caaatgtcaa ccaagcattg aagg 24
<210> 21
<211> 20
<212> DNA
<213> 人工序列
<400> 21
ggaagtgacg gaaacggaga 20
<210> 22
<211> 19
<212> DNA
<213> 人工序列
<400> 22
tgtgattggc tgtcggctg 19
<210> 23
<211> 21
<212> DNA
<213> 人工序列
<400> 23
agatcgctgc tctttagctg g 21
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<400> 24
tttcgccaag gggctcttac 20
<210> 25
<211> 20
<212> DNA
<213> 人工序列
<400> 25
cattgagcag cgcattaccc 20
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<400> 26
aaaaggcgca tcagaaccct 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<400> 27
gcaccgggaa gacagtatcc 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<400> 28
tctggcacag ttcttgagca 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<400> 29
cctaagtcag ccttcgctgg 20
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<400> 30
aggggaacga ggcacaaatc 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<400> 31
cagttcccgt caatccctcc 20
<210> 32
<211> 21
<212> DNA
<213> 人工序列
<400> 32
cgtgtcctaa tctcgtgagc a 21
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<400> 33
tggagatttg ggtcacacgg 20
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<400> 34
cagtcggcct aagaaggtag g 21
<210> 35
<211> 19
<212> DNA
<213> 人工序列
<400> 35
gggggagctg gttcagaat 19
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<400> 36
ggacctgggc ggttcaataa 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<400> 37
attccggatg acttggctgt 20
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<400> 38
gtgatggttc gtctgtcgcc 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<400> 39
cctgtgacat cgtagcccag 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<400> 40
cagtgcctgt gtagacgtgg 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<400> 41
aaggctgaac tccctgcaaa 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<400> 42
gtctgattcg gtggctaggt 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<400> 43
ttgtggctga aacccttcgt 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<400> 44
gtttggccct aatcgctccc 20
<210> 45
<211> 20
<212> DNA
<213> 人工序列
<400> 45
tggtgcaggc taaaccgaag 20
<210> 46
<211> 20
<212> DNA
<213> 人工序列
<400> 46
ttccgaacct tgggaagcag 20
<210> 47
<211> 18
<212> DNA
<213> 人工序列
<400> 47
gggggaagag tcctgcac 18
<210> 48
<211> 21
<212> DNA
<213> 人工序列
<400> 48
ccctcaacac ttcctcgaac a 21
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<400> 49
atgaggagtt gggacacgga 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<400> 50
ggcggaactc acgatcatct 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<400> 51
ggcggtgagt gaggaaaacc 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<400> 52
taatacgtgc gattccgggg 20
<210> 53
<211> 22
<212> DNA
<213> 人工序列
<400> 53
agtgacgttc taaatccagc cc 22
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<400> 54
tgagggtttg ttttccccga 20
<210> 55
<211> 21
<212> DNA
<213> 人工序列
<400> 55
gaacgcctct ccagttaaca c 21
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<400> 56
tctgacacct ttcgcacaca 20
<210> 57
<211> 22
<212> DNA
<213> 人工序列
<400> 57
agcaatctct taggtaggca gc 22
<210> 58
<211> 21
<212> DNA
<213> 人工序列
<400> 58
actaccacgt gtgtcatacc c 21
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<400> 59
ttgggcactg gcctattgtg 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<400> 60
ccaaaacgcc tacccaggat 20
<210> 61
<211> 21
<212> DNA
<213> 人工序列
<400> 61
aggggatgta gacagttgag c 21
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<400> 62
ccacccgcta attatgggca 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<400> 63
actttatgcg agtgtccgcc 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<400> 64
gatccgaaac tcggggaacc 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<400> 65
taaaactgcg tccgtgcaga 20
<210> 66
<211> 21
<212> DNA
<213> 人工序列
<400> 66
acttcaacgc cgacatacac a 21
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<400> 67
gagagagcgt gtgtgcttgt 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<400> 68
acagaagcga aaccgagaca 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<400> 69
ggatgaggcc agtcagtgtc 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<400> 70
ggctgaccgt cttaccatgc 20
<210> 71
<211> 20
<212> DNA
<213> 人工序列
<400> 71
tgctattcca aacgccacct 20
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<400> 72
tgctgacaag cgtaacctga 20
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<400> 73
ttggccctca gtagaggaga 20
<210> 74
<211> 20
<212> DNA
<213> 人工序列
<400> 74
ccatcccttt ctgcccgtat 20
<210> 75
<211> 19
<212> DNA
<213> 人工序列
<400> 75
ttccgttggg gaagatggc 19
<210> 76
<211> 20
<212> DNA
<213> 人工序列
<400> 76
gctagatccg ccacaaaagg 20
<210> 77
<211> 21
<212> DNA
<213> 人工序列
<400> 77
ctcagaatta caccgggagg g 21
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<400> 78
ggagaaccaa tcggtcgtga 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<400> 79
ccctctgtta tcccccttgc 20
<210> 80
<211> 20
<212> DNA
<213> 人工序列
<400> 80
gcagaaaaca acgacgagcg 20
<210> 81
<211> 22
<212> DNA
<213> 人工序列
<400> 81
tgggacagta gttggtacat gc 22
<210> 82
<211> 20
<212> DNA
<213> 人工序列
<400> 82
tctcagcccc gaagtatcca 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<400> 83
tgaaagtgtt gaagcgcgga 20
<210> 84
<211> 20
<212> DNA
<213> 人工序列
<400> 84
ggagtgggcg gaaaatgtct 20
<210> 85
<211> 23
<212> DNA
<213> 人工序列
<400> 85
ggaccatcaa caaacaacag gaa 23
<210> 86
<211> 23
<212> DNA
<213> 人工序列
<400> 86
aaacaatgca tcctcagtgg gag 23
<210> 87
<211> 20
<212> DNA
<213> 人工序列
<400> 87
tttgagtttg agcgggaggg 20
<210> 88
<211> 20
<212> DNA
<213> 人工序列
<400> 88
gcgtcaagga acaatgagcg 20
<210> 89
<211> 20
<212> DNA
<213> 人工序列
<400> 89
ataacccatg ctgcccacag 20
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<400> 90
cagtcaccgc cttgcttagt 20
<210> 91
<211> 20
<212> DNA
<213> 人工序列
<400> 91
cccccagact taggacagga 20
<210> 92
<211> 20
<212> DNA
<213> 人工序列
<400> 92
cccctaccct gtatggatgc 20
<210> 93
<211> 22
<212> DNA
<213> 人工序列
<400> 93
ttggacctga gagacttgaa ac 22
<210> 94
<211> 22
<212> DNA
<213> 人工序列
<400> 94
cagtccaaac caaaagagcc aa 22
<210> 95
<211> 23
<212> DNA
<213> 人工序列
<400> 95
aagttgtgct gccttatttg taa 23
<210> 96
<211> 25
<212> DNA
<213> 人工序列
<400> 96
cctgtgtcta atactatggt ctggt 25
<210> 97
<211> 20
<212> DNA
<213> 人工序列
<400> 97
aagtcgggga gaccattcct 20
<210> 98
<211> 20
<212> DNA
<213> 人工序列
<400> 98
ggtccctgac tggggagaat 20
<210> 99
<211> 20
<212> DNA
<213> 人工序列
<400> 99
gtccacttcc cctatgcagg 20
<210> 100
<211> 20
<212> DNA
<213> 人工序列
<400> 100
tcccaagcaa agatggacgg 20
<210> 101
<211> 19
<212> DNA
<213> 人工序列
<400> 101
gacgctgcaa agaccgaag 19
<210> 102
<211> 20
<212> DNA
<213> 人工序列
<400> 102
cgtgtcgtta ttgaggggga 20
<210> 103
<211> 20
<212> DNA
<213> 人工序列
<400> 103
gagaagagcg accctcacag 20
<210> 104
<211> 20
<212> DNA
<213> 人工序列
<400> 104
tgagtggtga acccgaaacc 20
<210> 105
<211> 22
<212> DNA
<213> 人工序列
<400> 105
ggaaagacag accaacctgg aa 22
<210> 106
<211> 23
<212> DNA
<213> 人工序列
<400> 106
ttatctccaa cacccaaacc cac 23
<210> 107
<211> 20
<212> DNA
<213> 人工序列
<400> 107
ggcctcaagg gatgtctcac 20
<210> 108
<211> 20
<212> DNA
<213> 人工序列
<400> 108
tgggttagtc ccgactccag 20
<210> 109
<211> 20
<212> DNA
<213> 人工序列
<400> 109
ttgcagaagg accatccctt 20
<210> 110
<211> 20
<212> DNA
<213> 人工序列
<400> 110
tctctgttga agctgagcgg 20
<210> 111
<211> 20
<212> DNA
<213> 人工序列
<400> 111
ttgtagcgta cgacaatgcg 20
<210> 112
<211> 20
<212> DNA
<213> 人工序列
<400> 112
tcccatcaca gttgaacccc 20
<210> 113
<211> 20
<212> DNA
<213> 人工序列
<400> 113
ggtgtctggt gtgttcggat 20
<210> 114
<211> 20
<212> DNA
<213> 人工序列
<400> 114
ggcctagaaa aggaacccgt 20
<210> 115
<211> 20
<212> DNA
<213> 人工序列
<400> 115
ctaggagccc ctcgcttttc 20
<210> 116
<211> 21
<212> DNA
<213> 人工序列
<400> 116
atgcacaaag tttgcctgtg g 21
<210> 117
<211> 24
<212> DNA
<213> 人工序列
<400> 117
acaaccagct gaggagaatg aaga 24
<210> 118
<211> 22
<212> DNA
<213> 人工序列
<400> 118
cgatgggcta agagtgggtg tt 22
<210> 119
<211> 20
<212> DNA
<213> 人工序列
<400> 119
acctggagcc gttgttcgag 20
<210> 120
<211> 22
<212> DNA
<213> 人工序列
<400> 120
taccaagaag acaccaccct cc 22
<210> 121
<211> 22
<212> DNA
<213> 人工序列
<400> 121
caagttgatg accagctccc ag 22
<210> 122
<211> 24
<212> DNA
<213> 人工序列
<400> 122
tagtttaccc agtatcgcca gcac 24
<210> 123
<211> 20
<212> DNA
<213> 人工序列
<400> 123
tgcccttagc ccactacttc 20
<210> 124
<211> 20
<212> DNA
<213> 人工序列
<400> 124
ctgagcccat ttcctcggtg 20
<210> 125
<211> 24
<212> DNA
<213> 人工序列
<400> 125
tcttacccaa aatgctttca gctc 24
<210> 126
<211> 22
<212> DNA
<213> 人工序列
<400> 126
catcgggtgt ctgggaatat ct 22
<210> 127
<211> 20
<212> DNA
<213> 人工序列
<400> 127
tttcctgagt gtccccgtgt 20
<210> 128
<211> 20
<212> DNA
<213> 人工序列
<400> 128
gggtgctttt cccaacaacc 20
<210> 129
<211> 20
<212> DNA
<213> 人工序列
<400> 129
atttcgaact ccacgccctg 20
<210> 130
<211> 20
<212> DNA
<213> 人工序列
<400> 130
ggtaacttca ccccgtgtgt 20
<210> 131
<211> 22
<212> DNA
<213> 人工序列
<400> 131
gtctgggtta ctcttcgctt ct 22
<210> 132
<211> 25
<212> DNA
<213> 人工序列
<400> 132
agatgggaat taagatcctt ctgtg 25
<210> 133
<211> 20
<212> DNA
<213> 人工序列
<400> 133
ctggcctagg ggctagttac 20
<210> 134
<211> 20
<212> DNA
<213> 人工序列
<400> 134
ggccaggcca gtatgttgta 20
<210> 135
<211> 24
<212> DNA
<213> 人工序列
<400> 135
ggatggaaat gaaatcaaac cacc 24
<210> 136
<211> 23
<212> DNA
<213> 人工序列
<400> 136
gcaatgggga atatgacttg tgt 23
<210> 137
<211> 20
<212> DNA
<213> 人工序列
<400> 137
ccaccccgga agctacaaat 20
<210> 138
<211> 20
<212> DNA
<213> 人工序列
<400> 138
ccccaaaaac tggcatgctg 20
<210> 139
<211> 20
<212> DNA
<213> 人工序列
<400> 139
ggtaaaggtg gcacccagtt 20
<210> 140
<211> 20
<212> DNA
<213> 人工序列
<400> 140
tgtgatcaga ttccgccctg 20
<210> 141
<211> 20
<212> DNA
<213> 人工序列
<400> 141
tgcactcctt gttaggcacg 20
<210> 142
<211> 20
<212> DNA
<213> 人工序列
<400> 142
cctagacata gacggcgctc 20
<210> 143
<211> 20
<212> DNA
<213> 人工序列
<400> 143
cccgcaccct ttgggtttat 20
<210> 144
<211> 19
<212> DNA
<213> 人工序列
<400> 144
acgccggaca tcgaaagtt 19
<210> 145
<211> 25
<212> DNA
<213> 人工序列
<400> 145
acttattgaa tctccccctg tttct 25
<210> 146
<211> 20
<212> DNA
<213> 人工序列
<400> 146
tgcccacttg ggagaagctc 20
<210> 147
<211> 24
<212> DNA
<213> 人工序列
<400> 147
catgggattc acttttcagt agtc 24
<210> 148
<211> 25
<212> DNA
<213> 人工序列
<400> 148
taagaataga gaggaagctg agaaa 25
<210> 149
<211> 20
<212> DNA
<213> 人工序列
<400> 149
tggtgatgtt cagcaggtgg 20
<210> 150
<211> 20
<212> DNA
<213> 人工序列
<400> 150
cccacgctgc agtatgtttg 20
<210> 151
<211> 20
<212> DNA
<213> 人工序列
<400> 151
acggagcttt gcctctcaat 20
<210> 152
<211> 20
<212> DNA
<213> 人工序列
<400> 152
ctcctcccag ttccctgcta 20
<210> 153
<211> 20
<212> DNA
<213> 人工序列
<400> 153
tgcacaaaag caaacccgtc 20
<210> 154
<211> 20
<212> DNA
<213> 人工序列
<400> 154
tcctaccaga aaagccgacc 20
<210> 155
<211> 20
<212> DNA
<213> 人工序列
<400> 155
ggttacccag cgtgactcat 20
<210> 156
<211> 20
<212> DNA
<213> 人工序列
<400> 156
gcaccttaac ctgaccgctt 20
<210> 157
<211> 20
<212> DNA
<213> 人工序列
<400> 157
agttggcgtc ttggactctg 20
<210> 158
<211> 20
<212> DNA
<213> 人工序列
<400> 158
ccaaaagagg cctaggggtt 20
<210> 159
<211> 20
<212> DNA
<213> 人工序列
<400> 159
caacccccaa gtctaccagc 20
<210> 160
<211> 20
<212> DNA
<213> 人工序列
<400> 160
tcagcacttc aggccctcta 20
<210> 161
<211> 21
<212> DNA
<213> 人工序列
<400> 161
tgtgggccag ttcgttaatc t 21
<210> 162
<211> 20
<212> DNA
<213> 人工序列
<400> 162
tcccctaaac atcccctcgt 20
<210> 163
<211> 20
<212> DNA
<213> 人工序列
<400> 163
gacagctaac agcccccatt 20
<210> 164
<211> 19
<212> DNA
<213> 人工序列
<400> 164
caccagctgt gcaattcgg 19
<210> 165
<211> 20
<212> DNA
<213> 人工序列
<400> 165
ctttgccact atgggctgtc 20
<210> 166
<211> 20
<212> DNA
<213> 人工序列
<400> 166
gtcgaaggcg ggacttcatt 20
<210> 167
<211> 20
<212> DNA
<213> 人工序列
<400> 167
ttggtgaggc aatgaggctg 20
<210> 168
<211> 20
<212> DNA
<213> 人工序列
<400> 168
gagggcccct tgaagcatac 20
<210> 169
<211> 20
<212> DNA
<213> 人工序列
<400> 169
tcaccggcga aacatccatt 20
<210> 170
<211> 20
<212> DNA
<213> 人工序列
<400> 170
ctgcaactac gagggggtag 20
<210> 171
<211> 23
<212> DNA
<213> 人工序列
<400> 171
tggttgcaat tctgagagtc atc 23
<210> 172
<211> 20
<212> DNA
<213> 人工序列
<400> 172
gaggactttg agacgagagg 20
<210> 173
<211> 20
<212> DNA
<213> 人工序列
<400> 173
ctggggacac gggtctagta 20
<210> 174
<211> 20
<212> DNA
<213> 人工序列
<400> 174
tttagggaca aggttggcgt 20
<210> 175
<211> 20
<212> DNA
<213> 人工序列
<400> 175
gcgttctgca ctcgagtctt 20
<210> 176
<211> 20
<212> DNA
<213> 人工序列
<400> 176
tccttaaacg caggtccact 20
<210> 177
<211> 20
<212> DNA
<213> 人工序列
<400> 177
agggccgtca ttaagcgaac 20
<210> 178
<211> 20
<212> DNA
<213> 人工序列
<400> 178
gaggcccgtg attccgttta 20
<210> 179
<211> 20
<212> DNA
<213> 人工序列
<400> 179
ccttcaacta cagccccgac 20
<210> 180
<211> 20
<212> DNA
<213> 人工序列
<400> 180
ggggccaggt atggacacta 20
<210> 181
<211> 22
<212> DNA
<213> 人工序列
<400> 181
cctatcggtc gtatcctctg tc 22
<210> 182
<211> 23
<212> DNA
<213> 人工序列
<400> 182
ccttccctcc aatactgaga aca 23
<210> 183
<211> 21
<212> DNA
<213> 人工序列
<400> 183
caagtcaggg ttttgcgttg a 21
<210> 184
<211> 23
<212> DNA
<213> 人工序列
<400> 184
gaacaagaaa ttagccagag gga 23
<210> 185
<211> 20
<212> DNA
<213> 人工序列
<400> 185
gggcatgaat tgccagagtg 20
<210> 186
<211> 20
<212> DNA
<213> 人工序列
<400> 186
tgtttataat gcgccgcgag 20
<210> 187
<211> 20
<212> DNA
<213> 人工序列
<400> 187
aaccggcgat ttctccaaga 20
<210> 188
<211> 20
<212> DNA
<213> 人工序列
<400> 188
aaagtccgag aaggcacgtc 20
<210> 189
<211> 20
<212> DNA
<213> 人工序列
<400> 189
ggggcttagt gggcttactc 20
<210> 190
<211> 20
<212> DNA
<213> 人工序列
<400> 190
gagagcccca caggatggta 20
<210> 191
<211> 23
<212> DNA
<213> 人工序列
<400> 191
tgaggtaatg gcctttcaga cat 23
<210> 192
<211> 23
<212> DNA
<213> 人工序列
<400> 192
ttccccaaca caatttcttg ctt 23
<210> 193
<211> 180
<212> DNA
<213> 人工序列
<400> 193
gccacaaaat acccaccaac ccgtacctgt ttaagcaact cctttcgaag gcttaaagtg 60
aaggaggaat ttgttattgg cttgagaacc ctaacactga cccaaattag cccagtggct 120
tcttatgtgt gtatatgtgt gtaacaagaa ttccttttac aacacgaatg acatcgccct 180
<210> 194
<211> 180
<212> DNA
<213> 人工序列
<400> 194
ctatttgcgg tcctcctgct gggcttcttc atcttcacct tcttaagagt acctgaaact 60
cgaggccgga cgtttgacca gatctcagct gccttccacc ggacaccctc tcttttagag 120
caggaggtga aacccagcac agaacttgag tatttagggc cagatgagaa cgactgaggg 180
<210> 195
<211> 180
<212> DNA
<213> 人工序列
<400> 195
attgagttgg cctctgtccc tgaggcctgg tgtacactca ggatgagtgt gacaaggagt 60
gagacatggt cagtggctgg agatgtcttc ccaattagaa cgctcatctt tgccccaggg 120
cctcacgcaa atcctgggct cttagttcca atttggtagt caccgcttct ttctcagtgt 180
<210> 196
<211> 180
<212> DNA
<213> 人工序列
<400> 196
gcacccttgg gagtcatgat ttgaagaatc ttcgtaccac aaactggccc aacagaacca 60
cacccagaac caccagcacg ttcaggatgg gaccattgcc caagttcagg gctgccacct 120
gccgggagaa acaaggtggt cacagagagg ctagcagaag atataggaac ccgaggaagg 180
<210> 197
<211> 180
<212> DNA
<213> 人工序列
<400> 197
acgtgattga tgtcgggtgg gcgtggaatg tgctgtgcat tgcgtgggga gggcccttag 60
tgggggtgag cttggtggga aaaggagggt ctcggagggt ccagctgctg gggtggaggc 120
cacaggggcc caggagtgca gggtgggcgc ggtaaagaga ctgccgttgt tgcctttagg 180
<210> 198
<211> 180
<212> DNA
<213> 人工序列
<400> 198
atagcgttcc cctagcctct ttccccgggg agaatgtagg atacaggccc agcctcctgg 60
cctttctcca tcagggactc agttgtctgg gcccccccgt cactttatct gctagggtcc 120
cagaagtcca gggtccccag ctctgtcctc cctcaggggc cgtgagtctc cacagtctcc 180
<210> 199
<211> 180
<212> DNA
<213> 人工序列
<400> 199
aggaactgct cttggcactc tgtgcacaag ggagatactg acattctttc tgttgtgcag 60
atgagaaaac aggctcagag aaggtgagta acttaccatg gtcacacagc agcagagcta 120
ggtcagtata atccacaagt cattctctta accgctccgc cgtaccgccc agaatgttca 180
<210> 200
<211> 180
<212> DNA
<213> 人工序列
<400> 200
gagatgagga gtccaagcgg agggctcctc acccttcccc aaacatcgta cctggccagg 60
taaggggcta aggcagctgc cctttcctct ctgcacagcc ctggagccag agctcggccc 120
agatcctgga actccccagg caagcatcct ggatctctcc aaactcccta atgccagccc 180
<210> 201
<211> 180
<212> DNA
<213> 人工序列
<400> 201
gggctacccg attggtgaat ccggggccct ttagcgcggt gagtttgaaa ctgctcgcac 60
ttggcttcaa agctggctct tggaaattga gcggagagcg acgcggttgt tgtagctgcc 120
gctgcggccg ccgcggaata ataagccggg tacagtggct ggggtcaggg tcgtgtctag 180
<210> 202
<211> 180
<212> DNA
<213> 人工序列
<400> 202
ttggtgaaaa gggcccatgc gttatgaaat ttgagatcca tcactttaag tgaatgtagg 60
ccctggatac agtgggagct cagaagagca aatcagttgg tcaccttgct caacgtattt 120
tactaagggc atcagtaagg ctttctatga cctgctcctt caatgcttgg ttgacatttg 180
<210> 203
<211> 180
<212> DNA
<213> 人工序列
<400> 203
tgtgattggc tgtcggctgg aggagggcgc gggtgcaggc ggcggtgaag ggctaggcag 60
ggctttggcg gtgtgagggg aggaaaggtg gtgagctccg gaaaggctgc tagagggaaa 120
gcaggatggg tcctccgagc ccagccccag gagccgggtg tctccgtttc cgtcacttcc 180
<210> 204
<211> 180
<212> DNA
<213> 人工序列
<400> 204
tttcgccaag gggctcttac ctcggatccg ccctcggggc cacggctttc cccggagacg 60
ccgcgagccc agacgaggtg ggaggggacc gggagaaagc cccccaatct gattcgcgcc 120
cagccagtcg tccgcgagcc gcggagccgc cttctgcacc cagctaaaga gcagcgatct 180
<210> 205
<211> 180
<212> DNA
<213> 人工序列
<400> 205
aaaaggcgca tcagaaccct agatctgaga tggaaaaggc tcacagcgca ctttgcaaac 60
tgcaaagagt cgggagatgt ttgcaattgg ttgcgtgcgt ggagcgcaag gagggaacgc 120
ggcagggagg gtaggctttg gggcgaggtg ggggtggggt gggtaatgcg ctgctcaatg 180
<210> 206
<211> 180
<212> DNA
<213> 人工序列
<400> 206
tctggcacag ttcttgagca gtagatgagt ttggtcacct ccagcggata tgcctgccga 60
taacaagcgg actcagtccc tgtcccgccc cttcctttgt ctgcctttac gggttcagcg 120
catcactcac tctctggtat gccatgatca gggccaacag ggatactgtc ttcccggtgc 180
<210> 207
<211> 180
<212> DNA
<213> 人工序列
<400> 207
aggggaacga ggcacaaatc tccgccactc agccccactg agcagagact gcgagtccga 60
accctcaagt tcctcggggc tttgacccct caatggcggc ggtctaactg ctggtaaaac 120
ccccggcccc tgactgttcc accgcccgtc tcccaaacgc ccagcgaagg ctgacttagg 180
<210> 208
<211> 180
<212> DNA
<213> 人工序列
<400> 208
cagttcccgt caatccctcc ccccttacac aggatgtcca tattaggaca tctgcgtcag 60
caggtttcca cggcctttcc ctgtagccct ggggggagcc atccccgaaa cccctcatct 120
tggggggccc acgagacctc tgagacagga actgcgaaat gctcacgaga ttaggacacg 180
<210> 209
<211> 180
<212> DNA
<213> 人工序列
<400> 209
cagtcggcct aagaaggtag gccaccccag ccctcccgag gccgcgggca gggtgcggag 60
gtcagacttc cagggaaggc caaggggcgc tttaagcagt gagaaggcca cggccaggag 120
gtggacgcag aaaaaacttg caccctggct cagattcttc ccgtgtgacc caaatctcca 180
<210> 210
<211> 180
<212> DNA
<213> 人工序列
<400> 210
ggacctgggc ggttcaataa tagactaaat tctagtctag ccaaagccct acgcgacact 60
gaacctagta agagtttaac actgtaattg gagttactct gtcctagatc ccggctcaca 120
ctcacataag ggacctccct caccctatcc tacccccccg aattctgaac cagctccccc 180
<210> 211
<211> 180
<212> DNA
<213> 人工序列
<400> 211
attccggatg acttggctgt gctcccctcc tccttgcgaa gaagttgttt tctgctggtg 60
ggttgttgta acccaatcta gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 120
gtgtgtgtct ggaagttggt gagggcggca gggagttgcg ggcgacagac gaaccatcac 180
<210> 212
<211> 180
<212> DNA
<213> 人工序列
<400> 212
cctgtgacat cgtagcccag agatgggcta gtcagcaagc agcaccccct cccctcccag 60
gggtccacaa agaacgcccc ctcccttccc agccctcaca ctagcagctg aggctgggtc 120
acccctcctg ctttcccaca atagagcttt ctatgtacag ccacgtctac acaggcactg 180
<210> 213
<211> 180
<212> DNA
<213> 人工序列
<400> 213
aaggctgaac tccctgcaaa ttttcaaaac tgcataaaag actcccaagc aaatataacc 60
agaaattaat tccatattac gctatctgga atgatttaca gatgaaattg tgatttttat 120
tatagctcaa gccaaagcat tagagtctga ttgaatatat acctagccac cgaatcagac 180
<210> 214
<211> 180
<212> DNA
<213> 人工序列
<400> 214
gtttggccct aatcgctccc cgttgtagct ctaactggct ccagtctcac tggcctacat 60
gccccgacac cggcccgatc taaaggcaga agatccggaa agtctgggat cagtgcgcgc 120
cagcccaacc ccctcactag acactagttg ccccgctcct acgaagggtt tcagccacaa 180
<210> 215
<211> 180
<212> DNA
<213> 人工序列
<400> 215
tggtgcaggc taaaccgaag ttagcctctg ctaccctctg ctgggtgagg cactggggag 60
aacagtggga ctgaatgggg cgggctttct ccctcccaca cttcccctgg aaacacccag 120
caccagcaca ttagaacatg gggagccacc ttccccagcg ctgcttccca aggttcggaa 180
<210> 216
<211> 180
<212> DNA
<213> 人工序列
<400> 216
gggggaagag tcctgcacga ctggttgccc gcctcccctc ccccagcctc tgagcggggc 60
ctgcggttgc tactgcgacg tggggcgcca ggggttgcaa ggagaaggat gcaacctgtt 120
aaaacagact tctcacttaa tctctcaagc aggttactgt gttcgaggaa gtgttgaggg 180
<210> 217
<211> 180
<212> DNA
<213> 人工序列
<400> 217
ggcggaactc acgatcatct tcttatagag accgtaatgc aggaccaggc tatgggtcaa 60
tgccaggcga tggggcttca tagggtgtcc agctcctggg ggtggggaga agagagttcg 120
tcagctctca cccctggagt tgcaaccccg cctcaaaacc tccgtgtccc aacccctcat 180
<210> 218
<211> 180
<212> DNA
<213> 人工序列
<400> 218
ggcggtgagt gaggaaaacc ttttgggcgc gggtggcagc ctgcggggct gaggtgggca 60
agcatggagg ctgcggcgga gtttcgggga gggagccgac cccgggcagg gactgaggag 120
gaaaggaggg ttgggaaact gcaacggtga gtggaggaca ccccggaatc gcacgtatta 180
<210> 219
<211> 180
<212> DNA
<213> 人工序列
<400> 219
tgagggtttg ttttccccga gctgagcgcc ttcctgaagg ctgggagaca tcctctcgtg 60
gtctgcacag agcaacagct ctggcctctg ctggctctgc cccacgtgta tagggctggg 120
atcttcctgc agttcacctt atagctccgc tgacaagggg gctggattta gaacgtcact 180
<210> 220
<211> 180
<212> DNA
<213> 人工序列
<400> 220
tctgacacct ttcgcacaca cacagaaaaa attgttcatt tccttaaagg gtgagctggc 60
taaggtacac agaaagcagg ggtggggtgg gcaaggaggc cctccctgtc ttccccccaa 120
cttttttttt cttctcaagc catgttccca gtctttcctg tgttaactgg agaggcgttc 180
<210> 221
<211> 180
<212> DNA
<213> 人工序列
<400> 221
actaccacgt gtgtcatacc ccctgcttct ccttttacta tgcagaattt tactattaaa 60
caagaagcta tttttagttg cttagcattg tttgtgactt agcctcttag actcaagagt 120
ggcccaagtc ctttcaaagg gcaaccccca tccctgaagc tgcctaccta agagattgct 180
<210> 222
<211> 180
<212> DNA
<213> 人工序列
<400> 222
ttgggcactg gcctattgtg cttcctgctc tgcacccacg tcatcccttc ttacttgtct 60
ctgctttggt gttcagaagt gcctgattct ggccaccttc attccctaga ctctgtactt 120
gatagagtca ctcctgcttg atactgctca ggacagtcag atcctgggta ggcgttttgg 180
<210> 223
<211> 180
<212> DNA
<213> 人工序列
<400> 223
aggggatgta gacagttgag cgtatattgt ggatatgttg agtttgcggt ggccgtggga 60
tgggcaagtg aaaattgata gcatacagtg ggacatatga ctagaatttg ttagcgaagt 120
taaggctggt gctgtggtac ttaagagaaa agagtgggat tgcccataat tagcgggtgg 180
<210> 224
<211> 180
<212> DNA
<213> 人工序列
<400> 224
gatccgaaac tcggggaacc ccggtgttag tctactcccc ctcccgcccc cggacaacac 60
gcacacgctt aacacaacac gcacaacata acgcgcgcgc gcgcgcacac acacactcca 120
tccgcgccga gttgcttccg ggaaaacaag cccagaaggc ggcggacact cgcataaagt 180
<210> 225
<211> 180
<212> DNA
<213> 人工序列
<400> 225
acttcaacgc cgacatacac agtccccttt acgcgtgcat acaagagcac actcctgtgc 60
gcacactctc acaggcacac tcacacgtgc acacgcgctg ccctcgcctc tccgcagggt 120
ttgccccgca cagaagccgg cgaggcggct cacggggaaa tctgcacgga cgcagtttta 180
<210> 226
<211> 180
<212> DNA
<213> 人工序列
<400> 226
acagaagcga aaccgagaca ctgaaaggag aaagactgac tggggcaaat atctcacact 60
gctggagaac agttcaagtc gatcgcatgg acccagggct ccagcgctgg gcggtgggtg 120
gatccatagg tctatcgcac aagtacacac agactcttgc acaagcacac acgctctctc 180
<210> 227
<211> 180
<212> DNA
<213> 人工序列
<400> 227
ggctgaccgt cttaccatgc aagagactaa cgttcagggt cagactaacg attctgacgt 60
tctgggctgg acacacagtt gaagtgagac accaaggaag agatggccag cccaacccct 120
cacacagcat cccttcctgg ttaatccatg gagtgacaat gacactgact ggcctcatcc 180
<210> 228
<211> 180
<212> DNA
<213> 人工序列
<400> 228
tgctgacaag cgtaacctga ctagcagaga ctagagacac cacgggaaag atggcttctg 60
gctggggtga ttacctactg tgtgctacgc attggccttg gtgctgcatg tgtgcatgca 120
acacgctcct atctgaaatg gtgagccctg tgttagacca aggtggcgtt tggaatagca 180
<210> 229
<211> 180
<212> DNA
<213> 人工序列
<400> 229
ttggccctca gtagaggaga gatcttttcc atctaacagg aggaaatgca gaaaagttgt 60
gtgcccttgc gaggaagttt ggaagttgga aggtgaaggc ctattctcct ggctttcatc 120
ttctctgtgg tttctgtttg ctcaatgaag catgagattc atacgggcag aaagggatgg 180
<210> 230
<211> 180
<212> DNA
<213> 人工序列
<400> 230
gctagatccg ccacaaaagg ataagccctt ccccaccact aacggaggaa acaagttggc 60
tcgggatccc gggacgcagg gcaccagcag tccctactct tcccgggaag gatcaatctg 120
aagtccccgg cggcaagaag agaagggtgc tcgaggccgc cgccatcttc cccaacggaa 180
<210> 231
<211> 180
<212> DNA
<213> 人工序列
<400> 231
ggagaaccaa tcggtcgtga gttcacctca gtcacttcca ctcacacatc cggtacggcg 60
ctgctaggat tcccttctgc atccgggctg tgaactcaag gagtccggtg tctgggtatc 120
tccggatcgc agcgagagcg gctagcagag gttcgcgacc cctcccggtg taattctgag 180
<210> 232
<211> 180
<212> DNA
<213> 人工序列
<400> 232
ccctctgtta tcccccttgc aaagagaagc ggtccacggg ggccacttta tcccaccccc 60
tctcctcccc tcctcctgcc cggtctaggt ctctgggtac ggaaaacggc gggccctaca 120
tctgcctcgt tttatggggg gcgcttcttc gcgctggcgg cgctcgtcgt tgttttctgc 180
<210> 233
<211> 180
<212> DNA
<213> 人工序列
<400> 233
tctcagcccc gaagtatcca ttcttaaaaa aaaagtaagt attacaagat tccaaagaaa 60
aatagctgaa aatattttca taaagccata aagtcacatg ggatgtatgt cctaagttaa 120
agaaacagat gtactctgtt tatcaaggaa tggcaaatgc atgtaccaac tactgtccca 180
<210> 234
<211> 180
<212> DNA
<213> 人工序列
<400> 234
tgaaagtgtt gaagcgcgga cccttctggg tccagggagg ggtccctgca aaactccagg 60
caggacttct caccagcagt cgtggggaac ggaggaggac atggggaggt tgtggggcct 120
caggctccgg gcaccagggg ccaacctcag gctcctaaag agacattttc cgcccactcc 180
<210> 235
<211> 180
<212> DNA
<213> 人工序列
<400> 235
aaacaatgca tcctcagtgg gaggctggta acatcagcca ggatgaccga tataaaaaca 60
cttagaacag catcttggaa ataaaaggta ccagctcccg tgaattctcc gtgtccacag 120
ctgtcttctt gaaaagtctc aaccaatgga attgcatttc ctgttgtttg ttgatggtcc 180
<210> 236
<211> 180
<212> DNA
<213> 人工序列
<400> 236
gcgtcaagga acaatgagcg ctgcacccta atacatcagt acttacagct ccaaagtgaa 60
tcaatctgtc ctgttgaaac cattaagagg acaaggatta ggaaaggtgg gtccatgaaa 120
cacgaccaga ggttttctca agacaagact cacgatgacg ccctcccgct caaactcaaa 180
<210> 237
<211> 180
<212> DNA
<213> 人工序列
<400> 237
ataacccatg ctgcccacag gcaggggagc gtggatggga ttctagttcc ttctagtcta 60
agggacccat ggatggcact gggcatgtgc cagcccccat gggttggccc gtgtttcagt 120
ggcctcttct gtgccacctc cctggggcag cctcatgagg actaagcaag gcggtgactg 180
<210> 238
<211> 180
<212> DNA
<213> 人工序列
<400> 238
cccctaccct gtatggatgc cacagaggag aagtaggtgt gaggagagta acagggaggg 60
aaggtggggc acagaatctc cctattgctg gtaacaccag ccagtgcaac ttagcagaag 120
ggcaccctcc agggaactgg gatttagtga agcagatgat tcctgtccta agtctggggg 180
<210> 239
<211> 180
<212> DNA
<213> 人工序列
<400> 239
ttggacctga gagacttgaa actgacgtcc ttttttaatt cggccattga ttgacacgga 60
gcaagttgct gagagggctt cttcgaaaca gaagagcatt gtgttctgag ggaagggagt 120
tggcagtgag tagtcaatgg atgtgctagc cgctccattt ggctcttttg gtttggactg 180
<210> 240
<211> 180
<212> DNA
<213> 人工序列
<400> 240
cctgtgtcta atactatggt ctggtacact gttcactgca ttgctttagc aacttcaaaa 60
ctcaaattct ttaacagaag attcagtttg aagaataggg ctctttgtta gtacttctgc 120
ttttaactct ttaatctcaa gctaacactt aacgaattta caaataaggc agcacaactt 180
<210> 241
<211> 180
<212> DNA
<213> 人工序列
<400> 241
ggtccctgac tggggagaat gaagacactg accaagagat gtgaagccac tcagggctgt 60
gcagggtctg aggatctcac tggggacggc ctcccagcgg ccagctatca gcacgagttg 120
gagggaaaga gccatggtgg gggtcagtca cgtggctccc aggaatggtc tccccgactt 180
<210> 242
<211> 180
<212> DNA
<213> 人工序列
<400> 242
tcccaagcaa agatggacgg gcactcccgc ttatactggg ctattttgct tacaacttct 60
ggagtcgcta ctctcggttt actaccaccg attgccctgg gtctgatgga gccagtctcg 120
taatacctgc ccagaatttt actcacacat ccgttggaca cctgcatagg ggaagtggac 180
<210> 243
<211> 180
<212> DNA
<213> 人工序列
<400> 243
gacgctgcaa agaccgaagg ggcagcccct gccctgctac cctccaggga gccaccgctc 60
tagagcccag gctcctctgg acatcatgtg acttggggga cgacttgcct ttcttctgaa 120
acacggctac agactataac tttaaaacac ggggcttagc tccccctcaa taacgacacg 180
<210> 244
<211> 180
<212> DNA
<213> 人工序列
<400> 244
gagaagagcg accctcacag tgagtgccga cccgctctct ccgcctcatt tccatttcgt 60
gggttctcgc ccgctctctc ccctccagcc tgcaccctcc tcccggatct tcactgcgac 120
cctagcgctc cgtgtggttt ctggccgcgc ggccctcggc ggtttcgggt tcaccactca 180
<210> 245
<211> 180
<212> DNA
<213> 人工序列
<400> 245
ttatctccaa cacccaaacc cactaggctg ccttgttctt gcactttcga tttggaagaa 60
atcgaactgc tcagtttatt gttaagccgt tttctcacca gcccacgaag ccaagctgag 120
cagcacccac cgcccccacc cccaagacta cccaatactt ccaggttggt ctgtctttcc 180
<210> 246
<211> 180
<212> DNA
<213> 人工序列
<400> 246
ggcctcaagg gatgtctcac atcctctgtc tatttgagac ttagaaaaat cctacaaggc 60
tggcagtgac agaactaaga tgatcatctc cagtttatag accagaacca gagctcagag 120
aggctagatg attgattacc aagtgccgga ctagcaagtg ctggagtcgg gactaaccca 180
<210> 247
<211> 180
<212> DNA
<213> 人工序列
<400> 247
tctctgttga agctgagcgg cccaccatca tcactgagta tattaactcg ggtgttggaa 60
tttcccaggt gtgtttaatc tgtatagctt tgtattttaa ggcagaactt tattctcagt 120
tattcatctc aaaatgagag ttttcagaaa agatcgagaa aagggatggt ccttctgcaa 180
<210> 248
<211> 180
<212> DNA
<213> 人工序列
<400> 248
ttgtagcgta cgacaatgcg gtcaacctta gctgcaagta ttcctacaat ctcttctcaa 60
gggagttccg ggcatccctt cacaaaggac tggatagtgc tgtggaagtc tgtgttgtat 120
atgggaatta ctcccagcag cttcaggttt actcaaaaac ggggttcaac tgtgatggga 180
<210> 249
<211> 180
<212> DNA
<213> 人工序列
<400> 249
ggcctagaaa aggaacccgt tgagaagagc ctcttagttg gagacagatt gaggagtgca 60
aaacagctat aaacaagtgg ctgccagcag gactttttat ctatgtatat tcccacctca 120
ctccaaagac aggaagagtg gttttctaaa atgcaaacaa atccgaacac accagacacc 180
<210> 250
<211> 180
<212> DNA
<213> 人工序列
<400> 250
atgcacaaag tttgcctgtg gaaggcggtg cgcgaccccg acgccggctc gggctagggt 60
cgcacccagg ctgccgccgc cagcagccgc gaaaagaggt tggagcaagg aagggggatg 120
ggggtgagag aggaaggtga aacgaggcgg agaacgcagg gaaaagcgag gggctcctag 180
<210> 251
<211> 180
<212> DNA
<213> 人工序列
<400> 251
cgatgggcta agagtgggtg ttgagatgga gctcccaggc caggaggctc agagactgac 60
ctctgagcta ggggacattc agagtggggc agggctaggc aaagtgaaac gggggctgca 120
ttcccatcct cgccctggaa gaggctaaga gcaaactctt cattctcctc agctggttgt 180
<210> 252
<211> 180
<212> DNA
<213> 人工序列
<400> 252
taccaagaag acaccaccct cccctgtgtc caccctccac cccaactcac ttgttcttga 60
agtcttccac caggtcctgc atgtttctca gctctgagtc caggcggccc cgttccccca 120
cgatgctgtc cagctgcctc ctgaggttgt tgatgtactg ctcgaacaac ggctccaggt 180
<210> 253
<211> 180
<212> DNA
<213> 人工序列
<400> 253
tagtttaccc agtatcgcca gcacagccat gccttgagcc agcactatgc caggccctgt 60
gctggaggcc ttaaatgcat tcttccagtg aattctccca acaagcccat gaggtagata 120
ctatcattat gcccctttta cagaaatggc agctgaggct gggagctggt catcaacttg 180
<210> 254
<211> 180
<212> DNA
<213> 人工序列
<400> 254
ctgagcccat ttcctcggtg tagttatctg aagtgtatat ctgcaaaaga ggcaaaggaa 60
tggacattca cttccaattc agcaagcatt aacccagtta aaaaaaattt ttaaagcaat 120
ttaaaaaacc aattcaggct tgctttcttc aggaaattct gaagtagtgg gctaagggca 180
<210> 255
<211> 180
<212> DNA
<213> 人工序列
<400> 255
catcgggtgt ctgggaatat ctaagaatac aattaggtta ctgcataaca aaatttcctt 60
taacttattg tacaatatac agcaaaagtc atttttacta gcaataccat ctttaaaaca 120
ctgaacaata tttgcttttc tactacttgc aggaaagagc tgaaagcatt ttgggtaaga 180
<210> 256
<211> 180
<212> DNA
<213> 人工序列
<400> 256
gggtgctttt cccaacaacc aggaatgcat ggaaaacagg caggcttccc caactcctgg 60
ctctgtgctg gctcagcaga agagctgtca caggagccca aggctcctca accatcccag 120
ggcctgcctc ccactggggc atgcggccct ggacttctgc acacggggac actcaggaaa 180
<210> 257
<211> 180
<212> DNA
<213> 人工序列
<400> 257
atttcgaact ccacgccctg agtgaaaacc gcttccccgc caggggtgac tgccctggga 60
tgttgctgtc ttcgggcagt tgtgggaagt tgggcgctgg cccttatttg agtagagacc 120
atcttaacta gattggaggc acacgtctca cagctgacag acacacgggg tgaagttacc 180
<210> 258
<211> 180
<212> DNA
<213> 人工序列
<400> 258
gtctgggtta ctcttcgctt ctggtatctg gcgttctttg gtacacagtt ctggtgttcc 60
taccaggact caagagacac cccttcctgc tgacattccc atcacaacat tcctcagaca 120
agcctgtaaa ctaaaatctg ttaccattct gatggcacag aaggatctta attcccatct 180
<210> 259
<211> 180
<212> DNA
<213> 人工序列
<400> 259
ggccaggcca gtatgttgta agtacctaca ctggacaggt aagacttgga agttctatct 60
ttcccacacc tacttctgaa agaagccagg taaccatatc cagatcttct aacatgtagc 120
tttctccttt cctgggtctt tccttcctgt tctagcccca gtaactagcc cctaggccag 180
<210> 260
<211> 180
<212> DNA
<213> 人工序列
<400> 260
gcaatgggga atatgacttg tgtcctaaac ctattaatgg taaccacatt tcatgtcaga 60
aacagctcat taaactaatt ttagatttgg tgagaatgtg tttaaataat gacagcctgc 120
agaagtctga agcaggtcat taaagccatt ggaattggtg gtttgatttc atttccatcc 180
<210> 261
<211> 180
<212> DNA
<213> 人工序列
<400> 261
ccccaaaaac tggcatgctg aacttaggtc cctgctttgg aaagagaagg gtaactgcga 60
cagacctttc tcaaaatgca gaaataacat caatcagatg agacttcaga taacccccat 120
gtgcgggcac cgctcttcca ccgccgccac agcccagtac atttgtagct tccggggtgg 180
<210> 262
<211> 180
<212> DNA
<213> 人工序列
<400> 262
ggtaaaggtg gcacccagtt tccaaagaca gcacagacgc caagggtctt ttctgaactt 60
cttcgatttt tatgatccct ggctgggtcg gagaagggct agttagtatg tttttctttc 120
ttctggatga aagttgcaag gacacttaag ccttatgctt cagggcggaa tctgatcaca 180
<210> 263
<211> 180
<212> DNA
<213> 人工序列
<400> 263
cctagacata gacggcgctc aaaaacatct gtggaaggag gaagggtggg aaggagggag 60
ggaattaaaa aagaagggag ggaaggagag aggcaggcaa atcttgtgac tccaaatcct 120
aatgtcttca gacttcatat atttttcttt ctgcaaaaca cgtgcctaac aaggagtgca 180
<210> 264
<211> 180
<212> DNA
<213> 人工序列
<400> 264
acgccggaca tcgaaagttg cgccaggcgg cctgggctta ttgatttctc tcccctaggc 60
gatcgtggag agcgcagaga gaggcgtgaa ggggcctacg ggcaggcgat ctcgcctcct 120
cacagtcgcc accgcccccg cccccatttg acttatgcaa ataaacccaa agggtgcggg 180
<210> 265
<211> 180
<212> DNA
<213> 人工序列
<400> 265
tgcccacttg ggagaagctc gaggaactga cgcaggcacc aggcctactc atgttggagt 60
ggctgctgaa ggtccggggc cagaggtgga caccctgtag aacttctggg tcaccctgat 120
ggacatggtg gaggcgggag tggaggcagg tgggcagaaa cagggggaga ttcaataagt 180
<210> 266
<211> 180
<212> DNA
<213> 人工序列
<400> 266
taagaataga gaggaagctg agaaacagct attccatttg tttgcatatt taggattttt 60
ttctaattga cagggatgga gggaagcaaa cttggatttt ttgttctttt gtattgtaag 120
atgtatatct aaaaggtttt aaaacatata gctaaggact actgaaaagt gaatcccatg 180
<210> 267
<211> 180
<212> DNA
<213> 人工序列
<400> 267
cccacgctgc agtatgtttg aagctccctt gccctggtct ccctcctcgc agcctcttct 60
gggtgaaagg cacatgtccc accagacacc catgagccat ccttggcccc tctctggaac 120
cttacccctc acatcccata aatccccaag gactgtgcat ccacctgctg aacatcacca 180
<210> 268
<211> 180
<212> DNA
<213> 人工序列
<400> 268
ctcctcccag ttccctgcta aaaatgttga cagtcacatc tgtgaaaccc tgcaacacca 60
cctctttgaa aaatcaaaca taaatcccta aacaatattt agcttttgaa gcaaaggttt 120
ggtttttatt tgcatattga ggcgcaaagc ttatttgcat attgagaggc aaagctccgt 180
<210> 269
<211> 180
<212> DNA
<213> 人工序列
<400> 269
tgcacaaaag caaacccgtc ggaggagttt tgccagaaac accaccgcct gcattgcgtc 60
ggacctgacc atttccaatg tgaaattccc ggggaaggtc gcgagccgct aggggccgtt 120
cgtgggcggg gcggcgggcc acaggggaag tagagttagc ggtcggcttt tctggtagga 180
<210> 270
<211> 180
<212> DNA
<213> 人工序列
<400> 270
gcaccttaac ctgaccgctt gggctgtggg ggagcctgtt tcagggaaag tgagggacgc 60
gccagtttcc tcctttggac ttgatgaggc acgaacgcat ctctaataaa gccaggtctc 120
cccgccgtgg ctccctgggc gggtgcctgt ggctcgggcc atgagtcacg ctgggtaacc 180
<210> 271
<211> 180
<212> DNA
<213> 人工序列
<400> 271
agttggcgtc ttggactctg atcctctaca gcaagagtgg gcagaaggac gcagctctgg 60
tgcctggccc ttccccagtt ggcctggggt ggtgcccatt ctccccaatg ccaggggcaa 120
gcaaggcctg gcctctacaa tctcaatggc ctccttgccc aacccctagg cctcttttgg 180
<210> 272
<211> 180
<212> DNA
<213> 人工序列
<400> 272
tcagcacttc aggccctcta gtcctgctcc cccctccttc ccctgccacc tgcactccct 60
tcaatgccat ccacccaaac ctcagaaaga aagtaccagt gctgtgtaca tgagggtgtg 120
tgttacttgt agagaagggg tgggggagaa cgggaagggg gctggtagac ttgggggttg 180
<210> 273
<211> 180
<212> DNA
<213> 人工序列
<400> 273
tgtgggccag ttcgttaatc tacttgagct ttggttagtt attctataga tcgttttgtg 60
gattaagtga aacatcatac tgaaaacact tagttttatc atccagacca gggcactaaa 120
cgagaataaa ccaacctcct agtttttgga tgtgtttgac acgaggggat gtttagggga 180
<210> 274
<211> 180
<212> DNA
<213> 人工序列
<400> 274
gacagctaac agcccccatt tatcaaatcc ctgtcatatg ctgtgtcagg cactttatat 60
ccctcatcca ggaggatgca aaaacctggt gtttttcttt tttttttttt tgcattttcc 120
agacgagcca agggatggct cagaagggtg aaggaactca cccgaattgc acagctggtg 180
<210> 275
<211> 180
<212> DNA
<213> 人工序列
<400> 275
ctttgccact atgggctgtc tacacagcta tggaataccg ctggcccttt ggcaattacc 60
tatgtaagat tgcttcagcc agcgtcagtt tcaacctgta cgctagtgtg tttctactca 120
cgtgtctcag cattgatcga tacctggcta ttgttcaccc aatgaagtcc cgccttcgac 180
<210> 276
<211> 180
<212> DNA
<213> 人工序列
<400> 276
ttggtgaggc aatgaggctg atagctcagc attagctaca gccacccctc ctggccaacc 60
acacagggat caaaccaggg gtcagtccag aggtcagagt caggagcaga caactcagat 120
ccagccaggg acaggcaggt cacacggaca tgtgcctcac gtatgcttca aggggccctc 180
<210> 277
<211> 180
<212> DNA
<213> 人工序列
<400> 277
tcaccggcga aacatccatt ccctgagcat ctgcttcagg ggctggggat ggagatgcta 60
aaaatgacag gagcgagaaa gagtagcagt taatattcac cgacagcctc attggcctgg 120
ctctcgactc ctcaccgcac tcctgaggtg ggagctgtta ctaccccctc gtagttgcag 180
<210> 278
<211> 180
<212> DNA
<213> 人工序列
<400> 278
tggttgcaat tctgagagtc atctctgatg gatggacata gataccttgg ccttggacaa 60
tttgtgctga ctgtggagca tctgtgggtc ctgtggctgg cagtggaggc ggtaaggaga 120
tgactagcag tgagctaccc taaggccccc ttgtctaccg cctctcgtct caaagtcctc 180
<210> 279
<211> 180
<212> DNA
<213> 人工序列
<400> 279
ctggggacac gggtctagta tttgatgggt tggaagggag tatggaggct tctggcacca 60
ggctaaggct ttagtcaggg tatatctgac aggtgtttgc tttgtgtctg cagtgttgcc 120
atcccccctg ggggtcctga gtgggacctc acggcctccc acgccaacct tgtccctaaa 180
<210> 280
<211> 180
<212> DNA
<213> 人工序列
<400> 280
gcgttctgca ctcgagtctt gcgggtggac atgcatatgt cagagtggag ggcaggcagc 60
gatatctact ggtttggctt gggtattttt tttttttgag atggagtctc agctatgaag 120
atataataag cttgttggat ggcccctccc atcacctggc agtggacctg cgtttaagga 180
<210> 281
<211> 180
<212> DNA
<213> 人工序列
<400> 281
gaggcccgtg attccgttta tatgaagggt cccgaacagg gacccacaga ggcatgagat 60
ggattccctg gggctagagg ctctgtctgg aagatggaaa tgggctggat ggaggggagg 120
tggatgcacg gcctcgggag cgcactccac accacaaact gttcgcttaa tgacggccct 180
<210> 282
<211> 180
<212> DNA
<213> 人工序列
<400> 282
ggggccaggt atggacacta aggcgtccgc tgagggtccc ggccgcatcc ccgggtggag 60
gccccccacc tccgcccagg cagcggcgcc ccctcgcggc cgcttactcg tcgccgtcgg 120
ggcacacgcc ggtggcttcg ttgtacttgg agcagtacac gtcggggctg tagttgaagg 180
<210> 283
<211> 180
<212> DNA
<213> 人工序列
<400> 283
cctatcggtc gtatcctctg tcctgaccga gaagtaccgc tgagcgccgc ctccgggacc 60
cccaggacag gctgcggccc ctcccctgcc cttcaccctc ccacagttcc tgccctgact 120
ccaataaatg gatgaggacg gagcgatctg ggctctgtgt tctcagtatt ggagggaagg 180
<210> 284
<211> 180
<212> DNA
<213> 人工序列
<400> 284
caagtcaggg ttttgcgttg actgagtggg atttgggtca tcaattccaa tcagatttct 60
ggagaaggct cttctttccc tgatgattga ggtcttcatt gcagtcctct cggtggaagg 120
agaggccttc ctggaagtcc aaacagttct cttttcctcc ctctggctaa tttcttgttc 180
<210> 285
<211> 180
<212> DNA
<213> 人工序列
<400> 285
gggcatgaat tgccagagtg ggctctaagg agaccgggat cgggggaaag aggaacctgg 60
aagaagccaa ggctccttgg accaggctgc agggcagaaa ggaaaggctg ggaggaggct 120
gcctggggtg gagggggaag ctccatcagc cccacacgga ctcgcggcgc attataaaca 180
<210> 286
<211> 180
<212> DNA
<213> 人工序列
<400> 286
aaagtccgag aaggcacgtc ctgcgagtgg aggttaaacc gaaatctgaa cagaatgcac 60
ggtccccgca aactacgatt gataaagaag atactgagac gtttgcgggg gatataagcc 120
atggttgtct cgccttcctc ccctccctgc caactatgtt tcttggagaa atcgccggtt 180
<210> 287
<211> 180
<212> DNA
<213> 人工序列
<400> 287
gagagcccca caggatggta agttagagga gagcacaagg aaatgaccca tttagagcag 60
cagctgcaat accgggtgag aataatttgc acttacatcc ttgatgtctc caggttctcc 120
tttctgtccc tgaaacatga aacattcaca ggattaagcc gagtaagccc actaagcccc 180
<210> 288
<211> 180
<212> DNA
<213> 人工序列
<400> 288
ttccccaaca caatttcttg ctttcactcc taaaatctaa aagcaaaaaa gggccacatt 60
gtttaaaatg cattctccct aaaaaatgct atatgctata atcatatctg cctcatccaa 120
cacgagtaag tactaaatta caggtctgtt ttagctgatg tctgaaaggc cattacctca 180
<210> 289
<211> 38
<212> DNA
<213> 人工序列
<400> 289
ttgtcttcct aaggaacgac atggctacga tccgactt 38
<210> 290
<211> 58
<212> DNA
<213> 人工序列
<400> 290
agtcggaggc caagcggtct taggaagaca atgtcataaa tcaactcctt ggctcaca 58
<210> 291
<211> 58
<212> DNA
<213> 人工序列
<400> 291
agtcggaggc caagcggtct taggaagaca attaattaag gcaactcctt ggctcaca 58
<210> 292
<211> 58
<212> DNA
<213> 人工序列
<400> 292
agtcggaggc caagcggtct taggaagaca agactcactg acaactcctt ggctcaca 58
<210> 293
<211> 58
<212> DNA
<213> 人工序列
<400> 293
agtcggaggc caagcggtct taggaagaca aataaggcag tcaactcctt ggctcaca 58
<210> 294
<211> 58
<212> DNA
<213> 人工序列
<400> 294
agtcggaggc caagcggtct taggaagaca attgatagat tcaactcctt ggctcaca 58
<210> 295
<211> 58
<212> DNA
<213> 人工序列
<400> 295
agtcggaggc caagcggtct taggaagaca accttcctgg tcaactcctt ggctcaca 58
<210> 296
<211> 58
<212> DNA
<213> 人工序列
<400> 296
agtcggaggc caagcggtct taggaagaca aaatatctct ccaactcctt ggctcaca 58
<210> 297
<211> 58
<212> DNA
<213> 人工序列
<400> 297
agtcggaggc caagcggtct taggaagaca acatgtttcc ccaactcctt ggctcaca 58

Claims (29)

1.一种标签序列的检测方法,其特征在于,所述方法包括:
使用一组模板序列与一组待测标签序列进行匹配建库得到一组标签文库,所述模板序列是扩增或人工合成的不同基因序列,不同的模板序列在序列上彼此不同,所述模板序列与上述待测标签序列具有一对一或多对一的对应关系;
对所述标签文库进行测序,得到每个标签文库的测序读长序列;
将每个标签文库的测序读长序列与全部所述待测标签序列进行比对,统计比对到每个待测标签序列上的测序读长序列的数量;
根据所述数量计算每个待测标签序列中含有其他标签序列的污染率。
2.根据权利要求1所述的检测方法,其特征在于,所述模板序列是从基因组DNA中扩增得到的不同基因序列。
3.根据权利要求1所述的检测方法,其特征在于,所述一组模板序列的数量是N,N=4X,X是大于等于1的整数。
4.根据权利要求1所述的检测方法,其特征在于,所述一组模板序列的数量是96个。
5.根据权利要求1所述的检测方法,其特征在于,所述模板序列的大小是50-1000bp。
6.根据权利要求1所述的检测方法,其特征在于,所述模板序列的大小是180bp。
7.根据权利要求1所述的检测方法,其特征在于,全部所述模板序列的大小相等。
8.根据权利要求1所述的检测方法,其特征在于,所述模板序列满足其5’端和3’端与测序读长相同的碱基序列范围内A、T、C、G任意一种碱基占比至少不低于可保证四种碱基信号平衡的碱基占比值。
9.根据权利要求8所述的检测方法,其特征在于,所述模板序列的5’端和3’端与测序读长相同的碱基序列范围是5’端和3’端20bp至200bp范围。
10.根据权利要求8所述的检测方法,其特征在于,所述模板序列的5’端和3’端与测序读长相同的碱基序列范围是30bp内。
11.根据权利要求8所述的检测方法,其特征在于,所述碱基占比值是10%至30%。
12.根据权利要求8所述的检测方法,其特征在于,所述碱基占比值是15%。
13.根据权利要求1所述的检测方法,其特征在于,所述模板序列的数量是所述待测标签序列的数量的N倍,N是大于等于1的整数,所述模板序列分成相当于所述待测标签序列的数量的亚组数,每亚组所述模板序列包含N个模板序列。
14.根据权利要求1所述的检测方法,其特征在于,所述待测标签序列是标签接头和/或标签引物。
15.根据权利要求1所述的检测方法,其特征在于,所述待测标签序列是单标签接头。
16.根据权利要求15所述的检测方法,其特征在于,所述匹配建库包括:将所述模板序列与所述单标签接头按照一对一或多对一的对应方式进行接头连接,然后用通用引物进行PCR扩增得到用于上机的单标签文库。
17.根据权利要求1所述的检测方法,其特征在于,所述待测标签序列是单标签引物。
18.根据权利要求17所述的检测方法,其特征在于,所述匹配建库包括:将所述模板序列与通用接头连接得到连接产物,然后与单标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的单标签文库。
19.根据权利要求1所述的检测方法,其特征在于,所述待测标签序列是标签接头和标签引物组成的双标签序列。
20.根据权利要求19所述的检测方法,其特征在于,所述匹配建库包括:将所述模板序列与所述标签接头按照一对一或多对一的对应方式进行接头连接,然后与所述标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的双标签文库。
21.根据权利要求1所述的检测方法,其特征在于,所述待测标签序列是两个标签引物组成的双标签引物。
22.根据权利要求21所述的检测方法,其特征在于,所述匹配建库包括:将所述模板序列与通用接头连接得到连接产物,然后与所述双标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的双标签文库。
23.根据权利要求1所述的检测方法,其特征在于,所述待测标签序列是两个标签接头组成的双标签接头。
24.根据权利要求23所述的检测方法,其特征在于,所述匹配建库包括:将所述模板序列与所述双标签接头按照一对一或多对一的对应方式连接得到连接产物,然后与通用引物PCR扩增得到用于上机的双标签文库。
25.根据权利要求1所述的检测方法,其特征在于,所述测序是双末端测序。
26.根据权利要求25所述的检测方法,其特征在于,所述测序是PE30+10测序。
27.根据权利要求1所述的检测方法,其特征在于,全部所述待测标签序列是同一批合成的全部标签序列。
28.根据权利要求1所述的检测方法,其特征在于,所述方法还包括根据所述测序读长序列获得二链(read2)的测序质量评估结果;以及
任选地,通过所述评估结果来间接判断所述标签文库或所述标签文库的混合标签文库与二链测序相关接头的5’端碱基合成质量。
29.根据权利要求1所述的检测方法,其特征在于,所述模板序列通过SEQ ID NO:1~192所示的96对引物对扩增人基因组得到。
CN201880099610.8A 2018-12-13 2018-12-13 标签序列的检测方法 Active CN113168889B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2018/120820 WO2020118596A1 (zh) 2018-12-13 2018-12-13 标签序列的检测方法

Publications (2)

Publication Number Publication Date
CN113168889A CN113168889A (zh) 2021-07-23
CN113168889B true CN113168889B (zh) 2023-04-04

Family

ID=71075863

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880099610.8A Active CN113168889B (zh) 2018-12-13 2018-12-13 标签序列的检测方法

Country Status (2)

Country Link
CN (1) CN113168889B (zh)
WO (1) WO2020118596A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111910258B (zh) * 2020-08-19 2021-06-15 纳昂达(南京)生物科技有限公司 双端文库标签组合物及其在mgi测序平台中的应用
CN116287161A (zh) * 2021-12-31 2023-06-23 安诺优达基因科技(北京)有限公司 一种寡核苷酸序列一致性的检测方法
CN115197999B (zh) * 2022-07-15 2024-01-23 纳昂达(南京)生物科技有限公司 质控双端唯一标签接头合成串扰的方法及装置
CN116004763B (zh) * 2022-07-19 2024-02-09 纳昂达(南京)生物科技有限公司 一种组合型接头的选择验证和质控方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101921841A (zh) * 2010-06-30 2010-12-22 深圳华大基因科技有限公司 基于Illumina GA测序技术的HLA基因高分辨率分型方法
CN106021987A (zh) * 2016-05-24 2016-10-12 人和未来生物科技(长沙)有限公司 超低频突变分子标签聚类分群算法
CN106755454A (zh) * 2017-01-06 2017-05-31 杭州杰毅麦特医疗器械有限公司 一种分子标签核酸检测方法
CN108932401A (zh) * 2018-06-07 2018-12-04 江西海普洛斯生物科技有限公司 一种测序样本的标识方法及其应用

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11177020B2 (en) * 2012-02-27 2021-11-16 The University Of North Carolina At Chapel Hill Methods and uses for molecular tags

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101921841A (zh) * 2010-06-30 2010-12-22 深圳华大基因科技有限公司 基于Illumina GA测序技术的HLA基因高分辨率分型方法
CN106021987A (zh) * 2016-05-24 2016-10-12 人和未来生物科技(长沙)有限公司 超低频突变分子标签聚类分群算法
CN106755454A (zh) * 2017-01-06 2017-05-31 杭州杰毅麦特医疗器械有限公司 一种分子标签核酸检测方法
CN108932401A (zh) * 2018-06-07 2018-12-04 江西海普洛斯生物科技有限公司 一种测序样本的标识方法及其应用

Also Published As

Publication number Publication date
WO2020118596A1 (zh) 2020-06-18
CN113168889A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
CN113168889B (zh) 标签序列的检测方法
US8673595B2 (en) Sample analysis method and assay kit used therein
US5650274A (en) DNA analyzing method
WO2013106737A1 (en) Genotyping by next-generation sequencing
CN106755329B (zh) 基于二代测序技术检测α和β地中海贫血点突变的试剂盒
US10648030B2 (en) Methods of determining the presence or absence of a plurality of target polynucleotides in a sample
JP2005515789A6 (ja) 遺伝的同一性を証明するための方法および検査キット
JP2005515789A (ja) 遺伝的同一性を証明するための方法および検査キット
CN111286548B (zh) 基于二代测序技术检测68个基因座的试剂盒及其使用的引物组合
KR20130142523A (ko) 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법
KR101778877B1 (ko) 황금배와 미니배의 품종 구별을 위한 분자마커
CN113774053B (zh) 一种同时检测多种番茄类病毒的核酸探针、试剂盒及其应用
CN108823294B (zh) 基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒
KR101961653B1 (ko) 고구마 품종 판별용 snp 분자 마커 및 이의 용도
CN113337590A (zh) 一种二代测序方法和文库构建方法
CN106367498B (zh) 美洲大蠊微卫星位点及其应用
CN112442547A (zh) 水稻稻瘟病抗性基因Pita的SNP分子标记的开发和应用
BR112022006939B1 (pt) Detecção de sequências unicamente associadas a uma região alvo de dna
Adamowicz et al. Multiplexed DNA methylation analysis of target regions using microfluidics (Fluidigm)
KR20150059672A (ko) 닭의 성별을 감별하기 위한 등온증폭반응용 프라이머 조성물 및 이를 이용하여 닭의 성별을 감별하는 방법
He et al. An efficient and accurate droplet digital PCR method for rapid transgene copy number detection and homozygous identification in cotton (Gossypium hirsutum)
CN108315396B (zh) 一种简单便捷检测snp的新方法
CN108179198B (zh) 一种基于line1转座子与微卫星引物相结合的猪基因组分子标记的挖掘方法
US20200105368A1 (en) High-throughput hybridization and reading method for biochips and system thereof
JP4346933B2 (ja) アブラナ科植物のs遺伝子型同定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant