CN113168889B

CN113168889B - 标签序列的检测方法

Info

Publication number: CN113168889B
Application number: CN201880099610.8A
Authority: CN
Inventors: 赵霞; 赵静; 章文蔚; 陈奥
Original assignee: BGI Shenzhen Co Ltd
Current assignee: BGI Shenzhen Co Ltd
Priority date: 2018-12-13
Filing date: 2018-12-13
Publication date: 2023-04-04
Anticipated expiration: 2038-12-13
Also published as: WO2020118596A1; CN113168889A

Abstract

一种标签序列的检测方法，包括：使用一组模板序列与一组待测标签序列进行匹配建库得到一组标签文库，模板序列是扩增或人工合成的不同基因序列，不同的模板序列在序列上彼此不同，模板序列与待测标签序列具有一对一或多对一的对应关系；对标签文库进行测序，得到每个标签文库的测序读长序列；将测序读长序列与全部待测标签序列进行比对，统计比对到每个待测标签序列上的测序读长序列的数量；根据数量计算每个待测标签序列中含有其他标签序列的污染率。该方法由于模板序列在序列上彼此不同，无需担心由于多次PCR扩增带来的序列错误而无法区分不同模板的情况。

Description

标签序列的检测方法

技术领域

本发明涉及测序技术领域，具体涉及一种标签序列的检测方法。

背景技术

在高通量二代测序中，通过给文库加入已知序列的文库标签(barcode)，可以将多个文库混合在一起测序，后期根据文库标签将不同样品的信息分开。

标签文库有多种类型。第一种是单标签文库，可通过在接头上加上标签序列或在PCR引物上加上标签序列，再分别通过接头连接或PCR扩增的方式在文库中加上标签序列。第二种是双标签文库，可通过三种方式将双标签序列加入文库。第一种是在接头上加第一个标签序列，PCR引物上加第二个标签序列，通过加接头和PCR依次将两个标签加入文库中。第二种是两个标签序列分别加在PCR引物(聚合酶链式反应引物，Polymerase ChainReaction primer)的F引物(正向扩增引物，Forward primer)和R引物(反向扩增引物，Reverse primer)上，通过PCR扩增同时将两个标签加入文库中。第三种是两个标签分别加在接头序列的顶链(top chain)和底链(bottom chain)上，通过加接头同时将两个标签加入文库中。综上可见，构建标签文库的寡核苷酸(oligo)可分为标签接头、标签引物两大类。

虽然理论上标签混合(barcode pooling)文库(不同文库标签的单个文库混合在一起的文库)中一个标签只对应一个样本，但事实上有很多原因导致一个标签对应上了2个甚至是多个样本，造成测序数据之间的交叉污染。带文库标签的寡核苷酸(Barcode oligo)合成及纯化过程中引入的标签污染是原因之一。为此，在标准NGS(新一代测序，Next-Generation Sequencing)过程中，带文库标签的寡核苷酸的污染检测是必不可少的一个重要环节，在寡核苷酸投产之前，通过质检杜绝合成有污染的寡核苷酸投入使用，可从源头降低标签污染产生的概率。

目前寡核苷酸合成供应商标准的寡核苷酸QC(质量控制，Quality Control)方法主要包括OD(光密度，optical density)值检测、色谱检测、质谱检测，这些方法都不能检测寡核苷酸合成碱基的准确性，例如计划合成AATTCCGGA，而实际合成的寡核苷酸中有1％合成成了AATTCCGGT，有1％合成成了GATTCCGGA，这种合成错误的碱基如果位于测序引物的3’端，将直接影响测序引物杂交成功率和测序成功率，导致有效测序模板数降低或测序错误。

如图1-4所示，现有技术一直以来使用的检测寡核苷酸污染率的方法是以从质粒DNA上扩增出来的一段带10bp样本标签(index)序列的180bp的扩增DNA为模板，让其与待测寡核苷酸进行匹配NGS建库，通过NGS测序来分辨与样本标签序列匹配的文库标签序列的读长(reads)数，从而计算不匹配的其他标签的污染率。但该方法因模板DNA中只有10bp的碱基序列不一样，若是要进行read2测序，因碱基不平衡，二链测序质量得不到保证，故不能通过二链测序质量来间接检测寡核苷酸与二链引物杂交序列的碱基的合成准确性。

检测寡核苷酸碱基合成准确性，主要是通过PCR扩增寡核苷酸序列全长并加上A碱基之后做T-A克隆，Sanger测序寡核苷酸构建的单克隆文库，一般每个寡核苷酸需要测序至少100个单克隆文库。

另外，Eurofins公司采用质谱或液相色谱的方法来检测寡核苷酸合成质量，这些方法只能检测寡核苷酸纯度，不能检测合成碱基的准确性。2014年，Quail等报道了SASI-Seq(Sample Assurance Spike-In sequencing)的方法，采用带11nt的标签的Y构型特异引物，从PhiX 174中扩增384个带标签的Spike产物，用于质控混合文库的交叉污染及防止样本间混淆。但该方法未用于质控建库标签接头的标签合成污染率及合成碱基的准确性。

目前寡核苷酸合成出厂之前，一般都会对合成纯度及定量有一个质控过程，而对合成过程产生的寡核苷酸之间的交叉污染、合成的碱基准确性没有质控。NGS用户在拿到合成寡核苷酸之后，通常会对寡核苷酸(特别是标签接头或标签引物)进行污染率测试和合成碱基质量检测，一般两种检测不能在同一个实验中完成。

发明内容

本发明提供一种标签序列的检测方法，该方法包括：

使用一组模板序列与一组待测标签序列进行匹配建库得到一组标签文库，上述模板序列是扩增或人工合成的不同基因序列，不同的模板序列在序列上彼此不同，上述模板序列与上述待测标签序列具有一对一或多对一的对应关系；

对上述标签文库进行测序，得到每个标签文库的测序读长序列；

将每个标签文库的测序读长序列与全部上述待测标签序列进行比对，统计比对到每个待测标签序列上的测序读长序列的数量；

根据上述数量计算每个待测标签序列中含有其他标签序列的污染率；

在优选实施例中，上述模板序列是从基因组DNA中扩增得到的不同基因序列。

在优选实施例中，上述一组模板序列的数量是N，N＝4X，X是大于等于1的整数。

在优选实施例中，上述一组模板序列的数量是96个。

在优选实施例中，上述模板序列的大小是50-1000bp，优选180bp。

在优选实施例中，全部上述模板序列的大小相等。

在优选实施例中，上述模板序列满足其5’端和3’端与测序读长相同的碱基序列范围内A、T、C、G任意一种碱基占比至少不低于可保证四种碱基信号平衡的碱基占比值。

在优选实施例中，上述模板序列的5’端和3’端与测序读长相同的碱基序列范围是5’端和3’端20bp至200bp范围，优选30bp内。

在优选实施例中，上述碱基占比值是10％至30％，优选15％。

在优选实施例中，上述模板序列的数量是上述待测标签序列的数量的N倍，N是大于等于1的整数，上述模板序列分成相当于上述待测标签序列的数量的亚组数，每亚组上述模板序列包含N个模板序列。

在优选实施例中，上述待测标签序列是标签接头和/或标签引物。

在优选实施例中，上述待测标签序列是单标签接头。

在优选实施例中，上述匹配建库包括：将上述模板序列与上述单标签接头按照一对一或多对一的对应方式进行接头连接，然后用通用引物进行PCR扩增得到用于上机的单标签文库。

在优选实施例中，上述待测标签序列是单标签引物。

在优选实施例中，上述匹配建库包括：将上述模板序列与通用接头连接得到连接产物，然后与单标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的单标签文库。

在优选实施例中，上述待测标签序列是标签接头和标签引物组成的双标签序列。

在优选实施例中，上述匹配建库包括：将上述模板序列与上述标签接头按照一对一或多对一的对应方式进行接头连接，然后与上述标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的双标签文库。

在优选实施例中，上述待测标签序列是两个标签引物组成的双标签引物。

在优选实施例中，上述匹配建库包括：将上述模板序列与通用接头连接得到连接产物，然后与上述双标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的双标签文库。

在优选实施例中，上述待测标签序列是两个标签接头组成的双标签接头。

在优选实施例中，上述匹配建库包括：将上述模板序列与上述双标签接头按照一对一或多对一的对应方式连接得到连接产物，然后与通用引物PCR扩增得到用于上机的双标签文库。

在优选实施例中，上述测序是双末端测序。

在优选实施例中，上述测序是PE30+10测序。

在优选实施例中，全部上述待测标签序列是同一批合成的全部标签序列。

在优选实施例中，上述方法还包括根据上述测序读长序列获得二链(read2)的测序质量评估结果；以及

任选地，通过上述评估结果来间接判断上述标签文库或上述标签文库的混合标签文库与二链测序相关接头的5’端碱基合成质量。

在优选实施例中，上述模板序列通过SEQ ID NO：1～192所示的96对引物对扩增人基因组得到。

本发明使用一组模板序列与待测标签序列进行匹配建库来检测标签序列，模板序列一旦制备成功，即可进行多次的扩增后再扩增，节省模板序列制备成本；由于模板序列在序列上彼此不同，无需担心由于多次PCR扩增带来的序列错误而无法区分不同模板的情况。

此外，优选技术方案通过检测二链测序质量来间接检测标签接头或与二链测序相关接头的5’端碱基合成质量。可通过一个实验实现标签污染率和与测序引物相关的寡核苷酸合成质量的同时检测，节省质控的人力和成本。

附图说明

图1为现有技术中模板DNA的制备流程图；

图2为现有技术中单标签接头质控方法中的建库流程示意图；

图3为现有技术中单标签接头质控方法中的测序原理示意图；

图4为现有技术中单标签接头质控方法中的污染率计算原理图；

图5为本发明实施例中模板DNA制备方法示意图；

图6为本发明实施例中质检单标签接头的建库流程示意图；

图7为本发明实施例中质检单标签引物的建库流程示意图；

图8为本发明实施例中质检单标签序列的测序原理示意图；

图9为本发明实施例中质检单标签序列的文库测序后污染率和二链测序质量评估结果ESR；

图10为本发明实施例中质检标签接头+标签引物的建库流程示意图；

图11为本发明实施例中质检双标签引物的建库流程示意图；

图12为本发明实施例中质检双标签接头的建库流程示意图；

图13为本发明实施例中质检双标签序列的文库测序原理示意图；

图14为本发明实施例中质检双标签序列的文库测序后污染率和二链测序质量评估结果ESR；

图15为本发明实施例中ESR二链不提升和ESR二链提升的主带为160bp的文库SE200测序之后得到的接头序列统计结果；

图16为本发明实施例中不同厂家及不同批次标签接头构建的单标签混合文库的ESR统计结果图；

图17为本发明实施例中琼脂糖凝胶电泳鉴定扩增产物图；

图18为本发明实施例中180bp特异性产物再纯化扩增产物电泳图；

图19为本发明实施例中PCR产物琼脂糖凝胶电泳；

图20为本发明实施例中环化产物TBU-PAGE胶电泳结果图；

图21为本发明实施例中混合文库的ESR结果图。

图22为本发明实施例中所有待检8个标签接头构建文库ESR拆分结果图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中，很多细节描述是为了使得本发明能被更好的理解。然而，本领域技术人员可以毫不费力的认识到，其中部分特征在不同情况下是可以省略的，或者可以由其他材料、方法所替代。

另外，说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时，方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此，说明书和附图中的各种顺序只是为了清楚描述某一个实施例，并不意味着是必须的顺序，除非另有说明其中某个顺序是必须遵循的。

本文中为部件所编序号本身，例如“第一”、“第二”等，仅用于区分所描述的对象，不具有任何顺序或技术含义。

定义

标签序列寡核苷酸(barcode oligo)，本文中也称为“标签序列”(barcode)，或“寡核苷酸”(oligo)，是指文库(例如测序文库)构建中使用的具有区分不同样本来源和/或分子来源功能的核苷酸序列，包括标签接头和标签引物等。这些标签序列通过人工合成获得。

标签接头，含有标签的接头，指文库(例如测序文库)构建中使用的具有区分不同样本来源和/或分子来源功能的接头序列，包括单标签接头和双标签接头，其中双标签接头由两个单个的标签接头组成。

标签引物，含有标签的引物，指文库(例如测序文库)构建中使用的具有区分不同样本来源和/或分子来源功能的引物序列，包括单标签引物和双标签引物，其中双标签引物由两个单个的标签引物组成。

标签文库，是指通过文库构建方法得到的包含本发明的标签序列的文库，特别是测序文库。标签文库包括单标签文库和双标签文库。其中，单标签文库包含单标签接头或单标签引物。双标签文库包含双标签接头或双标签引物。

模板序列，是指本发明中用于与标签序列进行匹配建库的序列，不同的模板序列在序列上彼此不同。在优选实施例中，模板序列是从基因组DNA中扩增得到的不同基因序列。这样的模板序列，由于模板序列之间每个位置的序列都不一样，无需担心由于多次PCR扩增带来的序列错误而无法区分不同模板的情况。

测序，是指测定核酸序列的方法，本发明中尤其是指测定标签文库序列的方法，包括单端测序和双端测序，本发明优选双端测序，特别是PE30+10测序，即包括两端30bp测序长度和10bp标签序列长度的测序策略。

本发明可在一个实验中同时完成标签序列寡核苷酸(barcode oligo)合成污染率质控及与测序质量相关的寡核苷酸碱基合成质量的间接质控，为标签序列寡核苷酸的质检提供新方法。本发明的检测方法不仅适用于单标签序列寡核苷酸，也适合于双标签序列寡核苷酸。

如图5所示，本发明一个实施例中，以从人或其他任一物种基因组DNA中扩增N(N＝4X，X≥1)个(如96个)固定碱基个数(包括50-1000bp之间的任一片段大小，优选测序仪测序质量相对较佳的片段大小，优选180bp)的基因序列，该基因序列需要满足其5’和3’末端与测序读长相同的碱基序列范围内(如5’和3’端20bp至200bp范围，优选30bp内)A/T/C/G任意一种碱基占比至少不低于一个设定值，这样可保证A/T/C/G碱基信号平衡，该设定值例如可以是10％至30％范围内的某一百分值，例如15％等，以保证标签序列测序(如PE30+10)的插入片段碱基平衡，即保证测序质量不受模板碱基不平衡的影响。用PCR切胶回收得到的PCR纯化产物做为种子PCR模板，进行扩增后再扩增(PCR on PCR)来得到大量的测试模板DNA。

当有N个标签序列寡核苷酸待检时，将测试模板DNA均分成N组，然后再将分组之后的模板DNA分别混合之后，与待测标签序列寡核苷酸进行匹配建库。例如，当有8个标签接头需要用制备好的96个模板DNA进行质检时，则将1-96个模板DNA分成8组，1-12号模板DNA等质量比例混合之后与标签序列1(Barcode1)进行匹配建库，13-24号模板DNA等质量比例混合之后与标签序列2(Barcode2)进行匹配建库，以此类推到85-96号模板DNA等质量比例混合之后与标签序列8(Barcode8)进行匹配建库。通过PE30+10测序来分辨与模板DNA匹配的标签序列的读长(reads)数，从而计算不匹配的其他标签序列的污染率，同时通过二链测序质量，如DNB测序中二链ESR(Effective Spot Rate，有效测序位点比率)提升情况，来间接检测标签序列寡核苷酸与二链引物杂交序列的碱基合成准确性。又如，当有96个标签接头需要用制备好的96个模板DNA片段进行质检时，则按照1个DNA模板对应1个标签接头进行匹配建库，通过PE30+10测序来进行标签序列污染率和标签序列寡核苷酸合成准确性间接检测。标签序列寡核苷酸可以是单标签建库的寡核苷酸，也可以是双标签建库的寡核苷酸。需要说明的是，虽然在待检的标签序列少于测试模板DNA(例如96个)的情况下，理论上可以仅采用部分测试模板DNA，然而，考虑到需要保证模板序列在选定的测序策略(例如PE30测序策略)下每个测序位置的碱基平衡，采用全部测试模板DNA(例如96个)有利于保证这一点。

当标签序列寡核苷酸是单标签建库的寡核苷酸，即单标签接头或单标签引物时，其质检方法如图6-9所示。如图6所示，当有N(N＝4X，X≥1)个单标签接头(如标签1至标签N接头)需要用制备好的N个模板DNA片段(如模板DNA A至模板DNA N，或基因A片段至基因N片段)进行质检时，则按照DNA和标签接头一一对应的方式进行接头连接，再用通用引物进行PCR扩增得到用于上机的单标签文库。或者，如图7所示，当有N(N＝4X，X≥1)个单标签引物(如标签1引物至标签N引物)需要用制备好的N个模板DNA片段(如模板DNA A至模板DNA N，或基因A片段至基因N片段)进行质检时，则按照DNA模板与通用接头连接之后得到DNA连接产物与标签引物一一对应的方式进行PCR扩增得到用于上机的单标签文库。

如图8所示，每个文库等比例混合之后，通过PE30+10测序来获得每个模板DNA(如基因A片段至基因N片段)的测序读长对应到不同标签(如标签1至标签N)的读长数，如图9中4995，4，X，1，0，4998，Y，2，2，8，Z，4990等数值。根据读长个数按照标签污染率公式，可计算出每个标签接头/引物中包含其他标签接头/引物的污染率，如图9中标签1接头的污染率为(4+X+1)/(4+X+1+4995)*100％，标签2接头的污染率为(0+Y+2)/(0+Y+2+4998)*100％，标签N接头的污染率为(2+8+Z)/(2+8+Z+4990)*100％。同时，通过下机报告，可获得二链(read2)的测序质量评估结果(如图9中ESR结果)，通过评估结果来间接判断混合单标签文库与二链测序相关接头的5’端碱基合成质量。进一步通过下机数据的拆分分析，可获得每个单标签的测序质量评估结果(图中未示出)。

当标签序列寡核苷酸是双标签建库的寡核苷酸，即标签接头+标签引物、双标签引物或双标签接头时，其质检方法如图10-14所示。如图10所示，当有N(N＝4X，X≥1)个标签接头(如标签1至标签N接头)和N个标签引物(如标签1至标签N引物)需要用制备好的N个模板DNA片段(如模板DNA A至模板DNA N，或基因A片段至基因N片段)进行质检时，则按照DNA和标签接头一一对应的方式进行接头连接，再用标签引物一一对应进行PCR得到用于上机的双标签文库。如图11所示，当有N(N＝4X，X≥1)个标签引物F(如标签1至标签N引物F)和N个标签引物R(如标签1至标签N引物R)需要用制备好的N个模板DNA片段(如图中模板DNA A至模板DNA N，或基因A片段至基因N片段)进行质检时，则按照DNA模板与通用接头连接之后得到DNA连接产物与双标签引物一一对应的方式进行PCR扩增得到用于上机的双标签文库。如图12所示，当有N(N＝4X，X≥1)个标签接头顶链(top)和N个标签接头底链(bottom)(如标签1+标签1至标签N+标签N接头)需要用制备好的N个模板DNA片段(如图中模板DNA A至模板DNA N，或基因A片段至基因N片段)进行质检时，则按照DNA模板与双标签接头一一对应连接之后得到DNA连接产物与通用引物PCR扩增得到用于上机的双标签文库。

如图13所示，每个文库等比例混合之后，通过PE30+10测序来获得每个模板DNA(如图中基因A片段至基因N片段)的测序读长对应到不同标签接头或标签引物F或标签接头顶链(如标签1至标签N)的读长数(如图14中4995，4，X，1，0，4998，Y，2，2，8，Z，4990)和不同标签引物或标签引物R或标签接头底链的读长数(如图14中4990，10，X，0，3，4995，Y，2，3，12，Z，4985)。通过读长数按照标签污染率公式可计算出每个标签接头或标签引物F或标签接头顶链中包含其他标签接头或标签引物F或标签接头顶链的污染率，如图14中第一个表格中标签1接头或标签1引物F或标签1接头顶链的污染率为(4+X+1)/(4+X+1+4995)*100％，标签2的污染率为(0+Y+2)/(0+Y+2+4998)*100％，标签N的污染率为(2+8+Z)/(2+8+Z+4990)*100％，如图14中第二个表格中标签1引物或标签1引物R或标签1接头底链的污染率为(10+X+0)/(10+X+0+4990)*100％，标签2引物或标签2引物R或标签2接头底链的污染率为(3+Y+2)/(3+Y+2+4995)*100％，标签N引物或标签N引物R或标签N接头底链的污染率为(3+12+Z)/(3+12+Z+4985)*100％。同时，通过下机报告，可获得二链(read2)的测序质量评估结果(如图中ESR结果)，通过评估结果来间接判断混合双标签文库与二链测序相关接头的5’端碱基合成质量。进一步通过下机数据的拆分分析，可获得每个单标签的测序质量评估结果(图中未示出)。

本发明的特点包括：(1)模板DNA的设计需遵循碱基平衡的原则，以保证测序质量不受模板DNA因碱基不平衡而产生影响。(2)模板DNA一旦制备成功，即可进行多次的扩增后再扩增(PCR on PCR)，节省模板DNA制备成本。由于模板DNA之间每个位置的序列都不一样，不用担心由于多次PCR扩增带来的序列错误而无法区分不同模板的情况，PCR带来的少量错误可以通过适当容错来解决。而现有技术由于只有10bp序列不一样，不宜进行扩增后再扩增(PCR on PCR)的模板制备。(3)若制备的模板DNA有X个，则可检测标签寡核苷酸(标签oligo)待检个数在4-X之间的标签寡核苷酸，实验安排不受待检标签寡核苷酸个数的影响。(4)创新性地发明了通过检测二链测序质量来间接检测标签接头或与二链测序相关接头的5’端碱基合成质量的方法。(5)可通过一个质控系统实现标签污染率和与测序引物相关的寡核苷酸合成质量的同时检测，节省质控的人力和成本。(6)本发明的方法可满足各种类型标签文库构建的标签寡核苷酸质检，灵活方便。

本发明中，通过检测二链测序质量来间接检测与二链测序引物杂交寡核苷酸的合成质量的方法，是通过一系列测试调查之后产生的。首先，通过测通ESR二链不提升(质量差)和提升(质量好)的文库的接头区域，发现ESR二链不提升的接头序列碱基完全正确的比率低于ESR二链提升的，从而推测接头合成质量或建库质量影响了接头序列的正确性从而影响二链的测序质量。如图15所示，本发明的一个实施例中，ESR二链不提升和ESR二链提升的主带为160bp的文库SE200测序之后得到的接头序列统计结果显示，图中示出接头序列(adapterSeq)主带为160bp的文库SE200测序之后得到的接头序列，数量(number)是每条序列对应的读长数，百分比(percent％)是每条序列占总序列的占比百分值。第一行序列是正确的接头序列，其他行序列是含有错误碱基(图中框中的碱基)的接头序列，可见ESR二链不提升文库的正确接头序列的占比低于ESR二链提升文库的正确接头序列的占比。

本发明中，进而又通过一系列的对比调查测试，发现ESR二链不提升(质量差)的主要原因是接头合成质量的影响，如图16所示，上图中对比了厂家A和厂家B两个不同厂家的单标签97至单标签104混合文库的ESR结果，可见厂家A单标签97-104接头混合文库的二链ESR有明显提升(图中厂家A 97～104曲线)，而厂家B单标签97-104接头混合文库的二链ESR没有明显提升(图中厂家B 97～104曲线)。下图中对比了不同批次(第一批、第二批、第三批)采购的厂家B的单标签49-56接头混合文库的ESR结果，可见不同批次的单标签49-56接头混合文库的二链ESR有1批有明显提升，有2批没有明显提升。因此，确立了通过检测二链ESR是否提升来判断与二链测序引物杂交的接头序列5’端碱基合成的质量好坏。

以下通过实施例详细说明本发明的技术方案，应当理解，实施例仅是示例性的，不能理解为对本发明保护范围的限制。

实施例1：检测DNA纳米球(DNB)测序平台8个单标签接头的标签污染率和接头合成质量

1. 96个180bp模板DNA制备

1.1设计96套特异性扩增人基因组上涉及23对染色体的180bp片段，分别来自于96个基因，引物如SEQ ID NO：1～192所示，其中每两条序列组成扩增一个基因的引物对，例如，SEQ ID NO：1～2是扩增第1个基因的引物对，SEQ ID NO：3～4是扩增第2个基因的引物对，以此类推，SEQ ID NO：191～192是扩增第96个基因的引物对。扩增产物序列如SEQ IDNO：193～288所示，其中每条序列表示一个基因的扩增产物，其中SEQ ID NO：193～240表示1-48号基因的扩增产物序列，SEQ ID NO：241～288表示49-96号基因的扩增产物序列。

1.2利用人源NA12878 DNA作为模板，扩增96个180bp特异性产物。其中，扩增体系及程序如下表1和表2所示。

表1扩增体系

表2扩增程序

1.3利用琼脂糖凝胶电泳鉴定扩增产物片段正确性及特异性：

1.3.1配制2.5％的TAE琼脂糖胶：胶的大小取决于需要检查的样品数量，通常每100mL1×TAE缓冲液中加入2.5g的琼脂糖，加热煮沸至胶粉完全溶解；在温水浴中冷却2min后，加入2μL GelStain(全式金)，轻轻混匀，倒入胶板里，放入宽孔胶梳后，常温放置20-30min待胶凝固便可以使用。

1.3.2取10μL扩增后的DNA到点样板里，加入3μL的6×上样缓冲液，吹打混匀，全部点到胶孔里。

1.3.3电泳条件：150V，30min。

1.3.4电泳完成后拍照并存储照片，部分琼脂糖凝胶电泳鉴定扩增产物结果如图17所示。

1.4 180bp特异性产物切胶纯化回收

1.4.1将配制回收胶用的胶板、胶板架、梳子及跑回收胶用的电泳槽用清水洗涤干净，再用纯水润洗2-3次，晾干待用。

1.4.2配制2.5％的TAE琼脂糖胶：胶的大小取决于需要检查的样品数量，通常每100mL1×TAE缓冲液中加入2.5g的琼脂糖(BIO-RAD Megabase Agrose)，加热煮沸至胶粉完全溶解，溶液中不含有任何固体不溶物；在温水浴中冷却2min后，不加任何染料，倒入胶板里，放入宽孔胶梳，常温放置20－30min待胶凝固便可以使用，注意琼脂糖溶液中不要有气泡。

1.4.3取上一步扩增的25-30μL DNA产物到点样板里，加入6μL的6×溴酚黄，吹打混匀，全部点到胶孔里。

1.4.4上样2μL 50bp ladder(Tiangen和NEB)，点样孔为凝胶外侧的两个孔，远离回收样品点样孔，避免交叉污染。

1.4.5电泳条件：100V，2h-2.5h，溴酚黄跑到胶底端即可。

1.4.6电泳结束，将琼脂糖胶放入EB染料的TAE中染色30min。

1.4.7准备切胶用品：UV防护眼镜、头套、鞋套、手套、切胶刀片、承装回收胶EP管和EP管架。

1.4.8取一块干净的保鲜膜或PE手套，将染好的凝胶放在暗读器(Dark Reader)上切胶，在对应分子量180bp的位置用刀片切下目标条带，注意四个面，每切一个面换一个刀片，目标条带为180bp，所在位置为150-200bp之间。

1.4.9将切下的胶块放入干净的EP管中，称重并计算出所切胶的重量，做好标记。

1.4.10用QIAquick Gel Extraction kit进行胶纯化回收。

1.4.11取1μL纯化后产物用Qubit HS定量检测，记录每个样品的浓度。

1.5 180bp产物再扩增纯化

1.5.1取5ng的胶回收后产物进行再扩增纯化，反应体系及反应条件如下表3和表4所示：

表3扩增体系

表4扩增程序

1.5.2取5μL扩增产物跑琼脂糖凝胶检测，部分琼脂糖凝胶电泳鉴定扩增产物结果如图18所示。

1.5.3提前至少30分钟将AmpureXP磁珠从冰箱中取出，室温平衡，充分混匀待用。

1.5.4配制75％乙醇，可保存3天。

1.5.5用KingFisher进行纯化，每管样品加入90μL AmpureXP磁珠。

1.5.6纯化后用30μL TE重悬磁珠，准备进行下一步反应或保存于-20℃。

1.5.7取1μL纯化后产物用Qubit HS定量检测，记录每个样品的浓度，由于每套引物的扩增效率不同，若出现产物产量不足建库需求，重复步骤3扩增足量产物，每个产物浓度不小于1.67ng/μL，从而产物可以多次使用。所有96个产物中，产量相对较低的分别为#3、6、11、13、14、15、88和97，扩增是循环数可增加到22。

2.标签接头制备及接头退火操作

2.1寡核苷酸合成

合成如下表5所示的寡核苷酸序列，合成过程中避免寡核苷酸之间互相污染。

表5

2.2寡核苷酸溶解

寡核苷酸合成后，进行如下溶解操作：

2.2.1打开超净工作台电源，打开紫外灯，进行工作台、移液器、吸头、TE等待用物品的灭菌。

2.2.2核对：核对寡核苷酸合成单上的碱基序列、管子标签上的名称与订购的是否一致。

2.2.3离心：4℃，12000rpm，离心10min；注意保证寡核苷酸粉末聚集在管底部，离心后轻拿轻放，防止粉末飘起。

2.2.4关闭超净工作台的紫外灯，适当通风，在超净工作台里进行寡核苷酸的溶解：

a)关闭风机，小心开启管盖，注意不要让粉末飘出！打开一管寡核苷酸，根据管壁上的nmol数，加入(nmol数*10)μL的TE溶液，溶解粉末，成为终浓度为100nmol/μL(即100μM)的母液，盖紧管盖。

b)打开风机，通风约10秒后，再溶解下一管寡核苷酸。溶解每一管寡核苷酸之前，都需通风10秒左右，再溶解下一管。

c)溶解后，充分震荡混匀，短暂离心后室温放置1小时。

d)管盖标记清楚母液浓度100μM。

e)-20℃保存母液。

2.3退火

2.3.1打开超净工作台电源，打开紫外灯，进行工作台、移液器、吸头、TE等待用物品的灭菌。

2.3.2从-20℃取出寡核苷酸母液后，待完全融化后，震荡混匀，快速离心。关闭超净工作台的紫外灯，通风，在超净工作台里，按照下表6，取等体积的顶链和底链的母液，2×接头缓冲液(表7)进行混合，室温放置1小时，管盖标记清楚浓度25μM。

表6

组分	用量
		顶链(100μM)	25μL
底链(100μM)	25μL
		接头缓冲液(2×)	50μL
总量	100μL

表7 2×接头缓冲液配方

试剂名称	体积
		5M NaCl	4μL
1M Tris HCl	4μL
		2mM EDTA	20μL
水	172μL
		总量	200μL

2.3.3稀释至10μM工作液：100μL 25μM的接头溶液加入150μL TE缓冲液，充分震荡混匀，快速离心。

2.3.4 -20℃保存工作液。

3.标签接头质量及污染率质检建库

3.1为检测标签501-508 8个标签接头，将96个180bp特异性产物按照1-96编号，均分成8组(编号分别为1-12，13-24，25-36，37-48，49-60，61-72，73-84，85-96)，每组等质量混合之后，取50ng依次与标签501-508进行匹配建库。

3.2加A尾(A-tailing)：

3.2.1提前将保持于-20℃的试剂取出并于冰上融解，缓冲液和ATP等试剂需要振荡充分混匀，低速离心。

3.2.2提前5min左右准备末端修复混合液，如果反应数较少，可将dATP稀释至10mM，加1μL使用，反应混合物配制完成后置于常温，如果需要配制多个反应，照15％损耗进行配制，配制反应体系如下表8：

表8

组分	用量
		水	23.9μL
10×PNK buffer	4μL
		dATP(100mM)	0.1μL
PNK(10U/μL)	1μL
		rTaq(5U/μL)	1μL
总量	30μL

3.2.3在上一步骤10μL(体积不足用TE补充)180bp特异性产物中加入30μL配制好的末端修复混合液，混匀，离心。

3.2.4将产物置于PCR仪中，反应条件如下表9：

表9

温度	时间
		37℃	30min
65℃	15min
		4℃	保持
热盖105℃

3.2.5反应后产物可进行下一步反应或保存于-20℃冰箱。

3.3接头连接：

3.3.1将上一步产物40μL补水至50μL，与下面反应体系混匀，离心。

3.3.2配制反应体系如下表10：

表10

3.3.3将反应样品置入PCR仪中反应，反应条件如下表11：

表11

温度	时间
		23℃	20min
4℃	保持
		热盖105℃

3.3.4纯化：

a)反应结束后，向80μL连接产物中加入40μL AmpureXP磁珠，振荡混匀，室温静置10min；

b)瞬时离心后置于磁力架，静置至液体澄清，小心吸弃上清；

c)向管中加入150μL 75％乙醇，静置30s吸弃上清，重复1次，用小量程的移液器尽可能弃掉残留的乙醇，室温晾干；

d)用23μL TE重悬磁珠，震荡混匀后室温结合5min，之后置于磁力架上至液体澄清，小心吸取23μL上清至PCR管中，准备进行下一步反应或保存于-20℃。

3.4PCR

3.4.1配制反应体系如下表12：

表12

组分	用量
		Kapa 2×HotStart ReadyMix	25μL
AD153-PCR2-1(20μM)	2μL
		AD153-PCR2-2(20μM)	2μL
总量	29μL

3.4.2将29μL反应体系加入上步骤21μL连接产物中，混匀。

3.4.3将反应样品置入PCR仪中反应，反应条件如下表13：

表13

3.4.4反应结束后，向50μL PCR产物中加入50μL Ampure XP磁珠进行纯化，32μLTE溶液进行回溶。

3.5PCR后的检测

3.5.1定量：取1μL纯化后的产物用Qubit HS定量检测，记录每个样品的浓度。

3.5.2琼脂糖电泳检测：

质控标准：主带在250-300bp之间。如图19所示，主带上方会有一些模板自连产物，实验验证表明其不会对结果产生影响，环化消化后自连产物便会消失。

3.6热变性单链分离

3.6.1根据96个PCR产物的浓度定量，每个等质量(每个取1.7ng)混合至160ng，用TE溶液补至48μL，加入5μL 10μM介导序列(splint oligo)。

3.6.2将样品置于PCR仪反应，程序如下表14：

表14

温度	时间
		95℃	3min
4℃	10min
		4℃	维持
热盖105℃

3.7环化

3.7.1提前5分钟准备反应混合液，配制如下表15所示：

表15

组分	用量
		10×TA buffer	6μL
ATP(100mM)	0.6μL
		T4 DNA连接酶(600U/μL)	0.2μL
总量	6.8μL

3.7.2在样品中加入环化反应混合液6.8μL，混匀。

3.7.3置于PCR仪上反应，其程序如下表16：

表16

温度	时间
		37℃	30min
4℃	保持
		热盖105℃

3.8酶切消化

3.8.1提前5分钟准备反应混合液，Exo III酶先用储存缓冲液稀释10倍，配制如下表17：

表17

组分	用量
		水	1μL
10×TA buffer	0.4μL
		Exo I(20U/μL)	2μL
Exo III(10U/μL，10×稀释)	0.7μL
		总量	4.1μL

3.8.2置于PCR仪上反应，37℃反应30min。

3.8.3反应完成后，离心，向每个样品中加入3μL 0.5M EDTA，混匀，离心，如需保存可将反应终止样品置于-20℃冰箱。

3.8.4纯化：用168μL AmpureXP磁珠进行纯化，25μL TE溶液进行回溶；准备进行下一步反应或保存至-20℃冰箱。

3.8.5单链环定量(ssCircle Quant)

将线性消化的单链环产物用Qubit单链分析试剂盒(Qubit ssDNA Assay Kit)定量。缓冲液与染料比例为199:1混匀后涡旋，并离心混合备用，取两份190μL稀释后染料工作液分别加入10μL的两种标准品涡旋并离心混合备用，取199μL稀释后染料工作液加入1μL样品，涡旋后并离心进行Qubit仪器定量。

跑6％ TBU-PAGE胶检测线性DNA是否消化干净。若跑胶结果如图20中的泳道1-泳道3，则表示线性消化完全，如图20中泳道4，如果还有线性DNA残留，建议重新环化。

上述实施例中所用的试剂及物料如下表18所示：

表18

4.标签接头质量及污染率质检测序

将混合的文库送测BGISEQ-500平台进行PE30+10策略的测序。

5.信息分析

用ESR(有效测序位点比率)和接头污染分析流程进行结果分析。

6.数据结果

6.1ESR：

如图21为混合文库的ESR结果，可见这批501-508标签接头的总体5’端合成质量良好，二链有提升。

如图22为所有待检8个标签接头构建文库取用6个FOV的数据时，ESR拆分结果。

6.2接头污染率：

分别统计了8组模板DNA(1-12，13-24，25-36，37-48，49-60，61-72，73-84，85-96)分别测到标签501、502、503、504、505、506、507、508的读长(reads)数，然后根据匹配对应关系，计算标签匹配率和标签污染率，结果如下表19所示。其中标签504的污染率高于1％，判定为不合格。

表19

标签编号	标签匹配率	标签污染率
			501	99.97％	0.03％
502	99.95％	0.05％
			503	99.96％	0.04％
504	98.70％	1.30％
			505	99.96％	0.04％
506	99.96％	0.04％
			507	99.86％	0.14％
508	99.97％	0.03％

以上应用了具体个例对本发明进行阐述，只是用于帮助理解本发明，并不用以限制本发明。对于本发明所属技术领域的技术人员，依据本发明的思想，还可以做出若干简单推演、变形或替换。

SEQUENCE LISTING

<110> 深圳华大生命科学研究院

<120> 标签序列的检测方法

<130> 18P27119

<160> 297

<170> PatentIn version 3.3

<210> 1

<211> 21

<212> DNA

<213> 人工序列

<400> 1

gccacaaaat acccaccaac c 21

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<400> 2

agggcgatgt cattcgtgtt 20

<210> 3

<211> 20

<212> DNA

<213> 人工序列

<400> 3

ctatttgcgg tcctcctgct 20

<210> 4

<211> 21

<212> DNA

<213> 人工序列

<400> 4

ccctcagtcg ttctcatctg g 21

<210> 5

<211> 21

<212> DNA

<213> 人工序列

<400> 5

acactgagaa agaagcggtg a 21

<210> 6

<211> 20

<212> DNA

<213> 人工序列

<400> 6

attgagttgg cctctgtccc 20

<210> 7

<211> 24

<212> DNA

<213> 人工序列

<400> 7

ccttcctcgg gttcctatat cttc 24

<210> 8

<211> 23

<212> DNA

<213> 人工序列

<400> 8

gcacccttgg gagtcatgat ttg 23

<210> 9

<211> 20

<212> DNA

<213> 人工序列

<400> 9

cctaaaggca acaacggcag 20

<210> 10

<211> 20

<212> DNA

<213> 人工序列

<400> 10

acgtgattga tgtcgggtgg 20

<210> 11

<211> 20

<212> DNA

<213> 人工序列

<400> 11

atagcgttcc cctagcctct 20

<210> 12

<211> 20

<212> DNA

<213> 人工序列

<400> 12

ggagactgtg gagactcacg 20

<210> 13

<211> 20

<212> DNA

<213> 人工序列

<400> 13

aggaactgct cttggcactc 20

<210> 14

<211> 20

<212> DNA

<213> 人工序列

<400> 14

tgaacattct gggcggtacg 20

<210> 15

<211> 20

<212> DNA

<213> 人工序列

<400> 15

gggctggcat tagggagttt 20

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<400> 16

gagatgagga gtccaagcgg 20

<210> 17

<211> 20

<212> DNA

<213> 人工序列

<400> 17

gggctacccg attggtgaat 20

<210> 18

<211> 20

<212> DNA

<213> 人工序列

<400> 18

ctagacacga ccctgacccc 20

<210> 19

<211> 20

<212> DNA

<213> 人工序列

<400> 19

ttggtgaaaa gggcccatgc 20

<210> 20

<211> 24

<212> DNA

<213> 人工序列

<400> 20

caaatgtcaa ccaagcattg aagg 24

<210> 21

<211> 20

<212> DNA

<213> 人工序列

<400> 21

ggaagtgacg gaaacggaga 20

<210> 22

<211> 19

<212> DNA

<213> 人工序列

<400> 22

tgtgattggc tgtcggctg 19

<210> 23

<211> 21

<212> DNA

<213> 人工序列

<400> 23

agatcgctgc tctttagctg g 21

<210> 24

<211> 20

<212> DNA

<213> 人工序列

<400> 24

tttcgccaag gggctcttac 20

<210> 25

<211> 20

<212> DNA

<213> 人工序列

<400> 25

cattgagcag cgcattaccc 20

<210> 26

<211> 20

<212> DNA

<213> 人工序列

<400> 26

aaaaggcgca tcagaaccct 20

<210> 27

<211> 20

<212> DNA

<213> 人工序列

<400> 27

gcaccgggaa gacagtatcc 20

<210> 28

<211> 20

<212> DNA

<213> 人工序列

<400> 28

tctggcacag ttcttgagca 20

<210> 29

<211> 20

<212> DNA

<213> 人工序列

<400> 29

cctaagtcag ccttcgctgg 20

<210> 30

<211> 20

<212> DNA

<213> 人工序列

<400> 30

aggggaacga ggcacaaatc 20

<210> 31

<211> 20

<212> DNA

<213> 人工序列

<400> 31

cagttcccgt caatccctcc 20

<210> 32

<211> 21

<212> DNA

<213> 人工序列

<400> 32

cgtgtcctaa tctcgtgagc a 21

<210> 33

<211> 20

<212> DNA

<213> 人工序列

<400> 33

tggagatttg ggtcacacgg 20

<210> 34

<211> 21

<212> DNA

<213> 人工序列

<400> 34

cagtcggcct aagaaggtag g 21

<210> 35

<211> 19

<212> DNA

<213> 人工序列

<400> 35

gggggagctg gttcagaat 19

<210> 36

<211> 20

<212> DNA

<213> 人工序列

<400> 36

ggacctgggc ggttcaataa 20

<210> 37

<211> 20

<212> DNA

<213> 人工序列

<400> 37

attccggatg acttggctgt 20

<210> 38

<211> 20

<212> DNA

<213> 人工序列

<400> 38

gtgatggttc gtctgtcgcc 20

<210> 39

<211> 20

<212> DNA

<213> 人工序列

<400> 39

cctgtgacat cgtagcccag 20

<210> 40

<211> 20

<212> DNA

<213> 人工序列

<400> 40

cagtgcctgt gtagacgtgg 20

<210> 41

<211> 20

<212> DNA

<213> 人工序列

<400> 41

aaggctgaac tccctgcaaa 20

<210> 42

<211> 20

<212> DNA

<213> 人工序列

<400> 42

gtctgattcg gtggctaggt 20

<210> 43

<211> 20

<212> DNA

<213> 人工序列

<400> 43

ttgtggctga aacccttcgt 20

<210> 44

<211> 20

<212> DNA

<213> 人工序列

<400> 44

gtttggccct aatcgctccc 20

<210> 45

<211> 20

<212> DNA

<213> 人工序列

<400> 45

tggtgcaggc taaaccgaag 20

<210> 46

<211> 20

<212> DNA

<213> 人工序列

<400> 46

ttccgaacct tgggaagcag 20

<210> 47

<211> 18

<212> DNA

<213> 人工序列

<400> 47

gggggaagag tcctgcac 18

<210> 48

<211> 21

<212> DNA

<213> 人工序列

<400> 48

ccctcaacac ttcctcgaac a 21

<210> 49

<211> 20

<212> DNA

<213> 人工序列

<400> 49

atgaggagtt gggacacgga 20

<210> 50

<211> 20

<212> DNA

<213> 人工序列

<400> 50

ggcggaactc acgatcatct 20

<210> 51

<211> 20

<212> DNA

<213> 人工序列

<400> 51

ggcggtgagt gaggaaaacc 20

<210> 52

<211> 20

<212> DNA

<213> 人工序列

<400> 52

taatacgtgc gattccgggg 20

<210> 53

<211> 22

<212> DNA

<213> 人工序列

<400> 53

agtgacgttc taaatccagc cc 22

<210> 54

<211> 20

<212> DNA

<213> 人工序列

<400> 54

tgagggtttg ttttccccga 20

<210> 55

<211> 21

<212> DNA

<213> 人工序列

<400> 55

gaacgcctct ccagttaaca c 21

<210> 56

<211> 20

<212> DNA

<213> 人工序列

<400> 56

tctgacacct ttcgcacaca 20

<210> 57

<211> 22

<212> DNA

<213> 人工序列

<400> 57

agcaatctct taggtaggca gc 22

<210> 58

<211> 21

<212> DNA

<213> 人工序列

<400> 58

actaccacgt gtgtcatacc c 21

<210> 59

<211> 20

<212> DNA

<213> 人工序列

<400> 59

ttgggcactg gcctattgtg 20

<210> 60

<211> 20

<212> DNA

<213> 人工序列

<400> 60

ccaaaacgcc tacccaggat 20

<210> 61

<211> 21

<212> DNA

<213> 人工序列

<400> 61

aggggatgta gacagttgag c 21

<210> 62

<211> 20

<212> DNA

<213> 人工序列

<400> 62

ccacccgcta attatgggca 20

<210> 63

<211> 20

<212> DNA

<213> 人工序列

<400> 63

actttatgcg agtgtccgcc 20

<210> 64

<211> 20

<212> DNA

<213> 人工序列

<400> 64

gatccgaaac tcggggaacc 20

<210> 65

<211> 20

<212> DNA

<213> 人工序列

<400> 65

taaaactgcg tccgtgcaga 20

<210> 66

<211> 21

<212> DNA

<213> 人工序列

<400> 66

acttcaacgc cgacatacac a 21

<210> 67

<211> 20

<212> DNA

<213> 人工序列

<400> 67

gagagagcgt gtgtgcttgt 20

<210> 68

<211> 20

<212> DNA

<213> 人工序列

<400> 68

acagaagcga aaccgagaca 20

<210> 69

<211> 20

<212> DNA

<213> 人工序列

<400> 69

ggatgaggcc agtcagtgtc 20

<210> 70

<211> 20

<212> DNA

<213> 人工序列

<400> 70

ggctgaccgt cttaccatgc 20

<210> 71

<211> 20

<212> DNA

<213> 人工序列

<400> 71

tgctattcca aacgccacct 20

<210> 72

<211> 20

<212> DNA

<213> 人工序列

<400> 72

tgctgacaag cgtaacctga 20

<210> 73

<211> 20

<212> DNA

<213> 人工序列

<400> 73

ttggccctca gtagaggaga 20

<210> 74

<211> 20

<212> DNA

<213> 人工序列

<400> 74

ccatcccttt ctgcccgtat 20

<210> 75

<211> 19

<212> DNA

<213> 人工序列

<400> 75

ttccgttggg gaagatggc 19

<210> 76

<211> 20

<212> DNA

<213> 人工序列

<400> 76

gctagatccg ccacaaaagg 20

<210> 77

<211> 21

<212> DNA

<213> 人工序列

<400> 77

ctcagaatta caccgggagg g 21

<210> 78

<211> 20

<212> DNA

<213> 人工序列

<400> 78

ggagaaccaa tcggtcgtga 20

<210> 79

<211> 20

<212> DNA

<213> 人工序列

<400> 79

ccctctgtta tcccccttgc 20

<210> 80

<211> 20

<212> DNA

<213> 人工序列

<400> 80

gcagaaaaca acgacgagcg 20

<210> 81

<211> 22

<212> DNA

<213> 人工序列

<400> 81

tgggacagta gttggtacat gc 22

<210> 82

<211> 20

<212> DNA

<213> 人工序列

<400> 82

tctcagcccc gaagtatcca 20

<210> 83

<211> 20

<212> DNA

<213> 人工序列

<400> 83

tgaaagtgtt gaagcgcgga 20

<210> 84

<211> 20

<212> DNA

<213> 人工序列

<400> 84

ggagtgggcg gaaaatgtct 20

<210> 85

<211> 23

<212> DNA

<213> 人工序列

<400> 85

ggaccatcaa caaacaacag gaa 23

<210> 86

<211> 23

<212> DNA

<213> 人工序列

<400> 86

aaacaatgca tcctcagtgg gag 23

<210> 87

<211> 20

<212> DNA

<213> 人工序列

<400> 87

tttgagtttg agcgggaggg 20

<210> 88

<211> 20

<212> DNA

<213> 人工序列

<400> 88

gcgtcaagga acaatgagcg 20

<210> 89

<211> 20

<212> DNA

<213> 人工序列

<400> 89

ataacccatg ctgcccacag 20

<210> 90

<211> 20

<212> DNA

<213> 人工序列

<400> 90

cagtcaccgc cttgcttagt 20

<210> 91

<211> 20

<212> DNA

<213> 人工序列

<400> 91

cccccagact taggacagga 20

<210> 92

<211> 20

<212> DNA

<213> 人工序列

<400> 92

cccctaccct gtatggatgc 20

<210> 93

<211> 22

<212> DNA

<213> 人工序列

<400> 93

ttggacctga gagacttgaa ac 22

<210> 94

<211> 22

<212> DNA

<213> 人工序列

<400> 94

cagtccaaac caaaagagcc aa 22

<210> 95

<211> 23

<212> DNA

<213> 人工序列

<400> 95

aagttgtgct gccttatttg taa 23

<210> 96

<211> 25

<212> DNA

<213> 人工序列

<400> 96

cctgtgtcta atactatggt ctggt 25

<210> 97

<211> 20

<212> DNA

<213> 人工序列

<400> 97

aagtcgggga gaccattcct 20

<210> 98

<211> 20

<212> DNA

<213> 人工序列

<400> 98

ggtccctgac tggggagaat 20

<210> 99

<211> 20

<212> DNA

<213> 人工序列

<400> 99

gtccacttcc cctatgcagg 20

<210> 100

<211> 20

<212> DNA

<213> 人工序列

<400> 100

tcccaagcaa agatggacgg 20

<210> 101

<211> 19

<212> DNA

<213> 人工序列

<400> 101

gacgctgcaa agaccgaag 19

<210> 102

<211> 20

<212> DNA

<213> 人工序列

<400> 102

cgtgtcgtta ttgaggggga 20

<210> 103

<211> 20

<212> DNA

<213> 人工序列

<400> 103

gagaagagcg accctcacag 20

<210> 104

<211> 20

<212> DNA

<213> 人工序列

<400> 104

tgagtggtga acccgaaacc 20

<210> 105

<211> 22

<212> DNA

<213> 人工序列

<400> 105

ggaaagacag accaacctgg aa 22

<210> 106

<211> 23

<212> DNA

<213> 人工序列

<400> 106

ttatctccaa cacccaaacc cac 23

<210> 107

<211> 20

<212> DNA

<213> 人工序列

<400> 107

ggcctcaagg gatgtctcac 20

<210> 108

<211> 20

<212> DNA

<213> 人工序列

<400> 108

tgggttagtc ccgactccag 20

<210> 109

<211> 20

<212> DNA

<213> 人工序列

<400> 109

ttgcagaagg accatccctt 20

<210> 110

<211> 20

<212> DNA

<213> 人工序列

<400> 110

tctctgttga agctgagcgg 20

<210> 111

<211> 20

<212> DNA

<213> 人工序列

<400> 111

ttgtagcgta cgacaatgcg 20

<210> 112

<211> 20

<212> DNA

<213> 人工序列

<400> 112

tcccatcaca gttgaacccc 20

<210> 113

<211> 20

<212> DNA

<213> 人工序列

<400> 113

ggtgtctggt gtgttcggat 20

<210> 114

<211> 20

<212> DNA

<213> 人工序列

<400> 114

ggcctagaaa aggaacccgt 20

<210> 115

<211> 20

<212> DNA

<213> 人工序列

<400> 115

ctaggagccc ctcgcttttc 20

<210> 116

<211> 21

<212> DNA

<213> 人工序列

<400> 116

atgcacaaag tttgcctgtg g 21

<210> 117

<211> 24

<212> DNA

<213> 人工序列

<400> 117

acaaccagct gaggagaatg aaga 24

<210> 118

<211> 22

<212> DNA

<213> 人工序列

<400> 118

cgatgggcta agagtgggtg tt 22

<210> 119

<211> 20

<212> DNA

<213> 人工序列

<400> 119

acctggagcc gttgttcgag 20

<210> 120

<211> 22

<212> DNA

<213> 人工序列

<400> 120

taccaagaag acaccaccct cc 22

<210> 121

<211> 22

<212> DNA

<213> 人工序列

<400> 121

caagttgatg accagctccc ag 22

<210> 122

<211> 24

<212> DNA

<213> 人工序列

<400> 122

tagtttaccc agtatcgcca gcac 24

<210> 123

<211> 20

<212> DNA

<213> 人工序列

<400> 123

tgcccttagc ccactacttc 20

<210> 124

<211> 20

<212> DNA

<213> 人工序列

<400> 124

ctgagcccat ttcctcggtg 20

<210> 125

<211> 24

<212> DNA

<213> 人工序列

<400> 125

tcttacccaa aatgctttca gctc 24

<210> 126

<211> 22

<212> DNA

<213> 人工序列

<400> 126

catcgggtgt ctgggaatat ct 22

<210> 127

<211> 20

<212> DNA

<213> 人工序列

<400> 127

tttcctgagt gtccccgtgt 20

<210> 128

<211> 20

<212> DNA

<213> 人工序列

<400> 128

gggtgctttt cccaacaacc 20

<210> 129

<211> 20

<212> DNA

<213> 人工序列

<400> 129

atttcgaact ccacgccctg 20

<210> 130

<211> 20

<212> DNA

<213> 人工序列

<400> 130

ggtaacttca ccccgtgtgt 20

<210> 131

<211> 22

<212> DNA

<213> 人工序列

<400> 131

gtctgggtta ctcttcgctt ct 22

<210> 132

<211> 25

<212> DNA

<213> 人工序列

<400> 132

agatgggaat taagatcctt ctgtg 25

<210> 133

<211> 20

<212> DNA

<213> 人工序列

<400> 133

ctggcctagg ggctagttac 20

<210> 134

<211> 20

<212> DNA

<213> 人工序列

<400> 134

ggccaggcca gtatgttgta 20

<210> 135

<211> 24

<212> DNA

<213> 人工序列

<400> 135

ggatggaaat gaaatcaaac cacc 24

<210> 136

<211> 23

<212> DNA

<213> 人工序列

<400> 136

gcaatgggga atatgacttg tgt 23

<210> 137

<211> 20

<212> DNA

<213> 人工序列

<400> 137

ccaccccgga agctacaaat 20

<210> 138

<211> 20

<212> DNA

<213> 人工序列

<400> 138

ccccaaaaac tggcatgctg 20

<210> 139

<211> 20

<212> DNA

<213> 人工序列

<400> 139

ggtaaaggtg gcacccagtt 20

<210> 140

<211> 20

<212> DNA

<213> 人工序列

<400> 140

tgtgatcaga ttccgccctg 20

<210> 141

<211> 20

<212> DNA

<213> 人工序列

<400> 141

tgcactcctt gttaggcacg 20

<210> 142

<211> 20

<212> DNA

<213> 人工序列

<400> 142

cctagacata gacggcgctc 20

<210> 143

<211> 20

<212> DNA

<213> 人工序列

<400> 143

cccgcaccct ttgggtttat 20

<210> 144

<211> 19

<212> DNA

<213> 人工序列

<400> 144

acgccggaca tcgaaagtt 19

<210> 145

<211> 25

<212> DNA

<213> 人工序列

<400> 145

acttattgaa tctccccctg tttct 25

<210> 146

<211> 20

<212> DNA

<213> 人工序列

<400> 146

tgcccacttg ggagaagctc 20

<210> 147

<211> 24

<212> DNA

<213> 人工序列

<400> 147

catgggattc acttttcagt agtc 24

<210> 148

<211> 25

<212> DNA

<213> 人工序列

<400> 148

taagaataga gaggaagctg agaaa 25

<210> 149

<211> 20

<212> DNA

<213> 人工序列

<400> 149

tggtgatgtt cagcaggtgg 20

<210> 150

<211> 20

<212> DNA

<213> 人工序列

<400> 150

cccacgctgc agtatgtttg 20

<210> 151

<211> 20

<212> DNA

<213> 人工序列

<400> 151

acggagcttt gcctctcaat 20

<210> 152

<211> 20

<212> DNA

<213> 人工序列

<400> 152

ctcctcccag ttccctgcta 20

<210> 153

<211> 20

<212> DNA

<213> 人工序列

<400> 153

tgcacaaaag caaacccgtc 20

<210> 154

<211> 20

<212> DNA

<213> 人工序列

<400> 154

tcctaccaga aaagccgacc 20

<210> 155

<211> 20

<212> DNA

<213> 人工序列

<400> 155

ggttacccag cgtgactcat 20

<210> 156

<211> 20

<212> DNA

<213> 人工序列

<400> 156

gcaccttaac ctgaccgctt 20

<210> 157

<211> 20

<212> DNA

<213> 人工序列

<400> 157

agttggcgtc ttggactctg 20

<210> 158

<211> 20

<212> DNA

<213> 人工序列

<400> 158

ccaaaagagg cctaggggtt 20

<210> 159

<211> 20

<212> DNA

<213> 人工序列

<400> 159

caacccccaa gtctaccagc 20

<210> 160

<211> 20

<212> DNA

<213> 人工序列

<400> 160

tcagcacttc aggccctcta 20

<210> 161

<211> 21

<212> DNA

<213> 人工序列

<400> 161

tgtgggccag ttcgttaatc t 21

<210> 162

<211> 20

<212> DNA

<213> 人工序列

<400> 162

tcccctaaac atcccctcgt 20

<210> 163

<211> 20

<212> DNA

<213> 人工序列

<400> 163

gacagctaac agcccccatt 20

<210> 164

<211> 19

<212> DNA

<213> 人工序列

<400> 164

caccagctgt gcaattcgg 19

<210> 165

<211> 20

<212> DNA

<213> 人工序列

<400> 165

ctttgccact atgggctgtc 20

<210> 166

<211> 20

<212> DNA

<213> 人工序列

<400> 166

gtcgaaggcg ggacttcatt 20

<210> 167

<211> 20

<212> DNA

<213> 人工序列

<400> 167

ttggtgaggc aatgaggctg 20

<210> 168

<211> 20

<212> DNA

<213> 人工序列

<400> 168

gagggcccct tgaagcatac 20

<210> 169

<211> 20

<212> DNA

<213> 人工序列

<400> 169

tcaccggcga aacatccatt 20

<210> 170

<211> 20

<212> DNA

<213> 人工序列

<400> 170

ctgcaactac gagggggtag 20

<210> 171

<211> 23

<212> DNA

<213> 人工序列

<400> 171

tggttgcaat tctgagagtc atc 23

<210> 172

<211> 20

<212> DNA

<213> 人工序列

<400> 172

gaggactttg agacgagagg 20

<210> 173

<211> 20

<212> DNA

<213> 人工序列

<400> 173

ctggggacac gggtctagta 20

<210> 174

<211> 20

<212> DNA

<213> 人工序列

<400> 174

tttagggaca aggttggcgt 20

<210> 175

<211> 20

<212> DNA

<213> 人工序列

<400> 175

gcgttctgca ctcgagtctt 20

<210> 176

<211> 20

<212> DNA

<213> 人工序列

<400> 176

tccttaaacg caggtccact 20

<210> 177

<211> 20

<212> DNA

<213> 人工序列

<400> 177

agggccgtca ttaagcgaac 20

<210> 178

<211> 20

<212> DNA

<213> 人工序列

<400> 178

gaggcccgtg attccgttta 20

<210> 179

<211> 20

<212> DNA

<213> 人工序列

<400> 179

ccttcaacta cagccccgac 20

<210> 180

<211> 20

<212> DNA

<213> 人工序列

<400> 180

ggggccaggt atggacacta 20

<210> 181

<211> 22

<212> DNA

<213> 人工序列

<400> 181

cctatcggtc gtatcctctg tc 22

<210> 182

<211> 23

<212> DNA

<213> 人工序列

<400> 182

ccttccctcc aatactgaga aca 23

<210> 183

<211> 21

<212> DNA

<213> 人工序列

<400> 183

caagtcaggg ttttgcgttg a 21

<210> 184

<211> 23

<212> DNA

<213> 人工序列

<400> 184

gaacaagaaa ttagccagag gga 23

<210> 185

<211> 20

<212> DNA

<213> 人工序列

<400> 185

gggcatgaat tgccagagtg 20

<210> 186

<211> 20

<212> DNA

<213> 人工序列

<400> 186

tgtttataat gcgccgcgag 20

<210> 187

<211> 20

<212> DNA

<213> 人工序列

<400> 187

aaccggcgat ttctccaaga 20

<210> 188

<211> 20

<212> DNA

<213> 人工序列

<400> 188

aaagtccgag aaggcacgtc 20

<210> 189

<211> 20

<212> DNA

<213> 人工序列

<400> 189

ggggcttagt gggcttactc 20

<210> 190

<211> 20

<212> DNA

<213> 人工序列

<400> 190

gagagcccca caggatggta 20

<210> 191

<211> 23

<212> DNA

<213> 人工序列

<400> 191

tgaggtaatg gcctttcaga cat 23

<210> 192

<211> 23

<212> DNA

<213> 人工序列

<400> 192

ttccccaaca caatttcttg ctt 23

<210> 193

<211> 180

<212> DNA

<213> 人工序列

<400> 193

gccacaaaat acccaccaac ccgtacctgt ttaagcaact cctttcgaag gcttaaagtg 60

aaggaggaat ttgttattgg cttgagaacc ctaacactga cccaaattag cccagtggct 120

tcttatgtgt gtatatgtgt gtaacaagaa ttccttttac aacacgaatg acatcgccct 180

<210> 194

<211> 180

<212> DNA

<213> 人工序列

<400> 194

ctatttgcgg tcctcctgct gggcttcttc atcttcacct tcttaagagt acctgaaact 60

cgaggccgga cgtttgacca gatctcagct gccttccacc ggacaccctc tcttttagag 120

caggaggtga aacccagcac agaacttgag tatttagggc cagatgagaa cgactgaggg 180

<210> 195

<211> 180

<212> DNA

<213> 人工序列

<400> 195

attgagttgg cctctgtccc tgaggcctgg tgtacactca ggatgagtgt gacaaggagt 60

gagacatggt cagtggctgg agatgtcttc ccaattagaa cgctcatctt tgccccaggg 120

cctcacgcaa atcctgggct cttagttcca atttggtagt caccgcttct ttctcagtgt 180

<210> 196

<211> 180

<212> DNA

<213> 人工序列

<400> 196

gcacccttgg gagtcatgat ttgaagaatc ttcgtaccac aaactggccc aacagaacca 60

cacccagaac caccagcacg ttcaggatgg gaccattgcc caagttcagg gctgccacct 120

gccgggagaa acaaggtggt cacagagagg ctagcagaag atataggaac ccgaggaagg 180

<210> 197

<211> 180

<212> DNA

<213> 人工序列

<400> 197

acgtgattga tgtcgggtgg gcgtggaatg tgctgtgcat tgcgtgggga gggcccttag 60

tgggggtgag cttggtggga aaaggagggt ctcggagggt ccagctgctg gggtggaggc 120

cacaggggcc caggagtgca gggtgggcgc ggtaaagaga ctgccgttgt tgcctttagg 180

<210> 198

<211> 180

<212> DNA

<213> 人工序列

<400> 198

atagcgttcc cctagcctct ttccccgggg agaatgtagg atacaggccc agcctcctgg 60

cctttctcca tcagggactc agttgtctgg gcccccccgt cactttatct gctagggtcc 120

cagaagtcca gggtccccag ctctgtcctc cctcaggggc cgtgagtctc cacagtctcc 180

<210> 199

<211> 180

<212> DNA

<213> 人工序列

<400> 199

aggaactgct cttggcactc tgtgcacaag ggagatactg acattctttc tgttgtgcag 60

atgagaaaac aggctcagag aaggtgagta acttaccatg gtcacacagc agcagagcta 120

ggtcagtata atccacaagt cattctctta accgctccgc cgtaccgccc agaatgttca 180

<210> 200

<211> 180

<212> DNA

<213> 人工序列

<400> 200

gagatgagga gtccaagcgg agggctcctc acccttcccc aaacatcgta cctggccagg 60

taaggggcta aggcagctgc cctttcctct ctgcacagcc ctggagccag agctcggccc 120

agatcctgga actccccagg caagcatcct ggatctctcc aaactcccta atgccagccc 180

<210> 201

<211> 180

<212> DNA

<213> 人工序列

<400> 201

gggctacccg attggtgaat ccggggccct ttagcgcggt gagtttgaaa ctgctcgcac 60

ttggcttcaa agctggctct tggaaattga gcggagagcg acgcggttgt tgtagctgcc 120

gctgcggccg ccgcggaata ataagccggg tacagtggct ggggtcaggg tcgtgtctag 180

<210> 202

<211> 180

<212> DNA

<213> 人工序列

<400> 202

ttggtgaaaa gggcccatgc gttatgaaat ttgagatcca tcactttaag tgaatgtagg 60

ccctggatac agtgggagct cagaagagca aatcagttgg tcaccttgct caacgtattt 120

tactaagggc atcagtaagg ctttctatga cctgctcctt caatgcttgg ttgacatttg 180

<210> 203

<211> 180

<212> DNA

<213> 人工序列

<400> 203

tgtgattggc tgtcggctgg aggagggcgc gggtgcaggc ggcggtgaag ggctaggcag 60

ggctttggcg gtgtgagggg aggaaaggtg gtgagctccg gaaaggctgc tagagggaaa 120

gcaggatggg tcctccgagc ccagccccag gagccgggtg tctccgtttc cgtcacttcc 180

<210> 204

<211> 180

<212> DNA

<213> 人工序列

<400> 204

tttcgccaag gggctcttac ctcggatccg ccctcggggc cacggctttc cccggagacg 60

ccgcgagccc agacgaggtg ggaggggacc gggagaaagc cccccaatct gattcgcgcc 120

cagccagtcg tccgcgagcc gcggagccgc cttctgcacc cagctaaaga gcagcgatct 180

<210> 205

<211> 180

<212> DNA

<213> 人工序列

<400> 205

aaaaggcgca tcagaaccct agatctgaga tggaaaaggc tcacagcgca ctttgcaaac 60

tgcaaagagt cgggagatgt ttgcaattgg ttgcgtgcgt ggagcgcaag gagggaacgc 120

ggcagggagg gtaggctttg gggcgaggtg ggggtggggt gggtaatgcg ctgctcaatg 180

<210> 206

<211> 180

<212> DNA

<213> 人工序列

<400> 206

tctggcacag ttcttgagca gtagatgagt ttggtcacct ccagcggata tgcctgccga 60

taacaagcgg actcagtccc tgtcccgccc cttcctttgt ctgcctttac gggttcagcg 120

catcactcac tctctggtat gccatgatca gggccaacag ggatactgtc ttcccggtgc 180

<210> 207

<211> 180

<212> DNA

<213> 人工序列

<400> 207

aggggaacga ggcacaaatc tccgccactc agccccactg agcagagact gcgagtccga 60

accctcaagt tcctcggggc tttgacccct caatggcggc ggtctaactg ctggtaaaac 120

ccccggcccc tgactgttcc accgcccgtc tcccaaacgc ccagcgaagg ctgacttagg 180

<210> 208

<211> 180

<212> DNA

<213> 人工序列

<400> 208

cagttcccgt caatccctcc ccccttacac aggatgtcca tattaggaca tctgcgtcag 60

caggtttcca cggcctttcc ctgtagccct ggggggagcc atccccgaaa cccctcatct 120

tggggggccc acgagacctc tgagacagga actgcgaaat gctcacgaga ttaggacacg 180

<210> 209

<211> 180

<212> DNA

<213> 人工序列

<400> 209

cagtcggcct aagaaggtag gccaccccag ccctcccgag gccgcgggca gggtgcggag 60

gtcagacttc cagggaaggc caaggggcgc tttaagcagt gagaaggcca cggccaggag 120

gtggacgcag aaaaaacttg caccctggct cagattcttc ccgtgtgacc caaatctcca 180

<210> 210

<211> 180

<212> DNA

<213> 人工序列

<400> 210

ggacctgggc ggttcaataa tagactaaat tctagtctag ccaaagccct acgcgacact 60

gaacctagta agagtttaac actgtaattg gagttactct gtcctagatc ccggctcaca 120

ctcacataag ggacctccct caccctatcc tacccccccg aattctgaac cagctccccc 180

<210> 211

<211> 180

<212> DNA

<213> 人工序列

<400> 211

attccggatg acttggctgt gctcccctcc tccttgcgaa gaagttgttt tctgctggtg 60

ggttgttgta acccaatcta gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt 120

gtgtgtgtct ggaagttggt gagggcggca gggagttgcg ggcgacagac gaaccatcac 180

<210> 212

<211> 180

<212> DNA

<213> 人工序列

<400> 212

cctgtgacat cgtagcccag agatgggcta gtcagcaagc agcaccccct cccctcccag 60

gggtccacaa agaacgcccc ctcccttccc agccctcaca ctagcagctg aggctgggtc 120

acccctcctg ctttcccaca atagagcttt ctatgtacag ccacgtctac acaggcactg 180

<210> 213

<211> 180

<212> DNA

<213> 人工序列

<400> 213

aaggctgaac tccctgcaaa ttttcaaaac tgcataaaag actcccaagc aaatataacc 60

agaaattaat tccatattac gctatctgga atgatttaca gatgaaattg tgatttttat 120

tatagctcaa gccaaagcat tagagtctga ttgaatatat acctagccac cgaatcagac 180

<210> 214

<211> 180

<212> DNA

<213> 人工序列

<400> 214

gtttggccct aatcgctccc cgttgtagct ctaactggct ccagtctcac tggcctacat 60

gccccgacac cggcccgatc taaaggcaga agatccggaa agtctgggat cagtgcgcgc 120

cagcccaacc ccctcactag acactagttg ccccgctcct acgaagggtt tcagccacaa 180

<210> 215

<211> 180

<212> DNA

<213> 人工序列

<400> 215

tggtgcaggc taaaccgaag ttagcctctg ctaccctctg ctgggtgagg cactggggag 60

aacagtggga ctgaatgggg cgggctttct ccctcccaca cttcccctgg aaacacccag 120

caccagcaca ttagaacatg gggagccacc ttccccagcg ctgcttccca aggttcggaa 180

<210> 216

<211> 180

<212> DNA

<213> 人工序列

<400> 216

gggggaagag tcctgcacga ctggttgccc gcctcccctc ccccagcctc tgagcggggc 60

ctgcggttgc tactgcgacg tggggcgcca ggggttgcaa ggagaaggat gcaacctgtt 120

aaaacagact tctcacttaa tctctcaagc aggttactgt gttcgaggaa gtgttgaggg 180

<210> 217

<211> 180

<212> DNA

<213> 人工序列

<400> 217

ggcggaactc acgatcatct tcttatagag accgtaatgc aggaccaggc tatgggtcaa 60

tgccaggcga tggggcttca tagggtgtcc agctcctggg ggtggggaga agagagttcg 120

tcagctctca cccctggagt tgcaaccccg cctcaaaacc tccgtgtccc aacccctcat 180

<210> 218

<211> 180

<212> DNA

<213> 人工序列

<400> 218

ggcggtgagt gaggaaaacc ttttgggcgc gggtggcagc ctgcggggct gaggtgggca 60

agcatggagg ctgcggcgga gtttcgggga gggagccgac cccgggcagg gactgaggag 120

gaaaggaggg ttgggaaact gcaacggtga gtggaggaca ccccggaatc gcacgtatta 180

<210> 219

<211> 180

<212> DNA

<213> 人工序列

<400> 219

tgagggtttg ttttccccga gctgagcgcc ttcctgaagg ctgggagaca tcctctcgtg 60

gtctgcacag agcaacagct ctggcctctg ctggctctgc cccacgtgta tagggctggg 120

atcttcctgc agttcacctt atagctccgc tgacaagggg gctggattta gaacgtcact 180

<210> 220

<211> 180

<212> DNA

<213> 人工序列

<400> 220

tctgacacct ttcgcacaca cacagaaaaa attgttcatt tccttaaagg gtgagctggc 60

taaggtacac agaaagcagg ggtggggtgg gcaaggaggc cctccctgtc ttccccccaa 120

cttttttttt cttctcaagc catgttccca gtctttcctg tgttaactgg agaggcgttc 180

<210> 221

<211> 180

<212> DNA

<213> 人工序列

<400> 221

actaccacgt gtgtcatacc ccctgcttct ccttttacta tgcagaattt tactattaaa 60

caagaagcta tttttagttg cttagcattg tttgtgactt agcctcttag actcaagagt 120

ggcccaagtc ctttcaaagg gcaaccccca tccctgaagc tgcctaccta agagattgct 180

<210> 222

<211> 180

<212> DNA

<213> 人工序列

<400> 222

ttgggcactg gcctattgtg cttcctgctc tgcacccacg tcatcccttc ttacttgtct 60

ctgctttggt gttcagaagt gcctgattct ggccaccttc attccctaga ctctgtactt 120

gatagagtca ctcctgcttg atactgctca ggacagtcag atcctgggta ggcgttttgg 180

<210> 223

<211> 180

<212> DNA

<213> 人工序列

<400> 223

aggggatgta gacagttgag cgtatattgt ggatatgttg agtttgcggt ggccgtggga 60

tgggcaagtg aaaattgata gcatacagtg ggacatatga ctagaatttg ttagcgaagt 120

taaggctggt gctgtggtac ttaagagaaa agagtgggat tgcccataat tagcgggtgg 180

<210> 224

<211> 180

<212> DNA

<213> 人工序列

<400> 224

gatccgaaac tcggggaacc ccggtgttag tctactcccc ctcccgcccc cggacaacac 60

gcacacgctt aacacaacac gcacaacata acgcgcgcgc gcgcgcacac acacactcca 120

tccgcgccga gttgcttccg ggaaaacaag cccagaaggc ggcggacact cgcataaagt 180

<210> 225

<211> 180

<212> DNA

<213> 人工序列

<400> 225

acttcaacgc cgacatacac agtccccttt acgcgtgcat acaagagcac actcctgtgc 60

gcacactctc acaggcacac tcacacgtgc acacgcgctg ccctcgcctc tccgcagggt 120

ttgccccgca cagaagccgg cgaggcggct cacggggaaa tctgcacgga cgcagtttta 180

<210> 226

<211> 180

<212> DNA

<213> 人工序列

<400> 226

acagaagcga aaccgagaca ctgaaaggag aaagactgac tggggcaaat atctcacact 60

gctggagaac agttcaagtc gatcgcatgg acccagggct ccagcgctgg gcggtgggtg 120

gatccatagg tctatcgcac aagtacacac agactcttgc acaagcacac acgctctctc 180

<210> 227

<211> 180

<212> DNA

<213> 人工序列

<400> 227

ggctgaccgt cttaccatgc aagagactaa cgttcagggt cagactaacg attctgacgt 60

tctgggctgg acacacagtt gaagtgagac accaaggaag agatggccag cccaacccct 120

cacacagcat cccttcctgg ttaatccatg gagtgacaat gacactgact ggcctcatcc 180

<210> 228

<211> 180

<212> DNA

<213> 人工序列

<400> 228

tgctgacaag cgtaacctga ctagcagaga ctagagacac cacgggaaag atggcttctg 60

gctggggtga ttacctactg tgtgctacgc attggccttg gtgctgcatg tgtgcatgca 120

acacgctcct atctgaaatg gtgagccctg tgttagacca aggtggcgtt tggaatagca 180

<210> 229

<211> 180

<212> DNA

<213> 人工序列

<400> 229

ttggccctca gtagaggaga gatcttttcc atctaacagg aggaaatgca gaaaagttgt 60

gtgcccttgc gaggaagttt ggaagttgga aggtgaaggc ctattctcct ggctttcatc 120

ttctctgtgg tttctgtttg ctcaatgaag catgagattc atacgggcag aaagggatgg 180

<210> 230

<211> 180

<212> DNA

<213> 人工序列

<400> 230

gctagatccg ccacaaaagg ataagccctt ccccaccact aacggaggaa acaagttggc 60

tcgggatccc gggacgcagg gcaccagcag tccctactct tcccgggaag gatcaatctg 120

aagtccccgg cggcaagaag agaagggtgc tcgaggccgc cgccatcttc cccaacggaa 180

<210> 231

<211> 180

<212> DNA

<213> 人工序列

<400> 231

ggagaaccaa tcggtcgtga gttcacctca gtcacttcca ctcacacatc cggtacggcg 60

ctgctaggat tcccttctgc atccgggctg tgaactcaag gagtccggtg tctgggtatc 120

tccggatcgc agcgagagcg gctagcagag gttcgcgacc cctcccggtg taattctgag 180

<210> 232

<211> 180

<212> DNA

<213> 人工序列

<400> 232

ccctctgtta tcccccttgc aaagagaagc ggtccacggg ggccacttta tcccaccccc 60

tctcctcccc tcctcctgcc cggtctaggt ctctgggtac ggaaaacggc gggccctaca 120

tctgcctcgt tttatggggg gcgcttcttc gcgctggcgg cgctcgtcgt tgttttctgc 180

<210> 233

<211> 180

<212> DNA

<213> 人工序列

<400> 233

tctcagcccc gaagtatcca ttcttaaaaa aaaagtaagt attacaagat tccaaagaaa 60

aatagctgaa aatattttca taaagccata aagtcacatg ggatgtatgt cctaagttaa 120

agaaacagat gtactctgtt tatcaaggaa tggcaaatgc atgtaccaac tactgtccca 180

<210> 234

<211> 180

<212> DNA

<213> 人工序列

<400> 234

tgaaagtgtt gaagcgcgga cccttctggg tccagggagg ggtccctgca aaactccagg 60

caggacttct caccagcagt cgtggggaac ggaggaggac atggggaggt tgtggggcct 120

caggctccgg gcaccagggg ccaacctcag gctcctaaag agacattttc cgcccactcc 180

<210> 235

<211> 180

<212> DNA

<213> 人工序列

<400> 235

aaacaatgca tcctcagtgg gaggctggta acatcagcca ggatgaccga tataaaaaca 60

cttagaacag catcttggaa ataaaaggta ccagctcccg tgaattctcc gtgtccacag 120

ctgtcttctt gaaaagtctc aaccaatgga attgcatttc ctgttgtttg ttgatggtcc 180

<210> 236

<211> 180

<212> DNA

<213> 人工序列

<400> 236

gcgtcaagga acaatgagcg ctgcacccta atacatcagt acttacagct ccaaagtgaa 60

tcaatctgtc ctgttgaaac cattaagagg acaaggatta ggaaaggtgg gtccatgaaa 120

cacgaccaga ggttttctca agacaagact cacgatgacg ccctcccgct caaactcaaa 180

<210> 237

<211> 180

<212> DNA

<213> 人工序列

<400> 237

ataacccatg ctgcccacag gcaggggagc gtggatggga ttctagttcc ttctagtcta 60

agggacccat ggatggcact gggcatgtgc cagcccccat gggttggccc gtgtttcagt 120

ggcctcttct gtgccacctc cctggggcag cctcatgagg actaagcaag gcggtgactg 180

<210> 238

<211> 180

<212> DNA

<213> 人工序列

<400> 238

cccctaccct gtatggatgc cacagaggag aagtaggtgt gaggagagta acagggaggg 60

aaggtggggc acagaatctc cctattgctg gtaacaccag ccagtgcaac ttagcagaag 120

ggcaccctcc agggaactgg gatttagtga agcagatgat tcctgtccta agtctggggg 180

<210> 239

<211> 180

<212> DNA

<213> 人工序列

<400> 239

ttggacctga gagacttgaa actgacgtcc ttttttaatt cggccattga ttgacacgga 60

gcaagttgct gagagggctt cttcgaaaca gaagagcatt gtgttctgag ggaagggagt 120

tggcagtgag tagtcaatgg atgtgctagc cgctccattt ggctcttttg gtttggactg 180

<210> 240

<211> 180

<212> DNA

<213> 人工序列

<400> 240

cctgtgtcta atactatggt ctggtacact gttcactgca ttgctttagc aacttcaaaa 60

ctcaaattct ttaacagaag attcagtttg aagaataggg ctctttgtta gtacttctgc 120

ttttaactct ttaatctcaa gctaacactt aacgaattta caaataaggc agcacaactt 180

<210> 241

<211> 180

<212> DNA

<213> 人工序列

<400> 241

ggtccctgac tggggagaat gaagacactg accaagagat gtgaagccac tcagggctgt 60

gcagggtctg aggatctcac tggggacggc ctcccagcgg ccagctatca gcacgagttg 120

gagggaaaga gccatggtgg gggtcagtca cgtggctccc aggaatggtc tccccgactt 180

<210> 242

<211> 180

<212> DNA

<213> 人工序列

<400> 242

tcccaagcaa agatggacgg gcactcccgc ttatactggg ctattttgct tacaacttct 60

ggagtcgcta ctctcggttt actaccaccg attgccctgg gtctgatgga gccagtctcg 120

taatacctgc ccagaatttt actcacacat ccgttggaca cctgcatagg ggaagtggac 180

<210> 243

<211> 180

<212> DNA

<213> 人工序列

<400> 243

gacgctgcaa agaccgaagg ggcagcccct gccctgctac cctccaggga gccaccgctc 60

tagagcccag gctcctctgg acatcatgtg acttggggga cgacttgcct ttcttctgaa 120

acacggctac agactataac tttaaaacac ggggcttagc tccccctcaa taacgacacg 180

<210> 244

<211> 180

<212> DNA

<213> 人工序列

<400> 244

gagaagagcg accctcacag tgagtgccga cccgctctct ccgcctcatt tccatttcgt 60

gggttctcgc ccgctctctc ccctccagcc tgcaccctcc tcccggatct tcactgcgac 120

cctagcgctc cgtgtggttt ctggccgcgc ggccctcggc ggtttcgggt tcaccactca 180

<210> 245

<211> 180

<212> DNA

<213> 人工序列

<400> 245

ttatctccaa cacccaaacc cactaggctg ccttgttctt gcactttcga tttggaagaa 60

atcgaactgc tcagtttatt gttaagccgt tttctcacca gcccacgaag ccaagctgag 120

cagcacccac cgcccccacc cccaagacta cccaatactt ccaggttggt ctgtctttcc 180

<210> 246

<211> 180

<212> DNA

<213> 人工序列

<400> 246

ggcctcaagg gatgtctcac atcctctgtc tatttgagac ttagaaaaat cctacaaggc 60

tggcagtgac agaactaaga tgatcatctc cagtttatag accagaacca gagctcagag 120

aggctagatg attgattacc aagtgccgga ctagcaagtg ctggagtcgg gactaaccca 180

<210> 247

<211> 180

<212> DNA

<213> 人工序列

<400> 247

tctctgttga agctgagcgg cccaccatca tcactgagta tattaactcg ggtgttggaa 60

tttcccaggt gtgtttaatc tgtatagctt tgtattttaa ggcagaactt tattctcagt 120

tattcatctc aaaatgagag ttttcagaaa agatcgagaa aagggatggt ccttctgcaa 180

<210> 248

<211> 180

<212> DNA

<213> 人工序列

<400> 248

ttgtagcgta cgacaatgcg gtcaacctta gctgcaagta ttcctacaat ctcttctcaa 60

gggagttccg ggcatccctt cacaaaggac tggatagtgc tgtggaagtc tgtgttgtat 120

atgggaatta ctcccagcag cttcaggttt actcaaaaac ggggttcaac tgtgatggga 180

<210> 249

<211> 180

<212> DNA

<213> 人工序列

<400> 249

ggcctagaaa aggaacccgt tgagaagagc ctcttagttg gagacagatt gaggagtgca 60

aaacagctat aaacaagtgg ctgccagcag gactttttat ctatgtatat tcccacctca 120

ctccaaagac aggaagagtg gttttctaaa atgcaaacaa atccgaacac accagacacc 180

<210> 250

<211> 180

<212> DNA

<213> 人工序列

<400> 250

atgcacaaag tttgcctgtg gaaggcggtg cgcgaccccg acgccggctc gggctagggt 60

cgcacccagg ctgccgccgc cagcagccgc gaaaagaggt tggagcaagg aagggggatg 120

ggggtgagag aggaaggtga aacgaggcgg agaacgcagg gaaaagcgag gggctcctag 180

<210> 251

<211> 180

<212> DNA

<213> 人工序列

<400> 251

cgatgggcta agagtgggtg ttgagatgga gctcccaggc caggaggctc agagactgac 60

ctctgagcta ggggacattc agagtggggc agggctaggc aaagtgaaac gggggctgca 120

ttcccatcct cgccctggaa gaggctaaga gcaaactctt cattctcctc agctggttgt 180

<210> 252

<211> 180

<212> DNA

<213> 人工序列

<400> 252

taccaagaag acaccaccct cccctgtgtc caccctccac cccaactcac ttgttcttga 60

agtcttccac caggtcctgc atgtttctca gctctgagtc caggcggccc cgttccccca 120

cgatgctgtc cagctgcctc ctgaggttgt tgatgtactg ctcgaacaac ggctccaggt 180

<210> 253

<211> 180

<212> DNA

<213> 人工序列

<400> 253

tagtttaccc agtatcgcca gcacagccat gccttgagcc agcactatgc caggccctgt 60

gctggaggcc ttaaatgcat tcttccagtg aattctccca acaagcccat gaggtagata 120

ctatcattat gcccctttta cagaaatggc agctgaggct gggagctggt catcaacttg 180

<210> 254

<211> 180

<212> DNA

<213> 人工序列

<400> 254

ctgagcccat ttcctcggtg tagttatctg aagtgtatat ctgcaaaaga ggcaaaggaa 60

tggacattca cttccaattc agcaagcatt aacccagtta aaaaaaattt ttaaagcaat 120

ttaaaaaacc aattcaggct tgctttcttc aggaaattct gaagtagtgg gctaagggca 180

<210> 255

<211> 180

<212> DNA

<213> 人工序列

<400> 255

catcgggtgt ctgggaatat ctaagaatac aattaggtta ctgcataaca aaatttcctt 60

taacttattg tacaatatac agcaaaagtc atttttacta gcaataccat ctttaaaaca 120

ctgaacaata tttgcttttc tactacttgc aggaaagagc tgaaagcatt ttgggtaaga 180

<210> 256

<211> 180

<212> DNA

<213> 人工序列

<400> 256

gggtgctttt cccaacaacc aggaatgcat ggaaaacagg caggcttccc caactcctgg 60

ctctgtgctg gctcagcaga agagctgtca caggagccca aggctcctca accatcccag 120

ggcctgcctc ccactggggc atgcggccct ggacttctgc acacggggac actcaggaaa 180

<210> 257

<211> 180

<212> DNA

<213> 人工序列

<400> 257

atttcgaact ccacgccctg agtgaaaacc gcttccccgc caggggtgac tgccctggga 60

tgttgctgtc ttcgggcagt tgtgggaagt tgggcgctgg cccttatttg agtagagacc 120

atcttaacta gattggaggc acacgtctca cagctgacag acacacgggg tgaagttacc 180

<210> 258

<211> 180

<212> DNA

<213> 人工序列

<400> 258

gtctgggtta ctcttcgctt ctggtatctg gcgttctttg gtacacagtt ctggtgttcc 60

taccaggact caagagacac cccttcctgc tgacattccc atcacaacat tcctcagaca 120

agcctgtaaa ctaaaatctg ttaccattct gatggcacag aaggatctta attcccatct 180

<210> 259

<211> 180

<212> DNA

<213> 人工序列

<400> 259

ggccaggcca gtatgttgta agtacctaca ctggacaggt aagacttgga agttctatct 60

ttcccacacc tacttctgaa agaagccagg taaccatatc cagatcttct aacatgtagc 120

tttctccttt cctgggtctt tccttcctgt tctagcccca gtaactagcc cctaggccag 180

<210> 260

<211> 180

<212> DNA

<213> 人工序列

<400> 260

gcaatgggga atatgacttg tgtcctaaac ctattaatgg taaccacatt tcatgtcaga 60

aacagctcat taaactaatt ttagatttgg tgagaatgtg tttaaataat gacagcctgc 120

agaagtctga agcaggtcat taaagccatt ggaattggtg gtttgatttc atttccatcc 180

<210> 261

<211> 180

<212> DNA

<213> 人工序列

<400> 261

ccccaaaaac tggcatgctg aacttaggtc cctgctttgg aaagagaagg gtaactgcga 60

cagacctttc tcaaaatgca gaaataacat caatcagatg agacttcaga taacccccat 120

gtgcgggcac cgctcttcca ccgccgccac agcccagtac atttgtagct tccggggtgg 180

<210> 262

<211> 180

<212> DNA

<213> 人工序列

<400> 262

ggtaaaggtg gcacccagtt tccaaagaca gcacagacgc caagggtctt ttctgaactt 60

cttcgatttt tatgatccct ggctgggtcg gagaagggct agttagtatg tttttctttc 120

ttctggatga aagttgcaag gacacttaag ccttatgctt cagggcggaa tctgatcaca 180

<210> 263

<211> 180

<212> DNA

<213> 人工序列

<400> 263

cctagacata gacggcgctc aaaaacatct gtggaaggag gaagggtggg aaggagggag 60

ggaattaaaa aagaagggag ggaaggagag aggcaggcaa atcttgtgac tccaaatcct 120

aatgtcttca gacttcatat atttttcttt ctgcaaaaca cgtgcctaac aaggagtgca 180

<210> 264

<211> 180

<212> DNA

<213> 人工序列

<400> 264

acgccggaca tcgaaagttg cgccaggcgg cctgggctta ttgatttctc tcccctaggc 60

gatcgtggag agcgcagaga gaggcgtgaa ggggcctacg ggcaggcgat ctcgcctcct 120

cacagtcgcc accgcccccg cccccatttg acttatgcaa ataaacccaa agggtgcggg 180

<210> 265

<211> 180

<212> DNA

<213> 人工序列

<400> 265

tgcccacttg ggagaagctc gaggaactga cgcaggcacc aggcctactc atgttggagt 60

ggctgctgaa ggtccggggc cagaggtgga caccctgtag aacttctggg tcaccctgat 120

ggacatggtg gaggcgggag tggaggcagg tgggcagaaa cagggggaga ttcaataagt 180

<210> 266

<211> 180

<212> DNA

<213> 人工序列

<400> 266

taagaataga gaggaagctg agaaacagct attccatttg tttgcatatt taggattttt 60

ttctaattga cagggatgga gggaagcaaa cttggatttt ttgttctttt gtattgtaag 120

atgtatatct aaaaggtttt aaaacatata gctaaggact actgaaaagt gaatcccatg 180

<210> 267

<211> 180

<212> DNA

<213> 人工序列

<400> 267

cccacgctgc agtatgtttg aagctccctt gccctggtct ccctcctcgc agcctcttct 60

gggtgaaagg cacatgtccc accagacacc catgagccat ccttggcccc tctctggaac 120

cttacccctc acatcccata aatccccaag gactgtgcat ccacctgctg aacatcacca 180

<210> 268

<211> 180

<212> DNA

<213> 人工序列

<400> 268

ctcctcccag ttccctgcta aaaatgttga cagtcacatc tgtgaaaccc tgcaacacca 60

cctctttgaa aaatcaaaca taaatcccta aacaatattt agcttttgaa gcaaaggttt 120

ggtttttatt tgcatattga ggcgcaaagc ttatttgcat attgagaggc aaagctccgt 180

<210> 269

<211> 180

<212> DNA

<213> 人工序列

<400> 269

tgcacaaaag caaacccgtc ggaggagttt tgccagaaac accaccgcct gcattgcgtc 60

ggacctgacc atttccaatg tgaaattccc ggggaaggtc gcgagccgct aggggccgtt 120

cgtgggcggg gcggcgggcc acaggggaag tagagttagc ggtcggcttt tctggtagga 180

<210> 270

<211> 180

<212> DNA

<213> 人工序列

<400> 270

gcaccttaac ctgaccgctt gggctgtggg ggagcctgtt tcagggaaag tgagggacgc 60

gccagtttcc tcctttggac ttgatgaggc acgaacgcat ctctaataaa gccaggtctc 120

cccgccgtgg ctccctgggc gggtgcctgt ggctcgggcc atgagtcacg ctgggtaacc 180

<210> 271

<211> 180

<212> DNA

<213> 人工序列

<400> 271

agttggcgtc ttggactctg atcctctaca gcaagagtgg gcagaaggac gcagctctgg 60

tgcctggccc ttccccagtt ggcctggggt ggtgcccatt ctccccaatg ccaggggcaa 120

gcaaggcctg gcctctacaa tctcaatggc ctccttgccc aacccctagg cctcttttgg 180

<210> 272

<211> 180

<212> DNA

<213> 人工序列

<400> 272

tcagcacttc aggccctcta gtcctgctcc cccctccttc ccctgccacc tgcactccct 60

tcaatgccat ccacccaaac ctcagaaaga aagtaccagt gctgtgtaca tgagggtgtg 120

tgttacttgt agagaagggg tgggggagaa cgggaagggg gctggtagac ttgggggttg 180

<210> 273

<211> 180

<212> DNA

<213> 人工序列

<400> 273

tgtgggccag ttcgttaatc tacttgagct ttggttagtt attctataga tcgttttgtg 60

gattaagtga aacatcatac tgaaaacact tagttttatc atccagacca gggcactaaa 120

cgagaataaa ccaacctcct agtttttgga tgtgtttgac acgaggggat gtttagggga 180

<210> 274

<211> 180

<212> DNA

<213> 人工序列

<400> 274

gacagctaac agcccccatt tatcaaatcc ctgtcatatg ctgtgtcagg cactttatat 60

ccctcatcca ggaggatgca aaaacctggt gtttttcttt tttttttttt tgcattttcc 120

agacgagcca agggatggct cagaagggtg aaggaactca cccgaattgc acagctggtg 180

<210> 275

<211> 180

<212> DNA

<213> 人工序列

<400> 275

ctttgccact atgggctgtc tacacagcta tggaataccg ctggcccttt ggcaattacc 60

tatgtaagat tgcttcagcc agcgtcagtt tcaacctgta cgctagtgtg tttctactca 120

cgtgtctcag cattgatcga tacctggcta ttgttcaccc aatgaagtcc cgccttcgac 180

<210> 276

<211> 180

<212> DNA

<213> 人工序列

<400> 276

ttggtgaggc aatgaggctg atagctcagc attagctaca gccacccctc ctggccaacc 60

acacagggat caaaccaggg gtcagtccag aggtcagagt caggagcaga caactcagat 120

ccagccaggg acaggcaggt cacacggaca tgtgcctcac gtatgcttca aggggccctc 180

<210> 277

<211> 180

<212> DNA

<213> 人工序列

<400> 277

tcaccggcga aacatccatt ccctgagcat ctgcttcagg ggctggggat ggagatgcta 60

aaaatgacag gagcgagaaa gagtagcagt taatattcac cgacagcctc attggcctgg 120

ctctcgactc ctcaccgcac tcctgaggtg ggagctgtta ctaccccctc gtagttgcag 180

<210> 278

<211> 180

<212> DNA

<213> 人工序列

<400> 278

tggttgcaat tctgagagtc atctctgatg gatggacata gataccttgg ccttggacaa 60

tttgtgctga ctgtggagca tctgtgggtc ctgtggctgg cagtggaggc ggtaaggaga 120

tgactagcag tgagctaccc taaggccccc ttgtctaccg cctctcgtct caaagtcctc 180

<210> 279

<211> 180

<212> DNA

<213> 人工序列

<400> 279

ctggggacac gggtctagta tttgatgggt tggaagggag tatggaggct tctggcacca 60

ggctaaggct ttagtcaggg tatatctgac aggtgtttgc tttgtgtctg cagtgttgcc 120

atcccccctg ggggtcctga gtgggacctc acggcctccc acgccaacct tgtccctaaa 180

<210> 280

<211> 180

<212> DNA

<213> 人工序列

<400> 280

gcgttctgca ctcgagtctt gcgggtggac atgcatatgt cagagtggag ggcaggcagc 60

gatatctact ggtttggctt gggtattttt tttttttgag atggagtctc agctatgaag 120

atataataag cttgttggat ggcccctccc atcacctggc agtggacctg cgtttaagga 180

<210> 281

<211> 180

<212> DNA

<213> 人工序列

<400> 281

gaggcccgtg attccgttta tatgaagggt cccgaacagg gacccacaga ggcatgagat 60

ggattccctg gggctagagg ctctgtctgg aagatggaaa tgggctggat ggaggggagg 120

tggatgcacg gcctcgggag cgcactccac accacaaact gttcgcttaa tgacggccct 180

<210> 282

<211> 180

<212> DNA

<213> 人工序列

<400> 282

ggggccaggt atggacacta aggcgtccgc tgagggtccc ggccgcatcc ccgggtggag 60

gccccccacc tccgcccagg cagcggcgcc ccctcgcggc cgcttactcg tcgccgtcgg 120

ggcacacgcc ggtggcttcg ttgtacttgg agcagtacac gtcggggctg tagttgaagg 180

<210> 283

<211> 180

<212> DNA

<213> 人工序列

<400> 283

cctatcggtc gtatcctctg tcctgaccga gaagtaccgc tgagcgccgc ctccgggacc 60

cccaggacag gctgcggccc ctcccctgcc cttcaccctc ccacagttcc tgccctgact 120

ccaataaatg gatgaggacg gagcgatctg ggctctgtgt tctcagtatt ggagggaagg 180

<210> 284

<211> 180

<212> DNA

<213> 人工序列

<400> 284

caagtcaggg ttttgcgttg actgagtggg atttgggtca tcaattccaa tcagatttct 60

ggagaaggct cttctttccc tgatgattga ggtcttcatt gcagtcctct cggtggaagg 120

agaggccttc ctggaagtcc aaacagttct cttttcctcc ctctggctaa tttcttgttc 180

<210> 285

<211> 180

<212> DNA

<213> 人工序列

<400> 285

gggcatgaat tgccagagtg ggctctaagg agaccgggat cgggggaaag aggaacctgg 60

aagaagccaa ggctccttgg accaggctgc agggcagaaa ggaaaggctg ggaggaggct 120

gcctggggtg gagggggaag ctccatcagc cccacacgga ctcgcggcgc attataaaca 180

<210> 286

<211> 180

<212> DNA

<213> 人工序列

<400> 286

aaagtccgag aaggcacgtc ctgcgagtgg aggttaaacc gaaatctgaa cagaatgcac 60

ggtccccgca aactacgatt gataaagaag atactgagac gtttgcgggg gatataagcc 120

atggttgtct cgccttcctc ccctccctgc caactatgtt tcttggagaa atcgccggtt 180

<210> 287

<211> 180

<212> DNA

<213> 人工序列

<400> 287

gagagcccca caggatggta agttagagga gagcacaagg aaatgaccca tttagagcag 60

cagctgcaat accgggtgag aataatttgc acttacatcc ttgatgtctc caggttctcc 120

tttctgtccc tgaaacatga aacattcaca ggattaagcc gagtaagccc actaagcccc 180

<210> 288

<211> 180

<212> DNA

<213> 人工序列

<400> 288

ttccccaaca caatttcttg ctttcactcc taaaatctaa aagcaaaaaa gggccacatt 60

gtttaaaatg cattctccct aaaaaatgct atatgctata atcatatctg cctcatccaa 120

cacgagtaag tactaaatta caggtctgtt ttagctgatg tctgaaaggc cattacctca 180

<210> 289

<211> 38

<212> DNA

<213> 人工序列

<400> 289

ttgtcttcct aaggaacgac atggctacga tccgactt 38

<210> 290

<211> 58

<212> DNA

<213> 人工序列

<400> 290

agtcggaggc caagcggtct taggaagaca atgtcataaa tcaactcctt ggctcaca 58

<210> 291

<211> 58

<212> DNA

<213> 人工序列

<400> 291

agtcggaggc caagcggtct taggaagaca attaattaag gcaactcctt ggctcaca 58

<210> 292

<211> 58

<212> DNA

<213> 人工序列

<400> 292

agtcggaggc caagcggtct taggaagaca agactcactg acaactcctt ggctcaca 58

<210> 293

<211> 58

<212> DNA

<213> 人工序列

<400> 293

agtcggaggc caagcggtct taggaagaca aataaggcag tcaactcctt ggctcaca 58

<210> 294

<211> 58

<212> DNA

<213> 人工序列

<400> 294

agtcggaggc caagcggtct taggaagaca attgatagat tcaactcctt ggctcaca 58

<210> 295

<211> 58

<212> DNA

<213> 人工序列

<400> 295

agtcggaggc caagcggtct taggaagaca accttcctgg tcaactcctt ggctcaca 58

<210> 296

<211> 58

<212> DNA

<213> 人工序列

<400> 296

agtcggaggc caagcggtct taggaagaca aaatatctct ccaactcctt ggctcaca 58

<210> 297

<211> 58

<212> DNA

<213> 人工序列

<400> 297

agtcggaggc caagcggtct taggaagaca acatgtttcc ccaactcctt ggctcaca 58

Claims

1.一种标签序列的检测方法，其特征在于，所述方法包括：

使用一组模板序列与一组待测标签序列进行匹配建库得到一组标签文库，所述模板序列是扩增或人工合成的不同基因序列，不同的模板序列在序列上彼此不同，所述模板序列与上述待测标签序列具有一对一或多对一的对应关系；

对所述标签文库进行测序，得到每个标签文库的测序读长序列；

将每个标签文库的测序读长序列与全部所述待测标签序列进行比对，统计比对到每个待测标签序列上的测序读长序列的数量；

根据所述数量计算每个待测标签序列中含有其他标签序列的污染率。

2.根据权利要求1所述的检测方法，其特征在于，所述模板序列是从基因组DNA中扩增得到的不同基因序列。

3.根据权利要求1所述的检测方法，其特征在于，所述一组模板序列的数量是N，N＝4X，X是大于等于1的整数。

4.根据权利要求1所述的检测方法，其特征在于，所述一组模板序列的数量是96个。

5.根据权利要求1所述的检测方法，其特征在于，所述模板序列的大小是50-1000bp。

6.根据权利要求1所述的检测方法，其特征在于，所述模板序列的大小是180bp。

7.根据权利要求1所述的检测方法，其特征在于，全部所述模板序列的大小相等。

8.根据权利要求1所述的检测方法，其特征在于，所述模板序列满足其5’端和3’端与测序读长相同的碱基序列范围内A、T、C、G任意一种碱基占比至少不低于可保证四种碱基信号平衡的碱基占比值。

9.根据权利要求8所述的检测方法，其特征在于，所述模板序列的5’端和3’端与测序读长相同的碱基序列范围是5’端和3’端20bp至200bp范围。

10.根据权利要求8所述的检测方法，其特征在于，所述模板序列的5’端和3’端与测序读长相同的碱基序列范围是30bp内。

11.根据权利要求8所述的检测方法，其特征在于，所述碱基占比值是10％至30％。

12.根据权利要求8所述的检测方法，其特征在于，所述碱基占比值是15％。

13.根据权利要求1所述的检测方法，其特征在于，所述模板序列的数量是所述待测标签序列的数量的N倍，N是大于等于1的整数，所述模板序列分成相当于所述待测标签序列的数量的亚组数，每亚组所述模板序列包含N个模板序列。

14.根据权利要求1所述的检测方法，其特征在于，所述待测标签序列是标签接头和/或标签引物。

15.根据权利要求1所述的检测方法，其特征在于，所述待测标签序列是单标签接头。

16.根据权利要求15所述的检测方法，其特征在于，所述匹配建库包括：将所述模板序列与所述单标签接头按照一对一或多对一的对应方式进行接头连接，然后用通用引物进行PCR扩增得到用于上机的单标签文库。

17.根据权利要求1所述的检测方法，其特征在于，所述待测标签序列是单标签引物。

18.根据权利要求17所述的检测方法，其特征在于，所述匹配建库包括：将所述模板序列与通用接头连接得到连接产物，然后与单标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的单标签文库。

19.根据权利要求1所述的检测方法，其特征在于，所述待测标签序列是标签接头和标签引物组成的双标签序列。

20.根据权利要求19所述的检测方法，其特征在于，所述匹配建库包括：将所述模板序列与所述标签接头按照一对一或多对一的对应方式进行接头连接，然后与所述标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的双标签文库。

21.根据权利要求1所述的检测方法，其特征在于，所述待测标签序列是两个标签引物组成的双标签引物。

22.根据权利要求21所述的检测方法，其特征在于，所述匹配建库包括：将所述模板序列与通用接头连接得到连接产物，然后与所述双标签引物按照一对一或多对一的对应方式进行PCR扩增得到用于上机的双标签文库。

23.根据权利要求1所述的检测方法，其特征在于，所述待测标签序列是两个标签接头组成的双标签接头。

24.根据权利要求23所述的检测方法，其特征在于，所述匹配建库包括：将所述模板序列与所述双标签接头按照一对一或多对一的对应方式连接得到连接产物，然后与通用引物PCR扩增得到用于上机的双标签文库。

25.根据权利要求1所述的检测方法，其特征在于，所述测序是双末端测序。

26.根据权利要求25所述的检测方法，其特征在于，所述测序是PE30+10测序。

27.根据权利要求1所述的检测方法，其特征在于，全部所述待测标签序列是同一批合成的全部标签序列。

28.根据权利要求1所述的检测方法，其特征在于，所述方法还包括根据所述测序读长序列获得二链(read2)的测序质量评估结果；以及

任选地，通过所述评估结果来间接判断所述标签文库或所述标签文库的混合标签文库与二链测序相关接头的5’端碱基合成质量。

29.根据权利要求1所述的检测方法，其特征在于，所述模板序列通过SEQ ID NO：1～192所示的96对引物对扩增人基因组得到。