一种用于检测目的基因低频突变的扩增子文库的构建方法
技术领域
本发明属于生物技术领域,尤其涉及一种用于检测目的基因低频突变的扩增子文库的构建方法。
背景技术
肿瘤具有高度异质性,其中的致病突变可能以极低的比例存在,肿瘤患者的血液、尿液和脑脊液中的cfDNA中的目的基因的突变位点或突变区域的突变频率会影响将来肿瘤用药或者肿瘤发展方向的判断。因此,检测肿瘤患者的血液、尿液和脑脊液中的cfDNA中的目的基因的突变位点或突变区域的突变频率成为研究重点,这就需要对突变位点或者突变区域进行测序,检测突变频率。
目前二代测序最准的Hiseq测序本身的错误率就在0.2%上下,除此之外,当前的DNA聚合酶的扩增错误率也在10-7-10-5之间,因此,如何能够在测序结果中排除扩增错误和测序错误,直接反应出样本中原始模板分子的低频变异情况就成为了问题的关键。
肿瘤患者的血液、尿液和脑脊液中的cfDNA的含量很少,这对低频突变的检测来说是个难题。当前市场上主要有三种低频突变的检测方式:数字PCR、下一代测序(next-generation sequencing,NGS)和突变扩增系统(amplification refractory mutationsystem,ARMS)PCR。NGS具有高通量、低成本、快速、操作简便等优势,是目前国内最热门的低频突变检测技术。在NGS过程中,构建基因文库是整个测序进程中第一个步骤,也是最为关键步骤,基因文库的质量直接影响后续的测序工作。但是,市场上常规的建库方法均存在成本高、检测周期长、流程复杂、文库易被污染以及对检测人员要求高等缺陷,不适用于大量样本的测序建库。
发明内容
本发明的一个目的是提供用于检测待测样本目的基因待检区域突变情况的扩增子文库的构建方法。
本发明提供的方法适用于所有二代测序平台,包括如下步骤:
1)设计合成Barcode引物F1、上游引物F2、下游外引物R1、下游内引物R2;
所述Barcode引物F1依次由测序接头1、用于区分不同样本的barcode序列和通用序列1组成;
所述上游引物F2依次由通用序列1、分子标签、特定碱基序列和上游特异性引物序列组成;
所述下游外引物R1依次由测序接头2和通用序列2组成;
所述下游内引物R2依次由通用序列2和下游特异性引物序列组成;
所述测序接头1和所述测序接头2为根据不同测序平台选择对应的测序接头;
所述barcode序列均为长度为8-12nt、无连续碱基,且GC含量为40-60%的核苷酸;
所述通用序列1和所述通用序列2的长度均为16-25nt,且无连续碱基,GC含量为35-65%,无明显二级结构;
所述特定碱基序列为GAT;
所述上游特异性引物序列和所述下游特异性引物序列是扩增所述目的基因待检区域的引物;
所述分子标签为10-12位随机碱基;
2)用所述Barcode引物F1、所述上游引物F2、所述下游外引物R1和所述下游内引物R2对待测样本cfDNA进行一步PCR扩增,得到扩增产物,即为用于扩增子测序的DNA文库。
上述方法中,
所述测序平台为Illumina平台,所述测序接头1为I5,所述测序接头2为I7;
或所述测序平台为Ion Torrent平台,所述测序接头1为A,所述测序接头2为P。
上述方法中,
所述PCR扩增中,所述Barcode引物F1、所述上游引物F2、所述下游外引物R1和所述下游内引物R2的摩尔比为6:(10-6):(1-3):(1-3)。
上述方法中,
所述突变为低频突变,具体为突变频率最低至0.1%。
上述方法中,
所述待测样本为肿瘤患者的离体血液分离的cfDNA、肿瘤患者的离体尿液分离的cfDNA、肿瘤患者的离体脑脊液分离的cfDNA或肿瘤患者的离体肿瘤组织提取的基因组DNA。
上述的方法制备DNA文库也是本发明保护的范围。
上述的方法或上述DNA文库在检测待测样本cfDNA中目的基因的突变位点或突变区域突变情况中的应用也是本发明保护的范围。
上述的方法或上述DNA文库在检测待测样本cfDNA中目的基因的突变位点或突变区域的突变频率中的应用也是本发明保护的范围。
上述检测待测样本目的基因待检区域的突变情况为检测待测样本目的基因待检区域的突变碱基或者突变氨基酸或者检测待测样本目的基因待检区域的突变频率。
突变频率的计算方法如下:
测序结果中,带有同一种分子标签的DNA分子为一种初始DNA模板的扩增产物,命名为1个家族;
检测该家族中的突变率,若该家族的突变率≥80%,则该家族记作带有分子标签的突变的DNA家族;
突变率=(同一家族中编码氨基酸残基的密码子有突变的DNA分子的数量/同一家族中DNA分子总数)*100%;
突变频率=测序结果中带有分子标签的突变的DNA家族的数量/测序结果中所有带有分子标签DNA家族的数量*100%。
备注:测序结果中带有同一分子标签的read(测序出的一条序列)数≥2才有统计意义
本发明另一个目的是提供一种检测待测样本cfDNA中目的基因待检区域的突变情况的方法。
本发明提供的方法,包括如下步骤:
1)按照上述第一个目的的方法制备DNA文库;
2)测序所述DNA文库,得到测序结果,根据测序结果分析待测样本cfDNA中目的基因待检区域的突变情况。
上述方法中,
所述通用序列1的核苷酸序列为序列1;
所述通用序列2的核苷酸序列为序列2;
所述测序接头1的核苷酸序列为序列3;
所述测序接头2的核苷酸序列为序列4;
所述用于区分不同样本的barcode序列分别为序列5-序列14;
所述待测基因为NRAS,对应的上游特异性引物序列和下游特异性引物序列分别为序列15和序列15或序列17或序列18;
所述待测基因为ALK,对应的上游特异性引物序列和下游特异性引物序列分别为序列19和序列20或序列21和序列22或序列23和序列24或序列25和序列26或序列27和序列28或序列29和序列30或序列31和序列32;
所述待测基因为PIK3CA,对应的上游特异性引物序列和下游特异性引物序列分别为序列33和序列34或序列35或序列36;
所述待测基因为ROS,对应的上游特异性引物序列和下游特异性引物序列分别为序列37和序列38;
所述待测基因为EGFR,对应的上游特异性引物序列和下游特异性引物序列分别为序列39和序列40或序列41和序列42或序列43和序列44或序列45和序列46或序列47和序列48;
所述待测基因为MET,对应的上游特异性引物序列和下游特异性引物序列分别为序列49和序列50或序列51和序列52或序列53和序列54或序列55和序列56;
所述待测基因为BRAF,对应的上游特异性引物序列和下游特异性引物序列分别为序列57和序列58或序列59和序列60;
所述待测基因为KRAS,对应的上游特异性引物序列和下游特异性引物序列分别为序列61和序列62或序列63和序列64;
所述待测基因为TP53,对应的上游特异性引物序列和下游特异性引物序列分别为序列65和序列66或序列67和序列68或序列69和序列70或序列71和序列72或序列73和序列74或序列75和序列76;
所述待测基因为ERBB2,对应的上游特异性引物序列和下游特异性引物序列分别为序列77和序列78。
本发明由于采取以上技术方案,具有以下优点:
1、操作简便,节省时间。传统的建库捕获技术操作繁琐,流程长,对操作人员要求高。本发明只涉及一步PCR反应及对应产物纯化步骤,简化了建库的操作流程,节省建库时间(两小时内可完成建库,从文库构建到上机结束及生信分析完成的整个流程可在24小时内完成)。
2、极高的检测灵敏度。该建库方法可检测低至0.1%的突变,待检样本可以是血液、尿液以及脑脊液等分离出的游离DNA,也可是传统的冰冻组织、石蜡切片及新鲜穿刺组织等提取的基因组DNA。
3、有效杜绝样本间交叉污染。在PCR起始便加入区分不同样本的barcode序列,且操作过程及步骤的简化有效的杜绝了建库过程中有可能造成的交叉污染。
4、降低建库成本。与传统的捕获技术相比,该文库制备所需成本大大降低。传统捕获建库时所使用的捕获探针成本高,其冗长的实验流程所涉及的试剂耗材也给捕获建库增加了很大的成本,相对而言,一步法建库过程将试剂耗材的使用量大大减少,建库成本也较传统捕获建库方法低得多。
5、节省空间。由于本方法只需一轮PCR,因此实验室要求分室只需3个房间(样本提取、PCR扩增间、文库纯化和测序),与传统文库制备所需4房间(样本提取、PCR1、PCR2及文库纯化、测序)相比,节省空间需求。
该方法除能检测组织样本外,还能够快速、简便、灵敏、特异的对血液、尿液以及脑脊液等样本中游离DNA的不同区域进行靶向扩增,并高效检测低至0.1%水平的突变,大大的简化实验操作,有效避免文库损失及污染,显著降低成本,提高效率。
灵活简单的建库方法以及极高的灵敏度是该专利的最大特点。
附图说明
图1为分子标签的功能。A、B和C分别为不同的突变位点。
图2为受检者1血液样本提取的ctDNA文库构建完成后Agilent 2200TapeStationSystems检测得到的扩增产物分布。
图3为受检者1的血液样本提取的ctDNA通过一步法获得的扩增子文库在IonTorrent平台测序结果。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、构建用于检测目的基因低频突变的扩增子文库
肿瘤患者的血液、尿液和脑脊液中的cfDNA中的目的基因的突变位点或突变区域的突变频率会影响将来肿瘤用药或者肿瘤发展方向的判断,本实施例为了检测肿瘤患者的血液、尿液和脑脊液中的cfDNA中的目的基因的突变位点或突变区域的突变频率,构建用于检测目的基因低频突变的扩增子文库,具体如下:
一、用于检测目的基因低频突变的扩增子文库的引物组合设计合成
选择已知目的基因中一段区域作为待检区域设计合成如下引物:
该待检区域存在突变热点,只是待检样本中基因突变发生与否可以已知,也可未知
Barcode引物F1:测序接头1+barcode序列+通用序列1;
上游引物F2:通用序列1+分子标签+特定碱基序列+上游特异性引物序列;
下游外引物R1:测序接头2+通用序列2;
下游内引物R2:通用序列2+下游特异性引物序列;
其中,barcode序列是用来区分不同样本的序列,一个待测样本对应一个barcode序列,此Barcode序列长度为8-12nt,要求无连续碱基,GC含量为40-60%,引入Barcode序列的引物无明显二级结构等。F1是用来区分不同样本,只要是同一样本,F1均相同,与检测位点无关。
通用序列1和2长度为16-25nt,要求无连续碱基,GC含量为35-65%,引入序列的引物无明显二级结构等,该序列可根据需要变化,本实施例采用的是
通用序列1GGCATACGTCCTCGTCTA(序列1),大小18nt;
通用序列2CGACATCGCCTCTGCTGT(序列2),大小18nt。
测序接头1和测序接头2根据测序平台确定:
如果测序平台为Illumina平台,测序接头1和2分别为I5和I7,接头序列和芯片上的引物序列是互补的,加接头是为了把核酸片段连接到载体上。
如果测序平台为Ion Torrent平台,测序接头1和2分别为A和P(序列3和4),A接头用来测序,与特异性引物互补,P接头与载体上序列互补,用来将模板与载体连接。
特定碱基序列为GAT,不是基因特异扩增片段的部分,其作用是便于测序结果的生物信息分析,通过识别GAT序列来提高数据筛选的效率。
上游特异性引物序列和下游特异性引物序列为根据目的基因待检区域设计用于扩增其的引物,上游特异性引物序列大小为15-30nt,下游特异性引物序列大小为15-30nt。
分子标签为10-12位随机碱基,用来标记起始cfDNA模板。每位随机碱基有ATCG四种碱基形式,所以10位随机碱基总共存在1048576种不同的分子标签,以初始20ngDNA模板为例,其拷贝数为6000,而cfDNA的分子片段较短,所以能够扩增的有效模板拷贝数要小于6000,1048576种的分子标签形式完全可以为每一个初始模板加上特定的“标记”。通过分子标签来对测序结果的起始模板进行分类,就可以排除扩增错误及测序错误。
如图1所示,图1为所构建的文库中,带有同一个分子标签的5个扩增产物,其中A位点的突变在5个分子上都存在,而B和C位点的突变只在其中某一个扩增产物中存在,所占比例极低,就可以判定A位点的突变为初始模板分子中存在的突变,而B和C位点的突变则为建库的PCR扩增中或者测序过程中出现的假阳性的突变。所以,分子标签的作用是标记原始模板分子,识别原始模板中存在的突变,剔除PCR及测序过程中出现的假阳性突变,提高检测灵敏度。
二、检测方法的建立
1、将上述一的引物(F2,R1和R2)按特定比例混合,充分混匀后称引物mix,待用。
2、提取待检样本如肿瘤患者血液、尿液或脑脊液的cfDNA。
3、用不同样本对应的barcode引物和引物mix对cfDNA进行PCR扩增,向0.2ml的八连排管或96孔板中,依次加入如下表1所示的试剂,得到PCR扩增体系。
表1为PCR扩增体系
其中,引物mix中,R1、F2、R2引物加入初始浓度均为50μM,且R1:F2:R2(体积比)=10:(1-5):(1-5)。
PCR扩增体系中,Barcode引物F1、上游引物F2、下游外引物R1和下游内引物R2的摩尔比如下:F1:R1:F2:R2的摩尔比=6:(10-6):(1-3):(1-3)
4、在PCR仪(PCR仪使用Applied bio-system的2720Thermal Cycler)上,运行如下表2所示扩增程序:
表2为扩增程序
建库PCR过程中前两个循环的梯度退火温度的循环条件是对原始模板进行初步扩增,也可以说是为不同原始模板加上特定的分子标签,而随后19循环的PCR条件是对原始模板进分子标签内扩增,同时,高浓度的F1,R1与低浓度的引物F2,R2,也保证了之后19个循环过程中所进行的为分子标签内扩增(即一般不会在扩增过程中添加其它分子标签)。
5、用移液枪吸取PCR反应液1.3倍体积的Agencourt AMPure XP Kit(BECKMANCOULTER,A63882)进行纯化回收PCR产物,得到用于扩增子测序的DNA文库。具体纯化步骤如下:
1)提前30分钟取出Agencourt AMPure XP Kit,充分涡旋后,室温静置。
2)PCR反应结束后,将磁珠再次充分涡旋,向体系中加入24μl磁珠,反复吹打5次以上或充分涡旋,室温静置5分钟。
3)将EP管转移至置于磁力架上,静置5分钟至溶液澄清后,用移液枪小心除去上清,注意不要触碰磁珠。
4)每管加入100μl新鲜配置的80%乙醇溶液,EP管置于磁力架上缓慢旋转2圈,静置5m,弃去上清。
5)重复4步一次。
6)将EP管打开,室温静置,使液体挥发干净,以磁珠表面无光泽为准,注意不要过分干燥磁珠。
7)从磁力架上取下EP管,加入30μl PCR级纯化水,涡旋混匀后,室温静置10分钟。
8)将上步的EP管置于磁力架上2分钟或直至溶液澄清后,用移液枪在远离磁石的一面小心吸取上清液,注意不要触碰磁珠。
至此,扩增子文库构建完成,采用QuBit定量来判断是否构建成功。
6、上机测序及结果分析
上述不同样本扩增的文库按照测定的浓度进行等比例混合,最后稀释到特定浓度,用二代测序仪测序,得到测序结果。
测序的结果经过数据处理、生物信息学分析之后得到检测基因的突变情况。数据处理过程包括测序数据的转换、质控、序列比对(参考基因组为NCBI GRCh37/Hg19)、突变位点分析等过程,通过数据处理分析后得到检测样本的突变情况和突变频率。
因文库扩增过程对原始模板进行分子标记,突变频率的计算方法如下:
测序结果中,带有同一种分子标签的DNA分子为一种初始DNA模板的扩增产物,命名为1个家族;
检测该家族中的突变率,若该家族的突变率≥80%,则该家族记作带有分子标签的突变的DNA家族;
突变率=(同一家族中编码氨基酸残基的密码子有突变的DNA分子的数量/同一家族中DNA分子总数)*100%;
突变频率=测序结果中带有分子标签的突变的DNA家族的数量/测序结果中所有带有分子标签DNA家族的数量*100%。
备注:测序结果中带有同一分子标签的read(测序出的一条序列)数≥2才有统计意义
实施例3、构建用于检测目的基因低频突变的扩增子文库
目的基因如表5所示,待测样本来源于10例已经鉴定为肺癌患者的受检者,本实施例的目的是用本发明的方法检测表5所示的10例患者的基因突变频率。
一、用于检测目的基因低频突变的扩增子文库的引物组合设计合成
根据实施例1的一的目的基因的突变位点或突变区域设计合成如下引物,具体见表3和表4:
表3为引物组合
特异性引物设计原则:退火温度55-65℃,尽可能少二级结构,GC含量35%-65%,引物长度16-30nt,引物之间不宜形成二级结构,具体如表4。
表4为各个基因对应的特异引物序列为引物组合
二、检测
1、与实施例1的二1相同,将三种引物(R1,F2和R2)按特定比例混合,充分混匀后称引物mix,F1:R1:F2:R2的摩尔比=6:10:1:1,待用。
Barcode引物F1的浓度为1.67μM;
下游外引物R1的浓度为2.78μM;
上游引物F2的浓度为0.28μM;
下游内引物R2的浓度为0.28μM。
2、实际收集的10例受检者(均为已确诊的癌症患者)对应的FFPE样本(福尔马林固定后石蜡包埋的组织)与血液样本,提取FFPE样本的基因组DNA以及血液样本的cfDNA。
3、与实施例1的二3相同;
4、与实施例1的二4相同;
5、与实施例1的二5相同;
受检者1文库的检测结果(包含了32个扩增子)如图2所示,图2为具体样本文库构建完成后Agilent 2200TapeStation Systems检测得到的扩增产物分布图,横坐标为片段长度,纵坐标为信号强度(FU),lower峰为25bp位置marker,upper峰为1500bp位置marker,如图2所示经PCR扩增后所得PCR产物集中在160-230bp范围内。
6、上机测序及结果分析,与实施例1的二5相同,结果如下:
图3为已诊断为肺癌患者(受检者1)的血液样本提取的ctDNA采用本建库方法的Ion Torrent平台测序结果。
实际收集的10例受检者对应的FFPE样本与血液样本检测结果如下表5所示,其中FFPE样本和血液样本的方法一采用安捷伦的SureSelect定制化服务进行捕获建库,血液样本的方法二采用本专利方法进行建库,结果显示,FFPE样本与血液样本所检测到相关突变结果一致。充分说明了本发明的实际应用性和良好特异性。
表5为10例受检者对应的FFPE样本及血液样本的检测结果
上述表5中各个突变位点代表的含义举例如下:
EGFR p.Glu746_Ala750del:EGFR基因第746到750位氨基酸缺失,第746位氨基酸本来应该是Glu,第750位氨基酸本来应该是Ala。
EGFR p.Glu746_Thr751delinsAla:EGFR基因第746到750位氨基酸缺失,同时插入了Ala。
TP53p.Arg282Trp:TP53基因第282位氨基酸由Arg突变为Trp。
TP53p.Arg213X:TP53基因第213位氨基酸发生无义突变,由Arg突变为终止密码子。
序列表
<110> 北京泛生子基因科技有限公司 北京泛生子医学检验实验室有限公司 重庆今创泛生医学检验实验室有限公司
<120>一种用于检测目的基因低频突变的扩增子文库的构建方法
<160> 78
<170> PatentIn version 3.5
<210> 1
<211> 18
<212> DNA
<213> 人工序列
<220>
<223>
<400> 1
ggcatacgtc ctcgtcta 18
<210> 2
<211> 18
<212> DNA
<213> 人工序列
<220>
<223>
<400> 2
cgacatcgcc tctgctgt 18
<210> 3
<211> 30
<212> DNA
<213> 人工序列
<220>
<223>
<400> 3
ccatctcatc cctgcgtgtc tccgactcag 30
<210> 4
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 4
cctctctatg ggcagtcggt gat 23
<210> 5
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 5
tcctcgaatc 10
<210> 6
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 6
taggtggttc 10
<210> 7
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 7
tctaacggac 10
<210> 8
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 8
ttggagtgtc 10
<210> 9
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 9
tctagaggtc 10
<210> 10
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 10
tctggatgac 10
<210> 11
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 11
tctattcgtc
<210> 12
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 12
aggcaattgc 10
<210> 13
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 13
ttagtcggac 10
<210> 14
<211> 10
<212> DNA
<213> 人工序列
<220>
<223>
<400> 14
cagatccatc 10
<210> 15
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 15
ggtgaaacct gtttgttgga cat 23
<210> 16
<211> 22
<212> DNA
<213> 人工序列
<220>
<223>
<400> 16
cttcgcctgt cctcatgtat tg 22
<210> 17
<211> 27
<212> DNA
<213> 人工序列
<220>
<223>
<400> 17
tggtgtgaaa tgactgagta caaactg 27
<210> 18
<211> 25
<212> DNA
<213> 人工序列
<220>
<223>
<400> 18
gttctggatt agctggattg tcagt 25
<210> 19
<211> 18
<212> DNA
<213> 人工序列
<220>
<223>
<400> 19
tccaggccct ggaagagt 18
<210> 20
<211> 25
<212> DNA
<213> 人工序列
<220>
<223>
<400> 20
tgaggcagtc tttactcacc tgtag 25
<210> 21
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 21
cctgtggctg tcagtatttg gag 23
<210> 22
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 22
acacagatca gcgacaggat g 21
<210> 23
<211> 16
<212> DNA
<213> 人工序列
<220>
<223>
<400> 23
aatccctgcc ccggtt 16
<210> 24
<211> 15
<212> DNA
<213> 人工序列
<220>
<223>
<400> 24
gggcgggtct ctcgg 15
<210> 25
<211> 27
<212> DNA
<213> 人工序列
<220>
<223>
<400> 25
gttaattttg gttacatccc tctctgc 27
<210> 26
<211> 19
<212> DNA
<213> 人工序列
<220>
<223>
<400> 26
gattgcaggc tcaccccaa 19
<210> 27
<211> 22
<212> DNA
<213> 人工序列
<220>
<223>
<400> 27
actggatttc ctcatggaag cc 22
<210> 28
<211> 28
<212> DNA
<213> 人工序列
<220>
<223>
<400> 28
agatatcgat ctgttagaaa cctctcca 28
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 29
cggactctgt aggctgcagt 20
<210> 30
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 30
ggaaatccag ttcgtcctgt tca 23
<210> 31
<211> 26
<212> DNA
<213> 人工序列
<220>
<223>
<400> 31
gtttgactct gtctcctctt gtcttc 26
<210> 32
<211> 19
<212> DNA
<213> 人工序列
<220>
<223>
<400> 32
cttgggtcgt tgggcattc 19
<210> 33
<211> 27
<212> DNA
<213> 人工序列
<220>
<223>
<400> 33
caaagaacag ctcaaagcaa tttctac 27
<210> 34
<211> 28
<212> DNA
<213> 人工序列
<220>
<223>
<400> 34
attttagcac ttacctgtga ctccatag 28
<210> 35
<211> 25
<212> DNA
<213> 人工序列
<220>
<223>
<400> 35
agcaagaggc tttggagtat ttcat 25
<210> 36
<211> 26
<212> DNA
<213> 人工序列
<220>
<223>
<400> 36
tgtgtggaag atccaatcca tttttg 26
<210> 37
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 37
cttccctcgg gaaaaactga c 21
<210> 38
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 38
gatgtccact gctgttcctt cat 23
<210> 39
<211> 22
<212> DNA
<213> 人工序列
<220>
<223>
<400> 39
ccaaccaagc tctcttgagg at 22
<210> 40
<211> 15
<212> DNA
<213> 人工序列
<220>
<223>
<400> 40
caccgtgccg aacgc 15
<210> 41
<211> 27
<212> DNA
<213> 人工序列
<220>
<223>
<400> 41
cccagaaggt gagaaagtta aaattcc 27
<210> 42
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 42
cacatcgagg atttccttgt tgg 23
<210> 43
<211> 18
<212> DNA
<213> 人工序列
<220>
<223>
<400> 43
ctctccctcc ctccagga 18
<210> 44
<211> 17
<212> DNA
<213> 人工序列
<220>
<223>
<400> 44
gaggcagatg cccagca 17
<210> 45
<211> 17
<212> DNA
<213> 人工序列
<220>
<223>
<400> 45
ctgcctcacc tccaccg 17
<210> 46
<211> 22
<212> DNA
<213> 人工序列
<220>
<223>
<400> 46
attgtctttg tgttcccgga ca 22
<210> 47
<211> 17
<212> DNA
<213> 人工序列
<220>
<223>
<400> 47
ggaggaccgt cgcttgg 17
<210> 48
<211> 26
<212> DNA
<213> 人工序列
<220>
<223>
<400> 48
cttctgcatg gtattctttc tcttcc 26
<210> 49
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 49
cttgtaagtg cccgaagtgt aag 23
<210> 50
<211> 24
<212> DNA
<213> 人工序列
<220>
<223>
<400> 50
gtcacaaccc actgaggtat atgt 24
<210> 51
<211> 26
<212> DNA
<213> 人工序列
<220>
<223>
<400> 51
ctaaccaagt tctttctttt gcacag 26
<210> 52
<211> 24
<212> DNA
<213> 人工序列
<220>
<223>
<400> 52
agcacagtga attttcttgc catc 24
<210> 53
<211> 23
<212> DNA
<213> 人工序列
<220>
<223>
<400> 53
cagtcaaggt tgctgatttt ggt 23
<210> 54
<211> 24
<212> DNA
<213> 人工序列
<220>
<223>
<400> 54
ctttgcacct gttttgttgt gtac 24
<210> 55
<211> 18
<212> DNA
<213> 人工序列
<220>
<223>
<400> 55
ggtgcaaagc tgccagtg 18
<210> 56
<211> 27
<212> DNA
<213> 人工序列
<220>
<223>
<400> 56
aaccaataca ttaccacatc tgacttg 27
<210> 57
<211> 29
<212> DNA
<213> 人工序列
<220>
<223>
<400> 57
cttcatgaag acctcacagt aaaaatagg 29
<210> 58
<211> 26
<212> DNA
<213> 人工序列
<220>
<223>
<400> 58
ctcaattctt accatccaca aaatgg 26
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 59
gggcagatta cagtgggaca 20
<210> 60
<211> 28
<212> DNA
<213> 人工序列
<220>
<223>
<400> 60
aatgtcacca cattacatac ttaccatg 28
<210> 61
<211> 27
<212> DNA
<213> 人工序列
<220>
<223>
<400> 61
ggagaaacct gtctcttgga tattctc 27
<210> 62
<211> 22
<212> DNA
<213> 人工序列
<220>
<223>
<400> 62
tcctcatgta ctggtccctc at 22
<210> 63
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 63
aggcctgctg aaaatgactg a 21
<210> 64
<211> 25
<212> DNA
<213> 人工序列
<220>
<223>
<400> 64
gaattagctg tatcgtcaag gcact 25
<210> 65
<211> 27
<212> DNA
<213> 人工序列
<220>
<223>
<400> 65
gtgtatatac ttacttctcc ccctcct 27
<210> 66
<211> 22
<212> DNA
<213> 人工序列
<220>
<223>
<400> 66
cctcattcag ctctcggaac at 22
<210> 67
<211> 28
<212> DNA
<213> 人工序列
<220>
<223>
<400> 67
cctatcctga gtagtggtaa tctactgg 28
<210> 68
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 68
ccctttcttg cggagattct c 21
<210> 69
<211> 24
<212> DNA
<213> 人工序列
<220>
<223>
<400> 69
tctcctaggt tggctctgac tgta 24
<210> 70
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 70
cctggagtct tccagtgtga t 21
<210> 71
<211> 25
<212> DNA
<213> 人工序列
<220>
<223>
<400> 71
gcatcttatc cgagtggaag gaaat 25
<210> 72
<211> 18
<212> DNA
<213> 人工序列
<220>
<223>
<400> 72
cctcccagag accccagt 18
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223>
<400> 73
ctgtgggttg attccacacc 20
<210> 74
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 74
ctcaccatcg ctatctgagc a 21
<210> 75
<211> 19
<212> DNA
<213> 人工序列
<220>
<223>
<400> 75
gcattctggg acagccaag 19
<210> 76
<211> 19
<212> DNA
<213> 人工序列
<220>
<223>
<400> 76
tacggccagg cattgaagt 19
<210> 77
<211> 19
<212> DNA
<213> 人工序列
<220>
<223>
<400> 77
tcccataccc tctcagcgt 19
<210> 78
<211> 21
<212> DNA
<213> 人工序列
<220>
<223>
<400> 78
ccagaaggcg ggagacatat g 21