一种单链分子标签接头及单链DNA建库方法及其在检测循环
肿瘤DNA中应用
技术领域
本发明涉及生物医学技术领域,特别是一种单链分子标签接头及单链DNA建库方法及其在检测循环肿瘤DNA中应用。
背景技术
血浆游离DNA又称cfDNA(cell free DNA),是指外周中游离于细胞外的DNA,cfDNA的来源既包括正常细胞,也有异常细胞(如肿瘤细胞)或者外源的微生物(如病毒DNA),具体包括自身正常细胞代谢的凋亡小体,肿瘤细胞碎片,外泌体等。
循环肿瘤DNA(Circulating tumor DNA)ctDNA是指外周循环血中含有多种与癌症相关的突变基因,主要由肿瘤细胞脱落或凋亡后释放出而进入循环系统的DNA。ctDNA来自肿瘤细胞本身,是一种高度灵敏、特异性的特征性肿瘤生物标志物,可通过对其进行基因检测,进行定性、定量以及动态追踪观察肿瘤中发生突变的基因,从而为患者治疗前肿瘤分子分型、靶向治疗决策、治疗过程中肿瘤动态和负荷变化评估,以及实时监测治疗有效性等方面提供有效信息。来自宾夕法尼亚大学Abramson癌症中心的研究人员发现,与单独的实体组织NGS 检测相比,NGS液体活检能够识别出更多的非小细胞肺癌突变,帮助临床发现更多患者的靶向突变。在检测的靶向突变数量上,液体活检几乎是单独组织活检的两倍。此外,研究结果还表明,通过液体活检检测出靶向突变的患者,对靶向治疗的反应良好,86%的患者完全反应或部分反应,或保持稳定状态。“实体组织活检仍然是准确诊断的关键,但是我们现在已经证明,液体活检项目可以增加诊断价值,而且当实体组织活检无法进行时,它可以作为一种可行的替代方法”,研究作者Carpenter说道,“鉴于靶向治疗的快速发展,液体活检应该被纳入常规护理标准。”
然而,精确测序ctDNA存在三个巨大的技术障碍:首先是血浆中的ctDNA含量极低,且多为小片段分子特点,部分为受损伤的双链DNA和单链DNA,导致提取较为困难,损失量大,检测灵敏度较低,因此限制了其在临床上的应用。其次是由于后续的建库过程中经过末端修复、腺苷酸化、加接头以及PCR扩增等多步骤后,样本会损失更多,进一步限制了检测灵敏度,因此增加每步实验的效率对提高ctDNA的检出灵敏度都至关重要。最后,基于PCR方法的特意扩增或捕获,随着测序深度的提高而存在大量背景噪音,已严重限制了靶向测序技术在更高数据精度要求的检测。
对于某些低丰度,损伤的双链DNA和单链DNA的检测,以这些额外单链DNA作为模板的话可以显著增加目标DNA的模板量,有利于最终目的DNA捕获。Gansauge,M T等发明了一种单链DNA建库,该方法在单链模板和单链接头的连接步骤,使用的为Circ连接酶II。该方法解决的这种短片段易降解的古生物DNA的建库问题,但连接效率为较低,需要较长的连接时间,成本高。于是他们后续进行了优化,推出新版本ssDNA2.0,其更换了接头引物,同时将Circ连接酶II用常规的T4 DNA连接酶替换,模板用量降低、文库产量和富集度都有扩高,其成本降低近7倍。从建库的效率上来讲,单链建库建库要高很多,相对于基于454平台的双链建库效率要高6倍左右,测序深度高1.9倍左右。
ctDNA含量非常少,以10ml外周血为例,从中可以提取到cfDNA含量约30ng,ctDNA在所有cfDNA中的比例非常少,按1%计算,只有约300pg,也就是大约45个细胞裂解的DNA量,实际情况下,如果是做早期筛查,ctDNA的含量可能相当于5000个细胞中只有1-2个细胞是肿瘤细胞,所以对检测方法的敏感性要求非常高。
同时由于DNA的氧化损伤或脱氨基损伤、PCR扩增中DNA聚合酶引入的突变(每个碱基出现错误的概率在10-6~10-4之间),尤其是在第一轮扩增引入错误,以及测序仪器读取碱基时引入的错误,测序得到的每个碱基出现错误的概率在10-3~10-2之间,即每1000个碱基就会出现1 至10个错误碱基。因此,低于该频率的基因变异将无法准确检测。
目前,已经有针对超低频基因变异检测的建库测序方法,主要是在原始双链DNA分子模板两端引入分子标签序列unique molecular identifiers(UMI)。根据这些分子标签,可以在去除冗余的过程中将PCR和测序等过程中带来的系统突变排除掉,可以大大降低低频突变的假阳性率。已有大量文章或商业化产品引入分子标签技术。在没有分子条形码技术之前,受制于常规技术的局限,二代测序的用户通常将变异检测域值设置为3-5%的等位基因频率,而SureSelect XT HS大大提高了变异检出的灵敏度,可以检测突变频率<1%的稀有变异。
因此,需要结合上面的两项技术,对现有的超低频基因变异检测的建库测序方法进行改进,以提高对超低频基因变异检测的灵敏度,本发明解决这样的问题。
发明内容
为解决现有技术的不足,本发明的目的在于提供一种单链分子标签接头及单链DNA建库方法及其在检测循环肿瘤DNA中应用,本发明通过单链DNA建库,解决现有检测技术中对液态活检特别是ctDNA片段短、浓度低、碎片化、灵敏度低技术问题;其次基于分子标签技术和单链文库建库特点,实现准确辨别基因组坐标始末位点相同的测序reads是来自同一还是多个原始细胞释放出来的cfDNA,并将来源于同一个细胞的原始正负链的测序reads配对起来分析的目的,从而降低测序重复工作,提高对假阳性突变的分辨率。
为了实现上述目标,本发明采用如下的技术方案:
一种单链分子标签接头,包括:14个碱基配对形成的茎结构、测序引物序列、和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“U”脱氧尿嘧啶核苷,该单链核酸序列经退火变性会形成茎环结构。
一种单链DNA建库方法,包括如下步骤:
3’末端接头的制备;
5’末端接头的制备;
样本核酸在磷酸酶的作用下去磷酸化及变性处理:高温处理,将原来双链的DNA变性为单链DNA;
3’端接头连接:将单链DNA产物和3’端双链DNA接头进行碱基配对,并头进行连接反应;
3’端接头连接链霉亲和素:将连接反应得到的连接产物通过链霉亲和素磁珠进行吸附,固定在链霉亲和素磁珠上;
延伸:将连接过链霉亲和素的单链连接产物为模板,将3’末端接头作为引物进行延伸,获得双链DNA产物;
5’端接头连接:将双链DNA产物和5’端双链DNA接头进行分子间的双链连接;
链霉亲和素清洗及文库洗脱回收。
前述的一种单链DNA建库方法,
3’末端接头的制备的具体过程如下:
制备PCR试剂,PCR试剂的配方包括:
用移液器将PCR试剂混匀,瞬时离心将样品收集至管底,再将样品置于PCR仪中,PCR 程序如下:
95℃ 1min,
95℃-10℃ -0.1℃/sec,
10℃ 5min。
前述的一种单链DNA建库方法,
上链序列采用CL78(SEQ ID NO.1),序列为:
5’Pho-AGATCGGAAG[C3Spacer]10-TEG-biotin3’,该接头序列5’端磷酸化修饰,3’端生物素化修饰,中间引入10个C3相隔臂和TEG分子;
下链序列采用CL93(SEQ ID NO.2),序列为:
5’AmC12-AACTTCCGATCTNNNNNN-AmC7 3’,该接头序列5’端采用amino linker C12修饰,3’端含有6个随机核苷酸组成简并碱基,且末端amino linker C7修饰;
下链序列采用CL106(SEQ ID NO.3),序列为:
5’AmC12-AACTTCCGATCTNNNNNN-AmC3 3’,3’端含有6个随机核苷酸组成简并碱基,且末端amino linker C3修饰;
下链序列采用CL110(SEQ ID NO.4),序列为:
5’SpacerC12-AA[SpacerC12]CTTCCGATCTNNNNNN-AmC6 3’,5’端和中间含有aminolinker C12修饰,3’端含有8个随机核苷酸组成简并碱基,且末端amino linker C6修饰;
下链序列采用CL136(SEQ ID NO.5),序列为:
5’SpacerC12-AA[SpacerC12]CTTCCGATCTNNNNNNN-AmC6 3’,5’端和中间含有amino linker C12修饰,3’端含有7个随机核苷酸组成简并碱基,且末端amino linker C6修饰;
下链序列采用CL137(SEQ ID NO.6),序列为:
5’SpacerC12-AA[SpacerC12]CTTCCGATCTNNNNNNNN-AmC6 3’,5’端和中间含有amino linker C12修饰,3’端含有8个随机核苷酸组成简并碱基,且末端amino linker C6修饰。
前述的一种单链DNA建库方法,
5’末端接头的制备的具体过程如下:
PCR试剂包括:
用移液器将PCR试剂混匀,瞬时离心将样品收集至管底,再将样品置于PCR仪中,PCR 程序如下:
95℃ 1min,
95℃-14℃ -0.1℃/sec,
14℃ 5min。
前述的一种单链DNA建库方法,
上链序列或下链序列为:接头序列Bell_adatpor或接头序列Bell_TA_adapter;
Bell_adatpor的序列为:
5’GAGCACACGTCTGATANNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAUATCTCTCTCAGAC GTGTGCTC 3'(SEQ ID NO.9),
Bell_adatpor的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“U”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成平末端的茎环结构;
Bell_TA_adapter的序列为:
5’GAGCACACGTCTGATANNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAUATCTCTCTCA GACGTGTGCTCT 3'(SEQ ID NO.10),
Bell_TA_adapter的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“U”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成带T的粘末端茎环结构。
前述的一种单链DNA建库方法,
上链序列采用CL53(SEQ ID NO.7),序列为:5’CGACGCTCTTC-ddC3',3'端双脱氧修饰;
下链序列采用CL73(SEQ ID NO.8),序列为:
5’Pho-GGAAGAGCGTCGTGTAGGGAAAGAG*T*G*T*A 3',3'端末位4个碱基硫代修饰。
前述的一种单链DNA建库方法,
延伸的具体过程如下:
配制延伸反应液,延伸反应液的配方包括:
将具有连接过链霉亲和素的单链连接产物的磁珠加入延伸反应液,再加入2~5μl聚合酶,混匀,瞬时离心将样品收集至管底,再将样品置于PCR仪中,PCR程序如下:
25℃ 5min,
35℃ 25min;
洗涤,移除上清;
聚合酶采用Klenow fragment或Klenow fragment exo-。
前述的一种单链DNA建库方法,
3’末端接头的制备;
5’末端接头的制备;
样本核酸在磷酸酶的作用下去磷酸化及变性处理:高温处理,将原来双链的DNA变性为单链DNA;
3’端接头连接:将单链DNA产物和3’端双链DNA接头进行碱基配对,并头进行连接反应;
3’端接头连接链霉亲和素:将连接反应得到的连接产物通过链霉亲和素磁珠进行吸附,固定在链霉亲和素磁珠上;
延伸:将连接过链霉亲和素的单链连接产物为模板,3’端接头已知序列设计引物进行延伸,获得双链DNA产物;
5’端接头连接:将双链DNA产物和5’端双链DNA接头进行分子间的双链连接;
去除脱氧尿嘧啶核苷;
链霉亲和素清洗及文库洗脱回收。
一种单链分子标签接头在检测循环肿瘤DNA中的应用,包括如下内容:
提取检测血浆中游离的cfDNA;
3’末端接头的制备;
采用单链分子标签接头进行5’末端接头的制备,所述单链分子标签接头,包括:14个碱基配对形成的茎结构、测序引物序列、和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“U”脱氧尿嘧啶核苷,该单链核酸序列经退火变性会形成茎环结构;
样本核酸在磷酸酶的作用下去磷酸化及变性处理:高温处理,将原来双链的DNA变性为单链DNA;
3’端接头连接:将单链DNA产物和3’端双链DNA接头进行碱基配对,并头进行连接反应;
3’端接头连接链霉亲和素:将连接反应得到的连接产物通过链霉亲和素磁珠进行吸附,固定在链霉亲和素磁珠上;
延伸:将连接过链霉亲和素的单链连接产物为模板,3’端接头已知序列设计引物进行延伸,获得双链DNA产物;
5’端接头连接:将双链DNA产物和5’端双链DNA接头进行分子间的双链连接;
链霉亲和素清洗及文库洗脱回收。
本发明的有益之处在于:
本发明提供了针对液态活检特别是cfDNA二代测序文库构建时,有效回收单链和受损伤的模板DNA,进行独特的单链建库的二代测序文库构建。现在的cfDNA二代测序技术,绝大部分用常规的双链DNA文库构建的方法,只能够检测没有受损伤的双链DNA,本发明的方法通过单链建库的方法成功实现单链和受损伤的cfDNA的建库,同时模板用量降低、文库产量和富集度都有扩高。
本发明通过单链建库,将起始模板放大,可以用于10-100个位点甚至1000个位点的靶向捕获/靶向扩增。同时,由于cfDNA断裂的随机性,基于单链建库后,通过正反引物配合通用引物,能很大程度提供捕获的效率,特别是基于PCR方法特意扩增捕获,单侧引物结合概率是双侧引物结合概率的一倍。
本发明提供了8个随机核苷酸分子标签接头,基因组坐标始末位点相同的DNA片段加上完全相同的8个随机核苷酸分子标签接头的概率极低,那么对于基因组坐标始末位点相同的测序reads,就很容易判断它们来自同一还是多个原始细胞释放出来的cfDNA,从而降低测序重复工作。同时,对单一单链文库进行建库,可以有效的将来自同一个双链DNA模板的正链和负链匹配,排除PCR导致的错误,提高了对假阳性的分辨率,从而保证了对cfDNA中超低频突变的检测能力并矫正其扩增错误和测序错误。经过分子标签技术、背景去噪和正负链修正结合去噪之后,其背景噪音降到万分之一,且可以检测突变频率为0.02%的样本,与目前基于杂交探针法捕获技术检测灵敏度相当(即0.02%-0.05%)。因此,能有效地降低大量背景噪音,降低假阳性率、提高结果的准确性。
附图说明
图1为核酸序列Bell_adaptor退火后二级结构图;
图2为核酸序列Bell_TA_adaptor退火后二级结构图;
图3为线性5’末端接头构建文库的流程图,其中Single strand dissociation为单链变性之后再Dephosphorylation(去磷酸化),经过Primer annealing(引物退火)及T4DNA ligase(T4 DNA 连接酶)连接,然后固定到Streptavidin magnetic beads(链霉亲的磁珠),后续经Primer annealing(引物退火)及Klenow fragmen的amplification(扩增过程),形成双链,与亚玲结构的接头(8-nt barcode),在T4 DNA连接酶(T4 DNA ligase)将接头连接上去,5端接头被User酶(User digestion)移除U碱基,最后用P5/P7引物扩增文库(P5primer/P7primer);
图4为茎环接头构建的平末端文库的流程图,其中Single strand dissociation为单链变性之后再Dephosphorylation(去磷酸化),经过Primer annealing(引物退火)及T4 DNA ligase(T4 DNA 连接酶)连接,然后固定到Streptavidin magnetic beads(链霉亲的磁珠),后续经Primer annealing(引物退火)及Klenow fragmen的amplification(扩增过程),形成双链,与亚玲结构的接头(8-nt barcode),在T4 DNA连接酶(T4 DNA ligase)将接头连接上去,5端接头被User酶(User digestion)移除U碱基,最后用P5/P7引物扩增文库(P5primer/P7primer);
图5为茎环接头构建的TA连接文库的流程图,其中Single strand dissociation为单链变性之后再Dephosphorylation(去磷酸化),经过Primer annealing(引物退火)及T4 DNA ligase(T4 DNA 连接酶)连接,然后固定到Streptavidin magnetic beads(链霉亲的磁珠),后续经Primer annealing(引物退火)及Klenow fragmen的amplification(扩增过程),形成双链,与亚玲结构的接头(8-nt barcode),在T4 DNA连接酶(T4 DNA ligase)将接头连接上去,5端接头被User酶(User digestion)移除U碱基,最后用P5/P7引物扩增文库(P5primer/P7primer);
图6为基于单链文库构建的文库大小分布图,其中横坐标为样本迁移的时间(Migration time),纵坐标是为样本的荧光信号(RFU);
图7为线性5’末端接头构建文库read覆盖度全图;
图8为茎环接头构建的平末端文库read覆盖度全图;
图9为茎环接头构建的TA连接文库read覆盖度全图;
图10为本发明实验三中ddPCR和单链建库等位基因突变频率比较示意图,其中横坐标为数字PCR检测到的突变频率(multant Frequence(%)),纵坐标是为基于NGS检测到的突变频率 (multant Frequence(%));
图11为本发明实验四中来源于血浆中游离的ctDNA经单链建库,靶向扩增后的文库与来源于肿瘤基因组(tumor DNA,tDNA)的10个位点的突变信息比对结果图,其中横坐标为基因,纵坐标为突变频率。
具体实施方式
以下结合附图和具体实施例对本发明作具体的介绍。
一种单链分子标签接头,包括:14个碱基配对形成的茎结构、测序引物序列、和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“U”脱氧尿嘧啶核苷,该单链核酸序列经退火变性会形成茎环结构。
作为一种实施例,包括:Bell_adatpor和Bell_TA_adapter;
Bell_adatpor的序列为:
5’GAGCACACGTCTGATANNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAUATCTCTCTCAGAC GTGTGCTC 3'(SEQ ID NO.9),
Bell_adatpor的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“U”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成平末端的茎环结构;如图1为核酸序列Bell_adaptor退火后二级结构图。
Bell_TA_adapter的序列为:
5’GAGCACACGTCTGATANNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAUATCTCTCTCA GACGTGTGCTCT 3'(SEQ ID NO.10),
Bell_TA_adapter的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“U”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成带T的粘末端茎环结构,图2为核酸序列Bell_TA_adaptor退火后二级结构图。
作为一种实施例,如下演示一种单链DNA建库方法,包括如下步骤:
一,3’末端接头的制备
用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,按以下程序操作。
需要说明的是:上文只是一种实施例,上链序列和下链序列还可以采用如下所示的实施例;
上链序列采用CL78(SEQ ID NO.1),序列为:
5’Pho-AGATCGGAAG[C3Spacer]10-TEG-biotin3’,该接头序列5’端磷酸化修饰,3’端生物素化修饰,中间引入10个C3相隔臂和TEG分子;
下链序列采用CL93(SEQ ID NO.2),序列为:
5’AmC12-AACTTCCGATCTNNNNNN-AmC7 3’,该接头序列5’端采用amino linker C12修饰,3’端含有6个随机核苷酸组成简并碱基,且末端amino linker C7修饰;
下链序列采用CL106(SEQ ID NO.3),序列为:
5’AmC12-AACTTCCGATCTNNNNNN-AmC3 3’,3’端含有6个随机核苷酸组成简并碱基,且末端amino linker C3修饰;
下链序列采用CL110(SEQ ID NO.4),序列为:
5’SpacerC12-AA[SpacerC12]CTTCCGATCTNNNNNN-AmC6 3’,5’端和中间含有aminolinker C12修饰,3’端含有8个随机核苷酸组成简并碱基,且末端amino linker C6修饰;
下链序列采用CL136(SEQ ID NO.5),序列为:
5’SpacerC12-AA[SpacerC12]CTTCCGATCTNNNNNNN-AmC6 3’,5’端和中间含有amino linker C12修饰,3’端含有7个随机核苷酸组成简并碱基,且末端amino linker C6修饰;
下链序列采用CL137(SEQ ID NO.6),序列为:
5’SpacerC12-AA[SpacerC12]CTTCCGATCTNNNNNNNN-AmC6 3’,5’端和中间含有amino linker C12修饰,3’端含有8个随机核苷酸组成简并碱基,且末端amino linker C6修饰。
二,5’末端接头的制备
上链序列采用CL53(SEQ ID NO.7),序列为:5’CGACGCTCTTC-ddC3',3'端双脱氧修饰;
下链序列采用CL73(SEQ ID NO.8),序列为:
5’Pho-GGAAGAGCGTCGTGTAGGGAAAGAG*T*G*T*A 3',3'端末位4个碱基硫代修饰。
优选接头序列Bell_adatpor,优选接头序列Bell_TA_adatpor,
上链序列或下链序列为:接头序列Bell_adatpor或接头序列Bell_TA_adapter;
Bell_adatpor的序列为:
5’GAGCACACGTCTGATANNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAUATCTCTCTCAGAC GTGTGCTC 3'(SEQ ID NO.9),
Bell_adatpor的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“U”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成平末端的茎环结构;
Bell_TA_adapter的序列为:
5’GAGCACACGTCTGATANNNNNNNNAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAUATCTCTCTCA GACGTGTGCTCT 3'(SEQ ID NO.10),
Bell_TA_adapter的序列包含14个碱基配对形成的茎结构、测序引物序列和8个随机核苷酸组成的分子标签序列,其中测序引物序列与茎结构序列之间插入了一位碱基为“U”脱氧尿嘧啶核苷,该单链核酸序列经退火后形成带T的粘末端茎环结构。
其体系如下:
用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,按以下程序操作。
三,样本核酸在磷酸酶的作用下去磷酸化及变性处理;
用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,按以下程序操作。
立即冰浴。
四,3’端接头连接;
用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,37℃反应1小时。
五,3’端接头连接链霉亲和素;
取20μl的MyOne C1磁珠(Thermo Fisher Scientific),用500μl的1×BWT+SDS缓冲液(1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH 8.0),0.05%Tween-20,0.5%SDS)清洗2遍,最后用250μl的1×BWT+SDS悬浮,将上述连接产物加入到磁珠中,于37℃反应20min。反应结束之后,于磁力架上移除上清,加入0.1×BWT+SDS(0.1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH 8.0),0.05%Tween-20,0.5%SDS)洗涤一次,并去除上清,加入100μl 0.1×SSC+SDS 缓冲液(15mM NaCl,100mM Sodium Citrate,0.1%SDS)洗涤一次,并去除上清。最后用200μl 0.1×BWT(0.1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH8.0),0.05%Tween-20)悬浮,于磁力架上移除上清。
六,延伸;
配制延伸反应液
其中CL130序列为5’GTGACTGGAGTTCAGACGTGTGCTCTTCC*GA*TC*T 3'(SEQ IDNO.11),3'端末位4个碱基硫代修饰。将上述得到的磁珠中加入延伸反应液,于65℃反应2min,后立即冰浴2-5min,加入2μl Klenow fragment(10U/μl),作为一种优选,延伸反应的聚合酶可以选用Klenow fragment(Thermo Fisher Scientific),也可以选用Klenowfragment exo-(Thermo Fisher Scientific)。用移液器轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,按以下程序操作。
反应结束之后,于磁力架上移除上清,加入0.1×BWT+SDS(0.1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH 8.0),0.05%Tween-20,0.5%SDS)洗涤一次,并去除上清,加入100μl 0.1×SSC+SDS缓冲液(15mM NaCl,100mM Sodium Citrate,0.1%SDS)洗涤一次,并去除上清。最后用200μl 0.1×BWT(0.1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH8.0),0.05% Tween-20)悬浮,于磁力架上移除上清。
七,5’端接头连接;
配制延伸反应液
用移液器移入上述磁珠中,并轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于 PCR仪中,22℃反应1h。
反应结束之后,于磁力架上移除上清,加入0.1×BWT+SDS(0.1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH 8.0),0.05%Tween-20,0.5%SDS)洗涤一次,并去除上清,加入100μl 0.1×SSC+SDS缓冲液(15mM NaCl,100mM Sodium Citrate,0.1%SDS)洗涤一次,并去除上清。最后用200μl 0.1×BWT(0.1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH8.0),0.05% Tween-20)悬浮,于磁力架上移除上清。
八,去除脱氧尿嘧啶核苷,优选NEB的USER酶(NEB China,M5505S)。
往步骤七的离心管中加入5μl的10×CutSmart,并加入43μl双蒸水,并轻轻吹打混匀。瞬时离心将样品收集至管底,加入2μl的User酶,37℃反应30min。反应结束之后,于磁力架上移除上清,加入0.1×BWT+SDS(0.1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH8.0),0.05%Tween-20,0.5%SDS)洗涤一次,并去除上清,加入100μl 0.1×SSC+SDS缓冲液(15 mM NaCl,100mM Sodium Citrate,0.1%SDS)洗涤一次,并去除上清。最后用200μl 0.1×BWT (0.1M NaCl,10mM Tris-HCl(pH 8.0),1mM EDTA(pH 8.0),0.05%Tween-20)悬浮,于磁力架上移除上清。
九,文库洗脱回收;
往磁珠中加入50μl的EBT(10mM Tris-HCl(pH 8.0),0.05%Tween-20)轻轻吹打混匀,将样品置于PCR仪中,95℃反应1min,于磁力架上吸取上清保存,即为文库。
如图3-4所示,△实验一,应用分子标签接头进行cfDNA文库构建及检测,且对比使用3 种5’末端接头,双链接头CL53/CL73,Bell_adaptor,Bell_TA_adaptor,得到的cfDNA文库的 Barcode数,验证本发明的单链分子标签接头能够使得文库具有优秀的覆盖率。
实验过程如下所示:
1.cfDNA的提取:
根据QIAGEN公司提供的QIAamp Circulating Nucleic Acid Kit(50)试剂盒的使用说明书,使用该试剂盒对血浆中游离的cfDNA进行提取。
2.cfDNA文库的构建:
参考上文实施例,将步骤3的DNA变成cfDNA,即
反应制备3份,分别用于3种5’末端接头,即双链接头CL53/CL73,Bell_adaptor,Bell_TA_adaptor。其它步骤同其中实施例1,步骤7)结束之后,Bell_adaptor和Bell_TA_adaptor 两种文库,增加一个步骤:脱氧尿嘧啶核苷的去除,优选NEB的USER酶(NEB China,M5505S)。构建出三种cfDNA文库,即平端cfDNA文库,Bell平端cfDNA文库,Bell_TA_cfDNA文库。
3.文库质检:
以文库分子为模板,进行PCR扩增,PCR体系如下
SEQ ID NO.12:
ACACTCTTTCCCTACACGAC;
SEQ ID NO.13:
GTGACTGGAGTTCAGAGTGT;
PCR反应程序:
PCR产物进行片段分析仪Qsep100进行分析,结果如图6,片段大小270bp左右,符合预期大小。
4.上机测序:
按照illumina novaSeq 6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。
通过illumina测序仪对PCR产物进行测序,每个样本测序深度大约10层,50G数据量。
实验结果分析:从图7-9中可以看出文库具有良好的均一性和全基因组read覆盖度。其中又对Bell平端cfDNA文库,Bell_TA cfDNA文库的Barcode数进行了统计,分别为87581个和 98845个,在均一性和全基因组read覆盖度相似的情况下,Bell_TA cfDNA文库的Barcode数优于 Bell平端cfDNA文库的Barcode数,后续接头优选Bell_TA的。
△实验二,对检测方法的检测限进行测试;
应用分子标签接头进行超低频基因变异检测过程如下:
使用标准品cell-Free DNA reference standard(苏州安可济生物科技有限公司, AGSTD-SZ-TP-01)进行验证,其含有突变频率5%,1%,0.1%和0%核酸分子,核酸片段大小为 150bp±10%(135~165bp)。模板信息如下:
本实施案例对检测方法的检测限进行测试,按照以下步骤进行
1.低频突变标准品准备
使用上述cfDNA标准品进行EGFR基因21外显子位点检测,突变频率分别为0%、0.1%、 1%、5%,分别命名为:S0、S1、S2、S3。
2.文库构建
S0、S1、S2、S3分别安排实施例2中的建库方法进行单链文库构建,构建起始模板量为 30ng,采用Bell_TA_adapter接头作为5’末端接头。
3.文库的定量
按照Qubit dsDNA HS Assay Kit(Thermo Fisher Scientific,Q32854)说明书进行操作,测定文库的浓度。
4.靶位点的PCR扩增
设计合成858位点正向引物5EGFR858F(SEQ ID NO.14)及反向引物3EGFR858R(SEQID NO.15)、790位点正向引物5EGFR790F(SEQ ID NO.16)及反向引物3EGFR790R(SEQ IDNO.17)、750位点正向引物5EGFR750F(SEQ ID NO.18)及反向引物3EGFR750R(SEQ IDNO.19)。
以构建的单链文库为模板,进行靶向扩增,PCR体系如下:
每个位点分别用相应的F引物或R引物扩增一管,轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,PCR程序如下:
PCR结束之后,取1μlPCR产物作第二轮接头特异性扩增,PCR体系如下
P7引物中含有不同的index序列,区别不同样本。其中同一个突变频率的样本用同一个 index序列,同时同一突变频率的正负链引物扩增的样本,也以不同的index区分开。
轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,PCR程序如下:
使用60μl Ampure XP beads(Beckman,A63881)进行纯化,30μl Elution缓冲液洗脱;
5.文库的质检与定量
按照KAPA Library Quantifcation Kit(Kapa biosystems,Cat No.KK4854)
说明书进行操作,使用伯乐CFX 96Touch实时荧光定量PCR仪检测,参试剂盒里的标准品进行文库浓度的绝对定量。建库文库达到上机要求浓度,可用于上机测试。
6.上机测序:
按照illumina novaSeq 6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的特异性,分析结果见下表:
其中F或R代表以正向引物或反向引物构建的文库。
同时分析了样本的突变频率检测情况,如下表:
实验结果分析:经过分子标签技术、背景去噪和正负链修正结合去噪之后,其背景噪音降到万分之一,测定数据与理论数据一致性达95%以上;且可以检测突变频率为0.1%以上的样本,说明采用单链DNA建库的方法灵敏度高。
实验三,ddPCR和单链建库等位基因突变频率比较实验;
应用分子标签接头进行多位点的超低频基因变异检测过程如下:
本实施例以以下基因突变为例对本发明进行验证:EGFR基因突变c.2573T>G,p.L858R、c.2369C>T,T790M、del E746-A750;KRAS基因突变c.34G>T,p.G12C;NRAS 基因突变c.35G>A,p.G12D,NRAS基因突变c.182A>G,p.Q61R;BRAF基因突变c.1799T >A,p.V600E;PIK3CA基因突变c.1624G>A,p.E542K,PIK3CA基因突变c.3140A>G, p.H1074R,具体信息如下:
1.样本制备与验证:将上述8株细胞系及野生型细胞株NCI-H596,将所有突变
位点均经sanger测序鉴定。将上述突变型DNA(除A549和NCI-H2347以外)分别用野生型DNA 稀释成40%的比例,将A549和NCI-H2347基因组DNA用野生型DNA稀释成80%的比例,然后八种稀释好的DNA按1∶1∶1∶1∶1∶1∶1∶1的比例混合,使得每一种突变型DNA的比例均为10%,接着用野生型DNA倍比稀释使得最终突变型与野生型的比例为1∶100,1∶1000, 1∶10000,配制野生型的DNA做为对照,比例定为100%,并混合好的比例的DNA经covaris S220打断至200~300bp,分别为S0,S1,S2,S3。4个浓度比例DNA,对9个位点的突变频率进行数字PCR和二代测序验证,其位点突变频率为1%均值(三个重复)是1%±40%,位点突变频率小于1%均值(三个重复)是突变频率±50%。
2.单链文库的构建
3种浓度(S0,S1,S2,)比例分别安排实施例2中的建库方法进行单链文库构建,构建起始模板量为30ng,采用Bell_TA_adapter接头作为5’末端接头。
3.文库的定量
按照Qubit dsDNA HS Assay Kit(Thermo Fisher Scientific,Q32854)说明书进行操作,测定文库的浓度。
4.靶位点引物设计与PCR扩增
设计合成10个位点的正反引物,其引物名称和引物序列如下:
上述引物均不包括P7端部分接头序列
GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,实际引物合成时会在引物5’端加上上述P7端部分接头序列。同时,DCK9和PPDPF两个位点为内参对照,其在三个文库中突变频率为100%,作为体系的假阳性内参对照。
以构建的单链文库为模板,进行靶向扩增,PCR体系如下:
SEQ ID NO.20:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGAT CT;
每管分别用相应的10个位点正向引物池F引物或反向引物池R引物各扩增一管,轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,PCR程序如下:
PCR结束之后,取1μlPCR产物作第二轮接头特异性扩增,PCR体系如下
SEQ ID NO.20:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGAT CT;
SEQ ID NO.21:
CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCT CTTCC;
P7引物中含有不同的index序列,区别不同样本。其中同一个突变频率的样本用同一个index序列,同时同一突变频率的正负链引物扩增的样本,也以不同的index区分开。
轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,PCR程序如下:
使用60μl Ampure XP beads(Beckman,A63881)进行纯化,30μl Elution缓冲液洗脱;
7.文库的质检与定量
按照KAPA Library Quantifcation Kit(Kapa biosystems,Cat No.KK4854)
说明书进行操作,使用伯乐CFX 96Touch实时荧光定量PCR仪检测,参试剂盒里的标准品进行文库浓度的绝对定量。建库文库达到上机要求浓度,可用于上机测试。
8.上机测序:
按照illumina novaSeq 6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的。
实验结果:
对NGS的结果进行BWA比对,标准品的实际基因突变频率的实验结果如下表和图10所示:
与标准品的实际基因突变频率比较如图10:
结果分析:经过分子标签技术、背景去噪和正负链修正结合去噪之后,其背景噪音降到万分之一,测定数据与理论数据一致性达95%以上,且可以检测突变频率为0.02%的样本,能达到数字PCR检测的灵敏度,同时跟目前基因杂交探针法捕获技术检测灵敏度相当(即 0.02%-0.05%)。设定了两个内参基因,排除建库过程中存在假阴性的结果。同时,基于NGS 的适用性及单次单价方面均比数据PCR存在优势。
△实验四,ctDNA经单链建库靶向扩增后的文库与来源于肿瘤基因组(tumor DNA,tDNA) 的10个位点的突变信息进行比对实验:
应用分子标签接头进行临床样本基因变异检测的过程如下:
1.检测样本DNA的提取:
收集临床10例肺癌组织样本及对应血液样本,组织样本DNA提取和QIAGEN公司提供的DNeasy Blood&Tissue Kit,按照提取试剂盒的说明书进行操作。血液cfDNA提取根据QIAGEN公司提供的QIAamp Circulating Nucleic Acid Kit(50)试剂盒的使用说明书进行操作。提取得到的组织DNA用Nanodrop检测OD260/OD280应介于1.8~2.1,血液游离DNA片段大小用2100检测,片段在150~200bp,血液游离DNA用Qubit 2.0定量。
2.单链文库的构建
血液游离DNA分别安排实施例2中的建库方法进行单链文库构建,构建起始模板量为20 ng,采用Bell_TA_adapter接头作为5’末端接头。
3.文库的定量
按照Qubit dsDNA HS Assay Kit(Thermo Fisher Scientific,Q32854)说明书进行操作,测定文库的浓度。
4.靶位点引物设计与PCR扩增
设计合成10个位点的正反引物,其引物名称和引物序列如下:
上述引物均不包括P7端部分接头序列GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,实际引物合成时会在引物5’端加上上述P7端部分接头序列。同时,DCK9和PPDPF两个位点为内参对照,其在四个文库中突变频率为100%,作为体系的假阳性内参对照。
以构建的单链文库为模板,进行靶向扩增,PCR体系如下:
每管分别用相应的10个位点正向引物池F引物或反向引物池R引物各扩增一管,轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,PCR程序如下:
PCR结束之后,取1μlPCR产物作第二轮接头特异性扩增,PCR体系如下
P7引物中含有不同的index序列,区别不同样本。其中同一个突变频率的样本用同一个 index序列,同时同一突变频率的正负链引物扩增的样本,也以不同的index区分开。
轻轻吹打混匀。瞬时离心将样品收集至管底,将样品置于PCR仪中,PCR程序如下:
使用60μl Ampure XP beads(Beckman,A63881)进行纯化,30μl Elution缓冲液洗脱;
9.文库的质检与定量
按照KAPA Library Quantifcation Kit(Kapa biosystems,Cat No.KK4854)
说明书进行操作,使用伯乐CFX 96Touch实时荧光定量PCR仪检测,参试剂盒里的标准品进行文库浓度的绝对定量。建库文库达到上机要求浓度,可用于上机测试。
10.上机测序:
按照illumina novaSeq 6000测序仪操作流程进行文库变性、稀释以及150bp双端测序。将高通量测序下机数据经过质控过滤后,进行BWA比对,用于评估文库的。
将来源于血浆中游离的ctDNA经单链建库,靶向扩增后的文库与来源于肿瘤基因组 (tumor DNA,tDNA)的10个位点的突变信息进行比对,结果如下表和图11所示,
结果分析:根据上表和图11可知,将分子标签技术、背景去噪和正负链修正结合,其检测血液的ctDNA突变信息跟其肿瘤样本的体细胞突变一致性,其中NRAS_12能检测到1.2%,而且内参基因位点其去噪音之后,其突变率低于0.06%。
本发明通过单链DNA建库,解决现有检测技术中对液态活检特别是ctDNA片段短、浓度低、碎片化、灵敏度低技术问题;其次基于分子标签技术和单链文库建库特点,实现准确辨别基因组坐标始末位点相同的测序reads是来自同一还是多个原始细胞释放出来的cfDNA,并将来源于同一个细胞的原始正负链的测序reads配对起来分析的目的,从而降低测序重复工作,提高对假阳性突变的分辨率。
以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围内。
序列表
<110> 杭州纽安津生物科技有限公司
<120> 一种单链分子标签接头及单链DNA建库方法及其在检测循环肿瘤DNA中应用
<141> 2019-02-11
<160> 21
<170> SIPOSequenceListing 1.0
<210> 1
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (0)..(1)
<223> Pho
<220>
<221> prim_transcript
<222> (10)..(10)
<223> [C3Spacer]10-TEG-biotin
<400> 1
agatcggaag 10
<210> 2
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (0)..(1)
<223> AmC12
<220>
<221> prim_transcript
<222> (18)..(18)
<223> AmC7
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (15)..(15)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (17)..(17)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, t or u
<400> 2
aacttccgat ctnnnnnn 18
<210> 3
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (0)..(1)
<223> AmC12
<220>
<221> prim_transcript
<222> (18)..(18)
<223> AmC3
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (15)..(15)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (17)..(17)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, t or u
<400> 3
aacttccgat ctnnnnnn 18
<210> 4
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (0)..(1)
<223> SpacerC12-AA[SpacerC12]
<220>
<221> prim_transcript
<222> (18)..(18)
<223> AmC6
<220>
<221> misc_feature
<222> (11)..(11)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (15)..(15)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, t or u
<400> 4
cttccgatct nnnnnn 16
<210> 5
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (0)..(1)
<223> SpacerC12-AA[SpacerC12]
<220>
<221> prim_transcript
<222> (19)..(19)
<223> AmC6
<220>
<221> misc_feature
<222> (11)..(11)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (15)..(15)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (17)..(17)
<223> n is a, c, g, t or u
<400> 5
cttccgatct nnnnnnn 17
<210> 6
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (0)..(1)
<223> SpacerC12-AA[SpacerC12]
<220>
<221> prim_transcript
<222> (20)..(20)
<223> AmC6
<220>
<221> misc_feature
<222> (11)..(11)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (13)..(13)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (15)..(15)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (17)..(17)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, t or u
<400> 6
cttccgatct nnnnnnnn 18
<210> 7
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (12)..(12)
<223> ddC
<400> 7
cgacgctctt c 11
<210> 8
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (0)..(1)
<223> Pho
<220>
<221> prim_transcript
<222> (25)..(26)
<223> *
<220>
<221> prim_transcript
<222> (26)..(27)
<223> *
<220>
<221> prim_transcript
<222> (27)..(28)
<223> *
<220>
<221> prim_transcript
<222> (28)..(29)
<223> *
<400> 8
ggaagagcgt cgtgtaggga aagagtgta 29
<210> 9
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (58)..(59)
<223> u
<220>
<221> misc_feature
<222> (17)..(17)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (19)..(19)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (20)..(20)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, t or u
<400> 9
gagcacacgt ctgatannnn nnnnagatcg gaagagcgtc gtgtagggaa agagtgtaat 60
ctctctcaga cgtgtgctc 79
<210> 10
<211> 80
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (58)..(59)
<223> u
<220>
<221> misc_feature
<222> (17)..(17)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (18)..(18)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (19)..(19)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (20)..(20)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (21)..(21)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (22)..(22)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (23)..(23)
<223> n is a, c, g, t or u
<220>
<221> misc_feature
<222> (24)..(24)
<223> n is a, c, g, t or u
<400> 10
gagcacacgt ctgatannnn nnnnagatcg gaagagcgtc gtgtagggaa agagtgtaat 60
ctctctcaga cgtgtgctct 80
<210> 11
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<221> prim_transcript
<222> (29)..(30)
<223> *
<220>
<221> prim_transcript
<222> (31)..(32)
<223> *
<220>
<221> prim_transcript
<222> (33)..(34)
<223> *
<400> 11
gtgactggag ttcagacgtg tgctcttccg atct 34
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 12
acactctttc cctacacgac 20
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 13
gtgactggag ttcagagtgt 20
<210> 14
<211> 57
<212> DNA
<213> Artificial Sequence
<400> 14
gtgactggag ttcagacgtg tgctcttccg atctacaccg cagcatgtca agatcac 57
<210> 15
<211> 59
<212> DNA
<213> Artificial Sequence
<400> 15
gactggagtt cagacgtgtg ctcttccgat ctgcctcctt ctgcatggta ttctttctc 59
<210> 16
<211> 55
<212> DNA
<213> Artificial Sequence
<400> 16
gtgactggag ttcagacgtg tgctcttccg atctgctggg catctgcctc acctc 55
<210> 17
<211> 58
<212> DNA
<213> Artificial Sequence
<400> 17
gtgactggag ttcagacgtg tgctcttccg atcgacatag tccaggaggc agccgaag 58
<210> 18
<211> 59
<212> DNA
<213> Artificial Sequence
<400> 18
gtgactggag ttcagacgtg tgctcttccg atctgtgaga aagttaaaat tcccgtcgc 59
<210> 19
<211> 59
<212> DNA
<213> Artificial Sequence
<400> 19
gtgactggag ttcagacgtg tgctcttccg atcttcacat cgaggatttc cttgttggc 59
<210> 20
<211> 58
<212> DNA
<213> Artificial Sequence
<400> 20
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 21
<211> 59
<212> DNA
<213> Artificial Sequence
<400> 21
caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttcc 59