一组甲状腺癌标志物及其应用
技术领域
本发明属于基因检测技术领域,涉及一组甲状腺癌标志物及其应用。
背景技术
甲状腺癌(TC)是最常见的内分泌腺恶性肿瘤,近年来发病率显著上升,其中,女性的发病率高于男性,高发年龄为20~40岁。2012年中国卫生部统计报告指出,甲状腺癌成为第三大女性恶性肿瘤;2017年国家癌症中心数据提示,甲状腺癌的发病率呈逐年上升的趋势,每年以6.2%的速度递增,城市女性患甲状腺癌的风险较高。在领邦韩国以及我国浙江省等地区,甲状腺癌已经成为女性患者最常见的恶性肿瘤,预计到2020年,甲状腺癌将会超过乳腺癌,成为发病率最高的恶性肿瘤。
甲状腺癌的危险因素包括电离辐射、遗传因素、甲状腺疾病、女性激素、生殖因素、缺碘或碘摄入过多等。其中,电离辐射的危险度与暴露年龄负相关,年龄越小,危险性越高;对于遗传因素,一级亲属患甲状腺癌者,患病风险增加5-10倍;患有结节甲状腺肿或甲状腺腺瘤等甲状腺疾病,甲状腺癌的患病率会显著提高,有20%的甲状腺肿大和2%的甲亢会最终发展成为甲状腺癌;对于女性,雌激素水平越高,患甲状腺癌的风险越高,18-40岁是女性激素水平最高的时期,也是甲状腺癌发病的高峰期。
甲状腺癌的病理类型主要分为4类:甲状腺乳头状癌(PTC)、甲状腺滤泡状腺癌(FTC)、甲状腺髓样癌(MTC)和甲状腺未分化癌(ATC)。甲状腺乳头状癌(PTC)约占成年人甲状腺癌总数的70%,常见于中青年女性,以21-40岁的妇女最多见,儿童甲状腺癌常为乳头状癌,该类型甲状腺癌分化程度好,生长缓慢,恶性程度低,有多中心性发生倾向,可能较早出现颈部淋巴结转移,需争取早期发现和积极治疗,预后相对较好。甲状腺滤泡状腺癌(FTC)是仅次于甲状腺乳头状癌的常见的甲状腺癌,约占患者总数的15%,多见于50岁左右的妇女,此类型的甲状腺癌发展较快,属中度恶性,具有侵犯血管倾向,颈淋巴结转移仅占10%,预后不如乳头状癌。PTC和FTC均为分化的甲状腺癌(DTCs),占甲状腺癌总数的90%。甲状腺髓样癌(MTC)的主要发病原因为RET原癌基因突变,年龄为30~60岁、有甲状腺甲状旁腺及肾上腺肿瘤家族史的女性人群是甲状腺髓样癌的易患人群,约95%的遗传性MTC和约70%的散发性MTC是由原癌基因RET突变所致,目前已发现的与MTC相关的RET突变位点约有20个,该基因种系突变携带者患遗传性MTC的几率近90%。甲状腺未分化癌(ATC)是甲状腺癌中恶性程度最高的一种,约占患者总数的5%-10%,多见于老年人,发展迅速,恶性度高,约50%的患者伴有颈部淋巴结转移,或侵犯喉返神经、气管或食管,常经血运向远处转移,预后差,平均存活3-6个月,一年存活率仅5%-10%。
甲状腺癌主要根据临床表现(肿块,声音嘶哑,呼吸、吞咽困难等)进行临床诊断,甲状腺肿块质硬、固定,颈淋巴结肿大,有压迫症状的患者,或存在多年的甲状腺肿块、在短期内迅速增大者,均应怀疑为甲状腺癌。
目前甲状腺癌临床诊断方法首选超声检查,CT或MRI是常用的影像学检查手段,可以详细了解甲状腺肿物、肿大淋巴结与周围组织结构如气管、食管、喉和颈部大血管等的关系,局部晚期病例采用此项检查对外科医生有很大帮助。甲状腺功能化验主要检测促甲状腺激素(TSH)水平。细胞学检查,例如针吸涂片细胞学检查(FNAC),诊断准确率达85%以上。PET-CT对判断甲状腺癌是否发生肺部、全身骨骼等远处转移有很大帮助,但是价格昂贵,不是常规检查手段。甲状腺核素扫描常呈“冷结节”,但特异性不高,不属于常规检查手段。目前甲状腺癌的主要临床治疗方法包括:(1)手术治疗:包括甲状腺本身的手术和颈淋巴结清扫,甲状腺的切除范围目前仍有分歧,最小范围为腺叶加峡部切除,最大范围至甲状腺全切除;(2)内分泌治疗:甲状腺癌作次全或全切除者应终身服用甲状腺素片,以预防甲状腺功能减退及抑制TSH,乳头状腺癌和滤泡状腺癌均有TSH受体,TSH通过受体能影响甲状腺癌的生长;(3)放射性核素治疗:对于乳头状腺癌和滤泡状腺癌患者,术后应用131碘放射治疗,适于45岁以上、多发性癌灶、局部侵袭性肿瘤及存在远处转移的患者;(4)放射外照射治疗:主要用于未分化型甲状腺癌。
近年来,甲状腺癌的分子检测方法逐渐成为甲状腺癌临床诊断的新思路。2014年美国甲状腺学会(ATA)发表的《甲状腺结节及分化型甲状腺癌指南》将BRAF基因检测列入分子诊断框架中;2013年美国国家综合癌症网(NCCN)指南推荐所有新诊断的甲状腺髓样癌患者及其有血缘关系的亲属进行RET基因的突变检测,并考虑进行遗传咨询;2014年NCCN指南指出,细针穿刺细胞学检查(FNA)证实75%~80%的患者接受了不必要的甲状腺手术,约有70%的滤泡型损伤患者需要进行基因检测,约有50%的甲状腺结节患者需要进行BRAF基因检测,术前BRAF检测可以辅助鉴别甲状腺乳头状癌的良恶性程度,40-68%的甲状腺乳头状癌(PTC)、20-30%的甲状腺未分化癌(ATC)以及30%的甲状腺髓样癌(MTC)均可检出BRAF基因突变。对于微小乳头状癌(小于或者等于1mm)的术式选择,美国甲状腺协会推荐应该施行甲状腺腺叶切除,但是如果术前检测BRAF显示阳性,推荐进行甲状腺全切,因此辅助分子标志物的检测可以使微小甲状腺乳头状癌(PTMC)的术前诊断的准确率得到提高。BRAF和TERT基因突变可提示预后不良,复发率上升,美国霍普金斯大学医学院的Mingzhao Xing等开展了一项回顾性研究:对平均年龄为45.9岁的507例患者(365例女性和142例男性)进行随访,中位随访时间为24个月,结果显示,BRAF V600E突变阳性和突变阴性的患者中肿瘤复发率分别为25.8%和9.6%(HR=3.22);TERT C228T突变阳性和突变阴性的患者中肿瘤复发率分别为47.5%和11.4%(HR=3.46);BRAF和TERT同时突变与突变阴性的患者中肿瘤复发率分别为68.6%和8.7%,由此得出BRAF基因点突变可以辅助判断甲状腺乳头状癌的良恶性程度、指导甲状腺乳头状癌的手术切除范围以及判断预后/复发风险。
CN 108699553 A涉及用于确定患有具有未确定细胞学的甲状腺结节的患者能否从诊断手术(如腺叶切除手术)获益的方法,这些方法基于筛选患者的甲状腺结节和检测对应特定组的甲状腺癌相关基因的靶核酸序列中的改变,还提供了在实践所述方法中使用的试剂盒。CN 108315424 A公开了一种甲状腺结节良恶性相关基因的PCR特异性引物、检测试剂盒及检测方法,所述甲状腺结节良恶性相关基因与良性甲状腺结节和恶性甲状腺结节的病例的病理指标密切相关,能够作为生物标志物对甲状腺结节患者进行甲状腺结节良恶性的分类,为临床个体化干预治疗提供有效依据。但是,上述试剂盒采用的基因主要为甲状腺癌分子分型相关基因,不涉及其他甲状腺癌相关基因,不能获得全面的分子信息。
《二代测序技术在家族性非髓样甲状腺癌遗传易感基因筛查中的应用》采用的基因主要为甲状腺癌分子分型相关基因和甲状腺癌遗传相关基因,而未涉及用药或治疗标志物,对治疗方案的选择或预后评估不具有指导意义。
因此,有必要提供一种试剂盒,用于甲状腺癌相关基因检测,以获得准确全面的基因突变信息。
发明内容
针对现有技术的不足,本发明提供了一组甲状腺癌标志物及其应用,所述标志物覆盖了甲状腺分子分型、靶向用药、化疗用药、手术提示、预后及遗传相关的44种基因,针对所述标志物的捕获探针有助于全面评估甲状腺癌的状态。
为达此目的,本发明采用以下技术方案:
第一发明,本发明提供了一组甲状腺癌标志物,所述标志物包括甲状腺癌分子分型相关基因、靶向用药相关基因、化疗用药相关基因、手术提示相关基因、预后相关基因和甲状腺癌遗传相关基因;
所述甲状腺癌分子分型相关基因包括BRAF、HRAS、KRAS、NRAS、RET、PIK3CA、TERT、PTEN、CTNNB1、TP53、GNAS、PAX8-PPARγ、NTRK1、NTRK1-TPM3、NTRK1-TRP、NTRK1-TFG、RET-H4、RET-ELE1、TG、ZNF148、SPOP和EZH1;
所述靶向用药相关基因包括BRAF、HRAS、KRAS、NRAS、RET、PIK3CA、PTEN、CTNNB1、NTRK1-TPM3、NTRK1-TRP、NTRK1-TFG、RET-H4、RET-ELE1、TSHR和KMT2C;
所述化疗用药相关基因包括NOS3、ABCC4、CYBA、NCF4、RAC2、ERCC1、TP53、XPC、MTHFR、GSTP1、NQO1、DPYD、UMPS和ESR1;
所述手术提示相关基因为BRAF;
所述预后相关基因包括BRAF和TERT;
所述甲状腺癌遗传相关基因包括FAS、CASP10、PRKAR1A、APC、PTEN、RET、TP53、MEN1、SDHB和STK11。
本发明涵盖了甲状腺癌相关基因的全外显子区域,通过高深度测序可以同时分析基因的SNV/Indel、基因融合等多种变异类型,深度解析甲状腺结节以及甲状腺癌的分子层面信息。
第二方面,本发明提供了一种如第一方面所述的标志物的捕获探针,所述BRAF的捕获探针如SEQ ID NO:1所示;
TTATAACATTTTCCCGCTAAAAATCCGAAGTTAAGACATTTTACTCATGTCAAACGTGCCACTCCTCAGCAATATTTTTGGTCACCTGCACTCAAAATTTATAAAAAGAAACTTAGTTTA。
所述HRAS的捕获探针如SEQ ID NO:2所示;
CACCGTGTCCCACCCTCAGCCGAAAACCAAGATCAAGACCATCCAATAATTTACTGTGATCCCATCTGTGCCCGACAAGGGCCCACAGAGGCCTGGGAGGGGAGCTAAGGGCTGGGGTTC。
所述KRAS的捕获探针如SEQ ID NO:3所示;
TTCACTACAAAACAAACAGTTCCTGGTAATGATTTAAATGTAGTTATAGAAATAAATAATATGTATGGAGTCATTACTTCTGACCTTGAAATAGCCTGCTGGTGACTGGCATTAACATAC。
所述NRAS的捕获探针如SEQ ID NO:4所示;
ATAAAGGCACTTCAGTGAATATAAGAATTATGACTAAGCCAAGAACTTCCAGTTTTTATTTTTTAAACATCATTTAACAAGAAAAAACATTCAACCAAATTAAAAAGAACTAGGTTGGAT。
所述RET的捕获探针如SEQ ID NO:5所示;
CGACCGAAGCAGGGCGCGCAGCAGCGCTGAGTGCCCCGGAACGTGCGTCGCGCCCCCAGTGTCCGTCGCGTCCGCCGCGCCCCGGGCGGGGATGGGGCGGCCAGACTGAGCGCCGCACCC。
所述PIK3CA的捕获探针如SEQ ID NO:6所示;
CGCCGCCGCCGCCCGCGGGGCTGGGACCCGATGCGGTTAGAGCCGCGGAGCCTGGAAGAGCCCCGAGCGTGAGTAGAGCGCGGACTGGCCGGTAGCGGGTGCGGTGGGAATGGGGACCGG。
所述TERT的捕获探针如SEQ ID NO:7所示;
GGTGTCTATGCAGTGCACATTAGGATTCAAACATGAGATTTTTTTCAAAACTGAAAAACTCATATATTCAGTATTTTACTCCCACAGCACCTCCCCCCAATTTGACCCACAGGGACCCCC。
所述PTEN的捕获探针如SEQ ID NO:8所示;
AGCAAGCCCCAGGCAGCTACACTGGGCATGCTCAGTAGAGCCTGCGGCTTGGGGACTCTGCGCTCGCACCCAGAGCTACCGCTCTGCCCCCTCCTACCGCCCCCTGCCCTGCCCTGCCCT。
所述CTNNB1的捕获探针如SEQ ID NO:9所示;
TAAGCCCCAAAGCGCACTATAATTTTCTATTTCTGAACTGATTTGTAAGAGAATGGGTAACTGAAATTAGCAAAGAATCACCCCACACAAAGATGGCGCGTGCAGAATTTGTGAAAGCGA。
所述TP53的捕获探针如SEQ ID NO:10所示;
GTGATCCACCGTGCCTGGCCGGAAATGTTTTCTAAATAAAAAAATAGAACATATTGATTTAAGGTTGTGAATTACAAGTTTAGACTGAAGCCATGAGGAAATTGGGAGATTTGATTTCAG。
所述GNAS的捕获探针如SEQ ID NO:11所示;
CACCTCATAGGGTGTACCTTTCCCGGCTCCAGCAGCCAATGTGCTTCGGAGCCACTCTCTGCAGAGCCAGAGGGCAGGCCGGCTTCTCGGTGTGTGCCTAAGAGGATGGATCGGAGGTCC。
所述PAX8-PPARγ的捕获探针如SEQ ID NO:12所示;
TCTTTGCAGTGCTCCCCTTCCTGCCGGCCCTCTCCTTACCTGCCACCATGCCTGCGATGGCAGAGGAGGCATAGCTGCCCTGTCCGCTGGTGGGGATGTGGGGTGGGTATCCGGGCAGCG。
所述NTRK1的捕获探针如SEQ ID NO:13所示;
AATGTGGAATGCACTGGGCAAATGGTCACTGACACAGAGTGCAGATGCCTGCTTCTGGGACTCAATGCACTGCACCCTGGTCATCTGCGGACTCAGCCTGAGCTTCCAGAGGGCCTAGGA。
所述NTRK1-TPM3的捕获探针如SEQ ID NO:14所示;
CAAGCAGAAAAGTCTAAAAAAAACCCTTTAATTTCTTCCAGTTTTAATTTCTTCTGTTGCACACTGTTTATCTTAACACCACACCCTCCGCCCGACAAAAAAACTTTTTGCAATGATTTC。
所述NTRK1-TRP的捕获探针如SEQ ID NO:15所示;
GCTGTCAGGACCAGGGCTGTGGGTCTCCTGATGCCTAGCTTAAGGGAGTCTCTCTACTTTTCAGGCCGCCCTCATCTGCCTGGCACCCTCTGTACCCCCGATCTTGACGGTGAAGTCCTG。
所述NTRK1-TFG的捕获探针如SEQ ID NO:16所示;
TCAGGCCGCCCTCATCTGCCTGGCACCCTCTGTACCCCCGATCTTGACGGTGAAGTCCTGGGACACCATGCAGTTGCGGGCTGCTAGATCTCGGTGCACAAACTTGTTGGCAGCAAGGTA。
所述RET-H4的捕获探针如SEQ ID NO:17所示;
CGACCGAAGCAGGGCGCGCAGCAGCGCTGAGTGCCCCGGAACGTGCGTCGCGCCCCCAGTGTCCGTCGCGTCCGCCGCGCCCCGGGCGGGGATGGGGCGGCCAGACTGAGCGCCGCACCC。
所述RET-ELE1的捕获探针如SEQ ID NO:18所示;
AAATAACATGATTAAATTATCTCTATTTTGTAGCAAATTCCTGAGCACTTGATGGCTCATGCTAGTTCAGCAAATATTGGGCCCTTCCTGGAGAAGAGAGGCTGTATCTCCATGCCAGAG。
所述TG的捕获探针如SEQ ID NO:19所示;
TGGGGGTGGGAAGGAAAGTGCCAACGGCAGCTCTATAAAAGCTCCCTGGCCAGGGGACCTAGGGCAAGCAGTGGTTTCTCCTCCTTCCTCCCAGGAAGGGCCAGGAAAATGGCCCTGGTC。
所述ZNF148的捕获探针如SEQ ID NO:20所示;
CAGAACAGCCAGCATTCTGAAAAAAAAAATTTTTAAATTCAATCCAAACATATAATCAGGAAAATCTTCATAATCACTTTGTGCATGATAAATTGTCGAGTAAGACTCAATGACAACACA。
所述SPOP的捕获探针如SEQ ID NO:21所示;
ACAGAACCAGTTAGAGACAATAATTTCCCTTTATTTAATCTCCACATTTATGTCCCCTGGATCTTTTTATATTTAGTTAGAAGAAGGGAGGTGGGGATTAGGTCTTAAAACATACGGGGG。
所述EZH1的捕获探针如SEQ ID NO:22所示;
ACTTGCCAAAATGGATTCTAACACTTTATTAAGAGGTCACAAGCCACAGGACTTTAAAGTGCATGAAATTTATTGGCAATGAAGCCGCATGTATACCAGGCTCCCCTAGTCCCCACCACC。
所述TSHR的捕获探针如SEQ ID NO:23所示;
GGCCGCTGCCAGTCGACTCAACCACCGGAGTGGCCCCTGCAGTTGGATAGCAACGAGAATCCTCCAGGGGTGCAGGGCGACGGCTTCGGCCGCACCGCGGGCTAGCCAGGGCTGCGTGCC。
所述KMT2C的捕获探针如SEQ ID NO:24所示;
TAGGCAGCTCTTATAGATGTAAAATATTTTATTTGTAAATGGTGATCTTCTAAATCTGTGTCCACAAATTCCAAAACCCATAACACTCTGTATACTTCAAAAAATTCAATTTTTGCCAAC。
所述NOS3的捕获探针如SEQ ID NO:25所示;
CCACTCCCCACAGCTCTGCATTCAGCACGGCTGGACCCCAGGAAACGGTCGCTTCGACGTGCTGCCCCTGCTGCTGCAGGCCCCAGATGATCCCCCAGAACTCTTCCTTCTGCCCCCCGA。
所述ABCC4的捕获探针如SEQ ID NO:26所示;
AAGCGTGATTCCAATTGTTTTAGAGGTCAGTGCTAGGATAGCCATAACTGTACTTGGTCTAAGATAAAAATCACATTCTCCTTCCCTTCCGGTGGCACGTTCTCTATGCTTCCTACTAAA。
所述CYBA的捕获探针如SEQ ID NO:27所示;
GCGGGACGGGGACTCACAGGAGATGCAGGACGGCCCGAACATAGTAATTCCTGGTAAAGGGCCCGAACAGCTTCACCACGGCGGTCATGTACTTCTGTCCCCTGGGGGAGGGAGGAAGGC。
所述NCF4的捕获探针如SEQ ID NO:28所示;
TTGGGCAAAGGCTTGGCAGTAAGAGAATAAAGGTGGGGCTTGATGGGCCAGAGGATAAGTGACTCCTCAAGGTCACAAGACACCCTGATGGCTGGGACCCCATCTCTGATGGAGCAAGGC。
所述RAC2的捕获探针如SEQ ID NO:29所示;
GGAGGAGGGGAATGGGGCAGGTGGAAGGGGCCCCAGCACCCAGGTATCACCTGACCACCACCGAAGCCCACCCCCACGGAGGAAGGATGGTGCATTCAAGGAACCCAGAGACCACAGGGC。
所述ERCC1的捕获探针如SEQ ID NO:30所示;
GTGGCGCCGCAGAGCTCACCTGAGGAACAGGGCACAGGTGCTCTGGCCCAGCACATAGTCGGGAATTACGTCGCCAAATTCCCAGGGCACATTGCGCACGAACTTCAGTACGGGATTGCC。
所述XPC的捕获探针如SEQ ID NO:31所示;
GGGCTGGGCATGCCCAGGGCAGGTGTGGGGCCTGTAGTGGGGCAGCAGCAACTGGTGGGTGCCCCTCTAGTGGGCGCTCAGCTCACAGCTGCTCAAATGGGAACAGGTGGGAAGCTGCTG。
所述MTHFR的捕获探针如SEQ ID NO:32所示;
ATGGGGCAAGTGATGCCCATGTCGGTGCATGCCTTCACAAAGCGGAAGAATGTGTCAGCCTCAAAGAAAAGCTGCGTGATGATGAAATCGGCTCCCGCAGACACCTTCTCCTTCAAGTGC。
所述GSTP1的捕获探针如SEQ ID NO:33所示;
CCAACCCCAGGGCTCTATGGGAAGGACCAGCAGGAGGCAGCCCTGGTGGACATGGTGAATGACGGCGTGGAGGACCTCCGCTGCAAATACATCTCCCTCATCTACACCAACTATGTGAGC。
所述NQO1的捕获探针如SEQ ID NO:34所示;
CCCAAATATTCTCCAGGCGTTTCTTCCATCCTTCCAGGATTTGAATTCGGGCGTCTGCTGGAGTGTGCCCAATGCTATATGTCAGTTGAGGTTCTAAGACTTGGAAGCCACAGAAATGCA。
所述DPYD的捕获探针如SEQ ID NO:35所示;
TAGCATTCTAATTCCAGCAGGATTCTTACCTGGTAGCCAGAATCATTACAGGTCATGTAGCATTTACCACAGTTGATACACATTTCTTCATCAATCATAGCCACAACTTGCTCTACGTTG。
所述UMPS的捕获探针如SEQ ID NO:36所示;
TCGAGCAGCAGAAAAAAGTTGATGCTGAGACAGTTGGGAGAGTGAAGAGGTTTATTCAGGAGAATGTCTTTGTGGCAGCGAATCATAATGGTTCTCCCCTTTCTATAAAGGAAGCACCCA。
所述ESR1的捕获探针如SEQ ID NO:37所示;
GATGAAATGTTTATTTGTAGTTTTCAACCAGATACGATCTACCCACTCCAAAGGCATAATGTCATAAATAGAAAGAAACTACTGACACACGTTTTAAAATAACCTACCAACATTGCAGAT。
所述FAS的捕获探针如SEQ ID NO:38所示;
CTCACCCTGACTTCTCCCCCTCCCTACCCGCGCGCAGGCCAAGTTGCTGAATCAATGGAGCCCTCCCCAACCCGGGCGTTCCCCAGCGAGGCTTCCTTCCCATCCTCCTGACCACCGGGG。
所述CASP10的捕获探针如SEQ ID NO:39所示;
AGGAGTTGGTTAGGAAAACAGATGCTTCCCTTTTTGACTTACCAAGGAAATGGAGATCCAAAGGAAAGCCTGAAGCACTTTGTGGCTTCCACGGGTTCGTTTCTAGGAAGCTTTTGCTTT。
所述PRKAR1A的捕获探针如SEQ ID NO:40所示;
GCGCTGGCCGGGCACAGGATGCGCGGCCCGGAGAGCGCATCCCGGCCATCCGCCCGCGCTCGGCCCCGCAGCGCAGCTGCTGCAGATCCGCGGGGGCCGCCACCTCCTCCGGGGGCTGGC。
所述APC的捕获探针如SEQ ID NO:41所示;
AACACCTCTCACGCATGCGCATTGTAGTCTTCCCACCTCCCACAAGATGGCGGAGGGCAAGTAGCAAGGGGGCGGGGTGTGGCCGCCGGAAGCCTAGCCGCTGCTCGGGGGGGACCTGCG。
所述MEN1的捕获探针如SEQ ID NO:42所示;
CTTGCGCTTTATATTTTTTTTAACAAAATGTATTCATCTTTCTTGGAACTGAAAAATAAATCTATGTACAAAACAGGAAGAGATCAGGCTCTTGTCACCCACTCCTAACCCTCTGCAGAT。
所述SDHB的捕获探针如SEQ ID NO:43所示;
TCTTTTTTTTTTGTTAATAAAGTAGAATAACATTTATTTCTTAAAATTTTTATTATACATGCTGTATTCATGGAAAACCAAGATCTTTAAAGGAACTCAAATTAGATATAAATTATGTTC。
所述STK11的捕获探针如SEQ ID NO:44所示
CTCGCGAGGAGGCGTGCCCTGCGGCCGGGCGTGCGGTGTCCGCGGCGGCGCAGGGAGGGGGAGGGAGGTAAACAAGATGGCGGCGGCGTGTCGGGCGCGGAAGGGGGAGGCGGCCCGGGG。
本发明针对甲状腺分子分型、靶向用药、化疗用药、手术提示、预后及遗传相关的44种基因,共设计了3633条探针,覆盖了558个靶向目标区域,探针大小共计254.096Kbp,其中的44条探针如SEQ ID NO:1~44所示。
优选地,所述捕获探针的3’端标记有生物素。
本发明中,捕获探针的3’端标记有生物素,可以与带有链霉亲和素磁珠的样本DNA杂交,通过互补配对实现目标基因区域的捕获。
本发明的目标基因区域杂交捕获中,按照一份探针捕获1个文库的用量添加探针,避免多个文库混合杂交一份探针出现杂交不均一的情况,保证基因捕获效率。
第三方面,本发明提供了一种试剂盒,所述试剂盒包括如第二方面所述的捕获探针。
本发明的试剂盒覆盖了甲状腺分子分型、靶向用药、化疗用药、手术提示、预后及遗传相关的44种基因,覆盖面广,性价比高,实效性强,可以对甲状腺患者进一步的分子分型、用药提示、遗传风险评估等提供参考依据,适于临床推广应用。
所述试剂盒还包括接头元件,所述接头元件从5’到3’端包括依次相连的随机碱基序列和通用引物。
所述随机碱基的长度为5~15bp,例如可以是5bp、6bp、7bp、8bp、9bp、10bp、11bp、12bp、13bp、14bp或15bp。
本发明的接头元件的5’端具有随机碱基序列,可以使样本DNA的每一个模板分子在未进行PCR扩增之前均带有不同的分子标签,实现每个模板分子的标记,从而在后续数据分析时通过分子标签识别出是真实突变还是PCR扩增引入的碱基错误改变。
所述接头元件的5’端标记有磷酸基团。
所述接头元件与样本DNA的摩尔比为(10~200):1,例如可以是10:1、20:1、40:1、100:1或200:1。
所述接头与样本DNA连接后,进行PCR扩增构建文库。
所述PCR的循环数根据连接有接头元件的样本DNA的质量进行确定。
所述连接有接头元件的样本DNA的质量大于100ng,PCR循环数为5~6。
所述连接有接头元件的样本DNA的质量为50~100ng,PCR循环数为7~8。
所述连接有接头元件的样本DNA的质量为10~50ng,PCR循环数为8~9。
所述样本DNA的来源包括组织样本、血液样本或石蜡包埋样本。
所述试剂盒还包括缓冲液。
第四方面,本发明提供了一种检测方法,所述方法包括以下步骤:
(1)将提取的样本DNA进行片段化;
(2)在片段化样本DNA的两端添加接头元件;
(3)将添加有接头元件的样本DNA进行PCR扩增,产物纯化;
(4)采用如权利要求2或3所述的捕获探针对纯化的产物进行捕获;
(5)高通量测序,对测序结果进行比对分析,得到基因的突变信息。
本发明的用于甲状腺癌基因突变的检测方法,包括对甲状腺病灶组织样本、活检穿刺、血浆cfDNA液态活检样本等类型进行文库构建,并采用针对甲状腺分子分型、靶向用药、化疗用药、手术指导提示、预后及遗传相关的多种基因设计3634条捕获探针,对构建的gDNA/cfDNA文库进行目标区域捕获,然后进行靶向测序,并对测序结果进行全面的数据分析,获得准确可信的甲状腺癌基因突变信息,通过高通量测序,全面评估患者良恶性、可选择的治疗方案及预后,同时覆盖了家族性甲状腺癌相关遗传基因,评估家族性人群的患病风险。
需要说明的是,本发明的甲状腺癌基因突变的检测方法,获得的检测结果仅仅用于分析和判断靶标基因的生物信息学信息,并为用药或治疗提供可靠的参考依据。
步骤(2)所述接头元件与所述片段化样本DNA的摩尔比为(10~200):1,例如可以是10:1、20:1、40:1、100:1或200:1。
本发明的甲状腺癌基因突变的检测方法,其中一个关键步骤在于文库构建,尤其是针对一些甲状腺疾病患者的活检穿刺样本,需要临床病理结果鉴定后,再送检至实验室采用高通量测序的方法进行更深入的全面的分子检测,构建低起始量甚至微量样本的文库,是直接影响检测结果质量的关键因素。
本发明根据不同建库起始量的核酸文库构建中增加接头后的定量质控结果,调整PCR的循环数,使样本得到充分富集,同时采用特殊的分子标签即随机引物序列增加到接头设计中进行文库构建,有效降低了建库扩增过程中PCR引入的错误突变,提高了检测结果的准确性。
步骤(3)所述PCR的循环数根据连接有接头元件的样本DNA的质量进行确定。
所述连接有接头元件的样本DNA的质量大于100ng,PCR循环数为5~6。
所述连接有接头元件的样本DNA的质量为50~100ng,PCR循环数为7~8。
所述连接有接头元件的样本DNA的质量为10~50ng,PCR循环数为8~9。
所述样本DNA的来源包括组织样本、血液样本或石蜡包埋样本。
第五方面,本发明提供了一种如第一方面所述的标志物、如第二方面所述的捕获探针或如第三方面所述的试剂盒在制备甲状腺疾病治疗药物中的应用。
所述甲状腺疾病包括甲状腺结节和/或甲状腺癌。
所述甲状腺癌包括甲状腺乳头状癌、甲状腺滤泡状腺癌、甲状腺髓样癌或甲状腺未分化癌中的任意一种。
与现有技术相比,本发明具有如下有益效果:
(1)本发明针对甲状腺分子分型、靶向用药、化疗用药、手术提示、预后及遗传相关的44种基因的全外显子区域,进行高深度测序同时分析基因的SNV/Indel、基因融合等多种变异类型,深度解析甲状腺结节以及甲状腺癌的分子层面信息;
(2)本发明针对44种基因设计的捕获探针,覆盖了558个靶向目标区域,探针大小共计254.096Kbp,制备的试剂盒覆盖面广,性价比高,实效性强,可以对甲状腺患者进一步的分子分型、用药提示、遗传风险评估等提供参考依据,适于临床推广应用;
(3)本发明的检测方法通过对甲状腺疾病患者的活检穿刺样本,或液态活检的血浆cfDNA样本文库构建方法进行优化,使检测所需起始量较低、准确性好,可以全面评估患者良恶性、可选择的治疗方案及预后,同时覆盖了家族性甲状腺癌相关遗传基因,评估家族性人群的患病风险。
附图说明
图1为甲状腺结节/癌分子诊疗流程;
图2(A)为提取的活检穿刺样本组织gDNA的酶切片段化质控检测结果,图2(B)为血液gDNA的酶切片段化质控检测结果;
图3(A)为组织gDNA靶向捕获文库的质控检测结果,图3(B)为血液gDNA靶向捕获文库的质控检测结果;
图4为生物信息学分析流程示意图。
具体实施方式
为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
本发明的检测方法主要包括从甲状腺癌活检穿刺样本中提取gDNA,构建文库,利用设计的目标区域探针进行靶向捕获,上机测序,利用生物信息学进行数据分析,获得甲状腺癌患者相关基因的变异信息,流程如图1所示。
实施例1gDNA提取
甲状腺疾病患者的检测样本多为活检穿刺样本,样本量较少,核酸抽提质量至关重要,本实施例以编号为BT1809140101LNDBE/TV的甲状腺乳头状癌样本(组织和血液)为例,进行基因组DNA(gDNA)提取,采用QIAGEN公司的组织和血液DNA提取试剂盒进行,提取步骤按照说明书进行,提取的核酸采用Qubit 3.0进行质控。
将提取的核酸进行酶切片段化,酶切体系如表1所示,酶切条件如表2所示,酶切反应完成后,酶切产物中加入40μL无酶水,至总体积为50μL,采用Agilent 2100质检片段化后的核酸。
表1酶切体系
试剂 |
用量(μL) |
酶切缓冲液(5×SureSelect Fragmentation Buffer) |
2 |
酶(SureSelect Fragmentation Enzyme) |
1 |
gDNA(Genomic DNA) |
7(10-200ng) |
总体积 |
10 |
表2酶切条件
步骤 |
温度(℃) |
时间 |
1 |
37 |
15min |
2 |
65 |
5min |
3 |
4 |
保存 |
结果显示,从BT1809140101LNDBE/TV的组织和血液样本中提取的gDNA,浓度分别为2ng/μL和158ng/μL,总量分别为100ng和7.9μg,对两组gDNA分别取样100ng进行酶切打断,酶切后的片段大小如图2(A)和图2(B)所示,主峰在150bp左右,可见酶切片段化效果较好。
实施例2文库构建
本实施例参照SureSelect XT Low Input System进行建库,对步骤进行了改进与优化,具体操作如下:
(1)末端修复
向实施例1获得的酶切片段化样本中加入无酶水(Nuclease-free Water)定容至50μL,按照表3配制末端修复反应体系,混匀后放置在PCR仪上20℃保持15min,72℃保持15min,4℃保存备用。
表3末端修复反应体系
试剂 |
用量(μL) |
缓冲液(End Repair-ATailing Buffer) |
16 |
末端修复酶混合液(End Repair-ATailing Enzyme Mix) |
4 |
酶切片段化样本 |
50 |
总体积 |
70 |
(2)接头连接
按照表2配制接头连接反应体系,混匀后放置在PCR仪上20℃保持30min,4℃保存备用;需要说明的是,表4的反应试剂需提前配制,配制完成后室温平衡30min,再加入末端修复产物。
表4接头连接反应体系
试剂 |
用量(μL) |
连接缓冲液(Ligation Buffer) |
23 |
T4 DNA连接酶(T4 DNA Ligase) |
2 |
接头混合液(Adaptor Oligo Mix) |
2.5 |
无酶水(Nuclease-free Water) |
2.5 |
总体积 |
30 |
研究发现,根据不同的建库起始量,需要调整所加接头的浓度,接头浓度过高影响捕获和扩增效率,接头浓度过低影响建库的连接转化效率,建库起始量与接头浓度的比例按表5进行配制。
表5建库起始量与接头浓度的比例
建库起始量 |
接头浓度 |
接头与建库起始量的摩尔比 |
1μg |
15μM |
10:1 |
500ng |
15μM |
20:1 |
250ng |
15μM |
40:1 |
100ng |
15μM |
100:1 |
50ng |
15μM |
200:1 |
25ng |
7.5μM |
200:1 |
10ng |
3μM |
200:1 |
5ng |
1.5μM |
200:1 |
2.5ng |
750nM |
200:1 |
1ng |
300nM |
200:1 |
(3)连接产物纯化
采用AMPure XP磁珠进行连接产物的纯化,具体操作步骤如下:
将磁珠在室温下平衡至少30min,涡旋混匀,取80μL磁珠至新的1.5mL离心管中,加入接头连接产物至100μL;涡旋混匀,置于磁力架上至液体澄清,弃上清,加入200μL 75%乙醇,洗涤弃上清,重复操作洗涤两次;37℃孵育变干,加入36μL ddH2O,涡旋混匀,置于磁力架上至液体澄清,取上清保存于-20℃中备用。
(4)PCR扩增
对纯化的上清进行Qubit浓度测定,计算DNA总量,剩余的样本进行PCR扩增,混匀后放置于PCR仪上进行PCR,根据加接头后的核酸总量,选择PCR循环数,反应体系如表6所示,反应条件如表7所示,PCR循环数根据表8进行设置。
表6 PCR反应体系
表7 PCR反应条件
表8 PCR循环数设置
(5)扩增产物纯化
向PCR扩增产物中加入50μL磁珠进行纯化,涡旋混匀,置于磁力架上至液体澄清,弃上清,加入200μL 75%乙醇,洗涤弃上清,重复操作洗涤两次;37℃孵育变干,加入16μLddH2O,涡旋混匀,置于磁力架上至液体澄清,取上清即为gDNA文库。
实施例3甲状腺相关基因的目标区域捕获
本实施例参照SureSelect XT Low Input System进行目标区域捕获,具体操作如下:
(1)捕获杂交
将1000ng定量加接头预扩增后的文库(含如SEQ ID NO:1~44的捕获探针)全部转移至新的离心管中,烘干,加入12μL ddH2O溶解,涡旋混匀;
加入5μL封闭液(SureSelect XT HS and XT Low Input Blocker Mix),涡旋混匀,转入PCR板,置于PCR仪上进行反应,条件如表9所示;当程序运行到步骤3时,暂停,加入13μL如表10所示的捕获杂交体系。
表9目标区域捕获反应条件
表10捕获杂交体系
试剂 |
用量(μL) |
RNA酶封闭液(25%RNase Block solution) |
2 |
文库(Capture library<3Mb) |
2 |
杂交缓冲液(SureSelect Fast Hybridization Buffer) |
6 |
无酶水(Nuclease-free Water) |
3 |
总体积 |
13 |
(2)杂交洗脱
取50μL涡旋混匀的链霉亲和素磁珠(Dynabeads MyOne Streptavidin T1)于1.5mL离心管中,加入200μL结合液(SureSelect Binding Buffer),涡旋5s混匀,置于磁力架上至澄清,弃上清,再复洗2次;
向磁珠中加入200μL结合液(SureSelect Binding Buffer),重悬混匀;
取30μL杂交产物至清洗好的磁珠溶液中,颠倒混匀3-5次,室温平衡(1400-1800rpm)30min,瞬时离心,置于磁力架上,弃上清;加入200μL洗涤液1(SureSelect Wash1),颠倒混匀,瞬时离心,置于磁力架上,弃上清;
加入200μL 70℃预热的洗涤液2(SureSelect Wash 2),颠倒混匀,70℃孵育5min,瞬时离心,置于磁力架上,弃上清;再复洗5次,加入25μL ddH2O,涡旋混匀。
(3)PCR富集
对杂交在磁珠上的文库进行PCR富集,体系如表11所示,条件如表12所示。
表11 PCR富集体系
表12 PCR富集条件
(4)靶向文库纯化
室温下平衡磁珠至少30min,涡旋混匀,向PCR扩增产物中加入50μL磁珠进行产物纯化,涡旋混匀,置于磁力架上至液体澄清,弃上清,加入200μL 75%乙醇,洗涤弃上清,重复操作洗涤两次;37℃孵育变干,加入25μL ddH2O,涡旋混匀,置于磁力架上至液体澄清,取上清即为靶向捕获文库,4℃保存一周或-20℃保存。
(5)靶向文库质控
采用Qubit3.0进行靶向文库的浓度测定,采用Agilent 2100进行文库片段的大小质控鉴定。结果显示,捕获文库的浓度分别为3.02ng/μL和1.92ng/μL;如图3(A)和图3(B)所示,文库片段约为330bp,符合理论要求。
(6)测序
参照illumina上机操作手册,对文库变性稀释,混合进行上机测序,选用PE75上机模式,甲状腺穿刺组织样本的测序深度为1200×,血液对照样本的测序深度为500×。
实施例4数据分析
本实施例的测序数据分析采用上海宝藤生物科技股份有限公司研发的自动化分析流程,如图4所示,具体包括:
(1)提取碱基信息,数据质控,去除低质量数据,采用的过滤原则为:
①去除由于测序仪器硬件原因产生的信号强度极端的reads;
②去除总体质量偏低的reads,即Q=20碱基比例小于50%的reads,其中,Q=-10logerror_ratio;
③去除3’端质量Q低于10的碱基,即碱基错误率为0.1;
④去除reads中含有的模糊的N碱基,可能是由于测序荧光强度不够造成;
⑤去除reads中含有的接头序列;
⑥去除长度小于20的reads;
⑦去除核糖体RNA等非编码RNA reads;
(2)数据比对
采用BWA软件将测序结果与参考基因组进行比对,得到BAM格式的最初比对结果;采用Picard、GATK软件进行去重复(duplicate removal)、局部重比对(localrealignment)、碱基质量值重校正(base quality recalibration)等处理,得到BAM格式的最终比对结果;
(3)获取变异信息
采用VarScan2检测SNV/InDel变异类型信息,采用CONTRA/Control-FREEC进行拷贝数变异分析,采用factera进行Fusion检测,采用breakdancer进行其他类型例如大片段倒位、易位和SV检测;
(4)变异信息注释
结合数据库进行变异位点的注释,并生成供临床参考的解读报告,由专业人员进行审核和复核。
实施例5结果分析
(1)分子分型解读
检测结果如表13所示,该样本检测到BRAF基因突变,根据已有大样本量统计结果,受检者是甲状腺乳头状癌(PTC)的可能性较高。
表13检出的体细胞突变信息汇总
基因 |
变异类型 |
外显子号 |
变异位点 |
突变频率 |
BRAF |
SNV |
exon15 |
p.V600E |
4.8% |
(2)靶向用药指导信息解读
基因突变对应的靶向用药提示信息为:使用靶向药物索拉菲尼敏感性增加,佐证等级为2A;达拉菲尼+曲美替尼药物敏感性增加,佐证等级为2B;维罗菲尼药物敏感性增加,佐证等级为2B;卡博替尼+维罗菲尼药物敏感性增加,佐证等级为2B。佐证等级说明:注释等级引用自如表14所示的Memorial Sloan Kettering Cancer Center(MSK)Levels ofevidence。
表14
Level 1 |
FDA批准药物靶点指导FDA批准药物在药物适应癌种中的疗效 |
Level 2A |
药物靶点指导FDA批准药物在药物适应癌种中的疗效 |
Level 2B |
药物靶点指导FDA批准药物在其他癌种中的疗效 |
Level 3A |
有临床证据支持的药物靶点指导靶向药物在药物适应癌种中的疗效 |
Level 3B |
有临床证据支持的药物靶点指导靶向药物在其他癌种中的疗效 |
Level 4 |
有生物学证据支持的药物靶点指导靶向药物的疗效 |
Level R1 |
靶向药物耐药性靶点 |
(3)预后结果信息提示
该样本检测到BRAF基因突变,预后结果复发风险高,约为25.8%。
(4)甲状腺癌遗传风险提示
检测范围内未发现与遗传性甲状腺癌相关的基因变异。
(5)化疗药物结果提示
化疗主要针对未分化甲状腺癌,其他不考虑化疗,本实施例中受检者是甲状腺乳头状癌(PTC)的可能性较高,可忽略此部分结果。
(6)手术切除方案提示
手术切除方案提示结果解读仅限甲状腺微小乳头状癌(PTMC),其他分型无参考意义,本实施例中受检者是甲状腺乳头状癌(PTC)的可能性较高,可忽略此部分结果。
综上所述,本发明针对甲状腺分子分型、靶向用药、化疗用药、手术提示、预后及遗传相关的44种基因的全外显子区域,进行高深度测序同时分析基因的SNV/Indel、基因融合等多种变异类型,深度解析甲状腺结节以及甲状腺癌的分子层面信息;针对44种基因设计的捕获探针,覆盖了558个靶向目标区域,探针大小共计254.096Kbp,制备的试剂盒覆盖面广,性价比高,实效性强,可以对甲状腺患者进一步的分子分型、用药提示、遗传风险评估等提供参考依据,适于临床推广应用;检测方法所需起始量较低、准确性好。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。
SEQUENCE LISTING
<110> 上海宝藤生物医药科技股份有限公司
<120> 一组甲状腺癌标志物及其应用
<130> 20191219
<160> 44
<170> PatentIn version 3.3
<210> 1
<211> 120
<212> DNA
<213> 人工合成
<400> 1
ttataacatt ttcccgctaa aaatccgaag ttaagacatt ttactcatgt caaacgtgcc 60
actcctcagc aatatttttg gtcacctgca ctcaaaattt ataaaaagaa acttagttta 120
<210> 2
<211> 120
<212> DNA
<213> 人工合成
<400> 2
caccgtgtcc caccctcagc cgaaaaccaa gatcaagacc atccaataat ttactgtgat 60
cccatctgtg cccgacaagg gcccacagag gcctgggagg ggagctaagg gctggggttc 120
<210> 3
<211> 120
<212> DNA
<213> 人工合成
<400> 3
ttcactacaa aacaaacagt tcctggtaat gatttaaatg tagttataga aataaataat 60
atgtatggag tcattacttc tgaccttgaa atagcctgct ggtgactggc attaacatac 120
<210> 4
<211> 120
<212> DNA
<213> 人工合成
<400> 4
ataaaggcac ttcagtgaat ataagaatta tgactaagcc aagaacttcc agtttttatt 60
ttttaaacat catttaacaa gaaaaaacat tcaaccaaat taaaaagaac taggttggat 120
<210> 5
<211> 120
<212> DNA
<213> 人工合成
<400> 5
cgaccgaagc agggcgcgca gcagcgctga gtgccccgga acgtgcgtcg cgcccccagt 60
gtccgtcgcg tccgccgcgc cccgggcggg gatggggcgg ccagactgag cgccgcaccc 120
<210> 6
<211> 120
<212> DNA
<213> 人工合成
<400> 6
cgccgccgcc gcccgcgggg ctgggacccg atgcggttag agccgcggag cctggaagag 60
ccccgagcgt gagtagagcg cggactggcc ggtagcgggt gcggtgggaa tggggaccgg 120
<210> 7
<211> 120
<212> DNA
<213> 人工合成
<400> 7
ggtgtctatg cagtgcacat taggattcaa acatgagatt tttttcaaaa ctgaaaaact 60
catatattca gtattttact cccacagcac ctccccccaa tttgacccac agggaccccc 120
<210> 8
<211> 120
<212> DNA
<213> 人工合成
<400> 8
agcaagcccc aggcagctac actgggcatg ctcagtagag cctgcggctt ggggactctg 60
cgctcgcacc cagagctacc gctctgcccc ctcctaccgc cccctgccct gccctgccct 120
<210> 9
<211> 120
<212> DNA
<213> 人工合成
<400> 9
taagccccaa agcgcactat aattttctat ttctgaactg atttgtaaga gaatgggtaa 60
ctgaaattag caaagaatca ccccacacaa agatggcgcg tgcagaattt gtgaaagcga 120
<210> 10
<211> 120
<212> DNA
<213> 人工合成
<400> 10
gtgatccacc gtgcctggcc ggaaatgttt tctaaataaa aaaatagaac atattgattt 60
aaggttgtga attacaagtt tagactgaag ccatgaggaa attgggagat ttgatttcag 120
<210> 11
<211> 120
<212> DNA
<213> 人工合成
<400> 11
cacctcatag ggtgtacctt tcccggctcc agcagccaat gtgcttcgga gccactctct 60
gcagagccag agggcaggcc ggcttctcgg tgtgtgccta agaggatgga tcggaggtcc 120
<210> 12
<211> 120
<212> DNA
<213> 人工合成
<400> 12
tctttgcagt gctccccttc ctgccggccc tctccttacc tgccaccatg cctgcgatgg 60
cagaggaggc atagctgccc tgtccgctgg tggggatgtg gggtgggtat ccgggcagcg 120
<210> 13
<211> 120
<212> DNA
<213> 人工合成
<400> 13
aatgtggaat gcactgggca aatggtcact gacacagagt gcagatgcct gcttctggga 60
ctcaatgcac tgcaccctgg tcatctgcgg actcagcctg agcttccaga gggcctagga 120
<210> 14
<211> 120
<212> DNA
<213> 人工合成
<400> 14
caagcagaaa agtctaaaaa aaacccttta atttcttcca gttttaattt cttctgttgc 60
acactgttta tcttaacacc acaccctccg cccgacaaaa aaactttttg caatgatttc 120
<210> 15
<211> 120
<212> DNA
<213> 人工合成
<400> 15
gctgtcagga ccagggctgt gggtctcctg atgcctagct taagggagtc tctctacttt 60
tcaggccgcc ctcatctgcc tggcaccctc tgtacccccg atcttgacgg tgaagtcctg 120
<210> 16
<211> 120
<212> DNA
<213> 人工合成
<400> 16
tcaggccgcc ctcatctgcc tggcaccctc tgtacccccg atcttgacgg tgaagtcctg 60
ggacaccatg cagttgcggg ctgctagatc tcggtgcaca aacttgttgg cagcaaggta 120
<210> 17
<211> 120
<212> DNA
<213> 人工合成
<400> 17
cgaccgaagc agggcgcgca gcagcgctga gtgccccgga acgtgcgtcg cgcccccagt 60
gtccgtcgcg tccgccgcgc cccgggcggg gatggggcgg ccagactgag cgccgcaccc 120
<210> 18
<211> 120
<212> DNA
<213> 人工合成
<400> 18
aaataacatg attaaattat ctctattttg tagcaaattc ctgagcactt gatggctcat 60
gctagttcag caaatattgg gcccttcctg gagaagagag gctgtatctc catgccagag 120
<210> 19
<211> 120
<212> DNA
<213> 人工合成
<400> 19
tgggggtggg aaggaaagtg ccaacggcag ctctataaaa gctccctggc caggggacct 60
agggcaagca gtggtttctc ctccttcctc ccaggaaggg ccaggaaaat ggccctggtc 120
<210> 20
<211> 120
<212> DNA
<213> 人工合成
<400> 20
cagaacagcc agcattctga aaaaaaaaat ttttaaattc aatccaaaca tataatcagg 60
aaaatcttca taatcacttt gtgcatgata aattgtcgag taagactcaa tgacaacaca 120
<210> 21
<211> 120
<212> DNA
<213> 人工合成
<400> 21
acagaaccag ttagagacaa taatttccct ttatttaatc tccacattta tgtcccctgg 60
atctttttat atttagttag aagaagggag gtggggatta ggtcttaaaa catacggggg 120
<210> 22
<211> 120
<212> DNA
<213> 人工合成
<400> 22
acttgccaaa atggattcta acactttatt aagaggtcac aagccacagg actttaaagt 60
gcatgaaatt tattggcaat gaagccgcat gtataccagg ctcccctagt ccccaccacc 120
<210> 23
<211> 120
<212> DNA
<213> 人工合成
<400> 23
ggccgctgcc agtcgactca accaccggag tggcccctgc agttggatag caacgagaat 60
cctccagggg tgcagggcga cggcttcggc cgcaccgcgg gctagccagg gctgcgtgcc 120
<210> 24
<211> 120
<212> DNA
<213> 人工合成
<400> 24
taggcagctc ttatagatgt aaaatatttt atttgtaaat ggtgatcttc taaatctgtg 60
tccacaaatt ccaaaaccca taacactctg tatacttcaa aaaattcaat ttttgccaac 120
<210> 25
<211> 120
<212> DNA
<213> 人工合成
<400> 25
ccactcccca cagctctgca ttcagcacgg ctggacccca ggaaacggtc gcttcgacgt 60
gctgcccctg ctgctgcagg ccccagatga tcccccagaa ctcttccttc tgccccccga 120
<210> 26
<211> 120
<212> DNA
<213> 人工合成
<400> 26
aagcgtgatt ccaattgttt tagaggtcag tgctaggata gccataactg tacttggtct 60
aagataaaaa tcacattctc cttcccttcc ggtggcacgt tctctatgct tcctactaaa 120
<210> 27
<211> 120
<212> DNA
<213> 人工合成
<400> 27
gcgggacggg gactcacagg agatgcagga cggcccgaac atagtaattc ctggtaaagg 60
gcccgaacag cttcaccacg gcggtcatgt acttctgtcc cctgggggag ggaggaaggc 120
<210> 28
<211> 120
<212> DNA
<213> 人工合成
<400> 28
ttgggcaaag gcttggcagt aagagaataa aggtggggct tgatgggcca gaggataagt 60
gactcctcaa ggtcacaaga caccctgatg gctgggaccc catctctgat ggagcaaggc 120
<210> 29
<211> 120
<212> DNA
<213> 人工合成
<400> 29
ggaggagggg aatggggcag gtggaagggg ccccagcacc caggtatcac ctgaccacca 60
ccgaagccca cccccacgga ggaaggatgg tgcattcaag gaacccagag accacagggc 120
<210> 30
<211> 120
<212> DNA
<213> 人工合成
<400> 30
gtggcgccgc agagctcacc tgaggaacag ggcacaggtg ctctggccca gcacatagtc 60
gggaattacg tcgccaaatt cccagggcac attgcgcacg aacttcagta cgggattgcc 120
<210> 31
<211> 120
<212> DNA
<213> 人工合成
<400> 31
gggctgggca tgcccagggc aggtgtgggg cctgtagtgg ggcagcagca actggtgggt 60
gcccctctag tgggcgctca gctcacagct gctcaaatgg gaacaggtgg gaagctgctg 120
<210> 32
<211> 120
<212> DNA
<213> 人工合成
<400> 32
atggggcaag tgatgcccat gtcggtgcat gccttcacaa agcggaagaa tgtgtcagcc 60
tcaaagaaaa gctgcgtgat gatgaaatcg gctcccgcag acaccttctc cttcaagtgc 120
<210> 33
<211> 120
<212> DNA
<213> 人工合成
<400> 33
ccaaccccag ggctctatgg gaaggaccag caggaggcag ccctggtgga catggtgaat 60
gacggcgtgg aggacctccg ctgcaaatac atctccctca tctacaccaa ctatgtgagc 120
<210> 34
<211> 120
<212> DNA
<213> 人工合成
<400> 34
cccaaatatt ctccaggcgt ttcttccatc cttccaggat ttgaattcgg gcgtctgctg 60
gagtgtgccc aatgctatat gtcagttgag gttctaagac ttggaagcca cagaaatgca 120
<210> 35
<211> 120
<212> DNA
<213> 人工合成
<400> 35
tagcattcta attccagcag gattcttacc tggtagccag aatcattaca ggtcatgtag 60
catttaccac agttgataca catttcttca tcaatcatag ccacaacttg ctctacgttg 120
<210> 36
<211> 120
<212> DNA
<213> 人工合成
<400> 36
tcgagcagca gaaaaaagtt gatgctgaga cagttgggag agtgaagagg tttattcagg 60
agaatgtctt tgtggcagcg aatcataatg gttctcccct ttctataaag gaagcaccca 120
<210> 37
<211> 120
<212> DNA
<213> 人工合成
<400> 37
gatgaaatgt ttatttgtag ttttcaacca gatacgatct acccactcca aaggcataat 60
gtcataaata gaaagaaact actgacacac gttttaaaat aacctaccaa cattgcagat 120
<210> 38
<211> 120
<212> DNA
<213> 人工合成
<400> 38
ctcaccctga cttctccccc tccctacccg cgcgcaggcc aagttgctga atcaatggag 60
ccctccccaa cccgggcgtt ccccagcgag gcttccttcc catcctcctg accaccgggg 120
<210> 39
<211> 120
<212> DNA
<213> 人工合成
<400> 39
aggagttggt taggaaaaca gatgcttccc tttttgactt accaaggaaa tggagatcca 60
aaggaaagcc tgaagcactt tgtggcttcc acgggttcgt ttctaggaag cttttgcttt 120
<210> 40
<211> 120
<212> DNA
<213> 人工合成
<400> 40
gcgctggccg ggcacaggat gcgcggcccg gagagcgcat cccggccatc cgcccgcgct 60
cggccccgca gcgcagctgc tgcagatccg cgggggccgc cacctcctcc gggggctggc 120
<210> 41
<211> 120
<212> DNA
<213> 人工合成
<400> 41
aacacctctc acgcatgcgc attgtagtct tcccacctcc cacaagatgg cggagggcaa 60
gtagcaaggg ggcggggtgt ggccgccgga agcctagccg ctgctcgggg gggacctgcg 120
<210> 42
<211> 120
<212> DNA
<213> 人工合成
<400> 42
cttgcgcttt atattttttt taacaaaatg tattcatctt tcttggaact gaaaaataaa 60
tctatgtaca aaacaggaag agatcaggct cttgtcaccc actcctaacc ctctgcagat 120
<210> 43
<211> 120
<212> DNA
<213> 人工合成
<400> 43
tctttttttt ttgttaataa agtagaataa catttatttc ttaaaatttt tattatacat 60
gctgtattca tggaaaacca agatctttaa aggaactcaa attagatata aattatgttc 120
<210> 44
<211> 120
<212> DNA
<213> 人工合成
<400> 44
ctcgcgagga ggcgtgccct gcggccgggc gtgcggtgtc cgcggcggcg cagggagggg 60
gagggaggta aacaagatgg cggcggcgtg tcgggcgcgg aagggggagg cggcccgggg 120