实施例2高通量测序文库构建
在本实施例中,采用接头元件通用引物P5和P7,其序列分别为SEQ ID NO.65和SEQID NO.66,接头元件采用突出末端接头,该接头是双核酸链分子,该双链核酸分子至少包括一突出末端,接头选为8个(即同时对8个样本进行检测),短链序列为SEQ ID NO.67,长链序列为SEQ ID NO.68-SEQ ID NO.75。SEQ ID NO.65-SEQ ID NO.75序列如下表所示:
2.1 DNA提取以及打断
收集受检者晨尿,1600g离心收集尿液脱落细胞,上清再使用16000g离心,收集尿上清,使用商业提取试剂盒进行尿液脱落细胞或尿上清进行DNA提取。取200-500ng DNA使用商业DNA打断试剂或超声打断仪器将DNA打断至200bp左右,提取的DNA凝胶电泳图谱如图1所示。
2.2末端修复
将除酶以外的试剂解冻,并震荡混匀,稍加离心于管底,反应体系如下:
将反应体系在20℃金属浴中反应30min,加入已平衡至室温的Ampure XP磁珠90ul(1.8倍体积),用移液器吹打10次,静置5min后,将1.5ml离心管放置在磁力架上约3min,待液体完全澄清,吸取上清液体丢弃,注意不要吸到磁珠。加入200ul 80%的乙醇,移液器吹打约5次,吸取上清液体丢弃,再加入200ul 80%乙醇重复洗涤1次,并将残留80%乙醇吸尽,室温开盖放置5min,加入45ul TE洗脱。
2.3末端加A
将除酶以外的试剂解冻,并震荡均匀,稍加离心于管底,反应体系如下:
将反应体系在37℃金属浴中反应30min,加入已平衡至室温的Ampure XP磁珠90ul(1.8倍体积),用移液器吹打10次,静置5min后,将1.5ml离心管放置在磁力架上约3min,待液体完全澄清,吸取上清液体丢弃,注意不要吸到磁珠。加入200ul 80%的乙醇,移液器吹打约5次,吸取上清液体丢弃,再加入200ul 80%乙醇重复洗涤1次,并将残留80%乙醇吸尽,室温开盖放置5min,加入35ul TE洗脱。
2.4去磷酸化
将除酶以外的试剂解冻,并震荡均匀,稍加离心于管底,反应体系如下:
将反应体系在50℃金属浴中反应30min,加入已平衡至室温的Ampure XP磁珠72ul(1.8倍体积),用移液器吹打10次,静置5min后,将1.5ml离心管放置在磁力架上约3min,待液体完全澄清,吸取上清液体丢弃,注意不要吸到磁珠。加入200ul 80%的乙醇,移液器吹打约5次,吸取上清液体丢弃,再加入200ul 80%乙醇重复洗涤1次,并将残留80%乙醇吸尽,室温开盖放置5min,加入21ul TE洗脱。
2.5 barcode接头连接
将除酶以外的试剂解冻,并震荡均匀,稍加离心于管底,反应体系如下:
将反应体系在20℃金属浴中反应20min,加入已平衡至室温的Ampure XP磁珠90ul(1.8倍体积),用移液器吹打10次,静置5min后,将1.5ml离心管放置在磁力架上约3min,待液体完全澄清,吸取上清液体丢弃,注意不要吸到磁珠。加入200ul 80%的乙醇,移液器吹打约5次,吸取上清液体丢弃,再加入200ul 80%乙醇重复洗涤1次,并将残留80%乙醇吸尽,室温开盖放置5min,加入15ul TE洗脱。
2.6多重PCR捕获目的片段
利用上述特异性引物,对膀胱癌突变基因的目标区域进行扩增,得到扩增产物。其中32条外侧引物按一定比例混合成primer mix 1、32条外侧引物按一定比例混合成primermix 2。
第一轮多重PCR的反应体系如下:
PCR反应条件如下:
95℃,5min;10-15cycs(95℃,30s;60℃,90s;72℃,30s);68℃,10min,4℃。
加入已平衡至室温的Ampure XP磁珠75ul(1.5倍体积),用移液器吹打10次,静置5min后,将1.5ml离心管放置在磁力架上约3min,待液体完全澄清,吸取上清液体丢弃,注意不要吸到磁珠。加入200ul 80%的乙醇,移液器吹打约5次,吸取上清液体丢弃,再加入200ul 80%乙醇重复洗涤1次,并将残留80%乙醇吸尽,室温开盖放置5min,加入15ul TE洗脱
第二轮多重PCR反应体系如下:
PCR反应条件如下:
95℃,5min;10-15cycs(95℃,30s;60℃,90s;72℃,30s);68℃,10min,4℃
加入已平衡至室温的Ampure XP磁珠75ul(1.5倍体积),用移液器吹打10次,静置5min后,将1.5ml离心管放置在磁力架上约3min,待液体完全澄清,吸取上清液体丢弃,注意不要吸到磁珠。加入200ul 80%的乙醇,移液器吹打约5次,吸取上清液体丢弃,再加入200ul 80%乙醇重复洗涤1次,并将残留80%乙醇吸尽,室温开盖放置5min,加入40ul TE洗脱。
2.7 PCR扩增富集,引入接头序列
PCR反应体系如下所示
PCR反应条件如下:
94℃,2min;15cycs(94℃,10s;60℃,30s;72℃,30s);72℃,5min,4℃
PCR扩增完毕后,加入已平衡至室温的Ampure XP磁珠90ul(1.8倍体积),用移液器吹打10次,静置5min后,将1.5ml离心管放置在磁力架上约3min,待液体完全澄清,吸取上清液体丢弃,注意不要吸到磁珠。加入200ul 80%的乙醇,移液器吹打约5次,吸取上清液体丢弃,再加入200ul 80%乙醇重复洗涤1次,并将残留80%乙醇吸尽,室温开盖放置5min,加入25ul TE洗脱
3、文库质检
使用Qubit/QPCR检测试剂盒对扩增后文库进行浓度定量。不同样品文库浓度在25ng/ul-32.6ng/ul之间。
使用Caliper、agilent 2100或琼脂糖凝胶电泳检测文库片段大小及引物二聚体残留情况。如图2所示,caliper检测主峰在260bp左右,微量或无引物二聚体污染。如果拖尾严重,大片段较多,可以使用磁珠或切胶回收去除大片段。
4、使用illumina测序仪及测序试剂,用PE75或PE150进行测序。
5、结果分析
使用Illumina bcl2fastq软件把测序的bcl文件转化成常见的测序原始数据格式FASTQ,同时使用样本标签序列区分出不同的样本。使用cutadapt软件去除双端测序(PE)序列中的测序引物序列。使用双端测序数据中的一端read1,截取其中的前Nbp(N为单分子标签序列长度加1),识别出设计的单分子标签序列,如果read2中也存在单分子标签序列则一同去除,同时记录每对序列的单分子标签序列,最后得到可用于下一步分析的序列c leanreads。
使用BWA软件比对clean reads和人类参考基因组GRCh38,根据目标位点引物的位置准确识别出各目标位点的序列,结合序列的单分子标签序列,输出支持目标位点的分子的起始、终止位置以及比对质量值等信息,根据分子的起始、终止位置和单分子标签序列,比较其目标位点的碱基,选取其中支持数最多的一种碱基,并计该位点分子支持数加1,最后得到各位点上不同碱基的分子支持数。选取其中支持分子数目较多的碱基,计算出各目标位点的等位基因型和突变频率。根据突变情况判断是否患膀胱癌。
收集临床病人尿液进行检测,以临床诊断结果为对照。收集了肿瘤患者和血尿患者晨尿65例,其中包括43例膀胱癌,22例增生或炎症患者,65例患者都获得了临床诊断报告,将实验结果以临床诊断为标准进行比对分析。
与临床诊断报告对比,真阴性样本21例,真阳性样本40例,假阳性1例,假阴性3例,特异性达到95.5%,敏感性达到93%。
使用本试剂盒通过高通量测序以及信息分析方法,检测出尿沉淀细胞中是否含引起肿瘤的基因突变,本发明阳性预测值和阴性预测值明显高于常规尿检和膀胱镜,在临床上有很高的运用价值。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 湖南优品司生物科技有限公司
<120> 一种基于高通量测序技术检测膀胱癌的试剂盒
<160> 75
<170> SIPOSequenceListing 1.0
<210> 1
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
agatctgtag tctttccgaa ctgtgtgg 28
<210> 2
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
tccctttggg ttataaatag tgcactca 28
<210> 3
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ctttaccata aaatcatatg ctccacta 28
<210> 4
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ctcactcacc cgcccgcgtc ccggtgca 28
<210> 5
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ttttttctgt ttttccagct catactct 28
<210> 6
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
caaatattaa agttagtagc aatgtgcc 28
<210> 7
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
atattcatct acaaagtggt tctggatt 28
<210> 8
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ttacacagac actctagtat ctggaaaa 28
<210> 9
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
aaccatgatt cttaccctgt gaggatga 28
<210> 10
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gaagaagtcc caaccatgac aagatttt 28
<210> 11
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
cattttcgta agtgttactc aagaagca 28
<210> 12
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
gcgccgcgag gagagggcgg ggccgcgg 28
<210> 13
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
catccaggag gcccgtgagc gatggaac 28
<210> 14
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
acacagagga agccttcgcc tgtcctca 28
<210> 15
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
catgggatcc acctgcagca tatgtttc 28
<210> 16
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
agagccagcc cccctactca cagccaca 28
<210> 17
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
aaccccaaaa gcatgttagt tttacacc 28
<210> 18
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
acgtaccaga tggatgtgaa ccccgagg 28
<210> 19
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
tggcccaact atggggccaa aagaaaaa 28
<210> 20
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tggccatgga accagacaga aaagcggc 28
<210> 21
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
aggggccgga ctcgtcatac tcctgctt 28
<210> 22
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tccactggtt tctgactgga tgtgctgg 28
<210> 23
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
cctcagcccc ctcaatgacc tccagtaa 28
<210> 24
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gcagtggcgg tggtggtgag ggaggggg 28
<210> 25
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
gcatccttca tgggaattta aaggagct 28
<210> 26
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
acgcaggatg gcatggggga gggcatac 28
<210> 27
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
ttgatgatac tcactgtcca tcagcctc 28
<210> 28
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gtagagattg gtgatcaata atcaccct 28
<210> 29
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
agcagctgag ccgcgactgt gatgcgct 28
<210> 30
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
caggcctcaa cgcccatgtc tttgcagc 28
<210> 31
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tgagaaatca atgtaaacac catcttac 28
<210> 32
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
ctcttccagg ccttcatgcc acatctca 28
<210> 33
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
nnnnnnnnnn nnnnnnnnnn gccatccagt tcactttagt agtccagc 48
<210> 34
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
nnnnnnnnnn nnnnnnnnnn gaataaaaat tctttgtgca acctacgt 48
<210> 35
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
nnnnnnnnnn nnnnnnnnnn acaaccctcc tgccatcata ttgaacac 48
<210> 36
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
nnnnnnnnnn nnnnnnnnnn gctgcggcat cagcagtgga gcctggtc 48
<210> 37
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
nnnnnnnnnn nnnnnnnnnn ttccgtcgct gactgaagtc aaatactt 48
<210> 38
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
nnnnnnnnnn nnnnnnnnnn ataatagttt tcattacctc tgtagtct 48
<210> 39
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
nnnnnnnnnn nnnnnnnnnn agctggattg tcagtgcgct tttcccaa 48
<210> 40
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
nnnnnnnnnn nnnnnnnnnn atggctttga atctttggcc agtacctc 48
<210> 41
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
nnnnnnnnnn nnnnnnnnnn ggatggaaaa gcctgcgcac aataaacg 48
<210> 42
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
nnnnnnnnnn nnnnnnnnnn cccttacctt ttttcatgaa gatgcata 48
<210> 43
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
nnnnnnnnnn nnnnnnnnnn gaaagggaag aattttttga tgaaacaa 48
<210> 44
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
nnnnnnnnnn nnnnnnnnnn gaaagggaag aattttttga tgaaacaa 48
<210> 45
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
nnnnnnnnnn nnnnnnnnnn ttcgactttg tcaccgagac accactgg 48
<210> 46
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
nnnnnnnnnn nnnnnnnnnn tgtattggtc tctcatggca ctgtactc 48
<210> 47
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
nnnnnnnnnn nnnnnnnnnn aaaaggctaa tcacagaagg atttaaat 48
<210> 48
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
nnnnnnnnnn nnnnnnnnnn ggctcagtct ccttaccagc agcagcaa 48
<210> 49
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
nnnnnnnnnn nnnnnnnnnn gggggatgat atgccacggg tgtattgt 48
<210> 50
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
nnnnnnnnnn nnnnnnnnnn gcaaatacag ctttggtgcc acctgcgt 48
<210> 51
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
nnnnnnnnnn nnnnnnnnnn gaacagcaac atgacctacg agaagctg 48
<210> 52
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
nnnnnnnnnn nnnnnnnnnn tgttagtcac tggcagcaac agtcttac 48
<210> 53
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
nnnnnnnnnn nnnnnnnnnn gctgatccac atctgctgga aggtggac 48
<210> 54
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
nnnnnnnnnn nnnnnnnnnn gctggctgaa ttgggagaaa ttcacctg 48
<210> 55
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
nnnnnnnnnn nnnnnnnnnn gggagggcaa gaagatatga acctgagc 48
<210> 56
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
nnnnnnnnnn nnnnnnnnnn tggcccctga gcgtcatctg cccccaca 48
<210> 57
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
nnnnnnnnnn nnnnnnnnnn ggaaagagtg ctcaccgcag ttccattc 48
<210> 58
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
nnnnnnnnnn nnnnnnnnnn ccctcgtaga tgggcacagt gtgggtga 48
<210> 59
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
nnnnnnnnnn nnnnnnnnnn cagttcagca aggggtcata gacaaagg 48
<210> 60
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
nnnnnnnnnn nnnnnnnnnn gttgtttgtt tcagtgactc cttcacac 48
<210> 61
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
nnnnnnnnnn nnnnnnnnnn aatggcgggc tgcatccagg aggcccgt 48
<210> 62
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
nnnnnnnnnn nnnnnnnnnn cgaggaggag ctggtggagg ctgacgag 48
<210> 63
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
nnnnnnnnnn nnnnnnnnnn caatgggatt ggtggacgtc tcctgtcc 48
<210> 64
<211> 48
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
nnnnnnnnnn nnnnnnnnnn tgccagagga tggccactcg gatcagct 48
<210> 65
<211> 58
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 66
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
caagcagaag acggcatacg a 21
<210> 67
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
attggcgctc ttccgatct 19
<210> 68
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
gatcggaaga gcacacgtct gaactccagt cacatcacgn nnnatctcgt atgccgtctt 60
ctgcttg 67
<210> 69
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 69
gatcggaaga gcacacgtct gaactccagt caccgatgtn nnnatctcgt atgccgtctt 60
ctgcttg 67
<210> 70
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 70
gatcggaaga gcacacgtct gaactccagt catctacgan nnnatctcgt atgccgtctt 60
ctgcttg 67
<210> 71
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 71
gatcggaaga gcacacgtct gaactccagt cactggtatn nnnatctcgt atgccgtctt 60
ctgcttg 67
<210> 72
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 72
gatcggaaga gcacacgtct gaactccagt cacggtagtn nnnatctcgt atgccgtctt 60
ctgcttg 67
<210> 73
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 73
gatcggaaga gcacacgtct gaactccagt cagccattgn nnnatctcgt atgccgtctt 60
ctgcttg 67
<210> 74
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 74
gatcggaaga gcacacgtct gaactccagt cacagatgan nnnatctcgt atgccgtctt 60
ctgcttg 67
<210> 75
<211> 67
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 75
gatcggaaga gcacacgtct gaactccagt cacgggtgcn nnnatctcgt atgccgtctt 60
ctgcttg 67