CN109517889A - 一种基于高通量测序分析寡核苷酸序列杂质的方法及应用 - Google Patents
一种基于高通量测序分析寡核苷酸序列杂质的方法及应用 Download PDFInfo
- Publication number
- CN109517889A CN109517889A CN201710840332.4A CN201710840332A CN109517889A CN 109517889 A CN109517889 A CN 109517889A CN 201710840332 A CN201710840332 A CN 201710840332A CN 109517889 A CN109517889 A CN 109517889A
- Authority
- CN
- China
- Prior art keywords
- sequence
- product
- oligonucleotide sequence
- impurity
- extension primer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6848—Nucleic acid amplification reactions characterised by the means for preventing contamination or increasing the specificity or sensitivity of an amplification reaction
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biomedical Technology (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种基于高通量测序分析寡核苷酸序列杂质的方法及应用。本发明的方法包括如下步骤:构建用于寡核苷酸序列杂质分析的高通量测序文库;将所述高通量测序文库进行高通量测序,并根据测序结果对寡核苷酸序列组分进行分析;所述构建高通量测序文库中所使用的延伸引物序列依次由序列2第1‑22位所示的DNA分子和N个碱基A或碱基T或碱基C或碱基G组成;所述N为大于等于6的整数。通过实验证明:本发明的基于高通量测序分析寡核苷酸序列杂质的方法可以快速、准确和全面的对寡聚核苷酸序列中各组分纯度和含量进行分析。
Description
技术领域
本发明属于生物技术领域,具体涉及一种基于高通量测序分析寡核苷酸序列杂质的方法及应用。
背景技术
近年来,国内外越来越多的制药企业纷纷涉足基因药物,投入巨资用于研制新型基因药物以对抗各种疾病。反义寡聚脱氧核苷酸技术是利用能与RNA互补的人工合成或生物合成的DNA或RNA,封闭和抑制与疾病发生相关基因表达的一种治疗手段,可用于治疗由于基因突变所致的肿瘤或遗传疾病。
反义技术是一种新的药物开发方法,利用这一技术研制的药物称为反义药物,涉及反义DNA、反义RNA及核酶(ribozyme)。根据核酸杂交原理,反义药物能与特定基因杂交,在基因水平上干扰致病蛋白的产生,即干扰遗传信息从核酸向蛋白质的传递。传统药物主要直接作用于致病蛋白本身,反义药物则作用于产生蛋白质的基因。与传统药物相比,反义药物具有更高的选择性和效率,可广泛用于多种疾病的治疗,如传染病、炎症、心血管疾病及肿瘤等。
基因治疗是指将外源正常基因导入靶细胞,以纠正或补偿因基因缺陷和异常引起的疾病,以达到治疗目的。从广义说,基因治疗还可包括从DNA水平采取的治疗某些疾病的措施和新技术。
反义DNA主要指反义寡聚脱氧核苷酸(antisense oligodeoxynucleotide,AS-ODN),AS-ODN是一种与靶基因mRNA的一个或多个位点(互补区)互补、人工合成的短序列单链DNA片段,能抑制或减少靶基因的表达。AS-ODN可作用于不同目标:与双链DNA结合调节转录;与mRNA前体或剪接点结合抑制mRNA前体剪接,并影响剪接后的mRNA从核运至细胞质;与胞质中mRNA结合阻断翻译;与特异蛋白质结合调节基因表达。
由于反义DNA是人工合成的序列,在合成过程中存在碱基插入及缺少的情况,导致合成的DNA含有大量的杂质,并且合成的序列纯化后用于制药,因此需要对纯化的各序列组分进行分析和确认。但对于单链寡核酸序列的分析,目前没有很好的解决办法。
发明内容
本发明要解决的技术问题是如何快速、准确和全面的分析人工合成的寡聚核苷酸序列中各组分序列的组成及其纯度和/或含量。
为了解决上述技术问题,本发明首先提供了一种用于寡核苷酸序列杂质分析的高通量测序文库的构建方法。
本发明提供的用于寡核苷酸序列杂质分析的高通量测序文库的构建方法包括如下步骤:
1)将待检测寡核苷酸序列的3’端加poly尾,得到加poly尾产物;
2)将所述加poly尾产物进行反向延伸并扩增,得到反向延伸并扩增产物;
所述反向延伸并扩增所使用的引物由所述待检测寡核苷酸和延伸引物组成;
所述延伸引物序列依次由序列2第1-22位所示的DNA分子和N个碱基A或碱基T或碱基C或碱基G组成;所述N为大于等于6的整数;
3)将所述反向延伸并扩增产物进行沉淀,得到沉淀后产物;
4)将所述沉淀后产物依次进行末端修复、加A尾、连接头和PCR扩增,得到高通量测序文库。
上述方法中,所述寡核苷酸的长度可为8-120bp。所述寡核苷酸可为单链DNA或双链DNA。在本发明的具体实施例中,所述寡核苷酸为单链DNA,其核苷酸序列为序列5,大小为21bp。
上述方法中,步骤1)中,所述poly尾可为poly A尾或poly G尾或polyC尾或poly T尾;在本发明的具体实施例中,所述poly尾为poly A尾;
所述将待检测寡核苷酸序列的3’端加poly尾的方法具体如下:将末端转移酶1.5μL、待检测寡核苷酸1μL、dATP(或dTTP或dCTP或dGTP)(25μM)0.5μL、5×TdT Buffer 4μL和不含核酸酶的水混匀,得到反应体系(总体积为20μL)。所述待检测寡核苷酸在反应体系中的终浓度为5μM。
上述方法中,步骤2)中,所述N可为任一大于等于6的整数。在本发明的具体实施例中,所述N具体为20。当N为20时,所述延伸引物序列为序列1所示的DNA分子或序列2所示的DNA分子或序列3所示的DNA分子或序列4所示的DNA分子。在本发明的具体实施例中,所述延伸引物序列为序列1所示的DNA分子。
所述反向延伸并扩增反应的体系(总体积为50μL)由2×Phata Max Buffer 25μL、dNTPS(10mM)2μL、延伸引物2μL、待检测寡核苷酸1μL、DNA聚合酶I 1μL和不含核酸酶的水组成。所述延伸引物在反向体系中的终浓度为4μM;所述待检测寡核苷酸在反向体系中的终浓度为2μM。
上述方法中,步骤3)中,所述沉淀采用的方法为醋酸钠沉淀;将反向延伸并扩增产物进行醋酸钠沉淀的方法具体如下:
3a)向反向延伸并扩增产物中加入醋酸钠、无水乙醇和糖元;
3b)离心,弃上清液,收集沉淀;
3c)向所述沉淀中加入乙醇,离心,弃上清液,收集沉淀。
所述步骤3a)中,向反向延伸并扩增产物中加入1/10体积的醋酸钠、2.5倍体积的无水乙醇和1μL的糖元;所述醋酸钠的pH为5.2;所述糖元浓度为20mg/mL;
所述步骤3b)中,所述离心的条件为12000rpm,4℃离心30分钟;
所述步骤3c)中,所述离心的条件为12000rpm,4℃离心5分钟;所述乙醇为体积分数为80%的乙醇;
所述步骤3a)和所述步骤3b)之间还包括-80℃放置30分钟的步骤;所述步骤3c)重复一次。
上述方法中,步骤4)中,将所述沉淀后产物依次进行末端修复、加A尾、连接头和PCR扩增的方法具体如下:
4a)将所述沉淀后产物进行末端修复加A尾,得到修复后产物;
4b)将所述修复后产物加接头,得到加接头产物;
4c)将所述加接头产物进行PCR扩增,得到扩增产物,即为用于寡核苷酸序列杂质分析的高通量测序文库。
所述步骤4a)中,将所述沉淀后产物进行末端修复加A尾的方法具体如下:将沉淀后产物15μL、10×末端修复缓冲液3μL、T4DNA聚合酶2μL、T4Polynucleotide Kinase(T4PNK)2μL、Klenow DNA polymerase I 0.5μL、Bst DNA Pol I large Fragment0.5μL和不含核酸酶的水7μL混匀,反应。
所述步骤4b)中,将所述修复后产物加接头的方法具体如下:将修复后产物30μL、10×T4DNA Ligase Buffer 15μL、T4DNA Ligase 2μL、Y型接头2μL和不含核酸酶的水1μL混匀,反应。
所述步骤4c)中,将所述加接头产物进行PCR扩增的方法具体如下:将加接头产物5μL、引物各2μL、dNTP mix(10mM)1μL、2×Phanta Max Buffer 25μL、Phanta Max SuperFide DNA Polymerase 1μL和不含核酸酶的水14μL混匀,反应。所述引物在反应体系中的终浓度为1μM。
所述步骤4b)和所述步骤4c)之间还包括纯化的步骤,所述纯化可采用磁珠进行。
所述步骤4c)后还包括纯化的步骤,所述纯化可采用硅胶柱进行。
为了解决上述技术问题,本发明又提供了一种产品。
本发明的产品为如下a1)-a3)中的任一种:
a1)上述延伸引物;
a2)含有a1)所述的延伸引物的PCR试剂;
a3)含有a1)所述的延伸引物或a2)所述的PCR试剂的试剂盒。
上述产品中,所述延伸引物在所述PCR试剂中的终浓度为0.1~100μM。在本发明的具体实施例中,所述延伸引物在所述PCR试剂中的终浓度为100μM。
上述产品在构建用于寡核苷酸序列杂质分析的高通量测序文库中的应用也属于本发明的保护范围。
上述产品在寡核苷酸序列杂质分析中的应用也属于本发明的保护范围。
为了解决上述技术问题,本发明还提供了一种寡核苷酸序列杂质的分析方法。
本发明提供的寡核苷酸序列杂质的分析方法包括如下步骤:
(1)按照上述方法构建用于寡核苷酸序列杂质分析的高通量测序文库;
(2)将所述高通量测序文库进行高通量测序,并根据测序结果对核苷酸序列组分进行分析。
为了解决上述技术问题,本发明最后提供了上述方法的新用途。
本发明提供了上述方法在分析人工合成的用于基因治疗的反义寡聚核苷酸序列组分中的应用。
本发明还提供了上述方法在分析人工合成的用于基因治疗的反义寡聚核苷酸序列中各组分纯度和/或含量中的应用。
通过实验证明:本发明的基于高通量测序分析寡核苷酸序列杂质的方法可以快速、准确和全面的对寡聚核苷酸序列中各组分纯度和含量进行分析。
附图说明
图1为基于高通量测序分析寡核苷酸序列杂质的方法流程图。
图2为醋酸钠沉淀产物的电泳检测结果。
图3为PCR扩增产物的电泳检测结果。
图4为纯化后的PCR扩增产物的电泳检测结果。
图5为高通量测序数据分析结果。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中的T4DNA聚合酶为NEB(北京)有限公司的产品,产品目录号为M0203L。DNA Polymerase I和Large(Klenow)Fragment均为NEB公司的产品,产品目录号为M0210S,在下文中,DNA Polymerase I、Large(Klenow)Fragment称为DNA聚合酶I。T4Polynucleotide Kinase为NEB公司的产品,产品目录号为M0201。Klenow DNApolymerase I和Bst DNA Pol I large Fragment为NEB公司的产品,产品目录号为M0275。T4DNA Ligase为NEB公司的产品,产品目录号为M0202L。末端转移酶为赛默飞世尔科技(中国)有限公司的产品,产品目录号为EP0162。脱氧腺苷三磷酸为赛默飞世尔科技(中国)有限公司的产品,产品目录号为10216018。Phanta Max Super Fide DNA Polymerase为南京诺唯赞生物科技有限公司的产品,产品目录号为P505。
下述实施例中的10×末端修复缓冲液配方:溶质及其浓度为900mM MgCl2、30mMDTT、10mM ATP、1μg/μL BSA和4mM dNTPs;溶剂为pH8.3、500mM的Tris-HCl缓冲液。
实施例1、一种基于高通量测序分析寡核苷酸序列杂质的方法
一、寡核苷酸加poly尾
1、在寡核苷酸序列的3’端加poly A尾,按照表1中的各试剂及加入量配制加尾反应体系。寡核苷酸序列如下:5’-CAGAGCAGCTTGTCTTTCTTC-3’(序列5)。寡核苷酸序列由上海捷瑞生物工程有限公司合成。
表1为加尾反应体系
试剂 | 加入量(μL) |
不含核酸酶的水 | 13 |
寡核苷酸(100μM) | 1 |
dATP(25μM) | 0.5 |
5×TdT Buffer | 4 |
末端转移酶 | 1.5 |
总体积 | 20μL |
2、37℃反应25min。
3、70℃反应10min,失活末端转移酶。
二、反向延伸并扩增
1、向上述步骤一得到的反应产物中加入表2中所示的各试剂,配制反向延伸扩增体系。
表2为反向延伸扩增体系
延伸引物extpT序列如下:
5’-GAGACACGAATAGACGGCACGATTTTTTTTTTTTTTTTTTTT-3’(序列1)。
2、将步骤1中配制的反向延伸扩增体系置于PCR仪上进行表3所示的反应程序。
表3为反向延伸扩增程序
三、醋酸钠沉淀
1、取步骤二得到的产物,加入1/10体积的醋酸钠(pH5.2)、2.5倍体积的无水乙醇和1μL浓度为20mg/mL的糖元。
2、-80℃放置30分钟。
3、12000rpm,4℃离心30分钟,弃上清,收集沉淀。
4、向沉淀中加入1mL 80%的乙醇,然后12000rpm,4℃离心5分钟,弃上清,收集沉淀。
5、重复步骤4一次。
6、室温晾干,加入30μL TE溶解。
7、沉淀产物质检。具体步骤如下:配制12%PAGE凝胶,200V电泳40分钟,于暗盒中染色10分钟,于凝胶成像系统中成像拍照。电泳检测结果如图2所示。
四、末端修复
1、按照表4中的各试剂及加入量配制末端修复反应体系。配制后混匀,瞬时离心。
表4为末端修复反应体系
2、将步骤1中的末端修复反应体系在PCR仪上执行表5所示的程序。
表5为PCR反应程序
segment1 | 20℃30分钟 |
segment2 | 65℃30分钟 |
segment3 | 10℃保存 |
五、接头连接
1、按照表6中的各试剂及加入量配制接头连接反应体系。配制后混匀,瞬时离心。
表6为接头连接反应体系
试剂 | 加入量(μL) |
末端修复产物 | 30 |
不含核酸酶的水 | 11 |
10×T4DNA Ligase Buffer | 5 |
Y型接头(40μM) | 2 |
T4DNA Ligase | 2 |
总体积 | 50 |
上述Y型接头由UAF和AI5组成,其序列分别如下:
UAF(下划线标记的碱基进行硫代修饰):5-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT;
AI5(下划线标记的碱基进行磷酸修饰):5-GATCGGAAGAGCACACGTCTGAACTCCAGTCACACAGTGATCTCGTATGCCGTCTTCTGCTTG。
上述Y型接头序列均由上海捷瑞生物工程有限公司合成。接头在接头连接反应体系中的浓度均为1.6μM。
2、将接头连接反应体系置于PCR仪上16℃反应2小时,得到接头连接产物。
六、接头连接产物纯化
1、振荡Ampure XP磁珠(贝克曼库尔特有限公司生产的Agencourt AMPure XPKit,产品目录号为A63880),充分混匀;
2、向上述步骤五中获得的连接产物中加入1×的Ampure XP磁珠,用移液器混匀10次,室温放置1分钟;
3、置于磁力架上吸附5分钟,弃上清;
4、向磁珠中加入200μL新鲜配制的80%的乙醇,室温放置30s,弃上清;
5、重复一次上述步骤4;
6、加入50μL浓度为10mM Tris-Hcl(pH8.0)洗脱,转移上清至新的离心管中;
7、加入1倍体积的磁珠,用移液器混匀10次,室温放置1分钟;
8、向磁珠中加入200μL新鲜配制的80%的乙醇,室温放置30s,弃上清;
9、重复一次上述步骤8;
10、开盖室温放置10分钟;
11、加入50μL浓度为10mM Tris-Hcl(pH8.0),用移液器混匀,室温放置1分钟;
12、置于磁力架上5分钟,转移上清至新的离心管中,得到纯化后的接头连接产物。
七、接头连接产物PCR扩增
1、向纯化后的接头连接产物中加入表7中的各试剂,加入量也按照表7所示,配制PCR扩增体系。
表7为PCR扩增体系
引物mPF序列如下(由上海捷瑞生物工程有限公司合成):AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT;
引物mRPI5序列如下(由上海捷瑞生物工程有限公司合成):CAAGCAGAAGACGGCATACGAGATCACTGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT。上述引物序列中,下划线标记的碱基进行硫代修饰。
2、以45μL/管分装至PCR管中,然后加入5μL连接产物。
3、将PCR扩增体系置于PCR仪中,按照表8所示的PCR反应程序进行扩增,得到PCR扩增产物。将PCR扩增产物进行凝胶电泳检测,结果如图3所示。
表8为PCR反应程序
八、PCR扩增产物纯化
1、切取上述电泳中所需条带,用上海捷瑞生物工程有限公司的琼脂糖凝胶DNA回收试剂盒(离心柱型,GK2042-50)进行凝胶回收。
2、向凝胶中加入400μL Binding Solution,置于50℃水浴锅中,至胶块溶解。
3、期间每隔2分钟摇动一次。
4、将溶好的胶块转移至硅胶柱中,室温放置2分钟,6000转/分离心1分钟,弃废液。
5、向硅胶柱中加入500μL Washing Solution,室温放置3分钟。
6、12000转/分离心1分钟,弃废液。
7、重复一次步骤6。
8、12000转/分离心1分钟,转移硅胶柱至新的1.5mL离心管中。
9、向硅胶柱中加入30μL不含核酸酶的水,室温放置2分钟。
10、12000转/分离心1分钟,收集上清液,得到纯化后PCR扩增产物。将纯化后PCR扩增产物进行电泳检测,结果如图4所示,其中,M:20bp DNA Ladder;1:文库胶回收产物,从图中可以看出,成功得到高通量测序文库。
九、高通量测序及数据分析
1、高通量测序
取步骤八构建好的文库用Hiseq 3000平台用单端150bp测序模式进行测序。
2、高通量测序结果分析
使用trimmomatic-0.33软件(trimmomatic-0.33软件的网址如下:https://www.usadellab.org/cms/index.php?page=trimmomatic)去除读段3’末端低质量的碱基,用自行编写的per脚本ExtractValid.pl提取含有接头的正向测序的读段,使用cutadapt1.2.1软件(cutadapt1.2.1软件的网址如下:https://github.com/marcelm/cutadapt/releases/tag/v1.2.1)去除读段中的PolyA接头,用自行编写的per脚本FilterTN.pl去除含有N及PolyT接头的读段,用自行编写的perl脚本trim_polytail.pl去除末端由于dNTP不纯而加入的含有错误碱基的Poly尾,用自行编写perl脚本FastQ_ReadFilterByLength.pl过滤过长或短的读段,用FASTX Toolkit 0.0.13软件(FASTXToolkit 0.0.13软件的网址如下:https://hannonlab.cshl.edu/fastx_toolkit/)中的fastx_collapser模块合并重复序列,去除只有一个数目的读段。根据如下公式计算寡核苷酸各组分的纯度:各组分比率(%)=该组分读段数目/各组分读段数目之和×100%。
结果如表9和图5所示。从结果可以看出:在获得的9664589条寡核苷酸序列中,与寡核苷酸序列(CAGAGCAGCTTGTCTTTCTTC)完全一致的寡核苷酸序列共有7830352条,其比率为81.02%。与寡核苷酸序列相比,5’端缺少部分序列的寡核苷酸序列共有1331990条,其比率为13.78%;与寡核苷酸序列相比,3’端缺少部分序列的寡核苷酸序列共有144439条,其比率为1.49%,与寡核苷酸序列相比,5’端和3’端均缺少部分序列的寡核苷酸序列共有18697条,其比率为0.19%,还有一些其他情况(如插入、缺失、掺入错误的碱基等)的寡核苷酸序列,共有339111条,其比率为3.51%。上述结果表明:本发明的方法可以准确、全面的分析寡核苷酸序列中各组分的含量及其所占比率。
表9为数据分析结果
注:寡核苷酸序列为CAGAGCAGCTTGTCTTTCTTC。
3、数据分析
首先使用ncbi-blast-2.2.28+软件(ncbi-blast-2.2.28+软件的网址如下:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.2.28/)与寡核苷酸参考序列进行比对;用自行编写的脚本对比对结果进行解析,并对解析的结果进行标准化,再对标准化的结果进行分类,最后对分类的结果进行统计。
含量大于0.1%的组分及含量的分析结果如表10所示。N-1的读段数和N+1的读段数的分析结果如表11和表12所示。从表中可以看到,含量大于0.1%的各组分的寡核苷酸序列及其含量,N-1的读段数和N+1的读段数中各组分的含量及比率。
表10为含量大于0.1%的组分及含量
组分编号 | 组分 | 比率(%) |
1-7830352 | CAGAGCAGCTTGTCTTTCTTC | 81.02% |
2-209704 | GCTTGTCTTTCTTC | 2.17% |
3-204757 | AGAGCAGCTTGTCTTTCTTC | 2.12% |
4-182418 | CAGCTTGTCTTTCTTC | 1.89% |
5-165497 | GAGCAGCTTGTCTTTCTTC | 1.71% |
6-157170 | GCAGCTTGTCTTTCTTC | 1.63% |
7-154399 | AGCAGCTTGTCTTTCTTC | 1.60% |
8-133435 | CTTGTCTTTCTTC | 1.38% |
9-122557 | AGCTTGTCTTTCTTC | 1.27% |
10-85682 | CAGAGCAGCTTGTCTTTCTT | 0.89% |
11-34227 | CAGAGCAGCTTGTCTTTCTC | 0.35% |
12-18571 | CAGAGCAGCTTGTCTTTCT | 0.19% |
13-18146 | CAGAGCAGCTTGTCTTCTTC | 0.19% |
14-15125 | CAGAGAGCTTGTCTTTCTTC | 0.16% |
15-13947 | CGGAGCAGCTTGTCTTTCTTC | 0.14% |
16-13400 | CTGAGCAGCTTGTCTTTCTTC | 0.14% |
17-11075 | CAGAGCAGCTTGTCTTTC | 0.11% |
18-10938 | CAAGCAGCTTGTCTTTCTTC | 0.11% |
19-9391 | CGAGCAGCTTGTCTTTCTTC | 0.10% |
其它 | 2.83% |
表11为N-1的读段数的分析结果
注:寡核苷酸序列为CAGAGCAGCTTGTCTTTCTTC。
表12为N+1的读段数的分析结果
注:寡核苷酸序列为CAGAGCAGCTTGTCTTTCTTC。
序列表
<110>苏州吉赛基因测序科技有限公司
<120>一种基于高通量测序分析寡核苷酸序列杂质的方法及应用
<160>5
<210>1
<211>42bp
<212>DNA
<213>人工序列
<220>
<223>
<400>1
gagacacgaa tagacggcac gatttttttt tttttttttt tt 42
<210>2
<211>42bp
<212>DNA
<213>人工序列
<220>
<223>
<400>2
gagacacgaa tagacggcac gacccccccc cccccccccc cc 42
<210>3
<211>42bp
<212>DNA
<213>人工序列
<220>
<223>
<400>3
gagacacgaa tagacggcac gaaaaaaaaa aaaaaaaaaa aa 42
<210>4
<211>42bp
<212>DNA
<213>人工序列
<220>
<223>
<400>4
gagacacgaa tagacggcac gagggggggg gggggggggg gg 42
<210>5
<211>21bp
<212>DNA
<213>人工序列
<220>
<223>
<400>5
cagagcagct tgtctttctt c 21
Claims (10)
1.一种用于寡核苷酸序列杂质分析的高通量测序文库的构建方法,包括如下步骤:
1)将待检测寡核苷酸序列的3’端加poly尾,得到加poly尾产物;
2)将所述加poly尾产物进行反向延伸并扩增,得到反向延伸并扩增产物;
所述反向延伸并扩增所使用的引物由所述待检测寡核苷酸和延伸引物组成;
所述延伸引物序列依次由序列2第1-22位所示的DNA分子和N个碱基A或碱基T或碱基C或碱基G组成;所述N为大于等于6的整数;
3)将所述反向延伸并扩增产物进行沉淀,得到沉淀后产物;
4)将所述沉淀后产物依次进行末端修复、加A尾、连接头和PCR扩增,得到高通量测序文库。
2.根据权利要求1所述的方法,其特征在于:
所述延伸引物序列为序列1所示的DNA分子。
3.根据权利要求1或2所述的方法,其特征在于:
所述寡核苷酸的长度为8-120bp。
4.根据权利要求1-3中所述的方法,其特征在于:
所述寡核苷酸为单链DNA或双链DNA。
5.产品,为如下a1)-a3)中的任一种:
a1)权利要求1中所述的延伸引物;
a2)含有a1)所述的延伸引物的PCR试剂;
a3)含有a1)所述的延伸引物或a2)所述的PCR试剂的试剂盒。
6.根据权利要求5所述的产品,其特征在于:
所述延伸引物在所述PCR试剂中的终浓度为0.1~100μM。
7.权利要求5或6所述的产品在构建用于寡核苷酸序列杂质分析的高通量测序文库中的应用;
或,权利要求5或6所述的产品在寡核苷酸序列杂质分析中的应用。
8.一种寡核苷酸序列杂质的分析方法,包括如下步骤:
(1)按照权利要求1所述的方法构建用于寡核苷酸序列杂质分析的高通量测序文库;
(2)将所述高通量测序文库进行高通量测序,并根据测序结果对寡核苷酸序列组分进行分析。
9.权利要求8所述的方法在分析人工合成的用于基因治疗的反义寡聚脱氧核苷酸序列组分中的应用。
10.权利要求8所述的方法在分析人工合成的用于基因治疗的反义寡聚脱氧核苷酸序列中各组分纯度和/或含量中的应用。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710840332.4A CN109517889B (zh) | 2017-09-18 | 2017-09-18 | 一种基于高通量测序分析寡核苷酸序列杂质的方法及应用 |
PCT/CN2018/101878 WO2019052322A1 (zh) | 2017-09-18 | 2018-08-23 | 一种基于高通量测序分析寡核苷酸序列杂质的方法及应用 |
JP2020537274A JP7034299B2 (ja) | 2017-09-18 | 2018-08-23 | ハイスループットシークエンシングに基づくオリゴヌクレオチド配列不純物の分析方法及び使用 |
EP18857038.6A EP3680346A4 (en) | 2017-09-18 | 2018-08-23 | METHOD OF ANALYSIS OF THE CONTAMINATION OF AN OLIGONUCLEOTIDE SEQUENCE IMPURITY BASED ON HIGH-PERFORMANCE SEQUENCING AND USE |
US16/648,529 US11597922B2 (en) | 2017-09-18 | 2018-08-23 | Method for analyzing impurities of oligonucleotide sequence based on high-throughput sequencing and application |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710840332.4A CN109517889B (zh) | 2017-09-18 | 2017-09-18 | 一种基于高通量测序分析寡核苷酸序列杂质的方法及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109517889A true CN109517889A (zh) | 2019-03-26 |
CN109517889B CN109517889B (zh) | 2022-04-05 |
Family
ID=65722418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710840332.4A Active CN109517889B (zh) | 2017-09-18 | 2017-09-18 | 一种基于高通量测序分析寡核苷酸序列杂质的方法及应用 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11597922B2 (zh) |
EP (1) | EP3680346A4 (zh) |
JP (1) | JP7034299B2 (zh) |
CN (1) | CN109517889B (zh) |
WO (1) | WO2019052322A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114277113A (zh) * | 2021-11-24 | 2022-04-05 | 北京擎科生物科技有限公司 | 用于检测寡核苷酸合成质量的方法及系统 |
CN115491410A (zh) * | 2022-10-18 | 2022-12-20 | 浙江大学 | 二氧化钛/锌铝水滑石类氧化物纳米材料在寡核苷酸测序中的应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015054247A1 (en) * | 2013-10-07 | 2015-04-16 | The University Of North Carolina At Chapel Hill | Detection of chemical modifications in nucleic acids |
WO2016010856A1 (en) * | 2014-07-15 | 2016-01-21 | Qiagen Sciences, Llc | Semi-random barcodes for nucleic acid analysis |
CN105463585A (zh) * | 2014-09-12 | 2016-04-06 | 清华大学 | 基于单链dna分子构建测序文库的方法及其应用 |
CN105754995A (zh) * | 2016-04-19 | 2016-07-13 | 清华大学 | 构建待测基因组的dna测序文库的方法及其应用 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4069133B2 (ja) * | 2004-11-19 | 2008-04-02 | 財団法人富山県新世紀産業機構 | 生物試料に含まれる目的遺伝子を増幅する方法 |
WO2015111209A1 (ja) * | 2014-01-27 | 2015-07-30 | 株式会社日立製作所 | 核酸増幅反応後の反応液の解析方法、解析装置及び核酸増幅反応後の反応液処理装置 |
-
2017
- 2017-09-18 CN CN201710840332.4A patent/CN109517889B/zh active Active
-
2018
- 2018-08-23 US US16/648,529 patent/US11597922B2/en active Active
- 2018-08-23 WO PCT/CN2018/101878 patent/WO2019052322A1/zh unknown
- 2018-08-23 JP JP2020537274A patent/JP7034299B2/ja active Active
- 2018-08-23 EP EP18857038.6A patent/EP3680346A4/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015054247A1 (en) * | 2013-10-07 | 2015-04-16 | The University Of North Carolina At Chapel Hill | Detection of chemical modifications in nucleic acids |
WO2016010856A1 (en) * | 2014-07-15 | 2016-01-21 | Qiagen Sciences, Llc | Semi-random barcodes for nucleic acid analysis |
CN105463585A (zh) * | 2014-09-12 | 2016-04-06 | 清华大学 | 基于单链dna分子构建测序文库的方法及其应用 |
CN105754995A (zh) * | 2016-04-19 | 2016-07-13 | 清华大学 | 构建待测基因组的dna测序文库的方法及其应用 |
Non-Patent Citations (2)
Title |
---|
MARIE-THERES GANSAUGE等: "Single-stranded DNA library preparation for the sequencing of ancient or damaged DNA", 《NATURE PROTOCOLS》 * |
陈苏红等: "Sanger 测序法确证硫代修饰反义脱氧寡核苷酸的序列", 《军事医学科学院》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114277113A (zh) * | 2021-11-24 | 2022-04-05 | 北京擎科生物科技有限公司 | 用于检测寡核苷酸合成质量的方法及系统 |
CN115491410A (zh) * | 2022-10-18 | 2022-12-20 | 浙江大学 | 二氧化钛/锌铝水滑石类氧化物纳米材料在寡核苷酸测序中的应用 |
CN115491410B (zh) * | 2022-10-18 | 2024-05-17 | 浙江大学 | 二氧化钛/锌铝水滑石类氧化物纳米材料在寡核苷酸测序中的应用 |
Also Published As
Publication number | Publication date |
---|---|
CN109517889B (zh) | 2022-04-05 |
EP3680346A1 (en) | 2020-07-15 |
US11597922B2 (en) | 2023-03-07 |
US20210095270A1 (en) | 2021-04-01 |
JP2020534868A (ja) | 2020-12-03 |
EP3680346A4 (en) | 2021-05-19 |
JP7034299B2 (ja) | 2022-03-11 |
WO2019052322A1 (zh) | 2019-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7091397B2 (ja) | 合成核酸スパイクイン | |
CN110734908B (zh) | 高通量测序文库的构建方法以及用于文库构建的试剂盒 | |
JP6017458B2 (ja) | 大量並列連続性マッピング | |
US20210155985A1 (en) | Surface concatemerization of templates | |
US8846347B2 (en) | Sequence tag directed subassembly of short sequencing reads into long sequencing reads | |
AU2014409073B2 (en) | Linker element and method of using same to construct sequencing library | |
CN106715713B (zh) | 试剂盒及其在核酸测序中的用途 | |
BR122021026781B1 (pt) | Transposon de preservação de contiguidade | |
JP6789935B2 (ja) | データの速度および密度を増大させるための多数のプライマーからのシーケンシング | |
CN106574266A (zh) | 用于下一代测序的文库生成 | |
CN110114472A (zh) | 将线性测序文库转换为环状测序文库的方法 | |
CN105647907A (zh) | 一种用于靶向杂交捕获的修饰性dna杂交探针的制备方法 | |
WO2018184495A1 (zh) | 一步法构建扩增子文库的方法 | |
CN115298323A (zh) | 靶向测序方法 | |
CN113463202B (zh) | 一种新的rna高通量测序的方法、引物组和试剂盒及其应用 | |
CN109517889A (zh) | 一种基于高通量测序分析寡核苷酸序列杂质的方法及应用 | |
CN110951827B (zh) | 一种转录组测序文库快速构建方法及其应用 | |
CN102559856B (zh) | 去除测序文库中的载体片段的方法 | |
CN109750092A (zh) | 一种靶向富集高gc含量目标dna的方法和试剂盒 | |
CN106636069B (zh) | 一种菰cDNA文库的构建方法 | |
Lu et al. | Chimera: The spoiler in multiple displacement amplification | |
CN114657239A (zh) | 用于多重pcr二代测序的引物组合、试剂盒及建库方法 | |
CN117222737A (zh) | 用于测序文库制备的方法和组合物 | |
CN105462958A (zh) | 双链dna的人工合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |