CN116103383B - 识别NGS接头oligo错误碱基的方法及其文库 - Google Patents

识别NGS接头oligo错误碱基的方法及其文库 Download PDF

Info

Publication number
CN116103383B
CN116103383B CN202310346454.3A CN202310346454A CN116103383B CN 116103383 B CN116103383 B CN 116103383B CN 202310346454 A CN202310346454 A CN 202310346454A CN 116103383 B CN116103383 B CN 116103383B
Authority
CN
China
Prior art keywords
ngs
library
sequence
sequencing
linker oligo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310346454.3A
Other languages
English (en)
Other versions
CN116103383A (zh
Inventor
李亮
苏敏
李敏靓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Bailige Biotechnology Co ltd
Original Assignee
Beijing Bailige Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Bailige Biotechnology Co ltd filed Critical Beijing Bailige Biotechnology Co ltd
Priority to CN202310346454.3A priority Critical patent/CN116103383B/zh
Publication of CN116103383A publication Critical patent/CN116103383A/zh
Application granted granted Critical
Publication of CN116103383B publication Critical patent/CN116103383B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明提供识别NGS接头oligo错误碱基的方法及其文库,所述方法通过单链DNA建库实现对NGS接头oligo的错误碱基的识别。本发明通过单链DNA建库的方式对接头oligo进行建库,可以不引入额外序列进行接头oligo合成,从而使得本发明最终的碱基错误情况反映的是接头oligo真实的合成情况,而不是现有方法引入了额外序列的oligo合成情况。

Description

识别NGS接头oligo错误碱基的方法及其文库
技术领域
本发明涉及二代测序领域,特别涉及识别NGS接头oligo错误碱基的方法及其文库。
背景技术
第二代测序技术(NGS)又称高通量测序,是目前应用最广泛的基因检测技术。在二代测序平台中,接头oligo是重要组成部分。接头oligo包含了p5与p7扩增引物结合序列、read1和read2测序引物结合序列、样本标签序列等,并且带有用于连接的5’磷酸修饰和用于A/T连接的3’-dT尾。接头oligo由两条oligo退火形成。接头oligo合成的碱基错误率检测目前没有合适的方法,用一代测序灵敏度和准确率不够,用二代测序在建库,测序和数据分析存在很大的技术难点。
在现有技术中,如图1所示,目的oligo序列两端各加上15nt的序列得到序列A,合成序列A的oligo。以两端15nt的序列作为引物,以序列A作为模板进行扩增后得到双链的序列A。用酶对序列A加磷酸基团加A尾后连接建库,得到NGS文库,测序分析。
如图2所示,该方法由于检测的是合成的序列A中间的目的oligo序列,只能间接地反映目的oligo的碱基合成情况,不能展示出真实的接头oligo合成情况。由于文库含有重复片段,该方法无法区分目标reads和测序引物错误结合测到的reads。
发明内容
为了解决上述技术问题,本发明提供识别NGS接头oligo的错误碱基的方法,所述方法通过单链DNA建库直接实现对NGS接头oligo的错误碱基的识别。
本发明提供识别NGS接头oligo的错误碱基的方法包括以下步骤:步骤1:用P5 接头oligo序列和P7 接头oligo合成所述NGS接头oligo;步骤2:用单链DNA建库试剂盒,在所述NGS接头先连接3端接头,然后连接5端接头,接着用index引物扩增,得到NGS文库;步骤3:对所述步骤2中得到的NGS文库进行纯化,去除非特异扩增产物,纯化得到用于上机测序的NGS文库;和步骤4:对上机测序的NGS文库得到的测序数据进行生信分析,识别所述NGS接头oligo的错误碱基。
在一种实施方式中,在步骤3中,通过切胶去除非特异扩增产物。
在一种实施方式中,所述生信分析流程包括数据预处理,以insert序列加polyC/polyG判断作为正确的reads,得到可用于分析的正确数据。
在一种实施方式中,所述生信分析流程依次包括:原始测序数据的质控,数据预处理,序列比对,和错误碱基识别。
在一种实施方式中,在所述数据预处理中:a. 当插入片段为P5 接头oligo时,对Read 2进行预处理分析:利用单链建库引入的polyG 进行处理,去除5’端polyG后,去除3’端测通后的无意义序列,去除质量低于20的碱基,保留长度大于65bp的序列,截取前70bp,去除含有测序P5接头序列,得到可用于分析的正确数据;b. 当插入片段为P7接头oligo时,对Read1进行预处理分析:利用单链建库引入的polyC 进行处理,去除polyC 及后面测序接头序列,去除质量低于20的碱基,保留长度大于60bp小于70bp的序列,去除含有测序P7接头的序列,得到可用于分析的正确数据。
在一种实施方式中,提过提供一种识别二代测序NGS接头oligo的错误碱基的NGS文库,所述文库通过以下方法合成:步骤1:用P5 接头oligo序列和P7 接头oligo合成所述NGS接头oligo;步骤2:用单链DNA建库试剂盒,在所述NGS接头先连接3端接头,然后二链延伸,之后连接5端接头,接着用index引物扩增,得到所述NGS文库。
在本发明中,用单链DNA(接头oligo)建库方案直接检测出接头oligo真实的合成情况。本发明通过单链DNA建库的方式对接头oligo进行建库,可以不引入额外序列进行接头oligo合成,而现有建库方法一的技术会引入额外序列进行接头oligo合成;从而使得本发明最终的碱基错误情况反映的是接头oligo真实的合成情况,而不是现有方法引入了额外序列的oligo的合成情况。
在本发明中,通过切胶纯化的方法,解决了对NGS接头oligo直接进行单链DNA建库的困难:NGS接头oligo(P5/P7)两端加上NGS接头形成完整文库,会导致文库中有大片段重复序列,在PCR扩增时除了目的文库得扩增,还会产生多聚体非特异扩增。我们将目的文库切胶,去除非特异扩增产物,纯化得到目的文库,增加了测序的准确性。
对NGS接头oligo(P5/P7)建库得到的文库中,含有两处相同的测序引物结合区,这会导致测序引物的测序结合,引发测序错误,illumina官方不建议此种文库的上机测序。我们加大测序数据量,每个文库分配5G以上数据量上机测序,这样在数据过滤后得到碱基错误率分析所需的数据量。由于测序引物会错误地结合到文库中间的NGS接头oligo上,导致产生的测序数据中一大部分不能用于碱基错误率生信分析,需要将这部分数据过滤后分析。
在测序分析流程中,通过本发明的数据预处理方法处理测序数据。常规的数据预处理方法是去除接头序列和低质量的reads。在本发明中,由于文库含有重复片段,本发明方法通过insert序列加polyC/polyG判断作为正确的reads,可以区分目标reads和测序引物错误结合测到的reads。在此基础上,判断正确的reads,去除由于测序引物错误结合产生的reads,得到可用于分析的正确数据。序列比对,碱基错误识别统计后,从而得到接头oligo的合成错误情况。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是现有方法NGS接头建库示意图。
图2是现有方法NGS接头建库的文库结构示意图。
图3是本发明方法的技术方案示意图。
图4是本发明方法NGS接头直接建库示意图。
图5是本发明方法的单链DNA建库试剂盒建库扩增结果图。
图6是本发明文库中两处相同的测序引物结合区示意图。
图7是本发明方法中生物信息分析流程示意图。
图8是本发明文库结构示意图。
图9是本发明P5接头Oligo的碱基错误率生信分析结果图。
图10是本发明P7接头Oligo的碱基错误率生信分析结果图。
实施方式
为了使本领域技术人员更好地理解本申请中的技术方案,下面将结合实施例对本发明作进一步说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都应当属于本申请保护的范围。下述实施例中,如无特殊说明,均为本领域常规方法。
一.首先合成Oligo接头,接头结构如下:
Figure SMS_1
[i5]和[i7]是8位的碱基组成的index序列,分别为GATATCGA、GGTTATAA。
本发明上述序列的合成在LK192合成仪、100nmol合成柱上通过固相亚磷酰胺三酯法实现。
二.单链DNA建库
如图3和4所示,对NGS接头oligo直接建库。使用ssDNA建库试剂盒,对单链的合成Oligo接头,先连接3端接头,然后二链延伸,之后连接5端接头,接着用index引物扩增,得到NGS文库,测序分析。本方法检测的是合成的目的oligo序列,可以直接反映目的oligo的碱基合成情况。本发明中,用单链DNA(接头oligo)直接建库方案检测出接头oligo真实的合成情况。
现有商品化单链DNA建库试剂盒(Scale ssDNA-seq Lib Prep Kit for IlluminaV2 ,Abclonal,RK20228)对接头oligo建库会产生大量非特异性扩增,因为接头oligo两端连上NGS接头后,进行PCR扩增;连接产物中含有重复的接头序列,会导致在扩增时产生非特异性扩增。在本发明中,对目的文库进行切胶纯化后,得到目的文库。
建库试剂盒:
名称 厂商 货号
Scale ssDNA-seq Lib Prep Kit for lllumina V2 ABclonal RK20228
Dual DNA Adapter 96 Kit for Illumina ABclonal RK20287
建库实验操作过程如下:
(一). T7 拖尾&连接
1. 预热 PCR 仪,反应温度设定为 37℃,热盖温度 105℃。
2. 按照下面体系配制 T7 Tailing&Ligation 体系:
试剂 体积
T7 Buffer 4 μL
T7 Adapter 2.5 μL
T7 Enzyme Mix Ⅱ 3 μL
P5-2/P7-2 100ng
DEPC水* 至 40 μL
3. 使用移液器进行吹打混匀,然后瞬时离心使得反应液至管底。
4. 将 PCR 管置于 PCR 仪(热盖 105℃)中,进行 T7 Tailing&Ligation 反应:
温度 时间
37℃ 15min
95℃ 2 min
4 ℃ 保持
5. 待反应结束,将 PCR 管置于冰上,待加入 Second Strand SynthesisReaction 预混液。
二). 第二链合成反应
1. 预热 PCR 仪:反应温度设定 98℃,热盖温度 105℃。
2. 按照下面体系配置 Second Strand Synthesis Reaction 预混液,冰上放置时间最好不要超过 20min:
试剂 体积
Synthesis Reagent 3 μL
2X Synthesis Mix 43uL
总体积 46 μL
3. 取 46 μL Second Strand Synthesis Reaction 预混液加入到 T7 Tailing&Ligated DNA中,使用移液器进行吹打混匀,然后瞬时离心使得反 应液至管底。
4. 将 PCR 管置于 PCR 仪(热盖 105℃)中,进行二链合成反应:
温度 时间
98℃ 1 min
60℃ 2 min
68℃ 5 min
4℃ 保持
5. 提前将Hieff NGS® DNA Selection Beads DNA磁珠 从 2-8℃取出,静置平衡至室温,使用前涡旋或者振荡混匀。
6. 待 Second Strand Synthesis Reaction 结束后,在产物中加入 105 μLHieff NGS® DNA Selection Beads DNA磁珠 (~1.22X),吹打混匀。
7. 室温静置 5min,然后转移至磁力架上~5min,直至溶液变澄清,小心弃除上清。
8. 将离心管保持在磁力架上,加入 200 μL 80%乙醇,静置 30 s,弃除全部上清。
9.重复步骤8,将磁珠用 80%乙醇再洗 1 次,用 10 μL 枪头将残留液体彻底吸干。
10. 干燥磁珠 2-3 min,待酒精挥发完全后,将 PCR 管移出磁力架,加入22.5 μLDEPC水,吹打混匀,然后室温静置 2 min。
11. 将 PCR 管放置到磁力架上,室温静置直到溶液变澄清,小心吸取 20 μL上清液至另一新的 PCR 管中备用。
(三). T5 接头连接
1. 按照下面表格配制 T5 接头连接反应体系,依次加入如下组分,使用移液器进行吹打混匀,然后瞬时离心使得反应液至管底:
试剂 体积
Double Strand DNA(步骤 5.3.11) 20 μL
DEPC水 4 μL
T5 Buffer Ⅱ 8 μL
T5 Adapter Ⅱ 5 μL
Ligase Mix 3 μL
总体积 40 μL
2. 将 PCR 管置于 PCR 仪(热盖加热功能关闭,或者热盖不要合上)中, 进行连接反应:
温度 时间
25℃ 15 min
4℃ 保持
3. 提前将 Hieff NGS® DNA Selection Beads DNA磁珠 从 2-8℃取出,静置平衡至室温, 使用前涡旋或者振荡混匀。
4. 连接反应结束后,加入 32 μL Hieff NGS® DNA Selection Beads DNA磁珠(0.8X ) 到连接产物中,吹打混匀。
5. 室温静置 5 min,然后转移至磁力架上~5 min,直至溶液变澄清,小心弃除上清。
6. 将离心管保持在磁力架上,加入 200 μL 80%乙醇,静置 30 s,弃除全部上清。
7. 重复步骤6,将磁珠用 80%乙醇再洗 1 次,用 10 μL 枪头将残留液体彻底吸干。
8. 干燥磁珠 2-3 min,将 PCR 管移出磁力架,加入 22.5 μL DEPC水, 吹打混匀,然后室温静置 2 min。
9. 将 PCR 管放置到磁力架上,室温静置直到溶液变澄清,小心吸取 20 μL 上清液至另一新的 PCR 管中备用。
(四)扩增和纯化
1. 按照下表配制 PCR 反应体系:
试剂 体积
纯化后的连接产物(步骤 5.3.9) 2 0 μL
2X PCR Master Mix 2 5 μL
PCR Index Primer i7XX 2.5 μL
PCR Index Primer i5XX 2.5 μL
体积 50 μL
2. 使用移液器进行吹打混匀,然后瞬时离心使得反应液至管底,放置PCR 仪中。
3. 按照如下程序进行 PCR 反应:
温度 时间 循环
98℃ 45 s 1
98℃ 15 s60℃ 30 s 1572℃ 30 s
72℃ 1 min 1
4℃ 保持 -
4. 提前将 Hieff NGS® DNA Selection Beads DNA磁珠 从2-8℃取出,静置平衡至室温,使用前涡旋或者振荡混匀。
5. 反应结束后,加入 50 μL Hieff NGS® DNA Selection Beads DNA磁珠(1.0X)到PCR 反应产物,吹打混匀。
6. 室温静置 5min,然后转移至磁力架上~5min,直至溶液变澄清,小心弃除上清。
7. 将离心管保持在磁力架上,加入 200 μL 80%乙醇,静置 30s,弃除全部上清。
8. 重复步骤7,将磁珠用 80%乙醇再洗 1 次,用 10 μL 枪头将残留液体彻底吸干。
9. 干燥磁珠 2-3min,待酒精挥发完全后,将 PCR 管移除磁力架,加入 22.5 μLDEPC水,吹打混匀。
10. 室温静置 2min,磁力架上 1min,直到溶液变澄清,小心吸取 20 μL文库至另一新的离心管中,-20℃留存备用。
11. 检测结果查看:吸取10ng PCR纯化产物,使用2.5%琼脂糖凝胶,180V,20min,进行电泳检测。
12 . 对目的文库进行切胶纯化,具体参见图5。纯化后的文库上机测序。
本发明方法的文库示意图
如图6所示,本发明方法的文库示意图,对单链DNA的NGS接头oligo建库得到的文库中,含有两处相同的测序引物结合区,这会导致测序引物的测序结合,引发测序错误,illumina官方不建议此种文库的上机测序。
由于测序引物会错误地结合到文库中间的NGS接头oligo上,导致产生的测序数据中一大部分不能用于碱基错误率生信分析,因此,需要将这部分数据过滤后分析。在本发明中首先加大测序数据量,例如,每个文库分配5G以上数据量上机测序,在数据过滤后得到碱基错误率分析所需的数据量。
四.生信分析流程
生信分析流程如图7所示,首先对原始数据进行质量评估。原始测序数据中可能含有测序接头序列,低质量read以及模糊碱基比例较高的read,这将影响后续分析的质量。然后利用FastQC(v0.11.9)软件对原始数据进行质量检查。
该项目的文库中,插入片段为P5或者P7接头,两端连接P5或者P7接头,插入片段与测序使用的P5和P7接头只有index的8bp有差异,如图8所示。当插入片段为P5接头时:Read1的预期测序序列结构为:插入P5接头+polyC+测序P7接头,Read2的预期测序序列结构为polyG+插入P5接头反向互补序列+测序P5接头反向互补序列;当插入片段为P7接头时:Read1的预期测序序列结构为:插入P7接头+polyC+测序P7接头,Read2的预期测序序列结构为polyG+插入P7接头反向互补序列+测序P5接头反向互补序列。
利用CUTADAPT(v1.13)软件对数据进行预处理,专用的数据预处理方法:以insert序列加polyC/polyG判断作为正确的reads。
a. 对于插入片段为P5 oligo时,对read 2进行预处理分析:可利用单链建库引入的polyG 进行处理,去除5’端polyG后,去除3’端测通后的无意义序列,去除质量低于20的碱基,保留长度大于65bp的序列,截取前70bp,去除含有测序P5接头序列,得到可用于分析的正确数据。
b. 对于插入片段为P7 oligo时,对R1 read进行预处理分析:可利用单链建库引入的polyC 进行处理,序列必须包含polyC,去除polyC,去除3’端测通后的无意义序列,去除质量低于20的碱基,保留长度大于60bp小于70bp的序列,去除含有测序P7接头的序列,得到可用于分析的正确数据。然后统计每个文库的预文库处理情况再次对测序文库进行质量检查,确保分析准确性。
序列比对后,对错误碱基进行识别,统计错误率。碱基错误率生信分析结果中可以得到接头引物合成的错误信息(SNP:错配率,DEL:缺失率,INS:插入率)。利用SAMtools(v1.4.1)软件的call功能,VarScan(v2.3.7)软件的pileup2cnv功能鉴定变异位点(错误碱基),然后统计每个样本中参考序列每个位置的三种类型碱基错误率,累计分布情况如下表;P5接头Oligo和P7接头Oligo碱基错误率生信分析结果分别如图9和10所示:
样本编号 SNP(%) DEL(%) INS(%) Total(%)
P5接头Oligo 4.50% 0.74% 0.60% 5.84%
P接头Oligo 2.59% 2.06% 0.32% 4.97%
应该理解到披露的本发明不仅仅限于描述的特定的方法、方案和物质,因为这些均可变化。还应理解这里所用的术语仅仅是为了描述特定的实施方式方案的目的,而不是意欲限制本发明的范围,本发明的范围仅受限于所附的权利要求。
本领域的技术人员还将认识到,或者能够确认使用不超过常规实验,在本文中所述的本发明的具体的实施方案的许多等价物。这些等价物也包含在所附的权利要求中。

Claims (1)

1.Illumina测序平台中识别NGS接头oligo的错误碱基的方法,其特征在于,所述方法通过单链DNA建库直接实现对NGS接头oligo的错误碱基的识别;
所述方法包括:
步骤1:用P5 接头oligo序列和P7 接头oligo合成所述NGS接头oligo;
步骤2:用单链DNA建库试剂盒,在所述NGS接头先连接3端接头,然后二链延伸,之后连接5端接头,接着用index引物扩增,得到NGS文库;
步骤3:对所述步骤2中得到的NGS文库进行纯化,去除非特异扩增产物,纯化得到用于上机测序的NGS文库;
步骤4:对上机测序的NGS文库得到的测序数据进行生信分析,识别所述NGS接头oligo的错误碱基;
在步骤3中,通过切胶去除非特异扩增产物;
所述生信分析流程包括数据预处理,以insert序列加polyC/polyG判断作为正确的reads,得到可用于分析的正确数据;
所述生信分析流程依次包括:原始测序数据的质控,数据预处理,序列比对,和错误碱基识别;
在所述数据预处理中,以插入片段序列加polyC/polyG判断作为正确的reads:
a. 当插入片段为P5 接头oligo时,对Read 2进行预处理分析:利用单链建库引入的polyG 进行处理,去除5’端polyG后,去除3’端测通后的无意义序列,去除质量低于20的碱基,保留长度大于65bp的序列,截取前70bp,去除含有测序P5接头序列,得到可用于分析的正确数据;
b. 当插入片段为P7接头oligo时,对Read1进行预处理分析:利用单链建库引入的polyC 进行处理,去除polyC后,去除3’端测通后的无意义序列,去除质量低于20的碱基,保留长度大于60bp小于70bp的序列,去除含有测序P7接头的序列,得到可用于分析的正确数据。
CN202310346454.3A 2023-04-03 2023-04-03 识别NGS接头oligo错误碱基的方法及其文库 Active CN116103383B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310346454.3A CN116103383B (zh) 2023-04-03 2023-04-03 识别NGS接头oligo错误碱基的方法及其文库

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310346454.3A CN116103383B (zh) 2023-04-03 2023-04-03 识别NGS接头oligo错误碱基的方法及其文库

Publications (2)

Publication Number Publication Date
CN116103383A CN116103383A (zh) 2023-05-12
CN116103383B true CN116103383B (zh) 2023-06-20

Family

ID=86254647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310346454.3A Active CN116103383B (zh) 2023-04-03 2023-04-03 识别NGS接头oligo错误碱基的方法及其文库

Country Status (1)

Country Link
CN (1) CN116103383B (zh)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104153004A (zh) * 2014-08-11 2014-11-19 上海美吉生物医药科技有限公司 一种用于扩增子测序的建库方法
CN105861710B (zh) * 2016-05-20 2018-03-30 北京科迅生物技术有限公司 测序接头、其制备方法及其在超低频变异检测中的应用
CN108203847B (zh) * 2016-12-16 2022-01-04 深圳华大智造科技股份有限公司 用于二代测序质量评估的文库、试剂及应用
CN107858414B (zh) * 2017-10-18 2021-09-10 广州漫瑞生物信息技术有限公司 一种高通量测序接头、其制备方法及其在超低频突变检测中的应用
CN110904512A (zh) * 2018-09-14 2020-03-24 广州华大基因医学检验所有限公司 一种适用于单链dna的高通量测序文库构建方法
CN109797197A (zh) * 2019-02-11 2019-05-24 杭州纽安津生物科技有限公司 一种单链分子标签接头及单链dna建库方法及其在检测循环肿瘤dna中应用
CN110129415B (zh) * 2019-05-17 2023-08-18 迈杰转化医学研究(苏州)有限公司 一种ngs建库分子接头及其制备方法和用途
CN110607353B (zh) * 2019-08-29 2022-11-22 上海英基生物科技有限公司 一种利用高效地连接技术快速制备dna测序文库的方法和试剂盒
CN115807068A (zh) * 2022-09-20 2023-03-17 苏州金唯智生物科技有限公司 一种用于高通量测序的接头引物的质检方法及高通量测序方法

Also Published As

Publication number Publication date
CN116103383A (zh) 2023-05-12

Similar Documents

Publication Publication Date Title
CN108893466B (zh) 测序接头、测序接头组和超低频突变的检测方法
CN108300716B (zh) 接头元件、其应用和基于不对称多重pcr进行靶向测序文库构建的方法
CN110129415B (zh) 一种ngs建库分子接头及其制备方法和用途
CN106676182B (zh) 一种低频率基因融合的检测方法及装置
CN112195521A (zh) 一种基于转座酶的dna/rna共建库方法、试剂盒及应用
CN109576347B (zh) 含单分子标签的测序接头和测序文库的构建方法
CN113373524B (zh) 一种ctDNA测序标签接头、文库、检测方法和试剂盒
CN111471754A (zh) 一种通用型高通量测序接头及其应用
WO2022247555A1 (zh) 测序方法
CN111471746A (zh) 检测低突变丰度样本的ngs文库制备接头及其制备方法
CN108932401B (zh) 一种测序样本的标识方法及其应用
CN113046835A (zh) 检测慢病毒插入位点的测序文库构建方法和慢病毒插入位点检测方法
CN111304288A (zh) 特异性分子标签umi组及其应用
CN116103383B (zh) 识别NGS接头oligo错误碱基的方法及其文库
CN111304309A (zh) 一种测序平台标签序列污染的检测方法
CN109337966A (zh) 一种分子标签及其试剂和应用
CN112029823A (zh) 纳米孔测序平台的宏基因组建库方法及其试剂盒
CN116064818A (zh) 检测igh基因重排及超突变的引物组、方法和系统
CN114277114B (zh) 一种扩增子测序添加唯一性标识符的方法及应用
CN111944806A (zh) 一种高通量测序污染检测用分子标签组及其应用
CN115948522A (zh) 一种寡核苷酸序列一致性的检测方法
CN114277113B (zh) 用于检测寡核苷酸合成质量的方法及系统
WO2023092601A1 (zh) Umi分子标签及其应用、接头、接头连接试剂及试剂盒和文库构建方法
CN216274116U (zh) 用于检测酶末端修复能力的试剂盒
CN116287161A (zh) 一种寡核苷酸序列一致性的检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant