CN106939344B - 用于二代测序的接头 - Google Patents

用于二代测序的接头 Download PDF

Info

Publication number
CN106939344B
CN106939344B CN201710262024.8A CN201710262024A CN106939344B CN 106939344 B CN106939344 B CN 106939344B CN 201710262024 A CN201710262024 A CN 201710262024A CN 106939344 B CN106939344 B CN 106939344B
Authority
CN
China
Prior art keywords
sequence
chain
sequencing
dna
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710262024.8A
Other languages
English (en)
Other versions
CN106939344A (zh
Inventor
伍建
姬晓雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mygenostics Co ltd
Original Assignee
Beijing Mygenostics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mygenostics Co ltd filed Critical Beijing Mygenostics Co ltd
Priority to CN201710262024.8A priority Critical patent/CN106939344B/zh
Publication of CN106939344A publication Critical patent/CN106939344A/zh
Application granted granted Critical
Publication of CN106939344B publication Critical patent/CN106939344B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了用于二代测序的接头。本发明公开的接头由两条名称分别为A链和B链的单链DNA组成或由名称分别为C链和D链的单链DNA组成;A链从5′端至3′端如式(Ⅰ)所示:A1‑A3‑A2式(Ⅰ);A3的每个核苷酸均为A、T、C或G;B链从3′端至5′端如式(Ⅱ)所示:B1‑B2式(Ⅱ);A2与B2互补;A1与B1不互补;A3与B1及A1均不互补;A1和A2的序列不同;B1与B2的序列不同;C链由A1与A2组成;D链由B1、B2与A3组成。实验证明,本发明的接头能够简单高效的实现降低二代测序中的假阳性突变,从而更灵敏的对肿瘤异质性样本、嵌合体样本等异质性混合样本中的低频突变进行检出。

Description

用于二代测序的接头
技术领域
本发明涉及生物技术领域中,用于二代测序的接头。
背景技术
二代测序技术本身的错误率约为1%,这对于某些应用(例如遗传疾病致病基因、SNP位点检测等)是可以接受的,但是对于宏基因组学、古生物基因组学、癌症等研究领域是非常大的阻碍,这些涉及深度测序、复杂异质性样本需要检测小于1%的稀有突变,而二代测序1%的背景突变使得小于1%的稀有突变无法识别,所以目前急需一种更为精确的测序方法以满足现在测序的需要。
发明内容
本发明所要解决的技术问题是如何提高测序准确率。
为解决上述技术问题,本发明首先提供了用于制备二代测序接头的成套试剂。
本发明所提供的用于二代测序的成套试剂,为成套试剂甲或成套试剂乙;所述成套试剂甲由两条名称分别为A链和B链的单链DNA组成;
所述A链从5′端至3′端如式(Ⅰ)所示:
A1-A3-A2
式(Ⅰ);
所述A3的每个核苷酸均为A、T、C或G;
所述B链从3′端至5′端如式(Ⅱ)所示:
B1-B2
式(Ⅱ);
所述成套试剂乙由两条名称分别为C链和D链的单链DNA组成;所述C链由所述A1与所述A2组成,所述C链从5′端至3′端如式(Ⅲ)所示:
A1-A2
式(Ⅲ);
所述D链由所述B1、所述B2与所述A3组成,所述D链从3′端至5′端如式(Ⅳ)所示:
B1-A3-B2
式(Ⅳ);
所述A2与所述B2互补;所述A1与所述B1不互补;
所述A3与所述B1及所述A1均不互补;
所述A1和所述A2的序列不同;所述B1与所述B2的序列不同。
所述A3为随机序列,故,所述成套试剂甲中所述A链的种类和所述成套试剂乙中所述D链的种类由所述A3的种类数决定。
其中,所述互补的定义为两条单链DNA长度相同时可以完全配对,两条单链DNA长度不同时长度短的单链DNA能完全与长度长的单链DNA的一部分序列完全配对。所述不互补包括除所述互补外的所有情况。
上述成套试剂中,所述A链与所述B链可独立包装,也可包装在一起。所述A链与所述B链的配比可为1:1。所述C链和所述D链可独立包装,也可包装在一起。所述C链和所述D链的配比可为1:1。
上述成套试剂在二代测序中进行应用时,可先使所述A链的A2与所述B链的B2进行配对形成Y型DNA片段或使所述C链的A2与所述D链的B2进行配对形成Y型DNA片段,再利用所述Y型DNA片段进行下一步的文库构建。
在本发明的一个实施例中,所述Y型DNA片段为图1中A所示的DNA片段。
为解决上述技术问题,本发明还提供了用于二代测序的DNA片段。
本发明所提供的二代测序的DNA片段为下述G1)或G2):
G1)通过尿嘧啶核苷酸连接所述A链的5′端与所述B链的3′端得到的DNA片段;
G2)通过尿嘧啶核苷酸连接所述C链的5′端与所述D链的3′端得到的DNA片段。
上述DNA片段在二代测序中进行应用时,可先使所述DNA片段的A2与B2进行配对形成U型DNA片段,再利用所述U型DNA片段作为接头进行下一步的文库构建。
在本发明的一个实施例中,所述U型DNA片段为图1中B所示的DNA片段。
上述文中,所述A3的长度可为H1)或H2):
H1)8-18nt;
H2)14nt。
所述B链与所述C链的序列均可为Illumina接头的序列。
所述A1的长度可为15-25nt,如22nt。所述A1可为所述Illumina接头的Rd1SP的3′端第一位核苷酸开始的任意片段或Rd1SP的全长。所述A1具体可为所述Rd1SP3′端的22个核苷酸。所述B1的长度可为15-25nt,如22nt。所述B1可为与所述Illumina接头的Rd2SP的3′端第一位开始的任意片段或Rd2SP的全长互补的序列。所述B1具体可为与所述Rd2SP的3′端第一位开始的24个核苷酸互补的序列。
所述A2和所述B2均可不为Illumina接头的序列,所述A2用于平衡所述A链中四种核苷酸的比例,使所述A链中的四种核苷酸的比例基本一致;所述B2用于平衡所述D链中四种核苷酸的比例,使所述D链中的四种核苷酸的比例基本一致。
所述Illumina接头为利用Illumina测序平台测序所用到的接头(Adapter)。所述接头具体可为Y型接头或U型接头。所述Y型接头中组成所述接头的两条单链DNA部分互补。所述Y型接头中互补部分的长度为10-15nt,如13nt。所述U型接头为一条单链核酸分子,所述核酸分子5′端的10-15nt(13nt)与3′端的10-15nt(13nt)互补。
所述A2中3′末端核苷酸可为硫代核苷酸。
所述B2中5′末端核苷酸可为磷酸化修饰的核苷酸。
所述A1与所述B1可通过尿嘧啶核苷酸相连。
所述A1的序列具体可为序列表中序列1的第1-22位;
所述A2的序列具体可为序列表中序列1的第37-50位;
所述A3的序列具体可为序列表中序列1的第23-36位;
所述B1的序列具体可为序列表中序列2的第14-37位;
所述B2的序列具体可为序列表中序列2的第1-13位。
所述A链的序列具体可为序列表中序列1。所述B链的序列具体可为序列表中序列2。
所述DNA片段的序列具体可为序列表中序列3。
为解决上述技术问题,本发明还提供了下述R1)或R2):
R1)所述成套试剂的制备方法,包括:依次连接所述A1、所述A3和所述A2得到所述A链,依次连接所述B1和所述B2得到所述B链,将所述A链和所述B链分别包装得到所述成套试剂;
R2)所述DNA片段的制备方法,包括:通过尿嘧啶核苷酸连接中所述A链的5′端与所述B链的3′端或通过尿嘧啶核苷酸连接所述C链的5′端与所述D链的3′端得到所述DNA片段。
为解决上述技术问题,本发明还提供了二代测序DNA文库的构建方法。
本发明所提供的二代测序DNA文库的构建方法,包括:对待测样本的目的DNA连接作为接头的所述成套试剂或所述DNA片段,得到所述DNA文库。
上述方法中,对所述目的DNA连接所述成套试剂或所述DNA片段可通过T4连接酶进行。
上述方法还可包括在对所述目的DNA连接所述成套试剂或所述DNA片段前对所述目的DNA进行末端补齐和加A;
所述末端补齐与所述加A在同一反应体系中进行,具体可利用Kapa Biosystems的KAPA Hyper Prep Kits进行。KAPA Hyper Prep Kits的为货号可为KK8504。
解决上述技术问题,本发明还提供了二代测序的方法。
本发明所提供的二代测序的方法,包括:对待测样本按照所述二代测序DNA文库的构建方法建立DNA文库,利用Illumina测序平台进行测序,将测序结果中满足如下M1)、M2)和M3)的多条测序序列合并为一条序列,将合并后的序列命名为HF序列,即得到待测样本的测序结果;
M1)所述多条测序序列为大于等于4条测序序列;
M2)所述多条测序序列的所述A3序列均相同;
M3)所述多条测序序列具有75%或75%以上的同一性。
将所述多条测序序列合并为一条序列具体可按照如下方法进行:如果所述多条测序序列在相同位置的核苷酸不同,将占比超过50%(进一步可为75%)的核苷酸确定为HF序列相应位置的核苷酸;如果所述多条测序序列在相同位置的核苷酸相同,则该核苷酸即为HF序列相应位置的核苷酸。
上述二代测序的方法中,所述方法还可包括对建立得到的DNA文库进行富集。所述富集可通过PCR扩增进行,所述PCR扩增所用引物可为Illumina测序平台中常用引物,只要满足能与所述成套试剂或所述DNA片段配套使用即可(即所述PCR扩增所用引物能与所述成套试剂或所述DNA片段配对)。
为解决上述技术问题,本发明还提供了所述DNA片段的制备方法。
为解决上述技术问题,本发明还提供了下述任一应用:
X1、所述成套试剂或所述DNA片段在作为接头中的应用;
X2、所述成套试剂或所述DNA片段在作为二代测序接头中的应用;
X3、所述成套试剂或所述DNA片段在建立二代测序DNA文库中的应用;
X4、所述成套试剂或所述DNA片段在制备建立二代测序DNA文库产品中的应用;
X5、所述成套试剂或所述DNA片段在二代测序中的应用;
X6、所述成套试剂或所述DNA片段在制备二代测序产品中的应用。
本发明中,所述目的DNA和所述待测样本均可为片段化的基因组DNA或者直接提取的游离DNA(cfDNA)。所述游离DNA可为提取自人血浆、脑脊液或胸水等无细胞体液的游离DNA。
本发明中,所述二代测序可为利用Illumina测序平台进行的测序。
本发明提供一种针对二代测序平台文库构建过程对DNA进行随机序列(A3)标记的方法,制备了可以作为接头用于二代测序的成套试剂和DNA片段,以实现降低测序得到的假阳性突变目的。具体方法是在文库构建中使用加入随机序列(A3)标记的接头序列,连接到待测DNA模板序列两端;同时为了减少建库过程DNA模板序列的损失,将随机序列(A3)末端补齐和加A的过程合并为一个酶促反应。本发明使用的带有随机序列(A3)标签的接头有Y型和U型两种,其中Y型接头由Illumina通用的Y型接头加上14个随机序列(A3)以及为保持Y型结构所添加的14/13个用于平衡接头中四种核苷酸比例的核苷酸组成,U型接头由Y型接头远离待测片段的一端相互被碱基U(尿嘧啶核苷酸)连接组成。实验证明,本发明的可以作为接头的成套试剂和DNA片段可以提高测序准确性,降低测序背景中的假阳性突变:突变频率小于等于20%的突变read条数大于等于1的测序错误突变,使用对照接头分析,共有87768条(Mut>=1),使用本发明作为接头的成套试剂分析,下降到94条(HF>=1),下降了99.9%;突变频率小于等于20%的突变read条数大于等于2的测序错误突变,使用对照接头分析,共有20104条(Mut>=2),使用本发明作为接头的成套试剂分析,下降到3条(HF>=2),下降了99.99%。由此可见,使用本发明作为接头的成套试剂建库和相应生物信息学分析,可以极其显著下降测序错误,降低假阳性突变数目。另外,观察该样本的包含在dbSNP数据库中的SNP突变位点发现,使用对照接头和使用本发明作为接头的成套试剂分析对SNP位点的检出没有影响,数目均为40个,表明,利用本发明作为接头的成套试剂不会在提高测序准确率的情况下漏检已知的SNP位点,说明,利用本发明作为接头的成套试剂进行建库和测序具有很高的准确性和可靠性。本发明的作为接头的成套试剂和DNA片段与测序方法能够简单高效的实现降低二代测序中的假阳性突变,从而更灵敏的对肿瘤异质性样本、嵌合体样本等异质性混合样本中的低频突变进行检出。
附图说明
图1为接头的结构与序列。
图2为HF序列的合并。
图3为突变频率小于等于20%的测序错误突变。
图4为dbSNP数据库中已知SNP突变位点在利用不同接头时的检测结果。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。
下述实施例中的实验方法,如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂、仪器等,如无特殊说明,均可从商业途径得到。
实施例1、作为接头的成套试剂可以提高高通量测序准确率
本实施例提供了作为接头的用于二代测序的成套试剂,该成套试剂由两条名称分别为A链和B链的单链DNA组成;
A链从5′端至3′端如式(Ⅰ)所示:
A1-A3-A2(Ⅰ);
A3的每个核苷酸均为A、T、C或G,即A3为随机序列;
B链从3′端至5′端如式(Ⅱ)所示:
B1-B2(Ⅱ);
A2与B2互补;A1与B1不互补;
A3与B1及A1均不互补;
A1和A2的序列不同;B1与B2的序列不同;
A2中3′末端核苷酸为硫代核苷酸,即3′末端核苷酸中磷酸上带双键的氧原子被硫原子取代;B2中5′末端核苷酸为磷酸化修饰的核苷酸;
A链:5′-CTACACGACGCTCTTCCGATCTNNNNNNNNNNNNNNTCGAATGGTACTC*T-3′(序列表中序列1),*表示寡核苷酸的修饰方式为硫代核苷酸,N表示A、T、C或G;
B链:5′-p-GAGTACCATTCGAAGATCGGAAGAGCACACGTCTGAA-3′(序列表中序列2),5’-p-表示寡核苷酸的修饰方式为5′末端核苷酸为磷酸化修饰的核苷酸。
将A链与B链等摩尔量混合,如下程序退火,得到如图1中A所示的接头结构,下文称为接头甲:94℃,5min;30℃,15min。储存在-20℃备用。
提取一个正常人的血液基因组DNA,并超声破碎将基因组DNA片段化,得到片段化的基因组DNA,按照如下方法进行测序,实验重复三次。利用接头甲′作为对照,对照实验中不包括步骤2中的2)。接头甲′为由两条名称分别为A′链和B′链的单链DNA组成DNA片段:
A′链:5′-CTACACGACGCTCTTCCGATCTTCGAATGGTACTC*T-3′,*表示寡核苷酸的修饰方式为硫代碱基;
B′链:5′-p-GAGTACCATTCGAAGATCGGAAGAGCACACGTCTGAA-3′,5’-p-表示寡核苷酸的修饰方式为5’磷酸化。
1、文库构建
1)末端修复和加A
按照如下反应体系与反应条件对片段化的基因组DNA进行末端修复和加A:25μL片段化的基因组DNA、3.5μL ER/AT buffer、1.5μL ER/AT Mix,总体系为30μL,混合均匀瞬时离心:20℃孵育30min;65℃孵育30min;4℃ hold。反应结束后得到末端修复和加A的DNA。其中,ER/AT buffer与ER/AT Mix均为北京康为世纪生物科技有限公司产品。
2)连接接头甲
对步骤1)得到的末端补齐和加A的DNA连接接头甲:末端修复和加A的DNA 30μL,接头甲(50μM)2μL,Ligation buffer 15μL,DNA ligase 5μL,H2O 3μL,20℃孵育15min。。反应结束后得到连接接头的DNA。
3)磁珠纯化
取充分混匀的AmPure XP beads(Invitrogen)82.5μL,同连接接头的DNA混合均匀(AmPure XP beads的体积为连接接头的DNA的1.5倍),室温静置5min,在磁力架上静置5min,吸弃上清,EP管仍保持在磁力架上,用80%乙醇200μL清洗磁珠两次,彻底吸弃液体,开盖室温放置5min使乙醇挥发干净,使用39μL UltraPureTMDNase/RNase-Free DistilledWater(InvitrogenTM)洗脱磁珠吸附的DNA序列,涡旋混合均匀,室温放置5min,置于磁力架上静置5min,吸取上清,得到纯化好的DNA。
4)PCR扩增富集
使用扩增引物(PE1.0和PE2.0 INDEX)对纯化好的DNA 36μL进行扩增,扩增程序为98℃3min(1个循环);98℃ 20s,65℃ 30s,72℃ 30s(18个循环);72℃ 5min(1个循环)。将PCR产物用AmPure XP beads(Invitrogen)进行纯化,磁珠的体积为PCR产物体积的1.5倍。其中PE1.0和PE2.0 INDEX序列如表1所示,PE2.0 INDEX包括但不限于表1中的PE2.0INDEX001-PE2.0 INDEX007,在本实施例中所用PE2.0 INDEX为PE2.0 INDEX001和PE2.0INDEX002。
表1、扩增引物序列
PE1.0 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC*T
PE2.0 INDEX001 CAAGCAGAAGACGGCATACGAGATGTACACTCGTGACTGGAGTTCAGACGTGTGCTCTTCCGAT*C
PE2.0 INDEX002 CAAGCAGAAGACGGCATACGAGATACATCGGTGACTGGAGTTCAGACGTGTGCTCTTCCGAT*C
PE2.0 INDEX003 CAAGCAGAAGACGGCATACGAGATGCCTAAGTGACTGGAGTTCAGACGTGTGCTCTTCCGAT*C
PE2.0 INDEX004 CAAGCAGAAGACGGCATACGAGATTGGTCAGTGACTGGAGTTCAGACGTGTGCTCTTCCGAT*C
PE2.0 INDEX005 CAAGCAGAAGACGGCATACGAGATCACTGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGAT*C
PE2.0 INDEX006 CAAGCAGAAGACGGCATACGAGATATTGGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGAT*C
PE2.0 INDEX007 CAAGCAGAAGACGGCATACGAGATGATCTGGTGACTGGAGTTCAGACGTGTGCTCTTCCGAT*C
*表示寡核苷酸的修饰方式为硫代碱基。
2、测序
步骤1的4)中得到的纯化后的DNA通过Illumina HiSeq2000进行高通量测序,得到测序的数据。测序数据分析的过程包括单核苷酸位点变异(SNV/INDEL)分析过程和SV结构变异分析过程。
单核苷酸位点变异(SNV/INDEL)分析过程包括如下步骤:
1)测序仪(Illumina X 10)获取原始短序列,即fastq文件.。然后采用cutadapt程序去掉fastq文件3'/5'端的通用引物序列,保留读出质量大于20和读取长度大于80bp的序列;
2)将测序结果中满足如下M1)、M2)和M3)的多条测序序列合并为一条序列,将合并后的序列命名为HF序列;如果多条测序序列在相同位置的核苷酸不同,将占比超过50%的核苷酸确定为HF序列相应位置的核苷酸;如果多条测序序列在相同位置的核苷酸相同,则该核苷酸即为HF序列相应位置的核苷酸;
3)M1)上述多条测序序列为大于等于4条测序序列;
M2)上述多条测序序列的A3序列均相同;
M3)上述多条测序序列具有75%以上的同一性;
其中几条序列合并前后如图2所示。
4)利用bwa软件,将上一步得到的HF序列重新比对到人类参考基因组(HumanGRCh37/hg19)上,得到bam文件;
5)利用bamtools软件,将bam文件里面的未比对上的reads、未paired比对上的reads和未ProperPair的reads过滤掉;
6)为了减少PCR冗余所带来的影响,利用picard软件,对PCR冗余序列进行标记和去除;
7)采用samtools的mpileup程序,产生mpileup文件,然后再利用varscan的mpileup2cns程序,得到记录了所有检测到的变异的VCF文件(具体参数:samtoolsmpileup-d 100000-L 100000sample.bam|varscan mpileup2cns--min-reads2 1--min-coverage 1--strand-filter 1--output-vcf 1--variants 1--min-var-freq0.0001--p-value 1--min-avg-qual 20,其中p-value为1、最大测序深度100000X、最低覆盖reads数1、最低检测突变频率千分之一);
8)利用若干个数据库对每一个变异位点进行功能注释,这些数据库包括但不限于:HGMD、COSMIC、dbSNP、refGene、esp6500siv2_all、1000g2015aug_all、ExAC、dbnsfp、clinvar和spidex;
9)统计捕获效率、测序深度。
结构变异SV分析流程包括如下步骤:
1)将SNV/INDEL分析过程中得到的BWA比对结果,即BAM文件,提取其中的soft-clipped reads(具体参数:extractSClip.pl-i sample.bam--ref_genome hg19.fa>extractSClip.log,其中参考基因组为hg19);
2)对soft-clipped reads区域进行局部组装,获得一致性序列,从而找到断裂点;
3)利用annovar软件和refGene数据库对对断裂点进行基因注释。
在生物信息学分析过程中,统计使用含有14nt随机序列的接头(接头甲)分析得到的假阳性突变和使用不含有14nt随机序列的接头(接头甲′)分析得到的假阳性突变的数目变化。
与参考基因组相比,对于一个特定的人的基因组来说,在一个具体的SNP位点处的核苷酸为两种(杂合SNP位点)或一种(纯合SNP位点),所以理想的测序情况下(即测序完全准确),得到的多条测序序列中该位点的特定核苷酸的频率为50%或者100%。因此,对于一个SNP的多条测序结果,如果该SNP位点的某一核苷酸的频率偏离50%或者100%,则为测序过程中的测序错误突变(或假阳性突变,Error count)。具体的说,突变频率小于等于20%的突变read条数大于等于1(或者大于等于2)的为测序错误结果(即假阳性突变),分别统计其在同一个样本中在利用不同接头进行测序下的数目,结果如图3所示。
从图3中以明显看出:该样本的SNP中,突变频率小于等于20%的突变read条数大于等于1的测序错误突变,使用接头甲′分析,共有87768条(Mut>=1),使用接头甲分析,下降到94条(HF>=1),下降了99.9%;突变频率小于等于20%的突变read条数大于等于2的测序错误突变,使用接头甲′分析,共有20104条(Mut>=2),使用接头甲分析,下降到3条(HF>=2),下降了99.99%。由此可见,使用本发明的接头甲建库和相应生物信息学分析,可以极其显著下降测序错误,降低假阳性突变数目。
同时,观察该样本的包含在dbSNP数据库中的SNP突变位点发现,使用接头甲′和使用接头甲分析对SNP位点的检出没有影响,数目均为40个,如图4所示,表明,利用本发明的接头甲不会在提高测序准确率的情况下漏检已知的SNP位点,表明,利用本发明的接头甲进行建库和测序具有很高的准确性和可靠性。
<110> 北京迈基诺基因科技股份有限公司
<120> 用于二代测序的接头
<160> 2
<170> PatentIn version 3.5
<210> 1
<211> 50
<212> DNA
<213> 人工序列
<220>
<221> misc_feature
<222> (23)..(36)
<223> n is a, c, g, or t
<400> 1
ctacacgacg ctcttccgat ctnnnnnnnn nnnnnntcga atggtactct 50
<210> 2
<211> 37
<212> DNA
<213> 人工序列
<220>
<223>
<400> 2
gagtaccatt cgaagatcgg aagagcacac gtctgaa 37

Claims (2)

1.成套试剂在建立二代测序文库中的应用,
所述成套试剂由两条名称分别为A链和B链的单链DNA组成;
所述A链从5′端至3′端如式(Ⅰ)所示:
A1-A3-A2
式(Ⅰ);
所述B链从3′端至5′端如式(Ⅱ)所示:
B1-B2
式(Ⅱ);
所述A3的每个核苷酸均为A、T、C或G;
所述A2与所述B2互补;所述A1与所述B1不互补;
所述A3与所述B1及所述A1均不互补;
所述A1和所述A2的序列不同;所述B1与所述B2的序列不同;
所述A链的序列为序列表中序列1;所述B链的序列为序列表中序列2;
所述A1的序列为序列表中序列1的第1-22位;
所述A2的序列为序列表中序列1的第37-50位;
所述A3的序列为序列表中序列1的第23-36位;
所述B1的序列为序列表中序列2的第14-37位;
所述B2的序列为序列表中序列2的第1-13位;
所述应用先将A链与B链等摩尔量混合,如下程序退火:94°C,5min;30°C,15min,使所述A链的A2与所述B链的B2进行配对形成Y型DNA片段,再将所述Y型DNA片段与待测样本的目的DNA连接,得到所述DNA文库;
所述B链的序列为Illumina接头的序列;
所述A2中3′末端核苷酸为硫代核苷酸;
所述B2中5′末端核苷酸为磷酸化修饰的核苷酸。
2.根据权利要求1所述的应用,其特征在于:所述文库构建的方法还包括在对所述目的DNA连接所述Y型DNA片段前对所述目的DNA进行末端补齐和加A;
所述末端补齐与所述加A在同一反应体系中进行。
CN201710262024.8A 2017-04-20 2017-04-20 用于二代测序的接头 Active CN106939344B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710262024.8A CN106939344B (zh) 2017-04-20 2017-04-20 用于二代测序的接头

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710262024.8A CN106939344B (zh) 2017-04-20 2017-04-20 用于二代测序的接头

Publications (2)

Publication Number Publication Date
CN106939344A CN106939344A (zh) 2017-07-11
CN106939344B true CN106939344B (zh) 2020-04-21

Family

ID=59463766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710262024.8A Active CN106939344B (zh) 2017-04-20 2017-04-20 用于二代测序的接头

Country Status (1)

Country Link
CN (1) CN106939344B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107446996A (zh) * 2017-07-14 2017-12-08 艾吉泰康生物科技(北京)有限公司 一种检测靶序列的超低频突变的接头序列及方法
CN107545152A (zh) * 2017-09-18 2018-01-05 杭州和壹基因科技有限公司 一种基于Illumina数据找变异的方法
CN111378736B (zh) * 2018-12-28 2023-04-25 迈基诺(重庆)基因科技有限责任公司 耳聋相关基因捕获试剂盒及其应用
CN111378735B (zh) * 2018-12-28 2023-04-25 迈基诺(重庆)基因科技有限责任公司 Sma致病基因捕获试剂盒及应用
CN110129415B (zh) * 2019-05-17 2023-08-18 迈杰转化医学研究(苏州)有限公司 一种ngs建库分子接头及其制备方法和用途
CN117701691B (zh) * 2024-02-01 2024-04-26 上海锐赛循益生物技术有限公司 基于人基因组扩增子的illumina测序文库构建的引物组合

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102181533A (zh) * 2011-03-17 2011-09-14 北京贝瑞和康生物技术有限公司 多样本混合测序方法及试剂盒
CN102369298A (zh) * 2009-01-30 2012-03-07 牛津纳米孔技术有限公司 跨膜测序中用于核酸构建体的衔接体
CN106086162A (zh) * 2015-11-09 2016-11-09 厦门艾德生物医药科技股份有限公司 一种用于检测肿瘤突变的双标签接头序列及检测方法
CN106554957A (zh) * 2015-09-30 2017-04-05 中国农业科学院深圳农业基因组研究所 测序文库及其制备和应用
CN106755451A (zh) * 2017-01-05 2017-05-31 苏州艾达康医疗科技有限公司 核酸制备及分析

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011161549A2 (en) * 2010-06-24 2011-12-29 Population Genetics Technologies Ltd. Methods and compositions for polynucleotide library production, immortalization and region of interest extraction
CN104073549B (zh) * 2013-03-29 2016-08-31 中国农业大学 一种高效快速测定bac末端序列的方法
WO2015179706A1 (en) * 2014-05-23 2015-11-26 Fluidigm Corporation Haploidome determination by digitized transposons

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102369298A (zh) * 2009-01-30 2012-03-07 牛津纳米孔技术有限公司 跨膜测序中用于核酸构建体的衔接体
CN102181533A (zh) * 2011-03-17 2011-09-14 北京贝瑞和康生物技术有限公司 多样本混合测序方法及试剂盒
CN106554957A (zh) * 2015-09-30 2017-04-05 中国农业科学院深圳农业基因组研究所 测序文库及其制备和应用
CN106086162A (zh) * 2015-11-09 2016-11-09 厦门艾德生物医药科技股份有限公司 一种用于检测肿瘤突变的双标签接头序列及检测方法
CN106755451A (zh) * 2017-01-05 2017-05-31 苏州艾达康医疗科技有限公司 核酸制备及分析

Also Published As

Publication number Publication date
CN106939344A (zh) 2017-07-11

Similar Documents

Publication Publication Date Title
CN106939344B (zh) 用于二代测序的接头
US20230416729A1 (en) Nucleic acid sequencing adapters and uses thereof
CN107002292B (zh) 一种核酸的双接头单链环状文库的构建方法和试剂
CN113005121B (zh) 接头元件、试剂盒及其相关应用
CN111471754B (zh) 一种通用型高通量测序接头及其应用
KR102354422B1 (ko) 대량 평행 서열분석을 위한 dna 라이브러리의 생성 방법 및 이를 위한 키트
CN110114472A (zh) 将线性测序文库转换为环状测序文库的方法
CN109321567A (zh) 测序用dna文库试剂盒以及测序用dna文库构建方法
US20230272475A1 (en) A method for detecting the mutation and methylation of tumor-specific genes in ctdna
Babarinde et al. Computational methods for mapping, assembly and quantification for coding and non-coding transcripts
US12054710B2 (en) Method of ctDNA library construction and sequencing data analysis for simultaneously detecting multiple common mutations in liver cancer
JP7203276B2 (ja) メチル化されたdnaの標的領域に基づいてシーケンシングライブラリーを構築する方法及びキット
US20180223350A1 (en) Duplex adapters and duplex sequencing
CN109536579A (zh) 单链测序文库的构建方法及其应用
KR20170133270A (ko) 분자 바코딩을 이용한 초병렬 시퀀싱을 위한 라이브러리 제조방법 및 그의 용도
JP2020512405A (ja) ワンステップでアンプリコンライブラリを迅速に構築する方法
CN111041069B (zh) 一种低起始量dna样本的高通量测序文库构建方法及其应用
CN110603327A (zh) Pcr引物对及其应用
JP7281565B2 (ja) ネストされたマルチプレックスpcrハイスループットシーケンシングライブラリー調製方法及びキット
CN108359723B (zh) 一种降低深度测序错误的方法
CN106929507A (zh) 引物组、锚定引物、试剂盒、文库构建及基因测序方法
KR102133013B1 (ko) 분자 바코드 및 블로킹 올리고뉴클레오티드를 이용한 소량 돌연변이 증폭 및 정량 방법
US20190218606A1 (en) Methods of reducing errors in deep sequencing
CN110195095A (zh) 一种新的基因组甲基化文库的构建方法和应用
CN110564745B (zh) 一种肺癌稀有alk融合突变基因及其检测引物、试剂盒和检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant