CN114807125B - 测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法 - Google Patents

测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法 Download PDF

Info

Publication number
CN114807125B
CN114807125B CN202210550745.XA CN202210550745A CN114807125B CN 114807125 B CN114807125 B CN 114807125B CN 202210550745 A CN202210550745 A CN 202210550745A CN 114807125 B CN114807125 B CN 114807125B
Authority
CN
China
Prior art keywords
sequencing
library
sequencing library
adaptor
molecular tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210550745.XA
Other languages
English (en)
Other versions
CN114807125A (zh
Inventor
胡玉刚
汪彪
曲燕
吴强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naonda Nanjing Biological Technology Co ltd
Original Assignee
Naonda Nanjing Biological Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naonda Nanjing Biological Technology Co ltd filed Critical Naonda Nanjing Biological Technology Co ltd
Priority to CN202210550745.XA priority Critical patent/CN114807125B/zh
Publication of CN114807125A publication Critical patent/CN114807125A/zh
Application granted granted Critical
Publication of CN114807125B publication Critical patent/CN114807125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法。其中,该测序文库接头的3’末端为TG(T/A)。应用本发明的技术方案,通过将测序文库接头以TG末尾来提高连接效率,进一步的,以ATG结尾末端进一步提高连接效率,以此提升测序文库的建库效率。

Description

测序文库接头、测序文库及其构建方法、提升NGS建库连接效 率的方法
技术领域
本发明涉及测序文库构建技术领域,具体而言,涉及一种测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法。
背景技术
高通量测序作为重要的临床准确诊断获取信息的手段,科研人员和临床医生越来越重视NGS在临床诊断中的应用。目前,在肿瘤的靶向治疗方面,由于大量的FFPE样本有不同程度的降解,在肿瘤早筛和无创产前检测过程中,需要用cf/ctDNA样本进行建库,如何提升建库效率,充分利用有限的信息是人们探索的一致方向。在以往的探索过程中,有优化建库连接效率的酶和缓冲液、单链建库(US9896709)和平端腺苷化连接的(US20190010540A1)。虽然单链建库和平端腺苷化连接能够提升连接效率,但是由于这些建库流程过程过长和操作复杂,在做复杂样本时并不一定表现出优势。在基于A-T连接的优化酶和缓冲液的提升方面几乎已经到了尽头,因为加A效率限制、5’端碱基的无法修复和磷酸化限制导致这种提升。
由于目前大部分测序平台的建库接头都是基于A-T连接实现,并且固定接头末端,由于测序引物也是配套固定的序列,在改进加A效率不完全时的其它补救措施都不能实现提升连接效率。
因此,亟待开发新的方法进一步提升建库效率。
发明内容
本发明旨在提供一种测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法,以提升建库效率。
为了实现上述目的,根据本发明的一个方面,提供了一种测序文库接头。该测序文库接头的3’末端为TG(T/A)。
进一步地,测序文库接头的3’末端为ATG(T/A)。
进一步地,测序文库接头的末端T碱基3’端的-OH上的O用S修饰。
进一步地,测序文库接头为双端测序文库接头或单端测序文库接头。
进一步地,测序文库接头为在MGI或Illumina测序平台的测序文库接头序列基础上改变末端碱基获得。
进一步地,测序文库接头从5’端到3’端包括测序引物结合区和分子标签,部分分子标签的T改为C;优选的,10%的分子标签末端的T改为C;优选的,测序引物结合区的3’端增加碱基C;优选的,测序文库接头具有如SEQ ID NO:1和SEQ ID NO:2所示的序列;或如SEQID NO:3和SEQ ID NO:4所示的序列。
根据本发明的另一方面,提供了一种测序文库构建试剂盒。该测序文库构建试剂盒包括上述任一种测序文库接头。
根据本发明的再一方面,提供了一种测序文库的构建方法。该构建方法包括将上述任一种测序文库接头连接到待测序的目的片段上。
根据本发明的又一方面,提供了一种测序文库。该测序文库为通过上述任一种测序文库的构建方法构建而成。
进一步地,测序文库为用于MGI和Illumina测序平台的测序文库。
根据本发明的再一方面,提供了一种提升NGS建库连接效率的方法。该方法包括:将测序文库接头的3’末端设计为TG,以及将测序文库接头与待测目的片段通过T/A连接。
进一步地,将测序文库接头的3’末端设计为ATG;优选的,测序文库接头的末端T碱基3’端的-OH上的O用S修饰;优选的,测序文库接头为双端测序文库接头或单端测序文库接头;优选的,测序文库接头为在MGI或Illumina测序平台的测序文库接头序列基础上改变末端碱基获得;优选的,测序文库接头从5’端到3’端包括测序引物结合区和分子标签,部分分子标签接头末端的T改为C;更优选的,10%~20%的分子标签末端的T改为C;进一步优选的,测序文库接头具有如SEQ ID NO:1和SEQ ID NO:2所示的序列;或如SEQ ID NO:3和SEQID NO:4所示的序列。
应用本发明的技术方案,通过将测序文库接头以TG末尾来提高连接效率,进一步的,以ATG结尾末端进一步提高连接效率,以此提升测序文库的建库效率。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了目前MGI和Illumina测序平台接头末端三碱基;
图2示出了MGI不同末尾两碱基的连接效率;
图3示出了Illumina不同末尾两碱基的连接效率;
图4示出了MGI末尾两碱基16种组合的连接效率排名;
图5示出了Illumina末尾两碱基8种组合的连接效率排名;
图6示出了在双测序平台上末端连接效率最高的末端4碱基组成;
图7示出了在双测序平台上末端连接效率最高的末端3碱基组成和目前各自的末尾三碱基;
图8示出了不同接头末端连接效率对比;
图9示出了接头末端和测序引物之间的关系;
图10示出了接头末端分子标签和测序引物之间的关系;
图11示出了接头末端分子标签末端加C可以提升连接效率。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
术语解释:
分子标签接头:在需要标定模板的高通量测试时接的测序接头,与普通接头的区别是在普通接头末端添加一段3-5个碱基的随机序列。
测序引物结合区:在高通量测序的过程中,测序引物结合在接头的区域,一般这个区域会把通用的接头区域覆盖,读取的碱基就是插入片段部分。
建库接头:在MGI和Illumina测序平台都各自有自己的一套建库系统,建库包含建库试剂盒和接头部分,一般建库试剂盒是可以通用,建库接头不能通用,或不完全一致。
目前,MGI和Illumina测序平台分别有各自的建库接头,目前主流的建库系统还是通过T-A连接的方式实现,虽然Swift公司推出了单链建库和IDT公司的依赖腺苷化的平连实现了高效的连接,但是由于这些建库过程相对复杂,并不是目前建库的主流。在T-A建库连接的过程中,最开始修复和补平是一个步骤,加A是另一步完成,目前经过优化已经融合了修复补平加A在单管中通过控制不同的反应温度实现,并且修复补平加A的反应液不需要回收直接进行连接反应,在系列的优化过程中对酶的种类和用量及反应buffer的组成都进行了系统的优化。由于在T-A连接过程中依赖加A的效率和目标片段5’的磷酸化状态,加A的效率由于受到Taq酶的作用不只加A,还有部分加G碱基,同时5’端碱基如果有损伤是不能够被修复的,所以这些都限制了高效连接。
除了上述原因,还有受每种建库平台的接头末端序列决定,如图1所示,在MGI和Illumina的平台各自的接头末端三个碱基均不相同,MGI接头末端三个碱基是ACT,Illumina接头末端三个碱基是ATC,虽然这些接头都是经过优化,但是本发明的发明人在测试分子标签接头时,这两个平台目前选择的末端并不是最优选择。发明人在评估MGI平台分子标签接头的末端两个碱基的16种组合与目标片段的末端两碱基的16种组合的统计发现,不同的末端是有不用的连接效率,如图2所示,两碱基的16种组合在连接目标片段时差异明显;这种现象同样在Illumina测序平台也发现相似规律,虽然在Illumina测序平台的接头末端两个碱基种类只有8组,规律是一样的,如图3所示,在两个平台都是TG结尾的连接效率最高。在MGI测序平台的分子标签16种组合二碱基末端的均值排名如图4所示,TG是排名第一,MGI测序平台的接头相同末端两碱基是排名第4位,Illumina测序接头的相同末端两碱基是排名第6位。在Illumina测序平台的分子标签统计二碱基末端虽然不是16种组合都有,只有8种组合,也能反馈出基本问题,TG末尾的依然排名第一,Illumina相同结尾的排在第四名,如图5所示。从两个测序平台的分子标签末尾碱基连接通知看说明两个问题:第一个是连接效率受末端碱基的影响;第二点目前两个测序平台的接头末端效率排在中游以上,并不是连接效率最高的组合。
在研究MGI和Illumina双平台的分子标签接头除了统计前两个碱基外,还分析了第三个碱基的倾向性,虽然在倒数三位有四种组合形式,可以是A,T,G和C个任意一个碱基,比较统一的是在双侧序平台最高的分子标签组合都是ATG组合,说明在T-A连接的体系中,末端碱基的都能连接,但是每种组合的连接效率是有差异的,要想达到更好的效果,除了优化建库的酶和缓冲液体系,同时也要选择合适的接头末端碱基组合,如图6所示,如果MGI和Illumina测序平台的接头末端如果是ATG结尾会提升连接效率。
为了证明在分子标签中测试的规律是否在单端接头中是否是ATG结尾的接头在只有一种接头时具有连接效率优势,发明人分别对比了在MGI和Illumina平台末尾三个碱基的连接情况,把MGI原来末尾的ACT改为ATG,Illumina的原来ATC的改为ATG,如图7所示。同时也分别测试了建库的文库产量,ATG结尾的比原来的平台接头末端文库产量提升10-20%之间,所图8所示的文库产量结果,这充分说明在分子标签中测试了连接末端影响连接效率,在单独一种序列存在时也同样表现出来ATG末尾的接头有连接优势。
在测试分子标签接头时,由于分子标签接头加在通用接头前面,所以分子标签接头是可以不以T结尾的接头,原因是在普通的接头是完全和测序引物重合的,如果在普通接头末端突出碱基T改为C来弥补末端不完全加A,部分加G碱基,这样会影响测序引物的结合会影响测序的正常读取,如图9所示,如果在接头末端加C,虽然可以建库和读取,但是由于第一位读取的是C碱基,这个碱基是加上去的,会影响测序质量和是否去掉这个碱基的矛盾中。在分子标签接头的应用过程中,这个问题就不存在了,由于分子标签接头在固定接头末端一般加3-5个N碱基,一方面是碱基平衡性有保证,另一方面是在分子标签接头的应用过程中,分子标签的主要目的是标记序列,分析完是把标签去除进行数据分析的,所以既不影响测序,也不影响数据的平衡性,同时把部分分子标签接头的末端的T改为C可以提升连接效率,提升文库的转化效率,可以很好的利用有限的cf/ctDNA样本检测更低频的突变,如图10所示,在本发明测试中把一部的分子标签接头的末端设计为T结尾,另一部分分子标签接头的末端设计为C结尾。为了验证这种方案是否能够提升连接效率,本研究在64组分子标签测序结果靠后的5名分子标签除了以T结尾还添加了以C结尾的分子标签接头,经过建库测试发现在加有C碱基的结尾的分子标签排名大幅提前,如图11所示,排名上升四十多位,测序数据加C末尾的比没有加C的数据量提升了1倍多,这充分说明,在分子标签的应用中,除了T碱基结果还可以加部分C碱基结尾,这样能够提升连接效率。
综上所述,发明人在测试分子标签时发现,由于分子标签末端有各种序列组成的末端,连接效率会因为不同的末端有明显的差异,差距最大会有5-6倍。同时因为分子标签接头是在测序引物的外侧,是可以弥补加A方面的缺陷,突出末端是可以改变碱基提升连接效率。具体的,本发明通过在MGI和illumina两种测序平台的分子标签接头测试发现,不同的接头末端影响连接效率,目前MGI和Illumina的接头并不是最佳连接末端。本发明发现在T-A连接的过程中,末尾碱基是ATG有利于T-A连接达到最佳效果;在分子标签建库过程中突出末端除了T外,补充部分C突出末端有利于高效连接建库。
基于上述发现,根据本发明一种典型的实施方式,提供一种测序文库接头。该测序文库接头的3’末端为TG(T/A),其中,(T/A)表示此文库接头后面是T/A连接;优选的,测序文库接头的3’末端为ATG(T/A)。其中,“/”代表“或”。
在一种典型的实施方式中,测序文库接头的末端T碱基3’端的-OH上的O用S修饰,可以阻止引物被降解。本发明中的测序文库接头适应于双端测序,也是应用单端测序。为了使用方便及能够被广泛的应用,典型的,本发明的测序文库接头为在MGI或Illumina测序平台的测序文库接头序列基础上改变末端碱基获得。优选的,测序文库接头具有如SEQ IDNO:1和SEQ ID NO:2所示的序列;或如SEQ ID NO:3和SEQ ID NO:4所示的序列。
根据本发明一种典型的实施方式,提供一种测序文库构建试剂盒。该测序文库构建试剂盒上述任一种测序文库接头,进一步为了方便使用,测序文库构建试剂盒还可以包括其用于测序文库构建的试剂。
根据本发明一种典型的实施方式,提供一种测序文库的构建方法。该构建方法包括将测序文库接头连接到待测序的目的片段上,具体操作可参见本申请的实施方式及实施例部分。通过该方法构建的测序文库,能够充分利用有限的目的片段,达到高效建库,并且得到更准确的测序结果的目的,优选的,测序文库为用于MGI和Illumina测序平台的测序文库。
下面将结合具体的实施例来进一步说明本申请的有益效果。
实施例1
血浆游离DNA双端分子标签文库构建试剂盒(for MGI)构建文库(纳昂达,货号:#1002211)
步骤一:用天根血清/血浆游离DNA提取试剂盒(离心柱型)(DP339)提取人血浆DNA,建库投入10ng血浆碎片DNA。
步骤二:末端修复&加A
1、取出End Repair&A-Tailing Buffer和End Repair&A-Tailing Enzyme置于冰上自然融解,混合均匀,瞬时离心备用。
2、按照下表1,在置于冰上的0.2ml PCR管中进行反应体系配制:
表1
3、混合均匀,瞬时离心使全部反应液置于PCR管底部。
4、在PCR仪上启动如下表2所示的反应程序,等温度稳定至20℃时将反应管放进PCR仪:
表2
步骤三:接头连接
1、取出Ligation Buffer和DNA Ligase置于冰上自然融解,混合均匀,瞬时离心备用。
2、从PCR仪上取出步骤二PCR反应管,置于冰上,按照表3所示的体系进行接头连接反。
表3:应体系配制:
3、混合均匀,瞬时离心使全部反应液置于PCR管底部。
4、在PCR仪上启动如下表4的反应程序,等温度稳定至20℃时将反应管放进PCR仪:
表4
步骤四:磁珠纯化
1、提前将NanoPrepTM SP Beads取出涡旋混匀,室温平衡30min后使用。
2、向步骤三连接体系PCR管加入40μl NanoPrepTM SP Beads,混合均匀,25℃孵育5~10min。
3、将PCR管瞬时离心后放置于磁力架上5min至液体完全澄清,使用移液器吸取移弃上清。
4、沿PCR管侧壁缓慢加入150μl 80%乙醇,注意勿扰动磁珠,静置30s,使用移液器吸取移弃上清。
5、重复步骤4一次。
6、将PCR管瞬时离心后放置于磁力架上,使用10μl吸头移去少量残留乙醇,注意勿吸到磁珠。
7、打开PCR管管盖,并于室温静置约5min,至乙醇挥发完全。
8、移出PCR管,向PCR管中加入21μl Nuclease Free Water,将磁珠悬浮均匀,25℃孵育2min。
9、将PCR管瞬时离心后放置于磁力架上2min至液体完全澄清,使用移液器吸取20μl上清,并转移至1个新的0.2ml PCR管中,置于冰上备用。
步骤五:PCR扩增
1、取出2X HiFi PCR Master Mix和Amplification Primer Mix置于冰上自然解冻,混合均匀,瞬时离心备用。
2、按照表5中所示的体系在置于冰上的PCR管中进行反应体系配制:
表5
3、将PCR管放入PCR仪中启动表6中的程序:
表6
步骤五:文库纯化、定量和质检
1、向PCR管加入60μl的NanoPrepTM SP Beads混合均匀,25℃孵育5~10min。
2、将PCR管瞬时离心后放置于磁力架上5min,至液体完全澄清,使用移液器吸取移弃上清。
3、沿PCR管侧壁缓慢加入150μl 80%乙醇,注意勿扰动磁珠,静置30s,使用移液器吸取移弃上清。
4、重复步骤3一次。
5、PCR管瞬时离心,放置于磁力架上,使用10μl吸头移去少量残留乙醇,注意勿吸到磁珠。
6、打开PCR管管盖,并于室温静置约5min,至乙醇挥发完全。
7、向PCR管加入20μl TE Solution,使用移液器将磁珠悬浮均匀,25℃孵育2min。
8、将PCR管瞬时离心后放置于磁力架上2min,至液体完全澄清,使用移液器小心将上清移取至一个新的0.2ml PCR管中进行保存,注意勿吸到磁珠。
9、使用Qubit对文库进行定量。
10、使用Bioanalyzer(Agilent)、Qsep100(Bioptic)等相关片段分析仪器进行文库片段分布检测。
步骤六:上机测序和数据分析
1、用MGI-2000测序仪测定PE150。
2、分析时用前三个碱基的分子标签进行统计分析,比对时去掉前7个碱基。
其中,本实施例中测试的MGI UMI Adapter中末端标签序列信息如下表(MGI UMIAdapter结构具体参见CN109971827A):
表7
实施例1的测试结果:在MGI平台分子标签接头的末端两个碱基的16种组合与目标片段的末端两碱基的16种组合的统计发现,不同的末端是有不用的连接效率,如图2所示,两碱基的16种组合在连接目标片段时差异明显。在MGI分子标签的建库接头是由64种混合组成,在评估末尾两个碱基是有16种组合。
实施例2
血浆游离DNA双端分子标签文库构建试剂盒(for/>)构建文库(纳昂达,货号:#1003431)
实施例2和实施例1的区别在于:实施例2用的接头是针对Illumina测序平台的分子标签,扩增引物是针对Illumina平台的双端index引物,其它操作流程完全一样。
针对Illumina测序平台的分子标签信息如下:
表8
*号表示硫代修饰,将T碱基3’端的-OH上的O用S修饰,以防止接头被内切酶切掉。
实施例的测试结果:在MGI测序平台的这种现象同样在Illumina测序平台也发现相似规律,虽然在Illumina测序平台的接头末端两个碱基种类只有8组,规律是一样的,如图3所示,在两个平台都是TG结尾的连接效率最高。在Illumina的分子标签接头的设计过程中,由于末尾选择了G或C结尾,所在评估末尾两个碱基的组合时只有8种组合,这并不影响本发明的情况评估。
实施例3
用ATG结尾的通用接头建库评估接头末端碱基对建库效率的影响
实施例3用DNA通用型文库构建试剂盒搭配MGI和Illumina截断型接头,在MGI平台截断型接头的末端是ACT(T)结尾,在Illmina测序平台截断型接头末端是ATC(T),本实施例优化的对比测试是ATG(T)结尾。建库试剂盒是用纳昂达通用建库试剂盒建库(纳昂达,货号:#1002211),SEQ ID NO:1和SEQ ID NO:2退火在一起作为与MGI原始接头的对比测试;SEQ ID NO:3和SEQ ID NO:4退火在一起作为与Illumina原始接头的对比测试。具体ATG末端的接头序列如下:
MGI ATG结尾接头1,SEQ ID NO:1
/phos/CATCGGAGGCCAAGCGGTCTTAGGAAGACAATCAG,/phos/代表磷酸化。
MGI ATG结尾接头2,SEQ ID NO:2
CTGATTGTCTTCCTAAGCACAGAACGACATGGCTACGATCCGATG*T,其中*代表T碱基3’端的-OH上的O用S修饰。
Illumina ATG结尾接头1,SEQ ID NO:3
/5Phos/CATCGGAAGAGCACACGTCTGAACTCCAGTCAC,/phos/代表磷酸化。
Illumina ATG结尾接头2,SEQ ID NO:4
ACACTCTTTCCCTACACGACGCTCTTCCGATG*T,其中*代表T碱基3’端的-OH上的O用S修饰。
经过对比建库测试发现,以ATG三碱基结尾的建库接头封闭替换MGI和Illumian原始接头末端三个碱基对比建库实验,发现以ATG结尾的末端比目前测序平台原始的接头末端连接效率高10-20%,如图8所示。
实施例4
为了提升连接效率在分子标签接头建库时增加了部分GC连接接头。
本实施例和实施例1的流程一致,在分子标签接头部分,把连接效率靠后的5个分子标签接头的接头末尾由T改为C。在普通建库接头中由于接头和测序引物部分重叠,所以接头部分不能随意改动,改动后即使建库效率高,改动的建库产物也不能在后续的测序过程中有体现,如图9所示。在分子标签接头建库不存在这个问题,由于分子标签已经在测序引物结合的外部,所以是可以增加由于末端不止加A的末端的连接效率提升,在建库片段有一部分是加G结尾,这样本发明把连接效率靠后的接头补充了以C结尾的末端(大约10%),进而提升了建库的连接效率。图11所示,在靠后的5个分子标签加入C碱基后,连接数据有1倍多的提升,同时也不影响测序过程中的读取。如图10所示,测序引物结合的是通用接头部分,分子标签和建库连接时用到的A和C都在测序引物读取序列里,不在引物结合区,这样既可以提升连接效率,有不影响测序,是一种比较好的改进措施。
综上所述,本发明针对MGI和Illumina各自测序平台的建库接头末端序列连接效率的评估,尤其是分子标签建库的评估,在评估的过程中发现,建库接头末端的两个碱基和三个碱基是决定连接效率的主要因素,不同的末端连接效率最高有5-6倍的差异,在双测序平台都发现以TG末尾两碱基结尾是连接效率最高的组合,如果在考虑第三个碱基就是ATG结尾末端连接效率最高。同时在测试分标签接头时由于测序因为在分子标签接头结合位点不重合,可以部分接头采用C结尾的CG连接来提升建库效率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 纳昂达(南京)生物科技有限公司
<120> 测序文库接头、测序文库及其构建方法、提升NGS建库连接效率的方法
<130> PN181314NAGD
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 35
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(1)
<223> 5'端进行磷酸化修饰
<400> 1
catcggaggc caagcggtct taggaagaca atcag 35
<210> 2
<211> 46
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (45)..(46)
<223> T碱基3’端的-OH上的O用S修饰
<400> 2
ctgattgtct tcctaagcac agaacgacat ggctacgatc cgatgt 46
<210> 3
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(1)
<223> 5'端进行磷酸化修饰
<400> 3
catcggaaga gcacacgtct gaactccagt cac 33
<210> 4
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (32)..(33)
<223> T碱基3’端的-OH上的O用S修饰
<400> 4
acactctttc cctacacgac gctcttccga tgt 33

Claims (8)

1.一种提升NGS建库连接效率的方法,其特征在于,包括:
将测序文库接头的3’末端设计为TG,以及
将所述测序文库接头与待测目的片段通过T/A连接。
2.根据权利要求1所述的方法,其特征在于,将所述测序文库接头的3’末端设计为ATG。
3.根据权利要求1或2所述的方法,其特征在于,所述测序文库接头的末端T碱基3’端的-OH上的O用S修饰。
4.根据权利要求1或2所述的方法,其特征在于,所述测序文库接头为双端测序文库接头或单端测序文库接头。
5.根据权利要求1或2所述的方法,其特征在于,所述测序文库接头为在MGI或Illumina测序平台的测序文库接头序列基础上改变末端碱基获得。
6.根据权利要求1或2所述的方法,其特征在于,所述测序文库接头从5’端到3’端包括测序引物结合区和分子标签,部分所述分子标签接头末端的T改为C。
7.根据权利要求6所述的方法,其特征在于,10%~20%的所述分子标签末端的T改为C。
8.根据权利要求1或2所述的方法,其特征在于,所述测序文库接头具有如SEQ ID NO:1和SEQ ID NO:2所示的序列;或如SEQ ID NO:3和SEQ ID NO:4所示的序列。
CN202210550745.XA 2022-05-20 2022-05-20 测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法 Active CN114807125B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210550745.XA CN114807125B (zh) 2022-05-20 2022-05-20 测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210550745.XA CN114807125B (zh) 2022-05-20 2022-05-20 测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法

Publications (2)

Publication Number Publication Date
CN114807125A CN114807125A (zh) 2022-07-29
CN114807125B true CN114807125B (zh) 2023-09-12

Family

ID=82516517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210550745.XA Active CN114807125B (zh) 2022-05-20 2022-05-20 测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法

Country Status (1)

Country Link
CN (1) CN114807125B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012017081A1 (en) * 2010-08-06 2012-02-09 Ludwig-Maximilians-Universität München Identification of t cell target antigens
CN106192019A (zh) * 2015-05-29 2016-12-07 分子克隆研究室有限公司 用于制备测序文库的组合物和方法
CN109971827A (zh) * 2019-03-25 2019-07-05 纳昂达(南京)生物科技有限公司 血浆dna的建库方法和建库试剂盒
CN110565174A (zh) * 2019-09-17 2019-12-13 北京博昊云天科技有限公司 一种dna文库构建方法
CN111534518A (zh) * 2020-05-18 2020-08-14 纳昂达(南京)生物科技有限公司 通用封闭序列及其应用
CN113005121A (zh) * 2021-04-25 2021-06-22 纳昂达(南京)生物科技有限公司 接头元件、试剂盒及其相关应用
CN113106150A (zh) * 2021-05-12 2021-07-13 浙江大学 一种超高通量单细胞测序方法
CN113337501A (zh) * 2021-08-06 2021-09-03 北京橡鑫生物科技有限公司 一种发卡型接头及其在双端index建库中的应用
CN113502287A (zh) * 2021-06-28 2021-10-15 深圳市核子基因科技有限公司 分子标签接头及测序文库的构建方法
CN113913495A (zh) * 2021-10-28 2022-01-11 臻和(北京)生物科技有限公司 Duplex UMI接头及测序方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012017081A1 (en) * 2010-08-06 2012-02-09 Ludwig-Maximilians-Universität München Identification of t cell target antigens
CN106192019A (zh) * 2015-05-29 2016-12-07 分子克隆研究室有限公司 用于制备测序文库的组合物和方法
CN109971827A (zh) * 2019-03-25 2019-07-05 纳昂达(南京)生物科技有限公司 血浆dna的建库方法和建库试剂盒
CN110565174A (zh) * 2019-09-17 2019-12-13 北京博昊云天科技有限公司 一种dna文库构建方法
CN111534518A (zh) * 2020-05-18 2020-08-14 纳昂达(南京)生物科技有限公司 通用封闭序列及其应用
WO2021232793A1 (zh) * 2020-05-18 2021-11-25 纳昂达(南京)生物科技有限公司 通用封闭序列及其应用
CN113005121A (zh) * 2021-04-25 2021-06-22 纳昂达(南京)生物科技有限公司 接头元件、试剂盒及其相关应用
CN113106150A (zh) * 2021-05-12 2021-07-13 浙江大学 一种超高通量单细胞测序方法
CN113502287A (zh) * 2021-06-28 2021-10-15 深圳市核子基因科技有限公司 分子标签接头及测序文库的构建方法
CN113337501A (zh) * 2021-08-06 2021-09-03 北京橡鑫生物科技有限公司 一种发卡型接头及其在双端index建库中的应用
CN113913495A (zh) * 2021-10-28 2022-01-11 臻和(北京)生物科技有限公司 Duplex UMI接头及测序方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
新一代测序技术的文库制备方法研究进展;李琳等;应用化学;第38卷(第1期);全文 *

Also Published As

Publication number Publication date
CN114807125A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
CN109971827B (zh) 血浆dna的建库方法和建库试剂盒
WO2012116661A1 (zh) Dna标签及其应用
CN109486811A (zh) 双端分子标签接头及其用途和带有该接头的测序文库
CN112359093B (zh) 血液中游离miRNA文库制备和表达定量的方法及试剂盒
WO2017219512A1 (zh) 一种游离dna文库构建方法及试剂盒
CN113005121B (zh) 接头元件、试剂盒及其相关应用
US20220056519A1 (en) Method and system for constructing sequencing library on the basis of methylated dna target region, and use thereof
WO2023040723A1 (zh) 测序接头、构建方法、纳米孔建库试剂盒及应用
WO2020177012A1 (zh) 用于rna直接建库的核酸序列、基于rna样本直接构建测序文库的方法及应用
CN113862261B (zh) 一组应用于不同高通量测序平台文库的通用环化陪伴序列、其试剂盒以及环化方法
CN111304288A (zh) 特异性分子标签umi组及其应用
CN108474026A (zh) 用于核酸测序的新的衔接子和使用方法
CN112410331A (zh) 带分子标签和样本标签的接头及其单链建库方法
CN113337501A (zh) 一种发卡型接头及其在双端index建库中的应用
CN111471746A (zh) 检测低突变丰度样本的ngs文库制备接头及其制备方法
CN114807125B (zh) 测序文库接头、测序文库及其构建方法、提升ngs建库连接效率的方法
WO2021253372A1 (zh) 一种高兼容性的PCR-free建库和测序方法
CN110872609A (zh) 对小rna分子精准建库和测序的方法以及应用
CN111005075B (zh) 用于双样本共建测序文库的y型接头和双样本共建测序文库的方法
CN109337966A (zh) 一种分子标签及其试剂和应用
CN108342385A (zh) 一种接头和通过高效率环化方式构建测序文库的方法
CN111748613A (zh) 一种双标签接头设计方法及制备方法
WO2014086037A1 (zh) 构建核酸测序文库的方法及其应用
CN116004763B (zh) 一种组合型接头的选择验证和质控方法
CN114277096B (zh) 鉴别地中海贫血αααanti4.2杂合型和HKαα杂合型的方法和试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant