CN109694864B - 基于点击化学的测序接头、双条形码测序文库及其构建方法 - Google Patents
基于点击化学的测序接头、双条形码测序文库及其构建方法 Download PDFInfo
- Publication number
- CN109694864B CN109694864B CN201710994066.0A CN201710994066A CN109694864B CN 109694864 B CN109694864 B CN 109694864B CN 201710994066 A CN201710994066 A CN 201710994066A CN 109694864 B CN109694864 B CN 109694864B
- Authority
- CN
- China
- Prior art keywords
- fragment
- date
- sample
- sequencing
- click chemistry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B80/00—Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
一种基于点击化学的测序接头、双条形码测序文库及其构建方法,该测序接头包括:日期片段,包括5’端的与正向引物部分或全部序列一致的序列、中间的日期条形码序列以及3’末端的点击化学反应基团;样本片段顶链,包括5’末端的点击化学反应基团、中间的样本条形码序列以及3’端的与反向引物部分或全部序列一致的序列;样本片段底链,包括5’末端的磷酸化修饰、中间的样本条形码序列;其中样本片段底链分别与日期片段和样本片段顶链部分杂交;杂交后日期片段的点击化学反应基团与样本片段顶链的点击化学反应基团位置接近且能发生点击化学反应而偶联。可以快速、高效地实现双条形码测序文库构建,通过测序推断出核酸文库构建的日期,实现准确的样本溯源。
Description
技术领域
本发明涉及测序技术领域,具体涉及一种基于点击化学的测序接头、双条形码测序文库及其构建方法。
背景技术
分子生物学技术为感染性疾病病原微生物的诊断提供了新的手段,特别是PCR技术的高度敏感性和特异性,使感染性疾病的诊断有了质的飞跃。它可以从分子水平上早期诊断各种感染性疾病,并根据基因序列判断疾病的发生、发展、变异等。由于PCR检测高度的敏感性,使得病原检测极易出现假阳性,因此污染防控是基于PCR扩增的分子诊断产品的重要组成部分。
测序是确定微生物最为准确可靠的方法之一,使用新一代测序平台对提取的DNA进行测序,通过得到的大量序列信息,利用现有的微生物基因信息数据库,可以迅速识别各类病原微生物,使诊断结果更加精确。全基因组测序技术不同于以往的微生物分析手段,不需要筛选得到该环境中所有微生物的纯培养物,就可以一次性发现所有微生物的种类和生存情况,可以避免环境改变带来的偏差。如果将这种诊断技术应用于临床,可以判断已知和预测未知病原体,将极大提高病原微生物检测的效率和准确性,也可以在微量的样本中检测出病原体,尤其是发现部分先前未鉴定的微生物。随着高通量测序技术的快速发展和成本的降低,使得这一技术有了巨大的应用前景,但其面临着与PCR技术一样的问题,测序文库容易受到外源核酸的污染。如何高效地解决这一问题是高通量测序技术在临床大规模应用的前提。
现有高通量病原检测技术流程包括:样本核酸提取;Qubit测定核酸浓度;核酸片段化;末端修复与纯化;接头连接;测序引物PCR扩增;文库片段选择;Qubit测定文库浓度及质控;以及上机测序及结果分析。现有高通量测序文库构建过程较易产生气溶胶,污染其它样本,导致检测假阳性的产生;现有测序文库构建过程较为繁琐,样本编号系统不统一,依靠试管上的标识容易弄错或磨损,操作过程一旦出现失误,无法追踪样本的来源信息;对测序样本无法进行日期等核心信息的有效识别。
发明内容
本发明要解决的技术问题是提供一种基于点击化学的测序接头和包含此接头的试剂盒,以及利用基于点击化学的测序接头进行建库的方法及基于此建库方法构建的文库。利用本发明的测序接头,可以快速、高效地实现双条形码测序文库构建,通过测序推断出核酸文库构建的日期,实现准确的样本溯源,可排除测序结果中非当日产生的核酸序列,排除气溶胶污染。
为了解决上述问题,本发明通过如下技术方案实现:
本发明第一方面提供一种基于点击化学的测序接头,该测序接头包括如下三条核酸序列片段:
日期片段,其包括5’端的与正向引物部分或全部序列序列一致的序列、中间的用于编码日期信息的条形码序列以及3’末端的用于进行点击化学反应的基团;
样本片段顶链,其包括5’末端的与上述日期片段的3’末端基团进行点击化学反应的基团、中间的用于区分样本的条形码序列以及靠近3’端的与反向引物部分或全部序列序列一致的序列;
样本片段底链,其包括5’末端的用于与待测序核酸片段连接的磷酸化修饰、中间的用于区分样本的条形码序列,该条形码序列与上述样本片段顶链中的条形码序列反向互补;
其中,上述样本片段底链分别与上述日期片段和上述样本片段顶链部分杂交;且杂交后,上述日期片段中3’末端的用于进行点击化学反应的基团与上述样本片段顶链中5’末端的用于进行点击化学反应的基团位置接近且能发生点击化学反应而偶联在一起。
进一步地,上述日期片段的3’末端的基团和样本片段顶链的5’末端的基团可分别包含叠氮基和炔基,无先后顺序的限定,当日期片段的3’末端的基团包含叠氮基时,样本片段顶链的5’末端包含炔基;当日期片段的3’末端的基团包含炔基时,样本片段顶链的5’末端包含叠氮基。
进一步地,上述点击化学反应是铜催化的叠氮-炔基Husigen环加成反应。
进一步地,上述样本片段底链与上述日期片段互补的碱基个数是6~10个。
进一步地,上述日期片段的条形码序列采用四进制编码的方式对日期进行编码,用0、1、2、3分别与核酸的四种碱基一一对应,构建包含六个碱基序列的日期标签系统,其中以一位四进制数值表示年份,以二位四进制数值表示月份,以三位四进制数值表示日。
进一步地,上述日期片段、上述样本片段顶链和上述样本片段底链,分别如SEQ IDNO:1、SEQ ID NO:2和SEQ ID NO:3所示。
本发明第二方面提供一种基于点击化学的双条形码测序文库的构建方法,该构建方法包括将上述的测序接头与待测序核酸片段连接的步骤。
进一步地,上述构建方法还包括PCR扩增步骤,该PCR扩增步骤中采用一对正向引物和反向引物进行扩增,正向引物和反向引物的序列与日期片段和样本片段顶链中的正向引物和反向引物的序列相同。
进一步地,上述构建方法还包括基于点击化学制备测序接头的步骤。
进一步地,上述日期片段、上述样本片段顶链和上述样本片段底链,分别如SEQ IDNO:1、SEQ ID NO:2和SEQ ID NO:3所示;上述正向引物和上述反向引物,分别如SEQ ID NO:4和SEQ ID NO:5所示。
本发明第三方面提供一种基于点击化学的双条形码测序文库,该测序文库通过上述方法构建。
本发明第四方面提供一种试剂盒,该试剂盒包含第一方面的测序接头。
本发明的有益效果:
本发明的基于点击化学构建的测序接头同时含有两种标签,同时避免了直接合成长片段而造成的片段序列的准确性降低及成本大大提高的问题。
利用点击化学构建的测序接头进行文库的构建,在面对大量样本时更具有优势,一方面,点击化学构建的测序接头可满足大规模的样本进行建库同时测序的需求,例如,在365天、96种样本条形码的情况下,直接合成带有日期和样本双条形码的接头,需要合成35040(即365×96)种接头,而在本发明中,只需要合成365种日期片段和96种样本片段即可;另一方面,点击化学构建的测序接头含有日期和样本双重条形码双标签的特点,即使不同日期的文库可以使用同样的样本条形码而不会混淆。
附图说明
图1为本发明实施例中基于点击化学的测序接头的三条核酸序列片段的结构示意图;
图2为本发明实施例中基于点击化学的测序接头的三条核酸序列片段的相互作用示意图;
图3为本发明实施例中基于点击化学的双条形码测序文库的构建方法流程示意图。
图4为本发明实施例中点击化学反应前后的日期片段和样本片段及点击化学的连接产物进行Agilent 2100分析的结果。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本发明相关的一些操作并没有在说明书中显示或者描述,这是为了避免本发明的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
点击化学(Click chemistry),又称为“链接化学”、“动态组合化学”(DynamicCombinatorial Chemistry)、“速配接合组合式化学”,是由化学家巴里·夏普莱斯(K BSharpless)在2001年引入的一个合成概念,主旨是通过小单元的拼接,来快速可靠地完成形形色色分子的化学合成。它尤其强调开辟以碳-杂原子键(C-X-C)合成为基础的组合化学新方法,并借助这些反应(点击反应)来简单高效地获得分子多样性。点击化学的代表反应为铜催化的叠氮-炔基Husigen环加成反应(Copper-Catalyzed Azide–AlkyneCycloaddition)。点击化学具有产率高、反应速度快、选择性高等优点,其命名也是来源于“反应就像点击一下鼠标一样简单”。
点击化学在原理上可分成四类:碳碳多键加成反应、亲核开环化反应、“保护基”反应、环加成反应。Husigen环加成反应是点击反应中最接近完美的,除此以外点击反应中用得比较多的,还有Thiol-ene反应(烯基+巯基)、Diels-Alder反应(双烯体+亲双烯体)。这些点击化学都可以用于本发明中。
本发明利用点击化学来进行测序接头构建,使得构建好的文库中同时带有区分日期的条形码(barcode)序列和区分样本的条形码序列。
如图1所示,在本发明一实施例中基于点击化学的测序接头,包括如下三条核酸序列片段:
日期片段,其包括位于5’端的与正向引物序列(左斜线表示)一致的序列、位于中间的用于编码日期信息的条形码序列(即图中的日期条形码,方格表示),以及位于3’末端的用于进行点击化学反应的基团(即图中的叠氮基)。需要说明的是,在正向引物序列和日期条形码之间可以有或者没有一些碱基间隔,优选地,如图1所示的示意图中,包括一些碱基间隔。在日期条形码和用于进行点击化学反应的基团之间可以有或者没有一些碱基间隔,优选地,如图1所示的示意图中,包括一些碱基间隔。所谓“日期片段”,是根据其包含日期条形码而命名的,作用是标识样本的日期信息。在本发明的一个优选的实施例中,日期片段的条形码序列采用四进制编码的方式对日期进行编制,用0、1、2、3分别与核酸的四种碱基(A、T、C、G)一一对应,构建用6个碱基表示的日期标签系统。三位四进制的数值表示的范围是1-64,可以满足1-31的日期要求,所以本发明实施例以三位四进制数值表示日期,以此类推,以两位四进制数值表示月份;在年份设计方面,以四年为一周期,按A、T、C、G各表示一年的形式进行记录,如以2017年为基数,则其四位制表示数据为“0”,核酸序列表示值为“A”,以此类推。
样本片段顶链(TOP),其包括位于5’末端的与日期片段的3’末端基团进行点击化学反应的基团(即图中的炔基)、位于中间的用于区分样本的条形码序列(即图中的样本条形码,竖线表示),以及靠近3’端的与反向引物序列(右斜线表示)一致的序列。需要说明的是,在位于5’末端的进行点击化学反应的基团和样本条形码之间,可以有或者没有一些碱基间隔,优选地,如图1所示的示意图中,包括一些碱基间隔。在样本条形码和反向引物序列之间,可以有或者没有一些碱基间隔,优选地,如图1所示的示意图中,包括一些碱基间隔。在反向引物序列和3’末端之间,可以有或者没有一些碱基间隔,优选地,如图1所示的示意图中,包括一些碱基间隔。所谓“样本片段”是根据其包含样本条形码而命名的,作用是标识样本来源信息。所谓“顶链”是相对于“底链”而言的,这二者有配对关系,分别是双链接头的两条链。需要说明的是,样本片段顶链5’末端的进行点击化学反应的基团与日期片段3’末端的进行点击化学反应的基团,可以是任何能够发生点击化学反应的一对基团,例如,碳碳多键加成反应、亲核开环化反应、“保护基”反应、环加成反应等。在本发明的一个优选实施例中,点击化学反应是铜催化的叠氮-炔基Husigen环加成反应。更优选地,日期片段3’末端的进行点击化学反应的基团是叠氮基,样本片段顶链的5’末端的进行点击化学反应的基团是炔基。
样本片段底链(BOTTOM),其包括位于5’末端的用于与待测序核酸片段连接的磷酸化修饰(图中未示出)、位于中间的用于区分样本的条形码序列(即图中的样本条形码,竖线表示,与样本片段顶链中的条形码序列反向互补)。需要说明的是,样本条形码在样本片段底链中的位置没有严格限制,可以比较靠近5’末端,也可以比较靠近3’末端,并且距离5’末端和3’末端的碱基个数也没有严格限制。所谓“底链”是相对于“顶链”而言的,这二者有配对关系,分别是双链接头的两条链。
如图2所示,样本片段底链分别与日期片段和样本片段顶链部分杂交;且杂交后,日期片段中3’末端的用于进行点击化学反应的基团(即图中的叠氮基)与样本片段顶链中5’末端的用于进行点击化学反应的基团(即图中的炔基)位置接近且能发生点击化学反应而偶联在一起。在图2中,在点击化学反应的基团是叠氮基和炔基的情况下,优选地,样本片段底链与日期片段互补的碱基个数是8~10个,因此结合并不稳定。在Cu+存在的情况,Cu+可以催化日期片段3’末端的叠氮基与样本片段顶链5’末端的炔基发生偶联反应。通过这个偶联,日期片段和样本片段底链在空间上处于一个接近的位置,样本片段底链的3’端与日期片段的结合相较之前稳定,因此在后续反应中样本片段底链的3’端可以以日期片段作为模板延伸。三条序列组合而成的产物即为测序接头,后续用于与待测序片段连接。在另一种实现形式中,也可以先将样本片段(即“顶链”和“底链”的退火产物)与待测序片段连接,再加入日期片段进行点击反应。
需要说明的是,在本发明中“测序接头”,是指包括上述日期片段、样本片段顶链和样本片段底链的任何形式的核酸序列,不论它们是否发生退火。
图3示出了一种基于点击化学的双条形码测序文库的构建方法流程,将待测序片段(图中插入片段)与接头连接,获得连接产物,连接产物不能直接测序,需要进行一步PCR扩增步骤,该PCR扩增步骤中采用一对正向引物和反向引物进行扩增,正向引物和反向引物的序列与日期片段和样本片段顶链中的正向引物和反向引物的序列相同。图3示出了在PCR步骤中,从连接产物到可用于测序的文库之间发生的反应过程,包括:①由于连接产物中只存在与引物序列一致的序列,不存在反向互补序列,因此初始状态下,引物无法与连接产物杂交并延伸,故此样本片段底链的3’末端以日期片段为模板延伸;②延伸产物获得与正向引物序列互补的序列;③高温变性,双链打开,正向引物结合并延伸;④延伸过程中引入反向引物序列的互补序列,延伸无法通过三唑环,在此终止;⑤变性,反向引物杂交;⑥反向引物延伸;⑦上一步产物变性,正向引物杂交并延伸;⑧获得两端具有不对称接头序列的文库,之后文库在正、反向引物作用下进行指数扩增,产生足够的文库以用于测序。
以下通过实施例详细说明本发明的技术方案和效果,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。
实施例1:测序接头的点击化学连接
表1示出了本实施例使用的核酸序列。
表1
注:斜体代表与引物序列相同的序列;波浪线的序列之间反向互补,双划线的序列之间反向互补,单划线的序列之间反向互补;加粗代表条形码序列(包括日期和样本),其中日期条形码通过四进制进行编码,A、C、G、T分别代表四进制中的0、1、2、3,年份4年为一周期,用一个碱基编码,例如2017——A,2018——C,月份包含1-12变化,因此用两个碱基编码(42=16>12),日期包含1-32变化,因此用三个碱基编码(43=64>32),上面例子中的AGACCG,A代表2017年,GA代表四进中的20,即等于二进制中的8,CCG代表四进制中的112,即等于二进制中的26,代表8月26日。
将样本片段顶链和样本片段底链分别用TE溶液溶解成50μM,各取50μL混合并在室温静置30min退火,用作样本片段。之后按照表2的体系配置并进行反应。反应前后进行Agilent 2100分析。
表2
Agilent 2100分析结果如图4所示,反应前约35bp和100bp的条带分别为日期片段和样本片段,反应后这两个条带信号减弱,并在>100bp的地方出现了一个新的条带,即为点击化学的连接产物。
实施例2:基于BGISEQ-500测序平台的病原菌分析
表3示出了本实施例使用的测序接头的三条核酸序列片段以及正向引物和反向引物序列。
表3
注:斜体代表与引物序列相同的序列;波浪线的序列之间反向互补,双划线的序列之间反向互补,单划线的序列之间反向互补;加粗代表条形码序列(包括日期和样本),其中日期条形码通过四进制进行编码,A、C、G、T分别代表四进制中的0、1、2、3,年份4年为一周期,用一个碱基编码,例如2017——A,2018——C,月份包含1-12变化,因此用两个碱基编码(42=16>12),日期包含1-32变化,因此用三个碱基编码(43=64>32),上面例子中的AGACCG,A代表2017年,GA代表四进中的20,即等于二进制中的8,CCG代表四进制中的112,即等于二进制中的26,代表8月26日。
本实施例中使用的试剂信息如下表4所示:
表4
按照如下步骤进行反应:
1.样本片段退火(可分开提前进行):
按照如下表5所示的体系和程序进行样本片段退火反应:
表5
2.待测序片段末端修复
按照如下表6所示的体系和程序进行待测序片段末端修复反应:
表6
3.点击反应
按照如下表7所示的体系和程序进行点击反应:
表7
PBS | 9μL |
日期片段(100μM) | 2μL |
样本片段(步骤1产物) | 4μL |
抗坏血酸钠(300μM) | 2.5μL |
二水合氯化铜(II)(1mM) | 2.5μL |
总体积 | 20μL |
按照上面比例配制混合液,充分混匀后,在室温中静置1h。
4.接头连接
按照如下表8所示的体系和程序进行接头连接反应:
表8
5.纯化
5.1将连接产物加入40μL(0.5倍)Axygen磁珠,充分混匀后室温静置5min,小心弃去上清。
5.2小心加入400μL 80%乙醇,并旋转离心管以充分洗涤磁珠(旋转次数一般为2次),洗涤之后静止1min,吸弃乙醇。
5.3重复步骤5.2一次。
5.4小心吸弃乙醇之后室温晾干(时间长短与室内湿度有关,一般为3min),至磁珠表面哑光。
5.5加入23μL洗脱溶液(多次小心吹打混匀磁珠),静止5min(间隔轻弹管壁混匀)。
5.6短暂离心(时间稍长磁珠晾干的时间可能更短)后,置于磁力架上2min,小心吸取21μL溶液至新的1.5mL离心管中。
6.PCR扩增
按照如下表9所示的体系和程序进行PCR扩增反应:
表9
7.纯化
7.1将PCR产物加入50μL(1倍)Axygen磁珠,充分混匀后室温静置5min,小心弃去上清。
7.2小心加入400μL 80%乙醇,并旋转离心管以充分洗涤磁珠(旋转次数一般为2次),洗涤之后静止1min,吸弃乙醇。
7.3重复步骤7.2一次。
7.4小心吸弃乙醇之后室温晾干(时间长短与室内湿度有关,一般为3min),至磁珠表面哑光。
7.5加入23μL洗脱溶液(多次小心吹打混匀磁珠),静止5min(间隔轻弹管壁混匀)。
7.6短暂离心(时间稍长磁珠晾干的时间可能更短)后,置于磁力架上2min,小心吸取21μL溶液至新的1.5mL离心管中。
8.上机测序
将纯化的DNA文库稀释至合适浓度混合,使用BGISEQ-500进行测序分析。
9.下机数据分析
分别将下机数据中的每条序列与病原基因组数据库比对并注释,且识别序列中的日期条形码序列,获得文库构建日期。
该结果中,分别检测出金黄色葡萄球菌与大肠杆菌,各自的序列数分别为779和103,这些序列中,金黄色葡萄球菌上的日期条形码序列为AGACCG,代表2017年8月26日,符合预期,而大肠杆菌的日期条形码序列为AGACAT,代表2017年8月23日,表明这些序列来源于之前批次建库带来污染,从而将大肠杆菌的检出排除。通过日期条形码序列的引入,可以有效地排除由于污染而带来的结果分析错误。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
SEQUENCE LISTING
<110> 深圳华大基因股份有限公司
<120> 基于点击化学的测序接头、双条形码测序文库及其构建方法
<130> 17I24732
<160> 5
<170> PatentIn version 3.3
<210> 1
<211> 34
<212> DNA
<213> 人工序列
<400> 1
gaacgacatg gctacgaaag agaccgtcgg gagt 34
<210> 2
<211> 48
<212> DNA
<213> 人工序列
<400> 2
ggtctagtca ttgtcttcct aagtgtgagc caaggagttg tccgactt 48
<210> 3
<211> 55
<212> DNA
<213> 人工序列
<400> 3
agtcggaggc caagcggtct taggaagaca atgactagac cggaggaact cccga 55
<210> 4
<211> 17
<212> DNA
<213> 人工序列
<400> 4
gaacgacatg gctacga 17
<210> 5
<211> 17
<212> DNA
<213> 人工序列
<400> 5
tgtgagccaa ggagttg 17
Claims (12)
1.一种基于点击化学的测序接头,其特征在于,所述的测序接头包括如下三条核酸序列片段:
日期片段,其包括5’端的与正向引物部分或全部序列一致的序列、中间的用于编码日期信息的条形码序列以及3’末端的用于进行点击化学反应的基团;
样本片段顶链,其包括5’末端的与所述日期片段的3’末端基团进行点击化学反应的基团、中间的用于区分样本的条形码序列以及靠近3’端的与反向引物部分或全部序列一致的序列;
样本片段底链,其包括5’末端的用于与待测序核酸片段连接的磷酸化修饰、中间的用于区分样本的条形码序列,该条形码序列与所述样本片段顶链中的条形码序列反向互补;
其中,所述样本片段底链分别与所述日期片段和所述样本片段顶链部分杂交;且杂交后,所述日期片段中3’末端的用于进行点击化学反应的基团与所述样本片段顶链中5’末端的用于进行点击化学反应的基团位置接近且能发生点击化学反应而偶联在一起。
2.根据权利要求1所述的测序接头,其特征在于,所述日期片段的3’末端的基团和样本片段顶链的5’末端的基团分别包含叠氮基和炔基中的一种。
3.根据权利要求2所述的测序接头,其特征在于,所述点击化学反应是铜催化的叠氮-炔基Husigen环加成反应。
4.根据权利要求1至3任意一项权利要求所述的测序接头,其特征在于,所述样本片段底链与所述日期片段互补的碱基个数是6~10个。
5.根据权利要求1至3任意一项权利要求所述的测序接头,其特征在于,所述日期片段的条形码序列采用四进制编码的方式对日期进行编码,用0、1、2、3分别与核酸的四种碱基一一对应,构建包含六个碱基序列的日期标签系统,其中以一位四进制数值表示年份,以二位四进制数值表示月份,以三位四进制数值表示日。
6.根据权利要求1至3任意一项权利要求所述的测序接头,其特征在于,所述日期片段、所述样本片段顶链和所述样本片段底链,分别如SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3所示。
7.一种基于点击化学的双条形码测序文库的构建方法,其特征在于,包括将权利要求1至6任意一项权利要求所述的测序接头与待测序核酸片段连接的步骤。
8.根据权利要求7所述的双条形码测序文库的构建方法,其特征在于,还包括PCR扩增步骤,所述PCR扩增步骤中采用一对正向引物和反向引物进行扩增,所述正向引物和反向引物的序列与所述日期片段和样本片段顶链中的所述正向引物和反向引物的序列相同。
9.根据权利要求7所述的双条形码测序文库的构建方法,其特征在于,还包括基于点击化学制备测序接头的步骤。
10.根据权利要求7至9任意一项权利要求所述的双条形码测序文库的构建方法,其特征在于,所述日期片段、样本片段顶链和样本片段底链,分别如SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3所示;所述正向引物和所述反向引物,分别如SEQ ID NO:4和SEQ ID NO:5所示。
11.一种基于点击化学的双条形码测序文库,其特征在于,所述文库通过如权利要求7至10任意一项权利要求所述的方法构建。
12.一种试剂盒,其特征在于,所述试剂盒包含权利要求1-6任一权利要求所述的测序接头。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710994066.0A CN109694864B (zh) | 2017-10-23 | 2017-10-23 | 基于点击化学的测序接头、双条形码测序文库及其构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710994066.0A CN109694864B (zh) | 2017-10-23 | 2017-10-23 | 基于点击化学的测序接头、双条形码测序文库及其构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109694864A CN109694864A (zh) | 2019-04-30 |
CN109694864B true CN109694864B (zh) | 2020-12-25 |
Family
ID=66225910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710994066.0A Active CN109694864B (zh) | 2017-10-23 | 2017-10-23 | 基于点击化学的测序接头、双条形码测序文库及其构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109694864B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113736778A (zh) * | 2021-09-14 | 2021-12-03 | 成都齐碳科技有限公司 | 测序接头、构建方法、纳米孔建库试剂盒及应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105917036A (zh) * | 2013-08-19 | 2016-08-31 | 雅培分子公司 | 下一代测序文库 |
CN105985945A (zh) * | 2015-01-30 | 2016-10-05 | 深圳华大基因研究院 | mRNA片段化方法及基于其构建测序文库的方法 |
AU2017210667A1 (en) * | 2014-02-26 | 2017-08-24 | Ventana Medical Systems, Inc. | Photo-selective method for biological sample analysis field |
-
2017
- 2017-10-23 CN CN201710994066.0A patent/CN109694864B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105917036A (zh) * | 2013-08-19 | 2016-08-31 | 雅培分子公司 | 下一代测序文库 |
AU2017210667A1 (en) * | 2014-02-26 | 2017-08-24 | Ventana Medical Systems, Inc. | Photo-selective method for biological sample analysis field |
CN105985945A (zh) * | 2015-01-30 | 2016-10-05 | 深圳华大基因研究院 | mRNA片段化方法及基于其构建测序文库的方法 |
Non-Patent Citations (2)
Title |
---|
Polymer Interfaces: Synthetic Strategies Enabling Functionality, Adaptivity, and Spatial Control;Barner-Kowollik等;《MACROMOLECULES》;20160726;第49卷(第14期);第5001-5016页 * |
点击化学及其在生物医学领域的应用;赵正达等;《化学进展》;20100331;第22卷(第2/3期);第417-426页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109694864A (zh) | 2019-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4106769A1 (en) | Methods of barcoding nucleic acid for detection and sequencing | |
CN110129415B (zh) | 一种ngs建库分子接头及其制备方法和用途 | |
EP3642358A1 (en) | Systems and methods for identification of nucleic acids in a sample | |
De Rop et al. | Hydrop enables droplet-based single-cell ATAC-seq and single-cell RNA-seq using dissolvable hydrogel beads | |
JP2019501641A (ja) | ナノポア技術を用いた短いdna断片の迅速な配列決定 | |
CN110656157B (zh) | 用于高通量测序样本溯源的质控品及其设计和使用方法 | |
CN105039322B (zh) | Dna标签序列及测序文库构建方法和试剂盒 | |
CN113168889B (zh) | 标签序列的检测方法 | |
CN107002120A (zh) | 测序方法 | |
KR20170133270A (ko) | 분자 바코딩을 이용한 초병렬 시퀀싱을 위한 라이브러리 제조방법 및 그의 용도 | |
CN110724731A (zh) | 一种在多重pcr体系内加入内参定量核酸拷贝数的方法 | |
CN108932401B (zh) | 一种测序样本的标识方法及其应用 | |
CN109694864B (zh) | 基于点击化学的测序接头、双条形码测序文库及其构建方法 | |
Faccioli et al. | From single genes to co-expression networks: extracting knowledge from barley functional genomics | |
EP4045676A1 (en) | Detection of sequences uniquely associated with a dna target region | |
US20220002797A1 (en) | Full-length rna sequencing | |
CN113795591A (zh) | 表征肿瘤并且识别肿瘤异质性的方法和系统 | |
CN111394800A (zh) | 一种评估无参物种酵母双杂交文库质量的方法 | |
JP2020527033A (ja) | 核酸識別子の夾雑を検出するためのアッセイ方法および組成物 | |
EP4073264B1 (en) | Method for whole genome sequencing of picogram quantities of dna | |
WO2019117704A1 (en) | Methods for detecting pathogenicity of ganoderma sp. | |
WO2019010776A1 (zh) | 组合标签、接头及确定含有低频突变核酸序列的方法 | |
CN113444769A (zh) | 一种dna标签序列的构建方法及其应用 | |
Fish et al. | Transcriptome Analysis at the Single‐Cell Level Using SMART Technology | |
WO2019010775A1 (zh) | 分子标签、接头及确定含有低频突变核酸序列的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191121 Address after: Building w2a, building B, building a, building 201203a5, high tech Industrial Village, No. 025, South 4th Road, high tech Zone, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province Applicant after: Shenzhen Huada Yinyuan Pharmaceutical Technology Co., Ltd Address before: 7, 7 floor, 518083 floor, Hua Da comprehensive garden, No. 21 Hong An street, Yantian District, Shenzhen, Guangdong, Applicant before: BGI SHENZHEN CO LTD |
|
GR01 | Patent grant | ||
GR01 | Patent grant |