CN108866051A - 扩增子测序文库及其构建方法 - Google Patents
扩增子测序文库及其构建方法 Download PDFInfo
- Publication number
- CN108866051A CN108866051A CN201810631026.4A CN201810631026A CN108866051A CN 108866051 A CN108866051 A CN 108866051A CN 201810631026 A CN201810631026 A CN 201810631026A CN 108866051 A CN108866051 A CN 108866051A
- Authority
- CN
- China
- Prior art keywords
- sequence
- sequencing
- measuring joints
- amplicon
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B80/00—Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- General Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
扩增子测序文库及其构建方法,本发明提出测序接头,所述测序接头包括依次相连的基底结合序列、测序引物序列、内识别序列以及扩增引物序列。利用本发明的测序接头构建扩增子测序文库,能够实现一步PCR扩增,并且扩增效率高,数据准确性强、利用率高、拆分均一度高,操作简便,适于规模化应用。
Description
技术领域
本发明涉及生物领域。具体地,本发明涉及扩增子测序文库及其构建方法。更具体地,本发明涉及测序接头、试剂盒、扩增子测序文库的构建方法、测序方法及扩增子测序文库。
背景技术
第二代测序技术,又称新一代测序技术,是相对于以Sanger测序法为代表的第一代测序技术而得名。Illumina作为二代高通量测序的主流技术,其文库构建原理是在未知的DNA 序列两侧加上固定序列的接头,通过不同oligo的结合对未知序列进行操作,最终完成测序。接头的结构决定了测序的质量和下机数据的格式。
在测序前构建文库的过程就是在测序目的序列两侧加上特定序列,大多数文库的构建方式是通过连接反应,但是在扩增子测序文库中使用的是PCR扩增,结构如图1所示(单Index),其中,P5和P7区域决定了文库和芯片基底上对应的接头连接,Rd1SP和Rd2SP 区域决定了测序时结合的测序引物。
然而,目前适用于扩增子测序文库的接头及构建方法仍有待改进。
发明内容
本发明旨在至少在一定程度上解决现有技术中存在的技术问题至少之一。
需要说明的是,本发明是基于发明人的下列发现而完成的:
Illumina公司公开了一种Nextera建库方法,即利用具有双端index的接头通过两轮PCR 构建扩增子文库。具体过程如下(流程参见图2):
第一步:通过自己合成的第一轮引物1和引物2将环境中感兴趣的基因片段通过PCR 富集出来。
第一轮 引物1
TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCTACGGGNGGCWGCAG(SEQ ID NO:44)
第一轮 引物2
GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGACTACHVGGGTATCTAATCC (SEQ ID NO:45)
第二步:再通过以下试剂盒将PCR产物两侧加成完整长度的最终序列(第二轮PCR)。
Nextera XT Index Kit(Illumina公司提供的一款试剂盒)
第二轮引物1:
5’AATGATACGGCGACCACCGAGATCTACAC[i5]TCGTCGGCAGCGTC(SEQ ID NO: 46)
第二轮引物2:
5’CAAGCAGAAGACGGCATACGAGAT[i7]GTCTCGTGGGCTCGG(SEQ ID NO:47)
TCGTCGGCAGCGTC为第一轮引物1和第二轮引物1的重叠部分
GTCTCGTGGGCTCGG为第一轮引物2与第二轮引物2的重叠部分。
经过两轮PCR最终得到了完成的文库序列结构如图3所示,其中NNNNN…是PCR 产物的待测序目的片段序列。
接头1:
AATGATACGGCGACCACCGAGATCTACAC[i5]TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCCTACGGGNGGCWGCAG(SEQ ID NO:48)
接头2:
CAAGCAGAAGACGGCATACGAGAT[i7]GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGACTACHVGGGTATCTAATCC(SEQ ID NO:49)
测序仪上机时在软件上选择Nextera建库选项,仪器会自动从标准的Illumina试剂盒中选择正确的引物,测序得到数据采用双端index读取模式。
[i7]=AAAAAAAA[i5]=BBBBBBBB
AAAAAAAA为外barcode 1,是通过Index primer1与接头2退火得到的reads 3,该位点在Illumina的流程中被称作为i7,BBBBBBBB为外barcode 2,是通过Index primer2与接头1退火得到的reads 4,该位点在Illumina的流程中被称作为i5,16个bp长度的AAAAAAAA BBBBBBBB序列决定了该对reads来源于哪个样本。
外barcode的设计方案最初是Illumina公司根据shotgun连接法文库特点来构建的,但是发明人发现使用该方法在扩增子文库构建时由于外barcode位置处于接头序列的中部,容易形成稳定的二级结构,一步法扩增容易失败,测序时稳定性不佳,碱基设计比较困难。早先的Kit采用6碱基序列,双端支持96个样本在一个lane中测序。目前有高通量版本可以支持384个样本的混样方案,但稳定性不足,样本的均一性较差。
有鉴于此,发明人删除接头中的外barcode序列,同时,在测序引物序列与扩增引物序列之间增加内barcode序列。由此,可避免测序接头中出现二级结构。另外,由于不处于测序仪测序前处理的操作区间,相比于外barcode序列,位于测序区间的内barcode序列的设计更加自由。进一步地,在测序接头中增加spacer序列(本发明亦称作“间隔序列”)和linker 序列(本发明亦称作“连接序列”)的功能区段。由此,利用本发明的测序接头构建扩增子测序文库,能够实现一步PCR扩增,并且扩增效率高,数据准确性强、利用率高、拆分均一度高,操作简便,适于规模化应用。
为此,在本发明的一个方面,本发明提出了一种测序接头。根据本发明的实施例,所述测序接头包括依次相连的基底结合序列、测序引物序列、内识别序列以及扩增引物序列。发明人删除接头中的外barcode序列,同时,在测序引物序列与扩增引物序列之间增加内识别序列(本发明亦称作“内barcode序列”)。由此,可避免测序接头中出现二级结构。另外,由于不处于测序仪测序前处理的操作区间,相比于外barcode序列,位于测序区间的内barcode序列的设计更加自由。由此,利用本发明的测序接头构建扩增子测序文库,能够实现一步PCR扩增,并且扩增效率高,数据准确性强、利用率高、拆分均一度高,操作简便,适于规模化应用。
根据本发明的实施例,上述测序接头还可以具有下列附加技术特征:
根据本发明的实施例,所述内识别序列具有SEQ ID NO:1~30任一所示的核苷酸序列。
根据本发明的实施例,所述内识别序列与扩增引物序列之间进一步包括间隔序列,根据本发明的具体实施例,所述间隔序列具有SEQ ID NO:31~37任一所示的核苷酸序列。
根据本发明的实施例,所述测序引物序列与内识别序列之间进一步包括连接序列,根据本发明的具体实施例,所述连接序列具有SEQ ID NO:38和39任一所示的核苷酸序列。
根据本发明的实施例,所述基底结合序列具有SEQ ID NO:40和41任一所示的核苷酸序列。
根据本发明的实施例,所述测序引物序列具有SEQ ID NO:42和43任一所示的核苷酸序列。
在本发明的另一方面,本发明提出了一种试剂盒。根据本发明的实施例,所述试剂盒含有前面所述测序接头。由此,利用本发明的试剂盒构建扩增子测序文库,能够实现一步PCR扩增,并且扩增效率高,数据准确性强、利用率高、拆分均一度高,操作简便,适于规模化应用。
在本发明的又一方面,本发明提出了一种扩增子测序文库的构建方法。根据本发明的实施例,所述方法包括:利用正向测序接头与反向测序接头对扩增子进行扩增,以便得到测序文库,所述正向测序接头是如前面所述测序接头所限定的,其中扩增引物序列为正向引物,所述反向测序接头是如前面所述测序接头所限定的,其中扩增引物序列为反向引物。由此,可以实现一步PCR扩增,扩增效率高,数据准确性强、利用率高、拆分均一度高,操作简便,适于规模化应用。
根据本发明的实施例,所述扩增是一步进行的。由此,操作简便,适于规模化应用。
根据本发明的实施例,基于30μL的扩增体系,所述扩增体系包括:15μLPolymerase Mix;1μL所述正向测序接头;1μL所述反向测序接头;10ng所述扩增子;以及余量的水。由此,以提高扩增效率。
在本发明的又一方面,本发明提出了一种测序方法。根据本发明的实施例,所述方法包括:根据前面所述扩增子测序文库的构建方法构建扩增子测序文库;以及对所述测序文库进行测序。由此,以提高测序结果的准确性,并且,该方法操作简便,适于规模化应用。
在本发明的又一方面,本发明提出了一种扩增子测序文库。根据本发明的实施例,所述方法是通过前面所述扩增子测序文库的构建方法得到的。由此,该扩增子测序文库的数据准确性强,利用率高。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1显示了根据本发明一个实施例的标准测序接头的结构示意图;
图2显示了根据本发明一个实施例的两步PCR构建扩增子测序文库的流程示意图;
图3显示了根据本发明一个实施例的两步PCR构建扩增子测序文库采用的测序接头结构示意图;
图4显示了根据本发明一个实施例的spacer序列平衡扩增子文库碱基的工作原理示意图;
图5显示了根据本发明一个实施例的一步PCR构建扩增子测序文库采用的测序接头的结构示意图;
图6显示了根据本发明一个实施例的一步PCR构建扩增子测序文库的流程示意图。
具体实施方式
下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
本发明提出了测序接头、试剂盒、扩增子测序文库的构建方法、测序方法及扩增子测序文库,下面将分别对其进行详细描述。
测序接头
在本发明的一个方面,本发明提出了一种测序接头。根据本发明的实施例,测序接头包括依次相连的基底结合序列、测序引物序列、内识别序列以及扩增引物序列。
由于Illumina仪器测序通量十分巨大,在实际生产的过程中通常需要混合多个项目或者样本的文库放入同一条lane进行测序,外barcode和内barcode序列的作用就是识别这些测序序列的归属。发明人删除了现有测序接头中的外barcode序列,同时,在测序引物序列与扩增引物序列之间增加内barcode序列。由此,可避免测序接头中出现二级结构。另外,由于不处于测序仪测序前处理的操作区间,相比于外barcode序列,位于测序区间的内barcode序列的设计更加自由。利用本发明的测序接头构建扩增子测序文库,能够实现一步PCR扩增,并且扩增效率高,数据准确性强、利用率高、拆分均一度高,操作简便,适于规模化应用。
目前Illumina公司生产的index试剂盒产品推荐类型为24*8约为96次,通过i5和i7 的外barcode组合实现不同样本的拆分。发明人对于内barcode的序列设计考虑了如下要素:
(1)内barcode序列会改变接头两端的自由能,测序反应时为单链,应该避免形成复杂的二级结构,影响接头与芯片的结合。
(2)受到测序仪性能的影响,要求同一条lane上机的index序列之间,每一个测序循环时都有足够的ATCG碱基均匀分布,否则会造成测序质量大大的降低,甚至出现无法读取的现象。因此内barcode序列需要是差异度较高的序列,设计时需要进行计算。
(3)要考虑不同组合时和芯片上序列结合的竞争效率,否则会产生不同项目间下机数据量的不均一,造成一些项目数据过饱和,一些项目却需要补测数据量。
由此,发明人通过5000个样本的实际上机效果信息,筛选了较优的内识别序列(表1)。
表1内识别序列
根据本发明的实施例,内识别序列与扩增引物序列之间进一步包括间隔序列(本发明亦称作“Spacer”序列)。通过在内barcode与扩增引物序列之间设计Spacer序列,利用不等长的index来使扩增子序列之间形成碱基差异,达到碱基平衡,避免Illumina测序仪器在单个测序循环出现相同碱基过多的情况。本发明的30种内barcode序列,双端组合可以达到900个样本的识别效率,如果再和spacer区间进行组合可以得到更高的识别度,完全能够满足目前测序仪下机数据量对样本数的要求。
需要说明的是,本发明所使用的术语“碱基平衡”是指测序reads的每个测序循环内, A/T/C/G所占比例接近25%,此时测序反应产量和质量最佳。扩增子文库由于扩增片段序列高度一致,单循环内A/T/C/G所占比例接近100%:0%,属于极不平衡的测序文库。对于扩增子文库,Illumina公司的解决方案是,混合大量PhiX文库一同上机的策略。PhiX文库中GC含量约为45%,是碱基比例平衡的样本。PhiX文库是以ΦX174噬菌体的DNA构建的测序文库,通常作为标准品用于估算测序错误率以及平衡碱基。
然而,本发明通过特殊的Spacer序列设计,使样本之间产生梯度的碱基变化,均衡单测序循环中不同碱基的出现频率,可以大大减少平衡文库PhiX的使用量,有效提高下机数据的利用率(参见图4)。
需要说明的是,本发明对于间隔序列的具体核苷酸序列不作严格限定,可以根据实际需要进行选择,例如基底结合序列、测序引物序列、内识别序列以及扩增引物序列。在一些实施例中,间隔序列具有表2中所示的核苷酸序列。
表2 spacer序列
序列号 | 序列 | 序列号 | 序列 |
SEQ ID NO:31 | T | SEQ ID NO:32 | GT |
SEQ ID NO:33 | CGT | SEQ ID NO:34 | ATGA |
SEQ ID NO:35 | TGCGA | SEQ ID NO:36 | GAGTGG |
SEQ ID NO:37 | CCTGTGG |
进一步地,在一些实施例中,为了提高内barcode序列与spacer序列组合的稳定性,发明人经过对5000个样本的实际上机效果信息,筛选出了较为稳定的内barcode序列和spacer序列组合(表3)。根据内barcode和spacer组合可区分不同项目不同样本下机数据的归属,这对于样本量较大的科技服务类业务至关重要。
表3内barcode序列与spacer序列
根据本发明的实施例,测序引物序列与内识别序列之间进一步包括连接序列(本发明亦称作“linker”序列)。为了降低不同样本内barcode序列变化对文库结构稳定性的影响,发明人设计了linker序列,以提高拆分均一度。进一步地,发明人根据测序接头序列最高碱基自由能原则设计linker序列,以避免连接序列的前后序列折叠形成二级发卡结构,从而提高接头与fellowcell芯片的杂交结合效率。
根据本发明的实施例,连接序列具有SEQ ID NO:38和39任一所示的核苷酸序列。
表4连接序列
序列号 | 序列 | 序列号 | 序列 |
SEQ ID NO:38 | GT | SEQ ID NO:39 | CC |
根据本发明的实施例,基底结合序列具有SEQ ID NO:40和41任一所示的核苷酸序列。由此,以便于测序接头结合在illumina公司产的fellowcell芯片基底上。其中,SEQ IDNO:40所示的核苷酸序列能够与芯片基底的寡核苷酸P5互补,SEQ ID NO:41所示的核苷酸序列能够与芯片基底的寡核苷酸P7互补。
表5基底结合序列
根据本发明的实施例,测序引物序列具有SEQ ID NO:42和43任一所示的核苷酸序列。由此,以便文库可以被Illumina公司Miseq、Hiseq、Miniseq等机型识别并完成测序。
表6测序引物序列
根据本发明的实施例,图5显示了一组测序接头。由于测序仪器需要设置(读取)识别区,所以以基底结合序列中的一部分序列作为识别区,也可以理解为是选择一段固定序列替代原外barcode(图中新的外barcode 1和新的外barcode 2),并在测序引物序列(RdSP 序列)与引物序列之间依次设计linker、内barcode和spacer序列。由此,利用该组测序接头能够实现一步PCR扩增,并且扩增效率高,数据准确性强、利用率高、拆分均一度高,操作简便,适于规模化应用。
试剂盒
在本发明的另一方面,本发明提出了一种试剂盒。根据本发明的实施例,该试剂盒含有前面所述测序接头。由此,利用本发明的试剂盒构建扩增子测序文库,能够实现一步PCR 扩增,并且扩增效率高,数据准确性强、利用率高、拆分均一度高,操作简便,适于规模化应用。
需要说明的是,前面针对测序接头所描述的特征和优点,同样适用于该试剂盒,在此不再赘述。
扩增子测序文库的构建方法
在本发明的又一方面,本发明提出了一种扩增子测序文库的构建方法。根据本发明的实施例,该方法包括:利用正向测序接头与反向测序接头对扩增子进行扩增,以便得到测序文库,正向测序接头是如前面所述测序接头所限定的,其中扩增引物序列为正向引物,所述反向测序接头是如前面所述测序接头所限定的,其中扩增引物序列为反向引物。由此,可以实现一步PCR扩增,扩增效率高,数据准确性强、利用率高、拆分均一度高,操作简便,适于规模化应用。
根据本发明的实施例,扩增是一步进行的。现有的扩增子测序文库的构建方法,大多采用两轮PCR的方式,并且依赖于Illumina公司设计的进口index试剂盒,致使成本大大增加。另外,建库流程比较繁琐,需要目的片段的扩增、割胶回收目的片段、连接接头序列、文库富集等多个步骤。本发明通过采用特殊的测序接头,尤其是内barcode、linker、spacer序列的设计,扩增效率高,数据准确性强、利用率高、拆分均一度高。同时,简化了生产流程,操作简便,采用人工合成的替代引物,有效降低生产成本,适于规模化应用。具体地,图6显示了一步PCR构建扩增子测序文库,其中接头P5/P7是指能够与芯片上P5/P7 相结合的基底结合序列,接头P5与linker1之间存在测序引物序列1(图中并未给出),接头P7与linker2之间存在测序引物序列2(图中并未给出)。
根据本发明的实施例,基于30μL的扩增体系,所述扩增体系包括:15μLPolymerase Mix;1μL所述正向测序接头;1μL所述反向测序接头;10ng所述扩增子;以及余量的水。发明人经过大量实验得到上述较优扩增体系,由此,能够有效地提高扩增效率,数据准确性强、利用率高、拆分均一度高。
需要说明的是,前面针对测序接头所描述的特征和优点,同样适用于该扩增子测序文库的构建方法,在此不再赘述。
测序方法
在本发明的又一方面,本发明提出了一种测序方法。根据本发明的实施例,该方法包括:根据前面所述扩增子测序文库的构建方法构建扩增子测序文库;以及对所述测序文库进行测序。由此,以提高测序结果的准确性,并且,该方法操作简便,成本低,适于规模化应用。
需要说明的是,前面针对扩增子测序文库的构建方法所描述的特征和优点,同样适用于该测序方法,在此不再赘述。
扩增子测序文库
在本发明的又一方面,本发明提出了一种扩增子测序文库。根据本发明的实施例,所述方法是通过前面所述扩增子测序文库的构建方法得到的。由此,该扩增子测序文库的数据准确性强、利用率高、拆分均一度高。
需要说明的是,前面针对扩增子测序文库的构建方法所描述的特征和优点,同样适用于该扩增子测序文库,在此不再赘述。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1
1、准备接头序列(表7和图5)目标片段。
表7接头序列
2、PCR扩增
扩增体系:
表8扩增体系
物质 | Amount |
Polymerase Mix | 15μl |
正向接头(10uM) | 1μl |
反向接头(10uM) | 1μl |
DNA | 10ng |
NF水 | 补充至30μl |
总量 | 30μl |
注:Polymerase Mix的主要成分KAPA HiFi Hotstart ReadyMix Kit、MaxSuper-Fidelity DNA Polymerase和KOD–Plus-Neo。
PCR反应条件:
表9 PCR反应条件
3、结果
发明人比较了本实施例的建库方法和Illimina公司Nextera index试剂盒推荐方法,结果如表10所示。可以看出,本发明在不降低数据下机质量的情况下,提高了数据得率、有效拆分率,减少了样本不合格率。并且,本发明构建的文库通用于Illumina公司生产的所有支持TruSeq文库的机型(包括Minisq、Miseq、Hiseq等)。由于内barcode组合丰富且搭配自由,所构建的文库不容易和其他客户的文库类型冲突,适用于NGS技术在上游生产商中完成包lane、凑lane等,应用性强。
表10本发明的建库方法和Nextera index试剂盒建库推荐方法比较
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
SEQUENCE LISTING
<110> 上海锐翌生物科技有限公司
<120> 扩增子测序文库及其构建方法
<130> PIDC4180029
<160> 49
<170> PatentIn version 3.5
<210> 1
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 1
<400> 1
atcacg 6
<210> 2
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 2
<400> 2
cgatgt 6
<210> 3
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 3
<400> 3
ttaggc 6
<210> 4
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 4
<400> 4
tgacca 6
<210> 5
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 5
<400> 5
acagtg 6
<210> 6
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 6
<400> 6
gccaat 6
<210> 7
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 7
<400> 7
cagatc 6
<210> 8
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 8
<400> 8
acttga 6
<210> 9
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 9
<400> 9
gatcag 6
<210> 10
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 10
<400> 10
tagctt 6
<210> 11
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 11
<400> 11
ggctac 6
<210> 12
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 12
<400> 12
cttgta 6
<210> 13
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 13
<400> 13
agtcaa 6
<210> 14
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 14
<400> 14
agttcc 6
<210> 15
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 15
<400> 15
atgtca 6
<210> 16
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 16
<400> 16
ccgtcc 6
<210> 17
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 17
<400> 17
gtagag 6
<210> 18
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 18
<400> 18
gtccgc 6
<210> 19
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 19
<400> 19
gtgaaa 6
<210> 20
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 20
<400> 20
gtggcc 6
<210> 21
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 21
<400> 21
gtttcg 6
<210> 22
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 22
<400> 22
cgtacg 6
<210> 23
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 23
<400> 23
gagtgg 6
<210> 24
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 24
<400> 24
ggtagc 6
<210> 25
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 25
<400> 25
actgat 6
<210> 26
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 26
<400> 26
atgagc 6
<210> 27
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 27
<400> 27
attcct 6
<210> 28
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 28
<400> 28
caaaag 6
<210> 29
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 29
<400> 29
caacta 6
<210> 30
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 30
<400> 30
caccgg 6
<210> 31
<211> 1
<212> DNA
<213> Artificial Sequence
<220>
<223> 31
<400> 31
t 1
<210> 32
<211> 2
<212> DNA
<213> Artificial Sequence
<220>
<223> 32
<400> 32
gt 2
<210> 33
<211> 3
<212> DNA
<213> Artificial Sequence
<220>
<223> 33
<400> 33
cgt 3
<210> 34
<211> 4
<212> DNA
<213> Artificial Sequence
<220>
<223> 34
<400> 34
atga 4
<210> 35
<211> 5
<212> DNA
<213> Artificial Sequence
<220>
<223> 35
<400> 35
tgcga 5
<210> 36
<211> 6
<212> DNA
<213> Artificial Sequence
<220>
<223> 36
<400> 36
gagtgg 6
<210> 37
<211> 7
<212> DNA
<213> Artificial Sequence
<220>
<223> 37
<400> 37
cctgtgg 7
<210> 38
<211> 2
<212> DNA
<213> Artificial Sequence
<220>
<223> 38
<400> 38
gt 2
<210> 39
<211> 2
<212> DNA
<213> Artificial Sequence
<220>
<223> 39
<400> 39
cc 2
<210> 40
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> 40
<400> 40
aatgatacgg cgaccaccga gatctacac 29
<210> 41
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> 41
<400> 41
caagcagaag acggcatacg agat 24
<210> 42
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<223> 42
<400> 42
tctttcccta cacgacgctc ttccgatct 29
<210> 43
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> 43
<400> 43
gtgactggag ttcagacgtg tgctcttccg atct 34
<210> 44
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> 44
<400> 44
tcgtcggcag cgtcagatgt gtataagaga cagcctacgg gnggcwgcag 50
<210> 45
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> 45
<400> 45
gtctcgtggg ctcggagatg tgtataagag acaggactac hvgggtatct aatcc 55
<210> 46
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> 46
<220>
<221> misc_feature
<222> (29)..(30)
<223> 29位和30位之间存在i5序列
<400> 46
aatgatacgg cgaccaccga gatctacact cgtcggcagc gtc 43
<210> 47
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> 47
<220>
<221> misc_feature
<222> (24)..(25)
<223> 24位和25位之间存在i7序列
<400> 47
caagcagaag acggcatacg agatgtctcg tgggctcgg 39
<210> 48
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> 48
<220>
<221> misc_feature
<222> (29)..(30)
<223> 29位和30位之间存在i5序列
<400> 48
aatgatacgg cgaccaccga gatctacact cgtcggcagc gtcagatgtg tataagagac 60
agcctacggg nggcwgcag 79
<210> 49
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<223> 49
<220>
<221> misc_feature
<222> (24)..(25)
<223> 24位和25位之间存在i7序列
<400> 49
caagcagaag acggcatacg agatgtctcg tgggctcgga gatgtgtata agagacagga 60
ctachvgggt atctaatcc 79
Claims (10)
1.一种测序接头,其特征在于,包括依次相连的基底结合序列、测序引物序列、内识别序列以及扩增引物序列。
2.根据权利要求1所述的测序接头,其特征在于,所述内识别序列具有SEQ ID NO:1~30任一所示的核苷酸序列。
3.根据权利要求1所述的测序接头,其特征在于,所述内识别序列与扩增引物序列之间进一步包括间隔序列,
任选地,所述间隔序列具有SEQ ID NO:31~37任一所示的核苷酸序列。
4.根据权利要求1所述的测序接头,其特征在于,所述测序引物序列与内识别序列之间进一步包括连接序列,
任选地,所述连接序列具有SEQ ID NO:38和39任一所示的核苷酸序列。
5.根据权利要求1所述的测序接头,其特征在于,所述基底结合序列具有SEQ ID NO:40和41任一所示的核苷酸序列;
所述测序引物序列具有SEQ ID NO:42和43任一所示的核苷酸序列。
6.一种试剂盒,其特征在于,含有权利要求1~5任一项所述测序接头。
7.一种扩增子测序文库的构建方法,其特征在于,包括:
利用正向测序接头与反向测序接头对扩增子进行扩增,以便得到测序文库,
所述正向测序接头是如权利要求1~5任一项所述测序接头所限定的,其中扩增引物序列为正向引物,
所述反向测序接头是如权利要求1~5任一项所述测序接头所限定的,其中扩增引物序列为反向引物。
8.根据权利要求7所述的方法,其特征在于,所述扩增是一步进行的,
任选地,基于30μL的扩增体系,所述扩增体系包括:
15μL Polymerase Mix;
1μL所述正向测序接头;
1μL所述反向测序接头;
10ng所述扩增子;以及
余量的水。
9.一种测序方法,其特征在于,包括:
根据权利要求7或8所述扩增子测序文库的构建方法构建扩增子测序文库;以及
对所述测序文库进行测序。
10.一种扩增子测序文库,其特征在于,是通过权利要求7或8所述扩增子测序文库的构建方法得到的。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810631026.4A CN108866051A (zh) | 2018-06-19 | 2018-06-19 | 扩增子测序文库及其构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810631026.4A CN108866051A (zh) | 2018-06-19 | 2018-06-19 | 扩增子测序文库及其构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108866051A true CN108866051A (zh) | 2018-11-23 |
Family
ID=64339533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810631026.4A Pending CN108866051A (zh) | 2018-06-19 | 2018-06-19 | 扩增子测序文库及其构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108866051A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110628889A (zh) * | 2019-08-12 | 2019-12-31 | 远辰生物科技(苏州)有限公司 | Illumina二代测序平台文库构建引入分子标签的方法、接头序列及应用 |
CN111767256A (zh) * | 2020-05-22 | 2020-10-13 | 北京和瑞精准医学检验实验室有限公司 | 一种从fastq文件分离出样本read数据的方法 |
CN113025761A (zh) * | 2021-05-27 | 2021-06-25 | 广州赛哲生物科技股份有限公司 | 病原微生物鉴定的多重扩增配合高通量测序方法及试剂盒 |
CN113881781A (zh) * | 2021-10-14 | 2022-01-04 | 中国科学院水生生物研究所 | 用于雅鲁藏布江中上游鱼类环境dna监测的引物及其应用 |
US20220267850A1 (en) * | 2018-06-28 | 2022-08-25 | Md Healthcare Inc. | Inflammatory bowel disease diagnostic method by means of bacterial metagenomic analysis |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104293783A (zh) * | 2014-09-30 | 2015-01-21 | 天津诺禾致源生物信息科技有限公司 | 适用于扩增子测序文库构建的引物、构建方法、扩增子文库及包含其的试剂盒 |
CN106554958A (zh) * | 2016-11-29 | 2017-04-05 | 南京大学宜兴环保研究院 | 一种污水处理系统中水/泥样品dna扩增子测序文库快速构建的引物及快速构建方法 |
CN107937582A (zh) * | 2017-12-29 | 2018-04-20 | 苏州普瑞森基因科技有限公司 | 一种用于分析肠道微生物的引物组及其应用 |
-
2018
- 2018-06-19 CN CN201810631026.4A patent/CN108866051A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104293783A (zh) * | 2014-09-30 | 2015-01-21 | 天津诺禾致源生物信息科技有限公司 | 适用于扩增子测序文库构建的引物、构建方法、扩增子文库及包含其的试剂盒 |
CN106554958A (zh) * | 2016-11-29 | 2017-04-05 | 南京大学宜兴环保研究院 | 一种污水处理系统中水/泥样品dna扩增子测序文库快速构建的引物及快速构建方法 |
CN107937582A (zh) * | 2017-12-29 | 2018-04-20 | 苏州普瑞森基因科技有限公司 | 一种用于分析肠道微生物的引物组及其应用 |
Non-Patent Citations (4)
Title |
---|
BRIAN WANG.: "16 S rRNA indexed primers amplify phylogenic markers for microbiome sequencing analysis", 《IDTDNA》 * |
DOUGLAS W FADROSH ET AL.: "An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform", 《MICROBIOME》 * |
FIONA FOUHY ET AL.: "16S rRNA gene sequencing of mock microbial populations- impact of DNA extraction method, primer choice and sequencing platform", 《BMC MICROBIOLOGY》 * |
WIEBKE SICKEL ET AL.: "Increased efficiency in identifying mixed pollen samples by meta-barcoding with a dual-indexing approach", 《BMC ECOL》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220267850A1 (en) * | 2018-06-28 | 2022-08-25 | Md Healthcare Inc. | Inflammatory bowel disease diagnostic method by means of bacterial metagenomic analysis |
US12084721B2 (en) * | 2018-06-28 | 2024-09-10 | Md Healthcare Inc. | Inflammatory bowel disease diagnostic method by means of bacterial metagenomic analysis |
CN110628889A (zh) * | 2019-08-12 | 2019-12-31 | 远辰生物科技(苏州)有限公司 | Illumina二代测序平台文库构建引入分子标签的方法、接头序列及应用 |
CN111767256A (zh) * | 2020-05-22 | 2020-10-13 | 北京和瑞精准医学检验实验室有限公司 | 一种从fastq文件分离出样本read数据的方法 |
CN111767256B (zh) * | 2020-05-22 | 2023-10-20 | 北京和瑞精湛医学检验实验室有限公司 | 一种从fastq文件分离出样本read数据的方法 |
CN113025761A (zh) * | 2021-05-27 | 2021-06-25 | 广州赛哲生物科技股份有限公司 | 病原微生物鉴定的多重扩增配合高通量测序方法及试剂盒 |
CN113881781A (zh) * | 2021-10-14 | 2022-01-04 | 中国科学院水生生物研究所 | 用于雅鲁藏布江中上游鱼类环境dna监测的引物及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108866051A (zh) | 扩增子测序文库及其构建方法 | |
Hashimshony et al. | CEL-Seq2: sensitive highly-multiplexed single-cell RNA-Seq | |
JP6110297B2 (ja) | 高処理スクリーニング用の組合せ配列バーコード | |
JP5801349B2 (ja) | 制限断片のクローン源を識別するための方法 | |
CN106574286A (zh) | 选择性扩增核酸序列 | |
CN107236729A (zh) | 一种基于探针捕获富集的快速构建靶核酸测序文库的方法和试剂盒 | |
CN113005121A (zh) | 接头元件、试剂盒及其相关应用 | |
CN106283201B (zh) | 基于高通量测序的tcr多样性检测和文库构建 | |
JP2020536525A (ja) | プローブ及びこれをハイスループットシーケンシングに適用するターゲット領域の濃縮方法 | |
WO2018136526A1 (en) | Balanced capture probes and methods of use thereof | |
CN108203847A (zh) | 用于二代测序质量评估的文库、试剂及应用 | |
CN111748551A (zh) | 封闭序列、捕获试剂盒、文库杂交捕获方法及建库方法 | |
CN108138175A (zh) | 用于分子条形码编码的试剂、试剂盒和方法 | |
CN109706219A (zh) | 构建测序文库的方法、试剂盒、上机方法及测序数据的拆分方法 | |
CN111910258A (zh) | 双端文库标签组合物及其在mgi测序平台中的应用 | |
CN106939344A (zh) | 用于二代测序的接头 | |
CN110157785A (zh) | 一种单细胞rna测序文库构建方法 | |
Bashtrykov et al. | DNA methylation analysis by bisulfite conversion coupled to double multiplexed amplicon-based next-generation sequencing (NGS) | |
CN113999893B (zh) | 兼容双测序平台的建库元件、试剂盒及建库方法 | |
JP7281565B2 (ja) | ネストされたマルチプレックスpcrハイスループットシーケンシングライブラリー調製方法及びキット | |
CN103571822A (zh) | 一种用于新一代测序分析的多重目的dna片段富集方法 | |
CN116218954A (zh) | 乳腺癌相关基因高通量扩增子文库的制备方法、多重pcr引物对及应用 | |
CN106834428A (zh) | 高通量多位点人类短片段串联重复序列检测试剂盒及其制备和应用 | |
WO2016119448A2 (zh) | 不同种属微生物间种类和丰度比较的人工外源性参照分子 | |
EP3918091A1 (en) | Method of sequencing nucleic acid with unnatural base pairs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 202-3 and 302, Building No. 138, Xinjunhuan Road, Minhang District, Shanghai, 20114 Applicant after: SHANGHAI REALBIO TECHNOLOGY Co.,Ltd. Address before: Room 302, Building 6, 138 Xinjunhuan Road, Minhang District, Shanghai 200050 Applicant before: SHANGHAI REALBIO TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181123 |
|
RJ01 | Rejection of invention patent application after publication |