CN111005075A - 用于双样本共建测序文库的y型接头和双样本共建测序文库的方法 - Google Patents
用于双样本共建测序文库的y型接头和双样本共建测序文库的方法 Download PDFInfo
- Publication number
- CN111005075A CN111005075A CN201911329765.9A CN201911329765A CN111005075A CN 111005075 A CN111005075 A CN 111005075A CN 201911329765 A CN201911329765 A CN 201911329765A CN 111005075 A CN111005075 A CN 111005075A
- Authority
- CN
- China
- Prior art keywords
- sequence
- sequencing library
- sample
- library
- sequencing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B80/00—Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/06—Biochemical methods, e.g. using enzymes or whole viable microorganisms
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biochemistry (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Microbiology (AREA)
- Wood Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于双样本共建测序文库的Y型接头和双样本共建测序文库的方法。其中,第一Y型接头包括:第一序列包括依次连接的P5、i5、SP1和N1序列;第二序列包括依次连接的L1和N1c序列;第二Y型接头包括:第三序列包括依次连接的P7、i7、SP2和N2序列;第四序列包括依次连接的L2和N2c序列;L1、L2、N1、N1c、N2和N2c均与illumina接头序列及人基因组序列不同且不互补;N1与N1c互补,N2与N2c互补,且N1与N2和N2c不同且不互补;L1的3’端和L2的5’端序具有互补区域。应用本发明的技术方案,可以使两个单独建库的样本连接到一起形成一个文库并正常测序。
Description
技术领域
本发明涉及生物医学技术领域,具体而言,涉及一种用于双样本共建测序文库的Y型接 头和双样本共建测序文库的方法。
背景技术
作为基因检测临床转化最为成熟的项目,无创产前检测的方法多种多样:如NGS(Next Generation Sequencing)法、多重PCR法、探针法、数字PCR法和芯片法等等,其中多重PCR 法、探针法、数字PCR法和芯片法等方法具有成本低、周期短、灵敏度高等优点,尤其是多 重PCR法、芯片法和数字PCR法近年来在检测通量上有了很大提高,但仍无法达到NGS法 检测的通量。目前关于这些方法的研究文章较多,也有一些专利文献,但尚未大规模应用。 实际临床应用中,普遍采用的还是NGS法。
其中,NGS法检测主要包含两个部分:文库构建和高通量测序。
文库构建包括:对无创产前检测样本的游离DNA(cfDNA)进行末端修复得到末端被修 复的cfDNA,再通过加A反应在双链DNA的3’端添加一个碱基A用于后续连接反应;接着对修复加A后的cfDNA进行接头的连接,这一过程是为了将测序平台对应的接头添加到cfDNA片段的两端便于后续测序;最后,再对连接产物进行扩增富集来达到检测量的需求。目前,对该常规建库流程的改进方法较多,主要集中于对单个样本建库方式(如接头方案、环化扩增等)的改进,目的是为了提高建库效率。
高通量测序方面,无创产前样本目前主要采取的是SE35、SE50或SE75策略,即单端35bp、 50bp或75bp读长测序,数据量一般为5M Reads,平均测序深度约为0.1×。然而,从测序成 本方面考虑,单端测序的成本一般高于双端测序,且样本通量不高。以NextSeq 500为例,单 次检测样本数量最高只有96个,在样本检测需求量大的应用场景中局限性较大。如果无创产 前检测在较高通量的测序平台上(如illumina HiSeq X-ten或NovaSeq 6000)使用双端测序(PE 测序),检测样本数量可以提高,单位数据量的成本也可以得到一定的降低,但同时由于分析 只需要单端测序数据,造成了另一端数据的浪费。
发明内容
本发明旨在提供一种用于双样本共建测序文库的Y型接头和双样本共建测序文库的方 法,以提高测序数据的利用率。
为了实现上述目的,根据本发明的一个方面,提供了一种用于双样本共建测序文库的Y 型接头。该Y型接头包括:第一Y型接头和第二Y型接头,其中,第一Y型接头包括:第一序列,包括依次连接的P5、i5、SP1和N1序列,其中,依次连接的P5、i5和SP1即为illumina Y型接头中包含P5的单链核苷酸序列;第二序列,包括依次连接的L1和N1c序列;第二Y 型接头包括:第三序列,包括依次连接的P7、i7、SP2和N2序列,其中,依次连接的P7、i7 和SP2即为illumina Y型接头中包含P7的单链核苷酸序列;第四序列,包括依次连接的L2 和N2c序列;其中,L1、L2、N1、N1c、N2和N2c均与illumina接头序列及人基因组序列不 同且不互补;N1与N1c互补,N2与N2c互补,且N1与N2和N2c不同且不互补;L1的3’ 端和L2的5’端序具有互补区域。
进一步地,L1的3’端和L2的5’端序具有15~25bp的互补区域。
进一步地,N1、N1c、N2和N2c的长度为10~20bp。
进一步地,L1的3’端和L2的5’端序具有20bp的互补区域。
进一步地,第一序列和第四序列的3’末端添加碱基T和硫代修饰,第二序列和第三序列 的5’末端做磷酸化修饰。
进一步地,第一序列具有如SEQ ID NO:1所示的核苷酸序列,第二序列具有如SEQID NO:2所示的核苷酸序列,第三序列具有如SEQ ID NO:3所示的核苷酸序列,以及第四序列具有如SEQ ID NO:4所示的核苷酸序列。
根据本发明的另一个方面,提供一种双样本共建测序文库的方法。该方法包括以下步骤: 分别采用不同的接头对两个待测样本进行单样本建库,得到第一测序文库和第二测序文库, 其中,用于第一测序文库和第二测序文库构建的接头中具有能够通过PCR扩增将第一测序文 库和第二测序文库连接在一起的序列;将第一测序文库和第二测序文库混合,通过PCR扩增 将第一测序文库和第二测序文库连接在一起得到双样本测序文库。
进一步地,用于第一测序文库和第二测序文库构建的接头中具有互补序列,通过重叠延 伸PCR法将第一测序文库和第二测序文库连接在一起。
进一步地,采用上述任一种用于双样本共建测序文库的Y型接头进行双样本共建测序文 库。
进一步地,方法包括:S1,分别采用第一Y型接头和第二Y型接头对两个待测样本进行 单样本建库,得到第一测序文库和第二测序文库;S2,将第一测序文库和第二测序文库混合, 通过重叠延伸PCR法将第一测序文库和第二测序文库连接在一起得到双样本测序文库。
进一步地,S1包括:接头连接步骤,对其中一个待测样本连接第一Y型接头,对另一个 待测样本连接第二Y型接头;以及扩增步骤,采用具有P5和L1序列的引物对对连接有第一 Y型接头的待测样本进行扩增,得到第一测序文库,采用具有P7和L2序列的引物对对连接 有第二Y型接头的待测样本进行扩增,得到第二测序文库。
进一步地,具有P5序列的引物具有如SEQ ID NO:5所示的核苷酸序列,具有L1序列的引物具有如SEQ ID NO:6所示的核苷酸序列,具有P7序列的引物具有如SEQ ID NO:7 所示的核苷酸序列,具有L2序列的引物具有如SEQ ID NO:8所示的核苷酸序列。
应用本发明的技术方案,可以构建一种双样本测序文库,使两个单独建库的样本连接到 一起形成一个文库并正常测序,这样基于双端测序策略(如PE50、PE75、PE100等)的原理, 合理利用双端测序数据,在相对较低的测序成本下,能够有效提高样本检测通量、进一步降 低单个样本双端测序的成本,可应用于更为广泛的测序场景中。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实 施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1中的A示出了illuminaY型接头,图1中的B和C示出了根据本发明一典型实施方式的用于双样本共建测序文库的Y型接头结构示意图;
图2A和图2B示出了根据本发明一典型实施方式的采用本发明的用于双样本共建测序文 库的Y型接头进行双样本分别构建测序文库的流程示意图;
图3示出了根据本发明一典型实施方式的采用本发明的用于双样本共建测序文库的Y型 接头进行双样本共建测序文库的流程示意图;
图4A和图4B示出了在本发明另一典型实施方式的用于双样本单建测序文库的接头结构 示意图及建库流程示意图;
图5示出了实施例1中Y5接头单建库片段大小分布结果示意图;
图6示出了实施例1中Y7接头单建库片段大小分布结果示意图;以及
图7示出了实施例1中Y5和Y7接头共建库片段大小分布结果示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。 下面将参考附图并结合实施例来详细说明本发明。
正如本发明背景技术中记载的,现有NIPT建库和测序技术存在成本较高且浪费测序数据 和未能有效利用双端测序的数据的技术问题。为了解决这些技术问题,本发明提出了下列技术 方案。
根据本发明一种典型的实施方式,提供一种双样本共建测序文库的方法。该方法包括以 下步骤:分别采用不同的接头对两个待测样本进行单样本建库,得到第一测序文库和第二测 序文库,其中,用于第一测序文库和第二测序文库构建的接头中具有能够通过PCR扩增将第 一测序文库和第二测序文库连接在一起的序列;将第一测序文库和第二测序文库混合,通过 PCR扩增将第一测序文库和第二测序文库连接在一起得到双样本测序文库。
应用本发明的技术方案,可以构建一种双样本测序文库,使两个单独建库的样本连接到 一起形成一个文库并正常测序,这样基于双端测序策略(如PE50、PE75、PE100等)的原理, 合理利用双端测序数据,在相对较低的测序成本下,能够有效提高样本检测通量、进一步降 低单个样本双端测序的成本,可应用于更为广泛的测序场景中。
将两个样本的文库连接到一起,使之可以在illumina二代测序平台正常测序和分析,而将 两个片段连接到一起的方案有很多种,比如直接连接法、PCR连接法和重组置换连接法等。 优选的,用于第一测序文库和第二测序文库构建的接头中具有互补序列,通过重叠延伸PCR 法将第一测序文库和第二测序文库连接在一起。通过重叠延伸PCR的方法来连接两个样本的 文库,该方法具有操作简便、成本低等优点。
典型的,本发明可以通过设计一种新的Y型接头序列,作为桥梁来连接两个样本的测序 文库,该接头需不影响文库的产量,不影响illumina二代测序平台的测序过程,不影响测序结 果的分析过程。优选的,如图1所示(图1中第一个接头(A示出的接头)为illuminaY型接 头,第二、三个接头(B和C示出的接头)则分别为本发明的第一Y型接头和第二Y型接头), 根据本发明一种典型的实施方式,提供一种用于双样本共建测序文库的Y型接头。该Y型接 头包括第一Y型接头和第二Y型接头,其中,第一Y型接头包括第一序列和第二序列,第一 序列包括依次连接的P5、i5、SP1和N1序列,其中,依次连接的P5、i5和SP1即为illumina Y型接头中包含P5的单链核苷酸序列;第二序列包括依次连接的L1和N1c序列;第二Y型 接头包括第三序列和第四序列,第三序列包括依次连接的P7、i7、SP2和N2序列,其中,依 次连接的P7、i7和SP2即为illumina Y型接头中包含P7的单链核苷酸序列;第四序列包括依 次连接的L2和N2c序列;其中,L1、L2、N1、N1c、N2和N2c均与illumina接头序列及人基因组序列不同且不互补;N1与N1c互补,N2与N2c互补,且N1与N2和N2c不同且不互 补;L1的3’端和L2的5’端序具有互补区域。
上述方案的目的是将两个无创产前检测样本分别建库,使之分别带有P5和P7端的barcode,再连接到一起进行双端测序。这种使用双端barcode建库并结合上述双样本共建库的 方法,可以有效利用双端测序的特点,使第一测序文库和第二测序文库的数据都能被用于无 创产前检测的分析,增加一倍的可用数据;另外,使用双端barcode建库并结合上述双样本共 建库的方法,可以将双端barcode分别标记两个样本,达到增加样本检测数量和节省barcode 的目的。
在上述技术方案中,为了实现P5端和P7端分别连接到不同样本的需求,本发明设计了 两条新的序列:第二序列和第四序列。分别与第一序列(P5端接头序列)和第三序列(P7端 接头序列)退火,形成“P5&L1”和“P7&L2”两种新的Y型接头,为了后续描述方便, 我们将退火后形成的新的Y型接头简称为Y5和Y7接头(具体结构示意图见图1中B和C), 采用该接头分别建库和共建库原理见图2A、图2B和图3。
L1、L2、N1、N1c、N2和N2c均与illumina接头序列及人基因组序列不同且不互补,防止了共建库时造成非特异连接及对测序结果造成影响;L1的3’端和L2的5’端序列有15~25bp (优选20bp)的互补区域,用于两个样本文库的连接;N1和N2序列长度为10~20bp,N1与N1c互补,N2与N2c互补,且N1与N2和N2c不同且不互补,防止共建库时造成非特异 连接。
第一序列和第四序列的3’末端添加碱基T和硫代修饰,用来与加A后的DNA片段配对 连接,第二序列和第三序列的5’末端做磷酸化修饰,用来提高连接效率。
根据本发明一种典型的实施方式,优选地,第一序列具有如SEQ ID NO:1 (5’-aatgatacggcgaccaccgagatctacacccttgtagacactctttccctacacgacgctcttccgatctcataaatcaac*t-3’)所示 的核苷酸序列,第二序列具有如SEQ ID NO:2(5’Phos -gttgatttatgagatgcaggccaagcggtcttagtctgacagc-3’)所示的核苷酸序列,第三序列具有如SEQ ID NO:3(5’Phos-caagcagaagacggcatacgagatccttggaagtgactggagttcagacgtgtgctcttccgatctccttggctcac -3’)所示的核苷酸序列,以及第四序列具有如SEQ ID NO:4(5’ -gtgagccaaggagctgtcagactaagaccgcttggcctgcatc*t-3’)所示的核苷酸序列。
根据本发明一种典型的实施方式,提供一种双样本共建测序文库的方法。该方法包括以 下步骤:分别采用不同的接头对两个待测样本进行单样本建库,得到第一测序文库和第二测 序文库,其中,用于第一测序文库和第二测序文库构建的接头中具有能够通过PCR扩增将第 一测序文库和第二测序文库连接在一起的序列;将第一测序文库和第二测序文库混合,通过 PCR扩增将第一测序文库和第二测序文库连接在一起得到双样本测序文库。
在本发明一实施例中,具体的,S1包括:接头连接步骤,对其中一个待测样本连接第一 Y型接头,对另一个待测样本连接第二Y型接头;以及扩增步骤,采用具有P5和L1序列的 引物对对连接有第一Y型接头的待测样本进行扩增,得到第一测序文库,采用具有P7和L2 序列的引物对对连接有第二Y型接头的待测样本进行扩增,得到第二测序文库。
优选地,具有P5序列的引物具有如SEQ ID NO:5(5’-aatgatacggcgaccacc-3’)所示的 核苷酸序列,具有L1序列的引物具有如SEQ ID NO:6(5’-caagcagaagacggcata-3’)所示的 核苷酸序列,具有P7序列的引物具有如SEQ ID NO:7(5’-gctgtcagactaagaccg-3’)所示的 核苷酸序列,具有L2序列的引物具有如SEQ ID NO:8(5-gtgagccaaggagctgtc-3’)所示的核 苷酸序列。
应用本发明的技术方案,可以构建一种双样本测序文库,使两个单独建库的样本连接到 一起形成一个文库并正常测序,这样基于双端测序策略(如PE50、PE75、PE100等)的原理, 合理利用双端测序数据,在相对较低的测序成本下,能够有效提高样本检测通量、进一步降 低单个样本双端测序的成本,可应用于更为广泛的测序场景中。
典型的,用于第一测序文库和第二测序文库构建的接头中具有互补序列,通过重叠延伸 PCR法将第一测序文库和第二测序文库连接在一起。优选的,采用上述任一种用于双样本共 建测序文库的Y型接头进行双样本共建测序文库。在本发明一实施例中,双样本共建测序文 库的方法包括:S1,分别采用第一Y型接头和第二Y型接头对两个待测样本进行单样本建库, 得到第一测序文库和第二测序文库;S2,将第一测序文库和第二测序文库混合,通过重叠延 伸PCR法将第一测序文库和第二测序文库连接在一起得到双样本测序文库。
根据本发明一种典型的实施方式,将Y型接头的两条单链分别用无核酸酶水稀释到100 μM,按照如下表1所示比例配制退火反应液:
表1
试剂 | 体积 |
单链引物1 | 5μL |
单链引物2 | 5μL |
STE缓冲液(品牌:Solarbio货号:T1110)) | 15μL |
总计 | 25μL |
配制好的退火反应液涡旋10s,瞬时离心3s,置于PCR仪上,按照如下表2所示退火程 序运行:
表2
温度 | 时间 | 降温速率 |
95℃ | 10min | 5% |
70℃ | 10min | 5% |
65℃ | 10min | 5% |
55℃ | 10min | 5% |
50℃ | 10min | 5% |
25℃ | 10min |
退火后产物涡旋10s,瞬时离心3s,冻存于-20℃备用。
·工作浓度
退火后的接头母液为20μM,需稀释50倍后用于连接反应。
本发明中用于实现单建库的接头采用了Y型接头,Y型接头的优势在于所有连接产物都 可以被用来扩增富集;此Y型接头也可以采用完全互补的两种双链接头代替,但是其连接产 物中有效产物的量只有50%。
典型的,在单建库时,每一个文库都需要使用两种序列完全互补的接头,如:完全互补 的双链P5接头+完全互补的L1接头可以替代Y5接头;完全互补的双链L2接头+完全互补 的P7接头可以替代Y7接头(见图4A和图4B)。
下面将结合实施例进一步说明本发明的有益效果,以下实施例中如果有没有明确描述的 步骤或试剂,均可采用本领域的常规技术手段或常规试剂实现。
实施例1
1.两个样本分别单独建库(单建库):
为了实现双样本共建库,首先需要对两个样本(具体无创产前检测样本,即孕妇血浆游 离DNA),建库Y型接头(Y5接头:第一序列具有如SEQ ID NO:1所示的核苷酸序列,第二序列具有如SEQ ID NO:2所示的核苷酸序列;Y7接头:第三序列具有如SEQ ID NO:3 所示的核苷酸序列,第四序列具有如SEQ ID NO:4所示的核苷酸序列)进行单独建库,本实 施例中单独建库使用的是KAPA Hyper Prep Kit,流程如下:
(1)末端修复&加A反应
将末端修复缓冲液置于室温融化彻底后,涡旋10s,瞬时离心3s;按照下表3配制末端 修复反应液:
表3
试剂 | 体积 |
DNA sample(DNA样本) | 50μL |
End-repair&A-tailing buffer(末端修复&加A缓冲液) | 7μL |
End-repair&A-tailing Enzyme Mix(末端修复&加A酶混合液) | 3μL |
总计 | 60μL |
配好末端修复反应液后,涡旋10s,瞬时离心3s,放入PCR仪,按照下表4程序进行末端修复反应(PCR仪器热盖温度70℃);
表4
(2)接头连接
末端修复反应结束后,从PCR仪中拿出样本,按紧PCR管盖,涡旋10s,瞬时离心3s;
按下表5配制连接反应液:
表5
配制好的连接反应液涡旋10s,瞬时离心3s,置于PCR仪上,20℃温浴30min;
注意:
对于将要进行共建库的两个样本,分别使用Y5和Y7接头进行连接,Y5和Y7接头的barcode应选取一个UDI接头中对应的两种barcodes;
(3)连接产物纯化
a.连接反应结束后,将连接产物转移到1.5mL的离心管中,加入0.8倍体积(88μL)的 室温平衡30min的AMPure XP磁珠,涡旋5s,室温放置5min;
b.短时离心,将离心管置于磁力架上,静置3min直至溶液变澄清;
c.小心吸取离心管中的上清并丢弃,枪头避免碰触磁珠;
d.保持离心管在磁力架上,加入200μL 80%乙醇;
e.静置30s待磁珠沉降后,吸除乙醇;
f.重复步骤d-e一次;
g.室温晾干,直至离心管中残留的乙醇完全挥发;
注意:磁珠不要过于干裂,否则易造成回收效率降低;
h.加入22μL Nuclease-free Water,votex混匀5s,室温放置5min;
i.短时离心,将管子放在磁力架上,静置约2min至溶液变澄清;
j.吸取20μL上清到一个新的PCR管中。
(4)PCR扩增和纯化
在上一步的PCR管中,按下表6配制PCR反应液:
表6
配好后涡旋10s,瞬时离心3s,放入PCR仪,按照下表7中的程序进行扩增:
表7
PCR反应结束后,按下述方案对PCR产物进行纯化:
a.将PCR产物转移到1.5mL的离心管中,加入1倍体积(50μL)的室温平衡30min的AMPure XP磁珠,涡旋5s,室温放置5min;
b.短时离心,将离心管置于磁力架上,静置3min直至溶液变澄清;
c.小心吸取离心管中的上清并丢弃,枪头避免碰触磁珠;
d.保持离心管在磁力架上,加入200μL 80%乙醇;
e.静置30s待磁珠沉降后,吸除乙醇;
f.重复步骤d-e一次;
g.室温晾干,直至离心管中残留的乙醇完全挥发;
注意:磁珠不要过于干裂,否则易造成回收效率降低;
h.加入22μL Nuclease-free Water,votex混匀5s,室温放置5min;
i.短时离心,将管子放在磁力架上,静置约2min至溶液变澄清;
j.吸取20μL上清到一个新的离心管中,标记好名称(Y5/Y7端,barcode编号等)。
(5)单建库结果质检
取1μL单建库结果用Qubit 3.0进行浓度测定,浓度大于等于5ng/μL视为建库合格,否 则需重新建库;
取适量文库用Agilent 2100或相似片段分析仪器进行文库大小质检,文库主峰应该在 280-320bp左右。
2.两个样本文库的连接(共建库)
(1)PCR连接&扩增
取准备共建库的两个单建库样本文库各50ng,建库Y型接头(Y5接头:第一序列具有如 SEQ ID NO:1所示的核苷酸序列,第二序列具有如SEQ ID NO:2所示的核苷酸序列;Y7接头:第三序列具有如SEQ ID NO:3所示的核苷酸序列,第四序列具有如SEQ ID NO:4所 示的核苷酸序列),按照下表8配制共建库反应液:
表8
试剂 | 体积 |
2×KAPA HiFi Hotstart ReadyMix | 25μL |
KAPA Primer Mix | 5μL |
单文库1 | 50ng |
单文库2 | 50ng |
无核酸酶水 | To 50μL |
总计 | 50μL |
配好后涡旋10s,瞬时离心3s,放入PCR仪,按照下表9中的程序进行扩增:
表9
(2)扩增产物纯化
PCR反应结束后,按下述方案对PCR产物进行纯化:
a.将PCR产物转移到1.5mL的离心管中,加入0.7倍体积(35μL)的室温平衡30min的AMPure XP磁珠,涡旋5s,室温放置5min;
b.短时离心,将离心管置于磁力架上,静置3min直至溶液变澄清;
c.小心吸取离心管中的上清并丢弃,枪头避免碰触磁珠;
d.保持离心管在磁力架上,加入200μL 80%乙醇;
e.静置30s待磁珠沉降后,吸除乙醇;
f.重复步骤d-e一次;
g.室温晾干,直至离心管中残留的乙醇完全挥发;
注意:磁珠不要过于干裂,否则易造成回收效率降低;
h.加入22μL Nuclease-free Water,votex混匀5s,室温放置5min;
i.短时离心,将管子放在磁力架上,静置约2min至溶液变澄清;
j.吸取20μL上清到一个新的离心管中,标记好共建库信息。
本实施例中的两个样本分别使用Y5和Y7接头进行单建库和共建库,上机测序,对测序 结果的R1和R2数据(NGS双端测序数据包括两部分,分别是R1(reads1)端数据和R2(reads2) 端数据)分别分析并计算Z值。
单建库结果见表10,图5和图6:
表10
样本编号 | 起始量 | 接头 | PCR循环数 | 文库产量 |
T1 | 5ng | Y5 | 8 | 432ng |
T2 | 5ng | Y7 | 8 | 386ng |
共建库结果见表11和图7:
表11
样本编号 | 起始量 | PCR循环数 | 文库产量 |
T1&T2 | 各50ng | 7 | 1880ng |
分析结果见表12和13:
表12
样本数据 | Q30 | GC% |
R1(T1) | 94.6% | 40.79% |
R2(T2) | 93.8% | 41.19% |
R1和R2数据均可以正常拆分,且质控(Q30和GC%)合格,计算Z值也正常。
表13
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:
1)设计了一种新的成对的接头Y5和Y7,可以分别用于两个样本的单文库构建,同时建 好的文库可以用过Y5和Y7接头中的L1和L2序列进行连接,形成双样本文库;
2)建立了一种通过PCR连接两个文库的方法,实验操作简便,成本较低;
3)双样本共建库后,每个样本对应标记了双端barcode中的一种barcode,可以有效利用 双端测序的优势,使测序结果中R1和R2的reads都可以被有效利用,节省了测序成本;
4)NovaSeq 6000等高通量测序平台单条lane数据产量约为800-10000G,如将来获批用 于检测无创产前样本这种数据需求较小(约1-3G)的文库,barcode数量可能不够,本发明将 用于一个样本的双端barcode(UDI)分别标记两个样本,在增加样本检测数量的同时,提高 了barcode的利用率。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员 来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等 同替换、改进等,均应包含在本发明的保护范围之内。
序列表
<110> 北京科迅生物技术有限公司
<120> 用于双样本共建测序文库的Y型接头和双样本共建测序文库的方法
<130> PN115044YXYX
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 82
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(82)
<223> 第一序列
<220>
<221> modified_base
<222> (82)..(82)
<223> 硫代修饰
<400> 1
aatgatacgg cgaccaccga gatctacacc cttgtagaca ctctttccct acacgacgct 60
cttccgatct cataaatcaa ct 82
<210> 2
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(43)
<223> 第二序列
<220>
<221> modified_base
<222> (1)..(1)
<223> 磷酸化修饰
<400> 2
gttgatttat gagatgcagg ccaagcggtc ttagtctgac agc 43
<210> 3
<211> 77
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(77)
<223> 第三序列
<220>
<221> modified_base
<222> (1)..(1)
<223> 磷酸化修饰
<400> 3
caagcagaag acggcatacg agatccttgg aagtgactgg agttcagacg tgtgctcttc 60
cgatctcctt ggctcac 77
<210> 4
<211> 44
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(44)
<223> 第四序列
<220>
<221> modified_base
<222> (44)..(44)
<223> 硫代修饰
<400> 4
gtgagccaag gagctgtcag actaagaccg cttggcctgc atct 44
<210> 5
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(18)
<223> 具有P5序列的引物
<400> 5
aatgatacgg cgaccacc 18
<210> 6
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(18)
<223> 具有L1序列的引物
<400> 6
caagcagaag acggcata 18
<210> 7
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(18)
<223> 具有P7序列的引物
<400> 7
gctgtcagac taagaccg 18
<210> 8
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(18)
<223> 具有L2序列的引物
<400> 8
gtgagccaag gagctgtc 18
Claims (12)
1.一种用于双样本共建测序文库的Y型接头,其特征在于,包括:第一Y型接头和第二Y型接头,其中,所述第一Y型接头包括:
第一序列,包括依次连接的P5、i5、SP1和N1序列,其中,依次连接的所述P5、所述i5和所述SP1即为illumina Y型接头中包含P5的单链核苷酸序列;
第二序列,包括依次连接的L1和N1c序列;
所述第二Y型接头包括:
第三序列,包括依次连接的P7、i7、SP2和N2序列,其中,依次连接的所述P7、所述i7和所述SP2即为illumina Y型接头中包含P7的单链核苷酸序列;
第四序列,包括依次连接的L2和N2c序列;
其中,所述L1、所述L2、所述N1、所述N1c、所述N2和所述N2c均与illumina接头序列及人基因组序列不同且不互补;所述N1与所述N1c互补,所述N2与所述N2c互补,且所述N1与所述N2和所述N2c不同且不互补;所述L1的3’端和所述L2的5’端序具有互补区域。
2.根据权利要求1所述的Y型接头,其特征在于,所述L1的3’端和所述L2的5’端序具有15~25bp的互补区域。
3.根据权利要求1所述的Y型接头,其特征在于,所述N1、所述N1c、所述N2和所述N2c的长度为10~20bp。
4.根据权利要求2所述的Y型接头,其特征在于,所述L1的3’端和所述L2的5’端序具有20bp的互补区域。
5.根据权利要求1所述的Y型接头,其特征在于,所述第一序列和所述第四序列的3’末端添加碱基T和硫代修饰,所述第二序列和所述第三序列的5’末端做磷酸化修饰。
6.根据权利要求1所述的Y型接头,其特征在于,所述第一序列具有如SEQ ID NO:1所示的核苷酸序列,所述第二序列具有如SEQ ID NO:2所示的核苷酸序列,所述第三序列具有如SEQ ID NO:3所示的核苷酸序列,以及所述第四序列具有如SEQ ID NO:4所示的核苷酸序列。
7.一种双样本共建测序文库的方法,其特征在于,包括以下步骤:
分别采用不同的接头对两个待测样本进行单样本建库,得到第一测序文库和第二测序文库,其中,用于所述第一测序文库和所述第二测序文库构建的接头中具有能够通过PCR扩增将所述第一测序文库和所述第二测序文库连接在一起的序列;
将所述第一测序文库和所述第二测序文库混合,通过PCR扩增将所述第一测序文库和所述第二测序文库连接在一起得到双样本测序文库。
8.根据权利要求7所述的方法,其特征在于,用于所述第一测序文库和所述第二测序文库构建的接头中具有互补序列,通过重叠延伸PCR法将所述第一测序文库和所述第二测序文库连接在一起。
9.根据权利要求8所述的方法,其特征在于,采用如权利要求1至6中任一项所述的用于双样本共建测序文库的Y型接头进行双样本共建测序文库。
10.根据权利要求9所述的方法,其特征在于,所述方法包括:
S1,分别采用第一Y型接头和第二Y型接头对两个待测样本进行单样本建库,得到第一测序文库和第二测序文库;
S2,将第一测序文库和第二测序文库混合,通过重叠延伸PCR法将所述第一测序文库和所述第二测序文库连接在一起得到双样本测序文库。
11.根据权利要求10所述的方法,其特征在于,所述S1包括:
接头连接步骤,对其中一个待测样本连接所述第一Y型接头,对另一个待测样本连接所述第二Y型接头;以及
扩增步骤,采用具有P5和L1序列的引物对对连接有第一Y型接头的待测样本进行扩增,得到第一测序文库,采用具有P7和L2序列的引物对对连接有第二Y型接头的待测样本进行扩增,得到第二测序文库。
12.根据权利要求11所述的方法,其特征在于,所述具有P5序列的引物具有如SEQ IDNO:5所示的核苷酸序列,所述具有L1序列的引物具有如SEQ ID NO:6所示的核苷酸序列,所述具有P7序列的引物具有如SEQ ID NO:7所示的核苷酸序列,所述具有L2序列的引物具有如SEQ ID NO:8所示的核苷酸序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911329765.9A CN111005075B (zh) | 2019-12-20 | 2019-12-20 | 用于双样本共建测序文库的y型接头和双样本共建测序文库的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911329765.9A CN111005075B (zh) | 2019-12-20 | 2019-12-20 | 用于双样本共建测序文库的y型接头和双样本共建测序文库的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111005075A true CN111005075A (zh) | 2020-04-14 |
CN111005075B CN111005075B (zh) | 2023-04-21 |
Family
ID=70117398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911329765.9A Active CN111005075B (zh) | 2019-12-20 | 2019-12-20 | 用于双样本共建测序文库的y型接头和双样本共建测序文库的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111005075B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112626189A (zh) * | 2020-04-24 | 2021-04-09 | 北京吉因加医学检验实验室有限公司 | 基因测序仪的短接头、双index接头引物和双index建库体系 |
CN112708939A (zh) * | 2020-12-30 | 2021-04-27 | 深圳海普洛斯医学检验实验室 | 构建dna文库的试剂盒及方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104450872A (zh) * | 2013-09-25 | 2015-03-25 | 上海市肿瘤研究所 | 一种高通量多样本多靶点单碱基分辨率的甲基化水平检测方法 |
CN105602936A (zh) * | 2015-11-18 | 2016-05-25 | 中国人民解放军第四军医大学 | 一种双barcode二代测序文库的构建方法 |
WO2016195382A1 (ko) * | 2015-06-01 | 2016-12-08 | 연세대학교 산학협력단 | 바코드 서열을 포함하는 어댑터를 이용한 차세대 염기서열 분석 방법 |
CN108779453A (zh) * | 2016-04-21 | 2018-11-09 | 日铁住金环境株式会社 | 多项扩增法 |
US20180334712A1 (en) * | 2017-05-08 | 2018-11-22 | Illumina, Inc. | Universal short adapters for indexing of polynucleotide samples |
CN108893466A (zh) * | 2018-06-04 | 2018-11-27 | 苏州人人基因科技有限公司 | 测序接头、测序接头组和超低频突变的检测方法 |
CN109576347A (zh) * | 2018-12-06 | 2019-04-05 | 深圳海普洛斯医疗器械有限公司 | 含单分子标签的测序接头和测序文库的构建方法 |
CN109988820A (zh) * | 2019-04-19 | 2019-07-09 | 奥明(杭州)基因科技有限公司 | 一种用于乳腺癌多基因检测的文库构建方法及试剂盒 |
CN110257480A (zh) * | 2019-07-04 | 2019-09-20 | 北京京诺玛特科技有限公司 | 核酸序列测序接头及其构建测序文库的方法 |
CN110511978A (zh) * | 2019-09-09 | 2019-11-29 | 北京优迅医学检验实验室有限公司 | Ffpe样本dna文库及其构建方法 |
-
2019
- 2019-12-20 CN CN201911329765.9A patent/CN111005075B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104450872A (zh) * | 2013-09-25 | 2015-03-25 | 上海市肿瘤研究所 | 一种高通量多样本多靶点单碱基分辨率的甲基化水平检测方法 |
WO2016195382A1 (ko) * | 2015-06-01 | 2016-12-08 | 연세대학교 산학협력단 | 바코드 서열을 포함하는 어댑터를 이용한 차세대 염기서열 분석 방법 |
CN105602936A (zh) * | 2015-11-18 | 2016-05-25 | 中国人民解放军第四军医大学 | 一种双barcode二代测序文库的构建方法 |
CN108779453A (zh) * | 2016-04-21 | 2018-11-09 | 日铁住金环境株式会社 | 多项扩增法 |
US20180334712A1 (en) * | 2017-05-08 | 2018-11-22 | Illumina, Inc. | Universal short adapters for indexing of polynucleotide samples |
CN108893466A (zh) * | 2018-06-04 | 2018-11-27 | 苏州人人基因科技有限公司 | 测序接头、测序接头组和超低频突变的检测方法 |
CN109576347A (zh) * | 2018-12-06 | 2019-04-05 | 深圳海普洛斯医疗器械有限公司 | 含单分子标签的测序接头和测序文库的构建方法 |
CN109988820A (zh) * | 2019-04-19 | 2019-07-09 | 奥明(杭州)基因科技有限公司 | 一种用于乳腺癌多基因检测的文库构建方法及试剂盒 |
CN110257480A (zh) * | 2019-07-04 | 2019-09-20 | 北京京诺玛特科技有限公司 | 核酸序列测序接头及其构建测序文库的方法 |
CN110511978A (zh) * | 2019-09-09 | 2019-11-29 | 北京优迅医学检验实验室有限公司 | Ffpe样本dna文库及其构建方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112626189A (zh) * | 2020-04-24 | 2021-04-09 | 北京吉因加医学检验实验室有限公司 | 基因测序仪的短接头、双index接头引物和双index建库体系 |
CN112708939A (zh) * | 2020-12-30 | 2021-04-27 | 深圳海普洛斯医学检验实验室 | 构建dna文库的试剂盒及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111005075B (zh) | 2023-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110409001B (zh) | 一种构建捕获文库的方法和试剂盒 | |
CN105506125B (zh) | 一种dna的测序方法及一种二代测序文库 | |
JP6925424B2 (ja) | 短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法 | |
JP6110297B2 (ja) | 高処理スクリーニング用の組合せ配列バーコード | |
WO2016082129A1 (zh) | 一种核酸的双接头单链环状文库的构建方法和试剂 | |
CN111471754B (zh) | 一种通用型高通量测序接头及其应用 | |
CN111363783B (zh) | 一种基于特有识别序列的t细胞受体库高通量测序文库构建及测序数据分析方法 | |
CN113005121A (zh) | 接头元件、试剂盒及其相关应用 | |
CN107075513A (zh) | 分离的寡核苷酸及其在核酸测序中的用途 | |
CN110546272B (zh) | 将衔接子附接至样品核酸的方法 | |
EP3907296A1 (en) | Gene target region enrichment method and kit | |
CN105985945A (zh) | mRNA片段化方法及基于其构建测序文库的方法 | |
CN109576346B (zh) | 高通量测序文库的构建方法及其应用 | |
CN110904512A (zh) | 一种适用于单链dna的高通量测序文库构建方法 | |
CN111041026B (zh) | 一种高通量测序用核酸接头和文库构建方法 | |
CN110565174B (zh) | 一种dna文库构建方法 | |
WO2012037883A1 (zh) | 核酸标签及其应用 | |
CN113337501B (zh) | 一种发卡型接头及其在双端index建库中的应用 | |
CN102839168A (zh) | 核酸探针及其制备方法和应用 | |
CN111005075B (zh) | 用于双样本共建测序文库的y型接头和双样本共建测序文库的方法 | |
CN110004225B (zh) | 一种肿瘤化疗药个体化基因检测试剂盒、引物及方法 | |
CN111269909A (zh) | 一种转录组建库的方法、试剂和应用 | |
WO2012037875A1 (zh) | Dna标签及其应用 | |
CN116144736A (zh) | 甲状腺癌相关基因高通量扩增子文库的制备方法、多重pcr引物对及应用 | |
CN110734958A (zh) | 一种单分子标签免疫组库高通量测序文库构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |