CN113667716B - 基于滚环扩增的测序文库构建方法及其应用 - Google Patents

基于滚环扩增的测序文库构建方法及其应用 Download PDF

Info

Publication number
CN113667716B
CN113667716B CN202110996788.6A CN202110996788A CN113667716B CN 113667716 B CN113667716 B CN 113667716B CN 202110996788 A CN202110996788 A CN 202110996788A CN 113667716 B CN113667716 B CN 113667716B
Authority
CN
China
Prior art keywords
sequencing
dna
strand
sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110996788.6A
Other languages
English (en)
Other versions
CN113667716A (zh
Inventor
肖飞
罗玄梅
邹丽辉
苏斐
张丽丽
李贺鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hospital
Original Assignee
Beijing Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hospital filed Critical Beijing Hospital
Priority to CN202110996788.6A priority Critical patent/CN113667716B/zh
Publication of CN113667716A publication Critical patent/CN113667716A/zh
Application granted granted Critical
Publication of CN113667716B publication Critical patent/CN113667716B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本申请提供了一种基于滚环扩增的测序文库的构建方法及其应用。该测序文库的构建方法包括:提供闭合环状的双链DNA、cDNA或RNA分子;利用特异性引物,进行滚环扩增,从而每个环仅扩增得到一条含多拷贝的单链DNA产物作为第一链;以第一链为模版,产生互补的第二链,从而获得双链DNA产物。还提供了测序方法及试剂盒。

Description

基于滚环扩增的测序文库构建方法及其应用
技术领域
本发明涉及基因检测领域,更具体涉及一种基于滚环扩增的测序文库的构建方法及其应用、测序方法和试剂盒。
背景技术
单分子测序(SMS)方法作为第三代测序技术,例如Oxford NanoporeTechnologies(ONT)的纳米孔测序技术和Pacific Biosciences(PacBio)的SMRT(singlemolecule real time sequencing,单分子实时测序)测序技术,最大的特点是能够对单分子进行测序,同时具有通量高、读长(read)长、速度快的特点。长读长可以减少拼接成本,节省内存和计算时间。同时,三代测序还拓展了二代测序技术的应用,如直接读取DNA/RNA的甲基化信息。
然而与第三代测序技术的单分子测序相伴随的是其碱基读取错误率偏高,限制了在小片段插入或缺失(InDel)以及单核苷酸变异(SNV)等方面的研究。特别是对于一些序列高度多样性尤其是单个或几个碱基的差异的多样性的核酸序列进行分类时,例如免疫组库的克隆型(clonotype)分型、微生物16s扩增子测序的菌种鉴别,三代测序往往难以达到二代测序的精确度。
PacBio测序平台通过环形测序生成的一系列亚读长(subread)来进行自我校正,从而获得高质量的HiFi读长。这不仅提供了准确的序列信息,在后续的运算方面,分析的流程更为简单,消耗的时间也大大减少。但是其面临读长有限(相较于ONT)、成本高昂的问题。
ONT的纳米孔测序平台是根据不同碱基通过纳米孔时,造成电流幅度变化不同进行碱基识别的。ONT(~100kb)的读长比PacBio(~10Kb)长得多,数据可实时读取且通量更高、测序仪器便于携带,但是其碱基读取的错误率更高。
免疫组库是指在个体的循环系统内,任何指定时间所有功能多样性B细胞和T细胞的总和。T细胞和B细胞表面有能特异性结合某种抗原的受体,称为T细胞和B细胞表面受体(TCR/BCR,T/B cell recepter)。TCR/BCR上存在一块区域叫互补决定区(ComplementaryDetermining Region,CDR),包含CDR1、CDR2、CDR3,其中CDR3最高变,在抗原识别中起关键作用。免疫组库具有高度多样性,存在成千上万个克隆型,且有些克隆型仅存在一个拷贝。目前三代单分子测序的高错误率,导致其不能用于免疫组库研究。实际上,目前免疫组库的研究仅限于利用二代测序技术,例如illumina。然而,由于二代测序平台读长短,目前成熟的建库和分析方法大多仅研究CDR3区域,从而失去了全长RNA转录本的信息;同时,由于V、D、J基因片段本身具有多样性,使用二代测序要使用众多引物(例如EuroClonality-NGS工作组提供的IG/TR DNA扩增子测定方法使用了108条引物);另外,还存在PCR反应多所导致的扩增高偏好性和繁杂费时、难以确定各PCR反应管产物的正确混样比例等问题。考虑到一代测序技术读长能达到大约1000bp,早期将其用于免疫组库的研究,其基于L至C基因片段测序,能够获得RNA全长转录本的信息,但是一代测序技术通量低,且L基因片段引物特异性低、亲和力低,实际很难获得丰富的全长信息。这些都极大限制了免疫组库的更全面研究。
染色体外环状DNA(extrachromosomal circular DNAs,eccDNAs)是指位于染色体外的单链或双链闭合环状DNA,长度分布广泛,几百bp~几百兆bp。eccDNA广泛存在于各种真核生物中,具有很高的组织和疾病特异性。近年来大多数研究表明eccDNA是驱动肿瘤异质性的重要机制,同时eccDNA可以影响细胞生命活动,促进肿瘤细胞演进和适应性进化,增加了基因组的可塑性和不稳定性。
环状RNA(Circular RNAs,circRNAs)是一类非编码RNA,长度可小至100bp,也可大于4000bp,具有共价连接的闭环结构,由反向剪接事件产生。目前发现一些circRNA在细胞质中充当miRNA海绵,或作为RNA结合蛋白(RNA binding protein,RBP)的隔绝子,或作为核内翻译的调控子,是基因表达调控网络的重要参与者。大多数研究发现circRNA可能在动脉粥样硬化、神经退行性疾病、朊病毒疾病和癌症中发挥重要作用。
二代测序技术读长短且不能直接对环状核酸进行测序,鉴于eccDNA/circRNA天然的环状结构且部分长度较长,故而建库过程中需要将环状结构打开成线性并进行序列打断,后期再利用算法基于整合位点推测eccDNA/circRNA序列,不能直观并且准确地分析真实存在的eccDNA/circRNA及其组成元件。
发明人注意到,传统滚环扩增技术的引物为随机六碱基,该引物能随机结合到核酸序列的任意位置进行扩增。故而一个环状核酸序列通过滚环扩增反应后产生多条含有多拷贝的长序列,由此建立的测序文库在产生大量数据冗余的同时,改变了原始文库中各核酸序列的比例,难以进行定量。
发明内容
本发明旨在至少解决上述技术问题之一或多者。为此,本发明提供了一种用于单分子测序(即第三代测序)的测序文库的构建方法、其应用、以及相关试剂盒。本发明采用特异性引物对待测序分子的环状cDNA、dsDNA或RNA分子形式进行滚环扩增,一个环状序列仅产生一条含有多拷贝的长序列,即单拷贝扩增。使用本发明的构建方法所获得的测序文库,适合于第三代测序平台进行单分子测序,例如ONT测序平台和PacBio测序平台进行测序,通过一条长片段上拷贝间自我校正产生一致性序列,从而显著提高测序碱基质量,得到高精度的测序读长,降低单碱基读取的错误率,降低了成本,拓宽了第三代测序的应用范围。
另外,传统滚环扩增利用的是非特异性引物,对待测序分子的闭合环状分子形式进行多拷贝扩增,即一个环状核酸序列产生多条含有多拷贝的长序列,在产生大量数据冗余的同时,改变了原始文库中各核酸序列的比例,难以进行定量。本发明基于单拷贝扩增,可实现对测序分子的相对定量。
本发明的构建方法在circRNA、eccDNA、扩增子测序和免疫组库等研究中表现突出。
第一方面,提供了一种用于单分子测序的测序文库的构建方法,其包括:
提供待测序的分子的闭合环状的双链DNA分子、cDNA分子或RNA分子形式;
利用特异于所述闭合环状的双链DNA分子、cDNA分子或RNA分子的引物,进行滚环扩增,从而每个环仅扩增得到一条含多拷贝的单链DNA产物作为第一链;
以第一链为模版,产生互补的第二链,从而获得双链DNA产物,作为用于单分子测序的测序文库。
在一些实施方案中,所述闭合环状的双链DNA或cDNA分子为染色体外环状DNA,或者通过以下方法形成:
A)由平末端的双链DNA或cDNA分子通过连接酶连接成闭合环,例如T4 DNA连接酶、T4 RNA连接酶;
B)由粘性末端的双链DNA通过TA连接成闭合环,例如使用3‘端带dT粘性末端的T桥联片段,例如由SEQ ID NO:8和9组成的双链的T桥联片段。
本文实施例中所使用的T桥联片段是由SEQ ID NO:8和9组成的双链,该双链由两端的Xcml限制性酶切片段和中间的ccdB基因组成,在两端各有一个T碱基的悬突,如图13所示。
TA连接是本领域常用的一种成环技术,通过两个待连接双链分子末端分别具有的粘性末端T和A碱基之间的配对,连接成环。
滚环扩增使用的扩增酶是本领域技术人员已知的,例如phi29 DNA聚合酶、BstDNA聚合酶或Klenow酶,DNA分子时优选phi29 DNA聚合酶,RNA分子时优选Bst 3.0DNA聚合酶。
在一些实施方案中,所述cDNA分子来自白细胞(例如来自外周血、骨髓等)的总RNA。用于免疫组库研究时,可以在cDNA的3’末端连接miRNA接头(SEQ ID NO:6);可以利用特异性引物(例如SEQ ID NO:7、21、23-30)多重扩增获得dsDNA;和/或,可以通过DNA连接酶,例如T4 DNA连接酶将dsDNA连接成闭合环,利用引物(例如SEQ ID NO:22、31-39)、phi29DNA聚合酶进行滚环扩增。
在一些实施方案中,双链DNA产物通过连接酶(例如T4 DNA连接酶、T4 RNA连接酶)连接成环。或者通过使用T桥联片段成环,此时所述特异性引物的序列可以为SEQ ID NO:20。
在使用phi29 DNA聚合酶进行滚环扩增时,所述特异性引物可以不存在末端修饰。本领域技术人员知晓,通常情况下,phi29具有3’至5’的核酸外切酶活性,通过在3’进行硫代磷酸化修饰,可以防止该外切活性。本发明人发现,在本文文库构建的滚环扩增中,可以加入过量的末端未修饰的特异性引物,优选加入量为100~1000uM,保证所测序的DNA链的引物特异性位点被完全饱和,进一步降低了成本。
在一些实施方案中,第一链的互补性第二链通过以下方法产生:
使用末端转移酶在第一链的3'端产生poly-A序列;
使用与第一链的poly-A序列互补的Oligod(T)20作为引物,利用DNA聚合酶(例如phi29 DNA聚合酶、Bst DNA聚合酶或Klenow酶)产生第二链,形成dsDNA产物。
发明人发现,通过上述方法产生的dsDNA,在用于测序时,进一步改善了测序的结果,提高了准确性。
本文的所述的构建方法产生的测序文库适合于单分子测序,例如适合于纳米孔平台测序如ONT平台或者其他单分子实时测序平台如PacBio平台测序。在用于第三代单分子测序时,可以将所形成的dsDNA产物连接测序接头,例如使用ONT测序平台的SQK-LSK 109连接测序试剂盒,以获得测序文库。
第二方面,提供了测序方法,其包括:
利用第一方面的构建方法,获得测序文库;
利用单分子测序方法,例如纳米孔平台测序如ONT平台或者其他单分子实时测序平台如PacBio平台测序,对所述文库进行测序。
本文的构建方法或测序文库,可用于免疫组库测序、扩增子测序、染色体外环状DNA测序、环状RNA测序研究。
第三方面,提供了用于单分子测序的测序文库构建的试剂盒,其包括:
1)用于等温扩增的特异性引物,和
2)滚环扩增用酶,例如phi29 DNA聚合酶、Bst DNA聚合酶或Klenow酶,和
3)3‘端带dT粘性末端的T桥联片段,例如由序列SEQ ID NO:8和9组成的双链DNA和针对其的特异性引物序列SEQ ID NO:20;和/或
4)5’端r APP修饰且3’端NH2封闭修饰的接头,例如序列为SEQ ID NO:6的miRNA接头和针对其的特异性引物SEQ ID NO:7。
在一些实施方案中,所述试剂盒还包括DNA或RNA连接酶,例如T4DNA或RNA连接酶。
在一些实施方案中,所述试剂盒还包括:
dATP和Oligod(T)20;和/或
用于免疫组库扩增的特异性引物SEQ ID NO:21、23-31,和用于滚环扩增的特异性引物SEQ ID NO:22、31-39。
基于本文公开的内容,本领域技术人员理解,本发明的特异性引物与闭合环状的双链DNA分子、cDNA分子或RNA分子特异性结合(仅存在一个结合位点),在滚环扩增酶的作用下,每个待测分子仅仅扩增得到一条含多拷贝的单链DNA产物。
在滚环扩增之前,可以在dsDNA或cDNA的一端连接特异性分子,例如miRNA接头、T桥联片段,以便针对该特异性分子设计特异性引物,用于多重引物PCR扩增和/或滚环扩增。另外,所述接头和桥联片段可以作为待测序分子的条形码(barcode),实现多样本混合测序,然后利用该条形码,进行样本间的数据拆分。
基于本文公开的内容,本领域技术人员理解,可选地,对于序列高度多样性、拷贝数含量不高的待测序分子,例如免疫组库分子,在滚环扩增之前,可以利用特异性引物进行多重引物PCR扩增,以对待测分子进行富集。
本领域技术人员理解,滚环扩增所使用的特异性引物可以针对连接上的特异性序列或者待测序序列本身进行设计。本领域可以容易地确定待测序列中特异性序列并针对该序列设计引物。例如,浏览GenBank的核苷酸数据碱基,用例如BLASTN和BLASTX等计算机软件来识别序列身份及相似性,并使用引物设计软件设计引物。
本领域技术人员熟悉各种末端修饰,如为了在5′AppDNA/RNA热稳定连接酶的作用下与cDNA的3’端连接,可以进行5’端腺苷化修饰;为了避免末端与其他核酸分子连接,可以进行3’端封闭;为了DNA连接酶介导的DNA片段连接,可以进行5’端磷酸化修饰。
在具体的实施例中,基于TA连接的dsDNA成环方法包括:
a)提供5'端带磷酸化修饰的双链DNA且3'端带有一个突出dT碱基的桥联片段;
b)提供5'端带磷酸化修饰的双链DNA且3'端带有一个突出dA碱基的待测序分子的dsDNA形式,例如使用5'端磷酸化修饰的引物进行多重引物PCR扩增得到5'端磷酸化修饰且3'端带有一个突出dA碱基的dsDNA扩增产物;
c)利用TA连接的原理使桥联片段和dsDNA成环;
d)核酸外切酶Lambda exonuclease和Exonuclease III处理后去除未成环dsDNA。
在具体的实施例中,基于T4 RNA ligase 1的cDNA成环方法包括:
a)提供待检测的RNA并进行逆转录;
b)RNaseA处理,去除反应体系中的RNA;
c)T4 RNAligase 1介导cDNA成环;
d)Exonuclease I处理后去除未成环cDNA。
在具体的实施例中,滚环扩增方法包括:
a)获得待测序的分子的环状DNA形式;
b)使用特异性引物(如针对桥联片段的引物),依赖phi29 DNA聚合酶进行滚坏扩增合成第一链;
c)利用末端转移酶在第一链的3'端连续掺入多个dATP,形成poly-A序列;
d)使用Oligod(T)20引物与第一链poly-A序列互补配对,依赖phi29DNA聚合酶合成第二链。
在具体的实施例中,免疫组库TCR/BCR全长转录组研究方法包括:
a)提供待测样本中白细胞的总RNA;
b)使用Oligod(T)20引物对mRNA进行逆转录,获得cDNA;
c)RNase A处理,去除反应体系中RNA;
d)使用5'App DNA/RNA热稳定连接酶将腺苷化接头连接到cDNA的3'端;
e)利用5'端磷酸化的特异性引物(针对腺苷化接头和/或T细胞受体和/或B细胞受体C区的引物),例如SEQ ID NO:7、21、23-30,以cDNA为模版,进行多重引物PCR扩增;
f)使用T4 DNA聚合酶去除由于多重引物PCR扩增在3'端引入的一个突出dA
g)使用T4 DNA ligase让上一步得到的产物成环;
h)核酸外切酶Lambda exonuclease和Exonuclease III处理后去除未成环DNA;
i)使用针对T细胞受体和/或B细胞受体C区的特异性引物,例如SEQ ID NO:22、31-39,依赖phi29 DNA聚合酶进行滚环扩增合成第一链;
j)利用末端转移酶在第一链的3'端连续掺入多个dATP,形成poly-A序列;
k)使用Oligod(T)20与第一链poly(A)序列互补配对,依赖phi29 DNA聚合酶合成第二链。
利用第三代测序平台针对dsDNA的连接测序试剂盒进行建库上机测序,例如按照ONT公司SQK-LSK109连接测序试剂盒说明书,使用配套的测序仪器进行测序。
通过对环状模板进行特异性滚环扩增,使得每个环仅扩增得到一条含多拷贝的长双链DNA产物,从而得到高精度的测序读长,较好地纠正了第三代测序平台碱基读取的高错误率,消除了常规滚环扩增技术带来的数据冗余和扩增偏好性,可以实现对待测分子的相对定量,并使成本得到降低。
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
附图说明
图1为基于TA连接的dsDNA成环技术的具体示意图。
图2为基于T4 RNA连接酶1的cDNA成环技术的具体示意图。
图3为引物特异性滚环扩增的具体示意图。
图4为TCR/BCR全长转录组研究技术流程示意图。
图5显示通过本文文库构建方法构建文库进行测序的准确性。raw read1~8为随机选取的8条通过ONT官方LSK-109建库试剂说明书测序所得的碱基序列(每条序列对应一个纳米孔),consensus read1~5为随机选取的5条通过本发明实施例1测序方案所得碱基序列(各每条序列对应一个纳米孔),sanger-sequencing-result为待测分子的真实序列(通过一代测序获得)。A:随机选取的通过本发明产生的一致性序列及ONT平台官方测序流程所得结果与一代测序数据(sanger sequencing result)的多序列比对结果。B:本发明产生的一致性序列/ONT平台官方测序流程所得结果与一代测序数据的两两序列比对结果。
图6显示通过本文文库构建方法构建文库进行测序的相对定量能力。
图7显示实施例2的本发明方法的测序结果分析图。A:CDR3长度分析;B:异质性(Diversity)分析;C:克隆性评价,其中将克隆型根据频率分为:低频(small),中频(medium),高频(large),超高频(hyperexpanded),显示了不同频率克隆型的占比(相对丰度)。
图8显示实施例2的商品化二代免疫组库测序结果分析图。A:CDR3长度分析;B:异质性(Diversity)分析;C:克隆性评价,其中将克隆型根据频率分为:低频(small),中频(medium),高频(large),超高频(hyperexpanded),显示了不同频率克隆型的占比(相对丰度)。
图9显示实施例3的本发明方法的测序结果分析图。A:CDR3长度分析;B:异质性(Diversity)分析;C:克隆性评价,其中将克隆型根据频率分为:低频(small),中频(medium),高频(large),超高频(hyperexpanded),显示了不同频率克隆型的占比(相对丰度)。
图10显示实施例3的商品化二代免疫组库测序结果分析图。A:CDR3长度分析;B:异质性(Diversity)分析;C:克隆性评价,其中将克隆型根据频率分为:低频(small),中频(medium),高频(large),超高频(hyperexpanded),显示了不同频率克隆型的占比(相对丰度)。
图11显示实施例4的本发明方法的测序结果分析图。A:CDR3长度分析;B:异质性(Diversity)分析;C:克隆性评价,其中将克隆型根据频率分为:低频(small),中频(medium),高频(large),超高频(hyperexpanded),显示了不同频率克隆型的占比(相对丰度)。
图12显示实施例4的商品化二代免疫组库测序结果分析图。A:CDR3长度分析;B:异质性(Diversity)分析;C:克隆性评价,其中将克隆型根据频率分为:低频(small),中频(medium),高频(large),超高频(hyperexpanded),显示了不同频率克隆型的占比(相对丰度)。
图13显示T桥联片段的结构,其中斜体部分表示为Xcml酶切位点,其他部分为ccdB基因。
具体实施方式
现将详细地提供本发明实施方式的参考,其一个或多个实施例描述于下文。提供每一实施例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
因此,本发明覆盖了落入所附权利要求的范围及其等同范围中的此类修改和变化。本发明的其它对象、特征和方面公开于本文的发明内容中或从中是显而易见的。本领域普通技术人员应理解本部分仅是示例性实施方式的描述,而非意在限制本发明更广阔的方面。
实施例1:构建的测序文库的测序准确性和定量性能
本实施例以市售质粒Antimouse-pRSF、Antirabbit-pRSF、Dsbc-pRSF、FUCA1_pRSF、INP-pMV的混合物(按照Antimouse-pRSF:Antirabbit-pRSF:Dsbc-pRSF:Dsbc-pRSF:Dsbc-pRSF摩尔量比例为1:1:1:20:80对质粒混样)为例,研究利用本申请的文库构建方法所构建文库进行测序时的准确性和定量性能。
针对Antimouse-pRSF、Antirabbit-pRSF、Dsbc-pRSF、FUCA1_pRSF、INP-pMV各质粒上的特异性序列设计特异性引物SEQ ID NO:1~5,将五个质粒按照一定比例混合后,进行滚坏扩增合成第一链ssDNA。
质粒DNA 10~100ng
特异性引物(100μM) 1~10μL
混匀后进行互补配对:95℃5min,50℃15s,30℃15s,20℃10min。暂置于冰上。
特异性引物SEQ ID NO:1~5是合成的,序列为:
而后向其中加入以下:
混匀后30℃处理18h。然后,65℃处理10min使酶失活。
使用乙醇法沉淀回收产生的第一链ssDNA。
2.利用末端转移酶TdT在第1部分的第一链ssDNA的3'端掺入多个dATP,形成poly-A序列:
10X TdT reaction buffer 5μL
CoCl2(2.5mM) 5μL
ssDNA 0.1~10μg
dATP(10mM) 0.75μL
TdT(NEB) 10~50U
无核酸酶水 至50μL
混匀后37℃处理0.5~1h。然后,75℃处理20min使酶失活。
使用乙醇法沉淀回收产生的ssDNA。
3.使用与第一链的poly-A序列互补配对的Oligod(T)20,依赖phi29 DNA聚合酶产生第二链:
ssDNA 0.1~10μg
Oligod(T)20引物(100μM) 0.5~5μL
混匀后设置反应温度梯度:95℃5min,50℃15s,30℃15s,20℃10min。暂置于冰上。
而后,向其中加入以下:
混匀后30℃处理24h。然后,65℃处理10min使酶失活。
使用乙醇法沉淀回收产生的dsDNA。
4.使用ONT测序平台的SQK-LSK109快速连接测序试剂盒,按照说明书的描述进行末端修复及加测序接头。
5.使用配套的ONT测序仪器进行测序。
将上述利用本申请建库方法所得的含有多拷贝的长序列的下机数据利用C3POa算法(https://github.com/rvolden/C3POa)生成一致性序列(consensus_read),发明人将测序结果用多序列比对软件Clustal Omega和NCBI blastn比对软件进行比对,评价所获得一致性序列的碱基准确性(如图5所示)和本发明的定量能力(如图6所示)。
具体地,将本发明方法所得的一致性序列与ONT测序平台官方SQK-LSK109连接测序试剂盒建库流程所得的测序结果(随机选取来自8个纳米孔的序列,raw_read 1-8,每条序列对应一个纳米孔)进行比较,发现本发明通过序列内多拷贝片段的自我校正明显改善了ONT碱基读取的错误率。图5A所展示的是随机选取的通过本发明产生的一致性序列及ONT平台官方测序流程所得结果与一代测序数据(sanger sequencing result)的多序列比对结果。图5B所展示的是本发明产生的一致性序列(随机选取来自5个纳米孔的序列,consensus read 1-5,每条序列对应一个纳米孔)、ONT平台官方测序流程所得结果(随机选取来自8个纳米孔的序列,raw read 1-8,每条序列对应一个纳米孔)与一代测序数据的两两序列比对结果。从多序列比对结果可以看出一致性序列的碱基错误率低于ONT平台官方测序流程所得结果;从两两比对结果可以看出一致性序列与作为金标准的一代测序数据的比对率(Identities)为98%~99%,得分(Score)在5879~6071之间;而ONT平台官方测序流程的测序数据的比对率和得分均低于本发明。多序列比对结果可以直观地展示各碱基之间的比对情况,可以看出一致性序列与一代测序数据的碱基比对率也是高于ONT平台官方测序流程的测序数据。
图6显示质粒Antimouse-pRSF:Antirabbit-pRSF:Dsbc-pRSF:Dsbc-pRSF:Dsbc-pRSF=1:1:1:20:80混样时,测序所得的读长数目比例大约为8:8:9:160:672,与混样比例基本一致。这表明,所构建的测序文库具有良好的定量能力。
综上分析,本文的文库构建方法用于测序时能够显著提高ONT平台碱基读取的准确性,并且具有良好的定量能力。基于准确性和定量能力,可以考虑用于扩增子测序、免疫组库测序等。
实施例2:通过TA连接构建闭合环状dsDNA结构来建立文库,并对IGH基因测序
1.构建3'端带有一个dT突出末端的桥联片段
基于EcoR I和HindIII限制性酶切,将来自市售质粒ccdB2-pMV上的ccdB2片段插入到pRSF-Duet1载体,所形成的质粒名为ccdB2_RCA1。
酶切体系如下:
ccdB2-pMV/pRSF-Duet1 2~10μg
EcoR1限制性内切酶(NEB) 2μL
HindIII限制性内切酶(NEB) 2μL
10X CutSmart Buffer(NEB) 4μL
无核酸酶水 至40μL
37℃处理1h。
使用琼脂糖凝胶回收试剂盒回收相应片段大小的核酸分子。
连接体系如下:
T4 DNA ligase(ThermoFisher) 2~5U
10X T4 DNA ligase buffer 1μL
ccdB2片段 约500ng
pRSF-Duet1酶切产物 约500ng
无核酸酶水 至10μL
室温处理2h,通过热激转化转入化学感受态DH5α。
利用ThermoFisher质粒小提试剂盒提取ccdB2_RCA1质粒,使用限制性内切酶XcmI在37℃处理质粒,酶切产物通过琼脂糖凝胶电泳回收约303bp的片段,即可得到3'端带有一个dT突出末端的桥联片段。酶切体系如下:
ccdB2_RCA1 2~10μg
XcmI限制性内切酶(NEB) 2μL
10X CutSmart Buffer(NEB) 4μL
无核酸酶水 至40μL
37℃处理1~3h。使用琼脂糖凝胶回收试剂盒回收相应片段大小的核酸分子,所获得的桥联片段为3'端带有一个dT尾的双链DNA分子,其中一条链的序列为SEQ ID NO:8所示,其互补链为SEQ ID NO:9所示。
5'-TGTATGGATGCAGTTTAAGGTTTACACCTATAAAAGAGAGAGCCGTTATCGTCTGTTTGTGGATGTACAGAGTGATATTATTGACACGCCCGGGCGACGGATGGTGATCCCCCTGGCCAGTGCACGTCTGCTGTCAGATAAAGTCTCCCGTGAACTTTACCCGGTGGTGCATATCGGGGATGAAAGCTGGCGCATGATGACCACCGATATGGCCAGTGTGCCGGTCTCCGTTATCGGGGAAGAAGTGGCTGATCTCAGCCACCGCGAAAATGACATCAAAAACGCCATTAACCTGATGTTCTGGGGAATATAACCATACAT-3'(SEQ ID NO:8)
5'-TGTATGGTTATATTCCCCAGAACATCAGGTTAATGGCGTTTTTGATGTCATTTTCGCGGTGGCTGAGATCAGCCACTTCTTCCCCGATAACGGAGACCGGCACACTGGCCATATCGGTGGTCATCATGCGCCAGCTTTCATCCCCGATATGCACCACCGGGTAAAGTTCACGGGAGACTTTATCTGACAGCAGACGTGCACTGGCCAGGGGGATCACCATCCGTCGCCCGGGCGTGTCAATAATATCACTCTGTACATCCACAAACAGACGATAACGGCTCTCTCTTTTATAGGTGTAAACCTTAAACTGCATCCATACAT-3'(SEQ ID NO:9)
2.总RNA提取,并产生dsDNA
以类风湿关节炎病人外周血白细胞IGH基因为例。
首先利用红细胞裂解液(4.16g NH4Cl、0.5g KHCO3、0.02g乙二胺四乙酸二钠,加无核酸酶水至500ml,调节pH至7.2)除去外周血红细胞后,采取Trizol(Invitrogen)法提取外周血白细胞中的总RNA。
利用M-MLV Reverse Transcriptase(Invitrogen),按照如下的程序对所提取的总RNA进行逆转录获得cDNA。
反应体系如下:
总RNA 1~5μg
dNTP(10mM) 1μL
Oligod(T)20引物(10μM) 1μL
65℃反应5min。向反应混合物中加入:
5X First Strand Buffer 4μL
0.1M DTT 2μL
37℃反应2min。向反应混合物中加入:
M-MLV RT 1μL
无核酸酶水 至20μL
37℃反应50min,75℃反应15min灭活,cDNA产物4℃短时间保存备用,长时间保存需置于-80℃。
利用QIAGEN Multiplex PCR Kit,按照如下的程序对cDNA进行多重引物PCR扩增:
所用引物为以下序列,均为合成,且5’端均带有磷酸化修饰:
扩增程序如下:
使用乙醇法沉淀回收dsDNA。
3.利用TA连接的原理使第1部分的桥联片段和第2部分回收的dsDNA成环。反应体系如下:
10X T4 DNA Ligase Buffer 2μL
T4 DNA ligase(ThermoFisher) 5~10U
dsDNA 1~10μg
桥联片段 2~10μg
无核酸酶水 至20μL
室温反应0.5~2h。
使用乙醇法沉淀回收反应产物环状dsDNA。
4.Lambda Exonuclease和Exonuclease III处理后去除未成环的DNA:
DNA 0.5~10μg
Lambda Exonuclease(NEB) 10~20U
Exonuclease III(NEB) 20~50U
10X Cutsmart buffer 2μL
无核酸酶水 至20μL
37℃处理8~16h。然后,70℃处理20min使酶失活。
使用乙醇法沉淀回收成环的反应产物。
5.使用针对桥联片段的特异性引物进行滚坏扩增合成第一链ssDNA:
成环DNA产物 10~100ng
特异性引物(100μM) 1~10μL
混匀后设置反应温度梯度:95℃5min,50℃15s,30℃15s,20℃10min,立即置于冰上。
所使用特异性引物为合成,序列如下所示:
5'-CAGTTTAAGGTTTACACCTATAAAA-3'(SEQ ID NO:20)
而后向其中加入以下:
混匀后30℃处理18h~36h。然后,65℃处理10min使酶失活。
使用乙醇法沉淀回收反应产物第一链ssDNA。
6.利用末端转移酶在第5部分获得的第一链3'端掺入多个dATP(polyA序列):
混匀后37℃处理0.5~1h。然后,75℃处理20min使酶失活。
使用乙醇法沉淀回收反应产物中ssDNA。
7.使用Oligod(T)20与第6部分形成的ssDNA的poly-A序列互补配对,依赖phi29DNA聚合酶(NEB)合成第二链:
ssDNA 0.5~10μg
Oligod(T)20引物(100μM) 1~10μL
混匀后设置反应温度梯度:95℃5min,50℃15s,30℃15s,20℃10min。暂置于冰上。
而后,向其中加入以下:
混匀后30℃处理24h~72h。然后,65℃处理10min使酶失活。
使用乙醇法沉淀回收dsDNA产物。
9.使用ONT测序平台的SQK-LSK109快速连接测序试剂盒,按照说明书的描述进行末端修复及加测序接头。
10.使用配套的ONT测序仪器进行测序。
本发明下机的fastq文件利用C3POa算法生成一致性序列用于IGH的分析,同时与商业化二代免疫组库测序方案(艾吉泰康公司)所得结果就IGH的CDR3分析结果进行比较。艾吉泰康公司的方案基于DNA水平进行研究CDR3序列;相比之下,本发明是基于mRNA水平,不仅能获取CDR3的信息,还可以得到全长转录本。并且DNA水平存在较多无功能性的CDR3序列,而mRNA水平存在极少的无功能性CDR3序列。
具体地,利用MiXCR软件(https://mixcr.readthedocs.io/en/master/)将本发明方法生成的一致性序列或艾吉泰康公司测序方案拼接后读长与免疫组库的数据库进行比对,随后使用R包immunarch(https://immunarch.com)进行基于CDR3区域进行CDR3长度分析、异质性分析及克隆性评价。本发明分析结果如图7所示,商业化二代免疫组库测序方案如图8所示。
图7A的CDR3长度分析图显示集中分布在10~30bp,与图8A的商品化二代免疫组库测序结果对比,发现本发明的方法能够检测到更长的CDR3序列。图7B的异质性分析显示检测出近25000种克隆型的类型,表明本发明具有大量克隆型的检出潜力。与图8B的商品化二代免疫组库测序结果对比,发现本发明的方法能够检测到更多的克隆型。图7C的本发明方法的克隆性评价中,大部分为中频(medium)或低频(small)克隆,该检测结果基本符合类风湿性关节炎病人机体的免疫状况,与患者临床诊断结果(类风湿关节炎)相符合。同时,该结果也与图8C的商品化二代免疫组库测序结果匹配。
以上结果说明,本发明实施例的分析结果大致与商业化二代免疫组库测序结果相符,但本发明的方法能够检测出更多的信息,例如更长的CDR3序列信息、更多的克隆型以及提供全长转录组信息以供更深层次的分析等。
实施例3:通过利用T4 RNA连接酶将cDNA连接成环而建立文库并测序
1.使用实施例2第2部分所提取的外周血白细胞的总RNA,使用针对IGK恒定区的引物按照以下程序进行逆转录:
总RNA 1~5μg
dNTP(2.5mM) 1μL
IGK-引物(10μM) 1μL
65℃反应5min,向反应混合物中加入:
IGK-引物为合成,其序列为:
5'-GCGTTATCCACCTTCC-3'(SEQ ID NO:21)
5X First Strand Buffer 4μL
0.1M DTT 2μL
37℃反应2min,向反应混合物中加入:
M-MLV RT(Invitrogen) 1μL
无核酸酶水 至20μL
37℃反应50min。然后,75℃反应15min使酶失活。
2.向上述第1部分中加入1μL的RNaseA室温处理3~6h,除去反应中残留的RNA。使用50μL贝克曼RNAClean XP磁珠回收产生的cDNA。
3.使用T4 RNA ligase 1使回收的cDNA成环:
10X T4 RNA ligase Buffer 5μL
cDNA 0.5~10μg
T4 RNAligase 1(NEB) 10~50U
50%PEG8000 25μL
ATP(10μM) 4μL
无核酸酶水 至50μL
混匀后16℃过夜反应。然后,100℃处理2min使酶失活。
使用乙醇法沉淀回收反应产物中DNA。
4.使用核酸外切酶I去除未成环cDNA:
cDNA 0.5~10μg
Exonuclease I(NEB) 10~50U
10X reaction buffer 2μL
无核酸酶水 至20μL
混匀后37℃处理1~6h。然后,80℃处理20min使酶失活。
使用乙醇法沉淀回收产生的环状cDNA。
5.使用针对IGK恒定区的特异性引物进行滚坏扩增,产生第一链ssDNA:
环状cDNA 10~100ng
特异性引物(100μM) 1~10μL
混匀后进行互补配对:95℃5min,50℃15s,30℃15s,20℃10min。暂置于冰上。
特异性引物为合成的,序列为:
5'-GAACTGTGGCTGCACCATCTGTC-3'(SEQ ID NO:22)。
而后,向其中加入以下:
混匀后30℃处理18h~36h。然后,65℃处理10min使酶失活。
使用乙醇法沉淀回收产生的第一链ssDNA。
6.利用末端转移酶在第5部分的第一链3'端掺入多个dATP:
10X TdT reaction buffer 5μL
CoCl2(2.5mM) 5μL
ssDNA 0.5~10μg
dATP(10mM) 0.75μL
TdT(NEB) 10~50U
无核酸酶水 至50μL
混匀后37℃处理0.5~1h。然后,75℃处理20min使酶失活。
使用乙醇法沉淀回收产生的ssDNA。
7.使用与第6部分形成的poly-A序列互补配对的Oligod(T)20,依赖phi29DNA聚合酶(NEB)产生第二链,形成dsDNA产物:
混匀后设置反应温度梯度:95℃5min,50℃15s,30℃15s,20℃10min。暂置于冰上。
而后向其中加入以下:
混匀后30℃处理24h~72h。然后,65℃处理10min使酶失活。
使用乙醇法沉淀回收产生的dsDNA产物。
9.使用ONT测序平台的SQK-LSK109快速连接测序试剂盒,按照说明书的描述进行末端修复及加测序接头。
10.使用配套的ONT测序仪器进行测序。
下机的fastq文件利用C3POa算法生成一致性序列,随后将生成的一致性序列利用MiXCR软件与免疫组库的数据库进行比对,使用R包immunarch进行CDR3长度分析、异质性分析及克隆性评价,结果如图9和图10所示。图9A显示本发明方法的CDR3长度集中分布在10~15bp,与图10A的商品化二代免疫组库测序结果对比,长度稍较短,但是分布趋势大致相似。图9B的本发明方法的异质性分析显示检测出近2500种克隆型,与图10B的商品化二代免疫组库测序结果对比,发现本发明的方法能够检测到更多的克隆型。图9C的本发明方法的克隆性评价中高频克隆型占比含量不足5%,多为中频克隆型,基本符合类风湿性关节炎病人机体的免疫状况。同时也与图10C的商品化二代免疫组库测序结果匹配。
以上结果说明,基于CDR3进行分析,本发明方法的分析结果大致与商业化二代免疫组库测序结果相符,但其能够检测出更多的信息,例如更多的克隆型以及提供全长转录组信息以供更深层次的分析等。
实施例4:TCR和BCR全长转录组研究
本实施例以急性淋巴细胞白血病患者外周血TCR和BCR全长转录组为研究对象。
1.按照实施例2的方法提取外周血白细胞的总RNA。
2.使用Oligod(T)20引物对mRNA进行逆转录,获得cDNA
总RNA 1~5μg
dNTP(10mM) 1μL
Oligod(T)20引物(10μM) 1μL
65℃反应5min。向反应混合物中加入:
5X First Strand Buffer 4μL
0.1M DTT 2μL
37℃反应2min。向反应混合物中加入:
M-MLV RT(Invitrogen) 1μL
无核酸酶水 至20μL
37℃反应50min,然后75℃反应15min灭活,cDNA产物4℃短暂保存备用,长时间保存需置于-80℃。
3.加入1μL的RNaseA室温处理1~6h,除去上一步反应中残留的RNA。使用50μL贝克曼RNAClean XP磁珠回收产生的cDNA。
4.使用5'App DNA/RNA热稳定连接酶将腺苷化接头连接到cDNA的3'端:
cDNA 0.5~10ug
通用miRNA克隆接头(NEB)(10μM) 2μL
10X NEBuffer1 2μL
50mM MnCl2 2μL
5'App DNA/RNA热稳定连接酶(NEB) 2μL
无核酸酶水 至20μL
混匀后65℃处理过夜,90℃处理3min使酶失活。
通用miRNA克隆接头序列(SEQ ID NO:6):5'-rAppCTGTAGGCACCATCAAT-NH2 3'。
miRNA接头互补的特异性引物序列(SEQ ID NO:7):5'-ATTGATGGTGCCTACAG-3'。
使用乙醇法沉淀回收连接产物。
5.利用QIAGEN Multiplex PCRKit,按照如下的程序对cDNA进行多重引物PCR扩增:
所用引物序列为合成,序列如下,且5'端均带有磷酸化修饰:
名称 序列 SEQ ID NO
miRNA引物 5'-ATTGATGGTGCCTACAG-3' 7
TRB_C_5P 5'-CACGTGGTCGGGGWAGAAGC-3' 23
TRA_C_5P 5'-AGCTGGTACACGGCAGGGTC-3' 24
IGH_lgG_C_5P 5'-GAGTTCCACGACACCGTCAC-3' 25
IGH_lgA_C_5P 5'-GGCTCCTGGGGGAAGAAGCC-3' 26
IGH_lgE_C_5P 5'-TAGCCCGTGGCCAGGCAG-3' 27
IGH_lgD_C_5P 5'-CCCAGTTATCAAGCATGCCA-3' 28
IGH_lgM_C_5P 5'-GGGGAATTCTCACAGGAGAC-3' 29
IGL_C_5P 5'-GCTCCCGGGTAGAAGT-3' 30
IGK_C_5P 5'-GCGTTATCCACCTTCC-3' 21
扩增程序如下:
使用乙醇法沉淀回收反应产物dsDNA。
6.使用T4 DNA聚合酶去除由于多重引物PCR扩增过程在反应产物3’端添加的一个突出dA碱基
10X NEBuffer 2.1 2μL
dNTP(2.5mM) 4μL
DNA 0.5~10μg
0.1%BSA 2μL
70℃反应5min,向反应混合物中加入:
T4 DNA聚合酶(NEB) 0.5~2U
无核酸酶水 up to 20μL
37℃反应5min,然后75℃反应20min使酶失活。
使用乙醇法沉淀回收反应产物dsDNA。
7.使用T4 DNAligase让PCR产物成环:
10X T4 DNAligation buffer 2μL
T4 DNAligase(NEB) 10~20U
DNA 0.5~10μg
无核酸酶水 至20μL
室温处理2~6h。
使用乙醇法沉淀回收产生的环状dsDNA。
8.Lambda Exonuclease和Exonuclease III处理后去除未成环DNA:
混匀后37℃处理8~16h。然后,80℃处理20min使酶失活。
使用乙醇法沉淀回收dsDNA。
9.使用针对TCR/BCR恒定区的特异性引物进行滚坏扩增合成第一链ssDNA:
混匀后设置反应温度梯度:95℃5min,50℃15s,30℃15s,20℃10min。立即置于冰上,而后向其中加入以下:
混匀后30℃处理18h~36h。然后,65℃处理10min使酶失活。
引物是合成的,序列如下所示:
使用乙醇法沉淀回收反应产物ssDNA。
10.利用末端转移酶在合成的第一条单链3'端掺入多个dATP:
10X TdT reaction buffer 5μL
CoCl2(2.5mM) 5μL
ssDNA 0.5~10μg
dATP(10mM) 0.75μL
TdT(NEB) 10~50U
无核酸酶水 至50μL
混匀后37℃处理0.5~1h。然后,75℃处理20min使酶失活。
使用乙醇法沉淀回收反应产物ssDNA。
11.使用Oligod(T)20,依赖phi29 DNA聚合酶产生第二链,形成dsDNA产物:
ssDNA 0.5~10μg
Oligod(T)20(100μM) 1~10μL
混匀后设置反应温度梯度:95℃5min,50℃15s,30℃15s,20℃10min。暂置于冰上。
而后,向其中加入以下:
混匀后30℃处理24h~72h。然后,65℃处理10min使酶失活。
使用乙醇法沉淀回收dsDNA产物。
12.使用ONT测序平台的SQK-LSK109快速连接测序试剂盒,按照说明书的描述进行末端修复及加测序接头。
13.使用配套的ONT测序仪器进行测序。
下机的fastq文件利用C3POa算法生成一致性序列,随后将生成的一致性序列利用MiXCR软件与免疫组库的数据库进行比对,使用R包immunarch进行CDR3长度分析、异质性分析及克隆性评价。结果如图11和12所示。图11A显示的本发明方法CDR3长度集中分布在10~30bp,与图12A的商品化二代免疫组库测序结果对比,发现本发明能够检测到更长CDR3序列。图11B和11C显示的本发明方法异质性和克隆性评价与图12B和12C的商品化二代免疫组库测序结果相符合,基本符合急性淋巴细胞白血病病人机体的免疫状况,特别是TCR尤为异常。通过对克隆性进行评价,发现有占比大于5%的TRB克隆型的亚型,基本符合急性T淋巴细胞白血病的诊断,与后续临床的流式分析及骨髓病理活检结果一致,表明本发明有望用于辅助临床诊断。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述。然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅示例了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。本发明专利的保护范围应以所附权利要求为准。
序列表
<110> 北京医院
<120> 基于滚环扩增的测序文库构建方法及其应用
<130> LZ2105657CN01
<160> 39
<170> PatentIn version 3.3
<210> 1
<211> 19
<212> DNA
<213> 人工
<220>
<223> Antimouse-pRSF_RCA1
<400> 1
atgggccatc accatcatc 19
<210> 2
<211> 19
<212> DNA
<213> 人工
<220>
<223> Antirabbit-pRSF_RCA1
<400> 2
tgggccatca ccatcatca 19
<210> 3
<211> 19
<212> DNA
<213> 人工
<220>
<223> Dsbc-pRSF_RCA1
<400> 3
tgggccatca ccatcatca 19
<210> 4
<211> 20
<212> DNA
<213> 人工
<220>
<223> FUCA1-pRSF_RCA1
<400> 4
agaaaagagt tagaagagca 20
<210> 5
<211> 20
<212> DNA
<213> 人工
<220>
<223> INP-pRSF_RCA1
<400> 5
caccgttgaa agccgttact 20
<210> 6
<211> 17
<212> DNA
<213> 人工
<220>
<223> 通用miRNA克隆接头序列,5'是rApp,3'是NH2
<400> 6
ctgtaggcac catcaat 17
<210> 7
<211> 17
<212> DNA
<213> 人工
<220>
<223> miRNA接头互补的特异性引物序列
<400> 7
attgatggtg cctacag 17
<210> 8
<211> 306
<212> DNA
<213> 人工
<220>
<223> T桥联片段
<400> 8
tgtatggatg cagtttaagg tttacaccta taaaagagag agccgttatc gtctgtttgt 60
ggatgtacag agtgatatta ttgacacgcc cgggcgacgg atggtgatcc ccctggccag 120
tgcacgtctg ctgtcagata aagtctcccg tgaactttac ccggtggtgc atatcgggga 180
tgaaagctgg cgcatgatga ccaccgatat ggccagtgtg ccggtctccg ttatcgggga 240
agaagtggct gatctcagcc accgcgaaaa tgacatcaaa aacgccatta acctgatgtt 300
ctggggaata taaccataca t 321
<210> 9
<211> 305
<212> DNA
<213> 人工
<220>
<223> T桥联互补序列
<400> 9
tgtatggtta tattccccag aacatcaggt taatggcgtt tttgatgtca ttttcgcggt 60
ggctgagatc agccacttct tccccgataa cggagaccgg cacactggcc atatcggtgg 120
tcatcatgcg ccagctttca tccccgatat gcaccaccgg gtaaagttca cgggagactt 180
tatctgacag cagacgtgca ctggccaggg ggatcaccat ccgtcgcccg ggcgtgtcaa 240
taatatcact ctgtacatcc acaaacagac gataacggct ctctctttta taggtgtaaa 300
ccttaaactg catccataca t 321
<210> 10
<211> 24
<212> DNA
<213> 人工
<220>
<223> IGHV1
<400> 10
cctcagtgaa ggtctcctgc aagg 24
<210> 11
<211> 24
<212> DNA
<213> 人工
<220>
<223> IGHV2
<400> 11
tcctgcgctg gtgaaaccca caca 24
<210> 12
<211> 23
<212> DNA
<213> 人工
<220>
<223> IGHV3
<400> 12
ggtccctgag actctcctgt gca 23
<210> 13
<211> 24
<212> DNA
<213> 人工
<220>
<223> IGHV4
<400> 13
tcggagaccc tgtccctcac ctgc 24
<210> 14
<211> 21
<212> DNA
<213> 人工
<220>
<223> IGHV5
<400> 14
cagtctggag cagaggtgaa a 21
<210> 15
<211> 24
<212> DNA
<213> 人工
<220>
<223> IGHV6
<400> 15
cctgtgccat ctccggggac agtg 24
<210> 16
<211> 20
<212> DNA
<213> 人工
<220>
<223> CHA
<400> 16
ggctcctggg ggaagaagcc 20
<210> 17
<211> 20
<212> DNA
<213> 人工
<220>
<223> CHG
<400> 17
gagttccacg acaccgtcac 20
<210> 18
<211> 20
<212> DNA
<213> 人工
<220>
<223> CHM
<400> 18
ggggaattct cacaggagac 20
<210> 19
<211> 24
<212> DNA
<213> 人工
<220>
<223> IGHJ
<400> 19
acctgaggag acggtgacca gggt 24
<210> 20
<211> 25
<212> DNA
<213> 人工
<220>
<223> 桥联特异性引物
<400> 20
cagtttaagg tttacaccta taaaa 25
<210> 21
<211> 16
<212> DNA
<213> 人工
<220>
<223> IGK-引物
<400> 21
gcgttatcca ccttcc 16
<210> 22
<211> 23
<212> DNA
<213> 人工
<220>
<223> IGK恒定区的特异性引物
<400> 22
gaactgtggc tgcaccatct gtc 23
<210> 23
<211> 20
<212> DNA
<213> 人工
<220>
<223> TRB_C_5P
<400> 23
cacgtggtcg gggwagaagc 20
<210> 24
<211> 20
<212> DNA
<213> 人工
<220>
<223> TRA_C_5P
<400> 24
agctggtaca cggcagggtc 20
<210> 25
<211> 20
<212> DNA
<213> 人工
<220>
<223> IGH_lgG_C_5P
<400> 25
gagttccacg acaccgtcac 20
<210> 26
<211> 20
<212> DNA
<213> 人工
<220>
<223> IGH_lgA_C_5P
<400> 26
ggctcctggg ggaagaagcc 20
<210> 27
<211> 18
<212> DNA
<213> 人工
<220>
<223> IGH_lgE_C_5P
<400> 27
tagcccgtgg ccaggcag 18
<210> 28
<211> 20
<212> DNA
<213> 人工
<220>
<223> IGH_lgD_C_5P
<400> 28
cccagttatc aagcatgcca 20
<210> 29
<211> 20
<212> DNA
<213> 人工
<220>
<223> IGH_lgM_C_5P
<400> 29
ggggaattct cacaggagac 20
<210> 30
<211> 16
<212> DNA
<213> 人工
<220>
<223> IGL_C_5P
<400> 30
gctcccgggt agaagt 16
<210> 31
<211> 23
<212> DNA
<213> 人工
<220>
<223> TCRB_RCA1
<400> 31
aggacctgaa maacgtgttc cca 23
<210> 32
<211> 24
<212> DNA
<213> 人工
<220>
<223> TCRA_RCA1
<400> 32
atatccagaa ccctgaccct gccg 24
<210> 33
<211> 23
<212> DNA
<213> 人工
<220>
<223> IGHC_lgG_RCA1
<400> 33
cytccaccaa gggcccatcg gtc 23
<210> 34
<211> 23
<212> DNA
<213> 人工
<220>
<223> IGHC_lgA_RCA1
<400> 34
catccccgac cagccccaag gtc 23
<210> 35
<211> 23
<212> DNA
<213> 人工
<220>
<223> IGHC_lgE_RCA1
<400> 35
cctccacaca gagcccatcc gtc 23
<210> 36
<211> 23
<212> DNA
<213> 人工
<220>
<223> IGHC_lgD_RCA1
<400> 36
cacccaccaa ggctccggat gtg 23
<210> 37
<211> 18
<212> DNA
<213> 人工
<220>
<223> IGHC_lgM_RCA1
<400> 37
ggagtgcatc cgccccaa 18
<210> 38
<211> 22
<212> DNA
<213> 人工
<220>
<223> IGLC_RCA1
<400> 38
cactctgttc ccrccctcct ct 22
<210> 39
<211> 24
<212> DNA
<213> 人工
<220>
<223> IGLC4_RCA1
<400> 39
acaaggccac actggtgtgt ctca 24

Claims (23)

1.一种用于单分子测序的测序文库的构建方法,其包括:
提供待测序分子的闭合环状的双链DNA分子、cDNA分子或RNA分子形式;
利用特异于所述闭合环状的双链DNA分子、cDNA分子或RNA分子的引物,进行滚环扩增,从而每个环仅扩增得到一条含多拷贝的单链DNA产物作为第一链;
以第一链为模版,产生互补的第二链,从而获得双链DNA产物,作为用于单分子测序的测序文库;
其中滚环扩增所使用的特异性引物选自为SEQ ID NO:22和31-39。
2.如权利要求1所述的构建方法,其特征在于,所述闭合环状的双链DNA或cDNA分子为染色体外环状DNA,或者通过以下方法形成:
A)由平末端的双链DNA或cDNA分子通过连接酶连接成闭合环;
B)由粘性末端的双链DNA通过TA连接成闭合环。
3.如权利要求2所述的构建方法,其特征在于,所述连接酶选自T4 DNA连接酶、T4 RNA连接酶。
4.如权利要求2所述的构建方法,其特征在于,所述步骤B)使用3‘端带dT粘性末端的T桥联片段,或由SEQ ID NO:8和9组成的双链的T桥联片段。
5.如权利要求1或2所述的构建方法,其特征在于,所述滚环扩增使用phi29 DNA聚合酶、Bst DNA聚合酶或Klenow酶。
6.如权利要求1至3任一项所述的构建方法,其特征在于,所述cDNA由白细胞的总RNA逆转录而获得,其中滚环扩增所使用的特异性引物为SEQID NO:22和31-39。
7.如权利要求1至3任一项所述的构建方法,其特征在于,在提供闭合环状的双链DNA或cDNA分子形式之前,将逆转录所得的cDNA的3’端连接序列为SEQ ID NO:6的单链DNA接头,并使用SEQ ID NO:7、21、23-30的引物进行多重扩增。
8.如权利要求1至3任一项所述的构建方法,其特征在于,所述双链DNA通过使用T桥联片段成环时,所述特异性引物为SEQ ID NO:20。
9.如权利要求5所述的构建方法,其特征在于,在所述滚环扩增使用phi29 DNA聚合酶,且所述特异性引物不存在末端修饰。
10.如权利要求1至4任一项所述的构建方法,其特征在于,第一链的互补性第二链通过以下方法产生:
使用末端转移酶在第一链的3'端产生poly-A序列;
使用与第一链的poly-A序列互补的Oligo d(T)20作为引物,利用DNA聚合酶产生第二链。
11.如权利要求10所述的构建方法,其特征在于,所述DNA聚合酶是phi29 DNA聚合酶、Bst DNA聚合酶或Klenow酶。
12.如权利要求1至4任一项所述的构建方法,其特征在于,还包括将双链DNA产物连接测序接头,以获得所述测序文库。
13.如权利要求12所述的构建方法,其特征在于,利用ONT平台针对双链DNA的连接测序试剂盒连接测序接头。
14.如权利要求1所述的构建方法,其特征在于,其中所述测序文库用于单分子测序。
15.如权利要求14所述的构建方法,其特征在于,所述单分子测序选自ONT平台测序或者PacBio平台测序。
16.一种测序方法,其特征在于,其包括:
利用权利要求1-15任一项的构建方法,获得测序文库;
利用单分子测序方法对所述文库进行测序。
17.如权利要求1-15任一项所述的构建方法或权利要求16所述的测序方法,其特征在于,用于免疫组库测序、扩增子测序、染色体外环状DNA测序、环状RNA测序。
18.用于单分子测序的测序文库构建的试剂盒,其特征在于,其包括:
1)用于滚环扩增的特异性引物;和
2)滚环扩增用酶;和
3)3’端带dT粘性末端的T桥联片段;和/或
4)5’端r APP修饰且3’端NH2封闭修饰的接头;
其中所述滚环扩增的特异性引物选自为SEQ ID NO:22和31-39。
19.如权利要求18所述的试剂盒,其特征在于,所述滚环扩增用酶选自phi29 DNA聚合酶、Bst DNA聚合酶或Klenow酶。
20.如权利要求18所述的试剂盒,其特征在于,所述T桥联片段由序列SEQ ID NO:8和9组成的双链DNA和针对其的特异性引物序列SEQ ID NO:20。
21.如权利要求18所述的试剂盒,其特征在于,其还包括DNA或RNA连接酶。
22.如权利要求21所述的试剂盒,其特征在于,所述连接酶选自T4 DNA或RNA连接酶。
23.如权利要求18或21所述的试剂盒,其还包括:
dATP和Oligod(T)20;和/或
用于免疫组库cDNA多重引物PCR扩增的特异性引物SEQ ID NO:7、21、23-30。
CN202110996788.6A 2021-08-27 2021-08-27 基于滚环扩增的测序文库构建方法及其应用 Active CN113667716B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110996788.6A CN113667716B (zh) 2021-08-27 2021-08-27 基于滚环扩增的测序文库构建方法及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110996788.6A CN113667716B (zh) 2021-08-27 2021-08-27 基于滚环扩增的测序文库构建方法及其应用

Publications (2)

Publication Number Publication Date
CN113667716A CN113667716A (zh) 2021-11-19
CN113667716B true CN113667716B (zh) 2023-12-15

Family

ID=78547025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110996788.6A Active CN113667716B (zh) 2021-08-27 2021-08-27 基于滚环扩增的测序文库构建方法及其应用

Country Status (1)

Country Link
CN (1) CN113667716B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001038572A1 (fr) * 1999-11-19 2001-05-31 Takara Bio Inc. Methode d'amplification d'acides nucleiques
CN106399348A (zh) * 2016-10-26 2017-02-15 南京师范大学 一种新型基因克隆t‑载体及其构建方法和应用
CN110734958A (zh) * 2019-10-13 2020-01-31 湖南大地同年生物科技有限公司 一种单分子标签免疫组库高通量测序文库构建方法
WO2020113460A1 (zh) * 2018-12-05 2020-06-11 深圳华大智造极创科技有限公司 滚环扩增方法、测序文库制备方法及制得的dna纳米球
WO2021050717A1 (en) * 2019-09-10 2021-03-18 The Regents Of The University Of California Immune cell sequencing methods
WO2021051378A1 (zh) * 2019-09-20 2021-03-25 武汉华大医学检验所有限公司 测序文库的构建方法、测序方法及试剂盒和应用
CN112739829A (zh) * 2018-09-27 2021-04-30 深圳华大生命科学研究院 测序文库的构建方法和得到的测序文库及测序方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001038572A1 (fr) * 1999-11-19 2001-05-31 Takara Bio Inc. Methode d'amplification d'acides nucleiques
CN106399348A (zh) * 2016-10-26 2017-02-15 南京师范大学 一种新型基因克隆t‑载体及其构建方法和应用
CN112739829A (zh) * 2018-09-27 2021-04-30 深圳华大生命科学研究院 测序文库的构建方法和得到的测序文库及测序方法
WO2020113460A1 (zh) * 2018-12-05 2020-06-11 深圳华大智造极创科技有限公司 滚环扩增方法、测序文库制备方法及制得的dna纳米球
WO2021050717A1 (en) * 2019-09-10 2021-03-18 The Regents Of The University Of California Immune cell sequencing methods
WO2021051378A1 (zh) * 2019-09-20 2021-03-25 武汉华大医学检验所有限公司 测序文库的构建方法、测序方法及试剂盒和应用
CN110734958A (zh) * 2019-10-13 2020-01-31 湖南大地同年生物科技有限公司 一种单分子标签免疫组库高通量测序文库构建方法

Also Published As

Publication number Publication date
CN113667716A (zh) 2021-11-19

Similar Documents

Publication Publication Date Title
US20200354773A1 (en) High multiplex pcr with molecular barcoding
DK3192877T3 (en) VESICULAR ADAPTERS AND APPLICATIONS THEREOF IN NUCLEIC ACID LIBRARY CONSTRUCTION AND SEQUENCE
EP3485033B1 (en) Single end duplex dna sequencing
US20150284797A1 (en) Method and substances for isolating mirnas
CN109844137B (zh) 用于鉴定嵌合产物的条形码化环状文库构建
JP2016507246A (ja) 混合物中の核酸を配列決定する方法およびそれに関する組成物
WO2016187583A1 (en) Methods for generating circular dna from circular rna
WO2017054302A1 (zh) 测序文库及其制备和应用
CN111154845A (zh) 借助于茎环反向多核苷酸的直接rna纳米孔测序
US20220333186A1 (en) Method and system for targeted nucleic acid sequencing
CN102732629A (zh) 利用高通量测序同时测定基因表达量和多聚腺苷酸加尾的方法
CN111801427B (zh) 用于单分子的单链环状dna模板的产生
US20240191295A1 (en) Methods of enriching targeted nucleic acid, identifying off-target and evaluating gene editing efficiency
CN108359723B (zh) 一种降低深度测序错误的方法
CN113667716B (zh) 基于滚环扩增的测序文库构建方法及其应用
US9879318B2 (en) Methods and compositions for nucleic acid sample preparation
CN117242190A (zh) 单链dna的扩增
KR20220164753A (ko) 플로팅 바코드
CN114774522A (zh) 一种高保真测序文库构建的方法、试剂盒及应用
WO2023137292A1 (en) Methods and compositions for transcriptome analysis
JP2023553983A (ja) 二重鎖シーケンシングのための方法
US20240067959A1 (en) Library preparation from fixed samples
CN111074354A (zh) 一种低丰度dna突变测序文库的构建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant