CN113355390A - 可区分dna和rna来源的共建库方法 - Google Patents

可区分dna和rna来源的共建库方法 Download PDF

Info

Publication number
CN113355390A
CN113355390A CN202110626541.5A CN202110626541A CN113355390A CN 113355390 A CN113355390 A CN 113355390A CN 202110626541 A CN202110626541 A CN 202110626541A CN 113355390 A CN113355390 A CN 113355390A
Authority
CN
China
Prior art keywords
dna
rna
library
data
sources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110626541.5A
Other languages
English (en)
Inventor
江翱
陈晶晶
刘娜
秦雪梅
罗秉轮
卢瑶
王嫚
曹振
宋东亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yisheng Biotechnology Shanghai Co ltd
Original Assignee
Yisheng Biotechnology Shanghai Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yisheng Biotechnology Shanghai Co ltd filed Critical Yisheng Biotechnology Shanghai Co ltd
Priority to CN202110626541.5A priority Critical patent/CN113355390A/zh
Publication of CN113355390A publication Critical patent/CN113355390A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供一种可区分DNA和RNA来源的共建库方法,其特征在于:在建库过程中,先将DNA和RNA片段化,在RNA末端加上polyA,在逆转录过程中,在转录的cDNA另一末端加上Poly(dC),并在cDNA两端分别添加p5和p7接头,然后在DNA两端添加p5和p7接头,DNA和cDNA进行文库扩增及测序。本发明中,RNA来源的cDNA片段的两端会带有一段固定的核苷酸序列,用以区分测序数据的来源,因此不需要对样本中的DNA和RNA进行单独建库和测序,可有效降低NGS检测的成本。

Description

可区分DNA和RNA来源的共建库方法
技术领域
本发明专利涉及一种可区分DNA和RNA来源的共建库方法,属于生物技术领域。
背景技术
高通量测序技术(High-throughput sequencing)又称“下一代”测序技术("Next-generation"sequencing technology,NGS),是一种大规模并行测序技术,能够同时对几十万到几百万条DNA分子进行序列测定,具有通量大、偏好性小、信息齐全等特点。因此,NGS检测成为疾病诊断和科学研究的重要工具。在疾病诊断过程中,NGS检测主要分为DNA检测和RNA检测两大方面。DNA NGS检测主要用于分析单核苷酸变异(Single nucleotidevariants,SNVs)、插入或缺失突变(Insertions and Deletions InDels)、基因拷贝数变异(Copy number variants,CNVs)、肿瘤突变阈值(Tumor mutational burden score,TMB)、微卫星不稳定位点(Microsatellite instability loci,MSI)和DNA甲基化(DNAmethylation)等。RNA NGS检测主要用于分析基因融合(Gene fusions)、基因表达水平(Gene expression level)、RNA加工(RNA processing)和RNA修饰(RNA modification)等。综合利用DNA和RNA NGS检测,为临床疾病的诊断提供了重要的依据。
文库构建是指将DNA或RNA样本转化成适合于测序平台的DNA模板的过程,是影响NGS检测成功率的关键步骤。随着近年来NGS检测的发展和普及,各类文库构建的方法不断地优化和更新,极大地降低了文库构建的难度和成本。但是,对于要同时做DNA和RNA建库的病理学样本,分开建库不仅会增大建库失败的可能性,也提高了建库和测序的成本。因此,一种可用于DNA和RNA共建库的技术,对于病理学诊断,具有重要的意义。
目前已有的DNA和RNA共建库方法主要原理都是把RNA反转录成DNA,再共同进行DNA建库。这种方法无法区分测序的结果是来源于DNA还是来源于RNA,因此具有很大的应用局限性。尤其是针对肿瘤检测领域而言,逆转录酶的低保真性会额外引入基因突变,为肿瘤进程的鉴定带来了很多假阳性的干扰,目前的DNA和RNA共建库测序技术无法应用在肿瘤诊断上。因为目前的DNA和RNA共建库方法无法区分测序信息的具体来源,因此在未知病原鉴定领域上只能通过生物信息学的遗传进化分析和进一步实验验证来确定未知病原是DNA病原还是RNA病原,这增大了未知病原检测的难度。因此,一种可区分DNA和RNA来源的共建库方法,对于疾病诊断领域是迫切需要的。
发明内容
本发明的目的是提供一种可区分DNA和RNA来源的共建库方法,在RNA来源的cDNA片段的两端各带上一段固定的核苷酸序列,用以区分测序数据的来源。
一种可区分DNA和RNA来源的共建库方法,其特征在于:在建库过程中,先将DNA和RNA片段化,在RNA末端加上polyA,在逆转录过程中,在转录的cDNA另一末端加上Poly(dC),并在cDNA两端分别添加p5和p7接头,然后在DNA两端添加p5和p7接头,DNA和cDNA进行文库扩增及测序。
根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:其步骤包括:
(1)提取样本中的DNA和RNA,将DNA和RNA片段化;
(2)对片段化的DNA和RNA末端进行修复,保证DNA和RNA的5’端是磷酸基团,3’端是羟基基团,同时将RNA多聚腺苷酸化,在RNA一端加上polyA;
(3)使用M-MLV逆转录酶进行RNA逆转录和模板转换,反应体系中加入逆转录引物和接纳模板DNA oligo,其中逆转录引物为Poly(dT)VN引物,在逆转录引物的5’端带有P5序列,所述接纳模板DNA oligo的3’端带有2个以上的G,5’端带有P7序列;
(4)在DNA片段两端加上p5和p7接头;
(5)文库扩增和测序。
优选的,步骤(3)中Poly(dT)VN引物的序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT~TVN,其中Poly(dT)的数量为20~23。优选的,步骤(3)中接纳模板DNA oligo的序列为:TTTTTT/C12Spacer/GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGGGGGrGrGrG。
优选的,步骤(3)中还加入阻碍rRNA进行逆转录的探针,该探针可参考CN202110257924.X记载的方法进行设计。
优选的,步骤(1)中片段化的方法是先加入核酸酶处理,再加入金属离子高温处理。
优选的,步骤(2)中末端修复使用的是T4 PNK激酶,RNA多聚腺苷酸化使用的是Ecoli poly(A)polymerase。
优选的,步骤(4)中为平末端连接,连接反应分为两轮进行,第一轮为P7接头连接,第二轮为P5接头连接,连接在磁珠上进行。
优选的,第一轮P7接头连接采用T4 DNA连接酶突变体K159L,使用的接头为5’端预腺苷酰化的双链DNA接头。
优选的,第二轮P5接头连接使用的连接酶为Taq DNA连接酶、T4 DNA连接酶和Ecoli DNA连接酶中的一种或多种组合物,使用的接头为含P5序列的单链DNA接头。
本发明的建库方法命名为:DDRC-seq(Differentiable DNA/RNA Co-sequencing),仅需4个小时即可完成,具有以下几大优点:
1.RNA来源的cDNA片段的两端会带有一段固定的核苷酸序列,用以区分测序数据的来源。不需要对样本中的DNA和RNA进行单独建库和测序,降低了NGS检测的成本。
2.DDRC-seq在RNA文库构建过程中结合之前发明的逆转录阻碍探针法(202110257924.X)能够有效地去除rRNA,从而显著提高了DDRC-seq测序数据中RNA来源数据的利用率。
3.DDRC-seq在RNA逆转录过程使用模板转换(template switch)的方法,提高了文库构建的效率,并有效降低了RNA文库的自连。
4.在DNA文库构建上,使用了T4 DNA连接酶突变体K159L和预腺苷酰化的DNA接头,这不仅提高了DNA接头与DNA底物的连接效率,而且显著降低了DNA底物的自连率。这些能够有效改善测序数据的质量,降低假阳性的基因融合和基因突变事件,提高NGS检测的准确性和效率。
因此,DDRC-seq是一种高效准确且低成本的DNA和RNA共建库测序方法,适用于各类病理学样本和科学研究样本的NGS检测,尤其是珍贵的肿瘤病理样本。
附图说明
图1 DDRC-seq操作流程。
图2 DDRC-seq建库原理示意图。
图3 DDRC-seq用于DNA建库示意图。
图4 DDRC-seq用于不同投入量小牛gDNA建库文库大小分布。
图5 DDRC-seq用于不同投入量小牛gDNA建库文库产量。
图6 DDRC-seq用于不同投入量小牛gDNA建库测序数据在小牛基因组上的比对率。
图7 DDRC-seq用于不同投入量小牛gDNA建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比。
图8 DDRC-seq用于不同投入量小牛gDNA建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据在小牛基因组上的比对率。
图9 DDRC-seq用于RNA建库示意图。
图10 DDRC-seq用于不同投入量人类RNA建库文库大小分布。
图11 DDRC-seq用于不同投入量人类RNA建库文库产量。
图12 DDRC-seq用于不同投入量人类RNA建库测序数据在人类转录组上的比对率。
图13 DDRC-seq用于不同投入量人类RNA建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比。
图14 DDRC-seq用于不同投入量人类RNA建库测序数据中比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比。
图15 DDRC-seq用于不同投入量人类RNA建库测序数据中不能比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比。
图16 DDRC-seq用于不同投入量人类RNA建库测序数据中核糖体RNA来源数据的占比。
图17 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库文库大小分布。
图18 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库文库产量。
图19 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中DNA结构数据和RNA结构(G7-11NN…NNA18-25)数据的占比。
图20 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中具有共建库DNA结构数据的比对率。
图21 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)数据的比对率。
图22 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)数据的核糖体RNA数据占比。
图23 DDRC-seq对细胞DNA&RNA共建库文库大小分布。
图24 DDRC-seq对细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据占比。
图25 DDRC-seq对细胞DNA&RNA共建库文库测序数据中DNA来源数据点突变分析。
图26 DDRC-seq对细胞DNA&RNA共建库文库测序数据中DNA来源数据Indel突变分析。
图27 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中RNA来源数据基因检出数分析。
图28 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中RNA来源数据基因表达差异分析。
图29 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中RNA来源数据RNA可变剪接分析。
图30 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据点突变共分析。
图31 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据Indel突变共分析。
图32 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据基因融合共分析。
图33三种来源数据检测UV照射后基因点突变性能比较。
图34三种来源数据检测UV照射后基因插入缺失突变性能比较。
图35三种来源数据检测UV照射后基因融合性能比较。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
本实施例所使用的探针和引物序列及修饰如表1所示,N为随机碱基,即A、T、C、G中任意一种碱基。
表1探针及引物序列
Figure BDA0003101431260000051
实施例1:DDRC-seq流程的建立
在本实施例中,我们组建了DDRC-seq的流程,流程示意图见图1和图2。具体方式如下:
1)DNA和RNA片段化:
表2
组分 用量
DNA &RNA 100ng
片段化缓冲液 4μL
DSN(Evrogen) 2μL
Total 17μL
片段化缓冲液:200mM Tris-HCl,300mM KCl,20mM MgCl2,pH 8.3。
37℃反应20min,85℃反应15min,4℃保存。
2)RNA末端修复、多聚腺苷酸化
表3
组分 用量
上述反应体系 17μL
T4 PNK(Yeasen,12902) 1μL
E.coli Poly(A)Polymerase(NEB,M0276S) 2μL
Total 20μL
37℃反应30min。
3)rRNA去除、逆转录和模板转换
表4
组分 用量
上述反应体系 20μL
逆转录反应缓冲液 25μL
10μM Poly(dT)VN引物 1μL
4μM 5.8S/18S/28S rRNA probe mix(202110257924.X) 1μL
Total 50μL
逆转录反应缓冲液:50mM Tris-HCl,100mM KCl,pH 8.3。
80℃1min,55℃2min,保存于4℃。
表4
组分 用量
上述反应体系 50μL
100mM DTT/30mM MgCl<sub>2</sub> 3μL
SUPERaseIn RNase抑制剂(ThermoFisher,AM2694) 2μL
接纳模板DNA oligo(30μM) 1μL
SuperScript II逆转录酶(ThermoFisher,18064071) 4μL
Total 60μL
42℃15min,50℃15min,70℃15min,保存于4℃。
反应结束后,加入150μL Agencourt AMPure XP beads(Beckman,A63881)混匀后,室温静置孵育10min。将PCR管置于磁力架上,待溶液澄清后,吸去上清,加入200μL新鲜配制的80%乙醇静置30s,吸干净乙醇,室温静置3min。
4)DNA接头连接及回收
使用xGen Prism DNA Library Prep Kit(IDT,10006202)进行DNA接头连接,流程如下:
表5
组分 用量
上述反应体系磁珠
Ligation 1 buffer 25μL
Ligation 1 Adaptor 2μL
Ligation 1 Enzyme 3μL
Total 30μL
吹打重悬磁珠后,20℃15min,65℃15min,保存于4℃。
表6
组分 用量
上述反应体系 30μL
Ligation 2 buffer 4.5μL
Ligation 2 Adaptor 4μL
Ligation 2 Enzyme A 0.5μL
Ligation 2 Enzyme B 1μL
Total 40μL
65℃30min,保存于4℃。
加入100μL PEG/NaCl,吹打混匀。室温静置10min后,将PCR管置于磁力架上,待溶液澄清后,吸去上清,加入200μL新鲜配制的80%乙醇静置30s,吸干净乙醇,室温静置3min。加入21μL EB buffer悬浮磁珠,室温静置5min。将将PCR管置于磁力架上,待溶液澄清后,吸取20μL上清。
5)文库扩增
使用xGen Prism DNA Library Prep Kit(IDT,10006202)进行文库扩增,流程如下:
表7
组分 用量
上述回收DNA 20μL
xGen UDI Primer Pairs 5μL
HiFi HotStart ReadyMix 25μL
Total 50μL
吹打重悬磁珠后,按照下述程序进行文库扩增:
表8
Figure BDA0003101431260000071
Figure BDA0003101431260000081
65℃30min,保存于4℃。
反应结束后,加入150μL Agencourt AMPure XP beads(Beckman,A63881)混匀后,室温静置孵育10min。将PCR管置于磁力架上,待溶液澄清后,吸去上清。加入200μL新鲜配制的80%乙醇静置30s,吸去上清。加入200μL新鲜配制的80%乙醇静置30s,吸干净乙醇,室温静置3min。加入21μL ddH2O悬浮磁珠,室温静置5min。将将PCR管置于磁力架上,待溶液澄清后,吸取20μL上清。Qubit测量回收文库浓度,Qsep测量回收文库片段大小。文库在NovaSeq6000平台进行测序。获得的测序结果使用cutadaptor去掉接头后,先按照图2文库示意图分DNA来源的文库和RNA来源的文库(数据结构为G7-11NN…NNA18-25),然后将DNA数据比对到基因组上,RNA数据比对到转录组上。
实施例2:DDRC-seq对不同DNA投入量的建库效果
在本实施例中,我们验证了DDRC-seq在小牛胸腺0.1ng-100ng gDNA投入量条件下的建库效果,实验流程见实施例1,流程示意图见图3,PCR循环数和文库产量见表9,文库大小分布见图4,测序结果分析见图5-7。
表9
Figure BDA0003101431260000082
结果如表9和图4-5所示,DDRC-seq对0.01-100ng小牛gDNA投入量均具有很好的建库产量和文库大小。如图6和图7,在DNA测序数据中,100ng DNA投入量的文库测序数据的小牛基因组比对率达到99.64%,其中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比只有0.007%;0.01ng DNA投入量的文库测序数据的比对率达到95.79%,其中具有DDRC-seq共建库RNA结构(G7-11NN…NNA18-25)的数据占比只有4.371%。测序结果中具有共建库RNA结构(G7-11NN…NNA18-25)的数据在小牛基因组上的比对率低于5%(如图8),说明这些测序数据不是来源于投入的小牛gDNA模板,可能是来自于实验过程中的其他RNA污染。这些结果说明DDRC-seq中来自DNA的数据可以与共建库RNA结构(G7-11NN…NNA18-25)有效的区分开来。
实施例3:DDRC-seq对不同RNA投入量的建库效果
在本实施例中,我们验证了DDRC-seq在HEK293F 0.1ng-1000ng RNA投入量条件下的建库效果,实验流程同实施例1,示意图见图9,PCR循环数和文库产量见表10,文库大小分布见图10,测序结果分析见图11-16。
表10
Figure BDA0003101431260000091
结果如表10和图10-11所示,DDRC-seq对0.1-1000ng人类RNA投入量均具有很好的建库产量和文库大小。如图11-图15,在DNA测序数据中,1000ng RNA投入量的文库测序数据的人类转录组比对率达到99.34%,其中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比达到99.32%,比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比达到99.96%,不能比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比仅有1.43%;0.1ng RNA投入量的文库测序数据的人类转录组比对率达到93.09%,其中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比达到92.23%,比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比达到98.87%,不能比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比仅有1.35%。其他具有(G7-11NN…NNA18-25)结构的数据可能来源于外来RNA污染,具有(G7-11NN…NNA18-25)结构的数据可能来源于外来DNA污染。这些结果说明经DDRC-seq流程的RNA建库方法,来源于RNA的数据中具有(G7-11NN…NNA18-25)结构的数据可达到99.96%以上。因此,DDRC-seq方法可以根据(G7-11NN…NNA18-25)结构来有效区分测序数据中RNA来源的数据。
此外,DDRC-seq可以有效去除RNA建库过程中的核糖体RNA(如图16),从而显著提高RNA数据的利用率。
实施例4:DDRC-seq对不同DNA和RNA混合物投入量的建库效果
在本实施例中,我们验证了DDRC-seq对0.1ng-1000ng投入量DNA和RNA混合物的建库效果,实验流程见实施例1,流程示意图见图2。
DNA&RNA混合物的制备:取5μg小牛胸腺gDNA,加入50μg人类RNA,混匀后备用。按照实施例1进行DNA和RNA共建库,PCR循环数和文库产量见表11,文库大小分布见图17,测序结果分析见图17-图22。
表11
DNA和RNA投入量/ng 循环数 文库产量/ng
1000 5 476
100 9 524
10 12 431
1 16 545
0.1 20 413
结果如表11和图17-18所示,DDRC-seq对0.1-1000ng小牛gDNA&人类RNA投入量均具有很好的建库产量和文库大小。如图19-21,DDRC-seq可以有效检查DNA&RNA混合物中的DNA和RNA来源数据,且DNA和RNA来源的数据均具有极高的来源特异性。当DNA&RNA投入量为1000ng时,DNA来源结构的数据比对到小牛基因组上的数据占达99.52%,比对到人类转录组上的数据仅有0.06%;RNA来源结构的数据比对到人类转录组上的数据占达99.12%,比对到小牛基因组上的数据仅有0.13%。当DNA&RNA投入量为0.1ng时,DNA来源结构的数据比对到小牛基因组上的数据占达94.26%,比对到人类转录组上的数据仅有0.05%;RNA来源结构的数据比对到人类转录组上的数据占达94.09%,比对到小牛基因组上的数据仅有0.16%。这说明DDRC-seq能够准确有效的区分DNA&RNA共建库中来源于DNA和RNA的测序数据,实现DNA和RNA的共分析。
此外,DDRC-seq可以有效去除DNA&RNA共建库过程中的核糖体RNA(如图22),从而显著提高RNA数据的利用率。
实施例5:DDRC-seq验证UV照射对细胞DNA和RNA的影响
在本实施例中,我们验证了DDRC-seq对UV照射对细胞DNA和RNA的影响。具体实施方式如下:
UV处理:HEK293F细胞培养到70%细胞密度时,在50J/m2条件下处理细胞,处理后的细胞继续避光培养2天后,收集备用。
DNA&RNA共提取:利用天根生物的DNA/RNA共提取试剂盒(DP422)对HEK293F细胞进行DNA和RNA共提取。
DDRC-seq:提取好的细胞DNA和RNA按照实施例1流程进行DNA和RNA共建库。
结果如图23和图24所示,DDRC-seq能够对细胞中提取的DNA&RNA能够进行有效的共建库,其中RNA的数据占比约在20-25%左右。我们利用DDRC-seq中DNA来源的数据分析了UV照射对基因突变的影响(图25和图26),利用DDRC-seq中RNA来源的数据分析了UV照射对基因检出数、基因表达差异、RNA可变剪接分析(图27-图29)。同时,我们利用RNA来源的数据验证了DNA来源数据中检测到的SNV、Indel突变和基因融合事件,提高了SNV、Indel突变和基因融合事件检测的准确性(图30-图35)。

Claims (10)

1.一种可区分DNA和RNA来源的共建库方法,其特征在于:在建库过程中,先将DNA和RNA片段化,在RNA末端加上polyA,在逆转录过程中,在转录的cDNA另一末端加上Poly(dC),并在cDNA两端分别添加p5和p7接头,然后在DNA两端添加p5和p7接头,对DNA和cDNA进行文库扩增及测序。
2.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:其步骤包括:
(1)提取样本中的DNA和RNA,将DNA和RNA片段化;
(2)对片段化的DNA和RNA末端进行修复,同时将RNA多聚腺苷酸化,在RNA一端加上polyA;
(3)使用M-MLV逆转录酶进行RNA逆转录和模板转换,反应体系中加入逆转录引物和接纳模板DNA oligo,其中逆转录引物为Poly(dT)VN引物,在逆转录引物的5’端带有P5序列,所述接纳模板DNA oligo的3’端带有2个以上的G,5’端带有P7序列;
(4)在DNA片段两端加上p5和p7接头;
(5)文库扩增和测序。
3.根据权利要求2所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(3)中Poly(dT)VN引物的序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT~TVN,其中Poly(dT)的数量为20~23。
4.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(3)中接纳模板DNA oligo的序列为:TTTTTT/C12 Spacer/GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGGGGGrGrGrG。
5.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(3)中还加入阻碍rRNA进行逆转录的探针。
6.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(1)中对DNA和RNA片段化,使得处理后的DNA和RNA的长度在200-500bp。。
7.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(2)中末端修复使用的是T4 PNK激酶,RNA多聚腺苷酸化使用的是Ecoli poly(A)polymerase。
8.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(4)中为平末端连接,连接反应分为两轮进行,第一轮为P7接头连接,第二轮为P5接头连接,连接在磁珠上进行。
9.根据权利要求8所述的可区分DNA和RNA来源的共建库方法,其特征在于:第一轮P7接头连接采用T4 DNA连接酶突变体K159L,使用的接头为5’端预腺苷酰化的双链DNA接头。
10.根据权利要求9所述的可区分DNA和RNA来源的共建库方法,其特征在于:第二轮P5接头连接使用的连接酶为Taq DNA连接酶、T4 DNA连接酶和Ecoli DNA连接酶中的一种或多种组合物,使用的接头为含P5序列的单链DNA接头。
CN202110626541.5A 2021-06-04 2021-06-04 可区分dna和rna来源的共建库方法 Pending CN113355390A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110626541.5A CN113355390A (zh) 2021-06-04 2021-06-04 可区分dna和rna来源的共建库方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110626541.5A CN113355390A (zh) 2021-06-04 2021-06-04 可区分dna和rna来源的共建库方法

Publications (1)

Publication Number Publication Date
CN113355390A true CN113355390A (zh) 2021-09-07

Family

ID=77532298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110626541.5A Pending CN113355390A (zh) 2021-06-04 2021-06-04 可区分dna和rna来源的共建库方法

Country Status (1)

Country Link
CN (1) CN113355390A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114410741A (zh) * 2021-12-31 2022-04-29 翌圣生物科技(上海)股份有限公司 简便rna建库方法
CN115747208A (zh) * 2022-11-14 2023-03-07 南京诺唯赞生物科技股份有限公司 一种dna/rna混合物的处理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150307874A1 (en) * 2013-01-09 2015-10-29 Yeda Research And Development Co. Ltd High throughput transcriptome analysis
US20180002749A1 (en) * 2016-06-30 2018-01-04 Grail, Inc. Differential tagging of rna for preparation of a cell-free dna/rna sequencing library
CN112195521A (zh) * 2020-09-11 2021-01-08 翌圣生物科技(上海)有限公司 一种基于转座酶的dna/rna共建库方法、试剂盒及应用
CN112430849A (zh) * 2020-12-16 2021-03-02 深圳易倍科华生物科技有限公司 Rna、dna共建库测序方法及建库仪器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150307874A1 (en) * 2013-01-09 2015-10-29 Yeda Research And Development Co. Ltd High throughput transcriptome analysis
US20180002749A1 (en) * 2016-06-30 2018-01-04 Grail, Inc. Differential tagging of rna for preparation of a cell-free dna/rna sequencing library
CN112195521A (zh) * 2020-09-11 2021-01-08 翌圣生物科技(上海)有限公司 一种基于转座酶的dna/rna共建库方法、试剂盒及应用
CN112430849A (zh) * 2020-12-16 2021-03-02 深圳易倍科华生物科技有限公司 Rna、dna共建库测序方法及建库仪器

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HUAJUAN SHI等: "Bias in RNA-seq Library Preparation: Current Challenges and Solutions", 《BIOMED RES INT》, vol. 2021, 19 April 2021 (2021-04-19), pages 6647597 *
STEVEN R. HEAD等: "Library construction for next-generation sequencing: Overviews and challenges", 《BIOTECHNIQUES》, vol. 56, no. 2, 6 March 2015 (2015-03-06), pages 61, XP055544232, DOI: 10.2144/000114133 *
李琳等: "新一代测序技术的文库制备方法研究进展", 《应用化学》, vol. 38, no. 01, 17 December 2020 (2020-12-17), pages 11 - 23 *
贺添艳等: "T4 DNA连接酶性质及其平端连接功能", 《河南科技》, vol. 34, no. 7, 1 August 2016 (2016-08-01), pages 1058 - 1062 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114410741A (zh) * 2021-12-31 2022-04-29 翌圣生物科技(上海)股份有限公司 简便rna建库方法
CN114410741B (zh) * 2021-12-31 2024-06-18 翌圣生物科技(上海)股份有限公司 简便rna建库方法
CN115747208A (zh) * 2022-11-14 2023-03-07 南京诺唯赞生物科技股份有限公司 一种dna/rna混合物的处理方法
CN115747208B (zh) * 2022-11-14 2023-08-29 南京诺唯赞生物科技股份有限公司 一种dna/rna混合物的处理方法

Similar Documents

Publication Publication Date Title
US11326201B2 (en) Method for removing non-target RNA from RNA sample
US8986958B2 (en) Methods for generating target specific probes for solution based capture
CN110699426B (zh) 基因目标区域富集方法及试剂盒
WO2018024082A1 (zh) 一种串联rad标签测序文库的构建方法
US20230056763A1 (en) Methods of targeted sequencing
CN109576346B (zh) 高通量测序文库的构建方法及其应用
CN113355390A (zh) 可区分dna和rna来源的共建库方法
CN108517567B (zh) 用于cfDNA建库的接头、引物组、试剂盒和建库方法
CN109023537B (zh) 一种微量dna样品高通量测序文库的构建技术
US20210198660A1 (en) Compositions and methods for making guide nucleic acids
CN106637422A (zh) 一种构建Hi‑C高通量测序文库的方法
CN112251821A (zh) 一种快速高效的构建二代测序文库的试剂盒
CN113322523B (zh) Rna快速建库方法及其应用
CN108359723B (zh) 一种降低深度测序错误的方法
CN110951827A (zh) 一种转录组测序文库快速构建方法及其应用
CN115715323A (zh) 一种高兼容性的PCR-free建库和测序方法
CN114410741B (zh) 简便rna建库方法
CN112080555A (zh) Dna甲基化检测试剂盒及检测方法
CN113564227A (zh) 基于CRISPR/dcas9的宿主与病原微生物DNA快速分离方法
CN113403309A (zh) 非同源双链寡聚核苷酸片段在基因敲除系统中的应用
CN113943729B (zh) U型接头及采用u型接头介导的磁珠偶联转座酶进行rna快速均一化建库的方法
CN111979226B (zh) 一种可批量进行体外脱靶检测及sgRNA筛选的方法
WO2021232184A1 (zh) 标签化的转座复合体及其在高通量测序中的应用
US20230122979A1 (en) Methods of sample normalization
CN113718343A (zh) 极速rna建库方法及试剂盒

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination