CN113355390A - 可区分dna和rna来源的共建库方法 - Google Patents
可区分dna和rna来源的共建库方法 Download PDFInfo
- Publication number
- CN113355390A CN113355390A CN202110626541.5A CN202110626541A CN113355390A CN 113355390 A CN113355390 A CN 113355390A CN 202110626541 A CN202110626541 A CN 202110626541A CN 113355390 A CN113355390 A CN 113355390A
- Authority
- CN
- China
- Prior art keywords
- dna
- rna
- library
- data
- sources
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 24
- 238000012163 sequencing technique Methods 0.000 claims abstract description 53
- 238000000034 method Methods 0.000 claims abstract description 39
- 238000010839 reverse transcription Methods 0.000 claims abstract description 18
- 239000002299 complementary DNA Substances 0.000 claims abstract description 13
- 230000003321 amplification Effects 0.000 claims abstract description 8
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 8
- 239000012634 fragment Substances 0.000 claims abstract description 6
- 108020004414 DNA Proteins 0.000 claims description 114
- 102000053602 DNA Human genes 0.000 claims description 92
- 238000011176 pooling Methods 0.000 claims description 35
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 239000000523 sample Substances 0.000 claims description 10
- 239000011324 bead Substances 0.000 claims description 9
- 102000012410 DNA Ligases Human genes 0.000 claims description 7
- 108010061982 DNA Ligases Proteins 0.000 claims description 7
- 230000008488 polyadenylation Effects 0.000 claims description 5
- 102100034343 Integrase Human genes 0.000 claims description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 4
- 101710124239 Poly(A) polymerase Proteins 0.000 claims description 3
- 102100035460 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 claims description 3
- 102000003960 Ligases Human genes 0.000 claims description 2
- 108090000364 Ligases Proteins 0.000 claims description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 2
- SPTYHKZRPFATHJ-HYZXJONISA-N dT6 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 SPTYHKZRPFATHJ-HYZXJONISA-N 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 18
- 239000002773 nucleotide Substances 0.000 abstract description 4
- 125000003729 nucleotide group Chemical group 0.000 abstract description 4
- 229920002477 rna polymer Polymers 0.000 description 136
- 244000309466 calf Species 0.000 description 25
- 108091092584 GDNA Proteins 0.000 description 15
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 14
- 108091092356 cellular DNA Proteins 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 238000007481 next generation sequencing Methods 0.000 description 12
- 238000009281 ultraviolet germicidal irradiation Methods 0.000 description 12
- 108090000623 proteins and genes Proteins 0.000 description 11
- 230000035772 mutation Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 239000000872 buffer Substances 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 5
- 244000052769 pathogen Species 0.000 description 5
- 230000001717 pathogenic effect Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 108020004418 ribosomal RNA Proteins 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 206010064571 Gene mutation Diseases 0.000 description 3
- 238000000658 coextraction Methods 0.000 description 3
- 238000011109 contamination Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- 238000001712 DNA sequencing Methods 0.000 description 2
- 230000026279 RNA modification Effects 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 210000001541 thymus gland Anatomy 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 1
- 208000032818 Microsatellite Instability Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012154 double-distilled water Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010827 pathological analysis Methods 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供一种可区分DNA和RNA来源的共建库方法,其特征在于:在建库过程中,先将DNA和RNA片段化,在RNA末端加上polyA,在逆转录过程中,在转录的cDNA另一末端加上Poly(dC),并在cDNA两端分别添加p5和p7接头,然后在DNA两端添加p5和p7接头,DNA和cDNA进行文库扩增及测序。本发明中,RNA来源的cDNA片段的两端会带有一段固定的核苷酸序列,用以区分测序数据的来源,因此不需要对样本中的DNA和RNA进行单独建库和测序,可有效降低NGS检测的成本。
Description
技术领域
本发明专利涉及一种可区分DNA和RNA来源的共建库方法,属于生物技术领域。
背景技术
高通量测序技术(High-throughput sequencing)又称“下一代”测序技术("Next-generation"sequencing technology,NGS),是一种大规模并行测序技术,能够同时对几十万到几百万条DNA分子进行序列测定,具有通量大、偏好性小、信息齐全等特点。因此,NGS检测成为疾病诊断和科学研究的重要工具。在疾病诊断过程中,NGS检测主要分为DNA检测和RNA检测两大方面。DNA NGS检测主要用于分析单核苷酸变异(Single nucleotidevariants,SNVs)、插入或缺失突变(Insertions and Deletions InDels)、基因拷贝数变异(Copy number variants,CNVs)、肿瘤突变阈值(Tumor mutational burden score,TMB)、微卫星不稳定位点(Microsatellite instability loci,MSI)和DNA甲基化(DNAmethylation)等。RNA NGS检测主要用于分析基因融合(Gene fusions)、基因表达水平(Gene expression level)、RNA加工(RNA processing)和RNA修饰(RNA modification)等。综合利用DNA和RNA NGS检测,为临床疾病的诊断提供了重要的依据。
文库构建是指将DNA或RNA样本转化成适合于测序平台的DNA模板的过程,是影响NGS检测成功率的关键步骤。随着近年来NGS检测的发展和普及,各类文库构建的方法不断地优化和更新,极大地降低了文库构建的难度和成本。但是,对于要同时做DNA和RNA建库的病理学样本,分开建库不仅会增大建库失败的可能性,也提高了建库和测序的成本。因此,一种可用于DNA和RNA共建库的技术,对于病理学诊断,具有重要的意义。
目前已有的DNA和RNA共建库方法主要原理都是把RNA反转录成DNA,再共同进行DNA建库。这种方法无法区分测序的结果是来源于DNA还是来源于RNA,因此具有很大的应用局限性。尤其是针对肿瘤检测领域而言,逆转录酶的低保真性会额外引入基因突变,为肿瘤进程的鉴定带来了很多假阳性的干扰,目前的DNA和RNA共建库测序技术无法应用在肿瘤诊断上。因为目前的DNA和RNA共建库方法无法区分测序信息的具体来源,因此在未知病原鉴定领域上只能通过生物信息学的遗传进化分析和进一步实验验证来确定未知病原是DNA病原还是RNA病原,这增大了未知病原检测的难度。因此,一种可区分DNA和RNA来源的共建库方法,对于疾病诊断领域是迫切需要的。
发明内容
本发明的目的是提供一种可区分DNA和RNA来源的共建库方法,在RNA来源的cDNA片段的两端各带上一段固定的核苷酸序列,用以区分测序数据的来源。
一种可区分DNA和RNA来源的共建库方法,其特征在于:在建库过程中,先将DNA和RNA片段化,在RNA末端加上polyA,在逆转录过程中,在转录的cDNA另一末端加上Poly(dC),并在cDNA两端分别添加p5和p7接头,然后在DNA两端添加p5和p7接头,DNA和cDNA进行文库扩增及测序。
根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:其步骤包括:
(1)提取样本中的DNA和RNA,将DNA和RNA片段化;
(2)对片段化的DNA和RNA末端进行修复,保证DNA和RNA的5’端是磷酸基团,3’端是羟基基团,同时将RNA多聚腺苷酸化,在RNA一端加上polyA;
(3)使用M-MLV逆转录酶进行RNA逆转录和模板转换,反应体系中加入逆转录引物和接纳模板DNA oligo,其中逆转录引物为Poly(dT)VN引物,在逆转录引物的5’端带有P5序列,所述接纳模板DNA oligo的3’端带有2个以上的G,5’端带有P7序列;
(4)在DNA片段两端加上p5和p7接头;
(5)文库扩增和测序。
优选的,步骤(3)中Poly(dT)VN引物的序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT~TVN,其中Poly(dT)的数量为20~23。优选的,步骤(3)中接纳模板DNA oligo的序列为:TTTTTT/C12Spacer/GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGGGGGrGrGrG。
优选的,步骤(3)中还加入阻碍rRNA进行逆转录的探针,该探针可参考CN202110257924.X记载的方法进行设计。
优选的,步骤(1)中片段化的方法是先加入核酸酶处理,再加入金属离子高温处理。
优选的,步骤(2)中末端修复使用的是T4 PNK激酶,RNA多聚腺苷酸化使用的是Ecoli poly(A)polymerase。
优选的,步骤(4)中为平末端连接,连接反应分为两轮进行,第一轮为P7接头连接,第二轮为P5接头连接,连接在磁珠上进行。
优选的,第一轮P7接头连接采用T4 DNA连接酶突变体K159L,使用的接头为5’端预腺苷酰化的双链DNA接头。
优选的,第二轮P5接头连接使用的连接酶为Taq DNA连接酶、T4 DNA连接酶和Ecoli DNA连接酶中的一种或多种组合物,使用的接头为含P5序列的单链DNA接头。
本发明的建库方法命名为:DDRC-seq(Differentiable DNA/RNA Co-sequencing),仅需4个小时即可完成,具有以下几大优点:
1.RNA来源的cDNA片段的两端会带有一段固定的核苷酸序列,用以区分测序数据的来源。不需要对样本中的DNA和RNA进行单独建库和测序,降低了NGS检测的成本。
2.DDRC-seq在RNA文库构建过程中结合之前发明的逆转录阻碍探针法(202110257924.X)能够有效地去除rRNA,从而显著提高了DDRC-seq测序数据中RNA来源数据的利用率。
3.DDRC-seq在RNA逆转录过程使用模板转换(template switch)的方法,提高了文库构建的效率,并有效降低了RNA文库的自连。
4.在DNA文库构建上,使用了T4 DNA连接酶突变体K159L和预腺苷酰化的DNA接头,这不仅提高了DNA接头与DNA底物的连接效率,而且显著降低了DNA底物的自连率。这些能够有效改善测序数据的质量,降低假阳性的基因融合和基因突变事件,提高NGS检测的准确性和效率。
因此,DDRC-seq是一种高效准确且低成本的DNA和RNA共建库测序方法,适用于各类病理学样本和科学研究样本的NGS检测,尤其是珍贵的肿瘤病理样本。
附图说明
图1 DDRC-seq操作流程。
图2 DDRC-seq建库原理示意图。
图3 DDRC-seq用于DNA建库示意图。
图4 DDRC-seq用于不同投入量小牛gDNA建库文库大小分布。
图5 DDRC-seq用于不同投入量小牛gDNA建库文库产量。
图6 DDRC-seq用于不同投入量小牛gDNA建库测序数据在小牛基因组上的比对率。
图7 DDRC-seq用于不同投入量小牛gDNA建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比。
图8 DDRC-seq用于不同投入量小牛gDNA建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据在小牛基因组上的比对率。
图9 DDRC-seq用于RNA建库示意图。
图10 DDRC-seq用于不同投入量人类RNA建库文库大小分布。
图11 DDRC-seq用于不同投入量人类RNA建库文库产量。
图12 DDRC-seq用于不同投入量人类RNA建库测序数据在人类转录组上的比对率。
图13 DDRC-seq用于不同投入量人类RNA建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比。
图14 DDRC-seq用于不同投入量人类RNA建库测序数据中比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比。
图15 DDRC-seq用于不同投入量人类RNA建库测序数据中不能比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比。
图16 DDRC-seq用于不同投入量人类RNA建库测序数据中核糖体RNA来源数据的占比。
图17 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库文库大小分布。
图18 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库文库产量。
图19 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中DNA结构数据和RNA结构(G7-11NN…NNA18-25)数据的占比。
图20 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中具有共建库DNA结构数据的比对率。
图21 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)数据的比对率。
图22 DDRC-seq用于不同投入量小牛gDNA和人类RNA共建库测序数据中具有共建库RNA结构(G7-11NN…NNA18-25)数据的核糖体RNA数据占比。
图23 DDRC-seq对细胞DNA&RNA共建库文库大小分布。
图24 DDRC-seq对细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据占比。
图25 DDRC-seq对细胞DNA&RNA共建库文库测序数据中DNA来源数据点突变分析。
图26 DDRC-seq对细胞DNA&RNA共建库文库测序数据中DNA来源数据Indel突变分析。
图27 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中RNA来源数据基因检出数分析。
图28 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中RNA来源数据基因表达差异分析。
图29 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中RNA来源数据RNA可变剪接分析。
图30 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据点突变共分析。
图31 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据Indel突变共分析。
图32 DDRC-seq对UV照射后细胞DNA&RNA共建库文库测序数据中DNA和RNA来源数据基因融合共分析。
图33三种来源数据检测UV照射后基因点突变性能比较。
图34三种来源数据检测UV照射后基因插入缺失突变性能比较。
图35三种来源数据检测UV照射后基因融合性能比较。
具体实施方式
下面结合附图对本发明的具体实施方式做进一步说明。
本实施例所使用的探针和引物序列及修饰如表1所示,N为随机碱基,即A、T、C、G中任意一种碱基。
表1探针及引物序列
实施例1:DDRC-seq流程的建立
在本实施例中,我们组建了DDRC-seq的流程,流程示意图见图1和图2。具体方式如下:
1)DNA和RNA片段化:
表2
组分 | 用量 |
DNA &RNA | 100ng |
片段化缓冲液 | 4μL |
DSN(Evrogen) | 2μL |
Total | 17μL |
片段化缓冲液:200mM Tris-HCl,300mM KCl,20mM MgCl2,pH 8.3。
37℃反应20min,85℃反应15min,4℃保存。
2)RNA末端修复、多聚腺苷酸化
表3
组分 | 用量 |
上述反应体系 | 17μL |
T4 PNK(Yeasen,12902) | 1μL |
E.coli Poly(A)Polymerase(NEB,M0276S) | 2μL |
Total | 20μL |
37℃反应30min。
3)rRNA去除、逆转录和模板转换
表4
组分 | 用量 |
上述反应体系 | 20μL |
逆转录反应缓冲液 | 25μL |
10μM Poly(dT)VN引物 | 1μL |
4μM 5.8S/18S/28S rRNA probe mix(202110257924.X) | 1μL |
Total | 50μL |
逆转录反应缓冲液:50mM Tris-HCl,100mM KCl,pH 8.3。
80℃1min,55℃2min,保存于4℃。
表4
组分 | 用量 |
上述反应体系 | 50μL |
100mM DTT/30mM MgCl<sub>2</sub> | 3μL |
SUPERaseIn RNase抑制剂(ThermoFisher,AM2694) | 2μL |
接纳模板DNA oligo(30μM) | 1μL |
SuperScript II逆转录酶(ThermoFisher,18064071) | 4μL |
Total | 60μL |
42℃15min,50℃15min,70℃15min,保存于4℃。
反应结束后,加入150μL Agencourt AMPure XP beads(Beckman,A63881)混匀后,室温静置孵育10min。将PCR管置于磁力架上,待溶液澄清后,吸去上清,加入200μL新鲜配制的80%乙醇静置30s,吸干净乙醇,室温静置3min。
4)DNA接头连接及回收
使用xGen Prism DNA Library Prep Kit(IDT,10006202)进行DNA接头连接,流程如下:
表5
组分 | 用量 |
上述反应体系磁珠 | |
Ligation 1 buffer | 25μL |
Ligation 1 Adaptor | 2μL |
Ligation 1 Enzyme | 3μL |
Total | 30μL |
吹打重悬磁珠后,20℃15min,65℃15min,保存于4℃。
表6
组分 | 用量 |
上述反应体系 | 30μL |
Ligation 2 buffer | 4.5μL |
Ligation 2 Adaptor | 4μL |
Ligation 2 Enzyme A | 0.5μL |
Ligation 2 Enzyme B | 1μL |
Total | 40μL |
65℃30min,保存于4℃。
加入100μL PEG/NaCl,吹打混匀。室温静置10min后,将PCR管置于磁力架上,待溶液澄清后,吸去上清,加入200μL新鲜配制的80%乙醇静置30s,吸干净乙醇,室温静置3min。加入21μL EB buffer悬浮磁珠,室温静置5min。将将PCR管置于磁力架上,待溶液澄清后,吸取20μL上清。
5)文库扩增
使用xGen Prism DNA Library Prep Kit(IDT,10006202)进行文库扩增,流程如下:
表7
组分 | 用量 |
上述回收DNA | 20μL |
xGen UDI Primer Pairs | 5μL |
HiFi HotStart ReadyMix | 25μL |
Total | 50μL |
吹打重悬磁珠后,按照下述程序进行文库扩增:
表8
65℃30min,保存于4℃。
反应结束后,加入150μL Agencourt AMPure XP beads(Beckman,A63881)混匀后,室温静置孵育10min。将PCR管置于磁力架上,待溶液澄清后,吸去上清。加入200μL新鲜配制的80%乙醇静置30s,吸去上清。加入200μL新鲜配制的80%乙醇静置30s,吸干净乙醇,室温静置3min。加入21μL ddH2O悬浮磁珠,室温静置5min。将将PCR管置于磁力架上,待溶液澄清后,吸取20μL上清。Qubit测量回收文库浓度,Qsep测量回收文库片段大小。文库在NovaSeq6000平台进行测序。获得的测序结果使用cutadaptor去掉接头后,先按照图2文库示意图分DNA来源的文库和RNA来源的文库(数据结构为G7-11NN…NNA18-25),然后将DNA数据比对到基因组上,RNA数据比对到转录组上。
实施例2:DDRC-seq对不同DNA投入量的建库效果
在本实施例中,我们验证了DDRC-seq在小牛胸腺0.1ng-100ng gDNA投入量条件下的建库效果,实验流程见实施例1,流程示意图见图3,PCR循环数和文库产量见表9,文库大小分布见图4,测序结果分析见图5-7。
表9
结果如表9和图4-5所示,DDRC-seq对0.01-100ng小牛gDNA投入量均具有很好的建库产量和文库大小。如图6和图7,在DNA测序数据中,100ng DNA投入量的文库测序数据的小牛基因组比对率达到99.64%,其中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比只有0.007%;0.01ng DNA投入量的文库测序数据的比对率达到95.79%,其中具有DDRC-seq共建库RNA结构(G7-11NN…NNA18-25)的数据占比只有4.371%。测序结果中具有共建库RNA结构(G7-11NN…NNA18-25)的数据在小牛基因组上的比对率低于5%(如图8),说明这些测序数据不是来源于投入的小牛gDNA模板,可能是来自于实验过程中的其他RNA污染。这些结果说明DDRC-seq中来自DNA的数据可以与共建库RNA结构(G7-11NN…NNA18-25)有效的区分开来。
实施例3:DDRC-seq对不同RNA投入量的建库效果
在本实施例中,我们验证了DDRC-seq在HEK293F 0.1ng-1000ng RNA投入量条件下的建库效果,实验流程同实施例1,示意图见图9,PCR循环数和文库产量见表10,文库大小分布见图10,测序结果分析见图11-16。
表10
结果如表10和图10-11所示,DDRC-seq对0.1-1000ng人类RNA投入量均具有很好的建库产量和文库大小。如图11-图15,在DNA测序数据中,1000ng RNA投入量的文库测序数据的人类转录组比对率达到99.34%,其中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比达到99.32%,比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比达到99.96%,不能比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比仅有1.43%;0.1ng RNA投入量的文库测序数据的人类转录组比对率达到93.09%,其中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比达到92.23%,比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比达到98.87%,不能比对到人类转录组上的数据中具有共建库RNA结构(G7-11NN…NNA18-25)的数据占比仅有1.35%。其他具有(G7-11NN…NNA18-25)结构的数据可能来源于外来RNA污染,具有(G7-11NN…NNA18-25)结构的数据可能来源于外来DNA污染。这些结果说明经DDRC-seq流程的RNA建库方法,来源于RNA的数据中具有(G7-11NN…NNA18-25)结构的数据可达到99.96%以上。因此,DDRC-seq方法可以根据(G7-11NN…NNA18-25)结构来有效区分测序数据中RNA来源的数据。
此外,DDRC-seq可以有效去除RNA建库过程中的核糖体RNA(如图16),从而显著提高RNA数据的利用率。
实施例4:DDRC-seq对不同DNA和RNA混合物投入量的建库效果
在本实施例中,我们验证了DDRC-seq对0.1ng-1000ng投入量DNA和RNA混合物的建库效果,实验流程见实施例1,流程示意图见图2。
DNA&RNA混合物的制备:取5μg小牛胸腺gDNA,加入50μg人类RNA,混匀后备用。按照实施例1进行DNA和RNA共建库,PCR循环数和文库产量见表11,文库大小分布见图17,测序结果分析见图17-图22。
表11
DNA和RNA投入量/ng | 循环数 | 文库产量/ng |
1000 | 5 | 476 |
100 | 9 | 524 |
10 | 12 | 431 |
1 | 16 | 545 |
0.1 | 20 | 413 |
结果如表11和图17-18所示,DDRC-seq对0.1-1000ng小牛gDNA&人类RNA投入量均具有很好的建库产量和文库大小。如图19-21,DDRC-seq可以有效检查DNA&RNA混合物中的DNA和RNA来源数据,且DNA和RNA来源的数据均具有极高的来源特异性。当DNA&RNA投入量为1000ng时,DNA来源结构的数据比对到小牛基因组上的数据占达99.52%,比对到人类转录组上的数据仅有0.06%;RNA来源结构的数据比对到人类转录组上的数据占达99.12%,比对到小牛基因组上的数据仅有0.13%。当DNA&RNA投入量为0.1ng时,DNA来源结构的数据比对到小牛基因组上的数据占达94.26%,比对到人类转录组上的数据仅有0.05%;RNA来源结构的数据比对到人类转录组上的数据占达94.09%,比对到小牛基因组上的数据仅有0.16%。这说明DDRC-seq能够准确有效的区分DNA&RNA共建库中来源于DNA和RNA的测序数据,实现DNA和RNA的共分析。
此外,DDRC-seq可以有效去除DNA&RNA共建库过程中的核糖体RNA(如图22),从而显著提高RNA数据的利用率。
实施例5:DDRC-seq验证UV照射对细胞DNA和RNA的影响
在本实施例中,我们验证了DDRC-seq对UV照射对细胞DNA和RNA的影响。具体实施方式如下:
UV处理:HEK293F细胞培养到70%细胞密度时,在50J/m2条件下处理细胞,处理后的细胞继续避光培养2天后,收集备用。
DNA&RNA共提取:利用天根生物的DNA/RNA共提取试剂盒(DP422)对HEK293F细胞进行DNA和RNA共提取。
DDRC-seq:提取好的细胞DNA和RNA按照实施例1流程进行DNA和RNA共建库。
结果如图23和图24所示,DDRC-seq能够对细胞中提取的DNA&RNA能够进行有效的共建库,其中RNA的数据占比约在20-25%左右。我们利用DDRC-seq中DNA来源的数据分析了UV照射对基因突变的影响(图25和图26),利用DDRC-seq中RNA来源的数据分析了UV照射对基因检出数、基因表达差异、RNA可变剪接分析(图27-图29)。同时,我们利用RNA来源的数据验证了DNA来源数据中检测到的SNV、Indel突变和基因融合事件,提高了SNV、Indel突变和基因融合事件检测的准确性(图30-图35)。
Claims (10)
1.一种可区分DNA和RNA来源的共建库方法,其特征在于:在建库过程中,先将DNA和RNA片段化,在RNA末端加上polyA,在逆转录过程中,在转录的cDNA另一末端加上Poly(dC),并在cDNA两端分别添加p5和p7接头,然后在DNA两端添加p5和p7接头,对DNA和cDNA进行文库扩增及测序。
2.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:其步骤包括:
(1)提取样本中的DNA和RNA,将DNA和RNA片段化;
(2)对片段化的DNA和RNA末端进行修复,同时将RNA多聚腺苷酸化,在RNA一端加上polyA;
(3)使用M-MLV逆转录酶进行RNA逆转录和模板转换,反应体系中加入逆转录引物和接纳模板DNA oligo,其中逆转录引物为Poly(dT)VN引物,在逆转录引物的5’端带有P5序列,所述接纳模板DNA oligo的3’端带有2个以上的G,5’端带有P7序列;
(4)在DNA片段两端加上p5和p7接头;
(5)文库扩增和测序。
3.根据权利要求2所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(3)中Poly(dT)VN引物的序列为ACACTCTTTCCCTACACGACGCTCTTCCGATCT~TVN,其中Poly(dT)的数量为20~23。
4.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(3)中接纳模板DNA oligo的序列为:TTTTTT/C12 Spacer/GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGGGGGGrGrGrG。
5.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(3)中还加入阻碍rRNA进行逆转录的探针。
6.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(1)中对DNA和RNA片段化,使得处理后的DNA和RNA的长度在200-500bp。。
7.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(2)中末端修复使用的是T4 PNK激酶,RNA多聚腺苷酸化使用的是Ecoli poly(A)polymerase。
8.根据权利要求1所述的可区分DNA和RNA来源的共建库方法,其特征在于:步骤(4)中为平末端连接,连接反应分为两轮进行,第一轮为P7接头连接,第二轮为P5接头连接,连接在磁珠上进行。
9.根据权利要求8所述的可区分DNA和RNA来源的共建库方法,其特征在于:第一轮P7接头连接采用T4 DNA连接酶突变体K159L,使用的接头为5’端预腺苷酰化的双链DNA接头。
10.根据权利要求9所述的可区分DNA和RNA来源的共建库方法,其特征在于:第二轮P5接头连接使用的连接酶为Taq DNA连接酶、T4 DNA连接酶和Ecoli DNA连接酶中的一种或多种组合物,使用的接头为含P5序列的单链DNA接头。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110626541.5A CN113355390A (zh) | 2021-06-04 | 2021-06-04 | 可区分dna和rna来源的共建库方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110626541.5A CN113355390A (zh) | 2021-06-04 | 2021-06-04 | 可区分dna和rna来源的共建库方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113355390A true CN113355390A (zh) | 2021-09-07 |
Family
ID=77532298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110626541.5A Pending CN113355390A (zh) | 2021-06-04 | 2021-06-04 | 可区分dna和rna来源的共建库方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113355390A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114410741A (zh) * | 2021-12-31 | 2022-04-29 | 翌圣生物科技(上海)股份有限公司 | 简便rna建库方法 |
CN115747208A (zh) * | 2022-11-14 | 2023-03-07 | 南京诺唯赞生物科技股份有限公司 | 一种dna/rna混合物的处理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150307874A1 (en) * | 2013-01-09 | 2015-10-29 | Yeda Research And Development Co. Ltd | High throughput transcriptome analysis |
US20180002749A1 (en) * | 2016-06-30 | 2018-01-04 | Grail, Inc. | Differential tagging of rna for preparation of a cell-free dna/rna sequencing library |
CN112195521A (zh) * | 2020-09-11 | 2021-01-08 | 翌圣生物科技(上海)有限公司 | 一种基于转座酶的dna/rna共建库方法、试剂盒及应用 |
CN112430849A (zh) * | 2020-12-16 | 2021-03-02 | 深圳易倍科华生物科技有限公司 | Rna、dna共建库测序方法及建库仪器 |
-
2021
- 2021-06-04 CN CN202110626541.5A patent/CN113355390A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150307874A1 (en) * | 2013-01-09 | 2015-10-29 | Yeda Research And Development Co. Ltd | High throughput transcriptome analysis |
US20180002749A1 (en) * | 2016-06-30 | 2018-01-04 | Grail, Inc. | Differential tagging of rna for preparation of a cell-free dna/rna sequencing library |
CN112195521A (zh) * | 2020-09-11 | 2021-01-08 | 翌圣生物科技(上海)有限公司 | 一种基于转座酶的dna/rna共建库方法、试剂盒及应用 |
CN112430849A (zh) * | 2020-12-16 | 2021-03-02 | 深圳易倍科华生物科技有限公司 | Rna、dna共建库测序方法及建库仪器 |
Non-Patent Citations (4)
Title |
---|
HUAJUAN SHI等: "Bias in RNA-seq Library Preparation: Current Challenges and Solutions", 《BIOMED RES INT》, vol. 2021, 19 April 2021 (2021-04-19), pages 6647597 * |
STEVEN R. HEAD等: "Library construction for next-generation sequencing: Overviews and challenges", 《BIOTECHNIQUES》, vol. 56, no. 2, 6 March 2015 (2015-03-06), pages 61, XP055544232, DOI: 10.2144/000114133 * |
李琳等: "新一代测序技术的文库制备方法研究进展", 《应用化学》, vol. 38, no. 01, 17 December 2020 (2020-12-17), pages 11 - 23 * |
贺添艳等: "T4 DNA连接酶性质及其平端连接功能", 《河南科技》, vol. 34, no. 7, 1 August 2016 (2016-08-01), pages 1058 - 1062 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114410741A (zh) * | 2021-12-31 | 2022-04-29 | 翌圣生物科技(上海)股份有限公司 | 简便rna建库方法 |
CN114410741B (zh) * | 2021-12-31 | 2024-06-18 | 翌圣生物科技(上海)股份有限公司 | 简便rna建库方法 |
CN115747208A (zh) * | 2022-11-14 | 2023-03-07 | 南京诺唯赞生物科技股份有限公司 | 一种dna/rna混合物的处理方法 |
CN115747208B (zh) * | 2022-11-14 | 2023-08-29 | 南京诺唯赞生物科技股份有限公司 | 一种dna/rna混合物的处理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11326201B2 (en) | Method for removing non-target RNA from RNA sample | |
US8986958B2 (en) | Methods for generating target specific probes for solution based capture | |
CN110699426B (zh) | 基因目标区域富集方法及试剂盒 | |
WO2018024082A1 (zh) | 一种串联rad标签测序文库的构建方法 | |
US20230056763A1 (en) | Methods of targeted sequencing | |
CN109576346B (zh) | 高通量测序文库的构建方法及其应用 | |
CN113355390A (zh) | 可区分dna和rna来源的共建库方法 | |
CN108517567B (zh) | 用于cfDNA建库的接头、引物组、试剂盒和建库方法 | |
CN109023537B (zh) | 一种微量dna样品高通量测序文库的构建技术 | |
US20210198660A1 (en) | Compositions and methods for making guide nucleic acids | |
CN106637422A (zh) | 一种构建Hi‑C高通量测序文库的方法 | |
CN112251821A (zh) | 一种快速高效的构建二代测序文库的试剂盒 | |
CN113322523B (zh) | Rna快速建库方法及其应用 | |
CN108359723B (zh) | 一种降低深度测序错误的方法 | |
CN110951827A (zh) | 一种转录组测序文库快速构建方法及其应用 | |
CN115715323A (zh) | 一种高兼容性的PCR-free建库和测序方法 | |
CN114410741B (zh) | 简便rna建库方法 | |
CN112080555A (zh) | Dna甲基化检测试剂盒及检测方法 | |
CN113564227A (zh) | 基于CRISPR/dcas9的宿主与病原微生物DNA快速分离方法 | |
CN113403309A (zh) | 非同源双链寡聚核苷酸片段在基因敲除系统中的应用 | |
CN113943729B (zh) | U型接头及采用u型接头介导的磁珠偶联转座酶进行rna快速均一化建库的方法 | |
CN111979226B (zh) | 一种可批量进行体外脱靶检测及sgRNA筛选的方法 | |
WO2021232184A1 (zh) | 标签化的转座复合体及其在高通量测序中的应用 | |
US20230122979A1 (en) | Methods of sample normalization | |
CN113718343A (zh) | 极速rna建库方法及试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |