CN104388548B - 一种高通量环状rna测序的方法 - Google Patents
一种高通量环状rna测序的方法 Download PDFInfo
- Publication number
- CN104388548B CN104388548B CN201410604748.2A CN201410604748A CN104388548B CN 104388548 B CN104388548 B CN 104388548B CN 201410604748 A CN201410604748 A CN 201410604748A CN 104388548 B CN104388548 B CN 104388548B
- Authority
- CN
- China
- Prior art keywords
- rna
- ercc
- external source
- linear
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 26
- 229920002477 rna polymer Polymers 0.000 title abstract 9
- 108091028075 Circular RNA Proteins 0.000 title abstract 2
- 239000000203 mixture Substances 0.000 claims abstract description 115
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 80
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims abstract description 40
- 238000002156 mixing Methods 0.000 claims abstract description 28
- 230000014509 gene expression Effects 0.000 claims abstract description 23
- 229960002685 biotin Drugs 0.000 claims abstract description 20
- 235000020958 biotin Nutrition 0.000 claims abstract description 20
- 239000011616 biotin Substances 0.000 claims abstract description 20
- 238000004458 analytical method Methods 0.000 claims abstract description 14
- 238000003908 quality control method Methods 0.000 claims abstract description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 207
- 238000003559 RNA-seq method Methods 0.000 claims description 17
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 16
- 108091092562 ribozyme Proteins 0.000 claims description 16
- 230000015572 biosynthetic process Effects 0.000 claims description 15
- 238000003786 synthesis reaction Methods 0.000 claims description 14
- 230000003321 amplification Effects 0.000 claims description 12
- 230000004907 flux Effects 0.000 claims description 12
- 108020004418 ribosomal RNA Proteins 0.000 claims description 12
- 238000002372 labelling Methods 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 10
- 238000012986 modification Methods 0.000 claims description 10
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical group OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 claims description 10
- 108010090804 Streptavidin Proteins 0.000 claims description 9
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims description 9
- 230000026731 phosphorylation Effects 0.000 claims description 8
- 238000006366 phosphorylation reaction Methods 0.000 claims description 8
- 238000013518 transcription Methods 0.000 claims description 8
- 230000035897 transcription Effects 0.000 claims description 8
- 238000011529 RT qPCR Methods 0.000 claims description 5
- 238000010839 reverse transcription Methods 0.000 claims description 5
- 238000000338 in vitro Methods 0.000 claims description 4
- 230000009465 prokaryotic expression Effects 0.000 claims description 4
- 230000002194 synthesizing effect Effects 0.000 abstract 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 36
- 238000000746 purification Methods 0.000 description 35
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 25
- 238000005119 centrifugation Methods 0.000 description 22
- 101710163270 Nuclease Proteins 0.000 description 17
- 239000006228 supernatant Substances 0.000 description 14
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000001556 precipitation Methods 0.000 description 11
- 229960004756 ethanol Drugs 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 239000000243 solution Substances 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 9
- 239000011535 reaction buffer Substances 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 239000011324 bead Substances 0.000 description 8
- 239000000872 buffer Substances 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 239000007788 liquid Substances 0.000 description 8
- 238000004090 dissolution Methods 0.000 description 7
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 5
- 239000005695 Ammonium acetate Substances 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 229920002527 Glycogen Polymers 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 5
- 229940043376 ammonium acetate Drugs 0.000 description 5
- 235000019257 ammonium acetate Nutrition 0.000 description 5
- 238000004140 cleaning Methods 0.000 description 5
- 230000007850 degeneration Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 229940096919 glycogen Drugs 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 239000013600 plasmid vector Substances 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 4
- 108091000080 Phosphotransferase Proteins 0.000 description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 229960000935 dehydrated alcohol Drugs 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 108091027963 non-coding RNA Proteins 0.000 description 4
- 102000042567 non-coding RNA Human genes 0.000 description 4
- 102000020233 phosphotransferase Human genes 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 241000195585 Chlamydomonas Species 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 108060002716 Exonuclease Proteins 0.000 description 3
- 102000003960 Ligases Human genes 0.000 description 3
- 108090000364 Ligases Proteins 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000029087 digestion Effects 0.000 description 3
- 102000013165 exonuclease Human genes 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 150000004712 monophosphates Chemical group 0.000 description 3
- 238000006384 oligomerization reaction Methods 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 102000012410 DNA Ligases Human genes 0.000 description 2
- 108010061982 DNA Ligases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000007622 bioinformatic analysis Methods 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 244000309466 calf Species 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000004087 circulation Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 229940125532 enzyme inhibitor Drugs 0.000 description 2
- 239000002532 enzyme inhibitor Substances 0.000 description 2
- 238000012869 ethanol precipitation Methods 0.000 description 2
- 238000009413 insulation Methods 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000004064 recycling Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- BDKLKNJTMLIAFE-UHFFFAOYSA-N 2-(3-fluorophenyl)-1,3-oxazole-4-carbaldehyde Chemical compound FC1=CC=CC(C=2OC=C(C=O)N=2)=C1 BDKLKNJTMLIAFE-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- UNXHWFMMPAWVPI-UHFFFAOYSA-N Erythritol Natural products OCC(O)C(O)CO UNXHWFMMPAWVPI-UHFFFAOYSA-N 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 102100024319 Intestinal-type alkaline phosphatase Human genes 0.000 description 1
- 101710184243 Intestinal-type alkaline phosphatase Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 108091012456 T4 RNA ligase 1 Proteins 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- SNAMIIGIIUQQSP-UHFFFAOYSA-N bis(6-methylheptyl) hydrogen phosphate Chemical compound CC(C)CCCCCOP(O)(=O)OCCCCCC(C)C SNAMIIGIIUQQSP-UHFFFAOYSA-N 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000009514 concussion Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 239000006071 cream Substances 0.000 description 1
- 239000012531 culture fluid Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 230000032696 parturition Effects 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 229940087562 sodium acetate trihydrate Drugs 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 229940048102 triphosphoric acid Drugs 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种高通量环状RNA测序的方法,属于分子生物学领域。该方法包括:人工合成外源线性ERCC‑0004‑RNA和外源环状ERCC‑0013‑RNA;对外源环状ERCC‑0013‑RNA进行质量控制;将外源线性ERCC‑0004‑RNA和外源环状ERCC‑0013‑RNA按等摩尔比混合,得到混合外源RNA;向待测序样本的总RNA中加入混合外源RNA,得到第一混合物;去除第一混合物中的核糖体RNA,得到第二混合物;对第二混合物进行3’末端生物素标记,并去除标记上生物素的套索RNA及线性RNA,得到第三混合物;去除第三混合物中的线性RNA,得到第四混合物;对第四混合物进行标准的高通量转录组测序并对测序数据进行生物学分析。本发明能够准确反映出生物体内的基因在特定条件下的表达情况,降低了的成本。
Description
技术领域
本发明涉及分子生物学领域,特别涉及一种高通量环状RNA测序的方法。
背景技术
生物体内大部分的RNA为线性,但有少部分RNA首尾连接形成环状,被称为环状RNA。早在1980年,环状RNA就首次被发现,但是30年来,由于研究方法的限制,人们对于环状RNA的了解知之甚少,直至近年来,随着高通量测序技术的高速发展,并结合生物信息学的方法,大规模的转录组数据被深入挖掘,研究者们从中发现了大量的环状RNA信息,从而使得环状RNA迅速成为RNA世界研究的新热点,继而衍生出了有针对性的环状RNA测序,这也极大地加快了对环状RNA的发现及对环状RNA功能的分析。在现有的高通量转录组测序中,通过在样本中混入外源转录本作为参考,可以直接评估差异表达基因的检测的灵敏度、高通量测序文库的质量及基因表达倍数变化。
研究环状RNA的前提是将环状RNA从生物体内分离出来,目前还没有直接从生物体内获取环状RNA的方法,只能从总RNA中去除线性RNA,间接达到富集环状RNA的目的。在现有的研究方法下,虽然能够对线性RNA分子进行消化,但是效果并不明显,从环状RNA的测序数据中可见,仅仅只有不到1%是环状RNA分子的序列,而其余的99%都是无用的数据。要获取足够分析环状RNA的有效数据量,单个样本的测序数据量需要达到100M,这对于高通量测序而言,仍然是个非常庞大的数字,这也意味着巨额的人力物力财力的投入。
发明内容
为了解决现有技术中总RNA中的环状RNA无法准确测序的问题,本发明实施例提供了一种高通量环状RNA测序的方法。所述技术方案如下:
本发明实施例提供了一种高通量环状RNA测序的方法,所述方法包括:
人工合成外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA,所述人工合成外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA,包括:
选择外源ERCC-0004基因和外源ERCC-0013基因,所述外源ERCC-0004基因如序列表中SEQ ID NO:1所示,所述外源ERCC-0013基因如序列表中SEQ ID NO:2所示;
将所述外源ERCC-0004基因和所述外源ERCC-0013基因分别克隆到原核表达载体中,分别获得克隆的外源ERCC-0004基因和克隆的外源ERCC-0013基因;
将获得的所述克隆的外源ERCC-0004基因和所述克隆的外源ERCC-0013基因进行体外转录,分别合成所述外源线性ERCC-0004-RNA和外源线性ERCC-0013-RNA;
去除所述外源线性ERCC-0013-RNA的5’端的三磷酸结构,并将所述外源线性ERCC-0013-RNA的5’端修饰羟基;
对5’端修饰羟基的所述外源线性ERCC-0013-RNA进行磷酸化修饰,合成5’端经磷酸化修饰的所述外源线性ERCC-0013-RNA;
将所述5’端经磷酸化修饰的外源线性ERCC-0013-RNA的5’端和3’端连接;
去除未环化成功的所述外源线性ERCC-0013-RNA,得到所述外源环状ERCC-0013-RNA;
对所述外源环状ERCC-0013-RNA进行质量控制;
将所述外源线性ERCC-0004-RNA和所述外源环状ERCC-0013-RNA按等摩尔比混合,得到混合外源RNA;
向待测序样本的总RNA中加入所述混合外源RNA,所述总RNA与所述混合外源RNA的质量比为2000:1,得到第一混合物;
去除所述第一混合物中的核糖体RNA,得到第二混合物;
对所述第二混合物进行3’末端生物素标记,并去除被标记上生物素的套索RNA及线性RNA,所述线性RNA包括所述总RNA中的内源线性RNA和所述外源线性ERCC-0004-RNA,得到第三混合物;
去除所述第三混合物中残留的所述线性RNA,得到第四混合物;
对所述第四混合物进行高通量转录组测序并对测序数据进行生物学分析。
进一步地,所述待测序样本的基因中不存在与所述外源ERCC-0004基因和所述外源ERCC-0013基因相同或同源性高的基因。
进一步地,对所述外源环状ERCC-0013-RNA进行质量控制,包括:
利用随机引物对所述外源环状ERCC-0013-RNA进行逆转录,合成外源ERCC-0013-cDNA,所述外源ERCC-0013-cDNA包括外源线性ERCC-0013-cDNA和外源环状ERCC-0013-cDNA;
利用第一引物和第二引物分别对所述外源ERCC-0013-cDNA进行实时定量PCR扩增,所述第一引物包括如序列表中SEQ ID NO:3所示的第一正向引物和如序列表中SEQ IDNO:4所示的第一反向引物,所述第二引物包括如序列表中SEQ ID NO:5所示的第二正向引物和如序列表中SEQ ID NO:6所示的第二反向引物,所述第一引物用于扩增所述外源线性ERCC-0013-cDNA和所述外源环状ERCC-0013-cDNA,所述第二引物用于扩增所述外源环状ERCC-0013-cDNA,通过所述第一引物扩增获得CT1值,通过所述第二引物扩增获得CT2值;
通过CT1值和CT2值以及公式2[CT2-CT1]×100%,计算合成的所述外源环状ERCC-0013-RNA的环化比例,并选用环化比例超过90%的所述外源环状ERCC-0013-RNA。
具体地,采用RNA酶R去除所述第二混合物中的线性RNA。
具体地,向所述待测序样本的总RNA中,加入所述混合外源RNA,所述总RNA与所述混合外源RNA的质量比为2000:1。
进一步的,采用RNA酶R去除未环化成功的所述外源线性ERCC-0013-RNA。
具体地,采用链霉亲和素磁珠去除被标记上所述生物素的套索RNA及所述线性RNA。
具体地,所述生物学分析包括:获得所述外源线性ERCC-0004-RNA和所述外源环状ERCC-0013-RNA的相对比例、以及以所述外源环状ERCC-0013-RNA为参考分析所述待测序样本中的环状RNA基因表达变化。
本发明实施例提供的技术方案带来的有益效果是:本发明实施例提供了一种高通量环状RNA测序的方法,模拟真核生物内源转录本的特征,用于评估RNA测序工具的系统性能,及基因差异表达的检测灵敏度,通过加入人工合成的外源线性RNA与环状RNA,可以为环状RNA的表达量提供一个外源环状RNA参考基因,通过外源环状RNA的表达量,可以计算样本中内源基因的表达量变化倍数,从而更准确的反映出生物体内的基因在特定条件下的表达情况;此外,通过对具有3’未端的RNA进行生物素标记,之后再利用链霉亲和素磁珠捕获被标记上生物素的RNA的方法,进一步去除线性RNA和套索RNA,提高了样品中环状RNA的富集度,减少单个样本的环状RNA测序数据量,比常用的环状RNA高通量测序方法效率提高了14倍多,大幅的降低了高通量测序的成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将结合附图对实施例描述中所需要使用的附图作简单地介绍,显而易见,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的高通量环状RNA测序的方法流程图;
图2是本发明实施例提供的现有的环状RNA测序的方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明实施方式作进一步地详细描述。本方案中未特别说明的试剂均为常用市售试剂,且不同市售试剂效果差异不大。
实施例
本发明实施例提供了一种环状RNA测序的新方法,本发明实施例提供的待测序样本为莱茵衣藻,且该莱茵衣藻的品系为CC503(购自于衣藻资源中心,网址为:http://chlamycollection.org/),如图1所示,具体方法包括:
步骤100:人工合成外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA。已有的环状RNA测序中是采用一个外源线性RNA作为参照(阴性参照)。本发明实施例中,人工合成了外源环状RNA与外源线性RNA,按比例加入总RNA后作为参照,以模拟体内稳定表达的内源环状RNA与内源线性RNA。本发明实施例提供的外源环状RNA与外源线性RNA在待测序样本中没有相同序列或同源性较高的序列,因为一旦加入总RNA中之后,是无法将外源RNA与内源RNA区分开的,若二者存在重叠,将导致结果不准确。此外,外源基因长度也不能过长,否则影响环化效率。本发明实施例将RNA对应的DNA序列转入质粒中,通过质粒增殖而增加相应的DNA的量,从而灵活获得大量DNA序列,再通过体外转录,将质粒上的DNA转录为RNA。为此,在该DNA序列前端添加了体外转录启动子序列。因转录成的RNA需要纯化,所以在DNA的末端设计了寡聚T,转录后形成寡聚A尾巴,寡聚A可用于纯化RNA。合成的外源RNA是线状,需要环化后才能成为环状RNA。由于合成时的RNA的5’端为三磷酸基团,连接时需要单磷酸基团,为此,在去掉了外源RNA的三磷酸基团后,省去了加上单磷酸基团这一步,从而合成能够环化成环状的前体RNA的状态。具体操作步骤如下:
1、选择外源ERCC-0004基因和外源ERCC-0013基因,该外源ERCC-0004基因如序列表中SEQ ID NO:1所示,该外源ERCC-0013基因如序列表中SEQ ID NO:2所示。
上述SEQ ID NO:1、SEQ ID NO:2及其互补链由生工生物工程(上海)股份有限公司合成。
通过NCBI的BLAST程序检索,没有发现生物中存在外源ERCC-0004基因和外源ERCC-0013基因、以及与外源ERCC-0004基因和外源ERCC-0013基因的同源基因。选择的外源ERCC-0004基因和外源ERCC-0013基因的长度不超过1000bp。分别在外源ERCC-0004基因和外源ERCC-0013基因的5’端和3’端分别添加了ctcgag和aagctt序列,该ctcgag和aagctt序列分别为限制性内切酶Xho I和Hind III的酶切位点,便于将外源ERCC-0004基因和外源ERCC-0013基因克隆进入原核表达载体,外源ERCC-0004基因和外源ERCC-0013基因的5’端的taatacgactcactata序列为T7转录酶的启动子序列,其余序列为可转录的序列。在taatacgactcactata序列之后连接有ggg序列,ggg序列能够增加T7转录酶的转录效率。
2、将外源ERCC-0004基因和外源ERCC-0013基因分别克隆到原核表达载体中,获得克隆的外源ERCC-0004基因和ERCC-0013基因,包括:
所选用的克隆载体为pBluescript II SK(+)(该克隆载体从长沙赢润生物技术有限公司购买,货号为VKS0288),采用内切酶Xho I(购买自NEB公司,货号为R0146)和内切酶Hind III(购买自NEB公司,货号为R0104)对pBluescript II SK(+)载体进行双酶切。具体地,在20μl的反应体系中,包含有10μg pBluescript II SK(+)载体、20U的内切酶HindIII、20U的内切酶Xho I和2×的NEBuffer 2.1(由NEB公司提供)。将上述反应体系混合均匀,经短暂离心,于37℃保温1小时后,经80℃,20分钟将酶失活,纯化获得线性pBluescriptII SK(+)载体,该线性pBluescript II SK(+)载体的浓度为0.5μg/μl。
将外源ERCC-0004基因和外源ERCC-0013基因用无菌水溶解后,分别配制成浓度为0.5μg/μl的溶液,将外源ERCC-0004基因及其互补链按体积比1:1混合均匀,于PCR仪中依次经历94℃10分钟;65℃10分钟和37℃10分钟,形成外源ERCC-0004-双链DNA基因;将外源ERCC-0013基因及其互补链按相同的方法进行处理,获得外源ERCC-0013-双链DNA基因。
在20μl的反应体系中包括线性的pBluescript II SK(+)载体10μl、外源ERCC-0004-双链DNA基因1μl、T4DNA连接酶(购买自NEB公司,货号为M0202)400U和1×T4DNA连接酶缓冲液(随T4DNA连接酶一起购买自NEB公司),16℃温育过夜后,65℃10分钟,使T4DNA连接酶热失活,获得含有外源ERCC-0004基因的pBluescript II SK(+)质粒载体。按同样的方法,获得含有外源ERCC-0013基因的pBluescript II SK(+)质粒载体。
利用热激法将含有外源ERCC-0004基因的pBluescript II SK(+)质粒载体转化进入大肠杆菌,具体方法如下:取50μl感受态细胞(由北京全式金生物技术有限公司生产,目录号为CD501)在冰浴中缓慢解冻,加入含有外源ERCC-0004基因的pBluescript II SK(+)质粒载体,轻轻混匀,在冰浴上孵育30分钟,42℃热激30秒,快速转移至冰浴中冰浴3分钟,该过程中不要摇动离心管,然后加入300μl不含抗生素的无菌LB液体培养基(LB液体培养基成份:牛肉膏0.5g,蛋白胨1.0g,氯化钠0.5g,蒸馏水100mL,pH7.2~7.5),于37℃,200转/分钟,复苏1小时,取复苏后的菌液200μl均匀涂布于含氨苄青霉素抗性的LB固体培养基(LB固体培养基包括:胰蛋白胨10g/L、酵母提取物5g/L、氯化钠10g/L和琼脂粉15g/L)上,待菌液完全吸收后倒置于37℃恒温培养箱中,暗培养过夜。挑取LB固体培养基上长出来的单克隆至5ml含氨苄青霉素的LB液体培养基中,经37℃,200转/分钟,摇菌扩增繁殖6-8小时,获得的菌液用于提取质粒。
利用天根生化科技(北京)有限公司生产的快速质粒小提试剂盒(货号为DP105)从上述菌液中,提取并纯化含有外源ERCC-0004基因的pBluescript II SK(+)质粒载体的DNA,提取与纯化的方法按照随试剂盒提供的说明书进行。利用分光光度计(美国Quawell公司生产,型号为Q5000)中的双链DNA程序,检测纯化后的pBluescript II SK(+)质粒的质量浓度。利用外源ERCC-0004基因的PCR引物从纯化后的pBluescript II SK(+)质粒上扩增外源ERCC-0004基因。具体地,20μl的扩增体系包括:纯化后的pBluescript II SK(+)质粒50ng、10μl Q5高保真扩增混合物(购自于NEB公司,货号为M0492)和10μM的外源ERCC-0004基因的PCR引物(该PCR引物为正向引物与反向引物的混合物)。扩增程序如下:98℃,30秒;(98℃,8秒;56℃,20秒;72℃,20秒)×30个循环。将PCR产物利用乙醇沉淀进行纯化,纯化产物溶解于10μl无核酸酶的水中,获得外源线性ERCC-0004基因的PCR产物,利用Q5000(美国Quawell公司生产,型号为Q5000)中的双链DNA定量程序对PCR产物进行定量检测,检测结果表明:本次扩增获得的外源线性ERCC-0004基因的PCR产物浓度为610ng/μl。扩增产物送至武汉擎科生物技术有限公司测序,确认克隆的ERCC-0004的正确性,从而获得含有正确克隆外源ERCC-0004基因的Bluescript II SK(+)质粒与外源线性ERCC-0004基因的PCR产物。按同样的方法,获得含有正确克隆外源ERCC-0013基因的Bluescript II SK(+)质粒与外源线性ERCC-0013基因的PCR产物。
其中,外源ERCC-0004基因的PCR引物的正向引物如序列表中SEQ ID NO:7所示,外源ERCC-0004基因的PCR引物的反向引物如序列表中SEQ ID NO:8所示;外源ERCC-0013基因的PCR引物的正向引物如序列表中SEQ ID NO:7所示,外源ERCC-0013基因的PCR引物的反向引物如序列表中SEQ ID NO:9所示。其中,SEQ ID NO:7与SEQ ID NO:9中的多聚T序列是为了在转录时获得多聚A,用于模拟生物RNA的多聚A尾巴,多聚A尾巴可用于RNA的逆转录和纯化。
3、将克隆的外源ERCC-0004基因和ERCC-0013基因通过体外转录,合成外源线性ERCC-0004-RNA和外源线性ERCC-0013-RNA,包括:
采用T7RNA快速高效合成试剂盒(购自于NEB公司,货号为E2050)转录合成外源ERCC-0004-RNA。该试剂盒中的成份包括:无核酸酶的水、含有NTP的缓冲液混合物和T7RNA聚合酶混合物。反应体系中包括:1μg上述外源线性ERCC-0004基因的PCR产物、10μl含有NTP的缓冲液混合物和2μl T7RNA聚合酶混合物,加水补足20μl混合均匀,并短暂离心,经37℃保温2小时后,加入30μl无酶水和2μl DNase I(购自于NEB公司,货号为M0303),混合均匀后,经37℃保温15分钟,去除DNA模板。再利用Dynabeads mRNA纯化试剂盒(由Lifetechnologies公司生产,货号为61006)进行纯化,并用50μl无核酸酶的水溶解纯化产物,获得纯化的外源线性ERCC-0004-RNA。采用同样的方法,获得纯化的外源线性ERCC-0013-RNA。
4、去除外源线性ERCC-0013-RNA的5’端的三磷酸结构,并在外源线性ERCC-0013-RNA的5’端修饰羟基。因体外合成的外源线性ERCC-0013-RNA的5’端为三磷酸结构,使得外源线性ERCC-0013-RNA的5’端无法与3’端连接形成环状,所以必须去除该5’端的三磷酸结构,再在5’端加上单磷酸结构,这样才能使得外源线性ERCC-0013-RNA的首尾相连成环状,具体步骤包括:
采用小牛肠碱性磷酸酶(购自于NEB公司,货号为M0290)去除外源线性ERCC-0013-RNA的5’端的三磷酸结构。反应体系如下:20μg纯化的外源线性ERCC-0013-RNA和7U的小牛肠碱性磷酸酶,用水补足20μl后混合均匀,经短暂离心,于37℃保温1小时,获得去除5’端的三磷酸结构的外源线性ERCC-0013-RNA。利用Dynabeads mRNA纯化试剂盒(由Lifetechnologies公司生产,货号为61006)纯化去除5’端的三磷酸结构的外源线性ERCC-0013-RNA,得到5’端为羟基的外源线性ERCC-0013-RNA。
5、对5’端修饰羟基的外源线性ERCC-0013-RNA进行磷酸化修饰,合成5’端磷酸化修饰的外源线性ERCC-0013-RNA,包括:
利用T4PNK激酶(由NEB公司,货号为M0201)修饰该5’端为羟基的外源线性ERCC-0013-RNA。随酶一起提供的有10×T4PNK激酶缓冲液。在50μl的反应体系中,包含如下成份:1×T4PNK激酶缓冲液、1mM ATP、10U T4PNK激酶、以及上述获得的5’端为羟基的外源线性ERCC-0013-RNA,用水补足至50μl并混合均匀,经短暂离心,于37℃保温30分钟。利用Dynabeads mRNA纯化试剂盒(由Life technologies公司生产,货号为61006)进行纯化,操作方法按该试剂盒的说明书进行,获得5’端磷酸化修饰的外源线性ERCC-0013-RNA。
6、将5’端磷酸化修饰的外源线性ERCC-0013-RNA的5’端和3’端连接,合成外源环状ERCC-0013-RNA,包括:
利用T4RNA连接酶I(NEB公司生产,货号为M0204)对该5’端磷酸化修饰的外源线性ERCC-0013-RNA的5’端与3’端进行连接。随该T4RNA连接酶I一起提供的成份还包括:10×T4RNA连接酶反应缓冲液、10mM ATP、10U/μl的RNA酶抑制剂和PEG 8000。在20μl的反体系中包含如下成份:1×T4RNA连接酶反应缓冲液、10U/μl的T4RNA连接酶1μl、10U/μl的RNA酶抑制剂0.5μl、浓度为10%的PEG8000、20-50μM的ATP和上述获得的5’端磷酸化修饰的外源线性ERCC-0013-RNA,用水补足20μl并混合均匀,经短暂离心,于PCR仪中于16℃过夜,经95℃2分钟终止反应,得到外源环状ERCC-0013-RNA。
纯化外源环状ERCC-0013-RNA,具体地,向得到的含有外源环状ERCC-0013-RNA的混合物中加入以下成份:5M的醋酸铵(Life technologies公司生产,货号为AM9071)10μl、无水乙醇200μl和水80μl,混合均匀,经短暂离心,置于-80℃冰箱(海尔公司生产,型号为DW-86L626)中放置30分钟;取出后经14000rpm,4℃,离心25分钟,用移液器的枪头小心吸去上层清液,向沉淀中加入700μl浓度为70%的乙醇,用于清洗沉淀,再经14000rpm,4℃,离心5分钟后吸去上层清液,于室温下干燥10分钟,用于去除残留的乙醇,再用10μl无核酸酶的水溶解沉淀,获得纯化的外源环状ERCC-0013-RNA。
7、采用RNA酶R切掉未环化成功的外源线性ERCC-0013-RNA。具体步骤包括:
在获得的纯化的外源环状ERCC-0013-RNA中,还有部分未环化成功的外源线性ERCC-0013-RNA,采用RNA酶R(由Epicentre公司生产,货号为RNR07250)消化未环化成功的外源线性ERCC-0013-RNA。随该RNA酶R一起提供的还有10×RNA酶R反应缓冲液,向获得的纯化的外源环状ERCC-0013-RNA中加入2μl 10×RNA酶R反应缓冲液、1μl 20U/μl的RNA酶R和7μl无核酸酶的水,并混合均匀,经短暂离心后于40℃保温1小时,获得去除了外源线状ERCC-0013-RNA的外源环状ERCC-0013-RNA。
8、纯化去除了外源线状ERCC-0013-RNA的外源环状ERCC-0013-RNA,包括:
向获得的去除了外源线状ERCC-0013-RNA的外源环状ERCC-0013-RNA中加入以下成份:5M的醋酸铵(Life technologies公司生产,货号为AM9071)10μl、无水乙醇200μl和水80μl并混合均匀,经短暂离心,置于-80℃冰箱(海尔公司生产,型号为DW-86L626)中放置30分钟,取出后经14000rpm,4℃,离心25分钟,用移液器的枪头小心吸去上层清液,向沉淀中加入700μl浓度为70%的乙醇,用于清洗沉淀,再经14000rpm,4℃,离心5分钟后吸去上层清液,于室温下干燥10分钟,用于去除残留的乙醇,用50μl无核酸酶的水溶解沉淀,获得纯化的外源环状ERCC-0013-RNA。
步骤200:对外源环状ERCC-0013-RNA进行质量控制。即使是采用了以上去除线性ERCC-0013-RNA的步骤,外源环状ERCC-0013-RNA中仍然可能混有外源线状ERCC-0013-RNA,因此需要对外源环状ERCC-0013-RNA进行质量控制。具体步骤包括:
1、利用随机引物对合成的外源环状ERCC-0013-RNA进行逆转录,合成外源ERCC-0013-cDNA,外源ERCC-0013-cDNA包括外源线性ERCC-0013-cDNA和外源环状ERCC-0013-cDNA,具体步骤如下:
利用分光光度计(美国Quawell公司生产,型号为Q5000)中RNA定量程序,测定并获得上述纯化的外源环状ERCC-0013-RNA的质量浓度,本发明实施例提供的外源环状ERCC-0013-RNARNA的质量浓度为8.99ng/μl。
取纯化的外源环状ERCC-0013-RNA0.1μg,与下列成分混合:5μl浓度为1μM的6碱基随机逆转录引物(由生工生物工程(上海)股份有限公司合成)、2μl浓度为10mM的dNTP、20U的逆转录酶(美国Life technologies公司生产,货号为18064-014)、5μl浓度为100mM的DL-二硫苏糖醇(DL-Dithiothreitol,DTT,随逆转录酶一起由美国Life technologies公司提供)和10μl 5×逆转录反应缓冲液(随逆转录酶一起由美国Life technologies公司提供),用水补足至50μl混匀后,经42℃保温2小时,75℃保温15分钟,使酶失活,合成外源ERCC-0013-cDNA。
2、利用第一引物和第二引物分别对外源ERCC-0013-cDNA进行实时定量PCR扩增,第一引物包括如序列表中SEQ ID NO:3所示的第一正向引物和如序列表中SEQ ID NO:4所示的第一反向引物,第二引物包括如序列表中SEQ ID NO:5所示的第二正向引物和如序列表中SEQ ID NO:6所示的第二反向引物,第一引物用于扩增外源线性ERCC-0013-cDNA和外源环状ERCC-0013-cDNA,第二引物用于扩增外源环状ERCC-0013-cDNA,通过第一引物扩增获得CT1值,通过第二引物扩增获得CT2值。
其中,第一引物的扩增产物不跨越外源环状ERCC-0013-RNA的环化连接点,使得该第一引物可扩增外源线性ERCC-0013-cDNA,又可扩增外源环状ERCC-0013-cDNA;第二引物或其扩增产物跨越外源环状ERCC-0013-RNA的环化连接点,使得该第二引物只能扩增外源环状ERCC-0013-cDNA。
其中,第一引物和第二引物分别在两个反应体系中平行进行,且反应体系和反应条件均相同,仅引物不同。具体地,取2μl外源ERCC-0013-cDNA、3μl浓度为1μM的第一引物、10μl定量PCR混合物(由Toyobo公司生产,货号为QPS-201)和0.4μl 50倍的ROX荧光校正染料(由Toyobo公司随QPS-201一起提供)混合均匀后,经短暂离心,在Life technologiesStepOne实时定量PCR仪中按如下扩增程序进行实时定量PCR扩增:95℃20秒;95℃3秒,60℃20秒,共40个循环,在每一次循环的最后一步收集荧光信号,该荧光信号的强弱用于衡量表达量的多少。
3、通过CT1值和CT2值以及公式计算合成的外源环状ERCC-0013-RNA的环化比例,当环化比例超过90%时,外源环状ERCC-0013-RNA可以使用。
通过第一引物扩增获得CT1值,该CT1值为21.55;采用第二引物按同样的方法进行扩增,获得CT2值,该CT2值为21.45。将CT1值和CT2值代入公式计算外源环状ERCC-0013-RNA的环化比例为: 若外源环状ERCC-0013-RNA的环化比例超过90%,该外源环状ERCC-0013-RNA可以使用,否则,该外源环状ERCC-0013-RNA不能使用,需重新制备外源环状ERCC-0013-RNA。其中,90%的环化比例作为外源环状ERCC-0013-RNA合格的标准仅作为经验值,该比例可根据具体情况作出调整。
步骤300:将外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA按摩尔比1:1混合,得到混合外源RNA。具体操作如下:
利用Qubit RNA分析试剂盒(由Life technologies公司生产,货号为Q32852)测定外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA的质量浓度,测定方法按该试剂盒的说明书进行。在本发明实施例中,检测获得的外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA的质量浓度分别为13393pg/μl和5298pg/μl。利用网站工具(网址为:http://www.basic.northwestern.edu/biotools/oligocalc.html)计算外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA的分子量分别为168246.6和262445.9,通过分子量分别计算外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA的摩尔浓度分别为79603.39pM和20187.02pM,由此计算,若要求外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA按等摩尔比混合,那么,二者混合的体积比应该为1:3.94。具体地,取外源线性ERCC-0004-RNA 10μl与外源环状ERCC-0013-RNA 39.4μl混合均匀后,经短暂离心,获得混合外源RNA。计算得到该混合外源RNA的摩尔浓度为32214.62pM,质量浓度为6936.66pg/μl。
步骤400:向待测序样本(莱茵衣藻)的总RNA中加入该混合外源RNA,总RNA与混合外源RNA的质量比为2000:1,得到第一混合物。该第一混合物中既有外源环状ERCC-0013-RNA,又有外源线性ERCC-0004-RNA,模拟了内源环状RNA与内源线状RNA。1/2000的混合比例既保证了有足够的外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA可以检测,又不至于添加过多外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA,占用测序通量,以至于浪费高通量测序的检测成本。具体步骤包括:
1、提取莱茵衣藻的总RNA:
取正常生长和低温胁迫条件下处于对数生长期的莱茵衣藻5ml,且所取的莱茵衣藻的数目少于4000万个,若超过4000万个,则相应减少取样体积,反之增加。4000rpm常温离心1分钟,倒去上层的培养液后,利用Trizol试剂(由Life technologies公司生产,货号为15596-018)提取莱茵衣藻的总RNA并溶解于50μl无核酸酶的水中,总RNA的提取与纯化的方法按照Trizol试剂的操作手册进行。
利用分光光度计(分光光度计由美国Quawell公司生产,型号为Q5000)中RNA定量程序,测定并获得上述提取的莱茵衣藻的总RNA的质量浓度。在本实施例中,获得的正常和胁迫的莱茵衣藻的总RNA的质量浓度分别为1.52μg/μl和0.98μg/μl。由此计算,提取的莱茵衣藻的总RNA的量分别为76μg和49μg。
2、向提取的莱茵衣藻总RNA中加入混合外源RNA,包括:
总RNA与混合外源RNA的质量比为2000:1,具体地,向正常的莱茵衣藻的总RNA中加入38ng混合外源RNA,向胁迫的莱茵衣藻的总RNA中加入24.5ng混合外源RNA,根据混合外源RNA的质量浓度(6936.66pg/μl)计算,应加入的混合外源RNA的体积分别为5.48μl和3.53μl,加入后混合均匀,经短暂离心,得到第一混合物,分别记正常的样本为N1,胁迫处理的样本为T1。
步骤500:去除第一混合物(N1和T1)中的核糖体RNA,得到第二混合物(N2和T2)。总RNA中绝大部分都是核糖体RNA(>95%),该核糖体RNA不是环状的RNA,因此,需要消除。具体操作如下:
利用植物核糖体RNA去除试剂盒(由Epicentre公司生产,货号为MRZPL116-6)去除第一混合物中的核糖体RNA。
该试剂盒包括:RNA酶抑制剂(100U/μl)、核糖体RNA去除液、反应缓冲液、糖原(10mg/ml)、醋酸钠(3M)、无核酸酶的水、磁珠和磁珠悬浮液。
磁珠预处理:取225μl磁珠,置于磁架上,并在室温下静置1分钟,用225μl无核酸酶的水清洗一次,用225μl无核酸酶的水再清洗一次,将磁珠振荡悬浮于60μl磁珠磁浮液中,再加入1μl糖原,得到经过预处理的磁珠。
样品预处理:在40μl的反应体系中,加入以下成分:5μg第一混合物、8-10μl核糖体RNA去除液和4μl反应缓冲液,用水补足40μl,混匀后经短暂离心,68℃保温10分钟,取出后室温放置5分钟,得到经过预处理的样品混合物。
去除核糖体RNA:向经过预处理的磁珠中加入经过预处理样品混合物,用移液器的枪头吹打几次混匀,经短暂离心,于室温下保温5分钟,进行涡旋震荡,50℃保温5分钟,置于磁架上,于室温下静置1分钟,取上清液至另一离心管中,即为去除核糖体RNA的混合物。
纯化样品:将去除核糖体RNA的混合物的体积用无核酸酶的水补足至180μl,并加入以下成份:3M的醋酸铵10μl、糖原2μl,无水乙醇600μl,混合均匀,经短暂离心,置于-80℃冰箱(海尔公司生产,型号为DW-86L626)中放置30分钟,14000rpm,4℃,离心25分钟,用移液器的枪头小心吸去上层清液,再加入700μl浓度为70%的乙醇,用于清洗沉淀,再经14000rpm,4℃,离心5分钟后去除上层清液,于室温下干燥10分钟,用于去除残留的乙醇,用10μl无酶水溶解沉淀,获得纯化的去除了核糖体RNA的第一混合物,即第二混合物(N2和T2)。
步骤600:对第二混合物(N2和T2)进行3’末端生物素标记,并用链霉亲和素磁珠去除被标记上生物素的套索RNA及线性RNA,线性RNA包括总RNA中的内源线性RNA和外源线性ERCC-0004-RNA,得到第三混合物(N3和T3),同时,回收未被标记上生物素的环状RNA分子。在第二混合物中,混杂着各种类型的RNA,包括线性RNA、环状RNA、套索RNA及其它具有特殊结构的RNA。套索RNA类似于环状RNA而功能却不同于环状RNA的分子,它由基因间的内含子区形成,结构类似于环状,但是在其首尾相连的位置有一段裸露的3’端,形似套索。在现有环状RNA测序的方法中,总RNA经核酸外切酶R消化之后,将套索RNA的3’尾巴一并切除,形成一个完整的环,混入环状RNA中,导致在测序之前无法将环状RNA和套索RNA分离,造成测序数据的浪费。这是现有环状RNA测序方法的一个明显的不足之处。
针对环状RNA与其它RNA在结构上的差异,即环状RNA为一个封闭的环状,无裸露的5’和3’末端,而线性RNA和套索RNA有裸露的3’末端。因此,通过将3’末端标记上生物素,然后利用链霉亲和素与生物素之间的高度亲和力,通过链霉亲和素磁珠进行捕获,将线性RNA和套索RNA从第二混合物中去除。具体包括:
利用3’末端生物素标记用试剂盒(货号20160,购自美国Thermo公司),完成对第二混合物的标记,具体方法如下:将第二混合物(N2和T2)真空浓缩至5μl,向浓缩液中加入浓缩体积的25%的二甲基亚砜1.25μl,于85℃金属浴上变性5分钟,立即置冰上,同时,在冰上配制混合物,该混合物包括:变性后的浓缩液,3μl 10×连接反应缓冲液,1μl核酸酶抑制剂,1μl磷酸二异辛酯,2μl T4RNA连接酶,15μl 30%聚乙二醇,3μl无核酸酶的水,总体积30μl,混合均匀后,16℃保温过夜,得到过夜产物。
向过夜产物中加入50μl结合缓冲液(该结合缓冲液包括:0.5M NaCl、20mM Tris-HCl(PH7.5)和1mM EDTA),于65℃金属浴上变性5分钟,立即置冰上3分钟,得到变性后的过夜产物。取100μl链霉亲和素磁珠(货号S1420,购自NEB公司)于1.5ml离心管中,加入100μl结合缓冲液,混匀,将离心管置磁架上分离1分钟,去除上清液,取下离心管,加入100μl结合缓冲液,混匀,将离心管置磁架上分离1分钟,去除上清液,取下离心管,将变性后的过夜产物加入到该离心管中,混匀,室温孵育20分钟,并不时混匀。将离心管置磁架上分离1分钟,收集上清液至另一新离心管中,约50μl,即为去除被标记上生物素的套索RNA及线性RNA,得到第三混合物。
纯化去除被标记上生物素的套索RNA及线性RNA,采用乙醇沉淀的方法进行纯化,具体方法如下:向上述去除被标记上生物素的套索RNA及线性RNA的第三混合物中加入以下成份:130μl无核酸酶的水,3M的醋酸铵18μl、10mg/ml的糖原2μl,无水乙醇600μl,混合均匀,经短暂离心,置于-80℃冰箱(海尔公司生产,型号为DW-86L626)中放置30分钟,14000rpm,4℃,离心25分钟,用移液器的枪头小心吸去上层清液,加入700μl浓度为70%的乙醇,用于清洗沉淀,再经14000rpm,4℃,离心5分钟后去除上层清液,于室温下干燥10分钟,用于去除残留的乙醇,用10μl无核酸酶的水溶解沉淀,获得了纯化的去除了被标记上生物素的套索RNA及线性RNA的第三混合物。
步骤700:进一步去除第三混合物(N3和T3)中残留的线性RNA,得到第四混合物(N4和T4)。经过3’末端标记及链霉亲和素磁珠捕获去除非环状RNA之后的第三混合物中仍然会残留一部分线性的RNA,因此需要有针对性的处理线性的RNA分子,具体包括:
利用核酸外切酶R(货号为RNR07250,购自Epicentre公司)能够酶切消化线性RNA的特性,去除第三混合物中残留的线性RNA。随核酸外切酶R一起提供的还有10×RNA酶R反应缓冲液。向纯化后第三混合物中加入2μl 10×RNA酶R反应缓冲液、1μl 20U/μl的RNA酶R和无核酸酶的水7μl,混合均匀,经短暂离心后40℃保温1小时,得到了去除残留的线性RNA的第三混合物。
纯化去除残留的线性RNA的第三混合物:将上述去除残留的线性RNA的第三混合物用无核酸酶的水补足至180μl,并加入以下成份:3M的醋酸铵10μl,10mg/ml的糖原2μl,无水乙醇600μl,混合均匀,经短暂离心,置于-80℃冰箱(海尔公司生产,型号为DW-86L626)中放置30分钟,14000rpm,4℃,离心25分钟,用移液器的枪头小心吸去上层清液,加入700μl浓度为70%的乙醇,用于清洗沉淀,再经14000rpm,4℃,离心5分钟后去除上层清液,于室温下干燥10分钟,用于去除残留的乙醇,用10μl无核酸酶的水溶解沉淀,获得了纯化的去除了残留的线性RNA的第三混合物,即第四混合物(N4和T4)。
步骤800:对第四混合物进行高通量转录组测序。如图2所示,设置对照组,将莱茵衣藻按现有的环状RNA测序方法进行平行测序。该方法包括:
步骤101:提取莱茵衣藻总RNA;步骤201:向莱茵衣藻总RNA中按2000:1的质量比加入混合外源RNA,得到第一混合物;步骤301:去除第一混合物中的核糖体RNA,得到第二混合物;步骤401:去除第二混合物中的线性RNA,该线性RNA包括总RNA中的内源线性RNA和外源线性ERCC-0004-RNA,得到混合物CK1;该混合物CK1与本发明实施例提供的第四混合物(N4和T4)均按标准的高通量Proton转录组测序方法进行测序。本发明实施例中每个样本测序的总数据量均为10M。
对测序数据进行生物学分析,其中测序数据从以下几个方面分析:通过分析第四混合物N4(胁迫处理的样本)中外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA在测序数据中的绝对量,评估文库质量。具体地,本发明实施例提供的第四混合物N4中外源线性ERCC-0004-RNA的Reads数分别为506,外源环状ERCC-0013-RNA的Reads数为5672,而外源混合RNA中外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA是按等摩尔比混合的,由此可见,该文库的制备方法能够有效去除线性RNA分子。
以外源环状ERCC-0013-RNA为参考,分析待测序样本中的环状RNA基因表达变化,具体地,分析正常生长和低温胁迫下的两个样本中的外源环状ERCC-0013-RNA的表达变化倍数,根据此变化倍数,计算内源环状RNA的表达差异。具体地,分析正常生长和低温胁迫下的两个样本中某个特定的环状RNA基因相对外源环状ERCC-0013-RNA的表达变化倍数,分析低温胁迫对基因表达水平的影响。在第四混合物N4和T4的测序结果中均发现了特定的环状RNA基因circ_000026环状RNA基因的表达。其中,在第四混合物N4中外源环状ERCC-0013-RNA的Reads数为5672,circ_000026的Reads数为1146;在第四混合物T4中外源环状ERCC-0013-RNA的Reads数为4218,circ_000026的Reads数为350;由此计算该环状RNA circ_000026在低温胁迫条件下表达量相对正常生长下的变化倍数为(350/4218)/(1146/5672)=0.41,即在低温胁迫条件下环状RNA基因circ_000026表达下调了1/0.41=2.4倍。以此可以类推分析其它环状RNA的表达变化倍数,从而可以进一步分析胁迫条件下环状RNA的调控机制。
此外,对比分析本发明实施例获得的第四混合物N4与现有方法获得的混合物CK1测序数据中环状RNA的数据量。本发明实施例的测序数据经生物信息学分析之后的结果见表1,混合物CK1测序的结果中,环状RNA获得的reads比例是0.0056%,而第四混合物N4获得的reads比例是0.0787%,对比之下,本发明实施例提供的方法能够将样本中的非环状RNA进一步去除,使得环状RNA的有效测序数据量提高了14倍,由此可证明本发明实施例所用的方法能显著的将样本中的环状RNA进一步富集,这将大幅度降低环状RNA测序数据量,降低成本,减少人力物力的浪费。
表1.混合物CK1和第四混合物N4的测序数据经生物信息学分析
本发明实施例提供了一种高通量环状RNA测序的方法,通过加入人工合成的外源线性RNA与环状RNA,可以为环状RNA的表达量提供一个外源环状RNA参考基因,通过外源环状RNA的表达量,可以计算样本中内源基因的表达量变化倍数,从而更准确的反映出生物体内的基因在特定条件下的表达情况;此外,通过对具有3’未端的RNA进行生物素标记,之后再利用链霉亲和素磁珠捕获被标记上生物素的RNA的方法,进一步去除线性RNA和套索RNA,提高了样品中环状RNA的富集度,减少单个样本的环状RNA测序数据量,大幅的降低了高通量测序的成本。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种高通量环状RNA测序的方法,其特征在于,所述方法包括:
人工合成外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA,所述人工合成外源线性ERCC-0004-RNA和外源环状ERCC-0013-RNA,包括:
选择外源ERCC-0004基因和外源ERCC-0013基因,所述外源ERCC-0004基因如序列表中SEQ ID NO:1所示,所述外源ERCC-0013基因如序列表中SEQ ID NO:2所示;
将所述外源ERCC-0004基因和所述外源ERCC-0013基因分别克隆到原核表达载体中,分别获得克隆的外源ERCC-0004基因和克隆的外源ERCC-0013基因;
将获得的所述克隆的外源ERCC-0004基因和所述克隆的外源ERCC-0013基因进行体外转录,分别合成所述外源线性ERCC-0004-RNA和外源线性ERCC-0013-RNA;
去除所述外源线性ERCC-0013-RNA的5’端的三磷酸结构,并将所述外源线性ERCC-0013-RNA的5’端修饰羟基;
对5’端修饰羟基的所述外源线性ERCC-0013-RNA进行磷酸化修饰,合成5’端经磷酸化修饰的所述外源线性ERCC-0013-RNA;
将所述5’端经磷酸化修饰的外源线性ERCC-0013-RNA的5’端和3’端连接;
去除未环化成功的所述外源线性ERCC-0013-RNA,得到所述外源环状ERCC-0013-RNA;
对所述外源环状ERCC-0013-RNA进行质量控制;
将所述外源线性ERCC-0004-RNA和所述外源环状ERCC-0013-RNA按等摩尔比混合,得到混合外源RNA;
向待测序样本的总RNA中加入所述混合外源RNA,所述总RNA与所述混合外源RNA的质量比为2000:1,得到第一混合物;
去除所述第一混合物中的核糖体RNA,得到第二混合物;
对所述第二混合物进行3’末端生物素标记,并去除被标记上生物素的套索RNA及线性RNA,所述线性RNA包括所述总RNA中的内源线性RNA和所述外源线性ERCC-0004-RNA,得到第三混合物;
去除所述第三混合物中残留的所述线性RNA,得到第四混合物;
对所述第四混合物进行高通量转录组测序并对测序数据进行生物学分析。
2.根据权利要求1所述的方法,其特征在于,所述待测序样本的基因中不存在与所述外源ERCC-0004基因和所述外源ERCC-0013基因相同或同源性高的基因。
3.根据权利要求1所述的方法,其特征在于,对所述外源环状ERCC-0013-RNA进行质量控制,包括:
利用随机引物对所述外源环状ERCC-0013-RNA进行逆转录,合成外源ERCC-0013-cDNA,所述外源ERCC-0013-cDNA包括外源线性ERCC-0013-cDNA和外源环状ERCC-0013-cDNA;
利用第一引物和第二引物分别对所述外源ERCC-0013-cDNA进行实时定量PCR扩增,所述第一引物包括如序列表中SEQ ID NO:3所示的第一正向引物和如序列表中SEQ ID NO:4所示的第一反向引物,所述第二引物包括如序列表中SEQ ID NO:5所示的第二正向引物和如序列表中SEQ ID NO:6所示的第二反向引物,所述第一引物用于扩增所述外源线性ERCC-0013-cDNA和所述外源环状ERCC-0013-cDNA,所述第二引物用于扩增所述外源环状ERCC-0013-cDNA,通过所述第一引物扩增获得CT1值,通过所述第二引物扩增获得CT2值;
通过CT1值和CT2值以及公式计算合成的所述外源环状ERCC-0013-RNA的环化比例,并选用环化比例超过90%的所述外源环状ERCC-0013-RNA。
4.根据权利要求1所述的方法,其特征在于,采用RNA酶R去除所述第二混合物中的线性RNA。
5.根据权利要求1所述的方法,其特征在于,向所述待测序样本的总RNA中,加入所述混合外源RNA,所述总RNA与所述混合外源RNA的质量比为2000:1。
6.根据权利要求1所述的方法,其特征在于,采用RNA酶R去除未环化成功的所述外源线性ERCC-0013-RNA。
7.根据权利要求1所述的方法,其特征在于,采用链霉亲和素磁珠去除被标记上所述生物素的套索RNA及所述线性RNA。
8.根据权利要求1所述的方法,其特征在于,所述生物学分析包括:获得所述外源线性ERCC-0004-RNA和所述外源环状ERCC-0013-RNA的相对比例、以及以所述外源环状ERCC-0013-RNA为参考分析所述待测序样本中的环状RNA基因表达变化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410604748.2A CN104388548B (zh) | 2014-10-31 | 2014-10-31 | 一种高通量环状rna测序的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410604748.2A CN104388548B (zh) | 2014-10-31 | 2014-10-31 | 一种高通量环状rna测序的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104388548A CN104388548A (zh) | 2015-03-04 |
CN104388548B true CN104388548B (zh) | 2017-01-18 |
Family
ID=52606505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410604748.2A Expired - Fee Related CN104388548B (zh) | 2014-10-31 | 2014-10-31 | 一种高通量环状rna测序的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104388548B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105063210A (zh) * | 2015-08-12 | 2015-11-18 | 中国农业科学院北京畜牧兽医研究所 | 一种环状rna的鉴定方法 |
CN107400701A (zh) * | 2016-05-18 | 2017-11-28 | 上海德沛生物科技有限公司 | 环状rna分子的扩增和测序方法 |
CN106048040A (zh) * | 2016-07-05 | 2016-10-26 | 周重昌 | 结直肠癌环状rna分子标记物及检测试剂 |
CN109385468B (zh) * | 2017-08-11 | 2022-08-16 | 深圳华大基因股份有限公司 | 检测链特异性效率的成套试剂与方法 |
CN108192959A (zh) * | 2018-04-01 | 2018-06-22 | 南京千年健干细胞基因工程有限公司 | 一种基于环状rna的鉴定骨髓间充质干细胞传代次数的基因检测试剂盒 |
CN108192958A (zh) * | 2018-04-01 | 2018-06-22 | 南京千年健干细胞基因工程有限公司 | 一种基于环状rna的鉴定脐带间充质干细胞传代次数的基因检测试剂盒 |
CN113088567B (zh) * | 2021-03-29 | 2023-06-13 | 中国农业科学院农业基因组研究所 | 一种长片段dna分子结构柔性的表征方法 |
-
2014
- 2014-10-31 CN CN201410604748.2A patent/CN104388548B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN104388548A (zh) | 2015-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104388548B (zh) | 一种高通量环状rna测序的方法 | |
Mahat et al. | Base-pair-resolution genome-wide mapping of active RNA polymerases using precision nuclear run-on (PRO-seq) | |
US8278035B2 (en) | Method and substances for isolating miRNAs | |
Jackson et al. | Numbers and organization of RNA polymerases, nascent transcripts, and transcription units in HeLa nuclei | |
Sanbonmatsu | Towards structural classification of long non-coding RNAs | |
CN104328112B (zh) | 一种用于非疾病诊断目的的定量检测内源环状rna的方法 | |
CN108368503A (zh) | 用于受控dna片段化的方法 | |
CN105349675B (zh) | 基于双酶切的大黄鱼全基因组SNP和InDel分子标记方法 | |
Gräwe et al. | RNA-centric methods: toward the interactome of specific RNA transcripts | |
CN106947827A (zh) | 一种获得鳙性别特异分子标记及其筛选方法和应用 | |
CN104450920A (zh) | 基于指数级非酶扩增及电化学发光原理的microRNA痕量检测方法 | |
CN108342511A (zh) | 检测细胞肿大虹彩病毒的引物组及其应用 | |
Ramakrishnan et al. | The plant epitranscriptome: revisiting pseudouridine and 2′‐O‐methyl RNA modifications | |
WO2017215517A1 (zh) | 测序文库构建中5'和3'接头连接副产物的去除方法 | |
CN104388426B (zh) | 一种Oligo dT引物及构建cDNA文库的方法 | |
Hayashi | Cloning, sequencing, and linkage analysis of piRNAs | |
Wang et al. | Ancient mitogenomes provide new insights into the origin and early introduction of Chinese domestic donkeys | |
Xu et al. | DEtail-seq is an ultra-efficient and convenient method for meiotic DNA break profiling in multiple organisms | |
Ye et al. | RNA-Seq reveals miRNA and mRNA co-regulate muscle differentiation in fetal Leizhou goats | |
Tao et al. | Approaches for Modes of Action Study of Long Non-Coding RNAs: From Single Verification to Genome-Wide Determination | |
CN104328185B (zh) | 一种监控总rna中线状rna消除的方法 | |
Wu et al. | 3′ End sequencing of pA+ and pA− RNAs | |
US10160968B2 (en) | RNA tagging | |
CN105647928B (zh) | 马铃薯stu-miR5992a和stu-miR5992b及其应用 | |
Gómez-Saldivar et al. | Tissue-specific DamID protocol using nanopore sequencing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170118 |