CN110029149A - 一种鉴定碱基修饰的方法 - Google Patents
一种鉴定碱基修饰的方法 Download PDFInfo
- Publication number
- CN110029149A CN110029149A CN201910308739.1A CN201910308739A CN110029149A CN 110029149 A CN110029149 A CN 110029149A CN 201910308739 A CN201910308739 A CN 201910308739A CN 110029149 A CN110029149 A CN 110029149A
- Authority
- CN
- China
- Prior art keywords
- base
- sequence
- identified
- nucleic acid
- nuclease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004048 modification Effects 0.000 title claims abstract description 73
- 238000012986 modification Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000029087 digestion Effects 0.000 claims abstract description 72
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 52
- 101710163270 Nuclease Proteins 0.000 claims abstract description 51
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 36
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 36
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 15
- 238000005520 cutting process Methods 0.000 claims abstract description 8
- 238000004458 analytical method Methods 0.000 claims abstract description 5
- 238000012163 sequencing technique Methods 0.000 claims description 60
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 claims description 34
- 230000011987 methylation Effects 0.000 claims description 27
- 238000007069 methylation reaction Methods 0.000 claims description 27
- 239000000523 sample Substances 0.000 claims description 26
- 239000013642 negative control Substances 0.000 claims description 10
- 108020004414 DNA Proteins 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 4
- 230000008488 polyadenylation Effects 0.000 claims description 4
- 230000021736 acetylation Effects 0.000 claims description 3
- 238000006640 acetylation reaction Methods 0.000 claims description 3
- 230000026731 phosphorylation Effects 0.000 claims description 3
- 238000006366 phosphorylation reaction Methods 0.000 claims description 3
- 230000034512 ubiquitination Effects 0.000 claims description 3
- 238000010798 ubiquitination Methods 0.000 claims description 3
- 230000004069 differentiation Effects 0.000 claims description 2
- 239000002585 base Substances 0.000 claims 26
- 239000003513 alkali Substances 0.000 claims 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 47
- 108020004999 messenger RNA Proteins 0.000 description 22
- 102000004190 Enzymes Human genes 0.000 description 21
- 108090000790 Enzymes Proteins 0.000 description 21
- 102100031780 Endonuclease Human genes 0.000 description 14
- 108010042407 Endonucleases Proteins 0.000 description 14
- 108091034117 Oligonucleotide Proteins 0.000 description 13
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 8
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 5
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N adenyl group Chemical group N1=CN=C2N=CNC2=C1N GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000010520 demethylation reaction Methods 0.000 description 5
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 230000017858 demethylation Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 210000004907 gland Anatomy 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- HPZMWTNATZPBIH-UHFFFAOYSA-N 1-methyladenine Chemical compound CN1C=NC2=NC=NC2=C1N HPZMWTNATZPBIH-UHFFFAOYSA-N 0.000 description 2
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 229960005070 ascorbic acid Drugs 0.000 description 2
- 238000007622 bioinformatic analysis Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 239000003161 ribonuclease inhibitor Substances 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 235000000069 L-ascorbic acid Nutrition 0.000 description 1
- 239000002211 L-ascorbic acid Substances 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 230000006093 RNA methylation Effects 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- ZLXPLDLEBORRPT-UHFFFAOYSA-M [NH4+].[Fe+].[O-]S([O-])(=O)=O Chemical compound [NH4+].[Fe+].[O-]S([O-])(=O)=O ZLXPLDLEBORRPT-UHFFFAOYSA-M 0.000 description 1
- HWXBTNAVRSUOJR-UHFFFAOYSA-N alpha-hydroxyglutaric acid Natural products OC(=O)C(O)CCC(O)=O HWXBTNAVRSUOJR-UHFFFAOYSA-N 0.000 description 1
- 229940009533 alpha-ketoglutaric acid Drugs 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006196 deacetylation Effects 0.000 description 1
- 238000003381 deacetylation reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 230000009504 deubiquitination Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N iron Substances [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 238000001294 liquid chromatography-tandem mass spectrometry Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 230000007472 neurodevelopment Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000028617 response to DNA damage stimulus Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6809—Methods for determination or identification of nucleic acids involving differential detection
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种鉴定碱基修饰的方法,所述方法包括如下步骤:I、提供待测核酸样本和待鉴定碱基;II、利用能够特异性区分修饰和非修饰的待鉴定碱基的核酸酶对待测核酸样本进行酶切,获得至少一条经核酸酶酶切后的核酸序列;所述核酸酶的识别位点包含所述待鉴定碱基位点,所述核酸酶对识别位点进行切割后形成包含待鉴定碱基位点的第一末端和不包含待鉴定碱基位点的第二末端;III、分析步骤II经核酸酶酶切后的核酸序列,根据经核酸酶酶切后的核酸序列的情形判断待测核酸样本中是否存在该待鉴定碱基的修饰位点。
Description
技术领域:
本申请涉及一种鉴定碱基修饰的方法,尤其涉及一种鉴定单碱基甲基化修饰的方法。
背景技术
目前已知RNA上有超过100种不同的化学修饰,其中N6-甲基腺嘌呤修饰是真核生物mRNA上含量最高的化学修饰,约占所有腺嘌呤的0.1%-0.4%。N6-甲基腺嘌呤修饰影响mRNA各个阶段的代谢过程,如LncRNA和microRNA的生物合成,影响包括神经发育、细胞命运、免疫应答、DNA损伤应答和肿瘤发生等多种生命活动过程。
由于N6-甲基腺嘌呤修饰的化学性质与正常的腺嘌呤非常相似,所以很难通过化学的方法将其鉴别出来。近年来发展起来的高灵敏度质谱-液相色谱联用(LC-MS/MS)和抗体印迹法(dot blot)被广泛应用于检测N6-甲基腺嘌呤修饰的整体含量。目前最常使用的全转录组范围的N6-甲基腺嘌呤修饰检测方法是基于商业化抗体的免疫沉淀测序法(MeRIP-seq),即使用商业化的N6-甲基腺嘌呤修饰抗体将已片段化的mRNA片段进行富集,随后进行建库测序,通过生物信息学分析鉴定修饰位点存在的位置。但是这个方法的局限性在于只能确定修饰存在于约100个碱基长度的片段范围内,而不能确定单碱基的修饰位置。随后很多实验室在该方法的基础上进行改进,降低起始mRNA需求量,提高鉴定位点的分辨率,然而并没有更好的单碱基精度的方法。
基于抗体富集的方法不仅有分辨率较低的问题,还存在着重复率低、流程复杂、无法定量计算N6-甲基腺嘌呤修饰比例等问题。因此,急需一种方便简单、全转录组覆盖的单碱基精度的RNA甲基化修饰的检测方法。
发明内容
一方面,本发明提供了一种鉴定碱基修饰的方法,所述方法包括如下步骤:
I、提供待测核酸样本;
II、利用能够特异性的区分修饰和非修饰的待鉴定碱基的核酸酶对待测核酸样本进行酶切,获得至少一条经核酸酶酶切后的核酸序列;所述核酸酶的识别位点包含所述待鉴定碱基,所述核酸酶对识别位点进行切割后形成包含待鉴定碱基的第一末端和不包含待鉴定碱基位点的第二末端;
III、分析步骤II经核酸酶酶切后的核酸序列,根据经核酸酶酶切后的核酸序列的情形判断待测核酸样本中是否存在该待鉴定碱基的修饰位点。
在一个实施方式中,所述核酸酶能够酶切包含非修饰的待鉴定碱基的识别序列,但是不能酶切包含修饰的待鉴定碱基的识别序列;当所述经核酸酶酶切后的核酸序列的全部或部分序列包含非第一末端出现的所述核酸酶的识别位点时,则判断待测核酸样本中存在该待鉴定碱基的修饰位点。
所述非第一末端,可以是在酶切后的全部或部分序列的中间(不包含第一末端出现的识别位点)或第二末端。
在其他的实施方式中,所述核酸酶不能酶切包含非修饰的待鉴定碱基的识别序列,但是能够酶切包含修饰的待鉴定碱基的识别序列;当检测到所述核酸样本被所述核酸酶切割时,则判断待测核酸样本中存在该待鉴定碱基的修饰位点。例如,可以采用聚丙烯酰胺凝胶电泳确定核酸片段的切割情况。
进一步的,在步骤II获得至少一条经核酸酶酶切后的核酸序列后,还包括构建核酸文库以及测序的步骤;优选的,所述核酸文库为小核酸文库。
进一步的,还包括对测序数据进行分析的步骤,所述步骤如下:
(1)将构建的文库测序,获得测序数据;
(2)去除所述测序数据中的接头和/或测序引物,获得待分析测序序列;
(3)如果待分析测序序列的全部或部分序列包含在非第一末端出现的所述核酸酶的识别位点,则判断待测核酸样本中存在该待鉴定碱基的修饰位点。
所述非第一末端,可以是在测序序列的中间(不包含第一末端的识别位点)或另一末端出现的所述核酸酶的识别位点。
进一步的,步骤(2)在获得待分析测序序列后,还包括如下步骤:
计算待分析测序序列中所有出现所述核酸酶识别位点的测序序列数目,计为第一测序序列数;计算待分析测序序列中所有含有在非第一末端出现所述核酸酶识别位点的测序序列数目,计为第二测序序列数;第二测序序列数与第一测序序列数的第一比例即为待测核酸样本中该待鉴定碱基的修饰化的比例。
进一步的,所述每条待分析测序序列的碱基数量不小于m,所述m为大于或等于10的自然数,更优选,m为10、11、12、13、14、15、16、17、18、19或20。
进一步的,第二测序序列数中排除所述核酸酶的识别位点距离第一末端的碱基数量小于或等于m的测序序列,得到优化的第二测序序列数;如此优化可以降低第二测序序列数的假阳性;如果核酸酶识别位点距离第一末端碱基数量小于m,在建库过程中无法将这么短的片段全部成功建库,在序列比对的过程中存在比对错误,进而影响待鉴定碱基的修饰化的比例的计算结果,出现假阳性的修饰位点。
优选的,所述方法还包括对第二测序序列数进行校正的步骤,所述校正为排除第二测序序列数中形成二级结构的序列数,得到校正的第二测序序列数。
进一步的,还包括使用针对修饰的待鉴定碱基去修饰的试剂以及所述核酸酶对待测核酸样本进行处理得到负对照样本,并针对负对照样本进行文库的构建,得到负对照的文库;计算负对照的文库中所述第二测序序列数与第一测序序列数的比例,计为第二比例;如果第二比例小于第一比例,进一步确认待测核酸样本中存在该待鉴定碱基的修饰位点。
进一步的,第二比例相对于第一比例降低至少5%,则进一步确认待测核酸样本中存在该待鉴定碱基的修饰位点。优选的,第二比例相对于第一比例降低至少10%;更优选,至少11%、12%、13%、14%、15%、20%、25%、30%、40%、50%、60%、70%。
进一步的,本发明中的核酸酶可以通过以下方式进行筛选:合成具有固定碱基修饰位点的寡核苷酸序列;优选的,所述寡核苷酸序列的碱基数量为20-30个;利用体外酶切反应筛选能特异性区分修饰和非修饰的碱基的核酸酶。
核酸酶在对核酸序列进行切割时,通常会有特异的识别位点,在识别位点处对核酸序列进行切割,切割之后会形成两个末端,本发明中定义包含待鉴定碱基位点的末端为第一末端,不包含待鉴定碱基位点的为第二末端。
在优选的实施方式中,所述核酸酶可以为对N6-甲基腺嘌呤修饰敏感的RNA核酸内切酶,针对性地只对带有或不带有甲基化修饰的序列进行酶切;采用RNA核酸内切酶MazF,MazF酶可以酶切没有甲基化修饰的ACA序列,而不能够酶切带有甲基化修饰的ACA序列,该酶能够特异性识别ACA序列,并在ACA的5’端的方向上进行酶切,其中,识别序列ACA中5'端A即为待鉴定的甲基化修饰的A。以5'UUGGGGUAUGGACAUGUAUAUAGU 3'序列为例,经MazF酶切后会形成序列1:5'UUGGGGUAUGG3'和序列2:5'ACAUGUAUAUAGU 3'序列,序列1的3'端和序列2的5'端即为经MazF酶酶切后形成的两个末端,其中序列2的5'端包含了待鉴定的A,那么序列2的5'端即为第一末端,序列1的3'端即为第二末端。
再以其他的RNA核酸内切酶为例,假设某RNA内切酶可以酶切没有甲基化修饰的GAC序列,而不能够酶切带有甲基化修饰的GAC序列,该酶能够特异性识别GAC序列,并在GAC的3’端的方向上进行酶切。以5'UUGGGGUAUGGACAUGUAUAUAGU 3'序列为例,经酶切后会形成序列1:5'UUGGGGUAUGGAC3'和序列2:5'AUGUAUAUAGU 3'序列,序列1的3'端和序列2的5'端即为经酶切后形成的两个末端,其中序列1的3'端包含了待鉴定的A,那么序列1的3'端即为第一末端,序列2的5'端即为第二末端。
进一步的,在构建文库之前还包括对酶切后的核酸序列进行末端修复的步骤;优选的,所述末端修复包括使用T4多核苷酸激酶对核酸进行末端修复的步骤。
在一个实施方式中,所述待鉴定碱基位点为DNA或RNA碱基,更优选的,所述DNA或RNA碱基为DNA或RNA单碱基。
在一个实施方式中,所述碱基修饰选自甲基化、乙酰化、磷酸化、腺苷酸化、泛素化等中的一种或多种;更优选的,所述碱基修饰为单碱基甲基化修饰;更优选的,所述单碱基甲基化修饰选自N6-甲基腺嘌呤修饰、N1-甲基腺嘌呤修饰、5-甲基胞嘧啶修饰、7-甲基鸟嘌呤修饰,更优选N6-甲基腺嘌呤修饰。
针对N6-甲基腺嘌呤修饰,在优选的实施方式中,所述核酸酶能够区分N6-甲基腺嘌呤修饰和正常腺嘌呤;例如,核酸酶可以酶切无修饰的腺嘌呤,但是不能酶切N6-甲基腺嘌呤修饰。在优选的实施方式中,所述核酸酶选自MazF、ChpBK中的至少一种;所述MazF酶可以酶切没有甲基化修饰的ACA序列,而不能够酶切带有甲基化修饰的ACA序列,ChpBK只能酶切没有甲基化修饰的UAC序列,而不能够酶切带有甲基化修饰的UAC序列;所述MazF和ChpBK可以为野生型的酶,也可以不影响其特异性切割的突变型的酶;本发明的所需核酸酶可通过大肠杆菌表达纯化,也可直接从商业公司购买。MazF来源于宝日医生物技术(北京)有限公司,其货号为2415A,ChpBK蛋白序列来源于美国国立生物技术信息中心(NCBI),其序列编号为NP_418646.1。
核酸酶通常会在特异性的识别位点处进行酶切,在优选的实施方式中,所述核酸酶的识别位点中包含待检测的碱基。
对待测核酸样本进行核酸酶酶切后,本发明构建的文库优选为小核酸文库,所述小核酸文库中核酸片段的大小为5~2K nt,优选30~600nt;优选的,所述核酸为RNA。
在一个实施方式中,针对修饰的待鉴定碱基位点去修饰的试剂选自酶;例如,针对甲基化、乙酰化、磷酸化、腺苷酸化、泛素化等可以分别选自去甲基化、去乙酰化、去磷酸化、去腺苷酸化、去泛素化等的酶;在优选的实施方式中,针对N6-甲基腺嘌呤修饰去甲基化的试剂优选去甲基化酶,更优选,针对N6-甲基腺嘌呤修饰去甲基化酶FTO。
优选的,针对小RNA文库的构建方式包括如下步骤:
(1)3’接头与底物变性,(2)3’接头连接,(3)多余3’接头封闭,(4)5’接头连接,(5)cDNA合成,(6)文库富集。
本发明提供了一种快速准确、全转录组范围、单碱基精度的RNA N6-甲基腺嘌呤修饰检测方法。该方法省去了繁琐的抗体富集步骤,使用特异性区分修饰的RNA核酸内切酶进酶切的方法定位修饰位点在mRNA上的具体位置。使用N6-甲基腺嘌呤去甲基化酶处理组作为负对照,极大地降低了所鉴定出的修饰位点的假阳性。使用RNA核酸内切酶进行酶切的方法在鉴定N6-甲基腺嘌呤修饰位点的同时,也能够对甲基化比例进行估算。
本发明采用对N6-甲基腺嘌呤敏感的RNA核酸内切酶,能够特异性地区分特定序列中的腺嘌呤是带有修饰还是不带有修饰的,并针对性地只对带有或不带有甲基化修饰的序列进行酶切。如本研究中使用的RNA核酸内切酶MazF,该酶能够特异性识别ACA序列,并在其5‘端进行酶切,而当ACA序列的第一个碱基为N6-甲基腺嘌呤修饰时,不能进行酶切。
使用这种对甲基化敏感的RNA核酸内切酶酶切mRNA之后,将得到的小片段RNA进行末端修复和纯化,进而使用小RNA建库策略进行高通量测序文库构建并进行测序,通过生物信息学分析鉴定出修饰位点。同时使用N6-甲基腺嘌呤修饰去甲基化酶对mRNA进行处理,使用相同的建库流程建库测序作为数据分析的负对照,用以降低鉴定位点的假阳性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1.RNA核酸内切酶MazF对带有和不带有N6-甲基腺嘌呤修饰的RNA寡核苷酸序列进行酶切验证图。
图2.RNA核酸内切酶MazF对不同N6-甲基腺嘌呤修饰比例的RNA寡核苷酸序列进行酶切,其中,酶切的程度和其所含的甲基化比例成正比。
图3.RNA核酸内切酶ChpBK对带有和不带有N6-甲基腺嘌呤修饰的RNA寡核苷酸序列进行酶切。
图4.使用RNA核酸内切酶ChpBK对不同N6-甲基腺嘌呤修饰比例的RNA寡核苷酸序列进行酶切。酶切的程度和其所含的甲基化比例成正比。
图5.本发明建立的N6-甲基腺嘌呤修饰测序方法流程图。
图6.本发明获得测序数据后进行生物信息学分析流程图。
图7.HEK293T细胞系中的N6-甲基腺嘌呤修饰位点在转录本上的分布。
具体实施方案
为了能够更清楚地理解本申请的上述目的、特征和优点,下面结合附图和具体实施方式对本申请进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。在下面的描述中阐述了很多具体细节以便于充分理解本申请,但是,本申请还可以采用其他不同于在此描述的其他方式来实施,因此,本申请的保护范围并不受下面公开的具体实施例的限制。
实施例1RNA内切酶MazF和ChpBK酶切RNA寡核苷酸
使用体外合成的RNA寡核苷酸序列进行验证,发现MazF只能酶切没有甲基化修饰的ACA序列,并在ACA的5’端进行切割,而不能够酶切带有甲基化修饰的ACA序列(图1)。我们将带有甲基和不带有甲基的RNA寡核苷酸序列进行混合,使其修饰位点的比例分别为0%,20%,40%,60%,80%,100%,用来模拟体内部分甲基化的情况,并使用MazF酶进行酶切,发现酶切的程度和其所含的甲基化比例成正比(图2),表明可以使用该酶对N6-甲基腺嘌呤的比例进行估算。本发明的MazF来源于宝日医生物技术(北京)有限公司,其货号为2415A。RNA寡核苷酸序列酶切体系如下:
总量或终浓度 | |
mRNA | 10pmol |
MazF酶 | 10U |
MazF酶缓冲液(5x) | 1x |
无酶水(RNase-free H<sub>2</sub>O) | To 50ul |
37℃反应30分钟。使用15%Urea-TBE PAGE进行电泳检验。
其中,RNA寡核苷酸序列如下,在带下划线A位点分别合成带有和不带有N6-甲基腺嘌呤的碱基:5'UUUUUGGGGUAUGGACAUGUAUAUAGU 3'
使用体外合成的RNA寡核苷酸序列进行另一种RNA内切核酸酶ChpBK的验证,ChpBK同样具有区分RNA上N6-甲基腺嘌呤修饰的能力,ChpBK只能酶切没有甲基化修饰的UAC序列,并在UAC的A碱基5‘位置进行切割;而不能够酶切带有甲基化修饰的UAC序列(图3)。ChpBK蛋白序列来源于NCBI,序列编号NP_418646.1。我们将带有甲基和不带有甲基的RNA寡核苷酸序列进行混合,使其修饰的比例分别为0%,20%,40%,60%,80%,100%,用来模拟体内部分甲基化的情况,并使用ChpBK酶进行酶切,发现酶切的程度和其所含的甲基化比例成正比(图4)。
RNA寡核苷酸序列如下,在带下划线A位点分别合成带有和不带有N6-甲基腺嘌呤的碱基:5'GUUAGGAGAUAUACAUAUGGUGGUG 3'
实施例2小RNA文库建库流程
采用如图5的方式建立小RNA文库,具体操作如下:
1)去甲基化处理:使用N6-甲基腺嘌呤修饰去甲基化酶FTO对mRNA进行处理作为负对照。mRNA在进行反应之前须在PCR仪中使用85℃加热5分钟,随后立即插冰上2分钟,以去除mRNA的二级结构,去甲基化反应体系如下:
终浓度或总量 | |
mRNA | ~200ng |
N6-甲基腺嘌呤修饰去甲基化酶FTO | 2.5ug |
α-酮戊二酸(α-KG) | 300uM |
硫酸亚铁铵(Fe(NH4)2(SO4)2) | 283uM |
抗坏血酸(L-ascorbic acid) | 2mM |
Tris-HCl缓冲液(pH7.5) | 50mM |
RNA酶抑制剂(RNase inhibitor) | 20U |
无酶水(RNase-free H2O) | To 20ul |
室温(25℃)反应3小时,加入1ul 40mM EDTA终止反应,或使用RNA纯化试剂盒进行纯化。
2)MazF酶切反应:在酶切反应之前,使用PCR仪将mRNA 85℃加热5分钟,随后立即插冰上2分钟,以去除mRNA的二级结构。MazF反应体系如下:
总量或终浓度 | |
mRNA | ~100ng |
MazF酶 | 10U |
MazF酶缓冲液(5x) | 1x |
无酶水(RNase-free H2O) | To 50ul |
37℃反应30分钟,使用RNA纯化试剂盒对该体系进行纯化。
3)末端修复:使用T4多核苷酸激酶(T4Polynucleotide Kinase,T4PNK)对酶切后的mRNA进行末端修复。体系如下:
37℃反应30分钟,使用RNA纯化试剂盒对该体系进行纯化。
4)使用小RNA建库策略进行建库。
使用购买的商用小RNA建库试剂盒(如NEBSmall RNA Library Prep Set)进行建库,建库步骤主要为:
(1)3’接头与底物变性,将酶切后的mRNA和3’接头混合,在PCR仪里加热70℃2分钟,立即拿出插在冰上,尽量去除RNA中的二级结构。
(2)3’接头连接,mRNA与3’接头进行连接反应。
(3)多余3’接头封闭,使用反转录引物对多余3’接头进行封闭。
(4)5’接头连接,mRNA与5’接头进行连接反应。
(5)cDNA合成,使用反转录酶对mRNA片段进行反转录合成cDNA。
(6)文库富集,使用引物对已合成的cDNA进行文库扩增和纯化。
将建好的文库进行高通量测序。
实施例3高通量测序数据分析
采用图6的流程对实施例2得到的小RNA文库进行测序分析,具体步骤如下:
首先对测序数据进行质量控制,去除测序接头,保留剩余片段大于15nt测序短序列(reads);
使用Hisat2软件将测序数据比对回参考基因组,以得到其在基因组上的具体位置。
从比对结果中定位未被MazF酶切的ACA序列。具体方法为,如果一个ACA序列在测序reads的起始端,即为正常未甲基化的A,因为其是被MazF酶切断的位点;而当ACA序列出现在reads的中部时,即其并未被MazF酶切断,其第一个A即为甲基化位点。由于数据去接头时只保留15nt以上的reads,所以鉴定出的甲基化位点在reads上的位置必须距离reads端点大于15nt,如此可以降低数据的假阳性;
使用RNA二级结构预测软件对存在修饰位点的reads进行二级结构预测,去掉容易形成二级结构的修饰位点;
对每个修饰位点计算甲基化比例,即该位点测到存在于reads中间的数目,除以该位点测到的全部reads数目。对FTO处理组的测序结果进行同样的分析,已鉴定出的修饰位点只有在FTO处理组中甲基化比例下降,才证明其是一个正确的甲基化修饰位点;
通过这样的计算流程得到可靠的单碱基精度的N6-甲基腺嘌呤修饰位点信息。
实施例4对细胞系的mRNA进行N6-甲基腺嘌呤修饰鉴定
使用实施例1-3的方法对细胞系的mRNA进行N6-甲基腺嘌呤修饰鉴定,将鉴定出来的修饰位点在转录本上的位置进行作图,发现修饰位点主要在终止密码子附近富集(图7),这与之前报道的基于MeRIP-seq的结果一致。
Claims (10)
1.一种鉴定碱基修饰的方法,其特征在于,所述方法包括如下步骤:
I、提供待测核酸样本和待鉴定碱基;
II、利用能够特异性的区分修饰和非修饰的待鉴定碱基的核酸酶对待测核酸样本进行酶切,获得至少一条经核酸酶酶切后的核酸序列;所述核酸酶的识别位点包含待鉴定的碱基,所述核酸酶对识别位点进行切割后形成包含待鉴定碱基的第一末端和不包含待鉴定碱基的第二末端;
III、分析步骤II经核酸酶酶切后的核酸序列,根据经核酸酶酶切后的核酸序列的情形判断待测核酸样本中是否存在待鉴定的碱基修饰位点。
2.根据权利要求1所述的方法,其特征在于,所述核酸酶能够酶切包含非修饰的待鉴定碱基的识别序列,但是不能酶切包含修饰的待鉴定碱基的识别序列;当所述经核酸酶酶切后的核酸序列的全部序列或部分序列包含非第一末端出现的所述核酸酶的识别位点时,则判断待测核酸样本中存在该待鉴定碱基的修饰位点。
3.根据权利要求1所述的方法,其特征在于,所述核酸酶不能酶切包含非修饰的待鉴定碱基的识别序列,但是能够酶切包含修饰的待鉴定碱基的识别序列;当检测到所述核酸样本被所述核酸酶切割时,则判断待测核酸样本中存在该待鉴定碱基的修饰位点。
4.根据权利要求2所述的方法,其特征在于,在步骤II获得至少一条经核酸酶酶切后的核酸序列后,还包括构建核酸文库以及测序的步骤;优选的,所述核酸文库为小核酸文库。
5.根据权利要求4所述的方法,其特征在于,还包括对测序数据进行分析的步骤,所述步骤如下:
(1)将构建的文库进行测序,获得测序数据;
(2)去除所述测序数据中的接头和/或测序引物,获得待分析测序序列;
(3)如果待分析测序序列的全部序列或部分序列包含非第一末端出现的所述核酸酶的识别位点,则判断待测核酸样本中存在该待鉴定碱基的修饰位点。
6.根据权利要求5所述的方法,其特征在于,步骤(2)在获得待分析测序序列后,还包括如下步骤:
计算待分析测序序列中所有出现所述核酸酶识别位点的测序序列数目,计为第一测序序列数;
计算待分析测序序列中所有含有在非第一末端出现所述核酸酶识别位点的测序序列数目,计为第二测序序列数;
第二测序序列数与第一测序序列数的第一比例即为待测核酸样本中该待鉴定碱基的修饰化的比例。
7.根据权利要求6所述的方法,其特征在于,所述每条待分析测序序列的碱基数量不小于m,所述m为大于或等于10的自然数,更优选,m为10、11、12、13、14、15、16、17、18、19或20。
8.根据权利要求7所述的方法,其特征在于,第二测序序列数中排除所述核酸酶的识别位点距离第一末端的碱基数量小于或等于m的测序序列,得到优化的第二测序序列数;优选的,所述方法还包括对第二测序序列数进行校正的步骤,所述校正为排除第二测序序列数中形成二级结构的序列数,得到校正的第二测序序列数。
9.根据权利要求6-8任一所述的方法,其特征在于,还包括使用针对修饰的待鉴定碱基去修饰的试剂以及所述核酸酶对待测核酸样本进行处理得到负对照样本,并针对负对照样本进行文库的构建,得到负对照的文库;计算负对照的文库中所述第二测序序列数与第一测序序列数的比例,计为第二比例;如果第二比例小于第一比例,进一步确认待测核酸样本中存在该待鉴定碱基的修饰位点。
10.根据权利要求1-9任一所述的方法,其特征在于,所述待鉴定碱基为DNA或RNA碱基,更优选的,所述DNA或RNA碱基为DNA或RNA单碱基;更优选的,所述修饰选自甲基化、乙酰化、磷酸化、腺苷酸化、泛素化修饰中的一种或多种;更优选的,所述碱基修饰为单碱基甲基化修饰;更优选的,所述单碱基甲基化修饰为N6-甲基腺嘌呤修饰。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910308739.1A CN110029149A (zh) | 2019-04-17 | 2019-04-17 | 一种鉴定碱基修饰的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910308739.1A CN110029149A (zh) | 2019-04-17 | 2019-04-17 | 一种鉴定碱基修饰的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110029149A true CN110029149A (zh) | 2019-07-19 |
Family
ID=67238738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910308739.1A Pending CN110029149A (zh) | 2019-04-17 | 2019-04-17 | 一种鉴定碱基修饰的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110029149A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021042883A1 (zh) * | 2019-09-02 | 2021-03-11 | 浙江大学 | 一种全转录组范围单碱基分辨率检测rna n6-甲基腺嘌呤修饰的方法及试剂盒 |
-
2019
- 2019-04-17 CN CN201910308739.1A patent/CN110029149A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021042883A1 (zh) * | 2019-09-02 | 2021-03-11 | 浙江大学 | 一种全转录组范围单碱基分辨率检测rna n6-甲基腺嘌呤修饰的方法及试剂盒 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2929281T3 (es) | Métodos para el enriquecimiento de secuencias de ácidos nucleicos dirigidos con aplicaciones para la secuenciación de ácidos nucleicos con corrección de errores | |
US10515714B2 (en) | Methods for accurate sequence data and modified base position determination | |
CN103725773B (zh) | 鉴定宿主基因组中hbv基因整合位点和重复靶基因 | |
CN103088120B (zh) | 基于SLAFseq技术的大规模样品基因分型方法 | |
JP2021153588A (ja) | Rna転写産物バリアントを定量するための方法及び製品 | |
US11761037B1 (en) | Probe and method of enriching target region applicable to high-throughput sequencing using the same | |
EP3885448A1 (en) | Analysis of chromatin using a nicking enzyme | |
CN105734048A (zh) | 一种基因组DNA的PCR-free测序文库制备方法 | |
Paul et al. | SIRVs: spike-in RNA variants as external isoform controls in RNA-sequencing | |
Hartstock et al. | MePMe-seq: antibody-free simultaneous m6A and m5C mapping in mRNA by metabolic propargyl labeling and sequencing | |
CN110923314A (zh) | 一组检测SNP位点rs9263726的引物、crRNA序列及其应用 | |
CN104093854A (zh) | 表征组合物中的rna的方法和试剂盒 | |
CN110029149A (zh) | 一种鉴定碱基修饰的方法 | |
CN112105746B (zh) | 一种rna化学修饰的单基因单碱基分辨率检测方法 | |
CN106929507A (zh) | 引物组、锚定引物、试剂盒、文库构建及基因测序方法 | |
CN108728515A (zh) | 一种使用duplex方法检测ctDNA低频突变的文库构建和测序数据的分析方法 | |
CN108359723A (zh) | 一种降低深度测序错误的方法 | |
CN114277114B (zh) | 一种扩增子测序添加唯一性标识符的方法及应用 | |
CN113584135B (zh) | 一种混样检测rna修饰并实现精准定量的方法 | |
CN114214734A (zh) | 一种单分子靶标基因建库方法及其试剂盒 | |
CN108130366A (zh) | 一种构建人miRNA测序文库进行高通量测序的方法 | |
CN102533992B (zh) | 一种对苯丙氨酸羟化酶基因进行测序的方法及试剂盒 | |
US20240209349A1 (en) | Umi and application thereof, molecular identifier group, adapter, adapter ligation reagent, kits, method for constructing dna library and method for sequencing gene | |
CN108103173A (zh) | 一种构建小鼠miRNA测序文库进行高通量测序的方法 | |
CN114410762A (zh) | 磷酸激酶辅助的dna中5-羟甲基尿嘧啶修饰定位分析方法和试剂盒 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190719 |