CN116287166A - 甲基化测序接头及其应用 - Google Patents
甲基化测序接头及其应用 Download PDFInfo
- Publication number
- CN116287166A CN116287166A CN202310422311.6A CN202310422311A CN116287166A CN 116287166 A CN116287166 A CN 116287166A CN 202310422311 A CN202310422311 A CN 202310422311A CN 116287166 A CN116287166 A CN 116287166A
- Authority
- CN
- China
- Prior art keywords
- methylation
- sequencing
- cytosine
- adapter
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012164 methylation sequencing Methods 0.000 title claims description 34
- 238000012163 sequencing technique Methods 0.000 claims abstract description 52
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims abstract description 51
- 229940104302 cytosine Drugs 0.000 claims abstract description 22
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical group NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 claims abstract description 12
- 230000007067 DNA methylation Effects 0.000 claims abstract description 11
- 238000001514 detection method Methods 0.000 claims abstract description 5
- 108020004414 DNA Proteins 0.000 claims description 27
- 238000000034 method Methods 0.000 claims description 20
- 238000010276 construction Methods 0.000 claims description 17
- 230000009466 transformation Effects 0.000 claims description 14
- 102000000311 Cytosine Deaminase Human genes 0.000 claims description 7
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 7
- 102000053602 DNA Human genes 0.000 claims description 5
- 238000003556 assay Methods 0.000 claims description 3
- 238000006481 deamination reaction Methods 0.000 claims description 3
- 230000009615 deamination Effects 0.000 claims description 2
- 238000007069 methylation reaction Methods 0.000 description 63
- 230000011987 methylation Effects 0.000 description 62
- 238000006243 chemical reaction Methods 0.000 description 22
- 230000004048 modification Effects 0.000 description 17
- 238000012986 modification Methods 0.000 description 17
- 230000002255 enzymatic effect Effects 0.000 description 11
- 239000012634 fragment Substances 0.000 description 9
- 108090000790 Enzymes Proteins 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 7
- 238000012408 PCR amplification Methods 0.000 description 7
- 239000000178 monomer Substances 0.000 description 6
- 230000003321 amplification Effects 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 230000017858 demethylation Effects 0.000 description 4
- 238000010520 demethylation reaction Methods 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 3
- 108091029430 CpG site Proteins 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 230000003647 oxidation Effects 0.000 description 3
- 238000007254 oxidation reaction Methods 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- 108091029523 CpG island Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 description 2
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- SCVJRXQHFJXZFZ-KVQBGUIXSA-N 2-amino-9-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purine-6-thione Chemical compound C1=2NC(N)=NC(=S)C=2N=CN1[C@H]1C[C@H](O)[C@@H](CO)O1 SCVJRXQHFJXZFZ-KVQBGUIXSA-N 0.000 description 1
- MMIFUTMTWUWRCI-UHFFFAOYSA-N 4-amino-1-methyl-2-oxopyrimidine-5-carboxylic acid Chemical compound CN1C=C(C(O)=O)C(N)=NC1=O MMIFUTMTWUWRCI-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 101150039863 Rich gene Proteins 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010523 cascade reaction Methods 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-M hydrogensulfate Chemical compound OS([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-M 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000006277 sulfonation reaction Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本文提供了测序接头,其中至少一个胞嘧啶碱基为5‑羟甲基胞嘧啶(5hmC)。本文还提供了该测序接头在DNA甲基化检测中的应用。
Description
技术领域
本文涉及测序接头,尤其是包括甲基化胞嘧啶的测序接头。本文还涉及该测序接头在DNA甲基化检测中的应用。
背景技术
DNA化学修饰为DNA序列编码基因的表达增加了一层调控机制。这些化学修饰中,研究得最透彻的是5-甲基胞嘧啶(5mC),5mC这种表观遗传修饰,广泛存在于植物、动物等真核生物基因组中,称誉为“第五碱基”;5mC最初被发现位于CpG岛内,CpG岛是富含CpG二核苷酸的基因启动子区域常见的一段DNA片段。在这些启动子区域内,5mC充当了一种抑制基因转录稳定表观遗传标记的角色。
DNA甲基化与很多生理的、病理的因素相关,承载着大量生物学信息。随着NGS技术的发展,我们可以从全基因组层面分析DNA甲基化状态。甲基化测序方法种类繁多,重亚硫酸氢盐转化是甲基化测序的金标准,但是高温高盐的转化条件对样本造成较大损伤,基于酶转化模块的甲基化测序方法成为大家关注的热点。
发明内容
在一方面,本文提供了测序接头,其中至少一个胞嘧啶碱基为5-羟甲基胞嘧啶(5hmC)、5-甲酰基化胞嘧啶(5fC)或5-羧基化胞嘧啶(5caC)。
在一些实施方案中,所述测序接头中全部胞嘧啶碱基均为5hmC、5fC或5caC。
另一方面,本文提供了甲基化测序文库,其包括上述测序接头。
另一方面,本文提供了甲基化测序试剂盒,其包括上述测序接头。
在一些实施方案中,所述甲基化测序试剂盒还包括胞嘧啶脱氨酶,其中所述胞嘧啶脱氨酶不导致5fmC、5fC或5caC脱氨基。
在一些实施方案中,所述胞嘧啶脱氨酶为APOBEC,优选APOBEC3A。
另一方面,本文提供了上述测序接头在DNA甲基化检测中的应用。
另一方面,本文提供了提高甲基化测序文库建库效率的方法,其包括使用上述测序接头或甲基化测序试剂盒。
另一方面,本文提供了评估第一甲基化测序接头在DNA甲基化检测中是否发生转化的方法,包括在添加有所述甲基化测序接头的DNA分子上添加第二甲基化测序接头,以便对所述第一甲基化测序接头在转化后进行测序;优选地,所述第一甲基化测序接头和所述第二甲基化测序接头分别适用于不同的测序平台,如所述第一甲基化测序接头适用于Illumina平台,所述第二甲基化测序接头适用于MGI平台。
在一些实施方案中,所述第一甲基化测序接头和/或所述第二甲基化测序接头为前文所述测序接头。
附图说明
图1为甲基化文库构建流程示意图。
图2显示了C碱基甲基化修饰单体结构式。(A)5mC甲基化修饰单体结构式;(B)5hmC甲基化修饰单体结构式。
图3显示了甲基化接头,接头修饰示意图。接头序列中C碱基采用不同的甲基化单体。
图4显示了建库结果数据。(A)建库产量;(B)[Target]Average depth-[中靶]平均深度;(C)[Target]Average depth(rmdup)-[中靶]平均深度[去重]
图5显示了甲基化接头中C碱基过度转化的比例。(A)5mC修饰的C碱基,同一位点C碱基被转化成U碱基的比例;(B)5hmC修饰的C碱基,同一位点C碱基被转化成U的比例。
图6以条形图显示了图5中同一位点C碱基被转化成U的百分比结果。
具体实施方式
除非另有说明,本文使用的所有技术和科学术语具有本领域普通技术人员所通常理解的含义。
“DNA甲基化”在本文中指DNA分子或DNA片段中胞嘧啶碱基被修饰为5-甲基胞嘧啶(5mC)。脊椎动物中的DNA甲基化一般发生在CpG位点(即DNA序列中胞嘧啶后紧连鸟嘌呤的位点),经DNA甲基转移酶催化将胞嘧啶转化为5-甲基胞嘧啶。人类基因组中大多CpG位点已被甲基化,但是在某些特定区域,如富含胞嘧啶(C)和鸟嘌呤(G)的CpG岛则通常未被甲基化。CpG甲基化可影响相关基因的转录活性,例如,甲基化可抑制抑癌基因,而去甲基化则刺激某些癌基因的表达,这些情况下都有可能导致癌症发生。另外,尽管发生率低于5mC,也有少数胞嘧啶碱基被修饰为5-羟甲基胞嘧啶(5hmC)、5-甲酰基化胞嘧啶(5fC)、5-羧基化胞嘧啶(5caC)。本文中提到甲基化时,也可以指修饰为5hmC、5fC、5caC,除非上下文另有说明。
“甲基化测序”在本文中指通过测序来了解DNA分子或DNA片段中的胞嘧啶的甲基化状况,包括但不限于,甲基化位点、甲基化水平、甲基化方式(5mC或5hmC)等。可通过多种方式来检测一个胞嘧啶位点是否被甲基化。常用方法包括化学或酶转化法,在转化过程中甲基化胞嘧啶和未甲基的胞嘧啶中的一种转化为尿嘧啶(U)或者在碱基配对方式上基本上等同于尿嘧啶的碱基(例如二氢尿嘧啶,DHU)。在随后的扩增过程中,对应的尿嘧啶作为胸腺嘧啶(T)与腺嘌呤(A)配对,最终结果是该甲基化位点的胞嘧啶或甲基化胞嘧啶在检测结果(如测序结果)中以胸腺嘧啶体现出来。通过与参考序列对比,就能够确定DNA分子或DNA片段中的胞嘧啶是否被甲基化。该参考序列可以为来自相同样品但不经上述转化的序列,或者健康群体中的对应序列。另外,如下文有描述的,还可通过一些方法来对5mC和5hmC进行区分。目前,已经将DNA甲基化信息广泛用于癌症(例如,肺癌、乳腺癌、肝癌、结直肠癌等)筛查和诊断中,尤其是早期筛查和诊断。
“测序接头”在本文中指在DNA或RNA测序过程中使用的已知序列的短片段DNA或RNA,用于在样本中待测DNA或RNA的末端添加特定的序列,以便将其固定在测序仪的载体上。测序接头的一个重要作用是连接DNA或RNA分子到测序仪的载体上,并标记起始和终止点,以便在测序过程中识别并确定序列。在Illumina测序中,测序接头通常是一对短序列,称为“P5”和“P7”接头,每个都通常包括与流动池上固定的寡核苷酸单链链相同或互补的片段(P5和P7)、用于区分不同样本的Index序列以及测序引物结合部分(Rd1 SP和Rd2 SP)。这样,测序文库中的每个DNA片段都可以在测序过程中被复制和扩增,并且被准确地识别和测序。根据Index位置的不同,接头可以分为单端和双端Index接头。单端Index接头只在P7端存在Index序列,双端Index接头在P5和P7两端均存在Index序列。一般而言,Index序列的碱基数为6nt-10nt。接头还可以分为长接头(例如完整的Y型)和短接头(例如不完整的Y型接头)。长接头通过TA连接的方式连接到待测DNA片段两端,在文库产量足够的情况下,可不进行PCR扩增直接上机测序;而短接头通过TA连接的方式连接到待测DNA片段两端后,必须使用与短接头互补的Indexing Primers进行PCR扩增成为完整接头后,才能上机测序。另外,测序接头中还可以包括UDI(Unique dual Index)序列以克服标签跳跃问题或包括UMI(Unique Molecular Identifiers)序列以剔除扩增或测序错误。除了Illumina,其他测序平台也使用各种类型的测序接头,包括Roche/454、Ion Torrent、Pacific Biosciences、MGI等。这些不同的平台可能使用不同的测序技术和接头设计,但都涵盖在本文的测序接头范围内。
“甲基化测序接头”,或称为“甲基化修饰接头”,指用于检测样本中DNA甲基化情况的测序接头。甲基化测序接头中的胞嘧啶碱基可以被修饰,如甲基化,以便在后续胞嘧啶转化过程中保持序列不变。
“酶转化”在本文中指借助于特定酶(如胞嘧啶脱氨酶)的催化作用对胞嘧啶或甲基化胞嘧啶进行修饰,以便在随后的检测中可区分其甲基化和未甲基化状态,或者区分5mC和5hmC。本领域已知一些酶学转化方法,包括,例如但不限于,EM-seq转化法和TAPS转化法。酶转化中通常将这些酶与一些化学试剂配合使用。“转化”在本文中指包括酶转化在内的各种转化手段,例如还包括化学转化法,如亚硫酸氢盐处理。
本文中甲基化文库的构建流程参见图1。该流程适用于基因组DNA及血浆游离DNA的甲基化文库构建。现对该流程简述如下:基因组DNA使用超声打断的方式,打断至200-250bp的DNA片段;对打断后的基因组DNA或cfDNA进行末端修复、甲基化接头连接,接头连接产物的转化,使用NEB的酶转化模块(NEBNext Enzymatic Conversion module),将未甲基化的C碱基转化成U碱基,使用能够识别U碱基的扩增酶(KAPA HiFi HotStart Uracil Mix)进行PCR扩增,Qubit定量试剂对甲基化文库进行定量。该流程所用接头为甲基化修饰接头,本文对该甲基化修饰接头中C碱基的修饰形式进行研究,发现C碱基修饰类型影响所构建甲基化文库的建库效率。
甲基化接头示意图参见图3,接头序列中所用的C碱基发生了甲基化修饰,若采用非甲基化修饰的接头,转化过程中会将C碱基转化成U碱基,PCR扩增后U碱基会复制成为T碱基。接头序列改变会导致PCR扩增失败以及下游测序失败。采用双链建库方案构建甲基化文库时,会使用重压硫酸氢盐或者是酶转化模块对接头连接产物进行转化,所用接头必须是甲基化修饰的接头。针对不同转化模块,工作原理不同,所采用的甲基化修饰接头类型也会有差异。采用BS转化模块,常规的5mC修饰类型即可。重亚硫酸氢盐会通过磺化以及脱氨基两步反应对非甲基化修饰的C碱基转化成U碱基,5mC修饰的C碱基不会发生改变。NEB的酶转化模块使用TET2和氧化增强剂来保护修饰后的胞嘧啶免受下游去甲基化的影响。TET2通过级联反应将5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)氧化成5-羧甲基胞嘧啶(5caC)。这样可以保护5mC和5hmC免受去甲基化的影响。5hmC也可以通过使用氧化增强剂进行葡萄糖基化形成5ghmc来保护免受去甲基化的影响。5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)的结构见图2A和2B。第二个酶促步骤使用APOBEC脱氨基胞嘧啶形成U,但是没有影响5caC和5ghmC的状态。我们意外地发现针对EM转化模块,C碱基修饰类型,直接影响构建的甲基化接头的性能。若接头中的C碱基采用5mC进行修饰,使用EM转化模块时C碱基氧化不完全,APOBEC会将氧化不完全的C碱基转化成U,导致接头序列发生改变,从而导致PCR扩增过程中Index引物无法结合到接头序列,建库效率偏低,这是测序引物无法结合到相应的位点,导致测序失败,从而导致测序产出偏低。本文所选择的甲基化接头使用5hmC修饰(图2B),氧化更完全,选择该碱基修饰的甲基化接头,搭配EM转化模块构建甲基化文库时,其建库效率更高。
本研究通过优化甲基化接头的修饰方案,提高了酶转化方案的甲基化文库建库效率,提高甲基化文库的数据利用率。尤其是,本文提供一种甲基化修饰接头,接头中的C碱基采用5hmC修饰,而不是传统的5mC修饰,这种修饰方式更适用于酶转化模块,提高建库效率。其次,本文通过针对甲基化修饰的文库添加一种其他测序平台的接头,用来评估转化后甲基化接头的完整性。
以下通过实施例来进一步说明本发明。
实施例1
使用两种甲基化修饰的接头(分别包括5mC和5hmC)构建文库,对构建的文库进行杂交捕获,比较不同接头建库效率差异。
具体实验步骤如下。
甲基化文库的构建:基因组DNA使用超声打断的方式,打断至200~250bp的DNA片段;取50ng打断后的样本,使用甲基化文库构建试剂盒(for/>)#1002141构建甲基化文库。对打断后的基因组DNA(或cfDNA)进行末端修复、甲基化接头连接(采用两种不同类型的甲基化修饰形式)(图2和3),接头连接产物的转化(按试剂盒说明书操作),使用NEB的酶转化模块(NEBNext Enzymatic Conversion module,简称EM模块),将未甲基化的C碱基转化成U碱基,使用能够识别U碱基的扩增酶(2X HiFi-Methyl PCR Master Mix)进行PCR扩增,扩增循环数为5,Qubit定量试剂对甲基化文库进行定量,取500ng甲基化文库进行杂交捕获。杂交捕获试剂盒为/>Hybrid Capture Reagents(#1005102);靶向甲基化文库的构建过程主要包括:甲基化文库混合、浓缩,甲基化文库杂交,甲基化文库热洗脱,甲基化文库常温洗脱,靶向甲基化文库扩增和靶向甲基化文库纯化。纯化完成的靶向甲基化文库即可用于下游测序。
本实施例所用接头为两种类型甲基化接头:方案一,5mC修饰的甲基化接头;方案二,5hmC修饰的甲基化接头。通过建库产量以及建库产物中分析到的有效文库信息两个层面进行评估。
I5--ACACTCTTTCCCTACACGACGCTCTTCCGATC*T(SEQ ID NO:1)
I7--GATCGGAAGAGCACACGTCTGAACTCCAGT*C(SEQ ID NO:2)
*硫代修饰
实验结果参见图4A-4C。当采用所用5hmC甲基化接头建库时(合成甲基化接头序列时,使用5hmC单体原料),相对于5mC甲基化接头(合成甲基化接头序列时,使用5mC单体原料),能够提高文库产量,杂交捕获文库原始深度以及去重后的深度均高于5mC修饰的甲基化接头实验组。
实施例2
转化后文库中甲基化接头的完整性比较。
针对实施例1中构建的甲基化文库,加MGI测序平台的接头,构建MGI平台文库,送MGI-Seq2000测序仪进行测序。对文库中Illumina接头序列进行测序,通过分析甲基化接头序列,评估不同修饰类型甲基化接头在转化的过程中是否存在过度转化(即)的现象。具体分析结果参见图5A、5B和图6。图5中红色框代表该位点C碱基转化为U碱基。实验结果表明,使用5hmC修饰的甲基化接头,C碱基被过度转化的比例较低,使用5mC修饰的甲基化接头,C碱基被转化成U碱基的比例较高。
因此采用的甲基化修饰方式(采用5hmC替代5mC),能够提高甲基化文库的建库效率,是一种更优的甲基化接头修饰方案。
Claims (10)
1.测序接头,其中至少一个胞嘧啶碱基为5-羟甲基胞嘧啶(5hmC)、5-甲酰基化胞嘧啶(5fC)或5-羧基化胞嘧啶(5caC)。
2.如权利要求1所述的测序接头,其中全部胞嘧啶碱基均为5hmC、5fC或5caC。
3.甲基化测序文库,包括权利要求1或2所述的测序接头。
4.甲基化测序试剂盒,包括权利要求1或2所述的测序接头。
5.如权利要求4所述的甲基化测序试剂盒,还包括胞嘧啶脱氨酶,其中所述胞嘧啶脱氨酶不导致5fmC、5fC或5caC脱氨基。
6.如权利要求4或5所述的甲基化测序试剂盒,其中所述胞嘧啶脱氨酶为APOBEC,优选APOBEC3A。
7.权利要求1或2所述的测序接头在DNA甲基化检测中的应用。
8.提高甲基化测序文库建库效率的方法,包括使用权利要求1或2所述的测序接头或权利要求4-6任一项所述的甲基化测序试剂盒。
9.评估第一甲基化测序接头在DNA甲基化检测中是否发生转化的方法,包括在添加有所述甲基化测序接头的DNA分子上添加第二测序接头,以便对所述第一甲基化测序接头在转化后进行测序;优选地,所述第一甲基化测序接头和所述第二甲基化测序接头分别适用于不同的测序平台,如所述第一甲基化测序接头适用于Illumina平台,所述第二测序接头适用于MGI平台。
10.如权利要求9所述的方法,其中所述第一甲基化测序接头和/或所述第二测序接头为权利要求1或2所述的测序接头。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310422311.6A CN116287166A (zh) | 2023-04-19 | 2023-04-19 | 甲基化测序接头及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310422311.6A CN116287166A (zh) | 2023-04-19 | 2023-04-19 | 甲基化测序接头及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116287166A true CN116287166A (zh) | 2023-06-23 |
Family
ID=86788842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310422311.6A Pending CN116287166A (zh) | 2023-04-19 | 2023-04-19 | 甲基化测序接头及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116287166A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102534812A (zh) * | 2010-12-31 | 2012-07-04 | 深圳华大基因科技有限公司 | 一种细胞dna文库及其构建方法 |
WO2014165770A1 (en) * | 2013-04-05 | 2014-10-09 | The University Of Chicago | Single-base resolution sequencing of 5-formylcytosine (5fc) and 5-carboxylcytosine (5cac) |
US20140322707A1 (en) * | 2011-04-06 | 2014-10-30 | The University Of Chicago | COMPOSITION AND METHODS RELATED TO MODIFICATION OF 5-METHYLCYTOSINE (5-mC) |
CN113088562A (zh) * | 2020-01-08 | 2021-07-09 | 深圳华大基因股份有限公司 | 一种新型的低起始量dna甲基化建库方法 |
CN114480576A (zh) * | 2022-01-26 | 2022-05-13 | 纳昂达(南京)生物科技有限公司 | 靶向甲基化测序文库的构建方法及试剂盒 |
CN115181783A (zh) * | 2018-01-08 | 2022-10-14 | 路德维格癌症研究院 | 胞嘧啶修饰的免亚硫酸氢盐的碱基分辨率鉴定 |
WO2023003851A1 (en) * | 2021-07-20 | 2023-01-26 | Freenome Holdings, Inc. | Compositions and methods for improved 5-hydroxymethylated cytosine resolution in nucleic acid sequencing |
CN115928225A (zh) * | 2023-01-03 | 2023-04-07 | 京东方科技集团股份有限公司 | 游离dna甲基化文库构建方法及其文库、应用和试剂盒 |
-
2023
- 2023-04-19 CN CN202310422311.6A patent/CN116287166A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102534812A (zh) * | 2010-12-31 | 2012-07-04 | 深圳华大基因科技有限公司 | 一种细胞dna文库及其构建方法 |
US20140322707A1 (en) * | 2011-04-06 | 2014-10-30 | The University Of Chicago | COMPOSITION AND METHODS RELATED TO MODIFICATION OF 5-METHYLCYTOSINE (5-mC) |
WO2014165770A1 (en) * | 2013-04-05 | 2014-10-09 | The University Of Chicago | Single-base resolution sequencing of 5-formylcytosine (5fc) and 5-carboxylcytosine (5cac) |
CN115181783A (zh) * | 2018-01-08 | 2022-10-14 | 路德维格癌症研究院 | 胞嘧啶修饰的免亚硫酸氢盐的碱基分辨率鉴定 |
CN113088562A (zh) * | 2020-01-08 | 2021-07-09 | 深圳华大基因股份有限公司 | 一种新型的低起始量dna甲基化建库方法 |
WO2023003851A1 (en) * | 2021-07-20 | 2023-01-26 | Freenome Holdings, Inc. | Compositions and methods for improved 5-hydroxymethylated cytosine resolution in nucleic acid sequencing |
CN114480576A (zh) * | 2022-01-26 | 2022-05-13 | 纳昂达(南京)生物科技有限公司 | 靶向甲基化测序文库的构建方法及试剂盒 |
CN115928225A (zh) * | 2023-01-03 | 2023-04-07 | 京东方科技集团股份有限公司 | 游离dna甲基化文库构建方法及其文库、应用和试剂盒 |
Non-Patent Citations (2)
Title |
---|
唐文悦等: "DNA甲基化检测研究进展", 《分析科学学报》, vol. 38, no. 5, pages 641 - 648 * |
赵超;汪海林;: "DNA羟甲基化测序技术", 化学学报, no. 01, pages 24 - 33 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI752593B (zh) | 核酸鹼基修飾的測定 | |
EP2963127B1 (en) | High throughput detection of molecular markers based on restriction fragments | |
US20210262009A1 (en) | Methods for the epigenetic analysis of dna, particularly cell-free dna | |
JP2010535513A (ja) | 高スループット亜硫酸水素dnaシークエンシングのための方法および組成物ならびに有用性 | |
JP2007509629A (ja) | 二本鎖dnaの切断による複合核酸分析 | |
US10465241B2 (en) | High resolution STR analysis using next generation sequencing | |
US20210388445A1 (en) | Compositions and methods for cancer and neoplasia assessment | |
US11608518B2 (en) | Methods for analyzing nucleic acids | |
US20100129796A1 (en) | Dye probe fluorescence resonance energy transfer genotyping | |
US10889852B2 (en) | Genome methylation analysis | |
CN116287166A (zh) | 甲基化测序接头及其应用 | |
EP3022321A2 (en) | Mirror bisulfite analysis | |
WO2008009365A2 (en) | A method for determining the methylation rate of a nucleic acid | |
CN112126987A (zh) | 一种用于甲基化扩增子测序的建库方法 | |
US20060141475A1 (en) | Polynucleotide sequence detection assays and analysis | |
KR20190116773A (ko) | 분자 인덱스된 바이설파이트 시퀀싱 | |
US20240093300A1 (en) | Methylated dna fragment enrichment, methods, compositions and kits | |
US20100120036A1 (en) | Method for amplifying dna fragment | |
CN117778568A (zh) | 鉴别胃癌的标志物及应用 | |
CN115976160A (zh) | 基于点击化学的DNA中5-羧基胞嘧啶(5caC)的富集与定位分析方法 | |
Novroski et al. | The STR DECoDE Panel: Increased Diversity and Enhanced DNA Mixture Deconvolution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |