CN109825583A - 人重复元件dna甲基化作为肝癌早期诊断的标记物及其应用 - Google Patents

人重复元件dna甲基化作为肝癌早期诊断的标记物及其应用 Download PDF

Info

Publication number
CN109825583A
CN109825583A CN201910157573.8A CN201910157573A CN109825583A CN 109825583 A CN109825583 A CN 109825583A CN 201910157573 A CN201910157573 A CN 201910157573A CN 109825583 A CN109825583 A CN 109825583A
Authority
CN
China
Prior art keywords
marker
methylation
sequencing
site cpg
liver cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910157573.8A
Other languages
English (en)
Other versions
CN109825583B (zh
Inventor
汪小我
张祥林
方欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201910157573.8A priority Critical patent/CN109825583B/zh
Publication of CN109825583A publication Critical patent/CN109825583A/zh
Application granted granted Critical
Publication of CN109825583B publication Critical patent/CN109825583B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

人重复元件DNA甲基化作为肝癌早期诊断的标记物及其应用。本发明属于生物检测领域,涉及一种用于肝癌的标记物及其应用。这些标记物选自基因信息研究机构(GIRI)发布的Repbase数据中人重复元件的原型序列AluYg6上第64,AluSp上第72、231,L1HS第447、493、673,L1第380、448,AluYb3a2第230,LSAU第1569,LTR12E第446位置上修饰的CpG位点中的一个或多个。同时还提供了这些标记物的组合用于诊断肝癌或者预测肝癌患病风险的系统。这些标记物的甲基化状态在肿瘤组织和非肿瘤组织中存在明显差异,在肿瘤组织中低甲基化,这些标记物组合在测试集中区分患者是否患肝癌的准确率达到了90%。

Description

人重复元件DNA甲基化作为肝癌早期诊断的标记物及其应用
技术领域
本发明属于生物检测领域,涉及一种用于肝癌的标记物及其应用,具体涉及人重复元件DNA甲基化作为肝癌早期诊断的标记物及其应用。
背景技术
外周血检测疾病是一种微创甚至无创的检测方式。在外周血中有游离DNA,这些游离DNA来自于细胞凋亡释放到血液中的DNA,因此,通过对游离DNA的分析可以鉴别出机体内的出现一些问题。
DNA甲基化是表观遗传学的重要部分,DNA甲基化对基因调控有着至关重要的作用。现有研究表明癌症的发生与基因组DNA甲基化非常密切,这使得通过鉴别DNA甲基化的变异来检测癌症成为了现实。DNA甲基化是指生物体内在DNA甲基转移酶的催化下,以S-腺苷甲硫氨酸为甲基供体,将甲基转移到特定的碱基上的过程。在哺乳动物中DNA甲基化主要发生在CpG的C上,生成5-甲基胞嘧啶。
在基因组中98%以上的CpG位点分布于具有转座潜能的重复序列中。在正常细胞中,这些CpG处于高度甲基化/转录沉默的状态,而在肿瘤细胞中这些CpG发生了广泛的去甲基化,导致重复序列的转录、转座子的活化,增加基因组的不稳定性。余下的占总量2%左右的CpG密集地分布于基因启动子区域的CpG岛。筛选癌症组织特异的甲基化异常位点有助于癌症的检测。
肝癌是常见的一种恶性肿瘤,由于现有标记物特异性差(例如甲胎蛋白),许多肝癌患者诊断时往往已是中晚期,丧失了根治切除的机会。因此寻找早期肝癌外周血甲基化灵敏度高的标记物对于肝癌的早发现早治疗具有重要意义。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个目的在于提出一种能够用于肝癌的标记物以及应用。
本发明的发明人在研究过程中发现:重复元件在人基因组中比例超过2/3,是人基因组非常重要的组成部分。在肿瘤细胞中,重复元件上的CpG发生广泛的去甲基化,因此,重复元件上的CpG位点的DNA甲基化是潜在的癌症标记物。然而因为同类型重复元件的序列相似性,测序数据直接匹配回人参考基因组序列Hg19并不能保证有效的匹配率。因此,将测序数据匹配回重复元件的原型序列有助于提高对癌症发生过程中重复元件DNA甲基化模式变化的理解,为癌症诊断提供更有效的标记物。因此,在重复元件的原型序列上寻找检测癌症的标记物既有机制基础,也有实现基础。
具体而言,本发明提供了如下技术方案:
根据本发明的第一方面,本发明提供了一种用于肝癌的标记物,所述标记物包括选自下列CpG位点中的至少一个:原型序列AluYg6上第64,AluSp上第72、231,L1HS第447、493、673,L1第380、448,AluYb3a2第230,LSAU第1569,LTR12E第446位置处的CpG位点或者经修饰的CpG位点。给出的这些CpG位点或者经修饰的CpG位点的具体位置,均是以基因信息研究机构(GIRI)发布的Repbase数据中人重复元件的原型序列为基准表述的。需要说明的是,这些CpG位点的位置可能会因为数据库的数据更新或者因为不同数据库的表征方式的不同而发生变化,但是这些变化不影响这些位点用于诊断肝癌的功能。这些变化也包含在本发明的保护范围之内。
根据本发明的实施例,以上所述用于肝癌的标记物可以进一步包括如下技术特征:
在本发明的一些实施例中,所述标记物选自原型序列AluYg6上第64,AluSp上第72、231,L1HS第447、493、673位置处的CpG位点或者经修饰的CpG位点中的至少一个;以及L1第380、448,AluYb3a2第230,LSAU第1569,LTR12E第446位置处的CpG位点或者经修饰的CpG位点中的至少一个。
在本发明的一些实施例中,所述标记物选自原型序列AluYg6上第64,AluSp上第72、231,L1HS第447、493、673,L1第380、448位置处的CpG位点或者经修饰的CpG位点中的至少一个;以及AluYb3a2第230,LSAU第1569,LTR12E第446位置处的CpG位点或者经修饰的CpG位点中的至少两个;
在本发明的一些实施例中,所述标记物选自原型序列AluYg6上第64,AluSp上第72、231位置处的CpG位点或者经修饰的CpG位点中的至少一个;以及L1HS第447、493、673,L1第380、448,AluYb3a2第230,LSAU第1569,LTR12E第446位置处的CpG位点或者经修饰的CpG位点中的至少两个。
在本发明的一些实施例中,所述经修饰的CpG位点包括5-甲基化修饰或者5-羟甲基化修饰。
根据本发明的第二方面,本发明提供了一种引物序列,所述引物序列以本发明第一方面所述标记物所在的核苷酸序列为靶序列,用于靶序列的特异性扩增。
根据本发明的第三方面,本发明提供了一种探针,所述探针游离于溶液中或者固定于芯片上,所述探针能够特异性捕获本发明第一方面所述的标记物的所在的核苷酸序列。
根据本发明的第四方面,本发明提供了一种试剂盒,所述试剂盒用于诊断肝癌,所述试剂盒含有用于检测本发明第一方面所述的标记物的试剂。
在本发明的一些实施例中,所述试剂盒进一步包括本发明第二方面所述的引物序列或者本发明第三方面所述的探针。
根据本发明的第五方面,本发明提供了标记物或者引物序列或者探针在制备肝癌诊断试剂盒中的用途,所述标记物为本发明第一方面所述的标记物,所述引物序列为本发明第二方面所述的引物序列,所述探针为本发明第三方面所述的探针。
根据本发明的第六方面,本发明提供了一种确定待测样本中目标位点甲基化的方法,所述目标位点为本发明第一方面所述标记物中CpG位点,所述方法包括:(1)对所述待测样本外周血中的游离DNA进行甲基化处理,使得未发生甲基化的胞嘧啶转化为胸腺嘧啶,获得经甲基化处理后的样本;(2)基于所述经甲基化处理后的样本,构建测序文库,测序获得测序数据;(3)将所述测序数据与参考序列进行比对,基于比对结果确定所述测序数据中目标位点的甲基化结果。
根据本发明的实施例,以上所述确定待测样本中目标位点甲基化的方法可以进一步包括如下技术特征:
在本发明的一些实施例中,参考序列为基因信息研究机构(GIRI)发布的Repbase数据中人重复元件的原型序列。
在本发明的一些实施例中,所述测序是通过第二代测序方法或第三代测序方法进行的。利用已有的二代测序方法或者三代测序方法均可以实现对待测样本中的CpG位点的甲基化结果进行测定。
在本发明的一些实施例中,所述测序是通过选自Hiseq2000、SOliD、454和单分子测序装置的至少一种进行的。
根据本发明的第七方面,本发明提供了一种用于诊断肝癌或者预测肝癌患病风险的系统,包括:甲基化处理装置,所述甲基化处理装置用于对受试者外周血中的游离DNA进行甲基化处理,使得未发生甲基化的胞嘧啶转化为胸腺嘧啶,获得经甲基化处理后的样本;测序装置,所述测序装置与所述甲基化处理装置相连,所述测序装置基于所述富集样本,构建测序文库,测序获得测序数据;比对装置,所述比对装置与所述测序装置相连,所述比对装置用于所述测序数据与参考序列进行比对,基于比对结果确定所述测序数据中标记物CpG位点的甲基化结果;结果判定装置,所述结果判定装置与所述比对装置相连,所述结果判定装置基于所述测序数据中标记物中CpG位点的甲基化结果,通过统计模型分析,判定所述待测样本是否患有肝癌或者预测所述待测样本是否易患肝癌,其中,所述标记物为本发明第一方面任一所述标记物。
根据本发明的实施例,以上所述用于诊断肝癌或者预测肝癌患病风险的系统可以进一步包括如下技术特征:
在本发明的一些实施例中,所述参考序列为基因信息研究机构(GIRI)发布的Repbase数据中人重复元件的原型序列。
在本发明的一些实施例中,所述统计模型为多元统计模型。利用多元统计模型可以分析多个CpG位点甲基化情况同肝癌的关系,从而利用CpG位点的甲基化结果确定肝癌的患病情况,实现肝癌的早期快速诊断。
在本发明的一些实施例中,所述统计模型是基于多个肝癌患者和多个肝癌患者中CpG位点的甲基化结果建立的,所述CpG位点为本发明第一方面任一所述标记物中的CpG位点。
在本发明的一些实施例中,所述多元统计模型为logistic回归模型、随机森林模型中的至少一种,优选为logistic回归模型。回归模型是对统计关系进行定量描述的一种数学模型是,是通过模型研究一个变量关于另一个变量的具体依赖关系的计算模型。通过回归模型分析,可以研究各CpG位点或者多个CpG位点的甲基化结果同肝癌的关系,从而根据CpG位点的甲基化检测结果,即可以确定待测样本的患病情况。Logistic回归模型作为一种广义的线性回归模型,可以准确研究疾病和变量的关系。
在本发明的一些实施例中,利用软件bs-seeker2进行所述比对。软件所选匹配方式为局部比对(local alignment)。选择bs-seeker2匹配的原因是该软件支持’localalignment’的匹配模式,使用这种匹配模式有助于提高匹配回参考序列的比率,增加分析结果的鲁棒性。
本发明所取得的有益效果为:利用本发明提供的核酸序列作为标记物,能够以患者外周血为样本,通过检测病人外周血中重复元件原型序列的甲基化状态即可实现肝癌的早期诊断,从而在无创或者微创的情况下,即能够实现及时诊断肝癌。而且本发明所提供的标记物检测肝癌,特异性和灵敏性均很高,而且这些标记物在基因组中的拷贝数多,较少标记物即可以实现高精度检测。
附图说明
图1是根据本发明的实施例提供的人重复元件L1HS原型序列第673位置上CpG位点在肝癌组织和白细胞层上甲基化情况。
图2是根据本发明的实施例提供的人重复元件L1HS原型序列第673位置上CpG位点在健康人、HBV感染的非癌患者、早期肝癌患者外周血游离DNA的甲基化情况。
图3是根据本发明的实施例提供的外周血数据在人重复元件L1HS原型序列第673位置上CpG位点的甲基化水平鉴别非癌患者和癌症患者的ROC图。
图4是100次训练集和测试集拆分中,在测试集中准确率的箱体图。
图5是根据本发明的实施例提供的用于诊断肝癌或者预测肝癌患病风险的系统的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
为了方便本领域技术人员理解,对本文中出现的某些术语进行解释和说明,需要说明的是,这些解释和说明仅用来帮助本领域技术人员对于本发明进行理解,而不能看做是对本发明保护范围的限制。
本文中,CpG位点表示二核苷酸对,碱基鸟嘌呤(G)紧随胞嘧啶(C)之后,CpG是胞嘧啶(C)-磷酸(p)-鸟嘌呤(G)的缩写。
本文中,“标记物”是指能够用于指示受试者患有肝癌的情况。这些标记物可以是核酸序列、大分子、小分子等等,例如可以是一定长度的核酸序列,也可以是一个特定位点的核苷酸或者两个特定位点的核苷酸,只要能够用于指示受试者患有肝癌的情况。根据本发明的实施例,本发明提供的标记物指的是能够用于检测或者诊断受试者是否患者肝癌的CpG位点。
本文中,术语“重复元件”也称“重复序列”,是真核生物基因组中普遍存在的具有多个拷贝数的核酸序列。根据不同的拷贝数,通常可以将重复序列分为卫星DNA(高度串联重复序列)、小卫星和微卫星DNA(中度串联重复序列)、转座子等等。按照基因组中的分布方式,通常可以将重复序列分为串联重复序列,其重复单位首尾相连,成串排列,还有散布重复序列,其重复单位与其他无关重复序列或单拷贝序列相间排列。对这些重复元件或者重复序列中研究发现,其中存在的某些CpG位点可以用来指示肝癌的情况。
本发明提供了一种能够用来检测肝癌的标记物及应用。这些标记物是从人重复元件的原型参考序列中筛选出来的。本发明揭示了人重复元件甲基化异常的序列区域,筛选出了能够利用外周血DNA检测肝癌的11个CpG位点。这些区域的甲基化状态在肿瘤组织和非肿瘤组织中存在明显差异,在肿瘤组织中低甲基化,并且可以在外周血中很好地区分包含HBV感染病人在内的非肝癌患者和早期肝癌患者,这些标记物中单个CpG的AUC最高可以达到97%,在100%特异性下,可以取得80%的灵敏度。在测试集中,标记物的组合区分患者是否患肝癌的准确率达到了90%。
根据本发明的一个方面,本发明提供了一种用于肝癌的标记物,所述标记物以基因信息研究机构(GIRI)发布的Repbase数据中人重复元件的原型序列为基础,选自以下CpG位点中的至少一个:AluYg6上第64,AluSp上第72、231,L1HS第447、493、673,L1第380、448,AluYb3a2第230,LSAU第1569,LTR12E第446位置处CpG位点或者经修饰的CpG位点。用作标记物的CpG位点,可以是这些位点中的任意一个,任意两个,任意三个,任意四个,任意五个,任意六个,任意七个,任意八个,任意九个,任意十个,或者是全部。当用作标记物的CpG位点越多时,通过这些标记物进行肝癌诊断,所获得的诊断结果越可靠。
在至少一些实施方式中,AluYg6上第64,AluSp上第72、231,L1HS第447、673,L1第448位置处CpG位点或者经修饰的CpG位点,对于肝癌的诊断结果更准确,可以选择其中的一个或者两个位点作为标记物。在至少一些实施方式中,L1HS第493,L1第380,AluYb3a2第230,LSAU第1569,LTR12E第446位置处CpG位点或者经修饰的CpG位点,对于肝癌的诊断效果较其他CpG位点稍差,可以选择其中的至少两个位点作为标记物。
在本发明的至少一些实施方式中,所述CpG位点的修饰包括5-甲基化修饰、5-羟甲基化修饰。基于这些标记物,可以通过对外周血DNA进行处理,用于肝癌的早期诊断。也可以基于这些标记物,制备检测早期肝癌的检测试剂或者试剂盒。
根据本发明的另一方面,本发明提供了一种诊断肝癌的方法,包括:(1)对待测样本外周血中的游离DNA进行甲基化处理,使得未发生甲基化的胞嘧啶转化为胸腺嘧啶,获得经甲基化处理后的样本;(2)基于所述经甲基化处理的样本,构建测序文库,测序获得测序数据;(3)将所述测序数据与基因信息研究机构(GIRI)发布的Repbase数据中人重复元件的原型序列进行比对,基于比对结果确定所述测序数据中标记物CpG位点的甲基化结果;(4)基于所述测序数据中CpG位点的甲基化结果,通过统计模型分析,判定所述待测样本是否患有肝癌。需要说明的是,该方法不仅可以用来判断待测样本是否患有肝癌,还可以预测待测样本未来患有肝癌的风险,从而实现早点儿治疗或者预防。
在对待测样本外周血的游离DNA进行建库、测序,来获取各CpG位点的甲基化结果时,可以采用本领域通用的技术手段。在至少一些实施方式中,利用全基因组甲基化测序获取各CpG位点的甲基化结果。例如,将患者血液样本通过10分钟1600×g和10分钟16000×g离心过滤得到血浆;通过DSP Blood Mini Kit(Qiagen)提取DNA,每个病人DNA样本从4mL的血浆中提取;使用Illumina的Paired-End Sequencing Sample Preparation Kit进行甲基化接头;接下来,测序文库使用AMPure XP magnetic beads(Beckman Coulter)进行纯化,然后利用EpiTect Plus DNA Bisulfite Kit(Qiagen)进行两轮的重亚硫酸氢盐转化;将产物进行10个循环的PCR扩增,最后在HiSeq 2000(Illumina)进行单端测序。
本发明还提供了一种用于诊断肝癌或者预测肝癌患病风险的系统,如图5所示,包括:甲基化处理装置、测序装置、比对装置和结果判定装置,所述甲基化处理装置用于对受试者外周血中的游离DNA进行甲基化处理,使得未发生甲基化的胞嘧啶转化为胸腺嘧啶,获得经甲基化处理后的样本;所述测序装置与甲基化处理装置相连,所述测序装置基于所述甲基化处理后的样本,构建测序文库,在测序平台上获得测序数据;所述比对装置与所述测序装置相连,所述比对装置用于所述测序数据与参考序列进行比对,基于比对结果确定所述测序数据中标记物位置CpG位点的甲基化结果;所述结果判定装置与所述比对装置相连,所述结果判定装置基于所述测序数据中CpG位点的甲基化结果,通过统计模型分析,判定所述受试者是否患有肝癌或者预测所述待测样本是否易患肝癌。
下面将结合实施例对本发明的方案进行解释。本领域技术人员将会理解,下面的实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
实施例1全基因组甲基化测序数据筛选核糖体DNA上差异的CpG位点
我们使用2013年发表于PNAS题为”Noninvasive detection of cancer-associated genome-wide hypomethylation and copy number aberrations by plasmaDNA bisulfite sequencing”文章中发表的外周血重亚硫酸氢盐测序数据,数据存放于欧洲基因组-表型档案(European Genome-Phenome Archive),检索号为EGAS00001000566。这里使用到健康人(32个)、HBV感染非癌病人(8个)、早期肝癌病人(I期、II期,26个)的外周血DNA甲基化数据,以及其中15对肝癌组织和白细胞层DNA甲基化数据。
在基因信息研究机构(GIRI)发布的Repbase数据库中下载人重复元件的原型序列,共583条原型序列,31105个CpG位点。利用bs-seeker2软件将测序数据匹配回人重复元件的原型序列,不再去除测序重复,原因在于在原型序列上的测序覆盖度比较高。计算每个CpG位点的甲基化C个数和未甲基化C个数。
接下来,筛除那些匹配次数少的CpG位点,得到8855个有效的CpG位点。
这时,随机将病人拆分成两部分,一部分作为训练集,一部分作为测试集,其中,分别分别选择90%的健康人、90%的HBV感染非癌症人、90%的肝癌患者作为训练集,剩余的病人作为测试集。在训练集上筛选标记物,在测试集上进行测试。随机拆分过程重复100次,均进行后续的分析步骤。
利用训练集数据在8855个有效的CpG位点上筛选出能够有效区分非癌、癌患者的CpG位点。基本的操作是,利用每个CpG位点的甲基化水平区分非癌、癌患者,绘制每个CpG的ROC(receiver operating characteristic)曲线,计算AUC(area under curve)。对每个位点的AUC从大到小排序,筛选前30个CpG位点,一般前30个CpG位点的AUC均可以大于90%。
利用筛选出的前30个CpG位点,利用训练集数据训练正则化的logisitc回归模型,其中正则化是一范数约束,即Lasso回归,目的是减少过拟合,筛选有效的CpG位点。一范数约束的系数通过十倍交叉验证得到。最终选择出系数不为零的CpG位点,即为目标标记物。
通过100次的训练集和测试集的随机拆分,我们得到了100个正则化的logistic回归模型以及对应的CpG位点的组合,计算100次实验中CpG位点被选中的次数,我们可以得到表1的结果。表1中的CpG位点即是用于肝癌诊断的标记物。
表1 CpG位点选中的次数
进一步地,分析这些CpG位点在15对癌症组织和白细胞层上的甲基化程度,这些位点在癌症组织中均是低甲基化。以人重复元件L1HS原型序列第673位置处的CpG位点为例,图1示出了人重复元件L1HS原型序列第673位置处CpG位点在癌症组织和白细胞层DNA甲基化程度,从图1可以看出,第673位置处的CpG位点在癌症组织中显著低甲基化。
进一步地,比较在癌症和非癌症患者外周血中这些CpG位点的甲基化水平,发现在癌症病人中这些位点低甲基化。图2示出了人重复元件L1HS原型序列第673位置处CpG位点在健康人、感染HBV的非癌患者、早期肝癌患者外周血游离DNA中的甲基化水平。从图2可以看出,相比较于健康人,感染HBV的非癌患者、早期肝癌患者在人重复元件L1HS原型序列第673位置CpG位点的甲基化水平较低。尤其是早期肝癌患者在人重复元件L1HS原型序列第673位置CpG位点的甲基化水平更低。
同时,图3示出了利用人重复元件L1HS原型序列第673位置处CpG位点区分非癌患者和早期肝癌患者的ROC曲线图。从图3可以看出,仅依靠第673位置处CpG位点的甲基化水平即可有效区分癌症患者和非癌症患者,AUC=97.4%,在100%特异性下,可以取得80%以上的灵敏度。
实施例2测试集中测试标记物的效果
在100次训练集和测试集的随机拆分中,利用训练集训练了正则化的logistic模型,将模型应用于测试集,计算出在测试集中的准确率,图4给出了在100次数据集随机拆分中,模型在测试集中准确率的箱线图。平均准确率为0.90,准确率的标准差为0.11,说明取得了非常好的区分效果。
本文中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接或彼此可通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种用于肝癌的标记物,其特征在于,包括选自下列CpG位点中的至少一个:
原型序列AluYg6上第64,AluSp上第72、231,L1HS第447、493、673,L1第380、448,AluYb3a2第230,LSAU第1569,LTR12E第446位置处的CpG位点或者经修饰的CpG位点;
任选地,所述标记物选自原型序列AluYg6上第64,AluSp上第72、231,L1HS第447、493、673位置处的CpG位点或者经修饰的CpG位点中的至少一个;以及L1第380、448,AluYb3a2第230,LSAU第1569,LTR12E第446位置处的CpG位点或者经修饰的CpG位点中的至少一个。
2.根据权利要求1所述的标记物,其特征在于,所述标记物选自原型序列AluYg6上第64,AluSp上第72、231,L1HS第447、493、673,L1第380、448位置处的CpG位点或者经修饰的CpG位点中的至少一个;以及AluYb3a2第230,LSAU第1569,LTR12E第446位置处的CpG位点或者经修饰的CpG位点中的至少两个;
任选地,所述标记物选自原型序列AluYg6上第64,AluSp上第72、231位置处的CpG位点或者经修饰的CpG位点中的至少一个;以及L1HS第447、493、673,L1第380、448,AluYb3a2第230,LSAU第1569,LTR12E第446位置处的CpG位点或者经修饰的CpG位点中的至少两个。
3.根据权利要求1所述的标记物,其特征在于,所述经修饰的CpG位点包括5-甲基化修饰或者5-羟甲基化修饰。
4.一种引物序列,其特征在于,所述引物序列以权利要求1~3任一所述的标记物所在的核苷酸序列为靶序列,用于靶序列的特异性扩增。
5.一种探针,所述探针游离于溶液中或者固定于芯片上,其特征在于,所述探针能够特异性捕获权利要求1~3任一所述的标记物所在的核苷酸序列。
6.一种试剂盒,其特征在于,所述试剂盒用于诊断肝癌,所述试剂盒含有用于检测权利要求1~3任一所述的标记物的试剂;
任选地,所述试剂盒进一步包括权利要求4所述的引物序列或权利要求5所述的探针。
7.权利要求1~3任一所述的标记物或者权利要求4所述的引物序列或者权利要求5所述的探针在制备肝癌诊断试剂盒中的用途。
8.一种确定待测样本中目标位点甲基化的方法,所述目标位点为权利要求1~3中任一所述标记物中的CpG位点,所述方法包括:
(1)对所述待测样本外周血中的游离DNA进行甲基化处理,使得未发生甲基化的胞嘧啶转化为胸腺嘧啶,获得经甲基化处理后的样本;
(2)基于所述经甲基化处理后的样本,构建测序文库,测序获得测序数据;
(3)将所述测序数据与参考序列进行比对,基于比对结果确定所述测序数据中目标位点的甲基化结果;
任选地,所述参考序列为基因信息研究机构(GIRI)发布的Repbase数据中人重复元件的原型序列;
任选地,所述测序是通过第二代测序方法或第三代测序方法进行的;
任选地,所述测序是通过选自Hiseq2000、SOliD、454和单分子测序装置的至少一种进行的。
9.一种用于诊断肝癌或者预测肝癌患病风险的系统,其特征在于,包括:
甲基化处理装置,所述甲基化处理装置用于对受试者外周血中的游离DNA进行甲基化处理,使得未发生甲基化的胞嘧啶转化为胸腺嘧啶,获得经甲基化处理后的样本;
测序装置,所述测序装置与甲基化处理装置相连,所述测序装置基于所述经甲基化处理后的样本,构建测序文库,测序获得测序数据;
比对装置,所述比对装置与所述测序装置相连,所述比对装置用于所述测序数据与参考序列进行比对,基于比对结果确定所述测序数据中标记物中CpG位点的甲基化结果;
结果判定装置,所述结果判定装置与所述比对装置相连,所述结果判定装置基于所述测序数据中标记物中CpG位点的甲基化结果,通过统计模型分析,判定所述待测样本是否患有肝癌或者预测所述待测样本是否易患肝癌;
其中,所述标记物为权利要求1~3任一所述标记物。
10.根据权利要求9所述的系统,其特征在于,所述参考序列为基因信息研究机构(GIRI)发布的Repbase数据中人重复元件的原型序列;
任选地,所述统计模型为多元统计模型;
任选地,所述统计模型是基于多个肝癌患者和多个肝癌患者中CpG位点的甲基化结果建立的,所述CpG位点为权利要求1~3中任一所述标记物中的CpG位点;
任选地,所述多元统计模型为logistic回归模型、随机森林模型中的至少一种,优选为logistic回归模型;
利用软件bs-seeker2进行所述比对,软件所选匹配方式为局部比对(localalignment)。
CN201910157573.8A 2019-03-01 2019-03-01 人重复元件dna甲基化作为肝癌早期诊断的标记物及其应用 Active CN109825583B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910157573.8A CN109825583B (zh) 2019-03-01 2019-03-01 人重复元件dna甲基化作为肝癌早期诊断的标记物及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910157573.8A CN109825583B (zh) 2019-03-01 2019-03-01 人重复元件dna甲基化作为肝癌早期诊断的标记物及其应用

Publications (2)

Publication Number Publication Date
CN109825583A true CN109825583A (zh) 2019-05-31
CN109825583B CN109825583B (zh) 2021-08-17

Family

ID=66864972

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910157573.8A Active CN109825583B (zh) 2019-03-01 2019-03-01 人重复元件dna甲基化作为肝癌早期诊断的标记物及其应用

Country Status (1)

Country Link
CN (1) CN109825583B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112735514A (zh) * 2021-01-18 2021-04-30 清华大学 神经网络提取调控dna组合模式的训练和可视化方法及系统
CN113234817A (zh) * 2021-04-14 2021-08-10 首都医科大学附属北京佑安医院 利用CpG位点甲基化水平检测早期肝癌的标志物
CN114657247A (zh) * 2022-02-28 2022-06-24 北京莱盟君泰国际医疗技术开发有限公司 用于早期肝癌检测的dna甲基化生物标记物或组合及其应用
CN114787386A (zh) * 2019-10-08 2022-07-22 乐彼代株式会社 确定生物样本是否源自肝脏组织的方法
CN115287353A (zh) * 2022-01-24 2022-11-04 南京世和医疗器械有限公司 一种肝癌血浆游离dna来源的甲基化标志物及用途
CN117594243A (zh) * 2023-10-13 2024-02-23 太原理工大学 基于跨模态视图关联发现网络的卵巢癌预后预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1451759A (zh) * 2002-04-15 2003-10-29 上海市肿瘤研究所 肝癌相关基因启动子CpG岛的甲基化状态及其应用
CN102105585A (zh) * 2008-06-11 2011-06-22 住友化学株式会社 对dna进行定量或检测的方法
US8703419B2 (en) * 2009-12-11 2014-04-22 Korea Research Institute Of Bioscience And Biotechnology Method for diagnosis/prognosis of cancers using an epigenetic marker consisting of a specific single CpG site in TTP promoter and treatment of cancers by regulating its epigenetic status
WO2014093825A1 (en) * 2012-12-14 2014-06-19 Chronix Biomedical Personalized biomarkers for cancer
CN108753979A (zh) * 2018-07-09 2018-11-06 安徽达健医学科技有限公司 一种用于肝癌早期筛查的试剂盒及其使用方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1451759A (zh) * 2002-04-15 2003-10-29 上海市肿瘤研究所 肝癌相关基因启动子CpG岛的甲基化状态及其应用
CN102105585A (zh) * 2008-06-11 2011-06-22 住友化学株式会社 对dna进行定量或检测的方法
US8703419B2 (en) * 2009-12-11 2014-04-22 Korea Research Institute Of Bioscience And Biotechnology Method for diagnosis/prognosis of cancers using an epigenetic marker consisting of a specific single CpG site in TTP promoter and treatment of cancers by regulating its epigenetic status
WO2014093825A1 (en) * 2012-12-14 2014-06-19 Chronix Biomedical Personalized biomarkers for cancer
CN108753979A (zh) * 2018-07-09 2018-11-06 安徽达健医学科技有限公司 一种用于肝癌早期筛查的试剂盒及其使用方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
K C ALLEN CHAN ET AL.: "Noninvasive Detection of Cancer-Associated Genome-Wide Hypomethylation and Copy Number Aberrations by Plasma DNA Bisulfite Sequencing", 《PNAS》 *
吴少瑜: "DNA甲基化和基因组印记现象", 《山东医药》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114787386A (zh) * 2019-10-08 2022-07-22 乐彼代株式会社 确定生物样本是否源自肝脏组织的方法
CN112735514A (zh) * 2021-01-18 2021-04-30 清华大学 神经网络提取调控dna组合模式的训练和可视化方法及系统
CN112735514B (zh) * 2021-01-18 2022-09-16 清华大学 神经网络提取调控dna组合模式的训练和可视化方法及系统
CN113234817A (zh) * 2021-04-14 2021-08-10 首都医科大学附属北京佑安医院 利用CpG位点甲基化水平检测早期肝癌的标志物
CN115287353A (zh) * 2022-01-24 2022-11-04 南京世和医疗器械有限公司 一种肝癌血浆游离dna来源的甲基化标志物及用途
CN115287353B (zh) * 2022-01-24 2023-10-27 南京世和医疗器械有限公司 一种肝癌血浆游离dna来源的甲基化标志物及用途
CN114657247A (zh) * 2022-02-28 2022-06-24 北京莱盟君泰国际医疗技术开发有限公司 用于早期肝癌检测的dna甲基化生物标记物或组合及其应用
CN114657247B (zh) * 2022-02-28 2022-12-02 北京莱盟君泰国际医疗技术开发有限公司 用于早期肝癌检测的dna甲基化生物标记物或组合及其应用
CN117594243A (zh) * 2023-10-13 2024-02-23 太原理工大学 基于跨模态视图关联发现网络的卵巢癌预后预测方法
CN117594243B (zh) * 2023-10-13 2024-05-14 太原理工大学 基于跨模态视图关联发现网络的卵巢癌预后预测方法

Also Published As

Publication number Publication date
CN109825583B (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN109825583A (zh) 人重复元件dna甲基化作为肝癌早期诊断的标记物及其应用
CN106047998B (zh) 一种肺癌基因的检测方法及应用
CN109825584A (zh) 利用外周血诊断早期肝癌的dna甲基化标记物及其应用
CN108753967A (zh) 一种用于肝癌检测的基因集及其panel检测设计方法
CN101353695B (zh) 尿沉淀dna甲基化谱式分析诊断膀胱癌的方法和试剂盒
CN108064314A (zh) 判定癌症状态之方法及系统
CN102311953B (zh) 尿液诊断膀胱癌的方法和试剂盒
US20050282227A1 (en) Treatment discovery based on CGH analysis
CN110168108A (zh) 血浆中稀少dna的去卷积和检测
CN109072310A (zh) 在尿液中检测癌症
CN109680049A (zh) 一种基于血液游离DNA高通量测序分析cfDNA所属个体生理状态的方法及其应用
Poage et al. Identification of an epigenetic profile classifier that is associated with survival in head and neck cancer
Tanić et al. Epigenome-wide association studies for cancer biomarker discovery in circulating cell-free DNA: technical advances and challenges
JP2014519319A (ja) エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物
Peng et al. Identifying the tissues-of-origin of circulating cell-free DNAs is a promising way in noninvasive diagnostics
CN113667753B (zh) 用于肺癌诊断的试剂盒、装置及方法
KR101992785B1 (ko) Gnas 유전자의 메틸화 수준을 이용한 고혈압의 예측 또는 진단을 위한 정보제공방법 및 이를 위한 조성물
CN110195107A (zh) 外周血中癌症检测的核糖体dna甲基化标记物及其应用
US20140206565A1 (en) Esophageal Cancer Markers
CN107119144A (zh) 多功能转录调控因子ctcf的dna结合位点ctcf_55的应用
CN113817822B (zh) 一种基于甲基化检测的肿瘤诊断试剂盒及其应用
CN107227366A (zh) 多功能转录调控因子ctcf的dna结合位点ctcf_113的应用
CN107151708A (zh) 多功能转录调控因子ctcf的dna结合位点ctcf_13的应用
CN114250298B (zh) 胰腺导管腺癌的dna甲基化标志物及其应用
CN107227365A (zh) 多功能转录调控因子ctcf的dna结合位点ctcf_33的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant