CN113234817A - 利用CpG位点甲基化水平检测早期肝癌的标志物 - Google Patents
利用CpG位点甲基化水平检测早期肝癌的标志物 Download PDFInfo
- Publication number
- CN113234817A CN113234817A CN202110398309.0A CN202110398309A CN113234817A CN 113234817 A CN113234817 A CN 113234817A CN 202110398309 A CN202110398309 A CN 202110398309A CN 113234817 A CN113234817 A CN 113234817A
- Authority
- CN
- China
- Prior art keywords
- artificial sequence
- liver cancer
- dna
- marker
- early liver
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 201000007270 liver cancer Diseases 0.000 title claims abstract description 88
- 208000014018 liver neoplasm Diseases 0.000 title claims abstract description 83
- 239000003550 marker Substances 0.000 title claims abstract description 31
- 230000011987 methylation Effects 0.000 title claims abstract description 25
- 238000007069 methylation reaction Methods 0.000 title claims abstract description 25
- 102100023635 Alpha-fetoprotein Human genes 0.000 claims description 14
- 108091029430 CpG site Proteins 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 3
- 108010026331 alpha-Fetoproteins Proteins 0.000 claims description 2
- 102000013529 alpha-Fetoproteins Human genes 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 12
- 238000001514 detection method Methods 0.000 abstract description 10
- 230000008859 change Effects 0.000 abstract description 8
- 238000003384 imaging method Methods 0.000 abstract description 4
- 210000004185 liver Anatomy 0.000 abstract description 3
- 238000012317 liver biopsy Methods 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 75
- 208000002672 hepatitis B Diseases 0.000 description 32
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 29
- 238000003745 diagnosis Methods 0.000 description 23
- 238000011160 research Methods 0.000 description 17
- 230000007067 DNA methylation Effects 0.000 description 15
- 238000012549 training Methods 0.000 description 15
- 238000010200 validation analysis Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 13
- 238000013399 early diagnosis Methods 0.000 description 13
- 206010028980 Neoplasm Diseases 0.000 description 11
- 238000012163 sequencing technique Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- 241000700721 Hepatitis B virus Species 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 230000018109 developmental process Effects 0.000 description 7
- 208000000419 Chronic Hepatitis B Diseases 0.000 description 6
- 208000019425 cirrhosis of liver Diseases 0.000 description 6
- 208000019423 liver disease Diseases 0.000 description 6
- 238000012502 risk assessment Methods 0.000 description 6
- 208000024891 symptom Diseases 0.000 description 6
- 206010016654 Fibrosis Diseases 0.000 description 5
- 230000007882 cirrhosis Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 210000000987 immune system Anatomy 0.000 description 5
- 230000036039 immunity Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000011088 calibration curve Methods 0.000 description 4
- 201000011510 cancer Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000007621 cluster analysis Methods 0.000 description 3
- 230000034994 death Effects 0.000 description 3
- 231100000517 death Toxicity 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000006454 hepatitis Diseases 0.000 description 3
- 231100000283 hepatitis Toxicity 0.000 description 3
- 238000012165 high-throughput sequencing Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 210000001616 monocyte Anatomy 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 206010019799 Hepatitis viral Diseases 0.000 description 2
- 208000037581 Persistent Infection Diseases 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000017188 evasion or tolerance of host immune response Effects 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000036737 immune function Effects 0.000 description 2
- 230000003908 liver function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 2
- 238000012257 pre-denaturation Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 201000001862 viral hepatitis Diseases 0.000 description 2
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 101000716807 Arabidopsis thaliana Protein SCO1 homolog 1, mitochondrial Proteins 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- 208000037051 Chromosomal Instability Diseases 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 1
- 208000000624 Esophageal and Gastric Varices Diseases 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 102100032530 Glypican-3 Human genes 0.000 description 1
- 102100021184 Golgi membrane protein 1 Human genes 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 208000037357 HIV infectious disease Diseases 0.000 description 1
- 206010019668 Hepatic fibrosis Diseases 0.000 description 1
- 101001014668 Homo sapiens Glypican-3 Proteins 0.000 description 1
- 101001040742 Homo sapiens Golgi membrane protein 1 Proteins 0.000 description 1
- 101001076715 Homo sapiens RNA-binding protein 39 Proteins 0.000 description 1
- 101000773122 Homo sapiens Thioredoxin domain-containing protein 5 Proteins 0.000 description 1
- 102000001749 Immunologic Receptors Human genes 0.000 description 1
- 108010054738 Immunologic Receptors Proteins 0.000 description 1
- 102000048143 Insulin-Like Growth Factor II Human genes 0.000 description 1
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 102100023361 SAP domain-containing ribonucleoprotein Human genes 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 206010041660 Splenomegaly Diseases 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 102100030269 Thioredoxin domain-containing protein 5 Human genes 0.000 description 1
- 206010070863 Toxicity to various agents Diseases 0.000 description 1
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 description 1
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000030741 antigen processing and presentation Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000001369 bisulfite sequencing Methods 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 238000002575 gastroscopy Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 1
- 238000011502 immune monitoring Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000037451 immune surveillance Effects 0.000 description 1
- 230000036046 immunoreaction Effects 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000024121 nodulation Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003393 splenic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000005740 tumor formation Effects 0.000 description 1
- 239000000439 tumor marker Substances 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Hospice & Palliative Care (AREA)
- Biophysics (AREA)
- Oncology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种利用CpG位点甲基化水平检测早期肝癌的标志物。其用于检测早期肝癌,主要包括如下甲基化位点:cg14171514、cg07721852、cg05166871、cg18087306、cg05213896、cg18772205。本发明采用CpG位点甲基化水平变化检测早期肝癌,无需传统肝活检,CT、MRI和其他影像学检查,检测水平可靠性高,开发了一种对人体肝脏无损检测的新方法。
Description
技术领域
本发明属于肝病检测技术领域,具体涉及一种利用CpG位点甲基化水平检测早期肝癌的标志物。
背景技术
乙肝相关肝癌已成为严重威胁我国人民生命健康的常见疾病:我国是乙型肝炎病毒 (Hepatitis B virus,HBV)感染高流行国家,人群乙肝表面抗原(HBsAg)携带率为7.18%,现有慢性HBV感染者约9300万人。HBV感染者发生原发性肝癌(Primaryhepatocellular carcinoma,HCC)的可能性是正常人群的100倍。同时我国也是原发性肝癌高发国家,全球每年新发肝癌约100万,我国占55%;平均每年每10万人口中35人患有HCC,明显高于欧美国家。目前,我国每年死于肝癌的人数超过20万,在肿瘤相关死亡中仅次于肺癌,位居第二。因此,针对乙肝相关肝癌防治因素的研究对于提高我国人民健康水平具有重要意义。
乙肝相关肝癌早期诊断标志物研究的问题与局限:近年来肝癌诊断标志物在基因组、 MicroRNA及蛋白组学等基础研究方面硕果累累。但因肝癌细胞生物学特性具有复杂性及多态性,不同时期的癌细胞在生长速率、表面受体、免疫特性、浸润性、转移性、对药物毒性方面均可能不同,且肝癌细胞具有显著的异质性,在原发肝癌肿瘤细胞中存在着不同的肿瘤细胞亚群,这些亚群具有不同的形态、不同的增殖能力、不同的表型和染色体组型的特征。肝癌细胞的异质性导致了相关标志物检测的差异较大,导致基础研究发现的标志物在临床转化验证时缺乏普遍适用性。如:AFP-L3、DCP、GPC3、GP73、VEGF、AFU、IGF-Ⅱ等虽为目前国际肝癌诊断领域最有价值的标志物,每一种肿瘤标志物在诊断价值上都有其独特的优势,但也因肝癌异质性而导致其诊断局限性,特别是在肝癌早期诊断方面,尚无特异性早期诊断标志物。综上所述,目前乙肝相关肝癌早期诊断标志物研究的科学问题在于如何解决肿瘤异质性。
机体免疫在控制肝癌发生发展中发挥重要作用,肝癌相关免疫反应标志物成为肝癌早期诊断标志物研究新方向:乙肝相关肝癌的发生发展经历一个相对较长的过程,可以分为免疫清除期、免疫平衡期和免疫逃逸期:基于临床症状又可分为分子进展期、前临床期和临床症状期。分子进展期包括基因突变、细胞转换和免疫清除,对应于免疫清除期;前临床期又可分为初始期(即免疫平衡期:肿瘤形成但现有影像检测方法无法检测)和前临床诊断期(肿瘤可以检测到但尚无临床症状),临床症状期(对应免疫逃逸期)即现在统称肿瘤晚期,癌肿4.5-8厘米并伴有明确临床症状。由此可见,宿主免疫系统通过“免疫监视”功能,参与肿瘤发生、发展的全过程,随着肿瘤负荷变化而发生动态变化,并不受肝癌异质性影响。因此,以肝癌相关免疫反应变化为核心的标志物研究可成功解决肿瘤异质性难题,成为肝癌早期诊断标志物筛选的新思路。
DNA甲基化谱全面系统展现肝癌相关免疫动态变化,在肝癌早期诊断标志物研究中优势凸显:机体免疫系统通过“免疫监视”功能,包括:抗原识别、抗原递呈、细胞毒作用等参与肿瘤发生、发展的全过程,参与的免疫细胞,免疫分子数百种,而且呈现动态网络变化,单一监测某种细胞或细胞因子不足以反映机体免疫系统在肝癌发生发展中的整体变化。因此,虽然机体免疫在控制肝癌发生发展中发挥重要作用已经成为共识,但至今尚未发现某种免疫标志物可用于肝癌的诊断。随着人类基因组测序计划的完成,以及基因组学、蛋白组学、高通量测序技术的广泛应用,DNA甲基化在细胞正常发育、遗传、基因表达调控、基因修复以及染色体稳定等方面发挥的重要作用亦日渐凸显。涵盖450000免疫功能位点的DNA甲基化谱可全面、系统展现免疫系统在肝癌各期病情进展中的细微变化。因此,通过DNA甲基化谱全面展现肝癌相关免疫动态变化,进而筛选肝癌早期诊断标志物成为肝癌诊断标志物研究新亮点。
发明内容
本发明的目的在于提供一种利用CpG位点甲基化水平检测早期肝癌的标志物。
一种利用CpG位点甲基化水平检测早期肝癌的标志物,其特征在于,所述标志物包括如下甲基化位点:cg04998202、cg20253872、cg05702218、cg12467404、cg14171514、cg07721852、 cg03734874、cg05891094、cg21402921、cg04484415、cg27395066、cg05166871、cg11783901、 cg22632947、cg02185248、cg18087306、cg05213896、cg09404516、cg09778596、cg01620164、 cg15462501、cg25635352、cg18772205、cg09470983、cg04398282、cg17588578、cg15747825、 cg14279856、cg20445774、cg04749631、cg04115680、cg21183256、cg27616227、cg02243522。
扩增所述利用CpG位点甲基化水平检测早期肝癌的标志物的引物。
所述引物序列如序列表SEQ ID NO:1-SEQ ID NO:68所示。
所述利用CpG位点甲基化水平检测早期肝癌的标志物在评估早期肝癌中的应用。
所述利用CpG位点甲基化水平检测早期肝癌的标志物在制备检测早期肝癌的试剂盒中的应用。
优选的,所述检测早期肝癌采用如下标志物:cg14171514、cg07721852、cg05166871、cg18087306、cg05213896、cg18772205;
早期肝癌患病概率采用如下公式计算:
其中,
X=-1.0944708-0.7183741×G+1.7286974×A+0.2761166×log10(AFP)+0.7902764×SCms;
式中,G为性别、A为年龄、AFP为甲胎蛋白;
SCms=-0.8711-3.7342*cg14171514+2.5885*cg07721852+6.9108*cg05166871-9.8593*cg180873 06+4.5009*cg05213896+4.3853*cg18772205。
本发明的有益效果:本发明采用CpG位点甲基化水平变化检测早期肝癌,无需传统肝活检,CT、MRI和其他影像学检查,检测水平可靠性高,开发了一种对人体肝脏无损检测的新方法。本发明HCCe模型中包括年龄、性别、AFP和six-CG-mixer没有其他相关风险因子。单因素分析后的独立风险因子包括训练集中通过单因素风险分析年龄、性别、ALT、AST、DBIL、γ-GT、ALP、单核细胞、log(AFP)、Six-CGs-mixer独立风险因子。多因素风险分析由于共线性的影响只有年龄、性别、log(AFP)、Six-CGs-mixer。Six-CGs-mixer相对于其他临床资料更加具有诊断价值。
附图说明
图1为本发明思路总体方案。
图2为veen图展示CHB相对各期HCC的特异性CGs。
图3为HCC早期肝癌特异性CGs,无监督聚类分析能够将肝病与HCC早期肝癌区分开。
图4为Targeted Bisulfite Sequencing流程图。
图5A:LASSO-交叉验证(cross validation)拟合选取34CGs出11个(p<0.05)每一条曲线代表了每一个自变量系数的变化轨迹,纵坐标是系数的值,下横坐标是log(λ),上横坐标是此时模型中非零系数的个数;B:对于每一个λ值,在红点所示目标参量及其置信区间。两条虚线分别指示最小λ值(λmin)和标准差λ值(λ1se),λ1se所示模型最简单。
图6全子集回归筛选6个CGs位点;A car:subsets函数筛选两种最优组合;Bleaps: regsubsets筛选最优组合结果。
图7为Six-CGs-mixer及单独每个CGs的在训练集A、B的AUROC。
图8为HCCe Model在训练集A、B、C的AUROC。
图9为HCCe Model在训练集A的列线图及其校正曲线。
图10为HCCe Model在验证集B的列线图及其校正曲线。
图11为HCCe Model在验证集C的列线图及其校正曲线。
图12为训练集A列线图的DCA分析和临床影响分析。
图13为验证集B(早期HCC)列线图的DCA分析和临床影响分析。
图14为验证集C(晚期HCC)列线图的DCA分析和临床影响。
具体实施方式
下面结合附图和具体实施例对本发明做进一步说明。
本发明从2009年开始建立乙肝相关疾病队列,目前共收集队列患者2113例,其中慢性乙型肝炎244例,乙肝肝硬化1045例,原发性肝癌824例。所有患者均有详细医疗记录和标本(血浆、PBMC、DNA)保存,并签署知情同意。本队列特点:上述2113例患者均每3个月动态随访一次,所有临床资料包括临床症候学、临床检验学、临床影像学、临床病理学和预留的血浆、细胞标本。上述队列建设已获得北京市临床数据库和样本资源库支持,相关信息见www.beijingbiobank.cn/Web/。
本发明拟在前期筛选肝癌早期及各期特异性外周血单个核细胞DNA甲基化谱的基础上,运用已建设的乙肝相关疾病研究队列和以临床分期为基础的五位一体数据样本资源库;基于二代测序的技术的多重亚硫酸测序(Multiplex Bisulfite Sequencing,MBS);检测34个乙肝相关肝癌早期特异性DNA甲基化标志物的甲基化比率。
运用乙肝相关疾病研究队列,检测乙肝相关肝癌早期特异性DNA甲基化标志物,带入肝癌早期诊断模型,比较DNA甲基化诊断模型阳性者肝癌患病率是否显著高于诊断模型阴性者,进一步验证乙肝相关肝癌早期特异性DNA甲基化诊断标志物组合诊断模型的临床诊断价值,包括:诊断符合率、灵敏度、特异度、阳性预测值和阴性预测值。如图1为本发明思路总体方案。
实施例1
既往肝癌相关免疫研究多针对免疫细胞或免疫分子,本实施例基于当前组学研究成果,运用高通量测序方法,从目前发现的450000个免疫功能位点相关的DNA甲基化谱中全面、系统展现免疫系统在肝癌发生发展中的细微变化。样本量计算采用如下公式:
其中设定α=0.05,β=0.10,通过计算,横断面研究的七组(正常人群、慢性乙型肝炎、乙肝肝硬化、乙肝相关肝癌早早期、早期、进展期及晚期)患者各100例。
入组标准:年龄:18-70岁;性别:不限;民族或地区:不限;慢性乙型肝炎诊断依据2015年度APASL病毒性肝炎防治指南,具体如下:肝炎病程超过半年,或原有乙型肝炎或HBsAg携带史,本次又因同一病原再次出现肝炎症状、体征及肝功能异常,但是没有肝硬化表现,可诊断为慢性乙型肝炎。乙肝相关肝硬化诊断依据2010年中华医学会病毒性肝炎防治指南,具体如下:具有乙肝病毒慢性感染病史,影像学提示弥漫肝纤维化,再生结节形成,其他表现可有脾大、脾功能亢进、食管胃底静脉曲张,金标准为病理检查发现再生结节;乙肝相关肝癌诊断依据2012年EASL指南EASL–EORTC Clinical Practice Guidelines:Management ofhepatocellular carcinoma,具体如下:具有乙肝病毒慢性感染病史,CT或MRI四期增强扫描表现为典型的动脉灌注快速流出,病理学检查为金标准。乙肝相关肝癌分期依据2012年EASL指南EASL–EORTC Clinical Practice Guidelines:Management ofhepatocellular carcinoma(巴塞罗那标准),其中0期定义为早早期、A期定义为早期肝癌,B期定义为进展期肝癌,C期与D期定义为晚期肝癌。正常人群诊断依据明确排除慢性乙型肝炎,乙肝肝硬化和原发性肝癌,并自愿参加本研究的正常人群。
排除标准:非乙肝相关肝病或肝癌;孕妇或围产期妇女;有乙肝相关肝癌以外其他恶性肿瘤病史者;有HIV感染者。
观察指标:血常规、肝脏功能、血生化、HBV-DNA、HBV-M、B超、胃镜、CT或肝脏病理。
采用横断面研究,比较肝癌早期特异性DNA甲基化诊断标志物在七组人群中的差异,确定最佳诊断界值,采用回归分析、聚类分析等数学方法优化乙肝相关肝癌早期诊断模型,具体如下:
根据入选、排除标准从乙肝相关肝癌临床数据样本资源库中筛选符合本研究的七组(正常人群、慢性乙型肝炎、乙肝肝硬化、乙肝相关肝癌早早期、早期、进展期及晚期)患者各 100例;
运用MBS检测肝癌早期特异性DNA甲基化诊断标志物的甲基化比率;采用基因分析平台(http://www.broadinstitute.org/)和Venn Diagram等甲基化分析软件和数据分析模型,确定乙肝相关肝癌早期特异性DNA甲基化诊断标志物的最佳诊断界值和诊断模型。
筛选出能够肝病中区分出HCC早期的CGs位点:在原来5个CG位点(cg04398282、cg03956042、cg09435170、cg05941376、cg24754223)基础进一步分析,结合后续实验,通过无监督聚类分析找出34个CGs能够在肝病中区分出HCC早期肝癌。
通过limma差异性分析筛选出CHB与HCC各期特异性CGs(CHB vsHCC1:2285CGs,CHBvsHCC1:2233CGs,CHB vsHCC2:2285CGs,CHB vsHCC3:3345CGs,CHB vsHCC4:23596CGs)。其中326CGs是CHB相比HCC1和HCC2特异性的位点。在326CGs 位点中deltabeta的绝对值>0.2有34个。与后续分析的挑选出的位点一个39个用于下步分析(图2-3)。
实施例2基于二代测序的技术的Targeted Bisulfite Sequencing
1、DNA重亚硫酸盐处理
根据说明书方法,使用Zymo产的直接亚硫酸盐转化试剂盒(Zymo Research,货号D5020)对细胞样品进行处理。完成后,使用单链DNA Qubit 2.0检测试剂盒(Thermo,货号Q10212)对对获得的DNA进行浓度测定,以确保获得足量的转化后DNA。
2、多重扩增及高通量测序
设计并合成好一个包含34个CpG位点的引物池(如序列表SEQ ID NO:1-SEQ IDNO: 68所示),然后通过两步PCR的方法完成目标甲基化位点序列的扩增和兼容Illumina测序文库的制备。第一轮PCR体系如下:DNA模板5μl;上游引物池(10μM)1μl;下游引物池(10 μM)1μl;2×PCR Ready Mix 15μl(总体积25μl)(KAPAHiFi HotStart Uracil+ReadyMix)。配制好反应体系后,在PCR仪(BIO-RAD,T100TM)上执行以下反应程序:98度预变性3分钟,然后执行27个循环,条件是98度变性20秒,60度退火4分钟,最后72度延伸2分钟。反应完成后,恒温保持10度。PCR反应完成后,使用1%的琼脂糖胶电泳检测PCR产物,确定产物大小正确,使用AMPure XP磁珠纯化回收PCR产物。然后以第一轮PCR产物为模板执行第二轮PCR反应,以获得测序带分子标签的文库。反应体系如下:DNA模板 (10ng/μl)2μl,通用P7引物(含分子标签,10μM)1μl;通用P5引物(含分子标签,10μM)1μl; 2×PCR Ready Mix 15μl(总体积30μl)。
配制好反应体系后,执行如下PCR程序:98度预变性1分钟,然后执行8个循环程序,变性98度20秒,60度退火20秒,72度延伸30秒,最终72度延伸2分钟。完成后一直10度。最终PCR产物使用AMPure XP磁珠纯化回收。各个PCR产物等量混合后,使用 HiSeq XTen测序仪(Illumina,San Diego,CA)进行测序。
3、数据质控及基因分型分析
下机数据通过以下2步骤进行数据质控:1)使用cutadapt(v 1.2.1)软件切除任何含有测序接头序列的部分序列;2)使用PRINSEQ-lite(v 0.20.3)软件对剩下的序列进行质控,依照序列的3'端往5'端的顺序,删除质量阈值低于20的碱基。剩下的序列视作质控合格的序列。接着使用Bismark软件(版本v0.22.1)进行甲基化检测,参数为默认参数(图4)。
4.TBS检测34CGs甲基化数据
共有591例样本测序成功,其中健康对照40例,其中CHB 118例,LC 112例,HCC 早早期99例,HCC早期113例,HCC进展期59例,晚期50例。每一例检测34甲基化CGs。
实施例3 LASSO回归筛选HCC早期独立风险CGs位点
通过LASSO回归(Least absolute shrinkage and selection operator)从34CGs筛选出11个 cg14171514、cg07721852、cg05166871、cg18087306、cg05213896、cg18772205、cg15747825、 cg21402921、cg04398282、cg18087306、cg12467404(图5)。
实施例4全子集回归进一步筛选HCC早期独立风险CGs位点
从11个CGs中通过全子集回归将所有可能的组合模型都考虑在内,综合评估由N个不同子集大小的最佳模型。car包也提供subsets函数筛选出两个组合 c14-c07-c051-c052-c187-c21和c14-c07-c051-c052-c187-c21(图6)通过计算方差分析(495.69 vs503.58)和AIC(509.69vs 517.58)计算评估c14-c07-c051-c052-c187-c21最优组合。Leaps: regsubsets函数计算筛选出6个CGs(cg14171514、cg07721852、cg05166871、cg18087306、 cg05213896、cg18772205)为最优CGs位点。两种算法结果一致。最终确定Six-CGs-mixer score (SCms);
SCms=-0.8711-3.7342*cg14171514+2.5885*cg07721852+6.9108*cg05166871-9.8593*cg180873 06+4.5009*cg05213896+4.3853*cg18772205。
实施例5入组队列临床数据分析
通过随机分配将入组样本分我训练集和验证集,统计分析两个队列的临床数据。结果显示训练集中的HBV相关肝病组与HCC早期组相比的年龄、性别、DBIL、ALT、AST、γ-GT、ALP、单核细胞、AFP存在差异;在验证集中的HBV相关肝病组与HCC早期组相比的年龄、性别、AST、白蛋白、γ-GT、ALP、AFP存在差异。
实施例6单因素多因素风险分析
训练集中通过单因素风险分析年龄、性别、ALT、AST、DBIL、γ-GT、ALP、单核细胞、log10(AFP)、Six-CGs-mixer独立风险因子。多因素风险分析为年龄、性别、log10(AFP)、Six-CGs-mixer。
实施例7 Six-CGs-mixer在训练集AUROC
运用pROC包计算出34个CGs在训练集和验证集(HCCe)AUROC(表1)。其中的筛选出的6个CGs(cg14171514、cg07721852、cg05166871、cg18087306、cg05213896、 cg18772205)和组合Six-CGs-mixer的AUROC(图7)。
表1训练集和验证集中34个CGs位点的AUROC
实施例8 HCC早期诊断模型(HCCe Model)的确定
通过单因素多因素独立风险分析确定了年龄、性别、log10(AFP)、Six-CGs-mixer组成 HCCe Model:
X=-1.0944708-0.7183741×G+1.7286974×A+0.2761166×log10(AFP)+0.7902764×SCms;
并计算其在训练集AUROC为0.81(0.79-0.88)(图8A)、验证集(HCC早期)AUROC 为0.83(0.78-0.88)(图8B)、验证集(HCC晚期)的AUROC为0.87(0.81-0.92)(图8C )。这些AUROC数值较好>0.80,表明HCCe Model较好的区分能力。
实施例9 HCC早期诊断模型(HCCe Model)的列线图及其校正曲线
分别绘制HCCe Model在训练集(图9)、验证集(HCC早期,图10)、验证集(HCC 晚期,图11)的列线图和校正曲线。校正曲线表明其HCCe Model诊断与实际临床分组一致性较高。
分别计算出HCCe Model在训练集及验证集中的精度(Precision)、准确度(Accuracy)、敏感性(Sensitivity)、特异度(Specificity)、阳性预测值(Positivepredictive value)、阴性预测值(Negative predictive value)(表2)。结果显示具有较好的诊断精度。
表2 HCCe模型风险估计HCC早期诊断的准确性
实施例10 HCC早期诊断模型(HCCe Model)的临床应用评价
进行DCAs分析训练集中的列线图的(图12左),验证集(HCC早期)列线图(图13 左)和验证集(HCC晚期)列线图(图14左)。其阈值概率为0-1.0之间所有病人都有收益。基于这些DCA分析我们进一步绘制相应的临床影响曲线来评估它们的实质价值(图12-14右)。危险阈值在0-0.5的范围内,预测的高危人群数量患者的数量总是大于发生HCC 的高危人群,成本效益比在同一范围内是可以接受的。
本发明开发出新的CGs位点甲基化检测技术TBS(Targeted BisulfiteSequencing),基于二代测序基础上将CGs位点上下游100bp扩增子进行测序.目前最多检测200个样本的40CGs 位点一次实验可得到8000CGs数据,相对焦磷酸测序能够极大提高检测效率。为筛选CGs 位点的标志物模型建立和验证提供技术保障和可能性,同时为机制研究提供新的选择。
序列表
<110> 首都医科大学附属北京佑安医院
<120> 利用CpG位点甲基化水平检测早期肝癌的标志物
<160> 68
<170> SIPOSequenceListing 1.0
<210> 1
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ttttgtaatt tgggaagagg ggaga 25
<210> 2
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
acacaattcc aactacaacc tttaa 25
<210> 3
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tggtattgta gaggtggagg ttttt 25
<210> 4
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ccctcaaaaa ctaacacaaa ctatacca 28
<210> 5
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gttttggagg gtattggtgt agttg 25
<210> 6
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
attccttaaa atttacttta cttttcaaaa tct 33
<210> 7
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
agaaaagttt tgggaatgga atgta 25
<210> 8
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
aaactcttaa taaaacaaca aaacctact 29
<210> 9
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
agtagatggt ttttgttagg ggtga 25
<210> 10
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
tcaattccta tcatctccac actaa 25
<210> 11
<211> 34
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
agtgtattaa tatttaagaa ttgagtaggt tttt 34
<210> 12
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
accccaaact ccatactaca aacaa 25
<210> 13
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
gggtttaggg gttagagaag gg 22
<210> 14
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
ccctctctct cctaatctcc ttt 23
<210> 15
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
ggtgtggatg tggagtttgt tttta 25
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
cccacaaaaa cttcttctac ccaaa 25
<210> 17
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
tagagatgat atgtggtgtt tgggt 25
<210> 18
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
cactcccaac aaaacaactc ttaca 25
<210> 19
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
tttggggtta ttaggttagg ggg 23
<210> 20
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
aaccctaaaa actataaaat aactcctaaa aa 32
<210> 21
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tttgggaggt tgtagttgtg gtata 25
<210> 22
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tcccaactta ctcaaaaact caacc 25
<210> 23
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tgttgttgag tttgtttttg tgaga 25
<210> 24
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
cctacaactc ataaattact tcccaca 27
<210> 25
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
attattttgt ggaaaggtat tatttttgtt tt 32
<210> 26
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
acaaacaaat cacaacaaaa tataatacaa t 31
<210> 27
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
gttttggttt ttggaagggt agtga 25
<210> 28
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
taccccaaca tatcaccact aaaca 25
<210> 29
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
tgttgtttgt ttttattaat gtgagttga 29
<210> 30
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
actttacaca acttcccaaa aac 23
<210> 31
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tgagggtttt taggtgaatt tgagg 25
<210> 32
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
acctaaacta tacccccaac taaca 25
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tggtggttgg tatgtagtgt agttt 25
<210> 34
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
atacaaatca aaacctctcc cccaa 25
<210> 35
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
ttgttagaag tgatatagaa gtgtatatgt t 31
<210> 36
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
tctaaaacct accccaaaaa caact 25
<210> 37
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
tatatgaggt tttggaggtg agtgg 25
<210> 38
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
acccaaatac ctcccaaaaa caatt 25
<210> 39
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
tgtaagtgtg gtgtgtattt agtttaa 27
<210> 40
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
caataaaaca aaactaccaa aaatctataa tataac 36
<210> 41
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
aaggaaggtt tgttgtttga gatgg 25
<210> 42
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
accctacaca cttatataca aacca 25
<210> 43
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
ttttggggta aggtaaggtg gataa 25
<210> 44
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
cacccactcc tctaaaacaa aacat 25
<210> 45
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
tgtggtagtt agggagtagt taaagt 26
<210> 46
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 46
tcttttacct actctatcac ccctt 25
<210> 47
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 47
tgatttaggg tgatttattt atttggttt 29
<210> 48
<211> 31
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 48
ccttccaatt ctaactctaa taattaaatc c 31
<210> 49
<211> 33
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 49
aaataaagat agaaagaata attgtgtttt tga 33
<210> 50
<211> 32
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 50
aaaaacaatc tctaaataat ccacatatac tt 32
<210> 51
<211> 28
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 51
attagttgtt tgatttgtga attaggtt 28
<210> 52
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 52
acaacaaaac caatcctcta ccattt 26
<210> 53
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 53
ttttgggagg tgttagaaat tagtaaa 27
<210> 54
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 54
tcaacaatac aataattcca aacccca 27
<210> 55
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 55
tgggattgtt gtttgggatt gtaag 25
<210> 56
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 56
tactttttcc ccactcaaca ctacc 25
<210> 57
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 57
taggggtggg aatttgggtt aatag 25
<210> 58
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 58
aaaccacatc taataaacac cactc 25
<210> 59
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 59
agagtgtaag tgtttggttt gtgt 24
<210> 60
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 60
tcaacctacc taaaaacctc acaaa 25
<210> 61
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 61
tttgagattg gtggtgagtg ttttt 25
<210> 62
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 62
aacaaccact aacctatacc cacaa 25
<210> 63
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 63
tggatgttat ttggtgtatt tgttttt 27
<210> 64
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 64
acacaaacct aaaaactcct tccaa 25
<210> 65
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 65
tgatttgata ggaatgtatg agtgtgt 27
<210> 66
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 66
accataaatc tactaaaaac tcaaaacaat 30
<210> 67
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 67
gtatggttgt ttgtgtgatt ttggt 25
<210> 68
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 68
aaaactctcc acacatttct cctaa 25
Claims (6)
1.一种利用CpG位点甲基化水平检测早期肝癌的标志物,其特征在于,所述标志物包括如下甲基化位点:cg04998202、cg20253872、cg05702218、cg12467404、cg14171514、cg07721852、cg03734874、cg05891094、cg21402921、cg04484415、cg27395066、cg05166871、cg11783901、cg22632947、cg02185248、cg18087306、cg05213896、cg09404516、cg09778596、cg01620164、cg15462501、cg25635352、cg18772205、cg09470983、cg04398282、cg17588578、cg15747825、cg14279856、cg20445774、cg04749631、cg04115680、cg21183256、cg27616227、cg02243522。
2.扩增权利要求1所述利用CpG位点甲基化水平检测早期肝癌的标志物的引物。
3.根据权利要求2所述的引物,其特征在于,所述引物序列如序列表SEQ ID NO:1-SEQID NO:68所示。
4.权利要求1所述利用CpG位点甲基化水平检测早期肝癌的标志物在评估早期肝癌中的应用。
5.权利要求1所述利用CpG位点甲基化水平检测早期肝癌的标志物在制备检测早期肝癌的试剂盒中的应用。
6.根据权利要求5所述利用CpG位点甲基化水平检测早期肝癌的标志物在制备检测早期肝癌的试剂盒中的应用,其特征在于,所述检测早期肝癌采用如下标志物:cg14171514、cg07721852、cg05166871、cg18087306、cg05213896、cg18772205;
早期肝癌患病概率采用如下公式计算:
其中,
X=-1.0944708-0.7183741×G+1.7286974×A+0.2761166×log10(AFP)+0.7902764×SCms;
式中,G为性别、A为年龄、AFP为甲胎蛋白;
SCms=-0.8711-3.7342*cg14171514+2.5885*cg07721852+6.9108*cg05166871-9.8593*cg18087306+4.5009*cg05213896+4.3853*cg18772205。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110398309.0A CN113234817B (zh) | 2021-04-14 | 2021-04-14 | 利用CpG位点甲基化水平检测早期肝癌的标志物 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110398309.0A CN113234817B (zh) | 2021-04-14 | 2021-04-14 | 利用CpG位点甲基化水平检测早期肝癌的标志物 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113234817A true CN113234817A (zh) | 2021-08-10 |
CN113234817B CN113234817B (zh) | 2022-09-30 |
Family
ID=77128134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110398309.0A Active CN113234817B (zh) | 2021-04-14 | 2021-04-14 | 利用CpG位点甲基化水平检测早期肝癌的标志物 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113234817B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115287353A (zh) * | 2022-01-24 | 2022-11-04 | 南京世和医疗器械有限公司 | 一种肝癌血浆游离dna来源的甲基化标志物及用途 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106811523A (zh) * | 2017-01-17 | 2017-06-09 | 首都医科大学附属北京佑安医院 | 一种用于肝癌筛检的甲基化基因 |
CN107541565A (zh) * | 2016-06-23 | 2018-01-05 | 首都医科大学附属北京佑安医院 | 宿主外周血单个核细胞和t细胞的癌症dna甲基化标志物 |
CN109825583A (zh) * | 2019-03-01 | 2019-05-31 | 清华大学 | 人重复元件dna甲基化作为肝癌早期诊断的标记物及其应用 |
US20190345559A1 (en) * | 2016-06-23 | 2019-11-14 | Moshe Szyf | Dna methylation signatures of cancer in host peripheral blood mononuclear cells and t cells |
WO2020221315A1 (zh) * | 2019-04-30 | 2020-11-05 | 上海奕谱生物科技有限公司 | 基于甲基化修饰的肿瘤标记物stamp-ep8及其应用 |
-
2021
- 2021-04-14 CN CN202110398309.0A patent/CN113234817B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107541565A (zh) * | 2016-06-23 | 2018-01-05 | 首都医科大学附属北京佑安医院 | 宿主外周血单个核细胞和t细胞的癌症dna甲基化标志物 |
US20190345559A1 (en) * | 2016-06-23 | 2019-11-14 | Moshe Szyf | Dna methylation signatures of cancer in host peripheral blood mononuclear cells and t cells |
CN106811523A (zh) * | 2017-01-17 | 2017-06-09 | 首都医科大学附属北京佑安医院 | 一种用于肝癌筛检的甲基化基因 |
CN109825583A (zh) * | 2019-03-01 | 2019-05-31 | 清华大学 | 人重复元件dna甲基化作为肝癌早期诊断的标记物及其应用 |
WO2020221315A1 (zh) * | 2019-04-30 | 2020-11-05 | 上海奕谱生物科技有限公司 | 基于甲基化修饰的肿瘤标记物stamp-ep8及其应用 |
Non-Patent Citations (1)
Title |
---|
JILIANG QIU等: "CpG Methylation Signature Predicts Recurrence in Early-Stage Hepatocellular Carcinoma: Results From a Multicenter Study", 《JOURNAL OF CLINICAL ONCOLOGY》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115287353A (zh) * | 2022-01-24 | 2022-11-04 | 南京世和医疗器械有限公司 | 一种肝癌血浆游离dna来源的甲基化标志物及用途 |
CN115287353B (zh) * | 2022-01-24 | 2023-10-27 | 南京世和医疗器械有限公司 | 一种肝癌血浆游离dna来源的甲基化标志物及用途 |
Also Published As
Publication number | Publication date |
---|---|
CN113234817B (zh) | 2022-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6161607B2 (ja) | サンプルにおける異なる異数性の有無を決定する方法 | |
CN105695606A (zh) | 用于非治疗目的的肥厚型心肌病相关致病基因突变的筛查方法 | |
CN111690740B (zh) | 肝细胞癌早筛试剂盒及其制备方法和用途 | |
CN110904231B (zh) | 一种用于辅助诊断肝癌的试剂及其在制备试剂盒中的用途 | |
WO2018209625A1 (zh) | 一种基于外周血无创性检测病灶免疫组库多样性的分析系统及其用途 | |
CN112609015A (zh) | 一种预测结直肠癌风险的微生物标志物及其应用 | |
CN113234817B (zh) | 利用CpG位点甲基化水平检测早期肝癌的标志物 | |
US20240093306A1 (en) | Micro rna liver cancer markers and uses thereof | |
KR20220071122A (ko) | 핵산 길이 비를 이용한 암 진단 및 예후예측 방법 | |
JP6494356B2 (ja) | 非アルコール性脂肪性肝疾患及び/又は非アルコール性脂肪肝炎の発症リスク及び/又は重症化リスクの判定方法、並びに該判定用オリゴヌクレオチドキット | |
EP4256074A1 (en) | Methods for classification of liver disease | |
TWI646198B (zh) | Method for screening high risk of liver cancer by using hepatitis B virus gene sequence | |
CN109022592A (zh) | 用于四种常用品系大鼠鉴定的snp标记及其应用 | |
TWI500770B (zh) | Hoxa9基因作為檢測肝癌生物標記的用途 | |
TWI676688B (zh) | 辨識細胞種類型之方法及系統 | |
CN116068193B (zh) | 结核病分子标志物组合及其用途 | |
KR102543982B1 (ko) | Cpa3 유전자의 메틸화 수준을 이용한 비만 관련 질환의 예측 또는 진단을 위한 정보제공방법 | |
KR102126895B1 (ko) | 고밀도지질단백질콜레스테롤 수준을 예측하기 위한 조성물, 키트, 및 이를 이용한 방법 | |
Chen et al. | Early Prognostic Predictive System of AECHB and the Diagnosis of Severe Hepatitis B (Liver Failure) | |
IL285031A (en) | Diagnosis of inflammatory bowel diseases | |
Kunadirek | Circulating-tumor DNA and cancer-induced gene expression as novel liquid biomarkers of liver cancers | |
CN116064781A (zh) | 一种5-羟甲基胞嘧啶的用途 | |
CN116904575A (zh) | 与矽肺患者体能衰退相关的生物标志物及其用途 | |
CN115386634A (zh) | 一种基于EGFR基因rs763317位点的基因分型检测试剂盒及其应用 | |
CN113061658A (zh) | 用于乳腺癌遗传筛查的基因及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |