CN118197425A - 用于辅助诊断甲状腺恶性肿瘤和良性肿瘤的数据处理装置 - Google Patents
用于辅助诊断甲状腺恶性肿瘤和良性肿瘤的数据处理装置 Download PDFInfo
- Publication number
- CN118197425A CN118197425A CN202311691275.XA CN202311691275A CN118197425A CN 118197425 A CN118197425 A CN 118197425A CN 202311691275 A CN202311691275 A CN 202311691275A CN 118197425 A CN118197425 A CN 118197425A
- Authority
- CN
- China
- Prior art keywords
- thyroid
- seq
- dna fragment
- mreg
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 210000001685 thyroid gland Anatomy 0.000 title claims abstract description 413
- 201000011510 cancer Diseases 0.000 title claims abstract description 275
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 248
- 238000012545 processing Methods 0.000 title claims abstract description 33
- 238000003745 diagnosis Methods 0.000 title description 7
- 101150111571 mreg gene Proteins 0.000 claims abstract description 142
- 238000013178 mathematical model Methods 0.000 claims abstract description 78
- 208000016842 benign thyroid gland neoplasm Diseases 0.000 claims abstract description 41
- 238000007405 data analysis Methods 0.000 claims abstract description 22
- 239000012634 fragment Substances 0.000 claims description 262
- 108020004414 DNA Proteins 0.000 claims description 234
- 230000011987 methylation Effects 0.000 claims description 186
- 238000007069 methylation reaction Methods 0.000 claims description 186
- 108091029430 CpG site Proteins 0.000 claims description 180
- 230000036210 malignancy Effects 0.000 claims description 104
- 238000001514 detection method Methods 0.000 claims description 52
- 238000000034 method Methods 0.000 claims description 39
- 102000053602 DNA Human genes 0.000 claims description 32
- 101000625226 Homo sapiens Melanoregulin Proteins 0.000 claims description 32
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 32
- 239000002773 nucleotide Substances 0.000 claims description 32
- 125000003729 nucleotide group Chemical group 0.000 claims description 32
- 201000002510 thyroid cancer Diseases 0.000 claims description 25
- 238000007477 logistic regression Methods 0.000 claims description 15
- 230000004069 differentiation Effects 0.000 claims description 12
- 239000003153 chemical reaction reagent Substances 0.000 claims description 9
- 230000036961 partial effect Effects 0.000 claims description 8
- 238000002360 preparation method Methods 0.000 claims description 8
- 239000003550 marker Substances 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 238000013399 early diagnosis Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 208000023356 medullary thyroid gland carcinoma Diseases 0.000 description 39
- 208000030901 thyroid gland follicular carcinoma Diseases 0.000 description 37
- 206010033701 Papillary thyroid cancer Diseases 0.000 description 34
- 208000030045 thyroid gland papillary carcinoma Diseases 0.000 description 31
- 201000009030 Carcinoma Diseases 0.000 description 27
- 210000001519 tissue Anatomy 0.000 description 26
- 208000010576 undifferentiated carcinoma Diseases 0.000 description 25
- 208000024770 Thyroid neoplasm Diseases 0.000 description 16
- 230000007067 DNA methylation Effects 0.000 description 13
- 208000037196 Medullary thyroid carcinoma Diseases 0.000 description 11
- 208000013818 thyroid gland medullary carcinoma Diseases 0.000 description 11
- 238000012549 training Methods 0.000 description 10
- 208000004463 Follicular Adenocarcinoma Diseases 0.000 description 9
- 102100024976 Melanoregulin Human genes 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 206010016935 Follicular thyroid cancer Diseases 0.000 description 6
- 208000009018 Medullary thyroid cancer Diseases 0.000 description 6
- 238000010835 comparative analysis Methods 0.000 description 6
- 230000001575 pathological effect Effects 0.000 description 6
- 238000001269 time-of-flight mass spectrometry Methods 0.000 description 6
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 208000019179 thyroid gland undifferentiated (anaplastic) carcinoma Diseases 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 208000007054 Medullary Carcinoma Diseases 0.000 description 4
- 108091081021 Sense strand Proteins 0.000 description 4
- 230000003325 follicular Effects 0.000 description 4
- 201000010198 papillary carcinoma Diseases 0.000 description 4
- 238000007619 statistical method Methods 0.000 description 4
- 208000009453 Thyroid Nodule Diseases 0.000 description 3
- 208000033781 Thyroid carcinoma Diseases 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000003211 malignant effect Effects 0.000 description 3
- 239000003147 molecular marker Substances 0.000 description 3
- 208000013077 thyroid gland carcinoma Diseases 0.000 description 3
- 208000001490 Dengue Diseases 0.000 description 2
- 206010012310 Dengue fever Diseases 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 238000003759 clinical diagnosis Methods 0.000 description 2
- 230000002380 cytological effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 208000025729 dengue disease Diseases 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 230000005180 public health Effects 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 241000143060 Americamysis bahia Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical group [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 208000019155 Radiation injury Diseases 0.000 description 1
- 206010071027 Thyroid cancer stage I Diseases 0.000 description 1
- 206010071028 Thyroid cancer stage II Diseases 0.000 description 1
- 206010071029 Thyroid cancer stage III Diseases 0.000 description 1
- 206010071030 Thyroid cancer stage IV Diseases 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 238000003748 differential diagnosis Methods 0.000 description 1
- 208000015799 differentiated thyroid carcinoma Diseases 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000006718 epigenetic regulation Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000013188 needle biopsy Methods 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000528 statistical test Methods 0.000 description 1
- 238000001196 time-of-flight mass spectrum Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 229910001868 water Inorganic materials 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/112—Disease subtyping, staging or classification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/154—Methylation markers
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了用于辅助诊断甲状腺恶性肿瘤和良性肿瘤的数据处理装置。本发明提供了一种用于辅助区分A类型样本和B类型样本的数据处理装置,包括用于建立数学模型的单元X(包括数据采集模块、数据分析处理模块和模型输出模块)和用于确定待测样本类型的单元Y(包括数据输入模块、数据运算模块、数据比较模块和结论输出模块);A类型样本和B类型样本为甲状腺良性肿瘤和甲状腺恶性肿瘤。本发明研究发现相较于甲状腺良性肿瘤,恶性肿瘤患者组织中MREG基因呈现低甲基化状态,本发明对提高甲状腺恶性肿瘤早期诊疗效果和降低甲状腺恶性肿瘤的死亡率,以及指导制定合理的临床治疗方案均有重要的科学意义和临床应用价值。
Description
技术领域
本发明涉及医疗信息学领域,特别涉及用于辅助诊断甲状腺恶性肿瘤和良性肿瘤的数据处理装置。
背景技术
甲状腺癌为一种常见的内分泌系统恶性肿瘤,可分为甲状腺乳头状癌、滤泡性甲状腺癌、未分化甲状腺癌和髓样癌。其中乳头状癌(Papillary thyroid cancer,PTC)最为常见,占所有甲状腺恶性肿瘤的90%以上[Xing,Mingzhao;Haugen,Bryan R;Schlumberger,Martin(2013).Progress in molecular-based management ofdifferentiated thyroid cancer.The Lancet,381(9871),1058–1069.]。根据统计,成年人甲状腺结节的患病率约为5-10%,其中60岁以上的人群最为严重,可高达50-70%[GuthS,Theune U,Aberle J,et al.Very high prevalence of thyroid nodules detected byhigh frequency(13MHz)ultrasound examination.Eur J Clin Invest 2009;39:699-706.]。影像学检查是一种比较普遍的甲状腺诊断方法,该方法大多依靠医生经验判断,存在一定的结果误差,而且影像学对人身体有一定的辐射伤害。细针穿刺活检也是一种临床上常见的甲状腺癌诊断技术,该方法根据穿刺物的细胞学形态对结节的良恶性进行评估。因为甲状腺良恶性肿瘤的细胞学特征经常发生重叠,所以约有10-30%的细针穿刺诊断为不明确的细胞学结果[Cibas ES,Ali SZ.The 2017Bethesda System for ReportingThyroid Cytopathology.Thyroid.2017;27(11):1341-6.]。不确定的穿刺结果会导致约60%的患者遭受过度治疗或者漏诊[Stewart R,Leang YJ,Bhatt CR,Grodski S,SerpellJ,Lee JC.Quantifying the differences in surgical management of patients withdefinitive and indeterminate thyroid nodule cytology.Eur J Surg Oncol.2020;46(2):252-7.]。这不仅是增加了患者经济和身心负担,还占据了大量的公共卫生资源,使得医疗保健系统产生巨额的财务成本。因此,鉴别甲状腺良恶性肿瘤有利于临床医师采取更精准的治疗方案,具有很重要的临床和公共卫生意义。
表观遗传学为一种不涉及DNA序列改变但可遗传的基因表达调控方式,而且能够遗传给下一代[Nicoglou A,Merlin F.Epigenetics:A way to bridge the gap betweenbiological fields.Stud Hist Philos Biol Biomed Sci.2017;66:73-82]。DNA甲基化是表观遗传调控的重要方式之一,是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5’碳位共价键结合一个甲基基团[Bird A.Perceptions ofepigenetics.Nature.2007;447:396-398]。大量的研究表明,DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制了基因表达[MooreLD,Le T,Fan G.DNA methylation and its basic function.Neuropsychopharmacology.2013;38:23-38]。
DNA甲基化标志物为现阶段最佳的肿瘤体外早诊分子标志物,目前临床上关于甲状腺癌诊断标志物的灵敏度和特异性很有限,尤其是缺乏早期诊断的标志物,因此更为敏感、特异的早期分子标记物亟待发掘。
发明内容
本发明的目的是提供用于辅助诊断甲状腺恶性肿瘤和良性肿瘤的数据处理装置。
第一方面,本发明要求保护一种用于辅助区分A类型样本和B类型样本的数据处理装置。
本发明要求保护的用于辅助区分A类型样本和B类型样本的数据处理装置包括单元X和单元Y;
所述单元X用于建立数学模型,包括数据采集模块、数据分析处理模块和模型输出模块;
所述数据采集模块被配置为采集n1个所述A类型样本和n2个所述B类型样本的MREG基因甲基化水平数据;
其中,n1和n2均可为10以上正整数,如100以上。
所述数据分析处理模块被配置为接收来自于所述数据采集模块的所述n1个所述A类型样本和n2个所述B类型样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
在本发明的具体实施方式中,所述阈值设为0.5。大于0.5归为一类,小于0.5归为另外一类,等于0.5作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组是A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。
在实际应用中,所述阈值也可根据最大约登指数确定(具体可为最大约登指数对应的数值)。大于阈值归为一类,小于阈值归为另外一类,等于阈值作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。
所述模型输出模块被配置为接收来自于所述数据分析处理模块建立的所述数学模型,并进行输出;
所述单元Y用于确定待测样本类型,包括数据输入模块、数据运算模块、数据比较模块和结论输出模块;
所述数据输入模块被配置为输入待测者的MREG基因甲基化水平数据;
所述数据运算模块被配置为接收来自于所述数据输入模块的所述待测者的MREG基因甲基化水平数据,并将所述待测者的MREG基因甲基化水平数据代入所述单元X中的所述数据分析处理模块建立的所述数学模型,计算得到检测指数;
所述数据比较模块被配置为接收来自于所述数据运算模块计算得到的检测指数,并将所述检测指数与所述单元X中的所述数据分析处理模块中确定的所述阈值进行比较;
所述结论输出模块被配置为接收来自于所述数据比较模块的比较结果,并根据所述比较结果输出所述待测样本的类型是A类型还是B类型的结论。
所述A类型样本和所述B类型样本为如下任一种:
(C1)甲状腺良性肿瘤和甲状腺恶性肿瘤;
(C2)甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(C3)甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(C4)不同亚型的甲状腺恶性肿瘤;
(C5)不同分期的甲状腺恶性肿瘤。
进一步地,(C2)和(C4)中所述不同亚型可为病理分型,如组织学分型。
进一步地,(C3)和(C5)中所述不同分期可为临床分期。
在本发明的具体实施方式中,(C2)中所述甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤具体可为如下任一种:甲状腺良性肿瘤和甲状腺乳头状癌、甲状腺良性肿瘤和甲状腺滤泡癌、甲状腺良性肿瘤和甲状腺髓样癌、甲状腺良性肿瘤和甲状腺未分化癌。
在本发明的具体实施方式中,(C3)中所述甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤具体可为如下任一种:甲状腺良性肿瘤和Ⅰ期甲状腺恶性肿瘤、甲状腺良性肿瘤和Ⅱ期甲状腺恶性肿瘤、甲状腺良性肿瘤和Ⅲ期甲状腺恶性肿瘤、甲状腺良性肿瘤和Ⅳ期甲状腺恶性肿瘤。
在本发明的具体实施方式中,(C4)中所述甲状腺恶性肿瘤不同亚型具体可为如下任一种:甲状腺乳头状癌和甲状腺滤泡癌、甲状腺乳头状癌和甲状腺髓样癌、甲状腺乳头状癌和甲状腺未分化癌、甲状腺滤泡癌和甲状腺髓样癌、甲状腺滤泡癌和甲状腺未分化癌、甲状腺髓样癌和甲状腺未分化癌。
在本发明的具体实施方式中,(C5)中所述甲状腺恶性肿瘤不同分期具体可为如下任一种:Ⅰ期甲状腺恶性肿瘤和Ⅱ期甲状腺恶性肿瘤、Ⅰ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤、Ⅰ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤、Ⅱ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤、Ⅱ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤、Ⅲ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤。
第二方面,本发明要求保护一种系统。
本发明所要求保护的系统,可包括:
(D1)用于检测MREG基因甲基化水平的试剂和/或仪器;
(D2)装置,所述装置包括单元X和单元Y;
所述单元X用于建立数学模型,包括数据采集模块、数据分析处理模块和模型输出模块;
所述数据采集模块被配置为采集(D1)检测得到的n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据;
所述数据分析处理模块被配置为接收来自于所述数据采集模块的所述n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
其中,n1和n2均可为10以上正整数,如100以上。
所述模型输出模块被配置为接收来自于所述数据分析处理模块建立的所述数学模型,并进行输出;
所述单元Y用于确定待测样本类型,包括数据输入模块、数据运算模块、数据比较模块和结论输出模块;
所述数据输入模块被配置为输入(D1)检测得到的待测者的MREG基因甲基化水平数据;
所述数据运算模块被配置为接收来自于所述数据输入模块的所述待测者的MREG基因甲基化水平数据,并将所述待测者的MREG基因甲基化水平数据代入所述单元X中的所述数据分析处理模块建立的所述数学模型,计算得到检测指数;
所述数据比较模块被配置为接收来自于所述数据运算模块计算得到的检测指数,并将所述检测指数与所述单元X中的所述数据分析处理模块中确定的所述阈值进行比较;
所述结论输出模块被配置为接收来自于所述数据比较模块的比较结果,并根据所述比较结果输出所述待测样本的类型是A类型还是B类型的结论;
所述A类型样本和所述B类型样本为如下任一种:
(C1)甲状腺良性肿瘤和甲状腺恶性肿瘤;
(C2)甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(C3)甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(C4)不同亚型的甲状腺恶性肿瘤;
(C5)不同分期的甲状腺恶性肿瘤。
其中,(C1)-(C5)的具体含义参见前文第一方面中所述。
在本发明的具体实施方式中,所述阈值设为0.5。大于0.5归为一类,小于0.5归为另外一类,等于0.5作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组是A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。
在实际应用中,所述阈值也可根据最大约登指数确定(具体可为最大约登指数对应的数值)。大于阈值归为一类,小于阈值归为另外一类,等于阈值作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。
第三方面,本发明要求保护一种计算机可读存储介质。
本发明所要求保护的计算机可读存储介质存储有用于执行下述步骤的计算机程序:
采集n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据;
将所述n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
其中,n1和n2均可为10以上正整数,如100以上。
输入待测者的MREG基因甲基化水平数据;
将所述待测者的MREG基因甲基化水平数据代入所述数学模型,计算得到检测指数;
将所述检测指数与所述阈值进行比较,得到比较结果;
根据所述比较结果输出待测样本的类型是A类型还是B类型的结论;
所述A类型样本和所述B类型样本为如下任一种:
(C1)甲状腺良性肿瘤和甲状腺恶性肿瘤;
(C2)甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(C3)甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(C4)不同亚型的甲状腺恶性肿瘤;
(C5)不同分期的甲状腺恶性肿瘤。
其中,(C1)-(C5)的具体含义参见前文第一方面中所述。
在本发明的具体实施方式中,所述阈值设为0.5。大于0.5归为一类,小于0.5归为另外一类,等于0.5作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组是A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。
在实际应用中,所述阈值也可根据最大约登指数确定(具体可为最大约登指数对应的数值)。大于阈值归为一类,小于阈值归为另外一类,等于阈值作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。
在前文第一方面所述的数据处理装置或前文第二方面所述的系统或前文第三方面所述的计算机可读存储介质中,所述MREG基因甲基化水平可为MREG基因中如下(E1)-(E4)所示片段中全部或部分CpG位点的甲基化水平;
(E1)SEQ ID No.1所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E2)SEQ ID No.2所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E3)SEQ ID No.3所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E4)SEQ ID No.4所示的DNA片段或与其具有80%以上同一性的DNA片段。
进一步地,所述全部或部分CpG位点可为如下任一所示:
(F1)MREG基因中SEQ ID No.1、SEQ ID No.2、SEQ ID No.3和SEQ ID No.4所示4个DNA片段中的任意一个或多个CpG位点;
(F2)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点和SEQ ID No.2所示的DNA片段上的所有CpG位点;
(B3)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F4)MREG基因中SEQ ID No.2所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F5)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点、SEQ ID No.2所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F6)MREG基因中SEQ ID No.2所示的DNA片段中的全部CpG位点或任意12个或任意11个或任意10个或任意9个或任意8个或任意7个或任意6个或任意5个或任意4个或任意3个或任意2个或任意1个CpG位点;
(F7)MREG基因中SEQ ID No.2所示的DNA片段上如下5项所示CpG位点的全部或任意4项或任意3项或任意2项或任意1项:
第1项:SEQ ID No.2所示的DNA片段自5’端第167-168位和第169-170位所示CpG位点;
第2项:SEQ ID No.2所示的DNA片段自5’端第350-351位和第356-357位所示CpG位点;
第3项:SEQ ID No.2所示的DNA片段自5’端第365-366位所示CpG位点;
第4项:SEQ ID No.2所示的DNA片段自5’端第446-447位所示CpG位点;
第5项:SEQ ID No.2所示的DNA片段自5’端第496-497位所示CpG位点。
在本发明的具体实施方式中,有些相邻的甲基化位点在利用飞行时间质谱进行DNA甲基化分析时由于几个CpG位点位于一个甲基化片段上,峰图无法区分(无法区分的位点在表6中有记载),因而在进行甲基化水平分析、以及构建和使用相关数学模型时将其按照一个甲基化位点进行处理。
在前文第二方面所述的系统中,用于检测所述MREG基因甲基化水平的试剂包含(或为)用于扩增MREG基因全长或部分片段的引物组合,仪器可为飞行时间质谱检测仪。当然用于检测所述MREG基因甲基化水平的试剂中还可包含进行飞行时间质谱所用的其他常规试剂。
进一步地,所述部分片段可为如下中至少一个片段:
(G1)SEQ ID No.1所示的DNA片段或其包含的DNA片段;
(G2)SEQ ID No.2所示的DNA片段或其包含的DNA片段;
(G3)SEQ ID No.3所示的DNA片段或其包含的DNA片段;
(G4)SEQ ID No.4所示的DNA片段或其包含的DNA片段;
(G5)与SEQ ID No.1所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G6)与SEQ ID No.2所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G7)与SEQ ID No.3所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G8)与SEQ ID No.4所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段。
更进一步地,所述引物组合为引物对A和/或引物对B和/或引物对C和/或引物对D;
所述引物对A为引物A1和引物A2组成的引物对;所述引物A1为SEQ ID No.5或SEQID No.5的第11-35位核苷酸所示的单链DNA;所述引物A2为SEQ ID No.6或SEQ ID No.6的第32-56位核苷酸所示的单链DNA;
所述引物对B为引物B1和引物B2组成的引物对;所述引物B1为SEQ ID No.7或SEQID No.7的第11-35位核苷酸所示的单链DNA;所述引物B2为SEQ ID No.8或SEQ ID No.8的第32-56位核苷酸所示的单链DNA;
所述引物对C为引物C1和引物C2组成的引物对;所述引物C1为SEQ ID No.9或SEQID No.9的第11-35位核苷酸所示的单链DNA;所述引物C2为SEQ ID No.10或SEQ ID No.10的第32-56位核苷酸所示的单链DNA;
所述引物对D为引物D1和引物D2组成的引物对;所述引物D1为SEQ ID No.11或SEQID No.11的第11-35位核苷酸所示的单链DNA;所述引物D2为SEQ ID No.12或SEQ ID No.12的第32-56位核苷酸所示的单链DNA。
第四方面,本发明要求保护甲基化MREG基因作为标志物在制备产品中的应用;所述产品的用途为如下中的至少一种:
(1)区分或辅助区分甲状腺良性肿瘤和甲状腺恶性肿瘤;
(2)区分或辅助区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(3)区分或辅助区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(4)区分或辅助区分甲状腺恶性肿瘤不同亚型;
(5)区分或辅助区分甲状腺恶性肿瘤不同分期。
进一步地,(2)和(4)中所述不同亚型可为病理分型,如组织学分型。
进一步地,(3)和(5)中所述不同分期可为临床分期。
在本发明的具体实施方式中,(2)中所述区分或辅助区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤具体可为如下任一种:区分或辅助区分甲状腺良性肿瘤和甲状腺乳头状癌、区分或辅助区分甲状腺良性肿瘤和甲状腺滤泡癌、区分或辅助区分甲状腺良性肿瘤和甲状腺髓样癌、区分或辅助区分甲状腺良性肿瘤和甲状腺未分化癌。
在本发明的具体实施方式中,(3)中所述区分或辅助区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤具体可为如下任一种:区分或辅助区分甲状腺良性肿瘤和Ⅰ期甲状腺恶性肿瘤、区分或辅助区分甲状腺良性肿瘤和Ⅱ期甲状腺恶性肿瘤、区分或辅助区分甲状腺良性肿瘤和Ⅲ期甲状腺恶性肿瘤、区分或辅助区分甲状腺良性肿瘤和Ⅳ期甲状腺恶性肿瘤。
在本发明的具体实施方式中,(4)中所述区分或辅助区分甲状腺恶性肿瘤不同亚型具体可为如下任一种:区分或辅助区分甲状腺乳头状癌和甲状腺滤泡癌、区分或辅助区分甲状腺乳头状癌和甲状腺髓样癌、区分或辅助区分甲状腺乳头状癌和甲状腺未分化癌、区分或辅助区分甲状腺滤泡癌和甲状腺髓样癌、区分或辅助区分甲状腺滤泡癌和甲状腺未分化癌、区分或辅助区分甲状腺髓样癌和甲状腺未分化癌。
在本发明的具体实施方式中,(5)中所述区分或辅助区分甲状腺恶性肿瘤不同分期具体可为如下任一种:区分或辅助区分Ⅰ期甲状腺恶性肿瘤和Ⅱ期甲状腺恶性肿瘤、区分或辅助区分Ⅰ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤、区分或辅助区分Ⅰ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤、区分或辅助区分Ⅱ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤、区分或辅助区分Ⅱ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤、区分或辅助区分Ⅲ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤。
第五方面,本发明要求保护用于检测MREG基因甲基化水平的物质在制备产品中的应用;所述产品的用途为如下中的至少一种:
(1)区分或辅助区分甲状腺良性肿瘤和甲状腺恶性肿瘤;
(2)区分或辅助区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(3)区分或辅助区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(4)区分或辅助区分甲状腺恶性肿瘤不同亚型;
(5)区分或辅助区分甲状腺恶性肿瘤不同分期。
其中,(1)-(5)的具体含义参见前文第四方面中相关所述。
第六方面,本发明要求保护用于检测MREG基因甲基化水平的物质和储存有数学模型建立方法和/或使用方法的介质在制备产品中的应用;所述产品的用途为如下中的至少一种:
(1)区分或辅助区分甲状腺良性肿瘤和甲状腺恶性肿瘤;
(2)区分或辅助区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(3)区分或辅助区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(4)区分或辅助区分甲状腺恶性肿瘤不同亚型;
(5)区分或辅助区分甲状腺恶性肿瘤不同分期。
其中,(1)-(5)的具体含义参见前文第四方面中相关所述。
述数学模型按照包括如下步骤的方法获得:
(A1)分别检测n1个A类型样本和n2个B类型样本的MREG基因甲基化水平;
其中,n1和n2均可为10以上正整数,如100以上。
(A2)取步骤(A1)获得的所有样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
所述数学模型使用方法包括如下步骤:
(B1)检测待测样本的MREG基因甲基化水平;
(B2)将步骤(B1)获得的所述待测样本的MREG基因甲基化水平数据代入所述数学模型,得到检测指数;然后比较检测指数和阈值的大小,根据比较结果确定所述待测样本的类型是A类型还是B类型;
所述A类型样本和所述B类型样本为如下任一种:
(C1)甲状腺良性肿瘤和甲状腺恶性肿瘤;
(C2)甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(C3)甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(C4)不同亚型的甲状腺恶性肿瘤;
(C5)不同分期的甲状腺恶性肿瘤。
其中,(C1)-(C5)的具体含义参见前文第一方面中所述。
在本发明的具体实施方式中,所述阈值设为0.5。大于0.5归为一类,小于0.5归为另外一类,等于0.5作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组是A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。
在实际应用中,所述阈值也可根据最大约登指数确定(具体可为最大约登指数对应的数值)。大于阈值归为一类,小于阈值归为另外一类,等于阈值作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。
第七方面,本发明要求保护前文第六方面中所述的“储存有数学模型建立方法和/或使用方法的介质”在制备产品中的应用;所述产品的用途为如下中的至少一种:
(1)区分或辅助区分甲状腺良性肿瘤和甲状腺恶性肿瘤;
(2)区分或辅助区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(3)区分或辅助区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(4)区分或辅助区分甲状腺恶性肿瘤不同亚型;
(5)区分或辅助区分甲状腺恶性肿瘤不同分期。
其中,(1)-(5)的具体含义参见前文第四方面中所述。
在上述相关方面中,所述MREG基因甲基化水平为MREG基因中如下(E1)-(E4)所示片段中全部或部分CpG位点的甲基化水平。
在上述相关方面中,所述甲基化MREG基因为MREG基因中如下(E1)-(E4)所示片段中全部或部分CpG位点甲基化。
(E1)SEQ ID No.1所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E2)SEQ ID No.2所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E3)SEQ ID No.3所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E4)SEQ ID No.4所示的DNA片段或与其具有80%以上同一性的DNA片段。
进一步地,所述全部或部分CpG位点可为如下任一所示:
(F1)MREG基因中SEQ ID No.1、SEQ ID No.2、SEQ ID No.3和SEQ ID No.4所示4个DNA片段中的任意一个或多个CpG位点;
(F2)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点和SEQ ID No.2所示的DNA片段上的所有CpG位点;
(B3)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F4)MREG基因中SEQ ID No.2所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F5)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点、SEQ ID No.2所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F6)MREG基因中SEQ ID No.2所示的DNA片段中的全部CpG位点或任意12个或任意11个或任意10个或任意9个或任意8个或任意7个或任意6个或任意5个或任意4个或任意3个或任意2个或任意1个CpG位点;
(F7)MREG基因中SEQ ID No.2所示的DNA片段上如下5项所示CpG位点的全部或任意4项或任意3项或任意2项或任意1项:
第1项:SEQ ID No.2所示的DNA片段自5’端第167-168位和第169-170位所示CpG位点;
第2项:SEQ ID No.2所示的DNA片段自5’端第350-351位和第356-357位所示CpG位点;
第3项:SEQ ID No.2所示的DNA片段自5’端第365-366位所示CpG位点;
第4项:SEQ ID No.2所示的DNA片段自5’端第446-447位所示CpG位点;
第5项:SEQ ID No.2所示的DNA片段自5’端第496-497位所示CpG位点。
在上述相关方面中,所述用于检测MREG基因甲基化水平的物质包含(或为)用于扩增MREG基因全长或部分片段的引物组合;
进一步地,所述部分片段可为如下中至少一个片段:
(G1)SEQ ID No.1所示的DNA片段或其包含的DNA片段;
(G2)SEQ ID No.2所示的DNA片段或其包含的DNA片段;
(G3)SEQ ID No.3所示的DNA片段或其包含的DNA片段;
(G4)SEQ ID No.4所示的DNA片段或其包含的DNA片段;
(G5)与SEQ ID No.1所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G6)与SEQ ID No.2所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G7)与SEQ ID No.3所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G8)与SEQ ID No.4所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段。
更进一步地,所述引物组合为引物对A和/或引物对B和/或引物对C和/或引物对D;
所述引物对A为引物A1和引物A2组成的引物对;所述引物A1为SEQ ID No.5或SEQID No.5的第11-35位核苷酸所示的单链DNA;所述引物A2为SEQ ID No.6或SEQ ID No.6的第32-56位核苷酸所示的单链DNA;
所述引物对B为引物B1和引物B2组成的引物对;所述引物B1为SEQ ID No.7或SEQID No.7的第11-35位核苷酸所示的单链DNA;所述引物B2为SEQ ID No.8或SEQ ID No.8的第32-56位核苷酸所示的单链DNA;
所述引物对C为引物C1和引物C2组成的引物对;所述引物C1为SEQ ID No.9或SEQID No.9的第11-35位核苷酸所示的单链DNA;所述引物C2为SEQ ID No.10或SEQ ID No.10的第32-56位核苷酸所示的单链DNA;
所述引物对D为引物D1和引物D2组成的引物对;所述引物D1为SEQ ID No.11或SEQID No.11的第11-35位核苷酸所示的单链DNA;所述引物D2为SEQ ID No.12或SEQ ID No.12的第32-56位核苷酸所示的单链DNA。
以上任一所述数学模型在实际应用中可能会根据DNA甲基化的检测方法以及拟合方式不同有所改变,要根据具体的数学模型来确定,无需约定。
在本发明的实施例中,所述模型具体为ln(y/(1-y))=b0+b1x1+b2x2+b3x3+…+bnXn,其中y为因变量即将待测样品的一个或者多个甲基化位点的甲基化值代入模型以后得出的检测指数,b0为常量,x1-xn为自变量即为该测试样品的一个或者多个甲基化位点的甲基化值(每一个值为0-1之间的数值),b1-bn为模型赋予每一个位点甲基化值的权重。
本发明的实施例中建立的一个具体模型为用于区分或辅助区分甲状腺良性肿瘤和甲状腺恶性肿瘤的模型,所述模型具体为:ln(y/(1-y))=2.478-1.05*MREG_B_4.5-11.497*MREG_B_6.7+3.572*MREG_B_8+1.003*MREG_B_9+0.97*MREG_B_10。
所述MREG_B_CpG_4.5为SEQ ID No.2所示的DNA片段自5’端第167-168位和第169-170位所示CpG位点的甲基化水平;所述MREG_B_6.7为SEQ ID No.2所示的DNA片段自5’端第350-351位和第356-357位所示CpG位点的甲基化水平;所述MREG_B_8为SEQ ID No.2所示的DNA片段自5’端第365-366位所示CpG位点的甲基化水平;所述MREG_B_9为SEQ ID No.2所示的DNA片段自5’端第446-447位所示CpG位点的甲基化水平;所述MREG_B_10为SEQ ID No.2所示的DNA片段自5’端第496-497位所示CpG位点的甲基化水平。所述模型的阈值为0.5。通过模型计算的检测指数大于0.5的患者候选为甲状腺恶性肿瘤患者,小于0.5的患者候选为甲状腺良性肿瘤患者。
在上述各方面中,检测所述MREG基因甲基化水平可为检测肿瘤组织样本中所述MREG基因甲基化水平。
在本发明中,甲状腺恶性肿瘤组织中的MREG基因中SEQ ID No.1、2、3和4所示的DNA片段上甲基化位点的甲基化水平明显低于甲状腺良性肿瘤。
在本发明中,不同临床特征甲状腺癌如:乳头状癌、滤泡癌、髓样癌和未分化癌肿瘤组织中的MREG基因中SEQ ID No.1、2、3和4所示的DNA片段上甲基化位点的甲基化水平越来越低。
在本发明中,随着甲状腺恶性肿瘤的分期的增加组织中的MREG基因中SEQ IDNo.1、2、3和4所示的DNA片段上甲基化位点的甲基化水平越来越低。
以上任一所述MREG基因具体可参见Genbank登录号:NM_001372188.1(GI:1728373828),转录变体1;NM_018000.3(GI:1519245324),转录变体2;NM_001372189.1(GI:1728373839),转录变体3;NM_001372190.1(GI:1728373851),转录变体4。
本发明证明活检样本MREG甲基化可作为甲状腺良性肿瘤和甲状腺恶性肿瘤、不同亚型或不同分期的甲状腺恶性肿瘤的鉴别诊断的潜在标志物。本发明对鉴别甲状腺良性肿瘤和甲状腺恶性肿瘤、不同亚型或不同分期的甲状腺恶性肿瘤,以及指导制定合理的临床治疗方案均有重要的科学意义和临床应用价值。
附图说明
图1为本发明实现辅助区分A类型样本和B类型样本的计算机流程图。
图2为数学模型示意图。
图3为甲状腺良恶性肿瘤数学模型举例说明。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
图1为本发明实现辅助区分A类型样本和B类型样本的计算机流程图。
在步骤S1中,采集n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据;
在步骤S2中,将S1中所述n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
在步骤S3中,输入待测者的MREG基因甲基化水平数据;
在步骤S4中,将S3中所述待测者的MREG基因甲基化水平数据代入S2中所述数学模型,计算得到检测指数;
在步骤S5中,将S4中所述检测指数与S2中所述阈值进行比较,得到比较结果;
在步骤S6中,根据S5中所述比较结果输出待测样本的类型是A类型还是B类型的结论。
实施例1、用于检测MREG基因甲基化位点的引物设计
本次检测选择了MREG基因四个片段(MREG_A片段、MREG_B片段、MREG_C片段和MREG_D片段)上的CpG位点进行甲基化水平和甲状腺恶性肿瘤的相关性分析。
MREG_A片段(SEQ ID No.1)位于hg19参考基因组chr2:216869695-216870453,正义链。
MREG_B片段(SEQ ID No.2)位于hg19参考基因组chr2:216870879-216871506,正义链。
MREG_C片段(SEQ ID No.3)位于hg19参考基因组chr2:216871679-216872350,正义链。
MREG_D片段(SEQ ID No.4)位于hg19参考基因组chr2:216872329-216872917,正义链。
MREG_A片段中的位点信息如表1所示。
MREG_B片段中的位点信息如表2所示。
MREG_C片段中的位点信息如表3所示。
MREG_D片段中的位点信息如表4所示。
表1 MREG_A片段中CpG位点信息
CpG位点 | CpG位点在序列中的位置 |
MREG_A_1 | SEQ ID No.1自5’端第26-27位 |
MREG_A_2 | SEQ ID No.1自5’端第245-246位 |
MREG_A_3 | SEQ ID No.1自5’端第450-451位 |
MREG_A_4 | SEQ ID No.1自5’端第628-629位 |
MREG_A_5 | SEQ ID No.1自5’端第733-734位 |
表2 MREG_B片段中CpG位点信息
表3 MREG_C片段中CpG位点信息
CpG位点 | CpG位点在序列中的位置 |
MREG_C_1 | SEQ ID No.3自5’端第26-27位 |
MREG_C_2 | SEQ ID No.3自5’端第116-117位 |
MREG_C_3 | SEQ ID No.3自5’端第122-123位 |
MREG_C_4 | SEQ ID No.3自5’端第243-244位 |
MREG_C_5 | SEQ ID No.3自5’端第251-252位 |
MREG_C_6 | SEQ ID No.3自5’端第351-352位 |
MREG_C_7 | SEQ ID No.3自5’端第365-366位 |
MREG_C_8 | SEQ ID No.3自5’端第421-422位 |
MREG_C_9 | SEQ ID No.3自5’端第505-506位 |
MREG_C_10 | SEQ ID No.3自5’端第560-561位 |
MREG_C_11 | SEQ ID No.3自5’端第573-574位 |
MREG_C_12 | SEQ ID No.3自5’端第631-632位 |
表4 MREG_D片段中CpG位点信息
CpG位点 | CpG位点在序列中的位置 |
MREG_D_1 | SEQ ID No.4自5’端第26-27位 |
MREG_D_2 | SEQ ID No.4自5’端第84-85位 |
MREG_D_3 | SEQ ID No.4自5’端第134-135位 |
MREG_D_4 | SEQ ID No.4自5’端第379-380位 |
MREG_D_5 | SEQ ID No.4自5’端第451-452位 |
MREG_D_6 | SEQ ID No.4自5’端第560-561位 |
MREG_D_7 | SEQ ID No.4自5’端第563-564位 |
针对四个片段(MREG_A片段、MREG_B片段、MREG_C片段和MREG_D片段)设计特异性PCR引物,如表5所示。SEQ ID No.5、SEQ ID No.7、SEQ ID No.9和SEQ ID No.11为正向引物;SEQ ID No.6、SEQ ID No.8、SEQ ID No.10和SEQ ID No.12为反向引物。SEQ ID No.5、SEQ ID No.7、SEQ ID No.9和SEQ ID No.11中自5’端第1至10位为非特异性标签,第11至35位为特异性引物序列;SEQ ID No.6、SEQ ID No.8、SEQ ID No.10和SEQ ID No.12中自5’端第1至31位为非特异性标签,第32至56位为特异性引物序列。引物序列中不包含SNP和CpG位点。
表5、MREG甲基化引物序列
实施例2、MREG基因甲基化检测及结果分析(训练集)
一、研究样本
经患者知情同意,共收集380例甲状腺良性肿瘤组织和598例甲状腺恶性肿瘤组织。甲状腺癌分期以美国癌症联合会(AJCC)第八版分期系统为判断标准。根据病理类型,甲状腺恶性肿瘤包括甲状腺乳头状癌、甲状腺滤泡癌、髓样癌和未分化癌四大类。本次收集的598例甲状腺恶性肿瘤患者中包括甲状腺乳头状癌380例,甲状腺滤泡癌138例,甲状腺髓样癌44例,甲状腺未分化癌36例。按照病理分期划分,598例甲状腺恶性肿瘤患者中有470例Ⅰ期患者,68例Ⅱ期患者,24例Ⅲ期患者,36例Ⅳ期患者。
二、甲基化检测
1、提取肿瘤组织中的总DNA。
2、将步骤1制备的组织样本总DNA进行重亚硫酸盐处理(参照Qiagen的DNA甲基化试剂盒说明书操作)。重亚硫酸盐处理后,原来CpG位点中未发生甲基化的胞嘧啶(C)被转化成尿嘧啶(U),而发生甲基化的胞嘧啶保持不变。
3、以步骤2经过重亚硫酸盐处理的DNA为模板,采用表5中的4对特异引物对通过DNA聚合酶按照常规PCR反应要求的反应体系进行PCR扩增,所有引物都采用常规的标准PCR反应体系,且都按照以下程序进行扩增。
PCR反应程序为:95℃,4min→(95℃,20s→56℃,30s→72℃,2min)45个循环→72℃,5min→4℃,1h。
4、取步骤3的扩增产物,通过飞行时间质谱进行DNA甲基化分析,具体方法如下:
(1)向5μl PCR产物中加入2μl虾碱性磷酸盐(SAP)溶液(0.3ml SAP[0.5U]+1.7mlH2O)然后按照以下程序在PCR仪中孵育(37℃,20min→85℃,5min→4℃,5min);
(2)取出2μl步骤(1)得到的SAP处理后的产物,根据说明书加入5μl T-Cleavage反应体系中,然后在37℃孵育3h;
(3)取步骤(2)的产物,加入19μl去离子水,再用6μg Resin在旋转摇床进行去离子化孵育1h;
(4)2000rpm室温离心5min,将微量上清由Nanodispenser机械手臂上样384SpectroCHIP;
(5)飞行时间质谱分析;获得的数据用SpectroACQUIRE v3.3.1.3软件收集,通过MassArray EpiTyper v1.2软件实现可视化。
上述飞行时间质谱检测使用的试剂均来试剂盒(T-Cleavage MassCLEAVEReagent Auto Kit,货号:10129A);上述飞行时间质谱检测使用的检测仪器为MassARRAY○R Analyzer Chip Prep Module 384,型号:41243;上述数据分析软件为检测仪器自带软件。
5、对步骤4得到的数据进行分析。
数据统计分析由SPSS Statistics 23.0进行。
非参数检验用于两组之间的比较分析。
多个CpG位点的组合对于不同样品分组的鉴别效果通过逻辑回归和受试者曲线的统计学方法得以实现。
所有的统计检验都是双侧的,p值<0.05被认为具有统计学意义。
通过质谱实验,共获得33个可以区别的峰图。采用SpectroACQUIRE v3.3.1.3软件根据“甲基化水平=甲基化片段的峰面积/(非甲基化片段的峰面积+甲基化片段的峰面积)”公式可自动通过计算峰面积得到每个样本在每个CpG位点的甲基化水平。
三、统计分析
采用中位数表示甲基化水平,采用非参数检验比较两组或多组之间的甲基化水平差异。通过受试者工作特征曲线(receiver operating characteristic curve,ROC曲线)评价单个CpG位点和多个CpG位点组合的鉴别诊断价值。以双侧P<0.05为差异有统计学意义,所有数据均通过SPSS25.0进行统计分析。
四、结果分析
1、甲状腺良性肿瘤和甲状腺恶性肿瘤MREG基因甲基化水平分析
以380例甲状腺良性肿瘤和598例甲状腺恶性肿瘤的组织样本为研究材料分析MREG基因中所有CpG位点的甲基化水平。甲状腺良性肿瘤、甲状腺恶性肿瘤、甲状腺乳头状癌、甲状腺滤泡癌、甲状腺髓样癌、甲状腺未分化癌、Ⅰ期甲状腺恶性肿瘤、Ⅱ期甲状腺恶性肿瘤、Ⅲ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤病例MREG基因4个片段的甲基化水平的具体结果见表6。结果表明,甲状腺良性肿瘤MREG基因的甲基化水平中位数为0.64(IQR=0.44-0.73),甲状腺恶性肿瘤MREG基因的甲基化水平中位数为0.42(IQR=0.25-0.58),不同亚型MREG基因的甲基化水平中位数依次为:乳头状癌0.41(IQR=0.24-0.57)、甲状腺滤泡癌0.34(IQR=0.20-0.53)、甲状腺髓样癌0.32(IQR=0.18-0.51)、甲状腺未分化癌0.29(IQR=0.16-0.47),不同分期MREG基因的甲基化水平中位数依次为:I期为0.40(IQR=0.24-0.56)、II期为0.37(IQR=0.23-0.54)、Ⅲ期为0.33(IQR=0.17-0.49)、Ⅳ期为0.29(IQR=0.14-0.46)。通过比较分析几者之间的甲基化水平,结果发现甲状腺良性肿瘤MREG基因中所有CpG位点的甲基化水平显著高于甲状腺恶性肿瘤中MREG基因中所有CpG位点的甲基化水平的(表6)。另外,本发明中列出的几类甲状腺癌亚型如:甲状腺乳头状癌、甲状腺滤泡癌、甲状腺髓样癌和甲状腺未分化癌组织中的MREG基因中SEQ ID No.1、2、3和4所示的DNA片段上甲基化位点的甲基化水平依次呈下降趋势(表6),与甲状腺良性肿瘤之间的差异性越来越明显。另外,随着甲状腺恶性肿瘤分期的增加组织中MREG基因中SEQ ID No.1、2、3和4所示的DNA片段上甲基化位点的甲基化水平越来越低(表6),与甲状腺良性肿瘤之间差异性也越来越明显。
表6、甲状腺良性肿瘤和甲状腺恶性肿瘤及其各亚型、各分期的MREG基因甲基化水平
注:表中的CpG位点均指可区分的CpG位点。
2、肿瘤组织中MREG基因甲基化水平可以区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤
通过比较分析380例甲状腺良性肿瘤病例和598例甲状腺恶性肿瘤病例的MREG甲基化水平,结果发现,甲状腺恶性肿瘤、甲状腺乳头状癌、甲状腺滤泡癌、髓样癌和未分化癌患者中MREG_A片段、MREG_B片段、MREG_C片段和MREG_D片段甲基化水平显著低于甲状腺良性肿瘤患者中对应片段的甲基化水平(P<0.05)。具体结果见表7。
表7、甲状腺良性肿瘤与不同亚型甲状腺恶性肿瘤之间的MREG基因甲基化水平差异
注:表中的CpG位点均指可区分的CpG位点。
3、肿瘤组织中MREG基因甲基化水平可以区分不同亚型的甲状腺恶性肿瘤
通过比较分析不同分型的甲状腺恶性肿瘤(380例甲状腺乳头状癌、138例甲状腺滤泡癌、44例甲状腺髓样癌和36例甲状腺未分化癌)病例的MREG甲基化水平,结果发现,甲状腺乳头状癌、甲状腺滤泡癌、甲状腺髓样癌和甲状腺未分化癌患者的MREG基因甲基化水平之间有显著差异(P<0.05)。具体结果见表8。
表8、甲状腺恶性肿瘤各亚型之间的MREG基因甲基化水平差异
注:表中的CpG位点均指可区分的CpG位点。
4、肿瘤组织中MREG基因甲基化水平可以区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤
通过比较分析380例甲状腺良性肿瘤病例和不同分期的甲状腺恶性肿瘤患者(470例Ⅰ期患者、48例Ⅱ期患者、24例Ⅲ期患者和36例Ⅳ期患者)的MREG甲基化水平,结果发现,MREG_A片段、MREG_B片段、MREG_C片段和MREG_D片段甲基化水平随着分期增加显著降低(P<0.01)。具体结果见表9。
表9、甲状腺良性肿瘤与不同分期甲状腺恶性肿瘤之间的MREG基因甲基化水平差异
注:表中的CpG位点均指可区分的CpG位点。
5、肿瘤组织中MREG基因甲基化水平可以区分不同分期的甲状腺恶性肿瘤
通过比较分析不同分期的甲状腺恶性肿瘤患者(470例Ⅰ期患者、48例Ⅱ期患者、24例Ⅲ期患者和36例Ⅳ期患者)的MREG甲基化水平,结果发现,Ⅰ期甲状腺恶性肿瘤、Ⅱ期甲状腺恶性肿瘤、Ⅲ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者的MREG基因甲基化水平之间有显著差异(P<0.05)。具体结果见表10。
表10、甲状腺恶性肿瘤不同分期之间的MREG基因甲基化水平差异
注:表中的CpG位点均指可区分的CpG位点。
6、MREG基因甲基化用于辅助癌症诊断的数学模型的建立
本发明建立的数学模型可以用于达到如下目的:
(1)区分甲状腺恶性肿瘤患者和甲状腺良性肿瘤;
(2)区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(3)区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(4)区分甲状腺恶性肿瘤不同亚型;
(5)区分甲状腺恶性肿瘤不同分期。
数学模型的建立方法如下:
(A)数据来源:步骤一中列出380例甲状腺良性肿瘤和598例甲状腺恶性肿瘤(甲状腺乳头状癌380例,甲状腺滤泡癌138例,甲状腺髓样癌44例和甲状腺未分化癌36例)的组织样本的目标CpG位点(表1-表4中的一种或多种的组合)甲基化水平(检测方法同步骤二)。
(B)模型建立
根据需要选取任意两类不同类型患者数据即训练集(例如:甲状腺良性肿瘤和甲状腺恶性肿瘤患者、甲状腺良性肿瘤和甲状腺乳头状癌患者、甲状腺良性肿瘤和甲状腺滤泡癌患者、甲状腺良性肿瘤和髓样癌患者、甲状腺良性肿瘤和未分化癌患者、甲状腺乳头状癌和甲状腺滤泡癌患者、甲状腺乳头状癌和甲状腺髓样癌患者、甲状腺乳头状癌和甲状腺未分化癌患者、甲状腺滤泡癌和甲状腺髓样癌患者、甲状腺滤泡癌和甲状腺未分化癌患者、甲状腺髓样癌和甲状腺未分化癌患者、甲状腺良性肿瘤和Ⅰ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅱ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅱ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅱ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、Ⅱ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅲ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者)作为用于建立模型的数据,使用SAS,R,SPSS等统计软件使用二分类逻辑回归的统计方法通过公式建立数学模型。数学模型公式计算出的最大约登指数对应的数值为阈值或直接设定0.5为阈值,待测样品经过测试和代入模型计算后得到的检测指数大于阈值归为一类(B类),小于阈值归为另外一类(A类),等于阈值作为不确定的灰区。在对新的待测样品进行预测来判断属于哪一类时,首先通过DNA甲基化的测定方法检测该待测样品MREG基因上一个或者多个CpG位点的甲基化水平,然后将这些甲基化水平的数据代入上述数学模型,计算得到所述待测样本对应的检测指数,然后比较所述待测样本对应的检测指数和阈值的大小,根据比较结果确定所述待测样本属于哪一类样本。
举例:如图2所示,将训练集中MREG基因单个CpG位点的甲基化水平或者多个CpG位点组合的甲基化水平的数据通过SAS、R、SPSS等统计软件使用二分类逻辑回归的公式建立用于区分A类和B类的数学模型。该数学模型在此为二类逻辑回归模型,具体为:ln(y/(1-y))=b0+b1x1+b2x2+b3x3+…+bnXn,其中y为因变量即将待测样品的一个或者多个甲基化位点的甲基化水平代入模型以后得出的检测指数,b0为常量,x1-xn为自变量即为该测试样品的一个或者多个甲基化位点的甲基化水平(每一个值为0-1之间的数值),b1~bn为模型赋予每一个位点甲基化水平的权重。具体应用时,先根据训练集中已经检测的样本的一个或者多个DNA甲基化位点的甲基化水平(x1-xn)及其已知的分类情况(A类或者B类,分别对y赋值0和1)建立数学模型,由此确定该数学模型的常量b0以及各个甲基化位点的权重b1-bn,并由该数学模型计算出的以最大约登指数对应的数值为阈值或直接设定0.5为划分的阈值。待测样品经过测试和代入模型计算后得到的检测指数即y值大于阈值归为B类,小于阈值归为A类,等于阈值作为不确定的灰区。其中A类和B类为相对应的两分类(二分类的分组,哪一组A类,哪一组是B类,要根据具体的数学模型来确定,在此不做约定)。对受试者的样品进行预测来判断属于哪一类时,首先收集受试者的活检样本(即肿瘤组织),然后从中提取DNA。将提取的DNA通过重亚硫酸盐转化后,用DNA甲基化的测定方法对受试者MREG基因的单个CpG位点的甲基化水平或者多个CpG位点组合的甲基化水平进行检测,然后将检测得到的甲基化数据代入上述数学模型。如果该受试者的MREG基因一个或者多个CpG位点的甲基化水平代入上述数学模型后计算出来的值即检测指数大于阈值,则该受试者判定与训练集中检测指数大于阈值的归属一类(B类);如果该受试者的MREG基因一个或者多个CpG位点的甲基化水平数据代入上述数学模型后计算出来的值即检测指数小于阈值,则该受试者跟训练集中检测指数小于阈值的归属一类(A类);如果该受试者的MREG基因一个或者多个CpG位点的甲基化水平数据代入上述数学模型后计算出来的值即检测指数等于阈值,则不能判断该受试者是A类还是B类。
举例:如图3所示,举例说明MREG_B的如下5个可区分CpG位点(MREG_B_4.5、MREG_B_6.7、MREG_B_8、MREG_B_9、MREG_B_10)的甲基化以及数学建模在鉴别甲状腺良性肿瘤和甲状腺恶性肿瘤组织中的应用:将甲状腺良性肿瘤和甲状腺恶性肿瘤患者训练集(在此为:380甲状腺良性肿瘤和598例甲状腺恶性肿瘤患者)中已经检测的MREG_B的上述5个可区分CpG位点的甲基化水平的数据通过SPSS软件或R软件使用二分类逻辑回归的公式建立用于鉴别甲状腺恶性肿瘤患者的数学模型。该数学模型在此为二类逻辑回归模型,由此确定该数学模型的常量b0以及各个甲基化位点的权重b1-bn,在此例中具体为:ln(y/(1-y))=2.478-1.05*MREG_B_4.5-11.497*MREG_B_6.7+3.572*MREG_B_8+1.003*MREG_B_9+0.97*MREG_B_10,其中y为因变量,即将待测样品的MREG_B的上述5个可区分CpG位点的甲基化水平代入模型以后得出的检测指数。MREG_B_4和MREG_B_5位于同一片段,MREG_B_6和MREG_B_7位于同一片段故以MREG_B_4.5和MREG_B_6.7代表这两个位点甲基化水平的平均值。通过设定0.5为阈值的情况下,待测样品的MREG_B的上述5个可区分CpG位点的甲基化水平经过测试得到的值代入模型进行计算,得到的检测指数即y值小于阈值归为甲状腺良性肿瘤患者,大于阈值归为甲状腺恶性肿瘤患者,等于阈值则不确定为甲状腺良性肿瘤患者还是甲状腺恶性肿瘤患者。此模型的曲线下面积(AUC)计算结果为0.82(表15)。具体受试者判断方法举例如下所示,从两位受试者(甲,乙)分别收集活检样本提取DNA,将提取的DNA通过重亚硫酸盐转化后,用DNA甲基化的测定方法对受试者的(MREG_B_4.5、MREG_B_6.7、MREG_B_8、MREG_B_9、MREG_B_10)这5个可区分CpG位点的甲基化水平进行检测。然后将检测得到的甲基化水平数据信息代入上述数学模型。甲受试者的MREG_B的上述5个可区分CpG位点的甲基化水平数据代入上述数学模型后计算出来的值为0.81大于0.5,则甲受试者判定为甲状腺恶性肿瘤患者(与临床诊断相符);乙受试者的MREG_B的上述5个可区分CpG位点的甲基化水平数据代入上述数学模型后计算出来的值为0.37小于0.5,则乙受试者判定甲状腺良性肿瘤患者(与临床诊断相符)。
(C)模型效果评价
根据上述方法,分别建立用于发现甲状腺良性肿瘤和甲状腺恶性肿瘤患者、甲状腺良性肿瘤和甲状腺乳头状癌患者、甲状腺良性肿瘤和甲状腺滤泡癌患者、甲状腺良性肿瘤和甲状腺髓样癌患者、甲状腺良性肿瘤和甲状腺未分化癌患者、甲状腺乳头状癌和甲状腺滤泡癌患者、甲状腺乳头状癌和甲状腺髓样癌患者、甲状腺乳头状癌和甲状腺未分化癌患者、甲状腺滤泡癌和甲状腺髓样癌患者、甲状腺滤泡癌和甲状腺未分化癌患者、甲状腺髓样癌和甲状腺未分化癌患者、甲状腺良性肿瘤和Ⅰ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅱ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅱ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅱ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、Ⅱ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅲ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者的数学模型,并且通过受试者曲线(ROC曲线)对其有效性进行评价。ROC曲线得出的曲线下面积(AUC)越大,说明模型的区分度越好,分子标志物越有效。采用不同CpG位点进行数学模型构建后的评价结果如表11、表12、表13和表14所示。表11、表12、表13和表14中,1个CpG位点代表MREG_B扩增片段中任意一个CpG位点的位点,2个CpG位点代表MREG_B扩增片段中任意2个CpG位点的组合,3个CpG位点代表MREG_B扩增片段中任意3个CpG位点的组合,……以此类推。表中的数值为不同位点组合评价结果的范围值(即任意个CpG位点组合方式的结果均在此范围内)。
上述研究结果显示,MREG基因甲基化对于各组的鉴别能力(甲状腺良性肿瘤和甲状腺恶性肿瘤患者、甲状腺良性肿瘤和甲状腺乳头状癌患者、甲状腺良性肿瘤和甲状腺滤泡癌患者、甲状腺良性肿瘤和甲状腺髓样癌患者、甲状腺良性肿瘤和甲状腺未分化癌患者、甲状腺乳头状癌和甲状腺滤泡癌患者、甲状腺乳头状癌和甲状腺髓样癌患者、甲状腺乳头状癌和甲状腺未分化癌患者、甲状腺滤泡癌和甲状腺髓样癌患者、甲状腺滤泡癌和甲状腺未分化癌患者、甲状腺髓样癌和甲状腺未分化癌患者、甲状腺良性肿瘤和Ⅰ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅱ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅱ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅱ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、Ⅱ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅲ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者)随着MREG基因上甲基化位点个数的增加而增加。
除此以外,在表1-表4所示的CpG位点中,还存在少数几个优选位点的组合比多个非优选位点组合的鉴别能力更好的情况。例如表15、表16、表17和表18所示的MREG_B_4.5、MREG_B_6.7、MREG_B_8、MREG_B_9、MREG_B_10这5个可区分CpG位点的组合是MREG_B中任意5个组合的优选位点。
表11、MREG_B的CpG位点及其组合用于区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤
表12、MREG_B的CpG位点及其组合用于区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤
表13、MREG_B的CpG位点及其组合用于区分不同亚型甲状腺恶性肿瘤患者
表14、MREG_B的CpG位点及其组合用于区分不同分期甲状腺恶性肿瘤患者
表15、MREG_B的最佳CpG位点及其组合用于区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤
注:表中的CpG位点均指可区分的CpG位点。
表16、MREG_B的最佳CpG位点及其组合用于区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤
注:表中的CpG位点均指可区分的CpG位点。
表17、MREG_B的最佳CpG位点及其组合用于甲状腺恶性肿瘤不同亚型之间的区分
注:表中的CpG位点均指可区分的CpG位点。
表18、MREG_B的最佳CpG位点及其组合用于甲状腺恶性肿瘤不同分期之间的区分
注:表中的CpG位点均指可区分的CpG位点。
实施例3、MREG甲基化基因片段实验结果及模型在验证集中的验证
一、本发明另选取一组受试者作为验证集(样本完全不同于实施例2中的训练集),具体样本收集情况如下:
190例甲状腺良性肿瘤组织和300例甲状腺恶性肿瘤组织。甲状腺癌分期以美国癌症联合会(AJCC)第八版分期系统为判断标准。根据病理类型,甲状腺恶性肿瘤包括甲状腺乳头状癌、甲状腺滤泡癌、髓样癌和未分化癌四大类。本次收集的300例甲状腺恶性肿瘤患者中包括甲状腺乳头状癌188例,甲状腺滤泡癌70例,髓样癌22例,未分化癌20例。按照病理分期划分,300例甲状腺恶性肿瘤患者中有200例Ⅰ期患者,40例Ⅱ期患者,20例Ⅲ期患者,40例Ⅳ期患者。
二、甲基化检查、数据分析及统计分析方法
同实施例2。
三、结果分析
1、甲状腺良性肿瘤和甲状腺恶性肿瘤MREG基因甲基化水平分析
如表19所示,甲状腺良性肿瘤MREG基因的甲基化水平中位数为0.63(IQR=0.43-0.73),甲状腺恶性肿瘤MREG基因的甲基化水平中位数为0.41(IQR=0.24-0.56),不同亚型MREG基因的甲基化水平中位数依次为:乳头状癌0.40(IQR=0.24-0.57)、甲状腺滤泡癌0.36(IQR=0.21-0.55)、甲状腺髓样癌0.34(IQR=0.20-0.52)、甲状腺未分化癌0.31(IQR=0.18-0.51),不同分期MREG基因的甲基化水平中位数依次为:I期为0.41(IQR=0.24-0.56)、II期为0.39(IQR=0.24-0.55)、Ⅲ期为0.34(IQR=0.18-0.56)、Ⅳ期为0.31(IQR=0.16-0.49)。结果表明,甲状腺良性肿瘤MREG基因中所有CpG位点的甲基化水平显著高于甲状腺恶性肿瘤中MREG基因中所有CpG位点的甲基化水平的。另外,甲状腺乳头状癌、甲状腺滤泡癌、甲状腺髓样癌和甲状腺未分化癌组织中的MREG基因中SEQ ID No.1、2、3和4所示的DNA片段上甲基化位点的甲基化水平依次呈下降趋势,与甲状腺良性肿瘤之间的差异性越来越明显。另外,随着甲状腺恶性肿瘤分期的增加组织中MREG基因中SEQ ID No.1、2、3和4所示的DNA片段上甲基化位点的甲基化水平越来越低,与甲状腺良性肿瘤之间差异性也越来越明显。
表19、甲状腺良性肿瘤和甲状腺恶性肿瘤及其各亚型、各分期的MREG基因甲基化水平
2、肿瘤组织中MREG基因甲基化水平可以区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤
如表20所示,甲状腺恶性肿瘤、甲状腺乳头状癌、甲状腺滤泡癌、髓样癌和未分化癌患者中MREG_A片段、MREG_B片段、MREG_C片段和MREG_D片段甲基化水平显著低于甲状腺良性肿瘤患者中对应片段的甲基化水平(P<0.05)。
表20、甲状腺良性肿瘤与不同亚型甲状腺恶性肿瘤之间的MREG基因甲基化水平差异
3、肿瘤组织中MREG基因甲基化水平可以区分不同亚型的甲状腺恶性肿瘤
如表21所示,甲状腺乳头状癌、甲状腺滤泡癌、甲状腺髓样癌和甲状腺未分化癌患者的MREG基因甲基化水平之间有显著差异(P<0.05)。
表21、甲状腺恶性肿瘤各亚型之间的MREG基因甲基化水平差异
4、肿瘤组织中MREG基因甲基化水平可以区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤
如表22所示,甲状腺癌Ⅰ期、Ⅱ期、Ⅲ期和Ⅳ期患者中的MREG_A片段、MREG_B片段、MREG_C片段和MREG_D片段甲基化水平显著低于甲状腺良性肿瘤患者中对应片段的甲基化水平(P<0.05)。
表22、甲状腺良性肿瘤与不同分期甲状腺恶性肿瘤之间的MREG基因甲基化水平差异
5、肿瘤组织中MREG基因甲基化水平可以区分不同分期的甲状腺恶性肿瘤
如表23所示,Ⅰ期甲状腺恶性肿瘤、Ⅱ期甲状腺恶性肿瘤、Ⅲ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者的MREG基因甲基化水平之间有显著差异(P<0.05)。
表23、甲状腺恶性肿瘤不同分期之间的MREG基因甲基化水平差异
6、模型验证
将验证集中不同类型样本的MREG基因相应位点的甲基化水平代入实施例2训练集的各个模型中进行验证。MREG基因对于各组的鉴别能力(例如:甲状腺良性肿瘤和甲状腺恶性肿瘤患者、甲状腺良性肿瘤和甲状腺乳头状癌患者、甲状腺良性肿瘤和甲状腺滤泡癌患者、甲状腺良性肿瘤和髓样癌患者、甲状腺良性肿瘤和未分化癌患者、甲状腺乳头状癌和甲状腺滤泡癌患者、甲状腺乳头状癌和甲状腺髓样癌患者、甲状腺乳头状癌和甲状腺未分化癌患者、甲状腺滤泡癌和甲状腺髓样癌患者、甲状腺滤泡癌和甲状腺未分化癌患者、甲状腺髓样癌和甲状腺未分化癌患者、甲状腺良性肿瘤和Ⅰ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅱ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、甲状腺良性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅱ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、Ⅰ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅱ期甲状腺恶性肿瘤和Ⅲ期甲状腺恶性肿瘤患者、Ⅱ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者、Ⅲ期甲状腺恶性肿瘤和Ⅳ期甲状腺恶性肿瘤患者),由表24至表31可看出,MREG_A片段(SEQ ID No.1)、MREG_B片段(SEQ ID No.2)和MREG_C片段(SEQ ID No.3)组合对于各组的鉴别效果最好。
除此以外,几个较优位点的组合,如表28至表31所示的MREG_B_4.5、MREG_B_6.7、MREG_B_8、MREG_B_9、MREG_B_10这5个可区分的最优位点的组合对于本发明中列出各组不同的样本类型具有较好的鉴别能力。
表24、MREG_B的CpG位点及其组合用于区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤
表25、MREG_B的CpG位点及其组合用于区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤
表26、MREG_B的CpG位点及其组合用于区分不同亚型甲状腺恶性肿瘤患者
表27、MREG_B的CpG位点及其组合用于区分不同分期甲状腺恶性肿瘤患者
表28、MREG_B的最佳CpG位点及其组合用于区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤
注:表中的CpG位点均指可区分的CpG位点。
表29、MREG_B的最佳CpG位点及其组合用于区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤
表30、MREG_B的最佳CpG位点及其组合用于甲状腺恶性肿瘤不同亚型之间的区分
注:表中5个CpG位点是指MREG_B_4.5、MREG_B_6.7、MREG_B_8、MREG_B_9、MREG_B_10。
表31、MREG_B的最佳CpG位点及其组合用于甲状腺恶性肿瘤不同分期之间的区分
注:表中5个CpG位点是指MREG_B_4.5、MREG_B_6.7、MREG_B_8、MREG_B_9、MREG_B_10。
将验证集中不同类型样本的甲基化水平代入实施例2训练集中各个模型中,将经模型得出的值与临床结果进行对比,结果显示与临床具有一致性。由此可见,该专利中构建的模型能够有效区分本发明中列出的各组不同的样本类型。
综上所述,MREG基因上的CpG位点及其各种组合,MREG_A片段上的CpG位点及其各种组合,MREG_B片段上的CpG位点及其各种组合,MREG_B_4.5、MREG_B_6.7、MREG_B_8、MREG_B_9、MREG_B_10位点及其各种组合,MREG_C片段上的CpG位点及其各种组合,MREG_D片段上的CpG位点及其各种组合,以及MREG_A、MREG_B、MREG_C和MREG_D上的CpG位点及其各种组合的甲基化水平对本专利中各类不同类型的样本具有鉴别能力。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
Claims (10)
1.一种用于辅助区分A类型样本和B类型样本的数据处理装置,所述A类型样本和所述B类型样本为如下任一种:
(C1)甲状腺良性肿瘤和甲状腺恶性肿瘤;
(C2)甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(C3)甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(C4)不同亚型的甲状腺恶性肿瘤;
(C5)不同分期的甲状腺恶性肿瘤;
其特征在于:所述数据处理装置包括单元X和单元Y;
所述单元X用于建立数学模型,包括数据采集模块、数据分析处理模块和模型输出模块;
所述数据采集模块被配置为采集n1个所述A类型样本和n2个所述B类型样本的MREG基因甲基化水平数据;
所述数据分析处理模块被配置为接收来自于所述数据采集模块的所述n1个所述A类型样本和n2个所述B类型样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
所述模型输出模块被配置为接收来自于所述数据分析处理模块建立的所述数学模型,并进行输出;
所述单元Y用于确定待测样本类型,包括数据输入模块、数据运算模块、数据比较模块和结论输出模块;
所述数据输入模块被配置为输入待测者的MREG基因甲基化水平数据;
所述数据运算模块被配置为接收来自于所述数据输入模块的所述待测者的MREG基因甲基化水平数据,并将所述待测者的MREG基因甲基化水平数据代入所述单元X中的所述数据分析处理模块建立的所述数学模型,计算得到检测指数;
所述数据比较模块被配置为接收来自于所述数据运算模块计算得到的检测指数,并将所述检测指数与所述单元X中的所述数据分析处理模块中确定的所述阈值进行比较;
所述结论输出模块被配置为接收来自于所述数据比较模块的比较结果,并根据所述比较结果输出所述待测样本的类型是A类型还是B类型的结论。
2.一种系统,包括:
(D1)用于检测MREG基因甲基化水平的试剂和/或仪器;
(D2)装置,所述装置包括单元X和单元Y;
所述单元X用于建立数学模型,包括数据采集模块、数据分析处理模块和模型输出模块;
所述数据采集模块被配置为采集(D1)检测得到的n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据;
所述数据分析处理模块被配置为接收来自于所述数据采集模块的所述n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
所述模型输出模块被配置为接收来自于所述数据分析处理模块建立的所述数学模型,并进行输出;
所述单元Y用于确定待测样本类型,包括数据输入模块、数据运算模块、数据比较模块和结论输出模块;
所述数据输入模块被配置为输入(D1)检测得到的待测者的MREG基因甲基化水平数据;
所述数据运算模块被配置为接收来自于所述数据输入模块的所述待测者的MREG基因甲基化水平数据,并将所述待测者的MREG基因甲基化水平数据代入所述单元X中的所述数据分析处理模块建立的所述数学模型,计算得到检测指数;
所述数据比较模块被配置为接收来自于所述数据运算模块计算得到的检测指数,并将所述检测指数与所述单元X中的所述数据分析处理模块中确定的所述阈值进行比较;
所述结论输出模块被配置为接收来自于所述数据比较模块的比较结果,并根据所述比较结果输出所述待测样本的类型是A类型还是B类型的结论;
所述A类型样本和所述B类型样本为如下任一种:
(C1)甲状腺良性肿瘤和甲状腺恶性肿瘤;
(C2)甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(C3)甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(C4)不同亚型的甲状腺恶性肿瘤;
(C5)不同分期的甲状腺恶性肿瘤。
3.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有用于执行下述步骤的计算机程序:
采集n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据;
将所述n1个A类型样本和n2个B类型样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
输入待测者的MREG基因甲基化水平数据;
将所述待测者的MREG基因甲基化水平数据代入所述数学模型,计算得到检测指数;
将所述检测指数与所述阈值进行比较,得到比较结果;
根据所述比较结果输出待测样本的类型是A类型还是B类型的结论;
所述A类型样本和所述B类型样本为如下任一种:
(C1)甲状腺良性肿瘤和甲状腺恶性肿瘤;
(C2)甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(C3)甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(C4)不同亚型的甲状腺恶性肿瘤;
(C5)不同分期的甲状腺恶性肿瘤。
4.根据权利要求1所述的数据处理装置或权利要求2所述的系统或权利要求3所述的计算机可读存储介质,其特征在于:
所述MREG基因甲基化水平为MREG基因中如下(E1)-(E4)所示片段中全部或部分CpG位点的甲基化水平;
(E1)SEQ ID No.1所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E2)SEQ ID No.2所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E3)SEQ ID No.3所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E4)SEQ ID No.4所示的DNA片段或与其具有80%以上同一性的DNA片段;
进一步地,所述全部或部分CpG位点为如下任一所示:
(F1)MREG基因中SEQ ID No.1、SEQ ID No.2、SEQ ID No.3和SEQ ID No.4所示4个DNA片段中的任意一个或多个CpG位点;
(F2)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点和SEQ ID No.2所示的DNA片段上的所有CpG位点;
(B3)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F4)MREG基因中SEQ ID No.2所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F5)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点、SEQ ID No.2所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F6)MREG基因中SEQ ID No.2所示的DNA片段中的全部CpG位点或任意12个或任意11个或任意10个或任意9个或任意8个或任意7个或任意6个或任意5个或任意4个或任意3个或任意2个或任意1个CpG位点;
(F7)MREG基因中SEQ ID No.2所示的DNA片段上如下5项所示CpG位点的全部或任意4项或任意3项或任意2项或任意1项:
第1项:SEQ ID No.2所示的DNA片段自5’端第167-168位和第169-170位所示CpG位点;
第2项:SEQ ID No.2所示的DNA片段自5’端第350-351位和第356-357位所示CpG位点;
第3项:SEQ ID No.2所示的DNA片段自5’端第365-366位所示CpG位点;
第4项:SEQ ID No.2所示的DNA片段自5’端第446-447位所示CpG位点;
第5项:SEQ ID No.2所示的DNA片段自5’端第496-497位所示CpG位点。
5.根据权利要求2或4所述的系统,其特征在于:所述用于检测MREG基因甲基化水平的试剂包含用于扩增MREG基因全长或部分片段的引物组合;
进一步地,所述部分片段为如下中至少一个片段:
(G1)SEQ ID No.1所示的DNA片段或其包含的DNA片段;
(G2)SEQ ID No.2所示的DNA片段或其包含的DNA片段;
(G3)SEQ ID No.3所示的DNA片段或其包含的DNA片段;
(G4)SEQ ID No.4所示的DNA片段或其包含的DNA片段;
(G5)与SEQ ID No.1所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G6)与SEQ ID No.2所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G7)与SEQ ID No.3所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G8)与SEQ ID No.4所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
更进一步地,所述引物组合为引物对A和/或引物对B和/或引物对C和/或引物对D;
所述引物对A为引物A1和引物A2组成的引物对;所述引物A1为SEQ ID No.5或SEQIDNo.5的第11-35位核苷酸所示的单链DNA;所述引物A2为SEQ ID No.6或SEQ ID No.6的第32-56位核苷酸所示的单链DNA;
所述引物对B为引物B1和引物B2组成的引物对;所述引物B1为SEQ ID No.7或SEQIDNo.7的第11-35位核苷酸所示的单链DNA;所述引物B2为SEQ ID No.8或SEQ ID No.8的第32-56位核苷酸所示的单链DNA;
所述引物对C为引物C1和引物C2组成的引物对;所述引物C1为SEQ ID No.9或SEQIDNo.9的第11-35位核苷酸所示的单链DNA;所述引物C2为SEQ ID No.10或SEQ ID No.10的第32-56位核苷酸所示的单链DNA;
所述引物对D为引物D1和引物D2组成的引物对;所述引物D1为SEQ ID No.11或SEQIDNo.11的第11-35位核苷酸所示的单链DNA;所述引物D2为SEQ ID No.12或SEQ ID No.12的第32-56位核苷酸所示的单链DNA。
6.甲基化MREG基因作为标志物在制备产品中的应用;所述产品的用途为如下中的至少一种:
(1)区分或辅助区分甲状腺良性肿瘤和甲状腺恶性肿瘤;
(2)区分或辅助区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(3)区分或辅助区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(4)区分或辅助区分甲状腺恶性肿瘤不同亚型;
(5)区分或辅助区分甲状腺恶性肿瘤不同分期。
7.用于检测MREG基因甲基化水平的物质在制备产品中的应用;所述产品的用途为如下中的至少一种:
(1)区分或辅助区分甲状腺良性肿瘤和甲状腺恶性肿瘤;
(2)区分或辅助区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(3)区分或辅助区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(4)区分或辅助区分甲状腺恶性肿瘤不同亚型;
(5)区分或辅助区分甲状腺恶性肿瘤不同分期。
8.用于检测MREG基因甲基化水平的物质和储存有数学模型建立方法和/或使用方法的介质在制备产品中的应用;所述产品的用途为如下中的至少一种:
(1)区分或辅助区分甲状腺良性肿瘤和甲状腺恶性肿瘤;
(2)区分或辅助区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(3)区分或辅助区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(4)区分或辅助区分甲状腺恶性肿瘤不同亚型;
(5)区分或辅助区分甲状腺恶性肿瘤不同分期;
所述数学模型按照包括如下步骤的方法获得:
(A1)分别检测n1个A类型样本和n2个B类型样本的MREG基因甲基化水平;
(A2)取步骤(A1)获得的所有样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
所述数学模型使用方法包括如下步骤:
(B1)检测待测样本的MREG基因甲基化水平;
(B2)将步骤(B1)获得的所述待测样本的MREG基因甲基化水平数据代入所述数学模型,得到检测指数;然后比较检测指数和阈值的大小,根据比较结果确定所述待测样本的类型是A类型还是B类型;
所述A类型样本和所述B类型样本为如下任一种:
(C1)甲状腺良性肿瘤和甲状腺恶性肿瘤;
(C2)甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(C3)甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(C4)不同亚型的甲状腺恶性肿瘤;
(C5)不同分期的甲状腺恶性肿瘤。
9.储存有数学模型建立方法和/或使用方法的介质在制备产品中的应用;所述产品的用途为如下中的至少一种:
(1)区分或辅助区分甲状腺良性肿瘤和甲状腺恶性肿瘤;
(2)区分或辅助区分甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(3)区分或辅助区分甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(4)区分或辅助区分甲状腺恶性肿瘤不同亚型;
(5)区分或辅助区分甲状腺恶性肿瘤不同分期;
所述数学模型按照包括如下步骤的方法获得:
(A1)分别检测n1个A类型样本和n2个B类型样本的MREG基因甲基化水平;
(A2)取步骤(A1)获得的所有样本的MREG基因甲基化水平数据,按照A类型和B类型的分类方式,通过二分类逻辑回归法建立数学模型,确定分类判定的阈值;
所述数学模型使用方法包括如下步骤:
(B1)检测待测样本的MREG基因甲基化水平;
(B2)将步骤(B1)获得的所述待测样本的MREG基因甲基化水平数据代入所述数学模型,得到检测指数;然后比较检测指数和阈值的大小,根据比较结果确定所述待测样本的类型是A类型还是B类型;
所述A类型样本和所述B类型样本为如下任一种:
(C1)甲状腺良性肿瘤和甲状腺恶性肿瘤;
(C2)甲状腺良性肿瘤和不同亚型的甲状腺恶性肿瘤;
(C3)甲状腺良性肿瘤和不同分期的甲状腺恶性肿瘤;
(C4)不同亚型的甲状腺恶性肿瘤;
(C5)不同分期的甲状腺恶性肿瘤。
10.根据权利要求6-9中任一所述的应用,其特征在于:所述MREG基因甲基化水平为MREG基因中如下(E1)-(E4)所示片段中全部或部分CpG位点的甲基化水平;
所述甲基化MREG基因为MREG基因中如下(E1)-(E4)所示片段中全部或部分CpG位点甲基化;
(E1)SEQ ID No.1所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E2)SEQ ID No.2所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E3)SEQ ID No.3所示的DNA片段或与其具有80%以上同一性的DNA片段;
(E4)SEQ ID No.4所示的DNA片段或与其具有80%以上同一性的DNA片段;
进一步地,所述全部或部分CpG位点为如下任一所示:
(F1)MREG基因中SEQ ID No.1、SEQ ID No.2、SEQ ID No.3和SEQ ID No.4所示4个DNA片段中的任意一个或多个CpG位点;
(F2)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点和SEQ ID No.2所示的DNA片段上的所有CpG位点;
(B3)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F4)MREG基因中SEQ ID No.2所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F5)MREG基因中SEQ ID No.1所示的DNA片段上的所有CpG位点、SEQ ID No.2所示的DNA片段上的所有CpG位点和SEQ ID No.3所示的DNA片段上的所有CpG位点;
(F6)MREG基因中SEQ ID No.2所示的DNA片段中的全部CpG位点或任意12个或任意11个或任意10个或任意9个或任意8个或任意7个或任意6个或任意5个或任意4个或任意3个或任意2个或任意1个CpG位点;
(F7)MREG基因中SEQ ID No.2所示的DNA片段上如下5项所示CpG位点的全部或任意4项或任意3项或任意2项或任意1项:
第1项:SEQ ID No.2所示的DNA片段自5’端第167-168位和第169-170位所示CpG位点;
第2项:SEQ ID No.2所示的DNA片段自5’端第350-351位和第356-357位所示CpG位点;
第3项:SEQ ID No.2所示的DNA片段自5’端第365-366位所示CpG位点;
第4项:SEQ ID No.2所示的DNA片段自5’端第446-447位所示CpG位点;
第5项:SEQ ID No.2所示的DNA片段自5’端第496-497位所示CpG位点;
和/或
所述用于检测MREG基因甲基化水平的物质包含用于扩增MREG基因全长或部分片段的引物组合;
进一步地,所述部分片段为如下中至少一个片段:
(G1)SEQ ID No.1所示的DNA片段或其包含的DNA片段;
(G2)SEQ ID No.2所示的DNA片段或其包含的DNA片段;
(G3)SEQ ID No.3所示的DNA片段或其包含的DNA片段;
(G4)SEQ ID No.4所示的DNA片段或其包含的DNA片段;
(G5)与SEQ ID No.1所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G6)与SEQ ID No.2所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G7)与SEQ ID No.3所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
(G8)与SEQ ID No.4所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;
更进一步地,所述引物组合为引物对A和/或引物对B和/或引物对C和/或引物对D;
所述引物对A为引物A1和引物A2组成的引物对;所述引物A1为SEQ ID No.5或SEQIDNo.5的第11-35位核苷酸所示的单链DNA;所述引物A2为SEQ ID No.6或SEQ ID No.6的第32-56位核苷酸所示的单链DNA;
所述引物对B为引物B1和引物B2组成的引物对;所述引物B1为SEQ ID No.7或SEQIDNo.7的第11-35位核苷酸所示的单链DNA;所述引物B2为SEQ ID No.8或SEQ ID No.8的第32-56位核苷酸所示的单链DNA;
所述引物对C为引物C1和引物C2组成的引物对;所述引物C1为SEQ ID No.9或SEQIDNo.9的第11-35位核苷酸所示的单链DNA;所述引物C2为SEQ ID No.10或SEQ ID No.10的第32-56位核苷酸所示的单链DNA;
所述引物对D为引物D1和引物D2组成的引物对;所述引物D1为SEQ ID No.11或SEQIDNo.11的第11-35位核苷酸所示的单链DNA;所述引物D2为SEQ ID No.12或SEQ ID No.12的第32-56位核苷酸所示的单链DNA。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2022115890458 | 2022-12-12 | ||
CN202211589045.8A CN115851950A (zh) | 2022-12-12 | 2022-12-12 | 一种癌症鉴别标志物及其应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118197425A true CN118197425A (zh) | 2024-06-14 |
Family
ID=85672027
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211589045.8A Pending CN115851950A (zh) | 2022-12-12 | 2022-12-12 | 一种癌症鉴别标志物及其应用 |
CN202311691275.XA Pending CN118197425A (zh) | 2022-12-12 | 2023-12-11 | 用于辅助诊断甲状腺恶性肿瘤和良性肿瘤的数据处理装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211589045.8A Pending CN115851950A (zh) | 2022-12-12 | 2022-12-12 | 一种癌症鉴别标志物及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN115851950A (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113136428B (zh) * | 2020-01-19 | 2024-04-19 | 腾辰生物科技(上海)有限公司 | 一种甲基化标志物在辅助诊断癌症中的应用 |
CN113355412B (zh) * | 2020-03-02 | 2024-02-20 | 腾辰生物科技(上海)有限公司 | 用于辅助诊断癌症的甲基化标志物及试剂盒 |
CN114480630B (zh) * | 2020-10-26 | 2024-09-06 | 腾辰生物科技(上海)有限公司 | 用于辅助诊断癌症的一种甲基化标志物 |
CN114507731B (zh) * | 2020-11-16 | 2024-06-04 | 腾辰生物科技(上海)有限公司 | 一种用于辅助癌症诊断的甲基化标志物及试剂盒 |
-
2022
- 2022-12-12 CN CN202211589045.8A patent/CN115851950A/zh active Pending
-
2023
- 2023-12-11 CN CN202311691275.XA patent/CN118197425A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN115851950A (zh) | 2023-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3658684B1 (en) | Enhancement of cancer screening using cell-free viral nucleic acids | |
EP3249051B1 (en) | Use of methylation sites in y chromosome as prostate cancer diagnosis marker | |
CN111910004A (zh) | cfDNA在早期乳腺癌无创诊断中的应用 | |
CN111863250B (zh) | 一种早期乳腺癌的联合诊断模型及系统 | |
CN118547070A (zh) | 一种用于肺癌诊断的计算机装置及其应用 | |
CN115820860A (zh) | 基于增强子甲基化差异的非小细胞肺癌标志物筛选方法及其标志物和应用 | |
CN115896281A (zh) | 甲基化生物标记物、试剂盒及用途 | |
CN116804218A (zh) | 用于检测肺结节良恶性的甲基化标志物及其应用 | |
CN118197425A (zh) | 用于辅助诊断甲状腺恶性肿瘤和良性肿瘤的数据处理装置 | |
CN113215252B (zh) | 用于辅助诊断癌症的甲基化标志物 | |
CN113136428B (zh) | 一种甲基化标志物在辅助诊断癌症中的应用 | |
CN118098367A (zh) | 一种用于甲状腺恶性肿瘤诊断的数据处理装置、系统及其应用 | |
CN118345163A (zh) | 一种用于甲状腺癌诊断的计算机装置及其应用 | |
CN117690494A (zh) | 一种用于辅助诊断甲状腺良恶性肿瘤的数据处理装置及其应用 | |
CN117746991A (zh) | 一种用于甲状腺癌诊断的数据处理装置及系统 | |
CN117711498A (zh) | 一种用于辅助区分甲状腺良恶性肿瘤的数据处理装置、系统及其应用 | |
CN117690493A (zh) | 一种用于辅助区分甲状腺良恶性肿瘤的数据处理装置 | |
CN117802236A (zh) | 用于早期甲状腺癌鉴别的组合标志物在制备产品中的应用 | |
CN117711499A (zh) | 用于辅助区分甲状腺良恶性肿瘤的数据处理装置及其应用 | |
CN113215251B (zh) | 一种辅助诊断癌症的甲基化标志物 | |
CN113355413B (zh) | 一种分子标志物及试剂盒在辅助诊断癌症中的应用 | |
CN117568473A (zh) | 一种可用于辅助诊断癌症的甲基化分子标志物 | |
Pio | MS18. 04 Alternative and Promising Biomarkers | |
CN116042830A (zh) | 消化道恶性肿瘤诊断产品及其应用 | |
WO2022190752A1 (ja) | がん検査試薬セット、がん検査試薬セットの製造方法及びがん検査方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |