CN107025387A - 一种用于癌症生物标志物识别的方法 - Google Patents

一种用于癌症生物标志物识别的方法 Download PDF

Info

Publication number
CN107025387A
CN107025387A CN201710198234.5A CN201710198234A CN107025387A CN 107025387 A CN107025387 A CN 107025387A CN 201710198234 A CN201710198234 A CN 201710198234A CN 107025387 A CN107025387 A CN 107025387A
Authority
CN
China
Prior art keywords
matrix
gene
cancer
data
biomarker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710198234.5A
Other languages
English (en)
Other versions
CN107025387B (zh
Inventor
凡时财
黄康
邹见效
何建
徐红兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201710198234.5A priority Critical patent/CN107025387B/zh
Publication of CN107025387A publication Critical patent/CN107025387A/zh
Application granted granted Critical
Publication of CN107025387B publication Critical patent/CN107025387B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Oncology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Biology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种用于癌症生物标志物识别的方法,通过从公共数据库中获取癌症的基因表达数据和DNA甲基化数据,再对基因表达数据进行预处理和特征提取得到特征基因,对DNA甲基化数据进行扩展和t‑test假设检验得到差异甲基化位点,最后利用差异甲基化位点去比对现有基因,通过比对成功的现有基因与特征基因求交集得到重叠基因,重叠基因即为识别的潜在的癌症生物标志物。

Description

一种用于癌症生物标志物识别的方法
技术领域
本发明属于基因识别技术领域,更为具体地讲,涉及一种用于癌症生物标志物识别的方法。
背景技术
生物标志物是疾病正常或者异常状态的标志,癌症生物标志物是检测疑似患有癌症或处于患癌症风险的个体的标志,对于癌症的诊断和治疗具有指导作用。
癌症生物标志物识别的常用方法主要是基于单一来源的数据,比如基于基因表达芯片数据,或者基于DNA甲基化数据,以及多种数据的简单融合。由于上述数据存在的高维小样本特点,特征选择方法获得的具有最好分类性能的特征组合可能有多种,这也使得基于不同来源的数据样本得到的潜在生物标志物存在较大差异,且推广性能不好。
因此,如果能够得到推广性能良好的潜在癌症生物标志物,对于诊断和治疗癌症具有重大意义。
发明内容
本发明的目的在于克服现有技术的不足,提供一种用于癌症生物标志物识别的方法,通过找到具有良好推广性能的癌症基因,提供癌症的诊断和治疗的指导。
为实现上述发明目的,本发明一种用于癌症生物标志物识别的方法,其特征在于,包括以下步骤:
(1)、获取任意一种癌症的基因表达数据和450K芯片的DNA甲基化数据,以及对应癌症已知的重要基因;
(2)、设基因表达数据为n×p的矩阵,n为矩阵的行数,p为矩阵的列数;取矩阵的前p-1列构成矩阵A,取矩阵的第p列构成矩阵B;
(3)、对矩阵A进行预处理
(3.1)、对矩阵A进行标准化处理,得到矩阵
其中,xi,j表示矩阵A第i行第j列的元素,表示第j列元素的平均值,sj表示第j列元素的标准差;
(3.2)、对矩阵进行重采样,得到矩阵A*
(4)、对矩阵A*进行特征选择
(4.1)、结合癌症已知的重要基因,使用Elastic Net回归模型对矩阵A*进行特征选择;
L(λ12,β)=|B-A*β|22|β|21|β|1
其中,L(λ12,β)为Elastic Net回归模型的惩罚项,λ12为惩罚系数,β为j行1列的系数矩阵,β的估计值为:表示L(λ12,β)取最小值时,β的取值;βj为β的第j行;
(4.2)、令α=λ2/(λ12),在约束项(1-α)|β|1+α|β|2≤t下,计算其中t为很小的常数;
(4.3)、把癌症已知的重要基因对应的基因表达数据相应列的系数置为0,求得取出中不为0的值对应的列,再找到这些列对应的基因,把这些基因和已知重要基因求并集,得到最后的特征基因;
(5)、对450K芯片的DNA甲基化数据进行扩展处理,得到扩展后的DNA甲基化数据,再利用t-test假设检验法对扩展后的DNA甲基化数据进行检验,得到差异甲基化位点;
(6)、利用差异甲基化位点去比对现有基因,在现有基因中找出每个启动子区中拥有k个差异甲基化位点的基因,再将特征基因与找出的基因求交集,得到重叠基因,重叠基因即为识别的潜在的癌症生物标志物。
本发明的发明目的是这样实现的:
本发明一种用于癌症生物标志物识别的方法,通过从公共数据库中获取癌症的基因表达数据和DNA甲基化数据,再对基因表达数据进行预处理和特征提取得到特征基因,对DNA甲基化数据进行扩展和t-test假设检验得到差异甲基化位点,最后利用差异甲基化位点去比对现有基因,通过比对成功的现有基因与特征基因求交集得到重叠基因,重叠基因即为识别的潜在的癌症生物标志物。
同时,本发明一种用于癌症生物标志物识别的方法还具有以下有益效果:
(1)、本发明利用扩展后的DNA甲基化芯片数据和癌症的基因表达数据进行数据融合,减小了传统数据融合方法的有偏性;
(2)、本发明保留了文献报道中的跟癌症相关的重要基因信息,寻找与其组合性能最好的癌症基因特征,优于传统的癌症生物标志物识别方法,具有良好推广性能,且为癌症的诊断和治疗提供指导。
附图说明
图1是本发明一种用于癌症生物标志物识别的方法流程图;
图2是基因中差异甲基化位点示意图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明一种用于癌症生物标志物识别的方法流程图。
在本实施例中,如图1所示,本发明一种用于癌症生物标志物识别的方法,包括以下步骤:
S1、获取任意一种癌症的基因表达数据和DNA甲基化数据,以及对应癌症已知的重要基因;
在本实施例中,从癌症基因组公共数据库TCGA中获取甲状腺癌THCA(thyroidcarcinoma),来作为例子来说明,并取其对应的450K芯片的DNA甲基化数据,以及文献报道中跟THCA相关的重要基因。其中,甲状腺癌THCA的基因表达数据拥有572个样本,20503个基因特征。450K芯片的DNA甲基化数据拥有484个样本,401833个位点特征。
S2、设基因表达数据为n×p的矩阵,n为矩阵的行数,p为矩阵的列数,即基因表达数据为572×20503的矩阵;取矩阵的前p-1列构成矩阵A,取矩阵的第p列构成矩阵B;其中,前p-1列为基因表达数据的数据值,第p列为基因表达数据的标签。
S3、对矩阵A进行预处理
S3.1、扫描矩阵A的每一行,看每一行中是否存在缺失值,如果存在,则用该行的均值进行填补;
然后对填补后的矩阵A进行标准化处理,得到矩阵
其中,xi,j表示矩阵A第i行第j列的元素,表示第j列元素的平均值,sj表示第j列元素的标准差;
S3.2、对矩阵进行重采样,得到矩阵A*,重采样的目标是平衡正负样本。
S4、对矩阵A*进行特征选择
S4.1、结合癌症已知的重要基因,使用Elastic Net回归模型对矩阵A*进行特征选择;
L(λ12,β)=|B-A*β|22|β|21|β|1
其中,L(λ12,β)为Elastic Net回归模型的惩罚项,λ12为惩罚系数,β为j行1列的系数矩阵,β的估计值为:表示L(λ12,β)取最小值时,β的取值;βj为β的第j行;
S4.2、令α=λ2/(λ12),在约束项(1-α)|β|1+α|β|2≤t下,计算其中,t为很小的常数,取0.01;α取0.2;
S4.3、把癌症已知的重要基因对应的基因表达数据相应列的系数置为0,求得取出中不为0的值对应的列,再找到这些列对应的基因,把这些基因和已知重要基因求并集,得到最后的特征基因;
在本实施例中,甲状腺癌THCA的基因表达数据经过步骤S3、S4的处理后剩余690个样本,287个基因特征。
S5、对450K芯片的DNA甲基化数据进行扩展处理,得到扩展后的450K芯片的DNA甲基化数据,在本实施例中,对450K芯片的DNA甲基化数据进行扩展处理为现有技术,具体扩展的流程在此不再赘述;
再利用t-test假设检验法对扩展后的DNA甲基化数据进行检验,得到差异甲基化位点。
S6、如图2所示,在基因的启动子区中,黑色点代表差异甲基化位点,白色点代表正常的甲基化位点;利用差异甲基化位点去比对现有基因,在现有基因中找出每个启动子区中拥有5个差异甲基化位点的基因,得到1053个现有基因,再将特征基因与找出的基因求交集,得到21个重叠基因,这21个重叠基因即为识别癌症生物标志物。
S7、模型验证
在基因表达数据中取出这21个重叠基因对应的数据,构建数目适当的决策树分别进行分类,最终将结果采用投票的方式就能得到随机森林模型。
其中,利用重叠基因构建决策树的方法为:设重叠基因的维度是F维,即重叠基因有F个属性。在构建开始之前选定一个参数f,满足f<<F,在构建每个内部节点的过程中,都需要从21个重叠基因中采用随机抽样的方法从他的所有F个属性选取f个属性,然后从f个属性中根据信息增益比,选出一个最优的属性充当分裂属性,进而是决策在此节点产生分裂。
信息增益比的计算采用如下公式:
其中,S为21个重叠基因,value(T)表示属性T所有取值的集合,v是T的其中一个属性值,Sv是S中属性T的值为V的样例集合,|Sv|为Sv中所含样例数。Entropy(Sv)即表示信息增益,他的计算采用如下公式:
其中,n就是类别的总数,类别C是变量,它的取值是C1,C2,...,Cn,而每一个类别出现的概率分别是P(C1),P(C2),...,P(Cn)。
在得到随机森林模型后,我们采用特异性(SP)、灵敏度(SE)和准确性(ACC)3个指标来进行评估,通过使用3倍交叉验证测试20次,获得随机森林模型的平均性能。表1所示,我们构建的模型与两种数据简单融合的传统方法的对比,结果优于传统的方法。
方法 ACC(%) SP(%) SE(%)
传统方法 66.67 56.25 71.88
本发明 85.42 68.75 93.75
表1
最后,我们再取独立基因表达数据进行处理,获得21个基因特征的数据进行预测。在新批次数据的结果如表2所示,取得的结果是令人满意的。这表明我们构建的模型可用于检测疑似患有癌症或处于患癌症风险的个体,能够用于识别癌症生物标志物。
传统方法 ACC(%) SP(%) SE(%)
本发明 84.95 66.67 91.78
表2
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (3)

1.一种用于癌症生物标志物识别的方法,其特征在于,包括以下步骤:
(1)、获取任意一种癌症的基因表达数据和DNA甲基化数据,以及对应癌症已知的重要基因;
(2)、设基因表达数据为n×p的矩阵,n为矩阵的行数,p为矩阵的列数;取矩阵的前p-1列构成矩阵A,取矩阵的第p列构成矩阵B;
(3)、对矩阵A进行预处理
(3.1)、对矩阵A进行标准化处理,得到矩阵
其中,xi,j表示矩阵A第i行第j列的元素,表示第j列元素的平均值,sj表示第j列元素的标准差;
(3.2)、对矩阵进行重采样,得到矩阵A*;
(4)、对矩阵A*进行特征选择
(4.1)、结合癌症已知已知的重要基因,使用Elastic Net回归模型对矩阵A*进行特征选择;
L(λ12,β)=|B-A*β|22|β|21|β|1
其中,L(λ12,β)为Elastic Net回归模型的惩罚项,λ12为惩罚系数,β为j行1列的系数矩阵,β的估计值为:表示L(λ12,β)取最小值时,β的取值;βj为β的第j行;
(4.2)、令α=λ2/(λ12),在约束项(1-α)|β|1+α|β|2≤t下,计算
(4.3)、把癌症已知的重要基因对应的基因表达数据相应列的系数置为0,求得取出中不为0的值对应的列,再找到这些列对应的基因,把这些基因和已知重要基因求并集,得到最后的特征基因;
(5)、对DNA甲基化数据进行扩展处理,得到扩展后的DNA甲基化数据,再利用t-test假设检验法对扩展后的DNA甲基化数据进行检验,得到差异甲基化位点;
(6)、利用差异甲基化位点去比对现有基因,在现有基因中找出每个启动子区中拥有k个差异甲基化位点的基因,再将特征基因与找出的基因求交集,得到重叠基因,重叠基因即为识别癌症生物标志物。
2.根据权利要求1所述的一种用于癌症生物标志物识别的方法,其特征在于,所述的DNA甲基化数据选用450K芯片的DNA甲基化数据。
3.根据权利要求1所述的一种用于癌症生物标志物识别的方法,其特征在于,所述(6)中,在现有基因中找出每个启动子区中拥有5个差异甲基化位点的基因。
CN201710198234.5A 2017-03-29 2017-03-29 一种用于癌症生物标志物识别的方法 Expired - Fee Related CN107025387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710198234.5A CN107025387B (zh) 2017-03-29 2017-03-29 一种用于癌症生物标志物识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710198234.5A CN107025387B (zh) 2017-03-29 2017-03-29 一种用于癌症生物标志物识别的方法

Publications (2)

Publication Number Publication Date
CN107025387A true CN107025387A (zh) 2017-08-08
CN107025387B CN107025387B (zh) 2020-09-18

Family

ID=59525779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710198234.5A Expired - Fee Related CN107025387B (zh) 2017-03-29 2017-03-29 一种用于癌症生物标志物识别的方法

Country Status (1)

Country Link
CN (1) CN107025387B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967410A (zh) * 2017-11-27 2018-04-27 电子科技大学 一种面向基因表达与甲基化数据的融合方法
CN109101783A (zh) * 2018-08-14 2018-12-28 温州大学 一种基于概率模型的癌症网络标志物确定方法及系统
CN112927757A (zh) * 2021-02-24 2021-06-08 河南大学 基于基因表达和dna甲基化数据的胃癌生物标志物识别方法
WO2023052917A1 (en) * 2021-09-28 2023-04-06 Act Genomics (ip) Limited Methylation biomarker selection apparatuses and methods

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102272325A (zh) * 2008-11-17 2011-12-07 威拉赛特公司 用于疾病诊断的分子表达谱的方法和组合物
CN102348809A (zh) * 2008-12-23 2012-02-08 皇家飞利浦电子股份有限公司 用于预测无复发存活的生物学标记物
CN103268431A (zh) * 2013-05-21 2013-08-28 中山大学 一种基于学生t分布的癌症亚型生物标志物检测系统
CN103400158A (zh) * 2013-07-29 2013-11-20 电子科技大学 基于动态形状码本学习的水平集跟踪方法
US20140073521A1 (en) * 2010-09-27 2014-03-13 Somalogic, Inc. Mesothelioma Biomarkers and Uses Thereof
CN104094266A (zh) * 2011-11-07 2014-10-08 独创系统公司 用于识别原因性基因组变体的方法和系统
CN104685065A (zh) * 2012-01-20 2015-06-03 俄亥俄州立大学 浸润性和预后的乳腺癌生物标志物标签
US20150252425A1 (en) * 2014-03-05 2015-09-10 Caldera Health Ltd. Gene expression profiling for the diagnosis of prostate cancer
CN105018476A (zh) * 2015-07-03 2015-11-04 常州杰傲病理诊断技术有限公司 一种用于分析dna样本中mlh1启动子甲基化状态的试剂盒、方法和引物
CN105163657A (zh) * 2013-03-11 2015-12-16 泰勒顿国际控股公司 自主神经系统建模及其用途
CN105740651A (zh) * 2016-03-07 2016-07-06 吉林大学 一种特定癌症差异表达基因调控网络的构建方法
CN106520965A (zh) * 2016-11-11 2017-03-22 南昌艾迪康医学检验所有限公司 Msh2基因启动子甲基化检测的引物和检测方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102272325A (zh) * 2008-11-17 2011-12-07 威拉赛特公司 用于疾病诊断的分子表达谱的方法和组合物
CN102348809A (zh) * 2008-12-23 2012-02-08 皇家飞利浦电子股份有限公司 用于预测无复发存活的生物学标记物
US20140073521A1 (en) * 2010-09-27 2014-03-13 Somalogic, Inc. Mesothelioma Biomarkers and Uses Thereof
CN104094266A (zh) * 2011-11-07 2014-10-08 独创系统公司 用于识别原因性基因组变体的方法和系统
CN104685065A (zh) * 2012-01-20 2015-06-03 俄亥俄州立大学 浸润性和预后的乳腺癌生物标志物标签
CN105163657A (zh) * 2013-03-11 2015-12-16 泰勒顿国际控股公司 自主神经系统建模及其用途
CN103268431A (zh) * 2013-05-21 2013-08-28 中山大学 一种基于学生t分布的癌症亚型生物标志物检测系统
CN103400158A (zh) * 2013-07-29 2013-11-20 电子科技大学 基于动态形状码本学习的水平集跟踪方法
US20150252425A1 (en) * 2014-03-05 2015-09-10 Caldera Health Ltd. Gene expression profiling for the diagnosis of prostate cancer
CN105018476A (zh) * 2015-07-03 2015-11-04 常州杰傲病理诊断技术有限公司 一种用于分析dna样本中mlh1启动子甲基化状态的试剂盒、方法和引物
CN105740651A (zh) * 2016-03-07 2016-07-06 吉林大学 一种特定癌症差异表达基因调控网络的构建方法
CN106520965A (zh) * 2016-11-11 2017-03-22 南昌艾迪康医学检验所有限公司 Msh2基因启动子甲基化检测的引物和检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHRISTIAAN KLIJN等: "Identification of cancer genes using a statistical", 《NUCLEIC ACIDS RESEARCH》 *
凡时财: "Methods for genome-wide DNA methylation analysis", 《BRIEFINGS IN FUNCTIONAL GENOMICS》 *
凡时财等: "DNA甲基化的生物信息学研究进展", 《生物化学与生物物理进展》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967410A (zh) * 2017-11-27 2018-04-27 电子科技大学 一种面向基因表达与甲基化数据的融合方法
CN107967410B (zh) * 2017-11-27 2021-07-30 电子科技大学 一种面向基因表达与甲基化数据的融合方法
CN109101783A (zh) * 2018-08-14 2018-12-28 温州大学 一种基于概率模型的癌症网络标志物确定方法及系统
CN109101783B (zh) * 2018-08-14 2020-09-04 温州大学 一种基于概率模型的癌症网络标志物确定方法及系统
CN112927757A (zh) * 2021-02-24 2021-06-08 河南大学 基于基因表达和dna甲基化数据的胃癌生物标志物识别方法
CN112927757B (zh) * 2021-02-24 2022-09-02 河南大学 基于基因表达和dna甲基化数据的胃癌生物标志物识别方法
WO2023052917A1 (en) * 2021-09-28 2023-04-06 Act Genomics (ip) Limited Methylation biomarker selection apparatuses and methods

Also Published As

Publication number Publication date
CN107025387B (zh) 2020-09-18

Similar Documents

Publication Publication Date Title
CN107025387A (zh) 一种用于癌症生物标志物识别的方法
CN110413319B (zh) 一种基于深度语义的代码函数味道检测方法
Catini et al. Identifying geographic clusters: A network analytic approach
CN112908436B (zh) 临床试验数据结构化方法、临床试验推荐方法和装置
CN103324609A (zh) 文本校对装置和文本校对方法
CN105184292A (zh) 自然场景图像中手写体数学公式结构分析与识别方法
CN112700325A (zh) 一种基于Stacking集成学习的网贷回头客预测的方法
CN112756759B (zh) 点焊机器人工作站故障判定方法
CN112446351A (zh) 医疗票据智能识别系统解决方法
CN111597356B (zh) 智能化教育知识图谱构建系统与方法
US8572006B2 (en) Method for multi-layer classifier
CN108009287A (zh) 一种基于对话系统的回答数据生成方法以及相关装置
CN106528527A (zh) 未登录词的识别方法及识别系统
CN110929746A (zh) 一种基于深度神经网络的电子卷宗标题定位提取与分类方法
CN107273883A (zh) 决策树模型训练方法、确定ocr结果中数据属性方法及装置
CN107967410A (zh) 一种面向基因表达与甲基化数据的融合方法
CN104064182A (zh) 一种基于分类规则的语音识别系统及方法
Jehling et al. Do land policies make a difference? A data-driven approach to trace effects on urban form in France and Germany
CN109558591A (zh) 中文事件检测方法及装置
Cauvin et al. Thematic Cartography, Cartography and the Impact of the Quantitative Revolution
CN106529470A (zh) 一种基于多级深度卷积神经网络的手势识别方法
CN110188207A (zh) 知识图谱构建方法及装置、可读存储介质、电子设备
CN113673294A (zh) 文献关键信息的提取方法、装置、计算机设备和存储介质
CN109102164B (zh) 平台评估方法、装置、计算机设备和存储介质
CN111222566A (zh) 用户属性识别方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200918

CF01 Termination of patent right due to non-payment of annual fee