CN107025387B - 一种用于癌症生物标志物识别的方法 - Google Patents

一种用于癌症生物标志物识别的方法 Download PDF

Info

Publication number
CN107025387B
CN107025387B CN201710198234.5A CN201710198234A CN107025387B CN 107025387 B CN107025387 B CN 107025387B CN 201710198234 A CN201710198234 A CN 201710198234A CN 107025387 B CN107025387 B CN 107025387B
Authority
CN
China
Prior art keywords
genes
matrix
cancer
data
dna methylation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710198234.5A
Other languages
English (en)
Other versions
CN107025387A (zh
Inventor
凡时财
黄康
邹见效
何建
徐红兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201710198234.5A priority Critical patent/CN107025387B/zh
Publication of CN107025387A publication Critical patent/CN107025387A/zh
Application granted granted Critical
Publication of CN107025387B publication Critical patent/CN107025387B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Abstract

本发明公开了一种用于癌症生物标志物识别的方法,通过从公共数据库中获取癌症的基因表达数据和DNA甲基化数据,再对基因表达数据进行预处理和特征提取得到特征基因,对DNA甲基化数据进行扩展和t‑test假设检验得到差异甲基化位点,最后利用差异甲基化位点去比对现有基因,通过比对成功的现有基因与特征基因求交集得到重叠基因,重叠基因即为识别的潜在的癌症生物标志物。

Description

一种用于癌症生物标志物识别的方法
技术领域
本发明属于基因识别技术领域,更为具体地讲,涉及一种用于癌症生物标志物识别的方法。
背景技术
生物标志物是疾病正常或者异常状态的标志,癌症生物标志物是检测疑似患有癌症或处于患癌症风险的个体的标志,对于癌症的诊断和治疗具有指导作用。
癌症生物标志物识别的常用方法主要是基于单一来源的数据,比如基于基因表达芯片数据,或者基于DNA甲基化数据,以及多种数据的简单融合。由于上述数据存在的高维小样本特点,特征选择方法获得的具有最好分类性能的特征组合可能有多种,这也使得基于不同来源的数据样本得到的潜在生物标志物存在较大差异,且推广性能不好。
因此,如果能够得到推广性能良好的潜在癌症生物标志物,对于诊断和治疗癌症具有重大意义。
发明内容
本发明的目的在于克服现有技术的不足,提供一种用于癌症生物标志物识别的方法,通过找到具有良好推广性能的癌症基因,提供癌症的诊断和治疗的指导。
为实现上述发明目的,本发明一种用于癌症生物标志物识别的方法,其特征在于,包括以下步骤:
(1)、获取任意一种癌症的基因表达数据和450K芯片的DNA甲基化数据,以及对应癌症已知的重要基因;
(2)、设基因表达数据为n×p的矩阵,n为矩阵的行数,p为矩阵的列数;取矩阵的前p-1列构成矩阵A,取矩阵的第p列构成矩阵B;
(3)、对矩阵A进行预处理
(3.1)、对矩阵A进行标准化处理,得到矩阵
Figure BDA0001257934800000021
Figure BDA0001257934800000022
其中,xi,j表示矩阵A第i行第j列的元素,
Figure BDA0001257934800000023
表示第j列元素的平均值,sj表示第j列元素的标准差;
(3.2)、对矩阵
Figure BDA00012579348000000210
进行重采样,得到矩阵A*
(4)、对矩阵A*进行特征选择
(4.1)、结合癌症已知的重要基因,使用Elastic Net回归模型对矩阵A*进行特征选择;
L(λ12,β)=|B-A*β|22|β|21|β|1
其中,L(λ12,β)为Elastic Net回归模型的惩罚项,λ12为惩罚系数,β为j行1列的系数矩阵,β的估计值
Figure BDA0001257934800000024
为:
Figure BDA0001257934800000025
表示L(λ12,β)取最小值时,β的取值;
Figure BDA0001257934800000026
βj为β的第j行;
(4.2)、令α=λ2/(λ12),在约束项(1-α)|β|1+α|β|2≤t下,计算
Figure BDA0001257934800000027
其中t为很小的常数;
(4.3)、把癌症已知的重要基因对应的基因表达数据相应列的系数置为0,求得
Figure BDA0001257934800000028
取出
Figure BDA0001257934800000029
中不为0的值对应的列,再找到这些列对应的基因,把这些基因和已知重要基因求并集,得到最后的特征基因;
(5)、对450K芯片的DNA甲基化数据进行扩展处理,得到扩展后的DNA甲基化数据,再利用t-test假设检验法对扩展后的DNA甲基化数据进行检验,得到差异甲基化位点;
(6)、利用差异甲基化位点去比对现有基因,在现有基因中找出每个启动子区中拥有k个差异甲基化位点的基因,再将特征基因与找出的基因求交集,得到重叠基因,重叠基因即为识别的潜在的癌症生物标志物。
本发明的发明目的是这样实现的:
本发明一种用于癌症生物标志物识别的方法,通过从公共数据库中获取癌症的基因表达数据和DNA甲基化数据,再对基因表达数据进行预处理和特征提取得到特征基因,对DNA甲基化数据进行扩展和t-test假设检验得到差异甲基化位点,最后利用差异甲基化位点去比对现有基因,通过比对成功的现有基因与特征基因求交集得到重叠基因,重叠基因即为识别的潜在的癌症生物标志物。
同时,本发明一种用于癌症生物标志物识别的方法还具有以下有益效果:
(1)、本发明利用扩展后的DNA甲基化芯片数据和癌症的基因表达数据进行数据融合,减小了传统数据融合方法的有偏性;
(2)、本发明保留了文献报道中的跟癌症相关的重要基因信息,寻找与其组合性能最好的癌症基因特征,优于传统的癌症生物标志物识别方法,具有良好推广性能,且为癌症的诊断和治疗提供指导。
附图说明
图1是本发明一种用于癌症生物标志物识别的方法流程图;
图2是基因中差异甲基化位点示意图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明一种用于癌症生物标志物识别的方法流程图。
在本实施例中,如图1所示,本发明一种用于癌症生物标志物识别的方法,包括以下步骤:
S1、获取任意一种癌症的基因表达数据和DNA甲基化数据,以及对应癌症已知的重要基因;
在本实施例中,从癌症基因组公共数据库TCGA中获取甲状腺癌THCA(thyroidcarcinoma),来作为例子来说明,并取其对应的450K芯片的DNA甲基化数据,以及文献报道中跟THCA相关的重要基因。其中,甲状腺癌THCA的基因表达数据拥有572个样本,20503个基因特征。450K芯片的DNA甲基化数据拥有484个样本,401833个位点特征。
S2、设基因表达数据为n×p的矩阵,n为矩阵的行数,p为矩阵的列数,即基因表达数据为572×20503的矩阵;取矩阵的前p-1列构成矩阵A,取矩阵的第p列构成矩阵B;其中,前p-1列为基因表达数据的数据值,第p列为基因表达数据的标签。
S3、对矩阵A进行预处理
S3.1、扫描矩阵A的每一行,看每一行中是否存在缺失值,如果存在,则用该行的均值进行填补;
然后对填补后的矩阵A进行标准化处理,得到矩阵
Figure BDA0001257934800000041
Figure BDA0001257934800000042
其中,xi,j表示矩阵A第i行第j列的元素,
Figure BDA0001257934800000043
表示第j列元素的平均值,sj表示第j列元素的标准差;
S3.2、对矩阵
Figure BDA0001257934800000044
进行重采样,得到矩阵A*,重采样的目标是平衡正负样本。
S4、对矩阵A*进行特征选择
S4.1、结合癌症已知的重要基因,使用Elastic Net回归模型对矩阵A*进行特征选择;
L(λ12,β)=|B-A*β|22|β|21|β|1
其中,L(λ12,β)为Elastic Net回归模型的惩罚项,λ12为惩罚系数,β为j行1列的系数矩阵,β的估计值
Figure BDA0001257934800000045
为:
Figure BDA0001257934800000046
表示L(λ12,β)取最小值时,β的取值;
Figure BDA0001257934800000047
βj为β的第j行;
S4.2、令α=λ2/(λ12),在约束项(1-α)|β|1+α|β|2≤t下,计算
Figure BDA0001257934800000048
其中,t为很小的常数,取0.01;α取0.2;
S4.3、把癌症已知的重要基因对应的基因表达数据相应列的系数置为0,求得
Figure BDA0001257934800000049
取出
Figure BDA00012579348000000410
中不为0的值对应的列,再找到这些列对应的基因,把这些基因和已知重要基因求并集,得到最后的特征基因;
在本实施例中,甲状腺癌THCA的基因表达数据经过步骤S3、S4的处理后剩余690个样本,287个基因特征。
S5、对450K芯片的DNA甲基化数据进行扩展处理,得到扩展后的450K芯片的DNA甲基化数据,在本实施例中,对450K芯片的DNA甲基化数据进行扩展处理为现有技术,具体扩展的流程在此不再赘述;
再利用t-test假设检验法对扩展后的DNA甲基化数据进行检验,得到差异甲基化位点。
S6、如图2所示,在基因的启动子区中,黑色点代表差异甲基化位点,白色点代表正常的甲基化位点;利用差异甲基化位点去比对现有基因,在现有基因中找出每个启动子区中拥有5个差异甲基化位点的基因,得到1053个现有基因,再将特征基因与找出的基因求交集,得到21个重叠基因,这21个重叠基因即为识别癌症生物标志物。
S7、模型验证
在基因表达数据中取出这21个重叠基因对应的数据,构建数目适当的决策树分别进行分类,最终将结果采用投票的方式就能得到随机森林模型。
其中,利用重叠基因构建决策树的方法为:设重叠基因的维度是F维,即重叠基因有F个属性。在构建开始之前选定一个参数f,满足f<<F,在构建每个内部节点的过程中,都需要从21个重叠基因中采用随机抽样的方法从他的所有F个属性选取f个属性,然后从f个属性中根据信息增益比,选出一个最优的属性充当分裂属性,进而是决策在此节点产生分裂。
信息增益比的计算采用如下公式:
Figure BDA0001257934800000051
其中,S为21个重叠基因,value(T)表示属性T所有取值的集合,v是T的其中一个属性值,Sv是S中属性T的值为V的样例集合,|Sv|为Sv中所含样例数。Entropy(Sv)即表示信息增益,他的计算采用如下公式:
Figure BDA0001257934800000052
其中,n就是类别的总数,类别C是变量,它的取值是C1,C2,...,Cn,而每一个类别出现的概率分别是P(C1),P(C2),...,P(Cn)。
在得到随机森林模型后,我们采用特异性(SP)、灵敏度(SE)和准确性(ACC)3个指标来进行评估,通过使用3倍交叉验证测试20次,获得随机森林模型的平均性能。表1所示,我们构建的模型与两种数据简单融合的传统方法的对比,结果优于传统的方法。
方法 ACC(%) SP(%) SE(%)
传统方法 66.67 56.25 71.88
本发明 85.42 68.75 93.75
表1
最后,我们再取独立基因表达数据进行处理,获得21个基因特征的数据进行预测。在新批次数据的结果如表2所示,取得的结果是令人满意的。这表明我们构建的模型可用于检测疑似患有癌症或处于患癌症风险的个体,能够用于识别癌症生物标志物。
传统方法 ACC(%) SP(%) SE(%)
本发明 84.95 66.67 91.78
表2
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (3)

1.一种用于癌症生物标志物识别的方法,其特征在于,包括以下步骤:
(1)、获取任意一种癌症的基因表达数据和DNA甲基化数据,以及对应癌症已知的重要基因;
(2)、设基因表达数据为n×p的矩阵,n为矩阵的行数,p为矩阵的列数;取矩阵的前p-1列构成矩阵A,取矩阵的第p列构成矩阵B;
(3)、对矩阵A进行预处理
(3.1)、对矩阵A进行标准化处理,得到矩阵
Figure FDA0002568383500000011
Figure FDA0002568383500000012
其中,xi,j表示矩阵A第i行第j列的元素,
Figure FDA0002568383500000013
表示第j列元素的平均值,sj表示第j列元素的标准差;
(3.2)、对矩阵
Figure FDA00025683835000000110
进行重采样,得到矩阵A*
(4)、对矩阵A*进行特征选择
(4.1)、结合癌症已知的重要基因,使用Elastic Net回归模型对矩阵A*进行特征选择;
L(λ12,β)=|B-A*β|22|β|21|β|1
其中,L(λ12,β)为Elastic Net回归模型的惩罚项,λ12为惩罚系数,β为j行1列的系数矩阵,β的估计值
Figure FDA0002568383500000014
为:
Figure FDA0002568383500000015
表示L(λ12,β)取最小值时,β的取值;
Figure FDA0002568383500000016
βj为β的第j行;
(4.2)、令α=λ2/(λ12),在约束项(1-α)|β|1+α|β|2≤t下,计算
Figure FDA0002568383500000017
其中t为常数;
(4.3)、把癌症已知的重要基因对应的基因表达数据相应列的系数置为0,求得
Figure FDA0002568383500000018
取出
Figure FDA0002568383500000019
中不为0的值对应的列,再找到这些列对应的基因,把这些基因和已知重要基因求并集,得到最后的特征基因;
(5)、对DNA甲基化数据进行扩展处理,得到扩展后的DNA甲基化数据,再利用t-test假设检验法对扩展后的DNA甲基化数据进行检验,得到差异甲基化位点;
(6)、利用差异甲基化位点去比对现有基因,在现有基因中找出每个启动子区中拥有k个差异甲基化位点的基因,再将特征基因与找出的基因求交集,得到重叠基因,重叠基因即为识别癌症生物标志物。
2.根据权利要求1所述的一种用于癌症生物标志物识别的方法,其特征在于,所述的DNA甲基化数据选用450K芯片的DNA甲基化数据。
3.根据权利要求1所述的一种用于癌症生物标志物识别的方法,其特征在于,所述(6)中,在现有基因中找出每个启动子区中拥有5个差异甲基化位点的基因。
CN201710198234.5A 2017-03-29 2017-03-29 一种用于癌症生物标志物识别的方法 Expired - Fee Related CN107025387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710198234.5A CN107025387B (zh) 2017-03-29 2017-03-29 一种用于癌症生物标志物识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710198234.5A CN107025387B (zh) 2017-03-29 2017-03-29 一种用于癌症生物标志物识别的方法

Publications (2)

Publication Number Publication Date
CN107025387A CN107025387A (zh) 2017-08-08
CN107025387B true CN107025387B (zh) 2020-09-18

Family

ID=59525779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710198234.5A Expired - Fee Related CN107025387B (zh) 2017-03-29 2017-03-29 一种用于癌症生物标志物识别的方法

Country Status (1)

Country Link
CN (1) CN107025387B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967410B (zh) * 2017-11-27 2021-07-30 电子科技大学 一种面向基因表达与甲基化数据的融合方法
CN109101783B (zh) * 2018-08-14 2020-09-04 温州大学 一种基于概率模型的癌症网络标志物确定方法及系统
CN112927757B (zh) * 2021-02-24 2022-09-02 河南大学 基于基因表达和dna甲基化数据的胃癌生物标志物识别方法
WO2023052917A1 (en) * 2021-09-28 2023-04-06 Act Genomics (ip) Limited Methylation biomarker selection apparatuses and methods

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102272325A (zh) * 2008-11-17 2011-12-07 威拉赛特公司 用于疾病诊断的分子表达谱的方法和组合物
CN102348809A (zh) * 2008-12-23 2012-02-08 皇家飞利浦电子股份有限公司 用于预测无复发存活的生物学标记物
CN103268431A (zh) * 2013-05-21 2013-08-28 中山大学 一种基于学生t分布的癌症亚型生物标志物检测系统
CN103400158A (zh) * 2013-07-29 2013-11-20 电子科技大学 基于动态形状码本学习的水平集跟踪方法
CN104094266A (zh) * 2011-11-07 2014-10-08 独创系统公司 用于识别原因性基因组变体的方法和系统
CN104685065A (zh) * 2012-01-20 2015-06-03 俄亥俄州立大学 浸润性和预后的乳腺癌生物标志物标签
CN105018476A (zh) * 2015-07-03 2015-11-04 常州杰傲病理诊断技术有限公司 一种用于分析dna样本中mlh1启动子甲基化状态的试剂盒、方法和引物
CN105163657A (zh) * 2013-03-11 2015-12-16 泰勒顿国际控股公司 自主神经系统建模及其用途
CN105740651A (zh) * 2016-03-07 2016-07-06 吉林大学 一种特定癌症差异表达基因调控网络的构建方法
CN106520965A (zh) * 2016-11-11 2017-03-22 南昌艾迪康医学检验所有限公司 Msh2基因启动子甲基化检测的引物和检测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120077695A1 (en) * 2010-09-27 2012-03-29 Somalogic, Inc. Mesothelioma Biomarkers and Uses Thereof
US20150252425A1 (en) * 2014-03-05 2015-09-10 Caldera Health Ltd. Gene expression profiling for the diagnosis of prostate cancer

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102272325A (zh) * 2008-11-17 2011-12-07 威拉赛特公司 用于疾病诊断的分子表达谱的方法和组合物
CN102348809A (zh) * 2008-12-23 2012-02-08 皇家飞利浦电子股份有限公司 用于预测无复发存活的生物学标记物
CN104094266A (zh) * 2011-11-07 2014-10-08 独创系统公司 用于识别原因性基因组变体的方法和系统
CN104685065A (zh) * 2012-01-20 2015-06-03 俄亥俄州立大学 浸润性和预后的乳腺癌生物标志物标签
CN105163657A (zh) * 2013-03-11 2015-12-16 泰勒顿国际控股公司 自主神经系统建模及其用途
CN103268431A (zh) * 2013-05-21 2013-08-28 中山大学 一种基于学生t分布的癌症亚型生物标志物检测系统
CN103400158A (zh) * 2013-07-29 2013-11-20 电子科技大学 基于动态形状码本学习的水平集跟踪方法
CN105018476A (zh) * 2015-07-03 2015-11-04 常州杰傲病理诊断技术有限公司 一种用于分析dna样本中mlh1启动子甲基化状态的试剂盒、方法和引物
CN105740651A (zh) * 2016-03-07 2016-07-06 吉林大学 一种特定癌症差异表达基因调控网络的构建方法
CN106520965A (zh) * 2016-11-11 2017-03-22 南昌艾迪康医学检验所有限公司 Msh2基因启动子甲基化检测的引物和检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DNA甲基化的生物信息学研究进展;凡时财等;《生物化学与生物物理进展》;20090215;第143-150页 *
Identification of cancer genes using a statistical;Christiaan Klijn等;《Nucleic Acids Research》;20080110;第1-16页 *
Methods for genome-wide DNA methylation analysis;凡时财;《Briefings in Functional Genomics》;20160406;第432-442页 *

Also Published As

Publication number Publication date
CN107025387A (zh) 2017-08-08

Similar Documents

Publication Publication Date Title
CN107633265B (zh) 用于优化信用评估模型的数据处理方法及装置
CN107025387B (zh) 一种用于癌症生物标志物识别的方法
Hanczar et al. Small-sample precision of ROC-related estimates
JP6715451B2 (ja) マススペクトル解析システム,方法およびプログラム
JP2017224283A (ja) ビッグデータ解析方法及び該解析方法を利用した質量分析システム
CN107247873B (zh) 一种差异甲基化位点识别方法
Krouwel et al. Combining strengths of methods of party positioning to counter their weaknesses: the development of a new methodology to calibrate parties on issues and ideological dimensions
CN112700325A (zh) 一种基于Stacking集成学习的网贷回头客预测的方法
CN107967410B (zh) 一种面向基因表达与甲基化数据的融合方法
CN113422761B (zh) 基于对抗学习的恶意社交用户检测方法
JP2008077403A (ja) 評価装置、評価方法及び評価プログラム
CN111833310B (zh) 一种基于神经网络架构搜索的表面缺陷分类方法
CN103473416B (zh) 蛋白质相互作用的模型建立方法和装置
CN114328808A (zh) 地址模糊匹配方法、地址处理方法、装置和电子设备
CN113643756A (zh) 一种基于深度学习的蛋白质相互作用位点预测方法
CN111916143A (zh) 基于多样子结构特征融合的分子活性预测方法
Hannig et al. Testing for calibration discrepancy of reported likelihood ratios in forensic science
Rossel et al. Unsupervised biodiversity estimation using proteomic fingerprints from MALDI‐TOF MS data
CN104424332A (zh) 无歧义日本人名列表构建方法、人名识别方法及装置
Casale et al. Composite machine learning algorithm for material sourcing
CN113971984A (zh) 分类模型构建方法及装置、电子设备、存储介质
Brasier et al. Analysis and predictive modeling of asthma phenotypes
Lauria Rank-based miRNA signatures for early cancer detection
CN115881218B (zh) 用于全基因组关联分析的基因自动选择方法
CN117352048A (zh) 一种预后生物标志物识别系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200918