CN109671468A - 一种特征基因选择及癌症分类方法 - Google Patents
一种特征基因选择及癌症分类方法 Download PDFInfo
- Publication number
- CN109671468A CN109671468A CN201811522827.3A CN201811522827A CN109671468A CN 109671468 A CN109671468 A CN 109671468A CN 201811522827 A CN201811522827 A CN 201811522827A CN 109671468 A CN109671468 A CN 109671468A
- Authority
- CN
- China
- Prior art keywords
- gene
- model
- scad
- net
- selection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 133
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 47
- 201000011510 cancer Diseases 0.000 title claims abstract description 31
- 238000007477 logistic regression Methods 0.000 claims abstract description 23
- 238000011478 gradient descent method Methods 0.000 claims abstract description 10
- 238000007476 Maximum Likelihood Methods 0.000 claims abstract description 7
- 230000014509 gene expression Effects 0.000 claims description 19
- 230000033228 biological regulation Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000002790 cross-validation Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000013488 ordinary least square regression Methods 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 abstract description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 9
- 238000011160 research Methods 0.000 abstract description 5
- 238000013480 data collection Methods 0.000 abstract description 2
- 241000932075 Priacanthus hamrur Species 0.000 description 7
- 230000002452 interceptive effect Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 201000005202 lung cancer Diseases 0.000 description 2
- 208000020816 lung neoplasm Diseases 0.000 description 2
- 101150084044 P gene Proteins 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种特征基因选择及癌症分类方法,至少包括以下步骤:根据超参数组和待处理基因数据集建立logistic回归模型;根据极大似然估算以及对算运算,将logistic回归模型表达为损失函数;建立SCAD‑Net的求解模型;结合损失函数和SCAD‑Net的求解模型,得到SNL模型;计算SCAD‑Net的迭代更新算子;根据迭代更新算子,通过坐标梯度下降法计算SNL模型的基因回归系数;根据基因回归系数,进行特征基因的选择和癌症的分类。本发明提供了一种特征基因选择及癌症分类方法,能够有效地提高了特征基因选择和癌症分类的准确性,从而有利于对疾病的研究。
Description
技术领域
本发明涉及生物医学数据分析技术领域,尤其涉及一种特征基因选择及癌症分类方法。
背景技术
对癌症进行准确分类并识别出其疾病相关的生物标志物对肿瘤的临床治疗具有重要意义。目前,微阵列基因芯片技术是重要的基因组数据收集技术,通过此技术得到的基因表达谱数据已经被大量地应用于肿瘤的亚型分类及生物标志物的识别上。
然而由于基因表达谱高维小样本的特性,即收集到的样本个数远远小于其基因的个数(又称为小n,大p问题),在基因表达谱上建立的肿瘤预测模型和筛选出的基因非常容易遭遇过拟合问题及假阳性问题。
现有技术中,正则化方法是解决小n,大p问题的重要特征选择方法,它能够将模型的训练和特征基因选择同步进行。而典型方法包括基于L1范数的Lasso,基于L2范数的岭回归。典型方法中的L1范数和L2范数惩罚函数不能同时满足无偏性、稀疏性和连续性等要求,而且传统的SCAD方法并没有将基因与基因的交互网络纳入考虑范围,只是单纯从基因的角度去考虑与疾病的关系而没有考虑外部网络对其的协同影响,因而降低了使用SCAD方法进行基因选择和癌症分类的有效性。
发明内容
本发明实施例提供一种特征基因选择及癌症分类方法,能够解决传统的SCAD方法没有将基因与基因的交互网络纳入考虑范围的技术问题,从而有效地提高了特征基因选择和癌症分类的准确性,进而有利于对疾病的研究。
本发明实施例提供了一种特征基因选择及癌症分类方法,至少包括以下步骤:
根据超参数组和待处理基因数据集建立logistic回归模型;
根据极大似然估算以及对算运算,将所述logistic回归模型表达为损失函数;
建立SCAD-Net的求解模型;
结合所述损失函数和所述SCAD-Net的求解模型,得到SNL模型;
计算所述SCAD-Net的迭代更新算子;
根据所述迭代更新算子,通过坐标梯度下降法计算所述SNL模型的基因回归系数;
根据所述基因回归系数,进行特征基因的选择和癌症的分类。
进一步地,所述根据超参数和待处理基因数据集建立logistic回归模型之前,还包括步骤:
获取基因数据及基因调控网络,根据所述基因调控网并将所述基因数据进行生物网络处理,得到待处理基因数据集。
进一步地,所述根据超参数组和所述基因数据集建立logistic回归模型,具体为:
根据交叉验证方法选择超参数组,所述logistic回归模型表达式为:
其中,β=(β1,…,βp)为基因回归系数。
进一步地,所述根据极大似然估算以及对算运算,将所述logistic回归模型表达为损失函数,具体为:
其中,其中,l(·)称为损失函数,用于度量模型拟合值与观测值的误差。
进一步地,所述建立SCAD-Net的求解模型,其中所述SCAD-Net的求解模型的表达式为:
其中,
设基因i和基因k在生物调控网络中有连接,则wik=1或为0到1的实数,相反若无连接则wik=0;di和dk为基因i和基因k在生物调控网络中的度(入度+出度);λ1和λ2分别为调整模型稀疏度和模型平滑度的超参数。α为大于2.7的常数。
进一步地,所述结合所述损失函数和所述SCAD-Net的求解模型,得到SNL模型,具体为:
所述SNL模型的表达式为:
其中,l(β)为所述logistic回归损失函数,为SCAD-Net惩罚体。
进一步地,所述计算所述SCAD-Net的迭代更新算子,具体为:
建立线性稀疏SCAD-Net模型,表达式为:
通过对(4)进行求βj的一阶偏导数并使其为0,我们可得:
其中,是的第j分量,为普通最小二乘估计的解。而
其中,
综合(6)和(7)可得关于的迭代更新算子:
其中,sign(·)为符号函数,表示当时取否则取0。
进一步地,所述根据所述迭代更新算子,通过坐标梯度下降法计算所述SNL模型的基因回归系数,具体为:
通过泰勒公式对SNL模型进行线性化处理,得到线性化的目标函数;根据坐标梯度下降法求解所述线性化的目标函数,得到所述SNL模型的基因回归系数。
进一步地,所述根据所述基因回归系数,进行基因的选择和癌症的分类,具体为:
根据所述基因回归系数,建立所述待处理基因数据集的预测模型,根据所述预测模型,进行特征基因的选择和癌症的分类。
本发明实施例提供一种特征基因选择及癌症分类方法,能够解决传统的SCAD方法并没有将基因与基因的交互网络纳入考虑范围的技术问题,有效地提高了特征基因选择和癌症分类的准确性,从而有利于对疾病的研究。
附图说明
图1是本发明实施例提供的一种特征基因选择及癌症分类方法的流程示意图;
图2是本发明实施例提供的一种特征基因选择及癌症分类方法与其他主流方法在训练集的分类准确度、测试集的分类准确度上的结果对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明的第一实施例提供了一种特征基因选择及癌症分类方法,至少包括以下步骤:
根据超参数组和待处理基因数据集建立logistic回归模型;
根据极大似然估算以及对算运算,将所述logistic回归模型表达为损失函数;
建立SCAD-Net的求解模型;
结合所述损失函数和所述SCAD-Net的求解模型,得到SNL模型;
计算所述SCAD-Net的迭代更新算子;
根据所述迭代更新算子,通过坐标梯度下降法计算所述SNL模型的基因回归系数;
根据所述基因回归系数,进行特征基因的选择和癌症的分类。
在本发明实施例中,本发明实施例提供了一种特征基因选择及癌症分类方法,通过实现回归系数向量的稀疏化,使得与回归系数向量分量为零所对应的变量不参与模型的拟合,能够有效提高对基因的选择和癌症的分类的准确性;通过SCAD惩罚体与网络正则化相结合(SCAD-Net),协同考虑基因表达谱的内部变异与其外部的交互网络,能够有效地提升肿瘤预测模型的精度和帮助选择出更有生物学意义的基因,有利于对疾病的研究。
作为本发明实施例的一种具体实施方式,所述根据超参数组和所述待处理基因数据集建立logistic回归模型之前,还包括步骤:
获取基因数据及基因调控网络,根据所述基因调控网将所述基因数据进行生物网络处理,得到待处理基因数据集。
作为本发明实施例的一种具体实施方式,所述根据超参数组和所述待处理基因数据集建立logistic回归模型,具体为:
根据交叉验证方法选择超参数组,所述logistic回归模型表达式为:
其中,β=(β1,…,βp)为基因回归系数。
在本发明实施例中,设有一个n例样本,每个样本测量了p个基因的基因数据集D={(X1,y1),(X2,y2),…,(Xn,yn)},其中Xi=xi1,xi2,…,xip)为第i个样本的p个基因数据的测量值,yi是相应的因变量值为二元0和1.定义分类器f(x)=ex/(1+ex),logistic回归模型由条件概率分布P(Y|X)表示,形式为参数化的逻辑斯谛分布。
作为本发明实施例的一种具体实施方式,所述根据极大似然估算以及对算运算,将所述logistic回归模型表达为损失函数,具体为:
其中,其中,l(·)称为损失函数。
在本发明实施例中,损失函数用于度量模型拟合值与观测值的误差。
作为本发明实施例的一种具体实施方式,所述建立SCAD-Net的求解模型,其中所述SCAD-Net的求解模型的表达式为:
其中,
设基因i和基因k在生物调控网络中有连接,则wik=1或为0到1的实数,相反若无连接则wik=0;di和dk为基因i和基因k在生物调控网络中的度(入度+出度);λ1和λ2分别为调整模型稀疏度和模型平滑度的超参数。α为大于2.7的常数。
在本发明实施例中,通过交叉验证法进行超参数的选择。
作为本发明实施例的一种具体实施方式,所述结合所述损失函数和所述SCAD-Net的求解模型,得到SNL模型,具体为:
所述SNL模型的表达式为:
其中,l(β)为所述logistic回归损失函数,为SCAD-Net惩罚体。
在本发明实施例中,logistic回归损失函数将导向一个肿瘤预测模型,SCAD-Net惩罚体将帮助建立一个稀疏且无偏的模型,且选择出与该肿瘤相关的基因,同时其内部的基于网络的(network-based)惩罚体,可以将外部的基因与基因交互网络嵌入到模型中与基因表达谱数据做统一考虑,使得最终选择出的基因更加具有生物学本质。
作为本发明实施例的一种具体实施方式,所述计算所述SCAD-Net的迭代更新算子,具体为:
建立线性稀疏SCAD-Net模型,表达式为:
通过对(4)进行求βj的一阶偏导数并使其为0,我们可得:
其中,是的第j分量,为普通最小二乘估计的解。而
其中,
综合(6)和(7)可得关于的迭代更新算子:
其中,sign(·)为符号函数,表示当时取否则取0。
在本发明实施例中,由式子(8)可以看出,任何的值落在[-λ1,λ1]区间内的回归系数向量分量j均被置零,因此实现了回归系数向量的稀疏化,而回归系数向量的稀疏化使得与回归系数向量分量为零所对应的变量不参与模型的拟合,实现了变量选择效果。
作为本发明实施例的一种具体实施方式,所述根据所述迭代更新算子,通过坐标梯度下降法计算所述SNL模型的基因回归系数,具体为:
通过泰勒公式对SNL模型进行线性化处理,得到线性化的目标函数;根据坐标梯度下降法求解所述线性化的目标函数,得到所述SNL模型的基因回归系数。
在本发明实施例中,坐标梯度下降算法每次更新一个基因回归系数,同时固定其他回归系数不变。整个坐标梯度下降算法关于全部基因回归系数(1,2,…,p)循环迭代更新过程直到收敛。
作为本发明实施例的一种具体实施方式,所述根据所述基因回归系数,进行基因的选择和癌症的分类,具体为:
根据所述基因回归系数,建立基因的预测模型,根据所述基因的预测模型,进行特征基因的选择和癌症的分类。
在本发明实施例中,通过将SCAD惩罚体与网络正则化相结合(SCAD-Net),协同考虑基因表达谱的内部变异与其外部的交互网络,能够有效地提升肿瘤预测模型的精度和帮助选择出更有生物学意义的基因。
在本实施例中,通过具体的实施例来验证本发明公开的一种特征基因及癌症分类方法。采集前列腺癌、细胞淋巴癌和肺癌的基因数据,并下载基因调控网络,在基因数据中筛选出共有的基因,同时基于基因调控网络的连接关系为这些基因建立相应的链接矩阵以得到这3个疾病的基因数据集及其调控网络数据。将所有数据随机分成70%作为训练集,30%作为验证集,并通过交叉验证法选择超参数组。根据超参数和本发明提供的特征基因选择及癌症分类方法分别对前列腺癌、细胞淋巴癌和肺癌基因数据进行训练,当算法结束的时候所有的基因回归系数都已经确定,即基于基因数据的病人与健康人的预测模型已经确定。随后对各自的测试数据进行拟合。请参阅图2,为本方法与其他主流方法在对基因数据集中训练集的分类准确度和测试集的分类准确度的表现。分类准确率(accuracy)就是被分对的样本数除以所有的样本数,通常来说,准确率越高,分类器越好。实验结果可以看出,相对于现有方法,本发明方法无论在训练过程或者是在测试集上具有更高的肿瘤分类识别率。此外,通过对比上述4个方法在各基因数据集选择出的基因,发现本方法选出的基因在生物医学文献报告上更多、信号通信富集度更明显。所以,
本发明方法是正确且有效的。
实施本发明实施例,具有如下有益效果:
本发明实施例提供了一种特征基因选择及癌症分类方法,通过实现回归系数向量的稀疏化,使得与回归系数向量分量为零所对应的变量不参与模型的拟合,能够有效提高对基因的选择和癌症的分类的准确性;通过SCAD惩罚体与网络正则化相结合(SCAD-Net),协同考虑基因表达谱的内部变异与其外部的交互网络,能够有效地提升肿瘤预测模型的精度和帮助选择出更有生物学意义的基因,有利于对疾病的研究。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (9)
1.一种特征基因选择及癌症分类方法,其特征在于,至少包括以下步骤:
根据超参数组和待处理基因数据集建立logistic回归模型;
根据极大似然估算以及对算运算,将所述logistic回归模型表达为损失函数;
建立SCAD-Net的求解模型;
结合所述损失函数和所述SCAD-Net的求解模型,得到SNL模型;
计算所述SCAD-Net的迭代更新算子;
根据所述迭代更新算子,通过坐标梯度下降法计算所述SNL模型的基因回归系数;
根据所述基因回归系数,进行特征基因的选择和癌症的分类。
2.如权利要求1所述的特征基因选择及癌症分类方法,其特征在于,所述根据超参数组和基因数据集建立logistic模型之前,还包括步骤:
获取基因数据及基因调控网络,根据所述基因调控网将所述基因数据进行生物网络处理,得到待处理基因数据集。
3.如权利要求1所述的特征基因选择及癌症分类方法,其特征在于,所述根据超参数组和所述待处理基因数据集建立logistic回归模型,具体为:
根据交叉验证方法进行选择所述超参数组,所述logistic回归模型表达式为:
其中,β=(β1,…,βp)为基因回归系数。
4.如权利要求1所述的特征基因选择及癌症分类方法,其特征在于,所述根据极大似然估算以及对算运算,将所述logistic模型表达为损失函数,具体为:
其中,l(·)称为损失函数,用于度量模型拟合值与观测值的误差。
5.如权利要求1所述的特征基因选择及癌症分类方法,其特征在于,所述建立SCAD-Net的求解模型,其中所述SCAD-Net的求解模型的表达式为:
其中,
设基因i和基因k在生物调控网络中有连接,则wik=1或为0到1的实数,相反若无连接则wik=0;di和dk为基因i和基因k在生物调控网络中的度(入度+出度);λ1和λ2分别为调整模型稀疏度和模型平滑度的超参数。α为大于2.7的常数。
6.如权利要求1所述的特征基因选择及癌症分类方法,其特征在于,所述结合所述损失函数和所述SCAD-Net的求解模型,得到SNL模型,具体为:
所述SNL模型的表达式为:
其中,l(β)为所述logistic回归损失函数,为SCAD-Net惩罚体。
7.如权利要求1所述的特征基因选择及癌症分类方法,其特征在于,所述计算所述SCAD-Net的迭代更新算子,具体为:
建立线性稀疏SCAD-Net模型,表达式为:
通过对(4)进行求βj的一阶偏导数并使其为0,我们可得:
其中,是的第j分量,为普通最小二乘估计的解。而
其中,
综合(6)和(7)可得关于的迭代更新算子:
其中,sign(·)为符号函数,表示当时取否则取0。
8.如权利要求1所述的特征基因选择及癌症分类方法,其特征在于,所述根据所述迭代更新算子,通过坐标梯度下降法计算所述SNL模型的基因回归系数,具体为:
通过泰勒公式对SNL模型进行线性化处理,得到线性化的目标函数;根据坐标梯度下降法求解所述线性化的目标函数,得到所述SNL模型的基因回归系数。
9.如权利要求1所述的特征基因选择及癌症分类方法,其特征在于,所述根据所述基因回归系数,进行基因的选择和癌症的分类,具体为:
根据所述基因回归系数,建立所述待处理基因数据集的预测模型,根据所述预测模型,进行特征基因的选择和癌症的分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811522827.3A CN109671468B (zh) | 2018-12-13 | 2018-12-13 | 一种特征基因选择及癌症分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811522827.3A CN109671468B (zh) | 2018-12-13 | 2018-12-13 | 一种特征基因选择及癌症分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109671468A true CN109671468A (zh) | 2019-04-23 |
CN109671468B CN109671468B (zh) | 2023-08-15 |
Family
ID=66145044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811522827.3A Active CN109671468B (zh) | 2018-12-13 | 2018-12-13 | 一种特征基因选择及癌症分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109671468B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113780445A (zh) * | 2021-09-16 | 2021-12-10 | 平安科技(深圳)有限公司 | 癌症亚型分类预测模型的生成方法及装置、存储介质 |
CN116129992A (zh) * | 2023-04-17 | 2023-05-16 | 之江实验室 | 基于图神经网络的基因调控网络构建方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030225526A1 (en) * | 2001-11-14 | 2003-12-04 | Golub Todd R. | Molecular cancer diagnosis using tumor gene expression signature |
US20100178653A1 (en) * | 2007-03-27 | 2010-07-15 | Rosetta Genomics Ltd. | Gene expression signature for classification of cancers |
CN103473484A (zh) * | 2013-09-30 | 2013-12-25 | 南京大学 | 一种基于组和图稀疏化的基因序列分类方法 |
CN104462817A (zh) * | 2014-12-09 | 2015-03-25 | 西北师范大学 | 基于蒙特卡洛和非负矩阵因子分解的基因选择和癌症分类方法 |
US20170024529A1 (en) * | 2015-07-26 | 2017-01-26 | Macau University Of Science And Technology | Semi-Supervised Learning Framework based on Cox and AFT Models with L1/2 Regularization for Patient's Survival Prediction |
CN107526946A (zh) * | 2016-12-23 | 2017-12-29 | 南京理工大学 | 融合自学习和低秩表示的基因表达数据癌症分类方法 |
-
2018
- 2018-12-13 CN CN201811522827.3A patent/CN109671468B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030225526A1 (en) * | 2001-11-14 | 2003-12-04 | Golub Todd R. | Molecular cancer diagnosis using tumor gene expression signature |
US20100178653A1 (en) * | 2007-03-27 | 2010-07-15 | Rosetta Genomics Ltd. | Gene expression signature for classification of cancers |
CN103473484A (zh) * | 2013-09-30 | 2013-12-25 | 南京大学 | 一种基于组和图稀疏化的基因序列分类方法 |
CN104462817A (zh) * | 2014-12-09 | 2015-03-25 | 西北师范大学 | 基于蒙特卡洛和非负矩阵因子分解的基因选择和癌症分类方法 |
US20170024529A1 (en) * | 2015-07-26 | 2017-01-26 | Macau University Of Science And Technology | Semi-Supervised Learning Framework based on Cox and AFT Models with L1/2 Regularization for Patient's Survival Prediction |
CN107526946A (zh) * | 2016-12-23 | 2017-12-29 | 南京理工大学 | 融合自学习和低秩表示的基因表达数据癌症分类方法 |
Non-Patent Citations (4)
Title |
---|
LINGMIN ZENG等: "Group variable selection via SCAD-L2", 《STATISTICS》 * |
孙红卫等: "惩罚logistic回归用于高维变量选择的模拟评价", 《中国卫生统计》 * |
庄虹莉等: "基于Logistic回归惩罚函数的疾病诊断", 《中国卫生统计》 * |
张秀秀等: "高维数据回归分析中基于LASSO的自变量选择", 《中国卫生统计》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113780445A (zh) * | 2021-09-16 | 2021-12-10 | 平安科技(深圳)有限公司 | 癌症亚型分类预测模型的生成方法及装置、存储介质 |
CN113780445B (zh) * | 2021-09-16 | 2023-08-22 | 平安科技(深圳)有限公司 | 癌症亚型分类预测模型的生成方法及装置、存储介质 |
CN116129992A (zh) * | 2023-04-17 | 2023-05-16 | 之江实验室 | 基于图神经网络的基因调控网络构建方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109671468B (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Osman et al. | An effective of ensemble boosting learning method for breast cancer virtual screening using neural network model | |
Sangamithraa et al. | Lung tumour detection and classification using EK-Mean clustering | |
CN108877953B (zh) | 一种基于多相似性网络的药物敏感性预测方法 | |
Zhang et al. | Deep learning based analysis of breast cancer using advanced ensemble classifier and linear discriminant analysis | |
CN108763590B (zh) | 一种基于双变加权核fcm算法的数据聚类方法 | |
Stoean et al. | Ensemble of classifiers for length of stay prediction in colorectal cancer | |
WO2022095167A1 (zh) | 剂量确定方法及装置 | |
Jamshidi et al. | Cancer digital twins in metaverse | |
CN109671468A (zh) | 一种特征基因选择及癌症分类方法 | |
Guan et al. | Breast tumor computer-aided diagnosis using self-validating cerebellar model neural networks | |
Peng et al. | Deciphering ligand–receptor-mediated intercellular communication based on ensemble deep learning and the joint scoring strategy from single-cell transcriptomic data | |
Yu et al. | A recognition method of soybean leaf diseases based on an improved deep learning model | |
Zhuang et al. | A streamlined scRNA-Seq data analysis framework based on improved sparse subspace clustering | |
Jiang et al. | Flexible non-negative matrix factorization to unravel disease-related genes | |
Yan et al. | Radiomics analysis using stability selection supervised component analysis for right-censored survival data | |
Ram et al. | Lung cancer lesion detection in histopathology images using graph‐based sparse PCA network | |
Gangurde et al. | [Retracted] Developing an Efficient Cancer Detection and Prediction Tool Using Convolution Neural Network Integrated with Neural Pattern Recognition | |
Wang et al. | Deep manifold feature fusion for classification of breast histopathology images | |
Ahmed et al. | Thyroid cancer detection using deep neural network | |
CN109686399B (zh) | 一种基因数据集整合分析方法 | |
CN116189785A (zh) | 基于空间转录组学数据特征提取的空间域识别方法 | |
CN114358191A (zh) | 一种基于深度自动编码器的基因表达数据聚类方法 | |
CN114999661A (zh) | 皮肤癌识别模型的构建方法、皮肤癌识别装置、电子设备 | |
Kiranmayee et al. | Explorative data analytics of brain tumour data using R | |
Das et al. | An Adaptive Neural Network Model for Predicting Breast Cancer Disease in Mapped Nucleotide Sequences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |