CN105243300A - 基于近似化的谱聚类算法预测癌症转移复发的方法 - Google Patents

基于近似化的谱聚类算法预测癌症转移复发的方法 Download PDF

Info

Publication number
CN105243300A
CN105243300A CN201510561497.9A CN201510561497A CN105243300A CN 105243300 A CN105243300 A CN 105243300A CN 201510561497 A CN201510561497 A CN 201510561497A CN 105243300 A CN105243300 A CN 105243300A
Authority
CN
China
Prior art keywords
cancer
matrix
sample
approximation
recurrence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510561497.9A
Other languages
English (en)
Inventor
史明光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201510561497.9A priority Critical patent/CN105243300A/zh
Publication of CN105243300A publication Critical patent/CN105243300A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种基于近似化的谱聚类算法预测癌症转移复发的方法,其特征是:基于近似化的谱聚类算法,利用癌症基因表达谱数据作为训练集样本,构建癌症转移复发预测模型;将所述预测模型用于癌症转移复发独立测试集样本的测试,将癌症患者划分为转移复发与非转移复发两类病患。本发明方法对癌症患者是否会发生转移复发进行预测,以使得癌症患者的后续治疗更加具有针对性。

Description

基于近似化的谱聚类算法预测癌症转移复发的方法
技术领域
本发明属于生物信息学领域,更具体地说是涉及一种基于近似化的谱聚类算法预测癌症转移复发的方法,利用该算法的分类结果制定后续的癌症治疗方案,提高癌症患者的生存率。
背景技术
癌症的转移复发是恶性肿瘤最显著的生物学表型,也是影响其预后的首要因素。癌症的转移复发导致90%的癌症病人直接死亡,其转移复发过程是一个多因素、多阶段和多基因改变协同作用的过程。
癌症转移复发是恶性肿瘤发生中的早期事件,癌基因和抑癌基因的表达失调是癌症发生与转移的分子基础。通过高通量蛋白芯片和蛋白质组学技术,在癌症转移复发标志物的研究方面已经取得较大的进展。基于转移复发标志物建立癌症转移的多分子预测模型,经过大量临床样本规模化验证,加速临床应用将是今后的主要的趋势和研究重点。对具有转移复发倾向的癌症患者进行有效干预,有利于进一步提高癌症患者的治疗效果,对于癌症的早期诊断、个体化治疗、预后判断等都具有极其重要的意义。
对于癌症患者是否会发生转移复发的判别手段是TNM分期,但预后效果欠佳;在实际治疗中,医生依靠自身经验确定癌症患者的治疗方案,主观性较强且难以复制,具有不可预测性,而且患者预后效果各不相同。
发明内容
本发明是为避免上述现有技术所存在的不足,提供一种基于近似化的谱聚类算法预测癌症转移复发方法,对癌症患者是否会发生转移复发进行预测,以便能够有效地区分转移复发与非转移复发两类癌症患者。以上两类患者分别制定治疗方案,癌症转移复发患者进行放化疗得到较好的预后效果,减轻非转移复发患者的治疗与经济负担。
本发明为解决技术问题采用如下技术方案:
本发明基于近似化的谱聚类算法预测癌症转移复发的方法的特点是:基于近似化的谱聚类算法,利用癌症基因表达谱数据作为训练集样本,构建癌症转移复发预测模型;将所述预测模型用于癌症转移复发独立测试集样本的测试,将癌症患者划分为转移复发与非转移复发两类病患。
本发明基于近似化的谱聚类算法预测癌症转移复发的方法的特点也在于:所述基于近似化的谱聚类算法是按如下过程进行:
(1)计算癌症基因表达谱数据中的任意两个癌症样本之间的相似度矩阵;
所述癌症样本是指以列为基因表达谱数据的向量;依据高斯函数计算两个癌症样本之间的相似度值sij,以相似度值sij构造相似度矩阵S(n×n),其中xi和xj分别为癌症样本,1≤i≤n,1≤j≤n,n为癌症基因表达谱数据中的样本个数,σ为尺度参数;
(2)从n个癌症样本中随机采样个样本,分别构造相似度矩阵A相似度矩阵B以及相似度矩阵C其中则有稠密相似矩阵Sd为: S d = A B B T C , 并有变换矩阵W为: W = A B T ; 基于近似化方法获得近似化矩阵为:
S ~ = S d = WA - 1 W T = A B B T B T A - 1 B ;
(3)记矩阵为:其中行且列为1的列向量,行且列为1的列向量,则拉普拉斯矩阵为:
(4)令矩阵R为: R = A ‾ + A ‾ - 1 2 B ‾ B ‾ T A ‾ - 1 2 , 其中:
(5)将矩阵R依据公式进行分解,其中UR为特征向量,ΛR为特征值,令矩阵为: V ~ = A ‾ B ‾ T A ‾ - 1 2 ( U R ) : , 1 : k ( Λ R - 1 2 ) 1 : k , 1 : k , 其中k为聚类值;
(6)计算获得矩阵的归一化矩阵归一化矩阵中元素为:
(7)基于k-means聚类算法将矩阵聚为k类;依此,将采集样本中癌症患者划分为转移复发与非转移复发两类病患,即k=2。
本发明基于近似化的谱聚类算法预测癌症转移复发的方法的特点也在于:按如下方式构建癌症转移复发预测模型:设定尺度参数σ与随机采样样本的选择范围,通过选择不同的σ值和值,构成不同参数组合的待选预测模型;利用所述各待选预测模型,将训练集样本中的癌症患者划分为转移复发与非转移复发两类,各待选预测模型的构建重复执行10次,获得10个聚类精度值;以所述10个聚类精度值的平均值作为评价指标,选择10个聚类精度值的最大平均值所对应的待选预测模型作为预测模型。
本发明基于近似化的谱聚类算法预测癌症转移复发的方法的特点也在于:将所述预测模型用于癌症转移复发独立测试集样本的测试的方法是:针对独立测试集样本,基于选定的尺度参数σ,确定随机采样样本的选择范围,利用基于近似化的谱聚类算法,将独立测试集样本中的癌症患者划分为转移复发与非转移复发两类。
本发明基于近似化的谱聚类算法预测癌症转移复发的方法的特点也在于:所述训练集样本为GSE17536,所述独立测试集样本分别是由癌症基因表达谱数据得到的GSE14333和GSE17537。
本发明中谱聚类算法仅与数据样本的个数有关,而与样本维数无关。因此,基于近似化的谱聚类算法避免了在癌症转移复发预测问题中,高维特征向量造成的奇异性问题,并且它能够在任意形状的样本空间中收敛于全局最优解。近似化方法利用数据集中的随机采样样本进行近似计算,逼近真实的特征空间,可以有效降低计算复杂度,对于癌症转移复发预测具有重要的应用价值。
与已有技术相比,本发明有益效果体现在:
1、本发明方法中基于近似化的谱聚类算法,避免了癌症转移复发预测问题中高维特征向量造成的奇异性问题。近似化方法利用数据集中的随机采样样本进行近似计算,有效地降低计算复杂度。这对于提高癌症转移复发判断的准确率具有重要意义。
2、本发明方法中基于近似化的谱聚类算法构建癌症转移复发预测模型,可以明确识别癌症患者个体是否属于转移复发类,具有实际应用价值。
3、本发明将所述预测模型用于癌症转移复发独立测试集样本的测试,能够有效地把癌症患者区分为转移复发与非转移复发两类,识别出通过放化疗治疗受益的癌症转移复发患者。
附图说明
图1为利用本发明方法预测得到的训练集样本GSE17536中的聚类精度;
图2为利用本发明方法预测得到的独立测试集样本GSE14333中的聚类精度;
图3为利用本发明方法预测得到的独立测试集样本GSE17537中的聚类精度;
具体实施方式
本实施例中基于近似化的谱聚类算法预测癌症转移复发的方法是:基于近似化的谱聚类算法,利用癌症基因表达谱数据作为训练集样本,构建癌症转移复发预测模型;将所述预测模型用于癌症转移复发独立测试集样本的测试,将癌症患者划分为转移复发与非转移复发两类病患。
本实施例中基于近似化的谱聚类算法是按如下过程进行:
(1)计算癌症基因表达谱数据中的任意两个癌症样本之间的相似度矩阵;
所述癌症样本是指以列为基因表达谱数据的向量;依据高斯函数计算两个癌症样本之间的相似度值sij,以相似度值sij构造相似度矩阵S(n×n),其中xi和xj分别为癌症样本,1≤i≤n,1≤j≤n,n为癌症基因表达谱数据中的样本个数,σ为尺度参数;
(2)从n个癌症样本中随机采样个样本,分别构造相似度矩阵A相似度矩阵B以及相似度矩阵C其中则有稠密相似矩阵Sd为: S d = A B B T C , 并有变换矩阵W为: W = A B T ; 基于近似化方法获得近似化矩阵为:
S ~ = S d = WA - 1 W T = A B B T B T A - 1 B ;
(3)记矩阵为:其中行且列为1的列向量,行且列为1的列向量,则拉普拉斯矩阵为:
(4)令矩阵R为: R = A ‾ + A ‾ - 1 2 B ‾ B ‾ T A ‾ - 1 2 , 其中:
(5)将矩阵R依据公式进行分解,其中UR为特征向量,ΛR为特征值,令矩阵为: V ~ = A ‾ B ‾ T A ‾ - 1 2 ( U R ) : , 1 : k ( Λ R - 1 2 ) 1 : k , 1 : k , 其中k为聚类值;
(6)计算获得矩阵的归一化矩阵归一化矩阵中元素为:
(7)基于k-means聚类算法将矩阵聚为k类;依此,将采集样本中癌症患者划分为转移复发与非转移复发两类病患,即k=2。
本实施例中按如下方式构建癌症转移复发预测模型:设定尺度参数σ与随机采样样本的选择范围,通过选择不同的σ值和值,构成不同参数组合的待选预测模型;利用所述各待选预测模型,将训练集样本中的癌症患者划分为转移复发与非转移复发两类,各待选预测模型的构建重复执行10次,获得10个聚类精度值;以所述10个聚类精度值的平均值作为评价指标,选择10个聚类精度值的最大平均值所对应的待选预测模型作为预测模型。
本实施例中将预测模型用于癌症转移复发独立测试集样本的测试的方法是:针对独立测试集样本,基于选定的尺度参数σ,确定随机采样样本的选择范围,利用基于近似化的谱聚类算法,将独立测试集样本中的癌症患者划分为转移复发与非转移复发两类。
本实施例中训练集样本为GSE17536,设定尺度参数σ的选择范围为{20,30,40},随机采样样本的选择范围为{20,50,100,111},通过选择不同的尺度参数σ和随机采样样本构成12种不同参数组合的待选预测模型。独立测试集样本分别是由癌症基因表达谱数据得到的GSE14333和GSE17537,由于两个独立测试集样本的大小互不相同,独立测试集GSE14333选择随机采样样本的选择范围是{20,50,67},独立测试集GSE17537选择随机采样样本的选择范围是{20,50,55}。
下面给出基于似化的谱聚类算法预测结直肠癌转移复发方法:
1、收集癌症基因表达谱数据。利用基因表达谱数据平台GeneExpressionOmnibus(GEO),收集到的结直肠癌基因表达数据集,包括GEO数据集GSE17536,样本数n=111;GSE14333,样本数n=67,以及GSE17537,样本数n=55。以上数据来源于平台为Affymetrix的U133plus2.0基因芯片,分别对每一个数据集进行独立处理。把原始的CEL文件用RMA进行归一化并计算基因的原始表达值,然后将各基因的表达值经过Log2转化。对于得到的基因表达值进行标准化处理,使得各基因在样本中表达值的均值为0,标准差为1。
2、设定数据标签。以结直肠癌患者生存三年作为数据分类的标准,如果三年内发生转移复发记为转移复发类(+1),否则记为非转移复发类(-1)。结直肠癌基因表达谱数据GSE17536包括26个转移复发样本与85个非转移复发样本。结直肠癌基因表达谱数据GSE14333包括10个转移复发样本与57个非转移复发样本。结直肠癌基因表达谱数据GSE17537包括17个转移复发样本与38个非转移复发样本。
3、计算任意两个癌症样本之间的相似度矩阵。依据高斯函数计算两个癌症样本之间的相似度值,其中xi与xj分别表示第i个与第j个癌症样本的基因表达谱数据。对于基因表达谱数据GSE17536,得到的相似度矩阵包括111行与111列。依此类推,可以得到基因表达谱数据GSE14333的相似度矩阵包括67行与67列,GSE17537的相似度矩阵包括55行与55列。
4、从n个癌症样本中随机采样个样本,分别构造相似度矩阵A与相似度矩阵B。例如:对于基因表达谱数据GSE17536,从111个癌症样本中随机采样50个样本,矩阵A包括50行与50列,矩阵B包括50行与61列。构造稠密相似矩阵Sd为: S d = A B B T C , 以及构造变换矩阵W为: W = A B T . 基于近似化方法,得到近似化矩阵为:
S ~ = S d = WA - 1 W T = A B B T B T A - 1 B .
5、记矩阵为:例如:对于基因表达谱数据GSE17536,从111个癌症样本中随机采样50个样本,其中,为50行1列的列向量,该列向量中元素为1,为61行1列的列向量。构造拉普拉斯矩阵为:
6、令矩阵R为: R = A ‾ + A ‾ - 1 2 B ‾ B ‾ T A ‾ - 1 2 , 其中将矩阵R依据公式进行分解,其中ΛR为特征值,UR为特征值对应的特征向量。
7、令矩阵为: V ~ = A ‾ B ‾ T A ‾ - 1 2 ( U R ) : , 1 : k ( Λ R - 1 2 ) 1 : k , 1 : k .
8、获得矩阵的归一化矩阵其中为:
9、基于k-means聚类算法把矩阵聚为k类;依此,将采集样本中癌症患者划分为转移复发与非转移复发两类病患,即k=2。
10、评价指标。以10个聚类精度值的平均值作为评价指标,其中聚类精度定义为其中n为癌症患者样本数,yi为癌症患者标签,包括转移复发与非转移复发两类,ci为预测标签。函数map(·)采用Hungarian算法将癌症患者复发转移的预测标签映射,当y=c时,δ(y,map(c))=1,否则δ(y,map(c))=0。基于近似化的谱聚类算法采用MATLAB语言编程实现。
11、111个结直肠癌样本做为谱聚类算法的输入特征建模。训练集样本GSE17536中每个样本有19468个特征的列,矩阵的行与列为111×19468。基于近似化的谱聚类算法,选择平均聚类精度最大值对应的一组参数,得到σ=40和随机采样数此时,得到的聚类精度accuracy=0.75495。
12、对独立测试集样本GSE14333进行验证。采用19468个基因作为输入特征,GSE14333对应矩阵的行与列为67×19468,将癌症转移复发预测模型用于独立测试集样本的测试,对分类结果为+1的样本记为转移复发类,对分类结果为-1的样本记为非转移复发类,此时得到的accuracy=0.83582。
13、为了进一步验证基于近似化的谱聚类算法的有效性,对第二个独立测试集样本GSE17537进行验证。采用19825个基因作为输入特征,GSE17537对应矩阵的行与列为55×19825,将癌症转移复发预测模型用于独立测试集的测试,对分类结果为+1的样本记为转移复发类,对分类结果为-1的样本记为非转移复发类,此时得到的accuracy=0.70909。
14、本发明的效果通过以下仿真结果进一步说明。
通过标准的k-means聚类算法,对训练集样本GSE17536与独立测试集样本GSE14333和GSE17537,分别得到聚类精度。把基于近似化的谱聚类算法与标准的k-means聚类算法得到的聚类精度进行比较,得到如图所示的结果。
图1为利用本发明方法预测得到的训练集样本GSE17536中的聚类精度,图1中柱状图A为基于近似化的谱聚类算法得到的癌症转移复发聚类精度,柱状图B为基于k-means聚类算法得到的癌症转移复发聚类精度。
图2为利用本发明方法预测得到的独立测试集样本GSE14333中的聚类精度,图2中柱状图A为基于近似化的谱聚类算法得到的癌症转移复发聚类精度,柱状图B为基于k-means聚类算法得到的癌症转移复发聚类精度。
图3为利用本发明方法预测得到的独立测试集样本GSE17537中的聚类精度,图3中柱状图A为基于近似化的谱聚类算法得到的癌症转移复发聚类精度,柱状图B为基于k-means聚类算法得到的癌症转移复发聚类精度。
如图1中柱状图A所示,针对训练集样本GSE17536,基于近似化的谱聚类算法,对结直肠癌的转移复发预测精度进行预测,得到聚类精度accuracy=0.75495。如图1中柱状图B所示,针对训练集样本GSE17536,基于k-means聚类算法,得到聚类精度accuracy=0.56216。与k-means聚类算法相比,基于近似化的谱聚类算法得到的聚类精度提升了34.29%。如图2中柱状图A所示,针对独立测试集样本GSE14333,基于近似化的谱聚类算法,对结直肠癌的转移复发预测精度进行预测,得到聚类精度accuracy=0.83582。如图2中柱状图B所示,针对独立测试集样本GSE14333,基于k-means聚类算法,得到聚类精度accuracy=0.57313。与k-means聚类算法相比,基于近似化的谱聚类算法得到的聚类精度提升了45.83%。如图3中柱状图A所示,针对独立测试集样本GSE17537,基于近似化的谱聚类算法,对结直肠癌的转移复发预测精度进行预测,得到聚类精度accuracy=0.70909。如图3中柱状图B所示,针对独立测试集样本GSE17537,基于k-means聚类算法,得到聚类精度accuracy=0.58。与k-means聚类算法相比,基于近似化的谱聚类算法得到的聚类精度提升了22.25%。因此,基于近似化的谱聚类算法,能够有效地区分转移复发类与非转移复发类两类患者,改进了癌症转移复发预测结果。预测结果通过MATLAB语言编程实现。
本实施例中基于近似化的谱聚类算法是指基于近似化的谱聚类算法。近似化方法采用矩阵低秩逼近,求解近似的特征向量和特征空间,从而有效地处理高维数据。基于近似化的谱聚类算法,降低了运算时间与运算空间的开销,以较小的精度损失获得算法效率的提升。

Claims (5)

1.基于近似化的谱聚类算法预测癌症转移复发的方法,其特征是:基于近似化的谱聚类算法,利用癌症基因表达谱数据作为训练集样本,构建癌症转移复发预测模型;将所述预测模型用于癌症转移复发独立测试集样本的测试,将癌症患者划分为转移复发与非转移复发两类病患。
2.根据权利要求1所述的基于近似化的谱聚类算法预测癌症转移复发的方法,其特征是:所述基于近似化的谱聚类算法是按如下过程进行:
(1)计算癌症基因表达谱数据中的任意两个癌症样本之间的相似度矩阵;
所述癌症样本是指以列为基因表达谱数据的向量;依据高斯函数计算两个癌症样本之间的相似度值sij,以相似度值sij构造相似度矩阵S(n×n),其中xi和xj分别为癌症样本,1≤i≤n,1≤j≤n,n为癌症基因表达谱数据中的样本个数,σ为尺度参数;
(2)从n个癌症样本中随机采样l个样本,分别构造相似度矩阵A(l×l)、相似度矩阵B(l×(n-l)),以及相似度矩阵C((n-l)×(n-l)),其中l≤n,则有稠密相似矩阵Sd为: S d = A B B T C , 并有变换矩阵W为: W = A B T ; 基于近似化方法获得近似化矩阵为:
S ~ = S d = WA - 1 W T = A B B T B T A - 1 B ;
(3)记矩阵为: D ~ = d i a g ( A 1 l + B 1 n - l B T 1 l + B T A - 1 B 1 n - l ) , 其中1l为l行且列为1的列向量,1n-l为n-l行且列为1的列向量,则拉普拉斯矩阵为:
(4)令矩阵R为: R = A ‾ + A ‾ - 1 2 B ‾ B ‾ T A ‾ - 1 2 , 其中
A ‾ = D ~ 1 : l , 1 : l - 1 / 2 A D ~ 1 : l , 1 : l - 1 / 2 , B ‾ = D ~ 1 : l , 1 : l - 1 / 2 B D ~ l + 1 : n , l + 1 : n - 1 / 2 ;
(5)将矩阵R依据公式进行分解,其中UR为特征向量,ΛR为特征值,令矩阵为: V ~ = A ‾ B ‾ T A ‾ - 1 2 ( U R ) : , 1 : k ( Λ R - 1 2 ) 1 : k , 1 : k , 其中k为聚类值;
(6)计算获得矩阵的归一化矩阵归一化矩阵中元素为:
(7)基于k-means聚类算法将矩阵聚为k类;依此,将采集样本中癌症患者划分为转移复发与非转移复发两类病患,即k=2。
3.根据权利要求2所述的基于近似化的谱聚类算法预测癌症转移复发的方法,其特征是:按如下方式构建癌症转移复发预测模型:设定尺度参数σ与随机采样样本l的选择范围,通过选择不同的σ值和l值,构成不同参数组合的待选预测模型;利用所述各待选预测模型,将训练集样本中的癌症患者划分为转移复发与非转移复发两类,各待选预测模型的构建重复执行10次,获得10个聚类精度值;以所述10个聚类精度值的平均值作为评价指标,选择10个聚类精度值的最大平均值所对应的待选预测模型作为预测模型。
4.根据权利要求3所述的基于近似化的谱聚类算法预测癌症转移复发的方法,其特征是:将所述预测模型用于癌症转移复发独立测试集样本的测试的方法是:针对独立测试集样本,基于选定的尺度参数σ,确定随机采样样本l的选择范围,利用基于近似化的谱聚类算法,将独立测试集样本中的癌症患者划分为转移复发与非转移复发两类。
5.根据权利要求2所述的基于近似化的谱聚类算法预测癌症转移复发的方法,其特征是:所述训练集样本为GSE17536,所述独立测试集样本分别是由癌症基因表达谱数据得到的GSE14333和GSE17537。
CN201510561497.9A 2015-08-31 2015-08-31 基于近似化的谱聚类算法预测癌症转移复发的方法 Pending CN105243300A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510561497.9A CN105243300A (zh) 2015-08-31 2015-08-31 基于近似化的谱聚类算法预测癌症转移复发的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510561497.9A CN105243300A (zh) 2015-08-31 2015-08-31 基于近似化的谱聚类算法预测癌症转移复发的方法

Publications (1)

Publication Number Publication Date
CN105243300A true CN105243300A (zh) 2016-01-13

Family

ID=55040946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510561497.9A Pending CN105243300A (zh) 2015-08-31 2015-08-31 基于近似化的谱聚类算法预测癌症转移复发的方法

Country Status (1)

Country Link
CN (1) CN105243300A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107845424A (zh) * 2017-11-15 2018-03-27 海南大学 诊断信息处理分析的方法和系统
WO2020113673A1 (zh) * 2018-12-07 2020-06-11 深圳先进技术研究院 一种基于多组学集成的癌症亚型分类方法
US11113580B2 (en) 2019-12-30 2021-09-07 Industrial Technology Research Institute Image classification system and method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107845424A (zh) * 2017-11-15 2018-03-27 海南大学 诊断信息处理分析的方法和系统
CN107845424B (zh) * 2017-11-15 2021-11-16 海南大学 诊断信息处理分析的方法和系统
WO2020113673A1 (zh) * 2018-12-07 2020-06-11 深圳先进技术研究院 一种基于多组学集成的癌症亚型分类方法
CN111291777A (zh) * 2018-12-07 2020-06-16 深圳先进技术研究院 一种基于多组学集成的癌症亚型分类方法
CN111291777B (zh) * 2018-12-07 2023-04-07 深圳先进技术研究院 一种基于多组学集成的癌症亚型分类方法
US11113580B2 (en) 2019-12-30 2021-09-07 Industrial Technology Research Institute Image classification system and method

Similar Documents

Publication Publication Date Title
Yao et al. Whole slide images based cancer survival prediction using attention guided deep multiple instance learning networks
US20160026917A1 (en) Ranking of random batches to identify predictive features
CN106529165A (zh) 基于稀疏相似矩阵的谱聚类算法识别癌症分子亚型的方法
CN109872776B (zh) 一种基于加权基因共表达网络分析对胃癌潜在生物标志物的筛选方法及其应用
Ye et al. Cervical cancer metastasis and recurrence risk prediction based on deep convolutional neural network
CN111128385B (zh) 一种用于食管鳞癌的预后预警系统及其应用
CN111161882A (zh) 一种基于深度神经网络的乳腺癌生存期预测方法
CN109055562A (zh) 一种生物标志物、预测肾细胞癌的复发和死亡风险的方法
Liu et al. Predicting breast cancer recurrence and metastasis risk by integrating color and texture features of histopathological images and machine learning technologies
CN110993104A (zh) 肿瘤患者生存期预测系统
CN105243300A (zh) 基于近似化的谱聚类算法预测癌症转移复发的方法
CN111613267A (zh) 一种基于注意力机制的CRISPR/Cas9脱靶预测方法
CN113421609A (zh) 一种基于lncRNA对的结肠癌预后预测模型及其构建方法
Ray et al. Transforming Breast Cancer Identification: An In-Depth Examination of Advanced Machine Learning Models Applied to Histopathological Images
CN115881296B (zh) 一种甲状腺乳头状癌(ptc)风险辅助分层系统
KR20200109544A (ko) 공통 유전자 추출에 의한 다중 암 분류 방법
Sobhan et al. Explainable machine learning to identify patient-specific biomarkers for lung cancer
Patra et al. Deep learning methods for scientific and industrial research
Dayao et al. Deriving spatial features from in situ proteomics imaging to enhance cancer survival analysis
Metaxas et al. Deep learning-based nuclei segmentation and classification in histopathology images with application to imaging genomics
CN115100155A (zh) 放射性肺炎预测模型的建立方法与系统
CN113584175A (zh) 一组评估肾乳头状细胞癌进展风险的分子标记及其筛选方法和应用
Han et al. Molecular bases of morphometric composition in Glioblastoma multiforme
CN117393171B (zh) 直肠癌术后lars发展轨迹预测模型构建方法及系统
Gupta et al. Genome Sequence Identification using Deep Learning for Lung Cancer Diagnosis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160113

RJ01 Rejection of invention patent application after publication