CN117708706A - 一种端到端特征增强与选择的乳腺肿瘤分类方法及系统 - Google Patents
一种端到端特征增强与选择的乳腺肿瘤分类方法及系统 Download PDFInfo
- Publication number
- CN117708706A CN117708706A CN202410165971.5A CN202410165971A CN117708706A CN 117708706 A CN117708706 A CN 117708706A CN 202410165971 A CN202410165971 A CN 202410165971A CN 117708706 A CN117708706 A CN 117708706A
- Authority
- CN
- China
- Prior art keywords
- feature
- tumor
- input
- selection
- enhancement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 208000026310 Breast neoplasm Diseases 0.000 title claims abstract description 34
- 230000002708 enhancing effect Effects 0.000 title claims abstract description 14
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 82
- 239000013598 vector Substances 0.000 claims abstract description 61
- 206010006187 Breast cancer Diseases 0.000 claims abstract description 29
- 238000013507 mapping Methods 0.000 claims abstract description 19
- 201000011510 cancer Diseases 0.000 claims abstract description 16
- 230000036210 malignancy Effects 0.000 claims abstract description 13
- 238000000926 separation method Methods 0.000 claims abstract description 13
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 238000003860 storage Methods 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000006870 function Effects 0.000 description 16
- 238000012549 training Methods 0.000 description 10
- 238000007689 inspection Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- 230000003211 malignant effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004393 prognosis Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 208000009458 Carcinoma in Situ Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011423 initialization method Methods 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000004660 morphological change Effects 0.000 description 1
- 238000013188 needle biopsy Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明涉及肿瘤分类技术领域,尤其是涉及一种端到端特征增强与选择的乳腺肿瘤分类方法及系统。所述方法,包括获取肿瘤原始数据指标;基于分离层和全连接层对肿瘤原始数据指标进行增强表达,得到增强特征向量;对增强特征向量进行特征选择,得到特征子集;基于深度神经网络,对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率。本发明通过上述技术方案,直接利用原始的肿瘤检查指标作为模型输入,通过在网络中设计特征增强和选择模块,可以自动学习表达肿瘤分类相关的特征。
Description
技术领域
本发明涉及肿瘤分类技术领域,尤其是涉及一种端到端特征增强与选择的乳腺肿瘤分类方法及系统。
背景技术
乳腺肿瘤的良性和恶性分类对指导临床工作具有重要意义。良恶性的判断直接影响到后续的治疗方案选择和预后评估。良性肿瘤增殖较慢,大多是局部疾病,一般预后较好,多采取保守治疗。而恶性肿瘤侵袭性强,更易发生远处转移,预后差,需要积极的综合治疗。现有的乳腺肿瘤分类方法主要如下:
传统生物统计分析方法。这种方法首先由专家基于经验选择与肿瘤分类相关的生物学特征,比如患者年龄、肿瘤大小、生长速度等。然后汇总前期病例数据,依据经验构建一个简单统计分析模型,可能涉及到一些回归分析、方差分析等统计学方法。对新的患者样本,输入模型进行分类。
手术病理学检查方法。该方法获得肿瘤患者手术切除的肿瘤组织样本,进行病理学处理,制成组织切片,在显微镜下观察细胞形态、结构、分布等信息。切片可能进行染色处理以突出关键特征。然后病理学专家会根据经验对细胞形态学变化进行综合判断,来确定该肿瘤的恶性程度或良恶分类。
传统的机器学习方法。这类方法使用一些简单的机器学习算法模型,比如支持向量机、决策树、随机森林等。研究人员首先提取医学检验指标,进行特征工程,然后将特征数据集输入机器学习模型,训练分类器。这样就可以建立一个自动分类系统。
1.现有技术缺点
(1)传统生物统计分析方法完全依赖于专家经验选择与肿瘤分类相关的生物学特征。这导致不同专家根据各自知识背景和经验的局限性,可能选择非常不同的特征。这种人工特征选择的不稳定性和主观性,会直接影响后续建立的分类模型的客观性和准确性。
(2)手术病理学检查方法需要通过外科手术切除或针吸活检等方式来获取病变组织样本,这种侵入式的样本获取方式会对患者造成一定的创伤。同时手术切除也存在一定风险。这种方法仅适用于已确诊需要治疗的患者,无法用于早期筛查或原位癌监测。
传统机器学习方法无法实现端到端训练,往往需要进行复杂的特征工程。研究人员首先需要根据经验提取特征。然后还需要对特征进行选择、转换、降维等进一步的处理。而且无法保证提取原始数据中全部关键鉴别信息,且整个结构松散,这限制了传统机器学习方法的泛化性和灵活性。
发明内容
为了解决上述提到的问题,本发明提供一种端到端特征增强与选择的乳腺肿瘤分类方法及系统。
第一方面,本发明提供的一种端到端特征增强与选择的乳腺肿瘤分类方法,采用如下的技术方案:
一种端到端特征增强与选择的乳腺肿瘤分类方法,包括:
获取肿瘤原始数据指标;
利用深度神经网络直接接受肿瘤原始数据指标作为输入,基于分离层和全连接层对肿瘤原始数据指标进行增强表达,得到增强特征向量;
对增强特征向量进行特征选择,得到特征子集;
对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率。
进一步地,所述获取肿瘤原始数据指标,包括获取多种乳腺肿瘤关键指标,并将分为30类作为输入指标向量。
进一步地,所述基于分离层和全连接层对肿瘤原始数据指标进行增强表达,包括利用分离层对30个肿瘤原始数据指标进行标量特征拆分,利用全连接层对30个标量特征进行线性运算,得到30个8维的特征向量,并通过将30个8维特征向量拼接,得到一个240维的增强特征向量。
进一步地,所述对增强特征向量进行特征选择,包括通过第一路径直接接受增强特征向量输入,通过门控子模块获取选择后的全局特征向量,然后连接至全连接层和Softmax激活函数;通过第二路径将输入的增强特征向量分离为逐个特征,然后每个特征单独进行门控模块选择,最后将全部结果拼接,得到第二路径的输出,通过将第一路径和第二路径的结果相乘,得到特征子集。
进一步地,所述通过门控子模块获取选择后的全局特征向量,包括将输入的增强特征向量经过多个全连接层进行特征降维,在第三个全连接层处添加特征加权,权重值较小的特征被过滤,权重大的特征被保留,实现特征选择。
进一步地,所述对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率,包括通过一个全连接层输出选择后的特征,并将特征维度降低为1维,其中全连接层公式为:
;
其中,为输入特征向量,/>为权重矩阵,/>为偏置向量,/>为输出特征向量。
进一步地,所述对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率,还包括对降维后的特征进行Sigmoid函数映射,Softmax函数公式为:
其中,为第/>个输入特征,/>第j个输入特征;
Sigmoid公式为:
Relu公式为:
第二方面,一种端到端特征增强与选择的乳腺肿瘤分类系统,包括:
数据获取模块,被配置为,获取肿瘤原始数据指标;
特征增强模块,被配置为,利用深度神经网络直接接受肿瘤原始数据指标作为输入,基于分离层和全连接层对肿瘤原始数据指标进行增强表达,得到增强特征向量;
特征选择模块,被配置为,对增强特征向量进行特征选择,得到特征子集;
输出模块,被配置为,对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率。
第三方面,本发明提供一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种端到端特征增强与选择的乳腺肿瘤分类方法。
第四方面,本发明提供一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种端到端特征增强与选择的乳腺肿瘤分类方法。
综上所述,本发明具有如下的有益技术效果:
1.本发明通过上述技术方案,直接利用原始的肿瘤检查指标作为模型输入,通过在网络中设计特征增强和选择模块,可以自动学习表达肿瘤分类相关的特征。
2. 自定义设计的特征增强模块,针对每个原始输入特征,使用多层全连接网络作为子模块进行非线性映射,使每个特征获得更加丰富和鲁棒的表达。重复该模块增强所有特征,最终获得一个增强特征向量,为后续特征选择及分类任务提供信息充足的输入。
3. 自定义设计的特征选择模块,使用门控结构和残差连接实现对输入增强特征的自动选择,无需人工定义选择算法,可以完全数据驱动地学习到对分类任务最优化的特征子集,提高模型准确性。
4. 网络各组件功能明确,输入数据完整可追溯,实现了可解释的端到端框架,提升了模型的效率与灵活性。
5. 系统直接基于非侵入式检查指标作为输入,可以实现对疑似患者的无创智能筛查,拓展了临床应用场景,有利于提高疾病的早期发现率和治愈率。
附图说明
图1是本发明实施例1的一种端到端特征增强与选择的乳腺肿瘤分类方法的流程示意图;
图2是本发明实施例1的特征增强模块的流程示意图;
图3是本发明实施例1的特征选择模块的流程示意图;
图4是本发明实施例1的门控子模块的流程示意图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
实施例1
参照图1,本实施例的
S1. 获取肿瘤原始数据指标;
本网络的输入为多种乳腺肿瘤关键检查指标,这些指标反映了肿瘤的形态特征、表面特征以及生长变化趋势等多方面信息。具体而言,输入指标向量共包括30类,分别对应30个输入指标,每一组输入向量对应一个肿瘤患者的检查报告。输入数据源自临床获得的大规模乳腺肿瘤患者的多次复查报告。详细如下:
1)形态学指标:反映肿瘤大小、形状等形态特征的指标,如平均半径、平均周长、平均面积等;
2)表面指标:反映肿瘤表面质地的指标,如平均纹理、平均光滑度等;
3)误差指标:反映相同肿瘤不同位置测量结果误差的指标,如半径误差、周长误差等;
4)极值指标:反映肿瘤在各个位置的极大极小值指标,如最差半径、最差周长等;
5)其它指标:反映肿瘤形态复杂程度的指标,如平均对称度、平均碎形维数等。
上述丰富的多指标输入,可以全面刻画每个肿瘤案例的特征。这些指标以30维向量的形式表示,向量长度为30,分别对应30个输入指标。每一组输入向量对应一个肿瘤患者的检查报告。输入数据源自临床获得的大规模乳腺肿瘤患者的多次复查报告。
丰富的输入指标,全面刻画了每个肿瘤案例的特征,为网络学习提取肿瘤分类关键特征提供了可靠的基础数据。输入数据无需进行任何预处理与特征工程,将在后续网络中直接进行特征增强、选择处理,以学习表达肿瘤类别相关的主要特征。
S2. 利用深度神经网络直接接受肿瘤原始数据指标作为输入,基于分离层和全连接层对肿瘤原始数据指标进行增强表达,得到增强特征向量;
特征增强模块直接接受原始的30维输入检查指标作为输入,目的是增强这些原始特征的表达能力。具体来说,该模块首先利用分离层(spilt层)将输入的30维向量拆分为30个单独的标量特征输入。接下来,对每个标量特征X,应用一个独立的全连接网络层(Dense层),这个全连接层包含8个隐层单元,实现了一个线性映射:X =>Y,其中Y是8维的向量。这样通过全连接层的线性运算,可以获得比原始输入X更丰富的特征表达Y。重复这一过程,最终将30个原始标量特征分别映射为30个8维的特征向量。然后将这30个8维向量拼接在一起,构成一个240维的增强特征向量,其中每一维都包含了输入原始特征的增强表达。特征增强模块示意图如图2所示。
具体来说,设原始输入为,表示30个肿瘤临床指标。先利用30个分离层,将每个标量输入设为/>。再对每个/>应用一个全连接层,得到8维特征向量:/>,其中/>,/>。最后将所有 />按行拼接,得到最终240维特征,表示为。
需要指出的是,这个过程完全是数据驱动的,无需人工设计特征工程。通过端到端学习全连接层的参数,自动获得增强特征。相比线性映射,多个线性映射提取了原始特征中的更复杂关系,使表达更丰富,这是提升分类性能的关键。
S3.对增强特征向量进行特征选择,得到特征子集;
特征选择模块是整个网络的主干,其作用是对增强后的特征进行选择性的学习,提取对最终预测结果有效的特征,其接受特征增强模块的输出作为输入。本模块分为两条多路径,每条路径又多个门控子模块组成,门控子模块用以选择有效特征。第一路径直接接受向量输入,通过门控子模块获取选择后的全局特征向量,然后连接一个全连接层和Softmax激活函数。第二路径则是先将输入先分离为逐个特征,然后每个特征单独进行门控模块选择。全部结果再拼接,得到第二路径的输出。最后,将第一路径和第二路径的结果相乘,得到特征选择模块的最终输出。特征选择模块的示意图如图3所示。
门控子模块是特征选择模块中非常关键的组成部分,其作用是实现对输入特征的选择。门控子模块的结构采用了特征加权和残差结构组成。具体来说,本模块将原始输入经过多个全连接层对特征降维,在第三个全连接层处添加特征加权,权重值较小的特征被过滤,权重大的特征被保留,从而实现特征选择。此外,将原始输入通过一个全连接层降维后,与加权后的特征相加,构成残差结构,提高信息流动,避免梯度消失。相比直接删减特征,这种软门控方式可以学习特征重要性的连续值,实现更平滑的特征选择。门控子模块的示意图如图4所示(以第一个特征选择模块的子模块举例)。
S4.对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率。
基于本案提出的以上各个模块,网络由四个主要组件串联组成,网络的总体结构如图1所示,首先输入模块接收原始的30维检查指标数据。第二,特征增强模块,使用全连接网络对分离后的每个特征进行增强,输出增强后的240维向量。第三,特征选择模块,是网络的主体结构。共包括三个串联的特征选择模块,通过其中的全连接层进行特征降维,分别输出32、16、8维的特征向量。完成对增强特征进行选择,输出最终的特征子集。第四,输出模块,包含一个全连接层,输入选择后的特征,将特征维度降低为1维,然后经过Sigmoid函数映射,输出肿瘤恶性概率。
区别于传统方法需要进行复杂的特征工程等处理,本网络直接利用原始的多项肿瘤检查指标作为模型输入,无需进行人工特征提取、选择等数据预处理。所有原始指标数据被完整输入到模型中,保证最大程度利用输入数据的信息。同时,直接输入原始指标也避免了特征工程中人为选择带来的分类信息损失。实现了真正的端到端特征学习,避免了人工特征工程的主观性,并获得了模型性能提升。
此外,本网络中使用的主要层和激活函数公式如下,
全连接层公式为:;
其中,为输入特征向量,/>为权重矩阵,/>为偏置向量,/>为输出特征向量。
Softmax函数公式为:
其中,为第/>个输入特征,/>为第j个输入特征。
Sigmoid公式为:
Relu公式为:
其中x为输入向量。
1.模型训练与应用
本网络模型建立在TensorFlow框架上,损失函数使用二分类交叉熵函数。
优化器算法采用Adam,学习率设置为0.001,同时设置L2正则化防止过拟合。训练集数据按照8:2划分为训练集和验证集。训练批次大小设置为32。此外,训练过程中设置早停机制,如果验证集Loss连续3轮没有下降则停止训练,以防止过拟合。模型的权重初始化采用Xavier方法,可加速收敛速度。Xavier初始化方法的原理是自动调整权重的方差,使其与网络中每一层的输入的方差保持一定的比例关系。这有利于梯度在神经网络中向前和向后传播时的数值稳定性。
另外设置裁剪技术,当梯度超过给定阈值时进行裁剪,以平滑训练过程。训练硬件环境为NVDIA Tesla V100 GPU,并采用多GPU并行训练。最后模型在验证集上表现最优的一组超参被保存下来用于后续应用。
本网络模型可部署到云端作为智能辅助诊断的API服务。医生在获得肿瘤检查报告后,输入报告中的关键指标,即可调用模型API获取该患者肿瘤的恶性预测概率。该概率可作为重要参考,辅助医生判断进一步治疗方案。另外,本模型还可应用到移动端作为自检app。用户可定期进行乳腺检查,在获得报告后,利用app输入指标,获取该月检查结果的良恶性预测。如果预测为高危,app将推送警示提醒用户需要尽快进一步检查。该自检app可实现乳腺肿瘤的早期识别与预警。
通过模型的云端部署与移动应用,可覆盖临床医生诊断与用户自我检查两个场景,发挥模型效能、提高乳腺肿瘤治愈率。
实施例2
本实施例提供一种端到端特征增强与选择的乳腺肿瘤分类系统,包括:
数据获取模块,被配置为,获取肿瘤原始数据指标;
特征增强模块,被配置为,利用深度神经网络直接接受肿瘤原始数据指标作为输入,基于分离层和全连接层对肿瘤原始数据指标进行增强表达,得到增强特征向量;
特征选择模块,被配置为,对增强特征向量进行特征选择,得到特征子集;
输出模块,被配置为,对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种端到端特征增强与选择的乳腺肿瘤分类方法。
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种端到端特征增强与选择的乳腺肿瘤分类方法。
以上均为本发明的较佳实施例,并非依此限制本发明的保护范围,故:凡依本发明的结构、形状、原理所做的等效变化,均应涵盖于本发明的保护范围之内。
Claims (10)
1.一种端到端特征增强与选择的乳腺肿瘤分类方法,其特征在于,包括:
获取肿瘤原始数据指标;
利用深度神经网络直接接受肿瘤原始数据指标作为输入,基于分离层和全连接层对肿瘤原始数据指标进行增强表达,得到增强特征向量;
对增强特征向量进行特征选择,得到特征子集;
对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率。
2.根据权利要求1所述的一种端到端特征增强与选择的乳腺肿瘤分类方法,其特征在于,所述获取肿瘤原始数据指标,包括获取多种乳腺肿瘤关键指标,并将分为30类作为输入指标向量。
3.根据权利要求2所述的一种端到端特征增强与选择的乳腺肿瘤分类方法,其特征在于,所述基于分离层和全连接层对肿瘤原始数据指标进行增强表达,包括利用分离层对30个肿瘤原始数据指标进行标量特征拆分,利用全连接层对30个标量特征进行线性运算,得到30个8维的特征向量,并通过将30个8维特征向量拼接,得到一个240维的增强特征向量。
4.根据权利要求3所述的一种端到端特征增强与选择的乳腺肿瘤分类方法,其特征在于,所述对增强特征向量进行特征选择,包括通过第一路径直接接受增强特征向量输入,通过门控子模块获取选择后的全局特征向量,然后连接至全连接层和Softmax激活函数;通过第二路径将输入的增强特征向量分离为逐个特征,然后每个特征单独进行门控模块选择,最后将全部结果拼接,得到第二路径的输出,通过将第一路径和第二路径的结果相乘,得到特征子集。
5.根据权利要求4所述的一种端到端特征增强与选择的乳腺肿瘤分类方法,其特征在于,所述通过门控子模块获取选择后的全局特征向量,包括将输入的增强特征向量经过多个全连接层进行特征降维,在第三个全连接层处添加特征加权,权重值小的特征被过滤,权重大的特征被保留,实现特征选择。
6.根据权利要求5所述的一种端到端特征增强与选择的乳腺肿瘤分类方法,其特征在于,所述对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率,包括通过一个全连接层输出选择后的特征,并将特征维度降低为1维,其中全连接层公式为:
;
其中,为输入特征向量,/>为权重矩阵,/>为偏置向量,/>为输出特征向量。
7.根据权利要求6所述的一种端到端特征增强与选择的乳腺肿瘤分类方法,其特征在于,所述对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率,还包括对降维后的特征进行Sigmoid函数映射Softmax函数公式为:
,
其中,为第/>个输入特征,/>为第j个输入特征;
Sigmoid公式为:
,
Relu公式为:
,
其中x为输入向量。
8.一种端到端特征增强与选择的乳腺肿瘤分类系统,其特征在于,包括:
数据获取模块,被配置为,获取肿瘤原始数据指标;
特征增强模块,被配置为,利用深度神经网络直接接受肿瘤原始数据指标作为输入,基于分离层和全连接层对肿瘤原始数据指标进行增强表达,得到增强特征向量;
特征选择模块,被配置为,对增强特征向量进行特征选择,得到特征子集;
输出模块,被配置为,对特征子集进行Sigmoid函数映射,输出肿瘤恶性概率。
9.一种计算机可读存储介质,其中存储有多条指令,其特征在于,所述指令适于由终端设备的处理器加载并执行如权利要求1所述的一种端到端特征增强与选择的乳腺肿瘤分类方法。
10.一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令适于由处理器加载并执行如权利要求1所述的一种端到端特征增强与选择的乳腺肿瘤分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410165971.5A CN117708706B (zh) | 2024-02-06 | 2024-02-06 | 一种端到端特征增强与选择的乳腺肿瘤分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410165971.5A CN117708706B (zh) | 2024-02-06 | 2024-02-06 | 一种端到端特征增强与选择的乳腺肿瘤分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117708706A true CN117708706A (zh) | 2024-03-15 |
CN117708706B CN117708706B (zh) | 2024-05-28 |
Family
ID=90161107
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410165971.5A Active CN117708706B (zh) | 2024-02-06 | 2024-02-06 | 一种端到端特征增强与选择的乳腺肿瘤分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117708706B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275116A (zh) * | 2020-01-20 | 2020-06-12 | 太原理工大学 | 基于三维卷积神经网络的乳腺肿瘤超声图像分类方法 |
CN112580362A (zh) * | 2020-12-18 | 2021-03-30 | 西安电子科技大学 | 一种基于文本语义监督的视觉行为识别方法、系统及计算机可读介质 |
CN113380401A (zh) * | 2021-07-13 | 2021-09-10 | 华侨大学 | 基于超声图像的乳腺肿瘤良恶性分类方法、装置和介质 |
WO2022147940A1 (zh) * | 2021-01-08 | 2022-07-14 | 温州医科大学 | 一种面向多源数据的乳腺肿瘤图像分类预测方法及装置 |
CN114782307A (zh) * | 2022-02-11 | 2022-07-22 | 安徽医科大学第一附属医院 | 基于深度学习的增强ct影像直肠癌分期辅助诊断系统 |
CN114821058A (zh) * | 2022-04-28 | 2022-07-29 | 济南博观智能科技有限公司 | 一种图像语义分割方法、装置、电子设备及存储介质 |
CN115186769A (zh) * | 2022-09-07 | 2022-10-14 | 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) | 一种基于nlp的突变基因分类方法 |
CN115186192A (zh) * | 2022-07-27 | 2022-10-14 | 腾安基金销售(深圳)有限公司 | 信息处理方法、装置、存储介质及设备 |
US20220382553A1 (en) * | 2021-05-24 | 2022-12-01 | Beihang University | Fine-grained image recognition method and apparatus using graph structure represented high-order relation discovery |
CN115810129A (zh) * | 2022-12-22 | 2023-03-17 | 东莞理工学院 | 一种基于轻量化网络的物体分类方法 |
EP4174739A1 (en) * | 2021-10-29 | 2023-05-03 | Panakeia Technologies Limited | A method of classification |
CN116486401A (zh) * | 2023-04-14 | 2023-07-25 | 武汉大学 | 基于多尺度特征聚合的肉芽肿圆形表示定位方法及系统 |
CN116824694A (zh) * | 2023-06-06 | 2023-09-29 | 西安电子科技大学 | 基于时序聚合和门控Transformer的动作识别系统及方法 |
CN117078692A (zh) * | 2023-10-13 | 2023-11-17 | 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) | 一种基于自适应特征融合的医疗超声图像分割方法及系统 |
CN117132472A (zh) * | 2023-10-08 | 2023-11-28 | 兰州理工大学 | 基于前向-反向可分离自注意力的图像超分辨率重建方法 |
-
2024
- 2024-02-06 CN CN202410165971.5A patent/CN117708706B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275116A (zh) * | 2020-01-20 | 2020-06-12 | 太原理工大学 | 基于三维卷积神经网络的乳腺肿瘤超声图像分类方法 |
CN112580362A (zh) * | 2020-12-18 | 2021-03-30 | 西安电子科技大学 | 一种基于文本语义监督的视觉行为识别方法、系统及计算机可读介质 |
WO2022147940A1 (zh) * | 2021-01-08 | 2022-07-14 | 温州医科大学 | 一种面向多源数据的乳腺肿瘤图像分类预测方法及装置 |
US20220382553A1 (en) * | 2021-05-24 | 2022-12-01 | Beihang University | Fine-grained image recognition method and apparatus using graph structure represented high-order relation discovery |
CN113380401A (zh) * | 2021-07-13 | 2021-09-10 | 华侨大学 | 基于超声图像的乳腺肿瘤良恶性分类方法、装置和介质 |
EP4174739A1 (en) * | 2021-10-29 | 2023-05-03 | Panakeia Technologies Limited | A method of classification |
CN114782307A (zh) * | 2022-02-11 | 2022-07-22 | 安徽医科大学第一附属医院 | 基于深度学习的增强ct影像直肠癌分期辅助诊断系统 |
CN114821058A (zh) * | 2022-04-28 | 2022-07-29 | 济南博观智能科技有限公司 | 一种图像语义分割方法、装置、电子设备及存储介质 |
CN115186192A (zh) * | 2022-07-27 | 2022-10-14 | 腾安基金销售(深圳)有限公司 | 信息处理方法、装置、存储介质及设备 |
CN115186769A (zh) * | 2022-09-07 | 2022-10-14 | 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) | 一种基于nlp的突变基因分类方法 |
CN115810129A (zh) * | 2022-12-22 | 2023-03-17 | 东莞理工学院 | 一种基于轻量化网络的物体分类方法 |
CN116486401A (zh) * | 2023-04-14 | 2023-07-25 | 武汉大学 | 基于多尺度特征聚合的肉芽肿圆形表示定位方法及系统 |
CN116824694A (zh) * | 2023-06-06 | 2023-09-29 | 西安电子科技大学 | 基于时序聚合和门控Transformer的动作识别系统及方法 |
CN117132472A (zh) * | 2023-10-08 | 2023-11-28 | 兰州理工大学 | 基于前向-反向可分离自注意力的图像超分辨率重建方法 |
CN117078692A (zh) * | 2023-10-13 | 2023-11-17 | 山东未来网络研究院(紫金山实验室工业互联网创新应用基地) | 一种基于自适应特征融合的医疗超声图像分割方法及系统 |
Non-Patent Citations (3)
Title |
---|
JULIANA WOLF PEREIRA等: "Hyperparameter for Deep Learning Applied in Mammogram Image Classification", 2022 IEEE 35TH INTERNATIONAL SYMPOSIUM ON COMPUTER-BASED MEDICAL SYSTEMS (CBMS), 31 August 2022 (2022-08-31), pages 90 - 95 * |
戴昂等: "基于改进 TransBTS 的脑肿瘤分割算法研究", 实验技术与管理, 31 August 2023 (2023-08-31), pages 13 - 20 * |
武明虎;马旭茹;刘敏;: "基于改进的AlexNet的乳腺肿瘤智能诊断方法", 湖北工业大学学报, no. 04, 15 August 2020 (2020-08-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN117708706B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Osman et al. | An effective of ensemble boosting learning method for breast cancer virtual screening using neural network model | |
CN112101451B (zh) | 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法 | |
CN108257135A (zh) | 基于深度学习方法解读医学图像特征的辅助诊断系统 | |
Wakili et al. | Classification of breast cancer histopathological images using DenseNet and transfer learning | |
Mandache et al. | Basal cell carcinoma detection in full field OCT images using convolutional neural networks | |
CN111275706A (zh) | 一种基于剪切波弹性成像超声组学深度分析方法及系统 | |
CN111899259A (zh) | 一种基于卷积神经网络的前列腺癌组织微阵列分级方法 | |
CN115100467A (zh) | 一种基于核注意力网络的病理全切片图像分类方法 | |
Kalapahar et al. | Gleason grading of histology prostate images through semantic segmentation via residual u-net | |
Yi et al. | Decision tree model in the diagnosis of breast cancer | |
CN115471701A (zh) | 基于深度学习和迁移学习的肺腺癌组织学亚型分类方法 | |
Kumar et al. | Colon cancer classification of histopathological images using data augmentation | |
Al-Ani et al. | Implementing a novel low complexity CNN model for brain tumor detection | |
Fayyadh et al. | Brain tumor detection and classifiaction using CNN algorithm and deep learning techniques | |
CN117708706B (zh) | 一种端到端特征增强与选择的乳腺肿瘤分类方法及系统 | |
Verma et al. | A Futuristic Approach to Synaptic Fusion of INN and CNN Architectures for Tissue Classification | |
Ahmed et al. | Breast cancer classification from histopathological images using convolutional neural network | |
Miselis et al. | Deep neural networks for breast cancer diagnosis: fine needle biopsy scenario | |
Rawat | Assessing the Effect of Pre-processing Techniques on Classification of Breast Cancer using Histopathological Images | |
Chugh et al. | Morphological and otsu’s technique based mammography mass detection and deep neural network classifier based prediction | |
Theissen et al. | Learning cellular phenotypes through supervision | |
Zerouaoui et al. | Assessing the Impact of Deep End-to-End Architectures in Ensemble Learning for Histopathological Breast Cancer Classification. | |
Ahammed et al. | Inception V3 Based Transfer Learning Model for the Prognosis of Acute Lymphoblastic Leukemia from Microscopic Images | |
Tu et al. | Deep Multi-Dictionary Learning for Survival Prediction With Multi-Zoom Histopathological Whole Slide Images | |
ul Haq et al. | A Combined Approach for Multiclass Brain Tumor Detection and Classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |