CN111402205A - 一种基于多层感知机的乳腺肿瘤数据清洗方法 - Google Patents

一种基于多层感知机的乳腺肿瘤数据清洗方法 Download PDF

Info

Publication number
CN111402205A
CN111402205A CN202010122736.1A CN202010122736A CN111402205A CN 111402205 A CN111402205 A CN 111402205A CN 202010122736 A CN202010122736 A CN 202010122736A CN 111402205 A CN111402205 A CN 111402205A
Authority
CN
China
Prior art keywords
scoring
breast tumor
ultrasonic
characteristic
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010122736.1A
Other languages
English (en)
Other versions
CN111402205B (zh
Inventor
黄庆华
胡宝珠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202010122736.1A priority Critical patent/CN111402205B/zh
Publication of CN111402205A publication Critical patent/CN111402205A/zh
Application granted granted Critical
Publication of CN111402205B publication Critical patent/CN111402205B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2193Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10132Ultrasound image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30068Mammography; Breast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)

Abstract

本发明涉及一种基于多层感知机的乳腺肿瘤数据清洗方法,该方法基于BI‑RADS超声打分准则,对包含有乳腺肿瘤数据集的超声图片进行特征打分,构建数据集,根据数据集中的乳腺肿瘤超声特征对超声图像样本给出良恶性标签,构建乳腺肿瘤特征打分矩阵,基于该乳腺肿瘤特征打分矩阵,结合多层感知机修正所述打分矩阵中特征打分分值的误差,获得修正的乳腺肿瘤特征打分矩阵。该数据清洗方法能够有效的消除特征打分数据中所包含的误差,有效提高后续分类的准确性,具有很高的实用性。

Description

一种基于多层感知机的乳腺肿瘤数据清洗方法
技术领域
本发明涉及数据清洗技术领域,具体涉及一种基于多层感知机的乳腺肿瘤数据清洗方法。
背景技术
研究表明,超声对区分肿瘤良恶性具有较高的准确性,可以极大程度的避免不必要的活检。超声图像的读取依赖于超声医师自身经验水平,因此使用计算机手段进行超声图像数据的处理,能有效地提高数据处理的特异性及敏感性,具有重要的理论意义与极高的临床价值。传统的计算机处理技术利用图像预处理手段及分割技术从乳腺肿瘤超声图像中提取出感兴趣区域的纹理、形态学等有效特征,然后根据得到的特征使用机器学习手段进行分类器的拟合学习,从而实现乳腺肿瘤良恶性的分类。由于上述过程中使用的皆是纹理、形态学等低级图像特征,而医师临床诊断中常使用的为与乳腺肿瘤超声征象相关的高级语义特征,从而导致学习模型给出的分类结果难以直观被理解和解释。其次,由于相关特征的提取对设备参数、图片质量依赖性过高,导致分类模型不具有较强的鲁棒性。当乳腺肿瘤超声图像来源不同时,超声图像质量的改变将影响到最终分类的效果。若是根据BI-RADS打分细则得到的数据矩阵进行乳腺肿瘤良恶性的分类学习,避免了大量的乳腺肿瘤超声图像预处理等步骤,但由于BI-RADS打分细则自含的误差及乳腺肿瘤超声图像自含的模糊性,打分数据矩阵中可能包含误差,从而导致分类模型的准确性低,难以在应用上得到推广。
发明内容
针对现有技术中存在的技术问题,本发明的首要目的是提供一种基于多层感知机的乳腺肿瘤数据清洗方法,该方法能够根据BI-RADS打分细则,对相应的乳腺肿瘤超声特征进行分级打分,从而将图像信息转化为数据矩阵,然后使用多层感知机对数据矩阵进行打分模式的挖掘,从而清洗数据矩阵中存在的误差。该方法能够极大提高后续分类的准确性。基于上述目的,本发明至少提供如下技术方案:
一种基于多层感知机的乳腺肿瘤数据清洗方法,其包括以下步骤:
步骤S1、基于BI-RADS超声打分准则,对包含有乳腺肿瘤数据集的超声图片进行特征打分,构建包含有m个乳腺肿瘤超声图像样本的数据集,每个所述乳腺肿瘤超声图像样本包含n个乳腺肿瘤超声特征;
步骤S2、根据数据集中的乳腺肿瘤超声特征对所述超声图像样本给出良恶性标签,构建大小为m×(n+1)的乳腺肿瘤特征打分矩阵,其中,行数m为样本数,列数n+1为1列良恶性标签以及n列超声特征打分分值标签;
步骤S3、基于所述乳腺肿瘤特征打分矩阵,结合多层感知机修正所述打分矩阵中特征打分分值的误差:依次将所述打分矩阵中的每一列超声特征打分分值标签作为类别,良恶性标签列以及其余列超声特征打分分值标签作为特征,学习得到一个最优多层感知机,其中,对于当前类别,若最优的多层感知机拟合获得的结果与当前类别中的某个打分分值标签相差较大,则采用拟合的结果替换相差较大的打分分值标签,通过学习n个多层感知机对n个乳腺肿瘤特征打分矩阵进行拟合,获得修正的乳腺肿瘤特征打分矩阵。
进一步的,所述步骤S1中,所述n个乳腺肿瘤超声特征为25个乳腺肿瘤超声特征,从而将单张乳腺肿瘤超声图像转换为一个25维向量。
进一步的,所述步骤S3中,当最优多层感知机的准确率达到85%以上时,对此列超声特征打分分值标签中,超声特征打分分值与最优多层感知机给出的分值相差较大的分值进行替换;若最优多层感知机的准确率低于85%,表明该最优多层感知机对此列乳腺肿瘤超声特征打分规则学习的不充分或此列超声特征打分较为复杂,则对此列特征打分分值不进行处理;对于所述乳腺肿瘤特征打分矩阵中的每一列超声特征值,重复进行上述操作,从而完成对所述特征打分矩阵的清洗。
进一步的,所述多层感知机中,输出层节点激发函数为Relu。
一种基于多层感知机的乳腺肿瘤数据清洗系统,其包括:
打分模块,用于基于BI-RADS超声打分准则,对包含有乳腺肿瘤数据集的超声图片进行特征打分,构建包含有m个乳腺肿瘤超声图像样本的数据集,每个所述乳腺肿瘤超声图像样本包含n个乳腺肿瘤超声特征;
特征打分矩阵构建模块,用于根据数据集中的乳腺肿瘤超声特征对所述超声图像样本给出良恶性标签,构建大小为m×(n+1)的乳腺肿瘤特征打分矩阵,其中,行数m为样本数,列数n+1为1列良恶性标签以及n列超声特征打分分值标签;
数据清洗模块,用于基于所述乳腺肿瘤特征打分矩阵,结合多层感知机修正所述打分矩阵中特征打分分值的误差:依次将所述打分矩阵中的每一列超声特征打分分值标签作为类别,良恶性标签列以及其余列超声特征打分分值标签作为特征,学习得到一个最优多层感知机,其中,对于当前类别,若最优的多层感知机拟合获得的结果与当前类别中的某个打分分值标签相差较大,则采用拟合的结果替换相差较大的打分分值标签,通过学习n个多层感知机对n个乳腺肿瘤特征打分矩阵进行拟合,获得修正的乳腺肿瘤特征打分矩阵。
进一步的,所述打分模块中,所述n个乳腺肿瘤超声特征为25个乳腺肿瘤超声特征,从而将单张乳腺肿瘤超声图像转换为一个25维向量。
进一步的,所述数据清洗模块中,当最优多层感知机的准确率达到85%以上时,对此列超声特征打分分值标签中,超声特征打分分值与最优多层感知机给出的分值相差较大的分值进行替换;若最优多层感知机的准确率低于85%,表明该最优多层感知机对此列乳腺肿瘤超声特征打分规则学习的不充分或此列超声特征打分较为复杂,则对此列特征打分分值不进行处理;对于所述乳腺肿瘤特征打分矩阵中的每一列超声特征值,重复进行上述操作,从而完成对所述特征打分矩阵的清洗。
进一步的,所述多层感知机中,输出层节点激发函数为Relu。
相对于现有技术,本发明至少具有如下有益效果:
本发明的数据清洗方法基于BI-RADS超声打分准则构建乳腺肿瘤特征打分矩阵,采用多层感知机修正该打分矩阵中打分分值的误差,为后续乳腺肿瘤良恶性分类器的学习提供了准确的数据支撑,具有很高的实用性。
附图说明
图1是本发明数据清洗方法的流程示意图。
图2是本发明数据清洗方法中采用的三层感知机模型示意图。
图3是本发明实施例中采用的单棵决策树分类乳腺肿瘤良恶性简单示意图。
具体实施方式
接下来将结合本发明的附图对本发明实施例中的技术方案进行清楚、完整地描述,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的其它实施例,均属于本发明保护的范围。
下面结合附图1-3来对本发明做进一步详细的说明。本发明提供了一种基于多层感知机的乳腺肿瘤数据清洗方法,该方法包括以下步骤:
步骤S1、基于BI-RADS超声打分准则,对包含有乳腺肿瘤数据集的超声图片进行特征打分,构建包含有m个乳腺肿瘤超声图像样本的数据集,每个所述乳腺肿瘤超声图像样本包含n个乳腺肿瘤超声特征。
收集1488个乳腺肿瘤超声样本,其中包含良性肿瘤共401例,恶性肿瘤共1087例,25个乳腺肿瘤超声特征作为BI-RADS特征打分指标。选取超声样本中的1340例作为乳腺肿瘤分类数据中的训练数据集,剩余的148例为测试数据集。对着1488例乳腺肿瘤超声图像依据BI-RADS打分细则进行特征打分,以此获得这些超声图像的BI-RADS打分特征。打分准则见下表1。
表1
Figure BDA0002393476970000051
Figure BDA0002393476970000061
步骤S2、根据数据集中的乳腺肿瘤超声特征对所述超声图像样本给出良恶性标签,构建大小为m×(n+1)的乳腺肿瘤特征打分矩阵,其中,行数m为样本数,列数n+1为1列良恶性标签以及n列超声特征打分分值标签。
设打分所得数据矩阵为M,该实施例中,行数m为1488表示数据集中的样本序号,列数共26列,第一列为乳腺肿瘤的良恶性标签(良性样本表示为+1,恶性样本表示为-1),其余列为25个BI-RADS特征打分分值标签,因此所得数据矩阵大小为1488×26。表2是该实施例中涉及的乳腺肿瘤超声图像特征打分矩阵。
表2
Figure BDA0002393476970000062
步骤S3、基于所述乳腺肿瘤特征打分矩阵,结合多层感知机修正所述打分矩阵中特征打分分值的误差:依次将所述打分矩阵中的每一列超声特征打分分值标签作为类别,良恶性标签列以及其余列超声特征打分分值标签作为特征,学习得到一个最优多层感知机,其中,对于当前类别,若最优的多层感知机拟合获得的结果与当前类别中的某个打分分值标签相差较大,则采用拟合的结果替换相差较大的打分分值标签,通过学习n个多层感知机对n个乳腺肿瘤特征打分矩阵进行拟合,获得修正的乳腺肿瘤特征打分矩阵。
从数据矩阵M的第二列特征开始,将每一列评分特征作为标签,其余列(包含第一列良恶性结果列)作为特征,学习一个最优的多层感知机来进行打分规则的挖掘。最简单的三层感知机如图2所示。通过修改感知机中的神经元权值和偏置值的方法来使得网络的实际输出逐步靠近目标输出。其中,针对每列特征,设置多层感知机的隐藏层神经元数目为100,隐藏层数分别为:1、2、3、4、5、6,最大迭代次数分别为:100、200、500,输出层节点激发函数为Relu,学习率分别为:0.1、0.01、0.001、0.0001,进行多个感知机的学习,然后挑选出其中准确率最高的多层感知机作为最优多层感知机,来对此列特征进行误差清洗。由于数据矩阵大小为1488×26,学习出的分级打分规则不宜过于复杂,因此本发明中的参数设置均为较小合理值。当最优多层感知机的准确率达到85%以上,则对此列特征中打分分值与感知机给出的分类值相差较大的数值进行替换;若最优多层感知机的准确率低于85%,表明对此列乳腺肿瘤特征打分规则学习的不充分或此列特征打分较为复杂,则对此列特征不进行处理。对于数据矩阵中的每一列超声特征值,重复进行上述操作,从而完成对数据矩阵的清洗。
针对上述数据清洗方法,本发明还提供了一种基于多层感知机的乳腺肿瘤数据清洗系统,其包括:
打分模块,用于基于BI-RADS超声打分准则,对包含有乳腺肿瘤数据集的超声图片进行特征打分,构建包含有m个乳腺肿瘤超声图像样本的数据集,每个所述乳腺肿瘤超声图像样本包含n个乳腺肿瘤超声特征;
特征打分矩阵构建模块,用于根据数据集中的乳腺肿瘤超声特征对所述超声图像样本给出良恶性标签,构建大小为m×(n+1)的乳腺肿瘤特征打分矩阵,其中,行数m为样本数,列数n+1为1列良恶性标签以及n列超声特征打分分值标签;
数据清洗模块,用于基于乳腺肿瘤特征打分矩阵,结合多层感知机修正打分矩阵中特征打分分值的误差:依次将打分矩阵中的每一列超声特征打分分值标签作为类别,良恶性标签列以及其余列超声特征打分分值标签作为特征,学习得到一个最优多层感知机,其中,对于当前类别,若最优的多层感知机拟合获得的结果与当前类别中的某个打分分值标签相差较大,则采用拟合的结果替换相差较大的打分分值标签,通过学习n个多层感知机对n个乳腺肿瘤特征打分矩阵进行拟合,获得修正的乳腺肿瘤特征打分矩阵。
该打分模块中,n个乳腺肿瘤超声特征为25个乳腺肿瘤超声特征,从而将单张乳腺肿瘤超声图像转换为一个25维向量。该数据清洗模块中,当最优多层感知机的准确率达到85%以上时,对此列超声特征打分分值标签中,超声特征打分分值与最优多层感知机给出的分值相差较大的分值进行替换;若最优多层感知机的准确率低于85%,表明该最优多层感知机对此列乳腺肿瘤超声特征打分规则学习的不充分或此列超声特征打分较为复杂,则对此列特征打分分值不进行处理;对于所述乳腺肿瘤特征打分矩阵中的每一列超声特征值,重复进行上述操作,从而完成对所述特征打分矩阵的清洗。该多层感知机中,输出层几点激发函数为Relu。
在此,采用随机森林对清洗后的数据矩阵进行分类,以验证本发明的数据清洗方法的有效性。采用随机森林对清洗前及清洗后的数据矩阵进行分类,即采用n棵决策树进行分类学习,然后将得到的n个分类结果用简单投票法得到最终分类结果。单棵决策树分类乳腺肿瘤简单示意图如图3所示。决策树构建的核心在于最佳划分θ的选择,此处使用基尼指数作为树节点纯度的度量标准,其定义式如下所示:
Figure BDA0002393476970000091
其中,k表示节点内类别总数,Nm是节点m内样本的总数,
Figure BDA0002393476970000092
是节点m内属于类别Ci的样本总数。因此可以定义节点m处的数据集依照θ划分后的不纯度G(Dm,θ),其计算公式如下:
Figure BDA0002393476970000093
其中nlefy与nrigt分别代表依照θ划分后,节点m的左子节点和右子节点内样本的数量,Dl和Dr分别代表划分后Dm的左子集与右子集。当前节点m的最佳划分即为使得G(Dm,θ)值最小的划分方式,通过遍历未使用过的特征和特征值,找到最优划分。
随机森林的参数设置中,需要调整的参数为:决策树个数,特征属性个数和递归次数(决策树深度)。此处,决策树个数经验设置为1000,特征属性个数为BI-RADS打分细则中的特征个数25,递归停止条件为决策树会扩展节点直至所有叶子纯净,或所有叶子包含少于2的样本。通过以上步骤,可以得到清洗前及清洗后的分类器。
比较清洗前后分类器性能。对于测试数据集(数据集样本大小为148个乳腺肿瘤超声图像样本),先对测试集中的样本进行特征打分,然后分别采用上述构建的随机森林分类器得到测试集分类结果,以及采用本发明的数据清洗方法对数据进行修正,并采用上述构建的随机森林分类器对修正后的数据进行测试集分类,两种方法的分类结果对照见表3。
表3
方法 准确度 敏感度 特异度 PPV NPV
清洗前 94.96% 93.75% 95.41% 88.23% 88.23%
清洗后 98.99% 97.67% 99.52% 98.82% 98.82%
所采用的的性能度量指标为准确度,特异度,敏感度,PPV和NPV,从指标对比中可以看出,本发明提出的数据清洗方法可以很好的清洗乳腺肿瘤超声图像打分数据中所包含的误差,能够使后续的分类结果更准确。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (8)

1.一种基于多层感知机的乳腺肿瘤数据清洗方法,其特征在于,其包括以下步骤:
步骤S1、基于BI-RADS超声打分准则,对包含有乳腺肿瘤数据集的超声图片进行特征打分,构建包含有m个乳腺肿瘤超声图像样本的数据集,每个所述乳腺肿瘤超声图像样本包含n个乳腺肿瘤超声特征;
步骤S2、根据数据集中的乳腺肿瘤超声特征对所述超声图像样本给出良恶性标签,构建大小为m×(n+1)的乳腺肿瘤特征打分矩阵,其中,行数m为样本数,列数n+1为1列良恶性标签以及n列超声特征打分分值标签;
步骤S3、基于所述乳腺肿瘤特征打分矩阵,结合多层感知机修正所述打分矩阵中特征打分分值的误差:依次将所述打分矩阵中的每一列超声特征打分分值标签作为类别,良恶性标签列以及其余列超声特征打分分值标签作为特征,学习得到一个最优多层感知机,其中,对于当前类别,若最优的多层感知机拟合获得的结果与当前类别中的某个打分分值标签相差较大,则采用拟合的结果替换相差较大的打分分值标签,通过学习n个多层感知机对n个乳腺肿瘤特征打分矩阵进行拟合,获得修正的乳腺肿瘤特征打分矩阵。
2.根据权利要求1的所述数据清洗方法,其特征在于,所述步骤S1中,所述n个乳腺肿瘤超声特征为25个乳腺肿瘤超声特征,从而将单张乳腺肿瘤超声图像转换为一个25维向量。
3.根据权利要求1的所述数据清洗方法,其特征在于,所述步骤S3中,当最优多层感知机的准确率达到85%以上时,对此列超声特征打分分值标签中,超声特征打分分值与最优多层感知机给出的分值相差较大的分值进行替换;若最优多层感知机的准确率低于85%,表明该最优多层感知机对此列乳腺肿瘤超声特征打分规则学习的不充分或此列超声特征打分较为复杂,则对此列特征打分分值不进行处理;对于所述乳腺肿瘤特征打分矩阵中的每一列超声特征值,重复进行上述操作,从而完成对所述特征打分矩阵的清洗。
4.根据权利要求1的所述数据清洗方法,其特征在于,所述多层感知机中,输出层节点激发函数为Relu。
5.一种基于多层感知机的乳腺肿瘤数据清洗系统,其特征在于,其包括:
打分模块,用于基于BI-RADS超声打分准则,对包含有乳腺肿瘤数据集的超声图片进行特征打分,构建包含有m个乳腺肿瘤超声图像样本的数据集,每个所述乳腺肿瘤超声图像样本包含n个乳腺肿瘤超声特征;
特征打分矩阵构建模块,用于根据数据集中的乳腺肿瘤超声特征对所述超声图像样本给出良恶性标签,构建大小为m×(n+1)的乳腺肿瘤特征打分矩阵,其中,行数m为样本数,列数n+1为1列良恶性标签以及n列超声特征打分分值标签;
数据清洗模块,用于基于所述乳腺肿瘤特征打分矩阵,结合多层感知机修正所述打分矩阵中特征打分分值的误差:依次将所述打分矩阵中的每一列超声特征打分分值标签作为类别,良恶性标签列以及其余列超声特征打分分值标签作为特征,学习得到一个最优多层感知机,其中,对于当前类别,若最优的多层感知机拟合获得的结果与当前类别中的某个打分分值标签相差较大,则采用拟合的结果替换相差较大的打分分值标签,通过学习n个多层感知机对n个乳腺肿瘤特征打分矩阵进行拟合,获得修正的乳腺肿瘤特征打分矩阵。
6.根据权利要求5的所述数据清洗方法,其特征在于,所述打分模块中,所述n个乳腺肿瘤超声特征为25个乳腺肿瘤超声特征,从而将单张乳腺肿瘤超声图像转换为一个25维向量。
7.根据权利要求5的所述数据清洗方法,其特征在于,所述数据清洗模块中,当最优多层感知机的准确率达到85%以上时,对此列超声特征打分分值标签中,超声特征打分分值与最优多层感知机给出的分值相差较大的分值进行替换;若最优多层感知机的准确率低于85%,表明该最优多层感知机对此列乳腺肿瘤超声特征打分规则学习的不充分或此列超声特征打分较为复杂,则对此列特征打分分值不进行处理;对于所述乳腺肿瘤特征打分矩阵中的每一列超声特征值,重复进行上述操作,从而完成对所述特征打分矩阵的清洗。
8.根据权利要求5的所述数据清洗方法,其特征在于,所述多层感知机中,输出层节点激发函数为Relu。
CN202010122736.1A 2020-02-27 2020-02-27 一种基于多层感知机的乳腺肿瘤数据清洗方法 Active CN111402205B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010122736.1A CN111402205B (zh) 2020-02-27 2020-02-27 一种基于多层感知机的乳腺肿瘤数据清洗方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010122736.1A CN111402205B (zh) 2020-02-27 2020-02-27 一种基于多层感知机的乳腺肿瘤数据清洗方法

Publications (2)

Publication Number Publication Date
CN111402205A true CN111402205A (zh) 2020-07-10
CN111402205B CN111402205B (zh) 2023-06-23

Family

ID=71432117

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010122736.1A Active CN111402205B (zh) 2020-02-27 2020-02-27 一种基于多层感知机的乳腺肿瘤数据清洗方法

Country Status (1)

Country Link
CN (1) CN111402205B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348106A (zh) * 2020-11-18 2021-02-09 电子科技大学 一种基于关键点学习的乳腺超声影像分类方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106137259A (zh) * 2016-06-24 2016-11-23 华南理工大学 基于人工打分的超声肿瘤特征获取方法
CN106778830A (zh) * 2016-06-30 2017-05-31 华南理工大学 基于双聚类挖掘及AdaBoost的肿瘤分类方法
CN107748889A (zh) * 2017-10-16 2018-03-02 高东平 一种乳腺肿瘤超声图像自动分类方法
CN107908621A (zh) * 2017-11-16 2018-04-13 东华大学 基于超声检查报告文本数据的乳腺肿瘤风险性评估系统
CN110401649A (zh) * 2019-07-17 2019-11-01 湖北央中巨石信息技术有限公司 基于态势感知学习的信息安全风险评估方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106137259A (zh) * 2016-06-24 2016-11-23 华南理工大学 基于人工打分的超声肿瘤特征获取方法
CN106778830A (zh) * 2016-06-30 2017-05-31 华南理工大学 基于双聚类挖掘及AdaBoost的肿瘤分类方法
CN107748889A (zh) * 2017-10-16 2018-03-02 高东平 一种乳腺肿瘤超声图像自动分类方法
CN107908621A (zh) * 2017-11-16 2018-04-13 东华大学 基于超声检查报告文本数据的乳腺肿瘤风险性评估系统
CN110401649A (zh) * 2019-07-17 2019-11-01 湖北央中巨石信息技术有限公司 基于态势感知学习的信息安全风险评估方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348106A (zh) * 2020-11-18 2021-02-09 电子科技大学 一种基于关键点学习的乳腺超声影像分类方法
CN112348106B (zh) * 2020-11-18 2022-06-28 电子科技大学 一种基于关键点学习的乳腺超声影像分类方法

Also Published As

Publication number Publication date
CN111402205B (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN113378632B (zh) 一种基于伪标签优化的无监督域适应行人重识别方法
CN107506793B (zh) 基于弱标注图像的服装识别方法及系统
CN107515877A (zh) 敏感主题词集的生成方法和装置
CN109063719B (zh) 一种联合结构相似性和类信息的图像分类方法
CN113535974B (zh) 诊断推荐方法及相关装置、电子设备、存储介质
CN109815967A (zh) 基于特征融合的cnn舰船目标识别系统及方法
CN110097096B (zh) 一种基于tf-idf矩阵和胶囊网络的文本分类方法
Althubiti et al. Ensemble learning framework with GLCM texture extraction for early detection of lung cancer on CT images
CN107305691A (zh) 基于图像匹配的前景分割方法及装置
CN112800249A (zh) 基于生成对抗网络的细粒度跨媒体检索方法
Lagunas et al. Transfer learning for illustration classification
CN111932540B (zh) 一种针对新冠肺炎临床分型的ct影像对比特征学习方法
Li et al. Co-saliency detection based on hierarchical consistency
CN114091603A (zh) 一种空间转录组细胞聚类、分析方法
CN110349170A (zh) 一种全连接crf级联fcn和k均值脑肿瘤分割算法
CN115358337A (zh) 一种小样本故障诊断方法、装置及存储介质
CN110136113B (zh) 一种基于卷积神经网络的阴道病理图像分类方法
CN109740669B (zh) 一种基于深度特征聚合的乳腺癌病理图像分类方法
Naiemi et al. Scene text detection using enhanced extremal region and convolutional neural network
CN111402205B (zh) 一种基于多层感知机的乳腺肿瘤数据清洗方法
Li et al. High-Order Correlation-Guided Slide-Level Histology Retrieval With Self-Supervised Hashing
CN112861881A (zh) 一种基于改进MobileNet模型的蜂窝肺识别方法
Javed et al. Deep multiresolution cellular communities for semantic segmentation of multi-gigapixel histology images
CN110472088B (zh) 一种基于草图的图像检索方法
Qiu et al. Scratch Each Other's Back: Incomplete Multi-Modal Brain Tumor Segmentation via Category Aware Group Self-Support Learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant