CN111292291B - 一种基于pca或m波段小波域的癌症ct图像判断装置 - Google Patents

一种基于pca或m波段小波域的癌症ct图像判断装置 Download PDF

Info

Publication number
CN111292291B
CN111292291B CN202010042305.4A CN202010042305A CN111292291B CN 111292291 B CN111292291 B CN 111292291B CN 202010042305 A CN202010042305 A CN 202010042305A CN 111292291 B CN111292291 B CN 111292291B
Authority
CN
China
Prior art keywords
image
wavelet
data
pca
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010042305.4A
Other languages
English (en)
Other versions
CN111292291A (zh
Inventor
李东航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202010042305.4A priority Critical patent/CN111292291B/zh
Publication of CN111292291A publication Critical patent/CN111292291A/zh
Application granted granted Critical
Publication of CN111292291B publication Critical patent/CN111292291B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明公开一种基于PCA或M波段小波域的癌症CT图像判断装置;所述数据集包括结构数据集和非结构数据集;数据处理装置对图像进行预处理并提取相关的功能,来降低原始图像数据集的维度;预处理过程中针对非结构数据集进行小波变换,让图片的特征更清晰更便于识别;特征集选择装置,用于从处理后的数据集中选择出特征子集;判断装置,用于识别待测图像为良性还是恶性。本方案降低了数据维数,降低了数据处理的难度,使得癌细胞的识别准确率大大提高。

Description

一种基于PCA或M波段小波域的癌症CT图像判断装置
技术领域
本发明涉及图像判断领域,特别是涉及一种基于PCA或M波段小波域的癌症CT图像判断装置。
背景技术
乳腺癌是所有癌症中最常见的类型,通常被称为“女性健康杀手”是发病率最高的癌症,早期乳腺癌通常没有典型的症状或体征。癌症在社会上确实是一个严重的疾病,难以治愈。因此,早期发现和诊断癌症是可以挽救数百万人的生命,传统上,我们的医生会依据他的经验主观判断,因此在诊断中经常发生人为错误。
随着信息技术的不断进步,计算机图像处理技术已经取得了非常重要的发展。它已应用于人类生活和社会发展的各个方面。细胞生物医学领域的研究越来越多地将计算机视觉技术用于医学图像。而现有技术中对癌细胞图像图像的识别准确率低,无法准确对癌细胞进行早期识别判断。
发明内容
本发明的目的是提供一种基于PCA或M波段小波域的癌症CT图像判断装置,以解决上述现有技术存在的问题。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于PCA或M波段小波域的癌症CT图像处判断置,包括
所述数据集包括结构数据集和非结构数据集;
数据处理装置,对图像进行预处理并提取相关的特征,来降低原始图像数据的维度;预处理过程中针对非结构数据进行小波变换;
特征集选择装置,用于从处理后的数据中选择出特征子集;
判断装置,用于识别待测图像为良性还是恶性。
优选地,所述预处理过程中包括主成分分析法PCA。
优选地,所述非结构数据集包括原始颜色图像和灰度图像,根据图像的尺寸构建小波变换矩阵。
优选地,所述小波变换的过程为:使用M波段小波将图像数据集转换为小波域,然后为每个图像创建小波本;再使用图像转换对小波本进行扩充然后分为训练集与测试集;
优选地,小波变换后,针对于所述灰度图像包含原始图像的近似值,然后将切出的部分保存到新的数据批次中。
优选地,所述原始颜色图像进行小波变换后进行剪切,剪切出相似部分并进行保留,相似度大于0.9时,判定为相似部分;并合成由两个通道处理的图像并将其保存在数据批次,所述二通道为原始颜色图像、灰度图像。
优选地,所述特征子集包括细胞核、细胞质、核仁、有丝分裂。
本发明公开了以下技术效果:本发明对采集的图像分别对结构数据集和非结构数据集进行预处理,降低原始图像数据集的维度,减小了计算量,对非结构数据集的图像采用了M带小波对图片进行预处理而且优化了神经网络模型,让图片的特征更清晰更便于识别,从而提高了检测精度。
具体实施方式
基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合具体实施方式对本发明作进一步详细的说明。
本发明提供一种基于PCA或M波段小波域的癌症CT图像判断装置,包括数据处理装置,对图像进行预处理并提取相关的功能,来降低原始图像数据集的维度;预处理过程中针对非结构数据集进行小波变换;特征集选择装置,用于从处理后的数据集中选择出特征子集;判断装置,用于识别待测图像为良性还是恶性。
识别的图像分为结构数据和非结构数据集,其中结构数据集使用了著名的乳腺癌-威斯康星州数据集,共计683样本,数据集有11列,有1个样本代号,1个标签和9个特征。原始数据的标签表示为2和4,其中2为良性,4为恶性的。9个特征是:丛集厚度,像元大小的均匀性,均匀性形状,边缘黏附,单个上皮细胞大小,裸核,乏味染色质,正常核仁和有丝分裂;非结构数据集是BreakHist数据集,包含753钙化病例和891个例。质量数据集包括2386良性图像,5429个恶性图像和100x、40x、200x、400x.使用了图像扩充以将数据量增加到60000张图像。
TP率:正确率,TP:真实值和通过机器测试的样本相同,全部为正;
FP率:误报率,FP:对真实值和机器测试值进行样本不同,正确是负数,检验是正数;
F-Measure:加权谐波平均值的精度和调用率:α是一个常数。通常情况下,让α=1。
MCC:马修斯相关系数:MCC是一个非常全面的参数。MCC值在[-1,1]中。它的值越大,该算法的效果越好。TN是负数,表示样本的真实性和机器测试均相同,则为负数;FN为负数,是指指标和机器测试不同的样本;
ROC:即TPR和FPR。曲线下面积通常称为AUC,它越大该算法就具有更好的效果。
实验
一、首先采用主成分分析PCA对结构性数据进行预处理,再使用FSS选出特征子集,然后对特征子集进行标准化处理,最后使用支持向量机SVM上述数据进行训练,即可分析待检测指标是否为良性。
结构化数据,乳腺癌-威斯康星州:PCA减少9个特征到8个特征,FSS减少8个特征子集转换为4个特征子集。SVM的超参数如下。
使用10倍交叉验证。
二、首先采用主成分分析PCA对结构性数据进行预处理,再使用FSS选出特征子集,然后对特征子集进行标准化处理,并采用随机森林模型RF对上述数据进行训练,即可分析待检测指标是否为良性。
结构化数据,乳腺癌-威斯康星州:PCA和FSS的工作与上述相同,RF的超参数如下表。
尺寸 批次大小 最大深度 NU 百分比 种子
80 100 100 2 5 1
三、首先采用主成分分析PCA对结构性数据进行预处理,再使用FSS选出特征子集,然后对特征子集进行标准化处理,最后采用朴素贝叶斯模型NB对上述数据进行训练,即可分析待检测指标是否为良性。
结构化数据,乳腺癌-威斯康星州:PCA和FSS的工作与上述相同,NB的超参数如下:
批次大小 保留小数位数
60,80,100,120 2
分类 TPR FPR P R F MCC AUC
权重 0.950 0.030 0.956 0.950 0.951 0.901 0.977
四、从结构化数据,乳腺癌-威斯康星州:中使用FSS选出特征子集,然后对特征子集进行标准化处理,最后采用人工神经网络模型ANN对上述数据进行训练,分析待检测指标是否为良性。
结构化数据,乳腺癌-威斯康星州:FSS将9个特征缩减为8个特征,ANN的超参数如下。
批次大小 隐藏层 动势 保留小数位数 种子
100 A 0.2 2 0
训练时间 TPR FPR P R F MCC AUC
100 0.967 0.035 0.967 0.967 0.967 0.928 0.995
200 0.961 0.042 0.962 0.961 0.691 0.915 0.995
300 0.961 0.042 0.962 0.961 0.691 0.915 0.994
400 0.963 0.039 0.963 0.963 0.963 0.918 0.944
500 0.963 0.039 0.963 0.963 0.963 0.918 0.993
600 0.963 0.039 0.963 0.963 0.963 0.918 0.993
700 0.964 0.039 0.964 0.964 0.964 0.921 0.933
800 0.964 0.039 0.964 0.964 0.964 0.921 0.933
900 0.963 0.041 0.963 0.963 0.963 0.918 0.921
1000 0.966 0.036 0.966 0.96 0.966 0.925 0.921
五、对非结构性数据集进行小波变换Wavelet处理后,采用卷积神经网络模型CNN对上述数据进行训练,即可分析待检测图像是否为良性。
由此可见,结构数据集对于SVM,可以注意到当使用内核函数时,线性具有最大召回作用的内核是径向基函数内核,然后是多项式内核,最后是Sigmoid内核,此时的最佳准确率为97.0%。然后,对于随机森林,批次大小,最大深度,执行时隙数和其他参数通过实验证明没有任何显着与准确率的相关性,迭代次数除外。虽然在100到300时准确率较低,但是准确率也随时波动。最高的准确率为97.6%。接下来,对于NB,可以注意到批次大小,但实验表明此参数没有太大的相关性,这意味着批量大小的值不会影响准确率。最后,对于ANN,在参数学习率的基础上,当学习率约为0.05和0.4,此处的最佳回忆率为96.3%。对于其他与表现高度相关的参数是训练时间效果大约在100和1000之间。最佳召回率为96.7%。该算法的召回率如下所示。可以看出随机森林算法获得了最佳召回率,SVM和ANN具有相似的召回值,而NB的召回率较低。
本发明采用了M波段小波变换和PCA将数据变换到相应的域以减少原始数据集的大小并提取之前最重要的功能对其应用ML和CNN,从而提高了癌症诊断的准确性实现。为了分析结构数据,应用的基于PCA的ML算法获得的准确率高达97.6%。对于非结构数据集,首先使用M波段小波变换创建小波本(张量),然后进给这些小波张量导入到初始VGG19 CNN模型中进行培训和测试。这样,分解图像进入不同的频率,以便提取更重要的特征因此学会了取得更好的结果。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。

Claims (4)

1.一种基于PCA或M波段小波域的癌症CT图像判断装置,其特征在于:包括数据处理装置,对图像进行预处理并提取相关的功能,来降低原始图像数据集的维度;预处理过程中针对非结构数据集进行小波变换,利用PCA对结构性数据进行预处理;
特征集选择装置,用于从处理后的数据集中选择出特征子集;
判断装置,用于识别待测图像为良性还是恶性;
所述非结构数据集包括原始颜色图像和灰度图像,根据图像的尺寸构建小波变换矩阵;
所述小波变换的过程为:使用M波段小波将图像数据集转换为小波域,然后为每个图像创建小波本;再对小波本进行扩充然后分为训练集与测试集。
2.根据权利要求1所述的基于PCA或M波段小波域的癌症CT图像判断装置,其特征在于:小波变换后,针对于所述灰度图像包含原始图像的近似值,然后将切出部分的转换矩阵并保存到新的数据批次中。
3.根据权利要求1所述的基于PCA或M波段小波域的癌症CT图像判断装置,其特征在于:所述原始颜色图像进行小波变换后进行剪切,剪切出相似部分并进行保留,相似度大于0.9时,判定为相似部分;并合成由二个通道处理的图像并将其保存在数据批次,所述二个通道为原始颜色图像、灰度图像。
4.根据权利要求1所述的基于PCA或M波段小波域的癌症CT图像判断装置,其特征在于:所述特征子集包括细胞核、细胞质、核仁、有丝分裂。
CN202010042305.4A 2020-01-15 2020-01-15 一种基于pca或m波段小波域的癌症ct图像判断装置 Active CN111292291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010042305.4A CN111292291B (zh) 2020-01-15 2020-01-15 一种基于pca或m波段小波域的癌症ct图像判断装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010042305.4A CN111292291B (zh) 2020-01-15 2020-01-15 一种基于pca或m波段小波域的癌症ct图像判断装置

Publications (2)

Publication Number Publication Date
CN111292291A CN111292291A (zh) 2020-06-16
CN111292291B true CN111292291B (zh) 2024-02-02

Family

ID=71025446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010042305.4A Active CN111292291B (zh) 2020-01-15 2020-01-15 一种基于pca或m波段小波域的癌症ct图像判断装置

Country Status (1)

Country Link
CN (1) CN111292291B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1623091A (zh) * 2000-11-16 2005-06-01 赛弗根生物系统股份有限公司 质谱分析方法
CN104143101A (zh) * 2014-07-01 2014-11-12 华南理工大学 一种基于超声图像的乳腺肿瘤区域自动识别方法
CN108427966A (zh) * 2018-03-12 2018-08-21 成都信息工程大学 一种基于pca-lda的医学图像处理系统及方法
CN109978880A (zh) * 2019-04-08 2019-07-05 哈尔滨理工大学 采用高维特征选择对肺部肿瘤ct图像进行判别的方法
CN110033417A (zh) * 2019-04-12 2019-07-19 江西财经大学 一种基于深度学习的图像增强方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8280132B2 (en) * 2006-08-01 2012-10-02 Rutgers, The State University Of New Jersey Malignancy diagnosis using content-based image retreival of tissue histopathology

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1623091A (zh) * 2000-11-16 2005-06-01 赛弗根生物系统股份有限公司 质谱分析方法
CN104143101A (zh) * 2014-07-01 2014-11-12 华南理工大学 一种基于超声图像的乳腺肿瘤区域自动识别方法
CN108427966A (zh) * 2018-03-12 2018-08-21 成都信息工程大学 一种基于pca-lda的医学图像处理系统及方法
CN109978880A (zh) * 2019-04-08 2019-07-05 哈尔滨理工大学 采用高维特征选择对肺部肿瘤ct图像进行判别的方法
CN110033417A (zh) * 2019-04-12 2019-07-19 江西财经大学 一种基于深度学习的图像增强方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡哲元 等.基于M 带小波变换多重分形的胰腺内镜超声图像分类.中国生物医学工程学报.2009,第28卷(第3期),第2.2节. *

Also Published As

Publication number Publication date
CN111292291A (zh) 2020-06-16

Similar Documents

Publication Publication Date Title
Nanni et al. Survey on LBP based texture descriptors for image classification
CN111598003B (zh) 一种面向癫痫患者脑电信号的时频图像分类方法
Vij et al. A novel deep transfer learning based computerized diagnostic Systems for Multi-class imbalanced diabetic retinopathy severity classification
Usman et al. Intelligent automated detection of microaneurysms in fundus images using feature-set tuning
CN112233742B (zh) 一种基于聚类的病历文档分类系统、设备、存储介质
Bose et al. Detection of microcalcification in mammograms using soft computing techniques
Sreejini et al. Retrieval of pathological retina images using Bag of Visual Words and pLSA model
Liu et al. Fabric defect detection based on sparse representation of main local binary pattern
Derwin et al. Discrimination of microaneurysm in color retinal images using texture descriptors
Thapa et al. Deep learning for breast cancer classification: Enhanced tangent function
CN111292291B (zh) 一种基于pca或m波段小波域的癌症ct图像判断装置
Rozendo et al. Classification of non-Hodgkin lymphomas based on sample entropy signatures
Wei et al. Multi-feature fusion for ultrasound breast image classification of benign and malignant
CN112614096A (zh) 一种基于序数回归的乳腺钼靶病灶良恶性分析方法
Torrent et al. A supervised micro-calcification detection approach in digitised mammograms
CN103902997B (zh) 用于生物细胞显微镜图像分类的特征子空间集成方法
Selvathi et al. Performance evaluation of kernel based techniques for brain MRI data classification
Akyol et al. Assessing the importance of features for detection of hard exudates in retinal images
CN117173485B (zh) 一种肺癌组织病理图像的智能分类系统方法及系统
Xie et al. A multi-class support vector data description approach for classification of medical image
Zhao et al. Breast tumors multi-classification study based on histopathological images with radiomics approach
Reddy et al. Brain Tumor Segmentation and Classification in MRI Images Using Deep Learning Techniques
Zhang et al. Small Target Recognition Using Dynamic Time Warping and Visual Attention
Jing et al. Case-adaptive classification based on image retrieval for computer-aided diagnosis
CN115601356B (zh) 基于稀疏卷积自编码的多发性硬化病灶识别方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant