CN111292291B - 一种基于pca或m波段小波域的癌症ct图像判断装置 - Google Patents
一种基于pca或m波段小波域的癌症ct图像判断装置 Download PDFInfo
- Publication number
- CN111292291B CN111292291B CN202010042305.4A CN202010042305A CN111292291B CN 111292291 B CN111292291 B CN 111292291B CN 202010042305 A CN202010042305 A CN 202010042305A CN 111292291 B CN111292291 B CN 111292291B
- Authority
- CN
- China
- Prior art keywords
- image
- wavelet
- data
- pca
- cancer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 19
- 201000011510 cancer Diseases 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 17
- 230000009466 transformation Effects 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000000034 method Methods 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims abstract description 6
- 230000003211 malignant effect Effects 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000011278 mitosis Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 210000000805 cytoplasm Anatomy 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 239000000284 extract Substances 0.000 abstract description 2
- 206010006187 Breast cancer Diseases 0.000 description 8
- 208000026310 Breast neoplasm Diseases 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000003745 diagnosis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000007637 random forest analysis Methods 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000002308 calcification Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000001550 time effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Radiology & Medical Imaging (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明公开一种基于PCA或M波段小波域的癌症CT图像判断装置;所述数据集包括结构数据集和非结构数据集;数据处理装置对图像进行预处理并提取相关的功能,来降低原始图像数据集的维度;预处理过程中针对非结构数据集进行小波变换,让图片的特征更清晰更便于识别;特征集选择装置,用于从处理后的数据集中选择出特征子集;判断装置,用于识别待测图像为良性还是恶性。本方案降低了数据维数,降低了数据处理的难度,使得癌细胞的识别准确率大大提高。
Description
技术领域
本发明涉及图像判断领域,特别是涉及一种基于PCA或M波段小波域的癌症CT图像判断装置。
背景技术
乳腺癌是所有癌症中最常见的类型,通常被称为“女性健康杀手”是发病率最高的癌症,早期乳腺癌通常没有典型的症状或体征。癌症在社会上确实是一个严重的疾病,难以治愈。因此,早期发现和诊断癌症是可以挽救数百万人的生命,传统上,我们的医生会依据他的经验主观判断,因此在诊断中经常发生人为错误。
随着信息技术的不断进步,计算机图像处理技术已经取得了非常重要的发展。它已应用于人类生活和社会发展的各个方面。细胞生物医学领域的研究越来越多地将计算机视觉技术用于医学图像。而现有技术中对癌细胞图像图像的识别准确率低,无法准确对癌细胞进行早期识别判断。
发明内容
本发明的目的是提供一种基于PCA或M波段小波域的癌症CT图像判断装置,以解决上述现有技术存在的问题。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于PCA或M波段小波域的癌症CT图像处判断置,包括
所述数据集包括结构数据集和非结构数据集;
数据处理装置,对图像进行预处理并提取相关的特征,来降低原始图像数据的维度;预处理过程中针对非结构数据进行小波变换;
特征集选择装置,用于从处理后的数据中选择出特征子集;
判断装置,用于识别待测图像为良性还是恶性。
优选地,所述预处理过程中包括主成分分析法PCA。
优选地,所述非结构数据集包括原始颜色图像和灰度图像,根据图像的尺寸构建小波变换矩阵。
优选地,所述小波变换的过程为:使用M波段小波将图像数据集转换为小波域,然后为每个图像创建小波本;再使用图像转换对小波本进行扩充然后分为训练集与测试集;
优选地,小波变换后,针对于所述灰度图像包含原始图像的近似值,然后将切出的部分保存到新的数据批次中。
优选地,所述原始颜色图像进行小波变换后进行剪切,剪切出相似部分并进行保留,相似度大于0.9时,判定为相似部分;并合成由两个通道处理的图像并将其保存在数据批次,所述二通道为原始颜色图像、灰度图像。
优选地,所述特征子集包括细胞核、细胞质、核仁、有丝分裂。
本发明公开了以下技术效果:本发明对采集的图像分别对结构数据集和非结构数据集进行预处理,降低原始图像数据集的维度,减小了计算量,对非结构数据集的图像采用了M带小波对图片进行预处理而且优化了神经网络模型,让图片的特征更清晰更便于识别,从而提高了检测精度。
具体实施方式
基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合具体实施方式对本发明作进一步详细的说明。
本发明提供一种基于PCA或M波段小波域的癌症CT图像判断装置,包括数据处理装置,对图像进行预处理并提取相关的功能,来降低原始图像数据集的维度;预处理过程中针对非结构数据集进行小波变换;特征集选择装置,用于从处理后的数据集中选择出特征子集;判断装置,用于识别待测图像为良性还是恶性。
识别的图像分为结构数据和非结构数据集,其中结构数据集使用了著名的乳腺癌-威斯康星州数据集,共计683样本,数据集有11列,有1个样本代号,1个标签和9个特征。原始数据的标签表示为2和4,其中2为良性,4为恶性的。9个特征是:丛集厚度,像元大小的均匀性,均匀性形状,边缘黏附,单个上皮细胞大小,裸核,乏味染色质,正常核仁和有丝分裂;非结构数据集是BreakHist数据集,包含753钙化病例和891个例。质量数据集包括2386良性图像,5429个恶性图像和100x、40x、200x、400x.使用了图像扩充以将数据量增加到60000张图像。
TP率:正确率,TP:真实值和通过机器测试的样本相同,全部为正;
FP率:误报率,FP:对真实值和机器测试值进行样本不同,正确是负数,检验是正数;
F-Measure:加权谐波平均值的精度和调用率:α是一个常数。通常情况下,让α=1。
MCC:马修斯相关系数:MCC是一个非常全面的参数。MCC值在[-1,1]中。它的值越大,该算法的效果越好。TN是负数,表示样本的真实性和机器测试均相同,则为负数;FN为负数,是指指标和机器测试不同的样本;
ROC:即TPR和FPR。曲线下面积通常称为AUC,它越大该算法就具有更好的效果。
实验
一、首先采用主成分分析PCA对结构性数据进行预处理,再使用FSS选出特征子集,然后对特征子集进行标准化处理,最后使用支持向量机SVM上述数据进行训练,即可分析待检测指标是否为良性。
结构化数据,乳腺癌-威斯康星州:PCA减少9个特征到8个特征,FSS减少8个特征子集转换为4个特征子集。SVM的超参数如下。
使用10倍交叉验证。
二、首先采用主成分分析PCA对结构性数据进行预处理,再使用FSS选出特征子集,然后对特征子集进行标准化处理,并采用随机森林模型RF对上述数据进行训练,即可分析待检测指标是否为良性。
结构化数据,乳腺癌-威斯康星州:PCA和FSS的工作与上述相同,RF的超参数如下表。
尺寸 | 批次大小 | 最大深度 | NU | 百分比 | 种子 |
80 | 100 | 100 | 2 | 5 | 1 |
三、首先采用主成分分析PCA对结构性数据进行预处理,再使用FSS选出特征子集,然后对特征子集进行标准化处理,最后采用朴素贝叶斯模型NB对上述数据进行训练,即可分析待检测指标是否为良性。
结构化数据,乳腺癌-威斯康星州:PCA和FSS的工作与上述相同,NB的超参数如下:
批次大小 | 保留小数位数 |
60,80,100,120 | 2 |
分类 | TPR | FPR | P | R | F | MCC | AUC |
权重 | 0.950 | 0.030 | 0.956 | 0.950 | 0.951 | 0.901 | 0.977 |
四、从结构化数据,乳腺癌-威斯康星州:中使用FSS选出特征子集,然后对特征子集进行标准化处理,最后采用人工神经网络模型ANN对上述数据进行训练,分析待检测指标是否为良性。
结构化数据,乳腺癌-威斯康星州:FSS将9个特征缩减为8个特征,ANN的超参数如下。
批次大小 | 隐藏层 | 动势 | 保留小数位数 | 种子 |
100 | A | 0.2 | 2 | 0 |
训练时间 | TPR | FPR | P | R | F | MCC | AUC |
100 | 0.967 | 0.035 | 0.967 | 0.967 | 0.967 | 0.928 | 0.995 |
200 | 0.961 | 0.042 | 0.962 | 0.961 | 0.691 | 0.915 | 0.995 |
300 | 0.961 | 0.042 | 0.962 | 0.961 | 0.691 | 0.915 | 0.994 |
400 | 0.963 | 0.039 | 0.963 | 0.963 | 0.963 | 0.918 | 0.944 |
500 | 0.963 | 0.039 | 0.963 | 0.963 | 0.963 | 0.918 | 0.993 |
600 | 0.963 | 0.039 | 0.963 | 0.963 | 0.963 | 0.918 | 0.993 |
700 | 0.964 | 0.039 | 0.964 | 0.964 | 0.964 | 0.921 | 0.933 |
800 | 0.964 | 0.039 | 0.964 | 0.964 | 0.964 | 0.921 | 0.933 |
900 | 0.963 | 0.041 | 0.963 | 0.963 | 0.963 | 0.918 | 0.921 |
1000 | 0.966 | 0.036 | 0.966 | 0.96 | 0.966 | 0.925 | 0.921 |
五、对非结构性数据集进行小波变换Wavelet处理后,采用卷积神经网络模型CNN对上述数据进行训练,即可分析待检测图像是否为良性。
由此可见,结构数据集对于SVM,可以注意到当使用内核函数时,线性具有最大召回作用的内核是径向基函数内核,然后是多项式内核,最后是Sigmoid内核,此时的最佳准确率为97.0%。然后,对于随机森林,批次大小,最大深度,执行时隙数和其他参数通过实验证明没有任何显着与准确率的相关性,迭代次数除外。虽然在100到300时准确率较低,但是准确率也随时波动。最高的准确率为97.6%。接下来,对于NB,可以注意到批次大小,但实验表明此参数没有太大的相关性,这意味着批量大小的值不会影响准确率。最后,对于ANN,在参数学习率的基础上,当学习率约为0.05和0.4,此处的最佳回忆率为96.3%。对于其他与表现高度相关的参数是训练时间效果大约在100和1000之间。最佳召回率为96.7%。该算法的召回率如下所示。可以看出随机森林算法获得了最佳召回率,SVM和ANN具有相似的召回值,而NB的召回率较低。
本发明采用了M波段小波变换和PCA将数据变换到相应的域以减少原始数据集的大小并提取之前最重要的功能对其应用ML和CNN,从而提高了癌症诊断的准确性实现。为了分析结构数据,应用的基于PCA的ML算法获得的准确率高达97.6%。对于非结构数据集,首先使用M波段小波变换创建小波本(张量),然后进给这些小波张量导入到初始VGG19 CNN模型中进行培训和测试。这样,分解图像进入不同的频率,以便提取更重要的特征因此学会了取得更好的结果。
以上所述的实施例仅是对本发明的优选方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (4)
1.一种基于PCA或M波段小波域的癌症CT图像判断装置,其特征在于:包括数据处理装置,对图像进行预处理并提取相关的功能,来降低原始图像数据集的维度;预处理过程中针对非结构数据集进行小波变换,利用PCA对结构性数据进行预处理;
特征集选择装置,用于从处理后的数据集中选择出特征子集;
判断装置,用于识别待测图像为良性还是恶性;
所述非结构数据集包括原始颜色图像和灰度图像,根据图像的尺寸构建小波变换矩阵;
所述小波变换的过程为:使用M波段小波将图像数据集转换为小波域,然后为每个图像创建小波本;再对小波本进行扩充然后分为训练集与测试集。
2.根据权利要求1所述的基于PCA或M波段小波域的癌症CT图像判断装置,其特征在于:小波变换后,针对于所述灰度图像包含原始图像的近似值,然后将切出部分的转换矩阵并保存到新的数据批次中。
3.根据权利要求1所述的基于PCA或M波段小波域的癌症CT图像判断装置,其特征在于:所述原始颜色图像进行小波变换后进行剪切,剪切出相似部分并进行保留,相似度大于0.9时,判定为相似部分;并合成由二个通道处理的图像并将其保存在数据批次,所述二个通道为原始颜色图像、灰度图像。
4.根据权利要求1所述的基于PCA或M波段小波域的癌症CT图像判断装置,其特征在于:所述特征子集包括细胞核、细胞质、核仁、有丝分裂。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010042305.4A CN111292291B (zh) | 2020-01-15 | 2020-01-15 | 一种基于pca或m波段小波域的癌症ct图像判断装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010042305.4A CN111292291B (zh) | 2020-01-15 | 2020-01-15 | 一种基于pca或m波段小波域的癌症ct图像判断装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111292291A CN111292291A (zh) | 2020-06-16 |
CN111292291B true CN111292291B (zh) | 2024-02-02 |
Family
ID=71025446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010042305.4A Active CN111292291B (zh) | 2020-01-15 | 2020-01-15 | 一种基于pca或m波段小波域的癌症ct图像判断装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111292291B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1623091A (zh) * | 2000-11-16 | 2005-06-01 | 赛弗根生物系统股份有限公司 | 质谱分析方法 |
CN104143101A (zh) * | 2014-07-01 | 2014-11-12 | 华南理工大学 | 一种基于超声图像的乳腺肿瘤区域自动识别方法 |
CN108427966A (zh) * | 2018-03-12 | 2018-08-21 | 成都信息工程大学 | 一种基于pca-lda的医学图像处理系统及方法 |
CN109978880A (zh) * | 2019-04-08 | 2019-07-05 | 哈尔滨理工大学 | 采用高维特征选择对肺部肿瘤ct图像进行判别的方法 |
CN110033417A (zh) * | 2019-04-12 | 2019-07-19 | 江西财经大学 | 一种基于深度学习的图像增强方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8280132B2 (en) * | 2006-08-01 | 2012-10-02 | Rutgers, The State University Of New Jersey | Malignancy diagnosis using content-based image retreival of tissue histopathology |
-
2020
- 2020-01-15 CN CN202010042305.4A patent/CN111292291B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1623091A (zh) * | 2000-11-16 | 2005-06-01 | 赛弗根生物系统股份有限公司 | 质谱分析方法 |
CN104143101A (zh) * | 2014-07-01 | 2014-11-12 | 华南理工大学 | 一种基于超声图像的乳腺肿瘤区域自动识别方法 |
CN108427966A (zh) * | 2018-03-12 | 2018-08-21 | 成都信息工程大学 | 一种基于pca-lda的医学图像处理系统及方法 |
CN109978880A (zh) * | 2019-04-08 | 2019-07-05 | 哈尔滨理工大学 | 采用高维特征选择对肺部肿瘤ct图像进行判别的方法 |
CN110033417A (zh) * | 2019-04-12 | 2019-07-19 | 江西财经大学 | 一种基于深度学习的图像增强方法 |
Non-Patent Citations (1)
Title |
---|
蔡哲元 等.基于M 带小波变换多重分形的胰腺内镜超声图像分类.中国生物医学工程学报.2009,第28卷(第3期),第2.2节. * |
Also Published As
Publication number | Publication date |
---|---|
CN111292291A (zh) | 2020-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nanni et al. | Survey on LBP based texture descriptors for image classification | |
CN111598003B (zh) | 一种面向癫痫患者脑电信号的时频图像分类方法 | |
Vij et al. | A novel deep transfer learning based computerized diagnostic Systems for Multi-class imbalanced diabetic retinopathy severity classification | |
Usman et al. | Intelligent automated detection of microaneurysms in fundus images using feature-set tuning | |
CN112233742B (zh) | 一种基于聚类的病历文档分类系统、设备、存储介质 | |
Bose et al. | Detection of microcalcification in mammograms using soft computing techniques | |
Sreejini et al. | Retrieval of pathological retina images using Bag of Visual Words and pLSA model | |
Liu et al. | Fabric defect detection based on sparse representation of main local binary pattern | |
Derwin et al. | Discrimination of microaneurysm in color retinal images using texture descriptors | |
Thapa et al. | Deep learning for breast cancer classification: Enhanced tangent function | |
CN111292291B (zh) | 一种基于pca或m波段小波域的癌症ct图像判断装置 | |
Rozendo et al. | Classification of non-Hodgkin lymphomas based on sample entropy signatures | |
Wei et al. | Multi-feature fusion for ultrasound breast image classification of benign and malignant | |
CN112614096A (zh) | 一种基于序数回归的乳腺钼靶病灶良恶性分析方法 | |
Torrent et al. | A supervised micro-calcification detection approach in digitised mammograms | |
CN103902997B (zh) | 用于生物细胞显微镜图像分类的特征子空间集成方法 | |
Selvathi et al. | Performance evaluation of kernel based techniques for brain MRI data classification | |
Akyol et al. | Assessing the importance of features for detection of hard exudates in retinal images | |
CN117173485B (zh) | 一种肺癌组织病理图像的智能分类系统方法及系统 | |
Xie et al. | A multi-class support vector data description approach for classification of medical image | |
Zhao et al. | Breast tumors multi-classification study based on histopathological images with radiomics approach | |
Reddy et al. | Brain Tumor Segmentation and Classification in MRI Images Using Deep Learning Techniques | |
Zhang et al. | Small Target Recognition Using Dynamic Time Warping and Visual Attention | |
Jing et al. | Case-adaptive classification based on image retrieval for computer-aided diagnosis | |
CN115601356B (zh) | 基于稀疏卷积自编码的多发性硬化病灶识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |