CN112949770A - 一种医学图像的识别与分类的方法及终端 - Google Patents
一种医学图像的识别与分类的方法及终端 Download PDFInfo
- Publication number
- CN112949770A CN112949770A CN202110375116.3A CN202110375116A CN112949770A CN 112949770 A CN112949770 A CN 112949770A CN 202110375116 A CN202110375116 A CN 202110375116A CN 112949770 A CN112949770 A CN 112949770A
- Authority
- CN
- China
- Prior art keywords
- medical image
- feature map
- classification model
- image recognition
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000013145 classification model Methods 0.000 claims abstract description 94
- 238000012549 training Methods 0.000 claims abstract description 60
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 230000006870 function Effects 0.000 claims description 62
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000010586 diagram Methods 0.000 claims description 10
- 238000011176 pooling Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 238000005520 cutting process Methods 0.000 claims description 6
- 238000005457 optimization Methods 0.000 claims description 6
- 238000004806 packaging method and process Methods 0.000 claims 4
- 238000013135 deep learning Methods 0.000 abstract description 7
- 230000008034 disappearance Effects 0.000 abstract description 4
- 238000004880 explosion Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 206010009944 Colon cancer Diseases 0.000 description 6
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 201000003741 Gastrointestinal carcinoma Diseases 0.000 description 1
- 208000029523 Interstitial Lung disease Diseases 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 201000002313 intestinal cancer Diseases 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开一种医学图像的识别与分类的方法及终端,根据获取的医学图像确定样本集;对所述样本集进行特征提取,得到深层特征与浅层特征;根据所述深层特征与浅层特征建立医学图像识别分类模型,基于所述样本集对所述医学图像识别分类模型进行训练并优化,得到优化后的医学图像识别分类模型;根据所述优化后的医学图像识别分类模型对待处理的医学图像进行识别与分类,由于提取特征时使用的特征提取网络为深度学习网络,因此从根本上消除了训练网络梯度消失与爆炸的问题,使信息能够在所搭建的网络的高层和低层之间畅通传递,从而能够快速并准确地对医学图像进行识别与分类。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种医学图像的识别与分类的方法及终端。
背景技术
在常见的癌症类型中,大肠癌都被认为最常见的恶性肿瘤之一。大肠癌的早期症状不明显以及具有发病的部位不同产生不同的临床症状,所以对大肠癌的早期诊断和快速识别尤为重要。随着影像识别的技术的不断提高,人工智能医疗手段多次运用在医学影像的识别分类上。目前的医学影像的识别上,采用的方式一般基于传统的机器学习模型和普通深度学习的方式。但是大多数基于统计的机器学习的缺点在于强假设性,导致降低了模型识别分类的准确率。
在最新研究中表明,一般人群中的大肠癌的发病率越来越高,大肠癌也逐渐成为人们关注的重点癌症疾病之一。越早发现疾病将会提高癌症疾病被治愈的可能性,所以早期的诊断成功将直接影响癌症的治愈性。在诸多的前期的诊断中,传统的方式是经过切片、染色以及观察,最后通过专业医生的经验判定是否发生癌变,进而判定是何种癌变,这也就直接导致了诊断工作量大和诊断时间长。伴随着人工智能的发展,图像识别技术辅助识别技术的在各个领域运用较为成功,其中,前列腺癌和宫颈癌的成功也使人们对大肠癌识别注意力从传统研究转向了人工智能。针对大肠癌组织切片,MRI(Magnetic ResonanceImaging,磁共振成像)和CT(Computed Tomography,电子计算机断层扫描)影像的识别尤为重要。其中,组织切片的类较多,所需要识别的图片具有较高的相似度,识别的难度极大提高。
在近些年的研究中,应用卷积神经网络成为了图片识别方向的主流方法。目前,设计了具有浅层卷积层的定制卷积神经网络,以对具有间质性肺病的肺图像斑块进行分类;提出了一种分层的路径演化方法来压缩深度卷积神经网络,以对数字乳房断层合成中的肿块进行分类。但是由于卷积神经网络医学图像分类过程中需要池化,池化作为一种简单的路由方式,在上层和下层之间的传递丢弃了部分特征,这些部分特征的价值可能是十分重要的,对于卷积神经网络的池化可能会丢失整体特征相关性一般而言,卷积神经网络某个神经元无法确定一个特征的在不同方向的位置,模糊了特征空间关系,无法快速、准确地对医学图像进行分类和识别。
发明内容
本发明所要解决的技术问题是:提供一种医学图像的识别与分类的方法及终端,能够快速并准确地对医学图像进行识别与分类。
为了解决上述技术问题,本发明采用的一种技术方案为:
一种医学图像的识别与分类的方法,包括步骤:
根据获取的医学图像确定样本集;
对所述样本集进行特征提取,得到深层特征与浅层特征;
根据所述深层特征与浅层特征建立医学图像识别分类模型,基于所述样本集对所述医学图像识别分类模型进行训练并优化,得到优化后的医学图像识别分类模型;
根据所述优化后的医学图像识别分类模型对待处理的医学图像进行识别与分类。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种医学图像的识别与分类的终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据获取的医学图像确定样本集;
对所述样本集进行特征提取,得到深层特征与浅层特征;
根据所述深层特征与浅层特征建立医学图像识别分类模型,基于所述样本集对所述医学图像识别分类模型进行训练并优化,得到优化后的医学图像识别分类模型;
根据所述优化后的医学图像识别分类模型对待处理的医学图像进行识别与分类。
本发明的有益效果在于:
采用人工智能的特征提取算法对医学图像提取深层特征与浅层特征,对提取的特征进行学习,最终得到优化后的医学图像识别分类模型,由于提取特征时使用的特征提取网络为深度学习网络,因此从根本上消除了训练网络梯度消失与爆炸的问题,使信息能够在所搭建的网络的高层和低层之间畅通传递,从而能够快速并准确地对医学图像进行识别与分类。
附图说明
图1为本发明实施例的一种医学图像的识别与分类的方法的步骤流程图;
图2为本发明实施例的一种医学图像的识别与分类的方法的结构示意图;
图3为本发明实施例中医学图像的识别与分类的方法的不同的产生特征图方式的示意图;
图3(a)为本发明实施例医学图像的识别与分类的方法中的使用正常卷积运算产生特征图的示意图;
图3(b)为本发明实施例医学图像的识别与分类的方法中的使用线性运算产生特征图的示意图。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,本发明实施例提供了一种医学图像的识别与分类的方法,包括步骤:
根据获取的医学图像确定样本集;
对所述样本集进行特征提取,得到深层特征与浅层特征;
根据所述深层特征与浅层特征建立医学图像识别分类模型,基于所述样本集对所述医学图像识别分类模型进行训练并优化,得到优化后的医学图像识别分类模型;
根据所述优化后的医学图像识别分类模型对待处理的医学图像进行识别与分类。
从上述描述可知,本发明的有益效果在于:采用人工智能的特征提取算法对医学图像提取深层特征与浅层特征,对提取的特征进行学习,最终得到优化后的医学图像识别分类模型,由于提取特征时使用的特征提取网络为深度学习网络,因此从根本上消除了训练网络梯度消失与爆炸的问题,使信息能够在所搭建的网络的高层和低层之间畅通传递,从而能够快速并准确地对医学图像进行识别与分类。
进一步地,所述根据获取的医学图像确定样本集包括:
根据获取的医学图像得到数据集,将所述数据集进行文件转换,得到转换后的数据集;
将所述转换后的数据集进行划分,得到子训练样本;
根据所述转换后的数据集的位置信息对所述子训练样本进行裁剪,并对裁剪后的子训练样本的数据顺序进行随机排序,得到样本集。
由上述描述可知,将数据集转换成统一的文件形式,便于对数据集进行各类操作,例如复制和移动等,最大效率的利用内存,对裁剪后的子训练样本的数据顺序进行随机排序,能够避免后续模型学习固定的样本顺序,也能够减少数据噪音的负面影响。
进一步地,所述对所述样本集进行特征提取,得到深层特征与浅层特征包括:
对所述样本集进行卷积,得到第一特征图集合;
基于所述第一特征图集合进行线性运算,得到第二特征图集合;
根据所述第一特征图集合与所述第二特征图集合生成第三特征图集合;
将所述第三特征图集合通过插值转换至连续空间域,得到卷积特征;
对所述卷积特征进行全局平均池化,得到深层特征与浅层特征。
进一步地,所述对所述样本集进行卷积,得到第一特征图集合包括:
将所述样本集与卷积过滤器进行卷积,得到所述第一特征图集合;
所述第一特征图集合Y’为:
Y′=X*f′;
式中,f′表示所述卷积过滤器,X表示所述样本集,*表示卷积;
所述基于所述第一特征图集合进行线性运算,得到第二特征图集合包括:
将所述第一特征图集合中的每一第一特征图进行线性运算,得到所述第二特征图集合;
所述第二特征图集合中yij为:
式中,yi′表示所述第一特征图集合中的第i个第一特征图,Φi,j()表示线性运算,yij表示根据第i个第一特征图生成的第j个第二特征图,m表示所述第一特征图集合中的第一特征图个数,s表示所述第二特征图集合中的第二特征图个数;
所述将所述第三特征图集合通过插值转换至连续空间域,得到卷积特征包括:
将所述第三特征图集合中的每一层的特征通过插值转换至所述连续空间域中,得到所述卷积特征;
所述卷积特征Ad{xd}(t)为:
由上述描述可知,对样本集进行特征提取的过程使用了自动微分深度学习技术,随着网络层次的深入,内部使用反向传播算法,网络的输入层的信息可以从任意一个底层传递到高层,其前馈的信息,网络的参数依然可以得到有效更新,解决了网络的退化问题,使信息能够在高低层之间很好的传递,从而准确地对医学图像进行识别与分类,另外,通过线性运算得到第二特征图集合,与使用正常卷积运算相比,减少了计算成本,提高了计算效率。
进一步地,所述基于所述样本集对所述医学图像识别分类模型进行训练并优化,得到优化后的医学图像识别分类模型包括:
根据当前CPU版本创建线程管理器;
将所述样本集输入至所述医学图像识别分类模型,使用激活函数对所述医学图像识别分类模型进行训练,得到训练后的医学图像识别分类模型;
使用预设优化器对所述训练后的医学图像识别分类模型进行模型优化,得到优化后的医学图像识别分类模型;
保存所述优化后的医学图像识别分类模型。
由上述描述可知,创建线程管理器,能够针对当前使用的CPU版本进行多线程加速,提高了医学图像识别分类模型整体的训练速度,模型训练过程中使用优化器能够最小化模型在训练过程中的损失,提高模型的收敛速度,便于调整网络参数,计算效率高,对内存需求较小,从而快速地对医学图像进行识别与分类。
请参照图2,本发明另一实施例提供了一种医学图像的识别与分类的终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据获取的医学图像确定样本集;
对所述样本集进行特征提取,得到深层特征与浅层特征;
根据所述深层特征与浅层特征建立医学图像识别分类模型,基于所述样本集对所述医学图像识别分类模型进行训练并优化,得到优化后的医学图像识别分类模型;
根据所述优化后的医学图像识别分类模型对待处理的医学图像进行识别与分类。
从上述描述可知,本发明的有益效果在于:采用人工智能的特征提取算法对医学图像提取深层特征与浅层特征,对提取的特征进行学习,最终得到优化后的医学图像识别分类模型,由于提取特征时使用的特征提取网络为深度学习网络,因此从根本上消除了训练网络梯度消失与爆炸的问题,使信息能够在所搭建的网络的高层和低层之间畅通传递,从而能够快速并准确地对医学图像进行识别与分类。
进一步地,所述根据获取的医学图像确定样本集包括:
根据获取的医学图像得到数据集,将所述数据集进行文件转换,得到转换后的数据集;
将所述转换后的数据集进行划分,得到子训练样本;
根据所述转换后的数据集的位置信息对所述子训练样本进行裁剪,并对裁剪后的子训练样本的数据顺序进行随机排序,得到样本集。
由上述描述可知,将数据集转换成统一的文件形式,便于对数据集进行各类操作,例如复制和移动等,最大效率的利用内存,对裁剪后的子训练样本的数据顺序进行随机排序,能够避免后续模型学习固定的样本顺序,也能够减少数据噪音的负面影响。
进一步地,所述对所述样本集进行特征提取,得到深层特征与浅层特征包括:
对所述样本集进行卷积,得到第一特征图集合;
基于所述第一特征图集合进行线性运算,得到第二特征图集合;
根据所述第一特征图集合与所述第二特征图集合生成第三特征图集合;
将所述第三特征图集合通过插值转换至连续空间域,得到卷积特征;
对所述卷积特征进行全局平均池化,得到深层特征与浅层特征。
进一步地,所述对所述样本集进行卷积,得到第一特征图集合包括:
将所述样本集与卷积过滤器进行卷积,得到所述第一特征图集合;
所述第一特征图集合Y’为:
Y′=X*f′;
式中,f′表示所述卷积过滤器,X表示所述样本集,*表示卷积;
所述基于所述第一特征图集合进行线性运算,得到第二特征图集合包括:
将所述第一特征图集合中的每一第一特征图进行线性运算,得到所述第二特征图集合;
所述第二特征图集合中yij为:
式中,y′i表示所述第一特征图集合中的第i个第一特征图,Φi,j()表示线性运算,yij表示根据第i个第一特征图生成的第j个第二特征图,m表示所述第一特征图集合中的第一特征图个数,s表示所述第二特征图集合中的第二特征图个数;
所述将所述第三特征图集合通过插值转换至连续空间域,得到卷积特征包括:
将所述第三特征图集合中的每一层的特征通过插值转换至所述连续空间域中,得到所述卷积特征;
所述卷积特征Ad{xd}(t)为:
由上述描述可知,对样本集进行特征提取的过程使用了自动微分深度学习技术,随着网络层次的深入,内部使用反向传播算法,网络的输入层的信息可以从任意一个底层传递到高层,其前馈的信息,网络的参数依然可以得到有效更新,解决了网络的退化问题,使信息能够在高低层之间很好的传递,从而准确地对医学图像进行识别与分类,另外,通过线性运算得到第二特征图集合,与使用正常卷积运算相比,减少了计算成本,提高了计算效率。
进一步地,所述基于所述样本集对所述医学图像识别分类模型进行训练并优化,得到优化后的医学图像识别分类模型包括:
根据当前CPU版本创建线程管理器;
将所述样本集输入至所述医学图像识别分类模型,使用激活函数对所述医学图像识别分类模型进行训练,得到训练后的医学图像识别分类模型;
使用预设优化器对所述训练后的医学图像识别分类模型进行模型优化,得到优化后的医学图像识别分类模型;
保存所述优化后的医学图像识别分类模型。
由上述描述可知,创建线程管理器,能够针对当前使用的CPU版本进行多线程加速,提高了医学图像识别分类模型整体的训练速度,模型训练过程中使用优化器能够最小化模型在训练过程中的损失,提高模型的收敛速度,便于调整网络参数,计算效率高,对内存需求较小,从而快速地对医学图像进行识别与分类。
实施例一
请参照图1,本实施例的一种医学图像的识别与分类的方法,包括步骤:
S1、根据获取的医学图像确定样本集;
根据获取的医学图像得到数据集,将所述数据集进行文件转换,得到转换后的数据集;
其中,获取医学图像之后,使用tf.TFRecordReader()函数读取获取的医学图像,将其转换为TFRecord文件,便于后续的数据处理;
tf.TFRecordReader()函数是TFRecord生成器,一个读取tfrecord数据的函数,其作用为能够将图片转换为TFRecord文件;
对转换后的医学图像的label(数据标签)和img(图像数据)调用tf.FixedLenFeature()函数,实现医学图像的特征解析,便于后续处理;
tf.FixedLenFeature()函数是TensorFlow(开源软件库)封装的内部函数,其作用是解析数据的定长特征;
具体的,根据获取的医学图像得到数据集,所述数据集包括训练集、验证集与测试集,使用TFRecordWriter()函数将数据集转换为TF文件,得到转换后的数据集,即writer=tf.python_io.TFRecordwriter(os.path.join(file_path,tfrecordfilename));img=Image.open(img_path,'r'),img_raw=img.tobytes();
其中,TFRecordWriter()函数是TFRecord生成器,其作用是生成TFRecord文件;
Writer为一个变量,暂时命名此变量来保存TFRecordWriter()函数生成的内容,file_path指保存文件的路径,文件可以保存在设备的任何地方,即可以自由填写file_path的内容,tfrecordfilename指TFRecordReader()读取到的内容,Image.open()指打开图像数据函数,img_path指医学图像的路径,‘r’指函数里面的一个参数,代表read(读取)的意思,img_raw为一个变量,也可以命名为别的名字,此变量的空间用来存储img.tobytes()函数的输出结果,img.tobytes()函数指将图片转化为二进制数据流的函数;
将数据集转换为TF的二进制文件,有利于统一文件输入操作,最大效率地利用内存,也方便对文件执行各类操作,例如移动、复制等,此格式最大的优点为每一输入图像数据和与之关联的数据标签放在同一个文件中,且文件不需要进行压缩,效率高;
其中,还包括步骤:
对label使用cast()函数,即label=tf.cast(features[‘label’],tf.int64),将label的格式转化为dtype数据类型,能够将label输出为0,1序列的格式,方便操作与计算,反之亦可,再对label进行onehot编码,即one_hot_labels=tf.one_hot(),能够使后续进行计算特征之间的距离更加合理;
其中,features[‘label’]指标签label的特征,tf.int64为数据类型,指64位整数型数据,one_hot_labels表示编码后的label;
cast()函数为转换函数,用于转换数据类型;
tf.one_hot()函数是将input(输入)转化为one-hot类型数据输出,相当于将多个数值联合放在一起作为多个相同类型的向量,可用于表示各自的概率分布,通常用于分类任务中作为最后的FC层的输出;
对img进行裁剪,使其分辨率为224×224,即img=tf.reshape(img,[224,224,3]),将img进行归一化处理,归一化为0-1之间,即img=tf.cast(img,tf.float32)/255.0;
其中,Tf.reshape()是重塑张量函数,其作用是重塑张量,[224,224,3]指张量形状,224代表像素大小,3代表通道数(0维的张量就是标量,1维的张量就是向量,2维的张量就是矩阵,大于等于3维的张量没有名称,统一叫做张量),tf.cast()函数是一个修改张量数据的数据类型的函数,tf.float32为数据格式,指32位的浮点数,255.0指归一化的参数,像素值为256,即0-255,最大像素值为255.0;
将所述转换后的数据集进行划分,得到子训练样本;
具体的,将转换后的数据集中的训练集进行划分,得到子训练样本;
根据所述转换后的数据集的位置信息对所述子训练样本进行裁剪,并对裁剪后的子训练样本的数据顺序进行随机排序,得到样本集;
其中,使用shuffle_batch()函数对裁剪后的子训练样本的数据顺序进行随机排序,得到样本集,即tf.train.shuffle_batch([img,label]);
shuffle_batch()函数指随机采样函数,作用是将队列里的数据随机打乱再读取;
S2、对所述样本集进行特征提取,得到深层特征与浅层特征;
S3、根据所述深层特征与浅层特征建立医学图像识别分类模型,基于所述样本集对所述医学图像识别分类模型进行训练并优化,得到优化后的医学图像识别分类模型;
S4、根据所述优化后的医学图像识别分类模型对待处理的医学图像进行识别与分类。
实施例二
请参照图1、3,本实施例在实施例一的基础上进一步限定了如何提取深层特征与浅层特征,所述S2具体为:
对所述样本集进行卷积,得到第一特征图集合;
具体的,将所述样本集与卷积过滤器进行卷积,得到所述第一特征图集合;
所述第一特征图集合Y’为:
Y′=X*f′;
式中,f′表示所述卷积过滤器,X表示所述样本集,*表示卷积;
卷积过滤器也称为卷积核,每个卷积核具有长、宽、深三个维度,卷积核的长、宽都是人为指定的,长*宽也被称为卷积核的尺寸,卷积过程中,输入层有多少个通道,滤波器就要有多少个通道(卷积核的深度),但是滤波器的数量是任意的,滤波器的数量决定了卷积后输出的通道数;
基于所述第一特征图集合进行线性运算,得到第二特征图集合;
具体的,如图3所示,将所述第一特征图集合中的每一第一特征图进行线性运算,得到所述第二特征图集合;
所述第二特征图集合中yij为:
式中,y′i表示所述第一特征图集合中的第i个第一特征图,Φi,j()表示线性运算,yij表示根据第i个第一特征图生成的第j个第二特征图,m表示所述第一特征图集合中的第一特征图个数,s表示所述第二特征图集合中的第二特征图个数;
由于线性运算在每个通道进行,计算成本将小于原始卷积核;
根据所述第一特征图集合与所述第二特征图集合生成第三特征图集合;
具体的,根据第一特征图集合中的m个第一特征图与第二特征图集合中的s个特征图生成第三特征图集合中的n=m×s个第三特征图;
将所述第三特征图集合通过插值转换至连续空间域,得到卷积特征;
具体的,将所述第三特征图集合中的每一层的特征通过插值转换至所述连续空间域中,得到所述卷积特征;
所述卷积特征Ad{xd}(t)为:
对所述卷积特征进行全局平均池化,得到深层特征与浅层特征。
实施例三
请参照图1,本实施例在实施例一或实施例二的基础上进一步限定了如何进行医学图像识别分类模型训练,所述S3具体为:
根据所述深层特征与浅层特征建立医学图像识别分类模型;
根据当前CPU版本创建线程管理器;
具体的,针对当前CPU(Central Processing Unit,中央处理器)版本创建线程管理器coord=tf.train.Coordinator(),等待其他所有线程关闭之后,函数coord.request_stop(),coord.join(threads)返回;
tf.train.Coordinator()函数是线程函数,作用是终止所有线程以及把线程加入主线程,coord.request_stop()函数指线程管理函数,任何线程都可以调用此函数请求线程停止工作,coord.join(threads)指的是将线程加入主线程,等待线程(threads)结束;
将所述样本集输入至所述医学图像识别分类模型,使用激活函数对所述医学图像识别分类模型进行训练,得到训练后的医学图像识别分类模型;
其中,使用激活函数对医学图像识别分类模型进行训练,得到训练后的医学图像识别分类模型,即tf.nn.sigmod(x,name=’sigmod’),x=tf.constant(),loss=tf.reduce_mean(tf.nn.sigmod_cross_entropy_with_logits(logits=pred,labels=one_hot_labels));
tf.nn.sigmod_cross_entropy_with_logits()为损失函数,tf.nn.sigmod()为激活函数,tf.constant()为生成常量的函数;
loss指用来评价模型的预测值和真实值不一样的程度,logits是一个变量,预测值pred的值赋予logits来保存,pred表示预测值,one_hot_labels表示编码后的label;
使用预设优化器对所述训练后的医学图像识别分类模型进行模型优化,得到优化后的医学图像识别分类模型;
具体的,使用adam优化器对训练后的医学图像识别分类模型进行模型优化,即optimizer=tf.train.AdamOptimizer(learning_rate=lr).minimize(loss),使模型训练过程中的损失最小化,得到优化后的医学图像识别分类模型;
保存所述优化后的医学图像识别分类模型;
其中,Optimizer指优化器名称,learning_rate指学习率,lr即其缩写;
具体的,创建对象saver,使用tf.train.Saver()函数保存优化后的医学图像识别分类模型及参数;
tf.train.Saver()函数用于在训练好网络之后保存训练好的模型,还有在程序中读取保存好的模型。
实施例四
请参照图1,本实施例在实施例一、实施例二或实施例三的基础上进一步限定了如何使用优化后的医学图像识别分类模型对待处理的医学图像进行识别与分类,所述S4具体为:
获取待处理的医学图像,指定其加载的路径test_dir(test_file),test_file表示待处理的医学图像;
加载优化后的医学图像识别分类模型,指定其加载的路径model_dir(model_file),model_file表示优化后的医学图像识别分类模型;
指定预测结果文件的路径result_dir(result_file),result_file表示预测结果文件,用于保存识别与分类的结果;
将所述待处理的医学图像输入至优化后的医学图像识别分类模型,即prediction,end_points=nets.model_name(x,num_classes,is_training=False);prediction=tf.reshape(prediction,shape=[range]),a=tf.argmax(prediction,1);
shape=[range]指数据大小范围,a=tf.argmax(prediction,1)指输出每行最大元素所在的索引,a为argmax返回的索引值,1是tf.argmax(input,axis)函数的axis参数值,axis为0表示输出每一列最大元素所在的索引数组,axis为1表示输出每行最大元素所在的索引;
prediction指预测值,end_points指设置的变量,用来保存nets.model_name()函数的返回(输出)结果,nets.model_name()函数指调用模型函数,x、num_classes、is_training=False均为函数里的参数,x指输入,num_classes指类别数量,is_training=False指测试模式;
创建Session会话,即with tf.Session()as sess,用于处理输出的结果;
识别分类路径,即待处理的医学图像的路径class_path=os.path.join(test_dir,picture);
class_path是一个变量,用来保存os.path.join()函数的结果,os.path.join()函数指路径拼接函数,test_dir指测试路径,picture指测试图片,即待处理的医学图像;
对于待处理的医学图像的img路径处理,即使用路径拼接函数,将需要的文件路径加入待处理的医学图像的img路径中img_path=os.path.join(class_path,img_file_name);
img_path是一个变量,用来保存os.path.join()函数的结果,Img_file_name是指测试文件名;
对待处理的医学图像的img进行裁剪,即img1=img.reshape((224,224)),img=img.resize(img,[1,224,224,3]),并对img进行归一化处理,即img=tf.cast(img,tf.float32)/255.0;
img1是一个变量名称,也可以为img2等,(224,224)为医学图像尺寸,img.resize()指裁剪函数,用于将图像裁剪成特定的尺寸,[1,224,224,3]中的1指批次,224,224指尺寸,3指通道;
启用Session会话对比[img,img1]两个图像,即image,image_raw=sess.run([img,img1]),label=sess.run(a,feed_dict={x:image});
Image,image_raw均为变量名,分别保存函数返回的对比结果,sess.run()函数是with tf.Session()as sess启动会话,构成一个循环,张量在里面运行,运行完成后自动结束;
创建索引,即index=label[];
label[]指标签索引;
判断对比,若一致,则准确率累加,即if dic_data[img_file_name]==classes[index],acc_num,prediction=classes[index];
dic_data[img_file_name]指类别文件,classes[index]指类别数组文件,acc_num指所有输出准确率个数,每一张测试图片测试都会得到一个准确率,例如100张图片有100个结果;
输出时间和准确率结果,作为识别分类效率和准确率的指标,即time_use=(time.clock()-start),accuracy=acc_num/num;
time.clock()-start指获取的时钟值,用于计算运行的时间,acc_num指所有输出准确率个数,num指数量,即number的缩写;
输出识别与分类的结果,print(Time used,time_use),print(accuracy.format(acc*100));
Time used指测试运行的时间,accuracy.format(acc*100)指准确率,acc为小数,需要乘100来表示百分数,例如0.9为小数,0.9*100%=90%。
实施例五
请参照图2,一种医学图像的识别与分类的终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现实施例一、实施例二、实施例三或实施例四中的步骤。
综上所述,本发明提供的一种医学图像的识别与分类的方法及终端,根据获取的医学图像得到数据集,将其进行文件转换,便于对数据集进行各类操作,最大效率的利用内存;将转换后的数据集进行划分,得到子训练样本,根据转换后的数据集的位置信息对子训练样本进行裁剪,并对裁剪后的子训练样本的数据顺序进行随机排序,得到样本集,能够避免后续模型学习固定的样本顺序,减少数据噪音的负面影响;对样本集进行卷积,得到第一特征图集合,基于第一特征图集合进行线性运算,得到第二特征图集合,根据第一特征图集合与第二特征图集合生成第三特征图集合,将其通过插值转换至连续空间域,得到卷积特征,对卷积特征进行全局平均池化,得到深层特征与浅层特征,使用了自动微分深度学习技术,随着网络层次的深入,内部使用反向传播算法,网络的输入层的信息可以从任意一个底层传递到高层,其前馈的信息,网络的参数依然可以得到有效更新,解决了网络的退化问题,使信息能够在高低层之间很好的传递,能够准确地对医学图像进行识别与分类;根据深层特征与浅层特征建立医学图像识别分类模型,根据当前CPU版本创建线程管理器,基于样本集对医学图像识别分类模型进行训练并使用预设优化器进行优化,根据优化后的医学图像识别分类模型对待处理的医学图像进行识别与分类,能够针对当前使用的CPU版本进行多线程加速,提高了医学图像识别分类模型整体的训练速度,模型训练过程中使用优化器能够最小化模型在训练过程中的损失,提高模型的收敛速度,便于调整网络参数,计算效率高,对内存需求较小,从而快速地对医学图像进行识别与分类。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种医学图像的识别与分类的方法,其特征在于,包括步骤:
根据获取的医学图像确定样本集;
对所述样本集进行特征提取,得到深层特征与浅层特征;
根据所述深层特征与浅层特征建立医学图像识别分类模型,基于所述样本集对所述医学图像识别分类模型进行训练并封装,得到封装后的医学图像识别分类模型;
根据所述封装后的医学图像识别分类模型对待处理的医学图像进行识别与分类。
2.根据权利要求1所述的一种医学图像的识别与分类的方法,其特征在于,所述根据获取的医学图像确定样本集包括:
根据获取的医学图像得到数据集,将所述数据集进行文件转换,得到转换后的数据集;
将所述转换后的数据集进行划分,得到子训练样本;
根据所述转换后的数据集的位置信息对所述子训练样本进行裁剪,并对裁剪后的子训练样本的数据顺序进行随机排序,得到样本集。
3.根据权利要求1所述的一种医学图像的识别与分类的方法,其特征在于,所述对所述样本集进行特征提取,得到深层特征与浅层特征包括:
对所述样本集进行卷积,得到第一特征图集合;
基于所述第一特征图集合进行线性运算,得到第二特征图集合;
根据所述第一特征图集合与所述第二特征图集合生成第三特征图集合;
将所述第三特征图集合通过插值转换至连续空间域,得到卷积特征;
对所述卷积特征进行全局平均池化,得到深层特征与浅层特征。
4.根据权利要求3所述的一种医学图像的识别与分类的方法,其特征在于,所述对所述样本集进行卷积,得到第一特征图集合包括:
将所述样本集与卷积过滤器进行卷积,得到所述第一特征图集合;
所述第一特征图集合Y’为:
Y′=X*f′;
式中,f′表示所述卷积过滤器,X表示所述样本集,*表示卷积;
所述基于所述第一特征图集合进行线性运算,得到第二特征图集合包括:
将所述第一特征图集合中的每一第一特征图进行线性运算,得到所述第二特征图集合;
所述第二特征图集合中yij为:
式中,y′i表示所述第一特征图集合中的第i个第一特征图,Φi,j()表示线性运算,yij表示根据第i个第一特征图生成的第j个第二特征图,m表示所述第一特征图集合中的第一特征图个数,s表示所述第二特征图集合中的第二特征图个数;
所述将所述第三特征图集合通过插值转换至连续空间域,得到卷积特征包括:
将所述第三特征图集合中的每一层的特征通过插值转换至所述连续空间域中,得到所述卷积特征;
所述卷积特征Ad{xd}(t)为:
5.根据权利要求1所述的一种医学图像的识别与分类的方法,其特征在于,所述基于所述样本集对所述医学图像识别分类模型进行训练并封装,得到封装后的医学图像识别分类模型包括:
根据当前CPU版本创建线程管理器;
将所述样本集输入至所述医学图像识别分类模型,使用激活函数对所述医学图像识别分类模型进行训练,得到训练后的医学图像识别分类模型;
使用预设优化器对所述训练后的医学图像识别分类模型进行模型优化,得到优化后的医学图像识别分类模型;
将所述优化后的医学图像识别分类模型进行封装,得到封装后的医学图像识别分类模型。
6.一种医学图像的识别与分类的终端,包括存储器、处理器及存储在存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:
根据获取的医学图像确定样本集;
对所述样本集进行特征提取,得到深层特征与浅层特征;
根据所述深层特征与浅层特征建立医学图像识别分类模型,基于所述样本集对所述医学图像识别分类模型进行训练并封装,得到封装后的医学图像识别分类模型;
根据所述封装后的医学图像识别分类模型对待处理的医学图像进行识别与分类。
7.根据权利要求6所述的一种医学图像的识别与分类的终端,其特征在于,所述根据获取的医学图像确定样本集包括:
根据获取的医学图像得到数据集,将所述数据集进行文件转换,得到转换后的数据集;
将所述转换后的数据集进行划分,得到子训练样本;
根据所述转换后的数据集的位置信息对所述子训练样本进行裁剪,并对裁剪后的子训练样本的数据顺序进行随机排序,得到样本集。
8.根据权利要求6所述的一种医学图像的识别与分类的终端,其特征在于,所述对所述样本集进行特征提取,得到深层特征与浅层特征包括:
对所述样本集进行卷积,得到第一特征图集合;
基于所述第一特征图集合进行线性运算,得到第二特征图集合;
根据所述第一特征图集合与所述第二特征图集合生成第三特征图集合;
将所述第三特征图集合通过插值转换至连续空间域,得到卷积特征;
对所述卷积特征进行全局平均池化,得到深层特征与浅层特征。
9.根据权利要求8所述的一种医学图像的识别与分类的终端,其特征在于,所述对所述样本集进行卷积,得到第一特征图集合包括:
将所述样本集与卷积过滤器进行卷积,得到所述第一特征图集合;
所述第一特征图集合Y’为:
Y′=X*f′;
式中,f′表示所述卷积过滤器,X表示所述样本集,*表示卷积;
所述基于所述第一特征图集合进行线性运算,得到第二特征图集合包括:
将所述第一特征图集合中的每一第一特征图进行线性运算,得到所述第二特征图集合;
所述第二特征图集合中yij为:
式中,y′i表示所述第一特征图集合中的第i个第一特征图,Φi,j()表示线性运算,yij表示根据第i个第一特征图生成的第j个第二特征图,m表示所述第一特征图集合中的第一特征图个数,s表示所述第二特征图集合中的第二特征图个数;
所述将所述第三特征图集合通过插值转换至连续空间域,得到卷积特征包括:
将所述第三特征图集合中的每一层的特征通过插值转换至所述连续空间域中,得到所述卷积特征;
所述卷积特征Ad{xd}(t)为:
10.根据权利要求6所述的一种医学图像的识别与分类的终端,其特征在于,所述基于所述样本集对所述医学图像识别分类模型进行训练并封装,得到封装后的医学图像识别分类模型包括:
根据当前CPU版本创建线程管理器;
将所述样本集输入至所述医学图像识别分类模型,使用激活函数对所述医学图像识别分类模型进行训练,得到训练后的医学图像识别分类模型;
使用预设优化器对所述训练后的医学图像识别分类模型进行模型优化,得到优化后的医学图像识别分类模型;
将所述优化后的医学图像识别分类模型进行封装,得到封装后的医学图像识别分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110375116.3A CN112949770B (zh) | 2021-04-08 | 2021-04-08 | 一种医学图像的识别与分类的方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110375116.3A CN112949770B (zh) | 2021-04-08 | 2021-04-08 | 一种医学图像的识别与分类的方法及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112949770A true CN112949770A (zh) | 2021-06-11 |
CN112949770B CN112949770B (zh) | 2023-12-26 |
Family
ID=76230878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110375116.3A Active CN112949770B (zh) | 2021-04-08 | 2021-04-08 | 一种医学图像的识别与分类的方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112949770B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113989556A (zh) * | 2021-10-27 | 2022-01-28 | 南京大学 | 一种小样本医学影像分类方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709511A (zh) * | 2016-12-08 | 2017-05-24 | 华中师范大学 | 基于深度学习的城市轨道交通全景监控视频故障检测方法 |
CN111027626A (zh) * | 2019-12-11 | 2020-04-17 | 西安电子科技大学 | 基于可变形卷积网络的流场识别方法 |
CN111476292A (zh) * | 2020-04-03 | 2020-07-31 | 北京全景德康医学影像诊断中心有限公司 | 医学图像分类处理人工智能的小样本元学习训练方法 |
WO2020215557A1 (zh) * | 2019-04-24 | 2020-10-29 | 平安科技(深圳)有限公司 | 医学影像解释方法、装置、计算机设备及存储介质 |
CN112381178A (zh) * | 2020-12-07 | 2021-02-19 | 西安交通大学 | 一种基于多损失特征学习的医学影像分类方法 |
-
2021
- 2021-04-08 CN CN202110375116.3A patent/CN112949770B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106709511A (zh) * | 2016-12-08 | 2017-05-24 | 华中师范大学 | 基于深度学习的城市轨道交通全景监控视频故障检测方法 |
WO2020215557A1 (zh) * | 2019-04-24 | 2020-10-29 | 平安科技(深圳)有限公司 | 医学影像解释方法、装置、计算机设备及存储介质 |
CN111027626A (zh) * | 2019-12-11 | 2020-04-17 | 西安电子科技大学 | 基于可变形卷积网络的流场识别方法 |
CN111476292A (zh) * | 2020-04-03 | 2020-07-31 | 北京全景德康医学影像诊断中心有限公司 | 医学图像分类处理人工智能的小样本元学习训练方法 |
CN112381178A (zh) * | 2020-12-07 | 2021-02-19 | 西安交通大学 | 一种基于多损失特征学习的医学影像分类方法 |
Non-Patent Citations (1)
Title |
---|
刘晓;齐德昱;曹世轩;: "基于TensorFlow2.0的图像分类算法研究", 现代计算机, no. 14 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113989556A (zh) * | 2021-10-27 | 2022-01-28 | 南京大学 | 一种小样本医学影像分类方法和系统 |
CN113989556B (zh) * | 2021-10-27 | 2024-04-09 | 南京大学 | 一种小样本医学影像分类方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112949770B (zh) | 2023-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113077471B (zh) | 一种基于u型网络的医学图像分割方法 | |
Qayyum et al. | Medical image retrieval using deep convolutional neural network | |
US12118721B2 (en) | Systems and methods for image preprocessing | |
CN111429460B (zh) | 图像分割方法、图像分割模型训练方法、装置和存储介质 | |
KR102097740B1 (ko) | 인공지능을 활용한 의료영상 자동 분류 및 표준화 시스템 및 그 구동방법 | |
CN113808146B (zh) | 一种医学图像多器官分割方法及系统 | |
CN112381178B (zh) | 一种基于多损失特征学习的医学影像分类方法 | |
CN113838067B (zh) | 肺结节的分割方法和装置、计算设备、可存储介质 | |
KR101925603B1 (ko) | 병리 영상의 판독을 보조하는 방법 및 이를 이용한 장치 | |
Tsivgoulis et al. | An improved SqueezeNet model for the diagnosis of lung cancer in CT scans | |
CN110570419A (zh) | 特征信息的获取方法、装置和存储介质 | |
Wei et al. | An Efficient Cervical Whole Slide Image Analysis Framework Based on Multi-scale Semantic and Location Deep Features | |
CN114037699B (zh) | 一种病理图像分类方法、设备、系统及存储介质 | |
CN112949770B (zh) | 一种医学图像的识别与分类的方法及终端 | |
Sujini et al. | Machine Learning based Computer Aided Diagnosis Models for Thyroid Nodule Detection and Classification: A Comprehensive Survey | |
CN113283465B (zh) | 一种弥散张量成像数据分析方法及装置 | |
CN114168780A (zh) | 多模态数据处理方法、电子设备及存储介质 | |
Padamata et al. | Tomato Crop Disease Classification Using Semantic Segmentation Algorithm in Deep Learning. | |
Enshaei et al. | A Generalization Enhancement Approach for Deep Learning Segmentation Models: Application in COVID-19 Lesion Segmentation from Chest CT Slices | |
CN118230074B (zh) | 一种知识辅助迁移学习的乳腺癌分子亚型识别方法及系统 | |
CN110298400A (zh) | 一种图像分类方法、装置、设备及存储介质 | |
Tao et al. | Hippocampus segmentation after brain tumor resection via postoperative region synthesis | |
Krishna et al. | Image Data Classification Using Mobile Net for Big Data Analytics | |
Chandrakala et al. | Efficient Transfer Learning Model for Automated Diabetic Retinopathy Grading in Resource-Constrained Environment | |
Lin | Research Progress of Deep Learning Based Medical Image Classification Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |