CN113223730B - 基于人工智能的疟疾分类方法及设备 - Google Patents
基于人工智能的疟疾分类方法及设备 Download PDFInfo
- Publication number
- CN113223730B CN113223730B CN202110342953.6A CN202110342953A CN113223730B CN 113223730 B CN113223730 B CN 113223730B CN 202110342953 A CN202110342953 A CN 202110342953A CN 113223730 B CN113223730 B CN 113223730B
- Authority
- CN
- China
- Prior art keywords
- malaria
- attention mode
- practical
- feature map
- classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 201000004792 malaria Diseases 0.000 title claims abstract description 87
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 43
- 230000001575 pathological effect Effects 0.000 claims abstract description 14
- 230000006870 function Effects 0.000 claims description 32
- 238000011176 pooling Methods 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 11
- 230000015654 memory Effects 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 7
- 230000007170 pathology Effects 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 4
- 241000894007 species Species 0.000 description 15
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 241000224016 Plasmodium Species 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000223960 Plasmodium falciparum Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/80—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Public Health (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于人工智能的疟疾分类方法及设备。所述方法包括:对疟疾的病理图像进行分割得到实用级图像;在ResNetXt‑50网络结构中加载通道注意力模式和空间注意力模式得到分类器;采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,根据提取的第二特征图对疟疾的种类进行区分。本发明通过在ResNetXt‑50网络结构中加载通道注意力模式和空间注意力模式得到分类器,并采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,可以根据第二特征图对疟疾的种类进行区分,实现了在少量数据下的疟疾种类的高精度识别,提高了对疟疾种类的识别准确率和稳定性,分类结果更加精确客观。
Description
技术领域
本发明实施例涉及疟疾诊断技术领域,尤其涉及一种基于人工智能的疟疾分类方法及设备。
背景技术
疟疾仍是严重威胁人类健康的传染病之一,全球受威胁人数超过30亿人,每年超过2亿人发病,40多万人死亡。中国自2017年始已无本土疟疾发生,随着本土疟疾逐渐减少,诊断和实验室检测能力下降的问题逐渐突显出来。目前,镜检仍是疟疾诊断的常见方法,但该方法严重依赖检验人员的技能水平与经验,且境外以恶性疟流行为主,其它疟原虫均广泛存在,检验人员对不同虫种的鉴别也存在极大的困难,导致在少量数据下对疟疾种类的识别精度下降。因此,开发一种基于人工智能的疟疾分类方法及设备,可以有效克服上述相关技术中的缺陷,就成为业界亟待解决的技术问题。
发明内容
针对现有技术存在的上述问题,本发明实施例提供了一种基于人工智能的疟疾分类方法及设备。
第一方面,本发明的实施例提供了一种基于人工智能的疟疾分类方法,包括:对疟疾的病理图像进行分割得到实用级图像;在ResNetXt-50网络结构中加载通道注意力模式和空间注意力模式得到分类器;采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,根据提取的第二特征图对疟疾的种类进行区分。
在上述方法实施例内容的基础上,本发明实施例中提供的基于人工智能的疟疾分类方法,所述对疟疾的病理图像进行分割得到实用级图像,包括:将疟疾的病理图像分割为固定像素值的图像,对分割后的图像进行旋转、调整比例及颜色变换,得到所述实用级图像。
在上述方法实施例内容的基础上,本发明实施例中提供的基于人工智能的疟疾分类方法,所述ResNetXt-50网络结构在主卷积核两侧添加了1X1网络层,用于控制参数数量,所述主卷积核由若干不同维度的子卷积核堆叠构成。
在上述方法实施例内容的基础上,本发明实施例中提供的基于人工智能的疟疾分类方法,所述采用分类器中的通道注意力模式对实用级图像进行特征图提取,包括:
Mc(F)=σ{MLP[AvgPool(F)]+MLP[MaxPool(F)]}
其中,Mc(F)为通道注意力模式提取的第一特征图;σ为ReLU激活函数;MLP为三层感知机;AvgPool(F)为平均池化模式;MaxPool(F)为最大池化模式;F为实用级图像。
在上述方法实施例内容的基础上,本发明实施例中提供的基于人工智能的疟疾分类方法,所述采用分类器中的空间注意力模式对实用级图像进行特征图提取,包括:
Ms(F)=δ{f7×7([AvgPool(F);MaxPool(F)])}
其中,Ms(F)为空间注意力模式提取的第二特征图;δ为sigmoid激活函数;f7×7为7×7卷积核。
在上述方法实施例内容的基础上,本发明实施例中提供的基于人工智能的疟疾分类方法,在所述采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取之后,还包括:将提取第二特征图后生成的样本属于真实集合的概率输入损失函数中,若损失函数的输出值趋于一固定值,则确定第二特征图提取准确。
在上述方法实施例内容的基础上,本发明实施例中提供的基于人工智能的疟疾分类方法,所述损失函数包括:
FL(pt)=-(1-pt)γlog2(pt)
其中,FL(pt)为损失函数的输出值;pt为样本属于真实集合的概率;γ为聚焦参数。
第二方面,本发明的实施例提供了一种基于人工智能的疟疾分类装置,包括:
第一主模块,用于对疟疾的病理图像进行分割得到实用级图像;第二主模块,用于在ResNetXt-50网络结构中加载通道注意力模式和空间注意力模式得到分类器;第三主模块,用于采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,根据提取的第二特征图对疟疾的种类进行区分。
第三方面,本发明的实施例提供了一种电子设备,包括:
至少一个处理器;以及
与处理器通信连接的至少一个存储器,其中:
存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种实现方式中任一种实现方式所提供的基于人工智能的疟疾分类方法。
第四方面,本发明的实施例提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种实现方式中任一种实现方式所提供的基于人工智能的疟疾分类方法。
本发明实施例提供的基于人工智能的疟疾分类方法及设备,通过在ResNetXt-50网络结构中加载通道注意力模式和空间注意力模式得到分类器,并采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,可以根据第二特征图对疟疾的种类进行区分,实现了在少量数据下的疟疾种类的高精度识别,提高了对疟疾种类的识别准确率和稳定性,分类结果更加精确客观。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单的介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于人工智能的疟疾分类方法流程图;
图2为本发明实施例提供的基于人工智能的疟疾分类装置结构示意图;
图3为本发明实施例提供的电子设备的实体结构示意图;
图4为本发明实施例提供的不同深度下的ResNet网络结构示意图;
图5为本发明实施例提供的ResNeXt和ResNet的网络结构对比效果示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。另外,本发明提供的各个实施例或单个实施例中的技术特征可以相互任意结合,以形成可行的技术方案,这种结合不受步骤先后次序和/或结构组成模式的约束,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
基于人工智能的医学图像识别技术以其自动化程度高、通用性强、灵活性高,可学习性等优点已成功应用于各种医疗设备图像中。但是针对疟疾的识别中,由于图像放大倍数大,数据稀少,图形识别困难等因素阻碍了人工智能在疟疾识别的进一步发展。而且由于疟疾的稀少,专业的识别人员会越来越少,人工智能具备的自主学习特性可以在缺少专业人员的基础上,实现对疟疾种类的有效识别。基于这种认识,本发明实施例提供了一种基于人工智能的疟疾分类方法,参见图1,该方法包括:对疟疾的病理图像进行分割得到实用级图像;在ResNetXt-50网络结构中加载通道注意力模式和空间注意力模式得到分类器;采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,根据提取的第二特征图对疟疾的种类进行区分。
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类方法,所述对疟疾的病理图像进行分割得到实用级图像,包括:将疟疾的病理图像分割为固定(如1920*1280、1800*1000或1520*980)像素值的图像,对分割后的图像进行旋转、调整比例及颜色变换,得到所述实用级图像。
具体地,由于病理切片需要在显微镜下放大一千倍才可以观察到虫体,所以在得到病理图像之后,首先对疟疾的病理图像进行处理,首先把原图像分割为1920*1280(在另一实施例中可以为1800*1000或1520*980)大小的图像,然后对图像进行旋转,比例调整,颜色变换等处理用来做图像增强处理。
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类方法,所述ResNetXt-50网络结构在主卷积核两侧添加了1X1网络层,用于控制参数数量,所述主卷积核由若干不同维度的子卷积核堆叠构成。
具体地,在特征提取的过程中,使用ResNetXt-50作为基础网络结构,其以ResNet网络作为基础,同时采用VGG堆叠的思想和Inception里的split-transform-merge思想,而且可扩展性比较强,在增加准确率的同时基本不改变或降低模型的复杂度。不同深度的ResNet网络结构如图4所示,可以看到该网络中有conv1至conv5_x五个卷积层,维度从112X112至7X7递减,并在相应位置插入了最大池化max pool和平均池化average pool。ResNeXt相较于ResNet,加入了Inception里的split-transform-merge思想。ResNeXt(图5中右侧)和ResNet(图5中左侧)对比如图5所示,在图5左右网络有相同的参数个数,其中左边是ResNet的一个区块,右边的ResNeXt中每个分支一模一样,分支的个数就是基数。所谓split-transform-merge是指通过在主卷积核层两侧加入1x1的网络层,控制核个数,减少参数个数的方式。其中256、64和4均分别代表空间维度。
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类方法,所述采用分类器中的通道注意力模式对实用级图像进行特征图提取,包括:
Mc(F)=σ{MLP[AvgPool(F)]+MLP[MaxPool(F)]} (1)
其中,Mc(F)为通道注意力模式提取的第一特征图;σ为ReLU激活函数;MLP为三层感知机;AvgPool(F)为平均池化模式;MaxPool(F)为最大池化模式;F为实用级图像。
具体地,在网络中加入了通道注意力模式和空间注意力模式。通道注意力模式是对输入的实用级图像F按照取每个通道的最大池化模式和平均池化模式的结果,然后分别送入一个三层感知机MLP,输出结果相加,送入ReLU激活函数,得到通道注意力模式提取的第一特征图Mc(F),公式如(1)式所示。
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类方法,所述采用分类器中的空间注意力模式对实用级图像进行特征图提取,包括:
Ms(F)=δ{f7×7([AvgPool(F);MaxPool(F)])} (2)
其中,Ms(F)为空间注意力模式提取的第二特征图;δ为sigmoid激活函数;f7×7为7×7卷积核。
具体地,在通道注意力模式之后,通道注意力模式提取的第一特征图会被送入空间注意力模式继续处理,得到运用了空间注意力模式的最终的特征图(即空间注意力模式提取的第二特征图)。由通道注意力模式处理后的特征图F'(其实就是前面的Mc(F)),首先在通道维度上计算出Global Max Pooling和Global Average Pooling的两张特征图,将其以Concate方式连接起来,然后用一个传统卷积(f7×7)处理一次,最后使用Sigmoid激活就得到了空间注意力模式用到的特征图Ms(F),如(2)式所示。
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类方法,在所述采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取之后,还包括:将提取第二特征图后生成的样本属于真实集合的概率输入损失函数中,若损失函数的输出值趋于一固定值,则确定第二特征图提取准确。
基于上述方法实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类方法,所述损失函数包括:
FL(pt)=-(1-pt)γlog2(pt) (3)
其中,FL(pt)为损失函数的输出值;pt为样本属于真实集合的概率;γ为聚焦参数。
具体地,使用损失函数来解决难以区分的问题。在分类问题中,存在难易样本的问题。网络的训练由损失函数的值提供,通常来说损失值较大的样本称为困难样本,损失值较小的样本称为简单样本。通过引入两个额外的变量来区分对待每个样本,使得网络更专注于能给网络带来提升的样本从而提高准确率,具体如(3)式所示。
本发明实施例提供的基于人工智能的疟疾分类方法,通过在ResNetXt-50网络结构中加载通道注意力模式和空间注意力模式得到分类器,并采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,可以根据第二特征图对疟疾的种类进行区分,实现了在少量数据下的疟疾种类的高精度识别,提高了对疟疾种类的识别准确率和稳定性,分类结果更加精确客观。
基于人工智能的疟疾分类方法的训练过程如下:对搜集疟疾的病理图像按3:1的比例随机分为训练集或验证集。训练集用于构建AI模型,而验证集用于评估所构建模型的分类性能的准确性。基于深度学习,使用PyTorch平台采用了ImageNet数据集预训练的ResNeXt-50架构来开发的AI算法。重新训练包括初始化带有预训练权重的卷积层,并更新神经网络以识别疟疾的类别,如疟原虫,非疟原虫。在整个过程中网络结构保持不变。但是,调整了最后一个完全连接的层和最后三个卷积层的权重。在50个迭代之后(遍历整个数据集的迭代),如果未观察到准确性或交叉熵损失的进一步改善(即损失函数趋于一固定值),则停止训练。
本发明各个实施例的实现基础是通过具有处理器功能的设备进行程序化的处理实现的。因此在工程实际中,可以将本发明各个实施例的技术方案及其功能封装成各种模块。基于这种现实情况,在上述各实施例的基础上,本发明的实施例提供了一种基于人工智能的疟疾分类装置,该装置用于执行上述方法实施例中的基于人工智能的疟疾分类方法。参见图2,该装置包括:
第一主模块,用于对疟疾的病理图像进行分割得到实用级图像;第二主模块,用于在ResNetXt-50网络结构中加载通道注意力模式和空间注意力模式得到分类器;第三主模块,用于采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,根据提取的第二特征图对疟疾的种类进行区分。
本发明实施例提供的基于人工智能的疟疾分类装置,采用图2中的若干模块,通过在ResNetXt-50网络结构中加载通道注意力模式和空间注意力模式得到分类器,并采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,可以根据第二特征图对疟疾的种类进行区分,实现了在少量数据下的疟疾种类的高精度识别,提高了对疟疾种类的识别准确率和稳定性,分类结果更加精确客观。
需要说明的是,本发明提供的装置实施例中的装置,除了可以用于实现上述方法实施例中的方法外,还可以用于实现本发明提供的其他方法实施例中的方法,区别仅仅在于设置相应的功能模块,其原理与本发明提供的上述装置实施例的原理基本相同,只要本领域技术人员在上述装置实施例的基础上,参考其他方法实施例中的具体技术方案,通过组合技术特征获得相应的技术手段,以及由这些技术手段构成的技术方案,在保证技术方案具备实用性的前提下,就可以对上述装置实施例中的装置进行改进,从而得到相应的装置类实施例,用于实现其他方法类实施例中的方法。例如:
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类装置,还包括:第一子模块,用于实现所述对疟疾的病理图像进行分割得到实用级图像,包括:将疟疾的病理图像分割为固定(如1920*1280、1800*1000或1520*980)像素值的图像,对分割后的图像进行旋转、调整比例及颜色变换,得到所述实用级图像。
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类装置,还包括:第二子模块,用于实现所述ResNetXt-50网络结构在主卷积核两侧添加了1X1网络层,用于控制参数数量,所述主卷积核由若干不同维度的子卷积核堆叠构成。
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类装置,还包括:第三子模块,用于实现所述采用分类器中的通道注意力模式对实用级图像进行特征图提取,包括:
Mc(F)=σ{MLP[AvgPool(F)]+MLP[MaxPool(F)]}
其中,Mc(F)为通道注意力模式提取的第一特征图;σ为ReLU激活函数;MLP为三层感知机;AvgPool(F)为平均池化模式;MaxPool(F)为最大池化模式;F为实用级图像。
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类装置,还包括:第四子模块,用于实现所述采用分类器中的空间注意力模式对实用级图像进行特征图提取,包括:
Ms(F)=δ{f7×7([AvgPool(F);MaxPool(F)])}
其中,Ms(F)为空间注意力模式提取的第二特征图;δ为sigmoid激活函数;f7×7为7×7卷积核。
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类装置,还包括:第五子模块,用于实现在所述采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取之后,还包括:将提取第二特征图后生成的样本属于真实集合的概率输入损失函数中,若损失函数的输出值趋于一固定值,则确定第二特征图提取准确。
基于上述装置实施例的内容,作为一种可选的实施例,本发明实施例中提供的基于人工智能的疟疾分类装置,还包括:第六子模块,用于实现所述损失函数包括:
FL(pt)=-(1-pt)γlog2(pt)
其中,FL(pt)为损失函数的输出值;pt为样本属于真实集合的概率;γ为聚焦参数。
本发明实施例的方法是依托电子设备实现的,因此对相关的电子设备有必要做一下介绍。基于此目的,本发明的实施例提供了一种电子设备,如图3所示,该电子设备包括:至少一个处理器(processor)、通信接口(Communications Interface)、至少一个存储器(memory)和通信总线,其中,至少一个处理器,通信接口,至少一个存储器通过通信总线完成相互间的通信。至少一个处理器可以调用至少一个存储器中的逻辑指令,以执行前述各个方法实施例提供的方法的全部或部分步骤。
此外,上述的至少一个存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个方法实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。基于这种认识,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在本专利中,术语"包括"、"包含"或者其任何其它变体意在涵盖非排它性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括……"限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (5)
1.一种基于人工智能的疟疾分类方法,其特征在于,包括:对疟疾的病理图像进行分割得到实用级图像;在ResNetXt-50网络结构中加载通道注意力模式和空间注意力模式得到分类器;采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,根据提取的第二特征图对疟疾的种类进行区分;在所述采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取之后,还包括:将提取第二特征图后生成的样本属于真实集合的概率输入损失函数中,若损失函数的输出值趋于一固定值,则确定第二特征图提取准确;所述损失函数包括:
FL(pt)=-(1-pt)γlog2(pt)
其中,FL(pt)为损失函数的输出值;pt为样本属于真实集合的概率;γ为聚焦参数;所述ResNetXt-50网络结构在主卷积核两侧添加了1X1网络层,用于控制参数数量,所述主卷积核由若干不同维度的子卷积核堆叠构成;
所述采用分类器中的通道注意力模式对实用级图像进行特征图提取,包括:
Mc(F)=σ{MLP[AvgPool(F)]+MLP[MaxPool(F)]}
其中,Mc(F)为通道注意力模式提取的第一特征图;σ为ReLU激活函数;MLP为三层感知机;AvgPool(F)为平均池化模式;MaxPool(F)为最大池化模式;F为实用级图像;
所述采用分类器中的空间注意力模式对实用级图像进行特征图提取,包括:
Ms(F)=δ{f7×7([AvgPool(F);MaxPool(F)])}
其中,Ms(F)为空间注意力模式提取的第二特征图;δ为sigmoid激活函数;f7×7为7×7卷积核。
2.根据权利要求1所述的基于人工智能的疟疾分类方法,其特征在于,所述对疟疾的病理图像进行分割得到实用级图像,包括:将疟疾的病理图像分割为固定像素值的图像,对分割后的图像进行旋转、调整比例及颜色变换,得到所述实用级图像。
3.一种基于人工智能的疟疾分类装置,其特征在于,包括:第一主模块,用于对疟疾的病理图像进行分割得到实用级图像;第二主模块,用于在ResNetXt-50网络结构中加载通道注意力模式和空间注意力模式得到分类器;第三主模块,用于采用分类器中的通道注意力模式和空间注意力模式对实用级图像进行特征图提取,根据提取的第二特征图对疟疾的种类进行区分。
4.一种电子设备,其特征在于,包括:
至少一个处理器、至少一个存储器和通信接口;其中,
所述处理器、存储器和通信接口相互间进行通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以执行权利要求1至3任一项权利要求所述的方法。
5.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行权利要求1至3中任一项权利要求所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110342953.6A CN113223730B (zh) | 2021-03-30 | 2021-03-30 | 基于人工智能的疟疾分类方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110342953.6A CN113223730B (zh) | 2021-03-30 | 2021-03-30 | 基于人工智能的疟疾分类方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113223730A CN113223730A (zh) | 2021-08-06 |
CN113223730B true CN113223730B (zh) | 2023-06-06 |
Family
ID=77086100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110342953.6A Active CN113223730B (zh) | 2021-03-30 | 2021-03-30 | 基于人工智能的疟疾分类方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113223730B (zh) |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107492099B (zh) * | 2017-08-28 | 2021-08-20 | 京东方科技集团股份有限公司 | 医学图像分析方法、医学图像分析系统以及存储介质 |
CN110909756A (zh) * | 2018-09-18 | 2020-03-24 | 苏宁 | 用于医学图像识别的卷积神经网络模型训练方法和装置 |
CN110008846B (zh) * | 2019-03-13 | 2022-08-30 | 南京邮电大学 | 一种图像处理方法 |
CN110993094B (zh) * | 2019-11-19 | 2023-05-23 | 中国科学院深圳先进技术研究院 | 一种基于医学图像的智能辅助诊断方法及终端 |
CN111199212B (zh) * | 2020-01-02 | 2023-04-07 | 西安工程大学 | 基于注意力模型的行人属性识别方法 |
CN111310764B (zh) * | 2020-01-20 | 2024-03-26 | 上海商汤智能科技有限公司 | 网络训练、图像处理方法及装置、电子设备和存储介质 |
CN111340083A (zh) * | 2020-02-20 | 2020-06-26 | 京东方科技集团股份有限公司 | 医学图像的处理方法、装置、设备及存储介质 |
CN111458148A (zh) * | 2020-04-26 | 2020-07-28 | 上海电机学院 | 一种基于cbam的卷积神经网络滚动轴承故障诊断方法 |
-
2021
- 2021-03-30 CN CN202110342953.6A patent/CN113223730B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113223730A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110378381B (zh) | 物体检测方法、装置和计算机存储介质 | |
CN111784671B (zh) | 基于多尺度深度学习的病理图像病灶区域检测方法 | |
CN110310280B (zh) | 肝胆管及结石的图像识别方法、系统、设备及存储介质 | |
Popescu et al. | Retinal blood vessel segmentation using pix2pix gan | |
CN112581458B (zh) | 一种图像处理方法和装置 | |
CN113012163A (zh) | 一种基于多尺度注意力网络的视网膜血管分割方法、设备及存储介质 | |
CN109034218B (zh) | 模型训练方法、装置、设备及存储介质 | |
CN116563285B (zh) | 一种基于全神经网络的病灶特征识别与分割方法及系统 | |
CN111680755A (zh) | 医学图像识别模型构建及医学图像识别方法、装置、介质及终端 | |
CN115240240A (zh) | 基于yolo网络的红外人脸识别方法及系统 | |
CN114445356A (zh) | 基于多分辨率的全视野病理切片图像肿瘤快速定位方法 | |
Li et al. | Deep learning segmentation of glomeruli on kidney donor frozen sections | |
Barman et al. | Comparative assessment of Pest damage identification of coconut plant using damage texture and color analysis | |
CN113781403B (zh) | 一种胸部ct影像处理方法与装置 | |
CN112785575B (zh) | 一种图像处理的方法、装置和存储介质 | |
CN117095173A (zh) | 一种结直肠癌h&e染色病理图像语义分割方法及系统 | |
CN113223730B (zh) | 基于人工智能的疟疾分类方法及设备 | |
Goyzueta et al. | Integration of u-net, resu-net and deeplab architectures with intersection over union metric for cells nuclei image segmentation | |
CN116188501B (zh) | 基于多尺度交叉注意力的医学图像分割方法 | |
CN116030063B (zh) | Mri图像的分类诊断系统、方法、电子设备及介质 | |
Li et al. | Transfer learning performance analysis for VGG16 in hurricane damage building classification | |
Shah et al. | Reasoning over history: Context aware visual dialog | |
CN113283433A (zh) | 图像语义分割方法、系统、电子设备和存储介质 | |
CN113744166A (zh) | 一种用于浑浊水下鱼类图像增强的方法 | |
CN113496228A (zh) | 一种基于Res2Net、TransUNet和协同注意力的人体语义分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |