CN111695605B - 基于oct图像的图像识别方法、服务器及存储介质 - Google Patents
基于oct图像的图像识别方法、服务器及存储介质 Download PDFInfo
- Publication number
- CN111695605B CN111695605B CN202010431416.4A CN202010431416A CN111695605B CN 111695605 B CN111695605 B CN 111695605B CN 202010431416 A CN202010431416 A CN 202010431416A CN 111695605 B CN111695605 B CN 111695605B
- Authority
- CN
- China
- Prior art keywords
- image
- generator
- feature vector
- target
- discriminator
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 230000002159 abnormal effect Effects 0.000 claims abstract description 94
- 239000013598 vector Substances 0.000 claims description 170
- 230000006870 function Effects 0.000 claims description 69
- 238000004088 simulation Methods 0.000 claims description 32
- 238000012549 training Methods 0.000 claims description 29
- 238000004422 calculation algorithm Methods 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 9
- 230000002708 enhancing effect Effects 0.000 claims description 6
- 230000002401 inhibitory effect Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000012014 optical coherence tomography Methods 0.000 description 55
- 238000004891 communication Methods 0.000 description 7
- 230000003902 lesion Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000005856 abnormality Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000017105 transposition Effects 0.000 description 3
- 230000008485 antagonism Effects 0.000 description 2
- 230000001427 coherent effect Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及人工智能领域,公开了一种基于OCT图像的图像识别方法,应用于服务器,该方法包括获取不含异常区域的OCT图像作为样本图像构建生成式对抗网络,分别对生成式对抗网络的生成器与鉴别器进行训练得到目标鉴别器及目标生成器,对目标生成器和目标鉴别器进行交替迭代以对生成式对抗网络进行训练直至完成训练,获取客户端上传的待识别图像输入完成训练的生成式对抗网络得到模拟图像,利用第一算法计算模拟图像与待识别图像之间的异常分值,当异常分值大于第二预设阈值时,判断待识别图像为包含异常区域的异常图像。本发明能够提高识别判断OCT图像中反映的信息是否异常的准确性。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种基于OCT图像的图像识别方法、服务器及存储介质。
背景技术
OCT(光学相干层析技术,Optical Coherence tomography)是近十年迅速发展起来的一种成像技术,它利用弱相干光干涉仪的基本原理,检测生物组织不同深度层面对入射弱相干光的背向反射或几次散射信号,通过扫描,可得到生物组织二维或三维结构图像,即OCT图像。由于OCT图像的特殊性,通常需要人为借助特定仪器识别对应的OCT图像中反映的信息是否为异常,不仅图像识别准确率低,且图像结果识别效率不高,而随着神经网络的迅速发展,越来越多的神经网络也被应用到智能识别OCT图像是否异常的场景中。
由于现有的大多数神经网络在训练过程中需要用到大量的异常OCT图像(即包含疑似病灶区域的图像)样本,而在实际中,由于异常OCT图像涉及病人的隐私问题无法像正常OCT图像那样容易得到,导致了现有的神经网络运用在医学领域中存在很多困难,即使通过少量的异常OCT图像训练得到的识别模型也存在识别准确率低的问题。
发明内容
本发明的主要目的在于提供一种基于OCT图像的图像识别方法、服务器及存储介质,旨在如何根据不同语法的SQL快速精准地查询到对应的目标数据的问题。
为实现上述目的,本发明提供的一种基于OCT图像的图像识别方法,应用于服务器,该方法包括:
获取步骤:获取无异常区域的OCT图像作为样本图像,构建包括生成器和鉴别器的生成式对抗网络;
第一处理步骤:将所述样本图像输入所述生成器,采用生成器的卷积层对每个样本图像分别进行下采样得到第一图像,对所述第一图像进行高阶特征编码得到第一特征向量,计算每个第一特征向量与预设存储表中每个第二特征向量的相似度值,将最大相似度值对应的第二特征向量作为目标特征向量,将所述目标特征向量对应的第一特征向量作为第二特征向量存入所述预设存储表,采用所述生成器的转置卷积层对所述目标特征向量进行上采样得到模拟图像并作为所述生成器的输出结果;
第二处理步骤:基于所述输出结果,以最小化所述生成器的第一损失函数值为目标调整生成器的参数,当所述第一损失函数值小于第一预设阈值时,利用所述第一损失函数值更新生成器的参数得到目标生成器;
第三处理步骤:分别将所述样本图像及其对应的模拟图像输入所述鉴别器得到对应的第一概率值与第二概率值,基于所述第一概率值与第二概率值,以最小化所述鉴别器的第二损失函数值为目标调整鉴别器的参数,当所述第二损失函数值小于所述第一预设阈值时,利用所述第二损失函数值更新所述鉴别器的参数得到目标鉴别器,对所述目标生成器和目标鉴别器进行交替迭代以对所述生成式对抗网络进行训练直至完成训练;及
识别步骤:接收客户端上传的待识别图像并输入完成训练的所述生成式对抗网络得到模拟图像,利用第一算法计算所述模拟图像与待识别图像之间的异常分值,当所述异常分值大于所述第二预设阈值时,判断所述待识别图像为包含异常区域的异常图像。
优选地,所述将最大相似度值对应的所述第二特征向量作为目标特征向量包括:
将所述目标特征向量与第一特征向量输入权重计算公式得出数值在预设数值区间(例如0-0.1)的第一结果数据,所述提取权重计算公式为:
其中,wi表示目标特征向量的提取权重,exp表示以e为底数的指数运算符号,d表示第一特征向量与第二特征向量的相似度值,z表示第一图像的第一特征向量,m表示第一特征向量,mj表示第二特征向量,j表示预设存储表中第二特征向量的总数。
优选地,所述第一算法为:
A(x)=(1-λ)R(x)+λD(x)
其中,λ表示变量值,R(x)表示模拟图像与待识别图像的像素残差,D(x)表示鉴别器编码的高维空间残差。
优选地,该方法还包括目标检测步骤:
对所述待识别图像做高斯降采样得到第二图像;
对所述第二图像中大于Maximum/10的像素点做归一化,其中Maximum表示不同预设尺度的第二图像的亮度最大值;
构建九个尺度下的亮度高斯金字塔,利用Gabor滤波器构建四个方向,分别为θ{0°,45°,90°,135°}的方向高斯金字塔,得到亮度和方向高斯金字塔后,分别计算亮度和方向高斯金字塔对应的特征图,其中,亮度特征图为:I(c,s)=|I(c)-I(s)|,方向特征图为:O(c,s,θ)=|O(c,θ)-O(s,θ)|,c、s表示尺度参数,θ表示角度参数,c∈{2,3,4},s=c+δ,δ∈{3,4};
获取预设数量的特征图,抑制存在第一预设数量活动峰的特征图,增强存在第二预设数量活动峰的特征图,将所有特征图调整至统一尺寸后相加得到显著特征图,所述第一预设数量大于第二预设数量;及
利用第二算法分别计算所述待识别图像中每一个像素的异常概率值,分别将所述异常概率值与显著性特征图进行矩阵内积得到对应的第二结果数据,将所述第二结果数据大于或等于第三预设阈值对应的像素区域作为所述目标区域。
优选地,所述第二算法为:
B(x)=x-G(x)
其中,x表示待识别图像,G(x)表示生成器。
优选地,所述第一损失函数值的计算公式为:
Lg=Ex-ρ[log avg(E(x))+log(1-avg(E(G(x))))-αρ(z,E(G(x)))]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度。
优选地,所述第二损失函数值的计算公式为:
Ld=Ex-ρ[log avg(E(G(x)))-αρ(z,E(G(x)))]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度。
为实现上述目的,本发明还进一步提供一种服务器,所述服务器包括存储器和处理器,所述存储器上存储有基于OCT图像的图像识别程序,所述基于OCT图像的图像识别程序被所述处理器执行时实现如下步骤:
获取步骤:获取无异常区域的OCT图像作为样本图像,构建包括生成器和鉴别器的生成式对抗网络;
第一处理步骤:将所述样本图像输入所述生成器,采用生成器的卷积层对每个样本图像分别进行下采样得到第一图像,对所述第一图像进行高阶特征编码得到第一特征向量,计算每个第一特征向量与预设存储表中每个第二特征向量的相似度值,将最大相似度值对应的第二特征向量作为目标特征向量,将所述目标特征向量对应的第一特征向量作为第二特征向量存入所述预设存储表,采用所述生成器的转置卷积层对所述目标特征向量进行上采样得到模拟图像并作为所述生成器的输出结果;
第二处理步骤:基于所述输出结果,以最小化所述生成器的第一损失函数值为目标调整生成器的参数,当所述第一损失函数值小于第一预设阈值时,利用所述第一损失函数值更新生成器的参数得到目标生成器;
第三处理步骤:分别将所述样本图像及其对应的模拟图像输入所述鉴别器得到对应的第一概率值与第二概率值,基于所述第一概率值与第二概率值,以最小化所述鉴别器的第二损失函数值为目标调整鉴别器的参数,当所述第二损失函数值小于所述第一预设阈值时,利用所述第二损失函数值更新所述鉴别器的参数得到目标鉴别器,对所述目标生成器和目标鉴别器进行交替迭代以对所述生成式对抗网络进行训练直至完成训练;及
识别步骤:接收客户端上传的待识别图像并输入完成训练的所述生成式对抗网络得到模拟图像,利用第一算法计算所述模拟图像与待识别图像之间的异常分值,当所述异常分值大于所述第二预设阈值时,判断所述待识别图像为包含异常区域的异常图像。
优选地,对所述待识别图像做高斯降采样得到第二图像;
对所述第二图像中大于Maximum/10的像素点做归一化,其中Maximum表示不同预设尺度的第二图像的亮度最大值;
构建九个尺度下的亮度高斯金字塔,利用Gabor滤波器构建四个方向,分别为θ{0°,45°,90°,135°}的方向高斯金字塔,得到亮度和方向高斯金字塔后,分别计算亮度和方向高斯金字塔对应的特征图,其中,亮度特征图为:I(c,s)=|I(c)-I(s)|,方向特征图为:O(c,s,θ)=|O(c,θ)-O(s,θ)|,c、s表示尺度参数,θ表示角度参数,c∈{2,3,4},s=c+δ,δ∈{3,4};
获取预设数量的特征图,抑制存在第一预设数量活动峰的特征图,增强存在第二预设数量活动峰的特征图,将所有特征图调整至统一尺寸后相加得到显著特征图,所述第一预设数量大于第二预设数量;及
利用第二算法分别计算所述待识别图像中每一个像素的异常概率值,分别将所述异常概率值与显著性特征图进行矩阵内积得到对应的第二结果数据,将所述第二结果数据大于或等于第三预设阈值对应的像素区域作为所述目标区域。
为实现上述目的,本发明进一步提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于OCT图像的图像识别程序,所述基于OCT图像的图像识别程序可被一个或者多个处理器执行,以实现如上所述的基于OCT图像的图像识别方法的步骤。
本发明提出的基于OCT图像的图像识别方法、服务器及存储介质,通过获取不含异常区域的OCT图像作为样本图像构建生成式对抗网络,分别对生成式对抗网络的生成器与鉴别器进行训练得到目标鉴别器及目标生成器,对目标生成器和目标鉴别器进行交替迭代以对生成式对抗网络进行训练,直至训练完成,获取客户端上传的待识别图像输入生成式对抗网络得到模拟图像,利用第一算法计算模拟图像与待识别图像之间的异常分值,当异常分值大于第二预设阈值时,则判断待识别图像为包含异常区域的异常图像。本发明能够提高识别判断OCT图像中反映的信息是否异常的准确性。
附图说明
图1为本发明服务器较佳实施例的应用环境图;
图2为图1中基于OCT图像的图像识别程序较佳实施例的程序模块示意图;
图3为本发明基于OCT图像的图像识别方法较佳实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参附图做进一步说明。
具体实施方式
为了使本发明的目的、技术本实施例及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术本实施例可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术本实施例的结合出现相互矛盾或无法实现时应当认为这种技术本实施例的结合不存在,也不在本发明要求的保护范围之内。
本发明提供一种服务器1。
所述服务器1包括,但不仅限于,存储器11、处理器12及网络接口13。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是服务器1的内部存储单元,例如该服务器1的硬盘。存储器11在另一些实施例中也可以是服务器1的外部存储设备,例如该服务器1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
进一步地,存储器11还可以既包括服务器1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于服务器1的应用软件及各类数据,例如基于OCT图像的图像识别程序10的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行基于OCT图像的图像识别程序10等。
网络接口13可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该服务器1与其他电子设备之间建立通信连接。
客户端可以是桌上型计算机、笔记本、平板电脑、手机等。
网络可以为互联网、云网络、无线保真(Wi-Fi)网络、个人网(PAN)、局域网(LAN)和/或城域网(MAN)。网络环境中的各种设备可以被配置为根据各种有线和无线通信协议连接到通信网络。这样的有线和无线通信协议的例子可以包括但不限于以下中的至少一个:传输控制协议和互联网协议(TCP/IP)、用户数据报协议(UDP)、超文本传输协议(HTTP)、文件传输协议(FTP)、ZigBee、EDGE、IEEE 802.11、光保真(Li-Fi)、802.16、IEEE 802.11s、IEEE 802.11g、多跳通信、无线接入点(AP)、设备对设备通信、蜂窝通信协议和/或蓝牙(BlueTooth)通信协议或其组合。
可选地,该服务器1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以称为显示屏或显示单元,用于显示在服务器1中处理的信息以及用于显示可视化的用户界面。
图1仅示出了具有组件11-13以及基于OCT图像的图像识别程序10的服务器1,本领域技术人员可以理解的是,图1示出的结构并不构成对服务器1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在本实施例中,图1的基于OCT图像的图像识别程序10被处理器12执行时,实现以下步骤:
获取步骤:获取无异常区域的OCT图像作为样本图像,构建包括生成器和鉴别器的生成式对抗网络;
第一处理步骤:将所述样本图像输入所述生成器,采用生成器的卷积层对每个样本图像分别进行下采样得到第一图像,对所述第一图像进行高阶特征编码得到第一特征向量,计算每个第一特征向量与预设存储表中每个第二特征向量的相似度值,将最大相似度值对应的第二特征向量作为目标特征向量,将所述目标特征向量对应的第一特征向量作为第二特征向量存入所述预设存储表,采用所述生成器的转置卷积层对所述目标特征向量进行上采样得到模拟图像并作为所述生成器的输出结果;
第二处理步骤:基于所述输出结果,以最小化所述生成器的第一损失函数值为目标调整生成器的参数,当所述第一损失函数值小于第一预设阈值时,利用所述第一损失函数值更新生成器的参数得到目标生成器;
第三处理步骤:分别将所述样本图像及其对应的模拟图像输入所述鉴别器得到对应的第一概率值与第二概率值,基于所述第一概率值与第二概率值,以最小化所述鉴别器的第二损失函数值为目标调整鉴别器的参数,当所述第二损失函数值小于所述第一预设阈值时,利用所述第二损失函数值更新所述鉴别器的参数得到目标鉴别器,对所述目标生成器和目标鉴别器进行交替迭代以对所述生成式对抗网络进行训练直至完成训练;及
识别步骤:接收客户端上传的待识别图像并输入完成训练的所述生成式对抗网络得到模拟图像,利用第一算法计算所述模拟图像与待识别图像之间的异常分值,当所述异常分值大于所述第二预设阈值时,判断所述待识别图像为包含异常区域的异常图像。
在另一实施例中,该程序还执行以下步骤:
将所述目标特征向量与第一特征向量输入权重计算公式得出数值在预设数值区间(例如0-0.1)的第一结果数据,所述提取权重计算公式为:
其中,wi表示目标特征向量的提取权重,exp表示以e为底数的指数运算符号,d表示第一特征向量与第二特征向量的相似度值,z表示第一图像的第一特征向量,m表示第一特征向量,mj表示第二特征向量,j表示预设存储表中第二特征向量的总数。
在另一实施例中,该程序还执行以下步骤:
对所述待识别图像做高斯降采样得到第二图像;
对所述第二图像中大于Maximum/10的像素点做归一化,其中Maximum表示不同预设尺度的第二图像的亮度最大值;
构建九个尺度下的亮度高斯金字塔,利用Gabor滤波器构建四个方向,分别为θ{0°,45°,90°,135°}的方向高斯金字塔,得到亮度和方向高斯金字塔后,分别计算亮度和方向高斯金字塔对应的特征图,其中,亮度特征图为:I(c,s)=|I(c)-I(s)|,方向特征图为:O(c,s,θ)=|O(c,θ)-O(s,θ)|,c、s表示尺度参数,θ表示角度参数,c∈{2,3,4},s=c+δ,δ∈{3,4};
获取预设数量的特征图,抑制存在第一预设数量活动峰的特征图,增强存在第二预设数量活动峰的特征图,将所有特征图调整至统一尺寸后相加得到显著特征图,所述第一预设数量大于第二预设数量;及
利用第二算法分别计算所述待识别图像中每一个像素的异常概率值,分别将所述异常概率值与显著性特征图进行矩阵内积得到对应的第二结果数据,将所述第二结果数据大于或等于第三预设阈值对应的像素区域作为所述目标区域。
关于上述步骤的详细介绍,请参照下述图2关于基于OCT图像的图像识别程序10实施例的程序模块示意图及图3关于基于OCT图像的图像识别方法实施例的方法流程示意图的说明。
参照图2所示,为图1中基于OCT图像的图像识别程序10实施例的程序模块示意图。基于OCT图像的图像识别程序10被分割为多个模块,该多个模块存储于存储器11中,并由处理器12执行,以完成本发明。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。
在本实施例中,所述基于OCT图像的图像识别程序10包括获取模块110、第一处理模块120、第二处理模块130、第三处理模块140及识别模块150。
获取模块110,用于获取无异常区域的OCT图像作为样本图像,构建包括生成器和鉴别器的生成式对抗网络。
在本实施例中,通过获取大量不包含异常区域的OCT图像作为样本图像,构建生成式对抗网络。
其中,生成式对抗网络(GAN,Generative Adversarial Networks)是一种深度学习模型。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出,也称生成器G和鉴别器D。
例如,取一个生成器生成的模拟图像输入鉴别器,鉴别器根据输入的模拟图像发起投票来判断该输入模拟图像的真实程度,一般来说,鉴别器输出的数值越接近于0表示输入的模拟图像越真实,而输出的数值越接近1表示输入的模拟图像越虚假。生成器从一个真实图像中生成一个模拟图像输入并训练自己骗过鉴别器,使之认为其生成的模拟图像都是真实的。因此训练鉴别器的目标是使鉴别器最大化来自真实数据分布的图像,并最小化不是来自真实数据分布的图像。
因此,在本实施例中,通过生成式对抗网络能够生成与样本图像相似度最接近的模拟OCT图像,为后续利用生成式对抗网络生成的模拟OCT图像智能识别待识别图像是否异常(即是否包含疑似病灶的区域)。
第一处理模块120,用于将所述样本图像输入所述生成器,采用生成器的卷积层对每个样本图像分别进行下采样得到第一图像,对所述第一图像进行高阶特征编码得到第一特征向量,计算每个第一特征向量与预设存储表中每个第二特征向量的相似度值,将最大相似度值对应的第二特征向量作为目标特征向量,将所述目标特征向量对应的第一特征向量作为第二特征向量存入所述预设存储表,采用所述生成器的转置卷积层对所述目标特征向量进行上采样得到模拟图像并作为所述生成器的输出结果。
为了训练生成器能够生成与待识别图像相似度最高的模拟图像,因此,在本实施例中,首先将多个样本图像分别输入生成器中,采用步长为2的卷积层分别对每个样本图像进行多次下采样得到低分辨率的第一图像,并将第一图像进行高阶特征编码得到对应的第一特征向量,将每个第一特征向量分别与预设存储表中每个预设的第二特征向量进行相似度值计算得到对应的相似度值。
其中,所述预设存储表中预先存储有大量随机生成的图像特征向量,通过在训练生成器的过程中不断与样本图像进行相似度值计算,筛选出相似度值最大者对应的第二特征向量存入预设存储表中,由于样本图像是不包含异常区域的OCT图像,即正常图像,因此筛选出的第二特征向量具有正常图像的特征,即预设存储表中的第二特征向量均为正常图像的特征向量。
对生成器的每一次训练得到的第二特征向量都将对预设存储表进行优化,使得预设存储表中的第二特征向量更丰富且更接近正常图像。
所述相似度值计算方法可采用余弦相似度算法,利用余弦相似度算法计算出各个第一特征向量与第二特征向量对应的相似度值后,查询相似度值最大者对应的第二特征向量作为目标特征向量,再采用步长为2的转置卷积层对目标特征向量进行多次上采样直至恢复输入分辨率进行图像重建,生成高分辨率的模拟图像作为生成器的输出结果。
由于预设存储表中的每个预设的第二特征向量均接近正常图像的特征向量,因此不管输入生成器中的待识别图像是否异常,生成器输出的模拟图像都是不包含异常区域的正常图像,但是不管待识别图像的特征向量与预设存储表中的正常图像特征多接近,始终是跟正常图像的特征向量存在较大的差异,正常情况下,只有当输入生成器的待识别图像为正常图像,生成器输出的模拟图像才会跟待识别图像差异较小。因此,利用这一点,能够为后续通过计算模拟图像与待识别图像之间的异常分值,判断待识别图像是否异常。
在另一实施例中,为了避免极端情况下,部分输入生成器的包含异常区域(即包含疑似病灶区域)的异常图像通过复杂的特征向量组合得到的模拟图像与待识别图像进行差异对比效果不明显,影响本方案的识别精度,因此,所述查询相似度值最大者对应的所述第二特征向量作为目标特征向量包括:
将所述目标特征向量与第一特征向量输入权重计算公式得出数值在预设数值区间(例如0-0.1)的第一结果数据,所述提取权重计算公式为:
其中,wi表示目标特征向量的提取权重,exp表示以e为底数的指数运算符号,d表示第一特征向量与第二特征向量的相似度值,z表示第一图像的第一特征向量,m表示第一特征向量,mj表示第二特征向量,j表示预设存储表中第二特征向量的总数。
第二处理模块130,用于基于所述输出结果,以最小化所述生成器的第一损失函数值为目标调整生成器的参数,当所述第一损失函数值小于第一预设阈值时,利用所述第一损失函数值更新生成器的参数得到目标生成器。
为提高生成器输出的模拟图像更加客观准确,因此,在本实施例中,根据获得的第一输出结果,以最小化生成器的第一损失函数值为目标调整生成器的参数,当生成器的第一损失函数值小于第一预设阈值时,利用第一损失函数值更新生成器的参数,得到目标生成器。
所述第一损失函数值的计算公式为:
Lg=Ex-ρ[log avg(E(x))+log(1-avg(E(G(x))))-αρ(z,E(G(x)))]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度。
为了使生成器只在输入不含异常区域的OCT图像时可以较好地重建,因此设计了残差损失使得不含异常区域的图像样本和其生成的模拟图像的相似度最大化,因此,在另一实施例中,所述第一损失函数值的计算公式还可以是:
Lg=Ex-ρ[log avg(E(x))+log(1-avg(E(G(x))))-αρ(z,E(G(x)))]+μEx-ρ[x-G(x)]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度,μ表示变量值。
为了避免包含异常区域的异常图像也被很好地重建,通过约束预设存储表中特征向量的提取权重使其进一步稀疏化,因此,在另一实施例中,所述第一损失函数值的计算公式还可以是:
Lg=Ex-ρ[log avg(E(x))+log(1-avg(E(G(x))))-αρ(z,E(G(x)))]+μEx-ρ[x-G(x)]+Ew-ρ[-log(w)]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度,μ表示变量值,w表示目标特征向量的提取权重。
第三处理模块140,用于分别将所述样本图像及其对应的模拟图像输入所述鉴别器得到对应的第一概率值与第二概率值,基于所述第一概率值与第二概率值,以最小化所述鉴别器的第二损失函数值为目标调整鉴别器的参数,当所述第二损失函数值小于所述第一预设阈值时,利用所述第二损失函数值更新所述鉴别器的参数得到目标鉴别器,对所述目标生成器和目标鉴别器进行交替迭代以对所述生成式对抗网络进行训练直至完成训练。
在本实施例中,分别将样本图像及其对应的模拟图像输入鉴别器得到第一概率值与第二概率值,基于第一概率值与第二概率值,以最小化鉴别器的第二损失函数值为目标调整鉴别器的参数,当鉴别器的第二损失函数值小于第一预设阈值时,利用第二损失函数值更新鉴别器的参数,得到目标鉴别器,对目标生成器和目标鉴别器进行交替迭代以对生成式对抗网络进行训练直至完成训练。
对目标生成器和目标鉴别器进行交替迭代采用的方法为最大最小化目标函数,分别对生成器G和鉴别器D进行交互迭代,固定生成器G时优化鉴别器D,固定鉴别器D时优化生成器G,直到过程收敛。
所述第二损失函数值的计算公式为:
Ld=Ex-ρ[log avg(E(G(x)))-αρ(z,E(G(x)))]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度。加入的约束项使得判别网络在正确输出图像真假标签的同时具备了图像编码的能力,这使得本方案识别待识别图像正异常的准确率得到提升。
识别模块150,用于接收客户端上传的待识别图像并输入完成训练的所述生成式对抗网络得到模拟图像,利用第一算法计算所述模拟图像与待识别图像之间的异常分值,当所述异常分值大于所述第二预设阈值时,判断所述待识别图像为包含异常区域的异常图像。
在完成对生成式对抗网络的训练后,服务器1通过将获取到客户端上传的待识别图像输入生成式对抗网络得到模拟图像,利用预先确定的第一算法计算模拟图像与待识别图像之间的异常分值,当异常分值大于第二预设阈值时,则判断待识别图像为包含异常区域的异常图像。
所述第一算法为:
A(x)=(1-λ)R(x)+λD(x)
其中,λ表示变量值,R(x)表示模拟图像与待识别图像的像素残差,D(x)表示鉴别器编码的高维空间残差。
在另一实施例中,为了能够识别出包含异常区域的OCT图像中异常区域(即疑似病灶区域)的位置,因此,该程序还执行目标检测模块,用于:
对所述待识别图像做高斯降采样得到第二图像;
对所述第二图像中大于Maximum/10的像素点做归一化,其中Maximum表示不同预设尺度的第二图像的亮度最大值;
构建九个尺度下的亮度高斯金字塔,利用Gabor滤波器构建四个方向,分别为θ{0°,45°,90°,135°}的方向高斯金字塔,得到亮度和方向高斯金字塔后,分别计算亮度和方向高斯金字塔对应的特征图,其中,亮度特征图为:I(c,s)=|I(c)-I(s)|,方向特征图为:O(c,s,θ)=|O(c,θ)-O(s,θ)|,c、s表示尺度参数,θ表示角度参数,c∈{2,3,4},s=c+δ,δ∈{3,4};
获取预设数量(例如30)的特征图,抑制存在第一预设数量活动峰的特征图,增强存在第二预设数量活动峰的特征图,将所有所述特征图调整至统一尺寸(例如待识别图像的四分之一)后相加得到显著特征图,所述第一预设数量大于第二预设数量;及
利用第二算法分别计算所述待识别图像中每一个像素的异常概率值,分别将所述异常概率值与显著性特征图进行矩阵内积得到对应的第二结果数据,将所述第二结果数据大于或等于第三预设阈值对应的像素区域作为所述目标区域,所述第二算法为:
B(x)=x-G(x)
其中,x表示待识别图像,G(x)表示生成器。
此外,本发明还提供一种基于OCT图像的图像识别方法。参照图3所示,为本发明基于OCT图像的图像识别方法的实施例的方法流程示意图。服务器1的处理器12执行存储器11中存储的基于OCT图像的图像识别程序10时实现基于OCT图像的图像识别方法的如下步骤:
S110,获取无异常区域的OCT图像作为样本图像,构建包括生成器和鉴别器的生成式对抗网络。
在本实施例中,通过获取大量不包含异常区域的OCT图像作为样本图像,构建生成式对抗网络。
其中,生成式对抗网络(GAN,Generative Adversarial Networks)是一种深度学习模型。模型通过框架中(至少)两个模块:生成模型(Generative Model)和判别模型(Discriminative Model)的互相博弈学习产生相当好的输出,也称生成器G和鉴别器D。
例如,取一个生成器生成的模拟图像输入鉴别器,鉴别器根据输入的模拟图像发起投票来判断该输入模拟图像的真实程度,一般来说,鉴别器输出的数值越接近于0表示输入的模拟图像越真实,而输出的数值越接近1表示输入的模拟图像越虚假。生成器从一个真实图像中生成一个模拟图像输入并训练自己骗过鉴别器,使之认为其生成的模拟图像都是真实的。因此训练鉴别器的目标是使鉴别器最大化来自真实数据分布的图像,并最小化不是来自真实数据分布的图像。
因此,在本实施例中,通过生成式对抗网络能够生成与样本图像相似度最接近的模拟OCT图像,为后续利用生成式对抗网络生成的模拟OCT图像智能识别待识别图像是否异常(即是否包含疑似病灶的区域)。
S120,将所述样本图像输入所述生成器,采用生成器的卷积层对每个样本图像分别进行下采样得到第一图像,对所述第一图像进行高阶特征编码得到第一特征向量,计算每个第一特征向量与预设存储表中每个第二特征向量的相似度值,将最大相似度值对应的第二特征向量作为目标特征向量,将所述目标特征向量对应的第一特征向量作为第二特征向量存入所述预设存储表,采用所述生成器的转置卷积层对所述目标特征向量进行上采样得到模拟图像并作为所述生成器的输出结果。
为了训练生成器能够生成与待识别图像相似度最高的模拟图像,因此,在本实施例中,首先将多个样本图像分别输入生成器中,采用步长为2的卷积层分别对每个样本图像进行多次下采样得到低分辨率的第一图像,并将第一图像进行高阶特征编码得到对应的第一特征向量,将每个第一特征向量分别与预设存储表中每个预设的第二特征向量进行相似度值计算得到对应的相似度值。
其中,所述预设存储表中预先存储有大量随机生成的图像特征向量,通过在训练生成器的过程中不断与样本图像进行相似度值计算,筛选出相似度值最大者对应的第二特征向量存入预设存储表中,由于样本图像是不包含异常区域的OCT图像,即正常图像,因此筛选出的第二特征向量具有正常图像的特征,即预设存储表中的第二特征向量均为正常图像的特征向量。
对生成器的每一次训练得到的第二特征向量都将对预设存储表进行优化,使得预设存储表中的第二特征向量更丰富且更接近正常图像。
所述相似度值计算方法可采用余弦相似度算法,利用余弦相似度算法计算出各个第一特征向量与第二特征向量对应的相似度值后,查询相似度值最大者对应的第二特征向量作为目标特征向量,再采用步长为2的转置卷积层对目标特征向量进行多次上采样直至恢复输入分辨率进行图像重建,生成高分辨率的模拟图像作为生成器的输出结果。
由于预设存储表中的每个预设的第二特征向量均接近正常图像的特征向量,因此不管输入生成器中的待识别图像是否异常,生成器输出的模拟图像都是不包含异常区域的正常图像,但是不管待识别图像的特征向量与预设存储表中的正常图像特征多接近,始终是跟正常图像的特征向量存在较大的差异,正常情况下,只有当输入生成器的待识别图像为正常图像,生成器输出的模拟图像才会跟待识别图像差异较小。因此,利用这一点,能够为后续通过计算模拟图像与待识别图像之间的异常分值,判断待识别图像是否异常。
在另一实施例中,为了避免极端情况下,部分输入生成器的包含异常区域(即包含疑似病灶区域)的异常图像通过复杂的特征向量组合得到的模拟图像与待识别图像进行差异对比效果不明显,影响本方案的识别精度,因此,所述查询相似度值最大者对应的所述第二特征向量作为目标特征向量包括:
将所述目标特征向量与第一特征向量输入权重计算公式得出数值在预设数值区间(例如0-0.1)的第一结果数据,所述提取权重计算公式为:
其中,wi表示目标特征向量的提取权重,exp表示以e为底数的指数运算符号,d表示第一特征向量与第二特征向量的相似度值,z表示第一图像的第一特征向量,m表示第一特征向量,mj表示第二特征向量,j表示预设存储表中第二特征向量的总数。
S130,基于所述输出结果,以最小化所述生成器的第一损失函数值为目标调整生成器的参数,当所述第一损失函数值小于第一预设阈值时,利用所述第一损失函数值更新生成器的参数得到目标生成器。
为提高生成器输出的模拟图像更加客观准确,因此,在本实施例中,根据获得的第一输出结果,以最小化生成器的第一损失函数值为目标调整生成器的参数,当生成器的第一损失函数值小于第一预设阈值时,利用第一损失函数值更新生成器的参数,得到目标生成器。
所述第一损失函数值的计算公式为:
Lg=Ex-ρ[log avg(E(x))+log(1-avg(E(G(x))))-αρ(z,E(G(x)))]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度。
为了使生成器只在输入不含异常区域的OCT图像时可以较好地重建,因此设计了残差损失使得不含异常区域的图像样本和其生成的模拟图像的相似度最大化,因此,在另一实施例中,所述第一损失函数值的计算公式还可以是:
Lg=Ex-ρ[log avg(E(x))+log(1-avg(E(G(x))))-αρ(z,E(G(x)))]+μEx-ρ[x-G(x)]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度,μ表示变量值。
为了避免包含异常区域的异常图像也被很好地重建,通过约束预设存储表中特征向量的提取权重使其进一步稀疏化,因此,在另一实施例中,所述第一损失函数值的计算公式还可以是:
Lg=Ex-ρ[log avg(E(x))+log(1-avg(E(G(x))))-αρ(z,E(G(x)))]+μEx-ρ[x-G(x)]+Ew-ρ[-log(w)]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度,μ表示变量值,w表示目标特征向量的提取权重。
S140,分别将所述样本图像及其对应的模拟图像输入所述鉴别器得到对应的第一概率值与第二概率值,基于所述第一概率值与第二概率值,以最小化所述鉴别器的第二损失函数值为目标调整鉴别器的参数,当所述第二损失函数值小于所述第一预设阈值时,利用所述第二损失函数值更新所述鉴别器的参数得到目标鉴别器,对所述目标生成器和目标鉴别器进行交替迭代以对所述生成式对抗网络进行训练直至完成训练。
在本实施例中,分别将样本图像及其对应的模拟图像输入鉴别器得到第一概率值与第二概率值,基于第一概率值与第二概率值,以最小化鉴别器的第二损失函数值为目标调整鉴别器的参数,当鉴别器的第二损失函数值小于第一预设阈值时,利用第二损失函数值更新鉴别器的参数,得到目标鉴别器,对目标生成器和目标鉴别器进行交替迭代以对生成式对抗网络进行训练直至完成训练。
对目标生成器和目标鉴别器进行交替迭代采用的方法为最大最小化目标函数,分别对生成器G和鉴别器D进行交互迭代,固定生成器G时优化鉴别器D,固定鉴别器D时优化生成器G,直到过程收敛。
所述第二损失函数值的计算公式为:
Ld=Ex-ρ[log avg(E(G(x)))-αρ(z,E(G(x)))]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,β表示E(G(x))与z之间的相关度。加入的约束项使得判别网络在正确输出图像真假标签的同时具备了图像编码的能力,这使得本方案识别待识别图像正异常的准确率得到提升。
S150,接收客户端上传的待识别图像并输入完成训练的所述生成式对抗网络得到模拟图像,利用第一算法计算所述模拟图像与待识别图像之间的异常分值,当所述异常分值大于所述第二预设阈值时,判断所述待识别图像为包含异常区域的异常图像。
在完成对生成式对抗网络的训练后,服务器1通过将获取到客户端上传的待识别图像输入生成式对抗网络得到模拟图像,利用预先确定的第一算法计算模拟图像与待识别图像之间的异常分值,当异常分值大于第二预设阈值时,则判断待识别图像为包含异常区域的异常图像。
所述第一算法为:
A(x)=(1-λ)R(x)+λD(x)
其中,λ表示变量值,R(x)表示模拟图像与待识别图像的像素残差,D(x)表示鉴别器编码的高维空间残差。
在另一实施例中,为了能够识别出包含异常区域的OCT图像中异常区域(即疑似病灶区域)的位置,因此,该方法还包括目标检测步骤:
对所述待识别图像做高斯降采样得到第二图像;
对所述第二图像中大于Maximum/10的像素点做归一化,其中Maximum表示不同预设尺度的第二图像的亮度最大值;
构建九个尺度下的亮度高斯金字塔,利用Gabor滤波器构建四个方向,分别为θ{0°,45°,90°,135°}的方向高斯金字塔,得到亮度和方向高斯金字塔后,分别计算亮度和方向高斯金字塔对应的特征图,其中,亮度特征图为:I(c,s)=|I(c)-I(s)|,方向特征图为:O(c,s,θ)=|O(c,θ)-O(s,θ)|,c、s表示尺度参数,θ表示角度参数,c∈{2,3,4},s=c+δ,δ∈{3,4};
获取预设数量(例如30)的特征图,抑制存在第一预设数量活动峰的特征图,增强存在第二预设数量活动峰的特征图,将所有所述特征图调整至统一尺寸(例如待识别图像的四分之一)后相加得到显著特征图,所述第一预设数量大于第二预设数量;及
利用第二算法分别计算所述待识别图像中每一个像素的异常概率值,分别将所述异常概率值与显著性特征图进行矩阵内积得到对应的第二结果数据,将所述第二结果数据大于或等于第三预设阈值对应的像素区域作为所述目标区域,所述第二算法为:
B(x)=x-G(x)
其中,x表示待识别图像,G(x)表示生成器。
此外,本发明实施例还提出一种计算机可读存储介质,计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等中的任意一种或者几种的任意组合。计算机可读存储介质中包括基于OCT图像的图像识别程序10,本发明之计算机可读存储介质的具体实施方式与上述基于OCT图像的图像识别方法以及服务器1的具体实施方式大致相同,在此不再赘述。
需要说明的是,上述本发明实施例序日仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
上述本发明实施例序日仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术本实施例本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种基于OCT图像的图像识别方法,应用于服务器,其特征在于,该方法包括:
获取步骤:获取无异常区域的OCT图像作为样本图像,构建包括生成器和鉴别器的生成式对抗网络;
第一处理步骤:将所述样本图像输入所述生成器,采用生成器的卷积层对每个样本图像分别进行下采样得到第一图像,对所述第一图像进行高阶特征编码得到第一特征向量,计算每个第一特征向量与预设存储表中每个第二特征向量的相似度值,将最大相似度值对应的第二特征向量作为目标特征向量,将所述目标特征向量对应的第一特征向量作为第二特征向量存入所述预设存储表,采用所述生成器的转置卷积层对所述目标特征向量进行上采样得到模拟图像并作为所述生成器的输出结果;
第二处理步骤:基于所述输出结果,以最小化所述生成器的第一损失函数值为目标调整生成器的参数,当所述第一损失函数值小于第一预设阈值时,利用所述第一损失函数值更新生成器的参数得到目标生成器;
第三处理步骤:分别将所述样本图像及其对应的模拟图像输入所述鉴别器得到对应的第一概率值与第二概率值,基于所述第一概率值与第二概率值,以最小化所述鉴别器的第二损失函数值为目标调整鉴别器的参数,当所述第二损失函数值小于所述第一预设阈值时,利用所述第二损失函数值更新所述鉴别器的参数得到目标鉴别器,对所述目标生成器和目标鉴别器进行交替迭代以对所述生成式对抗网络进行训练直至完成训练;及
识别步骤:接收客户端上传的待识别图像并输入完成训练的所述生成式对抗网络得到模拟图像,利用第一算法计算所述模拟图像与待识别图像之间的异常分值,当所述异常分值大于第二预设阈值时,判断所述待识别图像为包含异常区域的异常图像;
其中,该方法还包括目标检测步骤:
对所述待识别图像做高斯降采样得到第二图像;
对所述第二图像中大于Maximum/10的像素点做归一化,其中Maximum表示不同预设尺度的第二图像的亮度最大值;
构建九个尺度下的亮度高斯金字塔,利用Gabor滤波器构建四个方向,分别为θ{0°,45°,90°,135°}的方向高斯金字塔,得到亮度和方向高斯金字塔后,分别计算亮度和方向高斯金字塔对应的特征图,其中,亮度特征图为:I(c,s)=|I(c)-I(s)|,方向特征图为:O(c,s,θ)=|O(c,θ)-O(s,θ)|,c、s表示尺度参数,θ表示角度参数,c∈{2,3,4},s=c+δ,δ∈{3,4};
获取预设数量的特征图,抑制存在第一预设数量活动峰的特征图,增强存在第二预设数量活动峰的特征图,将所有特征图调整至统一尺寸后相加得到显著特征图,所述第一预设数量大于第二预设数量;及
利用第二算法分别计算所述待识别图像中每一个像素的异常概率值,分别将所述异常概率值与显著性特征图进行矩阵内积得到对应的第二结果数据,将所述第二结果数据大于或等于第三预设阈值对应的像素区域作为目标区域。
2.如权利要求1所述的基于OCT图像的图像识别方法,其特征在于,所述将最大相似度值对应的所述第二特征向量作为目标特征向量包括:
将所述目标特征向量与第一特征向量输入权重计算公式得出数值在预设数值区间的第一结果数据,提取权重计算公式为:
其中,wi表示目标特征向量的提取权重,exp表示以e为底数的指数运算符号,d表示第一特征向量与第二特征向量的相似度值,z表示第一图像的第一特征向量,m表示第一特征向量,mj表示第二特征向量,j表示预设存储表中第二特征向量的总数。
3.如权利要求1所述的基于OCT图像的图像识别方法,其特征在于,所述第一算法为:
A(x)=(1-λ)R(x)+λD(x)
其中,λ表示变量值,R(x)表示模拟图像与待识别图像的像素残差,D(x)表示鉴别器编码的高维空间残差。
4.如权利要求1所述的基于OCT图像的图像识别方法,其特征在于,所述第二算法为:
B(x)=x-G(x)
其中,x表示待识别图像,G(x)表示生成器。
5.如权利要求1所述的基于OCT图像的图像识别方法,其特征在于,所述第一损失函数值的计算公式为:
Lg=Ex-ρ[logavg(E(x))+log(1-avg(E(G(x))))-αρ(z,E(G(x)))]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,ρ表示E(G(x))与z之间的相关度。
6.如权利要求1所述的基于OCT图像的图像识别方法,其特征在于,所述第二损失函数值的计算公式为:
Ld=Ex-ρ[logavg(E(G(x)))-αρ(z,E(G(x)))]
其中,x表示样本图像,E(x)表示鉴别器中的卷积层,G(x)表示生成器,E(G(x))表示生成器中的卷积层α表示权重系数,ρ表示E(G(x))与z之间的相关度。
7.一种服务器,用于实现如权利要求1-6中任一项所述的基于OCT图像的图像识别方法,其特征在于,所述服务器包括存储器和处理器,所述存储器上存储有基于OCT图像的图像识别程序,所述基于OCT图像的图像识别程序被所述处理器执行时实现如下步骤:
获取步骤:获取无异常区域的OCT图像作为样本图像,构建包括生成器和鉴别器的生成式对抗网络;
第一处理步骤:将所述样本图像输入所述生成器,采用生成器的卷积层对每个样本图像分别进行下采样得到第一图像,对所述第一图像进行高阶特征编码得到第一特征向量,计算每个第一特征向量与预设存储表中每个第二特征向量的相似度值,将最大相似度值对应的第二特征向量作为目标特征向量,将所述目标特征向量对应的第一特征向量作为第二特征向量存入所述预设存储表,采用所述生成器的转置卷积层对所述目标特征向量进行上采样得到模拟图像并作为所述生成器的输出结果;
第二处理步骤:基于所述输出结果,以最小化所述生成器的第一损失函数值为目标调整生成器的参数,当所述第一损失函数值小于第一预设阈值时,利用所述第一损失函数值更新生成器的参数得到目标生成器;
第三处理步骤:分别将所述样本图像及其对应的模拟图像输入所述鉴别器得到对应的第一概率值与第二概率值,基于所述第一概率值与第二概率值,以最小化所述鉴别器的第二损失函数值为目标调整鉴别器的参数,当所述第二损失函数值小于所述第一预设阈值时,利用所述第二损失函数值更新所述鉴别器的参数得到目标鉴别器,对所述目标生成器和目标鉴别器进行交替迭代以对所述生成式对抗网络进行训练直至完成训练;及
识别步骤:接收客户端上传的待识别图像并输入完成训练的所述生成式对抗网络得到模拟图像,利用第一算法计算所述模拟图像与待识别图像之间的异常分值,当所述异常分值大于第二预设阈值时,判断所述待识别图像为包含异常区域的异常图像。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于OCT图像的图像识别程序,所述基于OCT图像的图像识别程序可被一个或者多个处理器执行,以实现如权利要求1-6中任一项所述的基于OCT图像的图像识别方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010431416.4A CN111695605B (zh) | 2020-05-20 | 2020-05-20 | 基于oct图像的图像识别方法、服务器及存储介质 |
PCT/CN2020/098976 WO2021151276A1 (zh) | 2020-05-20 | 2020-06-29 | 基于oct图像的图像识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010431416.4A CN111695605B (zh) | 2020-05-20 | 2020-05-20 | 基于oct图像的图像识别方法、服务器及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111695605A CN111695605A (zh) | 2020-09-22 |
CN111695605B true CN111695605B (zh) | 2024-05-10 |
Family
ID=72478035
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010431416.4A Active CN111695605B (zh) | 2020-05-20 | 2020-05-20 | 基于oct图像的图像识别方法、服务器及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111695605B (zh) |
WO (1) | WO2021151276A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112465819A (zh) * | 2020-12-18 | 2021-03-09 | 平安科技(深圳)有限公司 | 图像异常区域检测方法、装置、电子设备及存储介质 |
CN112668462B (zh) * | 2020-12-25 | 2024-05-07 | 平安科技(深圳)有限公司 | 车损检测模型训练、车损检测方法、装置、设备及介质 |
CN113724214B (zh) * | 2021-08-23 | 2024-02-23 | 唯智医疗科技(佛山)有限公司 | 一种基于神经网络的图像处理方法及装置 |
CN113778719B (zh) * | 2021-09-16 | 2024-02-02 | 北京中科智眼科技有限公司 | 基于复制粘贴的异常检测算法 |
CN114612484B (zh) * | 2022-03-07 | 2023-07-07 | 中国科学院苏州生物医学工程技术研究所 | 基于无监督学习的视网膜oct图像分割方法 |
CN114418130B (zh) * | 2022-03-30 | 2022-07-15 | 中国科学技术大学 | 一种模型训练方法、数据处理方法及相关设备 |
CN114663428B (zh) * | 2022-05-16 | 2022-09-02 | 网思科技股份有限公司 | 基于人工智能的物体表面异常检测方法、装置及相关设备 |
CN114947734A (zh) * | 2022-05-18 | 2022-08-30 | 苏州比格威医疗科技有限公司 | 基于视网膜oct图像的cnv病灶伪造方法、装置及系统 |
CN114943639B (zh) * | 2022-05-24 | 2023-03-28 | 北京瑞莱智慧科技有限公司 | 图像获取方法、相关装置及存储介质 |
CN115238805B (zh) * | 2022-07-29 | 2023-12-15 | 中国电信股份有限公司 | 异常数据识别模型的训练方法及相关设备 |
CN115620082B (zh) * | 2022-09-29 | 2023-09-01 | 合肥的卢深视科技有限公司 | 模型训练方法、头部姿态估计方法、电子设备及存储介质 |
CN116343137B (zh) * | 2023-02-21 | 2024-04-19 | 北京海上升科技有限公司 | 一种基于人工智能的尾气异常汽车大数据检测方法及系统 |
CN116310734B (zh) * | 2023-04-25 | 2023-12-15 | 慧铁科技股份有限公司 | 基于深度学习的铁路货车走行部的故障检测方法及系统 |
CN116542956B (zh) * | 2023-05-25 | 2023-11-17 | 广州机智云物联网科技有限公司 | 一种织物组分自动检测方法、系统及可读存储介质 |
CN116797889B (zh) * | 2023-08-24 | 2023-12-08 | 青岛美迪康数字工程有限公司 | 医学影像识别模型的更新方法、装置和计算机设备 |
CN117633867A (zh) * | 2023-10-26 | 2024-03-01 | 唐山启奥科技股份有限公司 | 医疗图像脱敏方法、装置、电子设备及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564611A (zh) * | 2018-03-09 | 2018-09-21 | 天津大学 | 一种基于条件生成对抗网络的单目图像深度估计方法 |
CN109166126A (zh) * | 2018-08-13 | 2019-01-08 | 苏州比格威医疗科技有限公司 | 一种基于条件生成式对抗网络在icga图像上分割漆裂纹的方法 |
CN110070124A (zh) * | 2019-04-15 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 一种基于生成式对抗网络的图像扩增方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108734673B (zh) * | 2018-04-20 | 2019-11-15 | 平安科技(深圳)有限公司 | 去网纹系统训练方法、去网纹方法、装置、设备及介质 |
KR102661434B1 (ko) * | 2018-09-30 | 2024-04-29 | 보에 테크놀로지 그룹 컴퍼니 리미티드 | 이미지 처리를 위한 장치 및 방법, 및 신경 네트워크를 트레이닝하기 위한 시스템 |
-
2020
- 2020-05-20 CN CN202010431416.4A patent/CN111695605B/zh active Active
- 2020-06-29 WO PCT/CN2020/098976 patent/WO2021151276A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108564611A (zh) * | 2018-03-09 | 2018-09-21 | 天津大学 | 一种基于条件生成对抗网络的单目图像深度估计方法 |
CN109166126A (zh) * | 2018-08-13 | 2019-01-08 | 苏州比格威医疗科技有限公司 | 一种基于条件生成式对抗网络在icga图像上分割漆裂纹的方法 |
CN110070124A (zh) * | 2019-04-15 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 一种基于生成式对抗网络的图像扩增方法及系统 |
Non-Patent Citations (2)
Title |
---|
A Model of Saliency-Based Visual Attention for Rapid Scene Analysis;Laurent Itti等;《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》;19981130;第1页至第6页 * |
Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery;Thomas Schlegl等;《https://arxiv.org/abs/1703.05921》;20170523;第1页至第12页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111695605A (zh) | 2020-09-22 |
WO2021151276A1 (zh) | 2021-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111695605B (zh) | 基于oct图像的图像识别方法、服务器及存储介质 | |
US20230081645A1 (en) | Detecting forged facial images using frequency domain information and local correlation | |
CN111340214B (zh) | 对抗攻击模型的训练方法及装置 | |
JP6167733B2 (ja) | 生体特徴ベクトル抽出装置、生体特徴ベクトル抽出方法、および生体特徴ベクトル抽出プログラム | |
CN109255392B (zh) | 基于非局部神经网络的视频分类方法、装置及设备 | |
CN110705392A (zh) | 一种人脸图像检测方法及装置、存储介质 | |
US9171226B2 (en) | Image matching using subspace-based discrete transform encoded local binary patterns | |
CN106780662B (zh) | 人脸图像生成方法、装置及设备 | |
KR102440385B1 (ko) | 멀티 인식모델의 결합에 의한 행동패턴 인식방법 및 장치 | |
US20220012474A1 (en) | Evaluating The Security Of A Facial Recognition System Using Light Projections | |
US11604963B2 (en) | Feedback adversarial learning | |
CN108875549B (zh) | 图像识别方法、装置、系统及计算机存储介质 | |
US11854113B2 (en) | Deep learning methods for event verification and image re-purposing detection | |
CN112465517A (zh) | 防伪验证方法、装置及计算机可读存储介质 | |
CN114298997B (zh) | 一种伪造图片检测方法、装置及存储介质 | |
KR20220131808A (ko) | 이미지 분류 모델 생성 방법 및 장치 | |
JP6892569B2 (ja) | 人体に基づくデプス画像と組成値とを対応付ける装置 | |
CN113657293B (zh) | 活体检测方法、装置、电子设备、介质及程序产品 | |
CN111738087B (zh) | 一种游戏角色面部模型的生成方法和装置 | |
Ashiba et al. | Proposed homomorphic DWT for cancelable palmprint recognition technique | |
CN111222448A (zh) | 图像转换方法及相关产品 | |
US11906647B2 (en) | Person location determination using multipath | |
US20230282031A1 (en) | Pose prediction for articulated object | |
US20240177414A1 (en) | 3d generation of diverse categories and scenes | |
CN117150369B (zh) | 超重预测模型的训练方法及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |