CN109919954B - 目标对象的识别方法和装置 - Google Patents

目标对象的识别方法和装置 Download PDF

Info

Publication number
CN109919954B
CN109919954B CN201910176771.9A CN201910176771A CN109919954B CN 109919954 B CN109919954 B CN 109919954B CN 201910176771 A CN201910176771 A CN 201910176771A CN 109919954 B CN109919954 B CN 109919954B
Authority
CN
China
Prior art keywords
image
segmentation result
target object
processing
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910176771.9A
Other languages
English (en)
Other versions
CN109919954A (zh
Inventor
童云飞
赵巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Original Assignee
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shiyuan Electronics Thecnology Co Ltd filed Critical Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority to CN201910176771.9A priority Critical patent/CN109919954B/zh
Publication of CN109919954A publication Critical patent/CN109919954A/zh
Application granted granted Critical
Publication of CN109919954B publication Critical patent/CN109919954B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种目标对象的识别方法和装置。其中,该方法包括:获取包含目标对象的第一图像;对第一图像进行下采样,得到第二图像;利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果;利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果。本发明解决了现有技术中目标对象的识别导致图像边缘失真,准确率低的技术问题。

Description

目标对象的识别方法和装置
技术领域
本发明涉及图像识别领域,具体而言,涉及一种目标对象的识别方法和装置。
背景技术
在医疗领域的图像识别中,前段光学相干断层扫描(Anterior segment opticalcoherence tomography,AS-OCT)用来辅助诊断许多眼科疾病,例如角膜疾病、白内障和青光眼等,是一种非侵入式无伤害的拍摄方式。晶状体,是眼球的主要屈光结构,当晶状体出现浑浊现象时(密度增加),会引起视力障碍,导致白内障产生。图1a示出了晶状体结构图,图1b示出了AS-OCT眼底图,其中白色方框所在区域为晶状体区域。晶状体密度是衡量白内障等疾病严重程度的重要指标。卷积神经网络在图像分割领域有着广泛的应用及优越的性能。然而其模型本身参数多,计算复杂度高,内存占用高,在图片分辨率较高的情况下尤为明显。为缓解以上问题,一个广泛使用的方法是:首先将图片放缩为低分辨率图片,卷积神经网络对该低分辨率图片进行分割等操作,之后再将处理好的图片放缩回原本的高分辨率。然而这往往会导致图像边缘失真,误差放大。
针对现有技术中目标对象的识别导致图像边缘失真,准确率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种目标对象的识别方法和装置,以至少解决现有技术中目标对象的识别导致图像边缘失真,准确率低的技术问题。
根据本发明实施例的一个方面,提供了一种目标对象的识别方法,包括:获取包含目标对象的第一图像;对第一图像进行下采样,得到第二图像;利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果;利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果。
进一步地,利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果,包括:利用均值滤波模型和局部线性模型对第二图像和第一分割结果进行处理,得到第一系数和第二系数;对第一系数和第二系数进行双线性上采样,得到采样后的第一系数和采样后的第二系数;利用线性模型对采样后的第一系数、采样后的第二系数和第一图像进行处理,得到第二分割结果。
进一步地,利用均值滤波模型和局部线性模型对第二图像和第一分割结果进行处理,得到第一系数和第二系数,包括:获取多个预设窗口;利用局部线性模型对每个预设窗口的第二图像和第一分割结果进行处理,得到每个预设窗口对应的第一系数和第二系数;利用均值滤波模型对多个预设窗口对应的第一系数和第二系数进行处理,得到第一系数和第二系数。
进一步地,利用局部线性模型对每个预设窗口的第二图像和第一分割结果进行处理,得到每个预设窗口对应的第一系数和第二系数,包括:获取预设参数;基于第二图像在每个预设窗口内的像素值,第一分割结果在每个预设窗口内的像素值以及预设参数,得到每个预设窗口的损失函数;对每个预设窗口的损失函数进行求解,得到每个预设窗口对应的第一系数和第二系数。
进一步地,利用均值滤波模型对多个预设窗口对应的第一系数和第二系数进行处理,得到第一系数和第二系数,包括:获取多个预设窗口对应的第一系数的均值,得到第一系数;获取多个预设窗口对应的第二系数的均值,得到第二系数。
进一步地,利用线性模型对采样后的第一系数、采样后的第二系数和第一图像进行处理,得到第二分割结果,包括:获取采样后的第一系数与第一图像的乘积,得到和值;获取和值与采样后的第二系数之和,得到第二分割结果。
进一步地,U形全卷积神经网络模型包括:编码模型和解码模型,编码模型包括:多个第一网络块,第一网络块包括:依次连接的至少两个第一卷积层,第一卷积层采用修正线性单元激活函数和池化操作,每个第一网络块中的最后一个第一卷积层与下一个第一网络块中的第一个第一卷积层连接;解码模型包括:多个第二网络块和输出层,第一网络块和第二网络块的数量相同,第二网络块包括:依次连接的级联层、至少两个第二卷积层和旁侧输出层,级联层与对应的第一网络块和上一个第二网络块中的最后一个第二卷积层连接,级联层与对应的第一网络块采用复制和合并的跳跃连接方式连接,输出层包括:依次连接的两个第三卷积层,输出层与最后一个第二网络块中的最后一个第二卷基层连接。
进一步地,池化操作包括如下之一:最大池化操作和均值池操作。
进一步地,在利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果之前,上述方法还包括:分别利用导向图网络模型对第一图像和第二图像进行处理,得到第三图像和第四图像,其中,第三图像、第四图像和第一分割结果的通道数相同;利用导向滤波网络模型对第三图像、第四图像和第一分割结果进行处理,得到目标对象的第二分割结果。
进一步地,导向图网络模型包括:依次连接的第四卷积层、自适应归一化层、激活层和第五卷积层。
进一步地,在利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果之前,上述方法还包括:利用边缘检测算法对第二图像进行处理,得到目标对象所在区域的第五图像;利用U形全卷积神经网络模型对第五图像进行处理,得到第一分割结果。
进一步地,利用边缘检测算法对第二图像进行处理,得到目标对象所在区域的第五图像,包括:利用多级边缘检测算法对第二图像进行处理,得到第五图像。
进一步地,获取包含目标对象的第一图像,包括:
利用前段光学相干断层扫描技术对目标对象进行扫描,得到第一图像。
进一步地,目标对象为晶状体核。
根据本发明实施例的另一方面,还提供了一种目标对象的识别装置,包括:获取模块,用于获取包含目标对象的第一图像;采样模块,用于对第一图像进行下采样,得到第二图像;第一处理模块,用于利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果;第二处理模块,用于利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果。
根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的目标对象的识别方法。
根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的目标对象的识别方法。
在本发明实施例中,在获取到包含目标对象的第一图像之后,可以首先对第一图像进行下采样,得到第二图像,然后利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果,进一步利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果,也即得到最终的分割结果。容易注意到的是,通过结合U形全卷积神经网络模型和导向滤波网络模型进行晶状体结构分割,使得导向滤波与卷积神经网络更好地配合,通过使用导向滤波,使得识别运算速度、内存占用接近于处理低分辨率图像的情形,而分割效果近似于处理原始高分辨率图像的情形,达到了节省内存,提高运算读取,有效提高晶状体结构分割的准确性的技术效果,进而解决了现有技术中目标对象的识别导致图像边缘失真,准确率低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1a是根据现有技术的一种晶状体结构图的示意图;
图1b是根据现有技术的一种AS-OCT眼底图的示意图;
图2是根据本发明实施例的一种目标对象的识别方法的流程图;
图3是根据本发明实施例的一种导向滤波网络的网络结构的示意图;
图4是根据本发明实施例的一种U-net网络的网络结构的示意图;
图5是根据本发明实施例的一种导向图网络的网络结构的示意图;
图6是根据本发明实施例的一种可选的目标对象的识别方法的流程图;以及
图7是根据本发明实施例的一种目标对象的识别装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种目标对象的识别方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2是根据本发明实施例的一种目标对象的识别方法的流程图,如图2所示,该方法包括如下步骤:
步骤S202,获取包含目标对象的第一图像。
可选地,上述的目标对象可以是晶状体核。
具体地,上述的图像可以是AS-OCT眼底图,图像中包含有晶状体结构,由于晶状体核和皮质的边界之间模糊,可以通过对晶状体核和皮质的边界进行准确分割,实现对晶状体结构的准确分割,因此,可以确定目标对象为晶状体核。
步骤S204,对第一图像进行下采样,得到第二图像。
具体地,上述的第一图像为高分辨率原始图片,对该图片进行下采样后,可以得到低分辨率的图片,即上述的第二图像,以降低计算复杂度,节省内存。
步骤S206,利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果。
具体地,在医学图像分割领域中,目前基于深度学习图像分割算法发展迅速,尤其是U形全卷积神经网络模型,即U-net网络的出现,在肺结节、肿瘤和血管厚度分割等医学图像领域取得了较大的发展。由于U-net网络使用跳跃连接利用多层次的特征,可获得较精准的分割区域,另外AS-OCT图像内容并不复杂,主要难点在于边界模糊,使用复杂的网络并不会提升效果,因此,可以通过U-net网络作为AS-OCT图像中晶状体结构的初始轮廓的分割,确定晶状体核区域的边界,即得到上述的第一分割结果。
需要说明的是,通过U-net网络对AS-OCT眼底图进行图像分割,不仅仅可以确定晶状体核区域的边界,还可以确定晶状体的角膜和皮质区域的边界。
步骤S208,利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果。
具体地,由于经过U-net网络分割后的图片的分辨率较低,而且高分辨率原始图片已包含图像边缘细节特征,为了能够得到原本高分辨率的分割结果,可以通过导向滤波网络对高分辨率图片、低分辨率图片和分割结果进行处理,将低分辨率的分割结果恢复到原始分辨率,从而得到第二分割结果,其中,第二分割结果与第一分割结果相似,且保留边角等细节信息。
通过本发明上述实施例,在获取到包含目标对象的第一图像之后,可以首先对第一图像进行下采样,得到第二图像,然后利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果,进一步利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果,也即得到最终的分割结果。容易注意到的是,通过结合U形全卷积神经网络模型和导向滤波网络模型进行晶状体结构分割,使得导向滤波与卷积神经网络更好地配合,通过使用导向滤波,使得识别运算速度、内存占用接近于处理低分辨率图像的情形,而分割效果近似于处理原始高分辨率图像的情形,达到了节省内存,提高运算读取,有效提高晶状体结构分割的准确性的技术效果,进而解决了现有技术中目标对象的识别导致图像边缘失真,准确率低的技术问题。
可选地,利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果,包括:利用均值滤波模型和局部线性模型对第二图像和第一分割结果进行处理,得到第一系数和第二系数;对第一系数和第二系数进行双线性上采样,得到采样后的第一系数和采样后的第二系数;利用线性模型对采样后的第一系数、采样后的第二系数和第一图像进行处理,得到第二分割结果。
具体地,导向滤波网络模型的输入包括:高分辨率原始图片,下采样后的低分辨率图片,以及对应的低分辨率U-net网络输出结果,如图3所示。输入第二图像Il和第一分割结果Ol,利用均值滤波模型和局部线性模型可以得到第一系数和第二系数(al,bl),对其双线性上采样得到(ah,bh),最后在结合第一图像Ih,利用线性模型得到第二分割结果Oh
可选地,利用均值滤波模型和局部线性模型对第二图像和第一分割结果进行处理,得到第一系数和第二系数,包括:获取多个预设窗口;利用局部线性模型对每个预设窗口的第二图像和第一分割结果进行处理,得到每个预设窗口对应的第一系数和第二系数;利用均值滤波模型对多个预设窗口对应的第一系数和第二系数进行处理,得到第一系数和第二系数。
具体地,上述的预设窗口可以是半径为r的正方形窗口w,其中,半径r是根据实际识别需要预先设置的。利用局部线性模型可以是得到每个窗口wk内系数
Figure GDA0002864952230000061
(即上述的每个预设窗口对应的第一系数和第二系数),由于不同窗口内计算得到的系统并不一致,可以利用均值滤波模型处理其不一致性,对所有
Figure GDA0002864952230000062
取均值,得到(al,bl)。
可选地,利用局部线性模型对每个预设窗口的第二图像和第一分割结果进行处理,得到每个预设窗口对应的第一系数和第二系数,包括:获取预设参数;基于第二图像在每个预设窗口内的像素值,第一分割结果在每个预设窗口内的像素值以及预设参数,得到每个预设窗口的损失函数;对每个预设窗口的损失函数进行求解,得到每个预设窗口对应的第一系数和第二系数。
具体地,上述的预设参数可以是正则化参数ε,也可以是根据实际识别需要预先设置的。导向滤波是基于局部线性假设构建的,假设输入图片Il和导向滤波结果Ol之间存在局部线性关系,Ol是Il在一个在大小为r的窗口wk内的线性转换得到:
Figure GDA0002864952230000071
为了能够求出系数
Figure GDA0002864952230000072
最小化窗口wk内的损失函数为:
Figure GDA0002864952230000073
通过求解损失函数可以得到:
Figure GDA0002864952230000074
Figure GDA0002864952230000075
其中,μk
Figure GDA0002864952230000076
为窗口wk内Il的均值和方差,|w|为窗口wk内的像素值,
Figure GDA0002864952230000077
为窗口wk内Ol的均值。
需要说明的是,由于晶状体具有一定的结构信息,结构是光滑的曲面,因此可以在设计损失函数的时候考虑添加进光滑曲面的损失约束项。
可选地,利用均值滤波模型对多个预设窗口对应的第一系数和第二系数进行处理,得到第一系数和第二系数,包括:获取多个预设窗口对应的第一系数的均值,得到第一系数;获取多个预设窗口对应的第二系数的均值,得到第二系数。
具体地,通过对所有
Figure GDA0002864952230000078
取均值,得到(al,bl)。
可选地,利用线性模型对采样后的第一系数、采样后的第二系数和第一图像进行处理,得到第二分割结果,包括:获取采样后的第一系数与第一图像的乘积,得到和值;获取和值与采样后的第二系数之和,得到第二分割结果。
具体地,可以通过如下公式计算第二分割结果Oh
Oh=ah*Ih+bh,其中,*操作标识按元素相乘。
可选地,U形全卷积神经网络模型包括:编码模型和解码模型,编码模型包括:多个第一网络块,第一网络块包括:依次连接的至少两个第一卷积层,第一卷积层采用修正线性单元激活函数和池化操作,每个第一网络块中的最后一个第一卷积层与下一个第一网络块中的第一个第一卷积层连接;解码模型包括:多个第二网络块和输出层,第一网络块和第二网络块的数量相同,第二网络块包括:依次连接的级联层、至少两个第二卷积层和旁侧输出层,级联层与对应的第一网络块和上一个第二网络块中的最后一个第二卷积层连接,级联层与对应的第一网络块采用复制和合并的跳跃连接方式连接,输出层包括:依次连接的两个第三卷积层,输出层与最后一个第二网络块中的最后一个第二卷基层连接。
可选地,上述的池化操作包括如下之一:最大池化操作和均值池操作。
具体地,由于AS-OCT眼底图的尺寸较大,为了提高图像分割准确性和可重复性,可以对现有的U-net网络进行改进,改进点主要在于:卷积层使用的卷积核较小,例如,可以是3*3;整个U-net网络的层次较多,例如,整个网络的层次为5层,也即,第一网络块和第二网络块的数量为5个。
在本发明实施例中,每个卷积层可以使用激活函数(Relu)和最大池化操作。
U-net网络的网络结构如图4所示,网络结构包括编码模型(如图4中左侧所示)和解码模型(如图4中右侧所示),VGG19(Visual Geometry Group Network)可以作为网络的编码部分,包括五个网络块(即上述的第一网络块),每个网络块包含两到三个卷积层,每一个卷积层都会使用激活函数Relu(修正线性单元,rectified linear unit)和用于下采样的步长为2的2*2的最大池化,卷积层的卷积核为3*3,可以表示为Conv<3X3>with Relu,有利于细节特征的表达,测试速度相对于更深的残差网络能够有效保障,在每一个下采样的步骤中,特征通道数量都加倍;为了保持有效的复原图像和提取特征,解码模块也包含五个网络块(即上述的第二网络块),每个网络块包含一个级联层,来自相应的特征层(即上述的对应的第一网络块)和上采样(up-sample)(即上述的对应的第二卷积层),系数为2,之后使用两个卷积层和一个激活函数(ReLU)。考虑到图片局部关联性比较高,最后的特征图谱(U形网络最右端32通道的特征图谱)某种意义上是每个像素点的特征,因此,在最后一层(即上述的输出层)选取3×3的卷积核(Conv<3X3>padding=1)再次对特征图谱提取特征,在此基础上加入一个1×1的卷积核(Conv<1X1>padding=0),用于对每个像素分类。
需要说明的是,由于由于晶状体具有一定的结构信息,其边缘结构可用多项式函数拟合,因此,在得到U-net网络的分割结果后,可用多项式函数对分割结果拟合。
可选地,在利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果之前,该方法还包括:分别利用导向图网络模型对第一图像和第二图像进行处理,得到第三图像和第四图像,其中,第三图像、第四图像和第一分割结果的通道数相同;利用导向滤波网络模型对第三图像、第四图像和第一分割结果进行处理,得到目标对象的第二分割结果。
具体地,由于第一图像和第二图像的输入通道数和第一分割结果的输出通道数往往不一致,并且AS-OCT图像中,晶状体结构之间边界模糊,噪音干扰大。因此,本发明通过构建导向图网络,将原始的高分辨率图像转换为和输出具有相同通道数的导向图进行导向过滤。
可选地,导向图网络模型包括:依次连接的第四卷积层、自适应归一化层、激活层和第五卷积层。
具体地,上述的导向图网络模型可以由一个两层的卷积神经网络组成,如图5所示,该模型由两个卷积层(Conv<1×1>)组成,在这两个卷积层之间是一个自适应归一化层(AdaptiveNorm)和一个激活层(leaky ReLU)。将两个卷积层的卷积核都设置为1×1的大小,第一个卷积层的通道数设置为15,第二个卷积层的通道数为1,图5中最右侧数值用于表示通道数。
可选地,在利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果之前,该方法还包括:利用边缘检测算法对第二图像进行处理,得到目标对象所在区域的第五图像;利用U形全卷积神经网络模型对第五图像进行处理,得到第一分割结果。
具体地,为了减少多余的干扰信息,可以使用边缘检测算法提取到晶状体区域图像,得到第五图像,图像大小为256*256,并将提取到的图像输入至U形全卷积神经网络进行图像分割。
可选地,利用边缘检测算法对第二图像进行处理,得到目标对象所在区域的第五图像,包括:利用多级边缘检测算法对第二图像进行处理,得到第五图像。
具体地,可以使用多级边缘检测算法canny算子提取晶状体区域作为预处理。
需要说明的是,为了提高算法性能,还可以对图像进行直方图均衡化之类的预处理。
可选地,获取包含目标对象的第一图像,包括:利用前段光学相干断层扫描技术对目标对象进行扫描,得到第一图像。
具体地,可以通过AS-OCT技术对晶状体进行拍摄,得到AS-OCT眼底图(即上述的第一图像)。
图6是根据本发明实施例的一种可选的目标对象的识别方法的流程图,如图6所示,以晶状体核为例进行说明,可以在输入AS-OCT眼底图图像之后,对原始图像进行下采样,得到低分辨率图像,使用canny算子提取低分辨率图像中晶状体区域实现图像预处理,然后使用U-net网络预测,也即,使用U形全卷积神经网络分割晶状体,由于U形全卷积神经网络分割出的结果分辨率较低,因此,通过导向滤波网络,使用导向图替代原始图片来进行导向滤波,将低分辨率的输出恢复到高质量的原始分辨率,也即,使用导向图网络对原始图像和低分辨率图像进行处理,得到两个图像的导向图,使用导向滤波网络对导向图和U形全卷积神经网络的分割结果进行导向滤波,得到最终的分割结果。
通过上述方案,本发明实施例提供了一种基于AS-OCT图像的深度导向图的导向滤波与算法,使用导向滤波优化分割结果,并通过构建导向图替代原始图片以应对边界模糊,噪音干扰大等问题。具有如下优点:内存占用小,运算速度快,通过使用导向过滤,模型运算速度,内存占用接近于处理低分辨率图像的情形,而分割效果近似于处理原始高分辨率图像的情形;可以优化导向滤波与卷积神经网络的配合;通过构建导向图替代原始高分辨率图片在一定程度上利用图像的特征辅助过滤,解决AS-OCT图像中,晶状体结构之间边界模糊,噪音干扰大的问题。
实施例2
根据本发明实施例,提供了一种目标对象的识别装置的实施例。
图7是根据本发明实施例的一种目标对象的识别装置的示意图,如图7所示,该装置包括:获取模块72、采样模块74、第一处理模块76和第二处理模块78。
其中,获取模块72用于获取包含目标对象的第一图像;采样模块74用于对第一图像进行下采样,得到第二图像;第一处理模块76用于利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果;第二处理模块78用于利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果。
可选地,上述的目标对象可以是晶状体核。
具体地,上述的图像可以是AS-OCT眼底图,图像中包含有晶状体结构,由于晶状体核和皮质的边界之间模糊,可以通过对晶状体核和皮质的边界进行准确分割,实现对晶状体结构的准确分割,因此,可以确定目标对象为晶状体核。上述的第一图像为高分辨率原始图片,对该图片进行下采样后,可以得到低分辨率的图片,即上述的第二图像,以降低计算复杂度,节省内存。
在医学图像分割领域中,目前基于深度学习图像分割算法发展迅速,尤其是U形全卷积神经网络模型,即U-net网络的出现,在肺结节、肿瘤和血管厚度分割等医学图像领域取得了较大的发展。由于U-net网络使用跳跃连接利用多层次的特征,可获得较精准的分割区域,另外AS-OCT图像内容并不复杂,主要难点在于边界模糊,使用复杂的网络并不会提升效果,因此,可以通过U-net网络作为AS-OCT图像中晶状体结构的初始轮廓的分割,确定晶状体核区域的边界,即得到上述的第一分割结果。
需要说明的是,通过U-net网络对AS-OCT眼底图进行图像分割,不仅仅可以确定晶状体核区域的边界,还可以确定晶状体的角膜和皮质区域的边界。
由于经过U-net网络分割后的图片的分辨率较低,而且高分辨率原始图片已包含图像边缘细节特征,为了能够得到原本高分辨率的分割结果,可以通过导向滤波网络对高分辨率图片、低分辨率图片和分割结果进行处理,将低分辨率的分割结果恢复到原始分辨率,从而得到第二分割结果,其中,第二分割结果与第一分割结果相似,且保留边角等细节信息。
通过本发明上述实施例,在获取到包含目标对象的第一图像之后,可以首先对第一图像进行下采样,得到第二图像,然后利用U形全卷积神经网络模型对第二图像进行处理,得到目标对象的第一分割结果,进一步利用导向滤波网络模型对第一图像、第二图像和第一分割结果进行处理,得到目标对象的第二分割结果,也即得到最终的分割结果。容易注意到的是,通过结合U形全卷积神经网络模型和导向滤波网络模型进行晶状体结构分割,使得导向滤波与卷积神经网络更好地配合,通过使用导向滤波,使得识别运算速度、内存占用接近于处理低分辨率图像的情形,而分割效果近似于处理原始高分辨率图像的情形,达到了节省内存,提高运算读取,有效提高晶状体结构分割的准确性的技术效果,进而解决了现有技术中目标对象的识别导致图像边缘失真,准确率低的技术问题。
可选地,第二处理模块包括:第一处理子模块、采样子模块和第二处理子模块。
其中,第一处理子模块用于利用均值滤波模型和局部线性模型对第二图像和第一分割结果进行处理,得到第一系数和第二系数;采样子模块用于对第一系数和第二系数进行双线性上采样,得到采样后的第一系数和采样后的第二系数;第二处理子模块用于利用线性模型对采样后的第一系数、采样后的第二系数和第一图像进行处理,得到第二分割结果。
可选地,第一处理子模块包括:第一获取单元、第一处理单元和第二处理单元。
其中,第一获取单元用于获取多个预设窗口;第一处理单元用于利用局部线性模型对每个预设窗口的第二图像和第一分割结果进行处理,得到每个预设窗口对应的第一系数和第二系数;第二处理单元用于利用均值滤波模型对多个预设窗口对应的第一系数和第二系数进行处理,得到第一系数和第二系数。
可选地,第一处理单元包括:获取子单元、第一处理子单元和第二处理子单元。
其中,获取子单元用于获取预设参数;第一处理子单元用于基于第二图像在每个预设窗口内的像素值,第一分割结果在每个预设窗口内的像素值以及预设参数,得到每个预设窗口的损失函数;第二处理子单元用于对每个预设窗口的损失函数进行求解,得到每个预设窗口对应的第一系数和第二系数。
可选地,第二处理单元还用于获取多个预设窗口对应的第一系数的均值,得到第一系数,并获取多个预设窗口对应的第二系数的均值,得到第二系数。
可选地,第二处理子模块包括:第二获取单元和第三获取单元。
其中,第二获取单元用于获取采样后的第一系数与第一图像的乘积,得到和值;第三获取单元用于获取和值与采样后的第二系数之和,得到第二分割结果。
可选地,U形全卷积神经网络模型包括:编码模型和解码模型,编码模型包括:多个第一网络块,第一网络块包括:依次连接的至少两个第一卷积层,第一卷积层采用修正线性单元激活函数和池化操作,每个第一网络块中的最后一个第一卷积层与下一个第一网络块中的第一个第一卷积层连接;解码模型包括:多个第二网络块和输出层,第一网络块和第二网络块的数量相同,第二网络块包括:依次连接的级联层、至少两个第二卷积层和旁侧输出层,级联层与对应的第一网络块和上一个第二网络块中的最后一个第二卷积层连接,级联层与对应的第一网络块采用复制和合并的跳跃连接方式连接,输出层包括:依次连接的两个第三卷积层,输出层与最后一个第二网络块中的最后一个第二卷基层连接。
可选地,上述的池化操作包括如下之一:最大池化操作和均值池操作。
可选地,该装置还包括:第三处理模块。
其中,第三处理模块用于分别利用导向图网络模型对第一图像和第二图像进行处理,得到第三图像和第四图像,其中,第三图像、第四图像和第一分割结果的通道数相同;第二处理模块还用于利用导向滤波网络模型对第三图像、第四图像和第一分割结果进行处理,得到目标对象的第二分割结果。
可选地,导向图网络模型包括:依次连接的第四卷积层、自适应归一化层、激活层和第五卷积层。
可选地,该装置还包括:第四处理模块。
其中,第四处理模块用于利用边缘检测算法对第二图像进行处理,得到目标对象所在区域的第五图像;第一处理模块还用于利用U形全卷积神经网络模型对第五图像进行处理,得到第一分割结果。
可选地,第四处理模块还用于利用多级边缘检测算法对第二图像进行处理,得到第五图像。
可选地,获取模块还用于利用前段光学相干断层扫描技术对目标对象进行扫描,得到第一图像。
实施例3
根据本发明实施例,提供了一种存储介质的实施例,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例1中的目标对象的识别方法。
实施例4
根据本发明实施例,提供了一种处理器的实施例,处理器用于运行程序,其中,程序运行时执行上述实施例1中的目标对象的识别方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (17)

1.一种目标对象的分割方法,其特征在于,包括:
获取包含目标对象的第一图像;
对所述第一图像进行下采样,得到第二图像;
利用U形全卷积神经网络模型对所述第二图像进行处理,得到所述目标对象的第一分割结果;
利用导向滤波网络模型对所述第一图像、所述第二图像和所述第一分割结果进行处理,得到所述目标对象的第二分割结果。
2.根据权利要求1所述的方法,其特征在于,利用导向滤波网络模型对所述第一图像、所述第二图像和所述第一分割结果进行处理,得到所述目标对象的第二分割结果,包括:
利用均值滤波模型和局部线性模型对所述第二图像和所述第一分割结果进行处理,得到第一系数和第二系数;
对所述第一系数和所述第二系数进行双线性上采样,得到采样后的第一系数和采样后的第二系数;
利用线性模型对所述采样后的第一系数、所述采样后的第二系数和所述第一图像进行处理,得到所述第二分割结果。
3.根据权利要求2所述的方法,其特征在于,利用均值滤波模型和局部线性模型对所述第二图像和所述第一分割结果进行处理,得到第一系数和第二系数,包括:
获取多个预设窗口;
利用所述局部线性模型对每个预设窗口的第二图像和第一分割结果进行处理,得到所述每个预设窗口对应的第一系数和第二系数;
利用所述均值滤波模型对多个预设窗口对应的第一系数和第二系数进行处理,得到所述第一系数和所述第二系数。
4.根据权利要求3所述的方法,其特征在于,利用所述局部线性模型对每个预设窗口的第二图像和第一分割结果进行处理,得到所述每个预设窗口对应的第一系数和第二系数,包括:
获取预设参数;
基于所述第二图像在每个预设窗口内的像素值,所述第一分割结果在每个所述预设窗口内的像素值以及所述预设参数,得到所述每个预设窗口的损失函数;
对所述每个预设窗口的损失函数进行求解,得到所述每个预设窗口对应的第一系数和第二系数。
5.根据权利要求3所述的方法,其特征在于,利用所述均值滤波模型对所述多个预设窗口对应的第一系数和第二系数进行处理,得到所述第一系数和所述第二系数,包括:
获取所述多个预设窗口对应的第一系数的均值,得到所述第一系数;
获取所述多个预设窗口对应的第二系数的均值,得到所述第二系数。
6.根据权利要求2所述的方法,其特征在于,利用线性模型对所述采样后的第一系数、所述采样后的第二系数和所述第一图像进行处理,得到所述第二分割结果,包括:
获取所述采样后的第一系数与所述第一图像的乘积,得到和值;
获取所述和值与所述采样后的第二系数之和,得到所述第二分割结果。
7.根据权利要求1所述的方法,其特征在于,所述U形全卷积神经网络模型包括:编码模型和解码模型,
所述编码模型包括:多个第一网络块,所述第一网络块包括:依次连接的至少两个第一卷积层,所述第一卷积层采用修正线性单元激活函数和池化操作,每个第一网络块中的最后一个第一卷积层与下一个第一网络块中的第一个第一卷积层连接;
所述解码模型包括:多个第二网络块和输出层,所述第一网络块和所述第二网络块的数量相同,所述第二网络块包括:依次连接的级联层、至少两个第二卷积层,所述级联层与对应的第一网络块和上一个第二网络块中的最后一个第二卷积层连接,所述级联层与所述对应的第一网络块采用复制和合并的跳跃连接方式连接,所述输出层包括:依次连接的两个第三卷积层,所述输出层与最后一个第二网络块中的最后一个第二卷基层连接。
8.根据权利要求7所述的方法,其特征在于,所述池化操作包括如下之一:最大池化操作和均值池化操作。
9.根据权利要求1所述的方法,其特征在于,在利用导向滤波网络模型对所述第一图像、所述第二图像和所述第一分割结果进行处理,得到所述目标对象的第二分割结果之前,所述方法还包括:
分别利用导向图网络模型对所述第一图像和所述第二图像进行处理,得到第三图像和第四图像,其中,所述第三图像、所述第四图像和所述第一分割结果的通道数相同;
利用导向滤波网络模型对所述第三图像、所述第四图像和所述第一分割结果进行处理,得到所述目标对象的第二分割结果。
10.根据权利要求9所述的方法,其特征在于,所述导向图网络模型包括:依次连接的第四卷积层、自适应归一化层、激活层和第五卷积层。
11.根据权利要求1所述的方法,其特征在于,在利用U形全卷积神经网络模型对所述第二图像进行处理,得到所述目标对象的第一分割结果之前,所述方法还包括:
利用边缘检测算法对所述第二图像进行处理,得到所述目标对象所在区域的第五图像;
利用所述U形全卷积神经网络模型对所述第五图像进行处理,得到所述第一分割结果。
12.根据权利要求11所述的方法,其特征在于,利用边缘检测算法对所述第二图像进行处理,得到所述目标对象所在区域的第五图像,包括:
利用多级边缘检测算法对所述第二图像进行处理,得到所述第五图像。
13.根据权利要求1所述的方法,其特征在于,获取包含目标对象的第一图像,包括:
利用前段光学相干断层扫描技术对所述目标对象进行扫描,得到所述第一图像。
14.根据权利要求1所述的方法,其特征在于,所述目标对象为晶状体核。
15.一种目标对象的识别装置,其特征在于,包括:
获取模块,用于获取包含目标对象的第一图像;
采样模块,用于对所述第一图像进行下采样,得到第二图像;
第一处理模块,用于利用U形全卷积神经网络模型对所述第二图像进行处理,得到所述目标对象的第一分割结果;
第二处理模块,用于利用导向滤波网络模型对所述第一图像、所述第二图像和所述第一分割结果进行处理,得到所述目标对象的第二分割结果。
16.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至14中任意一项所述的目标对象的识别方法。
17.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至14中任意一项所述的目标对象的识别方法。
CN201910176771.9A 2019-03-08 2019-03-08 目标对象的识别方法和装置 Active CN109919954B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910176771.9A CN109919954B (zh) 2019-03-08 2019-03-08 目标对象的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910176771.9A CN109919954B (zh) 2019-03-08 2019-03-08 目标对象的识别方法和装置

Publications (2)

Publication Number Publication Date
CN109919954A CN109919954A (zh) 2019-06-21
CN109919954B true CN109919954B (zh) 2021-06-15

Family

ID=66963940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910176771.9A Active CN109919954B (zh) 2019-03-08 2019-03-08 目标对象的识别方法和装置

Country Status (1)

Country Link
CN (1) CN109919954B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110889826B (zh) * 2019-10-30 2024-04-19 平安科技(深圳)有限公司 眼部oct图像病灶区域的分割方法、装置及终端设备
CN111583264B (zh) * 2020-05-06 2024-02-27 上海联影智能医疗科技有限公司 图像分割网络的训练方法、图像分割方法和存储介质
CN111815569B (zh) * 2020-06-15 2024-03-29 广州视源电子科技股份有限公司 基于深度学习的图像分割方法、装置、设备和存储介质
CN113284112B (zh) * 2021-05-27 2023-11-10 中国科学院国家空间科学中心 一种基于深度神经网络的熔滴图像轮廓提取方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108447062B (zh) * 2018-02-01 2021-04-20 浙江大学 一种基于多尺度混合分割模型的病理切片非常规细胞的分割方法
CN108492286B (zh) * 2018-03-13 2020-05-05 成都大学 一种基于双通路u型卷积神经网络的医学图像分割方法
CN108961274B (zh) * 2018-07-05 2021-03-02 四川大学 一种mri图像中自动头颈肿瘤分割方法

Also Published As

Publication number Publication date
CN109919954A (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
CN109919954B (zh) 目标对象的识别方法和装置
CN109118495B (zh) 一种视网膜血管分割方法和装置
CN112435309A (zh) 一种基于深度学习的增强ct图像质量和分辨率的方法
CN110599500B (zh) 一种基于级联全卷积网络的肝脏ct图像的肿瘤区域分割方法及系统
CN108764342B (zh) 一种对于眼底图中视盘和视杯的语义分割方法
Liu et al. Gradnet image denoising
WO2022088665A1 (zh) 病灶分割方法、装置及存储介质
CN110751636B (zh) 一种基于改进型编解码网络的眼底图像视网膜动脉硬化检测方法
CN112163994B (zh) 一种基于卷积神经网络的多尺度医学图像融合方法
CN111815766A (zh) 基于2d-dsa图像重建血管三维模型处理方法及系统
CN113643353B (zh) 眼底图像的血管管径的增强分辨率的测量方法
CN110570394A (zh) 医学图像分割方法、装置、设备及存储介质
CN108305268B (zh) 一种图像分割方法及装置
Vijapur et al. Sensitized glaucoma detection using a unique template based correlation filter and undecimated isotropic wavelet transform
CN114418987B (zh) 一种多阶段特征融合的视网膜血管分割方法及系统
Jian et al. Dual-Branch-UNet: A Dual-Branch Convolutional Neural Network for Medical Image Segmentation.
CN113902824B (zh) 一种血管内光学相干断层扫描的导丝伪影去除方法
CN116452618A (zh) 一种三输入脊柱ct图像分割方法
CN109919098B (zh) 目标对象的识别方法和装置
CN115908237B (zh) 一种眼裂宽度的测量方法、装置和存储介质
CN116563554A (zh) 基于混合表征学习的低剂量ct图像去噪方法
CN117315735A (zh) 基于先验信息与注意力机制的人脸超分辨率重建方法
Shabbir et al. A comparison and evaluation of computerized methods for blood vessel enhancement and segmentation in retinal images
CN114332278A (zh) 一种基于深度学习的octa图像运动矫正方法
CN113888556A (zh) 一种基于差分注意力的视网膜血管图像分割方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant