CN111402217A - 一种图像分级方法、装置、设备和存储介质 - Google Patents

一种图像分级方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111402217A
CN111402217A CN202010163482.8A CN202010163482A CN111402217A CN 111402217 A CN111402217 A CN 111402217A CN 202010163482 A CN202010163482 A CN 202010163482A CN 111402217 A CN111402217 A CN 111402217A
Authority
CN
China
Prior art keywords
original
image
dimensional
preset
turbidity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010163482.8A
Other languages
English (en)
Other versions
CN111402217B (zh
Inventor
王静雯
刘江
袁进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Cixi Institute of Biomedical Engineering CIBE of CAS
Zhongshan Ophthalmic Center
Original Assignee
Guangzhou Shiyuan Electronics Thecnology Co Ltd
Cixi Institute of Biomedical Engineering CIBE of CAS
Zhongshan Ophthalmic Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Shiyuan Electronics Thecnology Co Ltd, Cixi Institute of Biomedical Engineering CIBE of CAS, Zhongshan Ophthalmic Center filed Critical Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority to CN202010163482.8A priority Critical patent/CN111402217B/zh
Publication of CN111402217A publication Critical patent/CN111402217A/zh
Application granted granted Critical
Publication of CN111402217B publication Critical patent/CN111402217B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10101Optical tomography; Optical coherence tomography [OCT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Eye Examination Apparatus (AREA)

Abstract

本发明公开了一种图像分级方法、装置、设备和存储介质。该方法包括:确定原始AS‑OCT图像对应的原始三维图像;将原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量;根据第一预设个数的一维向量计算得到对应的输出结果;根据输出结果和预先配置的浑浊类别确定原始AS‑OCT图像的浑浊程度。本发明通过从不同角度拍摄原始AS‑OCT图像,可以提取并学习到图像中的更多特征,有效提升了网络分类的精度;同时,通过构建多尺度的3D卷积神经网络,以将原始三维图像对应的多个尺度的中间三维图像输入至对应预设3D卷积神经网络中,从而将全局特征和局部特征相融合有利于网络挖掘到更具有辨别性的特征信息。

Description

一种图像分级方法、装置、设备和存储介质
技术领域
本发明实施例涉及心律识别技术,尤其涉及一种图像分级方法、装置、设备和存储介质。
背景技术
白内障是由于晶状体代谢紊乱,导致晶状体蛋白质变性而发生混浊,患者视物混浊模糊的一种眼部疾病。因此对眼睛的一些眼部结构进行混浊分级变得尤为重要。
目前,可以使用眼底图像和裂隙灯图,对白内障的浑浊程度进行分级。图1是现有技术提供的一种眼底图像的显示示意图;图2是现有技术提供的一种裂隙灯图的显示示意图。由于眼底图像和裂隙灯图采用的均是二维图像,若利用神经网络对眼底图像或裂隙灯图进行混浊程度的分级,降低了图像自动分级的准确率。
发明内容
有鉴于此,本发明提供一种图像分级方法、装置、设备和存储介质,有效提高了图像的分级准确率。
第一方面,本发明实施例提供了一种图像分级方法,包括:
确定原始眼前段光学相干断层扫描AS-OCT图像对应的原始三维图像;
将所述原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量;
根据所述第一预设个数的一维向量计算得到对应的输出结果;
根据所述输出结果和预先配置的浑浊类别确定所述原始AS-OCT图像的浑浊程度。
第二方面,本发明实施例还提供了一种图像分级装置,包括:
第一确定模块,用于确定原始眼前段光学相干断层扫描AS-OCT图像对应的原始三维图像;
第二确定模块,用于将所述原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量;
第三确定模块,用于根据所述第一预设个数的一维向量计算得到对应的输出结果;
第四确定模块,用于根据所述输出结果和预先配置的浑浊类别确定所述原始AS-OCT图像的浑浊程度。
第三方面,本发明实施例还提供了一种设备,该设备包括:存储器,以及一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述任一实施例所述的图像分级方法。
第四方面,一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一实施例所述的图像分级方法。
本发明通过从不同角度拍摄原始AS-OCT图像,并将多个原始AS-OCT图像组合成对应的原始三维图像,从而可以提取并学习到图像中的更多特征,有效提升了网络分类的精度;同时,通过构建多尺度的3D卷积神经网络,以将原始三维图像对应的多个尺度的中间三维图像输入至对应预设3D卷积神经网络中,从而将全局特征和局部特征相融合有利于网络挖掘到更具有辨别性的特征信息。
附图说明
图1是现有技术提供的一种眼底图像的显示示意图;
图2是现有技术提供的一种裂隙灯图的显示示意图;
图3是本发明实施例提供的一种AS-OCT图像的显示示意图;
图4是本发明实施例提供的一种图像分级方法的流程图;
图5是本申请实施例提供的一种预设3D卷积神经网络的结构示意图;
图6是本发明实施例提供的一种多尺度3D卷积神经网络的结构示意图;
图7是本发明实施例提供的另一种图像分级方法的流程图;
图8是本发明实施例提供的另一种AS-OCT图像的显示示意图;
图9是本发明实施例提供的一种图像分级装置的结构框图;
图10是本发明实施例提供的一种设备的硬件结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
目前,国际上采用晶状体混浊分类系统(Lens Opacities ClassificationSystemⅢ,LOCSⅢ)分类标准对晶状体的核、皮质和后囊的混浊程度进行分级。目前临床上白内障的混浊程度分级主要通过眼科医生进行分析和诊断,这不仅效率低并且对医生的技术水平要求较高。随着计算机人工智能的发展,计算机辅助诊断系统越来越多的应用到临床诊断中,这可以减轻医生工作负担、提高诊断准确率。因此利用图像处理以及深度学习等技术,对晶状体结构进行分析并自动分级变得尤为重要。
近10年来,眼前段光学相干断层扫描(Anterior segment optical coherencetomography,AS-OCT)影像技术飞速发展,为白内障的定性和定量分析提供了一种新的、非接触和快速准确的手段。图3是本发明实施例提供的一种AS-OCT图像的显示示意图。如图3所示,图3中的第一个图中矩形框内的灰度区域为晶状体,第二个图为矩形框内的灰度区域,第三个图标识出晶状体的核、皮质和后囊三个部分。
在现有技术中,采用眼底图像和裂隙灯图进行浑浊程度的分级,但由于眼底图像和裂隙灯图采用的均为二维图像,影响了图像自动分级的准确率。有鉴于此,本申请提出一种图像分级方法,以有效实时地对AS-OCT图像中的各晶状体结构进行分级,并在提高晶状体分级的准确性和可重复性的同时,能够大幅度的提升分级效率,以及实现实时准确的分级。
在一实现方式中,图4是本发明实施例提供的一种图像分级方法的流程图,本实施例可适用于诊断用户是否患有白内障的情况。如图4所示,本实施例包括如下步骤:
S110、确定原始AS-OCT图像对应的原始三维图像。
在实施例中,原始AS-OCT图像指的是直接从待检测用户的每只眼睛中拍摄得到的未处理图像。为了便于能够准确地体现出待检测用户的眼睛特征,可从待检测用户的眼睛中拍摄多张原始AS-OCT图像,即对原始AS-OCT图像的数量不作限定。示例性地,原始AS-OCT图像的数量可以为128张。当然,为了得到待检测用户眼睛中更多的特征,可从多个角度对待检测用户的眼睛进行拍摄。
在实施例中,原始三维图像,可以理解为对原始AS-OCT图像进行处理,而得到的三维图像。也就是说,原始AS-COT图像为二维图像。在实施例中,获取到多个二维的原始AS-OCT图像,对原始AS-OCT图像进行组合堆叠,得到对应的原始三维图像。
S120、将原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量。
在实施例中,中间三维图像,可以理解为对原始三维图像进行处理,得到的三维图像。在一实施例中,中间三维图像的确定过程,包括:对原始三维图像进行缩放,得到第一预设个数尺度的中间三维图像。在实施例中,第一预设个数尺度的中间三维图像,可以理解为将原始三维图像转换成中间三维图像的尺度个数。示例性地,若第一预设个数为3,则将原始三维图像转换为三个不同尺度的中间三维图像。
其中,预设3D卷积神经网络,指的是预先配置的3D卷积神经网络。在实施例中,预设3D卷积神经网络的数量与中间三维图像的数量是相同的。示例性地,在第一预设个数为3时,对应的预设3D卷积神经网络的个数也为3。可以理解为,在根据原始三维图像得到第一预设个数不同尺度的中间三维图像之后,依次将每个中间三维图像输入至对应的其中一个预设3D卷积神经网络,以得到对应的一维向量。其中,得到的一维向量的个数与预设3D卷积神经网络的数量是相同的。示例性地,在第一预设个数为3时,一维向量的数量也为3。
S130、根据第一预设个数的一维向量计算得到对应的输出结果。
在实施例中,将第一预设个数的一维向量进行相加,然后将累加值输入至预设3D卷积神经网络对应的全连接层,以输出对应的输出结果。需要说明的是,得到的输出结果的个数由预先配置的浑浊类别个数确定。可以理解为,预先配置的浑浊类别个数和输出结果的个数是相同的。示例性地,假设浑浊类别个数为5个,分别为:皮质透明、点状浑浊、轻度浑浊、中度浑浊和中毒浑浊,则预设3D卷积神经网络对应的全连接层输出的输出结果个数为5个。
S140、根据输出结果和预先配置的浑浊类别确定原始AS-OCT图像的浑浊程度。
在实施例中,在得到输出结果之后,将输出结果对应的数值与预先配置的浑浊类别进行对应,即每个输出结果对应一个浑浊类别。最后,输出结果的数值最高对应的浑浊类别对应的浑浊程度作为原始AS-OCT图像的浑浊程度。示例性地,假设轻度浑浊对应的数值为0.8,并且其它浑浊类别对应的数值均小于0.8,则原始AS-OCT图像的浑浊程度为轻度浑浊。
本实施例的技术方案,通过从不同角度拍摄原始AS-OCT图像,并将多个原始AS-OCT图像组合成对应的原始三维图像,从而可以提取并学习到图像中的更多特征,有效提升了网络分类的精度;同时,通过构建多尺度的3D卷积神经网络,以将原始三维图像对应的多个尺度的中间三维图像输入至对应预设3D卷积神经网络中,从而将全局特征和局部特征相融合有利于网络挖掘到更具有辨别性的特征信息。
在一实施例中,确定原始AS-OCT图像对应的原始三维图像,包括:获取待检测用户中第二预设个数的原始AS-OCT图像;对第二预设个数的原始AS-OCT图像进行裁剪,得到对应的中间AS-OCT图像;将每个中间AS-OCT图像进行组合,得到对应的原始三维图像。
在实施例中,第二预设个数指的是进行裁剪的原始AS-OCT图像的总数量。在实施例中,首先获取待检测用户眼睛中多张原始AS-OCT图像,并从多张原始AS-OCT图像中随机挑选出第二预设个数的原始AS-OCT图像进行裁剪,得到对应的中间AS-OCT图像。其中,中间AS-OCT图像的尺寸为预先配置的,即将原始AS-OCT图像裁剪成预先配置尺寸大小的中间AS-OCT图像。示例性地,假设从待检测用户眼睛中拍摄128张AS-OCT图像,并从128张AS-OCT图像中随机选出8张进行裁剪,并将8张原始AS-OCT图像裁剪成540*180大小的中间AS-OCT图像。其中,对8张原始AS-OCT图像进行裁剪的过程,就是对每张原始AS-OCT图像进行缩放和旋转的过程。在得到每张原始AS-OCT图像对应的中间AS-OCT图像图像,将8张中间AS-OCT图像进行组合,以得到对应的3D立方体,即原始三维图像。示例性地,若中间AS-OCT图像的尺寸为540*180,第二预设个数为8张,则原始三维图像的尺寸大小为8*540*180。其中,8表示中间AS-OCT图像的数量,540为每张中间AS-OCT图像的长度,180为每张中间AS-OCT图像的宽度。
在一实施例中,将原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量,包括:将原始三维图像对应每个尺度的中间三维图像依次输入至对应预设3D卷积神经网络的第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层,得到对应的一维向量。在实施例中,每个尺度的中间三维图像对应其中一个预设3D卷积神经网络。并且,在每个预设3D卷积神经网络中包括:第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层。在实施例中,在得到原始三维图像之后,为了便于能够提取出原始三维图像中更多的全局特征和局部特征,将原始三维图像缩放至第一预设个数不同尺度的中间三维图像。然后,将每个尺度的中间三维图像输入至其中一个预设3D卷积神经网络中,以得到对应的一维向量。
在一实施例中,各预设3D卷积神经网络的结构是相同的;第一卷积层包括一个卷积层;第二卷积层、第三卷积层、第四卷积层和第五卷积层均包括最大池化层和两个卷积层;第三卷积层、第四卷积层和第五卷积层分别对应的通道数不相同。
在实施例中,在每个预设3D卷积神经网络中的第一卷积层,可以包括一个卷积层,示例性地,第一卷积层中的卷积层结构为卷积核大小为7×7×7,输入通道数为3,步长为1×2×2的卷积层;第二卷积层、第三卷积层、第四卷积层和第五卷积层均包括一个最大池化层和两个卷积层,示例性地,第二卷积层、第三卷积层、第四卷积层和第五卷积层中最大池化层是卷积核大小为3×3×3,步长为2×2×2的最大池化层,卷积层为卷积核大小为1×1×1,通道数为64,步长为1×1×1的卷积块。当然,为了能够对输入至3D卷积神经网络中的中间AS-OCT图像进行不同特征的提取,可将第二卷积层、第三卷积层、第四卷积层和第五卷积层的通道数设置为不同的,比如,第二卷积层、第三卷积层、第四卷积层和第五卷积层的通道数分别为64、128、256和512。
在实施例中,每个尺度的中间AS-OCT图像对应的预设3D卷积神经网络的结构是相同的,即每个预设3D卷积神经网络均包括:第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层。在实施例中,将中间AS-OCT图像输入至对应的预设3D卷积神经网络,得到对应的一维向量。可以理解为,一维向量的个数与预设3D卷积神经网络的个数相同。示例性地,假设预设3D卷积神经网络的个数为3个,则对应的一维向量的个数也为3个。
在一实施例中,根据第一预设个数的一维向量计算得到对应的输出结果,包括:将第一预设个数的一维向量相加,得到对应的累加值;将累加值输入至第一预设个数的预设3D卷积神经网络共同对应的全连接层,得到对应的输出结果。
在实施例中,第一预设个数的预设3D卷积神经网络共同对应一个全连接层。在实施例中,将第一预设个数的预设3D卷积神经网络输出的一维向量进行相加,得到对应的累加值;然后将累加值输入至所有预设3D卷积神经网络对应的一个全连接层,得到对应的输出结果。
在一实施例中,根据输出结果和预先配置的浑浊类别确定原始AS-OCT图像的浑浊程度,包括:根据输出结果确定每个预先配置的浑浊类别的浑浊概率;将浑浊概率最高的浑浊类别对应的浑浊程度作为原始AS-OCT图像的浑浊程度。
在实施例中,输出结果的个数由浑浊类别的个数确定。在一实施例中,输出结果的个数与浑浊类别的个数相同。在对晶状体区域中的不同部分进行分类时,可预先配置不同部分对应的浑浊类别的个数。示例性地,假设对晶状体区域中的皮质进行分类,并且皮质共有5个浑浊类别,则输出结果的个数为5个。
在得到多个输出结果之后,将每个输出结果和预先配置的浑浊类别的浑浊概率进行对应;然后将浑浊概率最高的浑浊类别对应的浑浊程度作为原始AS-OCT图像的浑浊程度。
图5是本申请实施例提供的一种预设3D卷积神经网络的结构示意图。如图5所示,预设3D卷积神经网络包括:第一卷积层、第二卷积层、第三卷积层第四卷积层和第五卷积层。其中,第一卷积层包括一个卷积层;而第二卷积层、第三卷积层第四卷积层和第五卷积层均包括:最大池化层和卷积层。
在实施例中,以从待检测用户的每只眼睛拍摄128张原始AS-OCT图像,并且随机挑选出8张原始AS-OCT图像进行裁剪为例。在实施例中,对8张原始AS-OCT图像进行缩放和旋转,并将其随机裁剪成540×180大小的中间AS-OCT图像。通过堆叠将这8张AS-OCT图像组成一个3D立方体(即原始三维图像),其大小为8×540×180。将该立方体数据(原始三维图像)输入到如图5所示的预设3D卷积神经网络中。该预设3D卷积网络由5个卷积层组成,第一个卷积层是卷积核大小为7×7×7,输入通道数为3,步长为1×2×2的卷积层;第二个卷积层包含两部分,分别是卷积核大小为3×3×3,步长为2×2×2的最大池化层,和两个卷积核大小为1×1×1,通道数为64,步长为1×1×1的卷积块;第三层到第五层和第二层的结构相似,区别在于通道数分别为128、256、512。预设3D卷积神经网络的最后是一个全连接层,输出的结果个数由分类的级别个数决定。
在从AS-OCT图像中可以看到,其关键结构都是非常细粒度的,因此采用一个预设3D卷积神经网络会导致网络无法捕获到局部区域更细节的特征,为了克服这一缺点,将多尺度方法融合到3D卷积神经网络(Convolutional NeuralNetworks,CNN)网络中。图6是本发明实施例提供的一种多尺度3D卷积神经网络的结构示意图。如图6所示,采用三个结构相同的3D CNN网络并行训练,每个网络输入的图片尺寸不同,为了减少整体的参数,在所有的3D CNN之间共享参数。具体地,三个并行的预设3D卷积神经网络输入的中间AS-OCT图像大小分别为8×1080×360、8×540×180、8×270×90,通过三种不同大小的尺度输入,有利于网络提取到更精细局部的区域特征和全局的粗粒度特征,多种尺度特征的融合有利于网络忽略掉图像中的冗余信息,挖掘到更有辨别的特征和信息。这种多尺度方法的加入,3D卷积网络可以将全局特征和局部特征相融合,以提高分级的准确性。
图7是本发明实施例提供的另一种图像分级方法的流程图。以预设3D卷积神经网络的个数为3为例,对图像分级的过程进行说明。如图7所示,本实施例中的图像分级方法包括如下步骤:
S210、构建3D数据,得到原始三维图像。
在实施例中,从待检测用户的每只眼睛拍摄128张原始AS-OCT图像中随机挑选出8张,对原始AS-OCT图像进行缩放和旋转,并将其随机裁剪成540×180大小的中间AS-OCT图像。通过堆叠将这8张AS-OCT图像组成一个3D立方体,其大小为8×540×180。示例性地,图8是本发明实施例提供的另一种AS-OCT图像的显示示意图。
S220、采用预设3D卷积神经网络对原始三维图像对应的中间三维图像进行处理,得到对应的一维向量。
在实施例中,将构建好的8×540×180的原始三维图像,进行缩放,分别缩放为三种大小的尺度:8×1080×360、8×540×180、8×270×90,即三种尺度的中间三维图像。
在实施例中,首先将中间三维图像输入到子网络A(即三个预设3D卷积神经网络中的第一个网络)的第一个卷积层,该卷积层的结构为卷积核大小为7×7×7,输入通道数为3,步长为1×2×2的卷积层。
接下来,将通过第一个卷积层得到的数据,再输入到子网络A的第二个卷积层,该卷积层包含两部分,分别是卷积核大小为3×3×3,步长为2×2×2的最大池化层,和两个卷积核大小为1×1×1,通道数为64,步长为1×1×1的卷积块。
接下来,将通过第二个卷积层得到的数据集,再输入到子网络A的第三个卷积层,该卷积层包含两部分,分别是卷积核大小为3×3×3,步长为2×2×2的最大池化层,和两个卷积核大小为1×1×1,通道数为128,步长为1×1×1的卷积块。
接下来,将通过第三个卷积层得到的数据集,再输入到子网络A的第四个卷积层,该卷积层包含两部分,分别是卷积核大小为3×3×3,步长为2×2×2的最大池化层,和两个卷积核大小为1×1×1,通道数为256,步长为1×1×1的卷积块。
接下来,将通过第三个卷积层得到的数据集,再输入到子网络A的第四个卷积层,该卷积层包含两部分,分别是卷积核大小为3×3×3,步长为2×2×2的最大池化层,和两个卷积核大小为1×1×1,通道数为512,步长为1×1×1的卷积块。经过子网络A,得到2048×1大小的一维向量。
然后,将8×540×180的中间三维图像,输入到子网络B(即三个预设3D卷积神经网络中的第二个网络)中。其中,子网络B的结构和子网络A完全一致。同样地,经过子网络B,得到2048×1大小的一维向量。
然后,将8×270×90的中间三维图像,输入到子网络C(即三个预设3D卷积神经网络中的第三个网络)中。其中,子网络C的结构和子网络A完全一致。同样地,经过子网络C,得到2048×1大小的一维向量。
S230、根据所有一维向量计算得到对应的输出结果。
在实施例中,将通过三个子网络得到的3个2048×1的值相加,然后将其输入到网络的全连接层。通过全连接层,最终输出结果的个数由分类的浑浊类别个数决定。
S240、根据输出结果和预先配置的浑浊类别确定原始AS-OCT图像的浑浊程度。
在实施例中,假如对原始AS-OCT图像的皮质进行分类,皮质一共有1-5个类别(其中,1表示皮质透明,2表示点状混浊,3表示轻度混浊,4表示中度混浊,5表示中毒混浊)。那么最后的全连接层输出5个值,分别表示该原始AS-OCT图像的皮质属于不同混浊程度的概率,比如最后全连接输出5个值分别为0.1、0.4、0.2、0.8、0.3(即该图片的皮质属于类别1的概率为0.1,属于类别2的概率为0.4,属于类别3的概率为0.2,属于类别4的概率为0.8,属于类别5的概率为0.3)。其中属于类别4的概率0.8最大,那么网络认为该原始AS-OCT图像的类别为4,即实现了通过神经网络对图片进行自动的分级功能。
本实施例的技术方案,针对AS-OCT图像的皮质、核和后囊这三部分的分级过程,通过多尺度的3D CNN网络,实现了分级的可重复性,降低人为因素影响的同时极大地提高了分级精度,并且对于白内障的诊断具有重要意义。
传统的利用深度学习对2D图像进行分类的方法,大都是用2D CNN网络,本技术方案将同一只眼睛多角度拍摄的不同图片堆叠成3D图像,并用3D卷积核对图像进行卷积,这样不仅输入数据的信息更加丰富立体,同时3D卷积网络也可以提取并学习到图像的更多特征,有效的提升了网络分类的精度。
同时,由于AS-OCT图像包含很多细粒度的结构特征,因此引入多尺度的概念,构建多尺度的3D CNN网络,通过输入不同尺度的图片,并使用不同大小的卷积核,将全局特征和局部特征相融合有利于网络挖掘到更具有辨别性的特征信息。
图9是本发明实施例提供的一种图像分级装置的结构框图,该装置适用于诊断是否患有白内障的情况,该装置可以由硬件/软件实现。如图9所示,该装置包括:第一确定模块310、第二确定模块320、第三确定模块330和第四确定模块340。
其中,第一确定模块310,用于确定原始眼前段光学相干断层扫描AS-OCT图像对应的原始三维图像;
第二确定模块320,用于将原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量;
第三确定模块330,用于根据第一预设个数的一维向量计算得到对应的输出结果;
第四确定模块340,用于根据输出结果和预先配置的浑浊类别确定原始AS-OCT图像的浑浊程度。
本实施例的技术方案,通过从不同角度拍摄原始AS-OCT图像,并将多个原始AS-OCT图像组合成对应的原始三维图像,从而可以提取并学习到图像中的更多特征,有效提升了网络分类的精度;同时,通过构建多尺度的3D卷积神经网络,以将原始三维图像对应的多个尺度的中间三维图像输入至对应预设3D卷积神经网络中,从而将全局特征和局部特征相融合有利于网络挖掘到更具有辨别性的特征信息。
在一实施例中,第一确定模块,包括:
获取单元,用于获取待检测用户中第二预设个数的原始AS-OCT图像;
裁剪单元,用于对第二预设个数的原始AS-OCT图像进行裁剪,得到对应的中间AS-OCT图像;
组合单元,用于将每个中间AS-OCT图像进行组合,得到对应的原始三维图像。
在一实施例中,第二确定模块,具体用于:将原始三维图像对应每个尺度的中间三维图像依次输入至对应预设3D卷积神经网络的第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层,得到对应的一维向量。
在一实施例中,各预设3D卷积神经网络的结构是相同的;第一卷积层包括一个卷积层;第二卷积层、第三卷积层、第四卷积层和第五卷积层均包括最大池化层和两个卷积层;第三卷积层、第四卷积层和第五卷积层分别对应的通道数不相同。
在一实施例中,第三确定模块,包括:
相加模块,用于将第一预设个数的一维向量相加,得到对应的累加值;
第一确定单元,用于将累加值输入至第一预设个数的预设3D卷积神经网络共同对应的全连接层,得到对应的输出结果。
在一实施例中,第四确定模块,包括:
第二确定单元,用于根据输出结果确定每个预先配置的浑浊类别的浑浊概率;
第三确定单元,用于将浑浊概率最高的浑浊类别对应的浑浊程度作为原始AS-OCT图像的浑浊程度。
在一实施例中,输出结果的个数由预设配置的浑浊类别个数确定。
在一实施例中,中间三维图像的确定过程,包括:对原始三维图像进行缩放,得到第一预设个数尺度的中间三维图像。
上述图像分级装置可执行本发明任意实施例所提供的图像分级方法,具备执行方法相应的功能模块和有益效果。
图10是本发明实施例提供的一种设备的硬件结构示意图。本发明实施例中的设备以计算机设备为例进行说明。如图10所示,本发明实施例提供的计算机设备,包括:处理器410和存储器420、输入装置430和输出装置440。该计算机设备中的处理器410可以是一个或多个,图10中以一个处理器410为例,计算机设备中的处理器410、存储器420、输入装置430和输出装置440可以通过总线或其他方式连接,图10中以通过总线连接为例。
该计算机设备中的存储器420作为一种计算机可读存储介质,可用于存储一个或多个程序,程序可以是软件程序、计算机可执行程序以及模块,如本发明实施例或所提供图像分级方法对应的程序指令/模块(例如,图10所示的图像分级装置中的模块,包括:第一确定模块、第二确定模块、第三确定模块和第四确定模块)。处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述方法实施例中图像分级方法。
存储器420可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收用户输入的数字或字符信息,以产生与终端设备的用户设置以及功能控制有关的键信号输入。输出装置440可包括显示屏等显示设备。
并且,当上述计算机设备所包括一个或者多个程序被一个或者多个处理器410执行时,程序进行如下操作:确定原始眼前段光学相干断层扫描AS-OCT图像对应的原始三维图像;将原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量;根据第一预设个数的一维向量计算得到对应的输出结果;根据输出结果和预先配置的浑浊类别确定原始AS-OCT图像的浑浊程度。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例提供的图像分级方法,该方法包括:确定原始眼前段光学相干断层扫描AS-OCT图像对应的原始三维图像;将原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量;根据第一预设个数的一维向量计算得到对应的输出结果;根据输出结果和预先配置的浑浊类别确定原始AS-OCT图像的浑浊程度。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是,但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种图像分级方法,其特征在于,包括:
确定原始眼前段光学相干断层扫描AS-OCT图像对应的原始三维图像;
将所述原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量;
根据所述第一预设个数的一维向量计算得到对应的输出结果;
根据所述输出结果和预先配置的浑浊类别确定所述原始AS-OCT图像的浑浊程度。
2.根据权利要求1所述的方法,其特征在于,所述确定原始AS-OCT图像对应的原始三维图像,包括:
获取待检测用户中第二预设个数的原始AS-OCT图像;
对所述第二预设个数的原始AS-OCT图像进行裁剪,得到对应的中间AS-OCT图像;
将每个所述中间AS-OCT图像进行组合,得到对应的原始三维图像。
3.根据权利要求1所述的方法,其特征在于,所述将所述原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量,包括:
将所述原始三维图像对应每个尺度的中间三维图像依次输入至对应预设3D卷积神经网络的第一卷积层、第二卷积层、第三卷积层、第四卷积层和第五卷积层,得到对应的一维向量。
4.根据权利要求3所述的方法,其特征在于,各所述预设3D卷积神经网络的结构是相同的;
所述第一卷积层包括一个卷积层;所述第二卷积层、所述第三卷积层、所述第四卷积层和所述第五卷积层均包括最大池化层和两个卷积层;所述第三卷积层、所述第四卷积层和所述第五卷积层分别对应的通道数不相同。
5.根据权利要求1所述的方法,其特征在于,所述根据第一预设个数的一维向量计算得到对应的输出结果,包括:
将所述第一预设个数的一维向量相加,得到对应的累加值;
将所述累加值输入至第一预设个数的所述预设3D卷积神经网络共同对应的全连接层,得到对应的输出结果。
6.根据权利要求1所述的方法,其特征在于,所述根据所述输出结果和预先配置的浑浊类别确定所述原始AS-OCT图像的浑浊程度,包括:
根据所述输出结果确定每个预先配置的浑浊类别的浑浊概率;
将所述浑浊概率最高的浑浊类别对应的浑浊程度作为所述原始AS-OCT图像的浑浊程度。
7.根据权利要求6所述的方法,其特征在于,所述输出结果的个数由预设配置的浑浊类别个数确定。
8.根据权利要求1或3所述的方法,其特征在于,所述中间三维图像的确定过程,包括:
对所述原始三维图像进行缩放,得到第一预设个数尺度的中间三维图像。
9.一种图像分级装置,其特征在于,包括:
第一确定模块,用于确定原始眼前段光学相干断层扫描AS-OCT图像对应的原始三维图像;
第二确定模块,用于将所述原始三维图像对应的第一预设个数尺度的中间三维图像依次输入至对应预设3D卷积神经网络,得到对应的一维向量;
第三确定模块,用于根据所述第一预设个数的一维向量计算得到对应的输出结果;
第四确定模块,用于根据所述输出结果和预先配置的浑浊类别确定所述原始AS-OCT图像的浑浊程度。
10.一种设备,其特征在于,所述设备包括:存储器,以及一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的图像分级方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的图像分级方法。
CN202010163482.8A 2020-03-10 2020-03-10 一种图像分级方法、装置、设备和存储介质 Active CN111402217B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010163482.8A CN111402217B (zh) 2020-03-10 2020-03-10 一种图像分级方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010163482.8A CN111402217B (zh) 2020-03-10 2020-03-10 一种图像分级方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111402217A true CN111402217A (zh) 2020-07-10
CN111402217B CN111402217B (zh) 2023-10-31

Family

ID=71413301

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010163482.8A Active CN111402217B (zh) 2020-03-10 2020-03-10 一种图像分级方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111402217B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112085128A (zh) * 2020-10-27 2020-12-15 苏州浪潮智能科技有限公司 一种基于脉动阵列的图像识别方法、装置和介质
CN112101438A (zh) * 2020-09-08 2020-12-18 南方科技大学 一种左右眼分类方法、装置、服务器和存储介质
CN112200250A (zh) * 2020-10-14 2021-01-08 重庆金山医疗器械有限公司 一种胶囊内窥镜图像的消化道分段识别方法、装置和设备
CN113780319A (zh) * 2020-09-27 2021-12-10 北京沃东天骏信息技术有限公司 闭环检测方法及装置、计算机可存储介质
CN114936974A (zh) * 2022-05-12 2022-08-23 中山大学中山眼科中心 基于注意力机制的半监督oct图像去噪方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107437092A (zh) * 2017-06-28 2017-12-05 苏州比格威医疗科技有限公司 基于三维卷积神经网络的视网膜oct图像的分类算法
WO2018120740A1 (zh) * 2016-12-29 2018-07-05 深圳光启合众科技有限公司 图片分类方法和装置、机器人
CN108717568A (zh) * 2018-05-16 2018-10-30 陕西师范大学 一种基于三维卷积神经网络的图像特征提取与训练方法
CN109063139A (zh) * 2018-08-03 2018-12-21 天津大学 基于全景图及多通道cnn的三维模型分类和检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018120740A1 (zh) * 2016-12-29 2018-07-05 深圳光启合众科技有限公司 图片分类方法和装置、机器人
CN107437092A (zh) * 2017-06-28 2017-12-05 苏州比格威医疗科技有限公司 基于三维卷积神经网络的视网膜oct图像的分类算法
CN108717568A (zh) * 2018-05-16 2018-10-30 陕西师范大学 一种基于三维卷积神经网络的图像特征提取与训练方法
CN109063139A (zh) * 2018-08-03 2018-12-21 天津大学 基于全景图及多通道cnn的三维模型分类和检索方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101438A (zh) * 2020-09-08 2020-12-18 南方科技大学 一种左右眼分类方法、装置、服务器和存储介质
CN112101438B (zh) * 2020-09-08 2024-04-16 南方科技大学 一种左右眼分类方法、装置、服务器和存储介质
CN113780319A (zh) * 2020-09-27 2021-12-10 北京沃东天骏信息技术有限公司 闭环检测方法及装置、计算机可存储介质
CN112200250A (zh) * 2020-10-14 2021-01-08 重庆金山医疗器械有限公司 一种胶囊内窥镜图像的消化道分段识别方法、装置和设备
CN112085128A (zh) * 2020-10-27 2020-12-15 苏州浪潮智能科技有限公司 一种基于脉动阵列的图像识别方法、装置和介质
CN112085128B (zh) * 2020-10-27 2022-06-07 苏州浪潮智能科技有限公司 一种基于脉动阵列的图像识别方法、装置和介质
US11830244B2 (en) 2020-10-27 2023-11-28 Inspur Suzhou Intelligent Technology Co., Ltd. Image recognition method and apparatus based on systolic array, and medium
CN114936974A (zh) * 2022-05-12 2022-08-23 中山大学中山眼科中心 基于注意力机制的半监督oct图像去噪方法及装置

Also Published As

Publication number Publication date
CN111402217B (zh) 2023-10-31

Similar Documents

Publication Publication Date Title
CN111402217B (zh) 一种图像分级方法、装置、设备和存储介质
EP3989119A1 (en) Detection model training method and apparatus, computer device, and storage medium
US11887311B2 (en) Method and apparatus for segmenting a medical image, and storage medium
US10810735B2 (en) Method and apparatus for analyzing medical image
US11900647B2 (en) Image classification method, apparatus, and device, storage medium, and medical electronic device
US20220198230A1 (en) Auxiliary detection method and image recognition method for rib fractures based on deep learning
KR20210002606A (ko) 의료 영상 처리 방법 및 장치, 전자 기기 및 저장 매체
US20210224977A1 (en) Fundus image processing method, computer apparatus, and storage medium
CN110033023A (zh) 一种基于绘本识别的图像数据处理方法及系统
CN111488921A (zh) 一种全景数字病理图像智能分析系统及方法
US20220254134A1 (en) Region recognition method, apparatus and device, and readable storage medium
CN111667459A (zh) 一种基于3d可变卷积和时序特征融合的医学征象检测方法、系统、终端及存储介质
CN112232448B (zh) 图像分类方法、装置、电子设备和存储介质
CN110222718A (zh) 图像处理的方法及装置
US20240112329A1 (en) Distinguishing a Disease State from a Non-Disease State in an Image
CN112419326A (zh) 图像分割数据处理方法、装置、设备及存储介质
CN112614573A (zh) 基于病理图像标注工具的深度学习模型训练方法及装置
RU2732895C1 (ru) Метод для выделения и классификации типов клеток крови с помощью глубоких сверточных нейронных сетей
CN113158821B (zh) 基于多模态的眼部检测数据的处理方法、装置及终端设备
CN112101438B (zh) 一种左右眼分类方法、装置、服务器和存储介质
CN113705595A (zh) 异常细胞转移程度的预测方法、装置和存储介质
CN111462005A (zh) 处理显微图像的方法、装置、计算机设备及存储介质
CN114299598A (zh) 确定注视位置的方法及相关装置
CN111862098A (zh) 基于光场语义的个体匹配方法、装置、设备和介质
CN103955610A (zh) 一种医学影像计算机辅助分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant