CN115018839A - 用于医学检查的图像识别方法、装置和电子装置 - Google Patents

用于医学检查的图像识别方法、装置和电子装置 Download PDF

Info

Publication number
CN115018839A
CN115018839A CN202210942019.2A CN202210942019A CN115018839A CN 115018839 A CN115018839 A CN 115018839A CN 202210942019 A CN202210942019 A CN 202210942019A CN 115018839 A CN115018839 A CN 115018839A
Authority
CN
China
Prior art keywords
image
feature
depth
sub
medical examination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210942019.2A
Other languages
English (en)
Other versions
CN115018839B (zh
Inventor
周奇明
李丽丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Huanuokang Technology Co ltd
Original Assignee
Zhejiang Huanuokang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Huanuokang Technology Co ltd filed Critical Zhejiang Huanuokang Technology Co ltd
Priority to CN202210942019.2A priority Critical patent/CN115018839B/zh
Publication of CN115018839A publication Critical patent/CN115018839A/zh
Application granted granted Critical
Publication of CN115018839B publication Critical patent/CN115018839B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Geometry (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请涉及一种用于医学检查的图像识别方法、装置和电子装置,其中,该图像识别方法包括:获取待检测的第一图像,所述第一图像中具有目标检查部位,其中所述目标检查部位至少包括一个子检查部位;检测所述第一图像中的第二图像,获取所述第二图像的位置特征,其中所述第二图像为所述子检查部位的图像;提取所述第一图像的深度特征和所述第二图像的深度特征;根据所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征,确定所述第一图像的识别结果。通过本申请,解决了相关技术中存在的无法有效地判断鼻咽喉镜关键部位图片是否合格的问题,实现了准确的判断鼻咽喉镜关键部位图片是否合格的技术效果。

Description

用于医学检查的图像识别方法、装置和电子装置
技术领域
本申请涉及图像检测领域,特别是涉及一种用于医学检查的图像识别方法、装置和电子装置。
背景技术
鼻咽喉镜的检查主要关注鼻咽部偏右、鼻咽部偏左、声门及声门下区、声门上区、喉及下咽、会厌与舌根、左咽会厌襞、右咽会厌襞、左梨状窝、右梨状窝这10个关键部位。在进行检查的过程中,医生会在操作时或者视频回放里将这10个关键部位的图片抓取下来,最后医生会根据这10张图片出具检测报告,并放到检测报告中。鼻咽喉镜的检查时间大概有5分钟左右,医生从这5分钟的视频影像中挑选出10张合格的诊断图片,受限于医生的工作状态和经验积累,难免会出现图片漏选或者挑选的图片并不是最合格的情况。因此需要一种能够检测鼻咽喉镜关键部位图片是否合格的方法来进行辅助。
现有技术中,常见的图像检测技术只是对鼻咽喉镜关键部位图片的整体图片质量进行检测,比如检测图片有无噪点、有无运动模糊、有无曝光等一些图片质量上的问题。而鼻咽喉镜关键部位图片是否合格还需要判断其是否满足医学诊断标准,即关键部位图片上是否包含了所有能够用于诊断的解剖标志部位,且每一个解剖标志部位是否完整、是否清晰。其中,鼻咽喉镜检查中的每个关键部位至少包括一个解剖标志部位。鼻咽喉镜检查中常见的20个解剖标志部位分别是圆枕、咽鼓管咽口、咽隐窝、鼻咽部顶后壁、舌根、会厌谷、咽会厌襞、梨状窝、梨状窝底、下咽喉壁、环后区、会厌、杓会厌襞、杓突、室带、声带、前联合、后联合、喉室、声门下。因此现有技术中还缺少能够检测鼻咽喉镜关键部位图片是否合格的方法。
针对相关技术中存在的无法有效地判断鼻咽喉镜关键部位图片是否合格的问题,目前还没有提出有效的解决方案。
发明内容
在本实施例中提供了一种用于医学检查的图像识别方法、装置、电子装置和存储介质,以解决相关技术中存在的无法有效地判断鼻咽喉镜关键部位图片是否合格的问题。
第一个方面,在本实施例中提供了一种用于医学检查的图像识别方法,所述方法包括:
获取待检测的第一图像,所述第一图像中包含目标检查部位,其中所述目标检查部位至少包括一个子检查部位;
检测所述第一图像中的第二图像,获取所述第二图像的位置特征,其中所述第二图像为所述子检查部位的图像;
提取所述第一图像的深度特征和所述第二图像的深度特征;
根据所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征,确定所述第一图像的识别结果。
在其中的一些实施例中,所述检测所述第一图像中的第二图像,获取所述第二图像的位置特征包括:
根据预设的第一检测模型检测所述第一图像中的第二图像;
若所述第一图像中的第二图像数量不符合预设值,则确定所述第一图像的识别结果为图像不合格;
若所述第一图像中的第二图像数量符合预设值,则获取所述第二图像的位置特征。
在其中的一些实施例中,所述第二图像的位置特征包括:单个所述第二图像的位置特征和/或多个所述第二图像之间的相对位置特征。
在其中的一些实施例中,所述单个所述第二图像的位置特征至少包括如下之一:
在所述第一图像的坐标系中,所述第二图像的顶点坐标、中心点坐标、中心点与原点的距离、中心点所在象限;
所述第二图像的长度、宽度、面积、长宽比;
所述第二图像与所述第一图像的面积比、所述第二图像在所述第一图像中的相对位置。
在其中的一些实施例中,所述多个所述第二图像之间的相对位置特征至少包括如下之一:
在所述第一图像的坐标系中,多个所述第二图像之间的中心点坐标差值、中心点距离;
多个所述第二图像之间的面积比、长度比、宽度比。
在其中的一些实施例中,所述根据预设的第一检测模型检测所述第一图像中的第二图像包括:
通过训练预设的第二检测模型得到用于检测子检查部位的所述第一检测模型;
将所述第一图像输入至所述第一检测模型中,通过所述第一检测模型检测所述第一图像中的子检查部位,并通过标记框选定所述子检查部位,所述标记框内部的图像则为所述第二图像。
在其中的一些实施例中,所述提取所述第一图像的深度特征和所述第二图像的深度特征包括:
通过预设的用于提取图像特征的预训练模型分别提取所述第一图像的深度特征和所述第二图像的深度特征。
在其中的一些实施例中,所述根据所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征,确定所述第一图像的识别结果包括:
通过训练预设的第一分类模型得到用于分类所述第一图像的第二分类模型;
对所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征进行融合得到融合特征,将所述融合特征输入至所述第二分类模型中;
通过所述第二分类模型输出所述第一图像的识别结果,其中所述识别结果包括图像合格和图像不合格。
第二个方面,在本实施例中提供了一种用于医学检查的图像识别装置,所述装置包括:
图像获取模块,用于获取待检测的第一图像,所述第一图像中具有目标检查部位,其中所述目标检查部位至少包括一个子检查部位;
图像检测模块,用于检测所述第一图像中的第二图像,获取所述第二图像的位置特征,其中所述第二图像为所述子检查部位的图像;
特征提取模块,用于提取所述第一图像的深度特征和所述第二图像的深度特征;
图像识别模块,用于根据所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征,确定所述第一图像的识别结果。
第三个方面,在本实施例中提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的用于医学检查的图像识别方法。
第四个方面,在本实施例中提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一个方面所述的用于医学检查的图像识别方法。
与相关技术相比,在本实施例中提供的用于医学检查的图像识别方法,通过图像识别设备先获取待检测的包含目标检查部位的第一图像,然后检测第一图像中的子检查部位,并生成相应的第二图像;再获取第二图像的位置特征,以及提取第一图像和第二图像的深度特征,最后根据所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征,确定所述第一图像的识别结果,解决了相关技术中存在的无法有效地判断鼻咽喉镜关键部位图片是否合格的问题,实现了准确的判断鼻咽喉镜关键部位图片是否合格的技术效果。
本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本实施例的用于医学检查的图像识别方法的终端的硬件结构框图;
图2是本实施例的用于医学检查的图像识别方法的流程图;
图3是本优选实施例的用于医学检查的图像识别方法的流程图;
图4是本实施例的用于医学检查的图像识别装置的结构框图。
具体实施方式
为更清楚地理解本申请的目的、技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明。
除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属技术领域具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包括未列出的步骤或模块(单元),或者可包括这些过程、方法、产品或设备固有的其他步骤或模块(单元)。在本申请中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。在本申请中所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。通常情况下,字符“/”表示前后关联的对象是一种“或”的关系。在本申请中所涉及的术语“第一”、“第二”、“第三”等,只是对相似对象进行区分,并不代表针对对象的特定排序。
在本实施例中提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。比如在终端上运行,图1是本实施例的用于医学检查的图像识别方法的终端的硬件结构框图。如图1所示,终端可以包括一个或多个(图1中仅示出一个)处理器102和用于存储数据的存储器104,其中,处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置。上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示出的不同配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本实施例中的用于医学检查的图像识别方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(NetworkInterface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种用于医学检查的图像识别方法,图2是本实施例的用于医学检查的图像识别方法的流程图,如图2所示,该流程包括如下步骤:
步骤S210,获取待检测的第一图像,第一图像中包含目标检查部位,其中目标检查部位至少包括一个子检查部位。
具体的,图像识别设备获取待检测的第一图像,第一图像为目标检查部位的医学图像,而一个目标检查部位中至少包含一个子检查部位,进而在第一图像中至少具有一个子检查部位。
示例性地,在鼻咽喉镜的检查场景下,第一图像则是鼻咽喉镜拍摄的图像,而目标检查部位则为鼻咽喉中被检查的部位,比如鼻咽部偏右、鼻咽部偏左、声门及声门下区、声门上区、喉及下咽、会厌与舌根、左咽会厌襞、右咽会厌襞、左梨状窝、右梨状窝这10个关键部位,这些被检查的关键部位即为目标检查部位。每个关键部位相应的包括一个或多个解剖标志部位,常见的有圆枕、咽鼓管咽口、咽隐窝、鼻咽部顶后壁、舌根、会厌谷、咽会厌襞、梨状窝、梨状窝底、下咽喉壁、环后区、会厌、杓会厌襞、杓突、室带、声带、前联合、后联合、喉室、声门下等20个解剖标志部位,这些解剖标志部位即为子检查部位。
步骤S220,检测第一图像中的第二图像,获取第二图像的位置特征,其中第二图像为子检查部位的图像。
具体的,图像识别设备在获取第一图像后,通过预设的技术手段检测出第一图像中的子检查部位,进而获得子检查部位的图像,该图像可以标记为第二图像。其中第二图像则为第一图像的局部图像。由于目标检查部位中至少包括一个子检查部位,因此应当可以基于第一图像获取至少一个第二图像。在检测出第一图像中的第二图像后,获取第二图像在第一图像中的位置特征。
具体的,位置特征可以是单个第二图像的位置特征,或是多个第二图像之间的相对位置特征,以及两种位置特征的组合。因此位置特征体现了子检查部位与整体目标检查部位的相对关系,以及各个子检查部位之间的相对关系,从而可以根据第二图像的位置特征判断子检查部位的位置是否合理,以及反过来判断子检查部位的检测结果是否有误。
示例性地,在鼻咽喉镜的检查场景下,位置特征反映了解剖标志部位在相应鼻咽喉关键部位中的位置,以及各个解剖标志部位之间的相对位置关系,进而根据第二图像的位置特征判断解剖标志部位的位置是否合理,若是不合理则说明该第一图像变形严重,或是解剖标志部位识别有误。
步骤S230,提取第一图像的深度特征和第二图像的深度特征。
具体的,图像识别设备在基于第一图像获取第二图像之后,采用预设的技术手段提取第一图像和第二图像的深度特征。具体的,可以通过相应的卷积神经网络模型提取第一图像和第二图像的深度特征。
因此在一个优选的实施例中,通过预设的用于提取图像特征的预训练模型分别提取第一图像的深度特征和第二图像的深度特征。其中预训练模型是指已经训练完成可直接使用的卷积神经网络模型,从而在本实施例中,用户不需要再自行训练相应的网络模型用于提取图像的深度特征。示例性地,可以采用ImageNet(图片数据库)的ResNet(残差网络)预训练模型提取第一图像和第二图像的全局平均池化层特征作为深度特征。比如可以使用ResNet34提取图像的全局平均池化层特征作为深度特征。
需要进一步说明的是,第一图像的深度特征用于判断目标检查部位整体上是否清晰、有无噪点、有无运动模糊等,从而判断第一图像的质量;而第二图像的深度特征用于判断子检查部位是否清晰且完整,进而从医学诊断标准判断第一图像的质量。
步骤S240,根据第一图像的深度特征、第二图像的深度特征以及第二图像的位置特征,确定第一图像的识别结果。
具体的,图像识别设备从第一图像的深度特征、第二图像的深度特征以及第二图像的位置特征等三个角度的特征信息来确定第一图像的识别结果。三个不同的特征信息分别从三个不同角度反映了第一图像的质量,因此通过本实施例中的图像识别方法得出的第一图像的识别结果更加精准,能够准确地判断第一图像是否合格,其能否满足医学诊断的要求。
具体的,可以采用图像分类模型对第一图像进行分类,从而获得第一图像的识别结果,其中识别结果包括图像合格和图像不合格两种。因此在一个具体的实施例中,第一图像的识别流程为:通过训练预设的第一分类模型得到用于分类第一图像的第二分类模型;对第一图像的深度特征、第二图像的深度特征以及第二图像的位置特征进行融合得到融合特征,将融合特征输入至第二分类模型中;通过第二分类模型输出第一图像的识别结果,其中识别结果包括图像合格和图像不合格。
具体地在该实施例中,通过图像样本集训练第一分类模型,从而获得训练完备的第二分类模型,识别第一图像时将第一图像的深度特征、第二图像的深度特征以及第二图像的位置特征融合后输入至第二分类模型中,最终获得第一图像的分类结果,该分类结果即为识别结果,进而可以判断第一图像合格或是不合格。示例性地,分类模型可以采用xgboost(分布式梯度增强库)模型,每一个目标检查部位均需要训练一个xgboost模型,每个模型均是合格不合格两个类别。
通过上述步骤,图像识别设备先获取待检测的包含目标检查部位的第一图像,然后检测第一图像中的子检查部位,并生成相应的第二图像;再获取第二图像的位置特征,以及提取第一图像和第二图像的深度特征,最后根据第一图像的深度特征、第二图像的深度特征以及第二图像的位置特征,确定第一图像的识别结果。其中,第二图像的位置特征用于判断子检查部位的位置是否合理,以及反过来判断子检查部位的检测结果是否有误;第一图像的深度特征用于判断目标检查部位整体上是否清晰、有无噪点、有无运动模糊等,从而判断第一图像的质量;而第二图像的深度特征用于判断子检查部位是否清晰且完整,进而从医学诊断标准判断第一图像的质量。因此本实施例中的图像识别方法从三个不同的角度确定医学图像的图像质量,进而能够准确地判断相应的医学图像是否合格。当该图像识别方法应用在鼻咽喉镜检查中,可以解决现有技术中存在的无法有效地判断鼻咽喉镜关键部位图片是否合格的问题。
在其中的一些实施例中,步骤检测第一图像中的第二图像,获取第二图像的位置特征具体包括:根据预设的第一检测模型检测第一图像中的第二图像;若第一图像中的第二图像数量不符合预设值,则确定第一图像的识别结果为图像不合格;若第一图像中的第二图像数量符合预设值,则获取第二图像的位置特征。
具体的本实施例中,图像识别设备通过预设的第一检测模型来检测第一图像中的子检查部位,并获得相应的第二图像,同时可以获得第二图像的数量,第二图像数量即为在相应的目标检查部位中检测出的子检查部位数量。因此可以通过判断第二图像数量是否满足预设值来判断第一图像中是否完整的包含了应有的子检查部位。比如某个目标检查部位应当具有三个子检查部位,而在第一图像中实际检测出的第二图像仅有两个,则说明该第一图像中的目标检查部位是不完整的。则可能是在拍摄过程中没有完整的拍摄到目标检查部位,部分子检查部位未被拍摄到;或是部分子检查部位图像过于模糊,无法被有效地检测识别。无论是哪种原因导致子检查部位缺失,则该第一图像均是不合格的,无法在后续的医学诊断中被使用。因此在本实施例中,当第一图像中的第二图像数量不符合预设值时,则直接确定第一图像的识别结果为图像不合格,并且该第一图像的识别流程结束;当第一图像中的第二图像数量符合预设值时,则继续获取第二图像的位置特征,并继续对该第一图像进行后续的识别操作。
因此在本实施例中,在获取第二图像的位置特征以及提取第一图像的深度特征和第二图像的深度特征之前,先通过第二图像的数量对第一图像进行初步判断,能够简单有效地直接筛除部分明显不合格的第一图像,从而大大提高了图像识别效率。
在其中的一些实施例中,步骤根据预设的第一检测模型检测第一图像中的第二图像具体包括:通过训练预设的第二检测模型得到用于检测子检查部位的第一检测模型;将第一图像输入至第一检测模型中,通过第一检测模型检测第一图像中的子检查部位,并通过标记框选定子检查部位,标记框内部的图像则为第二图像。
具体的本实施例中,先通过包含子检查部位的图像样本集训练一个用于检测子检查部位的第一检测模型,然后用第一检测模型检测识别第一图像中的子检查部位,并采用相应的标记框来框选出子检查部位,而标记框内的图像则为第二图像。
在其中的一些实施例中,步骤单个第二图像的位置特征至少具体包括如下之一:在第一图像的坐标系中,第二图像的顶点坐标、中心点坐标、中心点与原点的距离、中心点所在象限;第二图像的长度、宽度、面积、长宽比;第二图像与第一图像的面积比、第二图像在第一图像中的相对位置。
具体的,由于第二图像是第一图像的一部分,因此可以在第一图像上建立坐标系来反映第二图像的位置。在采用标记框选定子检查部位的实施例中,每个第二图像在第一图像中的位置特征可以为标记框各个顶点的坐标、标记框的中心点坐标、标记框的中心点与坐标系原点的距离、标记框的中心点所在的坐标系象限;同时还可以通过顶点坐标,计算出第二图像的长度、宽度、面积、长宽比、第二图像与第一图像的面积比等;这些位置特征反映了子检查部位的大小、形状、比例等信息;同时位置特征还包括第二图像在第一图像中的相对位置,比如第二图像是否在第一图像的边缘位置。
在其中的一些实施例中,步骤多个第二图像之间的相对位置特征至少具体包括如下之一:在第一图像的坐标系中,多个第二图像之间的中心点坐标差值、中心点距离;多个第二图像之间的面积比、长度比、宽度比。
具体的,第一图像中还可能包括多个第二图像,因此还需要获取各个第二图像之间的相对位置关系,从而反映同一目标检查部位中各子检查部位之间的相对位置关系。在采用标记框选定子检查部位的实施例中,多个第二图像之间的相对位置特征可以为不同标记框的中心点坐标之间的差值、以及中心点之间的距离;同时在获取每个第二图像的长度、宽度、面积后,还可以计算出不同第二图像之间的面积比、长度比、宽度比等。这些相对位置特征反映了不同子检查部位之间的相对位置关系、相对大小关系等。
下面通过优选实施例对本申请中的技术方案进行描述和说明。
图3是本优选实施例的用于医学检查的图像识别方法的流程图。该本优选实施例中的图像识别方法应用在识别鼻咽喉镜检查中关键部位图片的场景中,如图3所示,该方法包括如下步骤:
步骤S310,对关键部位的图片进行解剖标志位的检测。
具体的,所有鼻咽喉镜关键部位的图片都有其对应的解剖标志位,因此在进行鼻咽喉镜关键部位的合格图片判断前,需要得到每一个解剖标志位的位置信息,即解剖标志位的最大外接矩形在图片的左上角x、y坐标和右下角x、y坐标。至于如何得到每一个解剖标志位的位置信息,可以自行应用目标检测网络来训练一个专门检测解剖标志位的模型。
步骤S320,判断解剖标志位是否齐全。
具体的,如果检测出的解剖标志位对于该关键部位而言不齐全,则该关键部位图片不合格,否则继续执行后续步骤S330。
步骤S330,获取解剖标志位的位置特征。
具体的,单个解剖标志位的位置特征信息为:x轴最小值、x轴最大值、y轴最小值、y轴最大值、长度、宽度、面积、长宽比、中心点坐标、中心点与原点的距离、中心点所在图片的第几象限、与所在关键部位图片的面积比、解剖标志位是否处在图片边缘等。各个解剖标志位间的位置特征信息为:各个解剖标志位间的中心点坐标插值、中心点之间的距离、面积比、长度比、宽度比、IOU等。
步骤S340,确定解剖标志位图片。
目标检测网络通过最大外接矩形选定解剖标志位,则最大外接矩形的内部图片则为解剖标志位图片。
步骤S350,提取关键部位图片的深度特征和提取解剖标志位图片的深度特征。
具体的,用ImageNet的ResNet预训练模型提取关键部位图片的深度特征。具体使用哪一个预训练模型、哪一层特征可以自行设定,本优选实施例中使用的是ResNet34,提取了全局平均池化层特征作为深度特征。与提取关键部位图片的深度特征相同,在提取解剖标志位图片的深度特征中,用ImageNet的ResNet预训练模型提取全局平均池化层特征作为深度特征。具体使用哪一个预训练模型、哪一层特征可以自行设定,本优选实施例中使用的是ResNet34。
步骤S360,将解剖标志位的位置特征、关键部位图片的深度特征和解剖标志位图片的深度特征进行融合。
具体的,本优选实施例中提取了关键部位图片的深度特征,用来判断整张图是否清晰、有无噪点、有无运动模糊等用来判断整幅图片的质量;提取了解剖标志位图片的深度特征,用来判断解剖标志位图片是否清晰且完整;提取了解剖标志位的位置信息,用来判断解剖标志位是否检测合理,是否位置正确,也能辅助判断是否完整。当所有特征提取完成后,将特征进行融合,特征融合可以是其他不同的方式,本优选实施例中用的是特征依次连接操作。
步骤S370,将融合后的特征输入至分类模型中。
具体的,特征融合之后就可送入分类模型中进行关键部位图片的合格不合格分类。其中,图片分类模型可以是任何分类模型,本优选实施例中使用的分类模型是xgboost,每个关键部位都需要训练一个xgboost模型,每个模型均是合格不合格两个类别。
步骤S380,输出图像识别结果。
具体的,通过分类模型输出图像识别结果,图像识别结果包括图像合格和图像不合格两种,分别对应分类模型的两种分类结果。
通过上述优选实施例的说明,可以看出本申请中的技术方案具有如下优点:
1、不仅能判断鼻咽喉镜关键部位图片的质量好坏,还能判断是否符合诊断报告中的标准。
2、结合了关键部位图片、解剖标志位图片和解剖标志位的位置信息,从三个不同维度提取特征,对关键部位图片的合格不合格判断更加准确。
3、提取的深度特征所用的网络模型不需要自行训练,可以使用ImageNet中的预训练模型,实现起来简单方便。
在本实施例中还提供了一种用于医学检查的图像识别装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。以下所使用的术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管在以下实施例中所描述的装置较佳的以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图4是本实施例的用于医学检查的图像识别装置的结构框图,如图4所示,该装置包括:
图像获取模块410,用于获取待检测的第一图像,第一图像中具有目标检查部位,其中目标检查部位至少包括一个子检查部位;
图像检测模块420,用于检测第一图像中的第二图像,获取第二图像的位置特征,其中第二图像为子检查部位的图像;
特征提取模块430,用于提取第一图像的深度特征和第二图像的深度特征;
图像识别模块440,用于根据第一图像的深度特征、第二图像的深度特征以及第二图像的位置特征,确定第一图像的识别结果。
通过上述功能模块的配合,图像识别装置先获取待检测的包含目标检查部位的第一图像,然后检测第一图像中的子检查部位,并生成相应的第二图像;再获取第二图像的位置特征,以及提取第一图像和第二图像的深度特征,最后根据第一图像的深度特征、第二图像的深度特征以及第二图像的位置特征,确定第一图像的识别结果。因此本实施例中的图像识别装置从三个不同的角度确定医学图像的图像质量,进而能够准确地判断相应的医学图像是否合格。当该图像识别装置应用在鼻咽喉镜检查中,可以解决现有技术中存在的无法有效地判断鼻咽喉镜关键部位图片是否合格的问题。
需要进一步说明的是,本实施例中的用于医学检查的图像识别装置的具体工作原理及过程,在上述方法实施例中已经具体说明,在此不再赘述。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
在本实施例中还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取待检测的第一图像,第一图像中具有目标检查部位,其中目标检查部位至少包括一个子检查部位。
S2,检测第一图像中的第二图像,获取第二图像的位置特征,其中第二图像为子检查部位的图像。
S3,提取第一图像的深度特征和第二图像的深度特征。
S4,根据第一图像的深度特征、第二图像的深度特征以及第二图像的位置特征,确定第一图像的识别结果。
需要说明的是,在本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,在本实施例中不再赘述。
此外,结合上述实施例中提供的用于医学检查的图像识别方法,在本实施例中还可以提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种用于医学检查的图像识别方法。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本申请提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本申请保护范围。
显然,附图只是本申请的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本申请适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本申请披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本申请公开的内容不足。
“实施例”一词在本申请中指的是结合实施例描述的具体特征、结构或特性可以包括在本申请的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本申请中描述的实施例在没有冲突的情况下,可以与其它实施例结合。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种用于医学检查的图像识别方法,其特征在于,所述方法包括:
获取待检测的第一图像,所述第一图像中包含目标检查部位,其中所述目标检查部位至少包括一个子检查部位;
检测所述第一图像中的第二图像,获取所述第二图像的位置特征,其中所述第二图像为所述子检查部位的图像;
提取所述第一图像的深度特征和所述第二图像的深度特征;
根据所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征,确定所述第一图像的识别结果。
2.根据权利要求1所述的用于医学检查的图像识别方法,其特征在于,所述检测所述第一图像中的第二图像,获取所述第二图像的位置特征包括:
根据预设的第一检测模型检测所述第一图像中的第二图像;
若所述第一图像中的第二图像数量不符合预设值,则确定所述第一图像的识别结果为图像不合格;
若所述第一图像中的第二图像数量符合预设值,则获取所述第二图像的位置特征。
3.根据权利要求1或权利要求2所述的用于医学检查的图像识别方法,其特征在于,所述第二图像的位置特征包括:单个所述第二图像的位置特征和/或多个所述第二图像之间的相对位置特征。
4.根据权利要求3所述的用于医学检查的图像识别方法,其特征在于,所述单个所述第二图像的位置特征至少包括如下之一:
在所述第一图像的坐标系中,所述第二图像的顶点坐标、中心点坐标、中心点与原点的距离、中心点所在象限;
所述第二图像的长度、宽度、面积、长宽比;
所述第二图像与所述第一图像的面积比、所述第二图像在所述第一图像中的相对位置。
5.根据权利要求3所述的用于医学检查的图像识别方法,其特征在于,所述多个所述第二图像之间的相对位置特征至少包括如下之一:
在所述第一图像的坐标系中,多个所述第二图像之间的中心点坐标差值、中心点距离;
多个所述第二图像之间的面积比、长度比、宽度比。
6.根据权利要求2所述的用于医学检查的图像识别方法,其特征在于,所述根据预设的第一检测模型检测所述第一图像中的第二图像包括:
通过训练预设的第二检测模型得到用于检测子检查部位的所述第一检测模型;
将所述第一图像输入至所述第一检测模型中,通过所述第一检测模型检测所述第一图像中的子检查部位,并通过标记框选定所述子检查部位,所述标记框内部的图像则为所述第二图像。
7.根据权利要求1或权利要求2所述的用于医学检查的图像识别方法,其特征在于,所述提取所述第一图像的深度特征和所述第二图像的深度特征包括:
通过预设的用于提取图像特征的预训练模型分别提取所述第一图像的深度特征和所述第二图像的深度特征。
8.根据权利要求1或权利要求2所述的用于医学检查的图像识别方法,其特征在于,所述根据所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征,确定所述第一图像的识别结果包括:
通过训练预设的第一分类模型得到用于分类所述第一图像的第二分类模型;
对所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征进行融合得到融合特征,将所述融合特征输入至所述第二分类模型中;
通过所述第二分类模型输出所述第一图像的识别结果,其中所述识别结果包括图像合格和图像不合格。
9.一种用于医学检查的图像识别装置,其特征在于,所述装置包括:
图像获取模块,用于获取待检测的第一图像,所述第一图像中具有目标检查部位,其中所述目标检查部位至少包括一个子检查部位;
图像检测模块,用于检测所述第一图像中的第二图像,获取所述第二图像的位置特征,其中所述第二图像为所述子检查部位的图像;
特征提取模块,用于提取所述第一图像的深度特征和所述第二图像的深度特征;
图像识别模块,用于根据所述第一图像的深度特征、所述第二图像的深度特征以及所述第二图像的位置特征,确定所述第一图像的识别结果。
10.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行权利要求1至权利要求8中任一项所述的用于医学检查的图像识别方法。
CN202210942019.2A 2022-08-08 2022-08-08 用于医学检查的图像识别方法、装置和电子装置 Active CN115018839B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210942019.2A CN115018839B (zh) 2022-08-08 2022-08-08 用于医学检查的图像识别方法、装置和电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210942019.2A CN115018839B (zh) 2022-08-08 2022-08-08 用于医学检查的图像识别方法、装置和电子装置

Publications (2)

Publication Number Publication Date
CN115018839A true CN115018839A (zh) 2022-09-06
CN115018839B CN115018839B (zh) 2022-11-04

Family

ID=83066095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210942019.2A Active CN115018839B (zh) 2022-08-08 2022-08-08 用于医学检查的图像识别方法、装置和电子装置

Country Status (1)

Country Link
CN (1) CN115018839B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115861299A (zh) * 2023-02-15 2023-03-28 浙江华诺康科技有限公司 一种基于二维重建的电子内窥镜质控方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007236502A (ja) * 2006-03-07 2007-09-20 Ge Medical Systems Global Technology Co Llc X線ct装置
JP2011092547A (ja) * 2009-10-30 2011-05-12 Ziosoft Inc 医療用画像処理装置及び医療用画像処理プログラム
CN112155601A (zh) * 2020-09-24 2021-01-01 广州爱孕记信息科技有限公司 一种胎儿超声图像的成像质量控制的确定方法及装置
CN113143168A (zh) * 2020-01-07 2021-07-23 日本电气株式会社 医疗辅助操作方法、装置、设备和计算机存储介质
CN113907775A (zh) * 2021-10-13 2022-01-11 瓴域影诺(北京)科技有限公司 一种髋关节影像质量判断方法及系统
WO2022108912A1 (en) * 2020-11-23 2022-05-27 Subtle Medical, Inc. Automated medical image quality control system
CN114663715A (zh) * 2022-05-26 2022-06-24 浙江太美医疗科技股份有限公司 医学图像质控、分类模型训练方法、装置及计算机设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007236502A (ja) * 2006-03-07 2007-09-20 Ge Medical Systems Global Technology Co Llc X線ct装置
JP2011092547A (ja) * 2009-10-30 2011-05-12 Ziosoft Inc 医療用画像処理装置及び医療用画像処理プログラム
CN113143168A (zh) * 2020-01-07 2021-07-23 日本电气株式会社 医疗辅助操作方法、装置、设备和计算机存储介质
CN112155601A (zh) * 2020-09-24 2021-01-01 广州爱孕记信息科技有限公司 一种胎儿超声图像的成像质量控制的确定方法及装置
WO2022108912A1 (en) * 2020-11-23 2022-05-27 Subtle Medical, Inc. Automated medical image quality control system
CN113907775A (zh) * 2021-10-13 2022-01-11 瓴域影诺(北京)科技有限公司 一种髋关节影像质量判断方法及系统
CN114663715A (zh) * 2022-05-26 2022-06-24 浙江太美医疗科技股份有限公司 医学图像质控、分类模型训练方法、装置及计算机设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JING-JING ZONG ET AL.: "Medical image fusion based on sparse representation of classified image patch", 《BIOMEDICAL SIGNAL PROCESSING AND CONTROL》 *
张喜红: "基于BP神经网络脑部CT图像模式分类方法的研究", 《伊犁师范学院学报(自然科学版)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115861299A (zh) * 2023-02-15 2023-03-28 浙江华诺康科技有限公司 一种基于二维重建的电子内窥镜质控方法及装置

Also Published As

Publication number Publication date
CN115018839B (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN108230252B (zh) 图像处理方法、装置以及电子设备
CN110232369B (zh) 一种人脸识别方法和电子设备
CN107633237B (zh) 图像背景分割方法、装置、设备及介质
CN108269333A (zh) 人脸识别方法、应用服务器及计算机可读存储介质
US8894500B2 (en) Diagnosing method of golf swing
CN107016348B (zh) 结合深度信息的人脸检测方法、检测装置和电子装置
US10796141B1 (en) Systems and methods for capturing and processing images of animals for species identification
CN115018839B (zh) 用于医学检查的图像识别方法、装置和电子装置
CN111597938A (zh) 活体检测、模型训练方法及装置
CN111985465A (zh) 文本识别方法、装置、设备及存储介质
CN110163046B (zh) 人体姿态识别方法、装置、服务器及存储介质
CN110363087B (zh) 一种长基线双目人脸活体检测方法及系统
CN112434715B (zh) 基于人工智能的目标识别方法、装置及存储介质
CN112052730B (zh) 一种3d动态人像识别监控设备及方法
CN111639582B (zh) 活体检测方法及设备
CN111368698B (zh) 主体识别方法、装置、电子设备及介质
JP2010239499A (ja) 通信端末装置、通信制御装置、通信端末装置の通信制御方法、通信制御プログラム
CN109697409B (zh) 一种运动图像的特征提取方法及起立动作图像的识别方法
CN108921178A (zh) 获取图像模糊程度分类的方法、装置、电子设备
CN109361850A (zh) 图像处理方法、装置、终端设备及存储介质
CN113674282A (zh) 图像分割方法、装置、电子装置、计算机设备和存储介质
CN111914763A (zh) 活体检测方法、装置和终端设备
JP2021022236A (ja) 分類信頼度算出装置、領域分割装置、学習装置、分類信頼度算出方法、学習方法、分類信頼度算出プログラム、及び学習プログラム
CN115272340A (zh) 工业产品缺陷检测方法和装置
CN115223173A (zh) 对象识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant