CN117036305A - 一种用于咽喉检查的图像处理方法、系统及存储介质 - Google Patents

一种用于咽喉检查的图像处理方法、系统及存储介质 Download PDF

Info

Publication number
CN117036305A
CN117036305A CN202311031259.8A CN202311031259A CN117036305A CN 117036305 A CN117036305 A CN 117036305A CN 202311031259 A CN202311031259 A CN 202311031259A CN 117036305 A CN117036305 A CN 117036305A
Authority
CN
China
Prior art keywords
throat
image
images
target
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311031259.8A
Other languages
English (en)
Inventor
汤洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University
Original Assignee
Zhengzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University filed Critical Zhengzhou University
Priority to CN202311031259.8A priority Critical patent/CN117036305A/zh
Publication of CN117036305A publication Critical patent/CN117036305A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于图像处理技术领域,具体涉及一种用于咽喉检查的图像处理方法、系统及存储介质,方法包括:获取若干个咽喉CT图像,生成若干个相应的咽喉CT目标图像,并且根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合来训练第一识别模型;重新获取若干个咽喉CT图像,生成若干个咽喉CT第一图像和咽喉CT第二图像,使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型,使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型;根据第二识别模型和第三识别模型的识别结果生成最终的识别结果,本发明能够提升识别准确率。

Description

一种用于咽喉检查的图像处理方法、系统及存储介质
技术领域
本发明属于图像处理技术领域,具体涉及一种用于咽喉检查的图像处理方法、系统及存储介质。
背景技术
目前,拍摄咽喉CT图像,通过对咽喉CT图像进行分析,从而检查咽喉部是否存在异物的技术越来越多的被用在了咽喉检查中。类似现有技术有公开号为CN116109610A的中国发明专利,公开一种超声检查报告图像中乳腺肿瘤分割方法和系统,步骤1,输入超声检查报告图像进行预处理;步骤2,利用第一检测模型对预处理的超声检查报告图像进行检测,裁剪出超声图像区域;步骤3,利用第一检测模型输出的分类标签,判断超声图像区域的超声图像类型,若为乳腺超声图像则进行下一步;步骤4,利用第二检测模型对超声图像区域进行检测,裁剪出超声图像肿瘤区域,但是该发明的肿瘤区域的检测准确率还有待提升。此外,类似现有技术还有公开号为CN106780460B的中国发明专利,公开一种用于胸部CT影像的肺结节自动检测系统,针对计算机辅助软件计算量大、预测不准确、预测种类少的问题提出改进,步骤包括:获取CT影像、分割肺部组织、检测肺部组织中的疑似结节区域、基于深度学习的病灶分类模型分类病灶、输出影像标记和诊断报告,然而,该发明没有考虑训练样本的生成需要花费大量时间的问题。
发明内容
本发明根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合来训练第一识别模型,并且使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型,还使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型,最后根据第二识别模型输出的识别结果,以及第三识别模型输出的识别结果生成最终的识别结果。本发明旨在提供第一识别模型的训练数据的生成方法,同时提高最终的识别结果的准确率。
为了达到上述的发明目的,本发明给出如下所述的一种用于咽喉检查的图像处理方法,主要包括以下的步骤:
获取若干个咽喉CT图像,从获取的若干个咽喉CT图像分别生成若干个相应的咽喉CT目标图像,并且根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,还使用新的咽喉CT图像和相应的新的咽喉CT目标图像的组合训练第一识别模型;
重新获取若干个咽喉CT图像,以及分别与若干个咽喉CT图像相对应的识别结果,得到若干个咽喉CT图像和若干个相应的识别结果的组合,并且针对重新获取的若干个咽喉CT图像分别进行第一处理,以分别得到若干个咽喉CT第一图像,使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型,还针对重新获取的若干个咽喉CT图像分别进行第二处理,以分别得到若干个咽喉CT第二图像,使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型;
将需要进行识别处理的咽喉CT图像进行所述第一处理,来得到咽喉CT第一图像,将咽喉CT第一图像输入所述第二识别模型,并且把需要进行识别处理的咽喉CT图像进行所述第二处理,以得到咽喉CT第二图像,将咽喉CT第二图像输入所述第三识别模型,还根据所述第二识别模型输出的识别结果,以及所述第三识别模型输出的识别结果生成最终的识别结果。
作为本发明的一种优选技术方案,根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,包括如下的步骤:
从若干个咽喉CT目标图像中随机选择预先设定个数的咽喉CT目标图像,并且将选择的预先设定个数的咽喉CT目标图像输入事先训练好的图像生成模型,所述图像生成模型输出由选择的预先设定个数的咽喉CT目标图像生成的新的咽喉CT目标图像;
依据若干个咽喉CT图像与若干个相应的咽喉CT目标图像之间的对应关系,从所述图像生成模型输出的新的咽喉CT目标图像得到新的咽喉CT图像。
作为本发明的一种优选技术方案,依据若干个咽喉CT图像与若干个相应的咽喉CT目标图像之间的对应关系,从所述图像生成模型输出的新的咽喉CT目标图像得到新的咽喉CT图像,包括如下的步骤:
从若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合中随机选择一个咽喉CT图像,以及与这个咽喉CT图像相对应的咽喉CT目标图像;
对于所述图像生成模型输出的新的咽喉CT目标图像中的每个图像元素,获取图像元素周围的图像元素的分布规律,同时将图像元素周围的图像元素的分布规律确定为标准分布规律,并且在与选择的咽喉CT图像相对应的咽喉CT目标图像中,查找周围的图像元素的分布规律与所述标准分布规律最接近的图像元素,还把坐标与查找到的图像元素在咽喉CT目标图像中的坐标相同的咽喉CT图像中的图像元素的颜色值,赋予坐标与查找到的图像元素在咽喉CT目标图像中的坐标相同的新的咽喉CT图像中的图像元素。
作为本发明的一种优选技术方案,所述第二识别模型,以及所述第三识别模型均指的是包括输入层、中间层,和输出层的神经网络模型。
作为本发明的一种优选技术方案,针对重新获取的若干个咽喉CT图像分别进行第一处理,以分别得到若干个咽喉CT第一图像,包括如下的步骤:
将咽喉CT图像输入所述第一识别模型,所述第一识别模型输出与咽喉CT图像相对应的咽喉CT目标图像,咽喉CT目标图像仅包含咽喉CT图像中的特定目标的图像;
在咽喉CT图像中根据咽喉CT目标图像确定特定目标的外接多边形,计算特定目标的外接多边形的各个边的比例关系,并且以和特定目标的外接多边形完全相同的形状,同时在特定目标的外接多边形的各个边之外保持预先设定的距离,从咽喉CT图像中剪切出部分咽喉CT图像;
针对所述部分咽喉CT图像进行整体扩大,或者整体缩小,以生成咽喉CT第一图像,使得咽喉CT第一图像能够输入到所述第二识别模型。
作为本发明的一种优选技术方案,针对重新获取的若干个咽喉CT图像分别进行第二处理,以分别得到若干个咽喉CT第二图像,包括针对咽喉CT图像进行边缘增强处理,并且继续对于经过边缘增强处理的咽喉CT图像进行整体扩大,或者整体缩小,以生成咽喉CT第二图像,使得咽喉CT第二图像能够输入到所述第三识别模型。
作为本发明的一种优选技术方案,根据所述第二识别模型输出的识别结果,以及所述第三识别模型输出的识别结果生成最终的识别结果,通过如下的计算公式实现:
κ=λ*α+(1-λ)*β
其中,κ为最终的识别结果,α为所述第二识别模型输出的识别结果,β为所述第三识别模型输出的识别结果,λ为所述第二识别模型输出的识别结果对应的权重,1-λ为所述第三识别模型输出的识别结果对应的权重。
本发明还提供一种用于咽喉检查的图像处理系统,包括如下的模块:
第一识别模型生成模块,用于获取若干个咽喉CT图像,从获取的若干个咽喉CT图像分别生成若干个相应的咽喉CT目标图像,并且根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,还使用新的咽喉CT图像和相应的新的咽喉CT目标图像的组合训练第一识别模型;
第二识别模型生成模块,用于重新获取若干个咽喉CT图像,以及分别与若干个咽喉CT图像相对应的识别结果,得到若干个咽喉CT图像和若干个相应的识别结果的组合,并且针对重新获取的若干个咽喉CT图像分别进行第一处理,以分别得到若干个咽喉CT第一图像,使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型;
第三识别模型生成模块,用于针对第二识别模型生成模块重新获取的若干个咽喉CT图像分别进行第二处理,以分别得到若干个咽喉CT第二图像,使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型;
图像识别处理模块,用于将需要进行识别处理的咽喉CT图像进行第一处理,来得到咽喉CT第一图像,将咽喉CT第一图像输入第二识别模型,并且把需要进行识别处理的咽喉CT图像进行第二处理,以得到咽喉CT第二图像,将咽喉CT第二图像输入第三识别模型,还根据第二识别模型输出的识别结果,以及第三识别模型输出的识别结果生成最终的识别结果。
本发明还提供一种存储介质,所述存储介质存储有程序指令,其中,在所述程序指令运行时控制所述存储介质所在设备执行上述中任意一项所述的方法。
与现有技术相比,本发明的有益效果至少如下所述:
在本发明中,首先获取若干个咽喉CT图像,生成若干个相应的咽喉CT目标图像,并且根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合来训练第一识别模型;其次重新获取若干个咽喉CT图像和与若干个咽喉CT图像相对应的识别结果,生成若干个咽喉CT第一图像和咽喉CT第二图像,使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型,使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型;根据第二识别模型输出的识别结果,以及第三识别模型输出的识别结果生成最终的识别结果。本发明不仅能够提高最终的识别结果的准确率,而且还能够为第一识别模型提供一种高效的训练数据的生成方法。
附图说明
图1为本发明的一种用于咽喉检查的图像处理方法的步骤流程图;
图2为本发明的一种用于咽喉检查的图像处理系统的组成结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
本发明提供了如图1所示的一种用于咽喉检查的图像处理方法,主要通过执行如下的步骤过程进行实现:
步骤一、获取若干个咽喉CT图像,从获取的若干个咽喉CT图像分别生成若干个相应的咽喉CT目标图像,并且根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,还使用新的咽喉CT图像和相应的新的咽喉CT目标图像的组合训练第一识别模型;
步骤二、重新获取若干个咽喉CT图像,以及分别与若干个咽喉CT图像相对应的识别结果,得到若干个咽喉CT图像和若干个相应的识别结果的组合,并且针对重新获取的若干个咽喉CT图像分别进行第一处理,以分别得到若干个咽喉CT第一图像,使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型,还针对重新获取的若干个咽喉CT图像分别进行第二处理,以分别得到若干个咽喉CT第二图像,使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型;
步骤三、将需要进行识别处理的咽喉CT图像进行上述第一处理,来得到咽喉CT第一图像,将咽喉CT第一图像输入上述第二识别模型,并且把需要进行识别处理的咽喉CT图像进行上述第二处理,以得到咽喉CT第二图像,将咽喉CT第二图像输入上述第三识别模型,还根据上述第二识别模型输出的识别结果,以及上述第三识别模型输出的识别结果生成最终的识别结果。
具体的,首先,获取若干个咽喉CT图像,咽喉CT图像中不仅包括特定目标的图像,特定目标为咽喉部的异物,异物为肿瘤和外来物,而且还包括除了特定目标的图像之外的背景图像,从获取的若干个咽喉CT图像分别生成若干个相应的咽喉CT目标图像,该过程可以由人工完成,能够准确生成咽喉CT图像对应的咽喉CT目标图像,但是一般效率较低,其中,咽喉CT目标图像仅包含咽喉CT图像中的特定目标的图像,根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,具体的生成过程将在下文中描述,该生成过程的效率较高,使用新的咽喉CT图像和相应的新的咽喉CT目标图像的组合训练第一识别模型,第一识别模型用于快速从咽喉CT图像生成对应的咽喉CT目标图像,其次,再次获取若干个咽喉CT图像,以及分别与若干个咽喉CT图像相对应的识别结果,该识别结果指的是对咽喉CT图像中包含的目标对象的识别结果,可以为肿瘤,或者是外来物,针对重新获取的若干个咽喉CT图像分别进行第一处理,分别得到若干个咽喉CT第一图像,使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型,第二识别模型能够将咽喉CT第一图像作为输入,并输出咽喉CT第一图像对应的识别结果,针对重新获取的若干个咽喉CT图像分别进行第二处理,分别得到若干个咽喉CT第二图像,使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型,第三识别模型能够将咽喉CT第二图像作为输入,并输出咽喉CT第二图像对应的识别结果,最后,获取需要进行识别处理的咽喉CT图像,需要进行识别处理的咽喉CT图像可以为需要进行咽喉检查的患者的咽喉CT图像,分别对需要进行识别处理的咽喉CT图像进行第一处理和第二处理,并把咽喉CT第一图像和咽喉CT第二图像分别输入第二识别模型和第三识别模型,根据第二识别模型和第三识别模型分别输出的识别结果生成最终的识别结果,生成方法将在下文中进行描述。
进一步的,根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,包括如下的步骤:
从若干个咽喉CT目标图像中随机选择预先设定个数的咽喉CT目标图像,并且将选择的预先设定个数的咽喉CT目标图像输入事先训练好的图像生成模型,上述图像生成模型输出由选择的预先设定个数的咽喉CT目标图像生成的新的咽喉CT目标图像;
依据若干个咽喉CT图像与若干个相应的咽喉CT目标图像之间的对应关系,从上述图像生成模型输出的新的咽喉CT目标图像得到新的咽喉CT图像。
进一步的,依据若干个咽喉CT图像与若干个相应的咽喉CT目标图像之间的对应关系,从上述图像生成模型输出的新的咽喉CT目标图像得到新的咽喉CT图像,包括如下的步骤:
从若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合中随机选择一个咽喉CT图像,以及与这个咽喉CT图像相对应的咽喉CT目标图像;
对于上述图像生成模型输出的新的咽喉CT目标图像中的每个图像元素,获取图像元素周围的图像元素的分布规律,同时将图像元素周围的图像元素的分布规律确定为标准分布规律,并且在与选择的咽喉CT图像相对应的咽喉CT目标图像中,查找周围的图像元素的分布规律与上述标准分布规律最接近的图像元素,还把坐标与查找到的图像元素在咽喉CT目标图像中的坐标相同的咽喉CT图像中的图像元素的颜色值,赋予坐标与查找到的图像元素在咽喉CT目标图像中的坐标相同的新的咽喉CT图像中的图像元素;
具体的,根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,该过程一般通过同时对若干个咽喉CT图像和若干个相应的咽喉CT目标图像进行移动、旋转等图像变换来实现,但是会使得新的咽喉CT图像和相应的新的咽喉CT目标图像保留了很多之前的图像特征,为了解决这个问题,从而快速生成新的咽喉CT图像和相应的新的咽喉CT目标图像来训练第一识别模型,先从若干个咽喉CT目标图像中随机选择一定个数的咽喉CT目标图像,并且将选择的一定个数的咽喉CT目标图像输入事先训练好的图像生成模型,图像生成模型输出新的咽喉CT目标图像,新的咽喉CT目标图像同时包含多个不同的咽喉CT目标图像的特征,新的咽喉CT目标图像具有多样性,再依据若干个咽喉CT图像与若干个相应的咽喉CT目标图像之间的对应关系,从新的咽喉CT目标图像得到新的咽喉CT图像,具体的做法是从若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合中,随机选择一个咽喉CT图像和与这个咽喉CT图像相对应的咽喉CT目标图像,针对新的咽喉CT目标图像中的每个图像元素,确定图像元素周围的图像元素的分布规律,并将分布规律认为是标准分布规律,分布规律举例如计算在图像元素周围的规定范围内的全部图像元素的直方图,在与选择的咽喉CT图像相对应的咽喉CT目标图像中,查找周围的图像元素的分布规律与标准分布规律最接近的图像元素,举例如两个直方图的内容最为相似,把坐标与查找到的图像元素在咽喉CT目标图像中的坐标相同的咽喉CT图像中的图像元素的颜色值,赋予坐标与查找到的图像元素在咽喉CT目标图像中的坐标相同的新的咽喉CT图像中的图像元素,坐标指的是图像元素在像素坐标系下的坐标,为了便于理解举例如,对于新的咽喉CT目标图像中的坐标为(x0,y0)的这个图像元素,在咽喉CT目标图像中的坐标为(x1,y1)的图像元素的周围的图像元素的分布规律与这个图像元素的周围的图像元素的分布规律最为接近,就把咽喉CT图像中的坐标为(x1,y1)的图像元素的颜色值,赋给新的咽喉CT图像中的坐标为(x1,y1)的图像元素。通过以上方法能够快速从若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,从而训练第一识别模型。
进一步的,上述第二识别模型,以及上述第三识别模型均指的是包括输入层、中间层,和输出层的神经网络模型;
进一步的,针对重新获取的若干个咽喉CT图像分别进行第一处理,以分别得到若干个咽喉CT第一图像,包括如下的步骤:
将咽喉CT图像输入上述第一识别模型,上述第一识别模型输出与咽喉CT图像相对应的咽喉CT目标图像,咽喉CT目标图像仅包含咽喉CT图像中的特定目标的图像;
在咽喉CT图像中根据咽喉CT目标图像确定特定目标的外接多边形,计算特定目标的外接多边形的各个边的比例关系,并且以和特定目标的外接多边形完全相同的形状,同时在特定目标的外接多边形的各个边之外保持预先设定的距离,从咽喉CT图像中剪切出部分咽喉CT图像;
针对上述部分咽喉CT图像进行整体扩大,或者整体缩小,以生成咽喉CT第一图像,使得咽喉CT第一图像能够输入到上述第二识别模型;
具体的,第一处理包括首先将咽喉CT图像输入训练好的第一识别模型,第一识别模型输出与咽喉CT图像相对应的咽喉CT目标图像,咽喉CT目标图像即为咽喉CT图像中的特定目标的图像,特定目标包括肿瘤和外来物这样的咽喉部的异物,但是第一识别模型无法区分咽喉部的异物是肿瘤还是外来物,其次在咽喉CT图像中根据咽喉CT目标图像确定特定目标的外接多边形,计算特定目标的外接多边形的各个边的比例关系,为了便于理解举例如特定目标的外接多边形为长方形,长方形的各个边的比例为1:2:1:2,以和特定目标的外接多边形完全相同的形状,并在特定目标的外接多边形的各个边之外保持预先设定的距离,从咽喉CT图像中剪切出部分咽喉CT图像,也即从咽喉CT图像中剪切出长方形的部分咽喉CT图像,长方形的各个边的比例为1:2:1:2,长方形的各个边的长度要大于特定目标的外接长方形的各个边的长度,长方形的各个边与相应的特定目标的外接长方形的各个边之间存在一定的距离,这样做能够尽量保留特定目标的完整的图像特征,上述长度和上述距离的度量单位均为图像元素,最后整体调整部分咽喉CT图像的大小,使得满足第二识别模型的输入要求。通过以上方法能够从咽喉CT图像中剪切出包含特定目标的部分咽喉CT图像,从而生成咽喉CT第一图像,咽喉CT第一图像更多包含特定目标的图像特征。
进一步的,针对重新获取的若干个咽喉CT图像分别进行第二处理,以分别得到若干个咽喉CT第二图像,包括针对咽喉CT图像进行边缘增强处理,并且继续对于经过边缘增强处理的咽喉CT图像进行整体扩大,或者整体缩小,以生成咽喉CT第二图像,使得咽喉CT第二图像能够输入到上述第三识别模型。通过该方法得到的咽喉CT第二图像,更多的包含咽喉CT图像的整体特征。
进一步的,根据上述第二识别模型输出的识别结果,以及上述第三识别模型输出的识别结果生成最终的识别结果,通过如下的计算公式实现:
κ=λ*α+(1-λ)*β
其中,κ为最终的识别结果,α为上述第二识别模型输出的识别结果,β为上述第三识别模型输出的识别结果,λ为上述第二识别模型输出的识别结果对应的权重,1-λ为上述第三识别模型输出的识别结果对应的权重。
具体的,经过上述第一处理,咽喉CT第一图像更多包含特定目标的图像特征,将咽喉CT第一图像输入第二识别模型,第二识别模型能够输出相应的识别结果,经过上述第二处理,咽喉CT第二图像更多的包含咽喉CT图像的整体特征,将咽喉CT第二图像输入第二识别模型,第二识别模型也能够输出相应的识别结果,再通过上述计算公式能够生成最终的识别结果,使用第二识别模型和第三识别模型的识别结果生成最终的识别结果,能够提升对咽喉CT图像中的特定目标的识别准确率,其中,不对λ,1-λ的具体数值进行限制,可以根据实际的应用情况进行设定。
进一步的,除了使用上述计算公式由第二识别模型和第三识别模型的识别结果生成最终的识别结果之外,还包括如下的生成最终的识别结果的方法:
在上述第二识别模型和上述第三识别模型都已经被训练完成之后,将上述第二识别模型的输出层的神经元和上述第三识别模型的输出层的神经元,与一个新的输出层的神经元进行完全连接,以形成由上述第二识别模型和上述第三识别模型组成的第四识别模型;
重新获取若干个咽喉CT图像,以及分别与若干个咽喉CT图像相对应的识别结果,针对若干个咽喉CT图像同时进行上述第一处理和上述第二处理,分别得到若干个咽喉CT第一图像,若干个相应的咽喉CT第二图像,以及若干个相应的识别结果的组合,并且分别使用若干个咽喉CT第一图像,若干个相应的咽喉CT第二图像,以及若干个相应的识别结果的组合训练上述第四识别模型;
将需要进行识别处理的咽喉CT图像进行上述第一处理,来得到咽喉CT第一图像,把需要进行识别处理的咽喉CT图像进行上述第二处理,以得到咽喉CT第二图像,同时将咽喉CT第一图像和咽喉CT第二图像输入到上述第四识别模型,上述第四识别模型输出最终的识别结果。
具体的,首先根据第二识别模型和第三识别模型建立第四识别模型,第四识别模型包括第二识别模型的组成结构,第三识别模型的组成结构,以及新的输出层,第二识别模型的输出层的神经元和第三识别模型的输出层的神经元,与新的输出层的神经元完全连接,其次重新获取若干个咽喉CT图像和分别与若干个咽喉CT图像相对应的识别结果,并且生成若干个咽喉CT第一图像,若干个相应的咽喉CT第二图像,以及若干个相应的识别结果的组合,同时将咽喉CT第一图像输入第四识别模型中的第二识别模型,将相应的咽喉CT第二图像输入第四识别模型中的第三识别模型,根据相应的识别结果训练第二识别模型的输出层和第三识别模型的输出层与第四识别模型的新的输出层之间的连接权重,最后将需要进行识别处理的咽喉CT图像进行第一处理得到咽喉CT第一图像,把需要进行识别处理的咽喉CT图像进行第二处理得到咽喉CT第二图像,同时将咽喉CT第一图像和咽喉CT第二图像输入到第四识别模型的第二识别模型和第三识别模型,从而第四识别模型输出最终的识别结果。
根据本发明实施例的另一个方面,参考如图2所示,还提供一种用于咽喉检查的图像处理系统,包括第一识别模型生成模块,第二识别模型生成模块,第三识别模型生成模块,以及图像识别处理模块,各个模块的功能如下:
第一识别模型生成模块,用于获取若干个咽喉CT图像,从获取的若干个咽喉CT图像分别生成若干个相应的咽喉CT目标图像,并且根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,还使用新的咽喉CT图像和相应的新的咽喉CT目标图像的组合训练第一识别模型;
第二识别模型生成模块,用于重新获取若干个咽喉CT图像,以及分别与若干个咽喉CT图像相对应的识别结果,得到若干个咽喉CT图像和若干个相应的识别结果的组合,并且针对重新获取的若干个咽喉CT图像分别进行第一处理,以分别得到若干个咽喉CT第一图像,使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型;
第三识别模型生成模块,用于针对第二识别模型生成模块重新获取的若干个咽喉CT图像分别进行第二处理,以分别得到若干个咽喉CT第二图像,使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型;
图像识别处理模块,用于将需要进行识别处理的咽喉CT图像进行第一处理,来得到咽喉CT第一图像,将咽喉CT第一图像输入第二识别模型,并且把需要进行识别处理的咽喉CT图像进行第二处理,以得到咽喉CT第二图像,将咽喉CT第二图像输入第三识别模型,还根据第二识别模型输出的识别结果,以及第三识别模型输出的识别结果生成最终的识别结果。
根据本发明实施例的另一个方面,还提供了一种存储介质,存储介质存储有程序指令,其中,在程序指令运行时控制存储介质所在设备执行上述中任意一项的方法。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,上述的程序可存储于一个非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上上述的实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上上述的实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上上述的仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种用于咽喉检查的图像处理方法,其特征在于,包括如下的步骤:
获取若干个咽喉CT图像,从获取的若干个咽喉CT图像分别生成若干个相应的咽喉CT目标图像,并且根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,还使用新的咽喉CT图像和相应的新的咽喉CT目标图像的组合训练第一识别模型;
重新获取若干个咽喉CT图像,以及分别与若干个咽喉CT图像相对应的识别结果,得到若干个咽喉CT图像和若干个相应的识别结果的组合,并且针对重新获取的若干个咽喉CT图像分别进行第一处理,以分别得到若干个咽喉CT第一图像,使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型,还针对重新获取的若干个咽喉CT图像分别进行第二处理,以分别得到若干个咽喉CT第二图像,使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型;
将需要进行识别处理的咽喉CT图像进行所述第一处理,来得到咽喉CT第一图像,将咽喉CT第一图像输入所述第二识别模型,并且把需要进行识别处理的咽喉CT图像进行所述第二处理,以得到咽喉CT第二图像,将咽喉CT第二图像输入所述第三识别模型,还根据所述第二识别模型输出的识别结果,以及所述第三识别模型输出的识别结果生成最终的识别结果。
2.根据权利要求1所述的一种用于咽喉检查的图像处理方法,其特征在于,根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,包括如下的步骤:
从若干个咽喉CT目标图像中随机选择预先设定个数的咽喉CT目标图像,并且将选择的预先设定个数的咽喉CT目标图像输入事先训练好的图像生成模型,所述图像生成模型输出由选择的预先设定个数的咽喉CT目标图像生成的新的咽喉CT目标图像;
依据若干个咽喉CT图像与若干个相应的咽喉CT目标图像之间的对应关系,从所述图像生成模型输出的新的咽喉CT目标图像得到新的咽喉CT图像。
3.根据权利要求2所述的一种用于咽喉检查的图像处理方法,其特征在于,依据若干个咽喉CT图像与若干个相应的咽喉CT目标图像之间的对应关系,从所述图像生成模型输出的新的咽喉CT目标图像得到新的咽喉CT图像,包括如下的步骤:
从若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合中随机选择一个咽喉CT图像,以及与这个咽喉CT图像相对应的咽喉CT目标图像;
对于所述图像生成模型输出的新的咽喉CT目标图像中的每个图像元素,获取图像元素周围的图像元素的分布规律,同时将图像元素周围的图像元素的分布规律确定为标准分布规律,并且在与选择的咽喉CT图像相对应的咽喉CT目标图像中,查找周围的图像元素的分布规律与所述标准分布规律最接近的图像元素,还把坐标与查找到的图像元素在咽喉CT目标图像中的坐标相同的咽喉CT图像中的图像元素的颜色值,赋予坐标与查找到的图像元素在咽喉CT目标图像中的坐标相同的新的咽喉CT图像中的图像元素。
4.根据权利要求1所述的一种用于咽喉检查的图像处理方法,其特征在于,所述第二识别模型,以及所述第三识别模型均指的是包括输入层、中间层,和输出层的神经网络模型。
5.根据权利要求4所述的一种用于咽喉检查的图像处理方法,其特征在于,针对重新获取的若干个咽喉CT图像分别进行第一处理,以分别得到若干个咽喉CT第一图像,包括如下的步骤:
将咽喉CT图像输入所述第一识别模型,所述第一识别模型输出与咽喉CT图像相对应的咽喉CT目标图像,咽喉CT目标图像仅包含咽喉CT图像中的特定目标的图像;
在咽喉CT图像中根据咽喉CT目标图像确定特定目标的外接多边形,计算特定目标的外接多边形的各个边的比例关系,并且以和特定目标的外接多边形完全相同的形状,同时在特定目标的外接多边形的各个边之外保持预先设定的距离,从咽喉CT图像中剪切出部分咽喉CT图像;
针对所述部分咽喉CT图像进行整体扩大,或者整体缩小,以生成咽喉CT第一图像,使得咽喉CT第一图像能够输入到所述第二识别模型。
6.根据权利要求4所述的一种用于咽喉检查的图像处理方法,其特征在于,针对重新获取的若干个咽喉CT图像分别进行第二处理,以分别得到若干个咽喉CT第二图像,包括针对咽喉CT图像进行边缘增强处理,并且继续对于经过边缘增强处理的咽喉CT图像进行整体扩大,或者整体缩小,以生成咽喉CT第二图像,使得咽喉CT第二图像能够输入到所述第三识别模型。
7.根据权利要求4所述的一种用于咽喉检查的图像处理方法,其特征在于,根据所述第二识别模型输出的识别结果,以及所述第三识别模型输出的识别结果生成最终的识别结果,通过如下的计算公式实现:
κ=λ*α+(1-λ)*β
其中,κ为最终的识别结果,α为所述第二识别模型输出的识别结果,β为所述第三识别模型输出的识别结果,λ为所述第二识别模型输出的识别结果对应的权重,1-λ为所述第三识别模型输出的识别结果对应的权重。
8.一种用于咽喉检查的图像处理系统,用于实现如权利要求1-7任意一项所述的方法,其特征在于,包括如下的模块:
第一识别模型生成模块,用于获取若干个咽喉CT图像,从获取的若干个咽喉CT图像分别生成若干个相应的咽喉CT目标图像,并且根据若干个咽喉CT图像和若干个相应的咽喉CT目标图像的组合,自动生成新的咽喉CT图像和相应的新的咽喉CT目标图像的组合,还使用新的咽喉CT图像和相应的新的咽喉CT目标图像的组合训练第一识别模型;
第二识别模型生成模块,用于重新获取若干个咽喉CT图像,以及分别与若干个咽喉CT图像相对应的识别结果,得到若干个咽喉CT图像和若干个相应的识别结果的组合,并且针对重新获取的若干个咽喉CT图像分别进行第一处理,以分别得到若干个咽喉CT第一图像,使用若干个咽喉CT第一图像和若干个相应的识别结果的组合训练第二识别模型;
第三识别模型生成模块,用于针对第二识别模型生成模块重新获取的若干个咽喉CT图像分别进行第二处理,以分别得到若干个咽喉CT第二图像,使用若干个咽喉CT第二图像和若干个相应的识别结果的组合训练第三识别模型;
图像识别处理模块,用于将需要进行识别处理的咽喉CT图像进行第一处理,来得到咽喉CT第一图像,将咽喉CT第一图像输入第二识别模型,并且把需要进行识别处理的咽喉CT图像进行第二处理,以得到咽喉CT第二图像,将咽喉CT第二图像输入第三识别模型,还根据第二识别模型输出的识别结果,以及第三识别模型输出的识别结果生成最终的识别结果。
9.一种存储介质,其特征在于,所述存储介质存储有程序指令,其中,在所述程序指令运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的方法。
CN202311031259.8A 2023-08-16 2023-08-16 一种用于咽喉检查的图像处理方法、系统及存储介质 Pending CN117036305A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311031259.8A CN117036305A (zh) 2023-08-16 2023-08-16 一种用于咽喉检查的图像处理方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311031259.8A CN117036305A (zh) 2023-08-16 2023-08-16 一种用于咽喉检查的图像处理方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN117036305A true CN117036305A (zh) 2023-11-10

Family

ID=88624160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311031259.8A Pending CN117036305A (zh) 2023-08-16 2023-08-16 一种用于咽喉检查的图像处理方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN117036305A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117437221A (zh) * 2023-12-18 2024-01-23 浙江祥晋汽车零部件股份有限公司 一种基于图像检测的亮饰条检测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117437221A (zh) * 2023-12-18 2024-01-23 浙江祥晋汽车零部件股份有限公司 一种基于图像检测的亮饰条检测方法及系统
CN117437221B (zh) * 2023-12-18 2024-04-26 浙江祥晋汽车零部件股份有限公司 一种基于图像检测的亮饰条检测方法及系统

Similar Documents

Publication Publication Date Title
CN110120040B (zh) 切片图像处理方法、装置、计算机设备和存储介质
WO2019200753A1 (zh) 病变监测方法、装置、计算机设备和存储介质
CN110796613B (zh) 一种图像伪影的自动识别方法及装置
CN110415792B (zh) 图像检测方法、装置、计算机设备和存储介质
CN111862044A (zh) 超声图像处理方法、装置、计算机设备和存储介质
CN111260055A (zh) 基于三维图像识别的模型训练方法、存储介质和设备
CN110717905B (zh) 脑部图像检测方法、计算机设备和存储介质
CN117036305A (zh) 一种用于咽喉检查的图像处理方法、系统及存储介质
CN110335248A (zh) 医学图像病灶检测方法、装置、计算机设备和存储介质
CN110490841B (zh) 计算机辅助影像分析方法、计算机设备和存储介质
CN110738702B (zh) 一种三维超声图像的处理方法、装置、设备及存储介质
CN111128348B (zh) 医学图像处理方法、装置、存储介质及计算机设备
CN111798410A (zh) 基于深度学习模型的癌细胞病理分级方法、装置、设备和介质
CN112488983A (zh) 缺陷识别网络的获得方法、缺陷识别方法和等级确定方法
CN111932538B (zh) 分析甲状腺图谱的方法、装置、计算机设备及存储介质
CN116959712A (zh) 基于病理图像的肺腺癌预后方法、系统、设备及存储介质
CN115359005A (zh) 图像预测模型生成方法、装置、计算机设备和存储介质
CN114693671A (zh) 基于深度学习的肺结节半自动分割方法、装置、设备及介质
CN110738664B (zh) 图像定位方法、装置、计算机设备和存储介质
CN113793316A (zh) 一种超声扫查区域提取方法、装置、设备和存储介质
CN112990367A (zh) 一种图像处理方法、装置、设备以及存储介质
CN112634266A (zh) 喉镜图像的半自动标注方法、介质、设备及装置
CN111210414A (zh) 医学图像分析方法、计算机设备和可读存储介质
CN113112475B (zh) 一种基于机器学习的中医耳部五脏区域分割方法和装置
CN116777893B (zh) 一种基于乳腺超声横纵切面特征结节的分割与识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination