CN114419370A - 目标图像处理方法、装置、存储介质与电子设备 - Google Patents
目标图像处理方法、装置、存储介质与电子设备 Download PDFInfo
- Publication number
- CN114419370A CN114419370A CN202210022093.2A CN202210022093A CN114419370A CN 114419370 A CN114419370 A CN 114419370A CN 202210022093 A CN202210022093 A CN 202210022093A CN 114419370 A CN114419370 A CN 114419370A
- Authority
- CN
- China
- Prior art keywords
- sub
- target
- images
- image
- classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20021—Dividing image into blocks, subimages or windows
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请公开一种目标图像处理方法、装置、存储介质与电子设备。目标图像处理方法中,将目标训练图像分割为多个第一子图像,并将多个第一子图像输入第一分类器中获得目标训练图像的分类结果;当第一分类器的分类结果为错误分类时,改变分割起始点对目标训练图像再次进行分割得到第二子图像,再通过第二分类器从第二子图像中选取第一目标子图像,并采用第一目标子图像对预设分类器进行训练,有利于在训练时预设分类器从第一目标子图像提取有效特征信息,从而提高第三分类器对目标图像的分类正确率和分类效率。
Description
技术领域
本申请涉及图像处理技术领域,具体涉及一种目标图像处理方法、装置、存储介质与电子设备。
背景技术
在一些图像处理场景中,需要根据图像中内容的不同,对图像进行分类。
目前,通过将图像输入基于神经网络的分类器中,可以实现对图像的分类。但是,现有基于神经网络的分类器对大尺度、类别特征分布稀疏的图像进行分类时,存在分类正确率较低和分类效率较低的问题。
发明内容
基于此,为了解决或改善现有技术的问题,本申请提供一种目标图像处理方法、装置、存储介质与电子设备,可以提高图像分类的正确率和分类效率。
第一方面,提供一种目标图像处理方法,包括:
获取目标训练图像,并根据第一分割参数将所述目标训练图像分割为多个第一子图像;
将所述多个第一子图像输入第一分类器中,获得所述目标训练图像的分类结果;
当所述分类结果为错误分类时,根据第二分割参数将所述第一训练图像分割为多个第二子图像,其中,所述第一分割参数与所述第二分割参数的分割起点不同;
至少将所述多个第二子图像输入第二分类器中,获得多个第一目标子图像,其中,所述第一目标子图像为含有预设特征的子图像;
构建训练集,所述训练集包括多个第一目标子图像和多个第二目标子图像,其中,所述第二目标子图像为不含所述预设特征的子图像;
采用所述训练集对预设分类器进行训练,得到第三分类器;
获取目标图像,并采用所述第三分类器对所述目标图像进行分类,得到所述目标图像的分类结果。
其中一个实施例中,所述至少将所述多个第二子图像输入第二分类器中,包括:
将所述多个第一子图像和所述多个第二子图像输入所述第二分类器。
其中一个实施例中,所述至少将所述多个第二子图像输入第二分类器中,获得第一目标子图像,包括:
至少将所述多个第二子图像输入所述第二分类器,分别获得所述多个第二子图像的分类类型;
根据所述多个第二子图像在所述目标训练图像中的位置和分类类型,确定第一目标子图像。
其中一个实施例中,所述根据所述多个第二子图像在所述目标训练图像中的位置和分类类型,确定多个第一目标子图像,包括:
根据所述多个第二子图像的分类类型,选取多个目标类别子图像;
根据所述多个目标类别子图像在所述目标训练图像中的位置,确定所述多个目标类别子图像的中心位置和分布半径;
根据所述中心位置和所述分布半径,确定所述多个目标类别子图像在所述目标训练图像中的分布区域;
当所述初始分布区域内的目标类别子图像与所述多个第二子图像的数量占比小于预设数量占比时,减小所述分布半径,直至所述分布区域内的目标类别子图像与所述多个第二子图像的数量占比大于或等于所述预设数量占比时,获得目标分布区域;
获取所述目标分布区域覆盖的目标类别子图像,得到所述多个第一目标子图像。
其中一个实施例中,所述根据所述多个目标类别子图像在所述目标训练图像中的位置,确定所述多个目标类别子图像的中心位置和分布半径,包括:
根据所述多个目标类别子图像在所述目标训练图像中的位置,确定确定所述多个目标类别子图像的中心位置;
计算最远目标类别子图像与所述中心位置之间的距离,获得分布半径,其中,所述最远目标类别子图像为与所述中心位置连通且距离最远的目标类别子图像。
其中一个实施例中,所述获取所述目标分布区域覆盖的目标类别子图像,得到所述多个第一目标子图像,包括:
将被所述目标分布区域覆盖且位于所述目标分布区域预设边缘位置的目标类别子图像进行移除,将剩余的目标类别子图像作为所述第一目标子图像。
其中一个实施例中,所述预设数量占比为95%~100%。
第二方面,提供一种目标图像处理装置,包括:
第一分割模块,用于获取目标训练图像,并根据第一分割参数将所述目标训练图像分割为多个第一子图像;
第一分类模块,用于将所述多个第一子图像输入第一分类器中,获得所述目标训练图像的分类结果;
第二分割模块,用于当所述分类结果为错误分类时,根据第二分割参数将所述第一训练图像分割为多个第二子图像,其中,所述第一分割参数与所述第二分割参数的分割起点不同;
第二分类模块,用于至少将所述多个第二子图像输入第二分类器中,获得多个第一目标子图像,其中,所述第一目标子图像为含有预设特征的子图像;
构建模块,用于构建训练集,所述训练集包括多个第一目标子图像和多个第二目标子图像,其中,所述第二目标子图像为不含所述预设特征的子图像;
训练模块,用于采用所述训练集对预设分类器进行训练,得到第三分类器;
第三分类模块,用于获取目标图像,并采用所述第三分类器对所述目标图像进行分类,得到所述目标图像的分类结果。
第三方面,提供一种计算机可读的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上执行时,使得所述计算机执行如上所述的目标图像处理方法。
第四方面,提供一种电子设备,包括存储器以及处理器,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如上所述的目标图像处理方法。
上述目标图像处理方法中,将目标训练图像分割为多个第一子图像,并将多个第一子图像输入第一分类器中,获得目标训练图像的分类结果,当第一分类器的分类结果为错误分类时,改变分割起始点对目标训练图像再次进行分割得到第二子图像,再通过第二分类器从第二子图像中选取具有预设特征的第一目标子图像,并采用第一目标子图像对预设分类器进行训练,有利于在训练时,预设分类器从第一目标子图像提取有效特征信息,有利于提高第三分类器对目标图像的分类正确率。因此,本申请可以提高图像分类的正确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。应当理解的是,下面描述中的附图仅仅用以解释本申请,并不用于限定本申请。
图1为本申请一个实施例中电子设备的内部结构示意图;
图2是本申请一实施例的目标图像处理方法的流程示意图;
图3是本申请一实施例中预设特征集群的分布示意图;
图4是本申请一实施例中第一目标子图像在目标训练图像中的位置示意图;
图5是本申请一个实施例的目标图像处理装置的结构框图。
具体实施方式
下面结合附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而非全部实施例。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中电子设备的内部结构示意图。如图1所示,该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该处理器用于提供计算和控制能力,支撑整个电子设备的运行。存储器用于存储数据、程序等,存储器上存储至少一个计算机程序,该计算机程序可被处理器执行,以实现本申请实施例中提供的适用于电子设备的无线网络通信方法。存储器可包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以下各个实施例所提供的一种目标图像处理方法。内存储器为非易失性存储介质中的操作系统计算机程序提供高速缓存的运行环境。网络接口可以是以太网卡或无线网卡等,用于与外部的电子设备进行通信。
本申请中描述的电子设备可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、便捷式媒体播放器(Portable MediaPlayer,PMP)、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
本实施例中,电子设备包括存储器及处理器,存储器中储存有计算机程序,计算机程序被处理器执行时,使得处理器执行目标图像处理方法。
请参阅图2,该目标图像处理方法包括:
步骤10、获取目标训练图像,并根据第一分割参数将目标训练图像分割为多个第一子图像;
步骤20、将多个第一子图像输入第一分类器中,获得目标训练图像的分类结果;
步骤30、当分类结果为错误分类时,根据第二分割参数将第一训练图像分割为多个第二子图像,其中,第一分割参数与第二分割参数的分割起点不同;
步骤40、至少将多个第二子图像输入第二分类器中,获得多个第一目标子图像,其中,第一目标子图像为含有预设特征的子图像;
步骤50、构建训练集,训练集包括多个第一目标子图像和多个第二目标子图像,其中,第二目标子图像为不含预设特征的子图像;
步骤60、采用训练集对预设分类器进行训练,得到第三分类器;
步骤70、获取目标图像,并采用第三分类器对目标图像进行分类,得到目标图像的分类结果。
目标图像可以是粮仓内粮食图像或细胞影像切片图像。这些图像的尺寸非常大,且影响类别的重要特征不均匀的分布在图像的不同区域,导致分类的难度增加的问题。
例如,在一个应用场景中,目标图像具体是一种病理影像切片图像,具体如医疗影像切片图像。目标图像的分类难度通常较大,会面临许多技术问题。
具体在训练分类器时,由于病理影像切片图像尺寸非常大,导致分类的难度增加的问题。一般地,病理影像切片图像具有很大的分辨率,尺寸在100MB以上,甚至1GB以上。本实施例通过对目标训练图像(病理影像切片图像)进行分割,得到尺寸较小的多个第一子图像,将多个第一子图像作为分类器的输入对象,进而根据多个第一子图像的分类结果确定目标训练图像的分类结果,从而有利于降低目标训练图像的分类难度。
而且,对病理影像切片图像进行分割后,还会面临只有完整病理影像切片图像的类别标签,而没有子图像的类别标签的问题。其中,由于具有病理特征的细胞在病理影像切片中的分布形式差异,导致对病理影像切片图像分割得到的多个子图像中既存在含预设特征的子图像和不含预设特征的子图像。由于子图像没有类别标签,若将不含预设特征的子图像的分类标签错误设定为含预设特征对应的分类标签,可能会影响训练得到的分类器的分类正确性。基于此,本实施例将多个第二子图像输入第二分类器中,获得多个第一目标子图像,即通过从多个第二子图像中选取大概率具有预设特征的子图像作为第一目标子图像,即实现第一目标子图像分类标签的设定为预设特征的子图像的分类标签,再采用第一目标子图像对预设分类器进行训练,进而得到第三分类器。
此外,在进行目标图像分类或训练分类器时,将病理影像切片图像分割后的子图像输入分类器后,还会面临病理影像切片图像大概率分类错误的问题。经研究发现,通常是这些病理影像切片图像中包含的有效预设特征较少,此时,将病理影像切片图像被分割成子图像后,可能大部分子图像中都不含预设特征,而这些不含预设特征的子图像会影响到分类效果。本实施例通过改变前后两次分割的分割起始点,使得目标训练图像中预设特征在第二子图像中重新排布,例如,使目标训练图像中预设特征分布在更多的第二子图像中,在通过第二分类器从第二子图像中获取的第一目标子图像的数量更多,减少由于对目标训练图像分割方式单一影响对预设分类器训练效果的问题,有利于提高第三分类器对目标图像的分类正确率。
步骤10中,目标训练图像为一种用于训练分类器的图像。例如,目标训练图像为包含至少一种细胞的图像,具体地,目标训练图像中可以只有一种细胞,如癌细胞A;目标训练图像中可以有两种或两种以上的细胞,如同时含有癌细胞A和癌细胞B。
目标训练图像是一种用于训练分类器的图像,且目标训练图像对应设置有分类标签,该分类标签用于表明训练图像的分类类别。例如,可以根据图像中预设细胞的分类设置目标训练图像的分类标签。具体地,目标训练图像中预设细胞为癌细胞A,则将目标训练图像设置为癌细胞A训练图像。又如,目标训练图像中预设细胞为癌细胞B,则将目标训练图像设置为癌细胞B训练图像。
步骤10中,第一分割参数是用于对目标训练图像进行分割的参数。可选地,第一分割参数包括:分割起始点、分割宽度等参数。第一子图像为对目标训练图像进行分割后得到的图像。可见,第一子图像的尺寸小于目标训练图像的尺寸。
在其中一个实施例中,第一子图像为方格图像,即第一子图像的形状为矩形。例如,以目标训练图像右上角的预设点作为分割起始点,将完整的目标训练图像分割成224×224的小方格,得到第一子图像。
步骤20中,第一分类器是一种基于神经网络的分类器,能够对输入的第一子图像的分类类别进行判断,并根据多个第一子图像的分类类别,确定目标训练图像的分类结果。
在其中一个实施例中,将所述多个第一子图像输入第一分类器中,对第一类分类器进行训练,并用当前训练后的第一类分类器获得目标训练图像的分类结果。
第一分类器为多分类器,例如二分类器、三分类器等,具体根据预设类别数量确定。例如,根据癌细胞A等级对目标训练图像进行分类时,可以基于癌细胞A的N个等级,并增加正常细胞类别后,将目标训练图像分为N+1个类别,则第一分类器为一种N+1分类器。
第一分类器根据多个第一子图像的分类类别和多数投票的方法,确定训练图像的分类结果。例如,在多数投票确定训练图像的分类结果中,当属于目标分类类别的第一子图像数量大于或等于预设数量阈值,或当属于目标分类类别的第一子图像数量比例大于或等于预设数量比例阈值时,确定原始的训练图像的分类类别为目标分类类别。
步骤30中,分类结果即为第一分类器对目标训练图像处理后得到的预测分类,当目标训练图像的预测分类与目标训练图像的真实分类不同时,即分类结果为错误分类。例如第一分类器将目标训练图像识别为正常图像,而目标训练图像的真实分类为癌细胞图像,目标训练图像的分类结果为错误分类。
步骤30中,第一分割参数与第二分割参数的分割起点不同,使得目标训练图像中预设特征进行子图像中重新分布,减少由于分割的原因造成第一子图像中预设细胞的有效特征信息损失的问题,即减少由于分割方式单一影响后续对预设分类器的训练效果。可选地,第二分割参数可以使预设特征分布在更多的第二子图像,有利于增加第二子图像中目标子图像的数量,减少由于分割导致的训练效果较差的问题。
研究发现,对于分类结果为错误分类的目标训练图像中包含的预设特征较少,而非预设特征较多,即该目标训练图像被分割成多个第一子图像后,可能大部分第一子图像为不含预设细胞的子图像,这些不含预设细胞的子图像会对分类结果造成影响,容易导致错误分类。基于此,对于分类结果为错误分类的目标训练图像需要重新进行分割,即通过改变分割参数对目标训练图像重新分割,得到多个第二子图像,可以使预设特征分布在更多的第二子图像,有利于增加第二子图像中目标子图像的数量,减少由于分割导致的训练效果较差的问题。
需要说明的是,不含预设细胞的子图像是指完全不包含预设细胞或含预设细胞较少以致未达到第一分类器检出限的子图像,其中,预设细胞具有预设特征。
第一分割参数中的分割起始点与第二分割参数中的分割起始点不同。分割起始点可以理解为对目标训练图像进行分割的起始坐标。例如,在按照从左至右和从上至下对目标训练图片进行分割的过程中,分割起始点即为第一个子图像的左上顶点对应的坐标。
步骤40中,第二分类器是一种基于神经网络的分类器,能够对输入的子图像进行分类,从而确定第一目标子图像。其中,第二分类器能够提取子图像中的细胞特征确定第一目标子图像,第一目标子图像为含有预设特征的子图像。
在其中一个实施例中,在第一分类器对第一子图像分类的过程中,获取分类正确的第一子图像。可以理解的是,目标训练图像的分类结果为错误,是由于分类结果正确的第一子图像较少,而分类正确的第一子图像较多导致的。因此,目标训练图像的分类结果为错误,第一子图像中仍然有分类结果正确的第一子图像。
将分类正确的第一子图像和第二子图像输入第二分类器中,对第二类分类器进行训练,并用当前训练后的第二类分类器对第二子图像进行分类。
在其中的一个实施例中,至少将多个第二子图像输入第二分类器中包括:
步骤401、将多个第一子图像和多个第二子图像输入第二分类器。
第二分类器能够从多个第一子图像和多个第二子图像中选取第一目标子图像,从而增加第一目标子图像的数量,有利于提高对第三分类器的训练效果。
在其中的一个实施例中,至少将多个第二子图像输入第二分类器中,获得多个目标子图像包括:
步骤402、至少将多个第二子图像输入第二分类器,分别获得多个第二子图像的分类类型;
步骤403、根据多个第二子图像在目标训练图像中的位置和分类类型,确定第一目标子图像。
第一目标子图像是根据第二子图像的位置和分类类型进行确定的,即第一目标子图像为分类类型为含有预设特征的分类类型,且在目标训练图像中位置为满足预设规则的位置时的第二子图像。需要说明的是,当输入第二分类器的方格中还包括第一子图像时,则还包括从多个第一子图像中提取出一个或多个第一目标子图像。
在其中的一个实施例中,根据多个第二子图像在目标训练图像中的位置和分类类型,确定第一目标子图像,包括:
步骤421、根据多个第二子图像的分类类型,选取多个目标类别子图像;
步骤422、根据多个目标类别子图像在目标训练图像中的位置,确定多个目标类别子图像的中心位置和分布半径;
步骤423、根据中心位置和分布半径,确定多个目标类别子图像在目标训练图像中的分布区域;
步骤424、当初始分布区域内的目标类别子图像与多个第二子图像的数量占比小于预设数量占比时,减小分布半径,直至分布区域内的目标类别子图像与多个第二子图像的数量占比大于或等于预设数量占比时,获得目标分布区域;
步骤425、获取目标分布区域覆盖的目标类别子图像,得到多个第一目标子图像。
步骤421中,第二分类器能够确定第二子图像的分类类型,通过第二子图像的分类类型确定目标类别子图像。
步骤422中,目标图像中的细胞通常具有集群的特征,并根据按照预设的中心位置获取方法和分布半径获取方法,确定多个目标类别子图像的中心位置和分布半径。
在其中的一个实施例中,预设特征在图像具有集群的特征。例如,具有预设特征的马铃薯(发芽的马铃薯)集中于粮仓图像的一个区域或多个区域。又如,具有预设特征细胞(癌细胞)基本都集中于细胞切片图像的一个区域或多个区域。如图3所示,预设细胞802相对于非预设细胞801(不含预设特征的细胞)集中分布于虚线圈803中。基于此,通过获取预设细胞802集群区域的位置确定第一目标子图像。具体地,在至少对每个第二子图像进行分类后,并选出目标类别子图像;根据多个目标类别子图像在目标训练图像中的一个集中区域或多个集中区域,对应确定多个目标类别子图像的多个中心位置和多个分布半径。
在其中的一个实施例中,根据多个目标类别子图像在目标训练图像中的位置,确定多个目标类别子图像的中心位置和分布半径,包括步骤431至步骤433。
步骤431、根据多个目标类别子图像在目标训练图像中的位置,确定确定多个目标类别子图像的中心位置。
步骤432、计算最远目标类别子图像与中心位置之间的距离,获得分布半径,其中,最远目标类别子图像为与中心位置连通且距离最远的目标类别子图像。
步骤433、根据中心位置和分布半径,确定多个目标类别子图像在目标训练图像中的分布区域。
可以理解的是,目标图像中同一类细胞的集群区域呈圆形,基于此,分布区域预设为圆形分布区域。在分布区域中,圆心即为中心位置,半径为分布半径。可选地,分布区域所覆盖的子图像为完全被分布区域所覆盖的子图像,不包括部分被分布区域所覆盖的子图像。
其中,初始的分布半径为中心位置与最远目标类别子图像之间的距离。最远目标类别子图像为与中心位置连通且距离最远的目标类别子图像。可以理解的是,最远目标类别子图像与中心位置具有连通路径,在连通路径均由目标类别子图像首尾连接(两两相邻)而成,其中,连通路径的一端为中心位置,连通路径的另一端为最远目标类别子图像。如4图所示,具有黑圆点的方格为目标类别子图像,不具有黑点的方格为其他类别的非目标类别子图像,可见,与中心位置804和最远目标类别子图像805是连通的,且中心位置804和最远目标类别子图像805之间的距离最大。
在其中的一个实施例中,中心位置的获取方法包括:获取多个目标类别子图像的特征向量,根据各个多个目标类别子图像的特征向量使用聚类方法(kmeans聚类方法)进行聚类,获得目标类别子图像的聚类中心,其中,聚类中心即为中心位置。其中,第二分类器对多个第二子图像进行分类过程中会产生多个第二子图像的特征向量,在进行聚类时则从第二分类器的特征层中获取相应的多个目标类别子图像的特征向量。
在其中的一个实施例中,采用kmeans聚类方法进行聚类的步骤包括:获取参数k值;从多个目标类别子图像的特征向量选取度量样例和样例,采用余弦相似度计算度量样例和样例的特征向量之间的特征向量距离;根据获得的特征向量距离进行聚类;根据聚类结果获取聚类中心。
在其中的一个实施例中,获取参数k值的过程包括:获取多个预设k值,分别对每个预设k值按照采用kmeans聚类方法对多个目标类别子图像的特征向量进行聚类,获得与每个k值对应的聚类结果;根据每个k值对应的聚类结果,获取对应的多个轮廓系数;将与最大的轮廓系数对应的预设k值作为参数k值。可选地,多个预设k值为4个,分别为2至5。
可以理解的是,聚类的目的是在多个目标类别子图像的特征向量里找到细微的区别进行kmeans聚类,所以聚类结果的聚类紧密较低。基于此,无需关注轮廓系数具体的值,轮廓系数用于获取参数k值,即将多个预设k值中使轮廓系数最大的预设k值为参数k值。
步骤424中,通过减小分布半径,使分布区域所覆盖的子图像中目标类别子图像占比提高。可以理解的是,由于目标类别子图像具有集群特征,因此离中心位置越近的区域子图像中目标类别子图像占比越高。基于此,当分布区域内的目标类别子图像与多个第二子图像的数量占比大于或等于预设数量占比时,获得目标分布区域。
在其中一个实施例中,预设数量占比的范围可以为95%至100%。例如,当预设数量占比为100%时,目标分布区域内的第二子图像全部为目标类别子图像。第一目标子图像即为目标分布区域覆盖的目标类别子图像。
在其中的一个实施例中,获取目标分布区域覆盖的目标类别子图像,得到多个第一目标子图像,包括:
步骤441、将被目标分布区域覆盖且位于目标分布区域预设边缘位置的目标类别子图像进行移除,将剩余的目标类别子图像作为第一目标子图像。
在研究过程中发现,目标分布区域预设边缘位置的目标类别子图像中预设特征不明显,在分类时容易导致错误分类。通过移除目标分布区域预设边缘位置的目标类别子图像,使第一目标子图像中的预设特征更加明显,有利于提高对第三分类器的训练效果。
步骤50、构建训练集,训练集包括多个第一目标子图像和多个第二目标子图像,其中,第二目标子图像为不含预设特征的子图像。
训练集中,第二目标子图像为不含预设特征的子图像。可选地,第二目标子图像为根据第三分割参数对不含预设特征的训练图像进行分割得到的多个方格,或者第二目标子图像为根据第一子图像或第二子图像中不含预设特征的子图像。第三分割参数可以与第一分割参数或第二分割参数的分割起始点参数相同或不同。
其中一个实施例中个,构建训练集的过程中,将多个第二子图像和正确分类的第一子图像作为训练集输入第二分类器中,对第二类分类器进行训练。再通过当前训练后的第二分类器选取正确分类的第二子图像,根据正确分类的第一子图像和正确分类的第二子图像构建训练集。
步骤60中,采用训练集对预设分类器进行训练,有利于预设分类器提取目标训练集中的有效特征,提高训练得到的第三分类器的训练效果。
步骤70中,目标图像为待分类的图像,采用第三分类器对目标图像进行分类,可以准确地获得分类结果。
可以理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本实施例目标图像处理方法中,将目标训练图像分割为多个第一子图像,并将多个第一子图像输入第一分类器中,获得目标训练图像的分类结果,当第一分类器的分类结果为错误分类时,改变分割起始点对目标训练图像再次进行分割得到第二子图像,再通过第二分类器从第二子图像中选取具有预设特征的第一目标子图像,并采用第一目标子图像对预设分类器进行训练,通过第二分类器从第二子图像中选取具有预设特征的第一目标子图像,有利于在训练时预设分类器从第一目标子图像提取有效特征信息,有利于提高第三分类器对目标图像的分类正确率。因此,本申请可以提高目标图像分类的正确率。
在一个区分两种癌细胞图像的应用场景中,提供的两种癌细胞切片,分别包含不同的癌症特征。同时,为了更好地区分两种癌细胞切片图像,引入正常细胞切片图像,进行三分类。
对癌细胞训练图像根据第一分割参数进行分割,得到第一子图像,采用第一子图像训练一个基础分类器,即第一分类器;采用训练后的第一分类器对这些第一子图像分类,根据多数投票的方法获取癌细胞训练图像的分类结果。如果第一分类器的对癌细胞训练图像的分类结果是正确的,那么这些第一子图像被默认为具有各自癌症特征的子图像,加入到训练集(该训练集为包含了两种癌症特征的训练集)中。但如果第一分类器的对癌细胞训练图像的分类结果是错误的,可能是因为分割方式的原因,导致预设特征未被有效地分割,因此需要将癌细胞训练图像采用新的分割方式(根据第二分割参数进行分割)进行分割。对癌细胞训练图像根据第二分割参数进行分割,得到第二子图像。将第二子图像和训练集组合一起形成新的训练集,并采用新的训练集训练第二分类器,并采用训练后第二分类器对错误分类的第一子图像和第二子图像进行分类,并把正确分类的第一子图像和第二子图像加入训练集,形成了完整的具有两种癌症特征的比较干净的训练集。此时,训练集包含正确分类的第一子图像和正确分类的第二子图像。
将正常细胞切片图像分割得到第三子图像,将第三子图像加入到包含正确分类的第一子图像和正确分类的第二子图像的训练集中。癌细胞图像对应有两种,再加上正常细胞切片图像,因此训练集包含两种癌症细胞的子图像和正常细胞的子图像,使训练集形成三个分类训练集。
图5为一个实施例的目标图像处理装置的结构框图。如图5所示,该目标图像处理装置,包括:
第一分割模块901,用于获取目标训练图像,并根据第一分割参数将目标训练图像分割为多个第一子图像,其中,目标训练图像为包含至少一种细胞的图像;
第一分类模块902,用于将多个第一子图像输入第一分类器中,获得目标训练图像的分类结果;
第二分割模块903,用于当分类结果为错误分类时,根据第二分割参数将第一训练图像分割为多个第二子图像,其中,第一分割参数与第二分割参数的分割起点不同;
第二分类模块904,用于至少将多个第二子图像输入第二分类器中,获得多个第一目标子图像,其中,第一目标子图像为含有预设特征的子图像;
构建模块905,用于构建训练集,训练集包括多个第一目标子图像和多个第二目标子图像,其中,第二目标子图像为不含预设特征的子图像;
训练模块906,用于采用训练集对预设分类器进行训练,得到第三分类器;
第三分类模块907,用于获取目标图像,并采用第三分类器对目标图像进行分类,得到目标图像的分类结果。
本实施例目标图像处理装置中,将目标训练图像分割为多个第一子图像,并将多个第一子图像输入第一分类器中,获得目标训练图像的分类结果,当第一分类器的分类结果为错误分类时,通过改变分割起始点从而得到不同于第一子图像的第二子图像,再通过第二分类器从第二子图像中具有预设特征的第一目标子图像,并采用第一目标子图像对预设分类器进行训练,有利于在训练时预设分类器从第一目标子图像提取有效特征信息,从而提高第三分类器对目标图像的分类正确率和分类效率。
其中一个实施例中,所述至少将所述多个第二子图像输入第二分类器中,包括:
将所述多个第一子图像和所述多个第二子图像输入所述第二分类器。
其中一个实施例中,第二分类模块904还用于至少将所述多个第二子图像输入所述第二分类器,分别获得所述多个第二子图像的分类类型;根据所述多个第二子图像在所述目标训练图像中的位置和分类类型,确定第一目标子图像。
其中一个实施例中,第二分类模块904还用于根据所述多个第二子图像的分类类型,选取多个目标类别子图像;根据所述多个目标类别子图像在所述目标训练图像中的位置,确定所述多个目标类别子图像的中心位置和分布半径;根据所述中心位置和所述分布半径,确定所述多个目标类别子图像在所述目标训练图像中的分布区域;当所述初始分布区域内的目标类别子图像与所述多个第二子图像的数量占比小于预设数量占比时,减小所述分布半径,直至所述分布区域内的目标类别子图像与所述多个第二子图像的数量占比大于或等于所述预设数量占比时,获得目标分布区域;获取所述目标分布区域覆盖的目标类别子图像,得到所述多个第一目标子图像。
其中一个实施例中,第二分类模块904还用于根据所述多个目标类别子图像在所述目标训练图像中的位置,确定确定所述多个目标类别子图像的中心位置;计算最远目标类别子图像与所述中心位置之间的距离,获得分布半径,其中,所述最远目标类别子图像为与所述中心位置连通且距离最远的目标类别子图像。
其中一个实施例中,第二分类模块904还用于将被所述目标分布区域覆盖且位于所述目标分布区域预设边缘位置的目标类别子图像进行移除,将剩余的目标类别子图像作为所述第一目标子图像。
上述目标图像处理系统中各个模块的划分仅用于举例说明,在其他实施例中,可将目标图像处理系统按照需要划分为不同的模块,以完成上述目标图像处理系统的全部或部分功能。
关于目标图像处理系统的具体限定可以参见上文中对于目标图像处理方法的限定,在此不再赘述。上述目标图像处理系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本申请实施例中提供的目标图像处理系统中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在终端或服务器的存储器上。该计算机程序被处理器执行时,实现本申请实施例中所描述方法的步骤。
本申请实施例提供一种计算机可读的存储介质,其上存储有计算机程序,当计算机程序在计算机上执行时,使得计算机执行如上的目标图像处理方法。具体地,一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当计算机可执行指令被一个或多个处理器执行时,使得处理器执行目标图像处理方法的步骤。
如图1所示,本申请实施例提供一种电子设备,包括存储器以及处理器,处理器通过调用存储器中存储的计算机程序,用于执行如上的目标图像处理方法。电子设备可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal DigitalAssistant,PDA)、便捷式媒体播放器(Portable Media Player,PMP)、可穿戴设备、智能手环、计步器等移动终端,以及诸如数字TV、台式计算机等固定终端。
一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行目标图像处理方法。
本申请所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM),它用作外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种目标图像处理方法,其特征在于,包括:
获取目标训练图像,并根据第一分割参数将所述目标训练图像分割为多个第一子图像;
将所述多个第一子图像输入第一分类器中,获得所述目标训练图像的分类结果;
当所述分类结果为错误分类时,根据第二分割参数将所述第一训练图像分割为多个第二子图像,其中,所述第一分割参数与所述第二分割参数的分割起点不同;
构建训练集,所述训练集包括多个第一目标子图像和多个第二目标子图像,其中,所述第二目标子图像为不含所述预设特征的子图像;
采用所述训练集对预设分类器进行训练,得到第三分类器;
获取目标图像,并采用所述第三分类器对所述目标图像进行分类,得到所述目标图像的分类结果。
2.根据权利要求1所述的目标图像处理方法,其特征在于,所述至少将所述多个第二子图像输入第二分类器中,包括:
将所述多个第一子图像和所述多个第二子图像输入所述第二分类器。
3.根据权利要求1所述的目标图像处理方法,其特征在于,所述至少将所述多个第二子图像输入第二分类器中,获得第一目标子图像,包括:
至少将所述多个第二子图像输入所述第二分类器,分别获得所述多个第二子图像的分类类型;
根据所述多个第二子图像在所述目标训练图像中的位置和分类类型,确定第一目标子图像。
4.根据权利要求3所述的目标图像处理方法,其特征在于,所述根据所述多个第二子图像在所述目标训练图像中的位置和分类类型,确定多个第一目标子图像,包括:
根据所述多个第二子图像的分类类型,选取多个目标类别子图像;
根据所述多个目标类别子图像在所述目标训练图像中的位置,确定所述多个目标类别子图像的中心位置和分布半径;
根据所述中心位置和所述分布半径,确定所述多个目标类别子图像在所述目标训练图像中的分布区域;
当所述初始分布区域内的目标类别子图像与所述多个第二子图像的数量占比小于预设数量占比时,减小所述分布半径,直至所述分布区域内的目标类别子图像与所述多个第二子图像的数量占比大于或等于所述预设数量占比时,获得目标分布区域;
获取所述目标分布区域覆盖的目标类别子图像,得到所述多个第一目标子图像。
5.根据权利要求4所述的目标图像处理方法,其特征在于,所述根据所述多个目标类别子图像在所述目标训练图像中的位置,确定所述多个目标类别子图像的中心位置和分布半径,包括:
根据所述多个目标类别子图像在所述目标训练图像中的位置,确定确定所述多个目标类别子图像的中心位置;
计算最远目标类别子图像与所述中心位置之间的距离,获得分布半径,其中,所述最远目标类别子图像为与所述中心位置连通且距离最远的目标类别子图像。
6.根据权利要求4所述的目标图像处理方法,其特征在于,所述获取所述目标分布区域覆盖的目标类别子图像,得到所述多个第一目标子图像,包括:
将被所述目标分布区域覆盖且位于所述目标分布区域预设边缘位置的目标类别子图像进行移除,将剩余的目标类别子图像作为所述第一目标子图像。
7.根据权利要求4所述的目标图像处理方法,其特征在于,所述预设数量占比为95%~100%。
8.一种目标图像处理装置,其特征在于,包括:
第一分割模块,用于获取目标训练图像,并根据第一分割参数将所述目标训练图像分割为多个第一子图像;
第一分类模块,用于将所述多个第一子图像输入第一分类器中,获得所述目标训练图像的分类结果;
第二分割模块,用于当所述分类结果为错误分类时,根据第二分割参数将所述第一训练图像分割为多个第二子图像,其中,所述第一分割参数与所述第二分割参数的分割起点不同;
第二分类模块,用于至少将所述多个第二子图像输入第二分类器中,获得多个第一目标子图像,其中,所述第一目标子图像为含有预设特征的子图像;
构建模块,用于构建训练集,所述训练集包括多个第一目标子图像和多个第二目标子图像,其中,所述第二目标子图像为不含所述预设特征的子图像;
训练模块,用于采用所述训练集对预设分类器进行训练,得到第三分类器;
第三分类模块,用于获取目标图像,并采用所述第三分类器对所述目标图像进行分类,得到所述目标图像的分类结果。
9.一种计算机可读的存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上执行时,使得所述计算机执行如权利要求1至7任一项所述的目标图像处理方法。
10.一种电子设备,包括存储器以及处理器,其特征在于,所述处理器通过调用所述存储器中存储的计算机程序,用于执行如权利要求1至7中任一项所述的目标图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210022093.2A CN114419370A (zh) | 2022-01-10 | 2022-01-10 | 目标图像处理方法、装置、存储介质与电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210022093.2A CN114419370A (zh) | 2022-01-10 | 2022-01-10 | 目标图像处理方法、装置、存储介质与电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114419370A true CN114419370A (zh) | 2022-04-29 |
Family
ID=81272272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210022093.2A Pending CN114419370A (zh) | 2022-01-10 | 2022-01-10 | 目标图像处理方法、装置、存储介质与电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114419370A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116330516A (zh) * | 2023-05-29 | 2023-06-27 | 乳山市东方硅胶有限公司 | 一种硅胶颗粒生产设备颗粒大小控制系统 |
-
2022
- 2022-01-10 CN CN202210022093.2A patent/CN114419370A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116330516A (zh) * | 2023-05-29 | 2023-06-27 | 乳山市东方硅胶有限公司 | 一种硅胶颗粒生产设备颗粒大小控制系统 |
CN116330516B (zh) * | 2023-05-29 | 2023-08-29 | 乳山市东方硅胶有限公司 | 一种硅胶颗粒生产设备颗粒大小控制系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111241947B (zh) | 目标检测模型的训练方法、装置、存储介质和计算机设备 | |
CN110427970B (zh) | 图像分类方法、装置、计算机设备和存储介质 | |
KR20210110823A (ko) | 이미지 인식 방법, 인식 모델의 트레이닝 방법 및 관련 장치, 기기 | |
EP2528017B1 (en) | Image identification device, image identification method, image identification program, and recording medium | |
CN111738244A (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
CN110378313B (zh) | 细胞团识别方法、装置及电子设备 | |
CN111723815B (zh) | 模型训练方法、图像处理方法、装置、计算机系统和介质 | |
CN110889437B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN112132206A (zh) | 图像识别方法及相关模型的训练方法及相关装置、设备 | |
CN111340213B (zh) | 神经网络的训练方法、电子设备、存储介质 | |
CN115908363B (zh) | 肿瘤细胞统计方法、装置、设备和存储介质 | |
CN113780145A (zh) | 精子形态检测方法、装置、计算机设备和存储介质 | |
CN111192279B (zh) | 基于边缘检测的物体分割方法、电子终端及存储介质 | |
CN114419370A (zh) | 目标图像处理方法、装置、存储介质与电子设备 | |
CN109523015B (zh) | 一种神经网络中图像处理方法 | |
CN112241736A (zh) | 一种文本检测的方法及装置 | |
CN117765363A (zh) | 一种基于轻量型记忆库的图像异常检测方法及系统 | |
CN113392455A (zh) | 基于深度学习的户型图比例尺检测方法、装置及电子设备 | |
CN113012189A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN112037174A (zh) | 染色体异常检测方法、装置、设备及计算机可读存储介质 | |
CN112560856A (zh) | 车牌检测识别方法、装置、设备及存储介质 | |
CN112487941B (zh) | 染色体簇与染色体实例的识别方法、系统和存储介质 | |
CN111783869B (zh) | 训练数据筛选方法、装置、电子设备及存储介质 | |
CN114511862A (zh) | 表格识别方法、装置及电子设备 | |
CN108475339B (zh) | 用于对图像中的对象分类的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |