CN113240042B - 图像分类预处理、图像分类方法、装置、设备及存储介质 - Google Patents
图像分类预处理、图像分类方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN113240042B CN113240042B CN202110609434.1A CN202110609434A CN113240042B CN 113240042 B CN113240042 B CN 113240042B CN 202110609434 A CN202110609434 A CN 202110609434A CN 113240042 B CN113240042 B CN 113240042B
- Authority
- CN
- China
- Prior art keywords
- image
- resolution
- step length
- conversion
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像分类预处理、图像分类方法、装置、设备及存储介质,该图像分类预处理方法通过根据目标图像分辨率、预设图像采样次数以及初始图像分辨率确定浮点变换步长;通过预设整数模拟方法对浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长;根据向上整数变换步长及浮点变换步长确定第一步长损失权重;同时根据向下整数变换步长以及浮点变换步长确定第二步长损失权重;根据浮点变换步长、向上整数变换步长、向下整数变换步长、第一步长损失权重以及第二步长损失权重,将初始图像自初始图像分辨率调整至目标图像分辨率得到待分类图像。本发明在进行图像预处理时保证了图像的特征完整性,提高了图像分类的准确性。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像分类预处理、图像分类方法、装置、设备及存储介质。
背景技术
随着科学技术的发展,计算机视觉技术是用机器来理解和分析图像的技术,并且计算机视觉技术应用在图像分类等领域中,取代了采用人工进行图像分类的方式,提高了图像分类的效率。
在对图像进行分类时,可能存在一部分仅包含不容易分别的细微特征的图像,现有技术中,计算机视觉技术在进行图像分类处理时,需要对图像进行缩放、旋转、裁剪等图像预处理,通过上述图像预处理方法对图像进行处理之后,可能会将不同图像之间的细微特征消除,使得计算机视觉技术无法识别出不同图像之间的区别,从而可能会将两个不同类型的图像归为同类图像,进而导致图像分类的准确率较低。
发明内容
本发明实施例提供一种图像分类预处理、图像分类方法、装置、设备及存储介质,以解决图像分类的准确率较低的问题。
一种图像分类预处理方法,包括:
接收图像分类预处理指令;所述图像分类预处理指令中包括目标图像分辨率、预设图像采样次数以及具有初始图像分辨率的初始图像;
根据所述目标图像分辨率、预设图像采样次数以及所述初始图像分辨率,确定浮点变换步长;
通过预设整数模拟方法对所述浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长;
根据所述向上整数变换步长以及所述浮点变换步长确定第一步长损失权重;同时根据所述向下整数变换步长以及所述浮点变换步长确定第二步长损失权重;
根据所述浮点变换步长、向上整数变换步长、向下整数变换步长、第一步长损失权重以及第二步长损失权重,将所述初始图像自所述初始图像分辨率调整至所述目标图像分辨率,得到待分类图像。
一种图像分类方法,包括:
接收图像分类指令;所述图像分类指令中包括指定图像分辨率,图像处理次数以及具有预设图像分辨率的待处理图像;
将所述指定图像分辨率记录为目标图像分辨率,将图像处理次数记录为预设图像采样次数,将待处理图像记录为初始图像,将预设图像分辨率记录为预设图像采样次数,通过上述图像分类预处理方法确定与所述待处理图像对应的待分类图像;
将所述待分类图像输入至预设图像分类模型中,得到图像分类结果。
一种图像分类预处理装置,包括:
预处理指令接收模块,用于接收图像分类预处理指令;所述图像分类预处理指令中包括目标图像分辨率、预设图像采样次数以及具有初始图像分辨率的初始图像;
浮点变换步长确定模块,用于根据所述目标图像分辨率、预设图像采样次数以及所述初始图像分辨率,确定浮点变换步长;
步长取整模块,用于通过预设整数模拟方法对所述浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长;
步长损失权重确定模块,用于根据所述向上整数变换步长以及所述浮点变换步长确定第一步长损失权重;同时根据所述向下整数变换步长以及所述浮点变换步长确定第二步长损失权重;
分辨率调整模块,用于根据所述浮点变换步长、向上整数变换步长、向下整数变换步长、第一步长损失权重以及第二步长损失权重,将所述初始图像自所述初始图像分辨率调整至所述目标图像分辨率,得到待分类图像。
一种图像分类装置,包括:
图像分类指令接收模块,用于接收图像分类指令;所述图像分类指令中包括指定图像分辨率,图像处理次数以及具有预设图像分辨率的待处理图像;
图像预处理模块,用于将所述指定图像分辨率记录为目标图像分辨率,将图像处理次数记录为预设图像采样次数,将待处理图像记录为初始图像,将预设图像分辨率记录为预设图像采样次数,通过上述图像分类预处理方法确定与所述待处理图像对应的待分类图像;
图像分类模块,用于将所述待分类图像输入至预设图像分类模型中,得到图像分类结果。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述图像分类预处理方法,或者所述处理器执行所述计算机程序时实现上述图像分类方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述图像分类预处理方法,或所述计算机程序被处理器执行时实现上述图像分类方法。
上述图像分类预处理、图像分类方法、装置、设备及存储介质,该图像分类预处理方法通过对浮点变换步长进行取整处理,并且通过第一步长损失权重以及第二步长损失权重对前述取整处理进行损失补偿,使得对初始图像进行预处理时,可以不修改初始图像的像素信息,也即初始图像中的所有特征均不会在预处理过程中被消除,进而保证了初始图像的特征完整性,提高了对完成预处理的待分类图像进行图像分类时的准确率。
该图像分类方法通过借助上述图像分类预处理方法生成待分类图像,在通过预设图像分类模型进行图像分类时,可以识别到待分类图像中的细微特征,进而可以识别出两个不同,但仅存在细微特征差别的图像之间的区别点,提高了图像分类的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中图像分类预处理方法或者图像分类方法的一应用环境示意图;
图2是本发明一实施例中图像分类预处理方法的一流程图;
图3是本发明一实施例中图像分类预处理方法中步骤S50的一流程图;
图4是本发明一实施例中图像分类方法的一流程图;
图5是本发明一实施例中图像分类预处理装置的一原理框图;
图6是本发明一实施例中图像分类预处理装置中分辨率调整模块50的一原理框图;
图7是本发明一实施例中图像分类装置的一原理框图;
图8是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的图像分类预处理方法,该图像分类预处理方法可应用如图1所示的应用环境中。具体地,该图像分类预处理方法应用在图像分类预处理系统中,该图像分类预处理系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决图像分类的准确率较低的问题。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种图像分类预处理方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S10:接收图像分类预处理指令;所述图像分类预处理指令中包括目标图像分辨率、预设图像采样次数以及具有初始图像分辨率的初始图像;
可以理解地,图像分类预处理指令可以由用户通过如移动终端,电脑等设备发送的,也可以在用户输入目标图像分辨率、预设图像采样次数以及具有初始图像分辨率的初始图像之后自动生成的。其中,目标图像分辨率是指用户或者图像分类模型指定需要将各种不同分辨率的图像转换成相同分辨率图像的目标值;预设图像采样次数是指图像分类预处理过程中需要对初始图像进行尺度转换的次数(例如缩放次数);初始图像可以为不同应用场景下的图像,示例性地,初始图像可以为证件照、病理照等,初始图像分辨率即为初始图像的图像分辨率。示例性地,假设一应用场景下,需要将300*300的证件照通过五次尺度转换后,转换成4*4的证件照时,其中,300*300即为初始图像分辨率,预设图像采样次数即为五次,目标图像分辨率为4*4。
S20:根据所述目标图像分辨率、预设图像采样次数以及所述初始图像分辨率,确定浮点变换步长;
可以理解地,浮点变换步长指的是每经过一次尺度变换,目标图像分辨率需要缩小的比例,示例性地,假设浮点变换步长为2.37,初始图像分辨率为300*300,则经过一次尺度变换之后,初始图像分辨率变换为126.58*126.58。
具体地,在接收到图像分类预处理指令之后,根据所述目标图像分辨率以及所述初始图像分辨率,确定分辨率比值;根据所述分辨率比值以及所述预设图像采样次数,确定所述浮点变换步长。
进一步地,可以根据下述表达式确定浮点变换步长:
其中,a为浮点变换步长;N为初始图像分辨率;m为目标图像分辨率;t为预设图像采样次数。
S30:通过预设整数模拟方法对所述浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长;
可以理解地,在根据所述目标图像分辨率、预设图像采样次数以及所述初始图像分辨率,确定浮点变换步长之后,由于在对初始图像进行缩放时,一些模型框架(例如机器学习框架中的torch框架,神经网络框架等)是不支持浮点变换步长,仅支持整数变换步长,因此需要通过预设整数模拟方法对浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长之后,即可对初始图像进行缩放。
在一具体实施例中,步骤S30中,包括:
通过所述向上取整方法对所述浮点变换步长进行向上取整处理,得到所述向上整数变换步长;可以理解地,向上取整处理也即针对于浮点整数步长,不考虑其小数位置上的数字,仅对整数部分加一处理的方法。
通过所述向下取整方法对所述浮点变换步长进行向下取整处理,得到所述向下整数变换步长。可以理解地,向上取整处理也即针对于浮点整数步长,不考虑其小数位置上的数字,仅对整数部分减一处理的方法。
具体地,在根据所述目标图像分辨率、预设图像采样次数以及所述初始图像分辨率,确定浮点变换步长之后,通过所述向上取整方法对所述浮点变换步长进行向上取整处理,得到所述向上整数变换步长;通过所述向下取整方法对所述浮点变换步长进行向下取整处理,得到所述向下整数变换步长。示例性地,假设浮点变换步长为2.37,则对该浮点变换步长进行向上取整处理之后,得到的向上整数变换步长即为3,对该浮点变换步长进行向下取整处理之后,得到的向下整数变换步长即为2。
S40:根据所述向上整数变换步长以及所述浮点变换步长确定第一步长损失权重;同时根据所述向下整数变换步长以及所述浮点变换步长确定第二步长损失权重;
具体地,在通过预设整数模拟方法对所述浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长之后,将所述向上整数变换步长与所述浮点变换步长之间的差值确定为所述第一步长损失权重;将所述浮点变换步长与所述向下整数变换步长之间的差值确定为所述第二步长损失权重。示例性地,假设浮点变换步长为2.37,经过步骤S30得到的向上整数变换步长为3,得到的向下整数变换步长为2,则对应的第一步长损失权重为0.63(即3-2.37),第二步长损失权重为0.37(即为2.37-2)。
S50:根据所述浮点变换步长、向上整数变换步长、向下整数变换步长、第一步长损失权重以及第二步长损失权重,将所述初始图像自所述初始图像分辨率调整至所述目标图像分辨率,得到待分类图像。可以理解地,待分类图像即为通过步骤S20至S50的图像分类预处理之后等待进行图像分类的图像,也即得到待分类图像之后即表征初始图像的图像分类预处理已完成。
在一具体实施方式中,如图3所示,步骤S50中,包括:
S501:根据所述向上整数变换步长对所述初始图像进行图像变换得到第一向上特征图,并根据所述向下整数变换步长对所述初始图像进行图像变换得到第一向下特征图之后,将图像变换次数累加一;
可以理解地,本实施例中提出的图像变换为图像缩放、图像放大等均可以作为图像变换方法。得到第一向上特征图以及第一向下特征图之后记录为一次图像变换次数。
具体地,在根据所述向上整数变换步长以及所述浮点变换步长确定第一步长损失权重;同时根据所述向下整数变换步长以及所述浮点变换步长确定第二步长损失权重之后,根据向上整数变换步长对初始图像进行图像变换得到第一向上特征图,也即根据向上整数变换步长对初始图像的初始图像分辨率进行图像变换之后,第一向上特征图的图像分辨率可以根据初始图像分辨率与向上整数变换步长进行确定,示例性地,假设初始图像分辨率为300*300,目标图像分辨率为4*4,向上整数变换步长为3时,则此次的图像变换即为对初始图像进行缩放,进而第一向上特征图的图像分辨率即为100*100(300/3)。
进一步地,在根据所述向上整数变换步长以及所述浮点变换步长确定第一步长损失权重;同时根据所述向下整数变换步长以及所述浮点变换步长确定第二步长损失权重之后,根据向下整数变换步长对所述初始图像进行图像变换得到第一向下特征图,该第一向下特征图的图像分辨率可以根据初始图像分辨率与向下整数变换步长进行确定,示例性地,假设初始图像分辨率为300*300,目标图像分辨率为4*4,向上整数变换步长为2时,则此次的图像变换即为对初始图像进行缩放,进而第一向上特征图的图像分辨率即为150*150(300/2),并在得到第一向上特征图以及第一向下特征图之后,将图像变换次数累加一。
S502:根据所述第一步长损失权重、所述第二步长损失权重、第一向上特征图以及第一向下特征图进行特征图加权融合,得到具有第一变换分辨率的第一转换图像;所述第一变换分辨率根据所述初始图像分辨率以及所述浮点变换步长确定;
具体地,在根据所述向上整数变换步长对所述初始图像进行图像变换得到第一向上特征图,并根据所述向下整数变换步长对所述初始图像进行图像变换得到第一向下特征图之后,将图像变换次数累加一之后,将第一向上特征图的图像分辨率转换至第一变换分辨率,进而得到第一向上变换特征图;同时将第一向下特征图的图像分辨率转换至第一变换分辨率,进而得到第一向下变换特征图;根据第一向上变换特征图以及第二步长损失权重确定第一向上权重特征图,根据第一向下变换特征图以及第一步长损失权重确定第一向下权重特征图,进而对第一向上权重特征图以及第一向下权重特征图进行特征图加权融合,即可得到具有第一变换分辨率的第一转换图像。
其中,第一变换分辨率可以根据初始图像分辨率以及浮点变换步长确定;示例性地,假设初始图像分辨率为300*300,浮点变换步长为2.37,目标图像分辨率为4*4,则对应的第一变换分辨率即为初始图像分辨率与浮点变换步长之商,也即第一变换分辨率为126.58(300/2.37),如此既可以通过对浮点变换步长进行取整之后,使得一些模型框架(例如机器学习框架中的torch框架,神经网络框架等)可以对整数变换步长进行计算,并且通过第一步长损失权重以及第二步长损失权重,将第一向上特征图以及第一向下特征图的图像分辨率还原至第一变换分辨率(也即当模型框架可以对浮点变换步长进行计算时得到的分辨率),提高了图像分类预处理的便捷性,同时也可以保留初始图像原有所有特征不被破坏,为后续图像分类提供了准确的待分类图像。
S503:确定所述图像变换次数与所述预设图像采样次数是否相等;
S504:在所述图像变换次数与所述预设图像采样次数相等时,将所述第一变换分辨率记录为所述目标图像分辨率,将所述第一转换图像记录为所述待分类图像。
具体地,在根据所述第一步长损失权重、所述第二步长损失权重、第一向上特征图以及第一向下特征图进行特征图加权融合,得到具有第一变换分辨率的第一转换图像之后,确定图像变换次数与预设图像采样次数是否相等,在图像变换次数等于预设图像采样次数时,表征当前图像预处理已完成,进而直接将第一变换分辨率记录为目标图像分辨率(在进行步骤S501至步骤S502之后,若第一变换分辨率等于目标图像分辨率也可以判定图像变换次数等于预设图像采样次数),并将第一转换图像记录为待分类图像。
在一实施例中,步骤S503之后,也即所述确定所述图像变换次数与所述预设图像采样次数是否相等之后,还包括:
在所述图像变换次数与所述预设图像采样次数不相等时,根据所述向上整数变换步长对所述第一转换图像进行图像变换得到第二向上特征图,并根据所述向下整数变换步长对所述第一转换图像进行图像变换得到第二向下特征图之后,将所述图像变换次数累加一;
可以理解地,在确定所述图像变换次数与所述预设图像采样次数是否相等之后,若图像变换次数与预设图像采样次数不相等,表征此时图像预处理还没有结束,且由于初始图像已经转换成为第一转换图像,因此需要对第一转换图像继续进行图像变换,以使得图像分辨率可以达到目标图像分辨率,进而根据所述向上整数变换步长对所述第一转换图像进行图像变换得到第二向上特征图,并根据所述向下整数变换步长对所述第一转换图像进行图像变换得到第二向下特征图之后,将所述图像变换次数累加一。
根据所述第一步长损失权重、所述第二步长损失权重、第二向上特征图以及第二向下特征图进行特征图加权融合,得到具有第二变换分辨率的第二转换图像;所述第二变换分辨率根据所述第一变换分辨率以及所述浮点变换步长确定;
具体地,在根据所述向上整数变换步长对所述第一转换图像进行图像变换得到第二向上特征图,并根据所述向下整数变换步长对所述第一转换图像进行图像变换得到第二向下特征图之后,将第二向上特征图的图像分辨率转换至第二变换分辨率,进而得到第二向上变换特征图;同时将第二向下特征图的图像分辨率转换至第二变换分辨率,进而得到第二向下变换特征图;根据第二向上变换特征图以及第二步长损失权重确定第二向上权重特征图,根据第二向下变换特征图以及第一步长损失权重确定第二向下权重特征图,进而对第二向上权重特征图以及第二向下权重特征图进行特征图加权融合,即可得到具有第二变换分辨率的第二转换图像。
确定所述图像变换次数与所述预设图像采样次数是否相等;
在所述图像变换次数与所述预设图像采样次数相等时,将所述第二变换分辨率记录为所述目标图像分辨率,将所述第二转换图像记录为所述待分类图像。
具体地,在根据所述第一步长损失权重、所述第二步长损失权重、第二向上特征图以及第二向下特征图进行特征图加权融合,得到具有第二变换分辨率的第二转换图像之后,确定图像变换次数与预设图像采样次数是否相等,在图像变换次数与预设图像采样次数相等时,表征当前图像预处理已完成,进而直接将第二变换分辨率记录为目标图像分辨率,将第二转换图像记录为待分类图像。
进一步地,若图像变换次数与预设图像采样次数不相等,则执行上述步骤后会得到第三变换分辨率的第三转换图像,甚至后续还会继续得到第四变换分辨率的第四转换图像,直至图像变换次数与预设图像采样次数相等时结束,具体地方法参照上述说明,在此不再赘述。
在本实施例中,通过对浮点变换步长进行取整处理,并且通过第一步长损失权重以及第二步长损失权重对前述取整处理进行损失补偿,使得对初始图像进行预处理时,可以不修改初始图像的像素信息,也即初始图像中的所有特征均不会在预处理过程中被消除,进而保证了初始图像的特征完整性,提高了对完成预处理的待分类图像进行图像分类时的准确率。
在一实施例中,如图4所示,提供一种图像分类方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S60:接收图像分类指令;所述图像分类指令中包括指定图像分辨率,图像处理次数以及具有预设图像分辨率的待处理图像;
可以理解地,指定图像分辨率是指用户或者预设图像分类模型指定需要将各种不同分辨率的图像转换成相同分辨率图像的目标值。图像处理次数是指图像分类预处理过程中需要对待处理图像进行尺度转换的次数。待处理图像可以为不同应用场景下的图像,示例性地,初始图像可以为证件照、病理照等,预设图像分辨率即为待处理图像的图像分辨率。
S70:将所述指定图像分辨率记录为目标图像分辨率,将图像处理次数记录为预设图像采样次数,将待处理图像记录为初始图像,将预设图像分辨率记录为预设图像采样次数,通过上述图像分类预处理方法确定与所述待处理图像对应的待分类图像;
具体地,在接收图像分类指令之后,将所述指定图像分辨率记录为目标图像分辨率,将图像处理次数记录为预设图像采样次数,将待处理图像记录为初始图像,将预设图像分辨率记录为预设图像采样次数,通过上述图像分类预处理方法确定与待处理图像对应的待分类图像。
S80:将所述待分类图像输入至预设图像分类模型中,得到图像分类结果。
具体地,在将所述指定图像分辨率记录为目标图像分辨率,将图像处理次数记录为预设图像采样次数,将待处理图像记录为初始图像,将预设图像分辨率记录为预设图像采样次数,通过上述图像分类预处理方法确定与所述待处理图像对应的待分类图像,此时待分类图像的图像分辨转换成了指定图像分辨率,进而可以将待分类图像输入至预设图像分类模型中,预设图像分类模型即可对待分类图像进行图像分类,得到图像分类结果。其中,预设图像分类模型可以为基于VGG(Visual Geometry Group Network,视觉几何组网络)网络构建的分类模型,也可以为基于ResNets(Residual Network,残差网络)网络构建的分类模型,如此在通过预设图像分类模型进行图像分类时,可以识别到待分类图像中的细微特征,进而可以识别出两个不同,但仅存在细微特征差别的图像之间的区别点,提高了图像分类的准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种图像分类预处理装置,该图像分类预处理装置与上述实施例中图像分类预处理方法一一对应。如图5所示,该图像分类预处理装置包括预处理指令接收模块10、浮点变换步长确定模块20、步长取整模块30、步长损失权重确定模块40和分辨率调整模块50。各功能模块详细说明如下:
预处理指令接收模块10,用于接收图像分类预处理指令;所述图像分类预处理指令中包括目标图像分辨率、预设图像采样次数以及具有初始图像分辨率的初始图像;
浮点变换步长确定模块20,用于根据所述目标图像分辨率、预设图像采样次数以及所述初始图像分辨率,确定浮点变换步长;
步长取整模块30,用于通过预设整数模拟方法对所述浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长;
步长损失权重确定模块40,用于根据所述向上整数变换步长以及所述浮点变换步长确定第一步长损失权重;同时根据所述向下整数变换步长以及所述浮点变换步长确定第二步长损失权重;
分辨率调整模块50,用于根据所述浮点变换步长、向上整数变换步长、向下整数变换步长、第一步长损失权重以及第二步长损失权重,将所述初始图像自所述初始图像分辨率调整至所述目标图像分辨率,得到待分类图像。
优选地,浮点变换步长确定模块20包括:
分辨率比值确定单元,用于根据所述目标图像分辨率以及所述初始图像分辨率,确定分辨率比值;
浮点变换步长确定单元,用于根据所述分辨率比值以及所述预设图像采样次数,确定所述浮点变换步长。
优选地,步长取整模块30包括:
向上确证处理单元,用于通过所述向上取整方法对所述浮点变换步长进行向上取整处理,得到所述向上整数变换步长;
向下确证处理单元,用于通过所述向下取整方法对所述浮点变换步长进行向下取整处理,得到所述向下整数变换步长。
优选地,步长损失权重确定模块40包括:
第一步长损失权重确定单元,用于将所述向上整数变换步长与所述浮点变换步长之间的差值确定为所述第一步长损失权重;
第二步长损失权重确定单元,用于将所述浮点变换步长与所述向下整数变换步长之间的差值确定为所述第二步长损失权重。
优选地,如图6所示,分辨率调整模块50包括:
第一图像缩放单元501,用于根据所述向上整数变换步长对所述初始图像进行图像变换得到第一向上特征图,并根据所述向下整数变换步长对所述初始图像进行图像变换得到第一向下特征图之后,将图像变换次数累加一;
第一特征图融合单元502,用于根据所述第一步长损失权重、所述第二步长损失权重、第一向上特征图以及第一向下特征图进行特征图加权融合,得到具有第一变换分辨率的第一转换图像;所述第一变换分辨率根据所述初始图像分辨率以及所述浮点变换步长确定;
第一缩放次数比较单元503,用于确定所述图像变换次数与所述预设图像采样次数是否相等;
第一待分类图像确定单元504,用于在所述图像变换次数与所述预设图像采样次数相等时,将所述第一变换分辨率记录为所述目标图像分辨率,将所述第一转换图像记录为所述待分类图像。
优选地,分辨率调整模块50还包括:
第二图像缩放单元,用于在所述图像变换次数与所述预设图像采样次数不相等时,根据所述向上整数变换步长对所述第一转换图像进行图像变换得到第二向上特征图,并根据所述向下整数变换步长对所述第一转换图像进行图像变换得到第二向下特征图之后,将所述图像变换次数累加一;
第二特征图融合单元,用于根据所述第一步长损失权重、所述第二步长损失权重、第二向上特征图以及第二向下特征图进行特征图加权融合,得到具有第二变换分辨率的第二转换图像;所述第二变换分辨率根据所述第一变换分辨率以及所述浮点变换步长确定;
第二缩放次数比较单元,用于确定所述图像变换次数与所述预设图像采样次数是否相等;
第一待分类图像确定单元,用于在所述图像变换次数与所述预设图像采样次数相等时,将所述第二变换分辨率记录为所述目标图像分辨率,将所述第二转换图像记录为所述待分类图像。
关于图像分类预处理装置的具体限定可以参见上文中对于图像分类预处理方法的限定,在此不再赘述。上述图像分类预处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一实施例中,提供一种图像分类装置,该图像分类装置与上述实施例中图像分类方法一一对应。如图7所示,该图像分类预处理装置包括图像分类指令接收模块60、图像预处理模块70和图像分类模块80。各功能模块详细说明如下:
图像分类指令接收模块60,用于接收图像分类指令;所述图像分类指令中包括指定图像分辨率,图像处理次数以及具有预设图像分辨率的待处理图像;
图像预处理模块70,用于将所述指定图像分辨率记录为目标图像分辨率,将图像处理次数记录为预设图像采样次数,将待处理图像记录为初始图像,将预设图像分辨率记录为预设图像采样次数,通过上述图像分类预处理方法确定与所述待处理图像对应的待分类图像;
图像分类模块80,用于将所述待分类图像输入至预设图像分类模型中,得到图像分类结果。
关于图像分类装置的具体限定可以参见上文中对于图像分类方法的限定,在此不再赘述。上述图像分类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,也可以是终端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机程序和数据库。该内存储器为可读存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例中图像分类预处理方法,或者图像分类方法所使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像分类预处理方法,或者该计算机程序被处理器执行时以实现一种图像分类方法。本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中的图像分类预处理方法,或者处理器执行计算机程序时实现上述实施例中的图像分类方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中的图像分类预处理方法,或者计算机程序被处理器执行时实现上述实施例中的图像分类方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中或者易失性计算机可读取存储介质,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (9)
1.一种图像分类预处理方法,其特征在于,包括:
接收图像分类预处理指令;所述图像分类预处理指令中包括目标图像分辨率、预设图像采样次数以及具有初始图像分辨率的初始图像;
根据所述目标图像分辨率、预设图像采样次数以及所述初始图像分辨率,确定浮点变换步长;
通过预设整数模拟方法对所述浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长;
根据所述向上整数变换步长以及所述浮点变换步长确定第一步长损失权重;同时根据所述向下整数变换步长以及所述浮点变换步长确定第二步长损失权重;
根据所述浮点变换步长、向上整数变换步长、向下整数变换步长、第一步长损失权重以及第二步长损失权重,将所述初始图像自所述初始图像分辨率调整至所述目标图像分辨率,得到待分类图像;
所述根据所述浮点变换步长、向上整数变换步长、向下整数变换步长、第一步长损失权重以及第二步长损失权重,将所述初始图像自所述初始图像分辨率调整至所述目标图像分辨率,得到待分类图像,包括:
根据所述向上整数变换步长对所述初始图像进行图像变换得到第一向上特征图,并根据所述向下整数变换步长对所述初始图像进行图像变换得到第一向下特征图之后,将图像变换次数累加一;
根据所述第一步长损失权重、所述第二步长损失权重、第一向上特征图以及第一向下特征图进行特征图加权融合,得到具有第一变换分辨率的第一转换图像;所述第一变换分辨率根据所述初始图像分辨率以及所述浮点变换步长确定;
确定所述图像变换次数与所述预设图像采样次数是否相等;
在所述图像变换次数与所述预设图像采样次数相等时,将所述第一变换分辨率记录为所述目标图像分辨率,将所述第一转换图像记录为所述待分类图像。
2.如权利要求1所述的图像分类预处理方法,其特征在于,所述根据所述目标图像分辨率、预设图像采样次数以及所述初始图像分辨率,确定浮点变换步长,包括:
根据所述目标图像分辨率以及所述初始图像分辨率,确定分辨率比值;
根据所述分辨率比值以及所述预设图像采样次数,确定所述浮点变换步长。
3.如权利要求1所述的图像分类预处理方法,其特征在于,所述预设整数模拟方法包括向上取整方法以及向下取整方法;所述通过预设整数模拟方法对所述浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长,包括:
通过所述向上取整方法对所述浮点变换步长进行向上取整处理,得到所述向上整数变换步长;
通过所述向下取整方法对所述浮点变换步长进行向下取整处理,得到所述向下整数变换步长。
4.如权利要求1所述的图像分类预处理方法,其特征在于,所述确定所述图像缩放次数与所述预设图像采样次数是否相等之后,还包括:
在所述图像变换次数与所述预设图像采样次数不相等时,根据所述向上整数变换步长对所述第一转换图像进行图像变换得到第二向上特征图,并根据所述向下整数变换步长对所述第一转换图像进行图像变换得到第二向下特征图之后,将所述图像变换次数累加一;
根据所述第一步长损失权重、所述第二步长损失权重、第二向上特征图以及第二向下特征图进行特征图加权融合,得到具有第二变换分辨率的第二转换图像;所述第二变换分辨率根据所述第一变换分辨率以及所述浮点变换步长确定;
确定所述图像变换次数与所述预设图像采样次数是否相等;
在所述图像变换次数与所述预设图像采样次数相等时,将所述第二变换分辨率记录为所述目标图像分辨率,将所述第二转换图像记录为所述待分类图像。
5.一种图像分类方法,其特征在于,包括:
接收图像分类指令;所述图像分类指令中包括指定图像分辨率,图像处理次数以及具有预设图像分辨率的待处理图像;
将所述指定图像分辨率记录为目标图像分辨率,将图像处理次数记录为预设图像采样次数,将待处理图像记录为初始图像,将预设图像分辨率记录为预设图像采样次数,通过如权利要求1至4任一项所述图像分类预处理方法确定与所述待处理图像对应的待分类图像;
将所述待分类图像输入至预设图像分类模型中,得到图像分类结果。
6.一种图像分类预处理装置,其特征在于,包括:
预处理指令接收模块,用于接收图像分类预处理指令;所述图像分类预处理指令中包括目标图像分辨率、预设图像采样次数以及具有初始图像分辨率的初始图像;
浮点变换步长确定模块,用于根据所述目标图像分辨率、预设图像采样次数以及所述初始图像分辨率,确定浮点变换步长;
步长取整模块,用于通过预设整数模拟方法对所述浮点变换步长进行取整处理,得到向上整数变换步长以及向下整数变换步长;
步长损失权重确定模块,用于根据所述向上整数变换步长以及所述浮点变换步长确定第一步长损失权重;同时根据所述向下整数变换步长以及所述浮点变换步长确定第二步长损失权重;
分辨率调整模块,用于根据所述浮点变换步长、向上整数变换步长、向下整数变换步长、第一步长损失权重以及第二步长损失权重,将所述初始图像自所述初始图像分辨率调整至所述目标图像分辨率,得到待分类图像;
分辨率调整模块包括:
第一图像缩放单元,用于根据所述向上整数变换步长对所述初始图像进行图像变换得到第一向上特征图,并根据所述向下整数变换步长对所述初始图像进行图像变换得到第一向下特征图之后,将图像变换次数累加一;
第一特征图融合单元,用于根据所述第一步长损失权重、所述第二步长损失权重、第一向上特征图以及第一向下特征图进行特征图加权融合,得到具有第一变换分辨率的第一转换图像;所述第一变换分辨率根据所述初始图像分辨率以及所述浮点变换步长确定;
第一缩放次数比较单元,用于确定所述图像变换次数与所述预设图像采样次数是否相等;
第一待分类图像确定单元,用于在所述图像变换次数与所述预设图像采样次数相等时,将所述第一变换分辨率记录为所述目标图像分辨率,将所述第一转换图像记录为所述待分类图像。
7.一种图像分类装置,其特征在于,包括:
图像分类指令接收模块,用于接收图像分类指令;所述图像分类指令中包括指定图像分辨率,图像处理次数以及具有预设图像分辨率的待处理图像;
图像预处理模块,用于将所述指定图像分辨率记录为目标图像分辨率,将图像处理次数记录为预设图像采样次数,将待处理图像记录为初始图像,将预设图像分辨率记录为预设图像采样次数,通过如权利要求1至4任一项所述图像分类预处理方法确定与所述待处理图像对应的待分类图像;
图像分类模块,用于将所述待分类图像输入至预设图像分类模型中,得到图像分类结果。
8.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述图像分类预处理方法,或者所述处理器执行所述计算机程序时实现如权利要求5所述图像分类方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述图像分类预处理方法,或所述计算机程序被处理器执行时实现如权利要求5所述图像分类方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110609434.1A CN113240042B (zh) | 2021-06-01 | 2021-06-01 | 图像分类预处理、图像分类方法、装置、设备及存储介质 |
PCT/CN2022/072287 WO2022252640A1 (zh) | 2021-06-01 | 2022-01-17 | 图像分类预处理、图像分类方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110609434.1A CN113240042B (zh) | 2021-06-01 | 2021-06-01 | 图像分类预处理、图像分类方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113240042A CN113240042A (zh) | 2021-08-10 |
CN113240042B true CN113240042B (zh) | 2023-08-29 |
Family
ID=77136274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110609434.1A Active CN113240042B (zh) | 2021-06-01 | 2021-06-01 | 图像分类预处理、图像分类方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113240042B (zh) |
WO (1) | WO2022252640A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113240042B (zh) * | 2021-06-01 | 2023-08-29 | 平安科技(深圳)有限公司 | 图像分类预处理、图像分类方法、装置、设备及存储介质 |
CN113470030B (zh) * | 2021-09-03 | 2021-11-23 | 北京字节跳动网络技术有限公司 | 组织腔清洁度的确定方法、装置、可读介质和电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298413A (zh) * | 2019-07-08 | 2019-10-01 | 北京字节跳动网络技术有限公司 | 图像特征提取方法、装置、存储介质及电子设备 |
CN112614143A (zh) * | 2020-12-30 | 2021-04-06 | 深圳市联影高端医疗装备创新研究院 | 一种图像分割方法、装置、电子设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3865165B2 (ja) * | 1996-10-30 | 2007-01-10 | 株式会社沖データ | 画像データの拡大/縮小方法 |
US10373050B2 (en) * | 2015-05-08 | 2019-08-06 | Qualcomm Incorporated | Fixed point neural network based on floating point neural network quantization |
CN111402139B (zh) * | 2020-03-25 | 2023-12-05 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备和计算机可读存储介质 |
CN113240042B (zh) * | 2021-06-01 | 2023-08-29 | 平安科技(深圳)有限公司 | 图像分类预处理、图像分类方法、装置、设备及存储介质 |
CN113361471A (zh) * | 2021-06-30 | 2021-09-07 | 平安普惠企业管理有限公司 | 图像数据处理方法、装置、计算机设备及存储介质 |
-
2021
- 2021-06-01 CN CN202110609434.1A patent/CN113240042B/zh active Active
-
2022
- 2022-01-17 WO PCT/CN2022/072287 patent/WO2022252640A1/zh unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110298413A (zh) * | 2019-07-08 | 2019-10-01 | 北京字节跳动网络技术有限公司 | 图像特征提取方法、装置、存储介质及电子设备 |
CN112614143A (zh) * | 2020-12-30 | 2021-04-06 | 深圳市联影高端医疗装备创新研究院 | 一种图像分割方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113240042A (zh) | 2021-08-10 |
WO2022252640A1 (zh) | 2022-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108154526B (zh) | 突发模式图像的图像对准 | |
WO2019201035A1 (zh) | 对图像中的对象节点的识别方法、装置、终端及计算机可读存储介质 | |
US11830170B2 (en) | Systems and methods for image data processing to correct document deformations using machine learning system | |
CN113240042B (zh) | 图像分类预处理、图像分类方法、装置、设备及存储介质 | |
CN109886077B (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
RU2651144C2 (ru) | Ввод данных с изображений документов с фиксированной структурой | |
JP7000627B2 (ja) | 標的細胞標識方法、装置、記憶媒体及び端末デバイス | |
CN112200722A (zh) | 图像超分辨重构模型的生成方法、重构方法及电子设备 | |
CN113807353B (zh) | 图像转换模型训练方法、装置、设备及存储介质 | |
JP6731529B1 (ja) | 単一画素攻撃サンプルの生成方法、装置、設備及び記憶媒体 | |
CN107886082B (zh) | 图像中数学公式检测方法、装置、计算机设备及存储介质 | |
CN110517186B (zh) | 消除发票印章的方法、装置、存储介质和计算机设备 | |
EP4044074A1 (en) | System, method, and program for predicting information | |
WO2020155485A1 (zh) | 图片差异性判断方法、装置、计算机设备和存储介质 | |
CN113505848A (zh) | 模型训练方法和装置 | |
CN116843901A (zh) | 医学图像分割模型训练方法和医学图像分割方法 | |
US10475187B2 (en) | Apparatus and method for dividing image into regions | |
CN112287947A (zh) | 一种区域建议框检测方法、终端及存储介质 | |
CN110827301A (zh) | 用于处理图像的方法和装置 | |
US20230343137A1 (en) | Method and apparatus for detecting key point of image, computer device and storage medium | |
CN116311120A (zh) | 视频标注模型训练方法、视频标注方法、装置以及设备 | |
CN115908116A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN112487943B (zh) | 关键帧去重的方法、装置和电子设备 | |
CN113361471A (zh) | 图像数据处理方法、装置、计算机设备及存储介质 | |
KR20170002710A (ko) | 스마트폰을 기반으로 하는 현장용 그래프 수치 분석 어플리케이션 및 그를 이용한 수치 분석방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40052925 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |