CN114693920A - 图像处理方法及装置、电子设备、计算机可读介质 - Google Patents
图像处理方法及装置、电子设备、计算机可读介质 Download PDFInfo
- Publication number
- CN114693920A CN114693920A CN202210336296.9A CN202210336296A CN114693920A CN 114693920 A CN114693920 A CN 114693920A CN 202210336296 A CN202210336296 A CN 202210336296A CN 114693920 A CN114693920 A CN 114693920A
- Authority
- CN
- China
- Prior art keywords
- image
- processed
- image processing
- processing
- target object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及图像处理技术领域,具体涉及一种图像处理方法及装置、电子设备、计算机可读介质,该方法包括:将待处理图像输入图像处理模型,图像处理模型识别待处理图像中含有的对象;基于对象确定目标对象,根据目标对象在待处理图像中的占比确定待处理图像的处理策略;若处理策略为第一处理策略,则对待处理图像进行分类,将分类信息作为图像处理结果;若处理策略为第二处理策略,则对待处理图像进行分类,并检测对象在待处理图像中的位置,将分类信息以及位置信息作为图像处理结果。本申请实施例有助于在提高图像的处理效率的同时提升图像处理的识别准确度。
Description
技术领域
本申请涉及图像处理技术领域,具体涉及一种图像处理方法、图像处理装置、电子设备以及计算机可读介质。
背景技术
近年来,在大数据环境的背景下,数据的安全、合法以及合规性越来越受到重视,对网络数据进行快速准确的数据审核是维持健康网络环境的关键手段。
相关技术中,针对互联网中的图像数据,通常采用图像分类或者采用目标检测进行图像数据审核,采用图像分类的优势在于推理速度快,针对海量的待处理图像数据,能够快速的给出审核结果,但对于目标对象在整体待处理图像中的占比较小的情况下,采用图像分类的方式无法实现准确分类,且在处理过程中容易引入干扰信息进一步影响图像处理结果;采用目标检测的优势在于能够准确识别出目标对象的在待处理图像中的位置,特别是目标图像在待处理图像中的占比比较小的情况,但采用目标检测的方式耗时长,对于海量的待审核图像数据来说,效率无法满足。
发明内容
为解决上述技术问题,本申请的实施例提供了一种图像处理方法、图像处理装置、电子设备以及计算机可读介质。
根据本申请实施例的一个方面,提供了一种图像处理方法,该方法包括:将待处理图像输入图像处理模型,所述图像处理模型识别所述待处理图像中含有的对象;基于所述对象确定目标对象,根据所述目标对象在所述待处理图像中的占比确定所述待处理图像的处理策略;若处理策略为第一处理策略,则对所述待处理图像进行分类,将分类信息作为图像处理结果;若处理策略为第二处理策略,则对所述待处理图像进行分类,并检测所述对象在所述待处理图像中的位置,将分类信息以及位置信息作为图像处理结果。
根据本申请实施例的一个方面,提供了一种图像处理装置,该装置包括:识别模块,配置为将待处理图像输入图像处理模型,所述图像处理模型识别所述待处理图像中含有的对象;确定模块,配置为基于所述对象确定目标对象,根据所述目标对象在所述待处理图像中的占比确定所述待处理图像的处理策略;第一处理模块,配置为若处理策略为第一处理策略,则对所述待处理图像进行分类,将分类信息作为图像处理结果;第二处理模块,配置为若处理策略为第二处理策略,则对所述待处理图像进行分类,并检测所述目标对象在所述待处理图像中的位置,将分类信息以及位置信息作为图像处理结果。
根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如前所述的图像处理方法。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行如上所述的图像处理方法。
在本申请的实施例所提供的技术方案中,首先将待处理图像输入到图像处理模型中,图像处理模型对待处理图像中得图像内容进行识别,得到待处理图像中含有的对象,基于所述对象确定目标对象,并根据目标对象在待处理图像中的占比确定待处理图像的处理策略,若确定采用第一处理策略,即对象进行分类,得到分类信息;若确定采用第二处理策略,则对待处理图像进行分类和位置检测,得到分类信息和位置信息。本申请实施例根据目标对象在待处理图像中的占比选择对待处理图像的处理策略,采用不同处理策略对含有不同目标对象的待处理图像进行处理,在提高图像的处理效率的同时提升了图像处理的识别准确度,整体达到了处理效率与准确度的平衡;此外,在图像处理模型中,由于第二策略的识别精度优于第一策略的识别精度,在追求识别准确度的情况下,图像处理模型在确定处理策略时会倾向于选择第二处理策略,因此,本申请实施例在计算期望值数据与已标注图像的图像处理结果之间的损失值时,引入了计算量来防止图像处理模型偏向于第二处理策略,能够使第一处理策略也能够得到充分的利用,达到既保证识别的准确度又能保证识别的效率的目的。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本申请的一示例性实施例示出的图像处理系统框架示意图;
图2是本申请的一示例性实施例示出的图像处理方法的流程图;
图3是图2所示实施例中的步骤S220在一示例性实施例中的流程图;
图4是图2所示实施例中的步骤S220在另一示例性实施例中的流程图;
图5是本申请的一示例性实施例示出的图像处理模型的训练流程图;
图6是图5所示实施例中的步骤S530在一示例性实施例中的流程图;
图7是图6所示实施例中的步骤S630在一示例性实施例中的流程图;
图8是本申请的另一示例性实施例示出的图像处理方法的流程图;
图9是本申请的一示例性实施例示出的图像处理装置的框图;
图10是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请实施例提供的方案涉及的方案包括图像处理技术。可以理解的是,图像识别是图像处理技术领域中广泛使用的技术,在数据传输、数据安全、场景识别等领域中得以广泛应用,例如互联网的图像审核。相关技术中,通常单一采用图像分类或者单一采用目标检测进行图像数据审核,其中,对于一些对象占据整体图像比例较小的待处理图像,单一采用图像分类的方法进行处理无法保证分类的准确度,且在图像分类的过程中,待处理图像的尺寸是保持不变的,极有可能引入干扰信息从而进一步降低图像处理结果的准确性;单一采用目标检测的方法对待处理图像进行处理的耗时比较长,无法保证处理效率。因此,相关技术无法实现准确而快速的图像处理。
为了处理效率与准确度的平衡,本申请提出一种图像处理系统,该图像处理系统包括终端和服务端,其中:
服务端将待处理图像输入图像处理模型,通过图像处理模型识别待处理图像中含有的对象;
基于对象确定目标对象,根据目标对象在待处理图像中的占比确定待处理图像的处理策略;
若处理策略为第一处理策略,则对待处理图像进行分类,将分类信息作为图像处理结果;
若处理策略为第二处理策略,则对待处理图像进行分类,并检测目标对象在待处理图像中的位置,将分类信息以及位置信息作为图像处理结果。
也即,终端和服务端进行交互;具体地,服务端通过图像处理模型对待处理图像中的内容进行识别,得到待处理图像中含有的对象,并根据对象在待处理图像中的占比选择对应的处理策略,通过相应的处理策略对待处理图像进行处理,得到图像处理结果。
图1是本申请的一示例性实施例示出的图像处理系统框架示意图,如图1所示,从图1所示的图像处理系统框架中可以看出,其中:服务端101具有逻辑计算,服务端101预测目标对象在待处理图像中的占比,从而根据目标对象在待处理图像中的占比确定待处理图像的处理策略,若处理策略为第一处理策略,则对待处理图像进行分类的相关计算,并将计算得到的待处理图像中含有的对象的分类信息作为图像处理结果;若处理策略为第二处理策略,则先对待处理图像中含有的对象进行分类的相关计算,再对对象在待处理图像中的位置进行计算,并将计算得到的对象的分类信息和位置信息作为图像处理结果。
在本申请的一个实施例中,服务端101是服务器,例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器,在此也不进行限制。服务端101可以通过3G(第三代的移动信息技术)、4G(第四代的移动信息技术)、5G(第五代的移动信息技术)等无线网络与终端102进行通信,本处也不对此进行限制。
在本申请的一个实施例中,终端102可以是智能手机、平板电脑、PC(PersonalComputer,个人计算机)或者其它任意能够运行客户端的电子设备,本处不进行限制。
基于图1的应用场景,在采用了本申请实施例的技术方案之后,服务端101通过图像处理模型识别待处理图像中含有的对象,基于对象确定目标对象,并根据目标对象在待处理图像中的占比确定待处理图像的处理策略,若处理策略为第一处理策略,则对待处理图像进行分类,并将分类信息作为图像处理结果;若处理策略为第二处理策略,则先对待处理图像进行分类和位置检测,并将分类信息和位置信息作为图像处理结果,在提高图像的处理效率的同时提升了图像处理的识别准确度,整体达到了效率与准确度的平衡。
以下对本申请实施例的技术方案的各种实现细节进行详细阐述:
图2是本申请的一示例性实施例示出的一种图像处理方法的流程图。如图2所示,该方法可以由图1所示图像处理系统框架中的服务端101执行。应理解的是,该方法也可以适用于其它的示例性实施环境,并由其它实施环境中的设备具体执行,本实施例不对该方法所适用的实施环境进行限制。
如图2所示,图像处理方法至少包括步骤S210至步骤S240,详细介绍如下:
步骤S210,将待处理图像输入图像处理模型,图像处理模型识别待处理图像中含有的对象。
在本申请实施例中,待处理图像的图像内容可以是任意一种能够通过机器学习识别的场景,例如可以是吸烟场景、纹身场景、竖中指场景以及其他任意一种需要识别的场景。
本申请实施例中,待处理图像中含有的对象可以是一个或多个,本实施例不对此进行限制。
本申请实施例中的图像处理模型为基于机器学习建立的模型。
步骤S220,基于对象确定目标对象,根据目标对象在待处理图像中的占比确定待处理图像的处理策略。
在本申请的一个实施例中,当对象的数量为一个时,步骤S220中基于对象确定目标对象,根据目标对象在待处理图像中的占比确定待处理图像的处理策略的过程,可以包括以下步骤,详细介绍如下:
将待处理图像中仅有的一个对象作为目标对象,并预测目标对象在待处理图像中的占比;
若目标对象在待处理图像中的占比大于预设的占比阈值,则确定处理策略为第一处理策略;
若目标对象在待处理图像中的占比小于预设的面积占比阈值,则确定处理策略为第二处理策略。
示例性的,本申请实施例中的第一处理策略可以是对待处理图像进行分类,得到待处理图像的分类信息。
示例性的,本申请实施例中的第二处理策略可以是先对待处理图像进行分类,得到待处理图像的分类信息,再对目标对象在待处理图像中的位置信息进行检测,得到目标对象在待处理图像中的坐标信息。
举例说明,对待处理图像中的图像内容进行识别,得到待处理图像中含有一个对象,将该对象作为目标对象,预设占比阈值为1/2,在此基础上,若计算得到目标对象在待处理图像中的占比大于1/2,例如为3/4,则采用第一处理策略对目标对象进行处理;若计算得到目标对象在待处理图像中的占比小于1/2,例如为1/4,则采用第二处理策略对目标对象进行处理。
在本申请的一个实施例中,请参阅图3,当对象的数量为多个时,步骤S220中基于对象确定目标对象的过程,可以包括步骤S310至步骤S330,详细介绍如下:
步骤S310,计算各个对象在待处理图像中的占比。
步骤S320,若存在任意一个对象在待处理图像中的占比大于预设的占比阈值,则将占比最大的对象作为目标对象。
举例说明,图像处理模型识别出待处理图像中含有的对象包括对象A和对象B,分别计算对象A和对象B在待处理图像中的占比,其中,对象A在待处理图像中的占比大于预设占比阈值,对象B在待处理图像中的面积占比小于预设占比阈值。在此基础上,从对象A和对象B这两个对象中选择占比最大的对象作为目标对象,即选择占比大于预设占比阈值的对象A作为目标对象。
示例性的,若图像处理模型识别待处理图像中包括多个占比大于预设占比阈值的对象,则将占比最大的对象作为目标对象。
步骤S330,若所有对象在待处理图像中的占比均小于预设的占比阈值,则将所有对象均作为目标对象。
举例说明,图像处理模型识别出待处理图像中含有的对象包括对象B和对象C,分别计算对象B和对象C在待处理图像中的占比,其中,对象B在待处理图像中的面积占比小于预设占比阈值,对象C在待处理图像中的面积占比小于预设占比阈值,在此基础上,将对象B和对象C都作为目标对象。
在本申请实施例中,请参阅图4,步骤S310中根据目标对象在待处理图像中的占比确定待处理图像的处理策略的过程,可以包括步骤S410至步骤S420,详细介绍如下:
步骤S410,若目标对象在待处理图像中的占比大于预设的占比阈值,则确定处理策略为第一处理策略。
步骤S420,若所有目标对象在待处理图像中的占比均小于预设的占比阈值,则确定处理策略为第二处理策略。
步骤S230,若处理策略为第一处理策略,则对待处理图像进行分类,将分类信息作为图像处理结果。
可以理解的是,在本申请实施例中,第一处理策略的处理方式包括对待处理图像进行分类,但不局限于此。
示例性的,第一处理策略的处理方式为对待处理图像进行场景分类,在确定出目标对象后,通过第一处理策略对待处理图像中的待处理图像进行场景分类,确定出待处理图像的场景信息。
步骤S240,若处理策略为第二处理策略,则对待处理图像进行分类,并检测目标对象在待处理图像中的位置,将分类信息以及位置信息作为图像处理结果。
可以理解的是,在本申请实施例中,第二处理策略的处理方式包括对待处理图像进行分类以及对待处理图像中的目标对象进行位置检测,但不局限于此。
示例性的,第二处理策略的处理方式为先对待处理图像进行场景分类,再对待处理图像中的目标对象进行位置检测,在确定出目标对象后,首先通过第二处理策略对待处理图像进行场景分类,得到待处理图像中的场景信息,再检测目标对象在待处理图像中的位置,得到目标对象在待处理图像中的位置信息。
举例说明,若图像处理模型识别出待处理图像中含有一个对象,则将该对象作为目标对象,预设占比阈值设置为1/2,在此基础上,若计算得到目标对象在待处理图像中的占比大于1/2,例如为3/4,则采用第一处理策略对目标对象进行处理,即对待处理图像进行分类,得到待处理图像的分类信息;若计算得到目标对象在待处理图像中的占比小于1/2,例如为1/4,则采用第二处理策略对目标对象进行处理,即对待处理图像进行分类,得到待处理图像的分类信息,再对目标对象在待处理图像中的位置坐标进行检测,得到目标对象在待处理图像中的位置信息。
由上可知,本申请实施例首先将待处理图像输入图像处理模型,通过图像处理模型识别待处理图像中含有的对象,基于对象中确定出目标对象,根据目标对象在待处理图像中的占比确定待处理图像的处理策略,若目标对象大于预设占比阈值,则采用第一处理策略,即对待处理图像进行分类,得到待处理图像的分类信息;若目标对象的占比小于预设占比阈值的对象,则采用第二处理策略,即对待处理图像进行分类和位置检测,得到待处理图像的分类信息以及目标对象在待处理图像中的位置信息。本申请实施例根据目标对象在待处理图像中的占比选择对待处理图像的处理策略,针对占比小于预设占比阈值的小目标对象,除了确定出待处理图像的分类信息,还要检测出目标对象在待处理图像中的位置信息,在提高图像的处理效率的同时提升了图像处理的识别准确度,使得整体达到了处理效率与准确度的平衡。
在本申请的一个实施例中,在将待处理图像输入图像处理模型之前,本方法还包括图像处理模型的训练过程。
图5是本申请的一示例性实施例示出的图像处理模型的训练流程图,如图5所示,该方法可以由图1所示图像处理系统框架中的服务端101执行。应理解的是,该方法也可以适用于其它的示例性实施环境,并由其它实施环境中的设备具体执行,本实施例不对该方法所适用的实施环境进行限制。
请参照图5,图像处理模型的训练过程至少包括步骤S510至步骤S530,详细介绍如下:
步骤S510,获取已标注图像作为训练样本;其中,训练样本包括期望值数据。
应当理解的是,已标注图像包括第一组图像和第二组图像,第一组图像中含有的目标对象满足第一处理策略的要求,对第一组图像采用第一处理策略进行处理;第一组图像中含有的目标对象满足第二处理策略的要求,对第二组图像中采用第二处理策略进行处理。
步骤S520,将已标注图像输入至图像处理模型,获得已标注图像的图像处理结果。
本申请实施例中,已标注图像的图像处理结果包括将第一组图像输入图像处理模型得到的第一图像处理结果和将第二组图像输入图像处理模型得到的第二图像处理结果。
应当理解的是,第一组图像输入图像处理模型后是采用第一处理策略进行处理的,即对第一组图像进行分类,得到第一组图像的分类信息,因此,将第一组图像输入图像处理模型得到的第一图像处理结果包括第一组图像的分类信息;第二组图像输入图像处理模型后是采用第二处理策略进行处理的,即对第二组图像中含有的对象进行分类和位置检测,得到第二组图像的分类信息和目标对象在对应图像中的位置信息,因此,将第二组图像输入图像处理模型得到的第二图像处理结果包括第二组图像的分类信息以及目标对象在对应图像中的位置信息。
步骤S530,通过期望值数据与已标注图像的图像处理结果之间的损失值,调整图像处理模型的参数,以得到训练好的图像处理模型。
在本申请的一个实施例中,期望值数据包括第一期望值数据和第二期望值数据,第一期望值数据是第一组图像的期望值数据,第二期望值数据是第二组图像的期望值数据,请参阅图6,步骤S530中通过期望值数据与已标注图像的图像处理结果之间的损失值,调整图像处理模型的参数的过程,可以包括步骤S610至步骤S640,详细介绍如下:
步骤S610,根据第一期望值数据与第一图像处理结果确定第一损失分量。
在本申请的一个实施例中,第一期望值数据中包括分类期望值,得到第一图像处理结果后,计算第一图像处理结果中的分类信息和第一期望值数据中的分类期望值之间的损失作为第一损失分量。
步骤S620,根据第二期望值数据与第二图像处理结果确定第二损失分量。
在本申请的一个实施例中,第二期望值数据中包括分类期望值和位置期望值,根据第二期望值数据与第二图像处理结果确定第二损失分量,可以采用以下方式:
根据第二图像处理结果中的分类信息和第二期望值数据中的分类期望值计算类别损失;
根据第二图像处理结果中目标对象的位置信息和第二期望值数据中的位置期望值计算坐标损失;
将类别损失和坐标损失之和作为第二损失分量。
示例性的,第二损失分量的计算表达式如下:
Ldet=(Ldcls+Lcoor)
其中,Ldet为第二损失分量,Ldcls为类别损失,Lcoor为坐标损失。
步骤S630,根据第一损失分量和第二损失分量计算损失值。
在本申请的一个实施例中,请参阅图7,步骤S630中根据第一损失分量和第二损失分量计算损失值的过程,可以包括步骤S710至步骤S730,详细介绍如下:
步骤S710,根据第一损失分量和第一计算量确定第一计算值。
步骤S720,根据第二损失分量和第二计算量确定第二计算值。
应当理解的是,第一计算量和第二计算量为防偏量,在图像处理模型中,由于第二策略的识别精度优于第一策略的识别精度,在追求识别准确度的情况下,图像处理模型在确定处理策略时会倾向于选择第二处理策略,所以,为了能够使第一处理策略也能够得到充分的利用,达到既保证识别的准确度又能保证识别的效率的目的,在损失值的计算中加入第一计算量和第二计算量来防止图像处理模型偏向于第二处理策略,能够使第一处理策略也能够得到充分的利用,达到既保证识别的准确度又能保证识别的效率的目的。
步骤S730,根据第一计算值、第二计算值、第一计算值的第一权重参数和第二计算值的第二权重参数进行加权求和计算,得到损失值。
示例性的,期望值数据与已标注图像的图像处理结果之间的损失值的计算表达式如下:
Ltotal=λ·(Lccls+η·Fcls)+(1-λ)·(Ldet+η·Fdet)
其中,Ltotal为期望值数据与已标注图像的图像处理结果之间的损失值,λ为第一计算值的第一权重参数,Lccls为第一损失分量,η为超参数,Fcls为第一计算量,(Lccls+η·Fcls)为第一计算值,1-λ为第二计算值的第二权重参数,Ldet为第二损失分量,Fdet为第二计算量,(Ldet+η·Fdet)为第二计算值。
步骤S640,根据损失值调整图像处理模型的参数,得到训练好的图像处理模型。
由上可知,在本申请实施例中,首先通过已标注图像对图像处理模型中的参数进行深度训练,根据期望值数据和已标注图像的图像处理结果之间的损失值确定图像处理模型是否训练完成,直至得到训练好的图像处理模型。采用训练好的图像处理模型对待处理图像进行自动识别和处理,输出目标对象的分类信息和/或位置信息,能够很大程度上节省图像处理时间,提升图像处理效率。且图像处理模型随着处理数据的累加,图像处理模型的参数也越来越精确,在提升处理效率的同时能够保证图像处理的准确度。
请参照图8,在上述实施例的基础上,图像处理模型中至少包括两个不同的深度神经网络,其中一个深度神经网络用于实现上述实施例中的第一处理策略,另一个深度神经网络用于实现上述实施例中的第二处理策略。
示例性的,图像处理模型中包括两个不同的深度神经网络,一个为分类模型,用于对待处理图像进行分类,确定待处理图像中含有的对象的分类信息;一个为检测模型,用于对待处理图像进行分类和位置检测,得到待处理图像的分类信息以及目标对象在待处理图像中的位置信息。
图9是本申请的一示例性实施例示出的图像处理装置的框图。该装置可以应用于图1所示的实施环境,并具体配置在服务端101中。该装置也可以适用于其它的示例性实施环境,并具体配置在其它设备中,本实施例不对该装置所适用的实施环境进行限制。
如图9所示,该示例性的图像处理装置包括:
识别模块910,配置为将待处理图像输入图像处理模型,图像处理模型识别待处理图像中含有的对象;
确定模块920,配置为基于对象确定目标对象,根据目标对象在待处理图像中的占比确定待处理图像的处理策略;
第一处理模块930,配置为若处理策略为第一处理策略,则对待处理图像进行分类,将分类信息作为图像处理结果;
第二处理模块940,配置为若处理策略为第二处理策略,则对待处理图像进行分类,并检测对象在待处理图像中的位置,将分类信息以及位置信息作为图像处理结果。
在本申请的一个实施例中,确定模块920还包括:
第一目标对象确定子模块,配置为当对象的数量为一个时,将对象作为目标对象;
第一处理策略确定子模块,配置为若目标对象在待处理图像中的占比大于预设的占比阈值,则确定处理策略为第一处理策略;若目标对象在待处理图像中的占比小于预设的面积占比阈值,则确定处理策略为第二处理策略。
在本申请的一个实施例中,确定模块920还包括:
第二目标对象确定子模块,配置为当对象的数量为多个时,从多个对象中确定目标对象。
在本申请的一个实施例中,第二目标对象确定子模块还包括:
计算单元,配置为计算各个对象在待处理图像中的占比。
第二目标对象确定单元,配置为若存在任意一个对象在待处理图像中的占比大于预设的占比阈值,则将占比最大的对象作为目标对象;若所有对象在待处理图像中的占比均小于预设的占比阈值,则将所有对象均作为目标对象。
在本申请的一个实施例中,确定模块920还包括:
第二处理策略确定子模块,配置为若目标对象在待处理图像中的占比大于预设的占比阈值,则确定处理策略为第一处理策略;若所有目标对象在待处理图像中的占比均小于预设的占比阈值,则确定处理策略为第二处理策略。
在本申请的一个实施例中,确定模块920还包括:
模型训练子模块,配置为获取已标注图像作为训练样本;其中,训练样本包括期望值数据;将已标注图像输入至图像处理模型,获得已标注图像的图像处理结果;通过期望值数据与已标注图像的图像处理结果之间的损失值,调整图像处理模型的参数,以得到训练好的图像处理模型。
在本申请的一个实施例中,模型训练子模块还包括:
第一损失确定单元,配置为根据第一期望值数据与第一图像处理结果确定第一损失分量;
第二损失确定单元,配置为根据第二期望值数据与第二图像处理结果确定第二损失分量;
损失值计算单元,配置为根据第一损失分量和第二损失分量计算损失值;
参数调整子单元,配置为根据损失值调整图像处理模型的参数。
在本申请的一个实施例中,损失值计算单元还包括:
第一计算子单元,配置为根据第一损失分量和第一计算量确定第一计算值;
第二计算子单元,配置为根据第二损失分量和第二计算量确定第二计算值;
损失值计算子单元,配置为根据第一计算值、第二计算值、第一计算值的第一权重系数和第二计算值的第二权重系数进行加权求和计算,得到损失值。
需要说明的是,上述实施例所提供的图像处理装置与上述实施例所提供的图像处理方法属于同一构思,其中各个模块和单元执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。上述实施例所提供的图像处理装置在实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能,本处也不对此进行限制。
本申请的实施例还提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现上述各个实施例中提供的图像处理方法。
图10示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。需要说明的是,图10示出的电子设备的计算机系统1000仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图10所示,计算机系统1000包括中央处理单元(Central Processing Unit,CPU)1001,其可以根据存储在只读存储器(Read-Only Memory,ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(Random Access Memory,RAM)1003中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 1003中,还存储有系统操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(Input/Output,I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本申请的另一方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前所述的图像处理方法。该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中。
本申请的另一方面还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个实施例中提供的图像处理方法。
上述内容,仅为本申请的较佳示例性实施例,并非用于限制本申请的实施方案,本领域普通技术人员根据本申请的主要构思和精神,可以十分方便地进行相应的变通或修改,故本申请的保护范围应以权利要求书所要求的保护范围为准。
Claims (10)
1.一种图像处理方法,其特征在于,包括:
将待处理图像输入图像处理模型,所述图像处理模型识别所述待处理图像中含有的对象;
基于所述对象确定目标对象,根据所述目标对象在所述待处理图像中的占比确定所述待处理图像的处理策略;
若处理策略为第一处理策略,则对所述待处理图像进行分类,将分类信息作为图像处理结果;
若处理策略为第二处理策略,则对所述待处理图像进行分类,并检测所述目标对象在所述待处理图像中的位置,将分类信息以及位置信息作为图像处理结果。
2.根据权利要求1所述的方法,其特征在于,所述对象的数量为一个;所述基于所述对象确定目标对象,包括:
将所述对象作为目标对象;
所述根据所述目标对象在所述待处理图像中的占比确定所述待处理图像的处理策略,包括:
若所述目标对象在所述待处理图像中的占比大于预设的占比阈值,则确定所述处理策略为所述第一处理策略;
若所述目标对象在所述待处理图像中的占比小于预设的面积占比阈值,则确定所述处理策略为所述第二处理策略。
3.根据权利要求1所述的方法,其特征在于,所述对象的数量为多个;所述基于所述对象确定目标对象,包括:
计算各个对象在所述待处理图像中的占比;
若存在任意一个对象在所述待处理图像中的占比大于所述预设的占比阈值,则将占比最大的对象作为目标对象;
若所有对象在所述待处理图像中的占比均小于所述预设的占比阈值,则将所有对象均作为目标对象。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标对象在所述待处理图像中的占比确定所述待处理图像的处理策略,包括:
若所述目标对象在所述待处理图像中的占比大于所述预设的占比阈值,则确定所述处理策略为所述第一处理策略;
若所有目标对象在所述待处理图像中的占比均小于所述预设的占比阈值,则确定所述处理策略为所述第二处理策略。
5.根据权利要求1所述的方法,其特征在于,在所述将待处理图像输入图像处理模型之前,所述方法还包括:
获取已标注图像作为训练样本;其中,所述训练样本包括期望值数据;
将所述已标注图像输入至所述图像处理模型,获得所述已标注图像的图像处理结果;
通过所述期望值数据与所述已标注图像的图像处理结果之间的损失值,调整所述图像处理模型的参数,以得到训练好的图像处理模型。
6.根据权利要求5所述的方法,其特征在于,所述图像处理结果包括第一图像处理结果和第二图像处理结果,所述期望值数据包括第一期望值数据和第二期望值数据;所述通过所述期望值数据与所述已标注图像的图像处理结果之间的损失值,调整所述图像处理模型的参数,包括:
根据所述第一期望值数据与所述第一图像处理结果确定第一损失分量;
根据所述第二期望值数据与所述第二图像处理结果确定第二损失分量;
根据所述第一损失分量和所述第二损失分量计算损失值;
根据所述损失值调整所述图像处理模型的参数。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第一损失分量和所述第二损失分量计算损失值,包括:
根据所述第一损失分量和第一计算量确定第一计算值;
根据所述第二损失分量和第二计算量确定第二计算值;
根据所述第一计算值、所述第二计算值、所述第一计算值的第一权重系数和所述第二计算值的第二权重系数进行加权求和计算,得到所述损失值。
8.一种图像处理装置,其特征在于,所述装置包括:
识别模块,配置为将待处理图像输入图像处理模型,所述图像处理模型识别所述待处理图像中含有的对象;
确定模块,配置为基于所述对象确定目标对象,根据所述目标对象在所述待处理图像中的占比确定所述待处理图像的处理策略;
第一处理模块,配置为若处理策略为第一处理策略,则对所述待处理图像进行分类,将分类信息作为图像处理结果;
第二处理模块,配置为若处理策略为第二处理策略,则对所述待处理图像进行分类,并检测所述对象在所述待处理图像中的位置,将分类信息以及位置信息作为图像处理结果。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述电子设备实现如权利要求1至7中任一项所述的图像处理方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行权利要求1至7中任一项所述的图像处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210336296.9A CN114693920A (zh) | 2022-03-30 | 2022-03-30 | 图像处理方法及装置、电子设备、计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210336296.9A CN114693920A (zh) | 2022-03-30 | 2022-03-30 | 图像处理方法及装置、电子设备、计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114693920A true CN114693920A (zh) | 2022-07-01 |
Family
ID=82141909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210336296.9A Pending CN114693920A (zh) | 2022-03-30 | 2022-03-30 | 图像处理方法及装置、电子设备、计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114693920A (zh) |
-
2022
- 2022-03-30 CN CN202210336296.9A patent/CN114693920A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108229419B (zh) | 用于聚类图像的方法和装置 | |
CN108280477B (zh) | 用于聚类图像的方法和装置 | |
CN109033408B (zh) | 信息推送方法及装置、计算机可读存储介质、电子设备 | |
CN110929799B (zh) | 用于检测异常用户的方法、电子设备和计算机可读介质 | |
CN111275470B (zh) | 服务发起概率预测方法及其模型的训练方法和装置 | |
CN104809132A (zh) | 一种获取网络主体社交关系类型的方法及装置 | |
CN108428001B (zh) | 信用分值预测方法及装置 | |
CN110825969A (zh) | 数据处理方法、装置、终端和存储介质 | |
CN112241327A (zh) | 分享信息处理方法、装置、存储介质与电子设备 | |
CN110245684B (zh) | 数据处理方法、电子设备和介质 | |
CN112214770A (zh) | 恶意样本的识别方法、装置、计算设备以及介质 | |
CN116048944A (zh) | 用于大数据平台的负载趋势预测方法及系统 | |
CN114693920A (zh) | 图像处理方法及装置、电子设备、计算机可读介质 | |
CN115546554A (zh) | 敏感图像的识别方法、装置、设备和计算机可读存储介质 | |
CN112131468A (zh) | 推荐系统中的数据处理方法、装置 | |
CN115659167B (zh) | 多特征库合并方法及装置、设备、计算机可读存储介质 | |
CN110704679A (zh) | 视频分类方法、装置及电子设备 | |
CN116501993B (zh) | 房源数据推荐方法及装置 | |
CN116911304B (zh) | 一种文本推荐方法及装置 | |
CN114637868B (zh) | 一种应用于快消行业的产品数据处理方法及系统 | |
CN114860912B (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN117392731B (zh) | 表情识别模型的训练方法和装置 | |
CN115293266A (zh) | 信用评级方法、装置、电子设备以及计算机可读存储介质 | |
CN115841341A (zh) | 用户召回方法、装置、电子设备、存储介质及产品 | |
CN115049503A (zh) | 基于人工智能的产品资源分析和展示的方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |