CN109829491B - 用于图像检测的信息处理方法、装置以及存储介质 - Google Patents
用于图像检测的信息处理方法、装置以及存储介质 Download PDFInfo
- Publication number
- CN109829491B CN109829491B CN201910059895.9A CN201910059895A CN109829491B CN 109829491 B CN109829491 B CN 109829491B CN 201910059895 A CN201910059895 A CN 201910059895A CN 109829491 B CN109829491 B CN 109829491B
- Authority
- CN
- China
- Prior art keywords
- information
- image
- target object
- object information
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Abstract
本申请公开了一种用于图像检测的信息处理方法、装置以及存储介质,涉及图像检测领域,该方法包括:提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息;将所述第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息;本申请解决了相关技术中单独使用基于统计学习的检测方法鲁棒性较差,单独使用基于深度学习的检测方法难以控制漏检和误检,从而导致的图像检测效果不佳的问题。
Description
技术领域
本申请涉及图像检测领域,具体而言,涉及一种用于图像检测的信息处理方法、装置以及存储介质。
背景技术
针对行人的检测是图像检测领域中重要的应用场景,相关技术中的行人检测往往采用基于统计学习的检测方法和基于深度学习的检测方法。
基于统计学习的检测方法是目前行人检测常用的方法,一般采用分类器加多尺度滑动窗口的模式,根据大量的标注样本构建行人分类器,提取的特征主要有目标的灰度、边缘、纹理、颜色、梯度直方图等信息,分类器主要包括SVM、adaboost等,通过多尺度滑动窗口对图片进行全方位扫描,用分类器判断每一个窗口是行人的概率,得分满足要求的窗口即为行人。
基于深度学习的检测方法主要包括Faster RCNN、SSD、YOLO等检测方法及其各种衍生检测方法,比如Faster RCNN主要由深度学习特征提取、区域建议网络、区域分类回归网络构成,而SSD、YOLO由深度学习特征提取、检测网络构成,它们都是一种端到端的检测器,根据大量的样本训练行人检测器,无需人工提取特征,卷积神经网络一般是全卷积神经网络。
发明人发现,基于统计学习的检测方法由标注样本训练出分类器,利用分类器的结果得到行人的得分,再利用滑动窗口得到行人的坐标,缺点是人工提取特征鲁棒性较差,无法适应多样性的场景,并且滑动窗口带来很大的计算量。
基于深度学习的检测方法由标注样本直接训练出检测器,直接得到行人的得分和坐标,缺点是训练样本量大,难以控制漏检和误检,无法通过改变少量的样本来控制检测器的行为,无法对特殊场景进行特殊处理。
针对相关技术中单独使用基于统计学习的检测方法鲁棒性较差,单独使用基于深度学习的检测方法难以控制漏检和误检,从而导致的图像检测效果不佳的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种用于图像检测的信息处理方法、装置以及存储介质,以解决相关技术中单独使用基于统计学习的检测方法鲁棒性较差,单独使用基于深度学习的检测方法难以控制漏检和误检,从而导致的图像检测效果不佳的问题。
为了实现上述目的,根据本申请的第一方面,本申请实施例提供了一种用于图像检测的信息处理方法,所述方法包括:提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息;将所述第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述提取目标图像的图像特征之前包括:根据预设训练数据对所述深度学习模型进行训练,得到第一分类器和第一回归器;提取所述初始图像的图像特征,并根据所述第一分类器和所述第一回归器计算得到所述初始物体信息,其中,所述初始物体信息为物体坐标信息和物体类型信息中的至少一种。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述提取目标图像的图像特征之前还包括:根据所述初始物体信息中的所述物体坐标信息对所述初始图像进行切割,得到所述目标图像。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息包括:提取所述目标图像的图像特征,并根据所述第一分类器和所述第一回归器计算得到所述第一目标物体信息。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息包括:根据预设训练数据对所述统计学习模型进行训练,得到第二分类器和第二回归器;提取所述目标图像的图像特征,并根据所述第二分类器和所述第二回归器计算得到所述第二目标物体信息。
结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,所述将第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息包括:确定所述第一目标物体信息和所述第二目标物体信息中的物体坐标信息占比和物体类型信息占比;根据所述物体坐标信息占比和所述物体类型信息占比,得到第三目标物体信息。
为了实现上述目的,根据本申请的第二方面,本申请实施例提供了一种用于图像检测的信息处理装置,包括:图像检测单元,用于提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息;信息融合单元,用于将所述第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述图像检测单元包括:第一目标物体信息获取模块,用于提取所述目标图像的图像特征,并根据所述深度学习模型的第一分类器和第一回归器计算得到所述第一目标物体信息;第二目标物体信息获取模块,用于提取所述目标图像的图像特征,并根据所述统计学习模型的第二分类器和第二回归器计算得到所述第二目标物体信息。
结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述信息融合单元包括:占比确定模块,用于确定所述第一目标物体信息和所述第二目标物体信息中的物体坐标信息占比和物体类型信息占比;第三目标物体信息获取模块,用于根据所述物体坐标信息占比和所述物体类型信息占比,得到第三目标物体信息。
为了实现上述目的,根据本申请的第三方面,本申请实施例提供了一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述任一项信息处理方法。
在本申请实施例中,采用提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息的方式,通过将第一目标物体信息和第二目标物体信息根据预设融合规则进行信息融合,得到目标图像的第三目标物体信息,从而实现了提高计算效率的同时保持检测准确度的技术效果,进而解决了相关技术中单独使用基于统计学习的检测方法鲁棒性较差,单独使用基于深度学习的检测方法难以控制漏检和误检,从而导致的图像检测效果不佳的问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请提供的一种用于图像检测的信息处理方法的流程图;
图2是根据本申请提供的另一种用于图像检测的信息处理方法的流程图;
图3是根据本申请提供的另一种用于图像检测的信息处理方法的流程图;
图4是根据本申请提供的另一种用于图像检测的信息处理方法的流程图;
图5是根据本申请提供的一种用于图像检测的信息处理装置的示意图;
图6是根据本申请提供的另一种用于图像检测的信息处理装置的示意图;以及
图7是根据本申请提供的另一种用于图像检测的信息处理装置的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
考虑到:相关技术中单独使用基于统计学习的检测方法鲁棒性较差,单独使用基于深度学习的检测方法难以控制漏检和误检,从而导致的图像检测效果不佳,因此,本申请提供了一种用于图像检测的信息处理方法、装置以及存储介质。
如图1所示,该方法包括如下的步骤S101至步骤S102:
步骤S101,提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息;
优选的,所述第一目标物体信息和所述第二目标物体信息包括但不限于所述目标图像中的所述目标物体的物体坐标信息和物体类型信息,具体的,所述物体坐标信息可以是能够反映所述目标物体位置的检测框,所述物体类型信息可以为能够反映所述目标物体是否为行人的概率得分。
首先,在提取所述目标图像的图像特征之前需要先对最先接收到的初始图像通过深度学习模型进行图像检测,具体的,通过用于训练的原始图像和在所述原始图像上添加正确的标注信息,做为用于进行深度学习模型训练的训练数据,通过训练得到第一分类器和第一回归器,同时也做为用于进行统计学习模型训练的训练数据,通过训练得到第二分类器和第二回归器;在对所述初始图像进行基于深度学习的图像检测时通过所述第一回归器得到所述初始图像中的初始检测框,通过所述第一分类器得到所述初始检测框中目标物体为行人的概率得分。
然后,根据所述初始图像中初始检测框的位置,将初始检测框从初始图像中切割出来,将切割后得到的图像设定为目标图像。
再然后,提取所述目标图像的图像特征,优选的,既按照统计学习模型的运算要求提取图像特征,同时也按照深度学习模型的运算要求提取图像特征。
具体的,通过CNN分类器(即所述第一分类器)对图像特征进行运算,得到所述目标图像中为行人的概率得分(即所述第一目标物体信息中的物体类型信息),通过CNN坐标回归器对图像特征进行运算,得到所述目标图像的坐标进行微调(即得到所述第一目标物体信息中的物体坐标信息);通过SVM分类器(即所述第二分类器)对图像特征进行运算,得到所述目标图像中为行人的概率得分(即所述第二目标物体信息中的物体类型信息),通过LR坐标回归器对图像特征进行运算,得到所述目标图像的坐标进行微调(即得到所述第二目标物体信息中的物体坐标信息)。
步骤S102,将所述第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息。
在通过预设训练数据对深度学习模型和统计学习模型进行训练的过程中,为了使训练得到的分类器和回归器的准确度与正确数据无限接近,需要对在进行分类器训练时的参数α和对回归器训练时的参数β进行动态调整,得到的最终参数α即为在进行分类器信息融合时的物体类型信息占比,得到的最终参数β即为在进行回归器信息融合时的物体坐标信息占比。
具体的,CNN分类器和SVM分类器负责对检测框进行分类,CNN分类器输入深度学习的特征,SVM分类器输入统计学习特征,经过两个分类器的组合,得到是行人或者背景的概率,概率融合的方法为:假设SVM分类器输出的行人的概率为pt,CNN分类器输出行人的概率为pd,最终的行人概率为pf=αpt+(1-α)pd,而CNN坐标回归器和LR坐标回归器用于对检测框的坐标进行微调,CNN回归器输入深度学习特征,LR回归器输入统计学习特征,坐标融合的方法为:假设CNN回归器的边框坐标为di,i=1,2,3,4,而LR回归器的边框坐标为ti,i=1,2,3,4,最终的边框计算方式为:fi=βdi+(1-β)ti,i=1,2,3,4,经过融合操作后得到的第三目标物体信息的物体坐标信息为fi,物体类型信息为pf。
从以上的描述中,可以看出,本发明实现了如下技术效果:
在本申请实施例中,采用提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息的方式,通过将第一目标物体信息和第二目标物体信息根据预设融合规则进行信息融合,得到目标图像的第三目标物体信息,从而实现了提高计算效率的同时保持检测准确度的技术效果,进而解决了相关技术中单独使用基于统计学习的检测方法鲁棒性较差,单独使用基于深度学习的检测方法容易出现漏检和误检,从而导致的图像检测效果不佳的问题。
根据本发明实施例,作为本申请实施例中的优选,如图2所示,所述提取目标图像的图像特征之前包括如下的步骤S201至步骤S202:
步骤S201,根据预设训练数据对所述深度学习模型进行训练,得到第一分类器和第一回归器;
优选的,通过用于训练的原始图像和在所述原始图像上添加正确的标注信息,做为用于进行深度学习模型训练的训练数据,通过训练得到第一分类器和第一回归器。
步骤S202,提取所述初始图像的图像特征,并根据所述第一分类器和所述第一回归器计算得到所述初始物体信息,其中,所述初始物体信息为物体坐标信息和物体类型信息中的至少一种。
优选的,在对所述初始图像进行基于深度学习的图像检测时通过所述第一回归器得到所述初始图像中的初始检测框,通过所述第一分类器得到所述初始检测框中目标物体为行人的概率得分。
根据本发明实施例,作为本申请实施例中的优选,所述提取目标图像的图像特征之前还包括:根据所述初始物体信息中的所述物体坐标信息对所述初始图像进行切割,得到所述目标图像。
优选的,根据所述初始图像中初始检测框的位置,将初始检测框从初始图像中切割出来,将切割后得到的图像设定为目标图像。
根据本发明实施例,作为本申请实施例中的优选,所述根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息包括:提取所述目标图像的图像特征,并根据所述第一分类器和所述第一回归器计算得到所述第一目标物体信息。
优选的,既按照统计学习模型的运算要求提取图像特征,通过CNN分类器(即所述第一分类器)对图像特征进行运算,得到所述目标图像中为行人的概率得分(即所述第一目标物体信息中的物体类型信息),通过CNN坐标回归器对图像特征进行运算,得到所述目标图像的坐标进行微调(即得到所述第一目标物体信息中的物体坐标信息)。
根据本发明实施例,作为本申请实施例中的优选,如图3所示,所述根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息包括如下的步骤S301至步骤S302:
步骤S301,根据预设训练数据对所述统计学习模型进行训练,得到第二分类器和第二回归器;
优选的,通过用于训练的原始图像和在所述原始图像上添加正确的标注信息,做为用于进行统计学习模型训练的训练数据,通过训练得到第二分类器和第二回归器。
步骤S302,提取所述目标图像的图像特征,并根据所述第二分类器和所述第二回归器计算得到所述第二目标物体信息。
优选的,按照深度学习模型的运算要求提取图像特征,通过SVM分类器(即所述第二分类器)对图像特征进行运算,得到所述目标图像中为行人的概率得分(即所述第二目标物体信息中的物体类型信息),通过LR坐标回归器对图像特征进行运算,得到所述目标图像的坐标进行微调(即得到所述第二目标物体信息中的物体坐标信息)。
根据本发明实施例,作为本申请实施例中的优选,如图4所示,所述将第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息包括如下的步骤S401至步骤S402:
步骤S401,确定所述第一目标物体信息和所述第二目标物体信息中的物体坐标信息占比和物体类型信息占比;
优选的,在通过预设训练数据对深度学习模型和统计学习模型进行训练的过程中,为了使训练得到的分类器和回归器的准确度与正确数据无限接近,需要对在进行分类器训练时的参数α和对回归器训练时的参数β进行动态调整,得到的最终参数α即为在进行分类器信息融合时的物体类型信息占比,得到的最终参数β即为在进行回归器信息融合时的物体坐标信息占比。
步骤S402,根据所述物体坐标信息占比和所述物体类型信息占比,得到第三目标物体信息。
优选的,CNN分类器和SVM分类器负责对检测框进行分类,CNN分类器输入深度学习的特征,SVM分类器输入统计学习特征,经过两个分类器的组合,得到是行人或者背景的概率,概率融合的方法为:假设SVM分类器输出的行人的概率为pt,CNN分类器输出行人的概率为pd,最终的行人概率为pf=αpt+(1-α)pd,而CNN坐标回归器和LR坐标回归器用于对检测框的坐标进行微调,CNN回归器输入深度学习特征,LR回归器输入统计学习特征,坐标融合的方法为:假设CNN回归器的边框坐标为di,i=1,2,3,4,而LR回归器的边框坐标为ti,i=1,2,3,4,最终的边框计算方式为:fi=βdi+(1-β)ti,i=1,2,3,4,经过融合操作后得到的第三目标物体信息的物体坐标信息为fi,物体类型信息为pf。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述用于图像检测的信息处理方法的装置,如图5所示,该装置包括:图像检测单元10,用于提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息;信息融合单元20,用于将所述第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息。
根据本申请实施例所述的图像检测单元10用于提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息,优选的,所述第一目标物体信息和所述第二目标物体信息包括但不限于所述目标图像中的所述目标物体的物体坐标信息和物体类型信息,具体的,所述物体坐标信息可以是能够反映所述目标物体位置的检测框,所述物体类型信息可以为能够反映所述目标物体是否为行人的概率得分。
根据本申请实施例所述的信息融合单元20用于将所述第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息,优选的,在通过预设训练数据对深度学习模型和统计学习模型进行训练的过程中,为了使训练得到的分类器和回归器的准确度与正确数据无限接近,需要对在进行分类器训练时的参数α和对回归器训练时的参数β进行动态调整,得到的最终参数α即为在进行分类器信息融合时的物体类型信息占比,得到的最终参数β即为在进行回归器信息融合时的物体坐标信息占比。
根据本发明实施例,作为本申请实施例中的优选,如图6所示,所述图像检测单元10包括:第一目标物体信息获取模块11,用于提取所述目标图像的图像特征,并根据所述深度学习模型的第一分类器和第一回归器计算得到所述第一目标物体信息;第二目标物体信息获取模块12,用于提取所述目标图像的图像特征,并根据所述统计学习模型的第二分类器和第二回归器计算得到所述第二目标物体信息。
根据本申请实施例所述的第一目标物体信息获取模块11用于提取所述目标图像的图像特征,并根据所述深度学习模型的第一分类器和第一回归器计算得到所述第一目标物体信息,优选的,通过CNN分类器(即所述第一分类器)对图像特征进行运算,得到所述目标图像中为行人的概率得分(即所述第一目标物体信息中的物体类型信息),通过CNN坐标回归器对图像特征进行运算,得到所述目标图像的坐标进行微调(即得到所述第一目标物体信息中的物体坐标信息)。
根据本申请实施例所述的第二目标物体信息获取模块12用于提取所述目标图像的图像特征,并根据所述统计学习模型的第二分类器和第二回归器计算得到所述第二目标物体信息,优选的,通过SVM分类器(即所述第二分类器)对图像特征进行运算,得到所述目标图像中为行人的概率得分(即所述第二目标物体信息中的物体类型信息),通过LR坐标回归器对图像特征进行运算,得到所述目标图像的坐标进行微调(即得到所述第二目标物体信息中的物体坐标信息)。
根据本发明实施例,作为本申请实施例中的优选,如图7所示,所述信息融合单元20包括:占比确定模块21,用于确定所述第一目标物体信息和所述第二目标物体信息中的物体坐标信息占比和物体类型信息占比;第三目标物体信息获取模块22,用于根据所述物体坐标信息占比和所述物体类型信息占比,得到第三目标物体信息。
根据本申请实施例所述的占比确定模块21用于确定所述第一目标物体信息和所述第二目标物体信息中的物体坐标信息占比和物体类型信息占比,优选的,在通过预设训练数据对深度学习模型和统计学习模型进行训练的过程中,为了使训练得到的分类器和回归器的准确度与正确数据无限接近,需要对在进行分类器训练时的参数α和对回归器训练时的参数β进行动态调整,得到的最终参数α即为在进行分类器信息融合时的物体类型信息占比,得到的最终参数β即为在进行回归器信息融合时的物体坐标信息占比。
根据本申请实施例所述的第三目标物体信息获取模块22用于根据所述物体坐标信息占比和所述物体类型信息占比,得到第三目标物体信息,优选的,CNN分类器和SVM分类器负责对检测框进行分类,CNN分类器输入深度学习的特征,SVM分类器输入统计学习特征,经过两个分类器的组合,得到是行人或者背景的概率,概率融合的方法为:假设SVM分类器输出的行人的概率为pt,CNN分类器输出行人的概率为pd,最终的行人概率为pf=αpt+(1-α)pd,而CNN坐标回归器和LR坐标回归器用于对检测框的坐标进行微调,CNN回归器输入深度学习特征,LR回归器输入统计学习特征,坐标融合的方法为:假设CNN回归器的边框坐标为di,i=1,2,3,4,而LR回归器的边框坐标为ti,i=1,2,3,4,最终的边框计算方式为:fi=βdi+(1-β)ti,i=1,2,3,4,经过融合操作后得到的第三目标物体信息的物体坐标信息为fi,物体类型信息为pf。
此外,本申请也公开了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述任一项所述的信息处理方法。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (8)
1.一种用于图像检测的信息处理方法,其特征在于,所述方法包括:
提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息;
将所述第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息;
所述根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息包括:根据预设训练数据对所述统计学习模型进行训练,得到第二分类器和第二回归器;提取所述目标图像的图像特征,并根据所述第二分类器和所述第二回归器计算得到所述第二目标物体信息;
所述将第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息包括:确定所述第一目标物体信息和所述第二目标物体信息中的物体坐标信息占比和物体类型信息占比;根据所述物体坐标信息占比和所述物体类型信息占比,得到第三目标物体信息。
2.根据权利要求1所述的信息处理方法,其特征在于,所述提取目标图像的图像特征之前包括:
根据预设训练数据对所述深度学习模型进行训练,得到第一分类器和第一回归器;
提取初始图像的图像特征,并根据所述第一分类器和所述第一回归器计算得到初始物体信息,其中,所述 初始物体信息为物体坐标信息和物体类型信息中的至少一种。
3.根据权利要求2所述的信息处理方法,其特征在于,所述提取目标图像的图像特征之前还包括:
根据所述 初始物体信息中的所述物体坐标信息对所述初始图像进行切割,得到所述目标图像。
4.根据权利要求3所述的信息处理方法,其特征在于,所述根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息包括:
提取所述目标图像的图像特征,并根据所述第一分类器和所述第一回归器计算得到所述第一目标物体信息。
5.一种用于图像检测的信息处理装置,其特征在于,所述信息处理装置用于执行权利要求1-4中任意一项所述的信息处理方法,所述信息处理装置包括:
图像检测单元,用于提取目标图像的图像特征,并根据预设深度学习模型和预设统计学习模型分别对所述目标图像进行图像检测,得到第一目标物体信息和第二目标物体信息;
信息融合单元,用于将所述第一目标物体信息和所述第二目标物体信息根据预设融合规则进行信息融合,得到所述目标图像的第三目标物体信息。
6.根据权利要求5所述的信息处理装置,其特征在于,所述图像检测单元包括:
第一目标物体信息获取模块,用于提取所述目标图像的图像特征,并根据所述深度学习模型的第一分类器和第一回归器计算得到所述第一目标物体信息;
第二目标物体信息获取模块,用于提取所述目标图像的图像特征,并根据所述统计学习模型的第二分类器和第二回归器计算得到所述第二目标物体信息。
7.根据权利要求6所述的信息处理装置,其特征在于,所述信息融合单元包括:
占比确定模块,用于确定所述第一目标物体信息和所述第二目标物体信息中的物体坐标信息占比和物体类型信息占比;
第三目标物体信息获取模块,用于根据所述物体坐标信息占比和所述物体类型信息占比,得到第三目标物体信息。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行权利要求1至4中任一项所述的信息处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910059895.9A CN109829491B (zh) | 2019-01-22 | 2019-01-22 | 用于图像检测的信息处理方法、装置以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910059895.9A CN109829491B (zh) | 2019-01-22 | 2019-01-22 | 用于图像检测的信息处理方法、装置以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109829491A CN109829491A (zh) | 2019-05-31 |
CN109829491B true CN109829491B (zh) | 2021-09-28 |
Family
ID=66861853
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910059895.9A Active CN109829491B (zh) | 2019-01-22 | 2019-01-22 | 用于图像检测的信息处理方法、装置以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109829491B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110490232B (zh) * | 2019-07-18 | 2021-08-13 | 北京捷通华声科技股份有限公司 | 训练文字行方向预测模型的方法、装置、设备、介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038422A (zh) * | 2017-04-20 | 2017-08-11 | 杭州电子科技大学 | 基于空间几何约束深度学习的疲劳状态识别方法 |
CN107392136A (zh) * | 2017-07-17 | 2017-11-24 | 河海大学常州校区 | 一种基于特征自适应震荡衰减的签名真伪性鉴别系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006114003A1 (en) * | 2005-04-27 | 2006-11-02 | The Governors Of The University Of Alberta | A method and system for automatic detection and segmentation of tumors and associated edema (swelling) in magnetic resonance (mri) images |
US8873813B2 (en) * | 2012-09-17 | 2014-10-28 | Z Advanced Computing, Inc. | Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities |
CN105069400B (zh) * | 2015-07-16 | 2018-05-25 | 北京工业大学 | 基于栈式稀疏自编码的人脸图像性别识别系统 |
CN106096623A (zh) * | 2016-05-25 | 2016-11-09 | 中山大学 | 一种犯罪识别与预测方法 |
US10032067B2 (en) * | 2016-05-28 | 2018-07-24 | Samsung Electronics Co., Ltd. | System and method for a unified architecture multi-task deep learning machine for object recognition |
CN106203450A (zh) * | 2016-07-11 | 2016-12-07 | 国家新闻出版广电总局广播科学研究院 | 基于深度学习框架对图像进行特征提取的目标检测方法 |
CN106250812B (zh) * | 2016-07-15 | 2019-08-20 | 汤一平 | 一种基于快速r-cnn深度神经网络的车型识别方法 |
CN108875452A (zh) * | 2017-05-11 | 2018-11-23 | 北京旷视科技有限公司 | 人脸识别方法、装置、系统和计算机可读介质 |
CN108108677A (zh) * | 2017-12-12 | 2018-06-01 | 重庆邮电大学 | 一种基于改进的cnn人脸表情识别方法 |
CN108154118B (zh) * | 2017-12-25 | 2018-12-18 | 北京航空航天大学 | 一种基于自适应组合滤波与多级检测的目标探测系统及方法 |
-
2019
- 2019-01-22 CN CN201910059895.9A patent/CN109829491B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038422A (zh) * | 2017-04-20 | 2017-08-11 | 杭州电子科技大学 | 基于空间几何约束深度学习的疲劳状态识别方法 |
CN107392136A (zh) * | 2017-07-17 | 2017-11-24 | 河海大学常州校区 | 一种基于特征自适应震荡衰减的签名真伪性鉴别系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109829491A (zh) | 2019-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102469295B1 (ko) | 깊이를 사용한 비디오 배경 제거 | |
CN108121986B (zh) | 目标检测方法及装置、计算机装置和计算机可读存储介质 | |
US10102446B2 (en) | Feature density object classification, systems and methods | |
EP3651055A1 (en) | Gesture recognition method, apparatus, and device | |
US8792722B2 (en) | Hand gesture detection | |
WO2018103608A1 (zh) | 一种文字检测方法、装置及存储介质 | |
US20180122114A1 (en) | Method and apparatus for processing video image and electronic device | |
US8750573B2 (en) | Hand gesture detection | |
CN114258559A (zh) | 用于标识具有不受控制的光照条件的图像中的肤色的技术 | |
WO2019114036A1 (zh) | 人脸检测方法及装置、计算机装置和计算机可读存储介质 | |
CN111881913A (zh) | 图像识别方法及装置、存储介质和处理器 | |
CN108985214A (zh) | 图像数据的标注方法和装置 | |
US20210224598A1 (en) | Method for training deep learning model, electronic equipment, and storage medium | |
US20150358549A1 (en) | Image capturing parameter adjustment in preview mode | |
CN113313111B (zh) | 文本识别方法、装置、设备和介质 | |
CN110222686B (zh) | 物体检测方法、装置、计算机设备和存储介质 | |
WO2021047484A1 (zh) | 文字识别方法和终端设备 | |
WO2022089170A1 (zh) | 字幕区域识别方法、装置、设备及存储介质 | |
CN105761201A (zh) | 一种翻译图片中文字的方法 | |
WO2022193523A1 (zh) | 图像处理方法、装置、设备及存储介质 | |
CN112464797A (zh) | 一种吸烟行为检测方法、装置、存储介质及电子设备 | |
CN110599453A (zh) | 一种基于图像融合的面板缺陷检测方法、装置及设备终端 | |
JP2014535101A (ja) | 画像中のテキストの検出を容易にする方法及び装置 | |
WO2022148248A1 (zh) | 图像处理模型的训练方法、图像处理方法、装置、电子设备及计算机程序产品 | |
WO2020108010A1 (zh) | 视频处理方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |