CN113034570A - 图像处理方法、装置和电子设备 - Google Patents
图像处理方法、装置和电子设备 Download PDFInfo
- Publication number
- CN113034570A CN113034570A CN202110262483.2A CN202110262483A CN113034570A CN 113034570 A CN113034570 A CN 113034570A CN 202110262483 A CN202110262483 A CN 202110262483A CN 113034570 A CN113034570 A CN 113034570A
- Authority
- CN
- China
- Prior art keywords
- sample
- normal vector
- image
- pixel point
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 28
- 239000013598 vector Substances 0.000 claims abstract description 234
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000012545 processing Methods 0.000 claims abstract description 37
- 238000013528 artificial neural network Methods 0.000 claims description 98
- 238000005457 optimization Methods 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 37
- 238000004590 computer program Methods 0.000 claims description 9
- 230000005484 gravity Effects 0.000 claims description 9
- 238000013145 classification model Methods 0.000 claims description 8
- 238000005259 measurement Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 238000011478 gradient descent method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000005286 illumination Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004568 cement Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004579 marble Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Abstract
本公开实施例公开了图像处理方法、装置和电子设备。该方法的一具体实施方式包括:获取待处理图像,从待处理图像中提取用于表征目标对象的像素点集合;确定目标对象的至少一个面中每个面的初始法向量;基于至少一个面中每个面的初始法向量、待处理图像和像素点集合,确定至少一个面中每个面中的像素点的最终法向量;利用至少一个面中每个面中的像素点的最终法向量,对待处理图像中呈现的目标对象所在区域进行处理。该实施方式可以更加准确地确定出法向量,从而提高了对图像中的目标对象所在区域的处理效果。
Description
技术领域
本公开实施例涉及计算机技术领域,具体涉及图像处理方法、装置和电子设备。
背景技术
目前,图像处理软件的应用越来越广泛。用户可以利用图像处理软件对图像进行处理,例如,可以利用图像处理软件对图像中目标区域的光照情况进行调整,也可以利用图像处理软件在图像的目标区域中叠加预设贴图,例如,在建筑物区域叠加广告牌。
发明内容
提供该公开内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该公开内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开实施例提供了一种图像处理方法、装置和电子设备,可以更加准确地确定出法向量,从而提高了对图像中的目标对象所在区域的处理效果。
第一方面,本公开实施例提供了一种图像处理方法,该方法包括:获取待处理图像,从待处理图像中提取用于表征目标对象的像素点集合,其中,待处理图像中呈现有目标对象,目标对象包括至少一个面;确定目标对象的至少一个面中每个面的初始法向量;基于至少一个面中每个面的初始法向量、待处理图像和像素点集合,确定至少一个面中每个面中的像素点的最终法向量;利用至少一个面中每个面中的像素点的最终法向量,对待处理图像中呈现的目标对象所在区域进行处理。
第二方面,本公开实施例提供了一种图像处理装置,包括:获取单元,用于获取待处理图像,从待处理图像中提取用于表征目标对象的像素点集合,其中,待处理图像中呈现有目标对象,目标对象包括至少一个面;第一确定单元,用于确定目标对象的至少一个面中每个面的初始法向量;第二确定单元,用于基于至少一个面中每个面的初始法向量、待处理图像和像素点集合,确定至少一个面中每个面中的像素点的最终法向量;处理单元,用于利用至少一个面中每个面中的像素点的最终法向量,对待处理图像中呈现的目标对象所在区域进行处理。
第三方面,本公开实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面的图像处理方法。
第四方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的图像处理方法的步骤。
本公开实施例提供的图像处理方法、装置和电子设备,通过获取待处理图像,从上述待处理图像中提取用于表征目标对象的像素点集合;之后,确定上述目标对象的至少一个面中每个面的初始法向量;而后,基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的最终法向量;最后,利用上述至少一个面中每个面中的像素点的最终法向量,对上述待处理图像中呈现的上述目标对象所在区域进行处理。通过这种方式可以更加准确地确定出法向量,从而提高了对图像中的目标对象所在区域的处理效果。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1是本公开的各个实施例可以应用于其中的示例性系统架构图;
图2是根据本公开的图像处理方法的一个实施例的流程图;
图3是根据本公开的图像处理方法中确定初始法向量的一个实施例的流程图;
图4是根据本公开的图像处理方法中训练得到方位角预测模型的一个实施例的流程图;
图5是根据本公开的图像处理方法中训练得到法向量残差预测模型的一个实施例的流程图;
图6是根据本公开的图像处理装置的一个实施例的结构示意图;
图7是适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
图1示出了可以应用本公开的图像处理方法的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备1011、1012、1013,网络102和服务器103。网络102用以在终端设备1011、1012、1013和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备1011、1012、1013通过网络102与服务器103交互,以发送或接收消息等,例如,用户可以利用终端设备1011、1012、1013采集到待处理图像,服务器103可以从终端设备1011、1012、1013中获取待处理图像。终端设备1011、1012、1013上可以安装有各种通讯客户端应用,例如图像处理类应用、即时通讯软件等。
终端设备1011、1012、1013可以首先获取待处理图像,从上述待处理图像中提取用于表征目标对象的像素点集合;之后,可以确定上述目标对象的至少一个面中每个面的初始法向量;而后,可以基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的最终法向量;最后,可以利用上述至少一个面中每个面中的像素点的最终法向量,对上述待处理图像中呈现的上述目标对象所在区域进行处理。
终端设备1011、1012、1013可以是硬件,也可以是软件。当终端设备1011、1012、1013为硬件时,可以是具有摄像头并且支持信息交互的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机等。当终端设备1011、1012、1013为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器103可以是提供各种服务的服务器。例如,可以从终端设备1011、1012、1013获取待处理图像,从上述待处理图像中提取用于表征目标对象的像素点集合;之后,可以确定上述目标对象的至少一个面中每个面的初始法向量;而后,可以基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的最终法向量;最后,可以利用上述至少一个面中每个面中的像素点的最终法向量,对上述待处理图像中呈现的上述目标对象所在区域进行处理。
需要说明的是,服务器103可以是硬件,也可以是软件。当服务器103为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器103为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
还需要说明的是,本公开实施例所提供的图像处理方法可以由服务器103执行,此时,图像处理装置通常设置于服务器103中。本公开实施例所提供的图像处理方法也可以由终端设备1011、1012、1013执行,此时,图像处理装置通常设置于终端设备1011、1012、1013中。
还需要说明的是,在本公开实施例所提供的图像处理方法由服务器103执行的情况下,若服务器103的本地存储有待处理图像,此时示例性系统架构100可以不存在终端设备1011、1012、1013和网络102。
还需要说明的是,在本公开实施例所提供的图像处理方法由终端设备1011、1012、1013执行的情况下,若终端设备1011、1012、1013的本地存储有方位角预测模型、方位角分类模型和法向量残差预测模型等模型,此时示例性系统架构100可以不存在网络102和服务器103。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开的图像处理方法的一个实施例的流程200。该图像处理方法,包括以下步骤:
步骤201,获取待处理图像,从待处理图像中提取用于表征目标对象的像素点集合。
在本实施例中,图像处理方法的执行主体(例如图1所示的终端设备或服务器)可以获取待处理图像。在这里,上述待处理图像可以为室外图像,也可以为室内图像。上述待处理图像中通常呈现有目标对象,上述目标对象通常包括至少一个面。作为示例,上述目标对象可以包括但不限于以下至少一项:建筑物、墙面、柜子和门。
之后,上述执行主体可以从上述待处理图像中提取用于表征目标对象的像素点集合。用于表征目标对象的像素点集合可以表示成掩膜(mask)。在这里,用于表征目标对象的掩膜可以从上述待处理图像中提取出上述目标对象所属的区域,对除上述目标对象所属的区域进行屏蔽。通常来说,用于表征目标对象的掩膜中属于上述目标对象的区域的像素值为255,其他区域的像素值为0。
在这里,上述执行主体可以将上述待处理图像和目标对象的对象标识输入预先训练的提取模型中,得到上述待处理图像中用于表征目标对象的像素点集合。上述提取模型可以用于表征图像和待提取对象的对象标识这两者与图像中用于表征待提取对象的像素点集合之间的对应关系。需要说明的是,若待提取对象为地面,则可以将地面的标识输入上述提取模型中,从而提取出用于表征地面的像素点集合。若待提取对象为衣柜,则可以将衣柜的标识输入上述提取模型中,从而提取出用于表征衣柜的像素点集合。
步骤202,确定目标对象的至少一个面中每个面的初始法向量。
在本实施例中,上述执行主体可以确定上述目标对象的至少一个面中每个面的初始法向量。垂直于平面的直线所表示的向量为该平面的法向量。由于空间内有无数个直线垂直于已知平面,因此一个平面都存在无数个法向量。上述初始法向量也可以称为基础法向量,一个面的初始法向量通常是包含该面的像素点最多的面的法向量。
步骤203,基于至少一个面中每个面的初始法向量、待处理图像和像素点集合,确定至少一个面中每个面中的像素点的最终法向量。
在本实施例中,上述执行主体可以基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的最终法向量。在这里,上述执行主体可以将上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合输入预先训练的法向量预测模型中,得到上述至少一个面中每个面中的像素点的最终法向量。上述法向量预测模型可以用于表征图像中呈现的对象的至少一个面中每个面的初始法向量、图像和图像中用于表征对象的像素点集合这三者与图像中呈现的对象的至少一个面中每个面中的像素点的最终法向量之间的对应关系。
通常情况下,上述目标对象的每个面可能不是光滑的、是凹凸不平的,所以该面的每个像素点的法向量通常是不相同的。上述执行主体需要在该面的初始法向量的基础上,确定该面中每个像素点的最终法向量。
步骤204,利用至少一个面中每个面中的像素点的最终法向量,对待处理图像中呈现的目标对象所在区域进行处理。
在本实施例中,上述执行主体可以利用上述至少一个面中每个面中的像素点的最终法向量,对上述待处理图像中呈现的目标对象所在区域进行处理。
作为一种示例,若上述目标对象为建筑物,可以在建筑物上进行挂载,例如,可以在建筑物上挂载广告牌。上述执行主体可以利用上述至少一个面中每个面中的像素点的最终法向量,在对上述待处理图像中呈现的建筑物所在区域进行挂载时,调整所挂载的物品的位置,从而可以使得挂载效果更好。
作为另一种示例,可以对上述目标对象进行打光,即对上述目标对象的光照参数进行调整。上述执行主体可以利用上述至少一个面中每个面中的像素点的最终法向量,对上述待处理图像中呈现的上述目标对象所在区域的光照情况进行调整,以使建筑物的光照情况符合预设要求且更加真实。
本公开的上述实施例提供的方法通过确定待处理图像中目标对象的每个面的初始法向量,之后,再利用初始法向量和待处理图像确定目标对象的每个面的最终法向量,因此,在初始法向量的基础上考虑了图像中的细节信息,这种方式可以更加准确地确定出法向量,从而提高了对图像中的目标对象所在区域的处理效果。
在一些可选的实现方式中,上述执行主体可以通过如下方式基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的最终法向量:上述执行主体可以基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的法向量残差。残差在数理统计中通常是指实际观察值与估计值(拟合值)之间的差值。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话,可以将残差看作误差的观测值。在这里,法向量残差通常是指最终法向量(实际法向量)与初始法向量之间的差值。作为示例,若最终法向量小于初始法向量,则法向量残差的值可以为负数。若最终法向量大于初始法向量,则法向量残差的值可以为正数。之后,上述执行主体可以利用上述至少一个面中每个面的初始法向量和每个面中的像素点的法向量残差,确定至少一个面中每个面中的像素点的最终法向量。具体地,针对上述至少一个面中每个面中的每个像素点,上述执行主体可以将该像素点的初始法向量与该像素点的法向量残差相加,将相加结果确定为该像素点的最终法向量。
在一些可选的实现方式中,上述目标对象可以为地面,例如,可以为室外地面(如,水泥地面、鹅卵石地面),也可以为室内地面(如,大理石地面、木质地面)。上述执行主体可以通过如下方式确定上述目标对象的至少一个面中每个面的初始法向量:用户可以利用目标电子设备采集得到上述待处理图像。上述执行主体可以获取上述目标电子设备在采集上述待处理图像时惯性测量单元(IMU,Inertial Measurement Unit)测量出的重力方向,可以将上述重力方向确定为地面的初始法向量。惯性测量单元通常包含加速度计、陀螺仪和磁力仪三种传感器。使用惯性测量单元可以测量速度、方向和重力,这种动捕技术也就是我们常说的惯性动捕。
在一些可选的实现方式中,上述执行主体可以通过如下方式基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的法向量残差:上述执行主体可以将上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合这三者输入预先训练的法向量残差预测模型中,得到上述至少一个面中每个面中的像素点的法向量残差。上述法向量残差预测模型可以用于表征图像、图像中用于表征目标对象的像素点集合和图像中目标对象的至少一个面中每个面的初始法向量这三者与图像中目标对象的至少一个面中每个面中的像素点的法向量残差之间的对应关系。
继续参考图3,其示出了图像处理方法中确定初始法向量的一个实施例的流程300。该确定初始法向量的流程300,包括以下步骤:
步骤301,将待处理图像和像素点集合输入预先训练的方位角预测模型中,得到目标方位角,将目标方位角确定为目标对象的目标面的初始法向量。
在本实施例中,图像处理方法的执行主体(例如图1所示的终端设备或服务器)可以将待处理图像和像素点集合输入预先训练的方位角预测模型中,得到目标方位角。上述像素点集合可以是由从上述待处理图像中提取出的用于表征目标对象的像素点所组成的。
在这里,上述方位角预测模型可以用于表征图像和图像中用于表征目标对象的像素点集合这两者与目标方位角之间的对应关系。上述目标方位角可以理解为上述目标对象的方位角,在这里,上述目标对象的方位角可以表征成上述目标对象的目标面的方位角。上述目标面可以为上述目标对象的至少一个面中与采集到上述待处理图像的电子设备的屏幕的夹角最小的面,因此,上述目标方位角可以为上述目标对象的目标面与采集到上述待处理图像的电子设备的屏幕所在平面之间的夹角。
之后,上述执行主体可以将上述目标方位角确定为上述目标对象的目标面的初始法向量。
步骤302,将目标方位角、待处理图像和像素点集合输入预先训练的方位角分类模型中,得到方位角分类结果。
在本实施例中,上述执行主体可以将上述目标方位角、上述待处理图像和上述像素点集合输入预先训练的方位角分类模型中,得到方位角分类结果。上述方位角分类模型可以用于表征目标方位角、图像和图像中用于表征目标对象的像素点集合这三者与方位角分类结果之间的对应关系。
在这里,上述方位角分类结果可以用于表征上述待处理图像中呈现的上述目标对象除上述目标面之外的其他面相对于上述目标面的旋转角度。需要说明的是,上述方位角分类结果通常不包括上述待处理图像中未呈现出的面相对于上述目标面的旋转角度。方位角分类结果可以按照实际情况(例如,目标对象所包含的面的数量、目标对象的面与面之间的夹角是否相同等)进行分类,例如,可以包括顺时针旋转30度、顺时针旋转60度、顺时针旋转90度、顺时针旋转270度、顺时针旋转300度和顺时针旋转330度。
步骤303,针对其他面中的每个面,利用目标方位角和该面相对于目标面的旋转角度,确定该面对应的方位角,将该面对应的方位角确定为该面的初始法向量。
在本实施例中,针对上述其他面中的每个面,上述执行主体可以利用上述目标方位角和该面相对于上述目标面的旋转角度,确定该面对应的方位角,将该面对应的方位角确定为该面的初始法向量。在这里,上述执行主体可以将上述目标方位角和该面相对于上述目标面的旋转角度相加,得到该面对应的方位角。作为示例,若上述目标方位角为10度,该面相对于上述目标面的旋转角度为顺时针旋转60度,则该面对应的方位角可以为70度。
本公开的上述实施例提供的方法通过利用方位角预测模型和方位角分类模型,确定目标对象的至少一个面中每个面的初始法向量,从而提供了一种初始法向量的确定方式。
进一步参考图4,其示出了图像处理方法中训练得到方位角预测模型的一个实施例的流程400。该训练得到方位角预测模型的流程400,包括以下步骤:
步骤401,获取第一样本集合。
在这里,可以获取第一样本集合。其中,上述第一样本集合中的第一样本可以包括样本图像、样本像素点集合,以及与样本图像和样本像素点集合对应的样本方位角,样本像素点集合可以为样本图像中用于表征样本对象的像素点集合。样本对象通常包括至少一个面。作为示例,样本对象可以包括但不限于以下至少一项:建筑物、墙面、柜子和门。
步骤402,基于第一样本集合执行以下训练步骤:将第一样本集合中的至少一个第一样本的样本图像和样本像素点集合输入第一初始神经网络,得到至少一个第一样本中的每个第一样本对应的方位角;将至少一个第一样本中的每个第一样本对应的方位角与对应的样本方位角进行比较;根据比较结果确定第一初始神经网络是否达到预设的第一优化目标;若第一初始神经网络达到第一优化目标,将第一初始神经网络确定为训练完成的方位角预测模型。
在这里,可以基于在步骤401中获取的第一样本集合,执行以下训练步骤。
在本实施例中,训练步骤402可以包括子步骤4021、4022、4023和4024。其中:
步骤4021,将第一样本集合中的至少一个第一样本的样本图像和样本像素点集合输入第一初始神经网络,得到至少一个第一样本中的每个第一样本对应的方位角。
在这里,可以将上述第一样本集合中的至少一个第一样本的样本图像和样本像素点集合输入第一初始神经网络,得到上述至少一个第一样本中的每个第一样本对应的方位角。其中,上述第一初始神经网络可以是能够根据样本图像和样本图像中用于表征样本对象的样本像素点集合得到样本对象在样本图像中的方位角的各种神经网络,例如,卷积神经网络、深度神经网络等等。
步骤4022,将至少一个第一样本中的每个第一样本对应的方位角与对应的样本方位角进行比较。
在这里,可以将上述至少一个第一样本中的每个第一样本对应的方位角与对应的样本方位角进行比较。即针对上述至少一个第一样本中的每个第一样本,将该第一样本中的样本图像和样本像素点集合输入上述第一初始神经网络所得到的方位角与该第一样本中的样本方位角进行比较。
步骤4023,根据比较结果确定第一初始神经网络是否达到预设的第一优化目标。
在这里,可以根据比较结果确定第一初始神经网络是否达到预设的第一优化目标。作为示例,当一个样本对应的方位角与对应的样本方位角之间的差异小于预设第一差异阈值时,认为该方位角的准确率大于预设的第一准确率阈值。此时,上述第一优化目标可以是指上述第一初始神经网络生成的方位角的准确率大于上述第一准确率阈值的比例大于预设的第一比例阈值。若上述第一初始神经网络达到上述第一优化目标,则可以执行步骤4024。
步骤4024,若第一初始神经网络达到第一优化目标,将第一初始神经网络确定为训练完成的方位角预测模型。
在这里,若在步骤4023中确定出上述第一初始神经网络达到上述第一优化目标,可以将第一初始神经网络确定为训练完成的方位角预测模型。
需要说明的是,上述方位角预测模型可以是图像处理方法的执行主体通过上述方式训练得到的,也可以是其他电子设备训练得到的。
本公开的上述实施例提供的方法通过在确定出第一初始神经网络达到预设的第一优化目标时,将第一初始神经网络确定为训练完成的方位角预测模型,从而可以使得方位角预测模型更加准确地预测出方位角。
在一些可选的实现方式中,训练得到上述方位角预测模型的步骤还可以包括以下步骤:若上述第一初始神经网络未达到上述第一优化目标,可以调整第一初始神经网络的网络参数,以及使用未用过的样本组成第一样本集合,使用调整后的第一初始神经网络作为第一初始神经网络,继续执行上述训练步骤402(即子步骤4021-4024)。作为示例,可以采用反向传播算法(Back Propgation Algorithm,BP算法)和梯度下降法(例如小批量梯度下降算法)对上述第一初始神经网络的网络参数进行调整。需要说明的是,反向传播算法和梯度下降法是目前广泛研究和应用的公知技术,在此不再赘述。
进一步参考图5,其示出了图像处理方法中训练得到法向量残差预测模型的一个实施例的流程500。该训练得到法向量残差预测模型的流程500,包括以下步骤:
步骤501,获取第二样本集合。
在这里,可以获取第二样本集合。其中,上述第二样本集合中的第二样本可以包括样本图像、样本像素点集合、样本图像中呈现的样本对象的至少一个面中每个面的样本初始法向量,以及与样本图像、样本像素点集合和样本初始法向量对应的至少一个面中每个面中的像素点的样本法向量残差,样本像素点集合可以为样本图像中用于表征样本对象的像素点集合。样本对象通常包括至少一个面。作为示例,样本对象可以包括但不限于以下至少一项:建筑物、墙面、柜子和门。法向量残差通常是指最终法向量与初始法向量之间的差值。
步骤502,基于第二样本集合执行以下训练步骤:将第二样本集合中的至少一个第二样本的样本图像、样本像素点集合和样本初始法向量输入第二初始神经网络,得到至少一个第二样本中的每个第二样本对应的至少一个面中每个面中的像素点的法向量残差;将至少一个第二样本中的每个第二样本对应的法向量残差与对应的样本法向量残差进行比较;根据比较结果确定第二初始神经网络是否达到预设的第二优化目标;若第二初始神经网络达到第二优化目标,将第二初始神经网络确定为训练完成的法向量残差预测模型。
在这里,可以基于在步骤501中获取的第二样本集合,执行以下训练步骤。
在本实施例中,训练步骤502可以包括子步骤5021、5022、5023和5024。其中:
步骤5021,将第二样本集合中的至少一个第二样本的样本图像、样本像素点集合和样本初始法向量输入第二初始神经网络,得到至少一个第二样本中的每个第二样本对应的至少一个面中每个面中的像素点的法向量残差。
在这里,可以将上述第二样本集合中的至少一个第二样本的样本图像、样本像素点集合和样本初始法向量输入第二初始神经网络,得到上述至少一个第二样本中的每个第二样本对应的至少一个面中每个面中的像素点的法向量残差。其中,上述第二初始神经网络可以是能够根据样本图像、样本图像中用于表征样本对象的样本像素点集合和样本初始法向量得到样本对象的至少一个面中每个面中的像素点的法向量残差的各种神经网络,例如,卷积神经网络、深度神经网络等等。
步骤5022,将至少一个第二样本中的每个第二样本对应的法向量残差与对应的样本法向量残差进行比较。
在这里,可以将上述至少一个第二样本中的每个第二样本对应的法向量残差与对应的样本法向量残差进行比较。即针对上述至少一个第二样本中的每个第二样本,将该第二样本中的样本图像、样本像素点集合和样本初始法向量这三者输入上述第二初始神经网络所得到的法向量残差与该第二样本中的样本法向量残差进行比较。
步骤5023,根据比较结果确定第二初始神经网络是否达到预设的第二优化目标。
在这里,可以根据比较结果确定第二初始神经网络是否达到预设的第二优化目标。作为示例,当一个样本对应的法向量残差与对应的样本法向量残差之间的差异小于预设第二差异阈值时,认为该法向量残差的准确率大于预设的第二准确率阈值。此时,上述第二优化目标可以是指上述第二初始神经网络生成的法向量残差的准确率大于上述第二准确率阈值的比例大于预设的第二比例阈值。若上述第二初始神经网络达到上述第二优化目标,则可以执行步骤5024。
步骤5024,若第二初始神经网络达到第二优化目标,将第二初始神经网络确定为训练完成的法向量残差预测模型。
在这里,若在步骤5023中确定出上述第二初始神经网络达到上述第二优化目标,可以将第二初始神经网络确定为训练完成的法向量残差预测模型。
需要说明的是,上述法向量残差预测模型可以是图像处理方法的执行主体通过上述方式训练得到的,也可以是其他电子设备训练得到的。
本公开的上述实施例提供的方法通过在确定出第二初始神经网络达到预设的第二优化目标时,将第二初始神经网络确定为训练完成的法向量残差预测模型,从而可以使得法向量残差预测模型更加准确地预测出法向量残差。
在一些可选的实现方式中,训练得到上述法向量残差预测模型的步骤还可以包括以下步骤:若上述第二初始神经网络未达到上述第二优化目标,可以调整第二初始神经网络的网络参数,以及使用未用过的样本组成第二样本集合,使用调整后的第二初始神经网络作为第二初始神经网络,继续执行上述训练步骤502(即子步骤5021-5024)。作为示例,可以采用反向传播算法和梯度下降法对上述第二初始神经网络的网络参数进行调整。需要说明的是,反向传播算法和梯度下降法是目前广泛研究和应用的公知技术,在此不再赘述。
进一步参考图6,作为对上述各图所示方法的实现,本公开提供了一种图像处理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图6所示,本实施例的图像处理装置600包括:获取单元601用于获取待处理图像,从待处理图像中提取用于表征目标对象的像素点集合,其中,待处理图像中呈现有目标对象,目标对象包括至少一个面;第一确定单元602用于确定目标对象的至少一个面中每个面的初始法向量;第二确定单元603用于基于至少一个面中每个面的初始法向量、待处理图像和像素点集合,确定至少一个面中每个面中的像素点的最终法向量;处理单元604用于利用至少一个面中每个面中的像素点的最终法向量,对待处理图像中呈现的目标对象所在区域进行处理。
在本实施例中,图像处理装置600的获取单元601、第一确定单元602、第二确定单元603和处理单元604的具体处理可以参考图2对应实施例中的步骤201、步骤202、步骤203和步骤204。
在一些可选的实现方式中,上述第二确定单元603可以进一步用于通过如下方式基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的最终法向量:上述第二确定单元603可以基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的法向量残差;之后,可以利用上述至少一个面中每个面的初始法向量和每个面中的像素点的法向量残差,确定上述至少一个面中每个面中的像素点的最终法向量。
在一些可选的实现方式中,上述目标对象可以为地面;以及上述第一确定单元602可以进一步用于通过如下方式确定上述目标对象的至少一个面中每个面的初始法向量:上述第一确定单元602可以获取目标电子设备在采集上述待处理图像时惯性测量单元测量出的重力方向,将上述重力方向确定为地面的初始法向量,其中,上述目标电子设备为采集到上述待处理图像的电子设备。
在一些可选的实现方式中,上述第一确定单元602可以进一步用于通过如下方式确定上述目标对象的至少一个面中每个面的初始法向量:上述第一确定单元602可以首先将上述待处理图像和上述像素点集合输入预先训练的方位角预测模型中,得到目标方位角,将上述目标方位角确定为上述目标对象的目标面的初始法向量,其中,上述目标方位角为上述目标对象的目标面与采集到上述待处理图像的电子设备的屏幕所在平面之间的夹角;之后,可以将上述目标方位角、上述待处理图像和上述像素点集合输入预先训练的方位角分类模型中,得到方位角分类结果,其中,上述方位角分类结果用于表征上述待处理图像中呈现的上述目标对象的其他面相对于上述目标面的旋转角度;最后,针对上述其他面中的每个面,可以利用上述目标方位角和该面相对于上述目标面的旋转角度,确定该面对应的方位角,将该面对应的方位角确定为该面的初始法向量。
在一些可选的实现方式中,上述第二确定单元603可以进一步用于通过如下方式基于上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合,确定上述至少一个面中每个面中的像素点的法向量残差:上述第二确定单元603可以将上述至少一个面中每个面的初始法向量、上述待处理图像和上述像素点集合输入预先训练的法向量残差预测模型中,得到上述至少一个面中每个面中的像素点的法向量残差。
在一些可选的实现方式中,上述方位角预测模型可以是通过如下方式训练得到的:首先,可以获取第一样本集合,其中,第一样本包括样本图像、样本像素点集合,以及与样本图像和样本像素点集合对应的样本方位角,样本像素点集合为样本图像中用于表征样本对象的像素点集合;之后,可以基于第一样本集合执行以下训练步骤:将第一样本集合中的至少一个第一样本的样本图像和样本像素点集合输入第一初始神经网络,得到上述至少一个第一样本中的每个第一样本对应的方位角;将上述至少一个第一样本中的每个第一样本对应的方位角与对应的样本方位角进行比较;根据比较结果确定第一初始神经网络是否达到预设的第一优化目标;若第一初始神经网络达到上述第一优化目标,将第一初始神经网络确定为训练完成的方位角预测模型。
在一些可选的实现方式中,训练得到上述方位角预测模型的步骤还可以包括:若第一初始神经网络未达到上述第一优化目标,调整第一初始神经网络的网络参数,以及使用未用过的样本组成第一样本集合,使用调整后的第一初始神经网络作为第一初始神经网络,继续执行上述训练步骤。
在一些可选的实现方式中,上述法向量残差预测模型可以是通过如下方式训练得到的:首先,可以获取第二样本集合,其中,第二样本包括样本图像、样本像素点集合、样本图像中呈现的样本对象的至少一个面中每个面的样本初始法向量,以及与样本图像、样本像素点集合和样本初始法向量对应的至少一个面中每个面中的像素点的样本法向量残差,样本像素点集合为样本图像中用于表征样本对象的像素点集合;之后,可以基于第二样本集合执行以下训练步骤:将第二样本集合中的至少一个第二样本的样本图像、样本像素点集合和样本初始法向量输入第二初始神经网络,得到上述至少一个第二样本中的每个第二样本对应的至少一个面中每个面中的像素点的法向量残差;将上述至少一个第二样本中的每个第二样本对应的法向量残差与对应的样本法向量残差进行比较;根据比较结果确定第二初始神经网络是否达到预设的第二优化目标;若第二初始神经网络达到上述第二优化目标,将第二初始神经网络确定为训练完成的法向量残差预测模型。
在一些可选的实现方式中,训练得到上述法向量残差预测模型的步骤还包括:若第二初始神经网络未达到上述第二优化目标,调整第二初始神经网络的网络参数,以及使用未用过的样本组成第二样本集合,使用调整后的第二初始神经网络作为第二初始神经网络,继续执行上述训练步骤。
下面参考图7,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的服务器或终端设备)700的结构示意图。本公开的实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图7示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700可以包括处理装置(例如中央处理器、图形处理器等)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储装置708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有电子设备700操作所需的各种程序和数据。处理装置701、ROM 702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
通常,以下装置可以连接至I/O接口705:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置706;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置707;以及通信装置709。通信装置709可以允许电子设备700与其他设备进行无线或有线通信以交换数据。虽然图7示出了具有各种装置的电子设备700,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图7中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置709从网络上被下载和安装,或者从存储装置708被安装,或者从ROM 702被安装。在该计算机程序被处理装置701执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取待处理图像,从待处理图像中提取用于表征目标对象的像素点集合,其中,待处理图像中呈现有目标对象,目标对象包括至少一个面;确定目标对象的至少一个面中每个面的初始法向量;基于至少一个面中每个面的初始法向量、待处理图像和像素点集合,确定至少一个面中每个面中的像素点的最终法向量;利用至少一个面中每个面中的像素点的最终法向量,对待处理图像中呈现的目标对象所在区域进行处理。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、第一确定单元、第二确定单元和处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一确定单元还可以被描述为“确定目标对象的至少一个面中每个面的初始法向量的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (20)
1.一种图像处理方法,其特征在于,包括:
获取待处理图像,从所述待处理图像中提取用于表征目标对象的像素点集合,其中,所述待处理图像中呈现有所述目标对象,所述目标对象包括至少一个面;
确定所述目标对象的至少一个面中每个面的初始法向量;
基于所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合,确定所述至少一个面中每个面中的像素点的最终法向量;
利用所述至少一个面中每个面中的像素点的最终法向量,对所述待处理图像中呈现的所述目标对象所在区域进行处理。
2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合,确定所述至少一个面中每个面中的像素点的最终法向量,包括:
基于所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合,确定所述至少一个面中每个面中的像素点的法向量残差;
利用所述至少一个面中每个面的初始法向量和每个面中的像素点的法向量残差,确定所述至少一个面中每个面中的像素点的最终法向量。
3.根据权利要求1所述的方法,其特征在于,所述目标对象为地面;以及
所述确定所述目标对象的至少一个面中每个面的初始法向量,包括:
获取目标电子设备在采集所述待处理图像时惯性测量单元测量出的重力方向,将所述重力方向确定为地面的初始法向量,其中,所述目标电子设备为采集到所述待处理图像的电子设备。
4.根据权利要求1所述的方法,其特征在于,所述确定所述目标对象的至少一个面中每个面的初始法向量,包括:
将所述待处理图像和所述像素点集合输入预先训练的方位角预测模型中,得到目标方位角,将所述目标方位角确定为所述目标对象的目标面的初始法向量,其中,所述目标方位角为所述目标对象的目标面与采集到所述待处理图像的电子设备的屏幕所在平面之间的夹角;
将所述目标方位角、所述待处理图像和所述像素点集合输入预先训练的方位角分类模型中,得到方位角分类结果,其中,所述方位角分类结果用于表征所述待处理图像中呈现的所述目标对象的其他面相对于所述目标面的旋转角度;
针对所述其他面中的每个面,利用所述目标方位角和该面相对于所述目标面的旋转角度,确定该面对应的方位角,将该面对应的方位角确定为该面的初始法向量。
5.根据权利要求2所述的方法,其特征在于,所述基于所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合,确定所述至少一个面中每个面中的像素点的法向量残差,包括:
将所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合输入预先训练的法向量残差预测模型中,得到所述至少一个面中每个面中的像素点的法向量残差。
6.根据权利要求4所述的方法,其特征在于,所述方位角预测模型是通过如下方式训练得到的:
获取第一样本集合,其中,第一样本包括样本图像、样本像素点集合,以及与样本图像和样本像素点集合对应的样本方位角,样本像素点集合为样本图像中用于表征样本对象的像素点集合;
基于第一样本集合执行以下训练步骤:将第一样本集合中的至少一个第一样本的样本图像和样本像素点集合输入第一初始神经网络,得到所述至少一个第一样本中的每个第一样本对应的方位角;将所述至少一个第一样本中的每个第一样本对应的方位角与对应的样本方位角进行比较;根据比较结果确定第一初始神经网络是否达到预设的第一优化目标;若第一初始神经网络达到所述第一优化目标,将第一初始神经网络确定为训练完成的方位角预测模型。
7.根据权利要求6所述的方法,其特征在于,训练得到所述方位角预测模型的步骤还包括:
若第一初始神经网络未达到所述第一优化目标,调整第一初始神经网络的网络参数,以及使用未用过的样本组成第一样本集合,使用调整后的第一初始神经网络作为第一初始神经网络,继续执行所述训练步骤。
8.根据权利要求5所述的方法,其特征在于,所述法向量残差预测模型是通过如下方式训练得到的:
获取第二样本集合,其中,第二样本包括样本图像、样本像素点集合、样本图像中呈现的样本对象的至少一个面中每个面的样本初始法向量,以及与样本图像、样本像素点集合和样本初始法向量对应的至少一个面中每个面中的像素点的样本法向量残差,样本像素点集合为样本图像中用于表征样本对象的像素点集合;
基于第二样本集合执行以下训练步骤:将第二样本集合中的至少一个第二样本的样本图像、样本像素点集合和样本初始法向量输入第二初始神经网络,得到所述至少一个第二样本中的每个第二样本对应的至少一个面中每个面中的像素点的法向量残差;将所述至少一个第二样本中的每个第二样本对应的法向量残差与对应的样本法向量残差进行比较;根据比较结果确定第二初始神经网络是否达到预设的第二优化目标;若第二初始神经网络达到所述第二优化目标,将第二初始神经网络确定为训练完成的法向量残差预测模型。
9.根据权利要求8所述的方法,其特征在于,训练得到所述法向量残差预测模型的步骤还包括:
若第二初始神经网络未达到所述第二优化目标,调整第二初始神经网络的网络参数,以及使用未用过的样本组成第二样本集合,使用调整后的第二初始神经网络作为第二初始神经网络,继续执行所述训练步骤。
10.一种图像处理装置,其特征在于,包括:
获取单元,用于获取待处理图像,从所述待处理图像中提取用于表征目标对象的像素点集合,其中,所述待处理图像中呈现有所述目标对象,所述目标对象包括至少一个面;
第一确定单元,用于确定所述目标对象的至少一个面中每个面的初始法向量;
第二确定单元,用于基于所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合,确定所述至少一个面中每个面中的像素点的最终法向量;
处理单元,用于利用所述至少一个面中每个面中的像素点的最终法向量,对所述待处理图像中呈现的所述目标对象所在区域进行处理。
11.根据权利要求10所述的装置,其特征在于,所述第二确定单元进一步用于通过如下方式基于所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合,确定所述至少一个面中每个面中的像素点的最终法向量:
基于所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合,确定所述至少一个面中每个面中的像素点的法向量残差;
利用所述至少一个面中每个面的初始法向量和每个面中的像素点的法向量残差,确定所述至少一个面中每个面中的像素点的最终法向量。
12.根据权利要求10所述的装置,其特征在于,所述目标对象为地面;以及
所述第一确定单元进一步用于通过如下方式确定所述目标对象的至少一个面中每个面的初始法向量:
获取目标电子设备在采集所述待处理图像时惯性测量单元测量出的重力方向,将所述重力方向确定为地面的初始法向量,其中,所述目标电子设备为采集到所述待处理图像的电子设备。
13.根据权利要求10所述的装置,其特征在于,所述第一确定单元进一步用于通过如下方式确定所述目标对象的至少一个面中每个面的初始法向量:
将所述待处理图像和所述像素点集合输入预先训练的方位角预测模型中,得到目标方位角,将所述目标方位角确定为所述目标对象的目标面的初始法向量,其中,所述目标方位角为所述目标对象的目标面与采集到所述待处理图像的电子设备的屏幕所在平面之间的夹角;
将所述目标方位角、所述待处理图像和所述像素点集合输入预先训练的方位角分类模型中,得到方位角分类结果,其中,所述方位角分类结果用于表征所述待处理图像中呈现的所述目标对象的其他面相对于所述目标面的旋转角度;
针对所述其他面中的每个面,利用所述目标方位角和该面相对于所述目标面的旋转角度,确定该面对应的方位角,将该面对应的方位角确定为该面的初始法向量。
14.根据权利要求11所述的装置,其特征在于,所述第二确定单元进一步用于通过如下方式基于所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合,确定所述至少一个面中每个面中的像素点的法向量残差:
将所述至少一个面中每个面的初始法向量、所述待处理图像和所述像素点集合输入预先训练的法向量残差预测模型中,得到所述至少一个面中每个面中的像素点的法向量残差。
15.根据权利要求13所述的装置,其特征在于,所述方位角预测模型是通过如下方式训练得到的:
获取第一样本集合,其中,第一样本包括样本图像、样本像素点集合,以及与样本图像和样本像素点集合对应的样本方位角,样本像素点集合为样本图像中用于表征样本对象的像素点集合;
基于第一样本集合执行以下训练步骤:将第一样本集合中的至少一个第一样本的样本图像和样本像素点集合输入第一初始神经网络,得到所述至少一个第一样本中的每个第一样本对应的方位角;将所述至少一个第一样本中的每个第一样本对应的方位角与对应的样本方位角进行比较;根据比较结果确定第一初始神经网络是否达到预设的第一优化目标;若第一初始神经网络达到所述第一优化目标,将第一初始神经网络确定为训练完成的方位角预测模型。
16.根据权利要求15所述的装置,其特征在于,训练得到所述方位角预测模型的步骤还包括:
若第一初始神经网络未达到所述第一优化目标,调整第一初始神经网络的网络参数,以及使用未用过的样本组成第一样本集合,使用调整后的第一初始神经网络作为第一初始神经网络,继续执行所述训练步骤。
17.根据权利要求14所述的装置,其特征在于,所述法向量残差预测模型是通过如下方式训练得到的:
获取第二样本集合,其中,第二样本包括样本图像、样本像素点集合、样本图像中呈现的样本对象的至少一个面中每个面的样本初始法向量,以及与样本图像、样本像素点集合和样本初始法向量对应的至少一个面中每个面中的像素点的样本法向量残差,样本像素点集合为样本图像中用于表征样本对象的像素点集合;
基于第二样本集合执行以下训练步骤:将第二样本集合中的至少一个第二样本的样本图像、样本像素点集合和样本初始法向量输入第二初始神经网络,得到所述至少一个第二样本中的每个第二样本对应的至少一个面中每个面中的像素点的法向量残差;将所述至少一个第二样本中的每个第二样本对应的法向量残差与对应的样本法向量残差进行比较;根据比较结果确定第二初始神经网络是否达到预设的第二优化目标;若第二初始神经网络达到所述第二优化目标,将第二初始神经网络确定为训练完成的法向量残差预测模型。
18.根据权利要求17所述的装置,其特征在于,训练得到所述法向量残差预测模型的步骤还包括:
若第二初始神经网络未达到所述第二优化目标,调整第二初始神经网络的网络参数,以及使用未用过的样本组成第二样本集合,使用调整后的第二初始神经网络作为第二初始神经网络,继续执行所述训练步骤。
19.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。
20.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-9中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110262483.2A CN113034570A (zh) | 2021-03-09 | 2021-03-09 | 图像处理方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110262483.2A CN113034570A (zh) | 2021-03-09 | 2021-03-09 | 图像处理方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113034570A true CN113034570A (zh) | 2021-06-25 |
Family
ID=76469363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110262483.2A Pending CN113034570A (zh) | 2021-03-09 | 2021-03-09 | 图像处理方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113034570A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115830044A (zh) * | 2023-01-10 | 2023-03-21 | 广东省测绘产品质量监督检验中心 | 一种图像分割方法、装置、电子设备及存储介质 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102147927A (zh) * | 2010-02-05 | 2011-08-10 | 新奥特(北京)视频技术有限公司 | 一种地形纹理贴图的处理方法和处理装置 |
US20120099782A1 (en) * | 2010-10-20 | 2012-04-26 | Samsung Electronics Co., Ltd. | Image processing apparatus and method |
CN108629800A (zh) * | 2017-03-20 | 2018-10-09 | 北京三星通信技术研究有限公司 | 平面确定方法及增强现实显示信息的显示方法、相应装置 |
CN108648224A (zh) * | 2018-05-18 | 2018-10-12 | 杭州电子科技大学 | 一种基于人工神经网络的实时场景布局识别及重建的方法 |
JP2018182700A (ja) * | 2017-04-21 | 2018-11-15 | キヤノン株式会社 | 画像処理装置およびその制御方法、プログラム、並びに記憶媒体 |
CN109521879A (zh) * | 2018-11-19 | 2019-03-26 | 网易(杭州)网络有限公司 | 交互式投影控制方法、装置、存储介质及电子设备 |
CN109635639A (zh) * | 2018-10-31 | 2019-04-16 | 百度在线网络技术(北京)有限公司 | 交通标识的位置检测方法、装置、设备和存储介质 |
CN109985384A (zh) * | 2019-03-21 | 2019-07-09 | 网易(杭州)网络有限公司 | 贴图动态调整方法及装置 |
CN110021071A (zh) * | 2018-12-25 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种增强现实应用中的渲染方法、装置及设备 |
CN110161496A (zh) * | 2019-05-27 | 2019-08-23 | 华中科技大学 | 基于极化毫米波辐射的目标表面法向量获取方法及系统 |
CN110807798A (zh) * | 2018-08-03 | 2020-02-18 | 华为技术有限公司 | 图像识别方法、系统、相关设备以及计算机可读存储介质 |
CN111142514A (zh) * | 2019-12-11 | 2020-05-12 | 深圳市优必选科技股份有限公司 | 一种机器人及其避障方法和装置 |
CN111311723A (zh) * | 2020-01-22 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 像素点识别及光照渲染方法、装置、电子设备和存储介质 |
CN111369680A (zh) * | 2020-02-28 | 2020-07-03 | 当家移动绿色互联网技术集团有限公司 | 生成建筑物的三维图像的方法及装置 |
CN111815750A (zh) * | 2020-06-30 | 2020-10-23 | 深圳市商汤科技有限公司 | 对图像打光的方法及装置、电子设备和存储介质 |
-
2021
- 2021-03-09 CN CN202110262483.2A patent/CN113034570A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102147927A (zh) * | 2010-02-05 | 2011-08-10 | 新奥特(北京)视频技术有限公司 | 一种地形纹理贴图的处理方法和处理装置 |
US20120099782A1 (en) * | 2010-10-20 | 2012-04-26 | Samsung Electronics Co., Ltd. | Image processing apparatus and method |
CN108629800A (zh) * | 2017-03-20 | 2018-10-09 | 北京三星通信技术研究有限公司 | 平面确定方法及增强现实显示信息的显示方法、相应装置 |
JP2018182700A (ja) * | 2017-04-21 | 2018-11-15 | キヤノン株式会社 | 画像処理装置およびその制御方法、プログラム、並びに記憶媒体 |
CN108648224A (zh) * | 2018-05-18 | 2018-10-12 | 杭州电子科技大学 | 一种基于人工神经网络的实时场景布局识别及重建的方法 |
CN110807798A (zh) * | 2018-08-03 | 2020-02-18 | 华为技术有限公司 | 图像识别方法、系统、相关设备以及计算机可读存储介质 |
CN109635639A (zh) * | 2018-10-31 | 2019-04-16 | 百度在线网络技术(北京)有限公司 | 交通标识的位置检测方法、装置、设备和存储介质 |
CN109521879A (zh) * | 2018-11-19 | 2019-03-26 | 网易(杭州)网络有限公司 | 交互式投影控制方法、装置、存储介质及电子设备 |
CN110021071A (zh) * | 2018-12-25 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 一种增强现实应用中的渲染方法、装置及设备 |
CN109985384A (zh) * | 2019-03-21 | 2019-07-09 | 网易(杭州)网络有限公司 | 贴图动态调整方法及装置 |
CN110161496A (zh) * | 2019-05-27 | 2019-08-23 | 华中科技大学 | 基于极化毫米波辐射的目标表面法向量获取方法及系统 |
CN111142514A (zh) * | 2019-12-11 | 2020-05-12 | 深圳市优必选科技股份有限公司 | 一种机器人及其避障方法和装置 |
CN111311723A (zh) * | 2020-01-22 | 2020-06-19 | 腾讯科技(深圳)有限公司 | 像素点识别及光照渲染方法、装置、电子设备和存储介质 |
CN111369680A (zh) * | 2020-02-28 | 2020-07-03 | 当家移动绿色互联网技术集团有限公司 | 生成建筑物的三维图像的方法及装置 |
CN111815750A (zh) * | 2020-06-30 | 2020-10-23 | 深圳市商汤科技有限公司 | 对图像打光的方法及装置、电子设备和存储介质 |
Non-Patent Citations (5)
Title |
---|
RAFAEL FERRARI PINTO ET AL.: "A cost effective open-source three-dimensional reconstruction system and trajectory analysis for mobile robots", 《5TH ISSNIP-IEEE BIOSIGNALS AND BIOROBOTICS CONFERENCE (2014): BIOSIGNALS AND ROBOTICS FOR BETTER AND SAFER LIVING (BRC)》, 21 August 2014 (2014-08-21), pages 1 - 5 * |
YONGLIN TIAN ET AL.: "Adaptive and Azimuth-Aware Fusion Network of Multimodal Local Features for 3D Object Detection", 《ARXIV:1910.04392V2 [CS.CV] 》, 3 June 2020 (2020-06-03), pages 1 - 13 * |
冼楚华等: "基于多尺度卷积网络的单幅图像的点法向估计", 《华南理工大学学报( 自然科学版)》, vol. 46, no. 12, 31 December 2018 (2018-12-31), pages 1 - 9 * |
樊帆等: "有效视角图像切片嵌合法全息体视图的数值重构", 《中国激光》, vol. 45, no. 12, 31 December 2018 (2018-12-31), pages 1 - 8 * |
湛逸飞等: "基于LiDAR点云法向量稳健估计的室内平面图自动生成方法", 《地理信息世界》, vol. 24, no. 1, 28 February 2017 (2017-02-28), pages 92 - 96 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115830044A (zh) * | 2023-01-10 | 2023-03-21 | 广东省测绘产品质量监督检验中心 | 一种图像分割方法、装置、电子设备及存储介质 |
CN115830044B (zh) * | 2023-01-10 | 2024-04-05 | 广东省测绘产品质量监督检验中心 | 一种图像分割方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109858445B (zh) | 用于生成模型的方法和装置 | |
CN109800732B (zh) | 用于生成漫画头像生成模型的方法和装置 | |
CN110413812B (zh) | 神经网络模型的训练方法、装置、电子设备及存储介质 | |
CN112488783B (zh) | 图像采集方法、装置和电子设备 | |
CN110059623B (zh) | 用于生成信息的方法和装置 | |
CN109754464B (zh) | 用于生成信息的方法和装置 | |
CN112650790A (zh) | 目标点云平面确定方法,装置,电子设备及存储介质 | |
CN110008926B (zh) | 用于识别年龄的方法和装置 | |
CN112257582A (zh) | 脚部姿态确定方法、装置、设备和计算机可读介质 | |
CN112818898B (zh) | 模型训练方法、装置和电子设备 | |
CN113038176B (zh) | 视频抽帧方法、装置和电子设备 | |
CN113034570A (zh) | 图像处理方法、装置和电子设备 | |
CN110555861B (zh) | 光流计算方法、装置及电子设备 | |
CN111967584A (zh) | 生成对抗样本的方法、装置、电子设备及计算机存储介质 | |
CN111586295B (zh) | 图像生成方法、装置和电子设备 | |
CN111680754B (zh) | 图像分类方法、装置、电子设备及计算机可读存储介质 | |
CN110209851B (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN114419292A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN115272760A (zh) | 适用于森林火灾烟雾检测的小样本烟雾图像细分类方法 | |
CN110084835B (zh) | 用于处理视频的方法和装置 | |
CN115086538A (zh) | 一种拍摄位置确定方法、装置、设备及介质 | |
CN113255812A (zh) | 视频边框检测方法、装置和电子设备 | |
CN112418233A (zh) | 图像处理方法、装置、可读介质及电子设备 | |
CN110717467A (zh) | 头部姿势的估计方法、装置、设备及存储介质 | |
CN111209050A (zh) | 用于切换电子设备的工作模式的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |