CN117152385A - 图像处理方法、装置、电子设备及存储介质 - Google Patents
图像处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117152385A CN117152385A CN202210307605.XA CN202210307605A CN117152385A CN 117152385 A CN117152385 A CN 117152385A CN 202210307605 A CN202210307605 A CN 202210307605A CN 117152385 A CN117152385 A CN 117152385A
- Authority
- CN
- China
- Prior art keywords
- special effect
- target
- video frame
- effect model
- main body
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 24
- 230000000694 effects Effects 0.000 claims abstract description 175
- 238000000034 method Methods 0.000 claims abstract description 41
- 238000012545 processing Methods 0.000 claims abstract description 27
- 230000003287 optical effect Effects 0.000 claims description 31
- 239000011159 matrix material Substances 0.000 claims description 29
- 230000009466 transformation Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 claims description 7
- 238000013519 translation Methods 0.000 claims description 7
- 238000009877 rendering Methods 0.000 claims description 6
- 230000009471 action Effects 0.000 abstract description 6
- 230000000007 visual effect Effects 0.000 abstract description 6
- 238000006243 chemical reaction Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000016776 visual perception Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/003—Navigation within 3D models or images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/006—Mixed reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/20—Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/20—Indexing scheme for editing of 3D models
- G06T2219/2016—Rotation, translation, scaling
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本公开实施例提供了一种图像处理方法、装置、电子设备及存储介质,该方法包括:在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型;根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置;将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧。本公开实施例的技术方案,使AR场景内的特效模型能够对视角转换的动作进行响应,即在显示界面中的画面发生变化时,使特效模型时刻与AR场景内各物体间的相对位置保持不变,从而使画面呈现出虚拟的模型完全融入到现实世界中的视觉效果,提高了用户的观看体验。
Description
技术领域
本公开实施例涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、电子设备及存储介质。
背景技术
随着图像处理技术的不断发展,相关应用软件中集成的图像处理功能也不断丰富,例如,应用可以根据用户需求调用多种特效模型,并将其展示在增强现实(AugmentedReality,AR)场景中。
然而,现有技术提供的方案中,当模型展示在AR场景中后,若摄像装置的拍摄视角发生变化,并导致显示界面中的画面发生适应性改变时,模型却无法对视角转换动作进行响应,也即是说,模型会依然静止展示于显示界面中。因此,模型无法与AR场景内各物体的相对位置保持不变,特效呈现给用户的视觉观感较差。
发明内容
本公开提供一种图像处理方法、装置、电子设备及存储介质,在显示界面中的画面发生变化时,使特效模型时刻与AR场景内各物体间的相对位置保持不变,提高了用户的观看体验。
第一方面,本公开实施例提供了一种图像处理方法,包括:
在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型;
根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置;
将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧。
第二方面,本公开实施例还提供了一种图像处理装置,包括:
目标主体检测模块,用于在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型;
目标显示位置确定模块,用于根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置;
显示模块,用于将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧。
第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例任一所述的图像处理方法。
第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例任一所述的图像处理方法。
本公开实施例的技术方案,在检测到于显示界面上的待处理主体为目标主体时,为目标主体添加AR特效模型,从而将特效模型展示于显示界面上,根据当前视频帧以及前一历史视频帧,确定AR特效模型在当前视频帧中的目标显示位置,进一步的,将AR特效模型显示在目标显示位置处,得到与当前视频帧相对应的目标特效视频帧,从而使AR场景内的特效模型能够对视角转换的动作进行响应,即在显示界面中的画面发生变化时,使特效模型时刻与AR场景内各物体间的相对位置保持不变,从而使画面呈现出虚拟的模型完全融入到现实世界中的视觉效果,提高了用户的观看体验。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例一所提供的一种图像处理方法流程示意图;
图2为本公开实施例二所提供的一种图像处理装置结构示意图;
图3为本公开实施例三所提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
在介绍本技术方案之前,可以先对本公开实施例的应用场景进行示例性说明。示例性的,当用户通过应用软件拍摄视频时,可以基于应用内置的功能,在所拍摄的视频中添加一些AR特效模型,进一步的,当用户拍摄的角度发生变化时,如果画面中添加的特效模型依然保持静止,则会使用户产生特效与所拍摄的现实画面之间出现割裂的感觉,即,特效模型无法完全融入到AR场景中。此时,可以根据本实施例的技术方案,在用户改变拍摄角度而导致显示界面所呈现的画面发生变化时,特效模型会时刻与AR场景内的各物体间的相对位置保持不变,从而提高用户的观看体验。
实施例一
图1为本公开实施例一所提供的一种图像处理方法流程示意图,本公开实施例适用于在显示界面中的画面发生变化时,使AR特效模型时刻与AR场景内各物体间的相对位置保持不变的情形,该方法可以由图像处理装置来执行,该装置可以通过软件和/或硬件的形式实现,可选的,通过电子设备来实现,该电子设备可以是移动终端、PC端或服务器等。
如图1所示,所述方法包括:
S110、在检测到于显示界面上的待处理主体为目标主体时,为目标主体添加AR特效模型。
其中,执行本公开实施例提供的图像处理方法的装置,可以集成在支持特效视频处理功能的应用软件中,且该软件可以安装至电子设备中,可选的,电子设备可以是移动终端或者PC端等。应用软件可以是对图像/视频处理的一类软件,其具体的应用软件在此不再一一赘述,只要可以实现图像/视频处理即可。还可以是专门研发的应用程序,来实现添加特效并将特效进行展示的软件中,亦或是集成在相应的页面中,用户可以通过PC端中集成的页面来实现对特效视频的处理。
在本实施例中,应用可以预先存储与多种物体相对应的特征点数据,可以理解,这些物体即是目标主体,例如,一座雕塑或一幅油画。需要说明的是,目标主体可以是一个或多个,其具体的数量与实际需求相关,同时,目标主体相关的特征点数据至少用于与显示界面中物体的特征点数据进行匹配。在实际应用过程中,应用还可以集成预先训练好的图像识别算法,该算法用于对显示界面中的内容进行识别,从而确定画面中是否包含目标物体,本领域技术人员应当理解,图像识别算法可以是神经网络模型,在将其集成至应用之前,需要先基于相应的训练集和验证集进行训练,当算法的损失函数收敛时,表明模型训练完毕可以在应用中进行部署,其具体的训练过程在本实施例中不再赘述。
在此基础上,当用户通过终端设备上的摄像装置拍摄得到相应的视频画面时,应用即可对显示界面中的内容进行实时检测,可以理解,画面中显示的任意物体都可以是待处理主体。可选的,当检测到显示界面中包括待处理主体,并根据待处理主体的待匹配特征点数据确定为目标主体时,调取预先设置的AR特效模型;将AR特效模型添加至目标主体,下面对该过程进行说明。
具体的,应用可以先对画面内容进行检测,确定画面中是否包含至少一个待处理主体,进一步的,当确定画面中存在待处理主体时,可以通过调用预先编写的特征点确定程序,确定出界面中各物体相应的特征点信息,并根据这些特征点信息以及预先存储的目标主体相对应的特征点信息,计算出两者之间的相似度,当相似度达到预设相似度阈值(如95%)时,表明特征点信息匹配成功,从而确定当前画面内包含有目标主体;或者,应用可以由预先训练好的图像识别算法对当前时刻的视频帧进行处理,根据算法的输出(即对当前视频帧的识别结果)确定画面内的待识别物体是否为目标主体。本领域技术人员应当理解,具体的检测画面内的待处理主体是否为目标主体的方式还可以有多种,本公开实施例在此不做具体的限定。
当然,在实际应用过程中,目标主体的特征点数据或预先训练好的图像识别算法可以存储在云服务器中,在此基础上,当应用在显示界面中检测到待处理主体后,可以基于移动终端将待处理主体对应的特征点信息或当前视频帧上传至云服务器,由云服务来执行上述确定目标主体的过程。进一步的,当云端将处理结果反馈至移动终端后,应用即可确定出当前画面内是否包含目标主体,可以理解,这种方式不仅有利于提高对目标主体的检测效率,也减少了应用对移动终端计算资源的占用。
在本实施例中,当检测到显示界面中包含目标主体时,应用即可调用预先设置的AR特效模型,并将其添加至目标主体上,其中,AR特效模型可以是预先构建的2D模型或3D模型,该模型可以在AR场景内进行展示,可以理解为,AR增强现实技术作为一种用于实现真实环境与虚拟物体之间的重叠的技术,可以使虚拟的AR特效模型与真实的物体在一幅画面内同时存在。进一步的,在模型构建完毕后,可以为其设置反映某种目标主体的特定标识,从而实现模型与目标主体之间的关联。例如,当目标主体为一座雕塑时,其对应的AR特效模型即是形状颜色等属性与实际雕塑相一致的虚拟3D模型,同时,将雕塑的名称设置为模型的标识,以便于应用在画面内检测到目标物体时,对该模型进行调用。
进一步的,在调用AR特效模型后,应用即可将其添加至目标主体上。具体来说,应用可以在显示界面中的特定位置预先部署用于添加AR特效模型的信息显示框,基于此,便可以将模型添加在显示界面中与目标主体相一致的位置上,或者,将模型添加在显示界面中目标主体附近的位置上,本领域技术人员应当理解,决定模型实际显示位置的信息显示框可以根据实际需求,预先部署在显示界面中的任意位置,本公开实施例在此不做具体的限定。
示例性的,应用可以预先为展览馆或博物馆内的各物体构建相应的AR特效模型,并将个模型与相应的物体进行关联。基于此,当用户参观游览展览馆或博物馆,并通过终端设备的摄像装置拍摄得到馆内画面时,应用即可对画面内容进行实时检测,当检测到画面内出现一座作为目标主体的雕塑时,即可通过雕塑名称与AR各特效模型的标签进行比对,从而选择出该雕塑对应的模型,并将其展示在显示界面上,使用户既可以在馆内参观真实的雕塑,也可以在移动终端上参观虚拟的雕塑模型。当然,在实际应用过程中,在将AR特效模型添加至目标主体时,应用还可以将与AR特效模型相关联的文本信息一同展示在显示界面上,或者,将与AR特效模型相关联的语音信息通过移动终端进行播放,从而实现对目标主体进行说明与讲解的效果,本公开实施例对此不再赘述。
S120、根据当前视频帧以及前一历史视频帧,确定AR特效模型在当前视频帧中的目标显示位置。
在本实施例中,应用将AR特效模型添加至显示界面中的目标主体后,模型即可在后续过程中长时间展示于显示界面上,此时,为了在用户调整拍摄视角而导致画面内容发生变化时,使AR特效模型时刻与AR场景内各物体间相对位置保持不变,还需要确定出AR特效模型在画面内容发生变化时的视频帧内的显示位置。
可选的,确定前一历史视频帧的历史关键点,在当前视频帧中的待匹配关键点,得到至少一个关键点组;根据至少一个关键点组,确定光流场信息;根据光流场信息,确定AR特效模型在当前视频帧中的目标显示位置。
其中,在基于移动终端摄像装置拍摄得到的视频中,各视频帧都关联有相对应的时间戳,在此基础上,当将用户调整视角后拍摄得到的视频帧作为当前视频帧时,即可根据其对应的时间戳确定出上一时刻的视频帧,可以理解,该视频帧即是前一历史视频帧。
进一步的,在应用确定出前一历史视频帧后,即可在该视频帧的画面内确定出历史关键点。其中,历史关键点即是用于反映AR特效模型显示位置的点位,其数量可以是一个或多个,例如,在前一历史视频帧中,对于展示于显示界面中的、与作为目标主体的雕塑相对应的3D雕塑模型来说,其历史关键点可以是AR场景所对应的三维空间坐标系内的十个坐标值,可以理解,这十个坐标值即可准确地反映出3D雕塑模型在AR场景内的显示位置。
相应的,在当前视频帧中,同样存在反映AR特效模型显示位置的点位,这些点位即是待匹配关键点,其中,待匹配关键点的数量与前一历史视频帧中历史关键点的数量相一致。基于此,可以将两个视频帧对应的关键点数据进行结合,从而得到至少一个关键点组,本领域技术人员应当理解,当各视频帧中的关键点分别只有一个时,所得到的关键点组也只有一个,当各视频帧中的关键的分别有多个时,所得到的关键点组也有多个,本公开实施例在此不再赘述。
在本实施例中,在得到至少一个关键点组后,应用即可基于这些数据确定出相应的光流场信息,可选的,根据每个关键点组中的历史关键点和相应的待匹配关键点,确定目标变换矩阵,作为光流场信息。
其中,目标变换矩阵即是反映历史关键点与待匹配关键点之间关联关系的矩阵,至少用于使应用确定如何在当前视频帧中渲染AR特效模型,可以理解为,应用根据目标变换矩阵,可以确定出AR特效模型对应的各像素点在当前视频帧中的渲染位置。具体的,在目标变换矩阵中包括平移矩阵和旋转矩阵,从可视化的角度来说,平移矩阵用于实现对AR特效模型在当前视频帧中展示位置的变化,旋转矩阵则用于实现AR特效模型在当前视频帧中展示角度的变化。
在本实施例中,当基于前一历史视频帧与当前视频帧确定出至少一个关键点组后,即可根据这些数据计算得到目标变换矩阵,并将该矩阵作为光流场信息,其中,光流场是指图像中所有像素点构成的一种二维瞬时速度场,其中的二维速度矢量是场景中可见点的三维速度矢量在成像表面的投影。可以理解为,光流不仅包含了被观察物体的运动信息,而且还包含相关物体三维结构的丰富信息。
示例性的,当确定出作为AR特效模型的3D雕塑模型在前一历史视频帧中对应的历史关键点,以及在当前视频帧中对应的待匹配关键点后,即可计算得到该目标变换矩阵,根据目标变换矩阵中的平移矩阵以及旋转矩阵,应用即可确定在当前视频帧中如何将该3D雕塑模型进行平移或旋转,进而在后续过程中确定出该3D雕塑模型对应的各像素点在当前视频帧中的目标显示位置。
在确定AR特效模型在当前视频帧中的目标显示位置的过程中,可以根据光流场信息以及AR特效模型在前一历史视频帧中的历史位置信息,确定AR特效模型在当前视频帧中的目标显示位置。
继续以上述示例进行说明,当AR特效模型为3D雕塑模型,并根据相邻两视频帧对应的关键点确定出光流场信息后,应用即可在前一历史视频帧中,确定出3D雕塑模型各个像素点在AR场景所对应三维空间坐标系内的坐标值,并将这些坐标值信息作为该AR特效模型的历史位置信息。进一步的,根据目标变换矩阵中的平移矩阵以及旋转矩阵,计算出3D雕塑模型各像素点在当前视频帧中的新的坐标值,可以理解,根据计算得到的各像素点的坐标值信息,应用即可确定出该3D雕塑模型在当前视频帧中的显示位置。
S130、将AR特效模型显示在目标显示位置处,得到与当前视频帧相对应的目标特效视频帧。
在本实施例中,当确定出AR特效模型在当前视频帧中的目标显示位置后,应用即可在当前视频帧中对AR特效模型进行渲染。可选的,在目标显示位置渲染出AR特效模型,以保持AR特效模型与目标主体的相对位置不变,得到目标特效视频帧。
具体来说,当确定出AR特效模型各像素点在当前视频帧中的新的坐标值后,应用可以将其传递给渲染引擎,从而在当前视频帧内对该模型进行渲染。其中,渲染引擎可以是控制图形处理器(Graphics Processing Unit,GPU)对相关图像进行渲染的程序,可以理解,在本实施例中,当将特效模型各像素点的坐标值传递给渲染引擎后,在渲染引擎的驱动下,计算机即可完成将AR特效模型所反映的图像绘制到目标显示界面上的任务。本领域技术人员应当理解,在渲染的过程中,应用还需要确定各像素点的RGB值等信息,从而确定AR特效模型的色彩信息,本公开实施例对此不再赘述。
在本实施例中,当AR特效模型在当前视频帧内渲染完毕并展示于显示界面中后,从用户的视角来看,在当前视频帧与前一历史视频帧中,虽然目标主体的显示位置发生变化,但其对应的AR特效模型的显示位置同样会发生适应性改变,也即是说,AR特效模型会呈现出与画面中的目标物体间的相对位置保持不变的视觉效果。
继续以上述示例进行说明,在前一历史视频帧中,画面中的雕塑以一种朝向展示于显示界面中的上方,在当前视频帧中,该雕塑以另一种朝向展示于显示界面中的下方。相应的,该雕塑关联的3D雕塑模型在前一历史视频帧中,同样会以特定的朝向展示于显示界面中的上方,也即是说,展示于作为目标主体的雕塑的附近区域,而在当前视频帧中,该3D雕塑模型则同样以另一种朝向展示于显示界面中的下方,即依然展示于作为目标主体的雕塑的附近区域,且与雕塑之间的相对位置保持不变。
在本实施例中,在得到目标特效视频帧后,还可以通过对各目标特效视频帧拼接处理,确定目标特效视频。
具体来说,在实际应用过程中,用户可以通过移动终端上的摄像装置采集得到多个视频帧,可以理解,只要视频帧画面内存在目标主体,应用即可按照本实施例的方案,分别在每一个视频帧中渲染出与目标主体相对应的AR特效模型,其中,所生成的包含有AR特效模型画面的视频帧即是特效视频帧。
进一步的,由于各视频帧携带有相应的时间戳,在AR特效模型于各视频帧内渲染完毕得到相应的特效视频帧后,应用即可按照各视频帧携带的时间戳确定出多幅特效视频帧对应的序列,从而根据序列将多幅特效视频帧进行拼接,得到目标视频。可以理解,在目标特效视频中,目标主体及其相对应的AR特效模型可以以动态的形式展示出来,同时在展示的过程中,目标主体的显示位置以及AR特效模型的显示位置虽然可以发生变化,但两者之间的相对位置会时刻保持静止。
本公开实施例的技术方案,在检测到于显示界面上的待处理主体为目标主体时,为目标主体添加AR特效模型,从而将特效模型展示于显示界面上,根据当前视频帧以及前一历史视频帧,确定AR特效模型在当前视频帧中的目标显示位置,进一步的,将AR特效模型显示在目标显示位置处,得到与当前视频帧相对应的目标特效视频帧,从而使AR场景内的特效模型能够对视角转换的动作进行响应,即在显示界面中的画面发生变化时,使特效模型时刻与AR场景内各物体间的相对位置保持不变,从而使画面呈现出虚拟的模型完全融入到现实世界中的视觉效果,提高了用户的观看体验。
实施例二
图2为本公开实施例二所提供的一种图像处理装置结构示意图,如图2所示,所述装置包括:目标主体检测模块210、目标显示位置确定模块220以及显示模块230。
目标主体检测模块210,用于在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型。
目标显示位置确定模块220,用于根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置。
显示模块230,用于将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧。
在上述各技术方案的基础上,目标主体检测模块210包括特效模型调取单元以及特效模型添加单元。
特效模型调取单元,用于当检测到显示界面中包括待处理主体,并根据所述待处理主体的待匹配特征点数据确定为目标主体时,调取预先设置的AR特效模型。
特效模型添加单元,用于将所述AR特效模型添加至所述目标主体。
在上述各技术方案的基础上,目标显示位置确定模块220包括关键点组确定单元、光流场信息确定单元以及目标显示位置确定单元。
关键点组确定单元,用于确定所述前一历史视频帧的历史关键点,在所述当前视频帧中的待匹配关键点,得到至少一个关键点组。
光流场信息确定单元,用于根据所述至少一个关键点组,确定光流场信息。
目标显示位置确定单元,用于根据所述光流场信息,确定所述AR特效模型在所述当前视频帧中的目标显示位置。
可选的,光流场信息确定单元,还用于根据每个关键点组中的历史关键点和相应的待匹配关键点,确定目标变换矩阵,作为所述光流场信息;其中,所述目标变换矩阵包括平移矩阵和旋转矩阵。
可选的,目标显示位置确定单元,还用于根据所述光流场信息以及所述AR特效模型在前一历史视频帧中的历史位置信息,确定所述AR特效模型在所述当前视频帧中的目标显示位置。
可选的,显示模块230,还用于在所述目标显示位置渲染出所述AR特效模型,以保持所述AR特效模型与所述目标主体的相对位置不变,得到所述目标特效视频帧。
在上述各技术方案的基础上,图像处理装置还包括目标特效视频确定模块。
目标特效视频确定模块,用于通过对各目标特效视频帧拼接处理,确定目标特效视频。
本实施例所提供的技术方案,在检测到于显示界面上的待处理主体为目标主体时,为目标主体添加AR特效模型,从而将特效模型展示于显示界面上,根据当前视频帧以及前一历史视频帧,确定AR特效模型在当前视频帧中的目标显示位置,进一步的,将AR特效模型显示在目标显示位置处,得到与当前视频帧相对应的目标特效视频帧,从而使AR场景内的特效模型能够对视角转换的动作进行响应,即在显示界面中的画面发生变化时,使特效模型时刻与AR场景内各物体间的相对位置保持不变,从而使画面呈现出虚拟的模型完全融入到现实世界中的视觉效果,提高了用户的观看体验。
本公开实施例所提供的图像处理装置可执行本公开任意实施例所提供的图像处理方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,上述装置所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本公开实施例的保护范围。
实施例三
图3为本公开实施例三所提供的一种电子设备的结构示意图。下面参考图3,其示出了适于用来实现本公开实施例的电子设备(例如图3中的终端设备或服务器)300的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图案处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置306加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。编辑/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的编辑装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置306被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
本公开实施例提供的电子设备与上述实施例提供的图像处理方法属于同一发明构思,未在本实施例中详尽描述的技术细节可参见上述实施例,并且本实施例与上述实施例具有相同的有益效果。
实施例四
本公开实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例所提供的图像处理方法。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型;
根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置;
将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,【示例一】提供了一种图像处理方法,该方法包括:
在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型;
根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置;
将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧。
根据本公开的一个或多个实施例,【示例二】提供了一种图像处理方法,该方法,还包括:
可选的,当检测到显示界面中包括待处理主体,并根据所述待处理主体的待匹配特征点数据确定为目标主体时,调取预先设置的AR特效模型;
将所述AR特效模型添加至所述目标主体。
根据本公开的一个或多个实施例,【示例三】提供了一种图像处理方法,该方法,还包括:
可选的,确定所述前一历史视频帧的历史关键点,在所述当前视频帧中的待匹配关键点,得到至少一个关键点组;
根据所述至少一个关键点组,确定光流场信息;
根据所述光流场信息,确定所述AR特效模型在所述当前视频帧中的目标显示位置。
根据本公开的一个或多个实施例,【示例四】提供了一种图像处理方法,该方法,还包括:
可选的,根据每个关键点组中的历史关键点和相应的待匹配关键点,确定目标变换矩阵,作为所述光流场信息;
其中,所述目标变换矩阵包括平移矩阵和旋转矩阵。
根据本公开的一个或多个实施例,【示例五】提供了一种图像处理方法,该方法,还包括:
可选的,根据所述光流场信息以及所述AR特效模型在前一历史视频帧中的历史位置信息,确定所述AR特效模型在所述当前视频帧中的目标显示位置。
根据本公开的一个或多个实施例,【示例六】提供了一种图像处理方法,该方法,还包括:
可选的,在所述目标显示位置渲染出所述AR特效模型,以保持所述AR特效模型与所述目标主体的相对位置不变,得到所述目标特效视频帧。
根据本公开的一个或多个实施例,【示例七】提供了一种图像处理方法,该方法,还包括:
可选的,通过对各目标特效视频帧拼接处理,确定目标特效视频。
根据本公开的一个或多个实施例,【示例八】提供了一种图像处理装置,该装置包括:
目标主体检测模块,用于在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型;
目标显示位置确定模块,用于根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置;
显示模块,用于将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
Claims (10)
1.一种图像处理方法,其特征在于,包括:
在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型;
根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置;
将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧。
2.根据权利要求1所述的方法,其特征在于,所述在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型,包括:
当检测到显示界面中包括待处理主体,并根据所述待处理主体的待匹配特征点数据确定为目标主体时,调取预先设置的AR特效模型;
将所述AR特效模型添加至所述目标主体。
3.根据权利要求1所述的方法,其特征在于,所述根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置,包括:
确定所述前一历史视频帧的历史关键点,在所述当前视频帧中的待匹配关键点,得到至少一个关键点组;
根据所述至少一个关键点组,确定光流场信息;
根据所述光流场信息,确定所述AR特效模型在所述当前视频帧中的目标显示位置。
4.根据权利要求3所述的方法,其特征在于,所述根据所述至少一个关键点组,确定光流场信息,包括:
根据每个关键点组中的历史关键点和相应的待匹配关键点,确定目标变换矩阵,作为所述光流场信息;
其中,所述目标变换矩阵包括平移矩阵和旋转矩阵。
5.根据权利要求3所述的方法,其特征在于,所述根据所述光流场信息,确定所述AR特效模型在所述当前视频帧中的目标显示位置,包括:
根据所述光流场信息以及所述AR特效模型在前一历史视频帧中的历史位置信息,确定所述AR特效模型在所述当前视频帧中的目标显示位置。
6.根据权利要求1所述的方法,其特征在于,所述将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧,包括:
在所述目标显示位置渲染出所述AR特效模型,以保持所述AR特效模型与所述目标主体的相对位置不变,得到所述目标特效视频帧。
7.根据权利要求1所述的方法,其特征在于,还包括:
通过对各目标特效视频帧拼接处理,确定目标特效视频。
8.一种图像处理装置,其特征在于,包括:
目标主体检测模块,用于在检测到于显示界面上的待处理主体为目标主体时,为所述目标主体添加AR特效模型;
目标显示位置确定模块,用于根据当前视频帧以及前一历史视频帧,确定所述AR特效模型在所述当前视频帧中的目标显示位置;
显示模块,用于将所述AR特效模型显示在所述目标显示位置处,得到与所述当前视频帧相对应的目标特效视频帧。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的图像处理方法。
10.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的图像处理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210307605.XA CN117152385A (zh) | 2022-03-25 | 2022-03-25 | 图像处理方法、装置、电子设备及存储介质 |
PCT/SG2023/050180 WO2023182935A2 (zh) | 2022-03-25 | 2023-03-21 | 图像处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210307605.XA CN117152385A (zh) | 2022-03-25 | 2022-03-25 | 图像处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117152385A true CN117152385A (zh) | 2023-12-01 |
Family
ID=88102256
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210307605.XA Pending CN117152385A (zh) | 2022-03-25 | 2022-03-25 | 图像处理方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN117152385A (zh) |
WO (1) | WO2023182935A2 (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991147A (zh) * | 2017-03-27 | 2017-07-28 | 重庆大学 | 一种植物识别系统及识别方法 |
JP2023515796A (ja) * | 2020-02-20 | 2023-04-14 | マジック リープ, インコーポレイテッド | Wifi/gpsベースのマップマージを伴うクロスリアリティシステム |
CN112070820A (zh) * | 2020-08-29 | 2020-12-11 | 南京翱翔信息物理融合创新研究院有限公司 | 一种分布式增强现实的定位终端、定位服务器及定位系统 |
-
2022
- 2022-03-25 CN CN202210307605.XA patent/CN117152385A/zh active Pending
-
2023
- 2023-03-21 WO PCT/SG2023/050180 patent/WO2023182935A2/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023182935A3 (zh) | 2023-11-09 |
WO2023182935A2 (zh) | 2023-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111242881B (zh) | 显示特效的方法、装置、存储介质及电子设备 | |
CN110866977B (zh) | 增强现实处理方法及装置、系统、存储介质和电子设备 | |
CN111311756A (zh) | 增强现实ar显示方法及相关装置 | |
WO2023071707A1 (zh) | 视频图像处理方法、装置、电子设备及存储介质 | |
CN114531553B (zh) | 生成特效视频的方法、装置、电子设备及存储介质 | |
CN114842120A (zh) | 一种图像渲染处理方法、装置、设备及介质 | |
CN111833459B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN111818265B (zh) | 基于增强现实模型的交互方法、装置、电子设备及介质 | |
CN109816791B (zh) | 用于生成信息的方法和装置 | |
CN116527993A (zh) | 视频的处理方法、装置、电子设备、存储介质和程序产品 | |
CN114049403A (zh) | 一种多角度三维人脸重建方法、装置及存储介质 | |
CN117152385A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN112070903A (zh) | 虚拟对象的展示方法、装置、电子设备及计算机存储介质 | |
CN113837918A (zh) | 多进程实现渲染隔离的方法及装置 | |
CN111862342A (zh) | 增强现实的纹理处理方法、装置、电子设备及存储介质 | |
JP7214926B1 (ja) | 画像処理方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体 | |
RU2802724C1 (ru) | Способ и устройство обработки изображений, электронное устройство и машиночитаемый носитель информации | |
EP4170599A2 (en) | Character display method and apparatus, electronic device, and storage medium | |
CN116563740A (zh) | 基于扩展现实的控制方法、装置、电子设备和存储介质 | |
CN117934769A (zh) | 图像显示方法、装置、电子设备和存储介质 | |
CN117641040A (zh) | 视频处理方法、装置、电子设备和存储介质 | |
CN111429585A (zh) | 图像生成方法、装置、电子设备及计算机可读存储介质 | |
CN115770386A (zh) | 控制运动物体运动的方法、装置、设备及介质 | |
CN117745981A (zh) | 图像生成方法、装置、电子设备和存储介质 | |
CN117435041A (zh) | 信息交互方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |