CN116883629A - 图像生成方法、装置、电子设备及计算机存储介质 - Google Patents
图像生成方法、装置、电子设备及计算机存储介质 Download PDFInfo
- Publication number
- CN116883629A CN116883629A CN202310843566.XA CN202310843566A CN116883629A CN 116883629 A CN116883629 A CN 116883629A CN 202310843566 A CN202310843566 A CN 202310843566A CN 116883629 A CN116883629 A CN 116883629A
- Authority
- CN
- China
- Prior art keywords
- information
- target
- target image
- image
- generating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000003190 augmentative effect Effects 0.000 claims abstract description 55
- 230000006399 behavior Effects 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 26
- 238000013507 mapping Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 210000005252 bulbus oculi Anatomy 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/006—Mixed reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/61—Scene description
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Computer Graphics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请实施例公开了一种图像生成方法、装置、电子设备及计算机存储介质;在本申请实施例中,获取增强现实设备所处环境的目标图像,并对所述目标图像进行识别,确定所述环境对应的场景类别;根据所述场景类别,确定与所述目标图像关联的对象类型,以及获取穿戴所述增强现实设备的用户的偏好信息;根据所述偏好信息和所述对象类型,生成与所述目标图像关联的第一对象信息;确定所述目标图像包括的第二对象信息,并根据所述第一对象信息和第二对象信息,生成所述目标图像对应的三维图像。本申请实施例可以提高生成三维图像的灵活性,丰富三维图像。
Description
技术领域
本申请涉及图像处理技术领域,具体涉及一种图像生成方法、装置、电子设备及计算机存储介质。
背景技术
增强现实(Augmented Reality,AR)技术指将虚拟信息与真实世界巧妙融合,得到三维图像的技术,由于其可以为用户提供丰富的视觉体验,因此,其越来越受用户的欢迎。
然而,目前的增强现实技术在将虚拟信息和真实世界融合,得到三维内容时,三维图像是固定的,灵活性较低。
发明内容
本申请实施例提供一种图像生成方法、装置、电子设备及计算机存储介质,可以解决增强现实技术的灵活性较低的技术问题。
本申请实施例提供一种图像生成方法,包括:
获取增强现实设备所处环境的目标图像,并对上述目标图像进行识别,确定上述环境对应的场景类别;
根据上述场景类别,确定与上述目标图像关联的对象类型,以及获取穿戴上述增强现实设备的用户的偏好信息;
根据上述偏好信息和上述对象类型,生成与上述目标图像关联的第一对象信息;
确定上述目标图像包括的第二对象信息,并根据上述第一对象信息和第二对象信息,生成上述目标图像对应的三维图像。
相应地,本申请实施例提供一种图像生成装置,包括:
第一获取模块,用于获取增强现实设备所处环境的目标图像,并对上述目标图像进行识别,确定上述环境对应的场景类别;
第二获取模块,用于根据上述场景类别,确定与上述目标图像关联的对象类型,以及获取穿戴上述增强现实设备的用户的偏好信息;
第一生成模块,用于根据上述偏好信息和上述对象类型,生成与上述目标图像关联的第一对象信息;
第二生成模块,用于确定上述目标图像包括的第二对象信息,并根据上述第一对象信息和第二对象信息,生成上述目标图像对应的三维图像。
此外,本申请实施例还提供一种电子设备,包括处理器和存储器,上述存储器存储有计算机程序,上述处理器用于运行上述存储器内的计算机程序实现本申请实施例提供的图像生成方法。
此外,本申请实施例还提供一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序适于处理器进行加载,以执行本申请实施例所提供的任一种图像生成方法。
此外,本申请实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请实施例所提供的任一种图像生成方法。
在本申请实施例中,获取增强现实设备所处环境的目标图像,并对目标图像进行识别,确定环境对应的场景类别;根据场景类别,确定与目标图像关联的对象类型,以及获取穿戴增强现实设备的用户的偏好信息;根据偏好信息和对象类型,生成与目标图像关联的第一对象信息;确定目标图像包括的第二对象信息,并根据第一对象信息和第二对象信息,生成目标图像对应的三维图像,实现根据用户的偏好信息生成三维图像,使得即使目标图像相同,三维图像不相同,丰富三维图像,提高生成目标三维图像的灵活性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的图像生成方法的流程示意图;
图2是本申请实施例提供的图像生成装置的结构示意图;
图3是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种图像生成方法、装置、电子设备及计算机存储介质。该图像生成装置可以集成在电子设备中,该电子设备可以是服务器,也可以是终端等设备。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、增强现实设备等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
例如,增强现实设备获取增强现实设备所处环境的目标图像,将目标图像发送至服务器。服务器对目标图像进行识别,确定环境对应的场景类别,根据场景类别,确定与目标图像关联的对象类型,以及获取穿戴增强现实设备的用户的偏好信息,根据偏好信息和对象类型,生成与目标图像关联的第一对象信息;确定目标图像包括的第二对象信息,并根据第一对象信息和第二对象信息,生成目标图像对应的三维图像,并将三维图像返回至增强现实设备,增强现实设备显示三维图像。
另外,本申请实施例中的“多个”指两个或两个以上。本申请实施例中的“第一”和“第二”等用于区分描述,而不能理解为暗示相对重要性。
本申请在获取用户的相关数据时,按照相关法律法规的规定,且经过用户的同意获取用户的相关数据。
以下分别进行详细说明。需要说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
在本实施例中,将从图像生成装置的角度进行描述,为了方便对本申请的图像生成方法进行说明,以下将以图像生成装置集成在终端中进行详细说明,即以终端作为执行主体进行详细说明。
请参阅图1,图1是本申请一实施例提供的图像生成方法的流程示意图。该图像生成方法可以包括:
S101、获取增强现实设备所处环境的目标图像,并对目标图像进行识别,确定环境对应的场景类别。
增强现实设备指可以将虚拟信息与真实世界巧妙融合的设备,其运用多媒体、三维建模、实时跟踪及注册、智能交互、传感等多种技术手段,将计算机生成的文字、图像、三维模型、音乐、视频等虚拟信息模拟仿真后,应用到真实世界中,实现对真实世界的“增强”。
增强现实设备的类型可以根据实际情况进行选择,比如,增强现实设备可以为增强现实眼镜或增强现实头盔,本申请实施例在此不做限定。
增强现实设备所处环境的目标图像,也即是穿戴增强现实设备的用户所处的环境的图像。目标图像可以包括至少一张。
目标图像的类型可以根据实际情况进行选择,比如,目标图像可以为RGB-D图像,或者,目标图像也可以为灰度图像和深度图像等,本申请实施例在此不做限定。
终端可以通过增强现实设备的摄像头采集目标图像,或者,终端可以通过其他终端采集目标图像,然后其他终端再将目标图像发送至终端。
对于获取目标图像的方式,可以根据实际情况进行选择,本申请实施例在此不做限定。
环境对应的场景类别指环境包括的对象组成的画面的类别,比如,环境中包括的对象为各种物品,则环境为商场,则环境对应的场景类别为购物场景,又比如,环境包括各种健身器材,则环境为健身场所,环境对应的场景类别为健身场景,又比如,环境包括各种花草以及亭子,则环境为公园,环境对应的场景类别为公园游玩场景。
对目标图像进行识别,确定环境对应的场景类别的方法,可以根据实际情况进行选择,本申请实施例在此不做限定。
比如,对目标图像进行识别,确定环境对应的场景类别的过程可以为:
对目标图像进行识别,得到目标图像包括的各个目标对象;
获取预设映射表,预设映射表包括候选场景类别和候选场景类别包括的对象;
将与目标对象匹配的对象对应的候选场景类别,作为环境对应的场景类别。
其中,确定与目标对象匹配的对象的过程可以为:直接将各个目标对象与预设映射表中候选场景类别包括的对象进行一一匹配,从而得到与目标对象匹配的对象。
或者,为了更加快速地得到与目标对象匹配地对象,确定与目标对象匹配的对象的过程也可以为:
将各个目标对象对应的标识进行拼接,得到拼接后标识;
获取候选场景类别对应的第一标识,第一标识为将候选场景类别包括的对象的标识进行拼接后得到的标识;
计算拼接后标识和第一标识之间的相似度;
将满足预设相似度的相似度对应的第一标识,作为与拼接后标识匹配的标识,得到目标标识;
将目标标识对应的对象,作为与目标对象匹配的对象。
或者,可以直接将目标标识对应的候选场景类别,作为环境对应的场景类别。
在本申请实施例中,由于通常目标图像中包括多个目标对象,如果直接将目标对象和预设映射表中的对象进行一一匹配,速度较慢,因此,在本申请实施例中,将将各个目标对象对应的标识进行拼接,得到拼接后标识;获取候选场景类别对应的第一标识,第一标识为将候选场景类别包括的对象的标识进行拼接后得到的标识;计算拼接后标识和第一标识之间的相似度;将满足预设相似度的相似度对应的第一标识,作为与拼接后标识匹配的标识,得到目标标识;将目标标识对应的对象,作为与目标对象匹配的对象,直接根据相似度即可判断对象是否与目标对象匹配,无需进行一一匹配,提高得到与目标对象匹配的对象,从而提高得到环境对应的场景类别的速度。
又比如,对目标图像进行识别,确定环境对应的场景类别的过程也可以为:
获取场景识别模型;
通过场景识别模型,对目标图像进行特征提取,得到目标图像对应的特征;
根据特征,对目标图像进行识别,确定环境对应的场景类别。
场景识别模型指由神经元互相连接形成,模拟生物神经系统的网络系统。场景识别模型的类型可以根据实际情况进行选择,比如,场景识别模型可以为卷积神经网络模型或自编码器,本申请实施例在此不做限定。
S102、根据场景类别,确定与目标图像关联的对象类型,以及获取穿戴增强现实设备的用户的偏好信息。
与目标图像关联的对象类型指目标图像不包括但与目标图像相关的数据的种类。
比如,与目标图像关联的对象类型可以为文字类型、虚拟对象类型或者图像类型以及音频类型中的至少一种。
终端可以将候选场景类别和候选对象类型存储在第一预设映射表中,然后将与场景类别对应的候选场景类别对应的候选对象类型,作为与目标图像关联的对象类型。
应理解,第一预设映射表可以与预设映射表相同,也即是,预设映射表还可以包括候选对象类型,或者,第一预设映射表也可以与预设映射表不相同,此时,预设映射表没有包括候选对象类型。
或者,终端也可以通过图像生成模型,根据场景类别,确定与目标图像关联的对象类型。图像生成模型与场景识别模型可以为同一个模型,也可以不是同一个模型。
用户的偏好信息指表征用户对某一物品有浓厚兴趣的信息。终端可以通过对用户的历史行为数据和用户的静态属性数据(静态属性信息比如可以为用户的年龄或用户的性别等)中的至少一种数据进行分析,从而得到用户的偏好信息。
其中,当通过对用户的历史行为数据进行分析,得到用户的偏好信息的过程可以为:
获取穿戴增强现实设备的用户针对场景类别的历史行为数据;
根据历史行为数据,生成增强现实设备的用户的偏好信息。
需要说明的是,可能没有存在用户针对该场景类别的历史行为数据,或者,没有存在用户的历史行为数据。当没有存在用户针对该场景类别的历史行为数据,则终端可以确定与场景类别关联的目标场景类别,然后将目标场景类别对应的历史行为数据,作为用户针对场景类别的历史行驶数据。
与场景类别关联的目标场景类别可以指与场景类别之间的相似度满足预设相似度条件的类别。比如,场景类别为公园游玩场景,则与场景类别关联的目标场景类别可以为草坪游玩场景。
当没有存在用户的历史行为数据时,获取穿戴增强现实设备的用户的偏好信息的过程可以为:
获取穿戴增强现实设备的用户对应的目标账号;
若目标账号不存在对应的偏好信息,则获取目标账号对应的目标属性信息;
确定与目标属性信息匹配的属性信息对应的账号,得到候选账号;
将候选账号对应的偏好信息,作为用户的偏好信息。
目标账号对应的目标属性信息,可以指表征目标账号的属性特征的信息,比如,目标属性信息可以为账号描述信息或者用户的静态属性数据。
在本申请实施例中,当不存在用户的历史行为数据时,可以通过获取目标账号对应的目标属性信息,然后确定与目标属性信息匹配的属性信息对应的账号,得到候选账号,最后将候选账号对应的偏好信息,作为用户的偏好信息,从而得到用户的偏好信息。
在本申请实施例中,获取用户的偏好信息,以便后续可以根据用户的偏好信息和目标图像,生成个性化的三维图像,使得即使目标图像相同,但当偏好信息不相同时,三维图像也不相同,提高三维图像的丰富性和灵活性,从而提高用户的沉浸感,进而提高用户体验。
由于通常用户的偏好信息较多,因此,为了更加快速地得到三维图像,可以是获取用户的偏红信息集合,偏好信息集合包括多种候选偏好信息以及候选场景类别,然后将偏好信息集合中与场景类别匹配的候选场景类别对应的候选偏好信息,作为用户的偏好信息。
S103、根据偏好信息和对象类型,生成与目标图像关联的第一对象信息。
当对象类型为文字类型时,根据偏好信息和对象类型,生成与目标图像关联的第一对象信息的过程可以为:
确定目标图像包括的目标对象;
根据偏好信息和文字类型,生成与目标对象关联的文字信息,得到与目标图像关联的第一对象信息。
比如,目标图像包括的目标对象为各个艺术品,则根据偏好信息,生成与介绍各个艺术品的文字信息。
其中,可以根据偏好信息,从目标对象筛选出偏好对象,然后根据文字类型,获取与偏好对象关联的文字信息。或者,由于一个目标对象关联的文字信息较多,则可以根据文字类型,获取与目标对象关联的候选文字信息,然后根据偏好信息,从候选文字信息中筛选出与目标对象关联的文字信息。
当对象类型为虚拟对象类型时,第一对象信息可以包括第一虚拟对象,根据偏好信息和对象类型,生成与目标图像关联的第一对象信息的过程可以为:
根据虚拟对象类型,获取预先设置的候选虚拟对象;
根据偏好信息,对候选虚拟对象进行调整,得到与目标图像关联的第一虚拟对象。
在本申请实例中,先预先设置候选虚拟对象,然后根据虚拟对象类型,获取候选虚拟对象,当获取到偏好信息,即可根据偏好信息,对候选虚拟对象进行调整,从而得到与目标图像关联的第一虚拟对象,提高得到第一虚拟对象的速度。
比如,场景类别为公园游玩场景,则候选虚拟对象可以为虚拟宠物,用户的偏好信息为猫,则第一虚拟对象可以为虚拟猫。
又比如,场景类别为健身场景,则候选虚拟对象可以为虚拟人物,用户的偏好信息为帅哥,则第一虚拟对象可以为虚拟帅气健身教练。
又比如,场景类别为社交场景,则候选虚拟对象可以为虚拟人物,用户的偏好信息为淡雅温柔,则第一虚拟对象可以为淡雅温柔虚拟社交助手。
S104、确定目标图像包括的第二对象信息,并根据第一对象信息和第二对象信息,生成目标图像对应的三维图像。
目标图像包括的第二对象信息,可以指目标图像包括的目标对象的描述信息,比如,第二对象信息可以为目标对象在目标图像的位置信息、目标对象的颜色信息、目标对象的形状信息等。
终端在生成三维图像之后,可以将三维图像在增强现实设备中进行显示,以便用户可以看到三维图像。
在一些实施例中,终端可以通过图像生成模型,根据第一对象信息和第二对象信息,生成目标图像对应的三维图像,此时,图像生成模型也可以称为人工智能生成内容模型(Artificial Intelligence Generated Content,AIGC)。
在另一些实施例中,如果第一对象信息是文字信息,则根据第一对象信息和第二对象信息,生成目标图像对应的三维图像的过程可以为:
根据第二对象信息,生成目标图像对应的候选三维图像;
根据第一对象信息,生成文字信息对应的三维文字;
在候选三维图像上展示三维文字,以得到目标图像对应的三维图像。
在另一些实施例中,如果第一对象信息是第一虚拟对象,则根据第一对象信息和第二对象信息,生成目标图像对应的三维图像的过程可以为:
根据第二对象信息,生成目标图像对应的候选三维图像;
在候选三维图像上展示第一虚拟对象,以得到目标图像对应的三维图像。
需要说明的是,如果第一对象信息为音频,音频可以为背景音乐,或者,音频可以为对目标图像的解说音频,则终端可以根据目标图像生成三维图像,然后在显示三维图像的同时,播放音频。
其中,可以在显示三维图像时,立即播放音频,或者,终端可以在显示三维图像时,根据用户的触发操作,播放触发操作对应的音频(此时,音频可以包括多段),触发操作可以为眼球聚焦操作或点击操作等,本申请实施例在此不做限定。
如果第一对象信息为图像,则根据第一对象信息和第二对象信息,生成目标图像对应的三维图像的过程可以为:
根据第二对象信息,生成目标图像对应的候选三维图像;
根据第一对象信息,生成第一对象信息对应的关联三维图像;
在候选三维图像上展示关联三维图像,得到目标图像对应的三维图像。
在另一些实施例中,在根据第一对象信息和第二对象信息,生成目标图像对应的三维图像之后,还包括:
获取目标用户的当前行为数据;
控制第一虚拟对象执行与当前行为数据对应的操作。
目标用户可以指穿戴增强现实设备的用户,或者,目标用户也可以指与穿戴增强现实设备的用户进行互动的用户,比如,场景类别为社交场景,则目标用户可以指社交场景中的各个用户。
控制第一虚拟对象执行与当前行为数据对应的操作,可以理解为根据当前行为数据,控制第一虚拟对象给出答案、建议或动作。
比如,当前行为数据为用户提出的问题,则控制第一虚拟对象执行与当前行为数据对应的操作,可以理解为控制第一虚拟对象回答用户提出的问题,以便解答用户的疑惑。
又比如,目标用户为与用户进行互动的用户,当前行为数据为与用户进行互动的用户说话的内容,则控制第一虚拟对象执行与当前行为数据对应的操作,可以理解为根据说话的内容,控制第一虚拟对象向用户给出接话技巧(比如,控制第一虚拟对象向用户建议如何响应说话的内容,或者,控制第一虚拟对象根据说话的内容,向用户提示新的话题),从而帮助用户进行社交。
又比如,当前行为数据为用户做出的动作,第一虚拟对象为虚拟猫,则控制第一虚拟对象执行与当前行为数据对应的操作,可以理解为控制虚拟猫根据用户的动作做出互动的动作,以便改善用户的心情。
又比如,当前行为数据为用户做出的动作,第一虚拟对象为虚拟健身教练,则控制第一虚拟对象执行与当前行为数据对应的操作,可以理解为控制虚拟健身教练根据用户的动作给出动作是否标准的建议,以便提高用户的健身效果。
由以上可知,在本申请实施例中,获取增强现实设备所处环境的目标图像,并对目标图像进行识别,确定环境对应的场景类别;根据场景类别,确定与目标图像关联的对象类型,以及获取穿戴增强现实设备的用户的偏好信息;根据偏好信息和对象类型,生成与目标图像关联的第一对象信息;确定目标图像包括的第二对象信息,并根据第一对象信息和第二对象信息,生成目标图像对应的三维图像,实现根据用户的偏好信息生成三维图像,使得即使目标图像相同,三维图像不相同,丰富三维图像,提高生成目标三维图像的灵活性。
为便于更好的实施本申请实施例提供的图像生成方法,本申请实施例还提供一种基于上述图像生成方法的装置。其中名词的含义与上述图像生成方法中相同,具体实现细节可以参考方法实施例中的说明。
例如,如图2所示,该图像生成装置可以包括:
第一获取模块201,用于获取增强现实设备所处环境的目标图像,并对目标图像进行识别,确定环境对应的场景类别。
第二获取模块202,用于根据场景类别,确定与目标图像关联的对象类型,以及获取穿戴增强现实设备的用户的偏好信息。
第一生成模块203,用于根据偏好信息和对象类型,生成与目标图像关联的第一对象信息。
第二生成模块204,用于确定目标图像包括的第二对象信息,并根据第一对象信息和第二对象信息,生成目标图像对应的三维图像。
可选地,对象类型为文字类型,相应地,第一生成模块203具体用于执行:
确定目标图像包括的目标对象;
根据偏好信息和文字类型,生成与目标对象关联的文字信息,得到与目标图像关联的第一对象信息。
可选地,第二生成模块204具体用于执行:
根据第二对象信息,生成目标图像对应的候选三维图像;
根据第一对象信息,生成文字信息对应的三维文字;
在候选三维图像上展示三维文字,以得到目标图像对应的三维图像。
可选地,对象类型为虚拟对象类型,第一对象信息包括第一虚拟对象,相应地,第一生成模块203具体用于执行:
根据虚拟对象类型,获取预先设置的候选虚拟对象;
根据偏好信息,对候选虚拟对象进行调整,得到与目标图像关联的第一虚拟对象。
可选地,该图像生成装置还包括:
控制模块,用于执行:
获取目标用户的当前行为数据;
控制第一虚拟对象执行与当前行为数据对应的操作。
可选地,第二获取模块202具体用于执行:
获取穿戴增强现实设备的用户对应的目标账号;
若目标账号不存在对应的偏好信息,则获取目标账号对应的目标属性信息;
确定与目标属性信息匹配的属性信息对应的账号,得到候选账号;
将候选账号对应的偏好信息,作为用户的偏好信息。
可选地,第二获取模块202具体用于执行:
获取穿戴增强现实设备的用户针对场景类别的历史行为数据;
根据历史行为数据,生成增强现实设备的用户的偏好信息。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施方式以及对应的有益效果可参见前面的方法实施例,在此不再赘述。
本申请实施例还提供一种电子设备,该电子设备可以是服务器或终端等,如图3所示,其示出了本申请实施例所涉及的电子设备的结构示意图,具体来讲:
该电子设备可以包括一个或者一个以上处理核心的处理器301、一个或一个以上计算机可读存储介质的存储器302、电源303和输入单元304等部件。本领域技术人员可以理解,图3中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器301是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器302内的计算机程序和/或模块,以及调用存储在存储器302内的数据,执行电子设备的各种功能和处理数据。可选的,处理器301可包括一个或多个处理核心;优选的,处理器301可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器301中。
存储器302可用于存储计算机程序以及模块,处理器301通过运行存储在存储器302的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器302可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器302可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器302还可以包括存储器控制器,以提供处理器301对存储器302的访问。
电子设备还包括给各个部件供电的电源303,优选的,电源303可以通过电源管理系统与处理器301逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源303还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该电子设备还可包括输入单元304,该输入单元304可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器301会按照如下的指令,将一个或一个以上的计算机程序的进程对应的可执行文件加载到存储器302中,并由处理器301来运行存储在存储器302中的计算机程序,从而实现各种功能,比如:
获取增强现实设备所处环境的目标图像,并对目标图像进行识别,确定环境对应的场景类别;
根据场景类别,确定与目标图像关联的对象类型,以及获取穿戴增强现实设备的用户的偏好信息;
根据偏好信息和对象类型,生成与目标图像关联的第一对象信息;
确定目标图像包括的第二对象信息,并根据第一对象信息和第二对象信息,生成目标图像对应的三维图像。
以上各个操作的具体实施方式以及对应的有益效果可参见上文对图像生成方法的详细描述,在此不作赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过计算机程序来完成,或通过计算机程序控制相关的硬件来完成,该计算机程序可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种图像生成方法中的步骤。例如,该计算机程序可以执行如下步骤:
获取增强现实设备所处环境的目标图像,并对目标图像进行识别,确定环境对应的场景类别;
根据场景类别,确定与目标图像关联的对象类型,以及获取穿戴增强现实设备的用户的偏好信息;
根据偏好信息和对象类型,生成与目标图像关联的第一对象信息;
确定目标图像包括的第二对象信息,并根据第一对象信息和第二对象信息,生成目标图像对应的三维图像。
以上各个操作的具体实施方式以及对应的有益效果可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种图像生成方法中的步骤,因此,可以实现本申请实施例所提供的任一种图像生成方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
其中,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述图像生成方法。
以上对本申请实施例所提供的一种图像生成方法、装置、电子设备及计算机存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种图像生成方法,其特征在于,包括:
获取增强现实设备所处环境的目标图像,并对所述目标图像进行识别,确定所述环境对应的场景类别;
根据所述场景类别,确定与所述目标图像关联的对象类型,以及获取穿戴所述增强现实设备的用户的偏好信息;
根据所述偏好信息和所述对象类型,生成与所述目标图像关联的第一对象信息;
确定所述目标图像包括的第二对象信息,并根据所述第一对象信息和所述第二对象信息,生成所述目标图像对应的三维图像。
2.根据权利要求1所述的图像生成方法,其特征在于,所述对象类型为文字类型,所述根据所述偏好信息和所述对象类型,生成与所述目标图像关联的第一对象信息,包括:
确定所述目标图像包括的目标对象;
根据所述偏好信息和所述文字类型,生成与所述目标对象关联的文字信息,得到与所述目标图像关联的第一对象信息。
3.根据权利要求2所述的图像生成方法,其特征在于,所述根据所述第一对象信息和所述第二对象信息,生成所述目标图像对应的三维图像,包括:
根据所述第二对象信息,生成所述目标图像对应的候选三维图像;
根据所述第一对象信息,生成所述文字信息对应的三维文字;
在所述候选三维图像上展示所述三维文字,以得到所述目标图像对应的三维图像。
4.根据权利要求1所述的图像生成方法,其特征在于,所述对象类型为虚拟对象类型,第一对象信息包括第一虚拟对象;
所述根据所述偏好信息和所述对象类型,生成与所述目标图像关联的第一对象信息,包括:
根据所述虚拟对象类型,获取预先设置的候选虚拟对象;
根据所述偏好信息,对所述候选虚拟对象进行调整,得到与所述目标图像关联的第一虚拟对象。
5.根据权利要求4所述的图像生成方法,其特征在于,在所述根据所述第一对象信息和所述第二对象信息,生成所述目标图像对应的三维图像之后,还包括:
获取目标用户的当前行为数据;
控制所述第一虚拟对象执行与所述当前行为数据对应的操作。
6.根据权利要求1-5任一项所述的图像生成方法,其特征在于,所述获取穿戴所述增强现实设备的用户的偏好信息,包括:
获取穿戴所述增强现实设备的用户对应的目标账号;
若所述目标账号不存在对应的偏好信息,则获取所述目标账号对应的目标属性信息;
确定与所述目标属性信息匹配的属性信息对应的账号,得到候选账号;
将所述候选账号对应的偏好信息,作为所述用户的偏好信息。
7.根据权利要求1-5任一项所述的图像生成方法,其特征在于,所述获取穿戴所述增强现实设备的用户的偏好信息,包括:
获取穿戴所述增强现实设备的用户针对所述场景类别的历史行为数据;
根据所述历史行为数据,生成所述增强现实设备的用户的偏好信息。
8.一种图像生成装置,其特征在于,包括:
第一获取模块,用于获取增强现实设备所处环境的目标图像,并对所述目标图像进行识别,确定所述环境对应的场景类别;
第二获取模块,用于根据所述场景类别,确定与所述目标图像关联的对象类型,以及获取穿戴所述增强现实设备的用户的偏好信息;
第一生成模块,用于根据所述偏好信息和所述对象类型,生成与所述目标图像关联的第一对象信息;
第二生成模块,用于确定所述目标图像包括的第二对象信息,并根据所述第一对象信息和第二对象信息,生成所述目标图像对应的三维图像。
9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,所述处理器用于运行所述存储器内的计算机程序,以执行权利要求1至7任一项所述的图像生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行权利要求1至7任一项所述的图像生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310843566.XA CN116883629A (zh) | 2023-07-10 | 2023-07-10 | 图像生成方法、装置、电子设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310843566.XA CN116883629A (zh) | 2023-07-10 | 2023-07-10 | 图像生成方法、装置、电子设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116883629A true CN116883629A (zh) | 2023-10-13 |
Family
ID=88254271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310843566.XA Pending CN116883629A (zh) | 2023-07-10 | 2023-07-10 | 图像生成方法、装置、电子设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116883629A (zh) |
-
2023
- 2023-07-10 CN CN202310843566.XA patent/CN116883629A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230012732A1 (en) | Video data processing method and apparatus, device, and medium | |
US10586369B1 (en) | Using dialog and contextual data of a virtual reality environment to create metadata to drive avatar animation | |
CN113766296B (zh) | 直播画面的展示方法和装置 | |
US11263815B2 (en) | Adaptable VR and AR content for learning based on user's interests | |
CN111414506B (zh) | 基于人工智能情绪处理方法、装置、电子设备及存储介质 | |
US20210335350A1 (en) | Messaging system with trend analysis of content | |
CN111400473A (zh) | 意图识别模型的训练方法及装置、存储介质及电子设备 | |
CN113347498A (zh) | 一种视频播放方法、装置及计算机可读存储介质 | |
CN115857704A (zh) | 一种基于元宇宙的展览系统、交互方法以及电子设备 | |
CN110488973A (zh) | 一种虚拟互动留言系统及方法 | |
CN114764896A (zh) | 适于视频游戏的直播中的自动内容辨识和信息 | |
CN113497946B (zh) | 视频处理方法、装置、电子设备和存储介质 | |
CN113486260B (zh) | 互动信息的生成方法、装置、计算机设备及存储介质 | |
CN116883629A (zh) | 图像生成方法、装置、电子设备及计算机存储介质 | |
CN114691853A (zh) | 句子推荐方法、装置、设备及计算机可读存储介质 | |
CN116701759B (zh) | 一种虚拟展馆的推荐方法、装置及电子设备 | |
CN112000256B (zh) | 一种内容互动方法及装置 | |
CN113448466B (zh) | 动画显示方法、装置、电子设备及存储介质 | |
TWI643080B (zh) | 能對網路資料進行解析並據以模擬特定對象之方法 | |
CN117101153A (zh) | 一种游戏配置信息分享方法、装置、电子设备及存储介质 | |
CN117857894A (zh) | 直播封面处理方法、装置、电子设备及计算机存储介质 | |
CN117519466A (zh) | 增强现实设备的控制方法、计算机设备和存储介质 | |
CN113703712A (zh) | 音频处理方法、装置、存储介质及计算机设备 | |
EP4272093A1 (en) | Engagement analysis based on labels | |
CN115225930A (zh) | 直播互动应用的处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |