CN116342764A - 一种形象配置方法、装置、车辆终端及存储介质 - Google Patents

一种形象配置方法、装置、车辆终端及存储介质 Download PDF

Info

Publication number
CN116342764A
CN116342764A CN202310283603.6A CN202310283603A CN116342764A CN 116342764 A CN116342764 A CN 116342764A CN 202310283603 A CN202310283603 A CN 202310283603A CN 116342764 A CN116342764 A CN 116342764A
Authority
CN
China
Prior art keywords
avatar
image
voice assistant
target object
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310283603.6A
Other languages
English (en)
Inventor
赵喜江
马小梅
陈立涛
孙澳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Changan Automobile Co Ltd
Original Assignee
Chongqing Changan Automobile Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Changan Automobile Co Ltd filed Critical Chongqing Changan Automobile Co Ltd
Priority to CN202310283603.6A priority Critical patent/CN116342764A/zh
Publication of CN116342764A publication Critical patent/CN116342764A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/802D [Two Dimensional] animation, e.g. using sprites
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请涉及一种形象配置方法、装置、车辆终端及存储介质,涉及人工智能技术领域。应用于车辆终端,方法包括:采集车辆终端内的目标对象的图像;从目标对象的图像中提取出目标对象的形象特征;基于目标对象的形象特征,生成语音助手的虚拟形象配置文件。由此,可以使配置得到的语音助手的虚拟形象逼真、灵动、立体效果逼真和立体感强等,以解决相关技术在构建车辆终端的语音助手的虚拟形象时,构建形象单一、种类少以及没有真实的虚拟人感的问题。

Description

一种形象配置方法、装置、车辆终端及存储介质
技术领域
本申请涉及人工智能领域,尤其涉及车辆终端智能语音识别技术领域和三维引擎图像处理技术领域,具体涉及一种形象配置方法、装置、车辆终端及存储介质。
背景技术
随着智能语音技术的不断发展,用户使用语音助手的场景越来越丰富。而随着汽车行业的发展,用户对于车辆终端的科技感要求越来越高,为提升用户的体验,厂家会在车辆终端中加入车辆终端的语音助手供用户使用,车辆终端的语音助手在车上为用户提供了很多便捷的操作。
相关技术中,车辆终端的语音助手的虚拟形象的构建有很多种类型,例如二维图标类型、三维图标类型或者二维虚拟人类型,但构建出来的形象都比较单一,没有真实的虚拟人感,不能给用户带来视觉上的灵动、逼真的感觉。
发明内容
本申请提供一种形象配置方法、装置、车辆终端及存储介质,以至少解决相关技术中车辆终端的语音助手的虚拟形象单一,不够灵动逼真的技术问题。本申请的技术方案如下:
根据本申请涉及的第一方面,提供一种形象配置方法,应用于车辆终端,方法包括:采集车辆终端内的目标对象的图像;从目标对象的图像中提取出目标对象的形象特征;基于目标对象的形象特征,生成语音助手的虚拟形象配置文件。
根据上述技术手段,本申请在构建车辆终端的语音助手的虚拟形象时,通过采集目标对象的图像,从目标对象的图像中提取目标对象的形象特征,进而基于目标对象的形象特征生成语音助手的虚拟形象配置文件,可以看出,本申请提供的形象配置方法,可以根据目标对象的形象特征来生成配置文件,进而可以根据配置文件生成语音助手的虚拟形象,如此,可以使配置得到的语音助手的虚拟形象具有虚拟人感,更加灵动逼真,丰富了语音助手的虚拟形象,能够解决相关技术在构建车辆终端的语音助手的虚拟形象时,构建形象单一、种类少以及没有真实的虚拟人感的问题。
在一种可能的实施方式中,基于目标对象的形象特征,生成语音助手的虚拟形象配置文件,包括:从形象数据库中查找与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号;形象数据库用于存储语音助手的虚拟形象的多个形象特征,以及虚拟形象的每个形象特征的编号;基于与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号,生成语音助手的虚拟形象配置文件。
根据上述技术手段,本申请可以从形象数据库中查找出与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号;根据虚拟形象的形象特征的编号生成语音助手的虚拟形象配置文件。区别于相关技术中语音助手的虚拟形象的形象单一,不具备真实的虚拟人感的技术问题,本申请将目标对象的形象特征与形象数据库中存储的语音助手的虚拟形象的形象特征进行匹配,使得生成的语音助手的虚拟形象与目标对象有一定的相似度,提高语音助手的虚拟形象的真实感,使语音助手的虚拟形象更加逼真。同时,形象数据库中语音助手的虚拟形象的形象特征是可拓展的,可以定时对形象数据库中的形象特质进行类型的拓展和数量的扩充,以提高语音助手的虚拟形象的形象特征与目标对象的形象特征之间的相似度,使得生成的语音助手的虚拟形象更加的灵动和逼真,提高语音助手的虚拟形象配置时的准确度。
在一种可能的实施方式中,基于目标对象的形象特征,生成语音助手的虚拟形象配置文件,包括:获取虚拟形象在多个场景下的动作数据;基于目标对象的形象特征和虚拟形象在多个场景下的动作数据,生成虚拟形象配置文件。
根据上述技术手段,本申请可以根据使用场景的不同,为语音助手的虚拟形象设置不同的动作数据,使语音助手的形象更加生动灵活,提升用户的使用体验。
在一种可能的实施方式中,方法还包括:响应于用户对虚拟形象的形象特征的修改,获取虚拟形象的修改后的形象特征;根据虚拟形象的修改后的形象特征,更新虚拟形象配置文件。
根据上述技术手段,区别于相关技术中语音助手的虚拟形象都是相同的,或者语音助手的虚拟形象只有几类外观类型可供用户选择,无法满足用户的多样化和个性化需求,本申请可以为用户提供语音助手的虚拟形象的配置的选择界面,用户除了使用车辆终端匹配出的语音助手的虚拟形象外,还可以根据自己的喜好从选择界面中自由定制车辆终端的语音助手的虚拟形象;同时本申请的操作简单,使用方便,用户只需要简单的操作几步,就能实现对用户的图像的扫描、特征提取和形象生成等一系列复杂操作,降低了用户的学习成本,提升了用户的参与度,给用户带来了良好的使用体验。
在一种可能的实施方式中,方法还包括:在第一场景下,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的三维图像数据;基于三维图像数据,在车辆终端的显示界面上显示语音助手的三维虚拟形象;第一场景为车辆终端的中央处理器CPU和/或内存的占用率小于或等于预设阈值的场景;或者,在第二场景下,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的二维图像数据;基于二维图像数据,在显示界面上显示语音助手的二维虚拟形象;第二场景为车辆终端的CPU和/或内存的占用率大于预设阈值的场景。
根据上述技术手段,本申请可以根据语音助手的虚拟形象的使用场景的不同,使语音助手的虚拟形象在显示界面显示不同维度的形象,进而优化车辆终端的中央处理器(central processing unit,CPU)和/或内存的占用率,避免CPU和/或内存占用率过高,影响用户的其他操作。
在一种可能的实施方式中,基于虚拟形象配置文件,生成语音助手的虚拟形象的二维图像数据,包括:基于虚拟形象配置文件,构建虚拟形象的三维模型;对三维模型进行二维渲染,得到二维图像数据。
根据上述技术手段,本申请通过对三维模型渲染,得到二维图像数据,可以在车辆终端的CPU和/或内存的占用率大于预设阈值时,在显示界面上显示语音助手的二维虚拟形象,进而避免CPU和/或内存占用率过高,影响用户的其他操作,同时又能保证语音助手的虚拟形象具有生动、逼真的视觉效果。
在一种可能的实施方式中,上述二维图像数据包括多帧连续的二维图像;上述基于二维图像数据,在显示界面上显示语音助手的二维虚拟形象,包括:基于多帧连续的二维图像和预设帧率,在显示界面上显示语音助手的二维虚拟形象。
根据上述技术手段,本申请可以在第二场景下,照预设帧率,以连续视频帧的形式显示语音助手的二维虚拟形象。在该帧速下二维虚拟形象所展示的动作为连续的。如此,既能解决CPU和/或内存占用率过高的问题,又能保证语音助手的虚拟形象具有生动的视觉效果。
根据本申请提供的第二方面,提供一种形象配置装置,包括:采集模块,用于采集车辆终端内的目标对象的图像;提取模块,用于从目标对象的图像中提取出目标对象的形象特征;生成模块,用于基于目标对象的形象特征,生成语音助手的虚拟形象配置文件。
在一种可能的实施方式中,形象配置装置,还包括查找模块;查找模块,用于从形象数据库中查找与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号;形象数据库用于存储语音助手的虚拟形象的多个形象特征,以及虚拟形象的每个形象特征的编号;生成模块,具体用于基于与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号,生成语音助手的虚拟形象配置文件。
在一种可能的实施方式中,形象配置装置,还包括获取模块;获取模块,用于获取虚拟形象在多个场景下的动作数据;生成模块,具体用于基于目标对象的形象特征和虚拟形象在多个场景下的动作数据,生成虚拟形象配置文件。
在一种可能的实施方式中,形象配置装置,还包括获取模块;获取模块,还用于响应于用户对虚拟形象的形象特征的修改,获取虚拟形象的修改后的形象特征;生成模块,还用于根据虚拟形象的修改后的形象特征,更新虚拟形象配置文件。
在一种可能的实施方式中,生成模块,还用于在第一场景下,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的三维图像数据;基于三维图像数据,在车辆终端的显示界面上显示语音助手的三维虚拟形象;第一场景为车辆终端的中央处理器CPU和/或内存的占用率小于或等于预设阈值的场景;或者,在第二场景下,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的二维图像数据;基于二维图像数据,在显示界面上显示语音助手的二维虚拟形象;第二场景为车辆终端的CPU和/或内存的占用率大于预设阈值的场景。
在一种可能的实施方式中,生成模块,具体用于基于虚拟形象配置文件,构建虚拟形象的三维模型;对三维模型进行二维渲染,得到二维图像数据。
在一种可能的实施方式中,二维图像数据包括多帧连续的二维图像;上述生成模块,具体用于基于多帧连续的二维图像和预设帧率,在显示界面上显示语音助手的二维虚拟形象。
根据本申请提供的第三方面,提供一种车辆终端,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述第一方面中及其任一种可能的实施方式的方法。
根据本申请提供的第四方面,提供一种计算机可读存储介质,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述第一方面中及其任一种可能的实施方式的方法。
由此,本申请的上述技术特征具有以下有益效果:
(1)本申请在构建车辆终端的语音助手的虚拟形象时,通过采集目标对象的图像,从目标对象的图像中提取目标对象的形象特征,进而基于目标对象的形象特征生成语音助手的虚拟形象配置文件,可以看出,本申请提供的形象配置方法,可以根据目标对象的形象特征来生成配置文件,进而可以根据配置文件生成语音助手的虚拟形象,如此,可以使配置得到的语音助手的虚拟形象具有虚拟人感,更加灵动逼真,丰富了语音助手的虚拟形象,能够解决相关技术在构建车辆终端的语音助手的虚拟形象时,构建形象单一、种类少以及没有真实的虚拟人感的问题。
(2)本申请可以从形象数据库中查找出与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号;根据虚拟形象的形象特征的编号生成语音助手的虚拟形象配置文件。区别于相关技术中语音助手的虚拟形象的形象单一,不具备真实的虚拟人感的技术问题,本申请将目标对象的形象特征与形象数据库中存储的语音助手的虚拟形象的形象特征进行匹配,使得生成的语音助手的虚拟形象与目标对象有一定的相似度,提高语音助手的虚拟形象的真实感,是语音助手的虚拟形象更加逼真。同时,形象数据库中语音助手的虚拟形象的形象特征是可拓展的,可以定时对形象数据库中的形象特质进行类型的拓展和数量的扩充,以提高语音助手的虚拟形象地形象特征与目标对象的形象特征之间的相似度,使得生成的语音助手的虚拟形象更加的灵动和逼真,提高语音助手的虚拟形象配置时的准确度。
(3)本申请可以根据使用场景的不同,为语音助手的虚拟形象设置不同的动作数据,使车辆终端的语音助手的形象更加生动灵活,提升用户的使用体验。
(4)区别于相关技术中语音助手的虚拟形象都是相同的,或者语音助手的虚拟形象只有几类外观类型可供用户选择,无法满足用户的多样化和个性化需求,本申请可以为用户提供语音助手的虚拟形象的配置的选择界面,用户除了使用车辆终端匹配出的语音助手的虚拟形象外,还可以根据自己的喜好从选择界面中自由定制车辆终端的语音助手的虚拟形象;同时本申请的操作简单,使用方便,用户只需要简单的操作几步,就能实现对用户的图像的扫描、特征提取和形象生成等一系列复杂操作,降低了用户的学习成本,提升了用户的参与度,给用户带来了良好的使用体验。
(5)本申请可以根据使用场景的不同,为虚拟人物配置不同的动作,使车辆终端的语音助手的形象更加生动灵活,提升用户的使用体验。
(6)本申请可以根据语音助手的虚拟形象的使用场景的不同,使语音助手的虚拟形象在显示界面显示不同维度的形象,进而优化车辆终端的CPU和/或内存的占用率,避免CPU和/或内存占用率过高,影响用户的其他操作。
(7)本申请通过对三维模型渲染,得到二维图像数据,可以在车辆终端的CPU和/或内存的占用率大于预设阈值时,在显示界面上显示语音助手的二维虚拟形象,进而避免CPU和/或内存占用率过高,影响用户的其他操作,同时又能保证语音助手的虚拟形象具有生动、逼真的视觉效果。
(8)本申请可以在第二场景下,照预设帧率,以连续视频帧的形式,显示语音助手的二维虚拟形象。在该帧速下二维虚拟形象所展示的动作为连续的。如此,既能解决CPU和/或内存占用率过高的问题,又能保证语音助手的虚拟形象具有生动的视觉效果。
需要说明的是,第二方面至第四方面中的任一种实现方式所带来的技术效果可参见第一方面中对应实现方式所带来的技术效果,此处不再赘述。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理,并不构成对本申请的不当限定。
图1是根据一示例性实施例实处的一种形象配置系统结构图;
图2是根据一示例性实施例示出的一种形象配置方法的流程图;
图3是根据一示例性实施例示出的另一种形象配置方法的流程图;
图4是根据一示例性实施例示出的另一种形象配置方法的流程图
图5是根据一示例性实施例示出的一种形象配置装置结构图;
图6是根据一示例性实施例示出的车辆终端的结构图。
其中,700-形象配置装置、701-采集模块、702-提取模块、703-生成模块、704-查找模块、705-获取模块、800-车辆终端、801-处理器、802-存储器。
具体实施方式
为了使本领域普通人员更好地理解本申请的技术方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
下面参考附图描述本申请实施例的形象配置方法、装置、车辆终端及存储介质。针对上述背景技术中提到的相关技术中车辆终端的语音助手的虚拟形象的构建有很多种类型,例如二维图标类型、三维图标类型或者二维虚拟人类型,但构建出来的形象都比较单一,没有那种真实的虚拟人感,没有给用户带来视觉上的灵动、逼真的感觉,本申请提供了一种形象配置方法,可以在构建车辆终端的语音助手的虚拟形象时,通过采集目标对象的图像,从目标对象的图像中提取目标对象的形象特征,进而基于目标对象的形象特征生成语音助手的虚拟形象配置文件,可以看出,本申请提供的形象配置方法,可以根据目标对象的形象特征来生成配置文件,进而可以根据配置文件生成语音助手的虚拟形象,如此,可以使配置得到的语音助手的虚拟形象具有虚拟人感,更加灵动逼真,丰富了语音助手的虚拟形象,能够解决相关技术在构建车辆终端的语音助手的虚拟形象时,构建形象单一、种类少以及没有真实的虚拟人感的问题。
为了便于理解,以下结合附图对本申请提供的形象配置方法进行具体介绍。
图1是根据一示例性实施例示出的一种形象配置系统,如图1所示,该形象配置系统包括:屏幕100、车内摄像头200、形象采集子系统300、形象复刻子系统400、三维立体引擎500和形象手动选择子系统600。
其中,屏幕100,用于展示语音助手的虚拟形象。
车内摄像头200,用于采集车辆终端内的目标对象的图像。
形象采集子系统300,用于从目标对象的图像中提取出目标对象的形象特征。
形象复刻子系统400,用于基于目标对象的形象特征,生成语音助手的虚拟形象配置文件。
形象复刻子系统400,具体用于从形象数据库中查找与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号;形象数据库用于存储语音助手的虚拟形象的多个形象特征,以及虚拟形象的每个形象特征的编号;基于与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号,生成语音助手的虚拟形象配置文件。
形象复刻子系统400,具体用于获取虚拟形象在多个场景下的动作数据;基于目标对象的形象特征和虚拟形象在多个场景下的动作数据,生成虚拟形象配置文件。
形象复刻子系统400,还用于根据采集到的形象特征,结合形象数据库里的形象特征对应的编号,生成配置文件,并将用户对该虚拟形象起的新名字对其进行标记;然后将标记后的配置文件导入语音助手。当用户用起的新名字唤醒语音助手时,屏幕100上呈现出来的形象即是配置生成的虚拟形象。
三维立体引擎500,用于基于语音助手的虚拟形象配置文件,在屏幕100上展示语音助手的虚拟形象。
作为一种可能的实现方式,三维立体引擎500,具体用于在第一场景下,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的三维图像数据;基于三维图像数据,在车辆终端的显示界面上显示语音助手的三维虚拟形象。
其中,第一场景为车辆终端的中央处理器(central processing unit,CPU)和/或内存的占用率小于或等于预设阈值的场景。
作为另一种可能的实现方式,三维立体引擎500,具体用于在第二场景下,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的二维图像数据;基于二维图像数据,在显示界面上显示语音助手的二维虚拟形象。
其中,第二场景为车辆终端的CPU和/或内存的占用率大于预设阈值的场景。
示例性的,三维立体引擎500,具体用于基于虚拟形象配置文件,构建虚拟形象的三维模型;对三维模型进行二维渲染,得到二维图像数据。
形象手动选择子系统600,用于响应于用户对虚拟形象的形象特征的修改,获取虚拟形象的修改后的形象特征;根据虚拟形象的修改后的形象特征,更新虚拟形象配置文件。
形象手动选择子系统600,还用于将用户对该虚拟形象起的新名字对其进行标记;然后将标记后的配置文件导入语音助手。当用户用起的新名字唤醒语音助手时,三维立体引擎500通基于配置文件,调用形象造型数据,然后加载运行,呈现出来的形象即是配置生成的虚拟形象。
图2是根据一示例性实施例示出的一种形象配置方法的流程图,如图2所示,该形象配置方法包括以下步骤:
S101、采集车辆终端内的目标对象的图像。
作为一种可能的实现方式,上述步骤S101可以实现为:在用户打开形象采集界面后,通过车内摄像头采集目标对象的图像。
作为另一种可能的实现方式,上述步骤S101可以实现为:从车内摄像头所拍摄的视频流中,获取目标对象的图像;其中,目标对象的图像为上述视频流中的任意一个图片帧。
在一些实施例中,当车内摄像头采集到的图像或图片帧中包括多个对象时,用户可以手动选择图像或图片帧中的任一对象作为目标对象,以得到目标对象的图像。
另外,为了提高对目标对象的图像采集的准确度,对车内摄像头的拍摄性能有一定的要求。如,摄像头的清晰度要高,以便能够准确的提取人脸的脸型、发型、是否佩戴眼镜等信息;摄像头的拍摄延时要短,目标对象不需要为了保证拍摄效果特意保持造型,采集到的图像也不会因为动作发生变化产生虚影;摄像头对光线的适应性要好,不能对光线变化太敏感,确保目标对象在绝大多数场景下都可以正常采集图像。
S102、从目标对象的图像中提取出目标对象的形象特征。
其中,目标对象的形象特征包括多种类别的形象特征,例如脸型、发型、眼型和配饰等。
在一些实施例中,从目标对象的图像中提取出目标对象的形象特征,包括:将目标对象的图像输入形象识别模型,得到目标对象的形象特征;其中,形象识别模型用于从目标对象的图像中提取目标对象的形象特征。例如,形象识别模型提取出的目标对象的形象特征包括圆脸、长发、丹凤眼和戴耳钉等。
作为一种可能的实现方式,上述形象识别模型的训练过程可以实现为:获取多张人脸图像;根据每张人脸图像的形象特征,分别为每一张人脸图像配置标签;例如,为人脸图像配置发型标签、脸型标签、标签、眼型标签和配饰标签等;根据多张人脸图像,以及每张人脸图像对应的标签,构建训练样本,根据训练样本对形象识别模型进行训练,得到训练好的形象识别模型。
示例性的,以目标对象的发型为例,形象识别模型可以识别用户的发型,例如,长发、短发或者盘发。形象识别模型可以根据设计上的需要对用户的发型进行拓展,如增加羊角辫和马尾辫等发型。
在一些实施例中,上述形象识别模型可以从不同的图像背景中识别出目标对象的发型。可以理解的是,发型的识别是比较困难的,因为目标对象的图像背景是一个很重要的因素,如果图像背景与头发色差比较大,则容易识别出对象的发型;但如果图像背景与头发颜色相近,则难以准确识别对象的发型。因此,本申请实施例在训练形象识别模型,采用不同图像背景的目标对象的图像对形象识别模型进行训练,可以提高形象识别模型对于发型识别的准确度。
示例性的,以目标对象的脸型为例,形象识别模型可以识别目标对象的脸型属于哪一种,如包子脸、瓜子脸和长脸等。
示例性的,以目标对象是否戴眼镜为例,如果目标对象的图像中是戴着眼镜的,形象识别模型在识别时就会相应的识别出戴眼镜这一形象特征。并且形象识别模型可以根据设计的需要对眼镜的细节进行拓展,如眼镜是方形的还是圆形的等。
示例性的,以目标对象的五官特征为例,形象识别模型可以识别出目标对象是高鼻梁、矮鼻梁、大鼻头、小鼻头、大眼睛、小眼睛、眉眼紧凑或眉眼疏远等。
可以理解的是,在采集目标对象的图像的过程中,会受到诸多环境因素的影响,例如,光线的明暗、背景等。因此在训练形象识别模型时,需要采集不同环境下的目标对象的图像进行标定,来对形式识别模型进行训练,以提高形象识别模型的识别准确度。
可以理解的是,根据设计的需要和用户的实际需求,形象识别模型能够识别的种类和细节可以不断地拓展,每增加一个类型,可以使形象模拟模型尽可能多地模拟各种使用场景,不断对形象识别模型进行适配,以提高形象识别模型对目标对象的形象特征识别的准确度。
需要说明的是,本申请实施例对上述形象特征以及形象识别模型的说明仅为示例,并不构成对本申请实施例提供的形象配置方法的具体限定。在另一些实施例中,形象特征还可以包括其他类型,形象识别模型还可以识别其他类型的形象特征。可以理解的是,形象识别模型能够识别出的形象特征的类型可以根据不同使用场景进行适配,并不局限于上述的几种类型,例如,形象识别模型能够识别出的形象特征的类型可以根据系统设置和用户需求灵活选择,本申请实施例对此不作限定。
S103、基于目标对象的形象特征,生成语音助手的虚拟形象配置文件。
在一些实施例中,上述步骤S103可以实现为:从形象数据库中查找与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号;形象数据库用于存储语音助手的虚拟形象的多个形象特征,以及虚拟形象的每个形象特征的编号;基于与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号,生成语音助手的虚拟形象配置文件。
作为一种可能的实现方式,目标对象的形象特征可以包括:脸型、发型以及配饰等多个形象特征。
在一些实施例中,形象数据库包括语音助手的虚拟形象的多个形象特征集合。每个形象特征集合中包括虚拟形象的多种不同类型的形象特征。
示例性的,假设形象数据库中包括第一形象特征集合。第一形象特征集合为虚拟形象的第一形象特征对应的不同类型的形象特征的集合。例如,第一形象特征结合可以为虚拟形象的脸型集合,第一形象特征集合中包括虚拟形象的不同类型的脸型,例如:瓜子脸形象特征、长脸形象特征以及圆脸形象特征等。
在一些实施例中,形象数据库存储语音助手的虚拟形象的形象特征时,每个形象特征都对应有不同的编号,用来标识语音助手的虚拟形象的形象特征。示例性的,形象数据库包括形象特征集合,形象特征集合用于存储语音助手的虚拟形象的形象特征及编号。例如,形象特征集合A包括:第一形象特征集合A1、第二形象特征集合A2和第三形象特征集合A3.其中,第一形象特征集合A1为第一形象特征(脸型)对应的不同类型的形象特征的集合;例如,第一形象特征集合A1包括:瓜子脸A1-1、圆脸A1-2等形象特征。第二形象特征集合A2为第二形象特征(发型)对应的不同类型的形象特征的集合;例如,第二形象特征集合A2包括:长发A2-1、短发A2-2等形象特征。第三形象特征集合A3为第三形象特征(配饰)对应的不同类型的形象特征的集合;例如,第三形象特征集合包括:戴眼镜A3-1、戴耳环A3-2等形象特征。
示例性的,若形象识别模型识别出目标对象的形象特征为瓜子脸和短发,则可以根据语音助手的虚拟形象的形象特征对应的编号,确定与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号为:A1-1和A2-2。
作为一种可能的实现方式,形象复刻子系统查找到与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号后,可生成语音助手的虚拟形象配置文件。其中,配置文件中包括:与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征及编号。例如,配置文件中包括:[圆脸A1-2、长发A2-1、戴眼镜A3-1]。
在一些实施例中,形象数据库还用于存储语音助手的虚拟形象的动作数据及编号;上述步骤S103可以实现为:获取虚拟形象在多个场景下的动作数据;基于目标对象的形象特征和虚拟形象在多个场景下的动作数据,生成虚拟形象配置文件。
作为一种可能的实现方式,为了使语音助手的虚拟形象视觉上看起来生动灵活,在使用语音助手时,厂商会根据使用场景的不同提前为语言助手的虚拟形象设计多组动作造型,每组动作造型对应的动作数据都存储在存储器中,当用户在不同的场景下使用语音助手时,语音助手的虚拟形象可以展示不同的动作造型。其中,动作造型包括说话时嘴部动作,手部的动作,腿部的动作,身体部位的动作,头部的动作,转身动作等。
在一些实施例中,形象数据库中存储的动作数据包括第一动作集合;第一动作集合为虚拟形象的第一部位对应的不同类型的动作数据的集合。示例性的,虚拟形象的第一部位为虚拟形象的多个部位中的任意一个部位。例如,假设虚拟形象的多个部位包括:脸部、手部以及嘴部等;则虚拟形象的第一部位可以为嘴部,则第一动作集合可以为嘴部对应的不同类型的动作数据的集合,例如,第一动作集合可以包括:说话的动作数据和微笑的动作数据等。
示例性的,假设提前设计好的动作造型包括虚拟形象的嘴部的动作造型,则从第一动作集合中来确定语音助手的虚拟形象的动作数据。假设提前设计好的动作造型为微笑,则语音助手的虚拟形象配置的动作数据为微笑的动作数据。
在一些实施例中,形象数据库中存储的动作数据都对应有不同的编号。示例性的,假设形象数据库包括动作造型集合,动作造型集合用于存储动作数据。例如,动作造型集合B包括:第一动作集合B1和第二动作集合B2。其中,第一动作集合B1为虚拟形象的第一部位(嘴部)对应的不同类型的动作数据的集合;例如,第一动作集合B1包括:说话B1-1、微笑B1-2等动作数据。第二动作集合B2为虚拟形象的第二部位(手部)对应的不同类型的动作数据的集合;例如,第二动作集合B2包括:摆手B2-1、挥手B2-2等动作数据。
作为一种可能的实现方式,形象复刻子系统基于目标对象的形象特征和虚拟形象在多个场景下的动作数据,生成虚拟形象配置文件。其中,虚拟形象配置文件中包括:动作数据及对应的编号。例如,虚拟形象配置文件中包括:[说话B1-1、摆手B2-1]。
此外,这些动作类造型,不会根据形象配置进行调整,而是与使用场景相匹配,使语音助手形象看起来更生动逼真。例如,语音助手在进行播报时,处理器会调用嘴部动作的造型数据;当语音助手在进行导航时,处理器除了调用嘴部动作的造型数据外,还会调用手部动作的造型数据并显示在语音助手的虚拟形象上。
可以理解的是,每个形象特征和动作数据都对应有不同的编号,并保存在形象数据库中;对每个形象特征或动作数据逐层分类进行编号,便于形象数据库后续对形象特征或动作数据进行调取;同时当对形象特征或动作数据的类型和内容进行扩充时,也可按照上述编号规律继续进行编号,便于对形象数据库中存储的形象特质或动作数据进行拓展。
在一些实施例中,语音助手的虚拟形象还可以由用户手动配置。示例性的,可以实现为以下步骤:
步骤a1、响应于用户对虚拟形象的形象特征的修改,获取虚拟形象的修改后的形象特征。
作为一种可能的实现方式,用户可以在形象采集界面,手动选择自己喜欢的语音助手的配饰等形象特征,语音助手的虚拟形象会被更新为用户自己设计的形象。
步骤a2、根据虚拟形象的修改后的形象特征,更新虚拟形象配置文件。
可以理解的是,根据用户手动选择的虚拟形象的形象特征更新虚拟形象配置文件,进而由三维立体引擎通过车机屏幕将用户修改后的语音助手的虚拟形象显示出来。例如,用户自定义选定了瓜子脸、长发和戴眼镜等,车机屏幕显示出来的语音助手的虚拟形象就会显示相对应的形象特征。
在一些实施例中,如图3所述,在上述步骤S103之后,上述方法还包括以下步骤:
S104、响应于用户唤醒语音助手的操作,在车辆终端的显示界面上显示语音助手的虚拟形象。
示例性的,用户唤醒语音助手的操作包括:语音操作或触屏操作等。例如,用户可以呼叫语音助手的虚拟形象的名字,以唤醒语音助手。又例如,用户可以在车机屏幕上点击唤醒语音助手的按键,以唤醒语音助手。
作为一种可能的实现方式,在第一场景下,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的三维图像数据;基于三维图像数据,在车辆终端的显示界面上显示语音助手的三维虚拟形象。
其中,第一场景为车辆终端的CPU和/或内存的占用率小于或等于预设阈值的场景。例如,第一场景可以是导航场景。上述预设阈值可以是80%。
作为另一种可能的实现方式,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的二维图像数据;基于二维图像数据,在显示界面上显示语音助手的二维虚拟形象。
其中,第二场景为车辆终端的CPU和/或内存的占用率大于预设阈值的场景。例如,第二场景可以是语音播报场景。
例如,语音助手的使用场景为语音播报场景的情况下,可以展示三维形象,使得语音助手的虚拟形象更加灵动逼真,具有真实的虚拟人感。当语音助手的使用场景为导航场景的情况下,可以展示二维形象,避免CPU和/或内存的占用率过高。
在一些实施例中,上述二维图像数据包括多帧连续的二维图像。则上述基于二维图像数据,在显示界面上显示语音助手的二维虚拟形象,包括:基于多帧连续的二维图像和预设帧率,在显示界面上显示语音助手的二维虚拟形象。示例性的,上述预设帧率可以为每秒20帧。可以理解的是,本申请实施例可以在第二场景下,照预设帧率,以连续视频帧的形式显示语音助手的二维虚拟形象。在该帧速下二维虚拟形象所展示的动作为连续的。如此,既能解决CPU和/或内存占用率过高的问题,又能保证语音助手的虚拟形象具有生动的视觉效果。
在一些实施例中,基于虚拟形象配置文件,生成语音助手的虚拟形象的二维图像数据,包括:基于虚拟形象配置文件,构建虚拟形象的三维模型;对三维模型进行二维渲染,得到二维图像数据。
可以理解的是,与手机3D游戏不同,用户打开手机3D游戏软件后,不会再打开其他视频等软件,几乎不存在多个软件同时使用的情况;而车辆终端的语音助手和车辆终端的其他功能经常存在同一时间段内长时间使用的情况,如在视频播放界面唤醒语音助手等,车机上如何解决CPU和/或内存长期高负荷占用是一个难题。本申请可以通过三渲二(例如本申请实施例中提供的构建三维模型,对三维模型进而二维渲染)的方法来解决此问题,在CPU和/或内存占用率较高的场景,语音助手的虚拟形象由三维虚拟形象切换到二维虚拟形象;同时为保证语音助手的虚拟形象生动逼真,给二维虚拟形象采用连续帧的方式配上连贯动作,每秒20帧,该帧速下肉眼看到的动作几乎是连续的。该方案既能解决硬件资源问题,又能保证语音助手的虚拟形象的逼真效果。
可以理解的是,虚拟形象的维数越多,虚拟形象就会越逼真;每个维数的分辨率越高,虚拟形象的清晰度就会越高。同时在语音助手的使用场景为高能耗的情况下,将语音助手的虚拟形象配置为二维形象,可以优化处理器的CPU和内存的占用率,避免CPU和/或内存占用率过高给用户带来不好的使用体验。
为了便于理解,下面以示例的形式对本申请实施例提供的一种形象配置方法进行举例说明。
示例性的,用户需要配置车辆终端内语音助手的虚拟形象,车辆终端中已安装有用来配置语音助手的虚拟形象的语音助手形象配置软件,如图4所示,形象配置过程可实现为以下步骤:
步骤a1、用户点击屏幕上的语音助手形象配置软件。
步骤a2、语音助手形象配置软件判断语音助手是否已存在配置后的虚拟形象。
步骤a3、若已存在配置后的虚拟形象,车机屏幕直接跳转界面,显示已配置的虚拟形象,并弹出虚拟形象修改按钮,询问和引导用户选择虚拟形象修改;若不存在配置后的虚拟形象,则直接执行步骤a5。
步骤a4、用户点击虚拟形象修改按钮,对想要配置的虚拟形象进行修改。
步骤a5、车机屏幕弹出性别选择界面,引导用户选择男性或女性。
步骤a6、完成性别选择后,界面跳转至车内摄像头显示的图像。
步骤a7、形象采集子系统对人脸进行识别和搜索,当识别到人脸后用相框框选出来,提示用户选择需要复刻的人脸。
步骤a8、用户选择后,形象采集子系统会对已选择的人脸进行特征提取,包括发型、脸型、眼镜、装饰配饰等;然后形成形象特征,发送给形象复刻子系统。
步骤a9、形象复刻子系统将根据收到的形象特征,制作配置文件,将该配置文件导入语音助手。
步骤a10、三维立体引擎根据配置文件将配置后的语音助手的虚拟形象加载运行并显示出来。
可以理解的是,与手机三维形象定制游戏软件相比,手机三维形象定制游戏软件的三维形象配置主要是一款独立的娱乐性质的软件,主要展示造型效果及动作等效果即可;而本申请实施例提供的形象配置方法,在语音助手的虚拟形象配置完成后,具有语音助手的全部功能,能够识别用户的指令并去执行对应的操作。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,形象配置装置或电子设备包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法,示例性的对形象配置装置或电子设备进行功能模块的划分,例如,形象配置装置或电子设备可以包括对应各个功能划分的各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图5是根据一示例性实施例示出的一种形象配置装置的框图。参照图5,该形象配置装置700包括:采集模块701、提取模块702、生成模块703。
采集模块701,用于采集车辆终端内的目标对象的图像。
提取模块702,用于从目标对象的图像中提取出目标对象的形象特征。
生成模块703,用于基于目标对象的形象特征,生成语音助手的虚拟形象配置文件。在一些实施例中,
在一些实施例中,形象配置装置700,还包括查找模块704;查找模块704,用于从形象数据库中查找与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号;形象数据库用于存储语音助手的虚拟形象的多个形象特征,以及虚拟形象的每个形象特征的编号;上述生成模块703,具体用于基于与目标对象的形象特征相匹配的语音助手的虚拟形象的形象特征的编号,生成语音助手的虚拟形象配置文件。
在一些实施例中,形象配置装置700,还包括获取模块705;上述获取模块705,用于获取虚拟形象在多个场景下的动作数据;上述生成模块703,具体用于基于目标对象的形象特征和虚拟形象在多个场景下的动作数据,生成虚拟形象配置文件。
在一些实施例中,形象配置装置700,还包括获取模块705;上述获取模块705,还用于响应于用户对虚拟形象的形象特征的修改,获取虚拟形象的修改后的形象特征;上述生成模块703,还用于根据虚拟形象的修改后的形象特征,更新虚拟形象配置文件。
在一些实施例中,上述生成模块703,还用于在第一场景下,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的三维图像数据;基于三维图像数据,在车辆终端的显示界面上显示语音助手的三维虚拟形象;第一场景为车辆终端的中央处理器CPU和/或内存的占用率小于或等于预设阈值的场景;或者,在第二场景下,响应于用户唤醒语音助手的操作,基于虚拟形象配置文件,生成语音助手的虚拟形象的二维图像数据;基于二维图像数据,在显示界面上显示语音助手的二维虚拟形象;第二场景为车辆终端的CPU和/或内存的占用率大于预设阈值的场景。
在一些实施例中,上述生成模块703,具体用于基于虚拟形象配置文件,构建虚拟形象的三维模型;对三维模型进行二维渲染,得到二维图像数据。
在一些实施例中,二维图像数据包括多帧连续的二维图像;上述生成模块703,具体用于基于多帧连续的二维图像和预设帧率,在显示界面上显示语音助手的二维虚拟形象。
根据上述技术手段,本申请提供了一种形象配置方法,可以在构建车辆终端的语音助手的虚拟形象时,通过采集目标对象的图像,从目标对象的图像中提取目标对象的形象特征,进而基于目标对象的形象特征生成语音助手的虚拟形象配置文件,可以看出,本申请提供的形象配置方法,可以根据目标对象的形象特征来生成配置文件,进而可以根据配置文件生成语音助手的虚拟形象,如此,可以使配置得到的语音助手的虚拟形象具有虚拟人感,更加灵动逼真,丰富了语音助手的虚拟形象,能够解决相关技术在构建车辆终端的语音助手的虚拟形象时,构建形象单一、种类少以及没有真实的虚拟人感的问题。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种车辆终端的框图。如图6所示,车辆终端800包括但不限于:处理器801和存储器802。
其中,上述的存储器802,用于存储上述处理器801的可执行指令。可以理解的是,上述处理器801被配置为执行指令,以实现上述实施例中的形象配置方法。
需要说明的是,本领域技术人员可以理解,图6中示出的车辆终端800结构并不构成对车辆终端800的限定,车辆终端800可以包括比图6所示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器801是车辆终端800的控制中心,利用各种接口和线路连接整个车辆终端800的各个部分,通过运行或执行存储在存储器802内的软件程序和/或模块,以及调用存储在存储器802内的数据,执行车辆终端800的各种功能和处理数据,从而对车辆终端800进行整体监控。处理器801可包括一个或多个处理单元。可选的,处理器801可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器801中。
存储器802可用于存储软件程序以及各种数据。存储器802可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能模块所需的应用程序(比如确定单元、处理单元等)等。此外,存储器802可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器802,上述指令可由车辆终端800的处理器801执行以实现上述实施例中的形象配置方法。
在实际实现时,图5中的采集模块701、提取模块702、生成模块703、查找模块704和获取模块705的功能均可以由图6中的处理器801调用存储器802中存储的计算机程序实现。其具体的执行过程可参考上实施例中的形象配置方法部分的描述,这里不再赘述。
可选地,计算机可读存储介质可以是非临时性计算机可读存储介质,例如,该非临时性计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,本申请实施例还提供了一种包括一条或多条指令的计算机程序产品,该一条或多条指令可以由车辆终端800的处理器801执行以完成上述实施例中的形象配置方法。
需要说明的是,上述计算机可读存储介质中的指令或计算机程序产品中的一条或多条指令被车辆终端800的处理器执行时实现上述形象配置方法实施例的各个过程,且能达到与上述形象配置方法相同的技术效果,为避免重复,这里不再赘述。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全分类部或者部分功能。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全分类部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全分类部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例方法的全分类部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (13)

1.一种形象配置方法,其特征在于,应用于车辆终端,所述方法包括:
采集所述车辆终端内的目标对象的图像;
从所述目标对象的图像中提取出所述目标对象的形象特征;
基于所述目标对象的形象特征,生成语音助手的虚拟形象配置文件。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标对象的形象特征,生成语音助手的虚拟形象配置文件,包括:
从形象数据库中查找与所述目标对象的形象特征相匹配的所述语音助手的虚拟形象的形象特征的编号;所述形象数据库用于存储所述语音助手的虚拟形象的多个所述形象特征,以及所述虚拟形象的每个所述形象特征的编号;
基于与所述目标对象的形象特征相匹配的所述语音助手的虚拟形象的形象特征的编号,生成所述语音助手的虚拟形象配置文件。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标对象的形象特征,生成语音助手的虚拟形象配置文件,包括:
获取所述虚拟形象在多个场景下的动作数据;
基于所述目标对象的形象特征和所述虚拟形象在多个场景下的动作数据,生成所述虚拟形象配置文件。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于用户对所述虚拟形象的形象特征的修改,获取所述虚拟形象的修改后的形象特征;
根据所述虚拟形象的修改后的形象特征,更新所述虚拟形象配置文件。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在第一场景下,响应于用户唤醒所述语音助手的操作,基于所述虚拟形象配置文件,生成所述语音助手的所述虚拟形象的三维图像数据;基于所述三维图像数据,在所述车辆终端的显示界面上显示所述语音助手的三维虚拟形象;所述第一场景为所述车辆终端的中央处理器CPU和/或内存的占用率小于或等于预设阈值的场景;或者,
在第二场景下,响应于用户唤醒所述语音助手的操作,基于所述虚拟形象配置文件,生成所述语音助手的所述虚拟形象的二维图像数据;基于所述二维图像数据,在所述显示界面上显示所述语音助手的二维虚拟形象;所述第二场景为所述车辆终端的所述CPU和/或所述内存的占用率大于预设阈值的场景。
6.根据权利要求5所述的方法,其特征在于,基于所述虚拟形象配置文件,生成所述语音助手的虚拟形象的二维图像数据,包括:
基于所述虚拟形象配置文件,构建所述虚拟形象的三维模型;
对所述三维模型进行二维渲染,得到所述二维图像数据。
7.根据权利要求5所述的方法,其特征在于,所述二维图像数据包括多帧连续的二维图像;所述基于所述二维图像数据,在所述显示界面上显示所述语音助手的二维虚拟形象,包括:
基于所述多帧连续的二维图像和预设帧率,在所述显示界面上显示所述语音助手的二维虚拟形象。
8.一种形象配置装置,其特征在于,包括:
采集模块,用于采集所述车辆终端内的目标对象的图像;
提取模块,用于从所述目标对象的图像中提取出所述目标对象的形象特征;
生成模块,用于基于所述目标对象的形象特征,生成语音助手的虚拟形象配置文件。
9.根据权利要求8所述的装置,其特征在于,所述形象配置装置,还包括查找模块;
所述查找模块,用于从形象数据库中查找与所述目标对象的形象特征相匹配的所述语音助手的虚拟形象的形象特征的编号;所述形象数据库用于存储所述语音助手的虚拟形象的多个所述形象特征,以及所述虚拟形象的每个所述形象特征的编号;
所述生成模块,具体用于基于与所述目标对象的形象特征相匹配的所述语音助手的虚拟形象的形象特征的编号,生成所述语音助手的虚拟形象配置文件。
10.根据权利要求8所述的装置,其特征在于,所述形象配置装置,还包括获取模块;
所述获取模块,用于获取所述虚拟形象在多个场景下的动作数据;
所述生成模块,具体用于基于所述目标对象的形象特征和所述虚拟形象在多个场景下的动作数据,生成所述虚拟形象配置文件。
11.根据权利要求8所述的装置,其特征在于,所述形象配置装置,还包括获取模块;
所述获取模块,还用于响应于用户对所述虚拟形象的形象特征的修改,获取所述虚拟形象的修改后的形象特征;
所述生成模块,还用于根据所述虚拟形象的修改后的形象特征,更新所述虚拟形象配置文件。
12.一种车辆终端,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1至7中任一项所述的形象配置方法。
13.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中存储的计算机执行指令由电子设备的处理器执行时,所述电子设备能够执行如权利要求1至7中任一项所述的形象配置方法。
CN202310283603.6A 2023-03-21 2023-03-21 一种形象配置方法、装置、车辆终端及存储介质 Pending CN116342764A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310283603.6A CN116342764A (zh) 2023-03-21 2023-03-21 一种形象配置方法、装置、车辆终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310283603.6A CN116342764A (zh) 2023-03-21 2023-03-21 一种形象配置方法、装置、车辆终端及存储介质

Publications (1)

Publication Number Publication Date
CN116342764A true CN116342764A (zh) 2023-06-27

Family

ID=86894361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310283603.6A Pending CN116342764A (zh) 2023-03-21 2023-03-21 一种形象配置方法、装置、车辆终端及存储介质

Country Status (1)

Country Link
CN (1) CN116342764A (zh)

Similar Documents

Publication Publication Date Title
US11256901B2 (en) Image information processing method and apparatus, and computer storage medium
CN100468463C (zh) 用于处理图像的方法、装置
CN105354334B (zh) 一种基于智能镜子的信息发布方法和智能镜子
EP4207080A1 (en) Avatar generation method, apparatus and device, and medium
CN107111861B (zh) 图像处理装置、触笔以及图像处理方法
CN111640202B (zh) 一种ar场景特效生成的方法及装置
CN110298283B (zh) 图像素材的匹配方法、装置、设备以及存储介质
CN112396679B (zh) 虚拟对象显示方法及装置、电子设备、介质
CN111627117B (zh) 画像展示特效的调整方法、装置、电子设备及存储介质
CN111432267B (zh) 视频调整方法、装置、电子设备及存储介质
CN110110118A (zh) 妆容推荐方法、装置、存储介质及移动终端
CN109064387A (zh) 图像特效生成方法、装置和电子设备
KR20210118149A (ko) 메이크업 처리 방법, 장치, 전자 디바이스 및 기록 매체
CN108629339A (zh) 图像处理方法及相关产品
US10650564B1 (en) Method of generating 3D facial model for an avatar and related device
CN108920490A (zh) 辅助化妆的实现方法、装置、电子设备以及存储介质
CN109978975A (zh) 一种动作的迁移方法及装置、计算机设备
CN111667588A (zh) 人物图像处理方法、装置、ar设备以及存储介质
CN113487709A (zh) 一种特效展示方法、装置、计算机设备以及存储介质
CN111862116A (zh) 动漫人像的生成方法及装置、存储介质、计算机设备
CN111640200A (zh) 一种ar场景特效生成的方法及装置
CN109947510A (zh) 一种界面推荐方法及装置、计算机设备
CN114007099A (zh) 一种视频处理方法、装置和用于视频处理的装置
WO2022257766A1 (zh) 图像处理方法、装置、设备及介质
CN111639613A (zh) 一种增强现实ar特效生成方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination