CN113900751A

CN113900751A - 一种合成虚拟形象的方法、装置、服务器和存储介质

Info

Publication number: CN113900751A
Application number: CN202111155824.2A
Authority: CN
Inventors: 周艳君
Original assignee: Ping An Puhui Enterprise Management Co Ltd
Current assignee: Ping An Puhui Enterprise Management Co Ltd
Priority date: 2021-09-29
Filing date: 2021-09-29
Publication date: 2022-01-07

Abstract

本申请适用于人工智能技术领域，提出一种合成虚拟形象的方法、装置、服务器和存储介质。该方法包括：当目标用户的事件处理流程进入指定流程节点时，从预先构建的虚拟形象元素库中查找与所述指定流程节点对应的目标元素分库，其中，所述虚拟形象元素库包含事件处理的各个流程节点分别对应的元素分库，每个所述元素分库包含合成虚拟形象的各个元素部件；根据所述目标用户的用户画像信息从所述目标元素分库中选取各个目标元素部件；基于所述各个目标元素部件合成相应的虚拟形象。通过这样设置，针对不同的事件处理流程节点以及不同的用户，能够分别合成不同的虚拟形象，从而提高合成虚拟形象的灵活性，满足用户对虚拟形象的多样化需求。

Description

一种合成虚拟形象的方法、装置、服务器和存储介质

技术领域

本申请涉及人工智能技术领域，提供一种合成虚拟形象的方法、装置、服务器和存储介质。

背景技术

目前，当用户使用软件产品碰到操作疑问时，通常可以点击软件产品上的客服答疑功能，此时软件产品能够合成相应的虚拟形象，并通过该虚拟形象为用户解答疑问。然而，现有软件产品合成的虚拟形象一般是固定且单一的，难以满足用户对虚拟形象的多样化需求。

发明内容

有鉴于此，本申请提出一种合成虚拟形象的方法、装置、服务器和存储介质，能够提高合成虚拟形象的灵活性，满足用户对虚拟形象的多样化需求。

第一方面，本申请实施例提供了一种合成虚拟形象的方法，包括：

当目标用户的事件处理流程进入指定流程节点时，从预先构建的虚拟形象元素库中查找与所述指定流程节点对应的目标元素分库，其中，所述虚拟形象元素库包含事件处理的各个流程节点分别对应的元素分库，每个所述元素分库包含合成虚拟形象的各个元素部件；

根据所述目标用户的用户画像信息从所述目标元素分库中选取各个目标元素部件；

基于所述各个目标元素部件合成相应的虚拟形象。

本申请实施例预先构建一个虚拟形象元素库，该虚拟形象元素库包含事件处理的各个流程节点分别对应的元素分库，其中每个元素分库可以包含合成虚拟形象的不同元素部件。当用户的事件处理流程进入某个指定流程节点时，会从该虚拟形象元素库找到与该指定流程节点对应的目标元素分库，然后根据用户的画像信息从该目标元素分库中选取各个元素部件，最后基于选取的元素部件合成相应的虚拟形象。通过这样设置，针对不同的事件处理流程节点以及不同的用户，能够分别合成不同的虚拟形象，从而提高合成虚拟形象的灵活性，满足用户对虚拟形象的多样化需求。

在本申请实施例的一种实现方式中，所述根据所述目标用户的用户画像信息从所述目标元素分库中选取各个目标元素部件，可以包括：

根据所述目标用户的用户画像信息，从所述目标元素分库中选取对应的声音元素部件；

从所述目标元素分库中选取与所述声音元素部件对应的人像元素部件；

将所述声音元素部件和所述人像元素部件确定为所述目标元素部件。

不同用户画像信息(例如不同年龄、性别和职业等)的用户青睐的声音一般是不同的，因此可以根据目标用户的用户画像信息，从该目标元素分库中选取对应的声音元素部件，再根据选取的声音元素部件选择匹配的人像元素部件，最后将确定的声音元素部件和人像元素部件作为目标元素部件。

进一步的，所述用户画像信息包括年龄、性别和职业，所述根据所述目标用户的用户画像信息，从所述目标元素分库中选取对应的声音元素部件，可以包括：

若所述目标用户的年龄小于指定阈值、性别为女且职业为非指定职业，则从所述目标元素分库中选取年轻男主播的声音元素部件；

若所述目标用户的年龄小于指定阈值、性别为男且职业为非指定职业，则从所述目标元素分库中选取年轻女主播的声音元素部件；

若所述目标用户的职业为指定职业，则从所述目标元素分库中选取成熟女主播的声音元素部件；

若所述目标用户的年龄大于指定阈值且职业为非指定职业，则从所述目标元素分库中选取成熟男主播的声音元素部件。

进一步的，在将所述声音元素部件和所述人像元素部件确定为所述目标元素部件之后，还可以包括：

获取所述目标用户输入的第一语音信息；

对所述第一语音信息进行NLP识别，得到第一NLP识别结果；

根据所述第一NLP识别结果从所述目标元素分库中选取对应的动作元素部件；

将所述动作元素部件确定为所述目标元素部件。

在某些应用场景下，如果目标用户提出某个疑问，此时服务器通过客户端可以获取相应的语音信息，然后对语音信息进行NLP(自然语言处理)识别，获得NLP识别结果。接着，可以根据NLP识别结果从该目标元素分库中选取对应的动作元素部件，并将选取的动作元素部件也作为待合成的目标元素部件。通过这样设置，能够为合成的虚拟形象添加动作元素，进一步提高人机交互的用户体验。

在本申请实施例的一种实现方式中，在基于所述各个目标元素部件合成相应的虚拟形象之后，还可以包括：

根据所述目标用户的用户画像信息以及所述目标用户输入的第二语音信息，确定所述虚拟形象在所述目标用户所处的客户端的显示界面上的显示方式；

按照所述显示方式将所述虚拟形象输出至所述客户端进行显示。

服务器在基于各个目标元素部件合成虚拟形象之后，可以向目标用户所处的客户端输出该虚拟形象，目标用户可以在客户端上看到该虚拟形象，并可以进行相应的语音交互。具体的，服务器可以根据该目标用户的画像数据以及该目标用户输入的语音信息确定该虚拟形象的显示方式，这里的显示方式可以包括虚拟形象在客户端显示界面中的显示位置，显示尺寸以及显示持续时间等。

进一步的，所述显示方式包括显示位置、显示尺寸或显示持续时间，所述根据所述目标用户的用户画像信息以及所述目标用户输入的第二语音信息，确定所述虚拟形象在所述目标用户所处的客户端的显示界面上的显示方式，可以包括：

根据所述目标用户的用户画像信息确定所述虚拟形象在所述客户端的显示界面上的显示位置、显示尺寸以及显示持续时间；

获取所述目标用户输入的所述第二语音信息，并对所述第二语音信息进行NLP识别，得到第二NLP识别结果；

根据所述第二NLP识别结果对所述虚拟形象在所述客户端的显示界面上的所述显示位置、所述显示尺寸或显示持续时间进行调整。

根据目标用户的用户画像信息，可以设置虚拟形象对应的默认显示位置，默认显示尺寸和默认显示持续时间。另外，目标用户还可以实时输入语音信息对客户端显示的虚拟形象的显示位置，显示尺寸或显示持续时间进行调整。

进一步的，在按照所述显示方式将所述虚拟形象输出至所述客户端进行显示之后，还可以包括：

获取与所述指定流程节点关联的操作指引数据；

将所述操作指引数据输出至所述客户端进行显示，其中，所述操作指引数据在所述客户端的显示界面上的显示位置根据所述虚拟形象在所述客户端的显示界面上的显示位置确定。

服务器可以预先将每个流程节点与相关的操作指引数据进行关联，在向客户端输出虚拟形象时，可以于客户端的虚拟形象周边显示或者播放该操作指引数据，以获得更好的虚拟形象服务效果。

第二方面，本申请实施例提供了一种合成虚拟形象的装置，包括：

元素分库查找模块，用于当目标用户的事件处理流程进入指定流程节点时，从预先构建的虚拟形象元素库中查找与所述指定流程节点对应的目标元素分库，其中，所述虚拟形象元素库包含事件处理的各个流程节点分别对应的元素分库，每个所述元素分库包含合成虚拟形象的各个元素部件；

元素部件选取模块，用于根据所述目标用户的用户画像信息从所述目标元素分库中选取各个目标元素部件；

虚拟形象合成模块，用于基于所述各个目标元素部件合成相应的虚拟形象。

第三方面，本申请实施例提供了一种服务器，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本申请实施例第一方面提出的合成虚拟形象的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如本申请实施例第一方面提出的合成虚拟形象的方法。

第五方面，本申请实施例提供了一种计算机程序产品，当该计算机程序产品在服务器上运行时，使得该服务器执行如本申请实施例第一方面提出的合成虚拟形象的方法。

上述第二方面至第五方面所能实现的有益效果，可以参照上述第一方面的相关说明。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种合成虚拟形象的方法的一个实施例的流程图；

图2是本申请实施例提供的一种合成虚拟形象的方法的另一个实施例的流程图；

图3是本申请实施例提供的一种合成虚拟形象的装置的一个实施例的结构图；

图4是本申请实施例提供的一种服务器的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

本申请实施例提出一种合成虚拟形象的方法、装置、服务器和存储介质，能够提高合成虚拟形象的灵活性，满足用户对虚拟形象的多样化需求。

应当理解，本申请实施例提供的合成虚拟形象的方法的执行主体可以是手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality，AR)/虚拟现实(virtualreality，VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer，UMPC)、上网本、个人数字助理(personal digital assistant，PDA)、大屏电视等终端设备或者服务器，本申请实施例对该终端设备和服务器的具体类型不作任何限制。

这里的服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

请参阅图1，本申请实施例一种合成虚拟形象的方法的一个实施例包括：

101、当目标用户的事件处理流程进入指定流程节点时，从预先构建的虚拟形象元素库中查找与所述指定流程节点对应的目标元素分库；

本申请实施例的执行主体可以是某个业务应用软件对应的服务器，各个用户于客户端打开相应业务APP并登录之后，可以通过对接该服务器完成指定事件(例如贷款、购买金融产品等)的处理。

目标用户是于客户端登录的正在执行指定事件的用户，目标用户可以通过客户端发起指定事件的处理请求，服务器在接收到该处理请求之后，会执行相应的事件处理流程，该事件处理流程可以包含多个流程节点。例如，贷款流程可以包括个人信息录入、联系人信息录入、贷款资质审核以及贷款放款等多个流程节点。

服务器会依次按照各个流程节点对事件进行处理，当事件处理流程进入某个指定流程节点时，会从预先构建的一个虚拟形象元素库中查找与该指定流程节点对应的一个元素分库作为目标元素分库。其中，该虚拟形象元素库包含多个不同的元素分库，每个元素分库都包含合成虚拟形象的各个元素部件，这些元素部件可以相同也可以不同，且每个元素分库都对应一个流程节点。例如，假设事件处理流程中有N个流程节点需要合成对应的虚拟形象输出，则可以构建一个包含N个元素分库(与N个流程节点一一对应)的虚拟形象元素库，每个元素分库都包含对应流程节点合成虚拟形象所需的各个元素部件，例如人体动作、口型和声音等部件。通过这样设置，每个不同的流程节点都可以根据需要查找不同的元素分库，从而合成不同的虚拟形象。

102、根据所述目标用户的用户画像信息从所述目标元素分库中选取各个目标元素部件；

在查找到与该指定流程节点对应的目标元素分库之后，由于该目标元素分库同样具有大量不同的元素部件，而不同的元素部件可以合成不同的虚拟形象，因此还需要从该目标元素分库中选取待合成的各个目标元素部件。

在本申请实施例中，可以通过目标用户的用户画像信息(例如年龄、性别和职业等)从该目标元素分库中选取出各个目标元素部件。具体的，可以针对每个类型的元素部件分别选取一个，作为选取到的目标元素部件，例如若目标元素分库包含“动作”、“口型”和“声音”三种元素部件，则可以分别从“动作”元素部件中选取一个元素部件，从“口型”元素部件中选取一个元素部件，以及从“声音”元素部件中选取一个元素部件，作为选取到的3个目标元素部件，以此类推。

(1)根据所述目标用户的用户画像信息，从所述目标元素分库中选取对应的声音元素部件；

(2)从所述目标元素分库中选取与所述声音元素部件对应的人像元素部件；

(3)将所述声音元素部件和所述人像元素部件确定为所述目标元素部件。

不同用户画像信息(例如不同年龄、性别和职业等)的用户青睐的声音一般是不同的，因此可以根据目标用户的用户画像信息，从该目标元素分库中选取对应的声音元素部件。例如，若目标用户为年轻男性，则可以选取年轻女主播的声音元素部件；若目标用户为年长用户，则可以选取成熟主播的声音元素部件，等等。在这之后，再根据选取的声音元素部件选择匹配的人像元素部件，例如若声音元素部件为年轻女主播的声音元素部件，则匹配的人像元素部件可以为年轻女生的虚拟形象。最后，将确定的声音元素部件和人像元素部件作为目标元素部件。在该目标元素分库中，可以预先设置好用户画像信息与声音元素部件的关联关系，以及声音元素部件与人像元素部件的关联关系。

(1)若所述目标用户的年龄小于指定阈值、性别为女且职业为非指定职业，则从所述目标元素分库中选取年轻男主播的声音元素部件；

(2)若所述目标用户的年龄小于指定阈值、性别为男且职业为非指定职业，则从所述目标元素分库中选取年轻女主播的声音元素部件；

(3)若所述目标用户的职业为指定职业，则从所述目标元素分库中选取成熟女主播的声音元素部件；

(4)若所述目标用户的年龄大于指定阈值且职业为非指定职业，则从所述目标元素分库中选取成熟男主播的声音元素部件。

例如，若目标用户为小于30岁的年轻女性，且其职业不是微小企业主，则表示其大概率喜欢听年轻的男声，故从该目标元素分库中选取年轻男主播的声音元素部件；若目标用户为小于30岁的年轻男性，且其职业不是微小企业主，则表示其大概率喜欢听年轻的女声，故从该目标元素分库中选取年轻女主播的声音元素部件；若目标用户的职业为微小企业主，则表示其大概率喜欢听成熟的女声，故从该目标元素分库中选取成熟女主播的声音元素部件；若目标用户的年龄超过50岁，且其职业不是微小企业主，则表示其大概率喜欢听成熟的男声，故从该目标元素分库中选取成熟男主播的声音元素部件。以此类推，可以灵活地定制用户画像信息与声音元素部件的关联关系。

(1)获取所述目标用户输入的第一语音信息；

(2)对所述第一语音信息进行NLP识别，得到第一NLP识别结果；

(3)根据所述第一NLP识别结果从所述目标元素分库中选取对应的动作元素部件；

(4)将所述动作元素部件确定为所述目标元素部件。

在某些应用场景下，如果目标用户提出某个疑问，此时服务器通过客户端可以获取相应的语音信息，然后对语音信息进行NLP(Natural Language Processing，自然语言处理)识别，获得相应的NLP识别结果，NLP识别结果一般可以是根据语音信息进行语义识别后获得的，与语义相匹配的输出文本。接着，可以根据NLP识别结果从该目标元素分库中选取对应的动作元素部件，并将选取的动作元素部件也作为待合成的目标元素部件。具体的，可以预先构建不同的NLP识别结果和该目标元素分库中的不同动作元素部件之间的对应关系。例如，若NLP识别结果为“此处您可以获取还款计划表”，则可以选取相应的用于指示的动作元素部件；若NLP识别结果为“正确”，则可以选取点头的动作元素部件，以此类推。通过这样设置，能够为合成的虚拟形象添加动作元素，进一步提高人机交互的用户体验。

103、基于所述各个目标元素部件合成相应的虚拟形象。

在从目标元素分库中选取各个目标元素部件之后，可以基于这些目标元素部件合成相应的虚拟形象。例如，假设“动作”元素部件选取的是A动作，“口型”元素部件选取的是B口型，“声音”元素部件选取的是C声音，则可以合成一个执行A动作，展示B口型且发声为C声音的虚拟形象。显然，通过各个不同元素部件的排列组合，本申请实施例能够合成大量不同的虚拟形象，满足用户对虚拟形象的多样化需求。

请参阅图2，本申请实施例中一种合成虚拟形象的方法的另一个实施例包括：

201、当目标用户的事件处理流程进入指定流程节点时，从预先构建的虚拟形象元素库中查找与所述指定流程节点对应的目标元素分库；

其中，所述虚拟形象元素库包含事件处理的各个流程节点分别对应的元素分库，其中每个元素分库包含合成虚拟形象的各个元素部件。

202、根据所述目标用户的用户画像信息从所述目标元素分库中选取各个目标元素部件；

203、基于所述各个目标元素部件合成相应的虚拟形象；

步骤201-203与步骤101-103相同，具体可参照步骤101-103的相关说明。

204、根据所述目标用户的用户画像信息以及所述目标用户输入的第二语音信息，确定所述虚拟形象在所述目标用户所处的客户端的显示界面上的显示方式；

在本申请实施例的一种实现方式中，所述显示方式包括显示位置、显示尺寸或显示持续时间，所述根据所述目标用户的用户画像信息以及所述目标用户输入的第二语音信息，确定所述虚拟形象在所述目标用户所处的客户端的显示界面上的显示方式，可以包括：

(1)根据所述目标用户的用户画像信息确定所述虚拟形象在所述客户端的显示界面上的显示位置、显示尺寸以及显示持续时间；

(2)获取所述目标用户输入的所述第二语音信息，并对所述第二语音信息进行NLP识别，得到第二NLP识别结果；

(3)根据所述第二NLP识别结果对所述虚拟形象在所述客户端的显示界面上的所述显示位置、所述显示尺寸或显示持续时间进行调整。

根据目标用户的用户画像信息，可以设置虚拟形象对应的默认显示位置，默认显示尺寸和默认显示持续时间。例如，若目标用户为年轻人群，由于年轻人群一般不太需要虚拟形象的详细操作指引，故可以设置虚拟形象的默认显示位置为客户端显示界面的右上角，设置较小的默认虚拟形象显示尺寸，以及设置较短的虚拟形象显示持续时间。若目标用户为老年人群，由于老年人群一般需要虚拟形象的详细操作指引，故可以设置虚拟形象的默认显示位置为客户端显示界面的中间，设置较大的默认虚拟形象显示尺寸，以及设置较长的虚拟形象显示持续时间。

另外，目标用户还可以实时输入语音信息对客户端显示的虚拟形象的显示位置，显示尺寸以及显示持续时间进行调整。例如，目标用户可以说出“关闭”，在进行NLP语义识别之后，可以将该虚拟形象的显示持续时间调整为0，即不再显示；目标用户可以说出“放大”，在进行NLP语义识别之后，可以将该虚拟形象的显示尺寸按照一定比例放大；目标用户可以说出“左移”，在进行NLP语义识别之后，可以将该虚拟形象的显示位置向左移动一定距离，等等。

205、按照所述显示方式将所述虚拟形象输出至所述客户端进行显示。

服务器在确定虚拟形象在目标用户所处客户端的显示界面上的显示方式之后，可以按照该显示方式将该虚拟形象输出至客户端进行显示，以实现虚拟形象服务。

在本申请实施例的一种实现方式中，在按照所述显示方式将所述虚拟形象输出至所述客户端进行显示之后，还可以包括：

(1)获取与所述指定流程节点关联的操作指引数据；

(2)将所述操作指引数据输出至所述客户端进行显示，其中，所述操作指引数据在所述客户端的显示界面上的显示位置根据所述虚拟形象在所述客户端的显示界面上的显示位置确定。

在使用虚拟形象向目标用户进行指引时，有时候还需要一并展示某些操作指引数据，例如说明性的文本、图片或者视频材料等。因此，服务器可以预先将每个流程节点与相关的操作指引数据进行关联，在向客户端输出虚拟形象时，可以于客户端的虚拟形象周边(例如左上角或者右上角等区域)显示或者播放该操作指引数据，以获得更好的虚拟形象服务效果。

本申请实施例预先构建一个虚拟形象元素库，该虚拟形象元素库包含事件处理的各个流程节点分别对应的元素分库，其中每个元素分库可以包含合成虚拟形象的不同元素部件。当用户的事件处理流程进入某个指定流程节点时，会从该虚拟形象元素库找到与该指定流程节点对应的目标元素分库，然后根据用户的画像信息从该目标元素分库中选取各个元素部件，基于选取的元素部件合成相应的虚拟形象。最后，根据用户的画像信息以及用户输入的语音信息，确定该虚拟形象在客户端的显示界面上的显示方式，并按照该显示方式将该虚拟形象输出至客户端进行显示。通过这样设置，针对不同的事件处理流程节点以及不同的用户，能够分别合成不同的虚拟形象，而且该虚拟形象的显示方式可以根据用户的画像信息以及用户输入的语音信息灵活调整，进一步提高了虚拟形象的服务效果。

综上所述，本申请实施例针对不同的事件处理流程节点以及不同的用户，能够分别合成不同的虚拟形象，从而提高合成虚拟形象的灵活性，满足用户对虚拟形象的多样化需求。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

对应于上文实施例所述的合成虚拟形象的方法，图3示出了本申请实施例提供的一种合成虚拟形象的装置的结构框图，为了便于说明，仅示出了与本申请实施例相关的部分。

参照图3，该装置包括：

元素分库查找模块301，用于当目标用户的事件处理流程进入指定流程节点时，从预先构建的虚拟形象元素库中查找与所述指定流程节点对应的目标元素分库，其中，所述虚拟形象元素库包含事件处理的各个流程节点分别对应的元素分库，每个所述元素分库包含合成虚拟形象的各个元素部件；

元素部件选取模块302，用于根据所述目标用户的用户画像信息从所述目标元素分库中选取各个目标元素部件；

虚拟形象合成模块303，用于基于所述各个目标元素部件合成相应的虚拟形象。

在本申请实施例的一种实现方式中，所述元素部件选取模块可以包括：

声音元素部件选取单元，用于根据所述目标用户的用户画像信息，从所述目标元素分库中选取对应的声音元素部件；

人像元素部件选取单元，用于从所述目标元素分库中选取与所述声音元素部件对应的人像元素部件；

第一目标元素部件确定单元，用于将所述声音元素部件和所述人像元素部件确定为所述目标元素部件。

进一步的，所述用户画像信息包括年龄、性别和职业，所述声音元素部件选取单元可以包括：

第一声音元素部件选取单元，用于若所述目标用户的年龄小于指定阈值、性别为女且职业为非指定职业，则从所述目标元素分库中选取年轻男主播的声音元素部件；

第二声音元素部件选取单元，用于若所述目标用户的年龄小于指定阈值、性别为男且职业为非指定职业，则从所述目标元素分库中选取年轻女主播的声音元素部件；

第三声音元素部件选取单元，用于若所述目标用户的职业为指定职业，则从所述目标元素分库中选取成熟女主播的声音元素部件；

第四声音元素部件选取单元，用于若所述目标用户的年龄大于指定阈值且职业为非指定职业，则从所述目标元素分库中选取成熟男主播的声音元素部件。

进一步的，所述元素部件选取模块还可以包括：

语音信息获取单元，用于获取所述目标用户输入的第一语音信息；

第一NLP识别单元，用于对所述第一语音信息进行NLP识别，得到第一NLP识别结果；

动作元素部件选取单元，用于根据所述第一NLP识别结果从所述目标元素分库中选取对应的动作元素部件；

第二目标元素部件确定单元，用于将所述动作元素部件确定为所述目标元素部件。

在本申请实施例的一种实现方式中，所述合成虚拟形象的装置还可以包括：

显示方式确定模块，用于根据所述目标用户的用户画像信息以及所述目标用户输入的第二语音信息，确定所述虚拟形象在所述目标用户所处的客户端的显示界面上的显示方式；

虚拟形象显示模块，用于按照所述显示方式将所述虚拟形象输出至所述客户端进行显示。

进一步的，所述显示方式包括显示位置、显示尺寸或显示持续时间，所述显示方式确定模块可以包括：

显示参数确定单元，用于根据所述目标用户的用户画像信息确定所述虚拟形象在所述客户端的显示界面上的显示位置、显示尺寸以及显示持续时间；

第二NLP识别单元，用于获取所述目标用户输入的所述第二语音信息，并对所述第二语音信息进行NLP识别，得到第二NLP识别结果；

显示参数调整单元，用于根据所述第二NLP识别结果对所述虚拟形象在所述客户端的显示界面上的所述显示位置、所述显示尺寸或显示持续时间进行调整。

进一步的，所述合成虚拟形象的装置还可以包括：

指引数据获取模块，用于获取与所述指定流程节点关联的操作指引数据；

指引数据显示模块，用于将所述操作指引数据输出至所述客户端进行显示，其中，所述操作指引数据在所述客户端的显示界面上的显示位置根据所述虚拟形象在所述客户端的显示界面上的显示位置确定。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如图1或图2表示的任意一种合成虚拟形象的方法。

本申请实施例还提供一种计算机程序产品，当该计算机程序产品在服务器上运行时，使得服务器执行实现如图1或图2表示的任意一种合成虚拟形象的方法。

图4是本申请一实施例提供的服务器的示意图。如图4所示，该实施例的服务器4包括：处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机可读指令42。所述处理器40执行所述计算机可读指令42时实现上述各个合成虚拟形象的方法实施例中的步骤，例如图1所示的步骤101至103。或者，所述处理器40执行所述计算机可读指令42时实现上述各装置实施例中各模块/单元的功能，例如图3所示模块301至303的功能。

示例性的，所述计算机可读指令42可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器41中，并由所述处理器40执行，以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段，该指令段用于描述所述计算机可读指令42在所述服务器4中的执行过程。

所述服务器4可以是智能手机、笔记本、掌上电脑及云端服务器等计算设备。所述服务器4可包括，但不仅限于，处理器40、存储器41。本领域技术人员可以理解，图4仅仅是服务器4的示例，并不构成对服务器4的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述服务器4还可以包括输入输出设备、网络接入设备、总线等。

所述处理器40可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(AppLication Specific Integrated Circuit，ASIC)、现成可编程门阵列(FieLd-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器41可以是所述服务器4的内部存储单元，例如服务器4的硬盘或内存。所述存储器41也可以是所述服务器4的外部存储设备，例如所述服务器4上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器41还可以既包括所述服务器4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机可读指令以及所述服务器所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/服务器的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random AccessMemory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种合成虚拟形象的方法，其特征在于，包括：

基于所述各个目标元素部件合成相应的虚拟形象。

2.如权利要求1所述的方法，其特征在于所述根据所述目标用户的用户画像信息从所述目标元素分库中选取各个目标元素部件，包括：

3.如权利要求2所述的方法，其特征在于，所述用户画像信息包括年龄、性别和职业，所述根据所述目标用户的用户画像信息，从所述目标元素分库中选取对应的声音元素部件，包括：

4.如权利要求2所述的方法，其特征在于，在将所述声音元素部件和所述人像元素部件确定为所述目标元素部件之后，还包括：

获取所述目标用户输入的第一语音信息；

对所述第一语音信息进行NLP识别，得到第一NLP识别结果；

将所述动作元素部件确定为所述目标元素部件。

5.如权利要求1至4中任一项所述的方法，其特征在于，在基于所述各个目标元素部件合成相应的虚拟形象之后，还包括：

6.如权利要求5所述的方法，其特征在于，所述显示方式包括显示位置、显示尺寸或显示持续时间，所述根据所述目标用户的用户画像信息以及所述目标用户输入的第二语音信息，确定所述虚拟形象在所述目标用户所处的客户端的显示界面上的显示方式，包括：

7.如权利要求6所述的方法，其特征在于，在按照所述显示方式将所述虚拟形象输出至所述客户端进行显示之后，还包括：

获取与所述指定流程节点关联的操作指引数据；

8.一种合成虚拟形象的装置，其特征在于，包括：

9.一种服务器，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的合成虚拟形象的方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的合成虚拟形象的方法。