CN116884439A

CN116884439A - 基于语音数据的推荐信息确定方法及相关装置

Info

Publication number: CN116884439A
Application number: CN202310949116.9A
Authority: CN
Inventors: 王一
Original assignee: Shenzhen Renma Interactive Technology Co Ltd
Current assignee: Shenzhen Renma Interactive Technology Co Ltd
Priority date: 2023-07-28
Filing date: 2023-07-28
Publication date: 2023-10-13

Abstract

本申请提供了一种基于语音数据的推荐信息确定方法及相关装置，包括：获取推荐请求；获取所述用户针对参考历史推荐信息的参考语音互动数据；根据所述参考语音互动数据确定所述用户针对每个参考历史推荐信息的实际互动时长；确定所述实际互动时长大于第一预设时长的参考历史推荐信息为目标历史推荐信息；根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性；根据所述互动连续性从所述目标历史推荐信息中确定可用历史推荐信息；获取所述用户的基本信息；根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签；根据所述目标推荐标签确定目标推荐信息。可以提高推荐信息的确定的准确度。

Description

基于语音数据的推荐信息确定方法及相关装置

技术领域

本申请属于互联网产业的一般数据处理技术领域，具体涉及一种基于语音数据的推荐信息确定方法及相关装置。

背景技术

当前在确定用户画像时，大多仅是基于用户登录时填写的基本信息生成，少数方案还会根据用户的浏览记录对用户画像进行更新，但由于用户在浏览时无法确定用户的浏览状态，使得用户的浏览记录并不能准确反应用户喜好，因此根据此种方式确定出的用户画像进行信息推荐也并不准确。

发明内容

本申请实施例提供了一种基于语音数据的推荐信息确定方法及相关装置，以提高确定出的推荐信息的准确度，使得推荐内容更符合用户需求。

第一方面，本申请实施例提供了一种基于语音数据的推荐信息确定方法，所述方法包括：

获取推荐请求，所述推荐信息中包括用于向用户推荐的语音互动内容或语音互动产品或语音互动服务；

获取所述用户针对参考历史推荐信息的参考语音互动数据，所述参考历史推荐信息为在第一预设时段内向所述用户推荐过的所有推荐信息中所述用户进行过语音互动的推荐信息；

根据所述参考语音互动数据确定所述用户针对每个参考历史推荐信息的实际互动时长；

确定所述实际互动时长大于第一预设时长的参考历史推荐信息为目标历史推荐信息，所述目标历史推荐信息对应的参考语音互动数据为目标语音互动数据；

根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性；

根据所述互动连续性从所述目标历史推荐信息中确定可用历史推荐信息，所述可用历史推荐信息对应的目标语音互动数据为可用语音互动数据；

获取所述用户的基本信息，所述基本信息包括所述用户的身份信息和关注偏好信息，所述关注偏好信息与所述推荐信息所属的类型和领域关联；

根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签；

根据所述目标推荐标签确定目标推荐信息。

第二方面，本申请实施例提供了一种基于语音数据的推荐信息确定装置，所述装置包括：

第一获取单元，用于获取推荐请求，所述推荐请求用于获取推荐信息，所述推荐信息中包括用于向用户推荐的语音互动内容或语音互动产品或语音互动服务；

第二获取单元，用于获取所述用户针对参考历史推荐信息的参考语音互动数据，所述参考历史推荐信息为在第一预设时段内向所述用户推荐过的所有推荐信息中所述用户进行过语音互动的推荐信息；

第一确定单元，用于根据所述参考语音互动数据确定所述用户针对每个参考历史推荐信息的实际互动时长；

第二确定单元，用于确定所述实际互动时长大于第一预设时长的参考历史推荐信息为目标历史推荐信息，所述目标历史推荐信息对应的参考语音互动数据为目标语音互动数据；

第三确定单元，用于根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性；

第四确定单元，用于根据所述互动连续性从所述目标历史推荐信息中确定可用历史推荐信息，所述可用历史推荐信息对应的目标语音互动数据为可用语音互动数据；

第三获取单元，用于获取所述用户的基本信息，所述基本信息包括所述用户的身份信息和关注偏好信息，所述关注偏好信息与所述推荐信息所属的类型和领域关联；

第五确定单元，用于根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签；

第四获取单元，用于根据所述目标推荐标签确定目标推荐信息。

第三方面，本申请实施例供了一种电子设备，包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行本申请实施例第一方面中的步骤的指令。

第四方面，本申请实施例提供了一种计算机存储介质其上存储有计算机程序/指令，该计算机程序/指令被处理器执行实现上述第一方面所述方法的步骤。

第五方面，本申请实施例提供了一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

可见，本申请实施例中，电子设备首先获取推荐请求，所述推荐信息中包括用于向用户推荐的语音互动内容或语音互动产品或语音互动服务，然后获取所述用户针对参考历史推荐信息的参考语音互动数据，所述参考历史推荐信息为在第一预设时段内向所述用户推荐过的所有推荐信息中所述用户进行过语音互动的推荐信息，然后根据所述参考语音互动数据确定所述用户针对每个参考历史推荐信息的实际互动时长，再然后确定所述实际互动时长大于第一预设时长的参考历史推荐信息为目标历史推荐信息，所述目标历史推荐信息对应的参考语音互动数据为目标语音互动数据，再然后根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性，再然后根据所述互动连续性从所述目标历史推荐信息中确定可用历史推荐信息，所述可用历史推荐信息对应的目标语音互动数据为可用语音互动数据，再然后获取所述用户的基本信息，所述基本信息包括所述用户的身份信息和关注偏好信息，所述关注偏好信息与所述推荐信息所属的类型和领域关联，再然后根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签，最后根据所述目标推荐标签确定目标推荐信息。这样可以提高确定出的推荐标签的准确性，以提高推荐信息的确定的准确度，使得向用户推荐的语音互动内容或语音互动产品或语音互动服务更符合用户需求。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种推荐系统的组成示意图；

图2是本申请实施例提供的一种电子设备的结构示意图；

图3是本申请实施例提供的一种基于语音数据的推荐信息确定方法的流程示意图；

图4是本申请实施例提供的一种推荐页面示意图；

图5是本申请实施例提供的一种基于语音数据的推荐信息确定装置的功能单元组成框图；

图6是本申请实施例提供的另一种基于语音数据的推荐信息确定装置的功能单元组成框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

当前在确定用户画像时，大多仅是基于用户登录时填写的基本信息生成，少数方案还会根据用户的浏览记录对用户画像进行更新，但由于用户在浏览时无法确定用户的浏览状态，使得用户的浏览记录并不能准确反应用户喜好。例如虽然用户在浏览某一个视频时的浏览时间较长，但可能是用户中途离开造成的长时间播放，因此根据此种方式确定出的用户画像进行信息推荐也并不准确。

针对上述问题，本申请实施例提供了一种基于语音数据的推荐信息确定方法及相关装置，下面结合附图对本申请实施例进行详细介绍。

请参阅图1，图1是本申请实施例提供的一种推荐系统的组成示意图。如图1所示，推荐系统10中包括有语音服务器101和终端设备102，该语音服务器101与终端设备102通信连接。需要说明的是，推荐系统10中包括的终端设备102和语音服务器101可以分别包括多个，该语音服务器101可以是指一个服务器集群。同时一个语音服务器101可以与多个终端设备102建立通信连接。该终端设备102用于登录用户账号，以及为用户提供语音互动服务或语音互动内容或语音互动产品的显示界面。语音服务器101用于根据来自终端设备102的用户语音信息对用户意图进行分析，并与用户进行语音互动。在确定推荐信息时，可以是语音服务器101根据用户的互动记录确定，也可以是终端设备102根据用户的互动记录确定。

请参阅图2，图2是本申请实施例提供的一种电子设备的结构示意图。如图2所示，本方案中的电子设备20可以是上述图1所述的语音服务器101，也可以是终端设备102。电子设备可以是具备通信能力的电子设备，该电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备，以及各种形式的用户设备(User Equipment，UE)，移动台(Mobile Station，MS)，终端设备(terminal device)等等。电子设备20包括处理器120、存储器130、通信接口140以及一个或多个程序131，其中，所述一个或多个程序131被存储在上述存储器130中，且被配置由上述处理器120执行，所述一个或多个程序131包括用于执行下述方法实施例中任一步骤的指令。具体实现中，所述处理器120用于执行如下述方法实施例中由电子设备执行的任一步骤，且在执行诸如发送等数据传输时，可选择的调用所述通信接口140来完成相应操作。

请参阅图3，图3是本申请实施例提供的一种基于语音数据的推荐信息确定方法的流程示意图。所述方法包括以下步骤。

S301，获取推荐请求。

其中，所述推荐信息中包括用于向用户推荐的语音互动内容或语音互动产品或语音互动服务。在本方案中的电子设备为终端设备时，该推荐请求的获取方式可以包括获取到用户的语音信息或者操作信息，根据语音信息或者操作信息确定用户的推荐请求。该语音信息可以是带有关键词的语音信息，例如包括“下一个”、“换一个”等关键词的语音。该操作信息可以为用户的手动操作，例如用户在终端设备的界面上执行上滑操作，或者用户按下音量键等操作。当电子设备为语音服务器时，则语音服务器获取来自终端设备的推荐请求，终端设备则是获取到用户的操作信息后向语音服务器发送操作请求。或者终端设备将获取的语音信息发送给语音服务器，语音服务器解析后确定推荐请求。

例如图4所示，图4是本申请实施例提供的一种推荐页面示意图。图4所示的语音互动内容是语音互动视频，用户可以在观看该语音互动视频的同时与电子设备进行语音互动，此时的推荐请求为根据用户的上滑操作触发。即当用户执行上滑操作后，电子设备会接收到用户的推荐请求，并向用户显示其他推荐信息。例如图4中用户执行上滑操作后，终端设备屏幕上显示的语音互动视频A就会更换成语音互动视频B。需要说明的是，本方案中推荐信息包括的内容与该语音互动功能对应的应用程序的推荐内容有关，若该应用程序为购物软件，则推荐信息指示的是语音互动产品，若该应用程序为视频播放软件，则扏信息指示的语音互动内容就可以是语音互动视频。

S302，获取所述用户针对参考历史推荐信息的参考语音互动数据。

其中，所述参考历史推荐信息为在第一预设时段内向所述用户推荐过的所有推荐信息中所述用户进行过语音互动的推荐信息，该第一预设时段可以根据用户对语音互动功能的使用频率确定。例如用户对语音互动功能对应的应用程序的使用较频繁，则第一预设时段可以是一个星期，而若用户很久才会使用一次语音互动功能对应的应用程序，则该第一预设时段就可以是一个月。确定与用户进行过语音互动的推荐信息包括：确定针对每个推荐信息的互动记录中是否存在用户语音信息，若存在，则确定该推荐信息为与用户进行过语音互动的信息，若不存在用户语音信息，则确定用户没有与该推荐信息进行过语音互动。

S303，根据所述参考语音互动数据确定所述用户针对每个参考历史推荐信息的实际互动时长。

其中，该实际互动时长的确定包括：获取每个参考历史推荐信息对应的互动记录中第一次获取用户语音数据的目标时刻，确定该目标时刻与用户浏览该参考历史推荐信息的初始时刻的时间间隔，若时间间隔大于第一预设值，则确定目标时刻为开始时刻，若时间间隔不大于第一预设值，则确定初始时刻为开始时刻，根据开始时刻和用户退出该参考历史推荐信息的互动时刻确定实际时长。确定用户退出互动的时刻包括：该推荐信息对应的语音互动剧本指示已互动结束的时刻，或者用户再次发出推荐请求的时刻。

S304，确定所述实际互动时长大于第一预设时长的参考历史推荐信息为目标历史推荐信息。

其中，所述目标历史推荐信息对应的参考语音互动数据为目标语音互动数据。每个参考历史推荐信息对应的第一预设时长可以相同，则此时该第一预设时长用于表征用户至少进行过一段时间的语音互动，例如20秒。或者每个参考历史推荐信息对应的第一预设时长均不相同，则此时第一预设时长可以根据参考历史推荐信息的剧本内容确定，例如参考历史推荐信息A的剧本内容指示用户第二次输入语音信息的时间较早，而参考历史推荐信息B的剧本内容指示用户第二次输入的语音信息的时间较晚，则此时参考历史推荐信息A对应的第一预设时长就短于参考历史推荐信息B对应的第一预设时长。这样可以使得目标历史推荐信息中不存在用户仅短暂互动过一次就退出的情况，使得可以避免用户误点击或者仅是被开头吸引而后觉得无趣的推荐信息。

S305，根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性。

S306，根据所述互动连续性从所述目标历史推荐信息中确定可用历史推荐信息。

其中，互动连续性主要用于表征用户在针对一个历史推荐信息进行语音互动时是否出现互动中断的情况。所述可用历史推荐信息对应的目标语音互动数据为可用语音互动数据。

S307，获取所述用户的基本信息。

其中，所述基本信息包括所述用户的身份信息和关注偏好信息，所述关注偏好信息与所述推荐信息所属的类型和领域关联。用户的身份信息可以是用于在注册账号时填写的信息，关注偏好信息可以是针对当前应用程序提供的语音服务功能所涉及的语音互动类型和领域相关的内容。例如当应用程序可以提供语音互动视频服务时，该类型可以是针对语音互动视频的分类，例如搞笑类或者科普类等，而所属领域可以是娱乐类或者教育类等。

S308，根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签。

S309，根据所述目标推荐标签确定目标推荐信息。

可见，本实例中，电子设备首先获取推荐请求，所述推荐信息中包括用于向用户推荐的语音互动内容或语音互动产品或语音互动服务，然后获取所述用户针对参考历史推荐信息的参考语音互动数据，所述参考历史推荐信息为在第一预设时段内向所述用户推荐过的所有推荐信息中所述用户进行过语音互动的推荐信息，然后根据所述参考语音互动数据确定所述用户针对每个参考历史推荐信息的实际互动时长，再然后确定所述实际互动时长大于第一预设时长的参考历史推荐信息为目标历史推荐信息，所述目标历史推荐信息对应的参考语音互动数据为目标语音互动数据，再然后根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性，再然后根据所述互动连续性从所述目标历史推荐信息中确定可用历史推荐信息，所述可用历史推荐信息对应的目标语音互动数据为可用语音互动数据，再然后获取所述用户的基本信息，所述基本信息包括所述用户的身份信息和关注偏好信息，所述关注偏好信息与所述推荐信息所属的类型和领域关联，再然后根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签，最后根据所述目标推荐标签确定目标推荐信息。这样可以提高确定出的推荐标签的准确性，以提高推荐信息的确定的准确度，使得向用户推荐的语音互动内容或语音互动产品或语音互动服务更符合用户需求。

在一个可能的实例中，所述根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性，包括：

针对每个目标历史推荐信息对应的目标语音互动数据执行以下操作：

对所述目标语音互动数据进行语义分析，得到多条语义；

确定每两条语义之间的实际间隔时长；

确定所述实际间隔时长中是否存在间隔时长大于第二预设时长的目标间隔时长；

若存在，则确定所述目标语音互动数据对应的实际互动时长与所述目标间隔时长的差值是否大于所述第一预设时长；

若是，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息的互动连续性为连续；

若否，则确定所述实际间隔时长中出现所述目标间隔时长的次数，根据所述次数确定所述目标历史推荐信息的互动连续性；

若不存在，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息的互动连续性为连续。

其中，在确定每条目标历史推荐信息的互动连续性时，主要根据用户回答的时间间隔来确定。每个目标语音互动数据对应的第二预设时长可以是不同的，该第二预设时长可以根据该目标历史推荐信息的互动剧本中的用户回答时机来确定该目标语音互动数据的用户回答的平均时间间隔，然后再结合用户的历史回答记录，确定用户的历史回答记录中的每两条语义的时间间隔众数与平均时间间隔的差距，在平均时间间隔的基础上确定第二预设时长。即第二预设时长与该目标历史推荐信息的互动剧本和用户平时的互动习惯相关。但当目标历史推荐信息对应的互动剧本仅包括互动大纲而没有细致到写明用户的回答时机时，该第二预设时长则为预设的统一时长，即该预设的统一时长为一般互动内容中最大的用户回答间隔时长，当然该统一的第一预设时长也可以与用户的年龄和该推荐内容的互动难度相关，即用户针对该互动内容需要思考的时间长度可能是不同的，则对应的该第一预设时长就不同。

例如当用户在针对目标历史推荐信息A进行语音互动时，用户一共回答了5句话，实际互动时长为10分钟，而其中有两个间隔时长长达5分钟，而第一预设时长为3分钟，则首先可以确定长达5分钟的间隔时长不是正常语音互动时用户回答所需的时长。可能用户在进行语音互动时因其他原因离开，但目标历史推荐信息A的页面一直停留在主页上，造成互动时间够长的假象。而由于第一预设时长也仅为3分钟，当互动时长高于第一预设时长时才将参考历史推荐信息确认为目标历史推荐信息A，也就是说用户对该目标历史推荐信息A的实际互动时长可能并不到6分钟。此时确定实际互动时长的差值与目标间隔时长的差值来得到用户的真实互动时长，即去掉可能存在干扰的互动时长5分钟，而此时差值为5分钟大于第一预设时长，则确定互动连续。而由于针对一个目标历史推荐信息来说，其对应的目标语音数据中包括的目标间隔时长可能存在多个，因此即使差值小于第一预设时长，也不能直接确定是互动不连续的。

可见，本实例中，在确定互动连续性时，根据用户回答时语义间隔来确定，可以避免用户因其他原因而单纯停留在该推荐信息的页面上，造成对用户喜好的误判的情况，减少用于确定推荐标签的历史推荐信息的干扰数量，提高对推荐标签的确定的准确度。

在一个可能的实例中，所述根据所述次数确定所述目标历史推荐信息的互动连续性，包括：获取所述目标语音互动数据对应的目标历史推荐信息的互动难度；根据所述身份信息获取所述用户的年龄；根据所述互动难度和所述用户的年龄确定参考间隔时长；根据所述次数和所述参考间隔时长确定所述目标间隔时长的预测时长总和；根据所述实际互动时长和所述预测时长总和确定预测互动时长；确定所述预测互动时长是否大于所述第一预设时长；若大于，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息互动连续性为连续；若不大于，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息互动连续性为不连续。

其中，由于针对一个目标历史推荐信息来说，其对应的目标语音数据中包括的目标间隔时长可能存在多个，则当实际互动时长与目标间隔时长的差值小于第一预设时长，可能出现用户即使多次存在语音互动时间隔很长时间才回复，但用户依然进行了深入的语音互动的情况。而由于该目标历史推荐信息的互动剧本可能仅有大纲，无法根据用户的互动内容判断用户进行语音互动时的互动深入程度。因此可以根据该目标历史推荐信息的互动难度和用户的年龄初步确定用户每次进行语音互动时需要思考的时间，以该时间替换目标间隔时长，得到预测的用户实际互动时长，并以此判断用户的互动是否连续。例如用户针对目标历史推荐信息B的实际互动时长为10分钟，对应的第一预设时长为3分钟，而用户回答的5句话中，有两句话与之前的语义的间隔均超过第二预设时长40秒，分别为5分钟和3分钟。而此时根据目标推荐信息B的互动难度和用户的年龄确定参考间隔时长为20秒，则对应的预测时长总和就为40秒，对应的预测互动时长为2分40秒，该时长小于第一预设时长，则确定互动不连续。而若确定出的参考间隔时长为35秒，则对应的预测互动时长为3分10秒，则超过第一预设时长，此时该目标历史推荐信息B的互动就连续，可以用于确定推荐标签。目标历史推荐信息的互动难度可以根据该目标历史推荐信息所属的类型和领域确定。

可见，本实例中，当存在多个目标间隔时长时，根据互动难度和用户年龄综合确定出用户的预测互动时长，以此来判断用户的互动时长连续。充分考虑到多种可能的互动场景下用户的实际互动情况，减少用于确定推荐标签的历史推荐信息的干扰数量，提高对推荐标签的确定的准确度。

在一个可能的实例中，所述根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签，包括：根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签；确定每个可用语音互动数据中包括的多条可用语义的语义类型，所述语义类型包括常规语义类型、主动语义类型和无关语义类型，所述常规语义类型用于指示与所述可用语音信息对应的可用推荐信息包括的语音互动内容或语音互动产品或语音互动服务的第一关联度高于第一预设值的语义，所述主动语义类型用于指示所述第一关联度低于所述第一预设值，且与所述可用语音信息对应的可用推荐信息包括的语音互动内容或语音互动产品或语音互动服务所属的领域的第二关联度高于第二预设值语义，所述无关语义类型用于指示所述第一关联度低于所述第一预设值，且所述第二关联度低于所述第二预设值的语义；确定所述每个可用语音互动数据对应的每种语义类型分别包括的可用语义的第一数量；根据所述第一数量对所述可用语音互动数据对应的可用历史推荐信息进行标记；确定每种语义类型分别包括的所有可用语义的第二数量；根据所述第二数量确定所述用户的说话风格；根据所述说话风格确定所述标记的可信度；根据所述可信度和所述标记对所述基础推荐标签进行更改，得到目标推荐标签。

其中，可以根据一个可用语音互动数据中包括的各种语义类型的第一数量确定当前语音互动数据是否能表征用户喜好。例如可用语音互动数据A中包括的常规语义类型的数量为5句，主动语义类型的数量为3句，无关语义类型的数量为1句，则可以确定该可用语音互动数据为正常的语音互动，可以用来表征用户喜好，因此对该可用语音互动数据打上对应标记，认为该可用语音互动数据A所属的类型和领域可以用来表征用户喜好。而若可用语音互动数据B中包括的常规语义类型的数量为2句，主动语义类型的数量为0句，无关语义类型的数量为7句，则可能存在用户在互动时乱说的情况，因此为该可用语音互动数据也打上对应标记，认为该可用语音互动数据B所属的类型和领域不能用来表征用户喜好。当然在确定目标推荐标签时，还需要根据用户的说话风格对之前的标记进行更正，即若确定多个可用语音互动数据中，常规语义类型中的语音互动数据共包括50句，主动语义类型中的语音互动数据共包括10句，而无关语义类型中的语音互动数据共包括100句，则认为用户的语音互动风格就是喜欢乱说，则可知之前确定的标记可信度就不高，即该目标语音互动数据B也可以用于表征用户喜好。则此时需要对基础推荐标签进行修改，得到目标推荐标签。

可见，本实例中，在根据可用历史推荐信息确定推荐标签时，还根据用户的可用语音互动数据确定用户的说话风格，来确定之前标记的可信度，提高对推荐标签的确定的准确度。

在一个可能的实例中，所述根据所述第一数量对所述可用语音互动数据对应的可用历史推荐信息进行标记，包括：针对每个可用历史推荐信息执行以下步骤：确定所述可用历史推荐信息所属的参考领域；确定所述基础推荐标签中是否包括所述参考领域对应的参考领域标签；若是，则在所述可用历史推荐信息对应的无关语义类型中包括的可用语义的第一数量大于第三预设值的情况下，对所述可用历史推荐信息进行第一标记；若否，则在所述可用历史推荐信息对应的主动语义类型中包括的可用语义的第一数量大于第四预设值的情况下，对所述可用历史推荐信息进行第二标记。

其中，在对可用历史推荐信息进行标记时，需要先确定该可用历史推荐信息所属的领域是否已经属于基础推荐标签中已确定的领域。若是，则若该可用历史推荐信息中包括的无关语义的数量大于第三预设值，则进行第一标记，该第一标记用于表征用户对该参考领域的喜爱度减弱。若基础推荐标签中不包括该参考领域的参考领域标签，则确定该可用历史推荐信息中主动语义类型的数量，若大于第四预设值，则进行第二标记，第二标记用于指示用于对该参考领域的喜好增强。例如用户在进行语音互动时，原本就喜好A领域的互动内容，则基础推荐标签中就包括A领域的标签，而此时用户在互动时，针对A领域的互动内容大多是说的无关的语句，则可以认为用户对A领域的喜好降低了。而若用户对A领域的互动内容中无关语句很少，则认为用户依然喜好A领域的互动内容，而由于A领域的标签本来就在基础推荐标签内，因此无需再对这部分内容进行标记，可以降低后面的数据分析量，提高对目标推荐标签的确定速度。而若A领域的标签原本不在基础推荐标签内，即用户原本不偏好A领域的内容，而此时用户针对该可用历史推荐信息说了很多与A领域有关的内容，则确定用户对A领域感兴趣，因此需要进行标记。

可见，本实例中，根据不同的情况进行标记，使得可以有针对性的仅分析一部分数据，就能了解用户当前的喜好情况，提高对目标推荐标签的确定的准确度。

在一个可能的实例中，所述根据所述可信度和所述标记对所述基础推荐标签进行更改，得到目标推荐标签，包括：确定所述可用历史推荐信息中存在所述第一标记，且属于所述参考领域的可用历史推荐信息的第三数量；根据所述可信度修正所述第三数量；在修正后的第三数量大于第五预设值的情况下，从所述基础推荐标签中删除所述参考领域标签，得到目标推荐标签；确定所述可用历史推荐信息中存在所述第二标记，且不属于所述参考领域的可用历史推荐信息的第四数量；根据所述可信度修正所述第四数量；在修正后的第四数量大于第六预设值的情况下，在所述基础推荐标签中添加所述参考领域标签，得到目标推荐标签。

其中，存在第一标记意味着用户喜好度下降，通过可信度修正后，若第一标记的数量还是多于第三数量，则意味着用户多次语音互动时针对该参考领域的内容都表现出喜好度下降的趋势，则将基础推荐标签中的该参考领域标签删除。而若第二标记的数量大于第六预设值，则认为用户在主动获取参考领域对应的信息，用户的语音互动意愿强烈，则此时可以将原本不属于基础推荐标签中的参考领域标签加入。

根据可信度修改第三数量或第四数量包括：该可信度用于表征用户针对每种说话风格时对应的各语义类型的目标数量占比区间，然后确定存在所述第一标记，且属于所述参考领域的可用历史推荐信息中，第一数量占比区间与目标数量占比区间不匹配的可用历史推荐信息的标记为第一标记，以此得到修正后的第三数量或第四数量。例如用户的说话风格为喜欢说无关的话，则此时对应的可信度指示的目标数量占比区间为，无关语义类型的数量在所有数量中的占比为40％-60％，则若原本为第一标记，且所属领域为参考领域的可用历史推荐信息A的主动语义类型的第一数量占比，在该可用历史推荐信息A对应的可用语音互动数据的所有第一数量中的占比为50％，则认为该可用历史推荐信息A的标记不为第一标记，则在计算数量时不计算可用历史推荐信息A的数量，仅将无关语义类型的第一数量占比高于目标占比区间的可用历史推荐信息计入第三数量。而在修正第四数量时，同理仅将主动语义类型的第一数量占比高于目标占比区间的可用历史推荐信息计入第四数量。

可见，本实例中，根据第一标记和第二标记的数量对基础推荐标签中的领域标签进行修改，得到目标推荐标签，可以提高目标推荐标签的确定的准确度。

在一个可能的实例中，所述根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签之前，所述方法还包括：确定在第二预设时段内，获取所述推荐请求的频率；确定所述基本信息的最后修改时间与当前时间的修改时间间隔；根据所述频率和所述修改时间间隔确定所述基本信息的可信度；所述根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签，包括：若所述基本信息的可信度大于第七预设值，则根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签；若所述基本信息的可信度不大于所述第七预设值，则根据所述可用历史推荐信息所属的领域和所述可用历史推荐信息所属的类型确定基础推荐标签。

其中，若用户在短时间频繁修改基本信息，则认为基本信息可信度不大于第七预设值，即若用户频繁修改，则无法确定用户修改的内容是否为真实内容。因此在确定基础推荐标签时，若基本信息的可信度不高，则不根据基本信息生成基础推荐标签，避免基本信息对基础推荐标签的生成产生误导。

具体实现中，在确定基本推荐标签时，若基本信息的可信度高于第七预设值，此时还可以先获取用户当前输入的语音信息，根据当前输入的语音信息确定当前用户是否为基本信息对应的目标用户，该基本信息中包括目标用户的声纹信息，若根据声纹信息比对发现当前用户不是目标用户，则不根据基本信息生成基础推荐标签，且获取的参考历史推荐信息前，先从历史语音互动数据中确定出语音数据的声纹信息为当前用户的声纹的历史语音互动数据，然后再在声纹信息为当前用户的声纹的历史语音互动数据对应的历史推荐信息中确定出参考历史推荐信息。

可见，本实例中，可以根据用户对基本信息的修改时间间隔确定是否可以基于用户填写的基本信息生成推荐标签，可以提高推荐标签的确定的准确度。

与上述实施例一致的，请参阅图5，图5是本申请实施例提供的一种基于语音数据的推荐信息确定装置的功能单元组成框图。所述基于语音数据的推荐信息确定装置40包括：第一获取单元401，用于获取推荐请求，所述推荐请求用于获取推荐信息，所述推荐信息中包括用于向用户推荐的语音互动内容或语音互动产品或语音互动服务；第二获取单元402，用于获取所述用户针对参考历史推荐信息的参考语音互动数据，所述参考历史推荐信息为在第一预设时段内向所述用户推荐过的所有推荐信息中所述用户进行过语音互动的推荐信息；第一确定单元403，用于根据所述参考语音互动数据确定所述用户针对每个参考历史推荐信息的实际互动时长；第二确定单元404，用于确定所述实际互动时长大于第一预设时长的参考历史推荐信息为目标历史推荐信息，所述目标历史推荐信息对应的参考语音互动数据为目标语音互动数据；第三确定单元405，用于根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性；第四确定单元406，用于根据所述互动连续性从所述目标历史推荐信息中确定可用历史推荐信息，所述可用历史推荐信息对应的目标语音互动数据为可用语音互动数据；第三获取单元407，用于获取所述用户的基本信息，所述基本信息包括所述用户的身份信息和关注偏好信息，所述关注偏好信息与所述推荐信息所属的类型和领域关联；第五确定单元408，用于根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签；第四获取单元409，用于根据所述目标推荐标签确定目标推荐信息。

在一个可能的实例中，在所述根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性方面，所述第三确定单元405具体用于：针对每个目标历史推荐信息对应的目标语音互动数据执行以下操作：对所述目标语音互动数据进行语义分析，得到多条语义；确定每两条语义之间的实际间隔时长；确定所述实际间隔时长中是否存在间隔时长大于第二预设时长的目标间隔时长；若存在，则确定所述目标语音互动数据对应的实际互动时长与所述目标间隔时长的差值是否大于所述第一预设时长；若是，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息的互动连续性为连续；若否，则确定所述实际间隔时长中出现所述目标间隔时长的次数，根据所述次数确定所述目标历史推荐信息的互动连续性；若不存在，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息的互动连续性为连续。

在一个可能的实例中，在所述根据所述次数确定所述目标历史推荐信息的互动连续性方面，所述第三确定单元405具体用于：获取所述目标语音互动数据对应的目标历史推荐信息的互动难度；根据所述身份信息获取所述用户的年龄；根据所述互动难度和所述用户的年龄确定参考间隔时长；根据所述次数和所述参考间隔时长确定所述目标间隔时长的预测时长总和；根据所述实际互动时长和所述预测时长总和确定预测互动时长；确定所述预测互动时长是否大于所述第一预设时长；若大于，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息互动连续性为连续；若不大于，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息互动连续性为不连续。

在一个可能的实例中，在所述根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签方面，第五确定单元408具体用于：根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签；确定每个可用语音互动数据中包括的多条可用语义的语义类型，所述语义类型包括常规语义类型、主动语义类型和无关语义类型，所述常规语义类型用于指示与所述可用语音信息对应的可用推荐信息包括的语音互动内容或语音互动产品或语音互动服务的第一关联度高于第一预设值的语义，所述主动语义类型用于指示所述第一关联度低于所述第一预设值，且与所述可用语音信息对应的可用推荐信息包括的语音互动内容或语音互动产品或语音互动服务所属的领域的第二关联度高于第二预设值语义，所述无关语义类型用于指示所述第一关联度低于所述第一预设值，且所述第二关联度低于所述第二预设值的语义；确定所述每个可用语音互动数据对应的每种语义类型分别包括的可用语义的第一数量；根据所述第一数量对所述可用语音互动数据对应的可用历史推荐信息进行标记；确定每种语义类型分别包括的所有可用语义的第二数量；根据所述第二数量确定所述用户的说话风格；根据所述说话风格确定所述标记的可信度；根据所述可信度和所述标记对所述基础推荐标签进行更改，得到目标推荐标签。

在一个可能的实例中，在所述根据所述第一数量对所述可用语音互动数据对应的可用历史推荐信息进行标记方面，第五确定单元408具体用于：针对每个可用历史推荐信息执行以下步骤：确定所述可用历史推荐信息所属的参考领域；确定所述基础推荐标签中是否包括所述参考领域对应的参考领域标签；若是，则在所述可用历史推荐信息对应的无关语义类型中包括的可用语义的第一数量大于第三预设值的情况下，对所述可用历史推荐信息进行第一标记；若否，则在所述可用历史推荐信息对应的主动语义类型中包括的可用语义的第一数量大于第四预设值的情况下，对所述可用历史推荐信息进行第二标记。

在一个可能的实例中，在所述根据所述可信度和所述标记对所述基础推荐标签进行更改，得到目标推荐标签方面，第五确定单元408具体用于：确定所述可用历史推荐信息中存在所述第一标记，且属于所述参考领域的可用历史推荐信息的第三数量；根据所述可信度修正所述第三数量；在修正后的第三数量大于第五预设值的情况下，从所述基础推荐标签中删除所述参考领域标签，得到目标推荐标签；确定所述可用历史推荐信息中存在所述第二标记，且不属于所述参考领域的可用历史推荐信息的第四数量；根据所述可信度修正所述第四数量；在修正后的第四数量大于第六预设值的情况下，在所述基础推荐标签中添加所述参考领域标签，得到目标推荐标签。

在一个可能的实例中，在所述根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签之前，所述基于语音数据的推荐信息确定装置40还用于：确定在第二预设时段内，获取所述推荐请求的频率；确定所述基本信息的最后修改时间与当前时间的修改时间间隔；根据所述频率和所述修改时间间隔确定所述基本信息的可信度；在所述根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签，第五确定单元408具体用于，若所述基本信息的可信度大于第七预设值，则根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签；若所述基本信息的可信度不大于所述第七预设值，则根据所述可用历史推荐信息所属的领域和所述可用历史推荐信息所属的类型确定基础推荐标签。

可以理解的是，由于方法实施例与装置实施例为相同技术构思的不同呈现形式，因此，本申请中方法实施例部分的内容应同步适配于装置实施例部分，此处不再赘述。

在采用集成的单元的情况下，请参阅图6，图6是本申请实施例提供的另一种基于语音数据的推荐信息确定装置的功能单元组成框图。在图6中，基于语音数据的推荐信息确定装置500包括：处理模块512和通信模块511。处理模块512用于基于语音数据的推荐信息确定装置的动作进行控制管理，例如，执行第一获取单元401、第二获取单元402、第一确定单元403、第二确定单元404、第三确定单元405、第四确定单元406、第三获取单元407、第五确定单元408、和第四获取单元409的步骤，和/或用于执行本文所描述的技术的其它过程。通信模块511用于基于语音数据的推荐信息确定装置与其他设备之间的交互。如图6所示，基于语音数据的推荐信息确定装置还可以包括存储模块513，存储模块513用于存储基于语音数据的推荐信息确定装置的程序代码和数据。

其中，处理模块512可以是处理器或控制器，例如可以是中央处理器(CentralProcessing Unit，CPU)，通用处理器，数字信号处理器(Digital Signal Processor，DSP)，ASIC，FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。通信模块511可以是收发器、RF电路或通信接口等。存储模块513可以是存储器。

其中，上述方法实施例涉及的各场景的所有相关内容均可以援引到对应功能模块的功能描述，在此不再赘述。上述基于语音数据的推荐信息确定装置500可执行上述图3所示的基于语音数据的推荐信息确定方法。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是，电子设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和软件模块。本领域技术人员应该很容易意识到，结合本文中所提供的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分，例如，可以对应各个功能划分各个功能单元，也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

本申请实施例还提供了一种芯片，其中，该芯片包括处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如上述方法实施例中电子设备所描述的部分或全部步骤。

Claims

1.一种基于语音数据的推荐信息确定方法，其特征在于，所述方法包括：

根据所述目标推荐标签确定目标推荐信息。

2.根据权利要求1所述的方法，其特征在于，所述根据所述目标语音互动数据确定所述用户针对每个目标历史推荐信息的互动连续性，包括：

对所述目标语音互动数据进行语义分析，得到多条语义；

确定每两条语义之间的实际间隔时长；

3.根据权利要求2所述的方法，其特征在于，所述根据所述次数确定所述目标历史推荐信息的互动连续性，包括：

获取所述目标语音互动数据对应的目标历史推荐信息的互动难度；

根据所述身份信息获取所述用户的年龄；

根据所述互动难度和所述用户的年龄确定参考间隔时长；

根据所述次数和所述参考间隔时长确定所述目标间隔时长的预测时长总和；

根据所述实际互动时长和所述预测时长总和确定预测互动时长；

确定所述预测互动时长是否大于所述第一预设时长；

若大于，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息互动连续性为连续；

若不大于，则确定所述用户针对所述目标语音互动数据对应的目标历史推荐信息互动连续性为不连续。

4.根据权利要求3所述的方法，其特征在于，所述根据所述可用历史推荐信息、所述可用语音互动数据和所述基本信息确定目标推荐标签，包括：

根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签；

确定每个可用语音互动数据中包括的多条可用语义的语义类型，所述语义类型包括常规语义类型、主动语义类型和无关语义类型，所述常规语义类型用于指示与所述可用语音信息对应的可用推荐信息包括的语音互动内容或语音互动产品或语音互动服务的第一关联度高于第一预设值的语义，所述主动语义类型用于指示所述第一关联度低于所述第一预设值，且与所述可用语音信息对应的可用推荐信息包括的语音互动内容或语音互动产品或语音互动服务所属的领域的第二关联度高于第二预设值语义，所述无关语义类型用于指示所述第一关联度低于所述第一预设值，且所述第二关联度低于所述第二预设值的语义；

确定所述每个可用语音互动数据对应的每种语义类型分别包括的可用语义的第一数量；

根据所述第一数量对所述可用语音互动数据对应的可用历史推荐信息进行标记；

确定每种语义类型分别包括的所有可用语义的第二数量；

根据所述第二数量确定所述用户的说话风格；

根据所述说话风格确定所述标记的可信度；

根据所述可信度和所述标记对所述基础推荐标签进行更改，得到目标推荐标签。

5.根据权利要求4所述的方法，其特征在于，所述根据所述第一数量对所述可用语音互动数据对应的可用历史推荐信息进行标记，包括：

针对每个可用历史推荐信息执行以下步骤：

确定所述可用历史推荐信息所属的参考领域；

确定所述基础推荐标签中是否包括所述参考领域对应的参考领域标签；

若是，则在所述可用历史推荐信息对应的无关语义类型中包括的可用语义的第一数量大于第三预设值的情况下，对所述可用历史推荐信息进行第一标记；

若否，则在所述可用历史推荐信息对应的主动语义类型中包括的可用语义的第一数量大于第四预设值的情况下，对所述可用历史推荐信息进行第二标记。

6.根据权利要求5所述的方法，其特征在于，所述根据所述可信度和所述标记对所述基础推荐标签进行更改，得到目标推荐标签，包括：

确定所述可用历史推荐信息中存在所述第一标记，且属于所述参考领域的可用历史推荐信息的第三数量；

根据所述可信度修正所述第三数量；

在修正后的第三数量大于第五预设值的情况下，从所述基础推荐标签中删除所述参考领域标签，得到目标推荐标签；

确定所述可用历史推荐信息中存在所述第二标记，且不属于所述参考领域的可用历史推荐信息的第四数量；

根据所述可信度修正所述第四数量；

在修正后的第四数量大于第六预设值的情况下，在所述基础推荐标签中添加所述参考领域标签，得到目标推荐标签。

7.根据权利要求6所述的方法，其特征在于，所述根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签之前，所述方法还包括：

确定在第二预设时段内，获取所述推荐请求的频率；

确定所述基本信息的最后修改时间与当前时间的修改时间间隔；

根据所述频率和所述修改时间间隔确定所述基本信息的可信度；

所述根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签，包括：

若所述基本信息的可信度大于第七预设值，则根据所述可用历史推荐信息所属的领域、所述可用历史推荐信息所属的类型和所述基本信息确定基础推荐标签；

若所述基本信息的可信度不大于所述第七预设值，则根据所述可用历史推荐信息所属的领域和所述可用历史推荐信息所属的类型确定基础推荐标签。

8.一种基于语音数据的推荐信息确定装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括处理器、存储器，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。

10.一种计算机可读存储介质，其上存储有计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行实现权利要求1-7任一项所述方法的步骤。