CN108304429A

CN108304429A - 信息推荐方法、装置和计算机设备

Info

Publication number: CN108304429A
Application number: CN201710345126.6A
Authority: CN
Inventors: 袁林
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-05-16
Filing date: 2017-05-16
Publication date: 2018-07-20
Anticipated expiration: 2037-05-16
Also published as: CN108304429B

Abstract

本发明涉及一种信息推荐方法、装置和计算机设备，该方法包括：获取源自于参考业务的目标用户属性；获取属于目标业务的待推荐的信息所属的源自于所述参考业务的信息类别；根据获取的各所述信息所属的信息类别和所述目标用户属性分别对各所述信息评分；将各所述信息按照相应的评分结果进行排序；按照所述排序的结果从各所述信息中选择信息并推荐。本申请的方案不需要依赖于目标业务的用户行为记录的累积就可以实现精准的信息推荐。

Description

信息推荐方法、装置和计算机设备

技术领域

本发明涉及信息处理技术领域，特别是涉及一种信息推荐方法、装置和计算机设备。

背景技术

随着计算机信息技术的发展，信息的种类和数量不断增多，需要通过信息推荐的方式为用户提供有价值的信息。比如用户在看视频的时候，可以向用户推荐视频信息。

通过信息推荐，可以向用户提供用户感兴趣的信息，避免用户通过繁琐的主动搜索来获取信息。目前实现信息推荐，需要记录每个用户的用户行为，从而对记录的用户行为进行分析，从而根据分析结果进行针对性的信息推荐。

然而，目前的信息推荐方式，依赖于用户行为记录的积累，在没有累积足够的用户行为记录的情况下，难以实现准确的信息推荐。

发明内容

基于此，有必要针对目前的信息推荐方式在没有累积足够的用户行为记录的情况下难以实现准确的信息推荐的问题，提供一种信息推荐方法、装置和计算机设备。

一种信息推荐方法，包括：

获取源自于参考业务的目标用户属性；

获取属于目标业务的待推荐的信息所属的源自于所述参考业务的信息类别；

根据获取的各所述信息所属的信息类别和所述目标用户属性分别对各所述信息评分；

将各所述信息按照相应的评分结果进行排序；

按照所述排序的结果从各所述信息中选择信息并推荐。

一种信息推荐装置，包括：

数据获取模块，用于获取源自于参考业务的目标用户属性；获取属于目标业务的待推荐的信息所属的源自于所述参考业务的信息类别；

评分模块，用于根据获取的各所述信息所属的信息类别和所述目标用户属性分别对各所述信息评分；

排序模块，用于将各所述信息按照相应的评分结果进行排序；

推荐模块，用于按照所述排序的结果从各所述信息中选择信息并推荐。

在其中一个实施例中，所述数据获取模块还用于获取目标业务的客户端登录所用的目标用户标识；根据所述目标用户标识，读取相应的源自于参考业务的目标用户属性；

所述推荐模块还用于按照所述排序的结果从各所述信息中选择信息，并推送选择的信息至所述目标业务的客户端。

在其中一个实施例中，所述信息为音频、视频和文本中至少一种的描述信息；和/或，

所述目标用户属性包括目标用户基础属性和/或根据源自于所述参考业务的用户行为记录生成的目标用户画像属性。

在其中一个实施例中，所述评分模块还用于对于各所述信息，分别根据相应的信息类别、所述目标用户属性和依据源自于所述参考业务的用户行为记录训练得到的机器学习模型进行评分。

在其中一个实施例中，所述评分模块还用于分别根据各所述信息相应的信息类别、所述目标用户属性和依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中的评分部分，对各所述信息分别评分；其中，所述评分部分用于评分以获得相应的评分结果，所述机器学习模型还包括用于根据所述评分结果输出用户行为分类结果的分类决策部分；所述机器学习模型根据源自于所述参考业务的用户行为记录进行分类训练得到。

在其中一个实施例中，所述用户行为记录包括用户行为分类结果、相应的用户属性和相应信息所属的信息类别。

在其中一个实施例中，所述评分模块还用于分别根据获取的各所述信息所属的信息类别和所述目标用户属性，确定各所述信息的推荐相关的特征；针对各所述信息的推荐相关的特征，分别获取依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中相应的参数；根据获取的参数分别对获取的各所述信息评分。

在其中一个实施例中，所述评分模块还用于对于各所述信息中的每条信息，分别将相应的信息类别和所述目标用户属性中的一种或多种的预设组合，映射为相应信息的推荐相关的特征的特征名称；获取依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中与所述特征名称相对应的参数。

在其中一个实施例中，所述评分模块还用于获取各所述信息的每个信息类别及每个目标用户属性各自的语义标识符；将获取的语义标识符中的一种或多种的预设组合，组装为与相应信息的推荐相关的特征的特征名称。

在其中一个实施例中，所述机器学习模型包括评分部分和分类决策部分；所述评分部分用于将枚举的全量的特征的值以相对应的参数为权重进行加权求和得到相应的评分结果；所述装置还包括：

训练模块，用于在所述枚举的全量的特征中，将与所述用户行为记录中的用户属性和信息类别中的一种或多种的预设组合相关的特征的值置为第一预设值；在所述枚举的全量的特征中，将与所述用户行为记录中的用户属性和信息类别中的一种或多种的预设组合无关的特征的值置为第二预设值；将置值后的特征的值作为机器学习模型的输入量，并将所述用户行为记录中的用户行为分类结果作为分类结果进行训练，获得所述机器学习模型中的评分部分中与枚举的各特征相对应的参数。

一种计算机设备，包括存储器和处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行以下步骤：

获取源自于参考业务的目标用户属性；

将各所述信息按照相应的评分结果进行排序；

按照所述排序的结果从各所述信息中选择信息并推荐。

在其中一个实施例中，所述获取源自于参考业务的目标用户属性，包括：

获取目标业务的客户端登录所用的目标用户标识；

根据所述目标用户标识，读取相应的源自于参考业务的目标用户属性；

所述按照所述排序的结果从各所述信息中选择信息并推荐，包括：

按照所述排序的结果从各所述信息中选择信息，并推送选择的信息至所述目标业务的客户端。

在其中一个实施例中，所述信息为音频、视频和文本中至少一种的描述信息；

和/或，

在其中一个实施例中，其特征在于，所述根据获取的各所述信息所属的信息类别和所述目标用户属性分别对各所述信息评分，包括：

对于各所述信息，分别根据相应的信息类别、所述目标用户属性和依据源自于所述参考业务的用户行为记录训练得到的机器学习模型进行评分。

在其中一个实施例中，所述对于各所述信息，分别根据相应的信息类别、所述目标用户属性和依据源自于所述参考业务的用户行为记录训练得到的机器学习模型进行评分，包括：

分别根据各所述信息相应的信息类别、所述目标用户属性和依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中的评分部分，对各所述信息分别评分；

其中，所述评分部分用于评分以获得相应的评分结果，所述机器学习模型还包括用于根据所述评分结果输出用户行为分类结果的分类决策部分；所述机器学习模型根据源自于所述参考业务的用户行为记录进行分类训练得到。

分别根据获取的各所述信息所属的信息类别和所述目标用户属性，确定各所述信息的推荐相关的特征；

针对各所述信息的推荐相关的特征，分别获取依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中相应的参数；

根据获取的参数分别对获取的各所述信息评分。

在其中一个实施例中，所述分别根据获取的各所述信息所属的信息类别和所述目标用户属性，确定各所述信息的推荐相关的特征，包括：

对于各所述信息中的每条信息，分别将相应的信息类别和所述目标用户属性中的一种或多种的预设组合，映射为相应信息的推荐相关的特征的特征名称；

所述针对各所述信息的推荐相关的特征，分别获取依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中相应的参数，包括：

获取依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中与所述特征名称相对应的参数。

在其中一个实施例中，所述对于各所述信息中的每条信息，分别将相应的信息类别和所述目标用户属性中的一种或多种的预设组合，映射为相应信息的推荐相关的特征的特征名称，包括：

获取各所述信息的每个信息类别及每个目标用户属性各自的语义标识符；

将获取的语义标识符中的一种或多种的预设组合，组装为与相应信息的推荐相关的特征的特征名称。

在其中一个实施例中，所述机器学习模型包括评分部分和分类决策部分；所述评分部分用于将枚举的全量的特征的值以相对应的参数为权重进行加权求和得到相应的评分结果；所述计算机可读指令还使得所述处理器执行以下步骤：

在所述枚举的全量的特征中，将与所述用户行为记录中的用户属性和信息类别中的一种或多种的预设组合相关的特征的值置为第一预设值；

在所述枚举的全量的特征中，将与所述用户行为记录中的用户属性和信息类别中的一种或多种的预设组合无关的特征的值置为第二预设值；

将置值后的特征的值作为机器学习模型的输入量，并将所述用户行为记录中的用户行为分类结果作为分类结果进行训练，获得所述机器学习模型中的评分部分中与枚举的各特征相对应的参数。

上述信息推荐方法、装置和计算机设备，对于目标业务的待推荐的各信息，采用源自于参考业务的信息类别进行分类后，利用待推荐的信息所属的信息类别以及源自于参考业务的目标用户属性对信息进行评分。评分结果可以准确地反映目标用户与目标业务的信息的匹配程度，依据评分对各信息排序后，按照排序的结果从各所述信息中选择信息并推荐，就可以对目标业务的待推荐的信息进行准确地推荐，不需要依赖于目标业务的用户行为记录的累积。

附图说明

图1为一个实施例中信息推荐方法的应用环境图；

图2为一个实施例中计算机设备的结构框图；

图3为一个实施例中信息推荐方法的流程示意图；

图4为一个实施例中根据获取的各信息所属的信息类别和目标用户属性分别对各信息评分的步骤的流程示意图；

图5为一个实施例中训练机器学习模型的步骤的流程示意图；

图6为一个实施例中信息推荐方法的整体流程示意图；

图7为一个实施例中信息推荐装置的结构框图；

图8为另一个实施例中信息推荐装置的结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1为一个实施例中信息推荐方法的应用环境图。参照图1，该信息推荐方法的应用环境包括服务器110和终端120，服务器110和终端120通过网络连接。其中，服务器110可获取源自于参考业务的目标用户属性；获取属于目标业务的待推荐的信息所属的源自于参考业务的信息类别；根据获取的各信息所属的信息类别和目标用户属性分别对各信息评分；将各信息按照相应的评分结果进行排序；按照排序的结果从各信息中选择信息并推荐。服务器110可以是独立的物理服务器或者物理服务器集群。终端120可以是个人计算机或者移动终端，移动终端包括手机、平板电脑、个人数字助理或者穿戴式设备等中的至少一种。

其中，目标业务是需要进行信息推荐的业务，参考业务是提供对目标业务的待推荐信息进行推荐的依据的业务。目标业务和参考业务具有相同或近似的信息类别。目标业务和参考业务分别可以是在线视频业务、在线音频业务和在线文本业务等。视频可以是电影、电视剧或者用户自制视频等。音频可以是流行歌曲、音乐或者用户自制音频等。文本比如小说、工具书或者专业词典等。

在一个实施例中，服务器110可以包括相连接的参考业务服务器111和目标业务服务器112。其中，参考业务服务器111用于提供参考业务的服务，目标业务服务器112用于提供目标业务的服务。参考业务服务器111可提供源自于参考业务的目标用户属性，并提供源自于参考业务的信息类别的集合。目标业务服务器112可缓存源自于参考业务的目标用户属性，并对属于目标业务的待推荐的信息，分别赋予源自于参考业务的信息类别的集合中的一种或多种的信息类别。目标业务服务器112可获取源自于参考业务的目标用户属性；获取属于目标业务的待推荐的信息所属的源自于参考业务的信息类别；根据获取的各信息所属的信息类别和目标用户属性分别对各信息评分；将各信息按照相应的评分结果进行排序；按照排序的结果从各信息中选择信息，并向目标用户标识对应的终端120推荐选择的信息。

图2为一个实施例中计算机设备的结构框图。该计算机设备可以是图1中的服务器110或者终端120。参照图2，该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中，计算机设备的非易失性存储介质存储有操作系统。计算机设备的处理器用于提供计算和控制能力，支撑整个计算机设备的运行。计算机设备的非易失性存储介质和/或内存储器中可存储有计算机可读指令，该计算机可读指令被处理器执行时，可使得处理器执行一种信息推荐方法。计算机设备的网络接口用于据以与外部连接通信。

本领域技术人员可以理解，图2中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

图3为一个实施例中信息推荐方法的流程示意图。该信息推荐方法可应用于终端或者服务器。本实施例主要以该方法应用于上述图1中的目标业务服务器112来举例说明。参照图3，该信息推荐方法具体包括如下步骤：

S302，获取源自于参考业务的目标用户属性。

其中，业务是提供给用户使用的服务的集合。业务可以是在线视频业务、在线音频业务和在线文本业务等。视频可以是电影、电视剧或者用户自制视频等。音频可以是流行歌曲、音乐或者用户自制音频等。文本比如小说、工具书或者专业词典等。

用户是指业务的使用者，可以是自然人、团体或者自然人所使用的终端。参考业务是提供对目标业务的待推荐信息进行推荐的依据的业务。用户属性是描述相应用户的信息，可以包括用户基础属性和/或用户画像属性。其中，用户基础属性是原始的用户属性，用户画像属性是根据用户行为记录和/或用户基础属性分析生成的用户属性。用户基础属性比如用户年龄、用户性别、用户地理位置或者用户学历等。用户画像属性比如用户兴趣标签、用户群体或者用户性格等。

目标用户是需要接收推荐的信息的用户。目标用户属性则是目标用户的用户属性。在一个实施例中，目标用户属性包括目标用户基础属性和/或根据源自于参考业务的用户行为记录生成的目标用户画像属性。

在一个实施例中，步骤S302包括：获取目标用户标识，根据目标用户标识，读取相应的源自于参考业务的目标用户属性。

具体地，目标业务服务器可接收访问请求，从访问请求中提取目标用户标识，从而从本地缓存中读取取自参考业务服务器的与该目标用户标识对应的目标用户属性，或者从参考业务服务器拉取与该目标用户标识对应的目标用户属性。访问请求可由目标业务的客户端触发，具体可由浏览器通过目标业务所提供的用于提供目标业务的服务的网页触发。目标业务的客户端是供用户使用目标业务的服务的应用程序。

在一个实施例中，步骤S302包括：获取属于目标业务的目标用户标识，根据目标业务和参考业务之间的用户标识映射关系，将目标用户标识映射为属于参考业务的目标用户标识，从而获取与属于参考业务的目标用户标识对应的、且源自于参考业务的目标用户属性。

具体地，目标业务服务器可接收访问请求，从访问请求中提取属于目标业务的目标用户标识，将该目标用户标识映射为属于参考业务的目标用户标识，从而从本地缓存中读取取自参考业务服务器的与属于参考业务的目标用户标识对应的目标用户属性，或者从参考业务服务器拉取与属于参考业务的目标用户标识对应的目标用户属性。访问请求可由目标业务的客户端触发，具体可由浏览器通过目标业务所提供的用于提供目标业务的服务的网页触发。目标业务的客户端是供用户使用目标业务的服务的应用程序。

在一个实施例中，步骤S302包括：获取属于目标业务的目标用户基础属性，查找源自于参考业务的与目标用户基础属性匹配的用户基础属性，进而查找与该用户基础属性对应的用户画像属性作为目标用户画像属性。匹配可以是相同或者相似度超过预设相似度。

S304，获取属于目标业务的待推荐的信息所属的源自于参考业务的信息类别。

其中，信息类别是指将信息分类为多个子集后每个子集的标识。待推荐的信息是需要推荐的信息。待推荐的信息可以是音频、视频和文本中至少一种的描述信息，也可以是音频、视频和文本中至少一种。待推荐的信息所属的信息类别源自于参考业务，就是说目标业务的待推荐的信息采用了参考业务的信息分类方式。一个待推荐的信息可以属于一个或者多于一个的信息类别。

举例说明，假设目标业务为在线电影业务，参考业务为在线多种类视频业务，其中多种类视频是指视频种类多于一种，多种类可以包括或者不包括电影类。在线电影业务和在线多种类视频业务都可以采用如下的视频标签或称为视频类别：动作，冒险，喜剧，科幻，爱情，战争，恐怖，动画，犯罪，记录，伦理，历史，音乐，悬疑，惊悚，武侠，灾难，情色，剧情，预告片，院线，奇幻，家庭，传记，歌舞，西部，原创栏目，微电影，电影特辑，电视剧未知，偶像，古装，武侠，警匪，历史，情景，家庭，神话，真人秀，剧情，恐怖，悬疑，战争，军事，片花，爱情，纪实，喜剧，都市，科幻，犯罪，网络剧，谍战，魔幻，动作，原创栏目，刑侦，创意剪辑，动漫，未知，动作，搞笑，科幻，魔法，侦探，竞技以及校园。

S306，根据获取的各信息所属的信息类别和目标用户属性分别对各信息评分。

其中，评分是通过输入信息所属的信息类别和目标用户属性，输出相应信息的评分结果的过程。评分结果是数值，用于量化表示进行评分的信息和目标用户之间的匹配程度。评分结果可以与匹配程度正相关。

在一个实施例中，步骤S306包括：将待推荐的各信息所属的信息类别分别与目标用户属性进行匹配，根据匹配的数量对相应信息进行累积评分。累积评分时，不同的匹配可以赋予不同的权重。比如目标用户属性包括用户兴趣标签为80后(表示1980年以后出生的人)和冒险，则匹配的视频类别为冒险和动作，则匹配的数量为2，从而可以据此进行累积评分。

S308，将各信息按照相应的评分结果进行排序。

在一个实施例中，目标业务服务器可将评分结果按照从大到小的顺序排序，各信息的排序结果可直接采用相应评分结果的排序结果。目标业务服务器也可以将各信息的标识按照相应的评分结果从大到小的顺序排序，信息标识的顺序就反映了信息的顺序。

S310，按照排序的结果从各信息中选择信息并推荐。

在一个实施例中，目标业务服务器可从排序的信息中排首位的信息起，取预设数量的信息进行推荐。推荐的信息可按照相应的评分结果进行排序。选择的信息可一次性推荐，也可以分批次推荐。推荐的信息可携带有信息的次序信息和/或评分结果，以将推荐的信息按相应的次序信息和/或评分结果排序显示。

在一个实施例中，当信息推荐方法应用于终端时，终端可以列表形式展示选择的信息，从而实现信息推荐。在一个实施例中，当信息推荐方法应用于目标业务服务器时，目标业务服务器可将选择的信息推送至目标用户所使用的终端，以实现信息推荐。

上述信息推荐方法，对于目标业务的待推荐的各信息，采用源自于参考业务的信息类别进行分类后，利用待推荐的信息所属的信息类别以及源自于参考业务的目标用户属性对信息进行评分。评分结果可以准确地反映目标用户与目标业务的信息的匹配程度，依据评分对各信息排序后，按照排序的结果从各信息中选择信息并推荐，就可以对目标业务的待推荐的信息进行准确地推荐，不需要依赖于目标业务的用户行为记录的累积。

在一个实施例中，步骤S302包括：获取目标业务的客户端登录所用的目标用户标识；根据目标用户标识，读取相应的源自于参考业务的目标用户属性。步骤S310包括：按照排序的结果从各信息中选择信息，并推送选择的信息至目标业务的客户端。

其中，目标业务的客户端是供用户使用目标业务的服务的应用程序，如在线视频客户端、在线音频客户端或者浏览器等。目标用户可通过目标用户标识登录终端上运行的目标业务的客户端，从而连接到目标业务服务器。目标业务服务器则获取登录该客户端的目标业务标识，从而读取相应的源自于参考业务的目标用户属性，从而对待推荐的信息评分，从而根据评分结果向客户端推送信息。

上述实施例中，当目标用户登录目标业务的客户端后，就可以通过该客户端接收到推荐的信息，而且推荐的信息能够准确地满足目标用户的需求。在目标用户初次使用目标业务的客户端时，就能够进行准确地信息推荐，有利于客户端的推广使用。

在一个实施例中，步骤S306包括：对于各信息，分别根据相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型进行评分。

具体地，目标业务服务器可针对每个待推荐的信息，分别将相应的信息类别和目标用户属性构成机器学习模型的输入量，将该输入量输入到机器学习模型，获得由该机器学习模型输出的针对待推荐的信息的评分结果，或者获得该机器学习模型的中间处理结果作为针对待推荐的信息的评分结果。

其中，机器学习模型是经过训练后具有评分能力的算法模型。该机器学习模型可采用神经网络模型，支持向量机(Support Vector Machine，SVM)或者逻辑回归模型。

用户行为记录是记录用户的计算机可识别的操作的数据。用户行为记录可以包括用户行为分类结果、相应的用户属性和相应信息所属的信息类别。用户行为分类结果可以包括执行了操作的类型和未执行操作的类型，执行了操作的类型还可以细分为执行了多种操作中一种的类型。

比如某用户行为记录X1，表示用户A1对信息B1做了访问操作，其中用户A1可用相应的用户属性表示，信息B1可用相应的信息类别表示，进行了访问操作则是相应的用户行为分类结果。再比如某用户行为记录X2，表示用户A2对信息B2未进行访问操作，未进行访问操作则是用户行为记录X2的用户行为分类结果。

在一个实施例中，将相应的信息类别和目标用户属性构成机器学习模型的输入量时，可将相应的信息类别和目标用户属性，以独立或者组合的方式，映射至预设的全量的特征中的相应特征，将映射至的相应特征的值置为第一预设值，并将全量的特征中未被映射至的特征的值置为第二预设值，进而将置值后的全量的特征作为机器学习模型的输入量。

其中，预设的全量的特征可以枚举特征。枚举的特征可供各种信息类别和各种用户属性以独立或者组合的方式进行映射。枚举的特征可覆盖信息类别和用户属性及其组合的各种可选状态。第一预设值可取预设非零值，相应的第二预设值可取零。

上述实施例中，经过源自于参考业务的用户行为记录训练得到的机器学习模型，具备了对属于参考业务的信息的评分能力。在目标业务还未累积足够的用户行为记录的情况下，针对属于目标业务的待推荐的信息，就可以利用该机器学习模型并结合源自于参考业务的目标用户属性和信息类别进行准确评分，从而实现精准地信息推荐。

在一个实施例中，对于各信息，分别根据相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型进行评分的步骤包括：分别根据各信息相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型中的评分部分，对各信息分别评分；其中，评分部分用于评分以获得相应的评分结果，机器学习模型还包括用于根据评分结果输出用户行为分类结果的分类决策部分；机器学习模型根据源自于参考业务的用户行为记录进行分类训练得到。

在一个实施例中，步骤S306包括：分别根据各信息相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型中的评分部分，对各信息分别评分；其中，评分部分用于评分以获得相应的评分结果，机器学习模型还包括用于根据评分结果输出用户行为分类结果的分类决策部分；机器学习模型根据源自于参考业务的用户行为记录进行分类训练得到。

具体地，机器学习模型包括评分部分和分类决策部分。评分部分和分类决策部分都是计算机可执行的代码逻辑。评分部分用于将输入机器学习模型的输入量进行评分，以将该输入量映射为评分结果并输出。分类决策部分用于将评分模型输出的评分结果映射为用户行为分类结果，以实现预测用户行为。对待推荐的信息进行评分时，可直接采用机器学习模型所包括的评分部分所输出的评分结果。

在一个实施例中，评分部分用于将枚举的全量的特征的值以相对应的参数为权重进行加权求和得到相应的评分结果。

在一个实施例中，当第二预设值为零时，评分部分可用于将置为第一预设值的特征的值以相对应的参数为权重进行加权求和得到相应的评分结果。

在一个实施例中，评分部分可用于在加权求和后，将加权求和的结果映射至预设范围内。预设范围比如[0，1]。

举例说明，假设机器学习模型的评分部分可用于实现以下公式(1)和(2)：

f(θ,X)＝θ₀+θ₁*x₁+θ₂*x₂+...+θ_n*x_n (1)

h(X)＝e^f(θ,X)/(1+e^f(θ,X)) (2)

其中，公式(1)中的X表示机器学习模型的输入量，x₁,x₂,...x_n是枚举的全量的特征的值；θ代表机器学习模型的评分部分的参数，包括θ₀,θ₁,θ₂,...θ_n；θ₁,θ₂,...θ_n分别为枚举的全量的特征各自对应的参数；θ₀表示修正值，可以省略；n为全量的特征的数量。公式(2)中e为自然底数。公式(1)用于将枚举的全量的特征的值以相对应的参数为权重进行加权求和得到相应的评分结果。公式(2)用于将加权求和的结果映射至预设范围内。

在一个实施例中，分类决策部分可用于实现以下公式(3)：

其中，Th是机器学习模型的分类决策部分的参数；当y＝1时表示通过输入量预测用户执行了操作，当y＝0时表示通过输入量预测用户未执行操作。

当机器学习模型实现上述公式(1)、(2)和(3)时，其中的参数θ₀,θ₁,θ₂,...θ_n以及Th通过训练来确定。训练机器学习模型时，将用户行为记录转化为特征的值x₁,x₂,...x_n以及相应的用户行为分类结果y后进行训练，以确定参数θ₀,θ₁,θ₂θ,...θ_n以及Th。Th也可以取预设值，比如0.5。

上述实施例中，机器学习模型包括评分部分和分类决策部分，训练机器学习模型时，根据源自于参考业务的用户行为记录进行分类训练，使得评分部分能够输出供分类决策部分准确地预测用户行为的评分结果，使得评分部分能够对信息进行准确地评分，从而进行更加精准地信息推荐。

在一个实施例中，对于各信息，分别根据相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型进行评分，包括：分别根据获取的各信息所属的信息类别和目标用户属性，确定各信息的推荐相关的特征；针对各信息的推荐相关的特征，分别获取依据源自于参考业务的用户行为记录训练得到的机器学习模型中相应的参数；根据获取的参数分别对获取的各信息评分。

如图4所示，在一个实施例中，步骤S306包括：

S402，分别根据获取的各信息所属的信息类别和目标用户属性，确定各信息的推荐相关的特征。

S404，针对各信息的推荐相关的特征，分别获取依据源自于参考业务的用户行为记录训练得到的机器学习模型中相应的参数。

S406，根据获取的参数分别对获取的各信息评分。

其中，与信息的推荐相关的特征，是表示该信息所存在的与判断是否推荐有关的特征。与信息的推荐相关的特征是已知的特征中该信息所涉及的特征，具体可以是全量的特征中该信息所涉及的特征。

举例说明，假设全量的特征的值依次为x₁,x₂,x₃,x₄,...x_n，假设其中x₁,x₂,x₃分别表示一种用户属性的不同状态，如分别表示10～20、20～40以及40以上的年龄段，若一种目标用户属性为目标用户年龄，若x₁,x₂,x₃中目标用户年龄所在的年龄段所对应的特征为x₁，则x₁为与信息的推荐相关的特征。

再假设x₄,x₅,x₆,...,x₅₅分别表示另一种用户属性的不同状态，比如用户属性为用户兴趣标签，若目标用户具有其中一个或多个用户兴趣标签，则目标用户具有的用户兴趣标签所对应的特征为与信息的推荐相关的特征。

在一个实施例中，步骤S402包括：对于各信息中的每条信息，分别将相应的信息类别和目标用户属性中的一种或多种的预设组合，映射为相应信息的推荐相关的特征的特征名称。步骤S404包括：获取依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中与所述特征名称相对应的参数。

其中，多于一个的目标用户属性可以组合，多于一个的信息类别可以组合，至少一个用户属性和至少一个信息类别也可以组合，每种组合可对应全量的特征中的一个特征。若目标用户属性和/或信息类别之间存在这种组合，则存在的组合所对应的特征为与信息的推荐相关的特征。

假设若x₅₆表示用户性别为男性、用户兴趣标签为血腥以及信息类别为动作的组合，则若目标用户性别为男性，目标用户的兴趣标签包括血腥，一条信息所属的信息类别为动作，则对于该条信息，该组合对应的特征为与该信息的推荐相关的特征。

在一个实施例中，步骤S402包括：获取各信息的每个信息类别及每个目标用户属性各自的语义标识符；将获取的语义标识符中的一种或多种的预设组合，组装为与相应信息的推荐相关的特征的特征名称。

其中，语义标识符可唯一标识相应的用户属性或者信息类别，且具有表示该标识符所对应的用户属性或者信息类别的语义表达能力。特征名称用于唯一标识相应的特征。通过特征名称可以查找到相应的特征。特征名称中的语义标识符可按照预定的顺序排列。

比如，一种用户属性为用户性别，则当目标用户的用户性别为男性时，相应的语义标签为gender和1的组合。其中gender表示用户性别，1则表示用户性别为男性，组装成特征名称比如gender_1。

再比如，用户兴趣标签为恶搞和信息类别为都市存在预设的组合，则组合而成的特征名称可以是comb_user_interest_item_category_恶搞_都市，其中comb表示组合特征，user表示用户，interest表示用户兴趣标签，item表示信息，category表示信息类别，“恶搞”表示用户兴趣标签中的具体一种，都市表示信息类别中的具体一种。

类似地，还可以组合得到其它特征名称，如comb_user_gender_interest_item_category_1_伦理_日本，comb_user_gender_interest_item_id_1_血腥_538764，或者comb_user_interest_item_category_武侠_历史，其中“伦理”、“血腥”和“武侠”分别表示用户兴趣标签中的具体一种，538764表示信息标识，“历史”表示信息类别中的具体一种。

在获取到特征名称后，就可以从经过训练的机器学习模型中获取与该特征名称对应的参数，如θ₁,θ₂,...θ_n。获取到参数后，可以直接将获取的参数进行加权求和获得评分结果。也可以将获取到的参数与相应特征项的值相乘后累加，得到相应的评分结果。

上述实施例中，确定各信息的推荐相关的特征后，就可以获取机器学习模型中的相应参数，从而利用获取的参数进行评分，可提高评分效率。

在一个实施例中，该信息推荐方法还包括训练机器学习模型的步骤。参照图5，该训练机器学习模型的步骤具体包括如下步骤：

S502，在枚举的全量的特征中，将与用户行为记录中的用户属性和信息类别中的一种或多种的预设组合相关的特征的值置为第一预设值。

其中，与用户行为记录中的用户属性和信息类别中的一种或多种的预设组合相关的特征，是用户行为记录具备的特征。

具体地，可先构建包括未知参数的机器学习模型，该机器学习模型包括评分部分和分类决策部分。目标业务服务器具体可确定用户行为记录中可提取出的特征作为全量的特征，按照该全量的特征的数量构建机器学习模型。比如，可按照上述公式(1)、(2)和(3)构建机器学习模型。

进一步地，目标业务服务器可将每个用户行为记录映射为全量的特征的值和相应的用户行为分类结果。具体可将枚举的全量的特征作为模板，将用户行为记录中涉及到的用户属性和信息类别各自对应的特征的值置为第一预设值，如1。将用户行为记录所包括的多于一个的目标用户属性组合，或者将用户行为记录所包括的多于一个的信息类别组合，或者将用户行为记录所包括的至少一个用户属性和至少一个信息类别组合，从而置枚举的全量的特征中与这些组合对应的特征的值为第一预设值。

S504，在枚举的全量的特征中，将与用户行为记录中的用户属性和信息类别中的一种或多种的预设组合无关的特征的值置为第二预设值。

其中，全量的特征的值可默认为第二预设值，从而在经过步骤S506后，实现将与用户行为记录中的用户属性和信息类别中的一种或多种的预设组合有关和无关的特征的值分别置为第一预设值和第二预设值。或者，全量的特征的值可默认为第一预设值，从而可先执行步骤S504后，实现将与用户行为记录中的用户属性和信息类别中的一种或多种的预设组合有关和无关的特征的值分别置为第一预设值和第二预设值。

S506，将置值后的特征的值作为机器学习模型的输入量，并将用户行为记录中的用户行为分类结果作为分类结果进行训练，获得机器学习模型中的评分部分中与枚举的各特征相对应的参数。

具体地，按照上述公式(1)、(2)和(3)构建机器学习模型时，可先构建目标函数如公式(4)：

其中，i表示用户行为记录的序号；X_i表示第i个用户行为记录提取的特征构成的输入量；y_i表示第i个用户行为记录的用户行为分类结果；P(y_i＝1|X_i)表示输入量X_i分类为y_i＝1类的概率；θ表示机器学习模型的评分部分中待求解的参数。

可采用梯度下降法、梯度上升法或者牛顿法来求解参数θ，使得目标函数最大化。

其中求解参数时的参数更新公式可表示为公式(5)：

其中，t表示迭代次数；α为可调参数；

上述实施例中，枚举全量的特征的值置为两种，其中一种值表示信息和/或目标用户具备相应的特征，另一种则表示不具备相应的特征，通过将置值后的特征的值作为机器学习模型的输入量，并将用户行为记录中的用户行为分类结果作为分类结果进行训练，使得训练得到的机器学习模型可以对信息准确评分，使得评分结果能够准确反映用户对该信息的需求程度，有利于实现精准地信息推荐。

下面用一个具体应用场景来说明上述信息推荐方法的整体流程。参照图6，通过枚举方式确定全量的特征，全量的特征覆盖了用户属性的离散取值和信息类别的离散取值，还覆盖了以下组合中的至少一种：多种用户属性的离散取值的组合，多种信息类别的离散取值的组合，以及至少一种用户属性的离散取值和至少一种信息类别的离散取值的组合。

将源自于参考业务的用户行为记录构建为训练样本，每个训练样本包括样本特征和样本分类结果。其中，样本特征可采用上述全量的特征作为特征模板，根据训练样本具有或者不具有相应特征而将特征的值置为1或者0，若用户行为记录表示执行了某操作，则相应的样本分类结果记为1，若用户行为记录表示未执行相应操作，则相应的样本分类结果记为0。

构建表示将全量的特征的值按照各特征对应的参数加权求和后映射到预设范围内得到评分结果的机器学习模型。构建该机器学习模型的目标函数并求解，使得目标函数最大化，学习到机器学习模型中全量的特征中各特征对应的参数。

在需要对某目标用户进行信息推荐时，获取源自于参考业务的目标用户属性；获取属于目标业务的待推荐的信息所属的源自于参考业务的信息类别。进而，根据目标用户属性和待推荐的信息所属的信息类别，确定与对推荐的信息进行评分相关的特征的特征名称，从而按照该特征名称获取机器学习模型中相应的参数，针对每条信息，将查询到的相应参数求和，得到相应的评分结果。将各信息按照相应的评分结果进行排序；按照排序的结果从各信息中选择信息并推荐。

图7为一个实施例中信息推荐装置700的结构框图。参照图7，该信息推荐装置700包括：

数据获取模块701，用于获取源自于参考业务的目标用户属性；获取属于目标业务的待推荐的信息所属的源自于参考业务的信息类别。

评分模块702，用于根据获取的各信息所属的信息类别和目标用户属性分别对各信息评分。

排序模块703，用于将各信息按照相应的评分结果进行排序。

推荐模块704，用于按照排序的结果从各信息中选择信息并推荐。

在一个实施例中，数据获取模块701还用于获取目标业务的客户端登录所用的目标用户标识；根据目标用户标识，读取相应的源自于参考业务的目标用户属性。

推荐模块704还用于按照排序的结果从各信息中选择信息，并推送选择的信息至目标业务的客户端。

在一个实施例中，信息为音频、视频和文本中至少一种的描述信息；和/或，目标用户属性包括目标用户基础属性和/或根据源自于参考业务的用户行为记录生成的目标用户画像属性。

在一个实施例中，评分模块702还用于对于各信息，分别根据相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型进行评分。

在一个实施例中，评分模块702还用于分别根据各信息相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型中的评分部分，对各信息分别评分；其中，评分部分用于评分以获得相应的评分结果，机器学习模型还包括用于根据评分结果输出用户行为分类结果的分类决策部分；机器学习模型根据源自于参考业务的用户行为记录进行分类训练得到。

在一个实施例中，用户行为记录包括用户行为分类结果、相应的用户属性和相应信息所属的信息类别。

在一个实施例中，评分模块702还用于分别根据获取的各信息所属的信息类别和目标用户属性，确定各信息的推荐相关的特征；针对各信息的推荐相关的特征，分别获取依据源自于参考业务的用户行为记录训练得到的机器学习模型中相应的参数；根据获取的参数分别对获取的各信息评分。

在一个实施例中，评分模块702还用于对于各信息中的每条信息，分别将相应的信息类别和目标用户属性中的一种或多种的预设组合，映射为相应信息的推荐相关的特征的特征名称；获取依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中与所述特征名称相对应的参数。

在一个实施例中，机器学习模型包括评分部分和分类决策部分；评分部分用于将枚举的全量的特征的值以相对应的参数为权重进行加权求和得到相应的评分结果。

如图8所示，在一个实施例中，信息推荐装置700还包括：训练模块705，用于在枚举的全量的特征中，将与用户行为记录中的用户属性和信息类别中的一种或多种的预设组合相关的特征的值置为第一预设值；在枚举的全量的特征中，将与用户行为记录中的用户属性和信息类别中的一种或多种的预设组合无关的特征的值置为第二预设值；将置值后的特征的值作为机器学习模型的输入量，并将用户行为记录中的用户行为分类结果作为分类结果进行训练，获得机器学习模型中的评分部分中与枚举的各特征相对应的参数。

上述信息推荐装置700，对于目标业务的待推荐的各信息，采用源自于参考业务的信息类别进行分类后，利用待推荐的信息所属的信息类别以及源自于参考业务的目标用户属性对信息进行评分。评分结果可以准确地反映目标用户与目标业务的信息的匹配程度，依据评分对各信息排序后，按照排序的结果从各信息中选择信息并推荐，就可以对目标业务的待推荐的信息进行准确地推荐，不需要依赖于目标业务的用户行为记录的累积

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中储存有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行以下步骤：获取源自于参考业务的目标用户属性；获取属于目标业务的待推荐的信息所属的源自于参考业务的信息类别；根据获取的各信息所属的信息类别和目标用户属性分别对各信息评分；将各信息按照相应的评分结果进行排序；按照排序的结果从各信息中选择信息并推荐。

在一个实施例中，获取源自于参考业务的目标用户属性，包括：获取目标业务的客户端登录所用的目标用户标识；根据目标用户标识，读取相应的源自于参考业务的目标用户属性；按照排序的结果从各信息中选择信息并推荐，包括：按照排序的结果从各信息中选择信息，并推送选择的信息至目标业务的客户端。

在一个实施例中，根据获取的各信息所属的信息类别和目标用户属性分别对各信息评分，包括：对于各信息，分别根据相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型进行评分。

在一个实施例中，对于各信息，分别根据相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型进行评分，包括：分别根据各信息相应的信息类别、目标用户属性和依据源自于参考业务的用户行为记录训练得到的机器学习模型中的评分部分，对各信息分别评分；其中，评分部分用于评分以获得相应的评分结果，机器学习模型还包括用于根据评分结果输出用户行为分类结果的分类决策部分；机器学习模型根据源自于参考业务的用户行为记录进行分类训练得到。

在一个实施例中，分别根据获取的各信息所属的信息类别和目标用户属性，确定各信息的推荐相关的特征，包括：对于各信息中的每条信息，分别将相应的信息类别和目标用户属性中的一种或多种的预设组合，映射为相应信息的推荐相关的特征的特征名称。针对各信息的推荐相关的特征，分别获取依据源自于参考业务的用户行为记录训练得到的机器学习模型中相应的参数包括：获取依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中与所述特征名称相对应的参数。

在一个实施例中，机器学习模型包括评分部分和分类决策部分；评分部分用于将枚举的全量的特征的值以相对应的参数为权重进行加权求和得到相应的评分结果；计算机可读指令还使得处理器执行以下步骤：在枚举的全量的特征中，将与用户行为记录中的用户属性和信息类别中的一种或多种的预设组合相关的特征的值置为第一预设值；在枚举的全量的特征中，将与用户行为记录中的用户属性和信息类别中的一种或多种的预设组合无关的特征的值置为第二预设值；将置值后的特征的值作为机器学习模型的输入量，并将用户行为记录中的用户行为分类结果作为分类结果进行训练，获得机器学习模型中的评分部分中与枚举的各特征相对应的参数。

上述计算机设备，对于目标业务的待推荐的各信息，采用源自于参考业务的信息类别进行分类后，利用待推荐的信息所属的信息类别以及源自于参考业务的目标用户属性对信息进行评分。评分结果可以准确地反映目标用户与目标业务的信息的匹配程度，依据评分对各信息排序后，按照排序的结果从各信息中选择信息并推荐，就可以对目标业务的待推荐的信息进行准确地推荐，不需要依赖于目标业务的用户行为记录的累积。

在一个实施例中，提供了一个或多个存储有计算机可读指令的计算机可读非易失性存储介质，计算机可读指令被处理器执行时，使得处理器执行以下步骤：获取源自于参考业务的目标用户属性；获取属于目标业务的待推荐的信息所属的源自于参考业务的信息类别；根据获取的各信息所属的信息类别和目标用户属性分别对各信息评分；将各信息按照相应的评分结果进行排序；按照排序的结果从各信息中选择信息并推荐。

上述存储介质，对于目标业务的待推荐的各信息，采用源自于参考业务的信息类别进行分类后，利用待推荐的信息所属的信息类别以及源自于参考业务的目标用户属性对信息进行评分。评分结果可以准确地反映目标用户与目标业务的信息的匹配程度，依据评分对各信息排序后，按照排序的结果从各信息中选择信息并推荐，就可以对目标业务的待推荐的信息进行准确地推荐，不需要依赖于目标业务的用户行为记录的累积。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种信息推荐方法，包括：

获取源自于参考业务的目标用户属性；

将各所述信息按照相应的评分结果进行排序；

按照所述排序的结果从各所述信息中选择信息并推荐。

2.根据权利要求1所述的方法，其特征在于，所述获取源自于参考业务的目标用户属性，包括：

获取目标业务的客户端登录所用的目标用户标识；

3.根据权利要求1所述的方法，其特征在于，所述信息为音频、视频和文本中至少一种的描述信息；

和/或，

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述根据获取的各所述信息所属的信息类别和所述目标用户属性分别对各所述信息评分，包括：

5.根据权利要求4所述的方法，其特征在于，所述对于各所述信息，分别根据相应的信息类别、所述目标用户属性和依据源自于所述参考业务的用户行为记录训练得到的机器学习模型进行评分，包括：

6.根据权利要求4所述方法，其特征在于，所述用户行为记录包括用户行为分类结果、相应的用户属性和相应信息所属的信息类别。

7.根据权利要求4所述的方法，其特征在于，所述对于各所述信息，分别根据相应的信息类别、所述目标用户属性和依据源自于所述参考业务的用户行为记录训练得到的机器学习模型进行评分，包括：

根据获取的参数分别对获取的各所述信息评分。

8.根据权利要求7所述的方法，其特征在于，所述分别根据获取的各所述信息所属的信息类别和所述目标用户属性，确定各所述信息的推荐相关的特征，包括：

9.根据权利要求8所述的方法，其特征在于，所述对于各所述信息中的每条信息，分别将相应的信息类别和所述目标用户属性中的一种或多种的预设组合，映射为相应信息的推荐相关的特征的特征名称，包括：

10.根据权利要求7所述的方法，其特征在于，所述机器学习模型包括评分部分和分类决策部分；所述评分部分用于将枚举的全量的特征的值以相对应的参数为权重进行加权求和得到相应的评分结果；所述方法还包括：

11.一种信息推荐装置，其特征在于，包括：

12.根据权利要求11所述的装置，其特征在于，所述数据获取模块还用于获取目标业务的客户端登录所用的目标用户标识；根据所述目标用户标识，读取相应的源自于参考业务的目标用户属性；

13.根据权利要求11或12所述的装置，其特征在于，所述评分模块还用于对于各所述信息，分别根据相应的信息类别、所述目标用户属性和依据源自于所述参考业务的用户行为记录训练得到的机器学习模型进行评分。

14.根据权利要求13所述的装置，其特征在于，所述评分模块还用于分别根据各所述信息相应的信息类别、所述目标用户属性和依据源自于所述参考业务的用户行为记录训练得到的机器学习模型中的评分部分，对各所述信息分别评分；其中，所述评分部分用于评分以获得相应的评分结果，所述机器学习模型还包括用于根据所述评分结果输出用户行为分类结果的分类决策部分；所述机器学习模型根据源自于所述参考业务的用户行为记录进行分类训练得到。

15.一种计算机设备，其特征在于，包括存储器和处理器，所述存储器中储存有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行如权利要求1至10中任一项所述方法的步骤。