CN112989174A - 信息推荐方法及装置、介质和设备 - Google Patents
信息推荐方法及装置、介质和设备 Download PDFInfo
- Publication number
- CN112989174A CN112989174A CN201911273559.0A CN201911273559A CN112989174A CN 112989174 A CN112989174 A CN 112989174A CN 201911273559 A CN201911273559 A CN 201911273559A CN 112989174 A CN112989174 A CN 112989174A
- Authority
- CN
- China
- Prior art keywords
- recommendation information
- information
- target user
- historical
- piece
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Abstract
本公开涉及数据处理技术领域,提供了一种信息推荐方法及装置,以及计算机存储介质和电子设备。其中,该方法包括:获取目标用户对于各历史推荐信息的浏览行为数据以及获取各历史推荐信息的标识数据;对各历史推荐信息的标识数据进行哈希处理,以将各历史推荐信息的标识数据分别转换为哈希值;根据目标用户对于各历史推荐信息的浏览行为数据,确定目标用户对于各历史推荐信息的兴趣权重;基于各历史推荐信息对应的哈希值以及兴趣权重,确定目标用户的兴趣向量,以基于兴趣向量确定对目标用户的推荐信息。本技术方案够提升推荐信息的计算效率,有利于提升确定推荐信息的实时性。
Description
技术领域
本公开涉及数据处理技术领域,具体而言,涉及一种信息推荐方法及装置,以及实现上述信息推荐方法的计算机存储介质和电子设备。
背景技术
信息流(Feeds)是指在在社交媒体中动态展示的信息,例如,社交媒体中动态展示的体育新闻、娱乐新闻等。
为了满足用户的个性化需求,信息流基于用户的历史浏览和观看行为确定用户的兴趣,从而根据用户的兴趣来实现千人千面的个性化推荐展示信息(Item)。相关技术中,一般根据用户对不同展示信息浏览行为确定对该用户的推荐展示信息。
然而,相关技术存在推荐展示信息的计算效率低的问题,不利于实时确定对用户的推荐信息。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。
发明内容
本公开的目的在于提供一种信息推荐方法及装置,以及实现上述信息推荐方法的计算机存储介质和电子设备,进而在保证信息的推荐准确度的情况下,至少在一定程度上提升推荐信息的计算效率,有利于实时确定对用户的推荐信息。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种信息推荐方法,包括:
获取目标用户对于各历史推荐信息的浏览行为数据以及获取各所述历史推荐信息的标识数据;
对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值;
根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重;以及,
基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量,以基于所述兴趣向量确定对所述目标用户的推荐信息。
根据本公开的一个方面,提供一种信息推荐装置,包括:数据获取模块、哈希处理模块、兴趣权重确定模块,以及信息推荐模块。其中:
上述数据获取模块,被配置为:获取目标用户对于各历史推荐信息的浏览行为数据以及获取各所述历史推荐信息的标识数据;
上述哈希处理模块,被配置为:对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值;
上述兴趣权重确定模块,被配置为:根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重;以及,
上述信息推荐模块,被配置为:基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量,以基于所述兴趣向量确定对所述目标用户的推荐信息。
在本公开的一些实施例中,基于前述方案,上述哈希处理模块,被具体配置为:
对各所述历史推荐信息的标识号,以及内容标签、展示类型和上架时间中的一种或多种进行哈希处理。
在本公开的一些实施例中,基于前述方案,上述哈希处理模块,还被具体配置为:
通过散列函数处理各所述历史推荐信息的字符串型、整型或浮点型的标识数据,得到各所述历史推荐信息的标识数据对应的哈希值。
在本公开的一些实施例中,基于前述方案,上述信息推荐模块,包括:加权处理单元和叠加单元。其中:
上述加权处理单元,被配置为:根据各所述历史推荐信息的兴趣权重对各所述历史推荐信息对应的哈希值进行加权处理,得到各所述历史推荐信息的兴趣子向量;以及,
上述叠加单元,被配置为:叠加各所述历史推荐信息的兴趣子向量,得到所述目标用户的兴趣向量。
在本公开的一些实施例中,基于前述方案,所述哈希值中包括第一数据码以及第二数据码;其中:
上述加权处理单元,被具体配置为:在所述哈希值的数据位为所述第一数据码时,将所述数据位由所述第一数据码替换为各所述历史推荐信息的兴趣权重;以及,
在所述哈希值的数据位为所述第二数据码时,将所述数据位由所述第二数据码替换为各所述历史推荐信息的兴趣权重的相反数。
在本公开的一些实施例中,基于前述方案,上述叠加单元,包括:统计周期确定子单元、候选兴趣子向量确定子单元以及兴趣向量确定子单元。
其中:
上述统计周期确定子单元,被配置为:确定各所述历史推荐信息所在的统计周期;
上述候选兴趣子向量确定子单元,被配置为:根据所述统计周期的时间衰减系数处理各所述历史推荐信息的兴趣子向量,得到各所述历史推荐信息的候选兴趣子向量;以及,
上述兴趣向量确定子单元,被配置为:叠加各所述历史推荐信息的候选兴趣子向量,得到所述目标用户的兴趣向量。
在本公开的一些实施例中,基于前述方案,上述统计周期确定子单元,被具体配置为:
根据所述目标用户对于各所述历史推荐信息的浏览行为数据的时间戳,确定各所述历史推荐信息所在的统计周期;或,
根据各所述历史推荐信息的上架时间确定各所述历史推荐信息所在的统计周期。
在本公开的一些实施例中,基于前述方案,上述信息推荐模块,包括:推荐信息确定单元。
其中,上述推荐信息确定单元,包括:拼接子单元和推荐子单元。具体的:
上述数据获取模块,还被配置为:获取所述目标用户的基础属性数据,获取各所述历史推荐信息的属性数据,以及获取展示页面的场景数据;
上述拼接子单元,被配置为:将所述目标用户的兴趣向量、所述目标用户的基础属性数据、各所述历史推荐信息的属性数据以及所述展示页面的场景数据进行拼接,得到拼接特征;以及,
上述拼接子单元,被配置为:根据所述拼接特征预测对所述目标用户的推荐信息。
在本公开的一些实施例中,基于前述方案,上述拼接子单元,被具体配置为:
将所述拼接特征输入至线下训练的预测模型,以使所述预测模型基于所述拼接特征确定模型的输出,得到各所述历史推荐信息的推荐值;以及,根据推荐分值确定对所述目标用户的推荐信息。
在本公开的一些实施例中,基于前述方案,上述拼接子单元,被具体配置为:
将线下训练的预测模型加载至信息推荐系统的引擎中;
响应于对所述展示页面的访问请求,触发对所述信息推荐系统的推荐请求;
通过所述引擎实时获取所述目标用户的拼接特征;以及,
将所述拼接特征输入至所述预测模型,以通过所述预测模型进行实时预测,得到对所述目标用户的推荐信息。
在本公开的一些实施例中,基于前述方案,上述数据获取模块,被具体配置为:
获取所述目标用户对于各历史推荐信息的观看时长、点击次数、收藏次数以及推荐次数中的一种或多种。
在本公开的一些实施例中,基于前述方案,上述兴趣权重确定模块,被具体配置为:
根据所述目标用户对于各所述历史推荐信息的观看时长、点击次数、收藏次数以及推荐次数中的一种或多种,确定所述目标用户对于各所述历史推荐信息的兴趣权重。
根据本公开的一个方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的信息推荐方法。
根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面所述的信息推荐方法。
由上述技术方案可知,本公开示例性实施例中的信息推荐方法及装置,以及实现上述信息推荐方法的计算机存储介质和电子设备至少具备以下优点和积极效果:
在本公开的一些实施例所提供的技术方案中,根据对目标用户的各历史推荐信息的标识数据进行哈希处理,并根据目标用户对于各历史推荐信息的浏览行为数据,确定目标用户对于各历史推荐信息的兴趣权重。进而基于各历史推荐信息对应的哈希值以及兴趣权重,确定目标用户的兴趣向量,以根据兴趣向量确定对该目标用户的推荐信息。
一方面,本技术方案根据对目标用户的各历史推荐信息的标识信息以及兴趣权重,来获取该目标用户的兴趣向量;可见,本技术方案确定的兴趣特征能够较为全面的反映目标用户的喜好。进一步地,基于上述兴趣向量特征来确定推荐信息,从而有利于保证对该目标用户推荐信息的准确度。另一方面,本技术方案中对上述各历史推荐信息的标识信息进行哈希处理,并基于处理得到的哈希值来确定上述兴趣向量。能够通过较少的数据量实现有效反映目标用户兴趣的爱好,从而提升推荐信息的计算效率,有利于提升确定推荐信息的实时性。
本公开应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
在附图中:
图1示出了可以应用本公开实施例的一种信息推荐方法及装置的示例性应用环境的系统架构的示意图;
图2示意性示出了根据本公开的一实施例的信息推荐方法的流程图;
图3示意性示出了根据本公开的一实施例的用户的兴趣向量的确定方法的流程图;
图4示意性示出了根据本公开的一实施例的历史推荐信息的兴趣子向量的确定方法的流程图;
图5示意性示出了根据本公开的另一实施例的用户的兴趣向量的确定方法的流程图;
图6示意性示出了根据本公开的再一实施例的用户的兴趣向量的确定方法的流程图;
图7示意性示出了根据本公开的又一实施例的用户的兴趣向量的确定方法的流程图;
图8示意性示出了根据本公开的另一实施例的信息推荐方法的流程图;
图9示意性示出了根据本公开的再一实施例的信息推荐方法的流程图;
图10示意性示出了根据本公开的又一实施例的信息推荐方法的流程图;
图11示意性示出本公开示例性实施例中信息推荐装置的结构图;以及,
图12示出本公开示例性实施例中电子设备的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本公开实施例的一种信息推荐方法及装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务端105。网络104用以在终端设备101、102、103和服务端105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务端的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务端。比如服务端105可以是多个服务端组成的服务端集群等。
本公开实施例所提供的信息推荐方法一般由服务端105执行,相应地,信息推荐装置一般设置于服务端105中。但本领域技术人员容易理解的是,本公开实施例所提供的信息推荐方法也可以由终端设备101、102、103执行,相应的,信息推荐装置也可以设置于终端设备101、102、103中,本示例性实施例中对此不做特殊限定。
举例而言,在一种示例性实施例中,可以是终端设备101、102、103获取目标用户对于各历史推荐信息的浏览行为数据以及各历史推荐信息的标识数据并发送至服务端105。从而,服务端105获取目标用户对于各历史推荐信息的浏览行为数据以及获取各所述历史推荐信息的标识数据;然后,服务端105对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值。进一步地,服务端105根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重;最终,服务端105基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量,以基于所述兴趣向量确定对所述目标用户的推荐信息。
示例性的,服务端105还可以将推荐信息发送至终端设备101、102、103,从而,目标用户可以通过终端设备101、102、103方便地浏览上述推荐信息。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。
在这样的实施例中,该计算机程序可以从网络上被下载和安装。在该计算机程序被中央处理单元(CPU)执行时,执行本申请的方法和装置中限定的各种功能。在一些实施例中,服务端105还可以包括人工智能(Artificial Intelligence,简称:AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
其中,人工智能(Artificial Intelligence,简称:AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
机器学习(Machine Learning,简称:ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本公开实施例提供的方案涉及人工智能的机器学习技术,具体通过如下实施例进行说明:
对于向用户推荐信息,通常作法包括:维护一个标签体系,并根据展示条目的展示内容在标签体系中确定对应的标签。根据用户对展示条目的点击等动作来获取展示条目对应的标签,从而根据标签确定用户兴趣。具体的,在进行实现千人千面的个性化推荐时,为了提升展示条目的推荐准确度,则需获取用户较多的标签数量来较为全面的体现用户的兴趣向量。然而,较多的标签数量将影响推荐信息的计算效率,不利于实时确定对用户的推荐信息。
基于上述问题,发明人提供的一种解决思路中,在用户对应的众多标签中截取部分标签作为用户的画像特征。以减少标签数量,从而在一定程度上推荐信息的计算效率,进而提升确定对用户的推荐信息的实时性。
然而,发明人发现,在上述一种解决思路中,用户画像精简了标签数量,这将导致用户的兴趣特征受损,不能够很全面的覆盖用户兴趣,进而将导致推荐信息的准确度下降。
基于推荐信息准确度下降的问题,发明人提供的又一种解决思路中,为了降低用户兴趣的维度,把标签系统构建成具有层级关系的体系。只选择层级体系的顶部标签作为用户的兴趣特征。然而,对于标签之间关系并非单纯的包含关系被包含关系的标签系统来说,标签之间关系较为复杂,无法构建成具有层级关系的体系。
例如,对于体育信息的推荐,因为体育信息中标签的层级关系鉴于产品的特殊性在构建之初就不分明,如:篮球、国际足球和国内足球在同一个层级。同时,标签的父子关系并非单纯的一对多的关系,如:巴塞罗那球队有“西甲”、“欧冠”等多个父节点。
然而,发明人发现,在上述的又一种解决思路中,技术方案的通用性较低。
针对相关技术中存在一种或多种技术问题,本技术方案提供一种信息推荐方法及装置,以及实现上述信息推荐方法的计算机存储介质和电子设备,能够在保证推荐信息准确度的情况下,至少在一定程度上提升推荐信息的计算效率,有利于实时确定对用户的推荐信息。
以下先对本公开提供信息推荐方法实施例的进行详细阐述:
图2示意性示出了根据本公开的一实施例的信息推荐方法的流程图。具体的,参考图2,该图所示实施例包括:
步骤S210,获取目标用户对于各历史推荐信息的浏览行为数据以及获取各所述历史推荐信息的标识数据;
步骤S220,对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值;
步骤S230,根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重;以及,
步骤S240,基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量,以基于所述兴趣向量确定对所述目标用户的推荐信息。
在图2所示实施例提供的技术方案中:一方面,本技术方案根据对目标用户的各历史推荐信息的标识信息以及兴趣权重,来获取该目标用户的兴趣向量;可见,本技术方案确定的兴趣特征能够较为全面的反映目标用户的喜好。进一步地,基于上述兴趣向量特征来确定推荐信息,从而有利于保证对该目标用户推荐信息的准确度。
另一方面,本技术方案中对上述各历史推荐信息的标识信息进行哈希处理,并基于处理得到的哈希值来确定上述兴趣向量。能够通过较少的数据量实现有效反映目标用户兴趣的爱好,从而提升推荐信息的计算效率,有利于提升确定推荐信息的实时性。
再一方面,本技术方案基于历史推荐信息的标识数据以及用户浏览行为数据确定用户的兴趣向量,而不需要确定各历史推荐信息的标签关系或基于标签关系进行信息推荐。从而,本技术方案提供的信息推荐方法具有较高的通用性。
本技术方案以确定任意用户(记作“目标用户”)的推荐信息为例进行说明,以下对图2所示实施例各个步骤的具体实施方式进行详细阐述:
在示例性的实施例中,步骤S210中对目标用户的历史推荐信息是指历史上向该目标用户推荐过的体育新闻、娱乐新闻等多媒体展示信息,可以记作Item。
在示例性的实施例中,上述目标用户的各历史推荐信息可以是根据用户兴趣向用户推荐过的展示信息,还可以是随机向用户推荐过的展示信息。其中,一种根据用户兴趣向用户推荐展示信息的实施方式为:
维护一个标签(tag)体系;再根据各个展示信息Item的内容,在标签体系内选择对应的标签。如:Item1:tag1;Item2:tag1,tag2;Item3:tag2,等等。然后,根据目标用户观看Item的行为,根据所观看过Item的标签确定该目标的标签,记作目标用户的兴趣标签。例如:用户user1观看过Item1和Item3,则用户user1的兴趣标签为tag1和tag2。进一步地,根据目标用户的兴趣标签确定上述推荐展示信息。
示例性的,对于目标用户对应的每兴趣标签,获取该标签对应的Item集合。然后,根据目标用户的兴趣标签对应的Item集合确定上述历史推荐信息。
在示例性的实施例中,在步骤S210中获取目标用户对于各历史推荐信息的浏览行为数据。示例性的,可以通过获取用户的日志信息的方式获取上述目标用户对各历史推荐信息的浏览行为数据。
具体地,可以获取该目标用户对于历史推荐信息A的观看时长作为该目标用户对历史推荐信息A的浏览行为数据,可以获取该目标用户对于历史推荐信息B的点击次数作为该目标用户对历史推荐信息B的浏览行为数据,可以获取该目标用户对于历史推荐信息C的收藏次数作为该目标用户对历史推荐信息C的浏览行为数据点击次数,还可以获取该目标用户对于历史推荐信息D的收藏次数作为该目标用户对历史推荐信息D的浏览行为数据点击次数。当然,还可以根据上述实施方式的组合来确定某一历史推荐信息的浏览行为数据。
上述浏览行为数据可以用来衡量目标用户对各历史推荐信息的喜好程度,以进一步确定该目标用户的兴趣向量。示例性的:
在步骤S230中,根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重。
在示例性的实施例中,假如目标用户对于历史推荐信息的观看时长越长/观看历史推荐信息的完成程度越高,说明该目标用户对于该历史推荐信息的喜好程度越高,从而可以为该历史推荐信息确定一个较高的兴趣权重值。示例性的,用户S完成了对历史推荐信息E的观看,则确定用户S对于历史推荐信息E的兴趣权重为1。反之,目标用户对于历史推荐信息的观看时长越短/观看历史推荐信息的完成程度越低,说明该目标用户对于该历史推荐信息的喜好程度越低,从而可以为该历史推荐信息确定一个较低的兴趣权重值。示例性的,用户S点击了历史推荐信息F(5分钟的视频),但是仅仅观看了整个的观看十几秒钟,则确定用户S对于历史推荐信息F的兴趣权重为接近0的数值。
示例性的,类似于上述实施例中得“观看时长/观看完成程度”,还可以通过点击次数、收藏次数以及推荐次数中的一种或多种,确定目标用户对于各所述历史推荐信息的兴趣权重。
在示例性的实施例中,在步骤S210中,还获取各所述历史推荐信息的标识数据,以及在步骤S220中:对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值。
示例性的,为了准确定位不同的历史推荐信息,历史推荐信息的标识数据包含其标识号(如,参考图中ItemID),从而可以通过将各历史推荐信息各自的标识号进行哈希处理,以得到各历史推荐信息对应的哈希值。参考图3,对于目标用户300的N个历史推荐信息,参考310部分,根据各自的标识号可以表示为[Item1,Item2,Item3,…ItemN]。
进一步地,对于ItemID进行上述哈希处理之后,得到320部分。如,对于标识号为Item1的历史推荐信息,其哈希值为“1100…11”;对于标识号为Item2的历史推荐信息,其哈希值为“1000…11”等。由于各历史推荐信息对应的哈希值长度相同,从而有利于准确地通过推荐历史信息来确定用户的兴趣向量。
示例性的,在通过标识号来确保准确定位各历史推荐信息的基础上,再增加各历史推荐信息自身属性特征,来最终反映用户的兴趣爱好。则还可以将历史推荐信息的标识号以及该历史推荐信息的内容标签、展示类型和上架时间中的一种或多种一起作为该历史推荐信息的标识数据,进行哈希处理,也可以得到各历史推荐信息对应的长度的哈希值。
其中,上述内容标签是指根据该历史推荐信息的内容而标注的至少一个标签,上述展示类型可以包括:视频类型、文字类型和图像类型等。
相较于相关技术中:通过获取用户感兴趣的信息来确定用户兴趣标签,进而直接通过尽量多的兴趣标签来预测对该用户的推荐信息。然而,较多的标签数量将影响推荐信息的计算效率,可见,相关技术不利于实时确定对用户的推荐展示条目。
本技术方案中,将各历史推荐信息的标识数据分别转换为哈希值的具体实施方式包括:通过散列函数处理各所述历史推荐信息的字符串型、整型或浮点型的标识数据,得到各所述历史推荐信息的标识数据对应的哈希值。从而,在最大限度的保存原始信息量的基础上,有效地减少数据量,进而起到提升推荐信息的计算效率的技术效果,有利于实时确定对目标用户的推荐信息。
示例性的,本技术方案与相关技术方案相比,对推荐信息的点击通过率(Click-Through-Rate,简称:CTR)即可提升2.04%。具体数据如下表表1所示:
表1
指标项 | 采用相关技术方案 | 采用本技术方案 | 提升度 |
CTR | 10.28% | 10.49% | 2.04% |
需要说明的是,上述步骤S220和步骤S230的具体实施方式不分先后,可以先执行步骤S220再执行步骤S230,可以先执行步骤S230再执行步骤S220,还可以步骤S220和步骤S230同步执行。
具体的,通过步骤S230对应的具体实施方式确定各历史推荐信息的兴趣权重,如图3中310部分,对于目标用户300对N各历史推荐信息对应的兴趣权重可以表示为[w1,w2,w3,…wN];通过步骤S220对应的具体实施例确定各历史推荐信息对应的哈希值,如图3中320部分的N各历史推荐信息对应的兴趣权重根本可以表示为[1100…11,1000…11,0100…11,…,0010…11]。
进一步地,在步骤S240中:基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量。示例性的,图4示意性示出了根据本公开的一实施例的用户的兴趣向量的确定方法的流程图。
参考图4,该图实施例所示方法包括:
步骤S410,根据各所述历史推荐信息的兴趣权重对各所述历史推荐信息对应的哈希值进行加权处理,得到各所述历史推荐信息的兴趣子向量;以及,步骤S420,叠加各所述历史推荐信息的兴趣子向量,得到所述目标用户的兴趣向量。
在示例性的实施例中,由于各历史推荐信息的兴趣权重能够反映目标用户对于各历史推荐信息的喜好程度,同时上述哈希值又能够唯一标识各历史推荐信息。从而,通过对兴趣权重对对应的历史推荐信息的哈希值进行加权计算,可以准确定位目标用户对于各历史推荐信息的喜好程度。
示例性的,图5示意性示出了根据本公开的一实施例的历史推荐信息的兴趣子向量的确定方法的流程图,可以作为步骤S410的一种具体实施方式。具体的,用于说明各历史推荐信息对应的哈希值包括第一数据码以及第二数据码的情况下,如何实现加权处理。
参考图5,该图实施例所示方法包括:
步骤S510,在所述哈希值的数据位为所述第一数据码时,将所述数据位由所述第一数据码替换为各所述历史推荐信息的兴趣权重;以及,步骤S520,在所述哈希值的数据位为所述第二数据码时,将所述数据位由所述第二数据码替换为各所述历史推荐信息的兴趣权重的相反数。
以下结合图3对步骤S510和步骤S520的具体实施方式进行说明。对于标识号为Item1的历史推荐信息,其对应的哈希值为二进制“1100…11”,同时,目标用户300对该历史推荐信息的兴趣权重为w1。将哈希值中的“1”作为上述第一数据码,将其中的“0”作为上述第二数据码。也就是说,在哈希值的数据位为“1”时,将改数据位由“1”替换为兴趣权重“w1”;在哈希值的数据位为“0”时,将改数据位由“0”替换为“-w1”。从而得到该历史推荐信息对应的兴趣子向量“w1,w1,-w1,-w1…,w1”(参考图3的330部分)。
同理,对于标识号为Item2的历史推荐信息,通过兴趣权重为w2加权处理对应的哈希值后,得到该历史推荐信息对应的兴趣子向量“w2,-w2,-w2,-w2…,w2”。
继续参考图4,在步骤S420中,叠加各所述历史推荐信息的兴趣子向量,得到所述目标用户的兴趣向量。示例性的,参考图3,在对330部分的各个兴趣子向量进行叠加,得到340部分表示的目标用户300的兴趣向量[w1+w2-w3…-wN,w1-w2+w3…-wN,-w1-w2-w3…+Wn,…w1+w2+w3…+wN]。示例性的,目标用户的兴趣向量为[12,-23,19,-32,29,…30]。
在示例性的实施例中,图6示意性示出了根据本公开的再一实施例的用户的兴趣向量的确定方法的流程图。具体的,在考虑时间衰减参数的情况下,步骤S420的另外一种具体实施方式。
参考图6,该图实施例所示方法包括步骤S610-步骤S630。
在步骤S610中,确定各所述历史推荐信息所在的统计周期。
在示例性的实施例中,由于目标用户产生的浏览行为数据的日期愈接近统计上述兴趣向量的日期,愈能够较为准确地反映目标用户现阶段的兴趣爱好;反之,浏览行为数据的日期愈久远,可能随着时间的流逝,用户的兴趣爱好发生改变,则不能够较为准确地反映目标用户现阶段的兴趣爱好。可见,目标用户当前的兴趣爱好收到浏览行为数据的时间戳影响。
从而,步骤S610的具体实施方式可以是:根据目标用户对于各历史推荐信息的浏览行为数据的时间戳,确定各历史推荐信息所在的统计周期。
在示例性的实施例中,各历史推荐信息一般为其对应的上架时间时段所流行的信息,例如,美国职业篮球联赛期间上架的/流行的信息多为篮球相关的信息,而国际足联世界杯期间上架的/流行的信息多为足球相关的信息。因而,历史推荐信息的上架时间在一定程度上也影响了目标用户的兴趣爱好。可见,目标用户当前的兴趣爱好收到历史推荐信息的上架时间影响。
从而,步骤S610的具体实施方式还可以是:根据各历史推荐信息的上架时间确定各历史推荐信息所在的统计周期。
在步骤S620中,根据所述统计周期的时间衰减系数处理各所述历史推荐信息的兴趣子向量,得到各所述历史推荐信息的候选兴趣子向量。
在示例性的实施例中,参考图7,仍以图3所示的对目标用户300各历史推荐信息为例进行说明。在710部分,对于N各历史推荐信息,假如:Item1对应的兴趣子向量为第一个统计周期确定的,其对应的时间衰减系数为s(其中,s为小于1的正数);Item2对应的兴趣子向量为第二个统计周期确定的,其对应的时间衰减系数为s2;Item3对应的兴趣子向量为第三个统计周期确定的,其对应的时间衰减系数为s3;…,ItemN对应的兴趣字向量为第N(N为大于3的整数)个统计周期确定的,其对应的时间衰减系数为sN。其中,第一个统计周期为距离当前时刻最近的统计周期,第N个统计周期为距离当前时刻最远的统计周期。
在示例性的实施例中,根据统计周期的时间衰减系数处理各历史推荐信息的兴趣子向量,得到各历史推荐信息的候选兴趣子向量。示例性的,Item1对应的时间衰减系数为s,通过s与Item1对应的兴趣子向量相乘的方式确定Item1对应的候选兴趣字向量“s*w1,s*w1,-s*w1,-s*w1…,s*w1”。同理,得到Item2对应的候选兴趣字向量“s2*w2,-s2*w2,-s2*w2,-s2*w2…,s2*w2”。
在步骤S630中,叠加各所述历史推荐信息的候选兴趣子向量,得到所述目标用户的兴趣向量。
参考图7的720部分,叠加N各历史推荐信息的候选兴趣子向量,得到目标用户300的兴趣向量:
[s*w1+s2*w2-s3*w3…-sN*wN,s*w1-s2*w2+s3*w3…-sN*wN,-s*w1-s2*w2-s3*w3…+sN*wN,……s*w1+s2*w2+s3*w3…-sN*wN]。
在示例性的实施例中,确定目标用户的兴趣向量之后,在步骤S240中:基于所述兴趣向量确定对所述目标用户的推荐信息。其中,图8示意性示出了根据本公开的另一实施例的信息推荐方法的流程图。
参考图8,该图实施例所示方法包括步骤S810-步骤S830。
在步骤S810中,获取所述目标用户的基础属性数据,获取各所述历史推荐信息的属性数据,以及获取展示页面的场景数据。
本实施例采用机器学习模型来预测目标用户的推荐信息,为了提升推荐信息的预测准确度,在结合上述实施例确定的目标用户的兴趣向量之外,还应获取该目标用户的基础属性数据(如,性别、年龄、居住地、学历等),各所述历史推荐信息的属性数据(如,内容标签、展示类型和上架时间等),以及当前展示页面的场景数据(如,推荐信息的上下文信息等)。
参考图9,采用梯度提升决策树(Gradient Boosting Decision Tree,简称:GBDT)920来实现推荐信息的预测.具体的,模型输入信息910包括:目标用户的兴趣向量912,具体可以是:[0.9,0.3,1.2,12.8…];该目标用户的基础属性数据911可以是:男性、15岁-35岁、北京(居住地)、硕士(学历)等;对该目标用户的某历史推荐信息的属性数据913,包括:詹姆斯(内容标签)、湖人(内容标签)、新闻(展示类型);当前展示页面的场景数据914,包括:Feeds流、首位等。在示例性的实施例中,模型输入信息还可以包括其他特915,如统计类等。
在步骤S820中,将所述目标用户的兴趣向量、所述目标用户的基础属性数据、各所述历史推荐信息的属性数据以及所述展示页面的场景数据进行拼接,得到拼接特征。
在示例性的实施例中,将上述多个特征数据进行拼接可以通过上述梯度提升树模型实现,还可以在输入模型之前,将上述多个特征数据进行拼接得到拼接特征。以在步骤S830中,根据所述拼接特征预测对所述目标用户的推荐信息。
在关于步骤S830的一种具体实施方式中:将所述拼接特征输入至线下训练的预测模型,以使所述预测模型基于所述拼接特征确定模型的输出,得到各所述历史推荐信息的推荐值;以及,根据推荐分值确定对所述目标用户的推荐信息。
本实施例中,采取离线训练预测模型并通过训练后的预测模型实现实时预测。具体的,将根据上述多个特征数据进行拼接得到的拼接特征输入至线下训练的预测模型,则该预测模型基于拼接特征确定模型的输出,得到各历史推荐信息的推荐值。也就是说,得到对各个历史推荐新的推荐值打分(score)。进一步地,对这些分值进行排序,取top N’(其中N’小于上述推荐历史信息的个数N)作为推荐信息,并展示给上述目标用户。
需要说明的是,线下训练模型的过程中,确定训练数据中的各用户的兴趣向量的方式与上述实施例所述的确定目标用户的兴趣向量的方式相同。从而,实时预测过程中目标用户的兴趣向量格式与和离线训练过程中各用户的兴趣向量格式相同,进而有利于保证推荐信息的预测准确度。
在示例性的实施例中,图10示出了关于步骤S830的一种具体实施方式中,参考图10:
首先将将线下训练的预测模型加载至信息推荐系统的引擎1020中;响应于对用户终端1010发出的对展示页面的访问请求(步骤S101),触发对上述信息推荐系统的推荐请求。进一步地,通过上述推荐系统的引擎1020实时获取该目标用户的拼接特征(步骤S102);然后,将所述拼接特征输入至已加载的预测模型,以通过所述预测模型进行实时预测,得到对所述目标用户的推荐信息(步骤S103)。进而,在步骤S104中:将推荐信息发送至用户终端1010,以供上述目标用户观看根据其兴趣爱好而确定的推荐信息。
本技术方案采取离线训练预测模型,以及通过训练后的预测模型实现实时预测的方式确定推荐信息,有利于进一步提升推荐信息的计算效率,以及有利于提升确定对目标用户的推荐信息的时效性。更进一步地,通过获取目标用户对上述推荐信息的浏览行为,可以捕获该目标用户更加准确的兴趣爱好,有利于提升下一轮推荐信息的推荐准确度。
本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由处理器(包含CPU和GPU)执行的计算机程序。例如,通过GPU实现对上述预测模型的模型训练;基于训练后的预测模型,使用CPU实现对目标用户的信息推荐;或者,基于训练后的预测模型,使用GPU实现对目标用户的信息推荐等。在该计算机程序被CPU或GPU执行时,执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本公开示例性实施方式的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
以下介绍本公开的信息推荐装置实施例,可以用于执行本公开上述的信息推荐方法。
图11示意性示出本公开示例性实施例中信息推荐装置的结构图。如图11所示,上述信息推荐装置1100包括:数据获取模块1101、哈希处理模块1102、兴趣权重确定模块1103,以及信息推荐模块1104。其中:
上述数据获取模块1101,被配置为:获取目标用户对于各历史推荐信息的浏览行为数据以及获取各所述历史推荐信息的标识数据;
上述哈希处理模块1102,被配置为:对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值;
上述兴趣权重确定模块1103,被配置为:根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重;
上述信息推荐模块1104,被配置为:基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量,以基于所述兴趣向量确定对所述目标用户的推荐信息。
在本公开的一些实施例中,基于前述方案,上述哈希处理模块1102,被具体配置为:对各所述历史推荐信息的标识号,以及内容标签、展示类型和上架时间中的一种或多种进行哈希处理。
在本公开的一些实施例中,基于前述方案,上述哈希处理模块1102,还被具体配置为:通过散列函数处理各所述历史推荐信息的字符串型、整型或浮点型的标识数据,得到各所述历史推荐信息的标识数据对应的哈希值。
在本公开的一些实施例中,基于前述方案,上述信息推荐模块1104,包括:加权处理单元和叠加单元。其中:
上述加权处理单元11041,被配置为:根据各所述历史推荐信息的兴趣权重对各所述历史推荐信息对应的哈希值进行加权处理,得到各所述历史推荐信息的兴趣子向量;以及,
上述叠加单元11042,被配置为:叠加各所述历史推荐信息的兴趣子向量,得到所述目标用户的兴趣向量。
在本公开的一些实施例中,基于前述方案,所述哈希值中包括第一数据码以及第二数据码;其中:
上述加权处理单元11041,被具体配置为:在所述哈希值的数据位为所述第一数据码时,将所述数据位由所述第一数据码替换为各所述历史推荐信息的兴趣权重;以及,在所述哈希值的数据位为所述第二数据码时,将所述数据位由所述第二数据码替换为各所述历史推荐信息的兴趣权重的相反数。
在本公开的一些实施例中,基于前述方案,上述叠加单元11042,包括:统计周期确定子单元、候选兴趣子向量确定子单元以及兴趣向量确定子单元。其中:
上述统计周期确定子单元,被配置为:确定各所述历史推荐信息所在的统计周期;
上述候选兴趣子向量确定子单元,被配置为:根据所述统计周期的时间衰减系数处理各所述历史推荐信息的兴趣子向量,得到各所述历史推荐信息的候选兴趣子向量;以及,
上述兴趣向量确定子单元,被配置为:叠加各所述历史推荐信息的候选兴趣子向量,得到所述目标用户的兴趣向量。
在本公开的一些实施例中,基于前述方案,上述统计周期确定子单元,被具体配置为:
根据所述目标用户对于各所述历史推荐信息的浏览行为数据的时间戳,确定各所述历史推荐信息所在的统计周期;或,根据各所述历史推荐信息的上架时间确定各所述历史推荐信息所在的统计周期。
在本公开的一些实施例中,基于前述方案,上述信息推荐模块1104,包括:推荐信息确定单元11043。其中,上述推荐信息确定单元11043,包括:拼接子单元和推荐子单元。其中:
上述数据获取模块1101,还被配置为:获取所述目标用户的基础属性数据,获取各所述历史推荐信息的属性数据,以及获取展示页面的场景数据;
上述拼接子单元,被配置为:将所述目标用户的兴趣向量、所述目标用户的基础属性数据、各所述历史推荐信息的属性数据以及所述展示页面的场景数据进行拼接,得到拼接特征;以及,
上述拼接子单元,被配置为:根据所述拼接特征预测对所述目标用户的推荐信息。
在本公开的一些实施例中,基于前述方案,上述拼接子单元,被具体配置为:
将所述拼接特征输入至线下训练的预测模型,以使所述预测模型基于所述拼接特征确定模型的输出,得到各所述历史推荐信息的推荐值;以及,根据推荐分值确定对所述目标用户的推荐信息。
在本公开的一些实施例中,基于前述方案,上述拼接子单元,被具体配置为:
将线下训练的预测模型加载至信息推荐系统的引擎中;响应于对所述展示页面的访问请求,触发对所述信息推荐系统的推荐请求;通过所述引擎实时获取所述目标用户的拼接特征;以及,将所述拼接特征输入至所述预测模型,以通过所述预测模型进行实时预测,得到对所述目标用户的推荐信息。
在本公开的一些实施例中,基于前述方案,上述数据获取模块1101,被具体配置为:获取所述目标用户对于各历史推荐信息的观看时长、点击次数、收藏次数以及推荐次数中的一种或多种。
在本公开的一些实施例中,基于前述方案,上述兴趣权重确定模块1103,被具体配置为:根据所述目标用户对于各所述历史推荐信息的观看时长、点击次数、收藏次数以及推荐次数中的一种或多种,确定所述目标用户对于各所述历史推荐信息的兴趣权重。
上述信息推荐装置中各单元的具体细节已经在说明书附图2至图10对应的信息推荐方法中进行了详细的描述,因此此处不再赘述。
图12示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图12示出的电子设备的计算机系统1200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图12所示,计算机系统1200包括处理器1201(包括:图形处理单元(GraphicsProcessing Unit,简称:GPU)、中央处理单元(Central Processing Unit,简称:CPU)),其可以根据存储在只读存储器(Read-Only Memory,简称:ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(Random Access Memory,简称:RAM)1203中的程序而执行各种适当的动作和处理。在RAM 1203中,还存储有系统操作所需的各种程序和数据。处理器(CPU或GPU)1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(Input/Output,简称:I/O)接口1205也连接至总线1004。
以下部件连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(Cathode Ray Tube,简称:CRT)、液晶显示器(Liquid Crystal Display,简称:LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如局域网(Local Area Network,简称:LAN)卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被处理器(CPU或GPU)1201执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。
计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,简称:EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,简称:CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。
计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。
例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
例如,所述的电子设备可以实现如图2中所示的信息推荐方法,具体地:步骤S210,获取目标用户对于各历史推荐信息的浏览行为数据以及获取各所述历史推荐信息的标识数据;步骤S220,对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值;步骤S230,根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重;以及,步骤S240,基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量,以基于所述兴趣向量确定对所述目标用户的推荐信息。
示例性的,所述的电子设备还可以实现如图3至如图10中任意一图中所示的信息推荐方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务端、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (15)
1.一种信息推荐方法,其特征在于,所述方法包括:
获取目标用户对于各历史推荐信息的浏览行为数据以及获取各所述历史推荐信息的标识数据;
对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值;
根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重;
基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量,以基于所述兴趣向量确定对所述目标用户的推荐信息。
2.根据权利要求1所述的信息推荐方法,其特征在于,所述对各所述历史推荐信息的标识数据进行哈希处理,包括:
对各所述历史推荐信息的标识号,以及内容标签、展示类型和上架时间中的一种或多种进行哈希处理。
3.根据权利要求1所述的信息推荐方法,其特征在于,所述对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值,包括:
通过散列函数处理各所述历史推荐信息的字符串型、整型或浮点型的标识数据,得到各所述历史推荐信息的标识数据对应的哈希值。
4.根据权利要求1至3中任意一项所述的信息推荐方法,其特征在于,所述基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量,包括:
根据各所述历史推荐信息的兴趣权重对各所述历史推荐信息对应的哈希值进行加权处理,得到各所述历史推荐信息的兴趣子向量;
叠加各所述历史推荐信息的兴趣子向量,得到所述目标用户的兴趣向量。
5.根据权利要求4所述的信息推荐方法,其特征在于,所述哈希值中包括第一数据码以及第二数据码;其中:
所述根据各所述历史推荐信息的兴趣权重对各所述历史推荐信息对应的哈希值进行加权处理,包括:
在所述哈希值的数据位为所述第一数据码时,将所述数据位由所述第一数据码替换为各所述历史推荐信息的兴趣权重;
在所述哈希值的数据位为所述第二数据码时,将所述数据位由所述第二数据码替换为各所述历史推荐信息的兴趣权重的相反数。
6.根据权利要求4所述的信息推荐方法,其特征在于,所述叠加各所述历史推荐信息的兴趣子向量,得到所述目标用户的兴趣向量,包括:
确定各所述历史推荐信息所在的统计周期;
根据所述统计周期的时间衰减系数处理各所述历史推荐信息的兴趣子向量,得到各所述历史推荐信息的候选兴趣子向量;
叠加各所述历史推荐信息的候选兴趣子向量,得到所述目标用户的兴趣向量。
7.根据权利要求6所述的信息推荐方法,其特征在于,所述确定各所述历史推荐信息所在的统计周期,包括:
根据所述目标用户对于各所述历史推荐信息的浏览行为数据的时间戳,确定各所述历史推荐信息所在的统计周期;或,
根据各所述历史推荐信息的上架时间确定各所述历史推荐信息所在的统计周期。
8.根据权利要求1至3中任意一项所述的信息推荐方法,其特征在于,所述基于所述兴趣向量确定对所述目标用户的推荐信息,包括:
获取所述目标用户的基础属性数据,获取各所述历史推荐信息的属性数据,以及获取展示页面的场景数据;
将所述目标用户的兴趣向量、所述目标用户的基础属性数据、各所述历史推荐信息的属性数据以及所述展示页面的场景数据进行拼接,得到拼接特征;
根据所述拼接特征预测对所述目标用户的推荐信息。
9.根据权利要求8所述的信息推荐方法,其特征在于,所述根据所述拼接特征预测对所述目标用户的推荐信息,包括:
将所述拼接特征输入至线下训练的预测模型,以使所述预测模型基于所述拼接特征确定模型的输出,得到各所述历史推荐信息的推荐值;
根据推荐分值确定对所述目标用户的推荐信息。
10.根据权利要求8所述的信息推荐方法,其特征在于,所述根据所述拼接特征预测对所述目标用户的推荐信息,包括:
将线下训练的预测模型加载至信息推荐系统的引擎中;
响应于对所述展示页面的访问请求,触发对所述信息推荐系统的推荐请求;
通过所述引擎实时获取所述目标用户的拼接特征;
将所述拼接特征输入至所述预测模型,以通过所述预测模型进行实时预测,得到对所述目标用户的推荐信息。
11.根据权利要求1至3中任意一项所述的信息推荐方法,其特征在于,所述获取目标用户对于各历史推荐信息的浏览行为数据,包括:
获取所述目标用户对于各历史推荐信息的观看时长、点击次数、收藏次数以及推荐次数中的一种或多种。
12.根据权利要求1至3中任意一项所述的信息推荐方法,其特征在于,所述根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重,包括:
根据所述目标用户对于各所述历史推荐信息的观看时长、点击次数、收藏次数以及推荐次数中的一种或多种,确定所述目标用户对于各所述历史推荐信息的兴趣权重。
13.一种信息推荐装置,其特征在于,所述装置包括:
数据获取模块,被配置为:获取目标用户对于各历史推荐信息的浏览行为数据以及获取各所述历史推荐信息的标识数据;
哈希处理模块,被配置为:对各所述历史推荐信息的标识数据进行哈希处理,以将各所述历史推荐信息的标识数据分别转换为哈希值;
兴趣权重确定模块,被配置为:根据所述目标用户对于各所述历史推荐信息的浏览行为数据,确定所述目标用户对于各所述历史推荐信息的兴趣权重;
信息推荐模块,被配置为:基于各所述历史推荐信息对应的哈希值以及兴趣权重,确定所述目标用户的兴趣向量,以基于所述兴趣向量确定对所述目标用户的推荐信息。
14.一种计算机存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至12中任意一项所述的信息推荐方法。
15.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至12中任意一项所述的信息推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911273559.0A CN112989174A (zh) | 2019-12-12 | 2019-12-12 | 信息推荐方法及装置、介质和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911273559.0A CN112989174A (zh) | 2019-12-12 | 2019-12-12 | 信息推荐方法及装置、介质和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112989174A true CN112989174A (zh) | 2021-06-18 |
Family
ID=76331566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911273559.0A Pending CN112989174A (zh) | 2019-12-12 | 2019-12-12 | 信息推荐方法及装置、介质和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112989174A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114168791A (zh) * | 2021-11-24 | 2022-03-11 | 卓尔智联(武汉)研究院有限公司 | 视频推荐方法、装置、电子设备和存储介质 |
CN116170497A (zh) * | 2022-12-09 | 2023-05-26 | 北京国电通网络技术有限公司 | 用户行为信息推送方法、装置、电子设备和计算机介质 |
-
2019
- 2019-12-12 CN CN201911273559.0A patent/CN112989174A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114168791A (zh) * | 2021-11-24 | 2022-03-11 | 卓尔智联(武汉)研究院有限公司 | 视频推荐方法、装置、电子设备和存储介质 |
CN116170497A (zh) * | 2022-12-09 | 2023-05-26 | 北京国电通网络技术有限公司 | 用户行为信息推送方法、装置、电子设备和计算机介质 |
CN116170497B (zh) * | 2022-12-09 | 2023-10-20 | 北京国电通网络技术有限公司 | 用户行为信息推送方法、装置、电子设备和计算机介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11334635B2 (en) | Domain specific natural language understanding of customer intent in self-help | |
CN110941740B (zh) | 视频推荐方法及计算机可读存储介质 | |
CN108446374B (zh) | 用户意图预测方法、装置、电子设备、存储介质 | |
AU2014201827B2 (en) | Scoring concept terms using a deep network | |
CN110489582B (zh) | 个性化展示图像的生成方法及装置、电子设备 | |
US11429405B2 (en) | Method and apparatus for providing personalized self-help experience | |
US11172040B2 (en) | Method and apparatus for pushing information | |
EP4181026A1 (en) | Recommendation model training method and apparatus, recommendation method and apparatus, and computer-readable medium | |
WO2020159593A1 (en) | Training image and text embedding models | |
US20230205813A1 (en) | Training Image and Text Embedding Models | |
CN110069698B (zh) | 信息推送方法和装置 | |
CN109783539A (zh) | 用户挖掘及其模型构建方法、装置及计算机设备 | |
US10290032B2 (en) | Blacklisting based on image feature analysis and collaborative filtering | |
CN110597962A (zh) | 搜索结果展示方法、装置、介质及电子设备 | |
CN111400586A (zh) | 群组展示方法、终端、服务器、系统及存储介质 | |
WO2020215977A1 (zh) | 用于展示信息的系统、方法及装置 | |
CN111597446B (zh) | 基于人工智能的内容推送方法、装置、服务器和存储介质 | |
CN112749330B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN112989174A (zh) | 信息推荐方法及装置、介质和设备 | |
CN112269943B (zh) | 一种信息推荐系统及方法 | |
US11790030B2 (en) | Creating an effective product using an attribute solver | |
CN113032676A (zh) | 基于微反馈的推荐方法和系统 | |
JP2023533723A (ja) | 検索クエリについての解釈の評価 | |
CN112650942A (zh) | 产品推荐方法、装置、计算机系统和计算机可读存储介质 | |
EP4307136A1 (en) | Sorting method and apparatus for search results, and electronic device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |