CN111143681A - 一种资讯推荐装置、方法、设备及系统 - Google Patents

一种资讯推荐装置、方法、设备及系统 Download PDF

Info

Publication number
CN111143681A
CN111143681A CN201911376449.7A CN201911376449A CN111143681A CN 111143681 A CN111143681 A CN 111143681A CN 201911376449 A CN201911376449 A CN 201911376449A CN 111143681 A CN111143681 A CN 111143681A
Authority
CN
China
Prior art keywords
information
user
preference
model
recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911376449.7A
Other languages
English (en)
Other versions
CN111143681B (zh
Inventor
张亚泽
张静
狄潇然
王志恒
郑小虎
朱阿龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN201911376449.7A priority Critical patent/CN111143681B/zh
Publication of CN111143681A publication Critical patent/CN111143681A/zh
Application granted granted Critical
Publication of CN111143681B publication Critical patent/CN111143681B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例公开了一种资讯推荐装置、方法、设备及系统。所述装置包括批量处理模块和实时处理模块,所述批量处理模块用于获取目标用户的特征信息,构建用户偏好模型并将其发送至实时处理模块;所述实时处理模块用于获取资讯、资讯在各个类别标签的权重信息以及用户对资讯各个类别标签的偏好信息,并基于权重信息和偏好信息确定推荐值向用户推荐资讯;还用于监听kafka队列消息,确定kafka队列消息中存在模型更新的消息时,更新偏好模型,并基于更新后的模型确定推荐值。利用本说明书实施例不仅可以根据用户对资讯的喜好程度推荐资讯,而且可以及时对用户的兴趣变化作出响应,从而可以保证推荐结果合理、准确的同时,提高用户体验。

Description

一种资讯推荐装置、方法、设备及系统
技术领域
本说明书实施例方案属于计算机技术领域,尤其涉及一种资讯推荐装置、方法、设备及系统。
背景技术
近年来,金融市场受到人们的关注越来越高,各大金融公司每天可以向用户提供成千上万条的金融资讯供用户浏览。商业银行作为金融行业的领军企业,其向用户提供的金融资讯更能得到用户的信赖。
目前,商业银行为用户提供的金融资讯丰富多彩、应有尽有。但是大多数银行向用户提供金融资讯服务时,所有用户收到相同的资讯,缺乏针对性。这样,如果将所有的资讯都推送给用户,用户从海量的资讯中找到自己感兴趣的内容会花费大量时间,从而降低用户体验。
因此,业内亟需一种可以高效推荐资讯的解决方案。
发明内容
本说明书实施例在于提供一种资讯推荐装置、方法、设备及系统,不仅可以根据用户对不同资讯的喜好程度推荐资讯,而且可以及时响应用户的兴趣变化为用户推荐资讯,从而可以在保证推荐结果合理性、准确性的同时,提高用户体验和资讯推荐效率。
本说明书提供的一种资讯推荐装置、方法、设备及系统是包括以下方式实现的:
一种资讯推荐装置,包括批量处理模块和实时处理模块,其中,所述批量处理模块包括用户信息处理模块和用户偏好处理模块;
所述用户信息处理模块,用于获取目标用户的特征信息,并将所述特征信息发送至用户偏好处理模块;
所述用户偏好处理模块,用于根据特征信息构建目标用户对资讯特征的用户偏好模型,并将所述用户偏好模型发送至实时处理模块包括的资讯推荐模块;还用于对用户偏好模型进行更新,以及将模型更新的消息发送至kafka;
所述实时处理模块包括资讯信息处理模块、多标签分类概率模型模块、资讯推荐模块;
所述资讯信息处理模块,用于获取资讯信息,并将所述资讯信息发送至多标签分类概率模型模块;
所述多标签分类概率模型模块,用于获取所述资讯信息在各个类别标签的权重信息,并将所述权重信息发送至资讯推荐模块;
所述资讯推荐模块,用于根据所述用户偏好模型确定用户对所述资讯信息各个类别标签的偏好信息;还用于基于线程池监听kafka队列消息;还用于基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,以及根据所述推荐值向用户推荐资讯。
本说明书提供的所述装置的另一个实施例中,所述根据特征信息构建目标用户对资讯特征的用户偏好模型,包括:
偏好关系信息确定单元,用于根据目标用户的特征信息、用户特征与资讯特征的映射关系,确定所述目标用户与资讯特征的偏好关系信息;
构建单元,用于基于所述偏好关系信息,构建目标用户对资讯特征的用户偏好模型。
本说明书提供的所述装置的另一个实施例中,所述基于线程池监听kafka队列消息,包括:
判断单元,用于判断kafka队列消息中是否存在模型更新的消息;
更新模型获取单元,用于确定存在时,从用户偏好处理模块获取更新后的用户偏好模型;
相应的,根据更新后的用户偏好模型确定用户对所述资讯信息各个类别标签的偏好信息;基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;根据所述推荐值向用户推荐资讯。
本说明书提供的所述装置的另一个实施例中,所述装置还包括:
第一处理单元,用于对所述资讯信息进行第一处理,获得第一处理结果,所述第一处理包括切词、去停用词、敏感词过滤;
第二处理单元,用于对所述第一处理结果进行第二处理,获得第二处理结果,所述第二处理包括向量化、特征约减;
相应的,将所述第二处理结果发送至多标签分类概率模型模块。
本说明书提供的所述装置的另一个实施例中,所述基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,包括:
计算单元,用于计算所述权重信息和所述偏好信息的余弦相似度,将所述余弦相似度作为资讯的推荐值。
一种资讯推荐方法,包括:
获取资讯信息;
将所述资讯信息输入多标签分类概率模型,获得所述资讯信息在各个类别标签的权重信息;
根据预先构建的用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息,其中,所述用户偏好模型基于线程池监听kafka中消息进行更新;
基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;
根据所述推荐值向用户推荐资讯。
本说明书提供的所述方法的另一个实施例中,所述获取资讯信息后,还包括:
对所述资讯信息进行第一处理,获得第一处理结果,所述第一处理包括切词、去停用词、敏感词过滤;
对所述第一处理结果进行第二处理,获得第二处理结果,所述第二处理包括向量化、特征约减;
相应的,将所述第二处理结果输入多标签分类概率模型。
本说明书提供的所述方法的另一个实施例中,所述预先构建的用户偏好模型包括采用下述方式得到:
获取目标用户的特征信息;
根据目标用户的特征信息、用户特征与资讯特征的映射关系,确定所述目标用户与资讯特征的偏好关系信息;
基于所述偏好关系信息,构建目标用户对资讯特征的用户偏好模型。
本说明书提供的所述方法的另一个实施例中,所述用户偏好模型基于线程池监听kafka中消息进行更新,包括:
利用线程池监听kafka队列消息,并判断所述队列消息中是否存在模型更新的消息;
确定存在时,获取更新后的用户偏好模型;
相应的,根据更新后的用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息;
基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;
根据所述推荐值向用户推荐资讯。
本说明书提供的所述方法的另一个实施例中,所述基于所述权重信息和所述偏好信息,确定所述资讯的推荐标准信息,包括:
计算所述权重信息和所述偏好信息的余弦相似度,将所述余弦相似度作为资讯的推荐值。
一种资讯推荐设备,包括将外呼服务数据输入目标业务场景的外呼流程中,所述外呼流程执行时包括以下步骤:
获取资讯信息;
将所述资讯信息输入多标签分类概率模型,获得所述资讯信息在各个类别标签的权重信息;
根据预先构建的用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息,其中,所述用户偏好模型基于线程池监听kafka中消息进行更新;
基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;
根据所述推荐值向用户推荐资讯。
一种资讯推荐系统,包括至少一个处理器以及存储计算机可执行指令的存储器,
所述存储器用于存储多标签分类概率模型和接收的用户偏好模型,并将存储多标签分类概率模型和用户偏好模型发送至所述处理器;
所述处理器包括离线处理装置和实时处理装置;
所述离线处理装置用于获取目标用户的特征信息,根据所述特征信息构建目标用户对资讯特征的用户偏好模型;还用于对用户偏好模型进行更新;还用于将所述用户偏好模型发送至存储器;
所述实时处理装置用于获取资讯信息,并从所述存储器中获取多标签分类概率模型和用户偏好模型;还用于基于线程池监听kafka队列消息,确定kafka队列消息中存在模型更新的消息时,从所述存储器获取更新后的用户偏好模型;还用于根据多标签分类概率模型获取所述资讯信息在各个类别标签的权重信息,根据用户偏好模型确定用户对所述资讯信息各个类别标签的偏好信息;还用于基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,以及根据所述推荐值向用户推荐资讯。
本说明书提供的一种资讯推荐装置、方法、设备及系统。一些实施例中通过构建基于spark平台的商业银行资讯推荐方法,可以统一数据交互格式,从而提高交互效率,方便集群资源分配;通过线程池监听与kafka消息队列可以实现实时计算部分在线加载批量部分生成的信息,从而可以解决实时计算部分线上自动更新问题,实现为用户提供资讯服务时能及时响应用户的兴趣变化,使用户能及时看到自己喜欢的资讯,从而提高用户体验;通过用户对资讯类别标签的偏好向量和每条资讯的类别标签权重向量两个维度来计算最终的资讯推荐评分,可以解决推荐冷启动问题,提升计算效率,同时保证了推荐结果的合理性和准确性。采用本说明书提供的实施方案,不仅可以根据用户对不同资讯的喜好程度推荐资讯,而且可以及时响应用户的兴趣变化为用户推荐资讯,从而可以在保证推荐结果合理性、准确性的同时,提高用户体验和资讯推荐效率。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书提供的一种资讯推荐装置的一个实施例的模块结构示意图;
图2是本说明书提供的一种资讯推荐方法的一个实施例的流程示意图;
图3是本说明书提供的一种资讯推荐方法具体实施例的场景示意图;
图4是本说明书提供的一种资讯推荐系统的一个实施例的模块结构示意图;
图5是本说明书提供的一种资讯推荐服务器的一个实施例的硬件结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书中的一部分实施例,而不是全部的实施例。基于本说明书中的一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书实施例保护的范围。
目前,商业银行为用户提供的金融资讯丰富多彩、应有尽有。但是大多数银行向用户提供金融资讯服务时,所有用户收到相同的资讯,缺乏针对性。这样,如果将所有的资讯都推送给用户,用户从海量的资讯中找到自己感兴趣的内容会花费大量时间,从而降低用户体验。
本说明书提供的一种资讯推荐装置、方法、设备及系统,通过构建基于spark平台的商业银行资讯推荐方法,可以统一数据交互格式,从而提高交互效率,方便集群资源分配;通过线程池监听与kafka消息队列可以实现实时计算部分在线加载批量部分生成的信息,从而可以解决实时计算部分线上自动更新问题,实现为用户提供资讯服务时能及时响应用户的兴趣变化,使用户能及时看到自己喜欢的资讯,从而提高用户体验;通过用户对资讯类别标签的偏好向量和每条资讯的类别标签权重向量两个维度来计算最终的资讯推荐评分,可以解决推荐冷启动问题,提升计算效率,同时保证了推荐结果的合理性和准确性。
下面以一个具体的应用场景为例对本说明书实施方案进行说明。具体的,图1是本说明书提供的一种资讯推荐装置的一个实施例的模块结构示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或系统结构,但基于常规或者无需创造性的劳动在所述方法或系统中可以包括更多或者部分合并后更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或系统的模块结构不限于本说明书实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置、服务器或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理、服务器集群的实施环境)。
需要说明的是,本说明书实施例中的资讯推荐装置可以包括分布式系统、软件(应用)、模块、模块、服务器、客户端等并结合必要的实施硬件的装置。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管本说明书实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
此外,下述实施例描述并不对基于本说明书的其他可扩展到的应用场景中的技术方案构成限制。具体的一种实施例如图1所示,本说明书一个实施例中提供的一种资讯推荐装置可以包括批量处理模块10和实时处理模块20,其中,所述批量处理模块10可以包括用户信息处理模块101和用户偏好处理模块103;
所述用户信息处理模块101,可以用于获取目标用户的特征信息,并将所述特征信息发送至用户偏好处理模块;
所述用户偏好处理模块103,可以用于根据特征信息构建目标用户对资讯特征的用户偏好模型,并将所述用户偏好模型发送至实时处理模块包括的资讯推荐模块;还可以用于对用户偏好模型进行更新,以及将模型更新的消息发送至kafka;
所述实时处理模块20可以包括资讯信息处理模块201、多标签分类概率模型模块203、资讯推荐模块205;
所述资讯信息处理模块201,可以用于获取资讯信息,并将所述资讯信息发送至多标签分类概率模型模块;
所述多标签分类概率模型模块203,可以用于获取所述资讯信息在各个类别标签的权重信息,并将所述权重信息发送至资讯推荐模块;
所述资讯推荐模块205,可以用于根据所述用户偏好模型确定用户对所述资讯信息各个类别标签的偏好信息;还可以用于基于线程池监听kafka队列消息;还可以用于基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,以及根据所述推荐值向用户推荐资讯。
所述装置的另一个实施例中,所述根据特征信息构建目标用户对资讯特征的用户偏好模型,可以包括:
偏好关系信息确定单元,可以用于根据目标用户的特征信息、用户特征与资讯特征的映射关系,确定所述目标用户与资讯特征的偏好关系信息;
构建单元,可以用于基于所述偏好关系信息,构建目标用户对资讯特征的用户偏好模型。
所述装置的另一个实施例中,所述基于线程池监听kafka队列消息,可以包括:
判断单元,可以用于判断kafka队列消息中是否存在模型更新的消息;
更新模型获取单元,可以用于确定存在时,从用户偏好处理模块获取更新后的用户偏好模型;
相应的,根据更新后的用户偏好模型确定用户对所述资讯信息各个类别标签的偏好信息;基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;根据所述推荐值向用户推荐资讯。
所述装置的另一个实施例中,所述装置还可以包括:
第一处理单元,可以用于对所述资讯信息进行第一处理,获得第一处理结果,所述第一处理包括切词、去停用词、敏感词过滤;
第二处理单元,可以用于对所述第一处理结果进行第二处理,获得第二处理结果,所述第二处理包括向量化、特征约减;
相应的,将所述第二处理结果发送至多标签分类概率模型模块。
所述装置的另一个实施例中,所述基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,可以包括:
计算单元,可以用于计算所述权重信息和所述偏好信息的余弦相似度,将所述余弦相似度作为资讯的推荐值。
本说明书提供的一种资讯推荐装置,通过构建基于spark平台的商业银行资讯推荐方法,可以统一数据交互格式,从而提高交互效率,方便集群资源分配。通过线程池监听与kafka消息队列可以实现实时计算部分在线加载批量部分生成的信息,从而可以解决实时计算部分线上自动更新问题,实现为用户提供资讯服务时能及时响应用户的兴趣变化,使用户能及时看到自己喜欢的资讯,从而提高用户体验。通过用户对资讯类别标签的偏好向量和每条资讯的类别标签权重向量两个维度来计算最终的资讯推荐评分,可以解决推荐冷启动问题,提升了系统计算效率,同时保证了系统输出结果推荐结果的合理性和准确性。
需要说明的,上述所述装置对应的实施例的描述可以参照下述方法实施例的描述。
下面以一个具体的应用场景为例对本说明书实施方案进行说明。具体的,图2是本说明书提供的一种资讯推荐方法的一个实施例的流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本说明书实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置、服务器或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理、服务器集群的实施环境)。
需要说明的是,下述实施例描述并不对基于本说明书的其他可扩展到的应用场景中的技术方案构成限制。具体的一种实施例如图2所示,本说明书提供的一种资讯推荐方法的一种实施例中,所述方法可以包括:
S0:获取资讯信息。
其中,资讯信息可以包括金融、经济、商业、政治、军事等资讯。
本说明书实施例中,可以通过接收来自kafka消息队列中的资讯来获取资讯信息,也可以通过其他方式获取资讯信息。其中,kafka消息队列可以表示一种消息队列。kafka是一个分布式、高吞吐量、高扩展性的消息队列系统,其主要可以应用在日志收集系统和消息系统。消息队列可以理解为是帮助开发人员解决系统间异步通信的中间件,常可以用于解决系统解耦和请求的削峰平谷的问题。传统的消息队列包括两种传播消息的方式,一种是单播,类似队列的方式,一个消息只可以被消费一次,消费过了,其他消费者就不能消费了;另一种是多播,类似发布-订阅的模式,一个消息可以被多个消费者同时消费。Kafka通过消费者组的方式来实现这两种方式,在一个消费者组中,每一个主题中的消息只能被这个组中的一个消费者消费,所以对于设置了多分区的主题来说,分区的个数和消费者的个数应该是一样的,一个消费者消费一个分区,这样每个消费者就成了单播形式,类似队列的消费形式。另外,不同的消费者组可以同时消费一个消息,这样就实现了多播,类似发布-订阅的模式。
本说明书一个实施例中,所述获取资讯信息后,还可以包括:对所述资讯信息进行第一处理,获得第一处理结果,所述第一处理包括切词、去停用词、敏感词过滤;对所述第一处理结果进行第二处理,获得第二处理结果,所述第二处理包括向量化、特征约减。例如一些实施场景中,可以接收来自kafka消息队列中的资讯,通过自然语言处理技术对资讯进行切词、去停用词、敏感词过滤等处理,获得处理后的资讯数据,然后可以采用TF*IDF(termfrequency–inverse document frequency)算法将资讯数据向量化成数值型向量,最后可以通过特征工程对资讯中冗余的词进行约减。其中,TF*IDF表示一种用于信息检索与数据挖掘的加权技术,TF可以表示词频,IDF可以表示逆文本频率指数。切词可以理解为是将资讯信息分成一个个单独的词。去停用词可以理解为将句子中一些完全没有意义的词去掉。例如,助词,介词,语气词等等。敏感词过滤可以理解为将一些不符合规定的词去除。例如,可以将违规、反动、辱骂等不合规信息去除掉。需要说明的是,切词、去停用词、敏感词过滤均可以利用现有比较成熟的分词工具完成,例如Jieba,SnowNLP,HanLP等。例如:对信息“我不但喜欢物理,还喜欢数学!”进行第一处理后,可以获得第一处理结果为:“喜欢物理喜欢数学”。
一些实施例中,针对第一处理后的资讯信息可以采用TF*IDF进行向量化,计算每个词的TF*IDF值。例如,对分词后的“喜欢物理喜欢数学”进行向量化,可以获得向量化后的结果为[0.03,0.6,0.03,0.5]。特征约减可以理解为对向量化后的结果进行降维,去除冗余信息。例如,可以采用PCA(Principal Component Analysis,主成分分析)算法进行降维。一些实施例中,由于一般文本数据向量化后维度会非常高,达到上万维,因此可以采取降维的方法在不影响准确度的范围内相应地降低维度。例如,降维前是5万维,利用PCA算法保留95%的信息量最终可以将维度降至1万维,从而提升计算效率。
需要说明的是,对资讯数据进行向量化的方式还可以是其它方式,本说明书对此不作限定。对资讯数据进行特征约减的方式还可以是其它方式,本说明书对此不作限定。
本说明书一个实施例中,获取资讯信息后,还可以判断其是否需要通过人工规则进行推荐。例如一些实施场景中,可以接收来自kafka消息队列中的资讯,然后通过资讯类型判断是否通过人工规则进行推荐,如果需要通过人工规则进行推荐,则可以不进行上述第一处理和第二处理。其中,人工规则可以理解为根据具体的应用场景,由业务人员或开发人员定义的一些规则。例如,推送关于黄金、白银等贵金属的资讯,业务人员可以要求该类资讯必须推送到有贵金属持仓的用户界面,这种场景下可以通过设置当资讯的标签与用户标签匹配时进行推荐。
S2:将所述资讯信息输入多标签分类概率模型,获得所述资讯信息在各个类别标签的权重信息。
其中,多标签分类概率模型可以用来确定输入信息所属标签以及输入信息在各个标签中的权重。其中,标签也可以理解为类别。一些实施场景中,多标签分类概率模型中的类别可以包括金融、经济、商业、政治、军事等。多标签分类概率模型可以包括朴素贝叶斯,ML-KNN(Multi-Label K-Nearest Neighbor algorithm,多标签k近邻算法)等。
权重可以理解为某一因素或指标相对于某一事物的重要程度。一些实施例中,资讯信息在各个类别标签的权重信息可以理解为资讯信息在各个类别标签的权重向量,其可以表示成向量的形式。例如,类别标签包括金融、经济、商业、政治、军事,某一资讯信息A在各个类别标签的权重分别为:0.1、0.3、0.4、0.1、0.1,则A在各个资讯类别标签的权重信息可以表示为(0.1,0.3,0.4,0.1,0.1)。再如,类别标签包括经济、政治、军事,某一资讯信息B在各个类别标签的权重分别为:0.3、0.2、0.5,则B在各个资讯类别标签的权重信息可以表示为(0.3、0.2、0.5)。需要说明都是,资讯的类别标签还可以根据系统要推荐的资讯类型进行定义。例如,金融资讯的标签还可以包括外汇、贵金属、原油、股票、证券等。
一些实施例中,多标签分类概率模型可以通过预先获取的资讯信息训练获得,也可以通过其他方式获得,本说明书对此不作限定。
本说明书一个实施例中,可以将从kafka消息队列中接收的资讯信息,输入多标签分类概率模型,从而获得资讯信息在各个类别标签的权重信息。本说明书另一个实施例中,可以先从kafka消息队列中获取初始资讯信息,然后将初始资讯信息进行切词、去停用词、敏感词过滤、向量化、特征约减等处理,获得处理后的资讯信息,最后可以将处理后的资讯信息输入多标签分类概率模型,从而获得资讯信息在各个类别标签的权重信息。
本说明书一个实施例中,多标签分类概率模型可以不断地根据新的资讯样本进行更新。由于一个训练好的系统进行更新的时间通常要低于重新训练一个系统所需的代价,因此,面对新的数据时在原有模型的基础上,仅对由于新增数据所引起的变化进行模型更新,可以有效提高效率。
本说明书实施例中,通过将资讯信息输入多标签分类概率模型,获得资讯信息在各个类别标签的权重信息,可以为后续提供合理、准确的推荐结果提供保证,从而可以提高用户体验和资讯推荐效率。
S4:根据预先构建的用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息,其中,所述用户偏好模型基于线程池监听kafka中消息进行更新。
其中,用户偏好模型可以用来确定用户对不同类别资讯信息的偏好程度。偏好信息可以理解为偏好程度。例如,用户user1对经济的偏好程度为0.5,对军事的偏好程度为0.2,用户user2对经济的偏好程度为0.1,对军事的偏好程度为0.6,对商业的偏好程度为0.3等。一些实施例中,用户对所述资讯信息各个类别标签的偏好信息可以用向量的形式表示。例如,用户user1对资讯信息各个类别标签的偏好信息可以表示成1×n维向量,其中,n可以表示资讯标签数量。再如,对于多个用户对资讯信息各个类别标签的偏好信息可以表示成m×n的矩阵,m可以表示用户数,n可以表示资讯标签数量。
本说明书一个实施例中,所述预先构建的用户偏好模型可以包括采用下述方式得到:获取目标用户的特征信息;根据目标用户的特征信息、用户特征与资讯特征的映射关系,确定所述目标用户与资讯特征的偏好关系信息;基于所述偏好关系信息,构建目标用户对资讯特征的用户偏好模型。其中,目标用户的特征信息可以包括个人基本信息、资产负债信息、贵金属持仓信息以及用户的资讯点击行为数据等。个人基本信息可以包括性别、年龄、职业、婚姻状况等,资产负债信息可以包括存款,外汇余额,账户理财,账户基金,账户贵金属等。偏好关系信息可以包括同一用户不同用户特征与不同资讯特征之间的权重关系。资讯特征也就是资讯的类别标签,也可以称为资讯类别。
本说明书一个实施例中,可以从不同系统中获取用户的特征信息,也可以根据用户浏览资讯的行为数据获取用户的特征信息,还可以通过其他方式获取,本说明书对此不作限定。
本说明书一个实施例中,获取目标用户的特征信息后,可以通过Spark SQL加工成表数据,并存入hive。本说明书另一个实施例中,获取目标用户的特征信息后,可以通过Spark SQL加工成表数据,然后通过Spark算子去除其中的异常数据,并存入hive。例如,一些实施场景中,获取目标用户的特征信息后,可以通过Spark SQL加工成表数据,然后对表数据进行清洗去除其中的异常数据,最后可以将去除异常数据的结果存入hive。其中,Spark SQL是Spark用来处理结构化数据的一个模块,它可以提供两个编程抽象分别叫做DataFrame和DataSet,它们可以作为分布式SQL查询引擎。Spark是一个基于内存计算的开源集群计算系统,与Hadoop相比,Spark的计算速度可以提升近100倍。Spark包括一组功能强大、高级别的库,如Spark SQL、Spark Streaming、MLlib、GraphX。Spark还可以提供大量的算子和丰富的数据操作接口,方便对数据处理。DataFrame是一种Spark平台上的分布式数据集,可以提供由列组成的详细模式信息。DataFrame包括丰富的算子,并可以进行更高层次的抽象,提供专用的API来处理分布式数据,从而可以方便地处理大规模结构化数据。
一些实施例中,可以预先收集一些用户的特征信息,然后按照业务含义定义用户特征与资讯特征的映射关系。例如一些实施场景中,根据收集信息可以定义如表1所示的用户特征与资讯特征映射关系表。
本说明书一个实施例中,获取目标用户的特征信息后,可以事先按照业务含义定义的用户特征与资讯类别标签的映射关系表,通过Spark SQL加工出用户对资讯特征的偏好关系信息表,并存入hive。例如一些实施场景中,获取的目标用户user1的特征信息包括年龄:23,性别:男,学历:研究生,全行基金:25w,则根据user1的特征信息以及表1所示用户特征与资讯特征的映射关系,可以确定user1与资讯特征的偏好关系信息如表2所示。
例如另一些实施场景中,获取的目标用户user2的特征信息包括年龄:55,性别:女,学历:高中,全行基金:30w,则根据user2的特征信息以及表1所示用户特征与资讯特征的映射关系,可以确定user2与资讯特征的偏好关系信息如表3所示。
本说明书一个实施例中,在确定目标用户与资讯特征的偏好关系信息后,可以基于偏好关系信息,构建目标用户对资讯特征的用户偏好模型。其中,构建方式可以包括几何平均、加权平均,或者其他方式,本说明书对此不作限定。例如一些实施场景中,在确定目标用户user1与资讯特征的偏好关系信息(如表2)后,可以基于偏好关系信息,通过对同一资讯特征不同用户特征对应的权重信息取平均,从而构建目标用户user1对资讯特征的用户偏好模型,如表4所示。
例如另一些实施场景中,在确定目标用户user2与资讯特征的偏好关系信息(如表3)后,可以基于偏好关系信息,通过对同一资讯特征不同用户特征对应的权重信息进行加权平均,从而构建目标用户user2对资讯特征的用户偏好模型,如表5所示。其中,可以对用户user2用户特征中年龄、性别、学历、全行基金分别设置权重为0.2、0.1、0.4、0.3,则目标用户user2对经济资讯特征的用户偏好程度为:0.15×0.2+0.1×0.1+0.05×0.4+0.3×0.3=0.150,目标用户user2对商业资讯特征的用户偏好程度为:0.15×0.2+0.07×0.1+0.2×0.4+0.3×0.3=0.207。需要说明的是,目标用户user2对其他资讯标签偏好程度的计算方式可以参考上述,对此不再赘述。
表1用户特征与资讯特征的映射关系表
Figure BDA0002341104850000121
表2目标用户user1与资讯特征的偏好关系信息表
用户user1 经济 商业 政治 军事 金融
年龄 0.15 0.15 0.05 0.15 0.15
性别 0.1 0.1 0.1 0.1 0.1
学历 0.15 0.1 0.2 0.2 0.3
全行基金 0.3 0.3 0.2 0.2 0.2
表3目标用户user2与资讯特征的偏好关系信息表
用户user2 经济 商业 政治 军事 金融
年龄 0.15 0.15 0.15 0.05 0.15
性别 0.1 0.07 0.3 0.05 0.6
学历 0.05 0.2 0.05 0.1 0.3
全行基金 0.3 0.3 0.2 0.2 0.2
表4目标用户user1对资讯特征的用户偏好模型
经济 商业 政治 军事 金融
用户user1 0.175 0.163 0.138 0.163 0.188
表5目标用户user2对资讯特征的用户偏好模型
经济 商业 政治 军事 金融
用户user2 0.150 0.207 0.140 0.115 0.270
需要说明的是,上述只是进行实例性说明,本说明书还可以通过其他方式目标用户对资讯特征的用户偏好模型,对此不作限定。
本说明书实施例中,通过根据用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息,可以为后续提供合理、准确的推荐结果提供保证,从而可以提高用户体验和资讯推荐效率。
本说明书一个实施例中,用户偏好模型可以根据用户对资讯信息喜欢程度的变化进行更新。一些实施场景中,可以统计用户对资讯信息喜欢程度的变化,然后在预设时间段对用户偏好模型进行更新。例如,可以批量统计每周用户对资讯信息的点击行为更新用户特征与资讯特征的映射关系表,然后基于更新后的映射关系表对用户偏好模型进行更新。一些实施场景中,还可以批量统计每天、每月等用户对资讯信息的点击行为更新用户特征与资讯特征的映射关系表,然后基于更新后的映射关系表对用户偏好模型进行更新。
本说明书一个实施例中,当确定用户对资讯信息各个类别标签的偏好信息后,还可以利用线程池实时监听kafka队列消息,并判断队列消息中是否存在模型更新的消息,确定存在时,可以获取更新后的用户偏好模型,并根据更新后的用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息。
本说明书实施例中,通过根据用户对资讯信息喜欢程度的变化对用户偏好模型进行更新,可以为后续用户及时看到自己喜欢的资讯提供保障,从而提高用户体验。
S6:基于所述权重信息和所述偏好信息,确定所述资讯的推荐值。
其中,推荐值可以包括用户对资讯的偏好评分,还可以包括其他信息。
本说明书一个实施例中,可以计算资讯信息在各个类别标签的权重信息和用户对资讯信息各个类别标签的偏好信息的相似度,然后将相似度从高到低的顺序作为资讯的推荐标准信息,以便后续可以根据相似度的顺序向用户推荐资讯。
本说明书一个实施例中,所述基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,可以包括:计算所述权重信息和所述偏好信息的余弦相似度,将所述余弦相似度作为资讯的推荐值。例如一些实施场景中,可以通过余弦相似性算法计算用户对资讯类别标签的偏好向量与每条资讯的类别标签权重向量的相似度作为用户对资讯评分,并根据评分给不同用户推荐该资讯。其中,余弦相似性算法是基于向量空间模型的算法,其可以通过计算两个向量的夹角的余弦值来度量它们之间的相似性。若两个向量大小、方向完全重合,则夹角为0°,余弦值为1;同理两个向量完全相反,即夹角为180°,余弦值为-1。
需要说明的是,本说明书实施例中还可以通过其他方式确定资讯的推荐值,本说明书对此不作限定。例如,可以使用向量的欧式距离、向量的内积作为用户对一条资讯的偏好评分。
本说明书实施例中,通过用户对资讯类别标签的偏好向量和每条资讯的类别标签权重向量两个维度来计算最终的资讯推荐评分,可以解决推荐冷启动问题,提升计算效率,同时保证了推荐结果的合理性和准确性。
本说明书一个实施例中,还可以利用线程池监听kafka队列消息,并判断所述队列消息中是否存在模型更新的消息,确定存在时,可以获取更新后的用户偏好模型,然后根据更新后的用户偏好模型确定用户对资讯信息各个类别标签的偏好信息,最后可以再基于权重信息和偏好信息,确定资讯的推荐值。例如一些实施场景中,可以通过线程池监听kafkatopic中模型更新的消息,当存在更新的消息时,可以重新将用户偏好模型加载至内存中,以便根据新加载的用户偏好模型确定用户对资讯信息各个类别标签的偏好信息。
本说明书实施例中,通过线程池监听与kafka消息队列可以实现实时计算部分在线加载批量部分生成的信息,从而可以解决实时计算部分线上自动更新问题,实现为用户提供资讯服务时能及时响应用户的兴趣变化,使用户能及时看到自己喜欢的资讯,从而提高用户体验。
S8:根据所述推荐值向用户推荐资讯。
本说明书一个实施例中,推荐值可以作为向用户推荐资讯的标准。
本说明书实施例中,在确定资讯的推荐值后,可以根据推荐值向用户推荐资讯。例如一些实施场景中,通过计算用户对资讯各个类别标签的偏好向量与实时资讯在各个类别标签的权重向量的余弦相似度作为用户对该资讯的推荐评分,然后可以根据评分高低的向用户推荐资讯。例如一些实施场景中,多条资讯的推荐评分分别为9.8、8.1、6.7、7.5,此时可以将该多条资讯的推荐评分按从高到低的顺序排列,获得推荐列表,然后根据推荐列表中资讯的顺序向用户推荐。另一些实施例中,也可以将该多条资讯的推荐评分按其它顺序排列,获得推荐列表,然后根据推荐列表中资讯的顺序向用户推荐。
下面以一个具体业务场景为例对本说明书实施方案进行说明。如图3所示,图3是本说明书提供的一种资讯推荐方法具体实施例的场景示意图。具体的,一些实施场景中,可以通过批量计算部分采集用户的基本信息、资产负债信息、贵金属持仓信息以及用户的资讯点击行为数据等,并对采集信息进行清洗去除其中的异常数据,然后可以根据用户特征与资讯特征标签的偏好权重映射关系加工出用户与资讯特征标签的偏好关系信息,最后可以基于偏好关系信息,构建用户对资讯特征的用户偏好模型,并存入hive数据库中。一些实施场景中,可以通过实时计算部分获取资讯信息,并判断是否需要通过人工规则进行推荐,如果需要通过人工规则进行推荐,则根据人工规则进行资讯推荐,如果不需要人工规则进行推荐,则可以对资讯信息进行自然语言处理、向量化、特征约减等处理后,输入多标签分类概率模型,获得资讯信息在各个类别标签的权重信息,最后可以结合批量计算部分用构建的户偏好模型获得用户对资讯的偏好评分,并根据偏好评分确定推荐列表进行推荐。一些实施场景中,用户偏好模型可以更新,当其更新时,可以向kafka topic中发送模型更新消息,实时计算部分可以利用线程池监听kafka队列消息,当队列消息中存在模型更新的消息时,可以获取更新后的用户偏好模型,然后根据更新后的用户偏好模型获得用户对资讯的偏好评分,从而根据偏好评分进行资讯推荐。
本说明书提供的一种资讯推荐方法,通过构建基于spark平台的商业银行资讯推荐方法,可以统一数据交互格式,从而提高交互效率,方便集群资源分配。通过线程池监听与kafka消息队列可以实现实时计算部分在线加载批量部分生成的信息,从而可以解决实时计算部分线上自动更新问题,实现为用户提供资讯服务时能及时响应用户的兴趣变化,使用户能及时看到自己喜欢的资讯,从而提高用户体验。通过用户对资讯类别标签的偏好向量和每条资讯的类别标签权重向量两个维度来计算最终的资讯推荐评分,可以解决推荐冷启动问题,提升计算效率,同时保证了推荐结果的合理性和准确性。
本说明书中上述方法的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参加即可,每个实施例重点说明的都是与其他实施例的不同之处。相关之处参加方法实施例的部分说明即可。
基于上述所述的一种资讯推荐方法,本说明书一个或多个实施例还提供一种资讯推荐设备的实施例,包括处理器及用于存储处理器可执行指令的存储器,所述指令被所述处理器执行时实现包括以下步骤:
获取资讯信息;
将所述资讯信息输入多标签分类概率模型,获得所述资讯信息在各个类别标签的权重信息;
根据预先构建的用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息,其中,所述用户偏好模型基于线程池监听kafka中消息进行更新;
基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;
根据所述推荐值向用户推荐资讯。
需要说明的,上述所述的设备根据方法实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。
需要说明的,上述所述的设备根据方法实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。
基于上述所述的一种资讯推荐方法,本说明书一个或多个实施例还提供一种资讯推荐系统的实施例,如图4所示,图4是本说明书提供的一种资讯推荐系统的一个实施例的模块结构示意图。其中,本说明书一个实施例中提供的一种资讯推荐系统可以包括至少一个处理器以及存储计算机可执行指令的存储器,所述存储器可以用于存储多标签分类概率模型和接收的用户偏好模型,并将存储多标签分类概率模型和用户偏好模型发送至所述处理器;
所述处理器可以包括离线处理装置和实时处理装置;
所述离线处理装置可以用于获取目标用户的特征信息,根据所述特征信息构建目标用户对资讯特征的用户偏好模型;还可以用于对用户偏好模型进行更新;还可以用于将所述用户偏好模型发送至存储器;
所述实时处理装置可以用于获取资讯信息,并从所述存储器中获取多标签分类概率模型和用户偏好模型;还可以用于基于线程池监听kafka队列消息,确定kafka队列消息中存在模型更新的消息时,从所述存储器获取更新后的用户偏好模型;还可以用于根据多标签分类概率模型获取所述资讯信息在各个类别标签的权重信息,根据用户偏好模型确定用户对所述资讯信息各个类别标签的偏好信息;还可以用于基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,以及根据所述推荐值向用户推荐资讯。
所述的系统可以为单独的服务器,也可以包括使用了本说明书的一个或多个所述方法或一个或多个实施例装置的服务器集群、系统(包括分布式系统)、软件(应用)、实际操作装置、逻辑门电路装置、量子计算机等并结合必要的实施硬件的终端装置。
本说明书所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例,图5是本说明书提供的一种资讯推荐服务器的一个实施例的硬件结构框图,该服务器可以是上述实施例中的资讯推荐装置或资讯推荐系统。如图5所示,服务器10可以包括一个或多个(图中仅示出一个)处理器100(处理器100可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器200、以及用于通信功能的传输模块300。本领域普通技术人员可以理解,图5所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,服务器10还可包括比图5中所示更多或者更少的组件,例如还可以包括其他的处理硬件,如数据库或多级缓存、GPU,或者具有与图5所示不同的配置。
存储器200可用于存储应用软件的软件程序以及模块,如本说明书实施例中的资讯推荐方法对应的程序指令/模块,处理器100通过运行存储在存储器200内的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器200可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器200可进一步包括相对于处理器100远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输模块300用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中,传输模块300包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块300可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书提供的上述实施例所述的方法或装置可以通过计算机程序实现业务逻辑并记录在存储介质上,所述的存储介质可以计算机读取并执行,实现本说明书实施例所描述方案的效果。
所述存储介质可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。所述存储介质有可以包括:利用电能方式存储信息的装置如,各式存储器,如RAM、ROM等;利用磁能方式存储信息的装置如,硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置如,CD或DVD。当然,还有其他方式的可读存储介质,例如量子存储器、石墨烯存储器等等。
本说明书提供的上述资讯推荐方法或装置实施例可以在计算机中由处理器执行相应的程序指令来实现,如使用windows操作系统的c++语言在PC端实现、linux系统实现,或其他例如使用android、iOS系统程序设计语言在智能终端实现,以及基于量子计算机的处理逻辑实现等。
需要说明的是说明书上述所述的装置、计算机存储介质、系统根据相关方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照对应方法实施例的描述,在此不作一一赘述。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书实施例并不局限于必须是符合行业通信标准、标准计算机数据处理和数据存储规则或本说明书一个或多个实施例所描述的情况。某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、存储、判断、处理方式等获取的实施例,仍然可以属于本说明书实施例的可选实施方案范围之内。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
虽然本说明书一个或多个实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书一个或多个时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
本发明是参照根据本发明实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储、石墨烯存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本说明书一个或多个实施例的实施例而已,并不用于限制本本说明书一个或多个实施例。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在权利要求范围之内。

Claims (12)

1.一种资讯推荐装置,其特征在于,包括批量处理模块和实时处理模块,其中,所述批量处理模块包括用户信息处理模块和用户偏好处理模块;
所述用户信息处理模块,用于获取目标用户的特征信息,并将所述特征信息发送至用户偏好处理模块;
所述用户偏好处理模块,用于根据特征信息构建目标用户对资讯特征的用户偏好模型,并将所述用户偏好模型发送至实时处理模块包括的资讯推荐模块;还用于对用户偏好模型进行更新,以及将模型更新的消息发送至kafka;
所述实时处理模块包括资讯信息处理模块、多标签分类概率模型模块、资讯推荐模块;
所述资讯信息处理模块,用于获取资讯信息,并将所述资讯信息发送至多标签分类概率模型模块;
所述多标签分类概率模型模块,用于获取所述资讯信息在各个类别标签的权重信息,并将所述权重信息发送至资讯推荐模块;
所述资讯推荐模块,用于根据所述用户偏好模型确定用户对所述资讯信息各个类别标签的偏好信息;还用于基于线程池监听kafka队列消息;还用于基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,以及根据所述推荐值向用户推荐资讯。
2.如权利要求1所述的装置,其特征在于,所述根据特征信息构建目标用户对资讯特征的用户偏好模型,包括:
偏好关系信息确定单元,用于根据目标用户的特征信息、用户特征与资讯特征的映射关系,确定所述目标用户与资讯特征的偏好关系信息;
构建单元,用于基于所述偏好关系信息,构建目标用户对资讯特征的用户偏好模型。
3.如权利要求1所述的装置,其特征在于,所述基于线程池监听kafka队列消息XX装置还包括,包括:
判断单元,用于判断kafka队列消息中是否存在模型更新的消息;
更新模型获取单元,用于确定存在时,从用户偏好处理模块获取更新后的用户偏好模型;
相应的,根据更新后的用户偏好模型确定用户对所述资讯信息各个类别标签的偏好信息;基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;根据所述推荐值向用户推荐资讯。
4.如权利要求1所述的装置,其特征在于,所述装置还包括:
第一处理单元,用于对所述资讯信息进行第一处理,获得第一处理结果,所述第一处理包括切词、去停用词、敏感词过滤;
第二处理单元,用于对所述第一处理结果进行第二处理,获得第二处理结果,所述第二处理包括向量化、特征约减;
相应的,将所述第二处理结果发送至多标签分类概率模型模块。
5.如权利要求1所述的装置,其特征在于,所述基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,包括:
计算单元,用于计算所述权重信息和所述偏好信息的余弦相似度,将所述余弦相似度作为资讯的推荐值。
6.一种资讯推荐方法,其特征在于,包括:
获取资讯信息;
将所述资讯信息输入多标签分类概率模型,获得所述资讯信息在各个类别标签的权重信息;
根据预先构建的用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息,其中,所述用户偏好模型基于线程池监听kafka中消息进行更新;
基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;
根据所述推荐值向用户推荐资讯。
7.如权利要求6所述的方法,其特征在于,所述获取资讯信息后,还包括:
对所述资讯信息进行第一处理,获得第一处理结果,所述第一处理包括切词、去停用词、敏感词过滤;
对所述第一处理结果进行第二处理,获得第二处理结果,所述第二处理包括向量化、特征约减;
相应的,将所述第二处理结果输入多标签分类概率模型。
8.如权利要求6所述的方法,其特征在于,所述预先构建的用户偏好模型包括采用下述方式得到:
获取目标用户的特征信息;
根据目标用户的特征信息、用户特征与资讯特征的映射关系,确定所述目标用户与资讯特征的偏好关系信息;
基于所述偏好关系信息,构建目标用户对资讯特征的用户偏好模型。
9.如权利要求6所述的方法,其特征在于,所述用户偏好模型基于线程池监听kafka中消息进行更新,包括:
利用线程池监听kafka队列消息,并判断所述队列消息中是否存在模型更新的消息;
确定存在时,获取更新后的用户偏好模型;
相应的,根据更新后的用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息;
基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;
根据所述推荐值向用户推荐资讯。
10.如权利要求6所述的方法,其特征在于,所述基于所述权重信息和所述偏好信息,确定所述资讯的推荐标准信息,包括:
计算所述权重信息和所述偏好信息的余弦相似度,将所述余弦相似度作为资讯的推荐值。
11.一种资讯推荐设备,其特征在于,包括处理器及用于存储处理器可执行指令的存储器,所述指令被所述处理器执行时实现包括以下步骤:
获取资讯信息;
将所述资讯信息输入多标签分类概率模型,获得所述资讯信息在各个类别标签的权重信息;
根据预先构建的用户偏好模型,确定用户对所述资讯信息各个类别标签的偏好信息,其中,所述用户偏好模型基于线程池监听kafka中消息进行更新;
基于所述权重信息和所述偏好信息,确定所述资讯的推荐值;
根据所述推荐值向用户推荐资讯。
12.一种资讯推荐系统,其特征在于,包括至少一个处理器以及存储计算机可执行指令的存储器,
所述存储器用于存储多标签分类概率模型和接收的用户偏好模型,并将存储多标签分类概率模型和用户偏好模型发送至所述处理器;
所述处理器包括离线处理装置和实时处理装置;
所述离线处理装置用于获取目标用户的特征信息,根据所述特征信息构建目标用户对资讯特征的用户偏好模型;还用于对用户偏好模型进行更新;还用于将所述用户偏好模型发送至存储器;
所述实时处理装置用于获取资讯信息,并从所述存储器中获取多标签分类概率模型和用户偏好模型;还用于基于线程池监听kafka队列消息,确定kafka队列消息中存在模型更新的消息时,从所述存储器获取更新后的用户偏好模型;还用于根据多标签分类概率模型获取所述资讯信息在各个类别标签的权重信息,根据用户偏好模型确定用户对所述资讯信息各个类别标签的偏好信息;还用于基于所述权重信息和所述偏好信息,确定所述资讯的推荐值,以及根据所述推荐值向用户推荐资讯。
CN201911376449.7A 2019-12-27 2019-12-27 一种资讯推荐装置、方法、设备及系统 Active CN111143681B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911376449.7A CN111143681B (zh) 2019-12-27 2019-12-27 一种资讯推荐装置、方法、设备及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911376449.7A CN111143681B (zh) 2019-12-27 2019-12-27 一种资讯推荐装置、方法、设备及系统

Publications (2)

Publication Number Publication Date
CN111143681A true CN111143681A (zh) 2020-05-12
CN111143681B CN111143681B (zh) 2023-10-24

Family

ID=70520986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911376449.7A Active CN111143681B (zh) 2019-12-27 2019-12-27 一种资讯推荐装置、方法、设备及系统

Country Status (1)

Country Link
CN (1) CN111143681B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579893A (zh) * 2020-12-15 2021-03-30 中国建设银行股份有限公司 一种信息推送、信息展示方法、装置及设备
CN112733034A (zh) * 2021-01-21 2021-04-30 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及存储介质
CN113129154A (zh) * 2021-05-18 2021-07-16 中国银行股份有限公司 基金产品信息的跨行推荐方法及装置
CN113159959A (zh) * 2021-05-20 2021-07-23 中国银行股份有限公司 外汇产品推荐方法及装置
CN113222734A (zh) * 2021-05-21 2021-08-06 中国银行股份有限公司 银行金融资讯推荐系统及方法
CN113434771A (zh) * 2021-07-09 2021-09-24 中国银行股份有限公司 基于区块链的金融资讯推荐方法及区块链中的参与方节点
CN113836324A (zh) * 2020-06-08 2021-12-24 上海幻电信息科技有限公司 资讯推荐方法、电子设备和服务器
CN114422585A (zh) * 2021-12-27 2022-04-29 航天信息股份有限公司 一种企业服务平台消息推送方法及系统
CN116150477A (zh) * 2022-12-06 2023-05-23 上海贝耳塔信息技术有限公司 一种财经资讯个性化推荐方法、装置、设备及介质
CN117011019A (zh) * 2023-09-28 2023-11-07 无锡锡商银行股份有限公司 一种基于大数据的银行架构自适应分析管理系统及方法
US11869015B1 (en) 2022-12-09 2024-01-09 Northern Trust Corporation Computing technologies for benchmarking

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150101340A (ko) * 2014-02-26 2015-09-03 에스케이플래닛 주식회사 사용자별 카테고리 선호도 생성 방법, 이를 이용한 상품 추천 방법 및 이를 위한 장치
CN107391680A (zh) * 2017-07-24 2017-11-24 北京京东尚科信息技术有限公司 内容推荐方法、装置和设备
CN109299375A (zh) * 2018-10-24 2019-02-01 中国平安人寿保险股份有限公司 资讯个性化推送方法、装置、电子设备及存储介质
US20190158443A1 (en) * 2017-11-17 2019-05-23 International Business Machines Corporation Real-time recommendation of message recipients based on recipient interest level in message
CN110134861A (zh) * 2019-04-12 2019-08-16 汕头大学 一种基于项目类别和用户偏好的推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150101340A (ko) * 2014-02-26 2015-09-03 에스케이플래닛 주식회사 사용자별 카테고리 선호도 생성 방법, 이를 이용한 상품 추천 방법 및 이를 위한 장치
CN107391680A (zh) * 2017-07-24 2017-11-24 北京京东尚科信息技术有限公司 内容推荐方法、装置和设备
US20190158443A1 (en) * 2017-11-17 2019-05-23 International Business Machines Corporation Real-time recommendation of message recipients based on recipient interest level in message
CN109299375A (zh) * 2018-10-24 2019-02-01 中国平安人寿保险股份有限公司 资讯个性化推送方法、装置、电子设备及存储介质
CN110134861A (zh) * 2019-04-12 2019-08-16 汕头大学 一种基于项目类别和用户偏好的推荐方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836324A (zh) * 2020-06-08 2021-12-24 上海幻电信息科技有限公司 资讯推荐方法、电子设备和服务器
CN113836324B (zh) * 2020-06-08 2024-05-14 上海幻电信息科技有限公司 资讯推荐方法、电子设备和服务器
CN112579893A (zh) * 2020-12-15 2021-03-30 中国建设银行股份有限公司 一种信息推送、信息展示方法、装置及设备
CN112733034B (zh) * 2021-01-21 2023-08-01 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及存储介质
CN112733034A (zh) * 2021-01-21 2021-04-30 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及存储介质
CN113129154A (zh) * 2021-05-18 2021-07-16 中国银行股份有限公司 基金产品信息的跨行推荐方法及装置
CN113159959A (zh) * 2021-05-20 2021-07-23 中国银行股份有限公司 外汇产品推荐方法及装置
CN113222734A (zh) * 2021-05-21 2021-08-06 中国银行股份有限公司 银行金融资讯推荐系统及方法
CN113434771A (zh) * 2021-07-09 2021-09-24 中国银行股份有限公司 基于区块链的金融资讯推荐方法及区块链中的参与方节点
CN114422585A (zh) * 2021-12-27 2022-04-29 航天信息股份有限公司 一种企业服务平台消息推送方法及系统
CN116150477A (zh) * 2022-12-06 2023-05-23 上海贝耳塔信息技术有限公司 一种财经资讯个性化推荐方法、装置、设备及介质
US11869015B1 (en) 2022-12-09 2024-01-09 Northern Trust Corporation Computing technologies for benchmarking
CN117011019A (zh) * 2023-09-28 2023-11-07 无锡锡商银行股份有限公司 一种基于大数据的银行架构自适应分析管理系统及方法
CN117011019B (zh) * 2023-09-28 2023-12-22 无锡锡商银行股份有限公司 一种基于大数据的银行架构自适应分析管理系统及方法

Also Published As

Publication number Publication date
CN111143681B (zh) 2023-10-24

Similar Documents

Publication Publication Date Title
CN111143681B (zh) 一种资讯推荐装置、方法、设备及系统
Khan et al. Stock market prediction using machine learning classifiers and social media, news
Li et al. Discovering public sentiment in social media for predicting stock movement of publicly listed companies
CN110321482B (zh) 一种信息的推荐方法、装置及设备
Lovaglio et al. Skills in demand for ICT and statistical occupations: Evidence from web‐based job vacancies
Jin et al. What makes consumers unsatisfied with your products: Review analysis at a fine-grained level
WO2018040068A1 (zh) 基于知识图谱的语意分析系统及方法
US20190303395A1 (en) Techniques to determine portfolio relevant articles
Kumar An encyclopedic overview of ‘big data’analytics
Dat et al. STING algorithm used English sentiment classification in a parallel environment
Jin et al. Chi-square statistics feature selection based on term frequency and distribution for text categorization
CN110313010B (zh) 一种为结构化问题组织答案的方法及相应计算设备
Rahnama Distributed real-time sentiment analysis for big data social streams
KR20200039852A (ko) 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법
CN110674188A (zh) 一种特征提取方法、装置及设备
CN108241867B (zh) 一种分类方法及装置
Yuvaraj et al. Twitter sentiment classification using binary shuffled frog algorithm
Zhao et al. WTL-CNN: A news text classification method of convolutional neural network based on weighted word embedding
Wei et al. Sentiment classification of Chinese Weibo based on extended sentiment dictionary and organisational structure of comments
Jayagopal et al. Data management and big data analytics: Data management in digital economy
CN114707041A (zh) 消息推荐方法、装置、计算机可读介质及电子设备
US11062330B2 (en) Cognitively identifying a propensity for obtaining prospective entities
US20230214676A1 (en) Prediction model training method, information prediction method and corresponding device
Subramani et al. Text mining and real-time analytics of twitter data: A case study of australian hay fever prediction
Zhao et al. Investigating smartphone user differences in their application usage behaviors: an empirical study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant