CN109710845A - 资讯推荐方法、装置、计算机设备和可读存储介质 - Google Patents
资讯推荐方法、装置、计算机设备和可读存储介质 Download PDFInfo
- Publication number
- CN109710845A CN109710845A CN201811594816.6A CN201811594816A CN109710845A CN 109710845 A CN109710845 A CN 109710845A CN 201811594816 A CN201811594816 A CN 201811594816A CN 109710845 A CN109710845 A CN 109710845A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- vector
- feature
- user characteristics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提出了一种资讯推荐方法、装置、计算机设备及可读存储介质。其中,方法包括:通过获取用户的用户模型,根据用户模型生成用户的用户特征向量;以及根据用户特征向量查询资讯索引库以获取推荐资讯。该方法通过基于用户特征向量来查询资讯索引库的方法向用户推荐资讯,解决了现有技术中仅根据用户的兴趣点、关注点等显性特征向用户推荐资讯,导致推荐的资讯内容不全面的技术问题,使得推荐的资讯维度更广,内容更加丰富,从而提高了用户的使用体验。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种资讯推荐方法、装置、计算机设备和可读存储介质。
背景技术
随着互联网技术的快速发展,越来越多的用户通过计算机设备(例如,智能手机、个人电脑等)获取资讯信息,但是如今的信息呈现爆炸式增长,海量信息使得用户难以寻找到自己所需的信息。智能推荐系统应运而生,充分运用了机器学习、数据挖掘、搜索引擎、自然语言处理等相关领域的技术为用户推荐信息。
例如,用户在资讯平台上浏览了某些内容后,智能推荐系统会根据用户的习惯和偏好定制相关的内容进行推荐。这样用户就可以很方便的获取自己想要的资讯信息,而不用专门花时间去寻找。
但是,现有技术中的智能推荐系统,仅通过用户的关注点、兴趣点、好友关系等向用户进行个性化资讯的推荐,不能充分挖掘用户的兴趣,从而导致推荐的资讯不够全面。
发明内容
本申请提出一种资讯推荐方法、装置、计算机设备和可读存储介质,通过用户的特征向量向用户推荐资讯,用于解决现有技术中仅根据用户的兴趣点、关注点等显性特征向用户推荐资讯,导致推荐的资讯内容不全面的技术问题。
本申请第一方面实施例提出了一种资讯推荐方法,包括:
获取用户的用户模型;
根据所述用户模型生成所述用户的用户特征向量;以及
根据所述用户特征向量查询资讯索引库以获取推荐资讯。
作为本申请第一种可能的实现方式,所述资讯索引库包括多个资讯以及每个资讯对应的资讯特征向量,所述根据所述用户特征向量查询资讯索引库以获取推荐资讯,包括:
将所述用户特征向量与所述资讯索引库中的多个资讯的资讯特征向量进行匹配;以及
将与所述用户特征向量匹配的资讯作为所述推荐资讯。
作为本申请第二种可能的实现方式,所述将所述用户特征向量与所述资讯索引库中的多个资讯的资讯特征向量进行匹配,包括:
分别计算所述用户特征向量与所述资讯特征向量之间的向量距离;以及
如果所述向量距离小于预设阈值,则将判断所述用户特征向量和所述资讯特征向量匹配。
作为本申请第三种可能的实现方式,所述根据所述用户模型生成所述用户的用户特征向量,包括:
从所述用户模型中提取用户属性特征和用户反馈行为特征;
将所述用户属性特征和用户反馈行为特征进行拼接以生成用户样本;
从所述用户样本中进行特征提取并将提取的特征转换为第一特征签名;以及
通过词嵌入向量特征将所述第一特征签名转换为所述用户特征向量。
作为本申请第四种可能的实现方式,所述资讯对应的所述资讯特征向量通过以下步骤获得:
获取所述资讯的原始属性信息;
根据所述原始属性信息生成文本样本;
从所述文本样本中进行特征提取并将提取的特征转换为第二特征签名;以及
通过词嵌入向量特征将所述第二特征签名转换为所述资讯特征向量。
本申请实施例的资讯推荐方法,通过获取用户的用户模型,根据用户模型生成用户的用户特征向量;以及根据用户特征向量查询资讯索引库以获取推荐资讯。该方法通过基于用户特征向量来查询资讯索引库的方法向用户推荐资讯,解决了现有技术中仅根据用户的兴趣点、关注点等显性特征向用户推荐资讯,导致推荐的资讯内容不全面的技术问题,使得推荐的资讯维度更广,内容更加丰富,从而提高了用户的使用体验。
本申请第二方面实施例提出了一种资讯推荐装置,其特征在于,包括:
第一获取模块,用于获取用户的用户模型;
生成模块,用于根据所述用户模型生成所述用户的用户特征向量;以及
第二获取模块,用于根据所述用户特征向量查询资讯索引库以获取推荐资讯。
本申请实施例的资讯推荐装置,通过获取用户的用户模型,根据用户模型生成用户的用户特征向量;以及根据用户特征向量查询资讯索引库以获取推荐资讯。该方法通过基于用户特征向量来查询资讯索引库的方法向用户推荐资讯,解决了现有技术中仅根据用户的兴趣点、关注点等显性特征向用户推荐资讯,导致推荐的资讯内容不全面的技术问题,使得推荐的资讯维度更广,内容更加丰富,从而提高了用户的使用体验。
本申请第三方面实施例提出了一种计算机设备,包括:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本申请上述实施例提出的资讯推荐方法。
本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请上述实施例提出的资讯推荐方法。
本申请第五方面实施例提出了一种计算机程序产品,当计算机程序产品中的指令由处理器执行时,实现如本申请上述实施例中所述的资讯推荐方法。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本申请实施例所提供的一种资讯推荐方法的流程示意图;
图2为本申请实施例所提供的另一种资讯推荐方法的流程示意图;
图3为本申请实施例所提供的一种资讯推荐装置的结构示意图;
图4为本申请实施例所提供的另一种资讯推荐装置的结构示意图;
图5示出了适于用来实现本申请实施方式的示例性计算机设备的框图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
现有技术中,个性化资讯推荐系统,通常通过用户的关注点、兴趣点、用户好友关系、社会热点和新鲜资讯等显示关系进行资讯推荐。具体的实现方案如下:
(1)根据用户关注点进行个性化资讯推荐时,具体通过用户关注的资讯发布机构、个人公众号等,分析出此类资讯发布机构和个人公众号所发布资讯的内容特征,根据相似度模型找出类似的资讯发布机构、个人公众号,并将其发布的资讯作为推荐资讯候选集推荐给用户。
(2)根据用户兴趣点进行个性化资讯推荐时,具体通过用户浏览、评论、收藏、转发、分享的资讯,分析出这类资讯的属性(其中,属性包括但不限于资讯标题分类、内容分类、资讯发布时间、资讯发布机构等),并根据这些属性推荐类似的资讯物料给用户。
(3)根据用户好友关系进行个性化资讯推荐时,由于用户的好友关系反应了用户的社交关系、兴趣和关注点。根据好友的兴趣点和关注点,用于对用户的个性化资讯推荐,也有较好的推荐效果。
(4)根据社会热点和新鲜资讯进行个性化资讯推荐时,由于社会热点和时效性最新的资讯消息具有大众普遍关注的特点,通常具有较好的传播效果和关注效果,因此,可以基于社会热点进行个性化资讯推荐。
但是,现有技术中的资讯推荐方法缺乏足够的泛化度,没有充分的挖掘出用户的兴趣爱好。针对现有技术中资讯推荐泛化能力不足的问题,本申请实施例提出了一种资讯推荐方法,通过获取用户的用户模型,根据用户模型生成用户的用户特征向量;以及根据用户特征向量查询资讯索引库以获取推荐资讯。
下面参考附图描述本申请实施例的资讯推荐方法、装置、计算机设备和可读存储介质。
图1为本申请实施例一所提供的资讯推荐方法的流程示意图。
本申请实施例以该资讯推荐方法被配置于资讯推荐装置中来举例说明,该资讯推荐装置可以应用于任一计算机设备中,以使该计算机设备可以执行资讯推荐方法。
其中,计算机设备可以为个人电脑(Personal Computer,简称PC)、云端设备、移动设备等,移动设备例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
如图1所示,该资讯推荐方法可以包括以下步骤:
步骤101,获取用户的用户模型。
本申请实施例中,用户模型,是用于研究用户对于资讯进行操作的行为的系统化方法。用户模型的构建,是通过人机交互获取用户行为的相关信息,建立用户个性化文件的过程。
作为一种可能的实现方式,可以采用流式计算架构进行用户模型的构建。例如spark、storm等现有的流式计算框架或者自主研发的流式计算框架。
具体地,收集用户在计算机设备的浏览器上对于资讯物料进行操作的用户行为数据,例如,用户对于资讯物料的浏览、点击、评论、收藏、喜欢、转发、分享以及阅读时长等多种角度的数据,根据收集到的数据,建立用户的行为特征,以构建用户模型。
需要说明的是,通过流式计算框架构建用户模型,可以实时获取行为数据,即只要用户有行为动作,即可在用户模型里体现,使得用户行为特征更新速度非常快,基本达到实时更新,同时也大大降低了计算资源。用户信息的获取包括两种:用户显性提供和隐式获取。用户显性提供,是指用户通过注册提供的用户的基本信息,例如,年龄、性别、常住地点等。用户信息的隐式获取是指通过用户的浏览行为、访问日志等信息获取用户的行为信息。
步骤102,根据用户模型生成用户的用户特征向量。
本申请实施例中,通过对用户行为日志的挖掘,对用户的每一个行为进行归一化处理、数据清理后得到用户的上下文样本。其中,用户的行为可以为用户对资讯的浏览、点击、评论、收藏、转发、分享等行为属性。其中,归一化处理方法是在分析研究对象变化趋势的基础上建立函数模型,从而研究对象之间存在的相互依存关系。
进一步的,通过特征提取器从用户模型中提取特征,包括提取用户属性特征和用户反馈行为特征,并根据特征签名算法把提取的特征转化为特征签名,并支持赋予不同特征的权重值。之后将其通过词嵌入的方法(word embedding)将用户特征转化为多维向量。例如,可以使用汉语语言模型(Chinese Language Model)CLM模型、连续词袋模型(Continuous Bag of Words Model,CBOW)、Skip-gram模型等方案将用户特征转化为多维向量。
步骤103,根据用户特征向量查询资讯索引库以获取推荐资讯。
本申请实施例中,通过用户的特征向量,根据向量的相似度查询资讯索引库,将相似度高的资讯召回,以获取推荐资讯。其中,向量相似度的计算方法可以通过用户特征向量和资讯特征向量之间的距离来确定,例如,可以计算欧式距离、曼哈顿距离等。用这种方式进行计算的向量召回具有最高的计算准确度,由于需要进行向量的全局精确计算,召回准确度最高,效果相对最好。
需要说明的是,可以使用基于二叉树的索引库的构建和存储方法构建资讯索引库,也可以使用基于图的索引库构建和存储方法来构建资讯索引库。
本申请实施例的资讯推荐方法,通过获取用户的用户模型,根据用户模型生成用户的用户特征向量;以及根据用户特征向量查询资讯索引库以获取推荐资讯。该方法通过基于用户特征向量来查询资讯索引库的方法向用户推荐资讯,解决了现有技术中仅根据用户的兴趣点、关注点等显性特征向用户推荐资讯,导致推荐的资讯内容不全面的技术问题,使得推荐的资讯维度更广,内容更加丰富,从而提高了用户的使用体验。
为了清楚说明上一实施例,本实施例提供了另一种资讯推荐方法,图2为本申请实施例提出的另一种资讯推荐方法的流程示意图。
如图2所示,该资讯推荐方法可以包括以下步骤:
步骤201,获取用户的用户模型。
本申请实施例中,步骤201的实现过程可以参见上述实施例中步骤101中所述的实现过程,在此不再赘述。
步骤202,从用户模型中提取用户属性特征和用户反馈行为特征。
本申请实施例中,用户的属性特征可以指用户的兴趣分类、用户性别、地域等信息。用户反馈行为特征可以指用户对某资讯及其分类的浏览、点击、评论、转发、分享等信息。
步骤203,将用户属性特征和用户反馈行为特征进行拼接以生成用户样本。
本申请实施例中,将从用户模型中提取的用户属性特征和用户反馈行为特征进行拼接,以生成用户样本。
作为一种示例,可以通过对用户行为日志的挖掘,对用户的每一个行为进行归一化处理以及数据清理,以得到用户样本。
步骤204,从用户样本中进行特征提取并将提取的特征转换为第一特征签名。
本申请实施例中,可以通过特征提取器从用户样本中进行特征提取,进一步的,根据特征签名算法将提取的特征转换为第一特征签名。其中,特征签名,是用户标识特征的唯一的,所谓的第一特征签名,是用于区别与其余的特征签名来说的。
步骤205,通过词嵌入向量特征将第一特征签名转换为用户特征向量。
其中,词嵌入(Word Embedding)是一组广泛应用于预测自然语言学习建模的特征工程技术,特别是在深度学习应用中的使用更为显著。词嵌入是将词的稀疏向量表示转换为密集、连续的向量空间,使得能够识别单词和短语之间的相似性,而这一点很大程度上依赖于它们的语境。也可以理解为将高维向量词表示嵌入到一个较低维的空间中。
举例来说,在典型的词袋(bag-of-words)模型中,每个单词都被认为是一个唯一的标记,与其他单词毫无关联。例如,即使“salt(盐)”和“seasoning(调味料)”平时都是高频地出现在相同的语境或是句子中,也将被分配一个唯一的ID。词嵌入是一系列特征工程技术,它将稀疏的词向量映射到基于周围语境的连续空间中。例如,如果“salt”和“seasoning”出现在相同的语境中,那么模型将表明“salt”在概念上更接近于“seasoning”,而不是“chair(椅子)”。
本申请实施例中,可以通过词嵌入向量特征将第一特征签名转换为用户特征向量,便于机器语言处理。
步骤206,将用户特征向量与资讯索引库中的多个资讯的资讯特征向量进行匹配。
其中,资讯索引库包括多个资讯以及每个资讯对应的资讯特征向量。
本申请实施例中,获取每个资讯对应的资讯特征向量时,首先获取资讯的原始属性信息,其中,原始属性信息可以为资讯的标题、分类、作者、发布时间、热度、受众人群等基础属性。进一步的,根据原始属性信息生成文本样本,通过特征提取器从文本样本中进行特征提取并将提取的特征转换为第二特征签名,最终通过词嵌入向量特征将第二特征签名转换为资讯特征向量。
本申请实施例中,通过分别计算用户特征向量与资讯特征向量之间的向量距离,来判断用户特征向量与资讯特征向量是否匹配。例如,可以计算用户特征向量与资讯特征向量之间的欧式距离、COS距离、曼哈顿距离等。
需要说明的是,已知用户特征向量与资讯特征向量,计算两者之间的距离可参考现有技术中的计算方法,在此不再赘述。
作为一种可能的情况,如果计算得到的用户特征向量与资讯特征向量之间的向量距离小于预设阈值,则确定用户特征向量和资讯特征向量匹配。
作为另一种可能的情况,如果计算得到的用户特征向量与资讯特征向量之间的向量距离大于预设阈值,则确定用户特征向量和资讯特征向量不匹配。
步骤207,将与用户特征向量匹配的资讯作为推荐资讯。
本申请实施例中,通过步骤206中计算得到的用户特征向量与资讯特征向量之间的向量距离,确定与用户特征向量匹配的资讯特征向量,进而将与用户特征向量匹配的资讯作为推荐资讯推荐给用户。
本申请实施例的资讯推荐方法,通过获取用户的用户模型,从用户模型中提取用户属性特征和用户反馈行为特征,将用户属性特征和用户反馈行为特征进行拼接以生成用户样本,从用户样本中进行特征提取并将提取的特征转换为第一特征签名,通过词嵌入向量特征将第一特征签名转换为用户特征向量,将用户特征向量与资讯索引库中的多个资讯的资讯特征向量进行匹配,将与用户特征向量匹配的资讯作为推荐资讯。该方法通过将用户特征向量与资讯特征向量进行匹配,将匹配的资讯作为推荐资讯推荐给用户,解决了现有技术中仅根据用户的兴趣点、关注点等显性特征向用户推荐资讯,导致推荐的资讯内容不全面、重复度较高的技术问题,使得推荐的资讯维度更广,内容更加丰富,从而提高了用户的使用体验。
为了实现上述实施例,本申请还提出一种资讯推荐装置。
图3为本申请实施例六所提供的资讯推荐装置的结构示意图。
如图3所示,该资讯推荐装置100包括:第一获取模块110、生成模块120以及第二获取模块130。
第一获取模块110,用于获取用户的用户模型;
生成模块120,用于根据所述用户模型生成所述用户的用户特征向量;以及
第二获取模块130,用于根据所述用户特征向量查询资讯索引库以获取推荐资讯。
作为一种可能的实现方式,资讯索引库包括多个资讯以及每个资讯对应的资讯特征向量,参见图4,第二获取模块130,包括:
匹配单元131,用于将用户特征向量与资讯索引库中的多个资讯的资讯特征向量进行匹配;以及
处理单元132,用于将与用户特征向量匹配的资讯作为推荐资讯。
作为另一种可能的实现方式,匹配单元131,具体用于分别计算用户特征向量与资讯特征向量之间的向量距离;以及
如果向量距离小于预设阈值,则将判断用户特征向量和资讯特征向量匹配。
作为另一种可能的实现方式,生成模块120,具体用于从用户模型中提取用户属性特征和用户反馈行为特征;
将用户属性特征和用户反馈行为特征进行拼接以生成用户样本;
从用户样本中进行特征提取并将提取的特征转换为第一特征签名;以及
通过词嵌入向量特征将第一特征签名转换为用户特征向量。
作为另一种可能的实现方式,参见图4,资讯推荐装置100,还包括:
第三获取模140,用于获取资讯的原始属性信息;根据原始属性信息生成文本样本;从文本样本中进行特征提取并将提取的特征转换为第二特征签名;以及通过词嵌入向量特征将第二特征签名转换为资讯特征向量。
需要说明的是,前述对资讯推荐方法实施例的解释说明也适用于该实施例的资讯推荐装置,此处不再赘述。
本申请实施例的资讯推荐装置,通过获取用户的用户模型,根据用户模型生成用户的用户特征向量;以及根据用户特征向量查询资讯索引库以获取推荐资讯。该方法通过基于用户特征向量来查询资讯索引库的方法向用户推荐资讯,解决了现有技术中仅根据用户的兴趣点、关注点等显性特征向用户推荐资讯,导致推荐的资讯内容不全面的技术问题,使得推荐的资讯维度更广,内容更加丰富,从而提高了用户的使用体验。
为了实现上述实施例,本申请还提出一种计算机设备,包括:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如本申请上述实施例提出的资讯推荐方法。
为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时,实现如本申请上述实施例提出的资讯推荐方法。
为了实现上述实施例,本申请还提出一种计算机程序产品,当计算机程序产品中的指令由处理器执行时,实现如本申请上述实施例中所述的资讯推荐方法。
图5示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图5显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的资讯推荐方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (13)
1.一种资讯推荐方法,其特征在于,包括:
获取用户的用户模型;
根据所述用户模型生成所述用户的用户特征向量;以及
根据所述用户特征向量查询资讯索引库以获取推荐资讯。
2.如权利要求1所述的资讯推荐方法,其特征在于,所述资讯索引库包括多个资讯以及每个资讯对应的资讯特征向量,所述根据所述用户特征向量查询资讯索引库以获取推荐资讯,包括:
将所述用户特征向量与所述资讯索引库中的多个资讯的资讯特征向量进行匹配;以及
将与所述用户特征向量匹配的资讯作为所述推荐资讯。
3.如权利要求2所述的资讯推荐方法,其特征在于,所述将所述用户特征向量与所述资讯索引库中的多个资讯的资讯特征向量进行匹配,包括:
分别计算所述用户特征向量与所述资讯特征向量之间的向量距离;以及
如果所述向量距离小于预设阈值,则将判断所述用户特征向量和所述资讯特征向量匹配。
4.如权利要求1所述的资讯推荐方法,其特征在于,所述根据所述用户模型生成所述用户的用户特征向量,包括:
从所述用户模型中提取用户属性特征和用户反馈行为特征;
将所述用户属性特征和用户反馈行为特征进行拼接以生成用户样本;
从所述用户样本中进行特征提取并将提取的特征转换为第一特征签名;以及
通过词嵌入向量特征将所述第一特征签名转换为所述用户特征向量。
5.如权利要求2所述的资讯推荐方法,其特征在于,所述资讯对应的所述资讯特征向量通过以下步骤获得:
获取所述资讯的原始属性信息;
根据所述原始属性信息生成文本样本;
从所述文本样本中进行特征提取并将提取的特征转换为第二特征签名;以及
通过词嵌入向量特征将所述第二特征签名转换为所述资讯特征向量。
6.一种资讯推荐装置,其特征在于,包括:
第一获取模块,用于获取用户的用户模型;
生成模块,用于根据所述用户模型生成所述用户的用户特征向量;以及
第二获取模块,用于根据所述用户特征向量查询资讯索引库以获取推荐资讯。
7.如权利要求6所述的资讯推荐装置,其特征在于,所述资讯索引库包括多个资讯以及每个资讯对应的资讯特征向量,所述第二获取模块,包括:
匹配单元,用于将所述用户特征向量与所述资讯索引库中的多个资讯的资讯特征向量进行匹配;以及
处理单元,用于将与所述用户特征向量匹配的资讯作为所述推荐资讯。
8.如权利要求7所述的资讯推荐装置,其特征在于,所述匹配单元,具体用于分别计算所述用户特征向量与所述资讯特征向量之间的向量距离;以及
如果所述向量距离小于预设阈值,则将判断所述用户特征向量和所述资讯特征向量匹配。
9.如权利要求6所述的资讯推荐装置,其特征在于,所述生成模块,具体用于从所述用户模型中提取用户属性特征和用户反馈行为特征;
将所述用户属性特征和用户反馈行为特征进行拼接以生成用户样本;
从所述用户样本中进行特征提取并将提取的特征转换为第一特征签名;以及
通过词嵌入向量特征将所述第一特征签名转换为所述用户特征向量。
10.如权利要求7所述的资讯推荐装置,其特征在于,还包括:
第三获取模块,用于获取所述资讯的原始属性信息;
根据所述原始属性信息生成文本样本;
从所述文本样本中进行特征提取并将提取的特征转换为第二特征签名;以及
通过词嵌入向量特征将所述第二特征签名转换为所述资讯特征向量。
11.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1-5中任一所述的资讯推荐方法。
12.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的资讯推荐方法。
13.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由处理器执行时,执行如权利要求1-5中任一所述的资讯推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811594816.6A CN109710845A (zh) | 2018-12-25 | 2018-12-25 | 资讯推荐方法、装置、计算机设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811594816.6A CN109710845A (zh) | 2018-12-25 | 2018-12-25 | 资讯推荐方法、装置、计算机设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109710845A true CN109710845A (zh) | 2019-05-03 |
Family
ID=66258108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811594816.6A Pending CN109710845A (zh) | 2018-12-25 | 2018-12-25 | 资讯推荐方法、装置、计算机设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109710845A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111400591A (zh) * | 2020-03-11 | 2020-07-10 | 腾讯科技(北京)有限公司 | 资讯信息推荐方法、装置、电子设备及存储介质 |
CN111460280A (zh) * | 2020-02-25 | 2020-07-28 | 中通服创发科技有限责任公司 | 基于公共法律服务平台的法律服务人员推荐方法 |
CN111737575A (zh) * | 2020-06-19 | 2020-10-02 | 北京字节跳动网络技术有限公司 | 内容分发方法、装置、可读介质及电子设备 |
WO2021025397A1 (en) * | 2019-08-02 | 2021-02-11 | Samsung Electronics Co., Ltd. | Method and electronic device for quantifying user interest |
WO2021077989A1 (zh) * | 2019-10-25 | 2021-04-29 | 腾讯科技(深圳)有限公司 | 推荐方法、装置、计算机设备及存储介质 |
CN114254193A (zh) * | 2021-12-20 | 2022-03-29 | 北京达佳互联信息技术有限公司 | 内容推荐方法、装置、电子设备及存储介质 |
CN114996561A (zh) * | 2021-03-02 | 2022-09-02 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的信息推荐方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
CN104239512A (zh) * | 2014-09-16 | 2014-12-24 | 电子科技大学 | 一种文本推荐方法 |
CN104778158A (zh) * | 2015-03-04 | 2015-07-15 | 新浪网技术(中国)有限公司 | 一种文本表示方法及装置 |
CN107451217A (zh) * | 2017-07-17 | 2017-12-08 | 广州特道信息科技有限公司 | 资讯推荐方法及装置 |
CN107918825A (zh) * | 2017-11-13 | 2018-04-17 | 珠海金山网络游戏科技有限公司 | 一种基于应用安装偏好判定用户年龄段的方法和装置 |
-
2018
- 2018-12-25 CN CN201811594816.6A patent/CN109710845A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
CN104239512A (zh) * | 2014-09-16 | 2014-12-24 | 电子科技大学 | 一种文本推荐方法 |
CN104778158A (zh) * | 2015-03-04 | 2015-07-15 | 新浪网技术(中国)有限公司 | 一种文本表示方法及装置 |
CN107451217A (zh) * | 2017-07-17 | 2017-12-08 | 广州特道信息科技有限公司 | 资讯推荐方法及装置 |
CN107918825A (zh) * | 2017-11-13 | 2018-04-17 | 珠海金山网络游戏科技有限公司 | 一种基于应用安装偏好判定用户年龄段的方法和装置 |
Non-Patent Citations (1)
Title |
---|
吴高: "基于数据挖掘的商品资讯投送平台研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021025397A1 (en) * | 2019-08-02 | 2021-02-11 | Samsung Electronics Co., Ltd. | Method and electronic device for quantifying user interest |
US11681756B2 (en) | 2019-08-02 | 2023-06-20 | Samsung Electronics Co., Ltd | Method and electronic device for quantifying user interest |
WO2021077989A1 (zh) * | 2019-10-25 | 2021-04-29 | 腾讯科技(深圳)有限公司 | 推荐方法、装置、计算机设备及存储介质 |
CN111460280A (zh) * | 2020-02-25 | 2020-07-28 | 中通服创发科技有限责任公司 | 基于公共法律服务平台的法律服务人员推荐方法 |
CN111460280B (zh) * | 2020-02-25 | 2023-10-24 | 中通服创发科技有限责任公司 | 基于公共法律服务平台的法律服务人员推荐方法 |
CN111400591A (zh) * | 2020-03-11 | 2020-07-10 | 腾讯科技(北京)有限公司 | 资讯信息推荐方法、装置、电子设备及存储介质 |
CN111400591B (zh) * | 2020-03-11 | 2023-04-07 | 深圳市雅阅科技有限公司 | 资讯信息推荐方法、装置、电子设备及存储介质 |
CN111737575A (zh) * | 2020-06-19 | 2020-10-02 | 北京字节跳动网络技术有限公司 | 内容分发方法、装置、可读介质及电子设备 |
CN111737575B (zh) * | 2020-06-19 | 2023-11-14 | 北京字节跳动网络技术有限公司 | 内容分发方法、装置、可读介质及电子设备 |
CN114996561A (zh) * | 2021-03-02 | 2022-09-02 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的信息推荐方法及装置 |
CN114996561B (zh) * | 2021-03-02 | 2024-03-29 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的信息推荐方法及装置 |
CN114254193A (zh) * | 2021-12-20 | 2022-03-29 | 北京达佳互联信息技术有限公司 | 内容推荐方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109710845A (zh) | 资讯推荐方法、装置、计算机设备和可读存储介质 | |
Ortis et al. | Survey on visual sentiment analysis | |
CN111339415B (zh) | 一种基于多交互式注意力网络的点击率预测方法与装置 | |
Golder et al. | Usage patterns of collaborative tagging systems | |
WO2022105115A1 (zh) | 问答对匹配方法、装置、电子设备及存储介质 | |
Mitra et al. | Helpfulness of online consumer reviews: A multi-perspective approach | |
CN106973244A (zh) | 使用弱监督为图像配字幕 | |
CN108319720A (zh) | 基于人工智能的人机交互方法、装置及计算机设备 | |
CN114238573B (zh) | 基于文本对抗样例的信息推送方法及装置 | |
Otto et al. | Characterization and classification of semantic image-text relations | |
Abu-Salih et al. | Social credibility incorporating semantic analysis and machine learning: A survey of the state-of-the-art and future research directions | |
Hou et al. | Classifying advertising video by topicalizing high-level semantic concepts | |
CN111666766A (zh) | 数据处理方法、装置和设备 | |
Xiong et al. | Affective impression: Sentiment-awareness POI suggestion via embedding in heterogeneous LBSNs | |
Tao et al. | Log2intent: Towards interpretable user modeling via recurrent semantics memory unit | |
CN113392179A (zh) | 文本标注方法及装置、电子设备、存储介质 | |
Maurya et al. | Deceptive opinion spam detection approaches: a literature survey | |
CN109740140A (zh) | 页面排版方法、装置和计算机设备 | |
Lin et al. | NL2API: A framework for bootstrapping service recommendation using natural language queries | |
Repke et al. | Extraction and representation of financial entities from text | |
CN116882414B (zh) | 基于大规模语言模型的评语自动生成方法及相关装置 | |
Lotfi et al. | Storytelling with image data: A systematic review and comparative analysis of methods and tools | |
CN112151187B (zh) | 信息查询方法、装置、计算机设备和存储介质 | |
US20210271637A1 (en) | Creating descriptors for business analytics applications | |
WO2023159766A1 (zh) | 餐饮数据分析方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |