CN106599047B - 一种信息的推送方法及装置 - Google Patents

一种信息的推送方法及装置 Download PDF

Info

Publication number
CN106599047B
CN106599047B CN201610989869.2A CN201610989869A CN106599047B CN 106599047 B CN106599047 B CN 106599047B CN 201610989869 A CN201610989869 A CN 201610989869A CN 106599047 B CN106599047 B CN 106599047B
Authority
CN
China
Prior art keywords
behavior
information
user
unit
priority value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610989869.2A
Other languages
English (en)
Other versions
CN106599047A (zh
Inventor
王永琴
王友玲
黄慧滢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MIGU Comic Co Ltd
Original Assignee
MIGU Comic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MIGU Comic Co Ltd filed Critical MIGU Comic Co Ltd
Priority to CN201610989869.2A priority Critical patent/CN106599047B/zh
Publication of CN106599047A publication Critical patent/CN106599047A/zh
Application granted granted Critical
Publication of CN106599047B publication Critical patent/CN106599047B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种信息的推送方法,所述方法包括:根据每个用户的行为获取行为对象的行为信息;根据所述行为信息确定所述行为对象的每个行为的权重值;对所述每个行为的权重值进行排序,生成第一排序结果;确定所述第一排序结果与预设排序结果相同时,根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值;根据所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果;根据用户行为的行为信息在所述第二排序结果中获取与所述用户行为匹配的行为对象,将所述匹配的行为对象作为待推荐信息向所述用户输出。本发明还同时公开了一种信息的推送装置。

Description

一种信息的推送方法及装置
技术领域
本发明涉及信息推送技术,具体涉及一种信息的推送方法及装置。
背景技术
由于目前被广泛使用的信息推送系统通常采用的是基于内容的推荐算法和协同过滤推荐算法;其中,基于内容的推荐算法是指,通过用户购买过的产品的特征,为用户推荐与其购买过的产品相似的产品,基于内容的推荐算法可以对冷启动问题和新加入的产品问题进行处理,因为它不依赖于用户对产品的评分,所以不会受到打分稀疏性的问题。协同过滤算法则是利用用户对产品评分的矩阵,计算用户或产品之间的相似度,利用相似度较高的邻居用户对其他产品进行评分预测,并根据预测评分的高低为目标用户进行推荐。
但是,基于内容的推荐算法存在的缺陷是,无法处理像图形、视频和音乐这种难以分析提取内容特征的商品。而采用协同过滤算法存在的缺陷是,由于每一个用户购买的产品数量通常不到产品总数的1%,容易造成用户对产品的评分矩阵非常稀疏,从而使得推荐结果不佳。
发明内容
为解决现有存在的技术问题,本发明实施例期望提供一种信息的推送方法及装置,能够提高信息推荐的准确性。
本发明实施例的技术方案是这样实现的:
根据本发明实施例的一方面,提供一种信息的推送方法,所述方法包括:
根据每个用户的行为获取行为对象的行为信息;
根据所述行为信息确定所述行为对象的每个行为的权重值;
对所述每个行为的权重值进行排序,生成第一排序结果;确定所述第一排序结果与预设排序结果相同时,根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值;
根据所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果;根据用户行为的行为信息在所述第二排序结果中获取与所述用户行为匹配的行为对象,将所述匹配的行为对象作为待推荐信息向所述用户输出。
上述方案中,在所述将所述匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所述匹配的行为对象进行类型过滤,得到相同类型的行为对象;
将所述相同类型的行为对象作为待推荐信息向所述用户输出。
上述方案中,在所述将所匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所匹配的行为对象进行历史行为过滤,得到所述用户未知的行为对象;
将所述用户未知的行为对象作为待推荐信息向所述用户输出。
上述方案中,在所述将所匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所匹配的行为对象进行黑名单过滤,得到属于所述用户白名单的行为对象;
将属于所述用户白名单的行为对象作为待推荐信息向所述用户输出。
上述方案中,在所述将所匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所匹配的行为对象进行级别过滤,得到推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象;
将所述推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象作为待推荐信息向所述用户输出。
上述方案中,在所述生成第二排序结果之前,所述方法还包括;
根据预设行为对象获取所述预设行为对象的预设优先值;
根据所述预设优先值、所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果。
上述方案中,所述根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值,包括:
根据用户的行为信息确定所述用户的各行为信息的使用数;
根据所述各行为信息的使用数确定各行为信息所对应的行为对象次数;
根据用户的行为信息确定各行为信息的被访问用户数;
根据用户的行为信息确定所述行为对象的被访问用户数;
根据所述用户的各行为信息的使用数、所述各行为信息所对应的行为对象次数、所述各行为信息的被访问用户数和所述行为对象的被访问用户数确定所述行为对象的推荐优先值。
上述方案中,所述根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的协同过滤推荐优先值,包括:
根据所述行为对象的每个行为的行为信息及每个行为的权重值生成评分矩阵;
根据所述评分矩阵在所有的行为对象中确定每个行为对象对应的行为信息的相似度;
根据每个行为对象对应的行为信息的相似度和每个用户的行为信息确定所述行为对象的协同过滤推荐优先值。
根据本发明实施例的另一方面,提供一种信息的推送装置,所述装置包括:
第一获取单元、第一确定单元、第一生成单元、第二确定单元、第二生成单元、第二获取单元和输出单元;
其中,所述第一获取单元,用于根据每个用户的行为获取行为对象的行为信息;
所述第一确定单元,用于根据所述第一获取单元获取到的所述行为信息确定所述行为对象的每个行为的权重值;
所述第一生成单元,用于对所述第一确定单元确定的所述每个行为的权重值进行排序,生成第一排序结果;
所述第二确定单元,用于确定所述第一生成单元生成的所述第一排序结果与预设排序结果相同时,根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值;
所述第二生成单元,用于根据所述第二确定单元确定的所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果;
所述第二获取单元,用于根据用户行为的行为信息在所述第二生成单元生成的所述第二排序结果中获取与所述用户行为匹配的行为对象;
所述输出单元,用于将所述第二获取单元获取到的所述匹配的行为对象作为待推荐信息向所述用户输出。
上述方案中,所述装置还包括:
第一过滤单元,用于对所述第二获取单元获取到的所述匹配的行为对象进行类型过滤,得到相同类型的行为对象;
所述输出单元,具体用于将所述第一过滤单元过滤后的所述相同类型的行为对象作为待推荐信息向所述用户输出。
上述方案中,所述装置还包括:
第二过滤单元,用于对所述第二获取单元获取到的所述匹配的行为对象进行历史行为过滤,得到所述用户未知的行为对象;
所述输出单元,具体用于将所述第二过滤单元过滤后的所述用户未知的行为对象作为待推荐信息向所述用户输出。
上述方案中,所述装置还包括:
第三过滤单元,用于对所述第二获取单元获取到的所述匹配的行为对象进行黑名单过滤,得到属于所述用户白名单的行为对象;
所述输出单元,具体用于将所述第三过滤单元过滤后的属于所述用户白名单的行为对象作为待推荐信息向所述用户输出。
上述方案中,所述装置还包括:
第四过滤单元,用于对所述第二获取单元获取到的所述匹配的行为对象进行级别过滤,得到推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象;
所述输出单元,具体用于将所述第四过滤单元过滤后的所述推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象作为待推荐信息向所述用户输出。
上述方案中,所述装置还包括:
第三获取单元,用于根据预设行为对象获取所述预设行为对象的预设优先值;
所述第二生成单元,具体用于根据所述第三获取单元获取到的所述预设优先值和所述第二确定单元确定的所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果。
上述方案中,所述第二确定单元,具体用于根据用户的行为信息确定所述用户的各行为信息的使用数;
根据所述各行为信息的使用数确定各行为信息所对应的行为对象次数;
根据用户的行为信息确定各行为信息的被访问用户数;
根据用户的行为信息确定所述行为对象的被访问用户数;
根据所述用户的各行为信息的使用数、所述各行为信息所对应的行为对象次数、所述各行为信息的被访问用户数和所述行为对象的被访问用户数确定所述行为对象的推荐优先值。
上述方案中,所述第二确定单元,具体还用于根据所述行为对象的每个行为的行为信息及每个行为的权重值生成评分矩阵;
根据所述评分矩阵在所有的行为对象中确定每个行为对象对应的行为信息的相似度;
根据每个行为对象对应的行为信息的相似度和每个用户的行为信息确定所述行为对象的协同过滤推荐优先值。
本发明实施例提供一种信息推送方法及装置,根据每个用户的行为获取行为对象的行为信息;根据所述行为信息确定所述行为对象的每个行为的权重值;对所述每个行为的权重值进行排序,生成第一排序结果;确定所述第一排序结果与预设排序结果相同时,根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值;根据所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果;根据用户行为的行为信息在所述第二排序结果中获取与所述用户行为匹配的行为对象,将所述匹配的行为对象作为待推荐信息向所述用户输出。如此,通过用户的行为,得到与用户的行为对应的行为对象中每个行为的权重值,基于每个行为的权重值确定出待推荐信息列表并进行发送,提高了推荐结果的准确性。
附图说明
图1为本发明实施例一种信息的推送方法流程示意图;
图2为本发明实施例一种信息的推送装置组成示意图。
具体实施方式
下面结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
图1为本发明实施例一种信息的推送方法流程示意图;如图1所示,所述方法包括:
步骤101,根据每个用户的行为获取行为对象的行为信息;
这里,每个用户的行为是指:用户在上网时对访问对象作出的例如,下载、收藏、点击等动作。所述行为对象的行为信息是指:被访问对象的具体行为名称及行为数量,例如,动漫图书被下载了15次、收藏了10次、点击了50次等。并且所述行为对象可以是一个类别对象,也可以是一个具体的产品对象。当所述行为对象是一个类别对象时,则所述行为对象中还包括多个子行为对象。例如,所述行为对象是动漫类,则在所述动漫类别中还包括有多个具体子动漫产品。
步骤102,根据所述行为信息确定所述行为对象的每个行为的权重值;
这里,可以采用熵值算法计算每个行为的权重值。例如:设有m个用户作为计算每个行为的权重的样本,其中,有n个行为信息对行为对象的推送结果有影响,则根据这m个用户的数据来确定所述行为对象中n个行为信息的权重值。其中,m和n均为自然数,m个用户的数据X的表达式如下:
Figure BDA0001149978210000061
在本发明实施例中,为了避免出现极值对行为对象的推荐结果产生影响,首先,对数据X进行log变换,即x'=log(x+1);然后,再对数据X进行标准化处理,具体地,当数据X是正向指标时,即公式为:
Figure BDA0001149978210000062
其中X取值越大越好;
当数据X是负向指标时,即公式为:
Figure BDA0001149978210000063
其中X取值越小越好;
上述公式中,x′ij代表行为对象的指标值,j代表行为信息,i代表用户。
根据行为对象的指标值x′ij计算所述行为对象的指标值x′ij在行为信息j下出现的概率,用f(xij)表示。具体公式为:
Figure BDA0001149978210000064
最后,利用熵值算法对行为信息j进行熵值ej的计算,具体公式如下:
Figure BDA0001149978210000065
根据计算出的行为信息j的熵值计算行为信息j的权重wj;具体公式如下:
Figure BDA0001149978210000071
如此,可以根据上述公式,可以计算出各行为信息的权重值。例如,计算出各行为信息的权重值为:下载:0.467,收藏:0.353,在线观看:0.135,点击:0.045。
步骤103,对所述每个行为的权重值进行排序,生成第一排序结果;确定所述第一排序结果与预设排序结果相同时,根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值;
这里,在计算出每个行为的权重值后,需对所述权重值进行验证。具体地,对计算出的每个行为的权重值进行升序或降序排列,得到第一排序结果。并将所述第一排序结果与预设排序结果进行比较,若相同,则确定所述权重值验证通过。例如,所述预设排序结果为:下载权重值>收藏权重值>在线观看权重值>点击权重值;而计算出每个行为的权重值的第一排序结果也是:下载权重值>收藏权重值>在线观看权重值>点击权重值。则确定计算出的每个行为的权重值通过验证。然后,根据所述行为对象的每个行为的行为信息以及通过验证后的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值。
在本发明实施例中,所述根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值,包括:
根据用户的行为信息确定所述用户的各行为信息的使用数;
根据所述各行为信息的使用数确定各行为信息所对应的行为对象次数;
根据用户的行为信息确定各行为信息的被访问用户数;
根据用户的行为信息确定所述行为对象的被访问用户数;
根据所述用户的各行为信息的使用数、所述各行为信息所对应的行为对象次数、所述各行为信息的被访问用户数和所述行为对象的被访问用户数确定所述行为对象的推荐优先值。
具体地,根据以下公式计算所述行为对象的推荐优先值。
例如,计算用户u对行为对象i感兴趣的概率p(u,i),公式为:
Figure BDA0001149978210000072
其中,nu,t指用户u使用行为信息t的次数,nt,i是行为信息t对应的行为对象i的次数,
Figure BDA0001149978210000081
为行为信息t被不同用户使用过的次数,
Figure BDA0001149978210000082
为行为对象i被不同用户访问过的次数。
这里,用户可以不参与行为对象中各行为信息的标注,各行为信息均可由系统编辑进行标注,假设系统编辑标注的行为信息都是准确的,则将编辑标注的行为定义为用户对各行为信息的标注行为,如此,使得用户和行为对象之间有了某种行为即:下载、收藏、观看的关联。进而能够得到所述行为对象的推荐优先值。
例如,通过上述公式,得到所述行为对象的推荐优先值为:用户|行为对象如,动漫1,推荐优先值1|动漫2,推荐优先值2|动漫3,推荐优先值3|……。
在本发明实施例中,所述根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的协同过滤推荐优先值,包括:
根据所述行为对象的每个行为的行为信息及每个行为的权重值生成评分矩阵;
根据所述评分矩阵在所有的行为对象中确定每个行为对象对应的行为信息的相似度;
根据每个行为对象对应的行为信息的相似度和每个用户的行为信息确定所述行为对象的协同过滤推荐优先值。
这里,根据所述行为对象的每个行为的行为信息及每个行为的权重值生成评分矩阵的公式为:score(xi)=wj*log(xij+1);
其中,score(xi)为用户i的分值,xij为用户i的第j种行为的次数,wj为第j种行为的权重。
然后,根据score(xi)计算行为对象之间的相似度。
在本发明实施例中,基于产品的协同过滤(ItemCF,ItemCollaborationFilter)算法计算行为对象之间的相似度。具体地,行为对象之间的相似度通过向量间的余弦夹角度量,夹角越小则说明行为对象之间的相似度越高,具体公式如下:
Figure BDA0001149978210000083
其中,sim(i,j)代表行为对象之间的相似度,向量
Figure BDA0001149978210000084
Figure BDA0001149978210000085
分别表示用户u在行为对象i、行为对象j上的评分。例如,所述行为对象为图书,则上述公式中,i代表图书目录中的每本图书,c代表访问过图书i的每位用户,j代表由用户c所访问过的每本图书,并记录每一用户所访问的图书i和j,根据记录的每一用户所访问的图书i和j,计算图书i和j之间的相似度,最后输出相似度值sim(i,j)。
根据每个行为对象对应的行为信息的相似度和每个用户的行为信息确定所述行为对象的协同过滤推荐优先值,具体公式为:
Figure BDA0001149978210000091
其中,U代表用户对行为对象i、行为对象j均有评分的用户集合,Ru,i和Ru,j分别表示用户u对i,j的喜好程度;log1+|N(u)|是为了降低深度用户对计算行为对象之间相似度的影响。
具体计算方式为:首先找出用户集合U中每个用户ua的评分集合Iua={i,j,…,k},然后根据该评分集合计算得到集合I中行为对象i的最近的邻近行为对象作为候选行为对象集合C,并且从中除去目标用户ua已经访问过的行为对象。对于集合C中的每个备选行为对象c,预测目标用户ua对其的评分,根据评分排序,选出其中的前N个行为对象数据,作为行为对象的协同过滤推荐优先值。
在本发明实施例中,预测目标用户ua对行为对象ia的评分公式如下:
Figure BDA0001149978210000092
其中,m为用户ua操作过的行为对象集合
Figure BDA0001149978210000093
中的最邻近行为对象集合Im,其标准是ia与ib之间的相似度sim(ia,ib)大于设定的某个阈值s,即所有满足sim(ia,ib)>s的行为对象集合m,则这里ib需遍历行为对象ia的经过最邻近行为对象比较之后的最邻近行为对象集合Im
Figure BDA0001149978210000094
为用户ua对于行为对象ib的评分。
计算目标用户ua对所有未操作过的行为对象预测评分p(ua,ia),ia遍历备选行为对象集合
Figure BDA0001149978210000095
中每个行为对象后形成的所有用户ua未操作行为对象的预测评分,通过评分对行为对象进行排序,根据排序情况对行为对象选前N个进行推荐。
步骤104,根据所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果;根据用户行为的行为信息在所述第二排序结果中获取与所述用户行为匹配的行为对象,将所述匹配的行为对象作为待推荐信息向所述用户输出。
这里,根据所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行降序排列,并生成第二排序结果。然后根据用户行为的行为信息在所述第二排序结果中选择前N个与所述用户行为匹配的行为对象进行推送。其中,N≥1。
在本发明实施例中,还可以根据行为对象的预设数据流行度或宣传度的数据对所述第二排序结果中的数据进行修正,然后根据用户行为的行为信息在修正后的排序结果中选择前N个与所述用户行为匹配的行为对象进行推送。其中,N≥1。
在本发明实施例中,在计算用户对行为对象的喜好程度时,可能需要对不同的行为信息数据进行加权计算。但是,不同行为信息的数据取舍相差很大,比如,用户的点击数据必然比购买数据大的多,如何将各个行为信息的数据统一在一个相同的取值范围中,从而使得加权求和得到的总体喜好更加精确,就需要我们对行为对象中各行为信息数据进行归一化处理。最简单的归一化处理,就是将行为对象中各行为信息数据除以所述行为对象中行为信息数据最大的值,
以保证归一化后的数据取值在0,1范围中。具体归一化处理的公式为:
Figure BDA0001149978210000101
在所述生成第二排序结果之前,所述方法还包括;
根据预设行为对象获取所述预设行为对象的预设优先值;
根据所述预设优先值、所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果。
这里,所述预设行为对象是指强烈推荐或是必须推荐的行为对象。例如,新上映的电影、新出版的书等。
在本发明实施例中,在所述将所述匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所述匹配的行为对象进行类型过滤,得到相同类型的行为对象;
将所述相同类型的行为对象作为待推荐信息向所述用户输出。
例如,待推荐行为对象为动画类,则将第二排序结果中将非动画类的行为对象过滤掉,仅保留动画类的行为对象并向用户输出。
在本发明实施例中,在所述将所匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所匹配的行为对象进行历史行为过滤,得到所述用户未知的行为对象;
将所述用户未知的行为对象作为待推荐信息向所述用户输出。
这里,根据用户的行为的行为信息得到用户的历史行为对象,将所述历史行为对象从所述第二排序结果中过滤掉,仅保留用户未知的行为对象进行推送。
在本发明实施例中,在所述将所匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所匹配的行为对象进行黑名单过滤,得到属于所述用户白名单的行为对象;
将属于所述用户白名单的行为对象作为待推荐信息向所述用户输出。
这里,根据用户的行为的行为信息,确定用户明确表示不喜欢、不关心的行为对象,将用户明确表示不喜欢、不关心的行为对象从第二排序结果中过滤掉,仅保留用户的白名单行为对象向所述用户推送。
在本发明实施例中,在所述将所匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所匹配的行为对象进行级别过滤,得到推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象;
将所述推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象作为待推荐信息向所述用户输出。
这里,主要是指将第二排序结果中,优先值低于预设阈值的行为对象过滤掉,因为低于预设阈值的行为对象表示喜欢该产品的用户极少,即便推送也不会被用户所喜欢的行为对象,所述仅保留优先值高于预设阈值的行为对象向所述用户推送。
如此,通过本发明实施例,使得推送对象更有针对性,不会因数据稀疏或者用户评分尺度不一致等问题而影响推送结果。
图2为本发明实施例一种信息的推送装置组成示意图,如图2所示,所述装置包括:
第一获取单元201、第一确定单元202、第一生成单元203、第二确定单元204、第二生成单元205、第二获取单元206和输出单元207;
其中,所述第一获取单元201,用于根据每个用户的行为获取行为对象的行为信息;
所述第一确定单元202,用于根据所述第一获取单元201获取到的所述行为信息确定所述行为对象的每个行为的权重值;
所述第一生成单元203,用于对所述第一确定单元202确定的所述每个行为的权重值进行排序,生成第一排序结果;
所述第二确定单元204,用于确定所述第一生成单元203生成的所述第一排序结果与预设排序结果相同时,根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值;
所述第二生成单元205,用于根据所述第二确定单元204确定的所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果;
所述第二获取单元206,用于根据用户行为的行为信息在所述第二生成单元205生成的所述第二排序结果中获取与所述用户行为匹配的行为对象;
所述输出单元207,用于将所述第二获取单元206获取到的所述匹配的行为对象作为待推荐信息向所述用户输出。
这里,每个用户的行为是指:用户在上网时对访问对象作出的动作,例如,下载、收藏、点击等动作。所述行为信息为:具体的行为名称及行为数量,例如,下载有15次、收藏有10次、点击有50次等。所述第一获取单元201根据每个用户的行为获取行为对象的行为信息。所述行为对象可以是一个类别对象,也可以是一个具体的产品对象。当所述行为对象是一个类别对象时,则所述行为对象中还包括多个子行为对象。例如,所述行为对象是动漫,则在所述动漫类别中还包括有多个具体地子动漫产品。
待所述第一获取单元201根据每个用户的行为获取到行为对象的行为信息后,触发所述第一确定单元202,由所述第一确定单元202采用熵值算法计算每个行为的权重。这里,具体计算每个行为的权重方法请参照方法实施例中的相关描述。
在所述第一确定单元201确定出每个行为的权重后,所述第一生成单元203对所述特征权重值进行验证,具体地,所述第一生成单元203先对所述第一确定单元202确定的每个行为的特征权重值进行升序或降序排列,得到第一排序结果。然后将所述第一排序结果与预设排序结果进行比较,若相同,则确定所述权重值验证通过。例如,所述预设排序结果为:下载权重值>收藏权重值>在线观看权重值>点击权重值;所述第一生成单元203检测到第一排序结果也是:下载权重值>收藏权重值>在线观看权重值>点击权重值。则确定所述第一确定单元202确定的每个行为的权重值通过验证。然后所述第一生成单元203触发所述第二确定单元204,由所述第二确定单元204根据所述行为对象的每个行为的行为信息以及通过验证后的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值。
具体地,由所述第二确定单元204先根据用户的行为信息确定所述用户中各行为的行为信息使用数;再根据所述各行为的行为信息使用数确定各行为所对应的行为对象次数;再根据用户的行为信息确定各行为的行为信息的访问用户数;再根据用户的行为信息确定所述行为对象的访问用户数;最后根据所述用户中各行为的行为信息使用数、所述各行为所对应的行为对象次数、所述各行为的行为信息的访问用户数和所述行为对象的访问用户数确定所述行为对象的推荐优先值。具体计算所述行为对象的推荐优先值的方法请参照方法实施例中的相关描述。
在本发明实施例中,所述第二确定单元204,具体还用于根据所述行为对象的每个行为的行为信息及每个行为的权重值生成评分矩阵;再根据所述评分矩阵在所有的行为对象中确定每个行为对象对应的行为信息的相似度;最后再根据每个行为对象对应的行为信息的相似度和每个用户的行为信息确定所述行为对象的协同过滤推荐优先值。具体计算所述行为对象的协同过滤推荐优先值的方法请参照方法实施例中的相关描述。
待所述第二确定单元204确定出所述行为对象的推荐优先值和协同过滤推荐优先值后,触发所述第二生成单元205,并由所述第二生成单元205根据所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行降序排列,并生成第二排序结果。然后由所述第二获取单元206根据用户行为的行为信息在所述第二生成单元205生成的所述第二排序结果中获取与所述用户行为匹配的前N个行为对象,并由所述输出单元207输出到用户端。其中,N≥1。
在本发明实施例中,所述第二生成单元205还可以根据行为对象的预设数据流行度或宣传度的数据对所述第二排序结果中的数据进行修正,然后根据用户行为的行为信息在修正后的排序结果中选择前N个与所述用户行为匹配的行为对象,并由所述输出单元207向用户端输出。其中,N≥1。
在本发明实施例中,在确定用户对行为对象的喜好程度时,可能需要对不同的行为信息数据进行加权计算。但是,不同行为信息的数据取舍相差很大,比如,用户的点击数据必然比购买数据大的多,如何将各个行为信息的数据统一在一个相同的取值范围中,从而使得加权求和得到的总体喜好更加精确,就需要我们对行为对象中各行为信息数据进行归一化处理。最简单的归一化处理,就是将行为对象中各行为信息数据除以所述行为对象中行为信息数据最大的值,
以保证归一化后的数据取值在0,1范围中。具体归一化处理的公式为:
Figure BDA0001149978210000141
在本发明实施例中,所述装置还包括第三获取单元(图中未显示),用于根据预设行为对象获取所述预设行为对象的预设优先值;所述第二生成单元205,具体用于根据所述第三获取单元获取到的所述预设优先值和所述第二确定单元204确定的所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果。
这里,所述预设行为对象是指强烈推荐或是必须推荐的行为对象。例如,新上映的电影、新出版的书等。
在本发明实施例中,所述装置还包括:第一过滤单元208、第二过滤单元209、第三过滤单元210和第四过滤单元211,其中,所述第一过滤单元208,用于对所述第二获取单元206获取到的所述匹配的行为对象进行类型过滤,得到相同类型的行为对象;所述输出单元207,具体用于将所述第一过滤单元208过滤后的所述相同类型的行为对象作为待推荐信息向所述用户输出。例如,待推荐行为对象为动画类,则将第二排序结果中将非动画类的行为对象过滤掉,仅保留动画类的行为对象并向用户输出。
所述第二过滤单元209,对所匹配的行为对象进行历史行为过滤,得到所述用户未知的行为对象;所述输出单元207将所述第二过滤单元209过滤后的所述用户未知的行为对象作为待推荐信息向所述用户输出。
这里,所述第二过滤单元209根据用户的行为的行为信息得到用户的历史行为对象,将所述历史行为对象从所述第二排序结果中过滤掉,仅保留用户未知的行为对象并由所述输出单元207进行输出。
所述第三过滤单无210,用于对所匹配的行为对象进行黑名单过滤,得到属于所述用户白名单的行为对象;所述输出单元207将所述第三过滤单无210过滤后的属于所述用户白名单的行为对象作为待推荐信息向所述用户输出。
这里,所述第三过滤单无210根据用户的行为的行为信息,确定用户明确表示不喜欢、不关心的行为对象,将用户明确表示不喜欢、不关心的行为对象从第二排序结果中过滤掉,仅保留用户的白名单行为对象由所述输出单元207向所述用户输出。
所述第四过滤单元211,用于对所匹配的行为对象进行级别过滤,得到推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象;所述输出单元207将所述推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象作为待推荐信息向所述用户输出。
这里,主要是指将第二排序结果中,优先值低于预设阈值的行为对象过滤掉,因为低于预设阈值的行为对象表示喜欢该产品的用户极少,即便推送也不会被用户所喜欢的行为对象,所以,仅保留优先值高于预设阈值的行为对象由所述输出单元207向所述用户输出。
在本发明实施例中,所述第一过滤单元208、所述第二过滤单元209、所述第三过滤单元210、所述第四过滤单元211也可以合并成一个总的过滤单元进行处理;或者所述第一过滤单元208、所述第二过滤单元209、所述第三过滤单元210、所述第四过滤单元211也可以交叉结合进行处理。
与现有技术相比,本发明实施例不仅将用户的行为特征权重纳入信息推荐的计算之中,而且还将推荐分和编辑推荐分纳入信息推荐总分的计算之中,如此避免了仅有协同过滤和仅有内容过滤的缺点,使得推荐结果更为准确。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装所设置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (14)

1.一种信息的推送方法,其特征在于,所述方法包括:
根据每个用户的行为获取行为对象的行为信息;
根据所述行为信息确定所述行为对象的每个行为的权重值;
对所述每个行为的权重值进行排序,生成第一排序结果;确定所述第一排序结果与预设排序结果相同时,根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值;
根据所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果;根据用户行为的行为信息在所述第二排序结果中获取与所述用户行为匹配的行为对象,将所述匹配的行为对象作为待推荐信息向所述用户输出;
所述根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的协同过滤推荐优先值,包括:
根据所述行为对象的每个行为的行为信息及每个行为的权重值生成评分矩阵;
根据所述评分矩阵在所有的行为对象中确定每个行为对象对应的行为信息的相似度;
根据每个行为对象对应的行为信息的相似度和每个用户的行为信息确定所述行为对象的协同过滤推荐优先值。
2.根据权利要求1所述的方法,其特征在于,在所述将所述匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所述匹配的行为对象进行类型过滤,得到相同类型的行为对象;
将所述相同类型的行为对象作为待推荐信息向所述用户输出。
3.根据权利要求1所述的方法,其特征在于,在所述将所匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所匹配的行为对象进行历史行为过滤,得到所述用户未知的行为对象;
将所述用户未知的行为对象作为待推荐信息向所述用户输出。
4.根据权利要求1所述的方法,其特征在于,在所述将所匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所匹配的行为对象进行黑名单过滤,得到属于所述用户白名单的行为对象;
将属于所述用户白名单的行为对象作为待推荐信息向所述用户输出。
5.根据权利要求1所述的方法,其特征在于,在所述将所匹配的行为对象作为待推荐信息向所述用户输出之前,所述方法还包括:
对所匹配的行为对象进行级别过滤,得到推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象;
将所述推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象作为待推荐信息向所述用户输出。
6.根据权利要求1所述的方法,其特征在于,在所述生成第二排序结果之前,所述方法还包括;
根据预设行为对象获取所述预设行为对象的预设优先值;
根据所述预设优先值、所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果。
7.根据权利要求1所述的方法,其特征在于,所述根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值,包括:
根据用户的行为信息确定所述用户的各行为信息的使用数;
根据所述各行为信息的使用数确定各行为信息所对应的行为对象次数;
根据用户的行为信息确定各行为信息的被访问用户数;
根据用户的行为信息确定所述行为对象的被访问用户数;
根据所述用户的各行为信息的使用数、所述各行为信息所对应的行为对象次数、所述各行为信息的被访问用户数和所述行为对象的被访问用户数确定所述行为对象的推荐优先值。
8.一种信息的推送装置,其特征在于,所述装置包括:
第一获取单元、第一确定单元、第一生成单元、第二确定单元、第二生成单元、第二获取单元和输出单元;
其中,所述第一获取单元,用于根据每个用户的行为获取行为对象的行为信息;
所述第一确定单元,用于根据所述第一获取单元获取到的所述行为信息确定所述行为对象的每个行为的权重值;
所述第一生成单元,用于对所述第一确定单元确定的所述每个行为的权重值进行排序,生成第一排序结果;
所述第二确定单元,用于确定所述第一生成单元生成的所述第一排序结果与预设排序结果相同时,根据所述行为对象的每个行为的行为信息及每个行为的权重值确定所述行为对象的推荐优先值和协同过滤推荐优先值;
所述第二生成单元,用于根据所述第二确定单元确定的所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果;
所述第二获取单元,用于根据用户行为的行为信息在所述第二生成单元生成的所述第二排序结果中获取与所述用户行为匹配的行为对象;
所述输出单元,用于将所述第二获取单元获取到的所述匹配的行为对象作为待推荐信息向所述用户输出;
所述第二确定单元,具体还用于根据所述行为对象的每个行为的行为信息及每个行为的权重值生成评分矩阵;
根据所述评分矩阵在所有的行为对象中确定每个行为对象对应的行为信息的相似度;
根据每个行为对象对应的行为信息的相似度和每个用户的行为信息确定所述行为对象的协同过滤推荐优先值。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一过滤单元,用于对所述第二获取单元获取到的所述匹配的行为对象进行类型过滤,得到相同类型的行为对象;
所述输出单元,具体用于将所述第一过滤单元过滤后的所述相同类型的行为对象作为待推荐信息向所述用户输出。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第二过滤单元,用于对所述第二获取单元获取到的所述匹配的行为对象进行历史行为过滤,得到所述用户未知的行为对象;
所述输出单元,具体用于将所述第二过滤单元过滤后的所述用户未知的行为对象作为待推荐信息向所述用户输出。
11.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第三过滤单元,用于对所述第二获取单元获取到的所述匹配的行为对象进行黑名单过滤,得到属于所述用户白名单的行为对象;
所述输出单元,具体用于将所述第三过滤单元过滤后的属于所述用户白名单的行为对象作为待推荐信息向所述用户输出。
12.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第四过滤单元,用于对所述第二获取单元获取到的所述匹配的行为对象进行级别过滤,得到推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象;
所述输出单元,具体用于将所述第四过滤单元过滤后的所述推荐优先值和协同过滤推荐优先值之和达到预设阈值的行为对象作为待推荐信息向所述用户输出。
13.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第三获取单元,用于根据预设行为对象获取所述预设行为对象的预设优先值;
所述第二生成单元,具体用于根据所述第三获取单元获取到的所述预设优先值和所述第二确定单元确定的所述推荐优先值和所述协同过滤推荐优先值之和对所有行为对象进行排序,生成第二排序结果。
14.根据权利要求8所述的装置,其特征在于,所述第二确定单元,具体用于根据用户的行为信息确定所述用户的各行为信息的使用数;
根据所述各行为信息的使用数确定各行为信息所对应的行为对象次数;
根据用户的行为信息确定各行为信息的被访问用户数;
根据用户的行为信息确定所述行为对象的被访问用户数;
根据所述用户的各行为信息的使用数、所述各行为信息所对应的行为对象次数、所述各行为信息的被访问用户数和所述行为对象的被访问用户数确定所述行为对象的推荐优先值。
CN201610989869.2A 2016-11-10 2016-11-10 一种信息的推送方法及装置 Active CN106599047B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610989869.2A CN106599047B (zh) 2016-11-10 2016-11-10 一种信息的推送方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610989869.2A CN106599047B (zh) 2016-11-10 2016-11-10 一种信息的推送方法及装置

Publications (2)

Publication Number Publication Date
CN106599047A CN106599047A (zh) 2017-04-26
CN106599047B true CN106599047B (zh) 2020-08-18

Family

ID=58590186

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610989869.2A Active CN106599047B (zh) 2016-11-10 2016-11-10 一种信息的推送方法及装置

Country Status (1)

Country Link
CN (1) CN106599047B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107479858A (zh) * 2017-07-12 2017-12-15 深圳市嘉德永丰开发科技股份有限公司 一种人机交互系统工作时序的智能处理方法
CN108038732A (zh) * 2017-12-25 2018-05-15 北京比利信息技术有限公司 一种品牌广告运营方法及装置
CN110110205A (zh) * 2018-01-16 2019-08-09 北京京东金融科技控股有限公司 推荐信息生成方法与装置
CN110472645A (zh) * 2018-05-09 2019-11-19 北京京东尚科信息技术有限公司 一种选择目标对象的方法和装置
CN111210290A (zh) * 2018-11-21 2020-05-29 北京京东尚科信息技术有限公司 排序方法、装置和计算机可读存储介质
CN110209927B (zh) * 2019-04-25 2020-12-04 北京三快在线科技有限公司 个性化推荐方法、装置、电子设备及可读存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739416A (zh) * 2008-11-04 2010-06-16 未序网络科技(上海)有限公司 多指标综合权重视频排序方法
US8631017B2 (en) * 2010-12-16 2014-01-14 Hewlett-Packard Development, L.P. Collaborative filtering with hashing
US8869208B2 (en) * 2011-10-30 2014-10-21 Google Inc. Computing similarity between media programs
EP2645324A1 (en) * 2012-03-30 2013-10-02 Sony Corporation Method for recommending items and recommendation system
CN103544188B (zh) * 2012-07-17 2017-03-29 中国移动通信集团广东有限公司 移动互联网内容的用户偏好推送方法与装置
CN103714084B (zh) * 2012-10-08 2018-04-03 腾讯科技(深圳)有限公司 推荐信息的方法和装置
CN103514239B (zh) * 2012-11-26 2016-12-21 Tcl美国研究所 一种集成用户行为和物品内容的推荐方法及系统

Also Published As

Publication number Publication date
CN106599047A (zh) 2017-04-26

Similar Documents

Publication Publication Date Title
CN106599047B (zh) 一种信息的推送方法及装置
CN109829775B (zh) 一种物品推荐方法、装置、设备及可读存储介质
CN108829808B (zh) 一种页面个性化排序方法、装置及电子设备
CN105095508B (zh) 一种多媒体内容推荐方法和多媒体内容推荐装置
CN108304512B (zh) 一种视频搜索引擎粗排序方法、装置及电子设备
CN101281540B (zh) 用于处理信息的设备、方法和计算机程序
CN110598086B (zh) 文章推荐方法、装置、计算机设备及存储介质
CN110532479A (zh) 一种信息推荐方法、装置及设备
CN107153656B (zh) 一种信息搜索方法和装置
CN109189990B (zh) 一种搜索词的生成方法、装置及电子设备
CN110704674A (zh) 一种视频播放完整度预测方法及装置
CN110197404B (zh) 可降低流行度偏差的个性化长尾商品推荐方法和系统
CN110737859A (zh) 一种up主匹配方法及装置
CN109446402B (zh) 一种搜索方法及装置
CN111444380B (zh) 音乐搜索排序方法、装置、设备和存储介质
CN113239182A (zh) 一种文章推荐方法、装置、计算机设备及存储介质
CN107133811A (zh) 一种目标用户的识别方法和装置
CN114581165A (zh) 一种产品推荐方法、装置、计算机存储介质及系统
CN113065067A (zh) 一种物品推荐方法、装置、计算机设备及存储介质
CN112163415A (zh) 针对反馈内容的用户意图识别方法、装置及电子设备
CN112733006A (zh) 用户画像的生成方法、装置、设备及存储介质
CN113836412B (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN116340610A (zh) 一种实时推荐方法及装置
CN114003772A (zh) 一种视频搜索方法、装置、电子设备及存储介质
CN109886353B (zh) 信息推荐方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant