CN102929964B - 一种网址推送方法及系统 - Google Patents

一种网址推送方法及系统 Download PDF

Info

Publication number
CN102929964B
CN102929964B CN201210385094.XA CN201210385094A CN102929964B CN 102929964 B CN102929964 B CN 102929964B CN 201210385094 A CN201210385094 A CN 201210385094A CN 102929964 B CN102929964 B CN 102929964B
Authority
CN
China
Prior art keywords
network address
user
collection
group
support
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210385094.XA
Other languages
English (en)
Other versions
CN102929964A (zh
Inventor
张文战
贾春鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing duxiaoman Youyang Technology Co.,Ltd.
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210385094.XA priority Critical patent/CN102929964B/zh
Publication of CN102929964A publication Critical patent/CN102929964A/zh
Application granted granted Critical
Publication of CN102929964B publication Critical patent/CN102929964B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种网址推送方法,包括:收到用户收藏网址的请求时,依据预先生成的所述用户所在社区的网址关联规则字典,获取用户请求收藏的网址的关联网址,将所述关联网址推送给用户;其中,所述网址关联规则字典包括网址与关联网址的对应关系;本发明还提供一种网址推送系统。根据本发明提供的技术方案,能够主动向网址导航的用户推送网址,提高网址导航中网址获取效率。

Description

一种网址推送方法及系统
【技术领域】
本发明涉及互联网应用领域,尤其涉及一种网址推送方法及系统。
【背景技术】
目前,互联网中已有230万个网站,而用户了解网站的途径却十分有限,大部分用户是通过网址导航获取网址。网址导航指的是一个集合较多网址,并按照一定条件进行分类的网址站,网址导航能够方便用户快速找到需要的网站,而且用户不需要记住各类网站的网址,就可以直接进到所需的网站。
现有的网址导航中,大多依据竞价排名等方式显示网站,导致网址的布局受到很大干扰,使得用户不能在网址导航中较快找到感兴趣的网站或关注度较高的网站,增加用户操作量,查找效率较低,严重影响用户体验。因此为了避免用户在网址导航中查找网址,可以向用户主动推荐网址,但是目前没有向网址导航中用户推荐网址的技术方案。
【发明内容】
本发明提供了一种网址推送方法及系统,能够主动向网址导航的用户推送网址,提高网址导航中网址获取效率。
本发明的具体技术方案如下:
根据本发明一优选实施例,一种网址推送方法,包括:
收到用户收藏网址的请求时,依据预先生成的所述用户所在社区的网址关联规则字典,获取用户请求收藏的网址的关联网址,将所述关联网址推送给用户;其中,所述网址关联规则字典包括网址与关联网址的对应关系。
上述方法中,该方法还包括:
依据预先存储的用户行为数据,创建二维矩阵;所述用户行为数据包括:用户ID、用户收藏的网址和用户收藏的网址的类型;所述二维矩阵为用户ID与用户收藏的每个类型的网址个数的对应关系;
依据所述用户行为数据和所述二维矩阵计算得到用户之间的相似性数据,将相似性数据大于预设的相似度阈值的用户归为同一个社区。
上述方法中,所述依据所述用户行为数据和所述二维矩阵计算得到用户之间的相似性数据为:
利用如下公式依次计算所有用户中每两个用户之间的相似性数据:
其中,sin(uc,un)表示用户uc和用户un之间的相似性数据,表示用户uc收藏的类型为i的网址的个数,表示用户un收藏的类型为i的网址的个数,{i∈Ic∩In}表示类型为i的网址是用户uc和用户un收藏的网址中具有相同类型的网址,表示用户uc收藏的各类型的网址的个数的平均值,表示用户un收藏的各类型的网址的个数的平均值。
上述方法中,所述网址关联规则字典采用以下方法生成:
计算用户收藏网址A条件下也收藏网址B的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址B;
或,计算用户收藏网址A条件下也收藏网址组C的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址组C中的所有网址;
或,计算用户收藏网址组C条件下也收藏网址A的置信度,当所述置信度大于预设的置信度阈值时,确定网址组C的关联网址为网址A。
上述方法中,
所述用户收藏网址A条件下也收藏网址B的置信度为:所述网址A和网址B组成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址A条件下也收藏网址组C的置信度为:所述网址A和网址组C构成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址组C条件下也收藏网址A的置信度为:所述网址A和网址组C构成的网址组的支持度与网址组C的支持度的比值;
其中,网址的支持度为:所述社区中收藏该网址的用户数量与所述社区的用户总数的比值;网址组的支持度为:所述社区中同时收藏所述网址组中所有网址的用户数量与所述社区的用户总量的比值。
上述方法中,该方法还包括:
过滤掉支持度小于预设支持度阈值的网址和网址组,保留支持度大于或等于预设支持度阈值的网址和网址组用于所述置信度的计算。
上述方法中,针对包含不同数量网址的网址组采用不同的支持度阈值,其中包含网址的数量越大采用的支持度阈值越小。
上述方法中,所述将所述关联网址推送给用户,具体为:
当所述网址关联规则字典中包括用户请求收藏的网址对应的关联网址,将所述关联网址推送到前端,前端将所述关联网址显示给用户;
或,当所述网址关联规则字典中包括用户请求收藏的网址与其他网址的组合对应的关联网址,且所述其他网址为用户已经收藏的网址时,将用户请求收藏的网址与其他网址的组合对应的关联网址推送到前端,前端将所述关联网址显示给用户。
一种网址推送系统,包括:生成单元和推送单元;其中,
生成单元,用于预先生成社区的网址关联规则字典,所述网址关联规则字典包括网址与关联网址的对应关系;
推送单元,用于收到用户收藏网址的请求时,依据所述用户所在社区的网址关联规则字典,获取用户请求收藏的网址的关联网址;将所述关联网址推送给用户。
上述系统中,该系统还包括:
数据处理单元,用于依据预先存储的用户行为数据,创建二维矩阵;所述用户行为数据包括:用户ID、用户收藏的网址和用户收藏的网址的类型;所述二维矩阵为用户ID与用户收藏的每个类型的网址个数的对应关系;
计算单元,用于依据所述用户行为数据和所述二维矩阵计算得到用户之间的相似性数据,将相似性数据大于预设的相似度阈值的用户归为同一个社区。
上述系统中,所述计算单元依据所述用户行为数据和所述二维矩阵计算得到用户之间的相似性数据,具体为:
利用如下公式依次计算所有用户中每两个用户之间的相似性数据:
其中,sin(uc,un)表示用户uc和用户un之间的相似性数据,表示用户uc收藏的类型为i的网址的个数,表示用户un收藏的类型为i的网址的个数,{i∈Ic∩In}表示类型为i的网址是用户uc和用户un收藏的网址中具有相同类型的网址,表示用户uc收藏的各类型的网址的个数的平均值,表示用户un收藏的各类型的网址的个数的平均值。
上述系统中,所述生成单元预先生成所述用户所在社区的网址关联规则字典,具体为:
计算用户收藏网址A条件下也收藏网址B的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址B;
或,计算用户收藏网址A条件下也收藏网址组C的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址组C中的所有网址;
或,计算用户收藏网址组C条件下也收藏网址A的置信度,当所述置信度大于预设的置信度阈值时,确定网址组C的关联网址为网址A。
上述系统中,
所述用户收藏网址A条件下也收藏网址B的置信度为:所述网址A和网址B组成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址A条件下也收藏网址组C的置信度为:所述网址A和网址组C构成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址组C条件下也收藏网址A的置信度为:所述网址A和网址组C构成的网址组的支持度与网址组C的支持度的比值;
其中,网址的支持度为:所述社区中收藏该网址的用户数量与所述社区的用户总数的比值;网址组的支持度为:所述社区中同时收藏所述网址组中所有网址的用户数量与所述社区的用户总量的比值。
上述系统中,生成单元,还用于过滤掉支持度小于预设支持度阈值的网址和网址组,保留支持度大于或等于预设支持度阈值的网址和网址组用于所述置信度的计算。
上述系统中,针对包含不同数量网址的网址组采用不同的支持度阈值,其中包含网址的数量越大采用的支持度阈值越小。
上述系统中,所述推送单元将所述关联网址推送给用户,具体为:
当所述网址关联规则字典中包括用户请求收藏的网址对应的关联网址,将所述关联网址推送到前端,前端将所述关联网址显示给用户;
或,当所述网址关联规则字典中包括用户请求收藏的网址与其他网址的组合对应的关联网址,且所述其他网址为用户已经收藏的网址时,将用户请求收藏的网址与其他网址的组合对应的关联网址推送到前端,前端将所述关联网址显示给用户。
由以上技术方案可以看出,本发明提供的具有以下有益效果:
本发明优选实施例中,依据与用户同一个社区的所有用户收藏的网址,有针对性的向用户推荐网址,解决目前不能实现向网址导航中用户推荐网址的问题,提高网址导航中网址获取效率,使得网址导航更加智能化。
【附图说明】
图1是本发明实现网址推送方法的优选实施例的流程示意图;
图2是本发明实现网址推送系统的优选实施例的结构示意图。
【具体实施方式】
本发明的基本思想是:收到用户收藏网址的请求时,依据预先生成的所述用户所在社区的网址关联规则字典,获取用户请求收藏的网址的关联网址,将所述关联网址推送给用户;其中,所述网址关联规则字典包括网址与关联网址的对应关系。
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
本发明提供一种网址推送方法,图1是本发明实现网址推送方法的优选实施例的流程示意图,如图1所示,该优选实施例包括以下步骤:
步骤101,依据预先存储的用户行为数据,创建二维矩阵,依据用户行为数据和二维矩阵计算得到用户之间的相似性数据,将相似性数据大于相似度阈值的用户归为同一个社区;所述用户行为数据包括:用户ID、用户收藏的网址、用户收藏的网址的类型,所述二维矩阵为用户ID与用户收藏的每个类型的网址个数的对应关系。
具体的,创建一个二维矩阵,该二维矩阵用于存储用户ID与用户收藏的每个类型的网址个数的对应关系,该二维矩阵的水平方向的数据为用户ID,垂直方向的数据为用户收藏的每个类型的网址个数,将创建的二维矩阵存储在数据库中;本优选实施例中,所述用户为网址导航的注册用户,在登录网址导航后,用户可以依据需求收藏不同类型的网址。
依据数据库中预先存储的用户行为数据,填充所述二维矩阵,所述用户行为数据包括:用户ID、用户收藏的网址、用户收藏的网址的类型;其中,用户行为数据中用户收藏的网址的类型可以是用户自定义的类型,也可以是依据网址导航中提供的网址分类字典中网址与类型的对应关系确定的类型;依据用户行为数据中用户收藏的网址的类型,填充二维矩阵中垂直方向的数据;本优选实施例中,所述网址分类字典中可以有以下类型的网址:综合类、贴吧类、社区类、购物类、游戏类、阅读类、体育类、影视类、音乐类、理财类、工具类、其他等;例如,填充数据后的二维矩阵可以如表1所示:
表1
依据数据库中存储的用户行为数据以及二维矩阵中的数据,并利用如下公式依次计算所有用户中每两个用户之间的相似性数据:
上述公式中,sin(uc,un)表示用户uc与用户un之间的相似性数据,表示用户uc的向量,表示用户un的向量,表示用户uc收藏的类型为i的网址的权重,其由用户uc收藏的类型为i的网址的个数确定,在此可以直接采用个数值,表示用户un收藏的类型为i的网址的权重,其由用户un收藏的类型为i的网址的个数确定,在此可以直接采用个数值,{i∈Ic∩In}表示类型为i的网址是用户uc和用户un收藏的网址中具有相同类型的网址,表示用户uc收藏的各类型的网址的权重平均值,可以采用用户uc收藏的各类型的网址的个数的平均值,表示用户un收藏的各类型的网址的权重平均值,可以采用用户un收藏的各类型的网址的个数的平均值。
两个用户之间的相似性数据越大,表示这两个用户的相似度越高,将计算得到的两个用户之间的相似性数据与预设的相似性阈值进行比较,相似性数据大于相似性阈值的两个用户为同一类用户,将相似性数据大于相似性阈值的两个用户归为同一个社区;例如,用户uc与用户un之间的相似性数据大于相似性阈值0.5,则用户uc与用户un为同一类用户,将用户uc与用户un归为同一个社区;在数据库中存储社区用户数据,该社区用户数据包括社区标识、每个社区中所有用户的用户ID,以及计算得到的社区中每个用户与同一个社区的其他用户之间的相似性数据。
步骤102,依据社区中所有用户收藏的网址,计算得到网址的支持度和网址组的支持度,依据得到的网址的支持度和网址组的支持度生成两个以上网址集合。
具体的,依据社区用户数据得到社区中所有用户的用户ID,依据每个用户ID找到对应的用户行为数据,获取每个用户收藏的网址,统计其中每个网址的用户数量;以该社区中所有用户收藏的网址作为样本,计算其中每个网址的支持度,网址的支持度等于该社区中收藏该网址的用户数量除以该社区的用户总数;比较计算出的每个网址的支持度与第一支持度阈值的大小,筛选掉支持度小于第一支持度阈值的网址,保留支持度大于等于第一支持度阈值的网址,支持度大于等于第一支持度阈值的网址组成第一网址集合,该第一网址集合中有一个以上网址;如果第一网址集合中有两个以上网址,则需要在第一网址集合的基础上执行网址组合并计算组合后网址组的支持度的操作;如果第一网址集合为空集或仅包括一个网址,由于一个网址无法实现后续网址的置信度的计算,因此结束整个流程;其中,第一支持度阈值可以预先设置;例如,可以将第一支持度阈值设置为0.5。
将生成的第一网址集合中的网址进行两两组合,得到一个以上网址组,每个网址组中包括两个网址;依据获取的每个用户收藏的网址;对于依据第一网址集合中网址进行组合后得到的每个网址组,统计社区中同时收藏该网址组中两个网址的用户数量,将该用户数量除以该社区的用户总量,得到该网址组的支持度;比较每个网址组的支持度与第二支持度阈值的大小,筛除支持度小于第二支持度阈值的网址组,保留支持度大于等于第二支持度阈值的网址组,并利用支持度大于等于第二支持度阈值的网址组,生成第二网址集合;对于生成的第二网址集合,将存在以下三种情况:第一种为没有网址组的支持度大于等于第二支持度阈值,第二网址集合为空集,相当于至此仅得到了第一网址集合,则由于仅有一个网址集合,而无法进行后续的置信度的计算,结束当前流程;第二种为第二网址集合中仅包括一个网址组,则直接执行步骤103;第三种为第二网址集合中包括两个以上网址组,则还需要对第二网址集合中两个以上网址组进行组合,直到得到的网址集合中仅包括一个网址组;其中,第二支持度阈值可以预先设置,例如,可以将第二支持度阈值设置为0.5。
如果第二网址集合中有两个以上网址组,对于每个网址组,将该网址组与第二网址集合中其他网址组中的一个网址组合和去重,得到包括两个网址或三个网址的网址组;其中,得到的包括两个网址或三个网址的网址组中,如果有两个网址组中的网址完全相同,仅保留两个网址组中的一个即可;如果进行网址组合时,其他网址中的一个网址与该网址组中的一个网址相同,则组合和去重后仍然得到包括两个网址的网址组,该网址组已经被第二网址集合包括,这里不对包括两个网址的网址组进行任何处理,也不将该网址组归为第三网址集合;对于得到的每个包括三个网址的网址组,依据获取的每个用户收藏的网址,统计社区中同时收藏该网址组中三个网址的用户数量,将该用户数量除以该社区的用户总量,得到该网址组的支持度;比较每个包含三个网址的网址组与第三支持度阈值的大小,筛除支持度小于第三支持度阈值的网址组,保留支持度大于等于第三支持度阈值的网址组,并利用支持度大于等于第三支持度阈值的网址组,生成第三网址集合;对于生成的第三网址集合,将存在以下三种情况:第一种为第三网址集合为空,由于已经有两个以上网址集合,可以进行后续置信度的计算,因此可以执行步骤103;第二种为第三网址集合仅包括一个网址组,则直接执行步骤103,如果第三网址集合中包括两个以上网址组,则还需要对第三网址集合中的网址组进行组合,以此类推,直到网址集合中仅包括一个网址组;其中,第三支持度阈值可以预先设置,由于同时收藏三个网址、四个网址等多个网址的用户数量会越来越少,因此设置的支持度阈值可以越来越小,例如,可以将第三支持度阈值设置为0.3。
例如,假设生成的第一网址集合中有网址A、B、C和D。对第一网址集合中的网址进行两两组合,得到网址组AB、AC、AD、BC、CD和BD,计算每个网址组的支持度,将支持度与支持度阈值比较后得到的第二网址集合中包括网址组AB和CD,或包括网址组AB和AC。对第二网址集合中的网址组进行组合,如果第二网址集合中包括AB和CD,则组合后得到的网址组为ABC、ABD、BCD和ACD,对这四个网址组的支持度进行计算,并将计算得到的支持度与第三支持度阈值进行比较,如果只有一个网址组大于等于第三支持度阈值,则执行步骤103,如果有两个以上网址组的支持度大于第三支持度阈值,则需要进一步进行组合,例如,如果支持度大于第三支持度阈值的网址组为ABC和BCD,则进一步组合将得到ABCD;如果第二网址集合中包括AB和AC,则组合后得到的网址组为ABC,如果ABC的支持度大于第三支持度阈值,则停止组合,执行步骤103。
步骤103,依据网址的支持度和网址组的支持度,对应两个以上网址集合中的网址和网址组,计算网址的置信度,并依据网址的置信度生成网址关联规则字典,该网址关联规则字典包括网址与关联网址的对应关系。
具体的,当步骤102中生成两个以上网址集合时,除第一网址集合外,对于其他网址集合,依据该网址集合和该网址集合的上一个网址集合,计算网址集合中网址的置信度,这里,由于需要利用网址集合及其上一个网址集合,因此第一网址集合无法计算出置信度,需要从第二网址集合开始才能计算出置信度。其中,第三网址集合的上一个网址集合为第二网址集合,第二网址集合的上一个网址集合为第一网址集合。
对于第二网址集合,第二网址集合中的每个网址组都包括两个网址,如网址A和网址B,对于每个网址组,利用该网址组的支持度除以该网址组中网址A的支持度,得到收藏网址A的用户收藏第一网址事件的置信度,判断该置信度是否大于置信度阈值;如果计算出的置信度大于置信度阈值,则确定网址A的关联网址为网址B,建立网址A与网址B的对应关系;当用户收藏网址A时,将向用户推送网址B。如果计算出的置信度不大于置信度阈值,则不建立对应关系;同理,利用该网址组的支持度除以该网址组中网址B的支持度,得到收藏网址B的用户收藏网址A事件的置信度,判断该置信度是否大于置信度阈值,如果是,则确定网址B的关联网址为网址A,用户收藏网址B时,向用户推送网址A。例如,P(AB)为网址组的支持度,P(B)为网址B的支持度,P(AB)除以P(B)将得到收藏网址B的用户收藏网址A事件P(A/B)的置信度,如果P(A/B)的置信度大于置信度阈值,则得到对应关系B->A,当用户收藏网址B时将向用户推送网址A。
对于第三网址集合,第三网址集合中每个网址组都包括三个网址,即网址A、网址B和网址D;下面以网址B和网址D组成的网址组C为例进行说明,利用第三网址集合中的网址组的支持度除以第二网址集合中网址组C的支持度,得到同时收藏网址B和网址D的用户收藏网址A事件的置信度;判断该置信度是否大于置信度阈值;如果不包含,则不针对第三网址集合中的该网址组计算置信度。如果计算出的置信度大于置信度阈值,则确定网址B和网址D组成的网址组C的关联网址为网址A,建立包括网址B和网址D的网址组与网址A的对应关系,例如,B+D->A;当用户同时收藏网址B和网址D时,将向用户推送网址A;如果计算出的置信度不大于置信度阈值,则不建立对应关系。同理,利用第三网址集合中的网址组C的支持度除以网址A的支持度,得到收藏网址A的用户同时收藏网址B和网址D事件的置信度,判断该置信度是否大于置信度阈值,如果是,则确定网址A的关联网址包括网址B和网址D,用户收藏网址A时,同时向用户推送网址B和网址D。例如,ABC为第三网址集合中的网址组,AB为第二网址集合中的网址组,P(ABC)为网址组ABC的支持度,P(AB)为网址组AB的支持度,P(ABC)除以P(AB)将得到同时收藏网址A和网址B的用户收藏网址C事件P(C/AB)的置信度;如果P(C/AB)的置信度大于置信度阈值,则得到对应关系A+B->C,如果用户收藏网址A和网址B,则向用户推送网址C;以此类推,计算第四网址集合等网址集合中网址的置信度。将建立的网址与关联网址的对应关系保存到网址关联规则字典,数据库中存储网址关联规则字典、社区标识以及他们的对应关系;置信度阈值可以预先设置,例如,可以将置信度阈值设置为0.1。
上述步骤102和步骤103是本发明实施例提供的一种优选的实施方式,核心思想是通过计算用户收藏两网址或者用户收藏网址和网址组的条件概率来确定两网址或网址和网址组的关联关系。具体体现为以下几种情况:
1)计算用户收藏网址A条件下也收藏网址B的置信度,当置信度大于预设的置信度阈值时,确定网址A的关联网址为网址B。此处的置信度计算方式为:网址A和网址B组成的网址组的支持度与网址A的支持度的比值。
2)计算用户收藏网址A条件下也收藏网址组C的置信度,当置信度大于预设的置信度阈值时,确定网址A的关联网址为网址组C中的所有网址。此处的置信度计算方式为:所述网址A和网址组C构成的网址组的支持度与网址A的支持度的比值。
3)计算用户收藏网址组C条件下也收藏网址A的置信度,当置信度大于预设的置信度阈值时,确定网址组C的关联网址为网址A。此处的置信度计算方式为:网址A和网址组C构成的网址组的支持度与网址组C的支持度的比值。
如上述实施例中所述,网址的支持度为:社区中收藏该网址的用户数量与所述社区的用户总数的比值;网址组的支持度为:社区中同时收藏所述网址组中所有网址的用户数量与所述社区的用户总量的比值。
上述实施例中描述的将网址和网址组逐次划分为不同网址集合的方式实际上是过滤掉支持度小于预设支持度阈值的网址和网址组,保留支持度大于或等于预设支持度阈值的网址和网址组用于置信度的计算。优选地,可以针对包含不同数量网址的网址组采用不同的支持度阈值,其中包含网址的数量越大采用的支持度阈值越小。
步骤104,收到用户收藏网址的请求时,依据所述用户所在社区的网址关联规则字典,获取用户请求收藏的网址的关联网址,将该关联网址推送给用户。
具体的,前端的交互界面接收用户收藏网址的请求,然后将用户请求收藏的网址提交给后端;后端收到用户请求收藏的网址后,从数据库中获取社区用户数据,依据用户ID在获取的社区用户数据中,找到请求收藏网址的用户所在的社区,依据社区标识与网址关联规则字典的对应关系,找到该社区的网址关联规则字典。
在找到的网址关联规则字典中查找用户请求收藏的网址是否有对应的关联网址;如果有,将包括两种对应关系,一种是用户请求收藏的网址对应的关联网址,另一种是用户请求收藏的网址与其他网址的组合对应的关联网址,其中,如果存在用户请求收藏的网址与其他网址的组合对应的关联网址,且其他网址已经被用户收藏,则优先将用户请求收藏的网址与其他网址的组合对应的关联网址推送到前端,由前端的交互界面显示给用户;如果仅有该用户请求收藏的网址对应的关联网址,则将该关联网址推送到前端,前端的交互界面将该关联网址显示给用户,实现向用户推荐网址;如果网址关联规则字典中没有用户请求收藏的网址对应的关联网址,则不推送网址给前端,不向用户推荐网址。
为实现上述方法,本发明还提供一种网址推送系统,图2是本发明实现网址推送系统的优选实施例的结构示意图,如图2所示,该系统位于后端,该系统包括:
数据处理单元20,用于依据预先存储的用户行为数据,创建二维矩阵;所述用户行为数据包括:用户ID、用户收藏的网址和用户收藏的网址的类型;所述二维矩阵为用户ID与用户收藏的每个类型的网址个数的对应关系;
计算单元21,用于依据所述用户行为数据和所述二维矩阵计算得到用户之间的相似性数据,将相似性数据大于预设的相似度阈值的用户归为同一个社区。
生成单元22,用于预先生成社区的网址关联规则字典;所述网址关联规则字典包括网址与关联网址的对应关系。
推送单元23,用于收到用户收藏网址的请求时,依据所述用户所在社区的网址关联规则字典,获取用户请求收藏的网址的关联网址;将所述关联网址推送给用户。
其中,所述计算单元21依据所述用户行为数据和所述二维矩阵计算得到用户之间的相似性数据,具体为:
利用如下公式依次计算所有用户中每两个用户之间的相似性数据:
藏的类型为i的网址的个数,表示用户un收藏的类型为i的网址的个数,{i∈Ic∩In}表示类型为i的网址是用户uc和用户un收藏的网址中具有相同类型的网址,表示用户uc收藏的各类型的网址的个数的平均值,表示用户un收藏的各类型的网址的个数的平均值。
所述生成单元22预先生成所述用户所在社区的网址关联规则字典,具体为:
计算用户收藏网址A条件下也收藏网址B的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址B;
或,计算用户收藏网址A条件下也收藏网址组C的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址组C中的所有网址;
或,计算用户收藏网址组C条件下也收藏网址A的置信度,当所述置信度大于预设的置信度阈值时,确定网址组C的关联网址为网址A。
其中,所述用户收藏网址A条件下也收藏网址B的置信度为:所述网址A和网址B组成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址A条件下也收藏网址组C的置信度为:所述网址A和网址组C构成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址组C条件下也收藏网址A的置信度为:所述网址A和网址组C构成的网址组的支持度与网址组C的支持度的比值;
其中,网址的支持度为:所述社区中收藏该网址的用户数量与所述社区的用户总数的比值;网址组的支持度为:所述社区中同时收藏所述网址组中所有网址的用户数量与所述社区的用户总量的比值。
其中,生成单元,还用于过滤掉支持度小于预设支持度阈值的网址和网址组,保留支持度大于或等于预设支持度阈值的网址和网址组用于所述置信度的计算。
本发明优选实施例中,针对包含不同数量网址的网址组采用不同的支持度阈值,其中包含网址的数量越大采用的支持度阈值越小。
所述推送单元23将所述关联网址推送给用户,具体为:
当所述网址关联规则字典中包括用户请求收藏的网址对应的关联网址,将所述关联网址推送到前端,前端将所述关联网址显示给用户;
或,当所述网址关联规则字典中包括用户请求收藏的网址与其他网址的组合对应的关联网址,且所述其他网址为用户已经收藏的网址时,将用户请求收藏的网址与其他网址的组合对应的关联网址推送到前端,前端将所述关联网址显示给用户。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (14)

1.一种网址推送方法,其特征在于,该方法包括:
收到用户收藏网址的请求时,依据预先生成的所述用户所在社区的网址关联规则字典,获取用户请求收藏的网址的关联网址,将所述关联网址推送给用户;其中,依据预先存储的用户行为数据,创建二维矩阵;所述用户行为数据包括:用户ID、用户收藏的网址和用户收藏的网址的类型;所述二维矩阵为用户ID与用户收藏的每个类型的网址个数的对应关系;依据预先存储的用户行为数据,填充所述二维矩阵;依据所述用户行为数据和所述二维矩阵中的数据,计算得到用户之间的相似性数据,将相似性数据大于预设的相似度阈值的用户归为同一个社区;所述网址关联规则字典包括网址与关联网址的对应关系。
2.根据权利要求1所述的方法,其特征在于,所述依据所述用户行为数据和所述二维矩阵中的数据,计算得到用户之间的相似性数据为:
利用如下公式依次计算所有用户中每两个用户之间的相似性数据:
其中,sin(uc,un)表示用户uc和用户un之间的相似性数据,表示用户uc收藏的类型为i的网址的个数,表示用户un收藏的类型为i的网址的个数,{i∈Ic∩In}表示类型为i的网址是用户uc和用户un收藏的网址中具有相同类型的网址,表示用户uc收藏的各类型的网址的个数的平均值,表示用户un收藏的各类型的网址的个数的平均值。
3.根据权利要求1所述的方法,其特征在于,所述网址关联规则字典采用以下方法生成:
计算用户收藏网址A条件下也收藏网址B的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址B;
或,计算用户收藏网址A条件下也收藏网址组C的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址组C中的所有网址;
或,计算用户收藏网址组C条件下也收藏网址A的置信度,当所述置信度大于预设的置信度阈值时,确定网址组C的关联网址为网址A。
4.根据权利要求3所述的方法,其特征在于,
所述用户收藏网址A条件下也收藏网址B的置信度为:所述网址A和网址B组成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址A条件下也收藏网址组C的置信度为:所述网址A和网址组C构成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址组C条件下也收藏网址A的置信度为:所述网址A和网址组C构成的网址组的支持度与网址组C的支持度的比值;
其中,网址的支持度为:所述社区中收藏该网址的用户数量与所述社区的用户总数的比值;网址组的支持度为:所述社区中同时收藏所述网址组中所有网址的用户数量与所述社区的用户总量的比值。
5.根据权利要求4所述的方法,其特征在于,该方法还包括:
过滤掉支持度小于预设支持度阈值的网址和网址组,保留支持度大于或等于预设支持度阈值的网址和网址组用于所述置信度的计算。
6.根据权利要求5所述的方法,其特征在于,针对包含不同数量网址的网址组采用不同的支持度阈值,其中包含网址的数量越大采用的支持度阈值越小。
7.根据权利要求1所述的方法,其特征在于,所述将所述关联网址推送给用户,具体为:
当所述网址关联规则字典中包括用户请求收藏的网址对应的关联网址,将所述关联网址推送到前端,前端将所述关联网址显示给用户;
或,当所述网址关联规则字典中包括用户请求收藏的网址与其他网址的组合对应的关联网址,且所述其他网址为用户已经收藏的网址时,将用户请求收藏的网址与其他网址的组合对应的关联网址推送到前端,前端将所述关联网址显示给用户。
8.一种网址推送系统,其特征在于,该系统包括:数据处理单元、计算单元、生成单元和推送单元;其中,
数据处理单元,用于依据预先存储的用户行为数据,创建二维矩阵;所述用户行为数据包括:用户ID、用户收藏的网址和用户收藏的网址的类型;所述二维矩阵为用户ID与用户收藏的每个类型的网址个数的对应关系;依据预先存储的用户行为数据,填充所述二维矩阵;
计算单元,用于依据所述用户行为数据和所述二维矩阵中的数据,计算得到用户之间的相似性数据,将相似性数据大于预设的相似度阈值的用户归为同一个社区;
生成单元,用于预先生成社区的网址关联规则字典,所述网址关联规则字典包括网址与关联网址的对应关系;
推送单元,用于收到用户收藏网址的请求时,依据所述用户所在社区的网址关联规则字典,获取用户请求收藏的网址的关联网址;将所述关联网址推送给用户。
9.根据权利要求8所述的系统,其特征在于,所述计算单元依据所述用户行为数据和所述二维矩阵中的数据,计算得到用户之间的相似性数据,具体为:
利用如下公式依次计算所有用户中每两个用户之间的相似性数据:
其中,sin(uc,un)表示用户uc和用户un之间的相似性数据,表示用户uc收藏的类型为i的网址的个数,表示用户un收藏的类型为i的网址的个数,{i∈Ic∩In}表示类型为i的网址是用户uc和用户un收藏的网址中具有相同类型的网址,表示用户uc收藏的各类型的网址的个数的平均值,表示用户un收藏的各类型的网址的个数的平均值。
10.根据权利要求8所述的系统,其特征在于,所述生成单元预先生成所述用户所在社区的网址关联规则字典,具体为:
计算用户收藏网址A条件下也收藏网址B的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址B;
或,计算用户收藏网址A条件下也收藏网址组C的置信度,当所述置信度大于预设的置信度阈值时,确定网址A的关联网址为网址组C中的所有网址;
或,计算用户收藏网址组C条件下也收藏网址A的置信度,当所述置信度大于预设的置信度阈值时,确定网址组C的关联网址为网址A。
11.根据权利要求10所述的系统,其特征在于,
所述用户收藏网址A条件下也收藏网址B的置信度为:所述网址A和网址B组成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址A条件下也收藏网址组C的置信度为:所述网址A和网址组C构成的网址组的支持度与网址A的支持度的比值;
所述用户收藏网址组C条件下也收藏网址A的置信度为:所述网址A和网址组C构成的网址组的支持度与网址组C的支持度的比值;
其中,网址的支持度为:所述社区中收藏该网址的用户数量与所述社区的用户总数的比值;网址组的支持度为:所述社区中同时收藏所述网址组中所有网址的用户数量与所述社区的用户总量的比值。
12.根据权利要求11所述的系统,其特征在于,生成单元,还用于过滤掉支持度小于预设支持度阈值的网址和网址组,保留支持度大于或等于预设支持度阈值的网址和网址组用于所述置信度的计算。
13.根据权利要求12所述的系统,其特征在于,针对包含不同数量网址的网址组采用不同的支持度阈值,其中包含网址的数量越大采用的支持度阈值越小。
14.根据权利要求8所述的系统,其特征在于,所述推送单元将所述关联网址推送给用户,具体为:
当所述网址关联规则字典中包括用户请求收藏的网址对应的关联网址,将所述关联网址推送到前端,前端将所述关联网址显示给用户;
或,当所述网址关联规则字典中包括用户请求收藏的网址与其他网址的组合对应的关联网址,且所述其他网址为用户已经收藏的网址时,将用户请求收藏的网址与其他网址的组合对应的关联网址推送到前端,前端将所述关联网址显示给用户。
CN201210385094.XA 2012-10-11 2012-10-11 一种网址推送方法及系统 Active CN102929964B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210385094.XA CN102929964B (zh) 2012-10-11 2012-10-11 一种网址推送方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210385094.XA CN102929964B (zh) 2012-10-11 2012-10-11 一种网址推送方法及系统

Publications (2)

Publication Number Publication Date
CN102929964A CN102929964A (zh) 2013-02-13
CN102929964B true CN102929964B (zh) 2019-02-12

Family

ID=47644762

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210385094.XA Active CN102929964B (zh) 2012-10-11 2012-10-11 一种网址推送方法及系统

Country Status (1)

Country Link
CN (1) CN102929964B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105243144A (zh) * 2015-10-15 2016-01-13 桂林电子科技大学 一种兴趣标签的推荐方法及装置
CN107369058A (zh) * 2016-05-13 2017-11-21 华为技术有限公司 一种关联推荐方法及服务器
CN109697642A (zh) * 2017-10-23 2019-04-30 北京京东尚科信息技术有限公司 数据推送方法、装置以及计算机可读存储介质
CN110442616B (zh) * 2018-05-02 2022-10-14 郑州芯兰德网络科技有限公司 一种针对大数据量的页面访问路径分析方法与系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101432714A (zh) * 2004-09-14 2009-05-13 A9.Com公司 自动生成推荐链接的方法和设备
CN102609860A (zh) * 2012-01-20 2012-07-25 彭立发 一种适用于电子商务的商品与信息分类推荐方法及系统
CN102663626A (zh) * 2012-04-26 2012-09-12 焦点科技股份有限公司 基于区域特征的协同过滤推荐方法
CN102722524A (zh) * 2012-05-07 2012-10-10 北京邮电大学 网站推荐结果显示方法、装置及具有该装置的终端

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8832101B2 (en) * 2010-02-18 2014-09-09 Yahoo! Inc. Automated user behavior feedback system for whole page search success optimization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101432714A (zh) * 2004-09-14 2009-05-13 A9.Com公司 自动生成推荐链接的方法和设备
CN102609860A (zh) * 2012-01-20 2012-07-25 彭立发 一种适用于电子商务的商品与信息分类推荐方法及系统
CN102663626A (zh) * 2012-04-26 2012-09-12 焦点科技股份有限公司 基于区域特征的协同过滤推荐方法
CN102722524A (zh) * 2012-05-07 2012-10-10 北京邮电大学 网站推荐结果显示方法、装置及具有该装置的终端

Also Published As

Publication number Publication date
CN102929964A (zh) 2013-02-13

Similar Documents

Publication Publication Date Title
CN106126669B (zh) 基于标签的用户协同过滤内容推荐方法及装置
CN105701216B (zh) 一种信息推送方法及装置
US7904303B2 (en) Engagement-oriented recommendation principle
CN104166668B (zh) 基于folfm模型的新闻推荐系统及方法
CN105868281B (zh) 基于非支配排序多目标方法的位置感知推荐系统
CN104142999B (zh) 搜索结果展示方法及装置
CN108595461B (zh) 兴趣探索方法、存储介质、电子设备及系统
CN103377204B (zh) 一种地图搜索结果的展现方法和装置
CN102929964B (zh) 一种网址推送方法及系统
CN106570008A (zh) 推荐方法及装置
CN103699678B (zh) 一种基于多阶段分层采样的层次聚类方法和系统
CN104835057A (zh) 一种获取网络用户的消费特征信息的方法及装置
WO2014113709A2 (en) Searching and determining active area
CN104462385A (zh) 一种基于用户兴趣模型的电影个性化相似度计算方法
CN101755283A (zh) 利用混合算法推荐信息的方法和设备
WO2011034475A1 (en) Method and apparatus for executing a recommendation
CN106528804B (zh) 一种基于模糊聚类的用户分群方法
CN107562947A (zh) 一种移动时空感知下动态即时推荐服务模型建立方法
CN107391670A (zh) 一种融合协同过滤和用户属性过滤的混合推荐方法
CN102591995A (zh) 一种基于云数据中心的用户信息处理方法及装置
CN108804576A (zh) 一种基于链接分析的域名层级结构探测方法
CN102135983A (zh) 基于网络用户行为的群体划分方法和装置
CN104077723A (zh) 一种社交网络推荐系统及方法
CN106227866A (zh) 一种基于数据挖掘的混合过滤电影推荐方法
CN105868230A (zh) 一种实现用户配对观影社交的方法与装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191209

Address after: 201210 room j1328, floor 3, building 8, No. 55, Huiyuan Road, Jiading District, Shanghai

Patentee after: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

Address before: 100085 Beijing, Haidian District, No. ten on the ground floor, No. 10 Baidu building, layer 2

Patentee before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20130213

Assignee: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

Assignor: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.

Contract record no.: X2019110000008

Denomination of invention: Website push method and website push system

Granted publication date: 20190212

License type: Exclusive License

Record date: 20191218

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 401120 b7-7-2, Yuxing Plaza, No.5, Huangyang Road, Yubei District, Chongqing

Patentee after: Chongqing duxiaoman Youyang Technology Co.,Ltd.

Address before: 201210 room j1328, 3 / F, building 8, 55 Huiyuan Road, Jiading District, Shanghai

Patentee before: SHANGHAI YOUYANG NEW MEDIA INFORMATION TECHNOLOGY Co.,Ltd.