CN104090900B - 一种热度关联的海量数据实时计算方法、装置及服务器 - Google Patents

一种热度关联的海量数据实时计算方法、装置及服务器 Download PDF

Info

Publication number
CN104090900B
CN104090900B CN201310719339.2A CN201310719339A CN104090900B CN 104090900 B CN104090900 B CN 104090900B CN 201310719339 A CN201310719339 A CN 201310719339A CN 104090900 B CN104090900 B CN 104090900B
Authority
CN
China
Prior art keywords
network information
user
row
information
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310719339.2A
Other languages
English (en)
Other versions
CN104090900A (zh
Inventor
谢贵明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201310719339.2A priority Critical patent/CN104090900B/zh
Publication of CN104090900A publication Critical patent/CN104090900A/zh
Application granted granted Critical
Publication of CN104090900B publication Critical patent/CN104090900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种热度关联的海量数据实时计算方法、装置及服务器,属于互联网领域。所述方法包括:获取第一用户,第一用户为在第一时间段内浏览网络信息的用户,第一时间段为离当前最近且时长为预设第一时长的时间段;根据第一用户在第二时间段内浏览的网络信息,构建第一用户对应的个人关联矩阵,第二时间段为离当前最近且时长为预设第二时长的时间段,第二时长大于第一时长;根据已存储的第二用户对应的个人关联矩阵和第一用户对应的个人关联矩阵,计算推荐信息矩阵,第二用户为用户群体中除第一用户以外的其他用户。所述装置包括:获取模块、构建模块和计算模块。本发明能够提高推荐信息的时效性。

Description

一种热度关联的海量数据实时计算方法、装置及服务器
技术领域
本发明涉及互联网领域,特别涉及一种热度关联的海量数据实时计算方法、装置及服务器。
背景技术
随着互联网技术的快速发展,网络上的商品信息的数量越来越多,极大的丰富了人们的日常生活,但是另一方面,用户从网络上快速准确地寻找到与自身有关的商品信息的难度越来越大;因此,为用户推荐与其有关的商品信息的方法受到业界人士广泛关注。
目前,可以通过推荐信息列表来为用户推荐商品信息,推荐信息列表用于存储浏览商品信息和相关商品信息集合的对应关系,在推荐信息列表中每个浏览商品信息对应的相关商品信息集合,该相关商品信息集合包括与该浏览商品信息相关的商品信息,且在该相关商品信息集合中每个相关商品信息按关联热度从大到小进行排序。当某个用户在浏览某个商品信息时,根据浏览的该商品信息,从推荐信息列表中获取对应的相关商品信息集合,从该相关商品信息集合中选择关联热度最大的几个相关商品信息推荐给该用户。
需要说明的是:为了保障推荐商品信息的时效性,推荐信息列表每隔预设时间长度更新一次,具体为:获取历史记录文件,历史记录文件用于记录用户群体中的用户在离当前最近且时长为预设时间长度的时间段内浏览的商品信息,根据该历史记录文件生成一个推荐信息列表,并将已存储的推荐信息列表更新为生成的推荐信息列表。
在实现本发明的过程中,发明人发现上述技术至少存在以下问题:
在上述方案中,生成推荐信息列表是计算复杂度较高的过程,为了减少生成推荐信息列表的次数,往往将预设时间长度设置的较长,可能是几天或几周等,如此导致根据推荐信息列表推荐信息的时效性较差。
发明内容
为了提高根据推荐信息矩阵推荐信息的时效性,本发明提供了一种热度关联的海量数据实时计算方法、装置及服务器。所述技术方案如下:
一种热度关联的海量数据实时计算方法,所述方法包括:
获取第一用户,所述第一用户为在第一时间段内浏览网络信息的用户,所述第一时间段为离当前最近且时长为预设第一时长的时间段;
根据所述第一用户在第二时间段内浏览的网络信息,构建所述第一用户对应的个人关联矩阵,所述第二时间段为离当前最近且时长为预设第二时长的时间段,所述第二时长大于所述第一时长,所述个人关联矩阵中每行的第一列元素为所述第一用户浏览的网络信息,该行除第一列元素以外的其他各列元素为该第一列元素的相关网络信息,且相关网络信息为所述用户浏览的除该第一列元素以外的其他网络信息;
根据已存储的第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,计算推荐信息矩阵,所述第二用户为用户群体中除所述第一用户以外的其他用户,所述推荐信息矩阵中每行的第一列元素为所述用户群体的用户浏览的网络信息,该行中除第一列元素以外的其他各列元素均为第一列元素的相关网络信息,且该行中的相关网络信息均按其关联热度进行排序。
一种热度关联的海量数据实时计算装置,所述装置包括:
获取模块,用于获取第一用户,所述第一用户为在第一时间段内浏览网络信息的用户,所述第一时间段为离当前最近且时长为预设第一时长的时间段;
构建模块,用于根据所述第一用户在第二时间段内浏览的网络信息,构建所述第一用户对应的个人关联矩阵,所述第二时间段为离当前最近且时长为预设第二时长的时间段,所述第二时长大于所述第一时长,所述个人关联矩阵中每行的第一列元素为所述第一用户浏览的网络信息,该行除第一列元素以外的其他各列元素为该第一列元素的相关网络信息,且相关网络信息为所述用户浏览的除该第一列元素以外的其他网络信息;
计算模块,用于根据已存储的第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,计算推荐信息矩阵,所述第二用户为用户群体中除所述第一用户以外的其他用户,所述推荐信息矩阵中每行的第一列元素为所述用户群体的用户浏览的网络信息,该行中除第一列元素以外的其他各列元素均为第一列元素的相关网络信息,且该行中的相关网络信息均按其关联热度进行排序。
一种热度关联的海量数据实时计算服务器,所述服务器包括:
一个或多个处理器;和
存储器;
所述存储器存储有一个或多个程序,所述一个或多个程序被配置成由所述一个或多个处理器执行,所述一个或多个程序包含用于进行所述热度关联的海量数据实时计算方法的指令。
在本发明实施例中,获取在离当前最近且时长为预设第一时长的第一时间段内浏览网络信息的第一用户,且第一时长可以为半小时或一小时等,所以第一时间段内浏览网络信息的第一用户的数目不是很多,获取的第一用户在计算第二时间段内浏览网络信息的数目也不是很多,所以每次计算推荐信息矩阵的计算复杂度也不是很高,可以缩短任意相邻两次计算推荐信息矩阵之间的时间间隔,且任意相邻两次计算推荐信息矩阵之间的时间间隔小于第二时长,提高了计算推荐信息矩阵的频率,并进一步提高根据推荐信息矩阵推荐信息的时效性。
附图说明
图1是本发明实施例1提供的一种热度关联的海量数据实时计算方法流程图;
图2是本发明实施例2提供的一种热度关联的海量数据实时计算方法流程图;
图3是本发明实施例3提供的一种热度关联的海量数据实时计算装置结构示意图;
图4是本发明实施例4提供的一种热度关联的海量数据实时计算服务器结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例1
参见图1,本发明实施例提供了一种热度关联的海量数据实时计算方法,包括:
步骤101:获取第一用户,第一用户为在第一时间段内浏览网络信息的用户,第一时间段为离当前最近且时长为预设第一时长的时间段;
步骤102:根据第一用户在第二时间段内浏览的网络信息,构建第一用户对应的个人关联矩阵,第二时间段为离当前最近且时长为预设第二时长的时间段,第二时长大于第一时长;
步骤103:根据已存储的第二用户对应的个人关联矩阵和第一用户对应的个人关联矩阵,计算推荐信息矩阵,第二用户为用户群体中除第一用户以外的其他用户。
在本发明实施例中,获取在离当前最近且时长为预设第一时长的第一时间段内浏览网络信息的第一用户,获取第一用户在离当前最近且时长为预设第二时长的第二时间段内浏览的网络信息,根据第一用户浏览的网络信息,计算推荐信息矩阵中的部分记录。其中,第一时长小于第二时长,且第一时长可以为半小时或一小时等,所以第一时间段内浏览网络信息的第一用户的数目不是很多,获取的第一用户在第二时间段内浏览网络信息的数目也不是很多,所以每次计算推荐信息矩阵的计算复杂度也不是很高,可以缩短任意相邻两次计算推荐信息矩阵之间的时间间隔,且任意相邻两次计算推荐信息矩阵之间的时间间隔小于第二时长,提高了计算推荐信息矩阵的频率,并进一步提高根据推荐信息矩阵推荐信息的时效性。
实施例2
参见图2,本发明实施例提供了一种热度关联的海量数据实时计算方法,包括:
步骤201:获取用户群体中的用户在第三时间段内浏览的网络信息,第三时间段为离当前最近且时长为预设第二时长的时间段;
其中,可以根据网络中的每个用户的性别或年龄等信息,将网络中的用户划分成不同的用户群体。例如,可以将年龄在18至27岁之间的用户划分为一个用户群体。预设第二时长可以为1周、2周或3周等,本发明对此不加以限定。
其中,可以从历史记录文件中获取用户群体中的用户在第三时间段内浏览的网络信息。历史记录文件用于记录离当前最近且时长为预设第二时长的时间段内每个用户浏览的网络信息等内容。例如,当某个用户浏览网络信息时,服务器可以获取该用户浏览的该网络信息和浏览时间,并设置该网络信息的权重,将该用户的用户标识、该网络信息、浏览时间和设置的权重的对应关系存储在历史记录文件中。
其中,设置该网络信息的权重,可以为:
如果该用户只浏览该网络信息且没有对该网络信息按其他处理方式进行处理,则获取权重初值,将该网络信息的权重设置为获取的权重初值,其他处理方式可以为评论、收藏或转发该网络信息等。如果该用户除浏览该网络信息之外,还对该网络信息以其他处理方式进行处理,如评论、收藏或转发该网络信息,则获取权重初值以及该其他处理方式对应的权重,将获取的权重初值与该其他处理方式对应的权重进行累加,得到该网络信息的权重。例如,假设权重初值为1.0,评论对应的权重为0.3,当用户浏览某一网络信息时,如果该用户除浏览该网络信息之外,还对该网络信息进行评论,则获取权重初值1.0与评论对应的权重0.3,将权重初值1.0与权重0.3进行累加得到该网络信息的权重1.3。
以一个具体的例子对本步骤进行详细说明,假设,用户群体包括用户1、2和3,获取用户1在第三时间段内浏览的网络信息,分别为网络信息A、B和C,且网络信息A、B和C的权重分别为1.1、1.2和1.3;获取用户2在第三时间段内浏览的网络信息,分别为网络信息B、C和D,且网络信息B、C和D的权重分别为1.1、1.0和1.2;以及获取用户3在第三时间段内浏览的网络信息,分别为网络信息H、I和J,且网络信息H、I和J的权重分别为1.2、1.5和1.0。
步骤202:根据用户群体中的用户浏览的网络信息生成推荐信息矩阵;
其中,推荐信息矩阵中每行的第一列元素为该用户群体的用户浏览的网络信息,该行中除第一列元素以外的其他各列元素均为第一列元素的相关网络信息,且该行中的相关网络信息均按其关联热度进行排序。
用户浏览的各条网络信息相互相关,对于用户浏览的每条网络信息,该用户浏览的除该条网络信息以外的其他网络信息为该条网络信息的相关网络信息。例如,用户1浏览了网络信息A、B和C,对于网络信息A,网络信息B和C是网络信息A的相关网络信息;对于网络信息B,网络信息A和C是网络信息B的相关网络信息;对于网络信息C,网络信息A和B是网络信息C的相关网络信息。
具体地,本步骤可以通过2021至2024的步骤来实现,包括:
2021:根据用户群体中的每个用户浏览的网络信息,分别构建用户群体中的每个用户对应的个人关联矩阵;
其中,任一用户对应的个人关联矩阵的行数与该用户浏览的网络信息的个数相等,个人关联矩阵中每行的第一列元素为该用户浏览的网络信息,该行除第一列元素以外的其他各列元素为该第一列元素的相关网络信息,且相关网络信息为该用户浏览的除该第一列元素以外的其他网络信息。
优选地,可以按如下方式来构建该用户群体中任一用户对应的个人关联矩阵,包括:
选择该用户浏览的一条网络信息,将选择的网络信息作为其对应的个人关联矩阵中行的第一列元素,将该用户浏览的除选择的网络信息以外的其他网络信息分别作为该行除第一列元素以外的其他各列元素,将该行储存在该用户对应的个人关联矩阵中;如果该用户浏览的网络信息中还存在未选择的网络信息,则选择一条未选择的网络信息并重新执行上述流程,直到选择完该用户浏览的每条网络信息,以实现构建该用户对应的个人关联矩阵。
例如,用户1浏览了3条网络信息,分别为网络信息A、B和C,因此构建的用户1对应的个人关联矩阵的行数为3,且可以按如下(A-1)至(A-3)的流程进行构建,包括:
(A-1):选择用户1浏览的网络信息A,将网络信息A(1.1)作为其对应的个人关联矩阵中第一行的第一列元素,将网络信息B(1.2)和C(1.3)分别作为第一行的第二列元素和第三列元素,得到的第一行为〈网络信息A(1.1),网络信息B(1.2),网络信息C(1.3)〉,并存储在矩阵1所示的用户1对应的个人关联矩阵中;网络信息B(1.2)表示网络信息B以及网络信息B的权重为1.2;
(A-2):选择用户1浏览的网络信息B,将网络信息B(1.2)作为其对应的个人关联矩阵中第二行的第一列元素,将网络信息A(1.1)和C(1.3)分别作为第二行的第二列元素和第三列元素,得到的第二行为〈网络信息B(1.2),网络信息A(1.1),网络信息C(1.3)〉,并存储在矩阵1所示的用户1对应的个人关联矩阵中;
(A-3):选择用户1浏览的网络信息C,将网络信息C(1.3)作为其对应的个人关联矩阵中第三行的第一列元素,将网络信息A(1.1)和B(1.2)分别作为第三行的第二列元素和第三列元素,得到的第三行为〈网络信息C(1.3),网络信息A(1.1),网络信息B(1.2)〉,并存储在矩阵1所示的用户1对应的个人关联矩阵中,如此构建出矩阵1所示的用户1对应的个人关联矩阵。
矩阵1
A ( 1.1 ) B ( 1.2 ) C ( 1.3 ) B ( 1.2 ) A ( 1.1 ) C ( 1.3 ) C ( 1.3 ) A ( 1.1 ) B ( 1.2 )
根据获取的用户2在第三时间段内浏览的网络信息B、C和D,按照构建用户1对应的个人关联矩阵的方法,构建出矩阵2所示的用户2对应的个人关联矩阵。
矩阵2
B ( 1.1 ) C ( 1.0 ) D ( 1.2 ) C ( 1.0 ) B ( 1.1 ) D ( 1.2 ) D ( 1.2 ) B ( 1.1 ) C ( 1 . 0 )
以及,根据获取的用户3在第三时间段内浏览的网络信息H、I和J,按照构建用户1对应的个人关联矩阵的方法,构建出矩阵3所示的用户3对应的个人关联矩阵。
矩阵3
H ( 1.2 ) I ( 1.5 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) J ( 1.0 ) J ( 1.0 ) H ( 1.2 ) I ( 1.5 )
2022:根据用户群体中的每个用户对应的个人关联矩阵,构建用户群体的第一信息关联矩阵;
具体地,可以通过如下(B-1)至(B-4)的步骤实现,包括:
(B-1):从该用户群体中的每个用户浏览的所有网络信息中选择一条网络信息;
(B-2):从该用户群体中的每个用户对应的个人关联矩阵中获取行的第一列元素为选择的网络信息的行;
(B-3):将获取的各行进行合并,合并过程中将相同的网络信息的权重进行累加;
(B-4):从该用户群体中的每个用户浏览的所有网络信息中选择下一条未选择的网络信息,并重复执行上述(B-1)至(B-3)的过程,直到选择完该用户群体中的每个用户浏览的所有网络信息,以实现构建该用户群体的信息关联矩阵。
例如,用户群体中的每个用户浏览的所有网络信息包括网络信息A、B、C、D、H、I和J。
从该用户群体中的每个用户浏览的所有网络信息中选择网络信息A,从该用户群体中的用户1、用户2和用户3分别对应的个人关联矩阵中获取行的第一列元素为网络信息A的行〈网络信息A(1.1),网络信息B(1.2),网络信息C(1.3)〉,并将该行存储在矩阵4所示的第一信息关联矩阵中。
继续从该用户群体中的每个用户浏览的所有网络信息中选择下一条未选择的网络信息B,从该用户群体中的用户1、用户2和用户3对应的个人关联矩阵中获取行的第一列元素为网络信息B的行,分别为〈网络信息B(1.2),网络信息A(1.1),网络信息C(1.3)〉和〈网络信息B(1.1),网络信息C(1.0),网络信息D(1.2)〉。将行〈网络信息B(1.2),网络信息A(1.1),网络信息C(1.3)〉和〈网络信息B(1.1),网络信息C(1.0),网络信息D(1.2)〉进行合并,合并过程中,将网络信息B的权重1.2和1.1进行累加得到网络信息B的权重为2.3;对网络信息C的权重1.3和1.0进行累加得到网络信息C的权重为2.3,得到的合并后的行为〈网络信息B(2.3),网络信息A(1.1),网络信息C(2.3),网络信息D(1.2)〉,并将该行存储在矩阵4所示的第一信息关联矩阵中。
继续分别选择未选择的网络信息C、D、H、I和J,对选择的每一条网络信息,重复对选择的网络信息A或B进行处理的过程,如此构建出矩阵4所示的该用户群体的第一信息关联矩阵。
矩阵4
A ( 1.1 ) B ( 1.2 ) C ( 1.3 ) B ( 2.3 ) A ( 1.1 ) C ( 2.3 ) D ( 1.2 ) C ( 2.3 ) A ( 1.1 ) B ( 2.3 ) D ( 1.2 ) D ( 1.2 ) B ( 1.1 ) C ( 1.0 ) H ( 1.2 ) I ( 1.5 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) J ( 1.0 ) J ( 1.0 ) H ( 1.2 ) I ( 1.5 )
2023:计算第一信息关联矩阵每行中的相关网络信息的关联热度,相关网络信息为每行除第一列元素以外的其他各列元素;
具体地。对于每行中的任一相关网络信息,计算该相关网络信息的权重与位于该行第一列的网络信息的权重的比值,将计算的比值作为该相关网络信息的关联热度。
例如,在第一信息关联矩阵的第一行中,对于相关网络信息B(1.2)和相关网络信息C(1.3),根据相关网络信息B的权重1.2和位于第一列的网络信息A的权重1.1,计算相关网络信息B的权重与位于第一列的网络信息A的权重之间的比值1.1,将计算的比值1.1作为相关网络信息B的关联热度;按照同样的方法可以计算出相关网络信息C的关联热度为1.2。
2024:将每行中的相关网络信息按关联热度进行排序,得到第二信息相关矩阵,将第二信息关联矩阵作为推荐信息矩阵。
根据计算出的关联热度对第一信息关联矩阵的第一行中的相关网络信息
B(1.2)和相关网络信息C(1.3)进行排序,得到排序后的行为〈网络信息A(1.1),网络信息C(1.3),网络信息B(1.2)〉。
继续对第一信息关联矩阵中的其他每行进行处理,如此构建出矩阵5所示的该用户群体的第二信息相关矩阵,并将第二信息相关矩阵作为推荐信息矩阵。
矩阵5
A ( 1.1 ) C ( 1.3 ) B ( 1.2 ) B ( 2.3 ) C ( 2.3 ) D ( 1.2 ) A ( 1.1 ) C ( 2.3 ) B ( 2.3 ) D ( 1.2 ) A ( 1.1 ) D ( 1.2 ) B ( 1.1 ) C ( 1.0 ) H ( 1.2 ) I ( 1.5 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) J ( 1.0 ) J ( 1.0 ) H ( 1.5 ) I ( 1.2 )
在构建出推荐信息矩阵之后,当某一用户正浏览网络信息时,根据该用户浏览的该网络信息,从推荐信息矩阵中获取行的第一列元素为该网络信息的行,获取该行中的相关网络信息,在相关网络信息中选择关联热度最大的预设数值个相关网络信息,并将选择的相关网络信息推荐给该用户。
为了提高推荐信息的时效性,在构建出推荐信息矩阵之后,可以通过如下步骤来更新推荐信息矩阵。
步骤203:获取第一用户,第一用户为在第一时间段内用户群体中浏览网络信息的用户,第一时间段为离当前最近且时长为预设第一时长的时间段,第一时长小于第二时长;
具体地,在生成推荐信息矩阵之后,对网络信息进行实时监测,在最近上一次计算推荐信息矩阵之后,第一次监测出有用户浏览网络信息时,开始计时,当计时的时间达到预设第一时长时,获取在计时的时间段内浏览网络信息的用户并作为第一用户。计时的时间段即为第一时间段。
其中,预设第一时长可以为半小时或一小时等,本发明对此不加以限定。
进一步地,当监测出有用户浏览网络信息时,获取该用户浏览的该网络信息和浏览时间,并设置该网络信息的权重,将该用户的用户标识、该网络信息、浏览时间和设置的权重的对应关系存储在历史记录文件中。
例如,假设在第一时间段内用户1浏览了网络信息D和网络信息X,且网络信息D的权重为1.5和网络信息X的权重为2.0,服务器将用户1的用户标识、网络信息D、浏览时间和权重1.5的对应关系存储在历史记录文件中,以及将用户1的用户标识、网络信息X、浏览时间和权重2.0的对应关系存储在历史记录文件中。
步骤204:获取第一用户在第二时间段内浏览的网络信息,第二时间段为离当前最近且时长为预设第二时长的时间段;
具体地,根据第一用户的标识,从历史记录文件中获取浏览时间位于第二时间段内的网络信息,获取的网络信息即为第一用户在第二时间段内浏览的网络信息。
例如,假设在第二时间段内用户1浏览了网络信息B、C、D和X,则在历史记录文件中获取用户1在第二时间段内浏览的网络信息B、C、D和X。
步骤205:根据第一用户在第二时间段内浏览的网络信息,构建第一用户对应的个人关联矩阵;
具体地,对于每个第一用户,选择该第一用户在第二时间段内浏览的一条网络信息,将选择的网络信息作为其对应的个人关联矩阵中行的第一列元素,将该第一用户浏览的除选择网络信息以外的其他网络信息分别作为该行除第一列元素以外的其他各列元素,将该行存储在该第一用户对应的个人关联矩阵中;如果该第一用户在第二时间段内浏览的网络信息中还存在未选择的网络信息,则选择一条未选择的网络信息并重新执行上述流程,直到选择完该第一用户在第二时间段内浏览的每条网络信息,以实现构建该第一用户对应的个人关联矩阵。
例如,对于用户1对应的个人关联矩阵,按如下流程进行构建,包括:在用户1浏览的网络信息B、C、D和X中选择网络信息B,将网络信息B作为其对应的个人关联矩阵中第一行的第一列元素,将网络信息C、D和X分别作为第一行的第二列元素、第三列元素和第四列元素,得到的第一行为〈网络信息B(1.2),网络信息C(1.3),网络信息D(1.5),网络信息X(2.0)〉,并存储在矩阵6所示的用户1对应的个人关联矩阵中;继续分别选择网络信息C、D和X,分别对网络信息C、D和X重复对网络信息B进行处理的过程,如此构建出矩阵6所示的用户1对应的个人关联矩阵。
矩阵6
B ( 1.2 ) C ( 1.3 ) D ( 1.5 ) X ( 2.0 ) C ( 1.3 ) B ( 1.2 ) D ( 1.5 ) X ( 2.0 ) D ( 1.5 ) B ( 1.2 ) C ( 1.3 ) X ( 2.0 ) X ( 2.0 ) B ( 1.2 ) C ( 1.3 ) D ( 1.5 )
其中,在生成用户群体的每个用户对应的个人关联矩阵之后,会保存每个用户对应的个人关联矩阵。当构建第一用户对应的个人关联矩阵之后,将已存储的第一用户对应的个人关联矩阵更新为构建的个人关联矩阵。
步骤206:从第一用户在第二时间段内浏览的网络信息中获取已存储的信息关联矩阵中存在的网络信息作为第一网络信息,以及获取已存储的信息关联矩阵中不存在的网络信息作为第二网络信息;
例如,矩阵5所示的该用户群体的第二信息关联矩阵中包括网络信息A、B、C、D、H、I和J,用户1在第二时间段内浏览的网络信息分别为网络信息B、C、D和X,而第二信息关联矩阵中包含有网络信息B、C和D,则将用户1在第二时间段内浏览的网络信息B、C和D作为第一网络信息;第二信息关联矩阵中不包含网络信息X,则将用户1在第二时间段内浏览的网络信息X作为第二网络信息。
步骤207:根据第二用户对应的个人关联矩阵、第一用户对应的个人关联矩阵和第一网络信息,对第二信息关联矩阵中行的第一列元素为第一网络信息的行进行更新,得到第三信息关联矩阵;
其中,第二用户为该用户群体中除第一用户以外的其他用户,且在步骤202中已经构建并存储第二用户对应的个人关联矩阵,因此无需再重新构建第二用户对应的个人关联矩阵。
具体地,本步骤可以通过如下2071至2073的步骤来实现,包括:
2071:从第二用户对应的个人关联矩阵和第一用户对应的个人关联矩阵中获取行的第一列元素为第一网络信息的行;
例如,从矩阵2、矩阵3和矩阵6所示的个人关联矩阵中获取行的第一列元素为第一网络信息B的行,分别为〈网络信息B(1.1),网络信息C(1.0),网络信息D(1.2)〉和〈网络信息B(1.2),网络信息C(1.3),网络信息D(1.5),网络信息X(2.0)〉。
从矩阵2、矩阵3和矩阵6所示的个人关联矩阵中获取行的第一列元素为第一网络信息C的行,分别为〈网络信息C(1.0),网络信息B(1.1),网络信息D(1.2)〉和〈网络信息C(1.3),网络信息B(1.2),网络信息D(1.5),网络信息X(2.0)〉。
从矩阵2、矩阵3和矩阵6所示的个人关联矩阵中获取行的第一列元素为第一网络信息D的行,分别为〈网络信息D(1.2),网络信息B(1.1),网络信息C(1.0)〉和〈网络信息D(1.5),网络信息B(1.2),网络信息C(1.3),网络信息X(2.0)〉。
2072:对获取的各行进行合并,且在合并过程中将相同网络信息的权重进行累加;
例如,将行的第一列元素为第一网络信息B的行〈网络信息B(1.1),网络信息C(1.0),网络信息D(1.2)〉和〈网络信息B(1.2),网络信息C(1.3),网络信息D(1.5),网络信息X(2.0)〉进行合并,合并过程中将第一网络信息B的权重1.2和1.1进行累加得到第一网络信息B的权重为2.3;将网络信息C的权重1.3和1.0进行累加得到网络信息C的权重为2.3,以及将网络信息D的权重1.5和1.2进行累加得到网络信息D的权重2.7,得到的合并后的行为〈网络信息B(2.3),网络信息C(2.3),网络信息D(2.7),网络信息X(2.0)〉。
将行的第一列元素为第一网络信息C的行〈网络信息C(1.0),网络信息B(1.1),网络信息D(1.2)〉和〈网络信息C(1.3),网络信息B(1.2),网络信息D(1.5),网络信息X(2.0)〉进行合并,得到的合并后的行为〈网络信息C(2.3),网络信息B(2.3),网络信息D(2.7),网络信息X(2.0)〉。
将行的第一列元素为第一网络信息D的行〈网络信息D(1.2),网络信息B(1.1),网络信息C(1.0)〉和〈网络信息D(1.5),网络信息B(1.2),网络信息C(1.3),网络信息X(2.0)〉进行合并,得到的合并后的行为〈网络信息D(2.7),网络信息B(2.3),网络信息C(2.3),网络信息X(2.0)〉。
2073:将第二信息关联矩阵中行的第一列元素为第一网络信息的行更新为合并的行。
例如,将第二信息关联矩阵中行的第一列元素为第一网络信息B、C、和D的行分别更新为〈网络信息B(2.3),网络信息C(2.3),网络信息D(2.7),网络信息X(2.0)〉,〈网络信息C(2.3),网络信息B(2.3),网络信息D(2.7),网络信息X(2.0)〉和〈网络信息D(2.7),网络信息B(2.3),网络信息C(2.3),网络信息X(2.0)〉,如此构建出矩阵7所示的第三信息关联矩阵。
矩阵7
A ( 1.1 ) C ( 1.3 ) B ( 1.2 ) B ( 2.3 ) C ( 2.3 ) D ( 2.7 ) X ( 2.0 ) C ( 2.3 ) B ( 2.3 ) D ( 2.7 ) X ( 2.0 ) D ( 1.2 ) B ( 2.3 ) C ( 2.3 ) X ( 2.0 ) H ( 1.2 ) I ( 1.5 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) J ( 1.0 ) J ( 1.0 ) I ( 1.5 ) I ( 1.2 )
步骤208:在第三信息关联矩阵中,对更新的行中存储的除第一网络信息以外的其他网络信息按关联热度进行排序,得到第四信息关联矩阵;
具体地,可以通过如下2081和2082两步骤完成,包括:
2081:根据更新的行中的相关网络信息的权重和位于更新的行中的第一网络信息的权重,计算更新的行中的相关网络信息的关联热度;
具体地,对于更新的行中任一相关网络信息,计算该相关网络信息的权重与第一网络信息的权重之间的比值,将计算的比值作为该相关网络信息的关联热度。
例如,对于更新的行〈网络信息B(2.3),网络信息C(2.3),网络信息D(2.7),网络信息X(2.0)〉中的相关网络信息C,根据相关网络信息C的权重2.3和第一网络信息B的权重2.3,计算相关网络信息C的权重与第一网络信息B的权重之间的比值1,将计算的比值1作为相关网络信息C的关联热度,以及对于该行中的相关网络信息D和X,可以按照计算相关网络信息C的关联热度的方法计算出相关网络信息D的关联热度为1.2和相关网络信息X的关联热度为0.87。
2082:按计算的关联热度对更新的行中的相关网络信息进行排序,得到第四信息关联矩阵。
例如,对于更新的行〈网络信息B(2.3),网络信息C(2.3),网络信息D(2.7),网络信息X(2.0)〉,按照计算出关联热度对该行中的相关网络信息C、D、和X进行排序,得到排序后更新的行〈网络信息B(2.3),网络信息D(2.7),网络信息C(2.3),网络信息X(2.0)〉。
对于更新的行〈网络信息C(2.3),网络信息B(2.3),网络信息D(2.7),网络信息X(2.0)〉和〈网络信息D(2.7),网络信息B(2.3),网络信息C(2.3),网络信息X(2.0)〉,分别同行〈网络信息B(2.3),网络信息C(2.3),网络信息D(2.7),网络信息X(2.0)〉一样执行上述过程,就不再详细说明;如此得到矩阵8所示的第四信息关联矩阵。
矩阵8
A ( 1.1 ) C ( 1 . 3 ) B ( 1.2 ) B ( 2.3 ) D ( 2.7 ) C ( 2.3 ) X ( 2.0 ) C ( 2.3 ) D ( 2.7 ) B ( 2.3 ) X ( 2.0 ) D ( 1.2 ) B ( 2.3 ) C ( 2.3 ) X ( 2.0 ) H ( 1.2 ) I ( 1.5 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) J ( 1.0 ) J ( 1.0 ) I ( 1.5 ) I ( 1.2 )
步骤209:根据第二用户对应的个人关联矩阵、第一用户对应的个人关联矩阵和第二网络信息,在第四信息关联矩阵中添加新行,得到第五信息关联矩阵,新行的第一列元素为第二网络信息,新行的其他各列元素为第二网络信息的相关网络信息;
具体地,本步骤可以通过如下2091至2093的步骤来实现,包括:
2091:从第二用户对应的个人关联矩阵和第一用户对应的个人关联矩阵中获取行的第一列元素为第二网络信息的行;
例如,从矩阵2、矩阵3和矩阵6所示的个人关联矩阵中获取行的第一列元素为第二网络信息X的行〈网络信息X(2.0),网络信息B(1.2),网络信息C(1.3),网络信息D(1.5)〉。
2092:对获取的各行进行合并,且在合并过程中将相同网络信息的权重进行累加;
2093:将合并的行添加到第四信息关联矩阵中,得到第五信息关联矩阵。
例如,将行〈网络信息X(2.0),网络信息B(1.2),网络信息C(1.3),网络信息D(1.5)〉添加至矩阵8所示的第四信息关联矩阵中,如此得到矩阵9所示的第五信息关联矩阵。
矩阵9
A ( 1.1 ) C ( 1.3 ) B ( 1.2 ) B ( 2.3 ) D ( 2.7 ) C ( 2.3 ) X ( 2.0 ) C ( 2.3 ) D ( 2.7 ) B ( 2.3 ) X ( 2.0 ) D ( 1.2 ) B ( 2.3 ) C ( 2.3 ) X ( 2.0 ) H ( 1.2 ) I ( 1.5 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) J ( 1.0 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) X ( 2.0 ) B ( 1.2 ) C ( 1.3 ) D ( 1.5 )
步骤210:在第五信息关联矩阵中,对新行中存储的除第二网络信息以外的其他网络信息按关联热度进行排序,得到第六信息关联矩阵;
具体地,可以通过如下2101和2102两步骤完成,包括:
2101:根据新行中的相关网络信息的权重和和位于新行中的第二网络信息的权重,计算新行中的相关网络信息的关联热度;
具体地,对于新行中任一相关网络信息,计算该相关网络信息的权重与第二网络信息的权重之间的比值,将计算的比值作为该相关网络信息的关联热度。
例如,对于新行〈网络信息X(2.0),网络信息B(1.2),网络信息C(1.3),网络信息D(1.5)〉中的相关网络信息B,根据相关网络信息B的权重1.2和第二网络信息X的权重2.0,计算相关网络信息B的权重与第二网络信息X的权重之间的比值0.6,将计算的比值0.6作为相关网络信息B的关联热度,以及对于该行中的相关网络信息C和D,可以按照计算相关网络信息B的关联热度的方法计算出相关网络信息C的关联热度为0.65和相关网络信息D的关联热度为0.75。
2102:按计算的关联热度对新行中的相关网络信息进行排序,得到第六信息关联矩阵。
例如,对于新行〈网络信息X(2.0),网络信息B(1.2),网络信息C(1.3),网络信息D(1.5)〉,按照计算出关联热度对该行中的相关网络信息B、C和D进行排序,得到排序后新行〈网络信息X(2.0),网络信息D(1.5),网络信息C(1.3),网络信息B(1.2)〉,如此得到矩阵10所示的第六信息关联矩阵。
矩阵10
A ( 1.1 ) C ( 1.3 ) B ( 1.2 ) B ( 2.3 ) D ( 2.7 ) C ( 2.3 ) X ( 2.0 ) C ( 2.3 ) D ( 2.7 ) B ( 2.3 ) X ( 2.0 ) D ( 1.2 ) B ( 2.3 ) C ( 2.3 ) X ( 2.0 ) H ( 1.2 ) I ( 1.5 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) J ( 1.0 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) X ( 2.0 ) D ( 1.5 ) C ( 1.3 ) B ( 1.2 )
步骤211:获取浏览时间不在第二时间段内的网络信息,从第六信息关联矩阵中删除行的第一列元素为获取的网络信息的行,以及从第六信息关联矩阵剩下的行中删除获取的网络信息得到第七信息关联矩阵,将第七信息关联矩阵作为推荐信息矩阵。
例如,历史记录文件中包括的网络信息A的浏览时间不在第二时间段内,则获取网络信息A,从矩阵10所示的第六信息关联矩阵中删除行〈网络信息A(1.1),网络信息C(1.3),网络信息B(1.2)〉,如此得到矩阵11所示的第七信息关联矩阵,其中,矩阵5所示的第二信息关联矩阵中,已经对每行的相关网络信息按关联热度进行了排序,无需再对矩阵5中未更新的行做其他操作,因此,将将矩阵11所示的第七信息关联矩阵作为推荐信息矩阵。
矩阵11
B ( 2.3 ) D ( 2.7 ) C ( 2.3 ) X ( 2.0 ) C ( 2.3 ) D ( 2.7 ) B ( 2.3 ) X ( 2.0 ) D ( 1.2 ) B ( 2.3 ) C ( 2.3 ) X ( 2.0 ) H ( 1.2 ) I ( 1 . 5 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) J ( 1.0 ) J ( 1.0 ) I ( 1.5 ) H ( 1.2 ) X ( 2.0 ) D ( 1.5 ) C ( 1.3 ) B ( 1.2 )
进一步地,从历史记录文件中获取浏览时间不在第二时间段内的网络信息,并从历史记录文件中删除获取的网络信息。
可选的,当某一用户正在浏览网络信息时,根据该用户浏览的该网络信息,从推荐信息矩阵中获取行的第一列元素为该网络信息的行,获取该行中的相关网络信息,在相关网络信息中选择关联热度最大的预设数值个相关网络信息,并将选择的相关网络信息推荐给该用户。
其中,本发明所述的个人关联矩阵和信息关联矩阵均存储在缓存里,因此可以对矩阵里的数据进行修改,以实现更新推荐信息矩阵。
在本发明实施例中,获取在离当前最近且时长为预设第一时长的第一时间段内浏览网络信息的第一用户,获取第一用户在离当前最近且时长为预设第二时长的第二时间段内浏览的网络信息,根据第一用户浏览的网络信息,计算推荐信息矩阵中的部分记录。其中,第一时长小于第二时长,且第一时长可以为半小时或一小时等,所以第一时间段内浏览网络信息的第一用户的数目不是很多,获取的第一用户在第二时间段内浏览网络信息的数目也不是很多,所以每次计算推荐信息矩阵的计算复杂度也不是很高,可以缩短任意相邻两次计算推荐信息矩阵之间的时间间隔,且任意相邻两次计算推荐信息矩阵之间的时间间隔小于第二时长,提高了计算推荐信息矩阵的频率,并进一步提高根据推荐信息矩阵推荐信息的时效性。
实施例3
参见图3,本发明实施例提供了一种热度关联的海量数据实时计算装置,包括:
获取模块301,用于获取第一用户,第一用户为在第一时间段内浏览网络信息的用户,第一时间段为离当前最近且时长为预设第一时长的时间段;
构建模块302,用于根据第一用户在第二时间段内浏览的网络信息,构建第一用户对应的个人关联矩阵,第二时间段为离当前最近且时长为预设第二时长的时间段,第二时长大于第一时长;
计算模块303,用于根据已存储的第二用户对应的个人关联矩阵和第一用户对应的个人关联矩阵,计算推荐信息矩阵,第二用户为用户群体中除第一用户以外的其他用户。
优选地,计算模块303包括:
第一获取单元,用于从第一用户在第二时间段内浏览的网络信息中获取已存储的信息关联矩阵中存在的网络信息作为第一网络信息;
更新单元,用于根据第二用户对应的个人关联矩阵和第一用户对应的个人关联矩阵,对信息关联矩阵中行的第一列元素为第一网络信息的行进行更新;
第一排序单元,用于在信息关联矩阵中,对更新的行中存储的除第一网络信息以外的其他网络信息按关联热度进行排序,得到推荐信息矩阵。
优选地,更新单元包括:
第一获取子单元,用于从第二用户对应的个人关联矩阵和第一用户对应的个人关联矩阵中获取行的第一列元素为第一网络信息的行;
第一合并子单元,用于对获取的各行进行合并,且在合并的过程中将相同网络信息的权重进行累加;
更新子单元,用于将信息关联矩阵中行的第一列元素为第一网络信息的行更新为合并的行。
优选地,计算模块303包括:
第二获取单元,用于从第一用户在第二时间段内浏览的网络信息中获取已存储的信息关联矩阵中不存在的网络信息作为第二网络信息;
添加单元,用于根据第二用户对应的个人关联矩阵和第一用户对应的个人关联矩阵,在信息关联矩阵中添加新行,新行的第一列元素为第二网络信息,新行的其他各列元素为第二网络信息的相关网络信息;
第二排序单元,用于在信息关联矩阵中,将新行中的网络信息按关联热度进行排序,得到推荐信息矩阵。
优选地,添加单元包括:
第二获取子单元,用于从第二用户对应的个人关联矩阵和第一用户对应的个人关联矩阵中获取行的第一列元素为第二网络信息的行;
第二合并子单元,用于对获取的各行进行合并,且在合并的过程中将相同网络信息的权重进行累加;
添加子单元,用于将合并的行添加到信息关联矩阵中。
进一步地,该装置还包括:
删除模块,用于获取浏览时间不在第二时间段内的网络信息,从推荐信息矩阵中删除行的第一列元素为获取的网络信息的行,以及,从推荐信息矩阵剩下的行中删除获取的网络信息。
优选地,获取模块301包括:
计时单元,用于在最近上一次计算推荐信息矩阵后,第一次监测出有用户浏览网络信息时,开始计时;
第三获取单元,用于当计时的时间达到预设第一时长时,获取在计时的时间段内浏览网络信息的用户作为第一用户。
在本发明实施例中,获取在离当前最近且时长为预设第一时长的第一时间段内浏览网络信息的第一用户,获取第一用户在离当前最近且时长为预设第二时长的第二时间段内浏览的网络信息,根据第一用户浏览的网络信息,计算推荐信息矩阵中的部分记录。其中,第一时长小于第二时长,且第一时长可以为半小时或一小时等,所以第一时间段内浏览网络信息的第一用户的数目不是很多,获取的第一用户在第二时间段内浏览网络信息的数目也不是很多,所以每次计算推荐信息矩阵的计算复杂度也不是很高,可以缩短任意相邻两次计算推荐信息矩阵之间的时间间隔,且任意相邻两次计算推荐信息矩阵之间的时间间隔小于第二时长,提高了计算推荐信息矩阵的频率,并进一步提高根据推荐信息矩阵推荐信息的时效性。
实施例4
参见图4,本发明实施例提供了一种热度关联的海量数据实时计算服务器,包括:
中央处理单元(CPU)401、包括随机存取存储器(RAM)402和只读存储器(ROM)403的系统存储器404,以及连接系统存储器404和中央处理单元401的系统总线405。所述服务器400还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)406,和用于存储操作系统413、应用程序410和其他程序模块415的大容量存储设备407。
所述基本输入/输出系统406包括有用于显示信息的显示器408和用于用户输入信息的诸如鼠标、键盘之类的输入设备409。其中所述显示器408和输入设备409都通过连接到系统总线405的输入输出控制器410连接到中央处理单元401。所述基本输入/输出系统406还可以包括输入输出控制器410以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器410还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备407通过连接到系统总线405的大容量存储控制器(未示出)连接到中央处理单元401。所述大容量存储设备407及其相关联的计算机可读介质为服务器400提供非易失性存储。也就是说,所述大容量存储设备407可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器404和大容量存储设备407可以统称为存储器。
根据本发明的各种实施例,所述服务器400还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器400可以通过连接在所述系统总线405上的网络接口单元411连接到网络412,或者说,也可以使用网络接口单元411来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,所述一个或者一个以上程序包含用于进行本发明实施例提供的热度关联的海量数据实时计算方法的指令。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种热度关联的海量数据实时计算方法,其特征在于,所述方法包括:
获取第一用户,所述第一用户为在第一时间段内浏览网络信息的用户,所述第一时间段为离当前最近且时长为预设第一时长的时间段;
根据所述第一用户在第二时间段内浏览的网络信息,构建所述第一用户对应的个人关联矩阵,所述第二时间段为离当前最近且时长为预设第二时长的时间段,所述第二时长大于所述第一时长,所述个人关联矩阵中每行的第一列元素为所述第一用户浏览的网络信息,该行除第一列元素以外的其他各列元素为该第一列元素的相关网络信息,且相关网络信息为所述用户浏览的除该第一列元素以外的其他网络信息;
根据已存储的第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,计算推荐信息矩阵,所述第二用户为用户群体中除所述第一用户以外的其他用户,所述推荐信息矩阵中每行的第一列元素为所述用户群体的用户浏览的网络信息,该行中除第一列元素以外的其他各列元素均为第一列元素的相关网络信息,且该行中的相关网络信息均按其关联热度进行排序。
2.如权利要求1所述的方法,其特征在于,所述根据已存储的第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,计算推荐信息矩阵,包括:
从所述第一用户在所述第二时间段内浏览的网络信息中获取已存储的信息关联矩阵中存在的网络信息作为第一网络信息;
根据所述第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,对所述信息关联矩阵中行的第一列元素为所述第一网络信息的行进行更新;
在所述信息关联矩阵中,对所述更新的行中存储的除所述第一网络信息以外的其他网络信息按关联热度进行排序,得到推荐信息矩阵。
3.如权利要求2所述的方法,其特征在于,所述根据第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,对所述信息关联矩阵中行的第一列元素为所述第一网络信息的行进行更新,包括:
从所述第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵中获取行的第一列元素为所述第一网络信息的行;
对所述获取的各行进行合并,且在合并的过程中将相同网络信息的权重进行累加;
将所述信息关联矩阵中行的第一列元素为所述第一网络信息的行更新为所述合并的行。
4.如权利要求1所述的方法,其特征在于,所述根据已存储的第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,计算推荐信息矩阵,包括:
从所述第一用户在所述第二时间段内浏览的网络信息中获取已存储的信息关联矩阵中不存在的网络信息作为第二网络信息;
根据所述第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,在所述信息关联矩阵中添加新行,所述新行的第一列元素为所述第二网络信息,所述新行的其他各列元素为所述第二网络信息的相关网络信息;
在所述信息关联矩阵中,将所述新行中的网络信息按关联热度进行排序,得到推荐信息矩阵。
5.如权利要求4所述的方法,其特征在于,所述根据第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,在所述信息关联矩阵中添加一行新行,包括:
从所述第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵中获取行的第一列元素为所述第二网络信息的行;
对所述获取的各行进行合并,且在合并的过程中将相同网络信息的权重进行累加;
将所述合并的行添加到所述信息关联矩阵中。
6.如权利要求1至5任一项权利要求所述的方法,其特征在于,所述方法还包括:
获取浏览时间不在所述第二时间段内的网络信息,从所述推荐信息矩阵中删除行的第一列元素为所述获取的网络信息的行,以及,从所述推荐信息矩阵剩下的行中删除所述获取的网络信息。
7.如权利要求1至5任一项权利要求所述的方法,其特征在于,所述获取第一用户,包括:
在最近上一次计算所述推荐信息矩阵后,第一次监测出有用户浏览网络信息时,开始计时;
当计时的时间达到所述预设第一时长时,获取在计时的时间段内浏览网络信息的用户作为第一用户。
8.一种热度关联的海量数据实时计算装置,其特征在于,所述装置包括:
获取模块,用于获取第一用户,所述第一用户为在第一时间段内浏览网络信息的用户,所述第一时间段为离当前最近且时长为预设第一时长的时间段;
构建模块,用于根据所述第一用户在第二时间段内浏览的网络信息,构建所述第一用户对应的个人关联矩阵,所述第二时间段为离当前最近且时长为预设第二时长的时间段,所述第二时长大于所述第一时长,所述个人关联矩阵中每行的第一列元素为所述第一用户浏览的网络信息,该行除第一列元素以外的其他各列元素为该第一列元素的相关网络信息,且相关网络信息为所述用户浏览的除该第一列元素以外的其他网络信息;
计算模块,用于根据已存储的第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,计算推荐信息矩阵,所述第二用户为用户群体中除所述第一用户以外的其他用户,所述推荐信息矩阵中每行的第一列元素为所述用户群体的用户浏览的网络信息,该行中除第一列元素以外的其他各列元素均为第一列元素的相关网络信息,且该行中的相关网络信息均按其关联热度进行排序。
9.如权利要求8所述的装置,其特征在于,所述计算模块包括:
第一获取单元,用于从所述第一用户在所述第二时间段内浏览的网络信息中获取已存储的信息关联矩阵中存在的网络信息作为第一网络信息;
更新单元,用于根据所述第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,对所述信息关联矩阵中行的第一列元素为所述第一网络信息的行进行更新;
第一排序单元,用于在所述信息关联矩阵中,对所述更新的行中存储的除所述第一网络信息以外的其他网络信息按关联热度进行排序,得到推荐信息矩阵。
10.如权利要求9所述的装置,其特征在于,所述更新单元包括:
第一获取子单元,用于从所述第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵中获取行的第一列元素为所述第一网络信息的行;
第一合并子单元,用于对所述获取的各行进行合并,且在合并的过程中将相同网络信息的权重进行累加;
更新子单元,用于将信息关联矩阵中行的第一列元素为所述第一网络信息的行更新为所述合并的行。
11.如权利要求8所述的装置,其特征在于,所述计算模块包括:
第二获取单元,用于从所述第一用户在所述第二时间段内浏览的网络信息中获取已存储的信息关联矩阵中不存在的网络信息作为第二网络信息;
添加单元,用于根据所述第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵,在所述信息关联矩阵中添加新行,所述新行的第一列元素为所述第二网络信息,所述新行的其他各列元素为所述第二网络信息的相关网络信息;
第二排序单元,用于在所述信息关联矩阵中,将所述新行中的网络信息按关联热度进行排序,得到推荐信息矩阵。
12.如权利要求11所述的装置,其特征在于,所述添加单元包括:
第二获取子单元,用于从所述第二用户对应的个人关联矩阵和所述第一用户对应的个人关联矩阵中获取行的第一列元素为所述第二网络信息的行;
第二合并子单元,用于对所述获取的各行进行合并,且在合并的过程中将相同网络信息的权重进行累加;
添加子单元,用于将所述合并的行添加到所述信息关联矩阵中。
13.如权利要求8至12任一项权利要求所述的装置,其特征在于,所述装置还包括:
删除模块,用于获取浏览时间不在所述第二时间段内的网络信息,从所述推荐信息矩阵中删除行的第一列元素为所述获取的网络信息的行,以及,从所述推荐信息矩阵剩下的行中删除所述获取的网络信息。
14.如权利要求8至12任一项权利要求所述的装置,其特征在于,所述获取模块包括:
计时单元,用于在最近上一次计算所述推荐信息矩阵后,第一次监测出有用户浏览网络信息时,开始计时;
第三获取单元,用于当计时的时间达到所述预设第一时长时,获取在计时的时间段内浏览网络信息的用户作为第一用户。
CN201310719339.2A 2013-12-20 2013-12-20 一种热度关联的海量数据实时计算方法、装置及服务器 Active CN104090900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310719339.2A CN104090900B (zh) 2013-12-20 2013-12-20 一种热度关联的海量数据实时计算方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310719339.2A CN104090900B (zh) 2013-12-20 2013-12-20 一种热度关联的海量数据实时计算方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN104090900A CN104090900A (zh) 2014-10-08
CN104090900B true CN104090900B (zh) 2015-07-29

Family

ID=51638616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310719339.2A Active CN104090900B (zh) 2013-12-20 2013-12-20 一种热度关联的海量数据实时计算方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN104090900B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101489107A (zh) * 2009-01-21 2009-07-22 华东师范大学 一种基于人口属性关键字向量的协作过滤推荐方法
CN101826114A (zh) * 2010-05-26 2010-09-08 南京大学 一种基于多马尔可夫链的内容推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8326580B2 (en) * 2008-01-29 2012-12-04 Qualcomm Incorporated Sparse sampling of signal innovations

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101489107A (zh) * 2009-01-21 2009-07-22 华东师范大学 一种基于人口属性关键字向量的协作过滤推荐方法
CN101826114A (zh) * 2010-05-26 2010-09-08 南京大学 一种基于多马尔可夫链的内容推荐方法

Also Published As

Publication number Publication date
CN104090900A (zh) 2014-10-08

Similar Documents

Publication Publication Date Title
CN108920588B (zh) 一种用于人机交互的知识图谱更新方法及系统
US20170083965A1 (en) Item Recommendation Method and Apparatus
CN104079960B (zh) 文件推荐方法和装置
CN106294830A (zh) 多媒体资源的推荐方法及装置
US20130151536A1 (en) Vertex-Proximity Query Processing
CN104462594A (zh) 一种提供用户个性化资源消息推送的方法和装置
CN110110101B (zh) 多媒体内容的推荐方法、装置、终端、服务器及可读介质
CN104243590A (zh) 资源对象推荐方法和装置
JP5662299B2 (ja) 情報推薦装置及び方法及び装置及びプログラム
CN105760395A (zh) 一种数据处理的方法、装置及系统
CN110209909A (zh) 数据爬取方法、装置、计算机设备和存储介质
CN106528851A (zh) 一种智能推荐方法及装置
CN104166730A (zh) 一种呈现搜索结果的方法及装置
CN108958612B (zh) 控制页面滑动的方法、控制页面方法、系统、终端设备及介质
CN110019944A (zh) 一种视频的推荐方法及系统
CN107153702A (zh) 一种数据处理方法及装置
Babaie-Kafaki et al. Two hybrid nonlinear conjugate gradient methods based on a modified secant equation
CN109034880A (zh) 收入预测方法及装置
CN104503868A (zh) 数据同步方法、装置以及系统
CN104484413A (zh) 一种获得搜索结果的方法和装置
Byrd et al. An active-set algorithm for nonlinear programming using parametric linear programming
CN106570068B (zh) 信息推荐方法及装置
CN110851708B (zh) 负样本的抽取方法、装置、计算机设备和存储介质
CN104090900B (zh) 一种热度关联的海量数据实时计算方法、装置及服务器
CN110188277A (zh) 一种资源的推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant