CN104376015B - 关系网络中节点的处理方法及装置 - Google Patents

关系网络中节点的处理方法及装置 Download PDF

Info

Publication number
CN104376015B
CN104376015B CN201310356173.2A CN201310356173A CN104376015B CN 104376015 B CN104376015 B CN 104376015B CN 201310356173 A CN201310356173 A CN 201310356173A CN 104376015 B CN104376015 B CN 104376015B
Authority
CN
China
Prior art keywords
matrix
network nodes
network
nodes
sparse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310356173.2A
Other languages
English (en)
Other versions
CN104376015A (zh
Inventor
冯校伟
任姣姣
熊焰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310356173.2A priority Critical patent/CN104376015B/zh
Priority to PCT/CN2014/082363 priority patent/WO2015021845A1/en
Priority to US14/592,407 priority patent/US10169386B2/en
Publication of CN104376015A publication Critical patent/CN104376015A/zh
Application granted granted Critical
Publication of CN104376015B publication Critical patent/CN104376015B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/278Data partitioning, e.g. horizontal or vertical partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例公开一种关系网络中节点的处理方法,包括:侦测到排序请求时,获取与排序请求相应的待排序的网络节点,并根据待排序的网络节点,构建特征矩阵;获取网络节点之间的关联信息,并根据所述网络节点之间的关联信息构建稀疏矩阵;将稀疏矩阵与特征矩阵进行迭代相乘计算,获得新的特征矩阵,直到特征矩阵收敛;根据收敛后的特征矩阵的元素值,对网络节点进行排序。对应地,本发明实施例还公开了一种关系网络中节点的处理装置。本发明实施例可以使用通用的结构查询语言实现,而且对于中小数据集的网络节点排序可以利用关系型数据库极快速的实现;对于大型或大型数据集的网络节点排序则可以利用hive、hadoop分布式计算平台轻松实现。

Description

关系网络中节点的处理方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种关系网络中节点的处理方法及装置。
背景技术
随着Google的崛起,业界对PageRank算法的研究和应用越来越多。目前PageRank算法被广泛应用于计算关系网络中各节点的影响力排名。目前的算法实现有用C/C++实现的、有用java实现的、有的甚至直接用商业软件封装好的算法。但是,现有的算法实现都有一定的局限性,有的是无法并行计算,只能用于中小型数据集的计算;有的虽然可以并行计算,但是实现麻烦,不便于维护。
发明内容
本发明实施例的主要目的是提供一种关系网络中节点的处理方法及装置,旨在既可以实现中小型数据集的网络节点的排序,也可以实现大型或超大型数据集的网络节点的排序。
为达到以上目的,本发明实施例提供了一种关系网络中节点的处理方法,包括以下步骤:
侦测到排序请求时,获取与排序请求相应的待排序的网络节点,并根据所述待排序的网络节点,构建特征矩阵;
获取网络节点之间的关联信息,并根据所述网络节点之间的关联信息构建稀疏矩阵;
将稀疏矩阵与特征矩阵进行迭代相乘计算,获得新的特征矩阵,直到特征矩阵收敛;
根据收敛后的特征矩阵的元素值,对网络节点进行排序。
对应地,本发明实施例还提供了一种关系网络中节点的处理装置,包括:
特征矩阵构建模块,用于侦测到排序请求时,获取与排序请求相应的待排序的网络节点,并根据所述待排序的网络节点构建特征矩阵;
稀疏矩阵构建模块,用于获取网络节点之间的关联信息,并根据所述网络节点之间的关联信息构建稀疏矩阵;
计算模块,用于将稀疏矩阵与特征矩阵进行迭代相乘计算,获得新的特征矩阵,直到特征矩阵收敛;
排序模块,用于根据收敛后的特征矩阵的元素值,对网络节点进行排序。
本发明实施例根据待排序的网络节点构建稀疏矩阵及特征矩阵,并对稀疏矩阵及特征矩阵进行迭代相乘计算,直到特征矩阵收敛。然后根据收敛后的特征矩阵中的元素值对网络节点进行排序。本发明实施例可以使用通用的结构查询语言实现,而且对于中小数据集的网络节点排序可以利用关系型数据库极快速的实现;对于大型或大型数据集的网络节点排序则可以利用hive、hadoop分布式计算平台轻松实现。
附图说明
图1是本发明用户通过网络平台建立关系网的示意图;
图2是本发明关系网络中节点的处理方法优选实施例的流程示意图;
图3是本发明关系网络中节点的处理方法中构建稀疏矩阵的流程示意图;
图4是本发明关系网络中节点的处理方法中构建特征矩阵的流程示意图;
图5是本发明关系网络中节点的处理方法中根据微博转发关系构建原始矩阵的示意图;
图6是图5中的原始矩阵经过概率转移处理后获得的稀疏矩阵的示意图;
图7是本发明关系网络中节点的处理装置一实施例的功能模块示意图;
图8是本发明关系网络中节点的处理装置中矩阵构建模块的功能模块示意图;
图9是本发明关系网络中节点的处理装置另一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下结合说明书附图及具体实施例进一步说明本发明的技术方案。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的主要思想是通过将待排序的网络节点构建成特征矩阵,然后根据网络节点的关联信息构建成稀疏矩阵,再将稀疏矩阵与特征矩阵进行迭代相乘计算,直到特征矩阵收敛,最后再根据收敛后的特征矩阵中的元素值对网络节点进行排序。本发明基于通用的结构化查询语言(Structured Query Language,SQL)语言实现,对矩阵进行最小化存储,而且进行迭代相乘计算时可以进行分块计算。
本发明运行于各种网络平台,该网络平台可以为微博平台、网络游戏的玩家交易平台等。如图1所示,用户之间通过网络平台建立关系网,通过本发明可以对同一关系网中的网络节点进行排序。而且,对于中小数据集的网络节点排序可以利用关系型数据库极快速的实现;对于大型或大型数据集的网络节点排序则可以利用hive、hadoop分布式计算平台轻松实现。以下实施例将以微博平台为例,对微博平台中用户与用户的收听关系以及微博转发关系进行实施例的具体描述。
参照图2,提出本发明一种关系网络中节点的处理方法一实施例。该实施例的关系网络中节点的处理方法包括以下步骤:
步骤S110、侦测到排序请求时,获取与排序请求相应的待排序的网络节点,并根据所述待排序的网络节点,构建特征矩阵;
该排序请求可以包括待排序的网络节点的节点类型,也可以包括一预置时间内访问某网络的用户节点。本实施例中,侦测到排序请求时,将统计一预置时间内访问该网络的用户节点,作为待排序的网络节点。其中,该预置时间可以以天或小时计算。获取待排序的网络节点,则构建特征矩阵B,本实施例中,该特征矩阵B为n*1的矩阵,如下所示:
Figure BDA0000366983411
其中,b11、b21、…、bn1的值均为“1/n”,n为网络节点的个数。
步骤S120、获取网络节点之间的关联信息,并根据所述网络节点之间的关联信息构建稀疏矩阵;
根据待排序的网络节点,从网络的后台数据库中获取网络节点之间的关联信息,例如微博平台用户节点之间具有收听或被收听的关系,还有微博被转发以及转发条数等关系。然后根据网络节点之间的关联信息,构建稀疏矩阵。本发明实施例中,该稀疏矩阵为n*n的矩阵,该稀疏矩阵中元素值为网络节点的关系值,而且该关系值仅为一种关系。例如,仅对网络节点的收听与被收听关系进行统计,或者仅对网络节点的微博转发或被转发的关系进行统计。
步骤S130、将稀疏矩阵与特征矩阵进行迭代相乘计算,直到特征矩阵收敛;
具体为,将稀疏矩阵与特征矩阵相乘后,获得新的特征矩阵,然后再将该稀疏矩阵与新的特征矩阵相乘,直到特征矩阵收敛,获得最终的特征矩阵。该特征矩阵收敛是通过将该新的特征矩阵中各元素值与上一特征矩阵中各元素值进行求差计算,并获取所有差值的绝对值的和,然后判断所有差值的绝对值的和是否趋近于零,是则判断特征矩阵收敛,否则判断特征矩阵未收敛。
步骤S140、根据收敛后的特征矩阵的元素值,对网络节点进行排序。
当特征矩阵收敛后,根据最终的特征矩阵中的元素值,对网络节点进行从大到小排列。
本发明实施例根据待排序的网络节点构建稀疏矩阵及特征矩阵,并对稀疏矩阵及特征矩阵进行迭代相乘计算,直到特征矩阵收敛。然后根据收敛后的特征矩阵中的元素值对网络节点进行排序。本发明实施例可以使用通用的结构查询语言实现,而且对于中小数据集的网络节点排序可以利用关系型数据库极快速的实现;对于大型或大型数据集的网络节点排序则可以利用hive、hadoop分布式计算平台轻松实现。
进一步地,参照图3,上述步骤S120中构建稀疏矩阵具体包括:
步骤S121、根据网络节点,构建原始矩阵,且所述原始矩阵中的元素值均为“0”;
根据所有网络节点,构建原始矩阵,如下:
Figure BDA0000366983412
而且,该矩阵中的元素值均为“0”。
步骤S122、当所述网络节点之间的关联信息中两个网络节点存在关联,则设置原始矩阵中该两个网络节点对应的元素值为“1”,并更新原始矩阵;
根据网络节点之间的关联信息,判断每两个网络节点之间是否存在关联,例如“收听”与“被收听”的关系,若存在关联,则设置原始矩阵中该网络节点对应的元素值为“1”,若不存在关联,则不做处理。
例如,网络节点为10个,若第一个网络节点分别与第二个网络节点 、第五个网络节点及第八个网络节点之间为互相收听关系,则设置g12、g21、g15、g51、g18、g81均设置为“1”;若第一个网络节点收听第三网络节点及第六网络节点,则设置g31、g61设置为“1”。
步骤S123、对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵。
对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵,如下:
Figure BDA0000366983413
其中,
Figure BDA0000366983414
该公式中P为经典常量,cj为矩阵G 中第j列元素之和。
观察上述公式可知:
•当gij =1时: aij = p/cj + (1-p)/n
•当gij =0且 cj <> 0时: aij = (1-p)/n
•当gij =0且 cj = 0 时: aij = 1/n
假设Ai为矩阵G中第i行不为0的列序号的集合,D为矩阵G中Cj =0的列的序号集合。则将稀疏矩阵A与特征矩阵B进行迭代相乘时,将获得:
Figure BDA0000366983415
由此可知,在进行矩阵A与矩阵B进行迭代相乘时,可以对其进行分块计算,即分成
Figure BDA0000366983416
三块分别进行计算,然后再进行相加。而且只需存储Cj =0的列的列号,以及存储原始矩阵G中元素值为1的行号及列号和原始矩阵G中元素值为1的元素点在概率转移后的矩阵A中对应的点的元素值,就可以进行迭代计算。
通过上述稀疏矩阵的设置使得稀疏矩阵A与特征矩阵B在迭代相乘时,可以对数据进行分块计算,提高了计算效率。而且在迭代相乘时,不需要存储所有的数据,节省了存储空间。
进一步地,参照图4,上述步骤S123包括:
步骤S1231、判断网络节点之间的关联信息是否存在联系频率的信息;是则转入步骤S1232;否则转入步骤S1233;
如前所述,网络节点的关联信息可以包括只有一种状态的关系信息,例如收听与被收听,当然该网络节点的关联信息还可以包括多种状态的关系信息,例如微博转发的关系中,转发微博的次数。因此,在对稀疏矩阵进行概率转移处理时,同时要考虑联系频率的信息。
步骤S1232、根据所述联系频率的信息对应的权重值,对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵;
当网络节点之间的关联信息中存在联系频率时,则根据联系频率获取其相应的权重值。例如网络节点A转发网络节点B的微博条数越多,则该行号为“网络节点A”列号为“网络节点B”对应的元素的权重值越大。然后再根据该获得的权重值,对对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵
步骤S1233、直接对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵。
如图5所示,存在六个网络节点A~F,箭头表示微博转发,例如B的箭头指向A表示“网络节点B转发网络节点A的微博”。箭头上的数值表示微博的转发条数。根据网络节点的关联信息,构建的原始矩阵G则为图5右边所示。根据网络节点之间转发微博的条数可以获得其相应的权重值,然后根据该权重值,对原始矩阵G进行概率转移处理,获得稀疏矩阵A。如图6所示,由于网络节点B转发网络节点A的微博条数更多,因此所获得的稀疏矩阵A中,相应的元素值为2/3。可以理解的是,该举例仅为了说明获得稀疏矩阵A时,若网络节点之间的关联信息中包括联系频率的信息时,还要考虑其联系频率的信息对应的权重值。
对应上述方法实施例,本发明还提供了一种关系网络中节点的处理装置。参照图7,本发明关系网络中节点的处理装置包括:
特征矩阵构建模块110,用于侦测到排序请求时,获取与排序请求相应的待排序的网络节点,并根据所述待排序的网络节点构建特征矩阵;
稀疏矩阵构建模块120,用于获取网络节点之间的关联信息,并根据所述网络节点之间的关联信息构建稀疏矩阵;
计算模块130,用于将稀疏矩阵与特征矩阵进行迭代相乘计算,获得新的特征矩阵,直到特征矩阵收敛;
排序模块140,用于根据收敛后的特征矩阵的元素值,对网络节点进行排序。
上述特征矩阵构建模块110中,排序请求可以包括待排序的网络节点的节点类型,也可以包括一预置时间内访问某网络的用户节点。本实施例中,侦测到排序请求时,将统计一预置时间内访问该网络的用户节点,作为待排序的网络节点。其中,该预置时间可以以天或小时计算。则特征矩阵构建模块110接收到该排序请求后,获取与排序请求相应的网络节点,并根据所获取的网络节点,构建特征矩阵,本实施例中,该特征矩阵是n*1的矩阵,而且特征矩阵中的元素值均为“1/n”,n为网络节点的个数。
然后稀疏矩阵构建模块120根据待排序的网络节点,从网络的后台数据库中获取网络节点之间的关联信息,例如微博平台用户节点之间具有收听或被收听的关系,还有微博被转发以及转发条数等关系。然后矩阵构建模块120根据网络节点之间的关联信息,构建稀疏矩阵。本发明实施例中,该稀疏矩阵为n*n的矩阵,稀疏矩阵中元素值为网络节点的关系值,而且该关系值仅为一种关系。
然后计算模块130将特征矩阵构建模块110构建的特征矩阵与稀疏矩阵构建模块120构建的稀疏矩阵进行相乘后,获得新的特征矩阵,然后再将该稀疏矩阵与新的特征矩阵相乘,直到特征矩阵收敛,获得最终的特征矩阵。该特征矩阵收敛是通过将该新的特征矩阵中各元素值与上一特征矩阵中各元素值进行求差计算,并获取所有差值的绝对值的和,然后判断所有差值的绝对值的和是否趋近于零,是则判断特征矩阵收敛,否则判断特征矩阵未收敛。
最后,排序模块140根据最终的特征矩阵中的元素值,对网络节点进行大到小排列。
本发明实施例根据待排序的网络节点构建稀疏矩阵及特征矩阵,并对稀疏矩阵及特征矩阵进行迭代相乘计算,直到特征矩阵收敛。然后根据收敛后的特征矩阵中的元素值对网络节点进行排序。本发明实施例可以使用通用的结构查询语言实现,而且对于中小数据集的网络节点排序可以利用关系型数据库极快速的实现;对于大型或大型数据集的网络节点排序则可以利用hive、hadoop分布式计算平台轻松实现。
进一步地,参照图7,上述稀疏矩阵构建模块120包括:
初始矩阵构建单元121,用于根据网络节点,构建原始矩阵,且所述原始矩阵中的元素值均为“0”;
矩阵元素值设置单元122,用于当所述网络节点之间的关联信息中两个网络节点存在关联,则设置原始矩阵中该两个网络节点对应的元素值为“1”,并更新原始矩阵;
矩阵转换单元123,用于对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵。
如上述方法实施例可知,特征矩阵构建模块110构建的特征矩阵B和稀疏矩阵构建模块120构建的稀疏矩阵A分别为:
Figure BDA0000366983417
Figure BDA0000366983418
假设Ai为矩阵G中第i行不为0的列序号的集合,D为矩阵G中Cj =0的列的序号集合。则将矩阵A与矩阵B进行迭代相乘时,将获得:
Figure BDA0000366983419
由此可知,在进行矩阵A与矩阵B进行迭代相乘时,可以对其进行分块计算,即分成
Figure BDA00003669834110
三块进行计算,然后再相加。因此,通过上述稀疏矩阵的设置使得稀疏矩阵A与特征矩阵B在迭代相乘时,可以对数据进行分块计算再求和,以获得最终的特征矩阵,从而提高了计算效率。
进一步地,上述矩阵转换单元123还用于:当网络节点的关联信息中存在联系频率的信息时,则根据联系频率的信息对应的权重值,对更新后的原始矩阵G进行概率转移处理,获得n*n的稀疏矩阵。
进一步地,参照图9,提出本发明关系网络中节点的处理装置第二实施例。在第一实施例的基础上,该排序装置还包括:
存储模块150,用于存储原始矩阵中一列元素值均为“0”的列号、原始矩阵中矩阵元素值为“1”的行号及列号,同时还存储原始矩阵中矩阵元素值为“1”的元素经过概率转移处理后,获得的稀疏矩阵中对应的元素值。
如前所述,由上述原始矩阵转换稀疏矩阵的公式可知:
•当gij =1时: aij = p/cj + (1-p)/n
•当gij =0且 cj <> 0时: aij = (1-p)/n
•当gij =0且 cj = 0 时: aij = 1/n
因此,在进行迭代计算时,计算模块140可以根据存储的原始矩阵中矩阵元素值为“1”的行号及列号,以及存储的原始矩阵中一列元素值均为“0”的列号,将稀疏矩阵划分为三块数据,并将其三块数据分别与特征矩阵进行相乘后相加,获得新的特征矩阵。该实施例中在进行迭代计算时,只需存储Cj =0的列的列号,以及存储原始矩阵G中元素值为1的行号及列号和原始矩阵G中元素值为1的点在概率转移矩阵A中对应的点的元素值,就可以进行迭代计算,而不需要存储所有的数据,节省了存储空间。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该关系网络中节点的处理装置将通过若干指令实现,该若干指令存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,供终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制其专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (11)

1.一种关系网络中节点的处理方法,应用于社交平台,其特征在于,包括以下步骤:
侦测到排序请求时,获取与排序请求相应的待排序的网络节点,并根据所述待排序的网络节点,构建特征矩阵;其中,所述待排序的网络节点为侦测到排序请求时,统计一预置时间内访问该网络的用户对应的网络节点;
获取网络节点之间的关联信息,并根据所述网络节点之间的关联信息构建稀疏矩阵;其中,所述关联信息表明所述社交平台中用户对应的网络节点之间的关系信息,包括:平台用户节点之间具有收听或被收听的关系、平台上发布的内容被转发或转发条数;所述稀疏矩阵中元素值为所述社交平台中用户对应的网络节点的关系值,而且所述关系值为所述用户对应的网络节点之间的一种关系,所述关系包括:对网络节点的收听与被收听关系进行统计,或者对网络节点的平台上发布的内容转发或被转发的关系进行统计;
根据存储的原始矩阵中矩阵元素值为“1”的行号及列号及存储的原始矩阵中一列元素值均为“0”的列号,将稀疏矩阵划分为三块数据,并将其三块数据分别与特征矩阵进行相乘后相加,获得新的特征矩阵,直到特征矩阵收敛;其中,在所述原始矩阵中,如果网络节点之间的关联信息中两个网络节点存在关联,所述两个网络节点对应的元素值为“1”,其他网络节点对应的元素值为0;
根据收敛后的特征矩阵的元素值,对网络节点进行排序。
2.根据权利要求1所述的关系网络中节点的处理方法,其特征在于,所述根据网络节点之间的关联信息构建稀疏矩阵包括:
根据网络节点,构建原始矩阵,且所述原始矩阵中的元素值均为“0”;
当所述网络节点之间的关联信息中两个网络节点存在关联,则设置原始矩阵中该两个网络节点对应的元素值为“1”,并更新原始矩阵;
对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵。
3.根据权利要求2所述的关系网络中节点的处理方法,其特征在于,所述对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵包括:
当所述网络节点之间的关联信息存在联系频率的信息时,则根据所述联系频率的信息对应的权重值,对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵。
4.根据权利要求2所述的关系网络中节点的处理方法,其特征在于,所述排序方法还包括:
存储原始矩阵中一列元素值均为“0”的列号、原始矩阵中矩阵元素值为“1”的行号及列号,同时还存储原始矩阵中矩阵元素值为“1”的元素经过概率转移处理后,获得的稀疏矩阵中对应的元素值。
5.根据权利要求1至4任一项所述的关系网络中节点的处理方法,其特征在于,所述特征矩阵为n*1的矩阵,所述稀疏矩阵为n*n的矩阵,其中n为网络节点的个数。
6.一种关系网络中节点的处理装置,应用于社交平台,其特征在于,包括:
特征矩阵构建模块,用于侦测到排序请求时,获取与排序请求相应的待排序的网络节点,并根据所述待排序的网络节点构建特征矩阵;其中,所述待排序的网络节点为侦测到排序请求时,统计一预置时间内访问该网络的用户对应的网络节点;
稀疏矩阵构建模块,用于获取网络节点之间的关联信息,并根据所述网络节点之间的关联信息构建稀疏矩阵;其中,所述关联信息表明所述社交平台中用户对应的网络节点之间的关系信息,包括:平台用户节点之间具有收听或被收听的关系、平台上发布的内容被转发或转发条数;所述稀疏矩阵中元素值为所述社交平台中用户对应的网络节点的关系值,而且所述关系值为所述用户对应的网络节点之间的一种关系,所述关系包括:对网络节点的收听与被收听关系进行统计,或者对网络节点的平台上发布的内容转发或被转发的关系进行统计;
计算模块,用于根据存储的原始矩阵中矩阵元素值为“1”的行号及列号及存储的原始矩阵中一列元素值均为“0”的列号,将稀疏矩阵划分为三块数据,并将其三块数据分别与特征矩阵进行相乘后相加,获得新的特征矩阵,直到特征矩阵收敛;其中,在所述原始矩阵中,如果网络节点之间的关联信息中两个网络节点存在关联,所述两个网络节点对应的元素值为“1”,其他网络节点对应的元素值为0;
排序模块,用于根据收敛后的特征矩阵的元素值,对网络节点进行排序。
7.根据权利要求6所述的关系网络中节点的处理装置,其特征在于,所述稀疏矩阵构建模块包括:
初始矩阵构建单元,用于根据网络节点,构建原始矩阵,且所述原始矩阵中的元素值均为“0”;
矩阵元素值设置单元,用于当所述网络节点之间的关联信息中两个网络节点存在关联,则设置原始矩阵中该两个网络节点对应的元素值为“1”,并更新原始矩阵;
矩阵转换单元,用于对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵。
8.根据权利要求7所述的关系网络中节点的处理装置,其特征在于,所述矩阵转换单元还用于:当所述网络节点之间的关联信息存在联系频率的信息时,则根据所述联系频率的信息对应的权重值,对更新后的原始矩阵进行概率转移处理,生成稀疏矩阵。
9.根据权利要求7所述的关系网络中节点的处理装置,其特征在于,所述排序模块还包括:
存储模块,用于存储原始矩阵中一列元素值均为“0”的列号、原始矩阵中矩阵元素值为“1”的行号及列号,同时还存储原始矩阵中矩阵元素值为“1”的元素经过概率转移处理后,获得的稀疏矩阵中对应的元素值。
10.根据权利要求9所述的关系网络中节点的处理装置,其特征在于,所述计算模块用于:根据存储的原始矩阵中矩阵元素值为“1”的行号及列号、存储的原始矩阵中一列元素值均为“0”的列号、原始矩阵中矩阵元素值为“1”的元素经过概率转移处理后获得的稀疏矩阵中对应的元素值,将稀疏矩阵进行分块,并将分块数据分别与特征矩阵进行相乘后相加,获得新的特征矩阵。
11.根据权利要求6至10任一项所述的关系网络中节点的处理装置,其特征在于,所述特征矩阵为n*1的矩阵,所述稀疏矩阵为n*n的矩阵,其中n为网络节点的个数。
CN201310356173.2A 2013-08-15 2013-08-15 关系网络中节点的处理方法及装置 Active CN104376015B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310356173.2A CN104376015B (zh) 2013-08-15 2013-08-15 关系网络中节点的处理方法及装置
PCT/CN2014/082363 WO2015021845A1 (en) 2013-08-15 2014-07-17 Devices and methods for processing network nodes
US14/592,407 US10169386B2 (en) 2013-08-15 2015-01-08 Devices and methods for processing network nodes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310356173.2A CN104376015B (zh) 2013-08-15 2013-08-15 关系网络中节点的处理方法及装置

Publications (2)

Publication Number Publication Date
CN104376015A CN104376015A (zh) 2015-02-25
CN104376015B true CN104376015B (zh) 2020-03-17

Family

ID=52468016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310356173.2A Active CN104376015B (zh) 2013-08-15 2013-08-15 关系网络中节点的处理方法及装置

Country Status (3)

Country Link
US (1) US10169386B2 (zh)
CN (1) CN104376015B (zh)
WO (1) WO2015021845A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951427B (zh) * 2015-06-30 2019-01-11 深圳清华大学研究院 以矩阵为中心的分布式计算框架
CN105808664A (zh) * 2016-02-29 2016-07-27 四川长虹电器股份有限公司 论坛用户排名的方法
CN105956925B (zh) * 2016-04-23 2021-07-02 时趣互动(北京)科技有限公司 一种基于传播网络的重要用户发现方法及装置
CN108512765B (zh) * 2017-02-28 2020-06-16 中国科学院声学研究所 一种基于网络节点分布式Pagerank的网络内容扩散方法
CN108647363A (zh) * 2018-05-21 2018-10-12 安徽知学科技有限公司 图谱构建、显示方法、装置、设备及存储介质
CN112073221B (zh) * 2020-08-14 2022-08-16 合肥本源量子计算科技有限责任公司 一种实现网络节点排序的方法及装置
CN116094943B (zh) * 2023-04-07 2023-06-06 湖南快乐阳光互动娱乐传媒有限公司 一种pcdn节点重要性排名方法、装置和设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140588A (zh) * 2007-10-10 2008-03-12 华为技术有限公司 一种关联关系搜索结果的排序方法及装置
CN101657040A (zh) * 2008-08-21 2010-02-24 华为技术有限公司 一种无线网络拓扑发现方法、装置及系统
CN102141976A (zh) * 2011-01-10 2011-08-03 中国科学院软件研究所 稀疏矩阵的对角线数据存储方法及基于该方法的SpMV实现方法
WO2011156247A2 (en) * 2010-06-11 2011-12-15 Massachusetts Institute Of Technology Processor for large graph algorithm computations and matrix operations
US8180804B1 (en) * 2010-04-19 2012-05-15 Facebook, Inc. Dynamically generating recommendations based on social graph information
CN102611713A (zh) * 2012-04-10 2012-07-25 重庆交通大学 基于熵运算的网络入侵检测方法和装置
CN102880799A (zh) * 2012-09-24 2013-01-16 西北工业大学 一种基于多属性决策的复杂网络节点重要度综合评价方法
CN103106279A (zh) * 2013-02-21 2013-05-15 浙江大学 一种同时基于节点属性以及结构关系相似度的聚类方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4972363A (en) * 1989-02-01 1990-11-20 The Boeing Company Neural network using stochastic processing
CA2327911A1 (en) * 2000-12-08 2002-06-08 Cloakware Corporation Obscuring functions in computer software
US6970397B2 (en) * 2003-07-09 2005-11-29 Gas Technology Institute Determination of fluid properties of earth formations using stochastic inversion
KR100955952B1 (ko) * 2003-10-13 2010-05-19 삼성전자주식회사 무선 통신 시스템에서 리프팅 저밀도 패러티 검사 부호를이용한 시공간 부호화 방법 및 장치
US7822289B2 (en) * 2006-07-25 2010-10-26 Microsoft Corporation Locally adapted hierarchical basis preconditioning
US9152969B2 (en) * 2010-04-07 2015-10-06 Rovi Technologies Corporation Recommendation ranking system with distrust

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101140588A (zh) * 2007-10-10 2008-03-12 华为技术有限公司 一种关联关系搜索结果的排序方法及装置
CN101657040A (zh) * 2008-08-21 2010-02-24 华为技术有限公司 一种无线网络拓扑发现方法、装置及系统
US8180804B1 (en) * 2010-04-19 2012-05-15 Facebook, Inc. Dynamically generating recommendations based on social graph information
WO2011156247A2 (en) * 2010-06-11 2011-12-15 Massachusetts Institute Of Technology Processor for large graph algorithm computations and matrix operations
CN102141976A (zh) * 2011-01-10 2011-08-03 中国科学院软件研究所 稀疏矩阵的对角线数据存储方法及基于该方法的SpMV实现方法
CN102611713A (zh) * 2012-04-10 2012-07-25 重庆交通大学 基于熵运算的网络入侵检测方法和装置
CN102880799A (zh) * 2012-09-24 2013-01-16 西北工业大学 一种基于多属性决策的复杂网络节点重要度综合评价方法
CN103106279A (zh) * 2013-02-21 2013-05-15 浙江大学 一种同时基于节点属性以及结构关系相似度的聚类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Big Graph Mining: Algorithms and Discoveries;kang等;《SIGKDD Explorations》;20121231;第29-34页 *

Also Published As

Publication number Publication date
US20150127667A1 (en) 2015-05-07
US10169386B2 (en) 2019-01-01
WO2015021845A1 (en) 2015-02-19
CN104376015A (zh) 2015-02-25

Similar Documents

Publication Publication Date Title
CN104376015B (zh) 关系网络中节点的处理方法及装置
Shin et al. Bear: Block elimination approach for random walk with restart on large graphs
CN103116639B (zh) 基于用户-物品二分图模型的物品推荐方法及系统
TWI605399B (zh) Method and device for sending product information
US10936765B2 (en) Graph centrality calculation method and apparatus, and storage medium
CN106021457B (zh) 基于关键词的rdf分布式语义搜索方法
CN105630800B (zh) 一种节点重要性排序的方法和系统
Aronshtam et al. When does the top homology of a random simplicial complex vanish?
KR102654884B1 (ko) 대화형 정보 제공 서비스 방법 및 이를 위한 장치
US8965934B2 (en) Method and apparatus for facilitating answering a query on a database
CN112085172A (zh) 图神经网络的训练方法及装置
CN112100396B (zh) 一种数据处理方法和装置
Kim et al. Influence maximization based on reachability sketches in dynamic graphs
US20110145261A1 (en) Efficient calculation of node proximity on graphs with side information
CN111797319B (zh) 推荐方法、装置、设备及存储介质
CN110516164B (zh) 一种信息推荐方法、装置、设备及存储介质
CN107437182B (zh) 资料分发方法及装置
Yin et al. Efficient distributed skyline computation using dependency-based data partitioning
US8874615B2 (en) Method and apparatus for implementing a learning model for facilitating answering a query on a database
CN113254797A (zh) 一种社交网络社区的搜索方法、装置以及处理设备
CN110085292B (zh) 药品推荐方法、装置及计算机可读存储介质
CN110633444A (zh) 一种基于论坛数据的影响力最大化评估方法
Yudin et al. Statistical approach to calculation of number of network motifs
Nguyen et al. Efficient regular path query evaluation by splitting with unit-subquery cost matrix
CN108334571A (zh) 层次查询的方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant