CN106844426A - 基于随机游走人员亲密度的计算系统及方法 - Google Patents

基于随机游走人员亲密度的计算系统及方法 Download PDF

Info

Publication number
CN106844426A
CN106844426A CN201611132104.3A CN201611132104A CN106844426A CN 106844426 A CN106844426 A CN 106844426A CN 201611132104 A CN201611132104 A CN 201611132104A CN 106844426 A CN106844426 A CN 106844426A
Authority
CN
China
Prior art keywords
cohesion
module
random walk
personnel
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611132104.3A
Other languages
English (en)
Inventor
闵圣捷
丁星
杨春勇
武静
周洋
肖青山
许文英
谢涛
张铭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CLP SECTION HUAYUN INFORMATION TECHNOLOGY Co Ltd
Original Assignee
CLP SECTION HUAYUN INFORMATION TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CLP SECTION HUAYUN INFORMATION TECHNOLOGY Co Ltd filed Critical CLP SECTION HUAYUN INFORMATION TECHNOLOGY Co Ltd
Priority to CN201611132104.3A priority Critical patent/CN106844426A/zh
Publication of CN106844426A publication Critical patent/CN106844426A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data

Abstract

本发明公开了一种基于随机游走人员亲密度的计算系统及方法,该系统包括语义网络引擎模块、亲密度计算推荐引擎模块,语义网络引擎模块与亲密度计算推荐引擎模块相连,其中语义网络引擎模块包括数据抽取模块、关系权重自动识别器模块,数据抽取模块与关系权重自动识别器模块相连;亲密度计算推荐引擎模块包括添加阻尼系数的随机游走训练模块、马尔可夫矩阵收敛性能评估模块,添加阻尼系数的随机游走训练模块与马尔可夫矩阵收敛性能评估模块相连。本发明能够通过对随机游走算法的改进,使该方法执行效率更高,更加节省资源;通过使用最终收敛的转移矩阵作为亲密度的衡量,将人与人之间的关系更加准确。

Description

基于随机游走人员亲密度的计算系统及方法
技术领域
本发明涉及一种计算系统及方法,特别是涉及一种基于随机游走人员亲密度的计算系统及方法。
背景技术
随机游走模型的基本思想是,从一个或一系列顶点开始遍历一张图,在任意一个顶点,遍历者将以概率1-A游走到这个顶点的邻居顶点,以概率A随机跳跃(teleport)到图中的任何一个顶点,称A为跳转发生概率。每次游走后得出一个概率分布,该概分布刻画了图中每一个顶点被访问到的概率,用这个概率分布作为下一次游走的输入并反复迭代这一过程当,满足一定前提条件时这个概率分布会趋于收敛收敛即可以得到一个稳定的概率分布。在数据挖掘领域,传统的都是利用随机游走模型,构造大量数据,根据随机游走数据分布特征,解决一些多标签分类问题、判断证券价格走势等。然而,这些方法需要构建大量数据,容易造成数据冗余,计算量大,耗时耗材。
发明内容
本发明所要解决的技术问题是提供一种基于随机游走人员亲密度的计算系统及方法,其能够通过对随机游走算法的改进,使该方法执行效率更高,更加节省资源;通过使用最终收敛的转移矩阵作为亲密度的衡量,将人与人之间的关系更加准确。
本发明是通过下述技术方案来解决上述技术问题的:一种基于随机游走人员亲密度的计算系统,其包括语义网络引擎模块、亲密度计算推荐引擎模块,语义网络引擎模块与亲密度计算推荐引擎模块相连,其中语义网络引擎模块包括数据抽取模块、关系权重自动识别器模块,数据抽取模块与关系权重自动识别器模块相连;亲密度计算推荐引擎模块包括添加阻尼系数的随机游走训练模块、马尔可夫矩阵收敛性能评估模块,添加阻尼系数的随机游走训练模块与马尔可夫矩阵收敛性能评估模块相连。
优选地,所述数据抽取模块从实体库、属性库、关系库中将数据抽取到分布式图形数据库中。
优选地,所述关系权重自动识别器模块将分布式图形数据库中的数据按照权重进行计算形成多图模型的建立。
优选地,所述添加阻尼系数的随机游走训练模块使用随机游走训练算法,将多图模型的数据对相关人员进行处理,形成一个亲密度关系矩阵。
优选地,所述马尔可夫矩阵收敛性能评估模块做为对随机游走训练模块形成的矩阵进行正确性验证,验证完成后形成最终亲密度矩阵。
本发明还提供一种基于随机游走人员亲密度的计算方法,其包括以下步骤:
步骤一,抽取、清洗数据,构建包含人物实体与属性实体,以及实体与实体间的语义网络;
步骤二,通过对权重的匹配计算形成多图模型;
步骤三,对整个语义网络使用改进的随机游走算法进行计算;
步骤四,使用最终收敛的转移矩阵作为亲密度的衡量。
本发明的积极进步效果在于:本发明能够通过实体库、属性库、关系库,分布式图形数据库、关系权重自动识别器和关系权重规则器,构建一个大型语义网络;通过人与人之间关系既有直接关系,以及间接关系构建一个亲密度关系矩阵;在矩阵构建成功后,可以使用到不同的应用场景,使查询人际关系更加便捷。
附图说明
图1为本发明的结构示意图。
图2为本发明的流程图。
具体实施方式
下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。
如图1所示,本发明基于随机游走人员亲密度的计算系统包括语义网络引擎模块、亲密度计算推荐引擎模块,语义网络引擎模块与亲密度计算推荐引擎模块相连,其中:
语义网络引擎模块包括数据抽取模块、关系权重自动识别器模块,数据抽取模块与关系权重自动识别器模块相连;
亲密度计算推荐引擎模块包括添加阻尼系数的随机游走训练模块、马尔可夫矩阵收敛性能评估模块,添加阻尼系数的随机游走训练模块与马尔可夫矩阵收敛性能评估模块相连。
所述数据抽取模块从实体库、属性库、关系库中将数据抽取到分布式图形数据库中。
所述关系权重自动识别器模块将分布式图形数据库中的数据按照权重进行计算形成多图模型的建立。
所述添加阻尼系数的随机游走训练模块使用随机游走训练算法,将多图模型的数据对相关人员进行处理,形成一个亲密度关系矩阵。
所述马尔可夫矩阵收敛性能评估模块做为对随机游走训练模块形成的矩阵进行正确性验证,验证完成后形成最终亲密度矩阵。
如图2所示,本发明基于随机游走人员亲密度的计算方法包括以下步骤:
步骤S1,抽取、清洗数据,构建包含人物实体与属性实体,以及实体与实体间的语义网络;将数据从外部数据库中抽取,清洗,然后存入分布式图形数据库中将模型持久化存储;
步骤S2,通过对权重的匹配计算形成多图模型;将分布式图形数据库中的多图模型与权重库中设置的计算权重进行匹配、计算形成多图模型;
步骤S3,对整个语义网络使用改进的随机游走算法进行计算;通过对随机算法改进,对步骤S2形成的多图模型进行计算,形成一个人员亲密度关系矩阵;
步骤S4,使用最终收敛的转移矩阵作为亲密度的衡量;主要是对步骤S3形成的矩阵进行衡量,衡量计算出现不稳定情况将会停止,如果是稳定矩阵那么就将稳定的矩阵关系存入数据库中。
以上所述的具体实施例,对本发明的解决的技术问题、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于随机游走人员亲密度的计算系统,其特征在于,其包括语义网络引擎模块、亲密度计算推荐引擎模块,语义网络引擎模块与亲密度计算推荐引擎模块相连,其中语义网络引擎模块包括数据抽取模块、关系权重自动识别器模块,数据抽取模块与关系权重自动识别器模块相连;亲密度计算推荐引擎模块包括添加阻尼系数的随机游走训练模块、马尔可夫矩阵收敛性能评估模块,添加阻尼系数的随机游走训练模块与马尔可夫矩阵收敛性能评估模块相连。
2.如权利要求1所述的基于随机游走人员亲密度的计算系统,其特征在于,所述数据抽取模块从实体库、属性库、关系库中将数据抽取到分布式图形数据库中。
3.如权利要求1所述的基于随机游走人员亲密度的计算系统,其特征在于,所述关系权重自动识别器模块将分布式图形数据库中的数据按照权重进行计算形成多图模型的建立。
4.如权利要求1所述的基于随机游走人员亲密度的计算系统,其特征在于,所述添加阻尼系数的随机游走训练模块使用随机游走训练算法,将多图模型的数据对相关人员进行处理,形成一个亲密度关系矩阵。
5.如权利要求1所述的基于随机游走人员亲密度的计算系统,其特征在于,所述马尔可夫矩阵收敛性能评估模块做为对随机游走训练模块形成的矩阵进行正确性验证,验证完成后形成最终亲密度矩阵。
6.一种基于随机游走人员亲密度的计算方法,其特征在于,其包括以下步骤:
步骤一,抽取、清洗数据,构建包含人物实体与属性实体,以及实体与实体间的语义网络;
步骤二,通过对权重的匹配计算形成多图模型;
步骤三,对整个语义网络使用改进的随机游走算法进行计算;
步骤四,使用最终收敛的转移矩阵作为亲密度的衡量。
CN201611132104.3A 2016-12-09 2016-12-09 基于随机游走人员亲密度的计算系统及方法 Pending CN106844426A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611132104.3A CN106844426A (zh) 2016-12-09 2016-12-09 基于随机游走人员亲密度的计算系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611132104.3A CN106844426A (zh) 2016-12-09 2016-12-09 基于随机游走人员亲密度的计算系统及方法

Publications (1)

Publication Number Publication Date
CN106844426A true CN106844426A (zh) 2017-06-13

Family

ID=59139282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611132104.3A Pending CN106844426A (zh) 2016-12-09 2016-12-09 基于随机游走人员亲密度的计算系统及方法

Country Status (1)

Country Link
CN (1) CN106844426A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107943935A (zh) * 2017-11-23 2018-04-20 北京天广汇通科技有限公司 数据的处理方法、装置和计算机可读存储介质
CN111427967A (zh) * 2018-12-24 2020-07-17 顺丰科技有限公司 实体关系查询方法和装置
US10776334B2 (en) 2017-10-10 2020-09-15 Alibaba Group Holding Limited Random walking and cluster-based random walking method, apparatus and device
US10901971B2 (en) 2017-10-10 2021-01-26 Advanced New Technologies Co., Ltd. Random walking and cluster-based random walking method, apparatus and device

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576904A (zh) * 2009-03-03 2009-11-11 杜小勇 一种基于有权图来计算文本内容相似度的方法
CN102163358A (zh) * 2011-04-11 2011-08-24 杭州电子科技大学 一种基于视频图像分析的烟雾/火焰检测方法
CN103559407A (zh) * 2013-11-14 2014-02-05 北京航空航天大学深圳研究院 一种用于度量有向加权图中节点亲密度的推荐系统及方法
CN103580919A (zh) * 2013-11-04 2014-02-12 复旦大学 一种利用邮件服务器日志进行邮件用户标记的方法与系统
CN104123377A (zh) * 2014-07-30 2014-10-29 福州大学 一种微博话题热度预测系统及方法
WO2014190037A1 (en) * 2013-05-22 2014-11-27 Siemens Aktiengesellschaft Parameter estimation for mesh segmentation using random walks
JP2015108983A (ja) * 2013-12-05 2015-06-11 日本電信電話株式会社 アイテム推薦装置、アイテム推薦方法、およびアイテム推薦プログラム
CN105812593A (zh) * 2016-03-30 2016-07-27 中国联合网络通信集团有限公司 对用户进行分级的方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101576904A (zh) * 2009-03-03 2009-11-11 杜小勇 一种基于有权图来计算文本内容相似度的方法
CN102163358A (zh) * 2011-04-11 2011-08-24 杭州电子科技大学 一种基于视频图像分析的烟雾/火焰检测方法
WO2014190037A1 (en) * 2013-05-22 2014-11-27 Siemens Aktiengesellschaft Parameter estimation for mesh segmentation using random walks
CN103580919A (zh) * 2013-11-04 2014-02-12 复旦大学 一种利用邮件服务器日志进行邮件用户标记的方法与系统
CN103559407A (zh) * 2013-11-14 2014-02-05 北京航空航天大学深圳研究院 一种用于度量有向加权图中节点亲密度的推荐系统及方法
JP2015108983A (ja) * 2013-12-05 2015-06-11 日本電信電話株式会社 アイテム推薦装置、アイテム推薦方法、およびアイテム推薦プログラム
CN104123377A (zh) * 2014-07-30 2014-10-29 福州大学 一种微博话题热度预测系统及方法
CN105812593A (zh) * 2016-03-30 2016-07-27 中国联合网络通信集团有限公司 对用户进行分级的方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10776334B2 (en) 2017-10-10 2020-09-15 Alibaba Group Holding Limited Random walking and cluster-based random walking method, apparatus and device
US10901971B2 (en) 2017-10-10 2021-01-26 Advanced New Technologies Co., Ltd. Random walking and cluster-based random walking method, apparatus and device
CN107943935A (zh) * 2017-11-23 2018-04-20 北京天广汇通科技有限公司 数据的处理方法、装置和计算机可读存储介质
CN107943935B (zh) * 2017-11-23 2021-02-02 北京天广汇通科技有限公司 数据的处理方法、装置和计算机可读存储介质
CN111427967A (zh) * 2018-12-24 2020-07-17 顺丰科技有限公司 实体关系查询方法和装置
CN111427967B (zh) * 2018-12-24 2023-06-09 顺丰科技有限公司 实体关系查询方法和装置

Similar Documents

Publication Publication Date Title
CN109325691B (zh) 异常行为分析方法、电子设备及计算机程序产品
CN104915879B (zh) 基于金融数据的社会关系挖掘的方法及装置
CN106844426A (zh) 基于随机游走人员亲密度的计算系统及方法
CN104133837B (zh) 一种基于分布式计算的互联网信息投放渠道优化系统
CN107066476A (zh) 一种基于物品相似度的实时推荐方法
CN104346629B (zh) 一种模型参数训练方法、装置及系统
CN109558951A (zh) 一种欺诈账号检测方法、装置及其存储介质
CN107438050B (zh) 识别网站的潜在恶意用户的方法和装置
CN104462163B (zh) 一种三维模型表征方法、检索方法及检索系统
CN109711883A (zh) 基于U-Net网络的互联网广告点击率预估方法
CN103150374A (zh) 一种识别微博异常用户的方法和系统
CN109299258A (zh) 一种舆情事件检测方法、装置及设备
CN109002492B (zh) 一种基于LightGBM的绩点预测方法
CN110519128A (zh) 一种基于随机森林的操作系统识别方法
CN107609469B (zh) 社会网络关联用户挖掘方法及系统
CN113706251B (zh) 基于模型的商品推荐方法、装置、计算机设备和存储介质
Wang et al. A novel algorithm for community detection and influence ranking in social networks
CN107895038A (zh) 一种链路预测关系推荐方法及装置
CN103226743A (zh) 基于trl的航空装备技术成熟度评估信息处理方法
CN112529415B (zh) 基于组合多感受野图神经网络的物品评分方法
CN108647818A (zh) 一种预测企业涉税风险的方法及装置
CN106789338B (zh) 一种在动态大规模社交网络中发现关键人物的方法
CN105825430A (zh) 一种基于异构社会网络的检测方法
CN105913235A (zh) 一种客户转账关系分析方法及系统
CN109472626A (zh) 一种面向手机租赁业务的智能金融风险控制方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170613

RJ01 Rejection of invention patent application after publication