CN107360087A - 一种社交图谱构建方法 - Google Patents

一种社交图谱构建方法 Download PDF

Info

Publication number
CN107360087A
CN107360087A CN201710763842.6A CN201710763842A CN107360087A CN 107360087 A CN107360087 A CN 107360087A CN 201710763842 A CN201710763842 A CN 201710763842A CN 107360087 A CN107360087 A CN 107360087A
Authority
CN
China
Prior art keywords
social
information
user
identity
engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710763842.6A
Other languages
English (en)
Inventor
潘国华
范渊
黄进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DBAPPSecurity Co Ltd
Original Assignee
DBAPPSecurity Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DBAPPSecurity Co Ltd filed Critical DBAPPSecurity Co Ltd
Priority to CN201710763842.6A priority Critical patent/CN107360087A/zh
Publication of CN107360087A publication Critical patent/CN107360087A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及社交网络,旨在提供一种社交图谱构建方法。该种社交图谱构建方法包括下述步骤:社交网络服务库构建、信息录入、信息探测、信息抓取、信息分析、用户确认。本发明能充分利用社交网络的开放性,自动构建互联网社交服务库;本发明能充分利用社交网络的互动性,可以不受限制的探测用户信息;随着发现的深入,用户可以回顾自己整个网络社交历程。

Description

一种社交图谱构建方法
技术领域
本发明是关于社交网络领域,特别涉及一种社交图谱构建方法。
背景技术
当今这个年代互联网已经非常普及,覆盖了人们生活中的方方面面,人们也开始在网络上进行社交活动,随着网络社交的悄悄演进,一个人在网络上的形象更加趋于完整,这时候社交网络出现了。网络社交已有几十年的发展史,互联网用户在整个发展过程中积累了很多社交身份,所有的这些身份可以描述出这个用户完整的互联网生命历程。
现今我们进行网络社交都需要有提供社交服务的网站或者服务的账号,这些账号都需要绑定一些个人信息作为用户的身份标识,比如名称、手机、邮箱等。网络社交最吸引人的就是其虚拟性,可以不暴露自己真实身份的情况下享受社交的自由。当资料泄露或者身份暴露影响社交体验时,人们往往会修改账户信息或者遗弃该社交账户。
另一方面,一项社交服务往往是有单一性的,而且人们的社交行为往往是不持续的,用户很少会停留在一款社交产品上。用户在停止使用一段时间后再次使用这项社交服务时,有可能会因为遗忘账户信息或者身份凭证(手机、邮箱)更换导致无法继续使用服务。
因此,研究出构建社交图谱的方法,使其能通过社交网络把任意一个互联网用户的众多社交身份关联起来,市场前景看好。
发明内容
本发明的主要目的在于克服现有技术中的不足,提供一种能帮助用户构建自己整个互联网生命周期内所有的社交身份信息,形成完整的社交图谱的方法。为解决上述技术问题,本发明的解决方案是:
提供一种社交图谱构建方法,用于构建用户的完整社交图谱,所述社交图谱构建方法具体包括下述步骤:
(1)社交网络服务库构建:收集互联网上(所有)的社交网络服务,构建社交网络服务库并定期更新;
(2)信息录入:用户主动向发现引擎录入已知的社交身份信息,社交身份信息包括社交服务提供者、账户信息;
所述发现引擎是指用于实现步骤(3)的信息探测、步骤(4)的信息抓取、步骤(5)的信息分析的程序;
(3)信息探测:通过社交网络服务提供的开放接口或者发现引擎模拟账户结合用户录入的信息进行探测,用于确认目标用户是否存在于该社交网络服务中(例如通过查找用户或者添加好友的方式确认用户是否存在于该社交服务);
(4)信息抓取:抓取用户在社交服务上所有的信息,包括名称、邮箱、手机、位置信息、时间信息,并将这些信息存入发现引擎数据库中;
(5)信息分析:分析步骤(4)中抓取到的用户社交内容,通过关联分析算法分析获取到的信息之间的关系形成社交图谱;
(6)用户确认:用户观察分析出来的社交图谱和步骤(4)中抓取到的用户社交内容,确认抓取和分析后的内容是否为自己所有,当用户确认信息与自己相关,则将这些信息录入到发现引擎(步骤(2)),并通过发现引擎的定时任务调度(发现引擎的定时任务调度模块)触发下一次信息获取和分析循环(循环是指从步骤(2)到步骤(5))。
在本发明中,所述步骤(1)中,社交网络服务库利用认证协议(互联网中合作站点之间常常用OAuth协议来实现账户互通),自动发现互联网上的社交服务来实现构建,具体包括下述步骤:
步骤(1A):选取一批支持统一认证协议(公开的统一认证协议均可支持)的社交服务作为构建起点;
步骤(1B):通过发现引擎(发现引擎中的模拟网站注册模块)向这些社交服务模拟注册一个账户;
步骤(1C):通过社交服务提供的统一认证服务登录到合作站点(即统一认证支持的目标站点);
步骤(1D):检查合作站点的统一认证服务,将其合作站点中未存入发现引擎数据库的站点存入发现引擎数据库;
步骤(1E):当步骤(1D)有新的合作站点存入发现引擎数据库时,通过发现引擎的定时任务调度(发现引擎的定时任务调度模块)重复上述4个步骤。
在本发明中,所述步骤(2)的信息录入过程中,用户录入的社交身份信息为社交服务完整的用户信息,包括用户名、密码,用于丰富分析内容获取的途径和内容数量。
在本发明中,所述步骤(3)的信息探测过程,具体包括下述步骤:
步骤(3A):模拟用户登录:(通过代码)调用社交网络服务提供的接口,模拟用户登录社交网络服务;
步骤(3B):模拟用户查询:(通过代码)调用社交网络服务提供的用户查询接口查询指定用户信息;
步骤(3C):分析查询结果:通过步骤(3B)调用社交网络服务的用户查询接口的返回结果,确认用户是否存在于该社交网络服务中。
在本发明中,所述步骤(5)的信息分析,具体包括下述步骤:
步骤(5A):社交身份收集:从爬取到的内容中提取所有的社交身份信息,包括用户名、昵称、手机、邮箱、头像,用于分析备用;
步骤(5B):互动对象搜集:通过社交网络的点名方式“@”获取用户的互动对象,用于分析关系网络;
步骤(5C):地理位置信息收集:搜集地理信息,用于账户归属的有效性判断(例如用户从未到过浙江,但是微信软件显示这条微信的定位信息是杭州);
步骤(5D):时间信息搜集:搜集时间信息,用于账户归属的有效性判断(例如社交网络账号的注册时间是2000年,但是2000用户并未开始网络社交活动);
步骤(5E):社交内容提取:提取社交内容,利用社交内容中发现的社交服务构建社交网络服务库(例如在微博中的社交内容中包含“加我微信abcd”,即可初步判定用户拥有微信,并将微信账号通过步骤(2)录入发现引擎);
步骤(5F):信息关联:通过上述信息进行互联,形成社交图谱并发现孤岛信息,协助用户确认信息是否有效。
在本发明中,在信息分析中,通过身份凭证(用户名、邮箱、手机号)确认用户身份,通过凭证的时间信息和地理位置信息确认用户身份,通过社交互动对象身份凭证(用户名、邮箱、手机)确认用户身份,通过社交内容提取出新的社交服务。
本发明的工作原理:通过互联网认证协议自动构建社交网络服务库,获取所有相互关联的社交服务,根据社交服务构建和扩大信息获取途径和范围;信息分析模块依赖于社交内容的连贯性形成跨越时间、地域以及社交内容分类的图谱。
与现有技术相比,本发明的有益效果是:
本发明能充分利用社交网络的开放性,自动构建互联网社交服务库;本发明能充分利用社交网络的互动性,可以不受限制的探测用户信息;随着发现的深入,用户可以回顾自己整个网络社交历程。
本发明的社交服务库是可以自动扩充的,数据分析维度也可以不断扩充。
利用本发明,用户可以发现遗失的社交身份,用户可以发现已失效的身份凭证,用户主动更换凭证时可以明确的知道该凭证涉及到哪些社交服务。
附图说明
图1为本发明的流程图。
具体实施方式
首先需要说明的是,本发明涉及存储、爬虫等软件技术的应用,是计算机技术在互联网领域的一种应用。在本发明的实现过程中,会涉及到多个软件功能模块的应用。申请人认为,如在仔细阅读申请文件、准确理解本发明的实现原理和发明目的以后,在结合现有公知技术的情况下,本领域技术人员完全可以运用其掌握的软件编程技能实现本发明。凡本发明申请文件提及的均属此范畴,申请人不再一一列举。
下面结合附图与具体实施方式对本发明作进一步详细描述:
如图1所示的一种社交图谱构建方法,基于网络信息探测和分析的发现引擎,帮助用户构建自己整个互联网生命周期内所有的社交身份信息,形成完整的社交图谱,用户在更换身份凭证时可明确知道涉及到哪些社交服务,避免因身份凭证更换而导致的社交服务账户无法使用的问题。所述社交图谱构建方法具体包括下述步骤:
(1)社交网络服务库构建:收集互联网上所有的社交网络服务,构建社交网络服务库并定期更新。
互联网中合作站点之间常常用OAuth协议来实现账户互通,社交网络服务库能利用认证协议,自动发现互联网上的社交服务来实现构建,具体包括下述步骤:
步骤(1A):选取一批支持统一认证协议的社交服务作为构建起点;
步骤(1B):通过发现引擎中的模拟网站注册模块向这些社交服务模拟注册一个账户;
步骤(1C):通过社交服务提供的统一认证服务登录到合作站点(即统一认证支持的目标站点);
步骤(1D):检查合作站点的统一认证服务,将将其合作站点中未存入发现引擎数据库的站点存入发现引擎数据库;
步骤(1E):当步骤(1D)有新的合作存入发现引擎数据库时,通过发现引擎的定时任务调度模块重复上述4个步骤。
(2)信息录入:用户主动向发现引擎录入已知的社交身份信息,社交身份信息包括社交服务提供者、账户信息。
所述发现引擎具体是指:代码实现过程(3)、(4)、(5)功能的程序。
在信息录入过程中,用户可录入某一社交服务完整的用户信息,包括用户名、密码,这样可以丰富分析内容获取的途径和内容数量。
(3)信息探测:通过社交网络服务提供的开放接口或者发现引擎模拟账户结合用户录入的信息进行探测,用于确认目标用户是否存在于该社交网络服务中(例如通过查找用户或者添加好友的方式确认用户是否存在于该社交服务)。
信息探测过程,具体包括下述步骤:
步骤(3A):模拟用户登录:通过代码调用社交网络服务提供的接口,模拟用户登录社交网络服务;
步骤(3B):模拟用户查询:通过代码调用社交网络服务提供的用户查询接口查询指定用户信息;
步骤(3C):分析查询结果:通过步骤(3B)调用社交网络服务的用户查询接口的返回结果,确认用户是否存在于该社交网络服务中。
(4)信息抓取:抓取用户在社交服务上所有的信息,包括名称、邮箱、手机、位置信息、时间信息,并记录并将这些信息存入发现引擎的数据库中。
(5)信息分析:分析步骤(4)中抓取到的用户社交内容,通过关联分析算法分析获取到的信息之间的关系形成图谱,具体包括下述步骤:
步骤(5A):社交身份收集:从爬取到的内容中提取所有的社交身份信息,包括用户名、昵称、手机、邮箱、头像,用于分析备用;
步骤(5B):互动对象搜集:通过社交网络的点名方式“@”获取用户的互动对象,用于分析关系网络;
步骤(5C):地理位置信息收集:搜集到的地理信息能够用于账户归属的有效性判断(例如用户从未到过浙江,但是微信软件显示这条微信的定位信息是杭州);
步骤(5D):时间信息搜集:搜集到的时间信息能够用于账户归属的有效性判断(例如社交网络账号的注册时间是2000年,但是2000用户并未开始网络社交活动);
步骤(5E):社交内容提取:社交内容中发现的社交服务能够作为社交网络服务库构建自动化的一种途径(例如在微博中的社交内容中包含“加我微信abcd”,即可初步判定用户拥有微信,并将微信账号通过步骤(2)录入发现引擎);
步骤(5F):信息关联:通过上述信息进行互联,形成图谱并发现孤岛信息,协助用户确认信息是否有效。
在信息分析中,通过身份凭证(用户名、邮箱、手机号)确认用户身份,通过凭证生效时间和地域信息确认用户身份,通过社交互动对象身份凭证(用户名、邮箱、手机号)确认用户身份,通过社交内容提取出新的社交服务。
(6)用户确认:用户观察分析出来的社交图谱和步骤(4)中抓取到的用户社交内容,确认抓取和分析后的内容是否为自己所有,当用户确认信息与自己相关则通过步骤(2)将这些信息录入到发现引擎,并通过发现引擎的定时任务调度触发下一次信息获取和分析循环(循环是指从步骤(2)到步骤(5))。
最后,需要注意的是,以上列举的仅是本发明的具体实施例。显然,本发明不限于以上实施例,还可以有很多变形。本领域的普通技术人员能从本发明公开的内容中直接导出或联想到的所有变形,均应认为是本发明的保护范围。

Claims (6)

1.一种社交图谱构建方法,用于构建用户的完整社交图谱,其特征在于,所述社交图谱构建方法具体包括下述步骤:
(1)社交网络服务库构建:收集互联网上的社交网络服务,构建社交网络服务库并定期更新;
(2)信息录入:用户主动向发现引擎录入已知的社交身份信息,社交身份信息包括社交服务提供者、账户信息;
所述发现引擎是指用于实现步骤(3)的信息探测、步骤(4)的信息抓取、步骤(5)的信息分析的程序;
(3)信息探测:通过社交网络服务提供的开放接口或者发现引擎模拟账户结合用户录入的信息进行探测,用于确认目标用户是否存在于该社交网络服务中;
(4)信息抓取:抓取用户在社交服务上所有的信息,包括名称、邮箱、手机、位置信息、时间信息,并将这些信息存入发现引擎数据库中;
(5)信息分析:分析步骤(4)中抓取到的用户社交内容,通过关联分析算法分析获取到的信息之间的关系形成社交图谱;
(6)用户确认:用户观察分析出来的社交图谱和步骤(4)中抓取到的用户社交内容,确认抓取和分析后的内容是否为自己所有,当用户确认信息与自己相关,则将这些信息录入到发现引擎,并通过发现引擎的定时任务调度触发下一次信息获取和分析循环。
2.根据权利要求1所述的一种社交图谱构建方法,其特征在于,所述步骤(1)中,社交网络服务库利用认证协议,自动发现互联网上的社交服务来实现构建,具体包括下述步骤:
步骤(1A):选取一批支持统一认证协议的社交服务作为构建起点;
步骤(1B):通过发现引擎向这些社交服务模拟注册一个账户;
步骤(1C):通过社交服务提供的统一认证服务登录到合作站点;
步骤(1D):检查合作站点的统一认证服务,将其合作站点中未存入发现引擎数据库的站点存入发现引擎数据库;
步骤(1E):当步骤(1D)有新的合作站点存入发现引擎数据库时,通过发现引擎的定时任务调度重复上述4个步骤。
3.根据权利要求1所述的一种社交图谱构建方法,其特征在于,所述步骤(2)的信息录入过程中,用户录入的社交身份信息为社交服务完整的用户信息,包括用户名、密码,用于丰富分析内容获取的途径和内容数量。
4.根据权利要求1所述的一种社交图谱构建方法,其特征在于,所述步骤(3)的信息探测过程,具体包括下述步骤:
步骤(3A):模拟用户登录:调用社交网络服务提供的接口,模拟用户登录社交网络服务;
步骤(3B):模拟用户查询:调用社交网络服务提供的用户查询接口查询指定用户信息;
步骤(3C):分析查询结果:通过步骤(3B)调用社交网络服务的用户查询接口的返回结果,确认用户是否存在于该社交网络服务中。
5.根据权利要求1所述的一种社交图谱构建方法,其特征在于,所述步骤(5)的信息分析,具体包括下述步骤:
步骤(5A):社交身份收集:从爬取到的内容中提取所有的社交身份信息,包括用户名、昵称、手机、邮箱、头像,用于分析备用;
步骤(5B):互动对象搜集:通过社交网络的点名方式“@”获取用户的互动对象,用于分析关系网络;
步骤(5C):地理位置信息收集:搜集地理信息,用于账户归属的有效性判断;
步骤(5D):时间信息搜集:搜集时间信息,用于账户归属的有效性判断;
步骤(5E):社交内容提取:提取社交内容,利用社交内容中发现的社交服务构建社交网络服务库;
步骤(5F):信息关联:通过上述信息进行互联,形成社交图谱并发现孤岛信息,协助用户确认信息是否有效。
6.根据权利要求5所述的一种社交图谱构建方法,其特征在于,在信息分析中,通过身份凭证确认用户身份,通过凭证的时间信息和地理位置信息确认用户身份,通过社交互动对象身份凭证确认用户身份,通过社交内容提取出新的社交服务。
CN201710763842.6A 2017-08-30 2017-08-30 一种社交图谱构建方法 Pending CN107360087A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710763842.6A CN107360087A (zh) 2017-08-30 2017-08-30 一种社交图谱构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710763842.6A CN107360087A (zh) 2017-08-30 2017-08-30 一种社交图谱构建方法

Publications (1)

Publication Number Publication Date
CN107360087A true CN107360087A (zh) 2017-11-17

Family

ID=60289345

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710763842.6A Pending CN107360087A (zh) 2017-08-30 2017-08-30 一种社交图谱构建方法

Country Status (1)

Country Link
CN (1) CN107360087A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632361A (zh) * 2020-12-29 2021-04-09 中科院计算技术研究所大数据研究院 迭代式数据获取方法
CN113055276A (zh) * 2021-03-09 2021-06-29 井冈山大学 一种基于智能手机的圈聊创建方法、显示方法及其系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102843311A (zh) * 2012-07-30 2012-12-26 北京网蜜在线网络有限公司 基于sns的信息融合方法及服务器
CN104079538A (zh) * 2013-03-28 2014-10-01 清华大学 一种支持跨平台互动的微博聚合方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102843311A (zh) * 2012-07-30 2012-12-26 北京网蜜在线网络有限公司 基于sns的信息融合方法及服务器
CN104079538A (zh) * 2013-03-28 2014-10-01 清华大学 一种支持跨平台互动的微博聚合方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632361A (zh) * 2020-12-29 2021-04-09 中科院计算技术研究所大数据研究院 迭代式数据获取方法
CN112632361B (zh) * 2020-12-29 2021-10-29 中科院计算技术研究所大数据研究院 迭代式数据获取方法
CN113055276A (zh) * 2021-03-09 2021-06-29 井冈山大学 一种基于智能手机的圈聊创建方法、显示方法及其系统

Similar Documents

Publication Publication Date Title
CN104394118B (zh) 一种用户身份识别方法及系统
CN104038647B (zh) 社交通信系统
CN106682212B (zh) 一种基于用户移动行为的社会关系分类方法与装置
CN104516918B (zh) 用户身份信息的维护方法、装置、服务器及系统
CN102150161A (zh) 基于密切关系准则对搜索结果进行排序
KR20190087962A (ko) 스택 데이터 구조 백그라운드의 디지털 어시스턴트 프로세싱
CN107122987B (zh) 一种通缉令诈骗的预警系统及方法
CN103365851A (zh) 一种基于虚拟组织分享用户上网行为的方法及系统
WO2014078154A4 (en) Generating challenge questions inferred from user history data
CN106095814A (zh) 联系人处理方法及服务器
CN105550248B (zh) 用户信息挖掘方法及装置
CN105426502A (zh) 基于社交网络的人物信息搜索与关系网绘制的方法
CN102055793B (zh) 自动地改变或更新通信系统的配置或设置的方法和系统
CN102333112A (zh) 一种在互联网上共享个人信息的方法和系统
CN105516085B (zh) 一种管理访客临时上网行为的系统及方法
CN101409730A (zh) 一种基于需求关系而实现的随机性网络通讯方法
CN104123350B (zh) 一种社交关系管理的方法、设备及系统
CN110955691A (zh) 一种基于区块链技术的图书漂流方法及系统
CN107992513A (zh) 一种信息处理系统及其实现信息处理的方法
CN106161406B (zh) 获取用户账号的方法和装置
CN106060097A (zh) 一种信息安全竞赛的管理系统及管理方法
CN107360087A (zh) 一种社交图谱构建方法
CN104901816B (zh) 提供多人聊天的方法和系统
CN106936971A (zh) 一种来电人信息提示系统及提示方法
CN101453526A (zh) 互联网辅助电话访问系统及操作该系统的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171117