CN104092601B - 社交网络账号的识别方法和装置 - Google Patents

社交网络账号的识别方法和装置 Download PDF

Info

Publication number
CN104092601B
CN104092601B CN201410364828.5A CN201410364828A CN104092601B CN 104092601 B CN104092601 B CN 104092601B CN 201410364828 A CN201410364828 A CN 201410364828A CN 104092601 B CN104092601 B CN 104092601B
Authority
CN
China
Prior art keywords
account
social networks
confidence level
networks account
social
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410364828.5A
Other languages
English (en)
Other versions
CN104092601A (zh
Inventor
高立琦
王震
陈儒
陈博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING WEIZOOM CULTURAL MEDIA Co Ltd
Original Assignee
BEIJING WEIZOOM CULTURAL MEDIA Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BEIJING WEIZOOM CULTURAL MEDIA Co Ltd filed Critical BEIJING WEIZOOM CULTURAL MEDIA Co Ltd
Priority to CN201410364828.5A priority Critical patent/CN104092601B/zh
Publication of CN104092601A publication Critical patent/CN104092601A/zh
Application granted granted Critical
Publication of CN104092601B publication Critical patent/CN104092601B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种社交网络账号的识别方法和装置。其中,社交网络账号的识别方法包括:接收待识别的社交网络账号的身份标识;按照身份标识查询待识别的社交网络账号的可信度,可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值;如果查询到待识别的社交网络账号的可信度,则判断可信度是否超过可信阈值;如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号,第一账号为真实用户使用的账号;以及如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号,第二账号为计算机操作的账号。通过本发明,达到了提高识别社交网络账号真实性的准确性的效果。

Description

社交网络账号的识别方法和装置
技术领域
本发明涉及社交网络领域,具体而言,涉及一种社交网络账号的识别方法和装置。
背景技术
随着现代技术的发展,计算机可以模拟社交网络上真实用户的一些行为,导致社交网络用户无法有效的辨别社交网络账号的背后是真实的用户还是计算机在操作。
社交网络在人们的生活中扮演着重要的角色,它已成为人们生活的一部分,并对人们的信息获得、思考和生活产生不可低估的影响,而有些用户为了满足虚荣心,通过一些计算机伪造方式迅速增加社交好友的现象越来越多,这就造成了庞大的无效的社会关系网络。现有鉴别账号背后是否是真实的用户的技术一般是从账号的注册时间、用户等级、标签数、地理位置信息、自我描述信息、链接信息、认证信息、微博数、粉丝数、关注数、互粉数、收藏数、交互比例、微博粉丝比例、发布微博规律性、发布微博与转发微博比例等方面进行鉴别,但是,这些特征通过计算机都可以大量的伪造或者复制,所以罗列的这些指标就不再真实,鉴别到的账号也就不准确。
目前,对社交网络账号的真实性进行识别方案具有如下缺点:
1.从账号的注册时间、用户等级、标签数、地理位置信息、自我描述信息、链接信息、认证信息、微博数、粉丝数、关注数、互粉数、收藏数、交互比例、微博粉丝比例、发布微博规律性、发布微博与转发微博比例等指标,计算机可以大量的伪造或者复制,所以通过以这些指标作为输入条件的方案识别账号真实性的结果不准确。
2.通过以上指标作为输入条件进行识别,必须从网络上获取大量的数据,计算量大,速度慢。
针对现有技术中无法准确识别社交网络账号的真实性的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种社交网络账号的识别方法和装置,以解决现有技术中无法准确识别社交网络账号的真实性的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种社交网络账号的识别方法。根据本发明的社交网络账号的识别方法包括:接收待识别的社交网络账号的身份标识;按照身份标识查询待识别的社交网络账号的可信度,可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值;如果查询到待识别的社交网络账号的可信度,则判断可信度是否超过可信阈值;如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号,第一账号为真实用户使用的账号;以及如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号,第二账号为计算机操作的账号。
进一步地,在接收社交网络账号的身份标识之前,识别方法还包括:基于社交网络关系计算社交网络关系中每个社交网络账号的可信度;将计算得到的每个社交网络账号的可信度存储到数据库中,按照身份标识查询待识别的社交网络账号的可信度包括:按照身份标识从数据库中查询待识别的社交网络账号的可信度。
进一步地,基于社交网络关系计算社交网络关系中每个社交网络账号的可信度包括:获取社交网络中通过实名认证的社交网络账号,将通过实名认证的社交网络账号作为第一账号圈中的社交网络账号;获取通过实名认证的社交网络账号所关注的社交网络账号,将通过实名认证的社交网络账号和通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为社交网络关系中每个社交网络账号的第一可信度。
进一步地,在计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的数量之后,识别方法还包括:获取第三账号圈中的社交网络账号,其中,第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号;以及计算第三账号圈中的每个社交网络账号被第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为社交网络关系中每个社交网络账号的第二可信度。
进一步地,可信阈值包括第一阈值和第二阈值,其中,如果查找到待识别的社交网络账号的可信度包括第一可信度和第二可信度,判断可信度是否超过可信阈值包括:判断第一可信度是否超过第一阈值;判断第二可信度是否超过第二阈值,其中,如果判断出第一可信度超过第一阈值,或者,判断出第二可信度超过第二阈值,则确定待识别的社交网络账号为第一账号;或者,如果判断出第一可信度超过第一阈值,并且判断出第二可信度超过第二阈值,则确定待识别的社交网络账号为第一账号。
为了实现上述目的,根据本发明的另一方面,提供了一种社交网络账号的识别装置。根据本发明的社交网络账号的识别装置包括:接收单元,用于接收待识别的社交网络账号的身份标识;查询单元,用于按照身份标识查询待识别的社交网络账号的可信度,可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值;判断单元,用于当查询到待识别的社交网络账号的可信度时,判断可信度是否超过可信阈值;第一确定单元,用于当判断出可信度超过可信阈值时,确定待识别的社交网络账号为第一账号,第一账号为真实用户使用的账号;以及第二确定单元,用于当判断出可信度未超过可信阈值时,确定待识别的社交网络账号为第二账号,第二账号为计算机操作的账号。
进一步地,识别装置还包括:计算单元,用于在接收社交网络账号的身份标识之前,基于社交网络关系计算社交网络关系中每个社交网络账号的可信度;存储单元,用于将计算得到的每个社交网络账号的可信度存储到数据库中,查询单元包括:查询模块,用于按照身份标识从数据库中查询待识别的社交网络账号的可信度。
进一步地,计算单元包括:第一获取模块,用于获取社交网络中通过实名认证的社交网络账号,将通过实名认证的社交网络账号作为第一账号圈中的社交网络账号;第二获取模块,用于获取通过实名认证的社交网络账号所关注的社交网络账号,将通过实名认证的社交网络账号和通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及第一计算模块,用于计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为社交网络关系中每个社交网络账号的第一可信度。
进一步地,计算单元还包括:第三获取模块,用于在计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的数量之后,获取第三账号圈中的社交网络账号,其中,第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号;以及第二计算模块,用于计算第三账号圈中的每个社交网络账号被第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为社交网络关系中每个社交网络账号的第二可信度。
进一步地,可信阈值包括第一阈值和第二阈值,其中,判断单元包括:第一判断模块,用于当查找到待识别的社交网络账号的可信度包括第一可信度和第二可信度时,判断第一可信度是否超过第一阈值;第二判断模块,用于判断第二可信度是否超过第二阈值,其中,第一确定单元还用于当判断出第一可信度超过第一阈值,或者,判断出第二可信度超过第二阈值,确定待识别的社交网络账号为第一账号;或者,第一确定单元还用于当判断出第一可信度超过第一阈值,并且判断出第二可信度超过第二阈值,确定待识别的社交网络账号为第一账号。
根据本发明实施例,通过接收待识别的社交网络账号的身份标识,按照身份标识查询待识别的社交网络账号的可信度,如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号即真实用户使用的账号,如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号即计算机操作的账号,通过可信度来判断社交网络账号的真实性,解决了无法准确识别社交网络账号的真实性的问题,达到了提高识别社交网络账号真实性的准确性的效果。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的社交网络账号的识别方法的流程图;
图2是根据本发明实施例的账号圈的示意图;以及
图3是根据本发明实施例的社交网络账号的识别装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种社交网络账号的识别方法。
图1是根据本发明实施例的社交网络账号的识别方法的流程图。如图1所示,该社交网络账号的识别方法包括步骤如下:
步骤S102,接收待识别的社交网络账号的身份标识。
社交网络账号可以是社会性网络服务(Social Networking Services,简称SNS)所用到的账号,可以是例如新浪微博、腾讯微博等社交网络服务的账号。身份标识(ID)为待识别的社交网络账号的唯一标识,以便于依据该身份标识查询该待识别的社交网络账号的可信度。
步骤S104,按照身份标识查询待识别的社交网络账号的可信度。该可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值。
社交网络账号的可信度可以基于社交网络关系计算得到,该社交网络关系可以是基于真实的社交网络账号建立的社交关系,例如,通过实名认证的社交网络账号及其关注的账号,以及其关注的账号所关注的账号,这样形成的层层社交关系。基于社交网络关系计算该社交网络关系中每个社交网络账号的可信度,并按照每个社交网络账号的身份标识一一对应地存储计算得到的可信度,这样,在识别社交网络账号的真实性时,可以直接从存储的可信度中查询带识别的社交网络账号的可信度,以便于通过该可信度判断待识别的社交网络账号的真实性。其中,可信度可以采用PageRank算法、HITS算法等进行计算得到,也可以通过自定义的算法进行计算得到。
由于在社交网络中,并非所有的社交网络账号均能够预先计算得到其可信度,因此查询待识别的社交网络账号时,如果能够查到,则对查询到的可信度进行判断,反之,则可以认为无法识别该社交网络账号的真实性。
步骤S106,如果查询到待识别的社交网络账号的可信度,则判断可信度是否超过可信阈值。
可信阈值可以是用于判断社交网络账号的真实性的阈值,该阈值可以根据实际需要或者根据统计结果进行设置和调整。
步骤S108,如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号。该第一账号为真实用户使用的账号。
步骤S110,如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号。该第二账号为计算机操作的账号。
第一账号为真实用户使用的一类账号,该账号的使用和操作者为真实的自然人,第二账号为通过计算机操作的账号。当待识别的社交网络账号的可信度超过可信阈值时,表明该待识别的社交网络账号为第一账号即真实账号的可能性比较大,则认为该待识别的账号为第一账号;反之,则认为其为第二账号即计算机操作的账号。
根据本发明实施例,通过接收待识别的社交网络账号的身份标识,按照身份标识查询待识别的社交网络账号的可信度,如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号即真实用户使用的账号,如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号即计算机操作的账号,通过可信度来判断社交网络账号的真实性,解决了无法准确识别社交网络账号的真实性的问题,达到了提高识别社交网络账号真实性的准确性的效果。
优选地,在接收社交网络账号的身份标识之前,本发明实施例的识别方法还包括:基于社交网络关系计算社交网络关系中每个社交网络账号的可信度;将计算得到的每个社交网络账号的可信度存储到数据库中,按照身份标识查询社交网络账号的可信度包括:按照身份标识从数据库中查询待识别的社交网络账号的可信度。
由于社交网络中各账号之间存在相互关注或者收听等社交网络关系,由于一些真实的用户所关注或者收听的账号大都为真实的账号,因此,利用社交网络关系可以统计计算每个账号关注或者被关注的账号数量,以此为基础计算该社交网络关系中每个账号的可信度。然后将计算得到的社交网络账号的可信度,按照社交网络账号的身份标识形成一一对应的映射关系,存储到数据库中。这样,就可以按照社交网络账号身份标识从数据库中查询待识别的社交网络账号的可信度。
具体地,以社交网络的真实用户作为基础集合,以新浪微博这个社交网络平台的场景为例,即以加“V”认证的企业账号和个人账号为基础集合,这些账号都有严格的实名认证体系,即新浪微博认可这些用户账号的真实性,且假设这些用户关注的账号背后也是真实用户。通过这些真实用户的社交网络关系开始一层层向外扩散,有效排除了计算机伪造数据的风险,用固定的方法计算可信度来达到判断账号是否真实的目的。从真实用户开始开展社交网络关系,并层层递推获得所需要的关注网络关系结构,并不局限于新浪微博平台的加“V”用户,可以用其他有权威的真实的用户来替代,譬如新浪的名人堂用户。
根据本发明实施例,基于社交网络关系计算社交网络账号的可信度,可以进一步地提高识别社交网络账号真实性的准确性。
另外,将计算得到的社交网络账号的可信度存入数据库中,在识别账号真实性时,只需要传入账号ID,数据库即可返回其可信度,无须再从互联网上获取大量数据,判断时计算量小,速度快。
优选地,基于社交网络关系计算社交网络关系中每个社交网络账号的可信度包括:
获取社交网络中通过实名认证的社交网络账号,将通过实名认证的社交网络账号作为第一账号圈中的社交网络账号。
通过实名认证的社交网络账号可以是例如新浪微博中的加“V”账号,将这些账号作为基础集合即第一账号圈。由于实名认证的社交网络账号通常为有效用户,可以基于这些账号来计算其他社交网络账号的可信度。
获取通过实名认证的社交网络账号所关注的社交网络账号,将通过实名认证的社交网络账号和通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号。
实名认证的社交网络账号通过社交网络关注一些账号,这些账号可以是通过实名认证的社交网络账号,也可以是未进行认证的社交网络账号,将通过实名认证的社交网络账号及其所关注的社交网络账号作为第二账号圈中的账号。
计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为社交网络关系中每个社交网络账号的第一可信度。
在获取到这些账号之后,即可得到每个账号所关注的账号或者被关注的账号,计算第二账号圈中每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,即计算第二账号圈中的账号被该圈中其他账号关注的数量,例如,第二账号圈中包含有10个账号,其中,账号A被该圈中的8个账号关注,则账号A的可信度记为8。
需要说明的是,本发明实施例中,对第二账户圈中的账号进行计算时,可以是仅计算通过实名认证的社交网络账号之外的其他账号的可信度,通过实名认证的社交网络账号可以直接标记为真实账号,存储在数据库中,在从数据库查找这些账号时,可以直接输出结果。
优选地,在计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的数量之后,识别方法还包括:获取第三账号圈中的社交网络账号,其中,第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号;以及计算第三账号圈中的每个社交网络账号被第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为社交网络关系中每个社交网络账号的第二可信度。
第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号,具体地,第三账号圈中的社交网络账号可以包括第二账号圈中所有的社交网络账号和这些账号所关注的除第二账号圈中之外的社交网络账号,然后按照与第二账号圈中相类似的计算方式计算第三账号圈中的社交网络账号的可信度。
由此可以看出,由于第三账号圈中包括第二账号圈的账号,因此,对于第二账号圈中的社交网络账号,可能存在两个可信度,即第一可信度和第二可信度,因此,在判断该社交网络账号的真实性时,可以对这两个可信度分别进行判断,或者综合进行判断。
需要说明的是,本发明实施例中,可以按照上述计算方式依次计算第四账号圈、第五账号圈、……、第N账号圈中的社交网络账号的可信度,其计算原理均相同,这里不做赘述。
根据本发明实施例,通过将计算到的社交网络账号被相同圈内账号所关注的数量作为可信度,依次来判断社交网络账号的真实性,可以进一步提高识别社交网络真实性的准确性。
优选地,可信阈值包括第一阈值和第二阈值,其中,如果查找到所述待识别的社交网络账号的可信度包括所述第一可信度和所述第二可信度,则判断可信度是否超过可信阈值,包括:判断第一可信度是否超过第一阈值;判断第二可信度是否超过第二阈值,其中,如果判断出第一可信度超过第一阈值,或者,判断出第二可信度超过第二阈值,则确定待识别的社交网络账号为第一账号;或者,如果判断出第一可信度超过第一阈值,并且判断出第二可信度超过第二阈值,则确定待识别的社交网络账号为第一账号。
当查找到同一社交网络账号的可信度包括两个时,可以分别判断每个可信度是否超出相应的阈值,只要有一个超出阈值,则可以认为该账号为真实账号;或者,在进行判断识别时,只有满足两个可信度均符合要求时,才认为该账号为真实账号。
相应地,由于账号圈可以是多个,因此,当查询到的可信度为多个时,如果这些可信度中,一个或者多个满足条件时,可以认为该账号为真实账号。
下面以新浪微博为例,结合图2对本发明实施例进行详细描述;
1、从网页上获取所有加“V”的账号0(视为有效用户),作为基础集合VF0,即图2中第一账号圈(一)内的节点。
2、获取基础集合VF0中账号的关注账号1,基础集合VF0及其关注账号的集合统称为集合VF1,即图2中第二账号圈(二)内的节点。
3、再次获取集合VF1中账号的关注账号2,此时集合VF1及其关注账号的集合统称为集合VF2,即图2中第三账号圈(三)内的节点。
4、通过VF分值的方法来计算集合VF1中账号的分值IV0,集合VF2中账号的分值IV1。VF分值指圈内某一账号被同一圈子中其他账号所关注的数量。计算分值的方法不依赖于VF方法,可以使用PageRank、HITS算法。
5、依次类推,系统定期自动以圈内的账号作为输入进行迭代获取关注账号,进而将社交网络进行扩展,即从加“V”的账号扩展出的第一层VF1至第N层VFN,出现N组VF分值。我们假设通过加“V”用户扩展两层即满足需求,即扩展到了VF2集合,同时也就对于VF2集合中所有用户计算出了两个分值IV0和IV1。
6、将分值IV0和IV1存入数据库中。
7、通过传入账号ID,系统返回一组分值,和设定的分数阀值进行比较,鉴别账号背后是否是有效用户。设定以下条件满足全部或者满足其中几项即可视为有效用户:
IV0>n1,(n1为设定的分数阈值);
IV1>n2,(n2为设定的分数阈值);
……
本发明实施例还提供了一种社交网络账号的识别装置。该装置可以通过社交网络账号的识别实现其功能。需要说明的是,本发明实施例的社交网络账号的识别装置可以用于执行本发明实施例所提供的社交网络账号的识别方法,本发明实施例的社交网络账号的识别方法也可以通过本发明实施例所提供的社交网络账号的识别装置来执行。
图3是根据本发明实施例的社交网络账号的识别装置的示意图。如图3所示,该社交网络账号的识别装置包括:接收单元10、查询单元20、判断单元30、第一确定单元40和第二确定单元50。
接收单元10用于接收待识别的社交网络账号的身份标识。
社交网络账号可以是社会性网络服务(Social Networking Services,简称SNS)所用到的账号,可以是例如新浪微博、腾讯微博等社交网络服务的账号。身份标识(ID)为待识别的社交网络账号的唯一标识,以便于依据该身份标识查询该待识别的社交网络账号的可信度。
查询单元20用于按照身份标识查询待识别的社交网络账号的可信度,可信度为预先计算得到的用于反映待识别的社交网络账号真实性的数值。
社交网络账号的可信度可以基于社交网络关系计算得到,该社交网络关系可以是基于真实的社交网络账号建立的社交关系,例如,通过实名认证的社交网络账号及其关注的账号,以及其关注的账号所关注的账号,这样形成的层层社交关系。基于社交网络关系计算该社交网络关系中每个社交网络账号的可信度,并按照每个社交网络账号的身份标识一一对应地存储计算得到的可信度,这样,在识别社交网络账号的真实性时,可以直接从存储的可信度中查询带识别的社交网络账号的可信度,以便于通过该可信度判断待识别的社交网络账号的真实性。其中,可信度可以采用PageRank算法、HITS算法等进行计算得到,也可以通过自定义的算法进行计算得到。
由于在社交网络中,并非所有的社交网络账号均能够预先计算得到其可信度,因此查询待识别的社交网络账号时,如果能够查到,则对查询到的可信度进行判断,反之,则可以认为无法识别该社交网络账号的真实性。
判断单元30用于当查询到待识别的社交网络账号的可信度时,判断可信度是否超过可信阈值。
可信阈值可以是用于判断社交网络账号的真实性的阈值,该阈值可以根据实际需要或者根据统计结果进行设置和调整。
第一确定单元40用于当判断出可信度超过可信阈值时,确定待识别的社交网络账号为第一账号,第一账号为真实用户使用的账号。
第二确定单元50用于当判断出可信度未超过可信阈值时,确定待识别的社交网络账号为第二账号,第二账号为计算机操作的账号。
第一账号为真实用户使用的一类账号,该账号的使用和操作者为真实的自然人,第二账号为通过计算机操作的账号。当待识别的社交网络账号的可信度超过可信阈值时,表明该待识别的社交网络账号为第一账号即真实账号的可能性比较大,则认为该待识别的账号为第一账号;反之,则认为其为第二账号即计算机操作的账号。
根据本发明实施例,通过接收待识别的社交网络账号的身份标识,按照身份标识查询待识别的社交网络账号的可信度,如果判断出可信度超过可信阈值,则确定待识别的社交网络账号为第一账号即真实用户使用的账号,如果判断出可信度未超过可信阈值,则确定待识别的社交网络账号为第二账号即计算机操作的账号,通过可信度来判断社交网络账号的真实性,解决了无法准确识别社交网络账号的真实性的问题,达到了提高识别社交网络账号真实性的准确性的效果。
优选地,识别装置还包括:计算单元,用于在接收社交网络账号的身份标识之前,基于社交网络关系计算社交网络关系中每个社交网络账号的可信度;存储单元,用于将计算得到的每个社交网络账号的可信度存储到数据库中,查询单元包括:查询模块,用于按照身份标识从数据库中查询待识别的社交网络账号的可信度。
由于社交网络中各账号之间存在相互关注或者收听等社交网络关系,由于一些真实的用户所关注或者收听的账号大都为真实的账号,因此,利用社交网络关系可以统计计算每个账号关注或者被关注的账号数量,以此为基础计算该社交网络关系中每个账号的可信度。然后将计算得到的社交网络账号的可信度,按照社交网络账号的身份标识形成一一对应的映射关系,存储到数据库中。这样,就可以按照社交网络账号身份标识从数据库中查询待识别的社交网络账号的可信度。
具体地,以社交网络的真实用户作为基础集合,以新浪微博这个社交网络平台的场景为例,即以加“V”认证的企业账号和个人账号为基础集合,这些账号都有严格的实名认证体系,即新浪微博认可这些用户账号的真实性,且假设这些用户关注的账号背后也是真实用户。通过这些真实用户的社交网络关系开始一层层向外扩散,有效排除了计算机伪造数据的风险,用固定的方法计算可信度来达到判断账号是否真实的目的。
根据本发明实施例,基于社交网络关系计算社交网络账号的可信度,可以进一步地提高识别社交网络账号真实性的准确性。
另外,将计算得到的社交网络账号的可信度存入数据库中,在识别账号真实性时,只需要传入账号ID,数据库即可返回其可信度,无须再从互联网上获取大量数据,判断时计算量小,速度快。
优选地,计算单元包括:第一获取模块,用于获取社交网络中通过实名认证的社交网络账号,将通过实名认证的社交网络账号作为第一账号圈中的社交网络账号;第二获取模块,用于获取通过实名认证的社交网络账号所关注的社交网络账号,将通过实名认证的社交网络账号和通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及第一计算模块,用于计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为社交网络关系中每个社交网络账号的第一可信度。
通过实名认证的社交网络账号可以是例如新浪微博中的加“V”账号,将这些账号作为基础集合即第一账号圈。由于实名认证的社交网络账号通常为有效用户,可以基于这些账号来计算其他社交网络账号的可信度。
通过实名认证的社交网络账号通过社交网络关注一些账号,这些账号可以是通过实名认证的社交网络账号,也可以是为进行认证的社交网络账号,将通过实名认证的社交网络账号及其所关注的社交网络账号作为第二账号圈中的账号。
在获取到这些账号之后,即可得到每个账号所关注的账号或者被关注的账号,计算第二账号圈中每个社交网络账号被第二账号圈中的社交网络账号所关注的第一数量,即计算第二账号圈中的账号被该圈中其他账号关注的数量,例如,第二账号圈中包含有10个账号,其中,账号A被该圈中的8个账号关注,则账号A的可信度记为8。
需要说明的是,本发明实施例中,对第二账户圈中的账号进行计算时,可以是仅计算通过实名认证的社交网络账号之外的其他账号的可信度,通过实名认证的社交网络账号可以直接标记为真实账号,存储在数据库中,在从数据库查找这些账号时,可以直接输出结果。
优选地,计算单元还包括:第三获取模块,用于在计算第二账号圈中的每个社交网络账号被第二账号圈中的社交网络账号所关注的数量之后,获取第三账号圈中的社交网络账号,其中,第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号;以及第二计算模块,用于计算第三账号圈中的每个社交网络账号被第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为社交网络关系中每个社交网络账号的第二可信度。
第三账号圈中的社交网络账号包括第二账号圈中的社交网络账号和第二账号圈中的社交网络账号所关注的账号,具体地,第三账号圈中的社交网络账号可以包括第二账号圈中所有的社交网络账号和这些账号所关注的除第二账号圈中之外的社交网络账号,然后按照与第二账号圈中相类似的计算方式计算第三账号圈中的社交网络账号的可信度。
由此可以看出,由于第三账号圈中包括第二账号圈的账号,因此,对于第二账号圈中的社交网络账号,可能存在两个可信度,即第一可信度和第二可信度,因此,在判断该社交网络账号的真实性时,可以对这两个可信度分别进行判断,或者综合进行判断。
需要说明的是,本发明实施例中,可以按照上述计算方式依次计算第四账号圈、第五账号圈、……、第N账号圈中的社交网络账号的可信度,其计算原理均相同,这里不做赘述。
根据本发明实施例,通过将计算到的社交网络账号被相同圈内账号所关注的数量作为可信度,依次来判断社交网络账号的真实性,可以进一步提高识别社交网络真实性的准确性。
优选地,可信阈值包括第一阈值和第二阈值,其中,判断单元包括:第一判断模块,用于当查找到待识别的社交网络账号的可信度包括第一可信度和第二可信度时,判断第一可信度是否超过第一阈值;第二判断模块,用于判断第二可信度是否超过第二阈值,其中,第一确定单元还用于当判断出第一可信度超过第一阈值,或者,判断出第二可信度超过第二阈值,确定待识别的社交网络账号为第一账号;或者,第一确定单元还用于当判断出第一可信度超过第一阈值,并且判断出第二可信度超过第二阈值,确定待识别的社交网络账号为第一账号。
当查找到同一社交网络账号的可信度包括两个时,可以分别判断每个可信度是否超出相应的阈值,只要有一个超出阈值,则可以认为该账号为真实账号;或者,在进行判断识别时,只有满足两个可信度均符合要求时,才认为该账号为真实账号。
相应地,由于账号圈可以是多个,因此,当查询到的可信度为多个时,如果这些可信度中,一个或者多个满足条件时,可以认为该账号为真实账号。
本发明实施例能够达到如下效果:
通过此发明实施例计算出来的可信度存入数据库中,只需要传入账号ID,数据库即可返回可信度,无须再从互联网上获取大量数据,判断时计算量小,速度快。
计算可信度时不仅可以使用PageRank、HITS等成熟的算法,而且创新VF分值方法,这样做可以综合各种算法优点来鉴别用户,而且即使将来有更好的算法也可以使用。
系统应用算法来计算用户可信度时,只依赖社交网络关系,相比于现有技术应用的微博数、粉丝数不那么频繁。
本发明实施例涉及到的用户由于是从加“V”用户的关注用户开始层层向外扩展,保证了用户的真实性。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、移动终端、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种社交网络账号的识别方法,其特征在于,包括:
接收待识别的社交网络账号的身份标识;
按照所述身份标识查询所述待识别的社交网络账号的可信度,所述可信度为预先计算得到的用于反映所述待识别的社交网络账号真实性的数值;
如果查询到所述待识别的社交网络账号的可信度,则判断所述可信度是否超过可信阈值;
如果判断出所述可信度超过所述可信阈值,则确定所述待识别的社交网络账号为第一账号,所述第一账号为真实用户使用的账号;以及
如果判断出所述可信度未超过所述可信阈值,则确定所述待识别的社交网络账号为第二账号,所述第二账号为计算机操作的账号;
其中,所述社交网络账号的可信度基于社交网络关系计算得到,所述社交网络关系是基于真实的社交网络账号建立的社交关系,其中,通过实名认证的社交网络账号及所述实名认证的社交网络账号关注的账号,以及实名认证的社交网络账号关注的账号所关注的账号,形成的层层社交关系。
2.根据权利要求1所述的识别方法,其特征在于,
在接收社交网络账号的身份标识之前,所述识别方法还包括:基于社交网络关系计算所述社交网络关系中每个社交网络账号的可信度;将计算得到的所述每个社交网络账号的可信度存储到数据库中,
按照所述身份标识查询所述待识别的社交网络账号的可信度包括:按照所述身份标识从所述数据库中查询所述待识别的社交网络账号的可信度。
3.根据权利要求2所述的识别方法,其特征在于,基于社交网络关系计算所述社交网络关系中每个社交网络账号的可信度包括:
获取社交网络中通过实名认证的社交网络账号,将所述通过实名认证的社交网络账号作为第一账号圈中的社交网络账号;
获取所述通过实名认证的社交网络账号所关注的社交网络账号,将所述通过实名认证的社交网络账号和所述通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及
计算所述第二账号圈中的每个社交网络账号被所述第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为所述社交网络关系中每个社交网络账号的第一可信度。
4.根据权利要求3所述的识别方法,其特征在于,在计算所述第二账号圈中的每个社交网络账号被所述第二账号圈中的社交网络账号所关注的数量之后,所述识别方法还包括:
获取第三账号圈中的社交网络账号,其中,所述第三账号圈中的社交网络账号包括所述第二账号圈中的社交网络账号和所述第二账号圈中的社交网络账号所关注的账号;以及
计算所述第三账号圈中的每个社交网络账号被所述第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为所述社交网络关系中每个社交网络账号的第二可信度。
5.根据权利要求4所述的识别方法,其特征在于,所述可信阈值包括第一阈值和第二阈值,其中,如果查找到所述待识别的社交网络账号的可信度包括所述第一可信度和所述第二可信度,
判断所述可信度是否超过可信阈值包括:判断所述第一可信度是否超过所述第一阈值;判断所述第二可信度是否超过所述第二阈值,
其中,如果判断出所述第一可信度超过所述第一阈值,或者,判断出所述第二可信度超过所述第二阈值,则确定所述待识别的社交网络账号为所述第一账号;或者,如果判断出所述第一可信度超过所述第一阈值,并且判断出所述第二可信度超过所述第二阈值,则确定所述待识别的社交网络账号为所述第一账号。
6.一种社交网络账号的识别装置,其特征在于,包括:
接收单元,用于接收待识别的社交网络账号的身份标识;
查询单元,用于按照所述身份标识查询所述待识别的社交网络账号的可信度,所述可信度为预先计算得到的用于反映所述待识别的社交网络账号真实性的数值;
判断单元,用于当查询到所述待识别的社交网络账号的可信度时,判断所述可信度是否超过可信阈值;
第一确定单元,用于当判断出所述可信度超过所述可信阈值时,确定所述待识别的社交网络账号为第一账号,所述第一账号为真实用户使用的账号;以及
第二确定单元,用于当判断出所述可信度未超过所述可信阈值时,确定所述待识别的社交网络账号为第二账号,所述第二账号为计算机操作的账号;
其中,所述社交网络账号的可信度基于社交网络关系计算得到,所述社交网络关系是基于真实的社交网络账号建立的社交关系,其中,通过实名认证的社交网络账号及所述实名认证的社交网络账号关注的账号,以及实名认证的社交网络账号关注的账号所关注的账号,形成的层层社交关系。
7.根据权利要求6所述的识别装置,其特征在于,
所述识别装置还包括:计算单元,用于在接收社交网络账号的身份标识之前,基于社交网络关系计算所述社交网络关系中每个社交网络账号的可信度;存储单元,用于将计算得到的所述每个社交网络账号的可信度存储到数据库中,
所述查询单元包括:查询模块,用于按照所述身份标识从所述数据库中查询所述待识别的社交网络账号的可信度。
8.根据权利要求7所述的识别装置,其特征在于,所述计算单元包括:
第一获取模块,用于获取社交网络中通过实名认证的社交网络账号,将所述通过实名认证的社交网络账号作为第一账号圈中的社交网络账号;
第二获取模块,用于获取所述通过实名认证的社交网络账号所关注的社交网络账号,将所述通过实名认证的社交网络账号和所述通过实名认证的社交网络账号所关注的社交网络账号作为第二账号圈中的社交网络账号;以及
第一计算模块,用于计算所述第二账号圈中的每个社交网络账号被所述第二账号圈中的社交网络账号所关注的第一数量,将计算得到的第一数量作为所述社交网络关系中每个社交网络账号的第一可信度。
9.根据权利要求8所述的识别装置,其特征在于,所述计算单元还包括:
第三获取模块,用于在计算所述第二账号圈中的每个社交网络账号被所述第二账号圈中的社交网络账号所关注的数量之后,获取第三账号圈中的社交网络账号,其中,所述第三账号圈中的社交网络账号包括所述第二账号圈中的社交网络账号和所述第二账号圈中的社交网络账号所关注的账号;以及
第二计算模块,用于计算所述第三账号圈中的每个社交网络账号被所述第三账号圈中的社交网络账号所关注的第二数量,将计算得到的第二数量作为所述社交网络关系中每个社交网络账号的第二可信度。
10.根据权利要求9所述的识别装置,其特征在于,所述可信阈值包括第一阈值和第二阈值,其中,
所述判断单元包括:第一判断模块,用于当查找到所述待识别的社交网络账号的可信度包括所述第一可信度和所述第二可信度时,判断所述第一可信度是否超过所述第一阈值;第二判断模块,用于判断所述第二可信度是否超过所述第二阈值,
其中,所述第一确定单元还用于当判断出所述第一可信度超过所述第一阈值,或者,判断出所述第二可信度超过所述第二阈值,确定所述待识别的社交网络账号为所述第一账号;或者,所述第一确定单元还用于当判断出所述第一可信度超过所述第一阈值,并且判断出所述第二可信度超过所述第二阈值,确定所述待识别的社交网络账号为所述第一账号。
CN201410364828.5A 2014-07-28 2014-07-28 社交网络账号的识别方法和装置 Expired - Fee Related CN104092601B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410364828.5A CN104092601B (zh) 2014-07-28 2014-07-28 社交网络账号的识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410364828.5A CN104092601B (zh) 2014-07-28 2014-07-28 社交网络账号的识别方法和装置

Publications (2)

Publication Number Publication Date
CN104092601A CN104092601A (zh) 2014-10-08
CN104092601B true CN104092601B (zh) 2017-12-05

Family

ID=51640283

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410364828.5A Expired - Fee Related CN104092601B (zh) 2014-07-28 2014-07-28 社交网络账号的识别方法和装置

Country Status (1)

Country Link
CN (1) CN104092601B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111371761B (zh) * 2014-12-04 2022-10-18 创新先进技术有限公司 一种基于风险识别的信息处理方法及装置
CN105808988B (zh) * 2014-12-31 2020-07-03 阿里巴巴集团控股有限公司 一种识别异常账户的方法及装置
CN106296330A (zh) * 2015-06-11 2017-01-04 阿里巴巴集团控股有限公司 账号信息处理方法及装置
CN106611321B (zh) * 2015-10-22 2020-09-25 百度在线网络技术(北京)有限公司 虚假手机号码的识别方法和装置
CN106611133B (zh) * 2015-10-27 2022-07-19 创新先进技术有限公司 一种风险识别方法和设备
CN105843889B (zh) * 2016-03-21 2020-08-25 华南师范大学 基于可信度面向大数据及普通数据的数据采集方法和系统
CN105930501B (zh) * 2016-05-09 2019-08-16 深圳市永兴元科技股份有限公司 网络账号关联方法和装置
CN108600090A (zh) * 2018-05-02 2018-09-28 上海同砚信息科技有限公司 社交网络信息发布系统
CN112422480B (zh) * 2019-08-22 2022-09-13 腾讯科技(深圳)有限公司 帐号属性的确定方法和装置、存储介质及电子装置
CN111083141A (zh) * 2019-12-13 2020-04-28 广州市百果园信息技术有限公司 一种仿冒账号的识别方法、装置、服务器和存储介质
CN112636980B (zh) * 2020-12-25 2022-06-28 平安科技(深圳)有限公司 资源数量确定方法、装置、电子设备及相关产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102946331A (zh) * 2012-10-10 2013-02-27 北京交通大学 一种社交网络僵尸用户检测方法及装置
CN103457799A (zh) * 2013-09-03 2013-12-18 上海交通大学 基于关系图的微博僵尸用户检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8973100B2 (en) * 2013-01-08 2015-03-03 Facebook, Inc. Trust-based authentication in a social networking system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102946331A (zh) * 2012-10-10 2013-02-27 北京交通大学 一种社交网络僵尸用户检测方法及装置
CN103457799A (zh) * 2013-09-03 2013-12-18 上海交通大学 基于关系图的微博僵尸用户检测方法

Also Published As

Publication number Publication date
CN104092601A (zh) 2014-10-08

Similar Documents

Publication Publication Date Title
CN104092601B (zh) 社交网络账号的识别方法和装置
CN103198161B (zh) 微博水军识别方法与设备
CN107316198A (zh) 账户风险识别方法及装置
CN104063450B (zh) 热点信息分析方法及设备
CN109858919B (zh) 异常账号的确定方法及装置、在线下单方法及装置
CN107193894A (zh) 数据处理方法、个体识别方法及相关装置
CN107835231A (zh) 反馈信息的处理方法及终端设备
CN108257027A (zh) 保单数据审核方法、装置、计算机设备及存储介质
CN106951446B (zh) 金融信息推送方法和装置
CN107146089A (zh) 一种刷单识别方法及装置,电子设备
CN104866484A (zh) 一种数据处理方法和装置
CN108256954A (zh) 一种礼品赠送方案的选取方法及其终端
CN108197851A (zh) 一种电子商务多单同地址的物流分配方法
CN106469392A (zh) 选择及推荐展示对象的方法及装置
CN104598595B (zh) 欺诈网页检测方法及相应装置
CN107959675A (zh) 配电网无线通信接入的网络异常流量检测方法和装置
CN107274042A (zh) 一种业务参与对象的风险识别方法及装置
CN106529953A (zh) 一种对业务属性进行风险识别的方法及装置
CN104902498B (zh) 用户重入网识别方法和装置
CN106294524A (zh) 一种关系数据的处理方法和装置
CN110210934A (zh) 招标投标管理系统及方法
WO2014107517A1 (en) Priority-weighted quota cell selection to match a panelist to a market research project
CN110162572A (zh) 策略执行方法、服务器及计算机存储介质
EP1639536A4 (en) METHOD AND SYSTEM FOR COLLECTING AND ANALYZING INVESTIGATOR INFORMATION
CN105988998A (zh) 关系网络构建方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Method and device for recognizing social-media account

Effective date of registration: 20190129

Granted publication date: 20171205

Pledgee: Beijing technology intellectual property financing Company limited by guarantee

Pledgor: BEIJING WEIZOOM CULTURE MEDIA CO.,LTD.

Registration number: 2019990000085

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20200529

Granted publication date: 20171205

Pledgee: Beijing technology intellectual property financing Company limited by guarantee

Pledgor: BEIJING WEIZOOM CULTURE MEDIA Co.,Ltd.

Registration number: 2019990000085

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171205