CN110457600A - 查找目标群体的方法、装置、存储介质和计算机设备 - Google Patents

查找目标群体的方法、装置、存储介质和计算机设备 Download PDF

Info

Publication number
CN110457600A
CN110457600A CN201910752468.9A CN201910752468A CN110457600A CN 110457600 A CN110457600 A CN 110457600A CN 201910752468 A CN201910752468 A CN 201910752468A CN 110457600 A CN110457600 A CN 110457600A
Authority
CN
China
Prior art keywords
user information
user
information
target
incidence relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910752468.9A
Other languages
English (en)
Other versions
CN110457600B (zh
Inventor
尤飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910752468.9A priority Critical patent/CN110457600B/zh
Publication of CN110457600A publication Critical patent/CN110457600A/zh
Application granted granted Critical
Publication of CN110457600B publication Critical patent/CN110457600B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种查找目标群体的方法、装置、存储介质和计算机设备,所述方法包括:获取目标用户的第一用户信息;在异构关系网中,以所述第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息;所述异构关系网,是以各类型的用户信息为节点依据用户信息间的关联关系构建而成的;当所述第二用户信息中存在关联关系冲突的用户信息时,从所述第二用户信息中排除至少一部分存在关联关系冲突的用户信息;根据所述第一用户信息和排除后剩余的第二用户信息定位目标群体。本申请提供的方案可以实现准确且完整地查找出目标群体。

Description

查找目标群体的方法、装置、存储介质和计算机设备
技术领域
本申请涉及互联网技术领域,特别是涉及一种查找目标群体的方法、装置、存储介质和计算机设备。
背景技术
随着互联网技术的发展,社交网络也越来越受到用户的喜爱,通过社交网络不仅可以实现与任一端的用户即时进行通信,而且还可以查找到可能认识的人,如查找到朋友的朋友,或同学的同学等等。
在传统的社交网络中,都是基于一度人脉关系(即直接相识的朋友之间的关系)建立起来的,如在社交网络平台中,根据用户所有相识的亲朋好友的社交账号构建一个人际关系网络。当需要查找目标群体时,需要在社交网络中输入相应的信息方可实现查找的目的。然而,基于一度人脉关系建立的社交网络,其维度较低,可能无法准确、且完整地查找出目标群体。
发明内容
基于此,有必要针对通过一度人脉关系的社交网络可能无法准确且完整地查找出目标群体的技术问题,提供一种查找目标群体的方法、装置、存储介质和计算机设备。
获取目标用户的第一用户信息;
在异构关系网中,以所述第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息;所述异构关系网,是以各类型的用户信息为节点依据用户信息间的关联关系构建而成的;
当所述第二用户信息中存在关联关系冲突的用户信息时,从所述第二用户信息中排除至少一部分存在关联关系冲突的用户信息;
根据所述第一用户信息和排除后剩余的第二用户信息定位目标群体。
一种查找目标群体的装置,所述装置包括:
信息获取模块,用于获取目标用户的第一用户信息;
节点查找模块,用于在异构关系网中,以所述第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息;所述异构关系网,是以各类型的用户信息为节点依据用户信息间的关联关系进行连接构成的;
信息排除模块,用于当所述第二用户信息中存在关联关系冲突的用户信息时,从所述第二用户信息中排除至少一部分存在关联关系冲突的用户信息;
目标群体定位模块,用于根据所述第一用户信息和排除后剩余的第二用户信息定位目标群体。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述查找目标群体的方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述查找目标群体的方法的步骤。
上述查找目标群体的方法、装置、存储介质和计算机设备,异构关系网是以各类型的用户信息为节点依据用户信息间的关联关系构建而成的网络,在该异构关系网中以第一用户信息为根节点进行逐级查找,得到与目标用户所有具有关联关系的第二用户信息,确保可以查找到所有可能存在关联的用户信息。而且,异构关系网是基于各类型的用户信息所构成的,信息维度较高,在定位目标群体时可以确保定位的准确率和完整性。此外,在查找到第二用户信息时,还对第二用户信息中存在关联关系冲突的用户信息进行至少一部分的排除,在排除了至少一部分关联关系冲突的用户信息时,剩余的第二用户信息的关联关系不会存在冲突,从而在定位目标群体,可以避免因关联关系冲突而导致将无效的目标计算进来,提高了查找目标群体的准确性。
附图说明
图1为一个实施例中查找目标群体的方法的应用环境图;
图2为一个实施例中查找目标群体的方法的流程示意图;
图3为一个实施例中异构关系网的示意图;
图4为另一个实施例中异构关系网的示意图;
图5为一个实施例中节点树形式的异构关系网的示意图;
图6为一个实施例中根据第一权重和第二权重排除第二用户信息中的第一目标用户信息和第二目标用户信息步骤的流程示意图;
图7为一个实施例中用户信息和各用户信息之间进行关联的示意图;
图8为一个实施例中根据请求包中的第一用户信息和对应层级数量来查找异构关系网钟的子节点步骤的流程示意图;
图9为一个实施例中构建异构关系网步骤的流程示意图;
图10为一个实施例中通过异构关系网扩散出黑产群体的示意图;
图11为一个实施例中查找目标群体的系统的结构示意图;
图12为一个实施例中查找目标群体的装置的结构框图;
图13为另一个实施例中查找目标群体的装置的结构框图;
图14为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使智能机器具有感知、推理与决策的功能。在本发明实施例中,利用人工智能的技术,可以根据某个目标用户的用户信息在异构关系网中,推导出与该目标用户对应的目标群体。
图1为一个实施例中查找目标群体的方法的应用环境图。参照图1,该查找目标群体的方法应用于查找目标群体的系统。该查找目标群体的系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110向服务器120发送目标用户的第一用户信息。服务器120在获得目标用户的第一用户信息时,在异构关系网中,以第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息;异构关系网,是以各类型的用户信息为节点依据用户信息间的关联关系构建而成的;当第二用户信息中存在关联关系冲突的用户信息时,从第二用户信息中排除至少一部分存在关联关系冲突的用户信息;根据第一用户信息和排除后剩余的第二用户信息定位目标群体。服务器120将定位到的目标群体输出至终端110。
其中,终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种查找目标群体的方法。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图2,该查找目标群体的方法具体包括如下步骤:
S202,获取目标用户的第一用户信息。
其中,目标用户可以是已经确定个人兴趣或爱好的用户,或者是确定身份的用户。例如,当向某个爱好阅读的未知群体推荐文章时,在确定某个用户的阅读爱好时,该用户即为目标用户,通过该目标用户可以扩散出更多爱好阅读的用户。对于黑产群体,在确定其中某黑产用户的身份时,该黑产用户即为目标用户,通过该目标用户可以扩散出对应的黑产群体。黑产用户指的是在互联网产业中利用非法手段或法律边界模糊的手段进行不正当获利的人。而黑产群体是由黑产用户所组成的群体。
第一用户信息可以是目标用户的个人信息,具体可以是:目标用户的设备属性信息、社交账号、移动通信号(如手机号)、银行卡号、IP(Internet Protocol,互联网协议)地址和唯一标识用户的身份编号中的任一种。其中,设备可以是目标用户登录社交账号所使用的设备。对应的,设备属性信息可以是目标用户登录社交账号所使用设备的设备识别码、MAC(Media Access Control,媒体访问控制)地址、或其它硬件串号。身份编号具体可以是身份证号,为了确保社交账号的安全或验证使用社交账号的用户身份,一般会绑定身份证号。
在一个实施例中,终端获取输入的目标用户的第一用户信息,根据该第一用户信息生成网络数据请求包,将生成的网络数据请求包发送给服务器。服务器接收终端发送的网络数据请求包,对该网络数据请求包进行解析,得到目标用户的第一用户信息。
例如,以目标用户为黑产用户为例,在获得某个黑产用户的身份证号时,将该身份证号输入终端,通过终端来根据身份证号生成一个网络数据请求包并发送给服务器,以便服务器解析该网络数据请求包得到黑产用户的身份证号,进而在异构关系网中根据该身份证号进行扩散,从而挖掘出对应的黑产群体。
S204,在异构关系网中,以第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息。
其中,异构关系网是以各类型的用户信息为节点依据用户信息间的关联关系构建而成的。如图3所示,图中的每个点表示一个用户信息,截取图3中的一部分进行放大,得到如图4所示的异构关系网,该异构关系网中的每个节点分别表示设备属性信息、社交账号、移动通信号、银行卡号、IP地址和唯一标识用户的身份编号等用户信息。图4中各节点之间的连接线为不同用户信息之间的关联关系,例如目标用户的社交账号A1绑定了身份编号B1,表示目标用户的社交账号A1与身份编号B1之间存在关联关系,且为直接关联关系。又例如,目标用户使用社交账号A1在目标设备C1进行了登录,那么社交账号A1与目标设备C1之间存在关联关系,且也为直接关联关系。此外,目标用户的社交账号A1绑定了移动通信号D1,而移动通信号D1绑定了身份编号B2,表示目标用户的社交账号A1与身份编号B2之间存在关联关系,且为间接关联关系。
通过逐级查找子节点所得到的第二用户信息,由于所查找的子节点数量较多,因此所得到的第二用户信息数量也较多,在本发明实施例中,上述第二用户信息可理解为由多个用户信息所组成的第二用户信息集合。第二用户信息可以包括目标用户的个人信息以及其他用户的个人信息,个人信息具体可以是:目标用户的设备属性信息、社交账号、移动通信号、银行卡号和唯一标识用户的身份编号中的至少一种。
举例来说,假设目标用户的第一用户信息为社交账号A1,那么,在异构关系网中查找社交账号A1的节点为根节点往下查找第一层子节点,若社交账号A1的好友账号为社交账号A2~An,以及绑定社交账号A1的身份信息为身份编号B1,而且登录社交账号A1的设备为目标设备C1,那么第一层子节点即为社交账号A2~An、身份编号B1以及目标设备C1。其中,身份编号B1以及目标设备C1即为目标用户的个人信息,而社交账号A2~An即为其他用户的个人信息。需要说明的是,当目标用户的社交账号为多个时,社交账号A2~An中可能有一个或多个为目标用户的社交账号。
异构关系网中的节点是以设备属性信息、社交账号、移动通信号、银行卡号、IP地址和唯一标识用户的身份编号等构成。在一个实施例中,服务器将设备关系链、社交好友关系链、IP关系链、身份信息关系链、移动通信号关系链和银行卡关系链进行打通,形成异构关系网。其中,服务器可以通过对应的账号将上述关系链进行打通。
在一个实施例中,在进行逐级查找子节点时,将异构关系网当作一棵节点树,以第一用户信息对应的节点为根节点开始逐级往下进行查找,即查找挂载在根节点的第一层子节点,然后再继续查找挂载在第一层子节点的第二层子节点,依此类推,如图5所示。
由于异构关系网是一个庞大的网络,节点数众多,若不断往下查找,所查找到的用户信息可能是无用的信息,此时需要确定最大查找的层级数量,换句话说,当从根节点查找子节点时,往下查找多少个层级数量时停止继续往下查找。在一个实施例中,服务器确定待查找的层级数量;在异构关系网中,以第一用户信息为根节点按照层级数量逐级查找子节点,得到对应的第二用户信息。
具体地,在查找子节点之前,服务器先确定待查找的层级数量,然后按照所确定的层级数量,以第一用户信息的节点为根节点在异构关系网中逐级往下查找子节点,每往下一层级查找子节点时,对应的查找次数自动加一。在往下查找的过程中,当查找次数等于所确定的层级数量时,服务器将停止继续往下查找子节点。
例如,假设最大需要往下查找5个层级,以根节点为起点逐级往下查找子节点,查找到第一层子节点时,查找次数进行加1。当查找完所有第一层子节点时,以第一层子节点为父节点继续往下查找第二层子节点,查找到第二层子节点时,查找次数在上一次基础上继续进行加1,依此类推,直至查找次数为5时,停止继续往下查找子节点。
在一个实施例中,在异构关系网中,以第一用户信息为根节点按照层级数量逐级查找子节点,得到对应的第二用户信息的步骤,具体可以包括:在异构关系网中,服务器以第一用户信息为根节点查找相连的第一子节点,获得与第一用户信息为直接关联关系的第二用户信息;以第一子节点为父节点查找相连的第二子节点,获得与第一用户信息为间接关联关系的第二用户信息;以第二子节点为父节点查找相连的第三子节点,获得与第一用户信息为间接关联关系的第二用户信息。其中,上述第一子节点指的是第一层子节点,第二子节点指的是第二层子节点,第三子节点指的是第三层子节点。
其中,对于异构关系网的节点,若两个节点之间存在关联关系,那么,该关联关系可以是直接关联关系,也可以是间接关联关系。例如,目标用户的社交账号A1绑定了身份编号B1,表示社交账号A1与身份编号B1之间为直接关联关系。又例如,目标用户的社交账号A1绑定了移动通信号D1,而移动通信号D1又绑定了身份编号B2,则表示社交账号A1与身份编号B2之间为间接关联关系。
例如,以目标用户为黑产用户为例进行说明,在异构关系网中,利用该黑产用户的第一用户信息进行查找(也可以是扩散):a)一度查找(或扩散),指通过一度关系查找,例如查找登录社交账号A1的所有目标设备C1~Cm,以及查找社交账号A1的所有好友账号A2~An。b)二度查找(或扩散),指通过二度关系查找,例如查找登录社交账号A1的目标设备C1,然后查找其它使用目标设备C1登录的其它社交账号Ai~Aj。c)三度查找(或扩散),指通过三度关系查找,例如查找登录社交账号A1的目标设备C1,然后查找其它使用目标设备C1登录的其它社交账号Ai~Aj,然后分别查找社交账号Ai~Aj所绑定的身份编号Bi~Bj。
S206,当第二用户信息中存在关联关系冲突的用户信息时,从第二用户信息中排除至少一部分存在关联关系冲突的用户信息。
其中,关联关系冲突指的是:两个同类型的不同用户信息同时与另一个不同类型的用户信息存在关联关系。例如,若同类型的用户信息B1与另一不同类型的用户信息A之间为直接关联关系,而同类型的用户信息B2与该用户信息A之间为间接直接关联关系,由于用户信息A与用户信息B1、用户信息B2均进行了关联,而且用户信息B1、用户信息B2又是同类型的、且不同内容的两个用户信息,那么用户信息A、用户信息B1和用户信息B2之间存在关联关系冲突。上述的类型可以包括:设备信息类型、社交类型、通信号类型、银行卡类型、IP类型和身份信息类型。
在一个实施例中,当第二用户信息中的用户信息与指定类型的至少两个用户信息之间存在关联关系时,服务器则确定第二用户信息中存在关联关系冲突的用户信息。
其中,由于身份信息类型可以唯一标识用户的信息,因此本发明实施例中在选择指定类型时,可以选择身份信息类型作为指定类型。上述的关联关系包括直接关联关系和间接关联关系。
指定类型的至少两个用户信息可以包括:指定类型的第一目标用户信息和第二目标用户信息,或者还包括指定类型的第三目标用户。因此,上述存在关联关系冲突可以分为以下三种情况:
情况1,第二用户信息中的用户信息与第一目标用户信息、第一目标用户信息之间均为直接关联关系。
在一个实施例中,当第二用户信息中的用户信息与指定类型用户信息之间为直接关联关系,同时,第二用户信息中的用户信息与另一个同类型的指定类型用户信息之间也为直接关联关系,那么,服务器则确定第二用户信息中存在关联关系冲突的用户信息。
例如,假设社交账号A直接绑定了身份编号B1,社交账号A也直接绑定了B2,身份编号B1与身份编号B2都可以与社交账号A关联起来,此时便形成了关联关系冲突。也就是说,社交账号A同时直接关联到了身份编号B1与身份编号B2,无法确定社交账号A是属于身份编号B1的用户,还是属于身份编号B2的用户。
情况2,第二用户信息中的用户信息与第一目标用户信息为直接关联关系、且与第二目标用户信息为间接关联关系。
在一个实施例中,当第二用户信息中的用户信息与至少两个同类型用户信息之间存在关联关系时,则确定第二用户信息中存在关联关系冲突的用户信息的步骤,具体可以包括:当第二用户信息中存在与第一目标用户信息为直接关联关系、且与第二目标用户信息为间接关联关系的第三目标用户信息时,服务器则确定第一目标用户信息和第二目标用户信息为存在关联关系冲突的用户信息;其中,第一目标用户信息和第二目标用户信息均为指定类型的用户信息、且属于第二用户信息。
其中,第一目标用户信息和第二目标用户信息可以分别为用于唯一标识用户的身份编号。第三目标用户信息为社交账号。第二目标用户信息与第三目标用户信息之间的用户信息为移动通信号。
例如,假设社交账号A直接绑定了身份编号B1,社交账号A间接绑定了B2,即社交账号A直接绑定了移动通信号D、且移动通信号D直接绑定了身份编号B2,这时,身份编号B1与身份编号B2都可以与社交账号A关联起来,此时便形成了关联关系冲突。也就是说,社交账号A直接关联到了身份编号B1,而社交账号A也间接关联到了身份编号B2,也无法确定社交账号A是属于身份编号B1的用户,还是属于身份编号B2的用户。
情况3,第二用户信息中的用户信息与第一目标用户信息为间接关联关系、且与第二目标用户信息为间接关联关系。
在一个实施例中,当第二用户信息中的用户信息与至少两个同类型用户信息之间存在关联关系时,则确定第二用户信息中存在关联关系冲突的用户信息的步骤,具体可以包括:当第二用户信息中存在与第一目标用户信息为间接关联关系、且与第二目标用户信息为间接关联关系的第三目标用户信息时,服务器则确定第一目标用户信息和第二目标用户信息为存在关联关系冲突的用户信息;其中,第一目标用户信息和第二目标用户信息均为指定类型的用户信息、且属于第二用户信息。
例如,假设社交账号A间接绑定了身份编号B1,社交账号A间接绑定了B2,即社交账号A直接绑定了移动通信号D、且移动通信号D直接绑定了身份编号B1,而且社交账号A直接绑定了银行卡号E、且银行卡号E直接绑定了身份编号B2,这时,身份编号B1与身份编号B2都可以与社交账号A关联起来,此时便形成了关联关系冲突。也就是说,社交账号A均间接关联到了身份编号B1和身份编号B2,也无法确定社交账号A是属于身份编号B1的用户,还是属于身份编号B2的用户。
S208,根据第一用户信息和排除后剩余的第二用户信息定位目标群体。
在一个实施例中,第一用户信息和第二用户信息的类型可以有多种,在定位目标群体时,服务器可以直接根据第一用户信息和排除后剩余的第二用户信息定位目标群体。此外,服务器还可以对第一用户信息和排除后剩余的第二用户信息进行筛选,即从第一用户信息和排除后剩余的第二用户信息中筛选出目标类型的用户信息,然后根据筛选出来的用户信息定位目标群体。
在一个实施例中,当属于某个用户的第二用户信息中不包含有目标类型的用户信息时,服务器可按照备选类型从第二用户信息中选取用户信息,以确保从整个第二用户信息中所筛选出来的用户信息涵盖了所有用户的信息。需要说明的是,上述的所有用户指的是属于整个第二用户信息中的各用户。
例如,第一用户信息的类型为身份信息类型,由于第二用户信息的数量较多,因此第二用户信息所对应的类型可以有多种,具体为:设备信息类型、社交类型、通信号类型、银行卡类型、IP类型和身份信息类型。由于身份编号可以唯一标识某个用户,这里可以选身份信息类型为目标类型来进行筛选,即把第一信息和排除后剩余的第二信息中属于身份信息类型的所有用户信息筛选出来。为了避免属于某用户的第二用户信息中,因未包含有身份信息类型的用户信息而忽略掉,此时,还可以把社交账号也筛选出来。
上述实施例中,异构关系网是以各类型的用户信息为节点依据用户信息间的关联关系构建而成的网络,在该异构关系网中以第一用户信息为根节点进行逐级查找,得到与目标用户所有具有关联关系的第二用户信息,确保可以查找到所有可能存在关联的用户信息。而且,异构关系网是基于各类型的用户信息所构成的,信息维度较高,在定位目标群体时可以确保定位的准确率和完整性。此外,在查找到第二用户信息时,还对第二用户信息中存在关联关系冲突的用户信息进行至少一部分的排除,在排除了至少一部分关联关系冲突的用户信息时,剩余的第二用户信息的关联关系不会存在冲突,从而在定位目标群体,可以避免因关联关系冲突而导致将无效的目标计算进来,提高了查找目标群体的准确性。
在一个实施例中,为了避免因关联关系冲突而影响定位目标群体的准确性,可以通过计算权重的方式确定所要排除的用户信息,如图6所示,上述从第二用户信息中排除至少一部分存在关联关系冲突的用户信息的步骤,具体可以包括:
S602,获取与直接关联关系对应的第一权重。
S604,获取与间接关联关系对应的第二权重。
其中,直接关联关系指的是:异构关系网中的两个节点之间直接相连,或者,两个不同节点的用户信息之间存在直接关联(也即绑定)的关系,如图7所示,如身份编号与移动通信号关联。为了避免在出现关联关系冲突而造成定位目标群体不准确的问题,每一种类型的关联关系均对应不同的权重,如直接关联关系对应第一权重,间接关联关系对应第二权重。需要说明的是,间接关联关系可以包括单间隔关联关系、双间隔关联关系和多间隔关联关系。单间隔关联关系指的是两个间接关联关系的用户信息之间,只间隔了一个用户信息,依次类推。例如,社交账号与身份编号之间为单间隔关联关系,那么社交账号与身份编号之间只间隔了一个移动通信号。单间隔关联关系、双间隔关联关系和多间隔关联关系所对应的权重可以相同,也可以不同,可以根据实际场景进行设置。
第一权重、第二权重与异构关系网保存于数据库。在一个实施例中,当检测到触发事件时,服务器从数据库中获取与直接关联关系对应的第一权重,以及获取与间接关联关系对应的第二权重。其中,触发事件可以是确定第二用户数据中存在关联关系冲突的用户信息。
S606,按照第一权重与第二权重之间的大小关系,从第二用户信息中排除第一目标用户信息或第二目标用户信息。
在一个实施例中,当第一权重小于第二权重时,服务器可以从第二用户信息中排除第一目标用户信息。当第一权重大于第二权重时,服务器可以从第二用户信息中排除第二目标用户信息。当第一权重等于第二权重时,服务器则进一步进行判断。
在另一个实施例中,在获取到第一权重与第二权重时,服务器还获取第一目标用户信息和第二目标用户信息的影响因子,结合第一权重、第二权重以及第一目标用户信息和第二目标用户信息的影响因子综合考虑,以确定从第二用户信息中排除第一目标用户信息或第二目标用户信息。
在一个实施例中,S606具体可以包括:确定第一目标用户信息的第一影响因子;确定第二目标用户信息的第二影响因子,以及第二目标用户信息与第三目标用户信息之间的用户信息的第三影响因子;根据第一权重和第一影响因子计算第一目标用户信息的权重;依据第二权重、第二影响因子和第三影响因子计算第二目标用户信息的权重;按照第一目标用户信息的权重和第二目标用户信息的权重之间的大小关系,从第二用户信息中排除第一目标用户信息或第二目标用户信息。
例如,社交账号A所绑定的身份编号B1属于社交网络进行实名的身份信息。社交账号A所绑定的移动通信号D属于密保手机号码或支付手机号码,而移动通信号D所绑定的身份编号B2属于身份核查机构所绑定的信息。那么,此时出现了以下影响因子:
1)社交账号A在社交网络进行实名制,进行实名制所提供身份编号B1的第一影响因子a;
2)社交账号A的移动通信号D(即密保手机号码或支付手机号码),移动通信号D对应的第三影响因子c;
3)移动通信号D所绑定的、且为身份核查机构实名的身份编号B2,其对应的影响因子,即为第二影响因子b。
需要说明的是,不同用户信息在应用场景中所起的作用不同,对应的影响因子大小存在差异。例如,身份编号B1所起的作用是在社交网络进行实名制。移动通信号D的作用是通过社交账号A所对应的客户端进行密保或支付。
在一个实施例中,服务器获取对应的第一计算式,将第一权重和第一影响因子输入该第一计算式,得到第一目标用户信息的权重。此外,服务器获取对应的第二计算式,将第二权重、第二影响因子和第三影响因子输入上述第二计算式,得到第二目标用户信息的权重。
例如,假设第一计算式为L1=Func(x)+Func(y),第二计算式为L2=Func(x)+Func(y)+Func(z),第一权重和第一影响因子分别为s和a,第二权重、第二影响因子和第三影响因子分别为t、b和c。服务器将x1和a输入L1=Func(x)+Func(y),得到L1=Func(s)+Func(a)。服务器将x2、b和c输入L2=Func(x)+Func(y)+Func(z),得到L2=Func(t)+Func(b)+Func(c)。当L2>L1时,则身份编号B2为社交账号真实有效的身份信息。
上述实施例中,按照第一权重与第二权重之间的大小关系,或者,按照第一目标用户信息的权重和第二目标用户信息的权重之间的大小关系,从第二用户信息中排除第一目标用户信息或第二目标用户信息,在排除了第一目标用户信息或第二目标用户信息之后,剩余的第二用户信息的关联关系不会存在冲突,从而在定位目标群体,可以避免因关联关系冲突而导致将无效的目标计算进来,提高了查找目标群体的准确性。
在一个实施例中,查找目标群体的方法应用于查找目标群体的系统,该系统对外提供了查询接口,以便接收终端的网络数据请求包,进而进行目标群体的查找,将查找到的目标群体输出至终端。如图8所示,该方法还包括:
S802,接收网络数据请求包。
在一个实施例中,终端获取输入的目标用户的第一用户信息,并配置查询需求,该查询需求可以是用于表示在异构关系网中查找子节点时的层级数量。终端根据该第一用户信息和查询需求封装成网络数据请求包,将生成的网络数据请求包发送给服务器。服务器接收终端发送的网络数据请求包。
例如,以目标用户为黑产用户为例,在获得某个黑产用户的身份证号时,用户将该身份证号输入终端,终端从而得到黑产用户的身份证号,并且通过终端配置查询需求,如配置用于逐级查找子节点是所移动的最大层级数。然后,终端根据身份证号和查询需求生成一个网络数据请求包并发送给服务器,从而服务器接收到终端发送的网络数据请求包。
S804,在网络数据请求包中,提取目标用户的第一用户信息和待查找的层级数量。
其中,层级数量用于表示在异构关系网中查找子节点时的最大查询层级数。
例如,在接收到网络数据请求包时,服务器解析该网络数据请求包得到黑产用户的身份证号和查询需求,该查询需求用于表示在异构关系网中查找子节点时的层级数量。
S806,以第一用户信息为根节点,在异构关系网中按照层级数量逐级查找子节点,得到对应的第二用户信息。
其中,S806的具体步骤可以参考S204。
上述实施例中,在接收外界的网络数据请求包时,提取目标用户的第一用户信息和待查找的层级数量,按照层级数量的要求,在异构关系网中以第一用户信息为根节点进行查找,从而不断进行扩散,可以定位出与目标用户对应的目标群体。由于异构关系网是基于各类型的用户信息所构成的,信息维度较高,在定位目标群体时可以确保定位的准确率和完整性。
在一个实施例中,如图9所示,异构关系网的构建步骤包括:
S902,获取用于构建异构关系网的候选用户信息;候选用户信息中包含有第一用户信息。
其中,候选用户信息可以是关系链、社交好友关系链、IP关系链、身份信息关系链、移动通信号关系链和银行卡关系链中的信息,具体可以包括:设备属性信息、社交账号、移动通信号、银行卡号、IP地址和唯一标识用户的身份编号等。
在一个实施例中,服务器从设备关系链、社交好友关系链、IP关系链、身份信息关系链、移动通信号关系链和银行卡关系链中获取对应的候选用户信息。或者,服务器直接获取设备关系链、社交好友关系链、IP关系链、身份信息关系链、移动通信号关系链和银行卡关系链,以便根据所获取的关系链构建异构关系网,如图10所示。
S904,确定各候选用户信息之间的关联关系。
其中,各候选用户信息之间存在关联关系,可以是直接关联关系,也可以是间接关联关系。
S906,根据候选用户信息和对应的关联关系构建异构关系网。
在一个实施例中,S906具体可以包括:服务器对候选用户信息和关联关系进行归一化处理;将归一化处理所得的候选用户信息存储为节点;将归一化处理所得的关联关系存储为连接线;根据节点和节点对应的连接线形成异构关系网。
例如,将所获取的候选用户信息理解为节点,候选用户信息之间的关联关系理解为用于连接节点的连接线,服务器将候选用户信息以及对应的关联关系进行归一化,然后将归一化之后的候选用户信息以键值对(key/value)的方式进行存储,即节点(即key)-候选用户信息(即value)。服务器将归一化之后的关联关系也以键值对的方式进行存储,即连接线(即key)-关联关系(即value)。按照上述方式的存储,可以得到对应的异构关系网。
上述实施例中,通过构建高信息维度的异构关系网,在定位目标群体时可以确保定位的准确率和完整性。
作为一个示例,随着互联网技术的发展,给广大用户带来了极大的方便,同时也给黑色产业带来不断变得壮大起来的机会。基于传统的关系链方式进行扩散来查找黑产群体,已经无法满足当下需求。基于此背景,本发明实施例构建了一种基于设备属性信息、社交账号、手机号、银行卡号、IP地址和身份证号等多维用户信息的异构关系网,根据该异构关系网进行扩散,可以识别出黑产群体。接下来分以下几部分进行阐述:
(1)异构关系网的构建
获取设备属性信息、社交账号、手机号、银行卡号、IP地址和身份证号等多维用户信息,并对上述多维用户信息进行关联处理,得到对应的关联关系。
将设备属性信息、社交账号、手机号、银行卡号、IP地址和身份证号等多维用户信息理解为点(vertex),对应的关联关系理解为边(edge),然后将上述多为用户信息和对应的关联关系进行存储。例如,以社交账号为例,将社交属性存储为“点—属性值”,示例地,社交QQ即为点,其属性值包含但不限于使用时长和好友数等。此外,将关联关系存储为“边—属性值”,示例地,“QQ—设备”之间地绑定关系即为边,其属性包含但不限于QQ在设备上的活跃天数等。其中,在进行存储之前,对设备属性信息、社交账号、手机号、银行卡号、IP地址和身份证号等多维用户信息进行归一化处理,然后通过键值对(key-value,K-V)的方式进行存储。
将上述设备属性信息、社交账号、手机号、银行卡号、IP地址和身份证号等多维用户信息进行整理,形成包含设备关系链、社交好友关系链、IP关系链、身份信息关系链、移动通信号关系链和银行卡关系链的异构关系网,如图10所示。
(2)利用原始的黑产用户的用户信息进行扩散
a)一度扩散:指通过一度关系扩散,例如使用社交账号A1登录过的所有设备,或社交账号A1的的所有好友;
b)二度扩散:指通过二度关系扩散,例如使用社交账号A1登录过的所有设备上登陆过的社交账号A2;
c)三度扩散:指通过三度关系扩散,例如社交账号A1的绑定手机的社交账号A2的所有绑定身份证号。
(3)对扩散所得的信息进行去冲突处理
示例地,设备属性信息、社交账号、手机号、银行卡号、IP地址和身份证号等多维用户信息,在关联的过程中会出现冲突,例如:
1)社交账号A绑定了身份证B1;
2)社交账号A绑定了手机号D1;
3)手机号D1绑定的身份证B2;
这时,身份证B1与身份证B2都可以与社交账号A关联起来,此时便形成了冲突,因此需要对扩散所得的信息进行去冲突处理,以避免无法确定与社交账号A真实关联的是身份证B1还是身份证B2。
去冲突处理的方式如下:
1)社交账号A绑定了身份证B1,属于一度关系绑定,假设一度关系的权重为s;
2)社交账号A绑定了手机号D1,手机号D1绑定的身份证B2,此时,此时社交账号A与身份证B2属于二度关系绑定,假设二度关系的权重为t。
当一度关系的权重s大于二度关系的权重t,即社交账号A绑定身份证B1的权重大,则认为社交账号A真实关联的是身份证B1。
此外,为了进一步提高去冲突的有效性,还可以结合权重投票法。例如,社交账号A绑定的身份证B1用于游戏实名制;社交账号A绑定的手机号D1用于密保或支付功能,而手机号D1绑定的身份证B2属于公安绑定数据,那么,此时出现了以下影响因子:
1)社交账号A绑定的、且用于游戏实名制身份证B1,其影响因子为a;
2)社交账号A绑定的、且用于密保或支付的手机号D1,其影响因子为b;
3)手机号D1的公安实名身份证B2,其影响因子为c。
此时,身份证权重L的计算式为:
L1=Func(x)+Func(y)
L2=Func(x)+Func(y)+Func(z)
其中,Func函数可以为任意线性函数。
将一度关系的权重s和影响因子为a输入L1=Func(x)+Func(y),得到L1=Func(s)+Func(a);将一度关系的权重t、影响因子b和影响因子c输入L2=Func(x)+Func(y)+Func(z),得到L2=Func(t)+Func(a)+Func(b),此时,若L2>L1,则身份证B2为社交账号A真正有效关联的身份证,将身份证B1从扩散所得的信息中排除掉,从而黑产群体扩散出来。
此外,为了实现查找目标群体的方法时,在本发明实施例中,提供了一种查找目标群体的系统,如图11所示,接下来对该系统的架构模块和功能进行阐述:
1)对外服务集群:本查找目标群体的系统对外提供查询,用于接收网络数据请求包;
2)图语言解析服务器:指收到网络数据请求包后,解析得到请求方的查询需求,该查询需求可以是A节点的N度关系网络;
3)分布式存储集群1:用于存储策略数据,是使用硬盘设计的一套存储方案,主要存储介质为计算机硬盘;
4)分布式存储集群2:用于存储策略数据,使用内存设计的一套存储方案,主要存储介质为计算机内存;
5)冷数据存储集群:用于存储业务数据,也就是整体数据来源,例如支付流水、社交账号的登陆日志等实时数据;
6)业务日志数据:指的是社交账号登录、交易支付等,由用户发起并请求到服务器的日志数据。
通过实施上述实施例,可以具有以下有益效果:
1)根据异构关系网进行扩散,可以提高黑产群体的覆盖率;
2)通过异构关系网进行扩散的方式,可以解决没有好友关系链的黑产群体识别。
图2、6、8-9为一个实施例中查找目标群体的方法的流程示意图。应该理解的是,虽然图2、6、8-9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、6、8-9中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图12所示,在一个实施例中,提供了一种查找目标群体的装置,该查找目标群体的装置具体包括:信息获取模块1202、节点查找模块1204、信息排除模块1206和目标群体定位模块1208;其中:
信息获取模块1202,用于获取目标用户的第一用户信息;
节点查找模块1204,用于在异构关系网中,以第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息;异构关系网,是以各类型的用户信息为节点依据用户信息间的关联关系进行连接构成的;
信息排除模块1206,用于当第二用户信息中存在关联关系冲突的用户信息时,从第二用户信息中排除至少一部分存在关联关系冲突的用户信息;
目标群体定位模块1208,用于根据第一用户信息和排除后剩余的第二用户信息定位目标群体。
在一个实施例中,节点查找模块1204还用于:
确定待查找的层级数量;
在异构关系网中,以第一用户信息为根节点按照层级数量逐级查找子节点,得到对应的第二用户信息。
在一个实施例中,节点查找模块1204还用于:
在异构关系网中,以第一用户信息为根节点查找相连的第一子节点,获得与第一用户信息为直接关联关系的第二用户信息;
以第一子节点为父节点查找相连的第二子节点,获得与第一用户信息为间接关联关系的第二用户信息;
以第二子节点为父节点查找相连的第三子节点,获得与第一用户信息为间接关联关系的第二用户信息。
在一个实施例中,如图13所示,该装置还可以包括:冲突确定模块1210;其中:
冲突确定模块1210,用于当第二用户信息中的用户信息与至少两个同类型用户信息之间存在关联关系时,则确定第二用户信息中存在关联关系冲突的用户信息。
在一个实施例中,冲突确定模块1210还用于:
当第二用户信息中存在与第一目标用户信息为直接关联关系、且与第二目标用户信息为间接关联关系的第三目标用户信息时,则
确定第一目标用户信息和第二目标用户信息为存在关联关系冲突的用户信息;其中,第一目标用户信息和第二目标用户信息为同类型的用户信息、且属于第二用户信息。
上述实施例中,异构关系网是以各类型的用户信息为节点依据用户信息间的关联关系构建而成的网络,在该异构关系网中以第一用户信息为根节点进行逐级查找,得到与目标用户所有具有关联关系的第二用户信息,确保可以查找到所有可能存在关联的用户信息。而且,异构关系网是基于各类型的用户信息所构成的,信息维度较高,在定位目标群体时可以确保定位的准确率和完整性。此外,在查找到第二用户信息时,还对第二用户信息中存在关联关系冲突的用户信息进行至少一部分的排除,在排除了至少一部分关联关系冲突的用户信息时,剩余的第二用户信息的关联关系不会存在冲突,从而在定位目标群体,可以避免因关联关系冲突而导致将无效的目标计算进来,提高了查找目标群体的准确性。
在一个实施例中,信息排除模块1206还用于:
获取与直接关联关系对应的第一权重;
获取与间接关联关系对应的第二权重;
按照第一权重与第二权重之间的大小关系,从第二用户信息中排除第一目标用户信息或第二目标用户信息。
在一个实施例中,信息排除模块1206还用于:
确定第一目标用户信息的第一影响因子;
确定第二目标用户信息的第二影响因子,以及第二目标用户信息与第三目标用户信息之间的用户信息的第三影响因子;
根据第一权重和第一影响因子计算第一目标用户信息的权重;
依据第二权重、第二影响因子和第三影响因子计算第二目标用户信息的权重;
按照第一目标用户信息的权重和第二目标用户信息的权重之间的大小关系,从第二用户信息中排除第一目标用户信息或第二目标用户信息。
在一个实施例中,第一目标用户信息和第二目标用户信息分别为用于唯一标识用户的身份编号;第三目标用户信息为社交账号;第二目标用户信息与第三目标用户信息之间的用户信息为移动通信号。
上述实施例中,按照第一权重与第二权重之间的大小关系,或者,按照第一目标用户信息的权重和第二目标用户信息的权重之间的大小关系,从第二用户信息中排除第一目标用户信息或第二目标用户信息,在排除了第一目标用户信息或第二目标用户信息之后,剩余的第二用户信息的关联关系不会存在冲突,从而在定位目标群体,可以避免因关联关系冲突而导致将无效的目标计算进来,提高了查找目标群体的准确性。
在一个实施例中,信息获取模块1202还用于接收网络数据请求包;在网络数据请求包,提取出目标用户的第一用户信息和待查找的层级数量;
节点查找模块1204还用于以第一用户信息为根节点,在异构关系网中按照层级数量逐级查找子节点,得到对应的第二用户信息。
上述实施例中,在接收外界的网络数据请求包时,提取目标用户的第一用户信息和待查找的层级数量,按照层级数量的要求,在异构关系网中以第一用户信息为根节点进行查找,从而不断进行扩散,可以定位出与目标用户对应的目标群体。由于异构关系网是基于各类型的用户信息所构成的,信息维度较高,在定位目标群体时可以确保定位的准确率和完整性。
在一个实施例中,如图13所示,该装置还包括:关系网构建模块1212;其中:
关系网构建模块1212,用于获取用于构建异构关系网的候选用户信息;候选用户信息中包含有第一用户信息;确定各候选用户信息之间的关联关系;根据候选用户信息和对应的关联关系构建异构关系网。
在一个实施例中,关系网构建模块1212还用于:对候选用户信息和关联关系进行归一化处理;将归一化处理所得的候选用户信息存储为节点;将归一化处理所得的关联关系存储为连接线;根据节点和节点对应的连接线形成异构关系网。
上述实施例中,通过构建高信息维度的异构关系网,在定位目标群体时可以确保定位的准确率和完整性。
图14示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图14所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现查找目标群体的方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行查找目标群体的方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的查找目标群体的装置可以实现为一种计算机程序的形式,计算机程序可在如图14所示的计算机设备上运行。计算机设备的存储器中可存储组成该查找目标群体的装置的各个程序模块,比如,图12所示的信息获取模块1202、节点查找模块1204、信息排除模块1206和目标群体定位模块1208。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的查找目标群体的方法中的步骤。
例如,图14所示的计算机设备可以通过如图12所示的查找目标群体的装置中的信息获取模块1202执行S202。计算机设备可通过节点查找模块1204执行S204。计算机设备可通过信息排除模块1206执行S206。计算机设备可通过目标群体定位模块1208执行S208。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述查找目标群体的方法的步骤。此处查找目标群体的方法的步骤可以是上述各个实施例的查找目标群体的方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述查找目标群体的方法的步骤。此处查找目标群体的方法的步骤可以是上述各个实施例的查找目标群体的方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种查找目标群体的方法,包括:
获取目标用户的第一用户信息;
在异构关系网中,以所述第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息;所述异构关系网,是以各类型的用户信息为节点依据用户信息间的关联关系构建而成的;
当所述第二用户信息中存在关联关系冲突的用户信息时,从所述第二用户信息中排除至少一部分存在关联关系冲突的用户信息;
根据所述第一用户信息和排除后剩余的第二用户信息定位目标群体。
2.根据权利要求1所述的方法,其特征在于,所述在异构关系网中,以所述第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息包括:
确定待查找的层级数量;
在所述异构关系网中,以所述第一用户信息为根节点按照所述层级数量逐级查找子节点,得到对应的第二用户信息。
3.根据权利要求2所述的方法,其特征在于,所述在所述异构关系网中,以所述第一用户信息为根节点按照所述层级数量逐级查找子节点,得到对应的第二用户信息包括:
在所述异构关系网中,以所述第一用户信息为根节点查找相连的第一子节点,获得与所述第一用户信息为直接关联关系的第二用户信息;
以所述第一子节点为父节点查找相连的第二子节点,获得与所述第一用户信息为间接关联关系的第二用户信息;
以所述第二子节点为父节点查找相连的第三子节点,获得与所述第一用户信息为间接关联关系的第二用户信息。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述第二用户信息中的用户信息与指定类型的至少两个用户信息之间存在关联关系时,则确定所述第二用户信息中存在关联关系冲突的用户信息。
5.根据权利要求4所述的方法,其特征在于,所述当所述第二用户信息中的用户信息与指定类型的至少两个用户信息之间存在关联关系时,则确定所述第二用户信息中存在关联关系冲突的用户信息包括:
当所述第二用户信息中存在与第一目标用户信息为直接关联关系、且与第二目标用户信息为间接关联关系的第三目标用户信息时,则
确定所述第一目标用户信息和所述第二目标用户信息为存在关联关系冲突的用户信息;
其中,所述第一目标用户信息和所述第二目标用户信息为所述指定类型的用户信息、且属于所述第二用户信息。
6.根据权利要求5所述的方法,其特征在于,所述从所述第二用户信息中排除至少一部分存在关联关系冲突的用户信息包括:
获取与所述直接关联关系对应的第一权重;
获取与所述间接关联关系对应的第二权重;
按照所述第一权重与所述第二权重之间的大小关系,从所述第二用户信息中排除所述第一目标用户信息或所述第二目标用户信息。
7.根据权利要求6所述的方法,其特征在于,所述按照所述第一权重与所述第二权重之间的大小关系,从所述第二用户信息中排除所述第一目标用户信息或所述第二目标用户信息包括:
确定所述第一目标用户信息的第一影响因子;
确定所述第二目标用户信息的第二影响因子,以及所述第二目标用户信息与所述第三目标用户信息之间的用户信息的第三影响因子;
根据所述第一权重和所述第一影响因子计算所述第一目标用户信息的权重;
依据所述第二权重、所述第二影响因子和第三影响因子计算所述第二目标用户信息的权重;
按照所述第一目标用户信息的权重和所述第二目标用户信息的权重之间的大小关系,从所述第二用户信息中排除所述第一目标用户信息或所述第二目标用户信息。
8.根据权利要求5至7中任一项所述的方法,其特征在于,所述第一目标用户信息和所述第二目标用户信息分别为用于唯一标识用户的身份编号;所述第三目标用户信息为社交账号;所述第二目标用户信息与所述第三目标用户信息之间的用户信息为移动通信号。
9.根据权利要求1所述的方法,其特征在于,所述获取目标用户的第一用户信息包括:
接收网络数据请求包;
在所述网络数据请求包,提取出所述目标用户的第一用户信息和待查找的层级数量;
所述在异构关系网中,以所述第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息包括:
以所述第一用户信息为根节点,在所述异构关系网中按照所述层级数量逐级查找子节点,得到对应的第二用户信息。
10.根据权利要求1所述的方法,其特征在于,所述异构关系网的构建步骤包括:
获取用于构建异构关系网的候选用户信息;所述候选用户信息中包含有所述第一用户信息;
确定各所述候选用户信息之间的关联关系;
根据所述候选用户信息和对应的关联关系构建异构关系网。
11.根据权利要求10所述的方法,其特征在于,所述根据所述候选用户信息和对应的关联关系构建异构关系网包括:
对所述候选用户信息和所述关联关系进行归一化处理;
将归一化处理所得的候选用户信息存储为节点;
将归一化处理所得的关联关系存储为连接线;
根据所述节点和所述节点对应的连接线形成异构关系网。
12.一种查找目标群体的装置,其特征在于,所述装置包括:
信息获取模块,用于获取目标用户的第一用户信息;
节点查找模块,用于在异构关系网中,以所述第一用户信息为根节点逐级查找子节点,得到对应的第二用户信息;所述异构关系网,是以各类型的用户信息为节点依据用户信息间的关联关系进行连接构成的;
信息排除模块,用于当所述第二用户信息中存在关联关系冲突的用户信息时,从所述第二用户信息中排除至少一部分存在关联关系冲突的用户信息;
目标群体定位模块,用于根据所述第一用户信息和排除后剩余的第二用户信息定位目标群体。
13.根据权利要求12所述的装置,其特征在于,所述节点查找模块还用于:
确定待查找的层级数量;
在所述异构关系网中,以所述第一用户信息为根节点按照所述层级数量逐级查找子节点,得到对应的第二用户信息。
14.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至11中任一项所述方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至11中任一项所述方法的步骤。
CN201910752468.9A 2019-08-15 2019-08-15 查找目标群体的方法、装置、存储介质和计算机设备 Active CN110457600B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910752468.9A CN110457600B (zh) 2019-08-15 2019-08-15 查找目标群体的方法、装置、存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910752468.9A CN110457600B (zh) 2019-08-15 2019-08-15 查找目标群体的方法、装置、存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN110457600A true CN110457600A (zh) 2019-11-15
CN110457600B CN110457600B (zh) 2023-10-27

Family

ID=68486712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910752468.9A Active CN110457600B (zh) 2019-08-15 2019-08-15 查找目标群体的方法、装置、存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN110457600B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767321A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 节点关系网络的确定方法、装置、电子设备和存储介质
CN117707453A (zh) * 2023-08-15 2024-03-15 荣耀终端有限公司 一种节点信息的读取方法、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150074122A1 (en) * 2013-09-09 2015-03-12 International Business Machines Corporation Social recommendation across heterogeneous networks
CN109446194A (zh) * 2018-08-21 2019-03-08 中国平安人寿保险股份有限公司 寻找预备主管的方法、装置、计算机设备以及存储介质
CN109446359A (zh) * 2018-09-26 2019-03-08 深圳壹账通智能科技有限公司 一种图形数据库构建方法及终端设备
CN109918395A (zh) * 2019-02-19 2019-06-21 北京明略软件系统有限公司 一种群体挖掘方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150074122A1 (en) * 2013-09-09 2015-03-12 International Business Machines Corporation Social recommendation across heterogeneous networks
CN109446194A (zh) * 2018-08-21 2019-03-08 中国平安人寿保险股份有限公司 寻找预备主管的方法、装置、计算机设备以及存储介质
CN109446359A (zh) * 2018-09-26 2019-03-08 深圳壹账通智能科技有限公司 一种图形数据库构建方法及终端设备
CN109918395A (zh) * 2019-02-19 2019-06-21 北京明略软件系统有限公司 一种群体挖掘方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767321A (zh) * 2020-06-30 2020-10-13 北京百度网讯科技有限公司 节点关系网络的确定方法、装置、电子设备和存储介质
CN111767321B (zh) * 2020-06-30 2024-02-09 北京百度网讯科技有限公司 节点关系网络的确定方法、装置、电子设备和存储介质
CN117707453A (zh) * 2023-08-15 2024-03-15 荣耀终端有限公司 一种节点信息的读取方法、设备及存储介质

Also Published As

Publication number Publication date
CN110457600B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
US11037083B2 (en) Non-intrusive techniques for discovering and using organizational relationships
Wang et al. A blockchain based privacy-preserving incentive mechanism in crowdsensing applications
CN103916244B (zh) 验证方法及装置
CN103607416B (zh) 一种网络终端机器身份认证的方法及应用系统
Billhardt et al. Trust-based service provider selection in open environments
US11106659B2 (en) Blockchain-based recording and querying operations
CN104506487B (zh) 云环境下隐私策略的可信执行方法
CN109063138A (zh) 用于在区块链即服务平台搜索数据的方法、设备及存储介质
CN105022939B (zh) 信息验证方法及装置
US20130007864A1 (en) System and method for location-aware social networking authentication
CN109985389A (zh) 基于区块链智能合约的牌类游戏防作弊方法及其系统
Xu et al. Trust2Privacy: A novel fuzzy trust-to-privacy mechanism for mobile social networks
CN107231345A (zh) 基于ahp的网络用户行为风险评估方法
CN110457600A (zh) 查找目标群体的方法、装置、存储介质和计算机设备
Gu et al. Using blockchain to enhance the security of fog-assisted crowdsensing systems
CN111161006A (zh) 一种区块链信用服务方法、系统及存储介质
CN111737765A (zh) 区块链资源的管理方法及装置
Zhang et al. A hybrid trust evaluation framework for E-commerce in online social network: a factor enrichment perspective
CN108540335A (zh) 设备分析报告的管理方法及管理装置
CN116821952A (zh) 基于区块链共识机制的隐私数据计算可追溯系统及方法
CN106156640A (zh) 基于大数据可信计算的信息运维服务知识共享方法
KR102488866B1 (ko) 블록체인 기반 개인 신상 증명을 위한 서비스 제공 장치 및 방법
Zhang et al. How do you interact with your old friends on a new site: Understanding social ties among different social network sites
Ma et al. Preserving privacy on the searchable internet
Lagesse Analytical evaluation of P2P reputation systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant