CN110209820A - 用户标识检测方法、装置及存储介质 - Google Patents

用户标识检测方法、装置及存储介质 Download PDF

Info

Publication number
CN110209820A
CN110209820A CN201910487943.4A CN201910487943A CN110209820A CN 110209820 A CN110209820 A CN 110209820A CN 201910487943 A CN201910487943 A CN 201910487943A CN 110209820 A CN110209820 A CN 110209820A
Authority
CN
China
Prior art keywords
user identifier
device identification
operation note
mark
note
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910487943.4A
Other languages
English (en)
Other versions
CN110209820B (zh
Inventor
温蕊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910487943.4A priority Critical patent/CN110209820B/zh
Publication of CN110209820A publication Critical patent/CN110209820A/zh
Application granted granted Critical
Publication of CN110209820B publication Critical patent/CN110209820B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种用户标识检测方法、装置及存储介质,属于图像处理领域。方法包括:根据多条操作记录,获取每个用户标识的操作信息,以及每个设备标识的操作信息;根据预设数据库,确定用户标识的初始分类标识;将多个用户标识和多个设备标识作为节点,将属于同一条操作记录的任两个节点进行连接,得到第一图网络,将每个用户标识的操作信息和初始分类标识,以及每个设备标识的操作信息添加至对应的节点中;基于图神经网络模型,对第一图网络进行预测,得到第二图网络。本发明实施例采用图神经网络模型和图网络对用户标识进行预测,突破了通过固定检测规则检测用户标识的局限性,防止异常用户躲避检测规则,提高了检测异常用户标识的准确率。

Description

用户标识检测方法、装置及存储介质
技术领域
本发明涉及计算机技术领域,特别涉及一种用户标识检测方法、装置及存储介质。
背景技术
随着计算机技术的快速发展和互联网的广泛普及,互联网的用户规模越来越大。随着用户的不断增加,互联网中除了正常用户外,还出现了很多异常用户,这些异常用户通过互联网传播虚假信息,严重破坏了网络环境。因此如何检测出正常用户和异常用户成为亟待解决的问题。
相关技术中,通常会预先设置固定的检测规则,该检测规则用于规定正常用户应满足的条件,如用户使用的用户标识是否合法、用户使用的设备标识是否合法或者同一个用户使用的设备数量是否小于规定数量。那么,对于待检测的用户标识,获取用户标识的操作记录,该操作记录中包括该用户标识和用户操作的设备标识,根据获取到的操作记录,获取用户标识、用户标识对应的设备标识以及用户标识对应的设备标识的数量,判断这些信息是否满足预先设置的检测规则。当满足该检测规则时,确定该用户标识为正常用户标识,当不满足该检测规则时,确定该用户标识为异常用户标识。
该检测规则固定,具有一定的局限性,如果异常用户获知该检测规则,很容易躲避该检测规则而通过检测,因此检测异常用户的准确率较低。
发明内容
本发明实例提供了一种用户标识检测方法、装置及存储介质,解决了相关技术存在的问题。所述技术方案如下:
一方面,提供了一种用户标识检测方法,所述方法包括:
根据多条操作记录,获取多个用户标识中每个用户标识的操作信息,以及多个设备标识中每个设备标识的操作信息;每条操作记录包括用户标识和设备标识,用于表示所述用户标识对应的用户在所述设备标识对应的设备上执行的操作;
将所述多个用户标识中,预设数据库中包括的用户标识的初始分类标识确定为第一分类标识,所述预设数据库中不包括的用户标识的初始分类标识确定为第二分类标识,所述预设数据库中包括至少一个异常用户标识,所述第一分类标识用于表示用户标识属于异常用户标识,所述第二分类标识用于表示用户标识属于正常用户标识;
将所述多个用户标识和所述多个设备标识作为节点,将属于同一条操作记录的任两个节点进行连接,得到第一图网络,将所述每个用户标识的操作信息和初始分类标识,以及所述每个设备标识的操作信息添加至对应的节点中;
基于图神经网络模型,对所述第一图网络中每个用户标识的分类标识进行预测,得到第二图网络,所述第二图网络中包括所述多个用户标识的预测分类标识。
另一方面,提供了一种用户标识检测装置,所述装置包括:
获取模块,用于根据多条操作记录,获取多个用户标识中每个用户标识的操作信息,以及多个设备标识中每个设备标识的操作信息;每条操作记录包括用户标识和设备标识,用于表示所述用户标识对应的用户在所述设备标识对应的设备上执行的操作;
确定模块,用于将所述多个用户标识中,预设数据库中包括的用户标识的初始分类标识确定为第一分类标识,所述预设数据库中不包括的用户标识的初始分类标识确定为第二分类标识,所述预设数据库中包括至少一个异常用户标识,所述第一分类标识用于表示用户标识属于异常用户标识,所述第二分类标识用于表示用户标识属于正常用户标识;
添加模块,用于将所述多个用户标识和所述多个设备标识作为节点,将属于同一条操作记录的任两个节点进行连接,得到第一图网络,将所述每个用户标识的操作信息和初始分类标识,以及所述每个设备标识的操作信息添加至对应的节点中;
预测模块,用于基于图神经网络模型,对所述第一图网络中每个用户标识的分类标识进行预测,得到第二图网络,所述第二图网络中包括所述多个用户标识的预测分类标识。
另一方面,提供了一种用户标识检测装置,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如所述用户标识检测方法中所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如所述用户标识检测方法中所执行的操作。
本发明实施例通过获取多条操作记录,根据该多条操作记录获取多个用户标识的操作信息以及多个设备标识中每个设备标识的操作信息,为该多条操作记录中的每个标识添加种类标记,将多个用户标识中属于预设数据库的用户标识的初始分类标识确定为第一分类标识,将不属于预设数据库的用户标识的初始分类标识确定为第二分类标识,且基于多个用户标识和多个设备标识构建第一图网络,将每个用户标识的操作信息、初始分类标识和种类标识以及每个设备标识的操作信息和种类标记添加至对应节点中,基于图神经网络模型,对第一图网络中的每个用户标识的分类标识进行预测,得到预测后的第二图网络,根据该第二图网络即可确定正常用户标识和异常用户标识。本发明实施例不再采用固定检测规则检测用户标识,而是采用图神经网络模型对用户标识的分类标识进行预测,基于用户标识的分类标识、用户标识的操作信息和设备的操作信息构建图网络,根据图网络对用户标识进行预测,突破了通过固定检测规则检测用户标识的局限性,防止异常用户躲避检测规则,提高了检测异常用户标识的准确率。
并且,本发明实施例还继续基于图神经网络模型,将预测得到的图网络再次输入到图神经网络模型中,继续对用户标识进行预测,基于该图神经网络模型对图网络进行多次预测,提高检测用户标识的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种实施环境的结构示意图;
图2是本发明实施例提供的一种用户标识检测方法的流程图;
图3是本发明实施例提供的一种图网络的结构示意图;
图4是本发明实施例提供的一种图神经网络模型的结构示意图;
图5是本发明实施例提供的一种检测第一图网络的流程图;
图6是本发明实施例提供的一种操作流程示意图;
图7是本发明实施例提供的一种用户标识检测装置的结构示意图;
图8是本发明实施例提供的另一种用户标识检测装置的结构示意图;
图9是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明实施例提供的一种实施环境的结构示意图。参见图1,该实施环境包括多个第一服务器101和第二服务器102,该多个第一服务器101分别与第二服务器102通过通信网络连接。
其中,多个第一服务器101可以包括即时通信服务器、信息展示服务器、视频播放服务器、网络购物服务器等。第二服务器102为用于提供用户标识检测服务的服务器,能够根据用户标识的操作记录检测用户标识是正常用户标识还是异常用户标识。
第二服务器102可以为多个第一服务器101提供检测接口,任一第一服务器101可以调用第二服务器102提供的检测接口,向第二服务器102发送获取的操作记录,由第二服务器102根据接收到的多条操作记录和图神经网络模型,对多条操作记录对应的多个用户标识进行检测,向第一服务器101反馈检测结果。
上述服务器可以为一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。
另外,该实施环境还包括多个设备103,该多个第一服务器101均可与多个设备103通过通信网络连接。
其中,设备可以为手机、平板电脑、个人计算机等设备。
每个设备103基于用户标识登录所连接的第一服务器101,与第一服务器101进行交互,由第一服务器101为设备103提供服务。且在交互过程中,第一服务器101会根据设备103登录的用户标识获取操作记录。
该操作记录可以由第一服务器101生成,即设备103将检测到的操作对应的操作请求发送给第一服务器101,第一服务器101基于该操作请求进行响应,并且还会根据该操作请求生成用户标识的操作记录。
或者,该操作记录可以由设备103生成后上传至第一服务器101,即设备103根据执行的操作生成用户标识的操作记录,将生成的操作记录发送给第一服务器101,由第一服务器101存储操作记录。
本发明实施例提供的用户标识检测方法,可以应用于多种应用场景中。
在即时通信场景中,采用本发明实施例提供的用户标识检测方法,对登录即时通信应用的多个用户标识进行检测,确定该多个用户标识中的异常用户标识,将确定的异常用户标识发送的信息屏蔽,或者将确定的异常用户标识进行封禁处理。
在资源包分享场景中,任一用户标识向其他用户标识分享资源包,其他用户标识可以领取所分享的资源包,此时采用本发明实施例提供的用户标识检测方法,对请求领取资源包的用户标识进行检测,确定异常用户标识,禁止异常用户标识领取资源包。
在网络投票场景下,许多异常用户会通过各种方式来增加投票数量,破坏网络投票的公平性,采用本发明实施例提供的用户标识检测方法,对进行投票的用户标识进行检测,确定异常用户标识,禁止异常用户标识在后续投票过程中继续投票的权限。或者,不仅禁止确定的异常用户标识在后续投票过程中继续投票的权限,而且将该异常用户标识已投的票删除,排除异常用户标识的投票对投票数量造成的干扰。
图2是本发明实施例提供的一种用户标识检测方法的流程图。参见图2,应用于检测服务器中。该方法包括:
201、获取多条操作记录。
检测服务器可以获取多条操作记录,该多条操作记录中包括多个用户标识的操作记录,因此,从多条操作记录中获取该多个用户标识中每个用户标识的操作记录,后续可以根据获取的操作记录对多个用户标识进行检测,确定该多个用户标识中的正常用户标识和异常用户标识。
其中,每条操作记录包括用户标识和设备标识,用户标识用于确定唯一对应的用户,例如该用户标识可以为QIMEI(一种移动用户标识码)或者为其他用户标识码。设备标识用于确定唯一对应的设备,例如该设备标识可以为IP(Internet Protocol,网际协议),或者MAC(Media Access Control,媒体访问控制),或者IMSI(International MobileSubscriber Identification Number,国际移动用户识别码),或者IMEI(InternationalMobile Equipment Identity,国际移动设备识别码)等。
且操作记录用于表示用户标识对应的用户在设备标识对应的设备上执行的操作,每条操作记录中可以包括用户在设备上执行的操作。其中,操作记录中的操作可以包括多种,可以为登录、退出等。
设备可以执行多种操作,该设备每执行一个操作,就可以生成一条操作记录。例如,当设备基于用户标识登录检测服务器时,生成该用户标识对应的操作记录,且该操作记录中包括的操作为登录。或者,当设备基于用户标识退出检测服务器时,生成该用户标识对应的操作记录,且该操作记录中包括的操作为退出。或者,设备还可以执行其他操作,对应生成其他操作记录。
在一种可能实现方式中,每条操作记录可以如表1所示:
表1
序号 用户标识 设备标识 操作时间 操作
1 用户1 设备1 XX年XX月XX日XX时XX分 登录
2 用户2 设备2 YY年YY月XX日YY时YY分 登录
3 用户3 设备3 ZZ年ZZ月XX日ZZ时ZZ分 退出
关于获取多条操作记录的方式可以包括以下至少一种:
1、多个设备分别基于用户标识登录检测服务器,该多个设备中的每个设备生成操作记录,将生成的操作记录存储下来,且检测服务器每隔预设时长向多个设备发送操作记录获取请求,当多个设备中的每个设备接收到操作记录获取请求时,向检测服务器发送已存储的操作记录,检测服务器接收每个设备发送的操作记录,存储接收的操作记录。
2、对于每个设备,每当设备生成一条操作记录时,向检测服务器发送该条操作记录,检测服务器接收设备发送的操作记录,存储接收的操作记录。
3、对于每个设备,生成用户标识的操作记录,且每隔预设时长向检测服务器发送该预设时长内的操作记录,检测服务器接收设备发送的操作记录,存储接收的操作记录。
4、对于每个设备,生成用户标识的操作记录,且每当生成操作记录的条数达到预设数量时,向检测服务器发送该预设数量的操作记录,检测服务器接收设备发送的操作记录。
5、设备检测到触发任一操作时,生成该操作对应的操作请求,向检测服务器发送该操作请求,检测服务器接收该操作请求,对该操作请求进行响应,且该检测服务器生成该操作请求对应的操作记录,存储该操作记录。
在一种可能实现方式中,上述检测服务器可以为图1所示实施环境中的第一服务器,多个设备可以分别基于用户标识登录该第一服务器。而在另一种可能实现方式中,上述检测服务器可以为图1所示实施环境中的第二服务器,多条操作记录由多个第一服务器发送给第二服务器。
202、为多条操作记录中的每个标识添加种类标记。
该多条操作记录中的每条操作记录均包括用户标识和设备标识,为便于对用户标识和设备标识的区分,将每条操作记录中的每个标识添加种类标记,且该种类标识用于表示标识所属的种类,根据每个标识的种类标记即可确定标识所属的种类。
例如,对于用户标识和设备标识来说,为用户标识添加种类标记1,为设备标识添加种类标记2。
对于每个设备来说,每个设备可以具有至少一种设备标识。因此,每条操作记录中也包括用户标识和至少一种设备标识。且设备标识包括IP地址、MAC地址、IMSI或IMEI中的至少一种。
在一种可能实现方式中,对于多个设备中的每个设备来说,设备所执行的操作不同,用于表示该设备的设备标识也不同。当设备执行操作时,获取该操作关联的设备标识,生成操作记录,在此过程中不会获取其他种类的设备标识。例如,当设备执行的操作通过通信网络进行数据传输时,此时向其他设备发送数据时使用该设备的IP地址,因此在生成操作记录时,获取该设备的IP地址,生成的操作记录。
由于不同操作关联的设备标识的种类不同,因此生成的操作记录中包括的设备标识的种类也不同。即多条操作记录中包括的设备标识的种类各不相同,每条操作记录中包括用户标识和至少一种设备标识。
在另一种可能实现方式中,该多条操作记录由多个第一服务器发送给检测服务器时,由于多个第一服务器生成操作记录的方式不同,导致这些操作记录中包括的设备标识的种类各不相同,因此,每条操作记录中包括用户标识和至少一种设备标识。
例如,当该操作记录中可以包括用户标识和4种设备标识时,每条操作记录如表2所示:
表2
如表2所示,该多条操作记录中的每条操作记录中均包括用户标识和4种设备标识,对于每个用户标识,都可以确定该用户标识在何种设备上何时触发的何种操作。
其中,为便于区分用户标识和设备标识,为多条操作记录中的用户标识添加第一种类标记,为多条操作记录中的IP地址添加第二种类标记,为多条操作记录中的MAC地址添加第三种类标记,为多条操作记录中的IMSI添加第四种类标记,为多条操作记录中的IMEI添加第五种类标记。
例如,如表3所示,当每条操作记录中包括用户标识和4种设备标识时,为用户标识添加种类标记A,为标识为IP的设备标识添加种类标记B,为标识为MAC的设备标识添加种类标记C,为标识为IMSI的设备标识添加种类标记D,为标识为IMEI的设备标识添加种类标识E,则可以根据添加的种类标记确定每个标识所属的种类。
表3
需要说明的是,在本发明实施例中,步骤202为可选步骤,在另一实施例中,可不执行该步骤202。
203、根据多条操作记录,获取多个用户标识中每个用户标识的操作信息,以及多个设备标识中每个设备标识的操作信息。
每条操作记录中包括用户标识、设备标识和对应的操作,多条操作记录包括的用户标识可能相同,也可能不同,多条操作记录包括的设备标识可能相同,也可能不同。因此,根据该多条操作记录中包含同一用户标识的操作记录进行统计,可以得到该用户标识的操作信息,根据该多条操作记录中包含同一设备标识的操作记录进行统计,可以得到该设备标识的操作信息。
获取用户标识的操作信息的过程可以包括:按照确定的用户标识,对该多条操作记录进行筛选,得到多条操作记录中包含该用户标识的至少一条操作记录,再从获取的操作记录中确定包括指定操作的至少一条操作记录,对该至少一条操作记录进行统计,得到该用户标识的操作信息。其中,指定操作可以包括登录、退出或者其他操作。
获取设备标识的操作信息的过程可以包括:按照确定的设备标识,对该多条操作记录进行筛选,得到多条操作记录中包含该设备标识的至少一条操作记录,再从获取的操作记录中确定包括指定操作的至少一条操作记录,对该至少一条操作记录进行统计,得到该设备标识的操作信息。
在一种可能实现方式中,按照确定的设备标识所属的种类,对该多条操作记录进行筛选,得到设备标识所属的种类与该设备标识所属的种类相同的至少一条操作记录,再从筛选得到的操作记录中继续进行筛选,得到包含该设备标识的至少一条操作记录,对该至少一条操作记录进行统计,得到该设备标识的操作信息。
例如,当该设备标识为IP地址时,先从多条操作记录中获取设备标识为IP地址的至少一条操作记录,再根据该设备标识的IP地址,从设备标识为IP地址的至少一条操作记录中获取包括该IP地址的至少一条操作记录。
本发明实施例中,当检测服务器获取到操作记录时,可以对获取的操作记录按照种类标记进行分类,当检测服务器需要获取某一种类的操作记录时,直接根据种类标记即可获取该种类标记对应的操作记录,无需对每条操作记录进行判断,提高了数据处理的效率。
关于获取用户标识的操作信息可以包括下述步骤中的任一项:
1、对于每个用户标识,根据多条操作记录中包含用户标识的操作记录,统计用户标识在至少一个预设时间段内执行的指定操作的次数,作为用户标识的操作信息。
其中,该预设时间段可以由操作人员设置,或者由检测服务器自行进行设置。
并且,当至少一个预设时间段包括多个预设时间段时,则每个预设时间段的预设时长相同,如以固定时刻为起点,按照预设时长依次向前进行划分,得到连续的多个预设时间段。在该固定时刻之前的预设时长对应的时间段为第一预设时间段,在第一预设时间段之前的预设时长对应的时间段为第二预设时间段,以此类推,划分出预设时长相同的多个预设时间段。其中,固定时刻可以为需要检测用户标识的时刻。例如,1天包括24个小时,将1天按照小时进行划分,则将1天划分为24个时间段,每个时间段的时长为1小时。
在一种可能实现方式中,根据用户标识和指定操作从多条操作记录中获取包含用户标识且包含指定操作的至少一条操作记录,根据获取的至少一条操作记录统计用户标识执行指定操作的次数,作为用户标识的操作信息。
在另一种可能实现方式中,先根据多条操作记录的操作时间获取位于预设时间段内的至少一条操作记录,再从至少一条操作记录中获取包含用户标识且包含指定操作的至少一条操作记录,根据获取的至少一条操作记录统计用户标识执行指定操作的次数,作为用户标识的操作信息。
当预设时间段为多个预设时间段时,按照在一个预设时间段内获取用户标识执行指定操作的次数的方式,获取每个预设时间段内用户标识执行指定操作的次数,将获取的每个预设时间段内的次数依次进行组合得到组合后的操作次数向量,将得到的操作次数向量作为该用户标识的操作信息。
2、对于每个用户标识,根据多条操作记录中包含用户标识的操作记录,统计用户标识在多个预设时间段内执行的指定操作的次数,将统计得到的多个次数进行编码,将得到的多个编码进行组合,得到操作次数特征,作为用户标识的操作信息。
在一种可能实现方式中,根据用户标识和指定操作从多条操作记录中获取包含用户标识且包含指定操作的至少一条操作记录,根据获取的至少一条操作记录统计用户标识执行指定操作的次数,将该次数进行编码,作为用户标识的操作信息。
在另一种可能实现方式中,先根据多条操作记录的操作时间获取位于预设时间段内的至少一条操作记录,再从至少一条操作记录中获取包含用户标识和包含指定操作的至少一条操作记录,根据获取的至少一条操作记录统计用户标识执行指定操作的次数,将该次数进行编码,作为用户标识的操作信息。
当预设时间段为多个预设时间段时,按照在一个预设时间段内获取用户标识执行指定操作的次数的方式,获取每个预设时间段内用户标识执行指定操作的次数,将每个预设时间段的次数进行编码,每个编码后的次数均为固定长度的向量,将多个预设时间段内的编码后的向量进行组合,得到操作次数矩阵,将得到的操作次数矩阵作为该用户标识的操作信息。
其中,在对次数进行编码时,将得到的次数编码为固定长度的向量,例如,将次数编码为24维的向量,或者,将次数编码为36维的向量,或者为其他长度的向量。
在一种可能实现方式中,可以采用二进制编码方式对次数进行编码,还可以采用其他方式对次数进行编码。
关于获取设备标识的操作信息可以包括下述步骤中的任一项:
1、对于每个设备标识,根据多条操作记录中包含设备标识的操作记录,统计设备标识在至少一个预设时间段内执行的指定操作的次数,作为设备标识的操作信息。
在一种可能实现方式中,根据设备标识和指定操作从多条操作记录中获取包含设备标识且包含指定操作的至少一条操作记录,根据获取的至少一条操作记录统计设备标识执行指定操作的次数,作为设备标识的操作信息。
在另一种可能实现方式中,先根据多条操作记录的操作时间获取位于预设时间段内的至少一条操作记录,再从至少一条操作记录中获取包含设备标识且包含指定操作的至少一条操作记录,根据获取的至少一条操作记录统计设备标识执行指定操作的次数,作为设备标识的操作信息。
当预设时间段包含多个预设时间段时,按照在一个预设时间段内获取设备标识执行指定操作的次数的方式,获取每个预设时间段内设备标识执行指定操作的次数,将获取的每个预设时间段内的次数依次进行组合得到组合后的操作次数向量,将得到的操作次数向量作为该设备标识的操作信息。
2、根据多条操作记录中包含设备标识的操作记录,统计设备标识在多个预设时间段内执行的指定操作的次数,将统计得到的多个次数进行编码,将得到的多个编码进行组合,得到操作次数特征,作为设备标识的操作信息。
其中,该预设时间段可以由操作人员设置,或者由检测服务器自行进行设置。
并且,当至少一个预设时间段为多个预设时间段时,则每个预设时间段的预设时长相同,且该多个预设时间段以固定的时刻为起点开始划分,在该固定时刻之前的预设时长内为第一预设时间段,在第一预设时间段之前的预设时长内为第二预设时间段,以此类推,划分出预设时长相同的多个预设时间段。例如,1天包括24个小时,将1天按照小时进行划分,则将1天划分为24个时间段,每个时间段的时长为1小时。
在一种可能实现方式中,根据设备标识和指定操作从多条操作记录中获取包含设备标识且包含指定操作的至少一条操作记录,根据获取的至少一条操作记录统计设备标识执行指定操作的次数,将该次数进行编码,作为设备标识的操作信息。
在另一种可能实现方式中,先根据多条操作记录的操作时间获取位于预设时间段内的至少一条操作记录,再从至少一条操作记录中获取包含设备标识和包含指定操作的至少一条操作记录,根据获取的至少一条操作记录统计设备标识执行指定操作的次数,将该次数进行编码,作为设备标识的操作信息。
当预设时间段包括多个预设时间段时,按照在一个预设时间段内获取设备标识执行指定操作的次数的方式,获取每个预设时间段内设备标识执行指定操作的次数,将每个预设时间段的次数进行编码,每个编码后的次数均为固定长度的向量,将多个预设时间段内的编码后的向量进行组合,得到操作次数矩阵,将得到的操作次数矩阵作为该设备标识的操作信息。
其中,在对次数进行编码时,将得到的次数编码为固定长度的向量,例如,将次数编码为24维的向量,或者,将次数编码为36维的向量,或者为其他长度的向量。
在一种可能实现方式中,可以采用二进制编码方式对次数进行编码,还可以采用其他方式对次数进行编码。
需要说明的是,由于后续采用用户标识的操作信息和设备标识的操作信息检测异常用户标识和正常用户标识时,要求两种操作信息的维度数量相等。但是,由于不同的操作记录中均包含用户标识,但可能会不包括不同种类的设备标识,而导致某些设备标识的操作记录的数量小于用户标识的操作记录的数量,进而导致设备标识的操作信息的维度数量小于用户标识的操作信息的维度数量,此时为了保持用户标识的操作信息和设备标识的操作信息的维度数量相等,将长度较小的操作信息通过添加0的方式进行补充,以使两种操作信息的维度数量相等。
204、将多个用户标识中,预设数据库中包括的用户标识的初始分类标识确定为第一分类标识,预设数据库中不包括的用户标识的初始分类标识确定为第二分类标识。
其中,预设数据库中包括至少一个异常用户标识,即预设数据库中包括的用户标识均可以确定是异常用户标识,而预设数据库中不包括的用户标识可能是正常用户标识,也可能是异常用户标识。因此,通过该预设数据库即可初步从多个用户标识中确定出异常用户标识。
在一种可能实现方式中,检测服务器设置有固定的检测规则,该检测规则用于规定正常用户应满足的条件,例如用户标识是否合法、用户使用的设备标识是否合法或者同一个用户使用的设备的数量是否小于规定数量,当检测服务器获取到多个用户标识的操作记录,从获取的多条操作记录中获取用户标识、用户标识对应的设备标识和同一用户使用的设备的数量时,判断获取的这些信息是否满足检测规则,当不满足该检测规则时,确定用户标识为异常用户标识,将该用户标识添加到预设数据库中。并且,还可以采用其他方式对用户标识进行检测,将检测到的异常用户标识添加到预设数据库中。例如,采用本发明实施例提供的方式检测出异常用户标识后,将检测出的异常用户标识添加到预设数据库中,以实现预设数据库的更新。
用户标识的分类标识包括第一分类标识和第二分类标识,第一分类标识用于表示用户标识属于异常用户标识,第二分类标识用于表示用户标识属于正常用户标识。
在对多条操作记录中的多个用户标识进行检测时,预设数据库中包括的用户标识可以确定为异常用户标识,而预设数据库中不包括的用户标识无法确定是否为异常用户标识,需要继续进行检测。为了区分这两种用户标识,可以确定每个用户标识的初始分类标识,该初始分类标识用于对用户标识进行初始分类。因此将预设数据库中包括的用户标识的初始分类标识确定为第一分类标识。将预设数据库中不包括的用户标识的初始分类标识确定为第二分类标识。后续可以对初始分类标识为第二分类标识的用户标识继续进行检测,重新确定这些用户标识的分类标识。
205、将多个用户标识和多个设备标识作为节点,将属于同一条操作记录的任两个节点进行连接,得到第一图网络。
本发明实施例通过创建图网络的方式对用户标识进行检测,因此将多个用户标识和多个设备标识均作为待生成图网络中的节点。由于一条操作记录中包括用户标识和设备标识,可以认为该用户标识和该设备标识之间具有关联关系,因此将该用户标识对应的节点和该设备标识对应的节点连接。针对多条操作记录重复执行上述连接步骤,即可得到第一图网络。其中,该第一图网络可以为异构图网络或者为其他类型的图网络。
例如,以1表示用户标识,以2表示IP地址,以3表示MAC地址,以4表示IMSI,以5表示IMEU。每条操作记录中包括用户标识和4个不同种类的设备标识,则第一图网络中任一个用户标识对应的节点与属于同一条操作记录的4个设备标识对应的节点连接,且该用户标识对应的节点还会与属于其他的同一条操作记录的4个设备标识连接,构成如图3所示的第一图网络。
206、将每个用户标识的操作信息、初始分类标识和种类标记,以及每个设备标识的操作信息和种类标记添加至对应的节点中。
对于每个用户标识,确定该用户标识在第一图网络中对应的节点,将该用户标识的操作信息、初始分类标识、种类标记添加到确定的节点中,作为节点的特征。且对于每个设备标识,确定该设备标识在第一图网络中对应的节点,将该设备标识的操作信息和种类标添加到确定的节点中,作为节点的特征。
本发明实施例对操作记录中的用户标识和设备标识添加种类标记,从而在第一图网络中引入每个节点的种类标记,能够对不同种类的节点进行区分,可以快速区分出不同种类的标识对应的节点,无需进行判断,减少了处理的数据量。
需要说明的是,本发明实施例仅是以将每个用户标识的操作信息、初始分类标识和种类标记以及每个设备标识的操作信息添加至对应的节点中为例进行说明。在另一实施例中,不执行步骤202,且在步骤206中仅将每个用户标识的操作信息和初始分类标识以及每个设备标识的操作信息添加至对应的节点中,而不再考虑种类标记。
207、基于图神经网络模型,对第一图网络中每个用户标识的分类标识进行预测,得到第二图网络,第二图网络中包括多个用户标识的预测分类标识。
其中,该图神经网络模型用于对输入的图网络进行分类预测,确定图网络中每个节点所属的分类标识。该图神经网络模型可以为图卷积网络模型、DeepWalk(一种对于图中的节点使用向量建模的方法)模型、LINE(Large-scale Information Network Embedding,大规模信息网络嵌入)模型、Node2vec(一种对于图中的节点使用向量建模的方法)模型、SDNE(Structural Deep Network Embedding,结构深层网络嵌入)模型和图自编码器模型等。
可选地,在图神经网络模型中的每层神经网络中,获取每个节点的特征矩阵、每个节点的邻接矩阵和度对角矩阵,采用以下公式进行计算:
H(0)=X
其中,X表示第一图网络中各节点的特征矩阵,H表示隐藏层,H(0)表示第一层神经网络,等于X,H(I)表示第I层神经网络;σ表示非线性激活函数;T表示第一图网络中设备标识对应节点的种类数量;D(t)表示第一图网络中种类为t的节点的度对角矩阵;A(t)表示第一图网络中种类为t的节点的邻接矩阵;W(l)表示第l层神经网络的参数矩阵。
将第一图网络输入至图神经网络模型中,该图神经网络中包括多层神经网络,对于第一层神经网络,采用上述公式在第一层神经网络中进行计算,得到计算结果,作为下一层神经网络的输入,在下一层神经网络中可以将每个节点和该节点的邻居节点的计算结果进行综合计算,得到下一层神经网络的计算结果,以此类推,在该图神经网络模型中的最后一层输出第二图网络,根据该第二图网络中每个用户标识对应的节点的预测分类标识,从而确定正常用户标识和异常用户标识。
其中,该第二图网络中包括多个用户标识的预测分类标识,通过该第二图网络即可确定每个用户标识的预测分类标识,也即是确定了正常用户标识和异常用户标识。
例如,如图4所示,该图神经网络模型中包括多层卷积神经网络,将第一图网络输入至第一个隐藏层后,对该第一图网络进行计算,且将上一层隐藏层的输出作为下一层隐藏层的输入,因此每一层隐藏层均会对图网络进行计算,直至最后一层隐藏层输出第二图网络。
本发明实施例采用该图神经网络模型中的每层卷积神经网络进行计算时,第一图网络中的每个节点共享一个参数,以达到局部参数共享的目的,且每增加一层卷积神经网络,即可将每个节点的邻居节点的信息包括进来,从而形成扩散式计算,增加感受域,以实现根据已知的异常用户标识确定未知用户标识的分类标识的目的。
如图5所示,将第一图网络输入图神经网络模型中,该第一图网络中包括两个异常用户标识(黑色节点),基于该图神经网络模型,对该第一图网络进行计算,得到第二图网络,该第二图网络中包括四个异常用户标识(黑色节点),也即是额外检测出来了两个异常用户标识。
208、基于图神经网络模型,对第二图网络中每个用户标识的分类标识继续进行预测,得到第三图网络,第三图网络中包括多个用户标识的预测分类标识。
由于基于图神经网络模型仅对第一图网络进行了一次预测,预测的结果可能会存在误差,不够准确,因此,可以将第二图网络继续输入到图神经网络中,对该第二图网络进行预测,得到第三图网络,该第三图网络中包括多个用户标识的预测分类标识。后续过程中,还可以将得到的第三图网络继续输入到该图神经网络模型中,基于该图神经网络模型继续对用户标识进行检测,得到用户标识的检测结果。通过对图网络进行多次预测,得到更准确的图网络中每个节点的分类标识,可以提高对用户标识检测的准确性。
举例来说,图6是本发明实施例提供的一种操作流程示意图,参见图6,该方法的操作流程可以包括如下步骤:
1、创建用户标识黑名单,用户标识黑名单中包括异常的用户标识。
2、提取多个用户标识的行为记录和多个设备标识的行为记录。
3、根据用户标识黑名单对每个用户标识进行标记。
4、根据用户标识、设备标识和行为记录构建异构图网络。
5、基于图卷积网络模型,对构建的异构图网络进行计算,从而检测出异常用户标识。
本发明实施例通过获取多条操作记录,根据该多条操作记录获取多个用户标识的操作信息以及多个设备标识中每个设备标识的操作信息,为该多条操作记录中的每个标识添加种类标记,将多个用户标识中属于预设数据库的用户标识的初始分类标识确定为第一分类标识,将不属于预设数据库的用户标识的初始分类标识确定为第二分类标识,且基于多个用户标识和多个设备标识构建第一图网络,将每个用户标识的操作信息、初始分类标识和种类标识以及每个设备标识的操作信息和种类标记添加至对应节点中,基于图神经网络模型,对第一图网络中的每个用户标识的分类标识进行预测,得到预测后的第二图网络,根据该第二图网络即可确定正常用户标识和异常用户标识。本发明实施例不再采用固定检测规则检测用户标识,而是采用图神经网络模型对用户标识的分类标识进行预测,基于用户标识的分类标识、用户标识的操作信息和设备的操作信息构建图网络,根据图网络对用户标识进行预测,突破了通过固定检测规则检测用户标识的局限性,防止异常用户躲避检测规则,提高了检测异常用户标识的准确率。
并且,本发明实施例还继续基于图神经网络模型,将预测得到的图网络再次输入到图神经网络模型中,继续对用户标识进行预测,基于该图神经网络模型对图网络进行多次预测,提高检测用户标识的准确性。
图7是本发明实施例提供的一种用户标识检测装置的结构示意图。参见图7,该装置包括:
获取模块701,用于根据多条操作记录,获取多个用户标识中每个用户标识的操作信息,以及多个设备标识中每个设备标识的操作信息;每条操作记录包括用户标识和设备标识,用于表示用户标识对应的用户在设备标识对应的设备上执行的操作;
确定模块702,用于将多个用户标识中,预设数据库中包括的用户标识的初始分类标识确定为第一分类标识,预设数据库中不包括的用户标识的初始分类标识确定为第二分类标识,预设数据库中包括至少一个异常用户标识,第一分类标识用于表示用户标识属于异常用户标识,第二分类标识用于表示用户标识属于正常用户标识;
添加模块703,用于将多个用户标识和多个设备标识作为节点,将属于同一条操作记录的任两个节点进行连接,得到第一图网络,将每个用户标识的操作信息和初始分类标识,以及每个设备标识的操作信息添加至对应的节点中;
预测模块704,用于基于图神经网络模型,对第一图网络中每个用户标识的分类标识进行预测,得到第二图网络,第二图网络中包括多个用户标识的预测分类标识。
本发明实施例提供的用户标识检测装置,通过获取多条操作记录,根据该多条操作记录获取多个用户标识的操作信息以及多个设备标识中每个设备标识的操作信息,为该多条操作记录中的每个标识添加种类标记,将多个用户标识中属于预设数据库的用户标识的初始分类标识确定为第一分类标识,将不属于预设数据库的用户标识的初始分类标识确定为第二分类标识,且基于多个用户标识和多个设备标识构建第一图网络,将每个用户标识的操作信息、初始分类标识和种类标识以及每个设备标识的操作信息和种类标记添加至对应节点中,基于图神经网络模型,对第一图网络中的每个用户标识的分类标识进行预测,得到预测后的第二图网络,根据该第二图网络即可确定正常用户标识和异常用户标识。本发明实施例不再采用固定检测规则检测用户标识,而是采用图神经网络模型对用户标识的分类标识进行预测,基于用户标识的分类标识、用户标识的操作信息和设备的操作信息构建图网络,根据图网络对用户标识进行预测,突破了通过固定检测规则检测用户标识的局限性,防止异常用户躲避检测规则,提高了检测异常用户标识的准确率。
在一种可能实现方式中,每条操作记录包括用户标识和至少一种设备标识;添加模块,还用于为多条操作记录中的每个标识添加种类标记,种类标记用于表示标识所属的种类;
添加模块703,还用于将每个用户标识的操作信息、初始分类标识和种类标记,以及每个设备标识的操作信息和种类标记添加至对应的节点中。
在另一种可能实现方式中,至少一种设备标识包括网际协议IP地址、媒体访问控制MAC地址、国际移动用户识别码IMSI或者国际移动设备识别码IMEI中的至少一种;
添加模块703,还用于执行以下至少一项:
为多条操作记录中的用户标识添加第一种类标记;
为多条操作记录中的IP地址添加第二种类标记;
为多条操作记录中的MAC地址添加第三种类标记;
为多条操作记录中的IMSI添加第四种类标记;
为多条操作记录中的IMEI添加第五种类标记。
在另一种可能实现方式中,参见图8,获取模块701,包括:
统计单元7011,用于对于每个用户标识,根据多条操作记录中包含用户标识的操作记录,统计用户标识在至少一个预设时间段内执行的指定操作的次数,作为用户标识的操作信息;
统计单元7011,还用于对于每个设备标识,根据多条操作记录中包含设备标识的操作记录,统计设备标识在至少一个预设时间段内执行的指定操作的次数,作为设备标识的操作信息。
在另一种可能实现方式中,统计单元7011,还用于:
根据多条操作记录中包含用户标识的操作记录,统计用户标识在多个预设时间段内执行的指定操作的次数,将统计得到的多个次数进行编码,将得到的多个编码进行组合,得到操作次数特征,作为用户标识的操作信息,多个预设时间段的时长相等。
在另一种可能实现方式中,统计单元7011,还用于:
根据多条操作记录中包含设备标识的操作记录,统计设备标识在多个预设时间段内执行的指定操作的次数,将统计得到的多个次数进行编码,将得到的多个编码进行组合,得到操作次数特征,作为设备标识的操作信息,多个预设时间段的时长相等。
在另一种可能实现方式中,预测模块704,还用于:
基于图神经网络模型,对第二图网络中每个用户标识的分类标识继续进行预测,得到第三图网络,第三图网络中包括多个用户标识的预测分类标识。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的用户标识检测装置在检测用户标识时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将检测服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的用户标识检测装置的实施例与用户标识检测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图9是本发明实施例提供的一种服务器的结构示意图,该服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)901和一个或一个以上的存储器902,其中,所述存储器902中存储有至少一条指令,所述至少一条指令由所述处理器901加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
服务器900可以用于执行上述用户标识检测方法中检测服务器所执行的步骤。
本发明实施例还提供了一种用户标识检测装置,该装置包括处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,指令、程序、代码集或指令集由处理器加载并具有以实现上述实施例的用户标识检测方法中所具有的操作。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,该指令、该程序、该代码集或该指令集由处理器加载并具有以实现上述实施例的用户标识检测方法中所具有的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种用户标识检测方法,其特征在于,所述方法包括:
根据多条操作记录,获取多个用户标识中每个用户标识的操作信息,以及多个设备标识中每个设备标识的操作信息;每条操作记录包括用户标识和设备标识,用于表示所述用户标识对应的用户在所述设备标识对应的设备上执行的操作;
将所述多个用户标识中,预设数据库中包括的用户标识的初始分类标识确定为第一分类标识,所述预设数据库中不包括的用户标识的初始分类标识确定为第二分类标识,所述预设数据库中包括至少一个异常用户标识,所述第一分类标识用于表示用户标识属于异常用户标识,所述第二分类标识用于表示用户标识属于正常用户标识;
将所述多个用户标识和所述多个设备标识作为节点,将属于同一条操作记录的任两个节点进行连接,得到第一图网络,将所述每个用户标识的操作信息和初始分类标识,以及所述每个设备标识的操作信息添加至对应的节点中;
基于图神经网络模型,对所述第一图网络中每个用户标识的分类标识进行预测,得到第二图网络,所述第二图网络中包括所述多个用户标识的预测分类标识。
2.根据权利要求1所述的方法,其特征在于,所述每条操作记录包括用户标识和至少一种设备标识;所述方法还包括:为所述多条操作记录中的每个标识添加种类标记,所述种类标记用于表示所述标识所属的种类;
所述将所述每个用户标识的操作信息和初始分类标识,以及所述每个设备标识的操作信息添加至对应的节点中,包括:将所述每个用户标识的操作信息、初始分类标识和种类标记,以及所述每个设备标识的操作信息和种类标记添加至对应的节点中。
3.根据权利要求2所述的方法,其特征在于,所述至少一种设备标识包括网际协议IP地址、媒体访问控制MAC地址、国际移动用户识别码IMSI或者国际移动设备识别码IMEI中的至少一种;
所述为所述多条操作记录中的每个标识添加种类标记,包括以下至少一项:
为所述多条操作记录中的用户标识添加第一种类标记;
为所述多条操作记录中的IP地址添加第二种类标记;
为所述多条操作记录中的MAC地址添加第三种类标记;
为所述多条操作记录中的IMSI添加第四种类标记;
为所述多条操作记录中的IMEI添加第五种类标记。
4.根据权利要求1所述的方法,其特征在于,所述根据多条操作记录,获取多个用户标识中每个用户标识的操作信息,以及多个设备标识中每个设备标识的操作信息,包括:
对于所述每个用户标识,根据所述多条操作记录中包含所述用户标识的操作记录,统计所述用户标识在至少一个预设时间段内执行的指定操作的次数,作为所述用户标识的操作信息;
对于所述每个设备标识,根据所述多条操作记录中包含所述设备标识的操作记录,统计所述设备标识在至少一个预设时间段内执行的指定操作的次数,作为所述设备标识的操作信息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述多条操作记录中包含所述用户标识的操作记录,统计所述用户标识在至少一个预设时间段内执行的指定操作的次数,作为所述用户标识的操作信息,包括:
根据所述多条操作记录中包含所述用户标识的操作记录,统计所述用户标识在多个预设时间段内执行的指定操作的次数,将统计得到的多个次数进行编码,将得到的多个编码进行组合,得到操作次数特征,作为所述用户标识的操作信息,所述多个预设时间段的时长相等。
6.根据权利要求4所述的方法,其特征在于,所述根据所述多条操作记录中包含所述设备标识的操作记录,统计所述设备标识在至少一个预设时间段内执行的指定操作的次数,作为所述设备标识的操作信息,包括:
根据所述多条操作记录中包含所述设备标识的操作记录,统计所述设备标识在多个预设时间段内执行的指定操作的次数,将统计得到的多个次数进行编码,将得到的多个编码进行组合,得到操作次数特征,作为所述设备标识的操作信息,所述多个预设时间段的时长相等。
7.根据权利要求1所述的方法,其特征在于,所述基于图神经网络模型,对所述第一图网络中每个用户标识的分类标识进行预测,得到第二图网络之后,所述方法还包括:
基于所述图神经网络模型,对所述第二图网络中每个用户标识的分类标识继续进行预测,得到第三图网络,所述第三图网络中包括所述多个用户标识的预测分类标识。
8.一种用户标识检测装置,其特征在于,所述装置包括:
获取模块,用于根据多条操作记录,获取多个用户标识中每个用户标识的操作信息,以及多个设备标识中每个设备标识的操作信息;每条操作记录包括用户标识和设备标识,用于表示所述用户标识对应的用户在所述设备标识对应的设备上执行的操作;
确定模块,用于将所述多个用户标识中,预设数据库中包括的用户标识的初始分类标识确定为第一分类标识,所述预设数据库中不包括的用户标识的初始分类标识确定为第二分类标识,所述预设数据库中包括至少一个异常用户标识,所述第一分类标识用于表示用户标识属于异常用户标识,所述第二分类标识用于表示用户标识属于正常用户标识;
添加模块,用于将所述多个用户标识和所述多个设备标识作为节点,将属于同一条操作记录的任两个节点进行连接,得到第一图网络,将所述每个用户标识的操作信息和初始分类标识,以及所述每个设备标识的操作信息添加至对应的节点中;
预测模块,用于基于图神经网络模型,对所述第一图网络中每个用户标识的分类标识进行预测,得到第二图网络,所述第二图网络中包括所述多个用户标识的预测分类标识。
9.根据权利要求8所述的装置,其特征在于,所述每条操作记录包括用户标识和至少一种设备标识;所述添加模块,还用于为所述多条操作记录中的每个标识添加种类标记,所述种类标记用于表示所述标识所属的种类;
所述添加模块,还用于:将所述每个用户标识的操作信息、初始分类标识和种类标记,以及所述每个设备标识的操作信息和种类标记添加至对应的节点中。
10.根据权利要求9所述的装置,其特征在于,所述至少一种设备标识包括网际协议IP地址、媒体访问控制MAC地址、国际移动用户识别码IMSI或者国际移动设备识别码IMEI中的至少一种;
所述添加模块,还用于执行以下至少一项:
为所述多条操作记录中的用户标识添加第一种类标记;
为所述多条操作记录中的IP地址添加第二种类标记;
为所述多条操作记录中的MAC地址添加第三种类标记;
为所述多条操作记录中的IMSI添加第四种类标记;
为所述多条操作记录中的IMEI添加第五种类标记。
11.根据权利要求8所述的装置,其特征在于,所述获取模块,包括:
统计单元,用于对于所述每个用户标识,根据所述多条操作记录中包含所述用户标识的操作记录,统计所述用户标识在至少一个预设时间段内执行的指定操作的次数,作为所述用户标识的操作信息;
所述统计单元,还用于对于所述每个设备标识,根据所述多条操作记录中包含所述设备标识的操作记录,统计所述设备标识在至少一个预设时间段内执行的指定操作的次数,作为所述设备标识的操作信息。
12.根据权利要求11所述的装置,其特征在于,所述统计单元,还用于:
根据所述多条操作记录中包含所述用户标识的操作记录,统计所述用户标识在多个预设时间段内执行的指定操作的次数,将统计得到的多个次数进行编码,将得到的多个编码进行组合,得到操作次数特征,作为所述用户标识的操作信息,所述多个预设时间段的时长相等。
13.根据权利要求11所述的装置,其特征在于,所述统计单元,还用于:
根据所述多条操作记录中包含所述设备标识的操作记录,统计所述设备标识在多个预设时间段内执行的指定操作的次数,将统计得到的多个次数进行编码,将得到的多个编码进行组合,得到操作次数特征,作为所述设备标识的操作信息,所述多个预设时间段的时长相等。
14.一种用户标识检测装置,其特征在于,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至7任一权利要求所述的用户标识检测方法中所执行的操作。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述指令、所述程序、所述代码集或所述指令集由处理器加载并执行以实现如权利要求1至7任一权利要求所述的用户标识检测方法中所执行的操作。
CN201910487943.4A 2019-06-05 2019-06-05 用户标识检测方法、装置及存储介质 Active CN110209820B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910487943.4A CN110209820B (zh) 2019-06-05 2019-06-05 用户标识检测方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910487943.4A CN110209820B (zh) 2019-06-05 2019-06-05 用户标识检测方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110209820A true CN110209820A (zh) 2019-09-06
CN110209820B CN110209820B (zh) 2023-06-06

Family

ID=67791133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910487943.4A Active CN110209820B (zh) 2019-06-05 2019-06-05 用户标识检测方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110209820B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570217A (zh) * 2019-09-10 2019-12-13 北京百度网讯科技有限公司 作弊检测的方法及装置
CN110995810A (zh) * 2019-11-25 2020-04-10 腾讯科技(深圳)有限公司 一种基于人工智能的对象识别方法和相关装置
CN111091410A (zh) * 2019-11-04 2020-05-01 南京光普信息技术有限公司 一种结合节点嵌入和用户行为特征的网点销量预测方法
CN111159395A (zh) * 2019-11-22 2020-05-15 国家计算机网络与信息安全管理中心 基于图神经网络的谣言立场检测方法、装置和电子设备
CN111275079A (zh) * 2020-01-13 2020-06-12 浙江大学 基于图神经网络的众包标签推测方法及系统
CN111368205A (zh) * 2020-03-09 2020-07-03 腾讯科技(深圳)有限公司 数据推荐方法、装置、计算机设备及存储介质
CN111740977A (zh) * 2020-06-16 2020-10-02 北京奇艺世纪科技有限公司 投票检测方法及装置、电子设备、计算机可读存储介质
CN113553370A (zh) * 2021-07-27 2021-10-26 百度在线网络技术(北京)有限公司 异常检测方法、装置、电子设备及可读存储介质
CN113591088A (zh) * 2021-07-30 2021-11-02 百度在线网络技术(北京)有限公司 一种标识识别方法、装置及电子设备
CN114201655A (zh) * 2020-09-02 2022-03-18 腾讯科技(深圳)有限公司 账号分类方法、装置、设备及存储介质
CN116664292A (zh) * 2023-04-13 2023-08-29 连连银通电子支付有限公司 一种交易异常预测模型的训练方法和交易异常预测方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160171533A1 (en) * 2012-10-18 2016-06-16 Tellmeplus Method and device for distributing information to a user provided with a communicating mobile terminal with information filtering and learning using bipartite graphs or neural networks
WO2017134024A1 (en) * 2016-02-03 2017-08-10 Telefonica Digital España, S.L.U. A computer-implemented web tracking identification method, a web tracker detecting entity and computer program products
CN107392022A (zh) * 2017-07-20 2017-11-24 北京小度信息科技有限公司 爬虫识别、处理方法及相关装置
CN107800608A (zh) * 2016-09-05 2018-03-13 腾讯科技(深圳)有限公司 一种用户信息的处理方法及装置
WO2018098598A1 (en) * 2016-12-02 2018-06-07 Stack Fintech Inc. Digital banking platform and architecture
CN108520470A (zh) * 2017-02-28 2018-09-11 百度在线网络技术(北京)有限公司 用于生成用户属性信息的方法和装置
US20180295504A1 (en) * 2015-12-14 2018-10-11 Alibaba Group Holding Limited Method and apparatus for recognizing service request to change mobile phone number
US20190073410A1 (en) * 2017-09-05 2019-03-07 Estia, Inc. Text-based network data analysis and graph clustering
US20190132224A1 (en) * 2017-10-26 2019-05-02 Accenture Global Solutions Limited Systems and methods for identifying and mitigating outlier network activity
CN109710754A (zh) * 2018-11-12 2019-05-03 中国科学院信息工程研究所 一种基于深度结构学习的群体异常行为检测方法
CN109829089A (zh) * 2018-12-12 2019-05-31 中国科学院计算技术研究所 基于关联图谱的社交网络用户异常检测方法和系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160171533A1 (en) * 2012-10-18 2016-06-16 Tellmeplus Method and device for distributing information to a user provided with a communicating mobile terminal with information filtering and learning using bipartite graphs or neural networks
US20180295504A1 (en) * 2015-12-14 2018-10-11 Alibaba Group Holding Limited Method and apparatus for recognizing service request to change mobile phone number
WO2017134024A1 (en) * 2016-02-03 2017-08-10 Telefonica Digital España, S.L.U. A computer-implemented web tracking identification method, a web tracker detecting entity and computer program products
CN107800608A (zh) * 2016-09-05 2018-03-13 腾讯科技(深圳)有限公司 一种用户信息的处理方法及装置
WO2018098598A1 (en) * 2016-12-02 2018-06-07 Stack Fintech Inc. Digital banking platform and architecture
CN108520470A (zh) * 2017-02-28 2018-09-11 百度在线网络技术(北京)有限公司 用于生成用户属性信息的方法和装置
CN107392022A (zh) * 2017-07-20 2017-11-24 北京小度信息科技有限公司 爬虫识别、处理方法及相关装置
US20190073410A1 (en) * 2017-09-05 2019-03-07 Estia, Inc. Text-based network data analysis and graph clustering
US20190132224A1 (en) * 2017-10-26 2019-05-02 Accenture Global Solutions Limited Systems and methods for identifying and mitigating outlier network activity
CN109710754A (zh) * 2018-11-12 2019-05-03 中国科学院信息工程研究所 一种基于深度结构学习的群体异常行为检测方法
CN109829089A (zh) * 2018-12-12 2019-05-31 中国科学院计算技术研究所 基于关联图谱的社交网络用户异常检测方法和系统

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570217B (zh) * 2019-09-10 2022-10-14 北京百度网讯科技有限公司 作弊检测的方法及装置
CN110570217A (zh) * 2019-09-10 2019-12-13 北京百度网讯科技有限公司 作弊检测的方法及装置
CN111091410A (zh) * 2019-11-04 2020-05-01 南京光普信息技术有限公司 一种结合节点嵌入和用户行为特征的网点销量预测方法
CN111159395A (zh) * 2019-11-22 2020-05-15 国家计算机网络与信息安全管理中心 基于图神经网络的谣言立场检测方法、装置和电子设备
CN111159395B (zh) * 2019-11-22 2023-02-17 国家计算机网络与信息安全管理中心 基于图神经网络的谣言立场检测方法、装置和电子设备
CN110995810A (zh) * 2019-11-25 2020-04-10 腾讯科技(深圳)有限公司 一种基于人工智能的对象识别方法和相关装置
CN110995810B (zh) * 2019-11-25 2021-08-06 腾讯科技(深圳)有限公司 一种基于人工智能的对象识别方法和相关装置
CN111275079A (zh) * 2020-01-13 2020-06-12 浙江大学 基于图神经网络的众包标签推测方法及系统
CN111275079B (zh) * 2020-01-13 2023-07-04 浙江大学 基于图神经网络的众包标签推测方法及系统
CN111368205A (zh) * 2020-03-09 2020-07-03 腾讯科技(深圳)有限公司 数据推荐方法、装置、计算机设备及存储介质
CN111740977A (zh) * 2020-06-16 2020-10-02 北京奇艺世纪科技有限公司 投票检测方法及装置、电子设备、计算机可读存储介质
CN111740977B (zh) * 2020-06-16 2022-06-21 北京奇艺世纪科技有限公司 投票检测方法及装置、电子设备、计算机可读存储介质
CN114201655A (zh) * 2020-09-02 2022-03-18 腾讯科技(深圳)有限公司 账号分类方法、装置、设备及存储介质
CN114201655B (zh) * 2020-09-02 2023-08-25 腾讯科技(深圳)有限公司 账号分类方法、装置、设备及存储介质
CN113553370A (zh) * 2021-07-27 2021-10-26 百度在线网络技术(北京)有限公司 异常检测方法、装置、电子设备及可读存储介质
CN113553370B (zh) * 2021-07-27 2023-07-21 百度在线网络技术(北京)有限公司 异常检测方法、装置、电子设备及可读存储介质
CN113591088A (zh) * 2021-07-30 2021-11-02 百度在线网络技术(北京)有限公司 一种标识识别方法、装置及电子设备
CN113591088B (zh) * 2021-07-30 2023-08-29 百度在线网络技术(北京)有限公司 一种标识识别方法、装置及电子设备
CN116664292A (zh) * 2023-04-13 2023-08-29 连连银通电子支付有限公司 一种交易异常预测模型的训练方法和交易异常预测方法
CN116664292B (zh) * 2023-04-13 2024-05-28 连连银通电子支付有限公司 一种交易异常预测模型的训练方法和交易异常预测方法

Also Published As

Publication number Publication date
CN110209820B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN110209820A (zh) 用户标识检测方法、装置及存储介质
CN111614690B (zh) 一种异常行为检测方法及装置
CN101517557B (zh) 用于管理虚拟房间内的资源的方法和装置
CN106294508B (zh) 一种刷量工具检测方法及装置
CN110602217B (zh) 基于区块链的联盟管理方法、装置、设备及存储介质
CN107404408B (zh) 一种虚拟身份关联识别方法及装置
CN107305611B (zh) 恶意账号对应的模型建立方法和装置、恶意账号识别的方法和装置
CN108540431A (zh) 账号类型的识别方法、装置和系统
CN107968730A (zh) 监测物联网卡被盗用的方法和系统
CN109450771A (zh) 添加好友的方法、装置、计算机设备及存储介质
CN110471821A (zh) 异常变更检测方法、服务器及计算机可读存储介质
CN113412607B (zh) 内容推送方法、装置、移动终端及存储介质
CN109495378A (zh) 检测异常帐号的方法、装置、服务器及存储介质
CN111148018A (zh) 基于通信数据识别定位区域价值的方法和装置
CN111611519B (zh) 一种个人异常行为检测方法及装置
CN111782735A (zh) 羊毛党流量识别方法及装置
CN117391861B (zh) 一种基于云平台的低碳积分的核算交易方法及系统
CN113378044A (zh) 题目匹配方法及平台
CN113609389A (zh) 一种社区平台信息推送方法及系统
CN110365682B (zh) 一种反作弊方法及装置
CN110807052A (zh) 用户群分类方法、装置、设备及存储介质
CN106790339A (zh) 元数据服务器、网络装置及自动资源管理方法
CN116318718A (zh) 口令管理方法、装置、设备及存储介质
CN110378120A (zh) 应用程序接口攻击检测方法、装置以及可读存储介质
CN113779336A (zh) 用户行为数据的处理方法及装置、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant