一种虚拟账户的处理方法和设备
技术领域
本申请涉及互联网信息技术处理领域,尤其涉及一种虚拟账户的处理方法和设备。
背景技术
随着互联网技术的发展,在线系统的网络安全受到的攻击越来越复杂。一个用户可以在不同的在线系统中设置虚拟账户,这样,一个用户将会得到多个虚拟账户。为了提升在线系统的网络安全性,识别每一个虚拟账户对应的用户的真实身份变得日趋重要。
然而,在实际应用中,虚拟账户与真实用户之间并不是简单的一对一的关系,可以是一个用户对应多个虚拟账户。
但是,随着互联网中数据的海量增加,为了增强在线系统的网络安全,如何快速地确定多个虚拟账户是否由同一个用户设置成为亟需解决的技术问题。
发明内容
有鉴于此,本申请实施例提供了一种虚拟账户的处理方法和设备,用于解决如何快速地确定多个虚拟账户是否由同一个用户设置的问题。
一种虚拟账户的处理方法,包括:
获取待处理的虚拟账户信息,其中,所述虚拟账户信息中包含设置所述虚拟账户信息的用户的用户信息,所述用户信息用于表征设置所述虚拟账户信息的用户的真实身份,所述用户信息中包含关键词以及所述关键词对应的用于表征所述用户的真实身份的内容;
根据所述虚拟账户信息中包含的用户信息,确定用于处理所述待处理的虚拟账户信息的至少一个关键词;
基于所述至少一个关键词,分别对所述待处理的虚拟账户信息执行聚类操作,得到聚类后的虚拟账户信息组,其中,所述虚拟账户信息组用于表征属于同一个用户的虚拟账户信息集合。
一种虚拟账户的处理设备,包括:
获取单元,用于获取待处理的虚拟账户信息,其中,所述虚拟账户信息中包含设置所述虚拟账户信息的用户的用户信息,所述用户信息用于表征设置所述虚拟账户信息的用户的真实身份,所述用户信息中包含关键词以及所述关键词对应的用于表征所述用户的真实身份的内容;
确定单元,用于根据所述虚拟账户信息中包含的用户信息,确定用于处理所述待处理的虚拟账户信息的至少一个关键词;
聚类单元,用于基于所述至少一个关键词,分别对所述待处理的虚拟账户信息执行聚类操作,得到聚类后的虚拟账户信息组,其中,所述虚拟账户信息组用于表征属于同一个用户的虚拟账户信息集合。
本申请有益效果如下:
本申请实施例获取待处理的虚拟账户信息,所述虚拟账户信息中包含设置所述虚拟账户信息的用户的用户信息,所述用户信息用于表征设置所述虚拟账户信息的用户的真实身份,所述用户信息中包含关键词以及所述关键词对应的用于表征所述用户的真实身份的内容;根据所述虚拟账户信息中包含的用户信息,确定用于处理所述待处理的虚拟账户信息的至少一个关键词;基于所述至少一个关键词,分别对所述待处理的虚拟账户信息执行聚类操作,得到聚类后的虚拟账户信息组,所述虚拟账户信息组用于表征属于同一个用户的虚拟账户信息集合,这样,通过用于表征用户真实身份的关键词,对多条虚拟账户信息执行聚类操作,快速关联同一用户的不同虚拟账户信息,有效地提升了对在线系统中大量虚拟账户信息的管理,变相地提升了互联网系统的网络安全性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种虚拟账户的处理方法的流程示意图;
图2为本申请实施例提供的一种虚拟账户的处理设备的结构示意图。
具体实施方式
为了实现本申请的目的,本申请实施例提供了一种虚拟账户的处理方法和设备,获取待处理的虚拟账户信息,所述虚拟账户信息中包含设置所述虚拟账户信息的用户的用户信息,所述用户信息用于表征设置所述虚拟账户信息的用户的真实身份,所述用户信息中包含关键词以及所述关键词对应的用于表征所述用户的真实身份的内容;根据所述虚拟账户信息中包含的用户信息,确定用于处理所述待处理的虚拟账户信息的至少一个关键词;基于所述至少一个关键词,分别对所述待处理的虚拟账户信息执行聚类操作,得到聚类后的虚拟账户信息组,所述虚拟账户信息组用于表征属于同一个用户的虚拟账户信息集合,这样,通过用于表征用户真实身份的关键词,对多条虚拟账户信息执行聚类操作,快速关联同一用户的不同虚拟账户信息,有效地提升了对在线系统中大量虚拟账户信息的管理,变相地提升了互联网系统的网络安全性。
下面结合说明书附图对本申请各个实施例作进一步地详细描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种虚拟账户的处理方法的流程示意图。所述方法可以如下所述。
步骤101:获取待处理的虚拟账户信息。
其中,所述虚拟账户信息中包含设置所述虚拟账户信息的用户的用户信息,所述用户信息用于表征设置所述虚拟账户信息的用户的真实身份,所述用户信息中包含关键词以及所述关键词对应的用于表征所述用户的真实身份的内容。
在步骤101中,由于互联网属于虚拟空间,为了标注用户在互联网上发生的行为,需要用户为自己设置一个账户。通常,用户设置的该账户被称为虚拟账户。例如:用户需要在A网站上进行购物,那么用户可以在A网站上设置一个用户名,例如:用户名为aaaa,同时设置与该用户名对应的用户密码,这样用户在A网站上产生购物订单之后,可以通过该用户名和用户名对应的用户密码查看该购物订单的状态。
但是,为了规范人们在互联网上的行为,在用户设置虚拟账户时,需要用户为该虚拟账户设置相应的用户信息,设置的这些用户信息需要能够真实确定该用户。一般设置的用户信息包括:用户姓名、身份证号码、联系电话、邮箱地址等等。
这里需要说明的是,用户姓名、身份证号码、联系电话、邮箱地址又可以被称为用户信息的关键词。
若用户信息的关键词为用户姓名,那么用户信息的关键词对应的内容可以理解为该用户的真实姓名,例如:张三;
若用户信息的关键词为身份证号码,那么用户信息的关键词对应的内容可以理解为该用户的18位身份证号码,例如:区域码(6位)+出生年月日(8位)+随机码(4位)。
具体地,在从系统中读取每一条虚拟账户信息时,同步获取该虚拟账户信息对应的用户信息。
可选地,所述方法还包括:
为所述待处理的虚拟账户信息分配账户标识,其中,所述账户标识用于区分不同的虚拟账户信息。
例如:为所述待处理的虚拟账户信息分配一个编号,该编号即为账户标识。
假设,获取的虚拟账户信息为10条,那么该10条虚拟账户信息的账户标识为0至9。
步骤102:根据所述虚拟账户信息中包含的用户信息,确定用于处理所述待处理的虚拟账户信息的至少一个关键词。
在步骤102中,由于聚类操作采用循环迭代的方式,如果选择一个不合适的关键词,那么在执行多次聚类操作之后得到的结果将会出现很大的偏差,因此,为了保证后续聚类操作的准确度,需要确定执行聚类操作所使用的关键词。
在选择用于处理所述待处理的虚拟账户信息的关键词时,首要的选择规则是:选择能够唯一标识用户真实身份的关键词,也就是说,需要从虚拟账户信息对应的用户信息中选择关键词;其次,为了避免需要执行聚类操作的虚拟账户信息属于公用账户信息(即可以多人使用的账户信息)或者批量注册的账户信息,那么需要对于用户信息中包含的关键词进行筛选。具体的筛选方式可以采用以下方式:
针对每一条所述虚拟账户信息中包含的用户信息,从所述用户信息中选择一个关键词,并确定所述关键词对应的内容,其中,所述关键词对应的内容为非空;
在确定包含所述关键词且包含所述关键词对应的内容的虚拟账户信息的个数不大于设定第二阈值时,确定所述关键词为用于处理所述待处理的虚拟账户信息的关键词。
需要说明的是,设定第二阈值可以根据实际需要确定,例如:设定第二阈值为20;也可以根据获取的虚拟账户信息的个数确定,这里不做限定。
假设经过筛选之后确定的关键词为:身份证号码、电话号码、邮箱地址以及与用户绑定的银行卡号。
需要说明的是,此处确定的关键词可以是明文存储的信息,也可以是加密后存储的信息,将不影响后续聚类操作。
步骤103:基于所述至少一个关键词,分别对所述待处理的虚拟账户信息执行聚类操作,得到聚类后的虚拟账户信息组。
其中,所述虚拟账户信息组用于表征属于同一个用户的虚拟账户信息集合。
在步骤103中,首先,针对确定的每一个所述关键词,执行第一轮聚类。
具体地,针对每一个所述关键词,执行以下操作:
选择其中一个关键词;
从所述待处理的虚拟账户信息中,筛选出包含选择的所述关键词的虚拟账户信息,并按照所述关键词对应的内容,将筛选出的虚拟账户信息进行分组,得到选择的所述关键词对应的至少一个虚拟账户信息组。
其中,位于同一分组内的虚拟账户信息中包含的所述关键词对应内容相同。
需要说明的是,位于同一分组内的虚拟账户信息包含的所述关键词对应内容相同排除关键词对应的内容为空的情形。
在得到每一个所述关键词对应的至少一个虚拟账户信息组时,将所述至少一个虚拟账户信息组中包含相同虚拟账户信息的虚拟账户信息组进行聚类。
可选地,在得到每一个所述关键词对应的至少一个虚拟账户信息组时,由于该虚拟账户信息组中包含同一个关键词,且该关键词对应的内容相同,因此,为了比较容易的确定该虚拟账户信息组,为该虚拟账户信息组确定一个组标识。
具体地,根据所述虚拟账户信息组中包含的虚拟账户信息的账户标识和选择的所述关键词,确定所述虚拟账户信息组的组标识。
其中,所述组标识中包含至少一个虚拟账户信息的账户标识。
具体地,根据所述虚拟账户信息组中包含的虚拟账户信息的账户标识,将所述虚拟账户信息进行排序;
根据排序结果,选择一个虚拟账户信息的账户标识,将选择的虚拟账户信息的账户标识和选择的所述关键组作为所述虚拟账户信息组的组标识。
例如:选择排序结果为第一位的虚拟账户信息的账户标识作为所述虚拟账户信息组的组标识的一部分。
在得到每一个虚拟账户信息组的组标识时,将所述至少一个虚拟账户信息组中包含相同虚拟账户信息的虚拟账户信息组进行聚类,包括:
根据所述至少一个虚拟账户信息组的组标识,将包含相同账户标识的不同组标识分别对应的虚拟账户信息组进行聚类。
例如:获取的虚拟账户信息有5条,为每一条虚拟账户信息分配的账户标识用0至4表示,即账户0、账户1、账户2、账户3和账户4。再假设,确定的关键词为A、B、C和D,那么账户0中包含的关键词以及关键词对应的内容为A1、B1、C2和D1;账户1中包含的关键词以及关键词对应的内容为A2、B2、C1和D2;账户2中包含的关键词以及关键词对应的内容为A3、B1、C2和D1;账户3中包含的关键词以及关键词对应的内容为A2、B2、C2和D2;账户4中包含的关键词以及关键词对应的内容为A1、B1、C1和D1。
若选择的关键为A,那么筛选出包含A的虚拟账户信息:账户0、账户1、账户2、账户3和账户4;按照A对应的内容,将筛选出的虚拟账户信息(账户0、账户1、账户2、账户3和账户4)进行分组,得到A对应的至少一个虚拟账户信息组:A1-账户0和账户4;A2-账户1和账户3;A3-账户2。
可选地,为每一个虚拟账户组确定一个组标识:A1-账户0和账户4对应的组标识为0(虚拟账户信息的账户标识)-A;A2-账户1和账户3对应的组标识为1(虚拟账户信息的账户标识)-A;A3-账户2对应的组标识为2(虚拟账户信息的账户标识)-A。
若选择的关键为B,那么筛选出包含B的虚拟账户信息:账户0、账户1、账户2、账户3和账户4;按照B对应的内容,将筛选出的虚拟账户信息(账户0、账户1、账户2、账户3和账户4)进行分组,得到B对应的至少一个虚拟账户信息组:B1-账户0、账户2和账户4;B2-账户1和账户3。
可选地,为每一个虚拟账户组确定一个组标识:B1-账户0、账户2和账户4对应的组标识为0(虚拟账户信息的账户标识)-B;B2-账户1和账户3对应的组标识为1(虚拟账户信息的账户标识)-B。
若选择的关键为C,那么筛选出包含C的虚拟账户信息:账户0、账户1、账户2、账户3和账户4;按照C对应的内容,将筛选出的虚拟账户信息(账户0、账户1、账户2、账户3和账户4)进行分组,得到C对应的至少一个虚拟账户信息组:C1-账户1和账户4;C2-账户0、账户2和账户3。
可选地,为每一个虚拟账户组确定一个组标识:C1-账户1和账户4对应的组标识为1(虚拟账户信息的账户标识)-C;C2-账户0、账户2和账户3对应的组标识为0(虚拟账户信息的账户标识)-C。
若选择的关键为D,那么筛选出包含D的虚拟账户信息:账户0、账户1、账户2、账户3和账户4;按照D对应的内容,将筛选出的虚拟账户信息(账户0、账户1、账户2、账户3和账户4)进行分组,得到D对应的至少一个虚拟账户信息组:D1-账户0、账户2和账户4;D2-账户1和账户3。
可选地,为每一个虚拟账户组确定一个组标识:D1-账户0、账户2和账户4对应的组标识为0(虚拟账户信息的账户标识)-D;D2-账户1和账户3对应的组标识为1(虚拟账户信息的账户标识)-D。
在得到每一个虚拟账户信息组的组标识时,根据所述至少一个虚拟账户信息组的组标识,将包含相同账户标识的不同组标识分别对应的虚拟账户信息组进行聚类:
由上述内容可以知道,包含相同账户标识的不同组标识由:0-A、0-B、0-C和0-D,那么将A1-账户0和账户4、B1-账户0、账户2和账户4、C2-账户0、账户2和账户3和D1-账户0、账户2和账户4进行聚合,即得到聚合的虚拟账户组:账户0、账户1、账户2、账户3和账户4。
可选地,在得到聚类后的虚拟账户信息组时,可以为聚类后的虚拟账户信息组设置聚类组标识,其中,所述聚类组标识中包含聚类的次数和聚类后的虚拟账户组中包含的任意一个虚拟账户组的账户标识,例如:聚类的次数可以表示为Level n。
步骤104:在得到聚类后的虚拟账户信息组时,确定已执行聚类操作的次数。
步骤105:判断已执行聚类操作的次数是否大于设定次数,若不大于,则执行步骤106;否则,执行步骤107。
其中,设定次数可以根据实际需要确定,也可以根据实验数据确定,这里不做限定。
步骤106:在已执行聚类操作的次数不大于设定次数时,判断本次得到的聚类后的虚拟账户信息组中包含的虚拟账户信息与相邻上一次得到的聚类后的虚拟账户信息组中包含的虚拟账户信息是否不同,若不同,则执行步骤103;若相同,则执行步骤107。
步骤107:输出本次得到的聚类后的虚拟账户信息组。
通过本申请实施例所述的技术方案,获取待处理的虚拟账户信息,所述虚拟账户信息中包含设置所述虚拟账户信息的用户的用户信息,所述用户信息用于表征设置所述虚拟账户信息的用户的真实身份,所述用户信息中包含关键词以及所述关键词对应的用于表征所述用户的真实身份的内容;根据所述虚拟账户信息中包含的用户信息,确定用于处理所述待处理的虚拟账户信息的至少一个关键词;基于所述至少一个关键词,分别对所述待处理的虚拟账户信息执行聚类操作,得到聚类后的虚拟账户信息组,所述虚拟账户信息组用于表征属于同一个用户的虚拟账户信息集合,这样,通过用于表征用户真实身份的关键词,对多条虚拟账户信息执行聚类操作,快速关联同一用户的不同虚拟账户信息,有效地提升了对在线系统中大量虚拟账户信息的管理,变相地提升了互联网系统的网络安全性。
下面对本申请实施例中所描述的虚拟账户的处理方法通过以下实例再次进行说明。
假设,获取的虚拟账户信息有四条,虚拟账户信息1:User-id=1、cert(身份证号码)=123和bcard(银行卡号)=null;虚拟账户信息2:User-id=2、cert(身份证号码)=567和bcard(银行卡号)=null;虚拟账户信息3:User-id=3、cert(身份证号码)=123和bcard(银行卡号)=234;虚拟账户信息4:User-id=4、cert(身份证号码)=567和bcard(银行卡号)=234。
假设确定的关键词为cert和bcard,那么执行第一次聚类操作:
以cert为推理对象,虚拟账户信息1和虚拟账户信息3中包含的cert对应的内容相同,那么得到包含虚拟账户信息1和虚拟账户信息3的虚拟账户信息组1;虚拟账户信息2和虚拟账户信息4中包含的cert对应的内容相同,那么得到包含虚拟账户信息2和虚拟账户信息4的虚拟账户信息组2。
在第一次聚类的基础之上,对于虚拟账户信息组1和虚拟账户信息组2再次执行聚类操作:
由于虚拟账户信息组1中包含的虚拟账户信息3与虚拟账户信息组2中包含的虚拟账户信息4中分别包含bcard且bcard对应的内容相同,那么可以将虚拟账户信息组1和虚拟账户信息组2再次进行聚合,这样得到的聚合结果为包含了虚拟账户信息1、虚拟账户信息2、虚拟账户信息3和虚拟账户信息4的聚类后的虚拟账户信息组。
这样即可确定虚拟账户信息1、虚拟账户信息2、虚拟账户信息3和虚拟账户信息4属于同一个用户的虚拟账户信息组。
图2为本申请实施例提供的一种虚拟账户的处理设备的结构示意图。所述处理设备包括:获取单元21、确定单元22和聚类单元23,其中:
获取单元21,用于获取待处理的虚拟账户信息,其中,所述虚拟账户信息中包含设置所述虚拟账户信息的用户的用户信息,所述用户信息用于表征设置所述虚拟账户信息的用户的真实身份,所述用户信息中包含关键词以及所述关键词对应的用于表征所述用户的真实身份的内容;
确定单元22,用于根据所述虚拟账户信息中包含的用户信息,确定用于处理所述待处理的虚拟账户信息的至少一个关键词;
聚类单元23,用于基于所述至少一个关键词,分别对所述待处理的虚拟账户信息执行聚类操作,得到聚类后的虚拟账户信息组,其中,所述虚拟账户信息组用于表征属于同一个用户的虚拟账户信息集合。
具体地,所述确定单元22,具体用于针对每一条所述虚拟账户信息中包含的用户信息,从所述用户信息中选择一个关键词,并确定所述关键词对应的内容,其中,所述关键词对应的内容为非空;
在确定包含所述关键词且包含所述关键词对应的内容的虚拟账户信息的个数不大于设定第二阈值时,确定所述关键词为用于处理所述待处理的虚拟账户信息的关键词。
具体地,所述聚类单元23,具体用于针对每一个所述关键词,执行以下操作:
选择其中一个关键词;
从所述待处理的虚拟账户信息中,筛选出包含选择的所述关键词的虚拟账户信息,并按照所述关键词对应的内容,将筛选出的虚拟账户信息进行分组,得到选择的所述关键词对应的至少一个虚拟账户信息组,其中,位于同一分组内的虚拟账户信息中包含的所述关键词对应内容相同;
在得到每一个所述关键词对应的至少一个虚拟账户信息组时,将所述至少一个虚拟账户信息组中包含相同虚拟账户信息的虚拟账户信息组进行聚类。
具体地,所述获取单元21,还用于在获取待处理的虚拟账户信息时,为所述待处理的虚拟账户信息分配账户标识,其中,所述账户标识用于区分不同的虚拟账户信息;
所述确定单元22,还用于在得到选择的所述关键词对应的至少一个虚拟账户信息组时,根据所述虚拟账户信息组中包含的虚拟账户信息的账户标识和选择的所述关键词,确定所述虚拟账户信息组的组标识,其中,所述组标识中包含至少一个虚拟账户信息的账户标识;
所述聚类单元23,具体用于根据所述至少一个虚拟账户信息组的组标识,将包含相同账户标识的不同组标识分别对应的虚拟账户信息组进行聚类。
具体地,所述聚类单元23根据所述虚拟账户信息组中包含的虚拟账户信息的账户标识和选择的所述关键词,确定所述虚拟账户信息组的组标识,包括:
根据所述虚拟账户信息组中包含的虚拟账户信息的账户标识,将所述虚拟账户信息进行排序;
根据排序结果,选择一个虚拟账户信息的账户标识,将选择的虚拟账户信息的账户标识和选择的所述关键词作为所述虚拟账户信息组的组标识。
可选地,所述处理设备还包括:判断单元24,其中:
所述判断单元24,用于确定已执行聚类操作的次数;在已执行聚类操作的次数不大于设定次数时,触发执行下一次聚类操作;
在已执行聚类操作的次数大于设定次数时,输出本次得到的聚类后的虚拟账户信息组。
具体地,所述判断单元24,具体用于在已执行聚类操作的次数不大于设定次数时,判断本次得到的聚类后的虚拟账户信息组中包含的虚拟账户信息与相邻上一次得到的聚类后的虚拟账户信息组中包含的虚拟账户信息是否不同;
若本次得到的聚类后的虚拟账户信息组中包含的虚拟账户信息与相邻上一次得到的聚类后的虚拟账户信息组中包含的虚拟账户信息不同,则继续执行下一次的聚类操作;
若本次得到的聚类后的虚拟账户信息组中包含的虚拟账户信息与相邻上一次得到的聚类后的虚拟账户信息组中包含的虚拟账户信息相同,则输出得到的聚类后的虚拟账户信息组。
需要说明的是,本申请实施例提供的处理设备可以通过软件方式实现,也可以通过硬件方式实现,这里不做限定。该处理设备通过用于表征用户真实身份的关键词,对多条虚拟账户信息执行聚类操作,快速关联同一用户的不同虚拟账户信息,有效地提升了对在线系统中大量虚拟账户信息的管理,变相地提升了互联网系统的网络安全性。
本领域的技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。