一种用于识别用户的方法、装置及计算机设备
技术领域
本发明属于直播技术领域,尤其涉及一种用于识别用户的方法、装置及计算机设备。
背景技术
随着直播平台的发展,越来越多的用户在直播平台上发送弹幕消息。有些主播为了增加直播间的人气,会使用机器设备在直播间发送大量弹幕信息,严重影响了直播平台的秩序。
一般来说机器弹幕从内容上大多数与正常弹幕信息并没有什么不同,机器会模仿正常用户的弹幕文本,因此无法识别出发送弹幕的异常用户,导致直播平台的秩序得不到保障。
发明内容
针对现有技术存在的问题,本发明实施例提供了一种用于识别用户的方法、装置及计算机设备,用于解决现有技术中无法识别出直播平台中发送弹幕的异常用户信息,导致直播平台秩序得不到保障的技术问题。
本发明实施例提供一种用于识别用户的方法,应用在直播平台中,所述方法包括:
为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;
根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的互联网协议IP信息确定所述用户样本中任意两个用户之间的相似值;
利用K近邻算法为用户样本中的所有用户构建K近邻图;
根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;
根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;
根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;
根据用户的标签对每个用户进行识别。
上述方案中,所述为用户样本中的正常用户及异常用户分别标记不同的标签,包括:
获取所述用户样本中每个用户在所述直播平台中的行为日志记录及用户等级;
若所述用户的行为日志记录正常或用户等级为高等级用户时,则确定所述用户为正常用户;
为所述正常用户标记第一标签。
上述方案中,所述为用户样本中的正常用户及异常用户分别标记不同的标签,包括:
获取所述用户样本中每个用户在所述直播平台中的登陆账号以及所述登陆账号对应的设备标识ID;
若所述登陆账号对应多个相同的设备ID,则确定所述登陆账号对应的用户为异常用户;
为所述异常用户标记第二标签。
上述方案中,所述根据每个用户行为发生的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中的登陆IP信息确定所述用户样本中任意两个用户之间的相似值,包括:
根据公式确定任意用户u和用户v之间的相似值s(u,v);其中,
当需要对发送弹幕信息的用户进行识别时,所述Ru为用户u在预设时间内发送弹幕的直播间数量、所述Rv为用户v在预设时间内发送弹幕的直播间数量;所述Iu为用户u用户在所述直播平台中的登陆IP信息、所述Iv为用户v用户在所述直播平台中的登陆IP信息;所述Du为用户u发送弹幕时使用的设备信息、所述Dv为用户v发送弹幕时使用的设备信息;所述wi(i=1,2,3,4)为权重系数,且所述xui为用户u的第i个与发送弹幕相关的特征指标,所述xvi为用户v的第i个与发送弹幕相关的特征指标;所述N为所述特征指标的数量。
上述方案中,所述根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和,包括:
根据预设的K值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边以及每个剩余用户与所述异常用户相连构成的K条边;
根据任意两个用户在所述K近邻图中构成的边的权重值分别计算所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边的第一权重和,以及每个剩余用户与所述异常用户相连构成的K条边的第二权重和。
上述方案中,所述根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值,包括:
根据公式确定任意两个用户在所述K近邻图中构成的边的权重值;其中,所述s(u,v)为任意用户u和用户v之间的相似值,所述a为预设的常数,a取值为(0,1)。
上述方案中,所述根据所述第一权重和及所述第二权重和确定每个剩余用户的标签,包括:
比较所述第一权重和及所述第二权重和,确定出最大的权重和;
将所述每个剩余用户的标签与最大的权重和对应的用户的标签标记为一致。
本发明实施例还提供一种用于识别用户的装置,所述装置包括:
标记单元,用于为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;
第一确定单元,用于根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的IP信息确定所述用户样本中任意两个用户之间的相似值;
构建单元,用于利用K近邻算法为用户样本中的所有用户构建K近邻图;
第二确定单元,用于根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;
第三确定单元,用于根据预设的K值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;
第四确定单元,用于根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;
识别单元,用于根据用户的标签对每个用户进行识别。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本包括:正常用户、异常用户及剩余用户;
根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的IP信息确定所述用户样本中任意两个用户之间的相似值;
利用K近邻算法为用户样本中的所有用户构建K近邻图;
根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;
根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;
根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;
根据用户的标签对每个用户进行识别。
本发明还提供一种用于识别弹幕用户的计算机设备,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中,
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述任一所述的方法。
本发明实施例提供了一种用于识别用户的方法、装置及计算机设备,所述方法包括:为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的IP信息确定所述用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;根据用户的标签对每个用户进行识别;如此,为用户样本中的正常用户及异常用户分别标记不同的标签;由于还不能识别出剩余用户中的正常用户及非正常用户,所以再根据K近邻算法为用户样本中的所有用户构建K近邻图,根据用户样本中任意两个用户之间的相似值计算,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边的第一权重和,以及每个剩余用户与所述异常用户相连构成的K条边的第二权重和;再根据所述第一权重和及所述第二权重和确定每个剩余用户的标签,最后可以根据每个用户的标签对每个用户进行识别;这样就可以精确地识别出直播平台中的非正常用户,保障直播平台的秩序。
附图说明
图1为本发明实施例提供的用于识别用户的方法流程示意图;
图2为本发明实施例提供的用于识别用户的装置结构示意图;
图3为本发明实施例提供的用于识别用户的计算机设备结构示意图。
具体实施方式
为了解决现有技术中无法识别出直播平台中的异常用户信息,导致直播平台秩序得不到保障的技术问题,本发明提供了一种用于识别用户的方法、装置及计算机设备,所述方法包括:为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中登陆的IP信息确定所述用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;根据用户的标签对每个用户进行识别。
下面通过附图及具体实施例对本发明的技术方案做进一步的详细说明。
实施例一
本实施例提供一种用于识别用户的方法,应用在直播平台中,如图1所示,所述方法包括:
S110,为用户样本中的正常用户及异常用户分别标记不同的标签。
本步骤中,所述用户样本中的用户包括:正常用户、异常用户及剩余用户。所述用户样本可以是直播平台中预设时间内登陆的用户,本实施例中的用户样本是直播平台中每天统计的用户样本。
这里,可以先利用预设的识别规则从所述用户样本中识别出正常用户及异常用户,并为用户样本中的正常用户及异常用户分别标记不同的标签。但是该识别规则不能识别出用户样本中的全部正常用户及异常用户,识别出的正常用户及异常用户只是用户样本中的一部分用户,因此还有一些剩余用户。
具体地,对正常用户进行识别及标记时,获取所述用户样本中每个用户在所述直播平台中的行为日志记录及用户等级;若所述用户的行为日志记录正常或用户等级为高等级用户时,则确定所述用户为正常用户;为所述正常用户标记第一标签,所述第一标签可以用数字或字母或其他标识,在此不做限制。本实施例中的第一标签是以数字表示的,比如1。
比如以用户的行为日志记录进行识别时,有些用户在发送弹幕或者进行其他触发动作时,行为日志记录中会有相应的打点记录,而如果日志记录中有相应的打点记录,也触发了相应的动作,比如发送了弹幕信息,那么就表示该用户是正常用户。
这里,以用户的等级进行识别时,是以基准等级5级进行判断的,当用户等级大于5级,则确定用户为高等级用户;当用户等级小于5级,则确定用户为低等级用户;比如当确定用户等级为10级时,确定该用户为高等级用户;当用户等级为1级时,确定该用户为低等级用户。
对正常用户进行识别及标记时,获取所述用户样本中每个用户在所述直播平台中的登陆账号及该账号对应的设备ID;若所述登陆账号对应多个相同的设备ID,则确定所述登陆账号对应的用户为异常用户;为所述异常用户标记第二标签。所述第二标签可以用数字或字母或其他标识,在此不做限制。本实施例中的第二标签是以数字表示的,比如0。
比如,在发送弹幕信息时,多个用户利用不同设备使用同一个账号发送弹幕信息,则确定该账号对应的用户是异常用户。
S111,根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中的登陆互联网协议IP信息确定所述用户样本中任意两个用户之间的相似值;
本步骤中,根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中的登陆互联网协议IP信息确定所述用户样本中任意两个用户之间的相似值。这里,每个用户通过在设备上登录直播平台时,直播平台都会为每个设备生成唯一的设备标识。
那么就可以根据公式(1)确定出用户样本中任意两个用户之间的相似值:
公式(1)中,当需要对发送弹幕信息的用户进行识别时,那么所述Ru为用户u在预设时间内发送弹幕的直播间数量、所述Rv为用户v在预设时间内发送弹幕的直播间数量;所述Iu为用户u用户在所述直播平台中的登陆IP信息、所述Iv为用户v用户在所述直播平台中的登陆IP信息;所述Du为用户u发送弹幕时使用的设备信息、所述Dv为用户v发送弹幕时使用的设备信息;所述wi(i=1,2,3,4)为权重系数,且所述xui为用户u的第i个与发送弹幕相关的特征指标,所述xvi为用户v的第i个与发送弹幕相关的特征指标;所述N为特征指标的数量;所述与发送弹幕相关的特征指标可以包括:预设时间段内发送弹幕的次数、发送弹幕的间隔时间等。其中,所述设备信息是每个设备的ID,当每个设备访问直播平台时,直播平台会为每个设备生成一个唯一的ID。
这里,当需要其他类型用户进行识别时,上述参数对应其他类型的用户进行适应调整即可。比如其他类型的用户还可以包括:发送礼物的用户等。
S112,利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;
当确定出所述用户样本中任意两个用户之间的相似值后,利用K近邻算法为用户样本中的所有用户构建K近邻图,在K近邻图中每个用户相当于一个节点,两个节点之间构成一条边,用户之间的相似值就代表了节点间的关联关系。
那么就可以根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值。具体实现方法如公式(2)所示:
公式(2)中,所述s(u,v)为任意用户u和用户v之间的相似值,所述a为预设的常数,a取值为(0,1)。
需要说明的是,在计算不同用户之间的构成的边的权重值时,所述a的取值是相同的。
S113,根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;
确定出任意两个用户在所述K近邻图中构成的边的权重值后,根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和。
具体地,若在述K近邻图中将所有的节点进行连接,那么K近邻图会太复杂,因此会预设一个K值,根据预设的K值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边以及每个剩余用户与所述异常用户相连构成的K条边;
根据任意两个用户在所述K近邻图中构成的边的权重值分别计算所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边的第一权重和,以及每个剩余用户与所述异常用户相连构成的K条边的第二权重和。
本实施例中将K值设置为30,即每个节点只与相似值最大的30个节点相连,形成30条边。
比如当K值为3时,剩余节点包括A节点,相似值最大的有B节点、C节点及D节点;A节点和B节点构成的边的权重为0.4,A节点和C节点构成的边的权重为0.3,A节点和D节点构成的边的权重为0.1;B节点和D节点的标签为1,C节点的标签为0;那么第一权重之和为0.5,第二权重之和为0.3。
S114,根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;
当第一权重和及所述第二权重和确定出之后,根据所述第一权重和及所述第二权重和确定每个剩余用户的标签。
具体地,比较所述第一权重和及所述第二权重和,确定出最大的权重和;将所述每个剩余用户的标签与最大的权重和对应的用户的标签标记为一致。
还是以上述步骤中的A节点为例,由于第一权重之和为0.5,第二权重之和为0.3。那么A节点的标签应该和正常用户的标签一致,即A节点的标签为1。
除原始节点外,其他的节点按照上述过程不断进行迭代标记,直至所有的节点的标签状态不再发生变化,即对剩余用户完成了标记。所述原始节点是指用户样本中正常用户与异常用户对应的节点。
S115,根据用户的标签对每个用户进行识别。
对剩余用户标记上标签后,可以根据用户的标签对每个用户进行识别。这样可以找出每个具有可能的异常用户,保证了直播平台的运行秩序。
实施例二
相应于实施例一,本实施例提供一种识别用户的装置,如图2所示,所述装置包括:标记单元21、第一确定单元22、构建单元23、第二确定单元24、第三确定单元25、第四确定单元26及识别单元27;其中,
所述标记单元21用于为用户样本中的正常用户及异常用户分别标记不同的标签。所述用户样本中的用户还包括:剩余用户。所述用户样本可以是直播平台中预设时间内登陆的用户,本实施例中的用户样本是直播平台中每天统计的用户样本。
这里,所述标记单元21可以先利用预设的识别规则从所述用户样本中识别出正常用户及异常用户,并为用户样本中的正常用户及异常用户分别标记不同的标签。但是该识别规则不能识别出用户样本中的全部正常用户及异常用户,识别出的正常用户及异常用户只是用户样本中的一部分用户,因此还有一些剩余用户。
具体地,所述标记单元21对正常用户进行识别及标记时,获取所述用户样本中每个用户在所述直播平台中的行为日志记录及用户等级;若所述用户的行为日志记录正常或用户等级为高等级用户时,则确定所述用户为正常用户;为所述正常用户标记第一标签,所述第一标签可以用数字或字母或其他标识,在此不做限制。本实施例中的第一标签是以数字表示的,比如1。
比如以用户的行为日志记录进行识别时,有些用户在发送弹幕或者进行其他触发动作时,行为日志记录中会有相应的打点记录,而如果日志记录中有相应的打点记录,也触发了相应的动作,比如发送了弹幕信息,那么就表示该用户是正常用户。
这里,以用户的等级进行识别时,是以基准等级5级进行判断的,当用户等级大于5级,则确定用户为高等级用户;当用户等级小于5级,则确定用户为低等级用户;比如当确定用户等级为10级时,确定该用户为高等级用户;当用户等级为1级时,确定该用户为低等级用户。
所述标记单元21对正常用户进行识别及标记时,获取所述用户样本中每个用户在所述直播平台中的登陆账号及该账号对应的设备ID;若所述登陆账号对应多个相同的设备ID,则确定所述登陆账号对应的用户为异常用户,为所述异常用户标记第二标签。所述第二标签可以用数字或字母或其他标识,在此不做限制。本实施例中的第二标签是以数字表示的,比如0。
比如,在发送弹幕信息时,多个用户利用不同设备使用同一个账号发送弹幕信息,则确定该账号对应的用户是异常用户。
然后所述第一确定单元22根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中的登陆互联网协议IP信息确定所述用户样本中任意两个用户之间的相似值。这里,每个用户通过在设备上登录直播平台时,直播平台都会为每个设备生成唯一的设备标识。
具体地,所述第一确定单元22根据公式(1)确定出用户样本中任意两个用户之间的相似值:
公式(1)中,当需要对发送弹幕信息的用户进行识别时,那么所述Ru为用户u在预设时间内发送弹幕的直播间数量、所述Rv为用户v在预设时间内发送弹幕的直播间数量;所述Iu为用户u用户在所述直播平台中的登陆IP信息、所述Iv为用户v用户在所述直播平台中的登陆IP信息;所述Du为用户u发送弹幕时使用的设备信息、所述Dv为用户v发送弹幕时使用的设备信息;所述wi(i=1,2,3,4)为权重系数,且所述xui为用户u的第i个与发送弹幕相关的特征指标,所述xvi为用户v的第i个与发送弹幕相关的特征指标;所述N为特征指标的数量;所述与发送弹幕相关的特征指标可以包括:预设时间段内发送弹幕的次数、发送弹幕的间隔时间等。其中,所述设备信息是每个设备的ID,当每个设备访问直播平台时,直播平台会为每个设备生成一个唯一的ID。
这里,当需要其他类型用户进行识别时,上述参数对应其他类型的用户进行适应调整即可。比如其他类型的用户还可以包括:发送礼物的用户等。
当第一确定单元22确定出所述用户样本中任意两个用户之间的相似值后,所述构建单元23用于利用K近邻算法为用户样本中的所有用户构建K近邻图,在K近邻图中每个用户相当于一个节点,两个节点之间构成一条边,用户之间的相似值就代表了节点间的关联关系。
那么第二确定单元24就可以根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值。具体实现方法如公式(2)所示:
公式(2)中,所述s(u,v)为任意用户u和用户v之间的相似值,所述a为预设的常数,a取值为(0,1)。
需要说明的是,在计算不同用户之间的构成的边的权重值时,所述a的取值是相同的。
当第二确定单元24确定出任意两个用户在所述K近邻图中构成的边的权重值后,所述第三确定单元25用于根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和。
具体地,若在述K近邻图中将所有的节点进行连接,那么K近邻图会太复杂,因此会预设一个K值,根据预设的K值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边以及每个剩余用户与所述异常用户相连构成的K条边;
根据任意两个用户在所述K近邻图中构成的边的权重值分别计算所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边的第一权重和,以及每个剩余用户与所述异常用户相连构成的K条边的第二权重和。
本实施例中将K值设置为30,即每个节点只与相似值最大的30个节点相连,形成30条边。
比如当K值为3时,剩余节点包括A节点,相似值最大的有B节点、C节点及D节点;A节点和B节点构成的边的权重为0.4,A节点和C节点构成的边的权重为0.3,A节点和D节点构成的边的权重为0.1;B节点和D节点的标签为1,C节点的标签为0;那么第一权重之和为0.5,第二权重之和为0.3。
当第一权重和及所述第二权重和确定出之后,所述第四确定单元26用于根据所述第一权重和及所述第二权重和确定每个剩余用户的标签。
具体地,比较所述第一权重和及所述第二权重和,确定出最大的权重和;将所述每个剩余用户的标签与最大的权重和对应的用户的标签标记为一致。
还是以上述步骤中的A节点为例,由于第一权重之和为0.5,第二权重之和为0.3。那么A节点的标签应该和正常用户的标签一致,即A节点的标签为1。
除原始节点外,其他的节点按照上述过程不断进行迭代标记,直至所有的节点的标签状态不再发生变化,即对剩余用户完成了标记。所述原始节点是指用户样本中正常用户与异常用户对应的节点。
对剩余用户标记上标签后,所述识别单元27可以根据用户的标签对每个用户进行识别。这样可以找出每个具有可能的异常用户,保证了直播平台的运行秩序。
实施例三
本实施例还提供一种用于识别用户的计算机设备,如图3所示,所述计算机设备包括:射频(Radio Frequency,RF)电路310、存储器320、输入单元330、显示单元340、音频电路350、WiFi模块360、处理器370、以及电源380等部件。本领域技术人员可以理解,图3中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图3对计算机设备的各个构成部件进行具体的介绍:
RF电路310可用于信号的接收和发送,特别地,将基站的下行信息接收后,给处理器370处理。通常,RF电路310包括但不限于至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier,LNA)、双工器等。
存储器320可用于存储软件程序以及模块,处理器370通过运行存储在存储器320的软件程序以及模块,从而执行计算机设备的各种功能应用以及数据处理。存储器320可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元330可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。具体地,输入单元330可包括键盘331以及其他输入设备332。键盘331,可收集用户在其上的输入操作,并根据预先设定的程式驱动相应的连接装置。键盘331采集到输出信息后再送给处理器370。除了键盘331,输入单元330还可以包括其他输入设备332。具体地,其他输入设备332可以包括但不限于触控面板、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元340可用于显示由用户输入的信息或提供给用户的信息以及计算机设备的各种菜单。显示单元340可包括显示面板341,可选的,可以采用液晶显示器(LiquidCrystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板341。进一步的,键盘331可覆盖显示面板341,当键盘331检测到在其上或附近的触摸操作后,传送给处理器370以确定触摸事件的类型,随后处理器370根据输入事件的类型在显示面板341上提供相应的视觉输出。虽然在图3中键盘331与显示面板341是作为两个独立的部件来实现计算机设备的输入和输入功能,但是在某些实施例中,可以将键盘331与显示面板341集成而实现计算机设备的输入和输出功能。
音频电路350、扬声器351,传声器352可提供用户与计算机设备之间的音频接口。音频电路350可将接收到的音频数据转换后的电信号,传输到扬声器351,由扬声器351转换为声音信号输出;
WiFi属于短距离无线传输技术,计算机设备通过WiFi模块360可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图3示出了WiFi模块360,但是可以理解的是,其并不属于计算机设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器370是计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器320内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器370可包括一个或多个处理单元;优选的,处理器370可集成应用处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等。
计算机设备还包括给各个部件供电的电源380(比如电源适配器),优选的,电源可以通过电源管理系统与处理器370逻辑相连。
本发明实施例提供的用于识别用户的方法、装置及计算机设备能带来的有益效果至少是:
本发明实施例提供了一种用于识别用户的方法、装置及计算机设备,所述方法包括:为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中的登陆互联网协议IP信息确定所述用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;根据用户的标签对每个用户进行识别;如此,为用户样本中的正常用户及异常用户分别标记不同的标签;由于还不能识别出剩余用户中的正常用户及非正常用户,所以再根据K近邻算法为用户样本中的所有用户构建K近邻图,根据用户样本中任意两个用户之间的相似值计算,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的K条边的第一权重和,以及每个剩余用户与所述异常用户相连构成的K条边的第二权重和;再根据所述第一权重和及所述第二权重和确定每个剩余用户的标签,最后可以根据每个用户的标签对每个用户进行识别;这样就可以精确地识别出直播平台中的非正常用户,保障直播平台的秩序。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP,Digital Signal Processing)来实现根据本发明实施例的网关、代理服务器、系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读存储介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供;该程序被处理器执行时实现以下步骤:为用户样本中的正常用户及异常用户分别标记不同的标签,所述用户样本中的用户包括:正常用户、异常用户及剩余用户;根据每个用户行为发生对应的直播间数量信息、使用的设备信息以及每个用户在所述直播平台中的登陆互联网协议IP信息确定所述用户样本中任意两个用户之间的相似值;利用K近邻算法为用户样本中的所有用户构建K近邻图;根据所述用户样本中任意两个用户之间的相似值确定任意两个用户在所述K近邻图中构成的边的权重值;根据预设的K值及任意两个用户在所述K近邻图中构成的边的权重值,确定所述K近邻图中每个剩余用户与所述正常用户相连构成的边的第一权重和,以及每个剩余用户与所述异常用户相连构成的边的第二权重和;根据所述第一权重和及所述第二权重和确定每个剩余用户的标签;根据用户的标签对每个用户进行识别。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。