CN105915960A - 一种用户类型的确定方法及装置 - Google Patents
一种用户类型的确定方法及装置 Download PDFInfo
- Publication number
- CN105915960A CN105915960A CN201610203161.XA CN201610203161A CN105915960A CN 105915960 A CN105915960 A CN 105915960A CN 201610203161 A CN201610203161 A CN 201610203161A CN 105915960 A CN105915960 A CN 105915960A
- Authority
- CN
- China
- Prior art keywords
- user
- module
- identified
- characteristic information
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25808—Management of client data
- H04N21/25816—Management of client data involving client authentication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/251—Learning process for intelligent management, e.g. learning user preferences for recommending movies
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Graphics (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例公开了一种用户类型的确定方法及装置,该方法包括提取直播频道内待识别用户的行为特征信息,并将该行为特征信息作为预先确定出的至少一个分类引擎的输入,得到每个分类引擎的输出值;通过预设算法对所有分类引擎的输出值进行计算,得到该行为特征信息的特征值;当该特征值处于第一预设范围内时,确定待识别用户为正常用户;当该特征值处于第二预设范围内时,确定待识别用户为非正常用户。实施本发明实施例能够通过多个分类引擎相互独立工作再将结果综合分析的方式提高确定出的用户类型的准确率。
Description
技术领域
本发明涉及互联网技术领域,具体涉及一种用户类型的确定方法及装置。
背景技术
网络直播是利用互联网将游戏、电影、电视剧或现实生活场景同步到网络直播平台,并向多个用户直播的一种新型网络媒体形式。随着网络直播平台的崛起以及观看网络直播用户数量的增多,一些涉及恶意竞争或经济利益的干扰网络直播的用户行为已经成为网络直播的一大难题。为了解决这一大难题,通常采用人工监控或自动给用户评分的方式确定直播频道内的用户是否为恶意用户。但是人工监控或给用户评分时的评分标准均缺乏理论依据,这降低了确定出的用户类型的准确率。
发明内容
本发明实施例公开了一种用户类型的确定方法及装置,能够提高确定出的用户类型的准确率。
本发明实施例第一方面公开了一种用户类型的确定方法,所述方法包括:
提取直播频道内待识别用户的行为特征信息,并将所述行为特征信息作为预先确定出的至少一个分类引擎的输入,得到每个所述分类引擎的输出值;
通过预设算法对所有所述分类引擎的输出值进行计算,得到所述行为特征信息的特征值;
当所述特征值处于第一预设范围内时,确定所述待识别用户为正常用户;
当所述特征值处于第二预设范围内时,确定所述待识别用户为非正常用户。
在本发明实施例第一方面的第一种可能的实现方式中,所述提取直播频道内待识别用户的行为特征信息之前,所述方法还包括:
从正常用户的用户集合中抽取第一数量的第一类用户,并从非正常用户的用户集合中抽取第二数量的第二类用户;
从未识别出用户类型的用户集合中抽取第三数量的第三类用户,并根据所述第三类用户中每个用户的行为特征信息与预先确定出的行为特征信息的相似度,将所述第三类用户划分成第四数量的正常用户以及第五数量的非正常用户;
确定训练样本集合,所述训练样本集合包括所述第一数量的第一类用户、所述第二数量的第二类用户、所述第四数量的正常用户以及所述第五数量的非正常用户;
通过预设监督学习工具对所述训练样本集合进行学习,得到至少一个分类引擎。
结合在本发明实施例第一方面的第一种可能的实现方式,在本发明实施例第一方面的第二种可能的实现方式中,所述方法还包括:
接收针对所述训练样本集合中的任一用户的第一反馈信息,所述第一反馈信息用于指示所述任一用户的用户类型不正确;
根据所述第一反馈信息修改所述任一用户的用户类型,并更新所述训练样本集合。
结合本发明实施例第一方面、本发明实施例第一方面的第一种可能的实现方式或本发明实施例第一方面的第二种可能的实现方式,在本发明实施例第一方面的第三种可能的实现方式中,所述方法还包括:
向所述待识别用户的客户端发送指示信息,所述指示信息用于指示所述待识别用户的用户类型。
结合在本发明实施例第一方面的第三种可能的实现方式,在本发明实施例第一方面的第四种可能的实现方式中,所述方法还包括:
接收所述待识别用户的客户端发送的第二反馈信息,所述第二反馈信息用于指示确定出的所述待识别用户的用户类型不正确;
根据所述第二反馈信息判断是否需要修改确定出的所述待识别用户的用户类型;
当判断结果为是时,修改所述待识别用户的用户类型。
本发明实施例第二方面公开了一种用户类型的确定装置,所述装置包括提取模块、输入模块、计算模块以及第一确定模块,其中:
所述提取模块,用于提取直播频道内待识别用户的行为特征信息;
所述输入模块,用于将所述行为特征信息作为预先确定出的至少一个分类引擎的输入,得到每个所述分类引擎的输出值;
所述计算模块,用于通过预设算法对所有所述分类引擎的输出值进行计算,得到所述行为特征信息的特征值;
所述第一确定模块,用于当所述特征值处于第一预设范围内时,确定所述待识别用户为正常用户,且当所述特征值处于第二预设范围内时,确定所述待识别用户为非正常用户。
在本发明实施例第二方面的第一种可能的实现方式中,所述装置还包括抽取模块、划分模块、第二确定模块以及学习模块,其中:
所述抽取模块,用于从正常用户的用户集合中抽取第一数量的第一类用户,从非正常用户的用户集合中抽取第二数量的第二类用户,并从未识别出用户类型的用户集合中抽取第三数量的第三类用户;
所述划分模块,用于根据所述第三类用户中每个用户的行为特征信息与预先确定出的行为特征信息的相似度,将所述第三类用户划分成第四数量的正常用户以及第五数量的非正常用户;
所述第二确定模块,用于确定训练样本集合,所述训练样本集合包括所述第一数量的第一类用户、所述第二数量的第二类用户、所述第四数量的正常用户以及所述第五数量的非正常用户;
所述学习模块,用于通过预设监督学习工具对所述训练样本集合进行学习,得到至少一个分类引擎。
结合在本发明实施例第二方面的第一种可能的实现方式,在本发明实施例第二方面的第二种可能的实现方式中,所述装置还包括第一接收模块、第一修改模块以及更新模块,其中:
所述第一接收模块,用于接收针对所述训练样本集合中的任一用户的第一反馈信息,所述第一反馈信息用于指示所述任一用户的用户类型不正确;
所述第一修改模块,用于根据所述第一反馈信息修改所述任一用户的用户类型;
所述更新模块,用于更新所述训练样本集合。
结合本发明实施例第二方面、本发明实施例第二方面的第一种可能的实现方式或本发明实施例第二方面的第二种可能的实现方式,在本发明实施例第二方面的第三种可能的实现方式中,所述装置还包括发送模块,其中:
所述发送模块,用于向所述待识别用户的客户端发送指示信息,所述指示信息用于指示所述待识别用户的用户类型。
结合在本发明实施例第二方面的第三种可能的实现方式,在本发明实施例第二方面的第四种可能的实现方式中,所述装置还包括第二接收模块、判断模块以及第二修改模块,其中:
所述第二接收模块,用于接收所述待识别用户的客户端发送的第二反馈信息,所述第二反馈信息用于指示确定出的所述待识别用户的用户类型不正确;
所述判断模块,用于根据所述第二反馈信息判断是否需要修改确定出的所述待识别用户的用户类型;
所述第二修改模块,用于当所述判断模块的判断结果为是时,修改所述待识别用户的用户类型。
本发明实施例中,提取直播频道内待识别用户的行为特征信息,并将该行为特征信息作为预先确定出的至少一个分类引擎的输入,得到每个分类引擎的输出值;通过预设算法对所有分类引擎的输出值进行计算,得到该行为特征信息的特征值;当该特征值处于第一预设范围内时,确定待识别用户为正常用户;当该特征值处于第二预设范围内时,确定待识别用户为非正常用户。实施本发明实施例能够通过多个分类引擎相互独立工作再将结果综合分析的方式提高确定出的用户类型的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种网络架构的结构示意图;
图2是本发明实施例公开的一种用户类型的确定方法的流程示意图;
图3是本发明实施例公开的另一种用户类型的确定方法的流程示意图;
图4是本发明实施例公开的一种训练样本集合的构造示意图;
图5是本发明实施例公开的一种多分类引擎协同工作的工作示意图;
图6是本发明实施例公开的一种用户类型的确定装置的结构示意图;
图7是本发明实施例公开的另一种用户类型的确定装置的结构示意图;
图8是本发明实施例公开的又一种用户类型的确定装置的结构示意图;
图9是本发明实施例公开的又一种用户类型的确定装置的结构示意图;
图10是本发明实施例公开的又一种用户类型的确定装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更好的理解本发明实施例公开的一种用户类型的确定方法及装置,下面先对本发明实施例适用的网络构架进行描述。请参阅图1,图1是本发明实施例公开的一种网络构架的结构示意图。如图1所示,该网络构架可以包括直播控制平台以及至少一个客户端,其中,每个客户端可以通过用户输入的验证信息(如用户名及用户密码等)以及互联网登录直播控制平台,且每个客户端均可以在直播控制平台的控制下参与直播频道内的直播,直播控制平台可以根据客户端的用户在直播频道内的行为判断用户是否为正常用户,若不是,则直播控制平台可以将用户从直播频道内踢除,以维持直播频道内的直播秩序,其中,图1所示的客户端可以是包括集合群聊、视频直播、频道K歌、在线游戏、在线影视等功能为一体的富客户端。
请参阅图2,图2是本发明实施例公开的一种用户类型的确定方法的流程示意图。其中,图2所示的方法可以应用于直播控制平台中。如图2所示,该用户类型的确定方法可以包括以下操作:
201、提取直播频道内待识别用户的行为特征信息。
本发明实施例中,直播频道内待识别用户的行为特征信息可以包括但不限于用户登录直播频道的时间、用户在直播频道内参与直播的时长、用户在直播频道内发言次数、用户在直播频道内的受关注度以及用户的登录地点等的一种或多种的组合,本发明实施例不做限定。且待识别用户的行为特征信息可以用行为特征向量表示,如X=(x1,x2,…,Xn),其中,X1-Xn分别用于表示用户不同的行为特征。
202、将上述行为特征信息作为预先确定出的至少一个分类引擎的输入,得到每个分类引擎的输出值。
本发明实施例中,预先确定出的至少一个分类引擎可以是由直播控制平台通过朴素贝叶斯、神经网络或支持向量机等监督学习工具对训练样本集合进行学习得到的,且将上述行为特征信息分别输入预先确定出的至少一个分类引擎后可以得到每个分类引擎的输出值。
203、通过预设算法对所有分类引擎的输出值进行计算,得到上述行为特征信息的特征值。
本发明实施例中,预设算法为根据实际需求设置的算法,如求乘积或求平均数等数学算法,又如现有的逻辑算法等,本发明实施例不做限定。其中,不同的预设算法可以对应不同的第一预设范围与第二预设范围。
本发明实施例中,以上述预设算法为求乘积的算法为例,当分类引擎的数量为一个时,即当一个分类引擎单独工作时,将该分类引擎的输出值作为上述行为特征信息的特征值,当分类引擎的数量大于一个时,即当多个分类引擎同时工作时,将所有分类引擎的输出值的乘积作为上述行为特征信息的特征值。
本发明实施例中,当上述行为特征信息的特征值处于第一预设范围内时,执行步骤204;当上述行为特征信息的特征值处于第二预设范围内时,执行步骤205。其中,当上述预设算法为求乘积的算法时,第一预设范围可以为[0,0.5],第二预设范围可以为(0.5,1]。
204、确定上述待识别用户为正常用户。
205、确定上述待识别用户为非正常用户。
本发明实施例中,当确定出上述待识别用户的用户类型之后,可以为上述待识别用户设置一个类型标识,如当上述待识别用户为正常用户时,可以为其设置一个类型标识“0”,当上述待识别用户为非正常用户时,可以为其设置一个类型标识“1”,且在确定出上述待识别用户的用户类型后,将上述待识别用户归入对应的用户集合中。
可见,本发明实施例通过多分类引擎共同协作的方式避免了人工监控和人工赋值打分的主观性和误差,通过多分类引擎多维度的非线性规则得到特征值的方式不容易被逆向嗅探出用户类型的确定规则,且多个分类引擎相互独立工作后将结果综合分析的方式比单一判断结果具有更高的准确率。
在一个可选的实施例中,该用户类型的确定方法还可以包括以下操作:
向上述待识别用户的客户端发送指示信息,其中,该指示信息用于指示上述待识别用户的用户类型。这样能够使上述待识别用户知晓其用户类型。
在该可选的实施例中,进一步可选的,该用户类型的确定方法还可以包括以下操作:
接收上述待识别用户的客户端发送的第二反馈信息,其中,该第二反馈信息用于指示确定出的待识别用户的用户类型不正确;
根据第二反馈信息判断是否需要修改确定出的上述待识别用户的用户类型;
当判断结果为是时,修改上述待识别用户的用户类型。
在该可选的实施例中,向上述待识别用户的客户端发送过上述指示信息能够使客户端的用户确认确定出的用户类型是否准确,若不准确,则上述待识别用户可以通过上述待识别用户的客户端发送第二反馈信息(或申诉信息),该第二反馈信息可以包括上述待识别用户的申诉理由,在接收到第二反馈信息后,根据第二反馈信息中的申诉理由判断是否需要修改上述待识别用户的用户类型,若是,则直接修改待识别用户的用户类型,并将该待识别用户归类到对应的用户集合中,这样能够进一步提高确定出的用户类型的准确率。
请参阅图3,图3是本发明实施例公开的另一种用户类型的确定方法的流程示意图。其中,图3所示的方法可以应用于直播控制平台中。如图3所示,该用户类型的确定方法可以包括以下操作:
301、从正常用户的用户集合中抽取第一数量的第一类用户,并从非正常用户的用户集合中抽取第二数量的第二类用户。
本发明实施例中,第一类用户均为正常用户或者是其行为特征信息的特征值处于第一预设范围[0,0.5]内的用户,如付费用户或优质用户等,第二类用户均为非正常用户或者其行为特征信息的特征值处于第二预设范围(0.5,1]内的用户,如曾被打击或者曾被发现违规的用户等。
302、从未识别出用户类型的用户集合中抽取第三数量的第三类用户,并根据第三类用户中每个用户的行为特征信息与预先确定出的行为特征信息的相似度,将该第三类用户划分成第四数量的正常用户以及第五数量的非正常用户。
本发明实施例中,第三类用户是用户类型未确定或者其行为特征信息的特征值未确定的用户,且预先确定出的行为特征信息为上述第一类用户的行为特征信息以及上述第二类用户的行为特征信息,第三类用户中每个用户的行为特征信息与预先确定出的行为特征信息的相似度可以使用常见的距离来度量,如欧几里得距离或汉明距离等,当第三类用户中任一用户的行为特征信息与第一类用户的行为特征信息的距离更近时,确定对应的相似度比较高,则将该任一用户划分为正常用户并将其归类至第一类用户中;当第三类用户中任一用户的行为特征信息与第二类用户的行为特征信息的距离更近时,确定对应的相似度比较高,则将该任一用户划分为非正常用户并将其归类至第二类用户中。
303、确定训练集合样本。
本发明实施例中,该训练集合样本可以包括上述第一数量的第一类用户、上述第二数量的第二类用户、上述第四数量的正常用户以及上述第五数量的非正常用户。这样上述第一数量的第一类用户以及上述第二数量的第二类用户能够保证后续监督学习工具学习的准确性,上述第四数量的正常用户以及上述第五数量的非正常用户能够保证足够的训练集合样本数量,其中,第三数量等于第四数量与第五数量的和,且第三数量可以大于第一数量与第二数量的和,第三数量与第一数量及第二数量之和的比值可以为预设比例值,本发明实施例不做限定。
需要说明的是,301-303可以合称为训练集合样本的构成过程。且训练集合样本的构成过程可以如图4所示,图4是本发明实施例公开的一种训练样本集合的构造示意图。如图4所示,初始的训练样本包括正常用户样本(对应上述第一数量的第一类用户)以及违规用户样本(对应上述第二数量的第二类用户),随机抽取样本包括未确定出用户类型的随机用户样本(对应上述第三数量的第三类用户),然后通过聚类算法对随机抽取样本进行分类,并将分类后的用户样本进行归类得到训练后的正常用户样本(对应上述第一数量的第一类用户以及第四数量的正常用户)以及违规用户样本(对应上述第二数量的第二类用户以及第五数量的非正常用户)。
304、通过预设监督学习工具对上述训练样本集合进行学习,得到至少一个分类引擎。
本发明实施例中,预设监督学习工具可以为朴素贝叶斯、神经网络以及支持向量机中的任意一种。
305、提取直播频道内待识别用户的行为特征信息。
本发明实施例中,直播频道内待识别用户的行为特征信息可以包括但不限于用户登录直播频道的时间、用户在直播频道内参与直播的时长、用户在直播频道内发言次数、用户在直播频道内的受关注度以及用户的登录地点等的一种或多种的组合,本发明实施例不做限定。且待识别用户的行为特征信息可以用行为特征向量表示,如X=(x1,x2,…,Xn),其中,X1-Xn分别用于表示用户不同的行为特征。
306、将上述行为特征信息作为上述至少一个分类引擎的输入,得到每个分类引擎的输出值。
本发明实施例中,预先确定出的至少一个分类引擎可以是由直播控制平台通过朴素贝叶斯、神经网络或支持向量机等监督学习工具对训练样本集合进行学习得到的,且将上述行为特征信息分别输入预先确定出的至少一个分类引擎后可以得到每个分类引擎的输出值。
307、通过预设算法对所有分类引擎的输出值进行计算,得到上述行为特征信息的特征值。
本发明实施例中,预设算法为根据实际需求设置的算法,如求乘积或求平均数等数学算法,又如现有的逻辑算法等,本发明实施例不做限定。其中,不同的算法可以对应不同的第一预设范围与第二预设范围。
本发明实施例中,以上述预设算法为求乘积的算法为例,当分类引擎的数量为一个时,即当一个分类引擎单独工作时,将该分类引擎的输出值作为上述行为特征信息的特征值,当分类引擎的数量大于一个时,即当多个分类引擎同时工作时,将所有分类引擎的输出值的乘积作为上述行为特征信息的特征值。
本发明实施例中,当上述行为特征信息的特征值处于第一预设范围内时,执行步骤308;当上述行为特征信息的特征值处于第二预设范围内时,执行步骤309。
本发明实施例中,通过上述至少一个分类引擎协同工作确定用户类型的过程可以如图5所示,图5是本发明实施例公开的一种多分类引擎协同工作的工作示意图。如图5所示,将待识别用户的行为特征信息分别输入每个分类引擎中,每个分类引擎都有一个输出值(分类结果),然后通过预设算法对所有分类引擎的输出值进行计算,得到最终结果,将该最终结果确定为上述行为特征信息的特征值,并根据最终结果所处的范围确定待识别用户的用户类型。
308、确定上述待识别用户为正常用户。
309、确定上述待识别用户为非正常用户。
本发明实施例中,当确定出上述待识别用户的用户类型之后,可以为上述待识别用户设置一个类型标识,如当上述待识别用户为正常用户时,可以为其设置一个类型标识“1”,当上述待识别用户为非正常用户时,可以为其设置一个类型标识“0”,且在确定出上述待识别用户的用户类型后,将上述待识别用户归入对应的用户集合中。
可见,本发明实施例通过多分类引擎共同协作的方式避免了人工监控和人工赋值打分的主观性和误差,通过多分类引擎多维度的非线性规则得到特征值的方式不容易被逆向嗅探出用户类型的确定规则,且多个分类引擎相互独立工作后将结果综合分析的方式比单一判断结果具有更高的准确率。
在一个可选的实施例中,该用户类型的确定方法还可以包括以下操作:
接收针对上述训练样本集合中的任一用户的第一反馈信息,其中,该第一反馈信息用于指示该任一用户的用户类型不正确;
根据该第一反馈信息修改该任一用户的用户类型,并更新训练样本集合。
在该可选的实施例中,更新训练样本集合之后,重新执行上述步骤304,这样能够根据实际情况调整训练样本集合中用户的用户类型,提高了训练样本集合中用户类型的准确性,进而提高了得到得分类引擎的准确性,且支持分类引擎的扩展。
进一步可选的,该用户类型的确定方法还可以包括以下操作:
向上述待识别用户的客户端发送指示信息,其中,该指示信息用于指示上述待识别用户的用户类型。这样能够使上述待识别用户知晓其用户类型。
又进一步可选的,该用户类型的确定方法还可以包括以下操作:
接收上述待识别用户的客户端发送的第二反馈信息,其中,该第二反馈信息用于指示确定出的待识别用户的用户类型不正确;
根据第二反馈信息判断是否需要修改确定出的上述待识别用户的用户类型;
当判断结果为是时,修改上述待识别用户的用户类型。
在该可选的实施例中,向上述待识别用户的客户端发送过上述指示信息能够使客户端的用户确认确定出的用户类型是否准确,若不准确,则上述待识别用户可以通过上述待识别用户的客户端发送第二反馈信息(或申诉信息),该第二反馈信息可以包括上述待识别用户的申诉理由,在接收到第二反馈信息后,根据第二反馈信息中的申诉理由判断是否需要修改上述待识别用户的用户类型,若是,则直接修改待识别用户的用户类型,并将该待识别用户归类到对应的用户集合中,这样能够进一步提高确定出的用户类型的准确率。
请参阅图6,图6是本发明实施例公开的一种用户类型的确定装置的结构示意图。其中,图6所示的装置可以安装在直播控制平台上。如图6所示,该装置可以包括提取模块601、输入模块602、计算模块603以及第一确定模块604,其中:
提取模块601用于提取直播频道内待识别用户的行为特征信息。
输入模块602用于将提取模块601提取到的行为特征信息作为预先确定出的至少一个分类引擎的输入,得到每个分类引擎的输出值。
计算模块603用于通过预设算法对所有分类引擎的输出值进行计算,得到上述行为特征信息的特征值。
本发明实施例中,预设算法为根据实际需求设置的算法,如求积或求平均数等数学算法,又如现有的逻辑算法等,本发明实施例不做限定。其中,不同的算法可以对应不同的第一预设范围与第二预设范围。
第一确定模块604用于当上述特征值处于第一预设范围内时,确定上述待识别用户为正常用户,且当上述特征值处于第二预设范围内时,确定上述待识别用户为非正常用户。
可选的,该装置还可以包括抽取模块605、划分模块606、第二确定模块607以及学习模块608,此时,该装置的结构可以如图7所示,图7是本发明实施例公开的另一种用户类型的确定装置的结构示意图。其中:
抽取模块605用于从正常用户的用户集合中抽取第一数量的第一类用户,从非正常用户的用户集合中抽取第二数量的第二类用户,并从未识别出用户类型的用户集合中抽取第三数量的第三类用户。
划分模块606用于根据第三类用户中每个用户的行为特征信息与预先确定出的行为特征信息的相似度,将第三类用户划分成第四数量的正常用户以及第五数量的非正常用户。
第二确定模块607用于确定训练样本集合,其中,该训练样本集合包括第一数量的第一类用户、第二数量的第二类用户、第四数量的正常用户以及第五数量的非正常用户;
学习模块608用于通过预设监督学习工具对训练样本集合进行学习,得到至少一个分类引擎。
进一步可选的,在7所示的装置结构基础上,该装置还可以包括第一接收模块609、第一修改模块610以及更新模块611,此时,该装置的结构可以如图8所示,图8是本发明实施例公开的又一种用户类型的确定装置的结构示意图。其中:
第一接收模块609用于接收针对上述训练样本集合中的任一用户的第一反馈信息,其中,该第一反馈信息用于指示该任一用户的用户类型不正确。
第一修改模块610用于根据第一接收模块609接收到的第一反馈信息修改任一用户的用户类型。
更新模块611用于更新第二确定模块607确定出的训练样本集合。
本发明实施例中,当更新模611更新第二确定模块607确定出的训练样本集合之后,触发学习模块608通过预设监督学习工具对更新后的训练样本集合进行学习,得到新的至少一个分类引擎。
可选的,在图6所示的装置结构基础上,该装置还可以包括发送过模块612,此时,该装置的结构可以如图9所示,图9是本发明实施例公开的又一种用户类型的确定装置的结构示意图。其中:
发送模块612用于向上述待识别用户的客户端发送指示信息,该指示信息用于指示上述待识别用户的用户类型。
进一步可选的,在图9所示的装置结构基础上,该装置还可以包括第二接收模块613、判断模块614以及第二修改模块615,此时,该装置的结构可以如图10所示,图10是本发明实施例公开的又一种用户类型的确定装置的结构示意图。其中:
第二接收模块613用于接收上述待识别用户的客户端发送的第二反馈信息,该第二反馈信息用于指示确定出的上述待识别用户的用户类型不正确。
判断模块614用于根据第二接收模块613接收到的第二反馈信息判断是否需要修改确定出的上述待识别用户的用户类型;
第二修改模块615用于当判断模块614的判断结果为是时,修改上述待识别用户的用户类型。
可见,本发明实施例通过多分类引擎共同协作的方式避免了人工监控和人工赋值打分的主观性和误差,通过多分类引擎多维度的非线性规则得到特征值的方式不容易被逆向嗅探出用户类型的确定规则,且多个分类引擎相互独立工作后将结果综合分析的方式比单一判断结果具有更高的准确率。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作以及模块并不一定是本发明所必须的。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本发明实施例中所述模块可以通过通用集成电路,例如CPU(CentralProcessing Unit,中央处理器),或通过ASIC(Application Specific IntegratedCircuit,专用集成电路)来实现。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上对本发明实施例所提供的一种用户类型的确定方法及装置进行了详细介绍,本文中应用了具体实例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种用户类型的确定方法,其特征在于,所述方法包括:
提取直播频道内待识别用户的行为特征信息,并将所述行为特征信息作为预先确定出的至少一个分类引擎的输入,得到每个所述分类引擎的输出值;
通过预设算法对所有所述分类引擎的输出值进行计算,得到所述行为特征信息的特征值;
当所述特征值处于第一预设范围内时,确定所述待识别用户为正常用户;
当所述特征值处于第二预设范围内时,确定所述待识别用户为非正常用户。
2.根据权利要求1所述的方法,其特征在于,所述提取直播频道内待识别用户的行为特征信息之前,所述方法还包括:
从正常用户的用户集合中抽取第一数量的第一类用户,并从非正常用户的用户集合中抽取第二数量的第二类用户;
从未识别出用户类型的用户集合中抽取第三数量的第三类用户,并根据所述第三类用户中每个用户的行为特征信息与预先确定出的行为特征信息的相似度,将所述第三类用户划分成第四数量的正常用户以及第五数量的非正常用户;
确定训练样本集合,所述训练样本集合包括所述第一数量的第一类用户、所述第二数量的第二类用户、所述第四数量的正常用户以及所述第五数量的非正常用户;
通过预设监督学习工具对所述训练样本集合进行学习,得到至少一个分类引擎。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
接收针对所述训练样本集合中的任一用户的第一反馈信息,所述第一反馈信息用于指示所述任一用户的用户类型不正确;
根据所述第一反馈信息修改所述任一用户的用户类型,并更新所述训练样本集合。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
向所述待识别用户的客户端发送指示信息,所述指示信息用于指示所述待识别用户的用户类型。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
接收所述待识别用户的客户端发送的第二反馈信息,所述第二反馈信息用于指示确定出的所述待识别用户的用户类型不正确;
根据所述第二反馈信息判断是否需要修改确定出的所述待识别用户的用户类型;
当判断结果为是时,修改所述待识别用户的用户类型。
6.一种用户类型的确定装置,其特征在于,所述装置包括提取模块、输入模块、计算模块以及第一确定模块,其中:
所述提取模块,用于提取直播频道内待识别用户的行为特征信息;
所述输入模块,用于将所述行为特征信息作为预先确定出的至少一个分类引擎的输入,得到每个所述分类引擎的输出值;
所述计算模块,用于通过预设算法对所有所述分类引擎的输出值进行计算,得到所述行为特征信息的特征值;
所述第一确定模块,用于当所述特征值处于第一预设范围内时,确定所述待识别用户为正常用户,且当所述特征值处于第二预设范围内时,确定所述待识别用户为非正常用户。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括抽取模块、划分模块、第二确定模块以及学习模块,其中:
所述抽取模块,用于从正常用户的用户集合中抽取第一数量的第一类用户,从非正常用户的用户集合中抽取第二数量的第二类用户,并从未识别出用户类型的用户集合中抽取第三数量的第三类用户;
所述划分模块,用于根据所述第三类用户中每个用户的行为特征信息与预先确定出的行为特征信息的相似度,将所述第三类用户划分成第四数量的正常用户以及第五数量的非正常用户;
所述第二确定模块,用于确定训练样本集合,所述训练样本集合包括所述第一数量的第一类用户、所述第二数量的第二类用户、所述第四数量的正常用户以及所述第五数量的非正常用户;
所述学习模块,用于通过预设监督学习工具对所述训练样本集合进行学习,得到至少一个分类引擎。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括第一接收模块、第一修改模块以及更新模块,其中:
所述第一接收模块,用于接收针对所述训练样本集合中的任一用户的第一反馈信息,所述第一反馈信息用于指示所述任一用户的用户类型不正确;
所述第一修改模块,用于根据所述第一反馈信息修改所述任一用户的用户类型;
所述更新模块,用于更新所述训练样本集合。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述装置还包括发送模块,其中:
所述发送模块,用于向所述待识别用户的客户端发送指示信息,所述指示信息用于指示所述待识别用户的用户类型。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括第二接收模块、判断模块以及第二修改模块,其中:
所述第二接收模块,用于接收所述待识别用户的客户端发送的第二反馈信息,所述第二反馈信息用于指示确定出的所述待识别用户的用户类型不正确;
所述判断模块,用于根据所述第二反馈信息判断是否需要修改确定出的所述待识别用户的用户类型;
所述第二修改模块,用于当所述判断模块的判断结果为是时,修改所述待识别用户的用户类型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610203161.XA CN105915960A (zh) | 2016-03-31 | 2016-03-31 | 一种用户类型的确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610203161.XA CN105915960A (zh) | 2016-03-31 | 2016-03-31 | 一种用户类型的确定方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105915960A true CN105915960A (zh) | 2016-08-31 |
Family
ID=56745467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610203161.XA Pending CN105915960A (zh) | 2016-03-31 | 2016-03-31 | 一种用户类型的确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105915960A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194215A (zh) * | 2017-05-05 | 2017-09-22 | 北京神州新桥科技有限公司 | 用户行为分析方法、装置、系统及机器可读存储介质 |
CN108021574A (zh) * | 2016-11-02 | 2018-05-11 | 北京酷我科技有限公司 | 一种搜索方法及装置 |
CN108174296A (zh) * | 2018-01-02 | 2018-06-15 | 武汉斗鱼网络科技有限公司 | 恶意用户识别方法及装置 |
CN108184148A (zh) * | 2018-01-08 | 2018-06-19 | 武汉斗鱼网络科技有限公司 | 一种用于识别用户的方法、装置及计算机设备 |
CN108390883A (zh) * | 2018-02-28 | 2018-08-10 | 武汉斗鱼网络科技有限公司 | 刷人气用户的识别方法、装置及终端设备 |
CN108520438A (zh) * | 2018-03-30 | 2018-09-11 | 北京小米移动软件有限公司 | 行为类型确定方法及装置 |
CN109255371A (zh) * | 2018-08-23 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种确定直播平台虚假关注用户的方法以及相关设备 |
CN109255391A (zh) * | 2018-09-30 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种识别恶意用户的方法、装置及存储介质 |
CN110414987A (zh) * | 2019-07-18 | 2019-11-05 | 中国工商银行股份有限公司 | 账户集合的识别方法、装置和计算机系统 |
CN110489691A (zh) * | 2019-07-03 | 2019-11-22 | 平安证券股份有限公司 | 页面组件显示方法及终端设备 |
CN112533018A (zh) * | 2020-12-02 | 2021-03-19 | 北京五八信息技术有限公司 | 一种直播间数据的处理方法和装置 |
WO2022068600A1 (zh) * | 2020-09-30 | 2022-04-07 | 百果园技术(新加坡)有限公司 | 异常用户检测模型训练方法、异常用户审核方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101980480A (zh) * | 2010-11-04 | 2011-02-23 | 西安电子科技大学 | 半监督异常入侵检测方法 |
CN102176698A (zh) * | 2010-12-20 | 2011-09-07 | 北京邮电大学 | 一种基于迁移学习的用户异常行为检测方法 |
CN103150578A (zh) * | 2013-04-09 | 2013-06-12 | 山东师范大学 | 一种基于半监督学习的支持向量机分类器训练方法 |
CN104158792A (zh) * | 2013-05-14 | 2014-11-19 | 中兴通讯股份有限公司 | 一种垃圾僵尸检测方法及系统 |
CN105302911A (zh) * | 2015-11-10 | 2016-02-03 | 珠海多玩信息技术有限公司 | 一种数据筛选引擎建立方法及数据筛选引擎 |
-
2016
- 2016-03-31 CN CN201610203161.XA patent/CN105915960A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101980480A (zh) * | 2010-11-04 | 2011-02-23 | 西安电子科技大学 | 半监督异常入侵检测方法 |
CN102176698A (zh) * | 2010-12-20 | 2011-09-07 | 北京邮电大学 | 一种基于迁移学习的用户异常行为检测方法 |
CN103150578A (zh) * | 2013-04-09 | 2013-06-12 | 山东师范大学 | 一种基于半监督学习的支持向量机分类器训练方法 |
CN104158792A (zh) * | 2013-05-14 | 2014-11-19 | 中兴通讯股份有限公司 | 一种垃圾僵尸检测方法及系统 |
CN105302911A (zh) * | 2015-11-10 | 2016-02-03 | 珠海多玩信息技术有限公司 | 一种数据筛选引擎建立方法及数据筛选引擎 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021574A (zh) * | 2016-11-02 | 2018-05-11 | 北京酷我科技有限公司 | 一种搜索方法及装置 |
CN107194215A (zh) * | 2017-05-05 | 2017-09-22 | 北京神州新桥科技有限公司 | 用户行为分析方法、装置、系统及机器可读存储介质 |
CN107194215B (zh) * | 2017-05-05 | 2020-06-26 | 北京神州新桥科技有限公司 | 用户行为分析方法、装置、系统及机器可读存储介质 |
CN108174296B (zh) * | 2018-01-02 | 2019-09-10 | 武汉斗鱼网络科技有限公司 | 恶意用户识别方法及装置 |
CN108174296A (zh) * | 2018-01-02 | 2018-06-15 | 武汉斗鱼网络科技有限公司 | 恶意用户识别方法及装置 |
CN108184148A (zh) * | 2018-01-08 | 2018-06-19 | 武汉斗鱼网络科技有限公司 | 一种用于识别用户的方法、装置及计算机设备 |
CN108390883A (zh) * | 2018-02-28 | 2018-08-10 | 武汉斗鱼网络科技有限公司 | 刷人气用户的识别方法、装置及终端设备 |
CN108390883B (zh) * | 2018-02-28 | 2020-08-04 | 武汉斗鱼网络科技有限公司 | 刷人气用户的识别方法、装置及终端设备 |
CN108520438A (zh) * | 2018-03-30 | 2018-09-11 | 北京小米移动软件有限公司 | 行为类型确定方法及装置 |
CN108520438B (zh) * | 2018-03-30 | 2021-06-22 | 北京小米移动软件有限公司 | 行为类型确定方法及装置 |
CN109255371A (zh) * | 2018-08-23 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种确定直播平台虚假关注用户的方法以及相关设备 |
CN109255371B (zh) * | 2018-08-23 | 2021-06-15 | 武汉斗鱼网络科技有限公司 | 一种确定直播平台虚假关注用户的方法以及相关设备 |
CN109255391A (zh) * | 2018-09-30 | 2019-01-22 | 武汉斗鱼网络科技有限公司 | 一种识别恶意用户的方法、装置及存储介质 |
CN109255391B (zh) * | 2018-09-30 | 2021-07-23 | 武汉斗鱼网络科技有限公司 | 一种识别恶意用户的方法、装置及存储介质 |
CN110489691A (zh) * | 2019-07-03 | 2019-11-22 | 平安证券股份有限公司 | 页面组件显示方法及终端设备 |
CN110414987A (zh) * | 2019-07-18 | 2019-11-05 | 中国工商银行股份有限公司 | 账户集合的识别方法、装置和计算机系统 |
WO2022068600A1 (zh) * | 2020-09-30 | 2022-04-07 | 百果园技术(新加坡)有限公司 | 异常用户检测模型训练方法、异常用户审核方法及装置 |
CN112533018A (zh) * | 2020-12-02 | 2021-03-19 | 北京五八信息技术有限公司 | 一种直播间数据的处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105915960A (zh) | 一种用户类型的确定方法及装置 | |
CN108322317B (zh) | 一种账号识别关联方法及服务器 | |
CN108419091A (zh) | 一种基于机器学习的视频内容审核方法及装置 | |
CN108765131A (zh) | 基于微表情的信贷审核方法、装置、终端及可读存储介质 | |
CN104077560B (zh) | 指纹比对方法 | |
CN110134871B (zh) | 一种基于课程和学习者网络结构的动态课程推荐方法 | |
CN108122437A (zh) | 自适应学习方法及装置 | |
CN113378961A (zh) | 网络流量识别方法、装置、设备以及计算机程序产品 | |
CN110493262A (zh) | 一种改进分类的网络攻击检测方法及系统 | |
Wardoyo et al. | Effectiveness of game-based learning–learning in modern education | |
CN109426700A (zh) | 数据处理方法、装置、存储介质和电子装置 | |
CN110493612A (zh) | 弹幕信息的处理方法、服务器及计算机可读存储介质 | |
CN109859116B (zh) | 图像处理模型的训练方法、装置、电子设备及存储介质 | |
CN113822160B (zh) | 深度伪造检测模型的评测方法、系统及设备 | |
CN108363967A (zh) | 一种遥感图像场景的分类系统 | |
CN111144546A (zh) | 评分方法、装置、电子设备及存储介质 | |
CN109325099A (zh) | 一种自动检索的方法和装置 | |
CN111415283A (zh) | 一种有效在线教学的因素分析方法和装置 | |
CN116934161A (zh) | 一种基于大数据的中文线上教育指导系统 | |
CN109214275B (zh) | 一种基于深度学习的低俗图片识别方法 | |
CN111340125A (zh) | 基于随机森林算法训练子宫内膜异位囊肿破裂数据的方法 | |
CN106815199A (zh) | 基于机器学习的协议类型分析方法和装置 | |
CN109740750A (zh) | 数据收集方法及装置 | |
CN110909132B (zh) | 一种基于语义分析的警务学习内容分析划归方法 | |
CN110968669A (zh) | 一种智能视频分析警务试题归类推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160831 |
|
RJ01 | Rejection of invention patent application after publication |