CN105608352B - 一种信息处理方法和服务器 - Google Patents
一种信息处理方法和服务器 Download PDFInfo
- Publication number
- CN105608352B CN105608352B CN201511032497.6A CN201511032497A CN105608352B CN 105608352 B CN105608352 B CN 105608352B CN 201511032497 A CN201511032497 A CN 201511032497A CN 105608352 B CN105608352 B CN 105608352B
- Authority
- CN
- China
- Prior art keywords
- behavior
- electronic equipment
- list
- degree
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/316—User authentication by observing the pattern of computer usage, e.g. typical user behaviour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Computer Security & Cryptography (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Social Psychology (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供了一种信息处理方法和服务器,用于实现确定使用电子设备的用户数量的技术问题。所述方法包括:获得一电子设备的行为列表;所述行为列表记录所述电子设备发生的行为;基于所述行为列表,提取出至少一个区别特征;基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量。
Description
技术领域
本发明涉及电子技术领域,尤其涉及一种信息处理方法和服务器。
背景技术
随着电子产品的发展,人们能够在电子设备上所做的事情越来越多。所以,分析电子设备的行为列表中记录的一条条行为,可以在一定程度上了解用户的习惯、爱好和经历等。
目前,在分析电子设备行为时,通常将一个电子设备的所有行为均当作一个用户的行为来处理。但是,在实际过程中,一个电子设备很可能被多个用户使用,例如一台共用电脑,上午由用户A使用,下午则变成了用户B使用。
然而,现有技术中并不能确定电子设备被多少用户所使用。
发明内容
本申请实施例提供了一种信息处理方法和服务器,用于实现确定使用电子设备的用户数量的技术问题。
第一方面,本申请提供了一种信息处理方法,包括:
获得一电子设备的行为列表;所述行为列表记录所述电子设备发生的行为;
基于所述行为列表,提取出至少一个区别特征;
基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量。
可选的,基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量,包括:
基于所述至少一个区别特征和所述行为列表中的每条行为的属性,获得至少一个集合;
确定所述至少一个集合的数量为所述用户数量。
可选的,获得至少一个集合,包括:
获取所述行为列表中一条行为的属性;
判断是否存在与所述属性对应的第一集合;
若所述第一集合不存在,则基于所述属性建立第一集合;或者
若所述第一集合存在,则判断所述第一集合以及所述属性对应的第一拟合度是否满足第一预设条件;
当所述第一集合和所述第一拟合度不满足所述第一预设条件时,获得一个集合,所述集合包括满足第二预设条件的行为。
可选的,获得至少一个集合,包括:
基于所述每条行为的属性,计算所述每条行为的拟合度;
计算所述每条行为的拟合度与其他行为的拟合度之间的距离;
将满足第三预设条件的所述距离对应的至少两条行为的属性作为一个集合,共获得所述至少一个集合。
可选的,确定所述至少一个集合的数量为所述用户数量,包括:
计算所述至少一个集合中每个集合包括的至少一条行为与所述行为列表的多条行为的比例;
确定所述比例高于等于第一阈值的集合为有效集合;
确定所述有效集合的数量为所述用户数量。
第二方面,本申请提供了一种服务器,包括:
获得单元,用于获得一电子设备的行为列表;所述行为列表记录所述电子设备发生的行为;
提取单元,用于基于所述行为列表,提取出至少一个区别特征;
确定单元,用于基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量。
可选的,所述确定单元用于基于所述至少一个区别特征和所述行为列表中的每条行为的属性,获得至少一个集合;确定所述至少一个集合的数量为所述用户数量。
可选的,所述确定单元用于获取所述行为列表中一条行为的属性;判断是否存在与所述属性对应的第一集合;若所述第一集合不存在,则基于所述属性建立第一集合;或者若所述第一集合存在,则判断所述第一集合以及所述属性对应的第一拟合度是否满足第一预设条件;当所述第一集合和所述第一拟合度不满足所述第一预设条件时,获得一个集合,所述集合包括满足第二预设条件的行为。
可选的,所述确定单元用于基于所述每条行为的属性,计算所述每条行为的拟合度;计算所述每条行为的拟合度与其他行为的拟合度之间的距离;将满足第三预设条件的所述距离对应的至少两条行为的属性作为一个集合,共获得所述至少一个集合。
可选的,所述确定单元用于计算所述至少一个集合中每个集合包括的至少一条行为与所述行为列表的多条行为的比例;确定所述比例高于等于第一阈值的集合为有效集合;确定所述有效集合的数量为所述用户数量。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
在本申请实施例的技术方案中,获得一电子设备的行为列表,然后基于行为列表,提取出至少一个区别特征,进而基于至少一个区别特征和行为列表,确定电子设备的用户数量。所以,解决了现有技术存在的将电子设备的全部行为默认为一个用户的行为的技术问题,实现了根据行为确定出电子设备被多少用户使用过,即确定用户数量的技术效果。
附图说明
图1为本申请实施例中信息处理方法的流程图;
图2为本申请实施例中电子设备的结构示意图。
具体实施方式
本申请实施例提供了一种信息处理方法和服务器,用以解决现有技术存在的将电子设备的全部行为默认为一个用户的行为的技术问题,实现了确定用户数量的技术效果。
为了解决上述技术问题,本申请提供的技术方案总体思路如下:
在本申请实施例的技术方案中,获得一电子设备的行为列表,然后基于行为列表,提取出至少一个区别特征,进而基于至少一个区别特征和行为列表,确定电子设备的用户数量。所以,解决了现有技术存在的将电子设备的全部行为默认为一个用户的行为的技术问题,实现了根据行为确定出电子设备被多少用户使用过,即确定用户数量的技术效果。
下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本申请第一方面提供了一种信息处理方法,如图1所示,包括如下步骤:
S101:获得一电子设备的行为列表。
S102:基于所述行为列表,提取出至少一个区别特征。
S103:基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量。
本申请实施例中的信息处理方法应用于服务器,具体来讲,本申请实施例中的服务器可以具体为通过网络与多个电子设备连接的云服务器,也可以就是电子设备本身,本申请不做具体限制。
首先,在S101中获得电子设备的行为列表。在本申请实施例中,行为列表记录该电子设备发生的行为,包括用户对电子设备的操作行为,电子设备的响应行为,以及电子设备自主行为等。电子设备发生的行为例如打开画图应用、删除“工作分析”文件、移动“邮件”图标至坐标点(*,*)等等。
如果服务器具体为云服务器,则云服务器通过网络向电子设备请求行为列表,进而接收电子设备发送的行为列表。如果服务器具体为电子设备本身,那么电子设备从自身存储空间中读取行为列表即可。
然后,在S102中,基于行为列表,提取出至少一个区别特征。
至少一个区别特征可以是服务器中的缺省的特征,例如点击键盘的速度、敲击鼠标的速度、以及使用专业工程应用等。可选的,如果服务器具体为电子设备自身,至少一个区别特征也可以是从由云服务器发送的。或者,可选的,如果服务器具体为云服务器,为获得至少一个区别特征,云服务器基于多个电子设备的行为列表记录的行为进行训练,进而提取出至少一个区别特征。
具体来讲,云服务器在训练前缺省设置有多个初始分类,例如男、女、0-10岁、11-20岁、21-30岁和/或多个职业等,本申请不做具体限制。基于云服务器从多个电子设备中获得的多个行为列表中的大量行为进行训练。具体来讲,基于每个电子设备的行为列表计算出对应的电子设备属于每类的概率。
在具体实现过中,云服务器与大量电子设备连接,每个行为列表中也包括多条行为。为了方便说明,仅以3个电子设备为例来说明。假设基于第1个电子设备的行为列表中全部行为进行计算,确定第1个电子设备属于男性的概率为98%,属于女性的概率为2%,属于31-30岁的概率95%,属于11-20岁的概率为4%。基于第2个电子设备的行为列表,确定第2个电子设备属于男性的概率为98%,属于女性的概率为2%,属于31-30岁的概率90%、属于11-20岁的概率为10%。基于第3个电子设备的行为列表,确定第3个电子设备属于男性的概率为50%,属于女性的概率为50%,属于31-30岁的概率50%、属于11-20岁的概率为50%。
然后,判断电子设备最大概率是否达到第二阈值。如果达到第二阈值,则将该电子设备的行为列表保留为训练数据;如果最大概率未达到第二阈值,则后续训练舍去该电子设备的行为列表。其中,第二阈值为(0,100%]中的任意值,且第二阈值越接近100%,准确率越高。
沿用上文中3个电子设备的例子,并假设第二阈值为95%。第1个电子设备最大概率为98%,98%大于第二阈值95%,所以,保留第1个电子设备的行为列表。第2个电子设备最大概率为98%,大于95%,所以也保留第2个电子设备的行为列表。第3个电子设备最大概率为50%,小于95%,所以,后续训练时舍去第3个电子设备的行为列表。
具体来讲,如果电子设备最大概率小于第二阈值,容易理解电子设备属于各个分类的概率是比较均衡的。那么表明此时电子设备的行为列表并没有明显偏向于某一个分类,换言之,该行为列表对后续训练提取区别特征导向性不强,所以,后续训练舍去最大概率小于第二阈值的行为列表。
接下来,基于所有保留下来的行为列表,以及各个电子设备属于每个分类的概率,计算出每个分类之间区别度最高的特征,以及互斥特征。例如计算出11-20岁敲击键盘的速度明显高于其他年龄层,则11-20岁分类的区别特征为敲击键盘的速度高于第三阈值。互斥特征例如使用看图识字软件的用户基本不会使用专业工程软件,或者使用百度搜索的用户基本不会使用谷歌搜索等。
经过上述计算,云服务器就基于大量行为提取出了每个分类之间区别度最高的特征和互斥特征,进而将每个分类之间区别度最高的特征和互斥特征作为至少一个区别特征。
获得至少一个区别特征后,接下来执行S103,即基于至少一个区别特征和行为列表,确定电子设备的用户数量。在本申请实施例中,S103可以包括如下过程:
基于所述至少一个区别特征和所述行为列表中的每条行为的属性,获得至少一个集合;
确定所述至少一个集合的数量为所述用户数量。
具体来讲,由于区别特征表示的一个分类区别于其他分类的行为特征,所以,服务器基于至少一个区别特征对电子设备的行为列表进行划分,从而将属性与区别特征匹配的行为划分一个集合,最终获得至少一个集合。
举例来说,假设电子设备的行为列表中包括100条行为,第1-50条行为是针对具体为购物应用的操作,例如打开购物应用、提交订单、支付订单等。第51-100条行为是针对游戏应用的操作,例如打开游戏应用、购买道具等。至少一个区别特征具体为“与购物应用相关”和“与游戏应用相关”两个区别特征。所以,基于“与购物应用相关”和“与游戏应用相关”两个区别特征,以及行为列表中的100条行为,可以获得两个集合:一个集合包含第1-50条行为,另一集合包含第51-100条行为。
由于每个集合中的行为属性具有相同的区别特征,而区别特征可以将不同集合中的行为对应于不同分类,所以,服务器最终所获得的集合数量可以表示用户数量。例如在上述举例中服务器共获得了两个集合,所以确定出该电子设备的用户数量为2。可以看出,使用该电子设备的2个用户,一个用户喜欢使用购物应用进行购物,较强对应于女性分类,另一个用户则喜欢在电子设备上玩游戏,较强对应于男性分类。
当服务器具体为电子设备时,电子设备执行S103时,具体就是基于至少一个区别特征和自身的行为列表获得至少一个集合,进而确定用户数量。而当服务器具体为云服务器的时候,云服务器将确定每个电子设备的用户数量。本领域技术人员应当理解,虽然云服务器在训练中舍去了部分电子设备的行为列表,但是在确定用户数量时,对于舍去的行为列表仍然要执行相对的实施方式确定用户数量。
为了更加清楚地说明如何获得至少一个集合,下面将列举两种具体实现方式。在具体实现过程中,包括但不限于以下两种。
第一种:
获取所述行为列表中一条行为的属性;
判断是否存在与所述属性对应的第一集合;
若所述第一集合不存在,则基于所述属性建立第一集合;或者
若所述第一集合存在,则判断所述第一集合以及所述属性对应的第一拟合度是否满足第一预设条件;
当所述第一集合和所述第一拟合度不满足所述第一预设条件时,获得一个集合,所述集合包括满足第二预设条件的行为。
具体来讲,服务器按照行为列表的顺序,依次获取每条行为,并对每条行为执行相同的过程。为了方便说明,下面以行为列表中多条行为记录中的任意一条为例来说明。
首先,获取行为列表中的一条行为的属性。为了方便说明,下面将称该条行为本条行为。然后计算出本体行为的属性与至少一个特征中的每个特征的拟合度。值最大的拟合度所对应的特征作为第一特征,且将第一特征对应的拟合度作为第一拟合度。接着,判断是否存在与本条行为的属性对应的第一集合,具体就是对第一特征对应的集合。
如果第一集合不存在,则基于本条行为的属性建立第一集合。
如果第一集合存在,接下来,判断第一集合以及第一拟合度是否满足第一预设条件。在本申请实施例中,第一预设条件为第一集合与第二集合为同一集合,并且第一拟合度大于第四阈值。其中,本条行为的前一条行为的属性,以及前一条行为之前所有行为的属性属于第二集合。第四阈值例如为70%或60%等,本申请不做具体限制。
当第一集合和第一拟合度满足第一预设条件时,也即第一集合和第二集合为同一集合,并且第一拟合度大于第四阈值时,如果本体行为之后没有下一条行为了,则结束,将当前参与计算的多条行为包含在一个集合中,最终获得至少一个集合;如果本体行为之后还有下一条行为,则获取下一条行为,重复执行上述过程,直到结束。
当第一集合和第一拟合度不满足第一预设条件时,也即第一集合和第二集合不为同一集合,和/或第一拟合度不大于第四阈值时,将满足第二预设条件的行为作为一个集合。具体来讲,第二预设条件为自身与第一集合的拟合度不低于自身前一条行为与第一集合拟合度。
如果在获得一个集合后,本条行为之后不存在下一条行为了,则结束;如果存在下一条行为,则获取下一条行为的属性,并将下一条行为作为本条行为,重复执行上述过程,直到结束。其中,将下一条行为作为本条行为后,不满足第二预设条件的行为作为本条行为之前的行为。
最后,重复上述过程,在结束时就可以获得至少一个集合。
为了对上述获得至少一个集合的过程更加清楚地说明,下面列举一具体例子来说明。由于在具体实现过载中,行为列表中可能包括大量行为,为了在本申请实施例中方便说明,假设行为列表仅包括10条行为来说明。
为了方便计算,初始时,将第1条行为和第2条行为作为集合A中的两条行为。
获得第3条行为,计算第1至3条行为与至少一个区别特征的拟合度。计算得到,第1至3条行为与特征a的拟合度值75%最大,则特征a为第一特征。令第1至3条行为与特征a的拟合度为与集合A的拟合度,记为N3。
获取第4条行为,通过计算,确定第1至4条行为与特征a拟合度80%最高,进而确定第1至4条行为属于集合A,且第1至4条行为的拟合度记为N4。
通过判断,确定第1至4条行为与第1至3条行为属于同一集合,且N4大于第四阈值70%。所以,获取第5条行为。
通过计算,确定第1至5条行为与特征b拟合度80%最高,进而确定第1至5条行为属于集合B,且第1至5条行为的拟合度记为N5。其中,本申请实施例以集合A和集合B表示两个不同的集合,并不表示集合A和集合B具体对应哪个分类。
通过判断,确定第1至5条行为与第1至4条行为属于不同集合,N5大于70%。此时,将N5之前拟合度大于等于上一个拟合度的行为作为一个集合。可见,N4≥N3,即第4条行为的拟合度N4大于等于上一个拟合度N3,所以将第3条行为作为一个集合。在具体实现过程中,初始计算时第1条行为和第2条行为作为初始连续行为,可以与第3条行为共同作为一个集合,也可以不与第3条行为作为一个集合,本申请不做具体限制。在本申请实施例中,将第1条行为、第2条行为与第3条行为一起作为一个集合。
接下来,获取第6条行为,并计算出第4、5和6条行为属于集合C,以及第4、5和6条行为的拟合度N6=80%。
获取第7条行为,并计算出第4、5、6和7条行为属于集合C,以及第4至7条行为的拟合度N7=85%。
由于第4、5和6条行为以及第4至7条行为都属于集合C,且N7>70%,所以获得第8条行为。
通过计算,确定第4至8条行为属于集合C,以及拟合度N8=83%。第4至8条行为和第4至7条行为均属于集合C,N8>70%,所以获取第9条行为。
通过计算,确定第4至9条行为属于集合C,以及拟合度N9=90%。第4至9条行为和第4至8条行为都属于集合C,N9>70%,所以获取第10条行为。
通过计算,确定第4至10条行为属于集合C,以及拟合度N10=95%。第4至10条行为和第4至9条行为属于集合C,N10>70%。由于第10条行为之后没有下一条行为了,所以,将第4至10条行为作为一个集合。最终获得两个集合。
第二种:
基于所述每条行为的属性,计算所述每条行为的拟合度;
计算所述每条行为的拟合度与其他行为的拟合度之间的距离;
将满足第三预设条件的所述距离对应的至少两条行为的属性作为一个集合,共获得所述至少一个集合。
具体来讲,首先服务器计算每条行为与至少一个区别特征中每个特征的拟合度,然后将值最大的拟合度作为该条行为的拟合度。例如至少一个区别特征具体为特征a、特征b和特征c,第1条行为与特征a的拟合度为78%,与特征b的拟合度为10%,与特征c的拟合度为90%,则确定第1条行为的拟合度为90%。
然后,计算每条行为与其他行为的拟合度之间的距离。最后,将满足第三预设条件的距离对应的至少两条行为的属性作为一个集合。具体来讲,第三预设条件为距离小于第五阈值,第五阈值由本申请所属领域的技术人员任意设置,第五阈值越小准确度越高。
如果至少两条行为之间的距离小于第五阈值,则表示这两条行为的属性相同或接近的行为,进而表示该至少两条很有可能是同一个用户的行为,所以,将该至少两个条行为的属性聚合为一个集合。换言之,第二种实现方式是将距离接近的至少两条行为的属性聚合为一个集合,进而获得至少一个集合。具体实现过程中,相同的思路也可以运用于集合间。可以通过判断两个集合间的拟合度,当所述两个集合间的拟合度符合某个预设阈值时,将该两个集合合并为一个集合,进而获得至少一个集合。
举例来说,假设通过上述过程获得一个月内一电子设备行为的61个集合,分别为上午的30个集合都属于25-30岁的男性,下午的30个集合都属于20-25岁的女性,晚上的一个集合属于50-60岁的女性。通过判断两个集合间的拟合度对集合进行合并,则得到这个设备行为中49%的行为属于25-30岁的男性,49%的行为属于20-25岁的女性,2%的行为属于50-60岁的女性,根据阈值丢弃2%的行为,则此设备被2个人使用,一个为25-30岁的男性,一个为20-25岁的女性。进而,服务器根据上述两个集合所属的分类,向该个电子设备推荐与25-30岁的男性分类和20-25岁的女性分类相关的推荐内容。
在具体实现过程中,如果有一条或多条行为的属性与其他行为距离都比较远,可以舍去该一条或多条行为。
在具体实现过程中,本申请所属领域的普通技术人员可以选择上述两种实现方式中的任意一种,或者按照其他方式获得至少一个集合,本申请不做具体限制。
可选的,若服务器在获得至少一个集合后,希望可以向不同的用户进行不同的推荐,则可以进一步确定每个集合所属的分类,进而对不同用户推荐不同的内容,本申请不做具体限制。
具体来讲,服务器对一个集合中所有行为进行计算,获得该集合与每个分类的拟合度。然后,确定最高拟合度对应的分类为该集合的分类,并将与该拟合度作为最终拟合度。以同样的方式获得每个集合所属的分类以及拟合度。进而,汇总所有集合的分类,对电子设备进行推荐。
举例来说,假设通过上述过程获得一电子设备行为的3个集合。第一个集合与男性分类的拟合度为70%,与女性分类的拟合度为20%,与儿童分类的拟合度为10%。可见,第一个集合与男性分类的拟合度最高,所以确定第一个集合所属分类为男性分类,并确定第一个集合的拟合度为70%。以类似的方式确定第二个集合所属分类为女性分类,拟合度为60%,第三个集合所属分类为儿童分类,拟合度为90%。进而,服务器根据上述三个集合所属的分类,向该个电子设备推荐与男性分类、女性分类和儿童分类相关的推荐内容。
可选的,无论在具体实现过程中选择第一种实现方式或第二种实现方式获得至少一个集合,在确定至少一个集合的数量为用户数量后,还可以包括:
计算所述至少一个集合中每个集合包括的至少一条行为与所述行为列表的多条行为的比例;
确定所述比例高于等于第一阈值的集合为有效集合;
确定所述有效集合的数量为所述用户数量。
具体来讲,首先计算每个集合中包括的至少一条行为与行为列表中全部行为的比例。沿用上文中的例子来说,所获得的至少一个集合具体为2个,第1至3条行为属于第一个集合,第4至10条行为属于第二个集合。所以,第一个集合包括的行为与全部行为的比例就是3/10,即30%。第二集合包括的行为与全部行为的比例就是7/10,即70%。
再列举一个例子来说,假设行为列表中包括1000条行为,至少一个集合具体为3个集合。集合No.1包括600条行为,与全部行为的比例为60%;集合No.2包括390条行为,与全部行为的比例为39%;集合No.3包括10条行为,与全部行为的比例为1%。
当集合的比例过低时,表示在电子设备的使用过程中,产生该集合的用户可能只是偶然使用电子设备,例如用户将电子设备暂借他人打电话等。所以,比例过低的集合不应当代表电子设备一个用户。所以,在本申请实施例中,将确定比例高于等于第一阈值的集合为有效集合,进而将有效集合的数量作为用户数量。其中,第一阈值例如为30%,0.4等,本申请所属领域的普通技术人员可以根据实际进行设置,本申请不做具体限制。
沿用上文中的两个例子来说,且设置第一阈值均为30%。行为列表中共有10条行为,第一个集合的比例为30%,第二个集合的比例为70%。两个集合均大于或等于第一阈值30%,所以两个集合都是有效集合,进而确定出的电子设备的用户数量为2。
第二个例子,行为列表中包括1000条行为,集合No.1的比例为60%,集合No.2的比例为39%,集合No.3的比例为1%。可见,集合No.1的比例60%高于30%,集合No.2的比例39%也高于30%,所以集合No.1和集合No.2都是有效集合。然而,集合No.3的比例仅有1%,小于30%,所以集合No.3并不是有效集合。因此该电子设备的用户数量为2。
由上述描述可以看出,通过计算每个集合的比例,舍去比例较小的集合,所以确定用户数量时,就不会将产生行为少,也即不常使用电子设备的用户计算在内。因此,提高了确定用户数量的准确性。
另外,除了上述过滤比例较低的用户来提高准确性,本申请实施例还提供了第二种提供准确性的方式。
具体来讲,首先,判断一个集合的前一个集合和后一个集合是否属于相同分类。如果前一个集合和后一个集合属于相同分类,则进一步判断该集合所包括的行为数量是否小于第六阈值。如果该集合的数量小于第六阈值,则确认该集合为无效集合。最终将有效集合的数量作为用户数量。
具体来讲,在第二种实现方式中,按照行为的时间排列集合的顺序。换言之,前一个集合中所有行为的时间早于后一个集合所有行为的时间。例如第一个集合包括1月1日至1月3日的行为,第二个集合包括1月4日的行为,第三个集合包括1月5日至2月1日的行为。
第六阈值例如为10、15或12等,本申请所属领域的普通技术人员可以根据实际进行设置,本申请不做具体限制。
如果一个集合处于两个属于相同分类的集合中间,且该集合仅包括较少数量的行为,则表示在电子设备的使用过程中,产生该集合的用户只是偶然发生了不属于相同分类的行为,并不能因此判定为一个用户;或者只是有其它用户偶然使用电子设备,而该集合的行为前后均由电子设备的用户使用,例如用户暂停游戏将电子设备暂借他人打电话,归还后继续游戏。所以,处于两个相同分类集合中间,且所包括的行为数量较少的集合不应当代表电子设备一个用户。
举例来说,假设电子设备的行为列表中包括100条行为,第1-50条行为是针对购物应用的操作。第51-60条行为是针对游戏应用的操作。第61-100条行为也是针对购物应用的操作。服务器基于至少一个区别特征和行为列表,获得3个集合:第1个集合包括第1-50条行为,且通过计算确定第1个集合属于20-35岁女性分类;第2个集合包括第51-60条行为,且通过计算确定第2个集合属于10-20岁男性分类;第3个集合包括第61-100条行为,且通过计算确定第3个集合也属于20-35岁女性分类。
上述3个集合,由于只有第2个集合的前后都有集合,所以对第2个集合进行判断。在具体实现过程中,如果获得的集合数量大于3,则以类似的方式判断即可,本申请不在具体赘述。对于第2个集合,前一个集合(也即第1个集合)以及后一个集合(也即第3个集合)均属于20-35岁女性分类。所以,进一步判断第2个集合包括的行为数量是否小于第六阈值。本申请实施例中,假设第六阈值为15。第2个集合包括10条行为,行为数量小于第六阈值。所以,确定第2个集合为无效集合,所以第1个集合和第3个集合为有效集合。
服务器可以将有效集合的数量作为用户数量。较佳地,由于无效集合的前一个集合和后一个集合属于相同分类,所以服务器可以将无效集合的前一个集合和后一个集合合并为一个有效集合,也即将无效集合的前一个集合和后一个集合作为一个用户的行为。最后,将有效集合的数量作为用户数量。
基于与前述实施例中信息处理方法同样的发明构思,本申请第二方面还提供一种服务器,如图2所示,包括:
获得单元201,用于获得一电子设备的行为列表;所述行为列表记录所述电子设备发生的行为;
提取单元202,用于基于所述行为列表,提取出至少一个区别特征;
确定单元203,用于基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量。
具体来讲,所述确定单元203用于基于所述至少一个区别特征和所述行为列表中的每条行为的属性,获得至少一个集合;确定所述至少一个集合的数量为所述用户数量。
在本申请实施中,确定单元203获得至少一个集合时,所述确定单元203用于获取所述行为列表中一条行为的属性;判断是否存在与所述属性对应的第一集合;若所述第一集合不存在,则基于所述属性建立第一集合;或者若所述第一集合存在,则判断所述第一集合以及所述属性对应的第一拟合度是否满足第一预设条件;当所述第一集合和所述第一拟合度不满足所述第一预设条件时,获得一个集合,所述集合包括满足第二预设条件的行为。
或者,所述确定单元203用于基于所述每条行为的属性,计算所述每条行为的拟合度;计算所述每条行为的拟合度与其他行为的拟合度之间的距离;将满足第三预设条件的所述距离对应的至少两条行为的属性作为一个集合,共获得所述至少一个集合。
进一步,为了提高用户数量的准确性,所述确定单元203用于计算所述至少一个集合中每个集合包括的至少一条行为与所述行为列表的多条行为的比例;确定所述比例高于等于第一阈值的集合为有效集合;确定所述有效集合的数量为所述用户数量。
前述图1实施例中的信息处理方法的各种变化方式和具体实例同样适用于本实施例的服务器,通过前述对信息处理方法的详细描述,本领域技术人员可以清楚的知道本实施例中服务器的实施方法,所以为了说明书的简洁,在此不再详述。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
在本申请实施例的技术方案中,获得一电子设备的行为列表,然后基于行为列表,提取出至少一个区别特征,进而基于至少一个区别特征和行为列表,确定电子设备的用户数量。所以,解决了现有技术存在的将电子设备的全部行为默认为一个用户的行为的技术问题,实现了根据行为确定出电子设备被多少用户使用过,即确定用户数量的技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
具体来讲,本申请实施例中的一种信息处理方法对应的计算机程序指令可以被存储在光盘,硬盘,U盘等存储介质上,当存储介质中的与第一种信息处理方法对应的计算机程序指令被一电子设备读取或被执行时,包括如下步骤:
获得一电子设备的行为列表;所述行为列表记录所述电子设备发生的行为;
基于所述行为列表,提取出至少一个区别特征;
基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量。
可选的,所述存储介质中存储的与步骤基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量,对应的计算机指令在具体被执行过程中,具体包括如下步骤:
基于所述至少一个区别特征和所述行为列表中的每条行为的属性,获得至少一个集合;
确定所述至少一个集合的数量为所述用户数量。
可选的,所述存储介质中存储的与步骤获得至少一个集合,对应的计算机指令在具体被执行过程中,具体包括如下步骤:
获取所述行为列表中一条行为的属性;
判断是否存在与所述属性对应的第一集合;
若所述第一集合不存在,则基于所述属性建立第一集合;或者
若所述第一集合存在,则判断所述第一集合以及所述属性对应的第一拟合度是否满足第一预设条件;
当所述第一集合和所述第一拟合度不满足所述第一预设条件时,获得一个集合,所述集合包括满足第二预设条件的行为。
可选的,所述存储介质中存储的与步骤获得至少一个集合,对应的计算机指令在具体被执行过程中,具体包括如下步骤:
基于所述每条行为的属性,计算所述每条行为的拟合度;
计算所述每条行为的拟合度与其他行为的拟合度之间的距离;
将满足第三预设条件的所述距离对应的至少两条行为的属性作为一个集合,共获得所述至少一个集合。
可选的,所述存储介质中存储的与步骤确定所述至少一个集合的数量为所述用户数量,对应的计算机指令在具体被执行过程中,具体包括如下步骤:
计算所述至少一个集合中每个集合包括的至少一条行为与所述行为列表的多条行为的比例;
确定所述比例高于等于第一阈值的集合为有效集合;
确定所述有效集合的数量为所述用户数量。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.一种信息处理方法,包括:
获得一电子设备的行为列表;所述行为列表记录所述电子设备发生的行为;
基于所述行为列表,提取出至少一个区别特征;
基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量,包括:
基于所述至少一个区别特征和所述行为列表中的每条行为的属性,获得至少一个集合;
确定所述至少一个集合的数量为所述用户数量;其中,
获得至少一个集合,包括:
获取所述行为列表中一条行为的属性;
判断是否存在与所述属性对应的第一集合;
若所述第一集合不存在,则基于所述属性建立第一集合;或者
若所述第一集合存在,则判断所述第一集合以及所述属性对应的第一拟合度是否满足第一预设条件;
当所述第一集合和所述第一拟合度不满足所述第一预设条件时,获得一个集合,所述集合包括满足第二预设条件的行为;其中,
所述区别特征为电子设备的每个分类之间区别度最高的特征和互斥特征。
2.一种信息处理方法,包括:
获得一电子设备的行为列表;所述行为列表记录所述电子设备发生的行为;
基于所述行为列表,提取出至少一个区别特征;
基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量,包括:
基于所述至少一个区别特征和所述行为列表中的每条行为的属性,获得至少一个集合;
确定所述至少一个集合的数量为所述用户数量;其中,
获得至少一个集合,包括:
基于所述每条行为的属性,计算所述每条行为的拟合度;
计算所述每条行为的拟合度与其他行为的拟合度之间的距离;
将满足第三预设条件的所述距离对应的至少两条行为的属性作为一个集合,共获得所述至少一个集合;其中,
所述区别特征为电子设备的每个分类之间区别度最高的特征和互斥特征。
3.如权利要求1或2所述的方法,其特征在于,确定所述至少一个集合的数量为所述用户数量,包括:
计算所述至少一个集合中每个集合包括的至少一条行为与所述行为列表的多条行为的比例;
确定所述比例高于等于第一阈值的集合为有效集合;
确定所述有效集合的数量为所述用户数量。
4.一种服务器,包括:
获得单元,用于获得一电子设备的行为列表;所述行为列表记录所述电子设备发生的行为;
提取单元,用于基于所述行为列表,提取出至少一个区别特征;
确定单元,用于基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量;其中,
所述确定单元用于基于所述至少一个区别特征和所述行为列表中的每条行为的属性,获得至少一个集合;确定所述至少一个集合的数量为所述用户数量;其中,
所述确定单元用于获取所述行为列表中一条行为的属性;判断是否存在与所述属性对应的第一集合;若所述第一集合不存在,则基于所述属性建立第一集合;或者若所述第一集合存在,则判断所述第一集合以及所述属性对应的第一拟合度是否满足第一预设条件;当所述第一集合和所述第一拟合度不满足所述第一预设条件时,获得一个集合,所述集合包括满足第二预设条件的行为;其中,
所述区别特征为电子设备的每个分类之间区别度最高的特征和互斥特征。
5.一种服务器,包括:
获得单元,用于获得一电子设备的行为列表;所述行为列表记录所述电子设备发生的行为;
提取单元,用于基于所述行为列表,提取出至少一个区别特征;
确定单元,用于基于所述至少一个区别特征和所述行为列表,确定所述电子设备的用户数量;其中,
所述确定单元用于基于所述至少一个区别特征和所述行为列表中的每条行为的属性,获得至少一个集合;确定所述至少一个集合的数量为所述用户数量;其中,
所述确定单元用于基于所述每条行为的属性,计算所述每条行为的拟合度;计算所述每条行为的拟合度与其他行为的拟合度之间的距离;将满足第三预设条件的所述距离对应的至少两条行为的属性作为一个集合,共获得所述至少一个集合;其中,
所述区别特征为电子设备的每个分类之间区别度最高的特征和互斥特征。
6.如权利要求4或5所述的服务器,其特征在于,所述确定单元用于计算所述至少一个集合中每个集合包括的至少一条行为与所述行为列表的多条行为的比例;确定所述比例高于等于第一阈值的集合为有效集合;确定所述有效集合的数量为所述用户数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511032497.6A CN105608352B (zh) | 2015-12-31 | 2015-12-31 | 一种信息处理方法和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201511032497.6A CN105608352B (zh) | 2015-12-31 | 2015-12-31 | 一种信息处理方法和服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105608352A CN105608352A (zh) | 2016-05-25 |
CN105608352B true CN105608352B (zh) | 2019-06-25 |
Family
ID=55988281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201511032497.6A Active CN105608352B (zh) | 2015-12-31 | 2015-12-31 | 一种信息处理方法和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105608352B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102265649A (zh) * | 2008-12-26 | 2011-11-30 | 微软公司 | 用户自适应推荐的移动内容 |
CN102428467A (zh) * | 2009-04-08 | 2012-04-25 | 谷歌公司 | 用于分类的基于相似度的特征集补充 |
CN104268171A (zh) * | 2014-09-11 | 2015-01-07 | 东北大学 | 基于活动相似和社交信任的社交网好友推荐系统及方法 |
CN104318136A (zh) * | 2014-09-29 | 2015-01-28 | 同济大学 | 用户键盘按键行为模式建模与分析系统及其身份识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101616101B (zh) * | 2008-06-26 | 2012-01-18 | 阿里巴巴集团控股有限公司 | 一种用户信息过滤方法及装置 |
CN104239416A (zh) * | 2014-08-19 | 2014-12-24 | 北京奇艺世纪科技有限公司 | 一种用户识别方法和系统 |
-
2015
- 2015-12-31 CN CN201511032497.6A patent/CN105608352B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102265649A (zh) * | 2008-12-26 | 2011-11-30 | 微软公司 | 用户自适应推荐的移动内容 |
CN102428467A (zh) * | 2009-04-08 | 2012-04-25 | 谷歌公司 | 用于分类的基于相似度的特征集补充 |
CN104268171A (zh) * | 2014-09-11 | 2015-01-07 | 东北大学 | 基于活动相似和社交信任的社交网好友推荐系统及方法 |
CN104318136A (zh) * | 2014-09-29 | 2015-01-28 | 同济大学 | 用户键盘按键行为模式建模与分析系统及其身份识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105608352A (zh) | 2016-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ahn et al. | A survey on churn analysis in various business domains | |
Fu et al. | User segmentation for retention management in online social games | |
CN104778173B (zh) | 目标用户确定方法、装置及设备 | |
CN110245301A (zh) | 一种推荐方法、装置及存储介质 | |
CN108650558B (zh) | 基于交互视频的视频前情提要的生成方法及装置 | |
CN103647800A (zh) | 推荐应用资源的方法及系统 | |
El-Nasr et al. | Game data science | |
Tan et al. | ECRModel: An elastic collision-based rumor-propagation model in online social networks | |
CN108304853A (zh) | 游戏相关度的获取方法、装置、存储介质和电子装置 | |
CN106390451B (zh) | 对游戏服务器的容量进行测试的方法及装置 | |
CN111860101A (zh) | 一种人脸关键点检测模型的训练方法及装置 | |
CN110503466A (zh) | 一种基于互动活动的消费者人群获取方法及装置 | |
Kaligotla et al. | Diffusion of competing rumours on social media | |
CN113011886B (zh) | 帐号类型的确定方法和装置及电子设备 | |
CN110188123A (zh) | 用户匹配方法及设备 | |
CN104965846A (zh) | MapReduce平台上的虚拟人建立方法 | |
Altshuler et al. | Campaign optimization through behavioral modeling and mobile network analysis | |
CN105608352B (zh) | 一种信息处理方法和服务器 | |
KR20190066179A (ko) | 게임 삭제 기록을 이용한 모바일 게임 추천 시스템 | |
Sarkar et al. | Using a disjoint skill model for game and task difficulty in human computation games | |
CN111354013A (zh) | 目标检测方法及装置、设备和存储介质 | |
CN107491509B (zh) | 一种用户属性信息挖掘方法、装置和介质 | |
CN110209704A (zh) | 用户匹配方法及设备 | |
CN112507214B (zh) | 基于用户名的数据处理方法、装置、设备及介质 | |
Downey | Visualizing a taxonomy for virtual worlds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |