CN112418294A - 确定帐号类别的方法、装置、存储介质及电子装置 - Google Patents

确定帐号类别的方法、装置、存储介质及电子装置 Download PDF

Info

Publication number
CN112418294A
CN112418294A CN202011296419.8A CN202011296419A CN112418294A CN 112418294 A CN112418294 A CN 112418294A CN 202011296419 A CN202011296419 A CN 202011296419A CN 112418294 A CN112418294 A CN 112418294A
Authority
CN
China
Prior art keywords
similarity
account
determining
category
probability distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011296419.8A
Other languages
English (en)
Inventor
毛莉
尹德帅
王守峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Original Assignee
Qingdao Haier Technology Co Ltd
Haier Smart Home Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qingdao Haier Technology Co Ltd, Haier Smart Home Co Ltd filed Critical Qingdao Haier Technology Co Ltd
Priority to CN202011296419.8A priority Critical patent/CN112418294A/zh
Publication of CN112418294A publication Critical patent/CN112418294A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Abstract

本发明实施例提供了一种确定帐号类别的方法、装置、存储介质及电子装置,其中,该方法包括:获取在登录了第一帐号的目标应用中,使用目标应用中包括的至少两个功能的第一概率分布,以及,获取在登录了第二帐号的目标应用中,使用至少两个功能的第二概率分布;基于第一概率分布与第二概率分布确定使用相似度,其中,使用相似度为在登录了第一帐号的目标应用中使用至少两个功能和在登录了第二帐号的目标应用中使用至少两个功能的相似度;基于使用相似度确定第一帐号所属的第一类别,以及第二帐号所属的第二类别。通过本发明,解决了相关技术中存在的无法有效对多样本进行分类,且分类效率低的问题。

Description

确定帐号类别的方法、装置、存储介质及电子装置
技术领域
本发明实施例涉及通信领域,具体而言,涉及一种确定帐号类别的方法、装置、存储介质及电子装置。
背景技术
在相关技术中,常用的分类方法是SVM(Support Vector Mac,支持向量机)算法。SVM算法最初是为二值分类问题设计的,当处理多类问题时,就需要构造合适的多类分类器。
目前,构造SVM多类分类器的方法主要有两类,即,直接法和间接法,但是,当样本的类别比较多的时候,这两种方法的工作量非常大,总计算时间和测试时长都很长,无法在较短的时间内实现分类。
针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种确定帐号类别的方法、装置、存储介质及电子装置,以至少解决相关技术中存在的无法有效对多样本进行分类,且分类效率低的问题。
根据本发明的一个实施例,提供了一种确定帐号类别的方法包括:获取在登录了第一帐号的目标应用中,使用所述目标应用中包括的至少两个功能的第一概率分布,以及,获取在登录了第二帐号的所述目标应用中,使用所述至少两个功能的第二概率分布;基于所述第一概率分布与所述第二概率分布确定使用相似度,其中,所述使用相似度为在登录了所述第一帐号的所述目标应用中使用所述至少两个功能和在登录了所述第二帐号的所述目标应用中使用所述至少两个功能的相似度;基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类别,其中,所述第一类别和所述第二类别相同或不同,相同类别的帐号所对应的使用相似度大于或等于相似度阈值,不同类别的帐号所对应的使用相似度小于所述相似度阈值。
可选地,基于所述第一概率分布与所述第二概率分布确定使用相似度包括:确定所述第一概率分布与所述第二概率分布的目标对数差值的期望;基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度;将所述目标相似度确定为所述使用相似度。
可选地,确定所述第一概率分布与所述第二概率分布的目标对数差值的期望包括:基于如下公式确定所述目标对数差值的期望DKL(p||q):
Figure BDA0002785470570000021
所述第一概率分布、q为所述第二概率分布,N为所述至少两个功能的数量,i为功能的编号且不同的功能对应不同的编号,p(xi)为在登录了所述第一帐号的所述目标应用中使用第i个功能的概率值,q(xi)为在登录了所述第二帐号的所述目标应用中使用第i个功能的概率值。
可选地,基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度之前,所述方法还包括:配置并存储所述对应关系,其中,在所述对应关系中,对数差值的期望越小,对应的相似度越大。
可选地,在基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类别之后,所述方法还包括:在确定所述第一类别和所述第二类别为同一个类别的情况下,在登录了所述第一帐号的所述目标应用和在登录了所述第二帐号的所述目标应用中推送相同的消息;在确定所述第一类别和所述第二类别为不同的类别的情况下,在登录了所述第一帐号的所述目标应用中推送与所述第一类别对应的第一消息,以及,在登录了所述第二帐号的所述目标应用中推送与所述第二类别对应的第二消息,其中,所述第一消息和所述第二消息相同或不同。
根据本发明的另一个实施例,还提供了一种确定帐号类别的装置,包括:获取模块,用于获取在登录了第一帐号的目标应用中,使用所述目标应用中包括的至少两个功能的第一概率分布,以及,获取在登录了第二帐号的所述目标应用中,使用所述至少两个功能的第二概率分布;第一确定模块,用于基于所述第一概率分布与所述第二概率分布确定使用相似度,其中,所述使用相似度为在登录了所述第一帐号的所述目标应用中使用所述至少两个功能和在登录了所述第二帐号的所述目标应用中使用所述至少两个功能的相似度;第二确定模块,用于基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类别,其中,所述第一类别和所述第二类别相同或不同,相同类别的帐号所对应的使用相似度大于或等于相似度阈值,不同类别的帐号所对应的使用相似度小于所述相似度阈值。
可选地,所述第一确定模块包括:第一确定单元,用于确定所述第一概率分布与所述第二概率分布的目标对数差值的期望;第二确定单元,用于基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度;第三确定单元,用于将所述目标相似度确定为所述使用相似度。
可选地,所述第一确定单元包括:确定子单元,用于基于如下公式确定所述目标对数差值的期望DKL(p||q):
Figure BDA0002785470570000031
所述第一概率分布、q为所述第二概率分布,N为所述至少两个功能的数量,i为功能的编号且不同的功能对应不同的编号,p(xi)为在登录了所述第一帐号的所述目标应用中使用第i个功能的概率值,q(xi)为在登录了所述第二帐号的所述目标应用中使用第i个功能的概率值。
根据本发明的另一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
根据本发明的另一个实施例,还提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任一项中所述的方法的步骤。
通过本发明,采用基于不同帐号对应的概率分别来确定帐号的使用相似度,进而基于使用相似度来对帐号进行分类,其中,相对于相关技术中的采用SVM算法进行分类而言,采用本发明中的方案可以实现对多样本进行分类,且能够实现在短时间内完成分类的目的,因此,可以解决相关技术中存在的无法有效对多样本进行分类,且分类效率低的问题,达到有效对多样本进行分类,提高分类效率的效果。
附图说明
图1是本发明实施例的一种确定帐号类别的方法的移动终端的硬件结构框图;
图2是根据本发明实施例的确定帐号类别的方法流程图;
图3是根据本发明实施例的确定帐号类别的装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
首先对现有技术进行说明:
目前,构造SVM多类分类器的方法主要有两类:
(1)直接法,即,直接在目标函数上进行修改,将多个分类面的参数求解合并到一个最优化问题中,通过求解该最优化问题“一次性”实现多类分类。这种方法看似简单,但其计算复杂度比较高,实现起来比较困难,只适合用于小型问题中;
(2)间接法,主要是通过组合多个二分类器来实现多分类器的构造,常见的方法有一对一法和一对多法两种,下面分别对两种方法进行说明:
一对多法(one-versus-rest,简称OVR SVMs):
训练时依次把某个类别的样本归为一类,其他剩余的样本归为另一类,这样k个类别的样本就构造出了k个SVM。分类时将未知样本分类为具有最大分类函数值的那类。
假如有四类要划分(也就是4个Label),分别是A、B、C、D。
于是在抽取训练集的时候,分别抽取:
(1)A所对应的向量作为正集,B,C,D所对应的向量作为负集;
(2)B所对应的向量作为正集,A,C,D所对应的向量作为负集;
(3)C所对应的向量作为正集,A,B,D所对应的向量作为负集;
(4)D所对应的向量作为正集,A,B,C所对应的向量作为负集;
使用这四个训练集分别进行训练,然后的得到四个训练结果文件。
在测试的时候,把对应的测试向量分别利用这四个训练结果文件进行测试。最后每个测试都有一个结果f1(x),f2(x),f3(x),f4(x)。于是最终的结果便是这四个值中最大的一个作为分类结果。
一对一法(one-versus-one,简称OVO SVMs或者pairwise):
其做法是在任意两类样本之间设计一个SVM,因此k个类别的样本就需要设计k(k-1)/2个SVM。
当对一个未知样本进行分类时,最后得票最多的类别即为该未知样本的类别。
假设有四类A,B,C,D四类。在训练的时候选择A,B;A,C;A,D;B,C; B,D;C,D所对应的向量作为训练集,然后得到六个训练结果,在测试的时候,把对应的向量分别对六个结果进行测试,然后采取投票形式,最后得到一组结果。
投票:
A=B=C=D=0;
(A,B)-classifier如果是A win,则A=A+1;otherwise,B=B+1;
(A,C)-classifier如果是A win,则A=A+1;otherwise,C=C+1;
...
(C,D)-classifier如果是C win,则C=C+1;otherwise,D=D+1;
The decision is the Max(A,B,C,D)。
需要说明的是,目前SVM算法应用于用户及家庭分类问题中(其中,一个用户或者一个家庭可以使用一个帐号,在对帐号进行分类后实际上就实现了对用户或者家庭进行分类),面对大量的样本数据,代价巨大,成本很高,不能在较短的时间内提供分类结果,为定向服务提供数据支撑。
针对上述问题,本发明提出了一种分类方法,下面对本发明实施例进行说明:
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种确定帐号类别的方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器 102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的确定帐号类别的方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种确定帐号类别的方法,图2是根据本发明实施例的确定帐号类别的方法流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取在登录了第一帐号的目标应用中,使用所述目标应用中包括的至少两个功能的第一概率分布,以及,获取在登录了第二帐号的所述目标应用中,使用所述至少两个功能的第二概率分布;
步骤S204,基于所述第一概率分布与所述第二概率分布确定使用相似度,其中,所述使用相似度为在登录了所述第一帐号的所述目标应用中使用所述至少两个功能和在登录了所述第二帐号的所述目标应用中使用所述至少两个功能的相似度;
步骤S206,基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类,其中,所述第一类别和所述第二类别相同或不同,相同类别的帐号所对应的使用相似度大于或等于相似度阈值,不同类别的帐号所对应的使用相似度小于所述相似度阈值。
其中,上述步骤的执行主体可以为终端或者其他的具备类似处理能力的处理设备等,但不限于此。
在上述实施例中,目标应用中包括有多个可供用户使用的功能,例如,用于控制智能家居设备的APP中可以配置多个用于控制智能家居设备的控制功能,上述第一概率分布和第二概率分布分别指示使用多个功能的概率,其中,上述第一概率分布和第二概率分布是基于多次操作中分别对各个功能的操作次数来确定的,例如,假设APP包含10个功能模块,记录每个用户使用每个功能模块的次数,根据用户使用每个功能的次数,在该用户的多次使用操作(例如,30次,50次,100次等,次数越多,统计的越准确)中,计算出使用所有功能的使用比率,可以得到用户使用某个功能的比率的概率分布,即[0,0.1,0.1,0,0.2,0.1,0.1,0.2,0.1,0.1],使用每个功能的概率都在0~1,且加起来为1。其中,在统计功能的使用次数时,可以通过功能的点击次数来确定功能的使用次数,还可以基于功能的使用时间来确定功能的使用次数,还可以基于功能的使用流量来确定功能的使用次数,等等。此外,需要说明的是,上述实施例仅是以两个帐号分类为例进行说明的,当需要对多个帐号进行分类时,采用类似的方式计算即可,即,当需要对多个帐号进行分类时,两两计算相似度,基于相似度来对多个帐号进行分类,进而实现对多个用户或者家庭进行分类,其中,上述的相似度阈值可以为90%、85%、80%等。
通过上述步骤,采用基于不同帐号对应的概率分别来确定帐号的使用相似度,进而基于使用相似度来对帐号进行分类,其中,相对于相关技术中的采用SVM算法进行分类而言,采用本发明中的方案可以实现对多样本进行分类,且能够实现在短时间内完成分类的目的,因此,可以解决相关技术中存在的无法有效对多样本进行分类,且分类效率低的问题,达到有效对多样本进行分类,提高分类效率的效果。
在一个可选的实施例中,基于所述第一概率分布与所述第二概率分布确定使用相似度包括:确定所述第一概率分布与所述第二概率分布的目标对数差值的期望;基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度;将所述目标相似度确定为所述使用相似度。在本实施例中,可以基于概率分布之间的对数差值的期望值来确定概率分布之间的相似度,在实际应用中,还可以采用其他的确定方式确定概率分布的相似度,采用对数差值的期望值来确定概率分布之间的相似度仅是一种可选的实现方式,并不仅限于此。
在一个可选的实施例中,确定所述第一概率分布与所述第二概率分布的目标对数差值的期望包括:基于如下公式确定所述目标对数差值的期望 DKL(p||q):
Figure DEST_PATH_FDA0002785470560000011
其中,p为所述第一概率分布、q为所述第二概率分布,N为所述至少两个功能的数量,i为功能的编号且不同的功能对应不同的编号,p(xi) 为在登录了所述第一帐号的所述目标应用中使用第i个功能的概率值,q (xi)为在登录了所述第二帐号的所述目标应用中使用第i个功能的概率值。本实施例中所涉及到的技术方式也可以称为K-L散度计算或者相对熵计算,即用第二概率分布来近似第一概率分布,进而得到两个概率分布之间的对数差值的期望。同样的,对于对应其他帐号的概率分别,可以利用相对熵的公式计算出来其他帐号对应的概率分布之间的对数差值的期望。 K-L散度值小的用户或家庭(即,与帐号对应的用户或家庭),拥有更相似的分布,从而可以实现对比K-L散度值来对用户或家庭进行分类。
在一个可选的实施例中,基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度之前,所述方法还包括:配置并存储所述对应关系,其中,在所述对应关系中,对数差值的期望越小,对应的相似度越大。在本实施例中,可以预先配置对数差值的期望与相似度的对应关系,其中,对数差值的期望越小的两个概率分布,相似度越高,因此,需要为取值小的对数差值的期望配置取值大的相似度,具体的对应关系可以灵活设置,只要保证对数差值的期望越小,对应的相似度越大即可。
在一个可选的实施例中,在基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类别之后,所述方法还包括:在确定所述第一类别和所述第二类别为同一个类别的情况下,在登录了所述第一帐号的所述目标应用和在登录了所述第二帐号的所述目标应用中推送相同的消息;在确定所述第一类别和所述第二类别为不同的类别的情况下,在登录了所述第一帐号的所述目标应用中推送与所述第一类别对应的第一消息,以及,在登录了所述第二帐号的所述目标应用中推送与所述第二类别对应的第二消息,其中,所述第一消息和所述第二消息相同或不同。在本实施例中,在完成帐号的分类之后,可以依据分类结果定向对不同类别的帐号(即,用户或家庭)推送不同的服务,从而满足用户的个性化服务需求。
由上述方法实施例可知,本发明可以通过对相对熵算法的研究,通过 Kullback-Leibler Divergence,即K-L散度,判断不同样本概率分布的差异,从而实现对用户及家庭进行分类。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如 ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种确定帐号类别的装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图3是根据本发明实施例的确定帐号类别的装置的结构框图,如图3 所示,该装置包括:
获取模块32,用于获取在登录了第一帐号的目标应用中,使用所述目标应用中包括的至少两个功能的第一概率分布,以及,获取在登录了第二帐号的所述目标应用中,使用所述至少两个功能的第二概率分布;
第一确定模块34,用于基于所述第一概率分布与所述第二概率分布确定使用相似度,其中,所述使用相似度为在登录了所述第一帐号的所述目标应用中使用所述至少两个功能和在登录了所述第二帐号的所述目标应用中使用所述至少两个功能的相似度;
第二确定模块36,用于基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类别,其中,所述第一类别和所述第二类别相同或不同,相同类别的帐号所对应的使用相似度大于或等于相似度阈值,不同类别的帐号所对应的使用相似度小于所述相似度阈值。
在一个可选的实施例中,所述第一确定模块34包括:第一确定单元,用于确定所述第一概率分布与所述第二概率分布的目标对数差值的期望;第二确定单元,用于基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度;第三确定单元,用于将所述目标相似度确定为所述使用相似度。
在一个可选的实施例中,所述第一确定单元包括:确定子单元,用于基于如下公式确定所述目标对数差值的期望DKL(p||q):
Figure 418789DEST_PATH_FDA0002785470560000011
其中,p为所述第一概率分布、q为所述第二概率分布,N为所述至少两个功能的数量,i为功能的编号且不同的功能对应不同的编号,p(xi) 为在登录了所述第一帐号的所述目标应用中使用第i个功能的概率值,q (xi)为在登录了所述第二帐号的所述目标应用中使用第i个功能的概率值。
在一个可选的实施例中,所述装置还用于基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度之前,配置并存储所述对应关系,其中,在所述对应关系中,对数差值的期望越小,对应的相似度越大。
在一个可选的实施例中,所述装置还用于在基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类别之后,在确定所述第一类别和所述第二类别为同一个类别的情况下,在登录了所述第一帐号的所述目标应用和在登录了所述第二帐号的所述目标应用中推送相同的消息;在确定所述第一类别和所述第二类别为不同的类别的情况下,在登录了所述第一帐号的所述目标应用中推送与所述第一类别对应的第一消息,以及,在登录了所述第二帐号的所述目标应用中推送与所述第二类别对应的第二消息,其中,所述第一消息和所述第二消息相同或不同。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被处理器执行时实现上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于: U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器 (Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种确定帐号类别的方法,其特征在于,包括:
获取在登录了第一帐号的目标应用中,使用所述目标应用中包括的至少两个功能的第一概率分布,以及,获取在登录了第二帐号的所述目标应用中,使用所述至少两个功能的第二概率分布;
基于所述第一概率分布与所述第二概率分布确定使用相似度,其中,所述使用相似度为在登录了所述第一帐号的所述目标应用中使用所述至少两个功能和在登录了所述第二帐号的所述目标应用中使用所述至少两个功能的相似度;
基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类别,其中,所述第一类别和所述第二类别相同或不同,相同类别的帐号所对应的使用相似度大于或等于相似度阈值,不同类别的帐号所对应的使用相似度小于所述相似度阈值。
2.根据权利要求1所述的方法,其特征在于,基于所述第一概率分布与所述第二概率分布确定使用相似度包括:
确定所述第一概率分布与所述第二概率分布的目标对数差值的期望;
基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度;
将所述目标相似度确定为所述使用相似度。
3.根据权利要求2所述的方法,其特征在于,确定所述第一概率分布与所述第二概率分布的目标对数差值的期望包括:
基于如下公式确定所述目标对数差值的期望DKL(p||q):
Figure FDA0002785470560000011
其中,p为所述第一概率分布、q为所述第二概率分布,N为所述至少两个功能的数量,i为功能的编号且不同的功能对应不同的编号,p(xi)为在登录了所述第一帐号的所述目标应用中使用第i个功能的概率值,q(xi)为在登录了所述第二帐号的所述目标应用中使用第i个功能的概率值。
4.根据权利要求2所述的方法,其特征在于,基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度之前,所述方法还包括:
配置并存储所述对应关系,其中,在所述对应关系中,对数差值的期望越小,对应的相似度越大。
5.根据权利要求1所述的方法,其特征在于,在基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类别之后,所述方法还包括:
在确定所述第一类别和所述第二类别为同一个类别的情况下,在登录了所述第一帐号的所述目标应用和在登录了所述第二帐号的所述目标应用中推送相同的消息;
在确定所述第一类别和所述第二类别为不同的类别的情况下,在登录了所述第一帐号的所述目标应用中推送与所述第一类别对应的第一消息,以及,在登录了所述第二帐号的所述目标应用中推送与所述第二类别对应的第二消息,其中,所述第一消息和所述第二消息相同或不同。
6.一种确定帐号类别的装置,其特征在于,包括:
获取模块,用于获取在登录了第一帐号的目标应用中,使用所述目标应用中包括的至少两个功能的第一概率分布,以及,获取在登录了第二帐号的所述目标应用中,使用所述至少两个功能的第二概率分布;
第一确定模块,用于基于所述第一概率分布与所述第二概率分布确定使用相似度,其中,所述使用相似度为在登录了所述第一帐号的所述目标应用中使用所述至少两个功能和在登录了所述第二帐号的所述目标应用中使用所述至少两个功能的相似度;
第二确定模块,用于基于所述使用相似度确定所述第一帐号所属的第一类别,以及所述第二帐号所属的第二类别,其中,所述第一类别和所述第二类别相同或不同,相同类别的帐号所对应的使用相似度大于或等于相似度阈值,不同类别的帐号所对应的使用相似度小于所述相似度阈值。
7.根据权利要求6所述的装置,其特征在于,所述第一确定模块包括:
第一确定单元,用于确定所述第一概率分布与所述第二概率分布的目标对数差值的期望;
第二确定单元,用于基于预先确定的对数差值的期望与相似度的对应关系,确定与所述目标对数差值的期望对应的目标相似度;
第三确定单元,用于将所述目标相似度确定为所述使用相似度。
8.根据权利要求7所述的装置,其特征在于,所述第一确定单元包括:
确定子单元,用于基于如下公式确定所述目标对数差值的期望DKL(p||q):
Figure FDA0002785470560000031
其中,p为所述第一概率分布、q为所述第二概率分布,N为所述至少两个功能的数量,i为功能的编号且不同的功能对应不同的编号,p(xi)为在登录了所述第一帐号的所述目标应用中使用第i个功能的概率值,q(xi)为在登录了所述第二帐号的所述目标应用中使用第i个功能的概率值。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至5任一项中所述的方法的步骤。
10.一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至5任一项中所述的方法的步骤。
CN202011296419.8A 2020-11-18 2020-11-18 确定帐号类别的方法、装置、存储介质及电子装置 Pending CN112418294A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011296419.8A CN112418294A (zh) 2020-11-18 2020-11-18 确定帐号类别的方法、装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011296419.8A CN112418294A (zh) 2020-11-18 2020-11-18 确定帐号类别的方法、装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN112418294A true CN112418294A (zh) 2021-02-26

Family

ID=74773484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011296419.8A Pending CN112418294A (zh) 2020-11-18 2020-11-18 确定帐号类别的方法、装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN112418294A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090049555A1 (en) * 2007-08-16 2009-02-19 Seoul National University Industry Foundation Method and system of detecting account sharing based on behavior patterns
CN103455525A (zh) * 2012-06-05 2013-12-18 百度在线网络技术(北京)有限公司 基于用户的搜索推广行为确定推广帐号状态的方法与设备
CN103530339A (zh) * 2013-10-08 2014-01-22 北京百度网讯科技有限公司 移动应用信息推送方法和装置
CN104317784A (zh) * 2014-09-30 2015-01-28 苏州大学 一种跨平台用户识别方法和系统
CN106326371A (zh) * 2016-08-12 2017-01-11 北京奇艺世纪科技有限公司 服务推送方法及装置
CN106339483A (zh) * 2016-08-30 2017-01-18 电子科技大学 一种移动社交网络中的社交活动推荐算法
CN106886518A (zh) * 2015-12-15 2017-06-23 国家计算机网络与信息安全管理中心 一种微博账号分类的方法
CN107341233A (zh) * 2017-07-03 2017-11-10 北京拉勾科技有限公司 一种职位推荐方法及计算设备
CN108009168A (zh) * 2016-10-31 2018-05-08 腾讯科技(深圳)有限公司 用户帐号识别方法及装置
CN110019774A (zh) * 2017-08-23 2019-07-16 腾讯科技(深圳)有限公司 标签分配方法、装置、存储介质及电子装置
CN110347314A (zh) * 2018-04-02 2019-10-18 腾讯科技(深圳)有限公司 一种内容展示方法、装置、存储介质和计算机设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090049555A1 (en) * 2007-08-16 2009-02-19 Seoul National University Industry Foundation Method and system of detecting account sharing based on behavior patterns
CN103455525A (zh) * 2012-06-05 2013-12-18 百度在线网络技术(北京)有限公司 基于用户的搜索推广行为确定推广帐号状态的方法与设备
CN103530339A (zh) * 2013-10-08 2014-01-22 北京百度网讯科技有限公司 移动应用信息推送方法和装置
CN104317784A (zh) * 2014-09-30 2015-01-28 苏州大学 一种跨平台用户识别方法和系统
CN106886518A (zh) * 2015-12-15 2017-06-23 国家计算机网络与信息安全管理中心 一种微博账号分类的方法
CN106326371A (zh) * 2016-08-12 2017-01-11 北京奇艺世纪科技有限公司 服务推送方法及装置
CN106339483A (zh) * 2016-08-30 2017-01-18 电子科技大学 一种移动社交网络中的社交活动推荐算法
CN108009168A (zh) * 2016-10-31 2018-05-08 腾讯科技(深圳)有限公司 用户帐号识别方法及装置
CN107341233A (zh) * 2017-07-03 2017-11-10 北京拉勾科技有限公司 一种职位推荐方法及计算设备
CN110019774A (zh) * 2017-08-23 2019-07-16 腾讯科技(深圳)有限公司 标签分配方法、装置、存储介质及电子装置
CN110347314A (zh) * 2018-04-02 2019-10-18 腾讯科技(深圳)有限公司 一种内容展示方法、装置、存储介质和计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭孝雪: ""微博用户标签推荐算法研究"", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 *

Similar Documents

Publication Publication Date Title
CN109035013B (zh) 检测异常金融交易的设备和方法及计算机可读存储介质
Garg et al. On communication cost of distributed statistical estimation and dimensionality
US20200057958A1 (en) Identification and application of hyperparameters for machine learning
CN112819054B (zh) 一种切片模板配置方法及装置
CN110457704B (zh) 目标字段的确定方法、装置、存储介质及电子装置
CN110609924A (zh) 基于图数据的全量关系计算方法、装置、设备及存储介质
CN109388552B (zh) 启动应用程序的时长的确定方法、装置及存储介质
CN111309946B (zh) 一种已建立档案优化方法及装置
CN112418294A (zh) 确定帐号类别的方法、装置、存储介质及电子装置
Yabas et al. Churn prediction in subscriber management for mobile and wireless communications services
WO2023093255A1 (zh) 聚类集合的确定方法和装置、存储介质及电子装置
CN107784363B (zh) 数据处理方法、装置及系统
CN111274209B (zh) 话单文件处理方法及装置
CN114691875A (zh) 一种数据分类分级处理方法及装置
US20200387811A1 (en) Systems and methods for neighbor frequency aggregation of parametric probability distributions with decision trees
CN114638998A (zh) 模型更新方法、装置、系统及设备
CN111340114A (zh) 图像的匹配方法及装置、存储介质和电子装置
CN112118012A (zh) 译码器迭代次数确定方法及装置
CN113343017B (zh) 图像特征点相似度的确定方法及装置
CN114637896B (zh) 数据的审核方法和装置、存储介质及电子装置
CN110913353A (zh) 短信的分类方法及装置
CN116662415B (zh) 基于数据挖掘的智能匹配方法及系统
CN110532561B (zh) 数据检测方法及装置、存储介质、电子装置
CN115118466B (zh) 一种策略生成方法、装置、电子设备和存储介质
CN110399418B (zh) 数据处理方法及装置、存储介质、电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210226