CN110245310B - 一种对象的行为分析方法、装置及存储介质 - Google Patents
一种对象的行为分析方法、装置及存储介质 Download PDFInfo
- Publication number
- CN110245310B CN110245310B CN201910168808.3A CN201910168808A CN110245310B CN 110245310 B CN110245310 B CN 110245310B CN 201910168808 A CN201910168808 A CN 201910168808A CN 110245310 B CN110245310 B CN 110245310B
- Authority
- CN
- China
- Prior art keywords
- feature
- order
- features
- low
- global
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明实施例公开了一种对象的行为分析方法、装置及存储介质,本发明实施例在获取目标对象的特征数据之后;提取所述特征数据的各阶特征组合,得到全局特征,并对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;然后将所述低阶特征、所述高阶特征以及所述全局特征连接成第一特征向量;最后根据所述第一特征向量确定所述目标对象的行为指标。该方案可以从特征数据中提取多种特征,然后结合多种特征一起对目标对象的行为指标进行预估,在进行对象的行为分析的时候更充分地利用了从特征数据中提取出来的特征,从而提高行为指标预估的准确率。
Description
技术领域
本发明涉及网络技术领域,具体涉及一种对象的行为分析方法、装置及存储介质。
背景技术
点击率(CTR,Click-Through-Rate)是互联网广告、新闻等媒体内容的常用的术语,指媒体内容(广告/新闻/公众号等)的点击到达率,即该媒体内容的实际点击次数除以该媒体内容的展现量;停留时长,是指用户访问媒体内容的平均停留时间;分享率,即该媒体内容的被用户转发分享的次数除以该媒体内容的展现量;点击率、停留时长以及分享率等均是衡量媒体内容是否受用户欢迎的一个重要的行为指标。
然而,现有模型对点击率、停留时长以及分享率等对象的行为分析的准确率较低,有待提高。
发明内容
本发明实施例提供一种对象的行为分析方法、装置及存储介质,可以提高对象的行为分析的准确率。
本发明实施例提供一种对象的行为分析方法,包括:
获取目标对象的特征数据;
提取所述特征数据的各阶特征组合,得到全局特征;
对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;
根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量;
根据所述第一特征向量确定所述目标对象的行为指标。
相应的,本发明实施例还提供一种对象的行为分析装置,包括:
获取单元,用于获取目标对象的特征数据;
提取单元,用于提取所述特征数据的各阶特征组合,得到全局特征;
处理单元,用于对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;
第一确定单元,用于根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量;
第二确定单元,用于根据所述第一特征向量确定所述目标对象的行为指标。
可选的,在一些实施例中,所述提取单元具体用于:
确定所述特征数据的类型数量;
根据所述类型数量以及全局特征提取算法提取所述特征数据的各阶特征组合,得到所述全局特征,其中,所述全局特征提取算法为经过张量分解处理的全局特征提取算法。
可选的,在一些实施例中,所述提取单元还具体用于:
根据所述类型数量以及所述全局特征提取算法确定目标全局特征提取算法;
根据所述目标全局特征提取算法确定所述特征数据的各阶特征组合,得到所述全局特征。
可选的,在一些实施例中,所述提取单元还具体用于:
根据所述目标全局特征提取算法确定各阶特征对应的张量因子;
根据各阶特征对应的张量因子对各阶特征进行组合,得到所述全局特征。
可选的,在一些实施例中,所述第一确定单元具体用于:
对所述低阶特征、所述高阶特征以及所述全局特征进行排列,得到所述低阶特征、所述高阶特征以及所述全局特征的排列位置;
基于所述排列位置将所述低阶特征、所述高阶特征以及所述全局特征组合成所述第一特征向量。
可选的,在一些实施例中,所述处理单元具体用于:
对所述特征数据进行低阶特征交叉处理,得到所述低阶特征;
基于深度神经网络对所述特征数据进行高阶特征提取,得到所述高阶特征。
可选的,在一些实施例中,所述处理单元还具体用于:
确定所述特征数据的类型数量;
根据所述特征数据的类型数量以及低阶特征提取算法对所述特征数据进行低阶特征交叉处理,得到所述低阶特征。
可选的,在一些实施例中,所述第二确定单元包括:
学习子单元,用于基于残差网络的第一全连接网络对所述第一特征向量进行学习,得到全连接特征;
拉取子单元,用于通过所述残差网络的拉取网络拉取所述第一特征向量;
连接子单元,用于通过所述残差网络的特征连接网络将所述第一特征向量以及所述全连接特征连接成第二特征向量;
预估子单元,用于基于所述残差网络的第二全连接网络对所述第二特征向量进行对象的行为分析处理,得到所述目标对象的行为指标。
可选的,在一些实施例中,所述预估子单元具体用于:
基于所述第二全连接网络确定所述第二特征向量的权重;
根据所述权重确定所述目标对象的行为指标。
可选的,在一些实施例中,所述连接子单元具体用于:
通过所述特征连接网络确定所述第一特征向量的第一待连接特征;
通过所述特征连接网络确定所述全连接特征的第二待连接特征;
基于所述第一待连接特征以及所述第二待连接特征将所述第一特征向量与所述全连接特征进行特征连接处理。
可选的,在一些实施例中,所述获取单元包括:
获取子单元,用于获取所述目标对象的原始特征数据;
稀疏子单元,用于对所述原始特征数据进行稀疏处理;
嵌入子单元,用于将稀疏处理后的原始特征数据进行嵌入式处理,得到所述特征数据。
可选的,在一些实施例中,所述第二确定单元具体用于:
根据所述第一特征向量确定所述目标对象的点击率;或,
根据所述第一特征向量确定所述目标对象的停留时长;或,
根据所述第一特征向量确定所述目标对象的分享率。
此外,本发明实施例还提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例提供的任一种对象的行为分析方法中的步骤。
此外,本发明实施例还提供一种网络设备,包括存储器和处理器,所述存储器存储有多条指令,所述处理器用于运行所述存储器内的指令,以执行本发明实施例提供的任一种对象的行为分析方法中的步骤。
本发明实施例在获取目标对象的特征数据之后;提取所述特征数据的各阶特征组合,得到全局特征,并对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;然后根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量;最后根据所述第一特征向量确定所述目标对象的行为指标。该方案可以从特征数据中提取多种特征,然后结合多种特征一起对目标对象的行为指标进行预估,在进行对象的行为分析的时候,即在行为指标的获取的时候,更充分地利用了从特征数据中提取出来的特征,从而提高行为指标预估的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的对象的行为分析方法的场景示意图;
图1b是本发明实施例提供的对象的行为分析网络的一个结构示意图;
图1c是本发明实施例提供的对象的行为分析网络的另一个结构示意图;
图1d是本发明实施例提供的对象的行为分析方法的一个流程示意图;
图1e是本发明实施例提供的MVM模型的张量分解图;
图1f是本发明实施例提供的残差网络的结构示意图;
图2是本发明实施例提供的对象的行为分析方法的另一个流程示意图;
图3a是本发明实施例提供的对象的行为分析方法的另一个流程示意图;
图3b是本发明实施例提供的指标预估方法中终端显示页面的一个示意图;
图4a是本发明实施例提供的对象的行为分析装置的一结构示意图;
图4b是本发明实施例提供的对象的行为分析装置的另一结构示意图;
图5是本发明实施例提供的网络设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种对象的行为分析方法、装置及存储介质,其中,该对象的行为分析装置可以集成在网络设备中,该对象的行为分析装置中集成有对象的行为分析模型,该网络设备可以是服务器,也可以是终端等设备。
本发明实施例提供的对象的行为分析方法可以用于分析对象,例如,通过本发明实施例可以获取对象的行为指标,以便分析对象。在一些实施例中,为了提升行为分析的准确率,可以采用计算机模型来实现本发明实施例提供的行为分析方法等。比如,在一些实施例中可以采用对象的行为分析模型来对对象的行为进行分析等。
在一些实施例中,对象的行为分析模型可以是基于深度学习的模型,该模型可以包括若干特征模块,比如,本发明实施例中的对象的行为分析模型可以包括深度分解模块以及全局特征提取模块,深度分解模块可以用于提取特征数据中的低阶特征以及高阶特征,全局特征提取单元可以用于提取特征数据的全局特征。
在一些实施例中,为了提升行为分析的准确率,深度分解模块可以包括深度分解机(deepFM,Deep Factorization Machines),其中,deepFM可以包含两部分:深度神经网络(DNN,Deep Neural Networks)部分和因子分解机(FM,Factorization Machines)部分,DNN是深度学习算法,可以学习到抽象的高阶特征;FM可以学习到低阶特征。
在一些实施例中,全局特征提取模块可以为多视点机(MVM,Multi-viewMachines),MVM是一种传统的机器学习算法,可以实现任意阶特征的交叉,即可以学习到高阶特征也可以学习到低阶特征。
在一些实施例中,对象的行为分析模型可以将MVM融入deepFM的网络结构中,使得该网络结构学习到多种特征组合,提高对象的行为分析的准确率,如下:
参见图1a,该集成了对象的行为分析装置的网络设备在获取到目标对象(例如广告、新闻或公众号等)的特征数据(例如广告属性、人群属性及历史行为等)之后,将会根据对象的行为分析模型中FM层对该特征数据进行低阶特征提取,根据DNN层进行抽象的高阶特征提取,并根据MVM层进行全局特征提取(包括可理解的低阶特征以及高阶特征),然后,连接层再将提取到的低阶特征提取、高阶特征以及全局特征连接成特征向量,最后模型的输出层根据该特征向量确定目标对象的行为指标。
其中,本发明实施例中的对象的行为分析模型,具体结构如下:
如图1b所示,在一些实施例中,本发明实施例中的对象的行为分析模型包括稀疏层(Sparse Features)、嵌入层(Dense Embedding)、FM层、DNN层、MVM层、连接层以及输出层,其中,FM层、DNN层、MVM层为并列结构。
具体地,该稀疏层用于将获取到的原始特征数据转换为数值向量,使得无序特征变为有序特征,得到稀疏的特征数据,嵌入层用于将稀疏的特征数据变稠密,即将代表同一类的特征,放到同一个特征类别(field)中,得到处理后的特征数据,然后FM层、DNN层、MVM层分别对该处理后的特征数据进行特征提取,其中,FM层根据该处理后的特征数据进行低阶特征交叉处理,得到低阶特征,FM层对训练二阶特征学习得比较充分,DNN层对该处理后的特征数据进行高阶特征提取,MVM对该处理后的特征数据进行全局特征交叉处理,得到全局特征,其中,全局特征中包含低阶特征以及高阶特征,但该低阶特征以及高阶特征与FM即DNN中提取到的低级特征以及高阶特征所包含的信息时不同的,所以结合这几个特征组合可以提取到特征数据中更多的特征信息。
根据上述FM层、DNN层、MVM层分别得到低阶特征、高阶特征以及全局特征之后,为了避免信息损失,还需要通过连接层将低阶特征、高阶特征以及全局特征组合(连接)成长特征向量(例如第一特征向量),再输入输出层中的全连接层,全连接层根据该长特征向量确定目标对象的行为指标,其中,本发明可以在输出层之外通过连接层对各个模块输出的特征组合进行连接,也可以在输出层里面对特征组合进行连接,只需要在输入全连接层之前对特征组合进行连接即可。
在一些实施例中,本发明实施例中还提供另一种对象的行为分析模型的结构,如图1c所示,包括稀疏层、嵌入层、FM层、DNN层、MVM层、第一连接层以及残差网络结构,其中,该残差网络结构包括第一全连接层(第一全连接层可以包含多个第一全连接网络)、拉取层(拉取网络)、第二连接层(此时图1b对应的连接层为第一连接层)以及第二全连接层(第二全连接网络),其中,第一全连接层用于对第一连接层输出的第一特征向量进行进一步学习,提取更高阶的特征,得到全连接特征,第一全连接层可以有一个或多个;拉取层用于拉取第一特征向量,使得第二连接层可以连接第一特征向量以及全连接特征,得到第二特征向量;第二全连接层用于根据第二特征向量确定目标对象的行为指标。
该模型与图1b所示的模型的区别在于,图1c所示的模型在图1b所示的模型的基础上,在输出层增加了残差网络。
需要说明的是,本发明实施例中的对象的行为分析模型不仅可以用于预估点击率,还可以预估用户的停留时长、分享率等其他行为指标,对象的行为分析模型的功能此处不做限定。
需要说明的是,本发明实施例中的对象的行为分析是指获取(预估)目标对象的行为指标,该目标对象的行为指标的用于反映目标对象是否受用户欢迎,当用户获取到了目标对象的行为指标之后,即可以分析出该目标对象在投放之后是否受用户欢迎。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从对象的行为分析装置的角度进行描述,该对象的行为分析装置具体可以集成在网络设备中,该网络设备可以是服务器,也可以是终端等设备;其中,该终端可以包括手机、平板电脑、笔记本电脑、以及个人计算(PC,Personal Computer)等设备。
如图1d所示,该对象的行为分析方法的具体流程可以如下:
101、获取目标对象的特征数据。
该目标对象可以为新闻、广告以及公众号等,该新闻、广告以及公众号可以位于聊天软件中的公众号中;以该目标对象为广告为例,特征数据可以为广告属性(广告属性、广告标题等)、广告人群的属性(年龄、性别、兴趣爱好等)、广告人群的历史行为(浏览过广告的次数、浏览同品牌广告的次数)等所对应的向量特征。
在一些实施例中,获取目标对象的特征数据,包括:
a.获取目标对象的原始特征数据。
其中,原始特征数据是指未经过处理的特征数据,例如广告属性:“公益”。
b.对原始特征数据进行稀疏处理。
具体可以将原始数据输入对象的行为分析模型中的稀疏层对特征数据进行稀疏处理,稀疏处理可以为独热码(one-hot)处理,此时,可以把每个无序原始特征数据转化为一个数值向量,但是此时会导致数据变稀疏,计算量大。
例如广告属性为:“公益”,则此时获取到“公益”这个数据时,为了便于计算,需要将原始特征数据转换为向量,此时需要对“公益”进行one-hot处理。
c.将稀疏处理后的原始特征数据进行嵌入式处理,得到特征数据。
具体可以将稀疏处理后的原始特征数据输入指标的预估模型中的嵌入层,由于进行过稀疏处理后的数据变得非常稀疏,数据量非常大,此时我们需要使用嵌入层将稀疏处理后的原始特征数据进行嵌入式处理,使得稀疏的数据变密集(例如,将代表同一类的特征,放到同一个field中),其中,嵌入层可以为Embedding层,用于对原始特征数据进行Embedding处理,降低计算量。
102、提取特征数据的各阶特征组合,得到全局特征。
具体地,确定特征数据的类型数量;然后根据类型数量以及全局特征提取算法提取特征数据的各阶特征组合,得到全局特征,其中,全局特征提取算法为经过张量分解处理的全局特征提取算法。
其中,在一些实施例中,本发明可以通过对象的行为分析模型中的MVM层提取特征数据的各阶特征组合,得到全局特征。
其中,全局特征提取算法可以为MVM层中的MVM算法,输入MVM层的特征数据通常包含多个field,对于一组特征输入数据:x1,x2,……,xf,假设数据中包含m个field,每个field对应的特征维度为Ip,由于本实施例中的MVM算法为经过张量分解处理的全局特征提取算法,因此对于经过张量分解,并且隐变量的维度为k的MVM算法,可以表示为:
在一些实施例中,根据类型数量以及全局特征提取算法提取特征数据的各阶特征组合,得到全局特征,包括:根据类型数量以及全局特征提取算法确定目标全局特征提取算法(即确定公式(1)中确定参数k的个数);然后根据目标全局特征提取算法确定特征数据的各阶特征组合,得到全局特征。
在一些实施例中,根据目标全局特征提取算法确定特征数据的各阶特征组合,得到全局特征,包括:根据目标全局特征提取算法确定各阶特征对应的张量因子;然后根据各阶特征对应的张量因子对各阶特征进行组合,得到全局特征。
其中,未进行过张量分解的MVM算法,可以表示为:
其中,
公式(2)中包含的参数个数为:
而进行过经过张量分解后的MVM算法(公式(1))所包含的参数个数为:
其中,fea_size表示稀疏特征(即经过稀疏处理后特征)的个数,field_size表示特征的类别个数。
由上可知,经过张量分解的参数个数比未进行过张量分解的参数个数少,因此对MVM算法进行张量分解处理,可以降低全局交叉计算复杂度以及参数的复杂度,提高特征提取的速度。
如图1e所示,本发明中的MVM算法通过对张量的分解降低参数量,图1e中是m维的张量,三阶(m=3)张量w近似为k阶张量,第f个张量是三个张量因子的张量乘积,如
其中,
所以MVM算法可以转化为公式(1),以下为转化过程:
其中,全局特征的表现形式为向量。
本发明实施例在通过MVM算法提取全局特征时,不需要把最后的向量直接相加,也即上面中最后一步的∑不需要执行计算,而是直接得到向量,直接和FM层以及DNN层的输出向量一起连接到输出层,这样可以避免造成信息损失,进一步提高指标预估的准确性。
其中,本发明实施例中的步骤102和103的执行顺序此处不做限定,一般情况,步骤102和103同时执行。
可以理解的是,全局特征包括低阶特征以及高阶特征,且经过MVM层提取的低阶特征与经过FM层提取的低阶特征的提取方法不一样,所以两种低阶特征所包含的信息不同,同理,经过MVM层提取的高阶特征与经过DNN层提取的高阶特征的提取方法也不一样,故两种高阶特征所包含的信息也不同。
103、对该特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征。
即对特征数据进行低阶特征交叉处理,得到低阶特征;并基于深度神经网络对特征数据进行高阶特征提取,得到高阶特征。
在一个具体的实施例中,将特征数据输入对象的行为分析模型中的FM层,使得处理后的特征数据在FM层进行低阶特征交叉处理,得到低阶特征;以及,将处理后的特征数据输入对象的行为分析模型中的DNN层,学习到抽象的高阶特征。
更具体地,对特征数据进行低阶特征交叉处理,得到低阶特征,包括:确定特征数据的类型数量;然后根据特征数据的类型数量以及低阶特征提取算法对特征数据进行低阶特征交叉处理,得到低阶特征。
其中,该低阶特征提取算法可以为FM层中的FM算法;
FM算法为:
其中,ω0∈R,R为实数,n为特征数据的类型数量,i,j为变量,xi为第i个特征数据的值,xj为第j个特征数据的值,vi为xi的隐向量,vj为xj的隐向量,<vi,vj>为两个大小为k的向量vi和向量vj的点积,ω0和ω1为FM算法的参数。
只需要将特征数据以及特征数据的类型数量输入式子(3)即可在进行低阶特征的提取。
在一些实施例中,根据特征数据的类型数量以及低阶特征提取算法对特征数据进行低阶特征交叉处理,得到低阶特征,包括:根据类型数量以及低阶特征提取算法确定目标低阶特征提取算法(即在确定式子(3)中n的值);然后根据目标低阶特征提取算法对特征数据进行低阶特征交叉处理,得到低阶特征。
其中,低阶特征的表现形式可以为向量。
具体地,本实施例中的深度神经网络(DNN)为经过特征样本训练后的网络,可以对特征数据进行高阶特征交叉处理,得到抽象的高阶特征。
其中,高阶特征的表现形式可以为向量。
104、根据低阶特征、高阶特征以及全局特征确定第一特征向量。
本实施例中,当对象的行为分析模型分别根据FM层、DNN层以及MVM层提取得到低阶特征、高阶特征以及全局特征之后,需要将低阶特征、高阶特征以及全局特征连接成第一特征向量。
在一些实施例中,所述根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量,包括:对所述低阶特征、所述高阶特征以及所述全局特征进行排列,得到所述低阶特征、所述高阶特征以及所述全局特征的排列位置;然后基于所述排列位置将所述低阶特征、所述高阶特征以及所述全局特征组合成所述第一特征向量。
其中,本实施例对排列位置中的低阶特征、高阶特征以及全局特征的排列顺序不做限定。
具体地,根据排列位置将低阶特征、高阶特征以及全局特征首尾连接进行连接,得到第一特征向量。
105、根据第一特征向量确定目标对象的行为指标。
其中,由于第一特征向量由低阶特征、高阶特征以及全局特征组成,故在本步骤中可以通过输出层中的全连接网络对同时考虑上述低阶特征、高阶特征以及全局特征,即同时对上述低阶特征、高阶特征以及全局特征中的所有特征进行连接。
若不将上述低阶特征、高阶特征以及全局特征连接成第一特征向量,则在输出层中的全连接网络只会和上述低阶特征、高阶特征以及全局特征各自的特征分别进行连接,这样考虑到的特征不够充分,造成低阶特征、高阶特征以及全局特征中信息的损失。
在一些具体的应用场景中,根据第一特征向量确定目标对象的行为指标,包括:根据第一特征向量确定目标对象的点击率;或,根据第一特征向量确定目标对象的停留时长;或,根据第一特征向量确定目标对象的分享率。
即本发明实施例中的行为指标包括点击率、停留时长或分享率。
需要说明的是,本发明实施例中的行为指标除了包括点击率、停留时长或分享率还可以包括其他行为指标,具体行为指标本发明不做限定。
在一些实施例中,在对象的行为分析模型中还增加了残差网络。
其中,残差网络的结构可以如图1f所示,包括第一全连接网络、拉取网络、特征连接网络与第二全连接网络,其中,第一全连接网络可以包括多个全连接层,用于对第一特征向量进行进一步学习,得到全连接特征。
其中,在残差网络中,假定某段神经网络的输入是x,期望输出是H(x),即H(x)是期望的复杂潜在映射,如果是要学习这样的模型,则训练难度会比较大;如果已经学习到较饱和的准确率(或者当发现下层的误差变大时),那么接下来的学习目标就转变为恒等映射的学习,也就是使输入x近似于输出H(x),以保持在后面的层次中不会造成精度下降。在残差网络中直接把输入x传到输出作为初始结果,输出结果为H(x)=F(x)+x,当F(x)=0时,那么H(x)=x,也就是图中所提到的恒等映射。于是,残差网络相当于将学习目标改变了,不再是学习一个完整的输出,而是目标值H(X)和x的差值,也就是所谓的残差F(x)=H(x)-x,因此,后面的训练目标就是要将残差结果逼近于0,使到随着网络加深,准确率不下降。
这种残差跳跃式的结构,打破了传统的神经网络n-1层的输出只能给n层作为输入的惯例,使某一层的输出可以直接跨过几层作为后面某一层的输入,其意义在于为叠加多层网络而使得整个学习模型的错误率不降反升的难题提供了新的方向。将残差网络应用于对象的行为分析模型中,使得模型对特征的理解更加深刻,可使指标预估准确性得以提升。
需要说明的是,本发明实施例中的残差网络并不是应用在传统意义上的图像处理领域,而是应用在特征提取以及行为指标预估方面,用于获取更加丰富的特征,提高行为指标预估的准确率。
具体地,当输出层添加了残差网络之后,根据第一特征向量确定目标对象的行为指标,包括:
a.基于残差网络的第一全连接网络对第一特征向量进行学习,得到全连接特征。
即根据第一特征向量进一步提取特征数据的特征,得到更高阶的特征。
其中,在本实施例中,上述H(x)=F(x)+x中的x相当于是第一特征向量,F(x)相当于全连接特征。
其中,本实施例中,第一全连接网络可以由多个,例如图1f中,第一全连接网络有2个,在另一些实施例中还可以有更多个,具体个数此处不做限定。
b.通过残差网络的拉取网络拉取第一特征向量。
为了使得第一特征向量在最后参与对象的行为分析,减少信息损失,提高行为指标预估的准确性,此时需要通过拉取网络拉取该第一特征向量。
c.通过残差网络的特征连接网络将第一特征向量以及全连接特征连接成第二特征向量。
具体地,通过特征连接网络确定第一特征向量的第一待连接特征;并通过特征连接网络确定全连接特征的第二待连接特征;然后基于第一待连接特征以及第二待连接特征将第一特征向量与全连接特征进行特征连接处理。
其中,第一待连接特征可以为第一特征向量的边界特征(首特征或尾特征的位置信息),第二待连接特征可以为全连接特征的边界特征(首特征或尾特征的位置信息)。
具体地,可以将第一特征向量与全连接特征首尾连接成第二特征向量。
d.基于残差网络的第二全连接网络对第二特征向量进行对象的行为分析处理,得到目标对象的行为指标。
其中,第二特征向量包含有第一特征向量的信息以及全连接特征的信息,第一特征向量中又包含有分别根据FM层、DNN层以及MVM层提取得到的低阶特征、高阶特征以及全局特征,所以第二全连接网络在根据第二特征向量进行对象的行为分析时,可以同时考虑到所提取到的所有特征,对提取到的所有特征都进行连接,充分考虑提取到的所有信息,避免由于分别对特征进行连接时造成的信息损失,提高行为指标预估的准确率。
具体地,基于第二全连接网络确定第二特征向量的权重;然后根据权重确定目标对象的行为指标。
在一些具体的应用场景中,基于残差网络的第二全连接网络对第二特征向量进行对象的行为分析处理,得到目标对象的行为指标,包括:基于残差网络的第二全连接网络对第二特征向量进行对象的行为分析处理,得到目标对象的点击率;或,基于残差网络的第二全连接网络对第二特征向量进行对象的行为分析处理,得到目标对象的停留时长;或,基于残差网络的第二全连接网络对第二特征向量进行对象的行为分析处理,得到目标对象的分享率。
更具体地,基于第二全连接网络确定第二特征向量的权重,然后根据该权重确定目标对象的点击率、停留时长或分享率。
本发明实施例在获取目标对象的特征数据之后;对特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;并提取特征数据的各阶特征组合,得到全局特征;然后根据低阶特征、高阶特征以及全局特征确定第一特征向量;最后根据第一特征向量确定目标对象的行为指标。该方案可以从特征数据中提取多种特征,然后结合多种特征一起对目标对象的行为指标进行预估,在进行对象的行为分析的时候更充分地利用了从特征数据中提取出来的特征,从而提高对象的行为分析的准确率。
根据上一个实施例所描述的方法,以下将举例作进一步进行说明。
本实施例中,将该对象的行为分析装置中集成有对象的行为分析模型,该对象的行为分析装置集成在网络设备中。
如图2所示,本发明实施例提供的另一种对象的行为分析方法,具体流程如下:
201、获取目标对象的原始特征数据。
其中,原始特征数据为目标对象的原始数据,目标对象可以为新闻、广告以及公众号等,该新闻、广告以及公众号可以位于聊天软件中的公众号中;以该目标对象为广告为例,原始特征数据可以为广告属性(广告具体属性、广告标题等)、广告人群的属性(年龄、性别、兴趣爱好等)和广告人群的历史行为(浏览过广告的次数、浏览同品牌广告的次数)所对应的数据。
202、对原始特征数据进行稀疏处理。
为了便于计算,需要将原始特征数据转换为向量,例如进行独热码(one-hot)处理,此时,可以把每个无序原始特征数据转化为一个数值向量,但是此时会导致数据变稀疏,计算量大。
203、将稀疏处理后的原始特征数据进行嵌入式处理,得到特征数据。
由于进行过稀疏处理后的数据变得非常稀疏,数据量非常大,此时我们需要使用嵌入层将稀疏处理后的原始特征数据进行嵌入式处理,使得稀疏的数据变密集(例如,将代表同一类的特征,放到同一个特征类别field中),其中,嵌入层可以为Embedding层,用于对原始特征数据进行Embedding处理,降低计算量。
204、对特征数据进行低阶特征交叉处理,得到低阶特征。
具体地,可以先确定特征数据的类型数量,然后再根据特征数据的类型数量以及预置的低阶特征提取算法对特征数据进行低阶特征交叉处理,得到低阶特征,低阶特征提取算法可以为经过矩阵分解处理的低阶特征交叉算法。
在一些实施例中,可以通过FM层对特征数据进行低阶特征交叉处理,其中,低阶特征提取算法可以为FM层中的FM算法,该算法可以为上一实施例中的算法(3)。
其中,低阶特征的表现形式为向量。
205、基于深度神经网络对特征数据进行高阶特征提取,得到高阶特征。
在一些实施例中,基于对象的行为分析模型中的DNN层对特征数据进行高阶特征提取,其中本发明中的DNN层中的深度神经网络为经过特征数据样本训练后的网络。
206、提取特征数据的各阶特征组合,得到全局特征。
具体地,在一些实施例中,可以先确定特征数据的类型数量;然后根据特征数据的类型数量以及预置的全局特征提取算法对特征数据进行全局交叉处理,得到全局特征,全局特征提取算法为经过张量分解处理的全局特征交叉算法。
在一些实施例中,具体地,可以通过对象的行为分析模型中的MVM层提取特征数据的各阶特征组合,得到全局特征。
在一些实施例中,全局特征提取算法为MVM层中的MVM算法,其中,MVM算法可以为上一实施例中的算法(1),该算法为经过张量分解的算法。
可以理解的是,全局特征包括低阶特征以及高阶特征,且经过MVM层提取的低阶特征与经过FM层提取的低阶特征的提取方法不一样,所以两种低阶特征所包含的信息不同,同理,经过MVM层提取的高阶特征与经过DNN层提取的高阶特征的提取方法也不一样,故两种高阶特征所包含的信息也不同。
所以本方案可以结合MVM层、FM层以及DNN层提取出来的特征进行行为的指标预估,由于学习到的组合特征类型比较多,故从特征数据中提取到的信息也比较多,所以可以提高对象的行为分析模型的准确率。
207、根据低阶特征、高阶特征以及全局特征确定第一特征向量。
由于将特征分开进行进一步学习或者进行预估会造成数据的损失,所以为了不造成数据的损失,需要通过对象的行为分析模型中的第一连接层将上述低阶特征、高阶特征以及该全局特征连接成第一特征向量。
在一些实施例中,所述根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量,包括:对所述低阶特征、所述高阶特征以及所述全局特征进行排列,得到所述低阶特征、所述高阶特征以及所述全局特征的排列位置;然后基于所述排列位置将所述低阶特征、所述高阶特征以及所述全局特征组合成所述第一特征向量。
其中,本实施例对排列位置中的低阶特征、高阶特征以及全局特征的排列顺序不做限定。
具体地,根据排列位置将低阶特征、高阶特征以及全局特征首尾连接进行连接,得到第一特征向量。
208、基于残差网络的第一全连接网络对第一特征向量进行学习,得到全连接特征。
其中,本发明实施例中的残差网络位于对象的行为分析模型中的输出层,为了学习到更多的特征信息,还需要通过残差网络的第一全连接网络对第一特征向量进行进一步的学习,获取到更高阶的特征(即全连接向量),使得提取到的特征更加丰富,在后续进行指标预估时,可以进一步提高准确率。
209、通过残差网络的拉取网络拉取第一特征向量。
为了减少或避免信息损失,在最后进行对象的行为分析时保留低阶特征,需要同时结合第一特征向量与全连接特征向量,此时,则需要通过拉取网络拉取第一特征向量。
210、通过残差网络的特征连接网络将第一特征向量以及全连接特征连接成第二特征向量。
当通过拉取网络拉取了第一特征向量之后,将通过特征连接网络将第一特征向量以及全连接特征连接成第二特征向量。
在一些实施例中,通过特征连接网络确定第一特征向量的第一待连接特征;并通过特征连接网络确定全连接特征的第二待连接特征;然后基于第一待连接特征以及第二待连接特征将第一特征向量与全连接特征进行特征连接处理。
其中,第一待连接特征可以为第一特征向量的边界特征(首特征或尾特征的位置信息),第二待连接特征可以为全连接特征的边界特征(首特征或尾特征的位置信息)。
具体地,可以将第一特征向量与全连接特征首尾连接成第二特征向量。
其中,需要说明的是,本发明实施例中的拉取网络与特征连接网络可以为同一网络,也可以为不同网络,具体此处不做限定。
211、基于残差网络的第二全连接网络对第二特征向量进行对象的行为分析处理,得到目标对象的行为指标。
其中,第二特征向量包含有第一特征向量的信息以及全连接特征的信息,第一特征向量中又包含有分别根据FM层、DNN层以及MVM层提取得到的低阶特征、高阶特征以及全局特征,所以第二全连接网络在根据第二特征向量进行对象的行为分析时,可以同时考虑到所提取到的所有特征,对提取到的所有特征都进行连接,充分考虑提取到的所有信息,避免由于分别对特征进行连接时造成的信息损失,提高行为指标预估的准确率。
具体地,基于第二全连接网络确定第二特征向量的权重;然后根据权重确定目标对象的行为指标。
需要说明的是,本发明实施例中的行为指标包括点击率、停留时长或分享率等。
由于第二特征向量不仅包含第一特征向量,还包含有全连接特征向量,而第一特征向量又包含有低阶特征、高阶特征以及全局特征,故第二特征向量中不仅包含有对象的行为分析模型中FM层、DNN层以及MVM层提取出来的特征,还包含有第一全连接层进一步学习得到特征,所以此时基于第二全连接网络对第二特征向量进行指标预估处理,可以最大程度地保留特征的提取出来的信息,并且可以进一步提高指标预估的准确率,使得最终获得的目标对象的行为指标更加准确。
在一些实施例中,结合该低阶特征、该高阶特征以及该全局特征确定该目标对象的评估指标之后,该方法还包括:根据该目标对象的评估指标的大小对该目标对象进行排序,例如,将点击率较高的排在前,点击率较低的排在后。
其中,如果执行主体为服务器时,还需要将排序好的目标对象发送给终端,使得用户通过终端查看排序好的目标对象,例如排序好的新闻对象,使得用户可以第一时间获取到感兴趣的内容,提高用户体验。
为了更好地理解本发明实施例,下面将以一具体的场景进行指标预估方法的描述:
本发明中的指标预估装置具体可以集成在网络设备中,该网络设备可以是服务器,也可以是终端等设备,本实施例从指标预估装置为服务器、评估指标为点击率的角度进行描述,其中,服务器中集成有对象的行为分析模型。
如图3a所示,本发明实施例提供的另一种指标预估方法,具体流程如下:
301、服务器获取目标对象的原始特征数据。
原始特征数据为目标对象的原始数据,目标对象可以为新闻、广告以及公众号等,该新闻、广告以及公众号可以位于聊天软件中的公众号中;以该目标对象为新闻为例,原始特征数据可以为新闻属性(新闻具体属性、新闻标题等)、新闻人群的属性(年龄、性别、兴趣爱好等)和新闻人群的历史行为(浏览过新闻的次数、浏览同属性新闻的次数)所对应的数据。
302、服务器对原始特征数据进行稀疏处理。
为了便于计算,需要将原始特征数据转换为向量,例如进行独热码(one-hot)处理,此时,可以把每个无序原始特征数据转化为一个数值向量,但是此时会导致数据变稀疏,计算量大。
例如,新闻具体属性为“正能量”这个数据时,为了便于计算,需要将该数据转换为向量,例如转换为向量一般情况下,该向量的矩阵都非常庞大,并且数据变得非常稀疏。
303、服务器将稀疏处理后的原始特征数据进行嵌入式处理,得到特征数据。
由于进行过稀疏处理后的数据变得非常稀疏,所以服务器还需要基于嵌入层将稀疏处理后的原始特征数据进行嵌入式处理。
其中,嵌入层可以为Embedding层,用于对原始特征数据进行Embedding处理,降低计算量,并使得数据变得密集。
304、服务器对特征数据进行低阶特征交叉处理,得到低阶特征。
具体地,可以先确定特征数据的类型数量,然后服务器再根据特征数据的类型数量以及预置的低阶特征提取算法对特征数据进行低阶特征交叉处理,得到低阶特征,低阶特征提取算法可以为经过矩阵分解处理的低阶特征交叉算法。
在一些实施例中,低阶特征提取算法为FM层中的FM算法。
其中,FM算法可以为本发明实施例中的算法(3)。
其中,低阶特征的表现形式为向量。
305、服务器基于深度神经网络对特征数据进行高阶特征提取,得到高阶特征。
具体地,可以基于对象的行为分析模型中的DNN层对特征数据进行高阶特征提取,其中本发明中的DNN层中的深度神经网络为经过特征数据样本训练后的网络。
306、服务器提取特征数据的各阶特征组合,得到全局特征。
在一些实施例中,具体地,可以通过对象的行为分析模型中的MVM层提取特征数据的各阶特征组合,得到全局特征。
其中,全局特征提取算法为MVM层中的MVM算法,其中,MVM算法可以为本发明实施例中的算法(1),该算法为经过张量分解的算法。
可以理解的是,全局特征包括低阶特征以及高阶特征,且经过MVM层提取的低阶特征与经过FM层提取的低阶特征的提取方法不一样,所以两种低阶特征所包含的信息不同,同理,经过MVM层提取的高阶特征与经过DNN层提取的高阶特征的提取方法也不一样,故两种高阶特征所包含的信息也不同。
307、服务器根据低阶特征、高阶特征以及全局特征确定第一特征向量。
由于将特征分开进行进一步学习或者进行预估会造成数据的损失,所以为了不造成数据的损失,服务器需要通过对象的行为分析模型中的第一连接层将上述低阶特征、高阶特征以及该全局特征连接成第一特征向量。
具体地,将低阶特征、高阶特征以及全局特征首尾连接(组合)成第一特征向量。
308、服务器基于残差网络的第一全连接网络对第一特征向量进行学习,得到全连接特征。
其中,本发明实施例中的残差网络位于对象的行为分析模型中的输出层,服务器为了学习到更多的特征信息,还需要通过残差网络的第一全连接网络对第一特征向量进行进一步的学习,获取到更高阶的特征(即全连接向量),使得提取到的特征更加丰富,在后续进行指标预估时,可以进一步提高准确率。
309、服务器通过残差网络的拉取网络拉取第一特征向量。
为了减少或避免信息损失,在最后进行对象的行为分析时保留低阶特征,服务器需要同时结合第一特征向量与全连接特征向量,此时,则需要通过拉取网络拉取第一特征向量。
310、服务器通过残差网络的特征连接网络将第一特征向量以及全连接特征连接成第二特征向量。
当服务器通过拉取网络拉取了第一特征向量之后,将通过特征连接网络将第一特征向量以及全连接特征连接成第二特征向量。
具体地,服务器通过特征连接网络将第一特征向量以及全连接特征向量首尾连接成第二特征向量。
其中,需要说明的是,本发明实施例中的拉取网络与特征连接网络可以为同一网络,也可以为不同网络,具体此处不做限定。
311、服务器基于残差网络的第二全连接网络对第二特征向量进行点击率的预估处理,得到目标对象的点击率。
具体地,可以基于第二全连接网络确定第二特征向量的权重;然后根据权重确定目标对象的点击率。
由于第二特征向量不仅包含第一特征向量,还包含有全连接特征向量,而第一特征向量又包含有低阶特征、高阶特征以及全局特征,故第二特征向量中不仅包含有对象的行为分析模型中FM层、DNN层以及MVM层提取出来的特征,还包含有第一全连接层进一步学习得到特征,所以此时基于第二全连接网络对第二特征向量进行指标预估处理,可以最大程度地保留特征的提取出来的信息,并且可以进一步提高指标预估的准确率,使得最终获得的目标对象的行为指标更加准确。
312、服务器根据目标对象的点击率对目标对象进行排序。
其中,在一些实施例中,可以将终端中需要显示的目标对象按照点击率的大小进行排序,将点击率较大的目标对象排在前,将点击率较小的目标对象排在后。
313、服务器将进行过排序处理的目标对象发送至终端。
当服务器根据点击率对目标对象进行过排序处理之后,将进行过排序处理后的目标对象发送至终端。
终端接收到进行过排序处理的目标对象之后,将目标对象按照服务器排序好的顺序直接进行显示。
在一些实施例中,服务器在获取目标对象的点击率之后,可以不对目标对象进行排序,而是直接将目标对象的内容以及目标对象对应的点击率发送至终端,终端接收到点击率之后,再根据各个目标对象的点击率的大小自行对目标对象进行排序。
在一些实施例中,在服务器将进行过排序处理的目标对象发送至终端之前,方法还包括:服务器接收终端发送的目标对象获取请求,其中,该目标对象获取请求为用户刷新目标对象对应的消息页面或打开目标对象对应的消息页面时触发终端发送的。
当服务器接收到目标对象的获取请求之后,服务器才将进行过排序处理的目标对象发送至终端;或,将目标对象的内容以及目标对象的点击率发送至终端。
在一些实施例中,服务器在接收到目标对象的获取请求之后,将根据该目标对象获取请求的触发时间将进行过排序处理的目标对象发送至终端,或根据该触发时间发送目标对象的内容以及目标对象的点击率至终端,其中,该触发时间为用户刷新或点开目标对象对应的消息页面时对应的时间。
例如,参考图3b,在即时通讯客户端显示有的与信息推荐相关的功能控件,比如看一看、新闻等,当用户对与信息推荐相关的功能控件进行操作,如点击、滑动等操作时会触发客户端显示相关的界面,其中,在相关的界面上包括排序过的信息流,使得用户可以第一时间阅读到自己感兴趣的信息,提高用户体验。
需要说明的是,在一些实施例中,服务器还可以基于残差网络的第二全连接网络对第二特征向量进行停留时长的预估处理,得到目标对象的停留时长。
需要说明的是,在一些实施例中,服务器还可以基于残差网络的第二全连接网络对第二特征向量进行分享率的预估处理,得到目标对象的分享率。其具体的确定流程与本实施例中点击率的确定类似,具体此处不做赘述。
为了更好地实施以上方法,相应的,本发明实施例还提供一种对象的行为分析装置,该对象的行为分析装置内置有对象的行为分析模型,该对象的行为分析装置具体可以集成在网络设备中,该网络设备可以是服务器,也可以是终端等设备。
例如,如图4a所示,该对象的行为分析装置可以包括获取单元401、提取单元402、处理单元403、第一确定单元404以及第二确定单元405,如下:
获取单元401,用于获取目标对象的特征数据;
提取单元402,用于提取所述特征数据的各阶特征组合,得到全局特征;
处理单元403,用于对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;
第一确定单元404,用于根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量;
第二确定单元405,用于根据所述第一特征向量确定所述目标对象的行为指标。
在一些实施例中,所述提取单元402具体用于:
确定所述特征数据的类型数量;
根据所述类型数量以及全局特征提取算法提取所述特征数据的各阶特征组合,得到所述全局特征,其中,所述全局特征提取算法为经过张量分解处理的全局特征提取算法。
在一些实施例中,所述提取单元402还具体用于:
根据所述类型数量以及所述全局特征提取算法确定目标全局特征提取算法;
根据所述目标全局特征提取算法确定所述特征数据的各阶特征组合,得到所述全局特征。
在一些实施例中,所述提取单元402还具体用于:
根据所述目标全局特征提取算法确定各阶特征对应的张量因子;
根据各阶特征对应的张量因子对各阶特征进行组合,得到所述全局特征。
在一些实施例中,所述第一确定单元404具体用于:
对所述低阶特征、所述高阶特征以及所述全局特征进行排列,得到所述低阶特征、所述高阶特征以及所述全局特征的排列位置;
基于所述排列位置将所述低阶特征、所述高阶特征以及所述全局特征组合成所述第一特征向量。
在一些实施例中,所述处理单元403具体用于:
对所述特征数据进行低阶特征交叉处理,得到所述低阶特征;
基于深度神经网络对所述特征数据进行高阶特征提取,得到所述高阶特征。
在一些实施例中,所述处理单元403还具体用于:
确定所述特征数据的类型数量;
根据所述特征数据的类型数量以及低阶特征提取算法对所述特征数据进行低阶特征交叉处理,得到所述低阶特征。
如图4b所示,在一些实施例中,所述第二确定单元405包括:
学习子单元4051,用于基于残差网络的第一全连接网络对所述第一特征向量进行学习,得到全连接特征;
拉取子单元4052,用于通过所述残差网络的拉取网络拉取所述第一特征向量;
连接子单元4053,用于通过所述残差网络的特征连接网络将所述第一特征向量以及所述全连接特征连接成第二特征向量;
预估子单元4054,用于基于所述残差网络的第二全连接网络对所述第二特征向量进行对象的行为分析处理,得到所述目标对象的行为指标。
在一些实施例中,所述预估子单元4054具体用于:
基于所述第二全连接网络确定所述第二特征向量的权重;
根据所述权重确定所述目标对象的行为指标。
在一些实施例中,所述连接子单元4053具体用于:
通过所述特征连接网络确定所述第一特征向量的第一待连接特征;
通过所述特征连接网络确定所述全连接特征的第二待连接特征;
基于所述第一待连接特征以及所述第二待连接特征将所述第一特征向量与所述全连接特征进行特征连接处理。
在一些实施例中,所述获取单元401包括:
获取子单元4011,用于获取所述目标对象的原始特征数据;
稀疏子单元4012,用于对所述原始特征数据进行稀疏处理;
嵌入子单元4013,用于将稀疏处理后的原始特征数据进行嵌入式处理,得到所述特征数据。
在一些实施例中,所述第二确定单元405具体用于:
根据所述第一特征向量确定所述目标对象的点击率;或,
根据所述第一特征向量确定所述目标对象的停留时长;或,
根据所述第一特征向量确定所述目标对象的分享率。
本发明实施例获取单元401在获取目标对象的特征数据之后;提取单元402提取所述特征数据的各阶特征组合,得到全局特征;处理单元403对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;然后第一确定单元404根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量;最后第二确定单元405根据所述第一特征向量确定所述目标对象的行为指标。该方案可以从特征数据中提取多种特征,然后结合多种特征一起对目标对象的行为指标进行预估,在进行对象的行为分析的时候更充分地利用了从特征数据中提取出来的特征,从而提高对象的行为分析的准确率。
此外,本发明实施例还提供一种网络设备,如图5所示,其示出了本发明实施例所涉及的网络设备的结构示意图,具体来讲:
该网络设备可以包括一个或者一个以上处理核心的处理器501、一个或一个以上计算机可读存储介质的存储器502、电源503和输入单元504等部件。本领域技术人员可以理解,图5中示出的网络设备结构并不构成对网络设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器501是该网络设备的控制中心,利用各种接口和线路连接整个网络设备的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行网络设备的各种功能和处理数据,从而对网络设备进行整体监控。可选的,处理器501可包括一个或多个处理核心;优选的,处理器501可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器501中。
存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据网络设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
网络设备还包括给各个部件供电的电源503,优选的,电源503可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源503还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该网络设备还可包括输入单元504,该输入单元504可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,网络设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,网络设备中的处理器501会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器501来运行存储在存储器502中的应用程序,从而实现各种功能,如下:
获取目标对象的特征数据;提取所述特征数据的各阶特征组合,得到全局特征;对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;将所述低阶特征、所述高阶特征以及所述全局特征连接成第一特征向量;根据所述第一特征向量确定所述目标对象的行为指标。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本发明实施例在获取目标对象的特征数据之后;提取所述特征数据的各阶特征组合,得到全局特征;并对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;然后根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量;最后根据所述第一特征向量确定所述目标对象的行为指标。该方案可以从特征数据中提取多种特征,然后结合多种特征一起对目标对象的行为指标进行预估,在进行对象的行为分析的时候更充分地利用了从特征数据中提取出来的特征,从而提高对象的行为分析的准确率。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例还提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种对象的行为分析方法中的步骤。例如,该指令可以执行如下步骤:
获取目标对象的特征数据;提取所述特征数据的各阶特征组合,得到全局特征;对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量;根据所述第一特征向量确定所述目标对象的行为指标。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种对象的行为分析方法中的步骤,因此,可以实现本发明实施例所提供的任一种对象的行为分析方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的一种对象的行为分析方法、装置和存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (15)
1.一种对象的行为分析方法,其特征在于,包括:
获取目标对象的特征数据;
提取所述特征数据的各阶特征组合,得到全局特征;
对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征和所述特征数据的高阶特征;
根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量;
基于残差网络的第一全连接网络对所述第一特征向量进行学习,得到全连接特征;
通过所述残差网络的拉取网络拉取所述第一特征向量;
通过所述残差网络的特征连接网络将所述第一特征向量以及所述全连接特征连接成第二特征向量;
基于所述残差网络的第二全连接网络对所述第二特征向量进行对象的行为分析处理,得到所述目标对象的行为指标。
2.根据权利要求1所述的方法,其特征在于,所述提取所述特征数据的各阶特征组合,得到全局特征,包括:
确定所述特征数据的类型数量;
根据所述类型数量以及全局特征提取算法提取所述特征数据的各阶特征组合,得到所述全局特征,其中,所述全局特征提取算法为经过张量分解处理的全局特征提取算法。
3.根据权利要求2所述的方法,其特征在于,所述根据所述类型数量以及全局特征提取算法提取所述特征数据的各阶特征组合,得到所述全局特征,包括:
根据所述类型数量以及所述全局特征提取算法确定目标全局特征提取算法;
根据所述目标全局特征提取算法确定所述特征数据的各阶特征组合,得到所述全局特征。
4.根据权利要求3所述的方法,其特征在于,所述根据所述目标全局特征提取算法确定所述特征数据的各阶特征组合,得到所述全局特征,包括:
根据所述目标全局特征提取算法确定各阶特征对应的张量因子;
根据各阶特征对应的张量因子对各阶特征进行组合,得到所述全局特征。
5.根据权利要求1所述的方法,其特征在于,所述根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量,包括:
对所述低阶特征、所述高阶特征以及所述全局特征进行排列,得到所述低阶特征、所述高阶特征以及所述全局特征的排列位置;
基于所述排列位置将所述低阶特征、所述高阶特征以及所述全局特征组合成所述第一特征向量。
6.根据权利要求1所述的方法,其特征在于,所述对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征,包括:
对所述特征数据进行低阶特征交叉处理,得到所述低阶特征;
基于深度神经网络对所述特征数据进行高阶特征提取,得到所述高阶特征。
7.根据权利要求6所述的方法,其特征在于,所述对所述特征数据进行低阶特征交叉处理,得到所述低阶特征,包括:
确定所述特征数据的类型数量;
根据所述特征数据的类型数量以及低阶特征提取算法对所述特征数据进行低阶特征交叉处理,得到所述低阶特征。
8.根据权利要求7所述的方法,其特征在于,所述根据所述特征数据的类型数量以及低阶特征提取算法对所述特征数据进行低阶特征交叉处理,得到所述低阶特征,包括:
根据所述类型数量以及所述低阶特征提取算法确定目标低阶特征提取算法;
根据所述目标低阶特征提取算法对所述特征数据进行低阶特征交叉处理,得到所述低阶特征。
9.根据权利要求1所述的方法,其特征在于,所述基于所述残差网络的第二全连接网络对所述第二特征向量进行对象的行为分析处理,得到所述目标对象的行为指标,包括:
基于所述第二全连接网络确定所述第二特征向量的权重;
根据所述权重确定所述目标对象的行为指标。
10.根据权利要求1所述的方法,其特征在于,所述通过所述残差网络的特征连接网络将所述第一特征向量以及所述全连接特征连接成第二特征向量,包括:
通过所述特征连接网络确定所述第一特征向量的第一待连接特征;
通过所述特征连接网络确定所述全连接特征的第二待连接特征;
基于所述特征连接网络、所述第一待连接特征以及所述第二待连接特征将所述第一特征向量与所述全连接特征进行特征连接处理。
11.根据权利要求1至10中任一项所述的方法,其特征在于,所述获取目标对象的特征数据,包括:
获取所述目标对象的原始特征数据;
对所述原始特征数据进行稀疏处理;
将稀疏处理后的原始特征数据进行嵌入式处理,得到所述特征数据。
12.根据权利要求1至10中任一项所述的方法,其特征在于,所述根据所述第一特征向量确定所述目标对象的行为指标,包括:
根据所述第一特征向量确定所述目标对象的点击率;或,
根据所述第一特征向量确定所述目标对象的停留时长;或,
根据所述第一特征向量确定所述目标对象的分享率。
13.一种对象的行为分析装置,其特征在于,包括:
获取单元,用于获取目标对象的特征数据;
处理单元,用于对所述特征数据进行深度分解处理,得到所述特征数据的低阶特征以及高阶特征;
提取单元,用于提取所述特征数据的各阶特征组合,得到全局特征;
第一确定单元,用于根据所述低阶特征、所述高阶特征以及所述全局特征确定第一特征向量;
第二确定单元,用于基于残差网络的第一全连接网络对所述第一特征向量进行学习,得到全连接特征;以及通过所述残差网络的拉取网络拉取所述第一特征向量;以及通过所述残差网络的特征连接网络将所述第一特征向量以及所述全连接特征连接成第二特征向量;以及基于所述残差网络的第二全连接网络对所述第二特征向量进行对象的行为分析处理,得到所述目标对象的行为指标。
14.一种存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至12任一项所述的对象的行为分析方法中的步骤。
15.一种网络设备,其特征在于,包括存储器和处理器,所述存储器存储有多条指令,所述处理器用于运行所述存储器内的指令,以执行权利要求1至12任一项所述的对象的行为分析方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910168808.3A CN110245310B (zh) | 2019-03-06 | 2019-03-06 | 一种对象的行为分析方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910168808.3A CN110245310B (zh) | 2019-03-06 | 2019-03-06 | 一种对象的行为分析方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110245310A CN110245310A (zh) | 2019-09-17 |
CN110245310B true CN110245310B (zh) | 2023-10-13 |
Family
ID=67883002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910168808.3A Active CN110245310B (zh) | 2019-03-06 | 2019-03-06 | 一种对象的行为分析方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110245310B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111429175B (zh) * | 2020-03-18 | 2022-05-27 | 电子科技大学 | 稀疏特征场景下进行点击转化预测的方法 |
CN111506811A (zh) * | 2020-03-19 | 2020-08-07 | 上海理工大学 | 一种基于深度残差网络的点击率预测方法 |
CN111861583B (zh) * | 2020-07-31 | 2022-10-21 | 成都新潮传媒集团有限公司 | 一种广告点击率的预测方法、装置及计算机可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104299008A (zh) * | 2014-09-23 | 2015-01-21 | 同济大学 | 基于多特征融合的车型分类方法 |
CN108520226A (zh) * | 2018-04-03 | 2018-09-11 | 东北大学 | 一种基于躯体分解和显著性检测的行人重识别方法 |
WO2018212711A1 (en) * | 2017-05-19 | 2018-11-22 | National University Of Singapore | Predictive analysis methods and systems |
CN108922560A (zh) * | 2018-05-02 | 2018-11-30 | 杭州电子科技大学 | 一种基于混合深度神经网络模型的城市噪声识别方法 |
CN108921783A (zh) * | 2018-06-01 | 2018-11-30 | 武汉大学 | 一种基于混合损失函数约束的卫星影像超分辨率重建方法 |
CN108960142A (zh) * | 2018-07-04 | 2018-12-07 | 国家新闻出版广电总局广播科学研究院 | 基于全局特征损失函数的行人再识别方法 |
CN109242097A (zh) * | 2018-07-12 | 2019-01-18 | 上海交通大学 | 无监督学习的视觉表示学习系统及方法 |
CN109299976A (zh) * | 2018-09-07 | 2019-02-01 | 深圳大学 | 点击率预测方法、电子装置及计算机可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331450B (zh) * | 2014-10-29 | 2017-11-24 | 山东财经大学 | 基于多模式特征和张量分解的视频拷贝检测方法 |
CN109062956A (zh) * | 2018-06-26 | 2018-12-21 | 湘潭大学 | 一种面向区域综合能源系统的时空特征挖掘方法 |
-
2019
- 2019-03-06 CN CN201910168808.3A patent/CN110245310B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104299008A (zh) * | 2014-09-23 | 2015-01-21 | 同济大学 | 基于多特征融合的车型分类方法 |
WO2018212711A1 (en) * | 2017-05-19 | 2018-11-22 | National University Of Singapore | Predictive analysis methods and systems |
CN108520226A (zh) * | 2018-04-03 | 2018-09-11 | 东北大学 | 一种基于躯体分解和显著性检测的行人重识别方法 |
CN108922560A (zh) * | 2018-05-02 | 2018-11-30 | 杭州电子科技大学 | 一种基于混合深度神经网络模型的城市噪声识别方法 |
CN108921783A (zh) * | 2018-06-01 | 2018-11-30 | 武汉大学 | 一种基于混合损失函数约束的卫星影像超分辨率重建方法 |
CN108960142A (zh) * | 2018-07-04 | 2018-12-07 | 国家新闻出版广电总局广播科学研究院 | 基于全局特征损失函数的行人再识别方法 |
CN109242097A (zh) * | 2018-07-12 | 2019-01-18 | 上海交通大学 | 无监督学习的视觉表示学习系统及方法 |
CN109299976A (zh) * | 2018-09-07 | 2019-02-01 | 深圳大学 | 点击率预测方法、电子装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110245310A (zh) | 2019-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Morente-Molinera et al. | Solving multi-criteria group decision making problems under environments with a high number of alternatives using fuzzy ontologies and multi-granular linguistic modelling methods | |
CN110929206B (zh) | 点击率预估方法、装置、计算机可读存储介质和设备 | |
CN108304439B (zh) | 一种语义模型优化方法、装置及智能设备、存储介质 | |
CN110472090B (zh) | 基于语义标签的图像检索方法以及相关装置、存储介质 | |
CN109033408B (zh) | 信息推送方法及装置、计算机可读存储介质、电子设备 | |
CN111291266A (zh) | 基于人工智能的推荐方法、装置、电子设备及存储介质 | |
CN111382361B (zh) | 信息推送方法、装置、存储介质和计算机设备 | |
CN110245310B (zh) | 一种对象的行为分析方法、装置及存储介质 | |
CN108536784B (zh) | 评论信息情感分析方法、装置、计算机存储介质和服务器 | |
CN111680147A (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
CN108875090B (zh) | 一种歌曲推荐方法、装置和存储介质 | |
CN113191154B (zh) | 基于多模态图神经网络的语义分析方法、系统和存储介质 | |
CN113761359B (zh) | 数据包推荐方法、装置、电子设备和存储介质 | |
CN114330966A (zh) | 一种风险预测方法、装置、设备以及可读存储介质 | |
CN111563158A (zh) | 文本排序方法、排序装置、服务器和计算机可读存储介质 | |
CN112749330B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN113392179A (zh) | 文本标注方法及装置、电子设备、存储介质 | |
Zarzour et al. | Sentiment analysis based on deep learning methods for explainable recommendations with reviews | |
CN116956183A (zh) | 多媒体资源推荐方法、模型训练方法、装置及存储介质 | |
CN116957128A (zh) | 业务指标预测方法、装置、设备和存储介质 | |
CN114627085A (zh) | 目标图像的识别方法和装置、存储介质及电子设备 | |
CN115858911A (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
CN115878839A (zh) | 一种视频推荐方法、装置、计算机设备和计算机程序产品 | |
CN112464106A (zh) | 对象推荐方法及装置 | |
CN111177493A (zh) | 数据处理方法、装置、服务器和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |