CN111881747B - 信息预估方法、装置,电子设备 - Google Patents
信息预估方法、装置,电子设备 Download PDFInfo
- Publication number
- CN111881747B CN111881747B CN202010582024.8A CN202010582024A CN111881747B CN 111881747 B CN111881747 B CN 111881747B CN 202010582024 A CN202010582024 A CN 202010582024A CN 111881747 B CN111881747 B CN 111881747B
- Authority
- CN
- China
- Prior art keywords
- model
- network
- information
- attribute
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 239000013598 vector Substances 0.000 claims abstract description 120
- 238000012549 training Methods 0.000 claims abstract description 103
- 230000004927 fusion Effects 0.000 claims abstract description 76
- 238000013507 mapping Methods 0.000 claims abstract description 60
- 238000004364 calculation method Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims description 50
- 238000006243 chemical reaction Methods 0.000 claims description 39
- 241000282414 Homo sapiens Species 0.000 claims description 26
- 230000006399 behavior Effects 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 20
- 230000009286 beneficial effect Effects 0.000 abstract description 7
- 238000004590 computer program Methods 0.000 description 37
- 230000008569 process Effects 0.000 description 8
- 101100243951 Caenorhabditis elegans pie-1 gene Proteins 0.000 description 7
- 101100458287 Saguinus oedipus MSPE gene Proteins 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000013145 classification model Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种信息预估方法,属于计算机技术领域,有助于提升预估图像中人物身份属性信息的运算效率。所述方法包括:基于当前预估图像信息,获取模型输入数据;通过预设信息预估模型中的编码网络,对模型输入数据进行编码,得到一编码向量;通过该模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值;不同分支网络分别基于所述编码向量预估不同的第一属性,不同的第一属性与该模型预估的第二属性之间满足贝叶斯法则;通过该模型的融合网络对各分支网络输出的相应所述第一属性值进行融合计算,得到第二属性值。本方法通过将预估目标拆分为多个子目标并行计算,提升了模型训练和识别运算效率。
Description
技术领域
本申请实施例涉及计算机技术领域,特别是涉及一种信息预估方法、装置、电子设备及计算机可读存储介质。
背景技术
随着神经网络技术的广泛应用,很多数据分析和处理问题都可以通过神经网络模型来实现。例如,通过对气象数据的学习,对天气情况进行预估;通过对人员外在特征进行学习,从而识别人员身份属性;通过对海量数据的学习,进而对用户成单概率进行预估。不同的数据处理需求可以采用不同类型的神经网络模型。例如,通过对海量数据的学习,进而对用户成单概率进行预估,可以采用分类模型;对人员外在特征进行学习,从而识别人员身份属性,可以采用回归模型。以识别图像中人物身份属性为例,需要识别出图像中人物为青年女性、青年男性、中年女性、中年男性等身份属性时,需要对大量的训练样本进行学习。由于回归模型回归的结果范围宽,导致回归模型不易收敛,训练回归模型时效率低下,在信息预估时也存在同样的效率低下的问题。
可见,现有技术中的信息预估方法至少存在效率低下的缺陷。
发明内容
本申请实施例提供一种信息预估方法,有助于提升信息预估的效率。
为了解决上述问题,第一方面,本申请实施例提供了一种信息预估方法,包括:
基于当前预估图像信息,获取模型输入数据;
通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;
通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值;其中,不同的所述分支网络分别基于所述编码向量预估不同的第一属性,不同的所述第一属性与所述预设信息预估模型预估的第二属性之间满足贝叶斯法则;
通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值。
第二方面,本申请实施例提供了一种信息预估装置,包括:
模型输入数据获取模块,用于基于当前预估图像信息,获取模型输入数据;
编码模块,用于通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;
并行特征映射模块,用于通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值;其中,不同的所述分支网络分别基于所述编码向量预估不同的第一属性,不同的所述第一属性与所述预设信息预估模型预估的第二属性之间满足贝叶斯法则;
融合计算模块,用于通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值。
第三方面,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的信息预估方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的信息预估方法的步骤。
本申请实施例公开的信息预估方法,通过基于当前预估图像信息,获取模型输入数据;通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值;其中,不同的所述分支网络分别基于所述编码向量预估不同的第一属性,不同的所述第一属性与所述预设信息预估模型预估的第二属性之间满足贝叶斯法则;通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值,有助于提升预估图像中人物身份属性信息的运算效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1是本申请实施例一的信息预估方法流程图;
图2是本申请实施例一的信息预估方法中分类模型结构示意图;
图3是本申请实施例二的信息预估方法流程图;
图4是本申请实施例二的信息预估方法中分类模型结构示意图;
图5是本申请实施例三的信息预估装置结构示意图;
图6是本申请实施例四的信息预估装置结构示意图;
图7示意性地示出了用于执行根据本申请的方法的电子设备的框图;以及
图8示意性地示出了用于保持或者携带实现根据本申请的方法的程序代码的存储单元。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本申请实施例公开的一种信息预估方法,如图1所示,所述方法包括:步骤110至步骤140。
步骤110,基于当前预估图像信息,获取模型输入数据。
本申请的一些实施例中,在通过信息预估模型预估图像中人物的身份属性信息时,首先需要获取当前预估图像的信息,例如,获取当前预估图像的内容数据作为模型输入数据。
本申请具体实施时,对基于当前预估图像信息,确定的模型输入数据的具体形式和内容不做限定。例如,还可以采用与现有技术中通过回归模型预估图像中人物的身份属性信息相同类型的图像特征作为模型输入数据。
本申请具体实施时,对基于当前预估图像信息,获取模型输入数据的具体技术手段不做限定。
步骤120,通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量。
本申请实施例中的信息预估模型采用如图2所示的三塔结构。如图2所示,所述信息预估模型包括编码网络210、分支网络220、230和240,融合网络250,其中,编码网络210用于对模型输入数据进行编码,得到一指定维度的编码向量;分支网络220、230和240分别与编码网络210的输出连接,用于分别对编码网络210输出的编码向量进行进一步处理,并输出相应的第一属性值;所述融合网络250用于对分支网络220、230和240的输出进行融合运算,最终输出针对输入的图像数据的预设信息预估结果。其中,融合网络250可以为一层网络,也可以为多层网络。
在获取到模型输入数据之后,将获取的所述模型输入数据输入至所述预设信息预估模型,通过所述信息预估模型的编码网络210对所述模型输入数据进行编码处理,得到一指定维度的编码向量。即计算处理设备通过执行所述预设信息预估模型中的编码网络对应的程序代码,对所述模型输入数据进行编码,得到一编码向量。
以获取的模型输入数据为当前预估图像的图像内容数据为例,所述编码网络210可以采用如现有技术中的纹理特征提取算法、轮廓特征提取算法、颜色特征提取算法中的一种或多种算法,提取当前预估图像中预设图像特征,例如:纹理特征、颜色特征、颜色特征,之后,对提取的上述图像特征进行拼接处理,得到与当前预估图像的编码向量。
本申请的一些实施例中,如果获取的模型输入数据为当前预估图像的颜色特征、纹理特征、轮廓特征等图像特征,则可以直接对输入的图像特征进行拼接处理,得到与当前预估图像的编码向量。
本申请实施例对编码网络的具体实施方式不做限定。所述编码网络210可以采用与模型输入数据像匹配的网络结构和编码方法,以便可以针对一定格式的模型输入数据进行编码处理。
步骤130,通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值。
其中,不同的所述分支网络分别基于所述编码向量预估不同的第一属性,不同的所述第一属性与所述预设信息预估模型预估的第二属性之间满足贝叶斯法则。
接下来,分支网络220、230和240将分别获取到编码网络210输出的编码向量,并对所述编码向量基于训练得到的网络参数进行特征映射,以预估相应的第一属性。即所述计算处理设备通过创建不同线程,分别同时执行所述预设信息预估模型中并行设置的多个分支网络对应的程序代码,对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值。
本申请是对现有技术中基于回归模型对图像中人物身份属性信息的预估方法的改进。现有技术中基于回归模型对图像中人物身份属性信息进行预估时,需要训练回归模型,以通过所述回归模型预估输入图像中是处于什么年龄段和性别的人类或者不是人类。在训练所述回归模型时,需要大量的包含不同性别、年龄段的人类图像和非人类图像,然后通过回归网络训练,得到用于对图像进行人物身份属性信息进行预估的回归模型。由于需要预估的人物身份属性信息的取值分布广泛,模型的训练目标只有一个,会出现模型不易收敛的问题,导致训练效率比较低。即现有技术中执行一个计算任务,对复杂的训练数据进行学习,会需要计算任务执行更长时间。
而本申请通过将复杂的计算任务拆分为多个计算任务,引入多个训练目标,相应的,设置多个分支网络,每个分支网络对应一个并行的计算任务,并行的多个计算任务可以同时运行,可以缩短模型训练时间,提升模型训练效率,从而改善计算机系统对外部数据的处理性能。同时,由于引入了多个训练目标,也会提升训练得到的模型的预估准确度。
具体到本实施例而言,所述第一属性包括:所述当前预估图像中目标对象为人类的概率、所述目标对象的性别、年龄段;其中,所述第二属性值用于指示所述当前预估图像中包括以下任意一类对象:中年男性、青年男性、老年男性、中年女性、老年女性、青年女性。
即将信息预估模型所预估的人物身份属性信息,如青年女性、老年女性、中年男性等身份属性信息,定义为第二属性信息,而将性别、年龄段、是否为人类的信息定义为第一属性信息。本领域技术人员应该能够理解,当一幅图像Pic1中的人物身份属性信息为“中年男性”时,那么这幅图像Pic1必须满足两个条件:第一,图像Pic1中的物体为人类;第二,图像Pic1中的物体为男性,即在信息预估模型预估出当前预估图像Pic1匹配的身份属性信息为“中年男性”时,图像Pic1中的物体为人类和图像Pic1中的物体为男性这两个条件一定成立,即所述第一属性与所述第二属性之间满足贝叶斯法则。因此,本实施例中,基于性别、是否为人类,与图像中人物身份属性信息满足贝叶斯法则的特点,将预估图像中人物身份属性信息的任务拆分为以下三个任务:预估图像中物体是否为人类的任务;预估图像中人物性别的任务;预估图像中人物身份属性信息(即图像中为哪个年龄段什么性别的人物)的任务。上述三个任务构建的贝叶斯公式可以表示为:p(身份属性|x)
∝p1(人类=是|x)×p2(性别=男(女)|x)×p3(青(中,老)年人|x)。
其中,p1表示图像中物体为人类的概率,p2表示图像中物体为男性的概率,p3表示图像中物体的年龄段。
根据拆分得到的三个任务,进一步构建如图2所示的信息预估模型。如图2所示,所述预设信息预估模型中并行设置的三个分支网络,不同的所述分支网络分别用于执行基于所述编码向量预估不同的第一属性的任务。例如,分支网络220用于基于所述编码向量预估图像中物体为人类的概率;分支网络230用于基于所述编码向量预估图像中物体为男性或女性的概率;分支网络240用于基于所述编码向量预估图像中人物的年龄段(即,人物为青年、中年或老年)。
其中,分支网络220和分支网络230可以基于二分类网络构建,分支网络240可以基于回归网络构建。本申请实施例中,对二分类网络和回归网络的具体结构不做限定。
在确定了信息预估模型的结构之后,基于若干有标注的训练样本训练所述信息预估模型。即所述通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值之前,还包括:基于若干条训练样本,训练所述预设信息预估模型。其中,每条所述训练样本的样本数据为基于不同图像获取的模型输入数据,每条所述训练样本的样本标签用于指示相应模型输入数据匹配的第二属性真实值和至少一所述第一属性真实值。例如,训练样本可以表示为如{data[],label_human,label_male,label_age}的形式,其中,data[]表示样本数据,label_human表示样本是否为人类的类别标签,label_male表示样本是否为男性的类别标签,label_age表示样本年龄段标签。
本申请的一些实施例中,生成训练样本的图像来源于包含不同身份属性信息的人类图像(如不同年龄段女性的照片、不同年龄段男性的照片)或不包含人类的图像。之后,通过每幅图像分别进行图像处理,提取每幅图像中的预设图像信息,作为该幅图像对应的训练样本的样本数据,同时,为该训练样本设置样本标签,该样本标签用于指示提取该样本数据的图像中是否包含人类、任务的性别、年龄段(如,中年、青年、老年)。
在模型训练过程中,对于每条所述训练样本,计算处理设备将分别执行如下操作:对所述样本数据进行编码,得到一样本数据编码向量;通过所述预设信息预估模型中并行设置的所述多个分支网络分别对所述样本数据编码向量进行特征映射,分别获得所述样本数据与相应分支网络对应的第一属性预估值;通过所述预设信息预估模型的融合网络对所述第一属性预估值进行融合计算,输出所述样本数据对应的第二属性预估值;通过所述预设信息预估模型的损失函数,根据部分或全部所述分支网络输出的第一属性预估值和对应的第一属性真实值、所述第二属性预估值和所述第二属性真实值计算所述预设信息预估模型的损失值,并以所述损失值最小为目标,优化所述预设信息预估模型的网络参数,直至所述损失值收敛。
在模型训练过程中,计算处理设备通过执行所述预设信息预估模型中编码网络对应的计算机程序代码,对输入的每条训练样本的样本数据进行编码,得到一样本数据编码向量,之后,计算处理设备可以通过创建不同的线程,分别执行每个分支网络对应的计算机程序代码,对所述样本数据编码向量进行特征映射,分别输出所述样本数据对应的各第一属性预估值。例如,计算处理设备创建三个线程,分别执行分支网络220、分支网络230和分支网络240对应的计算机程序代码,对所述样本数据编码向量进行特征映射。执行分支网络220对应的计算机程序代码,对所述样本数据编码向量进行特征映射之后,将输出当前训练样本中物体为人类的概率预估值;执行分支网络230对应的计算机程序代码,对所述样本数据编码向量进行特征映射之后,将输出当前训练样本中人物为男性的概率预估值;执行分支网络240对应的计算机程序代码,对所述样本数据编码向量进行特征映射之后,将输出当前训练样本中人物的年龄段预估值。
接下来,计算处理设备执行融合网络250对应的计算机程序代码,对分支网络220、230和240输出的当前训练样本中物体为人类的概率预估值、当前训练样本中人物为男性的概率预估值和当前训练样本中任务的年龄段预估值进行融合计算,得到当前训练样本中人物身份属性信息预估值。进一步的,计算处理设备执行融合网络250对应的计算机程序代码,通过所述信息预估模型的损失函数计算所述信息预估模型的损失值,并采用误差反向传导和梯度下降法优化所述信息预估模型中,至少包括各分支网络、融合网络的网络参数,直至模型收敛,完成所述信息预估模型的训练过程。
本申请的一些实施例中,所述信息预估模型的损失函数根据分支网络220、230和240的损失值计算所述信息预估模型的损失值。即所述信息预估模型的损失函数的参数包括部分或全部所述分支网络的损失值。例如,所述信息预估模型的损失函数可以为对分支网络220、230和240的损失值进行加权求和。其中,分支网络220的损失值可以根据图像中物体为人类的概率预估值和真实值的差值得到,分支网络230的损失值可以根据图像中人物为男性的概率预估值和真实值的差值得到,分支网络240的损失值可以根据图像中人物的年龄段预估值和真实值的差值得到。
在应用信息预估模型进行图像中人物身份属性信息预估的过程中,计算处理设备可以通过不同的线程分别执行信息预估模型的分支网络220、230和240对应的计算机程序代码,同时分别对编码网络210输出的编码向量进行特征映射,以输出图像中物体为人类的概率预估值、图像中人物为男性的概率预估值、图像中人物的年龄段等第一属性值。
步骤140,通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值。
之后,计算处理设备通过执行所述预设信息预估模型的融合网络对应的程序代码,对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值。即计算处理设备执行信息预估模型的融合网络250对应的计算机程序代码,对分支网络220输出的图像中物体为人类的概率预估值、分支网络230输出的图像中人物为男性的概率预估值,以及,分支网络240输出的图像中人物的年龄段预估值,进行融合计算,得到所述当前预估图像中人物的身份属性信息预估值。如,当分支网络220输出的图像中物体为人类的概率预估值为90%,分支网络230输出的图像中人物为男性的概率预估值为70%,分支网络240输出的图像中人物的年龄段预估值为30时,所述信息预估模型可以得到所述当前预估图像匹配的当前预估图像中人物的身份属性信息预估值(即第二属性值)为“青年男性”。
本申请实施例公开的信息预估方法,通过基于当前预估图像信息,获取模型输入数据;通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值;其中,不同的所述分支网络分别基于所述编码向量预估不同的第一属性,不同的所述第一属性与所述预设信息预估模型预估的第二属性之间满足贝叶斯法则;通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值,有助于提升预估图像中人物身份属性信息的运算效率。
通过将预估目标拆分为多个子目标,并通过构建不同的分支网络,使得计算处理设备可以并行执行部分模型代码,可以提升模型的训练和识别运算效率。另一方面,由于所述信息预估模型包括多个训练目标,即模型的损失函数的参数包括多个属性信息的损失值,相比于只对一个目标进行训练,从输入数据中提取多种信息进行运算,可以提升模型识别的准确度。
实施例二
本申请实施例公开的一种信息预估方法,如图3所示,所述方法包括:步骤310至步骤340。
步骤310,基于用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,获取模型输入数据。
本申请实施例中公开的信息预估方法,可以应用于预估多种信息。在预估不同信息时,需要获取相应的模型输入数据。
本申请的一些实施例中,所述信息预估方法可以用于预估商品成交额。相应的,所述当前预估图像信息替换为包括用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,所述基于当前预估图像信息,获取模型输入数据,包括:基于用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,获取模型输入数据。其中,用户画像信息包括但不限于:用户性别、年龄、常驻地等信息;用户历史行为信息包括但不限于用户的移动终端定位数据、商品点击历史数据、历史订单数据、商家浏览数据等;商家画像信息包括但不限于商家星级、地理位置、品类、好评率等信息。
本申请具体实施时,对基于用户画像信息、用户历史行为信息、商家画像信息,获取的模型输入数据的具体形式和内容不做限定。例如,还可以与现有技术中预估商品成交额的回归模型采用相同类型的信息,作为模型输入数据。
本申请具体实施时,对基于用户画像信息、用户历史行为信息、商家画像信息,获取的模型输入数据的具体技术手段不做限定。
之后,将模型输入数据输入至预先训练的信息预估模型,所述信息预估模型将输出与所述模型输入数据对应的预估结果。
本申请实施例中公开的信息预估方法,在预估不同信息时,需要获取相应的模型输入数据,相应的,训练信息预估模型的数据也是不同的,为了获得更准确的预估结果,模型的结构也可以相应调整。
本实施例中的信息预估模型采用如图4所示的三塔结构。如图4所示,所述信息预估模型包括编码网络410、分支网络420、430和440,融合网络450,其中,编码网络410用于对模型输入数据进行编码,得到一指定维度的编码向量;分支网络420、430和440分别与编码网络410的输出连接,用于分别对编码网络410输出的编码向量进行进一步处理,并输出相应的第一属性值;所述融合网络450用于对分支网络420、430和440的输出进行融合运算,最终输出针对模型输入数据的预设信息预估结果。其中,融合网络450进一步包括:第一隐层4501和第二隐层4502。
本申请是对现有技术中基于回归模型对商品成交额的预估方法的改进。现有技术中基于回归模型进行商品成交额预估时,需要训练回归模型,以通过所述回归模型根据输入的用户画像信息、商家画像信息、用户历史行为信息预估用户在商家的商品成交额。在训练所述回归模型时,需要大量的包含不同用户和商家的数据,然后通过回归网络训练,得到预估商品成交额的回归模型。由于需要预估的商品成交额具有取值分布广泛的特点,模型的训练目标只有一个,会出现模型不易收敛的问题,导致训练效率比较低。即现有技术中执行一个计算任务,对复杂的训练数据进行学习,会需要计算任务执行更长时间。
而本申请通过将复杂的计算任务拆分为多个计算任务,引入多个训练目标,相应的,设置多个分支网络,每个分支网络对应一个并行的计算任务,并行的多个计算任务可以同时运行,可以缩短模型训练时间,提升模型训练效率,从而改善计算机系统对外部数据的处理性能。同时,由于引入了多个训练目标,也会提升训练得到的模型的预估准确度。
本领域技术人员应当了解,商品成交额正比于商品价格与成单概率,即成单概率实际为既点击又成功下单的概率。根据贝叶斯法则,成单概率正比于点击概率与转化概率的乘积。成单概率与点击概率和转化概率的关系可以通过如下公式表示:
p(ctcvr|x)=p(click=1,order=1|x)∝p(click|x)×p(order|x) 公式1
上述公式1中,p(ctcvr|x)表示成单概率,p(click|x)表示点击概率,p(order|x)表示转化概率。而商品成交额和商品价格、成单概率满足贝叶斯法则,商品成交额和商品价格、成单概率的关系可以通过如下公式表示:
p(gmv|x)∝p(click,order|x)×p(price|x) 公式2
上述公式2中,p(gmv|x)表示商品成交额,p(click,order|x)表示既点击又成功下单的概率,p(price|x)表示商品价格。将既点击又成功下单的概率(即成单概率)替换为公式1,可以得到如下公式:
p(gmv|x)∝p(click|x)×p(order|x)×p(price|x) 公式3
由上述公式3可以看出,商品成交额与点击概率、转化概率和商品价格满足贝叶斯法则。即当某一商品存在商品成交额时,这个商品一定存在点击概率并且成单,并且商品价格不为零,即点击概率和转化概率、商品价格与商品成交额之间满足贝叶斯法则。因此,本实施例中,基于点击概率、转化概率、商品价格与商品成交额之间满足贝叶斯法则的特点,将预估商品成交额的任务拆分为以下三个任务:预估点击概率的任务;预估转化概率的任务;预估商品价格的任务。
根据拆分得到的三个任务,进一步构建如图4所示的信息预估模型。如图4所示,所述预设信息预估模型中并行设置的三个分支网络,预估点击概率的第一分支网络(如分支网络430)、预估转化概率的第二分支网络(如分支网络420)和预估商品价格的第三分支网络(分支网络440)。不同的所述分支网络分别用于执行基于所述编码向量预估不同的第一属性的任务。例如,分支网络420用于基于所述编码向量预估转化概率;分支网络430用于基于所述编码向量预估对点击概率;分支网络440用于基于所述编码向量预估商品价格。
其中,分支网络420和分支网络430可以基于二分类网络构建,分支网络440可以基于多分类网络或者回归网络构建。本申请实施例中,对二分类网络和回归网络的具体结构不做限定。
本申请的实施例中,当前预估图像信息替换为包括用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息时,所述通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值,进一步替换为:通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得所述用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息的、分别与各所述分支网络对应的第一属性值。
具体到本实施例而言,所述第一属性包括:点击概率、转化概率、商品价格,所述第二属性包括:商品成交额。
本申请实施例中,在通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量之前,还包括:基于若干条训练样本,训练所述预设信息预估模型。
在确定了信息预估模型的结构之后,基于若干有标注的训练样本训练所述信息预估模型。
即所述通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值之前,还包括:基于若干条训练样本,训练所述预设信息预估模型。其中,每条所述训练样本的样本数据为从不同用户的用户画像信息、用户历史行为信息、不同商家的商家画像信息中提取的与所述模型输入数据对应的信息,每条所述训练样本的样本标签用于指示相应样本数据匹配的点击概率真实值、成单概率真实值、商品成交额真实值。
本申请的一些实施例中,生成训练样本的信息来源于若干用户的用户画像数据、用户历史行为数据,若干商家的商家画像数据。之后,对于每个用户,通过提取该用户的用户画像信息、用户历史行为信息,该用户点击或下单的商家的商家画像信息中预设维度的信息,作为该用户对应的一条训练样本的样本数据,同时,为该训练样本设置样本标签,该样本标签用于指示提取该样本数据的信息是否为点击数据、是否为下单数据,以及产生的商品成交额。例如,训练样本可以表示为如{data[],label_ctr,label_cvr,label_gmv}的形式,其中,data[]表示样本数据,label_ctr表示样本是否点击样本的类别标签,label_cvr表示样本是否为下单样本的类别标签,label_gmv表示样本的商品成交额标签。
在模型训练过程中,对于每条所述训练样本,计算处理设备将分别执行如下操作:对所述样本数据进行编码,得到一样本数据编码向量;通过所述第一分支网络对所述样本数据编码向量进行特征映射,获得所述样本数据对应的点击概率预估值;以及,通过所述第二分支网络对所述样本数据编码向量进行特征映射,获得所述样本数据对应的转化概率预估值;以及,通过所述第三分支网络对所述样本数据编码向量进行特征映射,获得所述样本数据对应的商品价格预估值;通过所述预设信息预估模型的融合网络的第一隐层对所述点击概率预估值和所述转化概率预估值进行乘法运算,获得所述样本数据对应的成单概率预估值;通过所述融合网络的第二隐层对所述成单概率预估值和所述商品价格预估值进行乘法运算,输出所述样本数据匹配的商品成交额预估值;通过所述预设信息预估模型的损失函数,根据所述点击概率真实值、所述点击概率预估值、所述成单概率真实值、所述成单概率预估值、所述商品成交额预估值和所述商品成交额真实值,计算所述预设信息预估模型的损失值,并以所述损失值最小为目标,优化所述预设信息预估模型的网络参数,直至所述损失值收敛。
在模型训练过程中,计算处理设备通过执行所述预设信息预估模型中编码网络对应的计算机程序代码,对输入的每条训练样本的样本数据进行编码,得到一样本数据编码向量,之后,计算处理设备可以通过创建不同的线程,分别执行每个分支网络对应的计算机程序代码,对所述样本数据编码向量进行特征映射,分别输出所述样本数据对应的各第一属性预估值。例如,计算处理设备创建三个线程,分别执行分支网络420对应的计算机程序代码、分支网络430对应的计算机程序代码和分支网络440对应的计算机程序代码,对所述样本数据编码向量进行特征映射。例如,计算处理设备通过执行分支网络420对应的计算机程序代码,对所述样本数据编码向量进行特征映射之后,将获得当前训练样本对应的转化概率预估值;计算处理设备通过执行分支网络430对应的计算机程序代码,对所述样本数据编码向量进行特征映射之后,将获得当前训练样本对应的点击概率预估值;计算处理设备通过执行分支网络440对应的计算机程序代码,对所述样本数据编码向量进行特征映射之后,将获得当前训练样本对应的商品价格预估值。
接下来,计算处理设备执行融合网络450对应的计算机程序代码,对分支网络420、430和440输出的当前训练样本对应的点击概率预估值、转化概率预估值和商品价格预估值进行融合计算,得到当前训练样本对应的商品成交额预估值。
如图4所示,本申请的一些实施中,所述融合网络450包括第一隐层4501和第二隐层4502,所述计算处理设备通过执行所述融合网络450的第一隐层4501对应的计算机程序代码,对所述点击概率预估值和所述转化概率预估值进行乘法运算,获得所述样本数据对应的成单概率预估值;之后,通过执行所述融合网络450的第二隐层4502对应的计算机程序代码,对所述成单概率预估值和所述商品价格预估值进行乘法运算,输出所述样本数据匹配的商品成交额预估值。
接下来,所述计算处理设备进一步执行所述预设信息预估模型的损失函数对应的程序代码,根据所述点击概率真实值、所述点击概率预估值、所述成单概率真实值、所述成单概率预估值、所述商品成交额预估值和所述商品成交额真实值,计算所述预设信息预估模型的损失值,并采用误差反向传导和梯度下降法优化所述信息预估模型中,至少包括各分支网络、融合网络的网络参数,直至模型收敛,完成所述信息预估模型的训练过程。
本申请的一些实施例中,所述信息预估模型的损失函数根据分支网络420、430和440的损失值计算所述信息预估模型的损失值。即所述信息预估模型的损失函数的参数包括所述分支网络420、430和440的损失值。例如,所述信息预估模型的损失函数loss可以表示为:
loss=λ1cross_entropyctr+λ2cross_entropyctcvr+αλ3MSPEgmv,其中,λ1、λ2、λ3为权重系数,λ1+λ2+λ3=1,α为平衡cross_entropyctr、λ2cross_entropyctcvr和MSPEgmv的数值量级的缩放系数,α>0,cross_entropyctr表示点击概率预估结果损失值、cross_entropyctcvr表示成单概率预估结果损失值,MSPEgmv表示商品成交额预估结果损失值,MSPEgmv表示商品成交额真实值与预估值的均方比例误差。本申请实施例中,所述第一分支网络和所述第二分支网络为分类网络,所述第三分支网络为回归网络。因为商品成交额预估属于回归问题,数值无明确范围,可大可小。而点击概率,成单概率预估结果为概率,值域在[0,1],因此,对于商品成交额的训练目标,需要配以缩放系数,将商品成交额的损失值与点击概率,成单概率两个训练目标取值在同一量级,以加快模型收敛速度。
并且,针对点击概率、成单概率(即第一属性)和商品成交额(即第二属性)的取值数量级不同的问题,本申请实施例采用计算商品成交额的真实值和预估值的均方比例误差作为融合网络的损失值。例如,商品成交额真实值与预估值的均方比例误差可以通过如下公式计算:其中,true表示当前训练样本对应的商品成交额真实值,pred表示当前训练样本对应的商品成交额预估值,N为样本数量。/>
因为商品成交额取值没有限定边界,因此与点击概率,成单概率等概率相比,数值量级差距会较大。用商品成交额的真实值与预估值做差,再除以真实值,则表示预估值与真实值偏离的百分比,即预估值预估的离谱程度,此数值取值范围在0-1之间,与点击概率,成单概率相同,能使模型更快收敛。
步骤320,通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量。
在获取到模型输入数据之后,将获取的所述模型输入数据输入至所述预设信息预估模型,通过所述信息预估模型的编码网络410对所述模型输入数据进行编码处理,得到一指定维度的编码向量。
基于用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,获取的模型输入数据包括多个维度,因此,获取的模型输入数据中可能包括离散数值型数据也可能包括连续数值型数据,需要对模型数据进行统一编码。
本申请的一些实施例中,所述通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量,包括:提取所述用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息中预设离散数值型信息,并对提取的所述预设离散数值型信息进行特征矩阵化处理,得到第一矩阵向量;提取所述用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息中预设连续型信息,并对提取的所述连续型信息进行归一化处理,得到第二向量;将所述第一矩矩阵向量和第二向量进行拼接,得到一编码向量。
例如,对于用户性别、常驻地、商家地理位置、品类等离散数值型数据,进行特征矩阵化处理(embedding),得到第一矩阵向量。同时,对用户年龄、商品历史点击数量、历史订单数量、商家好平率等连续数值型数据进行归一化处理,得到第二矩阵向量。之后,将第一矩阵向量和第二矩阵向量拼接为统一编码的编码向量。
本申请实施例对编码网络的具体实施方式不做限定。所述编码网络410可以采用与模型输入数据相匹配的网络结构和编码方法,以便可以针对一定格式的模型输入数据进行编码处理。
步骤330,通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值。
其中,不同的所述分支网络分别基于所述编码向量预估不同的第一属性,不同的所述第一属性与所述预设信息预估模型预估的第二属性之间满足贝叶斯法则。
接下来,分支网络420、430和440将分别获取到编码网络410输出的编码向量,并对所述编码向量进行特征映射,以预估相应的第一属性。
信息预估模型训练完成之后,则可以用于基于与训练样本中样本数据格式和维度内容相同模型输入数据,进行商品成交额预估。
在应用信息预估模型进行商品成交额预估的过程中,计算处理设备可以通过不同的线程分别执行信息预估模型的分支网络420、430和440对应的计算机程序代码,同时分别对编码网络410输出的编码向量进行特征映射,以输出相应的第一属性值。本申请的实施例中,所述第一属性替换为点击概率、转化概率、商品价格时,所述预设信息预估模型中并行设置预估点击概率的第一分支网络、预估转化概率的第二分支网络和预估商品价格的第三分支网络,所述通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值的步骤,包括:通过所述第一分支网络对所述编码向量进行特征映射,获得所述模型输入数据对应的点击概率预估值;以及,通过所述第二分支网络对所述编码向量进行特征映射,获得所述模型输入数据对应的转化概率预估值;以及,通过所述第三分支网络对所述编码向量进行特征映射,获得所述模型输入数据对应的商品价格预估值。
例如,计算处理设备启动三个线程,通过各线程分别执行分支网络420、430和440对应的程序代码。其中,计算处理设备通过执行分支网络420对应的程序代码,对所述编码向量进行特征映射,获得当前用户对当前商家的转换概率预估值;计算处理设备通过执行分支网络430对应的程序代码,对所述编码向量进行特征映射,获得当前用户对当前商家的点击概率预估值;计算处理设备通过执行分支网络440对应的程序代码,对所述编码向量进行特征映射,获得当前用户在当前商家成单的商品价格预估值。
步骤340,通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述模型输入数据匹配的第二属性值。
在当前预估图像替换为用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息时,所述通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值的步骤,包括:通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述模型输入数据匹配的第二属性值。
本申请的实施例中,所述第一属性替换为点击概率、转化概率、商品价格,所述第二属性替换为商品成交额时,所述通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述模型输入数据匹配的第二属性值,包括:通过所述预设信息预估模型的融合网络的第一隐层对所述第一分支网络输出的所述点击概率和所述第二分支网络输出的所述转化概率进行乘法运算,得到所述模型输入数据对应的成单概率值;通过所述融合网络的第二隐层对所述成单概率值和所述第三分支网络输出的所述商品价格进行乘法运算,得到所述模型输入数据匹配的商品成交额。
例如,计算处理设备执行信息预估模型的融合网络450的第一隐层4501对应的计算机程序代码,对分支网络420输出的转化概率预估值、分支网络430输出的点击概率预估值进行乘法运算,得到当前用户对当前商家的成单概率预估值;接下来,计算处理设备执行所述融合网络450的第二隐层4502对所述成单概率值和所述分支网络440输出的所述商品价格进行乘法运算,得到当前用户对当前商家的商品成交额预估值。
本申请实施例公开的信息预估方法,通过基于用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,获取模型输入数据;通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值,有助于提升基于用户数据和商家数据预估用户对商家的商品成交额的运算效率。
通过将预估目标拆分为多个子目标,并通过构建不同的分支网络,使得计算处理设备可以并行执行部分模型代码,可以提升模型的训练和识别运算效率。另一方面,由于所述信息预估模型包括多个训练目标,即模型的损失函数的参数包括多个属性信息的损失值,相比于只对一个目标进行训练,从输入数据中提取多种信息进行运算,可以提升模型识别的准确度。
实施例三
本实施例公开的一种信息预估装置,如图5所示,所述装置包括:
模型输入数据获取模块510,用于基于当前预估图像信息,获取模型输入数据;
编码模块520,用于通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;
并行特征映射模块530,用于通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值;其中,不同的所述分支网络分别基于所述编码向量预估不同的第一属性,不同的所述第一属性与所述预设信息预估模型预估的第二属性之间满足贝叶斯法则;
融合计算模块540,用于通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值。
本申请的一些实施例中,所述第一属性包括:所述当前预估图像中目标对象为人类的概率、所述目标对象的性别、年龄段;其中,所述第二属性值用于指示所述当前预估图像中包括以下任意一类对象:中年男性、青年男性、老年男性、中年女性、老年女性、青年女性。
本申请的一些实施例中,所述通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值之前,还包括:
基于若干条训练样本,训练所述预设信息预估模型;其中,每条所述训练样本的样本数据为基于不同图像获取的模型输入数据,每条所述训练样本的样本标签用于指示相应模型输入数据匹配的第二属性真实值和至少一所述第一属性真实值;
对于每条所述训练样本,计算处理设备将分别执行如下操作:
对所述样本数据进行编码,得到一样本数据编码向量;
通过所述预设信息预估模型中并行设置的所述多个分支网络分别对所述样本数据编码向量进行特征映射,分别获得所述样本数据与相应分支网络对应的第一属性预估值;
通过所述预设信息预估模型的融合网络对所述第一属性预估值进行融合计算,输出所述样本数据对应的第二属性预估值;
通过所述预设信息预估模型的损失函数,根据部分或全部所述分支网络输出的第一属性预估值和对应的第一属性真实值、所述第二属性预估值和所述第二属性真实值计算所述预设信息预估模型的损失值,并以所述损失值最小为目标,优化所述预设信息预估模型的网络参数,直至所述损失值收敛。本实施例公开的信息预估装置,用于实现本申请实施例一中所述的信息预估方法,装置的各模块的具体实施方式不再赘述,可参见方法实施例相应步骤的具体实施方式。
本申请实施例公开的信息预估装置,通过基于当前预估图像信息,获取模型输入数据;通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值;其中,不同的所述分支网络分别基于所述编码向量预估不同的第一属性,不同的所述第一属性与所述预设信息预估模型预估的第二属性之间满足贝叶斯法则;通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值,有助于提升预估图像中人物身份属性信息的运算效率。
通过将预估目标拆分为多个子目标,并通过构建不同的分支网络,使得计算处理设备可以并行执行部分模型代码,可以提升模型的训练和识别运算效率。另一方面,由于所述信息预估模型包括多个训练目标,即模型的损失函数的参数包括多个属性信息的损失值,相比于只对一个目标进行训练,从输入数据中提取多种信息进行运算,可以提升模型识别的准确度。
实施例四
本实施例公开的一种信息预估装置,如图6所示,所述装置包括:模型输入数据获取模块610、编码模块620、并行特征映射模块630,以及融合计算模块640。
当前预估图像信息替换为包括用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,所述模型输入数据获取模块610,还用于:
基于用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,获取模型输入数据;
所述编码模块620,用于通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;
相应的,所述第一属性替换为点击概率、转化概率、商品价格时,所述预设信息预估模型中并行设置预估点击概率的第一分支网络、预估转化概率的第二分支网络和预估商品价格的第三分支网络,所述并行特征映射模块630,还用于:
通过所述第一分支网络对所述编码向量进行特征映射,获得所述模型输入数据对应的点击概率预估值;以及,通过所述第二分支网络对所述编码向量进行特征映射,获得所述模型输入数据对应的转化概率预估值;以及,通过所述第三分支网络对所述编码向量进行特征映射,获得所述模型输入数据对应的商品价格预估值。
所述第二属性替换为商品成交额时,所述融合计算模块640,还用于:
通过所述预设信息预估模型的融合网络的第一隐层对所述第一分支网络输出的所述点击概率和所述第二分支网络输出的所述转化概率进行乘法运算,得到所述模型输入数据对应的成单概率值;
通过所述融合网络的第二隐层对所述成单概率值和所述第三分支网络输出的所述商品价格进行乘法运算,得到所述模型输入数据匹配的商品成交额。
本申请的一些实施例中,所述第一属性替换为点击概率、转化概率、商品价格时,所述预设信息预估模型中并行设置预估点击概率的第一分支网络、预估转化概率的第二分支网络和预估商品价格的第三分支网络,所述通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量之前,所述装置还包括:
模型训练模块650,用于基于若干条训练样本,训练所述预设信息预估模型;其中,每条所述训练样本的样本数据为从不同用户的用户画像信息、用户历史行为信息、不同商家的商家画像信息中提取的与所述模型输入数据对应的信息,每条所述训练样本的样本标签用于指示相应样本数据匹配的点击概率真实值、成单概率真实值、商品成交额真实值;
对于每条所述训练样本,计算处理设备将分别执行如下操作:
对所述样本数据进行编码,得到一样本数据编码向量;
通过所述第一分支网络对所述样本数据编码向量进行特征映射,获得所述样本数据对应的点击概率预估值;以及,通过所述第二分支网络对所述样本数据编码向量进行特征映射,获得所述样本数据对应的转化概率预估值;以及,通过所述第三分支网络对所述样本数据编码向量进行特征映射,获得所述样本数据对应的商品价格预估值;
通过所述预设信息预估模型的融合网络的第一隐层对所述点击概率预估值和所述转化概率预估值进行乘法运算,获得所述样本数据对应的成单概率预估值;
通过所述融合网络的第二隐层对所述成单概率预估值和所述商品价格预估值进行乘法运算,输出所述样本数据匹配的商品成交额预估值;
通过所述预设信息预估模型的损失函数,根据所述点击概率真实值、所述点击概率预估值、所述成单概率真实值、所述成单概率预估值、所述商品成交额预估值和所述商品成交额真实值,计算所述预设信息预估模型的损失值,并以所述损失值最小为目标,优化所述预设信息预估模型的网络参数,直至所述损失值收敛。
本申请的一些实施例中,所述第一属性替换为点击概率、转化概率、商品价格时,所述预设信息预估模型中并行设置预估点击概率的第一分支网络、预估转化概率的第二分支网络和预估商品价格的第三分支网络,所述第一分支网络和所述第二分支网络为分类网络,所述第三分支网络为回归网络,所述预设信息预估模型的损失函数loss表示为:
loss=λ1cross_entropyctr+λ2cross_entropyctcvr+αλ3MSPEgmv,其中,λ1、λ2、λ3为权重系数,λ1+λ2+λ3=1,α为平衡cross_entropyctr、λ2cross_entropyctcvr和MSPEgmv的数值量级的缩放系数,α>0,cross_entropyctr表示点击概率预估结果损失值、cross_entropyctcvr表示成单概率预估结果损失值,MSPEgmv表示商品成交额预估结果损失值,MSPEgmv表示商品成交额真实值与预估值的均方比例误差。
本实施例公开的信息预估装置,用于实现本申请实施例二中所述的信息预估方法,装置的各模块的具体实施方式不再赘述,可参见方法实施例相应步骤的具体实施方式。
本申请实施例公开的信息预估装置,通过基于用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,获取模型输入数据;通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值,有助于提升基于用户数据和商家数据预估用户对商家的商品成交额的运算效率。
通过将预估目标拆分为多个子目标,并通过构建不同的分支网络,使得计算处理设备可以并行执行部分模型代码,可以提升模型的训练和识别运算效率。另一方面,由于所述信息预估模型包括多个训练目标,即模型的损失函数的参数包括多个属性信息的损失值,相比于只对一个目标进行训练,从输入数据中提取多种信息进行运算,可以提升模型识别的准确度。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上对本申请提供的一种信息预估方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其一种核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的电子设备中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
例如,图7示出了可以实现根据本申请的方法的电子设备。所述电子设备可以为PC机、移动终端、个人数字助理、平板电脑等。该电子设备传统上包括处理器710和存储器720及存储在所述存储器720上并可在处理器710上运行的程序代码730,所述处理器710执行所述程序代码730时实现上述实施例中所述的方法。所述存储器720可以为计算机程序产品或者计算机可读介质。存储器720可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器720具有用于执行上述方法中的任何方法步骤的计算机程序的程序代码730的存储空间7201。例如,用于程序代码730的存储空间7201可以包括分别用于实现上面的方法中的各种步骤的各个计算机程序。所述程序代码730为计算机可读代码。这些计算机程序可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(CD)、存储卡或者软盘之类的程序代码载体。所述计算机程序包括计算机可读代码,当所述计算机可读代码在电子设备上运行时,导致所述电子设备执行根据上述实施例的方法。
本申请实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例一所述的信息预估方法的步骤。
这样的计算机程序产品可以为计算机可读存储介质,该计算机可读存储介质可以具有与图7所示的电子设备中的存储器720类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩存储在所述计算机可读存储介质中。所述计算机可读存储介质通常为如参考图8所述的便携式或者固定存储单元。通常,存储单元包括计算机可读代码730’,所述计算机可读代码730’为由处理器读取的代码,这些代码被处理器执行时,实现上面所描述的方法中的各个步骤。
本文中所称的“一个实施例”、“实施例”或者“一个或者多个实施例”意味着,结合实施例描述的特定特征、结构或者特性包括在本申请的至少一个实施例中。此外,请注意,这里“在一个实施例中”的词语例子不一定全指同一个实施例。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (7)
1.一种信息预估方法,其特征在于,包括:
基于当前预估图像信息,获取模型输入数据;
通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量;
通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值;其中,不同的所述分支网络分别基于所述编码向量预估不同的第一属性,不同的所述第一属性与所述预设信息预估模型预估的第二属性之间满足贝叶斯法则;
通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值;
其中,当所述第一属性为点击概率、转化概率、商品价格时,所述预设信息预估模型中并行设置预估点击概率的第一分支网络、预估转化概率的第二分支网络和预估商品价格的第三分支网络,所述通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值的步骤,包括:
通过所述第一分支网络对所述编码向量进行特征映射,获得所述模型输入数据对应的点击概率预估值;以及,通过所述第二分支网络对所述编码向量进行特征映射,获得所述模型输入数据对应的转化概率预估值;以及,通过所述第三分支网络对所述编码向量进行特征映射,获得所述模型输入数据对应的商品价格预估值,
当所述第二属性为商品成交额时,所述通过所述预设信息预估模型的融合网络对各所述分支网络输出的相应所述第一属性值,进行融合计算,得到所述当前预估图像匹配的第二属性值的步骤,包括:
通过所述预设信息预估模型的融合网络的第一隐层对所述第一分支网络输出的所述点击概率和所述第二分支网络输出的所述转化概率进行乘法运算,得到所述模型输入数据对应的成单概率值;
通过所述融合网络的第二隐层对所述成单概率值和所述第三分支网络输出的所述商品价格进行乘法运算,得到所述模型输入数据匹配的商品成交额。
2.根据权利要求1所述的方法,其特征在于,当所述第一属性包括:所述当前预估图像中目标对象为人类的概率、所述目标对象的性别、年龄段;所述第二属性值用于指示所述当前预估图像中包括以下任意一类对象:中年男性、青年男性、老年男性、中年女性、老年女性、青年女性。
3.根据权利要求1所述的方法,其特征在于,所述通过所述预设信息预估模型中并行设置的多个分支网络分别对所述编码向量进行特征映射,获得与各自分支网络对应的第一属性值的步骤之前,还包括:
基于若干条训练样本,训练所述预设信息预估模型;其中,每条所述训练样本的样本数据为基于不同图像获取的模型输入数据,每条所述训练样本的样本标签用于指示相应模型输入数据匹配的第二属性真实值和至少一所述第一属性真实值;
对于每条所述训练样本,计算处理设备将分别执行如下操作:
对所述样本数据进行编码,得到一样本数据编码向量;
通过所述预设信息预估模型中并行设置的所述多个分支网络分别对所述样本数据编码向量进行特征映射,分别获得所述样本数据与相应分支网络对应的第一属性预估值;
通过所述预设信息预估模型的融合网络对所述第一属性预估值进行融合计算,输出所述样本数据对应的第二属性预估值;
通过所述预设信息预估模型的损失函数,根据部分或全部所述分支网络输出的第一属性预估值和对应的第一属性真实值、所述第二属性预估值和所述第二属性真实值计算所述预设信息预估模型的损失值,并以所述损失值最小为目标,优化所述预设信息预估模型的网络参数,直至所述损失值收敛。
4.根据权利要求1所述的方法,其特征在于,所述当前预估图像信息为包括用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,所述基于当前预估图像信息,获取模型输入数据的步骤,包括:
基于用户画像信息、用户历史行为信息、商家画像信息中的一项或多项信息,获取模型输入数据。
5.根据权利要求4所述的方法,其特征在于,当所述第一属性为点击概率、转化概率、商品价格时,所述预设信息预估模型中并行设置预估点击概率的第一分支网络、预估转化概率的第二分支网络和预估商品价格的第三分支网络,所述通过预设信息预估模型中的编码网络,对所述模型输入数据进行编码,得到一编码向量的步骤之前,还包括:
基于若干条训练样本,训练所述预设信息预估模型;其中,每条所述训练样本的样本数据为从不同用户的用户画像信息、用户历史行为信息、不同商家的商家画像信息中提取的与所述模型输入数据对应的信息,每条所述训练样本的样本标签用于指示相应样本数据匹配的点击概率真实值、成单概率真实值、商品成交额真实值;
对于每条所述训练样本,计算处理设备将分别执行如下操作:
对所述样本数据进行编码,得到一样本数据编码向量;
通过所述第一分支网络对所述样本数据编码向量进行特征映射,获得所述样本数据对应的点击概率预估值;以及,通过所述第二分支网络对所述样本数据编码向量进行特征映射,获得所述样本数据对应的转化概率预估值;以及,通过所述第三分支网络对所述样本数据编码向量进行特征映射,获得所述样本数据对应的商品价格预估值;
通过所述预设信息预估模型的融合网络的第一隐层对所述点击概率预估值和所述转化概率预估值进行乘法运算,获得所述样本数据对应的成单概率预估值;
通过所述融合网络的第二隐层对所述成单概率预估值和所述商品价格预估值进行乘法运算,输出所述样本数据匹配的商品成交额预估值;
通过所述预设信息预估模型的损失函数,根据所述点击概率真实值、所述点击概率预估值、所述成单概率真实值、所述成单概率预估值、所述商品成交额预估值和所述商品成交额真实值,计算所述预设信息预估模型的损失值,并以所述损失值最小为目标,优化所述预设信息预估模型的网络参数,直至所述损失值收敛。
6.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的程序代码,其特征在于,所述处理器执行所述程序代码时实现权利要求1至5任意一项所述的信息预估方法。
7.一种计算机可读存储介质,其上存储有程序代码,其特征在于,该程序代码被处理器执行时实现权利要求1至5任意一项所述的信息预估方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010582024.8A CN111881747B (zh) | 2020-06-23 | 2020-06-23 | 信息预估方法、装置,电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010582024.8A CN111881747B (zh) | 2020-06-23 | 2020-06-23 | 信息预估方法、装置,电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111881747A CN111881747A (zh) | 2020-11-03 |
CN111881747B true CN111881747B (zh) | 2024-05-28 |
Family
ID=73157029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010582024.8A Active CN111881747B (zh) | 2020-06-23 | 2020-06-23 | 信息预估方法、装置,电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111881747B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446327A (zh) * | 2010-10-15 | 2012-05-09 | 汉王科技股份有限公司 | 基于人脸识别的广告投放装置及广告投放方法 |
CN107483988A (zh) * | 2017-08-11 | 2017-12-15 | 环球智达科技(北京)有限公司 | 基于图像信息统计的推送方法 |
CN108460089A (zh) * | 2018-01-23 | 2018-08-28 | 哈尔滨理工大学 | 基于Attention神经网络的多元特征融合中文文本分类方法 |
CN109242499A (zh) * | 2018-09-19 | 2019-01-18 | 中国银行股份有限公司 | 一种交易风险预测的处理方法、装置及系统 |
CN109272356A (zh) * | 2018-09-19 | 2019-01-25 | 电子科技大学 | 基于关键词广告的最优竞价策略方法 |
CN109886314A (zh) * | 2019-01-29 | 2019-06-14 | 淮阴工学院 | 一种基于pnn神经网络的餐厨废弃油检测方法及其装置 |
CN110532970A (zh) * | 2019-09-02 | 2019-12-03 | 厦门瑞为信息技术有限公司 | 人脸2d图像的年龄性别属性分析方法、系统、设备和介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8788438B2 (en) * | 2011-11-22 | 2014-07-22 | Telefonaktiebolaget L M Ericsson (Publ) | Method performed in a computer system for aiding the assessment of an influence of a user in or interacting with a communication system by applying social network analysis, SNA, functions, a computer system, computer program and computer program product |
-
2020
- 2020-06-23 CN CN202010582024.8A patent/CN111881747B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102446327A (zh) * | 2010-10-15 | 2012-05-09 | 汉王科技股份有限公司 | 基于人脸识别的广告投放装置及广告投放方法 |
CN107483988A (zh) * | 2017-08-11 | 2017-12-15 | 环球智达科技(北京)有限公司 | 基于图像信息统计的推送方法 |
CN108460089A (zh) * | 2018-01-23 | 2018-08-28 | 哈尔滨理工大学 | 基于Attention神经网络的多元特征融合中文文本分类方法 |
CN109242499A (zh) * | 2018-09-19 | 2019-01-18 | 中国银行股份有限公司 | 一种交易风险预测的处理方法、装置及系统 |
CN109272356A (zh) * | 2018-09-19 | 2019-01-25 | 电子科技大学 | 基于关键词广告的最优竞价策略方法 |
CN109886314A (zh) * | 2019-01-29 | 2019-06-14 | 淮阴工学院 | 一种基于pnn神经网络的餐厨废弃油检测方法及其装置 |
CN110532970A (zh) * | 2019-09-02 | 2019-12-03 | 厦门瑞为信息技术有限公司 | 人脸2d图像的年龄性别属性分析方法、系统、设备和介质 |
Non-Patent Citations (6)
Title |
---|
DCCR: Deep Collaborative Conjunctive Recommender for Rating Prediction;Qingxian Wang 等;《IEEE Access》;20190508;第7卷;第60186 – 60198页 * |
Multi-branch CNN for Multi-scale Age Estimation;Marco Del Coco 等;《Image Analysis and Processing》;20171013;第234–244页 * |
Multi-objective evolutionary feature selection for online sales forecasting;F. Jiménez 等;《Neurocomputing》;20170419;第234卷;第75-92页 * |
基于人工神经网络的商品销售额预测;白杨 等;《宁波高等专科学校学报》;20030625;第15卷(第2期);第7-9页 * |
基于深度学习的人脸年龄段分类研究与应用;耿凯悦;《中国优秀硕士学位论文全文数据库 信息科技辑(月刊)》;20181115(第11期);第I138-388页 * |
微博舆情分析系统关键技术研究;谢乾龙;《中国优秀硕士学位论文全文数据库 信息科技辑(月刊)》;20131115(第11期);第I138-1056页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111881747A (zh) | 2020-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110020877B (zh) | 点击率的预测方法、点击率的确定方法及服务器 | |
CN113379449B (zh) | 多媒体资源召回方法、装置、电子设备以及存储介质 | |
CN111667024B (zh) | 内容推送方法、装置、计算机设备和存储介质 | |
CN112348592A (zh) | 广告推荐方法、装置、电子设备及介质 | |
US20230342797A1 (en) | Object processing method based on time and value factors | |
CN113239702A (zh) | 意图识别方法、装置、电子设备 | |
CN114240555A (zh) | 训练点击率预测模型和预测点击率的方法和装置 | |
CN114862010A (zh) | 一种基于时空数据的流量确定方法、装置、设备和介质 | |
CN115564517A (zh) | 商品推荐方法、预测模型训练方法和相关设备 | |
CN115018552A (zh) | 产品点击率确定方法 | |
CN115730125A (zh) | 对象识别方法、装置、计算机设备和存储介质 | |
CN113592593A (zh) | 序列推荐模型的训练及应用方法、装置、设备及存储介质 | |
CN112348590A (zh) | 一种物品价值确定方法、装置、电子设备和存储介质 | |
CN111881747B (zh) | 信息预估方法、装置,电子设备 | |
CN116578400A (zh) | 多任务数据处理方法和装置 | |
CN116340635A (zh) | 物品推荐方法、模型训练方法、装置及设备 | |
CN115952928A (zh) | 一种短期电力负荷预测方法、装置、设备及存储介质 | |
CN111178987B (zh) | 训练用户行为预测模型的方法和装置 | |
CN112559640B (zh) | 图谱表征系统的训练方法及装置 | |
CN115618079A (zh) | 会话推荐方法、装置、电子设备及存储介质 | |
CN115222112A (zh) | 一种行为预测方法、行为预测模型的生成方法及电子设备 | |
CN115796984A (zh) | 物品推荐模型的训练方法、存储介质及相关设备 | |
CN113255891B (zh) | 对事件特征进行处理的方法、神经网络模型和装置 | |
CN117391713A (zh) | 信息推送方法及装置、电子设备和存储介质 | |
CN114912934A (zh) | 用户意愿识别方法、装置以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |