CN113626716A - 数据处理方法、电子设备及存储介质 - Google Patents
数据处理方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN113626716A CN113626716A CN202110992088.XA CN202110992088A CN113626716A CN 113626716 A CN113626716 A CN 113626716A CN 202110992088 A CN202110992088 A CN 202110992088A CN 113626716 A CN113626716 A CN 113626716A
- Authority
- CN
- China
- Prior art keywords
- matrix
- fusion
- feature
- attribute
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract description 17
- 230000004927 fusion Effects 0.000 claims abstract description 396
- 239000011159 matrix material Substances 0.000 claims abstract description 388
- 239000013598 vector Substances 0.000 claims abstract description 248
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 182
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000012549 training Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 12
- 238000003062 neural network model Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 15
- 238000000605 extraction Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 9
- 230000003993 interaction Effects 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种数据处理方法、电子设备及存储介质,应用于数据处理技术领域。其中方法包括:获取推荐对象的第一对象属性和第二对象属性,将第一对象属性输入推荐模型得到第一对象特征向量,并将第二对象属性输入推荐模型得到第二对象特征向量,获取推荐模型中的特征融合矩阵,并对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,根据第一分解矩阵和第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量,根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。采用本申请实施例,可以提高针对推荐对象(如视频)的预测准确率。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据处理方法、电子设备及存储介质。
背景技术
目前,在推荐场景中,可以预测推荐对象的推荐指标(如点击率),进而通过推荐对象的推荐指标对推荐对象进行排序推荐。在预测时,可以基于推荐对象的多种对象属性获取多种对象特征向量,并对该多种对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量,后续可以根据融合对象特征向量进行推荐指标的预测。现有的特征融合方法通常是将该多种对象特征向量进行拼接,以作为融合对象特征向量。然而,该融合方式使得多种对象特征向量间的特征信息交互较浅,导致预测准确率低。因此,如何提高针对推荐对象的预测准确率成为一个亟待解决的问题。
发明内容
本申请实施例提供了一种数据处理方法、电子设备及存储介质,可以有效地提高针对推荐对象的预测准确率。
一方面,本申请实施例提供了一种数据处理方法,该方法包括:
获取推荐对象的第一对象属性和第二对象属性;
将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量;该推荐模型为基于样本对象的第一样本对象属性、第二样本对象属性以及针对样本对象的样本推荐指标训练得到的;
获取推荐模型中的特征融合矩阵,并对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵;
根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量;
根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。
一方面,本申请实施例提供了一种数据处理装置,该装置包括:
获取模块,用于获取推荐对象的第一对象属性和第二对象属性;
输入模块,用于将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量;该推荐模型为基于样本对象的第一样本对象属性、第二样本对象属性以及针对样本对象的样本推荐指标训练得到的;
分解模块,用于获取推荐模型中的特征融合矩阵,并对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵;
融合模块,用于根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量;
生成模块,用于根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。
一方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,其中,存储器用于存储计算机程序,该计算机程序包括程序指令,处理器被配置用于调用该程序指令,执行上述方法中的部分或全部步骤。
一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时,用于执行上述方法中的部分或全部步骤。
相应地,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括程序指令,该程序指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该程序指令,处理器执行该程序指令,使得该计算机设备执行上述提供的数据处理方法。
本申请实施例中可以获取推荐对象的第一对象属性和第二对象属性,将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量,获取推荐模型中的特征融合矩阵,并对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量,根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。通过实施上述所提出的方法,通过结合特征融合矩阵对多种对象特征向量进行特征融合,可以加强特征间的交互,以提高基于融合对象特征向量进行推荐指标的预测准确性,此外,在进行特征融合时,可以通过针对特征融合矩阵的分解矩阵来实现特征融合,以使得可以减少特征融合时所使用的参数量,进而可以降低模型在此阶段的复杂度以及提高模型的预测效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种应用架构示意图;
图2为本申请实施例提供的一种数据处理方法的流程示意图;
图3为本申请实施例提供的一种数据处理方法的流程示意图;
图4为本申请实施例提供的一种确定融合对象特征向量的场景示意图;
图5a为本申请实施例提供的一种应用场景示意图;
图5b为本申请实施例提供的一种应用场景示意图;
图6为本申请实施例提供的一种确定预测推荐指标的场景示意图;
图7为本申请实施例提供的一种数据处理装置的结构示意图;
图8为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
本申请实施例提出的数据处理方法实现于电子设备,该电子设备可以是服务器,也可以是终端。其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、智能语音交互设备、智能家电、车载终端、台式计算机、智能音箱、智能手表等,但并不局限于此。
本申请实施例涉及机器学习技术领域,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
在一些实施例中,请参见图1,图1为本申请实施例提供的一种应用架构示意图,可以通过该应用架构执行本申请所提出的数据处理方法。如图1所示,图1可包括终端设备、电子设备,以及部署在电子设备中的推荐模型。电子设备可以基于推荐模型对多个推荐对象进行预测,得到针对每个推荐对象的预测推荐指标,电子设备可以根据每个推荐对象的预测推荐指标对多个推荐对象进行排序,并将排序后的多个推荐对象发送给终端设备进行显示。其中,上述推荐模型可以包括特征提取层、特征融合层以及特征预测层,该特征提取层可以用于对电子设备输入的推荐对象的第一对象属性进行特征提取,得到推荐对象的第一对象特征向量,以及可以用于对电子设备输入的推荐对象的第二对象属性进行特征提取,得到推荐对象的第二对象特征向量;该特征融合层可以用于对第一对象特征向量和第二对象特征向量进行特征融合得到针对推荐对象的融合对象特征向量;该特征预测层可以用于对融合对象特征向量进行预测生成针对推荐对象的预测推荐指标。后续,电子设备可以结合该推荐对象的预测推荐指标进行推荐对象的推送。
可以理解的是,图1只是示例性地表征本申请技术方案的可能存在的应用架构,并不对本申请技术方案的具体架构进行限定,即本申请技术方案还可以提供其他形式的应用架构。
可选的,在一些实施例中,电子设备可根据实际的业务需求,执行该数据处理方法以提高针对推荐对象的预测准确率和预测效率。本申请技术方案可以应用于任意推荐场景中,即电子设备可以获取推荐对象的多种对象属性(如第一对象属性和第二对象属性),并对多种对象属性执行本申请技术方案中包含的特征融合步骤,得到针对推荐对象的融合对象特征向量,并根据推荐模型和融合对象特征向量进行预测得到针对推荐对象的预测推荐指标。
例如,本申请技术方案可以应用于图文数据的推荐场景,此时推荐对象为图文数据(如视频等),第一对象属性可以是图文数据的文本属性(如视频标题),第二对象属性可以是图文数据的图像属性(如视频封面帧),预测推荐指标可以为针对图文数据的预测点击率。又如,本申请技术方案还可以应用于音频数据的推荐场景中,此时推荐对象为音频数据(如音乐软件上某歌单的歌曲),第一对象数据可以是音频数据的文本属性(如歌曲标题),第二对象数据也可以是音频数据的文本属性(如歌曲简介),预测推荐指标可以是为针对音频数据的预测播放率。
可选的,本申请涉及的数据如推荐对象的预测推荐指标等,可以存储于数据库中,或者可以存储于区块链中,如通过区块链分布式系统存储,本申请不做限定。
可以理解,上述场景仅是作为示例,并不构成对于本申请实施例提供的技术方案的应用场景的限定,本申请的技术方案还可应用于其他场景。例如,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
基于上述的描述,本申请实施例提出了一种数据处理方法,该方法可以由上述提及的电子设备来执行。请参见图2,图2为本申请实施例提供的一种数据处理方法的流程示意图。如图2所示,本申请实施例的数据处理方法的流程可以包括如下:
S201、获取推荐对象的第一对象属性和第二对象属性。
其中,推荐对象可以是任意可进行推荐的对象,如视频、商品,或新闻等。此处对推荐对象的具体类型不作限制。以及第一对象属性和第二对象属性用于表示推荐对象的不同维度的特征,第一对象属性和第二对象属性可以由相关业务人员根据实际应用场景设置,此处不作限制。例如,以推荐对象为视频为例,第一对象属性可以是视频的标题信息,第二对象属性可以是视频的封面帧信息。
可选的,电子设备还可以获取推荐对象的多种(两种以上)对象属性,并根据该多种对象属性得到针对推荐对象的融合对象特征向量,以用于推荐对象的推荐指标的预测。
S202、将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量。
在一个可能的实施方式中,推荐模型可以包括特征提取层,电子设备可以将第一对象属性输入推荐模型,由特征提取层对第一对象属性进行处理,得到推荐对象的第一对象特征向量,该第一对象特征向量可以理解为是推荐模型学习到的第一对象属性的特征,以及可以将第二对象属性输入推荐模型,由特征提取层对第二对象属性进行处理,得到推荐对象的第二对象特征向量,该第二对象特征向量可以理解为是推荐模型学习到的第二对象属性的特征。其中,第一对象特征向量中的元素个数与第二对象特征向量中的元素个数可以相同也可以不相同。即第一对象特征向量表示为f1∈R1*n,第二对象特征向量表示为f2∈R1*m,n与m可以相同或不同。
S203、获取推荐模型中的特征融合矩阵,并对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵。
在一个可能的实施方式中,推荐模型可以包括特征融合层,电子设备可以获取推荐模型包括的特征融合层中的特征融合矩阵,并使用特征融合矩阵对第一对象特征向量和第二对象特征向量进行特征融合;该特征融合矩阵可以为一个或多个。在一些实施例中,特征融合矩阵可以表示为W∈Rn*m,该特征融合矩阵的维度可以是n*m,即特征融合矩阵的行数等于第一对象特征向量的元素个数,特征融合矩阵的列数等于第二对象特征向量的元素个数。
在一些实施例中,电子设备可以在特征融合层中将获取到的推荐模型中的特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,并利用第一分解矩阵和第二分解矩阵进行特征融合,可以实现在基于特征融合矩阵加深特征交互以提高模型预测准确性的基础上,通过对特征融合矩阵进行分解,利用第一分解矩阵和第二分解矩阵还可以使得减少所使用的的参数量,进而提高模型预测效率。可选的,电子设备对特征融合矩阵进行分解即可以是将该特征融合矩阵分解为第一矩阵(U∈Rn*k,k可以由相关业务人员根据经验值设置)与第二矩阵(V∈Rk*m)的乘积,并将第一矩阵作为第一分解矩阵,第二矩阵作为第二分解矩阵。通过将特征融合矩阵进行分解(即张量分解方式)得到第一分解矩阵和第二分解矩阵之后再进行特征融合,可以实现将第一分解矩阵和第二分解矩阵近似特征融合矩阵,以使得在加深特征间交互的同时减少参数量。
S204、根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量。
在一个可能的实施方式中,电子设备可以在特征融合层中利用第一分解矩阵和第一对象特征向量得到第一融合特征矩阵,并利用第二分解矩阵和第二对象特征向量得到第二融合特征矩阵,并根据第一融合特征矩阵和第二融合特征矩阵生成针对推荐对象的融合对象特征向量。其中,融合对象特征向量中的元素个数与所获取到特征融合矩阵的个数相同。
在一些实施例中,电子设备利用第一分解矩阵和第一对象特征向量得到第一融合特征矩阵具体可以是,对第一分解矩阵进行转置处理,得到第一分解矩阵对应的转置矩阵,对第一对象特征向量进行转置处理,得到第一对象特征向量对应的转置向量,将第一分解矩阵对应的转置矩阵与第一对象特征向量对应的转置向量的乘积作为第一融合特征矩阵。以及电子设备利用第一分解矩阵和第一对象特征向量得到第一融合特征矩阵具体可以是,对第二对象特征向量进行转置处理,得到第二对象特征向量对应的转置向量,将第二分解矩阵与第一对象特征向量对应的转置向量的乘积作为第二融合特征矩阵。
在一些实施例中,电子设备根据第一融合特征矩阵和第二融合特征矩阵生成针对推荐对象的融合对象特征向量具体可以是,将第一融合特征矩阵的转置矩阵和第二融合特征矩阵的乘积,作为融合特征元素,并根据融合特征元素得到融合对象特征向量。即:
其中,表示基于电子设备所获取到的特征融合矩阵中的第i个特征融合矩阵得到的第一融合特征矩阵,表示基于第i个特征融合矩阵得到的第二融合特征矩阵,logiti表示基于第i个特征融合矩阵得到的融合特征元素。设所获取到的特征融合矩阵有N个,N为1或者大于1的正整数,则i为小于或等于N的正整数,当N为1时,i为1,当N大于1时,i为从1至N的正整数。因此,一个特征融合矩阵可以得到一个融合特征元素,以及电子设备根据融合特征元素得到融合对象特征向量可以是,当特征融合矩阵的个数为1时,直接将融合特征元素作为融合对象特征向量,当特征融合矩阵的个数为多个时,将多个融合特征元素进行拼接,得到融合对象特征向量。
S205、根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。
在一个可能的实施方式中,推荐模型可以包括特征预测层,电子设备可以在推荐模型包括的特征预测层中对融合对象特征向量进行预测,以生成针对推荐对象的预测推荐指标。可选的,该特征预测层可以为全连接层,因此电子设备可以将融合对象特征向量输入该全连接层,由全连接层对融合对象特征向量进行映射并输出针对推荐对象的预测推荐指标。后续,电子设备可以根据多个推荐对象的预测推荐指标对推荐对象进行排序,并基于排序后的多个推荐对象进行推送。
本申请实施例中可以获取推荐对象的第一对象属性和第二对象属性,将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量,获取推荐模型中的特征融合矩阵,并对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量,根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。通过实施上述所提出的方法,通过结合特征融合矩阵对多种对象特征向量进行特征融合,可以加强特征间的交互,以提高基于融合对象特征向量进行推荐指标的预测准确性,此外,在进行特征融合时,可以通过针对特征融合矩阵的分解矩阵来实现特征融合,以使得可以减少特征融合时所使用的参数量,进而可以降低模型在此阶段的复杂度以及提高模型的预测效率。
请参见图3,图3为本申请实施例提供的一种数据处理方法的流程示意图,该方法可以由上述提及的电子设备执行。如图3所示,本申请实施例中数据处理方法的流程可以包括如下:
S301、获取推荐对象的第一对象属性和第二对象属性。其中,步骤S301的具体实施方式可以参见步骤S201的相关描述,此处不再赘述。
S302、将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量。
在一个可能的实施方式中,特征提取层可以包括神经网络模型,该神经网络模型可以用于对对象属性进行编码得到对应的对象特征向量。因此,电子设备可以将第一对象属性输入推荐模型,由神经网络模型对第一对象属性进行编码得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,由神经网络模型对二对象属性进行编码得到推荐对象的第二对象特征向量。
可选的,对第一对象属性进行编码的神经网络模型和对第二对象属性进行编码的神经网络模型可以是相同的神经网络模型,也可以是不同的神经网络模型。在一些实施例中,当对象属性为文本属性时,可以利用神经网络模型对该文本属性进行语义编码,得到对应的对象特征向量,因此对文本属性进行编码的神经网络模型可以是语义模型,如BERT(Bidirectional Encoder Representations from Transformer,变压器的双向编码器表示)模型、LSTM(Long Short-Time Memory,长短期记忆)模型,或CNN(ConvolutionalNeural Networks,卷积神经网络)模型等。在一些实施例中,当对象属性为图像属性时,可以利用神经网络模型对该图像属性进行编码,得到对应的对象特征向量,因此对图像属性进行编码的神经网络模型可以是ResNet(Residual Network,残差网络)模型,或其他用于对图像进行编码的神经网络模型等。此处对神经网络模型的具体类型不作限制。例如,若推荐对象为视频,第一对象属性可以是视频标题,第二对象属性可以是视频封面帧,因此对第一对象属性进行编码的神经网络模型可以是BERT模型,对第二对象属性进行编码的神经网络模型可以是ResNet模型。
其中,可以在推荐模型中引入与对象属性类型适配的神经网络模型,即若对象属性为文本属性时,则适配的神经网络模型可以是文本语义模型(如BERT模型),以及若对象属性为图像属性时,则适配的神经网络模型可以是图像语义模型(如ResNet模型),使得可以是从对象属性中提取到更多的特征,以及使得后续在进行推荐指标的预测时,有助于提升预测准确性。
在一个可能的实施方式中,上述推荐模型为基于样本对象的第一样本对象属性、第二样本对象属性以及针对样本对象的样本推荐指标训练得到的。因此电子设备对待训练的初始推荐模型进行训练得到推荐模型的具体方式可以是,将样本对象的第一样本对象属性输入初始推荐模型,得到样本对象的第一样本对象特征向量,并将样本对象的第二样本对象属性输入初始推荐模型得到样本对象的第二样本对象特征向量,获取初始推荐模型中初始特征融合矩阵,并对初始特征融合矩阵进行分解,得到针对第一样本对象属性的第一初始分解矩阵和针对第二样本对象属性的第二初始分解矩阵,根据针对第一样本对象属性的第一初始分解矩阵和针对第二样本对象属性的第二初始分解矩阵,对第一样本对象特征向量和第二样本对象特征向量进行特征融合,得到针对样本对象的融合样本对象特征向量,根据初始推荐模型和融合样本对象特征向量生成针对样本对象的样本预测推荐指标,利用样本对象的样本推荐指标和样本预测推荐指标更新初始推荐模型的模型参数,得到推荐模型。其中,初始推荐模型的模型参数可以包括初始特征融合矩阵,因此推荐模型可以包括对初始特征融合矩阵进行参数更新后所得到的特征融合矩阵。可选的,初始特征融合矩阵可以为一个或多个,一个初始特征融合矩阵进行参数更新后得到一个特征融合矩阵。
在一些实施例中,电子设备利用样本对象的样本推荐指标和样本预测推荐指标更新初始推荐模型的模型参数,得到推荐模型具体可以是,构建模型损失函数,并根据模型损失函数、样本推荐指标和样本预测推荐指标得到损失函数值,并根据损失函数值更新初始推荐模型的模型参数,直至模型收敛。此外,模型训练采用监督学习的训练方式,通过拟合样本对象的样本推荐指标即可训练得到推荐模型,无需额外对样本对象等相关数据进行标注,因此具有灵活性和通用性,以及当第一对象属性和/或第二对象属性为文本属性时,对文本属性的内容大小以及上下文没有限制,因此泛化能力强,可应用与多种存在文本属性的预测场景中。
可选的,电子设备构建模型损失函数可以是基于回归的方式构建模型损失函数,模型训练的目的即为拟合样本推荐对象的样本推荐指标。该模型损失函数可以是均方误差损失函数(MSE,Mean Square Error)函数。即模型损失函数可以是:
其中,n为样本对象的数量,yk为针对样本对象k的样本预测推荐指标,y′k为针对样本对象k的样本推荐指标。
可选的,电子设备构建的模型损失函数还可以是其他回归模型中的损失函数,如平均绝对值损失函数(MAE,Mean Absolute Error),或平滑平均绝对误差损失函数(Huber)等。
例如,以推荐对象为视频文档为例,样本推荐模型的训练过程可以是:
(1)构建训练数据集,该训练数据集可以包括多个样本推荐对象(样本视频文档)的训练数据,具体可以包括样本视频文档,以及包括从样本视频文档中获取的样本标题属性和从样本视频文档中抽取的关键帧(例如封面帧)属性,该标题属性以作为第一对象属性,该封面帧属性作为第二对象属性,以及包括针对该样本视频文档的样本点击率,该样本点击率为样本视频文档的真实点击率,以作为训练目标值。因此,针对一个样本视频文档而言,所对应的训练数据可以如下:
样本视频文档X={“标题属性”:“XXXX”,“封面帧属性”:“XXXX”,“样本点击率”:0.75};
(2)将样本视频文档的标题属性和封面帧属性输入到样本推荐模型中进行特征提取,得到标题属性对应的第一对象特征向量,和封面帧属性对应的第二对象特征向量;其中,在样本推荐模型中对标题属性进行特征提取可以是通过BERT模型对标题属性进行语义编码得到表征标题属性的语义特征的第一对象特征向量(ftext),以及在样本推荐模型中对封面帧属性进行特征提取可以是通过ResNet模型对封面帧属性进行编码得到表征封面帧属性的图像语义特征的第二对象特征向量(fimg),即公式表征可以如下:
ftext=BERT(text)
fimg=ResNet(img)
其中,text表示标题属性,img表示视频帧属性;
可选的,该BERT模型和ResNet模型可以是预先训练好的模型并部署在该样本推荐模型中,也可以是待训练的模型,同样本推荐模型一起训练得到训练好的模型;
(3)利用样本推荐模型的特征融合层对第一对象特征向量和第二对象特征向量进行特征融合,得到融合样本对象特征向量,即多模态特征向量;
(4)根据样本推荐模型和融合样本对象特征向量得到针对样本视频文档的样本预测点击率,通过样本预测点击率和样本点击率对样本推荐模型进行训练,得到推荐模型,模型的目的是采用回归的方式拟合样本视频文档的样本预测点击率,其中,模型训练时通过回归的方式可以实现对标题语义特征和封面帧语义特征的融合语义特征与点击率的隐含关系建模,可以有效地捕捉融合语义特征和点击率之间的关系。
S303、获取推荐模型中的特征融合矩阵。
其中,特征融合矩阵可以为一个或多个,该特征融合矩阵可以表示为W[1:N]∈Rn*m,即特征融合矩阵可以为N个,N为正整数,每个特征融合矩阵均在n行m列的矩阵,每个特征融合矩阵的参数可以相同也可以不相同。可选的,该每个特征融合矩阵的参数可以是由上述对样本推荐模型进行训练得到的,也可以是由相关业务人员根据经验值设定的固定参数。
S304、若获取到的特征融合矩阵的数量为N个,则分别对N个特征融合矩阵进行分解,得到每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵。
在一个可能的实施方式中,电子设备若获取到N个特征融合矩阵时,分别对N个特征融合矩阵进行分解,得到N个特征融合矩阵中每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵;其中,一个特征融合矩阵对应一个第一分解矩阵和一个第二分解矩阵,第一分解矩阵为针对第一对象属性的矩阵,第二分解矩阵为针对第二对象属性的矩阵。因此特征融合矩阵的数量、第一分解矩阵的数量以及第二分解矩阵的数量相同。
在一些实施例中,每个特征融合矩阵进行分解的过程和原理相同,因此将N个特征融合矩阵中的任一个特征融合矩阵表示为第i个特征融合矩阵,i为小于或者等于N的正整数;将第i个特征融合矩阵进行分解以使得第i个特征融合矩阵对应的第一分解矩阵和第二分解矩阵的乘积等于第i个特征融合矩阵,以及该第i个特征融合矩阵对应的第一分解矩阵的行数等于第一对象特征向量中的元素个数;第i个特征融合矩阵对应的第二分解矩阵的列数等于第二对象特征向量的元素个数。即,设第i个特征融合矩阵为Wi,对第i个特征融合矩阵分解得到的第一分解矩阵为Ui和第二分解矩阵Vi,因此前述三种矩阵的关系为:
Wi=Ui*Vi i=[1,2,...,N]
其中,Ui∈R(n*k),即第一分解矩阵为n行k列的矩阵,Vi∈R(k*m),即第二分解矩阵为k行n列的矩阵;k可以由相关业务人员根据经验值设定。
S305、根据每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量。
在一个可能的实施方式中,电子设备可以根据每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵分别对第一对象特征向量和第二对象特征向量进行特征融合,得到每个特征融合特征对应的融合特征元素,将每个特征融合矩阵对应的融合特征元素进行拼接,得到融合对象特征向量。其中,融合对象特征向量中的融合特征元素个数与特征融合矩阵的数量相同,即当特征融合矩阵的数量为一个时,融合对象特征向量为由1个融合特征元素组成的向量;当特征融合矩阵的数量为N个时,融合对象特征向量为由N个融合特征元素所拼接组成的向量。
在一个可能的实施方式中,电子设备根据每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵分别对第一对象特征向量和第二对象特征向量进行特征融合,得到每个特征融合矩阵对应的融合特征元素的过程和原理相同,因此以第i个特征融合矩阵为例,得到第i个特征融合矩阵对应的融合特征元素具体方式可以为,根据第i个特征融合矩阵对应的第一分解矩阵和第一对象特征向量生成第一融合特征矩阵,根据第i个特征融合矩阵对应的第二分解聚成和第二对象特征向量生成第二融合特征矩阵,根据第一融合特征矩阵和第二融合特征矩阵生成第i个特征融合矩阵对应的融合特征元素。
在一些实施例中,电子设备根据第i个特征融合矩阵对应的第一分解矩阵和第一对象特征向量生成第一融合特征矩阵具体可以是,将第一分解矩阵的转置矩阵(Ui T)与第一对象特征向量的转置向量(f1 T)的乘积作为第一融合特征矩阵,即第一融合特征矩阵为Ui T*f1 T。以及电子设备根据第i个特征融合矩阵对应的第二分解矩阵和第二对象特征向量生成第二融合特征矩阵具体可以是,将第二分解矩阵(Vi)与第二对象特征向量的转置向量(f2 T)的乘积作为第二融合特征矩阵,即第一融合特征矩阵为Vi*f2 T。
在一些实施例中,电子设备根据第一融合特征矩阵和第二融合特征矩阵生成第i个特征融合矩阵对应的融合特征元素具体可以是,将第一融合特征矩阵的转置矩阵与第二融合特征矩阵的乘积作为对应的融合特征元素,即融合特征元素为:
logiti=(Ui T*f1 T)T*(Vi*f2 T)i=[1,2,...,N]
因此,融合对象特征向量为N个特征融合矩阵中每个特征融合矩阵对应的融合特征元素所拼接的向量,因此融合对象特征矩阵可以为logit=[logit1,logit2,...,logiti,...,logitN]。可选的,融合对象特征向量还可以为每个特征融合矩阵对应的融合特征元素所拼接的向量与偏置向量的和向量,即为logit=[logit1,logit2,...,logiti,...,logitN]+b。其中,b为偏置向量,该偏置向量可以是相关业务人员根据经验值设定的向量,也可以是作为样本推荐模型中的模型参数,训练得到的向量。
例如,如图4所示,图4为本申请实施例提供的一种确定融合对象特征向量的场景示意图;其中,电子设备获取到N个特征融合矩阵,并分别将每个特征融合矩阵分解对应的第一分解矩阵和第二分解矩阵,根据每个特征融合矩阵对应的第一分解矩阵和第一对象特征向量生成每个特征融合矩阵对应的第一融合特征矩阵,并根据每个特征融合矩阵对应的第二分解矩阵和第二对象特征向量生成每个特征融合矩阵对应的第二融合特征矩阵,根据每个特征融合矩阵对应的第一融合特征矩阵和第二融合特征矩阵生成每个特征融合矩阵对应的融合特征元素,并拼接得到融合对象特征向量。
S306、根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。
在一个可能的实施方式中,电子设备可以将融合对象特征向量输入推荐模型中的全连接层,经由全连接层根据融合对象特征向量生成针对推荐对象的预测推荐指标。
可选的,当推荐对象为图文数据时,第一对象数据可以为图文数据的文本属性,第二对象属性为图文数据的图像属性,该针对推荐对象的预测推荐指标可以是针对图文数据的预测点击率。在一些实施例中,若图文数据的数量为多个时,一个图文数据对应一个预测点击率,电子设备可以根据多个图文数据中每个图文数据分别对应的预测点击率,对多个图文数据进行排序,并将进行排序后的多个图文数据发送至推荐客户端,以使推荐客户端输出排序后的多个图文数据,进而实现图文数据的精准推送。
例如,如图5a-图5b为本申请实施例提供的一种应用场景示意图,其中,以应用于小程序中的视频搜索场景为例,在图5a中,用户在输入了搜索关键词之后,对应的后台服务器会在存放视频文档的索引库中根据搜索关键词进行检索,并将召回的索引库进行多轮排序,从而按照顺序给出和用户输入的搜索关键词最相关的视频文档,即在对视频文档进行粗排和/或精排的过程中,针对视频文档的预测点击率为很重要的特征,因此通过获取待排序的视频文档的标题属性和封面帧属性,并输入至推荐模型中,生成每个视频文档的预测点击率,在对视频文档进行排序阶段,结合该预测点击率可以提升推送的准确性以及优化用户的搜索体验,此外,能够实现通过推荐模型结合视频文档的标题属性和封面属性进行预测时,具有更吸引用户的封面和/或标题的视频文档的预测点击率更高更准确,以及可以根据标题属性和封面属性与点击率之间的隐含关系,捕捉到待排序视频文档的标题属性与点击率强相关的词语,进而使得具有强相关的视频文档的预测点击率可以更高,以及同时可以使得标题和封面不符的视频文档预测点击率降低以减少劣质视频文档(如预测点击率低于点击率阈值的视频文档)的出现;在图5b中,有多个视频文档,因此经测试发现图5b中的第2个和第4个视频文档会更吸引用户点击,因此推荐模型生成的预测点击率会更高,以使得该两个优质视频文档(如预测点击率等于或高于点击率阈值的视频文档)更容易曝光;此外,在该场景中,曝光次数低的视频文档容易处于冷启动阶段,因此曝光次数低的优质视频文档在粗排/精排阶段可能存在排名靠后以至于曝光机会少,因此在预测时使得低曝光的优质视频文档的预测点击率提高,并在粗排/精排阶段进行相应策略(如曝光低但预测点击率高的视频文档的权重适应性提高等)的调整,以使得低曝光的优质视频文档排序尽可能靠前,从而改善了低曝光的优质视频文档经常处于冷启动阶段的问题。
又如,如图6所示,图6为本申请实施例提供的一种确定预测推荐指标的场景示意图;其中,推荐对象为视频文档,电子设备获取视频文档的标题信息作为标题属性,并从视频文档中抽取封面帧(关键帧)信息作为封面帧属性,将标题属性输入推荐模型,经由推荐模型的特征抽取层的BERT模型得到第一对象特征向量,并将封面帧属性输入推荐模型,经由推荐模型的特征抽取层的ResNet模型得到第二对象特征向量,在特征融合层对第一对象特征向量和第二对象特征向量进行特征融合,得到融合特征向量,并将融合特征向量输入推荐模型的特征预测层,经由特征预测层中的全连接层对融合特征向量进行预测,得到针对视频文档的预测点击率。
本申请实施例中可以获取推荐对象的第一对象属性和第二对象属性,将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量,获取推荐模型中的特征融合矩阵,若获取到的特征融合矩阵的数量为N个,则分别对N个特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量,根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。通过实施上述所提出的方法,通过结合特征融合矩阵对多种对象特征向量进行特征融合,可以加强特征间的交互,以提高基于融合对象特征向量进行推荐指标的预测准确性,此外,在进行特征融合时,可以通过针对特征融合矩阵的分解矩阵来实现特征融合,以使得可以减少特征融合时所使用的参数量,进而可以降低模型在此阶段的复杂度以及提高模型的预测效率。
请参见图7,图7为本申请提供的一种数据处理装置的结构示意图。需要说明的是,图7所示的数据处理装置,用于执行本申请图2和图3所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示,经参照本申请图2和图3所示的实施例。该数据处理装置700可包括:获取模块701、输入模块702、分解模块703、融合模块704、生成模块705。其中:
获取模块701,用于获取推荐对象的第一对象属性和第二对象属性;
输入模块702,用于将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量;该推荐模型为基于样本对象的第一样本对象属性、第二样本对象属性以及针对样本对象的样本推荐指标训练得到的;
分解模块703,用于获取推荐模型中的特征融合矩阵,并对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵;
融合模块704,用于根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量;
生成模块705,用于根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。
在一个可能的实施方式中,上述特征融合矩阵的数量为N个,N为正整数;
分解模块703在用于对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵时,具体用于:
分别对N个特征融合矩阵进行分解,得到N个特征融合矩阵中每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵;其中,一个特征融合矩阵对应一个第一分解矩阵和一个第二分解矩阵。
在一个可能的实施方式中,上述N个特征融合矩阵中的任一个特征融合矩阵表示为第i个特征融合矩阵,i为小于或者等于N的正整数;第i个特征融合矩阵对应的第一分解矩阵和第二分解矩阵的乘积等于第i个特征融合矩阵;第i个特征融合矩阵对应的第一分解矩阵的行数等于第一对象特征向量中的元素个数;第i个特征融合矩阵对应的第二分解矩阵的列数等于所述第二对象特征向量的元素个数。
在一个可能的实施方式中,融合模块704在用于根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量时,具体用于:
根据每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵分别对第一对象特征向量和第二对象特征向量进行特征融合,得到每个特征融合矩阵对应的融合特征元素;
将每个特征融合矩阵对应的融合特征元素进行拼接,得到融合对象特征向量。
在一个可能的实施方式中,上述N个特征融合矩阵中的任一个特征融合矩阵表示为第i个特征融合矩阵,i为小于或者等于N的正整数;
融合模块704在用于根据每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵分别对第一对象特征向量和第二对象特征向量进行特征融合,得到每个特征融合矩阵对应的融合特征元素时,具体用于:
根据第i个特征融合矩阵对应的第一分解矩阵和第一对象特征向量生成第一融合特征矩阵;
根据第i个特征融合矩阵对应的第二分解矩阵和第二对象特征向量生成第二融合特征矩阵;
根据第一融合特征矩阵和第二融合特征矩阵生成第i个特征融合矩阵对应的融合特征元素。
在一个可能的实施方式中,生成模块705还用于:
将样本对象的第一样本对象属性输入初始推荐模型,得到样本对象的第一样本对象特征向量,并将样本对象的第二样本对象属性输入初始推荐模型,得到样本对象的第二样本对象特征向量;
获取初始推荐模型中的初始特征融合矩阵,并对初始特征融合矩阵进行分解,得到针对第一样本对象属性的第一初始分解矩阵和针对第二样本对象属性的第二初始分解矩阵;
根据针对第一样本对象属性的第一初始分解矩阵和针对第二样本对象属性的第二初始分解矩阵,对第一样本对象特征向量和第二样本对象特征向量进行特征融合,得到针对样本对象的融合样本对象特征向量;
根据初始推荐模型和融合样本对象特征向量生成针对样本对象的样本预测推荐指标;
利用样本对象的样本推荐指标和样本预测推荐指标更新初始推荐模型的模型参数,得到推荐模型;该推荐模型包括对初始特征融合矩阵进行参数更新后所得到的特征融合矩阵。
在一个可能的实施方式中,推荐对象为图文数据,第一对象属性为图文数据的文本属性,第二对象属性为图文数据的图像属性,预测推荐指标为针对图文数据的预测点击率。
在一个可能的实施方式中,上述图文数据的数量为多个,一个图文数据对应一个预测点击率;
生成模块705还用于:
根据多个图文数据中每个图文数据分别对应的预测点击率,对多个图文数据进行排序;
将进行排序后的多个图文数据发送至推荐客户端,以使推荐客户端输出排序后的多个图文数据。
本申请实施例中,获取模块获取推荐对象的第一对象属性和第二对象属性;输入模块将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量;该推荐模型为基于样本对象的第一样本对象属性、第二样本对象属性以及针对样本对象的样本推荐指标训练得到的;分解模块获取推荐模型中的特征融合矩阵,并对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵;融合模块根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量;生成模块根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。通过实施上述所提出的装置,通过结合特征融合矩阵对多种对象特征向量进行特征融合,可以加强特征间的交互,以提高基于融合对象特征向量进行推荐指标的预测准确性,此外,在进行特征融合时,可以通过针对特征融合矩阵的分解矩阵来实现特征融合,以使得可以减少特征融合时所使用的参数量,进而可以降低模型在此阶段的复杂度以及提高模型的预测效率。
在本申请各个实施例中的各功能模块可以集成在一个模块中,也可以是各个模块单独物理存在,也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现,本申请不做限定。
请参见图8,图8为本申请实施例提供的一种电子设备的结构示意图。如图8所示,该电子设备800包括:至少一个处理器801、存储器802。可选的,该电子设备还可包括网络接口。其中,处理器801、存储器802以及网络接口之间可以交互数据,网络接口受处理器801的控制用于收发消息,存储器802用于存储计算机程序,该计算机程序包括程序指令,处理器801用于执行存储器802存储的程序指令。其中,处理器801被配置用于调用该程序指令执行上述方法。
其中,存储器802可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器802也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory),固态硬盘(solid-state drive,SSD)等;存储器802还可以包括上述种类的存储器的组合。
其中,处理器801可以是中央处理器(central processing unit,CPU)。在一个实施例中,处理器801还可以是图形处理器(Graphics Processing Unit,GPU)。处理器801也可以是由CPU和GPU的组合。
在一个可能的实施方式中,存储器802用于存储程序指令,处理器801可以调用该程序指令,执行以下步骤:
获取推荐对象的第一对象属性和第二对象属性;
将第一对象属性输入推荐模型,得到推荐对象的第一对象特征向量,并将第二对象属性输入推荐模型,得到推荐对象的第二对象特征向量;该推荐模型为基于样本对象的第一样本对象属性、第二样本对象属性以及针对样本对象的样本推荐指标训练得到的;
获取推荐模型中的特征融合矩阵,并对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵;
根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量;
根据推荐模型和融合对象特征向量生成针对推荐对象的预测推荐指标。
在一个可能的实施方式中,上述特征融合矩阵的数量为N个,N为正整数;
处理器801在用于对特征融合矩阵进行分解,得到针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵时,具体用于:
分别对N个特征融合矩阵进行分解,得到N个特征融合矩阵中每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵;其中,一个特征融合矩阵对应一个第一分解矩阵和一个第二分解矩阵。
在一个可能的实施方式中,上述N个特征融合矩阵中的任一个特征融合矩阵表示为第i个特征融合矩阵,i为小于或者等于N的正整数;第i个特征融合矩阵对应的第一分解矩阵和第二分解矩阵的乘积等于第i个特征融合矩阵;第i个特征融合矩阵对应的第一分解矩阵的行数等于第一对象特征向量中的元素个数;第i个特征融合矩阵对应的第二分解矩阵的列数等于所述第二对象特征向量的元素个数。
在一个可能的实施方式中,处理器801在用于根据针对第一对象属性的第一分解矩阵和针对第二对象属性的第二分解矩阵,对第一对象特征向量和第二对象特征向量进行特征融合,得到针对推荐对象的融合对象特征向量时,具体用于:
根据每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵分别对第一对象特征向量和第二对象特征向量进行特征融合,得到每个特征融合矩阵对应的融合特征元素;
将每个特征融合矩阵对应的融合特征元素进行拼接,得到融合对象特征向量。
在一个可能的实施方式中,上述N个特征融合矩阵中的任一个特征融合矩阵表示为第i个特征融合矩阵,i为小于或者等于N的正整数;
处理器801在用于根据每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵分别对第一对象特征向量和第二对象特征向量进行特征融合,得到每个特征融合矩阵对应的融合特征元素时,具体用于:
根据第i个特征融合矩阵对应的第一分解矩阵和第一对象特征向量生成第一融合特征矩阵;
根据第i个特征融合矩阵对应的第二分解矩阵和第二对象特征向量生成第二融合特征矩阵;
根据第一融合特征矩阵和第二融合特征矩阵生成第i个特征融合矩阵对应的融合特征元素。
在一个可能的实施方式中,处理器801还用于:
将样本对象的第一样本对象属性输入初始推荐模型,得到样本对象的第一样本对象特征向量,并将样本对象的第二样本对象属性输入初始推荐模型,得到样本对象的第二样本对象特征向量;
获取初始推荐模型中的初始特征融合矩阵,并对初始特征融合矩阵进行分解,得到针对第一样本对象属性的第一初始分解矩阵和针对第二样本对象属性的第二初始分解矩阵;
根据针对第一样本对象属性的第一初始分解矩阵和针对第二样本对象属性的第二初始分解矩阵,对第一样本对象特征向量和第二样本对象特征向量进行特征融合,得到针对样本对象的融合样本对象特征向量;
根据初始推荐模型和融合样本对象特征向量生成针对样本对象的样本预测推荐指标;
利用样本对象的样本推荐指标和样本预测推荐指标更新初始推荐模型的模型参数,得到推荐模型;该推荐模型包括对初始特征融合矩阵进行参数更新后所得到的特征融合矩阵。
在一个可能的实施方式中,推荐对象为图文数据,第一对象属性为图文数据的文本属性,第二对象属性为图文数据的图像属性,预测推荐指标为针对图文数据的预测点击率。
在一个可能的实施方式中,上述图文数据的数量为多个,一个图文数据对应一个预测点击率;
处理器801还用于:
根据多个图文数据中每个图文数据分别对应的预测点击率,对多个图文数据进行排序;
将进行排序后的多个图文数据发送至推荐客户端,以使推荐客户端输出排序后的多个图文数据。
具体实现中,上述所描述的装置、处理器801、存储器802等可执行上述方法实施例所描述的实现方式,也可执行本申请实施例所描述的实现方式,在此不再赘述。
本申请实施例中还提供一种计算机(可读)存储介质,该计算机存储介质存储有计算机程序,计算机程序包括程序指令,程序指令被处理器执行时,使处理器可执行上述方法实施例中所执行的部分或全部步骤。可选的,该计算机存储介质可以是易失性的,也可以是非易失性的。计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,前述的程序可存储于计算机存储介质中,该计算机存储介质可以为计算机可读存储介质,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本申请的部分实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于本申请所涵盖的范围。
Claims (10)
1.一种数据处理方法,其特征在于,所述方法包括:
获取推荐对象的第一对象属性和第二对象属性;
将所述第一对象属性输入推荐模型,得到所述推荐对象的第一对象特征向量,并将所述第二对象属性输入所述推荐模型,得到所述推荐对象的第二对象特征向量;所述推荐模型为基于样本对象的第一样本对象属性、第二样本对象属性以及针对所述样本对象的样本推荐指标训练得到的;
获取所述推荐模型中的特征融合矩阵,并对所述特征融合矩阵进行分解,得到针对所述第一对象属性的第一分解矩阵和针对所述第二对象属性的第二分解矩阵;
根据针对所述第一对象属性的第一分解矩阵和针对所述第二对象属性的第二分解矩阵,对所述第一对象特征向量和所述第二对象特征向量进行特征融合,得到针对所述推荐对象的融合对象特征向量;
根据所述推荐模型和所述融合对象特征向量生成针对所述推荐对象的预测推荐指标。
2.根据权利要求1所述的方法,其特征在于,所述特征融合矩阵的数量为N个,N为正整数;
所述对所述特征融合矩阵进行分解,得到针对所述第一对象属性的第一分解矩阵和针对所述第二对象属性的第二分解矩阵,包括:
分别对N个特征融合矩阵进行分解,得到所述N个特征融合矩阵中每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵;其中,一个特征融合矩阵对应一个第一分解矩阵和一个第二分解矩阵。
3.根据权利要求2所述的方法,其特征在于,所述N个特征融合矩阵中的任一个特征融合矩阵表示为第i个特征融合矩阵,i为小于或者等于N的正整数;所述第i个特征融合矩阵对应的第一分解矩阵和第二分解矩阵的乘积等于所述第i个特征融合矩阵;所述第i个特征融合矩阵对应的第一分解矩阵的行数等于所述第一对象特征向量中的元素个数;所述第i个特征融合矩阵对应的第二分解矩阵的列数等于所述第二对象特征向量的元素个数。
4.根据权利要求2所述的方法,其特征在于,所述根据针对所述第一对象属性的第一分解矩阵和针对所述第二对象属性的第二分解矩阵,对所述第一对象特征向量和所述第二对象特征向量进行特征融合,得到针对所述推荐对象的融合对象特征向量,包括:
根据所述每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵分别对所述第一对象特征向量和所述第二对象特征向量进行特征融合,得到所述每个特征融合矩阵对应的融合特征元素;
将所述每个特征融合矩阵对应的融合特征元素进行拼接,得到所述融合对象特征向量。
5.根据权利要求4所述的方法,其特征在于,所述N个特征融合矩阵中的任一个特征融合矩阵表示为第i个特征融合矩阵,i为小于或者等于N的正整数;
所述根据所述每个特征融合矩阵对应的第一分解矩阵和第二分解矩阵分别对所述第一对象特征向量和所述第二对象特征向量进行特征融合,得到所述每个特征融合矩阵对应的融合特征元素,包括:
根据所述第i个特征融合矩阵对应的第一分解矩阵和所述第一对象特征向量生成第一融合特征矩阵;
根据所述第i个特征融合矩阵对应的第二分解矩阵和所述第二对象特征向量生成第二融合特征矩阵;
根据所述第一融合特征矩阵和所述第二融合特征矩阵生成所述第i个特征融合矩阵对应的融合特征元素。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述样本对象的所述第一样本对象属性输入初始推荐模型,得到所述样本对象的第一样本对象特征向量,并将所述样本对象的所述第二样本对象属性输入所述初始推荐模型,得到所述样本对象的第二样本对象特征向量;
获取所述初始推荐模型中的初始特征融合矩阵,并对所述初始特征融合矩阵进行分解,得到针对所述第一样本对象属性的第一初始分解矩阵和针对所述第二样本对象属性的第二初始分解矩阵;
根据针对所述第一样本对象属性的第一初始分解矩阵和针对所述第二样本对象属性的第二初始分解矩阵,对所述第一样本对象特征向量和所述第二样本对象特征向量进行特征融合,得到针对所述样本对象的融合样本对象特征向量;
根据所述初始推荐模型和所述融合样本对象特征向量生成针对所述样本对象的样本预测推荐指标;
利用所述样本对象的所述样本推荐指标和所述样本预测推荐指标更新所述初始推荐模型的模型参数,得到所述推荐模型;所述推荐模型包括对所述初始特征融合矩阵进行参数更新后所得到的所述特征融合矩阵。
7.根据权利要求1所述的方法,其特征在于,所述推荐对象为图文数据,所述第一对象属性为所述图文数据的文本属性,所述第二对象属性为所述图文数据的图像属性,所述预测推荐指标为针对所述图文数据的预测点击率。
8.根据权利要求7所述的方法,其特征在于,所述图文数据的数量为多个,一个图文数据对应一个预测点击率;
所述方法还包括:
根据多个图文数据中每个图文数据分别对应的预测点击率,对所述多个图文数据进行排序;
将进行排序后的所述多个图文数据发送至推荐客户端,以使所述推荐客户端输出排序后的所述多个图文数据。
9.一种电子设备,其特征在于,包括处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-8任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110992088.XA CN113626716A (zh) | 2021-08-26 | 2021-08-26 | 数据处理方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110992088.XA CN113626716A (zh) | 2021-08-26 | 2021-08-26 | 数据处理方法、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113626716A true CN113626716A (zh) | 2021-11-09 |
Family
ID=78387966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110992088.XA Pending CN113626716A (zh) | 2021-08-26 | 2021-08-26 | 数据处理方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113626716A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726747A (zh) * | 2018-12-20 | 2019-05-07 | 西安电子科技大学 | 基于社交网络推荐平台的数据融合排序方法 |
CN110851700A (zh) * | 2019-09-25 | 2020-02-28 | 浙江工业大学 | 一种融合属性和语义的概率矩阵分解冷启动推荐方法 |
CN111475730A (zh) * | 2020-04-09 | 2020-07-31 | 腾讯科技(北京)有限公司 | 基于人工智能的信息推荐方法、装置、电子设备 |
CN112163165A (zh) * | 2020-10-21 | 2021-01-01 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备及计算机可读存储介质 |
US11010691B1 (en) * | 2020-03-16 | 2021-05-18 | Sas Institute Inc. | Distributable event prediction and machine learning recognition system |
-
2021
- 2021-08-26 CN CN202110992088.XA patent/CN113626716A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726747A (zh) * | 2018-12-20 | 2019-05-07 | 西安电子科技大学 | 基于社交网络推荐平台的数据融合排序方法 |
CN110851700A (zh) * | 2019-09-25 | 2020-02-28 | 浙江工业大学 | 一种融合属性和语义的概率矩阵分解冷启动推荐方法 |
US11010691B1 (en) * | 2020-03-16 | 2021-05-18 | Sas Institute Inc. | Distributable event prediction and machine learning recognition system |
CN111475730A (zh) * | 2020-04-09 | 2020-07-31 | 腾讯科技(北京)有限公司 | 基于人工智能的信息推荐方法、装置、电子设备 |
CN112163165A (zh) * | 2020-10-21 | 2021-01-01 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110309427B (zh) | 一种对象推荐方法、装置及存储介质 | |
CN108959396B (zh) | 机器阅读模型训练方法及装置、问答方法及装置 | |
CN110234018B (zh) | 多媒体内容描述生成方法、训练方法、装置、设备及介质 | |
CN112035743B (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
CN111258995B (zh) | 数据处理方法、装置、存储介质及设备 | |
WO2014160282A1 (en) | Classifying resources using a deep network | |
CN113761153B (zh) | 基于图片的问答处理方法、装置、可读介质及电子设备 | |
CN111611488B (zh) | 基于人工智能的信息推荐方法、装置、电子设备 | |
CN111353303B (zh) | 词向量构建方法、装置、电子设备及存储介质 | |
Amplayo | Rethinking attribute representation and injection for sentiment classification | |
CN111949886B (zh) | 一种用于信息推荐的样本数据生成方法和相关装置 | |
CN114330966A (zh) | 一种风险预测方法、装置、设备以及可读存储介质 | |
CN111709493A (zh) | 对象分类方法、训练方法、装置、设备及存储介质 | |
CN113641797A (zh) | 数据处理方法、装置、设备、存储介质及计算机程序产品 | |
CN111506717B (zh) | 问题答复方法、装置、设备及存储介质 | |
CN117056474A (zh) | 会话应答方法和装置、电子设备、存储介质 | |
CN116977701A (zh) | 视频分类模型训练的方法、视频分类的方法和装置 | |
CN116957006A (zh) | 预测模型的训练方法、装置、设备、介质及程序产品 | |
CN116756676A (zh) | 一种摘要生成方法及相关装置 | |
CN113626716A (zh) | 数据处理方法、电子设备及存储介质 | |
CN114692012A (zh) | 一种基于Bert的神经协同过滤的电子政务推荐方法 | |
CN114357301A (zh) | 数据处理方法、设备及可读存储介质 | |
CN114707633A (zh) | 特征提取方法、装置、电子设备和存储介质 | |
CN113761933A (zh) | 检索方法、装置、电子设备及可读存储介质 | |
CN113033209A (zh) | 文本关系抽取方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40054068 Country of ref document: HK |