CN116340643B - 对象推荐的调整方法及装置、存储介质、电子设备 - Google Patents

对象推荐的调整方法及装置、存储介质、电子设备 Download PDF

Info

Publication number
CN116340643B
CN116340643B CN202310617096.5A CN202310617096A CN116340643B CN 116340643 B CN116340643 B CN 116340643B CN 202310617096 A CN202310617096 A CN 202310617096A CN 116340643 B CN116340643 B CN 116340643B
Authority
CN
China
Prior art keywords
sample
data
account
network
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310617096.5A
Other languages
English (en)
Other versions
CN116340643A (zh
Inventor
张晓辉
卢丽华
李茹杨
魏辉
赵雅倩
李仁刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310617096.5A priority Critical patent/CN116340643B/zh
Publication of CN116340643A publication Critical patent/CN116340643A/zh
Application granted granted Critical
Publication of CN116340643B publication Critical patent/CN116340643B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种对象推荐的调整方法及装置、存储介质、电子装置,该方法包括:获取预设时间段内的目标数据,其中,目标数据中包括:帐户集群中每个帐户的属性特征和每个帐户的行为特征,对象集群中每个对象的属性特征和每个对象的行为特征,帐户集群中的所有帐户均属于同一帐户类别,对象集群中的所有对象均属于同一对象类别;将目标数据输入至目标网络模型中,得到目标网络模型输出的帐户集群和对象集群之间的第一转化率;基于第一转化率调整对帐户集群的推荐对象。通过本申请,解决了相关技术中对象转化率的准确度较低的问题,达到提高对象转化率的准确性的效果。

Description

对象推荐的调整方法及装置、存储介质、电子设备
技术领域
本申请实施例涉及计算机领域,具体而言,涉及一种对象推荐的调整方法及装置、存储介质、电子装置。
背景技术
对象推荐的重要指标之一是转化率,因为转化率反应了对象的偏好兴趣。例如,在商品推荐的场景中,转化率可以反应用户对商品的偏好兴趣和购买意愿。目前,转化率预估通常需要通过机器学习,特别是通过深度学习的方式预测用户对对象的转化概率。经典的转化率预估模型,通常都是通过机器学习和大数据分析技术,构建样本,提取用户和商品的特征,然后进行特征处理,例如,分桶离散化、特征交叉、独热编码等后,输入到神经网络模型中,模型学习用户特征和商品特征之间的内在关联,预测单个用户购买单个商品的概率。
除了预估单个用户对单个商品的转化率,在很多推荐场景下,也需要预测用户人群(具有某种性质的用户的集合,例如,点击过某个商品的人就构成了一个人群)对商品集合的购买概率。全部用户都根据指定的规则划分成若干群体,每个用户属于且仅属于一个群体,同样,全部商品也都根据指定规则划分成若干集合,每个商品属于且仅属于一个商品集合。
在现有技术中,预测人群对商品集合的转化率方式有两种,第一种是通过预测单用户对单个商品的转化率,然后取平均获得;第二种是构造两阶段模型,第一阶段模型预测单用户对单个商品的转化率,产出用户表征和商品表征,第二阶段将用户表征和商品表征分别简单聚合得到人群表征和商品集合表征后,再构建新模型来学习人群表征和商品集合表征之间的内在联系,预测用户群体对商品集合的转化率。但这两种方式都采用间接方式处理问题,不是直接建模人群转化率模型,同时,这些方式将个体和集合孤立对待,割裂了用户和群体之间、商品和商品集合之间的内在关联,导致人群表征和商品集合表征没有得到充分刻画和描述,进而模糊了人群中不同用户对整体转化率的贡献,因此导致对象转化率的准确度较低。
针对上述技术问题,相关技术中尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种对象推荐的调整方法及装置、存储介质、电子装置,以至少解决相关技术中对象转化率的准确度较低的问题。
根据本申请的一个实施例,提供了一种对象推荐的调整方法,包括:获取预设时间段内的目标数据,其中,上述目标数据中包括:帐户集群中每个帐户的属性特征和每个上述帐户的行为特征,对象集群中每个对象的属性特征和每个上述对象的行为特征,上述帐户集群中的所有帐户均属于同一帐户类别,上述对象集群中的所有对象均属于同一对象类别;将上述目标数据输入至目标网络模型中,得到上述目标网络模型输出的上述帐户集群和上述对象集群之间的第一转化率;基于上述第一转化率调整对上述帐户集群的推荐对象。
根据本申请的另一个实施例,提供了一种对象推荐的调整装置,包括:第一获取模块,用于获取预设时间段内的目标数据,其中,上述目标数据中包括:帐户集群中每个帐户的属性特征和每个上述帐户的行为特征,对象集群中每个对象的属性特征和每个上述对象的行为特征,上述帐户集群中的所有帐户均属于同一帐户类别,上述对象集群中的所有对象均属于同一对象类别;第一输入模块,用于将上述目标数据输入至目标网络模型中,得到上述目标网络模型输出的上述帐户集群和上述对象集群之间的第一转化率;第一调整模块,用于基于上述第一转化率调整对上述帐户集群的推荐对象。
在一个示例性实施例中,上述第一获取模块,包括:第一获取单元,用于获取帐户集群中每个帐户的向量数据,其中,每个上述帐户的向量数据包括:每个上述帐户的标识向量、每个上述帐户所归属的上述帐户集群的标识向量以及每个上述帐户的行为标签向量,其中,上述行为标签向量用于表示每个上述帐户转化上述对象集群中的对象的行为;第二获取单元,用于获取对象集群中每个上述对象的向量数据,其中,每个上述对象的向量数据包括:每个上述对象的标识向量和每个上述对象所归属的上述对象集群的标识向量;第一确定单元,用于基于每个上述帐户的向量数据和每个上述对象的向量数据上述确定上述目标数据。
在一个示例性实施例中,上述第一确定单元,包括:第一获取子单元,用于获取每个上述帐户的原始数据,其中,每个上述帐户的原始数据包括:每个上述帐户的原始属性和每个上述帐户的原始行为特征,其中,上述原始行为特征包括每个上述帐户转化上述对象集群的行为;第二获取子单元,用于获取每个上述对象的原始数据,其中,每个上述对象的原始数据包括:每个上述对象的原始属性和每个上述对象的原始行为特征,其中,每个上述对象的原始行为特征包括每个上述对象被上述帐户集群转化的行为;第一转换子单元,用于将每个上述帐户的原始数据转换为向量数据,得到每个上述帐户的原始向量数据;第一拼接子单元,用于拼接每个上述帐户的原始向量数据和上述每个帐户的向量数据,以及拼接每个上述对象的原始向量数据和每个上述对象的向量数据,确定出目标向量矩阵,以得到目标数据。
在一个示例性实施例中,上述装置还包括:第一清洗模块,用于拼接每个上述帐户的原始向量数据和上述每个帐户的向量数据,以及拼接每个上述对象的原始向量数据和每个上述对象的向量数据,确定出目标向量矩阵,以目标数据之前,对每个上述帐户的原始数据和每个上述对象的原始数据均执行第一特征清洗操作,其中,上述第一特征清洗操作包括以下至少之一:特征格式的检测,异常值的处理,重复值的处理,缺失值的处理,特征值的归一化处理,特征值的标准化处理,特征值的分桶处理。
在一个示例性实施例中,上述第一输入模块,包括:第一计算单元,用于利用每个帐户的行为标签向量和帐户集群中的帐户数量计算帐户集群对对象集群进行转化的转化率标签;第一处理单元,用于将目标数据和转化率标签输入至目标网络模型中,得到目标网络模型输出的帐户集群和对象集群之间的第一转化率。
在一个示例性实施例中,上述目标网络模型是通过如下方式进行训练得到的:将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征,其中,上述训练数据中的数据均属于同一类别的数据,上述训练数据与上述目标数据的数据类型相同,上述训练数据中包括第一样本数据和第二样本数据,上述第一样本数据中包括不同类型的样本帐户集群,上述第二样本数据包括不同类型的样本对象集群,上述样本帐户集群中每个样本帐户的属性特征和每个上述样本帐户的行为特征,上述样本对象集群中每个上述样本对象的属性特征和每个上述样本对象的行为特征,上述样本帐户集群中的所有帐户均属于同一帐户类别,上述样本对象集群中的所有对象均属于同一对象类别,上述融合特征包括上述样本帐户集群和上述样本对象集群融合的属性特征和行为特征;将上述融合特征输入至上述原始网络模型中的第二网络中,得到转化率;基于上述转化率确定上述原始网络模型的损失值;基于上述损失值迭代更新上述原始网络模型的网络参数,得到上述目标网络模型。
在一个示例性实施例中,上述训练数据通过如下方式得到:按照第一采样规则从样本数据集中抽取第一样本数据,其中,上述第一采样规则包括每个样本数据被抽取到的概率相同;按照第二采样规则从上述样本数据集中抽取第二样本数据,其中,上述样本数据集中包括第一类型的样本数据和第二样本数据,上述第一类型的样本数据的数量小于或等于上述第二样本数据的数量,上述第二采样规则包括上述第二样本数据被抽取到的概率大于上述第一类型的样本数据被抽取到的概率,上述第一类型的样本数据包括不同类型的帐户集群,上述第二样本数据包括不同类型的对象集群;将上述第一样本数据、上述第二样本数据与原始样本数据进行拼接,得到上述训练数据。
在一个示例性实施例中,上述装置还包括:第一拼接模块,用于将上述第一样本数据、上述第二样本数据与原始样本数据进行拼接,得到上述训练数据。上述第一拼接模块包括:第一转化单元,用于将上述原始样本数据的数据格式转化为向量格式的数据,得到原始样本向量数据;第二拼接单元,用于将上述原始样本向量数据拼接至上述第一样本数据和上述第二样本数据组成的样本向量矩阵中,得到上述训练数据。
在一个示例性实施例中,上述装置通过以下方式确定上述原始样本数据:获取上述第一样本数据的第一原始样本数据,其中,上述第一原始样本数据包括:上述第一原始样本数据的原始样本属性和上述第一原始样本数据的原始样本行为特征,其中,上述第一原始样本数据的原始样本行为特征包括被转化的行为,上述第一样本数据与上述帐户集群中的帐户的数据的数据类型相同;获取上述第二样本数据的第二原始样本数据,其中,上述第二原始样本数据包括:上述第二原始样本数据的原始样本属性和上述第二原始样本数据的原始样本行为特征,其中,上述第二原始样本数据的原始样本行为特征包括被转化的行为,上述第二样本数据与上述对象集群中的对象的数据的数据类型相同;将上述第一原始样本数据和上述第二原始样本数据确定为上述原始样本数据。
在一个示例性实施例中,上述装置还包括:第二清洗模块,用于将上述第一原始样本数据和上述第二原始样本数据确定为上述原始样本数据之前,对上述第一原始样本数据和上述第二原始样本数据均执行第二特征清洗操作,其中,上述第二特征清洗操作包括以下至少之一:特征格式的检测,异常值的处理,重复值的处理,缺失值的处理,特征值的归一化处理,特征值的标准化处理,特征值的分桶处理。
在一个示例性实施例中,上述第一网络包括:第一分支网络,上述第一分支网络包括:依次连接的第一输入层、第一嵌入层以及第一特征提取网络,依次连接的第二输入层、第二嵌入层以及第二特征提取网络,与上述第一特征提取网络和上述第二特征提取网络均连接的第一特征融合网络;第二分支网络,上述第二分支网络包括:依次连接的第三输入层、第三嵌入层以及第三特征提取网络,依次连接的第四输入层、第四嵌入层以及第四特征提取网络,与上述第三特征提取网络和上述第四特征提取网络均连接的第二特征融合网络。
在一个示例性实施例中,上述第一输入模块,包括:第一输入单元,用于将上述训练数据输入至上述第一输入层和上述第二输入层,其中,上述训练数据中包括样本帐户集群中每个样本帐户的属性特征和每个上述样本帐户的行为特征,样本对象集群中每个样本对象的属性特征和每个上述样本对象的行为特征,上述样本帐户集群中的所有样本帐户均属于同一帐户类别,上述样本对象集群中的所有样本对象均属于同一对象类别;第二输入单元,用于通过上述第一输入层将上述训练数据输入至上述第一嵌入层,并通过上述第二输入层将上述训练数据输入至上述第二嵌入层,得到上述第一嵌入层输出的第一预设维度的第一向量矩阵,上述第二嵌入层输出的第二预设维度的第二向量矩阵;第三输入单元,用于将上述第一向量矩阵输入至上述第一特征提取网络,并将上述第二向量矩阵输入至上述第二特征提取网络,得到上述第一特征提取网络输出的上述样本帐户集群的属性特征与上述样本对象集群的属性特征之间的第一关系,上述第二特征提取网络输出的上述样本帐户集群的行为特征与上述样本对象集群的行为特征之间的第二关系;第四输入单元,用于将上述第一关系和上述第二关系输入至上述第一特征融合网络中进行特征融合,得到上述第一特征融合网络输出的上述样本帐户集群和上述样本对象集群之间的第一融合特征,其中,上述融合特征中包括上述第一融合特征。
在一个示例性实施例中,上述装置通过以下方式将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征:将上述训练数据输入至上述第三输入层和上述第三输入层,其中,上述训练数据中包括样本帐户集群中每个样本帐户的属性特征和每个上述样本帐户的行为特征,样本对象集群中每个样本对象的属性特征和每个上述样本对象的行为特征,上述样本帐户集群中的所有样本帐户均属于同一帐户类别,上述样本对象集群中的所有样本对象均属于同一对象类别;通过上述第三输入层将上述训练数据输入至上述第三嵌入层,并通过上述第四输入层将上述训练数据输入至上述第四嵌入层,得到上述第三嵌入层输出的第三预设维度的第三向量矩阵,上述第四嵌入层输出的第四预设维度的第四向量矩阵;将上述第三向量矩阵输入至上述第三特征提取网络,并将上述第四向量矩阵输入至上述第四特征提取网络,得到上述第三特征提取网络输出的每个上述样本帐户的属性特征与每个上述样本对象的属性特征之间的第三关系,上述第四特征提取网络输出的每个上述样本帐户的行为特征与每个上述样本对象的行为特征之间的第四关系;将上述第三关系和上述第四关系输入至上述第二特征融合网络中进行特征融合,得到上述第二特征融合网络输出的每个上述样本帐户和每个上述样本对象之间的第二融合特征,其中,上述融合特征中包括上述第二融合特征。
在一个示例性实施例中,上述第二网络包括:聚合网络,上述聚合网络包括第一聚合网络和第二聚合网络,其中,上述第一聚合网络与上述第一特征融合网络连接,上述第二聚合网络与上述第二特征融合网络连接;第一神经网络,上述第一神经网络与上述聚合网络连接;第一输出层,上述第一输出层与上述第一神经网络连接;第二神经网络,上述第二神经网络与上述第一特征融合网络、上述第二特征融合网络均连接;第二输出层,上述第二输出层与上述第二神经网络连接。
在一个示例性实施例中,上述装置通过以下方式将上述融合特征输入至上述原始网络模型中的第二网络中,得到转化率:将上述第一融合特征输入至上述第一聚合网络中,并将上述第二融合特征输入至上述第二聚合网络中,得到上述第一聚合网络输出的样本对象集群表征,上述第二聚合网络输出的样本帐户集群表征;将样本对象集群表征、样本帐户集群表征以及样本转化率标签输入至第一神经网络,以在第一神经网络中融合样本对象集群表征和样本帐户集群表征,其中,样本转化率标签是利用每个样本帐户的行为标签向量和样本帐户集群中的样本帐户数量计算得到的;通过上述第一输出层中输出上述样本帐户集群对上述样本对象集群的第一预测值,其中,上述转化率中包括上述第一预测值。
在一个示例性实施例中,上述装置通过以下方式基于上述转化率确定上述原始网络模型的损失值:利用上述第一预测值和上述训练数据中的样本对象集群的标签值和样本帐户集群的标签值计算上述原始网络模型的损失值。
在一个示例性实施例中,上述装置通过以下方式将上述融合特征输入至上述原始网络模型中的第二网络中,得到转化率:将上述第一融合特征和上述第二融合特征输入至上述第二神经网络中,以在上述第二神经网络中融合上述第一融合特征和上述第二融合特征;通过上述第二输出层中输出每个上述样本帐户转化每个上述样本对象的第二预测值,其中,上述转化率包括上述第二预测值。
在一个示例性实施例中,上述装置通过以下方式基于上述转化率确定上述原始网络模型的损失值:利用上述第二预测值和上述训练数据中的每个样本对象的标签值和每个样本帐户的标签值计算上述原始网络模型的损失值。
在一个示例性实施例中,上述装置还包括:
第一终止模块,用于基于上述损失值迭代更新上述原始网络模型的网络参数,得到上述目标网络模型之前,上述方法还包括:在上述损失值收敛和/或对上述原始网络模型的训练次数大于预设次数时,终止对上述原始网络模型的训练。
根据本申请的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本申请,获取预设时间段内的目标数据,其中,目标数据中包括:帐户集群中每个帐户的属性特征和每个帐户的行为特征,对象集群中每个对象的属性特征和每个对象的行为特征,帐户集群中的所有帐户均属于同一帐户类别,对象集群中的所有对象均属于同一对象类别;将目标数据输入至目标网络模型中,得到目标网络模型输出的帐户集群和对象集群之间的第一转化率;基于第一转化率调整对帐户集群的推荐对象。由于上述方法中,是将帐户集群和对象集群同时输入至目标模型中,是对帐户集群转化率的预估,可以实现提升转化率预估的准确性。因此,可以解决相关技术中对象转化率的准确度较低的问题,达到提高对象转化率的准确性的效果。
附图说明
图1是本申请实施例的一种对象推荐的调整方法的移动终端的硬件结构框图;
图2是根据本申请实施例的对象推荐的调整方法的流程图;
图3是根据本申请实施例的基于深度学习的群体转化率预估方法的流程图;
图4是根据本申请实施例的人群转化率模型的结构示意图;
图5是根据本申请实施例的对象推荐的调整装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请的实施例。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
下面对本实施例中的相关技术解释如下:
CR:Conversion Rate,转化率,用户是否购买商品的概率;
ID:IDentity,身份标识号,序列号;
Batch:分批,一批数据;
Shared-Bottom:底层共享模块;
DNN:Deep Neural Networks,深度神经网络;
FM:Factorization Machine, 因子分解机;
RNN:Recurrent Neural Network,循环神经网络;
LSTM:Long Short Term Memory,长短期记忆网络;
GRU:Gated Recurrent Unit,门控循环单元网络;
TCN:Temporal Convolutional Network,时域卷积网络。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本申请实施例的一种对象推荐的调整方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的对象推荐的调整方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种对象推荐的调整方法,图2是根据本申请实施例的对象推荐的调整方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取预设时间段内的目标数据,其中,目标数据中包括:帐户集群中每个帐户的属性特征和每个帐户的行为特征,对象集群中每个对象的属性特征和每个对象的行为特征,帐户集群中的所有帐户均属于同一帐户类别,对象集群中的所有对象均属于同一对象类别;
步骤S204,将目标数据输入至目标网络模型中,得到目标网络模型输出的帐户集群和对象集群之间的第一转化率;
步骤S206,基于第一转化率调整对帐户集群的推荐对象。
其中,上述步骤的执行主体可以为终端、服务器、终端或服务器中设置的具体处理器,或者与终端或者服务器相对独立设置的处理器或者处理设备等,但不限于此。
本实施例可用于需要进行推荐的场景中,例如,电商平台为用户群体推荐商品集合的场景中。同时,还可以用于到任意用户群体和内容集合的推荐场景中,例如,给某用户群推荐短视频集、热点新闻动态变化、技术更新迭代文集等推荐内容集合。
在本实施例中,预设时间段的取值是可以基于实际应用场景来灵活设置的。帐户集群可以是登录至某一网站的所有帐户,也可以是部分帐户。对象集群可以是商品、短视频等。例如,获取24小时内某购物网站中浏览电子产品的20-30岁的人群的数据。帐户的属性特征包括注册帐户的年龄、性别、职业、学历、所在城市等信息。帐户的行为特征包括帐户在某段时间内(例如1天、3天、7天、14天、30天)点击、收藏、购买的某一类商品的次数和价格等信息。对象的属性特征包括对象的基本属性,例如,商品的标题、类目、行业和品牌等。对象的行为特征包括对象的被转化的信息,例如,商品在某段时间内(例如,30天)被浏览、点击、收藏和购买的次数等信息。
在本实施例中,目标网络模型包括但不限于是神经网络模型,神经网络模型中包括第一网络和第二网络,第一网络包括:第一分支网络,第一分支网络包括:依次连接的第一输入层、第一嵌入层以及第一特征提取网络,依次连接的第二输入层、第二嵌入层以及第二特征提取网络,与第一特征提取网络和第二特征提取网络均连接的第一特征融合网络;第二分支网络,第二分支网络包括:依次连接的第三输入层、第三嵌入层以及第三特征提取网络,依次连接的第四输入层、第四嵌入层以及第四特征提取网络,与第三特征提取网络和第四特征提取网络均连接的第二特征融合网络。第二网络包括:聚合网络,聚合网络包括第一聚合网络和第二聚合网络,其中,第一聚合网络与第一特征融合网络连接,第二聚合网络与第二特征融合网络连接;第一神经网络,第一神经网络与聚合网络连接;第一输出层,第一输出层与第一神经网络连接;第二神经网络,第二神经网络与第一特征融合网络、第二特征融合网络均连接;第二输出层,第二输出层与第二神经网络连接。
在本实施例中,第一转化率包括帐户集群转换对象集群的转化率。帐户集群转换对象集群包括对对象集群的购买率、点击率等信息。例如,20-30年龄段的人群对电子产品的购买率是60%。
在训练的过程中,可以对第一聚合网络和第二聚合网络同时进行训练,也可以只训练第一聚合网络。在同时训练时,可以参考第二输出层输出的转化率优化第一输出层输出的转化率。
通过上述步骤,获取预设时间段内的目标数据,其中,目标数据中包括:帐户集群中每个帐户的属性特征和每个帐户的行为特征,对象集群中每个对象的属性特征和每个对象的行为特征,帐户集群中的所有帐户均属于同一帐户类别,对象集群中的所有对象均属于同一对象类别;将目标数据输入至目标网络模型中,得到目标网络模型输出的帐户集群和对象集群之间的第一转化率;基于第一转化率调整对帐户集群的推荐对象。由于上述方法中,是将帐户集群和对象集群同时输入至目标模型中,是对帐户集群转化率的预估,可以实现提升转化率预估的准确性。因此,可以解决相关技术中对象转化率的准确度较低的问题,达到提高对象转化率的准确性的效果。
在一个示例性实施例中,获取预设时间段内的目标数据,包括:获取帐户集群中每个帐户的向量数据,其中,每个帐户的向量数据包括:每个帐户的标识向量、每个帐户所归属的帐户集群的标识向量以及每个帐户的行为标签向量,其中,行为标签向量用于表示每个帐户转化对象集群中的对象的行为;获取对象集群中每个对象的向量数据,其中,每个对象的向量数据包括:每个对象的标识向量和每个对象所归属的对象集群的标识向量;基于每个帐户的向量数据和每个对象的向量数据确定目标数据。在本实施例中,目标数据均是可以直接输入至目标网络模型的数据。在获取到帐户集群和对象集群的数据之后,需要将数据转化为向量数据,例如,人的年龄是一个数值的特征,可以将年龄从0到100等距划分成10个区间,将用户年龄分到对应区间,将用户所在的年龄区间转化为向量数据。
本实施例通过获取帐户集群和对象集群的向量数据,可以直接输入至目标网络模型中,加快了转化率计算的效率。
在一个示例性实施例中,基于每个帐户的向量数据和每个对象的向量数据确定目标数据,包括:获取每个帐户的原始数据,其中,每个帐户的原始数据包括:每个帐户的原始属性和每个帐户的原始行为特征,其中,原始行为特征包括每个帐户转化对象集群的行为;获取每个对象的原始数据,其中,每个对象的原始数据包括:每个对象的原始属性和每个对象的原始行为特征,其中,每个对象的原始行为特征包括每个对象被帐户集群转化的行为;将每个帐户的原始数据转换为向量数据,得到每个帐户的原始向量数据;拼接每个帐户的原始向量数据和每个帐户的向量数据,以及拼接每个对象的原始向量数据和每个对象的向量数据,确定出目标向量矩阵,以得到目标数据。在本实施例中,帐户的原始数据和对象的原始数据可以从数据库中获取,也可以从外部设备中获取。例如,在网上购物平台的场景中,可以获取用户集群中每个用户的年龄、性别、学历等原始信息,以及用户浏览商品的浏览信息、收藏信息、购买信息等。获取电子商品中电子产品的名称、用途、使用方法,以及电子产品被浏览的次数、被收藏的次数、被购买的次数等。
本实施例通过获取原始信息,并将其转化为向量数据,可以将其融合至目标数据中,丰富了输入数据。
在一个示例性实施例中,拼接每个帐户的原始向量数据和每个帐户的向量数据,以及拼接每个对象的原始向量数据和每个对象的向量数据,确定出目标向量矩阵,以得到目标数据之前,上述方法还包括:对每个帐户的原始数据和每个对象的原始数据均执行第一特征清洗操作,其中,第一特征清洗操作包括以下至少之一:特征格式的检测,异常值的处理,重复值的处理,缺失值的处理,特征值的归一化处理,特征值的标准化处理,特征值的分桶处理。在本实施例中,特征格式的检测包括检测数据的格式,在数据格式不是向量数据时,将其转换为向量数据,例如,将性别中的男、女、未知用001、002、000表示。异常值的处理包括将数据中的异常数据剔除,例如,将未知性别的数据删除。重复值的处理包括删除重复的数据。缺失值的处理包括将某一时间点缺失的数据补充上,或者是删除没有数据的时间点。特征值的归一化处理包括对最大值和最小值的归一化,例如,将最大值和最小值归一化是将数值型特征缩放到0~1之间。特征值的标准化处理包括将数据的特征值转化至同一量纲或者同一维度中。特征值的分桶处理包括将根据业务经验或常识,将一个数值型数据归类到各个区间中,例如,年龄是一个数值型特征,可以将年龄从0到100等距划分成10个区间,将用户年龄分到对应区间。
本实施例通过对数据的清洗操作,可以有效的去除冗余数据,优化输入目标网络模型中的数据。
在一个示例性实施例中,将所述目标数据输入至目标网络模型中,得到所述目标网络模型输出的所述帐户集群和所述对象集群之间的第一转化率,包括:利用每个所述帐户的行为标签向量和所述帐户集群中的帐户数量计算所述帐户集群对所述对象集群进行转化的转化率标签;将所述目标数据和所述转化率标签输入至目标网络模型中,得到所述目标网络模型输出的所述帐户集群和所述对象集群之间的第一转化率。在本实施例中,转化率标签,其中,N是对帐户集群进行分批的大小,yi是帐户是否购买对象的标签值,即如果帐户购买了对象,yi=1,否则,yi=0。就可以构造出了该分批数据的转化率标签ycr
在一个示例性实施例中,目标网络模型是通过如下方式进行训练得到的:将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征,其中,训练数据中的数据均属于同一类别的数据,训练数据与目标数据的数据类型相同,训练数据中包括第一样本数据和第二样本数据,第一样本数据中包括不同类型的样本帐户集群,第二样本数据包括不同类型的样本对象集群,样本帐户集群中每个样本帐户的属性特征和每个样本帐户的行为特征,样本对象集群中每个样本对象的属性特征和每个样本对象的行为特征,样本帐户集群中的所有帐户均属于同一帐户类别,样本对象集群中的所有对象均属于同一对象类别,融合特征包括样本帐户集群和样本对象集群融合的属性特征和行为特征;将融合特征输入至原始网络模型中的第二网络中,得到转化率;基于转化率确定原始网络模型的损失值;基于损失值迭代更新原始网络模型的网络参数,得到目标网络模型。在本实施例中,原始网络模型的结构与目标网络模型的结构相同。训练数据包括多个批次,每个批次的训练数据包括一个类别的数据,例如,20-30年龄段的人群购买电子产品的数据,60-70年龄段的人群购买电子产品的数据。同时,将帐户的表征和对象的表征进行融合,可以充分的建模帐户集群和对象集群的特征信息,更加准确的从个体特征中抽取出帐户集群和对象集群的表征,使得模型达到更好的训练效果。
在一个示例性实施例中,训练数据通过如下方式得到:按照第一采样规则从样本数据集中抽取第一样本数据,其中,第一采样规则包括每个样本数据被抽取到的概率相同;按照第二采样规则从样本数据集中抽取第二样本数据,其中,样本数据集中包括第一类型的样本数据和第二样本数据,第一类型的样本数据的数量小于或等于第二样本数据的数量,第二采样规则包括第二样本数据被抽取到的概率大于第一类型的样本数据被抽取到的概率,第一类型的样本数据包括不同类型的帐户集群,第二样本数据包括不同类型的对象集群;将第一样本数据、第二样本数据与原始样本数据进行拼接,得到训练数据。在本实施例中,样本数据集中包括同一个帐户集群和同一个对象集群的数据。采样数据并不是采用随机均匀采样方式,而是在同一个帐户集群和同一个对象集群的训练数据中进行采样,可以从这种分批数据中更好地学习到帐户集群和对象集群的相互关系,避免了不同帐户集群和不同对象集群信息的相互干扰,从而可以提升预测的准确率。此外,第一类型的样本数据和第二样本数据可以是正负样本,例如,用户购买商品的数据是正样本,用户没有购买行为的数据是负样本,正负样本的采样比例可以设置成1:1~1:3之间。使得正负样本尽可能保持均衡,可以避免正负样本数量比例差距太大造成不均衡问题。同时,要保持样本中人群最大规模和最小规模比例,商品集合的最大规模和最小规模比例都不应过大,例如,可以设置成1:1~20:1之间。可以提高小规模人群和小规模商品的训练数据所占的比例,使得它们也能得到充分训练。
在一个示例性实施例中,将第一样本数据、第二样本数据与原始样本数据进行拼接,得到训练数据,包括:将原始样本数据的数据格式转化为向量格式的数据,得到原始样本向量数据;将原始样本向量数据拼接至第一样本数据和第二样本数据组成的样本向量矩阵中,得到训练数据。在本实施例中,将原始样本数据的数据格式转换为向量数据,可以直接输入至模型中进行训练。拼接数据的方式包括将原始样本数据和第一样本数据、第二样本数据记性融合,例如,第一样本数据和第二样本数据中包括的内容如表1所示:
表1:
将原始样本数据的进行转化之后,融入至表1中,就可以得到附加用户属性和商品属性的训练数据,从而可以准确的进行模型训练。
在一个示例性实施例中,通过以下方式确定原始样本数据:获取第一样本数据的第一原始样本数据,其中,第一原始样本数据包括:第一原始样本数据的原始样本属性和第一原始样本数据的原始样本行为特征,其中,第一原始样本数据的原始样本行为特征包括被转化的行为,第一样本数据与帐户集群中的帐户的数据的数据类型相同;获取第二样本数据的第二原始样本数据,其中,第二原始样本数据包括:第二原始样本数据的原始样本属性和第二原始样本数据的原始样本行为特征,其中,第二原始样本数据的原始样本行为特征包括被转化的行为,第二样本数据与对象集群中的对象的数据的数据类型相同;将第一原始样本数据和第二原始样本数据确定为原始样本数据。在本实施例中,第一原始样本数据中主要是包括帐户的基本属性信息以及基本的行为信息,例如,用户的姓名、性别、年龄、对某一类商品的浏览量、购买量、收藏量等信息。第二原始样本数据中主要包括对象的基本属性信息以及基本的行为信息,例如,电子商品的名称、使用方法、结构部件、被浏览的数量、被购买的数量等。通过获取原始样本数据,可以对模型进行充分的训练。
在一个示例性实施例中,将第一原始样本数据和第二原始样本数据确定为原始样本数据之前,方法还包括:对第一原始样本数据和第二原始样本数据均执行第二特征清洗操作,其中,第二特征清洗操作包括以下至少之一:特征格式的检测,异常值的处理,重复值的处理,缺失值的处理,特征值的归一化处理,特征值的标准化处理,特征值的分桶处理。在本实施例中,特征格式的检测包括检测数据的格式,在数据格式不是向量数据时,将其转换为向量数据,例如,将性别中的男、女、未知,用001、002、000表示。异常值的处理包括将数据中的异常数据剔除,例如,将未知性别的数据删除。重复值的处理包括删除重复的数据。缺失值的处理包括将某一时间点缺失的数据补充上,或者是删除没有数据的时间点。特征值的归一化处理包括对最大值和最小值的归一化,例如,将最大值和最小值归一化是将数值型特征缩放到0~1之间。特征值的标准化处理包括将数据的特征值转化至同一量纲或者同一维度中。特征值的分桶处理包括将根据业务经验或常识,将一个数值型数据归类到各个区间中,例如,年龄是一个数值型特征,可以将年龄从0到100等距划分成10个区间,将用户年龄分到对应区间。本实施例通过对数据的清洗操作,可以有效的去除冗余数据,优化输入目标网络模型中的样本数据。
在一个示例性实施例中,第一网络包括:第一分支网络,第一分支网络包括:依次连接的第一输入层、第一嵌入层以及第一特征提取网络,依次连接的第二输入层、第二嵌入层以及第二特征提取网络,与第一特征提取网络和第二特征提取网络均连接的第一特征融合网络;第二分支网络,第二分支网络包括:依次连接的第三输入层、第三嵌入层以及第三特征提取网络,依次连接的第四输入层、第四嵌入层以及第四特征提取网络,与第三特征提取网络和第四特征提取网络均连接的第二特征融合网络。在本实施例中,第一特征提取网络和第三特征提取网络可以是DNN、FM或者Transformer结构。第二特征提取网络和第四特征提取网络可以是RNN、LSTM、GRU、TCN或者Transformer结构。第一特征融合网络、第二特征融合网络可以是由多个全连接层构成的DNN深度神经网络。
在一个示例性实施例中,将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征,包括:将训练数据输入至第一输入层和第二输入层,其中,训练数据中包括样本帐户集群中每个样本帐户的属性特征和每个样本帐户的行为特征,样本对象集群中每个样本对象的属性特征和每个样本对象的行为特征,样本帐户集群中的所有样本帐户均属于同一帐户类别,样本对象集群中的所有样本对象均属于同一对象类别;通过第一输入层将训练数据输入至第一嵌入层,并通过第二输入层将训练数据输入至第二嵌入层,得到第一嵌入层输出的第一预设维度的第一向量矩阵,第二嵌入层输出的第二预设维度的第二向量矩阵;将第一向量矩阵输入至第一特征提取网络,并将第二向量矩阵输入至第二特征提取网络,得到第一特征提取网络输出的样本帐户集群的属性特征与样本对象集群的属性特征之间的第一关系,第二特征提取网络输出的样本帐户集群的行为特征与样本对象集群的行为特征之间的第二关系;将第一关系和第二关系输入至第一特征融合网络中进行特征融合,得到第一特征融合网络输出的样本帐户集群和样本对象集群之间的第一融合特征,其中,融合特征中包括第一融合特征。在本实施例中,可以是将训练数据同时输入至第一输入层和第二输入层,在第一嵌入层和第二嵌入层中对数据进行维度和稠密度的转换,即是将离散的向量数据转换为相对比较稠密的向量数据。本实施例通过各个层级的数据训练,可以对模型进行充分的训练。
在一个示例性实施例中,将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征,包括:将训练数据输入至第三输入层和第三输入层,其中,训练数据中包括样本帐户集群中每个样本帐户的属性特征和每个样本帐户的行为特征,样本对象集群中每个样本对象的属性特征和每个样本对象的行为特征,样本帐户集群中的所有样本帐户均属于同一帐户类别,样本对象集群中的所有样本对象均属于同一对象类别;通过第三输入层将训练数据输入至第三嵌入层,并通过第四输入层将训练数据输入至第四嵌入层,得到第三嵌入层输出的第三预设维度的第三向量矩阵,第四嵌入层输出的第四预设维度的第四向量矩阵;将第三向量矩阵输入至第三特征提取网络,并将第四向量矩阵输入至第四特征提取网络,得到第三特征提取网络输出的每个样本帐户的属性特征与每个样本对象的属性特征之间的第三关系,第四特征提取网络输出的每个样本帐户的行为特征与每个样本对象的行为特征之间的第四关系;将第三关系和第四关系输入至第二特征融合网络中进行特征融合,得到第二特征融合网络输出的每个样本帐户和每个样本对象之间的第二融合特征,其中,融合特征中包括第二融合特征。在本实施例中,通过同时输出第一融合特征和第二融合特征,可以更好的提取出帐户集群和对象集群的表征,从而使得帐户集群的转化率预测可以融合到对象集群的转化率预测模型中,实现了端到端的模型训练。
在一个示例性实施例中,第二网络包括:聚合网络,聚合网络包括第一聚合网络和第二聚合网络,其中,第一聚合网络与第一特征融合网络连接,第二聚合网络与第二特征融合网络连接;第一神经网络,第一神经网络与聚合网络连接;第一输出层,第一输出层与第一神经网络连接;第二神经网络,第二神经网络与第一特征融合网络、第二特征融合网络均连接;第二输出层,第二输出层与第二神经网络连接。
在一个示例性实施例中,将融合特征输入至原始网络模型中的第二网络中,得到转化率,包括:将第一融合特征输入至第一聚合网络中,并将第二融合特征输入至第二聚合网络中,得到第一聚合网络输出的样本对象集群表征,第二聚合网络输出的样本帐户集群表征;将样本对象集群表征、样本帐户集群表征以及样本转化率标签输入至第一神经网络,以在第一神经网络中融合样本对象集群表征和样本帐户集群表征,其中,样本转化率标签是利用每个样本帐户的行为标签向量和样本帐户集群中的样本帐户数量计算得到的;通过第一输出层中输出样本帐户集群对样本对象集群的第一预测值,其中,转化率中包括第一预测值。本实施例在一个模型中使用两个表征聚合模块,直接将帐户集群表征和对象集群表征聚合,可以得到帐户集群表征和对象集群表征,整体建模了从帐户到帐户集群,从对象到对象集群的内在联系,避免了间接建模造成的个体与集合之间内在关系的割裂,提高了模型的鲁棒性和泛化能力。
在一个示例性实施例中,基于转化率确定原始网络模型的损失值,包括:利用第一预测值和训练数据中的样本对象集群的标签值和样本帐户集群的标签值计算原始网络模型的损失值。在本实施例中,模型采用交叉熵损失函数进行二分类损失的计算。
在一个示例性实施例中,将融合特征输入至原始网络模型中的第二网络中,得到转化率,包括:将第一融合特征和第二融合特征输入至第二神经网络中,以在第二神经网络中融合第一融合特征和第二融合特征;通过第二输出层中输出每个样本帐户转化每个样本对象的第二预测值,其中,转化率包括第二预测值。
在一个示例性实施例中,基于转化率确定原始网络模型的损失值,包括:利用第二预测值和训练数据中的每个样本对象的标签值和每个样本帐户的标签值计算原始网络模型的损失值。
本实施例结合两个损失值可以确定出网络模型的总损失函数,加快了模型的收敛。同时避免模型过拟合,增强了模型的泛化能力和鲁棒性。
在一个示例性实施例中,基于损失值迭代更新原始网络模型的网络参数,得到目标网络模型之前,方法还包括:在损失值收敛和/或对原始网络模型的训练次数大于预设次数时,终止对原始网络模型的训练。可以有效的控制模型的训练时间。
下面结合具体实施例对本发明进行说明:
本实施例以计算用户集合对商品集合的转化率为例进行说明。
本实施例的目的是为任一人群推荐最有可能发生转化的某一个商品集合。本实施例提供一种基于深度学习的群体转化率预估方法,如图3所示,包括以下步骤:
S301,样本采样,获取样本数据(对应于上述中的第一样本数据和第二样本数据);
从某一时间段(例如,24小时)内从海量用户数据中采样出部分数据作为样本,每条样本数据中包括了一个用户ID和所属人群ID,商品ID和所属商品集合ID,和是否发生购买的标签yi(如果用户购买了商品,yi为1,否则为0),具体如表格1所示。
在样本采样过程中,用户购买商品的数据是正样本,用户没有购买行为的数据是负样本,正负样本的采样比例不应过大,例如,可以设置成1:1~1:3之间。使得正负样本尽可能保持均衡,避免正负样本数量比例差距太大造成不均衡的问题。同时,要保持样本中人群最大规模和最小规模的比例,商品集合的最大规模和最小规模比例都不应过大,例如,可以设置成1:1~20:1之间,可以提高小规模人群和小规模商品的训练数据所占的比例,使得它们能得到充分的训练。
S302,获取用户和商品的原始信息数据(对应于上述中的原始样本数据);
根据任务的实际应用场景,评估特征数据相关性,选择特征。根据当前用户和当前商品,从数据库(例如,Hive、MySQL或者MongoDB)中,查询获得用户和商品原始信息数据。用户的原始信息包括用户的属性信息(对应于上述中的原始样本属性)和行为序列信息(对应于上述中的原始样本行为特征),用户属性信息包括:年龄、性别、学历和所在城市等,例如,Fattru={年龄,性别,学历,城市,…}。用户行为信息包括:用户在过去的某段时间内(如过去1天、3天、7天、14天、30天)点击、收藏、购买的商品的次数和价格等,例如,Fsequ={用户u在过去3天点击的商品次数,用户u在过去3天购买商品的价格,…}。商品的原始信息包括该商品的属性信息(对应于上述中的原始样本属性)和行为序列信息(对应于上述中的原始样本行为特征),例如商品的标题、类目、行业和品牌等。例如Fattri={标题,类目,行业,品牌,…}。商品的行为序列信息包括该商品在过去某段时间内(如过去30天)被浏览、点击、收藏和购买的次数等信息,例如,Fseqi={商品在过去3天被点击的次数,用户u在过去3天被购买的次数,…}。
S303,特征工程;
特征工程包括对用户和商品的原始信息数据进行清洗和加工,形成可以输入神经网络(对应于上述中的原始网络模型)的用户和商品特征数据,特征清洗包括:特征格式的检测,异常值的处理,重复值的处理,缺失值的处理,特征值的归一化处理,特征值的标准化处理,特征值的分桶处理等操作,最终形成0/1形式的独热向量作为特征。其中,最大值最小值归一化是将数值型特征缩放到0~1之间,例如,,其中,xmax和xmin 分别是数值型特征的最大值和最小值,xraw是数值型特征的原始特征值,x是归一化后的数值型特征的新特征值;特征值的标准化处理是将特征值转换到同一量纲下,例如,,其中,u是特征均值,是特征标准差,xraw是原始特征,x是标准化后的特征;特征值的分桶处理是指将根据业务经验或常识,将一个数值型数据归类到各个区间中,例如,年龄是一个数值型特征,可以将年龄从0到100等距划分成10个区间,将用户年龄分到对应区间。
S304,构造分批训练数据;
将S301的样本数据和S303的特征数据拼接后,构建成人群Batch训练数据(对应于上述中的训练数据)。通常,每个Batch的训练数据是从全部数据随机采样获得,但本实施例为了更好地建模人群和商品集合地内在关系,构建分批训练数据时,每个分批数据的样本要属于同一个人群和同一个商品集合。同时,根据每个分批中的用户是否购买商品的样本数据,可以计算该分批的人群对商品集合的转化率标签ycr,公式如下:
(1);
其中,N是分批的大小,yi是用户是否购买商品的标签值,例如,如果用户购买了商品,yi=1,否则,yi=0。这样构造出了该分批数据的人群转化率标签ycr,该标签用于任务2的训练。
S305,构建模型;
本实施例提出的人群转化率模型(对应于上述中的目标网络模型)是由一个底层共享模块(对应于上述中的第一网络)和两个任务模块(对应于上述中的第二网络)构成,如图4所示。
底层共享模块是被两个任务模块共享,主要作用是建模用户特征和商品特征。底层共享模块的输入是训练样本及其特征,包括用户和商品的属性特征和行为序列特征。训练数据输入到嵌入层后,获取嵌入层的表征,并输入到各自的特征提取网络中得到属性表征和行为序列表征,然后在表征融合网络中进行表征融合,分别得到用户表征和商品表征。
具体地,底层共享模型架构包括:输入层(包括上述中的第一输入层、第二输入层、第三输入层、第四输入层)、嵌入层(包括上述中的第一嵌入层、第二嵌入层、第三嵌入层、第四嵌入层)、用户行为序列特征提取网络(对应于上述中的第四特征提取网络)、用户属性特征提取网络(对应于上述中的第三特征提取网络)、用户表征融合网络(对应于上述中的第二特征融合网络)、商品行为序列特征(对应于上述中的第二特征提取网络)提取网络、商品属性特征提取网络(对应于上述中的第一特征提取网络)、商品表征融合网络(对应于上述中的第二特征融合网络)。
其中,输入层的数据是S304构造的样本数据;嵌入层是用于将离散序列化的特征数据转为预设维度的稠密向量;用户属性特征提取网络和商品属性特征提取网络用于特征交互,构建高阶特征,挖掘特征之间的关系,可以是DNN、FM或者Transformer结构。用户序列特征提取网络和商品序列特征网络可以用于挖掘用户和商品的时间序列特征,挖掘特征之间的前后关系,可以是RNN、LSTM、GRU、TCN或者Transformer结构。用户和商品融合网络,分别将用户和商品各自的属性表征和行为序列表征进行融合,可以由多个全连接层构成的DNN深度神经网络。
多任务模块,将用户表征和商品表征分别输入到两个任务模块中。任务1模块用来预测用户对商品的转化率,用户表征和商品表征经过深度神经网络1(对应于上述中的第二神经网络)进行融合,从任务1的输出层输出经sigmoid函数激活后的用户对商品的转化率的预测概率值。任务2模块用以预测人群对商品集合的转化率,分批用户表征经过人群表征聚合网络得到人群表征,分批商品表征经过商品表征聚合网络得到商品集合表征,人群表征和商品集合特征在经过深度神经网络2(对应于上述中的第一神经网络)后,从任务2的输出层输出经sigmoid函数激活后的群体对商品集合的转化率的预测概率值p。
具体地,人群表征聚合网络和商品集合表征聚合网络也不限定具体的网络类型,包括且不限于Mean-Pooling聚合、NetVLAD聚合和Transformer聚合等。人群表征聚合模块具体实现详述如下:
假设分批样本数据中,分批数据大小是N,第i个用户表征为di,则:
Mean-Pooling聚合中:,其中,Gmean是经过Mean-Pooling聚合后的人群表征向量。
NetVLAD聚合中,;GNetVLAD=concat(G1,G2,...,GK);其中,Gk(k∈[1,K] )是第k个聚类中心,K是常数,表示有K个聚类中心。Wk和bk是模型参数。GNetVLAD是NetVLAD聚合后的人群表征,它是由K个Gk拼接成的。
Transformer聚合中,使用Transformer模块进行用户特征聚合时,可以直接利用用户表征di,不使用位置表征向量,因为同分批的用户之间,没有前后顺序关系。所以GTransforomer=f(GTransforomer,d1,d2,...,dN);其中,函数f是多层Transformer-Block结构,人群向量GTransforomer类似于Transformer-Block的cls向量,既是模块输入,也是模块输出,即用户表征向量d1,d2,...,dN不断地通过self-attention机制,来调整人群表征向量GTransforomer
在本实施例中,商品表征聚合机制与用户表征聚合类似,不再重复叙述。需要说明的是,人群表征和商品表征聚合是独立的,二者可以采用不同的聚合机制。
在任务1用户转化率预估中,模型采用交叉熵损失函数进行二分类损失的计算,基于预测值和样本标签值得到任务1的损失值。交叉熵损失函数计算损失值的公式如下:
在任务2群体转化率预估中,模型仍然采用交叉熵损失函数进行损失计算,基于预测值和样本标签得到任务2的损失值L2,交叉熵损失函数计算损失值L2的公式如下:
L2=-ycrlogp-(1-ycr)logp(1-p);
多任务损失联合训练,模型总损失函数为:
其中,α和β用于调节两个损失函数重要性的参数,可以设置为常数,此时,0<α,β<1,且α+β=1;也可以设置为模型参数,在模型训练中自行调整。α和β的设置方式,并不影响本实施例的方案。
S306,训练人群转化率模型;多任务模型构建完成后,分批数据依次输入到网络中,反向传播梯度进行训练。当模型满足预设的收敛条件,如训练轮数达到限定值,或者损失函数值收敛,停止训练,得到训练完成的人群转化率模型。
综上所述,本实施例提出的一种基于多任务学习的转化率预估方法,该方法预估所有人群在所有商品集合上的转化率概率值,有效地提升了人群转化率预估的准确性。并设计了一种针对训练数据的分批构建方法,该方法构建分批训练数据时,不采用随机均匀采样方式,而是在同一个人群和同一个商品集合的训练数据中进行采样,模型可以从这种分批数据中更好地学习到人群和商品集合的相互关系,避免了不同人群和不同商品集合信息的相互干扰,从而提升预测准确率。同时,控制正负样本比例、人群规模大小比例和商品集合大小比例,避免样本不均衡问题。设计了用户表征和商品表征融合模块,该模块可以充分地建模人群和商品集合的特征信息,更加准确地从个体特征中抽取出人群表征和商品集合表征,帮助模型达到更好的效果。并设计了一种多任务训练和预测的方法,同时训练用户转化率任务和群体转化率任务,两任务相互辅助训练,达到很高的预测准确度,同时避免模型过拟合,增强模型的泛化能力和鲁棒性。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
在本实施例中还提供了一种对象推荐的调整装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图5是根据本申请实施例的对象推荐的调整装置的结构框图,如图5所示,该装置包括:
第一获取模块52,用于获取预设时间段内的目标数据,其中,上述目标数据中包括:帐户集群中每个帐户的属性特征和每个上述帐户的行为特征,对象集群中每个对象的属性特征和每个上述对象的行为特征,上述帐户集群中的所有帐户均属于同一帐户类别,上述对象集群中的所有对象均属于同一对象类别;
第一输入模块54,用于将上述目标数据输入至目标网络模型中,得到上述目标网络模型输出的上述帐户集群和上述对象集群之间的第一转化率;
第一调整模块56,用于基于上述第一转化率调整对上述帐户集群的推荐对象。
在一个示例性实施例中,上述第一获取模块,包括:
第一获取单元,用于获取帐户集群中每个帐户的向量数据,其中,每个上述帐户的向量数据包括:每个上述帐户的标识向量、每个上述帐户所归属的上述帐户集群的标识向量以及每个上述帐户的行为标签向量,其中,上述行为标签向量用于表示每个上述帐户转化上述对象集群中的对象的行为;
第二获取单元,用于获取对象集群中每个上述对象的向量数据,其中,每个上述对象的向量数据包括:每个上述对象的标识向量和每个上述对象所归属的上述对象集群的标识向量;
第一确定单元,用于基于每个上述帐户的向量数据和每个上述对象的向量数据确定上述目标数据。
在一个示例性实施例中,上述第一确定单元,包括:
第一获取子单元,用于获取每个上述帐户的原始数据,其中,每个上述帐户的原始数据包括:每个上述帐户的原始属性和每个上述帐户的原始行为特征,其中,上述原始行为特征包括每个上述帐户转化上述对象集群的行为;
第二获取子单元,用于获取每个上述对象的原始数据,其中,每个上述对象的原始数据包括:每个上述对象的原始属性和每个上述对象的原始行为特征,其中,每个上述对象的原始行为特征包括每个上述对象被上述帐户集群转化的行为;
第一转换子单元,用于将每个上述帐户的原始数据转换为向量数据,得到每个上述帐户的原始向量数据;
第一拼接子单元,用于拼接每个上述帐户的原始向量数据和上述每个帐户的向量数据,以及拼接每个上述对象的原始向量数据和每个上述对象的向量数据,确定出目标向量矩阵,以得到上述目标数据。
在一个示例性实施例中,上述装置还包括:第一清洗模块,用于拼接每个上述帐户的原始向量数据和上述每个帐户的向量数据,以及拼接每个上述对象的原始向量数据和每个上述对象的向量数据,确定出目标向量矩阵,以得到上述目标数据之前,对每个上述帐户的原始数据和每个上述对象的原始数据均执行第一特征清洗操作,其中,上述第一特征清洗操作包括以下至少之一:特征格式的检测,异常值的处理,重复值的处理,缺失值的处理,特征值的归一化处理,特征值的标准化处理,特征值的分桶处理。
在一个示例性实施例中,上述第一输入模块,包括:
第一计算单元,用于利用每个帐户的行为标签向量和帐户集群中的帐户数量计算帐户集群对对象集群进行转化的转化率标签;
第一处理单元,用于将目标数据和转化率标签输入至目标网络模型中,得到目标网络模型输出的帐户集群和对象集群之间的第一转化率。
在一个示例性实施例中,上述目标网络模型是通过如下方式进行训练得到的:将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征,其中,上述训练数据中的数据均属于同一类别的数据,上述训练数据与上述目标数据的数据类型相同,上述训练数据中包括第一样本数据和第二样本数据,上述第一样本数据中包括不同类型的样本帐户集群,上述第二样本数据包括不同类型的样本对象集群,上述样本帐户集群中每个样本帐户的属性特征和每个上述样本帐户的行为特征,上述样本对象集群中每个上述样本对象的属性特征和每个上述样本对象的行为特征,上述样本帐户集群中的所有帐户均属于同一帐户类别,上述样本对象集群中的所有对象均属于同一对象类别,上述融合特征包括上述样本帐户集群和上述样本对象集群融合的属性特征和行为特征;将上述融合特征输入至上述原始网络模型中的第二网络中,得到转化率;基于上述转化率确定上述原始网络模型的损失值;基于上述损失值迭代更新上述原始网络模型的网络参数,得到上述目标网络模型。
在一个示例性实施例中,上述训练数据通过如下方式得到:按照第一采样规则从样本数据集中抽取第一样本数据,其中,上述第一采样规则包括每个样本数据被抽取到的概率相同;按照第二采样规则从上述样本数据集中抽取第二样本数据,其中,上述样本数据集中包括第一类型的样本数据和第二样本数据,上述第一类型的样本数据的数量小于或等于上述第二样本数据的数量,上述第二采样规则包括上述第二样本数据被抽取到的概率大于上述第一类型的样本数据被抽取到的概率,上述第一类型的样本数据包括不同类型的帐户集群,上述第二样本数据包括不同类型的对象集群;将上述第一样本数据、上述第二样本数据与原始样本数据进行拼接,得到上述训练数据。
在一个示例性实施例中,上述装置还包括:
第一拼接模块,用于将上述第一样本数据、上述第二样本数据与原始样本数据进行拼接,得到上述训练数据。上述第一拼接模块包括:第一转化单元,用于将上述原始样本数据的数据格式转化为向量格式的数据,得到原始样本向量数据;
第二拼接单元,用于将上述原始样本向量数据拼接至上述第一样本数据和上述第二样本数据组成的样本向量矩阵中,得到上述训练数据。
在一个示例性实施例中,上述装置通过以下方式确定上述原始样本数据:获取上述第一样本数据的第一原始样本数据,其中,上述第一原始样本数据包括:上述第一原始样本数据的原始样本属性和上述第一原始样本数据的原始样本行为特征,其中,上述第一原始样本数据的原始样本行为特征包括被转化的行为,上述第一样本数据与上述帐户集群中的帐户的数据的数据类型相同;获取上述第二样本数据的第二原始样本数据,其中,上述第二原始样本数据包括:上述第二原始样本数据的原始样本属性和上述第二原始样本数据的原始样本行为特征,其中,上述第二原始样本数据的原始样本行为特征包括被转化的行为,上述第二样本数据与上述对象集群中的对象的数据的数据类型相同;将上述第一原始样本数据和上述第二原始样本数据确定为上述原始样本数据。
在一个示例性实施例中,上述装置还包括:
第二清洗模块,用于将上述第一原始样本数据和上述第二原始样本数据确定为上述原始样本数据之前,对上述第一原始样本数据和上述第二原始样本数据均执行第二特征清洗操作,其中,上述第二特征清洗操作包括以下至少之一:特征格式的检测,异常值的处理,重复值的处理,缺失值的处理,特征值的归一化处理,特征值的标准化处理,特征值的分桶处理。
在一个示例性实施例中,上述第一网络包括:第一分支网络,上述第一分支网络包括:依次连接的第一输入层、第一嵌入层以及第一特征提取网络,依次连接的第二输入层、第二嵌入层以及第二特征提取网络,与上述第一特征提取网络和上述第二特征提取网络均连接的第一特征融合网络;第二分支网络,上述第二分支网络包括:依次连接的第三输入层、第三嵌入层以及第三特征提取网络,依次连接的第四输入层、第四嵌入层以及第四特征提取网络,与上述第三特征提取网络和上述第四特征提取网络均连接的第二特征融合网络。
在一个示例性实施例中,上述第一输入模块,包括:
第一输入单元,用于将上述训练数据输入至上述第一输入层和上述第二输入层,其中,上述训练数据中包括样本帐户集群中每个样本帐户的属性特征和每个上述样本帐户的行为特征,样本对象集群中每个样本对象的属性特征和每个上述样本对象的行为特征,上述样本帐户集群中的所有样本帐户均属于同一帐户类别,上述样本对象集群中的所有样本对象均属于同一对象类别;
第二输入单元,用于通过上述第一输入层将上述训练数据输入至上述第一嵌入层,并通过上述第二输入层将上述训练数据输入至上述第二嵌入层,得到上述第一嵌入层输出的第一预设维度的第一向量矩阵,上述第二嵌入层输出的第二预设维度的第二向量矩阵;
第三输入单元,用于将上述第一向量矩阵输入至上述第一特征提取网络,并将上述第二向量矩阵输入至上述第二特征提取网络,得到上述第一特征提取网络输出的上述样本帐户集群的属性特征与上述样本对象集群的属性特征之间的第一关系,上述第二特征提取网络输出的上述样本帐户集群的行为特征与上述样本对象集群的行为特征之间的第二关系;
第四输入单元,用于将上述第一关系和上述第二关系输入至上述第一特征融合网络中进行特征融合,得到上述第一特征融合网络输出的上述样本帐户集群和上述样本对象集群之间的第一融合特征,其中,上述融合特征中包括上述第一融合特征。
在一个示例性实施例中,上述装置通过以下方式将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征:将上述训练数据输入至上述第三输入层和上述第三输入层,其中,上述训练数据中包括样本帐户集群中每个样本帐户的属性特征和每个上述样本帐户的行为特征,样本对象集群中每个样本对象的属性特征和每个上述样本对象的行为特征,上述样本帐户集群中的所有样本帐户均属于同一帐户类别,上述样本对象集群中的所有样本对象均属于同一对象类别;通过上述第三输入层将上述训练数据输入至上述第三嵌入层,并通过上述第四输入层将上述训练数据输入至上述第四嵌入层,得到上述第三嵌入层输出的第三预设维度的第三向量矩阵,上述第四嵌入层输出的第四预设维度的第四向量矩阵;将上述第三向量矩阵输入至上述第三特征提取网络,并将上述第四向量矩阵输入至上述第四特征提取网络,得到上述第三特征提取网络输出的每个上述样本帐户的属性特征与每个上述样本对象的属性特征之间的第三关系,上述第四特征提取网络输出的每个上述样本帐户的行为特征与每个上述样本对象的行为特征之间的第四关系;将上述第三关系和上述第四关系输入至上述第二特征融合网络中进行特征融合,得到上述第二特征融合网络输出的每个上述样本帐户和每个上述样本对象之间的第二融合特征,其中,上述融合特征中包括上述第二融合特征。
在一个示例性实施例中,上述第二网络包括:聚合网络,上述聚合网络包括第一聚合网络和第二聚合网络,其中,上述第一聚合网络与上述第一特征融合网络连接,上述第二聚合网络与上述第二特征融合网络连接;第一神经网络,上述第一神经网络与上述聚合网络连接;第一输出层,上述第一输出层与上述第一神经网络连接;第二神经网络,上述第二神经网络与上述第一特征融合网络、上述第二特征融合网络均连接;第二输出层,上述第二输出层与上述第二神经网络连接。
在一个示例性实施例中,上述装置通过以下方式将上述融合特征输入至上述原始网络模型中的第二网络中,得到转化率:将上述第一融合特征输入至上述第一聚合网络中,并将上述第二融合特征输入至上述第二聚合网络中,得到上述第一聚合网络输出的样本对象集群表征,上述第二聚合网络输出的样本帐户集群表征;将样本对象集群表征、样本帐户集群表征以及样本转化率标签输入至第一神经网络,以在第一神经网络中融合样本对象集群表征和样本帐户集群表征,其中,样本转化率标签是利用每个样本帐户的行为标签向量和样本帐户集群中的样本帐户数量计算得到的;通过上述第一输出层中输出上述样本帐户集群对上述样本对象集群的第一预测值,其中,上述转化率中包括上述第一预测值。
在一个示例性实施例中,上述装置通过以下方式基于上述转化率确定上述原始网络模型的损失值:利用上述第一预测值和上述训练数据中的样本对象集群的标签值和样本帐户集群的标签值计算上述原始网络模型的损失值。
在一个示例性实施例中,上述装置通过以下方式将上述融合特征输入至上述原始网络模型中的第二网络中,得到转化率:将上述第一融合特征和上述第二融合特征输入至上述第二神经网络中,以在上述第二神经网络中融合上述第一融合特征和上述第二融合特征;通过上述第二输出层中输出每个上述样本帐户转化每个上述样本对象的第二预测值,其中,上述转化率包括上述第二预测值。
在一个示例性实施例中,上述装置通过以下方式基于上述转化率确定上述原始网络模型的损失值:利用上述第二预测值和上述训练数据中的每个样本对象的标签值和每个样本帐户的标签值计算上述原始网络模型的损失值。
在一个示例性实施例中,上述装置还包括:
第一终止模块,用于基于上述损失值迭代更新上述原始网络模型的网络参数,得到上述目标网络模型之前,上述方法还包括:在上述损失值收敛和/或对上述原始网络模型的训练次数大于预设次数时,终止对上述原始网络模型的训练。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (20)

1.一种对象推荐的调整方法,其特征在于,包括:
获取预设时间段内的目标数据,其中,所述目标数据中包括:帐户集群中每个帐户的属性特征和每个所述帐户的行为特征,对象集群中每个对象的属性特征和每个所述对象的行为特征,所述帐户集群中的所有帐户均属于同一帐户类别,所述对象集群中的所有对象均属于同一对象类别;
将所述目标数据输入至目标网络模型中,得到所述目标网络模型输出的所述帐户集群和所述对象集群之间的第一转化率;
基于所述第一转化率调整对所述帐户集群的推荐对象;
所述目标网络模型是通过如下方式进行训练得到的:将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征,其中,所述训练数据中的数据均属于同一类别的数据,所述训练数据与所述目标数据的数据类型相同,所述训练数据中包括第一样本数据和第二样本数据,所述第一样本数据中包括不同类型的样本帐户集群,所述第二样本数据包括不同类型的样本对象集群,所述样本帐户集群中包括每个样本帐户的属性特征和每个所述样本帐户的行为特征,所述样本对象集群中包括每个所述样本对象的属性特征和每个所述样本对象的行为特征,所述样本帐户集群中的所有帐户均属于同一帐户类别,所述样本对象集群中的所有对象均属于同一对象类别,所述融合特征包括所述样本帐户集群和所述样本对象集群融合的属性特征和行为特征;将所述融合特征输入至所述原始网络模型中的第二网络中,得到转化率;基于所述转化率确定所述原始网络模型的损失值;基于所述损失值迭代更新所述原始网络模型的网络参数,得到所述目标网络模型;
所述训练数据通过如下方式得到:按照第一采样规则从样本数据集中抽取第一样本数据,其中,所述第一采样规则包括每个样本数据被抽取到的概率相同;按照第二采样规则从所述样本数据集中抽取第二样本数据,其中,所述样本数据集中包括第一类型的样本数据和第二样本数据,所述第一类型的样本数据的数量小于或等于所述第二样本数据的数量,所述第二采样规则包括所述第二样本数据被抽取到的概率大于所述第一类型的样本数据被抽取到的概率,所述第一类型的样本数据包括不同类型的帐户集群,所述第二样本数据包括不同类型的对象集群;将所述第一样本数据、所述第二样本数据与原始样本数据进行拼接,得到所述训练数据。
2.根据权利要求1所述的方法,其特征在于,获取预设时间段内的目标数据,包括:
获取所述帐户集群中每个所述帐户的向量数据,其中,每个所述帐户的向量数据包括:每个所述帐户的标识向量、每个所述帐户所归属的所述帐户集群的标识向量以及每个所述帐户的行为标签向量,所述行为标签向量用于表示每个所述帐户转化所述对象集群中的对象的行为;
获取对象集群中每个所述对象的向量数据,其中,每个所述对象的向量数据包括:每个所述对象的标识向量和每个所述对象所归属的所述对象集群的标识向量;
基于每个所述帐户的向量数据和每个所述对象的向量数据确定所述目标数据。
3.根据权利要求2所述的方法,其特征在于,基于每个所述帐户的向量数据和每个所述对象的向量数据确定所述目标数据,包括:
获取每个所述帐户的原始数据,其中,每个所述帐户的原始数据包括:每个所述帐户的原始属性和每个所述帐户的原始行为特征,其中,所述原始行为特征包括每个所述帐户转化所述对象集群的行为;
获取每个所述对象的原始数据,其中,每个所述对象的原始数据包括:每个所述对象的原始属性和每个所述对象的原始行为特征,其中,每个所述对象的原始行为特征包括每个所述对象被所述帐户集群转化的行为;
将每个所述帐户的原始数据转换为向量数据,得到每个所述帐户的原始向量数据;
拼接每个所述帐户的原始向量数据和所述每个帐户的向量数据,以及拼接每个所述对象的原始向量数据和每个所述对象的向量数据,确定出目标向量矩阵,以得到所述目标数据。
4.根据权利要求3所述的方法,其特征在于,拼接每个所述帐户的原始向量数据和所述每个帐户的向量数据,以及拼接每个所述对象的原始向量数据和每个所述对象的向量数据,确定出目标向量矩阵,以目标数据得到所述目标数据之前,所述方法还包括:
对每个所述帐户的原始数据和每个所述对象的原始数据均执行第一特征清洗操作,其中,所述第一特征清洗操作包括以下至少之一:特征格式的检测,异常值的处理,重复值的处理,缺失值的处理,特征值的归一化处理,特征值的标准化处理,特征值的分桶处理。
5.根据权利要求1所述的方法,其特征在于,将所述目标数据输入至目标网络模型中,得到所述目标网络模型输出的所述帐户集群和所述对象集群之间的第一转化率,包括:
利用每个所述帐户的行为标签向量和所述帐户集群中的帐户数量计算所述帐户集群对所述对象集群进行转化的转化率标签;
将所述目标数据和所述转化率标签输入至目标网络模型中,得到所述目标网络模型输出的所述帐户集群和所述对象集群之间的第一转化率。
6.根据权利要求1所述的方法,其特征在于,将所述第一样本数据、所述第二样本数据与原始样本数据进行拼接,得到所述训练数据,包括:
将所述原始样本数据的数据格式转化为向量格式的数据,得到原始样本向量数据;
将所述原始样本向量数据拼接至所述第一样本数据和所述第二样本数据组成的样本向量矩阵中,得到所述训练数据。
7.根据权利要求1或6所述的方法,其特征在于,通过以下方式确定所述原始样本数据:
获取所述第一样本数据的第一原始样本数据,其中,所述第一原始样本数据包括:所述第一原始样本数据的原始样本属性和所述第一原始样本数据的原始样本行为特征,其中,所述第一原始样本数据的原始样本行为特征包括被转化的行为,所述第一样本数据与所述帐户集群中的帐户的数据的数据类型相同;
获取所述第二样本数据的第二原始样本数据,其中,所述第二原始样本数据包括:所述第二原始样本数据的原始样本属性和所述第二原始样本数据的原始样本行为特征,其中,所述第二原始样本数据的原始样本行为特征包括被转化的行为,所述第二样本数据与所述对象集群中的对象的数据的数据类型相同;
将所述第一原始样本数据和所述第二原始样本数据确定为所述原始样本数据。
8.根据权利要求7所述的方法,其特征在于,将所述第一原始样本数据和所述第二原始样本数据确定为所述原始样本数据之前,所述方法还包括:
对所述第一原始样本数据和所述第二原始样本数据均执行第二特征清洗操作,其中,所述第二特征清洗操作包括以下至少之一:特征格式的检测,异常值的处理,重复值的处理,缺失值的处理,特征值的归一化处理,特征值的标准化处理,特征值的分桶处理。
9.根据权利要求1所述的方法,其特征在于,所述第一网络包括:
第一分支网络,所述第一分支网络包括:依次连接的第一输入层、第一嵌入层以及第一特征提取网络,依次连接的第二输入层、第二嵌入层以及第二特征提取网络,与所述第一特征提取网络和所述第二特征提取网络均连接的第一特征融合网络;
第二分支网络,所述第二分支网络包括:依次连接的第三输入层、第三嵌入层以及第三特征提取网络,依次连接的第四输入层、第四嵌入层以及第四特征提取网络,与所述第三特征提取网络和所述第四特征提取网络均连接的第二特征融合网络。
10.根据权利要求9所述的方法,其特征在于,将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征,包括:
将所述训练数据输入至所述第一输入层和所述第二输入层,其中,所述训练数据中包括样本帐户集群中每个样本帐户的属性特征和每个所述样本帐户的行为特征,样本对象集群中每个样本对象的属性特征和每个所述样本对象的行为特征,所述样本帐户集群中的所有样本帐户均属于同一帐户类别,所述样本对象集群中的所有样本对象均属于同一对象类别;
通过所述第一输入层将所述训练数据输入至所述第一嵌入层,并通过所述第二输入层将所述训练数据输入至所述第二嵌入层,得到所述第一嵌入层输出的第一预设维度的第一向量矩阵,所述第二嵌入层输出的第二预设维度的第二向量矩阵;
将所述第一向量矩阵输入至所述第一特征提取网络,并将所述第二向量矩阵输入至所述第二特征提取网络,得到所述第一特征提取网络输出的所述样本帐户集群的属性特征与所述样本对象集群的属性特征之间的第一关系,所述第二特征提取网络输出的所述样本帐户集群的行为特征与所述样本对象集群的行为特征之间的第二关系;
将所述第一关系和所述第二关系输入至所述第一特征融合网络中进行特征融合,得到所述第一特征融合网络输出的所述样本帐户集群和所述样本对象集群之间的第一融合特征,其中,所述融合特征中包括所述第一融合特征。
11. 根据权利要求 10所述的方法,其特征在于,将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征,包括:
将所述训练数据输入至所述第三输入层和所述第三输入层,其中,所述训练数据中包括样本帐户集群中每个样本帐户的属性特征和每个所述样本帐户的行为特征,样本对象集群中每个样本对象的属性特征和每个所述样本对象的行为特征,所述样本帐户集群中的所有样本帐户均属于同一帐户类别,所述样本对象集群中的所有样本对象均属于同一对象类别;
通过所述第三输入层将所述训练数据输入至所述第三嵌入层,并通过所述第四输入层将所述训练数据输入至所述第四嵌入层,得到所述第三嵌入层输出的第三预设维度的第三向量矩阵,所述第四嵌入层输出的第四预设维度的第四向量矩阵;
将所述第三向量矩阵输入至所述第三特征提取网络,并将所述第四向量矩阵输入至所述第四特征提取网络,得到所述第三特征提取网络输出的每个所述样本帐户的属性特征与每个所述样本对象的属性特征之间的第三关系,所述第四特征提取网络输出的每个所述样本帐户的行为特征与每个所述样本对象的行为特征之间的第四关系;
将所述第三关系和所述第四关系输入至所述第二特征融合网络中进行特征融合,得到所述第二特征融合网络输出的每个所述样本帐户和每个所述样本对象之间的第二融合特征,其中,所述融合特征中包括所述第二融合特征。
12. 根据权利要求 11所述的方法,其特征在于,所述第二网络包括:
聚合网络,所述聚合网络包括第一聚合网络和第二聚合网络,其中,所述第一聚合网络与所述第一特征融合网络连接,所述第二聚合网络与所述第二特征融合网络连接;
第一神经网络,所述第一神经网络与所述聚合网络连接;
第一输出层,所述第一输出层与所述第一神经网络连接;
第二神经网络,所述第二神经网络与所述第一特征融合网络、所述第二特征融合网络均连接;
第二输出层,所述第二输出层与所述第二神经网络连接。
13. 根据权利要求 12所述的方法,其特征在于,将所述融合特征输入至所述原始网络模型中的第二网络中,得到转化率,包括:
将所述第一融合特征输入至所述第一聚合网络中,并将所述第二融合特征输入至所述第二聚合网络中,得到所述第一聚合网络输出的样本对象集群表征,所述第二聚合网络输出的样本帐户集群表征;
将所述样本对象集群表征、所述样本帐户集群表征以及样本转化率标签输入至所述第一神经网络,以在所述第一神经网络中融合所述样本对象集群表征和所述样本帐户集群表征,其中,所述样本转化率标签是利用每个所述样本帐户的行为标签向量和所述样本帐户集群中的样本帐户数量计算得到的;
通过所述第一输出层中输出所述样本帐户集群对所述样本对象集群的第一预测值,其中,所述转化率中包括所述第一预测值。
14.根据权利要求13所述的方法,其特征在于,基于所述转化率确定所述原始网络模型的损失值,包括:
利用所述第一预测值和所述训练数据中的样本对象集群的标签值和样本帐户集群的标签值计算所述原始网络模型的损失值。
15. 根据权利要求 12所述的方法,其特征在于,将所述融合特征输入至所述原始网络模型中的第二网络中,得到转化率,包括:
将所述第一融合特征和所述第二融合特征输入至所述第二神经网络中,以在所述第二神经网络中融合所述第一融合特征和所述第二融合特征;
通过所述第二输出层中输出每个所述样本帐户转化每个所述样本对象的第二预测值,其中,所述转化率包括所述第二预测值。
16.根据权利要求15所述的方法,其特征在于,基于所述转化率确定所述原始网络模型的损失值,包括:
利用所述第二预测值和所述训练数据中的每个样本对象的标签值和每个样本帐户的标签值计算所述原始网络模型的损失值。
17.根据权利要求1所述的方法,其特征在于,基于所述损失值迭代更新所述原始网络模型的网络参数,得到所述目标网络模型之前,所述方法还包括:
在所述损失值收敛和/或对所述原始网络模型的训练次数大于预设次数时,终止对所述原始网络模型的训练。
18.一种对象推荐的调整装置,其特征在于,包括:
第一获取模块,用于获取预设时间段内的目标数据,其中,所述目标数据中包括:帐户集群中每个帐户的属性特征和每个所述帐户的行为特征,对象集群中每个对象的属性特征和每个所述对象的行为特征,所述帐户集群中的所有帐户均属于同一帐户类别,所述对象集群中的所有对象均属于同一对象类别;
第一输入模块,用于将所述目标数据输入至目标网络模型中,得到所述目标网络模型输出的所述帐户集群和所述对象集群之间的第一转化率;
第一调整模块,用于基于所述第一转化率调整对所述帐户集群的推荐对象;
所述目标网络模型是通过如下方式进行训练得到的:将确定的训练数据输入至原始网络模型中的第一网络中,得到融合特征,其中,所述训练数据中的数据均属于同一类别的数据,所述训练数据与所述目标数据的数据类型相同,所述训练数据中包括第一样本数据和第二样本数据,所述第一样本数据中包括不同类型的样本帐户集群,所述第二样本数据包括不同类型的样本对象集群,所述样本帐户集群中包括每个样本帐户的属性特征和每个所述样本帐户的行为特征,所述样本对象集群中包括每个所述样本对象的属性特征和每个所述样本对象的行为特征,所述样本帐户集群中的所有帐户均属于同一帐户类别,所述样本对象集群中的所有对象均属于同一对象类别,所述融合特征包括所述样本帐户集群和所述样本对象集群融合的属性特征和行为特征;将所述融合特征输入至所述原始网络模型中的第二网络中,得到转化率;基于所述转化率确定所述原始网络模型的损失值;基于所述损失值迭代更新所述原始网络模型的网络参数,得到所述目标网络模型;
所述训练数据通过如下方式得到:按照第一采样规则从样本数据集中抽取第一样本数据,其中,所述第一采样规则包括每个样本数据被抽取到的概率相同;按照第二采样规则从所述样本数据集中抽取第二样本数据,其中,所述样本数据集中包括第一类型的样本数据和第二样本数据,所述第一类型的样本数据的数量小于或等于所述第二样本数据的数量,所述第二采样规则包括所述第二样本数据被抽取到的概率大于所述第一类型的样本数据被抽取到的概率,所述第一类型的样本数据包括不同类型的帐户集群,所述第二样本数据包括不同类型的对象集群;将所述第一样本数据、所述第二样本数据与原始样本数据进行拼接,得到所述训练数据。
19.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至17任一项中所述的方法的步骤。
20.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至17任一项中所述的方法的步骤。
CN202310617096.5A 2023-05-29 2023-05-29 对象推荐的调整方法及装置、存储介质、电子设备 Active CN116340643B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310617096.5A CN116340643B (zh) 2023-05-29 2023-05-29 对象推荐的调整方法及装置、存储介质、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310617096.5A CN116340643B (zh) 2023-05-29 2023-05-29 对象推荐的调整方法及装置、存储介质、电子设备

Publications (2)

Publication Number Publication Date
CN116340643A CN116340643A (zh) 2023-06-27
CN116340643B true CN116340643B (zh) 2023-08-15

Family

ID=86891564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310617096.5A Active CN116340643B (zh) 2023-05-29 2023-05-29 对象推荐的调整方法及装置、存储介质、电子设备

Country Status (1)

Country Link
CN (1) CN116340643B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117252665B (zh) * 2023-11-14 2024-02-20 苏州元脑智能科技有限公司 业务推荐方法、装置、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442790A (zh) * 2019-08-07 2019-11-12 腾讯科技(深圳)有限公司 推荐多媒体数据的方法、装置、服务器和存储介质
CN113254792A (zh) * 2021-07-15 2021-08-13 腾讯科技(深圳)有限公司 训练推荐概率预测模型的方法、推荐概率预测方法及装置
CN115345635A (zh) * 2021-05-13 2022-11-15 腾讯科技(深圳)有限公司 推荐内容的处理方法、装置、计算机设备和存储介质
CN115392943A (zh) * 2021-05-25 2022-11-25 腾讯科技(深圳)有限公司 发送展示信息的方法、装置、设备和存储介质
CN115482019A (zh) * 2021-05-31 2022-12-16 腾讯云计算(北京)有限责任公司 一种活动关注度预测方法、装置、电子设备和存储介质
CN115796984A (zh) * 2021-09-10 2023-03-14 广州视源电子科技股份有限公司 物品推荐模型的训练方法、存储介质及相关设备
CN115880077A (zh) * 2022-11-10 2023-03-31 中国工商银行股份有限公司 基于客户标签的推荐方法及其装置、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111767466B (zh) * 2020-09-01 2020-12-04 腾讯科技(深圳)有限公司 基于人工智能的推荐信息推荐方法、装置及电子设备
CN115080856A (zh) * 2022-06-29 2022-09-20 清华大学 推荐方法及装置、推荐模型的训练方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110442790A (zh) * 2019-08-07 2019-11-12 腾讯科技(深圳)有限公司 推荐多媒体数据的方法、装置、服务器和存储介质
CN115345635A (zh) * 2021-05-13 2022-11-15 腾讯科技(深圳)有限公司 推荐内容的处理方法、装置、计算机设备和存储介质
CN115392943A (zh) * 2021-05-25 2022-11-25 腾讯科技(深圳)有限公司 发送展示信息的方法、装置、设备和存储介质
CN115482019A (zh) * 2021-05-31 2022-12-16 腾讯云计算(北京)有限责任公司 一种活动关注度预测方法、装置、电子设备和存储介质
CN113254792A (zh) * 2021-07-15 2021-08-13 腾讯科技(深圳)有限公司 训练推荐概率预测模型的方法、推荐概率预测方法及装置
CN115796984A (zh) * 2021-09-10 2023-03-14 广州视源电子科技股份有限公司 物品推荐模型的训练方法、存储介质及相关设备
CN115880077A (zh) * 2022-11-10 2023-03-31 中国工商银行股份有限公司 基于客户标签的推荐方法及其装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
互联网广告转化率预测模型研究;王姝霖;中国优秀硕士论文库 经济与管理科学(第02期);第17-20、26-30、33-75、45-49页 *

Also Published As

Publication number Publication date
CN116340643A (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
CN113626719B (zh) 信息推荐方法、装置、设备、存储介质及计算机程序产品
CN111784455B (zh) 一种物品推荐方法及推荐设备
CN110162693B (zh) 一种信息推荐的方法以及服务器
CN110837602B (zh) 基于表示学习和多模态卷积神经网络的用户推荐方法
CN113254803A (zh) 一种基于多特征异质图神经网络的社交推荐方法
WO2019144892A1 (zh) 数据处理方法、装置、存储介质和电子装置
CN111949887B (zh) 物品推荐方法、装置及计算机可读存储介质
CN115917535A (zh) 推荐模型的训练方法、推荐方法、装置及计算机可读介质
EP4242955A1 (en) User profile-based object recommendation method and device
EP4322031A1 (en) Recommendation method, recommendation model training method, and related product
CN112085525A (zh) 一种基于混合模型的用户网络购买行为预测研究方法
CN116340643B (zh) 对象推荐的调整方法及装置、存储介质、电子设备
CN111429161A (zh) 特征提取方法、特征提取装置、存储介质及电子设备
Cheung et al. Characterizing user connections in social media through user-shared images
CN114861050A (zh) 一种基于神经网络的特征融合推荐方法及系统
CN118468061A (zh) 一种算法自动匹配及参数优化方法及系统
CN117786185A (zh) 农业知识推送方法、装置、电子设备及存储介质
CN116401450A (zh) 一种基于知识图谱的推荐方法、装置及计算机设备
JP6541737B2 (ja) 選択装置、選択方法、選択プログラム、モデルおよび学習データ
CN111460300B (zh) 网络内容推送方法、装置及存储介质
CN115618079A (zh) 会话推荐方法、装置、电子设备及存储介质
CN111400567B (zh) 一种基于ai的用户数据的处理方法、装置及系统
CN114463590A (zh) 信息处理方法、装置、设备、存储介质及程序产品
WO2022066587A1 (en) Graph learning-based system with updated vectors
Xing et al. A novel personalized recommendation model based on location computing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant