CN117829968A - 一种基于用户数据分析的业务产品推荐方法、装置及系统 - Google Patents

一种基于用户数据分析的业务产品推荐方法、装置及系统 Download PDF

Info

Publication number
CN117829968A
CN117829968A CN202410250851.5A CN202410250851A CN117829968A CN 117829968 A CN117829968 A CN 117829968A CN 202410250851 A CN202410250851 A CN 202410250851A CN 117829968 A CN117829968 A CN 117829968A
Authority
CN
China
Prior art keywords
sample
vector
product
user
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410250851.5A
Other languages
English (en)
Other versions
CN117829968B (zh
Inventor
张晓亮
苏贤
曹荣来
贲余刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Shuce Information Technology Co ltd
Original Assignee
Nanjing Shuce Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Shuce Information Technology Co ltd filed Critical Nanjing Shuce Information Technology Co ltd
Priority to CN202410250851.5A priority Critical patent/CN117829968B/zh
Publication of CN117829968A publication Critical patent/CN117829968A/zh
Application granted granted Critical
Publication of CN117829968B publication Critical patent/CN117829968B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Image Processing (AREA)

Abstract

本申请提供一种基于用户数据分析的业务产品推荐方法、装置及系统,通过获取业务产品推荐网络和网络调试样例二元组;通过业务产品推荐网络对网络调试样例二元组进行特征提炼操作,得到产品信息样例表征向量、用户画像样例表征向量和加噪用户画像样例表征向量;基于加噪用户画像样例的画像加噪策略,确定每个加噪用户画像样例表征向量对应的代价确定策略,将加噪用户画像样例表征向量、产品信息样例表征向量和用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价,以此对业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络,增加产品和用户画像配对的精确度,提高用户产品推荐体验,增加转化率。

Description

一种基于用户数据分析的业务产品推荐方法、装置及系统
技术领域
本申请涉及但不限于数据处理技术领域,尤其涉及一种基于用户数据分析的业务产品推荐方法、装置及系统。
背景技术
随着大数据和人工智能技术的快速发展,业务产品推荐系统已成为许多在线平台的核心组件。这些系统通过分析用户数据和产品信息,能够智能地向用户推荐他们可能感兴趣的产品或服务。为了实现这一目标,业务产品推荐网络被设计用于从大量的用户和产品数据中提取有用的特征,并基于这些特征进行推荐决策。然而,现有的业务产品推荐网络在训练过程中面临着一些挑战。例如对于用户画像分析不足,用户画像信息有缺失时,向对应用户推荐的产品往往不能起到较好的用户体验响应,导致产品转化率不足。换言之,现有技术中,业务产品与用户画像配对推荐的准确性还有提高的空间。
发明内容
有鉴于此,本申请实施例至少提供一种基于用户数据分析的业务产品推荐方法、装置及系统。
本申请实施例的技术方案是这样实现的:
一方面,本申请实施例提供一种一种基于用户数据分析的业务产品推荐方法,应用于计算机系统,所述方法包括:
获取业务产品推荐网络和网络调试样例二元组,其中,所述网络调试样例二元组包括产品信息样例和用户画像样例集合,所述用户画像样例集合包括和所述产品信息样例配对的用户画像样例以及基于不同的画像加噪策略基于所述用户画像样例生成的多个加噪用户画像样例;
通过所述业务产品推荐网络对所述网络调试样例二元组进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量、所述用户画像样例对应的用户画像样例表征向量和所述加噪用户画像样例对应的加噪用户画像样例表征向量;
基于所述加噪用户画像样例的画像加噪策略,确定每个加噪用户画像样例表征向量对应的代价确定策略;
基于每个加噪用户画像样例表征向量对应的代价确定策略,将所述加噪用户画像样例表征向量、所述产品信息样例表征向量和所述用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价;
基于每个加噪用户画像样例表征向量对应的样例表征向量代价对所述业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络;
获取目标用户画像,将目标用户画像输入所述目标业务产品推荐网络,基于所述目标业务产品推荐网络得到对应于所述目标用户画像的业务产品信息。
在一些实施例中,所述业务产品推荐网络包括用户画像特征提炼组件和产品特征提炼组件;所述通过所述业务产品推荐网络对所述网络调试样例二元组进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量、所述用户画像样例对应的用户画像样例表征向量和所述加噪用户画像样例对应的加噪用户画像样例表征向量,包括:
通过所述产品特征提炼组件对所述产品信息样例进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量;
通过所述用户画像特征提炼组件对所述用户画像样例和所述加噪用户画像样例进行特征提炼操作,得到所述用户画像样例对应的用户画像样例表征向量和所述加噪用户画像样例对应的加噪用户画像样例表征向量。
在一些实施例中,所述通过所述产品特征提炼组件对所述产品信息样例进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量,包括:
对所述产品信息样例进行切分,得到一个或多个产品切分信息样例;
基于所述一个或多个产品切分信息样例进行链构建,得到产品切分信息链;
对所述产品切分信息链进行信息嵌入映射,得到所述产品切分信息链对应的产品切分映射向量;
通过所述产品特征提炼组件对所述产品切分映射向量进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量。
在一些实施例中,所述通过所述产品特征提炼组件对所述产品切分映射向量进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量,包括:
将所述产品信息样例对应的产品类型表征向量融合到所述产品切分映射向量,得到融合产品切分映射向量;
将分布向量和所述融合产品切分映射向量进行整合,得到整合产品切分映射向量;
通过所述产品特征提炼组件对所述整合产品切分映射向量进行特征提炼操作,得到产品切分提炼向量;
通过所述产品特征提炼组件将所述产品切分提炼向量进行下采样,得到下采样产品切分提炼向量;
基于所述产品类型表征向量对所述产品切分提炼向量进行识别处理,得到所述产品类型表征向量对应的产品切分提炼向量;
将所述下采样产品切分提炼向量和所述产品类型表征向量对应的产品切分提炼向量进行整合,得到所述产品信息样例对应的产品信息样例表征向量。
在一些实施例中,所述基于每个加噪用户画像样例表征向量对应的代价确定策略,将所述加噪用户画像样例表征向量、所述产品信息样例表征向量和所述用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述加噪用户画像样例表征向量对应的代价确定策略,在所述产品信息样例表征向量和所述用户画像样例表征向量中确定所述代价确定策略依赖的目标样例表征向量;
基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价。
在一些实施例中,当所述加噪用户画像样例表征向量为屏蔽后用户画像样例表征向量,所述代价确定策略为整体代价确定策略时,所述目标样例表征向量包括所述产品信息样例表征向量和所述用户画像样例表征向量;
所述基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述整体代价确定策略,获取所述业务产品推荐网络对应的产品类型影响系数和画像类型影响系数;
基于所述整体代价确定策略,将所述产品类型影响系数和所述产品信息样例表征向量进行作积,得到产品分类表征向量;
基于所述整体代价确定策略,分别将所述画像类型影响系数和所述用户画像样例表征向量以及所述屏蔽后用户画像样例表征向量进行作积,得到所述用户画像样例表征向量对应的第一画像分类表征向量和所述屏蔽后用户画像样例表征向量对应的第二画像分类表征向量;
基于所述整体代价确定策略将所述产品分类表征向量、所述第一画像分类表征向量和所述第二画像分类表征向量进行合并,得到所述加噪用户画像样例表征向量对应的样例表征向量代价。
在一些实施例中,所述基于所述整体代价确定策略将所述产品分类表征向量、所述第一画像分类表征向量和所述第二画像分类表征向量进行合并,得到所述加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述整体代价确定策略,分别对所述产品分类表征向量、所述第一画像分类表征向量和所述第二画像分类表征向量进行特征变换操作,得到产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量;
基于所述整体代价确定策略,分别对所述产品变换表征向量、所述第一画像变换表征向量和所述第二画像变换表征向量进行代价确定,得到产品整体代价、第一用户画像代价和第二用户画像代价;
基于所述整体代价确定策略,分别对所述产品整体代价、第一用户画像代价和第二用户画像代价进行标准化操作,得到标准化产品整体代价、标准化第一用户画像代价和标准化第二用户画像代价;
将所述标准化产品整体代价、所述标准化第一用户画像代价和所述标准化第二用户画像代价进行整合,得到所述加噪用户画像样例表征向量对应的样例表征向量代价。
在一些实施例中,当所述加噪用户画像样例表征向量为屏蔽后用户画像样例表征向量,所述代价确定策略为共性代价确定策略时,所述目标样例表征向量包括所述产品信息样例表征向量和所述用户画像样例表征向量;
所述基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价,包括:
获取和所述产品信息样例非配对的用户画像样例对应的用户画像样例表征向量;
基于所述共性代价确定策略,分别获取所述产品信息样例表征向量和所述用户画像样例表征向量之间的第一共性结果、所述产品信息样例表征向量和所述屏蔽后用户画像样例表征向量之间的第二共性结果以及所述产品信息样例表征向量和非配对的用户画像样例对应的用户画像样例表征向量之间的第三共性结果;
基于所述共性代价确定策略,对所述第一共性结果、所述第二共性结果和所述第三共性结果进行非线性整合,得到所述加噪用户画像样例表征向量对应的样例表征向量代价;
当所述加噪用户画像样例表征向量为屏蔽后用户画像样例表征向量,所述代价确定策略为画像代价确定策略时,所述目标样例表征向量包括所述用户画像样例表征向量和所述产品信息样例表征向量;
所述基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述画像代价确定策略,分别获取所述产品信息样例表征向量和所述用户画像样例表征向量之间的第四共性结果,以及所述产品信息样例表征向量和所述屏蔽后用户画像样例表征向量之间的第五共性结果;
基于所述画像代价确定策略,对所述第四共性结果和所述第五共性结果进行代价限制操作,得到所述加噪用户画像样例表征向量对应的样例表征向量代价;
当所述加噪用户画像样例表征向量为一个或多个画像描述样例表征向量,所述代价确定策略为产品代价确定策略时,所述目标样例表征向量包括所述产品信息样例表征向量;
所述基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述产品代价确定策略,对一个或多个画像描述样例表征向量进行分类,得到画像描述积极样例表征向量和画像描述消极样例表征向量;
基于所述产品代价确定策略,分别获取所述产品信息样例表征向量和所述画像描述积极样例表征向量之间的积极样例代价,以及所述产品信息样例表征向量和所述画像描述消极样例表征向量之间的消极样例代价;
基于所述产品代价确定策略,对所述积极样例代价和所述消极样例代价进行非线性整合,得到所述加噪用户画像样例表征向量对应的样例表征向量代价。
在一些实施例中,所述获取业务产品推荐网络和网络调试样例二元组之前,所述方法还包括:
获取产品信息样例以及和所述产品信息样例配对的用户画像样例;
基于不同的画像加噪策略对所述用户画像样例进行加噪,得到每个画像加噪策略对应的加噪用户画像样例;
将所述用户画像样例、所述每个画像加噪策略对应的加噪用户画像样例和所述产品信息样例进行合并,获得所述网络调试样例二元组。
在一些实施例中,所述基于不同的画像加噪策略对所述用户画像样例进行加噪,得到每个画像加噪策略对应的加噪用户画像样例,包括:
对所述用户画像样例进行解析处理,得到一个或多个画像标签样例;
对所述用户画像样例的一个或多个画像标签样例进行屏蔽,得到一个或多个屏蔽后用户画像样例;
对所述用户画像样例的一个或多个画像标签样例进行集成,获得一个或多个画像描述样例。
第二方面,本申请实施例提供一种基于用户数据分析的业务产品推荐装置,包括:
调试样例获取模块,用于获取业务产品推荐网络和网络调试样例二元组,其中,所述网络调试样例二元组包括产品信息样例和用户画像样例集合,所述用户画像样例集合包括和所述产品信息样例配对的用户画像样例以及基于不同的画像加噪策略基于所述用户画像样例生成的多个加噪用户画像样例;
样例特征提炼模块,用于通过所述业务产品推荐网络对所述网络调试样例二元组进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量、所述用户画像样例对应的用户画像样例表征向量和所述加噪用户画像样例对应的加噪用户画像样例表征向量;
代价策略确定模块,用于基于所述加噪用户画像样例的画像加噪策略,确定每个加噪用户画像样例表征向量对应的代价确定策略;
调试代价确定模块,用于基于每个加噪用户画像样例表征向量对应的代价确定策略,将所述加噪用户画像样例表征向量、所述产品信息样例表征向量和所述用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价;
网络参数优化模块,用于基于每个加噪用户画像样例表征向量对应的样例表征向量代价对所述业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络;
业务产品确定模块,用于获取目标用户画像,将目标用户画像输入所述目标业务产品推荐网络,基于所述目标业务产品推荐网络得到对应于所述目标用户画像的业务产品信息。
第三方面,本申请实施例提供一种计算机系统,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以上所述方法中的步骤。
本申请至少具有的有益效果:本申请实施例可以获取业务产品推荐网络和网络调试样例二元组,其中,网络调试样例二元组包括产品信息样例和用户画像样例集合,用户画像样例集合包括和产品信息样例配对的用户画像样例以及基于不同的画像加噪策略基于用户画像样例生成的多个加噪用户画像样例;通过业务产品推荐网络对网络调试样例二元组进行特征提炼操作,得到产品信息样例对应的产品信息样例表征向量、用户画像样例对应的用户画像样例表征向量和加噪用户画像样例对应的加噪用户画像样例表征向量;基于加噪用户画像样例的画像加噪策略,确定每个加噪用户画像样例表征向量对应的代价确定策略;基于每个加噪用户画像样例表征向量对应的代价确定策略,将加噪用户画像样例表征向量、产品信息样例表征向量和用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价;基于每个加噪用户画像样例表征向量对应的样例表征向量代价对业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络,可以增加产品和用户画像配对的精确度,提高用户产品推荐体验,增加产品转化率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本申请的技术方案。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。
图1为本申请实施例提供的一种基于用户数据分析的业务产品推荐方法的实现流程示意图。
图2为本申请实施例提供的一种基于用户数据分析的业务产品推荐装置的组成结构示意图。
图3为本申请实施例提供的一种计算机系统的硬件实体示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图和实施例对本申请的技术方案进一步详细阐述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。所涉及的术语“第一/第二/第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一/第二/第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请的目的,不是旨在限制本申请。
本申请实施例提供一种基于用户数据分析的业务产品推荐方法,该方法可以由计算机系统的处理器执行。其中,计算机系统可以指的是服务器、笔记本电脑、平板电脑、台式计算机、智能电视、移动设备(例如移动电话、便携式视频播放器、个人数字助理、专用消息设备、便携式游戏设备)等具备数据处理能力的设备。
图1为本申请实施例提供的一种基于用户数据分析的业务产品推荐方法的实现流程示意图,如图1所示,该方法包括如下步骤:
步骤S10,获取业务产品推荐网络和网络调试样例二元组,其中,网络调试样例二元组包括产品信息样例和用户画像样例集合,用户画像样例集合包括和产品信息样例配对的用户画像样例以及基于不同的画像加噪策略基于用户画像样例生成的多个加噪用户画像样例。
作为一种实施方式,该业务产品推荐网络例如为一个机器学习模型,如卷积神经网络、循环神经网络、深度神经网络等。作为一种实施方式,该业务产品推荐网络用于将用户画像和产品进行关联配对,以帮助向具有对应用户画像的用户推荐相应的产品。
作为一种实施方式,该业务产品推荐网络例如为拟进行调试(即训练)的神经网络模型。作为一种实施方式,网络调试样例二元组是用于对业务产品推荐网络进行调试的训练样本。该网络调试样例二元组例如包括产品信息样例和用户画像样例集合。其中,用户画像样例集合例如包括和产品信息样例配对的用户画像样例以及基于用户画像样例基于不同的画像加噪策略生成的多个加噪用户画像样例。即,网络调试样例二元组例如包括产品信息样例以及和产品信息样例配对的用户画像样例。此外,该网络调试样例二元组还例如包括基于不同画像加噪策略生成的加噪用户画像样例。画像加噪策略是指在用户画像样例上应用的一系列规则和算法,用于生成加噪用户画像样例。这些策略例如包括随机扰动、数据增强、特征屏蔽等。
产品信息样例是指一个具体产品的详细信息,通常包括各种属性和特征。举例而言,一款手机的产品信息样例可能包括品牌(如苹果)、型号(如iPhone 14)、操作系统(如iOS)、屏幕尺寸、电池容量、相机规格等。用户画像样例集合是指一组用户画像样例构成的数据集合,每个用户画像样例都包含了用户的多个属性和消费性格信息。用户画像可以是通过一个或多个标签构成的,这些标签可以是数字、字母或者文字,举例而言,一个用户画像样例可以是{年龄: 30, 性别: 男, 偏好品类: 工程师, 兴趣: 旅游, 购物消费性格信息: 电子产品}。多个这样的用户画像组成了用户画像样例集合。可以理解,上述用户画像样例还可以通过数值标签进行表示。
加噪用户画像样例是基于用户画像样例生成的样例。举例而言,可以基于不同的画像加噪策略对用户画像样例进行加噪,得到多个加噪用户画像样例。
举例而言,该网络调试样例二元组包括一个产品信息样例、一个用户画像样例和基于两种不同画像加噪策略生成的多个加噪用户画像样例。举例而言,对于第一画像加噪策略,可以生成2个加噪用户画像样例,对于第二画像加噪策略,可以生成4个加噪用户画像样例。第一画像加噪策略和第二画像加噪策略的具体形式不做限定,在后续内容中会进行示例。可以通过用户画像样例和加噪用户画像样例一起对业务产品推荐网络进行调试。
作为一种实施方式,基于对用户画像样例进行加噪,可以扩充用户画像样例集合中样例的多样性,以便提高对业务产品推荐网络调试的准确性和泛化能力。基于此,在获取业务产品推荐网络和网络调试样例二元组之前,获取产品信息样例以及和产品信息样例配对的用户画像样例。之后基于不同的画像加噪策略对所述用户画像样例进行加噪,得到每个画像加噪策略对应的加噪用户画像样例。
实际应用中,步骤S10,获取业务产品推荐网络和网络调试样例二元组之前,本申请实施例提供的方法还例如包括以下步骤:获取产品信息样例以及和产品信息样例配对的用户画像样例;基于不同的画像加噪策略对用户画像样例进行加噪,得到每个画像加噪策略对应的加噪用户画像样例;将用户画像样例、每个画像加噪策略对应的加噪用户画像样例和产品信息样例进行合并,获得网络调试样例二元组。
其中,画像加噪策略是对用户画像样例进行加噪(又叫增强)采用的规则或方式。举例而言,画像加噪策略例如包括基于用户画像样例生成和用户画像样例的整体近似的加噪用户画像样例等。
在目前的根据用户画像推荐产品的方式中,没有考虑到用户画像不完整的问题,例如对于新用户或信息较少的用户,推荐的准确性不够,本申请实施例中,画像加噪策略是基于用户画像样例生成一个或多个屏蔽后用户画像样例。此外,相关技术未充分通过与产品信息样例对应的用户画像样例中的细节信息包含的细节需求,神经网络将用户画像样例中的一些细微信息进行忽略,用户画像样例的信息挖掘不完全。基于此,本申请实施例中,提供的另一画像加噪策略为通过用户画像样例生成画像描述样例。
基于此,本申请实施例中,上述“基于不同的画像加噪策略对所述用户画像样例进行加噪,得到每个画像加噪策略对应的加噪用户画像样例”,具体例如包括:对用户画像样例进行解析处理,得到一个或多个画像标签样例;对用户画像样例的一个或多个画像标签样例进行屏蔽,得到一个或多个屏蔽后用户画像样例;对用户画像样例的一个或多个画像标签样例进行集成,获得一个或多个画像描述样例。
其中,画像标签样例包括组成用户画像样例的基本结构。举例而言,假设该用户画像样例例如为标签集合,该画像标签样例例如包括构成画像的各个标签,又比如画像标签样例是文字组成的,那么例如包括构成画像的文本。屏蔽后用户画像样例是具有缺失信息的用户画像样例。举例而言,可以将用户画像样例中的消费性格信息(例如谨慎型、经济型等)、偏好品类(如商品品牌、类目)、消费习惯等进行屏蔽,获得屏蔽后用户画像样例。其中,画像描述样例例如包括对用户画像样例进行细节刻画的信息。
作为一种实施方式,可以对用户画像样例进行解析得到一个或多个画像标签样例。举例而言,对用户画像样例进行解析得到用户画像样例中全部通用画像信息。其中,该通用画像信息例如为由消费性格信息和偏好品类组成,此外,该通用画像信息中的偏好品类是通用偏好品类,通用代表没有特殊性,如常规的商品品类,常规的消费金额区间等,常规的定义可以根据实际需要进行设定,具体不做限制。
作为一种实施方式,一种画像加噪策略例如为对用户画像样例的一个或多个画像标签样例进行屏蔽,得到一个或多个屏蔽后用户画像样例。其中,为了提高屏蔽后用户画像样例的有效性,本申请对一个或多个画像标签样例进行分组(即聚类),获得个不同类型的画像标签样例。基于画像标签样例的标签对画像标签样例进行屏蔽,得到一个或多个屏蔽后用户画像样例。
比如,对通用偏好品类进行分组,将相同类偏好品类对应的消费习惯作为相同类型。或者,将构成消费习惯的消费性格信息作为备选,再任意确定用户画像样例中的一个消费习惯,将其中的消费性格信息、偏好品类进行屏蔽,得到屏蔽后用户画像样例。举例而言,假设用户画像样例的内容是“31岁;程序员;月底大额消费频繁;偏爱数码产品;消费谨慎,习惯综合对比价格”,可以将用户画像样例中的消费性格信息“消费谨慎,习惯综合对比价格”进行屏蔽,获得屏蔽后用户画像样例是“31岁;程序员;月底大额消费频繁;偏爱数码产品”。
作为一种实施方式,画像标签样例可以达到细节地说明画像标签样例,一种画像加噪策略例如为对用户画像样例的一个或多个画像标签样例进行集成(即进行组合),获得一个或多个画像描述样例。其中,该画像描述样例例如为基于画像标签样例生成的策略标签描述。举例而言,将描述消费习惯的消费性格信息、偏好品类和全部消费习惯组成规范的画像描述样例,确保生成的画像描述样例是满足规范策略的。举例而言,用户画像样例为“31岁;程序员;月底大额消费频繁;偏爱数码产品;消费谨慎,习惯综合对比价格”,画像描述样例可以为“在月底大额频繁消费数码产品的31岁程序员”。
作为一种实施方式,本申请实施例基于生成屏蔽后用户画像样例,生成和产品信息样例配对但是信息不全的画像描述。另外,基于生成画像描述样例,可以基于画像描述的侧重信息对用户画像样例中的特有信息进行重组,构成和产品信息样例配对的按照特定方式形成的细节画像描述。因此,基于通过屏蔽后用户画像样例和画像描述样例对业务产品推荐网络进行调试,能提高业务产品推荐网络对画像细节信息的锁定和产品的匹配。
作为一种实施方式,可以获取产品信息样例,和与产品信息样例配对的用户画像样例。基于不同的画像加噪策略对用户画像样例进行加噪,得到每个画像加噪策略对应的加噪用户画像样例。举例而言,通过三个不同的画像加噪策略分别对用户画像样例进行加噪,得到每个画像加噪策略对应的一个或多个加噪用户画像样例。然后,可以将用户画像样例、每个画像加噪策略对应的加噪用户画像样例和产品信息样例进行合并(即整合),获得网络调试样例二元组。其中,将用户画像样例、每个画像加噪策略对应的加噪用户画像样例和产品信息样例进行合并,获得网络调试样例二元组的方式不做限定。举例而言,为了构建产品信息样例和用户画像样例的配对关系,用户画像样例和产品信息样例之间可以设置一致的标记。为构建加噪用户画像样例和产品信息样例的配对关系,可以为加噪用户画像样例分配一致的标记。则包含一致标记的用户画像样例、加噪用户画像样例和产品信息样例构成网络调试样例二元组。其他实现方式中,包含配对关系的产品信息样例和用户画像样例被存储在一个空间。生成加噪用户画像样例后,将加噪用户画像样例添加到对应的存储空间,则统一存储空间的用户画像样例、加噪用户画像样例和产品信息样例构成网络调试样例二元组。
作为一种实施方式,本申请可以获取多个产品信息样例组。可以通过该多个网络调试样例二元组对业务产品推荐网络进行调试,得到目标业务产品推荐网络。举例而言,可以通过10个产品信息样例组对业务产品推荐网络进行调试,得到目标业务产品推荐网络。
步骤S20,通过业务产品推荐网络对网络调试样例二元组进行特征提炼操作,得到产品信息样例对应的产品信息样例表征向量、用户画像样例对应的用户画像样例表征向量和加噪用户画像样例对应的加噪用户画像样例表征向量。
作为一种实施方式,本申请通过网络调试样例二元组对业务产品推荐网络进行调试,因此,可以通过业务产品推荐网络对网络调试样例二元组进行特征提炼操作(特征提炼操作也即进行编码的过程),得到产品信息样例对应的产品信息样例表征向量、用户画像样例对应的用户画像样例表征向量和加噪用户画像样例对应的加噪用户画像样例表征向量。
作为一种实施方式,因为产品信息和画像信息在数据层面的模式不统一,则业务产品推荐网络可以包括用户画像特征提炼组件和产品特征提炼组件。基于用户画像特征提炼组件可以对用户画像样例集合的用户画像信息进行特征提炼操作。基于产品特征提炼组件可以对产品信息样例进行特征提炼操作。
实际应用中,步骤S20“通过业务产品推荐网络对网络调试样例二元组进行特征提炼操作,得到产品信息样例对应的产品信息样例表征向量、用户画像样例对应的用户画像样例表征向量和加噪用户画像样例对应的加噪用户画像样例表征向量”,例如包括:通过产品特征提炼组件对产品信息样例进行特征提炼操作,得到产品信息样例对应的产品信息样例表征向量;通过用户画像特征提炼组件对用户画像样例和加噪用户画像样例进行特征提炼操作,得到用户画像样例对应的用户画像样例表征向量和加噪用户画像样例对应的加噪用户画像样例表征向量。
其中,产品特征提炼组件和用户画像特征提炼组件例如为深度学习网络,比如,产品特征提炼组件和用户画像特征提炼组件均为多层转换器网络(transformer)进行搭建。作为一种实施方式,为了增加产品特征提炼组件对产品信息样例的产品细节信息进行理解,本申请实施例将产品信息样例进行切分,得到一个或多个产品切分信息样例。接着通过产品特征提炼组件对该一个或多个产品切分信息样例进行特征提炼操作。
实际应用中,步骤“通过产品特征提炼组件对产品信息样例进行特征提炼操作,得到产品信息样例对应的产品信息样例表征向量”,例如包括:对产品信息样例进行切分,得到一个或多个产品切分信息样例;基于一个或多个产品切分信息样例进行链构建,得到产品切分信息链;对产品切分信息链进行信息嵌入映射,得到产品切分信息链对应的产品切分映射向量;通过产品特征提炼组件对产品切分映射向量进行特征提炼操作,得到产品信息样例对应的产品信息样例表征向量。
作为一种实施方式,产品信息样例可以为文本,或者产品标签构成的序列。可以将产品信息样例进行任意切分,得到一个或多个产品切分信息样例。举例而言,将文本形式的产品信息样例进行分词,或者将标签形式的产品信息样例进行单个标签单元切分,得到多个产品标签,那么,一个分词即一个产品切分信息样例,或者,一个产品标签为一个产品切分信息样例。将一个或多个产品切分信息样例进行链构建(即将各个分词或标签进行排列,得到一个链式数据,或者称为序列数据),得到产品切分信息链,其中,该产品切分信息链包括切分后的一个或多个产品切分信息样例。
作为一种实施方式,对产品切分信息链进行信息嵌入映射,得到产品切分信息链对应的产品切分映射向量。其中,对产品切分信息链进行信息嵌入映射处理即进行线性投影,具体是将产品切分信息链中的标签或分词映射到一个对应的向量。作为一种实施方式,可以通过产品特征提炼组件对产品切分映射向量进行特征提炼操作,得到产品信息样例对应的产品信息样例表征向量。
实际应用中,步骤“通过产品特征提炼组件对产品切分映射向量进行特征提炼操作,得到产品信息样例对应的产品信息样例表征向量”,例如包括:将产品信息样例对应的产品类型表征向量融合到产品切分映射向量,得到融合产品切分映射向量;将分布向量和融合产品切分映射向量进行整合,得到整合产品切分映射向量;通过产品特征提炼组件对整合产品切分映射向量进行特征提炼操作,得到产品切分提炼向量;通过产品特征提炼组件将产品切分提炼向量进行下采样,得到下采样产品切分提炼向量;基于产品类型表征向量对产品切分提炼向量进行识别得到产品类型表征向量对应的产品切分提炼向量;将下采样产品切分提炼向量和产品类型表征向量对应的产品切分提炼向量进行整合,得到产品信息样例对应的产品信息样例表征向量。
作为一种实施方式,将产品信息样例对应的产品类型表征向量融合到产品切分映射向量,得到融合产品切分映射向量。其中,产品类型表征向量例如为产品信息样例的产品类型对应的向量表征结果。举例而言,假设产品信息样例的产品类型是“高刷新率全屏幕手机”,那么将产品类型“高刷新率全屏幕手机”对应的向量表征结果融合到产品切分映射向量。或者,假设产品信息样例的产品类型是“同品类高端旗舰”,那么将产品类型“同品类高端旗舰”对应的向量表征结果融合到产品切分映射向量。举例而言,可以将产品类型表征向量融合到产品切分映射向量的头部位置(即第一个向量元素前),得到融合产品切分映射向量,或者将产品类型表征向量添加到产品切分映射向量的尾部位置(即最后一个向量元素后),得到融合产品切分映射向量。
作为一种实施方式,可以将分布向量和融合产品切分映射向量进行整合,得到整合产品切分映射向量。其中,分布向量用于表示融合产品切分映射向量中各个向量元素的分布位置。举例而言,融合产品切分映射向量例如包括产品类型表征向量和每个产品切分信息对应的向量表征结果。其中,产品类型表征向量可以对应一个分布向量,每个产品切分信息对应的向量表征结果也可以对应一个分布向量。举例而言,融合产品切分映射向量例如包括产品类型表征向量和3个产品切分信息对应的向量表征结果。其中,产品类型表征向量可以对应分布向量1,3个产品切分信息对应的向量表征结果可以分别对应分布向量2、分布向量3、分布向量4。
作为一种实施方式,将分布向量和融合产品切分映射向量进行相加以获得整合产品切分映射向量。举例而言,将产品类型表征向量和产品切分信息对应的向量表征结果分别和对应的分布向量进行相加以获得整合产品切分映射向量。作为一种实施方式,可以通过产品特征提炼组件对整合产品切分映射向量进行特征提炼操作,得到产品切分提炼向量。举例而言,假设产品特征提炼组件通过6层转换器网络组成,一层转换器网络具有一个多头自注意力和一个前馈神经网络。那么可以通过产品特征提炼组件对产品切分映射向量进行注意力挖掘以获得产品切分信息向量。通过仿射网络对产品切分信息向量处理以获得产品切分提炼向量。
作为一种实施方式,可以通过产品特征提炼组件将产品切分提炼向量进行下采样,得到下采样产品切分提炼向量。其中,通过产品特征提炼组件将产品切分提炼向量进行下采样的方式例如是对产品切分提炼向量进行池化,如最大池化或平均池化。作为一种实施方式,基于产品类型表征向量对产品切分提炼向量进行识别以得到产品类型表征向量对应的产品切分提炼向量。接着将下采样产品切分提炼向量和产品类型表征向量对应的产品切分提炼向量进行整合,得到产品信息样例对应的产品信息样例表征向量。举例而言,可以将下采样产品切分提炼向量和产品类型表征向量进行拼接以获得产品信息样例对应的产品信息样例表征向量。
作为一种实施方式,举例而言,对于产品特征提炼组件,输入产品信息样例,将产品信息样例进行切分,将产品信息样例进行链式转换,得到产品切分信息链。每个产品切分信息经过信息嵌入映射,得到产品切分映射向量,该产品切分映射向量包括每个产品切分信息对应的向量表征结果。产品切分映射向量中包括每个产品切分信息对应的向量表征结果。
作为一种实施方式,可以在产品切分映射向量的首端融入产品类型表征向量[head],或者还可以使用其他标记,例如<cls>。将产品切分映射向量与分布向量进行相加,以确定产品切分映射向量在链上的分布位置。全部产品切分映射向量加载到产品特征提炼组件,获得相等长度的产品切分提炼向量。针对每个产品切分提炼向量,可以取与产品类型表征向量[head]对应的提炼向量为执行结果向量(也就是输出的向量)1,对产品切分映射向量对应的提炼向量进行画像信令下采样,得到执行结果向量2。其中,产品信令下采样基于平均池化完成。接着将执行结果向量1和执行结果向量2拼接得到执行结果向量3,将之确定为最后的产品信息样例表征向量。
作为一种实施方式,对于用户画像样例和加噪用户画像样例基于相同原理进行特征提炼操作,得到用户画像样例对应的用户画像样例表征向量和加噪用户画像样例对应的加噪用户画像样例表征向量。
举例而言,对于用户画像特征提炼组件,输入用户画像样例和加噪用户画像样例,每个画像样例和一个类别标记对应,用于后续训练。其中,该类别标记用于表示用户画像样例和加噪用户画像样例对应的产品信息样例。
接着,针对每一加载的画像样例,令牌化为一个个令牌链(又叫令牌序列),在令牌链前后增加对应的标记。然后,按照相同的思路将画像标签的编码向量和分布向量相加完成融合,然后加载到用户画像特征提炼组件,得到画像标签提炼向量序列,将尾端标记对应的提炼向量作为执行结果向量4,对首端和尾端标记之间的提炼向量进行画像信令下采样,得到执行结果向量5。
然后,将执行结果向量4和执行结果向量5拼接获得执行结果向量6,将之作为用户画像样例表征向量。
作为一种实施方式,基于以上过程将得到产品信息样例对应的产品信息样例表征向量、用户画像样例对应的用户画像样例表征向量和加噪用户画像样例对应的加噪用户画像样例表征向量。本申请实施例基于通过业务产品推荐网络对网络调试样例二元组进行特征提炼操作,令业务产品推荐网络可以基于对产品信息样例和用户画像样例进行特征提炼操作,令产品特征提炼组件和用户画像特征提炼组件可以并行进行调试,产品特征提炼组件和用户画像特征提炼组件的性能能互相协同,增加业务产品推荐网络的效果。
步骤S30,基于加噪用户画像样例的画像加噪策略,确定每个加噪用户画像样例表征向量对应的代价确定策略。
作为一种实施方式,本申请基于不同的画像加噪策略基于用户画像样例生成多个加噪用户画像信息,为了通过加噪用户画像信息对业务产品推荐网络进行更好的调试,可以基于加噪用户画像信息确定样例表征向量代价。针对不同画像加噪策略生成的加噪用户画像样例,可基于不同的代价确定策略进行代价确定,得到样例表征向量代价。
作为一种实施方式,对于每个画像加噪策略,可以对应一个或多个代价确定策略。举例而言,对于一个画像加噪策略的代价确定,基于一个代价确定策略进行代价确定,对于另一画像加噪策略的代价确定,通过三个代价确定策略进行代价确定。作为一种实施方式,事先可以构建画像加噪策略和代价确定策略之间的对应关系,基于事先确定的对应关系,确定每个加噪用户画像样例表征向量对应的代价确定策略。
作为一种实施方式,当加噪用户画像样例包括屏蔽后用户画像样例表征向量和画像描述样例表征向量时,代价确定策略例如包括整体代价确定策略、共性代价确定策略、画像代价确定策略和产品代价确定策略。
其中,对于屏蔽后用户画像样例表征向量,其对应的代价确定策略例如包括整体代价确定策略、共性代价确定策略和画像代价确定策略。对于画像描述样例表征向量,对应的代价确定策略例如包括产品代价确定策略。
步骤S40,基于每个加噪用户画像样例表征向量对应的代价确定策略,将加噪用户画像样例表征向量、产品信息样例表征向量和用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,在确定每个加噪用户画像样例表征向量对应的代价确定策略之后,基于每个加噪用户画像样例表征向量对应的代价确定策略,将加噪用户画像样例表征向量、产品信息样例表征向量和用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,对于不同的代价确定策略,需要的样例表征向量不同。举例而言,对于一些代价确定策略,需基于加噪用户画像样例表征向量、产品信息样例表征向量和用户画像样例表征向量得到样例表征向量代价。但针对一些代价确定策略,只需基于加噪用户画像样例表征向量和用户画像样例表征向量生成样例表征向量代价。
那么,以上“基于每个加噪用户画像样例表征向量对应的代价确定策略,将加噪用户画像样例表征向量、产品信息样例表征向量和用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价”,例如包括:基于加噪用户画像样例表征向量对应的代价确定策略,在产品信息样例表征向量和用户画像样例表征向量中确定代价确定策略依赖的目标样例表征向量;基于加噪用户画像样例表征向量对应的代价确定策略,将目标样例表征向量和加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,当加噪用户画像样例表征向量为屏蔽后用户画像样例表征向量,代价确定策略为整体代价确定策略时。其中,整体代价确定策略可以整体地衡量业务产品推荐网络的特征提炼能力,则目标样例表征向量例如包括产品信息样例表征向量和用户画像样例表征向量。实际应用中,步骤S40“基于加噪用户画像样例表征向量对应的代价确定策略,将目标样例表征向量和加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价”,例如包括:基于整体代价确定策略,获取业务产品推荐网络对应的产品类型影响系数和画像类型影响系数;基于整体代价确定策略,将产品类型影响系数和产品信息样例表征向量进行作积,得到产品分类表征向量;基于整体代价确定策略,分别将画像类型影响系数和用户画像样例表征向量以及屏蔽后用户画像样例表征向量进行作积,得到用户画像样例表征向量对应的第一画像分类表征向量和屏蔽后用户画像样例表征向量对应的第二画像分类表征向量;基于整体代价确定策略将产品分类表征向量、第一画像分类表征向量和第二画像分类表征向量进行合并,得到加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,为了充分地衡量业务产品推荐网络的性能,可以获取业务产品推荐网络对应的产品类型影响系数和画像类型影响系数。其中,产品类型影响系数是业务产品推荐网络中产品特征提炼组件的权重,而画像类型影响系数是业务产品推荐网络中用户画像特征提炼组件的权重。
作为一种实施方式,可以基于整体代价确定策略,将产品类型影响系数和产品信息样例表征向量进行作积,得到产品分类表征向量。同理,可以基于整体代价确定策略,将整体代价确定策略,分别将画像类型影响系数和用户画像样例表征向量以及屏蔽后用户画像样例表征向量进行作积,得到用户画像样例表征向量对应的第一画像分类表征向量和屏蔽后用户画像样例表征向量对应的第二画像分类表征向量。
作为一种实施方式,在得到产品分类表征向量、第一画像分类表征向量和第二画像分类表征向量之后,可以基于整体代价确定策略将产品分类表征向量、第一画像分类表征向量和第二画像分类表征向量进行合并(例如完成非线性融合),得到加噪用户画像样例表征向量对应的样例表征向量代价。
实际应用中,步骤“基于整体代价确定策略将产品分类表征向量、第一画像分类表征向量和第二画像分类表征向量进行合并,得到加噪用户画像样例表征向量对应的样例表征向量代价”,例如包括:基于整体代价确定策略,分别对产品分类表征向量、第一画像分类表征向量和第二画像分类表征向量进行特征变换操作,得到产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量;基于整体代价确定策略,分别对产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量进行代价确定,得到产品整体代价、第一用户画像代价和第二用户画像代价;基于整体代价确定策略,分别对产品整体代价、第一用户画像代价和第二用户画像代价进行标准化操作,得到标准化产品整体代价、标准化第一用户画像代价和标准化第二用户画像代价;将标准化产品整体代价、标准化第一用户画像代价和标准化第二用户画像代价进行整合,得到加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,可以基于整体代价确定策略,分别对产品分类表征向量、第一画像分类表征向量和第二画像分类表征向量进行特征变换操作,得到产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量。举例而言,可以整体代价确定策略关联的非线性函数对产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量进行代价确定,得到产品整体代价、第一用户画像代价和第二用户画像代价。举例而言,非线性函数不做限定,例如为对数函数或各种激活函数。也即,上述特征变换操作为非线性变换操作。
作为一种实施方式,基于整体代价确定策略分别对产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量进行代价确定,得到产品整体代价、第一用户画像代价和第二用户画像代价。举例而言,获取产品变换表征向量对应的参照表征向量、第一画像变换表征向量对应的参照表征向量和第二画像变换表征向量对应的参照表征向量。接着分别将产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量和对应的参照表征向量进行代价确定,得到产品整体代价、第一用户画像代价和第二用户画像代价。举例而言,分别获取产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量和其对应的参照表征向量的差值,获得产品整体代价、第一用户画像代价和第二用户画像代价。举例而言,分别将产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量和对应的参照表征向量进行比例计算,得到产品整体代价、第一用户画像代价和第二用户画像代价。
作为一种实施方式,基于整体代价确定策略分别对产品整体代价、第一用户画像代价和第二用户画像代价进行标准化操作,得到标准化产品整体代价、标准化第一用户画像代价和标准化第二用户画像代价。举例而言,通过指数函数进行标准化操作。
作为一种实施方式,将标准化产品整体代价、标准化第一用户画像代价和标准化第二用户画像代价进行整合,得到加噪用户画像样例表征向量对应的样例表征向量代价。举例而言,将标准化产品整体代价、标准化第一用户画像代价和标准化第二用户画像代价进行加权求和,获得整体代价确定策略对应的样例表征向量代价。举例而言,将标准化产品整体代价、标准化第一用户画像代价和标准化第二用户画像代价相加以获得整体代价确定策略对应的样例表征向量代价。各个代价计算方式不做限定,例如采用对数损失函数进行对应代价求解。
作为一种实施方式,当加噪用户画像样例表征向量为屏蔽后用户画像样例表征向量,代价确定策略为共性代价确定策略时,目标样例表征向量例如包括产品信息样例表征向量和用户画像样例表征向量。
实际应用中,步骤S40中“基于加噪用户画像样例表征向量对应的代价确定策略,将目标样例表征向量和加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价”,例如包括:获取和产品信息样例非配对的用户画像样例对应的用户画像样例表征向量;基于共性代价确定策略,分别获取产品信息样例表征向量和用户画像样例表征向量之间的第一共性结果、产品信息样例表征向量和屏蔽后用户画像样例表征向量之间的第二共性结果以及产品信息样例表征向量和非配对的用户画像样例对应的用户画像样例表征向量之间的第三共性结果;基于共性代价确定策略,对第一共性结果、第二共性结果和第三共性结果进行非线性整合,得到加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,共性代价确定策略是计算产品信息样例表征向量和各种用户画像样例表征向量之间的共性结果。然后,基于该共性结果计算样例表征向量代价。举例而言,确定产品信息样例表征向量和用户画像样例表征向量之间的第一共性结果;确定产品信息样例表征向量和屏蔽后用户画像样例表征向量之间的第二共性结果。共性结果表示两个变量件的相似性度量结果,可以计算二者的空间距离来评估,例如欧式距离或余弦距离。此外,获取和产品信息样例非配对的用户画像样例对应的用户画像样例表征向量。确定产品信息样例表征向量和非配对的用户画像样例对应的用户画像样例表征向量之间的第三共性结果。
作为一种实施方式,基于共性代价确定策略,对第一共性结果、第二共性结果和第三共性结果完成非线性整合,得到加噪用户画像样例表征向量对应的样例表征向量代价。举例而言,对第一共性结果、第二共性结果和第三共性结果分别完成非线性变换(非线性函数不做限定,如指数函数和对数函数),获得第一非线性共性结果、第二非线性共性结果和第三非线性共性结果。再将三个非线性共性结果求和以获得加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,当加噪用户画像样例表征向量为屏蔽后用户画像样例表征向量,代价确定策略为画像代价确定策略时,目标样例表征向量例如包括用户画像样例表征向量和产品信息样例表征向量。
实际应用中,步骤S40中,“基于加噪用户画像样例表征向量对应的代价确定策略,将目标样例表征向量和加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价”,例如包括:基于画像代价确定策略,分别获取产品信息样例表征向量和用户画像样例表征向量之间的第四共性结果,以及产品信息样例表征向量和屏蔽后用户画像样例表征向量之间的第五共性结果;基于画像代价确定策略,对第四共性结果和第五共性结果进行代价限制操作(即对代价的数值进行约束),得到加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,可以基于画像代价确定策略,分别获取产品信息样例表征向量和用户画像样例表征向量的第四共性结果,以及产品信息样例表征向量和屏蔽后用户画像样例表征向量的第五共性结果。举例而言,可以基于画像代价确定策略,基于欧几里得距离评估获取产品信息样例表征向量和用户画像样例表征向量的第四共性结果,和产品信息样例表征向量和屏蔽后用户画像样例表征向量的第五共性结果。
作为一种实施方式,本申请实施例可以限制产品信息样例表征向量和用户画像样例表征向量之间的第四共性结果一直大于产品信息样例表征向量和屏蔽后用户画像样例表征向量之间的第五共性结果,那么可以基于画像代价确定策略对第四共性结果和第五共性结果进行代价限制操作,得到加噪用户画像样例表征向量对应的样例表征向量代价。其中,代价限制操作是令产品信息样例表征向量和用户画像样例表征向量的第四共性结果一直都大于产品信息样例表征向量和屏蔽后用户画像样例表征向量的第五共性结果。
举例而言,将第四共性结果和第五共性结果进行作差以获得的共性误差。接着令共性误差总为正数,以令产品信息样例表征向量和用户画像样例表征向量的第四共性结果一直都大于产品信息样例表征向量和屏蔽后用户画像样例表征向量的第五共性结果。或者,让第四共性结果除以第五共性结果,获得共性误差。再令共性误差始终大于1,以令产品信息样例表征向量和用户画像样例表征向量的第四共性结果一直都大于产品信息样例表征向量和屏蔽后用户画像样例表征向量的第五共性结果。
作为一种实施方式,画像代价确定可以基于以下公式实现,可以基于此确定画像代价确定策略对应的样例表征向量代价:
其中,Cp是画像代价确定策略对应的样例表征向量代价,Fm是产品信息样例表征向量,Gj m是第j个加噪用户画像样例表征向量,Gm是用户画像样例表征向量,N是网络调试样例二元组数量,X是其中的用户画像样例的数量。
举例而言,分别获取产品信息样例表征向量和用户画像样例表征向量之间的第四共性结果,以及产品信息样例表征向量和屏蔽后用户画像样例表征向量之间的第五共性结果。然后,可以对第四共性结果和第五共性结果进行代价限制操作,得到加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,当加噪用户画像样例表征向量为一个或多个画像描述样例表征向量,代价确定策略为产品代价确定策略时,目标样例表征向量例如包括产品信息样例表征向量。
实际应用中,步骤S40中,“基于加噪用户画像样例表征向量对应的代价确定策略,将目标样例表征向量和加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价”,例如包括:基于产品代价确定策略,对一个或多个画像描述样例表征向量进行分类,得到画像描述积极样例表征向量和画像描述消极样例表征向量;基于产品代价确定策略,分别获取产品信息样例表征向量和画像描述积极样例表征向量之间的积极样例代价,以及产品信息样例表征向量和所述画像描述消极样例表征向量之间的消极样例代价;基于产品代价确定策略,对积极样例代价和消极样例代价进行非线性整合,得到加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,因为画像描述样例是基于用户画像样例中的一个或多个画像标签样例组合得到,那么,一些画像描述样例之间可能语义有区别,使得不同的画像描述样例对应的产品类型产生偏差。则可以基于产品代价确定策略对一个或多个画像描述样例表征向量进行分类,得到画像描述积极样例表征向量和画像描述消极样例表征向量。其中,画像描述积极样例表征向量例如包括和产品信息样例配对的画像描述样例,画像描述消极样例例如包括和产品信息样例不配对的画像描述样例。
作为一种实施方式,可以基于产品代价确定策略,分别获取产品信息样例表征向量和画像描述积极样例表征向量之间的积极样例代价,以及产品信息样例表征向量和所述画像描述消极样例表征向量之间的消极样例代价。举例而言,可以基于欧几里得距离共性度量分别获取产品信息样例表征向量和画像描述积极样例表征向量之间的积极样例代价,以及产品信息样例表征向量和画像描述消极样例表征向量之间的消极样例代价。
作为一种实施方式,可以基于产品代价确定策略,对积极样例代价和消极样例代价完成非线性整合,获得加噪用户画像样例表征向量对应的样例表征向量代价。举例而言,将积极样例代价和消极样例代价进行非线性转换后求和,以获得加噪用户画像样例表征向量对应的样例表征向量代价。
作为一种实施方式,产品代价确定策略的计算方式可以采用对数似然损失函数,具体不做限定,例如:
其中,Cs是产品代价确定策略对应的样例表征向量代价。Y是生成的画像描述样例的数量。W为共性评估函数,如余弦距离函数。α是画像描述积极样例表征向量集,β是画像描述消极样例表征向量集。Fm是产品信息样例表征向量。A1是画像描述积极样例,A2是画像描述消极样例。a和b是预设尺度变量,t1和t2是预设阈值变量。
作为一种实施方式,对于积极样例和消极样例,对一用户画像样例来说,另一生成的画像描述样例和用户画像样例对应的类别一致,则视该画像描述样例是积极样例。若另一生成的画像描述样例与该用户画像样例的用户画像共性大于阈值,则画像描述样例是消极样例。由于调试时用户画像特征提炼组件需要持续迭代,同时画像描述样例与原始的用户画像样例的数据分布不同,则不对用户画像特征提炼组件进行逆向传递。
步骤S50,基于每个加噪用户画像样例表征向量对应的样例表征向量代价对业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络。
作为一种实施方式,获得每个加噪用户画像样例表征向量对应的样例表征向量代价之后,基于每个加噪用户画像样例表征向量对应的样例表征向量代价对业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络。
举例而言,将每个加噪用户画像样例表征向量对应的样例表征向量代价进行加权求和以获得目标代价。接着基于目标代价对业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络。
本申请实施例中,获取业务产品推荐网络和网络调试样例二元组,其中,网络调试样例二元组包括产品信息样例和用户画像样例集合,用户画像样例集合包括和产品信息样例配对的用户画像样例以及基于不同的画像加噪策略基于用户画像样例生成的多个加噪用户画像样例;通过业务产品推荐网络对网络调试样例二元组进行特征提炼操作,得到产品信息样例对应的产品信息样例表征向量、用户画像样例对应的用户画像样例表征向量和加噪用户画像样例对应的加噪用户画像样例表征向量;基于加噪用户画像样例的画像加噪策略,确定每个加噪用户画像样例表征向量对应的代价确定策略;基于每个加噪用户画像样例表征向量对应的代价确定策略,将加噪用户画像样例表征向量、产品信息样例表征向量和用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价;基于每个加噪用户画像样例表征向量对应的样例表征向量代价对业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络。
步骤S60,获取目标用户画像,将目标用户画像输入目标业务产品推荐网络,基于目标业务产品推荐网络得到对应于目标用户画像的业务产品信息。
可以理解,目标用户画像可以是根据用户的行为数据和/或基础属性信息进行挖掘得到的描述用户需求的标签集合,其可以是基于其他分析模型得到的,其获取方式非本申请实施例的重点,此处不做赘述,可以参考相关技术。通过将目标用户画像输入经过本申请实施例前述的调试方式得到的目标业务产品推荐网络,即可得到配对的准备的业务产品信息。
本申请实施例通过不同的画像加噪策略生成不同的加噪用户画像样例,令业务产品推荐网络能基于加噪用户画像样例学习到更多样例表征向量,增加业务产品推荐网络的质量。举例而言,本申请能生成屏蔽后用户画像样例和画像描述样例。基于生成屏蔽后用户画像样例,可以生成和产品信息样例配对但是信息不全的画像描述。另外,基于生成画像描述样例,可以基于画像描述的侧重信息对用户画像样例中的特有信息进行重组,构成和产品信息样例配对的按照特定方式形成的细节画像描述。因此,基于通过屏蔽后用户画像样例和画像描述样例对业务产品推荐网络进行调试,能提高业务产品推荐网络对画像细节信息的锁定和产品的匹配。另外,本申请实施例基于不同的画像加噪策略,通过不同的代价确定策略对业务产品推荐网络进行代价确定,令业务产品推荐网络可以基于不同画像加噪策略对应的样例表征向量代价学习到加噪用户画像样例表征向量更多的特征信息,和度量学习到产品信息样例和加噪用户画像样例表征向量之间的误差和用户画像样例和加噪用户画像样例表征向量之间的误差,增加网络的质量,帮助确定更准确的产品进行推荐,提高用户体验和产品转化率。
基于前述的实施例,本申请实施例提供一种基于用户数据分析的业务产品推荐装置,该装置所包括的各单元、以及各单元所包括的各模块,可以通过计算机系统中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(Central Processing Unit,CPU)、微处理器(Microprocessor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)或现场可编程门阵列(Field Programmable GateArray,FPGA)等。
图2为本申请实施例提供的一种基于用户数据分析的业务产品推荐装置的组成结构示意图,如图2所示,基于用户数据分析的业务产品推荐装置200包括:
调试样例获取模块210,用于获取业务产品推荐网络和网络调试样例二元组,其中,所述网络调试样例二元组包括产品信息样例和用户画像样例集合,所述用户画像样例集合包括和所述产品信息样例配对的用户画像样例以及基于不同的画像加噪策略基于所述用户画像样例生成的多个加噪用户画像样例;
样例特征提炼模块220,用于通过所述业务产品推荐网络对所述网络调试样例二元组进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量、所述用户画像样例对应的用户画像样例表征向量和所述加噪用户画像样例对应的加噪用户画像样例表征向量;
代价策略确定模块230,用于基于所述加噪用户画像样例的画像加噪策略,确定每个加噪用户画像样例表征向量对应的代价确定策略;
调试代价确定模块240,用于基于每个加噪用户画像样例表征向量对应的代价确定策略,将所述加噪用户画像样例表征向量、所述产品信息样例表征向量和所述用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价;
网络参数优化模块250,用于基于每个加噪用户画像样例表征向量对应的样例表征向量代价对所述业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络;
业务产品确定模块260,用于获取目标用户画像,将目标用户画像输入所述目标业务产品推荐网络,基于所述目标业务产品推荐网络得到对应于所述目标用户画像的业务产品信息。
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。在一些实施例中,本申请实施例提供的装置具有的功能或包含的模块可以用于执行上述方法实施例描述的方法,对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的基于用户数据分析的业务产品推荐方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机系统(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件、软件或固件,或者硬件、软件、固件三者之间的任意结合。
本申请实施例提供一种计算机系统,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的部分或全部步骤。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。所述计算机可读存储介质可以是瞬时性的,也可以是非瞬时性的。
本申请实施例提供一种计算机程序,包括计算机可读代码,在所述计算机可读代码在计算机系统中运行的情况下,所述计算机系统中的处理器执行用于实现上述方法中的部分或全部步骤。
本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序被计算机读取并执行时,实现上述方法中的部分或全部步骤。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一些实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一些实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
这里需要指出的是:上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考。以上设备、存储介质、计算机程序及计算机程序产品实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请设备、存储介质、计算机程序及计算机程序产品实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。
图3为本申请实施例提供的一种计算机系统的硬件实体示意图,如图3所示,该计算机系统1000的硬件实体包括:处理器1001和存储器1002,其中,存储器1002存储有可在处理器1001上运行的计算机程序,处理器1001执行程序时实现上述任一实施例的方法中的步骤。
存储器1002存储有可在处理器上运行的计算机程序,存储器1002配置为存储由处理器1001可执行的指令和应用,还可以缓存待处理器1001以及计算机系统1000中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(Random Access Memory,RAM)实现。
处理器1001执行程序时实现上述任一项的基于用户数据分析的业务产品推荐方法的步骤。处理器1001通常控制计算机系统1000的总体操作。
本申请实施例提供一种计算机存储介质,计算机存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如上任一实施例的基于用户数据分析的业务产品推荐方法的步骤。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。上述处理器可以为目标用途集成电路(Application Specific Integrated Circuit,ASIC)、数字信号处理器(DigitalSignal Processor,DSP)、数字信号处理装置(Digital Signal Processing Device,DSPD)、可编程逻辑装置(Programmable Logic Device,PLD)、现场可编程门阵列(FieldProgrammable Gate Array,FPGA)、中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器中的至少一种。可以理解地,实现上述处理器功能的电子器件还可以为其它,本申请实施例不作具体限定。
上述计算机存储介质/存储器可以是只读存储器、可编程只读存储器、可擦除可编程只读存储器、电可擦除可编程只读存储器、磁性随机存取存储器、快闪存储器、磁表面存储器、光盘、或只读光盘等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各步骤/过程的序号的大小并不意味着执行顺序的先后,各步骤/过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机系统(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。

Claims (12)

1.一种基于用户数据分析的业务产品推荐方法,其特征在于,应用于计算机系统,所述方法包括:
获取业务产品推荐网络和网络调试样例二元组,其中,所述网络调试样例二元组包括产品信息样例和用户画像样例集合,所述用户画像样例集合包括和所述产品信息样例配对的用户画像样例以及基于不同的画像加噪策略基于所述用户画像样例生成的多个加噪用户画像样例;
通过所述业务产品推荐网络对所述网络调试样例二元组进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量、所述用户画像样例对应的用户画像样例表征向量和所述加噪用户画像样例对应的加噪用户画像样例表征向量;
基于所述加噪用户画像样例的画像加噪策略,确定每个加噪用户画像样例表征向量对应的代价确定策略;
基于每个加噪用户画像样例表征向量对应的代价确定策略,将所述加噪用户画像样例表征向量、所述产品信息样例表征向量和所述用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价;
基于每个加噪用户画像样例表征向量对应的样例表征向量代价对所述业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络;
获取目标用户画像,将目标用户画像输入所述目标业务产品推荐网络,基于所述目标业务产品推荐网络得到对应于所述目标用户画像的业务产品信息。
2.根据权利要求1所述的方法,其特征在于,所述业务产品推荐网络包括用户画像特征提炼组件和产品特征提炼组件;所述通过所述业务产品推荐网络对所述网络调试样例二元组进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量、所述用户画像样例对应的用户画像样例表征向量和所述加噪用户画像样例对应的加噪用户画像样例表征向量,包括:
通过所述产品特征提炼组件对所述产品信息样例进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量;
通过所述用户画像特征提炼组件对所述用户画像样例和所述加噪用户画像样例进行特征提炼操作,得到所述用户画像样例对应的用户画像样例表征向量和所述加噪用户画像样例对应的加噪用户画像样例表征向量。
3.根据权利要求2所述的方法,其特征在于,所述通过所述产品特征提炼组件对所述产品信息样例进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量,包括:
对所述产品信息样例进行切分,得到一个或多个产品切分信息样例;
基于所述一个或多个产品切分信息样例进行链构建,得到产品切分信息链;
对所述产品切分信息链进行信息嵌入映射,得到所述产品切分信息链对应的产品切分映射向量;
通过所述产品特征提炼组件对所述产品切分映射向量进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量。
4.根据权利要求3所述的方法,其特征在于,所述通过所述产品特征提炼组件对所述产品切分映射向量进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量,包括:
将所述产品信息样例对应的产品类型表征向量融合到所述产品切分映射向量,得到融合产品切分映射向量;
将分布向量和所述融合产品切分映射向量进行整合,得到整合产品切分映射向量;
通过所述产品特征提炼组件对所述整合产品切分映射向量进行特征提炼操作,得到产品切分提炼向量;
通过所述产品特征提炼组件将所述产品切分提炼向量进行下采样,得到下采样产品切分提炼向量;
基于所述产品类型表征向量对所述产品切分提炼向量进行识别处理,得到所述产品类型表征向量对应的产品切分提炼向量;
将所述下采样产品切分提炼向量和所述产品类型表征向量对应的产品切分提炼向量进行整合,得到所述产品信息样例对应的产品信息样例表征向量。
5.根据权利要求1所述的方法,其特征在于,所述基于每个加噪用户画像样例表征向量对应的代价确定策略,将所述加噪用户画像样例表征向量、所述产品信息样例表征向量和所述用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述加噪用户画像样例表征向量对应的代价确定策略,在所述产品信息样例表征向量和所述用户画像样例表征向量中确定所述代价确定策略依赖的目标样例表征向量;
基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价。
6.根据权利要求5所述的方法,其特征在于,当所述加噪用户画像样例表征向量为屏蔽后用户画像样例表征向量,所述代价确定策略为整体代价确定策略时,所述目标样例表征向量包括所述产品信息样例表征向量和所述用户画像样例表征向量;
所述基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述整体代价确定策略,获取所述业务产品推荐网络对应的产品类型影响系数和画像类型影响系数;
基于所述整体代价确定策略,将所述产品类型影响系数和所述产品信息样例表征向量进行作积,得到产品分类表征向量;
基于所述整体代价确定策略,分别将所述画像类型影响系数和所述用户画像样例表征向量以及所述屏蔽后用户画像样例表征向量进行作积,得到所述用户画像样例表征向量对应的第一画像分类表征向量和所述屏蔽后用户画像样例表征向量对应的第二画像分类表征向量;
基于所述整体代价确定策略将所述产品分类表征向量、所述第一画像分类表征向量和所述第二画像分类表征向量进行合并,得到所述加噪用户画像样例表征向量对应的样例表征向量代价。
7.根据权利要求6所述的方法,其特征在于,所述基于所述整体代价确定策略将所述产品分类表征向量、所述第一画像分类表征向量和所述第二画像分类表征向量进行合并,得到所述加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述整体代价确定策略,分别对所述产品分类表征向量、所述第一画像分类表征向量和所述第二画像分类表征向量进行特征变换操作,得到产品变换表征向量、第一画像变换表征向量和第二画像变换表征向量;
基于所述整体代价确定策略,分别对所述产品变换表征向量、所述第一画像变换表征向量和所述第二画像变换表征向量进行代价确定,得到产品整体代价、第一用户画像代价和第二用户画像代价;
基于所述整体代价确定策略,分别对所述产品整体代价、第一用户画像代价和第二用户画像代价进行标准化操作,得到标准化产品整体代价、标准化第一用户画像代价和标准化第二用户画像代价;
将所述标准化产品整体代价、所述标准化第一用户画像代价和所述标准化第二用户画像代价进行整合,得到所述加噪用户画像样例表征向量对应的样例表征向量代价。
8.根据权利要求5所述的方法,其特征在于,当所述加噪用户画像样例表征向量为屏蔽后用户画像样例表征向量,所述代价确定策略为共性代价确定策略时,所述目标样例表征向量包括所述产品信息样例表征向量和所述用户画像样例表征向量;
所述基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价,包括:
获取和所述产品信息样例非配对的用户画像样例对应的用户画像样例表征向量;
基于所述共性代价确定策略,分别获取所述产品信息样例表征向量和所述用户画像样例表征向量之间的第一共性结果、所述产品信息样例表征向量和所述屏蔽后用户画像样例表征向量之间的第二共性结果以及所述产品信息样例表征向量和非配对的用户画像样例对应的用户画像样例表征向量之间的第三共性结果;
基于所述共性代价确定策略,对所述第一共性结果、所述第二共性结果和所述第三共性结果进行非线性整合,得到所述加噪用户画像样例表征向量对应的样例表征向量代价;
当所述加噪用户画像样例表征向量为屏蔽后用户画像样例表征向量,所述代价确定策略为画像代价确定策略时,所述目标样例表征向量包括所述用户画像样例表征向量和所述产品信息样例表征向量;
所述基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述画像代价确定策略,分别获取所述产品信息样例表征向量和所述用户画像样例表征向量之间的第四共性结果,以及所述产品信息样例表征向量和所述屏蔽后用户画像样例表征向量之间的第五共性结果;
基于所述画像代价确定策略,对所述第四共性结果和所述第五共性结果进行代价限制操作,得到所述加噪用户画像样例表征向量对应的样例表征向量代价;
当所述加噪用户画像样例表征向量为一个或多个画像描述样例表征向量,所述代价确定策略为产品代价确定策略时,所述目标样例表征向量包括所述产品信息样例表征向量;
所述基于加噪用户画像样例表征向量对应的代价确定策略,将所述目标样例表征向量和所述加噪用户画像样例表征向量进行代价确定,得到加噪用户画像样例表征向量对应的样例表征向量代价,包括:
基于所述产品代价确定策略,对一个或多个画像描述样例表征向量进行分类,得到画像描述积极样例表征向量和画像描述消极样例表征向量;
基于所述产品代价确定策略,分别获取所述产品信息样例表征向量和所述画像描述积极样例表征向量之间的积极样例代价,以及所述产品信息样例表征向量和所述画像描述消极样例表征向量之间的消极样例代价;
基于所述产品代价确定策略,对所述积极样例代价和所述消极样例代价进行非线性整合,得到所述加噪用户画像样例表征向量对应的样例表征向量代价。
9.根据权利要求1所述的方法,其特征在于,所述获取业务产品推荐网络和网络调试样例二元组之前,所述方法还包括:
获取产品信息样例以及和所述产品信息样例配对的用户画像样例;
基于不同的画像加噪策略对所述用户画像样例进行加噪,得到每个画像加噪策略对应的加噪用户画像样例;
将所述用户画像样例、所述每个画像加噪策略对应的加噪用户画像样例和所述产品信息样例进行合并,获得所述网络调试样例二元组。
10.根据权利要求9所述的方法,其特征在于,所述基于不同的画像加噪策略对所述用户画像样例进行加噪,得到每个画像加噪策略对应的加噪用户画像样例,包括:
对所述用户画像样例进行解析处理,得到一个或多个画像标签样例;
对所述用户画像样例的一个或多个画像标签样例进行屏蔽,得到一个或多个屏蔽后用户画像样例;
对所述用户画像样例的一个或多个画像标签样例进行集成,获得一个或多个画像描述样例。
11.一种基于用户数据分析的业务产品推荐装置,其特征在于,包括:
调试样例获取模块,用于获取业务产品推荐网络和网络调试样例二元组,其中,所述网络调试样例二元组包括产品信息样例和用户画像样例集合,所述用户画像样例集合包括和所述产品信息样例配对的用户画像样例以及基于不同的画像加噪策略基于所述用户画像样例生成的多个加噪用户画像样例;
样例特征提炼模块,用于通过所述业务产品推荐网络对所述网络调试样例二元组进行特征提炼操作,得到所述产品信息样例对应的产品信息样例表征向量、所述用户画像样例对应的用户画像样例表征向量和所述加噪用户画像样例对应的加噪用户画像样例表征向量;
代价策略确定模块,用于基于所述加噪用户画像样例的画像加噪策略,确定每个加噪用户画像样例表征向量对应的代价确定策略;
调试代价确定模块,用于基于每个加噪用户画像样例表征向量对应的代价确定策略,将所述加噪用户画像样例表征向量、所述产品信息样例表征向量和所述用户画像样例表征向量进行代价确定,得到每个加噪用户画像样例表征向量对应的样例表征向量代价;
网络参数优化模块,用于基于每个加噪用户画像样例表征向量对应的样例表征向量代价对所述业务产品推荐网络进行网络参数优化,得到目标业务产品推荐网络;
业务产品确定模块,用于获取目标用户画像,将目标用户画像输入所述目标业务产品推荐网络,基于所述目标业务产品推荐网络得到对应于所述目标用户画像的业务产品信息。
12.一种计算机系统,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至10任一项所述方法中的步骤。
CN202410250851.5A 2024-03-06 2024-03-06 一种基于用户数据分析的业务产品推荐方法、装置及系统 Active CN117829968B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410250851.5A CN117829968B (zh) 2024-03-06 2024-03-06 一种基于用户数据分析的业务产品推荐方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410250851.5A CN117829968B (zh) 2024-03-06 2024-03-06 一种基于用户数据分析的业务产品推荐方法、装置及系统

Publications (2)

Publication Number Publication Date
CN117829968A true CN117829968A (zh) 2024-04-05
CN117829968B CN117829968B (zh) 2024-05-31

Family

ID=90513772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410250851.5A Active CN117829968B (zh) 2024-03-06 2024-03-06 一种基于用户数据分析的业务产品推荐方法、装置及系统

Country Status (1)

Country Link
CN (1) CN117829968B (zh)

Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162700A (zh) * 2019-04-23 2019-08-23 腾讯科技(深圳)有限公司 信息推荐及模型的训练方法、装置、设备以及存储介质
CN110245719A (zh) * 2019-03-27 2019-09-17 中国海洋大学 一种面向实体和用户画像的特征融合方法
CN112560996A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 用户画像识别模型训练方法、设备、可读存储介质及产品
CN112699297A (zh) * 2020-12-23 2021-04-23 平安银行股份有限公司 基于用户画像的服务推荐方法、装置、设备及存储介质
CN113763095A (zh) * 2020-11-27 2021-12-07 北京京东振世信息技术有限公司 信息推荐方法、装置和模型训练方法、装置
CN113781139A (zh) * 2020-10-19 2021-12-10 北京沃东天骏信息技术有限公司 物品推荐方法、物品推荐装置、设备和介质
CN113869992A (zh) * 2021-12-03 2021-12-31 平安科技(深圳)有限公司 基于人工智能的产品推荐方法、装置、电子设备及介质
CN114238758A (zh) * 2021-12-14 2022-03-25 杭州电子科技大学 一种基于多源跨界数据融合的用户画像预测方法
CN114663198A (zh) * 2022-04-25 2022-06-24 未鲲(上海)科技服务有限公司 基于用户画像的产品推荐方法、装置、设备及存储介质
CN114764471A (zh) * 2021-01-12 2022-07-19 腾讯科技(深圳)有限公司 一种推荐方法、装置及存储介质
CN114764470A (zh) * 2021-01-12 2022-07-19 腾讯科技(深圳)有限公司 获取用户画像的方法、装置和设备及存储介质
CN114913028A (zh) * 2022-06-08 2022-08-16 华东师范大学 一种基于知识图谱提取倾向性的群组推荐方法
CN115438265A (zh) * 2022-09-19 2022-12-06 中国银行股份有限公司 一种信息推荐方法及装置
CN115510313A (zh) * 2021-06-23 2022-12-23 腾讯科技(深圳)有限公司 信息推荐方法、装置、存储介质及计算机设备
CN115545784A (zh) * 2022-10-13 2022-12-30 深圳供电局有限公司 业务推荐方法、装置、计算机设备和存储介质
CN115718930A (zh) * 2022-11-30 2023-02-28 北京航天数据股份有限公司 一种基于用户画像的用户服务系统、方法及电子设备
CN116629757A (zh) * 2023-04-11 2023-08-22 深圳市创新源供应链集成有限公司 一种基于人工智能的供应链验证方法及系统
CN116883181A (zh) * 2023-09-07 2023-10-13 北京中关村科金技术有限公司 基于用户画像的金融服务推送方法、存储介质及服务器
CN117235371A (zh) * 2023-10-27 2023-12-15 百度在线网络技术(北京)有限公司 视频推荐方法、模型训练方法及装置

Patent Citations (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245719A (zh) * 2019-03-27 2019-09-17 中国海洋大学 一种面向实体和用户画像的特征融合方法
CN110162700A (zh) * 2019-04-23 2019-08-23 腾讯科技(深圳)有限公司 信息推荐及模型的训练方法、装置、设备以及存储介质
CN113781139A (zh) * 2020-10-19 2021-12-10 北京沃东天骏信息技术有限公司 物品推荐方法、物品推荐装置、设备和介质
CN113763095A (zh) * 2020-11-27 2021-12-07 北京京东振世信息技术有限公司 信息推荐方法、装置和模型训练方法、装置
CN112699297A (zh) * 2020-12-23 2021-04-23 平安银行股份有限公司 基于用户画像的服务推荐方法、装置、设备及存储介质
CN112560996A (zh) * 2020-12-24 2021-03-26 北京百度网讯科技有限公司 用户画像识别模型训练方法、设备、可读存储介质及产品
CN114764471A (zh) * 2021-01-12 2022-07-19 腾讯科技(深圳)有限公司 一种推荐方法、装置及存储介质
CN114764470A (zh) * 2021-01-12 2022-07-19 腾讯科技(深圳)有限公司 获取用户画像的方法、装置和设备及存储介质
CN115510313A (zh) * 2021-06-23 2022-12-23 腾讯科技(深圳)有限公司 信息推荐方法、装置、存储介质及计算机设备
CN113869992A (zh) * 2021-12-03 2021-12-31 平安科技(深圳)有限公司 基于人工智能的产品推荐方法、装置、电子设备及介质
CN114238758A (zh) * 2021-12-14 2022-03-25 杭州电子科技大学 一种基于多源跨界数据融合的用户画像预测方法
CN114663198A (zh) * 2022-04-25 2022-06-24 未鲲(上海)科技服务有限公司 基于用户画像的产品推荐方法、装置、设备及存储介质
CN114913028A (zh) * 2022-06-08 2022-08-16 华东师范大学 一种基于知识图谱提取倾向性的群组推荐方法
CN115438265A (zh) * 2022-09-19 2022-12-06 中国银行股份有限公司 一种信息推荐方法及装置
CN115545784A (zh) * 2022-10-13 2022-12-30 深圳供电局有限公司 业务推荐方法、装置、计算机设备和存储介质
CN115718930A (zh) * 2022-11-30 2023-02-28 北京航天数据股份有限公司 一种基于用户画像的用户服务系统、方法及电子设备
CN116629757A (zh) * 2023-04-11 2023-08-22 深圳市创新源供应链集成有限公司 一种基于人工智能的供应链验证方法及系统
CN116883181A (zh) * 2023-09-07 2023-10-13 北京中关村科金技术有限公司 基于用户画像的金融服务推送方法、存储介质及服务器
CN117235371A (zh) * 2023-10-27 2023-12-15 百度在线网络技术(北京)有限公司 视频推荐方法、模型训练方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZHETAO LI等: ""Adversarial Learning of Transitive Semantic Features for Cross-Domain Recommendation"", 《2019 IEEE GLOBAL COMMUNICATIONS CONFERENCE (GLOBECOM)》, 27 February 2020 (2020-02-27) *
刘子瑞: ""基于用户画像的知识付费产品推荐研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 September 2021 (2021-09-15), pages 138 - 868 *
杨信昭: ""基于用户画像的推荐方法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》, 15 April 2022 (2022-04-15), pages 138 - 1361 *

Also Published As

Publication number Publication date
CN117829968B (zh) 2024-05-31

Similar Documents

Publication Publication Date Title
CN108829808B (zh) 一种页面个性化排序方法、装置及电子设备
CN110069709B (zh) 意图识别方法、装置、计算机可读介质及电子设备
CN112148889A (zh) 一种推荐列表的生成方法及设备
CN112364204B (zh) 视频搜索方法、装置、计算机设备及存储介质
CN112257808B (zh) 用于零样本分类的集成协同训练方法、装置及终端设备
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN111611390B (zh) 一种数据处理方法及装置
CN116308551A (zh) 基于数字金融ai平台的内容推荐方法及系统
US20230214676A1 (en) Prediction model training method, information prediction method and corresponding device
CN117829968B (zh) 一种基于用户数据分析的业务产品推荐方法、装置及系统
CN116596576A (zh) 目标推荐方法及装置
US20230153887A1 (en) Disentangled commodity recommendation method and apparatus, device, and storage medium
CN110929285A (zh) 一种隐私数据的处理方法及装置
CN115730217A (zh) 模型的训练方法、物料的召回方法及装置
CN115564450A (zh) 一种风控方法、装置、存储介质及设备
CN116955763A (zh) 内容推荐方法、装置、计算机设备及计算机可读存储介质
CN113704422A (zh) 一种文本推荐方法、装置、计算机设备和存储介质
CN111768262A (zh) 信息推荐方法、装置、电子设备及存储介质
CN112487803A (zh) 一种基于深度学习的合同审核方法、装置及电子设备
CN117786234B (zh) 一种基于两阶段对比学习的多模态资源推荐方法
CN115455306B (zh) 推送模型训练、信息推送方法、装置和存储介质
CN117951364A (zh) 信息推荐模型的训练、信息推荐方法及相关设备
CN117132359A (zh) 推荐方法、装置、设备及存储介质
CN116797319A (zh) 基于语音交互的业务处理方法、装置、设备、介质和产品
He et al. Cross‐Modal Discrimination Hashing Retrieval Using Variable Length

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant