CN117934064A - 一种数据处理方法、模型训练方法及相关设备 - Google Patents

一种数据处理方法、模型训练方法及相关设备 Download PDF

Info

Publication number
CN117934064A
CN117934064A CN202211246785.1A CN202211246785A CN117934064A CN 117934064 A CN117934064 A CN 117934064A CN 202211246785 A CN202211246785 A CN 202211246785A CN 117934064 A CN117934064 A CN 117934064A
Authority
CN
China
Prior art keywords
value
user
consumption
model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211246785.1A
Other languages
English (en)
Inventor
卞志鹏
毛正阳
盛镇醴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Cloud Computing Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Cloud Computing Technologies Co Ltd filed Critical Huawei Cloud Computing Technologies Co Ltd
Priority to CN202211246785.1A priority Critical patent/CN117934064A/zh
Priority to PCT/CN2023/116909 priority patent/WO2024078195A1/zh
Publication of CN117934064A publication Critical patent/CN117934064A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种数据处理方法、模型训练方法及相关设备。该方案中,通过获取目标用户的用户数据,将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值,其中,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿,由此快速的确定出客户的消费能力或消费意愿,提供更多的指标给企业的销售获客人员,从而快速的确定出跟进客户,提高跟进效率。

Description

一种数据处理方法、模型训练方法及相关设备
技术领域
本申请实施例涉及计算机领域,尤其涉及一种数据处理方法、模型训练方法及相关设备。
背景技术
随着科技和经济的高速发展,越来越多的企业需要增进与客户之间的关系,最大化增加企业销售收入和提高客户留存。
企业一般通过举办活动、线下拜访、用户注册账号和消费者访谈等方式获取客户资料,后续经过持续跟进,可转化为销售机会,并通过使用专业的系统,例如企业关系管理系统(customer relationship management,CRM)来对客户资料进行历史积累。
但客户资料多种多样,企业的销售获客人员无法直接从大量的数据中确定出最合适的跟进客户,导致跟进效率低,进而造成企业的高质量潜在客户流失。
发明内容
本申请实施例提供一种数据处理方法和模型训练方法,用于提供客户的相关指标,以提高企业的销售获客人员的客户跟进效率。本申请实施例还提供了相应的数据处理装置、模型训练装置、数据处理系统、计算机可读存储介质、芯片系统及计算机程序产品等。
本申请第一方面提供一种数据处理方法,该方法包括:获取目标用户的用户数据;将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值;其中,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿。
本申请中,该数据处理方法可以应用在云服务的获客场景,通过计算机设备执行,获取用户数据的方式可以是通过云服务器获取,用户数据需要进行特征加工处理。
本申请中的目标用户可以为多个用户,价值空间值用于表征目标用户的总体潜在消费能力,以元或万元为单位,消费意愿值用于表征目标用户进行消费的意愿大小,归一化到0-1之间,0表示没有意愿,1表示意愿最强烈。
该第一方面,通过获取目标用户的用户数据,将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值,其中,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿,由此快速的确定出客户的消费能力或消费意愿,提供更多的指标给企业的销售获客人员,从而快速的确定出跟进客户,提高跟进效率。
在第一方面的一种可能的实现方式中,该方法还包括:将价值空间预测值和/或消费意愿预测值输入至预先训练好的第二模型,得到目标用户的线索等级预测值;其中,线索等级预测值用于表示目标用户的评价等级。
该种可能的实现方式中,线索等级预测值结合了价值空间预测值和/或消费意愿预测值,即可以用于表示出目标用户的消费意愿和消费能力,线索等级值越高表示目标客户更为优质,从而进一步提供更多的指标给企业的销售获客人员,便于进行全面的线索洞察,从而快速的确定出跟进客户,提高跟进效率。
在第一方面的一种可能的实现方式中,用户数据包括静态数据和/或行为数据;第一模型的输入为静态数据时,第一模型的输出为价值空间预测值;第一模型的输入为行为数据时,第一模型的输出为消费意愿预测值。
该种可能的实现方式中,基于静态数据可以得到目标用户的价值空间预测值,基于行为数据可以得到目标用户的消费意愿预测值,提升了方案的可实现性。
在第一方面的一种可能的实现方式中,目标用户包括个人用户和企业用户,第一模型包括分别经过个人用户的用户数据,以及企业用户的用户数据单独训练得到的两种模型。
该种可能的实现方式中,将目标用户分为个人用户和企业用户,可以提升模型的准确度,提升模型预测的准确率。
在第一方面的一种可能的实现方式中,该方法还包括:基于价值空间预测值和/或消费意愿预测值从大到小的顺序展示目标用户。
该种可能的实现方式中,基于价值空间预测值和/或消费意愿预测值从大到小的顺序展示目标用户可以方便销售获客人员快速确定出需要跟进的客户,进一步提高跟进效率。
在第一方面的一种可能的实现方式中,该方法还包括:展示重点用户,重点用户为价值空间预测值和/或消费意愿预测值高于预设阈值的目标用户。
该种可能的实现方式中,展示价值空间预测值和/或消费意愿预测值高于预设阈值的目标用户可以方便销售获客人员快速确定出需要跟进的客户,进一步提高跟进效率。
本申请第二方面提供一种模型训练方法,该方法包括:获取样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项;基于样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;其中,价值空间值用于表示样本用户的消费能力,消费意愿值用于表示样本用户的消费意愿。
该第二方面,训练得到的目标模型可以预测出用户的价值空间值和/或用户的消费意愿值,从而提供更多的指标给企业的销售获客人员,从而快速的确定出跟进客户,提高跟进效率。
在第二方面的一种可能的实现方式中,样本用户为企业用户或个人用户中的任一项。
该种可能的实现方式中,将样本用户分为个人用户和企业用户分开进行训练,可以提升模型的准确度,提升模型预测的准确率。
在第二方面的一种可能的实现方式中,该方法还包括:获取消费场景信息;从用户数据中获取与消费场景信息相关的目标数据;初始模型训练时,目标数据的权重高于用户数据中除目标数据外的数据的权重。
该种可能的实现方式中,与消费场景信息相关的数据的训练权重更高,进一步提升模型预测的准确率。
本申请第三方面提供一种模型训练方法,该方法包括:获取样本用户的线索等级值,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项;基于样本用户的线索等级值,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;其中,价值空间值用于表示样本用户的消费能力,消费意愿值用于表示样本用户的消费意愿,线索等级值用于表示目标用户的评价等级。
该第三方面,训练得到的目标模型可以预测出用户的线索等级值,从而提供更多的指标给企业的销售获客人员,从而快速的确定出跟进客户,提高跟进效率。
本申请第四方面,提供了一种数据处理装置,用于执行上述第一方面或第一方面的任意可能的实现方式中的方法。具体地,该数据处理装置包括用于执行上述第一方面或第一方面的任意可能的实现方式中的方法的模块,如:获取模块和第一处理模块。
具体的,获取模块用于获取目标用户的用户数据;第一处理模块用于将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值;其中,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿。
在第四方面的一种可能的实现方式中,该数据处理装置还包括:第二处理模块,用于将价值空间预测值和/或消费意愿预测值输入至预先训练好的第二模型,得到目标用户的线索等级预测值;其中,线索等级预测值用于表示目标用户的评价等级。
在第四方面的一种可能的实现方式中,用户数据包括静态数据和/或行为数据;第一模型的输入为静态数据时,第一模型的输出为价值空间预测值;第一模型的输入为行为数据时,第一模型的输出为消费意愿预测值。
在第四方面的一种可能的实现方式中,目标用户包括个人用户和企业用户,第一模型包括分别经过个人用户的用户数据,以及企业用户的用户数据单独训练得到的两种模型。
在第四方面的一种可能的实现方式中,该数据处理装置还包括第一展示模块,第一展示模块用于基于价值空间预测值和/或消费意愿预测值从大到小的顺序展示目标用户。
在第四方面的一种可能的实现方式中,该数据处理装置还包括第二展示模块,第二展示模块用于展示重点用户,重点用户为价值空间预测值和/或消费意愿预测值高于预设阈值的目标用户。
本申请第五方面,提供了一种模型训练装置,用于执行上述第二方面或第二方面的任意可能的实现方式中的方法。具体地,该模型训练装置包括用于执行上述第二方面或第二方面的任意可能的实现方式中的方法的模块,如:第一获取模块和训练模块。
具体的,第一获取模块用于获取样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项;训练模块用于基于样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;其中,价值空间值用于表示样本用户的消费能力,消费意愿值用于表示样本用户的消费意愿。
在第五方面的一种可能的实现方式中,样本用户为企业用户或个人用户中的任一项。
在第五方面的一种可能的实现方式中,该模型训练装置还包括第二获取模块,第二获取模块用于获取消费场景信息;从用户数据中获取与消费场景信息相关的目标数据;初始模型训练时,目标数据的权重高于用户数据中除目标数据外的数据的权重。
本申请第六方面,提供了一种模型训练装置,用于执行上述第三方面中的方法。具体地,该模型训练装置包括用于执行上述第三方面的任意可能的实现方式中的方法的模块,如:获取模块和训练模块。
本申请第七方面提供一种计算机设备,该计算机设备包括处理器、内存和存储有计算机程序的计算机可读存储介质;处理器与计算机可读存储介质耦合,处理器上运行的计算机执行指令,当计算机执行指令被处理器执行时,处理器执行如上述第一方面或第一方面任意一种可能的实现方式的方法、上述第二方面或第二方面任意一种可能的实现方式的方法或上述第三方面的方法。可选地,该计算机设备还可以包括输入/输出(input/output,I/O)接口,该存储有计算机程序的计算机可读存储介质可以是存储器。
本申请第八方面提供一种存储一个或多个计算机执行指令的计算机可读存储介质,当计算机执行指令被处理器执行时,处理器执行如上述第一方面或第一方面任意一种可能的实现方式的方法、上述第二方面或第二方面任意一种可能的实现方式的方法或上述第三方面的方法。
本申请第九方面提供一种存储一个或多个计算机执行指令的计算机程序产品,当计算机执行指令被处理器执行时,处理器执行如上述第一方面或第一方面任意一种可能的实现方式的方法、上述第二方面或第二方面任意一种可能的实现方式的方法或上述第三方面的方法。
本申请第十方面提供一种数据处理系统,包括数据处理装置和模型训练装置,该数据处理系统用于执行如上述第一方面或第一方面任意一种可能的实现方式的方法、上述第二方面或第二方面任意一种可能的实现方式的方法或上述第三方面的方法。
具体的,数据处理装置用于获取目标用户的用户数据;将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值;模型训练装置用于获取样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项;基于样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;其中,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿,价值空间值用于表示样本用户的消费能力,消费意愿值用于表示样本用户的消费意愿。
本申请第十一方面提供一种计算设备集群,该计算设备集群包括至少一个计算设备,每个计算设备包括处理器和存储器;至少一个计算设备的处理器用于执行如上述第一方面或第一方面任意一种可能的实现方式的方法、上述第二方面或第二方面任意一种可能的实现方式的方法或上述第三方面的方法。
本申请第十二方面提供一种包含指令的计算机程序产品,当指令被计算设备集群运行时,使得计算设备集群执行如上述第一方面或第一方面任意一种可能的实现方式的方法、上述第二方面或第二方面任意一种可能的实现方式的方法或上述第三方面的方法。
本申请第十三方面一种计算机可读存储介质,该计算机可读存储介质包括计算机程序指令,当计算机程序指令由计算设备集群执行时,计算设备集群执行如上述第一方面或第一方面任意一种可能的实现方式的方法、上述第二方面或第二方面任意一种可能的实现方式的方法或上述第三方面的方法。
本申请第十四方面提供了一种芯片系统,该芯片系统包括至少一个处理器和接口,该接口用于接收数据和/或信号,至少一个处理器用于支持计算机设备实现执行如上述第一方面或第一方面任意一种可能的实现方式、上述第二方面或第二方面任意一种可能的实现方式或上述第三方面所涉及的功能。在一种可能的设计中,芯片系统还可以包括存储器,存储器,用于保存计算机设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。
本申请实施例中,通过获取目标用户的用户数据,将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值,其中,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿,由此快速的确定出客户的消费能力或消费意愿,提供更多的指标给企业的销售获客人员,从而快速的确定出跟进客户,提高跟进效率。
附图说明
图1为用户数据的获取示意图;
图2为企业的运营流程示意图;
图3为本申请实施例提供的模型训练方法的一实施例示意图;
图4-7为本申请实施例提供的模型训练方法的流程示意图;
图8为本申请实施例提供的模型训练方法的另一实施例示意图;
图9为本申请实施例提供的模型训练方法的流程示意图;
图10为本申请实施例提供的数据处理方法的一实施例示意图;
图11为本申请实施例提供的数据处理方法的流程示意图;
图12为本申请实施例提供的第一模型的示意图;
图13为本申请实施例提供的第二模型的示意图;
图14为本申请实施例提供的数据展示的示意图;
图15为本申请实施例提供的数据处理装置的一实施例示意图;
图16-17为本申请实施例提供的模型训练装置的实施例示意图;
图18-19为本申请实施例提供的计算机设备的实施例示意图;
图20为本申请实施例提供的数据处理系统的一实施例示意图;
图21为本申请实施例提供的计算设备的一实施例示意图;
图22-23为本申请实施例提供的计算设备集群的实施例示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。本领域普通技术人员可知,随着技术发展和新场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本申请,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本申请同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本申请的主旨。
本申请实施例提供一种数据处理方法和模型训练方法,用于提供客户的相关指标,以提高企业的销售获客人员的客户跟进效率。本申请实施例还提供了相应的数据处理装置、模型训练装置、数据处理系统、计算机可读存储介质、芯片系统及计算机程序产品等。以下分别进行详细说明。
下面对本申请实施例涉及的应用场景进行举例说明。
如图1所示,企业一般通过举办活动、线下拜访、用户注册账号和消费者访谈等方式获取客户资料(上述客户资料对应的客户,例如企业用户或者个人用户,也可以称为销售线索),并在企业关系管理系统(customer relationship management,CRM)来对客户资料进行历史积累,企业的销售获客人员在CRM中获取到这些线索,后续经过持续跟进,可转化为销售机会。
如图2所示,为了获取新的客户,企业的运营流程一般依次分为以下5个步骤:获客、激活、留存、营收、推荐。基于准确的获客结果,可以更高效、准确地实现线索激活,为接下来的各运营模块打下坚实的基础。随着云计算的高速发展,企业可以通过云上每日实时获取、接入大量的线索,因此需设计合理的线索定级决策系统,用于高效地线索定级分发、客户激活流转,帮助销售获客人员获取更多的价值线索。
示例性的,在云服务的获客场景中,企业可以通过云上获取到大量客户信息、以及客户购买、使用云服务的历史数据,这些线索经过线索定级决策系统后,可以提供这些线索的指标给销售获客人员,销售获客人员基于这些客户的指标就可以快速的确定出需要跟进的客户(线索),提高跟进效率。
下面结合上述应用场景对本申请实施例提供的数据处理方法和模型训练方法进行详细说明。
为了得到数据处理方法中的第一模型和第二模型,需要先对第一模型和第二模型进行训练。
如图3所示,为了训练第一模型,本申请实施例提供的模型训练方法的一实施例包括:
301、获取样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项。
以计算机设备执行为例,在训练初始模型时,需要先获取到样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项,获取用户数据的方式可以是通过云服务器获取。
其中,价值空间值用于表示样本用户的消费能力,消费意愿值用于表示样本用户的消费意愿,价值空间值和消费意愿值可以是技术人员和销售获客人员结合实际情况给出的值,例如消费意愿值归一化到0-1之间,消费意愿值为0时表样本示用户没有消费意愿,消费意愿值为1表示样本用户的消费意愿最强烈,更具体的,当样本用户在过去一年的消费次数高于50次,则消费意愿值确定为1,样本用户在过去一年的消费次数少于5次,则消费意愿值确定为0;价值空间值可以直接取样本用户过去一年的消费金额,以元或者万元为单位。应理解,当本申请实施例提供的数据处理方法和模型训练方法应用在云服务的获客场景中时,则上述样本用户的消费意愿或消费金额为对云服务的消费所记录的值,具体的,消费金额可以为对所有不同服务商提供的云服务或相关服务进行消费的消费金额。
302、基于样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型。
计算机设备获取到上述数据后,就可以基于这些数据对初始模型进行训练,得到目标模型,其中,初始模型可以为神经网络模型或树模型等,以神经网络模型为例,从初始模型训练得到目标模型的过程就是通过不断迭代,使神经网络模型中的目标函数收敛的过程。该目标模型为后续数据处理方法中所使用到的第一模型。
计算机设备获取到的数据存在多种可能的情况和不同的实现方式,下面分别进行说明:
实现方式1.1、获取用户数据和价值空间值
如图4所示,计算机设备获取用户数据,该用户数据为静态数据,具体为云上用户(也可以称为历史用户,即云上用户的历史数据)的静态信息数据,然后对静态数据进行特征加工处理。
得到加工处理后的静态数据和用户输入的对应的价值空间值后,就可以构建初始模型,进行模型训练,其中模型训练时静态数据和价值空间值是对应的,例如使用用户A的静态数据和用户A的价值空间值进行训练,使用用户B的静态数据和用户B的价值空间值进行训练,经过大量用户的静态数据和价值空间值训练后,模型实现收敛,得到目标模型,即第一模型,也可以称为价值空间预测模型。
实现方式1.2、获取用户数据和消费意愿值
如图5所示,计算机设备获取用户数据,该用户数据为行为数据,具体为云上用户(也可以称为历史用户,即云上用户的历史数据)的行为数据,然后对行为数据进行特征加工处理。
得到加工处理后的行为数据和用户输入的对应的消费意愿值后,就可以构建初始模型,进行模型训练,其中模型训练时行为数据和消费意愿值是对应的,例如使用用户A的行为数据和用户A的消费意愿值进行训练,使用用户B的行为数据和用户B的消费意愿值进行训练,经过大量用户的行为数据和消费意愿值训练后,模型实现收敛,得到目标模型,即第一模型,也可以称为消费意愿预测模型。
实现方式1.3、获取用户数据、价值空间值和消费意愿值
实现方式1.3相当于同时执行实现方式1.1和实现方式1.2,此时的用户数据包括静态数据和行为数据,训练得到价值空间预测模型和消费意愿预测模型,这两个模型合并为第一模型,具体实现方式可以参照上述实现方式,本申请实施例不再赘述。
可选的,样本用户为企业用户或个人用户中的任一项,则计算机设备获取到的数据也存在多种可能的情况和不同的实现方式,下面分别进行说明:
实现方式2.1、获取个人用户的用户数据和价值空间值
实现方式2.2、获取企业用户的用户数据和价值空间值
实现方式2.1和实现方式2.2可以单独进行,也可以同时进行,以同时进行为例,如图6所示,首先获取线索历史特征数据,即静态数据,该静态数据包括云上用户的注册信息,根据注册信息可以区分出该用户数据对应的用户是个人用户还是企业用户。
当用户数据为个人用户的静态数据,获取用户数据中个人用户填入的基本信息,比如年龄、学历、性别等信息,如果个人用户填写了所属公司,则加入企业基础信息,然后进行特征加工,在特征加工阶段,可获取消费场景信息,例如消费场景信息为云服务的消费场景(上云消费场景),可以通过数理统计方法从用户数据中识别出与上云场景相关度较高的职业类型、学校专业等特征作为目标数据,赋予此类特征更高的权重,即初始模型训练时,目标数据的权重高于用户数据中除目标数据外的数据的权重,然后构建初始模型进行训练,得到目标模型,即第一模型,也可以称为个人用户的价值空间预测模型。
当用户数据为企业用户的静态数据,获取用户数据中企业的基本信息、注册资本、软著、应用程序(application,APP)等信息,进行特征加工,在特征加工阶段,可通过关键词提取、相似度计算等方法提取企业特征中与上云场景相关度较高的特征作为目标数据,赋予此类特征更高的权重;然后构建初始模型进行训练,得到目标模型,即第一模型,也可以称为企业用户的价值空间预测模型。
最终得到的个人用户的价值空间预测模型和企业用户的价值空间预测模型可以合并为价值空间预测模型。
实现方式2.3、获取个人用户的用户数据和消费意愿值
实现方式2.4、获取企业用户的用户数据和消费意愿值
实现方式2.3和实现方式2.4可以单独进行,也可以同时进行,以同时进行为例,如图7所示,首先获取历史用户的注册信息(基础信息)和历史用户的行为信息数据,并添加历史用户的电话、现场拜访等记录(如没有则为空),将上述数据作为行为数据,根据行为数据中云上用户的注册信息,区分出该用户数据对应的用户是个人用户还是企业用户。
当用户数据为个人用户的行为数据,进行加工处理,基于语音处理、文本分类等技术筛选出与上云消费相关的主要特征作为目标数据,赋予此类特征更高的权重,然后构建初始模型进行训练,得到目标模型,即第一模型,也可以称为个人用户的消费意愿预测模型。
当用户数据为企业用户的行为数据,在行为数据中添加企业用户的实时舆情或新闻数据(没有则不添加),基于文本处理、关键词提取、知识图谱分析等方法从行为数据中筛选出与上云消费相关度较高的特征作为目标数据,赋予此类特征更高的权重,然后构建初始模型进行训练,得到目标模型,即第一模型,也可以称为企业用户的消费意愿预测模型。
最终得到的个人用户的消费意愿预测模型和企业用户的消费意愿预测模型可以合并为消费意愿预测模型。
实现方式2.5、获取个人用户的用户数据、价值空间值和消费意愿值
实现方式2.6、获取企业用户的用户数据、价值空间值和消费意愿值
实现方式2.5相当于同时执行实现方式2.1和实现方式2.2,实现方式2.6相当于同时执行实现方式2.3和实现方式2.4,实现方式2.5和实现方式2.6可以单独进行,也可以同时进行,以同时进行为例,此时的用户数据包括个人用户的静态数据、个人用户的行为数据、企业用户的静态数据和企业用户的行为数据,训练得到价值空间预测模型和消费意愿预测模型,这两个模型合并为第一模型,具体实现方式可以参照上述实现方式,本申请实施例不再赘述。
应理解,在使用得到的目标模型时,目标模型的输入为用户数据,输出为价值空间值和/或消费意愿值的预测值。
如图8所示,为了训练第二模型,本申请实施例提供的模型训练方法的另一实施例包括:
801、获取样本用户的线索等级值,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项。
802、基于样本用户的线索等级值,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型。
以计算机设备执行为例,在训练初始模型时,需要先获取到样本用户的线索等级值,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项,获取上述数据的方式可以是通过云服务器获取。
其中,价值空间值用于表示样本用户的消费能力,消费意愿值用于表示样本用户的消费意愿,线索等级值用于表示目标用户的评价等级,价值空间值和消费意愿值可以参考前述实施例相应的描述,线索等级值可以是基于用户的各项指标(例如价值空间值、消费意愿值等),给出用户的最终评级等级,例如可以将用户分为10个等级,等级越高,则表示该用户越值得去跟进。
用于训练的数据可以为价值空间值和线索等级值,也可以为消费意愿值和线索等级值,还可以为价值空间值、消费意愿值和线索等级值,以训练用的数据包括价值空间值、消费意愿值和线索等级值为例,如图9所示,计算机设备获取到上述数据后,就可以基于这些数据进行特征加工和处理,然后对初始模型进行训练,得到目标模型,该目标模型可以被称为线索等级预测模型。
应理解,在使用得到的目标模型时,目标模型的输入为价值空间值和/或消费意愿值,输出为线索等级值的预测值。
其中,初始模型可以为神经网络模型或树模型等,以神经网络模型为例,从初始模型训练得到目标模型的过程就是通过不断迭代,使神经网络模型中的目标函数收敛的过程。该目标模型为后续数据处理方法中所使用到的第二模型。
总结上述实施例可见,本申请实施例提供的模型训练方法可以带来包括但不限于以下3点有益效果:
(1)训练得到的目标模型可以预测出用户的价值空间值、消费意愿值和/或线索等级值,从而提供更多的指标给企业的销售获客人员,从而快速的确定出跟进客户,提高跟进效率。
(2)将企业用户和个人用户分开进行训练,提升模型预测的准确率。
(3)与消费场景信息相关的数据的训练权重更高,进一步提升模型预测的准确率。
如图10所示,本申请实施例提供的数据处理方法的一实施例包括:
1001、获取目标用户的用户数据。
1002、将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值。
1003、将价值空间预测值和/或消费意愿预测值输入至预先训练好的第二模型,得到目标用户的线索等级预测值。
以计算机设备执行为例,如图11所示,计算机设备先获取到目标用户的用户数据,其中获取用户数据的方式可以是通过云服务器获取,用户数据包括静态数据(线索静态信息)和/或行为数据(线索行为信息),然后对用户数据进行特征加工,将经过特征加工后的用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值,进一步的还可以将价值空间预测值和/或消费意愿预测值输入至预先训练好的第二模型,得到目标用户的线索等级预测值,最终得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值,以及目标用户的线索等级预测值,并进行输出或展示。
其中,目标用户可以为多个用户,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿,线索等级预测值用于表示目标用户的评价等级,具体来说,价值空间值用于表征目标用户的总体潜在消费能力,以元或万元为单位,消费意愿值用于表征目标用户进行消费的意愿大小,归一化到0-1之间,0表示没有意愿,1表示意愿最强烈,线索等级值为基于目标用户的各项指标(例如价值空间、消费意愿等)预测给出目标用户的最终评级等级,线索等级值越高表示目标客户更为优质。
本申请实施例提供的数据处理方法可以与前述模型训练方法对应,即数据处理方法为模型训练方法中得到的目标模型的具体应用过程,该数据处理方法也可以对应至上述实现方式1.1至实现方式2.6。
具体的,当目标用户的用户数据,即第一模型的输入为静态数据时,该第一模型为模型训练方法中实现方式1.1训练得到的目标模型,第一模型的输出为价值空间预测值。当目标用户的用户数据,即第一模型的输入为行为数据时,该第一模型为模型训练方法中实现方式1.2训练得到的目标模型,第一模型的输出为消费意愿预测值。当目标用户的用户数据包括静态数据和行为数据,即第一模型的输入为静态数据和行为数据时,该第一模型为模型训练方法中实现方式1.3训练得到的目标模型,第一模型的输出为价值空间预测值和消费意愿预测值。
可选的,目标用户包括个人用户和企业用户,第一模型包括分别经过个人用户的用户数据,以及企业用户的用户数据单独训练得到的两种模型。
具体的,当目标用户为个人用户,且用户数据,即第一模型的输入为静态数据时,该第一模型为模型训练方法中实现方式2.1训练得到的目标模型,第一模型的输出为个人用户的价值空间预测值。当目标用户为企业用户,且用户数据,即第一模型的输入为静态数据时,该第一模型为模型训练方法中实现方式2.2训练得到的目标模型,第一模型的输出为企业用户的价值空间预测值。
当目标用户为个人用户,且用户数据,即第一模型的输入为行为数据时,该第一模型为模型训练方法中实现方式2.3训练得到的目标模型,第一模型的输出为个人用户的消费意愿预测值。当目标用户为企业用户,且用户数据,即第一模型的输入为行为数据时,该第一模型为模型训练方法中实现方式2.4训练得到的目标模型,第一模型的输出为企业用户的消费意愿预测值。
当目标用户为个人用户,且用户数据包括静态数据和行为数据,即第一模型的输入为静态数据和行为数据时,该第一模型为模型训练方法中实现方式2.5训练得到的目标模型,第一模型的输出为个人用户的价值空间预测值和消费意愿预测值。当目标用户为企业用户,且用户数据包括静态数据和行为数据,即第一模型的输入为静态数据和行为数据时,该第一模型为模型训练方法中实现方式2.6训练得到的目标模型,第一模型的输出为企业用户的价值空间预测值和消费意愿预测值。
应理解,在获取到用户数据时,需要对用户数据进行特征加工,特征加工的具体方法与对应的模型训练方法中的特征加工方法相同,本申请实施例不再赘述。
可选的,第一模型包括价值空间预测模型和消费意愿预测模型,其中价值空间预测模型包括个人用户的价值空间预测模型和企业用户的价值空间预测模型,消费意愿预测模型包括个人用户的消费意愿预测模型和企业用户的消费意愿预测模型。
示例性的,如图12所示,获取到用户数据后,判断用户数据的用户类型和数据类型,即判断用户数据对应的目标用户为个人用户还是企业用户,并判断用户数据为静态数据还是行为数据(静态数据和行为数据中的一项可以为空,也可以同时包括静态数据和行为数据),应理解,这里的判断过程可以是计算机设备执行,也可以是人为预先执行的,即预先确定好用户数据的用户类型和数据类型,然后根据不同的用户类型和数据类型将用户数据输入第一模型内不同的模型,例如用户数据为个人用户的静态数据和行为数据时,将用户数据分别输入个人用户的价值空间预测模型和个人用户的消费意愿预测模型,得到该个人用户的价值空间值和消费意愿值。
进一步的,得到目标用户的价值空间预测值和/或消费意愿预测值后,可以继续输入至第二模型,得到目标用户的线索等级预测值,第二模型包括基于线索等级值和价值空间值训练得到的模型、基于线索等级值和消费意愿值训练得到的模型以及基于线索等级值、价值空间值和消费意愿值训练得到的模型。
示例性的,如图13所示,当第二模型的输入为价值空间预测值时,则将价值空间预测值输入至第二模型中基于线索等级值和价值空间值训练得到的模型,当第二模型的输入为消费意愿预测值时,则将消费意愿预测值输入至第二模型中基于线索等级值和消费意愿值训练得到的模型,当第二模型的输入为价值空间预测值和消费意愿预测值时,则将价值空间预测值和消费意愿预测值输入至第二模型中基于线索等级值、价值空间值和消费意愿值训练得到的模型。
应理解,本申请实施例中提供的价值空间预测值和消费意愿预测值作为指标,可以进行替换或追加,例如追加信用等级预测值,第一模型中还包括基于样本用户的付费记录、扣费成功率等用户数据进行特征加工和训练得到的模型,即第一模型在应用时可以输出目标用户的信用等级预测值,此时第二模型中也可以包括基于样本用户的信用等级值、价值空间值和消费意愿值训练得到的模型,即第二模型输出的线索等级预测值还耦合了信用等级预测值,从而进一步提升线索等级值的准确度。
1004、基于价值空间预测值和/或消费意愿预测值从大到小的顺序展示目标用户。
1005、展示重点用户,重点用户为价值空间预测值和/或消费意愿预测值高于预设阈值的目标用户。
在得到多个目标用户的价值空间预测值和/或消费意愿预测值后,可以基于价值空间预测值和/或消费意愿预测值从大到小的顺序展示目标用户,并用其他方式展示重点用户,重点用户为价值空间预测值和/或消费意愿预测值高于预设阈值的目标用户。
示例性的,如图14所示,得到了用户A的价值空间预测值为1万,用户B的消费意愿预测值为0.5,用户C、用户D和用户E的价值空间预测值和消费意愿预测值分别为10万;0.1、100万;0.8以及0万;0.9,那么分别基于消费意愿预测值和价值空间值对用户A-用户E进行展示,并对消费意愿预测值大于0.7的用户,以及价值空间预测值大于或等于50万的用户用其他方式展示,例如高亮显示和放大显示。
可选的,还可以展示目标用户的线索等级值,例如获取用户A-用户E的线索等级值后,基于线索等级值从大到小的顺序对用户A-用户E进行展示,并用其他方式展示重点用户。
企业的销售获客人员通过对目标用户的价值空间预测值、消费意愿预测值和/或线索等级值的观察,可以精细化筛选消费能力和消费意愿强的高质量客户,根据自己的销售目标选择合适的客户,进而可通过现场拜访、发放优惠券等行为进行优质用户的吸引。例如目标用户的价值空间预测值高、消费意愿预测值低,销售获客人员可以通过电话、现场拜访等促成用户在云上消费;例如目标用户的价值空间预测值高、消费意愿预测值高,销售获客人员可以通过定期回访等行为使得目标用户在云上持续消费,进一步提升用户粘性。
应理解,本申请实施例对上述步骤1004和步骤1005的执行先后顺序不作限定,且步骤1004和步骤1005为可选步骤,可以单独执行、同时执行或不执行。
本申请实施例提供的数据处理方法可以参照上述模型训练方法相应的说明进行理解,本申请实施例不再赘述。
总结上述实施例可见,本申请实施例提供的模型训练方法和数据处理方法可以带来包括但不限于以下3点有益效果:
(1)基于用户数据可以确定出客户的消费能力预测值、消费意愿预测值和/或线索等级预测值,提供更多的指标给企业的销售获客人员,便于进行全面的线索洞察,从而快速的确定出跟进客户,提高跟进效率。
(2)将目标用户分为个人用户和企业用户,可以提升模型预测的准确率。
(3)基于客户的消费能力预测值、消费意愿预测值和/或线索等级预测值进行不同的展示,方便销售获客人员快速确定出需要跟进的客户,进一步提高跟进效率。
以上介绍了本申请实施例提供的数据处理方法和模型训练方法,下面结合附图介绍本申请实施例提供的相关设备。
如图15所示,本申请实施例提供的数据处理装置1500的一实施例包括:
获取模块1501,用于获取目标用户的用户数据;该获取模块1501可以执行上述方法实施例中的步骤1001。
第一处理模块1502,用于将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值;其中,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿。该第一处理模块1502可以执行上述方法实施例中的步骤1002。
本申请实施例中,获取模块1501通过获取目标用户的用户数据第一处理模块1502,将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值,其中,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿,由此快速的确定出客户的消费能力或消费意愿,提供更多的指标给企业的销售获客人员,从而快速的确定出跟进客户,提高跟进效率。
可选的,该数据处理装置1500还包括第二处理模块1503,第二处理模块1503用于将价值空间预测值和/或消费意愿预测值输入至预先训练好的第二模型,得到目标用户的线索等级预测值;其中,线索等级预测值用于表示目标用户的评价等级。
可选的,用户数据包括静态数据和/或行为数据;第一模型的输入为静态数据时,第一模型的输出为价值空间预测值;第一模型的输入为行为数据时,第一模型的输出为消费意愿预测值。
可选的,目标用户包括个人用户和企业用户,第一模型包括分别经过个人用户的用户数据,以及企业用户的用户数据单独训练得到的两种模型。
可选的,该数据处理装置1500还包括第一展示模块1504,第一展示模块1504用于基于价值空间预测值和/或消费意愿预测值从大到小的顺序展示目标用户。
可选的,该数据处理装置1500还包括第二展示模块1505,第二展示模块1505用于展示重点用户,重点用户为价值空间预测值和/或消费意愿预测值高于预设阈值的目标用户。
其中,获取模块1501、第一处理模块1502、第二处理模块1503、第一展示模块1504和第二展示模块1505均可以通过软件实现,或者可以通过硬件实现。示例性的,接下来以获取模块1501为例,介绍获取模块1501的实现方式。类似的,第一处理模块1502、第二处理模块1503、第一展示模块1504和第二展示模块1505的实现方式可以参考获取模块1501的实现方式。
模块作为软件功能单元的一种举例,获取模块1501可以包括运行在计算实例上的代码。其中,计算实例可以包括物理主机(计算设备)、虚拟机、容器中的至少一种。进一步地,上述计算实例可以是一台或者多台。例如,获取模块1501可以包括运行在多个主机/虚拟机/容器上的代码。需要说明的是,用于运行该代码的多个主机/虚拟机/容器可以分布在相同的区域(region)中,也可以分布在不同的region中。进一步地,用于运行该代码的多个主机/虚拟机/容器可以分布在相同的可用区(availability zone,AZ)中,也可以分布在不同的AZ中,每个AZ包括一个数据中心或多个地理位置相近的数据中心。其中,通常一个region可以包括多个AZ。
同样,用于运行该代码的多个主机/虚拟机/容器可以分布在同一个虚拟私有云(virtual private cloud,VPC)中,也可以分布在多个VPC中。其中,通常一个VPC设置在一个region内,同一region内两个VPC之间,以及不同region的VPC之间跨区通信需在每个VPC内设置通信网关,经通信网关实现VPC之间的互连。
模块作为硬件功能单元的一种举例,获取模块1501可以包括至少一个计算设备,如服务器等。或者,获取模块1501也可以是利用专用集成电路(application-specificintegrated circuit,ASIC)实现、或可编程逻辑器件(programmable logic device,PLD)实现的设备等。其中,上述PLD可以是复杂程序逻辑器件(complex programmable logicaldevice,CPLD)、现场可编程门阵列(field-programmable gate array,FPGA)、通用阵列逻辑(generic array logic,GAL)或其任意组合实现。
获取模块1501包括的多个计算设备可以分布在相同的region中,也可以分布在不同的region中。获取模块1501包括的多个计算设备可以分布在相同的AZ中,也可以分布在不同的AZ中。同样,获取模块1501包括的多个计算设备可以分布在同一个VPC中,也可以分布在多个VPC中。其中,所述多个计算设备可以是服务器、ASIC、PLD、CPLD、FPGA和GAL等计算设备的任意组合。
需要说明的是,在其他实施例中,获取模块1501可以用于执行数据处理方法中的任意步骤,第一处理模块1502、第二处理模块1503、第一展示模块1504和第二展示模块1505也可以用于执行数据处理方法中的任意步骤,获取模块1501、第一处理模块1502、第二处理模块1503、第一展示模块1504和第二展示模块1505负责实现的步骤可根据需要指定,通过获取模块1501、第一处理模块1502、第二处理模块1503、第一展示模块1504和第二展示模块1505分别实现数据处理方法中不同的步骤来实现数据处理装置的全部功能。
如图16所示,本申请实施例提供的模型训练装置1600的一实施例包括:
第一获取模块1601,用于获取样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项;该获取模块1601可以执行上述方法实施例中的步骤301。
训练模块1602,用于基于样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;其中,价值空间值用于表示样本用户的消费能力,消费意愿值用于表示样本用户的消费意愿。该训练模块1602可以执行上述方法实施例中的步骤302。
本申请实施例中,通过训练模块1602训练得到的目标模型可以预测出用户的价值空间值和/或用户的消费意愿值,从而提供更多的指标给企业的销售获客人员,从而快速的确定出跟进客户,提高跟进效率。
可选的,样本用户为企业用户或个人用户中的任一项。
可选的,该模型训练装置1600还包括第二获取模块1603,第二获取模块1603用于获取消费场景信息;从用户数据中获取与消费场景信息相关的目标数据;初始模型训练时,目标数据的权重高于用户数据中除目标数据外的数据的权重。
其中,第一获取模块1601、训练模块1602和第二获取模块1603的实现方式可以参考第一获取模块1501的实现方式。
如图17所示,本申请实施例提供的模型训练装置1700的一实施例包括:
获取模块1701,用于获取样本用户的线索等级值,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项;该获取模块1701可以执行上述方法实施例中的步骤801。
训练模块1702,用于基于样本用户的线索等级值,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;其中,价值空间值用于表示样本用户的消费能力,消费意愿值用于表示样本用户的消费意愿,线索等级值用于表示目标用户的评价等级。该训练模块1702可以执行上述方法实施例中的步骤802。
本申请实施例中,通过训练模块1702训练得到的目标模型可以预测出用户的线索等级值,从而提供更多的指标给企业的销售获客人员,从而快速的确定出跟进客户,提高跟进效率。
其中,获取模块1701和训练模块1702的实现方式可以参考第一获取模块1501的实现方式。
图18所示,为本申请的实施例提供的计算机设备1800的一种可能的逻辑结构示意图。计算机设备1800包括:处理器1801、通信接口1802、存储器1803以及总线1804,该处理器1801可以包括CPU,或者,CPU与GPU和NPU和其他类型的处理器中的至少一个。处理器1801、通信接口1802以及存储器1803通过总线1804相互连接。在本申请的实施例中,处理器1801用于对计算机设备1800的动作进行控制管理,例如,处理器1801用于执行图3中的步骤301至302,以及图8中的步骤801至802,以及图10中的步骤1001至1005和/或用于本文所描述的技术的其他过程。通信接口1802用于支持计算机设备1800进行通信。存储器1803,用于存储计算机设备1800的程序代码和数据。
其中,处理器1801可以是中央处理器单元,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理器和微处理器的组合等等。总线1804可以是外设部件互连标准(PeripheralComponent Interconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图18中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
如图19所示,本申请实施例提供的计算机设备1900的一种可能的逻辑结构示意图。该计算机设备1900包括:硬件层1901和虚拟机(virtual machine,VM)层1902,该VM层可以包括一个或多个VM。该硬件层1901为VM提供硬件资源,支撑VM运行,该VM的功能和与本申请相关的过程可以参阅上述图3至图14中的方法相应描述进行理解。该硬件层1901包括处理器、通信接口以及存储器等硬件资源。该处理器可以包括CPU,或者,CPU与GPU和NPU中的至少一个。
在本申请的另一实施例中,还提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机执行指令,当设备的至少一个处理器执行该计算机执行指令时,设备执行上述图3至图14部分实施例所描述的模型训练方法或数据处理方法。
在本申请的另一实施例中,还提供一种计算机程序产品,该计算机程序产品包括计算机执行指令,该计算机执行指令存储在计算机可读存储介质中;设备的至少一个处理器可以从计算机可读存储介质读取该计算机执行指令,至少一个处理器执行该计算机执行指令使得设备执行上述图3至图14部分实施例所描述的模型训练方法或数据处理方法。
在本申请的另一实施例中,还提供一种芯片系统,该芯片系统包括至少一个处理器和接口,该接口用于接收数据和/或信号,至少一个处理器用于支持实现上述图3至图14部分实施例所描述的模型训练方法或数据处理方法。在一种可能的设计中,芯片系统还可以包括存储器,存储器,用于保存计算机设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。
本申请还提供一种数据处理系统2000,如图20所示,包括:
数据处理装置2001,用于获取目标用户的用户数据;将用户数据输入至预先训练好的第一模型,得到目标用户的价值空间预测值和/或目标用户的消费意愿预测值;
模型训练装置2002,用于获取样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项;基于样本用户的用户数据,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;
其中,价值空间预测值用于表示目标用户的消费能力,消费意愿预测值用于表示目标用户的消费意愿,价值空间值用于表示样本用户的消费能力,消费意愿值用于表示样本用户的消费意愿。
可选的,模型训练装置2002还用于获取样本用户的线索等级值,以及样本用户的价值空间值或样本用户的消费意愿值中的至少一项;基于样本用户的线索等级值,以及样本用户的价值空间值或样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;
其中,线索等级值用于表示目标用户的评价等级。
数据处理装置2001和模型训练装置2002的实现方式可以参考第一获取模块1501的实现方式。
本申请还提供一种计算设备100。如图21所示,计算设备100包括:总线102、处理器104、存储器106和通信接口108。处理器104、存储器106和通信接口108之间通过总线102通信。计算设备100可以是服务器或终端设备。应理解,本申请不限定计算设备100中的处理器、存储器的个数。
存储器106中存储有可执行的程序代码,处理器104执行该可执行的程序代码以实现上述图3至图14部分实施例所描述的模型训练方法或数据处理方法。具体的,存储器106上存有用于执行上述图3至图14部分实施例所描述的模型训练方法或数据处理方法的指令。
该计算机设备100的实现方式可以参考计算机设备1800的实现方式。
本申请实施例还提供了一种计算设备集群。该计算设备集群包括至少一台计算设备。该计算设备可以是服务器,例如是中心服务器、边缘服务器,或者是本地数据中心中的本地服务器。在一些实施例中,计算设备也可以是台式机、笔记本电脑或者智能手机等终端设备。
如图22所示,所述计算设备集群包括至少一个计算设备100,计算设备集群中的一个或多个计算设备100中的存储器106中可以存有相同的用于执行上述图3至图14部分实施例所描述的模型训练方法或数据处理方法的指令。
在一些可能的实现方式中,该计算设备集群中的一个或多个计算设备100也可以用于执行上述图3至图14部分实施例所描述的模型训练方法或数据处理方法的部分指令。换言之,一个或多个计算设备100的组合可以共同执行上述图3至图14部分实施例所描述的模型训练方法或数据处理方法。
需要说明的是,计算设备集群中的不同的计算设备100中的存储器106可以存储不同的指令,分别用于执行数据处理装置的部分功能。也即,不同的计算设备100中的存储器106存储的指令可以实现获取模块、第一处理模块、第二处理模块、第一展示模块和第二展示模块中的一个或多个模块的功能。
在一些可能的实现方式中,计算设备集群中的一个或多个计算设备可以通过网络连接。其中,所述网络可以是广域网或局域网等等。图23示出了一种可能的实现方式。如图23所示,两个计算设备100A和100B之间通过网络进行连接。具体地,通过各个计算设备中的通信接口与所述网络进行连接。在这一类可能的实现方式中,计算设备100A中的存储器106中存有执行获取模块的功能的指令。同时,计算设备100B中的存储器106中存有执行第一处理模块、第二处理模块、第一展示模块和第二展示模块的功能的指令。
图23所示的计算设备集群之间的连接方式可以是考虑到本申请提供的数据处理方法需要大量的获取和存储数据,因此考虑将第一处理模块、第二处理模块、第一展示模块和第二展示模块实现的功能交由计算设备100B执行。
应理解,图23中示出的计算设备100A的功能也可以由多个计算设备100完成。同样,计算设备100B的功能也可以由多个计算设备100完成。
本申请实施例还提供了一种包含指令的计算机程序产品。所述计算机程序产品可以是包含指令的,能够运行在计算设备上或被储存在任何可用介质中的软件或程序产品。当所述计算机程序产品在至少一个计算机设备上运行时,使得至少一个计算机设备执行上述图3至图14部分实施例所描述的模型训练方法或数据处理方法。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-onlymemory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (17)

1.一种数据处理方法,其特征在于,包括:
获取目标用户的用户数据;
将所述用户数据输入至预先训练好的第一模型,得到所述目标用户的价值空间预测值和/或所述目标用户的消费意愿预测值;
其中,所述价值空间预测值用于表示所述目标用户的消费能力,所述消费意愿预测值用于表示所述目标用户的消费意愿。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述价值空间预测值和/或所述消费意愿预测值输入至预先训练好的第二模型,得到所述目标用户的线索等级预测值;
其中,所述线索等级预测值用于表示所述目标用户的评价等级。
3.根据权利要求1或2所述的方法,其特征在于,所述用户数据包括静态数据和/或行为数据;
所述第一模型的输入为所述静态数据时,所述第一模型的输出为所述价值空间预测值;
所述第一模型的输入为所述行为数据时,所述第一模型的输出为所述消费意愿预测值。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述目标用户包括个人用户和企业用户,所述第一模型包括分别经过所述个人用户的用户数据,以及所述企业用户的用户数据单独训练得到的两种模型。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:
基于所述价值空间预测值和/或所述消费意愿预测值从大到小的顺序展示所述目标用户。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:
展示重点用户,所述重点用户为价值空间预测值和/或消费意愿预测值高于预设阈值的目标用户。
7.一种模型训练方法,其特征在于,包括:
获取样本用户的用户数据,以及所述样本用户的价值空间值或所述样本用户的消费意愿值中的至少一项;
基于所述样本用户的用户数据,以及所述样本用户的价值空间值或所述样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;
其中,所述价值空间值用于表示所述样本用户的消费能力,所述消费意愿值用于表示所述样本用户的消费意愿。
8.根据权利要求7所述的方法,其特征在于,所述样本用户为企业用户或个人用户中的任一项。
9.根据权利要求7或8所述的方法,其特征在于,所述方法还包括:
获取消费场景信息;
从所述用户数据中获取与所述消费场景信息相关的目标数据;
所述初始模型训练时,所述目标数据的权重高于所述用户数据中除所述目标数据外的数据的权重。
10.一种模型训练方法,其特征在于,包括:
获取样本用户的线索等级值,以及所述样本用户的价值空间值或所述样本用户的消费意愿值中的至少一项;
基于所述样本用户的线索等级值,以及所述样本用户的价值空间值或所述样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;
其中,所述价值空间值用于表示所述样本用户的消费能力,所述消费意愿值用于表示所述样本用户的消费意愿,所述线索等级值用于表示所述目标用户的评价等级。
11.一种数据处理装置,其特征在于,包括:
获取模块,用于获取目标用户的用户数据;
第一处理模块,用于将所述用户数据输入至预先训练好的第一模型,得到所述目标用户的价值空间预测值和/或所述目标用户的消费意愿预测值;
其中,所述价值空间预测值用于表示所述目标用户的消费能力,所述消费意愿预测值用于表示所述目标用户的消费意愿。
12.一种模型训练装置,其特征在于,包括:
第一获取模块,用于获取样本用户的用户数据,以及所述样本用户的价值空间值或所述样本用户的消费意愿值中的至少一项;
训练模块,用于基于所述样本用户的用户数据,以及所述样本用户的价值空间值或所述样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;
其中,所述价值空间值用于表示所述样本用户的消费能力,所述消费意愿值用于表示所述样本用户的消费意愿。
13.一种模型训练装置,其特征在于,包括:
获取模块,用于获取样本用户的线索等级值,以及所述样本用户的价值空间值或所述样本用户的消费意愿值中的至少一项;
训练模块,用于基于所述样本用户的线索等级值,以及所述样本用户的价值空间值或所述样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;
其中,所述价值空间值用于表示所述样本用户的消费能力,所述消费意愿值用于表示所述样本用户的消费意愿,所述线索等级值用于表示所述目标用户的评价等级。
14.一种数据处理系统,其特征在于,包括:
数据处理装置,用于获取目标用户的用户数据;将所述用户数据输入至预先训练好的第一模型,得到所述目标用户的价值空间预测值和/或所述目标用户的消费意愿预测值;
模型训练装置,用于获取样本用户的用户数据,以及所述样本用户的价值空间值或所述样本用户的消费意愿值中的至少一项;基于所述样本用户的用户数据,以及所述样本用户的价值空间值或所述样本用户的消费意愿值的至少一项对初始模型进行训练,得到目标模型;
其中,所述价值空间预测值用于表示所述目标用户的消费能力,所述消费意愿预测值用于表示所述目标用户的消费意愿,所述价值空间值用于表示所述样本用户的消费能力,所述消费意愿值用于表示所述样本用户的消费意愿。
15.一种计算设备集群,其特征在于,包括至少一个计算设备,每个计算设备包括处理器和存储器;
所述至少一个计算设备的处理器用于执行所述至少一个计算设备的存储器中存储的指令,以使得所述计算设备集群执行如权利要求1-10中任一项所述的方法。
16.一种包含指令的计算机程序产品,其特征在于,当所述指令被计算设备集群运行时,使得所述计算设备集群执行如权利要求的1-10中任一项所述的方法。
17.一种计算机可读存储介质,其特征在于,包括计算机程序指令,当所述计算机程序指令由计算设备集群执行时,所述计算设备集群执行如权利要求1-10中任一项所述的方法。
CN202211246785.1A 2022-10-12 2022-10-12 一种数据处理方法、模型训练方法及相关设备 Pending CN117934064A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211246785.1A CN117934064A (zh) 2022-10-12 2022-10-12 一种数据处理方法、模型训练方法及相关设备
PCT/CN2023/116909 WO2024078195A1 (zh) 2022-10-12 2023-09-05 一种数据处理方法、模型训练方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211246785.1A CN117934064A (zh) 2022-10-12 2022-10-12 一种数据处理方法、模型训练方法及相关设备

Publications (1)

Publication Number Publication Date
CN117934064A true CN117934064A (zh) 2024-04-26

Family

ID=90668748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211246785.1A Pending CN117934064A (zh) 2022-10-12 2022-10-12 一种数据处理方法、模型训练方法及相关设备

Country Status (2)

Country Link
CN (1) CN117934064A (zh)
WO (1) WO2024078195A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9805378B1 (en) * 2012-09-28 2017-10-31 Google Inc. Use of user consumption time to rank media suggestions
CN107705155A (zh) * 2017-10-11 2018-02-16 北京三快在线科技有限公司 一种消费能力预测方法、装置、电子设备及可读存储介质
CN113095861A (zh) * 2020-01-08 2021-07-09 浙江大搜车软件技术有限公司 目标对象成交概率的预测方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2024078195A1 (zh) 2024-04-18

Similar Documents

Publication Publication Date Title
CN109583966B (zh) 一种高价值客户识别方法、系统、设备及存储介质
CN108681970A (zh) 基于大数据的理财产品推送方法、系统及计算机存储介质
CN105225135B (zh) 潜力客户识别方法以及装置
US20200234218A1 (en) Systems and methods for entity performance and risk scoring
CN107423613A (zh) 依据相似度确定设备指纹的方法、装置及服务器
CN112508694B (zh) 服务器处理资源额度申请的方法、装置及电子设备
CN111352962A (zh) 客户画像构建方法及装置
CN113393306A (zh) 产品推荐方法、装置、电子设备及计算机可读介质
CN111177473A (zh) 人员关系分析方法、装置和可读存储介质
US20200005270A1 (en) Transaction processing based on statistical classification and contextual analysis
CN113424207B (zh) 高效地训练可理解模型的系统和方法
CN113051480A (zh) 资源推送方法、装置、电子设备及存储介质
CN115983900A (zh) 用户营销策略的构建方法、装置、设备、介质和程序产品
CN117150138B (zh) 一种基于高维空间映射的科技资源组织方法及系统
CN110795638A (zh) 用于输出信息的方法和装置
CN117934064A (zh) 一种数据处理方法、模型训练方法及相关设备
CN112015970A (zh) 产品推荐方法、相关设备及计算机存储介质
CN115719183A (zh) 基于权重动态分级的电力客户自反馈服务评价方法及系统
CN115827994A (zh) 一种数据处理方法、装置、设备、存储介质
CN114741606A (zh) 企业推荐方法、装置、计算机可读介质及电子设备
CN113436023A (zh) 基于区块链的理财产品推荐方法及装置
CN110163482B (zh) 确定活动方案的安全方案数据的方法、终端设备及服务器
CN116630027A (zh) 一种信用卡推荐方法、装置、电子设备及存储介质
CN117290595A (zh) 一种数据推荐方法、装置、电子设备及计算机可读介质
CN115080860A (zh) 金融产品的推荐方法及装置、存储介质、电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication