CN110727857A - 针对业务对象识别潜在用户的关键特征的方法及装置 - Google Patents
针对业务对象识别潜在用户的关键特征的方法及装置 Download PDFInfo
- Publication number
- CN110727857A CN110727857A CN201910833794.2A CN201910833794A CN110727857A CN 110727857 A CN110727857 A CN 110727857A CN 201910833794 A CN201910833794 A CN 201910833794A CN 110727857 A CN110727857 A CN 110727857A
- Authority
- CN
- China
- Prior art keywords
- user
- consumption
- item
- service
- historical consumption
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Abstract
本发明公开了一种针对业务对象识别潜在用户的关键特征的方法及装置,涉及电子信息领域,包括:获取与业务对象相对应的历史消费记录,分别确定与各条历史消费记录相对应的历史消费用户;从用户属性数据库中获取历史消费用户的多维用户属性数据,并确定历史消费用户的消费频次,以生成多条样本数据;针对多条样本数据进行分析,以确定多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系;根据关联关系,从各个维度的用户属性中提取关键属性作为与业务对象相对应的潜在用户的关键特征。该方式能够挖掘潜在用户的关键特征,进而根据关键特征来识别潜在用户,从而为潜在用户的筛选提供了依据。
Description
技术领域
本发明涉及电子信息领域,具体涉及一种针对业务对象识别潜在用户的关键特征的方法及装置。
背景技术
随着大数据的发展,出现了很多智能推荐方法。例如,在现有技术中,专利申请号为201810395572.2的专利申请中公开了一种物品推荐方法和装置。该方法根据用户历史行为数据获取N个目标物品以及对应每个目标物品的推荐因子;根据N个目标物品获取多个推荐物品以及每个推荐物品对应的推荐值排序,从而根据推荐值高低选择合适的物品进行推荐。
但是,上述方式仅限于向用户推送物品的应用场景中。实际情况中,可能还需要针对物品确定与该物品相对应的潜在用户。例如,需要针对特定的业务对象,从众多候选用户中识别与该业务对象相匹配的潜在用户。其中,不同的业务对象具有不同的业务属性数据,另外,不同类型的用户也具有不同的用户属性数据。现有技术中尚无法有效挖掘业务属性数据中的各类业务属性值与用户属性数据中的各类用户属性值之间的关联关系。因此,无法快速高效地识别与业务对象相匹配的潜在用户。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种针对业务对象识别潜在用户的关键特征的方法及装置。
根据本发明的一个方面,提供了一种针对业务对象识别潜在用户的关键特征的方法,包括:
获取与业务对象相对应的各条历史消费记录,分别确定与各条历史消费记录相对应的各个历史消费用户;
从用户属性数据库中获取各个历史消费用户的多维用户属性数据,并确定各个历史消费用户的消费频次,根据各个历史消费用户的消费频次以及各个历史消费用户的多维用户属性数据生成多条样本数据;
针对所述多条样本数据进行分析,以确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系;
根据所述关联关系,从各个维度的用户属性中提取关键属性,将所述关键属性识别为与所述业务对象相对应的潜在用户的关键特征。
可选的,所述业务对象为业务提供端和/或业务项目;其中,所述业务提供端用于提供多个业务项目。
可选的,当所述业务对象为业务项目时,所述获取与业务对象相对应的各条历史消费记录包括:
接收所述业务项目对应的业务提供端发送的历史消费数据,从所述历史消费数据中筛选与所述业务项目相对应的历史消费记录;
根据筛选出的历史消费记录,获取与该业务项目相关联的项目描述信息,根据获取到的项目描述信息生成该业务项目的项目标识。
可选的,所述获取与该业务项目相关联的项目描述信息,根据获取到的项目描述信息生成该业务项目的项目标识具体包括:
分别从多个维度获取与该业务项目相关联的项目描述信息,根据多个维度的项目描述信息生成包含多个类目节点的项目标识;
其中,各个类目节点分别对应于各个维度;并且,所述项目标识中包含的各个类目节点之间呈树状层级结构。
可选的,所述针对所述多条样本数据进行分析,以确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系包括:
根据各个样本数据所对应的消费时段、和/或消费频次,为各个样本数据设置对应的样本权重;
根据各个样本数据的样本权重,确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系。
可选的,当所述业务对象为业务提供端时,所述为各个样本数据设置对应的样本权重进一步包括:
预先针对该业务提供端中包含的各个业务项目设置对应的项目权重;
分别针对各个样本数据,确定该样本数据所对应的业务项目,根据该样本数据所对应的业务项目的项目权重,为各个样本数据设置对应的样本权重;
其中,当业务项目的项目标识包含多个类目节点时,所述项目权重进一步包括对应于类目节点的类目权重。
可选的,所述将所述关键属性识别为与所述业务对象相对应的潜在用户的关键特征之后,进一步包括:
根据所述与所述业务对象相对应的潜在用户的关键特征,对候选用户群中的各个候选用户进行筛选;
根据筛选结果,从所述候选用户群中提取预设数量的用户,根据提取出的用户生成目标用户群。
可选的,所述从所述候选用户群中提取预设数量的用户包括:
根据预设的消费概率阈值、和/或目标人数阈值,从所述候选用户群中提取预设数量的用户。
根据本发明的另一个方面,提供了一种针对业务对象识别潜在用户的关键特征的装置,包括:
获取模块,适于获取与业务对象相对应的各条历史消费记录,分别确定与各条历史消费记录相对应的各个历史消费用户;
生成模块,适于从用户属性数据库中获取各个历史消费用户的多维用户属性数据,并确定各个历史消费用户的消费频次,根据各个历史消费用户的消费频次以及各个历史消费用户的多维用户属性数据生成多条样本数据;
分析模块,适于针对所述多条样本数据进行分析,以确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系;
识别模块,适于根据所述关联关系,从各个维度的用户属性中提取关键属性,将所述关键属性识别为与所述业务对象相对应的潜在用户的关键特征。
可选的,所述业务对象为业务提供端和/或业务项目;其中,所述业务提供端用于提供多个业务项目。
可选的,当所述业务对象为业务项目时,所述获取模块具体适于:
接收所述业务项目对应的业务提供端发送的历史消费数据,从所述历史消费数据中筛选与所述业务项目相对应的历史消费记录;
根据筛选出的历史消费记录,获取与该业务项目相关联的项目描述信息,根据获取到的项目描述信息生成该业务项目的项目标识。
可选的,所述获取模块具体适于:
分别从多个维度获取与该业务项目相关联的项目描述信息,根据多个维度的项目描述信息生成包含多个类目节点的项目标识;
其中,各个类目节点分别对应于各个维度;并且,所述项目标识中包含的各个类目节点之间呈树状层级结构。
可选的,所述分析模块具体适于:
根据各个样本数据所对应的消费时段、和/或消费频次,为各个样本数据设置对应的样本权重;
根据各个样本数据的样本权重,确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系。
可选的,当所述业务对象为业务提供端时,所述分析模块具体适于:
预先针对该业务提供端中包含的各个业务项目设置对应的项目权重;
分别针对各个样本数据,确定该样本数据所对应的业务项目,根据该样本数据所对应的业务项目的项目权重,为各个样本数据设置对应的样本权重;
其中,当业务项目的项目标识包含多个类目节点时,所述项目权重进一步包括对应于类目节点的类目权重。
可选的,所述识别模块进一步适于:
根据所述与所述业务对象相对应的潜在用户的关键特征,对候选用户群中的各个候选用户进行筛选;
根据筛选结果,从所述候选用户群中提取预设数量的用户,根据提取出的用户生成目标用户群。
可选的,所述识别模块具体适于:
根据预设的消费概率阈值、和/或目标人数阈值,从所述候选用户群中提取预设数量的用户。
依据本发明的再一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如上述的针对业务对象识别潜在用户的关键特征的方法对应的操作。
依据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述的针对业务对象识别潜在用户的关键特征的方法对应的操作。
在本发明提供的针对业务对象识别潜在用户的关键特征的方法及装置中,能够确定与业务对象相对应的各条历史消费记录所对应的各个历史消费用户,并从用户属性数据库中获取各个历史消费用户的多维用户属性数据,根据各个历史消费用户的消费频次以及各个历史消费用户的多维用户属性数据生成多条样本数据,从而根据样本数据确定多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系,进而从各个维度的用户属性中提取关键属性,作为与该业务对象相对应的潜在用户的关键特征。由此可见,本发明中的方式通过建立用户属性与消费记录之间的对应关系,能够挖掘与业务对象相对应的潜在用户的关键特征,进而根据关键特征来识别潜在用户,从而为潜在用户的筛选提供了依据,使得业务对象的推送对象更有针对性。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例一提供的一种针对业务对象识别潜在用户的关键特征的方法的流程图;
图2示出了本发明实施例二提供的一种针对业务对象识别潜在用户的关键特征的方法的流程图;
图3示出了本发明实施例三提供的一种针对业务对象识别潜在用户的关键特征的装置的结构图;
图4示出了本发明实施例五提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
图1示出了本发明实施例一提供的一种针对业务对象识别潜在用户的关键特征的方法的流程图。如图1所示,该方法包括:
步骤S110:获取与业务对象相对应的各条历史消费记录,分别确定与各条历史消费记录相对应的各个历史消费用户。
其中,业务对象可以为业务提供端(例如门店端),也可以为业务项目,本发明对业务对象的具体内涵不做限定。具体地,根据历史消费数据获取与业务对象相对应的各条历史消费记录。并且,分别针对每条历史消费数据,确定与该历史消费记录相对应的历史消费用户。
步骤S120:从用户属性数据库中获取各个历史消费用户的多维用户属性数据,并确定各个历史消费用户的消费频次,根据各个历史消费用户的消费频次以及各个历史消费用户的多维用户属性数据生成多条样本数据。
其中,用户属性数据库也可以称作用户画像数据库,用于存储用户的各个维度的属性信息,例如,可以包括年龄、性别、居住地、工作地、职业、爱好、婚姻状况等多个维度。其中,历史消费用户通过用户标识表示,并且,用户属性数据库中的主键也为用户标识,相应地,根据用户标识能够从用户属性数据库中获取各个历史消费用户的多维用户属性数据。
进一步的,针对各个历史消费用户,统计该历史消费用户的消费频次。其中,消费频次用于表示该用户的消费次数、消费频率等信息。例如,可以针对每个历史消费用户,统计该用户的总消费次数、各次消费之间的间隔时长等信息,以确定该历史消费用户针对该业务对象的消费频次。又如,为了简便起见,也可以将各个历史消费用户的消费频次统一设置为相同值,本发明对具体细节不做限定。
步骤S130:针对多条样本数据进行分析,以确定多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系。
其中,每条样本数据中包含对应的历史消费用户的用户属性信息以及该历史消费用户的消费频次。相应地,通过分析各条样本数据,能够确定各个维度的用户属性与消费频次之间的关联关系。该关联关系主要用于表示消费频次高的用户所共有的用户属性。
步骤S140:根据该关联关系,从各个维度的用户属性中提取关键属性,将关键属性识别为与业务对象相对应的潜在用户的关键特征。
其中,关键属性是指:对消费频次影响较大的属性的属性值,通常为消费频次高的用户所具有的共同属性。相应地,将关键属性识别为与业务对象相对应的潜在用户的关键特征,从而能够利用关键特征筛选与业务对象相对应的潜在用户,进而提升了业务对象的推广成功率。
其中,潜在用户的关键特征既可以是特征维度也可以是特征值。例如,特征维度可以是性别维度或婚姻状况维度等,特征值可以为女性或离异等。
由此可见,本发明中的方式通过建立用户属性与消费记录之间的对应关系,能够挖掘与业务对象相对应的潜在用户的关键特征,进而根据关键特征来识别潜在用户,从而为潜在用户的筛选提供了依据,使得业务对象的推送对象更有针对性。
实施例二、
图2示出了本发明实施例二提供的一种针对业务对象识别潜在用户的关键特征的方法的流程图。如图2所示,该方法包括:
步骤S210:获取与业务对象相对应的各条历史消费记录。
在本实施例中,业务对象主要包括如下两类:
第一类业务对象为业务提供端。业务提供端是指:位于提供业务项目的业务场所中的项目管理终端,例如,可以为商户或门店内的网络设备,用于针对商户或门店内的全部业务项目进行管理。相应地,与第一类业务对象相对应的各条历史消费记录根据业务提供端所对应的历史消费数据确定。
第二类业务对象为业务项目。该业务项目由业务提供端提供,并且,不同的业务提供端所能够提供的业务项目往往各不相同。因此,业务项目需要结合对应的业务提供端进行唯一标识。例如,当业务提供端为美业类提供端时,业务项目可能为美容业务项目、美发业务项目、美甲业务项目。相应地,与第二类业务对象相对应的各条历史消费记录通过以下方式获取:接收该业务项目对应的业务提供端发送的历史消费数据,从历史消费数据中筛选与该业务项目相对应的历史消费记录。由于一个业务提供端能够提供多个业务项目,其对应的历史消费数据中也必然会杂糅各个业务项目所对应的消费数据。因此,需要从众多历史消费数据中筛选与该业务项目相对应的历史消费记录,以便于针对该业务项目分析匹配的潜在用户。
另外,可选的,在本实施例中,对于第二类业务对象而言,进一步根据筛选出的历史消费记录,获取与该业务项目相关联的项目描述信息,根据获取到的项目描述信息生成该业务项目的项目标识。其中,为了更加准确地描述一个业务项目,分别从多个维度获取与该业务项目相关联的项目描述信息,根据多个维度的项目描述信息生成包含多个类目节点的项目标识;其中,各个类目节点分别对应于各个维度;并且,项目标识中包含的各个类目节点之间呈树状层级结构。
其中,发明人在实现本发明的过程中发现,业务项目不同于常规物品,具有个性化的特点。对于常规物品(例如冰箱、电视)而言,各家门店提供的物品大致相同,能够通过物品型号等信息进行统一标识。但是,对于业务项目而言,由于业务项目是由门店提供的个性化业务,其业务流程千差万别,因此,各家门店提供的业务项目之间存在差异。相应地,为了能够准确描述各家门店提供的每一项业务项目,在本步骤中,分别从多个维度获取与该已消费业务项目相关联的项目描述信息,根据多个维度的项目描述信息生成包含多个类目节点的项目标识;其中,各个类目节点分别对应于各个维度。例如,以护理项目为例,从护理时机的维度可以划分为:烫后护理、染后护理、日常护理等类目节点;从护理用品品牌的维度可以划分为:A品牌护理、B品牌护理等类目节点;从护理时长的维度可以划分为:30分钟快速护理、60分钟精细护理、90分钟深度护理等类目节点;从护理技师等级的维度可以划分为:高级技师护理、中级技师护理、专业技师护理等类目节点。由此可见,为了准确描述一个护理业务项目,可通过四个类目节点的方式生成项目标识。可选的,该项目标识中包含的各个类目节点之间呈树状层级结构。其中,一级类目节点为护理时机、二级类目节点为用品品牌、三级类目节点为护理时长、四级类目节点为技师等级。包含多级类目节点的项目标识能够准确且全面地描述一个业务项目。
步骤S220:分别确定与该业务对象的各条历史消费记录相对应的各个历史消费用户,从用户属性数据库中获取各个历史消费用户的多维用户属性数据。
其中,用户属性数据库也可以称作用户画像数据库,用于存储用户的各个维度的属性信息,例如,可以包括年龄、性别、居住地、工作地、职业、爱好、婚姻状况、消费力等多个维度。其中,历史消费用户通过用户标识表示,并且,用户属性数据库中的主键也为用户标识,相应地,根据用户标识能够从用户属性数据库中获取各个历史消费用户的多维用户属性数据。该用户标识可以为用户手机号或身份证号等各类标识。
步骤S230:确定各个历史消费用户的消费频次,根据各个历史消费用户的消费频次以及各个历史消费用户的多维用户属性数据生成多条样本数据。
进一步的,针对各个历史消费用户,统计该历史消费用户的消费频次。其中,消费频次用于表示该用户的消费次数、消费频率等信息。例如,可以针对每个历史消费用户,统计该用户的总消费次数、各次消费之间的间隔时长等信息,以确定该历史消费用户针对该业务对象的消费频次。其中,消费频次越高的用户所对应的样本数据的权重越高,相应地,权重高的样本数据中的用户属性往往更加重要。因此,通过消费频次能够更加准确地识别关键属性。
由此可见,本步骤主要针对不同的历史消费用户生成不同的样本数据。每条样本数据用于存储一个历史消费用户的消费频次与多维用户属性数据之间的对应关系。
步骤S240:针对多条样本数据进行分析,以确定多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系。
具体地,根据各个样本数据所对应的消费时段、和/或消费频次,为各个样本数据设置对应的样本权重;根据各个样本数据的样本权重,确定多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系。其中,消费时段可以为一天当中的多个时段,例如,考虑到早晨人们较为匆忙,一般没有时间充分享受业务服务,因此,早晨这一时段来的用户可能只能偶尔光顾的用户,并非主流用户,因此,早晨时段的权重较低,中午时段的权重较高,而晚上时段的权重最高。另外,消费时段也可以为一段历史时期内的若干时段。比如,最近一个月消费情况更能反映最新的用户特征,因此,最近一个月的样本权重较高,而一个月前的样本权重较低。通过针对样本数据设置权重,能够更准确地分析用户属性与消费频次之间的关联关系。
另外,若业务对象为业务提供端,为各个样本数据设置对应的样本权重时,预先针对该业务提供端中包含的各个业务项目设置对应的项目权重;分别针对各个样本数据,确定该样本数据所对应的业务项目;根据该样本数据所对应的业务项目的项目权重,为各个样本数据设置对应的样本权重。例如,可以预先根据各个业务项目的重要程度、价格信息、复购率等因素为不同的业务项目设置不同的项目权重,相应地,项目权重高的业务项目所对应的样本数据的样本权重也较高。具体地,在根据各个历史消费用户的消费频次以及各个历史消费用户的多维用户属性数据生成多条样本数据时,分别针对该业务提供端所提供的每个业务项目,统计各个历史消费用户针对该业务项目的消费频次,根据统计结果得到与该业务项目相对应的项目样本数据;针对各个项目样本数据设置对应的权重,结合该权重,确定多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系。
另外,考虑到业务项目的项目标识包含多级类目节点,因此,还可以根据各个类目节点设置对应的类目权重,相应地,样本权重根据类目权重进行设置,从而便于针对不同类目的样本设置不同的权重,从而更能迎合实际需求。例如,在多级类目节点中,假设业务提供端更加关注护理用品品牌以及护理技师等级这两个类目,相应地,可以将畅销品牌的类目节点所对应的样本的权重设置得较高,以使畅销品牌的用户的特征更加显著;并且,可以将高级技师的类目节点所对应的样本的权重设置得较高,以使得高级技师的用户的特征更加显著。总而言之,由于多级类目节点能够更加全面准确地描述业务项目,因此,业务提供端可以根据各个类目节点的重要程度,将对业务影响较大的类目节点所对应的样本的权重设置得较大,从而使得该类用户的特征更加显著。由此可见,当业务项目的项目标识包含多个类目节点时,上述的项目权重进一步包括对应于类目节点的类目权重。
步骤S250:根据该关联关系,从各个维度的用户属性中提取关键属性,将关键属性识别为与业务对象相对应的潜在用户的关键特征。
其中,关键属性是指:对消费频次影响较大的属性的属性值,通常为消费频次高的用户所具有的共同属性。相应地,将关键属性识别为与业务对象相对应的潜在用户的关键特征,从而能够利用关键特征筛选与业务对象相对应的潜在用户,进而提升了业务对象的推广成功率。
步骤S260:根据与业务对象相对应的潜在用户的关键特征,对候选用户群中的各个候选用户进行筛选;根据筛选结果,从候选用户群中提取预设数量的用户,根据提取出的用户生成目标用户群。
其中,候选用户群可以由一个城市或门店周围预设范围内的全体用户构成。本步骤的目的在于从候选用户群中筛选与业务对象的潜客特征相匹配的目标用户群,从而便于实现业务对象的推广。具体实施时,可以根据预设的消费概率阈值、和/或目标人数阈值,从候选用户群中提取预设数量的用户。例如,在一种方式中,设置消费概率阈值,利用上文提到的特征模型从候选用户群中筛选消费概率大于该消费概率阈值的目标用户,从而形成目标用户群,供业务提供端使用。又如,在另一种方式中,设置目标人数阈值,利用上文提到的特征模型计算候选用户群中的各个候选用户的消费概率,将消费概率从高到低排列,从而筛选概率较高的预设数量(等于目标人数阈值)的目标用户,从而形成目标用户群,供业务提供端使用。通过本步骤能够生成目标用户群,从而便于向该目标用户群推送业务对象,提升推送成功率。另外,目标用户群可以为定向推送以及业务场所选取提供依据。
为了便于理解,最后给出一个具体示例:
在该示例中,以业务对象为门店端为例进行说明。门店端是指:门店中用于管理业务项目的网络设备。该门店端用于记录并管理各个业务项目所对应的消费数据。相应地,根据历史消费数据能够获取该门店端的历史消费用户的画像特征,例如,历史消费用户中各个性别的用户在总用户中所占的比例、各个年龄段的用户在总用户中所占的比例、不同职业的用户在总用户中所占的比例等。
具体地,将历史消费数据中的历史消费用户与用户属性数据库中对应的多维用户属性数据进行匹配,得到上文提到的样本数据,如表1所示。
表1
为了描述简便,表1仅以两条样本数据为例进行举例,实际上样本数据的数量众多。并且,表1仅以性别和婚姻状况两个维度的用户属性为例进行描述,实际上,用户属性的维度很多,以便于准确描述用户特征。其中,表1中的“应变量”也可以称作“因变量”,相应地,表1中的“因变量”也可以称作“自变量”。总之,表1中的“应变量”随“因变量”的改变而改变。
根据得到的样本数据进行模型训练,例如,可以通过逻辑回归等各类机器学习算法进行模型训练,以得到特征模型。通过训练过程,识别关键因子。其中,关键因子是指:对因变量影响显著的自变量。例如,在上例中,“性别-女、婚姻状况-离异、婚姻状况-已婚”为关键因子。相应地,将其作为潜在用户的关键特征。
实际情况中,随着门店的消费记录的增多,消费的迁移,潜客(即潜在用户)的特征可能会发生变化,因此上述模型训练过程可以定期进行(例如一个月)并进行输出,以实现模型的更新。例如,当门店内有新增的业务项目时,或者,当消费趋势变化,例如消费升级时;又或者,当用户属性数据库中的数据量增加,能够覆盖更多的用户时,都能够根据上述变化对模型进行重新训练和升级。
另外,在另一个示例中,以美发类业务项目为例,通过本发明中的方式确定了部分业务项目所对应的潜在用户的关键特征:
染发业务项目:
(1)3个月内复购率最高的用户特征如下:40-50岁之间,女,白领,消费高,有小孩,可能是离异,天河区与进城(番禺类远离城区)用户各贡献一半。
(2)3个月以上复购率最高的用户特征如下:男女各一半,20-40岁之间,白领,消费高,已婚已育为主,天河区用户60%以上,越秀区和进城用户各20%。
护发业务项目:
复购率最高的用户特征如下:全女性,26-40岁之间,消费中高、已婚有小孩,天河区用户80%以上。
由此可见,对于美发类业务项目而言,关键特征主要包括:年龄、性别、职业、婚姻状况、居住地等。
综上可知,本发明能够将交易记录与用户画像数据相结合得到逻辑回归的训练集并进行模型训练,从而识别关键因子以得到潜客的关键特征以及特征值。并且,当业务提供端设置好消费概率阈值或目标人群数量时,能够直接根据特征模型生成目标用户群,从而实现业务项目的定向推送。
另外,由于本实施例面向不同的项目提供端提供服务,而各个项目提供端所提供的业务项目又千差万别,因此,在本实施例中,需要预先针对各个项目提供端的业务项目进行分析,以便根据分析结果获取该业务项目的多维度描述信息,进而针对该业务项目设置匹配的信息结构来承载对应的多维度描述信息。并且,通过多维度来描述业务项目的方式,便于分别针对各个维度设置类目权重,以便针对业务提供端较关心的类目设置较高的权重,从而使该类目所对应的用户特征更加显著。
实施例三
图3示出了本发明实施例三提供的一种针对业务对象识别潜在用户的关键特征的装置的结构示意图,该装置包括:
获取模块31,适于获取与业务对象相对应的各条历史消费记录,分别确定与各条历史消费记录相对应的各个历史消费用户;
生成模块32,适于从用户属性数据库中获取各个历史消费用户的多维用户属性数据,并确定各个历史消费用户的消费频次,根据各个历史消费用户的消费频次以及各个历史消费用户的多维用户属性数据生成多条样本数据;
分析模块33,适于针对所述多条样本数据进行分析,以确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系;
识别模块34,适于根据所述关联关系,从各个维度的用户属性中提取关键属性,将所述关键属性识别为与所述业务对象相对应的潜在用户的关键特征。
可选的,所述业务对象为业务提供端和/或业务项目;其中,所述业务提供端用于提供多个业务项目。
可选的,当所述业务对象为业务项目时,所述获取模块具体适于:
接收所述业务项目对应的业务提供端发送的历史消费数据,从所述历史消费数据中筛选与所述业务项目相对应的历史消费记录;
根据筛选出的历史消费记录,获取与该业务项目相关联的项目描述信息,根据获取到的项目描述信息生成该业务项目的项目标识。
可选的,所述获取模块具体适于:
分别从多个维度获取与该业务项目相关联的项目描述信息,根据多个维度的项目描述信息生成包含多个类目节点的项目标识;
其中,各个类目节点分别对应于各个维度;并且,所述项目标识中包含的各个类目节点之间呈树状层级结构。
可选的,所述分析模块具体适于:
根据各个样本数据所对应的消费时段、和/或消费频次,为各个样本数据设置对应的样本权重;
根据各个样本数据的样本权重,确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系。
可选的,当所述业务对象为业务提供端时,所述分析模块具体适于:
预先针对该业务提供端中包含的各个业务项目设置对应的项目权重;
分别针对各个样本数据,确定该样本数据所对应的业务项目,根据该样本数据所对应的业务项目的项目权重,为各个样本数据设置对应的样本权重;
其中,当业务项目的项目标识包含多个类目节点时,所述项目权重进一步包括对应于类目节点的类目权重。
可选的,所述识别模块进一步适于:
根据所述与所述业务对象相对应的潜在用户的关键特征,对候选用户群中的各个候选用户进行筛选;
根据筛选结果,从所述候选用户群中提取预设数量的用户,根据提取出的用户生成目标用户群。
可选的,所述识别模块具体适于:
根据预设的消费概率阈值、和/或目标人数阈值,从所述候选用户群中提取预设数量的用户。
关于各个模块的具体工作原理可参照方法实施例中相应步骤的描述,此处不再赘述。
实施例四
本申请实施例四提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的针对业务对象识别潜在用户的关键特征的方法。可执行指令具体可以用于使得处理器执行上述方法实施例中对应的各个操作。
实施例五
图4示出了根据本发明实施例五的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图4所示,该电子设备可以包括:处理器(processor)402、通信接口(Communications Interface)406、存储器(memory)404、以及通信总线408。
其中:
处理器402、通信接口406、以及存储器404通过通信总线408完成相互间的通信。
通信接口406,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器402,用于执行程序410,具体可以执行上述针对业务对象识别潜在用户的关键特征的方法实施例中的相关步骤。
具体地,程序410可以包括程序代码,该程序代码包括计算机操作指令。
处理器402可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器404,用于存放程序410。存储器404可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行上述方法实施例中对应的各个操作。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的基于语音输入信息的抽奖系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种针对业务对象识别潜在用户的关键特征的方法,包括:
获取与业务对象相对应的各条历史消费记录,分别确定与各条历史消费记录相对应的各个历史消费用户;
从用户属性数据库中获取各个历史消费用户的多维用户属性数据,并确定各个历史消费用户的消费频次,根据各个历史消费用户的消费频次以及各个历史消费用户的多维用户属性数据生成多条样本数据;
针对所述多条样本数据进行分析,以确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系;
根据所述关联关系,从各个维度的用户属性中提取关键属性,将所述关键属性识别为与所述业务对象相对应的潜在用户的关键特征。
2.根据权利要求1所述的方法,其中,所述业务对象为业务提供端和/或业务项目;其中,所述业务提供端用于提供多个业务项目。
3.根据权利要求2所述的方法,其中,当所述业务对象为业务项目时,所述获取与业务对象相对应的各条历史消费记录包括:
接收所述业务项目对应的业务提供端发送的历史消费数据,从所述历史消费数据中筛选与所述业务项目相对应的历史消费记录;
根据筛选出的历史消费记录,获取与该业务项目相关联的项目描述信息,根据获取到的项目描述信息生成该业务项目的项目标识。
4.根据权利要求3所述的方法,其中,所述获取与该业务项目相关联的项目描述信息,根据获取到的项目描述信息生成该业务项目的项目标识具体包括:
分别从多个维度获取与该业务项目相关联的项目描述信息,根据多个维度的项目描述信息生成包含多个类目节点的项目标识;
其中,各个类目节点分别对应于各个维度;并且,所述项目标识中包含的各个类目节点之间呈树状层级结构。
5.根据权利要求1-4任一所述的方法,其中,所述针对所述多条样本数据进行分析,以确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系包括:
根据各个样本数据所对应的消费时段、和/或消费频次,为各个样本数据设置对应的样本权重;
根据各个样本数据的样本权重,确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系。
6.根据权利要求5所述的方法,其中,当所述业务对象为业务提供端时,所述为各个样本数据设置对应的样本权重进一步包括:
预先针对该业务提供端中包含的各个业务项目设置对应的项目权重;
分别针对各个样本数据,确定该样本数据所对应的业务项目,根据该样本数据所对应的业务项目的项目权重,为各个样本数据设置对应的样本权重;
其中,当业务项目的项目标识包含多个类目节点时,所述项目权重进一步包括对应于类目节点的类目权重。
7.根据权利要求1-6任一所述的方法,其中,所述将所述关键属性识别为与所述业务对象相对应的潜在用户的关键特征之后,进一步包括:
根据所述与所述业务对象相对应的潜在用户的关键特征,对候选用户群中的各个候选用户进行筛选;
根据筛选结果,从所述候选用户群中提取预设数量的用户,根据提取出的用户生成目标用户群。
8.一种针对业务对象识别潜在用户的关键特征的装置,包括:
获取模块,适于获取与业务对象相对应的各条历史消费记录,分别确定与各条历史消费记录相对应的各个历史消费用户;
生成模块,适于从用户属性数据库中获取各个历史消费用户的多维用户属性数据,并确定各个历史消费用户的消费频次,根据各个历史消费用户的消费频次以及各个历史消费用户的多维用户属性数据生成多条样本数据;
分析模块,适于针对所述多条样本数据进行分析,以确定所述多维用户属性数据中包含的各个维度的用户属性与消费频次之间的关联关系;
识别模块,适于根据所述关联关系,从各个维度的用户属性中提取关键属性,将所述关键属性识别为与所述业务对象相对应的潜在用户的关键特征。
9.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的针对业务对象识别潜在用户的关键特征的方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的针对业务对象识别潜在用户的关键特征的方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910833794.2A CN110727857A (zh) | 2019-09-04 | 2019-09-04 | 针对业务对象识别潜在用户的关键特征的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910833794.2A CN110727857A (zh) | 2019-09-04 | 2019-09-04 | 针对业务对象识别潜在用户的关键特征的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110727857A true CN110727857A (zh) | 2020-01-24 |
Family
ID=69218924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910833794.2A Pending CN110727857A (zh) | 2019-09-04 | 2019-09-04 | 针对业务对象识别潜在用户的关键特征的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110727857A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111309766A (zh) * | 2020-02-04 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 业务特征构造方法以及装置 |
CN111581296A (zh) * | 2020-04-02 | 2020-08-25 | 深圳壹账通智能科技有限公司 | 数据相关性分析方法、装置、计算机系统及可读存储介质 |
CN111681743A (zh) * | 2020-05-09 | 2020-09-18 | 北京启云数联科技有限公司 | 业务对象推荐方法、系统及装置 |
CN112818032A (zh) * | 2021-01-26 | 2021-05-18 | 龚世燕 | 服务于大数据挖掘分析的数据筛选方法及数据分析服务器 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014158894A2 (en) * | 2013-03-14 | 2014-10-02 | Google Inc. | Identifying target audience for a product or service |
CN107247786A (zh) * | 2017-06-15 | 2017-10-13 | 北京小度信息科技有限公司 | 用于确定相似用户的方法、装置和服务器 |
CN107730311A (zh) * | 2017-09-29 | 2018-02-23 | 北京小度信息科技有限公司 | 一种推荐信息的推送方法、装置及服务器 |
CN109559208A (zh) * | 2019-01-04 | 2019-04-02 | 平安科技(深圳)有限公司 | 一种信息推荐方法、服务器及计算机可读介质 |
CN109934683A (zh) * | 2019-03-19 | 2019-06-25 | 北京三快在线科技有限公司 | 推荐方法、装置及电子设备 |
-
2019
- 2019-09-04 CN CN201910833794.2A patent/CN110727857A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014158894A2 (en) * | 2013-03-14 | 2014-10-02 | Google Inc. | Identifying target audience for a product or service |
CN107247786A (zh) * | 2017-06-15 | 2017-10-13 | 北京小度信息科技有限公司 | 用于确定相似用户的方法、装置和服务器 |
CN107730311A (zh) * | 2017-09-29 | 2018-02-23 | 北京小度信息科技有限公司 | 一种推荐信息的推送方法、装置及服务器 |
CN109559208A (zh) * | 2019-01-04 | 2019-04-02 | 平安科技(深圳)有限公司 | 一种信息推荐方法、服务器及计算机可读介质 |
CN109934683A (zh) * | 2019-03-19 | 2019-06-25 | 北京三快在线科技有限公司 | 推荐方法、装置及电子设备 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111309766A (zh) * | 2020-02-04 | 2020-06-19 | 支付宝(杭州)信息技术有限公司 | 业务特征构造方法以及装置 |
CN111309766B (zh) * | 2020-02-04 | 2023-09-12 | 支付宝(杭州)信息技术有限公司 | 业务特征构造方法以及装置 |
CN111581296A (zh) * | 2020-04-02 | 2020-08-25 | 深圳壹账通智能科技有限公司 | 数据相关性分析方法、装置、计算机系统及可读存储介质 |
WO2021196457A1 (zh) * | 2020-04-02 | 2021-10-07 | 深圳壹账通智能科技有限公司 | 数据相关性分析方法、装置、计算机系统及可读存储介质 |
CN111581296B (zh) * | 2020-04-02 | 2022-08-16 | 深圳壹账通智能科技有限公司 | 数据相关性分析方法、装置、计算机系统及可读存储介质 |
CN111681743A (zh) * | 2020-05-09 | 2020-09-18 | 北京启云数联科技有限公司 | 业务对象推荐方法、系统及装置 |
CN112818032A (zh) * | 2021-01-26 | 2021-05-18 | 龚世燕 | 服务于大数据挖掘分析的数据筛选方法及数据分析服务器 |
CN112818032B (zh) * | 2021-01-26 | 2022-03-01 | 中科柏诚科技(北京)股份有限公司 | 服务于大数据挖掘分析的数据筛选方法及数据分析服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7343568B2 (ja) | 機械学習のためのハイパーパラメータの識別および適用 | |
US10347019B2 (en) | Intelligent data munging | |
CN110727857A (zh) | 针对业务对象识别潜在用户的关键特征的方法及装置 | |
JP5575902B2 (ja) | クエリのセマンティックパターンに基づく情報検索 | |
US20160379268A1 (en) | User behavior data analysis method and device | |
CN108416616A (zh) | 投诉举报类别的排序方法和装置 | |
CN104579909B (zh) | 一种用户信息的分类、用户分组信息的获取方法和设备 | |
TW201939378A (zh) | 資源推薦方法及裝置 | |
CN110674144A (zh) | 用户画像生成方法、装置、计算机设备和存储介质 | |
CN110197426A (zh) | 一种信用评分模型的建立方法、装置及可读存储介质 | |
CN110427358B (zh) | 数据清洗方法及装置和信息推荐方法及装置 | |
CN106202440B (zh) | 数据处理方法、装置及设备 | |
CN110717095B (zh) | 服务项目的推送方法及装置 | |
CN110737432A (zh) | 一种基于词根表的脚本辅助设计方法及装置 | |
CN108959289B (zh) | 网站类别获取方法和装置 | |
CN114995877B (zh) | 一种变量配置方法及装置 | |
CN113535966A (zh) | 知识图谱的创建方法、信息获取的方法、装置和设备 | |
CN116501979A (zh) | 信息推荐方法、装置、计算机设备及计算机可读存储介质 | |
CN110008352A (zh) | 实体发现方法及装置 | |
CN110347922A (zh) | 基于相似度的推荐方法、装置、设备和存储介质 | |
CN109582863B (zh) | 一种推荐方法及服务器 | |
CN114138651A (zh) | 测试数据的生成方法及装置 | |
CN112182177A (zh) | 一种用户问题处理方法、装置、电子设备及存储介质 | |
CN111382343A (zh) | 一种标签体系生成方法及装置 | |
WO2021168830A1 (zh) | 内容推送方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200124 |