CN111784403A - 基于网上商城的用户类别分析方法、装置和计算机设备 - Google Patents

基于网上商城的用户类别分析方法、装置和计算机设备 Download PDF

Info

Publication number
CN111784403A
CN111784403A CN202010650901.0A CN202010650901A CN111784403A CN 111784403 A CN111784403 A CN 111784403A CN 202010650901 A CN202010650901 A CN 202010650901A CN 111784403 A CN111784403 A CN 111784403A
Authority
CN
China
Prior art keywords
user
online shopping
shopping mall
consumption
characteristic data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010650901.0A
Other languages
English (en)
Inventor
周兆全
邵延富
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Joysim Technology Co ltd
Original Assignee
Guangzhou Joysim Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Joysim Technology Co ltd filed Critical Guangzhou Joysim Technology Co ltd
Priority to CN202010650901.0A priority Critical patent/CN111784403A/zh
Publication of CN111784403A publication Critical patent/CN111784403A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于网上商城的用户类别分析方法、装置和计算机设备,方法包括获取待分类的用户网上商城消费特征数据;将待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。该方法运行过程简单,能快速地确定用户类别;并且采用了无监督异常检测算法和聚类算法大大提成了分析的准确率,从而能实现对用户进行精确的信息推送。

Description

基于网上商城的用户类别分析方法、装置和计算机设备
技术领域
本发明涉及数据分类技术领域,具体涉及一种基于网上商城的用户类别分析方法、装置、计算机设备和存储介质。
背景技术
随着电子商务的飞速发展,大大小小的电商平台纷纷通过某些手段建立电商用户画像,以实现精准营销、助理产品与帮助了解行业等。用户画像其实就是希望通过某些手段对用户做甄别,把他们分成彼此相同或不同的人群或个体(例如将其分为特殊用户和普通用户),进而区别化提供服务进行观察分析。例如,淘宝会根据用户使用习惯来决定首页推荐的商品,该举措过滤了一部分垃圾营销,不会给用户带来不悦。不同于大型的电商平台,特定领域电商平台用户类型更集中,用户量也更少,所以建立用户画像时要结合自身平台的特色。在这些特色电商平台中,往往会催生一些“代购”、“买手”(即特殊用户),因此,区分“买手”与普通用户是建立用户类别的第一步。
区分普通用户与特殊用户,可视为一种二分类。一个用户不是普通用户,那就是特殊用户,那么对其进行分类时通常采用二分类算法。然而二分类算法都是监督学习,需要获得有标签的数据,但获得有标签的数据往往成本较高。
发明内容
有鉴于此,本发明提供了一种基于网上商城的用户类别分析方法、装置、计算机设备和存储介质以解决采用现有的二分类算法需要获得有标签的数据成本较高的技术问题。
一种基于网上商城的用户类别分析方法,包括以下步骤:
获取待分类的用户网上商城消费特征数据;
将所述待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,所述预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
进一步地,
在获取待分类的用户网上商城消费特征数据的步骤中,包括:
获取待分类的用户网上商城初始消费特征数据;
对所述取待分类的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到待分类的用户网上商城消费特征数据。
进一步地,
所述用户类别分析模型的建立,包括:
获取历史的用户网上商城消费特征数据;
对所述历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征;
将每个历史用户的各述消费特征输入至所述无监督异常检测算法,对应得到每个历史用户的消费分值;
将每个历史用户的消费分值输入至聚类算法中,确定分类阈值;
根据所述分类阈值对历史的用户打上标签。
进一步地,
所述无监督异常检测算法为孤立森林算法。
进一步地,
所述聚类算法为K-means聚类算法。
进一步地,
获取历史的用户网上商城消费特征数据的步骤中,包括:
获取历史的用户网上商城初始消费特征数据;
对所述历史的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到所述历史的用户网上商城消费特征数据。
进一步地,
对所述历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征的步骤中,包括:
对所述历史的用户网上商城消费特征数据进行统计分析,得到每个历史用户的消费次数、消费金额、消费商品类型数、消费平均时间差以及支付种类。
一种基于网上商城的用户类别分析装置,包括:
特征数据获取模块,用于获取待分类的用户网上商城消费特征数据;
用户类别获得模块,用于将所述待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,所述预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:
获取待分类的用户网上商城消费特征数据;
将所述待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,所述预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获取待分类的用户网上商城消费特征数据;
将所述待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,所述预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
上述的基于网上商城的用户类别分析方法、装置、计算机设备和存储介质,通过无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到预先建立的用户类别分析模型,从而需要对某个用户进行用户类别分析时只需要将用户网上商城消费特征数据输入到预先建立的用户类别分析模型中即可得到用户类别。该方法运行过程简单,能快速地确定用户类别;并且采用了无监督异常检测算法和聚类算法大大提成了分析的准确率,从而能实现对用户进行精确的信息推送。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例的基于网上商城的用户类别分析方法应用环境的示意图;
图2为本发明实施例的基于网上商城的用户类别分析方法流程示意图;
图3为本发明实施例的建立用户类别分析模型的流程示意图;
图4为本发明实施例的基于网上商城的用户类别分析装置的结构示意图;
图5为本发明实施例的计算机设备的内部结构图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更详细说明本发明,下面结合附图对本发明提供的一种基于网上商城的用户类别分析方法、装置、计算机设备和存储介质,进行具体地描述。
本方法运用于图1的终端102中,终端可以是个人计算机、笔记本电脑等,终端102与检测设备104进行通讯连接,检测设备104为采集器等。
其中,终端102与检测设备104采用本地接口连接时,检测设备104可以将采集的待分类的用户网上商城消费特征数据发送至终端102中。另外,终端102也可以通过指令获取检测设备104中测量的待分类的用户网上商城消费特征数据。
在一个实施例中,如图2所示,提供了一种基于网上商城的用户类别分析方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤S202,获取待分类的用户网上商城消费特征数据;
其中,网上商城为购物平台的任意一种,包括淘宝、京东、A商城等。用户网上商城消费特征数据是指用户在网上商城上进行的一些列消费行为而产生的数据,包括用户编号uid、用户下单的手机号、消费商品种类、消费商品名称、消费金额、下单时间、支付时间、支付方式、订单状态、收件人号码、收件地址、快递单号以及签收时间等。uid是指用户身份证明,即注册会员后的一个编号,是用户在网上商城中唯一标识码。待分类的用户网上商城消费特征数据是任意的需要进行用户类别分类或确定的用户在网上商城的消费特征数据。
步骤S204,将待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
其中,异常检测算法是一种机器学习任务,包括发现所谓的异常值。异常值是一种数据集中的观测值,似乎与该组数据的其余部分不一致,异常值是一种观测值,与其他观测值有很大差异,引起人们怀疑它是由不同的机制产生的。异常检测是一种无监督学习算法,它指的是通过数据挖掘手段识别数据中的“异常点”,常见的使用案例包括风控领域,例如识别信用卡诈骗、网络通信领域发现异常信息流、或机械加工领域识别未达标的产品等。在本实施例中,将用户网上商城消费特征数据的分析过程看作是“异常点”的挖掘。
聚类算法又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类分析是由若干模式组成的,通常,模式是一个度量的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
模型学习训练其实质就是以一个参数作为X变量,以另一个参数作为Y变量,并采用相应的函数建立模型的过程。在本实施例中,以用户网上商城消费特征数据作为X变量,以用户类别作为Y变量,采用无监督异常检测算法和聚类算法建立用户类别分析模型。具体为:用户类别分析模型采用异常检测方法给网上商城消费过的用户计算一个异常得分,由于确定“异常”的用户占整体比重是未知的,因此再使用聚类算法将用户聚为两类,并观察两类的阈值以确定最终模型的划分比例。
上述的基于网上商城的用户类别分析方法,通过无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到预先建立的用户类别分析模型,从而需要对某个用户进行用户类别分析时只需要将用户网上商城消费特征数据输入到预先建立的用户类别分析模型中即可得到用户类别。该方法运行过程简单,能快速地确定用户类别;并且采用了无监督异常检测算法和聚类算法大大提成了分析的准确率,从而能实现对用户进行精确的信息推送。
在一个实施例中,在获取待分类的用户网上商城消费特征数据的步骤中,包括:
获取待分类的用户网上商城初始消费特征数据;
对取待分类的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到待分类的用户网上商城消费特征数据。
具体的,用户在网上商城进行消费活动会形成一系列的消费特征数据,但这些数据中往往存在一些杂质,例如数据为0,空字段以及一些异常值(通常是指明显不符合逻辑的消费数据)等。为了保证分类的准确性,在获取待分类的用户网上商城初始消费特征数据的数据后对其进行清理,去除0或空字段数据、以及异常值数据,从而得到待分类的用户网上商城消费特征数据。
在一个实施例中,如图3所示,用户类别分析模型的建立,包括:
步骤S 302,获取历史的用户网上商城消费特征数据;
其中,历史的用户网上商城消费特征数据是指过去一段时间内用户在网上商城中进行消费活动而产生的用户网上商城消费特征数据。过去一段时间的长度可以是任意值,可以是几天到几个月甚至是几年,例如1年,2年,3个月,6个月等。在本实施例中,综合考虑用户类别分析模型的准确性以及计算量选择6个月,即获取过去6个月内的用户网上商城消费特征数据。
步骤S 304,对历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征;
在一个实施例中,对历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征的步骤中,包括:
对历史的用户网上商城消费特征数据进行统计分析,得到每个历史用户的消费次数、消费金额、消费商品类型数、消费平均时间差以及支付种类。
其中,用户网上商城消费特征数据中包含有多个消费特征,包括消费次数、消费金额、消费商品类型数、消费平均时间差、以及支付种类数等。由于每一个历史用户都有这些数据,因此对这些数据进行分类,得到每个历史用户的各消费特征。所述历史用户就是在过去一段时间内在网上商城中进行消费活动而产生的用户网上商城消费特征数据的用户。
步骤S306,将每个历史用户的各消费特征输入至无监督异常检测算法,对应得到每个历史用户的消费分值;
步骤S308,将每个历史用户的消费分值输入至聚类算法中,确定分类阈值;
具体而言,将每个历史用户的各述消费特征输入至无监督异常检测算法,对应得到每个历史用户的消费分值,将每个历史用户的消费分值输入至聚类算法中,确定分类阈值,其中分类阈值用来确定分类类别,即通常是大于分类阈值为一个类别,小于或等于分类阈值为另一个类别。
步骤S310,根据分类阈值对历史的用户打上标签。
为了便于理解,给出一个详细的实施例。用户类别分析模型的建立过程为:输入近半年半个内A商城用户消费行为特征数据;输出:带“真实用户”或者“专业买手”标签的uid数据,在本实施例中,“真实用户”和“专业买手”作为用户类别。
S1:将消费数据中的用户标识数据uid进行去重。
S2:根据uid统计用户的消费特征x1,x2,..,xn;x1,x2,..,xn为指定uid在连续半年中的相关统计数据,其中x1:消费次数、x2:消费金额、x3:消费商品类型数、x4:消费平均时间差和x5:支付种类数;
S3:将x1,x2,..,xn输入到IsolationForest算法中,计算每一个uid得分λ12,..,λm,得分值介于0到1之间;
S4:使用k-means算法将uid分为两类,观察两类uid得分区间,确定分类阈值K;
S5:将得分λ值大于K的uid打上“专业买手”标签,λ值低于K的uid打上“真实用户”标签。
利用已经建立好的A商城用户标签分类模型,只需要统计没打标签的用户的消费特征x1,x2,..,xn,即可得出该用户的标签为“专业买手”还是“真实用户”。
在一个实施例中,无监督异常检测算法为孤立森林算法。
孤立森林(IsolationForest)算法,又称为隔离森林,是一种基于树的异常检测算法。该算法构建了许多随机树,其基本原理是,如果样本被隔离,在非常少量的随机分割之后,它应该单独存在于叶子中。隔离森林根据样本最终所在的树的深度建立异常得分。孤立森林算法是一种适用于连续数据的无监督异常检测方法,训练样本不需要有标记,使用方便准确率高。
在一个实施例中,聚类算法为K-means聚类算法。
K-means聚类算法也是一种无监督学习,是一种迭代求解的聚类分析算法,其步骤是,预将数据分为K组,则随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。采用该算法可以快速地计算出分类阈值。
在一个实施例中,获取历史的用户网上商城消费特征数据的步骤中,包括:
获取历史的用户网上商城初始消费特征数据;
对历史的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到历史的用户网上商城消费特征数据。
具体的,用户在网上商城进行消费活动会形成一系列的消费特征数据,但这些数据中往往存在一些杂质,例如数据为0,空字段以及一些异常值(通常是指明显不符合逻辑的消费数据)等。为了保证建立的用户类别分析模型的准确性,在获取待分类的用户网上商城初始消费特征数据的数据后对其进行清理,去除0或空字段数据、以及异常值数据,从而得到待分类的用户网上商城消费特征数据。
上述本发明公开的实施例中详细描述了一种基于网上商城的用户类别分析方法,对于本发明公开的上述方法可采用多种形式的设备实现,因此本发明还公开了对应上述方法的的配置装置,下面给出具体的实施例进行详细说明。
请参阅附图4,为本发明实施例公开的一种基于网上商城的用户类别分析装置,主要包括:
特征数据获取模块402,用于获取待分类的用户网上商城消费特征数据;
用户类别获得模块404,用于将待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
在一个实施例中,初始数据获得模块,用于获取待分类的用户网上商城初始消费特征数据;
特征数据获取模块,还用于对取待分类的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到待分类的用户网上商城消费特征数据。
在一个实施例中,历史数据获取模块,用于获取历史的用户网上商城消费特征数据;
消费特征获得模块,用于对历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征;
消费分值得到模块,用于将每个历史用户的各述消费特征输入至无监督异常检测算法,对应得到每个历史用户的消费分值;
消费分值确定模块,用于将每个历史用户的消费分值输入至聚类算法中,确定分类阈值;
标签确定模块,用于根据分类阈值对历史的用户打上标签。
在一个实施例中,无监督异常检测算法为孤立森林算法。
在一个实施例中,聚类算法为K-means聚类算法。
在一个实施例中,初始历史数据获取模块,用于获取历史的用户网上商城初始消费特征数据;
历史数据获取模块,还用于对历史的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到历史的用户网上商城消费特征数据。
在一个实施例中,消费特征获得模块,还用于对历史的用户网上商城消费特征数据进行统计分析,得到每个历史用户的消费次数、消费金额、消费商品类型数、消费平均时间差以及支付种类。
关于基于网上商城的用户类别分析装置的具体限定可以参见上文中对于方法的限定,在此不再赘述。上述基于网上商城的用户类别分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本发明实施例还提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储电阻等效模型、等效子模型的数据,以及存储执行计算时得到的等效电阻、工作电阻以及接触电阻。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种配电区域峰谷电价的方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取待分类的用户网上商城消费特征数据;将待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:在获取待分类的用户网上商城消费特征数据的步骤中,包括:获取待分类的用户网上商城初始消费特征数据;对取待分类的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到待分类的用户网上商城消费特征数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:用户类别分析模型的建立,包括:获取历史的用户网上商城消费特征数据;对历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征;将每个历史用户的各述消费特征输入至无监督异常检测算法,对应得到每个历史用户的消费分值;将每个历史用户的消费分值输入至聚类算法中,确定分类阈值;根据分类阈值对历史的用户打上标签。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:无监督异常检测算法为孤立森林算法。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:聚类算法为K-means聚类算法。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取历史的用户网上商城消费特征数据的步骤中,包括:获取历史的用户网上商城初始消费特征数据;对历史的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到历史的用户网上商城消费特征数据。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:对历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征的步骤中,包括:对历史的用户网上商城消费特征数据进行统计分析,得到每个历史用户的消费次数、消费金额、消费商品类型数、消费平均时间差以及支付种类。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取待分类的用户网上商城消费特征数据;将待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:在获取待分类的用户网上商城消费特征数据的步骤中,包括:获取待分类的用户网上商城初始消费特征数据;对取待分类的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到待分类的用户网上商城消费特征数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:用户类别分析模型的建立,包括:获取历史的用户网上商城消费特征数据;对历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征;将每个历史用户的各述消费特征输入至无监督异常检测算法,对应得到每个历史用户的消费分值;将每个历史用户的消费分值输入至聚类算法中,确定分类阈值;根据分类阈值对历史的用户打上标签。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:无监督异常检测算法为孤立森林算法。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:聚类算法为K-means聚类算法。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取历史的用户网上商城消费特征数据的步骤中,包括:获取历史的用户网上商城初始消费特征数据;对历史的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到历史的用户网上商城消费特征数据。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:对历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征的步骤中,包括:对历史的用户网上商城消费特征数据进行统计分析,得到每个历史用户的消费次数、消费金额、消费商品类型数、消费平均时间差以及支付种类。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种基于网上商城的用户类别分析方法,其特征在于,包括以下步骤:
获取待分类的用户网上商城消费特征数据;
将所述待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,所述预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
2.根据权利要求1所述的基于网上商城的用户类别分析方法,其特征在于,在获取待分类的用户网上商城消费特征数据的步骤中,包括:
获取待分类的用户网上商城初始消费特征数据;
对所述取待分类的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到待分类的用户网上商城消费特征数据。
3.根据权利要求1所述的基于网上商城的用户类别分析方法,其特征在于,所述用户类别分析模型的建立,包括:
获取历史的用户网上商城消费特征数据;
对所述历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征;
将每个历史用户的各述消费特征输入至所述无监督异常检测算法,对应得到每个历史用户的消费分值;
将每个历史用户的消费分值输入至聚类算法中,确定分类阈值;
根据所述分类阈值对历史的用户打上标签。
4.根据权利要求3所述的基于网上商城的用户类别分析方法,其特征在于,所述无监督异常检测算法为孤立森林算法。
5.根据权利要求4所述的基于网上商城的用户类别分析方法,其特征在于,所述聚类算法为K-means聚类算法。
6.根据权利要求3所述的基于网上商城的用户类别分析方法,其特征在于,获取历史的用户网上商城消费特征数据的步骤中,包括:
获取历史的用户网上商城初始消费特征数据;
对所述历史的用户网上商城初始消费特征数据进行清理,去除0或空字段数据、以及异常值数据,得到所述历史的用户网上商城消费特征数据。
7.一种权利要求3所述的基于网上商城的用户类别分析方法,其特征在于,对所述历史的用户网上商城消费特征数据进行统计分析,对应得到每个历史用户的各消费特征的步骤中,包括:
对所述历史的用户网上商城消费特征数据进行统计分析,得到每个历史用户的消费次数、消费金额、消费商品类型数、消费平均时间差以及支付种类。
8.一种基于网上商城的用户类别分析装置,其特征在于,包括:
特征数据获取模块,用于获取待分类的用户网上商城消费特征数据;
用户类别获得模块,用于将所述待分类的用户网上商城消费特征数据输入至预先建立的用户类别分析模型计算得到用户类别;其中,所述预先建立的用户类别分析模型是采用无监督异常检测算法和聚类算法对历史的用户网上商城消费特征数据进行学习训练得到的。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-7所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7所述方法的步骤。
CN202010650901.0A 2020-07-08 2020-07-08 基于网上商城的用户类别分析方法、装置和计算机设备 Pending CN111784403A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010650901.0A CN111784403A (zh) 2020-07-08 2020-07-08 基于网上商城的用户类别分析方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010650901.0A CN111784403A (zh) 2020-07-08 2020-07-08 基于网上商城的用户类别分析方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN111784403A true CN111784403A (zh) 2020-10-16

Family

ID=72758882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010650901.0A Pending CN111784403A (zh) 2020-07-08 2020-07-08 基于网上商城的用户类别分析方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN111784403A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113034179A (zh) * 2021-03-15 2021-06-25 广州虎牙科技有限公司 用户的分类方法以及相关装置、设备
CN117726378A (zh) * 2023-12-28 2024-03-19 杭州快付传媒科技有限公司 基于移动互联网的流量数据统计分析方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105023175A (zh) * 2015-07-24 2015-11-04 金鹃传媒科技股份有限公司 一种基于消费者行为数据分析和分类技术的在线广告分类推送方法及其系统
US20170011437A1 (en) * 2015-07-08 2017-01-12 United Parcel Service Of America, Inc. Systems, methods, and computer program products for detecting billing anomalies
CN109873812A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 异常检测方法、装置及计算机设备
CN110751231A (zh) * 2019-10-30 2020-02-04 上海观安信息技术股份有限公司 一种基于无监督算法的养卡号码检测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170011437A1 (en) * 2015-07-08 2017-01-12 United Parcel Service Of America, Inc. Systems, methods, and computer program products for detecting billing anomalies
CN105023175A (zh) * 2015-07-24 2015-11-04 金鹃传媒科技股份有限公司 一种基于消费者行为数据分析和分类技术的在线广告分类推送方法及其系统
CN109873812A (zh) * 2019-01-28 2019-06-11 腾讯科技(深圳)有限公司 异常检测方法、装置及计算机设备
CN110751231A (zh) * 2019-10-30 2020-02-04 上海观安信息技术股份有限公司 一种基于无监督算法的养卡号码检测方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113034179A (zh) * 2021-03-15 2021-06-25 广州虎牙科技有限公司 用户的分类方法以及相关装置、设备
CN117726378A (zh) * 2023-12-28 2024-03-19 杭州快付传媒科技有限公司 基于移动互联网的流量数据统计分析方法
CN117726378B (zh) * 2023-12-28 2024-09-24 杭州快付传媒科技有限公司 基于移动互联网的流量数据统计分析方法

Similar Documents

Publication Publication Date Title
CN111062757B (zh) 基于多路径寻优匹配的信息推荐方法及系统
CN110503531B (zh) 时序感知的动态社交场景推荐方法
CN109559208A (zh) 一种信息推荐方法、服务器及计算机可读介质
CN110147821B (zh) 目标用户群体确定方法、装置、计算机设备及存储介质
CN107341716A (zh) 一种恶意订单识别的方法、装置及电子设备
CN106022800A (zh) 一种用户特征数据的处理方法和装置
CN112001754A (zh) 用户画像生成方法、装置、设备及计算机可读介质
CN111666275A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN108109004A (zh) 相似人群扩展方法、装置及电子设备
CN111784403A (zh) 基于网上商城的用户类别分析方法、装置和计算机设备
CN113032668A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN109447103B (zh) 一种基于硬聚类算法的大数据分类方法、装置及设备
CN112488863A (zh) 一种在用户冷启动场景下的险种推荐方法及相关设备
CN110717097A (zh) 业务推荐方法、装置、计算机设备和存储介质
CN112990386A (zh) 用户价值聚类方法、装置、计算机设备和存储介质
CN117495513B (zh) 一种基于大数据和人工智能的购物推荐方法及系统
CN113486225B (zh) 一种基于大数据的企业画像展现方法及系统
CN110020918B (zh) 一种推荐信息生成方法和系统
CN116151857A (zh) 一种营销模型的构建方法及装置
CN114266594A (zh) 一种基于东南亚跨境电商平台的大数据分析方法
CN110427558B (zh) 资源处理事件的推送方法及装置
Huang et al. Clustering analysis on e-commerce transaction based on k-means clustering
CN112036988A (zh) 标签生成方法和装置、存储介质及电子设备
CN113297467A (zh) 推荐方法、装置及计算机存储介质
CN112131485A (zh) 房源推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201016

RJ01 Rejection of invention patent application after publication