CN105281925A - 网络业务用户群组划分的方法和装置 - Google Patents

网络业务用户群组划分的方法和装置 Download PDF

Info

Publication number
CN105281925A
CN105281925A CN201410307390.7A CN201410307390A CN105281925A CN 105281925 A CN105281925 A CN 105281925A CN 201410307390 A CN201410307390 A CN 201410307390A CN 105281925 A CN105281925 A CN 105281925A
Authority
CN
China
Prior art keywords
group
standard
data
central point
standardized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410307390.7A
Other languages
English (en)
Other versions
CN105281925B (zh
Inventor
杨向勇
艾志兵
刘黎春
陈川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410307390.7A priority Critical patent/CN105281925B/zh
Priority to PCT/CN2015/082396 priority patent/WO2016000562A1/en
Publication of CN105281925A publication Critical patent/CN105281925A/zh
Priority to US15/395,714 priority patent/US9817885B2/en
Application granted granted Critical
Publication of CN105281925B publication Critical patent/CN105281925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/02Details
    • H04L12/16Arrangements for providing special services to substations
    • H04L12/18Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
    • H04L12/1859Arrangements for providing special services to substations for broadcast or conference, e.g. multicast adapted to provide push services, e.g. data channels
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/58Message adaptation for wireless communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种网络业务用户群组划分的方法,包括步骤:获取多个用户在当前统计周期内的属性和/或行为数据,将属性和/或行为数据转换为标准化数据;根据标准化数据确定多个群组中心点,将标准化数据划分到距离最近的群组中心点所在群组;根据所述各个群组中的标准化数据,确定各个群组的群组特征;根据各个群组的群组特征,分别向各个群组的用户推送对应的业务推送信息。本发明还公开了一种网络业务用户群组划分的装置。本发明根据用户属性和/或行为数据对用户群组进行精细划分,使划分后的群组具备各自的群组特征,划分更加准确,使业务信息推送更加合理。

Description

网络业务用户群组划分的方法和装置
技术领域
本发明涉及到互联网技术领域,特别涉及到网络业务用户群组划分的方法和装置。
背景技术
随着互联网技术的发展,网络应用软件、网络游戏、网络资讯、网络视频等网络业务被广泛应用,各种网络业务的用户数量众多,增长速度非常快,新老用户交替更新频率也较高。为了进一步推广网络业务,运营商常常会向用户发送业务推广信息,以增加网络业务及其附加业务的用户使用量。但是,现有的信息推送方式常常采用随机推送、全部推送等方式,或者根据运营方经验来划分用户群组,针对不同的用户群组推送不同的信息。但是,由于用户数量多,随机性较大,且每个时间段各用户关注的重点可能会发生变化,传统的划分方式无法自适应的划分用户群组,可能会造成信息推广不合理,针对性较差,一方面达不到信息推送目的,另一方面也会对用户造成困扰。
发明内容
本发明实施例提供一种网络业务用户群组划分的方法和装置,使网络业务的用户群组划分更加精细、合理。
本发明实施例提出一种网络业务用户群组划分的方法,包括步骤:
获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属性和/或行为数据包括多个统计指标,并将所述属性和/或行为数据转换为标准化数据;
根据所述标准化数据,确定多个群组中心点,将所述标准化数据划分到距离最近的群组中心点所在群组;
根据所述各个群组中的标准化数据,确定各个群组的群组特征;
根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送信息。
本发明实施例还提出一种网络业务用户群组划分的装置,包括:
数据统计模块,用于获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属性和/或行为数据包括多个统计指标;
数据转换模块,用于将所述属性和/或行为数据转换为标准化数据;
数据分组模块,用于根据所述标准化数据,确定多个群组中心点,将所述标准化数据划分到距离最近的群组中心点所在群组;
特征确定模块,用于根据所述各个群组中的标准化数据,确定各个群组的群组特征;
信息推送模块,用于根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送信息。
本发明实施例根据用户属性和/或行为数据对用户群组进行精细划分,使划分后的群组具备各自的群组特征,划分更加准确,使业务信息推送更加合理。
附图说明
图1为本发明实施例中网络业务用户群组划分的装置所在服务器的总线图;
图2为本发明网络业务用户群组划分的方法的第一实施例的流程图;
图3为本发明网络业务用户群组划分的方法的第一实施例中分类型数据标准化的步骤流程图;
图4为本发明网络业务用户群组划分的方法的第一实施例中划分群组的步骤流程图;
图5为本发明网络业务用户群组划分的方法的第一实施例中确定群组特征的步骤流程图;
图6为本发明网络业务用户群组划分的方法的第一实施例中确定群组特征的进一步详细步骤流程图;
图7为本发明网络业务用户群组划分的方法的第二实施例的流程图;
图8为本发明实施例的网络业务用户群组划分的装置的结构示意图;
图9为本发明实施例中同一个统计指标的各个群组的偏差概率的图表示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1为本发明实施例中网络业务用户群组划分的装置所在服务器的总线图。该服务器可以包括:至少一个处理器101,例如CPU,至少一个网络接口104,用户接口103,存储器105,至少一个通信总线102。其中,通信总线102用于实现这些组件之间的连接通信。其中,用户接口103可以包括显示屏(Display)、键盘(Keyboard),还可以包括标准的有线接口、无线接口。网络接口104可以包括标准的有线接口、无线接口(如WIFI接口)。存储器105可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器105还可以是至少一个位于远离前述处理器101的存储装置。作为一种计算机存储介质的存储器105中可以包括操作系统、网络通信模块、用户接口模块以及用户群组划分程序。
在图1所示的网络业务用户群组划分的装置所在服务器中,网络接口104主要用于连接终端设备或其他服务器,与终端设备或其他服务器进行数据通信;而用户接口103主要用于接收管理员、运营商等用户指令,并与管理员、运营商等用户进行交互;而处理器101可以用于调用存储器105中存储的用户群组划分程序,并执行以下操作:
通过网络接口104获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属性和/或行为数据包括多个统计指标;
将属性和/或行为数据转换为标准化数据;
根据标准化数据,确定多个群组中心点,将标准化数据划分到距离最近的群组中心点所在群组;
根据所述各个群组中的标准化数据,确定各个群组的群组特征;
根据各个群组的群组特征,通过网络接口104分别向各个群组的用户推送对应群组特征的业务推送信息。
在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以执行以下操作:
根据所述各个群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概率,比较各个群组中同一个统计指标的偏差概率大小,获取所述统计指标的偏差概率较其他群组差异最显著的群组,将所述统计指标的数值特征作为该群组的群组特征。
在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以执行以下操作:
当所述属性和/或行为数据为连续型数据时,采用以下公式将属性和/或行为数据转换为标准化数据:
Xji标准=(Xji-Xjmin)÷(Xjmax-Xjmin);
Ui标准=(X1i标准,X2i标准,……,Xji标准,……,Xmi标准);
其中,Xji标准为Xji转换后的标准化数据,Xjmax为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最大的属性和/或行为数据,Xjmin为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最小的属性和/或行为数据;
在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以执行以下操作:
当所述属性和/或行为数据为分类型数据时,采用以下方式将属性和/或行为数据转换为标准化数据:
对同一个统计指标中属性和/或行为数据的取值进行分类,相同的取值分为一类,分类后的取值包括Y1、Y2、……、Ye、……、Yf,其中f为取值分类总个数,e为取值的分类序号,Ye为第e类取值;
判断f是否小于或等于2;
当f小于或等于2时,判断Y1和Y2是否仅为0或1;
如果是,则无需数值转换,原属性和/或行为数据作为标准化数据Xji;
如果否,则将Y1转换为0、Y2转换为1,或将Y1转换为1、Y2转换为0,将转换后的数据作为标准化数据Xji;
当f大于2时,若所述属性和/或行为数据的取值为Ye,则使Ye对应的取值为1、除Ye之外的取值为0,按照Y1、Y2、……、Ye、……、Yf的排列顺序,将所述属性和/或行为数据的取值转换为f位的二值型数据,并将转换后的二值型数据乘以获得标准化数据Xji标准
在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以执行以下操作:
从所有标准化数据中获取任一个作为第一个初始群组中心点C01;
从除去C01之外的标准化数据中查找距离C01最远的标准化数据,作为第二个初始群组中心点C02;
从除去C01、C02之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1和至C02的距离Di2,选择Di1和Di2中较小值作为Ui标准至中心点集合{C01,C02}的距离,比较各标准化数据至中心点集合{C01,C02}的距离的大小,选取至中心点集合{C01,C02}的距离最大的标准化数据作为第三个初始群组中心点C03;
从除去C01、C02、C03之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1、至C02的距离Di2和至C03的距离Di3,选择Di1、Di2和Di3中最小值作为Ui标准至中心点集合{C01,C02,C03}的距离,比较各标准化数据至中心点集合{C01,C02,C03}的距离的大小,选取至中心点集合{C01,C02,C03}的距离最大的标准化数据作为第四个初始群组中心点C04;
以此类推,直至确定k个初始群组中心点C01、C02、……、C0k,其中k为预设的群组总个数;
计算每一个标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最小的初始群组中心点所在群组;
分别计算各个群组中标准化数据的平均值,分别作为第一次迭代后的k个修正群组中心点C11、C12、……、C1k;
计算每一个标准化数据至第一次迭代后的各修正群组中心点的距离,将标准化数据划分到距离最小的修正群组中心点所在群组;
分别计算第一次迭代后各个群组中标准化数据的平均值,分别作为第二次迭代后的k个修正群组中心点C21、C22、……、C2k;
以此类推,直至在计算本次迭代后的修正群组中心点与对应的前一次迭代后的修正群组中心点之间的距离后,k个距离之和在预设范围内,或直至迭代次数达到预设次数,则将本次迭代后的k个修正群组中心点作为最终群组中心点;
计算每一个标准化数据至各最终群组中心点的距离,将标准化数据划分到距离最小的最终群组中心点所在群组。
在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以执行以下操作:
计算所有标准化数据的各个统计指标的平均值:
Q01标准、Q02标准、……、Q0j标准、……、Q0m标准
Q0j标准=(Xj1标准+Xj2标准+……+Xjn标准)÷n;
其中Q0j标准为所有标准化数据中第j个统计指标的平均值;
在最终确定的群组中,分别计算各个群组中各统计指标的平均值Qt1标准、Qt2标准、……、Qtj标准、……、Qtm标准,其中t为群组序号,1≤t≤k,Qtj标准为第t个群组中第j个统计指标的平均值;
分别计算各个群组中各个统计指标的偏差概率:
Pt1标准、Pt2标准、……、Ptj标准、……、Ptm标准
Ptj标准=(Qtj标准-Q0j标准)÷Q0j标准
其中,Ptj标准为第t个群组中第j个统计指标的偏差概率;
比较P1j标准、P2j标准、……、Ptj标准、……、Pkj标准的大小,获取第j个统计指标中偏差概率较其他群组差异最显著的群组,将第j个统计指标的数值特征作为该群组的群组特征。
在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以执行以下操作:
获取下一个统计周期的用户的属性和/或行为数据,并将下一个统计周期的用户的属性和/或行为数据转换为标准化数据;
将下一个统计周期的用户的标准化数据划分到距离最近的群组中心点所在群组;
根据下一个统计周期的用户所在群组的群组特征,向下一个统计周期的用户推送对应群组特征的业务推送信息。
本实施例图1所描述的网络业务用户群组划分的装置所在服务器,根据用户属性和/或行为数据对用户群组进行精细划分,使划分后的群组具备各自的群组特征,划分更加准确,使业务信息推送更加合理。
如图2所示,图2为本发明网络业务用户群组划分的方法的第一实施例的流程图。本实施例提到的网络业务用户群组划分的方法,包括步骤:
步骤S10,获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属性和/或行为数据包括多个统计指标,将属性和/或行为数据转换为标准化数据;
用户在通过终端设备访问网络业务时,服务器会接收到对应的操作指令,并根据这些操作指令执行对应的网络业务操作,同时,为了对用户进行合理划分群组,服务器还对用户操作的数据进行统计,包括用户周期内访问总天数、周期内访问总次数、周期内访问总时长、参与的附加项目总个数、投入资本等多个统计指标的数据,多个统计指标的属性和/或行为数据组合起来,构成该用户的属性和/或行为数据,该属性和/或行为数据包括多个维度,即一个维度对应一个统计指标。由于各个统计指标的单位和统计标准不同,为了便于群组划分,需将属性和/或行为数据中各个统计指标的属性和/或行为数据转换为统一标准,即标准化数据。
步骤S20,根据标准化数据,确定多个群组中心点,将标准化数据划分到距离最近的群组中心点所在群组;
按照预设的群组划分个数确定群组中心点的个数,每一个群组包括一个群组中心点,群组中心点可从标准化数据中选取,也可以由标准化数据求均值、均方根等方式获得,或采用k-means聚类算法获得。在确定群组中心点后,将每一个标准化数据与各个群组中心点比较,找到距离该标准化数据最近的一个群组中心点,将该标准化数据划分到该群组中心点所在群组中。
步骤S30,根据各个群组中的标准化数据,确定各个群组的群组特征;
在完成群组划分后,需对该组特点进行分析。每个标准化数据中都包括了多个统计指标,各个群组中标准化数据存在差异,对各个群组中标准化数据的差异性进行分析,几个确定该群组的群组特征。
步骤S40,根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送信息。
在完成群组划分以及特征分析后,服务器根据特征制定推送方案,向各个群组的用户终端推送相应特征的业务信息,例如在网络视频业务中,对于访问新闻类视频较多的用户推送更新的新闻资讯,对于访问电视剧较多的用户推送最近更新的热播电视剧等。
本实施例根据用户属性和/或行为数据对用户群组进行精细划分,使划分后的群组具备各自的群组特征,划分更加准确,使业务信息推送更加合理。
进一步的,步骤S10中,属性和/或行为数据包括:
U1=(X11,X21,……,Xj1,……,Xm1);
U2=(X12,X22,……,Xj2,……,Xm2);
……;
Ui=(X1i,X2i,……,Xji,……,Xmi);
……;
Un=(X1n,X2n,……,Xjn,……,Xmn);
其中,i为用户的序号,n为获取的用户总个数,Ui为第i个用户的属性和/或行为数据,j为属性和/或行为数据的统计指标的序号,m为属性和/或行为数据的统计指标的总个数,Xj为第j个统计指标的属性和/或行为数据,Xji为第i个用户的第j个统计指标的属性和/或行为数据。
例如,将上述属性和/或行为数据表示为下表:
进一步的,当属性和/或行为数据为连续型数据时,例如连续数字的取值范围,将属性和/或行为数据转换为标准化数据采用以下公式:
Xji标准=(Xji-Xjmin)÷(Xjmax-Xjmin);
Ui标准=(X1i标准,X2i标准,……,Xji标准,……,Xmi标准);
其中,Xji标准为Xji转换后的标准化数据,Xjmax为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最大的属性和/或行为数据,Xjmin为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最小的属性和/或行为数据。
采用上述方式将连续型属性和/或行为数据中各个统计指标的属性和/或行为数据转换为统一标准的标准化数据,有利于弱化各个统计指标的单位和统计标准不同的问题,简化了多维度的属性和/或行为数据的计算难度,便于群组划分的处理流程。
如图3所示,图3为本发明网络业务用户群组划分的方法的第一实施例中分类型数据标准化的步骤流程图。本实施例的属性和/或行为数据为分类型数据,例如用户等级分为一级、二级、三级,会员类型分为非会员、普通会员、高级会员,与图2所示实施例中对连续型数据标准化所采用的方式不同,本实施例要将分类型的属性和/或行为数据转换为标准化数据,可采用以下步骤:
步骤S101,对同一个统计指标中属性和/或行为数据的取值进行分类,相同的取值分为一类,分类后的取值包括Y1、Y2、……、Ye、……、Yf,其中f为取值分类总个数,e为取值的分类序号,Ye为第e类取值;
步骤S102,判断f是否小于或等于2;如果是,则执行步骤S103;如果否,则执行步骤S106;
步骤S103,判断Y1和Y2是否仅为0或1;如果是,则执行步骤S104;如果否,则执行步骤S105;
步骤S104,无需数值转换,原属性和/或行为数据作为标准化数据Xji;
对于f小于或等于2,且Y1和Y2仅为0或1的情况,举例说明,假设统计指标为会员类型,包括会员和非会员两类,则会员对应取值为1,非会员对应取值为0,则无需数值转换,原属性和/或行为数据作为标准化数据Xji。
步骤S105,将Y1转换为0、Y2转换为1,或将Y1转换为1、Y2转换为0,将转换后的数据作为标准化数据Xji;
对于f小于或等于2,且Y1和Y2不仅仅为0和1的情况,举例说明,假设统计指标为用户等级,包括一级用户和二级用户两类,一级用户对应数值为1,二级用户对应数值为2,则需将其进行数值转换,使转换后的一级用户赋值为0(或1),转换后的二级用户赋值为1(或0)。
步骤S106,若属性和/或行为数据的取值为Ye,则使Ye对应的取值为1、除Ye之外的取值为0,按照Y1、Y2、……、Ye、……、Yf的排列顺序,将属性和/或行为数据的取值转换为f位的二值型数据,并将转换后的二值型数据乘以获得标准化数据Xji标准
对于f大于2的情况,举例说明,假设统计指标为会员类型,包括普通会员、银卡会员、金卡会员三类,则需将其进行数值转换,普通会员对应Y1、银卡会员对应Y2、金卡会员对应Y3;用户U1为普通会员,则Y1=1、Y2=0、Y3=0,用户U1的会员类型的取值转换后的二值型数据为(1,0,0);用户U2为银卡会员,则Y1=0、Y2=1、Y3=0,用户U2的会员类型的取值转换后的二值型数据为(0,1,0);用户U3为金卡会员,则Y1=0、Y2=0、Y3=1,用户U3的会员类型的取值转换后的二值型数据为(0,0,1)。此外,在计算两个标准化数据之间距离时,为了使距离范围在0~1之间,对于f大于2的情况,在进行二值型数据转换后,还需将转换后的二值型数据乘以例如,上述实施例中,用户U1的会员类型的标准化数据为(0,0),用户U2的会员类型的标准化数据为(0,0),用户U1的会员类型的标准化数据为(0,0,)。
采用上述方式将分类型属性和/或行为数据中各个统计指标的属性和/或行为数据转换为统一标准的标准化数据,使不同取值的统计指标采用0~1的标准化数据代替,简化了多维度的属性和/或行为数据的计算难度,便于群组划分的处理流程。
如图4所示,图4为本发明网络业务用户群组划分的方法的第一实施例中划分群组的步骤流程图。本实施例是对图2所示实施例中的步骤S20详细说明,采用k-means聚类算法进行群组划分,其中群组中心点包括了初始群组中心点、修正群组中心点和最终群组中心点,步骤S20具体包括以下步骤:
步骤S201,从所有标准化数据中获取任一个作为第一个初始群组中心点C01;
步骤S202,从除去C01之外的标准化数据中查找距离C01最远的标准化数据,作为第二个初始群组中心点C02;
在所有的标准化数据中除去已经被选为第一个初始群组中心点C01的数据,剩下的数据分别与C01计算距离。两个标准化数据之间的距离采用欧氏距离公式计算,例如,取C01=U1=(X11,X21,……,Xj1,……,Xm1),计算Ui=(X1i,X2i,……,Xji,……,Xmi)与C01之间的距离,可采用以下公式:
Di = ( X 11 - X 1 i ) 2 + ( X 21 - X 2 i ) 2 + . . . + ( Xj 1 - Xji ) 2 + . . . + ( Xm 1 - Xmi ) 2 ;
Di值最大的标准化数据即为距离C01最远的标准化数据,作为第二个初始群组中心点C02。
步骤S203,从除去C01、C02之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1和至C02的距离Di2,选择Di1和Di2中较小值作为Ui标准至中心点集合{C01,C02}的距离,比较各标准化数据至中心点集合{C01,C02}的距离的大小,选取至中心点集合{C01,C02}的距离最大的标准化数据作为第三个初始群组中心点C03;
在计算第三个初始群组中心点C03时,计算除去C01、C02之外的标准化数据至中心点集合{C01,C02}的距离,选取距离中心点集合{C01,C02}最远的一个数据标准化数据作为第三个初始群组中心点C03。
步骤S204,从除去C01、C02、C03之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1、至C02的距离Di2和至C03的距离Di3,选择Di1、Di2和Di3中最小值作为Ui标准至中心点集合{C01,C02,C03}的距离,比较各标准化数据至中心点集合{C01,C02,C03}的距离的大小,选取至中心点集合{C01,C02,C03}的距离最大的标准化数据作为第四个初始群组中心点C04;
步骤S205,以此类推,直至确定k个初始群组中心点C01、C02、……、C0k,其中k为预设的群组总个数;
在计算后续的初始群组中心点时,采用与计算C03同理的方式,直至找到预设数量的初始群组中心点。
步骤S206,计算每一个标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最小的初始群组中心点所在群组;
在确定初始群组中心点后,对各标准化数据进行初始划分群组,仍然采用欧氏距离公式计算标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最近的初始群组中心点所在群组。
步骤S207,分别计算各个群组中标准化数据的平均值,分别作为第一次迭代后的k个修正群组中心点C11、C12、……、C1k;
完成初始划分群组后,采用求取群组平均值的方式获得一次迭代的群组中心点修正值,即修正群组中心点。求取平均值采用对该群组中各个统计指标的标准化数据分别求平均值即可,例如,第一个群组中包括以下数据:
U1=(X11,X21,……,Xj1,……,Xm1);
U3=(X13,X23,……,Xj3,……,Xm3);
U5=(X15,X22,……,Xj5,……,Xm5);
则第一次迭代后的第一个修正群组中心点为:
C 11 = ( X 11 + X 13 + X 15 3 , X 21 + X 23 + X 25 3 , . . . , Xm 1 + Xm 3 + Xm 5 3 ) .
步骤S208,计算每一个标准化数据至第一次迭代后的各修正群组中心点的距离,将标准化数据划分到距离最小的修正群组中心点所在群组;
重新对各标准化数据进行群组划分,仍然采用欧氏距离公式计算标准化数据至各修正群组中心点的距离,将标准化数据划分到距离最近的修正群组中心点所在群组。
步骤S209,分别计算第一次迭代后各个群组中标准化数据的平均值,分别作为第二次迭代后的k个修正群组中心点C21、C22、……、C2k;
步骤S210,以此类推,直至在计算本次迭代后的修正群组中心点与对应的前一次迭代后的修正群组中心点之间的距离后,k个距离之和在预设范围内,或直至迭代次数达到预设次数,则将本次迭代后的k个修正群组中心点作为最终群组中心点;
经过多次迭代,反复求取修正群组中心点和群组划分,直至多次迭代后的修正群组中心点无变化或变化细微,或达到预设迭代次数,则停止迭代。在判断前后两次迭代后的修正群组中心点无变化或变化细微时,可采用以下方式:
例如,第一次迭代后的k个修正群组中心点C11、C12、……、C1k,第二次迭代后的k个修正群组中心点C21、C22、……、C2k;
计算前后两次迭代后的对应的修正群组中心点之间的距离:
C11与C21的距离D1,C12与C22的距离D2,……,C1k与C2k的距离Dk;
可分别判断D1、D2、……、Dk是否在预设范围内;
另外还可以对D1、D2、……、Dk求和,得到距离之和Sum(D),判断Sum(D)是否在预设范围内;
当各D1、D2、……、Dk均在预设范围内,或Sum(D)在预设范围内,则认为前后两次迭代后的修正群组中心点无变化或变化细微。
步骤S211,计算每一个标准化数据至各最终群组中心点的距离,将标准化数据划分到距离最小的最终群组中心点所在群组。
在获得最终的群组中心点后,再次将各标准化数据划分到距离最近的最终群组中心点所在群组,完成群组划分。
本实施例采用了k-means聚类算法对用户群组进行精细划分,使划分后的群组更加准确,有利于业务信息的合理推送。
如图5所示,图5为本发明网络业务用户群组划分的方法的第一实施例中确定群组特征的步骤流程图。本实施例是对图2所示实施例中的步骤S30详细说明,步骤S30具体包括以下步骤:
步骤S300,根据各个群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概率,比较各个群组中同一个统计指标的偏差概率大小,获取该统计指标中偏差概率较其他群组差异最显著的群组,将该统计指标的数值特征作为该群组的群组特征。
在确定群组特征时,可比较各个群组中同一个统计指标的偏差概率大小,比较出特征最明显的一个群组,将该统计指标的数值特征作为该群组的群组特征,例如统计指标为访问次数,群组1的访问次数的偏差概率较其他群组大很多,则群组1的访问次数的数值特征为访问次数较多,该数值特征即作为群组1的群组特征,群组2的访问次数的偏差概率较其他群组小很多,则群组2的访问次数的数值特征为访问次数较少,该数值特征即作为群组2的群组特征。求取偏差概率可采用多种方式,例如,在一个群组中,获取一个统计指标的所有标准化数据,求取这些标准化数据的均值或均方根作为偏差概率,然后再来比较各个偏差概率的大小。
本实施例对统计指标中各个群组的偏差概率进行计算,以确定群组的群组特征,划分后的群组具备各自的群组特征,业务信息推送使按照各群组的特征进行推送,使信息推送更加合理。
如图6所示,图6为本发明网络业务用户群组划分的方法的第一实施例中确定群组特征的进一步详细步骤流程图。本实施例对图5所示实施例中的步骤S300详细说明,具体包括以下步骤:
步骤S301,计算所有标准化数据的各个统计指标的平均值:
Q01标准、Q02标准、……、Q0j标准、……、Q0m标准
Q0j标准=(Xj1标准+Xj2标准+……+Xjn标准)÷n;
其中Q0j标准为所有标准化数据中第j个统计指标的平均值;
步骤S302,在最终确定的群组中,分别计算各个群组中各个统计指标的平均值Qt1标准、Qt2标准、……、Qtj标准、……、Qtm标准,其中t为群组的序号,1≤t≤k,Qtj标准为第t个群组中第j个统计指标的平均值;
例如,一个群组中包括以下标准化数据:
U1标准=(X11标准,X21标准,……,Xj1标准,……,Xm1标准);
U3标准=(X13标准,X23标准,……,Xj3标准,……,Xm3标准);
U5标准=(X15标准,X22标准,……,Xj5标准,……,Xm5标准);
则Qtj标准=(Xj1标准+Xj3标准+Xj5标准)÷3;
步骤S303,分别计算各个群组中各个统计指标的偏差概率:
Pt1标准、Pt2标准、……、Ptj标准、……、Ptm标准
Ptj标准=(Qtj标准-Q0j标准)÷Q0j标准
其中,Ptj标准为第t个群组中第j个统计指标的偏差概率;
步骤S304,比较P1j标准、P2j标准、……、Ptj标准、……、Pkj标准的大小,获取第j个统计指标中偏差概率较其他群组差异最显著的群组,将第j个统计指标的数值特征作为该群组的群组特征。
采用上述方式获得同一个统计指标中各个群组的偏差概率,可一并参考图9所示图表,在图表中,群组1的偏差最显著,且相对其他群组来说偏差较大,则将该统计指标的数值特征作为群组1的群组特征,即群组1的该统计指标偏差较大。如果统计指标中各群组的偏差概率区别不明显,则可重新设置群组划分个数或重新选择用户属性和/或行为数据,重新确定群组中心点以及群组划分,在重新确定群组中心点时,可选择与前一次相同的点作为初始群组中心点,以使后续群组的划分更加稳定。此外,计算偏差概率时也可以不采用标准化数据,直接采用属性和/或行为数据同样可以得到群组的群组特征。
本实施例对统计指标中各个群组的偏差概率进行计算,以确定群组的群组特征,划分后的群组具备各自的群组特征,业务信息推送使按照各群组的特征进行推送,使信息推送更加合理。
如图7所示,图7为本发明网络业务用户群组划分的方法的第二实施例的流程图。本实施例包括了图2所示实施例中的所有步骤,并在步骤S40之后增加了以下步骤:
步骤S50,获取下一个统计周期的用户的属性和/或行为数据,并将所述下一个统计周期的用户的属性和/或行为数据转换为标准化数据;
步骤S60,将下一个统计周期的用户的标准化数据划分到距离最近的群组中心点所在群组;
步骤S70,根据下一个统计周期的用户所在群组的群组特征,向下一个统计周期的用户推送对应群组特征的业务推送信息。
在图2至图6所示实施例中,获得了一个群组划分的固定模型,在后续统计周期内,只需要将用户属性和/或行为数据套用到该固定模型中,即可实现用户的群组划分,具体的执行流程可参照图2至图6所示实施例,在此不做赘述。由于采用了上述实施例中的固定模型,在后续统计周期内可使用户群组划分更加快速、准确,有利于提高业务信息推送的合理性、准确性和快捷性。
如图8所示,图8为本发明实施例的网络业务用户群组划分的装置的结构示意图。本实施例提到的网络业务用户群组划分的装置,包括:
数据统计模块210,用于获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属性和/或行为数据包括多个统计指标;
数据转换模块220,用于将属性和/或行为数据转换为标准化数据;
数据分组模块230,用于根据标准化数据,确定多个群组中心点,将标准化数据划分到距离最近的群组中心点所在群组;
特征确定模块240,用于根据所述各个群组中的标准化数据,确定各个群组的群组特征;
信息推送模块250,用于根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送信息。
用户在通过终端设备访问网络业务时,服务器会接收到对应的操作指令,并根据这些操作指令执行对应的网络业务操作,同时,为了对用户进行合理划分群组,服务器还对用户操作的数据进行统计,包括用户周期内访问总天数、周期内访问总次数、周期内访问总时长、参与的附加项目总个数、投入资本等多个统计指标的数据,多个统计指标的属性和/或行为数据组合起来,构成该用户的属性和/或行为数据,该属性和/或行为数据包括多个维度,即一个维度对应一个统计指标。由于各个统计指标的单位和统计标准不同,为了便于群组划分,需将属性和/或行为数据中各个统计指标的属性和/或行为数据转换为统一标准,即标准化数据。
按照预设的群组划分个数确定群组中心点的个数,每一个群组包括一个群组中心点,群组中心点可从标准化数据中选取,也可以由标准化数据求均值、均方根等方式获得,或采用k-means聚类算法获得。在确定群组中心点后,将每一个标准化数据与各个群组中心点比较,找到距离该标准化数据最近的一个群组中心点,将该标准化数据划分到该群组中心点所在群组中。
在完成群组划分后,需对该组特点进行分析。由于每个标准化数据中都包括了多个统计指标,各个群组中标准化数据存在差异,对各个群组中标准化数据的差异性进行分析,几个确定该群组的群组特征。
在完成群组划分以及特征分析后,服务器根据特征制定推送方案,向各个群组的用户终端推送相应特征的业务信息,例如在网络视频业务中,对于访问新闻类视频较多的用户推送更新的新闻资讯,对于访问电视剧较多的用户推送最近更新的热播电视剧等。
本实施例根据用户属性和/或行为数据对用户群组进行精细划分,使划分后的群组具备各自的群组特征,划分更加准确,使业务信息推送更加合理。
进一步的,数据统计模块210获取的属性和/或行为数据包括:
U1=(X11,X21,……,Xj1,……,Xm1);
U2=(X12,X22,……,Xj2,……,Xm2);
……;
Ui=(X1i,X2i,……,Xji,……,Xmi);
……;
Un=(X1n,X2n,……,Xjn,……,Xmn);
其中,i为用户的序号,n为获取的用户总个数,Ui为第i个用户的属性和/或行为数据,j为属性和/或行为数据的统计指标的序号,m为属性和/或行为数据的统计指标的总个数,Xj为第j个统计指标的属性和/或行为数据,Xji为第i个用户的第j个统计指标的属性和/或行为数据。
例如,将上述属性和/或行为数据表示为下表:
进一步的,当属性和/或行为数据为连续型数据时,例如连续数字的取值范围,数据转换模块220采用以下公式将属性和/或行为数据转换为标准化数据:
Xji标准=(Xji-Xjmin)÷(Xjmax-Xjmin);
Ui标准=(X1i标准,X2i标准,……,Xji标准,……,Xmi标准);
其中,Xji标准为Xji转换后的标准化数据,Xjmax为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最大的属性和/或行为数据,Xjmin为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最小的属性和/或行为数据。
采用上述方式将连续型属性和/或行为数据中各个统计指标的属性和/或行为数据转换为统一标准的标准化数据,有利于弱化各个统计指标的单位和统计标准不同的问题,简化了多维度的属性和/或行为数据的计算难度,便于群组划分的处理流程。
进一步的,当属性和/或行为数据为分类型数据时,例如用户等级分为一级、二级、三级,会员类型分为非会员、普通会员、高级会员,数据转换模块220采用以下方式将属性和/或行为数据转换为标准化数据:
对同一个统计指标中属性和/或行为数据的取值进行分类,相同的取值分为一类,分类后的取值包括Y1、Y2、……、Ye、……、Yf,其中f为取值分类总个数,e为取值的分类序号,Ye为第e类取值;
判断f是否小于或等于2;
当f小于或等于2时,判断Y1和Y2是否仅为0或1;
如果是,则无需数值转换,原属性和/或行为数据作为标准化数据Xji;
如果否,则将Y1转换为0、Y2转换为1,或将Y1转换为1、Y2转换为0,将转换后的数据作为标准化数据Xji;
当f大于2时,若属性和/或行为数据的取值为Ye,则使Ye对应的取值为1、除Ye之外的取值为0,按照Y1、Y2、……、Ye、……、Yf的排列顺序,将属性和/或行为数据的取值转换为f位的二值型数据,并将转换后的二值型数据乘以获得标准化数据Xji标准
对于f小于或等于2,且Y1和Y2仅为0或1的情况,举例说明,假设统计指标为会员类型,包括会员和非会员两类,则会员对应取值为1,非会员对应取值为0,则无需数值转换,原属性和/或行为数据作为标准化数据Xji。
对于f小于或等于2,且Y1和Y2不仅仅为0和1的情况,举例说明,假设统计指标为用户等级,包括一级用户和二级用户两类,一级用户对应数值为1,二级用户对应数值为2,则需将其进行数值转换,使转换后的一级用户赋值为0(或1),转换后的二级用户赋值为1(或0)。
对于f大于2的情况,举例说明,假设统计指标为会员类型,包括普通会员、银卡会员、金卡会员三类,则需将其进行数值转换,普通会员对应Y1、银卡会员对应Y2、金卡会员对应Y3;用户U1为普通会员,则Y1=1、Y2=0、Y3=0,用户U1的会员类型的取值转换后的二值型数据为(1,0,0);用户U2为银卡会员,则Y1=0、Y2=1、Y3=0,用户U2的会员类型的取值转换后的二值型数据为(0,1,0);用户U3为金卡会员,则Y1=0、Y2=0、Y3=1,用户U3的会员类型的取值转换后的二值型数据为(0,0,1)。此外,在计算两个标准化数据之间距离时,为了使距离范围在0~1之间,对于f大于2的情况,在进行二值型数据转换后,还需将转换后的二值型数据乘以例如,上述实施例中,用户U1的会员类型的标准化数据为(0,0),用户U2的会员类型的标准化数据为(0,0),用户U1的会员类型的标准化数据为(0,0,)。
采用上述方式将分类型属性和/或行为数据中各个统计指标的属性和/或行为数据转换为统一标准的标准化数据,使不同取值的统计指标采用0~1的标准化数据代替,简化了多维度的属性和/或行为数据的计算难度,便于群组划分的处理流程。
进一步的,群组中心点包括初始群组中心点、修正群组中心点和最终群组中心点;数据分组模块230还用于:
从所有标准化数据中获取任一个作为第一个初始群组中心点C01;
从除去C01之外的标准化数据中查找距离C01最远的标准化数据,作为第二个初始群组中心点C02;
从除去C01、C02之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1和至C02的距离Di2,选择Di1和Di2中较小值作为Ui标准至中心点集合{C01,C02}的距离,比较各标准化数据至中心点集合{C01,C02}的距离的大小,选取至中心点集合{C01,C02}的距离最大的标准化数据作为第三个初始群组中心点C03;
从除去C01、C02、C03之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1、至C02的距离Di2和至C03的距离Di3,选择Di1、Di2和Di3中最小值作为Ui标准至中心点集合{C01,C02,C03}的距离,比较各标准化数据至中心点集合{C01,C02,C03}的距离的大小,选取至中心点集合{C01,C02,C03}的距离最大的标准化数据作为第四个初始群组中心点C04;
以此类推,直至确定k个初始群组中心点C01、C02、……、C0k,其中k为预设的群组总个数;
计算每一个标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最小的初始群组中心点所在群组;
分别计算各个群组中标准化数据的平均值,分别作为第一次迭代后的k个修正群组中心点C11、C12、……、C1k;
计算每一个标准化数据至第一次迭代后的各修正群组中心点的距离,将标准化数据划分到距离最小的修正群组中心点所在群组;
分别计算第一次迭代后各个群组中标准化数据的平均值,分别作为第二次迭代后的k个修正群组中心点C21、C22、……、C2k;
以此类推,直至在计算本次迭代后的修正群组中心点与对应的前一次迭代后的修正群组中心点之间的距离后,k个距离之和在预设范围内,或直至迭代次数达到预设次数,则将本次迭代后的k个修正群组中心点作为最终群组中心点;
计算每一个标准化数据至各最终群组中心点的距离,将标准化数据划分到距离最小的最终群组中心点所在群组。
本实施例采用k-means聚类算法进行群组划分,其中群组中心点包括了初始群组中心点、修正群组中心点和最终群组中心点。首先获取任一个作为第一个初始群组中心点C01。在所有的标准化数据中除去已经被选为第一个初始群组中心点C01的数据,剩下的数据分别与C01计算距离。两个标准化数据之间的距离采用欧氏距离公式计算,例如,取C01=U1=(X11,X21,……,Xj1,……,Xm1),计算Ui=(X1i,X2i,……,Xji,……,Xmi)与C01之间的距离,可采用以下公式:
Di = ( X 11 - X 1 i ) 2 + ( X 21 - X 2 i ) 2 + . . . + ( Xj 1 - Xji ) 2 + . . . + ( Xm 1 - Xmi ) 2 ;
Di值最大的标准化数据即为距离C01最远的标准化数据,作为第二个初始群组中心点C02。
在计算第三个初始群组中心点C03时,计算除去C01、C02之外的标准化数据至中心点集合{C01,C02}的距离,选取距离中心点集合{C01,C02}最远的一个数据标准化数据作为第三个初始群组中心点C03。在计算后续的初始群组中心点时,采用与计算C03同理的方式,直至找到预设数量的初始群组中心点。
在确定初始群组中心点后,对各标准化数据进行初始划分群组,仍然采用欧氏距离公式计算标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最近的初始群组中心点所在群组。
完成初始划分群组后,采用求取群组平均值的方式获得一次迭代的群组中心点修正值,即修正群组中心点。求取平均值采用对该群组中各个统计指标的标准化数据分别求平均值即可,例如,第一个群组中包括以下数据:
U1=(X11,X21,……,Xj1,……,Xm1);
U3=(X13,X23,……,Xj3,……,Xm3);
U5=(X15,X22,……,Xj5,……,Xm5);
则第一次迭代后的第一个修正群组中心点为:
C 11 = ( X 11 + X 13 + X 15 3 , X 21 + X 23 + X 25 3 , . . . , Xm 1 + Xm 3 + Xm 5 3 ) .
重新对各标准化数据进行群组划分,仍然采用欧氏距离公式计算标准化数据至各修正群组中心点的距离,将标准化数据划分到距离最近的修正群组中心点所在群组。经过多次迭代,反复求取修正群组中心点和群组划分,直至多次迭代后的修正群组中心点无变化或变化细微,或达到预设迭代次数,则停止迭代。在判断前后两次迭代后的修正群组中心点无变化或变化细微时,可采用以下方式:
例如,第一次迭代后的k个修正群组中心点C11、C12、……、C1k,第二次迭代后的k个修正群组中心点C21、C22、……、C2k;
计算前后两次迭代后的对应的修正群组中心点之间的距离:
C11与C21的距离D1,C12与C22的距离D2,……,C1k与C2k的距离Dk;
可分别判断D1、D2、……、Dk是否在预设范围内;
另外还可以对D1、D2、……、Dk求和,得到距离之和Sum(D),判断Sum(D)是否在预设范围内;
当各D1、D2、……、Dk均在预设范围内,或Sum(D)在预设范围内,则认为前后两次迭代后的修正群组中心点无变化或变化细微。
在获得最终的群组中心点后,再次将各标准化数据划分到距离最近的最终群组中心点所在群组,完成群组划分。
本实施例采用了k-means聚类算法对用户群组进行精细划分,使划分后的群组更加准确,有利于业务信息的合理推送。
进一步的,特征确定模块240用于:
根据各个群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概率,比较各个群组中同一个统计指标的偏差概率大小,获取统计指标的偏差概率较其他群组差异最显著的群组,将统计指标的数值特征作为该群组的群组特征。
在确定群组特征时,可比较各个群组中同一个统计指标的偏差概率大小,比较出特征最明显的一个群组,将该统计指标的数值特征作为该群组的群组特征,例如统计指标为访问次数,群组1的访问次数的偏差概率较其他群组大很多,则群组1的访问次数的数值特征为访问次数较多,该数值特征即作为群组1的群组特征,群组2的访问次数的偏差概率较其他群组小很多,则群组2的访问次数的数值特征为访问次数较少,该数值特征即作为群组2的群组特征。求取偏差概率可采用多种方式,例如,在一个群组中,获取一个统计指标的所有标准化数据,求取这些标准化数据的均值或均方根作为偏差概率,然后再来比较各个偏差概率的大小。
本实施例对统计指标中各个群组的偏差概率进行计算,以确定群组的群组特征,划分后的群组具备各自的群组特征,业务信息推送使按照各群组的特征进行推送,使信息推送更加合理。
进一步的,特征确定模块240还用于:
计算所有标准化数据的各个统计指标的平均值:
Q01标准、Q02标准、……、Q0j标准、……、Q0m标准
Q0j标准=(Xj1标准+Xj2标准+……+Xjn标准)÷n;
其中Q0j标准为所有标准化数据中第j个统计指标的平均值;
在最终确定的群组中,分别计算各个群组中各个统计指标的平均值Qt1标准、Qt2标准、……、Qtj标准、……、Qtm标准,其中t为群组的序号,1≤t≤k,Qtj 为第t个群组中第j个统计指标的平均值;
分别计算各个群组中各个统计指标的偏差概率:
Pt1标准、Pt2标准、……、Ptj标准、……、Ptm标准
Ptj标准=(Qtj标准-Q0j标准)÷Q0j标准
其中,Ptj标准为第t个群组中第j个统计指标的偏差概率;
比较P1j标准、P2j标准、……、Ptj标准、……、Pkj标准的大小,获取第j个统计指标中偏差概率较其他群组差异最显著的群组,将第j个统计指标的数值特征作为该群组的群组特征。
采用上述方式获得同一个统计指标中各个群组的偏差概率,可一并参考图9所示图表,在图表中,群组1的偏差最显著,且相对其他群组来说偏差较大,则将该统计指标的数值特征作为群组1的群组特征,即群组1的该统计指标偏差较大。如果统计指标中各群组的偏差概率区别不明显,则可重新设置群组划分个数或重新选择用户属性和/或行为数据,重新确定群组中心点以及群组划分,在重新确定群组中心点时,可选择与前一次相同的点作为初始群组中心点,以使后续群组的划分更加稳定。此外,计算偏差概率时也可以不采用标准化数据,直接采用属性和/或行为数据同样可以得到群组的群组特征。
本实施例对统计指标中各个群组的偏差概率进行计算,以确定群组的群组特征,划分后的群组具备各自的群组特征,业务信息推送使按照各群组的特征进行推送,使信息推送更加合理。
进一步的,数据统计模块210还用于,获取下一个统计周期的用户的属性和/或行为数据;
数据转换模块220还用于,将下一个统计周期的用户的属性和/或行为数据转换为标准化数据;
数据分组模块230还用于,将下一个统计周期的用户的标准化数据划分到距离最近的群组中心点所在群组;
信息推送模块250还用于,根据下一个统计周期的用户所在群组的群组特征,向下一个统计周期的用户推送对应群组特征的业务推送信息。
在上述实施例中,获得了一个群组划分的固定模型,在后续统计周期内,只需要将用户属性和/或行为数据套用到该固定模型中,即可实现用户的群组划分。由于采用了上述实施例中的固定模型,在后续统计周期内可使用户群组划分更加快速、准确,有利于提高业务信息推送的合理性、准确性和快捷性。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (18)

1.一种网络业务用户群组划分的方法,其特征在于,包括步骤:
获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属性和/或行为数据包括多个统计指标,并将所述属性和/或行为数据转换为标准化数据;
根据所述标准化数据,确定多个群组中心点,将所述标准化数据划分到距离最近的群组中心点所在群组;
根据所述各个群组中的标准化数据,确定各个群组的群组特征;
根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送信息。
2.如权利要求1所述的网络业务用户群组划分的方法,其特征在于,所述根据所述各个群组中的标准化数据,确定各个群组的群组特征的步骤包括:
根据所述各个群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概率,比较各个群组中同一个统计指标的偏差概率大小,获取所述统计指标的偏差概率较其他群组差异最显著的群组,将所述统计指标的数值特征作为该群组的群组特征。
3.如权利要求2所述的网络业务用户群组划分的方法,其特征在于,所述属性和/或行为数据包括:
U1=(X11,X21,……,Xj1,……,Xm1);
U2=(X12,X22,……,Xj2,……,Xm2);
……;
Ui=(X1i,X2i,……,Xji,……,Xmi);
……;
Un=(X1n,X2n,……,Xjn,……,Xmn);
其中,i为用户的序号,n为获取的用户总个数,Ui为第i个用户的属性和/或行为数据,j为属性和/或行为数据的统计指标的序号,m为属性和/或行为数据的统计指标的总个数,Xj为第j个统计指标的属性和/或行为数据,Xji为第i个用户的第j个统计指标的属性和/或行为数据。
4.如权利要求3所述的网络业务用户群组划分的方法,其特征在于,当所述属性和/或行为数据为连续型数据时,所述将属性和/或行为数据转换为标准化数据采用以下公式:
Xji标准=(Xji-Xjmin)÷(Xjmax-Xjmin);
Ui标准=(X1i标准,X2i标准,……,Xji标准,……,Xmi标准);
其中,Xji标准为Xji转换后的标准化数据,Xjmax为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最大的属性和/或行为数据,Xjmin为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最小的属性和/或行为数据。
5.如权利要求3所述的网络业务用户群组划分的方法,其特征在于,当所述属性和/或行为数据为分类型数据时,所述将属性和/或行为数据转换为标准化数据采用以下步骤:
对同一个统计指标中属性和/或行为数据的取值进行分类,相同的取值分为一类,分类后的取值包括Y1、Y2、……、Ye、……、Yf,其中f为取值分类总个数,e为取值的分类序号,Ye为第e类取值;
判断f是否小于或等于2;
当f小于或等于2时,判断Y1和Y2是否仅为0或1;
如果是,则无需数值转换,原属性和/或行为数据作为标准化数据Xji;
如果否,则将Y1转换为0、Y2转换为1,或将Y1转换为1、Y2转换为0,将转换后的数据作为标准化数据Xji;
当f大于2时,若所述属性和/或行为数据的取值为Ye,则使Ye对应的取值为1、除Ye之外的取值为0,按照Y1、Y2、……、Ye、……、Yf的排列顺序,将所述属性和/或行为数据的取值转换为f位的二值型数据,并将转换后的二值型数据乘以获得标准化数据Xji标准
6.如权利要求2所述的网络业务用户群组划分的方法,其特征在于,所述群组中心点包括初始群组中心点、修正群组中心点和最终群组中心点;所述根据标准化数据,确定多个群组中心点,将所述标准化数据划分到距离最近的群组中心点所在群组的步骤包括:
从所有标准化数据中获取任一个作为第一个初始群组中心点C01;
从除去C01之外的标准化数据中查找距离C01最远的标准化数据,作为第二个初始群组中心点C02;
从除去C01、C02之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1和至C02的距离Di2,选择Di1和Di2中较小值作为Ui标准至中心点集合{C01,C02}的距离,比较各标准化数据至中心点集合{C01,C02}的距离的大小,选取至中心点集合{C01,C02}的距离最大的标准化数据作为第三个初始群组中心点C03;
从除去C01、C02、C03之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1、至C02的距离Di2和至C03的距离Di3,选择Di1、Di2和Di3中最小值作为Ui标准至中心点集合{C01,C02,C03}的距离,比较各标准化数据至中心点集合{C01,C02,C03}的距离的大小,选取至中心点集合{C01,C02,C03}的距离最大的标准化数据作为第四个初始群组中心点C04;
以此类推,直至确定k个初始群组中心点C01、C02、……、C0k,其中k为预设的群组总个数;
计算每一个标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最小的初始群组中心点所在群组;
分别计算各个群组中标准化数据的平均值,分别作为第一次迭代后的k个修正群组中心点C11、C12、……、C1k;
计算每一个标准化数据至第一次迭代后的各修正群组中心点的距离,将标准化数据划分到距离最小的修正群组中心点所在群组;
分别计算第一次迭代后各个群组中标准化数据的平均值,分别作为第二次迭代后的k个修正群组中心点C21、C22、……、C2k;
以此类推,直至在计算本次迭代后的修正群组中心点与对应的前一次迭代后的修正群组中心点之间的距离后,k个距离之和在预设范围内,或直至迭代次数达到预设次数,则将本次迭代后的k个修正群组中心点作为最终群组中心点;
计算每一个标准化数据至各最终群组中心点的距离,将标准化数据划分到距离最小的最终群组中心点所在群组。
7.如权利要求6所述的网络业务用户群组划分的方法,其特征在于,两个标准化数据之间的距离为欧氏距离。
8.如权利要求4或5所述的网络业务用户群组划分的方法,其特征在于,所述根据各个群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概率,比较各个群组中同一个统计指标的偏差概率大小,获取所述统计指标中偏差概率较其他群组差异最显著的群组,将所述统计指标的数值特征作为该群组的群组特征的步骤包括:
计算所有标准化数据的各个统计指标的平均值:
Q01标准、Q02标准、……、Q0j标准、……、Q0m标准
Q0j标准=(Xj1标准+Xj2标准+……+Xjn标准)÷n;
其中Q0j标准为所有标准化数据中第j个统计指标的平均值;
在最终确定的群组中,分别计算各个群组中各统计指标的平均值Qt1标准、Qt2标准、……、Qtj标准、……、Qtm标准,其中t为群组序号,1≤t≤k,Qtj标准为第t个群组中第j个统计指标的平均值;
分别计算各个群组中各个统计指标的偏差概率:
Pt1标准、Pt2标准、……、Ptj标准、……、Ptm标准
Ptj标准=(Qtj标准-Q0j标准)÷Q0j标准
其中,Ptj标准为第t个群组中第j个统计指标的偏差概率;
比较P1j标准、P2j标准、……、Ptj标准、……、Pkj标准的大小,获取第j个统计指标中偏差概率较其他群组差异最显著的群组,将第j个统计指标的数值特征作为该群组的群组特征。
9.如权利要求2所述的网络业务用户群组划分的方法,其特征在于,所述根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送信息的步骤之后还包括:
获取下一个统计周期的用户的属性和/或行为数据,并将所述下一个统计周期的用户的属性和/或行为数据转换为标准化数据;
将所述下一个统计周期的用户的标准化数据划分到距离最近的群组中心点所在群组;
根据所述下一个统计周期的用户所在群组的群组特征,向所述下一个统计周期的用户推送对应群组特征的业务推送信息。
10.一种网络业务用户群组划分的装置,其特征在于,包括:
数据统计模块,用于获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属性和/或行为数据包括多个统计指标;
数据转换模块,用于将所述属性和/或行为数据转换为标准化数据;
数据分组模块,用于根据所述标准化数据,确定多个群组中心点,将所述标准化数据划分到距离最近的群组中心点所在群组;
特征确定模块,用于根据所述各个群组中的标准化数据,确定各个群组的群组特征;
信息推送模块,用于根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送信息。
11.如权利要求10所述的网络业务用户群组划分的装置,其特征在于,所述特征确定模块用于:
根据所述各个群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概率,比较各个群组中同一个统计指标的偏差概率大小,获取所述统计指标的偏差概率较其他群组差异最显著的群组,将所述统计指标的数值特征作为该群组的群组特征。
12.如权利要求11所述的网络业务用户群组划分的装置,其特征在于,所述数据统计模块获取的属性和/或行为数据包括:
U1=(X11,X21,……,Xj1,……,Xm1);
U2=(X12,X22,……,Xj2,……,Xm2);
……;
Ui=(X1i,X2i,……,Xji,……,Xmi);
……;
Un=(X1n,X2n,……,Xjn,……,Xmn);
其中,i为用户的序号,n为获取的用户总个数,Ui为第i个用户的属性和/或行为数据,j为属性和/或行为数据的统计指标的序号,m为属性和/或行为数据的统计指标的总个数,Xj为第j个统计指标的属性和/或行为数据,Xji为第i个用户的第j个统计指标的属性和/或行为数据。
13.如权利要求12所述的网络业务用户群组划分的装置,其特征在于,当所述属性和/或行为数据为连续型数据时,所述数据转换模块采用以下公式将属性和/或行为数据转换为标准化数据:
Xji标准=(Xji-Xjmin)÷(Xjmax-Xjmin);
Ui标准=(X1i标准,X2i标准,……,Xji标准,……,Xmi标准);
其中,Xji标准为Xji转换后的标准化数据,Xjmax为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最大的属性和/或行为数据,Xjmin为当前统计周期内第j个统计指标的所有属性和/或行为数据中数值最小的属性和/或行为数据。
14.如权利要求12所述的网络业务用户群组划分的装置,其特征在于,当所述属性和/或行为数据为分类型数据时,所述数据转换模块采用以下方式将属性和/或行为数据转换为标准化数据:
对同一个统计指标中属性和/或行为数据的取值进行分类,相同的取值分为一类,分类后的取值包括Y1、Y2、……、Ye、……、Yf,其中f为取值分类总个数,e为取值的分类序号,Ye为第e类取值;
判断f是否小于或等于2;
当f小于或等于2时,判断Y1和Y2是否仅为0或1;
如果是,则无需数值转换,原属性和/或行为数据作为标准化数据Xji;
如果否,则将Y1转换为0、Y2转换为1,或将Y1转换为1、Y2转换为0,将转换后的数据作为标准化数据Xji;
当f大于2时,若所述属性和/或行为数据的取值为Ye,则使Ye对应的取值为1、除Ye之外的取值为0,按照Y1、Y2、……、Ye、……、Yf的排列顺序,将所述属性和/或行为数据的取值转换为f位的二值型数据,并将转换后的二值型数据乘以获得标准化数据Xji标准
15.如权利要求11所述的网络业务用户群组划分的装置,其特征在于,所述群组中心点包括初始群组中心点、修正群组中心点和最终群组中心点;所述数据分组模块还用于:
从所有标准化数据中获取任一个作为第一个初始群组中心点C01;
从除去C01之外的标准化数据中查找距离C01最远的标准化数据,作为第二个初始群组中心点C02;
从除去C01、C02之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1和至C02的距离Di2,选择Di1和Di2中较小值作为Ui标准至中心点集合{C01,C02}的距离,比较各标准化数据至中心点集合{C01,C02}的距离的大小,选取至中心点集合{C01,C02}的距离最大的标准化数据作为第三个初始群组中心点C03;
从除去C01、C02、C03之外的标准化数据中,计算各标准化数据Ui标准分别至C01的距离Di1、至C02的距离Di2和至C03的距离Di3,选择Di1、Di2和Di3中最小值作为Ui标准至中心点集合{C01,C02,C03}的距离,比较各标准化数据至中心点集合{C01,C02,C03}的距离的大小,选取至中心点集合{C01,C02,C03}的距离最大的标准化数据作为第四个初始群组中心点C04;
以此类推,直至确定k个初始群组中心点C01、C02、……、C0k,其中k为预设的群组总个数;
计算每一个标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最小的初始群组中心点所在群组;
分别计算各个群组中标准化数据的平均值,分别作为第一次迭代后的k个修正群组中心点C11、C12、……、C1k;
计算每一个标准化数据至第一次迭代后的各修正群组中心点的距离,将标准化数据划分到距离最小的修正群组中心点所在群组;
分别计算第一次迭代后各个群组中标准化数据的平均值,分别作为第二次迭代后的k个修正群组中心点C21、C22、……、C2k;
以此类推,直至在计算本次迭代后的修正群组中心点与对应的前一次迭代后的修正群组中心点之间的距离后,k个距离之和在预设范围内,或直至迭代次数达到预设次数,则将本次迭代后的k个修正群组中心点作为最终群组中心点;
计算每一个标准化数据至各最终群组中心点的距离,将标准化数据划分到距离最小的最终群组中心点所在群组。
16.如权利要求15所述的网络业务用户群组划分的装置,其特征在于,两个标准化数据之间的距离为欧氏距离。
17.如权利要求13或14所述的网络业务用户群组划分的装置,其特征在于,所述特征确定模块还用于:
计算所有标准化数据的各个统计指标的平均值:
Q01标准、Q02标准、……、Q0j标准、……、Q0m标准
Q0j标准=(Xj1标准+Xj2标准+……+Xjn标准)÷n;
其中Q0j标准为所有标准化数据中第j个统计指标的平均值;
在最终确定的群组中,分别计算各个群组中各统计指标的平均值Qt1标准、Qt2标准、……、Qtj标准、……、Qtm标准,其中t为群组序号,1≤t≤k,Qtj标准为第t个群组中第j个统计指标的平均值;
分别计算各个群组中各个统计指标的偏差概率:
Pt1标准、Pt2标准、……、Ptj标准、……、Ptm标准
Ptj标准=(Qtj标准-Q0j标准)÷Q0j标准
其中,Ptj标准为第t个群组中第j个统计指标的偏差概率;
比较P1j标准、P2j标准、……、Ptj标准、……、Pkj标准的大小,获取第j个统计指标中偏差概率较其他群组差异最显著的群组,将第j个统计指标的数值特征作为该群组的群组特征。
18.如权利要求11所述的网络业务用户群组划分的装置,其特征在于,所述数据统计模块还用于,获取下一个统计周期的用户的属性和/或行为数据;
所述数据转换模块还用于,将所述下一个统计周期的用户的属性和/或行为数据转换为标准化数据;
所述数据分组模块还用于,将所述下一个统计周期的用户的标准化数据划分到距离最近的群组中心点所在群组;
所述信息推送模块还用于,根据所述下一个统计周期的用户所在群组的群组特征,向所述下一个统计周期的用户推送对应群组特征的业务推送信息。
CN201410307390.7A 2014-06-30 2014-06-30 网络业务用户群组划分的方法和装置 Active CN105281925B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201410307390.7A CN105281925B (zh) 2014-06-30 2014-06-30 网络业务用户群组划分的方法和装置
PCT/CN2015/082396 WO2016000562A1 (en) 2014-06-30 2015-06-25 Method and apparatus for grouping network service users
US15/395,714 US9817885B2 (en) 2014-06-30 2016-12-30 Method and apparatus for grouping network service users

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410307390.7A CN105281925B (zh) 2014-06-30 2014-06-30 网络业务用户群组划分的方法和装置

Publications (2)

Publication Number Publication Date
CN105281925A true CN105281925A (zh) 2016-01-27
CN105281925B CN105281925B (zh) 2019-05-14

Family

ID=55018438

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410307390.7A Active CN105281925B (zh) 2014-06-30 2014-06-30 网络业务用户群组划分的方法和装置

Country Status (3)

Country Link
US (1) US9817885B2 (zh)
CN (1) CN105281925B (zh)
WO (1) WO2016000562A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677925A (zh) * 2016-03-30 2016-06-15 北京京东尚科信息技术有限公司 数据库用户数据处理方法和装置
CN106202388A (zh) * 2016-07-08 2016-12-07 武汉斗鱼网络科技有限公司 一种用户等级自动划分方法及系统
CN108566668A (zh) * 2018-04-25 2018-09-21 北京市电话工程有限公司 一种基于小区智能wifi上网的方法
CN108596682A (zh) * 2018-05-03 2018-09-28 惠龙易通国际物流股份有限公司 数据处理方法及系统
CN108734186A (zh) * 2017-04-18 2018-11-02 阿里巴巴集团控股有限公司 自动退出即时通信会话群的方法、装置和系统

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10118017B4 (de) 2001-04-10 2017-04-13 Dendron Gmbh Occlusionswendel und Vorrichtung zur Implantation von Occlusionswendeln
CN107392054A (zh) * 2017-08-23 2017-11-24 爱爱网(深圳)电子商务有限公司 一种隐私阅读的方法和装置
CN109962956B (zh) * 2017-12-26 2022-06-07 中国电信股份有限公司 用于向用户推荐通信业务的方法和系统
CN111047336A (zh) * 2019-12-24 2020-04-21 太平金融科技服务(上海)有限公司 用户标签推送、用户标签展示方法、装置和计算机设备
CN113573242B (zh) * 2020-04-28 2023-03-31 中国移动通信有限公司研究院 重入网用户的识别方法、装置及设备
CN112767042A (zh) * 2021-01-26 2021-05-07 上海乐享似锦科技股份有限公司 一种群组生成方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102135983A (zh) * 2011-01-17 2011-07-27 北京邮电大学 基于网络用户行为的群体划分方法和装置
CN102768667A (zh) * 2011-05-06 2012-11-07 腾讯科技(北京)有限公司 一种推送信息的发布方法和系统
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和系统
CN103605791A (zh) * 2013-12-04 2014-02-26 深圳中兴网信科技有限公司 信息推送系统和信息推送方法
CN103731738A (zh) * 2014-01-23 2014-04-16 哈尔滨理工大学 基于用户群组行为分析的视频推荐方法及装置

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ250926A (en) * 1993-02-23 1996-11-26 Moore Business Forms Inc Relational database: product, consumer and transactional data for retail shopping targeting
US6714975B1 (en) * 1997-03-31 2004-03-30 International Business Machines Corporation Method for targeted advertising on the web based on accumulated self-learning data, clustering users and semantic node graph techniques
US6055573A (en) * 1998-12-30 2000-04-25 Supermarkets Online, Inc. Communicating with a computer based on an updated purchase behavior classification of a particular consumer
US7069308B2 (en) * 2003-06-16 2006-06-27 Friendster, Inc. System, method and apparatus for connecting users in an online computer system based on their relationships within social networks
US8682995B1 (en) * 2004-04-07 2014-03-25 Cisco Technology, Inc. Methods and apparatus for targeting communications using social network metrics
US7818394B1 (en) * 2004-04-07 2010-10-19 Cisco Techology, Inc. Social network augmentation of search results methods and apparatus
US7797345B1 (en) * 2004-04-07 2010-09-14 Cisco Technology, Inc. Restricting hierarchical posts with social network metrics methods and apparatus
US7844671B1 (en) * 2004-04-07 2010-11-30 Cisco Technology, Inc. Communication systems and methods with social network filtering
US7831684B1 (en) * 2004-04-07 2010-11-09 Cisco Technology, Inc. Social network filtering of search results methods and apparatus
US7856449B1 (en) * 2004-05-12 2010-12-21 Cisco Technology, Inc. Methods and apparatus for determining social relevance in near constant time
US20080228699A1 (en) * 2007-03-16 2008-09-18 Expanse Networks, Inc. Creation of Attribute Combination Databases
US7720855B2 (en) * 2007-07-02 2010-05-18 Brown Stephen J Social network for affecting personal behavior
KR100993817B1 (ko) * 2007-12-21 2010-11-12 한국과학기술정보연구원 정보 분석 시스템 및 그 방법
US8762285B2 (en) * 2008-01-06 2014-06-24 Yahoo! Inc. System and method for message clustering
US8255403B2 (en) * 2008-12-30 2012-08-28 Expanse Networks, Inc. Pangenetic web satisfaction prediction system
US8108406B2 (en) * 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
US8386519B2 (en) * 2008-12-30 2013-02-26 Expanse Networks, Inc. Pangenetic web item recommendation system
US8539359B2 (en) * 2009-02-11 2013-09-17 Jeffrey A. Rapaport Social network driven indexing system for instantly clustering people with concurrent focus on same topic into on-topic chat rooms and/or for generating on-topic search results tailored to user preferences regarding topic
CN103167329A (zh) * 2011-12-09 2013-06-19 上海文广互动电视有限公司 基于互动电视的用户行为的信息处理方法
US10282461B2 (en) * 2015-07-01 2019-05-07 Ncino, Inc. Structure-based entity analysis
JP6064855B2 (ja) * 2013-06-17 2017-01-25 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置
US10002180B2 (en) * 2014-03-05 2018-06-19 Ayasdi, Inc. Landmark point selection
US10216828B2 (en) * 2014-03-05 2019-02-26 Ayasdi, Inc. Scalable topological summary construction using landmark point selection
CN103886047B (zh) * 2014-03-12 2017-07-07 浙江大学 面向流式数据的分布式在线推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102135983A (zh) * 2011-01-17 2011-07-27 北京邮电大学 基于网络用户行为的群体划分方法和装置
CN102768667A (zh) * 2011-05-06 2012-11-07 腾讯科技(北京)有限公司 一种推送信息的发布方法和系统
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和系统
CN103605791A (zh) * 2013-12-04 2014-02-26 深圳中兴网信科技有限公司 信息推送系统和信息推送方法
CN103731738A (zh) * 2014-01-23 2014-04-16 哈尔滨理工大学 基于用户群组行为分析的视频推荐方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677925A (zh) * 2016-03-30 2016-06-15 北京京东尚科信息技术有限公司 数据库用户数据处理方法和装置
CN105677925B (zh) * 2016-03-30 2021-10-15 北京京东尚科信息技术有限公司 数据库用户数据处理方法和装置
CN106202388A (zh) * 2016-07-08 2016-12-07 武汉斗鱼网络科技有限公司 一种用户等级自动划分方法及系统
CN106202388B (zh) * 2016-07-08 2017-12-08 武汉斗鱼网络科技有限公司 一种用户等级自动划分方法及系统
CN108734186A (zh) * 2017-04-18 2018-11-02 阿里巴巴集团控股有限公司 自动退出即时通信会话群的方法、装置和系统
CN108566668A (zh) * 2018-04-25 2018-09-21 北京市电话工程有限公司 一种基于小区智能wifi上网的方法
CN108596682A (zh) * 2018-05-03 2018-09-28 惠龙易通国际物流股份有限公司 数据处理方法及系统
CN108596682B (zh) * 2018-05-03 2022-06-24 惠龙易通国际物流股份有限公司 数据处理方法及系统

Also Published As

Publication number Publication date
WO2016000562A1 (en) 2016-01-07
CN105281925B (zh) 2019-05-14
US20170109431A1 (en) 2017-04-20
US9817885B2 (en) 2017-11-14

Similar Documents

Publication Publication Date Title
CN105281925A (zh) 网络业务用户群组划分的方法和装置
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
CN106228386A (zh) 一种信息推送方法及装置
CN103150696A (zh) 选择目标增值业务潜在客户的方法及装置
CN102083010B (zh) 一种用户信息筛选方法和设备
CN111294819B (zh) 一种网络优化方法及装置
CN111614690A (zh) 一种异常行为检测方法及装置
US8788438B2 (en) Method performed in a computer system for aiding the assessment of an influence of a user in or interacting with a communication system by applying social network analysis, SNA, functions, a computer system, computer program and computer program product
CN110322143B (zh) 模型实体化管理方法、装置、设备及计算机存储介质
CN108614843B (zh) 网站内容的评估方法及装置
CN103631939B (zh) 用于搜索引擎的数据处理方法和装置
CN102521706A (zh) Kpi 数据的分析方法及装置
CN110866767A (zh) 电信用户满意度的预测方法、装置、设备及介质
CN109636433A (zh) 基于大数据分析的养卡识别方法、装置、设备和存储介质
CN104408640A (zh) 应用软件推荐方法及装置
CN111652661B (zh) 一种手机客户端用户流失预警处理方法
CN110472834A (zh) 一种推送课程的方法、装置、存储介质和服务器
US20140214826A1 (en) Ranking method and system
CN115879826B (zh) 一种基于大数据的精细化工工艺质检方法、系统及介质
CN106412796B (zh) 一种推荐方法及系统
binti Oseman et al. Data mining in churn analysis model for telecommunication industry
TW202006617A (zh) 雲端自助分析平台與其分析方法
CN110582091A (zh) 定位无线质量问题的方法和装置
CN111190938B (zh) 数据分析方法、装置、存储介质及处理器
CN114723469A (zh) 用户满意度预测与归因的方法、系统以及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant