CN108369674B - 使用目标聚类方法对具有混合属性类型的客户进行细分的系统和方法 - Google Patents

使用目标聚类方法对具有混合属性类型的客户进行细分的系统和方法 Download PDF

Info

Publication number
CN108369674B
CN108369674B CN201680069856.1A CN201680069856A CN108369674B CN 108369674 B CN108369674 B CN 108369674B CN 201680069856 A CN201680069856 A CN 201680069856A CN 108369674 B CN108369674 B CN 108369674B
Authority
CN
China
Prior art keywords
attribute data
data
customer
numeric
demographic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680069856.1A
Other languages
English (en)
Other versions
CN108369674A (zh
Inventor
M·H·哈简
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oracle International Corp
Original Assignee
Oracle International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oracle International Corp filed Critical Oracle International Corp
Publication of CN108369674A publication Critical patent/CN108369674A/zh
Application granted granted Critical
Publication of CN108369674B publication Critical patent/CN108369674B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0203Market surveys; Market polls
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0204Market segmentation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/07User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
    • H04L51/08Annexed information, e.g. attachments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/02User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail using automatic reactions or user delegation, e.g. automatic replies or chatbot-generated messages

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

公开了被配置为使用混合属性类型对客户进行细分的系统、方法和其它实施例。在一个实施例中,读取计算机化的数据结构。该计算机化的数据结构具有与客户相关联并存储在计算机化的存储器中的数值人口统计属性数据、分类人口统计属性数据和目标属性数据。数值人口统计属性数据和分类人口统计属性数据至少部分地基于目标属性数据被转换为相同的数值尺度,以形成一致属性数据,该一致属性数据具有与对该一致属性数据执行聚类分析相兼容的格式。对一致属性数据执行聚类分析以生成表示客户的细分的细分客户数据。细分客户数据可以用于控制由计算机化管理系统执行的至少一个企业功能。

Description

使用目标聚类方法对具有混合属性类型的客户进行细分的系 统和方法
背景技术
客户细分(segmentation)是将客户分成共享与营销相关的类似特性(诸如性别、年龄、教育水平或消费习惯)的分组的实践。零售商基于每个客户都具有不同的需求以及可以通过识别和瞄准具有类似偏好的分组来更好地服务客户的想法来进行客户细分。
聚类分析(clustering analysis)是用于将一组观察结果分类成互斥分组的统计技术。存在各种算法来执行聚类分析,并且这些算法在其聚类构建过程中和其效率方面显著不同。聚类分析可以用作识别具有类似购买行为的客户细分以从客户赚取额外收入的工具。例如,关于客户购物体验的不同方面的基于1至10点满意度调查的结果可以被聚类,以识别对零售商具有类似态度的客户细分。
人口统计(demographic)细分是一种常见策略,其中基于诸如年龄、性别、教育和收入水平之类的人口统计属性来对客户进行分组。细分过程中的一个主要挑战是人口统计属性中存在不同的属性类型。两种常见的属性类型是数值的(numerical)和分类的(categorical)。数值属性是具有可以按升序或降序排列的数值的属性。家庭大小、年龄和收入水平是数值属性的示例。分类属性是其值没有固有顺序的属性。例如,教育、种族和性别是分类属性的示例。
在对客户进行细分时,使用聚类并不总是期望的选项,因为聚类是发现数据中看不见的模式的方法。客户细分是通常根据预定义的目标推导出的,并且因此分类方法更适合于有目标性的细分。但是,分类需要将被标记的聚类识别/定义为用作目标的手动过程。这个过程对于商业用户来说通常是繁重且不期望的。
发明内容
在一个实施例中,公开了一种由计算设备执行的计算机实现的方法,其中计算设备至少包括用于执行来自存储器的指令的处理器。该方法包括:经由至少一个处理器读取计算机化的数据结构,该数据结构具有数值人口统计属性数据、分类人口统计属性数据以及与客户相关联的目标属性数据,并且存储在计算机化的存储器中;至少部分地基于目标属性数据,经由至少一个处理器将数值人口统计属性数据和分类人口统计属性数据转换为相同的数值比例以形成一致(congruent)属性数据,该一致属性数据具有与对该一致属性数据执行聚类分析相兼容的格式;经由至少一个处理器对一致属性数据执行聚类分析以生成表示客户的细分的细分客户数据;生成包括细分客户数据的电子消息;以及经由网络通信将电子消息传送到远程计算系统以使远程计算系统执行至少一个企业功能。
在另一个实施例中,该方法还包括对细分客户数据执行聚合处理以生成最终客户分组。
在另一个实施例中,所述至少一个企业功能包括库存分配功能、需求预测功能或市场细分功能中的至少一个。在另一个实施例中,目标属性数据包括销售数据;数值人口统计属性数据包括与客户相关联的年龄数据、家庭大小数据以及收入水平数据中的至少一个。在另一个实施例中,分类人口统计属性数据包括与客户相关联的职业数据、性别数据和资格数据中的至少一个。
在另一个实施例中,远程计算系统包括企业资源计划系统;远程计算系统包括库存管理和需求预测系统。
在该方法的另一个实施例中,转换包括将分类人口统计属性数据从非数值形式变换为数值形式以生成经变换的人口统计属性数据。
在该方法的另一个实施例中,转换包括对与数值人口统计属性数据和经变换的人口统计属性数据相关联的值进行加权。
在另一个实施例中,公开了一种计算系统,其包括:连接到至少一个存储器的处理器;视觉用户界面模块,其包括存储在非瞬态计算机可读介质中的指令,所述指令当由处理器执行时使处理器促进与客户相关联的数值人口统计属性数据、分类人口统计属性数据以及目标属性数据的读取;分类变换模块,其包括存储在非瞬态计算机可读介质中的指令,被配置为通过将分类人口统计属性数据从非数值形式变换为数值形式来生成经变换的人口统计属性数据;尺度转换模块,其包括存储在非瞬态计算机可读介质中的指令,被配置为至少部分地基于目标属性数据将数值人口统计属性数据和经变换的人口统计属性数据转换为相同的数值尺度,以形成与执行聚类分析相兼容的格式的一致属性数据;以及聚类分析模块,其包括存储在非瞬态计算机可读介质中的指令,被配置为对一致属性数据执行聚类分析以生成表示客户的细分的细分客户数据,其中视觉用户界面模块还被配置为:生成包括细分客户数据的电子消息、以及经由网络通信将该电子消息传送到远程计算系统,以使远程计算系统执行至少一个企业功能。
在另一个实施例中,计算系统还包括数据库设备,该数据库设备被配置为存储至少数值人口统计属性数据、分类人口统计属性数据和目标属性数据。
在计算系统的另一个实施例中,细分客户数据表示基于目标属性数据的客户的细分;其中目标属性数据包括销售数据。
在计算系统的另一个实施例中,所述至少一个企业功能包括库存分配功能、需求预测功能或市场细分功能中的至少一个。
附图说明
结合在本说明书中并构成其一部分的附图图示了本公开的各种系统、方法和其它实施例。将认识到的是,图中所图示的元件边界(例如,框、框的组,或者其它形状)表示边界的一个实施例。在一些实施例中,一个元件可以被设计为多个元件,或者多个元件可以被设计为一个元件。在一些实施例中,示为另一个元件的内部部件的元件可以被实现为外部部件,并且反之亦然。此外,元件可能不是按比例绘制的。
图1图示了计算机系统的一个实施例,其具有配置有混合属性细分模块的计算设备;
图2图示了可以由图1的计算机系统的混合属性细分模块执行的用于生成细分客户数据的方法的一个实施例;
图3以图形方式图示了由图2的方法生成的细分客户数据的示例实施例;
图4-图12图示了使用目标聚类方法对具有混合属性类型的客户进行细分的具体示例;以及
图13图示了可以在其上实现计算系统的混合属性细分模块的计算设备的一个实施例。
具体实施方式
公开了计算机化的系统、方法和其它实施例,其使用指定的目标属性(例如,销售量)将分类属性类型和数值属性类型二者都转换为相同尺度的数值属性。实施例实现与数值数据兼容的任何聚类算法(例如,K-均值)以高效地识别聚类。目标属性有助于推导业务驱动的细分。销售额或销售数量是可以用作目标属性的可容易获得的数据集。
根据一个实施例,计算设备被配置为分析并将数值属性类型和分类属性类型转换为相同的可比较的数值维度,从而使得这些属性类型可由许多聚类算法消耗(例如,可用于输入到许多聚类算法)。销售数据用于计算属性值的权重,这使得聚类算法能够像分类算法一样表现,而无需手动引入聚类标签。一致性度量用于所有类型的属性,从而增强了高效处理数值属性类型和分类属性类型两者的能力。使用相同尺度的输入属性提高了客户细分的质量,并使得聚类算法能够根据目标属性识别不同层中的客户。
本文关于各种实施例使用了以下术语。·
如本文所使用的,术语“项目”或“零售项目”是指在销售环境中出售、购买和/或返回的商品。
如本文所使用的,术语“时段”、“时间时段”、“零售时段”或“日历时段”是指销售者为了计划和预测的目的用来关联日历中从一年到下一年的季节性时段的时间增量单位(例如,7天的一周)。这些术语可以在本文中互换使用。
如本文所使用的,术语“销售渠道”或“位置”或“零售地点”可以指其中销售项目的实体商店或销售项目的在线商店。
如本文所使用的,术语“人口统计性数据”是指归因于客户的数值数据和/或非数值数据(例如,分类数据)。例如,人口统计属性数据可以指客户的年龄数据、家庭大小数据、收入水平数据、种族数据、性别数据和阶层(class)数据。
如本文所使用的,术语“目标属性数据”是指与客户相关联的、不是人口统计数据的数据。例如,目标属性数据可以指例如与客户相关联的销售数据(例如,销售量)。
图1图示了计算机系统100的一个实施例,其具有配置有混合属性细分工具110的计算设备105。例如,在一个实施例中,混合属性细分工具110可以是较大计算机应用的一部分(例如,计算机化库存管理和需求预测应用),其被配置为基于客户人口统计来预测和管理各个零售地点处的零售项目的销售、促销和库存。混合属性细分工具110被配置为使用聚类分析基于目标属性(例如,销售量)来对细分客户的过程进行计算机化。本文描述的实施例以相同尺度的方式考虑客户的数值人口统计属性和分类人口统计属性。
混合属性细分工具110被配置为对分析数据的过程进行计算机化以生成细分客户数据。在一个实施例中,系统100是包括用于企业组织的分布式应用或应用集合的计算/数据处理系统。应用和计算系统100可以被配置为利用基于云的网络系统、软件即服务(SaaS)体系架构或其它类型的计算解决方案来操作或者被实现为基于云的网络系统、软件即服务(SaaS)体系架构或其它类型的计算解决方案。
在一个实施例中,公开了一种计算机算法,其实现用于生成细分客户数据的分析方法。本文假定数值人口统计属性数据和分类人口统计属性数据都可用于使用,并且聚类分析模型被用作细分过程的一部分。
客户细分可以是供应链的重要驱动者,并且可以对零售项目的需求预测的准确度有很大贡献。如果预测不准确,那么分配和补货执行不佳,从而导致零售商的财务损失。可以通过本文公开的实施例来实现项目预测准确度的改进。此外,可以实现对不同客户细分对需求所具有的影响的更好的理解。例如,这有助于零售商更有效地相对于渠道、定价、促销和客户细分进行计划。
参考图1,在一个实施例中,混合属性细分工具110被实现在计算设备105上并且包括用于实现混合属性细分工具110的各种功能方面的逻辑或模块。在一个实施例中,混合属性细分工具110包括视觉用户界面逻辑/模块120、分类变换逻辑/模块130、尺度转换逻辑/模块140和聚类分析逻辑/模块150。
其它实施例可以提供不同的逻辑或逻辑组合,其提供与图1的混合属性细分工具110相同或相似的功能。在一个实施例中,混合属性细分工具110是可执行应用,包括被配置为执行逻辑的功能的算法和/或程序模块。应用被存储在非瞬态计算机存储介质中。即,在一个实施例中,混合属性细分工具110的逻辑被实现为存储在计算机可读介质上的指令的模块。
计算机系统100还包括可操作地连接到计算设备105的显示屏幕160。根据一个实施例,显示屏幕160被实现为显示用户与由视觉用户界面逻辑120生成的图形用户界面(GUI)交互的视图和促进用户与该图形用户界面(GUI)交互,以便查看和更新与生成细分客户数据相关联的信息。图形用户界面可以与混合属性细分应用相关联,并且视觉用户界面逻辑120可以被配置为生成该图形用户界面。
在一个实施例中,计算机系统100是中央化的服务器侧应用,其提供至少本文所公开的功能,并且由许多用户经由与计算机系统100通信的计算设备/终端通过计算机网络进行访问(充当服务器)。因此,显示屏幕160可以表示允许用户经由联网的计算机通信从混合属性细分工具110访问和接收服务的多个计算设备/终端。
在一个实施例中,计算机系统100还包括至少一个数据库设备170,其可操作地连接到计算设备105和/或经由网络连接访问数据库设备170的网络接口。例如,在一个实施例中,数据库设备170可操作地连接到视觉用户界面逻辑120。根据一个实施例,数据库设备170被配置为在数据库系统(例如,计算机化库存管理和需求预测应用)中存储和管理与混合属性细分工具110相关联的数据结构。数据结构可以包括例如与客户相关联的数值人口统计属性数据、分类人口统计属性数据和销售数据的记录。
返回参考图1的混合属性细分工具110的逻辑,在一个实施例中,视觉用户界面逻辑120被配置为生成图形用户界面(GUI)以促进用户与混合属性细分工具110的交互。例如,视觉用户界面逻辑120包括程序代码,其基于所实现的界面的图形设计来生成图形用户界面和使得该图形用户界面被显示。响应于经由GUI的用户动作和选择,可以操纵生成细分客户数据的相关联方面。
例如,在一个实施例中,视觉用户界面逻辑120被配置为响应于用户动作来促进接收输入和读取数据。例如,视觉用户界面逻辑120可以促进与客户相关联的人口统计属性数据(图1中的α和β)和销售数据(图1中的γ)的选择、读取和输入。人口统计属性数据和销售数据可以驻留在与混合属性细分应用(例如,混合属性细分工具110)相关联(并且可经由图形用户界面由其访问)的(例如,在数据库设备170内的)数据结构中。例如,数据可以被读取到与视觉用户界面逻辑120相关联的存储器中的数据结构中。细分客户数据(图1中的∑)的生成可以至少部分地基于数值人口统计属性数据α和分类人口统计属性数据β两者。
数值人口统计属性数据α可以包括例如表示客户的年龄、家庭大小和收入水平的数据。分类人口统计属性数据β可以包括例如表示客户的种族、性别和社会阶层的数据。目标属性数据γ也可以与客户相关联。例如,在一个实施例中,目标属性数据γ包括与每个客户相关联的销售数据(例如,销售量)。目标属性数据γ可以从过去几周的零售时段进行合计,每个过去的周具有分配给它以指示每个客户该周产生的销售量的数值。根据一个实施例,可以经由网络通信访问客户的人口统计属性数据(α和β)和目标属性数据γ。
此外,视觉用户界面逻辑120被配置为经由在显示屏幕160上的图形用户界面促进输出和显示细分客户数据Σ。在一个实施例中,聚类分析逻辑150被配置为可操作地与视觉用户界面逻辑120交互,以促进输出数据结构的细分客户数据Σ的显示。此外,在一个实施例中,分类变换逻辑130和尺度转换逻辑140被配置为与视觉用户界面逻辑120可操作地交互以接收人口统计属性数据(α和β)和目标属性数据γ。在一个实施例中,视觉用户界面逻辑120被配置为生成包括细分客户数据Σ(或其聚合版本)的电子消息。此外,视觉用户界面逻辑120被配置为经由网络通信将电子消息传送到远程计算系统,以使远程计算系统执行如本文稍后讨论的至少一个企业功能。
再次参考图1,在一个实施例中,分类变换逻辑130被配置为通过将客户的分类人口统计属性数据β从非数值形式(例如,文本)变换为数值形成来生成经变换的人口统计属性数据β'。通过将分类人口统计属性数据β变换为数值形式,经变换的人口统计属性数据β'处于与可以进行数值处理的数值人口统计属性数据α类似的形式。本文至少关于“一个算法实施例的细节”部分、“具体示例”部分和图4-图12讨论了执行变换的细节。
例如,分类人口统计属性数据β可以包括关于种族、性别和社会阶层的分类的数据。种族的分类可以包括例如“白人”、“黑人”、“西班牙裔”和“亚洲人”。性别的分类可以包括例如“男性”、“女性”和“变性人”。社会阶层的分类可以包括例如“中下阶层”、“中产阶层”和“上等阶层”。
再次参考图1,在一个实施例中,尺度转换逻辑140被配置为将数值人口统计属性数据α和经变换的人口统计属性数据β'转换为相同的数值尺度以形成一致属性数据Δ。该转换基于目标属性数据γ,诸如,例如,客户的销售数据的销售量。通过将数值人口统计属性数据α和经变换的人口统计属性数据β'转换为相同的数值尺度,一致属性数据Δ是可以由聚类分析算法操作的形式。本文至少关于“一个算法实施例的细节”部分、“具体示例”部分和图4-图12讨论了执行相同尺度转换的细节。
在一个实施例中,聚类分析逻辑150被配置为对一致属性数据执行聚类分析以生成细分客户数据Σ。细分客户数据Σ可以根据例如盈利率来对客户进行细分。例如,在一个实施例中,由细分客户数据Σ表示的第一聚类可以表示最盈利的客户,第二聚类可以表示中等盈利的客户,并且第三聚类可以表示最不盈利的客户。本文至少关于“一个算法实施例的细节”部分、“具体示例”部分和图4-图12讨论了执行聚类分析的细节。
在一个实施例中,可以对(表示客户分组的)细分客户数据执行聚类聚合过程,以进一步组合类似分组以形成最终数量的客户细分(最终数量的分组)。聚类分析逻辑150被配置为执行该聚类聚合过程。本文至少关于“一个算法实施例的细节”部分讨论了执行聚类聚合的细节。
根据一个实施例,(在聚合之前或者在聚合之后的)细分客户数据Σ可以用于控制由计算机化管理系统执行的至少一个企业功能。例如,计算机化管理系统可以是企业资源计划(ERP)系统或库存管理和需求预测系统。受控制的企业功能可以是例如库存分配功能、需求预测功能或市场细分功能。
聚类分析通常不是对客户进行细分的理想选择,因为聚类分析是发现数据中看不见的模式的工具,并且细分通常用于尝试实现已定义的目标。因此,一般而言,分类方法更适合于有目标性的细分。但是,分类需要识别预定义的聚类以用作目标的手动过程。这个过程对于商业用户来说通常是繁重且不可取的。混合属性细分工具110使用目标属性数据(例如,销售数据)来计算属性值的权重。这使得聚类算法能够像细分算法一样表现,而无需手动引入聚类标签。
以这种方式,混合属性细分工具110被配置为基于目标属性数据使用客户的数值人口统计属性数据和分类人口统计属性数据两者来生成细分客户数据。此外,采用聚类分析过程根据目标属性(例如,销售量)来对客户进行细分。一致性度量被用于不同类型的属性,这增强了同时且高效地处理混合属性类型的能力。
图2图示了可以由图1的计算机系统100的混合属性细分工具110执行的用于生成细分客户数据的计算机实现的方法200的一个实施例。方法200描述了混合属性细分工具110的操作,并且被实现为由图1的混合属性细分工具110或由配置有方法200的算法的计算设备来执行。例如,在一个实施例中,方法200由配置为执行计算机应用的计算设备来实现。计算机应用被配置为处理电子形式的数据并且包括执行方法200的功能的所存储的可执行指令。
将从以下角度来描述方法200:对于零售企业的客户,可以收集并分析多种类型和形式的人口统计属性数据,以基于目标属性(诸如例如销售数据)来对客户进行细分。各种类型的人口统计属性数据可以被置于相似的形式,使得可以使用聚类分析技术来对客户进行细分。
人口统计属性数据可以包括数值人口统计属性数据和分类人口统计属性数据两者。本文假定已经记录了在过去的零售时段(例如,过去一年的52周内)已经购买零售企业的零售项目的多个客户的人口统计属性数据和目标属性数据。例如,人口统计属性数据和目标属性数据可以存储在数据库设备170中。根据一个实施例,混合属性细分工具110被配置为从至少一个数据结构(例如,从数据库170中的数据结构)读取客户的人口统计属性数据和目标属性数据。
又一次地,数值人口统计属性数据可以包括例如与多个客户相关联的年龄数据、家庭大小数据和收入水平数据。分类人口统计属性数据可以包括例如与多个客户相关联的种族数据、性别数据和社会阶层数据。目标属性数据可以包括例如具有多个客户中的每个客户的销售量的销售数据。
在发起方法200之后,在框210处,从存储在存储器中的计算机化数据结构读取与多个客户相关联的数值人口统计属性数据、分类人口统计属性数据和目标属性数据。根据一个实施例,读取可以由混合属性细分工具110的视觉用户界面逻辑120执行。例如,属性数据可以驻留在计算设备105的存储器中存储的数据结构中并且从该数据结构中读取。替代地,属性数据可以驻留在数据库设备170的存储器中存储的数据结构中并从该数据结构中读取。例如,属性数据可以被读入到与视觉用户界面逻辑120相关联的数据结构中。
属性数据(数值人口统计、分类人口统计、目标)与多个客户相关联。分类人口统计属性数据(例如,种族、性别、社会阶层)典型地具有与数值人口统计属性数据(例如,年龄、家庭大小、收入水平)的形式(数值)不同的形式(例如,文本)。此外,目标属性数据(如果是销售数据)典型地具有数值形式(例如,销售额和/或销售数量)。
再次参考图2,在框220处,将分类人口统计属性数据从非数值形式(例如,文本)变换为数值形式以生成经变换的人口统计属性数据。在一个实施例中,分类人口统计属性数据的变换由混合属性细分工具110的分类变换逻辑130执行。本文下面至少在“一个算法实施例的细节”部分给出了执行变换的细节。
这时,数值人口统计属性数据和经变换的人口统计属性数据二者都具有数值的形式。但是,数值人口统计属性数据和经变换的人口统计属性数据可以对应于不同的数值尺度。不同的数值尺度可以使得期望用于对属性数据进行操作的算法(例如,聚类算法)可能由于尺度差异而提供错误的结果。因此,另一个变换或转换仍然是需要的。
因此,在框230处,将数值人口统计属性数据和(表示分类人口统计属性数据的)经变换的人口统计属性数据转换为相同的数值尺度以形成一致属性数据。一致属性数据具有与对一致属性数据执行聚类分析相兼容的格式(一致属性数据是该聚类分析的有效输入)。在一个实施例中,通过混合属性细分工具110的尺度转换逻辑140来执行转换。根据一个实施例,基于目标属性数据(例如,销售数据)来计算转换所需的权重。该转换包括使用权重对与数值人口统计属性数据和经变换的人口统计属性数据相关联的值进行归一化(normalized)。这使得两种属性类型(数值和分类)成为可以被聚类算法操作的相同的可比较的数值维度。本文下面至少在“一个算法实施例的细节”部分给出了执行转换的细节。
聚类分析是基于表示对象的特征和对象之间的关系的数据内信息对表示对象(例如,客户)的数据进行分组的分析技术。理想情况下,通过聚类分析形成的分组将相似或相关的对象放在同一分组中,并将不相似或不相关的对象放在不同的分组中。当分组内相似度更高并且分组间差异更大时,对象的聚类更加明显。
参考图2,在框240处,对一致属性数据执行聚类分析以生成表示将客户细分成分组的细分客户数据。在一个实施例中,通过由混合属性细分工具110的聚类分析逻辑150实现的聚类算法来执行聚类分析。在框250处,对(表示客户分组的)细分客户数据执行聚类聚合过程,以组合相似的分组以形成最终数量的客户细分(最终数量的分组)。在一个实施例中,框250的聚合过程由聚类分析逻辑150执行。
根据一个实施例,聚合过程包括为来自框240的每个客户细分计算客户简档、对简档执行聚类分析、以及基于聚类分析合并客户细分以形成经聚合的聚类。即,聚类聚合过程合并来自框240的具有相似客户简档的客户细分。本文在下面至少在“一个算法实施例的细节”部分给出了执行框240和框250的细节。
方法200将与属性数据(数值人口统计、分类人口统计、目标人口统计)相关联的客户有效地细分成分组,其中每个分组的客户展现出特定行为或特性(即,类似的客户简档)。例如,细分客户数据的每个最终分组(即,经聚合的聚类)可以表示盈利水平。第一分组可以表示最盈利的客户分组,第二分组可以表示最不盈利的客户分组,并且第三分组可以表示中等盈利的客户分组。图3在图300中图示了由图2的方法200生成的这样的细分客户数据的示例。在图3中,每个“x”表示最盈利分组310中的客户,每个“+”表示中等盈利分组320中的客户,并且每个“△”表示最不盈利分组330中的客户。
在一个实施例中,使用称为K-means(K-均值)的聚类技术来执行聚类分析,其中可以指定期望的聚类的数量K。初始地,在数据域中建立数量K个质心,并且将(例如表示客户的)每个数据点被分配给数据域内最接近的质心。根据一个实施例,基于一致属性数据的性质来定义数据域。每个聚类的质心基于被分配给该聚类的数据点进行更新。重复分配和更新过程,直到质心不再改变(或在某个指定的容差范围内改变)。根据其它实施例,其它聚类技术也是可能的。本文在下面“具体示例”部分给出了执行聚类的示例。
以这种方式,可以将客户细分成分组,其中每个分组表示由每个分组内的客户提供的不同特性或简档(例如,盈利水平)。在执行细分过程时,将与客户相关联的数值人口统计属性数据和分类人口统计属性数据二者都考虑在内。通过使属性数据/将属性数据转换成相同的数值尺度,可以采用聚类技术来对客户进行细分。
计算机化的管理系统可以使用细分客户数据来控制由计算机化的管理系统执行的至少一个企业功能。例如,可以按照细分客户数据来控制库存分配功能,以在将库存引导至其它销售渠道之前首先将可用库存引导至最盈利分组中的客户购物的销售渠道。例如,这种计算机化管理系统可以是企业资源计划(ERP)系统或库存管理和需求预测系统。
在一个实施例中,生成包括(聚合之前的)细分客户数据或者表示经聚合的客户分组的数据的电子消息。该电子消息可以(例如,经由网络通信)被传送到远程计算系统(例如,计算机化管理系统),以使远程计算系统执行至少一个企业功能。例如,企业功能可以是库存分配功能、需求预测功能或市场细分功能。
一个算法实施例的细节
在一个实施例中,目标是基于特定分类中的销售数据使用人口统计属性来对客户进行细分。输入数据包括在感兴趣的时间时段(例如,至少3个月)内每客户的目标属性值AT和人口统计属性A1,...,Am。根据一个实施例,人口统计属性可以是先前已被确定为具有最高重要性或最相关的那些人口统计属性。
本文使用以下符号:
Cust:所有客户的集合
|Cust|:客户的总数量
Figure BDA0001677815150000141
客户c∈Cust的属性Ai的值
Figure BDA0001677815150000142
客户c∈Cust的属性Ai的权重
Vc:客户c的向量化属性值
|Ai|:属性Ai的不同值的数量
aij:属性Ai的来自“属性重要性”算法的输出的值j,j∈{1,...,|Ai|}
Figure BDA0001677815150000143
属性Ai的权重向量
Figure BDA0001677815150000144
权重向量
Figure BDA0001677815150000145
的值j,j∈{1,...,|Ai|}
Pk:聚类k的客户简档
Si:细分i中客户的集合
Figure BDA0001677815150000151
细分i中的客户价值
算法步骤:
该算法在两个阶段中实现:阶段1:聚类生成,以及阶段2:聚类聚合。
阶段1:聚类生成
1)对于每个Ai,针对所有属性值计算每个人的目标属性的平均值,并从计算出的平均值构建权重向量
Figure BDA0001677815150000152
值通过如下来计算:
Figure BDA0001677815150000153
2)对于每个客户,为客户属性值寻找对应的权重向量值:
Figure BDA0001677815150000154
3)使用
Figure BDA0001677815150000155
值的加权平均来向量化每个客户的目标属性值。作为每个客户的分类值的数值对应物的这个向量是到聚类过程的输入。该向量计算如下:
Figure BDA0001677815150000156
4)对客户向量化值执行K-Means聚类。为了确定聚类的数量,针对一(1)个聚类至数量kmax的聚类执行聚类,并且针对每个聚类数量计算“解释的相对离差(relativedispersion)”。针对数量k的聚类的“解释的相对离差”被定义为:
Figure BDA0001677815150000157
与相对离差的小于0.05的连续变化对应的数量k可以被选择为聚类的最优数量,由kopt表示。
阶段2:聚类聚合
1)计算每个聚类的“客户简档”。聚类的“客户简档”包括基于该聚类中的客户的数量及其属性值计算出的所有属性的归一化分布的集合。客户简档具有维度∑i∈{1,...,m}|Ai|并且通过以下来计算:
Figure BDA0001677815150000161
2)对kopt个聚类的聚类简档集合执行K-Means聚类。该步骤的目标是识别具有相似简档的聚类。对于一(1)个至kopt个聚类执行K-Means,使用在阶段1的步骤4中利用的相同方法寻找聚类的最优数量。所得到的最优数量将是客户细分的最终数量,由sopt表示。
3)根据步骤2中的结果合并步骤1中的客户聚类,从而产生期望的客户细分。
阶段2保证每个细分的唯一简档,从而使得用户能够找到每个细分的区分因素。例如,聚类的区分因素可以是低女性比例和高教育程度。
后处理步骤:通过按照每个人的值计算每个细分中的目标属性值的平均值来确定该细分中的“客户价值”:
Figure BDA0001677815150000162
将客户价值映射到区分因素允许从每个细分中提取见解(insight)。见解的示例是:“最有价值的客户是受过高等教育的女性”。
具体示例
分类:女性针织品
目标属性:一年的女性针织品销售额
人口统计属性:年龄、性别、资格和职业。
阶段1:
1)输入属性中唯一的数值属性是年龄,其根据零售商的指令进行拣选(bin)。所有四个属性都被选择用于细分。属性值如下列出:
年龄:年轻成年人、年轻中年人、较老中年人、老年人
性别:男性、女性
资格:低于平均、文凭、学士学位、其它
职业:雇员、家庭主妇、行政人员、退休人员、学生、教师、其它。
然后针对所有属性计算
Figure BDA0001677815150000171
值,如图4的表410-440中所示。
2)对于每个客户,选择对应的属性权重。例如,图4的表410-440中突出显示了作为具有文凭学位的女性、老年人、家庭主妇的客户#4的权重,并在图5的表500中示出。
3)使用属性权重向量化每个客户的针织品销售额。如图6的表600中所示,计算在针织品分类中具有213美元的总购买行为的同一客户#4的向量。
4)对于所有客户的向量化值执行K-Means聚类。每个输入数据点是与特定客户对应的向量,并且存在与客户数量一样多的数据点。使用图7中所示的离差图700,聚类的最优数量被计算为六(6)。
阶段2:
1)导出每个聚类中每个属性的聚类简档。结果在图8的表810和表830和图形820和图形840以及图9的表910和表930和图形920和图形940中示出。对于每个属性/聚类组合,这些数字应该合计为100%。
2)然后在另一个步骤中将客户简档馈送到K-Means聚类中,以将具有相似客户简档的聚类合并。结果显示在图10的表1010和图形1020中。
3)根据步骤2中的结果,聚类#1和#2被合并以形成一个细分。聚类#3和#4也被合并以形成另一个细分。聚类#5和#6保持不变并且每个聚类将被视为单独的细分。图11中的表1110和图表1120中所示的最终聚类简档被保证至少关于一个属性值是彼此不同的。
后处理:图12中以表1210和饼图1220和饼图1230的形式示出了每个聚类中具有其对应计算出的“客户价值”的客户的相对数量。可以从这些结果推断出几个见解。例如,聚类#4中的客户(仅占客户总数百分之一(1))到目前为止在客户中具有最高的值(价值),而关于他们的最大区分因素是他们的年龄(较老中年人)。
计算设备实施例
图13图示了用本文描述的示例系统和方法中的一个或多个和/或等同物配置和/或编程的示例计算设备。图13图示了可以在其上实现混合属性细分工具的实施例的计算设备的一个示例实施例。示例计算设备可以是计算机1300,其包括通过总线1308可操作地连接的处理器1302、存储器1304以及输入/输出端口1310。
在一个示例中,计算机1300可以包括配置有如本文公开的编程算法的混合属性细分工具1330(对应于来自图1的混合属性细分工具110),以变换和分析与客户相关联的人口统计属性数据并基于目标属性(例如,销售数据)生成细分客户数据。在不同的示例中,工具1330可以用硬件、具有存储的指令的非瞬态计算机可读介质、固件和/或其组合来实现。虽然工具1330被图示为附接到总线1308的硬件组件,但是应该认识到的是,在其它实施例中,工具1330可以被实现在处理器1302、存储在存储器1304中的模块或者存储在盘1306中的模块中。
在一个实施例中,工具1330或计算机1300是用于执行所描述的动作的装置(例如,结构:硬件、非瞬态计算机可读介质、固件)。在一些实施例中,计算设备可以是在云计算系统中操作的服务器、以软件即服务(SaaS)体系架构配置的服务器、智能电话、笔记本电脑、平板计算设备等。
例如,该装置可以被实现为ASIC,该ASIC被编程以促进细分客户数据的生成。该装置还可以被实现为存储的计算机可执行指令,该计算机可执行指令作为临时存储在存储器1304中并且然后由处理器1302执行的数据1316被呈现给计算机1300。
工具1330还可以提供用于使用数值人口统计属性数据和分类人口统计属性数据二者来促进细分客户数据的生成的装置(例如,硬件、存储可执行指令的非瞬态计算机可读介质、固件)。
一般地描述计算机1300的示例配置,处理器1302可以是各种的处理器,包括双微处理器和其它多处理器体系架构。存储器1304可以包括易失性存储器和/或非易失性存储器。非易失性存储器可以包括例如ROM、PROM等等。易失性存储器可以包括例如RAM、SRAM、DRAM等等。
存储盘1306可以经由例如输入/输出接口(例如,卡、设备)1318和输入/输出端口1310可操作地连接到计算机1300。盘1306可以是例如磁盘驱动器、固态盘驱动器、软盘驱动器、带驱动器、Zip驱动器、闪存卡、记忆棒等。此外,盘1306可以是CD-ROM驱动器、CD-R驱动器、CD-RW驱动器、DVD ROM等等。例如,存储器1304可以存储过程1314和/或数据1316。盘1306和/或存储器1304可以存储控制和分配计算机1300的资源的操作系统。
计算机1300可以经由I/O接口1318和输入/输出端口1310与输入/输出设备交互。输入/输出设备可以是例如键盘、麦克风、指向和选择设备、相机、视频卡、显示器、盘1306、网络设备1320等等。输入/输出端口1310可以包括例如串行端口、并行端口和USB端口。
计算机1300可以在网络环境中操作并且因此可以经由I/O接口1318和/或I/O端口1310连接到网络设备1320。通过网络设备1320,计算机1300可以与网络进行交互。通过网络,计算机1300可以在逻辑上连接到远程计算机。计算机1300可以与之交互的网络包括但不限于LAN、WAN和其它网络。
已经描述了被配置为基于目标属性使用数值人口统计属性数据和分类人口统计属性数据二者对客户进行细分的系统、方法和其它实施例。在一个实施例中,分类变换逻辑通过将分类人口统计属性数据从非数值形式变换为数值形式来生成经变换的人口统计属性数据。尺度转换逻辑基于目标属性数据将数值人口统计属性数据和经变换的人口统计属性数据转换为相同的数值尺度以形成一致属性数据,该一致属性数据具有与对一致属性数据执行聚类分析相兼容的格式。聚类分析逻辑对一致属性数据执行聚类分析以生成细分客户数据。细分客户数据表示对客户的细分,并且可以用于控制由计算机化管理系统执行的企业功能。
定义和其它实施例
在另一个实施例中,所描述的方法和/或它们的等同物可以用计算机可执行指令来实现。因此,在一个实施例中,非瞬态计算机可读/存储介质被配置为具有存储的算法/可执行应用的计算机可执行指令,该指令当由(一个或多个)机器执行时使该(一个或多个)机器(和/或相关联的部件)执行所述方法。示例机器包括但不限于处理器、计算机、在云计算系统中操作的服务器、用软件即服务(SaaS)体系架构配置的服务器、智能电话等等。在一个实施例中,计算设备用被实现为具有被配置为执行任何所公开的方法的一个或多个可执行算法。
在一个或多个实施例中,所公开的方法或它们的等同物由以下任一项执行:被配置为执行所述方法的计算机硬件;或体现在非瞬态计算机可读介质中包括被配置为执行所述方法的可执行算法的计算机软件。
虽然为了简化说明的目的,图中图示的方法被示出和描述为算法的一系列框,但是应该认识到的是,这些方法不受框的顺序的限制。一些框可以以与所示出和描述的不同的顺序出现和/或与其它框同时出现。而且,可以使用比全部图示的框少的框来实现示例方法。框可以被组合或分成多个动作/部件。此外,附加的和/或替代的方法可以采用未在框中图示的附加动作。本文描述的方法仅限于依据35U.S.C§101的法定主题。
以下包括本文所采用的所选择术语的定义。定义包括属于术语的范围并且可以用于实现的部件的各种示例和/或形式。示例并不旨在是限制性的。术语的单数和复数形式都可以在定义之内。
对“一个实施例”、“实施例”、“一个示例”、“示例”等的引用指示如此描述的(一个或多个)实施例或(一个或多个)示例可以包括特定的特征、结构、特性、性质、元素或限制,但并非每个实施例或示例都必须包括该特定的特征、结构、特性、性质、元素或限制。此外,重复使用短语“在一个实施例中”不一定指代相同的实施例,但是可以指代相同的实施例。
ASIC:专用集成电路。
CD:紧凑盘。
CD-R:CD可记录的。
CD-RW:CD可重写的。
DVD:数字多功能盘和/或数字视频盘。
HTTP:超文本传输协议。
LAN:局域网。
RAM:随机存取存储器。
DRAM:动态RAM。
SRAM:同步RAM。
ROM:只读存储器。
PROM:可编程ROM。
EPROM:可擦除PROM。
EEPROM:电可擦除PROM。
USB:通用串行总线。
WAN:广域网。
“可操作的连接”或实体通过其“可操作地连接”的连接是其中可以发送和/或接收信号、物理通信和/或逻辑通信的连接。可操作的连接可以包括物理接口、电接口和/或数据接口。可操作的连接可以包括足以允许可操作的控制的接口和/或连接的不同组合。例如,可以可操作地连接两个实体以将信号直接或通过一个或多个中间实体(例如,处理器、操作系统、逻辑,非瞬态计算机可读介质)彼此通信。可操作的连接可以包括生成数据并将数据存储在存储器中的一个实体以及经由例如指令控制从存储器中检索该数据的另一个实体。逻辑和/或物理通信通道可以用于创建可操作的连接。
如本文使用的,“数据结构”是计算系统中存储在存储器、存储设备或其它计算机化系统中的数据的组织。数据结构可以是例如数据字段、数据文件、数据阵列、数据记录、数据库、数据表、图、树、链表等中的任何一个。数据结构可以由许多其它数据结构形成以及包含许多其它数据结构(例如,数据库包括许多数据记录)。根据其它实施例,数据结构的其它示例也是可能的。
如本文所使用的,“计算机可读介质”或“计算机存储介质”是指存储被配置为当被执行时执行所公开的功能中的一个或多个功能的指令和/或数据的非瞬态介质。计算机可读介质可以采取包括但不限于非易失性介质和易失性介质的形式。非易失性介质可以包括例如光盘、磁盘等。易失性介质可以包括例如半导体存储器、动态存储器等。计算机可读介质的常见形式可以包括但不限于软盘、柔性盘、硬盘、磁带、其它磁性介质、专用集成电路(ASIC)、可编程逻辑器件、紧凑型盘(CD)、其它光学介质、随机存取存储器(RAM)、只读存储器(ROM)、存储器芯片或卡、存储棒、固态存储设备(SSD)、闪存驱动器、以及计算机、处理器或其它电子设备可以利用其工作的其它介质。如果每种类型的媒体在一个实施例中被选择用于实现,则其可以包括被配置为执行所公开的和/或所要求保护的功能中的一个或多个功能的算法的存储指令。
如本文所使用的,“逻辑”表示利用计算机或电气硬件、具有存储的可执行应用或程序模块的指令的非瞬态介质和/或这些的组合实现的部件,以执行如本文公开的任何功能或动作,和/或使得来自另一逻辑、方法和/或系统的功能或动作如本文所公开的那样被执行。等效逻辑可以包括固件、利用算法编程的微处理器、离散逻辑(例如,ASIC)、至少一个电路、模拟电路、数字电路、编程的逻辑器件、包含算法的指令的存储器设备等,其中任何一个可以被配置为执行所公开的功能中的一个或多个功能。在一个实施例中,逻辑可以包括一个或多个门、门的组合、或者被配置为执行所公开的功能中的一个或多个能够的其它电路部件。在描述多个逻辑的情况下,有可能将多个逻辑合并到一个逻辑中。类似地,在描述单个逻辑的情况下,有可能在多个逻辑之间分配那单个逻辑。在一个实施例中,这些逻辑中的一个或多个是与执行所公开的和/或所要求保护的功能相关联的对应结构。选择实现哪种类型的逻辑可以基于期望的系统条件或规范。例如,如果考虑更高的速度,则将选择硬件来实现功能。如果考虑更低的成本,则将选择存储的指令/可执行应用来实现功能。逻辑本身不是软件。
如本文所使用的,“用户”包括但不限于一个或多个人、计算机或其它设备、或者这些的组合。
虽然已经相当详细地图示和描述了所公开的实施例,但并不旨在将所附权利要求的范围限制或以任何方式限定到这样的细节。当然,不可能为了描述主题的各个方面而描述部件或方法的每种预期的组合。因此,本公开不限于所示出和描述的特定细节或说明性示例。因此,本公开旨在涵盖落入满足对专利合格发明的法定主题要求的所附权利要求的范围内的变更、修改和变化。
就术语“包括”在具体实施方式或权利要求书中被采用的程度而言,它旨在以类似于当术语“包含”作为过渡词在权利要求中被采用时所解释的方式是包含性的。
就术语“或”在具体实施方式或权利要求书中被采用的程度而言(例如,A或B),其旨在意味着“A或B或这两者”。当申请人旨在指示“仅A或B但不是两者”时,那么将使用短语“仅A或B但不是两者”。因此,术语“或”在本文的使用是包含性的,而不是排他性使用。
就短语“A、B和C中的一个或多个”在本文被使用的程度而言,(例如,被配置为存储A、B和C中的一个或多个的数据存储库)其旨在传达可能性A、B、C、AB、AC、BC和/或ABC的集合(例如,数据存储库可以仅存储A、仅存储B、仅存储C、存储A和B、存储A和C、存储B和C、和/或存储A和B和C)。并不旨在要求A中的一个、B中的一个和C中的一个。当申请人旨在指示“A中的至少一个、B中的至少一个和C中的至少一个”时,那么将使用短语“A中的至少一个、B中的至少一个和C中的至少一个”。

Claims (13)

1.一种由计算设备执行的计算机实现的方法,其中所述计算设备至少包括用于执行来自存储器的指令的处理器,所述方法包括:
经由至少一个处理器读取计算机化的数据结构,所述计算机化的数据结构具有与客户相关联并存储在计算机化的存储器中的数值人口统计属性数据、分类人口统计属性数据以及目标属性数据,其中所述目标属性数据包括所述客户的销售数据;
将所述分类人口统计属性数据从非数值形式变换为数值形式以生成经变换的人口统计属性数据;
至少部分地基于所述目标属性数据,经由所述至少一个处理器将所述数值人口统计属性数据和所述经变换的人口统计属性数据转换为相同的数值尺度以形成一致属性数据,所述一致属性数据具有与对所述一致属性数据执行聚类分析相兼容的格式;
其中,所述转换包括:使用与所述数值人口统计属性数据以及所述经变换的人口统计属性数据的数值相关联的权重来对与所述数值人口统计属性数据相关联的值以及所述经变换的人口统计属性数据的数值进行归一化,使得所述数值人口统计属性数据以及所述经变换的人口统计属性数据二者都被转换到能够被聚类分析操作的相同的可比较的数值尺度;
其中,在所述转换的所述归一化中,用于每个属性数据的权重是根据所述目标属性数据的所述销售数据而计算的,使得所述聚类分析不需要手动地引入聚类标签;
经由所述至少一个处理器对所述一致属性数据执行所述聚类分析以生成表示客户的细分的细分客户数据;
生成包括所述细分客户数据的电子消息;以及
经由网络通信将所述电子消息传送到远程计算系统以使所述远程计算系统执行至少一个企业功能。
2.如权利要求1所述的方法,还包括对所述细分客户数据执行聚合处理以生成最终的客户分组。
3.如权利要求1所述的方法,其中所述至少一个企业功能包括库存分配功能、需求预测功能或市场细分功能中的至少一个。
4.如权利要求1所述的方法,其中所述数值人口统计属性数据包括与客户相关联的年龄数据、家庭大小数据和收入水平数据中的至少一个。
5.如权利要求1所述的方法,其中所述分类人口统计属性数据包括与客户相关联的职业数据、性别数据和资格数据中的至少一个。
6.如权利要求1所述的方法,其中所述远程计算系统包括企业资源计划系统。
7.如权利要求1所述的方法,其中所述远程计算系统包括库存管理和需求预测系统。
8.一种计算系统,包括:
连接到至少一个存储器的处理器;
视觉用户界面模块,其包括存储在非瞬态计算机可读介质中的指令,该指令当由所述处理器执行时使所述处理器促进与客户相关联的数值人口统计属性数据、分类人口统计属性数据以及目标属性数据的读取,其中所述目标属性数据包括所述客户的销售数据;
分类变换模块,其包括存储在所述非瞬态计算机可读介质中的指令,被配置为通过将所述分类人口统计属性数据从非数值形式变换为数值形式来生成经变换的人口统计属性数据;
尺度转换模块,包括存储在所述非瞬态计算机可读介质中的指令,被配置为至少部分地基于所述目标属性数据将所述数值人口统计属性数据和所述经变换的人口统计属性数据转换为相同的数值尺度,以形成一致属性数据,该一致属性数据具有与执行聚类分析相兼容的格式,
其中,所述转换包括:使用与所述数值人口统计属性数据以及所述经变换的人口统计属性数据的数值相关联的权重来对与所述数值人口统计属性数据相关联的值以及所述经变换的人口统计属性数据的数值进行归一化,使得所述数值人口统计属性数据以及所述经变换的人口统计属性数据二者都被转换到能够被聚类分析操作的相同的可比较的数值尺度;
其中,在所述转换的所述归一化中,用于每个属性数据的权重是根据所述目标属性数据的所述销售数据而计算的,使得所述聚类分析不需要手动地引入聚类标签;以及
聚类分析模块,包括存储在所述非瞬态计算机可读介质中的指令,被配置为对所述一致属性数据执行所述聚类分析以生成表示客户的细分的细分客户数据,
其中所述视觉用户界面模块还被配置为:
生成包括所述细分客户数据的电子消息,以及
经由网络通信将所述电子消息传送到远程计算系统,以使所述远程计算系统执行至少一个企业功能。
9.如权利要求8所述的计算系统,还包括数据库设备,所述数据库设备被配置为存储至少所述数值人口统计属性数据、所述分类人口统计数据属性数据和所述目标属性数据。
10.如权利要求8所述的计算系统,其中所述细分客户数据表示基于所述目标属性数据的对客户的细分。
11.如权利要求8所述的计算系统,其中所述至少一个企业功能包括库存分配功能、需求预测功能或市场细分功能中的至少一个。
12.一种存储指令的非瞬态计算机可读介质,所述指令在由至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1-7中任一项所述的计算机实现的方法。
13.一种包括用于执行如权利要求1-7中任一项所述的计算机实现的方法的单元的装置。
CN201680069856.1A 2015-12-09 2016-12-06 使用目标聚类方法对具有混合属性类型的客户进行细分的系统和方法 Active CN108369674B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/963,858 US20170169447A1 (en) 2015-12-09 2015-12-09 System and method for segmenting customers with mixed attribute types using a targeted clustering approach
US14/963,858 2015-12-09
PCT/US2016/065064 WO2017100155A1 (en) 2015-12-09 2016-12-06 System and method for segmenting customers with mixed attribute types using a targeted clustering approach

Publications (2)

Publication Number Publication Date
CN108369674A CN108369674A (zh) 2018-08-03
CN108369674B true CN108369674B (zh) 2022-02-11

Family

ID=57681733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680069856.1A Active CN108369674B (zh) 2015-12-09 2016-12-06 使用目标聚类方法对具有混合属性类型的客户进行细分的系统和方法

Country Status (4)

Country Link
US (1) US20170169447A1 (zh)
JP (1) JP6810745B2 (zh)
CN (1) CN108369674B (zh)
WO (1) WO2017100155A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109615162A (zh) * 2018-10-23 2019-04-12 深圳壹账通智能科技有限公司 用户分组处理方法及装置、电子设备以及存储介质
US11868957B1 (en) * 2019-04-17 2024-01-09 Blue Yonder Group, Inc. System and method of anomaly detection using machine learning and a local outlier factor
US11107097B2 (en) 2019-08-29 2021-08-31 Honda Motor Co., Ltd. System and method for completing trend mapping using similarity scoring
CN110852392A (zh) * 2019-11-13 2020-02-28 中国建设银行股份有限公司 一种用户分群方法、装置、设备和介质
CN111339294B (zh) * 2020-02-11 2023-07-25 普信恒业科技发展(北京)有限公司 客户数据分类方法、装置及电子设备
US11875370B2 (en) * 2020-12-18 2024-01-16 Replenium Inc. Automated replenishment shopping harmonization
CN114064494A (zh) * 2021-11-19 2022-02-18 北京每日菜场科技有限公司 数据异常报警方法、装置、电子设备和计算机可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004213153A (ja) * 2002-12-27 2004-07-29 Ns Solutions Corp 情報表示装置、情報表示方法、その記録媒体およびプログラム
CN101256646A (zh) * 2008-03-20 2008-09-03 上海交通大学 轿车客户需求信息聚类分析系统
JP2015146126A (ja) * 2014-02-03 2015-08-13 富士通株式会社 顧客分析プログラム、顧客分析方法、及び顧客分析装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020194056A1 (en) * 1998-07-31 2002-12-19 Summers Gary J. Management training simulation method and system
US20090132347A1 (en) * 2003-08-12 2009-05-21 Russell Wayne Anderson Systems And Methods For Aggregating And Utilizing Retail Transaction Records At The Customer Level
EP1811446A1 (en) * 2005-12-30 2007-07-25 Accenture Global Services GmbH Statistical modeling methods for determining customer distribution by churn probability within a customer population
US20120066065A1 (en) * 2010-09-14 2012-03-15 Visa International Service Association Systems and Methods to Segment Customers
US20140067472A1 (en) * 2012-08-29 2014-03-06 State Farm Mutual Automobile Insurance Company System and Method For Segmenting A Customer Base
US10410243B2 (en) * 2012-12-22 2019-09-10 Quotient Technology Inc. Automatic recommendation of digital offers to an offer provider based on historical transaction data
US10366420B2 (en) * 2013-11-19 2019-07-30 Transform Sr Brands Llc Heuristic customer clustering
US20150142521A1 (en) * 2013-11-20 2015-05-21 Sears Brands, Llc Customer clustering using integer programming
CN103714139B (zh) * 2013-12-20 2017-02-08 华南理工大学 一种移动海量客户群识别的并行数据挖掘方法
EP2945113A1 (en) * 2014-05-14 2015-11-18 Cisco Technology, Inc. Audience segmentation using machine-learning
US10102281B2 (en) * 2014-10-16 2018-10-16 Accenture Global Services Limited Segmentation discovery, evaluation and implementation platform
CN104615722B (zh) * 2015-02-06 2018-04-27 浙江工业大学 基于密度搜索与快速划分的混合数据聚类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004213153A (ja) * 2002-12-27 2004-07-29 Ns Solutions Corp 情報表示装置、情報表示方法、その記録媒体およびプログラム
CN101256646A (zh) * 2008-03-20 2008-09-03 上海交通大学 轿车客户需求信息聚类分析系统
JP2015146126A (ja) * 2014-02-03 2015-08-13 富士通株式会社 顧客分析プログラム、顧客分析方法、及び顧客分析装置

Also Published As

Publication number Publication date
US20170169447A1 (en) 2017-06-15
JP2018536947A (ja) 2018-12-13
WO2017100155A1 (en) 2017-06-15
JP6810745B2 (ja) 2021-01-06
CN108369674A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
CN108369674B (zh) 使用目标聚类方法对具有混合属性类型的客户进行细分的系统和方法
Sarstedt et al. Treating unobserved heterogeneity in PLS-SEM: A multi-method approach
Vriens et al. Metric conjoint segmentation methods: A Monte Carlo comparison
US20220108407A1 (en) Predictive segmentation of customers
Cao et al. Customer demand prediction of service-oriented manufacturing incorporating customer satisfaction
JP6125627B2 (ja) 消費者ディシジョンツリー生成システム
US20200294067A1 (en) Time series clustering analysis for forecasting demand
JP2019079302A (ja) 営業活動支援システム、営業活動支援方法および営業活動支援プログラム
US20170193538A1 (en) System and method for determining the priority of mixed-type attributes for customer segmentation
US20140067472A1 (en) System and Method For Segmenting A Customer Base
CN111489180A (zh) 参考信息生成方法、系统及装置
US20110251889A1 (en) Inventory clustering
US20160117703A1 (en) Large-Scale Customer-Product Relationship Mapping and Contact Scheduling
CN111861605A (zh) 业务对象推荐方法
Esmaeili et al. Personalizing group recommendation to social network users
KR20150122307A (ko) 광고 제공 방법 및 서버 장치
Jhamtani et al. Size of wallet estimation: Application of K-nearest neighbour and quantile regression
Apichottanakul et al. Customer behaviour analysis based on buying-data sparsity for multi-category products in pork industry: A hybrid approach
WO2013165583A1 (en) Method for automatic development of an art index
Goar et al. Business decision making by big data analytics
Zhou et al. The allocation optimization of promotion budget and traffic volume for an online flash-sales platform
WO2019040451A1 (en) COMPUTER SYSTEM AND METHOD FOR PREDICTING CLIENT BEHAVIOR BASED ON INFLUENCES BETWEEN CUSTOMERS AND CONTROLLING DISTRIBUTION OF ELECTRONIC MESSAGES
Kang Advertising allocation and impact of advertising on event ticket sales: Which product, where, and when
US11803868B2 (en) System and method for segmenting customers with mixed attribute types using a targeted clustering approach
CN111401935B (zh) 资源分配方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant