CN106779843A - 一种基于客户群体特征的商户竞合关系分析的方法和装置 - Google Patents

一种基于客户群体特征的商户竞合关系分析的方法和装置 Download PDF

Info

Publication number
CN106779843A
CN106779843A CN201611161103.1A CN201611161103A CN106779843A CN 106779843 A CN106779843 A CN 106779843A CN 201611161103 A CN201611161103 A CN 201611161103A CN 106779843 A CN106779843 A CN 106779843A
Authority
CN
China
Prior art keywords
trade company
client
customer
accounting
trade
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611161103.1A
Other languages
English (en)
Other versions
CN106779843B (zh
Inventor
王臻
何朔
刘国宝
何东杰
王琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN201611161103.1A priority Critical patent/CN106779843B/zh
Publication of CN106779843A publication Critical patent/CN106779843A/zh
Application granted granted Critical
Publication of CN106779843B publication Critical patent/CN106779843B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Abstract

本发明实施例涉及数据挖掘领域,尤其涉及一种基于客户群体特征的商户竞合关系分析的方法和装置,用于提高分析商户竞合关系的准确性。本发明实施例中,统计出多条客户交易记录对应的多个客户标识,对多个客户标识进行分类获得N个客户集合;针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据上述内容确定第一商户和第二商户之间的竞争关系。

Description

一种基于客户群体特征的商户竞合关系分析的方法和装置
技术领域
本发明实施例涉及数据挖掘领域,尤其涉及一种基于客户群体特征的商户竞合关系分析的方法和装置。
背景技术
现有技术中,由于商户只能通过自身的销售系统获取单一的自身商户的客户信息,因此无法用客户交易信息来全面分析与其它商户的竞合关系。
目前,可通过问卷调查等方式来了解商户自身在本行业的位置和竞合关系,但是通过此方式前期投入大,如需要投入大量的人力和物力,而且得到的结果可信度比较低。但是随着人们消费观念的逐步更新,刷卡或电子支付越来越受到客户的青睐,在很多商户中,刷卡或电子支付占很大的比重。
综上,亟需一种基于客户群体特征的商户竞合关系分析的方案,用于提高分析商户竞合关系的准确性。
发明内容
本发明实施例提供了一种基于客户群体特征的商户竞合关系分析的方法和装置,用于提高分析商户竞合关系的准确性。
本发明实施例提供一种基于客户群体特征的商户竞合关系分析的方法,包括:获取M个商户对应的多条客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系。
可选地,多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;可选地,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合,包括:使用K-Means算法,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合。
可选地,根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系,包括:根据第一商户在N个客户集合中对应的N个第一占比,确定出第一商户的第一总占比;根据第二商户在N个客户集合中对应的N个第二占比,确定出第二商户的第二总占比;根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;根据相似度确定确定第一商户和第二商户之间的竞争关系。
可选地,根据相似度确定确定第一商户和第二商户之间的竞争关系,包括:在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系;在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系。
可选地,在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系,包括:在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系。
可选地,获取M个商户对应的多条客户交易记录,包括:获取待查询的M个商户;获取预设时间段内M个商户中每个商户对应的所有客户交易记录;对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录。
本发明实施例提供一种一种基于客户群体特征的商户竞合关系分析的装置,包括:获取单元,用于获取M个商户对应的多条客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;统计单元,用于统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;处理单元,用于根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系。
可选地,多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;处理单元,用于:使用K-Means算法,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合。
可选地,处理单元,用于:根据第一商户在N个客户集合中对应的N个第一占比,确定出第一商户的第一总占比;根据第二商户在N个客户集合中对应的N个第二占比,确定出第二商户的第二总占比;根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;根据相似度确定确定第一商户和第二商户之间的竞争关系。
可选地,还包括处理单元,用于:在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系;在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系。
可选地,处理单元,用于:在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系。
可选地,获取单元,用于:获取待查询的M个商户;获取预设时间段内M个商户中每个商户对应的所有客户交易记录;
处理单元,用于:对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录。
由于本发明实施例中,通过获取M个商户对应的多条客户交易记录;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;获得N个客户集合是基于多个商户的多条客户交易记录进行的分类;之后,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系;根据每个商户的客户数量来在每个客户集合中客户数量的占比,来确定商户之间的竞争关系,进而,可以获得准确的商户间竞合关系;如此,通过该方法可以提高分析商户竞合关系的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。
图1为本发明实施例提供的一种基于客户群体特征的商户竞合关系分析的方法流程示意图;
图2为本发明实施例提供的另一种基于客户群体特征的商户竞合关系分析的方法流程示意图;
图3为本发明实施例提供的一种基于客户群体特征的商户竞合关系分析的装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示例性示出了本发明实施例提供的一种基于客户群体特征的商户竞合关系分析的方法流程示意图,如图2所示,该基于客户群体特征的商户竞合关系分析的方法包括以下步骤:
步骤101,获取M个商户对应的多条客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;
步骤102,统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;
步骤103,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;
步骤104,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;
步骤105,根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系。
由于本发明实施例中,通过获取M个商户对应的多条客户交易记录;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;获得N个客户集合是基于多个商户的多条客户交易记录进行的分类;之后,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系;根据每个商户的客户数量来在每个客户集合中客户数量的占比,来确定商户之间的竞争关系,进而,可以获得准确的商户间竞合关系;如此,通过该方法可以提高分析商户竞合关系的准确性。
可选地,本发明实施例中获取M个商户对应的多条客户交易记录,包括:获取待查询的M个商户;获取预设时间段内M个商户中每个商户对应的所有客户交易记录;对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录。
可选地,为了保证获得的交易记录的可靠性,将获得的交易记录中数据进行筛选,去除无效的客户交易记录,无效的交易记录包括交易记录标识为失败的交易记录、交易记录标识为存在欺诈的交易记录、交易记录标识为套现的交易记录。
可选地,本发明实施例中,多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合,包括:使用K-Means算法,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合。
可选地,客户的消费信息包括客户的卡号、消费金额、消费所在的商户标识,消费时间,购买的产品、产品的单价、购买的数量、消费的总金额等信息;根据客户交易属性信息的特点,可以将客户进行分类;可选地,可以将客户分为不经常变化的数据集合,反映客户的一些基本属性信息的集合,如客户的自然属性的集合;也可以将客户分为随时间变化的数据集合,主要是客户与商户之间进行交易或其他交互所积累的数据,这些交易记录详细记录了客户和商户之间的整个交易过程,反映了客户的消费习惯等信息,可以为客户消费属性。本发明实施例中,将客户分为N个集合时,既包括客户的自然属性,又包括客户的消费属性,比如,首先从客户的交易属性信息中提取客户的消费属性特征作为聚类的向量,对客户聚类,然后应用特征提取方法从客户交易属性信息中选择客户的自然属性作为分类变量;将客户交易属性中随时间变化的特征聚类的结果与客户的自然属性相结合对客户进行分类。可选地,分类包括聚类,以及一般的分类方法,聚类能帮助市场分析人员从客户交易记录中发现不同的客户群,并且用购买模式来刻画不同的客户群的特征;如此,由于在客户的分类过程中包含了大量的客户交易记录,因此,可提高分类的全面性。
可选地,根据客户的交易属性信息的趋势、平均值、方差、偏度、峰度来描述客户的交易属性,如此,既降低了数据分析的维度,又描述了交易属性的统计特征;结合统计的客户的交易属性特征和客户的自然属性特征,获得客户的特征矩阵X,其中,特征矩阵的每一行代表一个客户的交易属性信息,每一列代表一个特征属性。
可选地,趋势特征是交易属性较常用的特征,反映了客户消费的长期变化趋势,可采用公式(1)计算获得:
在公式(1)中,xi表示客户第i次消费的消费时间,yi表示客户第i次消费的消费金额,n表示客户消费的次数;μ表示趋势特征;i表示第i次进行消费,取值为大于等于1的整数。
可选地,平均值反映了客户购买产品消费的金额,可采用公式(2)计算获得:
在公式(2)中,yi表示客户第i次消费的消费金额,n表示客户消费的次数,Г表示平均值,i表示第i次进行消费,取值为大于等于1的整数。
可选地,方差反映了客户购买产品的波动程度,可采用公式(3)计算获得:
在公式(3)中,yi表示客户第i次消费的消费金额,n表示客户消费的次数,σ表示方差,即客户购买产品的波动程度,i表示第i次进行消费,取值为大于等于1的整数。
可选地,偏度衡量数据的分布相对于中心点是否看起来一致,即交易的值相对于平均值的对称程度,可采用公式(4)计算获得:
在公式(4)中,yi表示客户第i次消费的消费金额,n表示客户消费的次数;μ表示趋势特征,σ表示方差,S表示偏度,即客户购买产品的波动程度,i表示第i次进行消费,取值为大于等于1的整数。
可选地,峰度是数据分布集中趋势的高峰的形状,这里表示交易属性的数据分布相对于正态分布来讲是平坦还是具有尖峰,如果数据分布具有高的峰度系统,则通常会在君子附近有明显的尖峰,并且以较高的速度下降,峰度对于标准正态分布是3,因此,峰度系数可用公式(5)计算:
在公式(5)中,yi表示客户第i次消费的消费金额,n表示客户消费的次数;μ表示趋势特征,σ表示方差,K表示峰度,i表示第i次进行消费,取值为大于等于1的整数。
可选地,频次表示客户消费的频率,可采用公式(6)计算:
在公式(6)中,Tt表示客户第i次消费的开始日期,Ts表示客户第i次消费的结束日期,n表示客户消费的次数,i表示第i次进行消费,取值为大于等于1的整数。
为了不使个别特征统治聚类结果,消除由于特征取值范围不同造成的影响,对上述特征进行标准化,按公式(7)进行标准化:
在公式(7)中,X表示每个特征,Y表示进行标准化后的特征,σ表示方差,μ表示趋势特征.
可选地,对标准化之后的数据使用特征降维(Principal Component Analysis,简称PCA)进行降维,形成客户特征矩阵X;之后使用K-Means算法将客户分为N个集合,即获得N个客户群体g1,g2,g3…..gn,由于K-Means算法接收输入量K,然后将n个数据划分为K个聚类以便使得获得的聚类满足:统一聚类中的对象相似度较高,而不同聚类中的对象相似度较低,即群体g1,g2,g3…..gn,群体内的特征非常接近,但群与群之间的特征差异非常大;上述分群操作包括但不限于此。
可选地,根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系,包括:根据第一商户在N个客户集合中对应的N个第一占比,确定出第一商户的第一总占比;根据第二商户在N个客户集合中对应的N个第二占比,确定出第二商户的第二总占比;根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;根据相似度确定确定第一商户和第二商户之间的竞争关系。
可选地,假设获取的M个商户为商户i、商户j、商户k,根据商户i、商户j、商户k中的多条客户交易记录的交易属性信息。获得3个客户群,分别客群体g1,客户群体g2,客户群体g3,统计商户i中的客户数量在客户群体g1中客户数量的占比,用表示,商户i中的客户数量在客户群体g2中客户数量的占比,用表示,商户i中的客户数量在客户群体g2中客户数量的占比,用表示;使用同样的方法统计出商户j中的客户数量在客群体g1,客户群体g2,客户群体g3中的客户数量的占比,分别用表示;商户k中的客户数量在客在客群体g1,客户群体g2,客户群体g3中的客户数量的占比,分别用表示;获得的占比构成占比矩阵R,占比矩阵R中的每一行表示同一个商户的客户数量在不同的群体中的客户数量占的比例,每一列表示不同的商户的客户数量在同一个客户群中客户数量的占比;
可选地,根据占比矩阵确定出每个商户的总占比,商户i的总占比向量为:商户j的总占比向量为:商户k的总占比向量为:
可选地,根据总的占比向量确定出任意两个商户的相似度,使用向量余弦相似度来衡量,根据向量余弦相似度公式:
在公式(8)中,Si,j表示商户i和商户j的相似度,表示商户i的总占比向量,表示商户j的总占比向量。
其中,余弦值Si,j的值越接近1,表明的夹角越接近零度,也就是越接近,夹角等于零的时候,两个向量完全一样,因此,余弦值Si,j越大越相似。
可选地,对每两个商户使用余弦相似度公式计算出相似度后,可转化为相似度矩阵S。
可选地,对于相似度的计算包括使用余弦相似度公式计算,但不限于此,比如,可以使用Tanimoto系数计算:
在公式(9)中,Si,j表示商户i和商户j的相似度,表示商户i的总占比向量,表示商户j的总占比向量;
其中,Ti,j的范围[0,1],完全相同的时候为Ti,j=1,没有相似的为Ti,j=0,越接近1相似度越高。
可选地,根据相似度确定确定第一商户和第二商户之间的竞争关系,包括:在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系;在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系。
可选地,根据业务需求,确定相似度第一阈值,根据任意两个商户之间的相似度阈值和是否属于同一行业,可以确定出两个商户之间是否为竞争关系,或者合作关系。
可选地,根据结果真值表来确定两个商户之间的竞合关系,表1为结果真值表:
表1:结果真值表:
相似度是否大于第一阈值 是否属于同一行业 预计竞合关系
竞争关系
合作关系
合作关系
未知
可选地,在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系,包括:在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系。
可选地,在确定任意两个商户之间为竞争关系之后,根据根据业务需求,确定出第二阈值,比较两个商户之间的相似度与第二阈值的大小关系,在确定两个商户之间的相似度大于第二阈值的情况下,说明两个商户之间存在强竞争关系,如此,通过自动的方式方便快捷的获取到商户间竞合关系,为商户做出决策时提供了可靠的数据支持。
可选地,为了便于展示结果,将相似度按照如下公式二值化:
在公式(10)中,Si,j表示商户i和商户j的相似度,K为第二阈值;通过二值化的方式,可更加方便的展示商户间的竞合关系。
需要说明的一点是:上述针对基于客户群体特征的商户间竞合关系的分析过程的说明仅是示例性和解释性的,并不用于限定本发明。
为了更清楚的介绍上述方法流程,图2示例性示出了本发明实施例提供的另一种基于客户群体特征的商户竞合关系分析的方法。该分析方法可以在银联的后台系统进行分析,而且基于客户群体特征分析商户竞合关系,可提高分析商户竞合关系的准确性和全面性。基于客户群体特征的商户竞合关系分析的过程见下述内容。
如图2所示,该方法包括:
步骤201,接收输入的查询指令;其中,查询指令包括查询时间段,待查询的M个商户标识;
步骤202,获取待查询的M个商户;
步骤203,获取预设时间段内M个商户中每个商户对应的所有客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;
步骤204,对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录;
步骤205,统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;
步骤206,根据多条客户交易记录中每条客户交易记录的交易属性信息,获取客户交易的消费频次、均值、趋势、方差、偏度、峰度;
步骤207,根据客户交易的消费频次、均值、趋势、方差、偏度、峰度;使用K-Means算法对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;
步骤208,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;
步骤209,根据计算出的第一数量在该客户集合的所有客户标识的数量中的第一占比,确定出第一商户的第一总占比;以及计算出的第二数量在该客户集合的所有客户标识的数量中的第二占比,确定出第二商户的第二总占比;
步骤210,根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;
步骤211,判断第一商户和第二商户是否满足相似度大于第一阈值且属于同一行业,若均满足,则执行步骤212;若至少一个满足,则执行步骤213
步骤212,确定第一商户和第二商户为竞争关系;
可选地,在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系。
步骤213,确定第一商户和第二商户为合作关系或者不确定第一商户和第二商户之间的竞合关系;
可选地,第一商户和第二商户之间若满足相似度大于第一阈值或者属于同一行业两个条件中的任一个,则可确定第一商户和第二商户之间为合作关系,若不满足相似度大于第一阈值且不属于同一行业两个条件,则第一商户和第二商户之间的竞合关系为未知;
可选地,在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;
可选地,在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系;
步骤214,在步骤212之后,判断第一商户和第二商户和相似度是否大于第二阈值,若是,则执行步骤215;若否,则执行步骤216;
步骤215,确定第一商户和第二商户为强竞争关系;
步骤216;确定第一商户和第二商户为普通竞争关系;
可选地,在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系;
可选地,在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;
可选地,对M个商户的竞合关系进行可视化处理;即将M个商户的竞合关系以图形或者图像的形式展示出来。
从上述内容可以看出:本发明实施例中,由于本发明实施例中,通过获取M个商户对应的多条客户交易记录;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;获得N个客户集合是基于多个商户的多条客户交易记录进行的分类;之后,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系;根据每个商户的客户数量来在每个客户集合中客户数量的占比,来确定商户之间的竞争关系,进而,可以获得准确的商户间竞合关系;如此,通过该方法可以提高分析商户竞合关系的准确性。
图3示例性示出了本发明实施例提供的一种基于客户群体特征的商户竞合关系分析的装置的结构示意图。
基于相同构思,本发明实施例提供一种基于客户群体特征的商户竞合关系分析的装置,如图3所示,一种基于客户群体特征的商户竞合关系分析的装置300包括获取单元301、统计单元302和处理单元303。其中:
获取单元,用于获取M个商户对应的多条客户交易记录;其中,多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,M为大于等于2的整数;统计单元,用于统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;处理单元,用于根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;其中,N个客户集合的中每个客户集合包括多个客户标识中的至少一个客户标识;N为大于等于1的正整数;针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,第一商户和第二商户为M个商户中的任两个商户;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系。
可选地,多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;处理单元,用于:使用K-Means算法,根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合。
可选地,处理单元,用于:根据第一商户在N个客户集合中对应的N个第一占比,确定出第一商户的第一总占比;根据第二商户在N个客户集合中对应的N个第二占比,确定出第二商户的第二总占比;根据第一总占比和第二总占比,计算第一商户和第二商户的相似度;根据相似度确定确定第一商户和第二商户之间的竞争关系。
可选地,还包括处理单元,用于:在确定相似度大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为竞争关系;在确定相似度大于第一阈值,且第一商户和第二商户为不同行业的情况下,确定第一商户和第二商户为合作关系;在确定相似度不大于第一阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为合作关系。
可选地,处理单元,用于:在确定相似度大于第一阈值、小于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为普通竞争关系;其中,第二阈值大于第一阈值;在确定相似度大于第二阈值,且第一商户和第二商户为同行业的情况下,确定第一商户和第二商户为强竞争关系。
可选地,获取单元,用于:获取待查询的M个商户;获取预设时间段内M个商户中每个商户对应的所有客户交易记录;
处理单元,用于:对M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到M个商户对应的多条客户交易记录。
从上述内容可以看出:本发明实施例中,由于本发明实施例中,通过获取M个商户对应的多条客户交易记录;统计出多条客户交易记录对应的多个客户标识,每个客户标识对应至少一个商户标识;根据多条客户交易记录中每条客户交易记录的交易属性信息,对多个客户标识进行分类,获得N个客户集合;获得N个客户集合是基于多个商户的多条客户交易记录进行的分类;之后,针对N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算第二数量在该客户集合的所有客户标识的数量中的第二占比;根据第一商户在N个客户集合中对应的N个第一占比,以及第二商户在N个客户集合中对应的N个第二占比,确定第一商户和第二商户之间的竞争关系;根据每个商户的客户数量来在每个客户集合中客户数量的占比,来确定商户之间的竞争关系,进而,可以获得准确的商户间竞合关系;如此,通过该方法可以提高分析商户竞合关系的准确性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种基于客户群体特征的商户竞合关系分析的方法,其特征在于,包括:
获取M个商户对应的多条客户交易记录;其中,所述多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,所述M为大于等于2的整数;
统计出所述多条客户交易记录对应的多个客户标识,所述每个客户标识对应至少一个商户标识;
根据所述多条客户交易记录中每条客户交易记录的交易属性信息,对所述多个客户标识进行分类,获得N个客户集合;其中,所述N个客户集合的中每个客户集合包括所述多个客户标识中的至少一个客户标识;N为大于等于1的正整数;
针对所述N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算所述第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算所述第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,所述第一商户和所述第二商户为所述M个商户中的任两个商户;
根据所述第一商户在所述N个客户集合中对应的N个第一占比,以及所述第二商户在所述N个客户集合中对应的N个第二占比,确定所述第一商户和所述第二商户之间的竞争关系。
2.如权利要求1所述的方法,其特征在于,所述多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;
所述根据所述多条客户交易记录中每条客户交易记录的交易属性信息,对所述多个客户标识进行分类,获得N个客户集合,包括:
使用K-Means算法,根据所述多条客户交易记录中每条客户交易记录的交易属性信息,对所述多个客户标识进行分类,获得N个客户集合。
3.如权利要求1所述的方法,其特征在于,所述根据所述第一商户在所述N个客户集合中对应的N个第一占比,以及所述第二商户在所述N个客户集合中对应的N个第二占比,确定所述第一商户和所述第二商户之间的竞争关系,包括:
根据所述第一商户在所述N个客户集合中对应的N个第一占比,确定出所述第一商户的第一总占比;
根据所述第二商户在所述N个客户集合中对应的N个第二占比,确定出所述第二商户的第二总占比;
根据所述第一总占比和所述第二总占比,计算所述第一商户和所述第二商户的相似度;
根据所述相似度确定所述确定所述第一商户和所述第二商户之间的竞争关系。
4.如权利要求3所述的方法,其特征在于,所述根据所述相似度确定所述确定所述第一商户和所述第二商户之间的竞争关系,包括:
在确定所述相似度大于第一阈值,且所述第一商户和所述第二商户为同行业的情况下,确定所述第一商户和所述第二商户为竞争关系;
在确定所述相似度大于第一阈值,且所述第一商户和所述第二商户为不同行业的情况下,确定所述第一商户和所述第二商户为合作关系;
在确定所述相似度不大于第一阈值,且所述第一商户和所述第二商户为同行业的情况下,确定所述第一商户和所述第二商户为合作关系。
5.如权利要求4所述的方法,其特征在于,所述在确定所述相似度大于第一阈值,且所述第一商户和所述第二商户为同行业的情况下,确定所述第一商户和所述第二商户为竞争关系,包括:
在确定所述相似度大于所述第一阈值、小于第二阈值,且所述第一商户和所述第二商户为同行业的情况下,确定所述第一商户和所述第二商户为普通竞争关系;其中,所述第二阈值大于所述第一阈值;
在确定所述相似度大于所述第二阈值,且所述第一商户和所述第二商户为同行业的情况下,确定所述第一商户和所述第二商户为强竞争关系。
6.如权利要求1至5任一权利要求所述的方法,其特征在于,所述获取M个商户对应的多条客户交易记录,包括:
获取待查询的所述M个商户;
获取预设时间段内所述M个商户中每个商户对应的所有客户交易记录;
对所述M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到所述M个商户对应的多条客户交易记录。
7.一种基于客户群体特征的商户竞合关系分析的装置,其特征在于,包括:
获取单元,用于获取M个商户对应的多条客户交易记录;其中,所述多条客户交易记录中的每条客户交易记录包括客户标识、商户标识和交易属性信息;其中,所述M为大于等于2的整数;
统计单元,用于统计出所述多条客户交易记录对应的多个客户标识,所述每个客户标识对应至少一个商户标识;
处理单元,用于根据所述多条客户交易记录中每条客户交易记录的交易属性信息,对所述多个客户标识进行分类,获得N个客户集合;其中,所述N个客户集合的中每个客户集合包括所述多个客户标识中的至少一个客户标识;N为大于等于1的正整数;针对所述N个客户集合中的每个客户集合:统计第一商户的商户标识在该客户集合中对应的客户标识的第一数量,计算所述第一数量在该客户集合的所有客户标识的数量中的第一占比;统计第二商户的商户标识在该客户集合中对应的客户标识的第二数量,计算所述第二数量在该客户集合的所有客户标识的数量中的第二占比;其中,所述第一商户和所述第二商户为所述M个商户中的任两个商户;根据所述第一商户在所述N个客户集合中对应的N个第一占比,以及所述第二商户在所述N个客户集合中对应的N个第二占比,确定所述第一商户和所述第二商户之间的竞争关系。
8.如权利要求7所述的装置,其特征在于,所述多条客户交易记录中的每条客户交易记录包括交易属性信息包括:客户消费信息和该客户交易记录对应的客户的属性信息;
所述处理单元,用于:
使用K-Means算法,根据所述多条客户交易记录中每条客户交易记录的交易属性信息,对所述多个客户标识进行分类,获得N个客户集合。
9.如权利要求7所述的装置,其特征在于,所述处理单元,用于:
根据所述第一商户在所述N个客户集合中对应的N个第一占比,确定出所述第一商户的第一总占比;根据所述第二商户在所述N个客户集合中对应的N个第二占比,确定出所述第二商户的第二总占比;根据所述第一总占比和所述第二总占比,计算所述第一商户和所述第二商户的相似度;根据所述相似度确定所述确定所述第一商户和所述第二商户之间的竞争关系。
10.如权利要求9所述的装置,其特征在于,还包括处理单元,用于:
在确定所述相似度大于第一阈值,且所述第一商户和所述第二商户为同行业的情况下,确定所述第一商户和所述第二商户为竞争关系;在确定所述相似度大于第一阈值,且所述第一商户和所述第二商户为不同行业的情况下,确定所述第一商户和所述第二商户为合作关系;在确定所述相似度不大于第一阈值,且所述第一商户和所述第二商户为同行业的情况下,确定所述第一商户和所述第二商户为合作关系。
11.如权利要求10所述的装置,其特征在于,所述处理单元,用于:
在确定所述相似度大于所述第一阈值、小于第二阈值,且所述第一商户和所述第二商户为同行业的情况下,确定所述第一商户和所述第二商户为普通竞争关系;其中,所述第二阈值大于所述第一阈值;在确定所述相似度大于所述第二阈值,且所述第一商户和所述第二商户为同行业的情况下,确定所述第一商户和所述第二商户为强竞争关系。
12.如权利要求7至11任一权利要求所述的装置,其特征在于,所述获取单元,用于:
获取待查询的所述M个商户;获取预设时间段内所述M个商户中每个商户对应的所有客户交易记录;
所述处理单元,用于:
对所述M个商户中每个商户对应的所有客户交易记录进行筛选,去除无效的客户交易记录,得到所述M个商户对应的多条客户交易记录。
CN201611161103.1A 2016-12-15 2016-12-15 一种基于客户群体特征的商户竞合关系分析的方法和装置 Active CN106779843B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611161103.1A CN106779843B (zh) 2016-12-15 2016-12-15 一种基于客户群体特征的商户竞合关系分析的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611161103.1A CN106779843B (zh) 2016-12-15 2016-12-15 一种基于客户群体特征的商户竞合关系分析的方法和装置

Publications (2)

Publication Number Publication Date
CN106779843A true CN106779843A (zh) 2017-05-31
CN106779843B CN106779843B (zh) 2020-08-11

Family

ID=58887682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611161103.1A Active CN106779843B (zh) 2016-12-15 2016-12-15 一种基于客户群体特征的商户竞合关系分析的方法和装置

Country Status (1)

Country Link
CN (1) CN106779843B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107358251A (zh) * 2017-06-09 2017-11-17 阿里巴巴集团控股有限公司 一种对象筛选方法和装置
CN107705175A (zh) * 2017-09-29 2018-02-16 北京三快在线科技有限公司 确定用户与商户之间相似度的方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040158536A1 (en) * 1998-06-01 2004-08-12 Kowal David P. Customer valuation in a resource price manager
CN102693502A (zh) * 2012-06-04 2012-09-26 南京中兴软创科技股份有限公司 面向用户消费行为的时间推移数据分析模型的建立方法
CN102890803A (zh) * 2011-07-21 2013-01-23 阿里巴巴集团控股有限公司 电子商品异常交易过程的确定方法及其装置
CN103559630A (zh) * 2013-10-31 2014-02-05 华南师范大学 一种基于客户属性及行为特征分析的客户细分方法
CN105931065A (zh) * 2015-09-22 2016-09-07 中国银联股份有限公司 客户群特征数据的处理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040158536A1 (en) * 1998-06-01 2004-08-12 Kowal David P. Customer valuation in a resource price manager
CN102890803A (zh) * 2011-07-21 2013-01-23 阿里巴巴集团控股有限公司 电子商品异常交易过程的确定方法及其装置
CN102693502A (zh) * 2012-06-04 2012-09-26 南京中兴软创科技股份有限公司 面向用户消费行为的时间推移数据分析模型的建立方法
CN103559630A (zh) * 2013-10-31 2014-02-05 华南师范大学 一种基于客户属性及行为特征分析的客户细分方法
CN105931065A (zh) * 2015-09-22 2016-09-07 中国银联股份有限公司 客户群特征数据的处理方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107358251A (zh) * 2017-06-09 2017-11-17 阿里巴巴集团控股有限公司 一种对象筛选方法和装置
CN107705175A (zh) * 2017-09-29 2018-02-16 北京三快在线科技有限公司 确定用户与商户之间相似度的方法、装置及电子设备
WO2019061867A1 (zh) * 2017-09-29 2019-04-04 北京三快在线科技有限公司 确定用户与商户之间的相似度
CN107705175B (zh) * 2017-09-29 2023-03-07 北京三快在线科技有限公司 确定用户与商户之间相似度的方法、装置及电子设备

Also Published As

Publication number Publication date
CN106779843B (zh) 2020-08-11

Similar Documents

Publication Publication Date Title
CN107578281B (zh) 电子商务环境下用户优惠券行为预测方法及模型构建方法
Kee et al. Domestic value added in exports: Theory and firm evidence from China
US8170998B2 (en) Methods, systems, and computer program products for estimating accuracy of linking of customer relationships
Cheung et al. Market structure and the persistence of sectoral real exchange rates
CN108665159A (zh) 一种风险评估方法、装置、终端设备及存储介质
CN106600369A (zh) 基于朴素贝叶斯分类的银行金融产品实时推荐系统和方法
CN107657500B (zh) 股票推荐方法及服务器
US20090222323A1 (en) Opportunity segmentation
CN109583966B (zh) 一种高价值客户识别方法、系统、设备及存储介质
CN108090834A (zh) 基金评价方法和装置
CN104850868A (zh) 一种基于k-means和神经网络聚类的客户细分方法
CN112270596A (zh) 基于用户画像构建的风险控制系统及方法
CN107133862A (zh) 动态产生增强信用评估的详细交易支付经历的方法和系统
CN106779843A (zh) 一种基于客户群体特征的商户竞合关系分析的方法和装置
CN109360099A (zh) 一种基于k-近邻算法的金融反欺诈方法
CN113743826A (zh) 一种客户分类方法及装置
Rappoport et al. Comparative advantage and specialization in bank lending
Bredin et al. Performance and performance persistence of UK closed-end equity funds
CN112581291A (zh) 风险测评异动检测方法、装置、设备及存储介质
Liu et al. Information asymmetry and bank regulation: Can the spread of debt contracts be explained by recovery rates?
CN111612602A (zh) 上市公司疑似财务风险判别方法及装置
CN113674045B (zh) 一种基于区间分割的电商水军识别方法
TWI769385B (zh) 金融商品之潛在購買客群篩選方法及其系統
Bulder Point of Sale Merchant Segmentation in the Payments Industry
Yang Do National Standards Impact Foreign Trade? Evidence from China’s Foreign Trade and Sino-US Bilateral Trade

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant