CN111951035A - 消费分析方法和系统、装置以及消费分析平台 - Google Patents

消费分析方法和系统、装置以及消费分析平台 Download PDF

Info

Publication number
CN111951035A
CN111951035A CN201910413604.1A CN201910413604A CN111951035A CN 111951035 A CN111951035 A CN 111951035A CN 201910413604 A CN201910413604 A CN 201910413604A CN 111951035 A CN111951035 A CN 111951035A
Authority
CN
China
Prior art keywords
consumption
merchant
merchants
transaction data
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910413604.1A
Other languages
English (en)
Other versions
CN111951035B (zh
Inventor
董奕
朱祎
马晓甦
王志永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiaxing Shurong Data Technology Co ltd
Original Assignee
Shanghai Shurong Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Shurong Data Technology Co Ltd filed Critical Shanghai Shurong Data Technology Co Ltd
Priority to CN202410611776.0A priority Critical patent/CN118521330A/zh
Priority to CN201910413604.1A priority patent/CN111951035B/zh
Publication of CN111951035A publication Critical patent/CN111951035A/zh
Application granted granted Critical
Publication of CN111951035B publication Critical patent/CN111951035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开一种消费分析方法和系统、装置以及消费分析平台,其中,所述消费分析方法通过对获取的商户的消费交易数据基于消费者的身份标识进行提取,从而能基于各个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,相较于相关技术,能避免人工处理大数据的麻烦和不足,具有数据处理准确及高效的优点。

Description

消费分析方法和系统、装置以及消费分析平台
技术领域
本申请涉及大数据处理领域,特别地,涉及一种消费分析方法、消费分析系统、消费分析装置、计算机可读存储介质、以及消费分析平台。
背景技术
随着城市化进程的推进和商业社会的发展,各大城市的商场数量以及单个商场的规模都在不断增加,商场会引进众多的商户入驻,商场之间、商场内各个商铺之间的竞争越来越大。
对于商场经营者而言,吸引尽可能多的消费者光顾并最大满足不同消费者的消费需求,是最大的诉求。因此,了解或掌握消费者的消费行为习惯和消费偏好,对于商场或商户而言有着重要意义。一方面,商家可以针对具体消费者的消费偏好开展有计划的个性化营销,提升营销活动有效性,改善消费者的消费体验;另一方面,根据消费者在消费过程中的消费记录进行统计分析,获得消费者群体的消费偏好数据和商户之间的消费关联,可以对商户入驻选择、商户布局、商户经营策略的调整、营销计划的制定、确定广告的投放目标等经营活动提供指导和决策依据。
传统的消费者消费行为习惯分析主要由各家商户进行;再将各家商户统计的单店消费记录予以汇总后进行统计,各家商户的消费记录,数据量大且通用性差,往往得后续进行人工处理;从统计结果中进行分析,需要借助人工判断,不仅费事费力,效率低下,且很大程度上依赖于人的经验和智力。
发明内容
为解决前述相关技术的缺失,本申请的目的在于公开一种消费分析方法、消费分析系统、消费分析装置、计算机可读存储介质、以及消费分析平台。
本申请的第一方面公开一种消费分析方法,包括以下步骤:
获取商场所辖的商户的消费交易数据;所述消费交易数据包括消费者的身份标识和商户标识;
基于消费者的身份标识从所述消费交易数据中提取反映单个消费者的消费交易数据;
基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联。
本申请公开的消费分析方法,通过对获取的商户的消费交易数据基于消费者的身份标识进行提取,从而能基于各个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,相较于相关技术,能避免人工处理大数据的麻烦和不足,具有数据处理准确及高效的优点。
本申请第一方面的某些实施方式中,所述获取商场所辖的商户的消费交易数据通过以下至少一种方式实现:从商场所辖的商户接收消费交易数据;由商场运营者通过消费者藉由网站录入或服务台登记来获得消费交易数据。
本申请第一方面的某些实施方式中,获取商场所辖的商户的消费交易数据是在预定时间段内获取商场所辖的商户的消费交易数据。
本申请第一方面的某些实施方式中,所述消费分析方法还包括如下步骤:按照数据清洗规则,对获取的消费交易数据进行数据清洗。
本申请第一方面的某些实施方式中,所述基于消费者的身份标识从所述消费交易数据中提取反映单个消费者的消费交易数据包括如下步骤:从所述消费交易数据中循环检索单个消费者的身份标识,提取反映单个消费者的消费交易数据。
本申请第一方面的某些实施方式中,基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,包括以下步骤:依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联;将提取的商户标识以及商户之间的消费关联进行汇总和统计,获得商场所辖的商户之间的消费关联。
本申请第一方面的某些实施方式中,所述从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联,包括以下步骤:从单个消费者的消费交易数据中通过循环检索提取每一次检索所涉及的两笔消费记录中商户之间的消费关联;将循环检索得到的商户之间的消费关联进行合并和统计,获得与单个消费者的消费交易数据对应的商户之间的消费关联。
本申请第一方面的某些实施方式中,所述从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联,包括以下步骤:依序从单个消费者的每一笔消费记录中提取出商户的商户标识;将提取的商户的商户标识进行汇总;将汇总的商户的商户标识进行两两关联以形成商户之间的消费关联。
本申请第一方面的某些实施方式中,所述消费分析方法还包括以下步骤:对提取的商户标识以及商户之间的消费关联进行筛选,滤除重复的或不符合筛选要求的数据。
本申请第一方面的某些实施方式中,所述消费分析方法还包括如下步骤:基于获得的商户之间的消费关联,构建消费网络图。
本申请第一方面的某些实施方式中,基于获得的商户之间的消费关联,构建消费网络图,包括如下步骤:以商户作为顶点、商户与商户之间的关联消费作为边构建消费网络图。
本申请第一方面的某些实施方式中,所述消费分析方法还包括以下步骤:在构建消费网络图的过程中,根据所述消费交易数据,以商户的活跃度指数作为所述商户对应的顶点的权重。
本申请第一方面的某些实施方式中,所述活跃度指数包括以下的至少一个:消费交易笔数、消费交易金额、以及单笔消费平均交易金额。
本申请第一方面的某些实施方式中,所述消费分析方法还包括以下步骤:在构建消费网络图的过程中,根据所述消费交易数据,以商户与商户之间的关联消费笔数作为边的权重。
本申请第一方面的某些实施方式中,所述消费分析方法还包括以下步骤:在构建消费网络图的过程中,根据所述消费交易数据,以商户的经营类别作为顶点的属性。
本申请第一方面的某些实施方式中,所述消费分析方法还包括将构建的消费网络图以可视化形式予以输出显示的步骤。
本申请第一方面的某些实施方式中,所述消费分析方法还包括如下步骤:在显示的消费网络图的顶点和/或边上进行操作。
本申请第一方面的某些实施方式中,所述消费分析方法还包括以下步骤:根据分析条件,构建新的消费网络图或调整原有的消费网络图。
本申请第二方面公开一种消费分析系统,包括:
数据获取单元,用于获取商场所辖的商户的消费交易数据;所述消费交易数据包括消费者的身份标识和商户标识;
数据提取单元,用于基于消费者的身份标识,从所述消费交易数据中提取反映单个消费者的消费交易数据;以及
关联分析单元,用于基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联。
本申请公开的消费分析系统,通过对获取的商户的消费交易数据基于消费者的身份标识进行提取,从而能基于各个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,相较于相关技术,能避免人工处理大数据的麻烦和不足,具有数据处理准确及高效的优点。
本申请第二方面的某些实施方式中,所述获取商场所辖的商户的消费交易数据通过以下至少一种方式实现:从商场所辖的商户接收消费交易数据;由商场运营者通过消费者藉由网站录入或服务台登记来获得消费交易数据。
本申请第二方面的某些实施方式中,所述消费分析系统还包括数据清洗单元,用于按照数据清洗规则对获取的消费交易数据进行数据清洗。
本申请第二方面的某些实施方式中,所述关联分析单元包括:
关联提取模块,用于依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联;
汇总模块,用于将提取的商户标识以及商户之间的消费关联进行汇总和统计,获得商场所辖的商户之间的消费关联。
本申请第二方面的某些实施方式中,所述关联分析单元还包括:数据筛选模块,用于对提取的商户标识以及商户之间的消费关联进行筛选,滤除重复的或不符合筛选要求的数据。
本申请第二方面的某些实施方式中,所述消费分析系统还包括关联构建单元,用于基于获得的商户之间的消费关联,构建消费网络图。
本申请第二方面的某些实施方式中,所述关联构建单元是以商户作为顶点、商户与商户之间的关联消费作为边来构建消费网络图的。
本申请第二方面的某些实施方式中,所述关联构建单元还包括以商户的活跃度指数作为所述商户对应的顶点的权重。
本申请第二方面的某些实施方式中,所述活跃度指数包括以下的至少一个:消费交易笔数、消费交易金额、以及单笔消费平均交易金额。
本申请第二方面的某些实施方式中,所述关联构建单元还包括以商户与商户之间的关联消费笔数作为边的权重。
本申请第二方面的某些实施方式中,所述关联构建单元还包括以商户的经营类别作为顶点的属性。
本申请第二方面的某些实施方式中,所述消费分析系统还包括可视化显示单元,用于将构建的消费网络图以可视化形式予以输出显示。
本申请的第三方面公开一种消费分析装置,其特征在于,包括:
存储器,用于存储指令;
处理器,耦合到所述存储器,所述处理器被配置为基于所述存储器存储的指令执行实现如前所述的消费分析方法。
本申请的第四方面公开一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行时实现如前所述的消费分析方法。
本申请的第五方面公开一种消费分析平台,包括:
如前所述的消费分析系统;
数据存储单元,用于存储消费交易数据和由所述消费分析系统获得商户之间的消费关联;
数据处理单元,用于根据操作指令对所述数据存储单元中商户之间的消费关联进行数据处理;所述操作指令包括即时查询和多维数据分析中的至少一种。
本申请第五方面的某些实施方式中,所述消费分析平台还包括:可视化展示单元,用于提供操作界面以及将所述数据处理单元的处理结果采用可视化的界面予以展示。
附图说明
图1显示为消费分析系统在一实施例中的结构框图。
图2显示为消费分析系统在另一实施例中的结构框图。
图3显示为消费分析系统在又一实施例中的结构框图。图4显示为消费分析系统在再一实施例中的结构框图。
图5显示为各个商户之间的消费关联信息所构建消费网络图的可视化形式的示意图。
图6显示为消费网络图经操作后的局部消费网络图的可视化形式的示意图。
图7显示为消费网络图经操作后的局部消费网络图的可视化形式的示意图。
图8显示为所述消费分析平台在一实施例中的结构框图。
图9显示为本申请消费分析方法在一实施例中的流程示意图。
图10显示为本申请消费分析方法在另一实施例中的流程示意图。
图11显示为本申请消费分析方法在又一实施例中的流程示意图。
图12显示为本申请消费分析方法在再一实施例中的流程示意图。
具体实施方式
以下由特定的具体实施例说明本申请的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本申请的其他优点及功效。
在下述描述中,参考附图,附图描述了本申请的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本公开的精神和范围的情况下进行组成以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本申请的实施例的范围仅由本申请的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本申请。
再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。比如本申请中对“至少一个客户端”则包括一个客户端以及多个客户端的情况,或者“至少一个内容展示设备”则包括一个内容展示设备以及多个内容展示设备的情况。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。
对于商场经营者而言,需要了解和掌握消费者的行为习惯和消费偏好,以便于商场针对例如商户入驻选择、商户布局、商户经营策略的调整、营销计划的制定、确定广告的投放目标等经营活动提供指导和决策依据,传统上,是由各个商户自行收集并形成单店消费数据,再将各个商户的单店消费记录予以汇总和统计,各家商户的消费记录数据量大且通用性差,往往需要人工处理,同时,从统计结果中分析出消费者的行为习惯和消费偏好以及各个商户之间的消费关联,也需要借助人工判断,效率低下且准确度较低。有鉴于此,需要以有效的方式整合来自各个商户的消费交易数据,分析出消费者的行为习惯和消费偏好以及各个商户之间的消费关联。
如本文所公开的,申请公开的消费分析系统及消费分析方法,通过对获取的商户的消费交易数据基于消费者的身份标识进行提取,从而能基于各个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,以此为商场经营者实施经营活动提供指导和决策依据,相较于相关技术,能避免人工处理大数据的麻烦和不足,具有数据处理准确及高效的优点。
本申请消费分析系统被配置为获取和整合来自商场所辖的商户的消费,基于各个消费者的消费交易数据中所涉及的商户标识来获得商户之间的消费关联,从而可为商场经营者实施经营活动提供指导和决策依据。这些经营活动可包括但不限于:商户入驻选择、商户布局、商户经营策略的调整、营销计划的制定、确定广告的投放目标等。
请参阅图1,显示为消费分析系统在一实施例中的结构框图。如图1所示,消费分析系统1包括:数据获取单元11、数据提取单元13、以及关联分析单元15。
在实施例中,消费分析系统1可构建于台式电脑、笔记本电脑、平板电脑、智能手机、云端服务器、或者分布式电脑集群等信息处理设备(组)中。
数据获取单元11用于获取商场所辖的商户的消费交易数据。
商场因其同时具备购物、娱乐和餐饮等多种消费功能,已成为人们生活中重要的消费场所之一。对于某一商场而言,商场所辖的商户众多,消费者会在商场内的不同商户进行消费,例如,消费者会去服饰商户处购买服饰、在餐饮商户处就餐、在娱乐商户处游玩、在超市内购买日用品等,这样,就在不同商户处留下了消费记录,这些消费者的消费记录,就形成了商户的消费交易数据。对于商场经营者而言,为了解和掌握消费者的行为习惯和消费偏好以及各个商户之间的消费关联,就需要获得商户的消费交易数据以进行分析。
在某些实施例中,获取商户的消费交易数据可从商场所辖的商户接收消费交易数据。
例如,商场所辖的各个商户与商场建立数据互联,从而使得商场能从商户处接收相应的消费交易数据。在某些示例中,所述消费交易数据可由各个商户上传。例如,在某一商户处完成的消费交易数据可由该商户自行上传给商场的数据管理中心。商户上传消费交易数据可以实时的,即,完成一笔消费交易后就实时上传该笔消费记录,也可以是定期的,例如,每天、每周、每半个月等。在某些示例中,所述消费交易数据可由商场向各个商户调取。例如,商场的数据管理中心向各个商户发送数据调取请求,例如,所述数据调取请求中包含有商户信息和调取时间(段),由相应的商户响应所述数据调取请求并据此将该商户的消费交易数据上传给商场的数据管理中心。
在某些实施例中,获取商户的消费交易数据可由商场运营者通过消费者藉由网站录入或服务台登记来获得消费交易数据。
一般地,商场可对消费者在商场内消费进行积分奖励,消费者在商场的商户内消费即可获得一定的积分奖励。所述积分奖励可以是由商场统一制定,也可由各个商户自行制定。积分的获得,可以采用多种形式。在某些示例中,积分的获得可以是单纯由消费金额来实现,例如,每消费1元即可获得1个积分或10个积分。在某些示例中,积分的获得可以由阶梯式的消费金额来实现,例如,消费1000元以下,每消费1元即可获得1个积分,消费1000元至3000元,每消费1元即可获得2个积分,消费3000元至10000元,每消费1元即可获得5个积分。在某些示例中,积分的获得可以由消费者的会员等级来实现,例如,普通等级的消费者,每消费1元获得1个积分,VIP等级的消费者,每消费1元获得3个积分。在某些示例中,积分的获得可以由商场内商户的联合活动来实现,例如,若在同一活动周期内(例如,同一天,同一周内,同一月内等)在A商户和B商户都有消费的,会在计算周期结束之后额外赠送500个积分。
获得的这些积分,可有不同的用途实现。在某些示例中,积分可实现折现或兑换消费券,例如,每100个或1000个积分可兑换1元,在下次消费时抵现,每10000分积分兑换某类商户的消费券(例如,餐饮类商户或培训教育类商户的折扣券等),或者,积分可兑换商场停车券。在某些示例中,积分可兑换礼物,这些礼物可例如食品(巧克力、饼干等)、日用品(被子、杯子等)、玩具、鲜花等。
商场会提供有积分管理系统,用于对对各个消费者的会员信息、积分获得、积分兑换等进行管理。
在某些实施例中,商场提供有商场网站,消费者可通过相应的登录信息登录商场网站,录入消费记录,商场网站根据录入的消费记录,换算出该消费记录可得的积分。通过上述方式,商场就可获得各个消费者的消费交易数据。
在某些实施例中,在消费者于某个商户处完成消费后,消费者至商场内的服务台登记该次消费记录,服务台的工作人员根据登记的消费记录,换算出该消费记录可得的积分。通过上述方式,商场就可获得各个消费者的消费交易数据。
在某些实施例中,所述商场可为位于某地的单一商场。在某些实施例中,所述商场也可为具有连锁性质的商场集团,包含有多个连锁的商场,例如,上海万达广场,就可包含位于上海的多个连锁的万达广场。
获得的消费交易数据,每一笔消费记录中至少包括消费者的身份标识和商户标识。消费者的身份标识可采用多种方式。在某些示例中,消费者的身份标识为消费者在该商场注册的会员号。在某些示例中,消费者的身份标识为消费者的手机号或身份证号。在某些示例中,消费者的身份标识为消费者的微信号、QQ号、微博账号、或邮箱账号等。商户标识可采用多种方式。在某些示例中,商户账号可采用商户名称或缩略简称。在某些示例中,商户账号可采用自定义的商户编号。当然,所述消费记录中的信息并不仅限于此,所述消费记录中还可包括但不限于:交易时间、交易方式、消费金额、以及消费项目中的一个或多个,其中,交易方式可包括现金交易、POS机刷卡消费、移动支付(微信支付、支付宝支付、云闪付等)、线上预支付等,消费项目可包括实物类产品(例如食品、日用品、服饰等)或体验性服务(例如美容美发、娱乐休闲等)等。
获得的消费交易数据可以采用表单的形式,如此,形成消费交易数据表。
由于数据获取单元11获取的商户的消费交易数据中可能会存在大量无效或异常的数据,这些无效或异常的数据可能是重复的数据、多余的数据、不完整的数据、或是有错误的数据等,这些无效或异常的数据不仅会造成后续数量处理量大,更会对后续数据处理造成干扰或污染,影响数据处理结果的信度和效度。所述重复的数据例如为重复的消费记录,所述多余的数据可例如为无关的信息(例如,消费者信息、商户信息等)或者是无实际消费所产生的数据(例如,无实质消费记录而产生的积分赠与记录等)。因此,需要删除这些无效或异常的数据或者对这些无效或异常的数据中的部分或全部进行纠正,这就涉及到对数据进行清洗。
目前,对于轻量级数据,传统上会采用人工清洗的方式,缺少统一、标准的清洗流程,人工清洗的方式主要存在如下问题:数据清洗耗时长,人工清洗的方式依赖于操作人员进行数据判断,且判断后需要一步步完成清洗,需要大量时间;数据清洗容易出现遗漏;数据清洗结果不稳定,数据清洗的结果会因操作人员的不同而出现清洗结果不一致的问题;数据清洗过程不可回溯,当出现清洗失误时无法回查修正;数据清洗结果核查费时费力,清洗完成后需对数据进行重新统计,核查数据清洗结果。因此,对于本申请中大数据量的消费交易数据,很显然,采用传统的人工清洗绝非是行之有效的方式。
请参阅图2,显示为消费分析系统在另一实施例中的结构框图。如图2所示,本申请消费分析系统还可包括数据清洗单元12,用于按照数据清洗规则对数据获取单元11所获取的消费交易数据进行数据清洗。
一般地,数据清洗(Data Cleaning),通常是指对数据进行重新审查和校验的过程,目的在于删除重复的数据、删除多余的数据、删除或纠正不完整的数据和错误的数据,从而得到一致性较高的数据。
在实施例中,数据清洗单元12对数据获取单元11获取的消费交易数据中的部分或全部进行数据清洗,删除重复的数据、删除多余的数据、删除或纠正不完整的数据和错误的数据,保留合格的数据和经纠正后的数据,这些数据可存储于存储介质中(例如:硬盘、光碟、磁盘等)、云端、或是分布式服务器等。
利用数据清洗单元12对消费交易数据进行清洗可按照预设的数据清洗规则来实现,因此,还可包括清洗规则设定单元,用于设定数据的清洗规则。在某些实施例中,利用清洗规则设定单元配置数据清洗规则文件,所述数据清洗规则文件中可包括一条或多条数据清洗规则,其中的数据清洗规则可根据数据的类型、格式、来源、和/或行业等设定,即,不同类型的数据可设定不同的数据清洗规则,不同格式的数据可设定不同的数据清洗规则,不同来源的数据可设定不同的数据清洗规则,不同行业的数据可设定不同的数据清洗规则。
在一示例中,数据清洗规则可进行有效性验证并根据有效性验证结果进行调整。例如,通过对消费交易数据进行自相关的和互相关的数据有效性验证分析,根据有效性验证分析结果,判断当前的针对某个数据源、数据类型、和/或数据格式的数据清洗规则是否需要修正。若需要修正,则修正原有的数据清洗规则并予以更新,以令数据清洗单元12根据更新后的数据清洗规则对消费交易数据进行清洗。
数据提取单元13用于从消费交易数据中提取反映单个消费者的消费交易数据。
在实施例中,数据提取单元13基于消费者的身份标识,从数据获取单元11获取的消费交易数据中选择性地提取反映单个消费者的消费交易数据。在实际应用中,从所述消费交易数据中提取反映单个消费者的消费交易数据包括:从所述消费交易数据中循环检索单个消费者的身份标识,提取反映单个消费者的消费交易数据。例如,针对消费者的身份标识“CA82335566”,可从所述消费交易数据中循环检索身份标识为“CA82335566”的消费记录,一旦检索到身份标识为“CA82335566”的消费记录,则将该笔消费记录提取出,接着,继续往下检索该身份标识对应的其他消费记录,如此,通过遍历检索所述消费交易数据,即可将所述消费交易数据中身份标识为“CA82335566”的所有消费记录都提取出。后续,按照上述检索方式,循环检索其他消费者的身份标识并提取对应的消费交易数据。
经由数据提取单元13,可从消费交易数据中提取反映单个消费者的消费交易数据。一般地,在提取反映单个消费者的消费交易数据之后还可对其进行重组,以便于后续的数据处理。所述重组过程具体可以是按照交易时间或消费交易金额等关键词进行排序。所述排序方式可以有多种,此处不再一一列举。
另外,如前所述,若数据获取单元11获取的消费交易数据采用表单形式的话,经由数据提取单元13提取的反映单个消费者的消费交易数据也可采用表单形式,即,每一个消费者都有一个对应的消费交易数据表,即,该消费交易数据表中的消费者的身份标识相同。如此,若将数据获取单元11获取的商场所辖的商户的消费交易数据表可称为商场的消费交易数据总表,而数据提取单元13提取得到的对应单个消费者的消费交易数据表可称为消费者的消费交易数据子表。
关联分析单元15用于基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联。
在实施例中,关联分析单元15会对经数据提取单元13所提取的反映单个消费者的消费交易数据进行关联分析以获得所述单个消费者所涉及的各个商户之间的消费关联,并将所有的单个消费者所涉及的商户之间的消费关联予以汇总,进而获得所有消费者所涉及的商户之间的消费关联,即商场所辖的商户之间的消费关联。
在实施例中,关联分析单元15可进一步包括关联提取模块和汇总模块。
关联提取模块用于依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联。
在某些示例中,关联提取模块从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联可至少包括以下操作:
从单个消费者的消费交易数据中通过循环检索提取每一次检索所涉及的两笔消费记录中商户之间的消费关联。
将循环检索得到的商户之间的消费关联进行合并和统计,获得与单个消费者的消费交易数据对应的商户之间的消费关联。
请参阅下表一,显示为单个消费者的部分消费交易数据,所述部分消费交易数据以表单的形式形成消费交易数据表。在所述消费交易数据表中,列出了该消费者所涉及的多笔消费记录,这些消费记录可以消费时间排序。在每一条消费记录中可包括身份标识(例如,会员号、手机号等)、订单编号、消费时间、商户、消费项目、消费金额等。
表一
Figure BDA0002063612490000101
Figure BDA0002063612490000111
从该消费者的消费交易数据表中提取出所涉及的商户之间的消费关联可如下操作:循环检索商户的商户标识并提取每一次检索所涉及的两笔消费记录中商户之间的消费关联。
要获得商户之间的消费关联,即,就是要确认各个商户两两之间是否存在消费关联。因此,在实施例中,通过检索任意两笔消费记录中所涉及的商户标识即可获得涉及的两个商户之间的消费关联。
以表一中的消费交易数据为例,循环检索商户的商户标识并提取每一次检索所涉及的两笔消费记录中商户之间的消费关联具体可包括:
以第一笔消费记录开始循环检索:检索第一笔消费记录和第二笔消费记录获得涉及商户A和商户B的消费关联,可记作:A—B;检索第一笔消费记录和第三笔消费记录获得涉及商户A和商户C的消费关联,可记作:A—C;检索第一笔消费记录和第四笔消费记录获得涉及商户A和商户D的消费关联,可记作:A—D;检索第一笔消费记录和第五笔消费记录获得涉及商户A和商户A的消费关联,可记作:A—A;检索第一笔消费记录和第六笔消费记录获得涉及商户A和商户D的消费关联,可记作:A—D;
以第二笔消费记录开始循环检索:检索第二笔消费记录和第三笔消费记录获得涉及商户B和商户C的消费关联,可记作:B—C;检索第二笔消费记录和第四笔消费记录获得涉及商户B和商户D的消费关联,可记作:B—D;检索第二笔消费记录和第五笔消费记录获得涉及商户B和商户A的消费关联,可记作:B—A;检索第二笔消费记录和第六笔消费记录获得涉及商户B和商户D的消费关联,可记作:B—D;
以第三笔消费记录开始循环检索:检索第三笔消费记录和第四笔消费记录获得涉及商户C和商户D的消费关联,可记作:C—D;检索第三笔消费记录和第五笔消费记录获得涉及商户C和商户A的消费关联,可记作:C—A;检索第三笔消费记录和第六笔消费记录获得涉及商户C和商户D的消费关联,可记作:C—D;
以第四笔消费记录开始循环检索:检索第四笔消费记录和第五笔消费记录获得涉及商户D和商户A的消费关联,可记作:D—A;检索第四笔消费记录和第六笔消费记录获得涉及商户D和商户D的消费关联,可记作:D—D;
以第五笔消费记录开始循环检索:检索第五笔消费记录和第六笔消费记录获得涉及商户A和商户D的消费关联,可记作:A—D;
将循环检索得到的商户之间的消费关联进行合并和统计,获得与单个消费者的消费交易数据对应的商户之间的消费关联,具体可参见下表二:
表二
A B C D A D
A—B
A—C B—C
A—D B—D C—D
A—A B—A C—A D—A
A—D B—D C—D D—D A—D
在实施例中,将循环检索得到商户之间的消费关联进行合并和统计就可得到与单个消费者的消费交易数据对应的商户之间的消费关联。
不过,值得注意的是,一方面,要获取的是关于商户之间的消费关联,所述消费关联与消费记录的顺序无关,无指向性。例如,商户A和商户B的消费关联A—B与商户B和商户A的消费关联B—A可合并计算,即,商户A与商户B之间的消费关联包括消费关联A—B和消费关联B—A。
另一方面,这里的商户之间的消费关联确指不同商户之间的消费关联,并不包含仅涉及到单一商户(即首尾的商户相同的消费关联)。例如,商户A和商户A的消费关联A—A以及商户D和商户D的消费关联D—D可记作无效的消费关联而去除。
如此,基于上述两个规则,通过对表二中各个商户之间的消费关联经合并和去除等操作后进行汇总,即可得到反映该消费者(会员号:CA82335566)的消费交易数据表中所涉及的商户之间消费关联,具体可参见下表三:
表三
会员号 A—B A—C A—D B—C B—D C—D
CA82335566 2 2 4 1 2 2
通过上述关联提取模块依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联即可得到能反映单个消费者的消费交易数据中所涉及的商户之间消费关联。
在某些示例中,关联提取模块从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联可至少包括以下操作:
依序从单个消费者的每一笔消费记录中提取出商户的商户标识;
将提取的商户的商户标识进行汇总;
将汇总的商户的商户标识进行两两关联以形成商户之间的消费关联。
仍以上表一为例进行说明。
首先,依序从单个消费者的每一笔消费记录中提取出商户的商户标识。具体包括:从第一笔消费记录中提取商户A;从第二笔消费记录中提取商户B;从第三笔消费记录中提取商户C;从第四笔消费记录中提取商户D;从第五笔消费记录中提取商户A;从第六笔消费记录中提取商户D。
接着,将提取的商户的商户标识进行汇总。具体包括:基于第一笔消费记录和第五笔消费记录,商户A为2次;基于第二笔消费记录,商户B为1次;基于第三笔消费记录,商户C为1次;基于第四笔消费记录,商户D为2次。可参见下表四:
表四
A B C D
2 1 1 2
最后,将汇总的商户的商户标识进行两两关联以形成商户之间的消费关联。具体包括:商户A(2次)与商户B(1次)关联形成商户A与商户B之间的消费关联A—B为2,商户A(2次)与商户C(1次)关联形成商户A与商户C之间的消费关联A—C为2,商户A(2次)与商户D(2次)关联形成商户A与商户D之间的消费关联A—D为4,商户B(1次)与商户C(1次)关联形成商户B与商户C之间的消费关联B—C为1,商户B(1次)与商户D(2次)关联形成商户B与商户D之间的消费关联B—D为2,商户C(1次)与商户D(2次)关联形成商户C与商户D之间的消费关联C—D为2。如此,即可得到反映该消费者(会员号:CA82335566)的消费交易数据表中所涉及的商户之间消费关联,具体可参见前表五。
表五
会员号 A—B A—C A—D B—C B—D C—D
CA82335566 2 2 4 1 2 2
根据表三和表五,可发现,通过不同的示例,都能获得反映单个消费者的消费交易数据表中所涉及的商户之间消费关联
值得注意的是,在对商户进行两两关联时,仍遵从前述的两个规则:一,商户之间的消费关联与消费记录的顺序无关,无指向性。二,商户之间的消费关联确指不同商户之间的消费关联,并不包含仅涉及到单一商户(即首尾的商户相同的消费关联)。
通过上述关联提取模块依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联即可得到能反映单个消费者的消费交易数据中所涉及的商户之间消费关联。
表六显示为通过关联提取模块依序从单个消费者的消费交易数据中提取出能反映单个消费者的消费交易数据中所涉及的商户之间消费关联的一个示例,在表六中,仅涉及商户A、商户B、商户C、以及商户D。
表六
会员号 A—B A—C A—D B—C B—D C—D
CA82335566 2 2 4 1 2 2
CA22343441 2 2 2 1 1 1
CA54336762 2 0 2 0 1 0
汇总模块用于将提取的商户标识以及商户之间的消费关联进行汇总和统计,获得商场所辖的商户之间的消费关联。
以表六中所列的三个消费者的消费交易数据为例,将提取的商户标识以及商户之间的消费关联进行汇总和统计,具体可包括:
商户A与商户B之间的消费关联A—B为2+2+2=6,商户A与商户C之间的消费关联A—C为2+2+0=4,商户A与商户D之间的消费关联A—D为4+2+2=8,商户B与商户C之间的消费关联B—C为1+1+0=2,商户B与商户D之间的消费关联B—D为2+1+1=4,商户C与商户D之间的消费关联C—D为2+1+0=3。如此,即可得到反映商场所辖的商户之间的消费关联,具体可参见前表七。
表七
A—B A—C A—D B—C B—D C—D
6 4 8 2 4 3
由表七可知,通过上述关联提取模块和汇总模块可获得商户之间的消费关联。
在某些实施例中,关联分析单元还可包括数据筛选模块,对提取的商户标识以及商户之间的消费关联进行筛选,滤除重复的或不符合筛选要求的数据。在某些示例中,例如与前述的关联提取模块配合,可滤除仅包含单一商户(即首尾的商户相同)的消费关联的数据。在某些示例中,可滤除不符合筛选要求的数据,所述筛选要求可包括最小消费关联数量或限定时间段内的消费关联等。
本示例公开的消费分析系统,通过数据获取单元获取商场所辖的商户的消费交易数据,利用数据提取单元基于消费者的身份标识从所述消费交易数据中提取反映单个消费者的消费交易数据,从而可使得关联分析单元能基于各个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,相较于相关技术,能避免人工处理大数据的麻烦和不足,具有数据处理准确及高效的优点。
请参阅图3,显示为3消费分析系统在又一实施例中的结构框图。如图3所示,消费分析系统1包括:数据获取单元11、数据清洗单元12、数据提取单元13、关联分析单元15、以及关联构建单元17。
数据获取单元11用于获取商场所辖的商户的消费交易数据。
在某些实施例中,获取商户的消费交易数据可从商场所辖的商户接收消费交易数据。
在某些实施例中,获取商户的消费交易数据可由商场运营者通过消费者藉由网站录入或服务台登记来获得消费交易数据。
关于数据获取单元11如何获取商场所辖的商户的消费交易数据的内容,可具体参见前文描述,在此不再赘述。
数据清洗单元12用于按照数据清洗规则对数据获取单元11所获取的消费交易数据进行数据清洗。
关于数据清洗单元12对消费交易数据进行数据清洗的内容,可具体参见前文描述,在此不再赘述。
数据提取单元13用于从消费交易数据中提取反映单个消费者的消费交易数据。
经由数据提取单元13,可从消费交易数据中提取反映单个消费者的消费交易数据。具体参见前文描述,在此不再赘述。
关联分析单元15用于基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联。
在实施例中,关联分析单元15会对经数据提取单元13所提取的反映单个消费者的消费交易数据进行关联分析以获得所述单个消费者所涉及的各个商户之间的消费关联,并将所有的单个消费者所涉及的商户之间的消费关联予以汇总,进而获得所有消费者所涉及的商户之间的消费关联,即商场所辖的商户之间的消费关联。
在实施例中,关联分析单元15可进一步包括关联提取模块和汇总模块。
关联提取模块用于依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联。
汇总模块用于将提取的商户标识以及商户之间的消费关联进行汇总和统计,获得商场所辖的商户之间的消费关联。
关于关联提取模块和汇总模块,可参见前文描述,在此不再赘述。
关联构建单元17用于基于获得的商户之间的消费关联,构建消费网络图。
利用前述的关联分析单元15,能基于各个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,不过,这些商户之间的消费关联更多采用的是表单等形式,不能直观、形象地展现商户之间的消费关联。
有鉴于此,在实施例中,利用关联构建单元17基于获得的商户之间的消费关联来构建消费网络图。
特别地,在实施例中,关联构建单元17是基于图论和商户之间的消费关联来构建消费网络图的。
图是一种数据结构,可定义为:Graph=(V,E),其中,V是一个非空有限集合,集合V中的元素代表图G的顶点(或节点、点),集合E中的元素代表边(或连线),一般用(Vx,Vy)表示,其中,Vx,Vy属于V。若两个顶点U、V之间有一条边连接,则称这两个顶点U、V是关联的。
基于这样的概念,本申请提出以商户为顶点、上述与商户之间的消费关联信息为边的图,以便基于图的关联模型和算法进行商户之间的消费关联分析来提高数据分析的性能和效率。
在实施例中,利用关联构建单元17构建的消费网络图具有如下规则:
在拟构建的消费网络图中,以商户作为顶点、商户与商户之间的关联消费作为边。
针对顶点,以商户的活跃度指数作为所述商户对应的顶点的权重。在这里,所述活跃度指数包括但不限于以下的至少一个:消费交易笔数、消费交易金额、以及单笔消费平均交易金额。
针对边,以商户与商户之间的关联消费笔数作为边的权重。
以下以利用关联构建单元17针对前述表七中所列的各个商户之间的消费关联信息来构建消费网络图为例进行说明。
在表七中,出现了商户A、商户B、商户C、以及商户D,因此,关联构建单元17构建了分别代表商户A、商户B、商户C、以及商户D的四个顶点A、B、C、以及D。
在表七中,商户A与商户B之间的消费关联A—B为6,商户A与商户C之间的消费关联A—C为4,商户A与商户D之间的消费关联A—D为8,商户B与商户C之间的消费关联B—C为2,商户B与商户D之间的消费关联B—D为4,商户C与商户D之间的消费关联C—D为3。因此,关联构建单元17构建了顶点A与顶点B之间的边,顶点A与顶点C之间的边,顶点A与顶点D之间的边,顶点B与顶点C之间的边,顶点B与顶点D之间的边,顶点C与顶点D之间的边。其中,针对顶点,可以商户的活跃度指数(例如,消费交易笔数)作为所述商户对应的顶点的权重。根据表六可得到:涉及商户A的消费交易笔数为2+2+2=6笔,作为商户A的权重;涉及商户B的消费交易笔数为1+1+1=3笔,作为商户B的权重;涉及商户C的消费交易笔数为1+1+0=2笔,作为商户C的权重;涉及商户D的消费交易笔数为2+1+1=4笔,作为商户D的权重。针对边,可以商户与商户之间的关联消费笔数作为边的权重:商户A与商户B之间的消费关联A—B为6,即,商户A与商户B之间的关联消费笔数有6笔,作为顶点A与顶点B之间的边的权重;商户A与商户C之间的消费关联A—C为4,即,商户A与商户C之间的关联消费笔数有4笔,作为顶点A与顶点C之间的边的权重;商户A与商户D之间的消费关联A—D为8,即,商户A与商户D之间的关联消费笔数有8笔,作为顶点A与顶点D之间的边的权重;商户B与商户C之间的消费关联A—C为2,即,商户B与商户C之间的关联消费笔数有2笔,作为顶点A与顶点D之间的边的权重;商户B与商户D之间的消费关联B—D为4,即,商户B与商户D之间的关联消费笔数有4笔,作为顶点B与顶点D之间的边的权重;商户C与商户D之间的消费关联C—D为3,即,商户C与商户D之间的关联消费笔数有3笔,作为顶点C与顶点D之间的边的权重。
如此,利用关联构建单元17根据以上信息可构建相应的消费网络图。
实际上,对于某一商场而言,商场所辖的商户众多,其涵盖购物、娱乐、餐饮、培训教育、生活服务等多种消费功能。例如,针对一般的商场而言,其所辖的商户可分为多种行业,所述行业可例如为:餐饮、商业地产、便利商超、培训教育、美容美发、保健服务、服装配饰、奢侈品、鲜花礼品店、宠物店等。因此,在实施例中,还可利用关联构建单元17以商户所属行业来构建顶点的属性。
请参阅图4,显示为消费分析系统在再一实施例中的结构框图。如图4所示,本申请消费分析系统还可包括可视化显示单元18。
可视化显示单元18用于将构建的消费网络图以可视化形式予以输出显示。
在某些实施例中,可视化显示单元18将关联构建单元17构建的商场所辖的所有商户的商户之间的消费网络图以可视化形式予以显示,这样,用户即可全局地看到所有商户的商户之间的消费关联。
在某些实施例中,可视化显示单元18将关联构建单元17构建的消费网络图以可视化形式予以显示,这样,用户即可藉此全局地看到所有商户的商户之间的消费关联。
以下以利用可视化显示单元18将管理构建单元17针对表七所列的各个商户之间的消费关联信息所构建的消费网络图进行可视化形式显示为例进行说明。
在表七中,出现了商户A、商户B、商户C、以及商户D以及各个商户相互之间的消费关联,关联构建单元17构建了分别代表商户A、商户B、商户C、以及商户D的四个顶点A、B、C、以及D,并将各个商户相互之间的消费关联作为各个顶点之间的边,即,顶点A与顶点B之间的边,顶点A与顶点C之间的边,顶点A与顶点D之间的边,顶点B与顶点C之间的边,顶点B与顶点D之间的边,顶点C与顶点D之间的边。因此,在某些实施例中,可视化显示单元18在进行顶点的可视化处理时,将四个顶点A、B、C、以及D以某一标记图形来可视化表示,如图4所示,所涉及的顶点(顶点A、B、C、以及D)采用的是圆点来表示,但并不以此为限,所述顶点也可采用方形、三角形、或星形等标记图形来可视化表示。可视化显示单元18在进行顶点之间的边的可视化处理时,将四个顶点A、B、C、以及D相互之间的边采用的是连线来表示,如图4所示,所涉及的顶点A、B、C、以及D相互之间采用的是实连线,但并不以此为限,所述连线也可采用虚连线或是动态射线等可视化表示。
如上所述,关联构建单元17是以商户的活跃度指数(例如,消费交易笔数)作为所述商户对应的顶点的权重,因此,在某些实施例中,可视化显示单元18可通过将可视化表示的标记图形的大小与所述标记图形所对应的商户的消费交易笔数相适配。例如,可作这样的设定:所述商户的消费交易笔数多,则与所述商户对应的标记图形就大;所述商户的消费交易笔数少,则与所述商户对应的标记图形就小。根据表六可得到:涉及商户A的消费交易笔数为2+2+2=6笔,涉及商户B的消费交易笔数为1+1+1=3笔,涉及商户C的消费交易笔数为1+1+0=2笔,涉及商户D的消费交易笔数为2+1+1=4笔,因此,可视化显示单元18在可视化处理时,将与商户A对应的顶点A的圆点显示为最大,将与商户C对应的顶点C的圆点显示为最小。
同理,关联构建单元17是以商户与商户之间的关联消费笔数作为边的权重,因此,在某些实施例中,可视化显示单元18可通过将可视化表示的连线的线宽与对应的两个商户之间的关联消费笔数相适配。例如,可作这样的设定:两个商户之间的关联消费笔数多,则与所述商户对应的两个标记图形之间的连线的线宽就宽;两个商户之间的关联消费笔数少,则与所述商户对应的两个标记图形之间的连线的线宽就细。根据表七可得到:商户A与商户B之间的消费关联A—B为6,即,商户A与商户B之间的关联消费笔数有6笔;商户A与商户C之间的消费关联A—C为4,即,商户A与商户C之间的关联消费笔数有4笔;商户A与商户D之间的消费关联A—D为8,即,商户A与商户D之间的关联消费笔数有8笔;商户B与商户C之间的消费关联B—C为2,即,商户B与商户C之间的关联消费笔数有2笔;商户B与商户D之间的消费关联B—D为4,即,商户B与商户D之间的关联消费笔数有4笔;商户C与商户D之间的消费关联C—D为3,即,商户C与商户D之间的关联消费笔数有3笔,其中,商户A与商户D之间的关联消费笔最多,商户B与商户C之间的关联消费笔数最少,因此,可视化显示单元18在可视化处理时,将顶点A与顶点D之间的连线的线宽设为最大,将顶点B与顶点C之间的连线的线宽设为最小。
所述消费网络图经可视化显示单元18可视化处理后输出显示的可视化形式可如图5所示。
另外,在某些实施例中,可视化显示单元18在可视化处理时,可通过将可视化表示的标记图形的颜色或形状与对应的商户的所属行业。在一示例中,通过构建标记图形(例如:圆点)采用不同的颜色来代表所述顶点对应的商户所属的行业。在一示例中,通过构建标记图形采用不同的形状来代表所述标记图形对应的商户所属的行业,所述标记图形的形状包括但不限于圆点、方形、三角形、或星形等。通过对产生消费关联的商户所对应的标记图形进行颜色或者形状设定,可便于用户能通过观察基于上述规则所构建的消费网络图,直观且清晰地了解或掌握不同行业的商户之间的消费关联。
在某些实施例中,在显示的消费网络图的顶点和/或边上可供用户进行操作。以顶点为例,用户可通过鼠标点选或手指点选(若用于显示消费网络图的显示设备为触控显示面时)至对应的顶点,那么,可视化显示单元18即可根据所述点选操作,将以被点选的顶点为中心的商户之间的消费关联例如以高亮方式显示出来,从而能针对特定商户与其他商户之间的消费关联进行查看和分析。
图6显示了顶点A被点选后的局部消费网络图的可视化形式的示意图。如图6所示,显示有以顶点A为中心的商户之间的消费关联,包括商户A与商户B之间的消费关联A—B,商户A与商户C之间的消费关联A—C,商户A与商户D之间的消费关联A—D。
图7显示了顶点D被点选后的局部消费网络图的可视化形式的示意图。如图7所示,显示有以顶点A为中心的商户之间的消费关联,包括商户D与商户A之间的消费关联D—A,商户D与商户B之间的消费关联D—B,商户D与商户C之间的消费关联D—C。
在某些实施例中,关联构建单元17还包括根据分析条件来构建新的消费网络图或调整原有的消费网络图,并通过可视化显示单元18将新的消费网络图或调整的消费网络图以可视化形式予以输出显示。例如,用户在全局地看到所有商户的商户之间的消费关联之后,进一步输入分析条件,关联构建单元17接收所述分析条件并据此重新构建消费网络图。
在某些示例中,分析条件可例如为活跃度指数大于某一阈值且关联消费笔数小于某一阈值,如此,关联构建单元17即可根据所述分析条件构建新的消费网络图,在新的消费网络图中,显示的即为顶点大但线细小的消费网络图,用户通过观察这“顶点大边线细”的现象,分析商户自身体量大与关联强度低脱离的相关性。例如,商场经营者可根据两个商户之间存在“顶点大边线细”的现象,可为这两个商户制定联合促销的活动,增加两个商户之间的关联消费。
在某些示例中,分析条件可例如为活跃度指数小于某一阈值且关联消费笔数大于某一阈值,如此,关联构建单元17即可根据所述分析条件构建新的消费网络图,在新的消费网络图中,显示的即为顶点小但线宽大的消费网络图,用户通过观察这“顶点小边线宽”的现象,分析商户自身体量小与关联强度高脱离的相关性。例如,商场经营者可根据两个商户之间存在“顶点小边线宽”的现象,可对这两个商户的布局进行规划,例如将两个商户布置地相互远离,以诱发消费者在两个商户之间的移动过程中光顾其他商户并在其他商户处消费。
在某些示例中,分析条件可例如为根据消费记录中消费时间划分为周末时间和平日时间,如此,关联构建单元17即可根据所述分析条件分别构建周末消费网络图和平日消费网络图,用户通过对比观察周末消费网络图和平日消费网络图,分析商户之间的消费关联关系的迁移,以利于商场经营者或商户经营者调整经营策略、制定不同的营销计划的制定及确定广告的投放目标等经营活动。其中,这里的周末时间和平日时间可有不同的设定,例如,周末时间为周六和周日,平日时间则为周一至周五,但并不以此为限,例如,周末时间为周五下午三点至周日,平日时间则为周一至周五下午三点。
本示例公开的消费分析系统,通过数据获取单元获取商场所辖的商户的消费交易数据,利用数据提取单元基于消费者的身份标识从所述消费交易数据中提取反映单个消费者的消费交易数据,使得关联分析单元能基于各个消费者的消费交易数据中所涉及的商户标识获得商户之间的消费关联,从而利用关联构建单元基于获得的商户之间的消费关联来构建消费网络图,并通过可视化显示单元将构建的消费网络图以直观、形象地展现出商户之间的消费关联,用户即可根据消费网络图,可以对商户入驻选择、商户布局、商户经营策略的调整、营销计划的制定、确定广告的投放目标等经营活动进行决策。
本申请另公开一种基于前述消费分析系统的消费分析平台。
请参阅图8,显示为所述消费分析平台在一实施例中的结构框图。如图8所示,所述消费分析平台可包括:消费分析系统1、数据存储单元2、以及数据处理单元3。
消费分析系统1可如参考图1、图2、图3及对应的前文详述,在此不再赘述。通过消费分析系统,可基于商场所辖的商户的消费交易数据中的商户信息获得商户之间的消费关联。
数据存储单元2用于存储商场所辖的商户的消费交易数据以及由消费分析系统获得的商户之间的消费关联。在某些实施例中,数据存储单元2可为云端或分布式服务端的存储介质中(例如:硬盘、光碟、磁盘等)。
数据处理单元3用于根据操作指令对所述数据存储单元中的消费交易数据或商户之间的消费关联的信息进行数据处理。
在某些实施例中,所述操作指令可包括即时查询、多维数据分析等。
以即时查询为例,可包括但不限于:商场内所有商户的消费关联,某一商户的活跃度指数及与其他商户的消费关联等。
以多维数据分析为例,可包括但不限于:同行业的两个商户所属的消费关联、活跃度指数等,节假日商户之间的消费关联与平日商户之间的消费关联,等。
本申请消费分析平台还可包括:可视化展示单元4,用于提供操作界面以及将所述数据处理单元的处理结果采用可视化的界面予以展示。在实施例中,可视化展示单元4是以客户端的方式设计的。当用户安装与消费分析平台相关的客户端之后,即可通过可视化展示单元4发出请求,数据处理单元3根据反映所述请求的操作指令对所述数据存储单元中的消费交易数据或商户之间的消费关联进行数据处理,并将数据处理的结果通过可视化展示单元4展示给请求用户。
本申请又公开一种消费分析方法,通过对获取的商户的消费交易数据基于消费者的身份标识进行提取,从而能基于各个消费者的消费交易数据中所涉及的商户标识,获得各个商户之间的消费关联,以此为商场经营者实施经营活动提供指导和决策依据。
请参阅图9,显示为本申请消费分析方法在一实施例中的流程示意图。
如图9所示,本实施例中的消费分析方法包括如下步骤:
步骤S101,获取商场所辖的商户的消费交易数据。
在某些实施例中,获取商户的消费交易数据可从商场所辖的商户接收消费交易数据。
例如,商场所辖的各个商户与商场建立数据互联,从而使得商场能从商户处接收相应的消费交易数据。在某些示例中,所述消费交易数据可由各个商户上传。例如,在某一商户处完成的消费交易数据可由该商户自行上传给商场的数据管理中心。商户上传消费交易数据可以实时的,即,完成一笔消费交易后就实时上传该笔消费记录。商户上传消费交易数据也可以是定期的,例如,每天、每周、每半个月等。在某些示例中,所述消费交易数据可由商场向各个商户调取。例如,商场的数据管理中心向各个商户发送数据调取请求,例如,所述数据调取请求中包含有商户信息和调取时间(段),由相应的商户响应所述数据调取请求并据此将该商户的消费交易数据上传给商场的数据管理中心。
在某些实施例中,获取商户的消费交易数据可由商场运营者通过消费者藉由网站录入或服务台登记来获得消费交易数据。
一般地,商场可对消费者在商场内消费进行积分奖励,消费者在商场的商户内消费即可获得一定的积分奖励。所述积分奖励可以是由商场统一制定,也可由各个商户自行制定。积分的获得,可以采用多种形式。在某些示例中,积分的获得可以是单纯由消费金额来实现,例如,每消费1元即可获得1个积分或10个积分。在某些示例中,积分的获得可以由阶梯式的消费金额来实现,例如,消费1000元以下,每消费1元即可获得1个积分,消费1000元至3000元,每消费1元即可获得2个积分,消费3000元至10000元,每消费1元即可获得5个积分。在某些示例中,积分的获得可以由消费者的会员等级来实现,例如,普通等级的消费者,每消费1元获得1个积分,VIP等级的消费者,每消费1元获得3个积分。在某些示例中,积分的获得可以由商场内商户的联合活动来实现,例如,若在同一活动周期内(例如,同一天,同一周内,同一月内等)在A商户和B商户都有消费的,会在计算周期结束之后额外赠送500个积分。
获得的这些积分,可有不同的用途实现。在某些示例中,积分可实现折现或兑换消费券,例如,每100个或1000个积分可兑换1元,在下次消费时抵现,每10000分积分兑换某类商户的消费券(例如,餐饮类商户或培训教育类商户的折扣券等),或者,积分可兑换商场停车券。在某些示例中,积分可兑换礼物,这些礼物可例如食品(巧克力、饼干等)、日用品(被子、杯子等)、玩具、鲜花等。
商场会提供有积分管理系统,用于对对各个消费者的会员信息、积分获得、积分兑换等进行管理。
在某些实施例中,商场提供有商场网站,消费者可通过相应的登录信息登录商场网站,录入消费记录,商场网站根据录入的消费记录,换算出该消费记录可得的积分。通过上述方式,商场就可获得各个消费者的消费交易数据。
在某些实施例中,在消费者于某个商户处完成消费后,消费者至商场内的服务台登记该次消费记录,服务台的工作人员根据登记的消费记录,换算出该消费记录可得的积分。通过上述方式,商场就可获得各个消费者的消费交易数据。
在某些实施例中,所述商场可为位于某地的单一商场。在某些实施例中,所述商场也可为具有连锁性质的商场集团,包含有多个连锁的商场,例如,上海万达广场,就可包含位于上海的多个连锁的万达广场。
获得的消费交易数据,每一笔消费记录中至少包括消费者的身份标识和商户标识。消费者的身份标识可采用多种方式。在某些示例中,消费者的身份标识为消费者在该商场注册的会员号。在某些示例中,消费者的身份标识为消费者的手机号或身份证号。在某些示例中,消费者的身份标识为消费者的微信号、QQ号、微博账号、或邮箱账号等。商户标识可采用多种方式。在某些示例中,商户账号可采用商户名称或缩略简称。在某些示例中,商户账号可采用自定义的商户编号。当然,所述消费记录中的信息并不仅限于此,所述消费记录中还可包括但不限于:交易时间、交易方式、消费金额、以及消费项目中的一个或多个,其中,交易方式可包括现金交易、POS机刷卡消费、移动支付(微信支付、支付宝支付、云闪付等)、线上预支付等,消费项目可包括实物类产品(例如食品、日用品、服饰等)或体验性服务(例如美容美发、娱乐休闲等)等。
获得的消费交易数据可以采用表单的形式,如此,形成消费交易数据表。
步骤S103,基于消费者的身份标识从消费交易数据中提取反映单个消费者的消费交易数据。
在实施例中,从消费交易数据中提取反映单个消费者的消费交易数据具体可包括:从消费交易数据中循环检索单个消费者的身份标识,提取反映单个消费者的消费交易数据。例如,针对消费者的身份标识“CA82335566”,可从所述消费交易数据中循环检索身份标识为“CA82335566”的消费记录,一旦检索到身份标识为“CA82335566”的消费记录,则将该笔消费记录提取出,接着,继续往下检索该身份标识对应的其他消费记录,如此,通过遍历检索所述消费交易数据,即可将所述消费交易数据中身份标识为“CA82335566”的所有消费记录都提取出。后续,按照上述检索方式,循环检索其他消费者的身份标识并提取对应的消费交易数据。
一般地,在提取反映单个消费者的消费交易数据之后还可对其进行重组,以便于后续的数据处理。所述重组过程具体可以是按照交易时间或消费交易金额等关键词进行排序。所述排序方式可以有多种,此处不再一一列举。
另外,如前所述,若获取的消费交易数据采用表单形式的话,经步骤S103提取的反映单个消费者的消费交易数据也可采用表单形式,即,每一个消费者都有一个对应的消费交易数据表,即,该消费交易数据表中的消费者的身份标识相同。如此,若将步骤S101中获取的商场所辖的商户的消费交易数据表可称为商场的消费交易数据总表,而步骤S103中提取得到的对应单个消费者的消费交易数据表可称为消费者的消费交易数据子表。
实际上,在步骤S101获得消费交易数据之后及步骤S103基于消费者的身份标识从消费交易数据中提取反映单个消费者的消费交易数据之前,还可包括其他的数据处理步骤。
请参阅图10,显示为本申请消费分析方法在另一实施例中的流程示意图。如图10所示,还包括步骤S102,对获取的商户的消费交易数据进行数据清洗。
由于步骤S101中获取的商户的消费交易数据中可能会存在大量无效或异常的数据,这些无效或异常的数据可能是重复的数据、多余的数据、不完整的数据、或是有错误的数据等,这些无效或异常的数据不仅会造成后续数量处理量大,更会对后续数据处理造成干扰或污染,影响数据处理结果的信度和效度。所述重复的数据例如为重复的消费记录,所述多余的数据可例如为无关的信息(例如,消费者信息、商户信息等)或者是无实际消费所产生的数据(例如,无实质消费记录而产生的积分赠与记录等)。因此,需要删除这些无效或异常的数据或者对这些无效或异常的数据中的部分或全部进行纠正,这就涉及到对数据进行清洗。
一般地,数据清洗(Data Cleaning),通常是指对数据进行重新审查和校验的过程,目的在于删除重复的数据、删除多余的数据、删除或纠正不完整的数据和错误的数据,从而得到一致性较高的数据。
目前,对于轻量级数据,传统上会采用人工清洗的方式,缺少统一、标准的清洗流程,人工清洗的方式主要存在如下问题:数据清洗耗时长,人工清洗的方式依赖于操作人员进行数据判断,且判断后需要一步步完成清洗,需要大量时间;数据清洗容易出现遗漏;数据清洗结果不稳定,数据清洗的结果会因操作人员的不同而出现清洗结果不一致的问题;数据清洗过程不可回溯,当出现清洗失误时无法回查修正;数据清洗结果核查费时费力,清洗完成后需对数据进行重新统计,核查数据清洗结果。因此,对于本申请中大数据量的消费交易数据,很显然,采用传统的人工清洗绝非是行之有效的方式。
在实施例中,对获取的消费交易数据中的部分或全部进行数据清洗,删除重复的数据、删除多余的数据、删除或纠正不完整的数据和错误的数据,保留合格的数据和经纠正后的数据。
对消费交易数据进行清洗可按照预设的数据清洗规则来实现,所述数据清洗规则文件中可包括一条或多条数据清洗规则,其中的数据清洗规则可根据数据的类型、格式、来源、和/或行业等设定,即,不同类型的数据可设定不同的数据清洗规则,不同格式的数据可设定不同的数据清洗规则,不同来源的数据可设定不同的数据清洗规则,不同行业的数据可设定不同的数据清洗规则。
在一示例中,数据清洗规则可进行有效性验证并根据有效性验证结果进行调整。例如,通过对消费交易数据进行自相关的和互相关的数据有效性验证分析,根据有效性验证分析结果,判断当前的针对某个数据源、数据类型、和/或数据格式的数据清洗规则是否需要修正。若需要修正,则修正原有的数据清洗规则并予以更新,从而可根据更新后的数据清洗规则对消费交易数据进行清洗。
在一示例中,可采用机器学习方法来训练数据清洗规则,例如,通过对已有的数据采用机器学习方法来训练数据清洗规则,后续,即可利用训练出来的数据清洁规则来对消费交易数据进行数据清洗。
步骤S105,基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联。
在实施例中,在步骤S105中,会对步骤S103中所提取的反映单个消费者的消费交易数据进行关联分析以获得所述单个消费者所涉及的各个商户之间的消费关联,并将所有的单个消费者所涉及的商户之间的消费关联予以汇总,进而获得所有消费者所涉及的商户之间的消费关联,即商场所辖的商户之间的消费关联。
步骤S105更可细化为步骤S1051和步骤S1053。
步骤S1051,依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联。
在某些示例中,从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联可至少包括以下操作:
从单个消费者的消费交易数据中通过循环检索提取每一次检索所涉及的两笔消费记录中商户之间的消费关联。
将循环检索得到的商户之间的消费关联进行合并和统计,获得与单个消费者的消费交易数据对应的商户之间的消费关联。
在该示例中,是先通过循环检索提取每一次检索所涉及的两笔消费记录中商户之间的消费关联,再将检索结果中相同的商户之间的消费关联进行合并和统计。
要获得商户之间的消费关联,即,就是要确认各个商户两两之间是否存在消费关联。因此,在实施例中,通过检索任意两笔消费记录中所涉及的商户标识即可获得涉及的两个商户之间的消费关联。
值得注意的是,涉及的两个商户之间的消费关联,遵从两个规则:一,商户之间的消费关联与消费记录的顺序无关,无指向性。二,商户之间的消费关联确指不同商户之间的消费关联,并不包含仅涉及到单一商户(即首尾的商户相同的消费关联)。
关于如何通过循环检索的方式从反映单个消费者的消费交易数据中获得与单个消费者的消费交易数据对应的商户之间的消费关联的实现方式,可参见前述消费分析系统中针对表一中的消费交易数据得到商户之间的消费关联的示例描述,涉及到表一至表三,在此不再赘述。
在某些示例中,从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联可至少包括以下操作:
依序从单个消费者的每一笔消费记录中提取出商户的商户标识;
将提取的商户的商户标识进行汇总;
将汇总的商户的商户标识进行两两关联以形成商户之间的消费关联。
在该示例中,是先从每一笔消费记录中提取出商户,将相应的商户汇总,再将汇总的商户进行两两关联获得商户之间的消费关联。
值得注意的是,在对商户进行两两关联时,仍遵从前述的两个规则:一,商户之间的消费关联与消费记录的顺序无关,无指向性。二,商户之间的消费关联确指不同商户之间的消费关联,并不包含仅涉及到单一商户(即首尾的商户相同的消费关联)。
关于如何通过商户汇总后两两关联来获得与单个消费者的消费交易数据对应的商户之间的消费关联的实现方式,可参见前述消费分析系统中针对表三中的消费交易数据得到商户之间的消费关联的示例描述,涉及到表四和表五,在此不再赘述。
通过上述两个示例,可从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联。如此,可对其他消费者的消费交易数据如法炮制,从而可依序从单个消费者的消费交易数据中提取出能反映单个消费者的消费交易数据中所涉及的商户之间消费关联。具体可参见表六及相关描述,在此不再赘述。
步骤S1053,将提取的商户标识以及商户之间的消费关联进行汇总和统计,获得商场所辖的商户之间的消费关联。
在步骤S1051中,获得了反映单个消费者的消费交易数据中所涉及的商户之间消费关联。而在步骤S1053中,就是基于商户之间的消费关联进行汇总,即,将不同消费者的消费交易数据中基于相同的商户之间的消费关联进行汇总。
关于步骤S1053中将提取的商户标识以及商户之间的消费关联进行汇总和统计的具体实现方式,可参见表七及相关描述,在此不再赘述。
实际上,在某些实施例中,还可包括对提取的商户标识以及商户之间的消费关联进行筛选的步骤,通过筛选,滤除重复的或不符合筛选要求的数据。在某些示例中,可滤除仅包含单一商户(即首尾的商户相同)的消费关联的数据。在某些示例中,可滤除不符合筛选要求的数据,所述筛选要求可包括最小消费关联数量或限定时间段内的消费关联等。
本示例公开的消费分析方法,通过获取商场所辖的商户的消费交易数据,基于消费者的身份标识从所述消费交易数据中提取反映单个消费者的消费交易数据,从而可基于各个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,相较于相关技术,能避免人工处理大数据的麻烦和不足,具有数据处理准确及高效的优点。
请参阅图11,显示为消费分析方法在又一实施例中的流程示意图。
如图11所示,本实施例中的消费分析方法包括如下步骤:
步骤S201,获取商场所辖的商户的消费交易数据。
在某些实施例中,获取商户的消费交易数据可从商场所辖的商户接收消费交易数据。
在某些实施例中,获取商户的消费交易数据可由商场运营者通过消费者藉由网站录入或服务台登记来获得消费交易数据。
关于如何获取商场所辖的商户的消费交易数据的内容,可具体参见图8中步骤S101的描述,在此不再赘述。
步骤S203,基于消费者的身份标识从消费交易数据中提取反映单个消费者的消费交易数据。
关于从消费交易数据中提取反映单个消费者的消费交易数据的内容,可具体参见图8中步骤S103的描述,在此不再赘述。
步骤S205,基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联。
在实施例中,对经步骤S203所提取的反映单个消费者的消费交易数据进行关联分析以获得所述单个消费者所涉及的各个商户之间的消费关联,并将所有的单个消费者所涉及的商户之间的消费关联予以汇总,进而获得所有消费者所涉及的商户之间的消费关联,即商场所辖的商户之间的消费关联。
首先,依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联。
在某些示例中,从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联可至少包括以下操作:
从单个消费者的消费交易数据中通过循环检索提取每一次检索所涉及的两笔消费记录中商户之间的消费关联。
将循环检索得到的商户之间的消费关联进行合并和统计,获得与单个消费者的消费交易数据对应的商户之间的消费关联。
在该示例中,是先通过循环检索提取每一次检索所涉及的两笔消费记录中商户之间的消费关联,再将检索结果中相同的商户之间的消费关联进行合并和统计。
在某些示例中,从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联可至少包括以下操作:
依序从单个消费者的每一笔消费记录中提取出商户的商户标识;
将提取的商户的商户标识进行汇总;
将汇总的商户的商户标识进行两两关联以形成商户之间的消费关联。
在该示例中,是先从每一笔消费记录中提取出商户,将相应的商户汇总,再将汇总的商户进行两两关联获得商户之间的消费关联。
接着,将提取的商户标识以及商户之间的消费关联进行汇总和统计,获得商场所辖的商户之间的消费关联。
关于步骤S205的具体实现方式的内容,可具体参见图8中步骤S105的描述,在此不再赘述。
实际上,在某些实施例中,还可包括对提取的商户标识以及商户之间的消费关联进行筛选的步骤,通过筛选,滤除重复的或不符合筛选要求的数据。在某些示例中,可滤除仅包含单一商户(即首尾的商户相同)的消费关联的数据。在某些示例中,可滤除不符合筛选要求的数据,所述筛选要求可包括最小消费关联数量或限定时间段内的消费关联等。
步骤S207,基于获得的商户之间的消费关联,构建消费网络图。
能基于各个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,不过,这些商户之间的消费关联更多采用的是表单等形式,不能直观、形象地展现商户之间的消费关联。
有鉴于此,在实施例中,在步骤S207中,基于获得的商户之间的消费关联来构建消费网络图。
特别地,在实施例中,构建消费网络图是基于图论和商户之间的消费关联来实现的。
图是一种数据结构,可定义为:Graph=(V,E),其中,V是一个非空有限集合,集合V中的元素代表图G的顶点(或节点、点),集合E中的元素代表边(或连线),一般用(Vx,Vy)表示,其中,Vx,Vy属于V。若两个顶点U、V之间有一条边连接,则称这两个顶点U、V是关联的。
基于这样的概念,本申请提出以商户为顶点、上述与商户之间的消费关联信息为边的图,以便基于图的关联模型和算法进行商户之间的消费关联分析来提高数据分析的性能和效率。
在实施例中,构建的消费网络图具有如下规则:
在拟构建的消费网络图中,以商户作为顶点、商户与商户之间的关联消费作为边。
针对顶点,以商户的活跃度指数作为所述商户对应的顶点的权重。在这里,所述活跃度指数包括但不限于以下的至少一个:消费交易笔数、消费交易金额、以及单笔消费平均交易金额。
针对边,以商户与商户之间的关联消费笔数作为边的权重。
如此,可便于用户(例如,商场经营者、商户经营者、咨询分析人员等)能通过观察基于上述规则所构建的消费网络图,直观且清晰地了解或掌握商户之间的消费关联及其关联强度等信息。
关于基于获得的商户之间的消费关联来构建消费网络图的内容,可参见前述消费分析系统中针对表七中所列的各个商户之间的消费关联信息来构建消费网络图的示例描述,在此不再赘述。
实际上,在实施例中,还可以商户所属行业来构建顶点的属性。
请参阅图12,显示为消费分析方法在再一实施例中的流程示意图。
如图12所示,本实施例中的消费分析方法还包括:
步骤S209,将构建的消费网络图以可视化形式予以输出显示。
在步骤S209中,将关联构建单元17构建的商场所辖的所有商户的商户之间的消费关联信息以图予以显示,这样,用户即可全局地看到所有商户的商户之间的消费关联。
本示例公开的消费分析方法,获取商场所辖的商户的消费交易数据,基于消费者的身份标识从所述消费交易数据中提取反映单个消费者的消费交易数据,基于各个消费者的消费交易数据中所涉及的商户标识获得商户之间的消费关联,从而基于获得的商户之间的消费关联来构建消费网络图,并通过可视化显示单元将构建的消费网络图以直观、形象地展现出商户之间的消费关联,用户即可根据消费网络图,可以对商户入驻选择、商户布局、商户经营策略的调整、营销计划的制定、确定广告的投放目标等经营活动进行决策。
本示例中消费分析方法还可作其他的扩展。
在某些实施例中,在显示的消费网络图的顶点和/或边上可供用户进行操作。以顶点为例,用户可通过鼠标点选或手指点选(若用于显示消费网络图的显示设备为触控显示面时)至对应的顶点,那么,即可根据所述点选操作,将以被点选的顶点为中心的商户之间的消费关联例如以高亮方式显示出来,从而能针对特定商户与其他商户之间的消费关联进行查看和分析。
在某些实施例中,还可根据分析条件来构建新的消费网络图或调整原有的消费网络图,并将新的消费网络图或调整的消费网络图以可视化形式予以输出显示。例如,用户在全局地看到所有商户的商户之间的消费关联之后,进一步输入分析条件,基于所述分析条件重新构建消费网络图。
本申请还公开一种消费分析装置,其包括但不限于处理器和存储器。
所述处理器可以是中央处理单元(Central Processing Unit),也可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。所述中央处理器可采用由Intel公司开发出来的x86处理器架构或是此采用由ARM公司开发出来的进阶精简指令集机器(Advanced RISC Machines,ARM)处理器架构。
所述存储器可用于存储所述计算机指令和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机指令和/或模块,以及调用存储在存储器内的数据,实现消费分析系统1的各种功能。所述存储器可主要包括指令存储区和数据存储区,其中,指令存储区可存储操作系统、至少一个功能所需的软件程序或应用程序等;数据存储区可存储消费交易数据和商户之间的消费关联的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述消费分析系统如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过执行计算机程序来控制相关的硬件完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
上述实施例仅例示性说明本申请的原理及其功效,而非用于限制本申请。任何熟悉此技术的人士皆可在不违背本申请的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本申请所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本申请的权利要求所涵盖。

Claims (34)

1.一种消费分析方法,其特征在于,包括以下步骤:
获取商场所辖的商户的消费交易数据;所述消费交易数据包括消费者的身份标识和商户标识;
基于消费者的身份标识从所述消费交易数据中提取反映单个消费者的消费交易数据;以及
基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联。
2.根据权利要求1所述的消费分析方法,其特征在于,所述获取商场所辖的商户的消费交易数据通过以下至少一种方式实现:
从商场所辖的商户接收消费交易数据;
由商场运营者通过消费者藉由网站录入或服务台登记来获得消费交易数据。
3.根据权利要求1所述的消费分析方法,其特征在于,获取商场所辖的商户的消费交易数据是在预定时间段内获取商场所辖的商户的消费交易数据。
4.根据权利要求1所述的消费分析方法,其特征在于,还包括如下步骤:按照数据清洗规则,对获取的消费交易数据进行数据清洗。
5.根据权利要求1所述的消费分析方法,其特征在于,所述基于消费者的身份标识从所述消费交易数据中提取反映单个消费者的消费交易数据包括如下步骤:
从所述消费交易数据中循环检索单个消费者的身份标识,提取反映单个消费者的消费交易数据。
6.根据权利要求1所述的消费分析方法,其特征在于,基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联,包括以下步骤:
依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联;
将提取的商户标识以及商户之间的消费关联进行汇总和统计,获得商场所辖的商户之间的消费关联。
7.根据权利要求6所述的消费分析方法,其特征在于,所述从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联,包括以下步骤:
从单个消费者的消费交易数据中通过循环检索提取每一次检索所涉及的两笔消费记录中商户之间的消费关联;
将循环检索得到的商户之间的消费关联进行合并和统计,获得与单个消费者的消费交易数据对应的商户之间的消费关联。
8.根据权利要求6所述的消费分析方法,其特征在于,所述从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联,包括以下步骤:
依序从单个消费者的每一笔消费记录中提取出商户的商户标识;
将提取的商户的商户标识进行汇总;
将汇总的商户的商户标识进行两两关联以形成商户之间的消费关联。
9.根据权利要求7或8所述的消费分析方法,其特征在于,还包括以下步骤:
对提取的商户标识以及商户之间的消费关联进行筛选,滤除重复的或不符合筛选要求的数据。
10.根据权利要求1所述的消费分析方法,其特征在于,还包括如下步骤:基于获得的商户之间的消费关联,构建消费网络图。
11.根据权利要求10所述的消费分析方法,其特征在于,基于获得的商户之间的消费关联,构建消费网络图,包括如下步骤:以商户作为顶点、商户与商户之间的关联消费作为边构建消费网络图。
12.根据权利要求11所述的消费分析方法,其特征在于,还包括以下步骤:在构建消费网络图的过程中,根据所述消费交易数据,以商户的活跃度指数作为所述商户对应的顶点的权重。
13.根据权利要求12所述的消费分析方法,其特征在于,所述活跃度指数包括以下的至少一个:消费交易笔数、消费交易金额、以及单笔消费平均交易金额。
14.根据权利要求11所述的消费分析方法,其特征在于,还包括以下步骤:在构建消费网络图的过程中,根据所述消费交易数据,以商户与商户之间的关联消费笔数作为边的权重。
15.根据权利要求11所述的消费分析方法,其特征在于,还包括以下步骤:在构建消费网络图的过程中,根据所述消费交易数据,以商户的经营类别作为顶点的属性。
16.根据权利要求11所述的消费分析方法,其特征在于,还包括将构建的消费网络图以可视化形式予以输出显示的步骤。
17.根据权利要求16所述的消费分析方法,其特征在于,还包括如下步骤:在显示的消费网络图的顶点和/或边上进行操作。
18.根据权利要求11所述的消费分析方法,其特征在于,还包括以下步骤:根据分析条件,构建新的消费网络图或调整原有的消费网络图。
19.一种消费分析系统,其特征在于,包括:
数据获取单元,用于获取商场所辖的商户的消费交易数据;所述消费交易数据包括消费者的身份标识和商户标识;
数据提取单元,用于基于消费者的身份标识,从所述消费交易数据中提取反映单个消费者的消费交易数据;以及
关联分析单元,用于基于至少一个消费者的消费交易数据中所涉及的商户标识,获得商户之间的消费关联。
20.根据权利要求19所述的消费分析系统,其特征在于,所述获取商场所辖的商户的消费交易数据通过以下至少一种方式实现:
从商场所辖的商户接收消费交易数据;
由商场运营者通过消费者藉由网站录入或服务台登记来获得消费交易数据。
21.根据权利要求19所述的消费分析系统,其特征在于,还包括数据清洗单元,用于按照数据清洗规则对获取的消费交易数据进行数据清洗。
22.根据权利要求19所述的消费分析系统,其特征在于,所述关联分析单元包括:
关联提取模块,用于依序从单个消费者的消费交易数据中提取出所涉及的商户标识以及商户之间的消费关联;
汇总模块,用于将提取的商户标识以及商户之间的消费关联进行汇总和统计,获得商场所辖的商户之间的消费关联。
23.根据权利要求22所述的消费分析系统,其特征在于,所述关联分析单元还包括:
数据筛选模块,用于对提取的商户标识以及商户之间的消费关联进行筛选,滤除重复的或不符合筛选要求的数据。
24.根据权利要求19所述的消费分析系统,其特征在于,还包括关联构建单元,用于基于获得的商户之间的消费关联,构建消费网络图。
25.根据权利要求24所述的消费分析系统,其特征在于,所述关联构建单元是以商户作为顶点、商户与商户之间的关联消费作为边来构建消费网络图的。
26.根据权利要求25所述的消费分析系统,其特征在于,所述关联构建单元还包括以商户的活跃度指数作为所述商户对应的顶点的权重。
27.根据权利要求26所述的消费分析系统,其特征在于,所述活跃度指数包括以下的至少一个:消费交易笔数、消费交易金额、以及单笔消费平均交易金额。
28.根据权利要求25所述的消费分析系统,其特征在于,所述关联构建单元还包括以商户与商户之间的关联消费笔数作为边的权重。
29.根据权利要求25所述的消费分析系统,其特征在于,所述关联构建单元还包括以商户的经营类别作为顶点的属性。
30.根据权利要求24所述的消费分析系统,其特征在于,还包括可视化显示单元,用于将构建的消费网络图以可视化形式予以输出显示。
31.一种消费分析装置,其特征在于,包括:
存储器,用于存储指令;
处理器,耦合到所述存储器,所述处理器被配置为基于所述存储器存储的指令执行实现如权利要求1至18中任一项所述的消费分析方法。
32.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述指令被处理器执行时实现如权利要求1至18中任一项所述的消费分析方法。
33.一种消费分析平台,其特征在于,包括:
如权利要求19至30中任一项所述的消费分析系统;
数据存储单元,用于存储消费交易数据和由所述消费分析系统获得商户之间的消费关联;以及
数据处理单元,用于根据操作指令对所述数据存储单元中商户之间的消费关联进行数据处理;所述操作指令包括即时查询和多维数据分析中的至少一种。
34.根据权利要求33所述的消费分析平台,其特征在于,还包括:
可视化展示单元,用于提供操作界面以及将所述数据处理单元的处理结果采用可视化的界面予以展示。
CN201910413604.1A 2019-05-17 2019-05-17 消费分析方法和系统、装置以及消费分析平台 Active CN111951035B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202410611776.0A CN118521330A (zh) 2019-05-17 2019-05-17 消费分析方法和系统、装置以及消费分析平台
CN201910413604.1A CN111951035B (zh) 2019-05-17 2019-05-17 消费分析方法和系统、装置以及消费分析平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910413604.1A CN111951035B (zh) 2019-05-17 2019-05-17 消费分析方法和系统、装置以及消费分析平台

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202410611776.0A Division CN118521330A (zh) 2019-05-17 2019-05-17 消费分析方法和系统、装置以及消费分析平台

Publications (2)

Publication Number Publication Date
CN111951035A true CN111951035A (zh) 2020-11-17
CN111951035B CN111951035B (zh) 2024-06-11

Family

ID=73336169

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202410611776.0A Pending CN118521330A (zh) 2019-05-17 2019-05-17 消费分析方法和系统、装置以及消费分析平台
CN201910413604.1A Active CN111951035B (zh) 2019-05-17 2019-05-17 消费分析方法和系统、装置以及消费分析平台

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202410611776.0A Pending CN118521330A (zh) 2019-05-17 2019-05-17 消费分析方法和系统、装置以及消费分析平台

Country Status (1)

Country Link
CN (2) CN118521330A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667968A (zh) * 2020-12-22 2021-04-16 银联商务股份有限公司 一种数据处理装置、方法、设备及可读存储介质

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040016461A (ko) * 2002-08-17 2004-02-25 장형환 직원 간 전자 상거래 시스템
US20080133391A1 (en) * 2006-09-05 2008-06-05 Kerry Ivan Kurian User interface for sociofinancial systems and methods
CN101944218A (zh) * 2010-01-27 2011-01-12 北京大学 社会网络下的基于图的个性化推荐方法及其系统
CN102087730A (zh) * 2009-12-08 2011-06-08 深圳市腾讯计算机系统有限公司 一种产品用户网络构建方法和装置
CN102254028A (zh) * 2011-07-22 2011-11-23 青岛理工大学 一种集成属性和结构相似性的个性化商品推荐方法和系统
KR20140114508A (ko) * 2013-03-15 2014-09-29 이정훈 특정 패턴디자인 융합 오브젝트와 킬러콘텐츠 관계 복합거래 시스템 및 그 방법
CN105139252A (zh) * 2015-10-14 2015-12-09 北京邻和科技有限公司 一种基于网络平台的交易与消费系统及方法
CN105528716A (zh) * 2015-12-03 2016-04-27 山东烟草研究院有限公司 一种面向零售商户个性化需求的烟草品牌远程智能推荐方法
CN105678323A (zh) * 2015-12-31 2016-06-15 中国银联股份有限公司 基于图的分析用户的方法和系统
CN105761101A (zh) * 2016-02-04 2016-07-13 云南今日游情科技有限公司 基于相互选择的移动终端高精准度广告推送系统及方法
CN106254525A (zh) * 2016-09-12 2016-12-21 中国银联股份有限公司 一种信息推送方法和系统
CN106296308A (zh) * 2016-08-24 2017-01-04 广州云移信息科技有限公司 一种商户营销方法及系统
CN106384253A (zh) * 2016-09-30 2017-02-08 中国银联股份有限公司 一种银行卡交易中消费行为分析方法及装置
US20170140382A1 (en) * 2015-11-12 2017-05-18 International Business Machines Corporation Identifying transactional fraud utilizing transaction payment relationship graph link prediction
CN106779811A (zh) * 2016-11-25 2017-05-31 中国银联股份有限公司 一种消费商户预测方法和装置
CN107203529A (zh) * 2016-03-16 2017-09-26 中国移动通信集团河北有限公司 基于元数据图结构相似性的多业务关联性分析方法及装置
CN107230121A (zh) * 2016-03-25 2017-10-03 阿里巴巴集团控股有限公司 交易处理方法、装置及服务器
CN107248095A (zh) * 2017-04-14 2017-10-13 北京小度信息科技有限公司 推荐方法及装置
CN107436914A (zh) * 2017-06-06 2017-12-05 北京小度信息科技有限公司 推荐方法及装置
CN109493086A (zh) * 2018-10-26 2019-03-19 中国银联股份有限公司 一种确定违规商户的方法及装置

Patent Citations (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040016461A (ko) * 2002-08-17 2004-02-25 장형환 직원 간 전자 상거래 시스템
US20080133391A1 (en) * 2006-09-05 2008-06-05 Kerry Ivan Kurian User interface for sociofinancial systems and methods
CN102087730A (zh) * 2009-12-08 2011-06-08 深圳市腾讯计算机系统有限公司 一种产品用户网络构建方法和装置
CN101944218A (zh) * 2010-01-27 2011-01-12 北京大学 社会网络下的基于图的个性化推荐方法及其系统
CN102254028A (zh) * 2011-07-22 2011-11-23 青岛理工大学 一种集成属性和结构相似性的个性化商品推荐方法和系统
KR20140114508A (ko) * 2013-03-15 2014-09-29 이정훈 특정 패턴디자인 융합 오브젝트와 킬러콘텐츠 관계 복합거래 시스템 및 그 방법
CN105139252A (zh) * 2015-10-14 2015-12-09 北京邻和科技有限公司 一种基于网络平台的交易与消费系统及方法
US20170140382A1 (en) * 2015-11-12 2017-05-18 International Business Machines Corporation Identifying transactional fraud utilizing transaction payment relationship graph link prediction
CN105528716A (zh) * 2015-12-03 2016-04-27 山东烟草研究院有限公司 一种面向零售商户个性化需求的烟草品牌远程智能推荐方法
WO2017114276A1 (zh) * 2015-12-31 2017-07-06 中国银联股份有限公司 基于图的分析用户的方法和系统
CN105678323A (zh) * 2015-12-31 2016-06-15 中国银联股份有限公司 基于图的分析用户的方法和系统
CN105761101A (zh) * 2016-02-04 2016-07-13 云南今日游情科技有限公司 基于相互选择的移动终端高精准度广告推送系统及方法
CN107203529A (zh) * 2016-03-16 2017-09-26 中国移动通信集团河北有限公司 基于元数据图结构相似性的多业务关联性分析方法及装置
CN107230121A (zh) * 2016-03-25 2017-10-03 阿里巴巴集团控股有限公司 交易处理方法、装置及服务器
CN106296308A (zh) * 2016-08-24 2017-01-04 广州云移信息科技有限公司 一种商户营销方法及系统
CN106254525A (zh) * 2016-09-12 2016-12-21 中国银联股份有限公司 一种信息推送方法和系统
CN106384253A (zh) * 2016-09-30 2017-02-08 中国银联股份有限公司 一种银行卡交易中消费行为分析方法及装置
CN106779811A (zh) * 2016-11-25 2017-05-31 中国银联股份有限公司 一种消费商户预测方法和装置
CN107248095A (zh) * 2017-04-14 2017-10-13 北京小度信息科技有限公司 推荐方法及装置
CN107436914A (zh) * 2017-06-06 2017-12-05 北京小度信息科技有限公司 推荐方法及装置
CN109493086A (zh) * 2018-10-26 2019-03-19 中国银联股份有限公司 一种确定违规商户的方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112667968A (zh) * 2020-12-22 2021-04-16 银联商务股份有限公司 一种数据处理装置、方法、设备及可读存储介质
CN112667968B (zh) * 2020-12-22 2023-01-24 银联商务股份有限公司 一种数据处理装置、方法、设备及可读存储介质

Also Published As

Publication number Publication date
CN118521330A (zh) 2024-08-20
CN111951035B (zh) 2024-06-11

Similar Documents

Publication Publication Date Title
CN108876526B (zh) 商品推荐方法、装置和计算机可读存储介质
US11468475B2 (en) Apparatuses, computer program products, and methods for generation of augmented reality interfaces
US8589208B2 (en) Data integration and analysis
US20180174205A1 (en) Systems and methods for recommending merchants to a consumer
US8909646B1 (en) Pre-processing of social network structures for fast discovery of cohesive groups
US8341101B1 (en) Determining relationships between data items and individuals, and dynamically calculating a metric score based on groups of characteristics
US11798023B2 (en) Systems and methods to determine tax classification of benefits offered to subscribers of a membership platform
Sudaryanto et al. Impact of culture, brand image and price on buying decisions: Evidence from East Java, Indonesia
CN109118283A (zh) 基于大数据的精准营销服务系统
CN112269805A (zh) 数据处理方法、装置、设备及介质
KR20160090509A (ko) 감성기반 사용자특성 분석을 이용한 개인화된 광고 제공 서비스 방법
WO2012174650A1 (en) Method for geographically targeting online advertising campaigns
Xu et al. The influences of experiential marketing factors on brand trust, brand attachment, and behavioral intention: Focused on integrated resort tourists
CN109685573A (zh) 一种商圈数据的处理方法、装置、电子设备和存储介质
Leo et al. Correlations and dynamics of consumption patterns in social-economic networks
CN117455579B (zh) 商品推荐干预方法、装置以及介质和设备
CN111951035B (zh) 消费分析方法和系统、装置以及消费分析平台
US20210326910A1 (en) System and method for optimizing an observation campaign in response to observed real-world data
KR20190079582A (ko) 선물 추천 서비스 방법 및 이를 실행하기 위한 선물 추천 서버
Choudhary et al. Role of retail store attributes on store and customer engagement in food industry
Liao et al. Mining customer knowledge for channel and product segmentation
KR20210112258A (ko) 오프라인 구매를 위한 개인화된 추천 서비스 제공 방법 및 장치
Kadhim et al. Factors influencing (Reputation, Perceived Value, Location, Convenience, Internal Environment, and Staff) on Customer Loyalty through Satisfaction: Perspective from Malaysia Hypermarket Industry
KR20210111117A (ko) 업로드된 미디어로부터 추출된 이미지 기반의 상품 거래 시스템
Liu et al. The Moderating Effect of Income for the Relation Between Online and In-Store Shopping of Airlines Employees.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20231013

Address after: Room 901-A, Block B, Building 19, No. 36 Changsheng South Road, Economic and Technological Development Zone, Jiaxing City, Zhejiang Province, 314001

Applicant after: Jiaxing Shurong Data Technology Co.,Ltd.

Address before: Room 1301, Building 2, Chuangzhi Tiandi Technology Center, No. 477 Zhengli Road, Yangpu District, Shanghai, 200433

Applicant before: Shanghai Shurong Data Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant