CN115471302B - 基于大数据分析的电子营销数据处理方法 - Google Patents

基于大数据分析的电子营销数据处理方法 Download PDF

Info

Publication number
CN115471302B
CN115471302B CN202211417283.0A CN202211417283A CN115471302B CN 115471302 B CN115471302 B CN 115471302B CN 202211417283 A CN202211417283 A CN 202211417283A CN 115471302 B CN115471302 B CN 115471302B
Authority
CN
China
Prior art keywords
category
commodities
purchase quantity
correlation
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211417283.0A
Other languages
English (en)
Other versions
CN115471302A (zh
Inventor
孙晓琛
葛强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Zhidou Digital Technology Co ltd
Original Assignee
Shandong Zhidou Digital Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Zhidou Digital Technology Co ltd filed Critical Shandong Zhidou Digital Technology Co ltd
Priority to CN202211417283.0A priority Critical patent/CN115471302B/zh
Publication of CN115471302A publication Critical patent/CN115471302A/zh
Application granted granted Critical
Publication of CN115471302B publication Critical patent/CN115471302B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Finance (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Pure & Applied Mathematics (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Algebra (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及大数据技术领域,具体涉及一种基于大数据分析的电子营销数据处理方法。该方法包括:获取电子营销数据中的历史订单,基于历史订单,获取任意两个类别的商品被同时购买的购买概率和实际购买频率,任意两个类别的商品包括第一类别商品和第二类别商品;获取第一类别商品和第二类别商品之间的相关度、第一类别商品和第二类别商品之间的非相关度和第一类别商品和第二类别商品被同时购买的趋势度;基于购买概率、实际购买频率、相关度、非相关度和趋势度,获取第一类别商品和第二类别商品之间的目标相关度;基于目标相关度,将第一类别商品和第二类别商品进行关联。本申请提高了商品相关性评估的准确性,并提高了评估效率,节省了评估成本。

Description

基于大数据分析的电子营销数据处理方法
技术领域
本申请涉及大数据技术领域,具体涉及一种基于大数据分析的电子营销数据处理方法。
背景技术
在电商平台上有些不同类别的商品经常被同一个用户同时购买,可以认为这些被同一个用户同时购买的商品之间具有一定的相关性。在电子营销行业中,往往需要对商品的电子营销大数据进行分析处理,来确定这些商品之间的相关性,从而实现商品的选择性推送,以达到更好的营销目的。
现有技术中,通过聚类算法评估不同类别的商品之间的相关性,由于该现有技术仅考虑了商品被同时购买的次数,考虑的因素较为单一,存在准确性较低的缺陷,且由于聚类过程的计算量较大,导致效率较低,成本较高。
发明内容
为了解决上述技术问题,本申请的目的在于提供一种基于大数据分析的电子营销数据处理方法,所采用的技术方案具体如下:
本申请提出了一种基于大数据分析的电子营销数据处理方法,所述方法包括:
获取电子营销数据中的历史订单,基于所述历史订单,获取任意两个类别的商品被同时购买的购买概率和实际购买频率,所述任意两个类别的商品包括第一类别商品和第二类别商品;
从所述历史订单中,确定所述第一类别商品和所述第二类别商品被同时购买的第一订单、所述第一类别商品被单独购买的第二订单和所述第二类别商品被单独购买的第三订单;
基于所述第一订单、所述第二订单和所述第三订单,获取所述第一类别商品和所述第二类别商品之间的相关度以及所述第一类别商品和所述第二类别商品之间的非相关度;
获取每个所述第一订单上所述第一类别商品的第一购买数量和所述第二类别商品的第二购买数量,并基于所述第一购买数量和所述第二购买数量,获取所述第一类别商品和所述第二类别商品被同时购买的趋势度;
基于所述购买概率、所述实际购买频率、所述相关度、所述非相关度和所述趋势度,获取所述第一类别商品和所述第二类别商品之间的目标相关度;
基于所述目标相关度,将所述第一类别商品和所述第二类别商品进行关联。
在一些实施例中,所述相关度的获取过程,包括:
获取所述第一类别商品在全部所述第一订单中的第一平均购买数量,以及所述第二类别商品在全部所述第一订单中的第二平均购买数量;
基于所述第一购买数量、所述第二购买数量、所述第一平均购买数量和所述第二平均购买数量,获取所述第一类别商品与所述第二类别商品之间的所述相关度。
在一些实施例中,所述基于所述第一购买数量、所述第二购买数量、所述第一平均购买数量和所述第二平均购买数量,获取所述第一类别商品与所述第二类别商品之间的所述相关度,包括:
根据相关度公式获取所述相关度,其中,所述相关度公式包括:
Figure 355362DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
为第一类别商品和第二类别商品之间的相关度,
Figure 785731DEST_PATH_IMAGE004
为第一订单的数量,
Figure DEST_PATH_IMAGE005
表示第一订单,
Figure 861003DEST_PATH_IMAGE006
为第
Figure DEST_PATH_IMAGE007
个第一订单中第一类别商品的第一购买数量,
Figure 540246DEST_PATH_IMAGE008
为第一类别商品在全部第一订单中的第一平均购买数量,
Figure DEST_PATH_IMAGE009
为第
Figure 751785DEST_PATH_IMAGE007
个第一订单中第二类别商品的第二购买数量,
Figure 756650DEST_PATH_IMAGE010
为第二类别商品在全部第一订单中的第二平均购买数量,
Figure 74147DEST_PATH_IMAGE007
为正整数。
在一些实施例中,所述非相关度的获取过程,包括:
获取所述第二订单中所述第一类别商品的第三购买数量、所述第一类别商品在全部所述第二订单中的第三平均购买数量、所述第三订单中所述第二类别商品的第四购买数量和所述第二类别商品在全部所述第三订单中的第四平均购买数量;
基于所述第三购买数量、所述第三平均购买数量、所述第四购买数量和所述第四平均购买数量,获取所述第一类别商品与所述第二类别商品之间的所述非相关度。
在一些实施例中,所述基于所述第三购买数量、所述第三平均购买数量、所述第四购买数量和所述第四平均购买数量,获取所述第一类别商品与所述第二类别商品之间的所述非相关度,包括:
根据非相关度公式获取所述非相关度,其中,所述非相关度公式包括:
Figure 291502DEST_PATH_IMAGE012
其中,
Figure DEST_PATH_IMAGE013
为第一类别商品与第二类别商品之间的非相关度,
Figure 295230DEST_PATH_IMAGE014
表示第二订单,
Figure DEST_PATH_IMAGE015
为第二订单的数量,
Figure 64472DEST_PATH_IMAGE016
为第
Figure DEST_PATH_IMAGE017
个第二订单中第一类别商品的第三购买数量,
Figure 114336DEST_PATH_IMAGE018
为第一类别商品在全部第二订单中的第三平均购买数量,
Figure DEST_PATH_IMAGE019
表示第三订单,
Figure 200628DEST_PATH_IMAGE020
为第三订单的数量,
Figure DEST_PATH_IMAGE021
为第
Figure 652338DEST_PATH_IMAGE022
个第三订单中第二类别商品的第四购买数量,
Figure DEST_PATH_IMAGE023
为第二类别商品在全部第三订单中的第四平均购买数量,
Figure 733427DEST_PATH_IMAGE017
Figure 942691DEST_PATH_IMAGE022
均为正整数。
在一些实施例中,所述趋势度的获取过程,包括:
基于所述第一购买数量和所述第二购买数量,获取所述第一订单上所述第一类别商品与所述第二类别商品之间的商品购买数量比例;
基于所述商品购买数量比例,获取所述第一订单的下一个相邻第一订单的商品购买数量与所述第一订单的商品购买数量之间的比值,作为所述第一类别商品和所述第二类别商品被同时购买的趋势比;
基于所述趋势比,获取所述第一类别商品和所述第二类别商品被同时购买的所述趋势度。
在一些实施例中,所述方法还包括:
根据趋势度公式获取所述趋势度,其中,所述趋势度公式包括:
Figure DEST_PATH_IMAGE025
其中,
Figure 829745DEST_PATH_IMAGE026
为第一类别商品和第二类别商品被同时购买的趋势度,
Figure DEST_PATH_IMAGE027
为第
Figure 929769DEST_PATH_IMAGE028
个第一订单中第一类别商品的第一购买数量,
Figure DEST_PATH_IMAGE029
为第
Figure 244076DEST_PATH_IMAGE028
个第一订单中第二类别商品的第二购买数量,
Figure 206215DEST_PATH_IMAGE030
为第
Figure DEST_PATH_IMAGE031
个第一订单中第一类别商品的第一购买数量,
Figure 569064DEST_PATH_IMAGE032
为第
Figure 401890DEST_PATH_IMAGE031
个第一订单中第二类别商品的第二购买数量,
Figure DEST_PATH_IMAGE033
为以自常数为底的指数函数,
Figure 949415DEST_PATH_IMAGE031
为正整数。
在一些实施例中,所述基于所述购买概率、所述实际购买频率、所述相关度、所述非相关度和所述趋势度,获取所述第一类别商品和所述第二类别商品之间的目标相关度,包括:
根据目标相关度公式获取所述目标相关度,其中,所述目标相关度包括:
Figure DEST_PATH_IMAGE035
其中,
Figure 198519DEST_PATH_IMAGE036
为第一类别商品与第二类别商品之间的目标相关度,
Figure DEST_PATH_IMAGE037
为第一类别商品和第二类别商品被同时购买的购买概率,
Figure 427375DEST_PATH_IMAGE038
为第一类别商品和第二类别商品被同时购买的实际购买频率。
本申请具有如下有益效果:
本申请实施例中,由于是通过任意两个类别的商品被同时购买的购买概率、实际购买频率、趋势度以及该任意两个类别的商品之间的相关度和非相关度,获取该任意两个类别的商品之间的相关度,考虑了任意两个类别的商品被同时购买的相关性、不被同时购买的非相关性和被同时购买的趋势性,通过对这些因素的考虑,不同的角度对商品订单进行定性定量的分析,提高了相关度的准确性,并且,相比于现有技术,并不需要提取商品营销数据中的特征及基于特征构建特征模型,因此计算量较小,提高了评估效率,节省了评估成本。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本申请一个实施例所提供的一种基于大数据分析的电子营销数据处理方法的流程示意图。
具体实施方式
为了更进一步阐述本申请为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本申请提出的一种基于大数据分析的电子营销数据处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本申请所提供的一种基于大数据分析的电子营销数据处理方法的具体方案。
图1为本申请实施例所提供的一种基于大数据分析的电子营销数据处理方法的流程示意图。如图1所示,该方法包括以下步骤:
S101,获取电子营销数据中的历史订单,基于历史订单,获取任意两个类别的商品被同时购买的购买概率和实际购买频率,任意两个类别的商品包括第一类别商品和第二类别商品。
其中,电子营销数据为电商平台上各类商品的营销数据,通常电子营销数据的数据量较大,因此电子营销数据的处理属于大数据处理。
一些实施例中,可以通过下述公式获取任意两个类别的商品被同时购买的购买概率:
Figure 645866DEST_PATH_IMAGE040
其中,
Figure DEST_PATH_IMAGE041
表示第一类别商品,
Figure 567555DEST_PATH_IMAGE042
Figure 238708DEST_PATH_IMAGE037
为第一类别商品和第二类别商品被同时购买的购买概率,
Figure DEST_PATH_IMAGE043
为第一类别商品的订单数量,
Figure 533904DEST_PATH_IMAGE044
为第二类别商品的订单数量,
Figure DEST_PATH_IMAGE045
为订单总数量。
本申请实施例中,
Figure 341323DEST_PATH_IMAGE046
表示第一类别商品的第一购买概率,
Figure DEST_PATH_IMAGE047
表示第二类别商品的第二购买概率,可以将第一购买概率和第二购买概率的乘积作为任意两个类别的商品被同时购买的购买概率,由于该购买概率是将第一类别商品的购买事件和第二类别商品的购买事件作为独立事件计算得到的,反映了第一类别商品和第二类别商品之间无任何相关性的情况下,第一类别商品和第二类别商品被同时购买的概率。
本申请实施例中,任意两个类别的商品被同时购买的实际购买频率可以通过公式:
Figure 433913DEST_PATH_IMAGE048
,计算得到。其中,
Figure 326783DEST_PATH_IMAGE038
为任意两个类别的商品被同时购买的实际购买频率,
Figure 835124DEST_PATH_IMAGE004
为第一类别商品和第二类别商品被同时购买的订单数量。
S102,从历史订单中,确定第一类别商品和第二类别商品被同时购买的第一订单、第一类别商品被单独购买的第二订单和第二类别商品被单独购买的第三订单。
其中,历史订单包括多个订单,一些实施例中,可以选取设定时间段内的订单作为历史订单,例如可以选取过去一年、一个季度、一个月等时间段内的订单作为历史订单。应说明的是,设定时间段可以根据实际需求进行设定,此处不做任何限定。
本申请实施例中,第一类别商品和第二类别商品的购买情况包括:第一类别商品被单独购买、第二类别商品被单独购买、第一类别商品和第二类别商品被同时购买的三种购买情况。
一些实施例中,可以以第一类别商品的第一标识为索引从历史订单中查询第一类别商品被单独购买的第二订单,以及以第二类别商品的第一标识为索引从历史订单中查询第二类别商品被单独购买的第三订单,以及以第一标识和第二标识从历史订单中第一类别商品和第二类别商品被同时购买的第一订单。可选地,标识可以为商品的名称、商品的身份标识号(Identity Document,ID)等。
S103,基于第一订单、第二订单和第三订单,获取第一类别商品和第二类别商品之间的相关度以及第一类别商品和第二类别商品之间的非相关度。
可选地,获取第一类别商品在全部第一订单中的第一平均购买数量,以及第二类别商品在全部第一订单中的第二平均购买数量,基于第一购买数量、第二购买数量、第一平均购买数量和第二平均购买数量,获取第一类别商品与第二类别商品之间的相关度。
本申请实施例中,第一平均购买数量=全部第一订单中第一类别商品的总数量/第一订单的订单数量,第二平均购买数量=全部第二订单中第二类别商品的总数量/第二订单的订单数量。
一些实施例中,根据相关度公式获取相关度,其中,相关度公式包括:
Figure DEST_PATH_IMAGE049
其中,
Figure 890192DEST_PATH_IMAGE041
表示第一类别商品,
Figure 825787DEST_PATH_IMAGE050
为第一类别商品和第二类别商品之间的相关度,
Figure 471532DEST_PATH_IMAGE004
为第一订单的数量,
Figure 455669DEST_PATH_IMAGE005
表示第一订单,
Figure 503259DEST_PATH_IMAGE006
为第
Figure 609756DEST_PATH_IMAGE007
个第一订单中第一类别商品的第一购买数量,
Figure 742797DEST_PATH_IMAGE008
为第一类别商品在全部第一订单中的第一平均购买数量,
Figure 858520DEST_PATH_IMAGE009
为第
Figure 760617DEST_PATH_IMAGE007
个第一订单中第二类别商品的第二购买数量,
Figure 97402DEST_PATH_IMAGE010
为第二类别商品在全部第一订单中的第二平均购买数量,
Figure 655422DEST_PATH_IMAGE007
为正整数。
本申请实施例中,第一类别商品与第二类别商品被同时购买时的购买数量差异越小,第一类别商品与第二类别商品之间的相关性越大,反之,第一类别商品与第二类别商品被同时购买时的购买数量差异越大,第一类别商品与第二类别商品之间的相关性越小,因此,第一类别商品与第二类别商品被同时购买时的购买数量差异可以在一定程度上反映第一类别商品与第二类别商品之间的相关性,本申请实施例通过考虑第一类别商品与第二类别商品被同时购买时的购买数量差异,提高了第一类别商品与第二类别商品之间的相关性评估的准确性。
本申请实施例的相关度公式中,
Figure DEST_PATH_IMAGE051
为第
Figure 637154DEST_PATH_IMAGE007
个第一订单中第一类别商品的第一购买数量与第一平均购买数量之间的差异,
Figure 190495DEST_PATH_IMAGE052
为第
Figure 904373DEST_PATH_IMAGE007
个第一订单中第二类别商品的第二购买数量与第二平均购买数量之间的差异,
Figure DEST_PATH_IMAGE053
可以反映第一类别商品与第二类别商品被同时购买时购买数量上的差异稳定度,该差异稳定度可以在一定程度上反映第一类别商品与第二类别商品之间的相关性。第一类别商品与第二类别商品之间的相关性越强,
Figure 808744DEST_PATH_IMAGE053
的值越趋向于数值1,反之,第一类别商品与第二类别商品之间的相关性越弱,
Figure 269200DEST_PATH_IMAGE053
的值越偏离于数值1。在
Figure 552413DEST_PATH_IMAGE054
的数值较小时,差异稳定度的量化值较小,越容易导致量化结果不准确,通过分别对式
Figure 702772DEST_PATH_IMAGE054
中的分子分母进行平方处理,可以对较小的量化值进行放大处理,以保证量化的准确性,从而提高相关度计算的准确性。
进一步地,相关度公式中的
Figure DEST_PATH_IMAGE055
反映了第一类别商品和第二类别商品被同时购买时在购买数量上的差异程度,
Figure 828860DEST_PATH_IMAGE056
反映了第一类别商品和第二类别商品被同时购买时在平均购买数量上的差异程度,其中,第一类别商品与第二类别商品之间的相关性越强,
Figure DEST_PATH_IMAGE057
的值越趋近于0,第一类别商品与第二类别商品之间的相关性越弱,
Figure 683552DEST_PATH_IMAGE057
的值越偏离于0。
由此,相关度
Figure 414748DEST_PATH_IMAGE058
可以反映第一类别商品与第二类别商品之间的相关性,且准确性较高,能够为后续第一类别商品与第二类别商品之间的目标相关度的计算提供可靠依据。
可选地,获取第二订单中第一类别商品的第三购买数量、第一类别商品在全部第二订单中的第三平均购买数量、第三订单中第二类别商品的第四购买数量和第二类别商品在全部第三订单中的第四平均购买数量,并基于第三购买数量、第三平均购买数量、第四购买数量和第四平均购买数量,获取第一类别商品与第二类别商品之间的非相关度。
一些实施例中,根据非相关度公式获取非相关度,其中,非相关度公式包括:
Figure 736008DEST_PATH_IMAGE012
其中,
Figure 307583DEST_PATH_IMAGE013
为第一类别商品与第二类别商品之间的非相关度,
Figure 106911DEST_PATH_IMAGE014
表示第二订单,
Figure 364717DEST_PATH_IMAGE015
为第二订单的数量,
Figure 591299DEST_PATH_IMAGE016
为第
Figure 895242DEST_PATH_IMAGE017
个第二订单中第一类别商品的第三购买数量,
Figure 232682DEST_PATH_IMAGE018
为第一类别商品在全部第二订单中的第三平均购买数量,
Figure 469629DEST_PATH_IMAGE019
表示第三订单,
Figure 132691DEST_PATH_IMAGE020
为第三订单的数量,
Figure 658350DEST_PATH_IMAGE021
为第
Figure 802411DEST_PATH_IMAGE022
个第三订单中第二类别商品的第四购买数量,
Figure 362706DEST_PATH_IMAGE023
为第二类别商品在全部第三订单中的第四平均购买数量,
Figure 931090DEST_PATH_IMAGE017
Figure 209625DEST_PATH_IMAGE022
均为正整数。
本申请实施例中,从第一类别商品被独立购买和第二类别商品被独立购买的角度考虑第一类别商品与第二类别商品之间的非相关性,保证了非相关性评估的准确性,即保证了非相关度的准确性,为后续计算第一类别商品与第二类别商品之间的目标相关度提供了可靠依据。
S104,获取每个第一订单上第一类别商品的第一购买数量和第二类别商品的第二购买数量,并基于第一购买数量和第二购买数量,获取第一类别商品和第二类别商品被同时购买的趋势度。
本申请实施例中,第一类别商品和第二类别商品在每次被同时购买时的购买数量可能不同,可以根据第一类别商品和第二类别商品在每次被同时购买时的购买数量确定第一类别商品和第二类别商品被同时购买的趋势度。
可选地,基于第一购买数量和第二购买数量,获取第一订单上第一类别商品与第二类别商品之间的商品购买数量比例,基于商品购买数量比例,获取第一订单的下一个相邻第一订单的商品购买数量与第一订单的商品购买数量之间的比值,作为第一类别商品和第二类别商品被同时购买的趋势比,基于趋势比,获取第一类别商品和第二类别商品被同时购买的趋势度。
需要说明的是,本申请实施例中,可以预先将第一订单按照时间顺序进行排序。
其中,第一订单上第一类别商品与第二类别商品之间的商品购买数量比例反映了第一类别商品与第二类别商品被同时购买时的购买数量差异,第一订单的下一个相邻第一订单的商品购买数量与该第一订单的商品购买数量之间的比值,反映了第一类别商品与第二类别商品被同时购买时购买数量差异的趋势,即第一类别商品和第二类别商品被同时购买的趋势比反映了第一类别商品与第二类别商品被同时购买时购买数量差异的趋势,也即第一类别商品和第二类别商品被同时购买的趋势度反映了第一类别商品与第二类别商品被同时购买时的购买数量差异的趋势。
一些实施例中,根据趋势度公式获取趋势度,其中,趋势度公式包括:
Figure 826551DEST_PATH_IMAGE025
其中,
Figure 241352DEST_PATH_IMAGE026
为第一类别商品和第二类别商品被同时购买的趋势度,
Figure 980638DEST_PATH_IMAGE027
为第
Figure 215310DEST_PATH_IMAGE028
个第一订单中第一类别商品的第一购买数量,
Figure 963823DEST_PATH_IMAGE029
为第
Figure 230201DEST_PATH_IMAGE028
个第一订单中第二类别商品的第二购买数量,
Figure 405967DEST_PATH_IMAGE030
为第
Figure 190252DEST_PATH_IMAGE031
个第一订单中第一类别商品的第一购买数量,
Figure 476877DEST_PATH_IMAGE032
为第
Figure 866270DEST_PATH_IMAGE031
个第一订单中第二类别商品的第二购买数量,
Figure 212938DEST_PATH_IMAGE033
为以自常数为底的指数函数,
Figure 422202DEST_PATH_IMAGE031
为正整数。
本申请实施例中,由于第一类别商品与第二类别商品相关性越强,第一类别商品与第二类别商品每次被同时购买时的购买数量差异越小,第一类别商品和第二类别商品被同时购买的趋势度越趋近于数值1;第一类别商品与第二类别商品相关性越弱,第一类别商品与第二类别商品每次被同时购买时的购买数量差异越大,第一类别商品和第二类别商品被同时购买的趋势度越偏离于数值1,第一类别商品和第二类别商品被同时购买的趋势度可以反映第一类别商品与第二类别商品之间的相关性。
本申请实施例中,通过考虑第一类别商品和第二类别商品每次被同时购买时购买数量差异对第一类别商品和第二类别商品被同时购买的趋势进行评估,得到第一类别商品和第二类别商品被同时购买的趋势度,保证了趋势度的准确性,为后续计算第一类别商品和第二类别商品之间的目标相关度提供了可靠依据。
S105,基于购买概率、实际购买频率、相关度、非相关度和趋势度,获取第一类别商品和第二类别商品之间的目标相关度。
可选地,根据目标相关度公式获取目标相关度,其中,目标相关度包括:
Figure DEST_PATH_IMAGE059
其中,
Figure 374502DEST_PATH_IMAGE036
为第一类别商品与第二类别商品之间的目标相关度,
Figure 618402DEST_PATH_IMAGE037
为第一类别商品和第二类别商品被同时购买的购买概率,
Figure 808075DEST_PATH_IMAGE038
为第一类别商品和第二类别商品被同时购买的实际购买频率。
本申请实施例中,由于是通过第一类别商品与第二类别的商品在无任何相关性时被同时购买的购买概率以及第一类别商品和第二类别商品被同时购买的相关度、非相关度和趋势度,获取第一类别与第二类别之间的目标相关度,综合考虑了多个影响因素,提高了目标相关度的准确性,从而提高了第一类别商品与第二类别商品之间相关性评估的准确性。
S106,基于目标相关度,将第一类别商品和第二类别商品进行关联。
本申请实施例中,可以根据目标相关度,将第一类别商品和第二类别商品进行不同程度的关联。
一些实施例中,若目标相关度大于或等于相关度阈值,则可以将第一类别商品和第二类别商品进行较强程度的关联;若目标相关度小于相关度阈值,则可以将第一类别商品和第二类别商品进行较弱程度的关联。
需要说明的是,相关度阈值可以根据实际需求进行设定,此处不做任何限定,可选地,可以将相关度阈值设置为0.8。
综上所述,本申请实施例中,由于是通过任意两个类别的商品被同时购买的购买概率、实际购买频率、趋势度以及该任意两个类别的商品之间的相关度和非相关度,获取该任意两个类别的商品之间的相关度,考虑了任意两个类别的商品被同时购买的相关性、不被同时购买的非相关性和被同时购买的趋势性,通过对这些因素的考虑,不同的角度对商品订单进行定性定量的分析,提高了相关度的准确性,并且,相比于现有技术,并不需要提取商品营销数据中的特征及基于特征构建特征模型,因此计算量较小,提高了评估效率,节省了评估成本。
需要说明的是:上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (1)

1.一种基于大数据分析的电子营销数据处理方法,其特征在于,所述方法包括:
获取电子营销数据中的历史订单,基于所述历史订单,获取任意两个类别的商品被同时购买的购买概率和实际购买频率,所述任意两个类别的商品包括第一类别商品和第二类别商品;
从所述历史订单中,确定所述第一类别商品和所述第二类别商品被同时购买的第一订单、所述第一类别商品被单独购买的第二订单和所述第二类别商品被单独购买的第三订单;
基于所述第一订单、所述第二订单和所述第三订单,获取所述第一类别商品和所述第二类别商品之间的相关度以及所述第一类别商品和所述第二类别商品之间的非相关度;
获取每个所述第一订单上所述第一类别商品的第一购买数量和所述第二类别商品的第二购买数量,并基于所述第一购买数量和所述第二购买数量,获取所述第一类别商品和所述第二类别商品被同时购买的趋势度;
基于所述购买概率、所述实际购买频率、所述相关度、所述非相关度和所述趋势度,获取所述第一类别商品和所述第二类别商品之间的目标相关度;
基于所述目标相关度,将所述第一类别商品和所述第二类别商品进行关联;
所述相关度的获取过程,包括:
获取所述第一类别商品在全部所述第一订单中的第一平均购买数量,以及所述第二类别商品在全部所述第一订单中的第二平均购买数量;
基于所述第一购买数量、所述第二购买数量、所述第一平均购买数量和所述第二平均购买数量,获取所述第一类别商品与所述第二类别商品之间的所述相关度;
所述基于所述第一购买数量、所述第二购买数量、所述第一平均购买数量和所述第二平均购买数量,获取所述第一类别商品与所述第二类别商品之间的所述相关度,包括:
根据相关度公式获取所述相关度,其中,所述相关度公式包括:
Figure DEST_PATH_IMAGE001
其中,
Figure 252047DEST_PATH_IMAGE002
为第一类别商品和第二类别商品之间的相关度,
Figure 516806DEST_PATH_IMAGE003
为第一订单的数量,
Figure 879785DEST_PATH_IMAGE004
表示第一订单,
Figure 728530DEST_PATH_IMAGE005
为第
Figure 959791DEST_PATH_IMAGE006
个第一订单中第一类别商品的第一购买数量,
Figure 79057DEST_PATH_IMAGE007
为第一类别商品在全部第一订单中的第一平均购买数量,
Figure 737572DEST_PATH_IMAGE008
为第
Figure 214558DEST_PATH_IMAGE006
个第一订单中第二类别商品的第二购买数量,
Figure 983931DEST_PATH_IMAGE009
为第二类别商品在全部第一订单中的第二平均购买数量,
Figure 223283DEST_PATH_IMAGE006
为正整数;
所述非相关度的获取过程,包括:
获取所述第二订单中所述第一类别商品的第三购买数量、所述第一类别商品在全部所述第二订单中的第三平均购买数量、所述第三订单中所述第二类别商品的第四购买数量和所述第二类别商品在全部所述第三订单中的第四平均购买数量;
基于所述第三购买数量、所述第三平均购买数量、所述第四购买数量和所述第四平均购买数量,获取所述第一类别商品与所述第二类别商品之间的所述非相关度;
所述基于所述第三购买数量、所述第三平均购买数量、所述第四购买数量和所述第四平均购买数量,获取所述第一类别商品与所述第二类别商品之间的所述非相关度,包括:
根据非相关度公式获取所述非相关度,其中,所述非相关度公式包括:
Figure 20075DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE011
为第一类别商品与第二类别商品之间的非相关度,
Figure 548139DEST_PATH_IMAGE012
表示第二订单,
Figure 121203DEST_PATH_IMAGE013
为第二订单的数量,
Figure 588962DEST_PATH_IMAGE014
为第
Figure 323700DEST_PATH_IMAGE015
个第二订单中第一类别商品的第三购买数量,
Figure 135799DEST_PATH_IMAGE016
为第一类别商品在全部第二订单中的第三平均购买数量,
Figure 11088DEST_PATH_IMAGE017
表示第三订单,
Figure 225032DEST_PATH_IMAGE018
为第三订单的数量,
Figure 865092DEST_PATH_IMAGE019
为第
Figure 898907DEST_PATH_IMAGE020
个第三订单中第二类别商品的第四购买数量,
Figure 312309DEST_PATH_IMAGE021
为第二类别商品在全部第三订单中的第四平均购买数量,
Figure 256125DEST_PATH_IMAGE015
Figure 332665DEST_PATH_IMAGE020
均为正整数;
所述趋势度的获取过程,包括:
基于所述第一购买数量和所述第二购买数量,获取所述第一订单上所述第一类别商品与所述第二类别商品之间的商品购买数量比例;
基于所述商品购买数量比例,获取所述第一订单的下一个相邻第一订单的商品购买数量与所述第一订单的商品购买数量之间的比值,作为所述第一类别商品和所述第二类别商品被同时购买的趋势比;
基于所述趋势比,获取所述第一类别商品和所述第二类别商品被同时购买的所述趋势度;
所述趋势度的获取过程,包括:
根据趋势度公式获取所述趋势度,其中,所述趋势度公式包括:
Figure 712831DEST_PATH_IMAGE022
其中,
Figure 563148DEST_PATH_IMAGE023
为第一类别商品和第二类别商品被同时购买的趋势度,
Figure 751684DEST_PATH_IMAGE024
为第
Figure 999126DEST_PATH_IMAGE025
个第一订单中第一类别商品的第一购买数量,
Figure 771647DEST_PATH_IMAGE026
为第
Figure 28316DEST_PATH_IMAGE025
个第一订单中第二类别商品的第二购买数量,
Figure 805779DEST_PATH_IMAGE027
为第
Figure 224122DEST_PATH_IMAGE028
个第一订单中第一类别商品的第一购买数量,
Figure 93727DEST_PATH_IMAGE029
为第
Figure 154087DEST_PATH_IMAGE028
个第一订单中第二类别商品的第二购买数量,
Figure 786057DEST_PATH_IMAGE030
为以自常数为底的指数函数,
Figure 139415DEST_PATH_IMAGE028
为正整数;
所述基于所述购买概率、所述实际购买频率、所述相关度、所述非相关度和所述趋势度,获取所述第一类别商品和所述第二类别商品之间的目标相关度,包括:
根据目标相关度公式获取所述目标相关度,其中,所述目标相关度包括:
Figure 387994DEST_PATH_IMAGE031
其中,
Figure 720886DEST_PATH_IMAGE032
为第一类别商品与第二类别商品之间的目标相关度,
Figure 846843DEST_PATH_IMAGE033
为第一类别商品和第二类别商品被同时购买的购买概率,
Figure 872568DEST_PATH_IMAGE034
为第一类别商品和第二类别商品被同时购买的实际购买频率。
CN202211417283.0A 2022-11-14 2022-11-14 基于大数据分析的电子营销数据处理方法 Active CN115471302B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211417283.0A CN115471302B (zh) 2022-11-14 2022-11-14 基于大数据分析的电子营销数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211417283.0A CN115471302B (zh) 2022-11-14 2022-11-14 基于大数据分析的电子营销数据处理方法

Publications (2)

Publication Number Publication Date
CN115471302A CN115471302A (zh) 2022-12-13
CN115471302B true CN115471302B (zh) 2023-02-14

Family

ID=84338192

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211417283.0A Active CN115471302B (zh) 2022-11-14 2022-11-14 基于大数据分析的电子营销数据处理方法

Country Status (1)

Country Link
CN (1) CN115471302B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206752A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 电子商务网站相关商品推荐系统及其方法
CN102663594A (zh) * 2012-03-31 2012-09-12 浙江工商大学 电子商务目录分销系统
CN104899241A (zh) * 2014-03-07 2015-09-09 歌乐株式会社 关联数据生成装置和关联数据生成方法
CN110555712A (zh) * 2018-05-31 2019-12-10 北京京东尚科信息技术有限公司 商品关联程度确定方法及装置
CN110570233A (zh) * 2019-08-16 2019-12-13 苏宁云计算有限公司 用于电商平台的用户回购时间预测方法及装置
CN112381621A (zh) * 2020-12-02 2021-02-19 好活(昆山)网络科技有限公司 一种大数据协同监管平台及方法
WO2021065289A1 (ja) * 2019-10-03 2021-04-08 パナソニックIpマネジメント株式会社 店舗支援システム、店舗支援方法及びプログラム
CN114565334A (zh) * 2022-02-22 2022-05-31 国连科技(浙江)有限公司 基于大数据的商品关联仓储方法及装置
CN115080865A (zh) * 2022-08-19 2022-09-20 山东智豆数字科技有限公司 基于多维数据分析的电商数据运营管理系统
CN115170253A (zh) * 2022-09-07 2022-10-11 国连科技(浙江)有限公司 一种促销活动中商品信息推送方法及装置
CN115204450A (zh) * 2022-05-26 2022-10-18 京东城市(北京)数字科技有限公司 购买行为预测方法、装置、电子设备和存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050154629A1 (en) * 2002-07-10 2005-07-14 Fujitsu Limited Product purchasing trend analyzing system
CN106372961A (zh) * 2016-08-23 2017-02-01 北京小米移动软件有限公司 商品推荐方法及装置
CN113761380A (zh) * 2021-09-21 2021-12-07 武汉兰宇博信息科技有限公司 一种基于区块链大数据的各个电商平台商品信息共享方法和系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101206752A (zh) * 2007-12-25 2008-06-25 北京科文书业信息技术有限公司 电子商务网站相关商品推荐系统及其方法
CN102663594A (zh) * 2012-03-31 2012-09-12 浙江工商大学 电子商务目录分销系统
CN104899241A (zh) * 2014-03-07 2015-09-09 歌乐株式会社 关联数据生成装置和关联数据生成方法
CN110555712A (zh) * 2018-05-31 2019-12-10 北京京东尚科信息技术有限公司 商品关联程度确定方法及装置
CN110570233A (zh) * 2019-08-16 2019-12-13 苏宁云计算有限公司 用于电商平台的用户回购时间预测方法及装置
WO2021065289A1 (ja) * 2019-10-03 2021-04-08 パナソニックIpマネジメント株式会社 店舗支援システム、店舗支援方法及びプログラム
CN112381621A (zh) * 2020-12-02 2021-02-19 好活(昆山)网络科技有限公司 一种大数据协同监管平台及方法
CN114565334A (zh) * 2022-02-22 2022-05-31 国连科技(浙江)有限公司 基于大数据的商品关联仓储方法及装置
CN115204450A (zh) * 2022-05-26 2022-10-18 京东城市(北京)数字科技有限公司 购买行为预测方法、装置、电子设备和存储介质
CN115080865A (zh) * 2022-08-19 2022-09-20 山东智豆数字科技有限公司 基于多维数据分析的电商数据运营管理系统
CN115170253A (zh) * 2022-09-07 2022-10-11 国连科技(浙江)有限公司 一种促销活动中商品信息推送方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Parallelizing OPTICS for Commodity Clusters;Poonam Goyal;《ICDCN "15: Proceedings of the 2015 International Conference on Distributed Computing and Networking》;20150104;全文 *
基于协同推荐算法的智慧社区服务系统的设计与实现;赖丽萍等;《黄冈职业技术学院学报》;20200828(第04期);全文 *
超市商品关联规则分析;周冠茜;《全国流通经济》;20200208(第04期);全文 *

Also Published As

Publication number Publication date
CN115471302A (zh) 2022-12-13

Similar Documents

Publication Publication Date Title
CN110874778B (zh) 异常订单检测方法及装置
Sanders et al. New evidence on the impact of index funds in US grain futures markets
US8170998B2 (en) Methods, systems, and computer program products for estimating accuracy of linking of customer relationships
WO2010129571A2 (en) Demographic analysis using time-based consumer transaction histories
CN108921398B (zh) 店铺质量评价方法及装置
CN108764705A (zh) 一种数据质量评估平台以及方法
US8560506B2 (en) Automatic selection of blocking column for de-duplication
CN110019798B (zh) 一种用于对进销项商品种类差异进行度量的方法及系统
CN105303447A (zh) 利用网络信息进行信用评级的方法和系统
CN112700268A (zh) 一种基于商品编码相似度比较的下游企业推荐方法及系统
CN115471302B (zh) 基于大数据分析的电子营销数据处理方法
CN103309885A (zh) 一种在电子交易平台中识别特征用户的方法及装置和搜索方法及装置
CN110599281A (zh) 一种确定目标店铺的方法和装置
CN109558462A (zh) 数据统计方法及装置
CN116611796A (zh) 一种店铺交易数据的异常检测方法及装置
US20180005120A1 (en) Data mining interest generator
KR101409273B1 (ko) 사용자의 구매 영향력 지수를 산출하는 방법 및 장치
CN114219547B (zh) 一种门店订货量的确定方法、装置、设备及存储介质
JP6085802B2 (ja) ユーザ購入挙動に基づいて不良商品を識別するための方法及びシステム
CN116451128A (zh) 虚假交易对象的检测方法、装置及服务器
CN113298291A (zh) 快递件量预测方法、装置、设备及存储介质
CN109242354B (zh) 加工效果评价方法和加工效果评价装置
CN112819404A (zh) 数据处理方法、装置、电子设备和存储介质
CN115187387B (zh) 一种风险商家的识别方法及设备
CN111199414A (zh) 一种数据分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Electronic marketing data processing method based on big data analysis

Effective date of registration: 20230816

Granted publication date: 20230214

Pledgee: Rizhao Bank Co.,Ltd. Qingdao Branch

Pledgor: Shandong Zhidou Digital Technology Co.,Ltd.

Registration number: Y2023370010086

PE01 Entry into force of the registration of the contract for pledge of patent right