CN115204978A - 一种多平台数据处理方法、装置、电子设备及存储介质 - Google Patents
一种多平台数据处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115204978A CN115204978A CN202210834267.5A CN202210834267A CN115204978A CN 115204978 A CN115204978 A CN 115204978A CN 202210834267 A CN202210834267 A CN 202210834267A CN 115204978 A CN115204978 A CN 115204978A
- Authority
- CN
- China
- Prior art keywords
- order
- order data
- data
- identification
- consignee
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Databases & Information Systems (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Finance (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Accounting & Taxation (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种多平台数据处理方法、装置、电子设备及存储介质,该方法包括:从不同平台获取多个订单数据;获取每个第一订单数据组对应的多个收货人标识;针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,选取数值最大的识别权重对应的收货人标识作为目标收货人标识;将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理获取多个规范化订单数据;按照统一的分析标准对多个规范化订单数据进行分析获取目标商家的运营指标。通过采用上述多平台数据处理方法、装置、电子设备及存储介质,解决了不同电商平台交易数据的分析结果无法直接对比以及在交易量较大时人工汇总速度慢的问题。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种多平台数据处理方法、装置、电子设备及存储介质。
背景技术
目前,电商交易平台众多,例如:淘宝,京东,有赞,微盟等,同一商家通常会在多个电商平台中进行商品售卖,并使用不同电商平台自带的数据分析功能对各自平台的交易数据进行汇总分析,为商家的后续运营提供解决方案。商家会根据不同平台的汇总数据,对消费者群体及各平台营收情况进行特定分析,例如:购买人群年龄,性别,日期,消费能力,购买商品分布,营收金额等。对消费者群体进行分析,可以帮助商家统计出不同商品在不同平台中的消费群体,购买能力及购买时间区间等。目前,通常是商家通过人工整合、分析的方式对不同平台的交易数据进行单独分析后再进行汇总统计,得到不同电商平台交易运营指标数据。
然而,采用上述人工方式汇总多个电商平台交易数据时,不同电商平台的交易数据的分析标准各不相同,无法直接将不同电商平台交易数据的分析结果进行对比,同时,在交易量较大时会导致人工汇总速度慢的问题。
发明内容
有鉴于此,本申请的目的在于提供一种多平台数据处理方法、装置、电子设备及存储介质,以解决不同电商平台交易数据的分析结果无法直接对比以及在交易量较大时人工汇总速度慢的问题。
第一方面,本申请实施例提供了一种多平台数据处理方法,包括:
从不同平台获取目标商家对应的多个订单数据,多个订单数据包括不存在下单人标识的多个第一订单数据以及存在下单人标识的多个第二订单数据;
将多个第一订单数据按照购买标识划分为多个第一订单数据组,获取每个第一订单数据组对应的多个收货人标识;
针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,选取数值最大的识别权重对应的收货人标识作为该第一订单数据组的目标收货人标识;
将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理,获取多个规范化订单数据;
按照统一的分析标准对不同频台的多个规范化订单数据进行分析,获取目标商家在不同平台下的运营指标。
可选地,针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,包括:针对每个收货人标识,确定该收货人标识在第一订单数据组中对应的目标订单数量;将目标订单数量与第一订单数据组中订单总数量的比值确定为该收货人标识的识别权重。
可选地,在从不同平台获取目标商家对应的多个订单数据之后,还包括:针对每个订单数据,确定该订单数据是否存在下单人标识;若不存在下单人标识,则将该订单数据确定为第一订单数据;若存在下单人标识,则将该订单数据确定为第二订单数据。
可选地,将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理,获取多个规范化订单数据,包括:将目标收货人标识作为第一订单数据的数据标识,将下单人标识作为第二订单数据的数据标识;按照预设字段标识与不同平台的字段标识的对应关系从多个订单数据中提取预设字段标识对应的目标数据;将数据标识作为索引字段的取值,并将目标数据配置到预设字段标识对应的字段中,获取多个统一化订单数据;针对每个统一化订单数据,对该统一化订单数据进行数据清洗,获取多个规范化订单数据。
可选地,针对每个统一化订单数据,对该统一化订单数据进行数据清洗,包括:确定该统一化订单数据对应的订单是否为异常订单;若是异常订单,则将该统一化订单数据从多个统一化订单数据中去除。
可选地,异常订单包括虚拟订单;确定该统一化订单数据对应的订单是否为异常订单,包括:针对每个统一化订单数据,确定该统一化订单数据对应的订单标识与对应平台提供的订单标识生成规则是否匹配,或者,数据标识与标识格式规则是否匹配;若该统一化订单数据对应的订单标识与对应平台提供的订单标识生成规则不匹配,或者,数据标识与标识格式规则不匹配,则将该统一化订单数据对应的订单确定为虚拟订单。
可选地,获取每个第一订单数据组对应的多个收货人标识,包括:针对每个第一订单数据组,确定该第一订单数据组中每个第一订单数据对应的收货人标识;将多个第一订单数据对应的收货人标识作为该第一订单数据组对应的多个收货人标识。
第二方面,本申请实施例还提供了一种多平台数据处理装置,所述装置包括:
订单数据获取模块,用于从不同平台获取目标商家对应的多个订单数据,多个订单数据包括不存在下单人标识的多个第一订单数据以及存在下单人标识的多个第二订单数据;
标识获取模块,用于将多个第一订单数据按照购买标识划分为多个第一订单数据组,获取每个第一订单数据组对应的多个收货人标识;
权重确定模块,用于针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,选取数值最大的识别权重对应的收货人标识作为该第一订单数据组的目标收货人标识;
数据规范模块,用于将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理,获取多个规范化订单数据;
指标确定模块,用于按照统一的分析标准对不同平台的多个规范化订单数据进行分析,获取目标商家在不同平台下的运营指标。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的多平台数据处理方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的多平台数据处理方法的步骤。
本申请实施例带来了以下有益效果:
本申请实施例提供的一种多平台数据处理方法、装置、电子设备及存储介质,能够获取不存在下单人标识的每个第一订单数据组对应的目标收货人标识,并将目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理获得规划化订单数据,使得无论订单数据中是否存在下单人标识都能获得规划化订单数据,然后按照统一的分析标准对不同平台的规范化订单数据进行分析,得到标准统一的不同平台的运行指标,以便于商家对比分析,与现有技术中的多平台数据处理方法相比,解决了不同电商平台交易数据的分析结果无法直接对比以及在交易量较大时人工汇总速度慢的问题。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的多平台数据处理方法的流程图;
图2示出了本申请实施例所提供的多平台数据处理装置的结构示意图;
图3示出了本申请实施例所提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
值得注意的是,在本申请提出之前,目前,电商交易平台众多,例如:淘宝,京东,有赞,微盟等,同一商家通常会在多个电商平台中进行商品售卖,并使用不同电商平台自带的数据分析功能对各自平台的交易数据进行汇总分析,为商家的后续运营提供解决方案。商家会根据不同平台的汇总数据,对消费者群体及各平台营收情况进行特定分析,例如:购买人群年龄,性别,日期,消费能力,购买商品分布,营收金额等。对消费者群体进行分析,可以帮助商家统计出不同商品在不同平台中的消费群体,购买能力及购买时间区间等。目前,通常是商家通过人工整合、分析的方式对不同平台的交易数据进行单独分析后再进行汇总统计,得到不同电商平台交易运营指标数据。然而,采用上述人工方式汇总多个电商平台交易数据时,不同电商平台的交易数据的分析标准各不相同,无法直接将不同电商平台交易数据的分析结果进行对比,同时,在交易量较大时会导致人工汇总速度慢的问题。
基于此,本申请实施例提供了一种多平台数据处理方法,以提高不同电商平台交易数据的汇总速度。
请参阅图1,图1为本申请实施例所提供的一种多平台数据处理方法的流程图。如图1所示,本申请实施例提供的多平台数据处理方法,包括:
步骤S101,从不同平台获取目标商家对应的多个订单数据。
该步骤中,不同平台可指不同的电商平台,目标商家的商品在这些电商平台中出售,例如,不同平台可以是淘宝,京东,有赞,微盟等。
目标商家可指将商品在多个电商平台出售的商家,目标商家有对出售商品的交易数据进行分析的需求。
作为示例,目标商家可以是个人,也可以是公司。
多个订单数据可指目标商家出售的商品在不同电商平台上的交易数据,多个订单数据用于分析商品在不同电商平台上的交易情况。
订单数据可指单个订单的数据,每个订单数据对应一个订单,每个订单数据包括多个字段及字段的取值,字段包括子字段。
示例性的,每个订单数据的字段包括但不限于:订单号、订单支付金额、订单支付时间、订单状态、会员标识、下单人信息、收货人信息、购买物品。
以字段是“下单人信息”为例,该字段包括多个子字段,例如:下单人标识、下单人姓名、下单人性别、下单人住址等。
需要说明的是,每个订单数据中的各个字段的字段标识(字段名称)在不同电商平台中可能是不同,例如:“购买物品”字段,从淘宝平台获取的订单数据中可能称为“商品列表”,从京东平台获取的订单数据中可能称为“购买的商品”。
多个订单数据包括不存在下单人标识的多个第一订单数据以及存在下单人标识的多个第二订单数据。
第一订单数据可指多个订单数据中不存在下单人标识的订单数据。
第二订单数据可指多个订单数据中存在下单人标识的订单数据。
在本申请实施例中,在从不同平台获取多个订单数据之前,先要进行电商平台的授权对接。通过对接不同电商平台的开放平台信息,实现不同电商平台下的授权逻辑,例如:淘宝,京东,有赞,微盟等普遍遵从auth2.0授权协议,然后,将java作为主要编程语言,编写与不同电商平台的对接接口,以从不同电商平台获取目标商家的订单数据。
在一可选实施例中,在从不同平台获取目标商家对应的多个订单数据之后,还包括:针对每个订单数据,确定该订单数据是否存在下单人标识;若不存在下单人标识,则将该订单数据确定为第一订单数据;若存在下单人标识,则将该订单数据确定为第二订单数据。
这里,下单人可指购买目标商家出售的商品的用户,下单人标识可指下单人的唯一标识。
示例性的,下单人标识可指下单人的手机号。
具体的,不是每个订单数据都有下单人标识的,需要对多个订单数据进行划分,以区分该订单是否存在下单人标识。首先,获取每个订单数据中下单人标识子订单数据项中的数据,确定该订单数据是否存在对应的下单人标识,如果不存在下单人标识,则将该订单数据作为第一订单数据;如果存在下单人标识,则将该订单数据作为第二订单数据。
步骤S102,将多个第一订单数据按照购买标识划分为多个第一订单数据组,获取每个第一订单数据组对应的多个收货人标识。
该步骤中,购买标识可指购买该商品的用户标识,示例性的,购买标识是指该订单数据所对应的订单上的用户账号,即,在电商平台上的用户账号。
收货人标识可指单个订单数据对应的订单上的收货人的标识,示例性的,收货人标识可指收货人手机号。
第一订单数据组可指由具有相同购买标识的多个第一订单数据组成的数据组,第一订单数据组用于表征每个电商平台上同一账号对应的多个第一订单数据。
在本申请实施例中,由于第一订单数据中不存在下单人标识,所以需要根据第一订单数据中的其他数据确定第一订单数据的数据标识。首先,按照第一订单数据中的用户账号,确定同一用户账号对应的多个第一订单数据,并将这些第一订单数据作为单独的第一订单数据组,并确定该第一订单数据组对应的多个收货人标识,以根据多个收货人标识确定该第一订单数据组中每个第一订单数据的数据标识。
在一可选实施例中,获取每个第一订单数据组对应的多个收货人标识,包括:针对每个第一订单数据组,确定该第一订单数据组中每个第一订单数据对应的收货人标识;将多个第一订单数据对应的收货人标识作为该第一订单数据组对应的多个收货人标识。
这里,第一订单数据组中包括多个第一订单数据,从每个第一订单数据中获取该第一订单数据的收货人标识,将获取的多个收货人标识作为第一订单数据组的多个收货人标识,根据该多个收货人标识确定该第一订单数据组的目标收货人标识。
步骤S103,针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,选取数值最大的识别权重对应的收货人标识作为该第一订单数据组的目标收货人标识。
该步骤中,识别权重可指多个收货人标识的权重,识别权重用于从多个收货人标识中确定该第一订单数据组的目标收货人标识。
目标收货人标识可指第一订单数据组对应的收货人标识,目标收货人标识是从第一订单数据组对应的多个收货人标识中选取的标识。
在一可选实施例中,针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,包括:针对每个收货人标识,确定该收货人标识在第一订单数据组中对应的目标订单数量;将目标订单数量与第一订单数据组中订单总数量的比值确定为该收货人标识的识别权重。
这里,识别权重是根据收货人标识对应的订单数据确定的,假设,在淘宝平台上,账号Z共有100个订单,这100个订单中有25个订单的收货人标识是A,50个订单的收货人标识为B,25个订单的收货人标识为C,则收货人标识A的识别权重为25/100=0.25,收货人标识B的识别权重为50/100=0.5、收货人标识C的识别权重为25/100=0.25,由于收货人标识B的识别权重最高,则选取收货人标识B作为该第一订单数据组的目标收货人标识。
需要说明的是,在确定每个第一订单数据组的目标收货人标识之前,先将不同电商平台的多个第一订单数据组对应的多个收货人标识进行比较,确定不同电商平台的多个第一订单数据组之间各自的多个收货人标识是否相同,如果相同则确定这些第一订单数据组为关联第一订单数据组,当不同电商平台的关联第一订单数据组之间的目标收货人标识不同时,目标商家可手动选取关联第一订单数据组中各第一订单数据组的目标收货人标识。
例如:A平台的第一订单数据组a的多个收货人标识分别为c、d和e,B平台的第一订单数据组的多个收货人标识也为c、d和e,即,第一订单数据组a与第一订单数据组b具有相同的多个收货人标识,则第一订单数据组a与第一订单数据组b虽然为不同的电商平台,但两者属于关联第一订单数据组。
假设,经过计算后,第一订单数据组a确定的目标收货人标识为c,第一订单数据组b确定的目标收获人标识为d,说明关联第一订单数据组之间存在数据打通冲突,需要目标商家为第一订单数据组a、第一订单数据组b手动分配目标收获人标识,即,从目标收货人标识c和目标收货人标识d中手动选择关联第一订单数据组中第一订单数据组a以及第一订单数据组b各自的目标收获人标识。
步骤S104,将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理,获取多个规范化订单数据。
该步骤中,数据标识可指数据索引,数据标识用于为同一下单人在不同电商平台下的订单生成统一的标识。
规范化订单数据可指格式统一且无异常的数据,由于从不同平台获得的订单数据是字段名称以及索引不一致,还可能存在异常数据,所以需要对不同平台的订单数据进行统一处理,以获取格式统一且无异常的数据。
具体的,为了便于对不同电商平台的订单数据进行分析,需要整理出同一下单人在不同电商平台上的购买行为,同一下单人在不同电商平台上的账号可能是不同的,但是手机号是相同的,因此,可将手机号作为订单数据的数据标识,即,将下单人手机号作为订单数据的索引,然后将订单数据按照统一的字段名称进行存储,以便于分析时准确地获取相应的数据。
由于第一订单数据中不存在下单人标识,可以将第一订单数据中的目标收货人标识作为第一订单数据的数据标识,将第二订单数据中的下单人标识作为第二订单数据的数据标识,根据数据标识对多个订单数据进行整理,获取规范化订单数据。
在一可选实施例中,将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理,获取多个规范化订单数据,包括:将目标收货人标识作为第一订单数据的数据标识,将下单人标识作为第二订单数据的数据标识;按照预设字段标识与不同平台的字段标识的对应关系从多个订单数据中提取预设字段标识对应的目标数据;将数据标识作为索引字段的取值,并将目标数据配置到预设字段标识对应的字段中,获取多个统一化订单数据;针对每个统一化订单数据,对该统一化订单数据进行数据清洗,获取多个规范化订单数据。
这里,多个订单数据分为第一订单数据以及第二订单数据。第一订单数据被分为多个第一订单数据组,而每个第一订单数据组具有对应的目标收货人标识,可将目标收货人标识作为该第一订单数组中所有第一订单数据的数据标识;直接将下单人标识作为第二订单数据的数据标识。
由于不同平台的字段标识不同,需要对字段标识进行统一,即对字段名称进行统一,例如:将不同平台的“购买物品”字段以及“商品列表”字段统一为“购买商品”字段。将所有字段标识进行统一后,从不同平台的订单数据中确定各字段的取值,并将取值存储在对应的字段中,获取统一化订单书。最后,对统一化订单数据进行数据清洗,将异常数据过滤掉获取规范化订单数据。
在一可选实施例中,针对每个统一化订单数据,对该统一化订单数据进行数据清洗,包括:确定该统一化订单数据对应的订单是否为异常订单;若是异常订单,则将该统一化订单数据从多个统一化订单数据中去除。
这里,异常订单可指数据异常的订单,异常订单包括但不限于:无效订单、虚拟订单以及错误订单。
无效订单可指订单数据中缺少必要信息的订单,例如:缺少订单号的订单。
错误订单可指订单数据违反日常数值的订单,例如:订单金额不是以数字的形式表示,而是以字母表示的订单,该订单可能因为遭受到DOS攻击而造成的数值错误。
具体的,确定统一化订单数据中的订单数据是否被清洗,取决于该订单数据对应的订单是否为异常订单,针对每个订单数据,依次确定该订单数据对应的订单是否为无效订单、虚拟订单以及错误订单,如果该订单属于上述中的任意一种订单,则确定该订单对应的订单数据为需要清洗的数据,并从统一化订单数据中清洗掉。
在一可选实施例中,异常订单包括虚拟订单;确定该统一化订单数据对应的订单是否为异常订单,包括:针对每个统一化订单数据,确定该统一化订单数据对应的订单标识与对应平台提供的订单标识生成规则是否匹配,或者,数据标识与标识格式规则是否匹配;若该统一化订单数据对应的订单标识与对应平台提供的订单标识生成规则不匹配,或者,数据标识与标识格式规则不匹配,则将该统一化订单数据对应的订单确定为虚拟订单。
这里,虚拟订单可指非真实的订单,虚拟订单可以是通过应用程序生成的虚拟化的订单,不是根据购买者的实际购买行为生成的订单,例如:刷单时应用程序自动生成的订单。
订单标识可指订单的唯一标识,示例性的,订单标识可以是订单号。
订单标识生成规则可指订单标识的生成规则,示例性的,订单标识生成规则是指订单号生成规则。
数据标识可指目标收货人标识以及下单人标识,示例性的,数据标识可指收货人手机号或者下单人手机号。
具体的,不同的电商平台的订单号生成规则可能是不同的,先从各个电商平台获取其对应的订单号生成规则,然后根据订单号生成规则判断每个订单数据的订单号是否符合对应的订单号生成规则,如果不符合说明该订单号异常,订单号对应的订单为虚拟订单。其中,订单号通常是根据下单日期、商家ID以及购买用户ID按照指定规则组合起来生成的,可以根据日期、商家ID以及购买用户ID的数值特性、组合方式来确定订单号生成规则。
其次,还可通过判断数据标识是否符合标识格式规则,来判断订单是否为虚拟订单,即,通过判断手机号是否符合手机号格式规则来判断。其中,可以通过手机号的长度以及手机号前三位的形式来判断数据标识是否异常,如果数据标识的数字位数不等于11,或者,手机号的前三位不属于固定的几种形式之一,则表示该数据标识为异常标识,数据标识对应的订单为虚拟订单。
只要订单标识与对应的订单标识生成规则不匹配,或者,数据标识与标识格式规则不匹配,则确定该订单为虚拟订单。
步骤S105,按照统一的分析标准对不同平台的多个规范化订单数据进行分析,获取目标商家在不同平台下的运营指标。
该步骤中,获取规范化订单数据后,需要对这些数据进行分析,以确定目标商家在不同平台下的运营指标。
在本申请实施例中,在对规范化订单数据进行分析前,先将规范化订单数据进行离线处理,并保存在数据库中,然后,根据不同平台的数据进行分别统计,确定不同平台下的运营指标,例如:运营指标为不同平台的订单数量、交易金额等,并采用Vue-3,Element-ui,echarts构建前端页面,将分析结果以图表的形式进行展示。
目标商家可以根据得到的图表,快速分析出各时间段售卖率最高的平台,销售量最高的平台,各平台的销售价格分布,各平台的用户购买时间分布等一系列运营数据,从而有针对性的在不同平台开展优惠活动。
与现有技术中多平台数据处理方法相比,本申请能够获取不存在下单人标识的每个第一订单数据组对应的目标收货人标识,并将目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理获得规划化订单数据,使得无论订单数据中是否存在下单人标识都能获得规划化订单数据,然后按照统一的分析标准对不同平台的规范化订单数据进行分析,得到标准统一的不同平台的运行指标,以便于商家对比分析,解决了不同电商平台交易数据的分析结果无法直接对比以及在交易量较大时人工汇总速度慢的问题。
基于同一发明构思,本申请实施例中还提供了与多平台数据处理方法对应的多平台数据处理装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述多平台数据处理方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图2,图2为本申请实施例所提供的一种多平台数据处理装置的结构示意图。如图2中所示,所述多平台数据处理装置200包括:
订单数据获取模块201,用于从不同平台获取目标商家对应的多个订单数据,多个订单数据包括不存在下单人标识的多个第一订单数据以及存在下单人标识的多个第二订单数据;
标识获取模块202,用于将多个第一订单数据按照购买标识划分为多个第一订单数据组,获取每个第一订单数据组对应的多个收货人标识;
权重确定模块203,用于针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,选取数值最大的识别权重对应的收货人标识作为该第一订单数据组的目标收货人标识;
数据规范模块204,用于将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理,获取多个规范化订单数据;
指标确定模块205,用于按照统一的分析标准对不同平台的多个规范化订单数据进行分析,获取目标商家在不同平台下的运营指标。
请参阅图3,图3为本申请实施例所提供的一种电子设备的结构示意图。如图3中所示,所述电子设备300包括处理器310、存储器320和总线330。
所述存储器320存储有所述处理器310可执行的机器可读指令,当电子设备300运行时,所述处理器310与所述存储器320之间通过总线330通信,所述机器可读指令被所述处理器310执行时,可以执行如上述图1所示方法实施例中的多平台数据处理方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的多平台数据处理方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种多平台数据处理方法,其特征在于,包括:
从不同平台获取目标商家对应的多个订单数据,所述多个订单数据包括不存在下单人标识的多个第一订单数据以及存在下单人标识的多个第二订单数据;
将所述多个第一订单数据按照购买标识划分为多个第一订单数据组,获取每个第一订单数据组对应的多个收货人标识;
针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,选取数值最大的识别权重对应的收货人标识作为该第一订单数据组的目标收货人标识;
将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理,获取多个规范化订单数据;
按照统一的分析标准对不同平台的多个规范化订单数据进行分析,获取所述目标商家在不同平台下的运营指标。
2.根据权利要求1所述的方法,其特征在于,所述针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,包括:
针对每个收货人标识,确定该收货人标识在第一订单数据组中对应的目标订单数量;
将所述目标订单数量与第一订单数据组中订单总数量的比值确定为该收货人标识的识别权重。
3.根据权利要求1所述的方法,其特征在于,在从不同平台获取目标商家对应的多个订单数据之后,还包括:
针对每个订单数据,确定该订单数据是否存在下单人标识;
若不存在下单人标识,则将该订单数据确定为第一订单数据;
若存在下单人标识,则将该订单数据确定为第二订单数据。
4.根据权利要求1所述的方法,其特征在于,所述将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理,获取多个规范化订单数据,包括:
将目标收货人标识作为第一订单数据的数据标识,将下单人标识作为第二订单数据的数据标识;
按照预设字段标识与不同平台的字段标识的对应关系从多个订单数据中提取预设字段标识对应的目标数据;
将所述数据标识作为索引字段的取值,并将所述目标数据配置到预设字段标识对应的字段中,获取多个统一化订单数据;
针对每个统一化订单数据,对该统一化订单数据进行数据清洗,获取多个规范化订单数据。
5.根据权利要求4所述的方法,其特征在于,所述针对每个统一化订单数据,对该统一化订单数据进行数据清洗,包括:
确定该统一化订单数据对应的订单是否为异常订单;
若是异常订单,则将该统一化订单数据从多个统一化订单数据中去除。
6.根据权利要求5所述的方法,其特征在于,所述异常订单包括虚拟订单;
所述确定该统一化订单数据对应的订单是否为异常订单,包括:
针对每个统一化订单数据,确定该统一化订单数据对应的订单标识与对应平台提供的订单标识生成规则是否匹配,或者,数据标识与标识格式规则是否匹配;
若该统一化订单数据对应的订单标识与对应平台提供的订单标识生成规则不匹配,或者,数据标识与标识格式规则不匹配,则将该统一化订单数据对应的订单确定为虚拟订单。
7.根据权利要求1所述的方法,其特征在于,所述获取每个第一订单数据组对应的多个收货人标识,包括:
针对每个第一订单数据组,确定该第一订单数据组中每个第一订单数据对应的收货人标识;
将多个第一订单数据对应的收货人标识作为该第一订单数据组对应的多个收货人标识。
8.一种多平台数据处理装置,其特征在于,包括:
订单数据获取模块,用于从不同平台获取目标商家对应的多个订单数据,所述多个订单数据包括不存在下单人标识的多个第一订单数据以及存在下单人标识的多个第二订单数据;
标识获取模块,用于将所述多个第一订单数据按照购买标识划分为多个第一订单数据组,获取每个第一订单数据组对应的多个收货人标识;
权重确定模块,用于针对每个第一订单数据组确定该第一订单数据组中每个收货人标识对应的识别权重,选取数值最大的识别权重对应的收货人标识作为该第一订单数据组的目标收货人标识;
数据规范模块,用于将多个目标收货人标识以及下单人标识作为数据标识对多个订单数据进行整理,获取多个规范化订单数据;
指标确定模块,用于按照统一的分析标准对不同平台的多个规范化订单数据进行分析,获取所述目标商家在不同平台下的运营指标。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7中任一项所述的多平台数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7中任一项所述的多平台数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210834267.5A CN115204978A (zh) | 2022-07-14 | 2022-07-14 | 一种多平台数据处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210834267.5A CN115204978A (zh) | 2022-07-14 | 2022-07-14 | 一种多平台数据处理方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115204978A true CN115204978A (zh) | 2022-10-18 |
Family
ID=83581542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210834267.5A Pending CN115204978A (zh) | 2022-07-14 | 2022-07-14 | 一种多平台数据处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115204978A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117455622A (zh) * | 2023-11-08 | 2024-01-26 | 深圳市土地公网络科技有限公司 | 订单数据的处理方法、装置、设备及存储介质 |
-
2022
- 2022-07-14 CN CN202210834267.5A patent/CN115204978A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117455622A (zh) * | 2023-11-08 | 2024-01-26 | 深圳市土地公网络科技有限公司 | 订单数据的处理方法、装置、设备及存储介质 |
CN117455622B (zh) * | 2023-11-08 | 2024-07-02 | 深圳市土地公网络科技有限公司 | 订单数据的处理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107918905A (zh) | 异常交易识别方法、装置及服务器 | |
CN111292164B (zh) | 一种商品推荐方法、装置、电子设备及可读存储介质 | |
CN107516246B (zh) | 用户类型的确定方法、确定装置、介质及电子设备 | |
US20220180379A1 (en) | Transaction-based information processing system, method, and article | |
CN109146533B (zh) | 信息推送方法和装置 | |
CN110458544B (zh) | 一种跨多收银系统的支付方法及支付服务系统 | |
CN111242318B (zh) | 基于异构特征库的业务模型训练方法及装置 | |
CN112765230B (zh) | 基于互联网金融的支付大数据分析方法及大数据分析系统 | |
CN111667225A (zh) | 财务数据处理方法、装置及计算机系统 | |
CN108648005A (zh) | 数据处理方法及系统 | |
CN114942971B (zh) | 一种结构化数据的抽取方法及装置 | |
CN112734165A (zh) | 智能化的功能展示方法、装置、设备及存储介质 | |
CN115204978A (zh) | 一种多平台数据处理方法、装置、电子设备及存储介质 | |
CN111639102A (zh) | 客户数据资源共享方法、装置及电子设备 | |
JP6160165B2 (ja) | 評価支援プログラム、評価支援装置及び評価支援方法 | |
CN114493361A (zh) | 一种商品推荐算法的有效性评估方法和装置 | |
CN111275294B (zh) | 一种商品信息批量处理分析方法、装置和设备 | |
CN112884291A (zh) | 一种企业供应链的分析方法、装置、计算机装置和存储介质 | |
CN108352027A (zh) | 识别个人客户在不同商户购买的产品的计算机实现的方法和系统 | |
JP2007233694A (ja) | 評価収集システム、電子決済装置、携帯端末、評価収集方法、権利付与方法、評価提供方法およびプログラム | |
CN111639274B (zh) | 线上商品智能排序方法、装置、计算机设备和存储介质 | |
CN109214874B (zh) | Ip产品运营数据处理方法、装置、设备及可读存储介质 | |
JP6932680B2 (ja) | 売買審査装置、売買審査方法及び売買審査プログラム | |
CN112734531A (zh) | 物品推荐方法、装置、电子设备及存储介质 | |
CN111159506A (zh) | 一种数据有效性识别方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |