CN110347888B - 订单数据的处理方法、装置及存储介质 - Google Patents

订单数据的处理方法、装置及存储介质 Download PDF

Info

Publication number
CN110347888B
CN110347888B CN201910638642.7A CN201910638642A CN110347888B CN 110347888 B CN110347888 B CN 110347888B CN 201910638642 A CN201910638642 A CN 201910638642A CN 110347888 B CN110347888 B CN 110347888B
Authority
CN
China
Prior art keywords
order
data
classification information
processing
collected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910638642.7A
Other languages
English (en)
Other versions
CN110347888A (zh
Inventor
刘占春
赵杨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN201910638642.7A priority Critical patent/CN110347888B/zh
Publication of CN110347888A publication Critical patent/CN110347888A/zh
Application granted granted Critical
Publication of CN110347888B publication Critical patent/CN110347888B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种订单数据的处理方法、装置及存储介质,所述方法包括:获取至少两个订单处理系统的订单数据;对所述至少两个订单处理系统的订单数据进行数据预处理,得到待归集订单数据集;根据改进的文档主题生成模型LDA和改进的单通SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集;根据预设分类信息对所述至少一个订单归集数据集中属于预设时长的目标订单归集数据进行统计分析,得到不同预设分类信息对应的订单统计数据。可见,本申请实施例实现了对所有订单处理系统的订单数据进行数据归集分析,以便于终端可以快速地查询所有订单处理系统的不同预设分类信息对应的订单统计数据。

Description

订单数据的处理方法、装置及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种订单数据的处理方法、装置及存储介质。
背景技术
随着计算机网络技术的发展,订单处理系统的使用越来越普遍。
现有技术中,通常情况下不同地理区域会采用不同的订单处理系统,每个订单处理系统仅可以统计分析出自身的订单统计数据,无法统计分析其他订单处理系统的订单统计数据,导致现有技术中只能通过不同订单处理系统分别查询对应的订单统计数据,无法快速地查询所有订单处理系统的订单统计数据。
随着订单处理系统数量的增加和/或订单数据量的增加,如何能够实现对所有订单处理系统的订单数据进行数据归集分析,以便于可以快速地查询所有订单处理系统的订单统计数据是亟待解决的问题。
发明内容
本申请实施例提供一种订单数据的处理方法、装置及存储介质,实现了对所有订单处理系统的订单数据进行数据归集分析。
第一方面,本申请实施例提供一种订单数据的处理方法,包括:
获取至少两个订单处理系统的订单数据;
对所述至少两个订单处理系统的订单数据进行数据预处理,得到待归集订单数据集;
根据改进的文档主题生成模型LDA和改进的单通SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集;
根据预设分类信息对所述至少一个订单归集数据集中属于预设时长的目标订单归集数据进行统计分析,得到不同预设分类信息对应的订单统计数据。
在一种可能的实现方式中,所述根据改进的文档主题生成模型LDA和改进的单通SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集,包括:
将所述待归集订单数据集中的各待归集订单数据输入所述改进的文档主题生成模型LDA,得到各所述待归集订单数据对应的主题字段信息;
根据所述改进的SP聚类算法以及各所述待归集订单数据对应的主题字段信息,对各所述待归集订单数据进行聚类得到至少一个订单归集数据集;其中,同一个所述订单归集数据集中包括的订单归集数据所对应的预设主题字段信息相同。
在一种可能的实现方式中,所述数据预处理包括以下至少一项:数据清洗处理、数据标准化处理、数据去重处理、数据冲突处理。
在一种可能的实现方式中,所述方法还包括:
接收终端发送的查询请求消息;其中,所述查询请求消息中携带待查询的分类信息;
从所述不同预设分类信息对应的订单统计数据中确定出所述待查询的分类信息对应的订单统计数据;
向所述终端发送查询响应消息,其中,所述查询响应消息中携带所述待查询的分类信息对应的订单统计数据。
在一种可能的实现方式中,所述预设分类信息包括以下至少一项:订单业务分类信息、产品分类信息、销售渠道分类信息、门店分类信息、地理区域分类信息。
第二方面,本申请实施例提供一种订单数据的处理装置,包括
获取模块,用于获取至少两个订单处理系统的订单数据;
预处理模块,用于对所述至少两个订单处理系统的订单数据进行数据预处理,得到待归集订单数据集;
归集处理模块,用于根据改进的文档主题生成模型LDA和改进的单通SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集;
统计分析模块,用于根据预设分类信息对所述至少一个订单归集数据集中属于预设时长的目标订单归集数据进行统计分析,得到不同预设分类信息对应的订单统计数据。
在一种可能的实现方式中,所述归集处理模块具体用于:
将所述待归集订单数据集中的各待归集订单数据输入所述改进的文档主题生成模型LDA,得到各所述待归集订单数据对应的主题字段信息;
根据所述改进的SP聚类算法以及各所述待归集订单数据对应的主题字段信息,对各所述待归集订单数据进行聚类得到至少一个订单归集数据集;其中,同一个所述订单归集数据集中包括的订单归集数据所对应的预设主题字段信息相同。
在一种可能的实现方式中,所述数据预处理包括以下至少一项:数据清洗处理、数据标准化处理、数据去重处理、数据冲突处理。
在一种可能的实现方式中,所述装置还包括:
接收模块,用于接收终端发送的查询请求消息;其中,所述查询请求消息中携带待查询的分类信息;
确定模块,用于从所述不同预设分类信息对应的订单统计数据中确定出所述待查询的分类信息对应的订单统计数据;
发送模块,用于向所述终端发送查询响应消息,其中,所述查询响应消息中携带所述待查询的分类信息对应的订单统计数据。
在一种可能的实现方式中,所述预设分类信息包括以下至少一项:订单业务分类信息、产品分类信息、销售渠道分类信息、门店分类信息、地理区域分类信息。
第三方面,本申请实施例提供一种订单数据的处理设备,包括:存储器和处理器;
其中,所述存储器,用于存储程序指令;
所述处理器,用于调用并执行所述存储器中存储的程序指令,当所述处理器执行所述存储器存储的程序指令时,所述订单数据的处理设备用于执行上述第一方面的任一实现方式所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行上述第一方面的任一实现方式所述的方法。
本申请实施例提供的订单数据的处理方法、装置及存储介质,通过对从至少两个订单处理系统获取的订单数据进行数据预处理,得到待归集订单数据集;进一步地,根据改进的文档主题生成模型LDA和改进的SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集;进一步地,根据预设分类信息对所述至少一个订单归集数据集进行统计分析,得到不同预设分类信息对应的订单统计数据。可见,本申请实施例实现了对所有订单处理系统的订单数据进行数据归集分析,以便于终端可以快速地查询所有订单处理系统的不同预设分类信息对应的订单统计数据。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用场景示意图;
图2为本申请一实施例提供的订单数据的处理方法的流程示意图;
图3为本申请另一实施例提供的订单数据的处理方法的流程示意图;
图4为本申请另一实施例提供的订单数据的处理方法的流程示意图;
图5为本申请实施例提供的订单数据的处理装置的结构示意图;
图6为本申请实施例提供的订单数据的处理设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先,对本申请实施例所涉及的应用场景和部分词汇进行介绍。
图1为本申请实施例提供的应用场景示意图,如图1所示,本申请实施例提供的应用场景中可以包括但不限于:订单数据的处理设备、至少两个订单处理系统(为了便于描述,图1中以至少两个订单处理系统包括订单处理系统A、订单处理系统B和订单处理系统C为例),以及终端。
示例性地,订单数据的处理设备可以从至少两个订单处理系统(例如订单处理系统A、订单处理系统B和订单处理系统C)获取订单数据,并对获取到的所有订单数据进行数据预处理、数据归集处理和统计分析,得到不同预设分类信息对应的订单统计数据,实现了对所有订单处理系统的订单数据进行数据归集分析,从而以便于终端可以查询所有订单处理系统的不同预设分类信息对应的订单统计数据。
本申请实施例中,订单数据的处理设备可以为数据处理服务器。示例性地,本申请实施例提供的订单数据的处理设备可以通过软件和/或硬件实现。
本申请实施例中,订单数据的处理装置可以为数据处理服务器,也可以为设置在数据处理服务器中的装置。示例性地,本申请实施例提供的订单数据的处理装置可以通过软件和/或硬件实现。
本申请实施例中涉及的终端可以包括但不限于以下任一项:手机或电脑等具有数据查询功能和/或数据展示功能的设备。
本申请实施例中涉及的订单数据可以包括但不限于以下至少一项:订单的标识信息(用于唯一标识订单)、订单的业务类型信息、订单的状态信息、订单的产品信息(用于指示订单对应的产品信息)、订单的用户信息(用于指示订单对应的用户信息)、订单的时间信息(用于指示订单对应的时间信息)。
本申请实施例中涉及的数据预处理可以包括但不限于以下至少一项:数据清洗处理、数据标准化处理、数据去重处理、数据冲突处理。
示例性地,数据清洗处理是指过滤掉数据格式不满足预设数据格式的订单数据,和/或,过滤掉数据类型不满足预设数据类型的订单数据。
示例性地,数据标准化处理是指将不同数据格式的订单数据统一转换成目标预设数据格式的订单数据。
示例性地,数据去重处理是指对于订单的标识信息相同,且数据格式相同的多个订单数据,只保留其中一个订单数据,去除掉其它重复的订单数据。
示例性地,数据冲突处理是指对于订单的标识信息相同,但数据格式不相同(例如,订单数据中的关键字段不同)的多个订单数据,需要将所述多个订单数据生成异常数据,并发送给所述多个订单数据所属的订单处理系统进行确认处理。
本申请实施例中涉及的预设分类信息可以包括但不限于以下至少一项:订单业务分类信息、产品分类信息、销售渠道分类信息、门店分类信息、地理区域分类信息。
本申请实施例提供的订单数据的处理方法、装置及存储介质,通过对从至少两个订单处理系统获取的订单数据进行数据预处理,得到待归集订单数据集;进一步地,根据改进的文档主题生成模型LDA和改进的SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集;进一步地,根据预设分类信息对所述至少一个订单归集数据集进行统计分析,得到不同预设分类信息对应的订单统计数据。可见,本申请实施例实现了对所有订单处理系统的订单数据进行数据归集分析,以便于终端可以快速地查询所有订单处理系统的不同预设分类信息对应的订单统计数据。
下面以具体地实施例对本申请的技术方案进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请一实施例提供的订单数据的处理方法的流程示意图。本申请实施例的执行主体可以为订单数据的处理装置,也可以为订单数据的处理设备(下述实施例中以订单数据的处理装置为例进行介绍)。如图2所示,本申请实施例的方法可以包括:
步骤S201、获取至少两个订单处理系统的订单数据。
本步骤中,订单数据的处理装置可以从至少两个订单处理系统(例如图1中的订单处理系统A、订单处理系统B和订单处理系统C)获取对应的订单数据。示例性地,订单数据的处理装置可以通过Kafka集群从至少两个订单处理系统获取对应的订单数据。
本申请实施例涉及的Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。其中,Kafka集群包含一个或多个服务器。
步骤S202、对所述至少两个订单处理系统的订单数据进行数据预处理,得到待归集订单数据集。
本步骤中,订单数据的处理装置对所述至少两个订单处理系统的订单数据进行数据预处理,得到待归集订单数据集,其中,待归集订单数据集中包括多个待归集订单数据。
本申请实施例中涉及的数据预处理可以包括但不限于以下至少一项:数据清洗处理、数据标准化处理、数据去重处理、数据冲突处理。
示例性地,数据清洗处理是指过滤掉数据格式不满足预设数据格式的订单数据,和/或,过滤掉数据类型不满足预设数据类型的订单数据。
示例性地,数据标准化处理是指将不同数据格式的订单数据统一转换成目标预设数据格式的订单数据。
示例性地,数据去重处理是指对于订单的标识信息相同,且数据格式相同的多个订单数据,只保留其中一个订单数据,去除掉其它重复的订单数据。
示例性地,数据冲突处理是指对于订单的标识信息相同,但数据格式不相同(例如,订单数据中的关键字段不同)的多个订单数据,需要将所述多个订单数据生成异常数据,并发送给所述多个订单数据所属的订单处理系统进行确认处理。
示例性地,订单数据中的关键字段可以包括但不限于以下至少一项:订单的用户信息、订单的业务类型信息、订单的产品信息。
步骤S203、根据改进的文档主题生成模型LDA和改进的单通SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集。
本申请实施例中涉及的改进的文档主题生成模型(Latent DirichletAllocation,LDA)可以是将预设的多个订单数据输入预设LDA,通过设置不同的调和因子γ进行训练,最终获取得到的最优的LDA主题矩阵分布θ。
本申请实施例中涉及的改进的单通(Single-Pass,SP)聚类算法在对输入的订单数据进行聚类计算时,只需要与各订单数据簇的质心向量进行相似度计算即可,无需与各订单数据簇中的每个订单数据进行相似度计算,从而提高了聚类的效率。
本申请实施例中涉及的任意订单数据簇的质心向量(或者称之为聚类中心)可以代表所述订单数据簇内的各订单数据所具有的主题字段信息。
需要说明的是,采用本申请实施例提供的改进的SP聚类算法对各待归集订单数据进行聚类,最终得到的订单数据簇可以称之为订单归集数据集。
本申请实施例中涉及的任意订单数据簇中包括多个订单数据,且所述多个订单数据所对应的预设主题字段信息(例如订单业务类型信息等)相同。
本步骤中,订单数据的处理装置根据改进的文档主题生成模型LDA和改进的SP聚类算法对所述待归集订单数据集中的各归集订单数据进行数据归集处理,得到一个或多个订单归集数据集,其中,同一个订单归集数据集中包括的订单归集数据所对应的预设主题字段信息(例如订单业务类型信息等)相同,不同订单归集数据集中包括的订单归集数据所对应的预设主题字段信息不相同。
示例性地,订单数据的处理装置可以将所述待归集订单数据集中的各待归集订单数据输入所述改进的文档主题生成模型LDA,得到各所述待归集订单数据对应的主题字段信息。例如,假设待归集订单数据集中包括待归集订单数据A、待归集订单数据B和待归集订单数据C,订单数据的处理装置将待归集订单数据A、待归集订单数据B和待归集订单数据C输入所述改进的文档主题生成模型LDA,得到待归集订单数据A对应的主题字段信息A1和主题字段信息A2、待归集订单数据B对应的主题字段信息B1、主题字段信息B2和主题字段信息B3,以及待归集订单数据C对应的主题字段信息C1。
进一步地,订单数据的处理装置根据所述改进的SP聚类算法以及各所述待归集订单数据对应的主题字段信息,对各所述待归集订单数据进行聚类。其中,根据所述改进的SP聚类算法对任意待归集订单数据进行聚类计算时,通过将所述待归集订单数据对应的主题字段信息与各订单数据簇的质心向量进行相似度计算;若所述待归集订单数据对应的主题字段信息与任意订单数据簇的质心向量之间的相似度小于预设相似度,则将所述待归集订单数据划分到所述订单数据簇。可见,通过结合改进的文档主题生成模型LDA和改进的SP聚类算法的方式,可以提高聚类的精度,从而提高了数据归集处理的准确度。
需要说明的是,采用本申请实施例提供的改进的SP聚类算法对各待归集订单数据进行聚类,最终得到的至少一个订单数据簇也可以称之为至少一个订单归集数据集;其中,同一个所述订单归集数据集中包括的订单归集数据所对应的预设主题字段信息(例如订单业务类型信息等)相同,不同订单归集数据集中包括的订单归集数据所对应的预设主题字段信息不相同。
步骤S204、根据预设分类信息对所述至少一个订单归集数据集中属于预设时长的目标订单归集数据进行统计分析,得到不同预设分类信息对应的订单统计数据。
本申请实施例中涉及的预设分类信息可以包括但不限于以下至少一项:订单业务分类信息、产品分类信息、销售渠道分类信息、门店分类信息、地理区域分类信息。
本步骤中,为了便于终端查询所有订单处理系统的订单统计数据,订单数据的处理装置可以根据预设分类信息对所述至少一个订单归集数据集中属于预设时长的目标订单归集数据进行统计分析,得到不同预设分类信息对应的订单统计数据。例如,假设预设分类信息包括产品分类信息、销售渠道分类信息、门店分类信息、地理区域分类信息,则订单数据的处理装置可以根据产品分类信息、销售渠道分类信息、门店分类信息、地理区域分类信息分别对所述至少一个订单归集数据集中属于预设时长(如5月份)的目标订单归集数据进行统计分析,得到产品分类信息对应的订单统计数据、销售渠道分类信息对应的订单统计数据、门店分类信息对应的订单统计数据、地理区域分类信对应的订单统计数据。
需要说明的是,本申请实施例中涉及的预设时长和/或预设分类信息可以为系统预设的,也可以为用户或终端输入的。
本申请实施例提供的订单数据的处理方法,通过对从至少两个订单处理系统获取的订单数据进行数据预处理,得到待归集订单数据集;进一步地,根据改进的文档主题生成模型LDA和改进的SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集;进一步地,根据预设分类信息对所述至少一个订单归集数据集中属于预设时长的目标订单归集数据进行统计分析,得到不同预设分类信息对应的订单统计数据。可见,本申请实施例实现了对所有订单处理系统的订单数据进行数据归集分析,以便于终端可以快速地查询所有订单处理系统的不同预设分类信息对应的订单统计数据。
图3为本申请另一实施例提供的订单数据的处理方法的流程示意图。在上述实施例的基础上,本申请实施例中对终端查询订单统计数据的可实现方式进行介绍。如图3所示,本申请实施例的方法可以包括:
步骤S301、接收终端发送的查询请求消息。
本申请实施例中,终端可以向用户显示查询页面,以便于用户在所述查询页面中输入待查询的分类信息等,进而将用户输入的待查询的分类信息等携带在查询请求消息中发送给订单数据的处理装置。
本步骤中,订单数据的处理装置可以接收终端发送的查询请求消息;其中,所述查询请求消息中可以携带用户在所述终端输入的待查询的分类信息等。
步骤S302、从所述不同预设分类信息对应的订单统计数据中确定出所述待查询的分类信息对应的订单统计数据。
本步骤中,订单数据的处理装置可以根据所述待查询的分类信息,从所述不同预设分类信息对应的订单统计数据中确定出与所述待查询的分类信息对应的订单统计数据。例如,假设不同预设分类信息对应的订单统计数据可以包括:产品分类信息对应的订单统计数据、销售渠道分类信息对应的订单统计数据、门店分类信息对应的订单统计数据、地理区域分类信对应的订单统计数据,以及所述待查询的分类信息为产品分类信息,则订单数据的处理装置可以从所述不同预设分类信息对应的订单统计数据中确定出与所述待查询的分类信息对应的订单统计数据(即产品分类信息对应的订单统计数据)。
步骤S303、向所述终端发送查询响应消息。
本步骤中,订单数据的处理装置向所述终端发送查询响应消息,其中,所述查询响应消息中携带所述待查询的分类信息对应的订单统计数据,以便于终端可以将所述待查询的分类信息对应的订单统计数据显示给用户。
本申请实施例中,订单数据的处理装置在接收到终端发送的携带有待查询的分类信息的查询请求消息后,从所述不同预设分类信息对应的订单统计数据中确定出所述待查询的分类信息对应的订单统计数据,并发送给所述终端,以便于终端可以将所述待查询的分类信息对应的订单统计数据显示给用户。可见,本申请实施例实现了终端可以快速地查询所有订单处理系统的不同预设分类信息对应的订单统计数据。
图4为本申请另一实施例提供的订单数据的处理方法的流程示意图。在上述实施例的基础上,本申请实施例中结合订单数据采集阶段、订单数据预处理阶段、订单数据归集处理阶段以及订单数据统计分析阶段对订单数据的处理方法进行介绍。如图4所示,本申请实施例的方法可以包括:
1、订单数据采集阶段:订单数据的处理装置可以从多个订单处理系统处采集对应的订单数据。
2、订单数据预处理阶段:订单数据的处理装置可以对采集到的多个订单处理系统的订单数据进行数据清洗处理、数据标准化处理、数据去重处理、数据冲突处理等数据预处理。
3、订单数据归集处理阶段:订单数据的处理装置可以根据改进的LDA和改进的SP聚类算法进行数据归集处理,得到至少一个订单归集数据集。
可选地,订单数据的处理装置还可以进一步地对所述至少一个订单归集数据集进行数据规整和数据沉淀,以便于后续可以快速地进行数据统计和数据查询;其中,数据规整是指可以按照预设分类信息将所述至少一个订单归集数据集进行分类,得到不同预设分类信息对应的订单分类数据集;数据沉淀是指将数据规整阶段分类后得到各订单分类数据集分别存储在数据库,例如分布式关系型数据库服务(Distributed Relational DatabaseService,DRDS)。
4、订单数据统计分析阶段:订单数据的处理装置可以根据产品分类信息、销售渠道分类信息、门店分类信息、地理区域分类信息等预设分类信息分别对数据库中相应的订单分类数据集进行统计分析,得到不同预设分类信息对应的订单统计数据。例如,订单数据的处理装置可以根据产品分类信息对数据库中存储的与产品分类信息所对应的订单分类数据集进行统计分析,得到产品分类信息对应的订单统计数据、订单数据的处理装置可以根据销售渠道分类信息对数据库中存储的与销售渠道分类信息所对应的订单分类数据集进行统计分析,得到销售渠道分类信息对应的订单统计数据、订单数据的处理装置可以根据门店分类信息对数据库中存储的与门店分类信息所对应的订单分类数据集进行统计分析,得到门店分类信息对应的订单统计数据、订单数据的处理装置可以根据地理区域分类信对数据库中存储的与地理区域分类信所对应的订单分类数据集进行统计分析,得到地理区域分类信对应的订单统计数据。
综上所述,本申请实施例提供的订单数据的处理方法,通过对从多个订单处理系统获取的订单数据依次进行数据预处理、结合改进的LDA和改进的SP聚类算法进行数据归集处理得到至少一个订单归集数据集,以及对所述至少一个订单归集数据集进行数据规整和数据沉淀以将不同预设分类信息对应的订单分类数据集分别存储在数据库;进一步地,根据预设分类信息对数据库中相应的订单分类数据集进行统计分析,可以快速地得到不同预设分类信息对应的订单统计数据。可见,本申请实施例实现了快速地对所有订单处理系统的订单数据进行数据归集分析,从而有利于终端可以快速地查询所有订单处理系统的不同预设分类信息对应的订单统计数据。
图5为本申请实施例提供的订单数据的处理装置的结构示意图。如图5所示,本申请实施例提供的订单数据的处理装置50可以包括:获取模块501、预处理模块502、归集处理模块503以及统计分析模块504。
其中,获取模块501,用于获取至少两个订单处理系统的订单数据;
预处理模块502,用于对所述至少两个订单处理系统的订单数据进行数据预处理,得到待归集订单数据集;
归集处理模块503,用于根据改进的文档主题生成模型LDA和改进的SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集;
统计分析模块504,用于根据预设分类信息对所述至少一个订单归集数据集中属于预设时长的目标订单归集数据进行统计分析,得到不同预设分类信息对应的订单统计数据。
在一种可能的实现方式中,所述归集处理模块503具体用于:
将所述待归集订单数据集中的各待归集订单数据输入所述改进的文档主题生成模型LDA,得到各所述待归集订单数据对应的主题字段信息;
根据所述改进的SP聚类算法以及各所述待归集订单数据对应的主题字段信息,对各所述待归集订单数据进行聚类得到至少一个订单归集数据集;其中,同一个所述订单归集数据集中包括的订单归集数据所对应的预设主题字段信息相同。
在一种可能的实现方式中,所述数据预处理包括以下至少一项:数据清洗处理、数据标准化处理、数据去重处理、数据冲突处理。
在一种可能的实现方式中,所述装置还包括:
接收模块,用于接收终端发送的查询请求消息;其中,所述查询请求消息中携带待查询的分类信息;
确定模块,用于从所述不同预设分类信息对应的订单统计数据中确定出所述待查询的分类信息对应的订单统计数据;
发送模块,用于向所述终端发送查询响应消息,其中,所述查询响应消息中携带所述待查询的分类信息对应的订单统计数据。
在一种可能的实现方式中,所述预设分类信息包括以下至少一项:订单业务分类信息、产品分类信息、销售渠道分类信息、门店分类信息、地理区域分类信息。
本申请实施例提供的订单数据的处理装置,可以用于执行本申请上述订单数据的处理方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
图6为本申请实施例提供的订单数据的处理设备的结构示意图。如图6所示,本申请实施例提供的订单数据的处理设备60可以包括:存储器601和处理器602。
其中,所述存储器601,用于存储程序指令;
所述处理器602,用于调用并执行所述存储器601中存储的程序指令,当所述处理器602执行所述存储器601存储的程序指令时,所述订单数据的处理设备60用于执行本申请上述订单数据的处理方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行本申请上述订单数据的处理方法实施例中的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域普通技术人员可以理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (8)

1.一种订单数据的处理方法,其特征在于,包括:
获取至少两个订单处理系统的订单数据;
对所述至少两个订单处理系统的订单数据进行数据预处理,得到待归集订单数据集;
根据改进的文档主题生成模型LDA和改进的单通SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集;
根据预设分类信息对所述至少一个订单归集数据集中属于预设时长的目标订单归集数据进行统计分析,得到不同预设分类信息对应的订单统计数据;
所述根据改进的文档主题生成模型LDA和改进的单通SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集,包括:
将所述待归集订单数据集中的各待归集订单数据输入所述改进的文档主题生成模型LDA,得到各所述待归集订单数据对应的主题字段信息,其中,所述改进的文档主题生成模型LDA是将预设的多个订单数据输入预设LDA,通过设置不同的调和因子γ进行训练,得到最优的LDA主题矩阵分布θ;
根据所述改进的SP聚类算法以及各所述待归集订单数据对应的主题字段信息,对各所述待归集订单数据进行聚类得到至少一个订单归集数据集;其中,同一个所述订单归集数据集中包括的订单归集数据所对应的预设主题字段信息相同,所述改进的SP聚类算法为:将所述待归集订单数据对应的主题字段信息与各订单数据簇的质心向量进行相似度计算;若得到的相似度小于预设相似度,则将所述待归集订单数据划分到所述订单数据簇。
2.根据权利要求1所述的方法,其特征在于,所述数据预处理包括以下至少一项:数据清洗处理、数据标准化处理、数据去重处理、数据冲突处理。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收终端发送的查询请求消息;其中,所述查询请求消息中携带待查询的分类信息;
从所述不同预设分类信息对应的订单统计数据中确定出所述待查询的分类信息对应的订单统计数据;
向所述终端发送查询响应消息,其中,所述查询响应消息中携带所述待查询的分类信息对应的订单统计数据。
4.根据权利要求1所述的方法,其特征在于,所述预设分类信息包括以下至少一项:订单业务分类信息、产品分类信息、销售渠道分类信息、门店分类信息、地理区域分类信息。
5.一种订单数据的处理装置,其特征在于,包括:
获取模块,用于获取至少两个订单处理系统的订单数据;
预处理模块,用于对所述至少两个订单处理系统的订单数据进行数据预处理,得到待归集订单数据集;
归集处理模块,用于根据改进的文档主题生成模型LDA和改进的单通SP聚类算法对所述待归集订单数据集进行数据归集处理,得到至少一个订单归集数据集;
统计分析模块,用于根据预设分类信息对所述至少一个订单归集数据集中属于预设时长的目标订单归集数据进行统计分析,得到不同预设分类信息对应的订单统计数据;
所述归集处理模块具体用于:
将所述待归集订单数据集中的各待归集订单数据输入所述改进的文档主题生成模型LDA,得到各所述待归集订单数据对应的主题字段信息,其中,所述改进的文档主题生成模型LDA是将预设的多个订单数据输入预设LDA,通过设置不同的调和因子γ进行训练,得到最优的LDA主题矩阵分布θ;
根据所述改进的SP聚类算法以及各所述待归集订单数据对应的主题字段信息,对各所述待归集订单数据进行聚类得到至少一个订单归集数据集;其中,同一个所述订单归集数据集中包括的订单归集数据所对应的预设主题字段信息相同,所述改进的SP聚类算法为:将所述待归集订单数据对应的主题字段信息与各订单数据簇的质心向量进行相似度计算;若得到的相似度小于预设相似度,则将所述待归集订单数据划分到所述订单数据簇。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收终端发送的查询请求消息;其中,所述查询请求消息中携带待查询的分类信息;
确定模块,用于从所述不同预设分类信息对应的订单统计数据中确定出所述待查询的分类信息对应的订单统计数据;
发送模块,用于向所述终端发送查询响应消息,其中,所述查询响应消息中携带所述待查询的分类信息对应的订单统计数据。
7.一种订单数据的处理设备,其特征在于,包括:存储器和处理器;
其中,所述存储器,用于存储程序指令;
所述处理器,用于调用并执行所述存储器中存储的程序指令,当所述处理器执行所述存储器存储的程序指令时,所述订单数据的处理设备用于执行如权利要求1-4中任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-4中任一项所述的方法。
CN201910638642.7A 2019-07-16 2019-07-16 订单数据的处理方法、装置及存储介质 Active CN110347888B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910638642.7A CN110347888B (zh) 2019-07-16 2019-07-16 订单数据的处理方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910638642.7A CN110347888B (zh) 2019-07-16 2019-07-16 订单数据的处理方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110347888A CN110347888A (zh) 2019-10-18
CN110347888B true CN110347888B (zh) 2022-02-15

Family

ID=68175452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910638642.7A Active CN110347888B (zh) 2019-07-16 2019-07-16 订单数据的处理方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110347888B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111522871B (zh) * 2020-04-23 2023-05-23 北京思特奇信息技术股份有限公司 订单数据的归集方法、装置及存储介质
CN111885100A (zh) * 2020-06-05 2020-11-03 河南翔宇医疗设备股份有限公司 一种信息收集处理方法及相关装置
CN112200709A (zh) * 2020-09-01 2021-01-08 深圳市道旅旅游科技股份有限公司 呼叫中心工单跟进方法、装置、计算机设备及存储介质
CN112235471B (zh) * 2020-09-01 2022-08-23 深圳市道旅旅游科技股份有限公司 呼叫中心工单处理方法、装置、计算机设备及存储介质
CN113643104A (zh) * 2021-09-01 2021-11-12 首约科技(北京)有限公司 一种网约车重复订单的过滤方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7548877B2 (en) * 2004-08-30 2009-06-16 Quixtar, Inc. System and method for processing orders for multiple multilevel marketing business models
CN106709777A (zh) * 2015-11-18 2017-05-24 阿里巴巴集团控股有限公司 一种订单聚类方法及装置,以及反恶意信息的方法及装置
CN105893526A (zh) * 2016-03-30 2016-08-24 上海坤士合生信息科技有限公司 多源数据融合系统和方法
CN107742242A (zh) * 2017-10-16 2018-02-27 苏州赛科计算机信息系统有限公司 订单处理方法及装置
CN109670916A (zh) * 2018-12-21 2019-04-23 成都小时代科技有限公司 一种车辆信息大数据服务平台及其服务方法

Also Published As

Publication number Publication date
CN110347888A (zh) 2019-10-18

Similar Documents

Publication Publication Date Title
CN110347888B (zh) 订单数据的处理方法、装置及存储介质
CN110069495A (zh) 数据存储方法、装置和终端设备
CN109558397B (zh) 一种数据处理方法、装置、服务器及计算机存储介质
CN111522968B (zh) 知识图谱融合方法及装置
CN110502546A (zh) 一种数据处理方法及装置
CN112396462B (zh) 基于Clickhouse的人群圈选方法及装置
WO2017114276A1 (zh) 基于图的分析用户的方法和系统
CN109542737A (zh) 平台告警处理方法、装置、电子装置及存储介质
CN111639077B (zh) 数据治理方法、装置、电子设备、存储介质
CN111967521A (zh) 跨境活跃用户识别方法及装置
CN112949914A (zh) 一种产业集群的识别方法、装置、存储介质及电子设备
CN114860742A (zh) 基于人工智能的ai客服交互方法、装置、设备及介质
CN111737371B (zh) 可动态预测的数据流量检测分类方法及装置
CN111339294A (zh) 客户数据分类方法、装置及电子设备
CN111368858A (zh) 用户满意度评估方法及装置
CN112804446B (zh) 基于云平台大数据的大数据处理方法及装置
CN113780580A (zh) 基于机器学习的数据分析方法、装置、设备及存储介质
CN109391738B (zh) 一种根据移动终端信息进行预警的方法
CN111740871A (zh) 一种数据采集方法及装置
CN110727532A (zh) 一种数据修复方法、电子设备及存储介质
CN115022083B (zh) 一种异常定界方法和装置
CN117807559B (zh) 一种多模态数据融合方法及系统
CN111159516B (zh) 媒资信息处理方法及装置
CN115543990A (zh) 电网监控数据处理方法、装置、设备及存储介质
CN115374280A (zh) 对话处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant