CN113112285B - 数据分析方法和装置 - Google Patents

数据分析方法和装置 Download PDF

Info

Publication number
CN113112285B
CN113112285B CN202010031932.8A CN202010031932A CN113112285B CN 113112285 B CN113112285 B CN 113112285B CN 202010031932 A CN202010031932 A CN 202010031932A CN 113112285 B CN113112285 B CN 113112285B
Authority
CN
China
Prior art keywords
address
order
attribute
warehouse
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010031932.8A
Other languages
English (en)
Other versions
CN113112285A (zh
Inventor
韦付芝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Zhenshi Information Technology Co Ltd
Original Assignee
Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Zhenshi Information Technology Co Ltd filed Critical Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority to CN202010031932.8A priority Critical patent/CN113112285B/zh
Publication of CN113112285A publication Critical patent/CN113112285A/zh
Application granted granted Critical
Publication of CN113112285B publication Critical patent/CN113112285B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据分析方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取订单数据,订单数据包括每个订单流转过程中相关的多个地址;根据地址的属性信息,将多个地址划分为不同类型的节点;根据每个订单的流转关系连接节点,生成订单流向模型图,在订单流向模型图中,不同类型的节点采用不同的图例表示;存储订单流向模型图,并基于订单流向模型图进行数据分析。该实施方式能够将订单数据以非结构化的订单流向模型图的形式进行存储,在存储过程中,数据之间的关系已经建立,在分析数据时,根据订单流向模型图的结构即可,无需对数据库表进行关联查询,也无需建立数据分析模型,从而减少数据处理过程,降低数据分析难度。

Description

数据分析方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据分析方法和装置。
背景技术
随着互联网快速发展,电子商务越来越成熟。在电子商务的往来业务中产生了大量的数据。而大多数的数据对象通过关系型数据库保存,在进行数据分析过程中,通过大数据相关技术进行处理。具体的,在现有技术中在对数据进行分析时,需要对数据进行结构化处理,涉及较多数据库和网络操作。然后对数据进行模型建立,最终通过模型对数据进行统计分析。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:通过关系型数据库保存数据对象时,各数据对象之间相互独立,数据处理难度大;数据分析过程复杂,需要对关系型数据库中的各种库表进行操作。
发明内容
有鉴于此,本发明实施例提供一种数据分析方法,能够将订单数据以非结构化的订单流向模型图的形式进行存储,在存储该订单流向模型图的过程中,数据之间的关系已经建立,在分析数据时,根据订单流向模型图的结构即可,无需对数据库表进行关联查询,也无需建立数据分析模型,从而减少数据处理过程,降低数据分析难度。
为实现上述目的,根据本发明实施例的一个方面,提供了一种数据分析方法,包括:
获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;
根据地址的属性信息,将所述多个地址划分为不同类型的节点;
根据每个订单的流转关系连接所述节点,生成订单流向模型图,在所述订单流向模型图中,不同类型的节点采用不同的图例表示;
存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析。
可选地,所述属性信息包括用户属性、仓库属性和厂商属性;
根据地址的属性信息,将所述多个地址划分为不同类型的节点包括:
对于某一地址,若所述地址只具有用户属性,则将所述地址作为第一类型节点;
若所述地址只具有厂商属性,则将所述地址作为第二类型节点;
若所述地址只具有仓库属性,则将所述地址作为第三类型节点;
若所述地址同时具有用户属性和厂商属性,则将所述地址作为第四类型节点;
若所述地址同时具有用户属性和仓库属性,则将所述地址作为第五类型节点;
若所述地址同时具有厂商属性和仓库属性,则将所述地址作为第六类型节点;
若所述地址同时具有用户属性、厂商属性和仓库属性,则将所述地址作为第七类型节点。
可选地,根据每个订单的流转关系连接所述节点,生成订单流向模型图包括:
按照订单由厂商到仓库的流向,利用第一类型的有向线条连接具有厂商属性的节点和具有仓库属性的节点;
按照订单由仓库到用户的流向,利用第二类型的有向线条连接具有仓库属性的节点和具有用户属性的节点。
可选地,基于所述订单流向模型图进行数据分析包括:
确定所述订单流向模型图中每一节点的入度和出度;
基于所述入度和所述出度,进行数据分析,所述数据分析包括仓库选址分析和厂商选址分析。
为实现上述目的,根据本发明实施例的一个方面,提供了一种数据分析装置,包括:
数据获取模块,用于获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;
节点划分模块,用于根据地址的属性信息,将所述多个地址划分为不同类型的节点;
流向图生成模块,用于根据每个订单的流转关系连接所述节点,生成订单流向模型图,在所述订单流向模型图中,不同类型的节点采用不同的图例表示;
数据分析模块,用于存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析。
可选地,所述属性信息包括用户属性、仓库属性和厂商属性;
所述节点划分模块还用于:对于某一地址,若所述地址只具有用户属性,则将所述地址作为第一类型节点;若所述地址只具有厂商属性,则将所述地址作为第二类型节点;若所述地址只具有仓库属性,则将所述地址作为第三类型节点;若所述地址同时具有用户属性和厂商属性,则将所述地址作为第四类型节点;若所述地址同时具有用户属性和仓库属性,则将所述地址作为第五类型节点;若所述地址同时具有厂商属性和仓库属性,则将所述地址作为第六类型节点;若所述地址同时具有用户属性、厂商属性和仓库属性,则将所述地址作为第七类型节点。
可选地,流向图生成模块还用于:按照订单由厂商到仓库的流向,利用第一类型的有向线条连接具有厂商属性的节点和具有仓库属性的节点;按照订单由仓库到用户的流向,利用第二类型的有向线条连接具有仓库属性的节点和具有用户属性的节点。
可选地,所述据分析模块还用于:确定所述订单流向模型图中每一节点的入度和出度;基于所述入度和所述出度,进行数据分析,所述数据分析包括仓库选址分析和厂商选址分析。
为实现上述目的,根据本发明实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的数据分析方法。
为实现上述目的,根据本发明实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的数据分析方法。
上述发明中的一个实施例具有如下优点或有益效果:通过获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;根据地址的属性信息,将所述多个地址划分为不同类型的节点;根据每个订单的流转关系连接所述节点,生成订单流向模型图;存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析的技术手段,能够将订单数据以非结构化的订单流向模型图的形式进行存储,在存储该订单流向模型图的过程中,数据之间的关系已经建立,在分析数据时,根据订单流向模型图的结构即可,无需对数据库表进行关联查询,也无需建立数据分析模型,从而减少数据处理过程,降低了数据分析难度。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是本发明实施例的数据分析方法的主要流程的示意图;
图2是本发明实施例的数据分析方法的订单数据E-R图;
图3是本发明实施例的数据分析方法的订单数据中的基础数据的逻辑存储关系图;
图4是本发明实施例的数据分析方法的订单数据的时序图;
图5是本发明实施例的数据分析方法的基于订单数据生成的关联路径网络图;
图6是本发明实施例的数据分析方法的基于地址生成的关联路径有向图;
图7是本发明实施例的数据分析方法的订单流向模型图;
图8是本发明实施例的数据分析装置的主要模块的示意图;
图9是本发明实施例可以应用于其中的示例性系统架构图;
图10是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的数据分析方法的主要流程的示意图,如图1所示,该方法包括:
步骤S101:获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址。
在本步骤中,与每个订单相关的多个地址包括与订单中的商品相关的厂商地址、仓库地址和用户的收货地址(以下简称用户地址)。
步骤S102:根据地址的属性信息,将所述多个地址划分为不同类型的节点。
在本步骤中,地址的属性信息包括用户属性、仓库属性和厂商属性。根据地址的属性信息,将地址划分为不同类型的节点之后,不同类型的节点利用不同的图例表示。其中,图例是指是集中于地图一角或一侧的地图上各种符号和颜色所代表内容与指标的说明,有助于更好的认识地图。它具有双重任务,在编图时作为图解表示地图内容的准绳,用图时作为必不可少的阅读指南。
作为具体的示例,根据地址的属性信息,将所述多个地址划分为不同类型的节点包括:
对于某一地址,若所述地址只具有用户属性,则将所述地址作为第一类型节点;
若所述地址只具有厂商属性,则将所述地址作为第二类型节点;
若所述地址只具有仓库属性,则将所述地址作为第三类型节点;
若所述地址同时具有用户属性和厂商属性,则将所述地址作为第四类型节点;
若所述地址同时具有用户属性和仓库属性,则将所述地址作为第五类型节点;
若所述地址同时具有厂商属性和仓库属性,则将所述地址作为第六类型节点;
若所述地址同时具有用户属性、厂商属性和仓库属性,则将所述地址作为第七类型节点。
步骤S103:根据每个订单的流转关系连接所述节点,生成订单流向模型图,在所述订单流向模型图中,不同类型的节点采用不同的图例表示。
在本步骤中,订单的流转关系包括订单中的商品由厂商到仓库的流转以及由仓库到用户的流转。因此,该步骤具体的可以包括:
按照订单由厂商到仓库的流向,利用第一类型的有向线条连接具有厂商属性的节点和具有仓库属性的节点;
按照订单由仓库到用户的流向,利用第二类型的有向线条连接具有仓库属性的节点和具有用户属性的节点。
在本实施例中,利用有向线条表示节点之间的依赖关系,利用不同类型的有向线条表示不同类型的依赖关系。
其中,具有厂商属性的节点可以是第二类型节点、第四类型节点、第六类型节点或第七类型节点。具有仓库属性的节点可以是第三类型节点、第五类型节点、第六类型节点或第七类型节点。具有用户属性的节点可以是第一类型节点、第四类型节点、第五类型节点或第七类型节点。
本发明实施例的数据分析方法,利用不同类型的有向线条连接不同类型的节点,可以直观的了解商品的流转情况和周转情况。
步骤S104:存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析。
在本发明实施例中,可以将订单流向模型图存储于图数据库中。其中,图数据库(Graph Database)并非指存储图片的数据库,而是以图这种数据结果存储和查询数据的数据库。在存储订单流向模型图的过程中,数据之间的关系已经建立,数据无需表关联查询,从而减少数据处理过程,降低了数据分析难度。
在可选的实施例中,基于订单流向模型图进行数据分析的过程包括:
确定所述订单流向模型图中每一节点的入度和出度;
基于所述入度和所述出度,进行数据分析,所述数据分析包括仓库选址分析和厂商选址分析。
其中,节点的度是指和该节点相连的边的条数。节点的入度为该节点的入边条数,节点的出度为该节点的出边条数。
对于本实施例的订单流向模型图,节点的入度和出度均为厂商-仓库流向与仓库-用户流向的总和。入度大,表示商品流通到此处频繁。出度大,表示此处某商品周转频繁。因此,在本实施例中出入度表示的含义为:某一节点,其生产某一商品的销量,和某一地区的消费能力。具体的,假如该节点为第二类型节点(即该节点具有厂商属性),则该节点的出度可以表示该厂商生产某一商品的销量,假如该节点为第一类型节点(即该节点具有用户属性),则该节点的入度可以表示该地区的消费能力,假如该节点为第三类型节点(即该节点具有仓库属性),则该节点的出度表示该仓库生产某一商品的销量,该节点的入度为表示该仓库所在地区的消费能力。
在实际应用场景中,节点的出入度的最佳比应该是1:1,说明此处的厂商或者仓库,地理布局合理,就近满足消费者用户的消费。实际生产中,减少了商品流通环节,降低货物运输距离和搬运次数。
本发明实施例的数据分析方法,通过获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;根据地址的属性信息,将所述多个地址划分为不同类型的节点;根据每个订单的流转关系连接所述节点,生成订单流向模型图;存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析的技术手段,能够将订单数据以非结构化的订单流向模型图的形式进行存储,在存储该订单流向模型图的过程中,数据之间的关系已经建立,在分析数据时,根据订单流向模型图的结构即可,无需对数据库表进行关联查询,也无需建立数据分析模型,从而减少数据处理过程,降低了数据分析难度。
为使本发明实施例的数据分析方法更加清楚,以下述实施例为例进行说明。
本发明实施例中所涉及的订单数据主要包括:
用户(User):用户账号(userAccount)、地址码(addressCode);
订单(Order):订单号(orderNo)、商品码(skuCode)、用户账号(userAccount);
商品(Sku):商品(skuCode)、仓库号(whNo)、厂商码(manufacturerCode);
仓库(Wh):仓库号(whNo)、地址码(addressCode);
厂商(Manufacturer):厂商码(manufacturerCode)、地址码(addressCode);
地址(Address):一级地址、二级地址、三级地址等。
以上订单数据所对应的实体E-R图如图2所示。其中,E-R图(实体-联系图,EntityRelationship Diagram),提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。
在实际生产过程中,以上订单数据的具体内容如下表所示:
User表:用户信息,简化为用户账号+用户地址码,如表1所示。
表1:
userAccount addressCode
User1 A1
User2 A2
User3 A2
Order表:订单信息,简化为订单号+商品码+用户账号,如表2所示。
表2:
OrderCode skuCode userAccount
Order1 Sku1 User1
Order1 Sku2 User1
Order1 Sku3 User1
Order2 Sku1 User2
Order3 Sku1 User3
Sku表:商品信息,简化为商品码+所在仓库码+所属厂商码,如表3所示。
表3:
Wh表:仓库信息,简化为仓库号+地址码,如表4所示。
表4:
whCode addressCode
Wh1 A3
Wh2 A4
Manufacturer表:厂商信息,简化为厂商编码+地址码,如表5所示。
表5:
manufacturerCode addressCode
M1 A4
M2 A4
Address表:地址信息,简化为地址码+地址等级,如表6所示。
表6:
addresssCode primaryAddress(地址等级)
A1 P1(一级)
A2 P2(二级)
A3 P3(三级)
A4 P4(四级)
如上表所示:存在3条User记录,3条Order记录,3条Sku记录,2条Wh记录,2条Manufacturer记录,4条Address记录。表达的含义是:
User1创建了1个Order:Order1;Order1中存在3个Sku:Sku1、Sku2、Sku3;Sku1存储在Wh1,其对应的制造商为M1;Sku2存储在Wh1,其对应的制造商为M2;Sku3存储在Wh2,其对应的制造商为M2;Wh1仓库所在的地址编码为A3,Wh2、M1和M2所在的地址编码均为A4。其中,P1表示一级地址省份,省略二级地址城市,三级地址县区等。
User2和User3分别创建了订单Order2、Order3,其对应的具体信息内容如上表所示。
以上数据主要是基础数据User、Sku、Wh、Manufacturer、Address和生产数据Order。其基础数据对应的逻辑存储关系如图3所示。生产数据Order与基础数据的时序图如图4所示。如图4所示,基础数据的生命周期一直存活,而生产数据Order的生命周期是在下单后、生产出库前存货存活。将节点数据进行关联,形成一个基于订单数据的关联路径网络,如图5所示。该图5用于表示订单数据之间具有关联关系,而具体的关联关系从该图无法得知。
由于生产数据Order生命周期较短,其本质价值是将Sku和User进行关联,其可以转化为一个地址到另一个地址的有向路径,即:A1->A2。
将表2进行简单变形,如下表7和表8所示:
表7:厂商-仓库流向
OrderCode manufacturerCode/fromAddressOfMf whCode/toAddressOfWh
Order1 M1/A4 Wh1/A3
Order1 M2/A4 Wh1/A3
Order1 M2/A4 Wh2/A4
Order2 M1/A4 Wh1/A3
Order3 M1/A4 Wh1/A3
表8:仓库-用户流向
OrderCode whCode/fromAddressOfWh userAccount/toAddressOfUser
Order1 Wh1/A3 User1/A1
Order1 Wh1/A3 User1/A1
Order1 Wh2/A4 User1/A1
Order2 Wh1/A3 User2/A1
Order3 Wh1/A3 User3/A2
上表表示:订单Order中商品的移动流向。具体为:
Order1中的商品,在其生命周期内,会分别经历A4->A3、A3->A1、A4->A1的流向。
基于商品的流向,将图5的关联路径网络转化为关联路径有向图,如图6所示。
根据图6的关联路径有向图可知:
inDegree(A1)=2,outDegree(A1)=0;
inDegree(A2)=1,outDegree(A2)=0;
inDegree(A3)=2,outDegree(A3)=2;
inDegree(A4)=1,outDegree(A4)=3;
inDegree(A5)=0,outDegree(A5)=0。
其中,inDegree(A(n))表示节点A(n)的入度,outDegree(A(n))表示节点A(n)的出度。其中,A4->A3有两条,是因为两个厂商M1、M2均在同一地址A4。
图6中的节点的类型均为同一类型的节点,即在图6中地址不分用户地址、仓库地址、厂商地址。
若将地址按照其具有的属性信息划分为不同类型的节点,并将不同类型的节点利用不同的图例进行表示,则得到图7。其中,在图7中,方框表示该节点的属性是用户属性,圆框表示该节点的属性是仓库属性,菱形框表示该节点的属性既有仓库属性又有厂商属性。实线箭头表示厂商到仓库的流向,虚线箭头表示仓库到用户的流向。
根据图7的订单流向模型图可知:
inDegree(A1)=2,outDegree(A1)=0;
inDegree(A2)=1,outDegree(A2)=0;
inDegree(A3)=2,outDegree(A3)=2;
inDegree(A4)=1,outDegree(A4)=3。
以上出入度为厂商-仓库流向+仓库-用户流向的总和。
入度大,表示商品流通到此处频繁;出度大,表示此处某商品周转频繁。
如果将地址节点Address关联上商品Sku信息和用户User信息,其流向图模型中出入度表示的含义为:
某一地址节点,其生产某一商品的销量,和某一地区的消费能力。
实际应用场景中,出入度的最佳比,应该是1:1,说明此处的厂商或者仓库,地理布局合理,就近满足消费者用户的消费。实际生产中,减少了商品流通环节,降低货物运输距离和搬运次数。
订单流向图模型可用于商品流向分析,商品销量分析,也可以用于用户消费行为习惯分析,仓库选址分析,厂家售后选址分析等业务。
图8是本发明实施例的数据分析装置800的主要模块的示意图,如图8所示,该数据分析装置800包括:
数据获取模块801,用于获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;
节点划分模块802,用于根据地址的属性信息,将所述多个地址划分为不同类型的节点;
流向图生成模块803,用于根据每个订单的流转关系连接所述节点,生成订单流向模型图,在所述订单流向模型图中,不同类型的节点采用不同的图例表示;
数据分析模块804,用于存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析。
可选地,所述属性信息包括用户属性、仓库属性和厂商属性;
所述节点划分模块802还用于:对于某一地址,若所述地址只具有用户属性,则将所述地址作为第一类型节点;若所述地址只具有厂商属性,则将所述地址作为第二类型节点;若所述地址只具有仓库属性,则将所述地址作为第三类型节点;若所述地址同时具有用户属性和厂商属性,则将所述地址作为第四类型节点;若所述地址同时具有用户属性和仓库属性,则将所述地址作为第五类型节点;若所述地址同时具有厂商属性和仓库属性,则将所述地址作为第六类型节点;若所述地址同时具有用户属性、厂商属性和仓库属性,则将所述地址作为第七类型节点。
可选地,流向图生成模块803还用于:按照订单由厂商到仓库的流向,利用第一类型的有向线条连接具有厂商属性的节点和存在仓库属性的节点具有仓库属性的节点;按照订单由仓库到用户的流向,利用第二类型的有向线条连接具有仓库属性的节点和具有用户属性的节点。
可选地,所述据分析模块804还用于:确定所述订单流向模型图中每一节点的入度和出度;基于所述入度和所述出度,进行数据分析,所述数据分析包括仓库选址分析和厂商选址分析。
上述装置可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
本发明实施例的数据分析装置,通过获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;根据地址的属性信息,将所述多个地址划分为不同类型的节点;根据每个订单的流转关系连接所述节点,生成订单流向模型图;存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析的技术手段,能够将订单数据以非结构化的订单流向模型图的形式进行存储,在存储该订单流向模型图的过程中,数据之间的关系已经建立,在分析数据时,根据订单流向模型图的结构即可,无需对数据库表进行关联查询,也无需建立数据分析模型,从而减少数据处理过程,降低了数据分析难度能够将订单数据以非结构化的订单流向模型图的形式进行存储,在存储该订单流向模型图的过程中,数据之间的关系已经建立,在分析数据时,根据订单流向模型图的结构即可,无需对数据库表进行关联查询,也无需建立数据分析模型,从而减少数据处理过程,降低了数据分析难度。
图9示出了可以应用本发明实施例的数据分析方法或数据分析装置的示例性系统架构900。
如图9所示,系统架构900可以包括终端设备901、902、903,网络904和服务器905。网络904用以在终端设备901、902、903和服务器905之间提供通信链路的介质。网络904可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备901、902、903通过网络904与服务器905交互,以接收或发送消息等。终端设备901、902、903上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备901、902、903可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器905可以是提供各种服务的服务器,例如对用户利用终端设备901、902、903所浏览的购物类网站提供支持的后台管理服务器。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息)反馈给终端设备。
需要说明的是,本发明实施例所提供的数据分析方法一般由服务器905执行,相应地,数据分析装置一般设置于服务器905中。
应该理解,图9中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图10,其示出了适于用来实现本发明实施例的终端设备的计算机系统1000的结构示意图。图10示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图10所示,计算机系统1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有系统1000操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括发送模块、获取模块、确定模块和第一处理模块。其中,这些模块的名称在某种情况下并不构成对该单元本身的限定,例如,发送模块还可以被描述为“向所连接的服务端发送图片获取请求的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;
根据地址的属性信息,将所述多个地址划分为不同类型的节点;
根据每个订单的流转关系连接所述节点,生成订单流向模型图,在所述订单流向模型图中,不同类型的节点采用不同的图例表示;
存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析。
本发明实施例的技术方案,通过获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;根据地址的属性信息,将所述多个地址划分为不同类型的节点;根据每个订单的流转关系连接所述节点,生成订单流向模型图;存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析的技术手段,能够将订单数据以非结构化的订单流向模型图的形式进行存储,在存储该订单流向模型图的过程中,数据之间的关系已经建立,在分析数据时,根据订单流向模型图的结构即可,无需对数据库表进行关联查询,也无需建立数据分析模型,从而减少数据处理过程,降低了数据分析难度。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (8)

1.一种数据分析方法,其特征在于,包括:
获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;
根据地址的属性信息,将所述多个地址划分为不同类型的节点;其中,所述属性信息包括用户属性、仓库属性和厂商属性;
根据每个订单的流转关系连接所述节点,生成订单流向模型图,包括:按照订单由厂商到仓库的流向,利用第一类型的有向线条连接具有厂商属性的节点和具有仓库属性的节点;按照订单由仓库到用户的流向,利用第二类型的有向线条连接具有仓库属性的节点和具有用户属性的节点;在所述订单流向模型图中,不同类型的节点采用不同的图例表示;
存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析。
2.根据权利要求1所述的方法,其特征在于,根据地址的属性信息,将所述多个地址划分为不同类型的节点包括:
对于某一地址,若所述地址只具有用户属性,则将所述地址作为第一类型节点;
若所述地址只具有厂商属性,则将所述地址作为第二类型节点;
若所述地址只具有仓库属性,则将所述地址作为第三类型节点;
若所述地址同时具有用户属性和厂商属性,则将所述地址作为第四类型节点;
若所述地址同时具有用户属性和仓库属性,则将所述地址作为第五类型节点;
若所述地址同时具有厂商属性和仓库属性,则将所述地址作为第六类型节点;
若所述地址同时具有用户属性、厂商属性和仓库属性,则将所述地址作为第七类型节点。
3.根据权利要求1所述的方法,其特征在于,基于所述订单流向模型图进行数据分析包括:
确定所述订单流向模型图中每一节点的入度和出度;
基于所述入度和所述出度,进行数据分析,所述数据分析包括仓库选址分析和厂商选址分析。
4.一种数据分析装置,其特征在于,包括:
数据获取模块,用于获取订单数据,所述订单数据包括每个订单流转过程中相关的多个地址;
节点划分模块,用于根据地址的属性信息,将所述多个地址划分为不同类型的节点;其中,所述属性信息包括用户属性、仓库属性和厂商属性;
流向图生成模块,用于根据每个订单的流转关系连接所述节点,生成订单流向模型图,包括:按照订单由厂商到仓库的流向,利用第一类型的有向线条连接具有厂商属性的节点和具有仓库属性的节点;按照订单由仓库到用户的流向,利用第二类型的有向线条连接具有仓库属性的节点和具有用户属性的节点;在所述订单流向模型图中,不同类型的节点采用不同的图例表示;
数据分析模块,用于存储所述订单流向模型图,并基于所述订单流向模型图进行数据分析。
5.根据权利要求4所述的装置,其特征在于,所述节点划分模块还用于:
对于某一地址,若所述地址只具有用户属性,则将所述地址作为第一类型节点;
若所述地址只具有厂商属性,则将所述地址作为第二类型节点;
若所述地址只具有仓库属性,则将所述地址作为第三类型节点;
若所述地址同时具有用户属性和厂商属性,则将所述地址作为第四类型节点;
若所述地址同时具有用户属性和仓库属性,则将所述地址作为第五类型节点;
若所述地址同时具有厂商属性和仓库属性,则将所述地址作为第六类型节点;
若所述地址同时具有用户属性、厂商属性和仓库属性,则将所述地址作为第七类型节点。
6.根据权利要求4所述的装置,其特征在于,所述据分析模块还用于:
确定所述订单流向模型图中每一节点的入度和出度;
基于所述入度和所述出度,进行数据分析,所述数据分析包括仓库选址分析和厂商选址分析。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3中任一所述的方法。
8.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-3中任一所述的方法。
CN202010031932.8A 2020-01-13 2020-01-13 数据分析方法和装置 Active CN113112285B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010031932.8A CN113112285B (zh) 2020-01-13 2020-01-13 数据分析方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010031932.8A CN113112285B (zh) 2020-01-13 2020-01-13 数据分析方法和装置

Publications (2)

Publication Number Publication Date
CN113112285A CN113112285A (zh) 2021-07-13
CN113112285B true CN113112285B (zh) 2023-11-03

Family

ID=76709163

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010031932.8A Active CN113112285B (zh) 2020-01-13 2020-01-13 数据分析方法和装置

Country Status (1)

Country Link
CN (1) CN113112285B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113869591A (zh) * 2021-09-30 2021-12-31 浙江创邻科技有限公司 一种基于图技术的物流管理系统及方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631621A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 分布式系统中物流订单状态的控制方法及其系统
CN106127327A (zh) * 2016-05-17 2016-11-16 北京京东尚科信息技术有限公司 基于gis的配送站点选址方法和系统
CN106169127A (zh) * 2016-06-30 2016-11-30 乐视控股(北京)有限公司 一种订单处理方法和系统
CN107862506A (zh) * 2017-11-01 2018-03-30 青岛鹏海软件有限公司 一种实现订单执行全流程可视化的系统和方法
CN108171452A (zh) * 2017-12-08 2018-06-15 苏宁云商集团股份有限公司 一种快递点选址方法及装置
CN110309034A (zh) * 2019-06-13 2019-10-08 阿里巴巴集团控股有限公司 业务流转链路视图生成方法及装置
CN110620722A (zh) * 2018-06-20 2019-12-27 北京京东尚科信息技术有限公司 一种订单处理的方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004111902A2 (en) * 2003-06-13 2004-12-23 Jon Kirkegaard Order commitment method and system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631621A (zh) * 2014-11-05 2016-06-01 阿里巴巴集团控股有限公司 分布式系统中物流订单状态的控制方法及其系统
CN106127327A (zh) * 2016-05-17 2016-11-16 北京京东尚科信息技术有限公司 基于gis的配送站点选址方法和系统
CN106169127A (zh) * 2016-06-30 2016-11-30 乐视控股(北京)有限公司 一种订单处理方法和系统
CN107862506A (zh) * 2017-11-01 2018-03-30 青岛鹏海软件有限公司 一种实现订单执行全流程可视化的系统和方法
CN108171452A (zh) * 2017-12-08 2018-06-15 苏宁云商集团股份有限公司 一种快递点选址方法及装置
CN110620722A (zh) * 2018-06-20 2019-12-27 北京京东尚科信息技术有限公司 一种订单处理的方法和装置
CN110309034A (zh) * 2019-06-13 2019-10-08 阿里巴巴集团控股有限公司 业务流转链路视图生成方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
B2B2C电子商务平台系统满足客户订单需求的资源整合系统设计研究;王怡婷;;门窗(第24期);全文 *

Also Published As

Publication number Publication date
CN113112285A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
CN111046237B (zh) 用户行为数据处理方法、装置、电子设备及可读介质
US11132413B2 (en) Providing travel or promotion based recommendation associated with social graph
CN110689268B (zh) 一种提取指标的方法和装置
CN109901987B (zh) 一种生成测试数据的方法和装置
US10242381B1 (en) Optimized selection and delivery of content
US20180004724A1 (en) Providing action associated with event detected within communication
CN111626804A (zh) 商品推荐方法、装置、电子设备及计算机可读介质
CN112347147A (zh) 基于用户关联关系的信息推送方法、装置及电子设备
CN111695840A (zh) 一种实现流程控制的方法和装置
CN113112285B (zh) 数据分析方法和装置
US20180107763A1 (en) Prediction using fusion of heterogeneous unstructured data
CN110060075B (zh) 用于预测销量的方法、装置、系统及介质
CN109426998B (zh) 信息推送方法和装置
CN107291923B (zh) 信息处理方法和装置
CN109255563B (zh) 物品的储位区域的确定方法和装置
CN110796543B (zh) 基于关系网络的定制信息获取方法、装置及电子设备
CN113495991A (zh) 一种推荐方法和装置
CN107679096B (zh) 数据集市间指标共享的方法和装置
CN110807095A (zh) 一种物品匹配方法和装置
WO2017196541A1 (en) Enhancing contact card based on knowledge graph
CN107885774B (zh) 数据处理方法和系统
CN112905604A (zh) 一种数据处理方法和装置
CN113256362A (zh) 用于输出信息的方法和装置
CN113269602A (zh) 物品推荐的方法和装置
CN113222680A (zh) 一种生成订单的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant