CN114240201A

CN114240201A - 一种基于供应链背景下的智慧数据中台

Info

Publication number: CN114240201A
Application number: CN202111574094.XA
Authority: CN
Inventors: 张贺; 贾俊宇; 张乐民; 周鑫; 荣国平; 邵栋
Original assignee: Nanjing Kuangji Information Technology Co ltd
Current assignee: Nanjing Kuangji Information Technology Co ltd
Priority date: 2021-12-21
Filing date: 2021-12-21
Publication date: 2022-03-25

Abstract

本发明公开了一种基于供应链背景下的智慧数据中台，包括数据获取模块，用于获取并清洗数据中台使用者的相关数据；数据控制模块，用于将数据存储，并为智能推荐模块，智能预测模块提供数据支持；智能推荐模块，可根据最新数据计算出数据中台使用者销售商品推荐、采购清单推荐等多种推荐结果；智能预测模块，可根据最新数据通过智能预测引擎计算出未来需求，退货量、销售额等多种预测结果；结果数据展示模块和结果数据输出模块，可将智能预测模块和智能推荐模块的结果对外以多种数据进行展示输出；本发明提高了需求预测和商品推荐的精准度，优化了供应链整体的性能。

Description

一种基于供应链背景下的智慧数据中台

技术领域

本发明涉及数据处理技术领域，具体为一种基于供应链背景下的智慧数据中台。

背景技术

供应链是由物料获取并加工成中间件或成品，再将成品送到数据中台使用者手中的一系列企业和部门构成的网络，对于供应链中每个中间节点的企业主体包括的过程有：订单的发送和获取、原材料的获得、产品制造到产品分配发放给数据中台使用者的整个过程；涉及的人员有：原材料供应者、零部件加工者及标准件供应者、最终产品制造者、产品批发分销商和最终数据中台使用者；随着21世纪电子商务的蓬勃发展，以及现代企业的数字化程度不断地提高，供应链整体的数字化也在进一步的提升。但是现代企业信息系统往往比较落后，并没有随着企业的发展而做进一步的提升。同时企业物流、信息流与资金流这些信息的数据量大幅增加，而对于这些数据，供应链中各个企业并没有一个很好的利用方法。对于企业自身的需求预测，库存计划，企业还停留在凭经验判断。对于供应链的管理策略，企业还在使用传统的供应链管理策略，这样带来的就是企业日常经营中存在多种问题，生产部门无法获得需要的物料；销售部门无法拿到需要的货物；冗余库存积压在库存，账面上来看是挣到了钱，其实钱全部都被挣到了库存中；供应链成本越来越高，库存越来越多，客户服务水平越来越低等等问题。

基于上述问题，亟于提出一种基于供应链背景下的智慧数据中台，该数据中台包含一种对于某种特定领域中海量数据进行采集、计算、存储、加工同时统一标准和口径的一种数据操作方法。数据中台在构建的时候考虑到了服务复用的问题，将供应链企业不同的个性化服务为其私人定制，但是数据中台的智能算法可以适配绝大部分企业的共有需求，并且对于中台中智能算法，由于其部署在不同的服务器中，方便对不同的智能算法进行升级的同时，不会造成对其它算法服务有影响。

发明内容

本发明的目的在于提供一种基于供应链背景下的智慧数据中台，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：一种基于供应链背景下的智慧数据中台，智慧数据中台包括：

数据获取模块，数据获取模块用于从数据中台使用者中获取数据，对获取到的数据进行数据清洗；

数据控制模块，数据控制模块用于将清洗后的数据保存到数据中台使用者对应的数据仓库中，并为其余模块提供数据支持；

智能推荐模块，智能推荐模块利用推荐引擎对数据中台使用者的多种历史数据进行计算，生成针对于数据中台使用者的多种推荐列表；

智能预测模块，智能预测模块利用智能预测引擎对数据中台使用者的销售需求、采购需求、退货量进行预测；

结果展示模块，结果展示模块用于将数据中台中计算结果进行可视化展示；

结果输出模块，结果输出模块用于对外界系统暴露接口，且数据中台使用者可以通过结果输出模块将数据中台的计算结果进行输出。

进一步的，数据获取模块包括：

数据拉取单元，数据拉取单元用于从数据中台使用者原始数据所在系统获取数据，通过获得数据中台使用者的允许在其允许的时间范围内，拉取其指定数据集；

数据上传单元，数据上传单元用于为数据中台使用者提供数据上传接口，数据上传单元支持数据中台使用者将原始数据以多种有效文件形式进行上传；

数据清洗单元，数据清洗单元用于将数据中台使用者提供的原始数据进行清洗，将原始数据中涉密、冗余、错误数据进行多种清洗操作，保留满足数据质量要求的数据。

进一步的，数据控制模块包括：

数据存储单元，数据存储单元用于将数据获取模块中清洗后的数据、智能推荐模块生成的结果数据、智能预测模块生成的结果数据存储到数据仓库；

数据提供单元，数据提供单元用于为智能推荐模块、智能预测模块、结果展示模块、结果输出模块提供数据支持。

进一步的，智能推荐模块包括：

商品推荐单元，商品推荐单元用于挖掘适合数据中台使用者销售的商品列表，根据智能商品推荐引擎为数据中台使用者提供不同粒度的推荐结果；

采购推荐单元，采购推荐单元用于根据商品推荐单元推荐的结果、库存数据、商品销量预测结果，计算出所需采购结果；

商品关联识别单元，商品关联识别单元用于识别不同商品之间的关联程度。

进一步的，智能预测模块包括：

需求预测单元，需求预测单元用于根据数据中台使用者的身份给出不同粒度的需求预测结果；

销量预测单元，销量预测单元用于为数据中台使用者提供不同商品在不同销售周期内的销量情况，以及为数据中台使用者提供其不同销售渠道不同商品的销量预测；

通过上述各种模块和单元建立了一整套完整的蕴含多种人工智能算法的智能供应链数据中台操作流水线，将供应链中丰富的海量的数据充分的利用起来。

进一步的，数据中台内包括以下操作步骤：

S100：数据获取模块根据数据中台使用者设定的时间，每天定时从数据中台使用者所使用的信息系统获取数据中台使用者指定的权限范围内的全部原始数据，并将获取到的原始数据进行数据清洗，得到新的数据；

S200：数据控制模块将新的数据分类型存放保存到数据中台使用者专属的数据仓库中，并通过权限控制保持该数据仓库的私密性，除了该数据中台使用者和数据中台管理人员外，其它人员无法通过任何方法进行访问；

S300：数据控制模块保存好新的数据之后，通知智能预测模块将新的数据进行预测，保存预测结果；同时将新保存的数据中的中间数据保存在智能预测模块内私有的数据库；并将中间数据和自身的预测结果进行比较；

S400：通知智能推荐模块，智能推荐模块在收到数据控制模块传递来的新的数据之后，将新的数据保存在智能推荐模块私有的数据库中，并利用智能推荐引擎对历史数据在内的所有的数据进行计算，得到推荐结果；

S500：将步骤S400得到的推荐结果根据推荐权值进行综合排序，生成推荐产品列表。

进一步的，步骤S100中的数据清理包括：

从原始数据中提取中间数据；

将原始数据中的敏感信息用已设定好的代号代替，敏感信息由数据中台使用者自行定义；

对于原始数据中缺失的数据或者错误的数据，该数据为空；对于缺失的数据，选择抛弃改行或者将数据中台使用者提交所有的原始数据中的异常数据统计后，展示给数据中台使用者，让数据中台使用者重新填充或者选择抛弃；对于错误的数据，进行修复，修复包括对于错误的数据所在的数据列进行平均值的求取、对可推导的错误的数据进行数据的重新计算；

统一原始数据的格式，对于真实企业中存在同一SKU在不同时期名称不同或者命名不规范问题，通过即使获取最新SKU名称，建立新旧名称之间的关系，并将数据以最新或者原始的SKU命名规则命名；

通过清洗后的原始数据符合最新的命名规范和格式，不会存在异常的数据；确保每一数据都是准确的、无误的；通过清洗后的原始数据代表了该数据中台使用者最新时间段的数据；并同时确保了和历史数据的一致性，与此同时，数据清洗过程中获得的中间数据，也会方便其它模块进行数据处理时的使用。

进一步的，步骤S300将新保存的数据中的销售额数据、销量数据和所述智能预测模块自身的预测结果进行比较的过程中还包括以下步骤：

S301：将中间数据所包括的销售额数据、销量数据和所述智能预测模块自身的预测结果计算偏差率，公式如下：

其中，T为该时间真实销售值，P为该时间预测销售值；

S302：当偏差率的波动范围大于偏差阈值，智能预测模块会将预测模型重构；

S303：当偏差率的波动范围小于等于偏差阈值，使用已存在的模型文件，对预测模型进行新的预测；

上述方法通过计算偏差率来决定对模型是否重新构建，有利于根据偏差率的波动范围进行区分不同情况的处理，进而节省了在数据处理过程中不必要的时间；由于是利用了微服务架构的设计，不同的模块分布在不同的服务器上，这带来了远超于单机系统的扩展性，方便我们对数据中台某一模块进行升级的同时不会影响到其它模块，提高了数据中台使用者的体验感。

进一步的，步骤S400中的推荐算法包括以下步骤：

S401：首先根据数据中台使用者提供的销售数据，获得其对应销售商家的销售信息之间的相似度，相似度公式如下：

其中，N(u)代表销售商家u的销售产品的集合，N(v)代表销售商家v的销售产品的集合，Wuv表示销售商家u和销售商家v之间销售的相似程度；

S402：根据获得的Wuv，计算不同销售来源对统一推荐产品i的推荐权值；公式如下：

其中，p(u,i)表示销售商家u对于推荐产品i的推荐权值，S(u,k)表示与销售商家u相似度最高的K个销售商家的集合，r_vi表示销售商家v对销售产品i的销售次数或者销售总额；

通过上述推荐算法可以保证最终得到的推荐结果是最满足数据中台使用者需求的，并且也是最具有数据含义的结果。

进一步的，S500包括以下步骤：

S501：将步骤S400计算得到的推荐结果按照推荐权值从高到低进行排名；

S502：根据推荐权值进行推荐产品的选取，在选取过程中对所选定的推荐产品列表进行重复产品的排除，最终得到一个由推荐权值排名前k的不同推荐产品组成的推荐产品结果列表。

与现有技术相比，本发明所达到的有益效果是：本发明建立了一整套完整的蕴含多种人工智能算法的智能供应链数据中台操作流水线，将供应链中丰富的海量的数据充分的利用起来，同时由于人工智能算法预测的准确性，以及智能推荐引擎推荐的准确性，进而确保了对于数据中台使用者预测的准确度，进而使得数据中台使用者可以根据数据中台提供的数据决策，对现实采购，备货，库存，物流等供应链方面进行优化管理，同时对于数据中台使用者对应的供应商，可自动生成需求报表，该需求报表可有效地指导数据中台使用者对应的供应商采取更为合理的方式进行备货准备，精确的需求预测，降低了整条供应链的牛鞭效应；数据中台的涉及是利用了微服务架构的设计，不同的模块分布在不同的服务器上，这带来了远超于单机系统的扩展性，方便我们对数据中台某一模块进行升级的同时不会影响到其它模块，同时将不同的模块尤其是具有人工智能算法的模块放置在具有高性能GPU的计算机中，使得数据中台整体运算性能得以大幅度提高，进而突破了单机的运算能力的限制，提高了数据中台使用者的体验感。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是一种基于供应链背景下的智慧数据中台的案例架构图；

图2是一种基于供应链背景下的智慧数据中台操作实施例中清洗过后的源数据表结构示意图；

图3是一种基于供应链背景下的智慧数据中台操作实施例中清洗过后的源数据表结构示意图；

图4是一种基于供应链背景下的智慧数据中台操作实施例中的智能预测结果数据示意图；

图5是一种基于供应链背景下的智慧数据中台操作实施例中的智能推荐结果数据示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本文中使用术语“Spring Boot”，Spring Boot是由Pivotal团队提供的全新框架，其设计目的是用来简化新Spring应用的初始搭建以及开发过程。该框架使用了特定的方式来进行配置，从而使开发人员不再需要定义样板化的配置。Spring Boot框架中有两个非常重要的策略：开箱即用和约定优于配置。开箱即用，是指在开发过程中，通过在MAVEN项目的pom文件中添加相关依赖包，然后使用对应注解来代替繁琐的XML配置文件以管理对象的生命周期。这个特点使得开发人员摆脱了复杂的配置工作以及依赖的管理工作，更加专注于业务逻辑。约定优于配置，是一种由Spring Boot本身来配置目标结构，由开发者在结构中添加信息的软件设计范式。这一特点虽降低了部分灵活性，增加了BUG定位的复杂性，但减少了开发人员需要做出决定的数量，同时减少了大量的XML配置，并且可以将代码编译、测试和打包等工作自动化。

本文中使用术语“Spring Cloud”，Spring Cloud是建立在Spring Boot上为开发人员提供了用于快速构建分布式系统中某些常见框架的有序集合(例如，配置管理，服务发现，断路器，智能路由，微代理，控制总线)。分布式系统的协调产生了样板模式，并且使用Spring云开发人员可以快速支持实现这些模式的服务和应用程序。它们可以在任何分布式环境中正常工作，包括开发人员自己的笔记本电脑，裸机数据中心和受管理的平台，例如Cloud Foundry。

本文中使用术语“Zuul”，Zuul是Netflix的基于JVM的路由器和服务器端负载平衡器。Netflix将Zuul用于以下用途：认证方式，见解，压力测试，金丝雀测试，动态路由，服务迁移，减载，安全，静态响应处理，主动/主动流量管理，Zuul的规则引擎可使用几乎所有JVM语言编写规则和过滤器，并内置对Java和Groovy的支持。

本文中使用术语“Spring config”，Spring Config为分布式系统中的外部配置提供服务器和客户端支持。使用Config Server，在所有环境中管理应用程序的外部属性。服务器存储后端的默认实现使用git，因此它轻松支持标签版本的配置环境，以及可以访问用于管理内容的各种工具。可以轻松添加替代实现，并使用Spring配置将其插入。

本文中使用术语“数据库”，数据库是存放数据的仓库。但是数据库并不是随意地将数据进行存放，是有一定的规则的。所谓的分布式数据库技术，就是结合了数据库技术与分布式技术的一种结合。具体指的是把那些在地理意义上分散开的各个数据库节点，但在计算机系统逻辑上又是属于同一个系统的数据结合起来的一种数据库技术。既有数据库间的协调性也有着数据的分布性。在分布式数据库里，数据冗杂是一种被需要的特性，这点和一般的集中式数据库系统不一样。第一点是为了提高局部的应用性而要在那些被需要的数据库节点复制数据。第二点是因为如果某个数据库节点出现系统错误，在修复好之前，可以通过操作其他的数据库节点里复制好的数据来让系统能够继续使用，提高系统的有效性。

本文中使用术语“RestTemplate”，RestTemplate是从Spring3.0开始支持的一个HTTP请求工具，它提供了常见的REST请求方案的模版；

例如GET请求、POST请求、PUT请求、DELETE请求以及一些通用的请求执行方法exchange以及execute。RestTemplate继承自InterceptingHttpAccessor并且实现了RestOperations接口，其中RestOperations接口定义了基本的RESTful操作，这些操作在RestTemplate中都得到了实现。

本文中使用术语“Eureka”，Eureka是Netflix开发的服务发现框架，本身是一个基于REST的服务，Spring Cloud将它集成在其子项目spring-cloud-netflix中，以实现Spring Cloud的服务发现功能。Eureka包含两个组件：Eureka Server和Eureka Client。Eureka Server提供服务注册服务，各个节点启动后，会在Eureka Server中进行注册，这样Eureka Server中的服务注册表中将会存储所有可用服务节点的信息，服务节点的信息可以在界面中直观的看到。Eureka Client是一个java客户端，用于简化与Eureka Server的交互，客户端同时也就是一个内置的、使用轮询(round-robin)负载算法的负载均衡器。Eureka通过心跳检查、客户端缓存等机制，确保了系统的高可用性、灵活性和可伸缩性。

本文中使用术语“Feign”，Feign是一种负载均衡的HTTP客户端,Feign集成了Ribbon。利用Ribbon维护了微服务的服务列表信息，并且通过轮询实现了客户端的负载均衡。Fegin是一个声明似的web服务客户端，它使得编写web服务客户端变得更加容易。它具有可插拔的注解支持包括Feign注解与JAX-RS注解，Feign还支持可插拔的编码器与解码器，但是在实际开发中，由于对服务依赖的调用可能不止一处，往往一个接口会被多处调用，所以通常都会针对每个微服务自行封装一些客户端类来包装这些依赖服务的调用。所以，Feign在此基础上做了进一步封装，由他来帮助我们定义和实现依赖服务接口的定义。

请参阅图1-图5，本发明提供技术方案：

一种基于供应链背景下的智慧数据中台，数据中台包括：

数据获取模块，数据获取模块用于从数据中台使用者中获取数据，对获取到的数据进行数据清洗，统一格式方便后续操作；

其中，数据获取模块包括：

数据拉取单元，数据拉取单元用于从数据中台使用者原始数据所在系统获取数据，通过获得使用者的允许在其允许的时间范围内，拉取其指定数据集；数据上传单元，数据上传单元用于为数据中台使用者提供数据上传接口，数据上传单元支持数据中台使用者将原始数据以多种有效文件形式进行上传；数据清洗单元，数据清洗单元用于将数据中台使用者提供的原始数据进行清洗，将原始数据中涉密、冗余、错误数据进行多种清洗操作，保留满足数据质量要求的数据；

其中，数据控制模块包括：

数据存储单元，数据存储单元用于将数据获取模块中清洗后的数据、智能推荐模块生成的结果数据、智能预测模块生成的结果数据存储到数据仓库，方便日后获取；数据提供单元，数据提供单元用于为智能推荐模块、智能预测模块、结果展示模块、结果输出模块提供数据支持；

智能推荐模块，智能推荐模块利用推荐引擎对数据中台使用者的多种历史数据进行计算，生成针对于使用者的多种推荐列表；

其中，智能推荐模块包括：

商品推荐单元，商品推荐单元用于挖掘适合使用者销售的商品列表，根据智能商品推荐引擎为使用者提供不同粒度的推荐结果；采购推荐单元，采购推荐单元用于根据商品推荐单元推荐的结果、库存数据、商品销量预测结果，计算出所需采购结果；商品关联识别单元，商品关联识别单元用于识别不同商品之间的关联程度；

其中，智能预测模块包括：

需求预测单元，需求预测单元用于根据数据中台使用者的身份给出不同粒度的需求预测结果；销量预测单元，销量预测单元用于为数据中台使用者提供不同商品在不同销售周期内的销量情况，以及为数据中台使用者提供其不同销售渠道不同商品的销量预测；

结果展示模块，结果展示模块用于将数据中台中计算结果进行可视化展示；结果展示模块是一个单独的web展示系统同时支持移动端，PC端等多端查看，用于将数据中台结果进行可视化展示，同时数据中台使用者可通过结果展示模块的数据上传按钮，将每日新产生的数据进行手动上传。同时结果展示模块通过数据控制模块获取到最新的预测结果和推荐结果。

其中对于预测结果可以通过多种图表形式进行展示，方便数据中台使用者自由的选择对不同商品、不同级别、不同时间段的需求预测情况、历史销售情况、历史需求预测、销售情况的偏差进行观察的形式。

其中对于推荐结果的展示，对于商品关联程度，按照商品关联程度的大小逆序排列展示；对于推荐商品以列表形式展示；对于采购推荐结果，针对于每条具有多种供应商的采购商品，会提供数据中台使用者选择的机会，让数据中台使用者可根据企业决策进行重新选择该采购的供应商，同时也提供采购订单的分解，即同一采购信息可划分为不同的数量进而分给不同的供应商；对于采购推荐结果，数据中台使用者可以再确定采购信息和选择供应商无误之后以报表的形式导出，该报表格式可在数据中台构建之前进行设定；所述结果输出模块用于对外界系统暴露接口，数据中台使用者可以通过结果输出模块将数据中台计算结果导入数据中台使用者企业所使用的信息系统。

其中所选用的开发框架和技术有：Spring Boot用于开发每个微服务也就是上述包括数据获取模块、数据控制模块、智能推荐模块、智能预测模块、结果展示模块、结果输出模块，Spring Cloud用于开发微服务整体架构，Zuul是微服务对应的网关，Eureka用于微服务的服务注册于发现，Feign用于负载均衡，利用Spring Config对配置进行管理，利用分布式数据库技术对数据进行存储。以上框架和技术应当随着具体实施行为可以随意替换，不仅仅局限于上述框架和技术。

数据中台内包括以下操作步骤：

步骤S100：

数据获取模块主要用于从数据中台使用者中获取数据，对获取到的数据进行数据清洗，统一格式方便后续操作；所述数据控制模块用于将清洗后的数据保存到数据中台使用者对应的数据仓库中，并为其余模块提供数据支持；所述智能推荐模块利用推荐引擎对数据中台使用者的多种历史数据进行计算，生成针对于使用者的多种推荐列表；所述智能预测模块利用智能预测引擎对数据中台使用者的销售需求，采购需求，退货量进行预测。所述结果展示模块用于将数据中台中计算结果进行可视化展示；所述结果输出模块用于对外界系统暴露接口，数据中台使用者可以通过结果输出模块将数据中台计算结果进行输出。

通过数据获取单元可以获得数据中台使用者的多种原始数据，数据获取单元提供多种方式获取数据中台使用者原始数据，数据中台使用者可以将企业中原始数据以多种形式导出通过数据中台提供的前端web页面进行文件上传；数据中台使用者也可以对数据中台提供获取数据得接口，数据中台会根据数据中台使用者设定的时间，每天定时从数据中台使用者所使用的信息系统获取数据中台使用者指定的权限范围内的全部原始数据；数据中台使用者同时也可以使自己企业所在的信息系统主动适配数据中台对外暴露的接口，通过在数据中台使用者所在的信息系统设置定时任务，定时将原始数据提交给数据中台；当数据获取单元获取到原始数据后，会对原始数据进行清洗；

数据清理包括：

从原始数据中提取中间数据；例如将只含有门店销售单据的数据，推导出该门店每日每件商品的总销售额，销售量，以及门店每日的总销售额，销售量等中间数据；

对于原始数据中缺失的数据或者错误的数据，该数据为空；对于缺失的数据，选择抛弃改行或者将数据中台使用者提交所有的原始数据中的异常数据统计后，展示给数据中台使用者，让数据中台使用者重新填充或者选择抛弃；对于错误的数据，例如销量应当是数值，结果传入的是非数值类型数据，进行修复；修复包括对于错误的数据所在的数据列进行平均值的求取、对可推导的错误的数据进行数据的重新计算；

步骤S200-S300:

数据控制模块会将数据收集模块提供的清洗后的数据保存到使用者专属的数据仓库中，并通过权限控制保持该数据仓库的私密性，除了该使用者和数据中台管理人员外，其它人员无法通过任何方法进行访问。

所述数据控制模块会将保存的数据按照类型存放，具体数据表结构参见图2与图3，具体为：销售数据，包括商品名称或代号，门店编号，销售量，销售额；商品数据，包括商品名称或代号，商品价格，商品种类，商品原料；供应商信息，包括供应商名称或代号，供应原料名称，供应能力，供应等级，供应价格；库存数据，包括库存编号，商品名称或代号，库存数量；门店或销售点数据，包括门店编号，门店名称；

对于图2中的数据表之间的关系，其中店铺信息表，可被替代为数据中台使用者所拥有的具有销售能力的部门信息；对于员工表则存储员工相关信息，同时员工表与所属店铺是通过所属店铺相关联的，对与该关联关系是随着数据中台使用者提供的部门信息而改变；对于供应商信息表，则会存储供应商基本信息与供应商在数据中台使用者所属企业的评级。对于商品分类表，存储商品分类信息。商品信息表则会存储商品分类信息，同时商品分类信息会与商品信息表相关。对于供应商商品表则会存储供应商和商品之间的关联。对于店铺库存表，保存着店铺中库存信息与商品信息表，店铺信息表相关联。对于销售信息表，存储了每一单销售记录。对于进货表，退货表，调货表这三张表会存储采购的相关信息。对于上述数据表，数据表结构，以及数据表之间的关系，会随着具体的实施案例，具体的数据中台使用者所在企业的不同而变化，例如：若使用者是制造商，那么应当加入商品和商品原料关系表等多种表格。

如此多种海量信息数据可以利用分布式数据库技术均匀的分布至各个计算机上进行存储，避免单点故障的发生，利用这种分布式数据存储技术突破了单机内存容量和计算能力的限制，加快了海量数据下的数据存取和运算能力。

上述数据控制模块保存好数据之后，会首先通知智能预测模块对新保存的数据包括且不限于图3中所示数据，与图2中商品信息、员工信息、店铺信息等数据进行计算，同时将智能预测模块的计算结果进行保存，紧接着会通知智能推荐模块，使其对新保存的数据以及智能预测模块的计算结果进行计算，同时会将智能推荐模块的计算结果进行保存，方便结果展示模块，进行展示，或者是结果输出模块进行结果输出；

智能预测模块将中间数据所包括的销售额数据、销量数据和所述智能预测模块自身的预测结果计算偏差率，公式如下：

其中，T为该时间真实销售值，P为该时间预测销售值；

当E的波动范围超过5％时，智能预测模块会将模型重构，对于E的波动范围在5％之内时，我们会使用已存在的模型文件，对该类型数据进行新的预测，而非重新计算模型，进而节省时间。

当智能预测模块需要更新模型时，也就代表该时间预测地销售情况已经偏差真实销售情况的5％以上，这时，智能预测模块对应的预测将从本地数据库中取出对应的历史数据包括且不限于某个商品/某个门店/某个分部的销售额/销售量/退货量/退货额等，对该数据进行模型的重新构建。

当智能预测模块计算出预测结果后，会将其保存在本地数据库，对于智能预测模块存储的结果数据表结构如图4所示。同时等所有预测任务都完成之后，会将所有结果传送给数据控制模块，并保存在分布式数据仓库，进而确保结果数据集的正常存储，虽然会引入部分冗余，但是相较于数据传送耗费的计算机资源来说，引入部分数据冗余是十分廉价和合适的。

步骤S400-S500：

智能推荐模块在收到最新数据控制模块传递来的数据之后，智能推荐模块会将最新数据保存在该模块私有的数据库中，并利用智能推荐引擎对历史数据在内的所有的数据进行计算，得到推荐结果，并将推荐结果保存至本地，这里展示一种推荐算法的具体计算步骤如下：

首先根据数据中台使用者提供的销售数据，获得其对应分销商/门店/分部的销售信息之间的相似度。其中相似度计算公式如下：

上述公式中，N(u)代表分销商u/门店u/分部u销售产品的集合，N(v)代表分销商v/门店v/分部v销售产品的集合，Wuv表示分销商u,v/门店u,v/分部u,v之间销售的相似程度。

紧接着根据获得的Wuv，可以获得对分销商u/门店u/分部u推荐产品i的推荐权值，具体公式如下：

其中p(u,i)表示分销商u/门店u/分部u对于推荐产品i的推荐权值，S(u,k)表示与分销商u/门店u/分部u相似度最高的K个分销商/门店/分部的集合，Wuv表示分销商u,v/门店u,v/分部u,v之间销售的相似程度,rvi表示分销商v/门店v/分部v销售产品i的销售次数/销售总额。

进而根据推荐权值进行排序，得到分销商u/门店u/分部u的推荐产品列表，此处所述计算步骤仅为有限业务场景中适用的推荐步骤，其中具体推荐算法的实现以及推荐引擎的构建需要根据所数据中台使用者的具体业务场景做对应的调整。

本专利所述智能推荐引擎，会根据除上述推荐算法之外的多种推荐算法进行计算，进而得到多个推荐结果，根据一种定制规则：选取每个推荐结果排名前十的推荐产品，并排除重复产品，最终可获得智能推荐产品结果列表。利用预测引擎模块获得的对应商品的需求量以及目前该主体库存量，得到该主体需要采购的数量，同时从供应商数据中选取根据供应能力于供应价格之比最大的供应商编号，该数值之比也就确保了选择的是供应性价比最高的供应商，同时智能供应商选择引擎中也嵌入了更多约束条件，例如供应商供应周期，供应商信用信息等多种条件，确保选择的供应商是最为合适的。

接下来智能推荐模块会将推荐结果保存至本地，当所有的推荐任务都完成之后，会将所有结果数据传送给数据控制模块，进而保存在分布式数据仓库，通过引入数据的部分冗余来降低数据传送消耗的计算机资；

智能推荐模块存储的结果数据表结构具体为：商品推荐结果数据，包括主体编号、推荐商品编号；商品关联结果数据，包括商品编号1、商品编号2、商品关联程度；采购推荐数据，包括商品编号、需采购数量、推荐供应商编号。

对于智能推荐模块产生的采购推荐结果并非不可更改，在结果展示模块中，数据中台使用者可以根据自己的决策，从所有具有该商品的供应商列表中选择符合人工决策的供应商。

当所有的推荐任务都完成之后，会将所有结果数据传送给数据控制模块，进而保存在分布式数据仓库，通过引入数据的部分冗余来降低数据传送消耗的计算机资源。

对于智能推荐模块的推荐引擎得到的推荐结果的数据表结构如图5所示，根据每个推荐结果的推荐置信度进行综合排序，同时利用预测引擎模块获得的对应商品的需求量以及目前该主体库存量，得到该主体需要采购的数量。同时从供应商数据中选取根据供应能力于供应价格之比最大的供应商编号，该数值之比也就确保了选择的是供应性价比最高的供应商，同时智能供应商选择引擎中也嵌入了更多约束条件，例如供应商供应周期，供应商信用信息等多种条件，确保选择的供应商是最为合适的。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于供应链背景下的智慧数据中台，其特征在于，所述智慧数据中台包括：

数据获取模块，所述数据获取模块用于从数据中台使用者中获取数据，对获取到的数据进行数据清洗；

数据控制模块，所述数据控制模块用于将清洗后的数据保存到数据中台使用者对应的数据仓库中，并为其余模块提供数据支持；

智能推荐模块，所述智能推荐模块利用推荐引擎对数据中台使用者的多种历史数据进行计算，生成针对于数据中台使用者的多种推荐列表；

智能预测模块，所述智能预测模块利用智能预测引擎对数据中台使用者的销售需求、采购需求、退货量进行预测；

结果展示模块，所述结果展示模块用于将数据中台中计算结果进行可视化展示；

结果输出模块，所述结果输出模块用于对外界系统暴露接口，且数据中台使用者可以通过结果输出模块将数据中台的计算结果进行输出。

2.根据权利要求1所述的一种基于供应链背景下的智慧数据中台，其特征在于，所述数据获取模块包括：

数据拉取单元，所述数据拉取单元用于从数据中台使用者原始数据所在系统获取数据，通过获得使用者的允许在其允许的时间范围内，拉取其指定数据集；

数据上传单元，所述数据上传单元用于为数据中台使用者提供数据上传接口，所述数据上传单元支持数据中台使用者将原始数据以多种有效文件形式进行上传；

数据清洗单元，所述数据清洗单元用于将数据中台使用者提供的原始数据进行清洗，将原始数据中涉密、冗余、错误数据进行多种清洗操作，保留满足数据质量要求的数据。

3.根据权利要求1所述的一种基于供应链背景下的智慧数据中台，其特征在于，所述数据控制模块包括：

数据存储单元，所述数据存储单元用于将所述数据获取模块中清洗后的数据、所述智能推荐模块生成的结果数据、所述智能预测模块生成的结果数据存储到数据仓库；

数据提供单元，所述数据提供单元用于为所述智能推荐模块、智能预测模块、结果展示模块、结果输出模块提供数据支持。

4.根据权利要求1所述的一种基于供应链背景下的智慧数据中台，其特征在于，所述智能推荐模块包括：

商品推荐单元，所述商品推荐单元用于挖掘适合数据中台使用者销售的商品列表，根据智能商品推荐引擎为数据中台使用者提供不同粒度的推荐结果；

采购推荐单元，所述采购推荐单元用于根据所述商品推荐单元推荐的结果、库存数据、商品销量预测结果，计算出所需采购结果；

商品关联识别单元，所述商品关联识别单元用于识别不同商品之间的关联程度。

5.根据权利要求1所述的一种基于供应链背景下的智慧数据中台，其特征在于，所述智能预测模块包括：

需求预测单元，所述需求预测单元用于根据数据中台使用者的身份给出不同粒度的需求预测结果；

销量预测单元，所述销量预测单元用于为数据中台使用者提供不同商品在不同销售周期内的销量情况，以及为数据中台使用者提供在不同销售渠道下对不同商品的销量预测。

6.根据权利要求1所述的一种基于供应链背景下的智慧数据中台，其特征在于，所述数据中台内包括以下操作步骤：

S100：所述数据获取模块根据数据中台使用者设定的时间，每天定时从数据中台使用者所使用的信息系统获取数据中台使用者指定的权限范围内的全部原始数据，并将获取到的原始数据进行数据清洗，得到新的数据；

S200：所述数据控制模块将所述新的数据分类型存放保存到使用者专属的数据仓库中，并通过权限控制保持该所述数据仓库的私密性，除了该使用者和数据中台管理人员外，其它人员无法通过任何方法进行访问；

S300：所述数据控制模块保存好新的数据之后，通知所述智能预测模块将新的数据进行预测，保存预测结果；同时将所述新保存的数据中的中间数据保存在所述智能预测模块内私有的数据库；并将所述中间数据和所述智能预测模块自身的预测结果进行比较；

S400：通知所述智能推荐模块，所述智能推荐模块在收到所述数据控制模块传递来新的数据之后将新的数据保存在所述智能推荐模块私有的数据库中，并利用智能推荐引擎对历史数据在内的所有数据进行计算，得到推荐结果；

7.根据权利要求6所述的一种基于供应链背景下的智慧数据中台，其特征在，所述步骤S100中的数据清理包括：

从原始数据中提取中间数据；

将原始数据中的敏感信息用已设定好的代号代替，所述敏感信息由数据中台使用者自行定义；

对于原始数据中缺失的数据或者错误的数据，该数据为空；对于所述缺失的数据，选择抛弃改行或者将数据中台使用者提交所有的原始数据中的异常数据统计后，展示给数据中台使用者，让数据中台使用者重新填充或者选择抛弃；对于所述错误的数据，进行修复，所述修复包括对于所述错误的数据所在的数据列进行平均值的求取、对可推导的所述错误的数据进行数据的重新计算；

统一原始数据的格式，对于真实企业中存在同一SKU在不同时期名称不同或者命名不规范问题，通过即使获取最新SKU名称，建立新旧名称之间的关系，并将数据以最新或者原始的SKU命名规则命名。

8.根据权利要求6所述的一种基于供应链背景下的智慧数据中台，其特征在于，所述步骤S300将所述新保存的数据中的销售额数据、销量数据和所述智能预测模块自身的预测结果进行比较的过程中还包括以下步骤：

S301：将所述中间数据所包括的销售额数据、销量数据和所述智能预测模块自身的预测结果计算偏差率，公式如下：

其中，T为该时间真实销售值，P为该时间预测销售值；

S303：当偏差率的波动范围小于等于偏差阈值，使用已存在的模型文件，对预测模型进行新的预测。

9.根据权利要求6所述的一种基于供应链背景下的智慧数据中台，其特征在于，所述步骤S400中的推荐算法包括以下步骤：

其中，p(u,i)表示销售商家u对于推荐产品i的推荐权值，S(u,k)表示与销售商家u相似度最高的K个销售商家的集合，r_vi表示销售商家v对销售产品i的销售次数或者销售总额。

10.根据权利要求6所述的一种基于供应链背景下的智慧数据中台，其特征在于，所述S500包括以下步骤：

S502：根据所述推荐权值进行推荐产品的选取，在选取过程中对所选定的推荐产品列表进行重复产品的排除，最终得到一个由推荐权值排名前k的不同推荐产品组成的推荐产品结果列表。