CN113298552A - 数据处理方法、服务器及存储介质 - Google Patents

数据处理方法、服务器及存储介质 Download PDF

Info

Publication number
CN113298552A
CN113298552A CN202011402216.2A CN202011402216A CN113298552A CN 113298552 A CN113298552 A CN 113298552A CN 202011402216 A CN202011402216 A CN 202011402216A CN 113298552 A CN113298552 A CN 113298552A
Authority
CN
China
Prior art keywords
network
network object
commodity
behavior data
operation behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011402216.2A
Other languages
English (en)
Inventor
张晨宇
王林
王桐
陈坤金
邓玉明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN202011402216.2A priority Critical patent/CN113298552A/zh
Publication of CN113298552A publication Critical patent/CN113298552A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种数据处理方法、服务器及存储介质。针对任一网络对象,可以获取用户对该网络对象执行网络操作所产生的网络操作行为数据,以及从网络操作行为数据中提取该网络对象以及与该网络对象存在替代关系的其它网络对象之间的关联信息,基于这些关联信息预测该网络对象在一定时间内产生的网络流量。在该预测过程中,考虑到了网络对象之间的可替代性,有利于提升预测结果的准确性,并且,该预测结果可作为提供商进行网络对象调度以及资源分配等相关操作的依据,为提供商的后续操作提供了数据基础,有利于提高用户对该网络对象及提供商的黏性,减少用户流失。

Description

数据处理方法、服务器及存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及一种数据处理方法、服务器及存储介质。
背景技术
随着电商行业的发展以及快节奏的生活方式,网络购物的受众群体越来越广泛。用户通过电商平台下单,电商平台收到用户订单后,就近选择有货的仓库,通知该仓库为用户安排发货,这样用户足不出户即可买到自己所需的商品,极大地方便了用户。
从商家或电商平台的角度来看,很有必要对商品销量进行预测,因为准确的销量预测可帮助商家及时补货,从而减少因缺货或无法及时发货带来的用户流失,改善用户购物体验,或者帮助商家减少因为商品销量不准确而滞销带来的库存管理成本。
在现有技术中,通常是基于商品的历史销量来预测商品的未来销量,这种方式比较简单,但预测结果的准确度不高。
发明内容
本申请的多个方面提供一种数据处理方法、服务器及存储介质,用以提高商品未来销量预测的准确性,进而提高商品的用户黏性,减少用户流失,降低商家的管理成本。
本申请实施例提供了一种数据处理方法,包括:获取用户产生的与第一网络对象关联的网络操作行为数据;从所述网络操作行为数据中,提取与所述第一网络对象存在可替代关系的第二网络对象与所述第一网络对象的关联关系;根据所述第二网络对象与所述第一网络对象的关联关系以及所述第一网络对象在至少一个维度上的属性信息,预测所述第一网络对象在一定时间内产生的网络流量。
本申请实施例还提供了一种商品销量预测方法,包括:获取用户产生的与第一商品关联的网络操作行为数据;从所述网络操作行为数据中,提取与所述第一商品存在可替代关系的第二商品与所述第一商品的关联关系;根据所述第二商品与所述第一商品的关联关系以及所述第一商品在至少一个维度上的属性信息,预测所述第一商品的未来销量;输出所述未来销量至所述目标商品的提供商,以供所述提供商根据所述未来销量执行与所述目标商品相关的操作。
本申请实施例还提供了一种仓储调度方法,包括:获取用户产生的与第一商品关联的网络操作行为数据;从所述网络操作行为数据中,提取与所述第一商品存在可替代关系的第二商品与所述第一商品的关联关系;根据所述第二商品与所述第一商品的关联关系以及所述第一商品在至少一个维度上的属性信息,预测所述第一商品的未来销量;根据第一商品的未来销量,预先在多个仓库之间进行第一商品的调度。
本申请实施例还提供了一种仓库资源配置方法,包括:获取用户产生的与第一商品关联的网络操作行为数据;从所述网络操作行为数据中,提取与所述第一商品存在可替代关系的多个商品与所述第一商品的关联关系;根据所述多个商品与所述第一商品的关联关系以及所述第一商品在至少一个维度上的属性信息,预测所述第一商品的未来销量;根据的第一商品的未来销量,对仓库中的拣货资源在地商品与其他商品之间进行动态配置。
本申请实施例还提供了一种数据处理服务器,包括:处理器以及存储有计算机程序的存储器;所述处理器,用于执行所述计算机程序,以用于:获取用户产生的与第一网络对象关联的网络操作行为数据;从所述网络操作行为数据中,提取与所述第一网络对象存在可替代关系的第二网络对象与所述第一网络对象的关联关系;根据所述第二网络对象与所述第一网络对象的关联关系以及所述第一网络对象在至少一个维度上的属性信息,预测所述第一网络对象在一定时间内产生的网络流量。
本申请实施例还提供了一种存储有计算机程序的计算机可读存储介质,当所述计算机程序被处理器执行时,致使所述处理器实现本申请实施例方法中的步骤。
在本申请实施例中,针对任一网络对象,可以获取用户对该网络对象执行网络操作行为所产生的网络操作行为数据,以及从网络操作行为数据中提取该网络对象以及与该网络对象存在替代关系的其它网络对象之间的关联信息,基于这些关联信息预测该网络对象在一定时间内产生的网络流量。在该预测过程中,考虑到了网络对象之间的可替代性,有利于提升预测结果的准确性,并且,该预测结果可作为提供商进行网络对象调度以及资源分配等相关操作的依据,为提供商的后续操作提供了数据基础,有利于提高用户对该网络对象及提供商的黏性,减少用户流失,降低商家的管理成本。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种数据处理系统的结构示意图;
图2为本申请实施例提供的一种数据处理方法的流程图;
图3a为本申请实施例提供的一种数据处理结果的示意图;
图3b为本申请实施例提供的一种商品销量预测方法的流程图;
图4为本申请实施例提供的一种数据处理服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种数据处理方法,该方法可以结合存在可替代关系的网络对象之间的关联关系,预测网络对象在一定时间内产生的网络流量,并将预测到的网络对象在一定时间内产生的网络流量提供给提供商,可作为提供商进行网络对象调度以及资源分配等相关操作的依据,为提供商的后续操作提供了数据基础,有利于提高用户对该网络对象及提供商的黏性,减少用户流失,降低商家的管理成本。其中,提供商是指可以面向用户提供网络对象的一方,例如可以是网络对象的直接提供商,例如商家,也可以是中间提供商,例如各电商平台。根据应用场景的不同,网络对象、网络对象之间的关联关系、提供商以及提供商所执行的后续操作均会有所不同,可参见下述实施例中的示例性说明。该数据处理方法可应用于下述数据处理系统,但不限于此。
图1为应用本申请实施例数据处理方法的一种数据处理系统的结构示意图。如图1所示,数据处理系统100包括:数据处理服务器10、提供商服务器20以及多个终端设备30。
如图1中①所示,提供商服务器20可向终端设备30提供网络对象。其中,提供商服务器20可以将网络对象发布到与其对应的客户端、APP或网页上。终端设备30通过运行客户端、APP或网页,将网络对象提供给用户。可选地,提供商服务器20可以是电商领域中的电商服务器,相应地,网络对象可以是电商领域中的商品或服务。或者,提供商服务器20可以是音视频领域中的音视频服务器,相应地,网络对象可以是音视频领域中的影视剧或歌曲等音视频内容。或者,提供商服务器20可以是软件领域中的软件开发平台,相应地,网络对象可以是软件开发平台提供的各种应用软件。
进一步,如图1中②所示,用户可通过终端设备30对网络对象发起各种网络操作,根据网络对象的不同,用户对网络对象发起的网络操作也会不同。以网络对象是电商领域中的商品为例,则用户通过终端设备30上运行的购物类APP或购物网站,可以浏览商品,将喜欢的商品加购物车,收藏喜欢的商品,以及下单购买商品,还可以对购买的商品发表评论等等,即用户的网络操作可以是浏览、添加购物车、收藏、下单以及评论等操作。以网络对象是音视频领域中的音视频内容为例,则用户通过终端设备30上运行的音视频播放APP或音视频网站,可以浏览、播放、缓存或者下载音视频内容,还可以针对音视频内容发表弹幕、评论等,即用户的网络操作可以是浏览、播放、缓存或下载以及发弹幕和评论等操作。以网络对象是应用软件为例,则用户通过终端设备30上运行的应用商城或下载网站,可以浏览、搜索以及下载各种应用软件,即用户的网络操作可以是浏览、搜索以及下载等操作。
在用户执行网络操作过程中,终端设备30可响应用户的网络操作,一方面与提供商服务器20配合执行与用户网络操作相关的操作,另一方面还可通过日志方式记录用户的网络操作行为数据。其中,用户的网络操作行为数据包括用户发起网络操作的时间、标识用户所发起的网络操作是什么的标识信息以及网络操作涉及的网络对象的标识信息等。进一步,如图1中③所示,终端设备30还可将用户产生的网络操作行为数据发送至提供商服务器20。进而,如图1中④所示,提供商服务器20可将网络操作行为数据发送至数据处理服务器10。可选地,终端设备30也可以直接将网络操作行为数据发送至数据处理服务器10。其中,网络操作行为数据可以是用户在一定历史时间段内产生的网络操作行为数据,例如可以是用户在最近一个月或三个月内产生的网络操作行为数据,也可以是用户在最近一周或两周内产生的网络操作行为数据,还可以是用户在某个或某几个历史活动期间产生的网络操作行为数据,还可以是用户在指定时间段,如3月10日-6月10日内产生的网络操作行为数据。其中,历史时间段的选择,可根据应用需求灵活而定,对此不做限定。
数据处理服务器10可以接收终端设备30或提供商服务器20提供的网络操作行为数据。之后,如图1中⑤所示,数据处理服务器10可以根据网络操作行为数据中包含的存在替代关系的网络对象之间的关联关系,预测相关网络对象在一定时间内产生的网络流量。其中,这里的“一定时间”可以是当前时刻,也可以是未来时段,例如自当前时刻开始的一小时、自当前时刻开始的一天、自当前时刻开始的30分钟,还可以是下一小时、第二天、下一周、下个月、或者未来某个起始时间-未来某个结束时间之间的时间段等等。如果预测的是网络对象在当前时刻产生的网络流量,可简称为当前网络流量;如果预测的是网络对象在未来时段产生的网络流量,可简称为未来网络流量。在图1中,以预测网络对象的未来网络流量为例进行图示。进一步,如图1中⑥所示,数据处理服务器10可将预测到的网络对象在一定时间内产生的网络流量(如未来网络流量)提供给提供商服务器20,以供提供商服务器20根据网络对象在一定时间内产生的网络流量(如未来网络流量)执行其它操作。可选地,在预测网络对象产生的未来网络流量的情况下,上述历史时间段的选择,也可以与未来时段相关,例如如果希望预测网络对象在未来1个月内产生的网络流量,则可以选择历史时期中同月份内的网络操作行为数据。其中,网络对象的未来网络流量是指网络对象在未来一段时间内产生的网络流量。
在本申请实施例中,根据网络对象的不同,网络对象的未来网络流量的含义也会不同,对应地,提供商服务器20根据网络对象在一定时间内产生的网络流量(如未来网络流量)所执行的后续操作也会不同。例如,在预测网络对象产生的未来网络流量的情况下,若网络对象是电商领域的商品,则网络对象的未来网络流量可以是商品的未来销量,可选地,提供商服务器20可根据商品的未来销量对商品的拣货资源或商品的库存等进行合理调配;若网络对象是音视频平台的影视剧,则网络对象的未来网络流量可以是影视剧的未来点击量,可选地,提供商服务器20可根据影视剧的未来点击量对不同类型的影视剧进行上架或下架的调整。在图1中以网络对象是商品为例,则如图1中⑦所示,提供商服务器20可根据商品的未来销量对商品的拣货人员以及仓库中的商品数量进行合理调度,以满足商品的供需需求。
可选地,如图1中⑧所示,本实施例的系统还可以包括其它服务器40,数据处理服务器10还可将网络对象在一定时间内产生的网络流量(如未来网络流量)提供给其他服务器40,以供其他商服务器40根据网络对象在一定时间内产生的网络流量(如未来网络流量)执行相关操作,其他服务器40可以是基于网络对象在一定时间内产生的网络流量(如未来网络流量)执行其他数据处理的下游服务器,具体实现形态与功能不做限定。
下面结合图2所示方法实施例,对数据处理服务器10预测网络对象在一定时间内产生的网络流量(如未来网络流量)的过程进行详细说明。
图2为本申请实施例数据处理方法的流程图,如图2所示,方法包括:
S1、获取用户产生的与第一网络对象关联的网络操作行为数据。
S2、从网络操作行为数据中,提取与第一网络对象存在可替代关系的第二网络对象与第一网络对象的关联关系。
S3、根据第二网络对象与第一网络对象的关联关系以及第一网络对象在至少一个维度上的属性信息,预测第一网络对象在一定时间内产生的网络流量。
可选地,如图2所示,该方法在步骤S3之后,还包括:
S4、输出第一网络对象未来网络流量至第一网络对象的提供商,以供该提供商根据该未来网络流量执行与第一网络对象相关的操作。
在本申请实施例中,将需要为其预测网络流量的网络对象称为第一网络对象。用户在终端设备对第一网络对象执行网络操作行为时,终端设备可响应用户对第一网络对象执行网络操作的动作,并根据网络操作类型的不同以日志方式记录用户所产生的网络操作行为数据,以及将网络操作行为数据直接或者经提供商服务器提供给数据处理设备。其中,网络操作行为数据可以包括网络对象的标识、网络操作的类型以及操作时间等信息,根据第一网络对象的不同以及网络操作类型的不同,网络操作行为数据还可以包括其它一些数据。例如,以第一网络对象是商品为例,若用户执行的网络操作是对商品进行浏览,则对应的网络操作行为数据包括该商品的名称、详情页地址、浏览时间以及浏览时长等;若用户执行的网络操作是对商品进行购买,则对应的网络操作行为数据包括该商品的购买数量、下单时间、收货人、联系方式以及收获地址、配送方式等信息。
在本实施例中,考虑到网络对象的类别繁多,且相同类别的网络对象存在相似性,用户在选择某个网络对象时,可能会对不同的网络对象进行比较筛选,也就是说,在获取到的网络操作行为数据对应的网络对象中,可能存在可以替换第一网络对象的其他网络对象,我们称之为第二网络对象。可选地,可以结合网络对象的类别以及属性信息,判断网络对象之间是否有可替代关系。如果两个网络对象的类别相同,且属性相同或相近,则可以确定两个网络对象之间存在可替代关系。例如,A品牌手机和B品牌手机存在可替代关系,或者厂家C的热水器与厂家D的热水器存在可替代关系。或者,可以结合网络对象的功能,判断网络对象之间是否有可替代关系。例如,羽绒服与棉服都具有防寒功能,两者之间存在可替代关系。关于两个网络对象之间是否具有可替代关系,可根据应用需求灵活定义。
如果用户选择第一网络对象,则第一网络对象会产生一定网络流量,但是,由于第二网络对象对第一网络对象具有可替换性,所以第二网络对象的存在对第一网络对象产生的网络流量有一定影响,有可能被第二网络对象分流一部分。鉴于此,在获取网络操作行为数据之后,可从获取到的网络操作行为数据中,识别出与第一网络对象存在可替代关系的第二网络对象,并提取第二网络对象与第一网络对象之间的关联关系;进而,根据第二网络对象与第一网络对象的关联关系以及第一网络对象在至少一个维度上的属性信息,预测第一网络对象的未来网络流量。其中,第一网络对象在至少一个维度上的属性信息与第一网络对象的未来网络流量具有关联性。
其中,第一网络对象在至少一个维度上的属性信息包括第一网络对象的基本属性信息,第一网络对象的历史序列信息以及第一网络对象的未来信息等几个维度上的属性信息。第一网络对象的历史序列信息可以是在历史时期内与第一网络对象产生网络流量相关的序列化信息。第一网络对象的未来信息是指在未来时段内存在的可能影响第一网络对象产生网络流量的相关信息。以第一网络对象是商品为例,其至少一个维度上的属性信息包括:商品的基本属性信息,商品的历史序列信息以及商品的未来信息。其中,商品的基本属性信息包括但不限于:商品的类别、规格、价格、产地等;商品的历史序列信息包括商品的历史销量、历史加购量、历史收藏量、历史浏览量等的至少一种;商品的未来信息包括:未来时段内与商品相关的商品活动信息,例如活动时间、商品预购量、用户浏览次数以及加购物车的数量等。
其中,第二网络对象与第一网络对象的关联关系表示第二网络对象对第一网络对象的影响程度,可通过用户对第二网络对象与第一网络对象所执行的网络操作是否相同或相近等信息来体现。例如,第一网络对象和第二网络对象分别为手机P1和手机P2,若用户同时将手机P1和手机P2添加到购物车中,或者,用户同时将手机P1和手机P2进行了收藏,这说明用户对这两款手机都比较中意,有可能从两者中选择一款购买。根据用户对手机P1和手机P2执行的加购物车或收藏操作,可以判断手机P1和手机P2具有可替代关系,手机P1的销量和手机P2的销量之间存在相互影响。
在一可选实施例中,在从网络操作行为数据中,提取与第一网络对象存在可替代关系的第二网络对象与第一网络对象的关联关系时,可以从网络操作行为数据中,提取由同一用户在设定时间范围内对第一网络对象和第二网络对象执行相同网络操作的次数,并根据该次数,在第一网络对象与第二网络对象之间建立关联关系。其中,设定时间范围可以根据网络对象以及网络操作的不同而不同,具体时长不做限定。例如,若第二网络对象与第一网络对象是类别相同且属性相同或相似的商品,对应的网络操作是添加购物车,则该设定时间范围可以是1小时、3小时、一天、三天或一周,在提取两个商品之间的关联关系时,可提取用户在1小时、3小时、一天内、三天内或一周内将两个商品均添加购物车的次数,该次数一定程度上可体现两个商品之间相互替代的可能性,次数越多,说明这两个商品之间相互替代的可能性越高,即两个商品之间的关联关系越强。又例如,若第二网络对象与第一网络对象是歌曲,对应的操作是播放各歌曲,则该设定时间范围可以是半小时或一小时,在提取两首歌曲之间的关联关系时,可提取用户在半小时或一小时内播放这两首歌曲的次数,该次数一定程度上可体现两首歌曲之间相互替代的可能性,次数越多,说明这两个商品之间相互替代的可能性越高,即两个商品之间的关联关系越强。
可选地,在从网络操作行为数据中,提取由同一用户在设定时间范围内对第一网络对象和第二网络对象执行相同网络操作的次数时,可以从网络操作行为数据中,识别出同一用户产生的各种网络操作类型下的网络操作行为数据,即先按照用户和网络操作的类型对网络操作行为数据进行分类;进一步,将同一用户产生的各种网络操作类型下的网络操作行为数据按照发生时间的先后顺序对涉及的网络对象进行排列,得到各种网络操作类型下的对象序列,即对每种类型的网络操作行为数据再按照发生时间对所涉及的网络对象进行排序。进而,基于各种网络操作类型下的对象序列,提取由同一用户在设定时间范围内对第一网络对象和第二网络对象执行相同网络操作的次数。以商品为例,用户可执行浏览、收藏、添加购物车、下单以及分享和评论等不同类型的网络操作;对应地,会产生浏览、收藏、添加购物车、下单以及分享和评论等不同网络操作类型下的网络操作行为数据。
在本申请实施例中,发生时间是指网络操作行为数据的生成时间,也是用户对网络对象执行网络操作的时间,因此,该时间的先后顺序可以反应用户对网络对象执行网络操作的先后顺序。针对同一用户产生的网络操作行为数据按照网络操作类型分类以及按照发生时间的先后顺序进行排序,可以确定同一用户执行了哪些网络操作以及所执行网络操作的顺序。进一步,若定义同类别且属性相同或相似的两个网络对象之间存在可替代关系,则还可以根据排序后得到的对象序列中各网络对象的类型、属性以及对应的发生时间可以判断出用户在设定时间范围内是否对存在替代关系的两个网络对象执行了相同的网络操作;进而针对存在替代关系的这两个网络对象,统计所有用户中对这两个网络对象在设定时间内执行了同一网络操作的次数。可选地,可以先根据网络对象的类型和属性识别出存在可替代关系的网络对象;进一步根据这两个网络对象对应的发生时间判断用户对这两个网络对象是否在设定时间范围内发起的相同网络操作。或者,可以先根据网络对象对应的发生时间识别出用户在设定时间范围内发起相同网络操作的网络对象;再根据网络对象的类型和属性判断这些网络对象之间是否存在可替代关系。
例如,以商品为例,在收到众多用户的网络操作行为数据之后,对每个用户的网络操作行为数据,根据网络操作的类型进行分类,例如将加购物车的行为数据划分为一类,将下单的行为数据划分为一类,将收藏商品的行为数据划分为一类,等等。进一步,对每一类网络操作行为数据,以加购物车的网络操作行为数据为例,按照加购物车的先后顺序将每次加购车的商品进行排序,得到加购物车的商品序列。假设某一用户先后加入购物车的商品为手机P1、手机P2、靴子、羽绒服以及儿童绘本等,且这些商品是在同一天被加入购物车的。其中,手机P1和手机P2属于同类别且属性相同或相近,属于具有替代关系的两个商品,且由于手机P1和手机P2被加入购物车的时间也在设定的时间范围内(如一天内),因此可以将手机P1和手机P2被加购物车的次数加1。与此类似,可以对其它用户的网络操作行为数据进行处理,并统计其它用户中在设定的时间范围内(如一天内)将手机P1和手机P2加购物车的次数,最终得到手机P1和手机P2在设定时间范围内被加购物车的最终次数。
在本申请一些实施例中,在根据第二网络对象与第一网络对象的关联关系以及第一网络对象在至少一个维度上的属性信息,预测第一网络对象在一定时间内产生的网络流量(如未来网络流量)时,可以根据第二网络对象与第一网络对象的关联关系和第一网络对象在至少一个维度上的属性信息,计算第一网络对象的一阶融合特征和二阶融合特征。进而,根据第一网络对象的一阶融合特征和二阶融合特征以及第一网络对象在至少一个维度上的属性信息,预测第一网络对象在一定时间内产生的网络流量(如未来网络流量)。其中,一阶融合特征是指在考虑与第一网络对象存在直接关联关系的第二网络对象对第一网络对象产生的影响后得到第一网络对象的特征信息,二阶融合特征是指在考虑与第一网络对象存在间接关联关系的第二网络对象对第一网络对象产生的影响后得到的第一网络对象的特征信息。例如,用户A在设定时间内将商品P和商品Q加入购物车,若商品P和商品Q存在可替代性,则商品P和商品Q具有直接关联关系,商品Q会影响商品P的销量,则计算商品P的特征时可以考虑商品Q的影响,从而得到商品P的一阶融合特征。又例如,若用户A在设定时间内将商品P和商品Q加入购物车,用户B在与用户A同一设定时间内将商品Q和商品U加入购物车;若商品P和商品Q存在可替代性且商品Q和商品U存在可替代性,一定程度上表示商品P和商品U之间具有间接关联关系,因此,商品U也会影响商品P的销量,则计算商品P的特征时还可以考虑商品U的影响,从而得到商品P的二阶融合特征。
在本申请一些可选实施例中,在计算第一网络对象的一阶融合特征和二阶融合特征之前,可对第二网络对象与第一网络对象的关联关系进行特征提取,得到第二网络对象与第一网络对象之间的关联关系特征;对第一网络对象在至少一个维度上的属性信息进行特征提取,得到第一网络对象的原始特征;根据关联关系特征和第一网络对象的原始特征,计算第一网络对象的一阶融合特征和二阶融合特征。相应地,在预测第一网络对象的未来网络流量时,包括:对第一网络对象的原始特征以及第一网络对象的一阶融合特征和二阶融合特征进行拼接,得到第一网络对象的整体特征;利用基于深度学习的流量预测算法对第一网络对象的整体特征进行预测,得到第一网络对象在一定时间内产生的网络流量(如未来网络流量)。
在实现形式上,不限定上述关联特征、原始特征以及一阶融合特征和二阶融合特征的表示方式,可选地,可以采用矩阵的方式来表示关联特征、原始特征以及一阶融合特征和二阶融合特征。基于此,在本申请可选实施例中,在建立第一网络对象与第二网络对象之间的关联关系时,可根据同一用户在设定时间内对第一网络对象和第二网络对象执行相同或相近的网络操作的次数,建立表示第一网络对象与第二网络对象的关联关系的有权图,其中,所述次数可以是第一网络对象与第二网络对象之间的边的权重。可选地,可以预测存在可替代关系的各个网络对象在一定时间内产生的网络流量(如未来网络流量),因此,在构建有权图时,将存在可替代关系的网络对象均作为有权图中的节点,在节点之间添加边,将彼此之间对应的“次数”作为边的权重,得到可表示网络对象之间存在的可替代关系及其程度的有权图。其中,有权图可表示为G=(V,E,W)。其中,V代表有权图中表示网络对象的节点的集合,E代表有权图中网络对象之间边的集合,W∈Rn*n代表有权图中边的权重矩阵,且该矩阵为一对称矩阵,n为每个存在可替代关系的网络对象的数目。在计算权重矩阵W时,如果两个网络对象的节点之间有边连接,则W中与该边对应位置的值即为该边的权重,如果两个网络对象的节点之间没有边连接,则W中对应位置的值即为0;边的权重值越大,表示该边所连接的两个网络对象之间的关联关系越强。
例如,以网络对象为商品为例,若用户甲在设定时间内将商品A、商品B加入购物车,且商品A和商品B属于同一商品叶子类目(表示类别相同)且属性相同或相近,则在构建有权图时,商品A和商品B之间有一条边,在设定的时间范围内对商品A和商品B加购物车的次数是1,则该边对应的权重为1。进一步,统计到用户乙、用户丙和用户丁在设定时间内将商品B和商品C加入购物车,且商品B和商品C属于同一商品叶子类目(表示类别相同)且属性相同或相近,则在有权图中,商品B和商品C之间有一条边,因为在设定的时间范围内对商品B和商品C加购物车的次数是3,则该边对应的权重为3。假设,构建出的有权图如图3a所示。以图3a所示的有权图为例,权重矩阵W为3*3的矩阵,每个矩阵元素表示两两商品之间被用户在设定时间范围内执行相同网络操作的次数。对于图3a所示的有权图,还可以定义有权图对应的度矩阵D和有权图的临接矩阵T。如图3a所示,商品A的度为1,商品B的度为4,商品C的度为3,因此,图3a对应的度矩阵D为
Figure BDA0002812837450000131
图3a对应的临接矩阵T为
Figure BDA0002812837450000132
基于上述,对网络对象之间的关联关系进行特征提取,得到关联关系特征的一种方式为:根据有权图的临接矩阵T和度矩阵D,计算有权图对应的图拉普拉斯矩阵L。其中,图拉普拉斯矩阵是n*n的方阵,可定义为L=D-A,n表示第一网络对象和第二网络对象的数量之和,且n是大于等于2的整数。则图3a对应的拉普拉斯矩阵L可表示为:
Figure BDA0002812837450000133
进一步,对拉普拉斯矩阵L进行归一化处理后可得到用于传递特征信息的图拉普拉斯矩阵
Figure BDA0002812837450000141
Figure BDA0002812837450000142
在本申请实施例中,网络对象自身具备很多属性信息,以网络对象是商品为例,其基本属性信息可以包括所属类别、品牌、价格、规格以及产地等信息,除此之外,还可以包括受众群体、用户好评度、是否涉及促销活动以及发货地等其他属性信息,这些不同维度上的属性信息都有可能影响商品的销量和口碑。因此,在对网络对象的未来流量进行预测时,需要从网络对象不同维度上属性信息考虑对未来流量的影响程度。可选地,在上述实施例中得到第二网络对象与第一网络对象之间的关联关系特征的情况下,可对第一网络对象在至少一个维度上的属性信息进行特征提取,得到第一网络对象的原始特征。在计算第一网络对象的原始特征时,可基于神经网络算法对第一网络对象和第二网络对象在至少一个维度上的属性信息进行特征提取,得到n*m的多维特征矩阵F∈Rn*m*k,其中,n是每种类别下的网络对象的个数,m是特征的维度,且m是大于等于2的整数,k是特征序列的长度。可选地,可以采用的神经网络算法包括但不限于:长短期记忆网络算法、wavenet网络算法等。该多维特征矩阵F是神经网络算法对网络对象各维度信息的高维汇总和抽象,利用该汇总抽象出的多维特征矩阵,可以输出各网络对象在一定时间内产生的网络流量(如未来网络流量)。需要说明的是,上述实施例仅为示例性说明,在多维特征矩阵时也可以从其他维度上的属性信息进行特征提取,在此不做过多赘述。以图3a所示有权图为例,商品A、B和C对应的多维特征矩阵F为
Figure BDA0002812837450000143
由于在上述实施例中计算得到的多维特征矩阵只是对网络对象自身特征信息的汇总和抽象,并没有考虑网络对象之间受彼此特征信息的相互影响,因此,为了更准确的预测第一网络对象在一定时间内产生的网络流量(如未来网络流量),需要考虑网络对象之间的影响因素。例如,用户在购买手机之前,将两款不同品牌的手机A和手机B加入购物车,但是手机A在3天后有促销活动,那么相较于手机B,用户在三天后更可能购买手机A。因此在对手机B进行未来销量预测时,就需要考虑手机A有促销活动会影响手机B的销量这个因素。在本申请可选实施例中,在得到第二网络对象与第一网络对象之间的关联关系特征与第一网络对象的原始特征的情况下,还可根据第二网络对象与第一网络对象之间的关联关系特征和第一网络对象的原始特征,计算第一网络对象的一阶融合特征和二阶融合特征,充分考虑第二网络对象对第一网络对象的影响。可选地,计算第一网络对象的一阶融合特征,可将经过归一化处理的图拉普拉斯矩阵Lsys与多维特征矩阵F相乘,得到一阶融合矩阵F′,该一阶融合矩阵F′的每一行代表一个网络对象的一阶融合特征,这些网络对象中包括第一网络对象。进一步可选地,在得到第一网络对象的一阶融合特征F′的情况下,可以再次将经过归一化处理的图拉普拉斯矩阵Lsys与一阶融合矩阵F′相乘,得到二阶融合矩阵F″,该二阶融合矩阵F″的每一行代表一个网络对象的二阶融合特征,这些网络对象中包括第一网络对象。以图3a所示的有权图为例,一阶融合矩阵
Figure BDA0002812837450000151
二阶融合矩阵
Figure BDA0002812837450000152
Figure BDA0002812837450000153
在得到第一网络对象的一阶融合特征和二阶融合特征的情况下,即可根据第一网络对象的一阶融合特征和二阶融合特征以及第一网络对象在至少一个维度上的属性信息,预测第一网络对象的未来网络流量。可选地,可对第一网络对象的原始特征以及第一网络对象的一阶融合特征和二阶融合特征进行拼接,得到第一网络对象的整体特征,再利用基于深度学习的流量预测算法对第一网络对象的整体特征进行预测,得到第一网络对象在一定时间内产生的网络流量(如未来网络流量)。由于拼接后得到的整体特征不仅包含了各个类别下的网络对象自身特征信息的汇总和抽象,还体现了各个网络对象之间受彼此特征信息的影响因素,因此,基于拼接后的整体特征进行网络流量预测,预测结果准确度更高。
进一步,在预测到第一网络对象在一定时间内产生的网络流量的情况下,可输出预测出的网络流量至第一网络对象的提供商服务器,以供提供商根据该预测出的网络流量执行与第一网络对象相关的操作。例如,在上述以预测手机P1未来销量的示例中,假设根据手机P1与手机P2的关联关系以及手机P1的属性信息,预测到手机P1在未来一周内的销售量为500台,提供商根据该预测结果可以判断手机P1的库存数量是否需要调配。若当前手机P1的库存为100台,则提供商可再增加400台,以在满足供需需求的情况下,避免因手机缺货无法下单或无法及时发货造成销售损失,用户流失等。又例如,以第一网络对象是影视剧为例,假设根据不同类型影视剧的属性信息以及关联关系,预测出古装剧的播放量要比青春偶像剧高出30%;枪机动作类电影的播放量要比文艺片高出百分之40%,则音视频提供商可根据该预测结果调整不同类型影视剧的上架数量。例如,对于电视剧可适当增加古装剧的上架数量,减少青春偶像剧的上架数量;对于电影可适当增加枪机动作类电影的上架数量,减少文艺片的上架数量。
本申请实施例的数据处理方法,可以应用到电商场景中,预测商品的未来销量。在该场景中,第一网络对象为第一商品,第二网络对象为第二商品。基于此,一种商品销量预测方法如图3b所示,包括以下步骤:
S1b、获取用户产生的与第一商品关联的网络操作行为数据。
S2b、从网络操作行为数据中,提取与第一商品存在可替代关系的第二商品与第一商品的关联关系。
S3b、根据第二商品与第一商品的关联关系以及第一商品在至少一个维度上的属性信息,预测第一商品的未来销量。
S4b、输出未来销量至目标商品的提供商,以供提供商根据未来销量执行与目标商品相关的操作。
本申请实施例的提供的商品销量预测方法可以获取用户产生的与第一商品关联的网络操作行为数据,并在获得这些网络操作行为数据的情况下,从网络操作行为数据中提取与第一商品存在可替代关系的第二商品与第一商品的关联关系,根据第二商品与第一商品的关联关系以及第一商品在至少一个维度上的属性信息,可预测第一商品的未来销量,以及输出未来销量至目标商品的提供商,以供提供商根据未来销量执行与目标商品相关的操作。关于预测第一商品的未来销量的过程与上述数据处理方法的实现过程一致,具体可参见上述实施例,在此不做重复赘述。
在电商场景中,用户通过终端设备可对商品执行一系列的网络操作,例如,浏览、收藏、添加购物车、评论或分享等。在用户执行这些网络操作过程中,终端设备可通过日志的形式记录用户在执行网络操作时产生的网络操作行为数据,并将这些网络操作行为数据通过提供商服务器或直接提供给云端的数据处理服务器。云端的数据处理服务器可根据网络操作行为数据预测每种商品在未来一段时间的销量,并将预测的结果返回给提供商。提供商基于预测结果可以合理调配每种商品对应的库存和拣货资源,以免出现因商品短缺导致用户无法下单或无法及时发货,造成用户流失,或者因为大量商品挤压导致亏本,以及因拣货资源分配不均,造成资源浪费等问题。
下面针对不同应用场景中应用本申请方法实施例的情况进行具体说明。
场景实施例1:
在电商领域的一场景中,提供商可根据商品的未来销量合理调配仓库中每种商品的库存量,确保每种商品的库存量合理且充足,以免出现部分商品积压或短缺的情况,从而减少因用户无法下单或无法及时发货造成的用户感受下降、用户流失以及经济损失。
在该场景实施例中,可采用图3b所示的方法预测各商品的未来销量;进而,根据各商品的未来销量,预先调整仓库中各商品的库存量。
例如,用户在挑选长沙发时往往会与短沙发进行比较,若当前要根据网络操作行为数据预测长沙发在未来一周内的销量,则可以根据长沙发与短沙发的关联关系以及长沙发的在至少一个维度上的属性信息进行预测。其中,长沙发的属性信息可以包括:历史周销量、所属的品牌、规格、品牌、当前价格以及未来一周内的价格变动等信息,基于这些信息衡量用户对长沙发的购买可能性,进而,预测长沙发的销量。例如,根据历史销量中长沙发所属品牌比短沙发所属品牌的销量更高,但时在未来一周内,短沙发有促销活动,根据以往该款长沙发在短沙发有促销活动下的周销量来看,该款长沙发的销量都会比平时销量减少20%。假设当前有300人将该款长沙发添加购物车,则可以预测在未来一周内短沙发有促活动的情况下,可能会有240人购买该款长沙发,若当前该款长沙发的库存数量仅有100个,则提供商可根据该预测结果,再增加250个左右的长沙发,避免因库存积压造成亏本。
场景实施例2:
在电商领域的另一场景中,提供商可根据商品的未来销量在多个仓库之间进行商品调度,使得各仓库中的库存量合理且充足,以免出现不同仓库中商品分配不均的情况,从而减少因用户无法下单或无法及时发货造成的用户感受下降、用户流失以及经济成本。
在该场景实施例中,以第一商品为例,可采用图3b所示的方法预测第一商品的未来销量。考虑到不同地区的仓库对同一商品的库存需求会有所不同,因此,可根据第一商品的未来销售量,预先在多个仓库之间进行第一商品的调度。在一可选实施例中,在多个仓库之间对第一商品进行调度时,可根据第一商品在多个仓库中的历史出货量和第一商品的未来销量,确定多个仓库中第一商品的预备存货量;并根据多个仓库中第一商品的当前存货量和预备存货量,在多个仓库之间进行所述第一商品的调度。
例如,某品牌提供商在入冬前要上架一款羽绒服,在上架之前,该提供商采用图3b所示的方式在考虑其他品牌以及其它款式羽绒服对该款羽绒服的影响的情况下,预测该款羽绒服的未来销量为8000件。假设提供商分别在A、B两个地区的设有仓库,且A地区靠近南方,B地区靠近北方,在历史销售情况中,A地区仓库对该款羽绒服的出货量为1000件,B地区仓库对该款羽绒服的出货量为3000件,则可以根据两个仓库对该款羽绒服的历史出货量的比例关系,确定每个仓库需要对该款羽绒服的预备存货量,如A地仓库需要2000件的存货量,B地仓库需要6000件的存货量;若在初始向仓库补货时,在A地区的仓库中存放5000件该款羽绒服,在B地区的仓库中存放5000件该款羽绒服,则可以从A地仓库中调拨1000-2000件该款羽绒服至B地仓库中,以确保B地仓库中的库存量,保证用户下单后能及时为用户发货,提高用户购物感受。
场景实施例3:
在电商领域的另一场景中,提供商可根据商品的未来销量,对仓库中的拣货资源在多个商品之间进行动态配置,避免造成资源分配不均,浪费资源。在本实施例中,不限定拣货资源的形式,可以是人力人员也可以是物力资源,例如,仓储搬运机器人或拣货机器人等设备。
在该场景实施例中,可采用图3b所示的方法预测各商品的未来销量;进而,根据各商品的未来销量,合理配置仓库中的拣货资源。
例如,在电商销售中,在双十一、双十二以及其他节假日都会有促销活动,且这种促销力度都比较大,在活动期间商品的销量可能会是平时的几倍甚至几十倍。在活动开始前,提供商可根据商品的预测销量配置仓库中的拣货资源,以免在活动期间影响用户的消费体验。假设某店铺在双十一期间对本店铺部分商品进行买一赠一促销活动,这些商品的预测销量会比平时高10倍。但是,目前的人员配置难以承受活动期间对商品进行打包和发货的压力,则提供商需需要对人员配置进行适当的调整。例如,平时需要2个人安排打包和发货,则根据该预测结果,提供商可临时招聘一些临时工在活动期间对商品进行打包和发货。例如,在招聘18各临时工在活动期间对商品进行打包和发货,或者,考虑到成本问题,提供商也可以适当减少招聘的人数,而调整工作的时长和报酬,以获得最大利益。
场景实施例4:
在电商领域另一场景中,在云端的数据处理服务器预测到商品的未来销量的情况下,除了将预测到的未来销量提供给提供商,还可以将预测到的未来销量提供给云端的其他服务器或者提供商的下游服务器,以供其他服务器根据该预测结果执行对应的处理。例如,云端在为提供商提供数据服务和支持过程中,除了对用户产生的网络操作行为数据进行处理外,还可以对预测结果进行统计和分析等其他操作,以及测试预测结果的准确性,进而对处理算法进行优化和升级,以为提供商提供更好的服务。
例如,在双十一等大型促销活动中,除了会比平时高出几倍甚至几十倍的成交销量,退货量也随之增加,很多用户在活动期间因为冲动消费导致买了很多不需要或不合适的商品,在收到货之后可能大量退货。因此,云端的其他服务器还可以根据数据处理服务器预测的销量以及实际成交的销量和退货退款的数量对数据处理服务器的预测结果进行统计分析,并不断对预测算法进行优化,以提升预测算法的准确性。又例如,云端还可以将预测到的商品的未来销量按照商品的种类、发货地以及收货地等信息,提供给不同的售后服务平台,例如物流厂商,售后服务平台根据预测到的商品的未来销量可以合理安排每个物流站点工作人员数量,避免出现商品大量堆积在物流站点,无人配送的情况。
在本申请实施例中,对用户执行网络操作生成的网络操作行为数据进行处理,可以得到用户执行网络操作对应的网络对象在各维度上的属性信息,基于这些信息可对网络对象在各维度上的未来网络流量进行预测。并且,在对网络对象的未来网络流量进行预测时,并不只是按照单独的网络对象的属性信息进行预测,而是对存在替代关系的网络对象的属性信息进行特征提取和融合,得到包含网络对象之间影响关系的属性信息的矩阵,并通过神经网络算法对该矩阵进行预测。通过这种方式,在预测某一网络对象的未来网络流量时,不仅将网络对象自身影响未来网络流量预测结果的因素考虑进来,还可以将与网络对象有替代关系的其他网络对象的属性信息考虑进来,有助于提升预测结果的准确性。
需要说明的是,上述实施例所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法也由不同设备作为执行主体。比如,步骤S1至步骤S4的执行主体可以为设备A;又比如,步骤S1和S2的执行主体可以为设备A,步骤S3和S4的执行主体可以为设备B;等等。
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如S1、S2等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
本申请实施例还提供了一种数据处理服务器,如图4所示,该数据处理服务器包括:处理器41以及存储有计算机程序的存储器42;其中,处理器41和存储器42可以是一个或多个。
存储器42,主要用于存储计算机程序,这些计算机程序可被处理器执行,致使处理器控制数据处理服务器实现相应功能、完成相应动作或任务。除了存储计算机程序之外,存储器还可被配置为存储其它各种数据以支持在数据处理服务器上的操作,这些数据的示例包括用于在数据处理服务器上操作的任何应用程序或方法的指令。
存储器42,可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
在本申请实施例中,并不限定处理器41的实现形态,例如可以是但不限于CPU、GPU或MCU等。处理器31可以看作是数据处理服务器的控制系统,可用于执行存储器42中存储的计算机程序,以控制数据处理服务器实现相应功能、完成相应动作或任务。值得说明的是,根据数据处理服务器实现形态以及所处于场景的不同,其所需实现的功能、完成的动作或任务会有所不同;相应地,存储器42中存储的计算机程序也会有所不同,而处理器41执行不同计算机程序可控制数据处理服务器实现不同的功能、完成不同的动作或任务。
在一可选实施例中,如图4所示,数据处理服务器还包括:通信组件43和电源组件44等其它组件。图4中仅示意性给出部分组件,并不意味着数据库引擎只包括图4所示组件。
在本申请实施例中,当处理器41执行存储器42中的计算机程序时,以用于:获取用户产生的与第一网络对象关联的网络操作行为数据;从网络操作行为数据中,提取与第一网络对象存在可替代关系的第二网络对象与第一网络对象的关联关系;根据第二网络对象与第一网络对象的关联关系以及第一网络对象在至少一个维度上的属性信息,预测第一网络对象在一定时间内产生的网络流量(如未来网络流量)。
在一可选实施例中,处理器41还用于:输出预测出的网络流量至第一网络对象的提供商,以供提供商根据该预测出的网络流量执行与第一网络对象相关的操作。
在一可选实施例中,处理器41在从网络操作行为数据中,提取与第一网络对象存在可替代关系的第二网络对象与第一网络对象的关联关系时,用于:从网络操作行为数据中,提取由同一用户在设定时间范围内对第一网络对象和第二网络对象执行相同网络操作的次数;根据次数,在第一网络对象与第二网络对象之间建立关联关系。
在一可选实施例中,处理器41在从网络操作行为数据中,提取由同一用户在设定时间范围内对第一网络对象和第二网络对象执行相同网络操作的次数时,用于:从网络操作行为数据中,识别出同一用户产生的各种网络操作类型下的网络操作行为数据;将同一用户产生的各种网络操作类型下的网络操作行为数据分别按照发生时间的先后顺序对涉及的网络对象进行排列,得到各种网络操作类型下的对象序列;基于各种网络操作类型下的对象序列,提取由同一用户在设定时间范围内对第一网络对象和第二网络对象执行相同网络操作的次数。
在一可选实施例中,第二网络对象是网络操作行为数据中出现的类别与第一网络对象相同且属性与第一网络对象相同或相近的网络对象。
在一可选实施例中,处理器41在根据第二网络对象与第一网络对象的关联关系以及第一网络对象在至少一个维度上的属性信息,预测第一网络对象在一定时间内产生的网络流量时,用于:根据第二网络对象与第一网络对象的关联关系和第一网络对象在至少一个维度上的属性信息,计算第一网络对象的一阶融合特征和二阶融合特征;根据第一网络对象的一阶融合特征和二阶融合特征以及第一网络对象在至少一个维度上的属性信息,预测第一网络对象在一定时间内产生的网络流量。
在一可选实施例中,处理器41在根据第二网络对象与第一网络对象的关联关系和第一网络对象在至少一个维度上的属性信息,计算第一网络对象的一阶融合特征和二阶融合特征时,用于:对第二网络对象与第一网络对象的关联关系进行特征提取,得到第二网络对象与第一网络对象之间的关联关系特征;对第一网络对象在至少一个维度上的属性信息进行特征提取,得到第一网络对象的原始特征;根据关联关系特征和第一网络对象的原始特征,计算第一网络对象的一阶融合特征和二阶融合特征。
在一可选实施例中,处理器41在根据第一网络对象的一阶融合特征和二阶融合特征以及第一网络对象在至少一个维度上的属性信息,预测第一网络对象在一定时间内产生的网络流量时,用于:对第一网络对象的原始特征以及第一网络对象的一阶融合特征和二阶融合特征进行拼接,得到第一网络对象的整体特征;利用基于深度学习的流量预测算法对第一网络对象的整体特征进行预测,得到第一网络对象在一定时间内产生的网络流量。
在一可选实施例中,处理器41在根据次数,在第一网络对象与第二网络对象之间建立关联关系时,用于:根据次数,建立表示第一网络对象与第二网络对象的关联关系的有权图,次数是第一网络对象与第二网络对象之间的边的权重。
在一可选实施例中,处理器41在对第二网络对象与第一网络对象的关联关系进行特征提取,得到第二网络对象与第一网络对象之间的关联关系特征时,用于:计算有权图对应的图拉普拉斯矩阵,图拉普拉斯矩阵是n*n的,n表示第一网络对象和第二网络对象的数量之和,n是大于等于2的整数。
在一可选实施例中,处理器41在对第一网络对象在至少一个维度上的属性信息进行特征提取,得到第一网络对象的原始特征时,用于:基于神经网络算法分别对第一网络对象和第二网络对象在至少一个维度上的属性信息进行特征提取,得到n*m的多维特征矩阵,m是特征的维度,m是大于等于2的整数。
在一可选实施例中,处理器41在根据关联关系特征和第一网络对象的原始特征,计算第一网络对象的一阶融合特征和二阶融合特征时,用于:将图拉普拉斯矩阵与多维特征矩阵相乘,得到一阶融合矩阵,一阶融合矩阵中包括第一网络对象的一阶融合特征;将图拉普拉斯矩阵与一阶融合矩阵相乘,得到二阶融合矩阵,二阶融合矩阵中包括第一网络对象的二阶融合特征。
在一可选实施例中,上述网络对象为电商领域中的商品,即第一网络对象为第一商品,第二网络对象为第二商品;相应地,在一定时间是未来时段的情况下,第一网络对象在未来时段内产生的网络流量为第一商品的未来销量。基于此,在预测到第一商品的未来销量后,处理器41还用于:根据第一商品的未来销量,预先在多个仓库之间进行第一商品的调度;和/或,根据第一商品的未来销量,对仓库中的拣货资源在第一商品与其它商品之间进行动态配置。
在一可选实施例中,处理器41在多个仓库之间进行第一商品的调度时,具体用于:根据第一商品在多个仓库中的历史出货量和第一商品的未来销量,确定多个仓库中所述第一商品的预备存货量;根据多个仓库中第一商品的当前存货量和预备存货量,在多个仓库之间进行第一商品的调度。
相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由数据处理服务器执行的各步骤。
上述图4中的通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如WiFi,2G、3G、4G/LTE、5G等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
上述图4中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的范围之内。

Claims (19)

1.一种数据处理方法,其特征在于,包括:
获取用户产生的与第一网络对象关联的网络操作行为数据;
从所述网络操作行为数据中,提取与所述第一网络对象存在可替代关系的第二网络对象与所述第一网络对象的关联关系;
根据所述第二网络对象与所述第一网络对象的关联关系以及所述第一网络对象在至少一个维度上的属性信息,预测所述第一网络对象在一定时间内产生的网络流量。
2.根据权利要求1所述的方法,其特征在于,还包括:
输出所述网络流量至所述第一网络对象的提供商,以供所述提供商根据所述网络流量执行与所述第一网络对象相关的操作。
3.根据权利要求1所述的方法,其特征在于,从所述网络操作行为数据中,提取与所述第一网络对象存在可替代关系的第二网络对象与所述第一网络对象的关联关系,包括:
从所述网络操作行为数据中,提取由同一用户在设定时间范围内对第一网络对象和第二网络对象执行相同网络操作的次数;
根据所述次数,在所述第一网络对象与所述第二网络对象之间建立关联关系。
4.根据权利要求3所述的方法,其特征在于,从所述网络操作行为数据中,提取由同一用户在设定时间范围内对第一网络对象和第二网络对象执行相同网络操作的次数,包括:
从所述网络操作行为数据中,识别出同一用户产生的各种网络操作类型下的网络操作行为数据;
将同一用户产生的各种网络操作类型下的网络操作行为数据分别按照发生时间的先后顺序对涉及的网络对象进行排列,得到各种网络操作类型下的对象序列;
基于所述各种网络操作类型下的对象序列,提取由同一用户在设定时间范围内对第一网络对象和第二网络对象执行相同网络操作的次数。
5.根据权利要求3或4所述的方法,其特征在于,所述第二网络对象是所述网络操作行为数据中出现的类别与所述第一网络对象相同且属性与所述第一网络对象相同或相近的网络对象。
6.根据权利要求3或4所述的方法,其特征在于,根据所述第二网络对象与所述第一网络对象的关联关系以及所述第一网络对象在至少一个维度上的属性信息,预测所述第一网络对象在一定时间内产生的网络流量,包括:
根据所述第二网络对象与所述第一网络对象的关联关系和所述第一网络对象在至少一个维度上的属性信息,计算所述第一网络对象的一阶融合特征和二阶融合特征;
根据所述第一网络对象的一阶融合特征和二阶融合特征以及所述第一网络对象在至少一个维度上的属性信息,预测所述第一网络对象在一定时间内产生的网络流量。
7.根据权利要求6所述的方法,其特征在于,根据所述第二网络对象与所述第一网络对象的关联关系和所述第一网络对象在至少一个维度上的属性信息,计算所述第一网络对象的一阶融合特征和二阶融合特征,包括:
对所述第二网络对象与所述第一网络对象的关联关系进行特征提取,得到所述第二网络对象与所述第一网络对象之间的关联关系特征;
对所述第一网络对象在至少一个维度上的属性信息进行特征提取,得到所述第一网络对象的原始特征;
根据所述关联关系特征和所述第一网络对象的原始特征,计算所述第一网络对象的一阶融合特征和二阶融合特征。
8.根据权利要求7所述的方法,其特征在于,根据所述第一网络对象的一阶融合特征和二阶融合特征以及所述第一网络对象在至少一个维度上的属性信息,预测所述第一网络对象在一定时间内产生的网络流量,包括:
对所述第一网络对象的原始特征以及所述第一网络对象的一阶融合特征和二阶融合特征进行拼接,得到所述第一网络对象的整体特征;
利用基于深度学习的流量预测算法对所述第一网络对象的整体特征进行预测,得到所述第一网络对象在一定时间内产生的网络流量。
9.根据权利要求8所述的方法,其特征在于,根据所述次数,在所述第一网络对象与所述第二网络对象之间建立关联关系,包括:
根据所述次数,建立表示所述第一网络对象与所述第二网络对象的关联关系的有权图,所述次数是所述第一网络对象与所述第二网络对象之间的边的权重。
10.根据权利要求9所述的方法,其特征在于,对所述第二网络对象与所述第一网络对象的关联关系进行特征提取,得到所述第二网络对象与所述第一网络对象之间的关联关系特征,包括:
计算所述有权图对应的图拉普拉斯矩阵,所述图拉普拉斯矩阵是n*n的,n表示所述第一网络对象和所述第二网络对象的数量之和,n是大于等于2的整数。
11.根据权利要求10所述的方法,其特征在于,对所述第一网络对象在至少一个维度上的属性信息进行特征提取,得到所述第一网络对象的原始特征,包括:
基于神经网络算法分别对所述第一网络对象和所述第二网络对象在至少一个维度上的属性信息进行特征提取,得到n*m的多维特征矩阵,m是特征的维度,m是大于等于2的整数。
12.根据权利要求11所述的方法,其特征在于,根据所述关联关系特征和所述第一网络对象的原始特征,计算所述第一网络对象的一阶融合特征和二阶融合特征,包括:
将所述图拉普拉斯矩阵与所述多维特征矩阵相乘,得到一阶融合矩阵,所述一阶融合矩阵中包括所述第一网络对象的一阶融合特征;
将所述图拉普拉斯矩阵与所述一阶融合矩阵相乘,得到二阶融合矩阵,所述二阶融合矩阵中包括所述第一网络对象的二阶融合特征。
13.一种商品销量预测方法,其特征在于,包括:
获取用户产生的与第一商品关联的网络操作行为数据;
从所述网络操作行为数据中,提取与所述第一商品存在可替代关系的第二商品与所述第一商品的关联关系;
根据所述第二商品与所述第一商品的关联关系以及所述第一商品在至少一个维度上的属性信息,预测所述第一商品的未来销量;
输出所述未来销量至所述目标商品的提供商,以供所述提供商根据所述未来销量执行与所述目标商品相关的操作。
14.根据权利要求13所述的方法,其特征在于,所述第一商品在至少一个维度上的属性信息包括:所述第一商品的基本属性信息、所述第一商品的历史序列信息以及所述第一商品的未来信息;
其中,所述第一商品的历史序列信息包括所述第一商品的历史销量、历史收藏量以及历史加购量中的至少一种;所述第一商品的未来信息包括:未来时段内与所述第一商品相关的商品活动信息。
15.一种仓储调度方法,其特征在于,包括:
获取用户产生的与第一商品关联的网络操作行为数据;
从所述网络操作行为数据中,提取与所述第一商品存在可替代关系的第二商品与所述第一商品的关联关系;
根据所述第二商品与所述第一商品的关联关系以及所述第一商品在至少一个维度上的属性信息,预测所述第一商品的未来销量;
根据所述第一商品的未来销量,预先在多个仓库之间进行所述第一商品的调度。
16.根据权利要求15所述的方法,其特征在于,根据所述第一商品的未来销量,预先在多个仓库之间进行所述第一商品的调度,包括:
根据所述第一商品在多个仓库中的历史出货量和所述第一商品的未来销量,确定多个仓库中所述第一商品的预备存货量;
根据所述多个仓库中所述第一商品的当前存货量和预备存货量,在所述多个仓库之间进行所述第一商品的调度。
17.一种仓库资源配置方法,其特征在于,包括:
获取用户产生的与第一商品关联的网络操作行为数据;
从所述网络操作行为数据中,提取与所述第一商品存在可替代关系的多个商品与所述第一商品的关联关系;
根据所述多个商品与所述第一商品的关联关系以及所述第一商品在至少一个维度上的属性信息,预测所述第一商品的未来销量;
根据所述第一商品的未来销量,对仓库中的拣货资源在所述第一商品与其它商品之间进行动态配置。
18.一种数据处理服务器,其特征在于,包括:处理器以及存储有计算机程序的存储器;
所述处理器,用于执行所述计算机程序,以用于:
获取用户产生的与第一网络对象关联的网络操作行为数据;
从所述网络操作行为数据中,提取与所述第一网络对象存在可替代关系的第二网络对象与所述第一网络对象的关联关系;
根据所述第二网络对象与所述第一网络对象的关联关系以及所述第一网络对象在至少一个维度上的属性信息,预测所述第一网络对象在一定时间内产生的网络流量。
19.一种存储有计算机程序的计算机可读存储介质,其特征在于,当所述计算机程序被处理器执行时,致使所述处理器实现权利要求1-17任一项所述方法中的步骤。
CN202011402216.2A 2020-12-02 2020-12-02 数据处理方法、服务器及存储介质 Pending CN113298552A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011402216.2A CN113298552A (zh) 2020-12-02 2020-12-02 数据处理方法、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011402216.2A CN113298552A (zh) 2020-12-02 2020-12-02 数据处理方法、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN113298552A true CN113298552A (zh) 2021-08-24

Family

ID=77318385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011402216.2A Pending CN113298552A (zh) 2020-12-02 2020-12-02 数据处理方法、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113298552A (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236628A (zh) * 2008-01-18 2008-08-06 冉文学 配送订单自动化分拣组单配货生产工艺
CN105825354A (zh) * 2016-03-11 2016-08-03 北京小米移动软件有限公司 仓储调度方法和装置
US20160275590A1 (en) * 2015-03-18 2016-09-22 Ebay, Inc Alternate product recommendations
CN106156880A (zh) * 2015-04-22 2016-11-23 阿里巴巴集团控股有限公司 一种预测库存分配比例的方法、装置及电子设备
DE102016114224A1 (de) * 2015-08-05 2017-02-09 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Priorisierung von Netzwerkverkehr basierend auf einer relativen bevorstehenden Verwendung
CN106910034A (zh) * 2015-12-22 2017-06-30 阿里巴巴集团控股有限公司 商品对象调拨方法及装置
CN107886279A (zh) * 2017-11-29 2018-04-06 商派软件有限公司 一种基于商家库存的全渠道库存分配方法
CN108074003A (zh) * 2016-11-09 2018-05-25 北京京东尚科信息技术有限公司 预测信息推送方法和装置
CN108764646A (zh) * 2018-04-27 2018-11-06 车智互联(北京)科技有限公司 一种销量预测方法及计算设备
CN109993484A (zh) * 2019-03-28 2019-07-09 杭州网易再顾科技有限公司 数据处理方法及系统、介质和计算设备
CN110135907A (zh) * 2019-05-14 2019-08-16 网易无尾熊(杭州)科技有限公司 销量预测模型的建立方法、介质、装置和计算设备
CN110782266A (zh) * 2018-07-31 2020-02-11 阿里巴巴集团控股有限公司 商品销量预测及模型训练方法、装置以及设备
CN110874751A (zh) * 2018-08-29 2020-03-10 北京京东尚科信息技术有限公司 一种超市补货的方法和系统
CN111401940A (zh) * 2020-03-05 2020-07-10 杭州网易再顾科技有限公司 特征预测方法、装置、电子设备及存储介质
CN111652657A (zh) * 2020-06-10 2020-09-11 创新奇智(南京)科技有限公司 商品销量预测方法、装置、电子设备及可读存储介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101236628A (zh) * 2008-01-18 2008-08-06 冉文学 配送订单自动化分拣组单配货生产工艺
US20160275590A1 (en) * 2015-03-18 2016-09-22 Ebay, Inc Alternate product recommendations
CN106156880A (zh) * 2015-04-22 2016-11-23 阿里巴巴集团控股有限公司 一种预测库存分配比例的方法、装置及电子设备
DE102016114224A1 (de) * 2015-08-05 2017-02-09 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Priorisierung von Netzwerkverkehr basierend auf einer relativen bevorstehenden Verwendung
CN106910034A (zh) * 2015-12-22 2017-06-30 阿里巴巴集团控股有限公司 商品对象调拨方法及装置
CN105825354A (zh) * 2016-03-11 2016-08-03 北京小米移动软件有限公司 仓储调度方法和装置
CN108074003A (zh) * 2016-11-09 2018-05-25 北京京东尚科信息技术有限公司 预测信息推送方法和装置
CN107886279A (zh) * 2017-11-29 2018-04-06 商派软件有限公司 一种基于商家库存的全渠道库存分配方法
CN108764646A (zh) * 2018-04-27 2018-11-06 车智互联(北京)科技有限公司 一种销量预测方法及计算设备
CN110782266A (zh) * 2018-07-31 2020-02-11 阿里巴巴集团控股有限公司 商品销量预测及模型训练方法、装置以及设备
CN110874751A (zh) * 2018-08-29 2020-03-10 北京京东尚科信息技术有限公司 一种超市补货的方法和系统
CN109993484A (zh) * 2019-03-28 2019-07-09 杭州网易再顾科技有限公司 数据处理方法及系统、介质和计算设备
CN110135907A (zh) * 2019-05-14 2019-08-16 网易无尾熊(杭州)科技有限公司 销量预测模型的建立方法、介质、装置和计算设备
CN111401940A (zh) * 2020-03-05 2020-07-10 杭州网易再顾科技有限公司 特征预测方法、装置、电子设备及存储介质
CN111652657A (zh) * 2020-06-10 2020-09-11 创新奇智(南京)科技有限公司 商品销量预测方法、装置、电子设备及可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ALY MEGAHED等: "An Optimization Approach to Services Sales Forecasting in a Multi-staged Sales Pipeline", 《2016 IEEE INTERNATIONAL CONFERENCE ON SERVICES COMPUTING (SCC)》 *
王晓等: "大数据在电子商务领域的应用", 《信息技术与标准化》, no. 09 *

Similar Documents

Publication Publication Date Title
US10812870B2 (en) Yield optimization of cross-screen advertising placement
US20180225708A1 (en) Method and system for forecasting performance of audience clusters
US8386285B2 (en) Demand modeling and prediction in a retail category
US10306335B2 (en) Database driven computer systems and computer-implemented methods for real-time performance of web originated activities related to media events
US20110225023A1 (en) Prioritized Product Distribution
US11164127B2 (en) System and method for on-site purchases at automated storage and retrieval system
US11367042B2 (en) Computerized inventory redistribution control system
US20160034952A1 (en) Control apparatus and accelerating method
KR102445639B1 (ko) 인바운드 스토우 모델을 이용한 아웃바운드 예측을 위한 시스템 및 방법
CN110766509A (zh) 服务订单处理、外卖订单推荐方法及装置
Lakshmanan et al. Sales demand forecasting using LSTM network
EP3675020A1 (en) Distribution service providing method connecting initial provider and buyer via mid-distribution man
CN113888229A (zh) 一种门店数据处理及订单处理方法及装置
US20210312259A1 (en) Systems and methods for automatic product usage model training and prediction
CN113298610A (zh) 信息推荐与获取方法、设备及存储介质
US20220337911A1 (en) Systems and methods for customizing live video streams
KR102618008B1 (ko) 가상 번들의 동적 밸런싱을 위한 시스템 및 방법
KR20210046571A (ko) 복수 매장 관리용 비즈니스 모델 생성 방법
CN113298552A (zh) 数据处理方法、服务器及存储介质
CN114969523A (zh) 基于用户行为数据的标签及推送策略的管理方法及设备、介质
KR102415685B1 (ko) 긴급소진 요구상품의 실시간 알림을 이용한 상품 판매 서비스 제공 방법
US11875370B2 (en) Automated replenishment shopping harmonization
KR102662226B1 (ko) 물류 정보 시스템에서 상품의 재고를 관리하기 위한 장치 및 방법
US10438217B1 (en) Estimating an output based on robustness associated with multiple input variables
CN114463103B (zh) 一种数据处理方法及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination