CN116415990B - 一种基于云计算的自助数据分析方法、系统及存储介质 - Google Patents

一种基于云计算的自助数据分析方法、系统及存储介质 Download PDF

Info

Publication number
CN116415990B
CN116415990B CN202310682825.5A CN202310682825A CN116415990B CN 116415990 B CN116415990 B CN 116415990B CN 202310682825 A CN202310682825 A CN 202310682825A CN 116415990 B CN116415990 B CN 116415990B
Authority
CN
China
Prior art keywords
time sequence
sales
scale
feature vector
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310682825.5A
Other languages
English (en)
Other versions
CN116415990A (zh
Inventor
张晓辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jibeike Century Information Technology Co ltd
Global Business Intelligence Consulting Co
Original Assignee
Beijing Jibeike Century Information Technology Co ltd
Global Business Intelligence Consulting Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jibeike Century Information Technology Co ltd, Global Business Intelligence Consulting Co filed Critical Beijing Jibeike Century Information Technology Co ltd
Priority to CN202310682825.5A priority Critical patent/CN116415990B/zh
Publication of CN116415990A publication Critical patent/CN116415990A/zh
Application granted granted Critical
Publication of CN116415990B publication Critical patent/CN116415990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Abstract

一种基于云计算的自助数据分析方法、系统及存储介质,其获取由企业用户上传至云计算平台的历史销售数据;采用基于深度学习的人工智能技术,进行所述销售额的时序动态变化特征信息进行充分表达,以此来准确可靠地进行未来销售额的预测,从而制定相应的销售计划来优化企业的销售策略。

Description

一种基于云计算的自助数据分析方法、系统及存储介质
技术领域
本申请涉及智能化数据分析技术领域,并且更具体地,涉及一种基于云计算的自助数据分析方法、系统及存储介质。
背景技术
随着互联网和电子商务的发展,企业数据规模不断增大,数据分析和预测变得越来越重要。因此,如何从这些数据中提取有用的信息,预测未来的销售趋势,并制定更有效的销售策略,成为了企业需要解决的重要问题。
然而,传统的数据分析方法往往需要专业的数据分析人员和昂贵的软件工具来进行,效率较低且成本较高,导致传统的数据分析方法很难应对数据量大、数据类型多样化和数据处理速度要求高的情况。
因此,期望一种优化的基于云计算的自助数据分析方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于云计算的自助数据分析方法、系统及存储介质,其获取由企业用户上传至云计算平台的历史销售数据;采用基于深度学习的人工智能技术,进行所述销售额的时序动态变化特征信息进行充分表达,以此来准确可靠地进行未来销售额的预测,从而制定相应的销售计划来优化企业的销售策略。
第一方面,提供了一种基于云计算的自助数据分析方法,其包括:
获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额;
对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量;
将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,其中,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核;
将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,其中,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核;
融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量;
使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵;
以及将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值。
在上述基于云计算的自助数据分析方法中,将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,包括:使用所述基于第一卷积神经网络模型的第一时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第一卷积神经网络模型的第一时序序列特征提取器的最后一层的输出为所述第一尺度销售额时序关联特征向量,其中,所述基于第一卷积神经网络模型的第一时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
在上述基于云计算的自助数据分析方法中,将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,包括:使用所述基于第二卷积神经网络模型的第二时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第二卷积神经网络模型的第二时序序列特征提取器的最后一层的输出为所述第二尺度销售额时序关联特征向量,其中,所述基于第二卷积神经网络模型的第二时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
在上述基于云计算的自助数据分析方法中,所述第一尺度不等于所述第二尺度。
在上述基于云计算的自助数据分析方法中,融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量,包括:通过采用类转换器空间迁移置换融合的方式,以如下融合公式来融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到所述多尺度销售额时序关联特征向量;其中,所述第一融合公式为:
其中,和/>分别是所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量,/>是所述第二尺度销售额时序关联特征向量的转置向量,/>为所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量之间的距离矩阵,/>表示所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量间的欧式距离,/>为掩码阈值超参数,且向量均为行向量,/>、/>和/>分别表示特征向量的逐位置相加、相减和相乘,/>表示矩阵乘法,/>表示/>函数,/>是所述多尺度销售额时序关联特征向量,/>是所述第一尺度销售额时序关联特征向量第/>个位置的特征值,/>是所述第二尺度销售额时序关联特征向量第/>个位置的特征值。
在上述基于云计算的自助数据分析方法中,使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵,包括:以如下高斯公式构造所述多尺度销售额时序关联特征向量的高斯密度图;其中,所述高斯公式为:
其中,表示所述多尺度销售额时序关联特征向量,且/>的每个位置的值表示所述多尺度销售额时序关联特征向量中各个位置的特征值之间的方差;对所述高斯密度图中各个位置的高斯分布进行高斯离散化处理以将所述高斯密度图中各个位置的高斯分布降维为一维的特征向量;以及,将所述各个位置的一维的特征向量进行二维排列以生成所述解码特征矩阵。
在上述基于云计算的自助数据分析方法中,将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值,包括:进一步用于:使用所述解码器以如下解码公式对所述解码特征矩阵进行解码回归以得到所述解码值;
其中,所述解码公式为:,其中,/>表示所述解码特征矩阵,表示所述解码值,/>表示权重矩阵,/>表示偏置向量,/>表示矩阵乘。
第二方面,提供了一种基于云计算的自助数据分析系统,其包括:
数据获取模块,用于获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额;
向量排列模块,用于对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量;
第一时序特征提取模块,用于将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,其中,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核;
第二时序特征提取模块,用于将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,其中,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核;
融合模块,用于融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量;
高斯强化模块,用于使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵;
以及解码模块,用于将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值。
在上述基于云计算的自助数据分析系统中,所述第一时序特征提取模块,用于:使用所述基于第一卷积神经网络模型的第一时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第一卷积神经网络模型的第一时序序列特征提取器的最后一层的输出为所述第一尺度销售额时序关联特征向量,其中,所述基于第一卷积神经网络模型的第一时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
第三方面,提供了一种存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如所述的基于云计算的自助数据分析方法。
与现有技术相比,本申请提供的基于云计算的自助数据分析方法、系统及存储介质,其获取由企业用户上传至云计算平台的历史销售数据;采用基于深度学习的人工智能技术,进行所述销售额的时序动态变化特征信息进行充分表达,以此来准确可靠地进行未来销售额的预测,从而制定相应的销售计划来优化企业的销售策略。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例的基于云计算的自助数据分析方法的场景示意图。
图2为根据本申请实施例的基于云计算的自助数据分析方法的流程图。
图3为根据本申请实施例的基于云计算的自助数据分析方法的架构示意图。
图4为根据本申请实施例的基于云计算的自助数据分析系统的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
在本申请实施例记载中,需要说明的是,除非另有说明和限定,术语“连接”应做广义理解,例如,可以是电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。
如上所述,传统的数据分析方法往往需要专业的数据分析人员和昂贵的软件工具来进行,效率较低且成本较高,导致传统的数据分析方法很难应对数据量大、数据类型多样化和数据处理速度要求高的情况。因此,期望一种优化的基于云计算的自助数据分析方案。
相应地,考虑到在实际进行销售数据分析的过程中,为了能够有效且准确地预测未来的销售趋势,并制定相应的销售策略,关键在于对于企业的历史销售数据的时序隐含变化特征进行充分分析捕捉,以进行销售额的预测。但是,由于企业的历史销售数据,例如销售额在时间维度上的不同时间周期下呈现出不同的动态变化规律性,并这种变化规律的特征信息较为微弱,为小尺的隐含时序变化特征信息,难以通过传统的特征提取方式进行有效地捕捉刻画,导致对于销售额的预测精度较低。因此,在此过程中,难点在于如何进行所述销售额的时序动态变化特征信息进行充分表达,以此来准确可靠地进行未来销售额的预测,从而制定相应的销售计划来优化企业的销售策略。
具体地,在本申请的技术方案中,首先,获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额。接着,考虑到由于所述销售额在时间维度上有着时序的动态变化规律性,而时间因素又是销售额预测中非常重要的一个因素,这是由于销售额通常会受到季节性、节假日、促销活动等时间因素的影响。因此,在本申请的技术方案中,为了能够提取出所述历史销售数据中多天的销售额的时序变化特征信息,需要对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量,以此来整合所述销售额在时间维度上的时序分布信息,有利于后续进行所述历史销售数据中销售额的时序变化特征的有效提取,从而提高销售额预测的准确性。
然后,考虑到由于所述历史销售数据中多天的销售额在时间维度上具有着时序动态变化特征,并且所述销售额在不同的时间周期跨度下呈现出不同的变化规律性。因此,在本申请的技术方案中,使用具有不同尺度的一维卷积核的卷积神经网络模型来进行所述销售额时序输入向量的特征挖掘,以此来提取出所述销售额在不同时间跨度下的多尺度时序关联特征信息。
更具体地,将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器中进行特征挖掘,以此来提取出所述销售额在第一尺度时序跨度下的时序动态变化特征,从而得到第一尺度销售额时序关联特征向量;并且将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器进行特征提取,以提取出所述销售额在第二尺度时序跨度下的时序动态变化特征信息,从而得到第二尺度销售额时序关联特征向量。特别地,这里,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核,并且所述第一尺度和所述第二尺度不相同。然后,在得到不同尺度下的关于销售额的时序动态变化特征信息后,进一步融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量,以此来表示所述销售额在不同时间周期跨度下的多尺度时序关联特征信息,即所述销售额的多尺度时序变化特征信息。
进一步地,还考虑到由于所述销售额的时序动态变化信息在实际监测的过程中并不明显,因此,在得到所述销售额的时序多尺度动态变化特征后,期望对其进行特征表达强化。应可以理解,作为神经网络模型的学习目标,高斯密度图可以表示特征分布的单个特征值由于其概率密度而在多个特征值构成整体分布情况下的联合分布,也就是,以所述销售额的特征分布作为先验分布,来获得每个先验分布位置下由于其它先验分布位置的相关性作用下的概率密度以作为后验分布,从而在更高维度上更准确地描述特征分布。因此,在本申请的技术方案中,可以通过所述销售额的先验分布,即高斯分布,来对于所述销售额的时序多尺度动态隐含关联特征进行数据增强,也就是,使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵,以此来更好地捕捉到销售额时序数据中的关联性特征信息,从而提高销售额预测的准确性。
接着,进一步再将所述解码特征矩阵通过解码器进行解码回归,以得到用于表示销售额的预测值的解码值。也就是说,以特征增强后的关于所述销售额的时序多尺度变化特征信息来进行解码,从而对于销售额的趋势进行检测评估,以此来进行未来销售额的预测,以制定相应的销售计划。
特别地,在本申请的技术方案中,这里,在融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量时,可以获得历史销售额在不同时间尺度下的关联模式特征。考虑到所述第一尺度销售额时序关联特征向量由所述第一卷积神经网络模型对所述销售额时序输入向量进行基于具有第一尺度的一维卷积核的一维卷积编码得到,而所述第二尺度销售额时序关联特征向量由所述第二卷积神经网络模型对所述销售额时序输入向量进行基于具有第二尺度的一维卷积核的一维卷积编码得到,因此,所述第一尺度销售额时序关联特征向量的特征分布相对于所述第二尺度销售额时序关联特征向量的特征分布在高维特征空间内会存在空间迁移。因此,期望提升在具有空间迁移情况下的所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量的融合效果。
因此,本申请的申请人采用类转换器空间迁移置换融合来融合所述第一尺度销售额时序关联特征向量,例如记为和所述第二尺度销售额时序关联特征向量,例如记为/>,具体表示为:
为向量之间的距离矩阵,即其第/>位置的特征值是所述第一尺度销售额时序关联特征向量/>的第/>个特征值/>与所述第二尺度销售额时序关联特征向量/>的第/>个特征值/>之间的距离,/>表示向量间的欧式距离,/>为掩码阈值超参数,且向量均为行向量。
这里,所述类转换器空间迁移置换融合通过以所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量/>的特征值对的差分表征来对特征值对的空间距离进行类转换器机制的掩码预测,实现了所述多尺度销售额时序关联特征向量/>在高维特征空间内的边仿射编码,并通过施加转换器的自注意力机制下的隐状态偏置,来通过所述多尺度销售额时序关联特征向量/>相对于待融合的所述第一尺度销售额时序关联特征向量/>和所述第二尺度销售额时序关联特征向量/>在转换器机制下的全局旋转和平移不变形,实现所述第一尺度销售额时序关联特征向量/>和所述第二尺度销售额时序关联特征向量/>的特征分布的空间迁移可置换性,这样,就提升了所述多尺度销售额时序关联特征向量/>对所述第一尺度销售额时序关联特征向量/>和所述第二尺度销售额时序关联特征向量/>的融合效果,从而提升了所述多尺度销售额时序关联特征向量/>的表达效果。这样,能够准确可靠地进行未来销售额的预测,从而制定相应的销售计划来优化企业的销售策略。
图1为根据本申请实施例的基于云计算的自助数据分析方法的场景示意图。如图1所示,在该应用场景中,首先,获取由企业用户上传至云计算平台的历史销售数据(例如,如图1中所示意的C);然后,将获取的历史销售数据输入至部署有基于云计算的自助数据分析算法的服务器(例如,如图1中所示意的S)中,其中所述服务器能够基于云计算的自助数据分析算法对所述历史销售数据进行处理,以生成用于表示销售额的预测值的解码值。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
在本申请的一个实施例中,图2为根据本申请实施例的基于云计算的自助数据分析方法的流程图。如图2所示,根据本申请实施例的基于云计算的自助数据分析方法100,包括:110,获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额;120,对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量;130,将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,其中,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核;140,将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,其中,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核;150,融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量;160,使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵;以及,170,将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值。
图3为根据本申请实施例的基于云计算的自助数据分析方法的架构示意图。如图3所示,在该网络架构中,首先,获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额;然后,对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量;接着,将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,其中,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核;然后,将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,其中,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核;接着,融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量;然后,使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵;以及,最后,将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值。
具体地,在步骤110中,获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额。如上所述,传统的数据分析方法往往需要专业的数据分析人员和昂贵的软件工具来进行,效率较低且成本较高,导致传统的数据分析方法很难应对数据量大、数据类型多样化和数据处理速度要求高的情况。因此,期望一种优化的基于云计算的自助数据分析方案。
相应地,考虑到在实际进行销售数据分析的过程中,为了能够有效且准确地预测未来的销售趋势,并制定相应的销售策略,关键在于对于企业的历史销售数据的时序隐含变化特征进行充分分析捕捉,以进行销售额的预测。但是,由于企业的历史销售数据,例如销售额在时间维度上的不同时间周期下呈现出不同的动态变化规律性,并这种变化规律的特征信息较为微弱,为小尺的隐含时序变化特征信息,难以通过传统的特征提取方式进行有效地捕捉刻画,导致对于销售额的预测精度较低。因此,在此过程中,难点在于如何进行所述销售额的时序动态变化特征信息进行充分表达,以此来准确可靠地进行未来销售额的预测,从而制定相应的销售计划来优化企业的销售策略。
在本申请的技术方案中,首先,获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额。
具体地,在步骤120中,对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量。接着,考虑到由于所述销售额在时间维度上有着时序的动态变化规律性,而时间因素又是销售额预测中非常重要的一个因素,这是由于销售额通常会受到季节性、节假日、促销活动等时间因素的影响。因此,在本申请的技术方案中,为了能够提取出所述历史销售数据中多天的销售额的时序变化特征信息,需要对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量,以此来整合所述销售额在时间维度上的时序分布信息,有利于后续进行所述历史销售数据中销售额的时序变化特征的有效提取,从而提高销售额预测的准确性。
具体地,在步骤130和步骤140中,将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,其中,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核;以及,将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,其中,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核。
然后,考虑到由于所述历史销售数据中多天的销售额在时间维度上具有着时序动态变化特征,并且所述销售额在不同的时间周期跨度下呈现出不同的变化规律性。因此,在本申请的技术方案中,使用具有不同尺度的一维卷积核的卷积神经网络模型来进行所述销售额时序输入向量的特征挖掘,以此来提取出所述销售额在不同时间跨度下的多尺度时序关联特征信息。
更具体地,将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器中进行特征挖掘,以此来提取出所述销售额在第一尺度时序跨度下的时序动态变化特征,从而得到第一尺度销售额时序关联特征向量;并且将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器进行特征提取,以提取出所述销售额在第二尺度时序跨度下的时序动态变化特征信息,从而得到第二尺度销售额时序关联特征向量。特别地,这里,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核,并且所述第一尺度和所述第二尺度不相同。
其中,将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,包括:使用所述基于第一卷积神经网络模型的第一时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第一卷积神经网络模型的第一时序序列特征提取器的最后一层的输出为所述第一尺度销售额时序关联特征向量,其中,所述基于第一卷积神经网络模型的第一时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
进一步地,将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,包括:使用所述基于第二卷积神经网络模型的第二时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第二卷积神经网络模型的第二时序序列特征提取器的最后一层的输出为所述第二尺度销售额时序关联特征向量,其中,所述基于第二卷积神经网络模型的第二时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
卷积神经网络(Convolutional Neural Network,CNN)是一种人工神经网络,在图像识别等领域有着广泛的应用。卷积神经网络可以包括输入层、隐藏层和输出层,其中,隐藏层可以包括卷积层、池化(pooling)层、激活层和全连接层等,上一层根据输入的数据进行相应的运算,将运算结果输出给下一层,输入的初始数据经过多层的运算之后得到一个最终的结果。
卷积神经网络模型利用卷积核作为特征过滤因子在图像局部特征提取方面具有非常优异的性能表现,且相较于传统的基于统计或者基于特征工程的图像特征提取算法,所述卷积神经网络模型具有更强的特征提取泛化能力和拟合能力。
具体地,在步骤150中,融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量。然后,在得到不同尺度下的关于销售额的时序动态变化特征信息后,进一步融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量,以此来表示所述销售额在不同时间周期跨度下的多尺度时序关联特征信息,即所述销售额的多尺度时序变化特征信息。
特别地,在本申请的技术方案中,这里,在融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量时,可以获得历史销售额在不同时间尺度下的关联模式特征。考虑到所述第一尺度销售额时序关联特征向量由所述第一卷积神经网络模型对所述销售额时序输入向量进行基于具有第一尺度的一维卷积核的一维卷积编码得到,而所述第二尺度销售额时序关联特征向量由所述第二卷积神经网络模型对所述销售额时序输入向量进行基于具有第二尺度的一维卷积核的一维卷积编码得到,因此,所述第一尺度销售额时序关联特征向量的特征分布相对于所述第二尺度销售额时序关联特征向量的特征分布在高维特征空间内会存在空间迁移。因此,期望提升在具有空间迁移情况下的所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量的融合效果。
因此,本申请的申请人采用类转换器空间迁移置换融合来融合所述第一尺度销售额时序关联特征向量,例如记为和所述第二尺度销售额时序关联特征向量,例如记为/>,具体表示为:通过采用类转换器空间迁移置换融合的方式,以如下融合公式来融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到所述多尺度销售额时序关联特征向量;其中,所述第一融合公式为:
其中,和/>分别是所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量,/>是所述第二尺度销售额时序关联特征向量的转置向量,/>为所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量之间的距离矩阵,/>表示所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量间的欧式距离,/>为掩码阈值超参数,且向量均为行向量,/>、/>和/>分别表示特征向量的逐位置相加、相减和相乘,/>表示矩阵乘法,/>表示/>函数,/>是所述多尺度销售额时序关联特征向量,/>是所述第一尺度销售额时序关联特征向量第/>个位置的特征值,/>是所述第二尺度销售额时序关联特征向量第/>个位置的特征值。
这里,所述类转换器空间迁移置换融合通过以所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量/>的特征值对的差分表征来对特征值对的空间距离进行类转换器机制的掩码预测,实现了所述多尺度销售额时序关联特征向量/>在高维特征空间内的边仿射编码,并通过施加转换器的自注意力机制下的隐状态偏置,来通过所述多尺度销售额时序关联特征向量/>相对于待融合的所述第一尺度销售额时序关联特征向量/>和所述第二尺度销售额时序关联特征向量/>在转换器机制下的全局旋转和平移不变形,实现所述第一尺度销售额时序关联特征向量/>和所述第二尺度销售额时序关联特征向量/>的特征分布的空间迁移可置换性,这样,就提升了所述多尺度销售额时序关联特征向量/>对所述第一尺度销售额时序关联特征向量/>和所述第二尺度销售额时序关联特征向量/>的融合效果,从而提升了所述多尺度销售额时序关联特征向量/>的表达效果。这样,能够准确可靠地进行未来销售额的预测,从而制定相应的销售计划来优化企业的销售策略。
具体地,在步骤160中,使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵。进一步地,还考虑到由于所述销售额的时序动态变化信息在实际监测的过程中并不明显,因此,在得到所述销售额的时序多尺度动态变化特征后,期望对其进行特征表达强化。应可以理解,作为神经网络模型的学习目标,高斯密度图可以表示特征分布的单个特征值由于其概率密度而在多个特征值构成整体分布情况下的联合分布,也就是,以所述销售额的特征分布作为先验分布,来获得每个先验分布位置下由于其它先验分布位置的相关性作用下的概率密度以作为后验分布,从而在更高维度上更准确地描述特征分布。
因此,在本申请的技术方案中,可以通过所述销售额的先验分布,即高斯分布,来对于所述销售额的时序多尺度动态隐含关联特征进行数据增强,也就是,使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵,以此来更好地捕捉到销售额时序数据中的关联性特征信息,从而提高销售额预测的准确性。
其中,使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵,包括:以如下高斯公式构造所述多尺度销售额时序关联特征向量的高斯密度图;其中,所述高斯公式为:
其中,表示所述多尺度销售额时序关联特征向量,且/>的每个位置的值表示所述多尺度销售额时序关联特征向量中各个位置的特征值之间的方差;对所述高斯密度图中各个位置的高斯分布进行高斯离散化处理以将所述高斯密度图中各个位置的高斯分布降维为一维的特征向量;以及,将所述各个位置的一维的特征向量进行二维排列以生成所述解码特征矩阵。
应可以理解,作为神经网络模型的学习目标,高斯密度图可以表示特征分布的单个特征值由于其概率密度而在多个特征值构成整体分布情况下的联合分布,也就是,以特征分布作为先验分布,来获得每个先验分布位置下由于其它先验分布位置的相关性作用下的概率密度以作为后验分布,从而在更高维度上更准确地描述特征分布。
具体地,在步骤170中,将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值。接着,进一步再将所述解码特征矩阵通过解码器进行解码回归,以得到用于表示销售额的预测值的解码值。也就是说,以特征增强后的关于所述销售额的时序多尺度变化特征信息来进行解码,从而对于销售额的趋势进行检测评估,以此来进行未来销售额的预测,以制定相应的销售计划。
其中,将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值,包括:进一步用于:使用所述解码器以如下解码公式对所述解码特征矩阵进行解码回归以得到所述解码值;其中,所述解码公式为:,其中,/>表示所述解码特征矩阵,/>表示所述解码值,/>表示权重矩阵,/>表示偏置向量,/>表示矩阵乘。
综上,基于本申请实施例的基于云计算的自助数据分析方法100被阐明,其获取由企业用户上传至云计算平台的历史销售数据;采用基于深度学习的人工智能技术,进行所述销售额的时序动态变化特征信息进行充分表达,以此来准确可靠地进行未来销售额的预测,从而制定相应的销售计划来优化企业的销售策略。
在本申请的一个实施例中,图4为根据本申请实施例的基于云计算的自助数据分析系统的框图。如图4所示,根据本申请实施例的基于云计算的自助数据分析系统200,包括:数据获取模块210,用于获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额;向量排列模块220,用于对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量;第一时序特征提取模块230,用于将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,其中,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核;第二时序特征提取模块240,用于将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,其中,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核;融合模块250,用于融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量;高斯强化模块260,用于使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵;以及,解码模块270,用于将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值。
在一个具体示例中,在上述基于云计算的自助数据分析系统中,所述第一时序特征提取模块,用于:使用所述基于第一卷积神经网络模型的第一时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第一卷积神经网络模型的第一时序序列特征提取器的最后一层的输出为所述第一尺度销售额时序关联特征向量,其中,所述基于第一卷积神经网络模型的第一时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
在一个具体示例中,在上述基于云计算的自助数据分析系统中,所述第二时序特征提取模块,用于:使用所述基于第二卷积神经网络模型的第二时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第二卷积神经网络模型的第二时序序列特征提取器的最后一层的输出为所述第二尺度销售额时序关联特征向量,其中,所述基于第二卷积神经网络模型的第二时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
在一个具体示例中,在上述基于云计算的自助数据分析系统中,所述第一尺度不等于所述第二尺度。
在一个具体示例中,在上述基于云计算的自助数据分析系统中,所述融合模块,用于:通过采用类转换器空间迁移置换融合的方式,以如下融合公式来融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到所述多尺度销售额时序关联特征向量;其中,所述第一融合公式为:
其中,和/>分别是所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量,/>是所述第二尺度销售额时序关联特征向量的转置向量,/>为所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量之间的距离矩阵,/>表示所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量间的欧式距离,/>为掩码阈值超参数,且向量均为行向量,/>、/>和/>分别表示特征向量的逐位置相加、相减和相乘,/>表示矩阵乘法,/>表示/>函数,/>是所述多尺度销售额时序关联特征向量,/>是所述第一尺度销售额时序关联特征向量第/>个位置的特征值,/>是所述第二尺度销售额时序关联特征向量第/>个位置的特征值。
在一个具体示例中,在上述基于云计算的自助数据分析系统中,所述高斯强化模块,包括:高斯单元,用于以如下高斯公式构造所述多尺度销售额时序关联特征向量的高斯密度图;其中,所述高斯公式为:
其中,表示所述多尺度销售额时序关联特征向量,且/>的每个位置的值表示所述多尺度销售额时序关联特征向量中各个位置的特征值之间的方差;离散化单元,用于对所述高斯密度图中各个位置的高斯分布进行高斯离散化处理以将所述高斯密度图中各个位置的高斯分布降维为一维的特征向量;以及,二维排列单元,用于将所述各个位置的一维的特征向量进行二维排列以生成所述解码特征矩阵。
在一个具体示例中,在上述基于云计算的自助数据分析系统中,所述解码模块,用于:进一步用于:使用所述解码器以如下解码公式对所述解码特征矩阵进行解码回归以得到所述解码值;其中,所述解码公式为:,其中,/>表示所述解码特征矩阵,/>表示所述解码值,/>表示权重矩阵,/>表示偏置向量,/>表示矩阵乘。
这里,本领域技术人员可以理解,上述基于云计算的自助数据分析系统中的各个单元和模块的具体功能和操作已经在上面参考图1到图3的基于云计算的自助数据分析方法的描述中得到了详细介绍,并因此,将省略其重复描述。
如上所述,根据本申请实施例的基于云计算的自助数据分析系统200可以实现在各种终端设备中,例如用于基于云计算的自助数据分析的服务器等。在一个示例中,根据本申请实施例的基于云计算的自助数据分析系统200可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该基于云计算的自助数据分析系统200可以是该终端设备的操作系统中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该基于云计算的自助数据分析系统200同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该基于云计算的自助数据分析系统200与该终端设备也可以是分立的设备,并且基于云计算的自助数据分析系统200可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
在本申请的一个实施例中,还提供一种存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如所述的基于云计算的自助数据分析方法。
本申请还提供了一种计算机程序产品,所述计算机程序产品包括指令,当所述指令被执行时,以使得装置执行对应于上述方法中的操作。
在本申请的一个实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述所述方法的计算机程序。
应可以理解,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。
本申请实施例的方法、系统、和计算机程序产品的流程图和/或框图来描述的。应理解可由计算机程序指令实现流程图和/或框图中的每一流程和/或方框、以及流程图和/或框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的步骤。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (8)

1.一种基于云计算的自助数据分析方法,其特征在于,包括:
获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额;
对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量;
将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,其中,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核;
将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,其中,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核;
融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量;
使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵;
以及将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值;
所述融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量,包括:
通过采用类转换器空间迁移置换融合的方式,以如下融合公式来融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到所述多尺度销售额时序关联特征向量;
其中,第一融合公式为:
其中,和/>分别是所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量,/>是所述第二尺度销售额时序关联特征向量的转置向量,/>为所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量之间的距离矩阵,/>表示所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量间的欧式距离,/>为掩码阈值超参数,且向量均为行向量,/>、/>和/>分别表示特征向量的逐位置相加、相减和相乘,/>表示矩阵乘法,/>表示/>函数,/>是所述多尺度销售额时序关联特征向量,/>是所述第一尺度销售额时序关联特征向量第/>个位置的特征值,/>是所述第二尺度销售额时序关联特征向量第/>个位置的特征值;
所述将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值,包括:使用所述解码器以如下解码公式对所述解码特征矩阵进行解码回归以得到所述解码值;
其中,所述解码公式为:,其中,/>表示所述解码特征矩阵,/>表示所述解码值,/>表示权重矩阵,/>表示偏置向量,/>表示矩阵乘。
2.根据权利要求1所述的基于云计算的自助数据分析方法,其特征在于,将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,包括:使用所述基于第一卷积神经网络模型的第一时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第一卷积神经网络模型的第一时序序列特征提取器的最后一层的输出为所述第一尺度销售额时序关联特征向量,其中,所述基于第一卷积神经网络模型的第一时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
3.根据权利要求2所述的基于云计算的自助数据分析方法,其特征在于,将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,包括:使用所述基于第二卷积神经网络模型的第二时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第二卷积神经网络模型的第二时序序列特征提取器的最后一层的输出为所述第二尺度销售额时序关联特征向量,其中,所述基于第二卷积神经网络模型的第二时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
4.根据权利要求3所述的基于云计算的自助数据分析方法,其特征在于,所述第一尺度不等于所述第二尺度。
5.根据权利要求4所述的基于云计算的自助数据分析方法,其特征在于,使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵,包括:
以如下高斯公式构造所述多尺度销售额时序关联特征向量的高斯密度图;
其中,所述高斯公式为:
其中,/>表示所述多尺度销售额时序关联特征向量,且/>的每个位置的值表示所述多尺度销售额时序关联特征向量中各个位置的特征值之间的方差;
对所述高斯密度图中各个位置的高斯分布进行高斯离散化处理以将所述高斯密度图中各个位置的高斯分布降维为一维的特征向量;
以及将所述各个位置的一维的特征向量进行二维排列以生成所述解码特征矩阵。
6.一种基于云计算的自助数据分析系统,其特征在于,包括:
数据获取模块,用于获取由企业用户上传至云计算平台的历史销售数据,其中,所述历史销售数据包括多天的销售额;
向量排列模块,用于对所述历史销售数据中多天的销售额按照时间维度排列为销售额时序输入向量;
第一时序特征提取模块,用于将所述销售额时序输入向量通过基于第一卷积神经网络模型的第一时序序列特征提取器以得到第一尺度销售额时序关联特征向量,其中,所述第一卷积神经网络模型使用具有第一尺度的一维卷积核;
第二时序特征提取模块,用于将所述销售额时序输入向量通过基于第二卷积神经网络模型的第二时序序列特征提取器以得到第二尺度销售额时序关联特征向量,其中,所述第二卷积神经网络模型使用具有第二尺度的一维卷积核;
融合模块,用于融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到多尺度销售额时序关联特征向量;
高斯强化模块,用于使用高斯密度图对所述多尺度销售额时序关联特征向量进行特征表达强化以得到解码特征矩阵;
以及解码模块,用于将所述解码特征矩阵通过解码器进行解码回归以得到解码值,所述解码值用于表示销售额的预测值;
所述融合模块,还用于:
通过采用类转换器空间迁移置换融合的方式,以如下融合公式来融合所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量以得到所述多尺度销售额时序关联特征向量;
其中,第一融合公式为:
其中,和/>分别是所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量,/>是所述第二尺度销售额时序关联特征向量的转置向量,/>为所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量之间的距离矩阵,/>表示所述第一尺度销售额时序关联特征向量和所述第二尺度销售额时序关联特征向量间的欧式距离,/>为掩码阈值超参数,且向量均为行向量,/>、/>和/>分别表示特征向量的逐位置相加、相减和相乘,/>表示矩阵乘法,/>表示/>函数,/>是所述多尺度销售额时序关联特征向量,/>是所述第一尺度销售额时序关联特征向量第/>个位置的特征值,/>是所述第二尺度销售额时序关联特征向量第/>个位置的特征值;
所述解码模块,进一步用于:使用所述解码器以如下解码公式对所述解码特征矩阵进行解码回归以得到所述解码值;
其中,所述解码公式为:,其中,/>表示所述解码特征矩阵,/>表示所述解码值,/>表示权重矩阵,/>表示偏置向量,/>表示矩阵乘。
7.根据权利要求6所述的基于云计算的自助数据分析系统,其特征在于,所述第一时序特征提取模块,用于:使用所述基于第一卷积神经网络模型的第一时序序列特征提取器的各层在层的正向传递中对输入数据分别进行卷积处理、基于特征矩阵的均值池化处理和非线性激活处理以由所述基于第一卷积神经网络模型的第一时序序列特征提取器的最后一层的输出为所述第一尺度销售额时序关联特征向量,其中,所述基于第一卷积神经网络模型的第一时序序列特征提取器的第一层的输入为所述销售额时序输入向量。
8.一种存储介质,其特征在于,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1至5任一项中所述的基于云计算的自助数据分析方法。
CN202310682825.5A 2023-06-09 2023-06-09 一种基于云计算的自助数据分析方法、系统及存储介质 Active CN116415990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310682825.5A CN116415990B (zh) 2023-06-09 2023-06-09 一种基于云计算的自助数据分析方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310682825.5A CN116415990B (zh) 2023-06-09 2023-06-09 一种基于云计算的自助数据分析方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN116415990A CN116415990A (zh) 2023-07-11
CN116415990B true CN116415990B (zh) 2023-09-01

Family

ID=87054684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310682825.5A Active CN116415990B (zh) 2023-06-09 2023-06-09 一种基于云计算的自助数据分析方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN116415990B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117575685A (zh) * 2024-01-17 2024-02-20 之江实验室科技控股有限公司 数据分析预警系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6839682B1 (en) * 1999-05-06 2005-01-04 Fair Isaac Corporation Predictive modeling of consumer financial behavior using supervised segmentation and nearest-neighbor matching
CN113256007A (zh) * 2021-05-28 2021-08-13 浙江大学 一种面向多模态的新产品销量预测方法及装置
CN113837794A (zh) * 2021-08-26 2021-12-24 润联软件系统(深圳)有限公司 基于时空图卷积网络的连锁零售门店销售预测方法
CN114519610A (zh) * 2022-02-16 2022-05-20 支付宝(杭州)信息技术有限公司 信息预测方法以及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6839682B1 (en) * 1999-05-06 2005-01-04 Fair Isaac Corporation Predictive modeling of consumer financial behavior using supervised segmentation and nearest-neighbor matching
CN113256007A (zh) * 2021-05-28 2021-08-13 浙江大学 一种面向多模态的新产品销量预测方法及装置
CN113837794A (zh) * 2021-08-26 2021-12-24 润联软件系统(深圳)有限公司 基于时空图卷积网络的连锁零售门店销售预测方法
CN114519610A (zh) * 2022-02-16 2022-05-20 支付宝(杭州)信息技术有限公司 信息预测方法以及装置

Also Published As

Publication number Publication date
CN116415990A (zh) 2023-07-11

Similar Documents

Publication Publication Date Title
Li et al. Multiattention network for semantic segmentation of fine-resolution remote sensing images
Vadera et al. Methods for pruning deep neural networks
Su et al. Convolutional tensor-train LSTM for spatio-temporal learning
Yan et al. Pointasnl: Robust point clouds processing using nonlocal neural networks with adaptive sampling
Zhao et al. Jsnet: Joint instance and semantic segmentation of 3d point clouds
Peng et al. Spatial temporal graph deconvolutional network for skeleton-based human action recognition
Fan et al. Deep learning based matrix completion
US10152673B2 (en) Method for pseudo-recurrent processing of data using a feedforward neural network architecture
Liu et al. Fg-net: A fast and accurate framework for large-scale lidar point cloud understanding
CN116415990B (zh) 一种基于云计算的自助数据分析方法、系统及存储介质
Li et al. Skeleton-parted graph scattering networks for 3d human motion prediction
Lei et al. Ultralightweight spatial–spectral feature cooperation network for change detection in remote sensing images
CN116336400B (zh) 油气集输管道基线检测方法
CN113222998B (zh) 基于自监督低秩网络的半监督图像语义分割方法及装置
CN110993037A (zh) 一种基于多视图分类模型的蛋白质活性预测装置
Yuan et al. Compositional scene representation learning via reconstruction: A survey
CN114419464A (zh) 一种基于深度学习的孪生网络变化检测模型
Wang et al. Fast and efficient algorithm for matrix completion via closed-form 2/3-thresholding operator
Li et al. Fixed-sign binary neural network: An efficient design of neural network for Internet-of-Things devices
Lee et al. Diverse temporal aggregation and depthwise spatiotemporal factorization for efficient video classification
Dou et al. Background subtraction based on circulant matrix
Li et al. Nonlocal band attention network for hyperspectral image band selection
Fu et al. Nonlocal spatial–spectral neural network for hyperspectral image denoising
Yuan et al. Sparse structural feature selection for multitarget regression
Wang et al. A parametric model for describing the correlation between single color images and depth maps

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant