WO2021139335A1 - 物理机销售数据预测方法、装置、计算机设备及存储介质 - Google Patents

物理机销售数据预测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
WO2021139335A1
WO2021139335A1 PCT/CN2020/124661 CN2020124661W WO2021139335A1 WO 2021139335 A1 WO2021139335 A1 WO 2021139335A1 CN 2020124661 W CN2020124661 W CN 2020124661W WO 2021139335 A1 WO2021139335 A1 WO 2021139335A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
user behavior
sales
time interval
vector sequence
Prior art date
Application number
PCT/CN2020/124661
Other languages
English (en)
French (fr)
Inventor
田玉凯
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2021139335A1 publication Critical patent/WO2021139335A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Definitions

  • This application relates to the field of artificial intelligence technology, in particular to a physical machine sales data method, device, computer equipment and storage medium.
  • the physical machine is a dedicated physical server that can be leased directly, which can provide excellent computing performance.
  • a physical machine can provide a virtual machine with a hardware environment, sometimes called a "host” or "host".
  • the sales situation of a physical machine in a later period of time is usually predicted based on the experience of the salesperson, and the result of artificial prediction is usually limited and low in accuracy. This makes it impossible for merchants to prepare the resource pool of physical machines in advance, and it is extremely prone to insufficient or surplus stocks.
  • the embodiments of the present application provide a physical machine sales data prediction method, device, computer equipment, and storage medium, aiming to improve the accuracy of physical machine sales data prediction.
  • an embodiment of the present application provides a method for predicting physical machine sales data, which includes:
  • the encoding and decoding model including an LSTM encoder and an LSTM decoder with an attention mechanism;
  • the sales data of the physical machine in the time interval to be measured is predicted according to the codec model after training, and the prediction result is output.
  • an embodiment of the present application also provides a physical machine sales data prediction device, which includes:
  • the first acquiring unit is configured to acquire user behavior data and sales data of the physical machine sales platform in a preset time period, where the preset time period includes multiple time intervals with the same time step;
  • a preprocessing unit that preprocesses the user behavior data and sales data of the preset time period to obtain the user behavior sample data and the sales sample data of the preset time period;
  • the second acquiring unit is configured to acquire the user behavior data vector sequence and the sales data vector sequence of each time interval according to the user behavior sample data and the sales sample data of the preset time period;
  • the training unit trains the pre-built codec model according to the user behavior data vector sequence and the sales data vector sequence of each time interval, the codec model includes an LSTM encoder and an LSTM decoder with an attention mechanism;
  • the first prediction unit is configured to, if the time interval to be measured is received, predict the sales data of the physical machine in the time interval to be measured according to the trained codec model and output the prediction result.
  • an embodiment of the present application also provides a computer device, the computer device includes a memory and a processor, the memory stores a computer program, and the processor is used to run the computer program to perform the following steps :
  • the encoding and decoding model including an LSTM encoder and an LSTM decoder with an attention mechanism;
  • the sales data of the physical machine in the time interval to be measured is predicted according to the codec model after training, and the prediction result is output.
  • the embodiments of the present application also provide a computer-readable storage medium that stores a computer program, wherein when the computer program is executed by a processor, the processor executes the following steps :
  • the encoding and decoding model including an LSTM encoder and an LSTM decoder with an attention mechanism;
  • the sales data of the physical machine in the time interval to be measured is predicted according to the codec model after training, and the prediction result is output.
  • FIG. 1 is a schematic flowchart of a method for predicting sales data of a physical machine according to an embodiment of the application
  • FIG. 2 is a schematic diagram of a sub-process of a method for predicting sales data of a physical machine according to an embodiment of the application;
  • FIG. 3 is a schematic diagram of a sub-process of a method for predicting sales data of a physical machine according to an embodiment of the application;
  • FIG. 4 is a schematic diagram of a sub-process of a method for predicting sales data of a physical machine according to an embodiment of the application;
  • FIG. 5 is a schematic diagram of a sub-process of a method for predicting sales data of a physical machine according to an embodiment of the application
  • FIG. 6 is a schematic diagram of a sub-process of a method for predicting sales data of a physical machine according to an embodiment of the application;
  • FIG. 7 is a schematic block diagram of an apparatus for predicting sales data of a physical machine according to an embodiment of the application.
  • FIG. 8 is a schematic block diagram of a first obtaining unit of a physical machine sales data prediction device provided by an embodiment of the application.
  • FIG. 9 is a schematic block diagram of a preprocessing unit of a physical machine sales data prediction device provided by an embodiment of the application.
  • FIG. 10 is a schematic block diagram of a second obtaining unit of a physical machine sales data prediction apparatus provided by an embodiment of the application.
  • FIG. 11 is a schematic block diagram of a first prediction unit of a physical machine sales data prediction apparatus provided by an embodiment of the application;
  • FIG. 12 is a schematic block diagram of a ninth obtaining unit of a first prediction unit of a physical machine sales data prediction apparatus according to an embodiment of the application;
  • FIG. 13 is a schematic block diagram of a computer device provided by an embodiment of this application.
  • the term “if” can be interpreted as “when” or “once” or “in response to determination” or “in response to detection” depending on the context .
  • the phrase “if determined” or “if detected [described condition or event]” can be interpreted as meaning “once determined” or “in response to determination” or “once detected [described condition or event]” depending on the context ]” or “in response to detection of [condition or event described]”.
  • FIG. 1 is a schematic flowchart of a method for predicting sales data of a physical machine provided by an embodiment of the present application.
  • This application can be applied to smart government affairs/smart city management/smart communities/smart security/smart logistics/smart healthcare/smart education/smart environmental protection/smart transportation scenarios to promote the construction of smart cities.
  • the method can be applied to a terminal, and the method includes the following steps S1-S5.
  • the user behavior data and sales data of the physical machine sales platform in a preset time period are acquired, and the preset time period includes a plurality of time intervals with the same time step.
  • the physical machine sales platform refers to a platform for selling physical machines, and can be specifically a sales website platform.
  • the preset time period refers to a time period set by the user.
  • the preset time period is the last two years.
  • the time step can be set by the user. For example, in one embodiment, the time step is set to one week.
  • User behavior data refers to the behavior data left by the user on the physical machine sales platform.
  • the user behavior data can specifically include the user's clicks, consultations, and forwarding data.
  • Sales data refers to data such as the number of physical machines sold (leased) by the physical machine sales platform and the physical machine model.
  • step S1 specifically includes the following steps S11-S12.
  • S11 Send a data retrieval request to a preset sales history data server, where the data retrieval request includes the preset time period.
  • the physical machine sales platform collects and stores user behavior data and sales data to the sales history data server.
  • the sales historical data server refers to a server used to store historical data.
  • the terminal sends a data retrieval request to the sales history data server, where the data retrieval request includes the preset time period.
  • the sales history data server when the sales history data server receives the data retrieval request, it retrieves the user behavior data and the sales data within the preset time period and sends them to the terminal.
  • S12 Receive a response message returned by the sales history data server, where the response message includes user behavior data and sales data within the preset time period.
  • the terminal receives a response message returned by the sales history data server, where the response message includes user behavior data and sales data within the preset time period.
  • the user behavior data of the preset time period is preprocessed to obtain user behavior sample data of the preset time period.
  • the sales data of the preset time period is preprocessed to obtain the sales cost data of the preset time period.
  • preprocessing is to standardize user behavior data and sales data to facilitate further data mining.
  • the above step S2 specifically includes the following steps S21-S22.
  • S21 Perform data cleaning processing on the user behavior data and sales data of the preset time period.
  • data cleaning processing is performed on the user behavior data and sales data of the preset time period.
  • Data cleaning includes filling in missing values and correcting outliers.
  • it can fill in missing values and correct outliers through means such as mean interpolation, homogeneous mean interpolation, modeling prediction, high-dimensional mapping, multiple interpolation, and maximum likelihood estimation.
  • S22 Perform normalization processing on the user behavior data and sales data for the preset time period after the data cleaning processing.
  • normalization processing is performed on the user behavior data and sales data for the preset time period after the data cleaning processing.
  • Normalization processing means to limit the data to be processed (normalization algorithm) within a certain range.
  • the normalization process can make the subsequent data processing convenient, and secondly, it can ensure that the model runs faster and converges.
  • the specific function of normalization is to summarize the statistical distribution of a uniform sample.
  • S3 Obtain a vector sequence of user behavior data and a vector sequence of sales data in each time interval according to the user behavior sample data and the sales sample data of the preset time period.
  • step S3 The purpose of step S3 is to obtain training data of a pre-built encoding and decoding model.
  • step S3 specifically includes the following steps S31-S36.
  • user behavior sample data in each of the time intervals is obtained.
  • the user behavior sample data of each time interval are respectively intercepted from the user behavior sample data of the preset time period.
  • the user behavior data vector of each time interval is obtained according to the user behavior sample data of each time interval.
  • a key figure factor is extracted from the user behavior sample data in the time interval, and a user behavior data vector in the time interval is constructed according to the extracted key figure factor.
  • the user behavior sample data in the time interval is: the amount of clicks is 100, the amount of consultation is 10, and the amount of forwarding is 10.
  • the key figure factor that can be extracted from the click volume is 100;
  • the key figure factor that can be extracted from the consultation volume is 10;
  • the key figure factor that can be extracted from the forwarding volume is 10;
  • the constructed user behavior data vector is (100, 10, 10).
  • the user behavior data vector sequence of each time interval is obtained, wherein the user behavior data vector sequence of the time interval is obtained by concatenating the user behavior data vectors of the first n time intervals of the time interval, and n is default value.
  • n is set to 10.
  • the user behavior data vectors of the first n time intervals of the time interval are X1, X2...Xn, respectively.
  • X1X2...Xn is the user behavior data vector sequence of the time interval.
  • n is set to 10. The first 10 time intervals are discarded.
  • the sales sample data of each time interval is obtained.
  • the sales sample data of each time interval are respectively intercepted from the sales sample data of the preset time period.
  • S35 Acquire the sales data vector of each time interval according to the sales sample data of each time interval.
  • the sales data vector of each time interval is obtained according to the sales sample data of each time interval.
  • a key figure factor is extracted from the sales sample data of the time interval, and a sales data vector of the time interval is constructed according to the extracted key figure factor.
  • the sales sample data for the time interval is: model a has a sales volume of 10, model b has sold 5, and model c has sold 5.
  • the key figure factor that can be extracted from the sales volume of model b is 5;
  • the key figure factor that can be extracted from the sales volume of model c is 5;
  • the constructed sales data vector is (10, 5, 5).
  • the sales data vector sequence of each time interval is acquired, wherein the sales data vector sequence of the time interval is determined by the sales data vector sequence of the time interval and the first n-1 time intervals of the time interval.
  • the sales data vector is spliced together.
  • n is the preset value. For example, in one embodiment, n is set to 10.
  • the sales data vector of the time interval is Yn
  • the sales data vectors of the first n-1 time intervals of the time interval are Y1, Y2...Yn-1.
  • the Y1, Y2...Yn are spliced in order to obtain Y1Y2...Yn which is the sales data vector sequence of the time interval.
  • n is set to 10.
  • the first 9 time intervals are discarded.
  • steps S31-S33 and steps S34-S36 are not executed sequentially. Alternatively, steps S31-S33 and steps S34-S36 can be executed in parallel.
  • the encoding and decoding model including an LSTM encoder and an LSTM decoder with an attention mechanism introduced.
  • the pre-built codec model is trained according to the user behavior data vector sequence and the sales data vector sequence of each time interval.
  • the codec model includes an LSTM encoder and an LSTM decoder with an attention mechanism. .
  • an end-to-end model structure is constructed, specifically an Encoder-Decoder model.
  • the encoding and decoding model includes an LSTM encoder and an LSTM decoder that introduces an attention mechanism (Attention).
  • LSTM Long Short-Term Memory
  • the Attention mechanism is used to label the output characteristics of each data node of the LSTM encoder in the observation window, and respectively label the weight value corresponding to the prediction result output by each data node of the LSTM decoder in the performance window; where,
  • the weight value represents the characteristics of the output of each data node in the observation window of the LSTM encoder, and corresponds to the degree of contribution (also referred to as the degree of influence) of the prediction result output by each data node in the performance window of the LSTM decoder.
  • the user behavior data vector sequence is the input sequence
  • the sales data vector sequence is the output sequence.
  • an intermediate feature vector is obtained and then decoded.
  • the device decodes the intermediate feature vector to obtain the sales data vector sequence. details as follows:
  • y i g(C, y 1 , y 2 ... y i-1 ⁇
  • X is the input sequence
  • Y is the output sequence
  • C is the intermediate feature vector.
  • the encoder converts the input sequence X into an intermediate feature vector C, and then the decoder performs processing according to the intermediate feature vector C generated by the encoder Decoding generates y i .
  • the user behavior data vector sequence in the time interval is used as the input of the encoding and decoding model
  • the sales data vector sequence in the time interval is used as the output of the encoding and decoding model to train the encoding and decoding model.
  • the training process of training the encoding and decoding model is the process of adjusting the parameters of the encoding and decoding model.
  • the household behavior data vector sequence of the time interval to be measured is input into the codec model after training, and the codec model after training is used to compare the codec
  • the sales data of the physical machine in the measured time interval is predicted and the forecast result is output.
  • the time interval to be measured refers to a time interval that has not yet arrived, for example, 10 days in the future.
  • the purpose of this application is to predict the sales data of physical machines in a certain period of time in the future (for example, the next 10 days).
  • the above step S5 specifically includes the following steps S51-S53.
  • S51 Acquire a user behavior data vector sequence in the time interval to be measured.
  • the user behavior data vector sequence of the time interval to be measured is obtained.
  • the user behavior data vector sequence of the first n time intervals of the time interval to be measured is obtained, and the user behavior data vector sequence of the n time intervals obtained is spliced to obtain the user behavior of the time interval to be measured Data vector sequence.
  • n is a preset value, for example, in one embodiment, n is 10.
  • step S51 specifically includes the following steps S511-S512.
  • S511 Acquire user behavior data vectors of the first n time intervals of the time interval to be measured.
  • the user behavior data vectors of the first n time intervals of the time interval to be tested are acquired.
  • the user behavior data vectors of the first n time intervals of the time interval to be measured are spliced to obtain the user behavior data vector sequence of the time interval to be measured.
  • the user behavior data vectors of the first n time intervals of the time interval to be measured are R1, R2...Rn.
  • R1R2...Rn is the user behavior data vector sequence of the time interval.
  • S52 Input the user behavior data vector sequence of the time interval to be measured into the trained LSTM encoder of the encoding and decoding model to obtain an intermediate feature vector.
  • the user behavior data vector sequence of the time interval to be measured is input into the LSTM encoder of the codec model after training, and the LSTM encoder performs the data vector sequence of the user behavior data in the time interval to be measured. Perform encoding to obtain the intermediate feature vector.
  • S53 Input the intermediate feature vector into the LSTM decoder of the codec model after training to obtain a prediction result of the sales data of the time interval to be measured.
  • the intermediate feature vector is input into the LSTM decoder of the codec model after training, and the intermediate feature vector is decoded by the LSTM decoder of the codec model after training to obtain The prediction result of the sales data in the time interval to be tested.
  • the technical solution of the embodiment of the present application obtains user behavior data and sales data of a physical machine sales platform within a preset time period; preprocessing the user behavior data and sales data of the preset time period to obtain the preset time period User behavior sample data and sales sample data; obtain the user behavior data vector sequence and sales data vector sequence of each time interval according to the user behavior sample data and the sales sample data of the preset time interval; according to the users in each time interval
  • the behavioral data vector sequence and the sales data vector sequence train the pre-built encoding and decoding model; if the time interval to be tested is received, the sales data of the physical machine in the time interval to be tested is performed according to the trained encoding and decoding model. Predict and output the predicted results.
  • FIG. 7 is a schematic block diagram of a device 70 for predicting sales data of a physical machine according to an embodiment of the present application.
  • the present application also provides a physical machine sales data prediction device 70.
  • the physical machine sales data forecasting device 70 includes a unit for executing the above-mentioned physical machine sales data forecasting method.
  • the physical machine sales data forecasting device 70 can be configured in a desktop computer, a tablet computer, a laptop computer, and other terminals.
  • the physical machine sales data prediction device 70 includes a first acquisition unit 71, a preprocessing unit 72, a second acquisition unit 73, a training unit 74, and a first prediction unit 75.
  • the first acquiring unit 71 is configured to acquire user behavior data and sales data of the physical machine sales platform in a preset time period, where the preset time period includes multiple time intervals with the same time step;
  • the preprocessing unit 72 preprocesses the user behavior data and sales data of the preset time period to obtain user behavior sample data and sales sample data of the preset time period;
  • the second acquiring unit 73 is configured to acquire the user behavior data vector sequence and the sales data vector sequence of each time interval according to the user behavior sample data and the sales sample data of the preset time period;
  • the training unit 74 trains a pre-built codec model according to the user behavior data vector sequence and the sales data vector sequence of each time interval, the codec model includes an LSTM encoder and an LSTM decoder with an attention mechanism ;
  • the first prediction unit 75 is configured to, if the time interval to be measured is received, predict the sales data of the physical machine in the time interval to be measured according to the trained codec model and output the prediction result.
  • the first acquiring unit 71 includes a sending unit 711 and a receiving unit 712.
  • the sending unit 711 is configured to send a data retrieval request to a preset sales history data server, where the data retrieval request includes the preset time period;
  • the receiving unit 712 is configured to receive a response message returned by the sales history data server, where the response message includes user behavior data and sales data within the preset time period.
  • the preprocessing unit 72 includes a data cleaning unit 721 and a normalization unit 722.
  • the data cleaning unit 721 is configured to perform data cleaning processing on the user behavior data and sales data of the preset time period
  • the normalization unit 722 is configured to perform normalization processing on the user behavior data and sales data for the preset time period after the data cleaning processing.
  • the second acquiring unit 73 includes a third acquiring unit 731, a fourth acquiring unit 732, a fifth acquiring unit 733, a sixth acquiring unit 734, and a seventh acquiring unit 735, Eighth obtaining unit 736.
  • the third acquiring unit 731 is configured to acquire user behavior sample data in each time interval
  • the fourth obtaining unit 732 is configured to obtain the user behavior data vector of each time interval according to the user behavior sample data of each time interval;
  • the fifth acquiring unit 733 is configured to acquire the user behavior data vector sequence of each time interval, wherein the user behavior data vector sequence of the time interval is spliced by the user behavior data vectors of the first n time intervals of the time interval Obtained, n is the preset value;
  • the sixth obtaining unit 734 is configured to obtain the sales sample data of each time interval
  • the seventh obtaining unit 735 is configured to obtain the sales data vector of each time interval according to the sales sample data of each time interval;
  • the eighth obtaining unit 736 is configured to obtain the sales data vector sequence of each time interval, wherein the sales data vector sequence of the time interval is composed of the sales data vector of the time interval and the first n-1 of the time interval The sales data vectors of two time intervals are spliced together.
  • the first prediction unit 75 includes a ninth acquisition unit 751, an input unit 752 and a second prediction unit 753.
  • the ninth obtaining unit 751 is configured to obtain the user behavior data vector sequence of the time interval to be measured
  • the input unit 752 is configured to input the user behavior data vector sequence of the time interval to be measured into the trained LSTM encoder of the encoding and decoding model to obtain an intermediate feature vector;
  • the second prediction unit 753 is configured to input the intermediate feature vector into the LSTM decoder of the trained codec model to obtain a prediction result of the sales data in the time interval to be measured.
  • the ninth obtaining unit 751 includes a tenth obtaining unit 7511 and a splicing unit 7512.
  • the tenth obtaining unit 7511 is configured to obtain user behavior data vectors in the first n time intervals of the time interval to be measured;
  • the splicing unit 7512 is configured to splice the user behavior data vectors of the first n time intervals of the time interval to be measured to obtain the user behavior data vector sequence of the time interval to be measured.
  • the above-mentioned physical machine sales data forecasting apparatus can be implemented in the form of a computer program, and the computer program can be run on a computer device as shown in FIG. 12.
  • the computer device 500 may be a terminal or a server, where the terminal may be an electronic device with communication functions such as a smart phone, a tablet computer, a notebook computer, a desktop computer, a personal digital assistant, and a wearable device.
  • the server can be an independent server or a server cluster composed of multiple servers.
  • the computer device 500 includes a processor 502, a memory, and a network interface 505 connected through a system bus 501, where the memory may include a non-volatile storage medium 503 and an internal memory 504.
  • the non-volatile storage medium 503 can store an operating system 5031 and a computer program 5032.
  • the processor 502 can execute a physical machine sales data prediction method.
  • the processor 502 is used to provide calculation and control capabilities to support the operation of the entire computer device 500.
  • the internal memory 504 provides an environment for the operation of the computer program 5032 in the non-volatile storage medium 503.
  • the processor 502 can make the processor 502 execute a physical machine sales data prediction method.
  • the network interface 505 is used for network communication with other devices.
  • the structure shown in FIG. 12 is only a block diagram of part of the structure related to the solution of the present application, and does not constitute a limitation on the computer device 500 to which the solution of the present application is applied.
  • the specific computer device 500 may include more or fewer components than shown in the figure, or combine certain components, or have a different component arrangement.
  • the processor 502 is configured to run a computer program 5032 stored in a memory to implement the physical machine sales data prediction method proposed in this application.
  • the processor 502 may be a central processing unit (Central Processing Unit, CPU), and the processor 502 may also be other general-purpose processors, digital signal processors (Digital Signal Processors, DSPs), and special purpose processors.
  • Integrated circuit Application Specific Integrated Circuit, ASIC
  • off-the-shelf programmable gate array Field-Programmable Gate Array, FPGA
  • the general-purpose processor may be a microprocessor or the processor may also be any conventional processor.
  • the computer program may be stored in a storage medium, and the storage medium is a computer-readable storage medium.
  • the computer program is executed by at least one processor in the computer system to implement the process steps of the foregoing method embodiment.
  • the storage medium may be a computer-readable storage medium.
  • the storage medium stores a computer program.
  • the processor executes the physical machine sales data prediction method proposed in this application.
  • the storage medium is a physical, non-transitory storage medium, such as a U disk, a mobile hard disk, a read-only memory (Read-Only Memory, ROM), a magnetic disk, or an optical disk, etc., which can store program codes. medium.
  • the computer-readable storage medium may be non-volatile or volatile.
  • the disclosed device and method may be implemented in other ways.
  • the device embodiments described above are only illustrative.
  • the division of each unit is only a logical function division, and there may be other division methods in actual implementation.
  • multiple units or components can be combined or integrated into another system, or some features can be omitted or not implemented.
  • the steps in the method in the embodiment of the present application can be adjusted, merged, and deleted in order according to actual needs.
  • the units in the devices in the embodiments of the present application may be combined, divided, and deleted according to actual needs.
  • the functional units in the various embodiments of the present application may be integrated into one processing unit, or each unit may exist alone physically, or two or more units may be integrated into one unit.
  • the integrated unit is implemented in the form of a software functional unit and sold or used as an independent product, it can be stored in a storage medium.
  • the technical solution of this application is essentially or the part that contributes to the existing technology, or all or part of the technical solution can be embodied in the form of a software product, and the computer software product is stored in a storage medium. It includes several instructions to make a computer device (which may be a personal computer, a terminal, or a network device, etc.) execute all or part of the steps of the methods described in the various embodiments of the present application.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种物理机销售数据预测方法、装置、计算机设备及存储介质,涉及人工智能技术领域,包括:获取预设时段内的用户行为数据以及销售数据;对预设时段的用户行为数据以及销售数据进行预处理;获取各时间区间的用户行为数据向量序列以及销售数据向量序列;对预构建的编码解码模型进行训练;若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。

Description

物理机销售数据预测方法、装置、计算机设备及存储介质
本申请要求于2020年07月28日提交中国专利局,申请号为202010738679.X,发明名称为“物理机销售数据预测方法、装置、计算机设备及存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种物理机销售数据方法、装置、计算机设备及存储介质。
背景技术
物理机是一种可以直接租赁的专用物理服务器,其能提供卓越的计算性能。物理机能够提供给虚拟机以硬件环境,有时也称为"寄主"或"宿主"。
发明人发现,随着云计算技术的快速发展,物理机的销售(租赁)变得越来越流行。现有技术中,通常根据销售人员的经验来预测物理机在后一段时间内的销售情况,人为预测的结果通常局限性较大,准确性低。使得商家无法提前准备物理机的资源池,极易出现备货不足或者过剩的现象。
发明内容
本申请实施例提供了一种物理机销售数据预测方法、装置、计算机设备及存储介质,旨在解决提高对物理机销售数据预测的准确性。
第一方面,本申请实施例提供了一种物理机销售数据预测方法,其包括:
获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间;
对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据;
根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;
根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器;
若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
第二方面,本申请实施例还提供了一种物理机销售数据预测装置,其包括:
第一获取单元,用于获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间;
预处理单元,对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据;
第二获取单元,用于根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;
训练单元,根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器;
第一预测单元,用于若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
第三方面,本申请实施例还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器用于运行所述计算机程序,以执行如下步骤:
获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间;
对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据;
根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;
根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器;
若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时使所述处理器执行以下步骤:
获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间;
对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据;
根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;
根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器;
若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种物理机销售数据预测方法的流程示意图;
图2为本申请实施例提供的一种物理机销售数据预测方法的子流程示意图;
图3为本申请实施例提供的一种物理机销售数据预测方法的子流程示意图;
图4为本申请实施例提供的一种物理机销售数据预测方法的子流程示意图;
图5为本申请实施例提供的一种物理机销售数据预测方法的子流程示意图;
图6为本申请实施例提供的一种物理机销售数据预测方法的子流程示意图;
图7为本申请实施例提供的一种物理机销售数据预测装置的示意性框图;
图8为本申请实施例提供的一种物理机销售数据预测装置的第一获取单元的示意性框图;
图9为本申请实施例提供的一种物理机销售数据预测装置的预处理单元的示意性框图;
图10为本申请实施例提供的一种物理机销售数据预测装置的第二获取单元的示意性框图;
图11为本申请实施例提供的一种物理机销售数据预测装置的第一预测单元的示意性框图;
图12为本申请实施例提供的一种物理机销售数据预测装置的第一预测单元的第九获取单元的示意性框图;
图13为本申请实施例提供的一种计算机设备的示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
图1是本申请实施例提供的物理机销售数据预测方法的流程示意图。本申请可应用于智慧政务/智慧城管/智慧社区/智慧安防/智慧物流/智慧医疗/智慧教育/智慧环保/智慧交通场景中,从而推动智慧城市的建设。如图所示,该方法可应用于终端中,该方法包括以下步骤S1-S5。
S1,获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间。
具体实施中,获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间。
需要说明的是,物理机销售平台是指销售物理机的平台,可具体为销售网站平台。
预设时段是指用户设定的时段,例如,在一实施例中,预设时段为最近两年。
时间步长可由用户设定,例如,在一实施例中,时间步长设定为一周。
用户行为数据是指用户在物理机销售平台上留下的行为数据,用户行为数据可具体包括用户的点击量、咨询量以及转发量等数据。
销售数据是指物理机销售平台对物理机的销售(租赁)数量、物理机型号等数据。
参见图2,在一实施例中,以上步骤S1具体包括如下步骤S11-S12。
S11,向预设的销售历史资料服务器发送数据调取请求,所述数据调取请求包括所述预设时段。
具体实施中,物理机销售平台采集并储存用户行为数据以及销售数据到销售历史资料服务器中。销售历史资料服务器是指用来储存历史资料的服务器。
终端向销售历史资料服务器发送数据调取请求,所述数据调取请求包括所述预设时段。
相应地,销售历史资料服务器在接收到数据调取请求时,调取预设时段内的用户行为数据以及销售数据,并发送给终端。
S12,接收所述销售历史资料服务器返回的应答消息,所述应答消息包含所述预设时段内的用户行为数据以及销售数据。
具体实施中,终端接收所述销售历史资料服务器返回的应答消息,所述应答消息包含所述预设时段内的用户行为数据以及销售数据。
S2,对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据。
具体实施中,对所述预设时段的用户行为数据进行预处理以得到所述预设时段的用户行为样本数据。
进一步地,对所述预设时段的销售数据进行预处理以得到所述预设时段的销售本数据。
预处理的目的在于把用户行为数据以及销售数据规范化,便于进一步进行数据挖掘。
可以理解地,本申请中,对用户行为数据以及销售数据进行预处理没有先后顺序,或者,二者可并行执行。
参见图3,在一实施例中,以上步骤S2具体包括如下步骤S21-S22。
S21,对所述预设时段的用户行为数据以及销售数据进行数据清洗处理。
具体实施中,对所述预设时段的用户行为数据以及销售数据进行数据清洗处理。
数据清洗处理包括填补缺失值以及修正异常值等处理。
具体可,通过均值插补、同类均值插补、建模预测、高维映射、多重插补以及极大似然估计等方式来填补缺失值以及修正异常值。
S22,对数据清洗处理后的所述预设时段的用户行为数据以及销售数据进行归一化处理。
具体实施中,对数据清洗处理后的所述预设时段的用户行为数据以及销售数据进行归一化处理。
归一化处理,就是要把需要处理的数据经过处理后(归一化算法)限制在设定的一定范围 内。
归一化处理一方面可使得后续数据处理的方便,其次是保证模型运行时收敛加快。归一化的具体作用是归纳统一样本的统计分布性。
S3,根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列。
具体实施中,首先获取各个时间区间的用户行为样本数据以及销售样本数据;然后根据各个时间区间的用户行为样本数据以及销售样本数据获取各个时间区间的用户行为数据向量以及销售数据向量;最后分别对各个时间区间的用户行为数据向量以及销售数据向量进行拼接以得到各个时间区间的用户行为数据向量序列以及销售数据向量序列。
步骤S3的目的在于获取预构建的编码解码模型的训练数据。
参见图4,在一实施例中,以上步骤S3具体包括如下步骤S31-S36。
S31,获取各所述时间区间的用户行为样本数据。
具体实施中,获取各所述时间区间的用户行为样本数据。
具体地,从预设时段的用户行为样本数据中分别截取各时间区间的用户行为样本数据。
S32,分别根据各所述时间区间的用户行为样本数据获取各所述时间区间的用户行为数据向量。
具体实施中,分别根据各所述时间区间的用户行为样本数据获取各所述时间区间的用户行为数据向量。
具体地,从所述时间区间的用户行为样本数据中提取关键数字因子,并根据提取到的关键数字因子构建所述时间区间的用户行为数据向量。
例如,在一实施例中,时间区间的用户行为样本数据为:点击量为100、咨询量为10以及转发量为10。
则可从点击量中提取到的关键数字因子为100;
可从咨询量中提取到的关键数字因子为10;
可从转发量中提取到的关键数字因子为10;
因此,构建得到的用户行为数据向量为(100,10,10)。
S33,获取各所述时间区间的用户行为数据向量序列,其中,所述时间区间的用户行为数据向量序列由所述时间区间的前n个时间区间的用户行为数据向量拼接得到,n为预设值。
具体实施中,获取各所述时间区间的用户行为数据向量序列,其中,所述时间区间的用户行为数据向量序列由所述时间区间的前n个时间区间的用户行为数据向量拼接得到,n为 预设值。例如,在一实施例中,n设定为10。
例如,在一实施例中,时间区间的前n个时间区间的用户行为数据向量分别为X1、X2……Xn。
按顺序对X1、X2……Xn进行拼接得到X1X2……Xn即为该时间区间的用户行为数据向量序列。
需要说明的是,如果某时间区间前面的时间区间的数量不足n个,则将该时间区间舍弃。
例如,在一实施例中,时间区间总共有1万个,n设定为10。则将前10个时间区间舍弃。
S34,获取各所述时间区间的销售样本数据。
具体实施中,获取各所述时间区间的销售样本数据。
具体地,从预设时段的销售样本数据中分别截取各时间区间的销售样本数据。
S35,分别根据各所述时间区间的销售样本数据获取各所述时间区间的销售数据向量。
具体实施中,分别根据各所述时间区间的销售样本数据获取各所述时间区间的销售数据向量。
具体地,从所述时间区间的销售样本数据中提取关键数字因子,并根据提取到的关键数字因子构建所述时间区间的销售数据向量。
例如,在一实施例中,时间区间的销售样本数据为:型号a销售量为10、型号b销售了5以及型号c销售了5。
则可从型号a销售量中提取到的关键数字因子为10;
可从型号b销售量中提取到的关键数字因子为5;
可从型号c销售量中提取到的关键数字因子为5;
因此,构建得到的销售数据向量为(10,5,5)。
S36,获取各所述时间区间的销售数据向量序列,其中,所述时间区间的销售数据向量序列由所述时间区间的销售数据向量与所述时间区间的前n-1个时间区间的销售数据向量拼接得到。
具体实施中,获取各所述时间区间的销售数据向量序列,其中,所述时间区间的销售数据向量序列由所述时间区间的销售数据向量与所述时间区间的前n-1个时间区间的销售数据向量拼接得到。n为预设值。例如,在一实施例中,n设定为10。
例如,在一实施例中,时间区间的销售数据向量为Yn,时间区间的前n-1个时间区间的销售数据向量为Y1、Y2……Yn-1。
按顺序对Y1、Y2……Yn进行拼接得到Y1Y2……Yn即为该时间区间的销售数据向量序列。
需要说明的是,如果某时间区间前面的时间区间的数量不足n-1个,则将该时间区间舍弃。
例如,在一实施例中,时间区间总共有1万个,n设定为10。则将前9个时间区间舍弃。
需要说明的是,以上步骤S31-S33与步骤S34-S36没有先后执行顺序。或者,步骤S31-S33与步骤S34-S36可并行执行。
S4,根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器。
具体实施中,根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器。
在本申请实施例中,构建一个端到端的模型结构,具体为编码解码模型(Encoder-Decoder)。具体的,所述编码解码模型包括LSTM编码器以及引入了注意力机制(Attention)的LSTM解码器。
LSTM(Long Short-Term Memory,长短期记忆网络),是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。
意力机制(Attention),用于为LSTM编码器在观察窗口中的各数据节点输出的特征,分别标注对应于LSTM解码器在表现窗口中的各数据节点输出的预测结果的权重值;其中,该权重值表征LSTM编码器在观察窗口中的各数据节点输出的特征,对应于LSTM解码器在表现窗口中的各数据节点输出的预测结果的贡献度(也称之为影响度)。
需要说明的是在该编码解码模型中,用户行为数据向量序列是输入序列,销售数据向量序列是输出序列,通过将用户行为数据向量序列输入到编码器中编码得到一个中间特征向量,然后通过解码器对该中间特征向量进行解码得到销售数据向量序列。具体如下:
X={x 1、x 2...x m}
Y={y 1、y 2...y m}
C=F(x 1、x 2...x m)
y i=g(C,y 1、y 2...y i-1}
其中,X为输入序列,Y为输出序列,C为中间特征向量,编码器通过对输入序列X进 行编码,将其转化为中间特征向量C,然后解码器根据编码器生成的中间特征向量C进行解码生成y i
具体操作中,以时间区间的用户行为数据向量序列作为编码解码模型的输入,以时间区间的销售数据向量序列作为编码解码模型的输出,来对编码解码模型进行训练。对编码解码模型进行训练的训练过程就是调整编码解码模型的参数的过程。
S5,若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
具体实施中,若接收到待测时间区间,则将待测时间区间的户行为数据向量序列输入到训练后的所述编码解码模型中,以由训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
待测时间区间是指未到来的时间区间,例如,未来10天。本申请的目的在于预测未来的某一段时间内(例如,未来10天)的物理机的销售数据。
参见图5,在一实施例中,以上步骤S5具体包括如下步骤S51-S53。
S51,获取所述待测时间区间的用户行为数据向量序列。
具体实施中,获取所述待测时间区间的用户行为数据向量序列。
具体地,获取所述待测时间区间的前n个时间区间的用户行为数据向量序列,并对获取到的n个时间区间的用户行为数据向量序列进行拼接得到所述待测时间区间的用户行为数据向量序列。
需要说明的是,n为预设值,例如,在一实施例中,n为10。
参见图6,在一实施例中,以上步骤S51具体包括如下步骤S511-S512。
S511,获取所述待测时间区间的前n个时间区间的用户行为数据向量。
具体实施中,获取所述待测时间区间的前n个时间区间的用户行为数据向量。
具体地,首先获取所述待测时间区间的前n个时间区间的用户行为数据向量,例如为R1、R2……Rn。
S512,对所述待测时间区间的前n个时间区间的用户行为数据向量进行拼接以得到所述待测时间区间的用户行为数据向量序列。
具体实施中,对所述待测时间区间的前n个时间区间的用户行为数据向量进行拼接以得到所述待测时间区间的用户行为数据向量序列。
例如,在一实施例中,所述待测时间区间的前n个时间区间的用户行为数据向量为R1、R2……Rn。
按顺序对R1、R2……Rn进行拼接得到R1R2……Rn即为该时间区间的用户行为数据向量序列。
S52,将所述待测时间区间的用户行为数据向量序列输入到训练后的所述编码解码模型的LSTM编码器中以得到中间特征向量。
具体实施中,将所述待测时间区间的用户行为数据向量序列输入到训练后的所述编码解码模型的LSTM编码器中,由LSTM编码器对所述待测时间区间的用户行为数据向量序列进行编码得到中间特征向量。
S53,将所述中间特征向量输入到训练后的所述编码解码模型的LSTM解码器中以得到对所述待测时间区间的销售数据的预测结果。
具体实施中,将所述中间特征向量输入到训练后的所述编码解码模型的LSTM解码器中,以由训练后的所述编码解码模型的LSTM解码器对所述中间特征向量进行解码以得到对所述待测时间区间的销售数据的预测结果。
本申请实施例的技术方案,获取物理机销售平台在预设时段内的用户行为数据以及销售数据;对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据;根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练;若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。通过历史的用户行为数据以及销售数据对预构建的编码解码模型进行训练,然后通过训练好的编码解码模型对待测时间区间的销售情况进行预测,从而能够准确预测物理机的销售情况,使得商家能够提前准确地准备物理机资源池。
图7是本申请实施例提供的一种物理机销售数据预测装置70的示意性框图。如图7所示,对应于以上物理机销售数据预测方法,本申请还提供一种物理机销售数据预测装置70。该物理机销售数据预测装置70包括用于执行上述物理机销售数据预测方法的单元,该物理机销售数据预测装置70可以被配置于台式电脑、平板电脑、手提电脑、等终端中。具体地,请参阅图7,该物理机销售数据预测装置70包括第一获取单元71、预处理单元72、第二获取单元73、训练单元74以及第一预测单元75。
第一获取单元71,用于获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间;
预处理单元72,对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预 设时段的用户行为样本数据以及销售样本数据;
第二获取单元73,用于根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;
训练单元74,根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器;
第一预测单元75,用于若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
在一实施例中,如图8所示,所述第一获取单元71包括发送单元711以及接收单元712。
发送单元711,用于向预设的销售历史资料服务器发送数据调取请求,所述数据调取请求包括所述预设时段;
接收单元712,用于接收所述销售历史资料服务器返回的应答消息,所述应答消息包含所述预设时段内的用户行为数据以及销售数据。
在一实施例中,如图9所示,所述预处理单元72包括数据清洗单元721以及归一化单元722。
数据清洗单元721,用于对所述预设时段的用户行为数据以及销售数据进行数据清洗处理;
归一化单元722,用于对数据清洗处理后的所述预设时段的用户行为数据以及销售数据进行归一化处理。
在一实施例中,如图10所示,所述第二获取单元73包括第三获取单元731、第四获取单元732、第五获取单元733、第六获取单元734、第七获取单元735、第八获取单元736。
第三获取单元731,用于获取各所述时间区间的用户行为样本数据;
第四获取单元732,用于分别根据各所述时间区间的用户行为样本数据获取各所述时间区间的用户行为数据向量;
第五获取单元733,用于获取各所述时间区间的用户行为数据向量序列,其中,所述时间区间的用户行为数据向量序列由所述时间区间的前n个时间区间的用户行为数据向量拼接得到,n为预设值;
第六获取单元734,用于获取各所述时间区间的销售样本数据;
第七获取单元735,用于分别根据各所述时间区间的销售样本数据获取各所述时间区间的销售数据向量;
第八获取单元736,用于获取各所述时间区间的销售数据向量序列,其中,所述时间区间的销售数据向量序列由所述时间区间的销售数据向量与所述时间区间的前n-1个时间区间的销售数据向量拼接得到。
在一实施例中,如图11所示,所述第一预测单元75包括第九获取单元751、输入单元752以及第二预测单元753。
第九获取单元751,用于获取所述待测时间区间的用户行为数据向量序列;
输入单元752,用于将所述待测时间区间的用户行为数据向量序列输入到训练后的所述编码解码模型的LSTM编码器中以得到中间特征向量;
第二预测单元753,用于将所述中间特征向量输入到训练后的所述编码解码模型的LSTM解码器中以得到对所述待测时间区间的销售数据的预测结果。
在一实施例中,如图12所示,所述第九获取单元751包括第十获取单元7511以及拼接单元7512。
第十获取单元7511,用于获取所述待测时间区间的前n个时间区间的用户行为数据向量;
拼接单元7512,用于对所述待测时间区间的前n个时间区间的用户行为数据向量进行拼接以得到所述待测时间区间的用户行为数据向量序列。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述物理机销售数据预测装置70和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述物理机销售数据预测装置可以实现为一种计算机程序的形式,该计算机程序可以在如图12所示的计算机设备上运行。
请参阅图12,图12是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500可以是终端,也可以是服务器,其中,终端可以是智能手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等具有通信功能的电子设备。服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图12,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行一种物理机销售数据预测方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种物理机销售数据预测方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图12中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本申请提出的物理机销售数据预测方法。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(Central ProcessingUnit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该计算机程序被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本申请还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序。该计算机程序被处理器执行时使处理器执行本申请提出的物理机销售数据预测方法。
所述存储介质为实体的、非瞬时性的存储介质,例如可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的实体存储介质。所述计算机可读存储介质可以是非易失性,也可以是易失性。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,尚且本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (20)

  1. 一种物理机销售数据预测方法,包括:
    获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间;
    对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据;
    根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;
    根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器;
    若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
  2. 根据权利要求1所述的物理机销售数据预测方法,其中,所述获取物理机销售平台在预设时段内的用户行为数据以及销售数据,包括:
    向预设的销售历史资料服务器发送数据调取请求,所述数据调取请求包括所述预设时段;
    接收所述销售历史资料服务器返回的应答消息,所述应答消息包含所述预设时段内的用户行为数据以及销售数据。
  3. 根据权利要求1所述的物理机销售数据预测方法,其中,所述对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据,包括:
    对所述预设时段的用户行为数据以及销售数据进行数据清洗处理;
    对数据清洗处理后的所述预设时段的用户行为数据以及销售数据进行归一化处理。
  4. 根据权利要求1所述的物理机销售数据预测方法,其中,所述根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列,包括:
    获取各所述时间区间的用户行为样本数据;
    分别根据各所述时间区间的用户行为样本数据获取各所述时间区间的用户行为数据向量;
    获取各所述时间区间的用户行为数据向量序列,其中,所述时间区间的用户行为数据向量序列由所述时间区间的前n个时间区间的用户行为数据向量拼接得到,n为预设值。
  5. 根据权利要求4所述的物理机销售数据预测方法,其中,所述根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列,还包括:
    获取各所述时间区间的销售样本数据;
    分别根据各所述时间区间的销售样本数据获取各所述时间区间的销售数据向量;
    获取各所述时间区间的销售数据向量序列,其中,所述时间区间的销售数据向量序列由所述时间区间的销售数据向量与所述时间区间的前n-1个时间区间的销售数据向量拼接得到。
  6. 根据权利要求5所述的物理机销售数据预测方法,其中,所述若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果,包括:
    获取所述待测时间区间的用户行为数据向量序列;
    将所述待测时间区间的用户行为数据向量序列输入到训练后的所述编码解码模型的LSTM编码器中以得到中间特征向量;
    将所述中间特征向量输入到训练后的所述编码解码模型的LSTM解码器中以得到对所述待测时间区间的销售数据的预测结果。
  7. 根据权利要求6所述的物理机销售数据预测方法,其中,所述获取所述待测时间区间的用户行为数据向量序列,包括:
    获取所述待测时间区间的前n个时间区间的用户行为数据向量;
    对所述待测时间区间的前n个时间区间的用户行为数据向量进行拼接以得到所述待测时间区间的用户行为数据向量序列。
  8. 根据权利要求3所述的物理机销售数据预测方法,其中,所述数据清洗处理包括填补缺失值以及修正异常值。
  9. 根据权利要求4所述的物理机销售数据预测方法,其中,所述分别根据各所述时间区间的用户行为样本数据获取各所述时间区间的用户行为数据向量,包括:
    从所述时间区间的用户行为样本数据中提取关键数字因子,并根据提取到的关键数字因子构建所述时间区间的用户行为数据向量。
  10. 一种物理机销售数据预测装置,包括:
    第一获取单元,用于获取物理机销售平台在预设时段内的用户行为数据以及销售数据, 所述预设时段包括多个时间步长相同的时间区间;
    预处理单元,对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据;
    第二获取单元,用于根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;
    训练单元,根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器;
    第一预测单元,用于若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
  11. 一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器用于运行所述计算机程序,以执行如下步骤:
    获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间;
    对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据;
    根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;
    根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器;
    若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
  12. 根据权利要求11所述的计算机设备,其中,所述获取物理机销售平台在预设时段内的用户行为数据以及销售数据的步骤,包括:
    向预设的销售历史资料服务器发送数据调取请求,所述数据调取请求包括所述预设时段;
    接收所述销售历史资料服务器返回的应答消息,所述应答消息包含所述预设时段内的用户行为数据以及销售数据。
  13. 根据权利要求11所述的计算机设备,其中,所述对所述预设时段的用户行为数据以 及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据的步骤,包括:
    对所述预设时段的用户行为数据以及销售数据进行数据清洗处理;
    对数据清洗处理后的所述预设时段的用户行为数据以及销售数据进行归一化处理。
  14. 根据权利要求11所述的计算机设备,其中,所述根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列的步骤,包括:
    获取各所述时间区间的用户行为样本数据;
    分别根据各所述时间区间的用户行为样本数据获取各所述时间区间的用户行为数据向量;
    获取各所述时间区间的用户行为数据向量序列,其中,所述时间区间的用户行为数据向量序列由所述时间区间的前n个时间区间的用户行为数据向量拼接得到,n为预设值。
  15. 根据权利要求14所述的计算机设备,其中,所述根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列的步骤,还包括:
    获取各所述时间区间的销售样本数据;
    分别根据各所述时间区间的销售样本数据获取各所述时间区间的销售数据向量;
    获取各所述时间区间的销售数据向量序列,其中,所述时间区间的销售数据向量序列由所述时间区间的销售数据向量与所述时间区间的前n-1个时间区间的销售数据向量拼接得到。
  16. 根据权利要求15所述的计算机设备,其中,所述若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果的步骤,包括:
    获取所述待测时间区间的用户行为数据向量序列;
    将所述待测时间区间的用户行为数据向量序列输入到训练后的所述编码解码模型的LSTM编码器中以得到中间特征向量;
    将所述中间特征向量输入到训练后的所述编码解码模型的LSTM解码器中以得到对所述待测时间区间的销售数据的预测结果。
  17. 根据权利要求16所述的计算机设备,其中,所述获取所述待测时间区间的用户行为数据向量序列的步骤,包括:
    获取所述待测时间区间的前n个时间区间的用户行为数据向量;
    对所述待测时间区间的前n个时间区间的用户行为数据向量进行拼接以得到所述待测时间区间的用户行为数据向量序列。
  18. 根据权利要求13所述的计算机设备,其中,所述数据清洗处理包括填补缺失值以及修正异常值。
  19. 根据权利要求14所述的计算机设备,其中,所述分别根据各所述时间区间的用户行为样本数据获取各所述时间区间的用户行为数据向量的步骤,包括:
    从所述时间区间的用户行为样本数据中提取关键数字因子,并根据提取到的关键数字因子构建所述时间区间的用户行为数据向量。
  20. 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时使所述处理器执行以下步骤:
    获取物理机销售平台在预设时段内的用户行为数据以及销售数据,所述预设时段包括多个时间步长相同的时间区间;
    对所述预设时段的用户行为数据以及销售数据进行预处理以得到所述预设时段的用户行为样本数据以及销售样本数据;
    根据所述预设时段的用户行为样本数据以及销售样本数据获取各所述时间区间的用户行为数据向量序列以及销售数据向量序列;
    根据各所述时间区间的用户行为数据向量序列以及销售数据向量序列对预构建的编码解码模型进行训练,所述编码解码模型包括LSTM编码器以及引入了注意力机制的LSTM解码器;
    若接收到待测时间区间,根据训练后的所述编码解码模型对所述待测时间区间的物理机的销售数据进行预测并输出预测结果。
PCT/CN2020/124661 2020-07-28 2020-10-29 物理机销售数据预测方法、装置、计算机设备及存储介质 WO2021139335A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010738679.X 2020-07-28
CN202010738679.XA CN111882039A (zh) 2020-07-28 2020-07-28 物理机销售数据预测方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
WO2021139335A1 true WO2021139335A1 (zh) 2021-07-15

Family

ID=73200959

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/124661 WO2021139335A1 (zh) 2020-07-28 2020-10-29 物理机销售数据预测方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN111882039A (zh)
WO (1) WO2021139335A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114742569A (zh) * 2021-01-08 2022-07-12 广州视源电子科技股份有限公司 用户生命阶段预测方法、装置、计算机设备及存储介质
CN113256007B (zh) * 2021-05-28 2022-02-25 浙江大学 一种面向多模态的新产品销量预测方法及装置
CN115829629B (zh) * 2022-12-16 2023-12-08 广州飞狮数字科技有限公司 一种畅滞销状态的确定方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017131696A1 (en) * 2016-01-28 2017-08-03 Entit Software Llc Database server to predict sales
CN109886747A (zh) * 2019-02-22 2019-06-14 网易(杭州)网络有限公司 销量预测方法、介质、装置和计算设备
CN109903064A (zh) * 2017-12-08 2019-06-18 北京京东尚科信息技术有限公司 销量预测方法、装置和计算机可读存储介质
CN111242679A (zh) * 2020-01-08 2020-06-05 北京工业大学 一种基于产品评论观点挖掘的销量预测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106779859A (zh) * 2016-12-27 2017-05-31 南京安讯科技有限责任公司 一种移动终端产品实时销量预测方法
CN108734338A (zh) * 2018-04-24 2018-11-02 阿里巴巴集团控股有限公司 基于lstm模型的信用风险预测方法及装置
CN109345048B (zh) * 2018-07-27 2023-02-10 创新先进技术有限公司 预测方法、装置、电子设备及计算机可读存储介质
US11586880B2 (en) * 2018-08-28 2023-02-21 Beijing Jingdong Shangke Information Technology Co., Ltd. System and method for multi-horizon time series forecasting with dynamic temporal context learning
CN111091410B (zh) * 2019-11-04 2022-03-11 南京光普信息技术有限公司 一种结合节点嵌入和用户行为特征的网点销量预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017131696A1 (en) * 2016-01-28 2017-08-03 Entit Software Llc Database server to predict sales
CN109903064A (zh) * 2017-12-08 2019-06-18 北京京东尚科信息技术有限公司 销量预测方法、装置和计算机可读存储介质
CN109886747A (zh) * 2019-02-22 2019-06-14 网易(杭州)网络有限公司 销量预测方法、介质、装置和计算设备
CN111242679A (zh) * 2020-01-08 2020-06-05 北京工业大学 一种基于产品评论观点挖掘的销量预测方法

Also Published As

Publication number Publication date
CN111882039A (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
WO2021139335A1 (zh) 物理机销售数据预测方法、装置、计算机设备及存储介质
US10958748B2 (en) Resource push method and apparatus
WO2018040944A1 (zh) 恶意地址/恶意订单的识别系统、方法及装置
US20140279739A1 (en) Resolving and merging duplicate records using machine learning
US11775412B2 (en) Machine learning models applied to interaction data for facilitating modifications to online environments
US10832150B2 (en) Optimized re-training for analytic models
KR102410777B1 (ko) 상품 추천 방식 개선 방법 및 장치
WO2020143186A1 (zh) 推荐系统训练方法、装置、计算机设备及存储介质
CN110858226A (zh) 对话管理方法和装置
CN110738508A (zh) 一种数据分析方法和装置
US11853948B2 (en) Methods and systems for managing risk with respect to potential customers
CN113205189B (zh) 训练预测模型的方法、预测方法及装置
US11681758B2 (en) Bot program for monitoring
CN112182281A (zh) 一种音频推荐方法、装置及存储介质
CN113360300A (zh) 接口调用链路生成方法、装置、设备及可读存储介质
CN114119123A (zh) 信息推送的方法和装置
CN107644042B (zh) 软件程序点击率预估排序方法及服务器
CN117422553A (zh) 区块链网络的交易处理方法、装置、设备、介质和产品
US11328205B2 (en) Generating featureless service provider matches
CN111368195A (zh) 一种模型训练方法、装置、设备及存储介质
CN115516490A (zh) 基于机器学习的股票趋势分析方法、装置
CN114385398A (zh) 一种请求响应状态确定方法、装置、设备和存储介质
CN113052509A (zh) 模型评估方法、模型评估装置、电子设备和存储介质
CN113497732A (zh) 一种传输性能预测模型的训练方法及其相关设备
CN111915339A (zh) 数据的处理方法、装置及设备

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20911962

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20911962

Country of ref document: EP

Kind code of ref document: A1