TW201730787A - 基於時間序列的資料預測方法和裝置 - Google Patents

基於時間序列的資料預測方法和裝置 Download PDF

Info

Publication number
TW201730787A
TW201730787A TW106101434A TW106101434A TW201730787A TW 201730787 A TW201730787 A TW 201730787A TW 106101434 A TW106101434 A TW 106101434A TW 106101434 A TW106101434 A TW 106101434A TW 201730787 A TW201730787 A TW 201730787A
Authority
TW
Taiwan
Prior art keywords
data
time series
category
feature
historical
Prior art date
Application number
TW106101434A
Other languages
English (en)
Other versions
TWI729058B (zh
Inventor
Yu Wang
Zhou Ye
Ji-Neng Wang
Yang Yang
Zhao-Ping Dong
Fan Chen
Qian Qian
Original Assignee
Alibaba Group Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Services Ltd filed Critical Alibaba Group Services Ltd
Publication of TW201730787A publication Critical patent/TW201730787A/zh
Application granted granted Critical
Publication of TWI729058B publication Critical patent/TWI729058B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Mining & Mineral Resources (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Animal Husbandry (AREA)
  • Agronomy & Crop Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本發明實施例提供了一種基於時間序列的資料預測方法和裝置,其中所述方法包括:獲取多個類目物件的歷史時間序列資料,其中,所述類目物件包括一個或多個資料物件;從所述多個類目物件中篩選出特徵類目物件,其中,所述特徵類目物件為包含特徵資料物件的類目物件,所述特徵資料物件為生命週期小於預設時間閾值的資料物件;基於所述特徵類目物件對應的歷史時間序列資料,從所述特徵類目物件包含的資料物件中預測出目標資料物件,所述目標資料物件為未來第一預設時間段內將要產生的未來時間序列資料滿足預設增長趨勢的資料物件。本發明可以根據時間序列資料的原理,預測出近期具有爆發力的目標資料物件,使得預測結果與實際更加吻合,準確率更高。

Description

基於時間序列的資料預測方法和裝置
本發明涉及資料處理技術領域,特別是涉及一種基於時間序列的資料預測方法和一種基於時間序列的資料預測裝置。
隨著資訊科技的發展,農村佈局成為了越來越多電子商務平臺戰略佈局的一個非常重要的方面:讓商品透過電商平臺走出去和讓外面的商品走進農村去。在農村產品中,很大的部分是一些時效性或者季節性要求較高的商品,甚至於保存期限也相當地短暫,如海鮮、河鮮以及新鮮蔬菜水果等。這類商品可以稱為時效性商品,時效性商品是指具有一定消費時效特性,且保存期限非常短暫的商品。
在實際中,時效性商品的需求雖然龐大,但是對於電商平臺及其物流系統的挑戰也是巨大的,這體現在兩個方面: (1)如果倉儲過多,則會造成物流壓力過大、也因本類商品的保存期限短,容易造成巨大的浪費; (2)如果錯誤估計造成倉儲不足,則會使得巨大的市場浪費。
因此,對時效性商品等時效性資料物件的識別和預測顯得尤其重要。
鑒於上述問題,提出了本發明實施例以便提供一種克服上述問題或者至少部分地解決上述問題的一種基於時間序列的資料預測方法和相應的一種基於時間序列的資料預測裝置。
為了解決上述問題,本發明公開了一種基於時間序列的資料預測方法,所述的方法包括:獲取多個類目物件的歷史時間序列資料,其中,所述類目物件包括一個或多個資料物件;從所述多個類目物件中篩選出特徵類目物件,其中,所述特徵類目物件為包含特徵資料物件的類目物件,所述特徵資料物件為生命週期小於預設時間閾值的資料物件;基於所述特徵類目物件對應的歷史時間序列資料,從所述特徵類目物件包含的資料物件中預測出目標資料物件,所述目標資料物件為未來第一預設時間段內將要產生的未來時間序列資料滿足預設增長趨勢的資料物件。
優選地,所述方法還包括:預測所述目標資料物件在所述未來第一預設時間段內的未來時間序列資料。
優選地,所述獲取多個類目物件的歷史時間序列資料的步驟包括:針對預設的多個時間區間,計算每個時間區間內預設資料庫中儲存的,所述資料物件對應的指定特徵資料的數量,作為所述資料物件在所述時間區間內的歷史特徵資料;組織所述資料物件在所有時間區間的歷史特徵資料,得到所述資料物件的歷史時間序列資料;按照所述時間區間,統計每個類目物件中包含的資料物件在所述時間區間的歷史特徵資料的總和;將所有時間區間的歷史特徵資料的總和組織成所述類目物件的歷史時間序列資料。
優選地,所述從所述多個類目物件中篩選出特徵類目物件的步驟包括:基於所述類目物件的歷史時間序列資料,從所述多個類目物件中篩選出第一特徵類目物件;獲取預設的第二特徵類目物件;將所述第一特徵類目物件以及所述第二特徵類目物件組織成特徵類目物件。
優選地,所述基於所述類目物件的歷史時間序列資料,從所述多個類目物件中篩選出第一特徵類目物件的步驟包括:計算在過去第一預設時間段內每個類目物件的歷史時間序列資料的中值M; 計算歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量;若所述歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量在預設範圍內,則判定所述類目物件為第一特徵類目物件。
優選地,所述基於所述特徵類目物件對應的歷史時間序列資料,從所述特徵類目物件包含的資料物件中預測出目標資料物件的步驟包括:基於所述特徵類目物件對應的歷史時間序列資料,對所述特徵類目物件進行歸一化處理;將所有歸一化處理後的特徵類目物件中包含的資料物件進行聚類,得到類簇物件;從所述類簇物件中預測出目標類簇物件;將所述目標類簇物件中包含的資料物件,作為目標資料物件。
優選地,所述從所述類簇物件中預測出目標類簇物件的步驟包括:基於所述類簇物件中的資料物件在過去一個月內的歷史時間序列資料,計算所述類簇物件的第一平均歷史時間序列資料;基於所述類簇物件中的資料物件在過去第十三個月的歷史時間序列資料,計算所述類簇物件的第二平均歷史時間序列資料;基於所述類簇物件中的資料物件在過去第十二個月的 歷史時間序列資料,計算所述類簇物件的第三平均歷史時間序列資料;根據所述第一平均歷史時間序列資料、所述第二平均歷史時間序列資料以及所述第三平均歷史時間序列資料,預估所述類簇物件在未來第一預設時間段內的未來平均時間序列資料;計算所述未來平均時間序列資料與所述第一平均歷史時間序列資料的差值,得到所述類簇物件的指標資料;將指標資料大於預設閾值的類簇物件作為目標類簇物件。
優選地,所述預測所述目標資料物件在所述未來第一預設時間段內的未來時間序列資料的步驟包括:對所述類簇物件在未來第一預設時間段內的未來平均時間序列資料進行反歸一化處理,得到所述類簇物件中每個資料物件的基準平均時間序列資料;對所述每個資料物件的基準平均時間序列資料進行修正,得到對應資料物件在未來第一預設時間段內的未來時間序列資料。
優選地,所述資料物件為商品資料,所述類目物件為商品類目,所述特徵類目物件為時效性商品類目,所述生命週期為商品的時效,所述時間序列資料為所述商品的日銷量。
本發明還公開了一種基於時間序列的資料預測裝置,所述的裝置包括: 歷史時序資料獲取模組,用於獲取多個類目物件的歷史時間序列資料,其中,所述類目物件包括一個或多個資料物件;特徵類目物件篩選模組,用於從所述多個類目物件中篩選出特徵類目物件,其中,所述特徵類目物件為包含特徵資料物件的類目物件,所述特徵資料物件為生命週期小於預設時間閾值的資料物件;目標資料物件預測模組,用於基於所述特徵類目物件對應的歷史時間序列資料,從所述特徵類目物件包含的資料物件中預測出目標資料物件,所述目標資料物件為未來第一預設時間段內將要產生的未來時間序列資料滿足預設增長趨勢的資料物件。
優選地,所述裝置還包括:未來時序資料預測模組,用於預測所述目標資料物件在所述未來第一預設時間段內的未來時間序列資料。
優選地,所述歷史時序資料獲取模組包括:歷史特徵資料計算子模組,用於針對預設的多個時間區間,計算每個時間區間內預設資料庫中儲存的,所述資料物件對應的指定特徵資料的數量,作為所述資料物件在所述時間區間內的歷史特徵資料;歷史特徵資料組織子模組,用於組織所述資料物件在所有時間區間的歷史特徵資料,得到所述資料物件的歷史時間序列資料;歷史特徵資料統計子模組,用於按照所述時間區間, 統計每個類目物件中包含的資料物件在所述時間區間的歷史特徵資料的總和;歷史時序資料組織子模組,用於將所有時間區間的歷史特徵資料的總和組織成所述類目物件的歷史時間序列資料。
優選地,所述特徵類目物件篩選模組包括:第一特徵類目物件篩選子模組,用於基於所述類目物件的歷史時間序列資料,從所述多個類目物件中篩選出第一特徵類目物件;第二特徵類目物件獲取子模組,用於獲取預設的第二特徵類目物件;組織子模組,用於將所述第一特徵類目物件以及所述第二特徵類目物件組織成特徵類目物件。
優選地,所述第一特徵類目物件篩選子模組還用於:計算在過去第一預設時間段內每個類目物件的歷史時間序列資料的中值M;計算歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量;若所述歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量在預設範圍內,則判定所述類目物件為第一特徵類目物件。
優選地,所述目標資料物件預測模組包括:歸一化子模組,用於基於所述特徵類目物件對應的歷史時間序列資料,對所述特徵類目物件進行歸一化處理; 聚類子模組,用於將所有歸一化處理後的特徵類目物件中包含的資料物件進行聚類,得到類簇物件;預測子模組,用於從所述類簇物件中預測出目標類簇物件;目標資料物件獲取子模組,用於將所述目標類簇物件中包含的資料物件,作為目標資料物件。
優選地,所述預測子模組還用於:基於所述類簇物件中的資料物件在過去一個月內的歷史時間序列資料,計算所述類簇物件的第一平均歷史時間序列資料;基於所述類簇物件中的資料物件在過去第十三個月的歷史時間序列資料,計算所述類簇物件的第二平均歷史時間序列資料;基於所述類簇物件中的資料物件在過去第十二個月的歷史時間序列資料,計算所述類簇物件的第三平均歷史時間序列資料;根據所述第一平均歷史時間序列資料、所述第二平均歷史時間序列資料以及所述第三平均歷史時間序列資料,預估所述類簇物件在未來第一預設時間段內的未來平均時間序列資料;計算所述未來平均時間序列資料與所述第一平均歷史時間序列資料的差值,得到所述類簇物件的指標資料;將指標資料大於預設閾值的類簇物件作為目標類簇物件。
優選地,所述未來時序資料預測模組包括:基準資料獲取子模組,用於對所述類簇對象在未來第一預設時間段內的未來平均時間序列資料進行反歸一化處理,得到所述類簇物件中每個資料物件的基準平均時間序列資料;修正子模組,用於對所述每個資料物件的基準平均時間序列資料進行修正,得到對應資料物件在未來第一預設時間段內的未來時間序列資料。
優選地,所述資料物件為商品資料,所述類目物件為商品類目,所述特徵類目物件為時效性商品類目,所述生命週期為商品的時效,所述時間序列資料為所述商品的日銷量。
本發明實施例包括以下優點:
在本發明實施例中,能夠從多個類目物件中篩選出具有時效特性以及季節特性的特徵類目物件,並基於該特徵類目物件的歷史時間序列資料,從特徵類目物件包含的資料物件中預測出近期將要產生的未來時間序列資料滿足預設增長趨勢的資料物件,即近期將要爆發的目標資料物件,本發明實施例根據時間序列資料的原理,預測出近期具有爆發力的目標資料物件,使得預測結果與實際更加吻合,準確率更高。
401‧‧‧歷史時序資料獲取模組
402‧‧‧特徵類目物件篩選模組
403‧‧‧目標資料物件預測模組
圖1是本發明的一種基於時間序列的資料預測方法實 施例一的步驟流程圖;圖2是本發明的一種基於時間序列的資料預測方法實施例一中的類目樹示意圖;圖3是本發明的一種基於時間序列的資料預測方法實施例二的步驟流程圖;圖4是本發明的一種基於時間序列的資料預測裝置實施例的結構框圖。
為使本發明的上述目的、特徵和優點能夠更加明顯易懂,下面結合圖式和具體實施方式對本發明作進一步詳細的說明。
參照圖1,示出了本發明的一種基於時間序列的資料預測方法實施例一的步驟流程圖,本發明實施例可以應用於電商平臺等具有樹形類目體系的平臺中,樹形類目體系可以為按照樹狀分類法對資料進行分類,得到類目的方法,其中,樹狀分類法是一種形象的分類法,按照層次,一層一層來分,就像一棵大樹,有葉、枝、樹幹、根。
例如,在電商平臺中,為適應當今時代的消費人群在網上商店有針對性的選購各種各樣的商品,可以採用樹狀分類法對商品做出的歸類,得到商品類目,例如,服裝、配飾、美容、數位、家居、母嬰、食品、文體、服務和保險等。
如圖1所示,本發明實施例可以包括如下步驟:
步驟101,獲取多個類目物件的歷史時間序列資料;應用於本發明實施例,一個類目物件可以包括一個或多個資料物件,例如,在電商平臺中,如圖2的類目樹示意圖所示,在商品類目如“海鮮”類目下,可以包括“大閘蟹”、“章魚”、“干貝”等商品資料。
進一步地,每個資料物件具有對應的多個指定特徵資料,所述指定特徵資料為在先生成的,檢測到對所述資料物件發生指定行為時生成的記錄。例如,在電商平臺中,所述指定行為可以包括銷售行為,所述指定特徵資料為對某個商品產生銷售行為時生成的銷售記錄。
在具體實現中,資料物件的指定特徵資料可以從預設資料庫中獲取,該預設資料庫可以為預先生成的資料庫。例如,該預設資料庫可以為商品資料庫,該商品資料庫中儲存有多條針對一個或多個商品的銷售記錄。
在實際中,預設資料庫中還可以儲存資料物件的資料屬性資訊,作為一種示例,該資料屬性資訊可以包括時間屬性資訊、識別屬性資訊、特徵屬性資訊等。例如,在商品資料庫中,還可以儲存每個商品的商品屬性資訊,該商品屬性資訊可以包括商品的基本屬性、時間屬性、交易屬性、信用屬性及行銷屬性等。其中,該商品的基本屬性可以包括商品的名稱、所屬商家ID、價格、上架時間長度、所屬類目等;時間屬性可以包括發生購買行為、評論行為、上架行為等行為的時間資訊;該商品的交易屬性可以包括商品收藏、加購、購買等;該商品的信用屬性可以 包括商家星級、差評數、差評率、物流評分等;該商品的行銷屬性可以包括是否為搶購商品、是否為促銷商品等。
在本發明實施例的一種優選實施例中,步驟101可以包括如下子步驟:
子步驟S11,針對預設的多個時間區間,計算每個時間區間內預設資料庫中儲存的,所述資料物件對應的指定特徵資料的數量,作為所述資料物件在所述時間區間內的歷史特徵資料;在具體實現中,時間區間可以為按照時間間隔設定的區間,例如,該時間間隔可以為一天、半天、一周、一個月等,若時間間隔為一天,則時間區間可以為每天的[00:00,23:59],當然該時間區間還可以添加日期資訊,例如2015年11月18日的時間區間為[2015-11-18-00:00,2015-11-18-23:59]。該預設的時間區間可以為開發人員預先設定的時間區間。
獲得多個預設的時間區間以後,可以進一步計算該資料物件在每個時間區間內(例如每天)的指定特徵資料的數量,得到該時間區間的歷史特徵資料。例如,計算某一商品每一天的銷售記錄的數量,得到日銷量。
子步驟S12,組織所述資料物件在所有時間區間的歷史特徵資料,得到所述資料物件的歷史時間序列資料;得到資料物件在每個時間區間中的歷史特徵資料以後,組織所有時間區間的歷史特徵資料,可以得到該資料物件的歷史時間序列資料。其中,時間序列資料是指不同 時間點上收集到的資料,這類資料反映了某一事物、現象等隨時間的變化狀態或程度。時間序列資料是資料存在的特殊形式,序列的過去值會影響到將來值,這種影響的大小以及影響的方式可由時間序列資料中的趨勢週期及非平穩等行為來刻畫。時間序列挖掘其本質是根據資料隨時間變化的趨勢預測將來的值。重點要考慮的是時間的特殊性質,像一些週期性的時間定義如星期、月、季節、年等,不同的日子如節假日可能造成的影響,日期本身的計算方法,還有一些需要特殊考慮的地方如時間前後的相關性(過去的事情對將來有多大的影響力)等。只有充分考慮時間因素,利用現有資料隨時間變化的一系列的值,才能更好地預測將來的值。
例如,得到一個商品的日銷量以後,組織每天的日銷量,得到該商品的歷史銷量。
一個資料物件的歷史時間序列資料可以反映該資料物件在過去某個時間段中的走勢。
子步驟S13,按照所述時間區間,統計每個類目物件中包含的資料物件在所述時間區間的歷史特徵資料的總和;由於一個類目物件可以包括一個或多個資料物件,當得到該類目物件下每個資料物件的歷史特徵資料以後,可以以時間區間為單位,計算該類目物件下所有資料物件在該時間區間的歷史特徵資料總和。
例如,在某一天中,在“海鮮”類目下,“大閘蟹”的日 銷量為1000斤、“章魚”的日銷量為500斤、“干貝”的日銷量為300斤,則該“海鮮”類目下在該日期中日銷量總和為1800斤。
子步驟S14,將所有時間區間的歷史特徵資料的總和組織成所述類目物件的歷史時間序列資料。
組織所有時間區間的歷史特徵資料的總和,可以得到該類目物件的歷史時間序列資料。
例如,計算“海鮮”類目在近一個月內每天的日銷量總和以後,將該一個月的所有天數的日銷量總和組織起來,可以得到“海鮮”類目在該月的歷史時間序列資料。
一個類目物件的歷史時間序列資料可以反映該類目物件在過去某個時間段中的走勢。
在具體實現中,步驟101可以透過一類目資料生成器完成,該生成器根據當前平臺的樹形類目體系,生成各類目物件的歷史時間序列資料,經過步驟101以後,原來海量的資料物件的歷史時間序列資料可以歸併為各個類目物件的歷史時間序列資料,為後續操作提供了有力的資料支撐。
步驟102,從所述多個類目物件中篩選出特徵類目物件;在本發明實施例中,當獲得每個類目物件的歷史時間序列資料以後,可以進一步從多個類目物件中篩選出特徵類目物件,其中,特徵類目物件可以為包含特徵資料物件的類目物件,而特徵資料物件可以為生命週期小於預設時 間閾值的資料物件,即具有時效性的資料物件。例如,當類目物件為商品類目時,該特徵類目物件可以為時效性商品類目,時效性商品類目可以為具有時效性商品的類目物件,時效性商品是指具有一定消費時效特性,且保存期限非常短暫的商品,例如:月餅、大閘蟹等,而時效性商品類目可以包括蔬菜、水果、海鮮、生肉、熟食等生鮮類目。
在本發明實施例的一種優選實施例中,步驟102可以包括如下子步驟:
子步驟S21,基於所述類目物件的歷史時間序列資料,從所述多個類目物件中篩選出第一特徵類目物件;獲得當前平臺的所有類目物件的歷史時間序列資料以後,可以進一步基於類目物件的歷史時間序列資料,從多個類目物件中自動篩選出第一特徵類目物件。
在本發明實施例的一種優選實施例中,子步驟S21進一步可以包括如下子步驟:
子步驟S211,計算在過去第一預設時間段內每個類目物件的歷史時間序列資料的中值M;具體來說,中值也稱中位數,是在一組資料中居於中間的數(特別注意的地方是:這組資料之前已經經過昇冪或者降冪排列),即在這組資料中,有一半的數據比它大,有一半的數據比它小。如果這組資料包含偶數個數位,中值是位於中間的兩個數的平均值,假如有n個資料,當n為偶數時,中位數為第n/2位數和第(n+2)/2位數 的平均數;如果n為奇數,那麼中位數為第(n+1)/2位數的值。
在具體實現中,可以將每個類目物件的歷史時間序列資料的時間範圍定義為過去第一預設時間段,例如,可以將過去第一時間段設定為過去一年。針對每個類目物件,可以將其歷史時間序列資料按照昇冪或降冪排序,即將過去一年內該類目物件中所有時間區間對應的歷史時間序列資料的總和進行排序,排序後獲得該類目物件的中值M,如將過去一年中每個商品類目的每天的日銷量總和進行排序後,獲得排序在中間的日銷量總和作為該商品類目在過去一年中的中值M。
需要說明的是,此處計算中值而不是計算平均值,是由於在一組資料中,平均值易受極端值的影響,而中值則不會受到極端值的影響,從而作出與實際情況更吻合的預測。
子步驟S212,計算歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量;得到中值M以後,可以將M放大n倍,例如1.5倍(可以表示為1.5M),並將該類目物件在每個時間區間的歷史特徵資料的總和與1.5M比較,獲得歷史特徵資料的總和大於1.5M的時間區間的數量。例如,計算商品類目中日銷量總和大於1.5M的天數。
子步驟S213,若所述歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量在預設範圍內,則判定所 述類目物件為第一特徵類目物件。
若M放大1.5倍時,該類目物件的歷史特徵資料的總和大於1.5M的時間區間的數量在預設範圍內時,可以判定該類目物件為第一特徵類目物件。
例如,將預設範圍取值為10-45,若商品類目中日銷量總和大於1.5M的天數在這個範圍內,則可以判定該商品類目為時效性商品類目。
子步驟S22,獲取預設的第二特徵類目物件;應用於本發明實施例,預設的第二特徵類目物件可以為白名單中的類目物件,該白名單可以透過人工的方式預先選定,例如,時效性商品類目可以為運營預先選出的商品類目,並將該選出的商品類目加入白名單中。
子步驟S23,將所述第一特徵類目物件以及所述第二特徵類目物件組織成特徵類目物件。
得到第一特徵類目物件以及第二特徵類目物件以後,可以將第一特徵類目物件以及第二特徵類目物件組織成特徵類目物件,其中,組織的方式可以包括去重方式,即將第一特徵類目物件以及第二特徵類目物件中重複的特徵類目物件去除,最後輸出所有的特徵類目物件。
在本發明實施例中,可以透過自動和人工的方式進行特徵類目物件的篩選,使得篩選結果更加符合用戶需求,也更加完善,智慧化程度高。
步驟103,基於所述特徵類目物件對應的歷史時間序列資料,從所述特徵類目物件包含的資料物件中預測出目 標資料物件。
確定特徵類目物件以後,可以從特徵類目物件包含的資料物件中篩選出目標資料物件,其中,該目標資料物件為未來第一預設時間段內將要產生的未來時間序列資料滿足預設增長趨勢的資料物件,即近期將要產生數量爆發的資料物件。
在具體實現中,為了提高預測結果的可靠性,未來第一預設時間段可以為近期的一個時間段,例如可以包括未來的一中期時間段或者一短期時間段。作為一種示例,該中期時間段可以為一個月的時間,即未來第一預設時間段為從當前時間開始接下來的一個月時間;該短期時間段可以為半個月、一周等短期內的時間,即未來第一預設時間段為從當前時間開始接下來的半個月時間或一周時間等。
該目標資料物件可以為未來第一預設時間段內,將要產生的未來時間序列資料滿足預設增長趨勢的資料物件,即產生的數量具有異常點或爆發點的資料物件。例如,在中秋節前,月餅的銷售數量將會爆發性增長,則月餅可以為目標資料物件。
應用於本發明實施例,確定特徵類目物件以後,可以從特徵類目物件中包含的資料物件中進一步篩選出目標資料物件。例如,確定時效性商品類目以後,可以進一步從該時效性商品類目中包含的時效性商品中篩選出近期將會熱賣(產生爆發點或異常點)的目標時效性商品。
在本發明實施例的一種優選實施例中,步驟103可以 包括如下子步驟:
子步驟S31,基於所述特徵類目物件對應的歷史時間序列資料,對所述特徵類目物件進行歸一化處理;確定特徵類目物件以後,為了消除特徵類目物件中各個資料物件之間的差別,得到更準確的預測結果,可以對該特徵類目物件進行歸一化處理。其中,歸一化是一種簡化計算的方式,即將有量綱的運算式,經過變換,化為無量綱的運算式,成為標量。
在一種實施方式中,可以採用如下方式對特徵類目物件進行歸一化處理:根據上述子步驟S211獲得的在過去第一預設時間段內特徵類目物件的歷史時間序列資料的中值M;分別計算該歷史時間序列資料中的每個歷史特徵資料的總和與中值M的比值,得到歸一化後的歷史特徵資料的總和,將所有歸一化後的歷史特徵資料的總和組織成該特徵類目物件的歸一化的歷史時間序列資料。
當然,本發明實施例並不限於上述歸一化的方式,本領域具有通常知識者採用其他歸一化的方式均是可以的。
子步驟S32,將所有歸一化處理後的特徵類目物件中包含的資料物件進行聚類,得到類簇物件;應用於本發明實施例,將特徵類目物件的歷史時間序列資料進行歸一化處理以後,進一步可以將所有特徵類目物件進行聚類,在實際中,該聚類可以為將所有特徵類目物件中包含的所有的資料物件進行聚類,將歷史時間序列 資料具有類似趨勢的資料物件(例如,具有類似爆發力的資料物件)聚合在一起,得到一個或多個類簇物件。
具體的,將物理或抽象物件的集合分成由類似的物件組成的多個類的過程被稱為聚類,由聚類所生成的類簇是一組物件的集合,這些物件與同一個簇中的物件彼此相似,與其他簇中的物件相異。在具體實現中,可以採用多種聚類方式進行聚類,例如層次聚類、劃分聚類、基於密度的聚類、基於網格的聚類、基於模型的聚類等,本發明實施例對具體的聚類方法不作限制。
例如,得到的特徵類目物件為水果類目、海鮮類目、熟食類目等,可以將這三個類目物件分別進行歸一化處理,並將歸一化處理後的類目物件中包含的商品進行聚類,把有類似爆發力的商品聚合在一起,得到一個或多個類簇,例如,大閘蟹由於在中秋期間到了多膏美味的頂峰,可以與月餅一起在中秋時節期間同時迎來爆發高峰,兩者的歷史時間序列資料的走勢類似,則可以將大閘蟹與月餅放入同一類簇中。
子步驟S33,從所述類簇物件中預測出目標類簇物件;得到類簇物件以後,可以從該類簇物件中篩選出近期(未來第一預設時間段內)將要爆發的類簇物件,作為目標類簇物件。例如,從多個類簇對象中篩選出將要熱賣的類簇物件作為目標類簇物件。
在本發明實施例的一種優選實施例中,子步驟S33進 一步可以包括如下子步驟:
子步驟S331,基於所述類簇物件中的資料物件在過去一個月內的歷史時間序列資料,計算所述類簇物件的第一平均歷史時間序列資料;在具體實現中,可以根據類簇物件中每個資料物件的在過去一個月內(最近一個月)的歸一化後的歷史時間序列資料,計算該類簇下所有資料物件的歷史時間序列資料的平均值,即以時間區間為單位(例如以天為單位),計算該類簇下該時間區間所有資料物件的歸一化後的歷史特徵資料之和除以該時間區間下所有資料物件的數量,得到該時間區間下的平均值;所有時間區間的平均值組成該類簇的第一平均歷史時間序列資料。
子步驟S332,基於所述類簇物件中的資料物件在過去第十三個月的歷史時間序列資料,計算所述類簇物件的第二平均歷史時間序列資料;在具體實現中,可以根據類簇物件中每個資料物件的在過去第十三個月(最近一個月對應的去年的日期)的歸一化後的歷史時間序列資料,計算該類簇下所有資料物件的歷史時間序列資料的平均值,即以時間區間為單位(例如以天為單位),計算該類簇下該時間區間所有資料物件的歸一化後的歷史特徵資料之和除以該時間區間下所有資料物件的數量,得到該時間區間下的平均值;所有時間區間的平均值組成所述類簇的第二平均歷史時間序列資料。
子步驟S333,基於所述類簇物件中的目標資料物件 在過去第十二個月的歷史時間序列資料,計算所述類簇物件的第三平均歷史時間序列資料;採用與上述子步驟S332的方法,計算類簇物件的第三平均歷史時間序列資料,即計算去年當前日期的平均歸一化資料。
子步驟S334,根據所述第一平均歷史時間序列資料、所述第二平均歷史時間序列資料以及所述第三平均歷史時間序列資料,預估所述類簇物件在未來第一預設時間段內的未來平均時間序列資料;在具體實現中,得到第一平均歷史時間序列資料以後,可以進一步計算該第一平均歷史時間序列資料的第一平均值(類簇的每個時間區間下的平均值之和除以時間區間的數量),以及,得到第二平均歷史時間序列資料以後,可以進一步計算該第二平均歷史時間序列資料的第二平均值(類簇的每個時間區間下的平均值之和除以時間區間的數量)。
然後計算第一平均值與第二平均值的比值,得到比值A。
然後將第三平均歷史時間序列資料分別乘以比值A,得到所述特徵類目物件在未來第一預設時間段內的未來平均時間序列資料。
需要說明的是,該未來第一預設時間段可以為農曆基準的時間段,若在該第一預設時間段內若某個時間區間內出現重大陽曆節日(如國慶,元旦等),則進行陽曆日假 期的相應修正,即在該節假日中,將農曆基準變成對應的陽曆基準,其他非重大陽曆節日不變。
子步驟S335,計算所述未來平均時間序列資料與所述第一平均歷史時間序列資料的差值,得到所述類簇物件的指標資料;得到未來第一預設時間段內的未來平均時間序列資料以後,可以進一步計算所述未來平均時間序列資料的第一總和(每個時間區間下類簇的平均值之和),以及,所述第一平均歷史時間序列資料的第二總和。
然後計算第一總和所述第二總和的差值,可以得到該類簇物件的指標資料。
子步驟S336,將指標資料大於預設閾值的類簇物件作為目標類簇物件。
獲得類簇物件的指標資料以後,可以篩選出指標資料較大的類簇物件作為目標類簇物件,在一種實施方式中,可以篩選出指標資料大於預設閾值的類簇物件作為目標類簇物件。
例如,得到的兩個類簇的指標資料分別如下(M為歸一化前的歷史序列資料的中值):
大閘蟹+月餅(第一類簇):1.1M
章魚(第二類簇):-0.01M
經過排序之後,可以很容易判定未來半個月之內第一類簇,即大閘蟹和月餅的銷量將會爆發,而章魚則會趨於平穩。
在本發明實施例中,可以根據類簇的爆發力指標資料判定其短期和中期爆發的可能性。
子步驟S34,將所述目標類簇中包含的資料物件,作為目標資料物件。
確定目標類簇物件以後,可以將該目標類簇物件中包含的資料物件,作為目標資料物件。
在本發明實施例中,能夠從多個類目物件中篩選出具有時效特性以及季節特性的特徵類目物件,並基於該特徵類目物件的歷史時間序列資料,從特徵類目物件包含的資料物件中預測出近期將要爆發的目標資料物件,本發明實施例根據時間序列資料的原理,預測出近期具有爆發力的目標資料物件,使得預測結果與實際更加吻合,準確率更高。
參照圖3,示出了本發明的一種基於時間序列的資料預測方法實施例二的步驟流程圖,可以包括如下步驟:
步驟301,獲取多個類目物件的歷史時間序列資料;應用於本發明實施例,一個類目物件可以包括一個或多個資料物件。
在本發明實施例的一種優選實施例中,步驟301可以包括如下子步驟:
子步驟S41,針對預設的多個時間區間,計算每個時間區間內預設資料庫中儲存的,所述資料物件對應的指定特徵資料的數量,作為所述資料物件在所述時間區間內的歷史特徵資料; 子步驟S42,組織所述資料物件在所有時間區間的歷史特徵資料,得到所述資料物件的歷史時間序列資料;子步驟S43,按照所述時間區間,統計每個類目物件中包含的資料物件在所述時間區間的歷史特徵資料的總和;子步驟S44,將所有時間區間的歷史特徵資料的總和組織成所述類目物件的歷史時間序列資料。
步驟302,從所述多個類目物件中篩選出特徵類目物件;在本發明實施例中,當獲得每個類目物件的歷史時間序列資料以後,可以進一步從多個類目物件中篩選出特徵類目物件,其中,特徵類目物件可以為包含特徵資料物件的類目物件,而特徵資料物件可以為生命週期小於預設時間閾值的資料物件,即具有時效性的資料物件。
在本發明實施例的一種優選實施例中,步驟302可以包括如下子步驟:
子步驟S51,基於所述類目物件的歷史時間序列資料,從所述多個類目物件中篩選出第一特徵類目物件;在本發明實施例的一種優選實施例中,子步驟S51進一步可以包括如下子步驟:子步驟S511,計算在過去第一預設時間段內每個類目物件的歷史時間序列資料的中值M;子步驟S512,計算歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量; 子步驟S513,若所述歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量在預設範圍內,則判定所述類目物件為第一特徵類目物件。
子步驟S52,獲取預設的第二特徵類目物件;子步驟S53,將所述第一特徵類目物件以及所述第二特徵類目物件組織成特徵類目物件。
步驟303,基於所述特徵類目物件對應的歷史時間序列資料,從所述特徵類目物件包含的資料物件中預測出目標資料物件;確定特徵類目物件以後,可以從特徵類目物件包含的資料物件中篩選出目標資料物件,其中,該目標資料物件可以為未來第一預設時間段內將要產生的未來時間序列資料滿足預設增長趨勢的資料物件。
在本發明實施例的一種優選實施例中,步驟303可以包括如下子步驟:
子步驟S61,基於所述特徵類目物件對應的歷史時間序列資料,對所述特徵類目物件進行歸一化處理;子步驟S62,將所有歸一化處理後的特徵類目物件中包含的資料物件進行聚類,得到類簇物件;子步驟S63,從所述類簇物件中預測出目標類簇物件;
在本發明實施例的一種優選實施例中,子步驟S63進一步可以包括如下子步驟:
子步驟S631,基於所述類簇物件中的資料物件在過 去一個月內的歷史時間序列資料,計算所述類簇物件的第一平均歷史時間序列資料;子步驟S632,基於所述類簇物件中的資料物件在過去第十三個月的歷史時間序列資料,計算所述類簇物件的第二平均歷史時間序列資料;子步驟S633,基於所述類簇物件中的資料物件在過去第十二個月的歷史時間序列資料,計算所述類簇物件的第三平均歷史時間序列資料;子步驟S634,根據所述第一平均歷史時間序列資料、所述第二平均歷史時間序列資料以及所述第三平均歷史時間序列資料,預估所述類簇物件在未來第一預設時間段內的未來平均時間序列資料;子步驟S635,計算所述未來平均時間序列資料與所述第一平均歷史時間序列資料的差值,得到所述類簇物件的指標資料;子步驟S636,將指標資料大於預設閾值的類簇物件作為目標類簇物件。
子步驟S64,將所述目標類簇物件中包含的資料物件,作為目標資料物件。
步驟304,預測所述目標資料物件在所述未來第一預設時間段內的未來時間序列資料。
在本發明實施例的一種優選實施例中,步驟304可以包括如下子步驟:
子步驟S71,對所述類簇對象在未來第一預設時間段 內的未來平均時間序列資料進行反歸一化處理,得到所述類簇物件中每個資料物件的基準平均時間序列資料;由於根據子步驟S634預估的所述類簇物件的未來平均時間序列資料是一種歸一化後的值,因此可以首先對該歸一化後的值進行反歸一化處理,即將該未來平均時間序列資料乘以中值M,可以得到該類簇物件中每個資料物件的基準平均時間序列資料。
子步驟S72,對所述每個資料物件的基準平均時間序列資料進行修正,得到對應資料物件在未來第一預設時間段內的未來時間序列資料。
獲得每個資料物件的基準平均時間序列資料以後,可以對該基準平均時間序列資料進行修正,得到該資料物件在未來第一預設時間段內的未來時間序列資料。在一種實施方式中,所述修正可以包括依據預設參考參數進行放大或縮小的補償修正。
預設參考參數可以為其他資料庫中的補償參數,例如,在電商平臺中,為了對抗平臺商家數量變化帶來的影響,該預設參考參數可以為商家資料庫中的資料,該商家資料庫記錄了平臺的各個商家及其主要的特徵,包括商家的基本屬性、交易屬性及信用屬性等特徵。可以以當前商家數和去年對應時期商家數相比進行基準平均時間序列資料的放大(或縮小)等修正,得到該商品類目的未來時間序列資料。
例如,去年與今年同期相比,商家資料庫中保存的商 家數量從100家增加到1000家,商家數量增加了10倍,而銷量增加了20倍,則可以將基準平均時間序列資料放大兩倍,得到未來時間序列資料。
作為本發明實施例的一種優選示例,若將本發明實施例應用於電商平臺中,則所述資料物件可以為商品資料,所述類目物件可以為商品類目,所述特徵類目物件可以為時效性商品類目,所述生命週期可以為商品的時效,所述時間序列資料可以為所述商品的日銷量。
在本發明實施例中,能夠從多個類目物件中篩選出具有時效特性以及季節特性的特徵類目物件,並基於該特徵類目物件的歷史時間序列資料,從特徵類目物件包含的資料物件中預測出近期將要爆發的目標資料物件,並預測該目標資料物件近期的未來時間序列資料,本發明實施例根據時間序列資料的原理,預測出近期具有爆發力的目標資料物件以及該目標資料物件的未來時間序列資料,使得預測結果與實際更加吻合,準確率更高。
對於圖3的方法實施例而言,由於其與圖1的方法實施例基本相似,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
需要說明的是,對於方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域具有通常知識者應該知悉,本發明實施例並不受所描述的動作順序的限制,因為依據本發明實施例,某些步驟可以採用其他順序或者同時進行。其次,本領域具有通常知識者也應該知 悉,說明書中所描述的實施例均屬於優選實施例,所涉及的動作並不一定是本發明實施例所必須的。
參照圖4,示出了本發明的一種基於時間序列的資料預測裝置實施例的結構框圖,具體可以包括如下模組:歷史時序資料獲取模組401,用於獲取多個類目物件的歷史時間序列資料,其中,所述類目物件包括一個或多個資料物件;特徵類目物件篩選模組402,用於從所述多個類目物件中篩選出特徵類目物件,其中,所述特徵類目物件為包含特徵資料物件的類目物件,所述特徵資料物件為生命週期小於預設時間閾值的資料物件;目標資料物件預測模組403,用於基於所述特徵類目物件對應的歷史時間序列資料,從所述特徵類目物件包含的資料物件中預測出目標資料物件,所述目標資料物件為未來第一預設時間段內將要產生的未來時間序列資料滿足預設增長趨勢的資料物件。
在本發明實施例的一種優選實施例中,所述裝置還可以包括:未來時序資料預測模組,用於預測所述目標資料物件在所述未來第一預設時間段內的未來時間序列資料。
在本發明實施例的一種優選實施例中,所述歷史時序資料獲取模組401包括:歷史特徵資料計算子模組,用於針對預設的多個時間區間,計算每個時間區間內預設資料庫中儲存的,所述資 料物件對應的指定特徵資料的數量,作為所述資料物件在所述時間區間內的歷史特徵資料;歷史特徵資料組織子模組,用於組織所述資料物件在所有時間區間的歷史特徵資料,得到所述資料物件的歷史時間序列資料;歷史特徵資料統計子模組,用於按照所述時間區間,統計每個類目物件中包含的資料物件在所述時間區間的歷史特徵資料的總和;歷史時序資料組織子模組,用於將所有時間區間的歷史特徵資料的總和組織成所述類目物件的歷史時間序列資料。
在本發明實施例的一種優選實施例中,所述特徵類目物件篩選模組402包括:第一特徵類目物件篩選子模組,用於基於所述類目物件的歷史時間序列資料,從所述多個類目物件中篩選出第一特徵類目物件;第二特徵類目物件獲取子模組,用於獲取預設的第二特徵類目物件;組織子模組,用於將所述第一特徵類目物件以及所述第二特徵類目物件組織成特徵類目物件。
在本發明實施例的一種優選實施例中,所述第一特徵類目物件篩選子模組還用於:計算在過去第一預設時間段內每個類目物件的歷史時間序列資料的中值M; 計算歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量;若所述歷史特徵資料的總和大於所述M的預設倍數的時間區間的數量在預設範圍內,則判定所述類目物件為第一特徵類目物件。
在本發明實施例的一種優選實施例中,所述目標資料物件預測模組403包括:歸一化子模組,用於基於所述特徵類目物件對應的歷史時間序列資料,對所述特徵類目物件進行歸一化處理;聚類子模組,用於將所有歸一化處理後的特徵類目物件中包含的資料物件進行聚類,得到類簇物件;預測子模組,用於從所述類簇物件中預測出目標類簇物件;目標資料物件獲取子模組,用於將所述目標類簇物件中包含的資料物件,作為目標資料物件。
在本發明實施例的一種優選實施例中,所述預測子模組還用於:基於所述類簇物件中的資料物件在過去一個月內的歷史時間序列資料,計算所述類簇物件的第一平均歷史時間序列資料;基於所述類簇物件中的資料物件在過去第十三個月的歷史時間序列資料,計算所述類簇物件的第二平均歷史時間序列資料;基於所述類簇物件中的資料物件在過去第十二個月的 歷史時間序列資料,計算所述類簇物件的第三平均歷史時間序列資料;根據所述第一平均歷史時間序列資料、所述第二平均歷史時間序列資料以及所述第三平均歷史時間序列資料,預估所述類簇物件在未來第一預設時間段內的未來平均時間序列資料;計算所述未來平均時間序列資料與所述第一平均歷史時間序列資料的差值,得到所述類簇物件的指標資料;將指標資料大於預設閾值的類簇物件作為目標類簇物件。
在本發明實施例的一種優選實施例中,所述未來時序資料預測模組包括:基準資料獲取子模組,用於對所述類簇對象在未來第一預設時間段內的未來平均時間序列資料進行反歸一化處理,得到所述類簇物件中每個資料物件的基準平均時間序列資料;修正子模組,用於對所述每個資料物件的基準平均時間序列資料進行修正,得到對應資料物件在未來第一預設時間段內的未來時間序列資料。
在本發明實施例的一種優選實施例中,所述資料物件為商品資料,所述類目物件為商品類目,所述特徵類目物件為時效性商品類目,所述生命週期為商品的時效,所述時間序列資料為所述商品的日銷量。
對於裝置實施例而言,由於其與方法實施例基本相 似,所以描述的比較簡單,相關之處參見方法實施例的部分說明即可。
本說明書中的各個實施例均採用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
本領域內的具有通常知識者應明白,本發明實施例的實施例可提供為方法、裝置、或電腦程式產品。因此,本發明實施例可採用完全硬體實施例、完全軟體實施例、或結合軟體和硬體方面的實施例的形式。而且,本發明實施例可採用在一個或多個其中包含有電腦可用程式碼的電腦可用儲存介質(包括但不限於磁碟記憶體、CD-ROM、光學記憶體等)上實施的電腦程式產品的形式。
在一個典型的配置中,所述電腦設備包括一個或多個處理器(CPU)、輸入/輸出介面、網路介面和記憶體。記憶體可能包括電腦可讀介質中的非永久性記憶體,隨機存取記憶體(RAM)和/或非易失性記憶體等形式,如唯讀記憶體(ROM)或快閃記憶體(flash RAM)。記憶體是電腦可讀介質的示例。電腦可讀介質包括永久性和非永久性、可移動和非可移動媒體可以由任何方法或技術來實現資訊儲存。資訊可以是電腦可讀指令、資料結構、程式的模組或其他資料。電腦的儲存介質的例子包括,但不限於相變記憶體(PRAM)、靜態隨機存取記憶體(SRAM)、動態隨機存取記憶體(DRAM)、其他類型的隨機存取記憶體(RAM)、唯讀記憶體(ROM)、電 可抹除可程式唯讀記憶體(EEPROM)、快閃記憶體或其他記憶體技術、唯讀光碟唯讀記憶體(CD-ROM)、數位多功能光碟(DVD)或其他光學儲存、磁盒式磁帶,磁帶磁磁片儲存或其他磁性存放裝置或任何其他非傳輸介質,可用於儲存可以被計算設備存取的資訊。按照本文中的界定,電腦可讀介質不包括非持續性的電腦可讀媒體(transitory media),如調製的資料信號和載波。
本發明實施例是參照根據本發明實施例的方法、終端設備(系統)、和電腦程式產品的流程圖和/或方塊圖來描述的。應理解可由電腦程式指令實現流程圖和/或方塊圖中的每一流程和/或方塊、以及流程圖和/或方塊圖中的流程和/或方塊的結合。可提供這些電腦程式指令到通用電腦、專用電腦、嵌入式處理機或其他可程式設計資料處理終端設備的處理器以產生一個機器,使得透過電腦或其他可程式設計資料處理終端設備的處理器執行的指令產生用於實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能的裝置。
這些電腦程式指令也可儲存在能引導電腦或其他可程式設計資料處理終端設備以特定方式工作的電腦可讀記憶體中,使得儲存在該電腦可讀記憶體中的指令產生包括指令裝置的製造品,該指令裝置實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能。
這些電腦程式指令也可裝載到電腦或其他可程式設計資料處理終端設備上,使得在電腦或其他可程式設計終端 設備上執行一系列操作步驟以產生電腦實現的處理,從而在電腦或其他可程式設計終端設備上執行的指令提供用於實現在流程圖一個流程或多個流程和/或方塊圖一個方塊或多個方塊中指定的功能的步驟。
儘管已描述了本發明實施例的優選實施例,但本領域內的具有通常知識者一旦得知了基本創造性概念,則可對這些實施例做出另外的變更和修改。所以,所附申請專利範圍意欲解釋為包括優選實施例以及落入本發明實施例範圍的所有變更和修改。
最後,還需要說明的是,在本文中,諸如第一和第二等之類的關係術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關係或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者終端設備所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,並不排除在包括所述要素的過程、方法、物品或者終端設備中還存在另外的相同要素。
以上對本發明所提供的一種基於時間序列的資料預測方法和一種基於時間序列的資料預測裝置,進行了詳細介紹,本文中應用了具體個例對本發明的原理及實施方式進 行了闡述,以上實施例的說明只是用於幫助理解本發明的方法及其核心思想;同時,對於本領域的具有通常知識者,依據本發明的思想,在具體實施方式及應用範圍上均會有改變之處,綜上所述,本說明書內容不應理解為對本發明的限制。

Claims (18)

  1. 一種基於時間序列的資料預測方法,其中,該方法包括:獲取多個類目物件的歷史時間序列資料,其中,該類目物件包括一個或多個資料物件;從該多個類目物件中篩選出特徵類目物件,其中,該特徵類目物件為包含特徵資料物件的類目物件,該特徵資料物件為生命週期小於預設時間閾值的資料物件;基於該特徵類目物件對應的歷史時間序列資料,從該特徵類目物件包含的資料物件中預測出目標資料物件,該目標資料物件為未來第一預設時間段內將要產生的未來時間序列資料滿足預設增長趨勢的資料物件。
  2. 根據申請專利範圍第1項所述的方法,其中,還包括:預測該目標資料物件在該未來第一預設時間段內的未來時間序列資料。
  3. 根據申請專利範圍第1或2項所述的方法,其中,該獲取多個類目物件的歷史時間序列資料的步驟包括:針對預設的多個時間區間,計算每個時間區間內預設資料庫中儲存的,該資料物件對應的指定特徵資料的數量,作為該資料物件在該時間區間內的歷史特徵資料;組織該資料物件在所有時間區間的歷史特徵資料,得到該資料物件的歷史時間序列資料; 按照該時間區間,統計每個類目物件中包含的資料物件在該時間區間的歷史特徵資料的總和;將所有時間區間的歷史特徵資料的總和組織成該類目物件的歷史時間序列資料。
  4. 根據申請專利範圍第3項所述的方法,其中,該從該多個類目物件中篩選出特徵類目物件的步驟包括:基於該類目物件的歷史時間序列資料,從該多個類目物件中篩選出第一特徵類目物件;獲取預設的第二特徵類目物件;將該第一特徵類目物件以及該第二特徵類目物件組織成特徵類目物件。
  5. 根據申請專利範圍第4項所述的方法,其中,該基於該類目物件的歷史時間序列資料,從該多個類目物件中篩選出第一特徵類目物件的步驟包括:計算在過去第一預設時間段內每個類目物件的歷史時間序列資料的中值M;計算歷史特徵資料的總和大於該M的預設倍數的時間區間的數量;若該歷史特徵資料的總和大於該M的預設倍數的時間區間的數量在預設範圍內,則判定該類目物件為第一特徵類目物件。
  6. 根據申請專利範圍第1或2項所述的方法,其中,該基於該特徵類目物件對應的歷史時間序列資料,從該特徵類目物件包含的資料物件中預測出目標資料物件的 步驟包括:基於該特徵類目物件對應的歷史時間序列資料,對該特徵類目物件進行歸一化處理;將所有歸一化處理後的特徵類目物件中包含的資料物件進行聚類,得到類簇物件;從該類簇物件中預測出目標類簇物件;將該目標類簇物件中包含的資料物件,作為目標資料物件。
  7. 根據申請專利範圍第6項所述的方法,其中,該從該類簇物件中預測出目標類簇物件的步驟包括:基於該類簇物件中的資料物件在過去一個月內的歷史時間序列資料,計算該類簇物件的第一平均歷史時間序列資料;基於該類簇物件中的資料物件在過去第十三個月的歷史時間序列資料,計算該類簇物件的第二平均歷史時間序列資料;基於該類簇物件中的資料物件在過去第十二個月的歷史時間序列資料,計算該類簇物件的第三平均歷史時間序列資料;根據該第一平均歷史時間序列資料、該第二平均歷史時間序列資料以及該第三平均歷史時間序列資料,預估該類簇物件在未來第一預設時間段內的未來平均時間序列資料;計算該未來平均時間序列資料與該第一平均歷史時間 序列資料的差值,得到該類簇物件的指標資料;將指標資料大於預設閾值的類簇物件作為目標類簇物件。
  8. 根據申請專利範圍第7項所述的方法,其中,該預測該目標資料物件在該未來第一預設時間段內的未來時間序列資料的步驟包括:對該類簇物件在未來第一預設時間段內的未來平均時間序列資料進行反歸一化處理,得到該類簇物件中每個資料物件的基準平均時間序列資料;對該每個資料物件的基準平均時間序列資料進行修正,得到對應資料物件在未來第一預設時間段內的未來時間序列資料。
  9. 根據申請專利範圍第1或2或4或5或7或8項所述的方法,其中,該資料物件為商品資料,該類目物件為商品類目,該特徵類目物件為時效性商品類目,該生命週期為商品的時效,該時間序列資料為該商品的日銷量。
  10. 一種基於時間序列的資料預測裝置,其中,該裝置包括:歷史時序資料獲取模組,用於獲取多個類目物件的歷史時間序列資料,其中,該類目物件包括一個或多個資料物件;特徵類目物件篩選模組,用於從該多個類目物件中篩選出特徵類目物件,其中,該特徵類目物件為包含特徵資料物件的類目物件,該特徵資料物件為生命週期小於預設 時間閾值的資料物件;目標資料物件預測模組,用於基於該特徵類目物件對應的歷史時間序列資料,從該特徵類目物件包含的資料物件中預測出目標資料物件,該目標資料物件為未來第一預設時間段內將要產生的未來時間序列資料滿足預設增長趨勢的資料物件。
  11. 根據申請專利範圍第10項所述的裝置,其中,還包括:未來時序資料預測模組,用於預測該目標資料物件在該未來第一預設時間段內的未來時間序列資料。
  12. 根據申請專利範圍第10或11項所述的裝置,其中,該歷史時序資料獲取模組包括:歷史特徵資料計算子模組,用於針對預設的多個時間區間,計算每個時間區間內預設資料庫中儲存的,該資料物件對應的指定特徵資料的數量,作為該資料物件在該時間區間內的歷史特徵資料;歷史特徵資料組織子模組,用於組織該資料物件在所有時間區間的歷史特徵資料,得到該資料物件的歷史時間序列資料;歷史特徵資料統計子模組,用於按照該時間區間,統計每個類目物件中包含的資料物件在該時間區間的歷史特徵資料的總和;歷史時序資料組織子模組,用於將所有時間區間的歷史特徵資料的總和組織成該類目物件的歷史時間序列資 料。
  13. 根據申請專利範圍第12項所述的裝置,其中,該特徵類目物件篩選模組包括:第一特徵類目物件篩選子模組,用於基於該類目物件的歷史時間序列資料,從該多個類目物件中篩選出第一特徵類目物件;第二特徵類目物件獲取子模組,用於獲取預設的第二特徵類目物件;組織子模組,用於將該第一特徵類目物件以及該第二特徵類目物件組織成特徵類目物件。
  14. 根據申請專利範圍第13項所述的裝置,其中,該第一特徵類目物件篩選子模組還用於:計算在過去第一預設時間段內每個類目物件的歷史時間序列資料的中值M;計算歷史特徵資料的總和大於該M的預設倍數的時間區間的數量;若該歷史特徵資料的總和大於該M的預設倍數的時間區間的數量在預設範圍內,則判定該類目物件為第一特徵類目物件。
  15. 根據申請專利範圍第10或11項所述的裝置,其中,該目標資料物件預測模組包括:歸一化子模組,用於基於該特徵類目物件對應的歷史時間序列資料,對該特徵類目物件進行歸一化處理;聚類子模組,用於將所有歸一化處理後的特徵類目物 件中包含的資料物件進行聚類,得到類簇物件;預測子模組,用於從該類簇物件中預測出目標類簇物件;目標資料物件獲取子模組,用於將該目標類簇物件中包含的資料物件,作為目標資料物件。
  16. 根據申請專利範圍第15項所述的裝置,其中,該預測子模組還用於:基於該類簇物件中的資料物件在過去一個月內的歷史時間序列資料,計算該類簇物件的第一平均歷史時間序列資料;基於該類簇物件中的資料物件在過去第十三個月的歷史時間序列資料,計算該類簇物件的第二平均歷史時間序列資料;基於該類簇物件中的資料物件在過去第十二個月的歷史時間序列資料,計算該類簇物件的第三平均歷史時間序列資料;根據該第一平均歷史時間序列資料、該第二平均歷史時間序列資料以及該第三平均歷史時間序列資料,預估該類簇物件在未來第一預設時間段內的未來平均時間序列資料;計算該未來平均時間序列資料與該第一平均歷史時間序列資料的差值,得到該類簇物件的指標資料;將指標資料大於預設閾值的類簇物件作為目標類簇物件。
  17. 根據申請專利範圍第16項所述的裝置,其中,該未來時序資料預測模組包括:基準資料獲取子模組,用於對該類簇對象在未來第一預設時間段內的未來平均時間序列資料進行反歸一化處理,得到該類簇物件中每個資料物件的基準平均時間序列資料;修正子模組,用於對該每個資料物件的基準平均時間序列資料進行修正,得到對應資料物件在未來第一預設時間段內的未來時間序列資料。
  18. 根據申請專利範圍第10或11或13或14或16或17項所述的裝置,其中,該資料物件為商品資料,該類目物件為商品類目,該特徵類目物件為時效性商品類目,該生命週期為商品的時效,該時間序列資料為該商品的日銷量。
TW106101434A 2016-01-14 2017-01-16 基於時間序列的資料預測方法和裝置 TWI729058B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610024102.6A CN106971348B (zh) 2016-01-14 2016-01-14 一种基于时间序列的数据预测方法和装置
CN201610024102.6 2016-01-14

Publications (2)

Publication Number Publication Date
TW201730787A true TW201730787A (zh) 2017-09-01
TWI729058B TWI729058B (zh) 2021-06-01

Family

ID=59310795

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106101434A TWI729058B (zh) 2016-01-14 2017-01-16 基於時間序列的資料預測方法和裝置

Country Status (5)

Country Link
US (1) US20180322404A1 (zh)
JP (1) JP2019502213A (zh)
CN (1) CN106971348B (zh)
TW (1) TWI729058B (zh)
WO (1) WO2017121285A1 (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934604B (zh) * 2017-12-15 2021-09-07 北京京东尚科信息技术有限公司 销量数据的处理方法、系统、存储介质及电子设备
CN108133391A (zh) * 2017-12-22 2018-06-08 联想(北京)有限公司 销量预测方法以及服务器
CN108829343B (zh) * 2018-05-10 2020-08-04 中国科学院软件研究所 一种基于人工智能的缓存优化方法
CN109255645B (zh) * 2018-07-20 2021-09-14 创新先进技术有限公司 一种消费预测方法、装置及电子设备
CN110858346B (zh) * 2018-08-22 2023-05-02 阿里巴巴集团控股有限公司 数据处理方法、装置和机器可读介质
CN111104627B (zh) * 2018-10-29 2023-04-07 北京国双科技有限公司 一种热点事件的预测方法及装置
CN111260427B (zh) * 2018-11-30 2023-07-18 北京嘀嘀无限科技发展有限公司 服务订单处理方法、装置、电子设备及存储介质
CN111260384B (zh) * 2018-11-30 2023-09-15 北京嘀嘀无限科技发展有限公司 服务订单处理方法、装置、电子设备及存储介质
CN110298690B (zh) * 2019-05-31 2023-07-18 创新先进技术有限公司 对象类目的周期判断方法、装置、服务器及可读存储介质
CN112149458A (zh) * 2019-06-27 2020-12-29 商汤集团有限公司 障碍物检测方法、智能驾驶控制方法、装置、介质及设备
CN110689170A (zh) * 2019-09-04 2020-01-14 北京三快在线科技有限公司 对象参量的确定方法、装置、电子设备及存储介质
CN113010500B (zh) * 2019-12-18 2024-06-14 天翼云科技有限公司 用于dpi数据的处理方法和处理系统
CN111008749B (zh) * 2019-12-19 2023-06-30 北京顺丰同城科技有限公司 一种需求预测的方法及装置
CN111210071B (zh) * 2020-01-03 2023-11-24 深圳前海微众银行股份有限公司 业务对象预测方法、装置、设备及可读存储介质
CN113269575A (zh) * 2020-02-14 2021-08-17 北京沃东天骏信息技术有限公司 计算时序队列的方法和装置
CN111833110A (zh) * 2020-07-23 2020-10-27 北京思特奇信息技术股份有限公司 客户生命周期定位方法、装置、电子设备及存储介质
CN112053004A (zh) * 2020-09-14 2020-12-08 胜斗士(上海)科技技术发展有限公司 用于时间序列预测的方法和装置
CN112988521B (zh) * 2021-02-09 2023-09-05 北京奇艺世纪科技有限公司 一种告警方法、装置、设备及存储介质
CN113506138B (zh) * 2021-07-16 2024-06-07 瑞幸咖啡信息技术(厦门)有限公司 业务对象的数据预估方法、装置、设备及存储介质
CN113469461A (zh) * 2021-07-26 2021-10-01 北京沃东天骏信息技术有限公司 生成信息的方法和装置
CN113657667A (zh) * 2021-08-17 2021-11-16 北京沃东天骏信息技术有限公司 一种数据处理方法、装置、设备及存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11306267A (ja) * 1998-04-24 1999-11-05 Moteibea:Kk 見込み売上推定システム及び方法並びに見込み売上 推定プログラムを記録した記録媒体
JP4987499B2 (ja) * 2007-01-31 2012-07-25 株式会社エヌ・ティ・ティ・データ 需要予測装置、需要予測方法、及び、需要予測プログラム
JP2009205365A (ja) * 2008-02-27 2009-09-10 Nec Corp 商品の在庫管理および販売の最適化システム、その最適化方法、及びその最適化プログラム
US20100088153A1 (en) * 2008-04-08 2010-04-08 Plan4Demand Solutions, Inc. Demand curve analysis method for demand planning
JP2010003112A (ja) * 2008-06-20 2010-01-07 Univ Of Tokyo 経営支援装置及び経営支援方法
CN102346894B (zh) * 2010-08-03 2017-03-01 阿里巴巴集团控股有限公司 推荐信息的输出方法、系统及服务器
CN103136683B (zh) * 2011-11-24 2017-03-01 阿里巴巴集团控股有限公司 计算产品参考价格的方法、装置及产品搜索方法、系统
US20140122155A1 (en) * 2012-10-29 2014-05-01 Wal-Mart Stores, Inc. Workforce scheduling system and method
CN102938124A (zh) * 2012-10-29 2013-02-20 北京京东世纪贸易有限公司 确定节日热销商品的方法和装置
CN103870453A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
JP5847137B2 (ja) * 2013-08-06 2016-01-20 東芝テック株式会社 需要予測装置及びプログラム
CN103617548B (zh) * 2013-12-06 2016-11-23 中储南京智慧物流科技有限公司 一种趋势性、周期性商品的中长期需求预测方法
CN103984998A (zh) * 2014-05-30 2014-08-13 成都德迈安科技有限公司 基于云服务平台大数据挖掘的销售预测方法
CN104517224B (zh) * 2014-12-22 2017-09-29 浙江工业大学 一种网络热销商品的预测方法及系统
CN105184618A (zh) * 2015-10-20 2015-12-23 广州唯品会信息科技有限公司 新用户的商品个性化推荐方法及系统

Also Published As

Publication number Publication date
CN106971348A (zh) 2017-07-21
TWI729058B (zh) 2021-06-01
CN106971348B (zh) 2021-04-30
JP2019502213A (ja) 2019-01-24
WO2017121285A1 (zh) 2017-07-20
US20180322404A1 (en) 2018-11-08

Similar Documents

Publication Publication Date Title
TWI729058B (zh) 基於時間序列的資料預測方法和裝置
Geetha et al. Optimal lot sizing policy for non-instantaneous deteriorating items with price and advertisement dependent demand under partial backlogging
US9600773B2 (en) Detecting electricity theft via meter tampering using statistical methods
US20150032598A1 (en) System and method for generating a natural hazard credit model
US11928616B2 (en) Method and system for hierarchical forecasting
TW201737176A (zh) 業務對象的分時推薦方法和系統
US20200043022A1 (en) Artificial intelligence system and method for generating a hierarchical data structure
CN109741082A (zh) 一种基于时间序列分解的季节性商品需求预测方法
US20220277331A1 (en) Systems and methods for procurement cost forecasting
US20160132496A1 (en) Data filtering
RU2016128715A (ru) Обнаружение сети деловых отношений и оценивание релевантности отношения
TW201734909A (zh) 一種目標用戶的識別方法和裝置
Anggrainy et al. Implementation of extract, transform, load on data warehouse and business intelligence using pentaho and tableau to analyse sales performance of offlist store
CN110458581B (zh) 商户业务周转异常的识别方法及装置
Pramana et al. Big data implementation for price statistics in Indonesia: Past, current, and future developments
CN107194190B (zh) 医药费用数据库中识别服务对象对费用影响的方法及装置
Mounika et al. Walmart Gross Sales Forecasting Using Machine Learning
US20140039949A1 (en) Determining supplier environmental impact
CN109754265B (zh) 一种数据处理方法及装置
CN113781120A (zh) 销售数额预测模型的构建方法、销售数额的预测方法
CN104484329A (zh) 基于评论中心词时序变化分析的消费热点追踪方法及装置
CN114092151A (zh) 一种基于电商平台的商品销量统计方法、设备及介质
Dholakia et al. Cognitive Demand Forecasting with Novel Features Using Word2Vec and Session of the Day
Ouamani et al. A Hybrid Model for Demand Forecasting Based on the Combination of Statistical and Machine Learning Methods
CN110413967B (zh) 对账图表生成方法、装置、计算机设备以及存储介质