JP2019502213A - 時系列に基づいたデータ予測方法及び装置 - Google Patents

時系列に基づいたデータ予測方法及び装置 Download PDF

Info

Publication number
JP2019502213A
JP2019502213A JP2018536870A JP2018536870A JP2019502213A JP 2019502213 A JP2019502213 A JP 2019502213A JP 2018536870 A JP2018536870 A JP 2018536870A JP 2018536870 A JP2018536870 A JP 2018536870A JP 2019502213 A JP2019502213 A JP 2019502213A
Authority
JP
Japan
Prior art keywords
data
category
feature
series data
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018536870A
Other languages
English (en)
Inventor
ワン ユー
ワン ユー
イエ ジョウ
イエ ジョウ
ワン ジーノン
ワン ジーノン
ヤン ヤン
ヤン ヤン
ドン ジャオピン
ドン ジャオピン
ファン チェン
チェン ファン
チエン チエン
チエン チエン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Publication of JP2019502213A publication Critical patent/JP2019502213A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound

Abstract

時系列に基づいたデータ予測の方法及び装置を本出願の実施形態によって提供する。方法は、複数のカテゴリオブジェクトの履歴時系列データを取得することであって、カテゴリオブジェクトは1つまたは複数のデータオブジェクトを含む、履歴時系列データを取得することと、複数のカテゴリオブジェクトからフィーチャカテゴリオブジェクト(複数可)を選択することであって、フィーチャカテゴリオブジェクト(複数可)は、各フィーチャデータオブジェクトを含むカテゴリオブジェクト(複数可)で、各フィーチャデータオブジェクトは、所定の時間閾値より短いライフサイクルを有するデータオブジェクトである、フィーチャカテゴリオブジェクト(複数可)を選択することと、フィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)の中から、フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、ターゲットデータオブジェクトを予測することであって、ターゲットデータオブジェクトは、将来の第1の所定の期間に生成される将来の時系列データであり、所定の成長傾向を満たす将来の時系列データを有するデータオブジェクトである、ターゲットデータオブジェクトを予測すること、を含む。時系列データの原理に基づいて、本出願は、近い将来、爆発的なパワーを有するターゲットデータオブジェクトを予測し、予測結果が、より良く現実に適合し、より高い精度を有することを可能にする。

Description

本出願は、2016年1月14日出願の中国特許出願番号第201610024102.6号「Time Series Based Data Prediction Method and Apparatus」の優先権を主張し、その全体を参照により本明細書に組み込む。
本出願は、データ処理の技術分野に関し、詳細には、時系列に基づいたデータ予測の方法と装置に関する。
情報技術の発展に伴って、村の配信は、電子商取引プラットフォームの戦略的配信の非常に重要な側面となり、電子商取引プラットフォームを通した商品の出荷を可能にし、商品が外部から村に入るのを可能にする。村の商品はほとんど、非常に時間的制約のある季節商品であり、海産物、淡水魚、及び、生鮮野菜や果物等、消費期限がかなり短いものさえある。これらの種類の商品は、時間的制約商品と呼ぶことができる。時間的制約商品は、時間的制約のある消費特徴と、非常に短い消費期限を有する商品を指す。
実際、時間的制約商品の需要は巨大であるが、電子商取引プラットフォーム及びその物流システムの課題もまた極めて大きく、2つの側面で表される。
(1)保管量が多すぎると、物流に過度の負担がかかり、短い消費期間の種類の商品ということが原因で、大きな損失につながることが多い。
(2)不正確な見積もりによって保管量が不足すると、大きな市場損失となる。
よって、時間的制約商品等の時間的制約のあるデータオブジェクトの識別及び予測は、特に重要である。
上記問題を考慮して、本出願の実施形態を提案して、上記問題または上記問題の少なくとも一部を解決する時系列に基づいたデータ予測方法と、対応する時系列に基づいたデータ予測装置を提供する。
上記問題を解決するために、本出願は、時系列に基づいたデータ予測方法を開示する。方法は、複数のカテゴリオブジェクトの履歴時系列データを取得することであって、カテゴリオブジェクトは1つまたは複数のデータオブジェクトを含む、履歴時系列データを取得することと、複数のカテゴリオブジェクトからフィーチャカテゴリオブジェクト(複数可)を選択することであって、フィーチャカテゴリオブジェクト(複数可)は、各フィーチャデータオブジェクトを含むカテゴリオブジェクト(複数可)であり、各フィーチャデータオブジェクトは、所定の時間閾値より短いライフサイクルを有するデータオブジェクトである、フィーチャカテゴリオブジェクト(複数可)を選択することと、フィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)の中から、フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、ターゲットデータオブジェクトを予測することであって、ターゲットデータオブジェクトは、将来の第1の所定の期間に生成され、所定の成長傾向を満たす将来の時系列データを有するデータオブジェクトである、ターゲットデータオブジェクトを予測することを含む。
好ましくは、方法は、将来の第1の所定の期間におけるターゲットデータオブジェクトの将来の時系列データを予測することをさらに含む。
好ましくは、複数のカテゴリオブジェクトの履歴時系列データを取得することは、複数の所定の時間間隔に関して、各時間間隔の所定のデータベースに記憶されたデータオブジェクトに対応する指定フィーチャデータの量を、各時間間隔におけるデータオブジェクトの履歴フィーチャデータとして計算することと、全ての時間間隔のデータオブジェクトの履歴フィーチャデータを編成して、データオブジェクトの履歴時系列データを取得することと、各時間間隔に従って、各時間間隔の各カテゴリオブジェクトに含まれるデータオブジェクトの履歴フィーチャデータの合計を計算することと、全ての時間間隔の履歴フィーチャデータの各合計を、各カテゴリオブジェクトの履歴時系列データとして編成することを含む。
好ましくは、フィーチャカテゴリオブジェクト(複数可)を複数のカテゴリオブジェクトから選択することは、複数のカテゴリオブジェクトの履歴時系列データに基づいて、複数のカテゴリオブジェクトから第1のフィーチャカテゴリオブジェクトを選択することと、所定の第2のフィーチャカテゴリオブジェクトを取得することと、第1のフィーチャカテゴリオブジェクトと第2のフィーチャカテゴリオブジェクトを、フィーチャカテゴリオブジェクトとして編成することを含む。
好ましくは、複数のカテゴリオブジェクトの履歴時系列データに基づいて、複数のカテゴリオブジェクトから第1のフィーチャカテゴリオブジェクトを選択することは、以前の第1の所定の期間の各カテゴリオブジェクトの履歴時系列データの中央値Mを計算することと、履歴フィーチャデータの合計がMの所定の倍数より大きい時間間隔の数を計算することと、履歴フィーチャデータの合計がMの所定の倍数より大きい時間間隔の数が、所定の範囲内にある場合、そのカテゴリオブジェクトは第1のフィーチャカテゴリオブジェクトであると決定することを含む。
好ましくは、フィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)の中から、フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、ターゲットデータオブジェクトを予測することは、フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、フィーチャカテゴリオブジェクト(複数可)を正規化することと、正規化されたフィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)をクラスタリングして、クラスクラスタオブジェクト(複数可)を取得することと、クラスクラスタオブジェクト(複数可)からターゲットクラスクラスタオブジェクトを予測することと、ターゲットクラスクラスタオブジェクトに含まれるデータオブジェクトをターゲットデータオブジェクトとして設定することを含む。
好ましくは、クラスクラスタオブジェクト(複数可)からターゲットクラスクラスタオブジェクトを予測することは、前月のクラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクト(複数可)の第1の平均履歴時系列データを計算することと、13か月前のクラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクト(複数可)の第2の平均履歴時系列データを計算することと、12か月前のクラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクト(複数可)の第3の平均履歴時系列データを計算することと、第1の平均履歴時系列データ、第2の平均履歴時系列データ、及び、第3の平均履歴時系列データに基づいて、将来の第1の所定の期間のクラスクラスタオブジェクト(複数可)の将来の平均時系列データを予測することと、将来の平均時系列データと第1の平均履歴時系列データとの差を計算して、クラスクラスタオブジェクト(複数可)のインジケータデータを取得することと、所定の閾値より大きいインジケータデータを有するクラスクラスタオブジェクトを、ターゲットクラスクラスタオブジェクトとして設定することを含む。
好ましくは、将来の第1の所定の期間におけるターゲットデータオブジェクトの将来の時系列データを予測することは、将来の第1の所定の期間のクラスクラスタオブジェクト(複数可)の将来の平均時系列データを正規化して、クラスクラスタオブジェクト(複数可)の各データオブジェクトの標準平均時系列データを取得することと、各データオブジェクトの標準平均時系列データを訂正して、将来の第1の所定の期間の各データオブジェクトの将来の時系列データを取得することを含む。
好ましくは、データオブジェクトは、商品データであり、カテゴリオブジェクトは、商品カテゴリであり、フィーチャカテゴリオブジェクト(複数可)は、時間的制約商品カテゴリ(複数可)であり、ライフサイクルは、商品の期限であり、時系列データは、商品の一日当たりの売上高である。
本出願は、時系列に基づいたデータ予測装置をさらに開示する。装置は、複数のカテゴリオブジェクトの履歴時系列データの取得するために使用される履歴時系列データ獲得モジュールであって、カテゴリオブジェクトは1つまたは複数のデータオブジェクトを含む、履歴時系列データ獲得モジュールと、複数のカテゴリオブジェクトからフィーチャカテゴリオブジェクト(複数可)を選択するために使用されるフィーチャカテゴリオブジェクト選択モジュールであって、フィーチャカテゴリオブジェクト(複数可)は、各フィーチャデータオブジェクトを含むカテゴリオブジェクト(複数可)であり、各フィーチャデータオブジェクトは、所定の時間閾値より短いライフサイクルを有するデータオブジェクトである、フィーチャカテゴリオブジェクト選択モジュールと、フィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)の中から、フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、ターゲットデータオブジェクトを予測するために使用されるターゲットデータオブジェクト予測モジュールであって、ターゲットデータオブジェクトは、将来の第1の所定の期間に生成され、所定の成長傾向を満たす将来の時系列データを有するデータオブジェクトである、ターゲットデータオブジェクト予測モジュールとを含む。
好ましくは、装置は、将来の第1の所定の期間におけるターゲットデータオブジェクトの将来の時系列データを予測するために使用される将来の時系列データ予測モジュールをさらに含む。
好ましくは、履歴時系列データ獲得モジュールは、複数の所定の時間間隔に関して、各時間間隔の所定のデータベースに記憶されたデータオブジェクトに対応する指定フィーチャデータの量を、各時間間隔におけるデータオブジェクトの履歴フィーチャデータとして計算するために使用される履歴フィーチャデータ計算サブモジュールと、全ての時間間隔のデータオブジェクトの履歴フィーチャデータを編成して、データオブジェクトの履歴時系列データを取得するために使用される履歴フィーチャデータ編成サブモジュールと、各時間間隔に従って、各時間間隔の各カテゴリオブジェクトに含まれるデータオブジェクトの履歴フィーチャデータの合計を計算するために使用される履歴フィーチャデータ統計サブモジュールと、全ての時間間隔の履歴フィーチャデータの各合計を、各カテゴリオブジェクトの履歴時系列データとして編成するために使用される履歴時系列データ編成サブモジュールとを含む。
好ましくは、フィーチャカテゴリオブジェクト選択モジュールは、複数のカテゴリオブジェクトの履歴時系列データに基づいて、複数のカテゴリオブジェクトから第1のフィーチャカテゴリオブジェクトを選択するために使用される第1のフィーチャカテゴリオブジェクト選択サブモジュールと、所定の第2のフィーチャカテゴリオブジェクトを取得するために使用される第2のフィーチャカテゴリオブジェクト獲得サブモジュールと、第1のフィーチャカテゴリオブジェクトと第2のフィーチャカテゴリオブジェクトを、フィーチャカテゴリオブジェクトとして編成するために使用される編成サブモジュールとを含む。
好ましくは、第1のフィーチャカテゴリオブジェクト選択サブモジュールは、以前の第1の所定の期間における各カテゴリオブジェクトの履歴時系列データの中央値Mを計算することと、履歴フィーチャデータの合計がMの所定の倍数より大きい時間間隔の数を計算することと、履歴フィーチャデータの合計がMの所定の倍数より大きい時間間隔の数が、所定の範囲内にある場合、カテゴリオブジェクトは第1のフィーチャカテゴリオブジェクトであると決定することにさらに使用される。
好ましくは、ターゲットデータオブジェクト予測モジュールは、フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、フィーチャカテゴリオブジェクト(複数可)を正規化するために使用される正規化サブモジュールと、正規化されたフィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)をクラスタリングして、クラスクラスタオブジェクト(複数可)を取得するために使用されるクラスタリングサブモジュールと、クラスクラスタオブジェクト(複数可)からターゲットクラスクラスタオブジェクトを予測するために使用される予測サブモジュールと、ターゲットクラスクラスタオブジェクトに含まれるデータオブジェクトをターゲットデータオブジェクトとして設定するために使用されるターゲットデータオブジェクト獲得サブモジュールとを含む。
好ましくは、予測サブモジュールは、前月のクラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクト(複数可)の第1の平均履歴時系列データを計算することと、13か月前のクラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクト(複数可)の第2の平均履歴時系列データを計算することと、12か月前のクラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクト(複数可)の第3の平均履歴時系列データを計算することと、第1の平均履歴時系列データ、第2の平均履歴時系列データ、及び、第3の平均履歴時系列データに基づいて、将来の第1の所定の期間のクラスクラスタオブジェクト(複数可)の将来の平均時系列データを予測することと、将来の平均時系列データと第1の平均履歴時系列データとの差を計算して、クラスクラスタオブジェクト(複数可)のインジケータデータを取得することと、所定の閾値より大きいインジケータデータを有するクラスクラスタオブジェクトを、ターゲットクラスクラスタオブジェクトとして設定することのためにさらに使用される。
好ましくは、将来の時系列データ予測モジュールは、将来の第1の所定の期間のクラスクラスタオブジェクト(複数可)の将来の平均時系列データを正規化して、クラスクラスタオブジェクト(複数可)の各データオブジェクトの標準平均時系列データを取得するために使用される標準データ獲得サブモジュールと、各データオブジェクトの標準平均時系列データを訂正して、将来の第1の所定の期間の各データオブジェクトの将来の時系列データを取得するために使用される訂正サブモジュールとを含む。
好ましくは、データオブジェクトは、商品データであり、カテゴリオブジェクトは、商品カテゴリであり、フィーチャカテゴリオブジェクト(複数可)は、時間的制約商品カテゴリ(複数可)であり、ライフサイクルは、商品の期限であり、時系列データは、商品の一日当たりの売上高である。
本出願の実施形態は、以下の利点を含む。
本出願の実施形態は、時間的制約のある、季節的フィーチャカテゴリオブジェクトを、複数のカテゴリオブジェクトから選択でき、近い将来に生成され所定の成長傾向を満たす将来の時系列データを有するデータオブジェクト、すなわち、爆発的に売れるターゲットデータオブジェクトを、フィーチャカテゴリオブジェクトに含まれたデータオブジェクトから予測する。時系列データの原理に基づいて、本出願の実施形態は、近い将来、爆発的なパワーを有するターゲットデータオブジェクトを予測し、予測結果が、より良く現実に適合し、より高い精度を有するのを可能にする。
本出願の第1の実施形態による、時系列に基づいたデータ予測方法のフローチャートである。 本出願の第1の実施形態による、時系列に基づいたデータ予測方法のカテゴリツリーの概略図である。 本出願の第2の実施形態による、時系列に基づいたデータ予測方法のフローチャートである。 本出願の実施形態による、時系列に基づいたデータ予測装置の構造ブロック図である。
本出願の上記目的、特徴、及び、利点がよりよく理解できるように、添付図面と特定の実施形態と共に、本出願をさらに詳細に記載する。
図1は、本出願の第1の実施形態による、時系列に基づいたデータ予測方法のフローチャートを示す。本出願の実施形態は、電子商取引プラットフォーム等、ツリーカテゴリシステムを有するプラットフォームに適用できる。ツリーカテゴリシステムは、ツリー分類に従ってデータを分類することによってカテゴリを取得する方法であってよい。ツリー分類は、葉、枝、幹、根を有するツリー等、レベルに従って、レベル毎に分類を行う画像分類である。
例えば、現在、消費者グループに、電子商取引プラットフォームのオンラインストアで、適切に的を絞って様々な種類の商品を購入させるために、商品を分類して、ファッション、アクセサリ、美容、デジタル、ホーム&ガーデン、幼児&母親、食品、レクリエーション&スポーツ、サービス、及び、保険等の商品カテゴリを取得するツリー分類を使用できる。
図1に示すように、本出願の実施形態は、以下のステップを含んでよい。
ステップ101は、複数のカテゴリオブジェクトの履歴時系列データを取得する。
本出願の実施形態に適用するために、カテゴリオブジェクトは、1つまたは複数のデータオブジェクトを含んでよい。例えば、電子商取引プラットフォームにおいては、図2に示すような分類ツリーの概略図において、「海産物」等の商品カテゴリの下に、「毛ガニ」、「たこ」、「ホタテ」等の商品データを含むことができる。
さらに、各データオブジェクトは、複数の対応する指定フィーチャデータを有する。指定フィーチャデータは、事前に生成され、データオブジェクトに関連付けられた指定の活動の発生が検出されると、生成される記録である。例えば、電子商取引プラットフォームにおいて、指定の活動は、販売活動を含んでよく、指定フィーチャデータは、ある商品の販売活動の発生に応答して生成された販売記録であってよい。
特定の実施態様において、データオブジェクトの指定フィーチャデータは、所定のデータベースから取得できる。所定のデータベースは、事前に生成されたデータベースであってよい。例えば、所定のデータベースは、商品データベースであってよく、商品データベースは、1つまたは複数の商品に関連付けられた多くの販売記録を記憶する。
実際には、所定のデータベースは、データオブジェクトのデータ特性情報も記憶してよい。例として、データ特性情報は、時間特性情報、識別特性情報、フィーチャ特性情報等を含んでよい。例えば、商品データベースは、各商品の商品特性情報も記憶してよい。商品特性情報は、商品の基本特性(複数可)、時間特性(複数可)、取引特性(複数可)、信頼性特性(複数可)、及び、販売特性(複数可)等を含んでよい。商品の基本特性(複数可)は、商品の名前、販売している商店のID、価格、販売期間、所属カテゴリ等を含んでよい。時間特性(複数可)は、購買活動、コメント活動、及び/または、販売活動等の活動の発生の時間情報を含んでよい。商品の取引特性(複数可)は、商品の受け取り、追加購入、及び/または、購入を含んでよい。商品の信頼性特性(複数可)は、商店の星のレベル、否定的なコメントの数、否定的なコメントの割合、物流スコア等を含んでよい。商品の販売特性(複数可)は、商品が人気商品か否か、商品が販促商品であるか否か等を含んでよい。
本出願の実施形態の好ましい実施形態においては、ステップ101は、以下のサブステップを含んでよい。
サブステップS11は、複数の所定の時間間隔に関して、各時間間隔の所定のデータベースに記憶されたデータオブジェクトに対応する指定フィーチャデータの数を、各時間間隔のデータオブジェクトの履歴フィーチャデータとして計算する。
特定の実施態様において、時間間隔は、時間空間に従って設定された間隔であってよい。例えば、時間間隔は、一日、半日、一週間、または、一ヶ月等であってよい。時間空間が一日の場合、時間間隔は、各日の[00:00,23:59]であってよい。時間間隔は、日付情報を追加されてもよいことは明らかである。例えば、2015−11−18の時間間隔は、[2015−11−18−00:00,2015−11−18−23:59]であってよい。所定の時間間隔は、事前に開発者によって設定された時間間隔であってよい。
複数の所定の時間間隔を取得後、各時間間隔(例えば、各日)のデータオブジェクトの指定フィーチャデータの数をさらに計算して、各時間間隔の履歴フィーチャデータを取得してよい。例えば、ある商品の一日の販売記録数を計算して、一日当たりの売上高を取得する。
サブステップS12は、全ての時間間隔のデータオブジェクトの履歴フィーチャデータを編成して、データオブジェクトの履歴時系列データを取得する。
各時間間隔のデータオブジェクトの履歴フィーチャデータを取得した後、全ての時間間隔の履歴フィーチャデータを編成し、データオブジェクトの履歴時系列データを取得できる。時系列データは、異なる時点で収集されたデータを指す。この種のデータは、ある事柄、現象等、時間と共に変化する状態または程度を反映する。時系列データは、データの在り方の特別な形態である。過去の一連の値が、将来の値に影響を与える。この種の影響の大きさと影響の様態は、トレンドサイクル等の活動で表すことができ、時系列データにおいては一定でない場合がある。時系列は、本質的に、時間の経過に伴うデータの変化の傾向に基づいて、将来の値の予測をマイニングする。考慮すべき重要な点は、週、月、季節、年等のある周期的な時間の定義、または、休日等の普通ではない日が原因となり得る影響等、時間に固有の特徴である。日付自体を計算する方法は、時間の前後の相関(過去の出来事が将来にどれくらい影響を与えるか)等の特定の考慮事項を必要とする局面も有する。時間的要因を十分に考慮し、時間と共に変化する現在のデータの一連の値を使用した後にのみ、将来の値をより良く予測できる。
例えば、商品の一日当たりの売上高を取得した後で、各日の各一日当たりの売上高を編成することによって、商品の履歴売上高を取得する。
データオブジェクトの履歴時系列データは、過去のある期間のデータオブジェクトの傾向を反映できる。
サブステップS13は、時間間隔に従って、時間間隔の各カテゴリオブジェクトに含まれるデータオブジェクト(複数可)の履歴フィーチャデータの合計を計算する。
カテゴリオブジェクトは、1つまたは複数のデータオブジェクトを含み得るので、カテゴリオブジェクトの全てのデータオブジェクトの履歴フィーチャデータの合計は、カテゴリオブジェクトの下の各データオブジェクトの履歴フィーチャデータを取得後、時間間隔で、この時間間隔を単位として使用して計算できる。
例えば、ある日、「海産物」のカテゴリで、「毛ガニ」の一日当たりの売上高は、1000ジン、「たこ」の一日当たりの売上高は、500ジン、「ホタテ」の一日当たりの売上高は、300ジンである。従って、この日の「海産物」のカテゴリの一日当たりの売上高の合計は、1800ジンである。
サブステップS14は、全ての時間間隔の履歴フィーチャデータの合計を、カテゴリオブジェクトの履歴時系列データとして編成する。
カテゴリオブジェクトの履歴時系列データは、全ての時間間隔の履歴フィーチャデータの合計を編成することによって取得できる。
例えば、前月の「海産物」のカテゴリの各日の一日当たりの売上高の合計を取得した後、前月の一日当たりの売上高の全ての合計を編成することによって、前月の「海産物」のカテゴリの履歴時系列データが取得できる。
特定の実施態様において、ステップ101は、カテゴリデータジェネレータによって達成できる。このジェネレータは、現在のプラットフォームのツリー分類システムに基づいて、各カテゴリオブジェクトの履歴時系列データを生成する。ステップ101の後、データオブジェクトの元々の膨大な量の履歴時系列データは、様々なカテゴリオブジェクトの履歴時系列データに統合されることによって、以降の動作にとって強力なデータ支援を提供できる。
ステップ102は、複数のカテゴリオブジェクトからフィーチャカテゴリオブジェクトを選択する。
本出願の実施形態においては、各カテゴリオブジェクトの履歴時系列データが取得された後、フィーチャカテゴリオブジェクトが、複数のカテゴリオブジェクトからさらに選択できる。フィーチャカテゴリオブジェクトは、フィーチャデータオブジェクトを有するカテゴリオブジェクトであってよい。フィーチャデータオブジェクトは、所定の時間閾値より短いライフサイクルを有するデータオブジェクト、すなわち、時間的制約のあるデータオブジェクトであってよい。例えば、カテゴリオブジェクトが、商品カテゴリである時、フィーチャカテゴリオブジェクトは、時間的制約商品カテゴリであってよい。時間的制約商品カテゴリは、時間的制約商品を有するカテゴリオブジェクトであってよい。時間的制約商品は、ある一定の時間的制約のある消費特徴と、非常に短い消費期限を有する商品である。例は、月餅、毛ガニ等である。時間的制約商品カテゴリは、野菜、果物、海産物、生肉、調理済み肉等の生鮮食品カテゴリを含んでよい。
本出願の実施形態の好ましい実施形態においては、ステップ102は、以下のサブステップを含んでよい。
サブステップS21は、複数のカテゴリオブジェクトの履歴時系列データに基づいて、複数のカテゴリオブジェクトから第1のフィーチャカテゴリオブジェクトを選択する。
現在のプラットフォームの全てのカテゴリオブジェクトの履歴時系列データを取得した後、第1のフィーチャカテゴリオブジェクトが、カテゴリオブジェクトの履歴時系列データに基づいて、カテゴリオブジェクトから選択できる。
本出願の実施形態の好ましい実施形態においては、ステップS21は、以下のサブステップをさらに含んでよい。
サブステップS211は、過去の第1の所定の期間の各カテゴリオブジェクトの履歴時系列データの中央値Mを計算する。
詳細には、中央値は、メジアンとも呼ばれ、データのグループの真ん中に位置する値である(このデータグループは、昇順または降順で配置されていることに特に留意する)。言い換えると、このデータグループにおいて、データの半分は、中央値より大きく、データの他の半分は、中央値より小さい。このデータグループが、偶数の数の値を含む場合、中央値は、真ん中の2つの値の平均である。n個のデータが存在する場合、nが偶数であると、メジアンは、n/2番目の値と(n+2)/2番目の値の平均である。nが奇数の場合、メジアンは、(n+1)/2番目の値である。
特定の実施態様において、各カテゴリオブジェクトの履歴時系列データの時間範囲は、過去の第1の所定の期間として定義できる。例えば、過去の第1の所定の期間は、去年として設定できる。各カテゴリオブジェクトの履歴時系列データは、昇順または降順で配置できる。言い換えると、去年の全ての時間間隔に対応するカテゴリオブジェクトの履歴時系列データの各合計が、順序付けられ、カテゴリオブジェクトの中央値Mが、順序付けの後、取得される。例えば、去年の各日の各商品カテゴリの一日当たりの売上高の合計を順序付けた後、中央にある一日当たりの売上高の合計が、去年の商品カテゴリの中央値Mとして取得される。
平均値は、データグループの極値の影響を受けやすく、中央値は、極値の影響を受けず、実際の状況に合った予測が行われるので、ここでは、平均値ではなく、中央値が計算されることに注意されたい。
サブステップS212は、履歴フィーチャデータの合計が、Mの所定の倍数より大きい時間間隔の数を計算する。
中央値Mを取得した後、Mを、n倍、例えば、1.5倍にする(1.5Mとして表すことができる)。各時間間隔のカテゴリオブジェクトの履歴フィーチャデータの合計を、1.5Mと比較して、履歴フィーチャデータの合計が1.5Mより大きい時間間隔の数を取得する。例えば、商品カテゴリの一日当たりの売上高の合計が1.5Mより大きい日数を計算する。
サブステップS213は、Mの所定の倍数より大きい履歴フィーチャデータの合計を有する時間間隔の数が所定の範囲内にある場合、カテゴリオブジェクトが第1のフィーチャカテゴリオブジェクトであると決定する。
Mを1.5倍し、1.5Mより大きい履歴フィーチャデータの合計を有する時間間隔の数が所定の範囲内にある場合、カテゴリオブジェクトは、第1のフィーチャカテゴリオブジェクトであると決定できる。
例えば、所定の範囲の値を10〜45と設定する。商品カテゴリの一日当たりの売上高の合計が、1.5Mより大きい日の数が、この範囲にある場合、その商品カテゴリは、時間的制約商品カテゴリであると決定される。
サブステップS22は、所定の第2のフィーチャカテゴリオブジェクトを取得する。
本出願の実施形態に適用するために、所定の第2のフィーチャカテゴリオブジェクトは、ホワイトリストにあるカテゴリオブジェクトであってよい。ホワイトリストは、事前に手動で選択できる。例えば、時間的制約商品カテゴリは、オペレータが事前に選択する商品カテゴリであってよく、これらの選択された商品カテゴリは、ホワイトリストに追加される。
サブステップS23は、第1のフィーチャオブジェクトと、第2のフィーチャオブジェクトをフィーチャカテゴリオブジェクトに編成する。
第1のフィーチャオブジェクトと第2のフィーチャオブジェクトを取得した後、第1のフィーチャオブジェクトと第2のフィーチャオブジェクトを、フィーチャカテゴリオブジェクトとして編成できる。編成方法は、重複排除、すなわち、第1のフィーチャオブジェクトと第2のフィーチャオブジェクトで重複しているフィーチャカテゴリオブジェクトを取り除いて、全てのフィーチャカテゴリオブジェクトを出力する方法を含み得る。
本出願の実施形態においては、フィーチャカテゴリオブジェクトの選択は、自動及び手動で行うことができ、そうすることによって、選択結果は、ユーザのニーズをより良く満たし、より完全で、高度なインテリジェント化を有し得る。
ステップ103は、フィーチャカテゴリオブジェクトに対応する履歴時系列データに基づいて、フィーチャカテゴリオブジェクトに含まれるデータオブジェクトから、ターゲットデータオブジェクトを予測する。
フィーチャカテゴリオブジェクト決定後、ターゲットデータオブジェクトが、フィーチャカテゴリオブジェクトに含まれるデータオブジェクトから選択できる。ターゲットデータオブジェクトは、将来の第1の所定の期間に生成される将来の時系列データが、所定の成長傾向を満たすデータオブジェクト、すなわち、爆発的な数が近い時期に生成されるデータオブジェクトである。
特定の実施態様において、予測結果の信頼性を向上させるために、将来の第1の所定の期間は、近い期間であってよい、例えば、将来の中期間または短期間を含んでよい。例として、中期間は、一ヶ月であってよい。すなわち、将来の第1の所定の期間は、現在の次の一ヶ月である。短期間は、半月、一週間等の短期であってよい。すなわち、将来の第1の所定の期間は、現在の次の半月または一週間である。
ターゲットデータオブジェクトは、生成される将来の時系列データが所定の成長傾向を満たすデータオブジェクト、すなわち、生成される数が、通常でない点またはブレークポイントを有するデータオブジェクトであってよい。例えば、中秋節の前には、月餅の売上高は、爆発的に増加するであろうし、そうすると、月餅は、ターゲットデータオブジェクトであってよい。
本出願の実施形態に適用して、フィーチャカテゴリオブジェクトを決定した後、ターゲットデータオブジェクトが、フィーチャカテゴリオブジェクトに含まれるデータオブジェクトからさらに選択できる。例えば、時間的制約商品カテゴリが決定された後、近々、売り上げが好調になる(ブレークポイントまたは通常でない点を生成する)時間的制約のあるターゲット商品が、時間的制約商品カテゴリに含まれる時間的制約商品からさらに選択できる。
本出願の実施形態の好ましい実施形態においては、ステップ103は、以下のサブステップを含んでよい。
サブステップS31は、フィーチャカテゴリオブジェクトの履歴時系列データに基づいて、フィーチャカテゴリオブジェクトを正規化する。
フィーチャカテゴリオブジェクトを決定後、フィーチャカテゴリオブジェクトの様々なデータオブジェクト間の差を取り除いて、より正確な予測結果を取得するために、フィーチャカテゴリオブジェクトに正規化を行うことができる。正規化は、単純化、すなわち、変換によってスカラー量になるように次元表現を非次元表現に変更する方法である。
ある実施態様においては、以下のアプローチを用いて、フィーチャカテゴリオブジェクトに対する正規化を行うことができる。
ステップS211に従って取得された過去の第1の所定の期間のフィーチャカテゴリオブジェクトの履歴時系列データの中央値Mに基づいて、履歴時系列データの各履歴フィーチャデータの合計と中央値Mとの間の各比率を個別に計算して、履歴フィーチャデータの正規化された合計を取得することと、履歴フィーチャデータの正規化された合計を編成して、フィーチャカテゴリオブジェクトの正規化された履歴時系列データを形成すること。
本出願の実施形態が上記正規化アプローチに制限されないことは明らかである。当業者は、他の正規化アプローチを採用できる。
サブステップS32は、全ての正規化されたフィーチャカテゴリオブジェクトに含まれるデータオブジェクトをクラスタリングして、クラスクラスタオブジェクトを取得する。
本出願の実施形態に適用して、フィーチャカテゴリオブジェクトの履歴時系列データを正規化した後、全てのフィーチャカテゴリオブジェクトに対してさらにクラスタリングを行うことができる。実際には、このクラスタリングは、全てのフィーチャカテゴリオブジェクトに含まれる全てのデータオブジェクトに対して行われるクラスタリングであってよく、履歴時系列データの傾向が類似しているデータオブジェクトを集約して、1つまたは複数のクラスクラスタオブジェクトを取得できる。
詳細には、物理的または抽象的オブジェクトの集合から、それぞれ、類似したオブジェクトから形成される複数のクラスを形成するプロセスが、クラスタリングと呼ばれる。クラスタリングによって生成されたクラスクラスタは、オブジェクトの集合である。これらのオブジェクトは、同じクラスタ内のオブジェクトとは類似しており、他のクラスタのオブジェクトとは異なっている。特定の実施態様において、クラスタリングを行うために、多くの異なるクラスタリング方法を使用できる。例は、階層クラスタリング、分割クラスタリング、密度ベースクラスタリング、グリッドベースクラスタリング、モデルベースクラスタリング等である。本出願の実施形態は、クラスタリング方法の詳細にいかなる制限も有さない。
例えば、取得されたフィーチャカテゴリオブジェクトは、果物のカテゴリ、海産物のカテゴリ、調理済み食品のカテゴリ等である。これらの3つのカテゴリオブジェクトは、個別に正規化できる。正規化されたカテゴリオブジェクトに含まれる商品は、クラスタリングされ、類似の爆発的パワーを有する商品が、集約されて、1つまたは複数のクラスクラスタを取得する。例えば、毛ガニは中秋節の頃に最も美味しいので、中秋節の頃の月餅と一緒に高いレベルの売上高に達し得る。これら2つの履歴時系列データの傾向は類似しているので、毛ガニと月餅は、同じクラスクラスタに配置できる。
サブステップS33は、クラスクラスタオブジェクトからターゲットクラスクラスタオブジェクトを予測する。
クラスクラスタオブジェクトを取得後、近い時期(将来の第1の所定の期間)に爆発的に売れるだろうクラスクラスタオブジェクトが、クラスクラスタオブジェクトの中から、ターゲットクラスクラスタオブジェクトに選択できる。例えば、売上好調になるクラスクラスタオブジェクトを、複数のクラスクラスタオブジェクトから、ターゲットクラスクラスタオブジェクトに選択する。
本出願の実施形態の好ましい実施形態においては、サブステップS33は、以下のサブステップをさらに含んでよい。
サブステップS331は、前月のクラスクラスタオブジェクトの各データオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクトの各平均履歴時系列データを計算する。
特定の実施態様において、前月(最近の一ヶ月)のクラスクラスタオブジェクトの各データオブジェクトの正規化された履歴時系列データに基づいて、クラスクラスタの下の全てのデータオブジェクトの履歴時系列データの平均値を計算する。言い換えると、時間間隔を単位として(例えば、日を単位として)使用して、時間間隔内のクラスクラスタの下の全てのデータオブジェクトの正規化された履歴フィーチャデータの合計を、時間間隔内の全てのデータオブジェクトの数によって割ることによって、この時間間隔の平均値を取得する。全ての時間間隔の平均値が、クラスクラスタの第1の平均履歴時系列データを形成する。
サブステップS332は、13か月前のクラスクラスタオブジェクトの各データオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクトの各第2の平均履歴時系列データを計算する。
特定の実施態様において、ここ13か月(最近の一ヶ月の一年前)以内のクラスクラスタオブジェクトの各データオブジェクトの正規化された履歴時系列データに基づいて、クラスクラスタの下の全てのデータオブジェクトの履歴時系列データの平均値を計算する。言い換えると、時間間隔を単位として(例えば、日を単位として)使用して、時間間隔内のクラスクラスタの下の全てのデータオブジェクトの正規化された履歴フィーチャデータの合計を、時間間隔内の全てのデータオブジェクトの数で割ることによって、この時間間隔での平均値を取得する。全ての時間間隔の平均値が、クラスクラスタの第2の平均履歴時系列データを形成する。
サブステップS333は、12か月前のクラスクラスタオブジェクトの各データオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクトの各第3の平均履歴時系列データを計算する。
ステップS332の方法を使用して、クラスクラスタオブジェクトの各第3の平均履歴時系列データを計算する、すなわち、現在の日付から1年前の平均正規化データを計算する。
サブステップS334は、各第1の平均履歴時系列データ、各第2の平均履歴時系列データ、及び、各第3の平均履歴時系列データに基づいて、将来の第1の所定の期間のクラスクラスタオブジェクトの将来の各平均時系列データを予測する。
特定の実施態様において、第1の平均履歴時系列データを取得後、第1の平均履歴時系列データの第1の平均値をさらに計算できる(クラスクラスタの各時間間隔の平均値の合計を時間間隔の数で割る)。また、第2の平均履歴時系列データを取得後、第2の平均履歴時系列データの第2の平均値をさらに計算できる(クラスクラスタの各時間間隔の平均値の合計を時間間隔の数で割る)。
第1の平均値と第2の平均値との比率を計算して、比率値Aを取得する。
第3の平均履歴時系列データに、個別に、比率値Aを掛けて、将来の第1の所定の期間のフィーチャカテゴリオブジェクトの将来の平均時系列データを取得する。
将来の第1の所定の期間は、太陰暦の標準を用いた期間であってよいことに注意されたい。グレゴリオ暦の重要な休日(国の休日、正月等)が、第1の所定の期間のある時間間隔に出現する場合、グレゴリオ暦の休日に従って、対応する訂正を行う。言い換えると、この休日に、太陰暦の標準は、グレゴリオ暦の対応する標準に変更され、他の重要でない休日は変更しない。
サブステップS335は、将来の各平均時系列データと第1の各平均履歴時系列データとの各差を計算して、クラスクラスタオブジェクトの各インジケータデータを取得する。
将来の第1の所定の期間の将来の平均時系列データを取得後、将来の平均時系列データの第1の合計(各時間間隔のクラスクラスタの平均値の合計)をさらに計算でき、第1の平均時系列データの第2の合計を計算できる。
次に、第1の合計と第2の合計の差を計算して、クラスクラスタオブジェクトのインジケータデータを取得できる。
サブステップS336は、所定の閾値より大きいインジケータデータを有するクラスクラスタオブジェクトを、ターゲットクラスクラスタオブジェクトに設定する。
クラスクラスタオブジェクトのインジケータデータを取得後、より大きいインジケータデータを有するクラスクラスタオブジェクトをターゲットクラスクラスタオブジェクトに選択する。ある実施態様においては、所定の閾値より大きいインジケータデータを有するクラスクラスタオブジェクトをターゲットクラスクラスタオブジェクトに選択できる。
例えば、2つのクラスクラスタのインジケータデータが、個別に、以下のように取得される(Mは、正規化された履歴時系列データの中央値である)。
毛ガニ+月餅(第1のクラスクラスタ):1.1M
たこ(第2のクラスクラスタ):−0.01M
順に配置した後、第1のクラスクラスタ(すなわち、毛ガニと月餅)の売上高が、来る半月で爆発的に増加し、たこの売上高は安定したままであるという決定を行う。
本出願の実施形態においては、クラスクラスタの短期及び中中期の爆発的売上の可能性は、クラスクラスタの爆発的なパワーのインジケータデータに基づいて決定できる。
サブステップS34は、ターゲットクラスクラスタに含まれるデータオブジェクト(複数可)を、ターゲットデータオブジェクト(複数可)として設定する。
ターゲットクラスクラスタオブジェクトを決定後、ターゲットクラスクラスタオブジェクトに含まれるデータオブジェクト(複数可)を、ターゲットデータオブジェクト(複数可)として設定できる。
本出願の実施形態は、時間的制約のある、季節的なフィーチャカテゴリオブジェクトを複数のカテゴリオブジェクトから選択でき、近い将来、爆発的に売れるターゲットデータオブジェクトを、フィーチャカテゴリオブジェクトに含まれるデータオブジェクトの中から予測できる。時系列データの原理に基づいて、本出願の実施形態は、近い将来、爆発的なパワーを有するターゲットデータオブジェクトを予測し、予測結果が、現実により良く適合し、より高い精度を有するのを可能にする。
図3は、本出願の第2の実施形態による、時系列に基づいたデータ予測方法のフローチャートを示す。フローチャートは、以下のステップを含んでよい。
ステップ301は、複数のカテゴリオブジェクトの履歴時系列データを取得する。
本出願の実施形態に適用すると、カテゴリオブジェクトは、1つまたは複数のデータオブジェクトを含んでよい。
本出願の実施形態の好ましい実施形態においては、ステップ301は、以下のサブステップを含んでよい。
サブステップS41は、複数の所定の時間間隔に関して、各時間間隔の所定のデータベースに記憶されたデータオブジェクトに対応する指定フィーチャデータの数を、各時間間隔のデータオブジェクトの履歴フィーチャデータとして、計算する。
サブステップS42は、全ての時間間隔のデータオブジェクトの履歴フィーチャデータを編成して、データオブジェクトの履歴時系列データを取得する。
サブステップS43は、時間間隔に従って、時間間隔の各カテゴリオブジェクトに含まれるデータオブジェクト(複数可)の履歴フィーチャデータの合計を計算する。
サブステップS44は、全ての時間間隔の履歴フィーチャデータの合計を、カテゴリオブジェクトの履歴時系列データとして編成する。
ステップ302は、フィーチャカテゴリオブジェクトを複数のカテゴリオブジェクトから選択する。
本出願の実施形態においては、各カテゴリオブジェクトの履歴時系列データを取得した後、フィーチャカテゴリオブジェクトが、複数のカテゴリオブジェクトからさらに選択できる。フィーチャカテゴリオブジェクトは、フィーチャデータオブジェクトを有するカテゴリオブジェクトであってよい。フィーチャデータオブジェクトは、所定の時間閾値より短いライフサイクルを有するデータオブジェクト、すなわち、時間的制約のあるデータオブジェクトであってよい。
サブステップS51は、複数のカテゴリオブジェクトの履歴時系列データに基づいて、複数のカテゴリオブジェクトから第1のフィーチャカテゴリオブジェクトを選択する。
本出願の実施形態の好ましい実施形態においては、サブステップS51は、以下のサブステップをさらに含んでよい。
サブステップS511は、過去の第1の所定の期間の各カテゴリオブジェクトの履歴時系列データの中央値Mを計算する。
サブステップS512は、履歴フィーチャデータの合計がMの所定の倍数より大きい時間間隔の数を計算する。
サブステップS513は、Mの所定の倍数より大きい履歴フィーチャデータの合計を有する時間間隔の数が所定の範囲内である場合、カテゴリオブジェクトは第1のフィーチャカテゴリオブジェクトであると決定する。
サブステップS52は、所定の第2のフィーチャカテゴリオブジェクトを取得する。
サブステップS53は、第1のフィーチャオブジェクトと第2のフィーチャオブジェクトをフィーチャカテゴリオブジェクトに編成する。
ステップ303は、フィーチャカテゴリオブジェクトに対応する履歴時系列データに基づいて、フィーチャカテゴリオブジェクトに含まれるデータオブジェクトからターゲットデータオブジェクトを予測する。
フィーチャカテゴリオブジェクトを決定後、ターゲットデータオブジェクトが、フィーチャカテゴリオブジェクトに含まれるデータオブジェクトから選択できる。ターゲットデータオブジェクトは、将来の第1の所定の期間に生成される将来の時系列データが所定の成長傾向を満たすデータオブジェクトであってよい。
本出願の実施形態の好ましい実施形態においては、ステップ303は、以下のサブステップを含んでよい。
サブステップS61は、フィーチャカテゴリオブジェクトの履歴時系列データに基づいて、フィーチャカテゴリオブジェクトを正規化する。
サブステップS62は、全ての正規化されたフィーチャカテゴリオブジェクトに含まれるデータオブジェクトをクラスタリングして、クラスクラスタオブジェクトを取得する。
サブステップS63は、クラスクラスタオブジェクトからターゲットクラスクラスタオブジェクトを予測する。
本出願の実施形態の好ましい実施形態においては、サブステップS63は、以下のサブステップをさらに含んでよい。
サブステップS631は、前月のクラスクラスタオブジェクトの各データオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクトの各平均履歴時系列データを計算する。
サブステップS632は、13か月前のクラスクラスタオブジェクトの各データオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクトの各第2の平均履歴時系列データを計算する。
サブステップS633は、12か月前クラスクラスタオブジェクトの各データオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクトの各第3の平均履歴時系列データを計算する。
サブステップS634は、第1の各平均履歴時系列データ、第2の各平均履歴時系列データ、及び、第3の各平均履歴時系列データに基づいて、将来の第1の所定の期間のクラスクラスタオブジェクトの将来の各平均時系列データを予測する。
サブステップS635は、将来の各平均時系列データと第1の各平均履歴時系列データとの各差を計算して、クラスクラスタオブジェクトの各インジケータデータを取得する。
サブステップS636は、所定の閾値より大きいインジケータデータを有するクラスクラスタオブジェクトを、ターゲットクラスクラスタオブジェクトに設定する。
サブステップS64は、ターゲットクラスクラスタに含まれるデータオブジェクト(複数可)を、ターゲットデータオブジェクト(複数可)として設定する。
ステップ304は、将来の第1の所定の期間のターゲットデータオブジェクトの将来の時系列データを予測する。
本出願の実施形態の好ましい実施形態においては、ステップ304は、以下のサブステップを含んでよい。
サブステップS71は、将来の第1の所定の期間のクラスクラスタオブジェクトの各将来の平均時系列データを非正規化して、クラスクラスタオブジェクトの各データオブジェクトの標準平均時系列データを取得する。
サブステップS634で予測されたクラスクラスタオブジェクトの将来の各平均時系列データは、正規化された値なので、これらの正規化された値に対して、非正規化を最初に行うことができる、すなわち、各将来の平均時系列データに各中央値Mを掛けて、クラスクラスタオブジェクトの各データオブジェクトの標準平均時系列データを取得する。
サブステップS72は、クラスクラスタオブジェクトの各データオブジェクトの標準平均時系列データを訂正して、将来の第1の所定の期間の各データオブジェクトの対応する将来の時系列データを取得する。
各データオブジェクトの標準平均時系列データを取得した後、標準平均時系列データに訂正を行って、将来の第1の所定の期間の各データオブジェクトの将来の時系列データを取得できる。ある実施態様においては、訂正は、所定の基準パラメータ(複数可)に従って行われる拡大または縮小というオフセット訂正を含んでよい。
所定の基準パラメータ(複数可)は、他のデータベースのオフセットパラメータであってよい。例えば、電子商取引プラットフォームにおいては、プラットフォームの商店の数の変化が原因の影響に対応するために、所定の基準パラメータ(複数可)は、商店データベースのデータであってよい。商店データベースは、プラットフォームの様々な商店と、基本的特性、取引特性、及び、信頼性特性等の商店の特性を含む、商店の主な特徴とを記録する。現在の期間の商店の数と、昨年同時期の商店の数との比較を用いて、標準平均時系列データの拡大(または、縮小)等の訂正を行って、商品カテゴリの将来の時系列データを取得できる。
例えば、今年と去年の同時期を比較すると、商店データベースに記憶された商店の数が、100から1000に増加している。商店の数は、10倍に増加しており、売上高が20倍に増加している。よって、標準平均時系列データを2倍して、将来の時系列データを取得してよい。
本出願の実施形態の好ましい実施形態として、本出願の実施形態が、電子商取引プラットフォームに適用される場合、データオブジェクトは、商品データであってよく、カテゴリオブジェクトは、商品カテゴリであってよく、フィーチャカテゴリオブジェクトは、時間的制約商品カテゴリであってよく、ライフサイクルは、商品の消費期限であってよく、時系列データは、商品の一日当たりの売上高であってよい。
本出願の実施形態は、時間的制約のある季節的なフィーチャカテゴリオブジェクトを、複数のカテゴリオブジェクトから選択でき、近い将来、爆発的に売れるターゲットデータオブジェクトを、フィーチャカテゴリオブジェクトに含まれるデータオブジェクトの中から予測でき、近い将来のターゲットデータオブジェクトの将来の時系列データを予測できる。時系列データの原理に基づいて、本出願の実施形態は、爆発的パワーを有するターゲットデータオブジェクトと、ターゲットデータオブジェクトの将来の時系列データを予測し、予測結果が、現実により良く適合し、より高い精度を有するのを可能にする。
図3の方法の実施形態は、図3の方法の実施形態と基本的に類似しているので、相対的に簡単に記載する。関連部分に関しては、方法の実施形態の部分の記載を参照できる。
方法の実施形態は、記載の目的で、アクションの一連の組み合わせとして表されることに注意されたい。しかしながら、あるステップは、本出願の実施形態に従って、他の順番で、または、並行して行うことができるので、本出願の実施形態は、記載のアクションの順番に制限されないことを当業者は理解されよう。さらに、明細書に記載された実施形態は好ましい実施形態であることも、当業者は理解されたい。実施形態に伴うアクションは、本出願の実施形態に必ずしも必須でないこともある。
図4は、本出願の実施形態による、時系列に基づいたデータ予測装置の構造ブロック図を示し、以下のモジュールを含んでよい。
履歴時系列データ獲得モジュール401は、複数のカテゴリオブジェクトの履歴時系列データを取得するために使用され、カテゴリオブジェクトは、1つまたは複数のデータオブジェクトを含む。
フィーチャカテゴリオブジェクト選択モジュール402は、複数のカテゴリオブジェクトからフィーチャカテゴリオブジェクト(複数可)を選択するために使用され、フィーチャカテゴリオブジェクト(複数可)は、各フィーチャデータオブジェクトを含むカテゴリオブジェクト(複数可)であり、各フィーチャデータオブジェクトは、所定の時間閾値より短いライフサイクルを有するデータオブジェクトである。
ターゲットデータオブジェクト予測モジュール403は、フィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)の中から、フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、ターゲットデータオブジェクトを予測するために使用される。ターゲットデータオブジェクトは、将来の第1の所定の期間に生成され、所定の成長傾向を満たす将来の時系列データを有するデータオブジェクトである。
本出願の実施形態の好ましい実施形態においては、装置は、将来の第1の所定の期間におけるターゲットデータオブジェクトの将来の時系列データを予測するために使用される将来の時系列データ予測モジュールをさらに含んでよい。
本出願の実施形態の好ましい実施形態においては、履歴時系列データ獲得モジュール401は、複数の所定の時間間隔に関して、各時間間隔の所定のデータベースに記憶されるデータオブジェクトに対応する指定フィーチャデータの量を、各時間間隔のデータオブジェクトの履歴フィーチャデータとして、計算するために使用される履歴フィーチャデータ計算サブモジュールと、全ての時間間隔のデータオブジェクトの履歴フィーチャデータを編成して、データオブジェクトの履歴時系列データを取得するために使用される履歴フィーチャデータ編成サブモジュールと、各時間間隔に従って、各時間間隔の各カテゴリオブジェクトに含まれるデータオブジェクトの履歴フィーチャデータの合計を計算するために使用される履歴フィーチャデータ統計サブモジュールと、全ての時間間隔の履歴フィーチャデータの各合計を、各カテゴリオブジェクトの履歴時系列データとして編成するために使用される履歴時系列データ編成サブモジュールとを含む。
本出願の実施形態の好ましい実施形態においては、フィーチャカテゴリオブジェクト選択モジュール402は、複数のカテゴリオブジェクトの履歴時系列データに基づいて、複数のカテゴリオブジェクトから第1のフィーチャカテゴリオブジェクトを選択するために使用される第1のフィーチャカテゴリオブジェクト選択サブモジュールと、所定の第2のフィーチャカテゴリオブジェクトを取得するために使用される第2のフィーチャカテゴリオブジェクト獲得サブモジュールと、第1のフィーチャカテゴリオブジェクトと第2のフィーチャカテゴリオブジェクトを、フィーチャカテゴリオブジェクトとして編成するために使用される編成サブモジュールとを含む。
本出願の実施形態の好ましい実施形態においては、第1のフィーチャカテゴリオブジェクト選択サブモジュールは、以前の第1の所定の期間の各カテゴリオブジェクトの履歴時系列データの中央値Mを計算することと、履歴フィーチャデータの合計がMの所定の倍数より大きい時間間隔の数を計算することと、履歴フィーチャデータの合計がMの所定の倍数より大きい時間間隔の数が所定の範囲内にある場合、カテゴリオブジェクトは第1のフィーチャカテゴリオブジェクトであると決定することのために、さらに使用される。
本出願の実施形態の好ましい実施形態においては、ターゲットデータオブジェクト予測モジュール403は、フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、フィーチャカテゴリオブジェクト(複数可)を正規化するために使用される正規化サブモジュールと、正規化されたフィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)をクラスタリングして、クラスクラスタオブジェクト(複数可)を取得するために使用されるクラスタリングサブモジュールと、クラスクラスタオブジェクト(複数可)からターゲットクラスクラスタオブジェクトを予測するために使用される予測サブモジュールと、ターゲットクラスクラスタオブジェクトに含まれるデータオブジェクトを、ターゲットデータオブジェクトとして設定するために使用されるターゲットデータオブジェクト獲得サブモジュールとを含む。
本出願の実施形態の好ましい実施形態においては、予測サブモジュールは、前月のクラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクト(複数可)の第1の平均履歴時系列データを計算することと、13か月前のクラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクト(複数可)の第2の平均履歴時系列データを計算することと、12か月前のクラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、クラスクラスタオブジェクト(複数可)の第3の平均履歴時系列データを計算することと、第1の平均履歴時系列データ、第2の平均履歴時系列データ、及び、第3の平均履歴時系列データに基づいて、将来の第1の所定の期間のクラスクラスタオブジェクト(複数可)の将来の平均時系列データを予測することと、将来の平均時系列データと第1の平均履歴時系列データとの差を計算して、クラスクラスタオブジェクト(複数可)のインジケータデータを取得することと、所定の閾値より大きいインジケータデータを有するクラスクラスタオブジェクトを、ターゲットクラスクラスタオブジェクトとして設定することのためにさらに使用される。
本出願の実施形態の好ましい実施形態においては、将来の時系列データ予測モジュールは、将来の第1の所定の期間のクラスクラスタオブジェクト(複数可)の将来の平均時系列データを正規化して、クラスクラスタオブジェクト(複数可)の各データオブジェクトの標準平均時系列データを取得するために使用される標準データ獲得サブモジュールと、各データオブジェクトの標準平均時系列データを訂正して、将来の第1の所定の期間の各データオブジェクトの将来の時系列データを取得するために使用される訂正サブモジュールとを含む。
本出願の実施形態の好ましい実施形態においては、データオブジェクトは、商品データであり、カテゴリオブジェクトは、商品カテゴリであり、フィーチャカテゴリオブジェクト(複数可)は、時間的制約商品カテゴリ(複数可)であり、ライフサイクルは、商品の期限であり、時系列データは、商品の一日当たりの売上高である。
装置の実施形態は、基本的に、方法の実施形態と類似しているので、記載は相対的に簡単にする。関連部分に関しては、方法の実施形態の部分を参照できる。
実施形態を明細書に漸進的に記載した。各実施形態の記載は、他の実施形態と異なる焦点を有する。実施形態間の同一または類似の部分は、互いに参照できる。
本出願の実施形態は、方法、装置、または、コンピュータプログラム製品として提供できることを、当業者は理解されよう。よって、本出願の実施形態は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、または、ソフトウェアとハードウェアの組み合わせの実施形態の形態で採用できる。さらに、本出願の実施形態は、コンピュータ使用可能プログラムコードを含む1つまたは複数のコンピュータ使用可能記憶媒体(磁気記憶装置、CD−ROM、光学記憶装置等を含むが、これらに限らない)によって実施されるコンピュータプログラム製品の形態で採用できる。
典型的な構成においては、コンピュータ装置は、1つまたは複数のプロセッサ(CPU)、入力/出力インタフェース、ネットワークインタフェース、及び、メモリを含む。メモリは、揮発性メモリ、ランダムアクセスメモリ(RAM)、及び/または、不揮発性メモリ、例えば、リードオンリメモリ(ROM)もしくはフラッシュRAM等、コンピュータ可読媒体の形態を含んでよい。メモリは、コンピュータ可読媒体の例である。コンピュータ可読媒体は、揮発性または不揮発性タイプの、取り外し可能または取り外し不能媒体を含んでよく、これらは、任意の方法または技術を使用して情報を記憶してよい。情報は、コンピュータ可読命令、データ構造、プログラムモジュール、または、他のデータを含んでよい。コンピュータ記憶媒体の例は、相変化メモリ(PRAM)、スタティックランダムアクセスメモリ(SRAM)、ダイナミックランダムアクセスメモリ(DRAM)、他の種類のランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、電気消去可能プログラマブルリードオンリメモリ(EEPROM)、クイックフラッシュメモリ、もしくは、他の内部記憶技術、コンパクトディスクリードオンリメモリ(CD−ROM)、デジタル多用途ディスク(DVD)、もしくは、他の光学ストレージ、磁気カセットテープ、磁気ディスクストレージ、もしくは、他の磁気記憶装置、または、任意の他の非伝送媒体を含むが、これらに限らず、これらを使用して、コンピュータ装置によってアクセス可能な情報を記憶してよい。本明細書の定義では、コンピュータ可読媒体は、変調データ信号や搬送波等の一時的媒体を含まない。
本開示の態様を、本開示の実施形態による、方法、端末装置(システム)、及び、コンピュータプログラム製品のフローチャート及び/またはブロック図を参照して記載した。コンピュータプログラム命令を使用して、フローチャート及び/またはブロック図の各プロセス及び/またはブロックと、フローチャート及び/またはブロック図のプロセス(複数可)及び/またはブロック(複数可)の組み合わせを実施してよいことは理解されよう。これらのコンピュータプログラム命令は、汎用コンピュータ、専用コンピュータ、埋め込みプロセッサ、または、他のプログラム可能データ処理端末装置のプロセッサに提供されて、機械を生成してよく、それによって、コンピュータまたは他のプログラム可能データ処理端末装置のプロセッサによって実行された命令が、フローチャートの1つまたは複数のプロセス、及び/またはブロック図の1つまたは複数のブロックで指定された機能(複数可)を実施する装置を生成する。
これらのコンピュータプログラム命令は、コンピュータ可読記憶装置に記憶されてもよく、コンピュータまたは他のプログラム可能データ処理端末装置に、特定の方法で動作を実行するように命令でき、それによって、コンピュータ可読記憶装置に記憶された命令は、命令装置を含む製品を生成する。命令装置は、フローチャートの1つまたは複数のプロセス、及び/または、ブロック図の1つまたは複数のブロックに指定された機能(複数可)を実施する。
これらのコンピュータプログラム命令は、コンピュータまたは他のプログラム可能データ処理端末装置にロードされてもよく、そうすることによって、一連の動作が、コンピュータまたは他のプログラム可能端末装置で行われて、コンピュータ実施処理が生成される。よって、コンピュータまたは他のプログラム可能端末装置で実行される命令は、フローチャートの1つまたは複数のプロセス、及び/または、ブロック図の1つまたは複数のブロックで指定された機能(複数可)を実施する手順を提供する。
本出願の実施形態における所定の実施形態を記載したが、当業者は、基本的な発明の概念が分かると、これらの実施形態に他の変更や修正を行い得る。よって、添付請求項は、好ましい実施形態と、本出願の実施形態の範囲に該当する全ての変更及び修正を含むと解釈されることを意図している。
最後に、「第1の」「第2の」等の関連を表す語は、1つの実体または動作を他の実体または動作と区別するためにのみ使用されており、実際には、これらの実体または動作間のこれらの関係または順序のいずれも必ずしも必要とせず、示唆していないことにさらに注意されたい。さらに、「include(含む)、「contain(含む)」、または、これらの他の変形等の用語は、排他的でなく含むことを意図しており、よって、一連の要素を含むプロセス、方法、品物、または、端末装置は、その要素を含むだけでなく、明示的に列挙していない他の要素を含み、または、プロセス、方法、品物、または、端末装置に本来備わる要素もさらに含む。さらなる制限が無い場合、「include a/an・・・(を含む)」という句で定義される要素は、その要素を含むプロセス、方法、品物、または、端末装置に他の同じ要素が存在することを除外しない。
本出願で提供される時系列に基づいたデータ予測方法と時系列に基づいたデータ予測装置を詳細に記載した。本出願の原理及び実施態様を説明するために、本明細書では、特定の例を使用しており、上記実施形態の記載は、本出願の方法と、その中心となる着想を理解するのを支援するためにのみ使用している。さらに、当業者は、特定の実施態様と適用の範囲を本出願の着想に基づいて、変更してよい。要するに、明細書の内容は、本出願を制限するものと解釈すべきではない。
特定の実施態様において、前月(最近の一ヶ月)のクラスクラスタオブジェクトの各データオブジェクトの正規化された履歴時系列データに基づいて、クラスクラスタオブジェクトの下の全てのデータオブジェクトの履歴時系列データの平均値を計算する。言い換えると、時間間隔を単位として(例えば、日を単位として)使用して、時間間隔内のクラスクラスタオブジェクトの下の全てのデータオブジェクトの正規化された履歴フィーチャデータの合計を、時間間隔内の全てのデータオブジェクトの数によって割ることによって、この時間間隔の平均値を取得する。全ての時間間隔の平均値が、クラスクラスタオブジェクトの第1の平均履歴時系列データを形成する。
特定の実施態様において、ここ13か月(最近の一ヶ月の一年前)以内のクラスクラスタオブジェクトの各データオブジェクトの正規化された履歴時系列データに基づいて、クラスクラスタオブジェクトの下の全てのデータオブジェクトの履歴時系列データの平均値を計算する。言い換えると、時間間隔を単位として(例えば、日を単位として)使用して、時間間隔内のクラスクラスタオブジェクトの下の全てのデータオブジェクトの正規化された履歴フィーチャデータの合計を、時間間隔内の全てのデータオブジェクトの数で割ることによって、この時間間隔での平均値を取得する。全ての時間間隔の平均値が、クラスクラスタオブジェクトの第2の平均履歴時系列データを形成する。
本出願の実施形態においては、クラスクラスタオブジェクトの短期及び中中期の爆発的売上の可能性は、クラスクラスタオブジェクトの爆発的なパワーのインジケータデータに基づいて決定できる。
サブステップS34は、ターゲットクラスクラスタオブジェクトに含まれるデータオブジェクト(複数可)を、ターゲットデータオブジェクト(複数可)として設定する。
サブステップS64は、ターゲットクラスクラスタオブジェクトに含まれるデータオブジェクト(複数可)を、ターゲットデータオブジェクト(複数可)として設定する。

Claims (18)

  1. 時系列に基づいたデータ予測方法であって、
    複数のカテゴリオブジェクトの履歴時系列データを取得することであって、前記カテゴリオブジェクトは1つまたは複数のデータオブジェクトを含む、前記履歴時系列データを取得することと、
    前記複数のカテゴリオブジェクトからフィーチャカテゴリオブジェクト(複数可)を選択することであって、前記フィーチャカテゴリオブジェクト(複数可)は、各フィーチャデータオブジェクトを含むカテゴリオブジェクト(複数可)であり、前記各フィーチャデータオブジェクトは、所定の時間閾値より短いライフサイクルを有するデータオブジェクトである、前記フィーチャカテゴリオブジェクト(複数可)を選択することと、
    前記フィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)の中から、前記フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、ターゲットデータオブジェクトを予測することであって、前記ターゲットデータオブジェクトは、将来の第1の所定の期間に生成され、所定の成長傾向を満たす将来の時系列データを有するデータオブジェクトである、前記ターゲットデータオブジェクトを予測することと、
    を含む、前記方法。
  2. 前記将来の第1の所定の期間における前記ターゲットデータオブジェクトの前記将来の時系列データを予測することをさらに含む、請求項1に記載の方法。
  3. 前記複数のカテゴリオブジェクトの前記履歴時系列データを取得することは、
    複数の所定の時間間隔に関して、各時間間隔の所定のデータベースに記憶された前記データオブジェクトに対応する指定フィーチャデータの量を、前記各時間間隔における前記データオブジェクトの履歴フィーチャデータとして、計算することと、
    全ての前記時間間隔の前記データオブジェクトの履歴フィーチャデータを編成して、前記データオブジェクトの履歴時系列データを取得することと、
    前記各時間間隔に従って、前記各時間間隔の各カテゴリオブジェクトに含まれるデータオブジェクトの履歴フィーチャデータの合計を計算することと、
    全ての前記時間間隔の履歴フィーチャデータの各合計を、前記各カテゴリオブジェクトの履歴時系列データとして編成することと、
    を含む、請求項1または2に記載の方法。
  4. フィーチャカテゴリオブジェクト(複数可)を前記複数のカテゴリオブジェクトから選択することは、
    前記複数のカテゴリオブジェクトの前記履歴時系列データに基づいて、前記複数のカテゴリオブジェクトから第1のフィーチャカテゴリオブジェクトを選択することと、
    所定の第2のフィーチャカテゴリオブジェクトを取得することと、
    前記第1のフィーチャカテゴリオブジェクトと前記第2のフィーチャカテゴリオブジェクトを、フィーチャカテゴリオブジェクトとして編成することと、
    を含む、請求項3に記載の方法。
  5. 前記複数のカテゴリオブジェクトの前記履歴時系列データに基づいて、前記複数のカテゴリオブジェクトから前記第1のフィーチャカテゴリオブジェクトを選択することは、
    以前の第1の所定の期間における各カテゴリオブジェクトの履歴時系列データの中央値Mを計算することと、
    履歴フィーチャデータの合計がMの所定の倍数より大きい時間間隔の数を計算することと、
    履歴フィーチャデータの前記合計がMの前記所定の倍数より大きい時間間隔の前記数が、所定の範囲内にある場合、前記カテゴリオブジェクトは前記第1のフィーチャカテゴリオブジェクトであると決定することと、
    を含む、請求項4に記載の方法。
  6. 前記フィーチャカテゴリオブジェクト(複数可)に含まれる前記データオブジェクト(複数可)の中から、前記フィーチャカテゴリオブジェクト(複数可)に対応する前記履歴時系列データに基づいて、前記ターゲットデータオブジェクトを予測することは、
    前記フィーチャカテゴリオブジェクト(複数可)に対応する前記履歴時系列データに基づいて、前記フィーチャカテゴリオブジェクト(複数可)を正規化することと、
    前記正規化されたフィーチャカテゴリオブジェクト(複数可)に含まれる前記データオブジェクト(複数可)をクラスタリングして、クラスクラスタオブジェクト(複数可)を取得することと、
    前記クラスクラスタオブジェクト(複数可)からターゲットクラスクラスタオブジェクトを予測することと、
    前記ターゲットクラスクラスタオブジェクトに含まれるデータオブジェクトを、前記ターゲットデータオブジェクトとして設定することと、
    を含む、請求項1または2に記載の方法。
  7. 前記クラスクラスタオブジェクト(複数可)から前記ターゲットクラスクラスタオブジェクトを予測することは、
    前月の前記クラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、前記クラスクラスタオブジェクト(複数可)の第1の平均履歴時系列データを計算することと、
    13か月前の前記クラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、前記クラスクラスタオブジェクト(複数可)の第2の平均履歴時系列データを計算することと、
    12か月前の前記クラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、前記クラスクラスタオブジェクト(複数可)の第3の平均履歴時系列データを計算することと、
    前記第1の平均履歴時系列データ、前記第2の平均履歴時系列データ、及び、前記第3の平均履歴時系列データに基づいて、前記将来の第1の所定の期間の前記クラスクラスタオブジェクト(複数可)の将来の平均時系列データを予測することと、
    前記将来の平均時系列データと前記第1の平均履歴時系列データとの差を計算して、前記クラスクラスタオブジェクト(複数可)のインジケータデータを取得することと、
    所定の閾値より大きいインジケータデータを有するクラスクラスタオブジェクトを、前記ターゲットクラスクラスタオブジェクトとして設定することと、
    を含む、請求項6に記載の方法。
  8. 前記将来の第1の所定の期間における前記ターゲットデータオブジェクトの前記将来の時系列データを予測することは、
    前記将来の第1の所定の期間の前記クラスクラスタオブジェクト(複数可)の将来の平均時系列データを正規化して、前記クラスクラスタオブジェクト(複数可)の各データオブジェクトの標準平均時系列データを取得することと、
    各データオブジェクトの前記標準平均時系列データを訂正して、前記将来の第1の所定の期間の前記各データオブジェクトの将来の時系列データを取得することと、
    を含む、請求項7に記載の方法。
  9. 前記データオブジェクトは、商品データであり、前記カテゴリオブジェクトは、商品カテゴリであり、前記フィーチャカテゴリオブジェクト(複数可)は、時間的制約商品カテゴリ(複数可)であり、前記ライフサイクルは、商品の期限であり、前記時系列データは、前記商品の一日当たりの売上高である、請求項1、2、4、5、7、8のいずれか1項に記載の方法。
  10. 時系列に基づいたデータ予測装置であって、
    複数のカテゴリオブジェクトの履歴時系列データを取得するために使用される履歴時系列データ獲得モジュールであって、前記カテゴリオブジェクトは1つまたは複数のデータオブジェクトを含む、前記履歴時系列データ獲得モジュールと、
    前記複数のカテゴリオブジェクトからフィーチャカテゴリオブジェクト(複数可)を選択するために使用されるフィーチャカテゴリオブジェクト選択モジュールであって、前記フィーチャカテゴリオブジェクト(複数可)は、各フィーチャデータオブジェクトを含むカテゴリオブジェクト(複数可)であり、前記各フィーチャデータオブジェクトは、所定の時間閾値より短いライフサイクルを有するデータオブジェクトである、前記フィーチャカテゴリオブジェクト選択モジュールと、
    前記フィーチャカテゴリオブジェクト(複数可)に含まれるデータオブジェクト(複数可)の中から、前記フィーチャカテゴリオブジェクト(複数可)に対応する履歴時系列データに基づいて、ターゲットデータオブジェクトを予測するために使用されるターゲットデータオブジェクト予測モジュールであって、前記ターゲットデータオブジェクトは、将来の第1の所定の期間に生成され、所定の成長傾向を満たす将来の時系列データを有するデータオブジェクトである、前記ターゲットデータオブジェクト予測モジュールと、
    を含む、前記装置。
  11. 前記将来の第1の所定の期間における前記ターゲットデータオブジェクトの前記将来の時系列データを予測するために使用される将来の時系列データ予測モジュールをさらに含む、請求項10に記載の装置。
  12. 前記履歴時系列データ獲得モジュールは、
    複数の所定の時間間隔に関して、各時間間隔の所定のデータベースに記憶された前記データオブジェクトに対応する指定フィーチャデータの量を、前記各時間間隔における前記データオブジェクトの履歴フィーチャデータとして、計算するために使用される履歴フィーチャデータ計算サブモジュールと、
    全ての前記時間間隔の前記データオブジェクトの履歴フィーチャデータを編成して、前記データオブジェクトの履歴時系列データを取得するために使用される履歴フィーチャデータ編成サブモジュールと、
    前記各時間間隔に従って、前記各時間間隔の各カテゴリオブジェクトに含まれるデータオブジェクトの履歴フィーチャデータの合計を計算するために使用される履歴フィーチャデータ統計サブモジュールと、
    全ての前記時間間隔の履歴フィーチャデータの各合計を、前記各カテゴリオブジェクトの履歴時系列データとして編成するために使用される履歴時系列データ編成サブモジュールと、
    を含む、請求項10または11に記載の装置。
  13. 前記フィーチャカテゴリオブジェクト選択モジュールは、
    前記複数のカテゴリオブジェクトの前記履歴時系列データに基づいて、前記複数のカテゴリオブジェクトから第1のフィーチャカテゴリオブジェクトを選択するために使用される第1のフィーチャカテゴリオブジェクト選択サブモジュールと、
    所定の第2のフィーチャカテゴリオブジェクトを取得するために使用される第2のフィーチャカテゴリオブジェクト獲得サブモジュールと、
    前記第1のフィーチャカテゴリオブジェクトと前記第2のフィーチャカテゴリオブジェクトを、フィーチャカテゴリオブジェクトとして編成するために使用される編成サブモジュールと、
    を含む、請求項12に記載の装置。
  14. 前記第1のフィーチャカテゴリオブジェクト選択サブモジュールは、
    以前の第1の所定の期間における各カテゴリオブジェクトの履歴時系列データの中央値Mを計算することと、
    履歴フィーチャデータの合計がMの所定の倍数より大きい時間間隔の数を計算することと、
    履歴フィーチャデータの前記合計がMの前記所定の倍数より大きい時間間隔の前記数が、所定の範囲内にある場合、前記カテゴリオブジェクトは前記第1のフィーチャカテゴリオブジェクトであると決定することと、
    のためにさらに使用される、請求項13に記載の装置。
  15. 前記ターゲットデータオブジェクト予測モジュールは、
    前記フィーチャカテゴリオブジェクト(複数可)に対応する前記履歴時系列データに基づいて、前記フィーチャカテゴリオブジェクト(複数可)を正規化するために使用される正規化サブモジュールと、
    前記正規化されたフィーチャカテゴリオブジェクト(複数可)に含まれる前記データオブジェクト(複数可)をクラスタリングして、クラスクラスタオブジェクト(複数可)を取得するために使用されるクラスタリングサブモジュールと、
    前記クラスクラスタオブジェクト(複数可)からターゲットクラスクラスタオブジェクトを予測するために使用される予測サブモジュールと、
    前記ターゲットクラスクラスタオブジェクトに含まれるデータオブジェクトを、前記ターゲットデータオブジェクトとして設定するために使用されるターゲットデータオブジェクト獲得サブモジュールと、
    を含む、請求項10または11に記載の装置。
  16. 前記予測サブモジュールは、
    前月の前記クラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、前記クラスクラスタオブジェクト(複数可)の第1の平均履歴時系列データを計算することと、
    13か月前の前記クラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、前記クラスクラスタオブジェクト(複数可)の第2の平均履歴時系列データを計算することと、
    12か月前の前記クラスクラスタオブジェクト(複数可)のデータオブジェクトの履歴時系列データに基づいて、前記クラスクラスタオブジェクト(複数可)の第3の平均履歴時系列データを計算することと、
    前記第1の平均履歴時系列データ、前記第2の平均履歴時系列データ、及び、前記第3の平均履歴時系列データに基づいて、前記将来の第1の所定の期間の前記クラスクラスタオブジェクト(複数可)の将来の平均時系列データを予測することと、
    前記将来の平均時系列データと前記第1の平均履歴時系列データとの差を計算して、前記クラスクラスタオブジェクト(複数可)のインジケータデータを取得することと、
    所定の閾値より大きいインジケータデータを有するクラスクラスタオブジェクトを、前記ターゲットクラスクラスタオブジェクトとして設定することと、
    のためにさらに使用される、請求項15に記載の装置。
  17. 前記将来の時系列データ予測モジュールは、
    前記将来の第1の所定の期間の前記クラスクラスタオブジェクト(複数可)の将来の平均時系列データを正規化して、前記クラスクラスタオブジェクト(複数可)の各データオブジェクトの標準平均時系列データを取得するために使用される標準データ獲得サブモジュールと、
    各データオブジェクトの前記標準平均時系列データを訂正して、前記将来の第1の所定の期間の前記各データオブジェクトの将来の時系列データを取得するために使用される訂正サブモジュールと、
    を含む、請求項16に記載の装置。
  18. 前記データオブジェクトは、商品データであり、前記カテゴリオブジェクトは、商品カテゴリであり、前記フィーチャカテゴリオブジェクト(複数可)は、時間的制約商品カテゴリ(複数可)であり、前記ライフサイクルは、商品の期限であり、前記時系列データは、前記商品の一日当たりの売上高である、請求項10、11、13、14、16、17のいずれか1項に記載の装置。
JP2018536870A 2016-01-14 2017-01-06 時系列に基づいたデータ予測方法及び装置 Pending JP2019502213A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610024102.6 2016-01-14
CN201610024102.6A CN106971348B (zh) 2016-01-14 2016-01-14 一种基于时间序列的数据预测方法和装置
PCT/CN2017/070356 WO2017121285A1 (zh) 2016-01-14 2017-01-06 一种基于时间序列的数据预测方法和装置

Publications (1)

Publication Number Publication Date
JP2019502213A true JP2019502213A (ja) 2019-01-24

Family

ID=59310795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018536870A Pending JP2019502213A (ja) 2016-01-14 2017-01-06 時系列に基づいたデータ予測方法及び装置

Country Status (5)

Country Link
US (1) US20180322404A1 (ja)
JP (1) JP2019502213A (ja)
CN (1) CN106971348B (ja)
TW (1) TWI729058B (ja)
WO (1) WO2017121285A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021536071A (ja) * 2019-06-27 2021-12-23 センスタイム グループ リミテッド 障害物検出方法、知的運転制御方法、装置、媒体、及び機器

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109934604B (zh) * 2017-12-15 2021-09-07 北京京东尚科信息技术有限公司 销量数据的处理方法、系统、存储介质及电子设备
CN108133391A (zh) * 2017-12-22 2018-06-08 联想(北京)有限公司 销量预测方法以及服务器
CN108829343B (zh) * 2018-05-10 2020-08-04 中国科学院软件研究所 一种基于人工智能的缓存优化方法
CN109255645B (zh) * 2018-07-20 2021-09-14 创新先进技术有限公司 一种消费预测方法、装置及电子设备
CN110858346B (zh) * 2018-08-22 2023-05-02 阿里巴巴集团控股有限公司 数据处理方法、装置和机器可读介质
CN111104627B (zh) * 2018-10-29 2023-04-07 北京国双科技有限公司 一种热点事件的预测方法及装置
CN111260427B (zh) * 2018-11-30 2023-07-18 北京嘀嘀无限科技发展有限公司 服务订单处理方法、装置、电子设备及存储介质
CN111260384B (zh) * 2018-11-30 2023-09-15 北京嘀嘀无限科技发展有限公司 服务订单处理方法、装置、电子设备及存储介质
CN110298690B (zh) * 2019-05-31 2023-07-18 创新先进技术有限公司 对象类目的周期判断方法、装置、服务器及可读存储介质
CN110689170A (zh) * 2019-09-04 2020-01-14 北京三快在线科技有限公司 对象参量的确定方法、装置、电子设备及存储介质
CN113010500A (zh) * 2019-12-18 2021-06-22 中国电信股份有限公司 用于dpi数据的处理方法和处理系统
CN111008749B (zh) * 2019-12-19 2023-06-30 北京顺丰同城科技有限公司 一种需求预测的方法及装置
CN111210071B (zh) * 2020-01-03 2023-11-24 深圳前海微众银行股份有限公司 业务对象预测方法、装置、设备及可读存储介质
CN113269575A (zh) * 2020-02-14 2021-08-17 北京沃东天骏信息技术有限公司 计算时序队列的方法和装置
CN111833110A (zh) * 2020-07-23 2020-10-27 北京思特奇信息技术股份有限公司 客户生命周期定位方法、装置、电子设备及存储介质
CN112053004A (zh) * 2020-09-14 2020-12-08 胜斗士(上海)科技技术发展有限公司 用于时间序列预测的方法和装置
CN112988521B (zh) * 2021-02-09 2023-09-05 北京奇艺世纪科技有限公司 一种告警方法、装置、设备及存储介质
CN113506138A (zh) * 2021-07-16 2021-10-15 瑞幸咖啡信息技术(厦门)有限公司 业务对象的数据预估方法、装置、设备及存储介质
CN113469461A (zh) * 2021-07-26 2021-10-01 北京沃东天骏信息技术有限公司 生成信息的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11306267A (ja) * 1998-04-24 1999-11-05 Moteibea:Kk 見込み売上推定システム及び方法並びに見込み売上 推定プログラムを記録した記録媒体
JP2009205365A (ja) * 2008-02-27 2009-09-10 Nec Corp 商品の在庫管理および販売の最適化システム、その最適化方法、及びその最適化プログラム
JP2010003112A (ja) * 2008-06-20 2010-01-07 Univ Of Tokyo 経営支援装置及び経営支援方法
JP2015032267A (ja) * 2013-08-06 2015-02-16 東芝テック株式会社 需要予測装置及びプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4987499B2 (ja) * 2007-01-31 2012-07-25 株式会社エヌ・ティ・ティ・データ 需要予測装置、需要予測方法、及び、需要予測プログラム
US20100004976A1 (en) * 2008-04-08 2010-01-07 Plan4Demand Solutions, Inc. Demand curve analysis method for analyzing demand patterns
CN102346894B (zh) * 2010-08-03 2017-03-01 阿里巴巴集团控股有限公司 推荐信息的输出方法、系统及服务器
CN103136683B (zh) * 2011-11-24 2017-03-01 阿里巴巴集团控股有限公司 计算产品参考价格的方法、装置及产品搜索方法、系统
CN102938124A (zh) * 2012-10-29 2013-02-20 北京京东世纪贸易有限公司 确定节日热销商品的方法和装置
US20140122155A1 (en) * 2012-10-29 2014-05-01 Wal-Mart Stores, Inc. Workforce scheduling system and method
CN103870453A (zh) * 2012-12-07 2014-06-18 盛乐信息技术(上海)有限公司 数据推荐方法及系统
CN103617548B (zh) * 2013-12-06 2016-11-23 中储南京智慧物流科技有限公司 一种趋势性、周期性商品的中长期需求预测方法
CN103984998A (zh) * 2014-05-30 2014-08-13 成都德迈安科技有限公司 基于云服务平台大数据挖掘的销售预测方法
CN104517224B (zh) * 2014-12-22 2017-09-29 浙江工业大学 一种网络热销商品的预测方法及系统
CN105184618A (zh) * 2015-10-20 2015-12-23 广州唯品会信息科技有限公司 新用户的商品个性化推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11306267A (ja) * 1998-04-24 1999-11-05 Moteibea:Kk 見込み売上推定システム及び方法並びに見込み売上 推定プログラムを記録した記録媒体
JP2009205365A (ja) * 2008-02-27 2009-09-10 Nec Corp 商品の在庫管理および販売の最適化システム、その最適化方法、及びその最適化プログラム
JP2010003112A (ja) * 2008-06-20 2010-01-07 Univ Of Tokyo 経営支援装置及び経営支援方法
JP2015032267A (ja) * 2013-08-06 2015-02-16 東芝テック株式会社 需要予測装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021536071A (ja) * 2019-06-27 2021-12-23 センスタイム グループ リミテッド 障害物検出方法、知的運転制御方法、装置、媒体、及び機器

Also Published As

Publication number Publication date
CN106971348B (zh) 2021-04-30
WO2017121285A1 (zh) 2017-07-20
TW201730787A (zh) 2017-09-01
CN106971348A (zh) 2017-07-21
TWI729058B (zh) 2021-06-01
US20180322404A1 (en) 2018-11-08

Similar Documents

Publication Publication Date Title
JP2019502213A (ja) 時系列に基づいたデータ予測方法及び装置
JP7105700B2 (ja) サービス対象のための時分割推薦方法及び装置
Das et al. An integrated production inventory model under interactive fuzzy credit period for deteriorating item with several markets
US10860634B2 (en) Artificial intelligence system and method for generating a hierarchical data structure
US20140136278A1 (en) Competitive price alert system with competitive price rules engine
US20140122179A1 (en) Method and system for determining long range demand forecasts for products including seasonal patterns
Rapolu et al. Joint pricing, advertisement, preservation technology investment and inventory policies for non-instantaneous deteriorating items under trade credit
US20160232461A1 (en) System and method for determining forecast errors for merchandise in retail
US20190251609A1 (en) Commodity demand prediction system, commodity demand prediction method, and commodity demand prediction program
US20190378061A1 (en) System for modeling the performance of fulfilment machines
US20220414579A1 (en) Salesperson evaluation apparatus, salesperson evaluation method, and salesperson evaluation program
CN111612560A (zh) 用于促销对象的推荐方法、系统、存储介质及电子设备
CN116881242B (zh) 一种生鲜农产品电商采购数据智能存储系统
CN107451881A (zh) 信息获取方法及装置
Shukla et al. An inventory model for continuously deteriorating agri–fresh produce: an artificial immune system–based solution approach
JP5847137B2 (ja) 需要予測装置及びプログラム
CN109658153B (zh) 备件需求量的预测方法及装置,以及电子设备
CN117194764A (zh) 一种基于多平台融合商城的商品展示方法、设备及介质
JP6276655B2 (ja) 需要予測装置およびプログラム
CN113487376A (zh) Ai智慧农批云平台处理系统和方法
US20150242784A1 (en) Order quantity determining method, order quantity determining apparatus, and recording medium
CN111461632A (zh) 商品供需平衡方法及系统、服务器及介质
JP2020115276A (ja) 情報処理方法、情報処理装置、プログラム及び学習済みモデルの生成方法
Kumari et al. CertiMart: Use Computer Vision to Digitize and Automate Supermarket with Fruit Quality Measuring and Maintaining
TWI771615B (zh) 訂單預測方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180914

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191217

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210706