WO2017090114A1 - データ処理システム及びデータ処理方法 - Google Patents

データ処理システム及びデータ処理方法 Download PDF

Info

Publication number
WO2017090114A1
WO2017090114A1 PCT/JP2015/083044 JP2015083044W WO2017090114A1 WO 2017090114 A1 WO2017090114 A1 WO 2017090114A1 JP 2015083044 W JP2015083044 W JP 2015083044W WO 2017090114 A1 WO2017090114 A1 WO 2017090114A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
index
optimization
processing system
data processing
Prior art date
Application number
PCT/JP2015/083044
Other languages
English (en)
French (fr)
Inventor
知明 秋富
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Priority to US15/756,383 priority Critical patent/US20180253455A1/en
Priority to JP2017514380A priority patent/JP6192877B1/ja
Priority to PCT/JP2015/083044 priority patent/WO2017090114A1/ja
Publication of WO2017090114A1 publication Critical patent/WO2017090114A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2272Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2453Query optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Abstract

データ処理システムは、プロセッサと、記憶部とを備え、複数のカラムを含む入力データを最適化するためのモデルを作成するものであり、ここで、前記プロセッサは、前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取り、前記指標データに基づいて前記モデルを生成する。

Description

データ処理システム及びデータ処理方法
 本発明は、データ処理システム及びデータ処理方法に関する。
 近年、BIGDATAと呼ばれる社会の大量の情報間の未知の関係を明らかにするような技術が発展してきている。このような情報間の関係を明らかにする目的は、情報間の関係を表す評価式を用いて、現実の問題を最適化するためである。このとき、現実の問題には、一般に様々な制約条件がある。したがって、これらの制約条件を満たしながら、上記評価式から得られる評価結果を改善するように最適化を行う必要がある。
 しかし、情報間の関係性を数値から帰納的に求めた評価式は、必ずしも、上記制約条件を考慮した最適化に適した評価式とは限らず、最適化の効果が制約条件により大きく下がることがある。このような問題を回避するために、評価式生成時にユーザが評価式に条件を追加する方法がある。例えば、特許文献1には、入力データの複数のカラムのうち、評価式に使用するカラム、又はカラムの一部をユーザが任意に指定する方法が開示されている。
米国特許第8171001号明細書
 特許文献1の技術は、作成すべき評価式を予めユーザが知っていて、その評価式が人間の把握できる程度の簡易なものである場合にしか適用できない。上記したように最適化の効果が大きい未知の評価式を作成したい場合には、予め評価式に用いるカラムを限定することができないという課題がある。
 そこで、本発明は、多くの変数を含むデータに関して、予め制約を考慮して最適化向けの評価式を作成する技術を提供する。
 例えば、上記課題を解決するために、請求の範囲に記載の構成を採用する。本願は上記課題を解決する手段を複数含んでいるが、その一例をあげるならば、プロセッサと、記憶部とを備え、複数のカラムを含む入力データを最適化するためのモデルを作成するデータ処理システムが提供される。前記プロセッサは、前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取り、前記指標データに基づいて前記モデルを生成する。
 他の例によれば、複数のカラムを含む入力データを最適化するためのモデルを作成するデータ処理方法が提供される。当該方法は、プロセッサが、前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、前記最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取るステップと、前記プロセッサが、前記指標データに基づいて前記モデルを生成するステップとを含む。
 本発明によれば、多くの変数を含むデータに関して、予め制約を考慮して最適化向けの評価式を作成することができる。なお、本発明に関連する更なる特徴は、本明細書の記述、添付図面から明らかになるものである。また、上記した以外の、課題、構成及び効果は、以下の実施例の説明により明らかにされる。
実施例1におけるデータ処理システムのシステム構成図である。 実施例1の基本フローである。 図2の指標生成ステップ(211)を説明するフローである。 過去説明データの具体的なデータ形式の一例である。 過去目的データの具体的なデータ形式の一例である。 最適化用設定パラメータと最適化用入力データの具体的なデータ形式の一例である。 指標データの具体的なデータ形式の一例である。 図2の最適化ステップ(213)を説明するフローである。 実施例2におけるデータ処理システムのシステム構成図である。 実施例2の基本フローである。 図10の検証データ分離ステップ(1002)を説明するフローである。 検証分離情報データの具体的なデータ形式の一例である。 実行結果データの具体的なデータ形式の一例である。 図10の有効性検証ステップ(1005)を説明するフローである。 指標有効性テーブルの具体的なデータ形式の一例である。 図10の指標生成ステップ(1001)を説明するフローである。
 以下、添付図面を参照して本発明の実施例について説明する。なお、添付図面は本発明の原理に則った具体的な実施例を示しているが、これらは本発明の理解のためのものであり、決して本発明を限定的に解釈するために用いられるものではない。なお、各図において共通の構成については同一の参照符号が付されている場合がある。
[実施例1]
 以下、本発明の一実施形態を、図面を参照して説明する。図1は、本実施例におけるデータ処理システムのシステム構成図である。データ処理システムは、データを解析し、モデルを作成するシステムである。以下では、モデルとして、データを最適化する際の評価式を作成する例で説明する。
 データ処理システムは、中央処理装置101と、二次記憶装置110と、主記憶装置120と、入力装置140と、出力装置150とを備える。データ処理システムは、例えば、一般的な計算機によって実現され、ここでは、サーバシステムとして構成される。
 中央処理装置101は、主記憶装置120に格納されたプログラムを実行するプロセッサである。
 二次記憶装置110は、例えば、磁気記憶装置、フラッシュメモリ等の大容量かつ不揮発性の記憶装置である。なお、二次記憶装置110に記憶されている情報は、主記憶装置120に格納して、より高速にアクセスすることを可能にしてもよい。
 主記憶装置120は、例えば、DRAM(Dynamic Random Access Memory)のような高速かつ揮発性の記憶装置である。主記憶装置120は、オペレーティングシステム(OS)及びアプリケーションプログラムを格納する。中央処理装置101が、オペレーティングシステムを実行することによって、計算機の基本機能が実現され、アプリケーションプログラムを実行することによって、計算機が提供する機能が実現される。
 具体的には、主記憶装置120には、モデリング機能付き最適化部130を実装するためのプログラムが格納される。モデリング機能付き最適化部130は、第1指標生成部131と、評価式生成部132と、最適化部133とを含む。
 モデリング機能付き最適化部130の各処理モジュールは、例えば、中央処理装置101(プロセッサ)が各処理モジュールに対応するプログラムを実行することによって実現される。したがって、以下の説明において、図1の処理モジュールを主語として処理内容を説明した場合、プロセッサを主語とした説明としてもよい。
 なお、中央処理装置101によって実行されるプログラムは、不揮発性の記憶媒体又はネットワークを介して計算機に提供される。このため、計算機は、記憶媒体(CD-ROM、フラッシュメモリ等)を読み込むインターフェースを備えてもよい。
 入力装置140は、キーボード、マウスなどのユーザインターフェースである。出力装置150は、ディスプレイ装置、プリンタなどのユーザインターフェースである。
 図2は、実施例1の基本フローを示す。本システムのフローは、最適化に有効な指標を生成し、その指標に基づいて評価式を生成する第1段階と、評価式に基づいてデータを最適化する第2段階とを含む。本実施例は、最適化する問題があらかじめ分かっている場合には、その最適化が上手くいくように評価式を過去のデータから学習する点が一つ特徴となっている。この学習機能により、大量のデータが入力され、最適化の評価式を人手で構築することが難しい場合でも、自動的に評価式を構築することが可能となる。
 図2に示すように、本システムには、過去説明データ201と、過去目的データ202と、最適化用設定パラメータ203と、最適化用入力データ204とが入力される。
 過去説明データ201は、過去の説明データ(説明変数)であり、基本的には、最適化用入力データ204と同じカラムを有するデータである。
 過去目的データ202は、過去の目的指標(目的変数)である。過去目的データ202は、過去説明データ201内のデータの状態を取ったときの目的指標の値を格納する。
 最適化用入力データ204は、最適化を行いたい入力データである。また、最適化用設定パラメータ203は、最適化の制約条件などが記載されているパラメータである。
 以下では、過去説明データ201と、過去目的データ202と、最適化用設定パラメータ203と、最適化用入力データ204とについて詳細に説明する。なお、本実施例において、本システムが使用する情報は、データ構造に依存せず、どのようなデータ構造で表現されていてもよい。図4~図6はテーブル形式の例を示しているが、例えば、テーブル、リスト、データベース又はキューから適切に選択したデータ構造体が、情報を格納することができる。
 図4は、過去説明データ201の具体的なデータ形式の一例を示す。過去説明データ201は、カラム名称401と、データ部分402とから構成されている。本実施例では、倉庫のピッキング作業の生産性を上げる最適化問題を例に挙げる。過去説明データ201は、過去の時間区分に関して、誰が、どの商品を、どの棚にピッキングしたかを示すデータである。
 過去説明データ201は、カラムとして、ピッキングID411と、棚種類412と、棚ID413と、商品ID414と、ピッカー時間区分415と、ピッカー416とを含む。つまり、各ピッキングは、ピッキングを行った棚種類、ピッキングを行った棚ID、ピッキングを行った商品ID、ピッカーがパート又は正社員であるか、ピッカーの就業時間区分が午前又は午後であるか、といった属性を有する。本実施例の目的は、どのような属性であればピッキングの生産性を高くすることができるかを明らかにし、ピッキングの生産性が高くなるように最適化を行うことである。
 また、過去説明データ201は、過去目的データ202と紐付け可能な共通カラムを備える。ここでは、ピッキングID411が、その共通カラムに相当する。他のカラムは同じピッキングIDを持つ過去目的データ202中の目的指標のカラムである生産性カラムの変動を説明するために使われる。
 図5は、過去目的データ202の具体的なデータ形式の一例を示す。過去目的データ202は、カラム名称501とデータ部分502とから構成されている。過去目的データ202は、カラムとして、ピッキングID511と、生産性512とを含む。過去目的データ202は、過去説明データ201と紐付け可能な共通カラムを備える。ここでは、ピッキングID511が、その共通カラムに相当する。また、生産性512が、目的指標となるカラムである。
 本実施例では、倉庫のピッキングを例に挙げているが、本発明の適用範囲は任意の説明データと目的データに適用可能であることに注意する。
 また、本実施例では、過去説明データ201と過去目的データ202を別々のテーブルで表現しているが、これは、より一般的な形式で説明するためである。本例の過去説明データ201と過去目的データ202の双方に関して、一つのピッキングIDに対して一つのレコードを割り当てているが、解きたい問題によっては別の例も考えらえる。例えば、過去目的データ202では一つのピッキングIDに対して一つのレコードを割り当て、過去説明データ201では一つのピッキングIDに対して複数のレコード(すなわち、複数回のピッキング作業)が割り当てられる例があり得る。本実施例では、上記のような説明データと目的データのサンプリングが異なる入力に関しても評価式を構築できる一般的な形を想定して、2つのテーブルに分けている。
 図6は、最適化用設定パラメータ203と最適化用入力データ204の具体的なデータ形式の一例を示す。最適化用入力データ204は、基本的には過去説明データ201と同じ形式のデータである。最適化用入力データ204は、カラム名称601と、データ部分602とから構成されている。最適化用入力データ204は、カラムとして、ピッキングID611と、棚種類612と、棚ID613と、商品ID614と、ピッカー時間区分615と、ピッカー616とを含む。
 最適化用設定パラメータ203は、最適化用入力データ204の組み合わせ変更の制約条件を含む。本実施例では、最適化用設定パラメータ203が、変更制約パラメータ621と変更可否パラメータ622の2つのパラメータを含む。
 変更可否パラメータ622は、最適化用入力データ204の組み合わせを変更する際に、変動部分631と、不動部分632とに分けるためのパラメータである。変動部分631は、最適化用入力データ204の組み合わせ最適化を行う際に交換が可能なカラムを意味し、不動部分632は、最適化用入力データ204の組み合わせ最適化を行う際に交換が行われず、固定されるカラムを意味する。ここでは、変動部分631となるカラムに「1」が設定され、不動部分632となるカラムに「0」が設定される。
 なお、変更可否パラメータ622は、この例に限定されない。複数のカラムが変動部分631として設定される場合、変更可否パラメータ622は、変動部分631の中での優先度の情報を含んでもよい。例えば、変動部分631として、あるカラムには「1」を設定し、別のカラムには「2」を設定してもよい。この場合、最適化部133は、最適化用入力データ204の最適化する際に、「2」に設定されたカラムを優先的に変更するようにしてもよい。
 変更制約パラメータ621は、変更可否パラメータ622で変動部分631に設定されたカラム中の動かせる範囲を規定するパラメータである。ここでは、動かせないカラムが「1」に設定され、動かせるカラムに「0」が設定されている。図6の符号633は、変更可否パラメータ622が「1」に設定され、最適化の際に動かせないカラムを示す。本例では、ピッカー時間区分615が「1」に設定されているので、変動部分631であるピッカー616は、ピッカー時間区分615の値が同じもの同士の間でしか交換できない。例えば、図6に示すように、ピッカー時間区分615の値が「午前」であるデータの間で、ピッカー616の値を交換できる。本例では、変更制約パラメータ621が同じ値同士の間でのみ交換可能な例を示したが、この例に限定されない。例えば、変更制約パラメータ621に設定されたカラムの値が近い場合には交換可能などの制約でもよい。したがって、あらゆる形の制約条件を設定可能である。
 次に、評価式の概要を説明する。過去説明データ201は、最適化を行う評価式Y=F(X)のXを生成するために用いられる。ここで、通常の回帰式とは異なり、本実施例では、評価式F(X)を汎用的にするために、過去説明データ201の1カラムが直接評価式F(X)のXになるのではなく、複数のカラムの組み合わせによって合成された組み合わせ指標がXとなる点に注意する。この指標生成に関しては、後述する。
 次に、図2のフローについて説明する。第1指標生成部131は、上記最適化用入力データ204を最適化用設定パラメータ203の条件で最適化する場合に、評価式F(X)のXとして有効な組み合わせ指標Xを生成する(211)。ここでの詳細な処理は、図7を用いて後述する。第1指標生成部131は、最適化に有効な組み合わせ指標を表す指標データ205を出力する。
 評価式生成部132は、指標データ205を用いて、過去目的データ202の目的指標に相当するカラムを回帰分析する。具体的に、本例では、目的指標Yは、過去目的データ202の生産性となる。したがって、評価式生成部132は、生産性Yを回帰するY=F(X)を、指標データ205に格納されている複数の指標から構築する(212)。評価式生成部132は、構築した評価式206を出力する。
 最適化部133は、最適化用入力データ204を、最適化用設定パラメータ203の条件のもと評価式206が向上するように最適化を行う(213)。この最適化処理に関しては、後述する。最適化部133は、最適化済みデータ207を出力する。
 最適化済みデータ207は、最適化用入力データ204の組み合わせが変更されたデータである。最適化済みデータ207のデータ形式は、最適化用入力データ204と同じ形式をとることが可能である。
 図3は、図2のステップ211のフローを示す。このフローでは、最適化に有効な組み合わせ指標を表す指標データ205が作成される。
 まず、第1指標生成部131は、入力情報としての最適化用設定パラメータ203と最適化用入力データ204を用いて、最適化用入力データ204のカラムのうち、任意のK個のカラムを選択する(301)。
 次に、第1指標生成部131は、ステップ301で選択されたK個のカラムの変更可否パラメータ622の値を最適化用設定パラメータ203から読み出す。ここで、第1指標生成部131は、K個のカラムの変更可否パラメータ622がある条件を満たすかどうかを判定する(302)。詳細には、第1指標生成部131は、K個のカラムの変更可否パラメータ622を参照し、K個のカラムの中に変動部分631と不動部分632がそれぞれ少なくとも1つ含まれるかどうかを判定する。変動部分631と不動部分632がそれぞれ少なくとも1つある場合には、この制約内でカラムの組み合わせを変更することが可能となる。したがって、最適化を行った際に評価値を向上させることが可能となる。第1指標生成部131は、この条件を満たす指標に関して(ステップ302のYes)、その情報を指標データ205に格納する。
 一方、K個のカラムの中に変動部分631と不動部分632がそれぞれ少なくとも1つ含まれない場合、つまり、K個のカラムの全てが変動部分631又は不動部分632である場合には、この制約内ではカラムの組み合わせを変更することができないことを意味する。したがって、最適化を行っても評価値が向上することはない。このような指標が評価式生成部132に入力されてしまうと、評価式生成部132によって出力される評価式206は、本来重視すべき指標(評価値が変動する指標)の重みを下げてしまうなどの弊害を引き起こす。その結果、最適化の向上の期待値が下がるという問題が引き起こされる。第1指標生成部131は、条件を満たさない指標に関して(ステップ302のNo)、その情報を指標データ205に格納する。
 次に、第1指標生成部131は、ステップ302において条件を満たすカラムの組み合わせに関して、流動度を計算する(303)。ここで、流動度は、ステップ302において条件を満たすカラムの組み合わせに関して、とり得る組み合わせの種類数の程度を表す情報である。他の言い方をすれば、流動度は、変更制約内において、どの程度組み合わせの変更が可能かを表すものである。流動度を計算するのは、たとえステップ302において最適化の際に組み合わせ変更が可能であると判定された場合でも、変更制約パラメータ621の設定によっては実質的には組み合わせが変わらない場合があるからである。
 例えば、図6の最適化用入力データ204において、ピッカー時間区分615が「午前」である行のピッカー616が「パート」のみであり、ピッカー時間区分615が「午後」である行のピッカー616が「社員」のみである場合を考える。この例では、変更制約内で交換を行っても組み合わせに全く変化がないことが明らかである。つまり、最適化の際に評価値が変わらないので、何の情報も持たないことになる。そこで、第1指標生成部131は、指定された変更制約内でどれだけ組み合わせの変更が可能であるかを表す流動度を計算する。計算方法の一例としては、変動部分631を変更制約内でランダムにシャッフルしたときに、当該選択されているK個のカラムの値の組み合わせが平均的にS%変更しているかを計算する方法がある。上記の例だと、全く組み合わせが変更されないのでS=0%となる。逆に流動性が高ければ、S=30%といった正の数値になる。
 第1指標生成部131は、ステップ303で計算された流動度Sが指標計算条件を満たすかを判定する(304)。ここでの指標計算条件の一例は、流動度Sが予め定められたしきい値Α以上となるという条件である。流動度Sがしきい値A以上である場合、ステップ305に進む。一方、流動度Sがしきい値Aより小さい場合(ステップ304のNo)、第1指標生成部131は、指標計算条件を満たさなかったことを指標データ205に格納してもよい。本例では、予め設けたしきい値Αをもとに判定したが、固定のしきい値Αを設けず、流動度Sの上位30%のカラムの組み合わせを採用するといった方法も可能である。
 第1指標生成部131は、ステップ304で指標計算条件を満たしたカラムの組み合わせに関して、過去説明データ201を用いて指標を計算する(305)。例えば、ここでのK個のカラムの組み合わせは、棚ID613とピッカー616であると仮定する。このカラムの組み合わせは、ステップ302の条件を満たし、かつ、ステップ304の条件も満たしていると仮定する。このようなカラム組み合わせに関して、第1指標生成部131は、1つ以上の種類の関数を適用して、指標を計算する。ここでは、一例として関数G1を使用する。関数G1は、「棚ID613が5未満」AND「ピッカー616がパート」であれば1、そうでなければ0となるような関数である。関数G1を過去説明データ201に適用すると、データベクトルは(0,0,1,0,…)となる。第1指標生成部131は、適用した関数及びその関数を用いて計算されたデータベクトルを指標データ205に格納する。
 ここで、関数に関して、予め1つ以上の種類が用意されていてもよいし、クラスタリング等を用いて動的に生成された1つ以上の種類の関数が使用されてもよい。また、予め用意された又は動的に生成された全ての関数が過去説明データ201に適用されてもよい。なお、複数の関数が適用された場合には、適用された関数の数だけ、指標が生成される。
 第1指標生成部131は、全てのカラムの組み合わせを選択したかを判定する(306)。例えば、カラムの組み合わせとして、3カラム以下の組み合わせを条件として設定していると仮定する。この場合、第1指標生成部131は、1カラム、2カラムの組み合わせ、及び3カラムの組み合わせの全てに関して、図3のフローを行ったかを判定する。上記の条件に従って全てのカラムの組み合わせの選択が終了した場合には、処理を終了する。選択が終了していない場合、ステップ301~306を繰り返し実行する。
 図7は、指標データ205の具体的なデータ形式の一例である。指標データ205は、カラムとして、指標ID701と、入力カラム702と、変更条件703と、制約内流動度704と、関数705と、データベクトル706とを備える。
 指標ID701は、生成した指標をユニークに特定できるIDである。入力カラム702は、最適化用入力データ204を最適化する際に指標となるカラムの組み合わせの情報であり、図3のステップ301で選択されたカラムの組み合わせである。
 変更条件703は、最適化する際のカラムごとの変更可否を示す変更可否情報であり、ステップ302の条件を満たしたかどうかを示す値である。変更条件703には、ステップ302の条件が満たされた場合に「可」が格納され、ステップ302の条件が満たさない場合に「不可」が格納される。
 制約内流動度704は、ステップ303で計算された流動度Sを格納する。関数705は、ステップ305で適用された関数を格納する。データベクトル706は、ステップ305で計算された指標の値をベクトルとして格納する。なお、ステップ302において条件を満たしていない場合、関数705及びデータベクトル706には、「-」が格納される。
 次に、評価式について説明する。評価式生成部132は、指標データ205を用いて、過去目的データ202の目的指標に相当するカラムを回帰分析する。指標データ205は、上記したように、有効な指標であるかの情報を含んでいるため、評価式生成部132は、指標データ205の中で有効な指標のみを用いて評価式206を構築する。
 すなわち、評価式生成部132は、指標データ205において、カラムの組み合わせの中に変動部分631と不動部分632がそれぞれ少なくとも1つ含まれる指標のみを用いて、評価式206を生成する。また、評価式生成部132は、指標データ205において、制約内流動度704が所定の条件を満たす指標のみを用いて、評価式206を生成する。ここでの所定の条件は、しきい値で設定されてよい。
 評価式の構築方法は、一般的な回帰モデリング手法ならば、どのような手法を用いてもよい。例えば、線形な回帰モデリングとしては、重回帰式、LASSO回帰、RIDGE回帰式等が挙げられる。また、非線形な回帰式を適用することも可能である。本実施例では簡単に重回帰式を用いた例で説明する。
 評価式206は、生産性Yを回帰するY=F(X)である。重回帰式で生成した評価式の一例を式(1)に示す。式(1)は、重回帰式の項として2つの指標G1(棚ID<5, ピッカー=パート)、G2(棚種類=big, ピッカー=社員)が係数A1,A2で線形結合された式である。G1は、「棚IDが5未満」AND「ピッカーがパート」であれば1、そうでなければ0となるような関数である。G2は、「棚種類がbig」AND「ピッカーが社員」であれば1、そうでなければ0となるような関数である。
  F(X)=A1*G1(棚ID<5, ピッカー=パート)+A2*G2(棚種類=big, ピッカー=社員)    …式(1)
 本実施例で使用される関数は任意の形式をとることが可能である。例えば、関数が、「AND」以外の、「OR」、「XOR」などの他の演算子を含んでもよい。また、関数は、平均又は分散等の集合演算を含んでもよい。
 図8は、図2のステップ213を説明するフローである。本フローでは、上記生成された評価式206の評価値が向上するように、最適化用設定パラメータ203の条件のもと、最適化用入力データ204に関して組み合わせの交換を行う。
 最適化部133は、評価式206と最適化用設定パラメータ203と最適化用入力データ204とを入力として受け取る。最適化部133は、最適化用入力データ204の変動部分631を、制約部分633の値が同じ範囲でランダムに交換を行う(801)。図6は、この組み合わせの変更処理の具体例を示す。例えば、データ部分602の1行目と4行目に関して、これらのピッカー時間区分615は「午前」であり、したがって、同じ値である。このように、最適化部133は、制約部分633の値が同じ範囲で、データ部分602の1行目と4行目のピッカー616の値を交換する。
 最適化部133は、ステップ801で組み合わせが変更された最適化用入力データ204に対して、評価式206に用いられている全ての指標を再計算する(802)。ここで、評価式206が式(1)であり、かつ、指標データ205が図7の例であると仮定する。最適化部133は、指標データ205のうち、評価式206に用いられている指標ID701(=3,4)に対応するデータベクトル706を再計算する。
 最適化部133は、ステップ802で再計算された指標データ205と評価式206とを用いて、組み合わせが変更された最適化用入力データ204に関して評価式Y=F(X)を計算する(803)。
 最適化部133は、評価値Yの収束判定を行う(804)。最適化部133は、(1)評価値Yの変動が収束しているか、又は、(2)ステップ801における組み合わせ変更回数が予め決められた条件に達しているかを判定する。最適化部133は、上記の(1)又は(2)の条件を満たしている場合、その時の最適化用入力データ204を最適化済みデータ207として出力する。そして、本フローを終了する。
 一方、上記の(1)又は(2)のいずれの条件も満たしていない場合、最適化部133は、改善判定を行う(805)。最適化部133は、今回の組み合わせ変更によって評価値Yが改善したかどうかを判定する。評価値Yが改善した場合、最適化部133は、その時の最適化用入力データ204を入力データとして、ステップ801~804の繰り返し処理を実行する。一方、評価値Yが改善していない場合、最適化部133は、前回の最適化用入力データの組み合わせに戻す(806)。その後、最適化部133は、前回の最適化用の組み合わせを入力データとして、ステップ801~804の繰り返し処理を実行する。なお、このとき、焼きなまし法のように、ある確率では改善していなくても組み合わせを採択することで、局所最適に陥らないようにすることも可能である。
 上記の実施例の効果について説明する。データから帰納的に目的変数を回帰した評価式は、制約を考慮した最適化を行う際に、最適化の効果がその制約により大きく下がる場合がある。これに対して、上記の実施例は、多数の説明変数と目的変数が含まれるデータ(過去説明データ201及び過去目的データ202)と最適化したいデータ(最適化用入力データ204)と最適化のパラメータ(最適化用設定パラメータ203)が与えられたときに、最適化したいデータとそのパラメータを考慮した目的変数の回帰評価式を作成することができる。したがって、パラメータ内の制約条件を考慮した最適化の効果を高くすることができる。
 より具体的には、本実施例によれば、データを解析し、モデル(例えば、評価式)を作成するデータ処理システムにおいて、カラムごとに前記モデルの最適化の際に変更可能か又は変更不可能かどうかを示す変更条件を受け付け、変更条件に基づいて前記モデルを作成する。したがって、制約条件を考慮した最適化を効果的に行う場合、予めその制約条件を考慮して最適化向けのモデルを作成することができる。
[実施例2]
 次に、実施例2を説明する。実施例2では、最適化を行った入力データを実際に実行した結果を用いることにより、指標の有効性の確度を上げる構成が提供される。
 図9は、本実施例におけるデータ処理システムのシステム構成図である。上述の実施例で説明した構成要素については、同じ符号を付して説明を省略する。
 二次記憶装置110には、本システムで最適化を行う際の有効性を格納する指標有効性テーブル901が格納される。また、モデリング機能付き最適化部130は、実施例1の構成要素に加え、第2指標生成部902と、検証データ分離部903と、部分最適化部904と、実行部905と、指標有効性検証部906とを備える。
 モデリング機能付き最適化部130の各処理モジュールは、例えば、中央処理装置101(プロセッサ)が各処理モジュールに対応するプログラムを実行することによって実現される。したがって、以下の説明において、図9の処理モジュールを主語として処理内容を説明した場合、プロセッサを主語とした説明としてもよい。
 図10は、実施例2の基本フローを示す。なお、実施例1の基本フローと同じ処理及び同じデータについては同じ符号を付し、その説明を省略する。
 第2指標生成部902は、指標有効性テーブル901の情報を用いて、有効な指標のみを生成する(1001)。ここでの詳細な処理は、図16を用いて後述する。第2指標生成部は、最適化に有効な組み合わせ指標を表す指標データ205を出力する。
 その後、評価式206を生成した後、検証データ分離部903は、最適化用入力データ204を、複数のデータに分離する(1002)。具体的には、検証データ分離部903は、最適化用入力データ204を、検証用データ1011と部分最適化用データ1012と最適化用データ1013に分離する。なお、ここでの分離情報は、検証分離情報データ1014として保存される。ここでの詳細な処理は、図11を用いて後述する。
 部分最適化部904は、評価式206のうち検証対象の指標のみを用いた評価式を用いて、部分最適化用データ1012に対して最適化処理を行う(1003)。基本的な最適化方法に関しては、最適化部133で行われる処理と同じであるが、例えば、以下の点で異なる。ここで、図7の指標データ205の指標ID701=3の検証を行うと仮定する。指標ID701=3の指標の検証を行う部分最適化用データ1012が入力された場合には、部分最適化部904は、式(2)のように当該指標のみを用いた評価式(第2モデル)を構築する。式(2)として、式(1)のうち指標ID=3の指標を含む項のみを抽出し、係数等はそのまま使用することも可能であるし、改めて当該項のみを用いて評価式を回帰し直すことも可能である。
  F(X)=A1*G1(棚ID<5, ピッカー=パート)   …式(2)
 本例の最適化済みデータ207は、図10に示す通り、検証用データ1011として最適化が行われていないデータと、部分最適化部904によって部分最適化されたデータ(すなわち、部分最適化用データ1012の最適化実行後のデータ)と、最適化部133によって最適化されたデータ(すなわち、最適化用データ1013の最適化実行後のデータ)とから構成される。
 実行部905は、最適化済みデータ207を入力として受け取り、最適化済みデータ207の内容に従って実際に何らかの処理又は作業を実行する(1004)。実行部905は、実行結果データ1015を出力する。ここでは、倉庫のピッキング作業の生産性を上げる最適化問題を例としている。したがって、実行部905での処理は、最適化済みデータ207に従って倉庫のピッキング作業を実際に実行し、その生産性を実行結果データ1015として出力することに相当する。
 なお、本フローでは簡単のため、全てのプログラムが同じシステム内にある例を示したが、これに限定されない。例えば、実際に最適化済みデータ207の内容に従って作業を実行する実行部905が他のシステム内にあってもよい。この場合、本実施例のデータ処理システムが、他のシステム内の実行部905に対して、最適化済みデータ207とともに実行要求を送る構成をとってもよい。別の例として、他のシステム内にある実行部905が、本実施例のデータ処理システムに対して、過去説明データ201、過去目的データ202、最適化用設定パラメータ203、最適化用入力データ204とともに最適化要求を送る構成をとってもよい。
 図13は、実行部905から出力される実行結果データ1015の一例である。実行結果データ1015は、目的指標に相当するカラム(ここでは、生産性結果)の値を格納する。実行結果データ1015は、ピッキングID1301と、生産性結果1302とを含む。
 指標有効性検証部906は、実行結果データ1015と検証分離情報データ1014とを入力として受け取り、各指標の有効性を検証する(1005)。指標有効性検証部906は、検証した情報を指標有効性テーブル111に記録する。ここでの詳細な処理は、図14を用いて後述する。
 図11は、図10のステップ1002のフローを示す。検証データ分離部903は、評価式206に用いられている各指標が実際に有効な指標であるかを検証するために、最適化用入力データ204を、単純に最適化を行う最適化用データと検証に用いるデータとに分離する。
 検証データ分離部903は、評価式206と最適化用設定パラメータ203と最適化用入力データ204とを入力データとして受け取る。検証データ分離部903は、最適化用入力データ204を、検証に用いるデータと単純に最適化を行うデータとに分離する(1101)。例えば、最適化用入力データ204の10%のデータは検証に用いて、残り90%のデータは単純に最適化に用いる場合には、検証データ分離部903は、最適化用入力データ204からランダムに90%のデータを最適化用データ1013として分離し、残りのデータを検証に用いるデータ(以下、指標検証用データ)として次のステップ1102で用いる。本処理によって、検証を行いながらも大部分のデータは最適化されるので、最適化と検証を同時に行うことが可能となる。
 次に、検証データ分離部903は、指標検証用データを、評価式206に用いられている指標の数だけ、分割する(1102)。例えば、式(1)の例では2つの指標が用いられているので、検証データ分離部903は、指標検証用データを2つの分割データ(第1データ及び第2データ)に分割する。
 次に、検証データ分離部903は、検証対象の指標を除いた評価式を作成し、その評価式を用いて分割データを計算する(1103)。ここで、図7の指標データ205の指標ID701=3の検証を行うと仮定する。検証データ分離部903は、式(1)から当該検証対象の指標を除いた式(3)を作成する。検証データ分離部903は、式(3)を用いて、第1データの各行の評価値を計算する。
  F(X)= A2*G2(棚種類=big, ピッカー=社員)  …式(3)
 なお、図7の指標データ205の指標ID701=4の検証を行う場合には、検証データ分離部903は、式(1)から当該検証対象の指標を除いた式を作成し、その式を用いて、第2データの各行の評価値を計算すればよい。
 次に、検証データ分離部903は、ステップ1103で計算された評価値がほぼ均等になるように、分割データを検証用データ1011と部分最適化用データ1012とに分離する(1104)。「評価値がほぼ均等である」とは、例えば、評価値の差が、あるしきい値より小さいことで判定されてもよい。例えば、検証データ分離部903は、ステップ1103で式(3)を用いて計算された評価値が均等になるように第1データを検証用データ1011と部分最適化用データ1012とに分離する。また、検証データ分離部903は、最適化用入力データ204のどの行がどのデータに分離されたか表す情報を、検証分離情報データ1014として出力する。
 なお、上述のステップ1103では、検証対象の指標を除いた式(3)を作成したが、検証対象の指標を除かずに式(1)を評価式として用いることも可能である。
 次に、検証データ分離部903は、終了判定を行う(1105)。検証データ分離部903は、全ての指標に関して、検証用データ1011と部分最適化用データ1012に分離したかを判定する。全ての指標に関して分離が完了している場合、処理を終了する。分離が完了していない場合は、ステップ1103~1104を繰り返し実行する。
 図12は、検証分離情報データ1014の具体的なデータ形式の一例である。検証分離情報データ1014は、検証指標ID1201と、対照群/最適化群1202と、データID1203とを含む。
 検証指標ID1201は、検証対象となっている指標の指標IDを格納し、指標データ205の指標ID701に対応する。
 対照群/最適化群1202は、検証用のデータか又は部分最適化が行われるデータかを示すフラグを格納する。本例では、検証用データ1011(最適化が行われないデータ)を示すフラグとして、「対照群」が格納される。また、部分最適化用データ1012を示すフラグとして、「最適化群」が格納される。
 データID1203は、最適化用入力データ204のどの行がどの群に属するかの情報を格納する。図4の例では、最適化用入力データ204の各行をユニークに指定するカラムはピッキングID611である。したがって、データID1203は、該当するピッキングIDのベクトルを格納する。
 図14は、図10のステップ1005のフローを示す。指標有効性検証部906は、各指標が最適化に実際に有効であったかを検証する。
 指標有効性検証部906は、検証分離情報データ1014と実行結果データ1015を入力データとして受け取る。指標有効性検証部906は、検証対象の1つの指標を検証分離情報データ1014から選択する(1401)。ここでは、検証対象の指標として、検証指標ID1201=3の指標が選択されたと仮定する。
 指標有効性検証部906は、検証分離情報データ1014から、当該検証対象の指標の対照群のデータID1203と最適化群のデータID1203を読み取る。指標有効性検証部906は、実行結果データ1015から、対照群のデータID1203に対応する生産性結果1302と、最適化群のデータID1203に対応する生産性結果1302とを抽出する(1402)。ここでは、対照群の実行結果として、実行結果データ1015から、ピッキングID1301=(1,3,5,…)のデータが抽出される。また、最適化群の実行結果として、実行結果データ1015から、ピッキングID1301=(2,4,6,…)のデータが抽出される。
 指標有効性検証部906は、対照群の生産性結果1302と最適化群の生産性結果1302とを比較する(1403)。指標有効性検証部906は、検証指標ID1201=3の指標によって目的指標である生産性が有意に改善されたかを示す結果を、指標有効性テーブル901に格納する。2つの群の生産性の比較は、平均値の比較又は分散分析等の統計的手法を用いることが可能である。
 なお、図14のフローを繰り返し実行した場合、既に当該指標の有効性が指標有効性テーブル901に格納されている場合がある。このような場合、有効性が高い情報のみを指標有効性テーブル901に格納するなどの方法を行ってもよい。
 このフローを繰り返し実行することにより、指標の有効性を指標有効性テーブル901に蓄積することができる。指標有効性テーブル901を用いることにより、有効性が高い指標のみを評価式の作成に使用することが可能となる。
 次に、指標有効性検証部906は、終了判定を行う(1404)。指標有効性検証部906は、全ての指標に関して検証が完了した場合、処理を終了する。検証が完了していない場合は、ステップ1401~1403を繰り返し実行する。
 図15は、指標有効性テーブル901の具体的なデータ形式の一例である。指標有効性テーブル901は、各指標の有効性を検証した結果を格納したものである。指標有効性テーブル901は、指標ID1501と、入力カラム1502と、関数1503と、有効度1504と、有効度信頼性1505とを含む。
 指標ID1501は、検証された指標の指標IDを格納し、図7の指標ID701に対応する。入力カラム1502は、当該指標となるカラムの組み合わせを格納し、図7の入力カラム702に対応する。関数1503は、当該指標に関する関数を格納し、図7の関数705に対応する。
 有効度1504は、対照群/最適化群の比較処理(図14のステップ1403)によって検証された有効度を格納する。例えば、有効度1504として、最適化群の平均値と対照群の平均値との差を使用してもよい。
 有効度信頼性1505は、有効度1504の信頼性の情報を格納する。これは、例えば最適化群の平均値と対照群の平均値の差が大きくても、各群の分散がそれ以上に大きい場合などは、この平均値の差が有意であるとは言えない。したがって、有効度信頼性1505は、このような場合に指標が有効であると判定されることを防止するために使用される。例えば、有効度信頼性1505として、分散分析の棄却確率の逆数を使用してもよい。
 図16は、図10のステップ1001を説明するフローである。本フローは、基本的に図3と同じであり、以下では、異なる処理のみ説明する。
 ステップ304とステップ305の間に、ステップ1601が挿入される。第2指標生成部902は、指標有効性テーブル901から、当該K個のカラムの組み合わせにおいて生成可能な指標を検索する。例えば、第2指標生成部902は、指標有効性テーブル901から、有効性が高い、又は、有効性が不確定の指標を取得する。ここで、有効性が高い指標とは、有効度1504があるしきい値より高い指標を意味する。また、有効性が不確定の指標とは、有効度信頼性1505があるしきい値より低い指標を意味する。ここでは、指標の有効性が低く、かつ、その有効性の信頼度が高い場合には、指標を生成しても上記したように悪影響を与える可能性がある。したがって、そのような悪影響を与え得る指標に関して、第2指標生成部902は、最適化の際に使用しないことを示す情報を指標データ205に上記と同様の方法で格納してもよい。
 次の処理において、第2指標生成部902は、ステップ1601において取得されたK個のカラムの組み合わせに関して、過去説明データ201を用いて指標を計算する。以上のフローによって、第2指標生成部902は、有効性が高い指標を指標データ205として出力することができる。
 以上の実施例2によれば、第2指標生成部902が、指標有効性テーブル901を参照しながら、最適化に有効な指標(カラムの組み合わせ)のみを含む指標データ205を作成することができる。評価式生成部132は、有効性が高いことが検証済みの指標が格納された指標データ205を用いて評価式206を生成することができる。
 上記の例では、指標有効性テーブル901の中で、有効性が高い又は有効性が不確定の指標が評価式の作成に使用される一方、有効性が低く、かつ、その有効性の信頼度が高い指標は、評価式の作成に使用されない。指標有効性テーブル901の利用方法は、この例に限定されない。第2指標生成部902は、例えば、指標有効性テーブル901の有効度1504と有効度信頼性1505とから、指標の重要度を算出し、その重要度の情報を指標データ205に加えてもよい。評価式生成部132は、各指標の重要度を各指標の重みとして利用し、評価式を生成してもよい。
 本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。上記実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることもできる。また、ある実施例の構成に他の実施例の構成を加えることもできる。また、各実施例の構成の一部について、他の構成を追加・削除・置換することもできる。
 また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)に記憶させることが可能である。非一時的なコンピュータ可読媒体としては、例えば、フレキシブルディスク、CD-ROM、DVD-ROM、ハードディスク、光ディスク、光磁気ディスク、CD-R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
 上記の実施例において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
101    …中央処理装置
110    …二次記憶装置
111    …指標有効性テーブル
120    …主記憶装置
130    …モデリング機能付き最適化部
131    …第1指標生成部
132    …評価式生成部
133    …最適化部
140    …入力装置
150    …出力装置
201    …過去説明データ
202    …過去目的データ
203    …最適化用設定パラメータ
204    …最適化用入力データ
205    …指標データ
206    …評価式
207    …最適化済みデータ
901    …指標有効性テーブル
902    …第2指標生成部
903    …検証データ分離部
904    …部分最適化部
905    …実行部
906    …指標有効性検証部
1011   …検証用データ
1012   …部分最適化用データ
1013   …最適化用データ
1014   …検証分離情報データ
1015   …実行結果データ

Claims (12)

  1.  プロセッサと、記憶部とを備え、複数のカラムを含む入力データを最適化するためのモデルを作成するデータ処理システムであって、
     前記プロセッサは、
     前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取り、
     前記指標データに基づいて前記モデルを生成することを特徴とするデータ処理システム。
  2.  請求項1に記載のデータ処理システムにおいて、
     前記プロセッサは、
     前記カラムの組み合わせの中に変更可能なカラムと変更不可のカラムとがそれぞれ少なくとも1つ含まれる前記指標のみを用いて、前記モデルを生成することを特徴とするデータ処理システム。
  3.  請求項2に記載のデータ処理システムにおいて、
     前記指標データは、前記変更可能なカラムに関して、取り得る組み合わせの種類の程度を表す流動度の情報をさらに含み、
     前記プロセッサは、
     前記流動度が所定の条件を満たす前記指標のみを用いて、前記モデルを生成することを特徴とするデータ処理システム。
  4.  請求項1に記載のデータ処理システムにおいて、
     前記指標データは、ある関数を用いて過去のデータに基づいて計算された前記指標の値をさらに含み、
     前記プロセッサは、前記指標の値を用いて前記モデルを生成することを特徴とするデータ処理システム。
  5.  請求項1に記載のデータ処理システムにおいて、
     前記プロセッサは、
     前記入力データを最適化する際の制約情報を受け取り、
     前記制約情報及び前記モデルに基づいて前記入力データを最適化し、最適化データを出力することを特徴とするデータ処理システム。
  6.  請求項5に記載のデータ処理システムにおいて、
     前記最適化データを用いて処理を実行し、実行結果データを出力する実行部をさらに備えることを特徴とするデータ処理システム。
  7.  請求項6に記載のデータ処理システムにおいて、
     前記記憶部は、指標の有効性を表す指標有効性情報を格納しており、
     前記プロセッサは、
     前記入力データを前記指標ごとに複数のデータに分割し、
     前記実行結果データから各指標の有効性を検証し、
     各指標の有効性を前記指標有効性情報として前記記憶部に格納することを特徴とするデータ処理システム。
  8.  請求項7に記載のデータ処理システムにおいて、
     前記プロセッサは、前記指標有効性情報を用いて前記指標データを作成することを特徴とするデータ処理システム。
  9.  請求項7に記載のデータ処理システムにおいて、
     前記複数のデータは、最適化を行わない検証用データと、最適化を行う部分最適化用データとを含み、
     前記プロセッサは、
     前記部分最適化用データに関して、検証対象の指標のみを用いた第2モデルを生成し、
     前記第2モデルを用いて最適化することを特徴とするデータ処理システム。
  10.  請求項9に記載のデータ処理システムにおいて、
     前記プロセッサは、前記実行結果データにおける前記検証用データに対応するデータと、前記実行結果データにおける前記部分最適化用データに対応するデータとを比較することによって、前記指標の有効性を検証することを特徴とするデータ処理システム。
  11.  請求項9に記載のデータ処理システムにおいて、
     前記プロセッサは、
     前記モデルから、検証対象の指標を除いた第3モデルを生成し、
     前記第3モデルの評価値がほぼ均等になるように前記検証用データと前記部分最適化用データに分離することを特徴とするデータ処理システム。
  12.  複数のカラムを含む入力データを最適化するためのモデルを作成するデータ処理方法であって、
     プロセッサが、前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、前記最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取るステップと、
     前記プロセッサが、前記指標データに基づいて前記モデルを生成するステップと
    を含むことを特徴とするデータ処理方法。
PCT/JP2015/083044 2015-11-25 2015-11-25 データ処理システム及びデータ処理方法 WO2017090114A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US15/756,383 US20180253455A1 (en) 2015-11-25 2015-11-25 Data processing system and data processing method
JP2017514380A JP6192877B1 (ja) 2015-11-25 2015-11-25 データ処理システム及びデータ処理方法
PCT/JP2015/083044 WO2017090114A1 (ja) 2015-11-25 2015-11-25 データ処理システム及びデータ処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2015/083044 WO2017090114A1 (ja) 2015-11-25 2015-11-25 データ処理システム及びデータ処理方法

Publications (1)

Publication Number Publication Date
WO2017090114A1 true WO2017090114A1 (ja) 2017-06-01

Family

ID=58764136

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/083044 WO2017090114A1 (ja) 2015-11-25 2015-11-25 データ処理システム及びデータ処理方法

Country Status (3)

Country Link
US (1) US20180253455A1 (ja)
JP (1) JP6192877B1 (ja)
WO (1) WO2017090114A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108900594A (zh) * 2018-06-21 2018-11-27 中国联合网络通信集团有限公司 移动视频的优化方法、装置及系统
CN109460857A (zh) * 2018-10-12 2019-03-12 上海企树网络科技有限公司 用于建模的数据处理方法及装置
CN114118008A (zh) * 2022-01-21 2022-03-01 西安羚控电子科技有限公司 一种基于bs架构的数据对比系统及方法
WO2023119739A1 (ja) * 2021-12-21 2023-06-29 株式会社日立製作所 最適化装置、最適化方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110632878B (zh) * 2019-10-08 2022-06-28 上海宝阶智能科技有限公司 一种异构嵌入式表格化处理及执行动作流程的方法和装置
US11507621B1 (en) * 2021-11-15 2022-11-22 The Trade Desk, Inc. Methods and systems for generating communications associated with optimization codes

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009057778A1 (ja) * 2007-11-01 2009-05-07 Omron Corporation 特徴量候補作成装置および特徴量候補作成方法
JP2011065636A (ja) * 2009-08-31 2011-03-31 Accenture Global Services Gmbh 変数スコアリングを使用するモデル最適化システム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009057778A1 (ja) * 2007-11-01 2009-05-07 Omron Corporation 特徴量候補作成装置および特徴量候補作成方法
JP2011065636A (ja) * 2009-08-31 2011-03-31 Accenture Global Services Gmbh 変数スコアリングを使用するモデル最適化システム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108900594A (zh) * 2018-06-21 2018-11-27 中国联合网络通信集团有限公司 移动视频的优化方法、装置及系统
CN108900594B (zh) * 2018-06-21 2021-03-19 中国联合网络通信集团有限公司 移动视频的优化方法、装置及系统
CN109460857A (zh) * 2018-10-12 2019-03-12 上海企树网络科技有限公司 用于建模的数据处理方法及装置
WO2023119739A1 (ja) * 2021-12-21 2023-06-29 株式会社日立製作所 最適化装置、最適化方法
CN114118008A (zh) * 2022-01-21 2022-03-01 西安羚控电子科技有限公司 一种基于bs架构的数据对比系统及方法
CN114118008B (zh) * 2022-01-21 2022-05-10 西安羚控电子科技有限公司 一种基于bs架构的数据对比系统及方法

Also Published As

Publication number Publication date
US20180253455A1 (en) 2018-09-06
JPWO2017090114A1 (ja) 2017-11-24
JP6192877B1 (ja) 2017-09-06

Similar Documents

Publication Publication Date Title
JP6192877B1 (ja) データ処理システム及びデータ処理方法
US10789509B2 (en) Systems and methods for generating machine learning applications
CN104123374B (zh) 分布式数据库中聚合查询的方法及装置
WO2015025386A1 (ja) データ処理システム、データ処理方法およびデータ処理装置
US8862638B2 (en) Interpolation data template to normalize analytic runs
US20150278310A1 (en) Database device
JP6850806B2 (ja) 電子データ構造から属性を抽出するための注釈システム
JP2013080375A (ja) 個人情報匿名化装置及び方法
CN106960020B (zh) 一种创建索引表的方法及设备
JPWO2017159403A1 (ja) 予測システム、方法およびプログラム
JP7098327B2 (ja) 情報処理システム、関数作成方法および関数作成プログラム
US20160350082A1 (en) Hardware/software agnostic design generation
JP2019504390A (ja) データ照会方法および装置ならびにデータベースシステム
US20200034348A1 (en) Information processing device, information processing method, and recording medium
WO2019023542A1 (en) METHODS AND SYSTEMS FOR OPTIMIZED VISUAL RECAPITULATION FOR TEMPORAL EVENT DATA SEQUENCES
JP6331756B2 (ja) テストケース生成プログラム、テストケース生成方法、及びテストケース生成装置
JP2006155344A (ja) データ分析装置、データ分析プログラム及びデータ分析方法
US20220035791A1 (en) Verification method, information processing apparatus, and non-transitory computer-readable storage medium for storing verification program
US11200233B2 (en) Evaluation of query for data item having multiple representations in graph by evaluating sub-queries
KR101242860B1 (ko) 누적 이동 평균에 기반하여 다원 탐색 트리의 노드를 분할하는 방법 및 장치
EP4113313A1 (en) Control method, information processing device, and control program
US10621155B2 (en) Method and apparatus for data integration
JP2016184213A (ja) 数値データを匿名化する方法及び数値データ匿名化サーバ
JP6317280B2 (ja) 同種帳票ファイル選定装置、同種帳票ファイル選定方法、および、同種帳票ファイル選定プログラム
WO2021234916A1 (ja) 分析装置、分析方法および分析プログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2017514380

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15909233

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 15756383

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 15909233

Country of ref document: EP

Kind code of ref document: A1