WO2017090114A1

WO2017090114A1 - データ処理システム及びデータ処理方法

Info

Publication number: WO2017090114A1
Application number: PCT/JP2015/083044
Authority: WO
Inventors: 知明秋富
Original assignee: 株式会社日立製作所
Priority date: 2015-11-25
Filing date: 2015-11-25
Publication date: 2017-06-01
Also published as: US20180253455A1; JPWO2017090114A1; JP6192877B1

Abstract

データ処理システムは、プロセッサと、記憶部とを備え、複数のカラムを含む入力データを最適化するためのモデルを作成するものであり、ここで、前記プロセッサは、前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取り、前記指標データに基づいて前記モデルを生成する。

Description

データ処理システム及びデータ処理方法

　本発明は、データ処理システム及びデータ処理方法に関する。

　近年、ＢＩＧＤＡＴＡと呼ばれる社会の大量の情報間の未知の関係を明らかにするような技術が発展してきている。このような情報間の関係を明らかにする目的は、情報間の関係を表す評価式を用いて、現実の問題を最適化するためである。このとき、現実の問題には、一般に様々な制約条件がある。したがって、これらの制約条件を満たしながら、上記評価式から得られる評価結果を改善するように最適化を行う必要がある。

　しかし、情報間の関係性を数値から帰納的に求めた評価式は、必ずしも、上記制約条件を考慮した最適化に適した評価式とは限らず、最適化の効果が制約条件により大きく下がることがある。このような問題を回避するために、評価式生成時にユーザが評価式に条件を追加する方法がある。例えば、特許文献１には、入力データの複数のカラムのうち、評価式に使用するカラム、又はカラムの一部をユーザが任意に指定する方法が開示されている。

米国特許第８１７１００１号明細書

　特許文献１の技術は、作成すべき評価式を予めユーザが知っていて、その評価式が人間の把握できる程度の簡易なものである場合にしか適用できない。上記したように最適化の効果が大きい未知の評価式を作成したい場合には、予め評価式に用いるカラムを限定することができないという課題がある。

　そこで、本発明は、多くの変数を含むデータに関して、予め制約を考慮して最適化向けの評価式を作成する技術を提供する。

　例えば、上記課題を解決するために、請求の範囲に記載の構成を採用する。本願は上記課題を解決する手段を複数含んでいるが、その一例をあげるならば、プロセッサと、記憶部とを備え、複数のカラムを含む入力データを最適化するためのモデルを作成するデータ処理システムが提供される。前記プロセッサは、前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取り、前記指標データに基づいて前記モデルを生成する。

　他の例によれば、複数のカラムを含む入力データを最適化するためのモデルを作成するデータ処理方法が提供される。当該方法は、プロセッサが、前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、前記最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取るステップと、前記プロセッサが、前記指標データに基づいて前記モデルを生成するステップとを含む。

　本発明によれば、多くの変数を含むデータに関して、予め制約を考慮して最適化向けの評価式を作成することができる。なお、本発明に関連する更なる特徴は、本明細書の記述、添付図面から明らかになるものである。また、上記した以外の、課題、構成及び効果は、以下の実施例の説明により明らかにされる。

実施例１におけるデータ処理システムのシステム構成図である。実施例１の基本フローである。図２の指標生成ステップ（２１１）を説明するフローである。過去説明データの具体的なデータ形式の一例である。過去目的データの具体的なデータ形式の一例である。最適化用設定パラメータと最適化用入力データの具体的なデータ形式の一例である。指標データの具体的なデータ形式の一例である。図２の最適化ステップ（２１３）を説明するフローである。実施例２におけるデータ処理システムのシステム構成図である。実施例２の基本フローである。図１０の検証データ分離ステップ（１００２）を説明するフローである。検証分離情報データの具体的なデータ形式の一例である。実行結果データの具体的なデータ形式の一例である。図１０の有効性検証ステップ（１００５）を説明するフローである。指標有効性テーブルの具体的なデータ形式の一例である。図１０の指標生成ステップ（１００１）を説明するフローである。

　以下、添付図面を参照して本発明の実施例について説明する。なお、添付図面は本発明の原理に則った具体的な実施例を示しているが、これらは本発明の理解のためのものであり、決して本発明を限定的に解釈するために用いられるものではない。なお、各図において共通の構成については同一の参照符号が付されている場合がある。

［実施例１］
　以下、本発明の一実施形態を、図面を参照して説明する。図１は、本実施例におけるデータ処理システムのシステム構成図である。データ処理システムは、データを解析し、モデルを作成するシステムである。以下では、モデルとして、データを最適化する際の評価式を作成する例で説明する。

　データ処理システムは、中央処理装置１０１と、二次記憶装置１１０と、主記憶装置１２０と、入力装置１４０と、出力装置１５０とを備える。データ処理システムは、例えば、一般的な計算機によって実現され、ここでは、サーバシステムとして構成される。

　中央処理装置１０１は、主記憶装置１２０に格納されたプログラムを実行するプロセッサである。

　二次記憶装置１１０は、例えば、磁気記憶装置、フラッシュメモリ等の大容量かつ不揮発性の記憶装置である。なお、二次記憶装置１１０に記憶されている情報は、主記憶装置１２０に格納して、より高速にアクセスすることを可能にしてもよい。

　主記憶装置１２０は、例えば、ＤＲＡＭ（Dynamic Random Access Memory）のような高速かつ揮発性の記憶装置である。主記憶装置１２０は、オペレーティングシステム（OS）及びアプリケーションプログラムを格納する。中央処理装置１０１が、オペレーティングシステムを実行することによって、計算機の基本機能が実現され、アプリケーションプログラムを実行することによって、計算機が提供する機能が実現される。

　具体的には、主記憶装置１２０には、モデリング機能付き最適化部１３０を実装するためのプログラムが格納される。モデリング機能付き最適化部１３０は、第１指標生成部１３１と、評価式生成部１３２と、最適化部１３３とを含む。

　モデリング機能付き最適化部１３０の各処理モジュールは、例えば、中央処理装置１０１（プロセッサ）が各処理モジュールに対応するプログラムを実行することによって実現される。したがって、以下の説明において、図１の処理モジュールを主語として処理内容を説明した場合、プロセッサを主語とした説明としてもよい。

　なお、中央処理装置１０１によって実行されるプログラムは、不揮発性の記憶媒体又はネットワークを介して計算機に提供される。このため、計算機は、記憶媒体（ＣＤ－ＲＯＭ、フラッシュメモリ等）を読み込むインターフェースを備えてもよい。

　入力装置１４０は、キーボード、マウスなどのユーザインターフェースである。出力装置１５０は、ディスプレイ装置、プリンタなどのユーザインターフェースである。

　図２は、実施例１の基本フローを示す。本システムのフローは、最適化に有効な指標を生成し、その指標に基づいて評価式を生成する第１段階と、評価式に基づいてデータを最適化する第２段階とを含む。本実施例は、最適化する問題があらかじめ分かっている場合には、その最適化が上手くいくように評価式を過去のデータから学習する点が一つ特徴となっている。この学習機能により、大量のデータが入力され、最適化の評価式を人手で構築することが難しい場合でも、自動的に評価式を構築することが可能となる。

　図２に示すように、本システムには、過去説明データ２０１と、過去目的データ２０２と、最適化用設定パラメータ２０３と、最適化用入力データ２０４とが入力される。

　過去説明データ２０１は、過去の説明データ（説明変数）であり、基本的には、最適化用入力データ２０４と同じカラムを有するデータである。

　過去目的データ２０２は、過去の目的指標（目的変数）である。過去目的データ２０２は、過去説明データ２０１内のデータの状態を取ったときの目的指標の値を格納する。

　最適化用入力データ２０４は、最適化を行いたい入力データである。また、最適化用設定パラメータ２０３は、最適化の制約条件などが記載されているパラメータである。

　以下では、過去説明データ２０１と、過去目的データ２０２と、最適化用設定パラメータ２０３と、最適化用入力データ２０４とについて詳細に説明する。なお、本実施例において、本システムが使用する情報は、データ構造に依存せず、どのようなデータ構造で表現されていてもよい。図４～図６はテーブル形式の例を示しているが、例えば、テーブル、リスト、データベース又はキューから適切に選択したデータ構造体が、情報を格納することができる。

　図４は、過去説明データ２０１の具体的なデータ形式の一例を示す。過去説明データ２０１は、カラム名称４０１と、データ部分４０２とから構成されている。本実施例では、倉庫のピッキング作業の生産性を上げる最適化問題を例に挙げる。過去説明データ２０１は、過去の時間区分に関して、誰が、どの商品を、どの棚にピッキングしたかを示すデータである。

　過去説明データ２０１は、カラムとして、ピッキングＩＤ４１１と、棚種類４１２と、棚ＩＤ４１３と、商品ＩＤ４１４と、ピッカー時間区分４１５と、ピッカー４１６とを含む。つまり、各ピッキングは、ピッキングを行った棚種類、ピッキングを行った棚ＩＤ、ピッキングを行った商品ＩＤ、ピッカーがパート又は正社員であるか、ピッカーの就業時間区分が午前又は午後であるか、といった属性を有する。本実施例の目的は、どのような属性であればピッキングの生産性を高くすることができるかを明らかにし、ピッキングの生産性が高くなるように最適化を行うことである。

　また、過去説明データ２０１は、過去目的データ２０２と紐付け可能な共通カラムを備える。ここでは、ピッキングＩＤ４１１が、その共通カラムに相当する。他のカラムは同じピッキングＩＤを持つ過去目的データ２０２中の目的指標のカラムである生産性カラムの変動を説明するために使われる。

　図５は、過去目的データ２０２の具体的なデータ形式の一例を示す。過去目的データ２０２は、カラム名称５０１とデータ部分５０２とから構成されている。過去目的データ２０２は、カラムとして、ピッキングＩＤ５１１と、生産性５１２とを含む。過去目的データ２０２は、過去説明データ２０１と紐付け可能な共通カラムを備える。ここでは、ピッキングＩＤ５１１が、その共通カラムに相当する。また、生産性５１２が、目的指標となるカラムである。

　本実施例では、倉庫のピッキングを例に挙げているが、本発明の適用範囲は任意の説明データと目的データに適用可能であることに注意する。

　また、本実施例では、過去説明データ２０１と過去目的データ２０２を別々のテーブルで表現しているが、これは、より一般的な形式で説明するためである。本例の過去説明データ２０１と過去目的データ２０２の双方に関して、一つのピッキングＩＤに対して一つのレコードを割り当てているが、解きたい問題によっては別の例も考えらえる。例えば、過去目的データ２０２では一つのピッキングＩＤに対して一つのレコードを割り当て、過去説明データ２０１では一つのピッキングＩＤに対して複数のレコード（すなわち、複数回のピッキング作業）が割り当てられる例があり得る。本実施例では、上記のような説明データと目的データのサンプリングが異なる入力に関しても評価式を構築できる一般的な形を想定して、２つのテーブルに分けている。

　図６は、最適化用設定パラメータ２０３と最適化用入力データ２０４の具体的なデータ形式の一例を示す。最適化用入力データ２０４は、基本的には過去説明データ２０１と同じ形式のデータである。最適化用入力データ２０４は、カラム名称６０１と、データ部分６０２とから構成されている。最適化用入力データ２０４は、カラムとして、ピッキングＩＤ６１１と、棚種類６１２と、棚ＩＤ６１３と、商品ＩＤ６１４と、ピッカー時間区分６１５と、ピッカー６１６とを含む。

　最適化用設定パラメータ２０３は、最適化用入力データ２０４の組み合わせ変更の制約条件を含む。本実施例では、最適化用設定パラメータ２０３が、変更制約パラメータ６２１と変更可否パラメータ６２２の２つのパラメータを含む。

　変更可否パラメータ６２２は、最適化用入力データ２０４の組み合わせを変更する際に、変動部分６３１と、不動部分６３２とに分けるためのパラメータである。変動部分６３１は、最適化用入力データ２０４の組み合わせ最適化を行う際に交換が可能なカラムを意味し、不動部分６３２は、最適化用入力データ２０４の組み合わせ最適化を行う際に交換が行われず、固定されるカラムを意味する。ここでは、変動部分６３１となるカラムに「１」が設定され、不動部分６３２となるカラムに「０」が設定される。

　なお、変更可否パラメータ６２２は、この例に限定されない。複数のカラムが変動部分６３１として設定される場合、変更可否パラメータ６２２は、変動部分６３１の中での優先度の情報を含んでもよい。例えば、変動部分６３１として、あるカラムには「１」を設定し、別のカラムには「２」を設定してもよい。この場合、最適化部１３３は、最適化用入力データ２０４の最適化する際に、「２」に設定されたカラムを優先的に変更するようにしてもよい。

　変更制約パラメータ６２１は、変更可否パラメータ６２２で変動部分６３１に設定されたカラム中の動かせる範囲を規定するパラメータである。ここでは、動かせないカラムが「１」に設定され、動かせるカラムに「０」が設定されている。図６の符号６３３は、変更可否パラメータ６２２が「１」に設定され、最適化の際に動かせないカラムを示す。本例では、ピッカー時間区分６１５が「１」に設定されているので、変動部分６３１であるピッカー６１６は、ピッカー時間区分６１５の値が同じもの同士の間でしか交換できない。例えば、図６に示すように、ピッカー時間区分６１５の値が「午前」であるデータの間で、ピッカー６１６の値を交換できる。本例では、変更制約パラメータ６２１が同じ値同士の間でのみ交換可能な例を示したが、この例に限定されない。例えば、変更制約パラメータ６２１に設定されたカラムの値が近い場合には交換可能などの制約でもよい。したがって、あらゆる形の制約条件を設定可能である。

　次に、評価式の概要を説明する。過去説明データ２０１は、最適化を行う評価式Ｙ＝Ｆ（Ｘ）のＸを生成するために用いられる。ここで、通常の回帰式とは異なり、本実施例では、評価式Ｆ（Ｘ）を汎用的にするために、過去説明データ２０１の１カラムが直接評価式Ｆ（Ｘ）のＸになるのではなく、複数のカラムの組み合わせによって合成された組み合わせ指標がＸとなる点に注意する。この指標生成に関しては、後述する。

　次に、図２のフローについて説明する。第１指標生成部１３１は、上記最適化用入力データ２０４を最適化用設定パラメータ２０３の条件で最適化する場合に、評価式Ｆ（Ｘ）のＸとして有効な組み合わせ指標Ｘを生成する（２１１）。ここでの詳細な処理は、図７を用いて後述する。第１指標生成部１３１は、最適化に有効な組み合わせ指標を表す指標データ２０５を出力する。

　評価式生成部１３２は、指標データ２０５を用いて、過去目的データ２０２の目的指標に相当するカラムを回帰分析する。具体的に、本例では、目的指標Ｙは、過去目的データ２０２の生産性となる。したがって、評価式生成部１３２は、生産性Ｙを回帰するＹ＝Ｆ（Ｘ）を、指標データ２０５に格納されている複数の指標から構築する（２１２）。評価式生成部１３２は、構築した評価式２０６を出力する。

　最適化部１３３は、最適化用入力データ２０４を、最適化用設定パラメータ２０３の条件のもと評価式２０６が向上するように最適化を行う（２１３）。この最適化処理に関しては、後述する。最適化部１３３は、最適化済みデータ２０７を出力する。

　最適化済みデータ２０７は、最適化用入力データ２０４の組み合わせが変更されたデータである。最適化済みデータ２０７のデータ形式は、最適化用入力データ２０４と同じ形式をとることが可能である。

　図３は、図２のステップ２１１のフローを示す。このフローでは、最適化に有効な組み合わせ指標を表す指標データ２０５が作成される。

　まず、第１指標生成部１３１は、入力情報としての最適化用設定パラメータ２０３と最適化用入力データ２０４を用いて、最適化用入力データ２０４のカラムのうち、任意のＫ個のカラムを選択する（３０１）。

　次に、第１指標生成部１３１は、ステップ３０１で選択されたＫ個のカラムの変更可否パラメータ６２２の値を最適化用設定パラメータ２０３から読み出す。ここで、第１指標生成部１３１は、Ｋ個のカラムの変更可否パラメータ６２２がある条件を満たすかどうかを判定する（３０２）。詳細には、第１指標生成部１３１は、Ｋ個のカラムの変更可否パラメータ６２２を参照し、Ｋ個のカラムの中に変動部分６３１と不動部分６３２がそれぞれ少なくとも１つ含まれるかどうかを判定する。変動部分６３１と不動部分６３２がそれぞれ少なくとも１つある場合には、この制約内でカラムの組み合わせを変更することが可能となる。したがって、最適化を行った際に評価値を向上させることが可能となる。第１指標生成部１３１は、この条件を満たす指標に関して（ステップ３０２のＹｅｓ）、その情報を指標データ２０５に格納する。

　一方、Ｋ個のカラムの中に変動部分６３１と不動部分６３２がそれぞれ少なくとも１つ含まれない場合、つまり、Ｋ個のカラムの全てが変動部分６３１又は不動部分６３２である場合には、この制約内ではカラムの組み合わせを変更することができないことを意味する。したがって、最適化を行っても評価値が向上することはない。このような指標が評価式生成部１３２に入力されてしまうと、評価式生成部１３２によって出力される評価式２０６は、本来重視すべき指標（評価値が変動する指標）の重みを下げてしまうなどの弊害を引き起こす。その結果、最適化の向上の期待値が下がるという問題が引き起こされる。第１指標生成部１３１は、条件を満たさない指標に関して（ステップ３０２のＮｏ）、その情報を指標データ２０５に格納する。

　次に、第１指標生成部１３１は、ステップ３０２において条件を満たすカラムの組み合わせに関して、流動度を計算する（３０３）。ここで、流動度は、ステップ３０２において条件を満たすカラムの組み合わせに関して、とり得る組み合わせの種類数の程度を表す情報である。他の言い方をすれば、流動度は、変更制約内において、どの程度組み合わせの変更が可能かを表すものである。流動度を計算するのは、たとえステップ３０２において最適化の際に組み合わせ変更が可能であると判定された場合でも、変更制約パラメータ６２１の設定によっては実質的には組み合わせが変わらない場合があるからである。

　例えば、図６の最適化用入力データ２０４において、ピッカー時間区分６１５が「午前」である行のピッカー６１６が「パート」のみであり、ピッカー時間区分６１５が「午後」である行のピッカー６１６が「社員」のみである場合を考える。この例では、変更制約内で交換を行っても組み合わせに全く変化がないことが明らかである。つまり、最適化の際に評価値が変わらないので、何の情報も持たないことになる。そこで、第１指標生成部１３１は、指定された変更制約内でどれだけ組み合わせの変更が可能であるかを表す流動度を計算する。計算方法の一例としては、変動部分６３１を変更制約内でランダムにシャッフルしたときに、当該選択されているＫ個のカラムの値の組み合わせが平均的にＳ％変更しているかを計算する方法がある。上記の例だと、全く組み合わせが変更されないのでＳ＝０％となる。逆に流動性が高ければ、Ｓ＝３０％といった正の数値になる。

　第１指標生成部１３１は、ステップ３０３で計算された流動度Ｓが指標計算条件を満たすかを判定する（３０４）。ここでの指標計算条件の一例は、流動度Ｓが予め定められたしきい値Α以上となるという条件である。流動度Ｓがしきい値Ａ以上である場合、ステップ３０５に進む。一方、流動度Ｓがしきい値Ａより小さい場合（ステップ３０４のＮｏ）、第１指標生成部１３１は、指標計算条件を満たさなかったことを指標データ２０５に格納してもよい。本例では、予め設けたしきい値Αをもとに判定したが、固定のしきい値Αを設けず、流動度Ｓの上位３０％のカラムの組み合わせを採用するといった方法も可能である。

　第１指標生成部１３１は、ステップ３０４で指標計算条件を満たしたカラムの組み合わせに関して、過去説明データ２０１を用いて指標を計算する（３０５）。例えば、ここでのＫ個のカラムの組み合わせは、棚ＩＤ６１３とピッカー６１６であると仮定する。このカラムの組み合わせは、ステップ３０２の条件を満たし、かつ、ステップ３０４の条件も満たしていると仮定する。このようなカラム組み合わせに関して、第１指標生成部１３１は、１つ以上の種類の関数を適用して、指標を計算する。ここでは、一例として関数Ｇ１を使用する。関数Ｇ１は、「棚ＩＤ６１３が５未満」ＡＮＤ「ピッカー６１６がパート」であれば１、そうでなければ０となるような関数である。関数Ｇ１を過去説明データ２０１に適用すると、データベクトルは（０，０，１，０，…）となる。第１指標生成部１３１は、適用した関数及びその関数を用いて計算されたデータベクトルを指標データ２０５に格納する。

　ここで、関数に関して、予め１つ以上の種類が用意されていてもよいし、クラスタリング等を用いて動的に生成された１つ以上の種類の関数が使用されてもよい。また、予め用意された又は動的に生成された全ての関数が過去説明データ２０１に適用されてもよい。なお、複数の関数が適用された場合には、適用された関数の数だけ、指標が生成される。

　第１指標生成部１３１は、全てのカラムの組み合わせを選択したかを判定する（３０６）。例えば、カラムの組み合わせとして、３カラム以下の組み合わせを条件として設定していると仮定する。この場合、第１指標生成部１３１は、１カラム、２カラムの組み合わせ、及び３カラムの組み合わせの全てに関して、図３のフローを行ったかを判定する。上記の条件に従って全てのカラムの組み合わせの選択が終了した場合には、処理を終了する。選択が終了していない場合、ステップ３０１～３０６を繰り返し実行する。

　図７は、指標データ２０５の具体的なデータ形式の一例である。指標データ２０５は、カラムとして、指標ＩＤ７０１と、入力カラム７０２と、変更条件７０３と、制約内流動度７０４と、関数７０５と、データベクトル７０６とを備える。

　指標ＩＤ７０１は、生成した指標をユニークに特定できるＩＤである。入力カラム７０２は、最適化用入力データ２０４を最適化する際に指標となるカラムの組み合わせの情報であり、図３のステップ３０１で選択されたカラムの組み合わせである。

　変更条件７０３は、最適化する際のカラムごとの変更可否を示す変更可否情報であり、ステップ３０２の条件を満たしたかどうかを示す値である。変更条件７０３には、ステップ３０２の条件が満たされた場合に「可」が格納され、ステップ３０２の条件が満たさない場合に「不可」が格納される。

　制約内流動度７０４は、ステップ３０３で計算された流動度Ｓを格納する。関数７０５は、ステップ３０５で適用された関数を格納する。データベクトル７０６は、ステップ３０５で計算された指標の値をベクトルとして格納する。なお、ステップ３０２において条件を満たしていない場合、関数７０５及びデータベクトル７０６には、「－」が格納される。

　次に、評価式について説明する。評価式生成部１３２は、指標データ２０５を用いて、過去目的データ２０２の目的指標に相当するカラムを回帰分析する。指標データ２０５は、上記したように、有効な指標であるかの情報を含んでいるため、評価式生成部１３２は、指標データ２０５の中で有効な指標のみを用いて評価式２０６を構築する。

　すなわち、評価式生成部１３２は、指標データ２０５において、カラムの組み合わせの中に変動部分６３１と不動部分６３２がそれぞれ少なくとも１つ含まれる指標のみを用いて、評価式２０６を生成する。また、評価式生成部１３２は、指標データ２０５において、制約内流動度７０４が所定の条件を満たす指標のみを用いて、評価式２０６を生成する。ここでの所定の条件は、しきい値で設定されてよい。

　評価式の構築方法は、一般的な回帰モデリング手法ならば、どのような手法を用いてもよい。例えば、線形な回帰モデリングとしては、重回帰式、ＬＡＳＳＯ回帰、ＲＩＤＧＥ回帰式等が挙げられる。また、非線形な回帰式を適用することも可能である。本実施例では簡単に重回帰式を用いた例で説明する。

　評価式２０６は、生産性Ｙを回帰するＹ＝Ｆ（Ｘ）である。重回帰式で生成した評価式の一例を式（１）に示す。式（１）は、重回帰式の項として２つの指標Ｇ１（棚ＩＤ＜５，　ピッカー＝パート）、Ｇ２（棚種類＝ｂｉｇ，　ピッカー＝社員）が係数Ａ１，Ａ２で線形結合された式である。Ｇ１は、「棚ＩＤが５未満」ＡＮＤ「ピッカーがパート」であれば１、そうでなければ０となるような関数である。Ｇ２は、「棚種類がｂｉｇ」ＡＮＤ「ピッカーが社員」であれば１、そうでなければ０となるような関数である。

　　Ｆ（Ｘ）＝Ａ１＊Ｇ１（棚ＩＤ＜５，　ピッカー＝パート）＋Ａ２＊Ｇ２（棚種類＝ｂｉｇ，　ピッカー＝社員）　　　　…式（１）

　本実施例で使用される関数は任意の形式をとることが可能である。例えば、関数が、「ＡＮＤ」以外の、「ＯＲ」、「ＸＯＲ」などの他の演算子を含んでもよい。また、関数は、平均又は分散等の集合演算を含んでもよい。

　図８は、図２のステップ２１３を説明するフローである。本フローでは、上記生成された評価式２０６の評価値が向上するように、最適化用設定パラメータ２０３の条件のもと、最適化用入力データ２０４に関して組み合わせの交換を行う。

　最適化部１３３は、評価式２０６と最適化用設定パラメータ２０３と最適化用入力データ２０４とを入力として受け取る。最適化部１３３は、最適化用入力データ２０４の変動部分６３１を、制約部分６３３の値が同じ範囲でランダムに交換を行う（８０１）。図６は、この組み合わせの変更処理の具体例を示す。例えば、データ部分６０２の１行目と４行目に関して、これらのピッカー時間区分６１５は「午前」であり、したがって、同じ値である。このように、最適化部１３３は、制約部分６３３の値が同じ範囲で、データ部分６０２の１行目と４行目のピッカー６１６の値を交換する。

　最適化部１３３は、ステップ８０１で組み合わせが変更された最適化用入力データ２０４に対して、評価式２０６に用いられている全ての指標を再計算する（８０２）。ここで、評価式２０６が式（１）であり、かつ、指標データ２０５が図７の例であると仮定する。最適化部１３３は、指標データ２０５のうち、評価式２０６に用いられている指標ＩＤ７０１（＝３，４）に対応するデータベクトル７０６を再計算する。

　最適化部１３３は、ステップ８０２で再計算された指標データ２０５と評価式２０６とを用いて、組み合わせが変更された最適化用入力データ２０４に関して評価式Ｙ＝Ｆ（Ｘ）を計算する（８０３）。

　最適化部１３３は、評価値Ｙの収束判定を行う（８０４）。最適化部１３３は、（１）評価値Ｙの変動が収束しているか、又は、（２）ステップ８０１における組み合わせ変更回数が予め決められた条件に達しているかを判定する。最適化部１３３は、上記の（１）又は（２）の条件を満たしている場合、その時の最適化用入力データ２０４を最適化済みデータ２０７として出力する。そして、本フローを終了する。

　一方、上記の（１）又は（２）のいずれの条件も満たしていない場合、最適化部１３３は、改善判定を行う（８０５）。最適化部１３３は、今回の組み合わせ変更によって評価値Ｙが改善したかどうかを判定する。評価値Ｙが改善した場合、最適化部１３３は、その時の最適化用入力データ２０４を入力データとして、ステップ８０１～８０４の繰り返し処理を実行する。一方、評価値Ｙが改善していない場合、最適化部１３３は、前回の最適化用入力データの組み合わせに戻す（８０６）。その後、最適化部１３３は、前回の最適化用の組み合わせを入力データとして、ステップ８０１～８０４の繰り返し処理を実行する。なお、このとき、焼きなまし法のように、ある確率では改善していなくても組み合わせを採択することで、局所最適に陥らないようにすることも可能である。

　上記の実施例の効果について説明する。データから帰納的に目的変数を回帰した評価式は、制約を考慮した最適化を行う際に、最適化の効果がその制約により大きく下がる場合がある。これに対して、上記の実施例は、多数の説明変数と目的変数が含まれるデータ（過去説明データ２０１及び過去目的データ２０２）と最適化したいデータ（最適化用入力データ２０４）と最適化のパラメータ（最適化用設定パラメータ２０３）が与えられたときに、最適化したいデータとそのパラメータを考慮した目的変数の回帰評価式を作成することができる。したがって、パラメータ内の制約条件を考慮した最適化の効果を高くすることができる。

　より具体的には、本実施例によれば、データを解析し、モデル（例えば、評価式）を作成するデータ処理システムにおいて、カラムごとに前記モデルの最適化の際に変更可能か又は変更不可能かどうかを示す変更条件を受け付け、変更条件に基づいて前記モデルを作成する。したがって、制約条件を考慮した最適化を効果的に行う場合、予めその制約条件を考慮して最適化向けのモデルを作成することができる。

［実施例２］
　次に、実施例２を説明する。実施例２では、最適化を行った入力データを実際に実行した結果を用いることにより、指標の有効性の確度を上げる構成が提供される。

　図９は、本実施例におけるデータ処理システムのシステム構成図である。上述の実施例で説明した構成要素については、同じ符号を付して説明を省略する。

　二次記憶装置１１０には、本システムで最適化を行う際の有効性を格納する指標有効性テーブル９０１が格納される。また、モデリング機能付き最適化部１３０は、実施例１の構成要素に加え、第２指標生成部９０２と、検証データ分離部９０３と、部分最適化部９０４と、実行部９０５と、指標有効性検証部９０６とを備える。

　モデリング機能付き最適化部１３０の各処理モジュールは、例えば、中央処理装置１０１（プロセッサ）が各処理モジュールに対応するプログラムを実行することによって実現される。したがって、以下の説明において、図９の処理モジュールを主語として処理内容を説明した場合、プロセッサを主語とした説明としてもよい。

　図１０は、実施例２の基本フローを示す。なお、実施例１の基本フローと同じ処理及び同じデータについては同じ符号を付し、その説明を省略する。

　第２指標生成部９０２は、指標有効性テーブル９０１の情報を用いて、有効な指標のみを生成する（１００１）。ここでの詳細な処理は、図１６を用いて後述する。第２指標生成部は、最適化に有効な組み合わせ指標を表す指標データ２０５を出力する。

　その後、評価式２０６を生成した後、検証データ分離部９０３は、最適化用入力データ２０４を、複数のデータに分離する（１００２）。具体的には、検証データ分離部９０３は、最適化用入力データ２０４を、検証用データ１０１１と部分最適化用データ１０１２と最適化用データ１０１３に分離する。なお、ここでの分離情報は、検証分離情報データ１０１４として保存される。ここでの詳細な処理は、図１１を用いて後述する。

　部分最適化部９０４は、評価式２０６のうち検証対象の指標のみを用いた評価式を用いて、部分最適化用データ１０１２に対して最適化処理を行う（１００３）。基本的な最適化方法に関しては、最適化部１３３で行われる処理と同じであるが、例えば、以下の点で異なる。ここで、図７の指標データ２０５の指標ＩＤ７０１＝３の検証を行うと仮定する。指標ＩＤ７０１＝３の指標の検証を行う部分最適化用データ１０１２が入力された場合には、部分最適化部９０４は、式（２）のように当該指標のみを用いた評価式（第２モデル）を構築する。式（２）として、式（１）のうち指標ＩＤ＝３の指標を含む項のみを抽出し、係数等はそのまま使用することも可能であるし、改めて当該項のみを用いて評価式を回帰し直すことも可能である。

　　Ｆ（Ｘ）＝Ａ１＊Ｇ１（棚ＩＤ＜５，　ピッカー＝パート）　　　…式（２）

　本例の最適化済みデータ２０７は、図１０に示す通り、検証用データ１０１１として最適化が行われていないデータと、部分最適化部９０４によって部分最適化されたデータ（すなわち、部分最適化用データ１０１２の最適化実行後のデータ）と、最適化部１３３によって最適化されたデータ（すなわち、最適化用データ１０１３の最適化実行後のデータ）とから構成される。

　実行部９０５は、最適化済みデータ２０７を入力として受け取り、最適化済みデータ２０７の内容に従って実際に何らかの処理又は作業を実行する（１００４）。実行部９０５は、実行結果データ１０１５を出力する。ここでは、倉庫のピッキング作業の生産性を上げる最適化問題を例としている。したがって、実行部９０５での処理は、最適化済みデータ２０７に従って倉庫のピッキング作業を実際に実行し、その生産性を実行結果データ１０１５として出力することに相当する。

　なお、本フローでは簡単のため、全てのプログラムが同じシステム内にある例を示したが、これに限定されない。例えば、実際に最適化済みデータ２０７の内容に従って作業を実行する実行部９０５が他のシステム内にあってもよい。この場合、本実施例のデータ処理システムが、他のシステム内の実行部９０５に対して、最適化済みデータ２０７とともに実行要求を送る構成をとってもよい。別の例として、他のシステム内にある実行部９０５が、本実施例のデータ処理システムに対して、過去説明データ２０１、過去目的データ２０２、最適化用設定パラメータ２０３、最適化用入力データ２０４とともに最適化要求を送る構成をとってもよい。

　図１３は、実行部９０５から出力される実行結果データ１０１５の一例である。実行結果データ１０１５は、目的指標に相当するカラム（ここでは、生産性結果）の値を格納する。実行結果データ１０１５は、ピッキングＩＤ１３０１と、生産性結果１３０２とを含む。

　指標有効性検証部９０６は、実行結果データ１０１５と検証分離情報データ１０１４とを入力として受け取り、各指標の有効性を検証する（１００５）。指標有効性検証部９０６は、検証した情報を指標有効性テーブル１１１に記録する。ここでの詳細な処理は、図１４を用いて後述する。

　図１１は、図１０のステップ１００２のフローを示す。検証データ分離部９０３は、評価式２０６に用いられている各指標が実際に有効な指標であるかを検証するために、最適化用入力データ２０４を、単純に最適化を行う最適化用データと検証に用いるデータとに分離する。

　検証データ分離部９０３は、評価式２０６と最適化用設定パラメータ２０３と最適化用入力データ２０４とを入力データとして受け取る。検証データ分離部９０３は、最適化用入力データ２０４を、検証に用いるデータと単純に最適化を行うデータとに分離する（１１０１）。例えば、最適化用入力データ２０４の１０％のデータは検証に用いて、残り９０％のデータは単純に最適化に用いる場合には、検証データ分離部９０３は、最適化用入力データ２０４からランダムに９０％のデータを最適化用データ１０１３として分離し、残りのデータを検証に用いるデータ（以下、指標検証用データ）として次のステップ１１０２で用いる。本処理によって、検証を行いながらも大部分のデータは最適化されるので、最適化と検証を同時に行うことが可能となる。

　次に、検証データ分離部９０３は、指標検証用データを、評価式２０６に用いられている指標の数だけ、分割する（１１０２）。例えば、式（１）の例では２つの指標が用いられているので、検証データ分離部９０３は、指標検証用データを２つの分割データ（第１データ及び第２データ）に分割する。

　次に、検証データ分離部９０３は、検証対象の指標を除いた評価式を作成し、その評価式を用いて分割データを計算する（１１０３）。ここで、図７の指標データ２０５の指標ＩＤ７０１＝３の検証を行うと仮定する。検証データ分離部９０３は、式（１）から当該検証対象の指標を除いた式（３）を作成する。検証データ分離部９０３は、式（３）を用いて、第１データの各行の評価値を計算する。

　　Ｆ（Ｘ）＝　Ａ２＊Ｇ２（棚種類＝ｂｉｇ，　ピッカー＝社員）　　…式（３）

　なお、図７の指標データ２０５の指標ＩＤ７０１＝４の検証を行う場合には、検証データ分離部９０３は、式（１）から当該検証対象の指標を除いた式を作成し、その式を用いて、第２データの各行の評価値を計算すればよい。

　次に、検証データ分離部９０３は、ステップ１１０３で計算された評価値がほぼ均等になるように、分割データを検証用データ１０１１と部分最適化用データ１０１２とに分離する（１１０４）。「評価値がほぼ均等である」とは、例えば、評価値の差が、あるしきい値より小さいことで判定されてもよい。例えば、検証データ分離部９０３は、ステップ１１０３で式（３）を用いて計算された評価値が均等になるように第１データを検証用データ１０１１と部分最適化用データ１０１２とに分離する。また、検証データ分離部９０３は、最適化用入力データ２０４のどの行がどのデータに分離されたか表す情報を、検証分離情報データ１０１４として出力する。

　なお、上述のステップ１１０３では、検証対象の指標を除いた式（３）を作成したが、検証対象の指標を除かずに式（１）を評価式として用いることも可能である。

　次に、検証データ分離部９０３は、終了判定を行う（１１０５）。検証データ分離部９０３は、全ての指標に関して、検証用データ１０１１と部分最適化用データ１０１２に分離したかを判定する。全ての指標に関して分離が完了している場合、処理を終了する。分離が完了していない場合は、ステップ１１０３～１１０４を繰り返し実行する。

　図１２は、検証分離情報データ１０１４の具体的なデータ形式の一例である。検証分離情報データ１０１４は、検証指標ＩＤ１２０１と、対照群／最適化群１２０２と、データＩＤ１２０３とを含む。

　検証指標ＩＤ１２０１は、検証対象となっている指標の指標ＩＤを格納し、指標データ２０５の指標ＩＤ７０１に対応する。

　対照群／最適化群１２０２は、検証用のデータか又は部分最適化が行われるデータかを示すフラグを格納する。本例では、検証用データ１０１１（最適化が行われないデータ）を示すフラグとして、「対照群」が格納される。また、部分最適化用データ１０１２を示すフラグとして、「最適化群」が格納される。

　データＩＤ１２０３は、最適化用入力データ２０４のどの行がどの群に属するかの情報を格納する。図４の例では、最適化用入力データ２０４の各行をユニークに指定するカラムはピッキングＩＤ６１１である。したがって、データＩＤ１２０３は、該当するピッキングＩＤのベクトルを格納する。

　図１４は、図１０のステップ１００５のフローを示す。指標有効性検証部９０６は、各指標が最適化に実際に有効であったかを検証する。

　指標有効性検証部９０６は、検証分離情報データ１０１４と実行結果データ１０１５を入力データとして受け取る。指標有効性検証部９０６は、検証対象の１つの指標を検証分離情報データ１０１４から選択する（１４０１）。ここでは、検証対象の指標として、検証指標ＩＤ１２０１＝３の指標が選択されたと仮定する。

　指標有効性検証部９０６は、検証分離情報データ１０１４から、当該検証対象の指標の対照群のデータＩＤ１２０３と最適化群のデータＩＤ１２０３を読み取る。指標有効性検証部９０６は、実行結果データ１０１５から、対照群のデータＩＤ１２０３に対応する生産性結果１３０２と、最適化群のデータＩＤ１２０３に対応する生産性結果１３０２とを抽出する（１４０２）。ここでは、対照群の実行結果として、実行結果データ１０１５から、ピッキングＩＤ１３０１＝（１，３，５，…）のデータが抽出される。また、最適化群の実行結果として、実行結果データ１０１５から、ピッキングＩＤ１３０１＝（２，４，６，…）のデータが抽出される。

　指標有効性検証部９０６は、対照群の生産性結果１３０２と最適化群の生産性結果１３０２とを比較する（１４０３）。指標有効性検証部９０６は、検証指標ＩＤ１２０１＝３の指標によって目的指標である生産性が有意に改善されたかを示す結果を、指標有効性テーブル９０１に格納する。２つの群の生産性の比較は、平均値の比較又は分散分析等の統計的手法を用いることが可能である。

　なお、図１４のフローを繰り返し実行した場合、既に当該指標の有効性が指標有効性テーブル９０１に格納されている場合がある。このような場合、有効性が高い情報のみを指標有効性テーブル９０１に格納するなどの方法を行ってもよい。

　このフローを繰り返し実行することにより、指標の有効性を指標有効性テーブル９０１に蓄積することができる。指標有効性テーブル９０１を用いることにより、有効性が高い指標のみを評価式の作成に使用することが可能となる。

　次に、指標有効性検証部９０６は、終了判定を行う（１４０４）。指標有効性検証部９０６は、全ての指標に関して検証が完了した場合、処理を終了する。検証が完了していない場合は、ステップ１４０１～１４０３を繰り返し実行する。

　図１５は、指標有効性テーブル９０１の具体的なデータ形式の一例である。指標有効性テーブル９０１は、各指標の有効性を検証した結果を格納したものである。指標有効性テーブル９０１は、指標ＩＤ１５０１と、入力カラム１５０２と、関数１５０３と、有効度１５０４と、有効度信頼性１５０５とを含む。

　指標ＩＤ１５０１は、検証された指標の指標ＩＤを格納し、図７の指標ＩＤ７０１に対応する。入力カラム１５０２は、当該指標となるカラムの組み合わせを格納し、図７の入力カラム７０２に対応する。関数１５０３は、当該指標に関する関数を格納し、図７の関数７０５に対応する。

　有効度１５０４は、対照群／最適化群の比較処理（図１４のステップ１４０３）によって検証された有効度を格納する。例えば、有効度１５０４として、最適化群の平均値と対照群の平均値との差を使用してもよい。

　有効度信頼性１５０５は、有効度１５０４の信頼性の情報を格納する。これは、例えば最適化群の平均値と対照群の平均値の差が大きくても、各群の分散がそれ以上に大きい場合などは、この平均値の差が有意であるとは言えない。したがって、有効度信頼性１５０５は、このような場合に指標が有効であると判定されることを防止するために使用される。例えば、有効度信頼性１５０５として、分散分析の棄却確率の逆数を使用してもよい。

　図１６は、図１０のステップ１００１を説明するフローである。本フローは、基本的に図３と同じであり、以下では、異なる処理のみ説明する。

　ステップ３０４とステップ３０５の間に、ステップ１６０１が挿入される。第２指標生成部９０２は、指標有効性テーブル９０１から、当該Ｋ個のカラムの組み合わせにおいて生成可能な指標を検索する。例えば、第２指標生成部９０２は、指標有効性テーブル９０１から、有効性が高い、又は、有効性が不確定の指標を取得する。ここで、有効性が高い指標とは、有効度１５０４があるしきい値より高い指標を意味する。また、有効性が不確定の指標とは、有効度信頼性１５０５があるしきい値より低い指標を意味する。ここでは、指標の有効性が低く、かつ、その有効性の信頼度が高い場合には、指標を生成しても上記したように悪影響を与える可能性がある。したがって、そのような悪影響を与え得る指標に関して、第２指標生成部９０２は、最適化の際に使用しないことを示す情報を指標データ２０５に上記と同様の方法で格納してもよい。

　次の処理において、第２指標生成部９０２は、ステップ１６０１において取得されたＫ個のカラムの組み合わせに関して、過去説明データ２０１を用いて指標を計算する。以上のフローによって、第２指標生成部９０２は、有効性が高い指標を指標データ２０５として出力することができる。

　以上の実施例２によれば、第２指標生成部９０２が、指標有効性テーブル９０１を参照しながら、最適化に有効な指標（カラムの組み合わせ）のみを含む指標データ２０５を作成することができる。評価式生成部１３２は、有効性が高いことが検証済みの指標が格納された指標データ２０５を用いて評価式２０６を生成することができる。

　上記の例では、指標有効性テーブル９０１の中で、有効性が高い又は有効性が不確定の指標が評価式の作成に使用される一方、有効性が低く、かつ、その有効性の信頼度が高い指標は、評価式の作成に使用されない。指標有効性テーブル９０１の利用方法は、この例に限定されない。第２指標生成部９０２は、例えば、指標有効性テーブル９０１の有効度１５０４と有効度信頼性１５０５とから、指標の重要度を算出し、その重要度の情報を指標データ２０５に加えてもよい。評価式生成部１３２は、各指標の重要度を各指標の重みとして利用し、評価式を生成してもよい。

　本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。上記実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることもできる。また、ある実施例の構成に他の実施例の構成を加えることもできる。また、各実施例の構成の一部について、他の構成を追加・削除・置換することもできる。

　また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)に記憶させることが可能である。非一時的なコンピュータ可読媒体としては、例えば、フレキシブルディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ハードディスク、光ディスク、光磁気ディスク、ＣＤ－Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどが用いられる。

　上記の実施例において、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。

１０１　　　　…中央処理装置
１１０　　　　…二次記憶装置
１１１　　　　…指標有効性テーブル
１２０　　　　…主記憶装置
１３０　　　　…モデリング機能付き最適化部
１３１　　　　…第１指標生成部
１３２　　　　…評価式生成部
１３３　　　　…最適化部
１４０　　　　…入力装置
１５０　　　　…出力装置
２０１　　　　…過去説明データ
２０２　　　　…過去目的データ
２０３　　　　…最適化用設定パラメータ
２０４　　　　…最適化用入力データ
２０５　　　　…指標データ
２０６　　　　…評価式
２０７　　　　…最適化済みデータ
９０１　　　　…指標有効性テーブル
９０２　　　　…第２指標生成部
９０３　　　　…検証データ分離部
９０４　　　　…部分最適化部
９０５　　　　…実行部
９０６　　　　…指標有効性検証部
１０１１　　　…検証用データ
１０１２　　　…部分最適化用データ
１０１３　　　…最適化用データ
１０１４　　　…検証分離情報データ
１０１５　　　…実行結果データ

Claims

　プロセッサと、記憶部とを備え、複数のカラムを含む入力データを最適化するためのモデルを作成するデータ処理システムであって、
　前記プロセッサは、
　前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取り、
　前記指標データに基づいて前記モデルを生成することを特徴とするデータ処理システム。
　請求項１に記載のデータ処理システムにおいて、
　前記プロセッサは、
　前記カラムの組み合わせの中に変更可能なカラムと変更不可のカラムとがそれぞれ少なくとも１つ含まれる前記指標のみを用いて、前記モデルを生成することを特徴とするデータ処理システム。
　請求項２に記載のデータ処理システムにおいて、
　前記指標データは、前記変更可能なカラムに関して、取り得る組み合わせの種類の程度を表す流動度の情報をさらに含み、
　前記プロセッサは、
　前記流動度が所定の条件を満たす前記指標のみを用いて、前記モデルを生成することを特徴とするデータ処理システム。
　請求項１に記載のデータ処理システムにおいて、
　前記指標データは、ある関数を用いて過去のデータに基づいて計算された前記指標の値をさらに含み、
　前記プロセッサは、前記指標の値を用いて前記モデルを生成することを特徴とするデータ処理システム。
　請求項１に記載のデータ処理システムにおいて、
　前記プロセッサは、
　前記入力データを最適化する際の制約情報を受け取り、
　前記制約情報及び前記モデルに基づいて前記入力データを最適化し、最適化データを出力することを特徴とするデータ処理システム。
　請求項５に記載のデータ処理システムにおいて、
　前記最適化データを用いて処理を実行し、実行結果データを出力する実行部をさらに備えることを特徴とするデータ処理システム。
　請求項６に記載のデータ処理システムにおいて、
　前記記憶部は、指標の有効性を表す指標有効性情報を格納しており、
　前記プロセッサは、
　前記入力データを前記指標ごとに複数のデータに分割し、
　前記実行結果データから各指標の有効性を検証し、
　各指標の有効性を前記指標有効性情報として前記記憶部に格納することを特徴とするデータ処理システム。
　請求項７に記載のデータ処理システムにおいて、
　前記プロセッサは、前記指標有効性情報を用いて前記指標データを作成することを特徴とするデータ処理システム。
　請求項７に記載のデータ処理システムにおいて、
　前記複数のデータは、最適化を行わない検証用データと、最適化を行う部分最適化用データとを含み、
　前記プロセッサは、
　前記部分最適化用データに関して、検証対象の指標のみを用いた第２モデルを生成し、
　前記第２モデルを用いて最適化することを特徴とするデータ処理システム。
　請求項９に記載のデータ処理システムにおいて、
　前記プロセッサは、前記実行結果データにおける前記検証用データに対応するデータと、前記実行結果データにおける前記部分最適化用データに対応するデータとを比較することによって、前記指標の有効性を検証することを特徴とするデータ処理システム。
　請求項９に記載のデータ処理システムにおいて、
　前記プロセッサは、
　前記モデルから、検証対象の指標を除いた第３モデルを生成し、
　前記第３モデルの評価値がほぼ均等になるように前記検証用データと前記部分最適化用データに分離することを特徴とするデータ処理システム。
　複数のカラムを含む入力データを最適化するためのモデルを作成するデータ処理方法であって、
　プロセッサが、前記入力データを最適化する際に指標となる前記カラムの組み合わせの情報と、前記最適化する際の前記カラムごとの変更可否を示す変更可否情報とを含む指標データを受け取るステップと、
　前記プロセッサが、前記指標データに基づいて前記モデルを生成するステップと
を含むことを特徴とするデータ処理方法。