WO2022176014A1

WO2022176014A1 - データ分析方法選択装置、方法及びプログラム

Info

Publication number: WO2022176014A1
Application number: PCT/JP2021/005698
Authority: WO
Inventors: 太三山本; 高明森谷; 学西尾; 優三好
Original assignee: 日本電信電話株式会社
Priority date: 2021-02-16
Filing date: 2021-02-16
Publication date: 2022-08-25
Also published as: JP7469730B2; US20240119117A1; JPWO2022176014A1

Abstract

２つの時系列データの関係性を表す評価値を集合Ａ，Ｂ，…ごとに異なる分析方法で求める分析部１０と、分析方法に対応させて評価値の変化の傾向が異なる集合の組合せを抽出する組合せ抽出部４０と、組合せ抽出部４０で抽出された組合せのそれぞれについて、評価値の良否で分析方法をグループに分類し、該分類した結果を集合に対応させて記録する分析方法グループ化部５０と、組合せ抽出部４０が抽出した組合せのそれぞれの集合の時系列データを利用者に提示し、どちらの集合の時系列データが似ているかを利用者に問合せる問合せ部６０と、利用者の回答で似ていると判定された集合の評価値が良い方のグループに属する分析方法のスコアを加点するスコア化部７０と、上記の各機能構成部のそれぞれの処理を繰り返し、スコアが所定値になる分析方法を選択する分析方法選択部９０とを備える。

Description

データ分析方法選択装置、方法及びプログラム

　本発明は、データ分析方法選択装置、方法及びプログラムに関する。

　データの集合を分析・評価するのに、データサイエンティスト（Data Scientist、以降ＤＳ）のサポートを受ける場合がある。ＤＳは、さまざまな意向決定の局面において、データに基づいて合理的な判断を行えるように意向決定者をサポートする職務を行う。

　ＤＳは、各分野に精通した専門家ではあるが、ノウハウを持たない分野もある。よって、ＤＳにノウハウのない場合は、適切なデータ分析ができない。

　一方、データ分析装置としては、時系列データ等のデータ集合に規則性を求め、各データの時間的変化量を示す指標値を算出し、時系列データをグラフ化するものが例えば特許文献１に開示されている。

特許第６５９２４１１号公報

　しかしながら、特許文献１に開示された技術は、求めた上記の指標値に従った順番で複数の時系列データをグラフ化したものを並べて表示するものである。よって、表示されたグラフが利用者の求めるもので無い場合もある。つまり、分析結果に利用者のフィードバックが効かないという課題がある。

　このように従来は、完全な分析方法は存在しないという前提に基づいて複数の分析方法の結果を利用者に提示し、利用者がより良い分析方法を選択するという仕組みが存在しなかった。

　本発明は、この課題を鑑みてなされたものであり、ノウハウが無いような場合においても適切な分析手法を利用者のフィードバックを効かせて絞り込み、適切なデータ分析が選択できるデータ分析方法選択装置、方法及びプログラムを提供することを目的とする。

　本発明の一態様に係るデータ分析方法選択装置は、２つの時系列データをそれぞれ記録した集合を複数含むデータ集合と、前記２つの時系列データの関係性を表す評価値を前記集合ごとに異なる分析方法で求める分析部と、前記分析方法に対応させて前記評価値の変化の傾向が異なる前記集合の組合せを抽出する組合せ抽出部と、前記組合せ抽出部で抽出された前記組合せのそれぞれについて、前記評価値の良否で前記分析方法をグループに分類し、該分類した結果を前記集合に対応させて記録する分析方法グループ化部と、前記組合せ抽出部が抽出した前記組合せのそれぞれの前記集合の時系列データを利用者に提示し、どちらの前記集合の時系列データが似ているかを利用者に問合せる問合せ部と、前記利用者の回答で似ていると判定された前記集合の前記評価値が良い方の前記グループに属する前記分析方法のスコアを加点するスコア化部と、前記組合せ抽出部、前記分析方法グループ化部、前記問合せ部、及び前記スコア化部のそれぞれの処理を繰り返し、前記スコアが所定値になる前記分析方法を選択する分析方法選択部とを備えることを要旨とする。

　また、本発明の一態様に係るデータ分析方法選択方法は、上記のデータ分析方法選択装置が行う方法であって、分析部は、２つの時系列データの関係性を表す評価値を前記時系列データがそれぞれ記録された集合ごとに異なる分析方法で求める分析ステップと、組合せ抽出部は、前記分析方法に対応させて前記評価値の変化の傾向が異なる前記集合の組合せを抽出する組合せ抽出ステップと、分析方法グループ化部は、前記組合せ抽出ステップで抽出された前記組合せのそれぞれについて、前記評価値の良否で前記分析方法をグループに分類し、該分類した結果を前記集合に対応させて記録する分析方法グループ化ステップと、問合せ部は、前記組合せ抽出部が抽出した前記組合せのそれぞれの前記集合の時系列データを利用者に提示し、どちらの前記集合の時系列データが似ているかを利用者に問合せる問合せステップと、スコア化部は、前記利用者の回答で似ていると判定された前記集合の前記評価値が良い方の前記グループに属する前記分析方法のスコアを加点するスコア化ステップと、前記組合せ抽出ステップ、前記分析方法グループ化ステップ、前記問合せステップ、及び前記スコア化ステップのそれぞれの処理を繰り返し、前記スコアが所定値になる前記分析方法を選択する分析方法選択部とを行うことを要旨とする。

　また、本発明の一態様に係るプログラムは、上記のデータ分析方法選択装置としてコンピュータを機能させるためのプログラムであることを要旨とする。

　本発明によれば、ノウハウが無いような場合においても適切な分析手法を利用者のフィードバックを効かせて絞り込み、適切なデータ分析方法を選択できるデータ分析方法選択装置、方法及びプログラムを提供することができる。

本発明の実施形態に係るデータ分析方法選択装置の構成例を示す図である。ある集合の時系列データと、該時系列データを異なる分析方法で分析して求めた評価値の例を示す図である。図１に示す評価値テーブルの一例を模式的に示す図である。図１に示すスコアテーブルの一例を模式的に示す図である。図１に示す分析方法選択部の作用を説明するための図である。分析方法（１）を説明するための図である。分析方法（２）を説明するための図である。分析方法（３）を説明するための図である。分析方法（４）を説明するための図である。図１に示すデータ分析方法選択装置の処理手順を示すフローチャートである汎用的なコンピュータシステムの構成例を示すブロック図である。

　以下、本発明の実施形態について図面を用いて説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。

　図１は、本発明の実施形態に係るデータ分析方法選択装置の構成例を示す図である。図１に示すデータ分析方法選択装置１００は、適切な分析手法を利用者のフィードバックを効かせて絞り込み、適切なデータ分析方法を選択するものである。

　データ分析方法選択装置１００は、データ集合１０、分析部２０、評価値テーブル３０、組合せ抽出部４０、分析方法グループ化部５０、問合せ部６０、スコア化部７０、スコアテーブル８０、及び分析方法選択部９０を備える。データ分析方法選択装置１００は、例えば、ＲＯＭ、ＲＡＭ、ＣＰＵ等からなるコンピュータで実現することができる。その場合、各機能構成部の処理内容はプログラムによって記述される。

　データ集合１０は、２つの時系列データをそれぞれ記録した集合Ａ，Ｂ，Ｃ，Ｄ，…を複数含む。集合Ａは、例えば、切り花（バラ）と情報通信関係費のそれぞれの物価指数の推移を記録したものである。集合Ｂは、例えば、下着と授業料の物価指数の推移を記録したものである。

　分析部２０は、２つの時系列データの関係性を表す評価値を集合Ａ，Ｂ，…ごとに異なる分析方法で求める。分析方法は、例えばＤＳの頭の中にある複数の分析方法のことである。

　図２は、データ集合の時系列データと、該時系列データを異なる分析方法で分析して求めた評価値の例を示す図である。図２（ａ）は、切り花（バラ）と情報通信関係費のそれぞれの物価指数の時系列データを示す。図２（ｂ）は、例えば４つの分析方法（１）～（４）のそれぞれで分析した評価値を示す。

　評価値は、例えば集合Ａの２つの時系列データが似ていれば値が小さくなる数値である。評価値の具体的な計算方法については後述する。

　図２（ｃ）は、下着（ブラジャー）と大学授業料（国立）のそれぞれの物価指数の時系列データを示す。図２（ｄ）は、図２（ｃ）に示す２つの時系列データを分析方法（１）～（４）のそれぞれで分析した評価値を示す。

　評価値テーブル３０は、集合Ａ，Ｂ，…ごとに異なる分析方法で分析して求めた評価値のテーブルである。評価値デーブル３０は、行を集合Ａ，Ｂ，…ごと、列を分析方法ごとに記録した表である。

　図３は、評価値テーブル３０の例を示す図である。表の各行が集合Ａ，Ｂ，…に対応し、各列が分析方法に対応する。なお、図３の集合Ａ，Ｂの評価値は、説明の都合により図２の集合Ａ，Ｂと異なる。

　集合Ａの分析方法（１）の評価値は0.09、途中省略、分析方法（４）の評価値は-0.02である。分析方法は（１）～（４）の４種類に限られない。

　組合せ抽出部４０は、分析方法に対応させて評価値の変化の傾向が異なる集合の組合せを抽出する。組合せ抽出部４０は、例えば集合Ａと集合Ｂの組合せを抽出する。

　評価値の変化の傾向が異なるとは、図３の集合ＡとＢに示すように、分析方法（１）～（４）の評価値が例えば逆転している様な場合である。集合Ａは、分析方法（１）の評価値が大きく、分析方法（２）～（３）の評価値が大きい。

　一方、集合Ｂは、分析方法（１）の評価値が小さく、分析方法（２）～（３）の評価値が大きい。この例の場合、組合せ抽出部４０は、集合Ａと集合Ｂの組合せを抽出する。

　このように組合せ抽出部４０は、評価値の傾向が反対、及び評価値の差の大きな集合の組合せを抽出する。

　分析方法グループ化部５０は、組合せ抽出部４０で抽出され組合せのそれぞれについて、評価値の良否で分類方法をグループに分類し、該分類した結果を集合に対応させて記録する。評価値の良否とは、良を２つの時系列データが似ている場合の例えば小さい数値の評価値、否を２つの時系列データが似ている場合の例えば大きな数値の評価値とする。

　図３に示す集合Ａの場合は、分析方法（１）を「否」、分析方法（２）～（４）を「良」にグループ分けする。図３に示す集合Ｂの場合は、分析方法（１）を「良」、分析方法（２）～（４）を「否」にグループ分けする。

　なお、図３に示す評価値テーブルでは、分析方法の良否が陽として表されていない。良否は、例えば表のマス目に対応させた良否フラグで表わす様にしてもよい。

　問合せ部６０は、組合せ抽出部４０が抽出した組合せのそれぞれの集合の時系列データを利用者に提示し、どちらの集合の時系列データが似ているかを利用者に問い合わせる。問い合わせは、図示を省略している操作パネル等に、例えば「集合Ａと集合Ｂのどちらが似ていますか？」等を表示して行う。

　スコア化部７０は、利用者の回答で似ていると判定された集合の評価値が良い方のグループに属する分析方法のスコアを加点する。利用者の回答は、例えばタッチパネルで構成される操作パネル（図示せず）に利用者がタッチすることで行われる。

　利用者の回答は、一方の集合の時系列データが似ている、他方の集合のデータ集合が似ている、及び分からない、の何れかである。これにより利用者（人）の感性を適切に取り込むことができる。

　図２に示した例において、利用者が集合Ａの２つの時系列データの方が、集合Ｂよりも似ていると回答したと仮定する。この場合、スコア化部７０は、集合Ａの分析方法（１）にスコア１を加点する。

　図４は、スコア化部７０がスコアを加点した結果を記録したスコアテーブルの例を示す図である。図４に示す例は、集合Ａ-Ｂの組合せを７回利用者に問い合わせた場合を示す。また、集合Ｃ－Ｄの組合せを３３回利用者に問い合わせた場合を示す。なお、集合Ａ－Ｂにおいて７回の利用者は、それぞれ異なる人である。

　集合Ａは、図３に示したように分析方法（１）を「否」、分析方法（２）～（４）を「良」にグループ分けしているので、集合Ａの方が似ていると判定された場合に分析方法の（２）～（４）マス目にスコア１が加点される。

　なお、利用者は、分析方法（１）～（４）について関知しない。分析方法（１）～（４）及びそれぞれに対応する評価値は、データ分析方法選択装置１００の内部の情報であり表に出ない。複数の分析方法及びそれぞれの評価値はブラックボックス化されている。

　分析方法選択部９０は、組合せ抽出部４０、分析方法グループ化部５０、問合せ部６０、及びスコア化部７０のそれぞれの処理を繰り返し、スコアが所定値になる分析方法を選択する。

　分析方法選択部９０の作用によって、問合せ部６０は複数のデータ集合１０の組合せを利用者に提示する。利用者に提示するデータ集合１０の組合せの数ＰＮは、データ集合１０を構成する集合の数をＮとすると次式で表せる。

　例えば集合の数をＡ，Ｂ，Ｃの３つとすると、データ集合１０の組合せは、Ａ-Ｂ、Ｂ-Ｃ、Ｃ-Ａの３つである。Ｎ＝１００とするとＰＮ＝４９００である。

　図５は、Ｎ＝３とした場合の分析方法選択部９０の作用を説明するための図である。なお、集合Ａ，Ｂ，Ｃの評価値の変化の傾向は、それぞれ異なるものとして説明する。

　問合せ部６０は、最初に組合せＡ-Ｂのどちらの時系列データが似ているかを利用者に問い合わせる。例えば集合Ａの方が似ていると回答した場合、図５に示すように分析方法（２）～（３）が評価値の良いグループに分類されているので、スコア化部７０は分析方法（２）～（３）のそれぞれにスコア１を加点する。

　この場合、図４に示す集合Ａ－Ｂの行の方法（２）～（４）のそれぞれが加点され＋１になる。図４の表記は異なっている。

　次に、問合せ部６０は、組合せＢ-Ｃのどちらの時系列データが似ているかを利用者に問い合わせる。例えば集合Ｂの方が似ていると回答した場合、図５に示すように分析方法（１）（３）（４）のグループの評価値が良いので、スコア化部７０は分析方法（１）（３）（４）のそれぞれにスコア１を加点する。

　次に、問合せ部６０は、組合せＣ-Ａのどちらの時系列データが似ているかを利用者に問い合わせる。例えば集合Ｃの方が似ていると回答した場合、図５に示すように分析方法（２）（３）（４）のグループの評価値が良いので、スコア化部７０は分析方法（２）（３）（４）のそれぞれにスコア１を加点する。

　以上の処理の結果、スコアテーブルにおける各分析方法（１）～（４）のスコアは、分析方法（３）のスコアが３ポイントとなり最も多くなる。この場合、分析方法選択部９０は分析方法（３）を選択する。

　実際は、利用者に提示するデータ集合１０の組合せの数ＰＮはもっと多数であり、分析方法を選択する所定値ももっと大きな数値になる。

　以上説明したように、本実施形態に係るデータ分析方法選択装置１００は、２つの時系列データをそれぞれ記録した集合Ａ，Ｂ，…を複数含むデータ集合１０と、２つの時系列データの関係性を表す評価値を集合Ａ，Ｂ，…ごとに異なる分析方法で求める分析部２０と、分析方法に対応させて評価値の変化の傾向が異なる集合Ａ，Ｂ，…の組合せを抽出する組合せ抽出部４０と、組合せ抽出部４０で抽出された組合せ（Ａ-Ｂ等）のそれぞれについて、評価値の良否で分析方法をグループに分類し、該分類した結果を集合に対応させて記録する分析方法グループ化部５０と、組合せ抽出部４０が抽出した組合せのそれぞれの集合（Ａ-Ｂ等）の時系列データを利用者に提示し、どちらの集合Ａ，Ｂの時系列データが似ているかを利用者に問合せる問合せ部６０と、利用者の回答で似ていると判定された集合の評価値が良い方のグループに属する分析方法のスコアを加点するスコア化部７０と、組合せ抽出部４０、分析方法グループ化部５０、問合せ部６０、及びスコア化部７０のそれぞれの処理を繰り返し、スコアが所定値になる分析方法を選択する分析方法選択部９０とを備える。これにより、ノウハウが無いような場合においても適切な分析手法を利用者のフィードバックを効かせて絞り込み、適切なデータ分析方法を選択できるデータ分析方法選択装置を提供することができる。

　本実施形態は、２つの時系列データの関係に着目し、その関係性を数値化し、利用者に２つの時系列データを画像化して提示して利用者の回答をフィードバックする。その結果、複数の分析方法から人（利用者）の感覚に近い分析方法を選択することができる。したがって、利用者に専門的な知識が無くても最適な分析方法の選択を可能にする。

　つまり、本実施形態は、完全な分析方法は存在しないという前提に基づいて複数の分析方法の結果を利用者に提示し、利用者がより良い分析方法を選択するという仕組みを提供する。なお、分析方法を提示される利用者（後述する被験者）と、本実施形態に係るデータ分析方法選択装置１００を利用する利用者とは基本的には別である。データ分析方法選択装置１００を利用する人の方が多くなる。また、分析方法を提示される利用者は一人であってもよいし、複数であっても構わない。

　なお、分析方法を提示される利用者が一人の場合、スコア化部７０が加点するスコアは１である。また、データ分析方法選択装置１００を利用する利用者が変わっても、ある一組の時系列データを分析する分析方法は最適なものが一つ選択される。

　次に分析方法の具体例について説明する。

　（分析方法（１））
　図６は、分析方法（１）を説明するための図である。図６は、２つの物価指数の時系列データを示す。図６の横軸は時間、縦軸は物価指数である。

　分析方法（１）は、一点鎖線と実線で示す比較する２つの物価指数について、２つの時系列データの対応するデータの差分の累積値を、該累積したデータ数で除算する。なお、差分については符号付でもよいし、絶対値で扱ってもよい。なお、図６において破線で示すように、一方にしかデータがない場合は加算しない。

　この分析方法（１）は、比較する２つの物価指数データの数が多く、季節変動のような時間ごとの変動が少ないものに好適である。

　（分析方法（２））
　図７は、分析方法（２）を説明するための図である。図７の横軸と縦軸の関係は図６と同じである。

　分析方法（２）は、２つの時系列データのそれぞれの変化量を求め、該変化量の差分の累積値を該累積したデータ数で除算する。図７に示す時間５の差分は２－（－２）＝４である。分析方法（１）と同様に、一方にしかデータがない場合は加算しない。

　この分析方法（２）は、比較する２つの物価指数データの個数が多く、差分の絶対値は大きく且つ変動の形が似ているものに好適である。

　（分析方法（３））
　図８は、分析方法（３）を説明するための図である。図７の横軸と縦軸の関係は図６と同じである。

　分析方法（３）の計算方法は、上記の分析方法（２）と基本的に同じである。ただし、２つの時系列データの一方のデータしか無い場合は、他方の時系列データの変化量を該時系列データの変化量の平均値で補間する点である。なお、両方共にデータが無い区間については補間を行わない。

　この分析方法（３）は、分析方法（２）と比べて、比較する２つの時系列データの一方にデータの無い区間が多いものに好適である。

　（分析方法（４））
　図９は、分析方法（４）を説明するための図である。図７の横軸と縦軸の関係は図６と同じである。

　分析方法（３）の計算方法は、上記の分析方法（２）と基本的に同じである。ただし、上記の平均値は、時系列データが無くなる直前の複数の変化量の平均値である。平均するデータの個数及び平均時の重みづけについては変更してもよい。

　この分析方法（４）は、上記の分析方法（１）が不適な季節変動の大きな時系列データの比較に好適である。

　（データ分析方法選択方法）
　図１０は、本実施形態に係るデータ分析方法選択装置１００が行うデータ分析方法選択方法の処理手順を示すフローチャートである。

　データ分析方法選択装置１００は、２つの時系列データをそれぞれ記録した集合Ａ，Ｂ，…を複数含むデータ集合１０を備える。データ集合１０は予め用意される。集合…は適宜追加される。

　データ分析方法選択装置１００の分析部２０は、２つの時系列データの関係性を表す評価値を集合Ａ，Ｂ，…ごとに異なる分析方法（例えば上記の（１）～（４））で算出する（ステップＳ１）。

　組合せ抽出部４０は、分析方法に対応させて評価値の変化の傾向が異なる集合の組合せを抽出する（ステップＳ２）。集合の組合せは、例えば、Ａ-Ｂ、Ｂ-Ｃ、Ｃ-Ａ等である。

　分析方法グループ化部５０は、組合せ抽出部４０で抽出された集合の組合せのそれぞれについて、評価値の良否で分析方法をグループに分類し、該分類した結果を集合に対応させて記録する（ステップＳ３）。

　問合せ部６０は、組合せ抽出部４０が抽出した組合せのそれぞれの集合の時系列データを利用者に提示し、どちらの集合の時系列データが似ているかを利用者に問い合わせる（ステップＳ４）。

　利用者は、どちらの集合の時系列データが似ているかを回答する（ステップＳ５）。回答は、例えば操作パネル（図示せず）等を利用者がタッチすることで行う。

　スコア化部７０は、利用者の回答で似ていると判定された集合の評価値が良い方のグループに属する分析方法のスコアを加点する。例えば、集合Ａの時系列データの方が似ていると判定された場合は、スコアテーブル（図４）の集合の例えばＡ-Ｂの方法（１）にスコアを加点する（ステップＳ６）。また、集合Ｂの時系列データの方が似ていると判定された場合は、スコアテーブル（図４）の集合の例えばＡ-Ｂの方法（２）（３）（４）にスコアを加点する（ステップＳ７）。

　分析方法選択部９０は、組合せ抽出ステップ（ステップＳ２）、分析方法グループ化ステップ（ステップＳ３）、問合せステップ（ステップＳ４）、及びスコア化ステップ（ステップＳ５）のそれぞれの処理を繰り返し、スコアが所定値になる分析方法を選択する（ステプＳ８のＹＥＳ）。なお、集合が追加された場合、処理の繰り返しは分析部２０の処理（ステップＳ２）から繰り返す。

　データ分析方法選択装置１００は、図８に示す汎用的なコンピュータシステムで実現することができる。例えば、ＣＰＵ９０、メモリ９１、ストレージ９２、通信部９３、入力部９４、及び出力部９５を備える汎用的なコンピュータシテムにおいて、ＣＰＵ９０がメモリ９１上にロードされた所定のプログラムを実行することにより、データ分析方法選択装置１００の各機能が実現される。所定のプログラムは、HDD、SSD、USBメモリ、CD-ROM、DVD-ROM、MOなどのコンピュータ読取り可能な記録媒体に記録することも、ネットワークを介して配信することもできる。

　（評価実験）
　本実施形態に係るデータ分析方法選択装置１００で得られる効果を確認する目的で評価実験を行った。

　評価実験には、総省統計局が提供している消費者物価指数（品目別価格指数）から時系列データ３８０項目を使用した。３８０項目を組み合わせた約７万２千個の集合を用いて、評価値の算出方法が異なる分析方法の中から、最も適した分析方法を選択する実験を行った。

　分析方法は、上記の分析方法（１）～（４）の４つを用いた。集合の選択は、分析方法１種類につき２０回実施した。その事前評価の結果、分析方法（１）が最も被験者（利用者（人））の感覚に合うことが分かった。

　その後、被験者４人に対して、ランダムに抽出した集合の１０組について同様の評価を行った。その結果を表１に示す。

　表１に示すように、事前の評価で分析方法（１）が最も被験者に合うと判定された分析方法（１）の一致率が平均値89％と最も高く、データ分析方法選択装置１００を用いることで、比較的少ない試行回数で分析方法が選択できることが分かった。

　本実施形態によれば、２つのデータの集合の時系列データの関係性に着目し、その関係性を数値化するだけでなく、視覚化して利用者に提示し、利用者から回答を得ることで複数の分析方法の中から人の感覚に近い分析方法を選択することができる。

　つまり、ＤＳと異なりノウハウのない利用者であっても適切なデータ分析方法を選択することが可能になる。

　なお、上記の実施例では、分析方法を（１）～（４）の４種類で説明したが、本発明はこの例に限定されない。分析方法はｎ個（ｎは自然数）であってもよい。また、分析方法は上記の実施例に限定されない。また、集合Ａ，Ｂは、物価指数の時系列データを例に示したが、他の時系列データであっても構わない。

　このように本発明はここでは記載していない様々な実施形態等を含むことは勿論である。したがって、本発明の技術的範囲は上記の説明から妥当な特許請求の範囲に係る発明特定事項によってのみ定められるものである。

１０：データ集合
２０：分析部
３０：評価値テーブル
４０：組合せ抽出部
５０：分析方法グループ化部
６０：問合せ部
７０：スコア化部
８０：スコアテーブル
９０：分析方法選択部
１００：データ分析方法選択装置
Ａ，Ｂ，Ｃ，Ｄ：集合

Claims

　２つの時系列データをそれぞれ記録した集合を複数含むデータ集合と、
　前記２つの時系列データの関係性を表す評価値を前記集合ごとに異なる分析方法で求める分析部と、
　前記分析方法に対応させて前記評価値の変化の傾向が異なる前記集合の組合せを抽出する組合せ抽出部と、
　前記組合せ抽出部で抽出された前記組合せのそれぞれについて、前記評価値の良否で前記分析方法をグループに分類し、該分類した結果を前記集合に対応させて記録する分析方法グループ化部と、
　前記組合せ抽出部が抽出した前記組合せのそれぞれの前記集合の時系列データを利用者に提示し、どちらの前記集合の時系列データが似ているかを利用者に問合せる問合せ部と、
　前記利用者の回答で似ていると判定された前記集合の前記評価値が良い方の前記グループに属する前記分析方法のスコアを加点するスコア化部と、
　前記組合せ抽出部、前記分析方法グループ化部、前記問合せ部、及び前記スコア化部のそれぞれの処理を繰り返し、前記スコアが所定値になる前記分析方法を選択する分析方法選択部と
　を備えるデータ分析方法選択装置。
　前記利用者の回答は、
　一方の前記時系列データが似ている、他方の前記時系列データが似ている、及び分からない、の何れかである
　請求項１に記載のデータ分析方法選択装置。
　前記分析方法の１つは、
　前記２つの時系列データの対応するデータの差分を累積した累積値を、該累積したデータ数で除算する
　請求項１又は２に記載のデータ分析方法選択装置。
　前記分析方法の１つは、
　前記２つの時系列データのそれぞれの変化量を求め、該変化量の差分を累積した累積値を該累積したデータ数で除算する
　請求項１又は２に記載のデータ分析方法選択装置。
　前記分析方法の１つは、
　前記２つの時系列データの一方しか無い場合は、他方の前記時系列データの前記変化量を該時系列データの前記変化量の平均値で補間する
　請求項４に記載のデータ分析方法選択装置。
　前記平均値は、
　前記時系列データが無くなる直前の複数の前記変化量の平均値である
　請求項５に記載のデータ分析方法選択装置。
　分析部は、２つの時系列データの関係性を表す評価値を前記時系列データがそれぞれ記録された集合ごとに異なる分析方法で求める分析ステップと、
　組合せ抽出部は、前記分析方法に対応させて前記評価値の変化の傾向が異なる前記集合の組合せを抽出する組合せ抽出ステップと、
　分析方法グループ化部は、前記組合せ抽出ステップで抽出された前記組合せのそれぞれについて、前記評価値の良否で前記分析方法をグループに分類し、該分類した結果を前記集合に対応させて記録する分析方法グループ化ステップと、
　問合せ部は、前記組合せ抽出部が抽出した前記組合せのそれぞれの前記集合の時系列データを利用者に提示し、どちらの前記集合の時系列データが似ているかを利用者に問合せる問合せステップと、
　スコア化部は、前記利用者の回答で似ていると判定された前記集合の前記評価値が良い方の前記グループに属する前記分析方法のスコアを加点するスコア化ステップと、
　前記組合せ抽出ステップ、前記分析方法グループ化ステップ、前記問合せステップ、及び前記スコア化ステップのそれぞれの処理を繰り返し、前記スコアが所定値になる前記分析方法を選択する分析方法選択部と
　を行うデータ分析方法選択方法。
　請求項１乃至６の何れかに記載のデータ分析方法選択装置としてコンピュータを機能させるためのプログラム。