JP7444248B2

JP7444248B2 - 分析装置、分析方法および分析プログラム

Info

Publication number: JP7444248B2
Application number: JP2022524810A
Authority: JP
Inventors: 昌史小山田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2020-05-21
Filing date: 2020-05-21
Publication date: 2024-03-06
Anticipated expiration: 2040-05-21
Also published as: JPWO2021234916A1; WO2021234916A1; US20230195746A1

Description

本発明は、データの意味が与えられた場合に、その意味を持つデータを用いてどのような分析を行えるのかを分析する分析装置、分析方法および分析プログラムに関する。

特許文献１には、シーケンス分析と決定木分析を組み合わせて、精度の高い潜在ターゲットを導出できる装置が記載されている。特許文献１に記載された装置は、時系列データを入力し、また、特定属性データ出現集合特有のルールを入力する。そして、その装置は、特定属性データ出現傾向と正の相関があるルールと同一の時系列的推移を持つデータの加工、および、特定属性データ非出現傾向と負の相関があるルールと同一の時系列的推移を持つデータの加工を行う。

また、特許文献２には、データを格納したテーブルが入力された場合に、そのテーブルのカラム毎に、カラムに格納されたデータの意味を推定する技術が記載されている。ここで、「データの意味」とは、そのデータが表す概念である。各カラムにはカラム名が付与されている。しかし、一般に、カラム名は、人間によって決定されるので、カラム名には表記ゆれが生じる。例えば、人物の性別を格納したカラムのカラム名として、「種別」、「男女」等の種々のカラム名が付与され得る。前述のように、「データの意味」とは、そのデータが表す概念であり、カラム名とは区別される。上記の例では、「性別」がデータの意味に該当する。

特開２００５－７０９１３号公報国際公開第２０１８／０２５７０６号

一般に、多くのデータを持つ者がいる。このような者の例として、例えば、種々の店舗等が挙げられる。ただし、このような者は、店舗に限定されない。

このように多くのデータを持つ者は、データを持つ一方で、そのデータを用いてどのような分析を行えるかを分かっていないことが多い。

そこで、本発明は、所持されているデータを用いてどのような分析を行えるかを示す情報を導出することができる分析装置、分析方法および分析プログラムを提供することを目的とする。

本発明による分析装置は、１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段と、与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析手段と、各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールＩＤを表すノードの集合とを含む有向２部グラフを生成するグラフ生成手段とを備え、前記分析手段が、前記与えられた１つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、前記有向２部グラフにおいて、前記探索開始点から１つのエッジを介して到達する変換ルールＩＤに対応するノードを特定し、特定された前記ノードに対応する変換ルールＩＤが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定された前記ノードが当該探索開始点の全てから到達されている場合に、前記変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、前記変換後のデータの意味を表すノードを探索開始点として定めることを繰り返し、新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、前記情報として定めることを特徴とする。
また、本発明による分析装置は、１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段と、与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析手段とを備え、個々の変換ルールにそれぞれコストが予め定められていて、各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールＩＤを表すノードの集合とを含む有向２部グラフを生成するグラフ生成手段と、前記有向２部グラフにおける個々のデータの意味に対して、コストの初期値を設定するコスト初期値設定手段とを備え、前記分析手段が、前記与えられた１つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、前記有向２部グラフにおいて、前記探索開始点から１つのエッジが向かっている変換ルールＩＤに対応するノードのうち、前記探索開始点に対応するデータの意味のコストと、前記変換ルールＩＤが表す変換ルールのコストとの和が、所定のコスト上限値以下であるという条件を満たすノードのみを、前記探索開始点から１つのエッジを介して到達されるノードとして特定し、特定された前記ノードに対応する変換ルールＩＤが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定された前記ノードが当該探索開始点の全てから到達されている場合に、前記変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、前記変換後のデータの意味を表すノードを探索開始点として定めるとともに、所定の条件を満たす場合に、当該ノードに対応するデータの意味のコストを更新することを繰り返し、新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、前記情報として定めることを特徴とする。
また、本発明による分析装置は、１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段と、与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析手段とを備え、前記分析手段が、変換前のデータの意味が、前記与えられた１つ以上のデータの意味に包含されているという条件を満たす変換ルールを抽出し、抽出した各変換ルールにおける変換後のデータの意味と、前記与えられた１つ以上のデータの意味との和集合を求め、当該和集合を前記与えられた１つ以上のデータの意味とみなすことを繰り返し、抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、前記抽出した変換ルールの集合を、前記情報として定めることを特徴とする。

本発明による分析方法は、１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段を備えるコンピュータが、与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出し、前記情報を導出するときに、変換前のデータの意味が、前記与えられた１つ以上のデータの意味に包含されているという条件を満たす変換ルールを抽出し、抽出した各変換ルールにおける変換後のデータの意味と、前記与えられた１つ以上のデータの意味との和集合を求め、当該和集合を前記与えられた１つ以上のデータの意味とみなすことを繰り返し、抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、前記抽出した変換ルールの集合を、前記情報として定めることを特徴とする。

本発明による分析プログラムは、１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段を備えるコンピュータに、与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析処理を実行させ、前記分析処理で、変換前のデータの意味が、前記与えられた１つ以上のデータの意味に包含されているという条件を満たす変換ルールを抽出させ、抽出した各変換ルールにおける変換後のデータの意味と、前記与えられた１つ以上のデータの意味との和集合を求め、当該和集合を前記与えられた１つ以上のデータの意味とみなすことを繰り返させ、抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、前記抽出した変換ルールの集合を、前記情報として定めさせる。

本発明によれば、所持されているデータを用いてどのような分析を行えるかを示す情報を導出することができる。

本発明の第１の実施形態の分析装置の例を示すブロック図である。変換ルールの例を示す模式図である。第１の実施形態の処理経過の例を示すフローチャートである。本発明の第２の実施形態の分析装置の例を示すブロック図である。変換ルールの例を示す模式図である。図５に示す各変換ルールに基づいて生成された有向２部グラフの例を示す説明図である。第２の実施形態の処理経過の例を示すフローチャートである。第２の実施形態の処理経過の例を示すフローチャートである。第２の実施形態の処理経過の例を示すフローチャートである。ステップＳ１８で導出される探索ルートの例を示す模式図である。最終的に得られる探索ルートの例を示す模式図である。本発明の第３の実施形態の分析装置の例を示すブロック図である。第３の実施形態の処理経過の例を示すフローチャートである。第３の実施形態の処理経過の例を示すフローチャートである。第３の実施形態の処理経過の例を示すフローチャートである。ステップＳ３１で設定されたコストを有向２部グラフとともに示した模式図である。ステップＳ１８で導出される探索ルートの例を示す模式図である。本発明の各実施形態の分析装置に係るコンピュータの構成例を示す概略ブロック図である。本発明の分析装置の概要の例を示すブロック図である。

以下、本発明の実施形態を図面を参照して説明する。

図１は、本発明の第１の実施形態の分析装置の例を示すブロック図である。本実施形態の分析装置１は、取得部２と、意味推定部３と、意味記憶部４と、変換ルール記憶部５と、分析部６とを備える。

取得部２は、多くのデータを持つ者によって所持されているデータを取得する。本実施形態では、説明を簡単にするために、取得部２が、データを格納したテーブルを取得する場合を例にして説明する。テーブルは、１つ以上のカラムを含み、各カラムにデータが格納されている。

なお、データを持つ者によって所持されているデータには、その者が他者から購入したデータが含まれていてもよい。

取得部２は、例えば、光学ディスク等のデータ記録媒体に記録されたテーブルを読み込むデータ読み込み装置によって実現されてもよいが、取得部２は、そのようなデータ読み込み装置に限定されない。例えば、取得部２は、通信ネットワークを介して配信されるテーブルを受信する通信インタフェースによって実現されてもよい。

意味推定部３は、取得部２が取得した種々のデータ群毎に、データの意味を推定する。本実施形態では、意味推定部３が、取得部２が取得したテーブルのカラム毎に、カラムに格納されたデータの意味を推定する場合を例にして説明する。意味推定部３によって推定されるデータの意味の数は１つ以上である。取得部２がデータの意味を推定する方法は、公知の方法でよい。例えば、意味推定部３は、特許文献２に記載された方法で、カラム毎に、カラムに格納されたデータの意味を推定してもよい。意味推定部３によって推定された種々のデータの意味は、データを持つ者から与えられた「データの意味」であると言うことができる。

意味推定部３は、推定によって得た種々の「データの意味」を、意味記憶部４に記憶させる。例えば、意味推定部３が、推定によって、データの意味として、「身長」、「体重」、「年収」、「年齢」等を得た場合、それらのデータの意味を、意味記憶部４に記憶させる。

意味記憶部４は、データの意味を記憶する記憶装置である。

変換ルール記憶部５は、複数の変換ルールを記憶する記憶装置である。「変換ルール」とは、1つ以上のデータの意味を、１つ以上の別のデータの意味に変換するルールである。ここで、「1つ以上のデータの意味を、１つ以上の別のデータの意味に変換する」とは、「ある意味を持つデータに基づいて、別の意味を持つデータを計算したり、推定したりすることができる」ということを表している。また、個々の変換ルールにはそれぞれ、変換ルールＩＤ（変換ルールの識別情報）が予め定められている。

図２は、変換ルールの例を示す模式図である。図２では、３つの変換ルールを示している。例えば、図２に示す１番目の変換ルールは、「身長」というデータの意味、および、「体重」というデータの意味を、「ＢＭＩ（Body Mass Index ）」というデータの意味に変換することを表している。このことは、「身長」という意味を持つデータ、および、「体重」という意味を持つデータに基づいて、「ＢＭＩ」という意味を持つデータを計算できることを表している。また、この変換ルールには、「ＢＭＩ計算」という変換ルールＩＤが定められている。

図２に示す１番目の変換ルールでは、「身長」および「体重」が変換前の「データの意味」に該当し、「ＢＭＩ」が変換後の「データの意味」に該当する。図２に示すように矢印を用いて模式的に変換ルールを表した場合、図２に示す例では、矢印の左辺に変換前の「データの意味」が示され、矢印の右辺に変換後の「データの意味」が示されている。そのため、便宜的に、変換前のデータの意味を、左辺のデータの意味と称し、変換後のデータの意味を右辺のデータの意味と称する場合がある。

図２では、各変換ルールにおいて、左辺のデータの意味（変換前のデータの意味)が複数存在する場合を示したが、変換ルールにおいて、左辺のデータの意味の数が１つであってもよい。また、図２では、各変換ルールにおいて、右辺のデータの意味（変換後のデータの意味）の数が１つである場合を示したが、変換ルールにおいて、右辺のデータの意味が複数存在していてもよい。右辺のデータの意味が複数存在するということは、左辺のデータの意味に基づいて、複数種類のデータが得られることを意味している。

また、以下の説明において、変換ルールＩＤを“r ”と表した場合に、左辺に該当する全てのデータの意味を、“r.input_semantics ”と表す場合がある。同様に、右辺に該当する全てのデータの意味を、“r.output_semantics”と表す場合がある。例えば、図２に示す１番目の変換ルールでは、“ＢＭＩ計算.input_semantics”は、｛「身長」、「体重」｝であり、“ＢＭＩ計算.output_semantics ”は、｛「ＢＭＩ」｝である。

各変換ルールは、例えば、分析処理のサービスを提供する者や、データを販売する者等によって提供され、予め変換ルール記憶部５に記憶される。

分析部６は、意味推定部３によって得られたデータの意味と、各変換ルールとに基づいて、その意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する。本実施形態では、分析部６は、この情報として、意味推定部３によって得られたデータの意味を起点にして再帰的に抽出した変換ルールの集合を導出する。

前述のように、意味推定部３によって推定された種々のデータの意味は、データを持つ者から与えられた「データの意味」であると言うことができる。そのため、以下、意味推定部３によって推定されたデータの意味を、与えられたデータの意味と記す場合がある。

分析部６は、左辺のデータの意味（変換前のデータの意味）が、与えられたデータの意味に包含されているという条件を満たす変換ルールを抽出する。そして、分析部６は、抽出した各変換ルールにおける右辺のデータの意味（変換後のデータの意味）と、与えられたデータの意味との和集合を求め、その和集合を、与えられたデータの意味とみなす。分析部６は、この動作を繰り返す。

そして、分析部６は、新たに抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、その新たに抽出した変換ルールの集合を、どのような分析を行えるかを示す情報として定める。

意味推定部３および分析部６は、例えば、分析プログラムに従って動作するコンピュータのＣＰＵ（Central Processing Unit ）によって実現される。例えば、ＣＰＵが、コンピュータのプログラム記憶装置等のプログラム記録媒体から分析プログラムを読み込み、その分析プログラムに従って、意味推定部３および分析部６として動作すればよい。

意味記憶部４および変換ルール記憶部５は、例えば、コンピュータが備える記憶装置によって実現される。

次に、第１の実施形態の処理経過について説明する。図３は、第１の実施形態の処理経過の例を示すフローチャートである。なお、取得部２がデータ（テーブル）を取得しているものとする。また、説明を簡単にするために、変換ルール記憶部５が、図２に示す３つの変換ルールを記憶しているものとする。また、既に説明した事項については、詳細な説明を省略する。

まず、意味推定部３が、取得部２が取得したデータの意味を推定する（ステップＳ１）。意味推定部３は、テーブルのカラム毎に、カラムに格納されたデータの意味を推定する。ステップＳ１では、１つ以上のデータの意味が得られる。本例では、データの意味として、「身長」、「体重」、「年収」、「年齢」が得られたものとする。以下、ステップＳ１で得られたデータの意味を、与えられたデータの意味と記す。意味推定部３は、与えられたデータの意味（「身長」、「体重」、「年収」、「年齢」）を、意味記憶部４に記憶させる。

ステップＳ１の後に、分析部６は、左辺のデータの意味（変換前のデータの意味）が、与えられたデータの意味に包含されているという条件を満たす変換ルールを全て抽出する（ステップＳ２）。本例では、与えられたデータの意味は、｛「身長」、「体重」、「年収」、「年齢」｝である。また、図２に示す変換ルール「ＢＭＩ計算」の左辺のデータの意味は、｛「身長」、「体重」｝である。従って、変換ルール「ＢＭＩ計算」の左辺のデータの意味は、与えられたデータの意味に包含されている。従って、変換ルール「ＢＭＩ計算」は、上記の条件を満たしているので、分析部６は、変換ルール「ＢＭＩ計算」を抽出する。

また、図２に示す変換ルール「年齢推定」に関しては、「性別」が、与えられたデータの意味に包含されていない。同様に、変換ルール「癌リスク予測」に関しては、「ＢＭＩ」が、与えられたデータの意味に包含されていない。よって、変換ルール「年齢推定」および変換ルール「癌リスク予測」は、抽出されない。

ステップＳ２の次に、分析部６は、直近のステップＳ２で抽出した変換ルールと、前回のステップＳ２で抽出した変換ルールとが同一であるか否かを判定する（ステップＳ３）。両者が同一でない場合（ステップＳ３のＮｏ）、ステップＳ４に移行する。両者が同一である場合（ステップＳ３のＹｅｓ）、ステップＳ５に移行する。最初にステップＳ３に移行した時点では、ステップＳ２は１回しか実行されていないため、ステップＳ４に移行する。従って、ここでは、ステップＳ４に移行する。

ステップＳ４において、分析部６は、抽出した各変換ルールの右辺のデータの意味（変換後のデータの意味）と、与えられたデータの意味との和集合を求め、その和集合を、与えられたデータの意味とみなす。そして、分析部６は、与えられたデータの意味を、意味記憶部４に記憶させる。

本例では、抽出した変換ルール「ＢＭＩ計算」の右辺のデータの意味は、｛「ＢＭＩ」｝である。従って、分析部６は、｛「ＢＭＩ」｝と、与えられたデータの意味｛「身長」、「体重」、「年収」、「年齢」｝との和集合として、｛「身長」、「体重」、「年収」、「年齢」、「ＢＭＩ」｝を求める。そして、分析部６は、その和集合｛「身長」、「体重」、「年収」、「年齢」、「ＢＭＩ」｝を、与えられたデータの意味とみなす。さらに、分析部６は、｛「身長」、「体重」、「年収」、「年齢」、「ＢＭＩ」｝を意味記憶部４に記憶させる。

ステップＳ４の後、分析部６は、ステップＳ２以降の処理を繰り返す。２回目のステップＳ２において、与えられたデータの意味は、｛「身長」、「体重」、「年収」、「年齢」、「ＢＭＩ」｝となっている。従って、このとき、分析部６は、変換ルール「ＢＭＩ計算」、および、変換ルール「癌リスク予測」を抽出する（図２参照）。

次に、分析部６は、再度、ステップＳ３を実行する。このとき、直近のステップＳ２で抽出した変換ルールは、変換ルール「ＢＭＩ計算」、および、変換ルール「癌リスク予測」である。また、前回のステップＳ２で抽出した変換ルールは、変換ルール「ＢＭＩ計算」のみである。従って、両者は同一ではないので（ステップＳ３のＮｏ）、ステップＳ４に移行する。

直近のステップＳ２で、抽出した２つの変換ルールの右辺の意味は、それぞれ、「ＢＭＩ」、「癌リスク」である。従って、ステップＳ４において、分析部６は、｛「ＢＭＩ」、「癌リスク」｝と、与えられたデータの意味｛「身長」、「体重」、「年収」、「年齢」、「ＢＭＩ」｝の和集合として、｛「身長」、「体重」、「年収」、「年齢」、「ＢＭＩ」、「癌リスク」｝を求める。そして、分析部６は、その和集合｛「身長」、「体重」、「年収」、「年齢」、「ＢＭＩ」、「癌リスク」｝を、与えられたデータの意味とみなす（ステップＳ４）。さらに、分析部６は、｛「身長」、「体重」、「年収」、「年齢」、「ＢＭＩ」、「癌リスク」｝を意味記憶部４に記憶させる。

ステップＳ４の後、分析部６は、３回目のステップＳ２を実行する。このとき、与えられたデータの意味は、｛「身長」、「体重」、「年収」、「年齢」、「ＢＭＩ」、「癌リスク」｝となっている。従って、このとき、分析部６は、変換ルール「ＢＭＩ計算」、および、変換ルール「癌リスク予測」を抽出する（図２参照）。

次に、分析部６は、再度、ステップＳ３を実行する。このとき、直近のステップＳ２で抽出した変換ルールは、変換ルール「ＢＭＩ計算」、および、変換ルール「癌リスク予測」である。また、前回のステップＳ２で抽出した変換ルールも、変換ルール「ＢＭＩ計算」、および、変換ルール「癌リスク予測」である。従って、両者は同一であるので（ステップＳ３のＹｅｓ）、ステップＳ５に移行する。

ステップＳ５において、分析部６は、直近のステップＳ２で抽出した変換ルールの集合を、どのような分析を行えるかを示す情報として定め、その情報を出力する（ステップＳ５）。本例では、分析部６は、変換ルール「ＢＭＩ計算」、および、変換ルール「癌リスク予測」からなる変換ルールの集合を、どのような分析を行えるかを示す情報として定める。

また、ステップＳ５では、分析部６は、例えば、分析装置１に設けられたディスプレイ装置（図示略）に、情報を表示させてもよい。ただし、表示は、出力態様の一例であり、分析部６は、他の態様で情報を出力してもよい。この点は、後述の他の実施形態でも同様である。

第１の実施形態では、分析部６が、ステップＳ２で、左辺のデータの意味が、与えられたデータの意味に包含されているという条件を満たす変換ルールを全て抽出する。すなわち、ステップＳ２で抽出される変換ルールは、与えられた意味を持つデータを用いて行える分析を表しているということができる。さらに、第１の実施形態では、ステップＳ４で和集合を求め、その和集合を、与えられたデータの意味とみなすことによって、与えられたデータの意味の数を増加させる。この結果、ステップＳ２～Ｓ４の繰り返し処理において、繰り返し回数が増えるほど、ステップＳ２で抽出される変換ルールも増加する。ステップＳ２で抽出される変換ルールが変化しなくなるまで、分析部６は、ステップＳ２～Ｓ４の繰り返し処理を実行するので、与えられた意味を持つデータを用いて行える分析を表す変換ルールをできるだけ多く抽出することができる。従って、本実施形態によれば、ユーザに所持されているデータを用いてどのような分析を行えるかを提示することができる。

実施形態２．
図４は、本発明の第２の実施形態の分析装置の例を示すブロック図である。本実施形態の分析装置１は、取得部２と、意味推定部３と、意味記憶部４と、変換ルール記憶部５と、グラフ生成部７と、グラフ記憶部８と、分析部２６とを備える。

第２の実施形態における取得部２、意味推定部３、意味記憶部４および変換ルール記憶部５は、第１の実施形態における取得部２、意味推定部３、意味記憶部４および変換ルール記憶部５と同様であり、説明を省略する。

グラフ生成部７は、予め変換ルール記憶部５に記憶されている各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールＩＤを表すノードの集合とを含む有向２部グラフを生成する。第２の実施形態では、変換ルール記憶部５が、図５に例示する６個の変換ルールを記憶している場合を例にして説明する。また、図６は、図５に示す各変換ルールに基づいて生成された有向２部グラフの例を示す説明図である。

グラフ生成部７が有向２部グラフを生成する動作の例を以下に示す。ただし、グラフ生成部７は、有向２部グラフを他の方法で生成してもよい。

グラフ生成部７は、変換ルール記憶部５に記憶されている各変換ルールのうち、未選択の変換ルールを１つ選択する。グラフ生成部７は、選択した変換ルールの左辺のデータの意味を表すノード、および、右辺のデータの意味を表すノードを生成し、それらのノードを第１のノードの集合に含める。また、グラフ生成部７は、選択した変換ルールの変換ルールＩＤを表すノードを生成し、第２のノードの集合に含める。第１のノードの集合は、データの意味に対応するノードの集合であり、第２のノードの集合は、変換ルールＩＤに対応するノードの集合である。そして、グラフ生成部７は、選択した変換ルールの左辺のデータの意味に対応する各ノードそれぞれから、選択した変換ルールの変換ルールＩＤに対応するノードに向かうエッジを生成する。さらに、グラフ生成部７は、選択した変換ルールの変換ルールＩＤに対応するノードから、選択した変換ルールの右辺のデータの意味に対応する各ノードそれぞれに向かうエッジを生成する。

例えば、図５に示す変換ルール「ＢＭＩ計算」が選択されたとする。この場合、グラフ生成部７は、「身長」に対応するノード、「体重」に対応するノード、および「ＢＭＩ」に対応するノードを生成し、それらのノードを第１の集合に含める。また、グラフ生成部７は、「ＢＭＩ計算」に対応するノードを生成し、第２の集合に含める。そして、グラフ生成部７は、「身長」に対応するノード、および、「体重」に対応するノードそれぞれから、「ＢＭＩ計算」に対応するノードに向かうエッジを生成する。さらに、グラフ生成部７は、「ＢＭＩ計算」に対応するノードから、「ＢＭＩ」に対応するノードに向かうエッジを生成する。

グラフ生成部７は、未選択の変換ルールが無くなるまで、変換ルールを１つずつ選択し、上記の処理を実行する。ただし、新たに生成しようとするデータの意味に対応するノードが、既に生成されている場合には、グラフ生成部７は、そのノードを重複して生成しなくてもよい。例えば、変換ルール「ＢＭＩ計算」を選択した後に、変換ルール「癌リスク予測」を選択して上記の処理を実行する場合を考える。変換ルール「癌リスク予測」を選択する場合、グラフ生成部７は、データの意味に対応するノードとして、「ＢＭＩ」に対応するノード、「年齢」に対応するノード、および、「癌リスク」に対応するノードを生成することになるが、「ＢＭＩ」に対応するノードは、既に生成済みである。従って、この場合、グラフ生成部７は、「ＢＭＩ」に対応するノードを重複して生成しなくてよい。

このようにして生成された有向２部グラフの例を図６に示す。図６では、データの意味に対応するノードから変換ルールＩＤに対応するノードに向かうエッジを実線で示している。また、変換ルールＩＤに対応するノードからデータの意味に対応するノードに向かうエッジを破線で示している。換言すれば、第１の集合内のノードから第２の集合内のノードに向かうエッジを実線で示し、第２の集合内のノードから第１の集合内のノードに向かうエッジを破線で示している。

グラフ生成部７は、生成した有向２部グラフをグラフ記憶部８に記憶させる。グラフ記憶部８は、生成された有向２部グラフを記憶する記憶装置である。

分析部２６は、与えられたデータの意味に対応する各ノードをそれぞれ探索開始点と定める。

その後、分析部２６は、以下の処理を繰り返す。

分析部２６は、有向２部グラフにおいて、探索開始点から１つのエッジを介して到達する変換ルールＩＤに対応するノードを特定する。

そして、分析部２６は、特定されたノードに対応する変換ルールＩＤが表す変換ルールの左辺の「データの意味」に対応する各ノードが全て探索開始点であり、特定されたノードがそれらの探索開始点の全てから到達されている場合に、それらの探索開始点から、その変換ルールの右辺のデータの意味を表すノードまでの探索ルートを導出する。

そして、分析部２６は、上述の右辺のデータの意味を表すノードを探索開始点として定める。

分析部２６は、新たな探索ルートを導出できなくなった時点までに導出された探索ルートを、どのような分析を行えるかを示す情報として定める。

グラフ生成部７および分析部２６は、例えば、例えば、分析プログラムに従って動作するコンピュータのＣＰＵによって実現される。また、グラフ記憶部８は、例えば、コンピュータが備える記憶装置によって実現される。

次に、第２の実施形態の処理経過について説明する。図７、図８および図９は、第２の実施形態の処理経過の例を示すフローチャートである。ただし、既に説明した事項については、詳細な説明を省略する。

なお、変換ルール記憶部５は、予め図５に例示する各変換ルールを記憶しているものとする。また、グラフ生成部７は、その各変換ルールに基づいて、図６に例示する有向２部グラフを既に生成しており、その有向２部グラフをグラフ記憶部８に記憶させているものとする。また、取得部２がデータ（テーブル）を取得しているものとする。

まず、意味推定部３が、取得部２が取得したデータの意味を推定する（ステップＳ１１）。意味推定部３は、テーブルのカラム毎に、カラムに格納されたデータの意味を推定する。ステップＳ１１では、１つ以上のデータの意味が得られる。以下、ステップＳ１１で得られたデータの意味を、与えられたデータの意味と記す。本例では、与えられたデータの意味が、｛「身長」、「体重」、「年収」、「年齢」｝であるものとする。

次に、分析部２６は、予め生成されている有向２部グラフにおいて、与えられたデータの意味に対応する各ノードをそれぞれ探索開始点と定める（ステップＳ１２）。このノードは、有向２部グラフの第１の集合に属している。また、分析部２６は、探索開始点に対応するデータの意味を、意味記憶部４に記憶させる。探索開始点の数は１つとは限らない。

本例では、「身長」、「体重」、「年収」、「年齢」に対応するそれぞれのノードを、探索開始点とする。

次に、分析部２６は、有向２部グラフにおいて、各探索開始点からエッジが向かっている第２の集合内のノードを特定する（ステップＳ１３）。ステップＳ１３で特定されるノードの数は、１つとは限らない。また、ステップＳ１３で特定されたノードは、探索開始点から１つのエッジを介して到達するノードであると言える。

本例では、「身長」、「体重」、「年収」、「年齢」に対応するそれぞれのノードが探索開始点であるので、ステップＳ１３では、「ＢＭＩ計算」、「年齢推定」、「癌リスク予測」、「年収推定」、「保険金算出」に対応するノードが特定される。

次に、分析部２６は、ステップＳ１３で特定されたノードが全てステップＳ１５で選択済みであるか否かを判定する（ステップＳ１４）。

ステップＳ１３で特定されたノードのうち、ステップＳ１５で選択されていないノードが残っているならば（ステップＳ１４のＮｏ）、ステップＳ１５に移行する。

ステップＳ１５において、分析部２６は、ステップＳ１３で特定されたノードのうち、未選択のノードを１つ選択する。

次に、分析部２６は、ステップＳ１５で選択されたノードに対応する変換ルールＩＤを持つ変換ルールに、そのノードに到達する各探索開始点それぞれに対応するデータの意味を付加する（ステップＳ１６）。変換ルールＩＤを“r ”と表した場合に、その変換ルールＩＤに対応するノードに到達する探索開始点におけるデータの意味を、“r.visited_semantics ”と表すこととする。選択されたノードに対応する変換ルールＩＤを“r ”とすると、ステップＳ１６で、分析部２６は、“r.visited_semantics ”に、具体的なデータの意味を付加する。

ステップＳ１６の次に、分析部２６は、ステップＳ１５で選択されたノードに対応する変換ルールＩＤを持つ変換ルールの左辺の「データの意味」と、ステップＳ１６でその変換ルールに付加された「データの意味」の集合とが合致するか否かを判定する（ステップＳ１７）。選択されたノードに対応する変換ルールＩＤを“r ”とすると、ステップＳ１７で、分析部２６は、“r.input_semantics ”と、“r.visited_semantics ”に付加された「データの意味」の集合とが合致しているか否かを判定すればよい。

ステップＳ１７で合致すると判定されたということは（ステップＳ１７のＹｅｓ）、選択されたノードに対応する変換ルールＩＤを持つ変換ルールにおける変換前の「データの意味」に対応する各ノードが全て探索開始点であり、選択されたノードが、その探索開始点の全てから到達されていることを意味する。

ステップＳ１７で合致しないと判定された場合（ステップＳ１７のＮｏ）、分析部２６は、ステップＳ１４（図７参照）以降の処理を繰り返す。

ステップＳ１７で合致すると判定された場合（ステップＳ１７のＹｅｓ）、分析部２６は、ステップＳ１５で選択されたノードに対応する変換ルールＩＤを持つ変換ルールの左辺のデータの意味を表す各探索開始点から、選択されたノードを経由して、その変換ルールの右辺のデータの意味を表すノードに行き着くまでの探索ルートを、新たな探索ルートとして導出する。そして、分析部２６は、その探索ルートをグラフ記憶部８に記憶させる（ステップＳ１８）。ただし、既に導出済みの探索ルートと同じ探索ルートについては、分析部２６は、重複してグラフ記憶部８に記憶させなくてよい。

図１０は、ステップＳ１８で導出される探索ルートの例を示す模式図である。

ステップＳ１８の次に、分析部２６は、ステップＳ１８で導出された探索ルートの終点に該当するノードを、探索開始点として定める（ステップＳ１９）。すなわち、ステップＳ１９において、既存の探索開始点に、新たな探索開始点が追加されることになる。例えば、ステップＳ１８で図１０に例示する探索ルートを導出した場合、分析部２６は、その探索ルートの終点に該当する、「ＢＭＩ」というデータの意味を表すノードを、新たな探索開始点として、既存の探索開始点に追加する。分析部２６は、ステップＳ１９で定めた探索開始点（換言すれば、新たに追加された探索開始点）に対応するデータの意味を、意味記憶部４に記憶させる。

ステップＳ１９の後、分析部２６は、ステップＳ１４（図７参照）以降の処理を繰り返す。

ステップＳ１４に移行し、ステップＳ１３で特定されたノードが全てステップＳ１５で選択済みであると判定した場合（ステップＳ１４のＹｅｓ）、ステップ２０（図９参照）に移行する。

ステップＳ２０において、分析部２６は、ステップＳ１３で特定された全てのノードのうちの一部のノードに関して、ステップＳ１８で既存の探索ルートとは異なる新たな探索ルートが導出されたか否かを判定する（ステップＳ２０）。

ステップＳ１３で特定された全てのノードのうちの一部のノードに関して、ステップＳ１８で新たな探索ルートが導出されていたならば（ステップＳ２０のＹｅｓ）、分析部２６は、ステップＳ１３（図７参照）以降の処理を繰り返す。

ステップＳ１３で特定されたいずれのノードに関しても、ステップＳ１８で新たな探索ルートが導出されていないならば（ステップＳ２０のＮｏ）、分析部２６は、その時点で得られている探索ルートを、どのような分析を行えるかを示す情報として定め、その情報を出力する（ステップＳ２１）。ステップＳ２１で処理を終了する。

図１１は、本例で最終的に得られる探索ルートの例を示す模式図である。

第２の実施形態によれば、図１１に示すように、与えられたデータの意味に対応するノードに基づく探索ルートが得られる。そして、その探索ルート上には、変換ルールＩＤに対応するノードが含まれている。従って、第１の実施形態と同様に、ユーザに所持されているデータを用いてどのような分析を行えるかを提示することができる。さらに、第２の実施形態では、どのような分析を行えるかを示す情報が、探索ルートの形式で導出されるので、どのような分析を行えるかだけでなく、どのような手順で分析を行うかという分析手順も提示することができる。例えば、図１１に例示する探索ルートが提示された場合、ユーザは、ＢＭＩ計算を行い、その後、癌リスク予測を行うことによって、「癌リスク」が得られるということを理解できる。

なお、図１１では、終点が「癌リスク」のみであるような探索ルートを示しているが、探索ルートが枝分かれしていき、終点が複数存在する探索ルートが得られてもよい。そのような探索ルートは、複数種類の分析を行うことができるということを表し、また、それらの分析毎に得られるデータの意味を表している。この点は、後述の第３の実施形態でも同様である。

実施形態３．
図１２は、本発明の第３の実施形態の分析装置の例を示すブロック図である。本実施形態の分析装置１は、取得部２と、意味推定部３と、意味記憶部４と、変換ルール記憶部５と、グラフ生成部７と、グラフ記憶部８と、コスト初期値設定部３１と、コスト記憶部３２と、分析部３６とを備える。

第３の実施形態では、有向２部グラフの第１の集合に属する個々のノードに対応する個々の「データの意味」にコストが設定される。また、各変換ルールにも予めコストが定められている。また、データを与えるユーザ（データを持つ者）には、コスト上限（以下、max_costと記す。）が予め定められている。max_coxtは、利用可能な変換ルール（換言すれば、利用可能な分析処理）に対する予算の上限を表していると言うことができる。また、max_costは、所定のコスト上限値と称することもできる。

以下、「データの意味」を“s_i”と表し、そのデータの意味のコストを“s_i.cost ”と表す場合がある。また、ある変換ルールの変換ルールＩＤを“r ”と表し、その変換ルールのコストを“r.cost”と表す場合がある。

第３の実施形態における取得部２、意味推定部３、意味記憶部４および変換ルール記憶部５は、第１の実施形態や第２の実施形態における取得部２、意味推定部３、意味記憶部４および変換ルール記憶部５と同様であり、説明を省略する。ただし、本実施形態では、変換ルール記憶部５に記憶されている個々の変換ルールには、予め個別にコストが定められている。

また、第３の実施形態におけるグラフ生成部７およびグラフ記憶部８は、第２の実施形態におけるグラフ生成部７およびグラフ記憶部８と同様であり、説明を省略する。

コスト初期値設定部３１は、有向２部グラフの第１の集合に属する個々のノードに対応する個々のデータの意味に対して、コストの初期値を設定する。このとき、コスト初期値設定部３１は、与えられたデータの意味（換言すれば、意味推定部３によって推定されたデータの意味）のコストをそれぞれ“０”に設定し、残りのデータの意味のコストを無限大に設定する。

コスト記憶部３２は、データの意味毎に、データの意味とコストとの組み合わせを記憶する記憶装置である。

分析部３６は、データの意味のコスト、各変換ルールに予め定められたコスト、および、max_costに基づいて、探索開始点からの探索ルートを導出する。

具体的には、分析部３６は、与えられたデータの意味に対応する各ノードをそれぞれ探索開始点と定める。

その後、分析部３６は、以下の処理を繰り返す。

分析部３６は、有向２部グラフにおいて、探索開始点から１つのエッジが向かっている変換ルールＩＤに対応する各ノードのうち、その探索開始点に対応するデータの意味のコストと、変換ルールＩＤが表す変換ルールのコストとの和が、max_cost以下であるという条件を満たしているノードのみを、その探索開始点から１つのエッジを介して到達されるノードとして特定する。従って、第３の実施形態では、探索開始点に対応するデータの意味のコスト（s_i.cost ）と、変換ルールのコスト（r.cost）との和がmax_cost以下であるという条件を満たしている場合にのみ、その変換ルールの変換ルールＩＤに対応するノードが、その探索開始点から１つのエッジを介して到達されるノードとして特定される。

そして、分析部３６は、特定されたノードに対応する変換ルールＩＤが表す変換ルールの左辺の「データの意味」に対応する各ノードが全て探索開始点であり、特定されたノードがそれらの探索開始点の全てから到達されている場合に、それらの探索開始点から、その変換ルールの右辺のデータの意味を表すノードまでの探索ルートを導出する。

そして、分析部３６は、上述の右辺のデータの意味を表すノードを探索開始点として定める。このとき、分析部３６は、所定の条件が満たされている場合に、その探索開始点に対応するデータの意味のコストを更新する。所定の条件とは、導出された探索ルート上の最後の変換ルールＩＤが表す変換ルールのコストと、その変換ルールＩＤに対応するノードに到達する全ての探索開始点に対応する各データの意味のコストの総和との和が、新たに定められた探索開始点に対応するデータの意味のコスト以下であるという条件である。この条件が満たされている場合、分析部３６は、新たに定められた探索開始点に対応するデータの意味のコストを、上記の和の値で更新する。また、この条件が満たされていない場合、分析部３６は、新たに定められた探索開始点に対応するデータの意味のコストを更新しない。

分析部３６は、新たな探索ルートを導出できなくなった時点までに導出された探索ルートを、どのような分析を行えるかを示す情報として定める。

コスト初期値設定部３１および分析部３６は、例えば、分析プログラムに従って動作するコンピュータのＣＰＵによって実現される。また、コスト記憶部３２は、例えば、コンピュータが備える記憶装置によって実現される。

次に、第３の実施形態の処理経過について説明する。図１３、図１４および図１５は、第３の実施形態の処理経過の例を示すフローチャートである。ただし、既に説明した事項については、詳細な説明を省略する。また、第２の実施形態と同様の処理についても、図７、図８および図９と同一のステップ番号を付し、詳細な説明を省略する。

なお、変換ルール記憶部５は、図５に例示する各変換ルールを予め記憶しているものとする。ただし、変換ルール「ＢＭＩ計算」、「年齢推定」、「癌リスク予測」、「年収推定」、「保険金算出」および「性別判定」にはそれぞれ、コストとして、“５”，“１０”，“２０”，“２０”，“１２”および“９”が予め定められているものとする。また、max_costの値も予め定められているものとする。

また、グラフ生成部７は、その各変換ルールに基づいて、図６に例示する有向２部グラフを既に生成しており、その有向２部グラフをグラフ記憶部８に記憶させているものとする。また、取得部２がデータ（テーブル）を取得しているものとする。

まず、意味推定部３が、取得部２が取得したデータの意味を推定する（ステップＳ１１）。以下、ステップＳ１１で得られたデータの意味を、与えられたデータの意味と記す。本例では、与えられたデータの意味が、｛「身長」、「体重」、「年収」、「年齢」｝であるものとする。

第３の実施形態では、ステップＳ１１の次に、コスト初期値設定部３１が、有向２部グラフの第１の集合に属する個々のノードに対応する個々のデータの意味のコストの初期値を設定する（ステップＳ３１）。具体的には、コスト初期値設定部３１は、与えられたデータの意味｛「身長」、「体重」、「年収」、「年齢」｝のコストをそれぞれ０に設定し、残りのデータの意味のコストを無限大に設定する。図１６は、ステップＳ３１で設定されたコストを有向２部グラフとともに示した模式図である。図１６では、予め定められている変換ルールのコストも図示している。

なお、ステップＳ３１において、コスト初期値設定部３１は、データの意味毎に、データの意味とコストとの組み合わせをコスト記憶部３２に記憶させる。

ステップＳ３１の次に、分析部３６は、有向２部グラフにおいて、与えられたデータの意味に対応する各ノードをそれぞれ探索開始点と定める（ステップＳ１２）。本例では、「身長」、「体重」、「年収」、「年齢」に対応するそれぞれのノードを、探索開始点とする。

次に、分析部３６は、探索開始点から１つのエッジが向かっている変換ルールＩＤに対応する各ノードのうち、その探索開始点に対応するデータの意味のコストと、変換ルールＩＤが表す変換ルールのコストとの和が、max_cost以下であるという条件を満たしているノードのみを、その探索開始点から１つのエッジを介して到達されるノードとして特定する（ステップＳ３２）。

例えば、「身長」と「ＢＭＩ計算」とに着目して説明する。「身長」に対応するノードは探索開始点である。また、「身長」のコストは“０”であり、変換ルール「ＢＭＩ計算」のコストは“５”である（図１６参照）。換言すれば。“身長.cost ＝０”、“ＢＭＩ計算.cost ＝５”である。従って、「“身長.cost”＋“ＢＭＩ計算.cost”」の値がmax_cost以下であるならば、「ＢＭＩ計算」に対応するノードは、「身長」に対応する探索開始点から１つのエッジを介して到達されるノードとして特定される。一方、「“身長.cost”＋“ＢＭＩ計算.cost”」の値がmax_costよりも大きいならば、「ＢＭＩ計算」に対応するノードは、「身長」に対応する探索開始点から１つのエッジを介して到達されるノードとして特定されない。

また、ステップＳ３２において、探索開始点から１つのエッジを介して到達されるノードが１つも特定されない場合には、その時点で得られている探索ルートを、どのような分析を行えるかを示す情報として定め、その情報を出力し、処理を終了する。

ステップＳ３２の次に、分析部３６は、ステップＳ１４以降の処理を行う。ステップＳ１４～Ｓ１９の動作は、第２の実施形態におけるステップＳ１４～Ｓ１９の動作と同様であり、説明を省略する。ただし、分析部３６は、ステップ１４において、ステップＳ３２で特定されたノードが全てステップＳ１５で選択済みであるか否かを判定する。また、分析部３６は、ステップＳ１５において、ステップＳ３２で特定されたノードのうち、未選択のノードを１つ選択する。

ステップＳ１９の後、分析部３６は、ステップＳ１８で導出された探索ルート上の最後の変換ルールＩＤが表す変換ルールのコストと、その変換ルールＩＤに対応するノードに到達する全ての探索開始点に対応する各データの意味のコストの総和との和が、ステップＳ１９で新たに定められた探索開始点に対応するデータの意味のコスト以下であるという条件を満たすか否かを判定する。その条件が満たされているならば、新たに定められた探索開始点に対応するデータの意味のコストを、上記の和の値で更新する。その条件が満たされていないならば、新たに定められた探索開始点に対応するデータの意味のコストを更新しない（ステップＳ３３）。

例えば、ステップＳ１８において、図１７に示す探索ルートが導出されたとする。この場合、探索ルート上の最後の変換ルールＩＤは「ＢＭＩ計算」であり、変換ルール「ＢＭＩ計算」のコストは“５”である。また、「ＢＭＩ計算」に対応するノードに到達する全ての探索開始点は、「身長」に対応する探索開始点、および、「体重」に対応する探索開始点である。そして、「身長」のコスト、および、「体重」のコストはいずれも“０”であるので、それらの総和も“０”である。従って、変換ルール「ＢＭＩ計算」のコスト “５”と、上記の総和“０”との和は“５”である。

また、図１７に示す探索ルートでは、「ＢＭＩ」に対応する探索開始点が、新たに定められた探索開始点である。そして、「ＢＭＩ」のコストは無限大である。従って、上記の和“５”は、「ＢＭＩ」のコスト“無限大”以下であるので、ステップＳ３３における条件は満たされている。従って、分析部３６は、「ＢＭＩ」のコストを“無限大”から、上記の和“５”に更新する。

仮に、「ＢＭＩ」のコストが“４”であるとすると、ステップＳ３３における条件は満たされないことになる。この場合、分析部３６は、「ＢＭＩ」のコストを更新せず、“４”のままとする。

分析部３６は、データの意味のコストを更新する場合、コスト記憶部３２に記憶されているデータの意味のコストを更新すればよい。

ステップＳ３３の後、分析部３６は、ステップＳ１４（図１３参照）以降の処理を繰り返す。

また、ステップＳ２０，Ｓ２１は、第２の実施形態におけるステップＳ２０，Ｓ２１と同様であり、説明を省略する。ただし、ステップＳ２０において、分析部３６は、ステップＳ３２で特定された全てのノードのうちの一部のノードに関して、ステップＳ１８で既存の探索ルートとは異なる新たな探索ルートが導出されたか否かを判定する

第３の実施形態においても、第２の実施形態と同様の効果が得られる。さらに、第３の実施形態では、max_costの値に応じて、得られる探索ルートの長さが異なる。すなわち、第３の実施形態では、max_costの値に応じた長さの探索ルートが得られる。このことは、例えば、データを持つ者の予算の範囲内で行える分析を提示できるということを意味している。

上記の例において、例えば、max_costが“２”であるならば、探索ルートは得られずに処理が終了する。また、上記の例において、例えば、max_costが“１５”であるならば、図１０に示す探索ルートが導出され、処理が終了する。また、上記の例において、例えば、max_costが“３０”であるならば、図１１に示す探索ルートが導出され、処理が終了する。このように、第３の実施形態では、max_costの値に応じた長さの探索ルートが得られる。

また、第２の実施形態で説明したように、探索ルートが枝分かれしていき、終点が複数存在する探索ルートが得られてもよい。

また、第２の実施形態や第３の実施形態において、データを持つ者が分析によって得たいと考えているデータがあるならば、そのデータの意味が指定されてもよい。そして、第２の実施形態の分析部２６や第３の実施形態の分析部３６は、探索ルートが枝分かれしていき終点が複数存在する探索ルートを得た後、指定された「データの位置」を終点とする探索ルートのみを抽出し、その探索ルートを出力してもよい。

次に、各実施形態の変形例について説明する。本発明の各実施形態において、分析装置１に、意味推定部３が設けられていなくてもよい。その場合、取得部２は、ユーザに所持されているデータの意味を直接取得してもよい。すなわち、取得部２が、１つ以上の「データの意味」を直接外部から取得してよい。この場合、その「データの意味」を、上記の各実施形態における「与えられたデータの意味」として扱えばよい。

図１８は、本発明の各実施形態の分析装置１に係るコンピュータの構成例を示す概略ブロック図である。例えば、コンピュータ１０００は、ＣＰＵ１００１と、主記憶装置１００２と、補助記憶装置１００３と、インタフェース１００４と、データ（テーブル）を読み込むデータ読み込み装置１００５とを備える。

本発明の各実施形態の分析装置１は、コンピュータ１０００によって実現される。分析装置１の動作は、プログラム（分析プログラム）の形式で補助記憶装置１００３に記憶されている。ＣＰＵ１００１は、プログラムを補助記憶装置１００３から読み出し、そのプログラムを主記憶装置１００２に展開し、そのプログラムに従って、上記の各実施形態で説明した処理を実行する。

補助記憶装置１００３は、一時的でない有形の媒体の例である。一時的でない有形の媒体の他の例として、インタフェース１００４を介して接続される磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory ）、ＤＶＤ－ＲＯＭ（Digital Versatile Disk Read Only Memory ）、半導体メモリ等が挙げられる。また、プログラムが通信回線によってコンピュータ１０００に配信される場合、配信を受けたコンピュータ１０００がそのプログラムを主記憶装置１００２に展開し、そのプログラムに従って上記の各実施形態で説明した処理を実行してもよい。

また、各構成要素の一部または全部は、汎用または専用の回路（circuitry ）、プロセッサ等やこれらの組合せによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組合せによって実現されてもよい。

各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

次に、本発明の概要について説明する。図１９は、本発明の分析装置の概要の例を示すブロック図である。本発明の分析装置は、変換ルール記憶手段７５と、分析手段７６とを備える。

変換ルール記憶手段７５（例えば、変換ルール記憶部５）は、１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する。

分析手段７６（例えば、分析部６、分析部２６または分析部３６）は、与えられた１つ以上のデータの意味と、変換ルールとに基づいて、その意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する。

そのような構成によって、所持されているデータを用いてどのような分析を行えるかを示す情報を導出することができる。

また、各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールＩＤを表すノードの集合とを含む有向２部グラフを生成するグラフ生成手段（例えば、グラフ生成部７）を備え、
分析手段７６（例えば、分析部２６）が、
与えられた１つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、
有向２部グラフにおいて、探索開始点から１つのエッジを介して到達する変換ルールＩＤに対応するノードを特定し、
特定されたノードに対応する変換ルールＩＤが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定されたノードが当該探索開始点の全てから到達されている場合に、その変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、
その変換後のデータの意味を表すノードを探索開始点として定めること
を繰り返し、
新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、上記の情報として定める
構成であってもよい。

また、個々の変換ルールにそれぞれコストが予め定められていて、
各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールＩＤを表すノードの集合とを含む有向２部グラフを生成するグラフ生成手段（例えば、グラフ生成部７）と、
有向２部グラフにおける個々のデータの意味に対して、コストの初期値を設定するコスト初期値設定手段（例えば、コスト初期値設定部３１）とを備え、
分析手段７６（例えば、分析部３６）が、
与えられた１つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、
有向２部グラフにおいて、探索開始点から１つのエッジが向かっている変換ルールＩＤに対応するノードのうち、その探索開始点に対応するデータの意味のコストと、変換ルールＩＤが表す変換ルールのコストとの和が、所定のコスト上限値以下であるという条件を満たすノードのみを、その探索開始点から１つのエッジを介して到達されるノードとして特定し、
特定されたノードに対応する変換ルールＩＤが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定されたノードが当該探索開始点の全てから到達されている場合に、その変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、
その変換後のデータの意味を表すノードを探索開始点として定めるとともに、所定の条件を満たす場合に、当該ノードに対応するデータの意味のコストを更新すること
を繰り返し、
新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、上記の情報として定める
構成であってもよい。

また、コスト初期値設定手段が、
与えられた１つ以上のデータの意味のコストをそれぞれ０に設定し、残りのデータの意味のコストを無限大に設定し、
分析手段７６（例えば、分析部３６）が、
導出された探索ルート上の最後の変換ルールＩＤが表す変換ルールのコストと、その変換ルールＩＤに対応するノードに到達する全ての探索開始点に対応する各データの意味のコストの総和との和が、その変換ルールにおける変換後のデータの意味のコスト以下である場合に、当該データの意味のコストを、上記の和で更新する
構成であってもよい。

また、分析手段７６（例えば、分析部６）が、
変換前のデータの意味が、与えられた１つ以上のデータの意味に包含されているという条件を満たす変換ルールを抽出し、
抽出した各変換ルールにおける変換後のデータの意味と、与えられた１つ以上のデータの意味との和集合を求め、当該和集合を与えられた１つ以上のデータの意味とみなすことを繰り返し、
抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、その抽出した変換ルールの集合を、上記の情報として定める
構成であってもよい。

また、データが与えられた場合に、当該データの意味を推定する意味推定手段（例えば、意味推定部３）を備える構成であってもよい。

以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

産業上の利用の可能性

本発明は、データの意味が与えられた場合に、その意味を持つデータを用いてどのような分析を行えるのかを分析する分析装置に好適に適用可能である。

１分析装置
２取得部
３意味推定部
４意味記憶部
５変換ルール記憶部
６，２６，３６分析部
７グラフ生成部
８グラフ記憶部
３１コスト初期値設定部
３２コスト記憶部

Claims

１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段と、
与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析手段と、
各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールＩＤを表すノードの集合とを含む有向２部グラフを生成するグラフ生成手段とを備え、
前記分析手段は、
前記与えられた１つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、
前記有向２部グラフにおいて、前記探索開始点から１つのエッジを介して到達する変換ルールＩＤに対応するノードを特定し、
特定された前記ノードに対応する変換ルールＩＤが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定された前記ノードが当該探索開始点の全てから到達されている場合に、前記変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、
前記変換後のデータの意味を表すノードを探索開始点として定めること
を繰り返し、
新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、前記情報として定める
ことを特徴とする分析装置。
１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段と、
与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析手段とを備え、
個々の変換ルールにそれぞれコストが予め定められていて、
各変換ルールに基づいて、データの意味を表すノードの集合と、変換ルールＩＤを表すノードの集合とを含む有向２部グラフを生成するグラフ生成手段と、
前記有向２部グラフにおける個々のデータの意味に対して、コストの初期値を設定するコスト初期値設定手段とを備え、
前記分析手段は、
前記与えられた１つ以上のデータの意味に対応する各ノードを探索開始点と定めた後に、
前記有向２部グラフにおいて、前記探索開始点から１つのエッジが向かっている変換ルールＩＤに対応するノードのうち、前記探索開始点に対応するデータの意味のコストと、前記変換ルールＩＤが表す変換ルールのコストとの和が、所定のコスト上限値以下であるという条件を満たすノードのみを、前記探索開始点から１つのエッジを介して到達されるノードとして特定し、
特定された前記ノードに対応する変換ルールＩＤが表す変換ルールにおける変換前のデータの意味に対応する各ノードが全て探索開始点であり、特定された前記ノードが当該探索開始点の全てから到達されている場合に、前記変換ルールにおける変換後のデータの意味を表すノードまでの探索ルートを導出し、
前記変換後のデータの意味を表すノードを探索開始点として定めるとともに、所定の条件を満たす場合に、当該ノードに対応するデータの意味のコストを更新すること
を繰り返し、
新たな探索ルートが導出できなくなった時点までに導出された探索ルートを、前記情報として定める
ことを特徴とする分析装置。
前記コスト初期値設定手段は、
前記与えられた１つ以上のデータの意味のコストをそれぞれ０に設定し、残りのデータの意味のコストを無限大に設定し、
前記分析手段は、
導出された探索ルート上の最後の変換ルールＩＤが表す変換ルールのコストと、前記変換ルールＩＤに対応するノードに到達する全ての探索開始点に対応する各データの意味のコストの総和との和が、前記変換ルールにおける変換後のデータの意味のコスト以下である場合に、当該データの意味のコストを、前記和で更新する
請求項２に記載の分析装置。
１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段と、
与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析手段とを備え、
前記分析手段は、
変換前のデータの意味が、前記与えられた１つ以上のデータの意味に包含されているという条件を満たす変換ルールを抽出し、
抽出した各変換ルールにおける変換後のデータの意味と、前記与えられた１つ以上のデータの意味との和集合を求め、当該和集合を前記与えられた１つ以上のデータの意味とみなすことを繰り返し、
抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、前記抽出した変換ルールの集合を、前記情報として定める
ことを特徴とする分析装置。
データが与えられた場合に、当該データの意味を推定する意味推定手段を備える
請求項１から請求項４のうちのいずれか１項に記載の分析装置。
１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段を備えるコンピュータが、
与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出し、
前記情報を導出するときに、
変換前のデータの意味が、前記与えられた１つ以上のデータの意味に包含されているという条件を満たす変換ルールを抽出し、
抽出した各変換ルールにおける変換後のデータの意味と、前記与えられた１つ以上のデータの意味との和集合を求め、当該和集合を前記与えられた１つ以上のデータの意味とみなすことを繰り返し、
抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、前記抽出した変換ルールの集合を、前記情報として定める
ことを特徴とする分析方法。
１つ以上のデータの意味を、１つ以上の別のデータの意味に変換する変換ルールを複数個記憶する変換ルール記憶手段を備えるコンピュータに、
与えられた１つ以上のデータの意味と、前記変換ルールとに基づいて、前記意味を持つデータを用いてどのような分析を行えるかを示す情報を導出する分析処理を実行させ、
前記分析処理で、
変換前のデータの意味が、前記与えられた１つ以上のデータの意味に包含されているという条件を満たす変換ルールを抽出させ、
抽出した各変換ルールにおける変換後のデータの意味と、前記与えられた１つ以上のデータの意味との和集合を求め、当該和集合を前記与えられた１つ以上のデータの意味とみなすことを繰り返させ、
抽出した変換ルールと、前回抽出した変換ルールとが同一になったならば、前記抽出した変換ルールの集合を、前記情報として定めさせる
ための分析プログラム。