JPWO2023037399A5

JPWO2023037399A5 -

Info

Publication number: JPWO2023037399A5
Application number: JP2023546585A
Authority: JP
Filing date: 2021-09-07
Publication date: 2024-05-13

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。

データ分析作業においては、「仮説設定、分析・可視化、仮説検証」のサイクルを回すことが一般的であるが、その作業は非常に時間と労力を要するものである。インサイト自動発見技術は、人が有益と考える可視化候補をデータの特徴に基づいて自動的に発見する技術である。これによって、データ分析作業における作業負荷を大幅に低減することが可能である。例えば、下記の特許文献１には、データの分析結果を可視化する方法を表現したキーワードを有するテンプレートデータに基づいて、可視化対象データを可視化したインスタンスデータを生成し、インスタンスデータをインスタンスメタデータの評価値に基づいて再生成する方法が記載されている。

国際公開第２０１８／１７３２５１号

しかしながら、ユーザの求めるデータの可視化結果は、データの内容及びユーザのニーズ等により様々であり、画一的に定まるものではない。特許文献１に記載の技術では、テンプレートデータがユーザコンテキストを捉えていない場合には、提示された可視化候補が必ずしもユーザの求める可視化結果とは限らない、という問題があった。

本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的の一例は、ユーザの求めるインサイトを与える情報を表示する技術を提供することである。

本発明の一側面に係る情報処理装置は、評価用データセット及びコンテキストデータを取得する取得手段と、前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出する関連度算出手段と、前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う評価手段と、前記インサイトサブジェクトに関連する情報を表示する表示手段とを備える。

本発明の一側面に係る情報処理方法は、少なくとも１つのプロセッサが、評価用データセット及びコンテキストデータを取得すること、前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出すること、前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行うこと、及び前記インサイトサブジェクトに関連する情報を表示することを含む。

本発明の一側面に係るプログラムは、コンピュータに、評価用データセット及びコンテキストデータを取得する処理と、前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出する処理と、前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う処理と、前記インサイトサブジェクトに関連する情報を表示する処理とを実行させる。

本発明の一態様によれば、ユーザの求めるインサイトを与える情報を表示することができる。

本発明の例示的実施形態１に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態１に係る情報処理方法の流れを示すフロー図である。本発明の例示的実施形態２に係る情報処理装置の構成を示すブロック図である。本発明の例示的実施形態２に係る情報処理方法の流れを示すフロー図である。本発明の例示的実施形態２に係る入力データの例を示す図である。本発明の例示的実施形態２に係るコンテキストの生成例を示す図である。本発明の例示的実施形態２に係るコンテキストと入力データとの関連度の計算方法の例を示す図である。本発明の例示的実施形態２に係るコンテキストと入力データとの関連度の計算方法の例を示す図である。本発明の例示的実施形態２に係る評価処理の例を示す図である。本発明の例示的実施形態２に係る可視化結果の表示例を示す図である。本発明の例示的実施形態２に係るインサイトサブジェクトを評価結果と共に表示する例を示す図である。本発明の例示的実施形態２に係る可視化情報を評価結果と共に表示する例を示す図である。本発明の例示的実施形態２に係るインサイトサブジェクトを評価結果と共に表示する例を示す図である。本発明の例示的実施形態２に係る特徴ベクトルの生成例を示す図である。本発明の例示的実施形態２に係る集計データ及び統計量の例を示す図である。本発明の例示的実施形態２に係る評価モデルの例を示す図である。本発明の例示的実施形態３に係る情報処理装置の構成を示すブロック図である。上記情報処理装置の各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータの一例を示す図である。

〔例示的実施形態１〕
本発明の第１の例示的実施形態について、図面を参照して詳細に説明する。本例示的実施形態は、後述する例示的実施形態の基本となる形態である。

＜情報処理装置の構成＞
本例示的実施形態に係る情報処理装置１の構成について、図１を参照して説明する。図１は、情報処理装置１の構成を示すブロック図である。情報処理装置１は、データを可視化して表示する装置である。図示のように、情報処理装置１は、取得部１１、関連度算出部１２、評価部１３及び表示部１４を備える。取得部１１は、評価用データセット及びコンテキストデータを取得する。関連度算出部１２は、コンテキストデータと評価用データセットの構成要素との関連度を算出する。評価部１３は、評価用データセットと関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う。表示部１４は、インサイトサブジェクトに関連する情報を表示する。

（評価用データセット）
評価用データセットは、データの可視化候補を情報処理装置１が評価するために用いるデータである。評価用データセットは、可視化の対象のデータである評価用データ、及び、当該評価用データに関連する関連データ、の少なくともいずれか一方を含む。ただし、評価用データセットに含まれるデータは上述した例に限られず、評価用データセットは他の情報を含んでいてもよい。

（評価用データ）
評価用データは、可視化の対象のデータであり、一例として、複数のレコードを含む多次元データである。評価用データは一例として、ある店舗の月間の売上記録を示すデータ、店舗の規模及びエリアを示すデータ、店舗で販売されている商品の商品コード、商品名及び単価を示すデータ、及び／又は、顧客の性別、年齢、居住地、職業等を示すデータを含む。ただし、評価用データはこれに限られず、他のデータであってもよい。評価用データは、一例として、評価用データの内容を表すチャート（円グラフ、棒グラフ、線グラフ、等）として可視化される。

（関連データ）
関連データは、評価用データに関連するデータである。関連データは、一例として、評価用データの集計結果を示す集計データ、集計データの統計量、及び／又は、評価用データの可視化に利用される各種情報の集合である関連情報を含む。関連情報は、一例として、評価用データの可視化に利用されるデータの名前、データ型、集計方法の種別、及びチャートデザインの種別、の一部又は全部を含む。なお、関連データに含まれるデータは上述した例に限られず、関連データは他のデータを含んでいてもよい。

（コンテキストデータ）
コンテキストデータは、ユーザがどのようなインサイトを求めるかを表すデータである。コンテキストデータは、一例として、ユーザが求めるインサイトに関するデータであるコンテキスト、及び、コンテキストをベクトル空間で表した特徴ベクトル、の少なくともいずれか一方を含む。なお、コンテキストデータに含まれるデータは上述した例に限られず、コンテキストデータは他のデータを含んでいてもよい。

（コンテキスト）
コンテキストは、ユーザが求めるインサイトに関するデータであり、一例として、ユーザクエリ又はメタデータから抽出される言語情報である。具体的には例えば、コンテキストは、「商品Ａの顧客について」というユーザクエリから抽出される「商品Ａ」及び「顧客」という単語である。また、他の例として、コンテキストは例えば、「売上推移について」というユーザクエリから抽出される「売上」及び「推移」という単語である。また、コンテキストは例えば、「検索履歴」が「商品Ａの顧客」であるメタデータから抽出される「商品Ａ」及び「顧客」という単語である。また、コンテキストは例えば、「検索履歴」が「売上推移」であるメタデータから抽出される「売上」及び「推移」という単語である。ただし、コンテキストは言語情報に限られず、他の情報であってもよい。コンテキストは例えば、ユーザの位置を示す位置情報、単語間の関連度を表す情報、又はサイトの閲覧履歴を示す情報であってもよい。

（関連度）
コンテキストデータと評価用データセットの構成要素との関連度は、コンテキストデータと評価用データセットの構成要素との関連の度合いを示す情報である。関連度は一例として、コンテキストである文字列と評価用データセットに含まれる構成要素である文字列との類似度であってもよい。文字列の類似度としては例えば、ハミング距離、レーベンシュタイン距離、ジャロ・ウィンクラー距離が用いられてもよい。また、関連度は一例として、文字列の意味的な類似度を表す情報であっても良い。文字列の意味的な類似度としては例えば、文字列の意味表現をベクトル空間で表した際のユークリッド距離、内積、コサイン類似度などを用いてもよい。また、関連度は一例として、文字列の共起度を表す情報であってもよい。文字列の共起度としては例えば、文字列の共起関係をベクトル空間で表した際のユークリッド距離、内積、コサイン類似度などを用いてもよい。また、関連度は一例として、コンテキストに対応するデータパターンと、評価用データセットの構成要素のデータパターンとの類似度を表す情報であってもよい。

（インサイトサブジェクト）
インサイトサブジェクトは、評価用データセットと関連度とを参照して生成されたデータである。インサイトサブジェクトは、一例として、評価用データの可視化結果を表すデータ、及び、評価用データを可視化するために用いられるデータ、の少なくともいずれか一方を含む。評価用データを可視化した可視化結果は、例えば評価用データの内容を表すチャート（円グラフ、棒グラフ、線グラフ、等）である。また、インサイトサブジェクトは、一例として、上述した関連データの一部、例えば関連データに含まれる関連情報であってもよい。換言すると、インサイトサブジェクトは、評価用データセットの一部であってもよい。ただし、インサイトサブジェクトは上述した例に限られず、他のデータであってもよい。

（インサイト）
また、本明細書において、インサイトとは、人が有益と認識する可視化結果、及び、そのような可視化結果を表すデータ、のことをいう。換言すれば、インサイトとは、人が有益と認識するインサイトサブジェクトのことをいう。

取得部１１が評価用データセット及びコンテキストデータを取得する方法は特に限定されない。例えば、取得部１１は、外部の記憶装置又は内部の記憶装置から評価用データセット及びコンテキストデータを読み出すことにより取得してもよく、また、通信ＩＦ又は入出力ＩＦを介して評価用データセット及びコンテキストデータを取得してもよい。

関連度算出部１２が関連度を算出する手法は特に限定されない。関連度算出部１２は一例として、コンテキストである文字列と評価用データセットに含まれる構成要素である文字列との類似の度合いを表す関連度を算出する。関連度算出部１２は一例として、コンテキストである文字列と評価用データセットに含まれる構成要素である文字列との意味的な類似度合いを表す関連度を算出してもよい。関連度算出部１２は一例として、コンテキストである文字列と評価用データセットに含まれる構成要素である文字列との共起度合いを表す関連度を算出してもよい。また、関連度算出部１２は一例として、コンテキストデータに対応するデータパターンと、評価用データセットの構成要素のデータパターンとの類似の度合いを表す関連度を算出してもよい。

また、評価部１３が複数のインサイトサブジェクトを評価する手法は特に限定されない。評価部１３は、一例として、複数のインサイトサブジェクトのそれぞれについて、ユーザが求めるインサイトを与えるかの評価結果である評価値を算出する。以下では、この評価値をインサイトスコアともいう。インサイトスコアは、そのまま出力してもユーザが求めるインサイトを与えるインサイトサブジェクトを発見する大きな助けとなる。また、インサイトスコアを用いることにより、インサイトスコアが高い、すなわちユーザが求めるインサイトを与える可能性が高いインサイトサブジェクトを自動で検出することも可能になる。

評価部１３は一例として、関連データとコンテキストデータとが入力され、評価値を出力する評価モデルを用いて、複数のインサイトサブジェクトに対して評価を行う。評価モデルは、予め規定されたスコア関数であってもよく、また、機械学習により構築された学習済モデルであってもよい。スコア関数を用いる場合、評価部１３は一例として、関連データとコンテキストデータとの関連性が高いほど、高い評価値を出力するスコア関数を用いて、複数のインサイトサブジェクトに対して評価を行う。ただし、評価部１３が行う評価の手法はこれらに限られず、他の手法が用いられてもよい。

評価用データを可視化した可視化結果は、可視化に利用される関連情報等の内容によってそれぞれ異なる。評価用データを複数の異なるパターンで可視化した複数の可視化結果のそれぞれを、以下では「可視化候補」ともいう。評価用データの複数の可視化候補がユーザに与える視覚的な特徴は、複数の可視化候補のそれぞれで異なる。

インサイトサブジェクトは、評価用データの可視化候補と１対１で対応する。そのため、評価部１３が複数のインサイトサブジェクトに対してコンテキストデータに応じた評価を行うことにより、複数の可視化候補に対してコンテキストデータに応じた評価が行われる。

表示部１４が表示するインサイトサブジェクトに関する情報の表示態様は特に限定されない。表示部１４は一例として、評価部１３による評価が相対的に高いインサイトサブジェクトを、評価が相対的に低いインサイトサブジェクトよりも優先的に表示してもよい。また、表示部１４は一例として、関連データに含まれる関連情報と、評価部１３による評価結果とを対応付けて表示してもよい。

以上のように、本例示的実施形態に係る情報処理装置１においては、評価用データセット及びコンテキストデータを取得する取得部１１と、コンテキストデータと評価用データセットの構成要素との関連度を算出する関連度算出部１２と、評価用データセットと関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う評価部１３と、インサイトサブジェクトに関連する情報を表示する表示部１４と、を備える構成が採用されている。このため、本例示的実施形態に係る情報処理装置１によれば、ユーザの求めるインサイトを与える情報を表示することが可能になる、という効果が得られる。

上述の情報処理装置１の機能は、プログラムによって実現することもできる。本例示的実施形態に係るプログラムは、コンピュータに、評価用データセット及びコンテキストデータを取得する処理と、コンテキストデータと評価用データセットの構成要素との関連度を算出する処理と、評価用データセットと関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う処理と、インサイトサブジェクトに関連する情報を表示する処理とを実行させる。したがって、本例示的実施形態に係るプログラムによれば、ユーザの求めるインサイトを与える情報を表示することが可能になる、という効果が得られる。

＜情報処理方法の流れ＞
本例示的実施形態に係る情報処理方法Ｓ１の流れについて、図２を参照して説明する。図２は、情報処理方法Ｓ１の流れを示すフロー図である。

ステップＳ１１では、少なくとも１つのプロセッサが、評価用データセット及びコンテキストデータを取得する。そして、ステップＳ１２では、少なくとも１つのプロセッサが、コンテキストデータと評価用データセットの構成要素との関連度を算出する。ステップＳ１３では、少なくとも１つのプロセッサが、評価用データセットと関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う。ステップＳ１４では、少なくとも１つのプロセッサが、インサイトサブジェクトに関連する情報を表示する。これにより、図２の情報処理方法Ｓ１は終了する。

なお、１つのプロセッサにＳ１１～Ｓ１４の処理を実行させてもよいし、Ｓ１１～Ｓ１４の処理を複数のプロセッサに分担させて実行させてもよい。後者の場合、各プロセッサは、１つの情報処理装置が備えているものであってもよいし、それぞれ異なる情報処理装置が備えているものであってもよい。また、Ｓ１１～Ｓ１４の処理を実行する少なくとも１つのプロセッサは、情報処理装置１が備えているものであってもよい。

以上のように、本例示的実施形態に係る情報処理方法Ｓ１においては、少なくとも１つのプロセッサが、評価用データセット及びコンテキストデータを取得すること、コンテキストデータと評価用データセットの構成要素との関連度を算出すること、評価用データセットと関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行うこと、及びインサイトサブジェクトに関連する情報を表示することを含む、という構成が採用されている。このため、本例示的実施形態に係る情報処理方法Ｓ１によれば、ユーザの求めるインサイトを与える情報を表示することが可能になる、という効果が得られる。

〔例示的実施形態２〕
本発明の第２の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態１にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付し、その説明を適宜省略する。

＜情報処理装置の構成＞
図３は、情報処理装置１Ａの構成を示すブロック図である。情報処理装置１Ａは、情報処理装置１Ａの各部を統括して制御する制御部１０Ａと、情報処理装置１Ａが使用する各種データを記憶する記憶部１７とを備える。また、情報処理装置１Ａは、情報処理装置１Ａが他の装置と通信するための通信部１８、情報処理装置１Ａがデータを表示出力するための表示部１９、及び情報処理装置１Ａに対する入力を受け付ける入力部２０を備える。以下では、表示部１９がデータを表示出力する例を説明するが、情報処理装置１Ａは、例えば印字出力や音声出力等の態様でデータを出力してもよい。また、表示部１９と入力部２０とは、情報処理装置１Ａに外付けされた、情報処理装置１Ａの外部の機器であってもよい。

制御部１０Ａは、取得部１１、関連度算出部１２、評価部１３、表示部１４、第１の生成部１５－１、及び第２の生成部１５－２を含む。また、記憶部１７には、評価用データセットＤＳ、コンテキストデータＣＤ、評価モデルパラメータＥＭＰ、評価結果ＥＲ、及び表示用データＤＤが記憶される。

（評価用データセットＤＳ）
評価用データセットＤＳには、評価用データと、当該評価用データに関連する関連データＶＤとが含まれている。評価用データは、可視化の対象であるデータであり、一例として、ある店舗の月間の売上記録を示すデータ、店舗の規模及びエリアを示すデータ、店舗で販売されている商品の商品コード、商品名及び単価を示すデータ、及び／又は、顧客の性別、年齢、居住地、職業等を示すデータである。

（関連データＶＤ）
関連データＶＤは、評価用データに関連するデータである。関連データＶＤには、
・評価用データに関連する関連情報Ｖ
・関連情報Ｖをベクトル空間で表した特徴ベクトルｄ^Ｖ
・評価用データに含まれるデータであって関連情報Ｖに対応するデータを集計して得られる集計データｓ^Ｖ、及び、
・集計データｓ^Ｖの統計量ｔ^Ｖ
の少なくともいずれかが含まれる。

（関連情報Ｖ）
関連情報Ｖは、一例として、評価用データの可視化に利用される各種情報の集合であり、例えば以下の情報を含む。
・評価用データに含まれる各データの属性情報
・集計方法（フィルタ、集計関数、集計のキーとなる列名、等）に関する情報（評価用データに対して適用するフィルタに関する情報、等）
・チャートデザイン（ｘ軸、ｙ軸、チャートタイプ、プロットタイプ、等）に関する情報（チャートの各軸と項目との関係に関する情報、等）

（特徴ベクトルｄ^Ｖ）
関連情報の特徴ベクトルｄ^Ｖは、関連情報Ｖをベクトル空間で表現したものである。ベクトル化の方法は任意であるが、例えば単語の分散表現などを用いてもよい。

（集計データｓ^Ｖ）
集計データｓ^Ｖは、評価用データから関連情報Ｖに対応する数値を集計したデータである。集計データｓ^Ｖは、関連情報Ｖの可視化結果としてチャートにプロットされる。

（統計量ｔ^Ｖ）
集計データｓ^Ｖの統計量ｔ^Ｖは、集計データｓ^Ｖについての各種統計量を並べたものである。利用する統計量は任意であるが、例えば以下のものが統計量ｔ^Ｖとして利用可能である。
・最大値、最小値、中央値
・平均値、標準偏差、分散
・カーディナリティ
・ゼロ値の割合、欠損値の割合
・尖度、歪度
・エントロピー
・ジニ係数

（コンテキストデータＣＤ）
コンテキストデータＣＤには、
・コンテキストＣ、及び、
・コンテキストをベクトル空間で表した特徴ベクトルｄ^Ｃ
の少なくとも何れかが含まれる。

（コンテキストＣ）
コンテキストＣは、ユーザが求めるインサイトに関するデータである。コンテキストＣは、一例として、ユーザが求めるインサイトを自然言語で表すデータであり、ユーザが求めるインサイトの質及び量に関するデータを含む。コンテキストＣは、後述のユーザクエリＱ及び／又はメタデータＭから抽出されてもよい。コンテキストＣは一例として、「商品Ａ」及び「顧客」という単語を含む。

（特徴ベクトルｄ^Ｃ）
コンテキストＣの特徴ベクトルｄ^Ｃは、コンテキストＣをベクトル空間で表したものである。ベクトル化の方法は任意であるが、一例として、単語の分散表現などを用いてもよい。

（ユーザクエリＱ）
ユーザクエリＱは、ユーザが求めるインサイトに関するクエリであり、ユーザによって自然言語で与えられる。ユーザクエリＱは、例えば以下の情報を含む。
・分析対象とするデータについての情報（例：「商品Ａ」、「売上」）
・インサイトに対する仮説（例：「～が増加している」、「～が突出している」）
・想定するチャートの特徴（例：地域別集計、円グラフ）

（メタデータＭ）
メタデータＭは、ユーザの求めるインサイトが推定できる情報である。メタデータＭは、一例として、所定のシステムにより自動的に収集される。メタデータＭは、例えば以下の情報を含む。
・ユーザの検索履歴（例：「商品Ａ、顧客」で検索している）
・ユーザの分析履歴（例：商品Ａの顧客分析を過去に実施）
・ユーザの評価履歴（例：商品Ａの顧客についてのチャート等を高く評価していた）
・ユーザの行動履歴（例：商品Ａのサイト又は販売店舗をｘｘ分滞在していた）

（評価モデルパラメータＥＭＰ）
評価モデルパラメータＥＭＰは、評価モデルｆを規定するパラメータである。評価モデルｆは、関連データＶＤ及びコンテキストデータＣＤを入力とし、入力された関連データＶＤに対応するインサイトサブジェクトを定量的に評価するモデルである。評価モデルｆとしては、インサイトサブジェクトの評価結果の推定に利用できるものであれば任意のモデルが利用可能である。例えば、後述するようなルールベースのモデル、又は、機械学習により構築されたモデル等が評価モデルｆとして利用可能である。評価モデルｆの出力は、一例として、評価結果を表すスコア、又は、ラベル確率である。評価モデルｆについては後述する。

（評価結果ＥＲ）
評価結果ＥＲは、評価部１３によるインサイトサブジェクトの評価結果を示すデータである。評価結果ＥＲは、一例として、複数のインサイトサブジェクトのそれぞれについての評価結果を表すインサイトスコアｙ＾である。

（インサイトスコアｙ＾）
インサイトスコアｙ＾は、評価モデルｆの出力値に基づいて計算される可視化のよさの定量的指標である。インサイトスコアｙ＾は例えば、評価モデルｆの出力値であってもよく、また、評価モデルｆの出力値に正規化及び／又は重み付け等の処理を加えた値であってもよい。インサイトスコアｙ＾の算出方法の具体例については後述する。

（表示用データＤＤ）
表示用データＤＤは、表示部１４が表示する、インサイトサブジェクトに関する情報である。表示用データＤＤは一例として、コンテキストＣと関連するインサイトオブジェクトを表す情報である。また、表示用データＤＤは一例として、インサイトオブジェクトの評価結果ＥＲを含んでもよい。

（取得部１１）
取得部１１は、評価用データセットＤＳ及びコンテキストデータＣＤを取得する。取得部１１は、一例として、評価用データセットＤＳ及びコンテキストデータＣＤを記憶部１７から読み出すことにより取得する。ただし、評価用データセットＤＳ及びコンテキストデータＣＤの取得方法は特に限定されない。例えば、取得部１１は、情報処理装置１Ａのユーザが入力部２０を介して入力した評価用データセットＤＳ及びコンテキストデータＣＤを取得してもよい。また、例えば、取得部１１は、通信部１８を介した通信により、外部の装置から評価用データセットＤＳ及びコンテキストデータＣＤを取得してもよい。

（関連度算出部１２・評価部１３）
関連度算出部１２は、コンテキストデータと評価用データセットの構成要素との関連度を算出する。評価部１３は、評価用データと関連度とを参照して生成された複数のインサイトサブジェクトに対して評価を行う。評価部１３は、一例として、複数のインサイトサブジェクトのそれぞれについてインサイトスコアｙ＾を算出し、その算出結果を示す評価結果ＥＲを生成して記憶部１７に記憶させる。

（表示部１４）
表示部１４は、第１の生成部１５－１が生成する表示用データＤＤを用いて、インサイトサブジェクトに関する情報を表示部１９に表示する。

（第１の生成部１５－１）
第１の生成部１５－１は、評価用データセットと関連度とを参照して、複数のインサイトサブジェクトを生成する。インサイトサブジェクトの生成処理については後述する。また、第１の生成部１５－１は、表示用データＤＤを生成する。第１の生成部１５－１は一例として、関連度算出部１２が算出した関連度に基づき、コンテキストＣと関連するインサイトサブジェクトを列挙した表示用データＤＤを生成する。

（第２の生成部１５－２）
第２の生成部１５－２は、参照情報を参照して、コンテキストデータを生成する。参照情報は例えば、ユーザクエリ又はメタデータである。また、第２の生成部１５－２は、評価用データセットＤＳを生成する。

＜情報処理方法の流れ＞
本例示的実施形態に係る情報処理方法の流れについて、図面を参照して説明する。図４は、情報処理方法の流れを示すフロー図である。以下では、関連情報Ｖが評価用データの可視化に利用される可視化情報である場合について説明する。以下では、関連情報Ｖの一例である可視化情報を「可視化情報Ｖ」ともいう。

（ステップＳ１０１）
ステップＳ１０１では、取得部１１が、入力データＤ及びコンテキスト生成用データを取得する。入力データＤは、本明細書に係る評価用データの一例である。入力データＤは、チャートにプロットされるデータを含んでいればよく、入力データＤのフォーマットとしては任意のフォーマットが利用可能である。取得部１１は一例として、入力部２０又は通信部１８を介して入力データＤを取得する。

図５は、入力データＤの例を示す図である。図５の例では、入力データＤは、売上データ、店舗データ、商品データ、及び顧客データを含む。売上データ、店舗データ、商品データ及び顧客データは、何れも複数のレコードを含む多次元データのデータセットである。売上データは、「日付」、「商品コード」、「顧客コード」、「店舗コード」、及び「売上」のデータ項目を含む多次元データである。店舗データは、「店舗コード」、「店舗名」、「エリア」、及び「規模」のデータ項目を含む多次元データである。商品データは、「商品コード」、「商品名」、「分類」、及び「単価」のデータ項目を含む多次元データである。顧客データは、「顧客コード」、「年齢」、「性別」、「居住地」、「職業」、及び「収入」のデータ項目を含む多次元データである。

（コンテキスト生成用データ）
コンテキスト生成用データは、コンテキストＣを生成するためのデータであり、本明細書に係る参照情報の一例である。コンテキスト生成用データは、一例として、ユーザクエリＱ及びメタデータＭの一方又は両方を含む。コンテキスト生成用データは、複数のユーザクエリを含んでいてもよく、また、複数のメタデータを含んでいてもよい。ただし、コンテキスト生成用データはユーザクエリ及びメタデータに限られず、他のデータであってもよい。また、コンテキスト生成用データは、そのままでコンテキストＣとして利用可能なデータであってもよい。取得部１１は、一例として、入力部２０又は通信部１８を介してコンテキスト生成用データを取得してもよく、また、記憶部１７からコンテキスト生成用データを読み出すことにより取得してもよい。

（ステップＳ１０２）
ステップＳ１０２では、第２の生成部１５－２が評価用データセットＤＳ及びコンテキストデータＣＤを生成する。評価用データセットＤＳの生成及びコンテキストデータＣＤの生成の具体例について以下に説明する。

（評価用データセットＤＳの生成）
第２の生成部１５－２は、まず、可視化情報Ｖを取得する。第２の生成部１５－２は、記憶部１７の所定の記憶領域から可視化情報Ｖを読み出すことにより取得してもよく、また、入力部２０又は通信部１８を介して可視化情報Ｖを取得してもよい。このとき、第２の生成部１５－２は、複数の可視化情報Ｖを取得する。可視化情報Ｖは、一例として、入力データＤに含まれる各データの属性情報、チャートの各軸と項目との関係に関する情報、入力データＤに対して適用するフィルタ、チャートタイプ、集計方法、等の情報を含む。

また、第２の生成部１５－２は、任意の言語モデルを用いて、取得した可視化情報Ｖをベクトル空間で表現する特徴ベクトルｄ^Ｖを生成する。特徴ベクトルｄ^Ｖは、複数の可視化情報Ｖのそれぞれについて生成される。また、第２の生成部１５－２は、入力データＤから可視化情報Ｖに対応する数値を集計した集計データｓ^Ｖ、及び、集計データｓ^Ｖについての各種統計量の集合である統計量ｔ^Ｖを生成する。

第２の生成部１５－２は、取得した可視化情報Ｖ、及び、生成した特徴ベクトルｄ^Ｖ、集計データｓ^Ｖ、統計量ｔ^Ｖを含む関連データＶＤと、ステップＳ１０１で取得部１１が取得した入力データＤとを含む評価用データセットＤＳを生成する。関連データＶＤには、複数の可視化情報Ｖ及び複数の特徴ベクトルｄ^Ｖが含まれてもよく、また、１対の可視化情報Ｖ及び特徴ベクトルｄ^Ｖが含まれてもよい。

（コンテキストデータＣＤの生成）
また、第２の生成部１５－２は、ステップＳ１０１で取得部１１が取得したコンテキスト生成用データに対し任意の自然言語処理を実行してコンテキストＣを生成する。なお、第２の生成部１５－２は、コンテキスト生成用データをそのままコンテキストＣとして用いてもよい。

図６は、コンテキストの生成例を示す図である。図６の例で、第２の生成部１５－２は、「商品Ａの顧客について」というユーザクエリＱ１に対し自然言語処理を実行し、「商品Ａ」、「顧客」というコンテキストＣ１１を生成する。また、第２の生成部１５－２は、「売上推移について」というユーザクエリＱ２に対し自然言語処理を行い、「売上」、「推移」というコンテキストＣ１２を生成する。また、第２の生成部１５－２は、「検索履歴」が「商品Ａの顧客」であるメタデータＭ１に対し自然言語処理を行って「商品Ａ」、「顧客」というコンテキストＣ１１を生成する。また、第２の生成部１５－２は、「検索履歴」が「売上推移」であるメタデータＭ２に対し自然言語処理を行った「売上」、「推移」というコンテキストＣ１２を生成する。

第２の生成部１５－２は、任意の言語モデルを用いて、生成したコンテキストＣをベクトル空間で表現する特徴ベクトルｄ^Ｃを生成し、生成した特徴ベクトルｄ^ＣとコンテキストＣとを含むコンテキストデータＣＤを生成する。

（ステップＳ１０３）
図４のステップＳ１０３では、関連度算出部１２は、コンテキストデータＣＤと評価用データセットＤＳの構成要素との関連度を算出する。図７及び図８は、コンテキストデータＣＤと評価用データセットＤＳとの関連度の算出方法の例を示す図である。図７は、コンテキストデータＣＤが「商品Ａ」及び「顧客」というコンテキストＣ１１を含み、評価用データセットＤＳに含まれる入力データＤが、図５に示したような、売上データ、商品データ、店舗データ及び顧客データを含む例を示す。この場合、関連度算出部１２は、コンテキストＣ１１の「商品Ａ」及び「顧客」のそれぞれと、入力データＤの複数の構成要素のそれぞれとの関連度を算出する。図７の例で、入力データＤの構成要素は例えば、売上データ、店舗データ、商品データ、顧客データの各々のデータ、及び、各データのデータ項目を含む。

図７の例では、売上データの「商品コード」の列、及び、商品データの「商品名」の項目が「商品Ａ」の行は、コンテキストＣ１１の「商品Ａ」との文字列の類似度が高いため、関連度算出部１２が算出する関連度は他の構成要素よりも大きくなる。また、売上データの「顧客コード」の列、及び顧客データは、コンテキストＣ１１の「顧客」との文字列の類似度が高いため、関連度算出部１２が算出する関連度は他の構成要素よりも大きくなる。

図８は、コンテキストデータＣＤが「売上」及び「推移」というコンテキストＣ１２を含み、評価用データセットＤＳに含まれる入力データＤが、図５に示したような、売上データ、商品データ、店舗データ及び顧客データを含む例を示す。この場合、関連度算出部１２は、コンテキストＣ１２の「売上」及び「推移」のそれぞれと、入力データＤの複数の構成要素のそれぞれとの関連度を算出する。

図８の例では、売上データの「売上」の列は、コンテキストＣ１２の「売上」との文字列の類似度が高いため、関連度算出部１２が算出する関連度は他の構成要素よりも大きくなる。また、売上データの「日付」の列は、コンテキストＣ１２の「推移」に対応するデータパターンを有しているため、関連度算出部１２が算出する関連度が他の構成要素よりも大きくなる。

（ステップＳ１０４）
図４のステップＳ１０４では、第１の生成部１５－１は、評価用データセットＤＳと、ステップＳ１０３で算出した関連度とを参照して複数のインサイトサブジェクトを生成する。第１の生成部１５－１は一例として、評価用データセットＤＳの構成要素のうち、関連度がゼロではない構成要素を含むインサイトサブジェクトを生成する。なお、第１の生成部１５－１が行うインサイトサブジェクトの生成方法は上述したものに限られない。第１の生成部１５－１は例えば、関連度が所定の条件を満たす（関連度が閾値以上である）構成要素を含むインサイトサブジェクトを生成してもよい。

また、ステップＳ１０４において、第１の生成部１５－１は、コンテキストが与えられていない、又は、関連のあるデータの構成要素が存在しなかった場合には、データテーブルにおいて考えられる全ての可視化情報Ｖについてインサイトサブジェクトを生成してもよい。

より具体的には、第１の生成部１５－１は例えば、関連データＶＤに含まれる集計データｓ ^Ｖを、可視化情報Ｖが表す表示態様のチャートにプロットした可視化結果を表すインサイトサブジェクトを生成する。このとき、第１の生成部１５－１が、複数の可視化情報Ｖのそれぞれについてインサイトサブジェクトを生成することにより、複数のインサイトサブジェクトが生成される。また、１つの可視化情報Ｖについて１つのインサイトサブジェクトが生成されるため、可視化情報Ｖとインサイトサブジェクトとは１対１で対応する。なお、インサイトサブジェクトは可視化候補を表すデータに限られず、例えば、可視化情報Ｖがそのままインサイトサブジェクトとして扱われてもよい。

（ステップＳ１０５）
ステップＳ１０５では、評価部１３は、インサイトサブジェクトに対して評価を実行する。評価部１３は一例として、複数のインサイトサブジェクトに対して、コンテキストデータＣＤに応じた評価を行う。

より具体的には、評価部１３は一例として、複数のインサイトサブジェクトの各々に対して、関連データＶＤとコンテキストデータＣＤとを参照した評価を行う。このとき、複数のインサイトサブジェクトは関連情報Ｖと１対１で対応しているため、評価部１３は、可視化情報Ｖのそれぞれについて評価を行う。換言すると、評価部１３は、複数のインサイトサブジェクトの各々に対して、関連データＶＤに含まれる関連情報Ｖ毎に評価を行う。

評価部１３は例えば、関連データ及びコンテキストデータの少なくとも一部が入力され、評価値を出力する評価モデルを用いて、複数のインサイトサブジェクトに対して評価を行う。図９は、評価部１３が行う評価処理の例を示す図である。図９の例で、評価部１３は、可視化情報ＶとコンテキストデータＣＤ、入力データＤが入力され、インサイトスコアｙ＾を出力する評価モデルｆを用いて、複数のインサイトサブジェクトに対して評価を行う。評価モデルｆは、予め規定されたスコア関数であってもよく、また、機械学習により構築された学習済モデルであってもよい。評価モデルｆを用いた評価方法については後述する。評価モデルｆによる可視化情報Ｖ毎のインサイトスコアｙ＾は記憶部１７に評価結果ＥＲとして記憶される。

（ステップＳ１０６）
ステップＳ１０６では、表示部１４は、インサイトサブジェクトに関連する情報を表示する。表示部１４は、一例として、関連度算出部１２が算出した関連度に基づき、コンテキストと関連する可視化情報Ｖを列挙した情報を表示する。ここで、表示部１４は、コンテキストが存在しない場合又は関連するインサイトサブジェクトがない場合、第１の生成部１５－１が生成した全てのインサイトサブジェクトを列挙した情報を表示してもよい。

より具体的には、例えば、表示部１４は、評価部１３による評価結果と共に、又は評価部１３による評価結果に応じた表示態様にて、複数のインサイトサブジェクトの少なくとも何れかを表示する。評価結果に応じた表示態様とは、例えば、表示順、又は、表示の大きさを含む。このとき、表示部１９は、評価部１３による評価が相対的に高いインサイトサブジェクトを、評価部１３による評価が相対的に低いインサイトサブジェクトよりも優先的に表示してもよい。

評価結果の表示例について、図１０～図１３を参照しつつ説明する。図１０は、可視化結果の表示例１を示す図である。図１０の例では、「１．商品Ａの顧客数の推移」、「２．商品Ａの顧客数（年齢）」及び「３．商品Ａの売上高（年齢）」の３つの可視化結果であるチャートＣ１０１～Ｃ１０３が、インサイトスコアｙ＾の高い順に表示される。また、チャートＣ１０１～Ｃ１０３のそれぞれに対応するインサイトスコアｙ＾及び可視化情報Ｖを含む情報Ｖ１０１～Ｖ１０３が、チャートＣ１０１～Ｃ１０３に対応付けて表示される。

また、表示例１では、チャートＣ１０１～Ｃ１０３のそれぞれについて、可視化結果をユーザが評価するための評価ボタンＣ１１１～Ｃ１１３が表示される。また入力データＤの再評価を行うための検索窓Ｃ１１４及び再評価ボタンＣ１１５が表示される。入力データＤの再評価については後述する。

チャートＣ１０１が表示されることにより、ユーザは例えば「商品Ａの顧客数は年々減少してしまっている」といった情報を把握することができる。また、チャートＣ１０２が表示されることにより、ユーザは例えば、「商品Ａの主要顧客の年代は２０代である」といった情報を把握することができる。

図１１は、インサイトサブジェクトを評価結果と共に表示する例を示す図である。図１１の例で、インサイトサブジェクトＶ７、Ｖ３、Ｖ８、…は、入力データＤの可視化結果を表すチャートであり、インサイトサブジェクトＶ７、Ｖ３、Ｖ８、…の視覚的特徴はそれぞれ異なっている。インサイトサブジェクトＶ７、Ｖ３、Ｖ８、…のそれぞれに隣接して各インサイトサブジェクトのインサイトスコアｙ＾が表示される。また、複数のインサイトサブジェクトＶ７、Ｖ３、Ｖ８、…は、インサイトスコアｙ＾の降順で表示される。

図１１の例によれば、複数のインサイトサブジェクトがインサイトスコアｙ＾の降順で表示されることにより、どのインサイトサブジェクトの評価が高いかをユーザが把握し易い。

図１２は、可視化情報Ｖを評価結果と共に表示する例を示す図である。図１２の例では、表示部１４は、関連データに含まれる各関連情報Ｖと、評価部１３による評価とを対応付けて表示する。具体的には、表示部１９は、可視化情報Ｖ１１～Ｖ１８と、可視化情報Ｖ１１～Ｖ１８のそれぞれに対応するインサイトスコアｙ＾とを対応付けて表示する。

図１３は、インサイトサブジェクトを評価結果と共に表示する例を示す図である。図１３の例では、表示部１４は、入力データＤの可視化結果であるチャート（棒グラフ）を表示するとともに、表示したチャートに対応するインサイトスコアｙ＾をチャートと共に表示する。

ユーザは、表示部１４の表示により、ユーザの求めるインサイトを与える可能性の高い可視化結果を優先的に視認することができる。このように、本例示的実施形態によれば、ユーザの求めるインサイトをユーザに与えやすい表示出力を行うことができる。

（ステップＳ１０５の評価の具体例）
次いで、評価部１３がステップＳ１０５で行う評価の具体例について、図１４～１６を参照しつつ説明する。評価部１３は、一例として、特徴ベクトルｄ^Ｃ、特徴ベクトルｄ^Ｖ、集計データｓ^Ｖ及び統計量ｔ^Ｖを用いてインサイトサブジェクトに対する評価を行う。

図１４は、特徴ベクトルｄ^Ｃ及び特徴ベクトルｄ^Ｖの生成例を示す図である。図１４に示すように、可視化情報Ｖから特徴ベクトルｄ^Ｖが生成されるとともに、コンテキストＣから特徴ベクトルｄ^Ｃが生成される。

図１５は、第２の生成部１５－２が生成する集計データｓ^Ｖ及び統計量ｔ^Ｖの例を示す図である。図１５の例で、集計データｓ^Ｖは、入力データＤに含まれるデータであって可視化情報Ｖに対応するデータを集計して得られるデータである。統計量ｔ^Ｖは、集計データｓ^Ｖの統計量を表すデータである。

以下では、評価部１３が実行する評価の具体例として、ルールベースでの評価と学習ベースでの評価とについて説明する。

（ルールベースでの評価）
ルールベースの場合、評価部１３は関連データＶＤを用いてスコアｙ_０＾を計算し、スコアｙ_０＾を用いてインサイトスコアｙ＾を計算する。このとき、評価部１３は、スコアｙ_０＾をそのままインサイトスコアｙ＾として用いてもよいし、スコアｙ_０＾に正規化又は重み付けなどの処理を加えてインサイトスコアｙ＾を算出してもよい。

スコアｙ_０＾の計算方法は限定されないが、評価部１３は例えば、インサイトの種別ごとにルールベースで定義されたスコア関数を用いてもよく、また、インサイトを与えるチャートの特徴量を学習するモデルを用いてスコアｙ_０＾を算出してもよい。

スコア関数を用いる場合、スコア関数は、一例として、関連データＶＤとコンテキストデータＣＤとの関連性が高い程、高い評価値を出力する関数である。換言すると、評価部１３は、予め規定されたスコア関数であって、関連データＶＤとコンテキストデータＣＤとの関連性が高い程、高い評価値を出力するスコア関数を用いて、複数のインサイトサブジェクトに対して評価を行う。

（ルールベースでの評価の例１）
評価部１３は例えば、コンテキストデータＣＤとの関連性が低い関連データＶＤについてのインサイトスコアｙ＾をゼロ、又はマイナス値にするなどして、評価結果が低くなるようにする。コンテキストデータＣＤと関連データＶＤとの関連性の程度（類似度）の計算方法は限定されないが、評価部１３は例えば、集合の類似度（Jaccard、Dice、Simpson、等）、文字列の類似度（ハミング距離、レーベンシュタイン距離、ジャロ・ウィンクラー距離、等）、分散表現（word2vec、fastText、BERT、等）の類似度を用いる。

（ルールベースでの評価の例２）
また、評価部１３は、コンテキストデータＣＤと関連データＶＤの類似度によって重み付けされたスコアを用いて、インサイトスコアｙ＾を算出してもよい。より具体的には、例えば、関連データＶＤを用いて計算されたスコアｙ_０＾と、類似度ｓｉｍ（ＣＤ，Ｄ^Ｖ）の積をインサイトスコアｙ＾としてもよい。

（学習ベースでの評価）
学習ベースの場合、評価部１３は、予め学習された評価モデルであって、関連データＶＤとコンテキストデータＣＤとが入力され、評価値を出力する評価モデルｆを用いて、複数のインサイトサブジェクトに対して評価を行う。評価モデルｆの機械学習の手法は限定されず、一例として、決定木ベース、線形回帰、又はニューラルネットワークの手法が用いられてもよく、また、これらのうちの１以上の手法が用いられてもよい。決定木ベースとしては、例えば、ＬｉｇｈｔＧＢＭ（Light Gradient Boosting Machine）、及びＸＧＢｏｏｓｔが挙げられる。線形回帰としては、例えば、サポートベクター回帰、Ｒｉｄｇｅ回帰、Ｌａｓｓｏ回帰、及びＥｌａｓｔｉｃＮｅｔが挙げられる。ニューラルネットワークとしては、例えばディープラーニングが挙げられる。

評価モデルｆの学習においては、インサイトがあるとみなせる任意の教師データが利用可能である。例えば、過去にデータ分析者によって作成されたチャートがインサイトを与える特徴を含んでいるとみなして、それらの可視化情報Ｖをポジティブサンプルとして学習に用いてもよい。また、インサイトがないと考えられるチャートの可視化情報Ｖをネガティブサンプルとして学習に用いてもよい。

図１６は、評価モデルｆの一例を示す図である。図１６の例で、評価モデルｆの入力は、特徴ベクトルｄ^Ｖ、特徴ベクトルｄ^Ｃ、集計データｓ ^Ｖ、及び統計量ｔ^Ｖを含む。評価モデルｆの出力は、評価結果であり、一例として、ユーザの求めるインサイトを与えるかを示すラベル確率である。

（学習ベースにおける評価モデルの例１）
可視化情報Ｖのインサイトに関する教師ラベルｙが与えられる場合には、分類モデルとして評価モデルを学習させることができる。例えば、ｙ∈｛０，１｝が１の場合はインサイトあり、０の場合はインサイトなし、を示すラベルとして与えられているとき、２クラス分類タスクとして、例えば以下の式（１）により与えられる損失関数Ｅ（θ）を最小化する機械学習モデルを学習させればよい。式（１）において、Ｎは学習データの数である。

上記損失関数を最小化する機械学習モデルの出力は、ｐ（ｙ＝１｜ＶＤ_ｉ，ＣＤ_ｉ）、すなわちインサイトありと判定される確率と解釈することができ、これをインサイトスコアｙ＾として用いることができる。

（学習ベースにおける評価モデルの例２）
可視化情報Ｖごとの可視化のよさを表すスコアやランキングが教師データとして与えられる場合、回帰モデルとして評価モデルを学習させることができる。例えば、ｙを教師データによって与えられたスコアであるとした場合、例えば以下の式（２）により与えられる損失関数Ｅ（θ）を最小化する機械学習モデルを学習させればよい。式（２）において、Ｎは学習データの数である。

上記の損失関数を最小化する機械学習モデルの出力は、教師データのスコアと同様に可視化のよさを表すスコアであり、これをインサイトスコアｙ＾として用いてもよい。

〔例示的実施形態３〕
本発明の第３の例示的実施形態について、図面を参照して詳細に説明する。なお、例示的実施形態１にて説明した構成要素と同じ機能を有する構成要素については、同じ符号を付記し、その説明を繰り返さない。

図１７は、本例示的実施形態に係る情報処理装置１Ｂの構成を示すブロック図である。図１７に示すように、情報処理装置１Ｂは、例示的実施形態２に係る情報処理装置１Ａの制御部１０Ａに代えて制御部１０Ｂを備える。制御部１０Ｂは、取得部１１、関連度算出部１２、評価部１３、表示部１４、第１の生成部１５－１及び第２の生成部１５－２に加えて、学習部１６を備える。

本例示的実施形態において、入力部２０は、評価部１３の評価結果に対するユーザからのフィードバックを受け付ける。また、評価部１３は、ユーザからのフィードバックを参照して、複数のインサイトサブジェクトに対して、再度の評価を行う。

例えば、入力部２０が受け付けたユーザからのフィードバックが、ユーザからの評価が高いことを示している場合に、取得部１１は、フィードバックが反映されたコンテキストデータを取得する。関連度算出部１２は、フィードバックが反映されたコンテキストデータと評価用データセットの構成要素との関連度を算出する。評価部１３は、評価用データセットと関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う。

コンテキスト及びユーザクエリは任意のタイミングで更新することが可能である。コンテキスト及びユーザクエリは例えば、図１０の検索窓Ｃ１１４にユーザが文字列を入力して再評価ボタンＣ１１５を選択することにより更新される。コンテキスト及びユーザクエリの更新後にはコンテキストデータの取得処理、及びインサイトサブジェクトに関連する情報の表示処理を情報処理装置１Ｂが再度実行し、これにより、表示部１９に表示される情報が切り替わる。

具体的には例えば、図１０の表示例において、ユーザが評価ボタンＣ１１１～Ｃ１１３のいずれかを選択する操作、又は、検索窓Ｃ１１４への入力操作及び再評価ボタンＣ１１５の選択操作を行うと、取得部１１は、ユーザの操作内容に基づくコンテキストデータを生成し、生成したコンテキストデータを用いて、図４に示す情報処理方法Ｓ１Ａを実行する。これにより、ユーザのフィードバックが反映された情報の表示が行われる。

また、学習部１６は、ユーザからのフィードバックを参照して、評価モデルｆを再学習してもよい。この場合、学習部１６は例えば、表示部１９が表示したインサイトサブジェクトに関連する情報（インサイトスコアｙ＾、可視化情報Ｖ、チャート、等）に関するユーザの操作履歴を、ユーザからのフィードバックとして記憶部１７等に記録する。ユーザの操作履歴は、一例として、インサイトサブジェクトに関連する情報の表示時間、インサイトサブジェクトに関連する情報に対する評価ボタンの押下、等を含む。

学習部１６は、ユーザからのフィードバックを反映した評価モデルｆの再学習を行う。学習部１６は例えば、評価の高い可視化情報Ｖをポジティブサンプルとし、評価の低い可視化情報をネガティブサンプルとして、評価モデルｆの再学習を行う。

本例示的実施形態に係る情報処理装置１Ｂにおいては、入力部２０が評価結果に対するユーザからのフィードバックを受け付け、評価部１３が、ユーザからのフィードバックを参照して、複数のインサイトサブジェクトに対して、再度の評価を行う。このため、本例示的実施形態に係る情報処理装置１Ｂによれば、例示的実施形態１に係る情報処理装置１の奏する効果に加えて、インサイトサブジェクトに対する評価の精度をより高くすることができるという効果が得られる。

〔変形例〕
上述の例示的実施形態１において、１つの情報処理装置１が行っていた処理は、複数の情報処理装置に分担させてもよい。言い換えれば、情報処理装置１が行う処理の一部を、少なくとも１つの他の情報処理装置に実行させてもよい。さらに言い換えれば、上述の各処理を少なくとも１つのプロセッサに行わせる場合、その少なくとも１つのプロセッサは、１つの情報処理装置１が備えているものであってもよいし、それぞれ異なる情報処理装置が備えているものであってもよい。これは、上述の例示的実施形態２における情報処理装置１Ａ、および例示的実施形態３における情報処理装置１Ｂについても同様である。

〔ソフトウェアによる実現例〕
情報処理装置１、１Ａ、１Ｂの一部又は全部の機能は、集積回路（ＩＣチップ）等のハードウェアによって実現してもよいし、ソフトウェアによって実現してもよい。

後者の場合、情報処理装置１、１Ａ、１Ｂは、例えば、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータによって実現される。このようなコンピュータの一例（以下、コンピュータＣと記載する）を図１８に示す。コンピュータＣは、少なくとも１つのプロセッサＣ１と、少なくとも１つのメモリＣ２と、を備えている。メモリＣ２には、コンピュータＣを情報処理装置１、１Ａ、１Ｂとして動作させるためのプログラムＰが記録されている。コンピュータＣにおいて、プロセッサＣ１は、プログラムＰをメモリＣ２から読み取って実行することにより、情報処理装置１、１Ａ、１Ｂの各機能が実現される。

プロセッサＣ１としては、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、ＤＳＰ（Digital Signal Processor）、ＭＰＵ（Micro Processing Unit）、ＦＰＵ（Floating point number Processing Unit）、ＰＰＵ（Physics Processing Unit）、マイクロコントローラ、又は、これらの組み合わせなどを用いることができる。メモリＣ２としては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、又は、これらの組み合わせなどを用いることができる。

なお、コンピュータＣは、プログラムＰを実行時に展開したり、各種データを一時的に記憶したりするためのＲＡＭ（Random Access Memory）を更に備えていてもよい。また、コンピュータＣは、他の装置との間でデータを送受信するための通信インタフェースを更に備えていてもよい。また、コンピュータＣは、キーボードやマウス、ディスプレイやプリンタなどの入出力機器を接続するための入出力インタフェースを更に備えていてもよい。

また、プログラムＰは、コンピュータＣが読み取り可能な、一時的でない有形の記録媒体Ｍに記録することができる。このような記録媒体Ｍとしては、例えば、テープ、ディスク、カード、半導体メモリ、又はプログラマブルな論理回路などを用いることができる。コンピュータＣは、このような記録媒体Ｍを介してプログラムＰを取得することができる。また、プログラムＰは、伝送媒体を介して伝送することができる。このような伝送媒体としては、例えば、通信ネットワーク、又は放送波などを用いることができる。コンピュータＣは、このような伝送媒体を介してプログラムＰを取得することもできる。

〔付記事項１〕
本発明は、上述した実施形態に限定されるものでなく、請求項に示した範囲で種々の変更が可能である。例えば、上述した実施形態に開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。

〔付記事項２〕
上述した実施形態の一部又は全部は、以下のようにも記載され得る。ただし、本発明は、以下の記載する態様に限定されるものではない。

（付記１）
評価用データセット及びコンテキストデータを取得する取得手段と、
前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出する関連度算出手段と、
前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う評価手段と、
前記インサイトサブジェクトに関連する情報を表示する表示手段と、
を備える情報処理装置。

上記の構成によれば、ユーザの求めるインサイトを与える情報を表示することができる。

（付記２）
前記評価用データセットと前記関連度とを参照して、前記複数のインサイトサブジェクトを生成する第１の生成手段を更に備える、付記１に記載の情報処理装置。

（付記３）
前記第１の生成手段は、
前記評価用データセットの構成要素のうち、前記関連度がゼロではない構成要素を含むインサイトサブジェクトを生成する、付記２に記載の情報処理装置。

上記の構成によれば、コンテキストデータとの関連度がゼロでない構成要素を含むインサイトサブジェクトに関する情報を表示することができる。

（付記４）
前記評価用データセットには、評価用データと、当該評価用データに関連する関連データとが含まれており、
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データに含まれる関連情報毎に評価を行う、付記１から３の何れか１つに記載の情報処理装置。

上記の構成によれば、関連情報毎にインサイトサブジェクトを評価することができる。

（付記５）
前記表示手段は、前記評価手段による評価が相対的に高いインサイトサブジェクトを、前記評価手段による評価が相対的に低いインサイトサブジェクトよりも優先的に表示する、付記４に記載の情報処理装置。

上記の構成によれば、インサイトサブジェクトに対する評価の程度をユーザに提示することができる。

（付記６）
前記表示手段は、前記関連データに含まれる各関連情報と、前記評価手段による評価結果とを対応付けて表示する、付記４又は５に記載の情報処理装置。

上記の構成によれば、表示手段が表示する情報によりユーザが複数のインサイトサブジェクトのそれぞれに対する評価を把握することができる。

（付記７）
前記表示手段は、
前記評価手段による評価結果と共に、又は前記評価手段による評価結果に応じた表示態様にて、前記複数のインサイトサブジェクトの少なくとも何れかを表示する、付記１から６の何れか１つに記載の情報処理装置。

上記の構成によれば、表示手段が表示するインサイトサブジェクトによりユーザがインサイトサブジェクトに対する評価をより把握し易くすることができる。

（付記８）
前記評価手段は、複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う、付記１から７の何れか１つに記載の情報処理装置。

上記の構成によれば、データの可視化候補がユーザの求めるインサイトを与えるかについて評価することができる。

（付記９）
参照情報を参照して、前記コンテキストデータを生成する第２の生成手段を更に備えている、付記１から８の何れか１つに記載の情報処理装置。

上記の構成によれば、参照情報に対応するインサイトを与える情報を表示することができる。

（付記１０）
前記評価手段の評価結果に対するユーザからのフィードバックを受け付ける受付手段を更に備え、
前記評価手段は、前記ユーザからのフィードバックを参照して、前記複数のインサイトサブジェクトに対して、再度の評価を行う、付記１から９の何れか１つに記載の情報処理装置。

上記の構成によれば、インサイトサブジェクトに対する評価の精度をより高くすることができる。

（付記１１）
前記受付手段が受け付けた前記ユーザからのフィードバックが、ユーザからの評価が高いことを示している場合に、
前記取得手段は、前記フィードバックが反映されたコンテキストデータを取得し、
前記関連度算出手段は、前記フィードバックが反映されたコンテキストデータと前記評価用データセットの構成要素との関連度を算出し、
前記評価手段は、前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う、付記１０に記載の情報処理装置。

（付記１２）
少なくとも１つのプロセッサが、
評価用データセット及びコンテキストデータを取得すること、
前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出すること、
前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行うこと、及び、
前記インサイトサブジェクトに関連する情報を表示すること、
を含む情報処理方法。

（付記１３）
コンピュータに、
評価用データセット及びコンテキストデータを取得する処理と、
前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出する処理と、
前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う処理と、
前記インサイトサブジェクトに関連する情報を表示する処理と、
を実行させるプログラム。

〔付記事項３〕
上述した実施形態の一部又は全部は、更に、以下のように表現することもできる。

少なくとも１つのプロセッサを備え、前記プロセッサは、評価用データセット及びコンテキストデータを取得する取得処理と、前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出する関連度算出処理と、前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う評価処理と、前記インサイトサブジェクトに関連する情報を表示する表示処理とを実行する情報処理装置。

なお、この情報処理装置は、更にメモリを備えていてもよく、このメモリには、前記取得処理と、前記関連度算出処理と、前記評価処理と、前記表示処理とを前記プロセッサに実行させるためのプログラムが記憶されていてもよい。また、このプログラムは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録されていてもよい。

１、１Ａ、１Ｂ情報処理装置
１０Ａ、１０Ｂ制御部
１１取得部（取得手段）
１２関連度算出部（関連度算出手段）
１３評価部（評価手段）
１４表示部（表示手段）
１５－１第１の生成部
１５－２第２の生成部
１６学習部
１７記憶部
１８通信部
１９表示部
２０入力部（受付手段）

Claims

評価用データセット及びコンテキストデータを取得する取得手段と、
前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出する関連度算出手段と、
前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う評価手段と、
前記インサイトサブジェクトに関連する情報を表示する表示手段と
を備える情報処理装置。
前記評価用データセットと前記関連度とを参照して、前記複数のインサイトサブジェクトを生成する第１の生成手段を更に備える、請求項１に記載の情報処理装置。
前記第１の生成手段は、
前記評価用データセットの構成要素のうち、前記関連度がゼロではない構成要素を含むインサイトサブジェクトを生成する、請求項２に記載の情報処理装置。
前記評価用データセットには、評価用データと、当該評価用データに関連する関連データとが含まれており、
前記評価手段は、前記複数のインサイトサブジェクトの各々に対して、前記関連データに含まれる関連情報毎に評価を行う、請求項１から３の何れか１項に記載の情報処理装置。
前記表示手段は、
前記評価手段による評価結果と共に、又は前記評価手段による評価結果に応じた表示態様にて、前記複数のインサイトサブジェクトの少なくとも何れかを表示する、請求項１から４の何れか１項に記載の情報処理装置。
前記評価手段は、複数のインサイトサブジェクトに対して、前記コンテキストデータに応じた評価を行う、請求項１から５の何れか１項に記載の情報処理装置。
参照情報を参照して、前記コンテキストデータを生成する第２の生成手段を更に備えている、請求項１から６の何れか１項に記載の情報処理装置。
前記評価手段の評価結果に対するユーザからのフィードバックを受け付ける受付手段を更に備え、
前記評価手段は、前記ユーザからのフィードバックを参照して、前記複数のインサイトサブジェクトに対して、再度の評価を行う、請求項１から７の何れか１項に記載の情報処理装置。
少なくとも１つのプロセッサが、
評価用データセット及びコンテキストデータを取得すること、
前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出すること、
前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行うこと、及び
前記インサイトサブジェクトに関連する情報を表示すること
を含む情報処理方法。
コンピュータに、
評価用データセット及びコンテキストデータを取得する処理と、
前記コンテキストデータと前記評価用データセットの構成要素との関連度を算出する処理と、
前記評価用データセットと前記関連度とを参照して生成された複数のインサイトサブジェクトに対して、評価を行う処理と、
前記インサイトサブジェクトに関連する情報を表示する処理と
を実行させるプログラム。