JP2017152042A

JP2017152042A - グラフ理論を用いた解析方法、解析プログラムおよび解析システム

Info

Publication number: JP2017152042A
Application number: JP2017093522A
Authority: JP
Inventors: 横山　淳; Atsushi Yokoyama; 淳横山
Original assignee: IMATRIX Corp
Current assignee: IMATRIX Corp
Priority date: 2017-05-10
Filing date: 2017-05-10
Publication date: 2017-08-31
Anticipated expiration: 2037-05-10
Also published as: EP3506131A4; US20190370274A1; JP6370961B2; EP3506131A1; CN109844742A; WO2018207874A1; CN109844742B

Abstract

【課題】ノード間の複雑な関連性を解析することができるグラフ理論を用いた解析方法を提供する。
【解決手段】グラフ理論を用いた解析方法は、収集した学習用データに基づき辞書を生成するステップＳ１０４と、収集した評価用データに基づき従来型のグラフデータを作成するステップＳ１１２と。辞書に格納されたベクトルデータを参照し、ノード間の予測した関係をベクトル化するステップＳ１１６と、関係ベクトルを作成済みの従来型のグラフに割り当て、Ｎ次元のベクトル化グラフデータを生成するステップＳ１１８と、を含む。
【選択図】図１４

Description

本発明は、グラフ理論を用いた解析方法に関し、グラフ理論により多義的あるいは複雑な関連性を解析する方法に関する。

ユーザーの嗜好を抽出するための手法として、分析の対象となる文章データからユーザーの興味のある単語等を抽出するものがある。例えば、特許文献１は、複数のユーザーが作成する文章から統一的に嗜好を表すデータを抽出する方法を開示する。また、特許文献２は、単語同士の意味が近いほど単語同士の距離が近くなる意味空間を利用し、複数の単語の意味空間における分布からオブジェクトを表す確率分布を推定し、類似度を算出する方法を開示する。

特開２０１７−２７１６８号公報特開２０１７−２７１０６号公報

自然言語の解析方法として、評価する単語を予め定義し、それの出現有無をデータとする「Bag of Words」というものがある。この方法は、予め定義された単語の出現有無を判断するため、定義されていない単語は扱えず、また、語順などを考慮することができない。例えば、図１に示す「This is a pen」のテキストデータを、単語毎に切り離し、「this」が定義された単語であれば、それがヒットしたことを示すデータ「１」が生成される。

また、テキストデータをＮ文字毎に区切り（Ｎは、１以上の整数）、それらの出現有無をデータとする「N-gram」という自然言語の解析方法がある。例えば、図１に示す「This is a pen」を、２グラムで解析する場合、このテキストデータは、「Th」、「hi」、「is」のように２文字毎に切り離され、それらがヒットしたことを示すデータ「１」が生成される。

さらに、単語を機械学習技術を用いてベクトル化する解析方法がある。例えば、図１に示す「This is a pen」の単語を辞書と比較し、単語間の意味的な類似関係をベクトルで表すことができる。このような単語のベクトル化は、単語の意味的な特徴が反映された意味ベクトル、あるいは分散表現であり、ｗｏｒｄ２ｖｅｃのような技術を実施することで生成することができる。ｗｏｒｄ２ｖｅｃの特徴として、（１）類似した単語は類似したベクトルとなる、（２）ベクトル成分は意味をもつ、（３）ベクトル同士の演算が可能である。例えば、「王様−男＋女＝女王」のような演算が可能である。また、ｗｏｒｄ２ｖｅｃのような単語をベクトル化するものの他にも、文書、製品、質問等をベクトル化する、ｓｅｎｔ２ｖｅｃ、ｐｒｏｄｕｃｔ２ｖｅｃ、ｑｕｅｒｙ２ｖｅｃ、ｍｅｄ２ｖｅｃなどがある。

また、データ構造の解析方法として、グラフ理論が知られている。グラフ理論は、ノード（頂点）とエッジ（辺）の集合で構成されるグラフであり、このグラフにより様々な事象の関連性を表すことができる。例えば、図２（Ａ）に示すように、ノードＡ、Ｂ、Ｃ、Ｄが、各エッジによって連結され、エッジの方向は、ノード間の関連性の方向を表す。このグラフをデータ化したものが図２（Ｂ）である。図３に示す重み付けグラフ理論は、エッジに重み付けをしたもの、つまりエッジを定量化したものである。例えば、ノードＡからノードＢへの関連性を表す重みＷ_ＡＢは、０．８で表され、ノードＢからノードＣへの関連性を表す重みＷ_ＢＣは、０．２で表される。

グラフ理論や重み付けグラフ理論は、ノード間の関係をエッジの有無、または1つの値(スカラー)で一義的にしか表現できないため、ノード間の関係の記述性が乏しく、ノード間の多義的な関係、あるいは複雑な関係を表現することは難しい。

本発明は、このような従来の課題を解決するものであり、複雑な関連性を解析することができるグラフ理論を用いた解析方法を提供することを目的とする。

本発明に係る解析方法は、ノード間の関連性を表すグラフ理論を用いた解析方法であって、辞書データに基づきノード間の関連性を表すＮ次元のベクトルを算出するステップと、算出されたＮ次元のベクトルによりベクトル化されたグラフデータを作成するステップと、を含む。

好ましくは前記算出するステップは、テキストデータから単語を抽出し、単語間の意味的な類似度を表すＮ次元のベクトルを算出する。好ましくは前記辞書データは、単語間の類似度を表すベクトルデータを含む。好ましくは前記算出するステップは、学習用データをｗｏｒｄ２ｖｅｃにより処理することで単語間の類似度を表すベクトルデータを生成することを含む。好ましくは前記算出するステップは、解析対象のデータからノード間の関係を予測し、前記辞書データを参照して予測した関係をベクトル化する。好ましくは前記算出するステップは、解析対象のデータを形態素解析し、解析された単語の平均ベクトルに基づきノード間の関係を予測する。好ましくは解析方法はさらに、ベクトル化されたグラフデータを他のグラフデータに変換するステップを含む。好ましくは前記変換するステップは、ベクトル化されたグラフデータのベクトルの内積を計算することで重み付けされたグラフデータに変換することを含む。好ましくは解析方法はさらに、ベクトル化されたグラフデータに基づきノード間の関連性を解析するステップを含む。好ましくは前記解析するステップは、人間関係を解析する。好ましくは前記解析するステップは、ベクトル化されたグラフデータに基づきノード間の全ベクトルの平均ベクトルを計算し、平均ベクトルと類似する類似のベクトルを辞書から選択し、選択された類似のベクトルの単語を抽出する。

本発明に係る解析方法は、ノード間の人間関係を表すグラフ理論を用いたものであって、単語間の類似度を表すベクトルデータを辞書データとして用意し、解析対象のデータからノード間の人間関係を予測し、予測した人間関係を前記辞書データを参照してベクトル化し、人間関係をＮ次元のベクトルによりベクトル化されたグラフデータを作成し、作成されたベクトル化グラフデータに基づき人間関係を解析する。

本発明に係るグラフ理論を用いた解析プログラムは、コンピュータ装置が実行するものであって、辞書データに基づきノード間の関連性を表すＮ次元のベクトルを算出するステップと、算出されたＮ次元のベクトルによりベクトル化されたグラフデータを作成するステップとを含む。本発明に係るグラフ理論を用いた解析システムは、辞書データに基づきノード間の関連性を表すＮ次元のベクトルを算出する算出手段と、算出されたＮ次元のベクトルによりベクトル化されたグラフデータを作成する作成手段とを含む。

本発明によれば、グラフ理論におけるノード間の関連性をＮ次元のベクトルにより定義するようにしたので、ノード間の複雑な関連性を表し、かつ解析することができる。

従来の自然言語の解析例を説明する図である。一般的なグラフ理論を説明する図である。重み付けグラフ理論を説明する図である。本発明のベクトル化グラフ理論を説明する図である。本発明のベクトル化グラフ理論を人間関係に応用した例を示す図である。本発明のベクトル化グラフ理論から特定の関係を抽出する例を示す図である。本発明のベクトル化グラフ理論から強度を抽出する例を説明する図である。本発明のベクトル化グラフ理論における他のグラフへの変換例を説明する図である。本発明のベクトル化グラフ理論による同一階層の複雑な関係の記述例を示す図である。本発明のベクトル化グラフ理論による他の階層層の関係の記述例を示す図である。本発明の実施例によるベクトル化グラフ理論を用いた解析システムの構成例を示す図である。図１２（Ａ）は、学習用データの一例、図１２（Ｂ）は、評価用データの一例である。図１３（Ａ）は、辞書データの一例であり、図１３（Ｂ）は、ベクトル化グラフデータを説明する図である。本実施例のベクトル化モジュールの動作フローである。図１５（Ａ）は、通常のグラフデータ、図１５（Ｂ）は、重み付けされた重み付けグラフデータの例示である。本実施例によるベクトル化モジュールの具体例を示す動作フローである。本実施例のグラフ変換モジュールの動作フローであり、図１７（Ａ）は、関係抽出するときの動作フロー、図１７（Ｂ）は、関係強度を抽出するときの動作フローである。本実施例のグラフ解析モジュールの動作フローの一例である。本実施例のベクトル化グラフ解析モジュールの動作フローの一例である。

次に、本発明に係るグラフ理論を用いた解析装置の実施形態について図面を参照して詳細に説明する。図４は、本発明によるベクトル化グラフ理論の概要を説明する図であり、図４（Ａ）は、ノードとエッジとを含むグラフの一例、図４（Ｂ）は、ノード間の関連性をＮ次元でベクトル化した例、図４（Ｃ）は、Ｎ次元のベクトル化グラフデータの一例である。

図４（Ａ）に示すように、ノードＡ、Ｂ、Ｃ、Ｄは、それぞれエッジにより関係性が示されている。エッジは、あるノードからあるノードへの関連性を示すベクトルであり、例えば、ノードＡからノードＢへの関与は、ベクトルＸ_ＡＢで表され、ノードＤからノードＡへの関与は、ベクトルＸ_ＤＡで表される。ここで、ベクトルの出発点のノードを「ソース」、到着点のノードを「ディスティネーション」とする。

本発明のベクトル化グラフ理論では、図４（Ｂ）に示すように、ソースとディスティネーションとの関連性を、Ｎ次元のベクトルによって定義される（Ｎは、２以上の整数）。Ｎ次元のベクトルは、ソースとディスティネーション間の複雑な関係、多義的な関係、異なる階層間の関係などを表すことができる。Ｎ次元のベクトルは、例えば、ソースとディスティネーションとの意味的な類似関係を表した数値化した意味ベクトル、またはソースとディスティネーションとの意味的な類似関係を数値化した分散表現であり得る。ソースとディスティネーションとの関係がＮ次元のベクトルにより定義されたとき、図４（Ｃ）に示すようなベクトル化グラフデータが得られる。

図５は、本発明のベクトル化グラフ理論により人間関係を表した例である。同図（Ａ）において、ノードＡ〜Ｄは、人物または人物と等価なものを表し、各ノードは、人的関係を表すベクトルによって連結されている。例えば、ノードＡがノードＢに対して好きという感情をもち、ノードＢがノードＤに対して妬みという感情をもち、ノードＤがノードＡに対して嫌いという感情をもち、ノードＢとノードＣがそれぞれ相互に信頼という感情をもつことが示されている。同図（Ｂ）は、図５（Ａ）の関係を表したＮ次元のベクトルであらわしたベクトル化グラフデータである。例えば、「好き」という感情にも色々あり、つまり、「好き」の度合（「大好き」、「少し好き」など）や、好きの対象（「顔が好き」、「目が好き」、「性格が好き」など）などの種々の意味合いが含まれる。Ｎ次元のベクトルは、こうした「好き」という概念を複数の多義的な観点から数値化したベクトルであるとも言える。本例の場合、ノードＡからノードＢへの「好き」は、図５（Ｂ）の「好き」のＮ次元のベクトルによって関連性が定義されている。

ベクトル化グラフ理論は、人間関係の関連性を表す他にも、例えば、インターネットのネットワークにおいてウェブページのリンク関係をベクトル化したり、ユーザーと商品との関係においてユーザーの購買動機をベクトル化することも可能である。

本発明のベクトル化グラフ理論により生成されたベクトル化グラフデータは、他のグラフ理論のためのグラフデータに変換可能である。例えば、ベクトル化グラフデータを参照し、そのノード間を表すベクトルに何らかの内積計算を算出することで、重み付けグラフ理論のためのグラフデータを算出することができる。また、重み付けグラフ理論のグラフデータの閾値を計算することで、通常のグラフ理論のためのグラフデータを算出することができる。その変化の一例を図６に示す。各関係ベクトルと信頼ベクトルの内積を取り、得られたスカラーを各関係の信頼値とすることで、図６（Ａ）に示すようなベクトル化グラフ理論から、図６（Ｂ）に示す信頼を表す重み付けグラフ理論への変換が可能である。この時、信頼ベクトルは、ｗｏｒｄ２ｖｅｃなどのベクトルデータを算出する過程で得られたベクトルを用いることができる。これにより、信頼の度合を示す重み付けグラフを得ることができる。同様に、図６（Ｃ）に示す嫌いグラフへ変換する場合には、各関係と嫌いベクトルとの内積を取ることで、嫌いの度合を示すグラフを得ることができる。ここで、ノードＡ、Ｂ間のベクトルは、「好き」であり、「嫌い」とは正反対であるため、両者のベクトルの内積は小さくなる。このようにベクトル化グラフから様々な関係を表すグラフに変換することができる。

さらに本発明のベクトル化グラフ理論は、感情や関係の強度を表すグラフ理論にも変換可能である。例えば、図７（Ａ）に示すようなベクトル化グラフがあるとき、各関係ベクトルが自己との内積を取ることで、図７（Ｂ）に示すようなノード間の感情や関係の強さのみを抽出することができる。

図８は、本発明のベクトル化グラフ理論の変換関係を説明する図である。同図に示すように、本発明のベクトル化グラフ１０に何らかの内積計算をすることで重み付けグラフ２０に変換することができ、重み付けグラフ２０は閾値計算をすることで通常のグラフ３０に変換することができる。この変換は、上位から下位に向けて可能であり、下位から上位に変換することはできないことに留意すべきである。

本発明のベクトル化グラフ理論は、複雑なあるいは多義的な関係を記述できる為、従来のグラフ理論では難しかった複数階層に跨る関係記述も可能である。図９は、３階層に跨る場合の関係図である。例えば、下位層（ノード４０−７、４０−８、４０−９）がハードウエア、中間層（ノード４０−４、４０−５、４０−６）がソフトウエア、上位層（ノード４０−１、４０−２、４０−３）がユーザーなどの場合が考えられる。

上記複数階層に跨るベクトル化グラフ理論の具体例を図１０に示す。例えば、ユーザーＡは、ブラウザを操作し、そのブラウザはパーソナルコンピュータＰＣのオペレーティングシステムＯＳ上にプリインストールされたものであり、オペレーティングシステムはパーソナルコンピュータＰＣにインストールされたものであり、パーソナルコンピュータＰＣがサーバーと通信し、また、オーディオ・ビデオＡＶがオペレーティングシステムＯＳを監視する。さらに、ユーザーＡがアプリケーションを操作し、そのアプリケーションはスマートフォンＡにインストールされたものである。ユーザーＢがアプリケーションを操作し、そのアプリケーションはスマートフォンＢにインストールされたものであり、スマートフォンＡ、Ｂ間で無線通信を行い、ユーザーＣが、サーバーを管理する。このような複数の階層間の関連性をベクトル化グラフ理論によって表すことができる。

本発明のベクトル化グラフ理論は、１つまたは複数のコンピュータ装置、あるいはネットワークを介して接続されたコンピュータ装置またはサーバーにおけるハードウエア、ソフトウエア、あるいはソフトウエアとハードウエアとの組合せにより実施される。

次に、本発明の実施例について説明する。図１１は、本発明の実施例に係るベクトル化グラフ理論を用いた解析システムの全体構成を示すブロック図である。本実施例の解析システム１００は、学習用データ１１０、評価用データ１２０、ベクトル化モジュール１３０、ベクトル化グラフデータ１４０、ベクトル化グラフ解析モジュール１５０、グラフ変換モジュール１６０、グラフデータ１７０、グラフ解析モジュール１８０を含む。好ましくは、解析システム１００は、メモリ等の記憶媒体や、ソフトウエア／プログラム等を実行するためのプロセッサ等を備えた汎用的なコンピュータ装置によって実施される。１つの態様では、コンピュータ装置は、ベクトル化モジュール１３０、グラフ変換モジュール１６０、ベクトル化グラフ解析モジュール１５０、およびグラフ解析モジュール１８０の機能を実行するためのソフトウエア／プログラムを実行し、ノード間の関連性の解析結果をディスプレイ等の表示手段から出力することができる。

学習用データ１１０は、解析システム１００の学習のために用いられるデータである。例えば、解析システム１００は、学習用データを機械学習処理することで、ｗｏｒｄ２ｖｅｃなどから得られるベクトルデータ（例えば、単語間の意味的な類似関係をベクトルで表したデータ）を生成し、これを辞書に格納する。種々の学習機能を実行することで、解析効率や解析精度が向上される。例えば、解析システム１００が複雑な人間関係などを解析する場合には、そのために必要な学習用データを処理し、そのためのベクトルデータを備えていることが望ましい。学習データ１１０は、記憶媒体から読み出され、あるいは外部（例えば、記憶装置やネットワークを介してリソース）から取り込まれる。学習用データ１１０は、上記のＮ次元のベクトル生成に使用される文書データである。例えば、図１２（Ａ）に示すように、青空文庫の文章や、wikipediaの文書や、コーパスなど種々の情報や媒体が用いられる。

一方、評価用データ１２０は、解析システム１００により解析されるデータであり、記憶媒体から読み出され、あるいは外部から取り込まれる。人間関係の解析を行う場合、評価用データ１２０は、例えば、図１２（Ｂ）に示すように、複数の人物が登場し、その中で種々の情報のやり取りが記載された電子メールであることができる。

ベクトル化モジュール１３０は、評価用データ１２０から、人間関係の類推を行う。その類推された関係を、生成したＮ次元のベクトルデータを用いて、ベクトル化する。１つの例では、ＡさんからＢさんへのメールを形態素解析し、全単語の平均ベクトルを、ＡさんとＢさんの関係、および関係ベクトルとみなす。その関係ベクトルと最も近いベクトルを上記辞書に格納されたベクトルデータから抽出し、そのベクトルが示す関係を、ＡさんとＢさんの関係とみなす。ＡさんからＢさんへのメールなので、メールの全文章に両者の関係と相関する単語が使用されていることが想定される。それ故、全単語の平均ベクトルによりＡさんとＢさんの関係が類推される。なお、ＡさんからＢさんへのメールは、例えば、複数の受信メールの中から、送信者の名前、受信者の名前を識別することで抽出するようにしてもよい。

また、ベクトル化モジュール１３０により学習用データ１１０が処理されるとき、その学習結果は辞書にベクトルデータとして格納される。図１３（Ａ）に辞書に格納されるベクトルデータの一例を示す。辞書データは、ノード間の関連性を表す単語をＮ次元でベクトル化するためのベクトルデータを含んでいる。例えば、辞書に格納された「好き」という単語のＮ次元のベクトルデータを参照して、図１３（Ｂ）に示すようなソースとディスティネーションとのノード間の関係を表すＮ次元のベクトル化グラフデータが生成される。

ベクトル化モジュール１３０により評価用データ１２０が処理されるとき、ベクトル化モジュール１３０は、辞書に格納されたベクトルデータを参照し、評価用データ１２０のノード間の関連性を表すＮ次元のベクトルを抽出し、つまり、ソースとディスティネーションとの関係をＮ次元でベクトル化したベクトル化グラフデータを生成する。図１３（Ｂ）は、ベクトル化グラフデータの一例であり、ソースとディスティネーションとがＮ次元のベクトルにより定義される。生成されたベクトル化グラフデータは、記憶媒体に格納され、その後、ベクトル化グラフ解析モジュール１５０により解析される。

図１４に、ベクトル化モジュール１３０の動作フローを示す。解析システム１００が学習機能を実行する場合、ベクトル化モジュール１３０は、学習用データ１１０を収集し（Ｓ１００）、収集したデータに基づきベクトルデータを生成し（Ｓ１０２）、生成したベクトルデータを辞書に格納する（Ｓ１０４）。

他方、解析システム１００が評価用データを解析する場合、ベクトル化モジュール１３０は、評価用データ１２０を収集し（Ｓ１１０）、収集したデータに基づき従来型のグラフデータを作成する（Ｓ１１２）。従来型のグラフは、例えば、図１５（Ａ）に示すように、ソースとディスティネーションとの関係を表したグラフ、あるいは図１５（Ｂ）に示すように、ソースとディスティネーションとの関係を重み付けで表した重み付けグラフであり、Ｎ次元でベクトル化されていないグラフである。次に、ベクトル化モジュール１３０は、辞書に格納されたベクトルデータを参照し、ノード間の予測した関係をベクトル化し（Ｓ１１６）、そのベクトルを作成済みの従来型のグラフに割り当て、Ｎ次元のベクトル化グラフデータを生成する（Ｓ１１８）。生成されたベクトル化グラフデータは、ベクトル化グラフ解析モジュール１５０へ提供され、そこで解析が行われる。

図１６に、ベクトル化モジュール１３０の具体的な動作フローを示す。学習機能が実行されるとき、ベクトル化モジュール１３０は、学習用テキストファイルを収集し（Ｓ２００）、ｗｏｒｄ２ｖｅｃを実行してベクトルデータを生成し（Ｓ２０２）、生成したベクトルデータを辞書に格納する（Ｓ２０４）。また、解析が実行されるとき、ベクトル化モジュール１３０は、評価用電子メールを収集し（Ｓ２１０）、送信者と受信者間のグラフを作成し（Ｓ２１２）、送信者と受信者間の電子メールの文章から関係を予測し（Ｓ２１４）、辞書を参照して予測した関係をベクトル化し（Ｓ２１６）、関係ベクトルを作成済みのグラフに割り当て、ベクトル化グラフを生成する（Ｓ２１８）。

次に、グラフ変換モジュール１６０について説明する。図１７（Ａ）は、グラフ変換モジュール１６０により関係を抽出するときの動作フローである。関係の抽出は、例えば、図６（Ｂ）、（Ｃ）に示すような信頼グラフや嫌いグラフの抽出である。グラフ変換モジュール１６０は、ベクトル化モジュール１３０により生成されたベクトルデータから抽出ベクトルを入力する（Ｓ３００）。抽出ベクトルは、例えば、信頼グラフを生成する場合には、図６（Ａ）の信頼ベクトルである。次に、グラフ変換モジュール１６０は、抽出ベクトルと全関係ベクトルの内積を計算し（Ｓ３０２）、上記内積を重みとする重み付けグラフを作成する（Ｓ３０４）。

図１７（Ｂ）は、グラフ変換モジュール１６０により関係強度を抽出するときの動作フローである。関係強度の抽出は、例えば、図７に示すような感情の強さのみの抽出である。この場合には、グラフ変換モジュール１６０は、各関係ベクトルの自己との内積を計算し（Ｓ３１０）、次に、上記内積を重みとする重み付けグラフを作成する（Ｓ３１２）。

グラフ変換モジュール１６０の変換結果は、グラフデータ１７０として記憶媒体に格納される。グラフデータ１７０は、図１５（Ａ）、（Ｂ）に示すように、ベクトル化されていない通常のグラフデータや、重み付けされた重み付けグラフデータである。

グラフ解析モジュール１８０は、グラフデータ１７０に基づきグラフを解析する。図１８にグラフ解析モジュール１８０の動作フローの一例を示す。グラフ理論には、“密度”という指標があり、それを計算するフローである。グラフ解析モジュール１８０は、グラフデータ１７０を入力し（Ｓ４００）、入力されたグラフデータに基づきノード数を取得し（Ｓ４０２）、かつエッジ数を取得し（Ｓ４０４）、上記ノード数およびエッジ数から密度を計算する（Ｓ４０６）。密度の計算は、density＝ｍ／ｎ（ｎ−１）で表される。ｎは、ノード数、ｍは、エッジ数である。

ベクトル化グラフ解析モジュール１５０は、ベクトル化グラフデータ１４０に基づきベクトル化グラフを解析する。図１９に、本実施例のベクトル化グラフ解析モジュール１９０の動作フローの一例を示す。ここでは、全関係ベクトルの平均をとった平均ベクトルを求める例である。例えば、解析対象が組織内の人間関係であるとき、平均ベクトルにより組織内の均した関係がわかる。

ベクトル化グラフ解析モジュール１５０は、ベクトル化グラフデータ１４０を入力し（Ｓ５００）、入力されたベクトル化グラフデータに基づき全関係ベクトルの平均ベクトルを計算する（Ｓ５０２）。関係ベクトルとは、ノード間の関係を表すベクトルである。次に、ベクトル化グラフ解析モジュール１５０は、辞書データから上記平均ベクトルと類似のベクトルを取得し（Ｓ５０４）、類似のベクトルの単語を抽出する（Ｓ５０６）。この単語から、例えば、組織内の平均的な関係がわかる。

本発明のベクトル化グラフ理論は、上記の説明以外にも、従来のグラフ理論への応用が可能である。例えば、指数に関しては、ノード（次数）、部分・ルート（次数、距離）、グラフ（密度、相互性、推移性）、グラフ間（同型）に応用することが可能であり、問題に関しては、ノード（ランキング問題、分類）、部分・ルート（クラスタリング、リンク予測、最小全域木問題、最短経路問題）、グラフ（頂点彩色問題）に応用することが可能である。

以上、本発明の好ましい実施の形態について詳述したが、本発明は、特定の実施形態に限定されるものではなく、特許請求の範囲に記載された発明の要旨の範囲において、種々の変形、変更が可能である。

１００：解析システム
１１０：学習用データ
１２０：評価用データ
１３０：ベクトル化モジュール
１４０：ベクトル化グラフデータ
１５０：ベクトル化グラフモジュール
１６０：グラフ変換モジュール
１７０：グラフデータ
１８０：グラフ解析モジュール

Claims

ノード間の関連性を表すグラフ理論を用いた解析方法であって、
辞書データに基づきノード間の関連性を表すＮ次元のベクトルを算出するステップと、
算出されたＮ次元のベクトルによりベクトル化されたグラフデータを作成するステップと、を含む解析方法。
前記算出するステップは、テキストデータから単語を抽出し、単語間の意味的な類似度を表すＮ次元のベクトルを算出する、請求項１に記載の解析方法。
前記辞書データは、単語間の類似度を表すベクトルデータを含む、請求項１または２に記載の解析方法。
前記算出するステップは、学習用データをｗｏｒｄ２ｖｅｃにより処理することで単語間の類似度を表すベクトルデータを生成することを含む、請求項１ないいし３いずれか１つに記載の解析方法。
前記算出するステップは、解析対象のデータからノード間の関係を予測し、前記辞書データを参照して予測した関係をベクトル化する、請求項１ないし４いずれか１つに記載の解析方法。
前記算出するステップは、解析対象のデータを形態素解析し、解析された単語の平均ベクトルに基づきノード間の関係を予測する、請求項５に記載の解析方法。
解析方法はさらに、ベクトル化されたグラフデータを他のグラフデータに変換するステップを含む、請求項１ないし６いずれか１つに記載の解析方法。
前記変換するステップは、ベクトル化されたグラフデータのベクトルの内積を計算することで重み付けされたグラフデータに変換することを含む、請求項６に記載の解析方法。
解析方法はさらに、ベクトル化されたグラフデータに基づきノード間の関連性を解析するステップを含む、請求項１ないし８いずれか１つに記載の解析方法。
前記解析するステップは、人間関係を解析する、請求項９に記載の解析方法。
前記解析するステップは、ベクトル化されたグラフデータに基づきノード間の全ベクトルの平均ベクトルを計算し、平均ベクトルと類似する類似のベクトルを辞書から選択し、選択された類似のベクトルの単語を抽出する、請求項９または１０に記載の解析方法。
ノード間の人間関係を表すグラフ理論を用いた解析方法であって、
単語間の類似度を表すベクトルデータを辞書データとして用意し、
解析対象のデータからノード間の人間関係を予測し、
予測した人間関係を前記辞書データを参照してベクトル化し、人間関係をＮ次元のベクトルによりベクトル化されたグラフデータを作成し、
作成されたベクトル化グラフデータに基づき人間関係を解析する、解析方法。
コンピュータ装置が実行するグラフ理論を用いた解析プログラムであって、
辞書データに基づきノード間の関連性を表すＮ次元のベクトルを算出するステップと、
算出されたＮ次元のベクトルによりベクトル化されたグラフデータを作成するステップと、を含む解析プログラム。
グラフ理論を用いた解析システムであって、
辞書データに基づきノード間の関連性を表すＮ次元のベクトルを算出する算出手段と、
算出されたＮ次元のベクトルによりベクトル化されたグラフデータを作成する作成手段と、を含む解析システム。