JP7099976B2

JP7099976B2 - 情報管理装置および情報管理方法

Info

Publication number: JP7099976B2
Application number: JP2019054851A
Authority: JP
Inventors: 真理奈藤田; 宏視荒
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-03-22
Filing date: 2019-03-22
Publication date: 2022-07-12
Anticipated expiration: 2039-03-22
Also published as: JP2020154991A; WO2020195545A1

Description

本発明は、情報を階層化して管理可能な情報管理装置および情報管理方法に関する。

利用者が必要な情報を取得し易くするために、情報を階層的に分類する技術が提案されている。

例えば、特許文献１には、経路パタン抽出部は、比較概念選択部で選択された概念を含むカテゴリを含む経路を情報分類階層において特定し、当該経路に含まれる各カテゴリの概念に対し、上位のカテゴリの概念とどのような関係にあるかの情報を設定し、当該各カテゴリの概念を、入力受付部で入力されたユーザ指定概念を除き、抽象化することにより経路パタンを生成し、カテゴリ生成部は、経路パタンに含まれるカテゴリの概念を、上記設定した情報を満たすように置換することで、候補カテゴリを生成し、制御部は候補カテゴリを情報分類階層に追加し、出力部は情報分類階層を出力する技術が開示されている。

特開２０１２－４３２１２号公報

しかしながら、従来の情報分類階層は、ドキュメントの表記の揺れのみを考慮して構築され、項目の使われ方は考慮されていなかった。このため、同じ項目であっても、ドキュメントによっては記載内容が異なることがあり、必要な情報の取得に手間がかかることがあった。

本発明は、上記事情に鑑みなされたものであり、その目的は、使われ方が反映された情報を階層的に管理可能な情報管理装置および情報管理方法を提供することにある。

上記目的を達成するため、第１の観点に係る情報管理装置は、概念化された情報に割り当てられたノードの階層構造から所定ノードを抽出する抽出部と、前記抽出部にて抽出された前記所定ノードに紐付けられた下位ノードの情報に基づいて、前記抽出部で抽出された前記所定ノードを分類する分類部とを備える。

本発明によれば、使われ方が反映された情報を階層的に管理することができる。

図１は、実施形態に係る情報管理装置の構成例を示すブロック図である。図２は、図１のドキュメントの一例を示す図である。図３は、図１のドキュメントのその他の例を示す図である。図４は、図１のドキュメントのさらにその他の例を示す図である。図５は、図１のドキュメントのさらにその他の例を示す図である。図６（ａ）は、図２のドキュメントの項目が割り当てられたノードの階層構造を示す図、図６（ｂ）は、図３のドキュメントの項目が割り当てられたノードの階層構造を示す図である。図７（ａ）は、図６（ａ）の階層構造のノードの概念の意味解析に基づく統合例を示す図、図７（ｂ）は、図６（ｂ）の階層構造のノードの概念の意味解析に基づく概念の統合例を示す図、図７（ｃ）は、図４（ｂ）のドキュメントの項目に基づく階層構造のノードの概念の意味解析に基づく統合例を示す図である。図８（ａ）は、図６（ｂ）の階層構造についての下位ノードの統合または分割の対象となる所定ノードの抽出例を示す図、図８（ｂ）は、図５のドキュメントの項目に基づく階層構造についての下位ノードの統合または分割の対象となる所定ノードの抽出例を示す図である。図９（ａ）は、図７（ａ）の階層構造のノードの概念の抽象度解析に基づく統合例を示す図、図９（ｂ）は、図８（ａ）の階層構造のノードの概念の抽象度解析に基づく概念の統合例を示す図、図９（ｃ）は、図７（ｃ）の階層構造のノードの概念の抽象度解析に基づく統合例を示す図、図９（ｄ）は、図８（ｂ）の階層構造のノードの概念の抽象度解析に基づく統合例を示す図である。図１０は、図１のドキュメントから抽出された情報内容と項目との対応関係の一例を示す図である。図１１（ａ）は、各ドキュメントの生息環境に紐付く下位ノードの紐付き方のパタンの分類例を示す図、図１１（ｂ）は、図１１（ａ）のパタンＰ１の数理モデルの一例を示す図、図１１（ｃ）は、図１１（ａ）のパタンＰ２の数理モデルの一例を示す図、図１１（ｄ）は、図１１（ａ）のパタンＰ３の数理モデルの一例を示す図である。図１２（ａ）は、図１１（ｂ）のパタンＰ１に基づく下位ノードの分割例を示す図、図１２（ｂ）は、図１１（ｃ）のパタンＰ２に基づく下位ノードの分割例を示す図、図１２（ｃ）は、図１１（ｄ）のパタンＰ３に基づく下位ノードの分割例を示す図である。図１３（ａ）は、図７（ａ）の階層構造に基づく下位ノードの統合または分割の対象となる所定ノードのその他の抽出例を示す図、図１３（ｂ）は、図８（ｂ）の階層構造に基づく下位ノードの統合または分割の対象となる所定ノードのその他の抽出例を示す図である。図１４は、実施形態に係る下位構造に基づくパタン分類と数理モデル化処理を示すフローチャートである。図１５は、図１４のＳ１８の処理の具体例を示すフローチャートである。図１６は、実施形態に係る抽象度再設定に基づくノードの分割処理の一例を示すフローチャートである。図１７は、実施形態に係る抽象度再設定に基づくノードの分割処理のその他の例を示すフローチャートである。図１８は、実施形態に係る抽象度再設定に基づくノードの分割処理のさらにその他の例を示すフローチャートである。図１９は、図１の情報管理装置のハードウェア構成例を示すブロック図である。

実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また、実施形態の中で説明されている諸要素およびその組み合わせの全てが発明の解決手段に必須であるとは限らない。

実施形態に係る情報管理装置は、ドキュメントの表記の使われ方に基づいて情報を分類する。このとき、情報管理装置は、概念化された情報に割り当てられたノードの階層構造から所定ノードを抽出し、その所定ノードに紐付けられた下位ノードの情報に基づいて所定ノードを分類する。ノードは、例えば、ドキュメントの項目が割り当てられる。ノードは、ドキュメントの見出しが割り当てられてもよいし、ドキュメントのタイトルが割り当てられてもよい。ノードは、例えば、帳票などの項目名が割り当てられてもよい。

以下、実施形態に係る情報管理装置について、ドキュメントの項目がノードに割り当てられる場合を例にとって説明する。以下の説明では、“○○部は”と動作主体を記した場合、プロセッサがプログラムである○○部を読み出し、ＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）にロードした上で○○部の機能を実現することを意味するものとする。

図１は、実施形態に係る情報管理装置の構成例を示すブロック図である。
図１において、情報管理装置は、項目抽出部１、ノード候補生成部２、ノード抽出部３、ノード統合部４、分類部５、モデル化部６、ノード分割部７、シソーラス辞書８および概念モデル９を備える。

項目抽出部１は、ドキュメントＤ１～Ｄ４・・から項目を抽出し、その項目が割り当てられたノードの階層構造を生成する。このとき、項目抽出部１は、ノードに付される項目名として、ドキュメントＤ１～Ｄ４・・の記載をそのまま用いる。このため、ノードに付される項目名は、同一の概念の項目であっても、表記にバラツキが発生することがある。

ノード候補生成部２は、形態素解析および類語分析に基づいて、ドキュメントＤ１～Ｄ４・・から抽出された同一概念の項目の名称を統一する。このとき、ノード候補生成部２は、シソーラス辞書８を参照することができる。また、ノード候補生成部２は、ドキュメントＤ１～Ｄ４・・から抽出された単語の包含関係に基づいてノードの階層構造を修正する。例えば、所定ノードに紐付く下位ノードの概念が、所定ノードの概念に含まれない修飾語である場合、ノード候補生成部２は、その下位ノードを所定ノードに集約することができる。

ノード抽出部３は、ノードの階層構造から所定ノードを抽出する。例えば、ノード抽出部３は、所定ノードとして、下位ノードの階層が１段以下のノードを抽出することができる。所定ノードとして、下位ノードの階層が１段以下のノードを抽出することにより、所定ノードに紐付く下位ノードの項目に基づくパタン分類を容易化することができる。

ノード統合部４は、所定ノードに紐付く下位ノードの項目の抽象度を統合する。このとき、ノード統合部４は、概念モデル９を参照することができる。これにより、同一階層の項目であっても、上位概念で表記された項目名と、下位概念で表記された項目名とを一致させることができる。

分類部５は、所定ノードに紐付く下位ノードの項目に基づいて所定ノードを分類する。このとき、分類部５は、所定ノードに紐付く下位ノードの概念の組み合わせに基づいて、所定ノードを分類することができる。例えば、分類部５は、第１ノードに紐付く下位ノードの概念が、第２ノードに紐付く下位ノードの概念となり得ない場合、第１ノードと第２ノードを異なるグループに分類することができる。これにより、第１ノードの項目名と第２ノードの項目名とが等しい場合においても、第１ノードの項目と第２ノードの項目とは、使われ方が異なると判断することができる。

ここで、異なるグループに分類された所定ノードに割り当てられた項目は、表記が同じであっても、使われ方が異なると判断することができ、項目の使われ方が反映された情報の検索効率を向上させることができる。このため、報告書、設計書、企画書、論文、社内向けおよび社外向けなどの種類に応じて適正化されたドキュメントの作成を支援したり、採択率の良い論文の作成を支援したりすることができる。

モデル化部６は、所定ノードに紐付く下位ノードの情報に基づいて、下位ノードの紐付き方のモデルを推定する。このとき、モデル化部６は、分類部５にて同一グループに分類された所定ノードに紐付く下位ノードの紐付き方のパタンを生成することができる。このパタンは、複数のドキュメントＤ１～Ｄ４・・から抽出された項目に割り当てられた所定ノードに紐付く下位ノードのまとまり度またはバラツキ度を示すことができる。

モデル化部６は、下位ノードの紐付き方のモデルを推定する場合、所定ノードに紐付く下位ノードの情報内容を参照することができる。例えば、モデル化部６は、所定ノードに紐付く下位ノードの情報内容の要素に基づいて、下位ノードの紐付き方のモデルを推定することができる。下位ノードの情報内容の要素は、例えば、下位ノードの情報内容に含まれる単語である。この下位ノードの情報の紐付き方のモデルは、下位ノードの情報内容の情報量に基づいて構築してもよいし、下位ノードの情報内容の要素の類似性に基づいて構築してもよい。

ノード分割部７は、異なるグループに分類された所定ノードにそれぞれ紐付く下位ノードの項目を、各グループに特有の具体的な項目に分割し、そのノードの階層構造をグループごとに出力する。このとき、ノード分割部７は、モデル化部６にて推定されたモデルに基づいて、所定ノードに紐付く下位ノードの項目を分割することができる。これにより、ドキュメントＤ１～Ｄ４・・から同一概念の項目として抽出された場合においても、これらの項目の使われ方に違いに応じて項目名を異ならせることができ、項目の使われ方の違いが反映された検索を実現することができる。

シソーラス辞書８は、意味の類似性に基づいて単語を分類した辞書である。概念モデル９は、概念間の上下の関係性を示すモデルである。このとき、上位の階層は、下位の階層よりも抽象度を高くすることができる。概念モデル９は、例えば、オントロジーを用いることができる。

以下、図１の情報管理装置の処理について、実際のドキュメントを例にとって具体的に説明する。
図２は、図１のドキュメントの一例を示す図である。
図２において、ドキュメントＤ１には、クマノミの生態というタイトルが設けられている。ドキュメントＤ１は、生息環境、繁殖方法、採食方法、性別および生存期間という項目を含む。生息環境という項目は、水質、水深、温度、共生および生息海域という項目を含む。

水質という項目は、海水という情報内容を含む。水深という項目は、２０－４０ｍという情報内容を含む。温度という項目は、２４度という情報内容を含む。共生という項目は、イソギンチャクという情報内容を含む。生息海域という項目は、インド太平洋および赤道付近という情報内容を含む。

図３は、図１のドキュメントのその他の例を示す図である。
図３において、ドキュメントＤ２には、ドビウオの生態というタイトルが設けられている。ドキュメントＤ２は、生息環境、繁殖方法、餌接種方法、性別および寿命という項目を含む。生息環境という項目は、水質、水深、温度および生息地域という項目を含む。

水質という項目は、海水という情報内容を含む。水深という項目は、１ｍという情報内容を含む。生息地域という項目は、太平洋、インド洋および大西洋という情報内容を含む。

図４は、図１のドキュメントのさらにその他の例を示す図である。
図４において、ドキュメントＤ３には、パンダの生態というタイトルが設けられている。ドキュメントＤ３は、形態、生息地域、繁殖方法、採食方法および寿命という項目を含む。形態という項目は、大きさ、体毛および鳴き声という項目を含む。大きさという項目は、全長および体重という項目を含む。鳴き声という項目は、おすおよびめすという項目を含む。生息地域という項目は、国名および生息環境という項目を含む。生息環境という項目は、温帯および竹林という項目を含む。

体重という項目は、ｋｇという情報内容を含む。おすという項目は、ニャーニャーという情報内容を含む。めすという項目は、ミャンミャンという情報内容を含む。国名という項目は、中国という情報内容を含む

図５は、図１のドキュメントのさらにその他の例を示す図である。
図５において、ドキュメントＤ４には、ライオンの生態というタイトルが設けられている。ドキュメントＤ４は、形態、生息地域、繁殖方法、採食方法、社会システムおよび寿命という項目を含む。形態という項目は、大きさ、体毛および鳴き声という項目を含む。大きさという項目は、全長および体重という項目を含む。生息地域という項目は、国名および生息環境という項目を含む。生息環境という項目は、亜熱帯および草地という項目を含む。国名という項目は、アフリカという情報内容を含む。

図６（ａ）は、図２のドキュメントの項目が割り当てられたノードの階層構造を示す図、図６（ｂ）は、図３のドキュメントの項目が割り当てられたノードの階層構造を示す図である。
図６（ａ）において、項目抽出部１は、図２のドキュメントＤ１からタイトルおよび項目を抽出する。そして、項目抽出部１は、クマノミの生態というタイトルにノードＮ１１１を割り当てる。

項目抽出部１は、生息環境、繁殖方法、採食方法、性別および生存期間という項目にノードＮ１２１～Ｎ１２５をそれぞれ割り当てる。項目抽出部１は、水質、水深、温度、共生および生息海域という項目にノードＮ１３１～Ｎ１３５をそれぞれ割り当てる。項目抽出部１は、ノードＮ１１１にノードＮ１２１～Ｎ１２５を紐付け、ノードＮ１２１にノードＮ１３１～Ｎ１３５を紐付ける。

図６（ｂ）において、図１の項目抽出部１は、図３のドキュメントＤ２からタイトルおよび項目を抽出する。そして、項目抽出部１は、トビウオの生態というタイトルにノードＮ２１１を割り当てる。

項目抽出部１は、生息環境、繁殖方法、餌接種方法、性別および寿命という項目にノードＮ２２１～Ｎ２２５をそれぞれ割り当てる。項目抽出部１は、水質、水深、温度および生息地域という項目にノードＮ２３１～Ｎ２３４をそれぞれ割り当てる。項目抽出部１は、ノードＮ２１１にノードＮ２２１～Ｎ２２５を紐付け、ノードＮ２２１にノードＮ２３１～Ｎ２３４を紐付ける。

ここで、図６（ａ）のノードＮ１２３の採食方法という項目と、図６（ｂ）のノードＮ２２３の餌接種方法という項目とは、同一概念であるが、項目抽出部１は、ドキュメントＤ１、Ｄ２の表記をそのまま用いる。また、図６（ａ）のノードＮ１２５の生存期間という項目と、図６（ｂ）のノードＮ２２５の寿命という項目とは、同一概念であるが、項目抽出部１は、ドキュメントＤ１、Ｄ２の表記をそのまま用いる。

図７（ａ）は、図６（ａ）の階層構造のノードの概念の意味解析に基づく統合例を示す図、図７（ｂ）は、図６（ｂ）の階層構造のノードの概念の意味解析に基づく概念の統合例を示す図、図７（ｃ）は、図４（ｂ）のドキュメントの項目に基づく階層構造のノードの概念の意味解析に基づく統合例を示す図である。
図７（ａ）において、図１のノード候補生成部２は、形態素解析に基づいて、ノードＮ１１１のクマノミの生態というタイトルから生態という項目を抽出し、ノードＮ１１１の名称を生態という項目に変更する。また、ノード候補生成部２は、類語分析に基づいて、ノードＮ１２５の生存期間という項目を寿命という項目に変更する。

図７（ｂ）において、ノード候補生成部２は、形態素解析に基づいて、ノードＮ２１１のトビウオの生態というタイトルから生態という項目を抽出し、ノードＮ２１１の名称を生態という項目に変更する。また、ノード候補生成部２は、類語分析に基づいて、ノードＮ２２３の餌接種方法という項目を繁殖方法という項目に変更する。

これにより、ノード候補生成部２は、ドキュメントＤ１、Ｄ２において同一概念の項目の表記が異なる場合においても、同一概念の項目の表記を統合することができる。

図７（ｃ）において、図１の項目抽出部１は、図４のドキュメントＤ３からタイトルおよび項目を抽出する。そして、項目抽出部１は、パンダの生態というタイトルにノードＮ３１１を割り当てる。

項目抽出部１は、生息地域、形態、採食方法、繁殖方法および寿命という項目にノードＮ３２１～Ｎ３２５をそれぞれ割り当てる。項目抽出部１は、国名、生息環境、大きさ、体毛および鳴き声という項目にノードＮ３３１～Ｎ３３５をそれぞれ割り当てる。項目抽出部１は、温帯、竹林、全長、体重、おすおよびめすという項目にノードＮ３４１～Ｎ３４６をそれぞれ割り当てる。項目抽出部１は、ノードＮ３１１にノードＮ３２１～Ｎ３２５を紐付け、ノードＮ３２１にノードＮ３３１、Ｎ３２２を紐付け、ノードＮ３２２にノードＮ３３３～Ｎ３３５を紐付け、ノードＮ３３２にノードＮ３４１、Ｎ３４２を紐付け、ノードＮ３３３にノードＮ３４３、Ｎ３４４を紐付け、ノードＮ３３５にノードＮ３４５、Ｎ３４６を紐付ける。

ここで、項目抽出部１は、ノードＮ３４１の温帯という項目に対して、温帯の上位概念の仮項目Ｘ１を設定し、ノードＮ３４２の竹林という項目に対して、竹林の上位概念の仮項目Ｘ２を設定することができる。

次に、ノード候補生成部２は、形態素解析に基づいて、ノードＮ３１１のパンダの生態というタイトルから生態という項目を抽出し、ノードＮ３１１の名称を生態という項目に変更する。また、ノード候補生成部２は、ノードＮ３４５のおすという項目の概念およびノードＮ３４６のめすという項目の概念が、ノードＮ３３５の鳴き声という項目の概念に含まれるどうかを判断する。また、ノード候補生成部２は、ノードＮ３４５のニャーニャーという情報内容およびノードＮ３４６のミャンミャンという情報内容が、ノードＮ３３５の鳴き声という項目の概念に含まれるどうかを判断する。

そして、ノード候補生成部２は、ノードＮ３４５のおすという項目の概念およびノードＮ３４６のめすという項目の概念が、ノードＮ３３５の鳴き声という項目の概念に含まれないが、ノードＮ３４５のニャーニャーという情報内容およびノードＮ３４６のミャンミャンという情報内容が、ノードＮ３３５の鳴き声という項目の概念に含まれる場合、ノードＮ３４５のおすという項目およびノードＮ３４６のめすという項目は、単なる修飾語と判断し、ノードＮ３４５、Ｎ３４６をノードＮ３３５に集約する。

図８（ａ）は、図６（ｂ）の階層構造についての下位ノードの統合または分割の対象となる所定ノードの抽出例を示す図、図８（ｂ）は、図５のドキュメントの項目に基づく階層構造についての下位ノードの統合または分割の対象となる所定ノードの抽出例を示す図である。
図８（ａ）において、図１のノード抽出部３は、ノード候補生成部２にて図７（ｂ）のノードの階層構造が生成されると、下層構造が１段である下位ノードＮ２３１～Ｎ２３４に紐付くノードＮ２２１を抽出する。

図８（ｂ）において、図１の項目抽出部１は、図５のドキュメントＤ４からタイトルおよび項目を抽出する。そして、項目抽出部１は、ライオンの生態というタイトルにノードＮ４１１を割り当てる。

項目抽出部１は、生息地域、形態、採食方法、繁殖方法、寿命および社会システムという項目にノードＮ４２１～Ｎ４２６をそれぞれ割り当てる。項目抽出部１は、国名、生息環境、大きさ、体毛および鳴き声という項目にノードＮ４３１～Ｎ４３５をそれぞれ割り当てる。項目抽出部１は、亜熱帯、草原、全長および体重という項目にノードＮ４４１～Ｎ４４４をそれぞれ割り当てる。項目抽出部１は、ノードＮ４１１にノードＮ４２１～Ｎ４２６を紐付け、ノードＮ４２１にノードＮ４３１、Ｎ４２２を紐付け、ノードＮ４２２にノードＮ４３３～Ｎ４３５を紐付け、ノードＮ４３２にノードＮ４４１、Ｎ４４２を紐付け、ノードＮ４３３にノードＮ４４３、Ｎ４４４を紐付ける。

ここで、項目抽出部１は、ノードＮ４４１の亜熱帯という項目に対して、亜熱帯の上位概念の仮項目Ｙ１を設定し、ノードＮ４４２の草原という項目に対して、草原の上位概念の仮項目Ｙ２を設定することができる。

ノード抽出部３は、項目抽出部１にて図８（ｂ）のノードの階層構造が生成されると、下層構造が１段である下位ノードＮ４４１、Ｎ４４２に紐付くノードＮ４３２を抽出することができる。あるいは、ノード抽出部３は、下層構造が１段である下位ノードＮ４４３、Ｎ４４４に紐付くノードＮ４３３抽出してもよい。

図９（ａ）は、図７（ａ）の階層構造のノードの概念の抽象度解析に基づく統合例を示す図、図９（ｂ）は、図８（ａ）の階層構造のノードの概念の抽象度解析に基づく概念の統合例を示す図、図９（ｃ）は、図７（ｃ）の階層構造のノードの概念の抽象度解析に基づく統合例を示す図、図９（ｄ）は、図８（ｂ）の階層構造のノードの概念の抽象度解析に基づく統合例を示す図である。

図９（ａ）において、図１のノード抽出部３は、図７（ａ）のノードの階層構造から、下層構造が１段である下位ノードＮ１３１～Ｎ１３５に紐付くノードＮ１２１を抽出したものとする。また、図９（ｂ）において、ノード抽出部３は、図７（ｂ）のノードの階層構造から、下層構造が１段である下位ノードＮ２３１～Ｎ２３４に紐付くノードＮ２２１を抽出したものとする。

そして、ノード統合部４は、抽象度解析に基づいて、図９（ａ）の下位ノードＮ１３５の生息海域という項目を生息地域という項目に統合する。これにより、図９（ａ）の下位ノードＮ１３５の項目名を、図９（ｂ）の下位ノードＮ２３４の項目名に一致させることができ、下位ノードの表記の揺れを除去することができる。

また、図９（ｃ）において、ノード抽出部３は、図７（ｃ）のノードの階層構造から、下層構造が１段である下位ノードＮ３４１～Ｎ３４２に紐付くノードＮ３３２を抽出したものとする。さらに、図９（ｄ）において、ノード抽出部３は、図８（ｂ）のノードの階層構造から、下層構造が１段である下位ノードＮ４４１～Ｎ４４２に紐付くノードＮ４３２を抽出したものとする。

そして、ノード統合部４は、抽象度解析に基づいて、下位ノードＮ３４１の仮項目Ｘ１を気候という項目に統合し、下位ノードＮ３４２の仮項目Ｘ２を植生という項目に統合する。さらに、ノード統合部４は、抽象度解析に基づいて、下位ノードＮ４４１の仮項目Ｙ１を気候という項目に統合し、下位ノードＮ４４２の仮項目Ｙ２を植生という項目に統合する。これにより、図９（ｃ）の下位ノードＮ３４１、Ｎ３４２の項目名と、図９（ｂ）の下位ノードＮ４４１、Ｎ４４２の項目名とをそれぞれ一致させることができ、下位ノードの表記の揺れを除去することができる。

図１０は、図１のドキュメントから抽出された情報内容と項目との対応関係の一例を示す図である。
図１０において、概念モデル９は、例えば、海水、汽水および淡水という下位概念を水質という上位概念に関連付け、インド太平洋、赤道付近の海域、インド洋、太平洋、東アジア河川という下位概念を生息地域という上位概念に関連付け、温帯および亜熱帯という下位概念を気候という上位概念に関連付け、草原および竹林という下位概念を植生という上位概念に関連付ける。

ノード統合部４は、概念モデル９を参照することにより、抽象度の異なる下位ノードの概念の項目名を統合することができる。例えば、図２のドキュメントＤ１には、インド太平洋および赤道付近という情報内容に対して生息海域という項目が記載されている。このとき、図１０の概念モデル９には、インド太平洋および赤道付近の海域という情報内容に対して生息地域という項目が関連付けられている。このため、ノード統合部４は、図１０の概念モデル９を参照することにより、図９（ａ）の下位ノードＮ１３５の生息海域という項目を生息地域という項目に統合することができる。

また、概念モデル９には、温帯および亜熱帯という情報内容に対して気候という項目が関連付けられ、草原および竹林という情報内容に対して植生という項目が関連付けられている。このため、ノード統合部４は、図１０の概念モデル９を参照することにより、図９（ｃ）および図９（ｄ）の下位ノードＮ３４１、Ｎ４４１の仮項目Ｘ１、Ｙ１を気候という項目に統合し、下位ノードＮ３４２、Ｎ４４２の仮項目Ｘ２、Ｙ２を植生という項目に統合することができる。

図１１（ａ）は、各ドキュメントの生息環境に紐付く下位ノードの紐付き方のパタンの分類例を示す図、図１１（ｂ）は、図１１（ａ）のパタンＰ１の数理モデルの一例を示す図、図１１（ｃ）は、図１１（ａ）のパタンＰ２の数理モデルの一例を示す図、図１１（ｄ）は、図１１（ａ）のパタンＰ３の数理モデルの一例を示す図である。

図１１（ａ）において、例えば、クマノミ、トビウオ、イルカ、アユ、メダカ、パンダおよびライオンの生態に関するドキュメントについて、図１のノード抽出部３は、所定ノードとして生息環境という項目を抽出したものとする。

このとき、クマノミの生態に関するドキュメントについては、生息環境という項目に紐付く下位ノードの項目として、水質、水深、温度、生息地域および共生があり、トビウオの生態に関するドキュメントについては、生息環境という項目に紐付く下位ノードの項目として、水質、水深、温度および生息地域があり、イルカの生態に関するドキュメントについては、生息環境という項目に紐付く下位ノードの項目として、水質、水深および温度があるものとする。

また、アユの生態に関するドキュメントについては、生息環境という項目に紐付く下位ノードの項目として、水質、生息地域および流速があり、メダカの生態に関するドキュメントについては、生息環境という項目に紐付く下位ノードの項目として、水質および流速があるものとする。

さらに、パンダの生態に関するドキュメントおよびライオンの生態に関するドキュメントについては、生息環境という項目に紐付く下位ノードの項目として、気候および植生があるものとする。

そして、図１の分類部５は、生息環境という項目に紐付く下位ノードの項目に基づいて、クマノミ、トビウオ、イルカ、アユ、メダカ、パンダおよびライオンの生態に関する各ドキュメントにおける生息環境という項目を分類する。このとき、分類部５は、各ドキュメントにおける生息環境という項目を分類するための指標として、例えば、各ドキュメントの下位ノードの項目をベクトル化した時のベクトル間の距離を用いることができる。

このとき、分類部５は、下位ノードの項目の有無に応じて１または０という成分が付与されたベクトルを生成することができる。例えば、分類部５は、クマノミについては、（１，１，１，１，１，０，０，０）というベクトルを生成し、トビウオについては、（１，１，１，１，０，０，０，０）というベクトルを生成し、イルカについては、（１，１，１，０，０，０，０，０）というベクトルを生成し、アユについては、（１，０，０，１，０，１，０，０）というベクトルを生成し、メダカについては、（１，０，０，０，０，１，０，０）というベクトルを生成し、パンダおよびライオンについては、（０，０，０，０，０，０，１，１）というベクトルを生成する。

クマノミ、トビウオおよびイルカについては、ベクトル間の距離は１または２である。アユおよびメダカについては、ベクトル間の距離は１である。パンダおよびライオンについては、ベクトル間の距離は０である。クマノミ、トビウオおよびイルカは、アユおよびメダカと、距離が３以上離れている。クマノミ、トビウオおよびイルカは、パンダおよびライオンと、距離が５以上離れている。アユおよびメダカとは、パンダおよびライオンと、距離が４以上離れている。

このため、分類部５は、下位ノードのベクトル間の距離の閾値を３に設定することで、ベクトル間の距離が３より小さい下位ノードに紐付く生息環境という項目を同一グループに分類し、ベクトル間の距離が３以上の下位ノードに紐付く生息環境という項目を別グループに分類することができる。

なお、分類部５は、第１ノードに紐付く下位ノードの概念が、第２ノードに紐付く下位ノードの概念となり得ない場合、第１ノードと第２ノードを異なるグループに分類するようにしてもよい。例えば、パンダおよびライオンの生態についての気候および植生という項目は、クマノミ、トビウオ、イルカ、アユおよびメダカの生態についての項目とはなり得ない。このため、パンダおよびライオンについての生息環境という項目は、クマノミ、トビウオ、イルカ、アユおよびメダカについての生息環境という項目と別グループに分類することができる。また、アユおよびメダカの生態についての流速という項目は、クマノミ、トビウオおよびイルカの生態についての項目とはなり得ない。このため、アユおよびメダカについての生息環境という項目は、クマノミ、トビウオおよびイルカについての生息環境という項目と別グループに分類することができる。

次に、モデル化部６は、クマノミ、トビウオおよびイルカについての生息環境という項目への紐付き方を示す生息環境パタンＰ１、アユおよびメダカについての生息環境という項目への紐付き方を示す生息環境パタンＰ２およびパンダおよびライオンについての生息環境という項目への紐付き方を示す生息環境パタンＰ３を生成する。

このとき、モデル化部６は、各生息環境パタンＰ１～Ｐ３に紐付く下位ノードの情報に基づいて、各生息環境パタンＰ１～Ｐ３についての数理モデルを推定することができる。各生息環境パタンＰ１～Ｐ３の数理モデルでは、例えば、下位項目の存在確率、各生息環境パタンＰ１～Ｐ３の下位ノードのまとまり度または各下位項目に紐付く情報の分布モデルを用いることができる。下位項目に紐付く情報は、下位項目よりさらに下位の項目または情報内容を用いることができる。下位ノードのまとまり度は、生息環境パタンＰ１～Ｐ３ごとの下位項目の存在確率の分散に基づいて算出することができる。各生息環境パタンＰ１～Ｐ３に属するベクトルの代表ベクトルからの平均距離に基づいて下位ノードのまとまり度を求めてもよい。

例えば、図１１（ｂ）に示すように、生息環境パタンＰ１において、水質、水深、温度、生息地域および共生という項目の存在確率は、それぞれ１．０、１．０、１．０、０．６７、０．３３である。この結果、生息環境パタンＰ１についてのまとまり度は、０．４５となる。また、生息環境パタンＰ１の生息地域という項目において、太平洋という情報内容が０．５の割合で存在し、インド洋という情報内容が０．３の割合で存在するという分布モデルを生成することができる。

また、図１１（ｃ）に示すように、生息環境パタンＰ２において、水質、生息地域および流速という項目の存在確率は、それぞれ１．０、０．５、１．０である。この結果、生息環境パタンＰ２についてのまとまり度は０．７となる。また、生息環境パタンＰ２の水質という項目において、淡水という単語は出現するが、汽水および海水という単語は出現しない場合、（淡水、汽水、海水）＝（１．０，０．０，０．０）という分布モデルを生成することができる。さらに、生息環境パタンＰ２の生息地域という項目において、東アジア河川という単語は出現するが、それ以外に河川という単語は出現しない場合、（東アジア河川）＝（１．０）という分布モデルを生成することができる。

また、図１１（ｄ）に示すように、生息環境パタンＰ３において、気候および植生という項目の存在確率は、それぞれ１．０、１．０である。この結果、生息環境パタンＰ３についてのまとまり度は１．０となる。また、生息環境パタンＰ３の気候という項目において、亜熱帯および温帯という単語が均等に出現する場合、（亜熱帯、温帯）＝（０．５，０．５）という分布モデルを生成し、生息環境パタンＰ３の植生という項目において、竹林および草原という単語が均等に出現する場合、（竹林、草原）＝（０．５，０．５）という分布モデルを生成することができる。

図１２（ａ）は、図１１（ｂ）のパタンＰ１に基づく下位ノードの分割例を示す図、図１２（ｂ）は、図１１（ｃ）のパタンＰ２に基づく下位ノードの分割例を示す図、図１２（ｃ）は、図１１（ｄ）のパタンＰ３に基づく下位ノードの分割例を示す図である。

図１２（ａ）において、図１のノード分割部７は、生息環境パタンＰ１に紐付く下位ノードの項目を、生息環境パタンＰ１に特有の具体的な項目に分割する。例えば、ノード分割部７は、生息環境パタンＰ１の生息地域という項目では、太平洋およびインド洋などの海域を表す情報内容しか現れない場合、生息環境パタンＰ１の生息地域という項目を海域という項目に変更する。

また、図１２（ｂ）において、ノード分割部７は、生息環境パタンＰ２の生息地域という項目では、（東アジア河川）＝（１．０）という分布モデルを示す場合、生息環境パタンＰ２の生息地域という項目を河川域という項目に変更する。

ここで、生息環境パタンＰ１、Ｐ２に紐付く下位ノードの項目を、各生息環境パタンＰ１、Ｐ２に特有の具体的な項目に分割することにより、例えば、コイという淡水魚について論文を書くものとすると、アユおよびメダカの生態に関する生息環境パタンＰ２を参照することができる。このため、アユおよびメダカ以外のコイという淡水魚について論文を書く場合に、生息環境という項目から流速という項目が抜け落ちるのを防止することが可能となるとともに、生息環境という項目に水深などの余計な項目が挿入されるのを防止することができ、論文の品質を向上させることができる。

また、図１２（ｃ）において、ノード分割部７は、生息環境パタンＰ３の気候という項目では、気候を具体化した情報内容に偏りがない場合、生息環境パタンＰ３の気候という項目をそのまま維持する。また、ノード分割部７は、生息環境パタンＰ３の植生という項目では、植生を具体化した情報内容に偏りがない場合、生息環境パタンＰ３の植生という項目をそのまま維持する。

ここで、下位ノードの項目の情報内容に偏りがない場合、その項目の抽象度をそのまま維持することにより、寒帯に生息する動物または森林に生息する動物について論文を書く場合に、生息環境パタンＰ３を参照することができる。

図１３（ａ）は、図７（ａ）の階層構造に基づく下位ノードの統合または分割の対象となる所定ノードのその他の抽出例を示す図、図１３（ｂ）は、図８（ｂ）の階層構造に基づく下位ノードの統合または分割の対象となる所定ノードのその他の抽出例を示す図である。

図１３（ａ）において、図１のノード抽出部３は、図１の分類部５の処理結果が反映されたノードの階層構造から所定ノードを抽出する。例えば、ノード抽出部３は、図７（ａ）のノードＮ１２１の生息環境という項目の下位ノードＮ１３１～Ｎ１３５をパタンＰＡとしてノードＮ１２１の情報内容として設定する。このとき、生態という項目が割り当てられたノードＮ１１１の下位ノードＮ１２１～Ｎ１２５の階層は１段となる。このため、ノード抽出部３は、下位ノードの階層が１段以下のノードを抽出することにより、所定ノードとして生態という項目が割り当てられたノードＮ１１１を抽出することができる。この結果、図７（ａ）の階層構造からは抽出されなかった生態という項目についても、分類部５によるパタン分類の対象とすることができる。

また、図１３（ｂ）において、ノード抽出部３は、図８（ｂ）のノードＮ４３２の生息環境という項目の下位ノードＮ４４１、Ｎ４４２をパタンＰＢとしてノードＮ４３２の情報内容として設定する。このとき、生息地域という項目が割り当てられたノードＮ４２１の下位ノードＮ４３１、Ｎ４３２の階層は１段となる。このため、ノード抽出部３は、下位ノードの階層が１段以下のノードを抽出することにより、所定ノードとして生息地域という項目が割り当てられたノードＮ４２１を抽出することができる。この結果、図８（ｂ）の階層構造からは抽出されなかった生息地域という項目についても、分類部５によるパタン分類の対象とすることができる。

図１４は、実施形態に係る下位構造に基づくパタン分類と数理モデル化処理を示すフローチャートである。
図１４において、分析対象のノード名Ｎと、ノード名Ｎの下位ノード名リストを取得する（Ｓ１１）。

次に、全ドキュメントからノード名Ｎのノードを抽出し、ノードｉの下位ノードベクトルをｖ_ｉとして、抽出した全ノードにそれぞれ対応する下位ノードベクトルｖ_ｉを算出する（Ｓ１２）。下位ノードベクトルｖ_ｉは、ノード名Ｎのあるノードｉに実際に紐付く下位ノード群と、ノード名Ｎの下位ノード名リストＭに記載されるノード情報との対応関係を数値化したベクトルである。

次に、下位ノードベクトルｖ_ｉをクラスタリングして、全ドキュメントから抽出したノード名ＮのノードをＫ（Ｋは正の整数）個のグループに分類する（Ｓ１３）。クラスタリングは、任意のクラスタリング手法を用いることができる。例えば、予め分類数を決めてＫ－ｍｅａｎｓ法で分類し、ベクトル間の類似度に関する閾値を任意に設定して階層型クラスタリングを実施することができる。

次に、ｋ＝１に設定する（Ｓ１４）。

次に、ｋ番目のクラスタリンググループに属するノードをノード名Ｎのｋパターンノードとして、グループｉｄであるｋ^Ｎを付与する（Ｓ１５）。

次に、ｋ^Ｎグループのノードの下位ノードベクトルｖ_ｉの平均ベクトルを、ｋ^Ｎグループのノードに各下位ノードが紐付く確率ベクトルＰ_ｋＮとして算出する（Ｓ１６）。

また、ｋ^Ｎグループのノードのバラツキ度の指標σ_ｋＮとして、ｋ^Ｎグループのノードの下位ノードベクトルｖ_ｉの分散を計算する（Ｓ１７）。

次に、ｋ^Ｎグループのノードの各下位ノードに実際に格納される情報内容の数理モデルを推定する（Ｓ１８）。

次に、ｋ＝ｋ＋１に設定する（Ｓ１９）。

次に、ｋ≦Ｋかどうかを判断する（Ｓ２０）。ｋ≦Ｋの場合、Ｓ１５の処理に戻り、ｋ≦Ｋでない場合、処理を終了する。

図１５は、図１４のＳ１８の処理の具体例を示すフローチャートである。
図１５において、ｋ^Ｎグループのノードに紐付く下位ノード名数Ｍ（Ｍは正の整数）を取得する（Ｓ３１）。

次に、ｍ＝１に設定する（Ｓ３２）。

次に、ｋ^Ｎグループのノードｓ（ｓ＝１，…，Ｓ（Ｓは正の整数））に関して、その下位ノードｍに格納されている情報内容ｙ_ｓ ^ｍ（ｓ＝１，…，Ｓ）を抽出する（Ｓ３３）。このとき、ノードsが、下位ノードｍと紐付いていない場合、ｙ_ｓ ^ｍ＝０とする。

次に、ベースとなる数理モデルＹ_ｍが存在するか判断する（Ｓ３４）。例えば、身長という項目が割り当てられたノードのベースモデルは、正規分布とすることができる。

次に、ベースとなる数理モデルＹ_ｍが存在する場合、情報内容ｙ_ｓ ^ｍに基づき数理モデルＹ_ｍのパラメータを計算し、ｋ^Ｎグループの下位ノードｍの情報内容ｙ_ｓ ^ｍに関する数理モデルＹ_ｍ ^ｋＮを算出し（Ｓ３５）、Ｓ４０に進む。

一方、ベースとなる数理モデルＹ_ｍが存在しない場合、下位ノードｍに格納され得る各要素ｚの情報内容ｙ_ｓ ^ｍにおける存在確率ｐ_ｍ ^ｋＮ（ｚ）を算出する（Ｓ３６）。

次に、情報内容ｙ_ｓ ^ｍに同時に複数の要素ｚが存在するかを判断する（Ｓ３７）。

情報内容ｙ_ｓ ^ｍに同時に複数の要素ｚが存在する場合、それらの要素ｚについてｚ＊ｐ_ｍ ^ｋＮ（ｚ）の総和をとることで数理モデルＹ_ｍ ^ｋＮを算出し（Ｓ３８）、Ｓ４０に進む。

一方、情報内容ｙ_ｓ ^ｍに同時に複数の要素ｚが存在しない場合、存在確率ｐ_ｍ ^ｋＮ（ｚ）の全要素ｚに関するベクトルＰ_ｍ ^ｋＮを、数理モデルＹ_ｍ ^ｋＮに格納する（Ｓ３９）。

次に、ｍ＝ｍ＋１に設定する（Ｓ４０）。

次に、ｍ≦Ｍかどうかを判断する（Ｓ４１）。ｍ≦Ｍの場合、Ｓ３２の処理に戻り、ｍ≦Ｍでない場合、処理を終了する。

図１６は、実施形態に係る抽象度再設定に基づくノードの分割処理の一例を示すフローチャートである。
図１６において、ｋが異なる複数のグループｋ^Ｎにおいて、それぞれＤ（Ｄは正の整数）個以上のデータを有する下位ノードｕ（ｕ＝１，…，Ｕ（Ｕは正の整数））を抽出する（Ｓ５１）。Ｄは、任意に設定した閾値である。例えば、Ｄ＝１としたとき、図１１（ｃ）の例では、水質と生息地域のノードが抽出される。

次に、ｕ＝１に設定する（Ｓ５２）。

次に、グループ間で下位ノードｕに格納され得る要素（ｐ＞０となる要素）を比較し、対象グループの要素を説明するが、他グループの要素を含まない最大抽象度の概念名に対象グループに関するノードｕのノード名を再設定する（Ｓ５３）。

次に、ｕ＝ｕ＋１に設定する（Ｓ５４）。

次に、ｕ≦Ｕかどうかを判断する（Ｓ５５）。ｕ≦Ｕの場合、Ｓ５２の処理に戻り、ｕ≦Ｕでない場合、処理を終了する。

図１７は、実施形態に係る抽象度再設定に基づくノードの分割処理のその他の例を示すフローチャートである。
図１７において、ｍ＝１に設定する（Ｓ６１）。

次に、ノード名Ｎの下位ノードｍについて、抽象化前に付与されていたノード名リストＬを取得する（Ｓ６２）。

次に、ｋ＝１に設定する（Ｓ６３）。

次に、リストＬのノード名と、グループｋ^Ｎにおける下位ノードｍに格納される情報内容ｙ_ｓ ^ｍを比較し、情報内容ｙ_ｓ ^ｍを包含するノード名のうち最も抽象度の低いノード名を下位ノードｍのノード名に再設定する（Ｓ６４）。

次に、ｋ＝ｋ＋１に設定する（Ｓ６５）。

次に、ｋ≦Ｋかどうかを判断する（Ｓ６６）。ｋ≦Ｋの場合、Ｓ６３の処理に戻り、ｋ≦Ｋでない場合、Ｓ６７の処理に進む。

次に、ｍ＝ｍ＋１に設定する（Ｓ６７）。

次に、ｍ≦Ｍかどうかを判断する（Ｓ６８）。ｍ≦Ｍの場合、Ｓ６１の処理に戻り、ｍ≦Ｍでない場合、処理を終了する。

図１８は、実施形態に係る抽象度再設定に基づくノードの分割処理のさらにその他の例を示すフローチャートである。
図１８において、ｍ＝１に設定する（Ｓ７１）。

次に、ｋ＝１に設定する（Ｓ７２）。

次に、グループｋ^Ｎにおける下位ノードｍに格納される情報内容ｙ_ｓ ^ｍが０でないデータに含まれる要素の個数Ｘを算出する（Ｓ７３）。個数Ｘでは、情報内容ｙ_ｓ ^ｍに複数の要素が存在する場合はそれらを全て足す。

次に、ノードｍと概念的に同等又は下位に位置するノードｏに関して、ベースとなる数理モデルＹ_ｏが存在するかどうかを判断する（Ｓ７４）。

ベースとなる数理モデルＹ_ｏが存在する場合、要素の個数がＸ個のデータ集合が各数理モデルＹ_ｏに属するかどうかを判断するための閾値を取得する（Ｓ７５）。

次に、各数理モデルＹ_ｏに対して、グループｋ^Ｎにおける下位ノードｍに格納される情報内容ｙ_ｓ ^ｍが属する確率を算出し、閾値を下回る数理モデルＹ_ｏのうち最も抽象度の低いノードｏを下位ノードｍのノード名に再設定し（Ｓ７６）、Ｓ７９の処理に進む。

一方、ベースとなる数理モデルＹ_ｏが存在しない場合、要素の個数がＸ個のデータ集合がある概念に属するかどうかを判断する基準となる対象概念の要素種類数の閾値を取得する（Ｓ７７）。

次に、グループｋ^Ｎにおける下位ノードｍに格納される情報内容ｙ_ｓ ^ｍを包含するノードのうち、閾値を下回る要素種類数のノードの中で最も下位ノードとなるノードｏを下位ノードｍのノード名に再設定する（Ｓ７８）。

次に、ｋ＝ｋ＋１に設定する（Ｓ７９）。

次に、ｋ≦Ｋかどうかを判断する（Ｓ８０）。ｋ≦Ｋの場合、Ｓ７２の処理に戻り、ｋ≦Ｋでない場合、Ｓ８１の処理に進む。

次に、ｍ＝ｍ＋１に設定する（Ｓ８１）。

次に、ｍ≦Ｍかどうかを判断する（Ｓ８２）。ｍ≦Ｍの場合、Ｓ７１の処理に戻り、ｍ≦Ｍでない場合、処理を終了する。

図１９は、図１の情報管理装置のハードウェア構成例を示すブロック図である。
図１９において、情報管理装置１０１は、プロセッサ１１、通信制御デバイス１２、通信インタフェース１３、主記憶デバイス１４および外部記憶デバイス１５を備える。プロセッサ１１、通信制御デバイス１２、通信インタフェース１３、主記憶デバイス１４および外部記憶デバイス１５は、内部バス１６を介して相互に接続されている。主記憶デバイス１４および外部記憶デバイス１５は、プロセッサ１１からアクセス可能である。

また、情報管理装置１０１の外部には、入力装置２０および出力装置２１が設けられている。入力装置２０および出力装置２１は、入出力インタフェース１７を介して内部バス１６に接続されている。入力装置２０は、例えば、キーボード、マウス、タッチパネル、カードリーダ、音声入力装置等である。出力装置２１は、例えば、画面表示装置（液晶モニタ、有機ＥＬ（ＥｌｅｃｔｒｏＬｕｍｉｎｅｓｃｅｎｃｅ）ディスプレイ、グラフィックカード等）、音声出力装置（スピーカ等）、印字装置等である。

プロセッサ１１は、情報管理装置１０１全体の動作制御を司るハードウェアである。プロセッサ１１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）であってもよいし、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）であってもよい。プロセッ１１は、シングルコアロセッサであってもよいし、マルチコアロセッサであってもよい。プロセッサ１１は、処理の一部または全部を行うハードウェア回路（例えば、ＦＰＧＡ（Ｆｉｅｌｄ－ＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ）またはＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ））を備えていてもよい。プロセッサ１１は、ニューラルネットワークを備えていてもよい。

主記憶デバイス１４は、例えば、ＳＲＡＭまたはＤＲＡＭなどの半導体メモリから構成することができる。主記憶デバイス１４には、プロセッサ１１が実行中のプログラムを格納したり、プロセッサ１１がプログラムを実行するためのワークエリアを設けたりすることができる。

外部記憶デバイス１５は、大容量の記憶容量を備える記憶デバイスであり、例えば、ハードディスク装置またはＳＳＤ（ＳｏｌｉｄＳｔａｔｅＤｒｉｖｅ）である。外部記憶デバイス１５は、各種プログラムの実行ファイルやプログラムの実行に用いられるデータを保持することができる。外部記憶デバイス１５には、情報管理プログラム１５Ａを格納することができる。情報管理プログラム１５Ａは、情報管理装置１０１にインストール可能なソフトウェアであってもよいし、情報管理装置１０１にファームウェアとして組み込まれていてもよい。

通信制御デバイス１２は、外部との通信を制御する機能を備えるハードウェアである。通信制御デバイス１２は、通信インタフェース１３を介してネットワーク１９に接続される。ネットワーク１９は、インターネットなどのＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）であってもよいし、ＷｉＦｉまたはイーサネット（登録商標）などのＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）であってもよいし、ＷＡＮとＬＡＮが混在していてもよい。

入出力インタフェース１７は、入力装置２０から入力されるデータをプロセッサ１１が処理可能なデータ形式に変換したり、プロセッサ１１から出力されるデータを出力装置２１が処理可能なデータ形式に変換したりする。

プロセッサ１１が情報管理プログラム１５Ａを主記憶デバイス１４に読み出し、情報管理プログラム１５Ａを実行することにより、概念化された情報に割り当てられたノードの階層構造から所定ノードを抽出し、その所定ノードに紐付けられた下位ノードの情報に基づいて所定ノードを分類することができる。このとき、プロセッサ１１は、図１の項目抽出部１、ノード候補生成部２、ノード抽出部３、ノード統合部４、分類部５、モデル化部６およびノード分割部７の機能を実現することができる。

なお、情報管理プログラム１５Ａの実行は、複数のプロセッサやコンピュータに分担させてもよい。あるいは、プロセッサ１１は、ネットワーク１９を介してクラウドコンピュータなどに情報管理プログラム１５Ａの全部または一部の実行を指示し、その実行結果を受け取るようにしてもよい。

本発明は、上記した実施形態に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施形態は、本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施形態の構成の一部を他の実施形態の構成に置き換えることが可能であり、また、ある実施形態の構成に他の実施形態の構成を加えることも可能である。また、各実施形態の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。

１項目抽出部、２ノード候補生成部、３ノード抽出部、４ノード統合部、５分類部、６モデル化部、７ノード分割部、８シソーラス辞書、９概念モデル

Claims

概念化された情報に割り当てられたノードの階層構造から所定ノードを抽出する抽出部と、
前記抽出部にて抽出された前記所定ノードに紐付けられた下位ノードの情報に基づいて、前記抽出部で抽出された前記所定ノードを分類する分類部と、
前記分類部による分類された前記所定ノードに紐付く前記下位ノードの情報に基づいて、前記下位ノードの紐付き方をモデル化するモデル化部とを備え、
前記モデル化部は、前記分類部にて同一グループに分類された前記所定ノードに紐付く前記下位ノードの紐付き方のパタンを生成する情報管理装置。
前記ノードは、ドキュメントの項目が割り当てられる請求項１に記載の情報管理装置。
前記所定ノードは、前記下位ノードの階層が１段以下のノードである請求項１に記載の情報管理装置。
前記抽出部は、前記分類部で同一グループに分類された前記所定ノードおよび前記所定ノードに紐付く下位ノードを単一ノードとみなす請求項３に記載の情報管理装置。
前記分類部は、前記所定ノードに紐付く前記下位ノードの概念の組み合わせに基づいて、前記所定ノードを分類する請求項１に記載の情報管理装置。
前記抽出部は、前記所定ノードとして第１ノードおよび第２ノードを抽出し、
前記分類部は、前記第１ノードに紐付く下位ノードの概念が、前記第２ノードに紐付く下位ノードの概念となり得ない場合、前記第１ノードを前記第２ノードと異なるグループに分類する請求項１に記載の情報管理装置。
前記所定ノードの分類結果に基づいて、前記所定ノードに紐付く下位ノードの概念を分割する分割部をさらに備える請求項１に記載の情報管理装置。
前記分割部は、異なるグループに分類された前記所定ノードにそれぞれ紐付く下位ノードの概念を、各グループに特有の具体化された概念に分割する請求項７に記載の情報管理装置。
前記所定ノードに紐付く下位ノードの概念の抽象度を統合する統合部をさらに備える請求項１に記載の情報管理装置。
前記統合部は、前記下位ノードの情報内容に基づいて、前記下位ノードの概念を統合する請求項９に記載の情報管理装置。
形態素解析および類語分析に基づいて、前記ドキュメントから抽出された同一概念の項目の名称を統一するノード候補生成部をさらに備える請求項２に記載の情報管理装置。
プロセッサにて実行される情報管理方法であって、
前記プロセッサは、
項目が割り当てられたノードの階層構造から所定ノードを抽出し、
前記所定ノードに紐付けられた下位ノードの項目に基づいて前記所定ノードを分類し、
分類された前記所定ノードに紐付く前記下位ノードの情報に基づいて、前記下位ノードの紐付き方をモデル化し、
同一グループに分類された前記所定ノードに紐付く前記下位ノードの紐付き方のパタンを生成
する情報管理方法。