JP2007004779A - リンク生成、リンク重要度及び類似文書に関する情報処理方法及び装置 - Google Patents

リンク生成、リンク重要度及び類似文書に関する情報処理方法及び装置 Download PDF

Info

Publication number
JP2007004779A
JP2007004779A JP2006138613A JP2006138613A JP2007004779A JP 2007004779 A JP2007004779 A JP 2007004779A JP 2006138613 A JP2006138613 A JP 2006138613A JP 2006138613 A JP2006138613 A JP 2006138613A JP 2007004779 A JP2007004779 A JP 2007004779A
Authority
JP
Japan
Prior art keywords
link
data
metadata
storage unit
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006138613A
Other languages
English (en)
Inventor
Masayuki Tanazawa
昌幸 棚澤
Shigeki Ueno
滋樹 上野
Takao Komata
孝夫 小俣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Electric Power Company Holdings Inc
Original Assignee
Tokyo Electric Power Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Electric Power Co Inc filed Critical Tokyo Electric Power Co Inc
Priority to JP2006138613A priority Critical patent/JP2007004779A/ja
Publication of JP2007004779A publication Critical patent/JP2007004779A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】ユーザの挙動及びその変化に基づき適切に文書間のリンク付けを行う。
【解決手段】文書管理システムに対するユーザのアクセス履歴ログデータにおけるメタデータに関連するログデータから、各ユーザの遷移履歴に関する遷移データを生成し、遷移データを用いて、各メタデータについて当該メタデータに到達する前の挙動と当該メタデータに到達した後の挙動とに基づきメタデータの寄与値を算出する。そして遷移データ及びメタデータの寄与値に基づき、特定期間における第1メタデータから遷移先となる第2メタデータへのリンク寄与値を算出する。その後、特定期間における上記リンクのリンク寄与値と特定期間より前の期間における上記リンクのリンク評価値とに基づき、特定期間における上記リンクのリンク評価値を算出し、特定期間におけるリンク評価値に基づき、上記リンクの生成の是非を判断する。
【選択図】図1

Description

本発明は、データの管理技術に関する。
例えば、特開2004−355440号公報(特許文献1)には、データ及びデータ間の関連性を人間の感覚に即した形で提示できるようにするための技術が開示されている。具体的には、メタデータ間のリンク関係をリンク元及びリンク先の識別情報の対のデータとして保持する第1データ構造と、各メタデータについて、当該メタデータに関連するファイルへのリンク・データを少なくとも含む第2データ構造と、メタデータの分類を規定する第3データ構造とを含み、メタデータの分類とメタデータ間のリンク関係とが独立に設定可能なデータ構造を利用するものである。しかしながら、第1データ構造が適切に構成されないと、このようなデータ構造を有する文書管理システムを利用するユーザは、必要とするデータを効率よく取得することができない。上記公報ではこの点について解決策は提示されていない。
また、データ間の関連付けに関連して例えば特開2002−207726号公報には、文書の分類整理や関連付けなどの事前作業を行うことなく、操作対象文書に関連した文書を抽出し、それを容易に参照できるようにするための技術が開示されている。具体的には、操作履歴管理部は、文書操作装置による文書操作の履歴情報を生成し、操作履歴情報保存部に保存する。関連文書処理部は、文書操作装置で操作される文書の操作履歴情報と、他の文書の操作履歴情報とを、ユーザにより選ばれた1つ以上の項目に関して照合することにより、操作対象文書と関連している可能性が高い文書を抽出し、そのリストを文書操作装置へ送る。ユーザは、表示装置に表示された関連文書リスト上で文書を選択することにより、その内容を参照できるというものである。なお、本公報には特許文献1のようなデータ構造は開示されていない。また操作履歴情報を用いることは開示されているが、操作履歴情報において時刻、内容、操作者、回数などで単に検索するだけである。
また、特開2001−5705号公報には、複数の文書情報の一覧表示を行う際に、各文書情報の有用度を自動的に判断し、有用な情報のみを表示するための技術を開示している。具体的には、各文書情報への参照履歴をテーブルに記録し、各文書情報への参照履歴を元に予め決めた時点で各情報の有用度を、有用度計算実行部に算出させ、各情報の有用度を元に一覧表示を行う項目を決定して、有用度の高い情報のみを表示するものである。この公報では有用度を、各履歴の日時から現在までの経過期間と基準となる重みとを対応付けした登録参照頻度重みテーブルにより基準重みを割り出し、予め定められている履歴情報の登録参照種別毎の重みに、基準重みを掛け合わせて算出した重みを、文書情報に関連する全ての履歴に対して合計した値を文書情報の有用度として用いる。
さらに、特開2004−192542号公報には、膨大なコンテンツの中から、ユーザが、自分にとって必要な情報を、容易かつ迅速に得ることができるようにするための技術が開示されている。具体的には、所定の専門分野に関連する語彙または情報を具備する専門知識リストを備え、情報提供サービスにおけるユーザの操作履歴と上記専門知識リストとに応じて、各ユーザの信頼度を評価し、評価されたユーザ信頼度に基づいて、信頼度の高いユーザを検出し、上記信頼度が所定値以上高いユーザだけに認知されている情報である高信頼度ユーザ認知情報を検出し、上記高信頼度ユーザ認知情報を、上記専門分野に関連する情報として推薦するものである。本公報では、ユーザの信頼性については考慮されているが、特定の文書に到達した後の挙動については考慮されていない。
また、特開2004−220215号公報には、計算機を利用した業務において、文書作成を効率化する技術が開示されている。具体的には、計算機を利用して文書を作成する業務を誘導支援するシステムが、作成文書とその文書を作成するのに参照した参照資料との関連付けを実行する類似性評価部と、関連付けを記憶する参照履歴データベースとを有する。参照履歴データベースに記憶された作成文書と参照資料との関連付けを、参照履歴検索部が検索する。作成文書および参照資料の参照関係を、文書作成履歴検索部が検索する。この際、類似性評価部は、作成文書と参照文書に出現する稀少頻度語の比較、作成文書と参照文書のカテゴリおよび作成文書と参照文書の参照時間または参照頻度の少なくともいずれかに基づいて関連付けを実行することが望ましいとされる。しかしながら、文書を単に参照している場合における参照履歴については関連付けに利用されていない。
また、特開2001−337992号公報には、1つの単語で複数の異なった概念を表現し且つ程度を表す概念を用いて表した類似度を用いて検索パターンに類似した事例データを検索するための技術が開示されている。具体的には、類似度検索装置は、事例データベースメモリに格納された事例データベースに基づいて、メモリに格納されたデータを参照して、事例データベース内の各属性において各検索パターンを含む度合いを示す含み類似度と、事例データベース内の各属性において各検索パターンが含まれる度合いを示す含まれ類似度とを計算し、計算された各含み類似度と各含まれ類似度とに基づいて、事例データベース内の全体の属性での割合を示す類似度割合を計算して出力する。本技術で問題としているのは、例えば「新聞」という文言が、その文脈において「新聞」の「内容」であったり、「新聞紙」であったりするため類似をうまく判断できないという問題などを取り扱ったものであって、そのために「含み類似度」及び「含まれ類似度」といった概念を採用している。また、算出された類似度割合の取扱いについては特に考察されていない。
特開2004−355440号公報 特開2002−207726号公報 特開2001−5705号公報 特開2004−192542号公報 特開2004−220215号公報 特開2001−337992号公報
以上のように従来技術では、様々な要素を基に文書を関連付けるようにしているが、文書間のリンク付けについて、ユーザの挙動及びその変化の分析に基づき適切に指標化して判断しているものはない。またリンクの重要度/有効度についても同様である。
また、上で述べた従来技術では、類似文書の抽出についても、高速且つ的確な抽出技術については考察されていない。同様に、抽出された類似文書の提示方法についても、より適切な技術は開示されていない。
従って、本発明の目的は、ユーザの挙動及びその変化に基づき適切に文書間のリンク付けを行うための新規な技術を提供することである。
さらに、本発明の他の目的は、ユーザの挙動及びその変化に基づき適切に文書間のリンクの重要度/有効度を判定するための新規な技術を提供するものである。
さらに、本発明の他の目的は、類似文書を適切に提示するための新規な技術を提供するものである。
本発明の第1の態様に係るリンク生成方法は、文書管理システムに対するユーザのアクセス履歴ログ・データにおける、特定種類の文書データに関連するログ・データから、各ユーザの遷移履歴に関する遷移データを生成し、遷移データ格納部に格納するステップと、遷移データ格納部に格納された遷移データを用いて、特定種類の各文書データについて、当該文書データに到達する前の挙動と当該文書データに到達した後の挙動とに基づき文書データの寄与値を算出し、寄与値データ格納部に格納する寄与値算出ステップと、遷移データ格納部に格納された遷移データ及び寄与値データ格納部に格納された文書データの寄与値に基づき、特定期間における、特定種類の第1の文書データから遷移先となる特定種類の第2の文書データへのリンク寄与値を算出し、記憶装置に格納するリンク寄与値算出ステップと、記憶装置に格納された、特定期間における、第1の文書データから第2の文書データへのリンク寄与値と、リンク評価値データ格納部に格納された、特定期間より前の期間における、第1の文書データから第2の文書データへのリンク評価値とに基づき、特定期間における、第1の文書データから第2の文書データへのリンク評価値を算出し、リンク評価値データ格納部に格納するリンク評価値算出ステップと、リンク評価値データ格納部に格納された、特定期間におけるリンク評価値に基づき、第1の文書データから第2の文書データへのリンクの生成の是非を判断するリンク生成判断ステップとを含む。
このように、ユーザの挙動、特に特定の文書に到達した後の挙動に基づき文書データの寄与値を算出することにより、ユーザによるアクセス・フロー(ナレッジ遷移)の中で重要と考えられる文書データ及び当該文書データからの直接又は間接の遷移先文書データ、若しくは当該文書データへの直接又は間接の遷移元文書データを特定することもできるようになる。すなわち、リンクを生成するのに適切な文書データを特定できる。さらに、特定期間における、第1の文書データから第2の文書データへのリンク寄与値と、特定期間より前の期間における、第1の文書データから第2の文書データへのリンク評価値とに基づき、特定期間におけるリンク評価値を算出するようになっているので、リンク寄与値の時間的な推移をも考慮して、リンクの生成の是非を判定することも可能となる。このようにして、ユーザの挙動及びその変化に基づき適切に文書間のリンク付けを行うことができるようになる。
また、上で述べたリンク寄与値算出ステップが、遷移データ格納部に格納された各ユーザに係る遷移データから、特定種類の第1の文書データと当該第1の文書データから遷移先となる特定種類の第2の文書データとを特定するステップと、特定された第1の文書データ及び第2の文書データの寄与値を寄与値データ格納部から読み出し、関係したユーザについての第1の文書データから第2の文書データへのリンク寄与値を算出し、記憶装置に格納するステップと、記憶装置に格納された上記寄与値を、特定期間及びユーザについて集計し、記憶装置に格納するステップとを含むようにしてもよい。文書管理システムに習熟しているユーザとそうでないユーザとでは、アクセス・フローを解析する上でその重みが異なる。ここではこのユーザによる重み付けを寄与値に反映させるものとしている。
なお、上で述べた関係したユーザについての第1の文書データから第2の文書データへのリンク寄与値が、第1の文書データ及び第2の文書データの寄与値の和と上記関係したユーザに対応する係数との積で計算されるようにしてもよい。
また、上で述べた寄与値算出ステップが、算出された寄与値と閾値とを比較し、寄与値が閾値未満である場合には当該寄与値を無効化するステップを含むようにしてもよい。このように、単なるノイズと考えられる値の寄与値については無視することにより、実質的に意味のあるリンク付けを可能とする。
上で述べたリンク評価値算出ステップが、特定期間より前の期間におけるリンク評価値からの、特定期間におけるリンク寄与値の増分を算出するステップと、当該増分に応じて特定期間より前の期間におけるリンク評価値を調整することにより、特定期間における、第1の文書データから第2の文書データへのリンク評価値を算出し、リンク評価値データ格納部に格納する調整ステップとを含むようにしてもよい。特定期間におけるリンク寄与値の増分を基にリンク評価値を算出するため、例えばリンク寄与値が上昇して文書データ間の関係が密となっていることが確認された場合にのみリンク評価値を増加させるといったことも可能となる。
また、上で述べた調整ステップにおいて、上記増分の値が所定の閾値未満である場合には、特定期間より前の期間におけるリンク評価値を減少させることにより、特定期間におけるリンク評価値を算出するようにしてもよい。文書データ間の関係が所定基準以上に密になっていなければ、リンク評価値を減ずる場合もあるということである。
さらに、上で述べたリンク生成判断ステップが、リンク評価値データ格納部に格納された、特定期間におけるリンク評価値の正規化を行うステップと、正規化されたリンク評価値が所定の閾値以上であるか判断するステップとを含むようにしてもよい。正規化することにより重要なリンクを適切に抽出することができるようになる。
なお、上で述べた特定種類の文書データがメタデータである場合もある。メタデータを文書管理システムにおける主軸データとして、ファイルを直接リンク付けずに、メタデータをリンク付けることで、図やグラフなどのデータも関連付けることができ且つ検索も容易になる。
また、本発明の第2の態様に係るリンク重要度決定方法は、文書管理システムに対するユーザのアクセス履歴ログ・データにおける、特定種類の文書データに関連するログ・データから、各ユーザの遷移履歴に関する遷移データを生成し、遷移データ格納部に格納するステップと、遷移データ格納部に格納された遷移データを用いて、特定種類の第1の文書データから特定種類の第2の文書データへの既に生成されているリンクの利用を特定し、当該リンクを用いたユーザについての、当該第2の文書データに到達した後の挙動に基づきリンクの寄与値を算出し、寄与値データ格納部に格納する寄与値算出ステップと、寄与値データ格納部に格納されたリンクの寄与値を、リンク毎に特定期間について集計し、記憶装置に格納するステップと、記憶装置に格納された、特定期間におけるリンクの寄与値と、リンク評価値データ格納部に格納された、特定期間より前の期間における当該リンクの評価値に基づき、特定期間におけるリンクの評価値を算出し、リンク評価値データ格納部に格納するリンク評価値算出ステップと、リンク評価値データ格納部に格納された、特定期間におけるリンクの評価値に基づき、第1の文書データから第2の文書データへのリンクの重要度を決定する重要度決定ステップとを含む。
既設のリンクを用いたユーザについての、当該第2の文書データに到達した後の挙動に基づきリンクの寄与値を算出することにより、アクセス・フロー(ナレッジ遷移)において当該リンクが十分役に立ったのかを当該リンクの寄与値に反映させることができる。また、特定期間におけるリンクの寄与値と、特定期間より前の期間におけるリンクの評価値に基づき、特定期間におけるリンクの評価値を算出するため、リンク寄与値の時間的な推移をも考慮して、リンクの重要度/有効度を判断することも可能となる。このようにして、ユーザの挙動及びその変化に基づき適切に文書間のリンクの重要度/有効度を判定することができるようになる。
また、上で述べたリンク評価値算出ステップが、特定期間より前の期間におけるリンクの評価値からの、特定期間における上記リンクの寄与値の増分を算出するステップと、上記増分に応じて特定期間より前の期間における上記リンクの評価値を調整することにより、特定期間におけるリンクの評価値を算出し、リンク評価値データ格納部に格納する調整ステップとを含むようにしてもよい。
さらに、上で述べた調整ステップにおいて、上記増分の値が所定の閾値未満である場合には、特定期間より前の期間におけるリンクの評価値を減少させることにより、特定期間におけるリンクの評価値を算出するようにしてもよい。
また、上で述べた重要度決定ステップが、リンク評価値データ格納部に格納された、特定期間における上記リンクの評価値の正規化を行うステップと、正規化された上記リンクの評価値が予め定められた範囲のいずれに入るか判断するステップとを含むようにしてもよい。各重要度/有効度について上限及び下限を設定して、正規化されたリンクの評価値に基づき重要度を判定するものである。
さらに、本発明の第2の態様においても、文書管理システムが、メタデータ間のリンク関係をリンク元及びリンク先の識別情報の対のデータとして保持する第1データ構造と、各メタデータについて、当該メタデータに関連するファイルへのリンク・データを少なくとも含む第2データ構造と、メタデータの分類を規定する第3データ構造とを含み、メタデータの分類とメタデータ間のリンク関係とが独立に設定可能なデータ構造を利用する場合には、上記特定種類の文書データをメタデータとすれば、より効果的である。
なお、本発明の第1の態様又は第2の態様において、予め規定されている属性毎に、予め規定されている項目のユーザによる選択又は非選択の状態を表す比較元ベクトルを生成し、記憶装置に格納するステップと、文書管理システムに既登録の文書データについて生成され且つ属性毎に当該文書データについて項目が該当する又は該当しない状態を表す比較先ベクトルと、記憶装置に格納された比較元ベクトルとから、比較先ベクトルと比較元ベクトルとのベクトル間類似度を算出し、当該ベクトル間類似度を用いて各属性についての重み付けが考慮された、メタデータについての類似度を算出し、少なくとも文書データの識別情報に対応して類似度データ格納部に格納する類似度算出ステップと、類似度データ格納部に格納された、文書データについての類似度及び寄与値データ格納部に格納された文書データの寄与値に従って、メタデータをソートし、当該ソート結果をユーザに出力する出力ステップとをさらに含むようにしてもよい。このようにすれば、例えば文書を作成する際に、類似文書を類似度及び上で述べた文書データの寄与値でソートするため、ユーザはより適切な順番で類似文書を特定することができる。
また、本発明の第3の態様に係る情報処理方法は、予め規定されている属性毎に、予め規定されている項目のユーザによる選択又は非選択の状態を表す比較元ベクトルを生成し、記憶装置に格納するステップと、データベースに既登録の各メタデータについて生成され且つ属性毎に当該メタデータについて項目が該当する又は該当しない状態を表す比較先ベクトルと、記憶装置に格納された比較元ベクトルとから、比較先ベクトルと比較元ベクトルとのベクトル間類似度を算出し、当該ベクトル間類似度を用いて各属性についての重み付けが考慮された、各メタデータについての類似度を算出し、少なくともメタデータの識別情報に対応して類似度データ格納部に格納する類似度算出ステップと、類似度データ格納部に格納された、メタデータについての類似度に従って、メタデータをソートし、当該ソート結果をユーザに出力する出力ステップとを含む。このようにメタデータをベースに上で述べたような選択/非選択又は該当/非該当を表すベクトルをベースを用いるため、より的確な類似メタデータが抽出できるようになる。すなわち、比較のベース及び対象が明確であるため、使用語句だけ類似するようなメタデータが抽出されなくなる。
なお、上で述べた類似度算出ステップが、ユーザが選択し且つ比較先のメタデータが該当する状態である項目数を、当該項目数とユーザのみが選択した項目数と比較先のメタデータのみが該当する状態である項目数との和で除した値を、各属性のベクトル間類似度として算出するステップを含むようにしてもよい。
さらに、上で述べた類似度算出ステップが、ベクトル間類似度と対応する属性の重み付け値との積和を全重み付け値で除することによって、メタデータについての類似度を算出するステップを含むようにしてもよい。
また、本発明の第3の態様において、データベースに対するユーザのアクセス履歴ログ・データにおける、メタデータに関連するログ・データから、各ユーザの遷移履歴に関する遷移データを生成し、遷移データ格納部に格納するステップと、遷移データ格納部に格納された遷移データを用いて、各メタデータについて、当該メタデータに到達する前の挙動と当該メタデータに到達した後の挙動とに基づきメタデータの活用度を算出し、活用度データ格納部に格納するステップとをさらに含むようにしてもよい。そして、上で述べた出力ステップにおいて、メタデータについての類似度及び活用度データ格納部に格納された活用度に従ってメタデータをソートするようにしてもよい。これによって、より活用度が高いメタデータを優先して提示することができるようになる。
本発明に係る方法をコンピュータに実行させるためのプログラムを作成することも可能であり、当該プログラムは、例えばフレキシブル・ディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークを介してディジタル信号にて頒布される場合もある。なお、処理途中のデータについては、コンピュータのメモリ等の記憶装置に一時保管される。
本発明によれば、ユーザの挙動及びその変化に基づき適切に文書間のリンク付けを行うことができるようになる。
また、本発明の他の側面によれば、ユーザの挙動及びその変化に基づき適切に文書間のリンクの重要度/有効度を判定することができるようになる。
さらに、本発明の他の側面によれば、類似文書を適切に提示することができるようになる。
図1に本発明の一実施の形態に係るシステム概要図を示す。例えばインターネットやイントラネット等のネットワーク7には、複数のクライアント端末9及び10等と、文書管理システムであるナレッジマネジメント(KM)システム1とが接続されている。複数のクライアント端末9及び10等は、ネットワーク7を介してKMシステム1に管理されている文書データにアクセスする。KMシステム1には、以下に説明するデータが蓄積されており、クライアント端末9及び10等からのアクセスに応答して、要求されたデータを要求元に送信する。また、KMシステム1は、アクセスログデータ格納部3及び認証ログデータ格納部4を有しているか又はアクセスログデータ格納部3及び認証ログデータ格納部4に接続されている。このアクセスログデータ格納部3は、クライアント端末9及び10等からのアクセスに対するアクセスログを格納している。また、認証ログデータ格納部4は、KMシステム1に対するクライアントのログイン及びログアウトなどの履歴を保持する。
リンク生成管理装置5は、アクセスログデータ格納部3及び認証ログデータ格納部4からデータを取得できるようになっており、リンク自動生成処理部51、リンク管理部52、ログ解析テーブル53、リンク生成用中間指標値テーブル54、リンク生成用最終指標値テーブル55、太さ用中間指標値テーブル56、太さ用最終指標値テーブル57、ユーザ係数データ格納部58、及び判定結果格納部59を有する。
次に、KMシステム1において管理されるデータ、すなわち図示しないデータベースに格納されるデータについて説明する。まず、データベースにおける論理的なデータ構造の一例を図2に示す。本実施の形態では1又は複数のデータを管理するためのメタデータを採用している。図2の例では、メタデータAと、メタデータBと、メタデータCとがメタデータ登録領域に保持されている。また、各メタデータは、自己が管理しているデータに対するリンクを含んでいる。図2の例では、メタデータAは、データa1乃至データanを管理しており、点線でリンクが示されている。メタデータBは、データb1乃至bmを管理しており、同じく点線でリンクが示されている。さらに、メタデータCは、データc1乃至ck及びデータb1を管理しており、同じく点線でリンクが示されている。なお、データは、データ登録領域に保持されている。メタデータCのように、他のメタデータと重複する形でデータを管理するようにしても良い。このようにメタデータは、データと1対nの関係を有しているが、個々のデータとは独立しているため、データを改変することなくその内容・構成を自由に変更することができる。
また、メタデータ間は双方向で関連付けられている。但し、ここで双方向とは、リンク元とリンク先とを合わせて抽出できるような形態にてリンク関係を保持していることを示している。図2の例では、メタデータAは、メタデータB及びメタデータCと関連付けられており、リンクXとリンクZとして示されている。メタデータBは、メタデータA及びメタデータCと関連付けられており、リンクX及びリンクYで示されている。メタデータCは、メタデータA及びメタデータBと関連付けられており、リンクZ及びリンクYで示されている。このようなリンク付けをメタデータについて行うことにより、例えば技術者が保有する連想情報である暗黙知を形式知化することができるようになる。このようにメタデータ間のリンクはHTMLにおけるリンクとは異なり、メタデータを介したデータ間の双方向なリンクである。HTMLでは1対nの関連付けしかできなかったが、図2に示すようにデータから他のデータに対してメタデータを介してn対nで関連付けることができるようになる。
また図3に示すように、メタデータはメタデータ間のリンク関係だけで関連付けられるわけではなく、リンク関係とは独立にメタデータには分類が規定される。メタデータが分類されれば、当該メタデータにより管理されるデータも分類されることになる。図3の例では、メタデータA及びメタデータBがカテゴリ1に分類され、メタデータCはカテゴリ2に分類されている。さらに、カテゴリ1及びカテゴリ2は、カテゴリ3に分類されている。
このようなデータ構造を実現することにより、検索を行うユーザは、メタデータに含まれる文字データによりキーワード検索を行うことができ、メタデータのリンクを双方向に辿ることにより目的のデータを探索することができ、さらに図3で示すようなメタデータの分類に従って目的のデータを探索することも可能となる。
次に、図2及び図3で説明したデータ構造を実現するためのデータの一例を図4乃至図6を用いて説明する。図4は、メタデータに含まれるデータ・テーブルの一例を示す図である。図4の例では、文書名(メタデータA)と、添付ファイル名1(画面例1.doc)と、作成者名(東電一郎)と、本メタデータの主題(例えば事故)に関するデータである概要、原因及び対策と、事故発生日時と、メタデータのサイズと、メタデータ更新日時とが含まれる。本データ・テーブルに含まれる添付ファイル名1に対応するファイル名が、本メタデータから管理されるデータへのリンクを表すデータである。添付ファイル名は、1つだけではなく複数指定される場合もある。また図4に示したデータ項目だけではなく、他のデータ項目を設けることも可能である。
図5は、メタデータ間のリンク関係を規定するテーブルの一例を示す図である。図5の例では、リンク元の列501と、リンク先の列502とが設けられている。このように本実施の形態では、メタデータに関するデータとは別にリンク関係を規定するテーブルを設けるようにしているため、リンク関係の追加・変更・削除が必要になった場合であっても、リンクテーブルのみを変更すればよいため、処理が簡略化される。なお、図5には示していないが、リンクにはIDが定義されており、リンク名称、リンク属性、リンク概要、作成日時、自動生成又は手動生成の別なども別途登録される。
図6は、メタデータの分類関係を規定するディレクトリ構造の一例を示す図である。図6の例では、文書というディレクトリに事故情報及び指示文書というディレクトリが設けられ、指示文書というディレクトリにカテゴリ1というディレクトリが設けられ、カテゴリ1というディレクトリにメタデータA及びメタデータBというメタデータが含まれる構造を示している。このようなディレクトリ構造によるファイルの管理は、従来からオペレーティング・システム(OS:Operating System)のファイル・システムにおいて実現されているが、ファイル・システムに類似のデータ構造を別途用意することにより、メタデータの分類を規定及び管理することができる。但し、例えば1つのメタデータを1つのファイルとして特定のディレクトリに保存することにより、メタデータの分類関係を規定及び管理するようにしても良い。また、このような管理は、図5に示したリンク・テーブルとは別個に設定・管理されており、柔軟なデータの関連付けを可能としている。
より具体的には、KMシステム1において、図7乃至図16を用いて説明するような画面遷移が可能となっている。以下の説明では、画面をノードと記し、画面間の遷移(終了画面への遷移を含む)をエッジと記すものとする。本例におけるKMシステム1は、主に、カレンダー機能と、検索機能と、キャビネット(ディレクトリ)からの検索機能と、キーワード用語辞書機能とを有する。そのため、図7に示すように、カレンダー機能のためのノード:メニュー1と、基本検索機能のためのノード:メニュー4と、キャビネットからの検索機能のためのノード:メニュー2と、キーワード用語辞書機能のためのノード:メニュー3とが設けられている。そして、それらのメニュー間を遷移するためのエッジ、及びそれらのメニューから終了するためのエッジが含まれ、さらにそれらの機能内における画面遷移が可能となっている。
図8にカレンダー機能内における画面遷移を示す。ここでは、カレンダーを月表示するためのノード:カレンダー1と、カレンダーを週表示するためのノード:カレンダー2と、カレンダーを年表示するためのノード:カレンダー3と、用語を選択するためのノード:カレンダー4と、カレンダーに添付されている文書を表示するためのノード:カレンダー5とを含む。ノード:カレンダー1及び2、ノード:カレンダー2及び3、ノード:カレンダー1及び3のそれぞれの間には双方向にエッジが設けられている。一方、ノード:カレンダー5へのエッジは、ノード:カレンダー1乃至3からの片方向のみである。また、ノード:カレンダー4へのエッジも、ノード:カレンダー1乃至3からの片方向となっている。また、ノード:カレンダー5を除く各ノードには、自ノードへの遷移のためのエッジも設けられている。
また、ノード:カレンダー1からは、メタデータに関連する画面への遷移(文書画面遷移)を表すエッジ:カレンダー1to文書、及び検索機能への遷移(検索画面遷移)を表すエッジ:カレンダー1to検索も設けられている。同様に、ノード:カレンダー2からは、メタデータに関連する画面への遷移(文書画面遷移)を表すエッジ:カレンダー2to文書、及び検索機能への遷移(検索画面遷移)を表すエッジ:カレンダー2to検索も設けられている。さらに、ノード:カレンダー3からは、メタデータに関連する画面への遷移(文書画面遷移)を表すエッジ:カレンダー3to文書、及び検索機能への遷移(検索画面遷移)を表すエッジ:カレンダー3to検索も設けられている。
図9にキャビネットからの検索機能内における画面遷移を示す。ここでは、視点の指定がない場合におけるキャビネット(フォルダ)の内容を示すためのノード:キャビネット1と、視点の指定のある場合におけるキャビネット(フォルダ)の内容を示すためのノード:キャビネット2とが設けられている。また、ノード:キャビネット1及び2間の遷移を表すエッジと、フォルダの移動による遷移(自ノードへの遷移)を表すエッジも設けられている。なお、ノード:キャビネット1及び2からは、メタデータに関連する画面への遷移(文書画面遷移)を表すエッジ:キャビネット1to文書及びエッジ:キャビネット2to文書も設けられている。
図10にキーワード用語辞書機能内における画面遷移を示す。ここでは、キーワード未選択状態に対応するノード:キーワード1と、キーワードが選択された状態に対応するノード:キーワード2とが設けられている。また、ノード:キーワード1及び2間の遷移を表すエッジと、分類又は50音指定による画面遷移(自ノードへの遷移)を表すエッジ:キーワード1to1と、同義語、関連語又は用語指定による画面遷移(自ノードへの遷移)を表すエッジ:キーワード2to2も設けられている。
図11に検索機能内における画面遷移を示す。ここでは、基本的な検索条件を入力するための画面に対応するノード:検索1と、キーワード用語辞書機能の画面に対応するノード:検索5と、詳細な検索条件を入力するための画面に対応するノード:検索2と、検索で抽出された文書を列挙する画面に対応するノード:検索3と、特定の文書が選択された場合の画面に対応するノード:検索4とが設けられている。また、検索画面に対応するノード:検索1と詳細検索画面に対応するノード:検索2との間には両方向にエッジが設けられている。また、ノード:検索1及び2については、検索条件を設定し、又は検索条件をクリアする場合は自ノードへの遷移であって、それに対応するエッジも設けられている。さらに、ノード:検索1及び2からは、用語を調べるためノード:検索5への遷移に対応するエッジ:検索1to5又はエッジ:検索2to5が設けられている。なお、検索はノード:検索1及び2で指示されるので、ノード:検索3へのエッジは、ノード:検索1及び2からのエッジとなる。また、検索結果の文書の内容を参照するために、ノード:検索3からノード:検索4への遷移を表すエッジもあり、表示させる文書を切り換える場合には自ノードへの遷移であって、それに対応するエッジ:検索4to4も設けられている。さらに、ノード:検索4からは、メタデータに関連する画面への遷移(文書画面遷移)を表すエッジ:検索4to文書も設けられている。
図12乃至図16にメタデータに関連する文書画面遷移の詳細を示す。上でも述べたように、検索機能、キャビネットからの検索機能、及びカレンダー機能から、メタデータに関連する画面に遷移することができるようになっている。ここでは、メタデータの基本データを表示するための画面に対応するノード:文書1と、メタデータの詳細データを表示するための画面に対応するノード:文書2と、ノード:文書1に表示されたメタデータに関連するメタデータへのリンクの一覧画面に対応するノード:文書3と、リンクの一覧画面において選択されたリンクの詳細画面に対応するノード:文書4と、メタデータに添付されている添付文書を表示するための画面に対応するノード:文書5と、添付文書のダウンロード中を表す画面に対応するノード:文書6と、添付文書の印刷中を表す画面に対応するノード:文書7とが設けられている。
そして、メタデータの基本データを表示するための画面に対応するノード:文書1とメタデータの詳細データを表示するための画面に対応するノード:文書2との間は、双方向にエッジが設けられている。また、添付文書の表示画面に対応するノード:文書5、添付文書のダウンロード中を表す画面に対応するノード:文書6、添付文書の印刷中を表す画面に対応するノード:文書7へは、ノード:文書1及び2からエッジが設けられている。
さらに、ノード:文書1及び2からはリンクの一覧画面に対応するノード:文書3へのエッジが設けられており、ノード:文書3からは、ノード:文書4へのエッジ、特定のメタデータについてのリンク一覧画面を表示させるためのボタンがクリックされた場合には自ノードへの遷移となり、これに対応するエッジ、及び他のメタデータへの遷移に対応するエッジ:文書3to文書が設けられている。また、ノード:文書4からは、別のメタデータへの遷移に対応するエッジ:文書4to文書が設けられている。
メタデータに関連する画面については、本実施の形態に関連が深いので以下に詳細についても触れておく。まず、図13にメタデータの基本データを表示するための画面例を示す。図13の画面例には、文書名、添付ファイル名(複数の場合もある)、概要、分類/分類要素、カテゴリ、リンク、付箋についての情報が含まれる。また、エッジ:文書1to2に沿って遷移させ且つメタデータの詳細を表示させるための詳細項目画面ボタン1301と、エッジ:文書1to7に沿って遷移させ且つメタデータを印刷させるための印刷ボタン1302と、エッジ:文書1to5に沿って遷移させ且つ添付ファイルを表示させるための表示ボタン1303と、エッジ:文書1to6に沿って遷移させ且つ添付ファイルをダウンロードさせるためのダウンロードボタン1304と、エッジ:文書1to3に沿って遷移させ且つリンクの一覧表示を行わせるためのリンクボタン1305も含まれる。
図14にメタデータの詳細データを表示するための画面例を示す。図14の画面例には、文書名、添付ファイル名(複数の場合もある)、概要、分類/分類要素、カテゴリ、リンク、付箋、事故発生日時、原因、対策、供給支障、変電所名、天候、作業条件、検索キーワード、作成者、作成日時、更新者、更新日時についての情報が含まれる。また、エッジ:文書2to1に沿って遷移させ且つメタデータの基本データを表示させるための基本項目画面ボタン1401と、エッジ:文書2to7に沿って遷移させ且つメタデータの詳細を印刷させるための印刷ボタン1402と、エッジ:文書2to5に沿って遷移させ且つ添付ファイルを表示させるための表示ボタン1403と、エッジ:文書2to6に沿って遷移させ且つ添付ファイルをダウンロードさせるためのダウンロードボタン1404と、エッジ:文書2to3に沿って遷移させ且つリンクの一覧表示を行わせるためのリンクボタン1405も含まれる。
図15にリンクの一覧表示画面の一例を示す。リンクの一覧表示画面には、図15に示すように、ノード:文書1におけるメタデータに関連するリンクの一覧として、ノード:文書1が参照元となっているリンクと、ノード:文書1が参照先となっているリンクとを含む。但し、本例では図13に示すようにノード:文書1が参照先となっている件数は0であるので、ノード:文書1が参照元となっているリンクのみが示されている。図15の例では、リンク1502a乃至1502cと、リンク1503及び1506と、リンク1505及び1507と、リンク表示ボタン1504及び1508と、本画面の表示を終了させるための終了ボタン1501とが含まれる。
リンク1502a乃至1502cは、エッジ:文書3to文書に沿って遷移させるためのリンクであってノード:文書1に戻る。また、リンク1503及び1506は、エッジ:文書3to4に沿って遷移させ且つリンク詳細画面を表示させるためのリンクである。なお、このリンク1503及び1506に隣接して表示される矢印は、その太さにより左右に示されているメタデータ間のリンクの重要度/有効度を示している。さらに、リンク1505及び1507は、エッジ:文書3to文書に沿って遷移させ且つ他のメタデータを表示させるためのリンクである。また、リンク表示ボタン1504及び1508は、エッジ:文書3to3に沿って遷移させ且つその行の参照先文書名に係る文書についてリンク一覧を表示させるためのボタンである。
図16にリンクの詳細画面の一例を示す。図16の画面例では、リンク名称、参照元文書名、参照先文書名、リンク概要、及び閉じるボタン1601が含まれる。図16の例は、リンク1506がクリックされた場合の画面であり、参照元文書名のリンク1602はリンク1502cと同じであり、エッジ:文書4to文書に沿って遷移させるためのものである。また、参照先文書名のリンク1603はリンク1507と同じであり、エッジ:文書4to文書に沿って遷移させるためのものである。
次に、アクセスログデータ格納部3に格納されるデータについて説明する。アクセスログデータ格納部3には、アクセス日時、アクセス元のアドレス、アクセス元のユーザID、セッションID、処理内容(例えばカレンダー機能実行、キャビネットからの検索機能実行、メタデータの表示機能実行、キーワード用語辞書機能実行、検索機能実行など)、メタデータの表示機能を実行した場合にはメタデータID、当該メタデータの表示に遷移する前の機能(前の機能がリンクの一覧表示の場合、使用したリンクのIDを含む)などを含む。
また、認証ログデータ格納部4には、ログインが発生する毎に、セッション生成日時及び生成セッションIDと、認証成功日時と、セッションID及びユーザIDとが格納され、ログアウトが発生するたびに、ログアウト日時と、セッションID及びユーザIDと、セッション無効化日時及び無効化セッションIDとが格納されるようになっている。なお、ログアウト処理しない場合でも最後の操作から一定時間を経過するとシステムにてセッションを無効化し、その際にセッション無効化日時及び無効化セッションIDとが格納される。
このようなKMシステム1、アクセスログデータ格納部3、及び認証ログデータ格納部4を前提として、リンク生成及び生成したリンクの有効度/重要度判定の処理について以下説明する。
1.リンクの自動生成
本実施の形態におけるリンク生成については、アクセスログから特定される画面間の遷移(リンク)を、ナレッジであるメタデータ間の遷移(リンク)に写像し、そしてメタデータ間の有効な遷移(リンク)にさらに写像するものである。模式的には、図17の左列に示すように、アクセスログのレベルでは、ノードが画面で、エッジが画面間遷移となる。それに対して第1の写像により、画面の中でもメタデータを表示する画面に対応するノードのみを残し、それらのノード間をつなぐ。すなわち、ナレッジたるメタデータ間の単純な遷移に変換する。図17の中央列の例では、画面1(画面1はメタデータ表示画面という種類の画面を示す)のノードのみが残り、それらが順番にリンク付けられている。そして、第2の写像により、メタデータの表示画面のうち有効と判断されたメタデータの表示画面のノードのみを残し、それらのノード間をつなぐ。これによりメタデータ間の有効な遷移、すなわち有効なナレッジ遷移を抽出する。図17の右列に示すように、画面1のうち3番目のノード以外のノードが残り、それらが順番にリンク付けられている。
以下、このための処理を図18乃至図24を用いて説明する。まず、リンク自動生成処理部51は、アクセスログデータ格納部3及び認証ログデータ格納部4に格納されたデータを用いてログ解析テーブル53の構成処理を実施する(ステップS1)。
この処理は上で述べた第1の写像に対応する。詳細については図19及び図20を用いて説明する。リンク自動生成処理部51は、まずメタデータ関連ログのみをアクセスログデータ格納部3から抽出する(ステップS21)。この処理は、メタデータIDが登録されているログのみを抽出するものである。そして、各ユーザの1単位におけるログを集約し、解析日時、アクセス日時、ユーザID、ユーザが所属するグループのグループID、メタデータID、表示後の挙動ID、メタデータ間の既設リンクを使用した場合にはそのリンクのリンクID、遷移元機能ID、表示時間などを含むレコードを生成し、ログ解析テーブル53に格納する(ステップS23)。
ユーザの1単位は、1のセッションIDにて特定される。本実施の形態では、ユーザが一人であっても、複数のウインドウを開いてそれぞれに画面遷移が存在する場合には、それはセッションが複数存在するものとして取り扱う。認証ログデータ格納部4のデータについては、セッションIDの特定並びにセッションの開始時刻及び終了時刻の特定のために用いる。また、ユーザが所属するグループのグループIDは、図示しないユーザ認証用データベースから特定される。表示後の挙動IDは、メタデータ表示のID(この場合のみ現在の状況を示す)、添付文書表示のID、添付文書ダウンロードのID、メタデータ印刷のIDのいずれかとなる。また、遷移元機能IDは、キャビネット(視点無)のID、キャビネット(視点有)のID、カレンダーのID、検索のID、リンク一覧表示のID、リンク詳細表示のIDのいずれかとなる。表示時間は、メタデータの表示に遷移する前の機能が登録されているログデータとセッションIDが同じすぐ後のログデータとのアクセス日時の差により特定される。
ログ解析テーブル53に格納されるデータの一例を図20に示す。図20の例では、ユーザの1単位に含まれる各レコード毎に、シーケンス番号が付与されており、各レコードに、解析日時、ログ日時、セッションID、グループID、ユーザID、メタデータID、表示後の挙動ID、使用されたリンクID、遷移元機能ID、表示時間が登録されるようになっている。
図18に戻って、次にリンク自動生成処理部51は、未処理に係る、ユーザの1単位を特定する(ステップS3)。そして、当該ユーザの1単位内の各レコードにつき中間指標値を算出し、リンク生成用中間指標値テーブル54に格納する(ステップS5)。ステップS5においては、メタデータを表示する前にどの画面(どの機能)から遷移したかという挙動を評価し、さらにメタデータを表示した後にどの画面に遷移したかという挙動を評価する。
上で述べたKMシステム1においては、メタデータの表示前にカレンダー画面を表示しており、当該カレンダー画面からメタデータに遷移する場合もある。このような画面遷移は、ログ解析テーブル53において遷移元機能IDにカレンダーのIDが登録されているレコードにおいて現れている。但し、このようなレコードが特定されたとしても、そのような挙動を行ったユーザがなぜカレンダー画面からそのメタデータの表示画面に遷移させたかというユーザの意図までは把握できない。従って、ユーザの1単位内の処理対象レコードにつき、単純に遷移元機能がカレンダーか否かについて判断し、遷移元機能がカレンダーであるか否かに関するクリスプ集合S1(bool)を以下のように設定する。
Figure 2007004779
この集合S1(bool)に対する寄与係数をb1とし、処理対象レコードに係るメタデータの寄与値をb11(bool)とする。
また、上で述べたKMシステム1においては、メタデータの表示前に検索画面を表示しており、当該検索画面からメタデータに遷移する場合もある。このような画面遷移は、ログ解析テーブル53において遷移元機能IDに検索のIDが登録されているレコードにおいて現れている。但し、このようなレコードが特定されたとしても、そのような挙動を行ったユーザがなぜ検索画面からそのメタデータの表示画面に遷移させたかというユーザの意図までは把握できない。従って、ユーザの1単位内の処理対象レコードにつき、単純に遷移元機能が検索か否かについて判断し、遷移元機能が検索であるか否かに関するクリスプ集合S2(bool)を以下のように設定する。
Figure 2007004779
この集合S2(bool)に対する寄与係数をb2し、処理対象レコードに係るメタデータの寄与値をb22(bool)とする。
さらに、上で述べたKMシステム1においては、メタデータの表示前にキャビネット画面を表示しており、当該キャビネット画面からメタデータに遷移する場合もある。このような画面遷移は、ログ解析テーブル53において遷移元機能IDにキャビネット(視点無)のIDが登録されているレコードにおいて現れている。但し、このようなレコードが特定されたとしても、そのような挙動を行ったユーザがなぜキャビネット画面からそのメタデータの表示画面に遷移させたかというユーザの意図までは把握できない。従って、ユーザの1単位内の処理対象レコードにつき、単純に遷移元機能がキャビネットか否かについて判断し、遷移元機能がキャビネットであるか否かに関するクリスプ集合S3(bool)を以下のように設定する。
Figure 2007004779
この集合S3(bool)に対する寄与係数をb3とし、処理対象レコードに係るメタデータの寄与値をb33(bool)とする。
さらに、視点有のキャビネット画面を表示させた後にメタデータの表示画面に遷移した場合には、レコードには、遷移元機能IDにキャビネット(視点有)のIDが登録されている。このような場合、クリスプ集合S3a(bool)を以下のように設定する。
Figure 2007004779
本実施の形態では、視点により複数回の絞込みを行うこともあるが、ここでは回数ではなく絞込みを行ったか否かを条件とする。また、この集合S3a(bool)に対する寄与係数をb3aとし、処理対象レコードに係るメタデータの寄与値は絞込みの影響を含めて、b3(1+b3a3(bool))S3(bool)とする。
さらに、上で述べたKMシステム1においては、メタデータの表示前にリンク一覧表示画面を表示しており、当該リンク一覧表示画面からメタデータに遷移する場合もある。このような画面遷移は、ログ解析テーブル53において遷移元機能IDにリンク一覧表示のIDが登録されているレコードにおいて現れている。但し、このようなレコードが特定されたとしても、そのような挙動を行ったユーザがなぜリンク一覧表示画面からそのメタデータの表示画面に遷移させたかというユーザの意図までは把握できない。従って、ユーザの1単位内の処理対象レコードにつき、単純に遷移元機能がリンク一覧表示か否かについて判断し、遷移元機能がリンク一覧表示であるか否かに関するクリスプ集合S4(bool)を以下のように設定する。
Figure 2007004779
この集合S4(bool)に対する寄与係数をb4とし、処理対象レコードに係るメタデータの寄与値をb44(bool)とする。
以上述べた要素をまとめると、メタデータの表示前の挙動に対応する全寄与値bStotalは、以下のように定義される。
bStotal=b11(bool)+b22(bool)+b3(1+b3a3(bool))S3(bool)+b44(bool)
また、上で述べたKMシステム1においては、メタデータの表示後の挙動としてメタデータの詳細表示を行う場合がある。但し、本実施の形態では、メタデータの基本データ表示からメタデータの詳細データ表示への遷移に対応するエッジ:文書1to2での遷移はログデータに登録されておらず、ログ解析テーブル53からも特定できない。そこで、エッジ:文書1to2を特定する代わりに、メタデータの基本データ表示の後に次の画面に遷移するまでの時間、すなわちログ解析テーブル53におけるレコードの表示時間Δtにより、メタデータの表示後の挙動を擬似的に評価する。
ここでΔtに関するファジー集合M1(Δt)を以下のように設定する。
Figure 2007004779
a,b,cについては定数である。また、t1は別途設定される。但し、t1<tmax<tminである。また、上記ファジー集合M1(Δt)の値をPUとすると、PUはtmaxで最大値1となり、tminでyminとなる。また、0≦ymin<1となる。このようなファジー集合M1(Δt)の二次曲線を図に表すと図21のようになる。図21において横軸はΔtを表し、縦軸はPUを表す。なお、図21においてt1未満、tminを超えるΔtについては、PU=0となる。このような上に凸の関数を用いるのは、ある程度(tmax)までは表示時間Δtが長くなればなるほどそのメタデータに注目しているとして寄与値を上げ、ある程度以上表示時間Δtが長くなると表示したままで放置されているとも考えられるので寄与値を下げるためである。なお、本ファジー集合M1(Δt)に対する寄与係数をc1とし、処理対象レコードに係るメタデータの寄与値をc11(Δt)とする。
また、上で述べたKMシステム1においては、メタデータの表示後の挙動として添付文書を表示する場合がある。ログ解析テーブル53のレコードには、表示後の挙動IDが登録されており、表示後の挙動IDが添付文書表示のIDであれば、そのレコードが該当する。なお、本レコードによりエッジ:文書1to5の存在が特定できる。但し、このようなレコードが特定されたとしても、添付文書の内容についてはログデータのみからは特定できず、また添付文書の内容の重要度については判断できない。従って、単純に添付文書を表示した回数kに注目して判断するものとする。ここで、kに関するクリスプ集合M2(k)を以下のように設定する。
Figure 2007004779
なお、複数の添付文書が存在する場合もあるが、kによる判断に単純化している。そして、この集合M2(k)に対する寄与係数をc2とし、処理対象レコードに係るメタデータの寄与値をc22(k)とする。
また、上で述べたKMシステム1においては、メタデータの表示後の挙動として添付文書をダウンロードする場合がある。ログ解析テーブル53のレコードには、表示後の挙動IDが登録されており、表示後の挙動IDが添付文書ダウンロードのIDであれば、そのレコードが該当する。なお、本レコードによりエッジ:文書1to6の存在が特定できる。但し、このようなレコードが特定されたとしても、添付文書の内容についてはログデータのみからは特定できず、また添付文書の内容の重要度については判断できない。従って、単純に添付文書をダウンロードした回数lに注目して判断するものとする。ここで、lに関するクリスプ集合M3(l)を以下のように設定する。
Figure 2007004779
なお、複数の添付文書が存在する場合もあるが、lによる判断に単純化している。そして、この集合M3(l)に対する寄与係数をc3とし、処理対象レコードに係るメタデータの寄与値をc33(l)とする。
また、上で述べたKMシステム1においては、メタデータの表示後の挙動として添付文書を印刷する場合がある。ログ解析テーブル53のレコードには、表示後の挙動IDが登録されており、表示後の挙動IDが添付文書印刷のIDであれば、そのレコードが該当する。なお、本レコードによりエッジ:文書1to7の存在が特定できる。但し、このようなレコードが特定されたとしても、添付文書の内容についてはログデータのみからは特定できず、また添付文書の内容の重要度については判断できない。従って、単純に添付文書を印刷した回数mに注目して判断するものとする。ここで、mに関するクリスプ集合M4(m)を以下のように設定する。
Figure 2007004779
なお、複数の添付文書が存在する場合もあるが、mによる判断に単純化している。そして、この集合M4(m)に対する寄与係数をc4とすると、処理対象レコードに係るメタデータの寄与値をc44(m)とする。
以上述べた要素をまとめると、メタデータの表示後の挙動に対する全寄与値cMtotalは、以下のように定義される。
cMtotal=c11(Δt)+c22(k)+c33(l)+c44(m)
処理対象レコード、すなわち処理対象メタデータ(同じメタデータが当該ユーザの1単位に出現していてもそれは別扱い)の寄与値KPviewは、メタデータ表示前の挙動に対する全寄与値bStotalとメタデータ表示後の挙動に対する全寄与値cMtotalとの和となる。すなわち、以下のように表される。
KPview=bStotal+cMtotal
以上の計算結果は、リンク生成用中間指標値テーブル54に格納される。リンク生成用中間指標値テーブル54に格納されるデータの一例を図22に示す。図22の例では、シーケンス番号、解析日時、ログ日時、グループID、ユーザID、メタデータID、使用されたリンクのリンクID(リンク生成時には使用しない)、中間指標値が登録される。シーケンス番号は、各ユーザの1単位内において付与される。
このように、各ユーザの1単位におけるレコード(メタデータ)のシーケンス番号を考慮すれば、メタデータ間の遷移及びユーザのアクセス・フロー(ナレッジ遷移)における当該メタデータの寄与を表す初期段階の中間指標値が算出される。
次に、上で述べた写像2を考える。本実施の形態では、閾値Bound1を用いて、メタデータの寄与は次のクリスプ集合へと変換される。
Figure 2007004779
このように、リンク自動生成処理部51は、閾値Bound1による中間指標値の調整を行い、リンク用中間指標値テーブル54を更新する(ステップS7)。すなわち、閾値Bound1未満の寄与しかないメタデータについては、当該メタデータの寄与を0として、重要でないメタデータを除去するものである。リンク生成用中間指標値テーブル54における中間指標値を0に設定するか、0と判断されたレコードを削除する。
そして、全てのユーザの全ての単位について処理したか判断する(ステップS9)。未処理の単位が残っている場合にはステップS3に戻る。全てのユーザの全ての単位について処理が完了した場合には、以下で実際にリンクを生成するか判断する。
まず、リンク自動生成処理部51は、リンク生成用中間指標値テーブル54をベースにして、未処理に係る、ユーザの1単位を特定する(ステップS11)。そして、ユーザ係数データ格納部58に格納されたデータを用いて、特定ユーザの特定の1単位における各リンクの寄与LP(i)を算出し、メインメモリなどの記憶装置に格納する(ステップS13)。
本実施の形態では、単純にリンク生成用中間指標値テーブル54に格納されているレコードのメタデータxから次のレコードのメタデータyへの遷移につきリンクの生成を検討する。そこでまず、メタデータxから次のメタデータyへのリンクの寄与LPx-yを、メタデータxの中間指標値(寄与値)とメタデータyの中間指標値(寄与値)の和であると定義する。すなわち、
LPx-y=KPx+KPy
さらに、ユーザjの熟練度に応じた重みujを、この段階で考慮してリンクの寄与値LPx-yを以下のように修正する。なお、熟練度uについては、ユーザ毎、又はグループ毎に予め設定して、ユーザ係数データ格納部58に格納しておき、リンク生成用中間指標データ格納部54に格納されているユーザID又はグループIDからujを特定して用いる。
LPx-y=ujLPx-y
そして、n個のメタデータが存在することを想定し、リンクを有向グラフとして捉えると、1単位におけるリンクの寄与LP(i)は、以下のような行列として表される。なお、iは特定の単位を示すものである。
Figure 2007004779
このように、1単位において出現したリンクについての寄与値が、対応する行列要素として登録される。出現していないリンクについては、その対応する行列要素の値が0となる。なお、1単位内において複数回同一リンクが出現した場合には、その寄与値の総和を行列要素として登録する。また、LPn-nは0としてリンクの設定は行わない。
そして、全てのユーザの全ての単位について処理したか判断する(ステップS15)。もし未処理の単位が存在する場合にはステップS11に戻る。一方、全てのユーザの全ての単位を処理した場合には、指定期間におけるリンクの寄与LP(i)の総和を算出し、メインメモリなどの記憶装置に格納する(ステップS17)。例えば、1月毎に本処理を実施する場合には、当月における、全ユーザの全単位につきリンクの寄与LP(i)の総和を算出する。これにより行列内の同一要素が累積されることになる。例えば、指定期間の始期をTmin、終期をTmaxとすると、ステップS15の演算は以下のように表される。
Figure 2007004779
但し、iがTminからTmaxまで変化するのではなく、その間の全てのiということである。
そして、リンク自動生成処理部51は、リンク生成用最終指標値テーブル55から前の指定期間における最終指標値を読み出し、ステップS17で算出されたリンクの寄与LP(i)の各要素LPx-yの、最終指標値からの増分Δnx-yを算出し、メインメモリなどの記憶装置に格納する(ステップS19)。リンク生成用最終指標値テーブル55に格納されるデータの一例を図23に示す。図23の例では、解析日時と、リンク元のメタデータIDと、リンク先のメタデータIDと、最終指標値とが格納されるようになっている。このように1レコードにつき1つのリンクの最終指標値が登録され、本テーブルは解析日時毎(実質的に指定期間毎)に保存される。ステップS19では、前の指定期間についてのデータを読み出す。処理は、端子Aを介して図24の処理フローに移行する。
そして、リンク自動生成処理部51は、増分Δnx-y及び予め定められた累積モデルに従って指定期間におけるリンク生成用の最終指標値を算出し、リンク生成用最終指標値テーブル55に登録する(ステップS31)。本実施の形態における累積モデルは、(1)Δnx-yが閾値nv以上であれば、増分Δnx-yをそのまま前の指定期間における最終指標値に累積し、(2)増分Δnx-yをそのまま前の指定期間における最終指標値に累積すると累積最大値fmax以上となってしまう場合には、指定期間におけるリンク生成用の最終指標値をfmaxに設定し、(3)増分Δnx-yが閾値nv未満であれば、前の指定期間における最終指標値を減衰させる、というものである。式で表すと以下のとおりになる。
Figure 2007004779
ここでf(n)は、指定期間における特定のリンクについての最終指標値であり、f(n-1)は、前の指定期間における特定のリンクについての最終指標値である。また、eは前の指定期間における最終指標値を減衰させるための係数であり、例えばαはThalve期間で半減するe-αThalve=0.5を満たすものとする。さらに、fMaxについては計算限界を超えないようするための値である。
このように、特定のメタデータから他の特定のメタデータへの遷移によるリンク寄与値が所定のレベル以上に増加していることが確認できれば最終指標値を増加させ、所定のレベル以上に増加しない場合には最終指標値を減衰させることにより、本当によく行われる遷移を抽出して、より適切なリンク生成につなげるようにするものである。
そして、リンク自動生成処理部51は、リンク生成用最終指標値テーブル55に格納されている最終指標値を正規化し、メインメモリなどの記憶装置に格納する(ステップS33)。なお、リンク生成用最終指標値テーブル55に、正規化後の最終指標値をも登録するようにしても良い。本実施の形態では、最終指標値に対して絶対的な閾値を設ける場合と、相対量としての閾値を設ける場合とが存在する。絶対的な閾値を設ける場合には、正規化単位fPUとしてfMaxを用いる。また、相対的な閾値を設ける場合には、正規化単位fPUとして最終指標値f(n)のうちの最大値を用いる。式に表せば以下のようになる。
Figure 2007004779
従って正規化は、以下のように行われる。
Figure 2007004779
そして、リンク自動生成処理部51は、PU(f(n))に対する閾値fcriteriaと比較することにより、リンク生成の是非を判定し、判定結果を判定結果格納部59に格納する(ステップS35)。本ステップを、式で示せば以下のようになる。
Figure 2007004779
なお、判定結果格納部59に格納するのは、遷移元メタデータID及び遷移先メタデータIDのセットである。また、ステップS35による判断だけではなく、KMシステム1の管理者による最終判断が行われた後にリンクを設定するようにしても良い。
判定結果格納部59に格納された結果に基づき、図5で示すようなテーブルを修正することにより、KMシステム1のユーザは、図15で示したようなリンク一覧表示画面において新たに生成されたリンクを見ることができる。また、図13で示したようなメタデータの基本データの表示画面及び図14で示したようなメタデータの詳細データの表示画面においても、リンクの件数が増加する。
以上のように関連性の高いメタデータ間にリンクを新たに生成することにより、ユーザは容易に関連するメタデータを参照することができ、利便性が向上する。
2.リンクの有効度/重要度判定
次に、リンクの有効度/重要度の判定について説明する。リンクの有効度を判断する場合には、ユーザのアクセス・フローを全て判断するのではなく、リンクをベースとした操作にのみ着目すればよい。このリンクをベースとする操作は、エッジ:文書1to3により表示されたリンク一覧表示画面(図15)における操作が中心である。リンクの有効度は、図15のリンク一覧表示画面における矢印の太さを変えることにより表現される。
この処理を図25及び図26を用いて説明する。まず、ログ解析テーブル53の構成処理を実施する(ステップS41)。本処理については、図19に示した処理フローと同じである。すなわち、図20に示したログ解析テーブル53を構成するものである。なお、リンク自動生成処理部51が、ログ解析テーブル53を既に生成している場合であって、同じ範囲についてリンク管理部52が処理を行う場合には、本ステップをスキップして、既に生成されているログ解析テーブル53を用いても良い。
次にリンク自動生成処理部51は、ログ解析テーブル53に格納されているデータを用いて、リンク経由の遷移に関連するレコードを抽出し、例えばログ解析テーブル53に別テーブルとして登録する(ステップS43)。本処理では、エッジ:文書3to文書によりリンク先のメタデータを表示する場合、及びエッジ:文書3to4によりリンク詳細画面を表示してリンク内容を確認した後にエッジ:文書4to文書によりメタデータを表示した場合を注目すればよい。一方、ログ解析テーブル53において、リンクIDが登録されているということは、リンクIDに対応するリンク詳細画面を経由して他のメタデータを表示するためのリンクが選択された場合又はリンク一覧表示画面から直接他のメタデータの表示画面に遷移したことを表すため、当該リンクIDが登録されているレコードを抽出する。
そして、未処理に係る、ユーザの1単位を特定する(ステップS45)。ユーザの1単位については、リンク生成の時と同じであって、セッションID毎という意味である。そして、ステップS43で抽出されたレコードを用いて1単位内の各レコードにつき中間指標値を算出し、太さ用中間指標値テーブル56に格納する(ステップS47)。本実施の形態においてリンクの有効度/重要度を判定する場合には、メタデータの表示後の挙動及びユーザの重みをベースに中間指標値を算出する。
上で述べたKMシステム1においては、メタデータ(基本データ)の表示後の挙動としてメタデータの詳細表示を行う場合がある。但し、本実施の形態では、メタデータの基本データ表示からメタデータの詳細データ表示への遷移に対応するエッジ:文書1to2での遷移はログデータに登録されておらず、ログ解析テーブル53からも特定できない。そこで、エッジ:文書1to2を特定する代わりに、メタデータの基本データ表示の後に次の画面に遷移するまでの時間、すなわちログ解析テーブル53におけるレコードの表示時間Δtにより、メタデータの表示後の挙動を擬似的に評価する。
ここでΔtに関するファジー集合mA(Δt)を以下のように設定する。
Figure 2007004779
なお、a,b,cについては定数である。また、t1は別途設定される。但し、t1<tmax<tminである。また、上記ファジー集合mA(Δt)の値をPUとすると、PUはtmaxで最大値1となり、tminでyminとなる。また、0≦ymin<1となる。このようなファジー集合mA(Δt)の二次曲線を図に表すと図21のようになる。図21については上で述べたのでここでは説明を省略する。なお、本ファジー集合に対する寄与係数をc1とし、処理対象レコードに係るリンクの寄与値をc1mA(Δt)とする。
また、上で述べたKMシステム1においては、メタデータの表示後の挙動として添付文書を表示する場合がある。ログ解析テーブル53のレコードには、表示後の挙動IDが登録されており、表示後の挙動IDが添付文書表示のIDであれば、そのレコードが該当する。なお、本レコードによりエッジ:文書1to5の存在が特定できる。但し、このようなレコードが特定されたとしても、添付文書の内容についてはログデータのみからは特定できず、また添付文書の内容の重要度については判断できない。従って、単純に添付文書を表示した回数kに注目して判断するものとする。ここで、kに関するクリスプ集合mB(k)を以下のように設定する。
Figure 2007004779
なお、複数の添付文書が存在する場合もあるが、kによる判断に単純化している。そして、この集合mB(k)に対する寄与係数をc2とし、処理対象レコードに係るリンクの寄与値をc2mB(k)とする。
また、上で述べたKMシステム1においては、メタデータの表示後の挙動として添付文書をダウンロードする場合がある。ログ解析テーブル53のレコードには、表示後の挙動IDが登録されており、表示後の挙動IDが添付文書ダウンロードのIDであれば、そのレコードが該当する。なお、本レコードによりエッジ:文書1to6の存在が特定できる。但し、このようなレコードが特定されたとしても、添付文書の内容についてはログデータのみからは特定できず、また添付文書の内容の重要度については判断できない。従って、単純に添付文書をダウンロードした回数lに注目して判断するものとする。ここで、lに関するクリスプ集合mC(l)を以下のように設定する。
Figure 2007004779
なお、複数の添付文書が存在する場合もあるが、lによる判断に単純化している。そして、この集合mC(l)に対する寄与係数をc3とし、処理対象レコードに係るリンクの寄与値をc3mC(l)とする。
また、上で述べたKMシステム1においては、メタデータの表示後の挙動として添付文書を印刷する場合がある。ログ解析テーブル53のレコードには、表示後の挙動IDが登録されており、表示後の挙動IDが添付文書印刷のIDであれば、そのレコードが該当する。なお、本レコードによりエッジ:文書1to7の存在が特定できる。但し、このようなレコードが特定されたとしても、添付文書の内容についてはログデータのみからは特定できず、また添付文書の内容の重要度については判断できない。従って、単純に添付文書を印刷した回数mに注目して判断するものとする。ここで、mに関するクリスプ集合mD(m)を以下のように設定する。
Figure 2007004779
なお、複数の添付文書が存在する場合もあるが、mによる判断に単純化している。そして、この集合mD(m)に対する寄与係数をc4とし、処理対象レコードに係るリンクの寄与値をc4mD(m)とする。
また、リンクを用いた遷移を行ったユーザの熟練度を表す重みujについては、ユーザ係数データ格納部58から読み出す。
そうすると、処理対象レコードに係るリンクの全寄与値Fiは、以下のように表される。
i=uj(c1mA(Δt)+c2mB(k)+c3mC(l)+c4mD(m))
このように、ユーザの重みujを除き、全て独立であって直和で表現できるものとしている。
このように算出された、処理対象レコードに係るリンクの全寄与Fiを、太さ用中間指標値として、太さ用中間指標値テーブル56に格納する。太さ用中間指標値テーブル56に格納されるデータの形式は、図22に示したリンク生成用中間指標値テーブル54のデータの形式と同じである。
そして、全てのユーザの全ての単位について処理したか判断する(ステップS49)。もし未処理の単位が存在するならばステップS45に戻る。一方、全てのユーザの全ての単位について処理した場合には、リンク管理部52は、太さ用中間指標値テーブル56においてリンクIDの列に登録されているリンクID毎に、指定期間における中間指標値Fiの総和を算出し、例えばメインメモリなどの記憶装置に格納する(ステップS51)。すなわち、各リンクIDにつき、指定期間における全てのユーザの全ての単位の中間指標値Fiの総和を算出する。式で表せば以下のようになる。
Figure 2007004779
指定期間の始期はTminであり、終期はTmaxである。但し、上記の式ではiがTminからTmaxまで変動するようになっているが、iがTminからTmaxまで変化するのではなく、その間の全ての単位iということである。
そして、リンク管理部52は、太さ用最終指標値テーブル57から前の指定期間における最終評価値を読み出し、ステップS51で算出された各リンクの中間指標値の累積値Fの、対応する最終指標値からの増分Δnx-yを算出し、メインメモリなどの記憶装置に格納する(ステップS53)。太さ用最終指標値テーブル57に格納されるデータの一例を図26に示す。図26の例では、解析日時と、リンクIDと、最終指標値とが格納されるようになっている。このように1レコードにつき1つのリンクの最終指標値が登録され、本テーブルは指定期間毎に保存される。
そして、リンク管理部52は、増分Δnx-y及び予め定められた累積モデルに従って指定期間における太さ用の最終指標値を算出し、太さ用最終指標値テーブル57に登録する(ステップS55)。本実施の形態における累積モデルは、(1)Δnx-yが閾値nv以上であれば、増分Δnx-yをそのまま前の指定期間における最終評価値に累積し、(2)増分Δnx-yをそのまま前の指定期間における最終評価値に累積すると累積最大値fmax以上となってしまう場合には、指定期間におけるリンク生成用の最終評価値をfmaxに設定し、(3)増分Δnx-yが閾値nv未満であれば、前の指定期間における最終評価値を減衰させる、というものである。式で表すと以下のとおりになる。
Figure 2007004779
ここでf(n)は、指定期間における特定のリンクについての最終評価値であり、f(n-1)は、前の指定期間における特定のリンクについての最終評価値である。また、eは前の指定期間における最終評価値を減衰させるための係数であり、例えばαはthalve期間で半減するe-αthalve=0.5を満たすものとする。さらに、fMaxについては計算限界を超えないようするための値である。
このように、各リンクの中間指標値の累計が所定のレベル以上に増加していることが確認できれば最終指標値を増加させ、所定のレベル以上に増加しない場合には最終指標値を減衰させることにより、ある期間にわたりよく用いられているリンクについてより大きな最終指標値を与えるようにしている。
そして、リンク管理部52は、太さ用最終指標値テーブル57に格納されている最終指標値を正規化し、メインメモリなどの記憶装置に格納する(ステップS57)。本実施の形態では、最終指標値に対して絶対的な閾値を設ける場合と、相対量としての閾値を設ける場合とが存在する。絶対的な閾値を設ける場合には、正規化単位fPUとしてfMaxを用いる。また、相対的な閾値を設ける場合には、正規化単位fPUとして最終指標値f(n)のうちの最大値を用いる。式に表せば以下のようになる。
Figure 2007004779
従って正規化は、以下のように行われる。
Figure 2007004779
そして、リンク自動生成処理部51は、PU(f(n))に対する閾値fhigh、fmiddle、flowと比較することにより、太さという有効度/重要度を判定し、例えば判定結果格納部59に格納する(ステップS59)。本ステップを式で示せば以下のようになる。
Figure 2007004779
このように、fhigh<PU(f(n))であれば、有効度大として太いリンクを設定し、fmiddle<PU(f(n))≦fhighであれば、有効度中として中太のリンクを設定し、flow<PU(f(n))≦fmiddleであれば、有効度小として細いリンクを設定し、PU(f(n))≦flowであれば、有効度微小として弱いリンクを設定する。このような判定結果をリンクに対応して判定結果格納部59に格納する。
なお、ステップS59による判断だけではなく、KMシステム1の管理者による最終判断が行われた後にリンクを設定するようにしても良い。
以上のように重要度の高いリンクをより太いリンクを表示することにより、ユーザは容易に関連の程度を把握しつつメタデータを参照することができ、利便性が向上する。
3.類似文書の抽出
上で述べた例では、リンクという明示的なメタデータ間の関連を取り扱ったが、これ以外にもメタデータ間には類似というものを定義することができる。以下では、類似のメタデータを提示するための処理等を説明する。
例えば、メタデータ等の文書データをKMシステム1に登録する場合に、類似のメタデータを参照したい場合がある。例えば、KMシステム1にメタデータ等を登録する際には、ユーザの指示に従って例えばクライアント端末9はKMシステム1にアクセスし、図27に示すような画面を表示するためのデータをKMシステム1から受信し、表示装置に表示する。図27の例では、入力データをKMシステム1に登録させるための登録ボタン2701と、入力内容をクリアするためのクリアボタン2702と、登録せずに処理を終了させるための終了ボタン2703と、類似事例提示ボタン2704と、図27より詳細なデータを登録するための詳細登録画面へ遷移させるための詳細登録画面ボタン2705と、類似メタデータを抽出するための条件となる事業所名の選択欄2706と、類似メタデータを抽出するための条件となる発電所の選択欄2707と、災害件名の入力欄2708と、発生日時の入力欄2709と、発生場所の入力欄2710と、発生状況(概要)の入力欄2711と、処置の入力欄2712と、原因の入力欄2713と、対策の入力欄2714と、水平展開の入力欄2715と、経験から得たナレッジの入力欄2716と、メタデータに関連する文書ファイルを登録するためのファイル登録ボタン2717と、メタデータに関連するメタデータへのリンクを登録するためのリンク登録ボタン2718と、本メタデータの分類であり且つ類似メタデータを抽出するための条件となる設備の選択欄2719と、本メタデータの分類であり且つ類似メタデータを抽出するための条件となる状況の選択欄2720と、本メタデータの分類であり且つ類似メタデータを抽出するための条件となる事故区分の選択欄2721と、本メタデータの分類であり且つ類似メタデータを抽出するための条件となるユニットへの影響の選択欄2722とが含まれている。
ユーザは、この画面において入力欄に登録すべきデータを入力し、選択欄において該当するデータを選択する。但し、ユーザが、メタデータ等の登録に習熟していればよいが、不慣れな場合には、事業所名の選択欄2706と、発電所の選択欄2707と、設備の選択欄2719と、状況の選択欄2720と、事故区分の選択欄2721と、ユニットへの影響の選択欄2722とのうち少なくとも1つにおいていずれかの選択肢(要素)を選択した後、類似事例提示ボタン2704をクリックする。そうすると、以下で述べるような処理が行われるようになる。なお、図27に示したような画面を表示させる場合には、KMシステム1へ予めログインしておく必要がある。
まず、類似メタデータの提示を行う場合におけるKMシステム1のシステム構成を図28を用いて説明しておく。KMシステム1は、図2乃至図6で説明したようなデータを格納するためのナレッジDB11と、例えば図27のような画面における類似事例提示ボタン2704をクリックすることによってKMシステム1に送信される抽出条件のデータ等を例えばクライアント端末9から受信する類似事例抽出指示受付部12と、ナレッジDB11に登録されたメタデータから類似事例の抽出条件に合致する類似事例の抽出処理を実施する類似事例抽出処理部13と、類似事例抽出処理部13の処理で用いられる重み係数のデータを格納する重み係数格納部14と、リンク生成管理装置5内のリンク生成用中間指標値テーブル54に格納されたデータを用いて活用指標値を算出する活用指標値算出部20と、活用指標値算出部20によって算出された活用指標値のデータを格納する活用指標値データ格納部19と、類似事例抽出処理部13の処理結果を格納する類似事例リスト格納部15と、類似事例リスト格納部15に格納されているデータに従って各種出力処理を実施する類似事例出力処理部16と、類似事例出力処理部16によって出力された類似メタデータからメタデータを作成するための処理を実施するメタデータ生成部17と、同じく類似事例出力処理部16によって出力された類似メタデータからリンクを生成するためのリンク生成処理部18とを有する。なお、メタデータ生成部17及びリンク生成処理部18は、その処理結果をナレッジDB11に格納する。また、類似事例抽出処理部13は、メタデータ毎に類似度を算出する類似度算出部131と、類似度及び活用指標値に基づきメタデータをソートするソート処理部132とを含む。
次に図29B乃至図35を用いて図28に示したシステムの処理フロー内容を説明する。なお、前処理として活用指標値算出部20は、図18のステップS9まで完了した時点においてリンク生成用中間指標値テーブル54に格納されたデータ(図22)を用いて、基本的にはステップS11乃至ステップS33(図24)の処理を実施して、活用指標値を算出する。但し、ステップS13については、上では、
LPx-y=KPx+KPy
を算出していたが、
LPx=KPx
を算出するようにする。さらに、LP(i)については、上ではn行n列の正方行列であったが、ここでは1行n列(又はn行1列)の行列となる。
また、ステップS19では、リンク生成用最終指標値テーブル55を用いているが、今回は活用指標値データ格納部19から前の指定期間における最終指標値(正規化前の活用指標値)を読み出し、ステップS17で算出された各メタデータのLP(i)の各要素LPxの、最終指標値からの増分Δnxを算出する。活用指標値データ格納部19には、図29Aに示すように、メタデータ毎に正規化前の活用指標値と正規化後の活用指標値とが登録されている。この正規化前の活用指標値が、上で述べた最終指標値に相当する。以下、上ではΔnx-yであったものについては、Δnxとして読み替えた形で処理を実施して、さらにリンク生成用最終指標値テーブル55を活用指標値データ格納部19として処理を実施し、ステップS33における正規化後の最終指標値を正規化後の活用指標値として活用指標値データ格納部19に格納しておく。このような処理を行って活用指標値データ格納部19に活用指標値(正規化後)を用意しておき、図29B以降の処理を実施する。
例えば図27に示したような画面において、ユーザが、事業所名の選択欄2706と、発電所の選択欄2707と、設備の選択欄2719と、状況の選択欄2720と、事故区分の選択欄2721と、ユニットへの影響の選択欄2722とのうち少なくとも1つにおいて、いずれかの要素(選択肢)を選択した後、類似事例提示ボタン2704をクリックすると、クライアント端末9は、ユーザから当該入力を受け付け、ユーザにより選択された選択欄(分類又は属性に相当する)の名称又は識別情報と選択要素名又は識別情報とを含む類似事例提示要求をKMシステム1に送信する。KMシステム1の類似事例抽出指示受付部12は、クライアント端末9から、選択欄の名称又は識別情報と選択要素名又は識別情報とを含む類似事例提示要求を受信すると(ステップS101)、抽出条件である選択欄の名称又は識別情報と選択要素名又は識別情報が十分であるか否かを判断する(ステップS103)。すなわち、上で述べた選択欄のいずれもが選択されずに類似事例提示ボタン2704がクリックされていないかを確認する。なお、ここでは上で述べた選択欄の少なくとも1つについて項目が選択されていることを要件としているが、さらに複数の選択欄の選択を要件にしたり、特定の選択欄を必須の選択欄として設定するようにしても良い。
ユーザによって指定された抽出条件が不十分である場合には、抽出条件の再入力要求をクライアント端末9に出力する(ステップS104)。クライアント端末9は、抽出条件の再入力要求を受信すると、表示装置に表示して、ユーザに対して入力をし直すように促す。そしてステップS101に戻る。
一方、抽出条件が十分である場合には、類似事例抽出指示受付部12は、受信した抽出条件を類似事例抽出処理部13の類似度計算部131に出力し、類似度計算部131は、受信した抽出条件について、要素毎に選択/非選択を表すベクトルを分類(選択欄)毎に生成し、例えばメインメモリなどの記憶装置に格納する(ステップS105)。図27の例では、「設備」という分類において、選択肢たる要素は「設備A」「設備B」「設備C」「設備D」であり、ユーザにより「設備A」が選択されていれば「1」を設定し、選択されていなければ「0」を設定するといったようにベクトルを生成する。「設備A」のみ選択されていれば「設備」のベクトルは、(1,0,0,0)となる。「設備A」及び「設備C」が選択されている場合には、(1,0,1,0)となる。このようなベクトルを全ての分類について生成する。一般的には、分類等がt個存在しており、その分類における要素がn個であれば、xt=(xt1,xt2,xt3・・・xtn-1,xtn)となる。xは比較元データのベクトル又はベクトル成分を表す。
また、類似度計算部131は、ナレッジDB11から未処理のメタデータを1つ特定し、当該処理対象メタデータに含まれる分類等の選択要素のデータを読み出して、ステップS105と同様に要素毎に選択/非選択を表すベクトルを分類毎に生成し、例えばメインメモリ等の記憶装置に格納する(ステップS107)。ベクトルの生成方法は上で述べたとおりであるが、メタデータの場合には、yでベクトル又はベクトル成分を表す。一般的には、yt=(yt1,yt2,yt3・・・ytn-1,ytn)となる。なお、本ステップで生成されるベクトルについては予め生成しておき、ナレッジDB11に登録しておくようにしても良い。
そして、類似度計算部131は、分類毎に類似度を算出すると共に、処理対象メタデータについて重み係数格納部14に格納されている重み係数による重み付きユークリッド距離を算出し、類似事例リスト格納部15に格納する(ステップS109)。本実施の形態では、抽出条件から生成されたベクトルxと処理対象メタデータから生成されるベクトルyとでは同じ分類については同じ次元数を有するベクトルが得られ、同じ要素を選択していれば、同じベクトル成分が「1」となっており、類似しているものと扱う。例えば「設備」という分類において、比較元データで「設備A」のみが選択されており、処理対象メタデータでも「設備A」のみが選択されている場合には、当該分類については類似度を1とする。但し、同一の分類について複数の要素が選択される可能性があるので、例えば「設備」という分類において、抽出条件では「設備A」と「設備C」が選択されており、処理対象メタデータでは「設備A」と「設備D」とが選択されている場合には、3種類の要素が関係していて一致しているのは「設備A」のみであるから、1/3という値を算出するものとする。分類tについての類似度は、以下の式で表される。
ρtxy=a/(a+b+c)
なお、aはxti及びytiが共に1である成分の個数、bはxtiが1でytiが0である成分の個数、cはxtiが0でytiが1である成分の個数をそれぞれ示す。具体的には、以下のとおりである。
Figure 2007004779
そして、本実施の形態では、各分類は独立で互いに他の分類に影響を及ぼさず、各分類についてその重要度を設定しており、分類について1つも要素の選択が行われない場合があることを許容するという前提の下、処理対象メタデータについての総合的な類似度である重み付きユークリッド距離を以下のように算出する。
Figure 2007004779
ここでWtが分類tの重み係数である。重み係数は重み係数格納部14に格納されている。重み係数格納部14に格納されているデータの一例を図30に示す。図30の例では、各分類につきWtの具体的な値が登録されている。このような式を用いればユークリッド距離dxyは、0≦dxy≦1の値をとる。dxyは1に近いほど類似しているとみなすことができる。
ステップS107及びS109については、全てのメタデータについて処理するまで繰り返す(ステップS111)。全てのメタデータについて処理を実施すれば、類似事例リスト格納部15には例えば図31のようなデータが格納される。図31の例では、メタデータ毎に、総合的な類似度であるユークリッド距離dxyが格納されるようになっている。
そして、類似度算出部131の処理が終了すると、ソート処理部132は、類似事例リスト格納部15に格納されたユークリッド距離dxy及び活用指標値データ格納部19に格納された活用指標値に基づき、メタデータをソートし、ソート結果を類似事例リスト格納部15に格納する(ステップS113)。本実施の形態では、ユークリッド距離dxyの大きい順でソートし、同一のユークリッド距離dxyを有する複数のメタデータが存在する場合に活用指標値の大きい順でソートする。さらに、活用指標値でも一致する場合には、メタデータIDの大小で順番を決める。
なお、ユークリッド距離dxyが0以上となるメタデータが全く見つからない場合もあるが、その場合にはステップS113はスキップされる。一方、ユークリッド距離dxyが0以上となるメタデータが多数となる場合もある。そのような場合には、例えば上位m(mは1以上の整数)個を選択する。
このように類似度が高いメタデータが特定されて類似事例リスト格納部15に格納されると、類似事例出力処理部16は、類似事例リスト格納部15及びナレッジDB11に格納されたデータを用いて類似事例の出力処理を実施する(ステップS115)。この類似事例の出力処理については、図32乃至図35を用いて詳細に説明する。
まず、類似事例出力処理部16は、類似事例リスト格納部15に格納されているメタデータのリストを類似事例リストとしてクライアント端末9に出力する(ステップS121)。クライアント端末9は、KMシステム1から類似事例リストを受信し、表示装置に表示する。例えば、図33のような画面が表示される。但し、図33では既に示されているが、この段階ではフレーム3303にはデータは表示されない。図33の例では、フレーム3301には、図30のような重み係数を表示するための重み表示ボタン3311と、終了ボタン3312と、リンク登録を実施するためのリンク登録ボタン3313と、図27で示したようなウィンドウへフレーム3303に表示されており且つチェックボックス群3333で指定されたデータをコピーするための作成中文書へコピーボタン3314とが含まれる。また、フレーム3302には、順位と対応するメタデータ(文書)名とのリストである類似事例リスト3324と、類似事例リスト3324で選択されたメタデータ名を表示したりキーボードによってメタデータ名の入力を行う表示文書表示入力欄3323と、表示文書表示入力欄3323に表示されているメタデータをフレーム3303に表示させるための表示ボタン3321と、類似事例リスト3324に列挙されているメタデータのうち重要文書のみ表示させるための重要文書のみ表示ボタン3322とが含まれる。フレーム3303には、選択されたメタデータの内容が表示される。なお、チェックボックス群3333は、上でも述べたように図27で示したようなウィンドウにデータを出力するための項目を指定するためのものであり、発生場所、発生状況、処置、原因、対策、水平展開、経験から得たナレッジを選択できるようになっている。また、表示ボタン3334は、表示されているメタデータの添付ファイルを表示するためのボタンであり、ダウンロードボタン3335は、添付ファイルをダウンロードするためのボタンであり、リンクボタン3336は、表示されているメタデータのリンクデータを表示させるためのボタンである。また、基本項目画面ボタン3331は、図33のフレーム3303の表示(現在詳細表示中)を基本項目のみの表示に変更させるためのボタンであり、基本項目表示中であれば詳細項目表示ボタンに切り替わる。また、フレーム3302の重要文書のみを表示ボタン3322が押されて、重要文書のみが表示されている場合には、全文書の表示ボタンが表示される。
ユーザは図33のフレーム3302の表示内容を見て、興味のあるメタデータを類似事例リスト3324から選択したり、重要文書のみ表示ボタン3322をクリックして重要文書に絞り込むことも可能である。例えば、重要文書のみ表示ボタン3322をクリックした場合には、クライアント端末9は、当該クリックを受け付け、重要文書絞り込み要求をKMシステム1に送信する。KMシステム1の類似事例出力処理部16は、クライアント端末9から重要文書絞り込み要求を受信し(ステップS123)、当該要求を表示対象の変更要求であると判断して(ステップS125:Yesルート)、要求に従って類似事例リスト格納部15に格納されているメタデータIDでナレッジDB11を検索し、設定した条件でメタデータを絞り込んでリストを再構成してクライアント端末9に出力する(ステップS127)。そして処理はステップS143に移行する。クライアント端末9は、KMシステム1から重要文書に関するメタデータのリストを受信してフレーム3302に表示する。類似事例リスト3324の内容は変るが、図33の構成は変化しない。
また、ユーザが図33のフレーム3302の表示内容を見て、興味のあるメタデータを類似事例リスト3324から選択して、表示文書表示入力欄3323に表示させた後に、表示ボタン3321をクリックすると、クライアント端末9は、ユーザによる入力を受け付け、メタデータIDを含む表示要求をKMシステム1に送信する。KMシステム1の類似事例出力処理部16は、クライアント端末9からメタデータIDを含む表示要求を受信し(ステップS123)、表示対象の変更ではなく(ステップS125:Noルート)、類似事例表示が要求されたものと判断し(ステップS129:Yesルート)、メタデータIDを用いてナレッジDB11から、要求されたメタデータを読み出して、クライアント端末9に送信する(ステップS131)。そして処理はステップS143に移行する。クライアント端末9は、KMシステム1から、要求したメタデータを受信し、表示装置に表示する。これによって図33のフレーム3303にユーザが選択したメタデータが表示される。
さらに、ユーザが図33のフレーム3303の表示内容を見て、必要な項目についてチェックボックス群3333にチェックを付した後に、作成中文書へコピーボタン3314をクリックすると、クライアント端末9は、ユーザによる入力を受け付け、メタデータID及びチェックが付された項目のIDを含む作成中文書へのコピー要求をKMシステム1に送信する。KMシステム1の類似事例出力処理部16は、メタデータID及びチェックが付された項目のIDを含む作成中文書へのコピー要求を受信すると(ステップS123)、表示対象の変更要求ではなく(ステップS125:Noルート)、類似事例表示の選択でもなく(ステップS129:Noルート)、作成中文書へのコピーが指示されたものと判断して(ステップS133:Yesルート)、受信データをメタデータ生成部17に出力し、メタデータ生成部17は、受信したメタデータIDでナレッジDB11から該当メタデータを読み出すと共に受信した項目IDから対応するデータを抽出し、対応する入力欄に当該抽出データを埋め込んだ形で表示するためのデータを生成して、クライアント端末9に送信するなどのメタデータ作成処理を実施する(ステップS135)。そして処理はステップS143に移行する。
クライアント端末9は、KMシステム1から表示のためのデータを受信し、表示装置に表示する。ここでは、例えば図34に示すような画面が表示される。基本的な画面構成は図27と同じであり、図33のチェックボックス群3333において発生場所、発生状況、処置、原因、対策、水平展開及び経験から得たナレッジが選択されているので、これらのデータが、入力欄2710乃至2716にそのまま埋め込まれている。ユーザは、このような表示内容を確認し、追加、修正などを行って、登録する場合には登録ボタン2701をクリックする。クリックされると、クライアント端末9は入力データをKMシステム1に送信する。KMシステム1のメタデータ生成部17は、クライアント端末9から入力データを受信し、ナレッジDB11に登録する。
また、ユーザが図33のリンク登録ボタン3313をクリックすると、クライアント端末9は、ユーザによる入力を受け付け、クッキーその他の技術を用いてフレーム3303に表示中のメタデータのメタデータID又は名称及び作成中のメタデータのID又は名称を含むリンク登録要求をKMシステム1に送信する。KMシステム1の類似事例出力処理部16は、表示中のメタデータのメタデータID又は名称及び作成中のメタデータのID又は名称を含むリンク登録要求を受信すると(ステップS123)、ステップS125:Noルート、ステップS129:Noルート、ステップS133:Noルートを経て、リンク登録が指示されたものと判断して(ステップS139:Yesルート)、リンク生成処理部18にリンク登録要求を出力し、リンク生成処理部18は、リンク登録要求に基づきリンク作成ページのためのデータを生成して、クライアント端末9に送信するなどのリンク生成処理を実施する(ステップS141)。そして処理はステップS143に移行する。
クライアント端末9は、KMシステム1から表示のためのデータを受信し、表示装置に表示する。ここでは、例えば図35に示すような画面が表示される。図35の例では、リンクの追加ボタン3501と、図35のウィンドウを閉じるボタン3502と、作成中のメタデータ名である参照元文書名(リンク元メタデータ名)の表示欄3503と、図33のフレーム3303に表示中のメタデータの名称である参照先文書名(リンク先メタデータ名)の表示欄3504と、リンク名称の入力欄3505と、リンクの概要の入力欄3506と、作成中のメタデータについての既設リンクの一覧表示部3507とが含まれる。既設リンクの一覧表示部3507のデータについては、リンク生成処理部18がナレッジDB11から抽出したものである。ユーザは、このような画面においてリンク名称などを入力して追加ボタン3501をクリックすれば、例えばリンク元メタデータ名又はID、リンク先メタデータ名又はID及び入力データを含むリンク生成要求がKMシステム1に送信される。KMシステム1のリンク生成処理部18は、クライアント端末9からリンク生成要求を受信すると、ナレッジDB11にリンクデータを登録する。
ステップS127、S131、S135、S141の後又はリンク登録が指示されていない場合には、終了が指示されたかを判断し(ステップS143)、終了ではなければステップS123に戻る。一方、終了が指示されていれば、元の処理に戻る。
このような類似事例の出力処理を実施すれば、ユーザは、類似するメタデータを参照して、新たなメタデータを作成することができる。類似するメタデータは、メタデータ間の類似であって、さらに予め規定された分類についての要素の選択/非選択に基づく類似であって、的確な類似メタデータを抽出することができるようになる。さらに、活用指標値を合わせて使用してリストを作成するので、ユーザは適切な類似メタデータを順番に参照することができる。また、類似メタデータが参照できれば、必要に応じてリンクを作成することも可能である。
なお、上では総合的な類似度を優先してソートするような処理を説明したが、総合的な類似度に活用指標値を組み込む形の新たな指標値を算出するような構成としてもよい。さらに、上では新規のメタデータ作成時に類似事例を抽出する例を示したが、これとは別に類似事例の検索も実施できるようにしても良い。その際の抽出処理の内容は実質的に同じである。
以上本発明の一実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、図1及び図28の機能ブロック図は、一例であって、KMシステム1に、リンク生成管理装置5の機能を持たせるようにしても良い。また、KMシステム1の類似事例抽出処理部13を別装置として実装しても良い。さらに、KMシステム1やリンク生成管理装置5の機能については、必ずしも実際のプログラム・モジュールと対応しない。特に図19に示した処理フローを実行する共通モジュールを用意するようにしても良い。また、上で述べた例では、評価する挙動として、画面間の遷移(メタデータ間又は文書間の遷移を含む)、又はそれらの遷移に要する時間の例を示しているが、取り扱う挙動は必ずしもこれに限定されるものではない。その他、特定のインターフェースにおいて採取可能なログデータから検出可能な挙動を、目的に応じて評価するようにしても良い。
なお、クライアント端末9及び10、KMシステム1、リンク生成管理装置5はコンピュータ装置であって、図36に示すように当該コンピュータ装置においては、メモリ2501(記憶部)とCPU2503(処理部)とハードディスク・ドライブ(HDD)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS)及びWebブラウザを含むアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。必要に応じてCPU2503は、表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、必要な動作を行わせる。また、処理途中のデータについては、メモリ2501に格納され、必要があればHDD2505に格納される。このようなコンピュータは、上で述べたCPU2503、メモリ2501などのハードウエアとOS及び必要なアプリケーション・プログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
本発明の実施の形態における機能ブロック図である。 本発明の実施の形態におけるデータ構造の模式図である。 本発明の実施の形態におけるデータ構造の模式図である。 メタデータの一例を示す図である。 本実施の形態におけるデータ構造の一部を示す図である。 本実施の形態におけるデータ構造の一部を示す図である。 KMシステムにおける画面遷移の概要を示す図である。 KMシステムにおける画面遷移の概要を示す図である。 KMシステムにおける画面遷移の概要を示す図である。 KMシステムにおける画面遷移の概要を示す図である。 KMシステムにおける画面遷移の概要を示す図である。 KMシステムにおける画面遷移の概要を示す図である。 メタデータ(基本データ)の表示画面の一例を示す図である。 メタデータ(詳細データ)の表示画面の一例を示す図である。 リンクの一覧表示画面の一例を示す図である。 リンク詳細表示画面の一例を示す図である。 リンク生成の処理の模式図である。 リンク生成処理の処理フローを示す図である。 ログ解析テーブル構成処理の処理フローを示す図である。 ログ解析テーブルの一例を示す図である。 ファジー集合の二次曲線の形を示す図である。 リンク生成用中間指標値テーブルの一例を示す図である。 リンク生成用最終指標値テーブルの一例を示す図である。 リンク生成処理の処理フローを示す図である。 リンク有効度判定処理の処理フローを示す図である。 太さ用最終指標値テーブルの一例を示す図である。 リンク作成画面の一例を示す図である。 KMシステムの機能ブロック図である。 活用指標値データ格納部に格納されるデータの一例を示す図である。 類似事例抽出処理の処理フローを示す図である。 重み係数格納部に格納されるデータの一例を示す図である。 類似事例リスト格納部に格納されるデータの一例を示す図である。 類似事例出力処理の処理フローを示す図である。 類似事例表示画面例を示す図である。 リンク作成画面の一例を示す図である。 リンク作成画面の一例を示す図である。 コンピュータの機能ブロック図である。
符号の説明
1 KMシステム 3 アクセスログデータ格納部
4 認証ログデータ格納部 7 ネットワーク
9,10 クライアント端末 5 リンク生成管理装置
51 リンク自動生成処理部 52 リンク管理部
53 ログ解析テーブル 54 リンク生成用中間指標値テーブル
55 リンク生成用最終指標値テーブル
56 太さ用中間指標値テーブル 57 太さ用最終指標値テーブル
58 ユーザ係数データ格納部 59 判定結果格納部
11 ナレッジDB 12 類似事例抽出指示受付部
13 類似事例抽出処理部 14 重み係数格納部
15 類似事例リスト格納部 16 類似事例出力処理部
17 メタデータ生成部 18 リンク生成処理部
19 活用指標値データ格納部 20 活用指標値算出部
131 類似度算出部 132 ソート処理部

Claims (22)

  1. 文書管理システムに対するユーザのアクセス履歴ログ・データにおける、特定種類の文書データに関連するログ・データから、各ユーザの遷移履歴に関する遷移データを生成し、遷移データ格納部に格納するステップと、
    前記遷移データ格納部に格納された前記遷移データを用いて、前記特定種類の各文書データについて、当該文書データに到達する前の挙動と当該文書データに到達した後の挙動とに基づき文書データの寄与値を算出し、寄与値データ格納部に格納する寄与値算出ステップと、
    前記遷移データ格納部に格納された前記遷移データ及び前記寄与値データ格納部に格納された前記文書データの寄与値に基づき、特定期間における、前記特定種類の第1の文書データから遷移先となる前記特定種類の第2の文書データへのリンク寄与値を算出し、記憶装置に格納するリンク寄与値算出ステップと、
    前記記憶装置に格納された、前記特定期間における、前記第1の文書データから前記第2の文書データへのリンク寄与値と、リンク評価値データ格納部に格納された、前記特定期間より前の期間における、前記第1の文書データから前記第2の文書データへのリンク評価値とに基づき、前記特定期間における、前記第1の文書データから前記第2の文書データへのリンク評価値を算出し、前記リンク評価値データ格納部に格納するリンク評価値算出ステップと、
    前記リンク評価値データ格納部に格納された、前記特定期間における前記リンク評価値に基づき、前記第1の文書データから前記第2の文書データへのリンクの生成の是非を判断するリンク生成判断ステップと、
    を含み、コンピュータにより実行される情報処理方法。
  2. 前記リンク寄与値算出ステップが、
    前記遷移データ格納部に格納された各ユーザに係る前記遷移データから、前記特定種類の第1の文書データと当該第1の文書データから遷移先となる前記特定種類の第2の文書データとを特定するステップと、
    特定された前記第1の文書データ及び前記第2の文書データの寄与値を前記寄与値データ格納部から読み出し、関係したユーザについての前記第1の文書データから前記第2の文書データへのリンク寄与値を算出し、記憶装置に格納するステップと、
    前記記憶装置に格納された前記寄与値を、前記特定期間及び前記ユーザについて集計し、前記記憶装置に格納するステップと、
    を含む請求項1記載の情報処理方法。
  3. 前記関係したユーザについての前記第1の文書データから前記第2の文書データへのリンク寄与値が、前記第1の文書データ及び前記第2の文書データの寄与値の和と前記関係したユーザに対応する係数との積で計算される
    請求項2記載の情報処理方法。
  4. 前記寄与値算出ステップが、
    算出された前記寄与値と閾値とを比較し、前記寄与値が前記閾値未満である場合には当該寄与値を無効化するステップ
    を含む請求項1記載の情報処理方法。
  5. 前記リンク評価値算出ステップが、
    前記特定期間より前の期間における前記リンク評価値からの、前記特定期間における前記リンク寄与値の増分を算出するステップと、
    前記増分に応じて前記特定期間より前の期間における前記リンク評価値を調整することにより、前記特定期間における、前記第1の文書データから前記第2の文書データへのリンク評価値を算出し、前記リンク評価値データ格納部に格納する調整ステップと、
    を含む請求項1記載の情報処理方法。
  6. 前記調整ステップにおいて、
    前記増分の値が所定の閾値未満である場合には、前記特定期間より前の期間における前記リンク評価値を減少させることにより、前期特定期間における前記リンク評価値を算出する
    請求項1記載の情報処理方法。
  7. 前記リンク生成判断ステップが、
    前記リンク評価値データ格納部に格納された、前記特定期間における前記リンク評価値の正規化を行うステップと、
    正規化された前記リンク評価値が所定の閾値以上であるか判断するステップと、
    を含む請求項1記載の情報処理方法。
  8. 前記特定種類の文書データがメタデータであることを特徴とする請求項1乃至7のいずれか1つ記載の情報処理方法。
  9. 文書管理システムに対するユーザのアクセス履歴ログ・データにおける、特定種類の文書データに関連するログ・データから、各ユーザの遷移履歴に関する遷移データを生成し、遷移データ格納部に格納するステップと、
    前記遷移データ格納部に格納された前記遷移データを用いて、前記特定種類の第1の文書データから前記特定種類の第2の文書データへの既に生成されているリンクの利用を特定し、当該リンクを用いたユーザについての、当該第2の文書データに到達した後の挙動に基づき前記リンクの寄与値を算出し、寄与値データ格納部に格納する寄与値算出ステップと、
    前記寄与値データ格納部に格納された前記リンクの寄与値を、前記リンク毎に特定期間について集計し、記憶装置に格納するステップと、
    前記記憶装置に格納された、前記特定期間における前記リンクの寄与値と、リンク評価値データ格納部に格納された、前記特定期間より前の期間における前記リンクの評価値に基づき、前記特定期間における前記リンクの評価値を算出し、前記リンク評価値データ格納部に格納するリンク評価値算出ステップと、
    前記リンク評価値データ格納部に格納された、前記特定期間における前記リンクの評価値に基づき、前記第1の文書データから前記第2の文書データへのリンクの重要度を決定する重要度決定ステップと、
    を含み、コンピュータにより実行される情報処理方法。
  10. 前記リンク評価値算出ステップが、
    前記特定期間より前の期間における前記リンクの評価値からの、前記特定期間における前記リンクの寄与値の増分を算出するステップと、
    前記増分に応じて前記特定期間より前の期間における前記リンクの評価値を調整することにより、前記特定期間における前記リンクの評価値を算出し、前記リンク評価値データ格納部に格納する調整ステップと、
    を含む請求項9記載の情報処理方法。
  11. 前記調整ステップにおいて、
    前記増分の値が所定の閾値未満である場合には、前記特定期間より前の期間における前記リンクの評価値を減少させることにより、前記特定期間における前記リンクの評価値を算出する
    請求項9記載の情報処理方法。
  12. 前記重要度決定ステップが、
    前記リンク評価値データ格納部に格納された、前記特定期間における前記リンクの評価値の正規化を行うステップと、
    正規化された前記リンクの評価値が予め定められた範囲のいずれに入るか判断するステップと、
    を含む請求項1記載の情報処理方法。
  13. 前記特定種類の文書データがメタデータであることを特徴とする請求項9乃至12のいずれか1つ記載の情報処理方法。
  14. 文書管理システムに対するユーザのアクセス履歴ログ・データにおける、特定種類の文書データに関連するログ・データから生成された、各ユーザの遷移履歴に関する遷移データを格納する遷移データ格納部と、
    前記遷移データ格納部に格納された前記遷移データを用いて、前記特定種類の各文書データについて、当該文書データに到達する前の挙動と当該文書データに到達した後の挙動とに基づき文書データの寄与値を算出し、寄与値データ格納部に格納する寄与値算出手段と、
    前記遷移データ格納部に格納された前記遷移データ及び前記寄与値データ格納部に格納された前記文書データの寄与値に基づき、特定期間における、前記特定種類の第1の文書データから遷移先となる前記特定種類の第2の文書データへのリンク寄与値を算出し、記憶装置に格納するリンク寄与値算出手段と、
    前記記憶装置に格納された、前記特定期間における、前記第1の文書データから前記第2の文書データへのリンク寄与値と、リンク評価値データ格納部に格納された、前記特定期間より前の期間における、前記第1の文書データから前記第2の文書データへのリンク評価値とに基づき、前記特定期間における、前記第1の文書データから前記第2の文書データへのリンク評価値を算出し、前記リンク評価値データ格納部に格納するリンク評価値算出手段と、
    前記リンク評価値データ格納部に格納された、前記特定期間における前記リンク評価値に基づき、前記第1の文書データから前記第2の文書データへのリンクの生成の是非を判断するリンク生成判断手段と、
    を有するリンク生成処理装置。
  15. 文書管理システムに対するユーザのアクセス履歴ログ・データにおける、特定種類の文書データに関連するログ・データから生成された、各ユーザの遷移履歴に関する遷移データを格納する遷移データ格納部と、
    前記遷移データ格納部に格納された前記遷移データを用いて、前記特定種類の第1の文書データから前記特定種類の第2の文書データへの既に生成されているリンクの利用を特定し、当該リンクを用いたユーザについての、当該第2の文書データに到達した後の挙動に基づき前記リンクの寄与値を算出し、寄与値データ格納部に格納する寄与値算出手段と、
    前記寄与値データ格納部に格納された前記リンクの寄与値を、前記リンク毎に特定期間について集計し、記憶装置に格納する手段と、
    前記記憶装置に格納された、前記特定期間における前記リンクの寄与値と、リンク評価値データ格納部に格納された前記特定期間より前の期間における前記リンクの評価値に基づき、前記特定期間における前記リンクの評価値を算出し、前記リンク評価値データ格納部に格納するリンク評価値算出手段と、
    前記リンク評価値データ格納部に格納された、前記特定期間における前記リンクの評価値に基づき、前記第1の文書データから前記第2の文書データへのリンクの重要度を決定する重要度決定手段と、
    を有するリンク重要度決定装置。
  16. 予め規定されている属性毎に、予め規定されている項目のユーザによる選択又は非選択の状態を表す比較元ベクトルを生成し、記憶装置に格納するステップと、
    データベースに既登録の各メタデータについて生成され且つ前記属性毎に当該メタデータについて前記項目が該当する又は該当しない状態を表す比較先ベクトルと、前記記憶装置に格納された前記比較元ベクトルとから、前記比較先ベクトルと前記比較元ベクトルとのベクトル間類似度を算出し、当該ベクトル間類似度を用いて各前記属性についての重み付けが考慮された、各前記メタデータについての類似度を算出し、少なくともメタデータの識別情報に対応して類似度データ格納部に格納する類似度算出ステップと、
    前記類似度データ格納部に格納された、前記メタデータについての類似度に従って、前記メタデータをソートし、当該ソート結果を前記ユーザに出力する出力ステップと、
    を含み、コンピュータにより実行される情報処理方法。
  17. 前記類似度算出ステップが、
    前記ユーザが選択し且つ比較先のメタデータが該当する状態である項目数を、当該項目数と前記ユーザのみが選択した項目数と前記比較先のメタデータのみが該当する状態である項目数との和で除した値を、各属性の前記ベクトル間類似度として算出するステップ
    を含む請求項16記載の情報処理方法。
  18. 前記類似度算出ステップが、
    前記ベクトル間類似度と対応する属性の重み付け値との積和を全重み付け値で除することによって、前記メタデータについての類似度を算出するステップ
    を含む請求項16又は17記載の情報処理方法。
  19. 前記データベースに対するユーザのアクセス履歴ログ・データにおける、メタデータに関連するログ・データから、各ユーザの遷移履歴に関する遷移データを生成し、遷移データ格納部に格納するステップと、
    前記遷移データ格納部に格納された前記遷移データを用いて、各前記メタデータについて、当該メタデータに到達する前の挙動と当該メタデータに到達した後の挙動とに基づきメタデータの活用度を算出し、活用度データ格納部に格納するステップと、
    をさらに含み、
    前記出力ステップにおいて、
    前記メタデータについての類似度及び前記活用度データ格納部に格納された活用度に従って前記メタデータをソートする
    請求項16乃至18のいずれか1つ記載の情報処理方法。
  20. 予め規定されている属性毎に、予め規定されている項目のユーザによる選択又は非選択の状態を表す比較元ベクトルを生成し、記憶装置に格納するステップと、
    前記文書管理システムに既登録の文書データについて生成され且つ前記属性毎に当該文書データについて前記項目が該当する又は該当しない状態を表す比較先ベクトルと、前記記憶装置に格納された前記比較元ベクトルとから、前記比較先ベクトルと前記比較元ベクトルとのベクトル間類似度を算出し、当該ベクトル間類似度を用いて各前記属性についての重み付けが考慮された、メタデータについての類似度を算出し、少なくとも前記文書データの識別情報に対応して類似度データ格納部に格納する類似度算出ステップと、
    前記類似度データ格納部に格納された、前記文書データについての類似度及び前記寄与値データ格納部に格納された前記文書データの寄与値に従って、前記メタデータをソートし、当該ソート結果を前記ユーザに出力する出力ステップと、
    をさらに含む請求項1記載の情報処理方法。
  21. 予め規定されている属性毎に、予め規定されている項目のユーザによる選択又は非選択の状態を表す比較元ベクトルを生成し、記憶装置に格納する手段と、
    データベースに既登録の各メタデータについて生成され且つ前記属性毎に当該メタデータについて前記項目が該当する又は該当しない状態を表す比較先ベクトルと、前記記憶装置に格納された前記比較元ベクトルとから、前記比較先ベクトルと前記比較元ベクトルとのベクトル間類似度を算出し、当該ベクトル間類似度を用いて各前記属性についての重み付けが考慮された、各前記メタデータについての類似度を算出し、少なくともメタデータの識別情報に対応して類似度データ格納部に格納する手段と、
    前記類似度データ格納部に格納された、前記メタデータについての類似度に従って、前記メタデータをソートし、当該ソート結果を前記ユーザに出力する出力手段と、
    を有する類似文書提示装置。
  22. 請求項1乃至13、16乃至20のいずれか1つ記載の情報処理方法をコンピュータに実行させるためのプログラム。
JP2006138613A 2005-05-26 2006-05-18 リンク生成、リンク重要度及び類似文書に関する情報処理方法及び装置 Pending JP2007004779A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006138613A JP2007004779A (ja) 2005-05-26 2006-05-18 リンク生成、リンク重要度及び類似文書に関する情報処理方法及び装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005153446 2005-05-26
JP2006138613A JP2007004779A (ja) 2005-05-26 2006-05-18 リンク生成、リンク重要度及び類似文書に関する情報処理方法及び装置

Publications (1)

Publication Number Publication Date
JP2007004779A true JP2007004779A (ja) 2007-01-11

Family

ID=37690286

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006138613A Pending JP2007004779A (ja) 2005-05-26 2006-05-18 リンク生成、リンク重要度及び類似文書に関する情報処理方法及び装置

Country Status (1)

Country Link
JP (1) JP2007004779A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009282957A (ja) * 2008-04-22 2009-12-03 Ntt Docomo Inc 文書処理装置および文書処理方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204351A (ja) * 1996-01-24 1997-08-05 Hitachi Ltd メモリ付リンク情報を用いた画面遷移方法
JPH10207838A (ja) * 1997-01-28 1998-08-07 Fujitsu Ltd 対話型ハイパーテキスト情報参照システムにおける情報参照回数計数装置及び方法並びに情報参照回数計数プログラムを記録した媒体
JP2000090111A (ja) * 1998-09-14 2000-03-31 Matsushita Electric Ind Co Ltd 情報検索エージェント装置及び情報検索エージェント装置の機能を発揮するプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001005705A (ja) * 1999-06-22 2001-01-12 Hitachi Ltd 文書情報管理システム
JP2001166981A (ja) * 1999-12-06 2001-06-22 Fuji Xerox Co Ltd ハイパーテキスト解析装置および方法
JP2001337992A (ja) * 2000-05-29 2001-12-07 Mitsubishi Electric Corp 類似検索システム及び類似検索方法
JP2002123556A (ja) * 2000-10-17 2002-04-26 Matsushita Electric Ind Co Ltd Webサイト構築装置及びWebサイト構築方法
JP2002207726A (ja) * 2000-11-10 2002-07-26 Ricoh Co Ltd 文書管理装置、関連文書抽出方法、文書操作支援方法
JP2004220215A (ja) * 2003-01-14 2004-08-05 Hitachi Ltd 計算機を利用した業務誘導支援システムおよび業務誘導支援方法
JP2004355440A (ja) * 2003-05-30 2004-12-16 Tokyo Electric Power Co Inc:The データ構造、並びにデータ処理方法及び装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204351A (ja) * 1996-01-24 1997-08-05 Hitachi Ltd メモリ付リンク情報を用いた画面遷移方法
JPH10207838A (ja) * 1997-01-28 1998-08-07 Fujitsu Ltd 対話型ハイパーテキスト情報参照システムにおける情報参照回数計数装置及び方法並びに情報参照回数計数プログラムを記録した媒体
JP2000090111A (ja) * 1998-09-14 2000-03-31 Matsushita Electric Ind Co Ltd 情報検索エージェント装置及び情報検索エージェント装置の機能を発揮するプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2001005705A (ja) * 1999-06-22 2001-01-12 Hitachi Ltd 文書情報管理システム
JP2001166981A (ja) * 1999-12-06 2001-06-22 Fuji Xerox Co Ltd ハイパーテキスト解析装置および方法
JP2001337992A (ja) * 2000-05-29 2001-12-07 Mitsubishi Electric Corp 類似検索システム及び類似検索方法
JP2002123556A (ja) * 2000-10-17 2002-04-26 Matsushita Electric Ind Co Ltd Webサイト構築装置及びWebサイト構築方法
JP2002207726A (ja) * 2000-11-10 2002-07-26 Ricoh Co Ltd 文書管理装置、関連文書抽出方法、文書操作支援方法
JP2004220215A (ja) * 2003-01-14 2004-08-05 Hitachi Ltd 計算機を利用した業務誘導支援システムおよび業務誘導支援方法
JP2004355440A (ja) * 2003-05-30 2004-12-16 Tokyo Electric Power Co Inc:The データ構造、並びにデータ処理方法及び装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009282957A (ja) * 2008-04-22 2009-12-03 Ntt Docomo Inc 文書処理装置および文書処理方法

Similar Documents

Publication Publication Date Title
US10929487B1 (en) Customization of search results for search queries received from third party sites
JP5351182B2 (ja) 関心領域についての関連情報の決定
KR101532715B1 (ko) 서치 결과를 향상시키기 위해 사용자로부터의 피드백을 적용하는 서치 엔진
US7769771B2 (en) Searching a document using relevance feedback
JP5801291B2 (ja) 検索結果のマージ
US8126888B2 (en) Methods for enhancing digital search results based on task-oriented user activity
US8572074B2 (en) Identifying task groups for organizing search results
US8266162B2 (en) Automatic identification of related search keywords
JP5497185B2 (ja) 非構造化情報のインテリジェント・イベント・ベース・データ・マイニング
US8204881B2 (en) Information search, retrieval and distillation into knowledge objects
KR101366408B1 (ko) 컴퓨터 실행 가능 컴포넌트를 포함하는 컴퓨터 구현된 시스템
US8117198B2 (en) Methods for generating search engine index enhanced with task-related metadata
US8706748B2 (en) Methods for enhancing digital search query techniques based on task-oriented user activity
US20080244428A1 (en) Visually Emphasizing Query Results Based on Relevance Feedback
KR20120015457A (ko) 인라인 문맥 질의들을 사용하는 검색 시스템들 및 방법들
US9411895B2 (en) Personalized deeplinks for search results
JP4896268B2 (ja) 情報価値を反映した情報検索方法及びその装置
KR20070089898A (ko) 사용자 피드백을 이용하여 검색된 컨텐츠를 평가하고 평가결과를 이용하여 검색 결과를 제공하는 방법 및 장치
JP2007256992A (ja) コンテンツ特定方法及び装置
KR20000063422A (ko) 인터넷 정보 검색 시 개인의 북마크 파일 데이터를기반으로 필터링하여 개인 맞춤 검색 결과를 도출하는 방법
Shchekotykhin et al. xCrawl: a high-recall crawling method for Web mining
TWI399657B (zh) A provider, a method of providing information, a program, and an information recording medium
KR100557874B1 (ko) 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체
CN113569132A (zh) 一种信息检索展示方法及系统
JP2007004779A (ja) リンク生成、リンク重要度及び類似文書に関する情報処理方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090324

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111227