JP2015072642A - 情報管理装置、プログラム及び情報処理システム - Google Patents

情報管理装置、プログラム及び情報処理システム Download PDF

Info

Publication number
JP2015072642A
JP2015072642A JP2013208655A JP2013208655A JP2015072642A JP 2015072642 A JP2015072642 A JP 2015072642A JP 2013208655 A JP2013208655 A JP 2013208655A JP 2013208655 A JP2013208655 A JP 2013208655A JP 2015072642 A JP2015072642 A JP 2015072642A
Authority
JP
Japan
Prior art keywords
data
document
information management
evaluation value
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013208655A
Other languages
English (en)
Other versions
JP6194732B2 (ja
Inventor
恭輔 屋内
Kyosuke Yanai
恭輔 屋内
恩田 昌徳
Masanori Onda
昌徳 恩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2013208655A priority Critical patent/JP6194732B2/ja
Publication of JP2015072642A publication Critical patent/JP2015072642A/ja
Application granted granted Critical
Publication of JP6194732B2 publication Critical patent/JP6194732B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】データ間に設定された関係に基づいてデータの価値を評価する。
【解決手段】情報管理装置10は、複数のデータと、ユーザが複数のデータのそれぞれに対して行った操作履歴情報を取得し、複数のデータに対する操作履歴情報に基づいて、複数のデータの中から選択された1以上のデータの組のそれぞれに対して、データ間の複数の関係のそれぞれに予め定められた条件を満足するか否かに基づいて、複数の関係をそれぞれ有するか否かを判定し、1以上のデータの組のそれぞれに対して判定された関係を関連付けて設定し、複数のデータの対象のデータについて対象期間内に設定された関係の数に基づいて、対象期間における対象のデータの評価値を算出する。
【選択図】図1

Description

本発明は、情報管理装置、プログラム及び情報処理システムに関する。
ファイルに対するユーザの操作を記録して、ファイル使用の重複時間に基づいて関連性の高いファイルを特定するシステムがある(例えば特許文献1を参照)。
特開2009−3553号公報
本発明の目的は、データ間に設定された関係に基づいてデータの価値を評価できる情報管理装置、プログラム及び情報処理システムを提供することにある。
請求項1に係る発明は、複数のデータと、ユーザが該複数のデータのそれぞれに対して行った操作履歴情報を取得する取得手段と、前記複数のデータに対する操作履歴情報に基づいて、前記複数のデータの中から選択された1以上のデータの組のそれぞれに対して、データ間の複数の関係のそれぞれに予め定められた条件を満足するか否かに基づいて、該複数の関係をそれぞれ有するか否かを判定する判定手段と、前記1以上のデータの組のそれぞれに対して前記判定手段により該データの組が有すると判定された関係を関連付けて設定する設定手段と、前記複数のデータの対象のデータについて対象期間内に前記設定手段により設定された関係の数に基づいて、該対象期間における該対象のデータの評価値を算出する算出手段と、を含む情報管理装置である。
請求項2に係る発明は、前記算出手段は、前記対象のデータについて前記対象期間内に前記設定手段により設定された前記複数の関係のそれぞれの関係の数と、該複数の関係にそれぞれ定められた重みとに基づいて、該対象期間における該対象のデータの評価値を算出する請求項1に記載の情報管理装置である。
請求項3に係る発明は、前記対象のデータについて、複数の期間のそれぞれにおいて前記算出手段によりそれぞれ算出された複数の評価値と、該複数の期間のそれぞれについて過去の期間ほど値が小さく定められた複数の重みとに基づいて、該対象のデータの累積評価値を算出する累積評価値算出手段をさらに含む請求項2に記載の情報管理装置である。
請求項4に係る発明は、前記累積評価値算出手段は、前記複数のデータのうち1以上のデータのそれぞれに対して、端末から受け付けた指定期間における累積評価値を算出し、前記指定期間における前記1以上のデータの累積評価値に基づいて選択したデータを前記端末に提供する請求項3に記載の情報管理装置である。
請求項5に係る発明は、前記複数のデータのうち1以上のデータのそれぞれに対して、端末から受け付けた指定期間内における複数の期間のそれぞれにおいて前記算出手段によりそれぞれ算出された評価値の変化量に基づいて、該1以上のデータのそれぞれの活性度を算出する活性度算出手段をさらに含み、前記指定期間における前記1以上のデータの活性度に基づいて選択したデータを前記端末に提供する請求項1乃至4のいずれかに記載の情報管理装置である。
請求項6に係る発明は、前記活性度算出手段は、前記1以上のデータのそれぞれについて前記指定期間内における評価値の変化量と、該指定期間内におけるアクセス数とに基づいて、該1以上のデータのそれぞれについての活性度を算出する請求項5に記載の情報管理装置である。
請求項7に係る発明は、複数のデータと、ユーザが該複数のデータのそれぞれに対して行った操作履歴情報を取得する取得手段と、前記複数のデータに対する操作履歴情報に基づいて、前記複数のデータの中から選択された1以上のデータの組のそれぞれに対して、データ間の複数の関係のそれぞれに予め定められた条件を満足するか否かに基づいて、該複数の関係をそれぞれ有するか否かを判定する判定手段と、前記1以上のデータの組のそれぞれに対して前記判定手段により該データの組が有すると判定された関係を関連付けて設定する設定手段と、前記複数のデータの対象のデータについて対象期間内に前記設定手段により設定された関係の数に基づいて、該対象期間における該対象のデータの評価値を算出する算出手段としてコンピュータを機能させるためのプログラムである。
請求項8に係る発明は、情報処理端末と、情報管理装置とを含み、前記情報処理端末は、複数のデータと、ユーザが該複数のデータのそれぞれに対して行った操作履歴情報を前記情報管理装置に送信する送信手段を含み、前記情報管理装置は、前記送信手段により送信された前記複数のデータと前記操作履歴情報を取得する取得手段と、前記複数のデータに対する操作履歴情報に基づいて、前記複数のデータの中から選択された1以上のデータの組のそれぞれに対して、データ間の複数の関係のそれぞれに予め定められた条件を満足するか否かに基づいて、該複数の関係をそれぞれ有するか否かを判定する判定手段と、前記1以上のデータの組のそれぞれに対して前記判定手段により該データの組が有すると判定された関係を関連付けて設定する設定手段と、前記複数のデータの対象のデータについて対象期間内に前記設定手段により設定された関係の数に基づいて、該対象期間における該対象のデータの評価値を算出する算出手段と、を含む情報処理システムである。
請求項1,7,8に係る発明によれば、データ間に設定された関係に基づいてデータの価値を評価できる。
請求項2に係る発明によれば、データ間に設定された複数の関係の数と、それぞれの関係の重みとに基づいてデータの価値を評価できる。
請求項3に係る発明によれば、データの価値にデータの過去からの評価値の累積を反映させることができる。
請求項4に係る発明によれば、データに累積した価値に応じて選択したデータを提供できる。
請求項5に係る発明によれば、データの関係性に基づく価値の変化量に応じて選択したデータを提供できる。
請求項6に係る発明によれば、データの関係性に基づく価値の変化量とデータへのアクセス数に基づいて選択したデータを提供できる。
本発明の実施形態に係る情報処理システムのシステム構成図である。 情報管理装置と情報処理端末のハードウェアの構成図である。 操作履歴情報管理テーブルの一例を示す図である。 文書情報管理テーブルの一例を示す図である。 関係性周期情報管理テーブルの一例を示す図である。 操作履歴情報の登録処理の一例を示すシーケンス図である。 文書間関係性判定処理の一例を示すフロー図である。 文書間関係性判定処理の一例を示すフロー図である。 文書の評価処理のフロー図である。 評価値管理テーブルの一例を示す図である。 情報提供処理の一例を示すフロー図である。 情報提供処理の一例を示すフロー図である。 活性度の算出処理のフロー図である。
以下、本発明を実施するための実施の形態(以下、実施形態という)を、図面を参照しながら説明する。
[1.システム構成]
図1には、本発明の実施形態に係る情報処理システム1のシステム構成図を示した。図1に示されるように、情報処理システム1は、情報管理装置10と、1以上の情報処理端末20を含み、情報管理装置10と情報処理端末20はネットワーク30を介して相互にデータ通信可能に接続されている。なお、ネットワーク30は、ローカルエリアネットワーク、ワイドエリアネットワークのいずれか又は両者を含み構成されていてもよい。なお、図1の例では、情報処理端末20は1つのみが示されているが、複数あってもよい。
情報処理端末20は、ユーザからの操作を受け付けて、処理を実行するコンピュータである。例えば、情報処理端末20は、ユーザから受け付けた操作に基づいて文書データを編集し、編集した文書データと、操作履歴のデータとを情報管理装置10に送信する。
情報管理装置10は、情報処理端末20から文書データと、操作履歴のデータとを受信し、受信した文書データと操作履歴のデータを管理するサーバコンピュータである。例えば、情報管理装置10は、文書データと操作履歴のデータに基づいて、文書データ間の関係性(複製、共起、類似、参照、流用、改訂)を判定し、判定された関係性を文書データに付与して管理する。さらに、情報管理装置10は、文書データに付与された関係性が出現する周期性を解析し、解析された周期性に基づいて、指定の期間に指定の関係性が生じる可能性がある文書データを利用者に提供する。
ここで、第1の文書データが第2の文書データと「複製」関係にあるとは、第1の文書データが第2の文書データから複製されたことを示すこととしてよい。また、第1の文書データが第2の文書データと「共起」関係にあるとは、第1の文書データが開かれていた時に、第2の文書データも開かれていたことを示すこととしてよい。また、第1の文書データが第2の文書データと「類似」関係にあるとは、第1の文書データと、第2の文書データの内容が類似であることを示すこととしてよい。また、第1の文書データが第2の文書データと「参照」関係にあるとは、第1の文書データの中に、第2の文書データを参照する情報を含むことを示すこととしてよい。また、第1の文書データが第2の文書データと「流用」関係にあるとは、第1の文書データの少なくとも一部に、第2の文書データの少なくとも一部を複製して編集された箇所を含むことを示すこととしてよい。また、第1の文書データが第2の文書データと「改訂」関係にあるとは、第1の文書データが、第2の文書データに基づいて編集されたものであり、ファイル名に類似性がある(例えばバージョンの違いのみである)ことを示すこととしてよい。
以上の処理を実行するために、情報管理装置10と情報処理端末20に備えられた構成と、情報管理装置10と情報処理端末20により実行される処理の詳細について以下説明する。
[2.ハードウェア構成]
まず、図2を参照しながら、情報管理装置10と情報処理端末20に備えられたハードウェア構成の一例について説明する。
[2−1.情報管理装置]
図2に示されるように、情報管理装置10は、制御部11、記憶部12、通信部13を備える。
制御部11は、CPU(Central Processing Unit)を含み、記憶部12に記憶されたプログラムに基づいて、各種の演算処理を実行するとともに情報管理装置10の各部を制御する。
記憶部12は、情報管理装置10のオペレーティングシステム等の制御プログラムやデータを記憶するほか、制御部11のワークメモリとしても用いられる。プログラムは、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等の情報記憶媒体に格納された状態で情報管理装置10に供給されてもよいし、インターネット等のデータ通信手段を介して情報管理装置10に供給されてもよい。以下、記憶部12に記憶されるデータの具体例について説明する。
記憶部12には、情報処理端末20から受信した操作履歴のデータを格納する履歴データ管理テーブルが記憶される。
図3には、履歴データ管理テーブルの一例を示した。図3に示されるように、履歴データ管理テーブルには、操作履歴データを識別する履歴ID、操作履歴データの操作に係るユーザを識別するユーザID、操作日時、操作コマンド、操作対象のファイル名(パス名)、操作対象のファイル(文書データ)を識別する文書IDが関連付けて記憶される。ここで、操作コマンドには、“open/close/delete ファイルA”(ファイルAを開く(ファイルAが存在しない場合には新規作成)/閉じる/削除する)、“copy/move ファイルA ファイルB”(ファイルAをファイルBに複製する/リネームする)、“copy ファイルA:エリアA ファイルB:エリアB”(ファイルAのエリアAのデータをファイルBのエリアBにコピーする)、“save ファイルA”(ファイルAを保存する)等を含むこととしてよい。
記憶部12には、情報処理端末20から受信した文書データの情報を格納する文書データ管理テーブルが記憶される。
図4には、文書データ管理テーブルの一例を示した。図4に示されるように、文書データ管理テーブルには、文書データを識別する文書ID、文書データの所有者(ユーザID)、文書データのファイル名、文書データの形式、文書データの格納先の情報が関連付けて記憶される。
記憶部12には、文書データ管理テーブルで管理される一の文書データと他の文書データとの関係性を示す関係性管理テーブルが記憶される。なお、関係性管理テーブルに記憶されるデータは、履歴データ管理テーブルと文書データ管理テーブルに基づいて情報管理装置10が生成されることとしてよく、この文書間の関係性データの生成処理の詳細については後述する。
図5には、関係性管理テーブルの一例を示した。図5に示されるように、関係性管理テーブルには、関係性データを識別する関係性ID、関係性データの主たる文書ID(主文書ID)、関係性データの従たる文書ID(従文書ID)、関係性の内容(1:複製、2:共起、3:類似、4:参照、5:流用、6:改訂)、関係性を発生させた操作者のユーザID、関係性の発生日の情報が関連付けて記憶される。例えば、主文書IDの文書が、従文書IDの文書と、複製(又は参照/流用/改訂)の関係にあるとは、主文書IDの文書が従文書IDの文書から複製(又は参照/流用/改訂)されたという関係を示しており、主文書IDの文書が、従文書IDの文書と、共起(又は類似)の関係にあるとは、主文書IDの文書が従文書IDと共起した(又は類似している)との関係を示している。
通信部13は、例えばネットワークインターフェースカード(NIC)を含み、NICを介してネットワーク30に接続して、情報処理端末20と通信する。
[2−2.情報処理端末]
情報処理端末20は、制御部21、記憶部22、通信部23、入力部24、表示部25を備える。
制御部21は、CPU(Central Processing Unit)を含み、記憶部22に記憶されたプログラムに基づいて、各種の演算処理を実行するとともに情報処理端末20の各部を制御する。
記憶部22は、情報処理端末20のオペレーティングシステム等の制御プログラムやデータを記憶するほか、制御部21のワークメモリとしても用いられる。プログラムは、予め記憶部22に書き込んでおくこととしてもよいし、光ディスク、磁気ディスク、磁気テープ、光磁気ディスク、フラッシュメモリ等の情報記憶媒体に格納された状態で情報処理端末20に供給されてもよいし、インターネット等のデータ通信網を介して情報処理端末20に供給されてもよい。
通信部23は、例えば無線又は有線の通信インターフェースを含み、通信インターフェースを介してネットワーク30に接続して、ネットワーク30に接続された情報管理装置10と通信する。
入力部24は、タッチパネル、キーボード等の入力装置により実現され、ユーザからの操作入力を受け付ける。
表示部25は、液晶ディスプレイ等の表示装置により実現され、制御部21による情報処理の結果(画面)を表示させる。
[3.処理の詳細の説明]
次に、図6〜図12を参照しながら、情報処理システム1において実行される処理の詳細について説明する。
[3−1.操作履歴データの登録時の処理]
まず、図6に示されたシーケンス図を参照しながら、情報処理システム1において情報処理端末20が情報管理装置10に操作履歴データを登録する際に実行される処理の一例について説明する。
図6に示されるように、情報処理端末20は、ユーザからの操作入力を受け付けると(S101)、受け付けた操作入力に基づいて、文書データの編集処理を実行する(S102)。ここでの編集処理には、例えば文書データを開く、閉じる、複製する等の処理を含むこととしてよい。
情報処理端末20は、実行した文書データの編集処理に基づいて、操作履歴データを記録する(S103)。例えば、情報処理端末20は、ユーザID、操作日時、操作コマンド、操作対象のファイル名(パス名)を操作履歴データとして記録することとしてよい。
情報処理端末20は、操作履歴データの送信タイミングが到来していない場合には(S104:N)、S101に戻り、それ以降の処理を継続し、操作履歴データの送信タイミングが到来した場合には(S104:Y)、送信する操作履歴データと、文書データとを選択する(S105)。例えば、情報処理端末20は、予め定められた時間間隔が経過するごとに、送信タイミングが到来したと判定することとしてもよいし、操作入力が行われた等の予め定められたイベントが発生するごとに、送信タイミングが到来したと判定することとしてもよい。そして、情報処理端末20は、情報管理装置10に対して未送信の操作履歴データと、文書データとを送信対象に選択することとしてよい。ここで、情報処理端末20は、既に送信した文書データであっても、送信後に文書データが更新された場合には、更新後の文書データを送信対象に選択することとしてよい。
情報処理端末20は、S105で選択された操作履歴データと、文書データとを情報管理装置10に送信する(S106)。そして、情報処理端末20は、文書の処理を終了しない場合には(S107:N)、S101に戻りそれ以降の処理を繰り返し、文書の処理を終了する場合には(S107:Y)、処理を終了する。
また、情報管理装置10は、S106で情報処理端末20から送信された操作履歴データと文書データを受信すると、受信した文書データに文書IDを付与した上で、文書データ管理テーブル(図4参照)に記憶するとともに(S108)、情報処理端末20から受信した操作履歴データを履歴データ管理テーブル(図3参照)に記憶する(S109)。なお、情報管理装置10は、情報処理端末20から受信した文書データのファイルパスに対応する文書データを既に文書データ管理テーブルに記憶している場合には、当該記憶されている文書データの情報(レコード)を更新し、情報処理端末20から受信した文書データのファイルパスに対応する文書データが文書データ管理テーブルに記憶されていない場合には、文書データに新たな文書IDを付与して文書データ管理テーブルに情報(レコード)を追加することとしてよい。
次に、情報管理装置10は、文書間の関係性を判定するタイミングが到来していない場合には(S110:N)、S108の前に戻って、情報処理端末20からの操作履歴データと文書データの送信を待機し、文書間の関係性を判定するタイミングが到来した場合には(S110:Y)、文書間の関係性を判定する処理(文書間関係性判定処理)を実行する(S111)。情報管理装置10は、S111の処理を終えると、S108の前に戻って、情報処理端末20からの操作履歴データと文書データの送信を待機する。次に、情報管理装置10により実行される文書間関係性判定処理の詳細について、図7及び図8のフロー図を参照しながら説明する。
[3−2.文書間関係性判定処理]
図7及び図8には、文書間関係性判定処理のフロー図を示した。図7に示されるように、情報管理装置10は、処理対象とする文書データ(ここでは、文書データD〜Dとし、Nは1以上の整数である)を選択する(S201)。例えば、情報管理装置10は、指定したユーザIDが関連付けられた文書データのうち、指定期間内(例えば現在時刻から予め定められた期間内)に文書データ管理テーブルに登録(又は情報が更新)された文書データと、履歴データ管理テーブルに登録された履歴データにおいて操作対象となった文書データとの少なくとも一方を処理対象として選択することとしてよい。なお、文書間関係性判定処理は、ユーザIDごとに実行することとしてよい。
次に、情報管理装置10は、変数iを1に初期化して(S202)、文書データDについての操作履歴データを履歴データ管理テーブルから抽出する(S203)。例えば、情報管理装置10は、文書データDの文書IDを含む操作履歴データ(レコード)を履歴データ管理テーブルから抽出することとしてよい。
情報管理装置10は、文書データDについて抽出された操作履歴データに基づいて、文書データDが他の文書データから複製されたと判定される場合には(S204:Y)、文書データDについて、複製元の文書データとの複製関係を関係性管理テーブル(図5参照)に記録する(S205)。例えば、情報管理装置10は、文書データDについて抽出された操作履歴データの中に、文書データDが他の文書データの複製により作成したことを示す操作コマンドが含まれている場合には、関係性管理テーブルに新たなレコードを追加し、当該追加したレコードの関係性IDに新たに生成したIDを格納し、主文書IDに文書データDの文書IDを、従文書IDに複製元の文書データの文書IDを、関係性の内容に「1:複製」を、関係性の発生日に操作履歴データにおける操作日時を関連付けて記憶することとしてよい。
情報管理装置10は、文書データDについて抽出された操作履歴データに基づいて、文書データDが他の文書データから複製されたと判定されなかった場合(S204:N)と、S205の後には、文書データDについて抽出された操作履歴データに基づいて、文書データDと共起関係の他の文書データがあるか否かを判定する(S206)。例えば、情報管理装置10は、文書データDについて抽出された操作履歴データにおいて、文書データDが開かれてから閉じられるまでの間に、開かれた他の文書データがある場合に、共起関係の他の文書データがあると判定し、そうでない場合に、共起関係の他の文書データがないと判定する。
情報管理装置10は、S206において、文書データDと共起関係の他の文書データがあると判定する場合には(S206:Y)、文書データDについて、他の文書データとの共起関係を関係性管理テーブル(図5参照)に記録する(S207)。例えば、情報管理装置10は、文書データDと共起関係の他の文書データがあると判定する場合には、関係性管理テーブルに新たなレコードを追加し、当該追加したレコードの関係性IDに新たに生成したIDを格納し、主文書IDに文書データDの文書IDを、従文書IDに共起関係にある他の文書データの文書IDを、関係性の内容に「2:共起」を、関係性の発生日に操作履歴データにおける操作日時(例えば、共起関係にある他の文書データを開いた日時)を関連付けて記憶することとしてよい。
情報管理装置10は、文書データDに共起関係の他の文書データがない場合(S206:N)と、S207の後には、文書データDについて特徴ベクトルVを生成する(S208)。例えば、特徴ベクトルVは、文書データDに含まれる単語とその重要度に基づき算出することとしてもよいし、他の方法により算出することとしてもよい。
情報管理装置10は、文書データDの特徴ベクトルVが、記憶部12に記憶される文書データのそれぞれの特徴ベクトルを分類した複数のクラスタのいずれに属するかを特定するとともに、特定したクラスタに属する文書データ群(ここでは文書データdi1〜diMi)を選択する(S209)。なお、Miは、1以上の整数とする。ここで、例えば、情報管理装置10は、各クラスタの代表特徴ベクトルと、特徴ベクトルVとの距離を算出し、距離が最小のクラスタを文書データDが属するクラスタに特定することとしてよい。ここで、S209以降の処理は、図8を参照しながら説明する。
図8に示されるように、情報管理装置10は、変数jを1に初期化して(S210)、文書データDと文書データdijが類似のデータであるか否かを判定する(S211)。例えば、情報管理装置10は、文書データDの特徴ベクトルと、文書データdijの特徴ベクトルとの距離が閾値以下であれば類似、閾値より大きければ非類似と判定することとしてよい。
情報管理装置10は、S211において、文書データDが文書データdijと類似である場合には(S211:Y)、S212に進み、文書データDが文書データdijと非類似である場合には(S211:N)、S217に進む。
情報管理装置10は、S212において、文書データDと文書データdijとが複製関係にあると判定される場合には(S212:Y)、文書データDに対して、文書データdijとの流用関係を関係性管理テーブル(図5参照)に記録し(S213)、文書データDと文書データdijとが複製関係にないと判定される場合には(S212:N)、文書データDに対して、文書データdijとの類似関係を関係性管理テーブル(図5参照)に記録する(S214)。例えば、情報管理装置10は、文書データDについて抽出された操作履歴データの中に、文書データdijを複製元とした複製操作の履歴が含まれているか否かに基づいて、文書データDと文書データdijとが複製関係にあるか否かを判定することとしてよい。
情報管理装置10は、S213又はS214の後に、文書データDと文書データdijとのファイルパスが類似しているか否かを判定する(S215)。例えば、情報管理装置10は、文書データDのファイルパスの文字列と、文書データdijのファイルパスの文字列が予め定められた割合以上一致する場合や、文書データDのファイルパスの文字列と、文書データdijのファイルパスの文字列との差異が、予め定められた形式(例えば数字のみ)に過ぎない場合に、両者が類似していると判定し、そうでない場合に両者が非類似であると判定することとしてよい。
情報管理装置10は、S215で、文書データDと文書データdijとのファイルパスが類似していると判定される場合に(S215:Y)、文書データDに対して、文書データdijとの改訂関係を関係性管理テーブル(図5参照)に記録する(S216)。
情報管理装置10は、S216の後、文書データDと文書データdijとのファイルパスが非類似である場合(S215:Y)、又は、文書データDが文書データdijと非類似である場合には(S211:N)、文書データDが文書データdijを参照するデータを含むか否かを判定する(S217)。例えば、情報管理装置10は、文書データDの中に、文書データdijのファイルパス(ファイル名)を含むか否かに基づいて、S217の判定処理を実行することとしてよい。
情報管理装置10は、S217で文書データDが文書データdijを参照するデータを含むと判定される場合には(S217:Y)、文書データDに対して、文書データdijへの参照関係を関係性管理テーブル(図5参照)に記録する(S218)。また、情報管理装置10は、文書データdijの中に文書データDを参照するデータを含むか否かをさらに判定し、その判定結果に基づいて、文書データdijに対して、文書データDへの参照関係を、関係性管理テーブルに記録するようにしてもよい。
情報管理装置10は、S218の後、又は、文書データDが文書データdijを参照するデータを含まない場合には(S217:N)、S219に進む。ここで、情報管理装置10は、変数jが、文書データDが属するクラスタの文書数Miに達していないときには(S219:N)、変数jをインクリメント(jに1加算)して(S220)、S211に戻ってそれ以降の処理を繰り返し、変数jがMiに達したときには(S219:Y)、S221に進む。
ここで、情報管理装置10は、変数iが対象文書データ数Nに達していないときには(S221:N)、変数iをインクリメント(iに1加算)して(S222)、図7のS203に戻ってそれ以降の処理を繰り返し、変数iが対象文書データ数Nに達したときには(S221:Y)、リターンして文書間関係性判定処理を抜ける。
以上が、情報処理システム1において操作履歴データを登録する際に実行される処理の一例である。次に、図6〜図8において解析された文書間の関係性を利用した、文書の価値評価処理と、文書について評価された価値に応じたユーザへの情報提供処理の例について説明する。
[3−3.文書価値評価処理]
図9には、情報管理装置10により実行される文書の価値評価処理のフロー図を示した。
図9に示されるように、情報管理装置10は、文書の評価タイミングが到来していない場合には(S301:N)、待機し、文書の評価タイミングが到来した場合には(S301:Y)、S302に進む。例えば、情報管理装置10は、予め定められた時間間隔(1日、1週間おき等)ごとに、文書の評価タイミングが到来したと判断してもよいし、予め定められた日時やイベントが到来したか否かに応じて、評価タイミングの到来を判断することとしてもよい。
情報管理装置10は、文書の評価タイミングが到来した場合には(S301:Y)、評価対象の文書D〜D(Nは1以上の整数)を選択する(S302)。例えば、情報管理装置10は、記憶部12に記憶される文書データの全てを評価対象に選択することとしてもよいし、指定した条件(例えば、生成日が指定した期間にあることや操作履歴が指定した期間内にあること等)に合致する文書データを評価対象に選択することとしてもよい。
情報管理装置10は、変数iを1に初期化して(S303)、注目する文書Dについて、評価対象期間内に発生した関係性データを、関係性管理テーブルを参照して取得する(S304)。例えば、評価対象期間は、前回の評価タイミングから今回の評価タイミングまでの期間としてよい。そして、情報管理装置10は、例えば、関係性管理テーブルの中から、文書DのIDを主文書ID又は従文書IDのいずれかに含み、さらに発生日が評価対象期間に含まれるレコードを取得することとしてよい。
情報管理装置10は、S304で取得した関係性データに基づいて、文書Dの被参照関係数aiを計数する(S305)。例えば、情報管理装置10は、S304で取得した関係性データのレコードのうち、文書DのIDが従文書IDの欄に格納され、さらに関係性が「4:複製」であるレコードの数を計数して、計数した数をaiとして得ることとしてよい。
次に、情報管理装置10は、S304で取得した関係性データに基づいて、文書Dの被複製関係数biを計数する(S306)。例えば、情報管理装置10は、S304で取得した関係性データのレコードのうち、文書DのIDが従文書IDの欄に格納され、さらに関係性が「1:複製」であるレコードの数を計数して、計数した数をbiとして得ることとしてよい。
次に、情報管理装置10は、S304で取得した関係性データに基づいて、文書Dの被流用関係数ciを計数する(S307)。例えば、情報管理装置10は、S304で取得した関係性データのレコードのうち、文書DのIDが従文書IDの欄に格納され、さらに関係性が「5:流用」であるレコードの数を計数して、計数した数をciとして得ることとしてよい。
次に、情報管理装置10は、S304で取得した関係性データに基づいて、文書Dの共起関係数diを計数する(S308)。例えば、情報管理装置10は、S304で取得した関係性データのレコードのうち、文書DのIDが従文書ID(又は主文書ID、又は主文書IDと従文書IDのいずれか)の欄に格納され、さらに関係性が「2:共起」であるレコードの数を計数して、計数した数をdiとして得ることとしてよい。
次に、情報管理装置10は、S304で取得した関係性データに基づいて、文書Dの改訂関係数eiを計数する(S309)。例えば、情報管理装置10は、S304で取得した関係性データのレコードのうち、文書Dか、又は文書Dに基づき改訂した文書のIDが従文書IDの欄に格納され、さらに関係性が「6:流用」であるレコードの数(又は、文書Dから改訂後の文書に至るまでの改訂回数)を計数して、計数した数をeiとして得ることとしてよい。
次に、情報管理装置10は、文書Dのアクセス数fiを計数する(S310)。例えば、情報管理装置10は、履歴データ管理テーブルの中から、操作日時が評価対象期間内にあるレコードであって、文書DのIDを文書IDの欄に含み、さらに操作コマンドが「開く(open)」又は「更新(update)」であるレコードの数を計数して、計数した数をfiとして得ることとしてよい。
そして、情報管理装置10は、S305〜S310で計数したデータに基づき、評価対象期間内における文書Dの評価値(期間内評価値)Viを算出する(S311)。例えば、情報管理装置10は、A,B,C,D,E,Fをそれぞれ予め定められた係数として、評価値Viを以下の式(1)により算出することとしてよい。一例としては、A=2、B=2、C=2、D=1、E=4、F=1等としてよい。
Vi=A・ai+B・bi+C・ci+D・di+E・ei+F・fi (1)
情報管理装置10は、S311で算出された文書Dの評価値Viと、文書Dについて過去に算出された評価値とに基づいて、文書Dの累積評価値TViを算出する(S312)。例えば、情報管理装置10は、評価対象タイミングが1日おきであり、文書Dの生成日から今回の評価対象タイミングまでの日数をMiとした場合には、文書Dの累積評価値TViを以下の式(2)により算出することとしてよい。なお、日数を表す変数jに関し、j=0は生成日、j=Miは今回の評価対象タイミングを表し、Vijは、日数jにおける文書Dの評価値を表している。また、eは自然体数の底、λは評価値の半減期をT(例えば10日)とした場合に、λ=ln2/Tとして表される。
Figure 2015072642
また、情報管理装置10は、累積評価値TViを、評価対象タイミングにおける評価値の増分をRj、減少分をRDjとした場合に以下の式(3)で算出することとしてもよい。なお、累積評価値TViの算出は式(2),(3)に限られるものではなく、過去の評価値を時間の経過とともに減少させて、現在の評価値に加算させる他の式によってもよい。
Figure 2015072642
情報管理装置10は、文書Dについて算出された期間内評価値Vi、累積評価値TVi、そしてアクセス数fiを文書Dに関連付けて評価値管理テーブル(図10参照)に記録する(S313)。
図10には、評価値管理テーブルの一例を示した。図10に示されるように、評価値管理テーブルには、文書ID、評価日時、文書のデータ形式、期間内評価値Vi、累積評価値TVi、アクセス数fiが関連付けて記憶される。例えば、情報管理装置10は、S313において、文書Dの文書ID、評価タイミングに基づく評価日時、文書Dのデータ形式、文書DについてS311で算出された評価値Vi、文書DについてS312で算出された累積評価値TVi、文書DについてS310で計数されたアクセス数fiを関連づけて評価値管理テーブルに記録することとしてよい。なお、評価値管理テーブルは、情報管理装置10の記憶部12に記憶されることとしてよい。
情報管理装置10は、変数iがNに達していない場合には(S314:N)、変数iをインクリメント(1加算)して(S315)、S304に戻り、それ以降の処理を繰り返し、変数iがNに達している場合には(S314:Y)、文書の評価処理を終了する。
[3−4.情報提供処理]
次に、文書の評価結果を利用した情報提供例について説明する。
[3−4−1.第1の情報提供処理]
第1の情報提供処理の例として、文書の累積評価値に基づくランキングが高い文書の情報をユーザに提供する例を説明する。
図11には、第1の情報提供処理のフロー図を示した。図11に示されるように、情報管理装置10は、例えばユーザの操作する情報処理端末20から累積評価値に基づくランキングについての検索要求を受け付ける(S401)。例えば、検索要求には、指定期間、キーワード、文書の形式、表示件数(例えばMとする)等が定められていることとしてよい。
情報管理装置10は、情報処理端末20から受け付けた検索要求に基づいて、指定条件(例えばキーワード、文書の形式)を満足する文書のうち、指定期間における累積評価値が大きいMの文書を検索する。例えば、情報管理装置10は、評価値管理テーブルの中から、評価日時が指定期間内にあり、かつデータ形式が条件を満足する文書のうち、累積評価値が大きい順にMの文書を検索することとしてよい。
情報管理装置10は、S402で検索された文書に基づく検索結果を生成する(S403)。例えば、情報管理装置10は、S402で検索されたMの文書のリストを含む表示データを検索結果として生成することとしてよい。
情報管理装置10は、S403で生成した検索結果を、検索を要求した情報処理端末20に対して提供する(S404)。例えば、情報処理端末20は、情報管理装置10から受信した検索結果に含まれる文書のリストを表示することとしてよい。
以上の情報提供処理によれば、指定した条件を満足する文書のうち、指定期間において価値の高い文書の情報をユーザに提供できる。
[3−4−2.第2の情報提供処理]
次に、第2の情報提供処理の例として、指定した期間において文書の活性度が高い文書の情報をユーザに提供する例を説明する。なお、活性度とは、文書の注目度、利用度が高まっている程度を示すデータであり、活性度の算出処理の詳細については後述する。
図12には、第2の情報提供処理のフロー図を示した。図12に示されるように、情報管理装置10は、例えばユーザの操作する情報処理端末20から活性度に基づくランキングについての検索要求を受け付ける(S501)。例えば、検索要求には、指定期間、キーワード、文書の形式、表示件数(例えばLとする)等が定められていることとしてよい。
情報管理装置10は、情報処理端末20から受け付けた検索要求に基づいて、指定条件(例えばキーワード、文書の形式)を満足する文書についての活性度を算出する(S502)。ここで、活性度の算出処理の詳細については図13に示したフロー図を参照しながら説明する。
図13に示されるように、情報管理装置10は、図12のS501で受け付けた検索要求に基づいて、指定期間を設定するとともに(S601)、指定条件(例えばキーワード、文書の形式)を満足する文書D〜Dを選択する(S602)。なお、Kは1以上の整数としてよい。
情報管理装置10は、変数iを1に初期化して(S603)、評価値管理テーブルから、指定期間内の文書Dについての評価データを取得する(S604)。例えば、情報管理装置10は、評価値管理テーブルから、文書Dの文書IDを含み、評価日時が指定期間に含まれるレコードを検索し取得することとしてよい。
情報管理装置10は、指定期間内の文書Dの評価値の変化量ΔViを算出する(S605)。例えば、情報管理装置10は、文書Dについての指定期間内の評価値の変化量(期間内評価値)の合計をΔViとして算出してもよいし、指定期間内の最後の累積評価値と最初の累積評価値との差分をΔViとして算出してもよい。
情報管理装置10は、指定期間内の文書Dへのアクセス数の合計Siを算出する(S606)。例えば、情報管理装置10は、文書Dについての指定期間内のアクセス数を、評価値管理テーブルから取得し、取得したアクセス数を合計してSiを得ることとしてよい。
情報管理装置10は、指定期間内の文書Dの評価値の変化量ΔViと、アクセス総数Siとに基づいて指定期間内の文書Dの活性度AViを算出する(S607)。例えば、情報管理装置10は、活性度AViを以下の式(4)により算出することとしてよい。なお、α、βは予め定められた係数であり(例えばα=1、β=1としてもよい)、変化量ΔViが0未満となった場合には0に置き換えることとしてよい。
AVi=α・ΔVi+β・Si (4)
情報管理装置10は、変数iがKに達していない場合には(S608:N)、変数iをインクリメント(1加算)して(S609)、S604に戻り、それ以降の処理を繰り返し、変数iがKに達している場合には(S608:Y)、文書の活性度の算出処理を終えて、リターンする。
ここで、図12に戻り説明を続ける。情報管理装置10は、S502で活性度が算出された文書の中から、活性度が大きい順にLの文書を検索する(S503)。
次いで情報管理装置10は、S503で検索された文書に基づく検索結果を生成する(S504)。例えば、情報管理装置10は、S503で検索されたLの文書のリストを含む表示データを検索結果として生成することとしてよい。
情報管理装置10は、S504で生成した検索結果を、検索を要求した情報処理端末20に対して提供する(S505)。例えば、情報処理端末20は、情報管理装置10から受信した検索結果に含まれる文書のリストを表示することとしてよい。
以上の情報提供処理によれば、指定した条件を満足する文書のうち、指定期間において活性度の高い文書の情報をユーザに提供できる。
情報管理装置は、情報処理端末からの要求に応じて、累積評価値に基づくランクの高い文書のリストと、活性度に基づくランクの高い文書のリストとの両方を情報処理端末に提供することとしてもよい。
本発明は、上記の実施形態に限定されるものではない。例えば、上記の実施形態では、文書データを管理する情報管理装置10を例にして説明したが、文書データ以外のデータを管理する情報管理装置10に対しても本発明を適用してよいのはもちろんである。

Claims (8)

  1. 複数のデータと、ユーザが該複数のデータのそれぞれに対して行った操作履歴情報を取得する取得手段と、
    前記複数のデータに対する操作履歴情報に基づいて、前記複数のデータの中から選択された1以上のデータの組のそれぞれに対して、データ間の複数の関係のそれぞれに予め定められた条件を満足するか否かに基づいて、該複数の関係をそれぞれ有するか否かを判定する判定手段と、
    前記1以上のデータの組のそれぞれに対して前記判定手段により該データの組が有すると判定された関係を関連付けて設定する設定手段と、
    前記複数のデータの対象のデータについて対象期間内に前記設定手段により設定された関係の数に基づいて、該対象期間における該対象のデータの評価値を算出する算出手段と、
    を含む情報管理装置。
  2. 前記算出手段は、前記対象のデータについて前記対象期間内に前記設定手段により設定された前記複数の関係のそれぞれの関係の数と、該複数の関係にそれぞれ定められた重みとに基づいて、該対象期間における該対象のデータの評価値を算出する
    請求項1に記載の情報管理装置。
  3. 前記対象のデータについて、複数の期間のそれぞれにおいて前記算出手段によりそれぞれ算出された複数の評価値と、該複数の期間のそれぞれについて過去の期間ほど値が小さく定められた複数の重みとに基づいて、該対象のデータの累積評価値を算出する累積評価値算出手段をさらに含む
    請求項2に記載の情報管理装置。
  4. 前記累積評価値算出手段は、前記複数のデータのうち1以上のデータのそれぞれに対して、端末から受け付けた指定期間における累積評価値を算出し、
    前記指定期間における前記1以上のデータの累積評価値に基づいて選択したデータを前記端末に提供する
    請求項3に記載の情報管理装置。
  5. 前記複数のデータのうち1以上のデータのそれぞれに対して、端末から受け付けた指定期間内における複数の期間のそれぞれにおいて前記算出手段によりそれぞれ算出された評価値の変化量に基づいて、該1以上のデータのそれぞれの活性度を算出する活性度算出手段をさらに含み、
    前記指定期間における前記1以上のデータの活性度に基づいて選択したデータを前記端末に提供する
    請求項1乃至4のいずれかに記載の情報管理装置。
  6. 前記活性度算出手段は、前記1以上のデータのそれぞれについて前記指定期間内における評価値の変化量と、該指定期間内におけるアクセス数とに基づいて、該1以上のデータのそれぞれについての活性度を算出する
    請求項5に記載の情報管理装置。
  7. 複数のデータと、ユーザが該複数のデータのそれぞれに対して行った操作履歴情報を取得する取得手段と、
    前記複数のデータに対する操作履歴情報に基づいて、前記複数のデータの中から選択された1以上のデータの組のそれぞれに対して、データ間の複数の関係のそれぞれに予め定められた条件を満足するか否かに基づいて、該複数の関係をそれぞれ有するか否かを判定する判定手段と、
    前記1以上のデータの組のそれぞれに対して前記判定手段により該データの組が有すると判定された関係を関連付けて設定する設定手段と、
    前記複数のデータの対象のデータについて対象期間内に前記設定手段により設定された関係の数に基づいて、該対象期間における該対象のデータの評価値を算出する算出手段
    としてコンピュータを機能させるためのプログラム。
  8. 情報処理端末と、情報管理装置とを含み、
    前記情報処理端末は、
    複数のデータと、ユーザが該複数のデータのそれぞれに対して行った操作履歴情報を前記情報管理装置に送信する送信手段を含み、
    前記情報管理装置は、
    前記送信手段により送信された前記複数のデータと前記操作履歴情報を取得する取得手段と、
    前記複数のデータに対する操作履歴情報に基づいて、前記複数のデータの中から選択された1以上のデータの組のそれぞれに対して、データ間の複数の関係のそれぞれに予め定められた条件を満足するか否かに基づいて、該複数の関係をそれぞれ有するか否かを判定する判定手段と、
    前記1以上のデータの組のそれぞれに対して前記判定手段により該データの組が有すると判定された関係を関連付けて設定する設定手段と、
    前記複数のデータの対象のデータについて対象期間内に前記設定手段により設定された関係の数に基づいて、該対象期間における該対象のデータの評価値を算出する算出手段と、を含む
    情報処理システム。
JP2013208655A 2013-10-03 2013-10-03 情報管理装置、プログラム及び情報処理システム Active JP6194732B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013208655A JP6194732B2 (ja) 2013-10-03 2013-10-03 情報管理装置、プログラム及び情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013208655A JP6194732B2 (ja) 2013-10-03 2013-10-03 情報管理装置、プログラム及び情報処理システム

Publications (2)

Publication Number Publication Date
JP2015072642A true JP2015072642A (ja) 2015-04-16
JP6194732B2 JP6194732B2 (ja) 2017-09-13

Family

ID=53014955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013208655A Active JP6194732B2 (ja) 2013-10-03 2013-10-03 情報管理装置、プログラム及び情報処理システム

Country Status (1)

Country Link
JP (1) JP6194732B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962658A (ja) * 1995-08-21 1997-03-07 Hitachi Inf Syst Ltd 文書間リンク処理システム
JPH09204351A (ja) * 1996-01-24 1997-08-05 Hitachi Ltd メモリ付リンク情報を用いた画面遷移方法
JP2009122940A (ja) * 2007-11-14 2009-06-04 Nec Corp 文書関連度算出システム、文書関連度算出方法および文書関連度算出プログラム
JP2010026849A (ja) * 2008-07-22 2010-02-04 Hitachi Ltd 文書管理システム、文書管理プログラム及び文書管理方法
JP2012510662A (ja) * 2008-11-28 2012-05-10 イーストソフト コーポレーション ウェブページの接続時間及び訪問度に基づいたウェブ検索システム及びその方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962658A (ja) * 1995-08-21 1997-03-07 Hitachi Inf Syst Ltd 文書間リンク処理システム
JPH09204351A (ja) * 1996-01-24 1997-08-05 Hitachi Ltd メモリ付リンク情報を用いた画面遷移方法
JP2009122940A (ja) * 2007-11-14 2009-06-04 Nec Corp 文書関連度算出システム、文書関連度算出方法および文書関連度算出プログラム
JP2010026849A (ja) * 2008-07-22 2010-02-04 Hitachi Ltd 文書管理システム、文書管理プログラム及び文書管理方法
JP2012510662A (ja) * 2008-11-28 2012-05-10 イーストソフト コーポレーション ウェブページの接続時間及び訪問度に基づいたウェブ検索システム及びその方法

Also Published As

Publication number Publication date
JP6194732B2 (ja) 2017-09-13

Similar Documents

Publication Publication Date Title
Liang et al. Factorization meets the item embedding: Regularizing matrix factorization with item co-occurrence
Jeffery et al. Pay-as-you-go user feedback for dataspace systems
Motro et al. Estimating the quality of databases
Yin et al. Structural link analysis and prediction in microblogs
CN111782965A (zh) 意图推荐方法、装置、设备及存储介质
JP3648051B2 (ja) 関連情報検索装置及びプログラム記録媒体
Çavdar et al. Airline customer lifetime value estimation using data analytics supported by social network information
Hung et al. Mining trajectory profiles for discovering user communities
CN110162695A (zh) 一种信息推送的方法及设备
CN106164865A (zh) 用于数据复制的依赖性感知的事务批处理
CN108550068A (zh) 一种基于用户行为分析的个性化商品推荐方法及系统
Nasraoui et al. A framework for mining evolving trends in web data streams using dynamic learning and retrospective validation
CN109190036A (zh) 推荐方法、装置、电子设备及存储介质
CN111767459A (zh) 物品推荐的方法和装置
Srikanth et al. Dynamic social media monitoring for fast-evolving online discussions
CN112995248B (zh) 信息推送方法、装置及设备
US8745042B2 (en) Determining matching degrees between information categories and displayed information
JP6194732B2 (ja) 情報管理装置、プログラム及び情報処理システム
CN109886844B (zh) 基于贝叶斯网络模型的房屋登记数据关联楼盘表方法
Bendimerad et al. Contextual subgraph discovery with mobility models
JP6160422B2 (ja) 情報管理装置、プログラム及び情報処理システム
CN116010681A (zh) 一种召回模型的训练及检索方法、装置及电子设备
KR101689499B1 (ko) 신규 논문 추천 방법 및 상기 방법을 수행하는 신규 논문 추천 시스템
Abbott et al. Population statistics without a Census or register
Liu et al. Social community evolution by combining gravitational relationship with community structure

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170426

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170731

R150 Certificate of patent or registration of utility model

Ref document number: 6194732

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350