JP4151288B2 - 文書管理装置、文書管理プログラムおよび記録媒体 - Google Patents
文書管理装置、文書管理プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP4151288B2 JP4151288B2 JP2002070479A JP2002070479A JP4151288B2 JP 4151288 B2 JP4151288 B2 JP 4151288B2 JP 2002070479 A JP2002070479 A JP 2002070479A JP 2002070479 A JP2002070479 A JP 2002070479A JP 4151288 B2 JP4151288 B2 JP 4151288B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- importance
- user
- documents
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【発明の属する技術分野】
本発明は、データ化された文書を、その重要度に応じて管理する文書管理装置、文書管理プログラムおよび記録媒体に関する。
【0002】
【従来の技術】
今日のように、情報通信網が大規模化して通信量が増大すると、受信した電子メールや、データベースの検索結果などのようにデータ化された文書の全文を即座に閲覧することが困難となる状況がしばしば発生し得る。このような状況下では、文書の全文を後日閲覧したり、確認等のために再度閲覧したりすれば済むが、このように文書の閲覧をしようとする場合に避けるべき点は、利用者にとって興味がある(または必要である)はずの文書が、興味のない(または不要な)文書に埋没してしまう点である。
この点を避けるための技術としては、データ化された文書毎にその重要度を示す指標を付しておく一方、閲覧前に当該指標で示される重要度にしたがって(例えば重要度が高いものから順番に、または、その重要度そのものを併記して)一覧表示する、という技術が考えられる。
【0003】
【発明が解決しようとする課題】
しかしながら、上記技術において重要度を固定的に扱ってしまうと、過去においては確かに興味があった文書であったが、現時点では興味がなくなった文書が一覧表示にて上位に位置付けられてしまうので、現時点において関心のある文書を探し出す際の障害となってしまう。
本発明は、このような事情に鑑みてなされたものであり、その目的とするところは、利用者にとって、その時点において関心(重要)のあると考えられる文書を効率良く見つけだして閲覧することができるように、データ化された文書を管理する文書管理装置、文書管理プログラムおよび記録媒体を提供することにある。
【0004】
【課題を解決するための手段】
上記目的を達成するために、本発明に係る文書管理装置は、文書を、その文書の重要度を示す指標とともに関連付けて記憶する記憶手段と、記憶された文書のなかから、利用者によって一の文書を閲覧する旨の指示があったとき、当該文書の重要度が高くなるように、当該文書に関連付けられた指標を更新する一方、他の文書については、放置された時間に応じて、その重要度が低くなるように、当該他の文書に関連付けられた指標を更新する更新手段と、を備え、
前記重要度を示す指標は、前記記憶された文書のすべての文書iについて類似度i×興味度合i×評価値iを累算することによって算出され、
前記類似度iは、一の文書ベクトルと文書iのベクトルについて、両者ベクトル同士の内積を算出して得た値とし、
前記興味度合iは、文書iの閲覧からの放置された時間をt、文書iの履歴回数で変化する変数をTlostとした場合、以下の数式による関数I(t)として算出して得た値とし、
I(t)=1−(t/Tlost)3
前記評価値iは、利用者が文書iについての関心度を示す値であって、閲覧したときの利用者の操作状況に応じて、「+0.5」、「+1.0」または「−1.0」のいずれかにセットされる係数とする。
この装置によれば、利用者がある一の文書の閲覧を所望したとき、その文書の重要度が高められる一方、他の文書については、放置された時間が経過したものほど、重要度が低くなる。このため、例えば、繰り返し閲覧されるほど、重要度が高くなり、また、過去に1回だけした閲覧されなかった文書は、重要度が下位とされる。したがって、利用者にとってみれば、現時点において関心のある(重要である)文書を効率良く見つけ出して閲覧することが可能となる。
【0005】
また、上記目的を達成するために、本発明に係る文書管理プログラムは、コンピュータを文書管理装置として機能させる文書管理プログラムであって、文書を、その文書の重要度を示す指標とともに関連付けて記憶する第1過程、および、記憶された文書のなかから、利用者によって一の文書を閲覧する旨の指示があったとき、当該文書の重要度が高くなるように、当該文書に関連付けられた指標を更新する一方、他の文書については、放置された時間に応じて、その重要度が低くなるように、当該他の文書に関連付けられた指標を更新する第2過程を備え、
前記重要度を示す指標は、前記記憶された文書のすべての文書iについて類似度i×興味度合i×評価値iを累算することによって算出され、
前記類似度iは、一の文書ベクトルと文書iのベクトルについて、両者ベクトル同士の内積を算出して得た値とし、
前記興味度合iは、文書iの閲覧からの放置された時間をt、文書iの履歴回数で変化する変数をTlostとした場合、以下の数式による関数I(t)として算出して得た値とし、
I(t)=1−(t/Tlost)3
前記評価値iは、利用者が文書iについての関心度を示す値であって、閲覧したときの利用者の操作状況に応じて、「+0.5」、「+1.0」または「−1.0」のいずれかにセットされる係数とすることを特徴とする。
【0006】
さらに、上記目的を達成するために、本発明に係る文書管理プログラムを記録した記録媒体は、コンピュータを文書管理装置として機能させる文書管理プログラムを記録した記録媒体であって、文書を、その文書の重要度を示す指標とともに関連付けて記憶する第1過程、および、記憶された文書のなかから、利用者によって一の文書を閲覧する旨の指示があったとき、当該文書の重要度が高くなるように、当該文書に関連付けられた指標を更新する一方、他の文書については、放置された時間に応じて、その重要度が低くなるように、当該他の文書に関連付けられた指標を更新する第2過程を備え、
前記重要度を示す指標は、前記記憶された文書のすべての文書iについて類似度i×興味度合i×評価値iを累算することによって算出され、
前記類似度iは、一の文書ベクトルと文書iのベクトルについて、両者ベクトル同士の内積を算出して得た値とし、
前記興味度合iは、文書iの閲覧からの放置された時間をt、文書iの履歴回数で変化する変数をTlostとした場合、以下の数式による関数I(t)として算出して得た値とし、
I(t)=1−(t/Tlost)3
前記評価値iは、利用者が文書iについての関心度を示す値であって、閲覧したときの利用者の操作状況に応じて、「+0.5」、「+1.0」または「−1.0」のいずれかにセットされる係数とすることを特徴とする。
【0010】
【発明の実施の形態】
以下、本発明の実施の形態に係る文書管理装置について、電子メールを文書として管理する電子メールシステムを例にとって説明する。この電子メールシステムは、メッセージ(本文)を含むメールデータを、ネットワーク上で配信するとともに、当該メッセージを文書として管理する。
【0011】
<全体構成>
図1は、この電子メールシステムの構成を示す図である。この図に示されるように、電子メールシステムは、クライアントコンピュータ10−1、10−2、10−3、…、の複数と、サーバーコンピュータ(メールサーバー)20とがネットワーク30を介して互いに接続された構成となっている。
【0012】
電子メールシステムの機能構成について図2を参照して説明する。クライアントコンピュータ10−1、10−2、10−3、…、の構成は互いに略同一である。そこで以降、特定のクライアントコンピュータに限定する必要のない限り、その符号を10として説明することにする。
クライアントコンピュータ10は、各種の演算や制御を実行する制御部100、キーボードやマウスなどのように利用者(ユーザ)の各種操作を入力する入力部121、利用者に対して各種の表示画面を提供する表示部122、サーバーコンピュータ20から読み出したメールを保持したり、要約文作成時に用いる辞書などの各種データを記憶したりする記憶部123、日時を示すデータを取得するためのタイマ124、および、ネットワーク30に接続してデータを送受信するためのネットワーク接続部128を有する。
【0013】
これらのうち、制御部100は、さらに、メールのメッセージ(本文)を解析して、その特徴を示すベクトルを算出するベクトル算出部111と、メール毎に重要度を算出する重要度計算部112と、算出された重要度に応じてメッセージを要約した要約文等を作成する要約文作成部113と、メールが選択される毎に、当該メールと他のメールとの類似しているか否かを判別するとともに、その判別結果に応じて各メールの重要度等を更新する履歴更新部114とを含む。
【0014】
なお、制御部100に含まれる各部については、サーバーコンピュータ20との間でメールの送受信を管理するアプリケーションプログラムを、クライアントコンピュータ10において実行することによって構築されるものであり、ハードウェア的にそれぞれ別々に存在する訳ではない。また、後述するようにベクトル算出部111と要約文作成部113とは、処理内容が一部重複しているので、これらを分けることなく、1つのブロックとして考えても良い。
【0015】
ここで、本実施形態では、メールの重要度ランクを「低」、「中」、「高」の3段階のいずれかに、次のようにして規定する。すなわち、メール毎に、重要度を示す指標を対応させ、それらのうち、特定の利用者に宛てられた全メールのうち、当該指標の値が上位30%のものについて重要度ランクを「高」とし、当該指標の値が下位30%のものについて重要度ランクを「低」とし、残余のものについては重要度ランクを「中」として、それぞれランク付けする。また、各重要度ランクに対応した要約文の長さ等については、それぞれ図13に示される通りとする。
なお、制御部100における制御内容や演算については、重要度を示す指標値の計算とともに、後述するものとする。
【0016】
一方、サーバーコンピュータ20は、各種の演算や制御を実行する制御部200、クライアントコンピュータ10−1、10−2、10−3、…、のいずれかから送信されたメールを文書データとして、宛先となる利用者毎に蓄積する文書DB(データベース)221、メール毎にその閲覧に関する情報やそのベクトルなどの履歴データを蓄積する履歴DB(データベース)222、および、ネットワーク30に接続してデータを送受信するためのネットワーク接続部228を有する。
これらのうち、制御部200は、さらに、文書DB221を管理する文書管理部211と、履歴DB222を管理する履歴管理部212とを含む。
【0017】
ここで、文書DB221に蓄積される文書データについて説明する。図3は、ある特定の利用者に宛てられたメールを蓄積した状態での文書データを示す図である。この図に示されるように、文書データについては、メール毎に、メールを識別するための通し番号である文書番号と、受信日時と、メールの題目と、メッセージ(本文)とを示すデータが組になっている。
このうち、文書番号および受信日時は、例えば文書管理部211によってそれぞれ自動的に付与されるが、メールの題目およびメッセージ(本文)は、それぞれ送信者によって入力されたテキストデータである。また、電子メールシステムとしては、このほかにも、送信元、送信先などを示すデータも組となって記憶されるが、本件では重要でないので、その説明を省略することにする。
【0018】
履歴DB222に蓄積される履歴データについては、図4に示されるように、メール毎に、文書番号と、宛先のクライアントコンピュータにおいて最後に閲覧された日時と、変数Tlostと、評価値と、文書のベクトルとを示すデータが組になっている。
【0019】
これらのうち、変数Tlostは、利用者が一のメールに対して抱く興味の度合いを算出する際に用いるデータである。ここで、興味の度合いは、次のような点を考慮して算出される。
一般に、人がモノに対して抱く興味は、そのモノに対する関心時には比較的高いが、その後の時間経過とともに関心の低いものほど早く薄れる傾向がある。本実施形態では、このような傾向を模擬して、一のメールに対する利用者の興味の度合いを定型的に算出するため、次式(a)または図12に示される関数I(t)が導入される。
【0020】
I(t)=1−(t/Tlost)3…(a)
この式において、tは、最大関心時(すなわち、メールの閲覧時)からの経過日数(日時)であり、変数Tlostの値が小さいほど、図12に示されるように、関数I(t)は早くゼロになる。換言すると、利用者にとって重要である、または、関心がある、と考えられるほど、変数Tlostとして大きな値をセットすれば、利用者における興味の度合いを、上記傾向を考慮して定型的に求めることができる。
図4における履歴データにおける変数Tlostの初期値は「15」であるが、後述する更新処理において条件を満たす場合に、「30」に、次に「60」に、1段階ずつアップされ、それ以降は「180」に保持される。
【0021】
次に、評価値とは、詳細については後述するが、利用者がそのメールについての関心度(重要度)を示す値であって、初期値が「+0.5」であり、メール本文を閲覧したときの操作に応じて「+1.0」または「−1.0」のいずれかにセットされる。
また、文書のベクトルとは、対応するメールのメッセージの特徴を示す指標であり、メッセージに含まれる単語とその統計的尺度とのペアを、単語に応じて複数組有するものである。
ここで、単語の統計的尺度とは、例えば、TF(Term Frequency)値、すなわち、対応するメールにおいて、ある単語が出現する割合と、IDF(Inverted Document Frequency)値、すなわち、全メールにおいて、その単語が出現するメールの割合の逆数とを組み合わせたTF・IDF値で示される。詳細には、ある特定の単語Wiの統計的尺度であるTF・IDF(Wi)値は、次式(b)で定義される。
【0022】
TF・IDF(Wi)=(Fi/F)log(N/Ni)…(b)
この式(b)において、Fは、メッセージに含まれる総単語数であり、Fiは、そのうち、単語Wiの出現回数であり、また、Nは、利用者に宛てられたメールの総数であり、Niは、そのうち、単語Wiを含むメール数である。
【0023】
<動作>
次に、電子メールシステムにおけるメール(文書)管理の動作について説明する。図5は、この動作を示すフローチャートである。
あるクライアントコンピュータ10において、特定の利用者宛のメッセージが作成されて、当該メッセージを含むメールが送信されると、当該メールは、一旦、文書管理部211の管理下にある文書DB221に蓄積される。このため、特定の利用者宛のメールが複数蓄積されると、その文書データは、図3に示される状態となる。
【0024】
ここで、ある利用者がクライアントコンピュータ10において、メール管理アプリケーションプログラムを起動させてログインすると、当該クライアントコンピュータの制御部100は、サーバーコンピュータ20にアクセスして、当該利用者に宛てられたメール(文書)が新規に発生しているか否かを判別する(ステップS11)。
【0025】
この判別結果が肯定的であるとき、制御部100は、新規に発生しているメールを文書DB221から1つ取得して、当該クラインアントコンピュータにおける記憶部123に保管する(ステップS12)。
【0026】
次に、制御部100(ベクトル算出部111)は、記憶部123に保管されている各メールのうち、新規に発生した文書については、当該文書のベクトルを新規に計算する一方、それ以外の文書については、ベクトルを再計算する(ステップS13)。ここで、新規に発生した文書のベクトルのみならず、他の文書のベクトルについても計算する理由は、新規に発生したメールを記憶部123に保管したことに伴って、当該利用者に宛てられたメールの総数が増加するため、メールの総数Nを引数とするTF・IDF値にて規定されるベクトルについても再計算する必要が生じるからである。
【0027】
ベクトルを再計算すると、制御部100は、当該計算結果を、当該メールの文書データに関連付けて記憶部123に記憶するとともに、サーバーコンピュータ20に送信する。これにより、サーバーコンピュータ20における履歴管理部212は、当該新規メールに対応して履歴データを1つ追加して、当該計算結果をベクトルの項目とする。なお、この時点では、当該メールは、未だ閲覧されていないので、最後の閲覧日時および変数Tlostは空白であるが、後述するように、実際に閲覧されると、その状況に応じてデータが埋められることになる。
【0028】
続いて、制御部100は、新規に発生したメールの重要度の指標値を算出するために、当該新規メールを、次に説明する指標値算出処理の対象文書としてセットする(ステップS14)。
そして、制御部100(重要度計算部112)は、対象文書の重要度の指標値算出処理を実行する(ステップS15)。
【0029】
この指標値算出処理は、対象文書としてセットされた文書(メール)の重要度を規定する際に用いる指標値を、算出するための処理である。そこで、この指標値算出処理の詳細について、図6を参照して説明する。
まず、制御部100(重要度計算部112)は、対象文書としてセットしたメール(ここでは、新規に発生したメール)に対応するスコアをゼロにリセットする(ステップS151)。ここで、スコアは、メール毎に対応して設定され、重要度を算出する際に用いるレジスタの一種である。
【0030】
次に、制御部100は、文書番号が「1」の文書を、対象文書と比較するための比較文書としてセットする(ステップS152)。重要度を示す指標値は、図6の下方に示されるように、対象文書とこれを含む全文書とを、それぞれ比較した値の累算によって求められるので(図6において項(1)、(2)、(3)、…、(N)の総和で示されるので)、このステップS152において、まず、対象文書と比較すべき文書を、文書番号が「1」である文書にセットするのである。
【0031】
制御部100は、対象文書としてセットされているメールのベクトルと比較文書としてセットされているベクトルを履歴DB222から取得し、両者ベクトル同士の内積を、両者メール本文の類似性を示す類似度として算出する(ステップS153)。
続いて、制御部100は、第1に、比較文書としてセットされているメールが最後に閲覧された日時を文書DB221から取得し、現時点における日時をタイマ124から取得するとともに、両者の差から、当該メールが最後に閲覧されたからの経過日時tを求め、第2に、当該メールの変数Tlostを履歴DB222から読み出し、第3に、経過日時tおよび変数Tlostを上式(a)に代入して、当該メールに対する興味の度合いI(t)を算出する(ステップS154)。
なお、比較対象のメールが未だ閲覧されていないとき、履歴データにおける当該メールのうち、最後の閲覧日時に対応する項目は空欄であるが、このような場合、制御部100は、当該メールに対する興味の度合いI(t)を便宜的にゼロとして算出する。
【0032】
さらに、制御部100は、第1に、比較文書としてセットされているメールの評価値を文書DB221から取得して、先に求めた類似度、興味の度合いI(t)、および、評価値の積を、対象文書のスコアに累算する(ステップS155)。
これによって、例えば現時点において比較文書としてセットされている文書番号が「1」であれば、求めるべき対象文書の重要度指標値のうち、右辺第1項(図6における(1)の項)が算出される。
【0033】
そして、制御部100は、現時点において比較対象となっている文書番号が最後(文書番号が最大値)であるか否かを判別する(ステップS156)。この判別結果が否定的であるとき、制御部100は、比較対象とする文書番号を「1」だけインクリメントして(ステップS157)、インクリメント後の文書番号に対応する次項について同様な処理を実行すべく、手順をステップS153に戻す。したがって、文書番号が「1」であったとき、インクリメントによって文書番号が「2」の文書が比較文書としてセットされるので、今度は、右辺第2項の値が算出されて、右辺第1項の値がセットされたスコアに累算されることになる。このような処理が繰り返されて、ステップS156の判別結果が肯定的となったとき、すべての文書についての累算和が、対象文書のスコアにセットされることになり、この累算和が、求めるべき指標値となる。
【0034】
説明を再び図5に戻すと、新規に発生したメールの重要度指標値を算出すると、制御部100(重要度計算部112)は、第1に、重要度指標値を、全メールにわたって相対的に評価して、その重要度ランクを全メール「低」、「中」または「高」のいずれかに決定し、第2に、今回決定した重要度ランクと、それまでの重要度ランクとを対にして記憶部123に記憶する(ステップS16)。なお、今回、新規に発生したメールについては、それまでの(過去の)重要度ランクが存在しないので、制御部100は、その旨が判るように記憶する。
【0035】
<要約文の再/新規作成処理>
重要度ランクが決定された新規メールについては、当該重要度ランクに応じて要約文を作成する必要がある。また、すべてのメールについて重要度ランクを決定すると、今回決定された重要度ランクと、それまでの重要度ランクとが相違するメールが存在する場合がある。
図13に示されるように、メール本文の要約文の作成条件は、重要度ランクに応じて規定されるので、新規メールについては今回決定された重要度ランクに応じて要約文を新規作成する必要が生じるし、重要度ランクが変化したメールについては、変化後の重要度ランクに応じて要約文を再作成する必要が生じる。
そこで、このような要約文作成のための処理(ステップS17)の詳細について図7を参照して説明する。
【0036】
まず、制御部100(要約文作成部113)は、文書DB221のうち、ログインした利用者に宛てられたメールのすべてを判断対象とするために、文書番号が「1」の文書を、対象文書としてセットする(ステップS171)。
次に、制御部100は、現時点においてセットされた比較文書(メール)に着目して、当該メールに対して今回決定された重要度ランクとそれまでの重要度ランクとを、記憶部123から読み出して取得する(ステップS172)。
そして、制御部100は、取得した重要度ランク同士が互いに相違するか否か(すなわち、今回決定された重要度ランクが変化したか否か)について、または、前回の重要度ランクが存在しないか否か(すなわち、比較文書が新規に発生したものであるか否か)について、判別する(ステップS173)。
【0037】
この判別結果が肯定的であるとき、制御部100は、次のようにして、対象文書の要約文を重要度ランクに応じて作成する(ステップS174)。
すなわち、制御部100は、第1に、対象文書(メール)におけるメッセージ(本文)を形態素解析して、単語列に分解し、第2に、分解した各単語につき、それぞれTF・IDF値を求め、第3に、TF・IDF値が高い単語を順番に選択して、当該メッセージの特徴語として位置付け、第4に、記憶部123に記憶された辞書を用いて、形態素解析によって抽出した単語列を簡易な表現に置換し、この際、TF・IDF値が低い単語近傍ほど、より簡易な表現に置換する、という手順を、重要度ランクに規定された字数に収まるまで繰り返し実行する、あるいは、重要度ランクが「低」であれば、TF・IDF値が高い単語だけを選択的に抜き出す。
そして、制御部100は、作成した要約文を、当該メールの文書データに関連付けて記憶部123に記憶する。
【0038】
一方、ステップS173の判別結果が否定的であれば、それまで用いていた要約文を引き続き使用できるので、要約文を再作成する必要がない。このため、制御部100は、ステップS174をスキップさせて、処理手順を直ちにステップS175に移行させる。
【0039】
そして、制御部100は、現時点において対象文書の文書番号が最後であるか否か(すなわち、すべての文書を対象文書としたか否か)について判別する(ステップS175)。この判別結果が否定的であるとき、制御部100は、対象文書の文書番号を「1」だけインクリメントして(ステップS176)、今度は、インクリメント後の文書番号に対応する文書について同様な処理を実行すべく、手順をステップS172に戻す。
一方、この判別結果が肯定的であるとき、現時点において、すべての文書について、更新後の重要度ランクに応じて、または、新規に設定した重要度ランクに応じて、要約文が用意されていることを意味するので、制御部100は、この要約文の再/新規作成処理を終了する。
要約文の再/新規作成処理を終了すると、制御部100は、ほかの新規メールに備えるために、または、今回決定された重要度ランクにしたがって再度一覧表示を実行するために、処理手順をステップS11(図5参照)に再び戻す。
【0040】
このため、制御部100は、再び、文書DB221において当該利用者に宛てられたメールのうち、自身の記憶部123に未だ保管していない新規のメールが存在しているか否かを判別する(ステップS11)。
したがって、新規のメールが存在しなくなるまで、ステップS11からS17までの処理が繰り返し実行されることになる。この結果、ステップS11における判別結果が否定的となった時点では、上記利用者に宛てられたメールのすべてに対応する文書データが文書DB221から記憶部123に複写されるとともに、図3に示される文書データの項目に加えて、すなわち、文書番号、受信日時、題目および本文に加えて、その重要度ランク、および、要約文が、メール毎に互いに関連付けられて、記憶部123に記憶されることになる。
【0041】
すべての文書(メール)に対して重要度ランクが決定されて、ステップS11における判別結果が否定的になると、制御部100は、表示部122に対し、記憶部123における記憶内容にしたがって図8に示されるようなウィンドウ型の画面130を表示させる(ステップS18)。詳細には、重要度を示す指標値が高いものから順番に、重要度ランク、題目、受信日時とともに、要約文が、メール毎に一覧表示される。
【0042】
この一覧表示の後、制御部100は、表示部122に表示させた画面130に対し、利用者が何らの操作をしたか否かを判別する(ステップS19)。この判別結果が否定的である場合、制御部100は、当該一覧表示を継続すべく、処理手順をステップS18に戻す。
また、この判別結果が肯定的である場合、制御部100は、利用者による操作内容がメールを閲覧するための選択操作であるか否か、具体的には、例えば図8に示されるように、閲覧を希望するメール表示部分にマウスポインタ132を配置させてダブルクリックした操作であるか否かを判別する(ステップS20)。利用者による操作内容が選択操作でないとき、制御部100は、さらに、該操作内容がメール管理の終了を指示する操作であるか否か、具体的には、マウスポインタ132をボタン138に配置させてシングルクリックした操作であるか否かを判別する(ステップS21)。
【0043】
制御部100は、該判別結果が肯定的である場合、画面130を閉じて、メール管理を終了する一方、該判別結果が否定的である場合、その操作内容に応じた処理(例えば、画面130の最大化や、ソートの順番変更など)した後、一覧表示を継続すべく、処理手順を再びステップS18に戻す。
したがって、文書の一覧を示す画面130が表示されると、メールの選択操作がなされるか、または、メール管理の終了を指示する操作がなされない限り、画面130による一覧表示が維持されることになる。
【0044】
一方、利用者が閲覧を希望するメールの選択操作をした場合、制御部100(履歴更新部114)は、タイマ124から取得した日時を、当該メールを閲覧した日時として、当該メールに関連付けて記憶部123に記憶させるとともに、サーバーコンピュータ20に送信する。これにより、記憶部123の記憶内容と、履歴DB222における記憶内容とが整合することになる。
さらに、制御部100は、表示部122に対し、図9に示されるように、選択操作されたメールの本文を表示するウィンドウ型の画面140を新たに表示させる(ステップS22)。
【0045】
表示画面について詳述すると、図9において画面140の領域144には、選択されたメールの受信日時および本文が表示され、また、タイトルバー141には、選択されたメールの題目が表示される。さらに、画面140には、当該メールの必要性を利用者に確認させるためのボタン146、147、148が表示される。
なお、ボタン147は、本文表示されたメールについて、現時点では特に必要ではなく、関心のないメールである旨を利用者に確認させるためのボタンであって、文書データ、履歴データから削除する旨を指示するためのボタンではない。
【0046】
次に、制御部100は、利用者が画面140に対し何らかの操作をしたか否か、詳細には、ボタン146、147、148のいずれかにマウスポインタ132を配置させてクリックした操作であるか否かを判別する(ステップS23)。
利用者が画面140に対して何ら操作をしていない場合、制御部100は、手順をステップS22に戻して、画面140の表示を継続させる。
一方、利用者が画面140に対して何らかの操作をした場合、制御部100は、選択されたメール本文を表示する画面140を閉じるとともに、当該メールの重要度を更新する際の評価値(係数)を、当該操作に応じた値にセットするために、サーバーコンピュータ20に送信する(ステップS24)。これにより、履歴DB222における評価値の項目は書き換えられることになる。
【0047】
詳細には、制御部100は、ボタン146のクリック操作に対しては、重要度を高めるべく、当該メールに対応する評価値に「+1」をセットする一方、ボタン147のクリック操作に対しては、逆に重要度を低めるべく当該メールに対応する評価値に「−1」をセットする。なお、ボタン146、147を操作することなく、ボタン148がクリック操作された場合には、利用者が必要性の確認を保留したとみなして、評価値は、初期値の「+0.5」から変更されない。
【0048】
制御部100は、本文表示したメールに対応する評価値に、利用者の必要性に応じた値をセットすると、重要度指標値をすべてのメールにわたって更新する際の興味度合いに反映させるために、次に説明する更新処理を実行し(ステップS25)、すべての文書の重要度指標値を再び算出する処理を実行する(ステップS26)。
【0049】
そこで、更新処理の詳細について図10を参照して説明する。まず、制御部100(履歴更新部114)は、すべての文書(メール)に対し、選択操作により本文表示された文書(メール)との類似性を順番に判断するために、文書番号が「1」である文書を、選択文書と比較する比較文書としてセットする(ステップS251)。
【0050】
次に、制御部100は、本文表示された文書のベクトルと、比較文書としてセットされているベクトルとを履歴DB222から取得し、両者ベクトル同士の内積を、類似度として算出する(ステップS252)。
そして、制御部100は、算出した類似度が予め設定された設定値(しきい値)より大きいか否かを判別する(ステップS253)。
【0051】
この判別結果が肯定的であるということは、選択操作されたメール本文の特徴に対して、比較文書としてのメール本文の特徴がある程度類似していることを意味する。そこで、制御部100は、比較対象としたメールの重要度指標値が、後の算出処理において高くなるようにするために、履歴DB222における履歴データのうち、比較文書としたメールに対応する変数Tlostを1段階アップさせる指示を、サーバーコンピュータ20に送信する(ステップS254)。これにより、当該メールの変数Tlostは、履歴管理部212によって、例えば初期値の「15」であれば、1段階アップの「30」にセットされる。
一方、ステップS253における判別結果が否定的であるとき、選択操作されたメール本文の特徴に対して、比較文書としたメール本文が類似していないので、比較文書としたメールにおける変数Tlostを1段階アップさせる必要がない。このため、制御部100は、ステップS253における判別結果が否定的であるとき、ステップS254をスキップさせる。
【0052】
そして、制御部100は、現時点において比較文書の文書番号が最後であるか否か(すなわち、すべての文書と比較したか否か)について判別する(ステップS255)。この判別結果が否定的であるとき、制御部100は、比較文書の文書番号を「1」だけインクリメントして(ステップS256)、今度は、インクリメント後の文書番号に対応する文書との類似性を判断すべく、手順をステップS252に戻す。
一方、この判別結果が肯定的であるとき、選択操作により本文表示された文書との類似性が、すべての文書に対して判断されたことを意味するので、制御部100は、この更新処理を終了する。この後、図5のステップS26において、次に説明する各文書の重要度指標値の算出処理が実行される。
【0053】
そこで、ステップS26における各文書の重要度指標値の算出処理について図11を参照して説明する。
まず、制御部100(重要度計算部112)は、重要度指標値をメール毎に順番に算出するために、文書番号が「1」である文書を、指標値を算出する対象の文書としてセットする(ステップS261)。
次に、制御部100は、対象文書の重要度指標値を、先に述べた同一の手順で算出する(ステップS15、図6参照)。すなわち、制御部100は、対象文書との類似度、興味度合いおよび評価値の積を文書毎に累算した総和を、対象文書の重要度指標値として算出する。
【0054】
そして、制御部100は、現時点における対象文書の文書番号が最後であるか否か(すなわち、すべての文書について重要度指標値を算出したか否か)について判別する(ステップS262)。この判別結果が否定的であるとき、制御部100は、文書番号を「1」だけインクリメントして(ステップS263)、手順をステップS15に戻す。これにより、今度は、インクリメント後の文書番号に対応する文書を対象として重要度指標値の算出処理が実行されることになる。
一方、この判別結果が肯定的であるとき、すべての文書について、重要度指標値が算出されたことになるので、制御部100は、この各文書の重要度指標値の算出処理を終了する。
なお、今回のステップS26の指標値算出処理と、メールが新規に発生したときのステップ15の指標値算出処理とは、前者が全メールの重要度指標値を順番に算出する処理であるのに対して、後者が新規メールの重要度指標値だけを算出する処理である点において相違する。
【0055】
ステップS26における各文書の重要度指標値の算出処理を終了すると、制御部100は、処理手順を、上述したステップS16に移行させて、今回算出した指標値にしたがって重要度ランクを決定した後、この重要度ランクにしたがって要約文がステップ17において再作成されることになる。
したがって、メールの一覧表示の際に、利用者によって一のメールが選択されて、そのメールの本文が表示されると、そのメールについては、ボタン146、147、148のクリック操作に応じて重要度を示す指標が更新される一方、他のメールについては、▲1▼最後に閲覧した時からの経過日時と利用者にとって関心時とを考慮した興味の度合い、▲2▼過去に本文表示されたときになされたボタン146、147、148のクリック操作、および、▲3▼選択されたメールとの類似性、のそれぞれが考慮されて重要度を示す指標が更新されて、更新された指標にしたがって各メールの重要度が再度ランク付けされるともに、その重要度ランクに応じた要約文等とともに、メールが一覧表示されることになる。
【0056】
このように実施形態においては、過去において関心が高くても、その後、関心が低くなって閲覧されなくなった文書(メール)や、最近、閲覧される文書内容に類似しない文書などについては、重要度が低められて一覧表示される一方、過去において関心が低く、最近になって閲覧されない文書であっても、当該文書内容に類似する文書の閲覧回数が多くなれば、重要度が高められて一覧表示されるので、利用者にとってみれば、現時点において、関心があったり重要であったりする文書を、効率良く容易に探し出すことが可能となる。
【0057】
また、実施形態にあっては、新規に発生した文書(メール)については利用者が閲覧しなくても、それを受け取った時点において、その重要度が、過去において閲覧された文書の性質(閲覧した文書との類似性、閲覧日時、評価値)に応じて算出される。このため、新規に発生する文書の頻度が多数あるために、利用者が新規文書を逐一チェックできない場合であっても、新規文書の重要度が利用者に提示されるので、利用者にとって、関心のある(重要である)文書を、より効率良く見つけだすことが可能となる。
【0058】
なお、本実施形態にあっては、電子メールシステムに適用して、メール本文を文書として管理する例を説明したが、これに限られないのはもちろんである。例えば、携帯電話やPDA(Personal Digital Assistants)などの機器において配信されるニュースやメールマガジンなどの情報を管理しても良い。
また、実施形態にあっては、処理負担を分散する観点から一部機能をサーバーコンピュータ20に負担させたが、メール等のデータを配信する機能だけをサーバーコンピュータ20に負担させ、他の機能についてはクライアントコンピュータ10に負担させても良いし、逆に、表示や必要性の選択だけの機能をクライアントコンピュータ10に負担させて、他の機能については、すべてサーバーコンピュータ20に負担させても良い。
さらに、実施形態においては、重要度ランクについて、全メールにおける重要度を示す指標値の相対評価によって決定したが、当該指標値を正規化して、その絶対評価によって決定しても良いのはもちろんである。
【0059】
【発明の効果】
以上説明したように本発明によれば、利用者にとって、その時点において関心(重要)のある文書を効率良く見つけだすことが可能となる。
【図面の簡単な説明】
【図1】 本発明の実施形態に係る文書管理装置を具体化した電子メールシステムの構成を示す図である。
【図2】 同電子メールシステムの機能構成を示すブロック図である。
【図3】 同電子メールシステムにおける文書データの構成を示す図である。
【図4】 同電子メールシステムにおける履歴データの構成を示す図である。
【図5】 同電子メールシステムにおけるメール管理の動作を説明するためのフローチャートである。
【図6】 同メール管理における対象文書の重要度の指標値算出処理を説明するためのフローチャートである。
【図7】 同メール管理における要約文の再/新規作成処理を説明するためのフローチャートである。
【図8】 同電子メールシステムにおける表示画面の一例を示す図である。
【図9】 同電子メールシステムにおける表示画面の一例を示す図である。
【図10】 同メール管理における更新処理を説明するためのフローチャートである。
【図11】 同メール管理における各文書の重要度の指標値算出処理を説明するためのフローチャートである。
【図12】 興味の度合いを示す関数の特性を示す図である。
【図13】 同電子メールシステムにおける重要度ランクと要約文の字数との対応関係を示す図である。
【符号の説明】
10−1、10−2、10−3…クライアントコンピュータ
20…サーバーコンピュータ
30…ネットワーク
100…制御部
111…ベクトル算出部
112…重要度計算部
113…要約文作成部
114…履歴更新部
122…表示部
123…記憶部
Claims (3)
- 文書を、その文書の重要度を示す指標とともに関連付けて記憶する記憶手段と、
記憶された文書のなかから、利用者によって一の文書を閲覧する旨の指示があったとき、当該文書の重要度が高くなるように、当該文書に関連付けられた指標を更新する一方、他の文書については、放置された時間に応じて、その重要度が低くなるように、当該他の文書に関連付けられた指標を更新する更新手段と、を備え、
前記重要度を示す指標は、前記記憶された文書のすべての文書iについて類似度i×興味度合i×評価値iを累算することによって算出され、
前記類似度iは、一の文書ベクトルと文書iのベクトルについて、両者ベクトル同士の内積を算出して得た値とし、
前記興味度合iは、文書iの閲覧からの放置された時間をt、文書iの履歴回数で変化する変数をTlostとした場合、以下の数式による関数I(t)として算出して得た値とし、
I(t)=1−(t/Tlost)3
前記評価値iは、利用者が文書iについての関心度を示す値であって、閲覧したときの利用者の操作状況に応じて、「+0.5」、「+1.0」または「−1.0」のいずれかにセットされる係数とする
ことを特徴とする文書管理装置。 - コンピュータを文書管理装置として機能させる文書管理プログラムであって、
文書を、その文書の重要度を示す指標とともに関連付けて記憶する第1過程、および、記憶された文書のなかから、利用者によって一の文書を閲覧する旨の指示があったとき、当該文書の重要度が高くなるように、当該文書に関連付けられた指標を更新する一方、他の文書については、放置された時間に応じて、その重要度が低くなるように、当該他の文書に関連付けられた指標を更新する第2過程を備え、
前記重要度を示す指標は、前記記憶された文書のすべての文書iについて類似度i×興味度合i×評価値iを累算することによって算出され、
前記類似度iは、一の文書ベクトルと文書iのベクトルについて、両者ベクトル同士の内積を算出して得た値とし、
前記興味度合iは、文書iの閲覧からの放置された時間をt、文書iの履歴回数で変化する変数をTlostとした場合、以下の数式による関数I(t)として算出して得た値とし、
I(t)=1−(t/Tlost)3
前記評価値iは、利用者が文書iについての関心度を示す値であって、閲覧したときの利用者の操作状況に応じて、「+0.5」、「+1.0」または「−1.0」のいずれかにセットされる係数とする
ことを特徴とする文書管理プログラム。 - コンピュータを文書管理装置として機能させる文書管理プログラムを記録した記録媒体であって、
文書を、その文書の重要度を示す指標とともに関連付けて記憶する第1過程、および、記憶された文書のなかから、利用者によって一の文書を閲覧する旨の指示があったとき、当該文書の重要度が高くなるように、当該文書に関連付けられた指標を更新する一方、他の文書については、放置された時間に応じて、その重要度が低くなるように、当該他の文書に関連付けられた指標を更新する第2過程を備え、
前記重要度を示す指標は、前記記憶された文書のすべての文書iについて類似度i×興味度合i×評価値iを累算することによって算出され、
前記類似度iは、一の文書ベクトルと文書iのベクトルについて、両者ベクトル同士の内積を算出して得た値とし、
前記興味度合iは、文書iの閲覧からの放置された時間をt、文書iの履歴回数で変化する変数をTlostとした場合、以下の数式による関数I(t)として算出して得た値とし、
I(t)=1−(t/Tlost)3
前記評価値iは、利用者が文書iについての関心度を示す値であって、閲覧したときの利用者の操作状況に応じて、「+0.5」、「+1.0」または「−1.0」のいずれかにセットされる係数とする
ことを特徴とする記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002070479A JP4151288B2 (ja) | 2002-03-14 | 2002-03-14 | 文書管理装置、文書管理プログラムおよび記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002070479A JP4151288B2 (ja) | 2002-03-14 | 2002-03-14 | 文書管理装置、文書管理プログラムおよび記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003271653A JP2003271653A (ja) | 2003-09-26 |
JP2003271653A5 JP2003271653A5 (ja) | 2005-06-30 |
JP4151288B2 true JP4151288B2 (ja) | 2008-09-17 |
Family
ID=29201038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002070479A Expired - Fee Related JP4151288B2 (ja) | 2002-03-14 | 2002-03-14 | 文書管理装置、文書管理プログラムおよび記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4151288B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4367355B2 (ja) | 2005-02-24 | 2009-11-18 | セイコーエプソン株式会社 | 写真画像検索装置、写真画像検索方法、記録媒体、およびプログラム |
JP4908094B2 (ja) | 2005-09-30 | 2012-04-04 | 株式会社リコー | 情報処理システム、情報処理方法及び情報処理プログラム |
JP5389409B2 (ja) * | 2008-09-29 | 2014-01-15 | 京セラ株式会社 | メール受信装置 |
US11269964B2 (en) * | 2017-07-24 | 2022-03-08 | Mycelebs Co., Ltd. | Field-of-interest based preference search guidance system |
-
2002
- 2002-03-14 JP JP2002070479A patent/JP4151288B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003271653A (ja) | 2003-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7085761B2 (en) | Program for changing search results rank, recording medium for recording such a program, and content search processing method | |
JP5224868B2 (ja) | 情報推薦装置および情報推薦方法 | |
KR100999267B1 (ko) | 관리 서버들에 의해 업데이트된 온-디바이스 애플리케이션 카탈로그 | |
EP2210167B1 (en) | Method and devices for dynamically updating a virtual list view | |
US7599918B2 (en) | Dynamic search with implicit user intention mining | |
WO2006031730A1 (en) | Modifying an on-line dating search using inline editing | |
KR20130014581A (ko) | 관심사항 클라우드에 포함된 관심사항 태그에 기초한 콘텐츠 선택 | |
US10733211B2 (en) | Optimizing faceted classification through facet range identification | |
WO2008141583A1 (fr) | Procédé d'entrée de caractères, système d'entrée et procédé pour mettre à jour un lexique de mots | |
JP6390139B2 (ja) | 文書検索装置、文書検索方法、プログラム、及び、文書検索システム | |
US8560496B2 (en) | Database query across processes with change notification | |
US20140164920A1 (en) | Information-selection assist system, information-selection assist method and program | |
JP4151288B2 (ja) | 文書管理装置、文書管理プログラムおよび記録媒体 | |
JP2012178026A (ja) | 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 | |
JP3645431B2 (ja) | 情報検索支援装置および情報検索支援プログラム記憶媒体 | |
EP3675085A1 (en) | Information processing device, information processing method, and program | |
US11726639B2 (en) | Stowing and unstowing browser tabs in groups each corresponding to a different subject | |
JP4445849B2 (ja) | ファイル検索方法、ファイル検索装置、および、ファイル検索プログラム | |
CN113805864A (zh) | 一种项目工程的生成方法、装置、电子设备及存储介质 | |
CN113239278A (zh) | 信息展示方法、装置、电子设备以及存储介质 | |
WO2022163142A1 (ja) | 情報処理装置 | |
KR102351264B1 (ko) | 사용자 맞춤형 신간 도서 정보의 제공 방법 및 그 시스템 | |
JP5416054B2 (ja) | コンテンツ設定装置、コンテンツ設定方法 | |
JP2004013213A (ja) | 論理ディレクトリー構成方法、論理ツリー表示方法、論理ツリー表示条件設定方法及び情報処理装置 | |
JP6436936B2 (ja) | 情報処理装置、情報処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041020 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080325 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080424 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080610 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080623 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110711 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110711 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120711 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |