JP2010160723A - データ価値判定システム、データ価値判定方法およびデータ価値判定用プログラム - Google Patents

データ価値判定システム、データ価値判定方法およびデータ価値判定用プログラム Download PDF

Info

Publication number
JP2010160723A
JP2010160723A JP2009003376A JP2009003376A JP2010160723A JP 2010160723 A JP2010160723 A JP 2010160723A JP 2009003376 A JP2009003376 A JP 2009003376A JP 2009003376 A JP2009003376 A JP 2009003376A JP 2010160723 A JP2010160723 A JP 2010160723A
Authority
JP
Japan
Prior art keywords
data
value determination
content
importance
content data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2009003376A
Other languages
English (en)
Inventor
Shigeaki Matsumoto
繁明 松元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009003376A priority Critical patent/JP2010160723A/ja
Publication of JP2010160723A publication Critical patent/JP2010160723A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザによるコンテンツデータの選択操作に基づく、コンテンツの重要度を算出処理可能とするデータ価値判定システムを提供する。
【解決手段】データ価値判定システムを、コンテンツデータの価値の判定に用いるイベントを取得するイベント取得手段と、イベント取得手段から取得したイベントに基づいて、コンテンツデータの重要度の算定に要する重み付け要素を出力する価値判定手段と、コンテンツデータを取得可能にするデータ取得手段と、価値判定手段から出力された重み付け要素に基づいて、データ取得手段で取得したコンテンツデータの重要度を演算処理するスコア演算手段とを備え、価値判定手段は、ユーザによるコンテンツデータの選択操作順に基づき、重要度の比較対象となるコンテンツデータ群の中での個々のコンテンツデータに対するユーザの重み付け要素を出力する操作演算手段を含むように構成した。
【選択図】図1

Description

本発明は、コンテンツに重要度を付する情報処理システムに関し、特に、ユーザの価値観に基づくデータ価値判定システム、データ価値判定方法および データ価値判定用プログラムに関する。
昨今、多くの情報処理システムにおいて、管理するコンテンツ量が増大している。
多くの情報処理システムでは、管理するコンテンツの活用や処理量の低減などのため、コンテンツに重要度を付することが望まれている。
コンテンツに重要度を付する情報処理システムとしては、例えば、特許文献1ないし特許文献3に記載されている。
特許文献1の「メッセージング・システムにおいてメッセージのユーザ固有の関連性スコアを決定するための方法およびシステム」は、サーバにおける監視手段と、クライアントにおける監視手段とから構成されている。
このような構成を有する従来のスコア算出システムはつぎのように動作する。すなわち、メッセージ間の相関関係と、ユーザによるメッセージの応答、転送、削除などのアクションと、事前にユーザが与えた条件(送信者もしくはコンテンツ)と、からスコアを算出する。
特許文献2の「電子メールオーガナイザー」では、構文解析手段を設け、メール本文中の期日とアクションを結びつけ、アクションの重要度、送信者、期日の3つを考慮して、電子メールのスコアを算出している。
特許文献3には、電子メールの受信手段と、受信した電子メールの重要度を機械的・確立的(人間の主観を勘案せず)に判定する重要度判定部と、閾値を用いて前記重要度判定部の出力結果を調整する重要度学習部(スコア調節手段)を備え、個々の電子メールの重要度を推定する電子メール送受信システムが記載されている。また、前記重要度学習部(スコア調節手段)は、開封済み電子メールの場合に着信通知日時から開封日時までの経過時間を用い、未開封メールの場合に着信通知日時から現在の日時までの経過時間を用い、閾値の時間と比較して、重要度の上げ下げを行なうことが記載されている。
特開2007−102788号公報 特開2007−149094号公報 特開2004−259294号公報
しかしながら、特許文献1ないし3に記載されたデータ価値判定システムでは、ユーザの価値観による重み付けが不十分である。
例えば、特許文献1では、サーバの監視コンポーネントも必要となることから、クライアント側システムだけでユーザのメッセージに対する価値観を判定することができない。 また、特許文献2では、メール本文中の期日と現在日時に着目して、メールの重要度を修正するものの、期日の書かれていないメールについてスコアが0となり、ユーザにとって重要度の高いメールが正しくスコアづけされないことである。また、ユーザの価値観による重み付けが成されていない。
また、特許文献3では、メールの受信時刻と現在時刻等から重要度を割当てるのみで、ユーザの価値観による重み付けが成されていない。
即ち、特許文献1ないし特許文献3の共通の課題は、ユーザが設定した重要なキーワードや送信者に対して、スコアに反映する仕組みが述べられているが、ユーザにとって重要なキーワードや送信者は時間とともに変化するため、再登録を必要とし、次第に利用されなくなってしまうことである。また、時間経過と共に変化する重要なキーワードや送信者を、ユーザ毎に異なる価値観に基づいて何ら考慮することができない。
本発明は、上記課題に鑑みて成されたものであり、ユーザによるコンテンツデータの選択操作に基づく、コンテンツの重要度を算出処理可能とするデータ価値判定システムを提供することを目的とする。
本発明のデータ価値判定システムは、コンテンツデータの価値の判定に用いるイベントを取得するイベント取得手段と、前記イベント取得手段から取得したイベントに基づいて、前記コンテンツデータの重要度の算定に要する重み付け要素を出力する価値判定手段と、前記コンテンツデータを取得可能にするデータ取得手段と、前記価値判定手段から出力された重み付け要素に基づいて、前記データ取得手段で取得したコンテンツデータの重要度を演算処理するスコア演算手段とを備え、前記価値判定手段は、ユーザによるコンテンツデータの選択操作順に基づき、重要度の比較対象となるコンテンツデータ群の中での個々のコンテンツデータに対する前記ユーザの重み付け要素を出力する操作演算手段を含むことを特徴とする。
本発明によれば、ユーザによるコンテンツデータの選択操作に基づく、コンテンツの重要度を算出処理可能とするデータ価値判定システムを提供できる。
第1の実施の一形態の価値判定システムの構成を示す機能ブロック図である。 第1の実施の一形態のイベント取得手段の構成を示す機能ブロック図である。 第1の実施の一形態の価値判定手段の構成を示す機能ブロック図である。 第1の実施の一形態の操作演算手段の構成を示す機能ブロック図である。 第1の実施の一形態のスコア算出手段の構成を示す機能ブロック図である。 メール構造分析の動作を示すフローチャートである。 ユーザ閲覧行為の重要度を計算するフローチャートである。 ユーザ検索行為に伴う重要度を計算するフローチャートである。 最終重要度の計算動作を示すフローチャートである。 ユーザ閲覧行為、検索行為の状態遷移を示すフローチャートである。 第2の実施の一形態の価値判定システムの構成を示す機能ブロック図である。 第2の実施の一形態のRSS更新イベント受信手段の構成を示す機能ブロック図である。 第2の実施の一形態のページ価値判定手段の構成を示す機能ブロック図である。 第2の実施の一形態のページ操作演算手段の構成を示す機能ブロック図である。 第2の実施の一形態のRSS更新イベント受信手段のIDを計算するフローチャートである。 第2の実施の一形態のページ操作演算手段の計算を示すフローチャートである。 第2の実施の一形態のユーザ閲覧行為、検索行為の状態遷移を示すフローチャートである。 第1の実施の一形態の価値判定システムの動作の具体例(初日)を示す説明図である。 第1の実施の一形態の価値判定システムの動作の具体例(1日経過後)を示す説明図である。 第1の実施の一形態の価値判定システムの動作の具体例(2日経過後)を示す説明図である。 第2の実施の一形態の価値判定システムの動作の具体例を示す説明図である。 実施の一形態の情報処理システムを例示するブロック図である。
本発明の実施の形態を図1ないし図22に基づいて説明する。
図1は、第1の実施の一形態の価値判定システムの構成を示す機能ブロック図である。図1を参照すると、本発明の第1の実施の形態は、情報処理装置においてプログラム制御により動作して、コンテンツデータの価値の判定に用いるイベントを取得するイベント取得手段100と、価値判定手段200と、コンテンツデータを取得可能するデータ格納手段300と、コンテンツデータの重要度を演算処理するスコア算出手段400とから構成されている。
図2は、イベント取得手段100の構成を示す機能ブロック図である。イベント取得手段100は、アダプタ手段101とフィルタ手段102とを含む。
これらの手段はそれぞれ概略つぎのように動作する。
アダプタ手段101は、コンテンツを管理する既存のデータ管理サーバもしくはデータ管理クライアントに接続し、データ受信完了やデータ選択など、コンテンツの管理する上で発生したイベントを取り出す。
フィルタ手段102は、前記コンテンツの管理する上で発生したイベントから、コンテンツの重要度判定に必要なイベントのみを抽出し、イベントと当該イベントの発生に付随する情報(例えば、コンテンツのIDや同時的に取得するIDリスト、コンテンツの実データ等)を、価値判定手段200へ受け渡す。
図3は、価値判定手段200の構成を示す機能ブロック図である。価値判定手段200は、データ量演算手段210と、日付判定手段220と、操作演算手段230と、忘却演算手段240とを含む。
これらの手段はそれぞれ概略つぎのように動作する。
データ量演算手段210は、イベントとID等を受け取り、データ格納手段300からIDに対応する本文等の情報を取得し、付随するファイルデータの有無や過去のコンテンツデータとの関連性の有無を判定する。その後、データ量演算手段210は、判定した結果をスコア算出手段400へ受け渡す。即ち、データ量演算手段210では、コンテンツの情報量に基づく重要度判定の加算要素(データ量演算係数α)を算出する。
日付判定手段220は、イベントとID等を受け取り、データ格納手段300からIDに対応する本文等の情報を取得し、本文の中などに、日時に関する情報(日付や何日後、来週など)が存在するか確認し、存在すれば当該情報に基づくコンテンツの重要度が最大と成る時点を算定して、減算要素としてスコア算出手段400へ受け渡す。
操作演算手段230は、イベントとID等を受け取り、ユーザのコンテンツに対する選択操作順(閲覧順序など)に基づき個々のIDに対するスコア要素を割り当て、スコア算出手段400へ受け渡す。即ち、操作演算手段230では、コンテンツへのインタラクションに基づく重要度判定の要素を算出する。
ユーザによるコンテンツへのインタラクションは、ユーザ個々のコンテンツに対する価値観が表れる。具体的には、インタラクションがユーザ個々の優先処理順や嗜好順に表れる。
忘却演算手段240は、イベントとID等を受け取り、例えば閲覧したIDの受信時刻と現在時刻から、ユーザごとの記憶力差を反映して忘却係数(係数λ)を算出し、個々のコンテンツデータの重要度が最大と成る時点からの経過時間又は到達時間に基づく忘却演算関数(関数β)を設定する。また、忘却演算手段240は、IDとスコアのリスト等を受け取り、忘却演算関数に基づくスコアの減算要素をスコア算出手段400に出力する。
図4は、操作演算手段230の構成を示す機能ブロック図である。操作演算手段230は、状態管理手段231と、状態記憶手段232と、IDリスト記憶手段233とを含む。
状態管理手段231は、フィルタ手段102から取得したイベントに応じて、内部状態を変化させ、ユーザの選択操作順時の処理選択を決定する。
状態記憶手段232は、状態管理手段231によって変化される内部状態を記憶保持する記憶手段である。IDリスト記憶手段233は、重要度の算出対照であるコンテンツが記録されたIDリストを記憶保持する記憶手段である。
データ格納手段300は、データ(コンテンツ)を一意に識別するIDとデータの内容が格納されており、IDをキーにして内容を返却するように動作する。尚、コンテンツデータを取得可能とできれば、どのような手段でも良い。
図5は、スコア算出手段400の構成を示す機能ブロック図である。スコア算出手段400は、トータルスコア演算手段401と、スコア関連情報格納手段402とを含む。
これらの手段はそれぞれ概略つぎのように動作する。
トータルスコア演算手段401は、価値判定手段200から、重要度判定に用いる要素(データ量演算係数αや忘却演算関数βなど)を受け取り、IDに対するスコアを演算処理し、スコア関連情報格納手段402に各パラメータと演算結果を格納する。
次に、図1から図5まで、図6から図10のフローチャートを参照して本実施の形態の価値判定システムの全体の動作について説明する。
以下の動作説明では、動作を明瞭に説明するため一例として、扱うデータ(コンテンツ)の種類を電子メールデータとする。
図6は、メール構造分析の動作を示すフローチャートである。まず、イベント取得手段100のアダプタ手段101とフィルタ手段102によって、新規データが受信されたタイミングで、新規データのリスト(同時的に受信したメールのIDリスト)を受け取る。アダプタ手段101は、ターゲットシステム(例えばクライアント用メールソフトや、IMAPサーバ)に準備された例えばON_EVENTというフック関数を用いて、新規メールの到着イベントを選択し(ステップS101)、そのイベントに関連する情報(本文データ等)を取り出す(ステップS102)。関連する情報には、メールを一意に識別するIDもしくはIDのリストが含まれる。また、IDに関連づいたデータには、Message-ID、Subject(タイトル:件名)、本文が記載されている。
データ量演算手段210は、本文がuuencode形式、base64形式、BinHex形式などのフォーマットで添付ファイル(付随データ)が含まれているかどうかを判定し、その判定結果(0もしくは1)をIDとともにスコア算出手段400に受け渡す(ステップS201)。
スコア算出手段400は、IDと各種判定結果をスコア関連情報手段402にテーブル情報として格納する(ステップS202)。
次に、メールの返信関係をIn-Reply-To, Referencesなどから同じ話題のメールをグルーピングし、単語数で比較する(ステップS203)。
最新のメールと過去の関連メールで単語数が増加していれば、最新のメールは過去の関連メールの本文を含んでいると判断する(ステップS204)。これは、受信した電子メールに過去のメールが包含しているか、即ち、過去の電子メールとの関連性の有無を判定する。
スコア算出手段400は、添付ファイルの判定結果(ステップS201参照)と、過去の本文を含むかどうかの判定結果を、データ量演算係数α(重要度の加算要素)として、スコア関連情報格納手段402に記録する(ステップS205)。
このとき、データ量演算係数αの値は次のルールで設定を行う。
・ 添付ファイル有り、かつ過去の本文含む →4
・ 添付ファイル有り、かつ過去の本文含まず →3
・ 添付ファイルなし、かつ過去の本文含む →2
・ 添付ファイルなし、かつ過去の本文含まず →1
次に日付判定手段220は、本文等の文字列をパターンマッチングし、日付に関する情報の有無を判定する(ステップS206)。
パターンマッチングは、例えば、本文の文字列を上の行から順番に正規表現で行う。
マッチした場合には現在の日付と比較し、マッチした日付が将来であれば、忘却と関係が薄いと判断し、”予定”として記入する(S207)。尚、マッチした日付が、電子メールの重要度が最大と成る時点とみなせる。
日付判定手段220には、例えば下記の正規表現が格納されており、パターンマッチングに用いる。
・YYYY/MM/DDの正規表現として、以下を利用する。
\b((19|[2-9][0-9])[0-9]{2})/(0[1-9]|1[0-2])/(0[1-9]|[12][0-9]|3[01])\b
・YYYY/M/Dの正規表現として、以下を利用する。
\b([1-9][0-9]*)/([1-9]|1[0-2])/([1-9]|[12][0-9]|3[01])\b
・和暦の正規表現として、以下を利用する。
\b(昭和|平成|大正|明治)(元|[2-9]|[1-9][0-9])年([1-9]|[1][0-2])月([1-9][12][0-9]|3[01])日\b
・別の和暦の正規表現として、以下を利用する。
\b([1-9][0-9]*)年([1-9]|[1][0-2])月([1-9][12][0-9]|3[01])日\b
・英語表記の正規表現として、以下を利用する。
\b(0[1-9]|[12][0-9]|3[01])-(Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)-[0-9]{2}\b
・別の英語表記の正規表現として、以下を利用する。
\b(Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec) ((0[1-9]|[12][0-9]|3[01]),(19|[2-9][0-9])[0-9]{2}\b
・別の英語表記の正規表現として、以下を利用する。
\b((0[1-9]|[12][0-9]|3[01])-(Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec)-(19|[2-9][0-9])[0-9]{2}\b
・別の英語表記の正規表現として、以下を利用する。
\b((0[1-9]|[12][0-9]|3[01]) (Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec) (19|[2-9][0-9])[0-9]{2}\b
尚、他の日付に関する情報の有無の判定用に、例えば、何日後や来週、明日などの用語を登録しても良い。
次に操作演算手段230の動作について、図7、図8、図10を用いて説明する。
操作演算手段230は、受信したイベントに応じて、内部状態を変化させ、ユーザの操作順(閲覧順)から重要度を決定する。まず、状態記憶手段232は"ready"状態である。内部状態は、"ready","received","selected"で表す。
ここで、メール受信後に閲覧した場合のスコア(重み付け要素)の算出方法と、メール検索後に閲覧した場合のスコア(重み付け要素)の算出方法について説明する。
[メール受信後のスコア算出]
図7は、操作演算手段230におけるユーザ閲覧行為の重要度を計算するフローチャートである。
図10(a)は、ユーザ閲覧行為の状態遷移を示すフローチャートである。
受信イベント(図中receive)が発生すると、状態管理手段231は、状態記憶手段232から内部状態を取得すると共に、新たな内部状態に書換え、"received"状態へ遷移し、メールのIDリストを受け取り、IDリスト記憶手段233に格納する(ステップS301)。
続いて、ユーザによるメール選択イベント(図中select)が発生すると、状態管理手段231は"selected"状態へ遷移し、IDリスト記憶手段233に記憶されているメールIDリストに、ユーザによって選択されたメールのIDが含まれているかどうか照合する(ステップS302)。
メールのIDが含まれている場合、メールIDリスト中で何番目に閲覧されたかIDリスト記憶手段233に記録し、次の計算式(1)で得られた値をスコア算出手段400にユーザの選択操作による重み付け要素として送付する(ステップS303)。
受信後の閲覧スコア = (受信したメール数 - 閲覧した順番+1) / 受信したメール数・・・(1)
引き続きユーザがメールを閲覧した場合、状態管理手段231は"selected"状態のまま、同様な仕組みで照合し、メールの閲覧スコアを算出する。尚、すでにスコアが与えられている場合は再度算出しない。
内部状態が"selected"状態で、受信したメールをユーザが全て閲覧されると、状態管理手段231は"ready"状態に戻る。また、"selected"状態で、受信イベントを受け取ると、ステップS301の処理によって、状態記憶手段232は"received"状態に遷移し、メールのIDリストをIDリスト記憶手段233に格納する。
[メール検索後のスコア算出]
図8は、ユーザ検索行為に伴う重要度を計算するフローチャートである。
図10(b)は、ユーザ検索行為の状態遷移を示すフローチャートである。
検索イベント(図中search)が発生すると、状態管理手段231は、状態記憶手段232から内部状態を取得すると共に、新たな内部状態に書換え、"searched"状態へ遷移し、メールのIDリストを受け取り、IDリスト記憶手段233に格納する(ステップS401)。
続いて、ユーザによるメール選択イベント(図中select)が発生すると、状態管理手段231は"selected"状態へ遷移し、IDリスト記憶手段233に記憶されているメールIDリストに、ユーザによって選択されたメールのIDが含まれているかどうか照合する(ステップS402)。
メールのIDが含まれている場合、メールIDリスト中で何番目に閲覧されたかIDリスト記憶手段233に記録し(ステップS403)、次の計算式(2)で得られた値をスコア算出手段400にユーザの選択操作による重み付け要素として送付する。
検索時の閲覧スコア = (列挙されたメール数 - 閲覧した順番+1) / 列挙されたメール数・・・(2)
引き続きユーザがメールを閲覧した場合、状態管理手段231は"selected"状態のまま、同様な仕組みで照合し、メールの閲覧スコアを算出する。尚、すでにスコアが与えられている場合は再度算出しない。
また、閲覧されたメールの参照関係(引用関係:リターンメールなど)があるものをグループ化し、同じグループ内で後者に選択されたメールのスコアを、前者のスコアで置き換えるようにする。これは、ユーザによる検索操作時には、重要なメール(目的のメール)が同じグループ内で最後に選択されることを見越した処理である。換言すれば、ユーザはメールの検索時に重要なメール(目的のメール)を選択した時点で、同じグループ内の他のメールの選択処理を行わなくなるので、後者に選択されてスコアが低くなってしまうメールに、そのグループ内でスコアが高いメールのスコアを反映させることによって、重要度の適正度を高める。即ち、当該処理によって、同じ話題(同一グループ)で最後に選択処理されたメールのスコアを大きくなるように処理し、ある話題にそった検索後のメール閲覧操作による、検索の目的を満たす情報が記載された所望メールが最後に選択されることをスコアに反映する。
内部状態が"selected"状態で、ユーザによる検索ウィンドウを閉じるなどのメール選択の終了イベント(図中close)が発生すると、状態管理手段231は"ready"状態に戻る。
また、"selected"状態で、検索ウィンドウの"search"イベントを受け取ると、ステップS401の処理によって、状態記憶手段232は"searched"状態に遷移し、メールのIDリストをIDリスト記憶手段233に格納する。
心理学者のヘルマン・エビングハウスによれば、人間の記憶は指数関数的に減少するということが指摘されている。また、人間の記憶力は個人差があることも良く知られている。
本発明におけるデータ価値判定においても、利用されないデータは記憶の減少と同様に、指数関数的に価値が減少するものとして処理する。そこで本発明は、データの価値を人間の記憶モデルに当てはめ、データ検索操作から得られる情報に基づき、個人差も加味した記憶力モデルを生成し、これをコンテンツのデータ価値に反映する処理を行う。
過去のデータを利用する際には、何日前に受け取って、どこに格納したか記憶している状態でデータを探す”記憶限界内のデータ再利用”がある。また、”記憶限界を超えたデータ再利用”を支援するために、コンピュータ上のデータを横断的に検索する仕組みも、一般的に普及している。
そこで、個人差がある記憶力を適切にモデル化するために、ユーザのコンテンツ検索時の操作順を取得して、個々のユーザの記憶力をモデル化する。即ち、検索した結果のうち、どのデータが必要なものだったのか、必要なデータが何日前に受信されたものだったかを個人ごとに把握して、記憶限界の境界を明らかにする。
本実施の一形態では、図8のS502に示すように、コンテンツの検索後に、個々のユーザによるデータを閲覧した順序から、記憶限界の境界に関わりをもつ係数λを算出処理する。このλは、検索後に得られたデータ閲覧数、各データの受信日、データ検索日から算出処理される。図10(B)では、"selected"状態への遷移回数が、データ閲覧数に対応する。ここで、記憶の減少を示すために、λは1.0を最大値とした減少率を用いる。すなわち、記憶限界内のデータ価値は減少しないものとする。
指数関数には様々な候補があるが、例えばe = 2.7182818を利用した指数関数を採用する。 記憶限界を超えた場合に、採用した指数関数eとλでデータ価値の"最終スコア"が減少する。
次に、忘却演算手段240の動作について説明する。
図9は、最終重要度の計算動作を示すフローチャートである。
忘却演算手段240は、ステップS206処理によって日付判定手段220が抽出した"予定"を参照し(ステップS501)、何も設定されていない場合に、次の計算式(3)で得られた値を"忘却演算関数β"に設定する(ステップS503)。
β=e^-λt・・・(3)
ここで、tは現時点の日時からメールの受信日時の差分である。また、λはユーザの検索、閲覧作業の習慣から毎回次の計算式(4)で算出する(ステップS502)。
λ=閲覧件数/Σ(検索日-受信日)・・・(4)
とする。
ここで、閲覧作業の習慣とは、図10(b)における、readyから始まりready状態へ戻ってくるまでに必要となるユーザの作業を指す。当該閲覧の習慣には、ユーザ個々の記憶力の差が出る。
"予定"が設定されている場合には、βの値を1.0に設定する(ステップS504)。これは、予定であれば、記憶から減算される確率が小さくなるため、1.0と近似しても良いためである。
スコア算出手段400は、ID、各種係数・関数、スコア、スコア関連情報等の各種計算要素を受け取り、次の計算式(5)で得られたIDに対する値を最終スコアとして、スコア関連情報格納手段402に各パラメータと共に演算結果を格納する(ステップS601)。
最終スコア =選択操作順のスコア*α*β・・・(5)
以上説明したように、本実施の形態によれば、操作演算手段が本文の意味解釈をしなくても、 ユーザの閲覧履歴等から重要度の指標となる優先順位を決定できるよう構成されているため、 時代に応じて変化するユーザの嗜好をとらえつつ、重要な情報を選別できる。
また、本実施の形態では、ユーザ個々の忘却モデルを検索履歴から算出するよう構成されているため、個人の記憶力の限界を超えたデータを保持しなくてもよいことがわかり、不要な情報を選別できる。
即ち、本実施の一形態では、ユーザのインタラクションから興味の順位づけを行い、その後 情報量に基づく加算処理を行い、更に 時間経過から情報の新鮮さに基づく減算処理をおこなうことで、電子メールの重要度を計算できる。また、予定が記載された電子メールの場合には、新鮮さに基づく減算処理法を変更する。加えて、ユーザのインタラクションから、そのユーザの忘却曲線を係数として算出して重要度の算定に使用する。
即ち、本実施の形態のデータ価値判定システムでは、事前に利用者が語彙集合を定義せずとも、データの選択操作に基づいて、コンテンツの重要度を適切に精度良く推定できる。
次に、第2の実施の一形態の価値判定システムについて図面を参照して説明する。尚、第1の実施の一形態の価値判定システムと同一部分には、同一符号を付与し、説明を省略する。
図11は、第2の実施の一形態の価値判定システムの構成を示す機能ブロック図である。図11を参照すると、本発明の第2の実施の形態は、プログラム制御により動作して、コンテンツデータの価値の判定に用いるイベントを取得するRSS更新イベント取得手段1100と、ページ価値判定手段1200と、コンテンツデータを取得可能するデータ格納手段300と、コンテンツデータの重要度を演算処理するスコア算出手段400とから構成されている。
図12は、RSS更新イベント受信手段1100の構成を示す機能ブロック図である。RSS更新イベント受信手段1100は、RSS解析手段1101と、ID生成手段1102と、ユーザアクセス監視手段1103とを含む。
図13は、ページ価値判定手段1200の構成を示す機能ブロック図である。ページ価値判定手段1200は、データ量演算手段210と、日付判定手段220と、ページ操作演算手段1230と、忘却演算手段240とを含む。
図14は、ページ操作演算手段1230の構成を示す機能ブロック図である。ページ操作演算手段1230は、状態管理手段1231と、状態記憶手段1232と、IDリスト記憶手段1233とを含む。
これらの手段はそれぞれ概略つぎのように動作する。
図15は、RSS更新イベント受信手段1100のIDを計算動作を示すフローチャートである。
RSS解析手段1101は、図15に示すように、コンテンツ管理サーバ上に新規に生成されたWebページのRSS情報を取得するべく、アクセス先(リンク先)をモニタする。RSS(RDF Site Summary また、Rich Site SummaryやReally Simple Syndicationとも記載される)情報とは、Webサイトの更新情報の配信に用いられる情報である。RSS解析手段1101は、コンテンツサーバ上で、更新されたページをRDF形式にまとめるモジュール(ターゲットシステム)に接続、もしくはRDF形式ファイルを取得し、新規ページのURLを得る(ステップS1101)。ID生成手段1102は、URLとその先のページに記載された文字列からMD5などによってハッシュ値を生成し、当該値をIDとする(ステップS1102)。
ユーザアクセス監視手段1103は、RSSデータに対するユーザのアクセスを監視し、イベントを発行する。イベントには、”配信完了”、”検索完了”、”選択”などが存在する。
ページ価値判定手段1200は、RSS配信されたURLと、ユーザのアクセス実績を管理する。
本発明の第一の実施の形態と大きく異なるのは、ページ操作演算手段1230である。ページ操作演算手段1230は、下記に説明するようにRSS配信に適合した状態遷移を持つ。
ここで、ページ操作演算手段1230におけるRSS配信後のスコア算出処理と、アイテム検索後のスコア算出処理を詳細に説明する。
[RSS配信後のスコア算出]
図16は、ページ操作演算手段1230の計算を示すフローチャートである。
図17(a)は、第2の実施の一形態のユーザ閲覧行為の状態遷移を示すフローチャートである。
RSS配信イベント(図中distribute)を検知すると、状態管理手段1231は、状態記憶手段1232から内部状態を取得すると共に、新たな内部状態に書換え、"distributed"状態へ遷移し、アイテムのIDリストを受け取り、IDリスト記憶手段1233に格納する(ステップS1103)。
続いて、ユーザによるアイテム選択イベント(図中access)が発生すると、状態管理手段1231は"accessed"状態へ遷移し、IDリスト記憶手段1233に記憶されているアイテムIDリストに、ユーザによって選択されたアイテムIDが含まれているかどうか照合する(ステップS1104)。
アイテムIDが含まれている場合、アイテムIDリスト中で何番目に閲覧されたかIDリスト記憶手段1233に記録し、次の計算式(6)で得られた値をスコア算出手段400にユーザの選択操作による重み付け要素として送付する(ステップS1105)。
RSS配信後の閲覧スコア = (配信したアイテム数 - 閲覧した順番+1) / 配信したアイテム数・・・(6)
引き続きユーザがアイテムを閲覧した場合、状態管理手段1231は"accessed"状態のまま、同様な仕組みで照合し、アイテムの閲覧スコアを算出する。尚、すでにスコアが与えられている場合は再度算出しない。
内部状態が"accessed"状態で受信したアイテムをユーザが全て閲覧すると、状態管理手段1231は"ready"状態に戻る。また、" accessed "状態で、新規アイテムリストが更新されたことを示すアップデートイベント(図中update)を受け取ると、ステップS1103の処理によって、状態記憶手段1232は"distributed"状態に遷移し、アイテムのIDリストをIDリスト記憶手段1233に格納する。
[アイテム検索後のスコア算出]
図17(b)は、第2の実施の一形態のユーザ検索行為の状態遷移を示すフローチャートである。
ユーザが検索ボタンを押下すると、ユーザアクセス監視手段1103が"search"イベントを発行する。状態管理手段1231は、"search"イベントを受け取ると、"searched"状態へ遷移するとともに、アイテムのIDリストを受け取り、IDリスト記憶手段233に格納する。
続いて、ユーザがアイテムのURLにアクセスすると、"access"イベントが発生し、状態管理手段1231は"accessed"状態へ遷移する。この際、状態管理手段1231はIDリスト記憶手段1233に記憶されているアイテムIDリストに、ユーザによって選択されたアイテムのIDが含まれているかどうか照合する。
アイテムのIDが含まれている場合、アイテムIDリスト中で何番目に閲覧されたかIDリスト記憶手段233に記録し、次の計算式(7)で得られた値をスコア算出手段400にユーザの選択操作による重み付け要素として送付する。
検索時の閲覧スコア = (列挙されたアイテム数 - 閲覧した順番+1) / 列挙されたアイテム数・・・(7)
引き続きユーザがアイテムを閲覧した場合、状態管理手段1231は"selected"状態のまま、同様な仕組みで照合し、アイテムの閲覧スコアを算出する。尚、すでにスコアが与えられている場合は再度算出しない。
また、閲覧されたアイテムの参照関係(リンク関係やドメイン関係)があるものをグループ化し、同じグループ内で後者に選択されたアイテムのスコアを、前者のスコアで置き換えるようにする。
アイテム検索後のスコア算出では、"accessed"状態から、検索結果とは関係のないURLへアクセスした場合に、検索結果の閲覧作業が終了したとみなし、"ready"状態へ遷移する。また、検索結果全てを閲覧した場合にも"ready"状態へ遷移する。
以上説明したように、本実施の形態によれば、操作演算手段が閲覧、検索など、情報の利用履歴を分析し、重要度の指標を選別するように構成されているため、ユーザの追加作業を必要とせず情報を順位づけできる。
次に、具体的な実施例を用いて本発明の実施の形態の動作を説明する。
本発明の第1の実施の一形態の実施例は、メールを受信するクライアントソフトと連携し、ユーザの閲覧行動からメールの価値を推定する。
図18は、第1の実施の一形態の価値判定システムの動作の具体例(初日)を示す説明図である。同様に、図19は、1日経過後を示す説明図である。同様に、図20は、2日経過後を示す説明図である。
以下では、3回のメール受信を通して、本発明の処理手順を説明する。具体的には、ユーザの操作によって、1回目はA001からA003、2回目はA004とA005、3回目はA006からA008までのメールを受信する。
価値判定システムの動作開始後(初日)、図18に示すように、3通のメールがクライアントソフトで受信される。
3通のメールのMessage-ID及びタイトルはそれぞれ、
・A001,「先日の展示会について」
・A002,「会議設定について」
・A003,「発注よろしく」 である。
この3通のメールに対して、図6のステップS101とステップS102から、A001,A002,A003というIDリストがイベント関連情報に含まれる。図18のようにIDおよび受信日、そしてIDに関連づいたSubject, 本文が記録される。
次に、各メールに対して図6のステップS201からS202まで実施すると、A001からA003において、添付ファイルが存在しないことから、図18に示す”添付”カラムに0が設定される。
次に、各メールに対して図6のステップS203からS205まで実施すると、A001からA003において、メールIDの参照関係がないことから、図18に示す"α"カラムに1が設定される。
次に、各メールに対して図6のステップS206からS207まで実施し、A001からA003においてメール本文から日付を抽出する。図18のように、A002のメール本文に対して、"2009/1/10"を抽出し、"予定"カラムに記入した結果が設定される。
次に、各メールに対して、図7のステップS301からS303まで実施し、A001からA003に対する閲覧順序および、閲覧順序から算出したユーザの操作による重み付け要素であるスコア値を、図18に示す"閲覧順序"カラムと"インタラクションスコア"カラムに記録する。
次に、各メールに対して図8及び図9のステップS501からS504まで実施すと、A002については予定日まで"β"カラムの値が1.0となる。A001, A003は2008/12/1時点で1.0となるが、ユーザが2日経過したメールを検索する癖があると仮定して、受信後3日に0.368に減算される。
最後に、各メールに対して図9のステップS601を実施すると、2008/12/1時点で、次のトータルスコアを得る。
・A001→0.33
・A002→1.00
・A003→0.66
次の日の2008/12/2にユーザがメールを受信すると、2通のメールがクライアントソフトで受信される。
図19に示すように、Message-ID、タイトルはそれぞれ、
・ A004,「Re:先日の展示会について」
・ A005,「Re:会議設定について」 である。
ステップS101からS601までの処理を、A004とA005に対して実施するとともに、A001とA003を忘却関数に従って、減算する。また、過去のメールとの関連性を有する、A004とA005は、加算要素に基づいて、加算する。このように動作させると、2008/12/2時点で、次のトータルスコアを得る。
・A001→0.20
・A002→1.00
・A003→0.40
・A004→2.00
・A005→0.50
さらに2008/12/3にユーザがメールを受信すると、3通のメールがクライアントソフトで受信される。 図20に示すように、Message-ID、タイトルはそれぞれ、
・A006,「Re: 発注よろしく」
・A007,「会議資料事前配布」
・A008,「Re: 会議資料事前配布」 である。
ステップS101からS601までの処理を、A006からA008に対して実施するとともに、A001からA005を忘却関数に従って、減算する。また、添付ファイルが付されているA007、A008は、加算要素に基づき、加算する。このように動作させると、2008/12/3時点で、次のトータルスコアを得る。
・A001→0.12
・A002→1.00
・A003→0.24
・A004→1.21
・A005→0.30
・A006→1.00
・A007→1.50
・A008→4.00
次に、本発明の第2の実施の一形態の実施例を説明する。
本実施例は、RSS配信を行うサーバ上で動作する場合について、例を交えて説明する。
RSS配信を行うサーバ上では、複数のユーザが新規に作成した複数のページタイトルとそのURLを管理しており、RDF形式で公開している。RSS受信を行うクライアントは、公開されたRDF形式を解析し新着ニュースとして表示するのが一般的である。
図21は、第2の実施の一形態の価値判定システムの動作の具体例を示す説明図である。
本発明は、RSS配信を行うサーバと連携して、ステップS1101からステップS1103を行い、公開用RDFが生成されたタイミングでIDを生成する。図21の"ID"カラムに、それぞれハッシュ値が格納される。
次にユーザがRSS受信を行うRSSリーダから、記事(本文)にアクセスすると、ユーザアクセス監視手段1103がアクセスされたURLからIDを生成し、ステップS1104を実行してIDリスト記憶手段1233と照合する。
次にステップ1105を実行し、RSS配信後の閲覧スコア(インタラクションスコア)を次のように算出する。
・ 3c45fd23→0.33
・ 1fab3234→1.00
・ ce13fd23→0.66
ユーザが最新のRSSデータにすべてアクセスした場合、もしくはRSSデータが更新された場合に、S1101からS1105を繰り返す。
上記実施の形態の説明で示したように、本発明によれば、ユーザによるコンテンツデータの選択操作に基づく、コンテンツの重要度を算出処理可能とするデータ価値判定システムを提供できる。
尚、データ価値判定システムの各種手段は、ハードウェア、及びソフトウェアの組み合わせを用いて実現する。具体的には、RAMにデータ価値判定用プログラムが展開され、当該プログラムに基づいて制御部等のハードウェアを動作させることによって、各種手段を実現する。また、前記プログラムは、記憶媒体に記録されて頒布されても良い。当該記録媒体に記録されたプログラムは、有線、無線、又は記録媒体そのものを介して、HDD等の補助記憶装置に読込まれ、制御部等を動作させる。尚、記録媒体を例示すれば、オプティカルディスクや磁気ディスク、半導体メモリ装置などが挙げられる。
また、本発明の具体的な構成は前述の実施の形態に限られるものではない。構成や動作は、発明の要旨を逸脱しない範囲の変更があってもこの発明に含まれる。
具体的な一例としては、図22に示すように、一般的なコンピュータを用いてデータ価値判定システムを実現できる。図22に示されたデータ価値判定システムは、ネットワークを介して接続されたメールサーバ等と接続し、補助記憶装置に記憶された各種プログラムがRAMに展開されて制御部に読込まれることによって、電子メールソフトをターゲットシステムとしたデータ価値判定システムとして動作する。制御部は、RAMに読込まれた各種プログラムに基づいて、イベント取得手段、価値判定手段、データ取得手段、スコア演算手段などとして機能する。
データ価値判定システムとして動作するコンピュータは、入力部やネットワークインタフェースを介して入力されたユーザのコンテンツへの選択に基づいて、夫々のユーザの価値観に合致するコンテンツを、スコア値に基づいて順序付けて出力し、ユーザにとって重要であるだろうコンテンツを判断できるように提供する。
上記実施の形態を別の表現で説明すれば、データ価値判定システムとして動作する情報処理システムは、ユーザによるコンテンツへの選択操作を受け付ける入力部と、コンテンツデータの価値判定用プログラムを記憶する記憶部と、前記価値判定用プログラムに基づいて動作する制御部とを備え、前記価値判定用プログラムは、前記制御部を、コンテンツデータの価値の判定に用いるイベントを取得するイベント取得手段と、前記イベント取得手段から取得したイベントに基づいて、前記コンテンツデータの重要度の算定に要する重み付け要素を出力する価値判定手段と、 前記コンテンツデータを取得可能にするデータ取得手段と、前記価値判定手段から出力された重み付け要素に基づいて、前記データ取得手段で取得したコンテンツデータの重要度を演算処理して前記記憶部に記録するスコア演算手段として機能させ、前記価値判定手段は、ユーザによる入力部を介するコンテンツデータへの選択操作順に基づき、重要度の比較対象となるコンテンツデータ群の中での個々のコンテンツデータに対する前記ユーザの重み付け要素を出力する操作演算手段と、前記コンテンツデータに対する付随するデータの有無及び/又は過去のコンテンツデータとの関連性の有無に基づき、加算要素を出力するデータ量演算手段と、ユーザごとの記憶力差を反映して忘却係数を設定して個々のコンテンツデータの重要度が最大と成る時点からの時間に基づく忘却関数を算出処理し、当該忘却関数に基づき、減算要素を出力する忘却演算手段とを含むことによって、ユーザによるコンテンツデータの選択操作に基づく、コンテンツの重要度を算出処理できる。
また、操作演算手段によるユーザの重み付け要素の算出式は、上記式(1)等から明らかなように、
{対象コンテンツへの重み付け要素=(比較対象となるコンテンツデータ数−対象コンテンツへの比較対象となるコンテンツデータ群中での選択順位+1)/比較対象となるコンテンツデータ数}
の数式を用いて算出するようにしても良い。
また、操作演算手段は、コンテンツ群の受信時及び/又は検索操作時に重み付け要素の算出を実施するようにしても良い。
また、価値判定手段は、重要度の算出対象であるコンテンツデータの内容に日時に関する情報が含まれていた場合、前記日時に関する情報に基づく重要度が最大と成る時点を定めて、減算要素を出力するようにしても良い。
また、価値判定手段は、重要度の算出対象であるコンテンツデータの内容に日時に関する情報が含まれていない場合、前記コンテンツデータの送信時又は受信時を重要度が最大と成る時点を定めて、減算要素を出力するようにしても良い。
また、価値判定手段は、忘却関数として、指数関数のマイナス冪乗を用い、ユーザの記憶力を反映して重要度の減算要素を出力するようにすれば効果的である。
また、忘却係数を、ユーザの検索操作時おける対象となるコンテンツへの到達回数から算出するようにしても良い。
尚、本発明は、ユーザによる追加の設定作業を必要とせずに閲覧や検索作業などの行為から、コンテンツの重要度を判定可能であるが、従来のユーザによる設定作業による重要度判定と組み合わせて用いることも可能である。
本発明によれば、 増加の一途をたどるメールやブログのページを、閲覧者の興味に従って優先順位づけし、 重要でないデータを大容量でアクセス速度の遅い記憶装置へ退避することや、 再利用する可能性の高いデータのみをアクセス速度の速いメモリに常駐させるといった用途に適用可能である。
100 イベント取得手段
101 アダプタ手段
102 フィルタ手段
200 価値判定手段
210 データ量演算手段
220 日付判定手段
230 操作演算手段
231 状態管理手段
232 状態記憶手段
233 IDリスト記憶手段
240 忘却演算手段
300 データ格納手段
400 スコア算出手段
401 トータルスコア演算手段
402 スコア関連情報格納手段
1100 RSS更新イベント受信手段
1101 RSS解析手段
1102 ID生成手段
1103 ユーザアクセス監視手段
1200 ページ価値判定手段
1230 ページ操作演算手段
1231 状態管理手段
1232 状態記憶手段
1233 IDリスト記憶手段

Claims (29)

  1. コンテンツデータの価値の判定に用いるイベントを取得するイベント取得手段と、
    前記イベント取得手段から取得したイベントに基づいて、前記コンテンツデータの重要度の算定に要する重み付け要素を出力する価値判定手段と、
    前記コンテンツデータを取得可能にするデータ取得手段と、
    前記価値判定手段から出力された重み付け要素に基づいて、前記データ取得手段で取得したコンテンツデータの重要度を演算処理するスコア演算手段と
    を備え、
    前記価値判定手段は、
    ユーザによるコンテンツデータの選択操作順に基づき、重要度の比較対象となるコンテンツデータ群の中での個々のコンテンツデータに対する前記ユーザの重み付け要素を出力する操作演算手段
    を含むことを特徴とするデータ価値判定システム。
  2. 請求項1記載のデータ価値判定システムであって、
    前記価値判定手段は、
    前記コンテンツデータに対する付随するデータの有無及び/又は過去のコンテンツデータとの関連性の有無に基づき、加算要素を出力するデータ量演算手段
    を含むことを特徴とするデータ価値判定システム。
  3. 請求項1又は2に記載のデータ価値判定システムであって、
    前記価値判定手段は、
    ユーザごとの記憶力差を反映して忘却係数を設定して個々のコンテンツデータの重要度が最大と成る時点からの時間に基づく忘却関数を算出処理し、当該忘却関数に基づき、減算要素を出力する忘却演算手段
    を含むことを特徴とするデータ価値判定システム。
  4. 請求項1ないし3の何れか一項に記載のデータ価値判定システムであって、
    前記操作演算手段によるユーザの重み付け要素の算出は、
    {対象コンテンツへの重み付け要素=(比較対象となるコンテンツデータ数−対象コンテンツへの比較対象となるコンテンツデータ群中での選択順位+1)/比較対象となるコンテンツデータ数}
    の数式を用いて算出する
    ことを特徴とするデータ価値判定システム。
  5. 請求項1ないし4の何れか一項に記載のデータ価値判定システムであって、
    前記操作演算手段は、コンテンツ群の受信時及び/又は検索操作時に重み付け要素の算出を実施する
    ことを特徴とするデータ価値判定システム。
  6. 請求項3ないし5の何れか一項に記載のデータ価値判定システムであって、
    前記価値判定手段は、
    重要度の算出対象であるコンテンツデータの内容に日時に関する情報が含まれていた場合、前記日時に関する情報に基づく重要度が最大と成る時点を定めて、減算要素を出力する
    ことを特徴とするデータ価値判定システム。
  7. 請求項3ないし6の何れか一項に記載のデータ価値判定システムであって、
    前記価値判定手段は、
    重要度の算出対象であるコンテンツデータの内容に日時に関する情報が含まれていない場合、前記コンテンツデータの送信時又は受信時を重要度が最大と成る時点に定めて、減算要素を出力する
    ことを特徴とするデータ価値判定システム。
  8. 請求項3ないし7の何れか一項に記載のデータ価値判定システムであって、
    前記価値判定手段は、
    前記忘却関数として、指数関数のマイナス冪乗を用い、ユーザの記憶力を反映して重要度の減算要素を出力する
    ことを特徴とするデータ価値判定システム。
  9. 請求項3ないし8の何れか一項に記載のデータ価値判定システムであって、
    前記価値判定手段は、
    前記忘却係数を、ユーザの検索操作時おける対象となるコンテンツへの到達回数から算出する
    ことを特徴とするデータ価値判定システム。
  10. 請求項1ないし9の何れか一項に記載のデータ価値判定システムであって、
    重要度を算定するコンテンツは、電子メールであることを特徴とするデータ価値判定システム。
  11. 請求項1ないし9の何れか一項に記載のデータ価値判定システムであって、
    重要度を算定するコンテンツは、Webページであることを特徴とするデータ価値判定システム。
  12. コンテンツデータの価値の判定に用いるイベントを取得するステップと、
    前記ステップで取得したイベントに基づいて、前記コンテンツデータの重要度の算定に要する重み付け要素を出力する価値判定ステップと、
    前記コンテンツデータを取得するステップと、
    前記価値判定ステップで出力された重み付け要素に基づいて、取得した前記コンテンツデータの重要度を演算処理するステップと
    を備え、
    前記価値判定ステップは、
    ユーザによるコンテンツデータの選択操作順に基づき、重要度の比較対象となるコンテンツデータ群の中での個々のコンテンツデータに対する前記ユーザの重み付け要素を出力する操作演算ステップ
    を含むことを特徴とするデータ価値判定方法。
  13. 請求項12記載のデータ価値判定方法であって、
    前記価値判定ステップは、
    前記コンテンツデータに対する付随するデータの有無及び/又は過去のコンテンツデータとの関連性の有無に基づき、加算要素を出力するステップ
    を含むことを特徴とするデータ価値判定方法。
  14. 請求項12又は13に記載のデータ価値判定方法であって、
    前記価値判定ステップは、
    ユーザごとの記憶力差を反映して忘却係数を設定して個々のコンテンツデータの重要度が最大と成る時点からの時間に基づく忘却関数を算出処理し、当該忘却関数に基づき、減算要素を出力するステップ
    を含むことを特徴とするデータ価値判定方法。
  15. 請求項12ないし14の何れか一項に記載のデータ価値判定方法であって、
    前記操作演算ステップによるユーザの重み付け要素の算出は、
    {対象コンテンツへの重み付け要素=(比較対象となるコンテンツデータ数−対象コンテンツへの比較対象となるコンテンツデータ群中での選択順位+1)/比較対象となるコンテンツデータ数}
    の数式を用いて算出処理する
    ことを特徴とするデータ価値判定方法。
  16. 請求項12ないし15の何れか一項に記載のデータ価値判定方法であって、
    前記操作演算ステップは、コンテンツ群の受信時及び/又は検索操作時に重み付け要素の算出を実施する
    ことを特徴とするデータ価値判定方法。
  17. 請求項14ないし16の何れか一項に記載のデータ価値判定方法であって、
    前記価値判定ステップは、
    重要度の算出対象であるコンテンツデータの内容に日時に関する情報が含まれていた場合、前記日時に関する情報に基づく重要度が最大と成る時点を定めて、減算要素を出力する
    ことを特徴とするデータ価値判定方法。
  18. 請求項14ないし17の何れか一項に記載のデータ価値判定方法であって、
    前記価値判定ステップは、
    重要度の算出対象であるコンテンツデータの内容に日時に関する情報が含まれていない場合、前記コンテンツデータの送信時又は受信時を重要度が最大と成る時点に定めて、減算要素を出力する
    ことを特徴とするデータ価値判定方法。
  19. 請求項14ないし18の何れか一項に記載のデータ価値判定方法であって、
    前記価値判定ステップは、
    前記忘却関数として、指数関数のマイナス冪乗を用い、ユーザの記憶力を反映して重要度の減算要素を出力する
    ことを特徴とするデータ価値判定方法。
  20. 請求項14ないし19の何れか一項に記載のデータ価値判定方法であって、
    前記価値判定ステップは、
    前記忘却係数を、ユーザの検索操作時おける対象となるコンテンツへの到達回数から算出する
    ことを特徴とするデータ価値判定方法。
  21. 情報処理装置の制御部を、
    コンテンツデータの価値の判定に用いるイベントを取得するイベント取得手段と、
    前記イベント取得手段から取得したイベントに基づいて、前記コンテンツデータの重要度の算定に要する重み付け要素を出力する価値判定手段と、
    前記コンテンツデータを取得可能にするデータ取得手段と、
    前記価値判定手段から出力された重み付け要素に基づいて、前記データ取得手段で取得したコンテンツデータの重要度を演算処理するスコア演算手段と
    して機能させ、
    更に、前記価値判定手段を、
    ユーザによるコンテンツデータの選択操作順に基づき、重要度の比較対象となるコンテンツデータ群の中での個々のコンテンツデータに対する前記ユーザの重み付け要素を出力する操作演算手段
    として機能させることを特徴とするデータ価値判定用プログラム。
  22. 請求項21記載のデータ価値判定用プログラムであって、
    前記価値判定手段を、
    前記コンテンツデータに対する付随するデータの有無及び/又は過去のコンテンツデータとの関連性の有無に基づき、加算要素を出力するデータ量演算手段
    として機能させることを特徴とするデータ価値判定用プログラム。
  23. 請求項21又は22に記載のデータ価値判定用プログラムであって、
    前記価値判定手段を、
    ユーザごとの記憶力差を反映して忘却係数を設定して個々のコンテンツデータの重要度が最大と成る時点からの時間に基づく忘却関数を算出処理し、当該忘却関数に基づき、減算要素を出力する忘却演算手段
    として機能させることを特徴とするデータ価値判定用プログラム。
  24. 請求項21ないし23の何れか一項に記載のデータ価値判定用プログラムであって、
    前記操作演算手段によるユーザの重み付け要素の算出を、
    {対象コンテンツへの重み付け要素=(比較対象となるコンテンツデータ数−対象コンテンツへの比較対象となるコンテンツデータ群中での選択順位+1)/比較対象となるコンテンツデータ数}
    の数式を用いて算出処理させる
    ことを特徴とするデータ価値判定用プログラム。
  25. 請求項21ないし24の何れか一項に記載のデータ価値判定用プログラムであって、
    前記操作演算手段に、コンテンツ群の受信時及び/又は検索操作時に重み付け要素の算出処理を実施させる
    ことを特徴とするデータ価値判定用プログラム。
  26. 請求項23ないし25の何れか一項に記載のデータ価値判定用プログラムであって、
    前記価値判定手段に、
    重要度の算出対象であるコンテンツデータの内容に日時に関する情報が含まれていた場合、前記日時に関する情報に基づく重要度が最大と成る時点を定めて、減算要素を出力させる
    ことを特徴とするデータ価値判定用プログラム。
  27. 請求項23ないし26の何れか一項に記載のデータ価値判定用プログラムであって、
    前記価値判定手段に、
    重要度の算出対象であるコンテンツデータの内容に日時に関する情報が含まれていない場合、前記コンテンツデータの送信時又は受信時を重要度が最大と成る時点と定めて、減算要素を出力させる
    ことを特徴とするデータ価値判定用プログラム。
  28. 請求項23ないし27の何れか一項に記載のデータ価値判定用プログラムであって、
    前記価値判定手段に、
    前記忘却関数として、指数関数のマイナス冪乗を用いて、ユーザの記憶力を反映した重要度の減算要素を出力させる
    ことを特徴とするデータ価値判定用プログラム。
  29. 請求項23ないし28の何れか一項に記載のデータ価値判定用プログラムであって、
    前記価値判定手段に、
    ユーザの検索操作時おける対象となるコンテンツへの到達回数から、前記忘却係数を算出させる
    ことを特徴とするデータ価値判定用プログラム。
JP2009003376A 2009-01-09 2009-01-09 データ価値判定システム、データ価値判定方法およびデータ価値判定用プログラム Withdrawn JP2010160723A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009003376A JP2010160723A (ja) 2009-01-09 2009-01-09 データ価値判定システム、データ価値判定方法およびデータ価値判定用プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009003376A JP2010160723A (ja) 2009-01-09 2009-01-09 データ価値判定システム、データ価値判定方法およびデータ価値判定用プログラム

Publications (1)

Publication Number Publication Date
JP2010160723A true JP2010160723A (ja) 2010-07-22

Family

ID=42577827

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009003376A Withdrawn JP2010160723A (ja) 2009-01-09 2009-01-09 データ価値判定システム、データ価値判定方法およびデータ価値判定用プログラム

Country Status (1)

Country Link
JP (1) JP2010160723A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019159695A (ja) * 2018-03-12 2019-09-19 トヨタ自動車株式会社 情報処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019159695A (ja) * 2018-03-12 2019-09-19 トヨタ自動車株式会社 情報処理装置
JP7013956B2 (ja) 2018-03-12 2022-02-01 トヨタ自動車株式会社 情報処理装置

Similar Documents

Publication Publication Date Title
US8140540B2 (en) Classification of electronic messages based on content
US8126895B2 (en) Method, apparatus, and computer program product for indexing, synchronizing and searching digital data
US8549412B2 (en) Method and system for display of information in a communication system gathered from external sources
JP5890308B2 (ja) コンテキスト上関連するタスクアイテムの自動発見
US9785957B2 (en) Collecting and presenting information
CA2817230C (en) Electronic communications triage
JP5021640B2 (ja) ユーザのアクティビティ、アテンション、および関心事のデータ活用手段の検知、格納、索引作成、および検索
US20170171124A1 (en) Presentation of Organized Personal and Public Data Using Communication Mediums
US8725711B2 (en) Systems and methods for information categorization
US9672232B1 (en) Systems and methods for selectively storing event data
JP2006107473A (ja) パーソナル化された検索および情報アクセスを提供するシステム、方法、およびインターフェース
US20120143806A1 (en) Electronic Communications Triage
US7970771B2 (en) Method and system for tracking objects associated with an activity
US8880595B2 (en) Asynchronous, passive knowledge sharing system and method
US20090113281A1 (en) Identifying And Displaying Tags From Identifiers In Privately Stored Messages
US11258744B2 (en) Digital conversation management
US9117202B2 (en) Identifying and displaying messages containing an identifier
JP2010160723A (ja) データ価値判定システム、データ価値判定方法およびデータ価値判定用プログラム
WO2022234273A1 (en) Project data processing method and apparatus

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120403