JP2006331014A - 情報提供装置、情報提供方法及び情報提供プログラム - Google Patents
情報提供装置、情報提供方法及び情報提供プログラム Download PDFInfo
- Publication number
- JP2006331014A JP2006331014A JP2005152734A JP2005152734A JP2006331014A JP 2006331014 A JP2006331014 A JP 2006331014A JP 2005152734 A JP2005152734 A JP 2005152734A JP 2005152734 A JP2005152734 A JP 2005152734A JP 2006331014 A JP2006331014 A JP 2006331014A
- Authority
- JP
- Japan
- Prior art keywords
- information
- user
- similarity
- distribution
- related information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 49
- 238000011156 evaluation Methods 0.000 claims description 94
- 238000004364 calculation method Methods 0.000 claims description 35
- 238000009825 accumulation Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 230000000877 morphologic effect Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3349—Reuse of stored results of previous queries
Abstract
【課題】 ユーザが知らない情報で、かつ、ユーザが興味を持つ可能性が高い関連情報を提供する。
【解決手段】 本発明では、関連情報として提供し得る関連情報候補の中から、ユーザへの配信情報との類似度が高いものを除外する。また、関連情報候補の中から、ユーザへの配信情報と同じ情報源のものや、情報源が有名なものは除外する。さらに、関連情報候補の中から、関連情報として提供したい部分が、その候補のバージョンが変化しても変わらないものは除外する。そして、関連情報候補の中から関連情報を決定する。
【選択図】 図1
【解決手段】 本発明では、関連情報として提供し得る関連情報候補の中から、ユーザへの配信情報との類似度が高いものを除外する。また、関連情報候補の中から、ユーザへの配信情報と同じ情報源のものや、情報源が有名なものは除外する。さらに、関連情報候補の中から、関連情報として提供したい部分が、その候補のバージョンが変化しても変わらないものは除外する。そして、関連情報候補の中から関連情報を決定する。
【選択図】 図1
Description
本発明は情報提供装置、情報提供方法及び情報提供プログラムに関し、例えば、ユーザに情報を紹介するサービスに適用し得るものである。
従来、ユーザに配信する情報として、ユーザの指定条件に合致する情報などに加え、他の配信された情報、あるいは、過去に配信された情報、あるいは、他者が配信を受けた情報から、類似した情報をグループ化することが行われている(例えば、特許文献1参照)。
これにより、ユーザは、同じような情報がまとめて提示されて、同じような情報をまとめて確認できる。また、今までの経過をまとめて把握することができる。また、他者が自分と似た情報についてどのように扱っているかを知ることができる。
このように、同じような情報をまとめることにより一括した情報の取り扱いを可能とし、利便性を高めている。
特開平09−101990号公報
一般的に、ユーザが、Webコンテンツやメールマガジンなどの情報の配信を要求する場合は、そこに欲しい情報がある、あるいは、欲しい情報が含まれていることに期待できる場合である。
しかしながら、そのような情報は、ユーザが知らない情報源からも発信されている場合も多い。また、検索する場合であっても、検索対象の存在を知らなければ検索のしようがない。
このようなユーザが情報源あるいは情報そのものの存在を知らない場合には、ユーザに配信された情報と類似した情報を提示することで、そのユーザにその情報や情報源に気づく機会を与える方法が考えられる。
また、このような情報や情報源として配信を受けるに値するものを紹介することを考えると、他者が選んで配信を受けている情報に価値が高いものが含まれている可能性が高いという仮説に基づいた手法に期待できる。
すなわち、他者に配信された情報の中で、類似した情報をユーザに紹介する方法が考えられる。
このようなことを従来手法で行った場合、ユーザに配信された情報と類似した、他者に配信された情報を紹介することが考えられる。しかしながら、従来手法は類似度が高い情報を同じように扱えるようにすることを目的としているため、結局、得られる情報はすでに自分に配信された情報と大差ないものが大半という結果になる。
また、ニュースサイトなど多くの情報が配信されるサイトの場合、類似した情報が含まれる可能性も高い。このため、類似した情報として紹介された配信情報の情報源であることが多い。しかしながら、多くの場合、このような一般的な情報源はユーザも知っており、また、読んでいる可能性も高いため、紹介する意味がないことが多い。
また、情報の紹介があるのは、ユーザが配信を受ける情報と類似しているためだが、その紹介された情報が繰り返し配信されるようなものの場合、その後も紹介され続ける可能性が高い。例えば、キャンペーン情報などはキャンペーンの期間中、配信される情報に含まれ続けるが、そのようなものが繰り返し紹介される可能性がある。そうすると、ユーザは何度も同じ情報を紹介されることになる。
以上のように、類似した情報を紹介するだけでは、ユーザがすでに知っている情報が多く紹介されてしまい、ユーザが気付いていないが興味を抱くであると考えられる情報が低順位となり紹介されないか、埋もれてしまう。
そのため、ユーザが知らない情報で、かつ、ユーザが興味を持つ可能性が高い情報を提供する情報提供装置、情報提供方法及び情報提供プログラムが望まれている。
第1の本発明は、ユーザによる設定に基づき、上記ユーザに配信すべき情報を情報源より配信情報として取得して配信すると共に、この配信情報と関連性がある関連情報を紹介する情報提供装置において、上記関連情報となり得る関連情報候補の中から、上記配信情報と重複した情報提供になるもの、又は、上記配信情報と重複した情報提供になる可能性が高いものを除外して関連情報を決定する重複情報提供回避手段を有することを特徴とする。
第2の本発明は、ユーザによる設定に基づき、上記ユーザに配信すべき情報を情報源より配信情報として取得して配信すると共に、この配信情報と関連性がある関連情報を紹介する情報提供方法において、上記関連情報となり得る関連情報候補の中から、上記配信情報と重複した情報提供になるもの、又は、上記配信情報と重複した情報提供になる可能性が高いものを除外して関連情報を決定する重複情報提供回避工程を含むことを特徴とする。
第3の本発明の情報提供プログラムは、第2の本発明の情報提供方法を、コンピュータが実行可能なコードで記述していることを特徴とする。
本発明によれば、ユーザへの配信情報と同様な情報ではない、ユーザが知らない情報で、かつ、ユーザが興味を持つ可能性が高い関連情報を提供することができる。
(A)第1の実施形態
以下、本発明による情報提供装置、情報提供方法及び情報提供プログラムの第1の実施形態を、図面を参照しながら詳述する。
以下、本発明による情報提供装置、情報提供方法及び情報提供プログラムの第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
第1の実施形態の情報提供装置は、例えば、サーバ、パソコンなどの通信機能を有する情報処理装置に情報提供プログラムがインストールされて構築され、機能的には、図1に示す構成を有する。なお、情報提供プログラムのインストール方法は、記録媒体からのインストールであっても良く、他の装置からのダウンロードによるインストールであっても良く、キーボードなどを用いた入力による方法であっても良い。
第1の実施形態の情報提供装置は、例えば、サーバ、パソコンなどの通信機能を有する情報処理装置に情報提供プログラムがインストールされて構築され、機能的には、図1に示す構成を有する。なお、情報提供プログラムのインストール方法は、記録媒体からのインストールであっても良く、他の装置からのダウンロードによるインストールであっても良く、キーボードなどを用いた入力による方法であっても良い。
図1において、第1の実施形態の情報提供装置100は、情報取得部111、類似度算出部112、不要情報評価部113、関連情報判定部114、出力部115、ユーザ設定記憶部121及び配信情報蓄積部122を有している。
ユーザ設定記憶部121は、1又は複数のユーザについて、ユーザごとに情報を配信するために必要な設定を記憶しているものである。ユーザ設定記憶部121には、例えば、情報を取得する情報源が設定される。ここで、情報源は、通信網を介した装置などであってもよく、当該情報提供装置と同一のハードウェアに設けられているデータベースなどであっても良い。その他、ユーザがある任意の情報源から特定の情報に絞って配信を受けたい場合には、ユーザが設定操作した検索条件なども記憶される(この場合には、情報源の情報は設定されていても設定されていなくても良い)。さらに、ユーザが情報を電子メールで受ける場合はそのメールアドレスなどの、出力先の情報も記憶される。
ユーザ設定記憶部121への設定は、例えば、ユーザとの契約内容に基づいて、システム管理者側がキーボードなどの入力手段によって行うものであっても良く、また例えば、ユーザが、自己のパソコンのブラウザ機能などを用いて、当該情報提供装置が提示した設定用のWebページから行うものであっても良く、設定方法は問われないものである。
情報取得部111は、例えば、通信機能を有し、ユーザ設定記憶部121にユーザ設定情報が記憶された全てのユーザのそれぞれについて、設定された情報源から設定された検索条件に一致する情報(以下、1次情報と呼ぶ)を配信する情報として取得し、配信情報蓄積部122に記憶させると共に、ユーザごとにその情報を後述する出力部115から配信させるものである。
ここで、情報源からの配信情報の取得は、情報取得部111が要求を発して実行するものであっても良く、また、情報源から自動的に送付されてきたものを、ユーザ設定に係るものか否かを判別して実行するものであっても良い。また、情報取得部111は、周期的な定時処理により配信情報を取得するものであっても良く、また、ユーザ設定情報のなかの情報源に関連付けて取得時刻をも設定させ、その時刻に取得動作するものであっても良い。
配信情報蓄積部122は、過去の所定期間の間に情報取得部111が出力する1次情報を蓄積情報として記憶しているものである。ここで、過去の所定期間とは、「1ヶ月」などの固定期間であっても良く、また、「3バージョン前の情報まで」のような相対的な期間であっても良い。
また、配信情報蓄積部122は、同一の1次情報でもユーザが異なる場合にはそれぞれ区別して蓄積するものであっても良く、また、同一の1次情報はその情報に係る全てのユーザの特定情報を付加して1個だけ蓄積するものであっても良く、類似度算出部112の機能を阻害しない方法であれば、その蓄積方法は問われないものである。なお、配信情報蓄積部122は、ユーザの特定情報に無関係に情報を蓄積するものであっても良い。
類似度算出部112は、配信情報蓄積部122に記憶された各蓄積情報について、各ユーザごとに情報取得部111で得られた1次情報との類似度を算出するものである。類似度算出部112は、配信情報蓄積部122に記憶された蓄積情報の2個ずつの類似度を算出した後に、各ユーザごとの1次情報について整理するものであっても良く、当初から、ユーザごとの1次情報と他の蓄積情報との類似度をそのつど算出するものであっても良い。後者の場合は、例えば、ユーザごとに、情報(1次情報、後述する関連情報)の発信時刻を設定させているような場合に適用可能である。類似度算出部112は、例えば、各情報(文書)を形態素解析した後にtf・idfによる評価値を計算するなどの、一般的な類似文書検索の手法を用いることで実現できる。
不要情報評価部113は、各ユーザごとに、類似度算出部112で得られた各蓄積情報についての類似度を元に、該ユーザに紹介するのに適当でない蓄積情報であるか否かを評価するものである。情報取得部111により該ユーザヘの配信情報として得られた1次情報と同一かほぼ同じ情報は重複してユーザに紹介するのは不適当である。従って、第1の実施形態の不要情報評価部113は、所定ルール下で類似度が高い蓄積情報は不要である確率が高いと評価する。この評価は、類似度から一定の式で算出できる値を取るような評価値でも良いし、紹介するかしないかといった2値でも良い。
以下の説明においては、不要情報評価部113は、内容がそのユーザへの配信情報(1次情報)と同一ではなく、かつ、最も類似度が高い蓄積情報の類似度の一定割合(例えば75%)を閾値とし、それ以上の類似度を持つ蓄積情報は不要であると判定するものとする。ここで、上述した一定割合をユーザが可変し得るようにしても良い。
関連情報判定部114は、各ユーザごとに、不要情報評価部113による評価値と類似度算出部112による類似度を用いて、蓄積情報から該ユーザの配信情報(1次情報)に関連して紹介する情報を関連情報と判定する。例えば、不要と判定されなかった蓄積情報のうち最も類似度が高いものから所定数(この数をユーザが可変し得るようにしても良い)を関連情報とする。また、所定数に代え、関連情報とする下限側のパラメータ(例えば類似度)を規定するものであっても良い。
出力部115は、各ユーザごとに、ユーザ設定記憶部121に記憶されたメールアドレスに発信するなどの所定の方法で、情報取得部111で得られた1次情報と関連情報判定部114で得られた関連情報を、該ユーザが閲覧可能なように出力するものである。なお、出力部115は、積極的に発信や送信を行うものだけでなく、ユーザ側の装置からの取り出し操作を待って発信や送信を行うものであっても良い。
(A−2)第1の実施形態の動作
次に、第1の実施形態の情報提供装置100の動作(第1の実施形態の情報提供方法)を、具体例を用いながら説明する。なお、上述した図1は、第1の実施形態の情報提供装置100の動作を示すフローチャートとして見ることもできる。
次に、第1の実施形態の情報提供装置100の動作(第1の実施形態の情報提供方法)を、具体例を用いながら説明する。なお、上述した図1は、第1の実施形態の情報提供装置100の動作を示すフローチャートとして見ることもできる。
情報取得部111は、ユーザ設定記憶部121の各ユーザごとに設定された情報源から定められた条件を満たす情報を取得し、配信情報蓄積部122に蓄積する。ここで、あるユーザ1Aについて、図2(a)に示す配信情報(1次情報)C1Aが取得され、また、他のユーザ1B、1C、1Dのそれぞれについて、図2(b)、(c)、(d)に示す情報(1次情報)C1B、C1C、C1Dが取得され、これら情報C1A〜C1Dが配信情報蓄積部122に蓄積されたとする。
類似度算出部112は、ユーザ1Aに関しては、図2(a)の配信情報C1Aと、他の配信情報蓄積部122中の図2(b)〜(d)の蓄積情報C1B〜C1Dとの間の類似度をそれぞれ算出する。
図2(a)の配信情報C1Aについては、形態素解析など一般的な自然言語処理技術で「防水」、「特徴」、「デジタルカメラ」、「発売」などの単語がキーワードとして抽出できる。
図2(b)の蓄積情報C1Bには、これら4つのキーワード全てが含まれているため、類似度算出部112は、例えば、4/4=100%を類似度とする。ここでは、説明を簡単にするために含まれているキーワードの率で類似度としたが、各キーワードの重みをidfで調整するなど一般的な文書検索における評価手法を用いることができる。類似度算出部112は、図2(c)の蓄積情報C1Cについては、「デジタルカメラ」、「発売」の2つのキーワードが含まれるため、2/4=50%と類似度を算出し、図2(d)の蓄積情報C1Dについては、一致するキーワードがないので0%を類似度とする。
不要情報評価部113は、最も類似度が高い図2(b)の蓄積情報C1Bについての評価値100%の所定割合(例えば75%)である75%を閾値とし、ユーザ1Aに対して紹介する情報として不要か否かを判定する。その結果、蓄積情報例C1Bは、類似度が100%であるため不要情報と判定され、また、蓄積情報C1Cは、類似度が50%であるため、不要情報とは判定されず、蓄積情報C1Dも、類似度が0%であるため不要情報とは判定されない。
関連情報判定部114は、ユーザ1Aの1次情報C1A以外の蓄積情報C1B〜C1Dの中から、1次情報C1Aと共にユーザ1Aに配信する関連情報を判定する。ここで、関連情報判定部114が選定する関連情報の数が1個に選定されているとする。関連情報判定部114は、蓄積情報C1Bについては不要情報評価部113で不要と判定されているため、関連情報と判定しない。関連情報判定部114は、蓄積情報C1CとC1Dとは不要情報評価部113では不要と判定されていないが、関連情報数が1個であるため、類似度が50%と高い蓄積情報C1Cをユーザ1Aへの関連情報とする。
以上のような処理により、ユーザ1Aは、出力部115が発信した、図2(a)の1次情報C1Aを受け取ると共に、図2(c)の情報C1Cを関連情報として受け取る。なお、1次情報と関連情報とを同様に提示するものであっても良く、関連情報の提示方法を1次情報の提示方法と変えるようにしても良い。例えば、1次情報の提示画面の一部に関連情報の存在を示すアイコンを設けておき、そのアイコンのクリック時に関連情報を提示させるものであっても良い。ここで、関連情報の配信そのものもクリック時に行うものであっても良い。
以上説明したように、ユーザ1Aは、図2(a)の配信情報C1Aに対して、関連した図2(c)の情報C1Cの紹介を受けることができる一方、より類似度が高いが、図2(a)の配信情報C1Aとほぼ同じ内容である図2(b)の情報C1Bの紹介は受けない。すなわち、同じような情報を重複して受けることはない。
(A−3)第1の実施形態の効果
第1の実施形態によれば、ユーザが知らない情報で、かつ、ユーザが興味を持つ可能性が高い情報を関連情報として提供することができる。
第1の実施形態によれば、ユーザが知らない情報で、かつ、ユーザが興味を持つ可能性が高い情報を関連情報として提供することができる。
一方、ユーザへの配信情報と高い類似度を持った情報、すなわち、そのユーザがすでに配信情報から得ている可能性が高い情報又は配信情報から得られるであろう情報と同じ情報は関連情報として紹介されることがない。そのため、ユーザが同じような情報をいくつも紹介されるということが減少し、ユーザの利便性が高まる。
(B)第2の実施形態
次に、本発明による情報提供装置、情報提供方法及び情報提供プログラムの第2の実施形態を、図面を参照しながら詳述する。
次に、本発明による情報提供装置、情報提供方法及び情報提供プログラムの第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
第2の実施形態の情報提供装置も、例えば、サーバ、パソコンなどの通信機能を有する情報処理装置に情報提供プログラムがインストールされて構築され、機能的には、図3に示す構成を有する。なお、図3において、第1の実施形態に係る図1との同一、対応部分には対応符号(百桁の番号が「1」から「2」へ変化)を付して示している。
第2の実施形態の情報提供装置も、例えば、サーバ、パソコンなどの通信機能を有する情報処理装置に情報提供プログラムがインストールされて構築され、機能的には、図3に示す構成を有する。なお、図3において、第1の実施形態に係る図1との同一、対応部分には対応符号(百桁の番号が「1」から「2」へ変化)を付して示している。
図3において、第2の実施形態の情報提供装置200も、第1の実施形態と同様に、情報取得部211、類似度算出部212、不要情報評価部213、関連情報判定部214、出力部215、ユーザ設定記憶部221及び配信情報蓄積部222を有すると共に、さらに、類似ユーザ判定部216を有している。
情報取得部211、類似度算出部212、出力部215及びユーザ設定記憶部221は、第1の実施形態のものと同様である。
配信情報蓄積部222は、第1の実施形態のものと同様なものであるが、第2の実施形態の場合、蓄積情報について、どのユーザのユーザ設定情報に基づくものであるかわかるように記憶することは必須である。
類似ユーザ判定部216は、各ユーザごとに、類似度算出部212によって類似度が高かった蓄積情報の多くに対応付けられている、処理対象ユーザ以外のユーザ情報(ユーザ)IDを得るものである。言い換えると、類似した配信情報を多く得ている他のユーザを類似ユーザとして1人又は複数人検出するものである。例えば、他のユーザそれぞれについて、そのユーザIDと対応付けられた蓄積情報の類似度を全て加算したものをそのユーザのスコアとし、スコアが良い上位のユーザを類似ユーザとする。類似ユーザを、固定人数(ユーザが変化し得るようにしても良い)だけ定めるようにしても良く、所定の値(ユーザが変化し得るようにしても良い)以上のスコアを有する全ての他のユーザを類似ユーザと判定するようにしても良い。
この処理は、類似のユーザが判定できれば良いので、単純にユーザ設定情報同士を比較して、情報源やキーワードなどの検索条件が類似しているユーザを類似ユーザとしても良い。その他、ユーザの契約データにおける、ユーザの年令、職業、性別などのユーザの属性項目に基づいて、類似ユーザを判定するようにしても良い。上述した判定方法を、複数組み合わせて用いるようにしても良い。
第2の実施形態の不要情報評価部213は、類似ユーザ判定部216において得られた類似ユーザに対応付けられた蓄積情報について類似度算出部212により算出された類似度に基づき、該ユーザに紹介するのに適当でない蓄積情報であるか否かを評価する。第2の実施形態の不要情報評価部213は、不要判定の対象となる蓄積情報を類似ユーザについての蓄積情報に限定すること以外は、第1の実施形態の不要情報評価部113と同様である。
第2の実施形態の関連情報判定部214は、類似ユーザ判定部216において得られた類似ユーザに対応付けられた蓄積情報について、不要情報評価部213による評価値と類似度算出部212により算出された類似度に基づき、蓄積情報の中からユーザへの配信情報に関連して紹介する関連情報を判定するものである。例えば、不要と判定されなかった類似ユーザと対応付けられた蓄積情報のうち、最も類似度が高いものから所定数を関連情報とする。関連情報の数などは任意にシステムが定めることができ、また、ユーザが指定できるようにしても良く、この点は第1の実施形態と同様である。
(B−2)第2の実施形態の動作
次に、第2の実施形態の情報提供装置200の動作(第2の実施形態の情報提供方法)を、具体例を用いながら説明する。なお、上述した図3は、第2の実施形態の情報提供装置200の動作を示すフローチャートとして見ることもできる。
次に、第2の実施形態の情報提供装置200の動作(第2の実施形態の情報提供方法)を、具体例を用いながら説明する。なお、上述した図3は、第2の実施形態の情報提供装置200の動作を示すフローチャートとして見ることもできる。
情報取得部211は、ユーザ設定記憶部221に記憶されている、各ユーザごとに設定された情報源から定められた条件を満たす情報を取得し、配信情報蓄積部222に蓄積する。ここで、あるユーザ2Aについて、図4(a)に示す配信情報(1次情報)C2Aが取得され、また、他のユーザ2Bについて、図4(b)及び(c)に示す配信情報C2B1及びC2B2が取得され、さらに、他のユーザ2Cについて、図4(d)に示す配信情報C2Cが取得され、これら取得情報C2A、C2B1、C2B2及びC2Cが配信情報蓄積部222に蓄積されたとする。
類似度算出部212は、ユーザ2Aに関しては、図4(a)に示す配信情報C2Aと、配信情報蓄積部222中の他のユーザ2B、2Cに関係する、図4(b)〜(d)の蓄積情報C2B1、C2B2、C2Cとの間の類似度を算出する。詳述は省略するが、配信情報C2Aに対し、配信情報C2B1の類似度が100%、配信情報C2B2の類似度が50%、配信情報C2Cの類似度が0%と算出されたとする(第1の実施形態参照)。
類似ユーザ判定部216では、まず、ユーザ2A以外のユーザ2B、2Cの評価値を算出する。ユーザ2Bに係る、図4(b)の蓄積情報C2B1が類似度100%、図4(c)の蓄積情報C2B2の類似度が50%であり、他に、ユーザ2Bに係る蓄積情報は存在しないので、ユーザ2Bの評価値を、類似度の和である150とする。また、ユーザ2Cに係る図4(d)の蓄積情報C2Cの類似度が0%であり、他に、ユーザ2Cに係る蓄積情報は存在しないので、ユーザ2Cの評価値を0とする。
ここで、類似ユーザの人数を1人に定めている場合であれば、評価値が高いユーザ2Bが、ユーザ2Aの類似ユーザと判定される。
不要情報評価部213は、類似ユーザと判定されたユーザ2Bに係る、図4(b)、(c)の蓄積情報C2B1、C2B2の中で、最も類似度が高い蓄積情報C2B1の類似度100%の所定割合(例えば75%)である値(75%)を閾値として、対象となっているユーザ2Aに対して紹介する情報として不要か否かを判定する。図4に示す情報の例の場合、蓄積情報C2B1は類似度が100%であるため不要と判定され、蓄積情報C2B2は類似度が50%であるため、不要とは判定されない。
関連情報判定部214は、ユーザ2Aの1次情報C2A以外の蓄積情報C2B1、C2B2、C2Cの中から、1次情報C2Aと共にユーザ2Aに配信する関連情報を判定する。ここで、関連情報判定部214が選定する関連情報の数が1個に選定されているとする。関連情報判定部214は、蓄積情報C2B1は不要情報評価部213で不要と判定されているため、関連情報と判定せず、蓄積情報C2B2は不要情報評価部213で不要と判定されておらず、類似度が50%と高いため関連情報とする。
出力部215により、ユーザ2Aは、図4(a)の配信情報C2Aを受け取ると共に、図4(c)の蓄積情報C2B2を関連情報として紹介される。
以上説明したように、ユーザ2Aは、図4(a)の配信情報C2Aに加え、類似ユーザ2Bへの配信情報C2B1、C2B2のうち、本来の配信情報C2Aと同じ内容でないものを関連情報として受けることができ、一方、類似ユーザ2Bへの配信情報C2B1、C2B2のうち、本来の配信情報C2Aとほぼ同じ内容の情報の紹介は受けない。
(B−3)第2の実施形態の効果
第2の実施形態によれば、ユーザは自己と興味が共通する類似ユーザへの配信情報のうち、自己への配信情報と多少異なっている情報だけを関連情報として提供される。
第2の実施形態によれば、ユーザは自己と興味が共通する類似ユーザへの配信情報のうち、自己への配信情報と多少異なっている情報だけを関連情報として提供される。
すなわち、ユーザへユーザが設定した内容で定まる配信情報以外の情報を提供する際に、ユーザが冗長な情報を受け取ることを未然に防止することができる。
(C)第3の実施形態
次に、本発明による情報提供装置、情報提供方法及び情報提供プログラムの第3の実施形態を、図面を参照しながら詳述する。
次に、本発明による情報提供装置、情報提供方法及び情報提供プログラムの第3の実施形態を、図面を参照しながら詳述する。
(C−1)第3の実施形態の構成
第3の実施形態の情報提供装置も、例えば、サーバ、パソコンなどの通信機能を有する情報処理装置に情報提供プログラムがインストールされて構築され、機能的には、図5に示す構成を有する。なお、図5において、第1の実施形態に係る図1との同一、対応部分には対応符号(百桁の番号が「1」から「3」へ変化)を付して示している。
第3の実施形態の情報提供装置も、例えば、サーバ、パソコンなどの通信機能を有する情報処理装置に情報提供プログラムがインストールされて構築され、機能的には、図5に示す構成を有する。なお、図5において、第1の実施形態に係る図1との同一、対応部分には対応符号(百桁の番号が「1」から「3」へ変化)を付して示している。
図5において、第3の実施形態の情報提供装置300も、第1の実施形態と同様に、情報取得部311、類似度算出部312、関連情報判定部314、出力部315、ユーザ設定記憶部321及び配信情報蓄積部32を有すると共に、さらに、情報源評価部313及び情報源評価記憶部323を有している。なお、第3の実施形態の場合、不要情報評価部(113)は設けられておらず、それに対応するものとして情報源評価部313が設けられている。
情報取得部311、類似度算出部312、出力部315及びユーザ設定記憶部321は、第1の実施形態のものと同様である。配信情報蓄積部322は、第1の実施形態のものと同様なものであるが、第3の実施形態の場合、蓄積情報について、どの情報源からのものであるかわかるように記憶することは必須である。
情報源評価部313は、各ユーザごとに、そのユーザに紹介する関連情報を取得する情報源として適当である度合いを評価するものである。
例えば、あるユーザの配信情報と同じ情報源による情報は紹介しなくてもそのユーザの目に留まる可能性が高い。このため、例えば、そのユーザの配信情報の情報源、若しくは、ユーザ設定情報に記憶されている情報源について評価値を低くする。また、ニュースサイトなど広く知られた情報源については紹介せずともユーザが知っている可能性が高い。そのため、予め情報源評価記憶部323に、そのようなサイト(著名情報源)を評価値と共に記憶し、その情報源評価記憶部323に記憶されている情報源についてはそこから評価値を得る。また、多くのユーザが設定している情報源は広く知られている情報源と考えられ、紹介せずともユーザが知っている可能性が高い。このため、ユーザ設定記憶部321を参照し、各情報源について、その情報源を配信元として設定しているユーザの数や比率に基づき、多くのユーザが設定しているほど低い評価値となるように算出する。
情報源評価部313は、以上のような評価値は乗算したり、その中の最小値を選択したりするなど、一般的な評価値の合成方法で合成する。
第3の実施形態の関連情報判定部314は、各ユーザごとに、類似度算出部312で得られた類似度が高く、情報源評価部313で得られた評価値が高い情報源に対応付けられた蓄積情報を、ユーザに紹介する関連情報と判定するものである。この蓄積情報の類似度と情報源の評価値からの判定には、2種類のパラメータを用いる一般的な手法を適用可能である。例えば、類似度と評価値を乗算した値に基づいて行う。但し、評価値がある値以下の場合にはその情報源からの蓄積情報を用いないなど、制約を付与するようにしても良い。
(C−2)第3の実施形態の動作
次に、第3の実施形態の情報提供装置300の動作(第3の実施形態の情報提供方法)を、具体例を用いながら説明する。なお、上述した図5は、第3の実施形態の情報提供装置300の動作を示すフローチャートとして見ることもできる。
次に、第3の実施形態の情報提供装置300の動作(第3の実施形態の情報提供方法)を、具体例を用いながら説明する。なお、上述した図5は、第3の実施形態の情報提供装置300の動作を示すフローチャートとして見ることもできる。
情報取得部311は、ユーザ設定記憶部321に記憶されている、各ユーザごとに設定された情報源から定められた条件を満たす情報を取得し、配信情報蓄積部322に蓄積する。ここで、ユーザ3Aについて、図6(a)に示す配信情報(1次情報)C3a1が情報源3aから取得され、また、他のユーザについて、図6(b)〜(d)に示す配信情報C3a2、C3b、C3cがそれぞれ情報源3a、3b、3cから取得され、これら取得情報C3a1、C3a2、C3b及びC3cが配信情報蓄積部322に情報源3a、3b、3cが明らかにされて蓄積されたとする。
類似度算出部312は、ユーザ3Aに関しては、図6(a)に示す配信情報C3a1と、配信情報蓄積部322中の図6(b)〜(d)に示す他の蓄積情報C3a2、C3b、C3cとの間の類似度を算出する。詳述は省略するが、配信情報C3a1に対し、蓄積情報C3a2の類似度が50%、蓄積情報C3bの類似度が50%、蓄積情報C3cの類似度が50%と算出されたとする(第1の実施形態参照)。
ここで、情報源評価記憶部323には、情報源3bを、関連情報を紹介する情報源として不適当なものとして予め記憶させているものとする。
情報源評価部313は、対象となっているユーザ3Aが取得した図6(a)に示す配信情報C3a1の情報源3aを、紹介する関連情報の情報源として不適当と判定する。また、情報源評価部313は、情報源3bについては、情報源評価記憶部323を参照し、そこに登録されているために、紹介する関連情報の情報源として不適当と判定する。上述したいずれの条件にもあてはまらない情報源3cについては、情報源評価部313は、情報源として設定しているユーザ数に応じた評価値を与える。例えば、評価値として、(全ユーザ数/設定しているユーザ数)の対数値などが考えられる。以下では、この情報源3cについての評価値が充分大きい、すなわち、情報源としての適合性が高いものとする。
関連情報判定部314では、情報源評価部313で情報源としてふさわしくないと判定された情報源3a、3bから得られた、図6(b)、(c)に示す蓄積情報C3a21、C3bは関連情報にしないと判定し、図6(d)に示す蓄積情報C3cについては、類似度50%と、情報源評価部313による情報源3cの評価値を乗じたものが充分大きいので、関連情報と判定する。
出力部315により、ユーザ3Aは、図6(a)の配信情報C3a1を受け取ると共に、図6(d)の蓄積情報C3cを関連情報として紹介される。
以上説明したように、ユーザ3Aが情報源3aからの情報C3a1の配信を受けた場合、同じ情報源3aからの図6(b)に示す蓄積情報C3a2は類似度が適当であっても紹介されない。
以上の説明では、情報源評価部313は、3つの観点(すなわち、配信情報と同じ情報源であるか否か、周知情報源であるか否か、設定ユーザが多い情報源であるか否か)から、蓄積情報の情報源を、関連情報にふさわしい情報源であるか評価するものを示したが、少なくとも1以上の観点で評価するものであっても良い。
(C−3)第3の実施形態の効果
第3の実施形態によれば、紹介せずとも、ユーザが自分に配信された情報から情報源にアクセスして目にするだろう情報を敢えて紹介することを未然に防止することができる。
第3の実施形態によれば、紹介せずとも、ユーザが自分に配信された情報から情報源にアクセスして目にするだろう情報を敢えて紹介することを未然に防止することができる。
また、情報源評価記憶部にニュースサイトのように普段目にするサイトを関連情報の紹介に不適当な情報源として登録しておけば、そのような情報源からの情報がユーザに紹介されることがない。従って、ユーザが普段目にするサイトの情報のような、紹介されずとも読む可能性が高い情報を紹介することを未然に防止することができる。
さらに、その他の情報源については、それを情報源として設定しているユーザ数から、一般的に知られた情報源がどうかが評価され、これが関連情報として紹介されるか否かに反映される。
以上のように、あるユーザについて配信された情報と同じ情報源からの情報が紹介されることがなくなる。また、ニュースサイトなど広く知られている情報源からの情報は紹介されなくなり、普通に読んでいる情報が紹介されることが回避される。すなわち、ユーザがすでに知っている可能性が高い情報が紹介されることを、情報源を評価することにより回避することができる。
(D)第4の実施形態
次に、本発明による情報提供装置、情報提供方法及び情報提供プログラムの第4の実施形態を、図面を参照しながら詳述する。
次に、本発明による情報提供装置、情報提供方法及び情報提供プログラムの第4の実施形態を、図面を参照しながら詳述する。
(D−1)第4の実施形態の構成
第4の実施形態の情報提供装置も、例えば、サーバ、パソコンなどの通信機能を有する情報処理装置に情報提供プログラムがインストールされて構築され、機能的には、図7に示す構成を有する。なお、図7において、第1の実施形態に係る図1との同一、対応部分には対応符号(百桁の番号が「1」から「4」へ変化)を付して示している。
第4の実施形態の情報提供装置も、例えば、サーバ、パソコンなどの通信機能を有する情報処理装置に情報提供プログラムがインストールされて構築され、機能的には、図7に示す構成を有する。なお、図7において、第1の実施形態に係る図1との同一、対応部分には対応符号(百桁の番号が「1」から「4」へ変化)を付して示している。
図7において、第4の実施形態の情報提供装置400も、第1の実施形態と同様に、類似度算出部412、関連情報判定部414、出力部415及びユーザ設定記憶部421を有すると共に、さらに、情報差分取得部411、情報差分蓄積部422及び配信情報キャッシュ423を有している。なお、第4の実施形態の場合、不要情報評価部(113)は設けられていない。出力部415及びユーザ設定記憶部421は、第1の実施形態のものと同様である。
情報差分取得部411は、ユーザ設定記憶部421に記憶された全ユーザについて設定された情報源から得られた前回までの配信情報を情報キャッシュ423に記憶しており、今回取得した配信情報のうち前回と異なる差分のみを出力する。そして、これを情報差分蓄積部422に記憶する。差分は、行単位、文単位、段落単位など、所定の情報の区切り単位で判断される。また、完全一致部分だけを差分ではないとして落とすのではなく、一定以上類似した行なども同じものとして差分に入れないなど、前回と比較して新しくなった差分情報を得られる手法ならば既存のいかなる差分取得方法であっても良い。
情報キャッシュ423は、前回まで情報源より得られた配信情報を記憶し、新たに情報差分取得部411により情報の取得と差分の出力が行われると、新たな配信情報で更新される。
情報差分蓄積部422は、情報差分取得部411により得られた差分情報を蓄積情報として所定期間だけ蓄積するものである。例えば、今回の取得された差分情報のみ、あるいは、前回取得された差分情報のみなどを蓄積するものである。
類似度算出部412は、差分情報蓄積部422に記憶された各蓄積情報について、各ユーザごとに、情報差分取得部411で得られた差分情報との類似度を算出する。ここでは、差分情報間の類似度を算出したが、差分情報蓄積部422に記憶された各蓄積情報について、各ユーザごとに得られる情報源からの配信情報自体との類似度の算出を行っても良い。いずれの場合であっても、一般的な類似文書検索の手法を用いることができる。
関連情報判定部414は、各ユーザごとに、類似度算出部412による類似度に基づいて、蓄積情報の中から、該ユーザの配信情報に関連して紹介する関連情報を検出するものである。例えば、最も類似度が高いものから所定数を関連情報とする。
(D−2)第4の実施形態の動作
次に、第4の実施形態の情報提供装置400の動作(第4の実施形態の情報提供方法)を、具体例を用いながら説明する。なお、上述した図7は、第4の実施形態の情報提供装置400の動作を示すフローチャートとして見ることもできる。
次に、第4の実施形態の情報提供装置400の動作(第4の実施形態の情報提供方法)を、具体例を用いながら説明する。なお、上述した図7は、第4の実施形態の情報提供装置400の動作を示すフローチャートとして見ることもできる。
情報差分取得部411は、ユーザ設定記憶部421の各ユーザごとに設定された情報源から定められた条件を満たす情報を取得する。ここでは、ユーザ4Aが設定した情報源4aからは、図8(a)に示す配信情報C4AOが取得され、また、他のユーザ4Bが設定した情報源4bからは、図8(c)に示す配信情報C4BOが取得されたとする。これまで、これらの情報源4a、4bから同じ情報が配信されていなければ、配信情報キャッシュ423に記憶されている前回との差分は配信情報の全てとなり、これらはそのまま情報差分蓄積部422に蓄積される。また、得られたこれらの配信情報C4AO、C4BOは、配信情報キャッシュ423に記憶される。
類似度算出部412は、ユーザ4Aに関しては、ユーザ4Aについて得られた図8(a)に示す配信情報例C4AOと、ユーザ4A以外の他のユーザ4Bについて得られた、情報差分蓄積部422中の図8(c)に示す蓄積情報C4BOとの間の類似度を算出する。
図8(a)に示す配信情報例C4AOについては、形態素解析など一般的な自然言語処理技術で「防水」、「特徴」、「デジタルカメラ」、「発売」などの単語がキーワードとして抽出できる。一方、図8(c)に示す蓄積情報C4BOには、そのS1の部分に、これら4つのキーワードのうち2つが含まれているため、例えば、2/4=50%を類似度とする(ここでは、説明を簡単にするために、含まれているキーワードの率を類似度としているが、各キーワードの重みをidfで調整するなど一般的な文書検索における評価手法を用いることができる)。
ここで、関連情報判定部414は、配信情報C4AOに対する蓄積情報C4BOの類似度50%が充分高く、関連情報と判定されたものとする。
出力部415によって、ユーザ4Aは、図8(a)に示す配信情報C4AOを受け取ると共に、図8(c)に示す情報C4BOを関連情報として紹介される。
次に、情報を取得した際に、情報差分取得部411は、ユーザ4Aが設定した情報源4aからは図8(b)に示す配信情報C4ANを取得し、また、他のユーザ4Bが設定した情報源4bからは図8(d)に示す配信情報C4BNを取得したとする。図8(b)に示す配信情報C4ANについては、前回に同じ情報源4aからの情報として配信情報キャッシュ423に記憶されている、図8(a)に示す配信情報C4AOと文単位で比較される。ここでは、一致しないため、全てが差分情報として得られる。図8(d)に示す情報C4BNは、前回に同じ情報源4bからの情報として配信情報キャッシュ423に記憶されている、図8(c)に示す配信情報C4BOと文単位で比較される。図8(d)に示す情報C4BNの文S3と、図8(c)に示す情報C4BOの文S1が一致するため、一致文は取り除かれ、図8(d)に示す情報C4BNの文S2のみが差分として得られる。
こうして得られた差分である図8(b)に示す情報C4ANと、図8(d)の情報C4BNの文S2が情報差分蓄積部422に記憶される。
また、図8(b)に示す配信情報C4ANと、図8(d)に示す配信情報C4BNが配信情報キャッシュ423に記憶される。
類似度算出部412は、ユーザ4Aについては、ユーザ4Aに配信された図8(b)に示す配信情報C4ANと、他のユーザ4Bについて情報差分記憶部422に記憶されている図8(d)に示す情報C4BNの文S2との類似度を算出する。
図8(b)に示す配信情報C4ANについては、形態素解析など一般的な自然言語処理技術で「5倍」、「ズーム」、「搭載」、「デジタルカメラ」、「発売」などの単語がキーワードとして抽出される。情報差分記憶部422に記憶されている文S2には、これら5つのキーワードのいずれも含まれていないため、類似度は0%でする。
関連情報判定部414では、情報差分記憶部422の図8(d)の情報C4BNの文S2の類似度が0%と低いため、これを関連情報とは判定しない。
出力部415によって、ユーザ4Aは、図8(b)に示す配信情報C4ANを受け取るが、図8(d)に示すユーザ4Bが受ける情報C4BNの紹介を受けることがない。
以上説明したように、ユーザ4Aは、図8(a)に示す情報C4AOを受け取ったときにはユーザ4Bに配信された図8(b)に示す情報C4BOの紹介を受けるが、その後、図8(b)に示す情報C4ANを受け取ったときには、ユーザ4Bに配信された図8(d)に示す情報C4BNのうち、すでに紹介されている図8(b)に示す情報C4BOと同一の部分S3は紹介の判断対象とならず、重複して紹介されることはない。
因みに、従来の手法であれば、図8(d)に示す情報部分S2に「発売」、「デジタルカメラ」など適合するキーワードがあって類似度が高くなるため、既に紹介済みの図8(c)に示す情報C4BOの部分S1と同じ情報にも関わらず、再度、ユーザ4Aに紹介されてしまうが、第4の実施形態ではこのようなことを回避することができる。
(D−3)第4の実施形態の効果
第4の実施形態によれば、全ユーザに配信されたそれぞれの情報に、継続して掲載される情報があっても、差分を取るために初回しか情報差分蓄積部に蓄積されず、このような継続情報の存在によって全体の類似度が高くても、継続情報を除外した差分での類似度を小さくでき、継続情報のために関連情報として紹介するようなことを未然に防止することができる。言い換えると、最新の情報のみ紹介されるため、情報の鮮度が高いという効果もある。
第4の実施形態によれば、全ユーザに配信されたそれぞれの情報に、継続して掲載される情報があっても、差分を取るために初回しか情報差分蓄積部に蓄積されず、このような継続情報の存在によって全体の類似度が高くても、継続情報を除外した差分での類似度を小さくでき、継続情報のために関連情報として紹介するようなことを未然に防止することができる。言い換えると、最新の情報のみ紹介されるため、情報の鮮度が高いという効果もある。
(E)他の実施形態
上記各実施形態は、複数のユーザに情報配信を行うシステムにおいて、あるユーザに配信される情報に基づいて、他ユーザに配信される情報を関連情報として紹介することを意図したものであった。しかしながら、第1や第4の実施形態であれば、関連情報は、他のユーザへ配信される情報以外であっても良い。また、第3の実施形態の場合であっても、情報源の評価に各ユーザでの情報源の設定内容を用いない場合であれば、関連情報は、他のユーザへ配信される情報以外であっても良い。
上記各実施形態は、複数のユーザに情報配信を行うシステムにおいて、あるユーザに配信される情報に基づいて、他ユーザに配信される情報を関連情報として紹介することを意図したものであった。しかしながら、第1や第4の実施形態であれば、関連情報は、他のユーザへ配信される情報以外であっても良い。また、第3の実施形態の場合であっても、情報源の評価に各ユーザでの情報源の設定内容を用いない場合であれば、関連情報は、他のユーザへ配信される情報以外であっても良い。
また、配信情報は、メールマガジンのように送られてくるものを受信する場合の他、Web文書やデータベースのような情報を定期的に取得する場合などの形態で得る場合であっても良い。
上記各実施形態では、あるユーザへの配信情報を、他のユーザへの関連情報候補とするものであるが、関連情報候補の蓄積(キャッシュでの記憶を含む)は、配信情報とするユーザが複数人いても1個だけにするようにしても良い。
さらに、第1〜第4の実施形態の技術思想を組み合わせて利用するようにしても良い。例えば、第1、第3及び第4の実施形態の技術思想を組み合わせた場合には、類似度が高くほぼ同じ内容のものも、情報源が一般的で知らせる必要が薄い情報も、最新の差分により過去に繰り返し提示されている情報も、いずれもユーザに紹介することを回避できるようになる。
ここで、第2の実施形態は、第1の実施形態の技術思想に対し、関連情報は類似ユーザへ配信したものという制約を付与したものであるが、第3や第4の実施形態の技術思想に対し、第2の実施形態のような関連情報は類似ユーザへ配信したものという制約を付与するようにしても良い。
また、関連情報候補は、最新に受信した他のユーザの配信情報に限定されず、他のユーザへの過去(所定期間内又は所定回数内)の配信情報であっても良い。差分を問題とする第4の実施形態についても同様であり、例えば、配信が相前後する配信情報の差分を考慮すればよい。
100、200、300、400…情報提供装置、
111、211、311…情報取得部、
112、212、312、412…類似度算出部、
113、213…不要情報評価部、
114、214、314、414…関連情報判定部、
115、215、315、415…出力部、
121、221、321、421…ユーザ設定記憶部、
122、222、322…配信情報蓄積部、
216…類似ユーザ判定部、
313…情報源評価部、
323…情報源評価記憶部、
411…情報差分取得部、
422…情報差分蓄積部、
423…配信情報キャッシュ。
111、211、311…情報取得部、
112、212、312、412…類似度算出部、
113、213…不要情報評価部、
114、214、314、414…関連情報判定部、
115、215、315、415…出力部、
121、221、321、421…ユーザ設定記憶部、
122、222、322…配信情報蓄積部、
216…類似ユーザ判定部、
313…情報源評価部、
323…情報源評価記憶部、
411…情報差分取得部、
422…情報差分蓄積部、
423…配信情報キャッシュ。
Claims (21)
- ユーザによる設定に基づき、上記ユーザに配信すべき情報を情報源より配信情報として取得して配信すると共に、この配信情報と関連性がある関連情報を紹介する情報提供装置において、
上記関連情報となり得る関連情報候補の中から、上記配信情報と重複した情報提供になるもの、又は、上記配信情報と重複した情報提供になる可能性が高いものを除外して関連情報を決定する重複情報提供回避手段を有することを特徴とする情報提供装置。 - 上記重複情報提供回避手段は、
上記ユーザヘの配信情報と上記各関連情報候補との間の類似度を算出する類似度算出部と、
上記各関連情報候補について上記類似度算出部による類似度が高いほど上記ユーザに紹介することが不要であることを示す不要度が高いと評価する不要情報評価部と、
上記不要情報評価部による不要度が不要度用閾値以下であり、かつ、上記類似度算出部による類似度が類似度用閾値以上である関連情報候補から、関連情報を定める関連情報判定部と
を備えたことを特徴とする請求項1に記載の情報提供装置。 - 上記重複情報提供回避手段は、
上記ユーザヘの配信情報と上記各関連情報候補との間の類似度を算出する類似度算出部と、
上記各関連情報候補の情報源について、関連情報への適合性を表す情報源評価値を与える情報源評価部と、
上記情報源評価部による情報源評価値が情報源用閾値より高い情報源からの情報であり、かつ、上記類似度算出部による類似度が類似度用閾値以上である関連情報候補から、関連情報を定める関連情報判定部と
を備えたことを特徴とする請求項1に記載の情報提供装置。 - 上記情報源評価部は、上記ユーザへの配信情報の情報源についての情報源評価値を低くすることを特徴とした請求項3に記載の情報提供装置。
- 上記重複情報提供回避手段は、情報源評価値を低くすべき情報源を登録している情報源評価記憶部をさらに備え、
上記情報源評価部は、上記情報源評価記憶部に登録されている情報源の情報源評価値を低くする
ことを特徴とする請求項3又は4に記載の情報提供装置。 - 上記情報源評価部は、多くのユーザが情報源設定を行っている情報源ほど低い情報源評価値を与えることを特徴とした請求項3〜5のいずれかに記載の情報提供装置。
- 上記重複情報提供回避手段は、
最新の上記ユーザへの配信情報および関連情報候補を記憶する配信情報キャッシュと、
上記ユーザへの配信情報について、上記配信情報キャッシュに記憶された前回の取得内容との差分情報を得ると共に、上記各関連情報候補について、上記配信情報キャッシュに記憶された前回の取得内容との差分情報を得る情報差分取得部と、
上記ユーザへの配信情報又は差分情報と、上記各関連情報候補についての差分情報との間の類似度を算出する類似度算出部と、
上記類似度算出部による類似度が類似度用閾値以上の関連情報候補から、関連情報を定める関連情報判定部と
を備えたことを特徴とする請求項1に記載の情報提供装置。 - 上記重複情報提供回避手段は、上記ユーザ以外のユーザへの配信情報を関連情報候補とするものであることを特徴とする請求項1〜7のいずれかに記載の情報提供装置。
- 上記重複情報提供回避手段は、上記ユーザ以外のユーザへの所定期間内又は所定回数内の過去の配信情報を関連情報候補として、蓄積又はキャッシュする蓄積部を有することを特徴とする請求項8に記載の情報提供装置。
- 上記重複情報提供回避手段は、上記ユーザと同種の情報提供を受けている類似ユーザを検出する類似ユーザ判定部を有し、上記類似ユーザへの配信情報の中から、関連情報を定めることを特徴とする請求項8又は9に記載の情報提供装置。
- ユーザによる設定に基づき、上記ユーザに配信すべき情報を情報源より配信情報として取得して配信すると共に、この配信情報と関連性がある関連情報を紹介する情報提供方法において、
上記関連情報となり得る関連情報候補の中から、上記配信情報と重複した情報提供になるもの、又は、上記配信情報と重複した情報提供になる可能性が高いものを除外して関連情報を決定する重複情報提供回避工程を含むことを特徴とする情報提供方法。 - 上記重複情報提供回避工程は、
上記ユーザヘの配信情報と上記各関連情報候補との間の類似度を算出する類似度算出サブ工程と、
上記各関連情報候補について上記類似度算出サブ工程による類似度が高いほど上記ユーザに紹介することが不要であることを示す不要度が高いと評価する不要情報評価サブ工程と、
上記不要情報評価サブ工程による不要度が不要度用閾値以下であり、かつ、上記類似度算出サブ工程による類似度が類似度用閾値以上である関連情報候補から、関連情報を定める関連情報判定サブ工程と
を備えたことを特徴とする請求項11に記載の情報提供方法。 - 上記重複情報提供回避工程は、
上記ユーザヘの配信情報と上記各関連情報候補との間の類似度を算出する類似度算出サブ工程と、
上記各関連情報候補の情報源について、関連情報への適合性を表す情報源評価値を与える情報源評価サブ工程と、
上記情報源評価サブ工程による情報源評価値が情報源用閾値より高い情報源からの情報であり、かつ、上記類似度算出サブ工程による類似度が類似度用閾値以上である関連情報候補から、関連情報を定める関連情報判定サブ工程と
を備えたことを特徴とする請求項11に記載の情報提供方法。 - 上記情報源評価サブ工程は、上記ユーザへの配信情報の情報源についての情報源評価値を低くすることを特徴とした請求項13に記載の情報提供方法。
- 上記情報源評価サブ工程は、情報源評価値を低くすべき情報源を登録している情報源評価記憶部に登録されている情報源の情報源評価値を低くする
ことを特徴とする請求項13又は14に記載の情報提供方法。 - 上記情報源評価サブ工程は、多くのユーザが情報源設定を行っている情報源ほど低い情報源評価値を与えることを特徴とした請求項13〜15のいずれかに記載の情報提供方法。
- 上記重複情報提供回避工程は、
上記ユーザへの配信情報について、最新の上記ユーザへの配信情報および関連情報候補を記憶する配信情報キャッシュに記憶された前回の取得内容との差分情報を得ると共に、上記各関連情報候補について、上記配信情報キャッシュに記憶された前回の取得内容との差分情報を得る情報差分取得サブ工程と、
上記ユーザへの配信情報又は差分情報と、上記各関連情報候補についての差分情報との間の類似度を算出する類似度算出サブ工程と、
上記類似度算出サブ工程による類似度が類似度用閾値以上の関連情報候補から、関連情報を定める関連情報判定サブ工程と
を備えたことを特徴とする請求項11に記載の情報提供方法。 - 上記重複情報提供回避工程は、上記ユーザ以外のユーザへの配信情報を関連情報候補とするものであることを特徴とする請求項11〜17のいずれかに記載の情報提供方法。
- 上記重複情報提供回避工程は、上記ユーザ以外のユーザへの所定期間内又は所定回数内の過去の配信情報を関連情報候補として、蓄積又はキャッシュする蓄積サブ工程を有することを特徴とする請求項18に記載の情報提供方法。
- 上記重複情報提供回避工程は、上記ユーザと同種の情報提供を受けている類似ユーザを検出する類似ユーザ判定サブ工程を有し、上記類似ユーザへの配信情報の中から、関連情報を定めることを特徴とする請求項18又は19に記載の情報提供方法。
- 請求項11〜20のいずれかに記載の情報提供方法を、コンピュータが実行可能なコードで記述していることを特徴とする情報提供プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005152734A JP2006331014A (ja) | 2005-05-25 | 2005-05-25 | 情報提供装置、情報提供方法及び情報提供プログラム |
US11/438,351 US20060271534A1 (en) | 2005-05-25 | 2006-05-23 | Information-providing apparatus and information-providing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005152734A JP2006331014A (ja) | 2005-05-25 | 2005-05-25 | 情報提供装置、情報提供方法及び情報提供プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006331014A true JP2006331014A (ja) | 2006-12-07 |
Family
ID=37464683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005152734A Pending JP2006331014A (ja) | 2005-05-25 | 2005-05-25 | 情報提供装置、情報提供方法及び情報提供プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20060271534A1 (ja) |
JP (1) | JP2006331014A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010093765A (ja) * | 2008-10-10 | 2010-04-22 | Hitachi Ltd | 情報処理装置、及びコンテンツに係わる関連情報の処理方法 |
JP2016520942A (ja) * | 2013-06-06 | 2016-07-14 | フェイスブック,インク. | トピックに関連付けられているコンテンツ・アイテムのフィードを複数のコンテンツ・ソースから生成する |
JP2016536725A (ja) * | 2013-09-25 | 2016-11-24 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | ユーザ行動の特徴を抽出して推奨を個人化する方法及びシステム |
US10564848B2 (en) | 2016-04-13 | 2020-02-18 | Fujitsu Limited | Information storage device and method for deduplication |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006040085A (ja) * | 2004-07-29 | 2006-02-09 | Sony Corp | 情報処理装置および方法、記録媒体、並びにプログラム |
US9984166B2 (en) * | 2014-10-10 | 2018-05-29 | Salesforce.Com, Inc. | Systems and methods of de-duplicating similar news feed items |
US10592841B2 (en) | 2014-10-10 | 2020-03-17 | Salesforce.Com, Inc. | Automatic clustering by topic and prioritizing online feed items |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6772150B1 (en) * | 1999-12-10 | 2004-08-03 | Amazon.Com, Inc. | Search query refinement using related search phrases |
WO2002103578A1 (en) * | 2001-06-19 | 2002-12-27 | Biozak, Inc. | Dynamic search engine and database |
US7117200B2 (en) * | 2002-01-11 | 2006-10-03 | International Business Machines Corporation | Synthesizing information-bearing content from multiple channels |
US7567953B2 (en) * | 2002-03-01 | 2009-07-28 | Business Objects Americas | System and method for retrieving and organizing information from disparate computer network information sources |
US20030220913A1 (en) * | 2002-05-24 | 2003-11-27 | International Business Machines Corporation | Techniques for personalized and adaptive search services |
US7158966B2 (en) * | 2004-03-09 | 2007-01-02 | Microsoft Corporation | User intent discovery |
-
2005
- 2005-05-25 JP JP2005152734A patent/JP2006331014A/ja active Pending
-
2006
- 2006-05-23 US US11/438,351 patent/US20060271534A1/en not_active Abandoned
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010093765A (ja) * | 2008-10-10 | 2010-04-22 | Hitachi Ltd | 情報処理装置、及びコンテンツに係わる関連情報の処理方法 |
JP2016520942A (ja) * | 2013-06-06 | 2016-07-14 | フェイスブック,インク. | トピックに関連付けられているコンテンツ・アイテムのフィードを複数のコンテンツ・ソースから生成する |
JP2016536725A (ja) * | 2013-09-25 | 2016-11-24 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | ユーザ行動の特徴を抽出して推奨を個人化する方法及びシステム |
US10178190B2 (en) | 2013-09-25 | 2019-01-08 | Alibaba Group Holding Limited | Method and system for extracting user behavior features to personalize recommendations |
US10564848B2 (en) | 2016-04-13 | 2020-02-18 | Fujitsu Limited | Information storage device and method for deduplication |
Also Published As
Publication number | Publication date |
---|---|
US20060271534A1 (en) | 2006-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9390144B2 (en) | Objective and subjective ranking of comments | |
US8326836B1 (en) | Providing time series information with search results | |
US9875313B1 (en) | Ranking authors and their content in the same framework | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
US10185751B1 (en) | Identifying and ranking attributes of entities | |
JP2007188352A (ja) | ページリランキング装置、ページリランキングプログラム | |
JP2006331014A (ja) | 情報提供装置、情報提供方法及び情報提供プログラム | |
US20100153213A1 (en) | Systems and Methods for Dynamic Content Selection and Distribution | |
US7996418B2 (en) | Suggesting long-tail tags | |
JP4896132B2 (ja) | 情報価値を反映した情報検索方法及びその装置 | |
JP2008084193A (ja) | インスタンス選択装置、インスタンス選択方法及びインスタンス選択プログラム | |
KR100856916B1 (ko) | 관심사를 반영하여 추출한 정보 제공 방법 및 시스템 | |
De Nies et al. | Bringing Newsworthiness into the 21st Century. | |
WO2012115254A1 (ja) | 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 | |
JP2006318398A (ja) | ベクトル生成方法及び装置及び情報分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
KR101614843B1 (ko) | 사회 이슈에 대한 은폐를 탐지하는 방법 및 판단 장치 | |
KR101648046B1 (ko) | 오픈소스 소프트웨어 추천 시스템 및 방법 | |
JP2002157270A (ja) | 興味記事配信システム及び興味記事配信方法 | |
JP6204923B2 (ja) | アセスメント装置、アセスメントシステム、アセスメント方法、及びプログラム | |
JP2010218216A (ja) | 類似文書検索システム、方法及びプログラム | |
JP2010015394A (ja) | リンク先提示装置およびコンピュータプログラム | |
JP4977004B2 (ja) | 関連キーワード抽出方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP2009288964A (ja) | 関連キーワード抽出方法及び装置及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP2011150538A (ja) | 重要キーワード抽出装置及び方法及びプログラム | |
JP2010224941A (ja) | 関連情報検索装置、関連情報検索方法、および関連情報検索プログラム |