JP2003016094A - 情報フィルタリングに用いるプロファイル管理方法、および、プロファイル管理プログラム - Google Patents

情報フィルタリングに用いるプロファイル管理方法、および、プロファイル管理プログラム

Info

Publication number
JP2003016094A
JP2003016094A JP2001195859A JP2001195859A JP2003016094A JP 2003016094 A JP2003016094 A JP 2003016094A JP 2001195859 A JP2001195859 A JP 2001195859A JP 2001195859 A JP2001195859 A JP 2001195859A JP 2003016094 A JP2003016094 A JP 2003016094A
Authority
JP
Japan
Prior art keywords
profile
user
information
information filtering
profiles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001195859A
Other languages
English (en)
Inventor
Yasuhiko Inaba
靖彦 稲場
Katsumi Tada
勝己 多田
Yoshifumi Sato
佳史 里
Tadataka Matsubayashi
忠孝 松林
Makoto Uchikado
内角  真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001195859A priority Critical patent/JP2003016094A/ja
Priority to EP02250562A priority patent/EP1271357A3/en
Priority to US10/059,206 priority patent/US20030009440A1/en
Publication of JP2003016094A publication Critical patent/JP2003016094A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】検索条件データとなるプロファイルを用いて、
文書情報をフィルタリングして提示する情報フィルタリ
ングにおいて、類似した複数のプロファイルの存在や、
古くなったプロファイルの存在を検知し、ユーザに知ら
せることにより、ユーザの対処を促して、情報フィルタ
リングの際のノイズや漏れのない配信結果を得られるよ
うにする。 【解決手段】複数のプロファイル間の類似度や、プロフ
ァイルの文書情報に対するヒット数などから、情報フィ
ルタリングに用いる際のプロファイルの有効性をユーザ
に通知して、不要なもの削除させる。また、複数のプロ
ファイルを統合したり、特殊化して不要なプロファイル
をなくすようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報フィルタリン
グに用いるプロファイル管理方法に係り、検索条件デー
タとなるプロファイルを用いて文書情報をフィルタリン
グする際に、重複や漏れがなく、ユーザの望む結果を得
ることのできるプロファイル管理方法に関する。
【0002】
【従来の技術】近年、電子メールや電子ニュース等によ
り大量の電子化文書(以下、テキストと呼ぶ)が時々刻
々ユーザへ配信されるようになってきた。また、WWW
(World Wide Web)を利用して情報発信をおこなう情報
源が急増しており、これらの情報源から情報収集ロボッ
ト等を用いて収集されるテキストも膨大な量となってい
る。このため、これらのテキストの中から、ユーザが求
める情報を含むテキストを検索し、これを、ユーザに配
信する情報フィルタリングシステムへのニーズが高まっ
ている。
【0003】この情報フィルタリングシステムとして、
例えば、特開平10−27182号公報(以下、従来技
術1と呼ぶ)が開示されている。従来技術1では、ユー
ザが設定した単語による検索条件式に合致する文書情報
のみを、そのユーザに配送する技術である。
【0004】しかしながら、あまり使用されない希少な
単語を検索条件として指定した場合や、一般的な単語で
あっても複雑に組み合わせた検索条件を指定した場合に
は、検索漏れが発生してしまうという問題があった。
【0005】また逆に、一般的な単語だけを指定した単
純な検索条件式を指定した場合には、検索の目的には適
合しない文書(以下、「検索ノイズ」と呼ぶ)を検索結
果に多く含んでしまうという問題があった。
【0006】上記の問題を改善するフィルタリング技術
として、本出願人は、特願平11−75005号(以
下、従来技術2と呼ぶ)を提案した。この従来技術2に
おいては、ユーザは単語ではなく、配信して欲しい情報
を表すサンプルの文書(以下、「種文書」と呼ぶ)を検
索条件として入力する。そしてその文書と文書情報との
内容の適合度を所定の方法により算出し、適合度が所定
値を超える文書情報だけを該当ユーザに配送する。
【0007】ここで、図2および図3を用いて従来技術
2に代表される一般的なフィルタリングシステムの処理
について説明する。図2は、一般的なプロファイルを用
いたフィルタリングシステムの処理を示すPAD(Prob
lem Analysis Diagram)ある。図3は、一般的なプロフ
ァイルを用いたフィルタリングシステムの具体的な処理
の流れを示す概要図である。
【0008】図2に示されるとおり、従来技術2に代表
される一般的なフィルタリングシステムでは、先ずユー
ザから種文書が入力された場合(S501)、該当ユー
ザの検索条件データ(以下、「プロファイル」と呼ぶ)
を生成する(S502)。次に、情報リソースから文書
情報が送られてきた場合(S503)、各ユーザのプロ
ファイルと該当文書情報との適合度を算出し、所定の条
件を満たすユーザに該当文書情報を配送する(S50
4)。
【0009】この処理を具体例をふまふて、図3により
説明すると以下のようになる。
【0010】先ず、ユーザ201が配信して欲しい情報
を表すサンプルの文書202(以下、「種文書」と呼
ぶ)を登録する。この図3の例では、ユーザ201は、
高校野球関連の情報が発生した場合に、これを配信して
欲しいと思っており、「高校野球が甲子園で開幕・・
・」という種文書202を設定している。
【0011】システムは、その種文書202から、その
文書の内容を特徴的に表すキーワード(以下、「特徴文
字列」と呼ぶ)を抽出して、種文書内出現回数をカウン
トして、それを各文字列の重みとして、対にしてプロフ
ァイル203に登録する(図3の)。図3の例では、
種文書202から「高校」「野球」「甲子園」「開幕」
といった特徴文字列を抽出して、それらの出現回数を重
みとしてプロファイル203に登録している。
【0012】その後、情報リソース204から次々と文
書情報205が送られてきたときに、その文書情報とプ
ロファイル203との内容がどのくらい合致しているか
を表す適合度を算出する(図3の)。ここで、あるプ
ロファイルと文書情報の適合度の算出式としては、例え
ば以下に示す(式1)を用いる。
【0013】
【数1】 この式で、S(D)は文書情報Dとプロファイルとの適
合度であり、Frq(i)は特徴文字列iの文書情報D
における出現回数であり、w(i)は該当プロファイル
内の特徴文字列iの重みである。Σは該当プロファイル
内の全ての特徴文字列について和をとることを示す。こ
の式により、プロファイル203内で高い重みを付与さ
れた特徴文字列が多く出現する文書情報ほど、高い適合
度が算出されることになる。
【0014】そして、適合度が予め指定された値を超え
る文書情報207のみをユーザに配信する(図3の
)。図3に示した例では、プロファイル203にある
文字列を含む「甲子園で熱戦展開中・・・」、「プロ野
球日本シリーズ開幕・・・」、「高校野球は甲子園球場
で・・・」といった文書情報207が高い適合度を算出
されて、ユーザ201に配信されることになる。
【0015】このように、従来技術2を用いることによ
り、ユーザは所望の情報を含む種文書を例示するだけ
で、大量の文書情報の中から、種文書と内容が類似する
情報のみをフィルタリング結果として受け取ることが可
能になる。
【0016】
【発明が解決しようとする課題】上記従来技術2は、大
量の文書からユーザが目的の文書を見つけ出すために、
予め種文書を基にしたプロファイルを作成しておく情報
フィルタリングの技法に関するものである。
【0017】しかしながら、上記従来技術2のような情
報フィルタリングシステムにおいては以下のような問題
がある。
【0018】この問題点について、具体例をとって、図
4を用いて説明する。図4は、一般的なプロファイルを
用いたフィルタリングシステムにおいて、ユーザが複数
のプロファイルを持つ場合の具体的な処理の流れを示す
概要図である。
【0019】一般に、ひとりのユーザが興味を持ってい
る観点はひとつではない場合が多く、複数の観点の話題
を配信できるようにすることが望ましい。したがって、
ひとりのユーザが複数のプロファイルを設定できるよう
にし、情報フィルタリングシステムはそれぞれのプロフ
ァイルに合致する文書情報をそのユーザに配信するとい
う形態を採るのが一般的である。
【0020】そのときに、ひとりのユーザが似たような
内容のプロファイルを複数設定してしまっている場合、
同一の文書情報がそれぞれのプロファイルに合致するも
のとして重複して送られてしまう場合がある。
【0021】例えば、図4に示したように、ユーザ30
8は、プロ野球に関する文書情報と、高校野球に関する
文書情報を欲しいと思っており、それぞれプロファイル
A304とプロファイルB305を設定しているものと
する。
【0022】このような場合、プロ野球と高校野球は違
った観点だが、「野球」という共通の話題であるため、
プロファイルA304とプロファイルB305の内容が
類似してしまう。この図の例では、AとBの両方のプロ
ファイルに「野球」と「開幕」という特徴文字列が登録
されている。したがって、これらの特徴文字列を含むよ
うな文書情報は、AとBの両方のプロファイルとの適合
度が高くなる。
【0023】その結果、プロファイルAに合致する文書
情報306と、プロファイルBに合致する文書情報30
7の中には重複する文書情報が含まれてしまう。図4の
例では、「高校野球は甲子園球場で・・・」、「プロ野
球日本シリーズ開幕・・・」という文書情報は「野球」
や「開幕」という文字列を含んでいるため、AとBの両
方のプロファイルとの適合度が高くなるため、重複して
ユーザに配信されてしまう。
【0024】このように従来技術2では、複数のプロフ
ァイルを設定すると重複する文書情報が送られてくる場
合がある。そのため、ユーザにとってはノイズが多い配
信結果になり、欲しい情報を見つけるまでの手間がかか
る。また、配信文書数に制限がある場合には、重複した
分ほかの欲しい文書情報が送られてこないため、配信漏
れが生じてしまう可能性も生じる。
【0025】また、今ひとつの問題点として、もう古く
なった話題や興味のなくなった話題を表すようなプロフ
ァイルを設定したまま残してしまう場合が考えられる。
【0026】例えば、図4に示したように、ユーザ30
8は、シドニー五輪の話題も送信して欲しいと思ってお
り、プロファイルC309を設定していたものとする。
しかし例えば、時間が経過して、シドニー五輪の話題は
もう過去の話題となり、関連する話題が発生しないよう
になったとする。そのとき、ユーザは古くなってしまっ
た無駄なプロファイルを自分が設定しているということ
を把握する手段がない。特に、ひとりのユーザが多数の
プロファイルを設定できる場合には、逐一無駄なプロフ
ァイルを設定していないかということを把握するのは極
めて困難である。ひとりのユーザが設定できるプロファ
イル数が制限されている場合や、設定しているプロファ
イル数にもとづいて課金するようなサービス体系におい
ては、このような無駄なプロファイルの存在を知る手段
がないことはユーザにとって大きな問題となる。
【0027】また、このようなプロファイルを設定して
いると、無駄なプロファイルと各文書情報との適合度算
出をおこなわねばならず、結果として、システム全体の
性能の低下を招いてししまうという問題もある。
【0028】本発明は、上記問題点を解決するためにな
されたもので、その目的は、検索条件データとなるプロ
ファイルを用いて、文書情報をフィルタリングして提示
する情報フィルタリングにおいて、類似した複数のプロ
ファイルの存在や、古くなったプロファイルの存在を検
知し、ユーザに知らせることにより、ユーザの対処を促
して、情報フィルタリングの際のノイズや漏れのない配
信結果を得ることのできるプロファイルの管理方法を提
供することにある。
【0029】また、本発明の今ひとつの目的は、古くな
ったものなど無駄なプロファイルを、適切に、しかも容
易に、最適化したり、削除できるようにして、無駄なプ
ロファイルを保持してしまうことを防ぎ、ユーザが効率
的にプロファイルを設定することができ、しかも、無駄
なプロファイルの参照をおこなわないようにしてシステ
ムとしても性能の低下を招かないようなプロファイルの
管理方法を提供することにある。
【0030】
【課題を解決するための手段】上記目的を達成するため
に、本発明の情報フィルタリングに用いるプロファイル
管理方法に係る発明の構成は、検索条件データとなるプ
ロファイルとの適合度を算出することにより、文書情報
をフィルタリングして提示する情報フィルタリングに用
いるプロファイル管理方法において、前記プロファイル
に対して、前記情報フィルタリングをおこなう際の有効
度を算出して、その有効度の算出結果により、前記プロ
ファイルの有効性をユーザに通知するようにしたもので
ある。
【0031】より詳しくは、上記情報フィルタリングに
用いるプロファイル管理方法において、前記情報フィル
タリングをおこなう際の有効度が、複数のプロファイル
が存在する場合の、それらの間における類似度であるよ
うにしたものである。
【0032】また詳しくは、上記情報フィルタリングに
用いるプロファイル管理方法において、前記複数のプロ
ファイルの内で、ユーザが指定した二つ以上のプロファ
イルから、一つのプロファイルに統合するようにしたも
のである。
【0033】上記目的を達成するために、本発明の情報
フィルタリングに用いるプロファイル管理方法に係る発
明の別の構成は、検索条件データとなるプロファイルと
の適合度を算出することにより、文書情報をフィルタリ
ングして提示する情報フィルタリングに用いるプロファ
イル管理方法において、ユーザに二つ以上のプロファイ
ルを指定させ、その指定された各々のプロファイルの特
徴を比較し、前記情報フィルタリングをおこなう際に結
果の差異が出るように、そのプロファイルを特殊化して
修正するようにしたものである。
【0034】さらに詳しくは、上記情報フィルタリング
に用いるプロファイル管理方法において、前記有効度
が、前記情報フィルタリングを過去所定時間内におこな
った際の、そのプロファイルと合致したテキスト情報の
発生頻度、前記情報フィルタリングを過去所定時間内に
おこなった際の、そのプロファイルと合致したテキスト
情報のユーザ評価、過去所定時間内にユーザがプロファ
イルを修正した頻度、そのプロファイルの作成日付を基
にして算出するようにしたものである。
【0035】さらにまた詳しくは、上記情報フィルタリ
ングに用いるプロファイル管理方法において、ユーザが
指定したプロファイルを削除する手順を含むようにした
ものである。
【0036】以上の方法により、類似した複数のプロフ
ァイルの存在や、古くなって役に立たなくなったプロフ
ァイルの存在を検知し、ユーザに知らせることが可能と
なる。そして、ユーザはこの情報をもとに、無駄なプロ
ファイルを容易にかつ適切に整理、削除することが可能
となる。このことにより、ひとりのユーザが複数のプロ
ファイルを設定している場合でも、ユーザは漏れやノイ
ズのない配信結果を得ることができるようになる。
【0037】さらに、プロファイルの統合、プロファイ
ルの特殊化により、無駄なプロファイルを保持してしま
うことを防ぐことができ、ユーザが効率的にプロファイ
ルを設定することができるようになる。また、余計な適
合度算出をしなくて済むようになるため、システム全体
の性能を向上できる。さらに、設定したプロファイルが
有効であったか無効であったかを知ることができるた
め、無効であった場合にはプロファイルの設定をやり直
すといったことが可能となる。
【0038】
【発明の実施の形態】以下、本発明に係る一実施形態
を、図1ないし図16を用いて説明する。
【0039】〔情報フィルタリングシステムのシステム
構成〕先ず、図1を用いて本発明に係る情報フィルタリ
ングシステムのシステム構成について説明する。図1
は、本発明に係る情報フィルタリングシステムのシステ
ム構成図である。
【0040】本発明に係る情報フィルタリングシステム
は、ディスプレイ100、キーボード101、中央演算
処理装置(CPU)102、主メモリ104およびこれ
らを結ぶバス103から構成される。
【0041】また、バス103には、LAN(情報フィ
ルタリングシステムを利用するユーザ107が接続され
ているLocal Area Network)等の通信
回線105を介して、文書情報を配信する文書情報配信
元106が接続されている。文書情報配信元106は、
電子メール等を用いて電子化された文書情報を本システ
ムへ配信したり、インターネットを介して文書情報を提
示する。ユーザ107は、電子メールを用いて検索条件
を本システムへ登録する。本システムからはその検索条
件に基づいて検索された文書情報が電子メールを用いて
該当ユーザへ配信される。
【0042】以下、本実施形態では、文書情報配信元1
06は、電子メール等を用いて本システムに文書情報を
配信するものとして述べるが、文書情報配信元106
は、インターネット上に情報提示する役割だけを持って
おり、テキストの収集は、情報収集ロボットを用いてお
こなうようにしても良い。また、ユーザ107は、電子
メールを用いて検索条件を本システムへ登録するものと
して述べるが、Webを介して本システムへ登録するよ
うにしても良い。さらに、本システムから前記検索条件
に基づいて検索された前記テキストが電子メールを用い
て該当ユーザに配信されるものとして述べるが、インタ
ーネット等を介してダウンロードするようにしても良
い。
【0043】主メモリ104には、メイン制御プログラ
ム110、検索プロファイル生成プログラム120、文
書情報配信制御プログラム121、プロファイル監視プ
ログラム122、プロファイル統合プログラム123、
プロファイル特殊化プログラム124、プロファイル削
除プログラム125、ユーザプロファイル格納エリア1
29、プロファイル間類似度テーブル130およびプロ
ファイル別週間ヒット数テーブル131が格納されて、
実行される。
【0044】また、このうちでプロファイル監視プログ
ラム122は、プロファイル間類似度算出プログラム1
26およびプロファイル有効度監視プログラム127か
ら構成される。
【0045】個々のプログラムの機能と処理について
は、後に詳細に説明するものとする。
【0046】以上のプログラムは、図示しなかったが、
通常は、ハードディスク装置に格納されて、実行時にメ
モリ104上にロードされて実行される。また、プログ
ラムとして、フロッピー(登録商標)ディスクやCD−
ROM等の記憶媒体に格納して提供することもできる。
【0047】〔情報フィルタリングシステムの処理手
順〕次に、本実施形態に係る情報フィルタリングシステ
ムの処理手順について順をおって説明して行く。 (I)メイン制御プログラムの処理手順 先ず、図5を用いて、メイン制御プログラム110の処
理手順について説明する。図5は、メイン制御プログラ
ム110の処理手順を示すPADである。
【0048】メイン制御プログラムは、情報フィルタリ
ングのためのS401〜S404までの処理に、プロフ
ァイル管理のためのS405〜S412を加えたもので
ある。
【0049】メイン制御プログラム110は、情報フィ
ルタリングシステムのシステム管理者によるキーボード
101からの指示を受け起動される。
【0050】メイン制御プログラム110は、先ず、ユ
ーザ107から種文書が入力されたと判定された場合
(S401)、検索プロファイル生成プログラム120
を起動し、該当ユーザの検索プロファイルを生成する
(S402)。検索プロファイルの具体的な生成方法に
ついては、従来技術の項で述べたものと同じである。
【0051】次に、情報リソース106から文書情報が
送られてきたと判定された場合(S403)、文書情報
配信制御プログラム121を起動し、各ユーザのプロフ
ァイルと該当文書情報との適合度を算出し、所定の条件
を満たすユーザに該当文書情報を配信する(S40
4)。適合度の具体的な算出方法についても従来技術の
項で述べたものと同じである。
【0052】次に、所定の時刻になったと判定された場
合(S405)、プロファイル監視プログラム122を
起動し、各ユーザが設定しているプロファイル間の類似
度やプロファイルの利用期間などを算出して、ユーザ1
07に警告を通知する(S406)。具体的な算出方法
については後述する。
【0053】次に、ユーザ107からプロファイル統合
の要求が入力されたと判定された場合(S407)、プ
ロファイル統合プログラム123を起動し、該当ユーザ
が指定した複数のプロファイルの内容を統合したひとつ
のプロファイルを作成し、もとのプロファイルを削除す
る(S408)。具体的なプロファイル統合の手順は後
述する。
【0054】次に、ユーザ107からプロファイル特殊
化の要求が入力されたと判定された場合(S409)、
プロファイル特殊化プログラム124を起動し、該当ユ
ーザが指定した複数のプロファイルの内容を、それぞれ
に特化した内容になるよう修正する(S410)。具体
的なプロファイルの特殊化の方法については後述する。
【0055】次に、ユーザ107からプロファイル削除
の要求が入力されたと判定された場合(S411)、プ
ロファイル削除プログラム125を起動し、該当ユーザ
が指定したプロファイルをユーザプロファイル格納エリ
ア129から削除する(S412)。具体的なプロファ
イルの削除の方法については後述する。 (II)検索プロファイル生成プログラム120と、文書
情報配信プログラム121の処理手順 このメイン制御処理の中で、プロファイルを生成するS
402の処理の中の検索プロファイル生成プログラム1
20の処理と、文書情報を配信する処理S404の中の
文書情報配信制御処理プログラム121の処理は、図3
により従来技術の項で用いた処理を用いることもできる
し、他の処理を用いることもできる。
【0056】以下では、図3の具体例により、従来技術
の項で述べた方法と同じ処理を用いるものとして説明す
る。
【0057】S402におけるプロファイル生成処理の
例は、図3のの処理が代表として示される。ユーザ2
01が「高校野球は甲子園で開幕・・・」という種文書2
02を入力した場合を想定する。このときの検索プロフ
ァイルの生成方法としては、従来技術の項で示されるよ
うに、種文書202から特徴文字列を抽出し、その出現
回数をカウントし、それを特徴文字列の重みとしてプロ
ファイル203に書き込むものとする。特徴文字列の抽
出方法としては従来技術の項に示されるような手段であ
っても良いし、単語辞書を用いて形態素解析によって抽
出しても良い。また重みとしては、各文字列の種文書2
02内における出現回数としたが、その他の指標も用い
ることは可能である。
【0058】また、S404における文書情報配信制御
処理の例は、図3のの処理が代表として示される。情
報リソース204からあらゆる内容の文書情報が配信さ
れてくる。それらの文書情報と、ユーザプロファイル格
納エリアに格納された各ユーザのプロファイルとの適合
度を算出する。ここで、あるプロファイルと文書情報の
適合度の算出方法としては、従来技術の項に示されるよ
うな方法を用いれば良い。すなわち、前述の(式1)を
用いて適合度S(D)を算出する。もとより、(式1)
以外により、適合度を算出することも可能である。
【0059】そして、図3のの処理に示したように、
図3の例では、あらゆる文書情報205のうち、プロフ
ァイル203に含まれる「野球」などの文字列を含んだ
文書情報207だけが、(式1)によって高い適合度を
算出され、ユーザ201に配信されることになる。 (III)プロファイル監視プログラム122の処理手順 次に、図6を用いてプロファイル監視プログラム122
の処理手順について説明する。図6は、プロファイル監
視プログラム122の処理手順を示すPADである。
【0060】本プログラムは、各ユーザが持っているプ
ロファイルの内容を参照して、類似したプロファイルを
複数持っているユーザに、それを知らせてプロファイル
の最適化を促すプログラムである。また、各ユーザが持
っているプロファイルの中に、内容が古くて、既に現在
のユーザの興味を表していないと思われるものがあるか
どうかを検査して、そのようなプロファイルを持ってい
るユーザにそのことを警告するプログラムである。
【0061】プロファイル監視プログラム122は、プ
ロファイル間類似度算出プログラム126を起動し、各
ユーザについて、ひとりで複数の類似したプロファイル
を設定していないかを検査し、該当するユーザにその旨
を通知して警告する(S701)。
【0062】次に、プロファイル有効度監視プログラム
127を起動し、各ユーザについて、古くなってしまっ
た話題を表すようなプロファイルなど、有効でないプロ
ファイルを設定していないかを検査し、該当するユーザ
にその旨を通知して警告する(S702)。
【0063】このようにプロファイル監視プログラム1
22が、プロファイル間類似度監視プログラム126、
およびプロファイル有効度監視プログラム127を呼出
すことにより、 類似した複数のプロファイルの存在
や、古くなったプロファイルの存在を検知し、ユーザに
知らせるようにして、複数のプロファイルを設定してい
る場合でも、ユーザはノイズや漏れのない配信結果を得
ることができるようになる。 (IV)プロファイル間類似度算出プログラム126の処
理手順とその処理の具体例 次に、図7および図8を用いてプロファイル間類似度算
出プログラム126の処理手順について説明する。図7
は、プロファイル間類似度算出プログラム126の処理
手順を示すPADである。図8は、プロファイル間類似
度算出プログラム126の具体的な処理の流れを示す概
要図である。
【0064】本プログラムは、プロファイル監視プログ
ラム122から起動されるものであり、各ユーザが設定
しているプロファイルの中に、内容が類似したものがな
いかどうかを判定し、どれくらい類似しているかを示す
類似度を算出して、類似するものがあったときには、ユ
ーザに通知して警告するプログラムである。ここで、類
似度とは、複数のプロファイル間において、どのくらい
類似しているかを示す指標であり、それらの複数のプロ
ファイルの有効度であると考えることができる。すなわ
ち、類似度が大きいときには、それらの複数のプロファ
イルの有効度が小さく、類似度が小さいときには、それ
らの複数のプロファイルの有効度が大きいとみなすので
ある。
【0065】プロファイル間類似度算出プログラム12
6は、S802〜S804の処理を登録された全ユーザ
について繰り返す(S701)。
【0066】最初の処理では、各ユーザが設定している
全プロファイルについてS803の処理を繰り返す(S
802)。S803の処理は、各プロファイルについ
て、所定の方法により該当ユーザが設定している他の全
プロファイルとの類似度を算出する。
【0067】ここで、S803におけるプロファイル間
の類似度の算出方法としては、以下の(式2)のような
ものを用いることができる。
【0068】
【数2】 この式で、Sim(a,b)はプロファイルaとプロフ
ァイルbの類似度であり、Wa(i)は、プロファイル
aにおける特徴文字列iの重みであり、Wb(i)はプ
ロファイルbにおける特徴文字列iの重みである。すな
わち、同じ特徴文字列があったときに、両者の重みをか
け合わせて、プロファイルa内の全ての特徴文字列につ
いて和をとることを示している。なお、ここで類似度の
算出式としてはこれ以外のものを用いても良い。
【0069】次に、S803で算出した類似度が所定の
値を超えるプロファイルの組が見つかった場合、ユーザ
にその旨を通知して警告する(S804)。
【0070】次に、図8によりこのプロファイル間類似
度算出プログラム126の処理の流れを具体例を取って
説明する。図8に示されるように、あるユーザ107
は、ユーザプロファイル格納エリア129にプロファイ
ルA、プロファイルB、およびプロファイルCの3つの
プロファイルを設定しているものとする。プロファイル
類似度算出プログラム126は、これら3つのプロファ
イル間の類似度を上述の(式2)を用いて算出し、プロ
ファイル間類似度テーブル131に書き込む(S90
1)。この図に示した例では、プロファイルAとプロフ
ァイルBは「野球」、「開幕」といった共通の特徴文字
列を含んでいるため、(式2)による類似度が高くな
る。
【0071】続いて、プロファイル間類似度テーブル1
31の中から類似度が所定の値を超えるものを抽出する
(S902)。この図に示した例では、プロファイルA
とプロファイルBの類似度が所定の値(例えば、類似度
50)を超えているため抽出されるものとする。
【0072】次に、S902において抽出したプロファ
イルAとプロファイルBの組を「似ている」という情報
とともにユーザ107に提示する(S903)。この図
に示した例では、「以下に示すプロファイルAとプロフ
ァイルBは似ています」というコメントが、それぞれの
プロファイルの内容とともに画面904に提示される。
【0073】このことにより、ユーザ107は内容が類
似しているプロファイルを二つ設定してしまっていると
いう事実を知ることができる。 (V)プロファイル有効度監視プログラム127の処理
手順とその処理の具体例 次に、図9および図10を用いてプロファイル有効度監
視プログラム127の処理手順について説明する。図9
は、プロファイル有効度監視プログラム127の処理手
順を示すPADである。図10は、プロファイル有効度
監視プログラム127の具体的な処理の流れを示す概要
図である。
【0074】本プログラムは、S702においてプロフ
ァイル監視プログラム122から起動されるものであ
り、各ユーザが設定しているプロファイルの中に、内容
が古いためもうそのプロファイルにヒットするような情
報が発生しないというようなユーザにとって無駄なプロ
ファイルがないかを判定し、そのようなプロファイルが
あった場合には、その旨をユーザに通知して警告するプ
ログラムである。
【0075】プロファイル有効度監視プログラム127
は、登録されている全てのユーザについてS1002、
S1003を繰り返す(S1001)。
【0076】S1002では、所定の方法により、該当
ユーザが設定している各プロファイルの有効度を算出す
る。ここで言う有効度とは、文書情報のフィルタリング
がどのように有効におこなえるかを示す指標であり、例
えば、そのプロファイルに該当する文書情報が、最近発
生することが多いときには、そのプロファイルの話題は
新しいとみなして、有効度を高くし、逆に、そのプロフ
ァイルに該当する文書情報が、最近発生していないとき
には、そのプロファイルは、「古くてもう役に立たな
い」プロファイルである可能性が高いとみなして、その
有効度を低くする。
【0077】次に、S1003で、S1002において
算出された有効度が所定の値を超えないプロファイルが
あった場合、その旨を該当ユーザ107に通知する。
【0078】次に、図10によりこのプロファイル有効
度監視プログラム127の処理の流れを具体例を取って
説明する。
【0079】図10に示されるように、あるユーザ10
7はプロファイルA、プロファイルB、およびプロファ
イルCという3つのプロファイルを設定しており、ユー
ザプロファイル格納エリア129に格納されているもの
とする。また、プロファイル別週間ヒット数テーブル1
31には、最近の一週間で各プロファイルに合致した文
書情報が発生するたびに、各プロファイル毎にヒット数
をカウントした値が保持されている。プロファイル有効
度監視プログラム127は、先ず、プロファイル別週間
ヒット数テーブルを参照し、ヒット数が所定の値より少
ないプロファイルを抽出する(S1101)。
【0080】次に、S1101で抽出されたプロファイ
ルを有効度の高いプロファイルとしてユーザ107に提
示する(S1102)。この図に示した例では、プロフ
ァイルCが最近一週間でヒット数が「0」であり、所定
値より小さいため、「以下に示すプロファイルCはもう
古くはないですか?」という警告がプロファイルCの内
容とともに画面1103に表示されることになる。
【0081】このことにより、ユーザ107は、もう古
くて関連する話題が発生しないような役に立たないプロ
ファイルの存在を知ることができるようになる。
【0082】ここでプロファイル別週間ヒット数テーブ
ル131に、最近の一週間の情報を格納するものとした
が、システムの利用形態などによって、一週間ではなく
その他の期間の情報を格納するものとしても良い。
【0083】ここで有効度の算出手段としては、上述の
ものと異なる手段を用いても良い。
【0084】例えば、ユーザ107が配信結果文書に対
して、「所望のものであった」、「不要のものであっ
た」などの評価を入力できるようなシステム(いわゆ
る、「レリバンスフィードバック機能」を備えたシステ
ムなど)の場合を想定する。このとき、その文書情報が
「所望のものであった」と評価されたときに、その文書
情報のヒット数が高かったプロファイルの有効度を高く
し、逆に、過去所定の時間内に、ヒットしていても、
「不要のものであった」と評価がされたときに、そのプ
ロファイルの有効度を低く設定するという方法を用いて
も良い。
【0085】また、ユーザが任意にプロファイルの内容
を修正できるようなシステムの場合、ユーザが過去所定
の時間内に内容の修正をおこななっていないと判断され
るものに対して、有効度が低いと判定するという方法を
用いても良い。また、単に最初に登録されてから、より
多くの日数が経過しているプロファイルに対して、有効
度が低いと判定するという方法を用いても良い。
【0086】さらに、プロファイル別週間ヒット数テー
ブル内の数値が一定期間内で減少してきているプロファ
イルに対して、有効度が低いと判定するという方法を用
いても良い。 (VI)プロファイル統合プログラム123の処理手順と
その処理の具体例 次に、図11および図12を用いてプロファイル統合プ
ログラム123の処理手順について説明する。図11
は、プロファイル統合プログラム123の処理手順を示
すPADである。図12は、プロファイル統合プログラ
ム123の具体的な処理の流れを示す概要図である。
【0087】本プログラムは、S408においてメイン
制御プログラム110により起動されるものであり、プ
ロファイル間類似度算出プログラム126によって提示
された類似プロファイルを、ユーザ107が「統合す
る」という指示を入力した際に起動される。このプロフ
ァイル統合プログラム123、複数の類似プロファイル
をひとつのプロファイルに統合することにより、それぞ
れのプロファイルに合致するような文書情報が、ユーザ
107に重複して配信されないようにし、無駄なプロフ
ァイルをなくそうとするプログラムである。
【0088】プロファイル統合プログラム123は、先
ず、 ユーザ107から指定された複数のプロファイル
の内容を読み込む(S1201)。
【0089】次に、 S1201で読み込んだ複数のプ
ロファイルの内容を所定の方法によって統合したひとつ
のプロファイルを作成する(S1202)。ここでプロ
ファイルの統合の処理例は後述する。
【0090】次に、S1202で作成したプロファイル
を該当するユーザのプロファイルとして設定し、S12
01で読み込んだプロファイルを削除する(S120
3)。
【0091】次に、図12によりこのプロファイル統合
プログラム123の処理の流れを具体例を取って説明す
る。
【0092】図12に示されるように、あるユーザ10
7が、プロファイル間類似度算出プログラム126によ
り、設定していたプロファイルAとプロファイルBが似
ているプロファイルだと警告され、それらのプロファイ
ルを持っているのは無駄と判断し、ひとつのプロファイ
ルに統合する要求を入力したものとする。
【0093】プロファイル統合プログラム123は、先
ず、ユーザ107が指定したプロファイルA1310と
プロファイルB1311の内容を読み込む(S130
1)。
【0094】次に、各プロファイル内の特徴文字列の重
みを加算した新プロファイルD1312を作成する(S
1302)。この図に示した例では、プロファイルAと
プロファイルBに共通して設定されている特徴文字列の
それぞれの重みを足し、片方にのみ含まれる特徴文字列
の重みはそのままにして、新しいプロファイルDに書き
込む。
【0095】例えば、「野球」という特徴文字列の重み
は、プロファイルAでは「4」であり、プロファイルB
では「5」であるので、それぞれ足してプロファイルD
では「9」となる。また、プロファイルAにのみ設定さ
れている「プロ」という文字列の重みは「5」であるの
で、プロファイルDではその重みがそのまま「5」とな
る。
【0096】この例では、以上のような統合手段を用い
るものとするが、他の手段を用いても良い。例えば、プ
ロファイルAとプロファイルBに共通して設定されてい
る特徴文字列の重みは、どちらか大きいほうの重みをそ
のまま新しいプロファイルDでの重みとして設定するよ
うにしても良い。また、統合後の各特徴文字列の重み
は、プロファイルAとプロファイルBに設定されていた
それらの特徴文字列の重みの平均値とするようにしても
良い。
【0097】そして、統合後に、もとのプロファイルA
とプロファイルBは削除する(S1303)。
【0098】このプロファイル統合プログラム123に
より、ユーザ107が複数の類似したプロファイルを持
っていても無駄であると判断したときに、簡単にそれら
のプロファイルを統合して無駄なプロファイルをなくす
ことが可能となる。 (VII)プロファイル特殊化プログラム124の処理手
順とその処理の具体例 次に、図13および図14を用いてプロファイル特殊化
プログラム124の処理手順について説明する。図13
は、プロファイル特殊化プログラム124の処理手順を
示すPADである。図14は、プロファイル特殊化プロ
グラム124の具体的な処理の流れを示す概要図であ
る。
【0099】本プログラムは、プロファイル間類似度算
出プログラム126によって提示された類似プロファイ
ルを、ユーザ107が「それぞれの内容に特化したもの
に特殊化する」という指示を入力した際に起動される。
このプロファイル特殊化プログラム124は、複数の類
似プロファイルをそれぞれの内容に特化したものにする
ことにより、それぞれのプロファイルに合致するような
文書情報がユーザ107に重複して配信されないように
し、かわりに所望する文書情報を漏れなくユーザ107
に配信するためのプログラムである。
【0100】プロファイル特殊化プログラム124は、
先ず、 ユーザ107によって指定された複数のプロフ
ァイルの内容を読み込む(S1401)。
【0101】次に、 S1401で読み込んだ複数のプ
ロファイルの内容を、所定の方法によってそれぞれのプ
ロファイルに特化した内容に修正する(S1402)。
プロファイルをそれぞれに特化したものに修正する処理
の例は後述する。
【0102】次に、図14によりこのプロファイル特殊
化プログラム124の処理の流れを具体例を取って説明
する。
【0103】図14に示されるように、あるユーザ10
7が、プロファイル間類似度算出プログラム126によ
り、設定していたプロファイルA1510とプロファイ
ルB1511が似ているプロファイルだと警告されたも
のとする。このときユーザ107は、それらのプロファ
イルをそのままにしておくと、それぞれに合致する文書
情報が重複して配信されるおそれがあると判断して、そ
れらのプロファイルをそれぞれの内容に特化したものに
修正する要求を入力したものとする。
【0104】プロファイル特殊化プログラム124は、
先ず、指定されたプロファイルA1510とプロファイ
ルB1511の内容を読み込む(S1501)。
【0105】次に、それぞれのプロファイルの内容をそ
れぞれに特化したものに修正する(S1502、S15
03)。
【0106】図14に示した例では、S1502では、
プロファイルB1511に含まれていて、プロファイル
A1510に含まれていない特徴文字列に負の重みを付
与して、プロファイルA1510に追加する。例えば、
プロファイルB1511に含まれている「高校」「甲子
園」という文字列をプロファイルA1510に負の重み
を付与して追加する。
【0107】一方で、S1503において、プロファイ
ルA1510に含まれていて、プロファイルB1511
に含まれていない文字列に負の重みを付与してプロファ
イルB1511に追加する。例えばプロファイルA15
10に含まれている「プロ」「リーグ」という文字列を
プロファイルB1511に負の重みを付与して追加す
る。
【0108】以上のようにそれぞれのプロファイルの内
容を修正して、(式1)に従った適合度算出をおこなう
とすると、プロファイルA1510との適合度が高く算
出される文書情報については、プロファイルB1511
との適合度が高く算出されにくくなる。また、逆にプロ
ファイルB1511との適合度が高く算出される文書情
報については、プロファイルA1510との適合度が高
く算出されにくくなる。すなわち、プロファイルA15
10に合致する文書情報とプロファイルB1511に合
致する文書情報に重複が発生しにくくなり、それぞれの
プロファイルがそれぞれの話題に専門化されることにな
る。
【0109】ここで、プロファイルの特殊化としては、
上述した方法以外のものを用いても良い。例えば、プロ
ファイルA1510に含まれる特徴文字列のうち、プロ
ファイルB1511にも含まれる特徴文字列を、プロフ
ァイルA1510から削除してしまうといった方法を用
いても良い。
【0110】このように、プロファイル特殊化プログラ
ム124は、複数の類似したプロファイルの内容をそれ
ぞれに特化したものに修正し、それを情報フィルタリン
グに用いれば、重複した文書情報が配信されてくること
を防ぐことが可能となる。 (VIII)プロファイル削除プログラム125の処理手順 次に、図15を用いてプロファイル削除プログラム12
5の処理手順について説明する。図15は、プロファイ
ル削除プログラム125の処理手順を示すPADであ
る。
【0111】本プログラムは、プロファイル有効度監視
プログラム127によって提示された有効でないと判定
されたプロファイルを、ユーザ107が「削除する」と
いう指示を入力した際に起動される。もう話題が古くな
ってしまって、その話題に関連するような文書情報が発
生しなくなったような場合に、その話題に関するプロフ
ァイルを削除して、無駄なプロファイルを保持したまま
にしてしまうことを防ぐためのプログラムである。
【0112】プロファイル削除プログラム125は、
ユーザ107によって指定されたプロファイルを、ユー
ザプロファイル格納エリア129から削除する(S16
01)。
【0113】このことにより、ユーザ107が指定した
プロファイルを簡単に削除することが可能となる。
【0114】〔プロファイル管理画面〕次に、図16を
用いて本発明のプロファイル管理方法のプロファイル管
理画面について説明する。図16は、本発明のプロファ
イル管理方法のプロファイル管理画面を示す模式図であ
る。
【0115】ユーザ107の端末画面1701には、該
当ユーザのプロファイル監視結果1702が表示され
る。プロファイル監視結果1702には、プロファイル
間類似度算出プログラム126による「プロファイルA
とプロファイルBは類似しています」といった情報や、
プロファイル有効度監視プログラム127による「プロ
ファイルCに合致する情報は最近発生していません」と
いった情報が表示される。また同時に、それらのプロフ
ァイルの内容が参考情報として提示される。
【0116】ユーザは、これらのプロファイル監視結果
1702を参照して、これらのプロファイルをどのよう
に最適化するかを決定して、その最適化をシステムに要
求できる。
【0117】例えば、図16に示す例では、ユーザはプ
ロファイルAとプロファイルBとが類似しているという
情報を得たため、プロファイルAとプロファイルBとを
統合してひとつのプロファイルにしようと考えたとす
る。その場合は、マウスなどのポインティングデバイス
により、プロファイルAのチェックボックス1703と
プロファイルBのチェックボックス1704をチェック
して、「統合する」ボタン1706を押下する。これに
より、プロファイル統合プログラム123が起動され、
プロファイルAとプロファイルBを統合したプロファイ
ルが設定され、もとのプロファイルは削除される。
【0118】同様に、プロファイルAとプロファイルB
の内容をそれぞれのプロファイルに特化した内容に修正
したい場合には、「特殊化する」ボタン1707を押下
する。これにより、プロファイル特殊化プログラム12
4が起動され、プロファイルAとプロファイルBの内容
が修正される。
【0119】また、プロファイルCの内容を見て、プロ
ファイルCがもう不要なプロファイルであるとユーザ1
07が判断した場合には、プロファイルCのチェックボ
ックス1705だけをチェックしておき、「削除する」
ボタン1708を押下する。これにより、プロファイル
削除プログラム125が起動され、プロファイルCは削
除される。
【0120】このプロファイル管理画面により、ユーザ
107は、自分が設定しているプロファイルの状況を簡
単に把握することができる。また、簡単な操作により、
プロファイルを最適化したり無駄なプロファイルを削除
するといった、プロファイルの整理が可能となる。
【0121】〔その他の実施形態の可能性〕以上述べて
きた実施形態において、ディスプレイ100、キーボー
ド101、中央演算処理装置(CPU)102、主メモ
リ104、およびこれらを結ぶバス103から構成され
る情報フィルタリングシステムは、図1における文書情
報配信元106と通信回線105の中間や、通信回線1
05とユーザ107の中間のいずれのネットワーク上の
位置に配置されても構わない。
【0122】また、上述の実施形態においては、プロフ
ァイル間類似度算出プログラム126、プロファイル統
合プログラム123、およびプロファイル特殊化プログ
ラム124は、ひとりのユーザ107が設定した複数の
プロファイル同士を処理対象とするものとしたが、異な
るユーザ107が設定したプロファイル同士を処理対象
とすることもできる。
【0123】また、上述の実施形態で説明した情報フィ
ルタリングシステムは、プロファイル統合プログラム1
23、プロファイル特殊化プログラム124およびプロ
ファイル削除プログラム125をすべて含むものである
が、これらプログラムの任意の組み合わせを含む情報フ
ィルタリングシステムも実現できる。
【0124】さらに、上述の実施形態においては、プロ
ファイル間類似度算出プログラム126、プロファイル
有効度監視プログラム127、プロファイル統合プログ
ラム123、およびプロファイル特殊化プログラム12
4は、情報フィルタリングシステム内に実装するものと
したが、文書データベースに対してユーザが任意のタイ
ミングで検索をおこななうような文書検索システムにお
いて、ユーザが複数のプロファイルを保存しておけるよ
うな場合にも適用できる。
【0125】
【発明の効果】本発明によれば、検索条件データとなる
プロファイルを用いて、文書情報をフィルタリングして
提示する情報フィルタリングにおいて、類似した複数の
プロファイルの存在や、古くなったプロファイルの存在
を検知し、ユーザに知らせることにより、ユーザの対処
を促して、情報フィルタリングの際のノイズや漏れのな
い配信結果を得ることのできるプロファイルの管理方法
を提供することができる。
【0126】また、本発明によれば古くなったものなど
無駄なプロファイルを、適切に、しかも容易に、最適化
したり、削除できるようにして、無駄なプロファイルを
保持してしまうことを防ぎ、ユーザが効率的にプロファ
イルを設定することができ、しかも、無駄なプロファイ
ルの参照をおこなわないようにしてシステムとしても性
能の低下を招かないようなプロファイルの管理方法を提
供することができる。
【図面の簡単な説明】
【図1】本発明に係る情報フィルタリングシステムのシ
ステム構成図である。
【図2】一般的なプロファイルを用いたフィルタリング
システムの処理を示すPAD(Problem Analysis Dia
gram)ある。
【図3】一般的なプロファイルを用いたフィルタリング
システムの具体的な処理の流れを示す概要図である。
【図4】一般的なプロファイルを用いたフィルタリング
システムにおいて、ユーザが複数のプロファイルを持つ
場合の具体的な処理の流れを示す概要図である。
【図5】メイン制御プログラム110の処理手順を示す
PADである。
【図6】プロファイル監視プログラム122の処理手順
を示すPADである。
【図7】プロファイル間類似度算出プログラム126の
処理手順を示すPADである。
【図8】プロファイル間類似度算出プログラム126の
具体的な処理の流れを示す概要図である。
【図9】プロファイル有効度監視プログラム127の処
理手順を示すPADである。
【図10】プロファイル有効度監視プログラム127の
具体的な処理の流れを示す概要図である。
【図11】プロファイル統合プログラム123の処理手
順を示すPADである。
【図12】プロファイル統合プログラム123の具体的
な処理の流れを示す概要図である。
【図13】プロファイル特殊化プログラム124の処理
手順を示すPADである。
【図14】プロファイル特殊化プログラム124の具体
的な処理の流れを示す概要図である。
【図15】プロファイル削除プログラム125の処理手
順を示すPADである。
【図16】本発明のプロファイル管理方法のプロファイ
ル管理画面を示す模式図である。
【符号の説明】
100…ディスプレイ 101…キーボード 102…中央演算処理装置(CPU) 103…バス 104…主メモリ 105…通信回線 106…文書情報配信元 107…ユーザ 110…メイン制御プログラム 120…プロファイル生成プログラム 121…文書情報配信制御プログラム 122…プロファイル監視プログラム 123…プロファイル統合プログラム 124…プロファイル特殊化プログラム 125…プロファイル削除プログラム 126…プロファイル間類似度算出プログラム 127…プロファイル有効度監視プログラム 129…ユーザプロファイル格納エリア 130…プロファイル間類似度テーブル 131…プロファイル別週間ヒット数テーブル
───────────────────────────────────────────────────── フロントページの続き (72)発明者 多田 勝己 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所ビジネスソリューション事 業部内 (72)発明者 里 佳史 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所ビジネスソリューション事 業部内 (72)発明者 松林 忠孝 神奈川県川崎市幸区鹿島田890番地 株式 会社日立製作所ビジネスソリューション事 業部内 (72)発明者 内角 真 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア事業部内 Fターム(参考) 5B075 KK07 KK40 PR06 PR08 QM08 UU06

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 検索条件データとなるプロファイルとの
    適合度を算出することにより、文書情報をフィルタリン
    グして提示する情報フィルタリングに用いるプロファイ
    ル管理方法において、 前記プロファイルに対して、前記情報フィルタリングを
    おこなう際の有効度を算出して、その有効度の算出結果
    により、前記プロファイルの有効性をユーザに通知する
    ことを特徴とする情報フィルタリングに用いるプロファ
    イル管理方法。
  2. 【請求項2】 前記情報フィルタリングをおこなう際の
    有効度が、複数のプロファイルが存在する場合の、それ
    らの間における類似度であることを特徴とする請求項1
    記載の情報フィルタリングに用いるプロファイル管理方
    法。
  3. 【請求項3】 前記複数のプロファイルの内で、ユーザ
    が指定した二つ以上のプロファイルから、一つのプロフ
    ァイルに統合することを特徴とする請求項2記載の情報
    フィルタリングに用いるプロファイル管理方法。
  4. 【請求項4】 検索条件データとなるプロファイルとの
    適合度を算出することにより、文書情報をフィルタリン
    グして提示する情報フィルタリングに用いるプロファイ
    ル管理方法において、 ユーザに二つ以上のプロファイルを指定させ、その指定
    された各々のプロファイルの特徴を比較し、前記情報フ
    ィルタリングをおこなう際に結果の差異が出るように、
    そのプロファイルを特殊化して修正することを特徴とす
    る情報フィルタリングに用いるプロファイル管理方法。
  5. 【請求項5】 前記有効度が、 前記情報フィルタリングを過去所定時間内におこなった
    際の、そのプロファイルと合致したテキスト情報の発生
    頻度、 前記情報フィルタリングを過去所定時間内におこなった
    際の、そのプロファイルと合致したテキスト情報のユー
    ザ評価、 過去所定時間内にユーザがプロファイルを修正した頻
    度、 そのプロファイルの作成日付であることを特徴とする請
    求項1記載の情報フィルタリングに用いるプロファイル
    管理方法。
  6. 【請求項6】 ユーザが指定したプロファイルを削除す
    る手順を含むことを特徴とする請求項1、請求項2およ
    び請求項5記載のいずれかの情報フィルタリングに用い
    るプロファイル管理方法。
  7. 【請求項7】 コンピュータに実行させることにより、
    検索条件データとなるプロファイルとの適合度を算出す
    ることにより、文書情報をフィルタリングして提示する
    情報フィルタリングに用いるプロファイル管理プログラ
    ムにおいて、 前記プロファイルに対して、前記情報フィルタリングを
    おこなう際の有効度を算出して、その有効度の算出結果
    により、前記プロファイルの有効性をユーザに通知する
    ことを特徴とする情報フィルタリングに用いるプロファ
    イル管理プログラム。
  8. 【請求項8】 前記情報フィルタリングをおこなう際の
    有効度が、複数のプロファイルが存在する場合の、それ
    らの間における類似度であることを特徴とする請求項7
    記載の情報フィルタリングに用いるプロファイル管理プ
    ログラム。
  9. 【請求項9】 前記複数のプロファイルの内で、ユーザ
    が指定した二つ以上のプロファイルから、一つのプロフ
    ァイルに統合することを特徴とする請求項8記載の情報
    フィルタリングに用いるプロファイル管理プログラム。
  10. 【請求項10】 ユーザにプロファイルを指定させ、前
    記プロファイルの統合の指示を与えるウィンドウを表示
    することを特徴とする請求項9記載の情報フィルタリン
    グに用いるプロファイル管理プログラム。
  11. 【請求項11】 コンピュータに実行させることによ
    り、検索条件データとなるプロファイルとの適合度を算
    出することにより、文書情報をフィルタリングして提示
    する情報フィルタリングに用いるプロファイル管理プロ
    グラムにおいて、 ユーザに二つ以上のプロファイルを指定させ、その指定
    された各々のプロファイルの特徴を比較し、前記情報フ
    ィルタリングをおこなう際に結果の差異が出るように、
    そのプロファイルを特殊化して修正することを特徴とす
    る情報フィルタリングに用いるプロファイル管理プログ
    ラム。
  12. 【請求項12】 ユーザにプロファイルを指定させ、前
    記プロファイルの特殊化した修正の指示を与えるウィン
    ドウを表示することを特徴とする請求項11記載の情報
    フィルタリングに用いるプロファイル管理プログラム。
  13. 【請求項13】 前記有効度が、 前記情報フィルタリングを過去所定時間内におこなった
    際の、そのプロファイルと合致したテキスト情報の発生
    頻度、 前記情報フィルタリングを過去所定時間内におこなった
    際の、そのプロファイルと合致したテキスト情報のユー
    ザ評価、 過去所定時間内にユーザがプロファイルを修正した頻
    度、 そのプロファイルの作成日付であることを特徴とする請
    求項7記載の情報フィルタリングに用いるプロファイル
    管理プログラム。
  14. 【請求項14】 ユーザが指定したプロファイルを削除
    する手順を含むことを特徴とする請求項7、請求項8お
    よび請求項13記載のいずれかの情報フィルタリングに
    用いるプロファイル管理プログラム。
  15. 【請求項15】 ユーザがプロファイルを指定して、前
    記プロファイルの削除の指示を与えるウィンドウを表示
    することを特徴とする請求項14記載の情報フィルタリ
    ングに用いるプロファイル管理プログラム。
JP2001195859A 2001-06-28 2001-06-28 情報フィルタリングに用いるプロファイル管理方法、および、プロファイル管理プログラム Pending JP2003016094A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2001195859A JP2003016094A (ja) 2001-06-28 2001-06-28 情報フィルタリングに用いるプロファイル管理方法、および、プロファイル管理プログラム
EP02250562A EP1271357A3 (en) 2001-06-28 2002-01-28 Profile management method for information filtering and profile management program
US10/059,206 US20030009440A1 (en) 2001-06-28 2002-01-31 Profile management method for information filtering and profile management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001195859A JP2003016094A (ja) 2001-06-28 2001-06-28 情報フィルタリングに用いるプロファイル管理方法、および、プロファイル管理プログラム

Publications (1)

Publication Number Publication Date
JP2003016094A true JP2003016094A (ja) 2003-01-17

Family

ID=19033767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001195859A Pending JP2003016094A (ja) 2001-06-28 2001-06-28 情報フィルタリングに用いるプロファイル管理方法、および、プロファイル管理プログラム

Country Status (3)

Country Link
US (1) US20030009440A1 (ja)
EP (1) EP1271357A3 (ja)
JP (1) JP2003016094A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008176782A (ja) * 2007-01-16 2008-07-31 Chutnoon Inc 関心事を反映して抽出した情報提供方法及びシステム
JP2008217370A (ja) * 2007-03-02 2008-09-18 Nec Corp プロファイル登録システム、プロファイル登録方法およびプロファイル登録プログラム

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4186474B2 (ja) * 2002-02-20 2008-11-26 富士通株式会社 プロファイル結合装置、方法及びプログラム
US8412706B2 (en) 2004-09-15 2013-04-02 Within3, Inc. Social network analysis
US8635217B2 (en) * 2004-09-15 2014-01-21 Michael J. Markus Collections of linked databases
US20070260599A1 (en) * 2004-09-15 2007-11-08 Mcguire Heather A Social network analysis
US8577886B2 (en) * 2004-09-15 2013-11-05 Within3, Inc. Collections of linked databases
US8880521B2 (en) * 2004-09-15 2014-11-04 3Degrees Llc Collections of linked databases
JP2006134236A (ja) * 2004-11-09 2006-05-25 Canon Inc プロファイル取得方法、装置、プログラム、および、記憶媒体
US7386545B2 (en) 2005-03-31 2008-06-10 International Business Machines Corporation System and method for disambiguating entities in a web page search
US8631006B1 (en) 2005-04-14 2014-01-14 Google Inc. System and method for personalized snippet generation
US8453044B2 (en) * 2005-06-29 2013-05-28 Within3, Inc. Collections of linked databases
US8190681B2 (en) 2005-07-27 2012-05-29 Within3, Inc. Collections of linked databases and systems and methods for communicating about updates thereto
US10395326B2 (en) * 2005-11-15 2019-08-27 3Degrees Llc Collections of linked databases
DE102006013162A1 (de) * 2006-03-22 2007-09-27 Robert Bosch Gmbh Verfahren zur Steuerung einer Anwendung
US20110035387A1 (en) * 2009-08-10 2011-02-10 Telcordia Technologies, Inc. System and method for the controlled introduction of noise to information filtering
CN106445961B (zh) * 2015-08-10 2021-02-23 北京奇虎科技有限公司 新闻推送方法及装置
JP6785583B2 (ja) * 2016-06-13 2020-11-18 株式会社日立製作所 淡水化装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5446891A (en) * 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US5854923A (en) * 1994-06-21 1998-12-29 International Business Machines Corp. Facility for the intelligent selection of information objects (persona)
US5694594A (en) * 1994-11-14 1997-12-02 Chang; Daniel System for linking hypermedia data objects in accordance with associations of source and destination data objects and similarity threshold without using keywords or link-difining terms
US6029195A (en) * 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
US5758257A (en) * 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US6112186A (en) * 1995-06-30 2000-08-29 Microsoft Corporation Distributed system for facilitating exchange of user information and opinion using automated collaborative filtering
US5867799A (en) * 1996-04-04 1999-02-02 Lang; Andrew K. Information system and method for filtering a massive flow of information entities to meet user information classification needs
US6308175B1 (en) * 1996-04-04 2001-10-23 Lycos, Inc. Integrated collaborative/content-based filter structure employing selectively shared, content-based profile data to evaluate information entities in a massive information network
US6092091A (en) * 1996-09-13 2000-07-18 Kabushiki Kaisha Toshiba Device and method for filtering information, device and method for monitoring updated document information and information storage medium used in same devices
US5778363A (en) * 1996-12-30 1998-07-07 Intel Corporation Method for measuring thresholded relevance of a document to a specified topic
US6003020A (en) * 1997-10-30 1999-12-14 Sapient Health Network Intelligent profiling system
JP4198786B2 (ja) * 1998-06-30 2008-12-17 株式会社東芝 情報フィルタリングシステム、情報フィルタリング装置、映像機器および情報フィルタリング方法
US6757720B1 (en) * 1999-05-19 2004-06-29 Sun Microsystems, Inc. Profile service architecture
JP2001256253A (ja) * 2000-03-13 2001-09-21 Kddi Corp 文書フィルタリング方法および装置
US6463428B1 (en) * 2000-03-29 2002-10-08 Koninklijke Philips Electronics N.V. User interface providing automatic generation and ergonomic presentation of keyword search criteria

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008176782A (ja) * 2007-01-16 2008-07-31 Chutnoon Inc 関心事を反映して抽出した情報提供方法及びシステム
JP2008217370A (ja) * 2007-03-02 2008-09-18 Nec Corp プロファイル登録システム、プロファイル登録方法およびプロファイル登録プログラム

Also Published As

Publication number Publication date
EP1271357A3 (en) 2005-10-05
US20030009440A1 (en) 2003-01-09
EP1271357A2 (en) 2003-01-02

Similar Documents

Publication Publication Date Title
JP2003016094A (ja) 情報フィルタリングに用いるプロファイル管理方法、および、プロファイル管理プログラム
US6236991B1 (en) Method and system for providing access for categorized information from online internet and intranet sources
US6212517B1 (en) Keyword extracting system and text retrieval system using the same
US8001118B2 (en) Methods and apparatus for employing usage statistics in document retrieval
US7930301B2 (en) System and method for searching computer files and returning identified files and associated files
US9300755B2 (en) System and method for determining information reliability
KR101540910B1 (ko) 전자메일 메시지들의 식별 및 상관
CN108475320B (zh) 在搜索查询当中识别查询模式及相关联的聚合统计
US20030135607A1 (en) Method and apparatus for collaborative document versioning of networked documents
JP2004062479A (ja) 情報収集装置、方法及びプログラム
WO2007001128A1 (en) Method and system for determining relation between search terms in the internet search system
JP2000132559A (ja) 情報フィルタリングシステムにおけるプロファイル更新方法及び情報フィルタリングシステム
WO2022198756A1 (zh) 基于热点事件的信息推送方法、装置、计算机设备及存储介质
JP5294002B2 (ja) 文書管理システム、文書管理プログラム及び文書管理方法
CN114003568A (zh) 数据处理的方法及相关装置
CN111190965A (zh) 基于文本数据的即席关系分析系统及方法
JP3612185B2 (ja) 文書情報更新監視装置
JPH11282874A (ja) 情報フィルタリング方法および装置
JP4135330B2 (ja) 人物紹介システム
JP5055202B2 (ja) キーワード比較システム、キーワード比較方法およびキーワード比較プログラム
JP5781618B2 (ja) 文書ファイル共有方法、システム、及びサーバ
CN111240559A (zh) 终端设备及其操作界面的快捷导航方法、计算机存储介质
JP4451305B2 (ja) 経験スコア管理システムおよび方法、プログラム
JP2003150438A (ja) ネットワークコンテンツ管理システム、ネットワークコンテンツ管理方法、ネットワークコンテンツ管理プログラム、及びネットワークコンテンツ管理プログラムを記録した記録媒体
JP2007034419A (ja) 情報収集配信システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081111