JP3468062B2 - 情報フィルタ装置及び情報フィルタリング方法 - Google Patents
情報フィルタ装置及び情報フィルタリング方法Info
- Publication number
- JP3468062B2 JP3468062B2 JP30838697A JP30838697A JP3468062B2 JP 3468062 B2 JP3468062 B2 JP 3468062B2 JP 30838697 A JP30838697 A JP 30838697A JP 30838697 A JP30838697 A JP 30838697A JP 3468062 B2 JP3468062 B2 JP 3468062B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- information
- user
- group
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Computer And Data Communications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
媒体とする記憶装置や情報通信網から必要な情報を取り
出し易くする情報フィルタ装置及び情報フィルタリング
方法に関するものであり、複数人が共同して情報検索を
することを支援する装置および方法を実現するものであ
る。
社会基盤の進展に伴い、情報通信網の大規模化と通信量
の著しい増大に対応する技術として、その実現が強く望
まれている。この背景には、今日、個人やグループ(複
数の人の集団)が処理可能な情報量に対して、個人やグ
ループがアクセスできる情報量が上回るようになってい
ることがある。このために、大量の情報の中に必要と思
う情報が埋没することが、しばしば起こる。
ては、特許検索などに用いられるキーワード論理式をあ
げることができる。すなわち、数十万から数百万件に及
ぶ特許情報をキーワード論理式によりフィルタリングす
るものである。
従来の検索においては、使用者がキーワードについての
論理式を精度良く設定する必要があるので、使用者がフ
ァイリングされているデータ群の癖(例えば、どのよう
な条件の基に、当該データのキーワードが決定されてい
るのか等)やシステムの構造(例えば、キーワードがシ
ソーラス体系のあるシステムであるか否か等)を十分に
知り得ていなければ良い検索ができない。このため、初
心者には精度の高い情報フィルタリングを行うことがで
きないという課題があった。
ワードについての論理式に適合するという評価があるだ
けであり、たまたまキーワードでは合致しているが、内
容は求めているものとは異なるケースであったり、ある
いは多くの検索結果から使用者にとって必要度の高い情
報をその結果から順に取り出すことは容易ではない。
30012号および特願平9−46384号の発明によ
り、情報の必要性の定量的な評価が実現され、上記の課
題の一部(初心者にも精度の高い情報フィルタリングが
でき、かつ使用者にとって必要性の高い情報を取り出し
易い情報フィルタ装置と情報フィルタリング方法を提供
すること)が、解決された。
明は、使用者を一人だけに限ったものであり、グループ
で共同して情報検索を行う上では、必ずしも十分な情報
検索支援を実現できないという課題があった。以下、こ
の課題を具体例を挙げて説明する。グループで情報検索
を行う具体的な例としては、大学など研究機関の一つの
研究室で論文検索、企業における課もしくはプロジェク
トにおける特許検索がある。大学の研究室を例に取れ
ば、一つの研究室では大きくみると同じ分野での研究が
行われ、しかし個々の研究者(教授、助教授、助手、ポ
スドクなど)は微妙に異なる研究テーマを持っている。
一方、研究者が読む必要がある論文とは、自分個人の研
究テーマに直接関係した論文(例えば、ニューラルネッ
トワークの中で連想記憶モデルに関する論文)と、自分
の研究テーマに近い重要な論文(例えば、ニューラルネ
ットワークの中でリカレントネットワークの論文だけど
研究室メンバーの多くがよい論文と感じる論文)とであ
る。前者は、自分の研究テーマに直接関係した論文であ
るから、自分自身の手でその論文を見つけることは、研
究者にとって簡単とは言えないまでも可能である。しか
し、後者の論文については自分の研究テーマと異なって
いるために、その論文を見つけることや論文の重要性に
気づくことは、研究者にとっても容易ではない。この例
に即して言えば、上記発明の課題は、前者の論文を見つ
けることを支援できるが、後者の論文を見つけることは
できないという課題である。
よび情報フィルタリング方法の課題を解決するものであ
り、複数の人が共同して情報検索を行う上でも有効な情
報フィルタリング装置および情報フィルタリング方法を
提供することを目的とする。
に、本発明の情報フィルタ装置は、提示された情報に対
し自分の興味の有無(教師信号)を入力する入力手段
と、前記教師信号を用いて使用者毎に独立して個人の興
味を反映した個人プロファイルを生成する個人プロファ
イル生成手段と、情報に対し前記個人プロファイルを用
いて使用者毎に必要性信号を計算する情報評価手段とを
有する一つ以上の情報フィルタユニットと、前記情報フ
ィルタユニットとネットワークを介して接続され、前記
使用者と同一グループに属する前記情報フィルタユニッ
トへの必要性信号の要求に対してそれぞれ送られてくる
必要性信号からグループの必要性信号を計算し、前記グ
ループの必要性信号を利用しグループの興味を反映した
情報の提示をする手段とを具備することを特徴とする構
成を有している。
ドから使用者の必要度を定量化することができ、使用者
は必要性の高い情報から順に情報を得るだけでなく、共
同作業を行っているグループ全体としての情報の必要度
を定量化することができ、使用者はグループのメンバー
として必要な情報を効率的に得ることができるようにな
る。
は、提示された情報に対し自分の興味の有無(教師信
号)を入力する入力手段と、前記教師信号を用いて使用
者毎に独立して個人の興味を反映した個人プロファイル
を生成する個人プロファイル生成手段と、情報に対し前
記個人プロファイルを用いて使用者毎に必要性信号を計
算する情報評価手段とを有する一つ以上の情報フィルタ
ユニットと、前記情報フィルタユニットとネットワーク
を介して接続され、前記使用者と同一グループに属する
前記情報フィルタユニットへの必要性信号の要求に対し
てそれぞれ送られてくる必要性信号からグループの必要
性信号を計算し、前記グループの必要性信号を利用しグ
ループの興味を反映した情報の提示をするグループイン
タフェースユニットとを具備することを特徴とする情報
フィルタ装置であり、使用者はグループのメンバーとし
て必要な情報を効率的に得ることができるようになると
いう作用を持つ。
される必要性信号は、正から負の値をとることを特徴と
する請求項1記載の情報フィルタ装置であり、使用者は
グループのメンバーとして必要な情報を効率的に得るこ
とができるようになるという作用を持つ。
性信号は、使用者毎に計算される必要性信号の和である
ことを特徴とする請求項1または2記載の情報フィルタ
装置であり、グループの必要性信号を各ユーザの必要性
信号の和で計算することにより、使用者はグループのメ
ンバーとして必要な情報を効率的に得ることができるよ
うになるという作用を持つ。
に対し自分の興味の有無(教師信号)を入力するステッ
プと、前記教師信号を用いて使用者毎に独立して個人の
興味を反映した個人プロファイルを生成するステップ
と、情報に対し前記個人プロファイルを用いて使用者毎
に必要性信号を計算する情報評価ステップとを有する一
つ以上の情報フィルタユニットからなるグループの個人
プロファイルの共同利用する方法において、前記情報フ
ィルタユニットとネットワークを介して接続され、前記
使用者と同一グループに属する前記情報フィルタユニッ
トへの必要性信号の要求に対してそれぞれ送られてくる
必要性信号からグループの必要性信号を計算し、前記グ
ループの必要性信号を利用しグループの興味を反映した
情報の提示をすることを特徴とする情報フィルタリング
方法であり、使用者はグループのメンバーとして必要な
情報を効率的に得ることができるようになるという作用
を持つ。
される必要性信号は、正から負の値をとることを特徴と
する請求項4記載の情報フィルタリング方法であり、使
用者はグループのメンバーとして必要な情報を効率的に
得ることができるようになるという作用を持つ。
性信号は、使用者毎に計算される必要性信号の和である
ことを特徴とする請求項4または5記載の情報フィルタ
リング方法であり、使用者はグループのメンバーとして
必要な情報を効率的に得ることができるようになるとい
う作用を持つ。
から図13を用いて説明する。 (実施の形態1)以下、本発明の実施の形態1につい
て、図面を参照しながら説明する。図1はその構成と動
作を分かりやすくするために機能単位にまとめたブロッ
ク図である。
念を説明する。本発明の情報フィルタ装置における基本
概念は、ユーザーがどんな「情報」を過去に必要とした
かという履歴に関する記録を記憶した複数の記憶部2、
5、6と、「情報」がユーザにどれほど必要とされてい
るかを必要性信号と信頼性信号によって評価する情報評
価ユニット54と、ユーザーがどんな「情報」を必要と
したかという履歴である教師データ信号を記憶する教師
信号記憶部13と、前記情報評価ユニット54と前記教師
信号記憶部13へのユーザーのアクセスを制御するユー
ザー認証部44と、前記教師データ信号を用いてユーザ
ーの関する学習を行う学習ユニット52とからなる適応
型グループ情報フィルタユニット56〜59と、少なく
ともユーザーが提示された情報について自分の興味のあ
る/なしを入力することができる入力端子106を備え
たインタフェースユニットであってユーザーが前記評価
済情報をユーザー個人の必要性信号の順に並べられた評
価済情報またはユーザーの属する共同作業グループ全体
の必要性信号の順に並べられた評価済情報を可視できる
ようにしたディスプレー等の出力端子107を有するグ
ループインタフェースユニット55と、外部から配信さ
れる「情報」を情報記憶部41に書き込むとともに「情
報」が書き込まれたアドレスと「情報」の特徴をあらわ
すキーワードなどからなるアドレス情報信号をアドレス
情報信号記憶部42に書き込む情報書き込み部40とから
なる。
発明の全体的な構成と基本的な動作を説明し、次に構成
と動作が少し複雑な情報評価ユニット54と学習ユニッ
ト52の説明を行う。なお、以下に単に「情報」と称す
るものには、当該「情報」に対応する1つ以上のキーワ
ードが付されているものとする。そのキーワードとは、
当該「情報」を構成する各単語の一部あるいは全体であ
っても良いし、当該「情報」を代表するために特別に付
したものであっても良い。
報フィルタユニット56〜59の利用者登録者(ユーザ
認証部44のユーザ認証番号の設定)は、すでに終わっ
ているものとする。このユーザ登録は、システム管理者
による作業または登録部を設け利用希望者に自ら登録さ
せる等の方法を採ることができる。
信号Dとキーワードなど前記記事信号Dを特徴づける信号
である記事プロファイルDPとからなるものとする。好ま
しい記事プロファイルは、「情報」の表題TTLと、キー
ワード数nofKsと、キーワード(複数)K[1]、・・・、K
[nofKs]を含む。なお、ここでいうキーワードは、IPCの
ような分類コード、複数のキーワードの論理式であって
もよい。
力されると、情報書き込み部40は前記「情報」を情報
記憶部41に書き込み、前記「情報」が書き込まれたア
ドレスAと前記「情報」の記事プロファイルDPとからな
るアドレス記事プロファイル信号ADP=(A,DP)をアド
レス情報信号記憶部42に書き込む。情報記憶部41およ
びアドレス情報信号記憶部42への「情報」の書き込みの
方法としては、配信された「情報」を1日分ごと(数時
間分ごと、数日分ごとであってもよい)を一つの単位
(例えば、一つのファイル)にまとめて記憶すること
は、好ましい。以下、アドレス記事プロファイル信号AD
Pをまとめたファイルをアドレスファイルと呼ぶ。
を利用するユーザーは、グループインターフェースユニ
ット55を起動する。起動された前記グループインタフ
ェースユニット56は、ユーザーにユーザー名UIDとパ
スワードPWDの入力を、ユーザーに要求する。ユーザー
からユーザー名UIDとパスワードPWDが入力されると、グ
ループインタフェースユニット55は、前記ユーザー名
UIDと前記パスワードPWDとからなる認証信号UIDPWD=
(UID,PWD)をネットワーク61を通じて、複数の適応
型グループ情報フィルタユニット56〜59へ送信す
る。
ループ情報フィルタユニット56〜59は、適応型情報
フィルタユニットを指定するユニット識別信号IFID、前
記ユーザーに情報評価ユニット54へのアクセスの許可
状況を示す情報評価ユニットアクセス認否信号PA54と
教師信号記憶部13へのアクセスの許可状況を示す教師
信号記憶部のアクセス認否信号PA13とからなるアクセ
ス認否信号 PA=(IFID、PA54、PA13) を前記グループインタフェースユニット55へ返信す
る。
り、それぞれ適応型グループ情報フィルタユニットIF
1、IF2、IF3、IF4を所有しており、さらに甲と乙とが第
1のグループG1をつくり、丙と丁が第2のグループG2をつ
くっている場合を例にとり、前記アクセス認否信号PAの
好ましい設定について説明をする。今、ユーザー甲がグ
ループインタフェースユニット55を通じて、認証信号
UIDPWDを送信した場合、4つ適応型グループ情報フィル
タユニット(以下、適応型情報フィルタユニット56−
IF1、57−IF2、58−IF3、59−IF4と書いて区別す
る)は、それぞれ以下のアクセス認否信号PA (IF1、許可、許可) (IF2、禁止、許可) (IF3、禁止、禁止) (IF4、禁止、禁止) を返信する。これらのアクセス認否信号は以下の意味を
持つ。
−IF1は、ユーザー甲の所有であるから、情報評価ユニ
ット54と教師信号記憶13とのいずれにもアクセスを
許可する。これによりユーザー甲は、適応型グループ情
報フィルタユニット56−IF1の情報評価ユニット54
の利用と適応型グループ情報フィルタユニット56−IF
1の特性を変更することが可能になる。適応型グループ
情報フィルタユニット57−IF2は、同一のグループで
あるユーザー乙の所有であるから、情報評価ユニット5
4へのアクセスを許可する。これによりユーザー甲は、
適応型グループ情報フィルタユニット57−IF2の情報
評価ユニット54の利用はできるが、適応型グループ情
報フィルタユニット57−IF2の特性を変更することは
できない。
−IF3、59−IF4は、グループも異なるユーザー丙、丁
の所有であるから、情報評価ユニット54と教師信号記
憶13とのいずれにもアクセスを禁止する。これにより
ユーザー甲は、適応型グループ情報フィルタユニット5
8−IF3、59−IF4の情報評価ユニット54の利用も、
適応型グループ情報フィルタユニット58−IF3、59
−IF4の特性を変更することもできない。
PAを受けた他前記グループインタフェースユニット5
5は、PA54=許可である適応型グループ情報フィルタ
ユニット56−IF1、57−IF2との間に通信回線を開
き、それぞれの情報評価ユニット54を起動し、情報評
価ユニット54を通して、ユーザー甲によって指定され
たアドレスファイルもしくはデフォルト値として設定さ
れているアドレスファイルを読み出す。好ましいデフォ
ルト値の一例は、最新日に配信された情報をまとめたア
ドレスファイルである。
0を介してアドレス情報信号記憶部42からアドレス記
事プロファイル信号ADPをまとめたアドレスファイル
を読み出す。情報評価ユニット54は、記憶部2、5、
6からユーザーがどのような記事プロファイルDPがつ
けられた「情報」を過去に必要としたかという記録(以
下、個人プロファイルと呼び、その詳細は後述する)を
読みだし、前記アドレス記事プロファイル信号ADPに
対応する前記情報記憶部41に書き込まれた「情報」の
必要性を表わす必要性信号Nと、情報評価ユニット54
の計算した必要性信号の信頼性を表わす信頼性信号Rと
を定量的に評価する(この必要性信号N、信頼性信号R
の計算方法は後述する)。
ADPと前記必要性信号Nと前記信頼性信号Rとをまと
めた信号を評価済情報信号NRADP=(N,R,A,DP)と呼
ぶ。
必要性信号Nの大きい順に評価済情報信号NRADPを並べ
て、ディスプレイに表示する。図2に、好ましいディス
プレイ表示の一例を示す。図2においては、上から、使
用するフィルタを切り替えるボタン(図2では、個人用
のフィルタがONの状態)アクセスしているアドレスフ
ァイルのグループ名、配信日などの属性、ファイルへの
アクセスを実行するボタン、学習ボタン、終了ボタン、
アクセスしているアドレスファイルの内容が表示されて
いる。
がONの場合)で、ユーザー甲が97年10月6日に今
日分の評価済情報信号を集めたアドレスファイルにアク
セスした場合を、以下に説明する。グループインターフ
ェースユニット55は、適応型グループ情報フィルタユ
ニット56−IF1の情報評価ユニット54から97年1
0月6日に配信された「情報」に対応する評価済情報信
号NRADP(複数)を要求し、情報評価ユニット54は同
信号を返す。
いる9件の「情報」に対応する評価済情報信号をIF1-NR
ADP-971006-001、IF1-NRADP-971006-002、・・・、 IF1
-NRADP-971006-009とする。そして、最後の3桁の数字
を記事番号とここでは呼ぶ。グループインタフェースユ
ニット55は、評価済情報信号IF1-NRADP-971006-001か
らIF1-NRADP-971006-009を、その中に含まれる必要性信
号Nの大きい順に並べて表示する。その際に、評価済情
報信号に含まれる記事プロファイルDPに対応する「情
報」の表題TTLが含まれている場合には、図2に示した
ように日付とともに、表題を表示することは好ましい。
さらに、必要性の順位、記事番号を同時に表字すること
は非常に好ましい(学習ボタンについては、後述す
る)。なお、図2においては、適応型グループ情報フィ
ルタユニット56-IF1はまだ使用者の興味を学習してい
ないので、すべて「情報」の必要性信号Nは0となってい
る。この好ましい実施例では、図2に示された順位1番
(記事番号001)のタイトルをクリックすると、グルー
プインタフェースユニット55は、評価済情報信号IF1-
NRADP-971006−001に含まれる前記情報記憶部41に記
憶された97年10月6日に配信された記事番号001の「情
報」のアドレスA−971006−001から「情報」を読み出
し、画面に表示する。
その「情報」に興味があれば興味ありボタン(3つある
ラジオボタン[Button]の一番左側のボタン)を押し、興
味がなければ興味なしボタン(3つあるラジオボタン[B
utton]の一番右側のボタン)を押す。以下、このユーザ
ーの応答を教師信号Tと呼ぶ。この教師信号Tを、ユー
ザーが興味ありのボタンを押した場合はT=1、ユーザ
ーが興味なしのボタンを押した場合はT=0、その他の
場合(例えば、データがない場合)はT=−1と設定す
ることは、好ましい。以下、教師信号記憶部13に前記
教師信号Tと記事プロファイルDPとの組を、教師デー
タ信号TD=(T,DP)と呼ぶ。
前記教師データ信号TDを、教師信号記憶部のアクセス認
否信号AP13=許可を与えられている適応型グループ情報
フィルタユニット56−IF1に送信する。適応型グルー
プ情報フィルタユニット56−IF1のユーザ認証部44
は、教師信号記憶部のアクセス認否信号AP13=許可を与
えているグループインタフェースユニット55から受信
した前記教師データ信号TDを、教師信号記憶部13に書
き込む。
タ信号TDが蓄積される。次に、図2において、記事番
号001の「情報」に興味なし、記事番号002の「情報」に
興味ありを入力し、学習ボタンを押した場合の説明をす
る。グループインタフェースユニット55は、適応型グ
ループ情報フィルタユニット56−IF1のユーザ認証部
44にアクセス認否信号PAと学習開始信号LSを送る。ユ
ーザー甲には適応型グループ情報フィルタユニット56
−IF1の教師信号記憶部13へのアクセスは許可されて
いるので、学習ユニット52に学習開始信号LSを送る。
学習ユニット52は、あらかじめ定められた学習アルゴ
リズム(後述する)にしたがって、適応型グループ情報
フィルタユニット56-IF1の個人プロファイルを書き換
える。個人プロファイルの修正を検出した情報評価ユニ
ット54は、アドレス記事プロファイル記憶部49から
現在アクセスしている97年10月6日に配信された記事
を読み出し、修正された個人プロファイルを用いて各記
事の必要性信号を計算し、図3のように評価済情報信号
IF1-NRADP-971006-001からIF1-NRADP-971006-009を、グ
ループインタフェースユニット55に再送する。グルー
プインタフェースユニット55は、再送された評価済情
報信号を、その中に含まれる必要性信号Nの大きい順に
並べて表示する。図3においては、ユーザー甲が興味あ
りと答えた「情報」は最上位に、興味なしと答えたもの
は、最下位に表示されている。また、その他の論文の並
びも変化している。
ァイルを開いた結果が、図4である。ユーザー甲が興味
を持った論文にあるChiral対称性に関係すると思われる
論文が最上位にあげられている。このようにして、ユー
ザーの興味のある/なしを学習した適応型グループ情報
フィルタ装置は、ユーザーの求める情報をリストの最上
位に置くことにより、ユーザーが欲しい情報を手に入れ
やすくすることができる。一方、ユーザー乙、丙、丁
も、同様に情報フィルタ装置を利用し、ユーザー甲とは
異なる個人プロファイルを適応型グループ情報フィルタ
ユニット56の中に作成する。
のフィルタがONの場合)で、2日前(10月4日分)
の評価済情報信号を集めたファイルにアクセスするボタ
ンを押した場合を、以下に説明する。グループインター
フェースユニット55は、ユーザー甲の興味を反映した
適応型グループ情報フィルタユニット56−IF1とユー
ザー乙の興味を反映した適応型グループ情報フィルタユ
ニット57−IF2とに、97年10月4日に配信された
13件「情報」に対応する評価済情報信号IF1-NRADP−9
71004−001からIF1-NRADP-971004-013までと、評価済情
報信号IF2-NRADP−971004−001からIF2-NRADP-971004-0
13までとを要求し、同信号を受け取る。グループインタ
フェースユニット55は、記事番号がxである「情報」
に対応する2つの評価済情報信号IF1-NRADP-971004-xに
含まれる必要性信号IF1-N-971004-xと評価済情報信号IF
2-NRADP-971004-xに含まれる必要性信号IF2-N-971004-
xとの和を、ユーザー甲、乙とからなるグループG1に対
する記事番号xの「情報」のグループ必要性信号IFG1−
N−970903−xとする。グループインタフェースユニット
55は、この計算をすべての記事番号xについて行う。
ンタフェースユニット55は、「情報」をグループ必要
性信号IFG1−Nの大きい順に並べて表示する。図5に示
した場合、ユーザー甲が興味があるとした論文以上にグ
ループとして興味を持つ必要がある論文が3つあること
が示されている。
利用することにより、ユーザー甲は、自分の属するグル
ープとして必要な「情報」をもっとも優先的に(リスト
の最上位に表示すること)手に入れることができる。ま
た、グループとしては大切な「情報」であるにも関わら
ずユーザー甲が見落とした「情報」であっても、ユーザ
ー乙が気づいてさえいれば、グループ用情報フィルタを
用いるとその見落とした「情報」はリストの上位に表示
される。したがって、ユーザー甲は、グループ用情報フ
ィルタを用いることで、「情報」の見落としを防ぐこと
ができる。以下のグループインタフェースユニット55
の動作は、個人用フィルタを用いた場合と同様であるの
で省略する。
ィルタユニット56−IF1の中の教師信号記憶部13に
は、個人用フィルタ、グループ用フィルタを有するグル
ープインタフェースユニット55を通じて、教師データ
信号TDが蓄積される。グループインタフェースユニット
55の学習ボタン(図2参照)を押すと、学習開始信号
LSが、ユーザー認証部44を通じて、学習ユニット52
に送信される。前記学習信号を受信した学習ユニット5
2は、前記教師信号記憶部13に記憶された教師データ
信号TDを用いて、後述する学習方法によって、記憶部
2、5、6の履歴内容(個人プロファイル)を書き換え
る。
は、学習ユニット52の学習能力をより高めるために実
施するものであり、学習ユニット52の学習能力(ユー
ザーがどんな「情報」を過去に必要としたかという履歴
の学習能力)が既に十分に高ければ行う必要はない。
を通じてユーザーに適応し、ユーザーの求める「情報」
を優先的に提示することができるだけでなく、さらに、
同一のグループに属するユーザーの知識を利用し、グル
ープ全体で必要な「情報」をも効率よく手に入れること
ができるという効果を有する。これによって、グループ
で情報検索を行う場合(具体的な例としては、大学など
研究機関の一つの研究室で論文検索、会社における課も
しくはプロジェクトにおける特許検索)に、自分個人の
研究テーマに直接関係した論文(例えば、ニューラルネ
ットワークの中で連想記憶モデルに関する論文)だけで
はなく、自分の研究テーマに近い重要な論文(例えば、
ニューラルネットワークの中でリカレントネットワーク
の論文だけど研究室メンバーの多くがよい論文と感じる
論文)をも容易に見つけることができるようになるとい
う効果がある。このように、本発明は、従来の情報フィ
ルタ装置および情報フィルタリング方法の課題を解決
し、複数の人が共同して情報検索を行う上でも有効な情
報フィルタリング装置および情報フィルタリング方法を
提供するものである。
は、従来の情報フィルタ装置では、学習を行っていない
初期状態からしか、情報フィルタ装置を利用できなかっ
たが、本発明の情報フィルタ装置では、同一のグループ
の他のユーザーの知識を利用できるので、最初から必要
な情報を手に入れやすいという効果もある。
について説明を行う。さて、いかに必要性信号(ある
「情報」が必要であったとの教師信号)を計算するかを
述べる。以下に述べる好ましい実施の形態では、必要性
信号は概念的に次のような量として計算される。上述し
た如く、入力された「情報」にキーワードが添付されて
いる場合を考える。一人のユーザーを考えると、そのユ
ーザーが必要としている「情報」に高い頻度または確率
で付いているキーワード集合Aと、不要としている「情
報」に高い頻度または確率で付いているキーワード集合
Bと、さらにはいずれにもよく付く、または付かないキ
ーワード集合Cとを考えることができる。
るキーワードには正の数値を、前記キーワード集合Bに
属するキーワードには負の値を、前記キーワード集合C
に属するキーワードには値0をそれぞれ割り振る。そし
て、新たに入力された「情報」についている1つ以上の
キーワードについてそれぞれが、前記キーワード集合
A、B、Cのどのキーワードグループに属するかを判定
し、前記割り振られた値を積算するように構成する。
れた「情報」に付いていた複数のキーワードを、キーワ
ード集合Aに属するキーワードが数多く含まれた「情
報」(ユーザーが必要とする可能性の高い情報)に対し
ては大きな正の値を示し、キーワード集合Bに属するキ
ーワードが数多く付いている「情報」(ユーザーが不要
とする可能性の高い情報)に対しては大きな負の値を示
す数値に変換することができる。このようにして、前記
数値を用いてユーザーの必要性を予測することができ
る。
報」に関するユーザーの必要/不要の評価とからキーワ
ード(キーワード共起を含む)への値の割り振りを自動
的に行い精度の高い必要性信号の計算を実現し、精度高
く必要性の高い順に「情報」を並べ変えることを実現す
るものである。実施の形態1では、「情報」に付けられ
た複数のキーワードを一つのベクトルに変換し、ユーザ
ーが必要とした場合と不要とした場合について、別々に
前記ベクトルの自己相関行列を計算している。ユーザー
が必要と答えた「情報」についていたキーワードから作
られた自己相関行列MYを用いて、ベクトルVの長さS
Yを以下の式のように計算する。
報」についていたキーワードから作られた自己相関行列
MYを「肯定メトリック信号」、不要と答えた情報につ
いていたキーワードから作られた自己相関行列MNを
「否定メトリック信号」と呼び、長さSYを肯定信号と
呼ぶ。この長さSYは、ベクトルVの元となった複数の
キーワードの中に、ユーザーが必要とする「情報」によ
く含まれているキーワードが数多く含まれていれば、長
さSYは大きな正の値をとり、そうでない場合には0に
近い値をとるから、必要性信号を計算する上で有効であ
る。
ブロック図を示し、詳細説明する。情報評価ユニット5
4は、個々の「情報」につけられた複数のキーワード
(正確には、分類コードを含む文字列)をベクトルに変
換する部分と、ユーザーがどんな「情報」を必要/不要
としたという履歴を表現した肯定メトリック信号及び否
定メトリック信号を用いてある種のスコアを表す肯定信
号と否定信号を計算する部分と、この肯定信号と否定信
号とから「情報」の必要性をよく反映する必要性信号を
計算する部分とからなる。
ロックの構成を、図6に即して説明する。図6におい
て、43はアドレス情報信号記憶部42からネットワー
ク60を介してアドレス情報信号ADPを読み出すアドレ
ス情報信号読み出し部であり、1は「情報」に付けられ
たキーワードなどの複数の文字列をベクトルに変換する
ベクトル生成部、2はキーワードなどの複数の文字列を
ベクトルに変換するための符号辞書信号を記憶した辞書
記憶部である。この辞書記憶部2に記憶された符号辞書
信号は、「情報」についているキーワードなどの文字列
Wを数字Cに変換する対応表をnofDCK個有するコードブ
ック
数信号nofKs とnofKs 個のキーワード信号からなるキー
ワード群信号Ks=(K[1],・・・,K[nofKs
])とを受けキーワード群信号Ksと符号辞書信号D
CKを用いてベクトル信号Vに変換する。3はスコア計
算部で、ユーザーに提示された「情報」を必要/不要と
評価した結果から計算された肯定メトリック信号MY、
否定メトリック信号MNを用いて、ベクトル生成部1で
変換された2つのベクトル信号Vを、肯定信号SYと否
定信号SNに変換する。5は(nofDCK×nofDCK) 行列で
ある前記肯定メトリック信号MYを記憶する肯定メトリ
ック記憶部、6は(nofDCK×nofDCK) 行列である前記否
定メトリック信号MNを記憶する否定メトリック記憶部
である。7は前記肯定信号SYと前記否定信号SNを受
け必要性信号Nと信頼性信号Rを計算する必要性計算部
である。45は、アドレス情報信号読み出し部43から
のアドレス情報信号ADPと必要性計算部7からの必要性
信号Nと信頼性信号Rを受けて、評価済アドレス情報信
号NRADPを出力する評価済アドレス情報信号出力部であ
る。
54の動作を以下に説明する。まず、グループインタフ
ェースユニット55がユーザーによって起動されると、
グループインタフェースユニット55はネットワーク6
1を介してデフォルト値に設定されたアドレス情報読み
出し開始信号RSをアドレス情報信号読み出し部43に
送る。前記デフォルト値に設定されたアドレス情報読み
出し開始信号RSを、ユーザー認証部44を通じて、受
け取ったアドレス情報読み出し部43は、複数のアドレ
ス記事プロファイル信号ADPからなる最も新しく作成
されたファイルを読み出し、ベクトル生成部1と評価済
アドレス情報信号出力部45へ送る。本実施例では、前
記アドレス記事プロファイル信号ADPには、「情報」
が書き込まれたアドレスを示すアドレス信号A、「情
報」のタイトルを示すタイトル信号TTL、キーワードの
個数を表すキーワード数信号nofKs と、複数のキーワー
ドであるキーワード群信号Ks=(K[1],K
[2],・・・,K[nofKs ])からなる場合を示す。
ス記事プロファイル信号ADPが含まれるが、各々のアド
レス記事プロファイル信号ADPは、順次以下の処理を受
ける。アドレス記事プロファイル信号ADPのキーワード
数信号nofKsとキーワード群信号Ksの2つがベクトル生
成部1に入力される。このベクトル生成部1は、キーワ
ード群信号Ksを、文字列の集まりからベクトル信号V
へと変換する。この変換によって、キーワード群信号の
類似性をベクトルの距離として計算できるようになる。
すフローチャートを参照しながら説明する。まず、キー
ワード数信号nofKsとキーワード群信号Ksを受けると
(図7ステップS1)、内部のベクトル信号V=(V
[1],V[2],・・・,V[nofDic])を(0,
0,・・・,0)に、キーワードカウンタ信号iを1に
セットする(同図ステップS2、S3)。次に、辞書カ
ウンタ信号jを0セットした後辞書カウンタ信号jを1
だけ増やす(同図ステップS4)。
Kを有する辞書記憶部2から辞書カウンタjが指定する
キーワードと数字からなる符号辞書信号DCK[j]を
読み出し、符号辞書信号DCKの文字列部分W[j]と
i番目のキーワード信号K〔i]とを比較する(同図ス
テップS5)。両者が等しくない場合には、辞書カウン
タjを1だけ増やす(同図ステップS6)。両者が一致
するか、または辞書カウンタjの値が辞書記憶部2に格
納された符号辞書信号の個数nofDiCと等しくなるまで図
7ステップS5〜S7の処理を繰り返す(同図ステップ
S7)。
が見つかると、ベクトル信号のj番目の成分V[j]を
1にし(同図ステップS8)、キーワードカウンタ信号
iを1だけ増やす(同図ステップS9)。以下、同様の
処理をキーワードカウンタ信号iがキーワード数信号no
fKs より大きくなるまで実行する(同図ステップ(S1
0)。
字列信号からなるキーワード信号の集合体であるキーワ
ード群信号Ksは、0と1でコード化されたnofDCK個の
成分を持ったベクトル信号Vに変換される。
成部1からのキーワード群信号Ksに過去にユーザーの
必要とした情報に含まれていたキーワードが数多く含ま
れる場合に、大きな値となる肯定信号SYを計算する。
この目的のために、肯定信号計算部31は、前記ベクト
ル信号Vを受けて、肯定メトリック記憶部5から肯定メ
トリック信号MYを読み出し、肯定信号SYを次の式の
ように計算する。
からのキーワード群信号Ksに過去にユーザーの不要と
した情報に含まれていたキーワードが数多く含まれる場
合に、大きな値となる否定信号SNを計算する。この目
的のために、否定信号計算部32は、否定メトリック記
憶部6から否定メトリック信号MNを読み出し、否定信
号SNを次の式のように計算する。
信号MNは、後述するようにキーワード群信号Ksとユ
ーザーの応答に基づいて決められる。本発明では、各々
のアドレス記事プロファイル信号(もしくは、各々の
「情報」)に、前記の肯定信号SYと否定信号SNとを
対応させる。この肯定信号SYと否定信号SNを用い
て、縦軸に肯定信号SYをとり横軸に否定信号SNをと
った2次元空間上の1点を定めることができる。つま
り、各々のアドレス記事プロファイル信号(もしくは、
各々の「情報」)を、この2次元の1点に対応させるこ
とができるのである。アドレス記事プロファイル信号
(もしくは、各々の「情報」)に対応する点(複数
個)、この2次元空間にプロットすると、その時の分布
(アドレス記事プロファイル信号(もしくは、「情
報」)の分布)は、図8に示したものになる。すなわ
ち、ユーザーが必要とするもの(○で表示)は主に左上
部に分布し、ユーザーが不要とするもの(×で表示)は
主に右下部に分布するようになる。したがって、図8に
示したように適切な係数Cを1に設定することにより、
ユーザーが必要とする記事信号Dと不要な記事信号Dと
を分離できる。したがって、上記ように必要性信号をN
=SY−SNとすれば、必要性信号は、ユーザーが必要
とする情報に対して大きな値をとるようになる。
れは○と×を良く分離できるものであれば他の値であっ
ても構わない。
述の2次元空間で左上にある程、すなわち、必要性の高
いと予測される記事信号Dほど大きな値となる。したが
って、必要性信号Nの大きい順に記事信号Dを並べて提
示すれば、ユーザーは必要な情報を効率よく手に入れる
ことができる。必要性信号Nと直交する方向の信頼性信
号Rは、大まかにはキーワード群信号Ksに含まれてい
たキーワードのうちどのくらいのキーワード信号が辞書
に含まれていたかを示す信号である。したがって、この
信頼性信号Rの大きさは、情報フィルタが計算した必要
性信号Nがどれだけ信頼できるのかを示す。
算部31から出力される前記肯定信号SYと前記否定信
号計算部32から出力される前記否定信号SNとを受
け、過去必要であった情報についていたキーワードが多
数あり、不要であった情報についていたキーワードがほ
とんどない時に大きな値となる必要性信号Nを N=SY−SN と計算し、信頼性信号Rを R=SY+SN と計算し、評価済アドレス情報信号出力部45へ送る。
評価済アドレス情報信号出力部45は、アドレス情報信
号読み出し部43からのアドレス情報信号ADPと必要性
信号計算部7からの必要性信号Nと信頼性信号Rとを受け
て、評価済情報信号NRADPを出力する。このようにし
て、情報評価ユニット54は、アドレス記事プロファイ
ル信号ADPを読み込み、評価済情報信号NRADPを出力す
る。
る。次に、図9に学習ユニット52のブロック構成図を
示し説明する。学習ユニット52は、ユーザーから入力
された教師信号Tを用いて肯定/否定メトリック信号を
修正するメトリック学習を行う部分と、肯定/否定信号
から必要性信号を計算するためのパラメータ、判定パラ
メータ信号、を修正する部分からなり、各部分は学習制
御部14によって制御される。
部5に記憶された肯定メトリック信号MYと否定メトリ
ック記憶部6に記憶された否定メトリック信号MNとを
修正するメトリック学習部である。このメトリック学習
部19は、教師信号記憶部13から教師データTDを読
み出し、ベクトル生成部1と同じ機能である学習用ベク
トル生成部20で複数のキーワードをベクトルに変換
し、自己相関行列を計算することで、肯定/否定メトリ
ック信号を修正する。14は学習開始信号LSを受けて
メトリック学習部19を制御する学習制御部である。
ト52の動作について図10と図11に示したフローチ
ャートと本発明の動作を説明するための概念図とを参照
しながら説明する。図10に学習制御部14の動作をフ
ローチャートを用いて、詳しく説明する。図10におい
て、まず、グループインタフェースユニット55からネ
ットワーク61を介して学習制御部14に学習開始信号
LSが入力されると、学習制御部14は指示信号LIを
待機状態を示す値0から処理中を示す値1に変え(図1
0ステップS41)、グループインタフェースユニット
55に返す。次に、図11のステップS53に対応する
メトリック学習部19を動作し(同図ステップS4
2)、学習処理が終わると学習制御部14の指示信号L
Iの値を再び待機中を示す値0にして、グループインタ
フェースユニット44に送り(同図ステップS43)、
処理を終了する。
応答(教師信号T)とキーワード群信号Ksとを用い
て、肯定/否定メトリック信号を修正する動作を図11
のフローチャートを用いて説明する。図11において、
メトリック学習部19は、学習制御部14からメトリッ
ク学習制御信号MLCを受けると(図11ステップS5
1)、肯定メトリック記憶部5から肯定メトリック信号
MYを、否定メトリック記憶部6から否定メトリック信
号MNをそれぞれ読み出し、教師データカウンタcの値
を1にする(同図ステップS52)。
データ記憶部13からc番目の教師データ信号TD
[c](=(T[c],DP[c])=(T[c],TTL[c],nofKs[c],Ks
[c]))を読み出し(同図ステップS53)、教師デー
タTD[c]の教師信号T[c]を調べる。前記教師信
号T[c]が−1でない場合(T≠−1)には(同図ス
テップS54)、教師データTD[c]のキーワード数
信号nofKs [c]とキーワード群信号Ks[c]とを出
力する(同図ステップS55)。前記教師データTD
[c]のキーワード数信号nofKs [c]とキーワード群
Ks[c]とを受けた学習用ベクトル生成部20は、前
述の情報評価ユニット54のベクトル生成部1と同様の
動作を行い、学習用ベクトル信号LVを出力する(同図
ステップS56)。メトリック学習部19は、前記学習
用ベクトル信号LVを受け、前記教師データTD[c]
の教師信号T[c]がT=1である場合(つまり、ユー
ザーが当該情報に興味があると答えた場合)には(同図
ステップS57)、肯定メトリック信号MYを
処理により、肯定メトリック信号MYは、ユーザーが必
要としたアドレス記事プロファイル信号ADPについて
いたキーワード信号(複数)に対して大きな値を持つよ
うになる。その結果、前述の肯定信号SYが、ユーザー
が必要とする記事信号Dに対して大きくなるようにな
る。否定メトリック信号MNも以下のように同様の処理
がなされる。
[c]がT=0である場合つまり、ユーザーが当該情報
に興味がないと答えた場合)には、否定メトリック信号
MNを MN[i][j]=MN[i][j]+LV[i]・L
V[j] (ここで、i,j=1〜nofDiC)と修正する(同図ステ
ップS59)。教師信号T[c]を、T[c]=−1と
リセットする(同図ステップS60)。次に、教師デー
タカウンタの値を c=c+1 と1だけ増やす(同図ステップS61)。カウンタ値c
と教師信号記憶部13に記憶できる教師データ信号数の
最大値nofTDとを比較し(同図ステップS62)、c>no
fTDの場合には同図ステップS63へ、その他の場合に
は同図ステップS53へ進む。
作を、教師データTD[c]の教師信号T[c]がT
[c]=−1になるとなるまで繰り返す。T[c]=−
1となると、メトリック学習の処理を終了し、メトリッ
ク学習制御信号MLCを学習制御部14に送る。学習制
御部14は、前記メトリック学習信号MLCを受け、学
習制御部指示信号を待機中を示す値にし、処理を終了す
る。
介した構成としたが、これを一つの装置の中にまとめる
ことも可能である。
リック信号MNの学習を忘却の効果を入れた MY[i][j]=α・MY[i][j]+LV[i]
・LV[j] MN[i][j]=β・MN[i][j]+LV[i]
・LV[j] を用いてもよい結果が得られる(ここで、αとβとは、
1より小さい正の数)。
然言語処理101−8(1994.5.27)」などに
記載された文書からキーワード群信号とキーワード数信
号を生成するキーワード生成部を付加する構成をとれ
ば、キーワードが与えられていない情報に対しても適用
できる情報フィルタ装置を構成することができる。
イトルを構成する単語をもってキーワードとし、キーワ
ード数信号とキーワード群信号を生成してもよい。加え
て、キーワード信号は、国際特許分類番号など分類記号
を含むようにもしても、本発明の構成を変更する必要は
なく、よい結果を得ることができる。
ループに属して情報を収集するメンバーの間で、個人の
興味を反映した個人プロファイルの共同利用を実現した
点にある。これを利用することにより、グループ内での
情報の見落としが減り、なおかつ、従来の技術では、ま
ったくの空の個人プロファイルから開始することしかで
きなかった情報フィルタ装置が、グループのメンバーの
個人プロファイルを初期の個人プロファイルとして利用
できることが可能となる。
報フィルタ装置によれば、ユーザーからの教師信号に基
づいた学習によって、ユーザーの求める「情報」を優先
的に提示することができるだけでなく、さらに、同一の
グループに属するユーザーの知識を利用し、グループ全
体で必要な「情報」をも効率よく手に入れることができ
る。これによって、グループで情報検索を行う場合(具
体的な例としては、大学など研究機関の一つの研究室で
論文検索、会社における課もしくはプロジェクトにおけ
る特許検索)に、自分個人の研究テーマに直接関係した
論文(例えば、ニューラルネットワークの中で連想記憶
モデルに関する論文)だけではなく、自分の研究テーマ
に近い重要な論文(例えば、ニューラルネットワークの
中でリカレントネットワークの論文だけど研究室メンバ
ーの多くがよい論文と感じる論文)をも容易に見つける
ことができるようになる。このように、本発明は、従来
の情報フィルタ装置および情報フィルタリング方法の課
題を解決するものであり、複数の人が共同して情報検索
を行う上で、グループ内での情報の見落としが少なくな
る優れたグループウエアとしての情報フィルタ装置が実
現される。
態2について、図面を参照しながら説明する。本発明の
実施の形態2は、実施の形態1の構成の学習ユニット5
2を図12に示す構成に置き換えたものであり、他の部
分は、実施の形態1と同じであるので説明および図示を
省略する。
辞書学習部23が辞書記憶部2に記憶された符号辞書信
号DCKが使用者に適応するように更新するものへ、ま
た肯定メトリック信号MYと否定メトリック信号MNを
単純な頻度分布に対応するキーワードの自己相関行列か
ら、情報が必要/不要の出現するキーワードの確率分布
を考慮したものへと情報フィルタ装置は改良される。
置のブロック結線図を示すが、以下の説明では、実施の
形態1の情報フィルタ装置のブロック結線図と異なる構
成についてのみ詳細に説明する。図12において、23
は学習制御部14からの辞書学習信号DLCを受け、辞
書記憶部2の符号辞書信号DCKを更新する辞書学習
部、24は文字列Wと数字Cがキーワード群信号Ksに
含まれていたときに使用者が記事信号Dを必要と解答し
た回数を示す肯定回数PYと、文字列Wがキーワード群
信号Ksに含まれていたときに使用者が記事信号Dが不
要と解答した回数を示す否定回数PNとからなる表をno
fFDCK個有する適応符号辞書信号
は使用者が必要と答えた回数を示す全肯定回数信号NY
と、不要と答えた回数を示す全否定回数信号NNとを記
憶する回数記憶部、26は肯定メトリック更新用の1次
肯定メトリック信号MY1を記憶する1次肯定メトリッ
ク記憶部、27は否定メトリック更新用の1次否定メト
リック信号MN1を記憶する1次否定メトリック記憶
部、28は前記肯定回数信号と前記否定回数信号と前記
1次肯定メトリック信号MY1と前記1次否定メトリッ
ク信号MN1とから改良された肯定メトリック信号MY
と否定メトリック信号MNを計算してそれぞれを肯定メ
トリック記憶部5と否定メトリック記憶部6に書き込む
KDメトリック学習部である。
の動作について説明する。なお、動作が実施の形態1と
同様の個所は説明を省略する。情報フィルタ装置の好ま
しい初期状態の一例は、肯定メトリック信号MYと否定
メトリック信号MNとを(nofDCK×nofDCK)零行列、未
読データ記憶部10の未読データURD[i]の全ての
必要性信号N[i](i=1,・・・,nofURD)を使用
するハードウエアが表現可能な最小の値Vmin、教師
データ記憶部13の教師データTD[j]の教師信号T
[j]を全て−1、適応符号辞書信号の文字列Wを全て
ブランク、数字Cを符号辞書信号FDCKの上から順に
1、2、・・・・、nofFDCK 、肯定回数PYと否定回数
PNを0、適応符号辞書に対応して、符号辞書の文字列
も全てブランクとした状態である。
書き込み部42、評価済情報記憶部43、ユーザー認証
部44、グループインタフェースユニット55は、実施
の形態1と同じ動作を行い、使用者の応答が付いた教師
データTDを教師データ記憶部13に送る。そして、グ
ループインタフェースユニット55から学習開始信号LS
が学習開始信号入力端子106を通じて入力されると、
学習ユニット52は、以下に述べるような学習を開始す
る。学習制御部14は、前記学習開始信号LSを受け
て、学習制御部指示信号出力端子107から出力される
学習制御部指示信号LIを0から1に変え、処理中を示
す。そして辞書学習信号DLCを辞書学習部23に送
る。
照しながら辞書学習部23の動作を説明する。まず、学
習制御部14から辞書学習信号DLCを受けて(図13
ステップS71)、適応符号辞書記憶部24から適応符
号辞書FDCKを最大nofFDCKtmp個の適応符号信号を記
憶できる適応符号信号バッファに読み込み、回数記憶部
25から全肯定回数信号NYと全否定回数信号NNと
を、1次肯定メトリック記憶部26から1次肯定メトリ
ック信号MY1を、1次否定メトリック信号記憶部27
から1次否定メトリック信号MN1を読み出す(同図ス
テップS72)。次に内部の教師データカウンタcの値
を1にし(同図ステップS73)、教師信号記憶部13
から教師データTD[c]を読み出し(同図ステップS
74)、その教師信号T[c]が−1であるか否かを判
定する(同図ステップS75)。
う。まず、内部のキーワード数カウンタiの値を1にセ
ットし(同図ステップS76)、適応符号辞書カウンタ
jの値を1にセットする(同図ステップS77)。次
に、前記文字列W[j]がブランクであるかないかを判
定し(同図ステップS78)、ブランクである場合に
は、前記文字列W[j]を前記キーワード信号TK
[i]で置き換える(同図ステップS79)。ブランク
でない場合には、教師データTD[c]のi番目のキー
ワード信号TK[i]とj番目の適応符号辞書信号FD
CK[j]の文字列W[j]とを比較する(同図ステッ
プS80)。
たは、ブランクでなくかつ前記キーワード信号TK
[i]と前記文字列W[j]が一致した場合、T[c]
の値に応じて以下の処理を行う。T[c]=1の場合
(同図ステップS81)、全肯定信号NYに1を加え
(同図ステップS82)、適応符号辞書信号FDCK
[j]の肯定回数PY[j]に1を加える(同図ステッ
プS83)。T[c]≠1、これはT[c]=0の場合
であるが、全否定信号NNに1を加え(同図ステップS
84))、適応符号辞書信号FDCK[j]の否定回数
PN[j]に1を加える(図ステップS85)。
ーワード信号TK[i]と前記文字列W[j]が一致し
ない場合、適応符号辞書カウンタjの値を1増やす(同
図ステップS86)。適応符号辞書カウンタjの値が適
応符号辞書信号バッファに記憶できる適応符号信号の数
に1を加えた値nofFDCKtmp+1と比較する(同図ステップ
S87)。適応符号辞書カウンタjの値が、nofFDCKtmp
+1以下の場合、文字列W[j]がブランクかどうかの判
定に戻る。それ以外の場合は、前記キーワードカウンタ
iの値を1だけ増やす(同図ステップS88)。
師データTD[c]のキーワード数信号TnofKSに1を加
えた値TnofKs+1と比較して小さい場合(同図ステップS
89)、辞書カウンタjを1にセットし、同様の処理を
行う。それ以外の場合、教師データカウンタcの値を1
だけ増やす(同図ステップS90)。教師データカウン
タcの値と、教師データ数の最大値nofTD に1を加えた
値nofTD+1 とを比較し(同図ステップS91)、教師デ
ータカウンタcの値が小さい場合、次の教師データTD
[c]を読み出して同様の処理を行う。以上の処理が、
全ての教師データTDに対して行われる。
書信号FDCK[j]に対してキーワードコスト信号K
Dを計算する。このキーワードコスト信号は、文字列W
〔j]がキーワードとして有効であるか否かを判断する
ために用いられる量である。
現する確率 NN/(NY+NN) と比較して、文字列W[j]が付いている記事信号Dが
使用者にとって不要である場合の確率 PN[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようなものであれ
ば、文字列W[j]は、情報データDが使用者にとって
不要と判定する上で有効である。同様に、使用者の必要
な記事信号Dが出現する確率 NY/(NY+NN) と比較して、文字列W[j]が付いている記事信号Dが
使用者にとって必要である場合の確率 PY[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようなものであれ
ば、文字列W[j]は、情報データDが使用者にとって
必要と判定する上で有効である。
反映している量で有ればなんでもよいが、好ましい例の
一つとして、カルバックダイバージェンスと呼ばれる
では、本情報フィルタ装置の初期状態など、全肯定回数
信号NY、全否定回数信号NN、肯定回数PY[j]、
否定回数PN[j]が0のときには、log( )の計算が
できない、 PY[j]+PN[j]≒1 を満たす適応符号辞書信号FDCK[j]のキーワード
コスト信号を過大評価する等不適切な場合がある。これ
を回避する好ましい実施の形態の一つは、キーワードコ
スト信号を
り算、log0を避けるための小さな正の値を持つパラメー
タである。パラメータPCは、3から10程度の値とす
るとよい。
文字列W[j]と肯定回数PY[j]と否定回数PN
[j]とをキーワードコスト信号KDの大きい順に並べ
替える(同図ステップS92)。このとき、適応符号辞
書FDCK[j]の数字C[j]には、最初の並び順が
残っている。これを利用して、1次肯定メトリック信号
MY1とC[j]から、C[i]、C[j]の値がとも
に符号辞書DCKの数nofDCKより小さい場合、 M[i][j]=MY1[C[i]][C[j]], i,j=1、・・nofDCK その他の場合は、i=jの場合は、 M[i][i]=PY[C[i]], i,=1、・・nofDCK i≠jの場合は、 M[i][j]=0, i,j=1、・・nofDCK とした上で、 MY1[i][j]=M[i][j]、i,j=1、・・nofDCK と1次肯定メトリック信号MY1の置き換えを行う。1
次否定メトリック信号MN1に対しても、同様の置き換
えを行う(同図ステップS93)。そして、適応符号辞
書信号バッファ内の適応符号辞書FDCK[j]の数字
C[j]を C[j]=j、j=1、・・・、nofFCKtmp と置き換える。
は、適応符号辞書バッファ内の適応符号辞書FDCKの
上位nofDCK個の文字列W[j]と数字C[j]を辞書記
憶部2に書き込み、適応符号辞書バッファ内の適応符号
辞書信号FDCK[j]の上位nofFDCK 個を適応符号辞
書記憶部24に書き込み、全肯定回数信号NYと全否定
回数信号NNを回数記憶部25に書き込み、1次肯定メ
トリック信号MY1を1次肯定メトリック信号記憶部2
6に1次否定メトリック信号MN1を1次否定メトリッ
ク信号記憶部27に書き込む(同図ステップS94)。
最後に、辞書学習信号DCLを学習制御部14に戻し
(同図ステップS95)、処理を終了する。
ック学習部28にメトリック学習制御信号MLCを送
る。前記メトリック学習制御信号MLCを受けたKDメ
トリック学習部28は、まず、1次肯定メトリック記憶
部26から1次肯定メトリック信号MY1を、1次否定
メトリック記憶部27から1次否定メトリック信号MN
1をそれぞれ読み出す。
データカウンタcの値を1にする。教師データ記憶部1
3からc番目の教師データ信号TD[c]を読み出し、
教師データTD[c]の教師信号T[c]を調べる。前
記教師信号T[c]が−1でない場合(T≠−1)に
は、教師データTD[c]のキーワード数信号nofKs
[c]とキーワード群信号Ks[c]とを出力する。前
記教師データTD[c]のキーワード数信号nofKs
[c]とキーワード群Ks[c]とを受けた学習用ベク
トル生成部20は、前述した実施の形態1の情報評価ユ
ニット54のベクトル生成部1と同様の動作を行い、学
習用ベクトル信号LVを出力する。KDメトリック学習
部28は、前記学習用ベクトル信号LVを受け、前記教
師データTD[c]の教師信号T[c]がT=1である
場合には、1次肯定メトリック信号MY1を MY1[i][j]=MY1[i][j]+LV[i]
・LV[j] (ここで、i,j=1〜nofDiC) と修正する。前記教師データTD[c]の教師信号T
[c]がT=0である場合には、1次否定メトリック信
号MN1を MN1[i][j]=MN1[i][j]+LV[i]
・LV[j] (ここで、i,j=1〜nofDiC) と修正する。教師データカウンタの値を c=c+1 と1だけ増やす。
の動作を、教師データTD[c]の教師信号T[c]が
T[c]=−1になるかまたはc=nofTD となるまで繰
り返す。T[c]=−1またはc=nofTD となると、1
次肯定メトリック信号MY1と1次否定メトリック信号
MN1の学習を終える。
NYと全否定回数信号NNを読み出し、1次肯定メトリ
ック信号MY1と1次否定メトリック信号MN1とを用
いて肯定メトリック信号MYを計算する。こうして計算
される肯定メトリック信号MY、否定メトリック信号M
Nは、キーワードコスト信号KDと同様、計算される肯
定信号SYと否定信号SNが、使用者の不要な記事信号
Dが出現する確率 NN/(NY+NN) と比較して、文字列W[j]が付いている記事信号Dが
使用者にとって不要である場合の確率 PN[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようなものであり、
使用者の必要な情報データDが出現する確率 NY/(NY+NN) と比較して、文字列W[j]が付いている記事信号Dが
使用者にとって必要である場合の確率 PY[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようなものであると
いった性質を持っていれば、他のものでもよい。これを
満たす好ましいのは、肯定メトリック信号MYを
log0を避けるための小さな正の値を持つパラメータであ
る。
号MY1を1次肯定メトリック信号記憶部26に、更新
された1次否定メトリック信号MN1を1次否定メトリ
ック信号記憶部27に、新たに計算れた肯定メトリック
信号MYを肯定メトリック記憶部5へ、新たに計算され
た否定メトリック信号MNを否定メトリック記憶部6へ
書き込む。
トリック学習の処理を終了し、メトリック学習制御信号
MLCを学習制御部14に送る。学習制御部14は、K
Dメトリック学習部28からのメトリック学習制御信号
MLCを受けて、学習制御部指示信号LIを1から0に
変え、処理を終了する。
部2の符号辞書が空でなくなるので、情報評価ユニット
54から出力される必要性信号N、信頼性信号Rは、0
でなくなり、使用者の必要性の高い情報データが、グル
ープインタフェースユニット55の表示するリストの上
位に現れるようになる。
用者が必要とする情報か否かを判定するために有効なキ
ーワードが優先的に辞書記憶部2に記憶されるようにな
り、小規模な辞書であっても、精度の高い情報フィルタ
リングが可能となる。
次否定メトリック信号MN1の学習を忘却の効果を入れ
た MY1[i][j]=α・MY1[i][j]+LV
[i]・LV[j] MN1[i][j]=α・MN1[i][j]+LV
[i]・LV[j] を用いてもよい結果が得られる。(ここで、αは、1よ
り小さい正の数)もしくは、MY1[i][j]または
MN1[i][j]のいずれかが一定値をこれた場合
に、 MY1[i][j]=MY1[i][j]/2 MN1[i][j]=MN1[i][j]/2 として、信号のオーバーフローを防ぐように構成するこ
とは、実施上好ましい。これは、適応符号辞書信号FD
CK[j]の肯定回数PY[j]と否定回数PN
[j]、および全肯定回数信号NYと全否定回数NNに
ついても同様である。
然言語処理101−8(1994.5.27)」などに
記載された文書からキーワード群信号とキーワード数信
号を生成するキーワード生成部を付加する構成をとれ
ば、キーワードが与えられていない情報に対しても適用
できる情報フィルタ装置を構成することができる。
は、タイトルを構成する単語をもってキーワードとし、
キーワード数信号とキーワード群信号を生成してもよ
い。加えて、キーワード信号は、国際特許分類番号など
分類記号を含むようにもしても本発明の構成を変更する
必要はなく、よい結果を得ることができる。
とする情報の出現確率を用いて情報の必要性信号Nを計
算する情報フィルタ装置において課題となっていた問
題、すなわち、情報検索になれていないユーザーは、自
分にとって必要な情報のみ「必要」と回答し、不要な情
報については無視するために、ユーザーが必要とする情
報の出現確率が1となってしまうという問題は、ユーザ
ーが「必要」もしくは「不要」だけしか入力しない状態
では、ユーザーが必要とする情報の出現確率NY/(N
Y+NN)を0もしくは1でない値、例えば0.5とす
ることにより解決することができる。
ィルタによれば、ユーザーからの教師信号に基づいた学
習によって、ユーザーの必要とする情報に対しては、必
要性信号が大きな値を取るようになり、その結果、表示
装置等には、ユーザーにとって必要性が高い情報が優先
的に表示されるようになる。
態3について説明する。本実施の形態3は、実施の形態
1または実施の形態2の構成における計算量およびメモ
リ量を、各メトリック信号を2次元の行列から1次元の
ベクトルとすることで、削減するものである。以下、本
実施の形態3の動作を実施の形態1を参照して説明す
る。
は、
師信号T[c]がT=1である場合には肯定メトリック
信号MYの更新式は、 MY1[i]=MY1[i]+LV[i] (ここで、i=1〜nofDiC) 前記教師データTD[c]の教師信号T[c]がT=0
である場合には、否定メトリック信号MNは、 MN1[i]=MN1[i]+LV[i] (ここで、i,j=1〜nofDiC) と更新される。その他は、実施の形態1と同様である。
にキーワードの積(AND)などキーワード検索式含む
ように構成することにより、キーワードの共起をベクト
ル信号Vに反映させることは、非常に好ましい。また、
この方法は、実施の形態2についても同様の方法で変更
できる。
られた複数のキーワードをベクトルに変換する手段と、
このベクトルと使用者からの教師信号を用いてスコアを
計算する手段と、このスコアから必要性と信頼性を計算
する手段とを備え、スコア計算部がスコアを計算する際
に用いるメトリックを使用者から与えられる情報の必要
/不要という単純な評価をもとに計算し、情報をユーザ
ーの必要度にしたがって並べ、ユーザーに対して必要性
の高い情報から順に提供することにより、初心者にも精
度の高い情報を得ることができる。
位で利用できるようにすることで、個々のユーザーの情
報の見落としを防ぎ、個人プロファイルの初期化を容易
に行うことのできる使用者にとって必要性の高く情報の
取り出し易い情報フィルタ装置を提供することができ
る。
ロック結線図
態)の一例を示す図
後)の一例を示す図
後)の一例を示す図
後)の一例を示す図
報評価ユニットのブロック結線図
クトル生成部の動作のフロー図
定面学習部の動作の模式図
習ユニットのブロック結線図
学習制御部の動作のフロー図
メトリック学習部の動作のフロー図
学習ユニットのブロック結線図
辞書学習部の動作のフロー図
Claims (6)
- 【請求項1】 提示された情報に対し自分の興味の有無
(教師信号)を入力する入力手段と、前記教師信号を用
いて使用者毎に独立して個人の興味を反映した個人プロ
ファイルを生成する個人プロファイル生成手段と、情報
に対し前記個人プロファイルを用いて使用者毎に必要性
信号を計算する情報評価手段とを有する一つ以上の情報
フィルタユニットと、前記情報フィルタユニットとネッ
トワークを介して接続され、前記使用者と同一グループ
に属する前記情報フィルタユニットへの必要性信号の要
求に対してそれぞれ送られてくる必要性信号からグルー
プの必要性信号を計算し、前記グループの必要性信号を
利用してグループの興味を反映した情報の提示をするグ
ループインタフェースユニットとを具備することを特徴
とする情報フィルタ装置。 - 【請求項2】 使用者毎に計算される必要性信号は、正
から負の値をとることを特徴とする請求項1記載の情報
フィルタ装置。 - 【請求項3】 グループの必要性信号は、使用者毎に計
算される必要性信号の和であることを特徴とする請求項
1または2記載の情報フィルタ装置。 - 【請求項4】 提示された情報に対し自分の興味の有無
(教師信号)を入力するステップと、前記教師信号を用
いて使用者毎に独立して個人の興味を反映した個人プロ
ファイルを生成するステップと、情報に対し前記個人プ
ロファイルを用いて使用者毎に必要性信号を計算する情
報評価ステップとを有する一つ以上の情報フィルタユニ
ットからなるグループの個人プロファイルの共同利用す
る方法において、前記情報フィルタユニットとネットワ
ークを介して接続され、前記使用者と同一グループに属
する前記情報フィルタユニットへの必要性信号の要求に
対してそれぞれ送られてくる必要性信号からグループの
必要性信号を計算し、前記グループの必要性信号を利用
してグループの興味を反映した情報の提示をすることを
特徴とする情報フィルタリング方法。 - 【請求項5】 使用者毎に計算される必要性信号は、正
から負の値をとることを特徴とする請求項4記載の情報
フィルタリング方法。 - 【請求項6】 グループの必要性信号は、使用者毎に計
算される必要性信号の和であることを特徴とする請求項
4または5記載の情報フィルタリング方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30838697A JP3468062B2 (ja) | 1997-11-11 | 1997-11-11 | 情報フィルタ装置及び情報フィルタリング方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP30838697A JP3468062B2 (ja) | 1997-11-11 | 1997-11-11 | 情報フィルタ装置及び情報フィルタリング方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002300120A Division JP3508767B2 (ja) | 2002-10-15 | 2002-10-15 | グループ情報フィルタユニット装置及び情報フィルタ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11143900A JPH11143900A (ja) | 1999-05-28 |
JP3468062B2 true JP3468062B2 (ja) | 2003-11-17 |
Family
ID=17980447
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30838697A Expired - Lifetime JP3468062B2 (ja) | 1997-11-11 | 1997-11-11 | 情報フィルタ装置及び情報フィルタリング方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3468062B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6321221B1 (en) | 1998-07-17 | 2001-11-20 | Net Perceptions, Inc. | System, method and article of manufacture for increasing the user value of recommendations |
US6334127B1 (en) * | 1998-07-17 | 2001-12-25 | Net Perceptions, Inc. | System, method and article of manufacture for making serendipity-weighted recommendations to a user |
US6412012B1 (en) | 1998-12-23 | 2002-06-25 | Net Perceptions, Inc. | System, method, and article of manufacture for making a compatibility-aware recommendations to a user |
JP2000331013A (ja) | 1999-05-19 | 2000-11-30 | Matsushita Electric Ind Co Ltd | 情報問いあわせ支援装置及び情報問いあわせ支援方法 |
US7461058B1 (en) | 1999-09-24 | 2008-12-02 | Thalveg Data Flow Llc | Optimized rule based constraints for collaborative filtering systems |
US7788123B1 (en) | 2000-06-23 | 2010-08-31 | Ekhaus Michael A | Method and system for high performance model-based personalization |
US7024380B2 (en) | 2000-11-08 | 2006-04-04 | Matsushita Electric Industrial Co., Ltd. | E-commerce system and method |
JP2004348626A (ja) * | 2003-05-26 | 2004-12-09 | Hitachi Ltd | 文書検索方法及び文書検索システム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3244005B2 (ja) * | 1995-09-04 | 2002-01-07 | 松下電器産業株式会社 | 情報フィルタ装置及び情報フィルタリング方法 |
JP3588510B2 (ja) * | 1995-11-30 | 2004-11-10 | 株式会社東芝 | 情報フィルタリング装置 |
-
1997
- 1997-11-11 JP JP30838697A patent/JP3468062B2/ja not_active Expired - Lifetime
Non-Patent Citations (5)
Title |
---|
PESNICK,P. et al.,GroupLens:An Open Architecture for Collaborative Filtering of Netnews,Proceedings ACM 1994 Conference on Computer Supported Cooperative Work,1994年10月22日,p.175−186 |
Upendra Shardanand,Pattie Maes,Social Information Filtering:Algorithms for automationg"Word of Mouth",Proceedings of the ACM Confernece on Human Factors in Computing Systems,1995年10月30日,p.210−217 |
宮原一弘、岡本俊雄,分散協調作業/学習環境における情報の協調フィルタリング−個人の興味領域の表現およびその獲得法−,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,1996年12月14日,Vol.96,No.431(ET96−94),p.47−54 |
渡部勇,緩い協調:協調情報フィルタリングシステム,情報処理学会研究報告,日本,社団法人情報処理学会,1991年 3月 8日,Vol.91,No.18(91−HI−35−24),p.179−186 |
竹内格、森保健治,プッシュ型サービスにおける配信情報のパーソナル化への一検討,情報処理学会第55回(平成9年後期)全国大会講演論文集(3),日本,社団法人情報処理学会,1997年 9月24日,pp.756−760 |
Also Published As
Publication number | Publication date |
---|---|
JPH11143900A (ja) | 1999-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Meadow et al. | Text information retrieval systems | |
CN100565670C (zh) | 用于用户模型化以增强对命名实体识别的系统和方法 | |
CN109492157A (zh) | 基于rnn、注意力机制的新闻推荐方法及主题表征方法 | |
US20140201008A1 (en) | System and Method for Intelligently Determining User Preferences and Responding Thereto | |
US20050044071A1 (en) | Techniques for facilitating information acquisition and storage | |
JP3244005B2 (ja) | 情報フィルタ装置及び情報フィルタリング方法 | |
KR102371329B1 (ko) | 과학기술 지식정보의 추천을 위한 운영컴퓨터, 과학기술 지식정보 추천 시스템 및 그 방법 | |
Stuart | Practical ontologies for information professionals | |
JP3468062B2 (ja) | 情報フィルタ装置及び情報フィルタリング方法 | |
Sundin | Towards an understanding of symbolic aspects of professional information: an analysis of the nursing knowledge domain | |
JP2000331013A (ja) | 情報問いあわせ支援装置及び情報問いあわせ支援方法 | |
Huberman et al. | Beehive: A system for cooperative filtering and sharing of information | |
JP3260093B2 (ja) | 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法 | |
JP3508767B2 (ja) | グループ情報フィルタユニット装置及び情報フィルタ装置 | |
JP2002511165A (ja) | 特徴制約に基づく文書情報の取得と配信 | |
KR102454261B1 (ko) | 사용자 정보 기반 협업 파트너 추천 시스템 및 그 방법 | |
Zhao et al. | Reviewer recommendations using document vector embeddings and a publisher database: Implementation and evaluation | |
Turner | Information Infrastructures in the Museum: Documenting, Digitizing, and Practising Ethnographic Objects in the Smithsonian's Department of Anthropology | |
KR100415177B1 (ko) | 네트워크를 이용한 정보 제공 방법 | |
Lowagie | From Bias to Transparency: Ethical Imperatives in AI-Based Library Cataloging | |
JP2004005751A (ja) | 情報フィルタ装置及びその方法 | |
Kerschbaumer et al. | The Power of Networks | |
CN111797317A (zh) | 一种基于数字图书馆的智慧学习系统 | |
Robertson | The Properties of Digital History | |
KR20000030189A (ko) | 인터넷 기반 학교 교육 정보 제공 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080905 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080905 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090905 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090905 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100905 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110905 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120905 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130905 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |