JP3203203B2 - 情報フィルタ装置及び情報フィルタリング方法 - Google Patents

情報フィルタ装置及び情報フィルタリング方法

Info

Publication number
JP3203203B2
JP3203203B2 JP09641897A JP9641897A JP3203203B2 JP 3203203 B2 JP3203203 B2 JP 3203203B2 JP 09641897 A JP09641897 A JP 09641897A JP 9641897 A JP9641897 A JP 9641897A JP 3203203 B2 JP3203203 B2 JP 3203203B2
Authority
JP
Japan
Prior art keywords
information
signal
keyword
user
metric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP09641897A
Other languages
English (en)
Other versions
JPH10275160A (ja
Inventor
敏樹 金道
秀行 吉田
泰助 渡辺
Original Assignee
松下技研株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 松下技研株式会社 filed Critical 松下技研株式会社
Priority to JP09641897A priority Critical patent/JP3203203B2/ja
Publication of JPH10275160A publication Critical patent/JPH10275160A/ja
Application granted granted Critical
Publication of JP3203203B2 publication Critical patent/JP3203203B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子または光等を
媒体とする記憶装置や情報通信網から必要な情報を取り
出し易くする情報フィルタ装置及び情報フィルタリング
方法並びに情報フィルタリングプログラムを記録した記
録媒体に関するものである。
【0002】
【従来の技術】近年の情報通信基盤の発展に伴う情報通
信網の大規模化及び通信量の著しい増大に対処するため
の技術として、情報フィルタ装置の実現が強く望まれて
いる。この背景には、今日、個人が処理可能な情報量に
対して、個人がアクセスできる情報量が上回るようにな
っていることがある。このために、大量の情報の中にユ
ーザにとって必要な情報が埋没することが、しばしば起
こる。
【0003】情報フィルタ装置に関連する従来技術とし
ては、特許検索などに用いられるキーワード論理式をあ
げることができる。すなわち、数十万から数百万件に及
ぶ特許情報をキーワード論理式によりフィルタリングす
るものである。
【0004】しかしながら、キーワード論理式を用いる
従来の検索においては、ユーザがキーワードについての
論理式を精度良く設定する必要があるので、ユーザがフ
ァイリングされているデータ群の癖(例えば、どのよう
な条件の基に、当該データのキーワードが決定されてい
るのか等)やシステムの構造(例えば、キーワードがシ
ソーラス体系のあるシステムであるか否か等)を十分に
知り得ていなければ良い検索ができない。このため、初
心者には精度の高い情報フィルタリングを行うことがで
きないという課題があった。
【0005】また、情報フィルタリングした結果はキー
ワードについての論理式に適合するという評価があるだ
けであり、たまたまキーワードでは合致しているが、内
容は求めているものとは異なるケースがあったり、ある
いは多くの検索結果からユーザにとって必要度の高い情
報をその結果から順に取り出すことは容易ではない。
【0006】そこで、本発明者らは、初心者にも精度の
高い情報フィルタリングが可能で、ユーザにとって必要
性の高い情報を容易に取り出すことのできる情報フィル
タ装置を開発し、特願平8―230012号及び特願平
9−046384号として特許出願済みである。
【0007】この情報フィルタ装置は、情報に割り振ら
れた複数のキーワードをベクトルに変換し、ベクトルと
ユーザがどんな情報を必要とし不要としたかを表現した
行列を用いてスコアを計算して、情報の必要性と信頼性
を計算する。必要性の大きい順に情報を並べ換え、ユー
ザから要求があれば必要性の大きい順に情報を提示す
る。さらに、提示した情報が必要か不要かというユーザ
の評価を入力して、ユーザの評価と前記複数のキーワー
ドとからスコア計算にもちいる行列を修正するものであ
る。
【0008】この構成によって、複数のキーワードは、
距離の定義ができない記号から、ユーザの必要度を反映
したメトリックを用いて距離を定義できるベクトル表現
へと変換され、ユーザの必要度を定量化することがで
き、ユーザは必要性の高い情報から順に情報を得ること
ができるようになる。
【0009】
【発明が解決しようとする課題】しかしながら、上記情
報フィルタ装置においては、複数の情報源(例えば、複
数の新聞社)から情報を集める場合、同じ内容の情報が
繰り返し現れ、十分な情報の一覧性が得られないという
課題があった。
【0010】例えば、多くの新聞紙面で報じられるよう
な重大事故が発生した場合、ユーザにとっても興味深い
その重大事故(情報)に高いスコアが付けられることに
なる。その結果、必要性の大きい順に情報を提示する
と、情報提示内容がその重大事故(情報)の記事で占有
され、その他の情報を得るまでに同じ内容の記事が何度
も繰り返し提示されることになる。
【0011】また、2つのキーワード集合の類似度を判
断する際によく用いられるベクトルの角度は、2つのキ
ーワード集合のベクトルが完全に等し場合しか0になら
ず、つけられたキーワードに違いがあるか否かを表現す
る上では有効であるが、2つのキーワード集合の間に一
方が他方を包含する場合と2つの集合が重ならない部分
を持つ場合とを区別できないという性質を持つ。このた
め、キーワードの包含関係を表現する上では適切でな
い。 本発明は以上のような実情に鑑みてなされたもので
あり、キーワードの包含関係に基づいて2つのキーワー
ド集合の類似度を判断して従属情報を選別できる情報フ
ィルタ装置及び情報フィルタリング方法を提供すること
を目的とする。 また本発明は、同じような情報が複数含
まれる場合には、代表的な情報と関連情報の件数表示す
ることにより、できる限り多くの種類の情報を一度に表
示でき一覧性の高い情報フィルタ装置及び情報フィルタ
リング方法を提供することを目的とする。
【0012】
【課題を解決するための手段】上記課題を達成するため
に、本発明は以下のような手段を講じた。すなわち、情
報が蓄積される記憶部と、この記憶部から類似度判定対
象の情報及び比較対象の情報を読み出す読出制御手段
と、読み出された類似度判定対象情報と比較対象情報と
の包含関係を分析し類似度判定対象情報が比較対象情報
に包含されている場合に最大値をとるように類似度を計
算する類似度計算手段と、前記類似度判定対象情報に対
して類似度が所定値以上の比較対象情報を従属情報とし
て抽出する抽出手段と、を具備するものとした。 また、
前記記憶部に蓄積された情報を一覧表示する場合、類似
度判定対象情報及びその従属情報で構成する類似情報群
中の代表情報と、従属情報の存在しなかった類似度判定
対象情報からなる独立情報と、を一覧表示する提示手段
を具備するものとした。
【0013】
【0014】
【0015】
【0016】
【0017】
【0018】
【0019】
【0020】
【0021】
【0022】
【0023】
【0024】
【0025】
【0026】
【0027】
【0028】
【0029】
【0030】
【0031】
【0032】
【0033】
【発明の実施の形態】本発明は、情報記録媒体又は情報
通信網から供給された情報が記憶される記憶部と、該記
憶部の情報を類似する情報でまとめて代表情報と従属情
報を決める類似判定手段と、前記記憶部の情報を提示す
る場合に類似する情報については代表情報を提示する提
示手段とを具備する構成を採る。また本発明は、情報記
録媒体又は情報通信網から供給された情報を類似する情
報でまとめて代表情報と従属情報を決め、前記情報を提
示する場合に類似する情報については代表情報を提示す
る構成を採る。本発明によれば、記憶部の情報を提示す
る場合に類似する情報については代表情報を提示するの
で、多くの種類の情報を一度に表示でき一覧性の改善を
図ることができる。また、本発明は、記憶部の情報を、
情報に割り振られた複数のキーワードと過去にそれらキ
ーワードの割り振られた情報を必要/不要とした履歴と
に基づいて計算された必要性の高さに応じた順序で並べ
る構成を採る。本発明によれば、記憶部の情報が必要性
の高さに応じた順序で並べられているので、ユーザの好
みに応じた順番で情報を提示できるとともに、類似する
情報については代表する代表情報だけを表示して一覧性
の改善を図ることができる。また、本発明は、類似判定
手段が、記憶部に記憶された各情報に付けられているキ
ーワードの一致度に基づいて代表情報に類似する情報を
検索する構成を採る。本発明によれば、キーワードの一
致度に基づいて代表情報に類似する情報を判断すること
ができ、記憶部の情報を提示する場合に類似する情報に
ついては代表情報を提示するので、多くの種類の情報を
一度に表示でき一覧性の改善を図ることができる。ま
た、本発明は、代表情報を必要性の高い順序で提示する
構成を採る。また、本発明は、必要性の高さに応じた順
番で情報が並べられた記憶部から情報を取り出し、情報
に付けられているキーワードの一致度に基づいて代表情
報に類似する従属情報を検索し、類似する情報について
は代表情報を提示対象として必要性の高い順序で情報を
提示する構成を採る。本発明によれば、代表情報を必要
性の高い順序で提示するので、ユーザの好みに応じた順
番で情報を提示でき、類似する情報については代表する
代表情報だけを表示して一覧性の改善を図ることができ
る。また、本発明は、代表情報を提示する際に、当該代
表情報に類似した従属情報の数又は有無を一緒に表示す
る構成を採る。本発明によれば、代表情報と共に従属情
報の数又は有無を表示するので、一覧性を確保しつつよ
り多くの関連情報を知ることができる。また、本発明
は、記憶部の情報を必要性の高い情報から順番にチェッ
クして未だ代表情報又は従属情報になっていない独立情
報があれば、その独立情報を代表情報とし類似する従属
情報を当該代表情報から必要性の低い方向に検索する構
成を採る。本発明によれば、情報が重要性の高い順序で
並んでいるので、代表情報よりも上に類似情報が存在し
ないことを利用して、類似情報を検索する際の検索範囲
の効率化を図ることができる。また、本発明は、類似す
る情報及び独立情報を検索する検索範囲が予め指示又は
設定され、当該検索範囲を必要性の低い方向へ順次シフ
トさせる構成を採る。本発明によれば、情報が重要性の
高い順序で並んでいる場合に検索範囲を定めると、類似
する情報は重要性が近似する特性が有り比較的近い位置
に存在することを利用して、検索の効率化を図ることが
できる。また、本発明は、情報に割り振られた複数のキ
ーワード信号をベクトル信号に変換する手段と、必要な
情報から構成される肯定メトリック信号、不要な情報か
ら構成される否定メトリック信号及び前記ベクトル信号
を用いて肯定スコア及び否定スコアを計算するスコア計
算部と、前記肯定スコア信号及び前記否定スコア信号か
らなる二次元平面の点の分布を必要な情報及び不要な情
報に分離する判定パラメータ信号、前記肯定スコア信号
及び前記否定スコア信号から必要性信号及び信頼性信号
を計算する必要性計算部と、情報を前記必要性信号の大
きさの順に並べて前記記憶部に書き込む手段とを具備す
る構成を採る。本発明によれば、複数のキーワードは、
距離の定義ができない記号から、ユーザの必要度を反映
したメトリックを用いて距離を定義できるベクトル表現
へと変換され、ユーザの必要度を定量化することがで
き、ユーザは必要性の高い情報から順に情報を得ること
ができるようになる。以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0034】(実施の形態1)図1は実施の形態1に係
る情報フィルタ装置の構成を示すブロック図であり、図
2は情報フィルタ装置を機能単位にまとめたブロック図
である。
【0035】この情報フィルタ装置は、ユーザーが過去
にどんな「情報」を必要としたかという履歴に基づいて
「情報」のフィルタリングを行う情報フィルタリングユ
ニット50、フィルタリングした情報をユーザーに提示
するディスプレー等のインタフェースユニット51、ユ
ーザーがどんな「情報」を必要としたかという履歴に関
する学習を行う学習ユニット52、フィルタリングした
未読データ(ユーザーが未だ読んでいない情報)から内
容がよく似た未読データにまとめて各グループを代表す
る「情報」の一覧にする代表情報一覧ユニット53に分
けられる。
【0036】情報フィルタリングユニット50は、個々
の「情報」につけられた複数のキーワード(正確には、
分類コードを含む文字列)をベクトルに変換する部分
と、ユーザーがどんな「情報」を必要/不要としたとい
う履歴を表現した肯定メトリック信号及び否定メトリッ
ク信号を用いてある種のスコアを表す肯定信号と否定信
号を計算する部分と、この肯定信号と否定信号とから
「情報」の必要性をよく反映する必要性信号を計算する
部分と、この必要性信号の大きい順に情報を並べ替える
部分からなる。
【0037】図1では、ベクトル生成部1が「情報」に
付けられたキーワードなどの複数の文字列をベクトルに
変換し、符号辞書記憶部2がキーワードなどの複数の文
字列をベクトルに変換するための符号辞書信号を記憶し
ている。この符号辞書記憶部2に記憶された符号辞書信
号は、「情報」についているキーワードなどの文字列W
を数字Cに変換する対応表をnofDCK個有するコー
ドブック
【数1】 である。ベクトル生成部1はキーワード数信号nofK
sとnofKs個のキーワード信号からなるキーワード群
信号Ks=(K[1],・・・,K[nofKs])とを
受けキーワード群信号Ksと前記符号辞書信号DCKを用い
てベクトル信号Vに変換する。また、スコア計算部3
が、ユーザーに提示された「情報」を、必要/不要と評
価した結果から計算された肯定メトリック信号MY、否
定メトリック信号MNを用いて、ベクトル生成部1で変
換された2つのベクトル信号Vの長さと肯定信号SYと
否定信号SNとに変換する。肯定メトリック記憶部5は
(nofDCK×nofDCK)行列である前記肯定メ
トリック信号MYを記憶し、否定メトリック記憶部6は
(nofDCK×nofDCK)行列である前記否定メ
トリック信号MNを記憶し、判定パラメータ記憶部8は
判定パラメータ信号Cを記憶する部分である。必要性計
算部7は前記肯定信号SYと前記否定信号SNを受け前
記判別パラメータ記憶部8から判定パラメータ信号Cを
読み出し必要性信号Nと信頼性信号Rを計算する。さら
に、未読データ書き込み制御部9が「情報」の本文であ
る情報データDとキーワード数信号nofKsとキーワ
ード群信号Ksと必要性信号Nと信頼性信号Rとを所定
の手続きに従って後述する未読データ記憶部10に書き
込む。未読データ記憶部10は、前記「情報」の本文で
ある情報データDと前記キーワード数信号nofKsと
前記キーワード群信号Ksと前記必要性信号Nと前記信
頼性信号Rとからなる最大nofURD個の未読データ
【数2】 を記憶する。
【0038】代表情報一覧ユニット53は、未読データ
記憶部10に記憶された未読データ相互の類似度を計算
し、どの未読データが一まとめにできるかを決める未読
データ圧縮部70、前記未読データ圧縮部70の結果を
記憶する圧縮未読データ記憶部81、圧縮未読データを
用いて未読データの読み出しを制御する圧縮未読データ
読み出し制御部82等からなる。図13に未読データ圧
縮部70の構成が示されている。71は類似度計算制御
部であり、72は未読データ読み出し部であり、73は
類似度ベクトル生成部であり、74はスイッチ、75は
参照ベクトル記憶部であり、76は類似度計算部であ
り、77は閾値記憶部であり、78は比較部であり、7
9は圧縮未読データ書き込み制御部であり、80はフラ
グ記憶部であり、81は圧縮未読データ記憶部である。
【0039】インターフェースユニット51は、未読デ
ータ出力制御部11が制御信号DOを受け圧縮未読デー
タ読み出し制御部82を通じて未読データ記憶部10か
ら未読データ信号URD[1]を読み出して表示信号D
Dを出力する。また、その表示信号DDがユーザーにと
って必要か否かを示す教師信号Tをユーザーから受け、
前記教師信号Tと前記未読データ信号URD[1]のキ
ーワード数信号nofKs[1]とキーワード群信号K
s[1]とを所定の手続きに従って教師データ記憶部1
3に書き込む。教師データ記憶部13は、最大nofTD
個の教師データ信号
【数3】 を記憶する。
【0040】学習ユニット52は、ユーザーから入力さ
れた教師信号Tを用いて肯定/否定メトリック信号を修
正するメトリック学習を行う部分と、肯定/否定信号か
ら必要性信号を計算するためのパラメータ、判定パラメ
ータ信号を修正する部分からなり、各部分は学習制御部
によって制御される。
【0041】図1において、メトリック学習を行う部分
の構成は次の通りである。
【0042】メトリック学習部19において肯定メトリ
ック記憶部5に記憶された肯定メトリック信号MYと前
記否定メトリック記憶部6に記憶された否定メトリック
信号MNとを修正する。このメトリック学習部19は、
教師データ記憶部13から前記教師データTDを読み出
し、学習ユニット50のベクトル生成部1と同じ機能で
ある学習用ベクトル生成部20で複数のキーワードをベ
クトルに変換し、自己相関行列を計算することで、肯定
/否定メトリック信号を修正する。
【0043】判定パラメータ信号の学習を行う部分の構
成は次の通りである。
【0044】学習用スコア計算部22が、学習用肯定信
号計算部221と学習用否定信号計算部222とから構
成される。学習用肯定信号計算部221は学習用ベクト
ル生成部20からの学習用ベクトル信号を受け学習用肯
定信号LSYを計算し、学習用否定信号計算部222は
学習用ベクトル生成部20からの学習用ベクトル信号を
受け学習用否定信号LSNを計算する。判定面学習部2
1は、学習制御部14からの判定パラメータ学習制御信
号PLCを受けて所定の方法で判定パラメータ記憶部8
の判定パラメータ信号の書き換えを行う。学習制御部で
14は学習開始信号LSを受けてスイッチ16、17、
18とメトリック学習部19と学習用ベクトル生成部2
0と学習用スコア計算部22と学習用否定信号計算部2
3と判定面学習部21とを制御する。
【0045】以上のように構成された情報フィルタ装置
での概略的な処理の流れについて説明する。以下の説明
では、既にユーザがどんな「情報」を過去に必要とした
かという履歴は学習済みであるものとする。また、単に
「情報」と称するものには、「情報」に対応する1つ以
上のキーワードが付されているものとする。キーワード
は、当該「情報」を構成する各単語の一部あるいは全体
であっても良いし、当該「情報」を代表するために特別
に付したものであっても良い。
【0046】情報フィルタリングユニット50では、新
たな「情報」が入力されると、記憶部2、5、6、8か
らユーザがどのような「情報」を過去に必要としたかと
いう記録を読みだし、当該ユーザにとっての新たな「情
報」の必要性を必要性信号として定量的に評価する。
【0047】次に、その評価された新たな「情報」は、
未読データ記憶部10に過去からの未読「情報」を含め
て必要性信号が大きい順に並ぶように書き込まれる。
【0048】代表情報一覧ユニット53では、未読デー
タ記憶部10への書き込みが終了すると、未読データ圧
縮部70が未読データ記憶部10に記憶された「情報」
の相互の類似度を計算し、どの情報が一まとめにできる
かという結果を圧縮未読データ信号として圧縮未読デー
タ記憶部81に書き込む。
【0049】インタフェースユニット51では、ユーザ
ーに必要性信号の大きい順に並べて、前記新たな「情
報」を含めた未読「情報」、類似の情報がある場合には
代表的な情報を提示(例えば、ディスプレー表示)す
る。
【0050】この際に、ユーザーに提示された前記新た
な「情報」を含めた未読「情報」の1つひとつがユーザ
ーにとって必要か不要かを示す教師信号をユーザーがイ
ンタフェースユニット51を介して入力することによ
り、インタフェースユニット51では、当該教師信号を
受け取り、当該「情報」とその教師信号を学習ユニット
52に送る。
【0051】なお、このユーザーによる教師信号の入力
は、学習ユニット52の学習能力をより高めるために実
施するものであり、学習ユニット52の学習能力(ユー
ザーがどんな「情報」を過去に必要としたかという履歴
の学習能力)が既に十分に高ければ行う必要はない。
【0052】次に、学習ユニット52では、前記提示し
た「情報」とその教師信号を用いて記憶部2、5、6、
8の履歴内容を書き換える。
【0053】以上、本発明の情報フィルタ装置は、より
高い学習を通じてユーザーに適応し、ユーザーの求める
「情報」を優先的に、かつ高い一覧性をもって提示する
ことができる。
【0054】また、学習を行っていない初期状態では、
ユーザーがどんな「情報」を必要としているのか学習ユ
ニット52では分からないので、全ての入力される新た
な「情報」をインタフェースユニット51でユーザーが
提示を受ける毎に上述したユーザーによる教師信号の入
力は必要であるが、随時実施する学習を通じてやがてユ
ーザーに適応し、ユーザーの求める「情報」を優先的に
提示することができるようになる。
【0055】なお、ユーザーの求める「情報」を優先的
に提示するとは、より具体的な使用例で述べれば、ある
「情報」データベースの母集団Aを特定のキーワードで
検索して「情報」の検索集合Bを得たとしても、当該検
索集合Bの「情報」の全てがユーザーにとっては必要で
あるとは限らないし、またユーザーにとっては「情報」
の全てが必要であってもその必要順位は当然存在するこ
とを前提としている。よって、必要から順に不要、ある
いはその必要順位に従って、インタフェースユニット5
1でユーザーに順に提示することが、ユーザーの求める
「情報」を優先的に提示することを意味する。
【0056】以下、各ユニットごとの動作内容を図面を
用いて具体的に説明する。
【0057】情報フィルタリングユニット50では「情
報」の必要性信号を計算する。
【0058】ここで、必要性信号を計算するための基本
概念を説明する。
【0059】入力された「情報」にキーワードが添付さ
れている場合を考える。一人のユーザーを考えると、そ
のユーザーが必要としている「情報」に高い頻度または
確率で付いているキーワード集合Aと、不要としている
「情報」に高い頻度または確率で付いているキーワード
集合Bと、さらにはいずれにもよく付く、または付かな
いキーワード集合Cとを考えることができる。
【0060】前記キーワード集合Aに属するキーワード
には正の数値を、前記キーワード集合Bに属するキーワ
ードには負の値を、前記キーワード集合Cに属するキー
ワードには値0をそれぞれ割り振る。
【0061】そして、新たに入力された「情報」につい
ている1つ以上のキーワードについてそれぞれが前記キ
ーワード集合A、B、Cのどのキーワードグループに属
するかを判定し、前記割り振られた値を積算するように
構成する。
【0062】このように構成すれば、前記新たに入力さ
れた「情報」に付いていた複数のキーワードを、キーワ
ード集合Aに属するキーワードが数多く含まれた「情
報」(ユーザーが必要とする可能性の高い情報)に対し
ては大きな正の値を示し、キーワード集合Bに属するキ
ーワードが数多く付いている「情報」(ユーザーが不要
とする可能性の高い情報)に対しては大きな負の値を示
す数値に変換することができる。
【0063】こうして、前記数値を用いてユーザーにと
っての必要性を予測することができる。本発明では、提
示した「情報」とその「情報」に関するユーザーの必要
/不要の評価とからキーワードへの値の割り振りを自動
的に行い精度の高い必要性信号の計算を実現し、精度高
く必要性の高い順に「情報」を並べ変えることを実現し
ている。
【0064】そのために、「情報」に付けられた複数の
キーワードを一つのベクトルに変換し、ユーザーが必要
とした場合と不要とした場合について、別々に前記ベク
トルの自己相関行列を計算している。ユーザーが必要と
答えた「情報」についていたキーワードから作られた自
己相関行列MYを用いて、ベクトルVの長さSYを
【数4】 と計算する。
【0065】なお、必要と答えた「情報」についていた
キーワードから作られた自己相関行列MYを「肯定メト
リック信号」、不要と答えた情報についていたキーワー
ドから作られた自己相関行列MNを「否定メトリック信
号」と呼び、長さSYを肯定信号と呼んでいる。この長
さSYは、ベクトルVの元となった複数のキーワードの
中に、ユーザーが必要とする「情報」によく含まれてい
るキーワードが数多く含まれていれば、長さSYは大き
な正の値をとり、そうでない場合には0に近い値をとる
から、必要性信号を計算する上で有効である。
【0066】情報フィルタ装置の好ましい初期状態の一
例は、肯定メトリック信号MYと否定メトリック信号M
Nとを(nofDCK×nofDCK)零行列、未読デ
ータ記憶部10の未読データURD[i]の全ての必要
性信号N[i](i=1,・・・,nofURD)を使用
するハードウエアが表現可能な最小の値Vmin、教師
データ記憶部13の教師データTD[j]の教師信号T
[j]を全て−1とした状態である。このような初期状
態となっているものとする。
【0067】情報フィルタリングユニット50では、ま
ず、情報データ入力端子100から情報データDが入力
され、キーワード数信号入力端子101から情報データ
に付けられたキーワードの個数を表すキーワード数信号
nofKsが入力され、キーワード信号入力端子102
から複数のキーワードであるキーワード群信号Ks=
(K[1],K[2],・・・,K[nofKs])が
入力される。
【0068】ベクトル生成部1によって、キーワード群
信号Ksが文字列の集まりからベクトル信号Vへと変換
される。この変換によって、キーワード群信号の類似性
をベクトルの距離として計算できるようになる。
【0069】ベクトル生成部1の動作を図3に示すフロ
ーチャートを参照しながら説明する。まず、キーワード
数信号nofKsとキーワード群信号Ksを受けると
(図3ステップ(イ))、内部のベクトル信号V=(V
[1],V[2],・・・,V[nofDic])を
(0,0,・・・,0)に、キーワードカウンタ信号i
を1にセットする(同図ステップ(ロ)、(ハ))。次
に、辞書カウンタ信号jを0セットした後辞書カウンタ
信号jを1だけ増やす(同図ステップ(ニ))。
【0070】次に、内部にnofDCK個の符号辞書信
号DCKを有する辞書記憶部2から辞書カウンタjが指
定するキーワードと数字からなる符号辞書信号DCK
[j]を読み出し、符号辞書信号DCKの文字列部分W
[j]とi番目のキーワード信号K[i]とを比較する
(同図ステップ(ホ))。両者が等しくない場合には、
辞書カウンタjを1だけ増やす(同図ステップ
(ヘ))。両者が一致するか、辞書カウンタjの値が辞
書記憶部2に格納された符号辞書信号の個数nofDiC
と等しくなるまで図3ステップ(ホ)〜(ト)の処理を
繰り返す(同図ステップ(ト))。
【0071】キーワード信号K[i]と等しいW[j]
が見つかると、ベクトル信号のj番目の成分V[j]を
1にし(同図ステップ(チ))、キーワードカウンタ信
号iを1だけ増やす(同図ステップ(リ))。以下、同
様の処理をキーワードカウンタ信号iがキーワード数信
号nofKsより大きくなるまで実行する(同図ステッ
プ(ヌ))。
【0072】こうして、ベクトル生成部1において、文
字列信号からなるキーワード信号の集合体であるキーワ
ード群信号Ksは、0と1でコード化されたnofDC
K個の成分を持ったベクトル信号Vに変換される。
【0073】次に、肯定信号計算部31は、キーワード
群信号Ksに過去にユーザーの必要とした情報に含まれ
ていたキーワードが数多く含まれる場合に、大きな値と
なる肯定信号SYを計算する。このために、肯定信号計
算部31は、前記ベクトル信号Vを受けて、肯定メトリ
ック記憶部5から肯定メトリック信号MYを読み出し、
肯定信号SYを
【数5】 と計算する。
【0074】否定信号計算部32は、キーワード群信号
Ksに過去にユーザーの不要とした情報に含まれていたキ
ーワードが数多く含まれる場合に、大きな値となる否定
信号SNを計算する。このために、否定信号計算部32
は、否定メトリック記憶部6から否定メトリック信号M
Nを読み出し、否定信号SNを
【数6】 と計算する。
【0075】肯定メトリック信号MYと否定メトリック
信号MNは、後述するようにキーワード群信号Ksとユ
ーザーの応答に基づいて決められる。
【0076】このように計算された肯定信号SYと否定
信号SNを用いて、図9に示したように縦軸に肯定信号
SYをとり横軸に否定信号SNをとった2次元空間上の
1点に、情報データDを対応させることができる。この
2次元空間における情報データDの分布は、ユーザーが
必要とするもの(○で表示)は主に左上部に分布し、ユ
ーザーが不要とするもの(×で表示)は主に右下部に分
布するようになる。
【0077】したがって、図10に示したように適切な
係数Cを定めることにより、ユーザーが必要とする情報
データDと不要な情報データDとを分離できる。
【0078】さらに、以下に述べるこの係数Cを用いて
計算される必要性信号Nは、上述の2次元空間で左上に
ある程、すなわち、必要性の高いと予測される情報デー
タDほど大きな値となる。したがって、必要性信号Nの
大きい順に情報データDを並べて提示すれば、ユーザー
は必要な情報を効率よく手に入れることができる。必要
性信号Nと直交する方向の信頼性信号Rは、大まかには
キーワード群信号Ksに含まれていたキーワードのうち
どのくらいのキーワード信号が辞書に含まれていたかを
示す信号である。したがって、この信頼性信号Rの大き
さは、情報フィルタが計算した必要性信号Nがどれだけ
信頼できるのかを示す。
【0079】次に、必要性計算部7は、前記肯定信号計
算部31から出力される前記肯定信号SYと前記否定信
号計算部32から出力される前記否定信号SNとを受
け、判定パラメータ記憶部8から判定パラメータ信号C
を読み出し、過去必要であった情報についていたキーワ
ードが多数あり、不要であった情報についていたキーワ
ードがほとんどない時に大きな値となる必要性信号Nを N=SY−C・SN と計算し、信頼性信号Rを R=C・SY+SN と計算する。
【0080】未読データ書き込み制御部9の動作を、図
4に示したフローチャートを参照しながら説明する。ま
ず、それぞれの入力端子から前記情報データDと前記キ
ーワード数信号nofKsと前記キーワード群信号Ks
と受け、必要性計算部7から前記必要性信号Nと前記信
頼性信号Rとを受け、未読データ部指示端子110から
出力する未読データ処理信号WIを0から1に変える
(図4ステップ(イ))。次に、i=1とし(同図ステ
ップ(ロ))、未読データ記憶部10に記憶された未読
データURD[i]の必要性信号N[i](i=1,・
・・,nofURD)を順次読み出し、前記必要性信号
Nと比較し(同図ステップ(ハ))、前記必要性信号N
が未読データURD[i]の必要性信号N[i]より大
きくなる(N≧N[i])最初の未読データの番号i1
を検出する(同図ステップ(ニ)(ホ))。
【0081】i1番目以降の未読データを URD[i+1]=URD[i] i=i1,・・・,
nofURD と置き換え(同図ステップ(ヘ)〜(リ))、その後、
i1番目の未読データURD[i1]を N[i1] =N R[i1] =R nofKs[i1] =nofKs Ks[i1] =Ks D[i1] =D と前記必要性信号N等で置き換える(同図ステップ
(ヌ))。この置き換えが終了すると、未読データ部指
示端子110から出力する未読データ部指示信号WIを
0に戻し(同図ステップ(ル))、処理を終了する。
【0082】次に、代表情報一覧ユニット53では、未
読データ記憶部70に端子170から類似度計算開始信
号が入力されると、類似度計算制御部71は、内部の情
報カウンタnと圧縮情報カウンタaをそれぞれ1にセッ
トする(図14ステップ(イ))。
【0083】前記情報カウンタのカウンタ出力nと圧縮
情報カウンタのカウンタ出力aの値を圧縮未読データ書
き込み制御部79に送る。圧縮未読データ書き込み制御
部79は、類似情報リスト信号AD[a][1]に前記
情報カウンタnの値を代入し、フラグA[a]に類似の
情報がないことを示す値1を代入し、比較回数カウンタ
のカウンタ出力lに1を代入し、比較対象情報番号差カ
ウンタΔmに0、比較情報番号カウンタのカウンタ出力
mに前記情報カウンタの値に1を加えたものを代入する
(同図ステップ(ロ))。
【0084】類似度計算制御部71は、情報カウンタn
の値を未読データ読み出し部72に送り、スイッチ74
を参照ベクトル記憶部75が接続するように切り替え
る。未読データ読み出し部72は、未読データ記憶部1
0から、未読データURD[n]を読み出し(同図ステ
ップ(ハ))、類似度ベクトル生成部73に送る。
【0085】類似度ベクトル生成部73は、前記ベクト
ル生成部1と同様にして類似度ベクトル信号を生成し
(同図ステップ(ニ))、参照ベクトル記憶部75に送
る。参照ベクトル記憶部75は、前記類似度ベクトル信
号を参照ベクトル信号Vnとして記憶する。類似度計算
部76は、参照ベクトル記憶75から参照ベクトル信号
Vnを読み出し、
【数7】 を計算する(同図ステップ(ホ))。
【0086】類似度計算制御部71は、スイッチ74を
類似度計算部76につながるように切り替え、比較情報
番号カウンタのカウンタ出力mの値を圧縮データ書き込
み制御部79から読み出し、未読データ読み出し部72
に送る。
【0087】未読データ読み出し部72は、未読データ
記憶部10から未読データURD[m]を読み出し(同
図ステップ(へ))、その未読データURD[m]を類
似度ベクトル生成部73に送る。
【0088】類似度ベクトル生成部73は、前記ベクト
ル生成部1と同様にして類似度ベクトル信号を生成し
(同図ステップ(ト))、比較ベクトル信号Vmとして
類似度計算部76に送る。
【0089】類似度計算部76は、比較ベクトル信号V
mから、
【数8】
【数9】 とを計算する(同図ステップ(ホ)、(リ))。類似度
計算部76は、
【数10】
【数11】 より大きい場合には、類似度Chを
【数12】 とし、その他の場合には、
【数13】 とする。この類似度Chは、未読データURD[n]に
つけられたキーワードのすべてが、未読データURD
[m]につけられたキーワードに含まれる場合(また
は、未読データURD[m]につけられたキーワードの
すべてが、未読データURD[n]につけられたキーワ
ードに含まれる場合)に1となり、その他の場合には1
より小さくなるという性質を持っている。
【0090】以下に、この類似度の性質について、従来
よく使われているベクトルの角度と比較して述べる。
【0091】よく用いられるベクトルの角度は、2つの
ベクトルが完全に等し場合しか0にならず、つけられた
キーワードに違いがあるか否かを表現する上では有効で
あるが、2つのキーワード集合の間に一方が他方を包含
する場合(図17(a))と2つの集合が重ならない部
分を持つ場合(図17(b))とを区別できないという
性質を持つ。このため、キーワードの包含関係を表現す
る上では適切でない。
【0092】実際、ある事件や事柄について、詳しい情
報とおおまかな情報とがある場合を考えると、詳しい情
報につけられたキーワードの集合がおおまかな情報につ
けられたキーワードを含むということはしばしば見られ
る。
【0093】したがって、情報の類似度考える場合、上
の類似度Chは、情報の類似度を評価するために、従来
よく使われているベクトルの角度より有効である。
【0094】さて、比較部78は、こうして得られた類
似度Chをあらかじめ閾値記憶部77に書き込んでいた
閾値θchと比較する(図15ステップ(ワ))。
【0095】類似度Chが閾値θchより大きい場合、
圧縮未読データ書き込み制御部79は、2つ未読データ
URD[n],URD[m]は同じ内容の情報とし、未
読データURD[m]を未読データURD[n]の従属
情報とする。このために、フラグ信号fflag[m]
を従属情報であることをあらわす値1にし、圧縮情報カ
ウンタA[a]の値を1だけ増やし、類似情報リスト信
号AD[a][A[a]]に比較情報番号カウンタmの
値を書き込む(同図ステップ(カ))。
【0096】類似度Chが閾値θchより小さい場合、
2つ未読データURD[n],URD[m]は異なる内
容の情報とし、未読データURD[m]を未読データU
RD[n]の独立情報とする。このために、フラグ信号
fflag[m]を独立情報であることをあらわす値0
にする(同図ステップ(ヨ))。
【0097】次に、比較対象情報番号差カウンタΔmに
1を加える(同図ステップ(タ))。
【0098】比較情報番号カウンタmに比較対象情報番
号差カウンタの値Δmを加え、未読データ数nofUR
Dと比較する(同図ステップ(レ))。(m+Δm)が
nofURDであればまだ比較すべき未読データがある
ことになる。そこで、未読データURD[m+Δm]が
独立データであるか否かを調べる(同図ステップ
(ソ))。つまり、すでに従属情報となった情報につい
ては、重ねて従属情報とする処理は行わないということ
である。
【0099】独立情報でない場合には、比較対象情報番
号差カウンタΔmに1を加え(同図ステップ(タ))、
独立情報が見つかるか、未読データがなくなるまで同様
の処理を行う。独立情報が見つかると、比較回数カウン
タlの値を1だけ増やし、比較情報番号カウンタmに
(m+Δm)を代入する(同図ステップ(ツ))。比較
回数カウンタlの値があらかじめ設定しておいた最大比
較回数lmax以下ならば、新たに未読データURD
[m]を読み出して同様の処理を行う(同図ステップ
(ネ))。
【0100】こうして、未読データURD[n]を代表
の情報とする従属情報のリストが、類似情報リスト信号
AD[a][A[a]]として作られる。
【0101】比較回数カウンタlの値があらかじめ設定
しておいた最大比較回数lmaxより大きくなる(同図
ステップ(ネ))と、新たな未読データを代表の情報と
する従属情報を探す手続きが始まる。そのためには、上
と同様に、従属情報として処理されていない未読データ
を探す(同図ステップ(ナ)、(ラ)、(ム)、
(ウ))。
【0102】新たに、従属情報として処理されていない
未読データが見つかると、情報カウンタnの値を(n+
Δn)、圧縮情報カウンタaの値を1だけ増やし、ステ
ップ(ロ)に戻り上記の処理を行う。
【0103】この処理を、情報カウンタnが未読データ
の数nofURD以上となるまで繰り返す。
【0104】この処理で得られる類似情報リスト信号A
Dは、図16のようなものとなる。圧縮未読データ書き
込み部79は、類似度情報信号ADと圧縮情報カウンタ
の値、すなわち独立情報の数とを圧縮未読データおよび
圧縮未読データ数nofaとして、圧縮未読データ記憶
部81に書き込む。
【0105】次に、圧縮未読データ読み出し制御部と、
未読データUDRを読みだし、ユーザーの応答(教師信
号T)を付加して教師データ信号TDをつくるインター
フェースユニット51ついて説明する。
【0106】次に、インターフェースユニット51の動
作を図5に示したフローチャートを参照しながら説明す
る。
【0107】データ読み出し開始信号入力端子103か
ら、データ読み出し開始信号DOが入力される(図5ス
テップ(イ))。未読データ出力制御部11は、圧縮未
読データ制御部82を通じて、前記未読データ記憶部1
0から1番目の独立情報である未読データURD[AD
[1][1]]を読み出し(同図ステップ(ロ))、未
読データの必要性信号N[1]が最小値Vminより大
きい場合には、未読データ信号URD[1]の情報信号
D[1]を表示情報信号DDとしてデータ表示端子10
4に出力し、待機する(同図ステップ(ハ)、
(ニ))。未読データの必要性信号N[1]が最小値V
minに等しい場合には、表示情報信号DDを「データ
なし」としてデータ表示端子104に出力し、待機する
(同図ステップ(ホ))。
【0108】ユーザー(図示せず)は、データ表示装置
(図示せず)に表示された表示情報信号DDを見て、そ
れが必要な情報である場合には教師信号T=1、必要で
ない場合には教師信号T=0、処理を終了する場合には
教師信号T=−1として、教師信号入力端子105に返
す(同図ステップ(ヘ))。教師信号T=−1の場合、
処理を終了し、教師信号T≠−1の場合には(同図ステ
ップ(ト))、未読データ出力制御部11は、教師デー
タ記憶部13の(数2)で表わされる教師データを TD[i]=TD[i−1], i=2,・・・,no
fTD と置き換え(同図ステップ(ル))、1番目の教師デー
タTD[1]を前記教師信号Tと前記未読データのキー
ワード数信号nofKs[1]とキーワード群信号Ks
[1]とを用いて T[1] =T TnofKs[1] =nofKs[1] TKs[1] =Ks[1] と置き換え(同図ステップ(ル)、(ヲ))、前記未読
データ記憶部10の未読データURDを URD[AD[a][b]]=URD[AD[a+1]
[b]],a=1,・・・,(nofa−1)、b=
1,2、… とし(同図ステップ(ワ)、(カ))、nofa番目の
独立した未読データURD[AD[nofa][1]の
必要性信号を N[nofa]=(最小値Vmin) とする(同図ステップ(ヨ)、(タ)、(レ))。
【0109】次に、学習ユニット52の動作について図
6〜図8に示したフローチャートを参照しながら説明す
る。
【0110】図6に学習制御部14の動作の概略を示す
フローチャート示し、詳しく説明する。
【0111】図6において、まず、学習開始信号入力端
子106から学習開始信号LSが入力され、学習制御部
指示信号出力端子107から出力される学習制御部指示
信号LIを0から1に変え(図6ステップ(イ))、処
理中を示す。次に、スイッチ16とスイッチ17とスイ
ッチ18とをメトリック学習部19と学習用ベクトル生
成部20が接続する様に切り替える(同図ステップ
(ロ))。
【0112】次に、図7のステップ(ハ)に対応するメ
トリック学習部19を動作し(同図ステップ(ハ)、判
定面学習部21を動作させた後(同図ステップ
(ニ))、LIを0として(同図ステップ(ホ))、処
理を終了する。
【0113】次に、メトリック学習部19がユーザーの
応答(教師信号T)とキーワード群信号Ksとを用い
て、肯定/否定メトリック信号を修正する動作を図7を
用いて説明する。
【0114】図7は、メトリック学習部19の動作のフ
ローチャートであり、同図において、前記学習制御部1
4からメトリック学習制御信号MLCを受けた(図7ス
テップ(イ))メトリック学習部19は、肯定メトリッ
ク記憶部5から肯定メトリック信号MYを、否定メトリ
ック記憶部6から否定メトリック信号MNをそれぞれ読
み出す。
【0115】次に、メトリック学習部19は、教師デー
タカウンタcの値を1にする(同図ステップ(ロ))。
次に教師データ記憶部13からc番目の教師データ信号
TD[c]を読み出し(同図ステップ(ハ))、教師デ
ータTD[c]の教師信号T[c]を調べる。前記教師
信号T[c]が−1でない場合(T≠−1)には(同図
ステップ(ニ))、教師データTD[c]のキーワード
数信号TnofKs[c]とキーワード群信号TKs
[c]とを出力する(同図ステップ(ホ))。前記教師
データTD[c]のキーワード数信号TnofKs
[c]とキーワード群TKs[c]とを受けた学習用ベ
クトル生成部20は、前述の情報フィルタリングユニッ
ト50のベクトル生成部1と同様の動作を行い、学習用
ベクトル信号LVを出力する(同図ステップ(ヘ))。
メトリック学習部19は、前記学習用ベクトル信号LV
を受け、前記教師データTD[c]の教師信号T[c]
がT=1である場合には(同図ステップ(ト))、肯定
メトリック信号MYを MY[i][j]=MY[i][j]+LV[i]・L
V[j] (ここで、i,j=1〜nofDiC)と修正する(同
図ステップ(チ))。
【0116】この処理により、肯定メトリック信号MY
は、ユーザーが必要とした情報 データDについていたキーワード信号(複数)に対して
大きな値を持つようになる。その結果、前述の肯定信号
SYが、ユーザーが必要とする情報データDに対して大
きくなるようになる。否定メトリック信号MNも以下の
ように同様の処理がなされる。
【0117】前記教師データTD[c]の教師信号T
[c]がT=0である場合には、否定メトリック信号M
Nを MN[i][j]=MN[i][j]+LV[i]・L
V[j] (ここで、i,j=1〜nofDiC)と修正する(同
図ステップ(リ))。
【0118】教師データカウンタの値を c=c+1 と1だけ増やす(同図ステップ(ヌ))。
【0119】以下、メトリック学習部19は、同様の動
作を、教師データTD[c]の教師信号T[c]がT
[c]=−1になるかまたはc=nofTDとなるまで
繰り返す。T[c]=−1またはc=nofTDとなる
と(同図ステップ(ヲ))、メトリック学習の処理を終
了し、メトリック学習制御信号MLCを学習制御部14
に送る。
【0120】学習制御部14は、メトリック学習部19
からのメトリック学習制御信号MLCを受けて、スイッ
チ16を学習用ベクトル生成部20とスコア計算部22
とが接続するように切り替え、スイッチ17とスイッチ
18を学習用ベクトル生成部20と判定面学習部21と
が接続するように切り替える。学習制御部14は、判定
面学習制御信号PLCを判定面学習部21に送る。
【0121】次に、判定面学習部21について、図8を
用いて詳しく説明する。
【0122】判定面学習部21は、図10に示したよう
に、肯定信号SYと否定信号SNを用いて2次元空間上
に表現されたユーザーが必要とする情報データDとユー
ザーが不要とする情報データDとをもっともよく分離す
る係数Cを求める。
【0123】このための処理を、図8に示したフローチ
ャートに従って詳しく説明する。
【0124】まず、前記判定面学習制御信号PLCを受
けて(図8ステップ(イ))、教師データカウンタcの
値を1にする(同図ステップ(ロ))。教師データ記憶
部13からc番目の教師データ信号TD[c]を読み出
し(同図ステップ(ハ))、教師データTD[c]の教
師信号T[c]を調べる(同図ステップ(ニ))。前記
教師信号T[c]が−1でない場合(T≠−1)には、
教師データTD[c]のキーワード数信号TnofKs
[c]とキーワード群信号TKs[c]とを出力する
(同図ステップ(ホ))。前記教師データTD[c]の
キーワード数信号TnofKs[c]とキーワード群T
Ks[c]とを受けた学習用ベクトル生成部20は、前
述した情報フィルタリングユニット50のベクトル生成
部1と同様の動作を行い、学習用ベクトル信号LVを出
力する。
【0125】学習用スコア計算部22は、前述した情報
フィルタリングユニット50のスコア計算部3と同様の
動作を行い、学習用肯定信号LSY[c]と学習用否定
信号LSN[c]とを出力し、判定面学習部21がそれ
を受ける(同図ステップ(ヘ))。前記学習用肯定信号
LSY[c]と前記学習用否定信号LSN[c]と教師
データTD[c]の教師信号T[c]と判定面学習用信
号TC[c]=(T[c],LSN[c],LSY
[c])を内部の記憶素子に記憶する(同図ステップ
(ト))。そして、教師データカウンタの値を c=c+1 と1だけ増やす(同図ステップ(チ))。
【0126】以下、判定面学習部21は、同様の動作
を、教師データTD[c]の教師信号T[c]がT
[c]=−1になるかまたはc=nofTD+1となる
まで繰り返す(同図ステップ(リ))。T[c]=−1
またはc=nofTDとなると、学習用肯定信号LSY
[c]計算等の処理を終了する。
【0127】次に、判定面学習部21は、内部の記憶素
子に記憶された判定面学習用信号TC[c](c=1、
・・・)は、横軸をLSN[c]、縦軸をLSY[c]
とし、T[c]=1を○、T[c]=0を×で示すと、
図9に示すような分布となる。これらのうち、教師信号
T[c]=1であるものと前記教師信号T[c]=0で
あるものとが、図10に示したように最もよく分離でき
る判定パラメータCを、山登り法によって計算する(同
図ステップ(ヌ))。次に前記判定パラメータCを判定
パラメータ記憶部8に書き込み、学習制御部14に判定
面学習制御信号PLCを送り(同図ステップ(ル))、
処理を終了する。学習制御部14は、判定面学習部21
から判定面学習制御信号PLCを受け、学習制御部指示
信号を待機中を示す値にし、処理を終了する。
【0128】図10に示したように、上述の2つのメト
リック信号を用いてキーワード群信号を肯定信号SYと
否定信号SNとで表される2次元空間上で、ユーザーが
必要とする情報は主に左上に、不要な情報は右下に分布
するようになる。したがって、上記ように適切な係数C
を用いて必要性信号をN=SY−C・SNとすれば、必
要性信号は、ユーザーが必要とする情報に対して大きな
値をとるようになる。
【0129】なお、判定パラメータCの計算方法とし
て、ここでは、山登り法を採用したが、判定面と学習用
必要性信号LNと学習用信頼性信号LRとの距離に基づ
いて構成されるコスト関数
【数14】 を最大にする判定面パラメータCをニュートン法、挟み
撃ち法などで求める方法であってもよい。
【0130】また、肯定メトリック信号MYと否定メト
リック信号MNの学習を忘却の効果を入れた MY[i][j]=α・MY[i][j]+LV[i]
・LV[j] MN[i][j]=β・MN[i][j]+LV[i]
・LV[j] を用いてもよい結果が得られる。(ここで、αとβと
は、1より小さい正の数)さらに、文献「情報処理学会
技術報告、自然言語処理101−8(1994.5.2
7)」などに記載された文書からキーワード群信号とキ
ーワード数信号を生成するキーワード生成部を付加する
構成をとれば、キーワードが与えられていない情報に対
しても適用できる情報フィルタ装置を構成することがで
きる。
【0131】タイトルがつけられた情報については、タ
イトルを構成する単語をもってキーワードとし、キーワ
ード数信号とキーワード群信号を生成してもよい。
【0132】加えて、キーワード信号は、国際特許分類
番号など分類記号を含むようにもしても、本発明の構成
を変更する必要はなく、よい結果をえることができる。
【0133】また、本発明の実施の形態1では、未読デ
ータURDを1つずつ提示する場合について示したが、
表示装置(図示せず)の大きさによっては、複数の未読
データURDを同時に表示し、ユーザが複数表示された
どの未読データに対して応答したのかが正しく情報フィ
ルタ装置に伝えられるような構成を取ることは容易であ
る。
【0134】また、本発明の実施の形態1では、代表情
報を含む独立情報だけを表示するように構成したが、ユ
ーザーの要求によって、従属情報の数又は有無を合わせ
て表示させるようにしてもよい。また、必要に応じて、
独立情報の一覧性を損なわない範囲で、従属情報を小さ
な文字、画像で表示してもよい。
【0135】実施の形態1の情報フィルタ装置によれ
ば、情報相互の類似度を計算して類似情報をひとまとめ
にするとともに、代表情報及び独立情報を一覧表示する
ようにしたので、ユーザーに必要性の順に情報を提示す
る場合に、同じ内容の情報が何度も繰り返し提示される
といった不具合いを防止できる。さらに、本発明の主た
る目的ではないが、本発明を単純な「類似情報を一まと
めにする装置」として用いることも可能である。
【0136】実施の形態1の情報フィルタ装置によれ
ば、ユーザーの応答とキーワードとの関係をキーワード
の同時出現に注目した肯定メトリック信号MY、否定メ
トリック信号に反映させ、この2つのメトリック信号を
用いてキーワード群信号を肯定信号SYと否定信号SN
とに変換することで、キーワードという記号情報を距離
の定義された空間に射影したものである。これによっ
て、キーワード群の遠近を距離というアナログ尺度で評
価することができるようになる。これを利用することに
より、従来の技術では必要か不要かの二者択一的な判定
しかできなかった必要性の評価が、ユーザーの必要性の
順番に並べるといったことが可能になる。
【0137】実施の形態1の情報フィルタ装置によれ
ば、ユーザーからの教師信号に基づいた学習によって、
ユーザーの必要とする情報に対しては、必要性信号が大
きな値を取るようになり、その結果、表示装置等のイン
ターフェースユニットには、ユーザーにとって必要性が
高い情報が優先的に、かつ類似の情報は代表的なものが
一つ表示されるようになる。
【0138】(実施の形態2)以下、本発明の第2の実
施の形態について、図面を参照しながら説明する。実施
の形態2は、実施の形態1の構成に辞書学習部を付加
し、辞書記憶部2に記憶された符号辞書信号DCKがユ
ーザに適応するように更新し、かつ肯定メトリック信号
MYと否定メトリック信号MNを単純な頻度分布に対応
するキーワードの自己相関行列から、情報が必要/不要
の出現するキーワードの確率分布を考慮したものへと改
良したものである。
【0139】図11に本発明の実施の形態2の情報フィ
ルタ装置のブロック結線図を示すが、前述した本発明の
実施の形態1の情報フィルタ装置のブロック結線図と異
なる構成について詳細に説明する。
【0140】図11において、23は学習制御部14か
らの辞書学習信号DLCを受け辞書記憶部2の符号辞書
信号DCKを更新する辞書学習部、24は文字列Wと数
字Cがキーワード群信号Ksに含まれていたときにユー
ザが情報データDを必要と解答した回数を示す肯定回数
PYと文字列Wがキーワード群信号Ksに含まれていた
ときにユーザが情報データDが不要と解答した回数を示
す否定回数PNとからなる表をnofFDCK個有する適応
符号辞書信号
【数15】 を記憶した適応符号辞書信号記憶部、25はユーザが必
要と答えた回数を示す全肯定回数信号NYと不要と答え
た回数を示す全否定回数信号NNを記憶する回数記憶
部、26は肯定メトリック更新用の1次肯定メトリック
信号MY1を記憶する1次肯定メトリック記憶部、27
は否定メトリック更新用の1次否定メトリック信号MN
1を記憶する1次否定メトリック記憶部、28は前記肯
定回数信号と前記否定回数信号と前記1次肯定メトリッ
ク信号MY1と前記1次否定メトリック信号MN1とか
ら改良された肯定メトリック信号MYと否定メトリック
信号MNを計算してそれぞれを肯定メトリック記憶部5
と否定メトリック記憶部6に書き込むKDメトリック学
習部である。
【0141】以上のように構成された情報フィルタ装置
について、図面を用いて動作を説明する。ただし、動作
が実施の形態1と同様の個所は説明を省略する。
【0142】情報フィルタ装置の好ましい初期状態の一
例は、肯定メトリック信号MYと否定メトリック信号M
Nとを(nofDCK×nofDCK)零行列、未読デ
ータ記憶部10の未読データURD[i]の全ての必要
性信号N[i](i=1,・・・,nofURD)を使用
するハードウエアが表現可能な最小の値Vmin、教師
データ記憶部13の教師データTD[j]の教師信号T
[j]を全て−1、適応符号辞書信号の文字列Wを全て
ブランク、数字Cを符号辞書信号FDCKの上から順に
1、2、・・・・、nofFDCK、肯定回数PYと否定回
数PNを0、適応符号辞書に対応して、符号辞書の文字
列も全てブランクとした状態である。
【0143】まず、情報フィルタリングユニット50の
動作を説明する。
【0144】上述の初期状態の場合、実施の形態1に記
載した通りの動作を情報フィルタリングユニット50は
行い、入力されたキーワード数信号nofKs、キーワ
ード群信号Ks、情報データDから必要性信号N、信頼性
信号Rをともに0と計算し、未読データ記憶部10に格
納する。次に、インタフェースユニット51は、実施の
形態1と同じ動作を行い、ユーザの応答が付いた教師デ
ータTDを教師データ記憶部13に送る。
【0145】未読データ圧縮部70の動作も、実施の形
態1と同様である。
【0146】学習ユニット52の動作は、まず、学習開
始信号入力端子106から学習開始信号LSが入力され
る。学習制御部14は、前記学習開始信号LSを受け
て、学習制御部指示信号出力端子107から出力される
学習制御部指示信号LIを0から1に変え、処理中を示
す。更に、辞書学習信号DLCを辞書学習部23に送
る。
【0147】以下、図12に示したフローチャートを参
照しながら辞書学習部23の動作を説明する。まず、辞
書学習信号DLCを受けて(図12ステップ(イ))、
適応符号辞書記憶部24から適応符号辞書FDCKを最
大nofFDCKtmp個の適応符号信号を記憶できる適応符
号信号バッファに読み込み、回数記憶部25から全肯定
回数信号NYと全否定回数信号NNとを、1次肯定メト
リック記憶部26から1次肯定メトリック信号MY1
を、1次否定メトリック信号記憶部27から1次否定メ
トリック信号MN1を読み出す(同図ステップ
(ロ))。次に内部の教師データカウンタcの値を1に
し(同図ステップ(ハ))、教師信号記憶部13から教
師データTD[c]を読み出し(同図ステップ
(ニ))、その教師信号T[c]が−1であるか否かを
判定する(同図ステップ(ホ))。
【0148】T[c]≠−1の場合、以下の処理を行
う。まず、内部のキーワード数カウンタiの値を1にセ
ットし(同図ステップ(ヘ))、適応符号辞書カウンタ
jの値を1にセットする(同図ステップ(ト))。次
に、前記文字列W[j]がブランクであるかないかを判
定し(同図ステップ(チ))、ブランクである場合に
は、前記文字列W[j]を前記キーワード信号TK
[i]で置き換える(同図ステップ(リ))。ブランク
でない場合には、教師データTD[c]のi番目のキー
ワード信号TK[i]とj番目の適応符号辞書信号FD
CK[j]の文字列W[j]とを比較する(同図ステッ
プ(ヌ))。
【0149】前記文字列W[j]がブランクの場合、ま
たは、ブランクでなくかつ前記キーワード信号TK
[i]と前記文字列W[j]が一致した場合、T[c]
の値に応じて以下の処理を行う。T[c]=1の場合
(同図ステップ(ル))、全肯定信号NYに1を加え
(同図ステップ(ヲ))、適応符号辞書信号FDCK
[j]の肯定回数PY[j]に1を加える(同図ステッ
プ(ワ))。T[c]≠1、これはT[c]=0の場合
であるが、全否定信号NNに1を加え(同図ステップ
(カ))、適応符号辞書信号FDCK[j]の否定回数
PN[j]に1を加える(同図ステップ(ヨ))。
【0150】前記W[j]がブランクでなくかつ前記キ
ーワード信号TK[i]と前記文字列W[j]が一致し
ない場合、適応符号辞書カウンタjの値を1増やす(同
図ステップ(タ))。適応符号辞書カウンタjの値が適
応符号辞書信号バッファに記憶できる適応符号信号の数
に1を加えた値nofFDCKtmp+1と比較する(同図ステ
ップ(レ))。適応符号辞書カウンタjの値が、nof
FDCKtmp+1以下の場合、文字列W[j]がブランクかど
うかの判定に戻る。
【0151】それ以外の場合は、前記キーワードカウン
タiの値を1だけ増やす(同図ステップ(ソ))。
【0152】前記キーワードカウンタiの値が、前記教
師データTD[c]のキーワード数信号TnofKsに1
を加えた値TnofKs+1と比較して小さい場合(同図ス
テップ(ツ))、辞書カウンタjを1にセットし、同様
の処理を行う。それ以外の場合、教師データカウンタc
の値を1だけ増やす(同図ステップ(ネ))。教師デー
タカウンタcの値と教師データ数nofTDに1を加えた
値nofTD+1とを比較し(同図ステップ(ナ))、教師
データカウンタcの値が小さい場合、次の教師データT
D[c]を読み出し同様の処理を行う。
【0153】以上の処理が、全ての教師データTDに対
して行われる。
【0154】次に、辞書学習部23は、各々の適応符号
辞書信号FDCK[j]に対し、キーワードコスト信号
KDを計算する。このキーワードコスト信号は、文字列
W[j]がキーワードとして有効であるか否かを判断す
るために用いられる量である。
【0155】ところで、ユーザの不要な情報データDが
出現する確率 NN/(NY+NN) と比較して、文字列W[j]が付いている情報データD
がユーザにとって不要である場合の確率 PN[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであれば、
文字列W[j]は、情報データDがユーザにとって不要
と判定する上で有効である。同様に、ユーザの必要な情
報データDが出現する確率 NY/(NY+NN) と比較して、文字列W[j]が付いている情報データD
がユーザにとって必要である場合の確率 PY[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであれば、
文字列W[j]は、情報データDがユーザにとって必要
と判定する上で有効である。
【0156】キーワードコスト信号KDは、この性質を
反映している量で有ればなんでもよいが、好ましい例の
一つとして、カルバックダイバージェンスと呼ばれる
【数16】 が考えられる。しかし、これは、そのままでは、本情報
フィルタ装置の初期状態など、全肯定回数信号NY、全
否定回数信号NN、肯定回数PY[j]、否定回数PN
[j]が0のときには、log()の計算ができない、 PY[j]+PN[j]≒1 を満たす適応符号辞書信号FDCK[j]のキーワード
コスト信号を過大評価する等不適切な場合がある。これ
を回避する好ましい実施の形態の一つは、キーワードコ
スト信号を
【数17】 とするものである。ここで、εは0でのわり算、log0を
避けるための小さな正の値を持つパラメータである。パ
ラメータPCは、3−20程度の値とするとよい。
【0157】次に、適応符号辞書信号FDCK[j]の
文字列W[j]と肯定回数PY[j]と否定回数PN
[j]とをキーワードコスト信号KDの大きい順に並べ
替える(同図ステップ(ラ))。このとき、適応符号辞
書FDCK[j]の数字C[j]には、最初の並び順が
残っている。これを利用して、1次肯定メトリック信号
MY1とC[j]から、C[i]、C[j]の値がとも
に符号辞書DCKの数nofDCKより小さい場合、 M[i][j]=MY1[C[i]][C[j]],
i,j=1、・・nofDCK その他の場合は、i=jの場合は、 M[i][i]=PY[C[i]], i,=1、・・
nofDCK i≠jの場合は、 M[i][j]=0, i,j=1、・・nofDCK とした上で、 MY1[i][j]=M[i][j]、i,j=1、・
・nofDCK と1次肯定メトリック信号MY1の置き換えを行う。1
次否定メトリック信号MN1に対しても、同様の置き換
えを行う(同図ステップ(ム))。
【0158】そして、適応符号辞書信号バッファ内の適
応符号辞書FDCK[j]の数字C[j]を C[j]=j、j=1、・・・、nofFCKtmp と置き換える。
【0159】以上の処理を終えると、辞書学習部23
は、適応符号辞書バッファ内の適応符号辞書FDCKの
上位nofDCK個の文字列W[j]と数字C[j]を
辞書記憶部2に書き込み、適応符号辞書バッファ内の適
応符号辞書信号FDCK[j]の上位nofFDCK個を適
応符号辞書記憶部24に書き込み、全肯定回数信号NY
と全否定回数信号NNを回数記憶部25に書き込み、1
次肯定メトリック信号MY1を1次肯定メトリック信号
記憶部26に1次否定メトリック信号MN1を1次否定
メトリック信号記憶部27に書き込む(同図ステップ
(ウ))。
【0160】最後に、辞書学習信号DCLを学習制御部
14に戻して(同図ステップ(ヒ))、処理を終了す
る。
【0161】次に、前記学習制御部14は、スイッチ1
6とスイッチ17とスイッチ18とをメトリック学習部
19と学習用ベクトル生成部20が接続する様に切り替
える。前記学習制御部14は、KDメトリック学習部2
8にメトリック学習制御信号MLCを送る。
【0162】前記メトリック学習制御信号MLCを受け
たKDメトリック学習部28は、まず、1次肯定メトリ
ック記憶部26から1次肯定メトリック信号MY1を、
1次否定メトリック記憶部27から1次否定メトリック
信号MN1をそれぞれ読み出す。
【0163】次に、KDメトリック学習部28は、教師
データカウンタcの値を1にする。
【0164】教師データ記憶部13からc番目の教師デ
ータ信号TD[c]を読み出し、教師データTD[c]
の教師信号T[c]を調べる。前記教師信号T[c]が
−1でない場合(T≠−1)には、教師データTD
[c]のキーワード数信号TnofKs[c]とキーワ
ード群信号TKs[c]とを出力する。前記教師データ
TD[c]のキーワード数信号TnofKs[c]とキ
ーワード群TKs[c]とを受けた学習用ベクトル生成
部20は、前述した実施の形態1の情報フィルタリング
ユニット50のベクトル生成部1と同様の動作を行い、
学習用ベクトル信号LVを出力する。KDメトリック学
習部28は、前記学習用ベクトル信号LVを受け、前記
教師データTD[c]の教師信号T[c]がT=1であ
る場合には、1次肯定メトリック信号MY1を MY1[i][j]=MY1[i][j]+LV[i]
・LV[j] (ここで、i,j=1〜nofDiC)と修正する。前
記教師データTD[c]の教師信号T[c]がT=0で
ある場合には、1次否定メトリック信号MN1を MN1[i][j]=MN1[i][j]+LV[i]
・LV[j] (ここで、i,j=1〜nofDiC)と修正する。教
師データカウンタの値をc=c+1と1だけ増やす。
【0165】以下、KDメトリック学習部28は、同様
の動作を、教師データTD[c]の教師信号T[c]が
T[c]=−1になるかまたはc=nofTDとなるま
で繰り返す。T[c]=−1またはc=nofTDとな
ると、1次肯定メトリック信号MY1と1次否定メトリ
ック信号MN1の学習を終える。
【0166】次に、回数記憶部25から全肯定回数信号
NYと全否定回数信号NNを読み出し、1次肯定メトリ
ック信号MY1と1次否定メトリック信号MN1とを用
いて、肯定メトリック信号MYを計算する。
【0167】こうして計算される肯定メトリック信号M
Y、否定メトリック信号MNは、キーワードコスト信号
KDと同様、計算される肯定信号SYと否定信号SN
が、ユーザの不要な情報データDが出現する確率 NN/(NY+NN) と比較して、文字列W[j]が付いている情報データD
がユーザにとって不要である場合の確率 PN[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであり、ユ
ーザの必要な情報データDが出現する確率 NY/(NY+NN) と比較して、文字列W[j]が付いている情報データD
がユーザにとって必要である場合の確率 PY[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであるとい
った性質を持っていれば、なんでもよい。これを満たす
好ましいのは、肯定メトリック信号MYを
【数18】 と計算し、否定メトリック信号MNを
【数19】 と計算する。ここで、εは0でのわり算、log0を避ける
ための小さな正の値を持つパラメータである。
【0168】そして、更新された1次肯定メトリック信
号MY1を1次肯定メトリック信号記憶部26に、更新
された1次否定メトリック信号MN1を1次否定メトリ
ック信号記憶部27に、新たに計算れた肯定メトリック
信号MYを肯定メトリック記憶部5へ、新たに計算され
た否定メトリック信号MNを否定メトリック記憶部6へ
書き込む。以上で、KDメトリック学習部28は、メト
リック学習の処理を終了し、メトリック学習制御信号M
LCを学習制御部14に送る。
【0169】学習制御部14は、KDメトリック学習部
28からのメトリック学習制御信号MLCを受けて、ス
イッチ16を学習用ベクトル生成部20とスコア計算部
22とが接続するように切り替え、スイッチ17とスイ
ッチ18を学習用ベクトル生成部20と判定面学習部2
1とが接続するように切り替える。学習制御部14は、
判定面学習制御信号PLCを判定面学習部21に送る。
【0170】判定面学習部21の動作は、実施の形態1
と全く同じであるので、説明は繰り返さない。
【0171】一度、以上の処理が行われると、辞書記憶
部2の符号辞書が空でなくなるので、情報フィルタリン
グユニット50から出力される必要性信号N、信頼性信
号Rは、0でなくなり、ユーザの必要性の高い情報デー
タが、未読データ記憶部10の上位に書き込まれるよう
になる。
【0172】以後、上記処理を繰り返すことにより、ユ
ーザが必要とする情報か否かを判定するために有効なキ
ーワードが優先的に辞書記憶部2に記憶されるようにな
り、小規模な辞書であっても、精度の高い情報フィルタ
リングが可能となる。
【0173】なお、判定パラメータCの計算方法とし
て、ここでは、山登り法を採用したが、実施の形態1と
同様、判定面と学習用必要性信号LNと学習用信頼性信
号LRとの距離に基づいて構成されるコスト関数を最大
にする判定面パラメータCをニュートン法、挟み撃ち法
などで求める方法であってもよい。さらに、簡便な方法
として、 C=tanθi ここで、 θi=0.5・π(i/90) i=1,・・・,90 の中から、T[c]=1である情報とT[c]=0であ
る情報をもっともよく分離できるCを選ぶと言う方法も
考えることができる。
【0174】また、1次肯定メトリック信号MY1と1
次否定メトリック信号MN1の学習を忘却の効果を入れ
た MY1[i][j]=α・MY1[i][j]+LV
[i]・LV[j] MN1[i][j]=α・MN1[i][j]+LV
[i]・LV[j] を用いてもよい結果が得られる。(ここで、αは、1よ
り小さい正の数)もしくは、MY1[i][j]または
MN1[i][j]のいずれかが一定値をこれた場合
に、 MY1[i][j]=MY1[i][j]/2 MN1[i][j]=MN1[i][j]/2 として、信号のオーバーフローを防ぐように構成するこ
とは、実施上好ましい。これは、適応符号辞書信号FD
CK[j]の肯定回数PY[j]と否定回数PN
[j]、および全肯定回数信号NYと全否定回数NNに
ついても同様である。さらに、文献「情報処理学会技術
報告、自然言語処理101−8(1994.5.2
7)」などに記載された文書からキーワード群信号とキ
ーワード数信号を生成するキーワード生成部を付加する
構成をとれば、キーワードが与えられていない情報に対
しても適用できる情報フィルタ装置を構成することがで
きる。
【0175】タイトルがつけられた情報については、タ
イトルを構成する単語をもってキーワードとし、キーワ
ード数信号とキーワード群信号を生成してもよい。
【0176】加えて、キーワード信号は、国際特許分類
番号など分類記号を含むようにもしても、本発明の構成
を変更する必要はなく、よい結果をえることができる。
【0177】また、本実施の形態では、未読データUR
Dを一つづつ提示する場合について示したが、表示装置
(図示せず)の大きさによっては複数の未読データUR
Dを同時に表示し、ユーザがどの未読データURDにつ
いて応答したのかを正しく情報フィルタ装置に伝える構
成をとることは容易である。
【0178】また、本発明の実施の形態1では、独立情
報だけを表示するように構成したが、ユーザーの要求に
よって、従属情報も表示できるように構成することは、
容易である。
【0179】実施の形態2の情報フィルタ装置によれ
ば、情報相互の類似度を計算して類似情報をひとまとめ
にするとともに、代表情報及び独立情報を一覧表示する
ようにしたので、ユーザーに必要性の順に情報を提示す
る場合に、同じ内容の情報が何度も繰り返し提示される
といった不具合いを防止できる。
【0180】実施の形態2の情報フィルタ装置によれ
ば、キーワードの同時出現に注目したメトリックを導入
することにより、キーワードという記号情報を距離の定
義された空間に射影したことにある。これによって、キ
ーワード群の遠近を距離というアナログ尺度で評価する
ことができるようになる。これを利用することにより、
従来の技術では必要か不要かの二者択一的な判定しかで
きなかった必要性の評価が、ユーザーの必要性の順番に
並べるといったことが可能になる。
【0181】本実施の形態による情報フィルタによれ
ば、ユーザーからの教師信号に基づいた学習によって、
ユーザーの必要とする情報に対しては、必要性信号が大
きな値を取るようになり、その結果、表示装置等には、
ユーザーにとって必要性が高い情報が優先的に、かつ類
似の情報は代表的なものが一つ表示されるようになる。
【0182】
【発明の効果】以上のように、本発明は、情報記録媒体
又は情報通信網から供給された情報が記憶される記憶部
と、該記憶部の情報を類似する情報でまとめて代表情報
と従属情報を決める類似判定手段と、前記記憶部の情報
を提示する場合に類似する情報については代表情報を提
示する提示手段とを具備することで、同じような情報が
複数含まれる場合には、代表的な情報と関連情報の件数
表示することにより、できる限り多くの種類の情報を一
度に表示でき一覧性の高い情報フィルタリングを実現で
きる。
【図面の簡単な説明】
【図1】本発明の実施の形態1の情報フィルタ装置のブ
ロック結線図
【図2】本発明の実施の形態1の情報フィルタ装置の概
略を示すブロック結線図
【図3】本発明の実施の形態1の情報フィルタ装置のベ
クトル生成部の動作を説明するフローチャート
【図4】本発明の実施の形態1の情報フィルタ装置の未
読データ書き込み制御部の動作を説明するフローチャー
【図5】本発明の実施の形態1の情報フィルタ装置の未
読データ出力制御部の動作を説明するフローチャート
【図6】本発明の実施の形態1の情報フィルタ装置の学
習制御部の動作を説明するフローチャート
【図7】本発明の実施の形態1の情報フィルタ装置のメ
トリック学習部の動作を説明するフローチャート
【図8】本発明の実施の形態1の情報フィルタ装置の判
定面学習部の動作を説明するフローチャート
【図9】本発明の実施の形態1の情報フィルタ装置の判
定面学習部の動作を説明するための図
【図10】本発明の実施の形態1の情報フィルタ装置の
判定面学習部の動作を説明するための図
【図11】本発明の実施の形態2の情報フィルタ装置の
ブロック結線図
【図12】本発明の実施の形態2の情報フィルタ装置の
辞書学習部の動作を説明するフローチャート
【図13】本発明の実施の形態1の未読データ圧縮部の
概略を示すブロック結線図
【図14】本発明の実施の形態1の未読データ圧縮部の
動作の前半を説明するためのフローチャート
【図15】本発明の実施の形態1の未読データ圧縮部の
動作の後半を説明するためのフローチャート
【図16】本発明の実施の形態1の類似情報リスト信号
ADの内容を示す概念図
【図17】(a),(b)は本発明の実施の形態1の類
似度の特徴を説明するための2つの情報に付されたキー
ワードの包含関係を示す概念図
【符号の説明】
1 ベクトル生成部 2 符号辞書記憶部 3 スコア計算部 5 肯定メトリック記憶部 6 否定メトリック記憶部 7 必要性計算部 8 判定パラメータ記憶部 9 未読データ書き込み制御部 10 未読データ記憶部 11 未読データ出力制御部 12 教師データ制御部 13 教師データ記憶部 14 学習制御部 16 スイッチ 17 スイッチ 18 スイッチ 19 メトリック学習部 20 学習用ベクトル生成部 21 判定面学習部 22 スコア計算部 23 辞書学習部 24 適応符号辞書記憶部 25 回数記憶部 26 1次肯定メトリック記憶部 27 1次否定メトリック記憶部 28 KDメトリック学習部 31 肯定信号計算部 32 否定信号計算部 50 情報フィルタリングユニット 51 インタフェースユニット 52 学習ユニット 53 代表情報一覧ユニット 70 未読データ圧縮部 71 類似度計算制御部 72 未読データ読み出し部 73 類似度ベクトル生成部 74 スイッチ 75 参照ベクトル記憶部 76 類似度計算部 77 閾値記憶部 78 比較部 79 圧縮未読データ書き込み制御部 80 フラグ記憶部 81 圧縮未読データ記憶部 82 圧縮未読データ読み出し制御部 101 キーワード数信号入力端子 102 キーワード信号入力端子 103 データ読み出し開始信号入力端子 104 データ表示端子 105 教師信号入力端子 106 学習開始信号入力端子 107 学習制御部指示信号出力端子 110 未読データ部指示端子
フロントページの続き (56)参考文献 特開 平9−101990(JP,A) 特開 平7−295994(JP,A) 特開 平5−204975(JP,A) 特開 平3−94375(JP,A) 住田,三池「情報フィルタリング技 術」東芝レビュー,Vol.51,No. 1,1996(平8−1−1)pp.42−44 菅井,和田「WWW上の電子新聞に対 する情報フィルタリングとその評価」情 報処理学会研究報告(96−FI−43− 13),Vol.96,No.88,1996,p p.89−96(平8−9−12) 野美山,外4名「個人適用型情報検索 システム−個人の興味を学習する階層記 憶モデルとその協調的フィルタリングへ の適用−」情報処理学会研究報告(96− FI−42−8) 神場「The Krakataoa Chronicle:WWW上のエージ ェント機能を利用した、対話型パーソナ ル新聞」情報処理学会研究報告(OS− 71−3,DPS−73−3),Vol. 95,No.115,pp.13−18 中島,外3名「ニュースフィルタリン グエージェントにおける協調」情報処理 学会ワークショップ論文集,Vol. 95,No.2,pp.63−69,1995 宮原,岡本「協調フィルタリングにお ける個人の興味領域の表現とその獲得 法」電子情報通信学会技術研究報告(A I96−32) 住田,外5名「WWW上のフロー情報 を対象にした情報フィルタ(Fresh Eye)」情報処理学シンポジウム論文 集,Vol.97,No.1,pp.63− 64,1997 菅井,和田「インターネット上の情報 フィルタリング(2)−情報の整理方 法」情報処理学会第51回(平成7年後 期)全国大会講演論文集(4)pp.87 −88 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06N 3/00 JICSTファイル(JOIS)

Claims (11)

    (57)【特許請求の範囲】
  1. 【請求項1】 情報が蓄積される記憶部と、この記憶部
    から類似度判定対象の情報及び比較対象の情報を読み出
    す読出制御手段と、読み出された類似度判定対象情報と
    比較対象情報との包含関係を分析し類似度判定対象情報
    が比較対象情報に包含されている場合に最大値をとるよ
    うに類似度を計算する類似度計算手段と、前記類似度判
    定対象情報に対して類似度が所定値以上の比較対象情報
    を従属情報として抽出する抽出手段と、を具備する情報
    フィルタ装置。
  2. 【請求項2】 前記記憶部に蓄積された情報を一覧表示
    する場合、類似度判定対象情報及びその従属情報で構成
    する類似情報群中の代表情報と、従属情報の存在しなか
    った類似度判定対象情報からなる独立情報と、を一覧表
    示する提示手段を具備することを特徴とする請求項1記
    載の情報フィルタ装置。
  3. 【請求項3】 前記提示手段は、代表情報を提示する際
    に、当該代表情報が属する類似情報群中の従属情報の数
    又は有無を一緒に表示することを特徴とする請求項2記
    載の情報フィルタ装置。
  4. 【請求項4】 前記提示手段は、独立情報の一覧性を損
    なわない範囲で従属情報を、独立情報よりも小さな文字
    又は画像で一緒に表示することを特徴とする請求項2記
    載の情報フィルタ装置。
  5. 【請求項5】 ユーザ毎に固有の符号辞書信号が記憶さ
    れた符号辞書記憶部と、前記符号辞書信号を用いてフィ
    ルタリング対象となる情報からキーワードを抽出してベ
    クトルデータに変換するベクトル生成手段と、ユーザが
    過去に「必要」と評価した情報及び「不要」と評価した
    情報から得たキーワードに基づいて生成したメトリック
    信号が記憶されたメトリック記憶部と、前記ベクトルデ
    ータ及びメトリック信号を用いてフィルタリング対象情
    報を当該ユーザが必要とする必要性の高さに基づいてフ
    ィルタリングして前記記憶部へ蓄積する制御手段と、を
    有することを特徴とする請求項1から請求項4のいずれ
    かに記載の情報フィルタ装置。
  6. 【請求項6】 前記符号辞書記憶部に記憶される符号辞
    書信号をユーザ個人に適応するように更新する辞書学習
    手段を備えたことを特徴とする請求項5記載の情報フィ
    ルタ装置。
  7. 【請求項7】 前記符号辞書記憶部に記憶される符号辞
    書信号を用いて、前記類似度判定対象情報のキーワード
    群及び前記比較対象情報のキーワード群を生成すること
    を特徴とする請求項5又は請求項6記載の情報フィルタ
    装置。
  8. 【請求項8】 前記メトリック記憶部は、ユーザが過去
    に「必要」と評価した情報のキーワードの自己相関行列
    からなる肯定メトリック信号および前記ユーザが過去に
    「不要」と評価した情報のキーワードの自己相関行列か
    らなる否定メトリック信号が、前記メトリック信号とし
    て記憶され、 前記制御手段は、前記ベクトルデータ、肯定メトリック
    信号及び否定メトリック信号を用いて、前記ベクトル変
    換されたキーワードに過去にユーザが「必要」とした情
    報のキーワードが多く含まれる程数値が大きくなる肯定
    スコア信号と、前記ベクトル変換されたキーワードに過
    去にユーザが「不要」とした情報のキーワードが多く含
    まれる程数値が大きくなる否定スコア信号とを計算する
    スコア計算手段と、前記肯定スコア信号及び否定スコア
    信号に基づいて、前記ユーザからみたフィルタリング対
    象情報の必要性の大きさを計算する必要性計算手段とを
    有する、ことを特徴とする請求項5記載の情報フィルタ
    装置。
  9. 【請求項9】 前記必要性計算手段は、前記肯定スコア
    信号及び前記否定スコア信号からなる二次元平面におい
    て必要な情報及び不要な情報に分離する判定パラメータ
    信号を用いて、前記ユーザが過去に「必要」と評価した
    情報のキーワードがより多数になり、かつ前記ユーザが
    過去に「不要」と評価した情報のキーワードがより少数
    になる程大きな必要性を示す必要性信号を計算すること
    を特徴とする請求項8記載の情報フィルタ装置。
  10. 【請求項10】 記憶部から類似度判定対象の情報及び
    比較対象の情報を読み出し、この読み出された類似度判
    定対象情報と比較対象情報との包含関係を分析して類似
    度判定対象情報が比較対象情報に包含されている場合に
    最大値をとるように類似度を計算し、前記類似度判定対
    象情報に対して類似度が所定値以上の比較対象情報を従
    属情報として抽出することを特徴とする情報フィルタリ
    ング方法。
  11. 【請求項11】 類似度判定対象情報及びその従属情報
    で構成する類似情報群中の代表情報と、従属情報の存在
    しなかった類似度判定対象情報からなる独立情報と、を
    一覧表示することを特徴とする請求項10記載の情報フ
    ィルタリング方法。
JP09641897A 1997-03-31 1997-03-31 情報フィルタ装置及び情報フィルタリング方法 Expired - Lifetime JP3203203B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09641897A JP3203203B2 (ja) 1997-03-31 1997-03-31 情報フィルタ装置及び情報フィルタリング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09641897A JP3203203B2 (ja) 1997-03-31 1997-03-31 情報フィルタ装置及び情報フィルタリング方法

Publications (2)

Publication Number Publication Date
JPH10275160A JPH10275160A (ja) 1998-10-13
JP3203203B2 true JP3203203B2 (ja) 2001-08-27

Family

ID=14164436

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09641897A Expired - Lifetime JP3203203B2 (ja) 1997-03-31 1997-03-31 情報フィルタ装置及び情報フィルタリング方法

Country Status (1)

Country Link
JP (1) JP3203203B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3344953B2 (ja) * 1998-11-02 2002-11-18 松下電器産業株式会社 情報フィルタ装置及び情報フィルタリング方法
JP3707361B2 (ja) * 2000-06-28 2005-10-19 日本ビクター株式会社 情報提供サーバ及び情報提供方法
JP2003203090A (ja) * 2002-01-07 2003-07-18 Ricoh Co Ltd 画像空間表示方法
JP3781005B2 (ja) 2002-12-12 2006-05-31 セイコーエプソン株式会社 文書抽出装置及び文書抽出プログラム並びに文書抽出方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3810463B2 (ja) * 1995-07-31 2006-08-16 株式会社ニューズウオッチ 情報フィルタリング装置

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
中島,外3名「ニュースフィルタリングエージェントにおける協調」情報処理学会ワークショップ論文集,Vol.95,No.2,pp.63−69,1995
住田,三池「情報フィルタリング技術」東芝レビュー,Vol.51,No.1,1996(平8−1−1)pp.42−44
住田,外5名「WWW上のフロー情報を対象にした情報フィルタ(FreshEye)」情報処理学シンポジウム論文集,Vol.97,No.1,pp.63−64,1997
宮原,岡本「協調フィルタリングにおける個人の興味領域の表現とその獲得法」電子情報通信学会技術研究報告(AI96−32)
神場「The Krakataoa Chronicle:WWW上のエージェント機能を利用した、対話型パーソナル新聞」情報処理学会研究報告(OS−71−3,DPS−73−3),Vol.95,No.115,pp.13−18
菅井,和田「WWW上の電子新聞に対する情報フィルタリングとその評価」情報処理学会研究報告(96−FI−43−13),Vol.96,No.88,1996,pp.89−96(平8−9−12)
菅井,和田「インターネット上の情報フィルタリング(2)−情報の整理方法」情報処理学会第51回(平成7年後期)全国大会講演論文集(4)pp.87−88
野美山,外4名「個人適用型情報検索システム−個人の興味を学習する階層記憶モデルとその協調的フィルタリングへの適用−」情報処理学会研究報告(96−FI−42−8)

Also Published As

Publication number Publication date
JPH10275160A (ja) 1998-10-13

Similar Documents

Publication Publication Date Title
CN112163077B (zh) 一种面向领域问答的知识图谱构建方法
US7979268B2 (en) String matching method and system and computer-readable recording medium storing the string matching method
CN100565670C (zh) 用于用户模型化以增强对命名实体识别的系统和方法
KR101078864B1 (ko) 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법
CN117235281B (zh) 基于知识图谱技术的多元数据管理方法及系统
CN101432684A (zh) 对非结构化内容进行高效索引存储的方法和装置
KR20070102034A (ko) 문서검색 결과를 이용한 군집화 시스템 및 그 방법
JP3244005B2 (ja) 情報フィルタ装置及び情報フィルタリング方法
CN114419387A (zh) 基于预训练模型和召回排序的跨模态检索系统及方法
CN115270738B (zh) 一种研报生成方法、系统及计算机存储介质
CN108959395A (zh) 一种面向多源异构大数据的层次约减联合清洗方法
KR20070009338A (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
CN110889003B (zh) 一种基于文本的车辆图像细粒度检索系统
JP3820878B2 (ja) 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体
KR100644016B1 (ko) 동영상 검색 시스템 및 방법
JP3344953B2 (ja) 情報フィルタ装置及び情報フィルタリング方法
JPH1145284A (ja) プロファイルの作成方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3203203B2 (ja) 情報フィルタ装置及び情報フィルタリング方法
CN115774996B (zh) 智能面试的追问题目生成方法、装置和电子设备
JP2019128925A (ja) 事象提示システムおよび事象提示装置
JP2004240488A (ja) 文書管理装置
JP3260093B2 (ja) 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法
CN115982316A (zh) 一种基于多模态的文本检索方法、系统及介质
JP3156703B1 (ja) メトリック学習装置及びメトリック学習方法
JP3244083B2 (ja) 適応辞書装置及び適応辞書方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090622

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090622

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100622

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110622

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110622

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120622

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120622

Year of fee payment: 11

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120622

Year of fee payment: 11

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120622

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130622

Year of fee payment: 12

EXPY Cancellation because of completion of term