JP2001167132A - 情報フィルタ装置及び情報フィルタリング方法 - Google Patents
情報フィルタ装置及び情報フィルタリング方法Info
- Publication number
- JP2001167132A JP2001167132A JP2000341564A JP2000341564A JP2001167132A JP 2001167132 A JP2001167132 A JP 2001167132A JP 2000341564 A JP2000341564 A JP 2000341564A JP 2000341564 A JP2000341564 A JP 2000341564A JP 2001167132 A JP2001167132 A JP 2001167132A
- Authority
- JP
- Japan
- Prior art keywords
- information
- signal
- input
- keyword
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
ユーザーに対して必要性の高い情報から順に提供できる
情報フィルタ装置を提供するものである。 【解決手段】 情報記憶媒体又は情報通信網から所定の
情報を取り出す装置であって、情報を提示する情報提示
手段と、提示された情報が必要か不要かを入力する入力
手段と、前記入力手段からの入力と、前記情報に付けら
れたひとつまたは複数のキーワード信号からなるキーワ
ード群信号を変換したベクトル信号とから計算された肯
定メトリック信号と否定メトリック信号とからスコア信
号を計算するスコア計算手段とを有し、前記スコア信号
を利用して情報の提示の順序を決めることを特徴とする
情報フィルタ装置としたものであり、ユーザーからの必
要か否かの評価を示す入力を用いて情報の並べ変えを行
い情報をユーザーに必要性の高い順に提示するという特
徴を有している。
Description
媒体とする記憶装置や情報通信網から必要な情報を取り
出し易くする情報フィルタ装置及び情報フィルタリング
方法に関するものである。
社会基盤の進展に伴い、情報通信網の大規模化と通信量
の著しい増大に対応する技術として、その実現が強く望
まれている。この背景には、今日、個人が処理可能な情
報量に対して、個人がアクセスできる情報量が上回るよ
うになっていることがある。このために、大量の情報の
中に必要と思う情報が埋没することが、しばしば起こ
る。
ては、特許検索などに用いられるキーワード論理式をあ
げることができる。すなわち、数十万から数百万件に及
ぶ特許情報をキーワード論理式によりフィルターリング
するものである。
ード論理式を用いる従来の検索においては、使用者がキ
ーワードについての論理式を精度良く設定する必要があ
るので、使用者がファイリングされているデータ群の癖
(例えば、どのような条件の基に、当該データのキーワ
ードが決定されているのか等)やシステムの構造(例え
ば、キーワードがシソーラス体系のあるシステムである
か否か等)を十分に知り得ていなければ良い検索ができ
ない。このため、初心者には精度の高い情報フィルタリ
ングを行うことができないという課題があった。
ワードについての論理式に適合するという評価があるだ
けであり、たまたまキーワードでは合致しているが、内
容は求めているものとは異なるケースであったり、ある
いは多くの検索結果から使用者にとって必要度の高い情
報をその結果から順に取り出すことは容易でない。
あり、初心者にも精度の高い情報フィルタリングがで
き、かつ使用者にとって必要性の高い情報を取り出し易
い情報フィルタ装置を提供することを目的とする。
に本発明の情報フィルタ装置は、情報記憶媒体又は情報
通信網から所定の情報を取り出す装置であって、情報を
提示する情報提示手段と、提示された情報が必要か不要
かを入力する入力手段と、前記入力手段からの入力と、
前記情報に付けられたひとつまたは複数のキーワード信
号からなるキーワード群信号を変換したベクトル信号と
から計算された肯定メトリック信号と否定メトリック信
号とからスコア信号を計算するスコア計算手段とを有
し、前記スコア信号を利用して情報の提示の順序を決め
ることを特徴とするものである。
ードは、距離の定義ができない記号から、使用者の必要
度を反映したメトリックを用いて距離を定義できるベク
トル表現へと変換され、使用者の必要度を定量化するこ
とができ、使用者は必要性の高い情報から順に情報を得
ることができるようになる。
憶媒体又は情報通信網から所定の情報を取り出す装置で
あって、情報を提示する情報提示手段と、提示された情
報が必要か不要かを入力する入力手段と、前記入力手段
からの入力と、前記情報に付けられたひとつまたは複数
のキーワード信号からなるキーワード群信号を変換した
ベクトル信号とから計算された肯定メトリック信号と否
定メトリック信号とからスコア信号を計算するスコア計
算手段とを有し、前記スコア信号を利用して情報の提示
の順序を決めることを特徴とする情報フィルタ装置とし
たものであり、ユーザーからの必要か不要かの評価を示
す入力を用いて情報の並べ変えを行い情報をユーザーに
必要性の高い順に提示するという作用を有する。
トリック信号は、入力手段から入力される信号が必要な
場合のベクトル信号の自己相関行列であり、否定メトリ
ック信号は、入力手段から入力される信号が不要である
場合のベクトル信号の自己相関行列であることを特徴と
する請求項1記載の情報フィルタ装置としたものであ
り、これによって簡単な計算でメトリックが計算でき、
情報をユーザーに必要な順に精度高く並べ変えるという
作用を持つ。
憶媒体又は情報通信網から所定の情報を取り出す方法で
あって、情報を提示する情報提示ステップと、提示され
た情報が必要か不要かを入力する入力ステップと、前記
入力ステップからの入力と、前記情報に付けられたひと
つまたは複数のキーワード信号からなるキーワード群信
号を変換したベクトル信号とから計算された肯定メトリ
ック信号と否定メトリック信号とからスコア信号を計算
するスコア計算ステップとを有し、前記スコア信号を利
用して情報の提示の順序を決めることを特徴とする情報
フィルタ方法であり、情報をユーザーに必要な順に精度
高く並べ変えるという作用を持つ。
トリック信号は、前記入力ステップから入力される信号
が必要な場合のベクトル信号の自己相関行列であり、否
定メトリック信号は、前記入力ステップから入力される
信号が不要である場合のベクトル信号の自己相関行列で
あることを特徴とする請求項3記載の情報フィルタ方法
であり、これによって簡単な計算でメトリックが計算で
き、情報をユーザーに必要な順に精度高く並べ変えると
いう作用を持つ。
憶媒体又は情報通信網上にある情報について、使用者に
とっての必要性を推定する装置であって、前記情報は情
報データと一つ以上のキーワード(文字列)を含むもの
であり、前記情報データを提示する情報提示手段と、前
記提示された情報データが必要か不要かを入力する入力
手段と、前記入力手段からの入力を用いて前記提示され
た情報データにつけられたキーワードへのユーザの必要
性を予測する値の割り振りを行う学習手段と、前記予測
値を用いて情報の必要性の評価値を求める必要性評価手
段とを有すること特徴とする情報必要性推定装置であ
り、情報をユーザーに必要な評価値が精度高く求めるこ
とが出来るという作用を持つ。
憶媒体又は情報通信網上にある情報について、使用者に
とっての必要性を推定する方法であって、前記情報は情
報データと一つ以上のキーワード(文字列)を含むもの
であり、前記情報データを提示する情報提示ステップ
と、前記提示された情報データが必要か不要かを入力す
る入力ステップと、前記入力ステップからの入力を用い
て前記提示された情報データにつけられたキーワードへ
のユーザの必要性を予測する値の割り振りを行う学習ス
テップと、前記予測値を用いて情報の必要性の評価値を
求める必要性評価ステップとを有すること特徴とする情
報必要性推定方法であり、情報をユーザーに必要な評価
値が精度高く求めることが出来るという作用を持つ。
から図12を用いて説明する。
施の形態について、図面を参照しながら説明する。図1
は本発明の実施の形態1の情報フィルタ装置の構成を示
すブロック図であり、図2はその構成と動作を分かりや
すくするために機能単位にまとめたブロック図である。
説明する。
ユーザーがどんな「情報」を過去に必要としたかという
履歴に関する記録を記憶した複数の記憶部2、5、6、
8と、「情報」のフィルタリングを行う情報フィルタリ
ングユニット50と、その情報フィルタリングユニット
50により実際にフィルタリングされた未読の「情報」
(ユーザーがまだ読んでいない情報)を蓄積しておく未
読データ記憶部10と、ユーザーが当該未読「情報」を
可視できるようにしたディスプレー等のインタフェース
ユニット51と、ユーザーがどんな「情報」を必要とし
たかという履歴に関する学習を行う学習ユニット52と
からなる。
なお、以下の説明では既にユーザーがどんな「情報」を
過去に必要としたかという履歴は学習済みのこととして
説明する。また、以下に単に「情報」と称するものに
は、当該「情報」に対応する1つ以上のキーワードが付
されているものとする。そのキーワードとは、当該「情
報」を構成する各単語の一部あるいは全体であっても良
いし、当該「情報」を代表するために特別に付したもの
であっても良い。
新たな「情報」が入力されると、情報フィルタリングユ
ニット50は、記憶部2、5、6、8からユーザーがど
のような「情報」を過去に必要としたかという記録を読
みだし、前記新たな「情報」の必要性を必要性信号とし
て定量的に評価する。
未読データ記憶部10に、必要性信号が大きい順に過去
からの未読「情報」を含めて並ぶように前記入力された
「情報」を当該順番に書き込む。
スユニット51では、ユーザーに必要性信号の大きい順
に前記新たな「情報」を含めた未読「情報」を1つひと
つ提示(例えば、ディスプレーに表示)する。
な「情報」を含めた未読「情報」の1つひとつがユーザ
ーにとって必要か不要かを示す教師信号をユーザーがイ
ンタフェースユニット51を介して入力することによ
り、インタフェースユニット51では、当該教師信号を
受け取り、当該「情報」とその教師信号を学習ユニット
52に送る。なお、このユーザーによる教師信号の入力
は、学習ユニット52の学習能力をより高めるために実
施するものであり、学習ユニット52の学習能力(ユー
ザーがどんな「情報」を過去に必要としたかという履歴
の学習能力)が既に十分に高ければ行う必要はない。
た「情報」とその教師信号を用いて記憶部2、5、6、
8の履歴内容を書き換える。
高い学習を通じてユーザーに適応し、ユーザーの求める
「情報」を優先的に提示することができる。また、当然
のことながら、学習を行っていない初期状態では、ユー
ザーがどんな「情報」を必要としているのか学習ユニッ
ト52では分からないので、全ての入力される新たな
「情報」をインタフェースユニット51でユーザーが提
示を受ける毎に上述したユーザーによる教師信号の入力
は必要であるが、随時実施する学習を通じてやがてユー
ザーに適応し、ユーザーの求める「情報」を優先的に提
示することができる。
に提示するとは、より具体的な使用例で述べれば、ある
「情報」データベースの母集団Aを特定のキーワードで
検索して「情報」の検索集合Bを得たとしても、当該検
索集合Bの「情報」の全てがユーザーにとっては必要で
あるとは限らないし、またユーザーにとっては「情報」
の全てが必要であってもその必要順位は当然存在するこ
とを前提としている。よって、必要から順に不要、ある
いはその必要順位に従って、インタフェースユニット5
1でユーザーに順に提示することを、ユーザーの求める
「情報」を優先的に提示することを意味する。
必要性信号(或「情報」が必要であったとの教師信号)
を計算するかである。
念的に次のような量として計算される。
ワードが添付されている場合を考える。一人のユーザー
を考えると、そのユーザーが必要としている「情報」に
高い頻度または確率で付いているキーワード集合Aと、
不要としている「情報」に高い頻度または確率で付いて
いるキーワード集合Bと、さらにはいずれにもよく付
く、または付かないキーワード集合Cとを考えることが
できる。
るキーワードには正の数値を、前記キーワード集合Bに
属するキーワードには負の値を、前記キーワード集合C
に属するキーワードには値0をそれぞれ割り振る。
ている1つ以上のキーワードについてそれぞれが前記キ
ーワード集合A、B、Cのどのキーワードグループに属
するかを判定し、前記割り振られた値を積算するように
構成する。
れた「情報」に付いていた複数のキーワードを、キーワ
ード集合Aに属するキーワードが数多く含まれた「情
報」(ユーザーが必要とする可能性の高い情報)に対し
ては大きな正の値を示し、キーワード集合Bに属するキ
ーワードが数多く付いている「情報」(ユーザーが不要
とする可能性の高い情報)に対しては大きな負の値を示
す数値に変換することができる。
要性に予測することができる。本発明では、提示した
「情報」とその「情報」に関するユーザーの必要/不要
の評価とからキーワード(キーワード共起を含む)への
値の割り振りを自動的に行い精度の高い必要性信号の計
算を実現し、精度高く必要性の高い順に「情報」を並べ
変えることを実現している。
に付けられた複数のキーワードを一つのベクトルに変換
し、ユーザーが必要とした場合と不要とした場合につい
て、別々に前記ベクトルの自己相関行列を計算してい
る。ユーザーが必要と答えた「情報」についていたキー
ワードから作られた自己相関行列MYを用いて、ベクト
ルVの長さSYを と計算する。
ていたキーワードから作られた自己相関行列MYを「肯
定メトリック信号」、不要と答えた情報についていたキ
ーワードから作られた自己相関行列MNを「否定メトリ
ック信号」と呼び、長さSYを肯定信号と呼ぶ。
複数のキーワードの中に、ユーザーが必要とする「情
報」によく含まれているキーワードが数多く含まれてい
れば、長さSYは大きな正の値をとり、そうでない場合
には0に近い値をとるから、必要性信号を計算する上で
有効である。
るように、さらに工夫を重ねて、精度の高い必要性信号
の計算を実現している。
リングユニット50に相当するブロックと、図2に示し
た学習ユニット52に相当するブロックについて、機能
単位毎に説明しておく。
相当するブロックの構成を説明する。
の「情報」につけられた複数のキーワード(正確には、
分類コードを含む文字列)をベクトルに変換する部分
と、ユーザーがどんな「情報」を必要/不要としたとい
う履歴を表現した肯定メトリック信号及び否定メトリッ
ク信号を用いてある種のスコアを表す肯定信号と否定信
号を計算する部分と、この肯定信号と否定信号とから
「情報」の必要性をよく反映する必要性信号を計算する
部分と、この必要性信号の大きい順に情報を並べ変える
部分からなる。以下、情報フィルタリングユニット50
に相当するブロックの構成を、図1に即して説明する。
キーワードなどの複数の文字列をベクトルに変換するベ
クトル生成部、2はキーワードなどの複数の文字列をベ
クトルに変換するための符号辞書信号を記憶した符号辞
書記憶部である。この符号辞書記憶部2に記憶された符
号辞書信号は、「情報」についているキーワードなどの
文字列Wを数字Cに変換する対応表をnofDCK個有するコ
ードブック
信号nofKsとnofKs個のキーワード信号からなるキーワー
ド群信号Ks=(K[1],・・・,K[nofKs])とを
受けキーワード群信号Ksと前記符号辞書信号DCKを用い
てベクトル信号Vに変換する。3はスコア計算部で、ユ
ーザーに提示された「情報」を必要/不要と評価した結
果から計算された肯定メトリック信号MY、否定メトリ
ック信号MNを用いて、ベクトル生成部1で変換された
2つのベクトル信号Vの長さ、肯定信号SYと否定信号
SNに変換する。5は(nofDCK×nofDCK)行列である前
記肯定メトリック信号MYを記憶する肯定メトリック記
憶部、6は(nofDCK×nofDCK)行列である前記否定メト
リック信号MNを記憶する否定メトリック記憶部であ
る。8は判定パラメータ信号Cを記憶する判定パラメー
タ記憶部、7は前記肯定信号SYと前記否定信号SNを
受け前記判別パラメータ記憶部8から判定パラメータ信
号Cを読み出し必要性信号Nと信頼性信号Rを計算する
必要性計算部である。9は「情報」の本文である情報デ
ータDとキーワード数信号nofKsとキーワード群信号K
sと必要性信号Nと信頼性信号Rとを所定の手続きに従
って後述する未読データ記憶部10に書き込む味読デー
タ書き込み制御部、10は前記「情報」の本文である情
報データDと前記キーワード数信号nofKsと前記キーワ
ード群信号Ksと前記必要性信号Nと前記信頼性信号R
とからなる最大nofURD個の未読データ
nofTD個の教師データ信号
ト51のブロックの構成を説明する。
未読データ記憶部10から未読データ信号URD[1]
を読み出し、表示信号DDを出力し、その表示信号DD
がユーザーにとって必要か不要かを示す教師信号Tをユ
ーザーから受け、前記教師信号Tと前記未読データ信号
URD[1]のキーワード数信号nofKs[1]とキーワ
ード群信号Ks[1]とを所定の手続きに従って教師デ
ータ記憶部13に書き込む未読データ出力制御部でああ
る。
当するブロックの構成を説明する。
れた教師信号Tを用いて肯定/否定メトリック信号を修
正するメトリック学習を行う部分と、肯定/否定信号か
ら必要性信号を計算するためのパラメータ、判定パラメ
ータ信号、を修正する部分からなり、各部分は学習制御
部によって制御される。
構成は次のようである。
部5に記憶された肯定メトリック信号MYと前記否定メ
トリック記憶部6に記憶された否定メトリック信号MN
とを修正するメトリック学習部である。このメトリック
学習部19は、教師データ記憶部13から前記教師デー
タTDを読み出し、学習ユニット50のベクトル生成部
1と同じ機能である学習用ベクトル生成部20で複数の
キーワードをベクトルに変換し、自己相関行列を計算す
ることで、肯定/否定メトリック信号を修正する。
成は次のようである。
部221と学習用否定信号計算部222とからなる学習
用スコア計算部である。この学習用スコア計算部におい
て、221は学習用ベクトル生成部20からの学習用ベ
クトル信号を受け、学習用肯定信号LSYを計算する学
習用肯定信号計算部、222は学習用ベクトル生成部2
0からの学習用ベクトル信号を受け、学習用否定信号L
SNを計算する学習用否定信号計算部である。21は学
習制御部14からの判定パラメータ学習制御信号PLC
を受けて所定の方法で判定パラメータ記憶部8の判定パ
ラメータ信号を書き換える判定面学習部、14は学習開
始信号LSを受けてスイッチ16、17、18とメトリ
ック学習部19と学習用ベクトル生成部20と学習用ス
コア計算部22と学習用否定信号計算部23と判定面学
習部21とを制御する学習制御部である。
について、各ユニットごとに図面を用いてその動作を説
明する。
例は、肯定メトリック信号MYと否定メトリック信号M
Nとを(nofDCK×nofDCK)零行列、未読データ記憶部1
0の未読データURD[i]の全ての必要性信号N
[i](i=1,・・・,nofURD)を使用するハー
ドウエアが表現可能な最小の値Vmin、教師データ記
憶部13の教師データTD[j]の教師信号T[j]を
全て−1とした状態である。
の動作を説明する。まず、情報データ入力端子100か
ら情報データDが入力され、キーワード数信号入力端子
101から情報データに付けられたキーワードの個数を
表すキーワード数信号nofKsが入力され、キーワード信
号入力端子102から複数のキーワードであるキーワー
ド群信号Ks=(K[1],K[2],・・・,K[no
fKs])が入力される。
号Ksは、文字列の集まりからベクトル信号Vへと変換
される。この変換によって、キーワード群信号の類似性
をベクトルの距離として計算できるようになる。ベクト
ル生成部1の動作を図3に示すフローチャートを参照し
ながら説明する。まず、キーワード数信号nofKsとキー
ワード群信号Ksを受けると(図3ステップ(イ))、
内部のベクトル信号V=(V[1],V[2],・・
・,V[nofDic])を(0,0,・・・,0)に、キー
ワードカウンタ信号iを1にセットする(同図ステップ
(ロ)、(ハ))。次に、辞書カウンタ信号jを0セッ
トした後辞書カウンタ信号jを1だけ増やす(同図ステ
ップ(ニ))。
Kを有する辞書記憶部2から辞書カウンタjが指定する
キーワードと数字からなる符号辞書信号DCK[j]を
読み出し、符号辞書信号DCKの文字列部分W[j]と
i番目のキーワード信号K[i]とを比較する(同図ス
テップ(ホ))。両者が等しくない場合には、辞書カウ
ンタjを1だけ増やす(同図ステップ(ヘ))。両者が
一致するか、辞書カウンタjの値が辞書記憶部2に格納
された符号辞書信号の個数nofDiCと等しくなるまで図3
ステップ(ホ)〜(ト)の処理を繰り返す(同図ステッ
プ(ト))。
が見つかると、ベクトル信号のj番目の成分V[j]を
1にし(同図ステップ(チ))、キーワードカウンタ信
号iを1だけ増やす(同図ステップ(リ))。以下、同
様の処理をキーワードカウンタ信号iがキーワード数信
号nofKsより大きくなるまで実行する(同図ステップ
(ヌ))。
字列信号からなるキーワード信号の集合体であるキーワ
ード群信号Ksは、0と1でコード化されたnofDCK個の
成分を持ったベクトル信号Vに変換される。
群信号Ksに過去にユーザーの必要とした情報に含まれ
ていたキーワードが数多く含まれる場合に、大きな値と
なる肯定信号SYを計算する。この目的のために、肯定
信号計算部31は、前記ベクトル信号Vを受けて、肯定
メトリック記憶部5から肯定メトリック信号MYを読み
出し、肯定信号SYを
Ksに過去にユーザーの不要とした情報に含まれていたキ
ーワードが数多く含まれる場合に、大きな値となる否定
信号SNを計算する。この目的のために、否定信号計算
部32は、否定メトリック記憶部6から否定メトリック
信号MNを読み出し、否定信号SNを
信号MNは、後述するようにキーワード群信号Ksとユ
ーザーの応答に基づいて決められる。本発明では、この
ように計算された肯定信号SYと否定信号SNを用い
て、図9に示したように縦軸に肯定信号SYをとり横軸
に否定信号SNをとった2次元空間上の1点に、情報デ
ータDを対応させることができる。この2次元空間にお
ける情報データDの分布は、ユーザーが必要とするもの
(○で表示)は主に左上部に分布し、ユーザーが不要と
するもの(×で表示)は主に右下部に分布するようにな
る。したがって、図10に示したように適切な係数Cを
定めることにより、ユーザーが必要とる情報データDと
不要な情報データDとを分離できる。
計算される必要性信号Nは、上述の2次元空間で左上に
ある程、すなわち、必要性の高いと予測される情報デー
タDほど大きな値となる。したがって、必要性信号Nの
大きい順に情報データDを並べて提示すれば、ユーザー
は必要な情報を効率よく手に入れることができる。必要
性信号Nと直交する方向の信頼性信号Rは、大まかには
キーワード群信号Ksに含まれていたキーワードのうち
どのくらいのキーワード信号が辞書に含まれていたかを
示す信号である。したがって、この信頼性信号Rの大き
さは、情報フィルタが計算した必要性信号Nがどれだけ
信頼できるのかを示す。
算部31から出力される前記肯定信号SYと前記否定信
号計算部32から出力される前記否定信号SNとを受
け、判定パラメータ記憶部8から判定パラメータ信号C
を読み出し、過去必要であった情報についていたキーワ
ードが多数あり、不要であった情報についていたキーワ
ードがほとんどない時に大きな値となる必要性信号Nを N=SY−C・SN と計算し、信頼性信号Rを R=C・SY+SN と計算する。
4に示したフローチャートを参照しながら説明する。ま
ず、それぞれの入力端子から前記情報データDと前記キ
ーワード数信号nofKsと前記キーワード群信号Ksと受
け、必要性計算部7から前記必要性信号Nと前記信頼性
信号Rとを受け、未読データ部指示端子110から出力
する未読データ処理信号WIを0から1に変える(図4
ステップ(イ))。次に、i=1とし(同図ステップ
(ロ))、未読データ記憶部10に記憶された未読デー
タURD[i]の必要性信号N[i](i=1,・・
・,nofURD)を順次読み出し、前記必要性信号N
と比較し(同図ステップ(ハ))、前記必要性信号Nが
未読データURD[i]の必要性信号N[i]より大き
くなる(N≧N[i])最初の未読データの番号i1を
検出する(同図ステップ(ニ)(ホ))。
nofURD と置き換え(同図ステップ(ヘ)〜(リ))、その後、
i1番目の未読データURD[i1]を N[i1] =N R[i1] =R nofKs[i1] =nofKs Ks[i1] =Ks D[i1] =D と前記必要性信号N等で置き換える(同図ステップ
(ヌ))。この置き換えが終了すると、未読データ部指
示端子110から出力する未読データ部指示信号WIを
0に戻し(同図ステップ(ル))、処理を終了する。
ザーの応答(教師信号T)を付加して教師データ信号T
Dをつくるインターフェースユニット51について説明
する。インターフェースユニット51の動作を図5に示
したフローチャートを参照しながら説明する。
ら、データ読み出し開始信号DOが入力される(図5ス
テップ(イ))。未読データ出力制御部11は、前記未
読データ記憶部10から1番目の未読データURD
[1]を読み出し(同図ステップ(ロ))、未読データ
の必要性信号N[1]が最小値Vminより大きい場合
には、未読データ信号URD[1]の情報信号D[1]
を表示情報信号DDとしてデータ表示端子104に出力
し、待機する(同図ステップ(ハ)、(ニ))。未読デ
ータの必要性信号N[1]が最小値Vminに等しい場
合には、表示情報信号DDを「データなし」としてデー
タ表示端子104に出力し、待機する(同図ステップ
(ホ))。
(図示せず)に表示された表示情報信号DDを見て、そ
れが必要な情報である場合には教師信号T=1、必要で
ない場合には教師信号T=0、処理を終了する場合には
教師信号T=−1として、教師信号入力端子105に返
す(同図ステップ(ヘ))。教師信号T=−1の場合、
処理を終了し、教師信号T≠−1の場合には(同図ステ
ップ(ト))、未読データ出力制御部11は、教師デー
タ記憶部13の(数2)で表わされる教師データを TD[i]=TD[i−1], i=2,・・・,no
fTD と置き換え(同図ステップ(ル))、1番目の教師デー
タTD[1]を前記教師信号Tと前記未読データのキー
ワード数信号nofKs[1]とキーワード群信号Ks
[1]とを用いて T[1] =T TnofKs[1] =nofKs[1] TKs[1] =Ks[1] と置き換え(同図ステップ(ル)、(ヲ))、前記未読
データ記憶部10の未読データURDを URD[i]=URD[i+1], i=1,・・・,
(nofURD−1) とし(同図ステップ(ワ)、(カ))、nofURD番目の未
読データの必要性信号をN[nofURD]=(最小値Vmi
n)とする(同図ステップ(ヨ)、(タ)、(レ))。
6〜図8に示したフローチャートを参照しながら説明す
る。
フローチャート示し、詳しく説明する。
子106から学習開始信号LSが入力され、学習制御部
指示信号出力端子107から出力される学習制御部指示
信号LIを0から1に変え(図6ステップ(イ))、処
理中を示す。次に、スイッチ16とスイッチ17とスイ
ッチ18とをメトリック学習部19と学習用ベクトル生
成部20が接続する様に切り替える(同図ステップ
(ロ))。
トリック学習部19を動作し(同図ステップ(ハ)、判
定面学習部21を動作させた後(同図ステップ
(ニ))、LIを0として(同図ステップ(ホ))、処
理を終了する。
応答(教師信号T)とキーワード群信号Ksとを用い
て、肯定/否定メトリック信号を修正する動作について
図7を用いて説明する。
ローチャートであり、同図において、前記学習制御部1
4からメトリック学習制御信号MLCを受けた(図7ス
テップ(イ))メトリック学習部19は、肯定メトリッ
ク記憶部5から肯定メトリック信号MYを、否定メトリ
ック記憶部6から否定メトリック信号MNをそれぞれ読
み出す。
タカウンタcの値を1にする(同図ステップ(ロ))。
次に教師データ記憶部13からc番目の教師データ信号
TD[c]を読み出し(同図ステップ(ハ))、教師デ
ータTD[c]の教師信号T[c]を調べる。前記教師
信号T[c]が−1でない場合(T≠−1)には(同図
ステップ(ニ))、教師データTD[c]のキーワード
数信号TnofKs[c]とキーワード群信号TKs[c]
とを出力する(同図ステップ(ホ))。前記教師データ
TD[c]のキーワード数信号TnofKs[c]とキーワ
ード群TKs[c]とを受けた学習用ベクトル生成部2
0は、前述の情報フィルタリングユニット50のベクト
ル生成部1と同様の動作を行い、学習用ベクトル信号L
Vを出力する(同図ステップ(ヘ))。メトリック学習
部19は、前記学習用ベクトル信号LVを受け、前記教
師データTD[c]の教師信号T[c]がT=1である
場合には(同図ステップ(ト))、肯定メトリック信号
MYを MY[i][j]=MY[i][j]+LV[i]・L
V[j] (ここで、i,j=1〜nofDiC)と修正する(同
図ステップ(チ))。
は、ユーザーが必要とした情報データDについていたキ
ーワード信号(複数)に対して大きな値を持つようにな
る。その結果、前述の肯定信号SYが、ユーザーが必要
とする情報データDに対して大きくなるようになる。否
定メトリック信号MNも以下のように同様の処理がなさ
れる。
[c]がT=0である場合には、否定メトリック信号M
Nを MN[i][j]=MN[i][j]+LV[i]・L
V[j] (ここで、i,j=1〜nofDiC)と修正する(同
図ステップ(リ))。
作を、教師データTD[c]の教師信号T[c]がT
[c]=−1になるかまたはc=nofTDとなるまで
繰り返す。T[c]=−1またはc=nofTDとなる
と(同図ステップ(ヲ))、メトリック学習の処理を終
了し、メトリック学習制御信号MLCを学習制御部14
に送る。
からのメトリック学習制御信号MLCを受けて、スイッ
チ16を学習用ベクトル生成部20とスコア計算部22
とが接続するように切り替え、スイッチ17とスイッチ
18を学習用ベクトル生成部20と判定面学習部21と
が接続するように切り替える。学習制御部14は、判定
面学習制御信号PLCを判定面学習部21に送る。
用いて詳しく説明する。
に、肯定信号SYと否定信号SNを用いて2次元空間上
に表現されたユーザーが必要とする情報データDとユー
ザーが不要とする情報データDとをもっともよく分離す
る係数Cを求めるものである。
ャートに従って詳しく説明する。
けて(図8ステップ(イ))、教師データカウンタcの
値を1にする(同図ステップ(ロ))。教師データ記憶
部13からc番目の教師データ信号TD[c]を読み出
し(同図ステップ(ハ))、教師データTD[c]の教
師信号T[c]を調べる(同図ステップ(ニ))。前記
教師信号T[c]が−1でない場合(T≠−1)には、
教師データTD[c]のキーワード数信号TnofKs
[c]とキーワード群信号TKs[c]とを出力する
(同図ステップ(ホ))。前記教師データTD[c]の
キーワード数信号TnofKs[c]とキーワード群TKs
[c]とを受けた学習用ベクトル生成部20は、前述し
た情報フィルタリングユニット50のベクトル生成部1
と同様の動作を行い、学習用ベクトル信号LVを出力す
る。
フィルタリングユニット50のスコア計算部3と同様の
動作を行い、学習用肯定信号LSY[c]と学習用否定
信号LSN[c]とを出力し、判定面学習部21がそれ
を受ける(同図ステップ(ヘ))。前記学習用肯定信号
LSY[c]と前記学習用否定信号LSN[c]と教師
データTD[c]の教師信号T[c]と判定面学習用信
号TC[c]=(T[c],LSN[c],LSY
[c])を内部の記憶素子に記憶する(同図ステップ
(ト))。そして、教師データカウンタの値をc=c+
1と1だけ増やす(同図ステップ(チ))。
を、教師データTD[c]の教師信号T[c]がT
[c]=−1になるかまたはc=nofTD+1となる
まで繰り返す(同図ステップ(リ))。T[c]=−1
またはc=nofTDとなると、学習用肯定信号LSY
[c]計算等の処理を終了する。
子に記憶された判定面学習用信号TC[c](c=1、
・・・)は、横軸をLSN[c]、縦軸をLSY[c]
とし、T[c]=1を○、T[c]=0を×で示すと、
図9に示すような分布となる。これらのうち、教師信号
T[c]=1であるものと前記教師信号T[c]=0で
あるものとが、図10に示したように最もよく分離でき
る判定パラメータCを、山登り法によって計算する(同
図ステップ(ヌ))。次に前記判定パラメータCを判定
パラメータ記憶部8に書き込み、学習制御部14に判定
面学習制御信号PLCを送り(同図ステップ(ル))、
処理を終了する。学習制御部14は、判定面学習部21
から判定面学習制御信号PLCを受け、学習制御部指示
信号は待機中を示す値にし、処理を終了する。
リック信号を用いてキーワード群信号を肯定信号SYと
否定信号SNとで表される2次元空間上で、ユーザーが
必要とする情報は主に左上に、不要な情報は右下に分布
するようになる。したがって、上記ように適切な係数C
を用いて必要性信号をN=SY−C・SNとすれば、必
要性信号は、ユーザーが必要とする情報に対して大きな
値をとるようになる。
て、ここでは、山登り法を採用したが、判定面と学習用
必要性信号LNと学習用信頼性信号LRとの距離に基づ
いて構成されるコスト関数
トン法、挟み撃ち法などで求める方法であってもよい。
リック信号MNの学習を忘却の効果を入れた MY[i][j]=α・MY[i][j]+LV[i]
・LV[j] MN[i][j]=β・MN[i][j]+LV[i]
・LV[j] を用いてもよい結果が得られる。(ここで、αとβと
は、1より小さい正の数)さらに、文献「情報処理学会
技術報告、自然言語処理101−8(1994.5.2
7)」などに記載された文書からキーワード群信号とキ
ーワード数信号を生成するキーワード生成部を付加する
構成をとれば、キーワードが与えられていない情報に対
しても適用できる情報フィルタ装置を構成することがで
きる。
イトルを構成する単語をもってキーワードとし、キーワ
ード数信号とキーワード群信号を生成してもよい。
番号など分類記号を含むようにもしても、本発明の構成
を変更する必要はなく、よい結果をえることができる。
ータURDを1つずつ提示する場合について示したが、
表示装置(図示せず)の大きさによっては、複数の未読
データURDを同時に表示し、使用者が複数表示された
どの未読データに対して応答したのかが正しく情報フィ
ルタ装置に伝えられるような構成を取ることは容易であ
る。
ローチャートのト、チ、リに示したように、ユーザーの
応答とキーワードとの関係をキーワードの同時出現に注
目した肯定メトリック信号MY、否定メトリック信号に
反映させ、この2つのメトリック信号を用いてキーワー
ド群信号を肯定信号SYと否定信号SNとに変換するこ
とで、キーワードという記号情報を距離の定義された空
間に射影したものである。これによって、キーワード群
の遠近を距離というアナログ尺度で評価することができ
るようになる。これを利用することにより、従来の技術
では必要か不要かの二者択一的な判定しかできなかった
必要性の評価が、ユーザーの必要性の順番に並べるとい
ったことが可能になる。
によれば、ユーザーからの教師信号に基づいた学習によ
って、ユーザーの必要とする情報に対しては、必要性信
号が大きな値を取るようになり、その結果、表示装置等
のインターフェースユニットには、ユーザーにとって必
要性が高い情報が優先的に表示されるようになる。
施の形態について、図面を参照しながら説明する。実施
の形態2は、実施の形態1の構成に辞書学習部を付加
し、辞書記憶部2に記憶された符号辞書信号DCKが使
用者に適応するように更新し、かつ肯定メトリック信号
MYと否定メトリック信号MNを単純な頻度分布に対応
するキーワードの自己相関行列から、情報が必要/不要
の出現するキーワードの確率分布を考慮したものへと改
良したものである。
ルタ装置のブロック結線図を示すが、前述した本発明の
実施の形態1の情報フィルタ装置のブロック結線図と異
なる構成について詳細に説明する。
らの辞書学習信号DLCを受け辞書記憶部2の符号辞書
信号DCKを更新する辞書学習部、24は文字列Wと数
字Cがキーワード群信号Ksに含まれていたときに使用
者が情報データDを必要と解答した回数を示す肯定回数
PYと文字列Wがキーワード群信号Ksに含まれていた
ときに使用者が情報データDを不要と解答した回数を示
す否定回数PNとからなる表をnofFDCK個有する適応符
号辞書信号
は使用者が必要と答えた回数を示す全肯定回数信号NY
と不要と答えた回数を示す全否定回数信号NNを記憶す
る回数記憶部、26は肯定メトリック更新用の1次肯定
メトリック信号MY1を記憶する1次肯定メトリック記
憶部、27は否定メトリック更新用の1次否定メトリッ
ク信号MN1を記憶する1次否定メトリック記憶部、2
8は前記肯定回数信号と前記否定回数信号と前記1次肯
定メトリック信号MY1と前記1次否定メトリック信号
MN1とから改良された肯定メトリック信号MYと否定
メトリック信号MNを計算してそれぞれを肯定メトリッ
ク記憶部5と否定メトリック記憶部6に書き込むKDメ
トリック学習部である。
について、図面を用いて動作を説明する。ただし、動作
が実施の形態1と同様の個所は説明を省略する。
例は、肯定メトリック信号MYと否定メトリック信号M
Nとを(nofDCK×nofDCK)零行列、未読データ記憶部1
0の未読データURD[i]の全ての必要性信号N
[i](i=1,・・・,nofURD)を使用するハー
ドウエアが表現可能な最小の値Vmin、教師データ記
憶部13の教師データTD[j]の教師信号T[j]を
全て−1、適応符号辞書信号の文字列Wを全てブラン
ク、数字Cを符号辞書信号FDCKの上から順に1、
2、・・・・、nofFDCK、肯定回数PYと否定回数PN
を0、適応符号辞書に対応して、符号辞書の文字列も全
てブランクとした状態である。
動作を説明する。
載した通りの動作を情報フィルタリングユニット50は
行い、入力されたキーワード数信号nofKs、キーワード
群信号Ks、情報データDから必要性信号N、信頼性信号
Rをともに0と計算し、未読データ記憶部10に格納す
る。
施の形態1と同じ動作を行い、使用者の応答が付いた教
師データTDを教師データ記憶部13に送る。
始信号入力端子106から学習開始信号LSが入力され
る。学習制御部14は、前記学習開始信号LSを受け
て、学習制御部指示信号出力端子107から出力される
学習制御部指示信号LIを0から1に変え、処理中を示
す。更に、辞書学習信号DLCを辞書学習部23に送
る。
照しながら辞書学習部23の動作を説明する。まず、辞
書学習信号DLCを受けて(図12ステップ(イ))、
適応符号辞書記憶部24から適応符号辞書FDCKを最
大nofFDCKtmp個の適応符号信号を記憶できる適応符号信
号バッファに読み込み、回数記憶部25から全肯定回数
信号NYと全否定回数信号NNとを、1次肯定メトリッ
ク記憶部26から1次肯定メトリック信号MY1を、1
次否定メトリック信号記憶部27から1次否定メトリッ
ク信号MN1を読み出す(同図ステップ(ロ))。次に
内部の教師データカウンタcの値を1にし(同図ステッ
プ(ハ))、教師信号記憶部13から教師データTD
[c]を読み出し(同図ステップ(ニ))、その教師信
号T[c]が−1であるか否かを判定する(同図ステッ
プ(ホ))。
う。まず、内部のキーワード数カウンタiの値を1にセ
ットし(同図ステップ(ヘ))、適応符号辞書カウンタ
jの値を1にセットする(同図ステップ(ト))。次
に、前記文字列W[j]がブランクであるかないかを判
定し(同図ステップ(チ))、ブランクである場合に
は、前記文字列W[j]を前記キーワード信号TK
[i]で置き換える(同図ステップ(リ))。ブランク
でない場合には、教師データTD[c]のi番目のキー
ワード信号TK[i]とj番目の適応符号辞書信号FD
CK[j]の文字列W[j]とを比較する(同図ステッ
プ(ヌ))。
たは、ブランクでなくかつ前記キーワード信号TK
[i]と前記文字列W[j]が一致した場合、T[c]
の値に応じて以下の処理を行う。T[c]=1の場合
(同図ステップ(ル))、全肯定信号NYに1を加え
(同図ステップ(ヲ))、適応符号辞書信号FDCK
[j]の肯定回数PY[j]に1を加える(同図ステッ
プ(ワ))。T[c]≠1、これはT[c]=0の場合
であるが、全否定信号NNに1を加え(同図ステップ
(カ))、適応符号辞書信号FDCK[j]の否定回数
PN[j]に1を加える(同図ステップ(ヨ))。
ーワード信号TK[i]と前記文字列W[j]が一致し
ない場合、適応符号辞書カウンタjの値を1増やす(同
図ステップ(タ))。適応符号辞書カウンタjの値が適
応符号辞書信号バッファに記憶できる適応符号信号の数
に1を加えた値nofFDCKtmp+1と比較する(同図ステップ
(レ))。適応符号辞書カウンタjの値が、nofFDCKtmp
+1以下の場合、文字列W[j]がブランクかどうかの判
定に戻る。
タiの値を1だけ増やす(同図ステップ(ソ))。
師データTD[c]のキーワード数信号TnofKSに1を加
えた値TnofKs+1と比較して小さい場合(同図ステップ
(ツ))、辞書カウンタjを1にセットし、同様の処理
を行う。それ以外の場合、教師データカウンタcの値を
1だけ増やす(同図ステップ(ネ))。教師データカウ
ンタcの値と教師データ数nofTDに1を加えた値nofTD+1
とを比較し(同図ステップ(ナ))、教師データカウン
タcの値が小さい場合、次の教師データTD[c]を読
み出し同様の処理を行う。
して行われる。
辞書信号FDCK[j]に対し、キーワードコスト信号
KDを計算する。このキーワードコスト信号は、文字列
W[j]がキーワードとして有効であるか否かを判断す
るために用いられる量である。
出現する確率 NN/(NY+NN) と比較して、文字列W[j]が付いている情報データD
が使用者にとって不要である場合の確率 PN[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであれば、
文字列W[j]は、情報データDが使用者にとって不要
と判定する上で有効である。同様に、使用者の必要な情
報データDが出現する確率 NY/(NY+NN) と比較して、文字列W[j]が付いている情報データD
が使用者にとって必要である場合の確率 PY[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであれば、
文字列W[j]は、情報データDが使用者にとって必要
と判定する上で有効である。
反映している量で有ればなんでもよいが、好ましい例の
一つとして、カルバックダイバージェンスと呼ばれる
では、本情報フィルタ装置の初期状態など、全肯定回数
信号NY、全否定回数信号NN、肯定回数PY[j]、
否定回数PN[j]が0のときには、log()の計算がで
きない、 PY[j]+PN[j]≒1 を満たす適応符号辞書信号FDCK[j]のキーワード
コスト信号を過大評価する等不適切な場合がある。これ
を回避する好ましい実施の形態の一つは、キーワードコ
スト信号を
り算、log0を避けるための小さな正の値を持つパラメー
タである。パラメータPCは、3程度の値とするとよ
い。
文字列W[j]と肯定回数PY[j]と否定回数PN
[j]とをキーワードコスト信号KDの大きい順に並べ
替える(同図ステップ(ラ))。このとき、適応符号辞
書FDCK[j]の数字C[j]には、最初の並び順が
残っている。これを利用して、1次肯定メトリック信号
MY1とC[j]から、C[i]、C[j]の値がとも
に符号辞書DCKの数nofDCKより小さい場合、 M[i][j]=MY1[C[i]][C[j]],
i,j=1、・・nofDCK その他の場合は、i=jの場合は、 M[i][i]=PY[C[i]], i,=1、・・
nofDCK i≠jの場合は、 M[i][j]=0, i,j=1、・・nofDCK とした上で、 MY1[i][j]=M[i][j]、i,j=1、・
・nofDCK と1次肯定メトリック信号MY1の置き換えを行う。1
次否定メトリック信号MN1に対しても、同様の置き換
えを行う(同図ステップ(ム))。
応符号辞書FDCK[j]の数字C[j]を C[j]=j、j=1、・・・、nofFCKtmp と置き換える。
は、適応符号辞書バッファ内の適応符号辞書FDCKの
上位nofDCK個の文字列W[j]と数字C[j]を辞書記
憶部2に書き込み、適応符号辞書バッファ内の適応符号
辞書信号FDCK[j]の上位nofFDCK個を適応符号辞
書記憶部24に書き込み、全肯定回数信号NYと全否定
回数信号NNを回数記憶部25に書き込み、1次肯定メ
トリック信号MY1を1次肯定メトリック信号記憶部2
6に1次否定メトリック信号MN1を1次否定メトリッ
ク信号記憶部27に書き込む(同図ステップ(ウ))。
14に戻して(同図ステップ(ヒ))、処理を終了す
る。
6とスイッチ17とスイッチ18とをメトリック学習部
19と学習用ベクトル生成部20が接続する様に切り替
える。前記学習制御部14は、KDメトリック学習部2
8にメトリック学習制御信号MLCを送る。
たKDメトリック学習部28は、まず、1次肯定メトリ
ック記憶部26から1次肯定メトリック信号MY1を、
1次否定メトリック記憶部27から1次否定メトリック
信号MN1をそれぞれ読み出す。
データカウンタcの値を1にする。
ータ信号TD[c]を読み出し、教師データTD[c]
の教師信号T[c]を調べる。前記教師信号T[c]が
−1でない場合(T≠−1)には、教師データTD
[c]のキーワード数信号TnofKs[c]とキーワード
群信号TKs[c]とを出力する。前記教師データTD
[c]のキーワード数信号TnofKs[c]とキーワード
群TKs[c]とを受けた学習用ベクトル生成部20
は、前述した実施の形態1の情報フィルタリングユニッ
ト50のベクトル生成部1と同様の動作を行い、学習用
ベクトル信号LVを出力する。KDメトリック学習部2
8は、前記学習用ベクトル信号LVを受け、前記教師デ
ータTD[c]の教師信号T[c]がT=1である場合
には、1次肯定メトリック信号MY1を MY1[i][j]=MY1[i][j]+LV[i]
・LV[j] (ここで、i,j=1〜nofDiC)と修正する。前
記教師データTD[c]の教師信号T[c]がT=0で
ある場合には、1次否定メトリック信号MN1を MN1[i][j]=MN1[i][j]+LV[i]
・LV[j] (ここで、i,j=1〜nofDiC)と修正する。教
師データカウンタの値を c=c+1 と1だけ増やす。
の動作を、教師データTD[c]の教師信号T[c]が
T[c]=−1になるかまたはc=nofTDとなるま
で繰り返す。T[c]=−1またはc=nofTDとな
ると、1次肯定メトリック信号MY1と1次否定メトリ
ック信号MN1の学習を終える。
NYと全否定回数信号NNを読み出し、1次肯定メトリ
ック信号MY1と1次否定メトリック信号MN1とを用
いて、肯定メトリック信号MYを計算する。
Y、否定メトリック信号MNは、キーワードコスト信号
KDと同様、計算される肯定信号SYと否定信号SN
が、使用者の不要な情報データDが出現する確率 NN/(NY+NN) と比較して、文字列W[j]が付いている情報データD
が使用者にとって不要である場合の確率 PN[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであり、使
用者の必要な情報データDが出現する確率 NY/(NY+NN) と比較して、文字列W[j]が付いている情報データD
が使用者にとって必要である場合の確率 PY[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであるとい
った性質を持っていれば、なんでもよい。これを満たす
好ましいのは、肯定メトリック信号MYを
log0を避けるための小さな正の値を持つパラメータであ
る。
号MY1を1次肯定メトリック信号記憶部26に、更新
された1次否定メトリック信号MN1を1次否定メトリ
ック信号記憶部27に、新たに計算れた肯定メトリック
信号MYを肯定メトリック記憶部5へ、新たに計算され
た否定メトリック信号MNを否定メトリック記憶部6へ
書き込む。以上で、KDメトリック学習部28は、メト
リック学習の処理を終了し、メトリック学習制御信号M
LCを学習制御部14に送る。
28からのメトリック学習制御信号MLCを受けて、ス
イッチ16を学習用ベクトル生成部20とスコア計算部
22とが接続するように切り替え、スイッチ17とスイ
ッチ18を学習用ベクトル生成部20と判定面学習部2
1とが接続するように切り替える。学習制御部14は、
判定面学習制御信号PLCを判定面学習部21に送る。
と全く同じであるので、説明は繰り返さない。
部2の符号辞書が空でなくなるので、情報フィルタリン
グユニット50から出力される必要性信号N、信頼性信
号Rは、0でなくなり、使用者の必要性の高い情報デー
タが、未読データ記憶部10の上位に書き込まれるよう
になる。
用者が必要とする情報か不要かを判定するために有効な
キーワードが優先的に辞書記憶部2に記憶されるように
なり、小規模な辞書であっても、精度の高い情報フィル
タリングが可能となる。
て、ここでは、山登り法を採用したが、実施の形態1と
同様、判定面と学習用必要性信号LNと学習用信頼性信
号LRとの距離に基づいて構成されるコスト関数を最大
にする判定面パラメータCをニュートン法、挟み撃ち法
などで求める方法であってもよい。さらに、簡便な方法
として、 C=tanθi ここで、 θi=0.5・π(i/90) i=1,・・・,90 の中から、T[c]=1である情報とT[c]=0であ
る情報をもっともよく分離できるCを選ぶと言う方法も
考えることができる。
次否定メトリック信号MN1の学習を忘却の効果を入れ
た MY1[i][j]=α・MY1[i][j]+LV
[i]・LV[j] MN1[i][j]=α・MN1[i][j]+LV
[i]・LV[j] を用いてもよい結果が得られる。(ここで、αは、1よ
り小さい正の数)もしくは、MY1[i][j]または
MN1[i][j]のいずれかが一定値を越えた場合
に、 MY1[i][j]=MY1[i][j]/2 MN1[i][j]=MN1[i][j]/2 として、信号のオーバーフローを防ぐように構成するこ
とは、実施上好ましい。これは、適応符号辞書信号FD
CK[j]の肯定回数PY[j]と否定回数PN
[j]、および全肯定回数信号NYと全否定回数NNに
ついても同様である。
然言語処理101−8(1994.5.27)」などに
記載された文書からキーワード群信号とキーワード数信
号を生成するキーワード生成部を付加する構成をとれ
ば、キーワードが与えられていない情報に対しても適用
できる情報フィルタ装置を構成することができる。
イトルを構成する単語をもってキーワードとし、キーワ
ード数信号とキーワード群信号を生成してもよい。
番号など分類記号を含むようにもしても、本発明の構成
を変更する必要はなく、よい結果をえることができる。
Dを一つづつ提示する場合について示したが、表示装置
(図示せず)の大きさによっては複数の未読データUR
Dを同時に表示し、使用者がどの未読データURDにつ
いて応答したのかを正しく情報フィルタ装置に伝える構
成をとることは容易である。
タの根幹は、キーワードの同時出現に注目したメトリッ
クを導入することにより、キーワードという記号情報を
距離の定義された空間に射影したことにある。これによ
って、キーワード群の遠近を距離というアナログ尺度で
評価することができるようになる。これを利用すること
により、従来の技術では必要か不要かの二者択一的な判
定しかできなかった必要性の評価が、ユーザーの必要性
の順番に並べるといったことが可能になる。
ば、ユーザーからの教師信号に基づいた学習によって、
ユーザーの必要とする情報に対しては、必要性信号が大
きな値を取るようになり、その結果、表示装置等には、
ユーザーにとって必要性が高い情報が優先的に表示され
るようになる。
又は情報通信網から所定の情報を取り出す装置であっ
て、情報を提示する情報提示手段と、提示された情報が
必要か不要かを入力する入力手段と、前記入力手段から
の入力と、前記情報に付けられたひとつまたは複数のキ
ーワード信号からなるキーワード群信号を変換したベク
トル信号とから計算された肯定メトリック信号と否定メ
トリック信号とからスコア信号を計算するスコア計算手
段とを有し、前記スコア信号を利用して情報の提示の順
序を決めることを特徴とするもので、情報をユーザーの
必要度にしたがって並べ、ユーザーに対して必要性の高
い情報から順に提供することにより、初心者にも精度の
高い情報を得ることができ、更に使用者にとって必要性
の高い情報の取り出し易い情報フィルタ装置を提供する
ことができる。
ロック結線図
略を示すブロック結線図
クトル生成部の動作を説明するフローチャート
読データ書き込み制御部の動作を説明するフローチャー
ト
読データ出力制御部の動作を説明するフローチャート
習制御部の動作を説明するフローチャート
トリック学習部の動作を説明するフローチャート
定面学習部の動作を説明するフローチャート
定面学習部の動作を説明するための図
判定面学習部の動作を説明するための図
ブロック結線図
辞書学習部の動作を説明するフローチャート
Claims (6)
- 【請求項1】 情報記憶媒体又は情報通信網から所定の
情報を取り出す装置であって、情報を提示する情報提示
手段と、提示された情報が必要か不要かを入力する入力
手段と、前記入力手段からの入力と、前記情報に付けら
れたひとつまたは複数のキーワード信号からなるキーワ
ード群信号を変換したベクトル信号とから計算された肯
定メトリック信号と否定メトリック信号とからスコア信
号を計算するスコア計算手段とを有し、前記スコア信号
を利用して情報の提示の順序を決めることを特徴とする
情報フィルタ装置。 - 【請求項2】 肯定メトリック信号は、入力手段から入
力される信号が必要な場合のベクトル信号の自己相関行
列であり、否定メトリック信号は、入力手段から入力さ
れる信号が不要である場合のベクトル信号の自己相関行
列であることを特徴とする請求項1記載の情報フィルタ
装置。 - 【請求項3】 情報記憶媒体又は情報通信網から所定の
情報を取り出す方法であって、情報を提示する情報提示
ステップと、提示された情報が必要か不要かを入力する
入力ステップと、前記入力ステップからの入力と、前記
情報に付けられたひとつまたは複数のキーワード信号か
らなるキーワード群信号を変換したベクトル信号とから
計算された肯定メトリック信号と否定メトリック信号と
からスコア信号を計算するスコア計算ステップとを有
し、前記スコア信号を利用して情報の提示の順序を決め
ることを特徴とする情報フィルタ方法。 - 【請求項4】 肯定メトリック信号は、前記入力ステッ
プから入力される信号が必要な場合のベクトル信号の自
己相関行列であり、否定メトリック信号は、前記入力ス
テップから入力される信号が不要である場合のベクトル
信号の自己相関行列であることを特徴とする請求項3記
載の情報フィルタ方法。 - 【請求項5】 情報記憶媒体又は情報通信網上にある情
報について、使用者にとっての必要性を推定する装置で
あって、前記情報は情報データと一つ以上のキーワード
(文字列)を含むものであり、前記情報データを提示す
る情報提示手段と、前記提示された情報データが必要か
不要かを入力する入力手段と、前記入力手段からの入力
を用いて前記提示された情報データにつけられたキーワ
ードへのユーザの必要性を予測する値の割り振りを行う
学習手段と、前記予測値を用いて情報の必要性の評価値
を求める必要性評価手段とを有すること特徴とする情報
必要性推定装置。 - 【請求項6】 情報記憶媒体又は情報通信網上にある情
報について、使用者にとっての必要性を推定する方法で
あって、前記情報は情報データと一つ以上のキーワード
(文字列)を含むものであり、前記情報データを提示す
る情報提示ステップと、前記提示された情報データが必
要か不要かを入力する入力ステップと、前記入力ステッ
プからの入力を用いて前記提示された情報データにつけ
られたキーワードへのユーザの必要性を予測する値の割
り振りを行う学習ステップと、前記予測値を用いて情報
の必要性の評価値を求める必要性評価ステップとを有す
ること特徴とする情報必要性推定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000341564A JP3622668B2 (ja) | 1995-09-04 | 2000-11-09 | 情報フィルタ装置及び情報フィルタリング方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP22617295 | 1995-09-04 | ||
JP7-226172 | 1995-09-04 | ||
JP8-31547 | 1996-02-20 | ||
JP3154796 | 1996-02-20 | ||
JP2000341564A JP3622668B2 (ja) | 1995-09-04 | 2000-11-09 | 情報フィルタ装置及び情報フィルタリング方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23001296A Division JP3244005B2 (ja) | 1995-09-04 | 1996-08-30 | 情報フィルタ装置及び情報フィルタリング方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004155839A Division JP3736564B2 (ja) | 1995-09-04 | 2004-05-26 | データ処理装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001167132A true JP2001167132A (ja) | 2001-06-22 |
JP2001167132A5 JP2001167132A5 (ja) | 2004-09-09 |
JP3622668B2 JP3622668B2 (ja) | 2005-02-23 |
Family
ID=27287357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000341564A Expired - Lifetime JP3622668B2 (ja) | 1995-09-04 | 2000-11-09 | 情報フィルタ装置及び情報フィルタリング方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3622668B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000137731A (ja) * | 1998-11-02 | 2000-05-16 | Matsushita Giken Kk | 情報フィルタ装置及び情報フィルタリング方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3736564B2 (ja) * | 1995-09-04 | 2006-01-18 | 松下電器産業株式会社 | データ処理装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55124862A (en) * | 1979-03-19 | 1980-09-26 | Toshiba Corp | Frequency control unit |
JPH02224068A (ja) * | 1989-02-27 | 1990-09-06 | Toshiba Corp | 情報検索システム |
JPH07129593A (ja) * | 1993-09-08 | 1995-05-19 | Toshiba Corp | テキスト選定装置 |
JPH07182433A (ja) * | 1993-12-21 | 1995-07-21 | Agency Of Ind Science & Technol | 神経回路の時系列学習方法 |
-
2000
- 2000-11-09 JP JP2000341564A patent/JP3622668B2/ja not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55124862A (en) * | 1979-03-19 | 1980-09-26 | Toshiba Corp | Frequency control unit |
JPH02224068A (ja) * | 1989-02-27 | 1990-09-06 | Toshiba Corp | 情報検索システム |
JPH07129593A (ja) * | 1993-09-08 | 1995-05-19 | Toshiba Corp | テキスト選定装置 |
JPH07182433A (ja) * | 1993-12-21 | 1995-07-21 | Agency Of Ind Science & Technol | 神経回路の時系列学習方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000137731A (ja) * | 1998-11-02 | 2000-05-16 | Matsushita Giken Kk | 情報フィルタ装置及び情報フィルタリング方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3622668B2 (ja) | 2005-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3244005B2 (ja) | 情報フィルタ装置及び情報フィルタリング方法 | |
CN112163077B (zh) | 一种面向领域问答的知识图谱构建方法 | |
CN100565670C (zh) | 用于用户模型化以增强对命名实体识别的系统和方法 | |
US6327583B1 (en) | Information filtering method and apparatus for preferentially taking out information having a high necessity | |
EP1193959B1 (en) | Hierarchized dictionaries for speech recognition | |
CN109299245B (zh) | 知识点召回的方法和装置 | |
KR101511656B1 (ko) | 퍼스널 아이덴티티를 기술하는 데이터에 대한 액셔너블 속성의 애스클라이빙 | |
CN108875090B (zh) | 一种歌曲推荐方法、装置和存储介质 | |
CN108319720A (zh) | 基于人工智能的人机交互方法、装置及计算机设备 | |
JP2001515623A (ja) | コンピュータによるテキストサマリ自動生成方法 | |
WO2008032780A1 (fr) | Procédé de recherche, procédé de calcul de similarité, calcul de similarité, système d'appariement de mêmes documents et programme de ceux-ci | |
JP7141371B2 (ja) | 学習データの精練方法及び計算機システム | |
JP3344953B2 (ja) | 情報フィルタ装置及び情報フィルタリング方法 | |
JP2007148118A (ja) | 音声対話システム | |
JP2020009140A (ja) | 情報検索システム | |
JP3469302B2 (ja) | テキスト選定装置 | |
CN112084944B (zh) | 一种动态演化表情的识别方法与系统 | |
JP3244084B2 (ja) | キーワード検索式生成装置及びキーワード検索式生成方法 | |
JP3244083B2 (ja) | 適応辞書装置及び適応辞書方法 | |
JP3156703B1 (ja) | メトリック学習装置及びメトリック学習方法 | |
JPH10240762A (ja) | 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法 | |
JP2001167132A (ja) | 情報フィルタ装置及び情報フィルタリング方法 | |
JP3203203B2 (ja) | 情報フィルタ装置及び情報フィルタリング方法 | |
JP3736564B2 (ja) | データ処理装置 | |
JPH11143900A (ja) | 情報フィルタ装置及び情報フィルタリング方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040330 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040526 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040713 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040909 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041115 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071203 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081203 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101203 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101203 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111203 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111203 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121203 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121203 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |