JP3260093B2 - 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法 - Google Patents

情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法

Info

Publication number
JP3260093B2
JP3260093B2 JP04638497A JP4638497A JP3260093B2 JP 3260093 B2 JP3260093 B2 JP 3260093B2 JP 04638497 A JP04638497 A JP 04638497A JP 4638497 A JP4638497 A JP 4638497A JP 3260093 B2 JP3260093 B2 JP 3260093B2
Authority
JP
Japan
Prior art keywords
information
signal
keyword
dictionary
metric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP04638497A
Other languages
English (en)
Other versions
JPH10240762A (ja
Inventor
道 敏 樹 金
田 秀 行 吉
辺 泰 助 渡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP04638497A priority Critical patent/JP3260093B2/ja
Publication of JPH10240762A publication Critical patent/JPH10240762A/ja
Application granted granted Critical
Publication of JP3260093B2 publication Critical patent/JP3260093B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子または光等を
媒体とする記憶装置や情報通信網から必要な情報を取り
出し易くする情報フィルタ装置とデータベース再構築装
置及び情報フィルタリング方法と初期化方法に関するも
のであり、本願出願人が先に出願した特願平08−23
0012号の情報フィルタ装置を、より簡単な構成と
し、より計算を簡略化し、より好ましい初期設定方法を
実現するものである。
【0002】
【従来の技術】近年、情報フィルタ装置は、情報通信の
社会基盤の進展に伴い、情報通信網の大規模化と通信量
の著しい増大に対応する技術として、その実現が強く望
まれている。この背景には、今日、個人が処理可能な情
報量に対して、個人がアクセスできる情報量が上回るよ
うになっていることがある。このために、大量の情報の
中に必要と思う情報が埋没することが、しばしば起こ
る。
【0003】情報フィルタ装置に関連する従来技術とし
ては、特許検索などに用いられるキーワード論理式をあ
げることができる。すなわち、数十万から数百万件に及
ぶ特許情報をキーワード論理式によりフィルターリング
するものである。
【0004】
【発明が解決しようとする課題】しかしながら、キーワ
ード論理式を用いる従来の検索においては、使用者がキ
ーワードについての論理式を精度良く設定する必要があ
るので、使用者がファイリングされているデータ群の癖
(例えば、どのような条件の基に、当該データのキーワ
ードが決定されているのか等)やシステムの構造(例え
ば、キーワードがシソーラス体系のあるシステムである
か否か等)を十分に知り得ていなければ良い検索ができ
ない。このため、初心者には精度の高い情報フィルタリ
ングを行うことができないという課題があった。
【0005】また、情報フィルタリングした結果もキー
ワードについての論理式に適合するという評価があるだ
けであり、たまたまキーワードでは合致しているが、内
容は求めているものとは異なるケースであったり、ある
いは多くの検索結果から使用者にとって必要度の高い情
報をその結果から順に取り出すことは容易ではない。
【0006】本発明は、上記従来の課題を解決するもの
であり、初心者にも精度の高い情報フィルタリングがで
き、かつ使用者にとって必要性の高い情報を取り出し易
い情報フィルタ装置とデータベース再構築装置及び情報
フィルタリング方法と初期化方法を提供することを目的
とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明の情報フィルタ装置は、情報に割り振られた
複数のキーワードをベクトルに変換する手段、前記ベク
トルと使用者がどんな情報を必要とし不要としたかを表
現した行列を用いてスコアを計算する手段、前記スコア
から必要性と信頼性を計算する手段、及び前記必要性の
大きい順に情報を並べ変える未読データ書き込み制御手
段からなる情報フィルタリングユニットと、必要性の大
きい順に情報を提示し、提示した情報が必要か不要かと
いうユーザーの評価を入力できるインタフェースユニッ
トと、ユーザーの評価と前記複数のキーワードとからス
コア計算に用いる行列を修正する学習ユニットとを含む
構成を有している。
【0008】このような構成によって、複数のキーワー
ドは、距離の定義ができない記号から、使用者の必要度
を反映したメトリックを用いて距離を定義できるベクト
ル表現へと変換され、使用者の必要度を定量化すること
ができ、使用者は必要性の高い情報から順に情報を得る
ことができるようになる。
【0009】
【発明の実施の形態】本発明の請求項1に記載の発明
は、電子又は光を媒体とする情報記憶媒体又は情報通信
網から所定の情報を取り出すために、少なくとも入力端
子からの入力を用いて情報の提示の順序付けの仕方を変
えることを特徴とする情報フィルタ装置であって、情報
の提示の順序付けのために、情報が必要か否かを示す信
号と前記情報に付けられたキーワード検索式を含む一つ
または複数のキーワード信号とを用いて辞書の内容を更
新する適応辞書手段と、一つまたは複数のキーワード信
号を前記適応辞書手段の辞書を用いてベクトル信号に変
換する手段と、必要な情報から構成される肯定メトリッ
ク信号、不要な情報から構成される否定メトリック信号
及び前記ベクトル信号を用いて肯定スコア信号及び否定
スコア信号を計算する手段と、前記肯定スコア信号と前
記否定スコア信号とから必要性信号として計算する手段
とを備え、前記必要性信号の大きさにより情報の提示の
順序を決めることを特徴とする情報フィルタ装置であ
り、必要性の高い順に情報をユーザーに提示できるとい
う作用を持つ。
【0010】本発明の請求項2に記載の発明は、電子又
は光を媒体とする情報記憶媒体又は情報通信網から所定
の情報を取り出すために、少なくとも入力端子からの入
力を用いて情報の提示の順序付けの仕方を変えることを
特徴とする情報フィルタ装置であって、情報の提示の順
序付けのために、情報が必要か否かを示す信号と前記情
報に付けられた一つまたは複数のキーワード信号とを用
いて辞書の内容を更新する適応辞書手段と、一つまたは
複数のキーワード信号を前記適応辞書手段の辞書を用い
てベクトル信号に変換する手段と、必要な情報から構成
される肯定メトリック信号、不要な情報から構成される
否定メトリック信号及び前記ベクトル信号を用いて肯定
スコア信号及び否定スコア信号を計算する手段と、前記
肯定スコア信号と前記否定スコア信号との差を必要性信
号として計算する手段とを備え、肯定メトリック信号と
否定メトリック信号はそれぞれ行列であり、前記行列の
(ij)成分は、必要とされた情報の頻度と不要とされ
た情報の頻度と、辞書のi番目のキーワード信号と辞書
のj番目のキーワード信号が同時に含まれた情報が必要
とされた頻度と、辞書のi番目のキーワード信号と辞書
のj番目のキーワード信号が同時に含まれた情報が不要
とされた頻度とから計算されることを特徴とする情報フ
ィルタ装置であり、必要性の高い順に情報をユーザーに
提示できるという作用を持つ。
【0011】本発明の請求項3に記載の発明は、行列の
(ij)成分は、情報が必要であるか不要であるかを示
す確率分布と、辞書のi番目のキーワード信号と辞書の
j番目のキーワード信号が同時に含まれた情報が必要で
あるか不要であるかを示す確率分布との違いを定量的に
評価する信号であることを特徴とする請求項2記載の情
報フィルタ装置であり、必要性の高い順に情報をユーザ
ーに提示できるという作用を持つ。
【0012】本発明の請求項4に記載の発明は、電子又
は光を媒体とする情報記憶媒体又は情報通信網から所定
の情報を取り出すために、少なくとも入力端子からの入
力を用いて情報の提示の順序付けの仕方を変えることを
特徴とする情報フィルタ装置であって、情報の提示の順
序付けのために、情報が必要か否かを示す信号と前記情
報に付けられたキーワード検索式を含む一つまたは複数
のキーワード信号とを用いて辞書の内容を更新する適応
辞書手段と、一つまたは複数のキーワード信号を前記適
応辞書手段の辞書を用いてベクトル信号に変換する手段
を有し、該ベクトル信号と、情報が必要か否かという入
力から計算されたベクトルで表現されるメトリック信号
とからスコア信号を計算し、そのスコア信号を利用して
情報の提示順序を決める情報フィルタ装置であり、必要
性の高い順に情報をユーザーに提示できるという作用を
持つ。
【0013】本発明の請求項5に記載の発明は、メトリ
ック信号は、肯定メトリック信号と否定メトリック信号
はそれぞれベクトルであり、前記ベクトルのi成分は、
必要とされた情報の頻度と不要とされた情報の頻度と、
辞書のi番目のキーワード信号が含まれた情報が必要と
された頻度と、辞書のi番目のキーワード信号が含まれ
た情報が不要とされた頻度とから計算されることを特徴
とする請求項4記載の情報フィルタ装置であり、必要性
の高い順に情報をユーザーに提示できるという作用を持
つ。
【0014】本発明の請求項6に記載の発明は、ベクト
ルのi成分は、情報が必要であるか不要であるかを示す
確率分布と、辞書のi番目のキーワード信号が含まれた
情報が必要であるか不要であるかを示す確率分布との違
いを定量的に評価する信号であることを特徴とする請求
項5記載の情報フィルタ装置であり、必要性の高い順に
情報をユーザーに提示できるという作用を持つ。
【0015】本発明の請求項7に記載の発明は、電子又
は光を媒体とする情報記憶媒体又は情報通信網から所定
の情報を取り出すために、少なくとも入力端子からの入
力を用いて情報の提示の順序付けの仕方を変えることを
特徴とする情報フィルタ装置であって、情報の提示の順
序付けのために、情報が必要か否かを示す信号と前記情
報に付けられたキーワード検索式を含む一つまたは複数
のキーワード信号を前記適応辞書手段の辞書を用いて複
数のキーワード信号をベクトル信号に変換する手段とを
有する情報フィルタ装置であり、必要性の高い順に情報
をユーザーに提示できるという作用を持つ。
【0016】
【0017】本発明の請求項に記載の発明は、未読の
情報を記憶する未読データ記憶部と、前記未読の情報を
必要性信号の大きさの順に並べて前記未読データ記憶部
に書き込む未読データ書き込み制御部と、前記未読デー
タを順に提示する未読データ出力制御部とを有する請求
項1からのいずれかに記載の情報フィルタ装置であ
り、電子ニュース等のように次々と流入してくる情報か
ら必要とする情報を優先的に提示できるので、必要性の
高い順に情報をユーザーに提示できるという作用を持
つ。
【0018】
【0019】本発明の請求項9に記載の発明は、辞書の
内容の変更は、必要とされた情報の頻度と、不要とされ
た情報の頻度と、それぞれのキーワード信号について、
前記キーワード信号を含む情報が必要とされた頻度と、
前記キーワード信号を含む情報が不要とされた頻度とか
ら計算されるキーワードコスト信号を用いて行われるこ
とを特徴とする適応辞書装置を有することを特徴とする
請求項1から8のいずれかに記載の情報フィルタ装置で
あり、必要性の高い順に情報をユーザーに提示できると
いう作用を持つ。
【0020】本発明の請求項10に記載の発明は、それ
ぞれのキーワード信号のキーワードコスト信号は、情報
が必要であるか不要であるかを示す確率分布と、前記キ
ーワード信号を含む情報が必要であるか不要であるかを
示す確率分布との違いを定量的に評価する信号であるこ
とを特徴とする適応辞書装置を有することを特徴とする
請求項1から9のいずれかに記載の情報フィルタ装置で
あり、必要性の高い順に情報をユーザーに提示できると
いう作用を持つ。
【0021】本発明の請求項11に記載の発明は、それ
ぞれのキーワード信号のキーワードコスト信号は、情報
が必要であるか不要であるかを示す確率分布と、前記キ
ーワード信号が含まれた情報が必要であるか不要である
かを示す確率分布との違いが大きいほど大きな値の信号
であり、前記キーワードコスト信号が大きなキーワード
信号を残し、小さいキーワード信号を破棄することを特
徴とする適応辞書装置を有することを特徴とする請求項
1から10のいずれかに記載の情報フィルタ装置であ
り、必要性の高い順に情報をユーザーに提示できるとい
う作用を持つ。
【0022】本発明の請求項12に記載の発明は、入力
端子からの入力が、提示された情報を必要とした回数を
示す全肯定回数及び前記情報を不要とした回数を示す全
否定回数を記憶する回数記憶部と、キーワード信号を示
す文字列を数字に変換する対応表、前記文字列がキーワ
ード信号として含まれた情報を必要とした回数を示す肯
定回数及び前記文字列がキーワード信号として含まれた
情報を不要とした回数を示す否定回数を記憶した適応辞
書記憶部と、提示された情報が必要か否かという入力端
子からの入力、前記情報に含まれたキーワード信号、前
記全肯定回数、前記全否定回数及び前記適応辞書記憶部
に記憶された信号から前記全肯定回数、前記全否定回数
及び前記適応辞書記憶部に記憶された信号を更新する辞
書学習部とを有することを特徴とする適応辞書装置を有
することを特徴とする請求項1から11のいずれかに記
載の情報フィルタ装置であり、必要性の高い順に情報を
ユーザーに提示できるという作用を持つ。
【0023】
【0024】本発明の請求項13に記載の発明は、情報
に対する評価のユーザー入力が必要だけである場合に、
情報がユーザーにとって必要である確率を、0と1以外
の値とすることを特徴とする請求項3、請求項6、請求
項8から12のいずれかに記載の情報フィルタ装置であ
り、必要性の高い順に情報をユーザーに提示できるとい
う作用を持つ。
【0025】本発明の請求項14に記載の発明は、情報
に対する評価のユーザー入力が不要だけである場合に、
情報がユーザーにとって不要である確率を、0と1以外
の値とすることを特徴とする請求項3、請求項6、請求
項8から12のいずれかに記載の情報フィルタ装置であ
り、必要性の高い順に情報をユーザーに提示できるとい
う作用を持つ。
【0026】本発明の請求項15に記載の発明は、デー
タベースを再構築する装置であって、請求項1から14
いずれかに記載の情報フィルタ装置を用いたことを特
徴とするデータベース再構築装置であり、必要性の高い
データにアクセスしやすいデータベースを再構築できる
という作用を持つ。
【0027】本発明の請求項16に記載の発明は、電子
又は光を媒体とする情報記憶媒体又は情報通信網から所
定の情報を取り出すために、少なくとも入力端子からの
入力を用いて情報の提示の順序付けの仕方を変えること
を特徴とする情報フィルタ方法であって、情報の提示の
順序付けのために、情報が必要か否かを示す信号と前記
情報に付けられたキーワード検索式を含む一つまたは複
数のキーワード信号とを用いて辞書の内容を更新する適
応辞書手段と、一つまたは複数のキーワード信号を適応
辞書手段の辞書を複数のキーワード信号を辞書を用いて
ベクトル信号に変換し、必要な情報から構成される肯定
メトリック信号、不要な情報から構成される否定メトリ
ック信号及び前記ベクトル信号を用いて肯定スコア信号
及び否定スコア信号を計算し、前記肯定スコア信号と前
記否定スコア信号とから必要性信号とし、該必要性信号
の大きさにより情報の提示の順序を決めることを特徴と
する情報フィルタリング方法であり、必要性の高い順に
情報をユーザーに提示できるという作用を持つ。
【0028】本発明の請求項17に記載の発明は、電子
又は光を媒体とする情報記憶媒体又は情報通信網から所
定の情報を取り出すために、情報が必要であるか不要で
あるかを示す確率分布と、キーワード信号が含まれた情
報が必要であるか不要であるかを示す確率分布との違い
を定量的に評価することを特徴とする情報フィルタ装置
または情報フィルタ方法の初期化方法であって、情報が
ユーザーにとって必要である確率の初期値を、0と1以
外の値とする情報フィルタ初期化方法。であり、必要性
の高い順に情報をユーザーに提示できるという作用を持
つ。
【0029】以下、本発明の実施の形態について、図1
から図12を用いて説明する。 (実施の形態1)以下、本発明の第1の実施の形態につ
いて、図面を参照しながら説明する。図1は本発明の第
1の実施の形態の情報フィルタ装置の構成を示すブロッ
ク図であり、図2はその構成と動作を分かりやすくする
ために機能単位にまとめたブロック図である。
【0030】まず最初に、図2を用いて本発明の基本概
念を説明する。本発明の情報フィルタ装置における基本
概念は、ユーザーがどんな「情報」を過去に必要とした
かという履歴に関する記録を記憶した複数の記憶部2、
5、6と、「情報」のフィルタリングを行う情報フィル
タリングユニット50と、その情報フィルタリングユニ
ット50により実際にフィルタリングされた未読の「情
報」(ユーザーがまだ読んでいない情報)を蓄積してお
く未読データ記憶部10と、ユーザーが当該未読「情
報」を可視できるようにしたディスプレー等のインタフ
ェースユニット51と、ユーザーがどんな「情報」を必
要としたかという履歴に関する学習を行う学習ユニット
52とからなる。
【0031】以下、上記構成の動作について説明する。
なお、以下の説明では既にユーザーがどんな「情報」を
過去に必要としたかという履歴は学習済みのこととして
説明する。また、以下に単に「情報」と称するものに
は、当該「情報」に対応する1つ以上のキーワードが付
されているものとする。そのキーワードとは、当該「情
報」を構成する各単語の一部あるいは全体であっても良
いし、当該「情報」を代表するために特別に付したもの
であっても良い。
【0032】まず、情報フィルタリングユニット50に
新たな「情報」が入力されると、情報フィルタリングユ
ニット50は、記憶部2、5、6からユーザーがどのよ
うな「情報」を過去に必要としたかという記録を読みだ
し、前記新たな「情報」の必要性を必要性信号として定
量的に評価する。
【0033】次に、その評価された新たな「情報」は、
未読データ記憶部10に、必要性信号が大きい順に過去
からの未読「情報」を含めて並ぶように前記入力された
「情報」を当該順番に書き込む。
【0034】そして、ユーザーが望めば、インタフェー
スユニット51では、ユーザーに必要性信号の大きい順
に前記新たな「情報」を含めた未読「情報」を1つひと
つ提示(例えば、ディスプレーに表示)する。その際
に、ユーザーに提示された前記新たな「情報」を含めた
未読「情報」の1つひとつがユーザーにとって必要か不
要かを示す教師信号をユーザーがインタフェースユニッ
ト51を介して入力することにより、インタフェースユ
ニット51では、当該教師信号を受け取り、当該「情
報」とその教師信号を学習ユニット52に送る。なお、
このユーザーによる教師信号の入力は、学習ユニット5
2の学習能力をより高めるために実施するものであり、
学習ユニット52の学習能力(ユーザーがどんな「情
報」を過去に必要としたかという履歴の学習能力)が既
に十分に高ければ行う必要はない。次に学習ユニット5
2では、前記提示した「情報」とその教師信号を用い
て、記憶部2、5、6の履歴内容を書き換える。
【0035】以上、本発明の情報フィルタ装置は、より
高い学習を通じてユーザーに適応し、ユーザーの求める
「情報」を優先的に提示することができる。また、当然
のことながら、学習を行っていない初期状態では、ユー
ザーがどんな「情報」を必要としているのか学習ユニッ
ト52では分からないので、全ての入力される新たな
「情報」をインタフェースユニット51でユーザーが提
示を受ける毎に上述したユーザーによる教師信号の入力
は必要であるが、随時実施する学習を通じてやがてユー
ザーに適応し、ユーザーの求める「情報」を優先的に提
示することができる。
【0036】なお、ユーザーの求める「情報」を優先的
に提示するとは、より具体的な使用例で述べれば、ある
「情報」データベースの母集団Aを特定のキーワードで
検索して「情報」の検索集合Bを得たとしても、当該検
索集合Bの「情報」の全てがユーザーにとっては必要で
あるとは限らないし、またユーザーにとっては「情報」
の全てが必要であってもその必要順位は当然存在するこ
とを前提としている。よって、必要から順に不要、ある
いはその必要順位に従って、インタフェースユニット5
1でユーザーに順に提示することを、ユーザーの求める
「情報」を優先的に提示することを意味する。
【0037】さて、本発明において重要な点は、いかに
必要性信号(ある「情報」が必要であったとの教師信
号)を計算するかである。以下に述べる好ましい実施の
形態では、必要性信号は概念的に次のような量として計
算される。上述した如く、入力された「情報」にキーワ
ードが添付されている場合を考える。一人のユーザーを
考えると、そのユーザーが必要としている「情報」に高
い頻度または確率で付いているキーワード集合Aと、不
要としている「情報」に高い頻度または確率で付いてい
るキーワード集合Bと、さらにはいずれにもよく付く、
または付かないキーワード集合Cとを考えることができ
る。
【0038】したがって、前記キーワード集合Aに属す
るキーワードには正の数値を、前記キーワード集合Bに
属するキーワードには負の値を、前記キーワード集合C
に属するキーワードには値0をそれぞれ割り振る。そし
て、新たに入力された「情報」についている1つ以上の
キーワードについてそれぞれが、前記キーワード集合
A、B、Cのどのキーワードグループに属するかを判定
し、前記割り振られた値を積算するように構成する。
【0039】このように構成すれば、前記新たに入力さ
れた「情報」に付いていた複数のキーワードを、キーワ
ード集合Aに属するキーワードが数多く含まれた「情
報」(ユーザーが必要とする可能性の高い情報)に対し
ては大きな正の値を示し、キーワード集合Bに属するキ
ーワードが数多く付いている「情報」(ユーザーが不要
とする可能性の高い情報)に対しては大きな負の値を示
す数値に変換することができる。このようにして、前記
数値を用いてユーザーの必要性を予測することができ
る。
【0040】本発明では、提示した「情報」とその「情
報」に関するユーザーの必要/不要の評価とからキーワ
ード(キーワード共起を含む)への値の割り振りを自動
的に行い精度の高い必要性信号の計算を実現し、精度高
く必要性の高い順に「情報」を並べ変えることを実現し
ている。そのために、実施の形態1では、「情報」に付
けられた複数のキーワードを一つのベクトルに変換し、
ユーザーが必要とした場合と不要とした場合について、
別々に前記ベクトルの自己相関行列を計算している。ユ
ーザーが必要と答えた「情報」についていたキーワード
から作られた自己相関行列MYを用いて、ベクトルVの
長さSYを以下の式のように計算する。
【0041】
【数1】 ・・・(1) なお、以下の説明では、必要と答えた「情報」について
いたキーワードから作られた自己相関行列MYを「肯定
メトリック信号」、不要と答えた情報についていたキー
ワードから作られた自己相関行列MNを「否定メトリッ
ク信号」と呼こ、長さSYを肯定信号と呼ぶ。この長さ
SYは、ベクトルVの元となった複数のキーワードの中
に、ユーザーが必要とする「情報」によく含まれている
キーワードが数多く含まれていれば、長さSYは大きな
正の値をとり、そうでない場合には0に近い値をとるか
ら、必要性信号を計算する上で有効である。
【0042】本発明は、以下に図1を用いて詳細説明す
るように、さらに工夫を重ねて、精度の高い必要性信号
の計算を実現している。図2に示した情報フィルタリン
グユニット50は、個々の「情報」につけられた複数の
キーワード(正確には、分類コードを含む文字列)をベ
クトルに変換する部分と、ユーザーがどんな「情報」を
必要/不要としたという履歴を表現した肯定メトリック
信号及び否定メトリック信号を用いてある種のスコアを
表す肯定信号と否定信号を計算する部分と、この肯定信
号と否定信号とから「情報」の必要性をよく反映する必
要性信号を計算する部分と、この必要性信号の大きい順
に情報を並べ変える部分からなる。
【0043】以下、情報フィルタリングユニット50に
相当するブロックの構成を、図1に即して説明する。図
1において、1は「情報」に付けられたキーワードなど
の複数の文字列をベクトルに変換するベクトル生成部、
2はキーワードなどの複数の文字列をベクトルに変換す
るための符号辞書信号を記憶した辞書記憶部である。こ
の辞書記憶部2に記憶された符号辞書信号は、「情報」
についているキーワードなどの文字列Wを数字Cに変換
する対応表をnofDCK個有するコードブック DCK〔1〕=(W〔1〕,C〔1〕) ・ ・ ・ DCK〔nofDCK〕=(W〔nofDCK〕,C〔nofDCK〕) ・・・(2) であり、ベクトル生成部1は、キーワード数信号nofKs
とnofKs 個のキーワード信号からなるキーワード群信号
Ks=(K[1],・・・,K[nofKs ])とを受けキ
ーワード群信号Ksと前記符号辞書信号DCKを用いて
ベクトル信号Vに変換する。3はスコア計算部で、ユー
ザーに提示された「情報」を必要/不要と評価した結果
から計算された肯定メトリック信号MY、否定メトリッ
ク信号MNを用いて、ベクトル生成部1で変換された2
つのベクトル信号Vの長さ、肯定信号SYと否定信号S
Nに変換する。5は(nofDCK×nofDCK) 行列である前記
肯定メトリック信号MYを記憶する肯定メトリック記憶
部、6は(nofDCK×nofDCK)行列である前記否定メトリ
ック信号MNを記憶する否定メトリック記憶部である。
7は前記肯定信号SYと前記否定信号SNを受け必要性
信号Nと信頼性信号Rを計算する必要性計算部である。
9は「情報」の本文である情報データDとキーワード数
信号nofKs とキーワード群信号Ksと必要性信号Nと信
頼性信号Rとを所定の手続きに従って後述する未読デー
タ記憶部10に書き込む味読データ書き込み制御部、1
0は前記「情報」の本文である情報データDと前記キー
ワード数信号nofKs と前記キーワード群信号Ksと前記
必要性信号Nと前記信頼性信号Rとからなる最大nofURD
個の未読データ URD 1 =(N 1 ,R 1 ,nofKs 1 ,Ks 1 ,D 1 ) ・ ・ ・ URD nofURD =(N nofURD ,R nofURD ,nofKs nofURD ,Ks nofURD ,D nofURD ) ・・・(3) を記憶する未読データ記憶部、13は最大nofTD 個の教師データ信号 TD 1 =(T 1 ,TnofKs 1 ,TKs 1 ) ・ ・ ・ TD nofTD =(T nofTD ,TnofKs nofTD ,TKs nofTD ) ・・・(4) を記憶する教師データ記憶部である。
【0044】次に、図2で示したインタフェースユニッ
ト51のブロックの構成を説明する。図1において、1
1は制御信号DOを受け未読データ記憶部10から未読
データ信号URD[1]を読み出し、表示信号DDを出
力し、その表示信号DDがユーザーにとって必要か否か
を示す教師信号Tをユーザーから受け、前記教師信号T
と前記未読データ信号URD[1]のキーワード数信号
nofKs [1]とキーワード群信号Ks[1]とを所定の
手続きに従って教師データ記憶部13に書き込む未読デ
ータ出力制御部である。
【0045】次に、図2で示した学習ユニット52に相
当するブロックの構成を説明する。学習ユニット52
は、ユーザーから入力された教師信号Tを用いて肯定/
否定メトリック信号を修正するメトリック学習を行う部
分と、肯定/否定信号から必要性信号を計算するための
パラメータ、判定パラメータ信号、を修正する部分から
なり、各部分は学習制御部14によって制御される。
【0046】図1において、19は肯定メトリック記憶
部5に記憶された肯定メトリック信号MYと前記否定メ
トリック記憶部6に記憶された否定メトリック信号MN
とを修正するメトリック学習部である。このメトリック
学習部19は、教師データ記憶部13から前記教師デー
タTDを読み出し、ベクトル生成部1と同じ機能である
学習用ベクトル生成部20で複数のキーワードをベクト
ルに変換し、自己相関行列を計算することで、肯定/否
定メトリック信号を修正する。14は学習開始信号LS
を受けてメトリック学習部19を制御する学習制御部で
ある。
【0047】以上のように構成された情報フィルタ装置
について、各ユニットごとに図面を用いてその動作を説
明する。情報フィルタ装置の好ましい初期状態の一例
は、肯定メトリック信号MYと否定メトリック信号MN
とを(nofDCK×nofDCK)零行列と、未読データ記憶部1
0の未読データURD[i]の全ての必要性信号N
[i](i=1,・・・,nofURD)を使用するハードウ
エアが表現可能な最小の値Vmin、教師データ記憶部
13の教師データTD[j]の教師信号T[j]を全て
−1とした状態である。
【0048】最初に情報フィルタリングユニット50の
動作を説明する。まず、情報データ入力端子100から
情報データDが入力され、キーワード数信号入力端子1
01から情報データに付けられたキーワードの個数を表
すキーワード数信号nofKs が入力され、キーワード信号
入力端子102から複数のキーワードであるキーワード
群信号Ks=(K[1],K[2],・・・,K[nofK
s ])が入力される。このベクトル生成部1によってキ
ーワード群信号Ksは、文字列の集まりからベクトル信
号Vへと変換される。この変換によって、キーワード群
信号の類似性をベクトルの距離として計算できるように
なる。
【0049】次に、ベクトル生成部1の動作を図3に示
すフローチャートを参照しながら説明する。まず、キー
ワード数信号nofKsとキーワード群信号Ksを受けると
(図3ステップS1)、内部のベクトル信号V=(V
[1],V[2],・・・,V[nofDic])を(0,
0,・・・,0)に、キーワードカウンタ信号iを1に
セットする(同図ステップS2、S3)。次に、辞書カ
ウンタ信号jを0セットした後辞書カウンタ信号jを1
だけ増やす(同図ステップS4)。
【0050】次に、内部にnofDCK個の符号辞書信号DC
Kを有する辞書記憶部2から辞書カウンタjが指定する
キーワードと数字からなる符号辞書信号DCK[j]を
読み出し、符号辞書信号DCKの文字列部分W[j]と
i番目のキーワード信号K〔i]とを比較する(同図ス
テップS5)。両者が等しくない場合には、辞書カウン
タjを1だけ増やす(同図ステップS6)。両者が一致
するか、または辞書カウンタjの値が辞書記憶部2に格
納された符号辞書信号の個数nofDiCと等しくなるまで図
3ステップS5〜S7の処理を繰り返す(同図ステップ
S7)。
【0051】キーワード信号K[i]と等しいW[j]
が見つかると、ベクトル信号のj番目の成分V[j]を
1にし(同図ステップS8)、キーワードカウンタ信号
iを1だけ増やす(同図ステップS9)。以下、同様の
処理をキーワードカウンタ信号iがキーワード数信号no
fKs より大きくなるまで実行する(同図ステップ(S1
0)。
【0052】こうして、ベクトル生成部1において、文
字列信号からなるキーワード信号の集合体であるキーワ
ード群信号Ksは、0と1でコード化されたnofDCK個の
成分を持ったベクトル信号Vに変換される。
【0053】次に、肯定信号計算部31は、キーワード
群信号Ksに過去にユーザーの必要とした情報に含まれ
ていたキーワードが数多く含まれる場合に、大きな値と
なる肯定信号SYを計算する。この目的のために、肯定
信号計算部31は、前記ベクトル信号Vを受けて、肯定
メトリック記憶部5から肯定メトリック信号MYを読み
出し、肯定信号SYを次の式のように計算する。
【0054】
【数2】 ・・・(5)
【0055】否定信号計算部32は、キーワード群信号
Ksに過去にユーザーの不要とした情報に含まれていたキ
ーワードが数多く含まれる場合に、大きな値となる否定
信号SNを計算する。この目的のために、否定信号計算
部32は、否定メトリック記憶部6から否定メトリック
信号MNを読み出し、否定信号SNを次の式のように計
算する。
【0056】
【数3】 ・・・(6)
【0057】肯定メトリック信号MYと否定メトリック
信号MNは、後述するようにキーワード群信号Ksとユ
ーザーの応答に基づいて決められる。本発明では、この
ように計算された肯定信号SYと否定信号SNを用い
て、図9に示したように縦軸に肯定信号SYをとり横軸
に否定信号SNをとった2次元空間上の1点に、情報デ
ータDを対応させることができる。この2次元空間にお
ける情報データDの分布は、ユーザーが必要とするもの
(○で表示)は主に左上部に分布し、ユーザーが不要と
するもの(×で表示)は主に右下部に分布するようにな
る。したがって、図8に示したように適切な係数Cを1
に設定することにより、ユーザーが必要とる情報データ
Dと不要な情報データDとを分離できる。
【0058】さらに、以下に述べるこの係数Cを用いて
計算される必要性信号Nは、上述の2次元空間で左上に
ある程、すなわち、必要性の高いと予測される情報デー
タDほど大きな値となる。したがって、必要性信号Nの
大きい順に情報データDを並べて提示すれば、ユーザー
は必要な情報を効率よく手に入れることができる。必要
性信号Nと直交する方向の信頼性信号Rは、大まかには
キーワード群信号Ksに含まれていたキーワードのうち
どのくらいのキーワード信号が辞書に含まれていたかを
示す信号である。したがって、この信頼性信号Rの大き
さは、情報フィルタが計算した必要性信号Nがどれだけ
信頼できるのかを示す。
【0059】次に、必要性計算部7は、前記肯定信号計
算部31から出力される前記肯定信号SYと前記否定信
号計算部32から出力される前記否定信号SNとを受
け、過去必要であった情報についていたキーワードが多
数あり、不要であった情報についていたキーワードがほ
とんどない時に大きな値となる必要性信号Nを N=SY−SN と計算し、信頼性信号Rを R=SY+SN と計算する。
【0060】次に、未読データ書き込み制御部9の動作
を、図4に示したフローチャートを参照しながら説明す
る。まず、それぞれの入力端子から前記情報データDと
前記キーワード数信号nofKs と前記キーワード群信号K
sと受け、必要性計算部7から前記必要性信号Nと前記
信頼性信号Rとを受け、未読データ部指示端子110か
ら出力する未読データ処理信号WIを0から1に変える
(図4ステップS11)。次に、i=1とし(同図ステ
ップS12)、未読データ記憶部10に記憶された未読
データURD[i]の必要性信号N[i](i=1,・
・・,nofURD)を順次読み出し、前記必要性信号Nと比
較し(同図ステップS13)、前記必要性信号Nが未読
データURD[i]の必要性信号N[i]より大きくな
る(N≧N[i])最初の未読データの番号i1を検出
する(同図ステップS14、S15)。そしてi1番目
以降の未読データを URD[i+1]=URD[i] i=i1,・・・,nofURD と置き換え(同図ステップS16〜S19)、その後、
i1番目の未読データURD[i1]を N[i1] =N R[i1] =R nofKs [i1]=nofKs Ks[i1] =Ks D[i1] =D と前記必要性信号N等で置き換える(同図ステップS2
0)。この置き換えが終了すると、未読データ部指示端
子110から出力する未読データ部指示信号WIを0に
戻し(同図ステップS20A)、処理を終了する。
【0061】次に、未読データUDRを読みだし、ユー
ザーの応答(教師信号T)を付加して教師データ信号T
Dをつくるインターフェースユニット51について説明
する。インターフェースユニット51の動作を図5に示
したフローチャートを参照しながら説明する。データ読
み出し開始信号入力端子103から、データ読み出し開
始信号DOが入力される(図5ステップS21)。未読
データ出力制御部11は、前記未読データ記憶部10か
ら1番目の未読データURD[1]を読み出し(同図ス
テップS22))、未読データの必要性信号N[1]が
最小値Vminより大きい場合には、未読データ信号U
RD[1]の情報信号D[1]を表示情報信号DDとし
てデータ表示端子104に出力し、待機する(同図ステ
ップS23、S24)。未読データの必要性信号N
[1]が最小値Vminに等しい場合には、表示情報信
号DDを「データなし」としてデータ表示端子104に
出力し、待機する(同図ステップS25)。
【0062】ユーザー(図示せず)は、データ表示装置
(図示せず)に表示された表示情報信号DDを見て、そ
れが必要な情報である場合には教師信号T=1、必要で
ない場合には教師信号T=0、処理を終了する場合には
教師信号T=−1として、教師信号入力端子105に返
す(同図ステップS26)。教師信号T=−1の場合は
処理を終了し、教師信号T≠−1の場合には(同図ステ
ップS27)、未読データ出力制御部11は、教師デー
タ記憶部13の式(4)で表わされる教師データを TD[i]=TD[i−1], i=2,・・・,nofTD と置き換え(同図ステップS28、S29)、1番目の
教師データTD[1]を前記教師信号Tと前記未読デー
タのキーワード数信号nofKs [1]とキーワード群信号
Ks[1]とを用いて T[1] =T TnofKs [1]=nofKs [1] TKs[1] =Ks[1] と置き換え(同図ステップS30、S31、S32)、
前記未読データ記憶部10の未読データURDをURD
[i]=URD[i+1], i=1,・・・,(nofY
RD−1)とし(同図ステップS33、S34)、nofURD
番目の未読データの必要性信号を N[nofURD]=(最小値Vmin) とする(同図ステップS35、S36、S37)。
【0063】次に、学習ユニット52の動作について図
6〜図8に示したフローチャートを参照しながら説明す
る。図6に学習制御部14の動作の概略を示すフローチ
ャート示し、詳しく説明する。図6において、まず、学
習開始信号入力端子106から学習開始信号LSが入力
され、学習制御部指示信号出力端子107から出力され
る学習制御部指示信号LIを0から1に変え(図6ステ
ップS41)、処理中を示す。次に、図7のステップS
53に対応するメトリック学習部19を動作し(同図ス
テップS42)、LIを0として(同図ステップS4
3)、処理を終了する。
【0064】次に、メトリック学習部19がユーザーの
応答(教師信号T)とキーワード群信号Ksとを用い
て、肯定/否定メトリック信号を修正する動作を図7の
フローチャートを用いて説明する。図7において、メト
リック学習部19は、前記学習制御部14からメトリッ
ク学習制御信号MLCを受けると(図7ステップS5
1)、肯定メトリック記憶部5から肯定メトリック信号
MYを、否定メトリック記憶部6から否定メトリック信
号MNをそれぞれ読み出し、教師データカウンタcの値
を1にする(同図ステップS52)。
【0065】次に、メトリック学習部19は、次に教師
データ記憶部13からc番目の教師データ信号TD
[c]を読み出し(同図ステップS53)、教師データ
TD[c]の教師信号T[c]を調べる。前記教師信号
T[c]が−1でない場合(T≠−1)には(同図ステ
ップS54)、教師データTD[c]のキーワード数信
号TnofKs [c]とキーワード群信号TKs[c]とを
出力する(同図ステップS55)。前記教師データTD
[c]のキーワード数信号TnofKs [c]とキーワード
群TKs[c]とを受けた学習用ベクトル生成部20
は、前述の情報フィルタリングユニット50のベクトル
生成部1と同様の動作を行い、学習用ベクトル信号LV
を出力する(同図ステップS56)。メトリック学習部
19は、前記学習用ベクトル信号LVを受け、前記教師
データTD[c]の教師信号T[c]がT=1である場
合には(同図ステップS57)、肯定メトリック信号M
Yを MY[i][j]=MY[i][j]+LV[i]・L
V[j] (ここで、i,j=1〜nofDiC)と修正する(同図ステ
ップS58)。
【0066】この処理により、肯定メトリック信号MY
は、ユーザーが必要とした情報データDについていたキ
ーワード信号(複数)に対して大きな値を持つようにな
る。その結果、前述の肯定信号SYが、ユーザーが必要
とする情報データDに対して大きくなるようになる。否
定メトリック信号MNも以下のように同様の処理がなさ
れる。
【0067】前記教師データTD[c]の教師信号T
[c]がT=0である場合には、否定メトリック信号M
Nを MN[i][j]=MN[i][j]+LV[i]・L
V[j] (ここで、i,j=1〜nofDiC)と修正する(同図ステ
ップS59)。次に、教師データカウンタの値を c=c+1 と1だけ増やす(同図ステップS60)。
【0068】以下、メトリック学習部19は、同様の動
作を、教師データTD[c]の教師信号T[c]がT
[c]=−1になるかまたはc=nofTD となるまで繰り
返す(同図ステップS61)。T[c]=−1またはc
=nofTD となると(同図ステップS62)、メトリック
学習の処理を終了し、メトリック学習制御信号MLCを
学習制御部14に送る。学習制御部14は、前記メトリ
ック学習信号MLCを受け、学習制御部指示信号を待機
中を示す値にし、処理を終了する。
【0069】図9に示したように、上述の2つのメトリ
ック信号を用いてキーワード群信号を肯定信号SYと否
定信号SNとで表される2次元空間上で、ユーザーが必
要とする情報は主に左上に、不要な情報は右下に分布す
るようになる。したがって、上記ように必要性信号をN
=SY−SNとすれば、必要性信号は、ユーザーが必要
とする情報に対して大きな値をとるようになる。
【0070】また、肯定メトリック信号MYと否定メト
リック信号MNの学習を忘却の効果を入れた MY[i][j]=α・MY[i][j]+LV[i]
・LV[j] MN[i][j]=β・MN[i][j]+LV[i]
・LV[j] を用いてもよい結果が得られる(ここで、αとβとは、
1より小さい正の数)。
【0071】さらに、文献「情報処理学会技術報告、自
然言語処理101−8(1994.5.27)」などに
記載された文書からキーワード群信号とキーワード数信
号を生成するキーワード生成部を付加する構成をとれ
ば、キーワードが与えられていない情報に対しても適用
できる情報フィルタ装置を構成することができる。
【0072】タイトルがつけられた情報については、タ
イトルを構成する単語をもってキーワードとし、キーワ
ード数信号とキーワード群信号を生成してもよい。加え
て、キーワード信号は、国際特許分類番号など分類記号
を含むようにもしても、本発明の構成を変更する必要は
なく、よい結果を得ることができる。
【0073】また、本発明の実施の形態1では、未読デ
ータURDを1つずつ提示する場合について示したが、
表示装置(図示せず)の大きさによっては、複数の未読
データURDを同時に表示し、使用者が複数表示された
どの未読データに対して応答したのかが正しく情報フィ
ルタ装置に伝えられるような構成を取ることは容易であ
る。
【0074】本発明の情報フィルタの根幹は、図7のフ
ローチャートのステップS57、S58、S59に示し
たように、ユーザーの応答とキーワードとの関係をキー
ワードの同時出現に注目した肯定メトリック信号MY、
否定メトリック信号に反映させ、この2つのメトリック
信号を用いてキーワード群信号を肯定信号SYと否定信
号SNとに変換することで、キーワードという記号情報
を距離の定義された空間に射影したものである。これに
よって、キーワード群の遠近を距離というアナログ尺度
で評価することができるようになる。これを利用するこ
とにより、従来の技術では必要か不要かの二者択一的な
判定しかできなかった必要性の評価が、ユーザーの必要
性の順番に並べるといったことが可能になる。
【0075】以上のように、本発明の実施の形態1の情
報フィルタ装置によれば、ユーザーからの教師信号に基
づいた学習によって、ユーザーの必要とする情報に対し
ては必要性信号が大きな値を取るようになり、その結
果、表示装置等のインターフェースユニットには、ユー
ザーにとって必要性が高い情報が優先的に表示されるよ
うになる。
【0076】(実施の形態2)次に、本発明の第2の実
施の形態について、図面を参照しながら説明する。本実
施の形態2は、実施の形態1の構成に辞書学習部を付加
し、辞書記憶部2に記憶された符号辞書信号DCKが使
用者に適応するように更新し、かつ肯定メトリック信号
MYと否定メトリック信号MNを単純な頻度分布に対応
するキーワードの自己相関行列から、情報が必要/不要
の出現するキーワードの確率分布を考慮したものへと改
良したものである。
【0077】図10に本実施の形態2の情報フィルタ装
置のブロック結線図を示すが、以下の説明では、実施の
形態1の情報フィルタ装置のブロック結線図と異なる構
成についてのみ詳細に説明する。図10において、23
は学習制御部14からの辞書学習信号DLCを受け、辞
書記憶部2の符号辞書信号DCKを更新する辞書学習
部、24は文字列Wと数字Cがキーワード群信号Ksに
含まれていたときに使用者が情報データDを必要と解答
した回数を示す肯定回数PYと、文字列Wがキーワード
群信号Ksに含まれていたときに使用者が情報データD
が不要と解答した回数を示す否定回数PNとからなる表
をnofFDCK個有する適応符号辞書信号
【0078】 FDCK 1 =(W 1 ,C 1 ,PY 1 ,PN 1 ) ・ ・ ・ FDCK nofFDCK =(W nofFDCK ,C nofFDCK ,PY nofFDCK ,PN nofFDCK ) ・・・(7) を記憶した適応符号辞書信号記憶部、25は使用者が必
要と答えた回数を示す全肯定回数信号NYと、不要と答
えた回数を示す全否定回数信号NNとを記憶する回数記
憶部、26は肯定メトリック更新用の1次肯定メトリッ
ク信号MY1を記憶する1次肯定メトリック記憶部、2
7は否定メトリック更新用の1次否定メトリック信号M
N1を記憶する1次否定メトリック記憶部、28は前記
肯定回数信号と前記否定回数信号と前記1次肯定メトリ
ック信号MY1と前記1次否定メトリック信号MN1と
から改良された肯定メトリック信号MYと否定メトリッ
ク信号MNを計算してそれぞれを肯定メトリック記憶部
5と否定メトリック記憶部6に書き込むKDメトリック
学習部である。
【0079】以上のように構成された情報フィルタ装置
について、図面を用いて動作を説明する。なお、動作が
実施の形態1と同様の個所は説明を省略する。情報フィ
ルタ装置の好ましい初期状態の一例は、肯定メトリック
信号MYと否定メトリック信号MNとを(nofDCK×nofD
CK)零行列、未読データ記憶部10の未読データURD
[i]の全ての必要性信号N[i](i=1,・・・,
nofURD)を使用するハードウエアが表現可能な最小の値
Vmin、教師データ記憶部13の教師データTD
[j]の教師信号T[j]を全て−1、適応符号辞書信
号の文字列Wを全てブランク、数字Cを符号辞書信号F
DCKの上から順に1、2、・・・・、nofFDCK 、肯定
回数PYと否定回数PNを0、適応符号辞書に対応し
て、符号辞書の文字列も全てブランクとした状態であ
る。
【0080】まず、情報フィルタリングユニット50
は、上述の初期状態の場合、実施の形態1に記載した通
りの動作を情報フィルタリングユニット50は行い、入
力されたキーワード数信号nofKs、キーワード群信号K
s、情報データDから必要性信号N、信頼性信号Rをと
もに0と計算し、未読データ記憶部10に格納する。次
にインタフェースユニット51は、実施の形態1と同じ
動作を行い、使用者の応答が付いた教師データTDを教
師データ記憶部13に送る。そして学習ユニット52
は、まず学習開始信号入力端子106から学習開始信号
LSが入力され、学習制御部14は、前記学習開始信号
LSを受けて、学習制御部指示信号出力端子107から
出力される学習制御部指示信号LIを0から1に変え、
処理中を示す。そして辞書学習信号DLCを辞書学習部
23に送る。
【0081】以下、図11に示したフローチャートを参
照しながら辞書学習部23の動作を説明する。まず、辞
書学習信号DLCを受けて(図11ステップS71)、
適応符号辞書記憶部24から適応符号辞書FDCKを最
大nofFDCKtmp個の適応符号信号を記憶できる適応符号信
号バッファに読み込み、回数記憶部25から全肯定回数
信号NYと全否定回数信号NNとを、1次肯定メトリッ
ク記憶部26から1次肯定メトリック信号MY1を、1
次否定メトリック信号記憶部27から1次否定メトリッ
ク信号MN1を読み出す(同図ステップS72)。次に
内部の教師データカウンタcの値を1にし(同図ステッ
プS73)、教師信号記憶部13から教師データTD
[c]を読み出し(同図ステップS74)、その教師信
号T[c]が−1であるか否かを判定する(同図ステッ
プS75)。
【0082】T[c]≠−1の場合、以下の処理を行
う。まず、内部のキーワード数カウンタiの値を1にセ
ットし(同図ステップS76)、適応符号辞書カウンタ
jの値を1にセットする(同図ステップS77)。次
に、前記文字列W[j]がブランクであるかないかを判
定し(同図ステップS78)、ブランクである場合に
は、前記文字列W[j]を前記キーワード信号TK
[i]で置き換える(同図ステップS79)。ブランク
でない場合には、教師データTD[c]のi番目のキー
ワード信号TK[i]とj番目の適応符号辞書信号FD
CK[j]の文字列W[j]とを比較する(同図ステッ
プS80)。
【0083】前記文字列W[j]がブランクの場合、ま
たは、ブランクでなくかつ前記キーワード信号TK
[i]と前記文字列W[j]が一致した場合、T[c]
の値に応じて以下の処理を行う。T[c]=1の場合
(同図ステップS81)、全肯定信号NYに1を加え
(同図ステップS82)、適応符号辞書信号FDCK
[j]の肯定回数PY[j]に1を加える(同図ステッ
プS83)。T[c]≠1、これはT[c]=0の場合
であるが、全否定信号NNに1を加え(同図ステップS
84))、適応符号辞書信号FDCK[j]の否定回数
PN[j]に1を加える(同図ステップS85)。
【0084】前記W[j]がブランクでなくかつ前記キ
ーワード信号TK[i]と前記文字列W[j]が一致し
ない場合、適応符号辞書カウンタjの値を1増やす(同
図ステップS86)。適応符号辞書カウンタjの値が適
応符号辞書信号バッファに記憶できる適応符号信号の数
に1を加えた値nofFDCKtmp+1と比較する(同図ステップ
S87)。適応符号辞書カウンタjの値が、nofFDCKtmp
+1以下の場合、文字列W[j]がブランクかどうかの判
定に戻る。それ以外の場合は、前記キーワードカウンタ
iの値を1だけ増やす(同図ステップS88)。
【0085】前記キーワードカウンタiの値が、前記教
師データTD[c]のキーワード数信号TnofKSに1を加
えた値TnofKs+1と比較して小さい場合(同図ステップS
89)、辞書カウンタjを1にセットし、同様の処理を
行う。それ以外の場合、教師データカウンタcの値を1
だけ増やす(同図ステップS90)。教師データカウン
タcの値と、教師データ数nofTD に1を加えた値nofTD+
1 とを比較し(同図ステップS91)、教師データカウ
ンタcの値が小さい場合、次の教師データTD[c]を
読み出して同様の処理を行う。以上の処理が、全ての教
師データTDに対して行われる。
【0086】次に辞書学習部23は、各々の適応符号辞
書信号FDCK[j]に対してキーワードコスト信号K
Dを計算する。このキーワードコスト信号は、文字列W
〔j]がキーワードとして有効であるか否かを判断する
ために用いられる量である。
【0087】ところで、使用者の不要な情報データDが
出現する確率 NN/(NY+NN) と比較して、文字列W[j]が付いている情報データD
が使用者にとって不要である場合の確率 PN[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであれば、
文字列W[j]は、情報データDが使用者にとって不要
と判定する上で有効である。同様に、使用者の必要な情
報データDが出現する確率 NY/(NY+NN) と比較して、文字列W[j]が付いている情報データD
が使用者にとって必要である場合の確率 PY[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようものであれば、
文字列W[j]は、情報データDが使用者にとって必要
と判定する上で有効である。
【0088】キーワードコスト信号KDは、この性質を
反映している量で有ればなんでもよいが、好ましい例の
一つとして、カルバックダイバージェンスと呼ばれる NY/(NY+NN)・log((PY〔j〕/PY〔j〕+PN〔j〕) +NN/(NY+NN)・log((PN〔j〕/PY〔j〕+PN〔j〕) ・・・(8) が考えられる。しかし、これは、そのままでは、本情報
フィルタ装置の初期状態など、全肯定回数信号NY、全
否定回数信号NN、肯定回数PY[j]、否定回数PN
[j]が0のときには、log( )の計算ができない、 PY[j]+PN[j]≒1 を満たす適応符号辞書信号FDCK[j]のキーワード
コスト信号を過大評価する等不適切な場合がある。これ
を回避する好ましい実施の形態の一つは、キーワードコ
スト信号を KD〔j〕=tanh((PY〔j〕+PN〔j〕/PC)・tanh{NY/(N Y+NN)・log((PY〔j〕+ε)/(PY〔j〕+PN〔 j〕+2ε)+NN/(NY+NN)・log ( (PN〔j〕+ ε)/PY〔j〕+PN〔j〕+2ε)} ・・・(9) とするものである。ここで、εは0でのわり算、log0を
避けるための小さな正の値を持つパラメータである。パ
ラメータPCは、3程度の値とするとよい。
【0089】次に、適応符号辞書信号FDCK[j]の
文字列W[j]と肯定回数PY[j]と否定回数PN
[j]とをキーワードコスト信号KDの大きい順に並べ
替える(同図ステップS92)。このとき、適応符号辞
書FDCK[j]の数字C[j]には、最初の並び順が
残っている。これを利用して、1次肯定メトリック信号
MY1とC[j]から、C[i]、C[j]の値がとも
に符号辞書DCKの数nofDCKより小さい場合、 M[i][j]=MY1[C[i]][C[j]], i,j=1、・・nofDCK その他の場合は、i=jの場合は、 M[i][i]=PY[C[i]], i,=1、・・nofDCK i≠jの場合は、 M[i][j]=0, i,j=1、・・nofDCK とした上で、 MY1[i][j]=M[i][j]、i,j=1、・・nofDCK と1次肯定メトリック信号MY1の置き換えを行う。1
次否定メトリック信号MN1に対しても、同様の置き換
えを行う(同図ステップS93)。そして、適応符号辞
書信号バッファ内の適応符号辞書FDCK[j]の数字
C[j]を C[j]=j、j=1、・・・、nofFCKtmp と置き換える。
【0090】以上の処理を終えると、辞書学習部23
は、適応符号辞書バッファ内の適応符号辞書FDCKの
上位nofDCK個の文字列W[j]と数字C[j]を辞書記
憶部2に書き込み、適応符号辞書バッファ内の適応符号
辞書信号FDCK[j]の上位nofFDCK 個を適応符号辞
書記憶部24に書き込み、全肯定回数信号NYと全否定
回数信号NNを回数記憶部25に書き込み、1次肯定メ
トリック信号MY1を1次肯定メトリック信号記憶部2
6に1次否定メトリック信号MN1を1次否定メトリッ
ク信号記憶部27に書き込む(同図ステップS94)。
最後に、辞書学習信号DCLを学習制御部14に戻し
(同図ステップS95)、処理を終了する。
【0091】次に、前記学習制御部14は、KDメトリ
ック学習部28にメトリック学習制御信号MLCを送
る。前記メトリック学習制御信号MLCを受けたKDメ
トリック学習部28は、まず、1次肯定メトリック記憶
部26から1次肯定メトリック信号MY1を、1次否定
メトリック記憶部27から1次否定メトリック信号MN
1をそれぞれ読み出す。
【0092】次に、KDメトリック学習部28は、教師
データカウンタcの値を1にする。教師データ記憶部1
3からc番目の教師データ信号TD[c]を読み出し、
教師データTD[c]の教師信号T[c]を調べる。前
記教師信号T[c]が−1でない場合(T≠−1)に
は、教師データTD[c]のキーワード数信号TnofKs
[c]とキーワード群信号TKs[c]とを出力する。
前記教師データTD[c]のキーワード数信号TnofKs
[c]とキーワード群TKs[c]とを受けた学習用ベ
クトル生成部20は、前述した実施の形態1の情報フィ
ルタリングユニット50のベクトル生成部1と同様の動
作を行い、学習用ベクトル信号LVを出力する。KDメ
トリック学習部28は、前記学習用ベクトル信号LVを
受け、前記教師データTD[c]の教師信号T[c]が
T=1である場合には、1次肯定メトリック信号MY1
を MY1[i][j]=MY1[i][j]+LV[i]
・LV[j] (ここで、i,j=1〜nofDiC)と修正する。前記教師
データTD[c]の教師信号T[c]がT=0である場
合には、1次否定メトリック信号MN1を MN1[i][j]=MN1[i][j]+LV[i]
・LV[j] (ここで、i,j=1〜nofDiC)と修正する。教師デー
タカウンタの値を c=c+1 と1だけ増やす。
【0093】以下、KDメトリック学習部28は、同様
の動作を、教師データTD[c]の教師信号T[c]が
T[c]=−1になるかまたはc=nofTD となるまで繰
り返す。T[c]=−1またはc=nofTD となると、1
次肯定メトリック信号MY1と1次否定メトリック信号
MN1の学習を終える。
【0094】次に、回数記憶部25から全肯定回数信号
NYと全否定回数信号NNを読み出し、1次肯定メトリ
ック信号MY1と1次否定メトリック信号MN1とを用
いて肯定メトリック信号MYを計算する。こうして計算
される肯定メトリック信号MY、否定メトリック信号M
Nは、キーワードコスト信号KDと同様、計算される肯
定信号SYと否定信号SNが、使用者の不要な情報デー
タDが出現する確率 NN/(NY+NN) と比較して、文字列W[j]が付いている情報データD
が使用者にとって不要である場合の確率 PN[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようなものであり、
使用者の必要な情報データDが出現する確率 NY/(NY+NN) と比較して、文字列W[j]が付いている情報データD
が使用者にとって必要である場合の確率 PY[j]/(PY[j]+PN[j]) が大きく異なる場合に、大きくなるようなものであると
いった性質を持っていれば、なんでもよい。これを満た
す好ましいのは、肯定メトリック信号MYを MY〔i〕〔j〕=NY/(NY+NN)・log((MY1〔i〕〔j〕 +ε)・(NY+NN)/(NY・(MY1〔i〕 〔j〕+MN1〔i〕〔j〕+2ε)} ・・・(10) と計算し、否定メトリック信号MNを MN〔i〕〔j〕=NN/(NY+NN)・log((MN1〔i〕〔j〕 +ε)・(NY+NN)/(NN・(MY1〔i〕 〔j〕+MN1〔i〕〔j〕+2ε)} ・・・(11) と計算する。ここで、εは0でのわり算、log0を避ける
ための小さな正の値を持つパラメータである。
【0095】そして、更新された1次肯定メトリック信
号MY1を1次肯定メトリック信号記憶部26に、更新
された1次否定メトリック信号MN1を1次否定メトリ
ック信号記憶部27に、新たに計算れた肯定メトリック
信号MYを肯定メトリック記憶部5へ、新たに計算され
た否定メトリック信号MNを否定メトリック記憶部6へ
書き込む。以上で、KDメトリック学習部28は、メト
リック学習の処理を終了し、メトリック学習制御信号M
LCを学習制御部14に送る。学習制御部14は、KD
メトリック学習部28からのメトリック学習制御信号M
LCを受けて、学習制御部指示信号LIを1から0に変
え、処理を終了する。
【0096】一度、以上の処理が行われると、辞書記憶
部2の符号辞書が空でなくなるので、情報フィルタリン
グユニット50から出力される必要性信号N、信頼性信
号Rは、0でなくなり、使用者の必要性の高い情報デー
タが、未読データ記憶部10の上位に書き込まれるよう
になる。
【0097】以後、上記処理を繰り返すことにより、使
用者が必要とする情報か否かを判定するために有効なキ
ーワードが優先的に辞書記憶部2に記憶されるようにな
り、小規模な辞書であっても、精度の高い情報フィルタ
リングが可能となる。
【0098】なお、1次肯定メトリック信号MY1と1
次否定メトリック信号MN1の学習を忘却の効果を入れ
た MY1[i][j]=α・MY1[i][j]+LV
[i]・LV[j] MN1[i][j]=α・MN1[i][j]+LV
[i]・LV[j] を用いてもよい結果が得られる。(ここで、αは、1よ
り小さい正の数)もしくは、MY1[i][j]または
MN1[i][j]のいずれかが一定値をこれた場合
に、 MY1[i][j]=MY1[i][j]/2 MN1[i][j]=MN1[i][j]/2 として、信号のオーバーフローを防ぐように構成するこ
とは、実施上好ましい。これは、適応符号辞書信号FD
CK[j]の肯定回数PY[j]と否定回数PN
[j]、および全肯定回数信号NYと全否定回数NNに
ついても同様である。
【0099】さらに、文献「情報処理学会技術報告、自
然言語処理101−8(1994.5.27)」などに
記載された文書からキーワード群信号とキーワード数信
号を生成するキーワード生成部を付加する構成をとれ
ば、キーワードが与えられていない情報に対しても適用
できる情報フィルタ装置を構成することができる。
【0100】また、タイトルがつけられた情報について
は、タイトルを構成する単語をもってキーワードとし、
キーワード数信号とキーワード群信号を生成してもよ
い。加えて、キーワード信号は、国際特許分類番号など
分類記号を含むようにもしても本発明の構成を変更する
必要はなく、よい結果を得ることができる。
【0101】さらに、本実施の形態では、未読データU
RDを一つづつ提示する場合について示したが、表示装
置(図示せず)の大きさによっては複数の未読データU
RDを同時に表示し、使用者がどの未読データURDに
ついて応答したのかを正しく情報フィルタ装置に伝える
構成をとることは容易である。
【0102】本発明の実施の形態2の情報フィルタの根
幹は、キーワードの同時出現に注目したメトリックを導
入することにより、キーワードという記号情報を距離の
定義された空間に射影したことにある。これによって、
キーワード群の遠近を距離というアナログ尺度で評価す
ることができるようになり、これを利用することによ
り、従来の技術では必要か不要かの二者択一的な判定し
かできなかった必要性の評価が、ユーザーの必要性の順
番に並べるといったことが可能になる。
【0103】加えて、本実施の形態2のように、ユーザ
ーが必要とする情報の出現確率を用いて情報の必要性信
号Nを計算する情報フィルタ装置において課題となって
いた問題、すなわち、情報検索になれていないユーザー
は、自分にとって必要な情報のみ「必要」と回答し、不
要な情報については無視するために、ユーザーが必要と
する情報の出現確率が1となってしまうという問題は、
ユーザーが「必要」もしくは「不要」だけしか入力しな
い状態では、ユーザーが必要とする情報の出現確率NY
/(NY+NN)を0もしくは1でない値、例えば0.
5とすることにより解決することができる。
【0104】以上のように、本実施の形態による情報フ
ィルタによれば、ユーザーからの教師信号に基づいた学
習によって、ユーザーの必要とする情報に対しては、必
要性信号が大きな値を取るようになり、その結果、表示
装置等には、ユーザーにとって必要性が高い情報が優先
的に表示されるようになる。
【0105】(実施の形態3)次に、本発明の第3の実
施の形態について説明する。本実施の形態3は、実施の
形態1または実施の形態2の構成における計算量および
メモリ量を、各メトリック信号を2次元の行列から1次
元のベクトルとすることで、削減するものである。以
下、本実施の形態3の動作を実施の形態1を参照して説
明する。
【0106】本実施の形態では、肯定スコア信号SY
は、
【0107】
【数4】 ・・・(12) となり、否定スコア信号SNは、
【0108】
【数5】 ・・・(13) となる。また、教師データTD[c]の教師信号T
[c]がT=1である場合には肯定メトリック信号MY
の更新式は、 MY1[i]=MY1[i]+LV[i] (ここで、i=1〜nofDiC) 前記教師データTD[c]の教師信号T[c]がT=0
である場合には、否定メトリック信号MNは、 MN1[i]=MN1[i]+LV[i] (ここで、i,j=1〜nofDiC)と更新される。その他
は、実施の形態1と同様である。
【0109】なお、本実施の形態を採用する場合、辞書
にキーワードの積(AND)などキーワード検索式含む
ように構成することにより、キーワードの共起をベクト
ル信号Vに反映させることは、非常に好ましい。また、
この方法は、実施の形態2についても同様の方法で変更
できる。
【0110】(実施の形態4)次に、本発明の第4の実
施の形態について図面を参照しながら説明する。本実施
の形態4は、実施の形態1または実施の形態2または実
施の形態3の情報フィルタ装置の構成にデータベース再
構築制御部、データベース読み出し部及び適応データベ
ース書き込み部等を付加し、情報フィルタ装置データベ
ース再構築装置としたもので、実施の形態1のインタフ
ェースユニット51、学習ユニット52及び情報フィル
タリングユニットの機能を用いて使用者にとって必要な
順にデータが並んだ使いやすい適応データベースを提供
するものである。
【0111】図12に本実施の形態4のデータベース再
構築装置ブロック結線図を示し、以下に説明する。図1
2において、60はデータベース記憶部、61はデータ
ベース記憶部60からデータを読み出し情報フィルタ装
置に適した形にデータを整形して出力するデータベース
読み出し部、62はデータベースの再構築を制御するデ
ータベース再構築制御部、63はスイッチ、65は適応
データベース記憶部、64は情報フィルタリングユニッ
トからの信号を一時的に保持し最終結果を適応データ記
憶部65に書き込む適応データベース書き込み部、20
0はデータベース再構築制御部62を制御する制御信号
入力端子、201は学習データ数信号を入力する学習数
信号入力端子である。その他のものは、実施の形態1に
記載した情報フィルタ装置と同一の構成であるので省略
する。
【0112】以上のように構成されたデータベース再構
築装置の動作について説明する。まず、制御信号入力端
子200からデータベース再構築開始を示す制御信号C
DB=1が入力され、学習数信号入力端子201から情
報フィルタ装置の学習回数を示す学習数信号LNが入力
される。データベース再構築制御部62は、データベー
ス再構築制御指示信号出力端子210から出力されるデ
ータベース再構築制御指示信号IRDを0から1に変
え、処理中であることを示す。データベース再構築制御
部62は、スイッチ63を情報フィルタリングユニット
50と未読データ記憶部10とを接続するように切り替
える。データベース再構築制御部62は、制御信号CD
B(=1)を受けて、データベース読み出し部61にデ
ータベース記憶部60に記憶されたデータの数を聞く。
データベース読み出し部61は、データベース記憶部6
0に記憶されたデータの数を数えその結果をデータ数信
号nofDとして、データベース再構築制御部62に送る。
データベース再構築制御部62は、適応データベース書
き込み制御部64内の未読データ数nofURDの内容をデー
タ数信号nofDで置き換える。次にデータベース再構築制
御部62は、学習数信号LNを読み出しデータ数信号R
DNとして、データベース読み出し部61に送る。
【0113】データベース読み出し部61は、学習数信
号LNを受けて、データベース記憶部60からLN個の
データを順次読み出し、必要な整形をして、情報フィル
タリングユニット50に送る。情報フィルタリングユニ
ット50は、実施の形態1に記載した動作を行い、未読
データ記憶部10に格納する。
【0114】使用者は、インターフェースユニット51
を起動し、未読データ記憶部10に格納されたLN個の
未読データURD を順次読み出し、要不要を示す教師信号
Tを入力する。LN個の未読データについての入力が終
わると、使用者は学習開始信号入力端子106から学習
開始信号LSを入力し、情報フィルタ装置の学習を行
う。学習制御部指示信号出力端子107から出力される
学習制御部指示信号LIが学習の終了を示すように1か
ら0になると、データベース再構築制御部62は新たに
LN個のデータを読み出すように読み出しデータ数信号
RDNをデータベース読み出し制御部61に送り、新た
にLN個のデータを情報フィルタリングユニット50を
通し並べ変える。
【0115】使用者は、再び、インタフェースユニット
51を起動し、LN個の未読データURD を必要か不要か
を判断しながら、必要な情報が上位に来ているか否かを
確認し、情報フィルタ装置にさらに学習させるか否かを
決める。情報フィルタ装置の性能が不十分で、さらに学
習させる場合には、使用者は、再び学習開始信号入力端
子106から学習開始信号LSが入力し、情報フィルタ
装置の学習を行う。
【0116】情報フィルタ装置の性能が十分に上がり学
習が必要でなくなると、制御信号入力端子200からデ
ータベース再構築実行を示す制御信号CDB=2を入力
する。データベース再構築制御部62は、まずスイッチ
63を情報フィルタリングユニット50と適応データベ
ース書き込み部64とが接続するように切り替える。次
に、データベース再構築制御部62は、データベース記
憶部60に記憶されたデータ数nofD個のデータを読みだ
すように読み出しデータ数信号RDNをデータベース読
み出し部61に送る。データベース読み出し部61は、
nofD個のデータを順次読み出し、情報フィルタリングユ
ニット50に送る。情報フィルタリングユニット50
は、適応データベース書き込み部64の中のバッファに
データを必要性に基づいて並べ替える。
【0117】適応データベース書き込み部64は、書き
込まれたデータの数がnofDになると、バッファの内容を
適応データベース記憶部65に書き込み、書き込み終了
信号EWをデータベース再構築制御部62に送る。書き
込み終了信号EWを受けたデータベース再構築制御部6
2は、データベース再構築制御指示信号出力端子210
から出力されるデータベース再構築制御指示信号IRD
を1から0に変え、処理を終了する。
【0118】以上のように、本実施の形態4のデータベ
ース再構築装置によれば、使用者にとって必要な順にデ
ータが並んだ使いやすい適応データベースを作ることが
できる。
【0119】なお、本実施の形態4では、適応データベ
ースは全体として元のデータベースと同じデータを持つ
ようにしたが、記憶装置のメモリ領域を節約するため
に、適応データベースの内容をデータ間のリンク情報だ
けとしても、同じ効果が得られる。
【0120】
【発明の効果】以上のように、本発明は、情報に割り振
られた複数のキーワードをベクトルに変換する手段と、
このベクトルと使用者からの教師信号を用いてスコアを
計算する手段と、このスコアから必要性と信頼性を計算
する手段とを備え、スコア計算部がスコアを計算する際
に用いるメトリックを使用者から与えられる情報の必要
/不要という単純な評価をもとに計算し、情報をユーザ
ーの必要度にしたがって並べ、ユーザーに対して必要性
の高い情報から順に提供することにより、初心者にも精
度の高い情報を得ることができ、更に使用者にとって必
要性の高い情報の取り出し易い情報フィルタ装置とデー
タベース再構築装置及び情報フィルタ方法と初期化方法
を提供することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1の情報フィルタ装置のブ
ロック結線図
【図2】本発明の基本概念を説明するためのブロック結
線図
【図3】本発明の実施の形態1の情報フィルタ装置のベ
クトル生成部の動作を説明するためのフロー図
【図4】本発明の実施の形態1の情報フィルタ装置の未
読データ書き込み制御部の動作を説明するためのフロー
【図5】本発明の実施の形態1の情報フィルタ装置の未
読データ出力制御部の動作を説明するためのフロー図
【図6】本発明の実施の形態1の情報フィルタ装置の学
習制御部の動作を説明するためのフロー図
【図7】本発明の実施の形態1の情報フィルタ装置のメ
トリック学習部の動作を説明するためのフロー図
【図8】本発明の実施の形態1の情報フィルタ装置の動
作を説明するための模式図
【図9】本発明の実施の形態1の情報フィルタ装置の判
定面学習部の動作を説明するための模式図
【図10】本発明の実施の形態2の情報フィルタ装置の
ブロック結線図
【図11】本発明の実施の形態2の情報フィルタ装置の
辞書学習部の動作を説明するためのフロー図
【図12】本発明の実施の形態3のデータベース再構築
装置の概略を示すブロック結線図
【符号の説明】
1 ベクトル生成部 2 辞書記憶部 3 スコア計算部 5 肯定メトリック記憶部 6 否定メトリック記憶部 7 必要性計算部 9 未読データ書き込み制御部 10 未読データ記憶部 11 未読データ出力制御部 12 教師データ制御部 13 教師データ記憶部 14 学習制御部 19 メトリック学習部 20 学習用ベクトル生成部 23 辞書学習部 24 適応符号辞書記憶部 25 回数記憶部 26 1次肯定メトリック記憶部 27 1次否定メトリック記憶部 28 KDメトリック学習部 50 情報フィルタリングユニット 51 インタフェースユニット 52 学習ユニット 60 データベース記憶部 61 データベース読み出し部 62 データベース再構築制御部 63 スイッチ 64 適応データベース書き込み部 65 適応データベース記憶部 100 情報入力端子 101 キーワード数信号入力端子 102 キーワード信号入力端子 103 データ読み出し開始信号入力端子 104 データ表示端子 105 教師信号入力端子 106 学習開始信号入力端子 107 学習制御部指示信号出力端子 110 未読データ部指示端子 200 制御信号入力端子 201 学習数信号入力端子 210 データベース再構築制御指示信号出力端子
フロントページの続き (56)参考文献 特開 平7−110818(JP,A) 特開 平9−54780(JP,A) 特開 平9−16627(JP,A) 特開 平8−320879(JP,A) 特開 平9−288683(JP,A) 特開 平9−6799(JP,A) 特開 平9−6796(JP,A) 特開 平6−243173(JP,A) 特開 平8−263517(JP,A) 特開 平8−161348(JP,A) 特開 平9−9244(JP,A) 特開 平9−44516(JP,A) 特開 平10−63679(JP,A) 特開 平2−224068(JP,A) 渡部勇,緩い協調:協調情報フィルタ リングシステム,情報処理学会研究報告 (91−HI−35),日本,1991年3月8 日,Vol.91,No.18,pp.179 −186 (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 JICSTファイル(JOIS)

Claims (17)

    (57)【特許請求の範囲】
  1. 【請求項1】 電子又は光を媒体とする情報記憶媒体又
    は情報通信網から所定の情報を取り出すために、少なく
    とも入力端子からの入力を用いて情報の提示の順序付け
    の仕方を変えることを特徴とする情報フィルタ装置であ
    って、情報の提示の順序付けのために、情報が必要か否
    かを示す信号と前記情報に付けられたキーワード検索式
    を含む一つまたは複数のキーワード信号とを用いて辞書
    の内容を更新する適応辞書手段と、一つまたは複数のキ
    ーワード信号を前記適応辞書手段の辞書を用いてベクト
    ル信号に変換する手段と、必要な情報から構成される肯
    定メトリック信号、不要な情報から構成される否定メト
    リック信号及び前記ベクトル信号を用いて肯定スコア信
    号及び否定スコア信号を計算する手段と、前記肯定スコ
    ア信号と前記否定スコア信号とから必要性信号として計
    算する手段とを備え、前記必要性信号の大きさにより情
    報の提示の順序を決めることを特徴とする情報フィルタ
    装置。
  2. 【請求項2】 電子又は光を媒体とする情報記憶媒体又
    は情報通信網から所定の情報を取り出すために、少なく
    とも入力端子からの入力を用いて情報の提示の順序付け
    の仕方を変えることを特徴とする情報フィルタ装置であ
    って、情報の提示の順序付けのために、情報が必要か否
    かを示す信号と前記情報に付けられた一つまたは複数の
    キーワード信号とを用いて辞書の内容を更新する適応辞
    書手段と、一つまたは複数のキーワード信号を前記適応
    辞書手段の辞書を用いてベクトル信号に変換する手段
    と、必要な情報から構成される肯定メトリック信号、不
    要な情報から構成される否定メトリック信号及び前記ベ
    クトル信号を用いて肯定スコア信号及び否定スコア信号
    を計算する手段と、前記肯定スコア信号と前記否定スコ
    ア信号との差を必要性信号として計算する手段とを備
    え、肯定メトリック信号と否定メトリック信号はそれぞ
    れ行列であり、前記行列の(ij)成分は、必要とされ
    た情報の頻度と不要とされた情報の頻度と、辞書のi番
    目のキーワード信号と辞書のj番目のキーワード信号が
    同時に含まれた情報が必要とされた頻度と、辞書のi番
    目のキーワード信号と辞書のj番目のキーワード信号が
    同時に含まれた情報が不要とされた頻度とから計算され
    ることを特徴とする情報フィルタ装置。
  3. 【請求項3】 行列の(ij)成分は、情報が必要であ
    るか不要であるかを示す確率分布と、辞書のi番目のキ
    ーワード信号と辞書のj番目のキーワード信号が同時に
    含まれた情報が必要であるか不要であるかを示す確率分
    布との違いを定量的に評価する信号であることを特徴と
    する請求項2記載の情報フィルタ装置。
  4. 【請求項4】 電子又は光を媒体とする情報記憶媒体又
    は情報通信網から所定の情報を取り出すために、少なく
    とも入力端子からの入力を用いて情報の提示の順序付け
    の仕方を変えることを特徴とする情報フィルタ装置であ
    って、情報の提示の順序付けのために、情報が必要か否
    かを示す信号と前記情報に付けられたキーワード検索式
    を含む一つまたは複数のキーワード信号とを用いて辞書
    の内容を更新する適応辞書手段と、一つまたは複数のキ
    ーワード信号を前記適応辞書手段の辞書を用いてベクト
    ル信号に変換する手段を有し、該ベクトル信号と、情報
    が必要か否かという入力から計算されたベクトルで表現
    されるメトリック信号とからスコア信号を計算し、その
    スコア信号を利用して情報の提示順序を決める情報フィ
    ルタ装置。
  5. 【請求項5】 メトリック信号は、肯定メトリック信号
    と否定メトリック信号はそれぞれベクトルであり、前記
    ベクトルのi成分は、必要とされた情報の頻度と不要と
    された情報の頻度と、辞書のi番目のキーワード信号が
    含まれた情報が必要とされた頻度と、辞書のi番目のキ
    ーワード信号が含まれた情報が不要とされた頻度とから
    計算されることを特徴とする請求項4記載の情報フィル
    タ装置。
  6. 【請求項6】 ベクトルのi成分は、情報が必要である
    か不要であるかを示す確率分布と、辞書のi番目のキー
    ワード信号が含まれた情報が必要であるか不要であるか
    を示す確率分布との違いを定量的に評価する信号である
    ことを特徴とする請求項5記載の情報フィルタ装置。
  7. 【請求項7】 電子又は光を媒体とする情報記憶媒体又
    は情報通信網から所定の情報を取り出すために、少なく
    とも入力端子からの入力を用いて情報の提示の順序付け
    の仕方を変えることを特徴とする情報フィルタ装置であ
    って、情報の提示の順序付けのために、情報が必要か否
    かを示す信号と前記情報に付けられたキーワード検索式
    を含む一つまたは複数のキーワード信号とを用いて辞書
    の内容を更新する適応辞書手段と、一つまたは複数のキ
    ーワード信号を前記適応辞書手段 の辞書を用いて複数の
    キーワード信号をベクトル信号に変換する手段とを有す
    ることを特徴とする情報フィルタ装置。
  8. 【請求項8】 未読の情報を記憶する未読データ記憶部
    と、前記未読の情報を必要性信号の大きさの順に並べて
    前記未読データ記憶部に書き込む未読データ書き込み制
    御部と、前記未読データを順に提示する未読データ出力
    制御部とを有する請求項1から7のいずれかに記載の情
    報フィルタ装置。
  9. 【請求項9】 辞書の内容の変更は、必要とされた情報
    の頻度と、不要とされた情報の頻度と、それぞれのキー
    ワード信号について、前記キーワード信号を含む情報が
    必要とされた頻度と、前記キーワード信号を含む情報が
    不要とされた頻度とから計算されるキーワードコスト信
    号を用いて行われることを特徴とする適応辞書装置を有
    することを特徴とする請求項1から8の何れかに記載の
    情報フィルタ装置。
  10. 【請求項10】 それぞれのキーワード信号のキーワー
    ドコスト信号は、情報が必要であるか不要であるかを示
    す確率分布と、前記キーワード信号を含む情報が必要で
    あるか不要であるかを示す確率分布との違いを定量的に
    評価する信号であることを特徴とする適応辞書装置を有
    することを特徴とする請求項1から9のいずれかに記載
    の情報フィルタ装置。
  11. 【請求項11】 それぞれのキーワード信号のキーワー
    ドコスト信号は、情報が必要であるか不要であるかを示
    す確率分布と、前記キーワード信号が含まれた情報が必
    要であるか不要であるかを示す確率分布との違いが大き
    いほど大きな値の信号であり、前記キーワードコスト信
    号が大きなキーワード信号を残し、小さいキーワード信
    号を破棄することを特徴とする適応辞書装置を有するこ
    とを特徴とする請求項1から10のいずれかに記載の情
    報フィルタ装置。
  12. 【請求項12】 入力端子からの入力が、提示された情
    報を必要とした回数を示す全肯定回数及び前記情報を不
    要とした回数を示す全否定回数を記憶する回数記憶部
    と、キーワード信号を示す文字列を数字に変換する対応
    表、前記文字列がキーワード信号として含まれた情報を
    必要とした回数を示す肯定回数及び前記文字列がキーワ
    ード信号として含まれた情報を不要とした回数を示す否
    定回数を記憶した適応辞書記憶部と、提示された情報が
    必要か否かという入力端子からの入 力、前記情報に含ま
    れたキーワード信号、前記全肯定回数、前記全否定回数
    及び前記適応辞書記憶部に記憶された信号から前記全肯
    定回数、前記全否定回数及び前記適応辞書記憶部に記憶
    された信号を更新する辞書学習部とを有することを特徴
    とする適応辞書装置を有することを特徴とする請求項1
    から11のいずれかに記載の情報フィルタ装置。
  13. 【請求項13】 情報に対する評価のユーザー入力が必
    要だけである場合に、情報がユーザーにとって必要であ
    る確率を、0と1以外の値とすることを特徴とする請求
    項3、請求項6、請求項8から12のいずれかに記載の
    情報フィルタ装置。
  14. 【請求項14】 情報に対する評価のユーザー入力が不
    要だけである場合に、情報がユーザーにとって不要であ
    る確率を、0と1以外の値とすることを特徴とする請求
    項3、請求項6、請求項8から12のいずれかに記載の
    情報フィルタ装置。
  15. 【請求項15】 データベースを再構築する装置であっ
    て、請求項1から14のいずれかに記載の情報フィルタ
    装置を用いたことを特徴とするデータベース再構築装
    置。
  16. 【請求項16】 電子又は光を媒体とする情報記憶媒体
    又は情報通信網から所定の情報を取り出すために、少な
    くとも入力端子からの入力を用いて情報の提示の順序付
    けの仕方を変えることを特徴とする情報フィルタ方法で
    あって、情報の提示の順序付けのために、情報が必要か
    否かを示す信号と前記情報に付けられたキーワード検索
    式を含む一つまたは複数のキーワード信号とを用いて辞
    書の内容を更新する適応辞書手段と、一つまたは複数の
    キーワード信号を前記適応辞書手段の辞書を用いてベク
    トル信号に変換し、必要な情報から構成される肯定メト
    リック信号、不要な情報から構成される否定メトリック
    信号及び前記ベクトル信号を用いて肯定スコア信号及び
    否定スコア信号を計算し、前記肯定スコア信号と前記否
    定スコア信号とから必要性信号とし、該必要性信号の大
    きさにより情報の提示の順序を決めることを特徴とする
    情報フィルタリング方法。
  17. 【請求項17】 電子又は光を媒体とする情報記憶媒体
    又は情報通信網から所定の情報を取り出すために、情報
    が必要であるか不要であるかを示す確率分布と 、キーワ
    ード信号が含まれた情報が必要であるか不要であるかを
    示す確率分布との違いを定量的に評価することを特徴と
    する情報フィルタ装置または情報フィルタ方法の初期化
    方法であって、情報がユーザーにとって必要である確率
    の初期値を、0と1以外の値とする情報フィルタ初期化
    方法。
JP04638497A 1997-02-28 1997-02-28 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法 Expired - Lifetime JP3260093B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04638497A JP3260093B2 (ja) 1997-02-28 1997-02-28 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04638497A JP3260093B2 (ja) 1997-02-28 1997-02-28 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2001158088A Division JP2001337986A (ja) 2001-05-28 2001-05-28 情報フィルタ装置及び情報フィルタリング方法

Publications (2)

Publication Number Publication Date
JPH10240762A JPH10240762A (ja) 1998-09-11
JP3260093B2 true JP3260093B2 (ja) 2002-02-25

Family

ID=12745654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04638497A Expired - Lifetime JP3260093B2 (ja) 1997-02-28 1997-02-28 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法

Country Status (1)

Country Link
JP (1) JP3260093B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3219386B2 (ja) 1997-12-26 2001-10-15 松下電器産業株式会社 情報フィルタ装置及び情報フィルタ方法
JP3344953B2 (ja) * 1998-11-02 2002-11-18 松下電器産業株式会社 情報フィルタ装置及び情報フィルタリング方法
US6976070B1 (en) 1999-02-16 2005-12-13 Kdd Corporation Method and apparatus for automatic information filtering using URL hierarchical structure and automatic word weight learning
JP2000331013A (ja) 1999-05-19 2000-11-30 Matsushita Electric Ind Co Ltd 情報問いあわせ支援装置及び情報問いあわせ支援方法
JP2001092824A (ja) * 1999-09-21 2001-04-06 Matsushita Electric Ind Co Ltd 情報提示装置、情報提示方法および記録媒体
JP2001134581A (ja) 1999-11-02 2001-05-18 Nec Corp 広告方法、広告装置、広告受信機及び記録媒体
JP7328743B2 (ja) * 2018-03-20 2023-08-17 株式会社東芝 教示装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02224068A (ja) * 1989-02-27 1990-09-06 Toshiba Corp 情報検索システム
JP3390197B2 (ja) * 1993-02-18 2003-03-24 富士通株式会社 個人適応型ネットワーク制御方法
JPH07110818A (ja) * 1993-10-12 1995-04-25 Mitsubishi Electric Corp データベースシステム
JPH08161348A (ja) * 1994-12-01 1996-06-21 Canon Inc 文書フィルタリング方法及び文書処理装置
JP2749790B2 (ja) * 1995-03-28 1998-05-13 株式会社エイ・ティ・アール音声翻訳通信研究所 並列テキスト検索システム
JP3472032B2 (ja) * 1995-04-24 2003-12-02 株式会社東芝 情報フィルタ装置及び情報フィルタ方法
JP2773682B2 (ja) * 1995-05-26 1998-07-09 日本電気株式会社 適合フィードバック装置
JPH096796A (ja) * 1995-06-16 1997-01-10 Nippon Telegr & Teleph Corp <Ntt> 照合パターン生成方法及び装置
JPH099244A (ja) * 1995-06-16 1997-01-10 Matsushita Electric Ind Co Ltd 情報提供システム
JPH096799A (ja) * 1995-06-19 1997-01-10 Sharp Corp 文書分類装置及び文書検索装置
JP3588507B2 (ja) * 1995-07-31 2004-11-10 株式会社東芝 情報フィルタリング装置
JP2870458B2 (ja) * 1995-08-10 1999-03-17 日本電気株式会社 学習装置及び学習方法
JP3244005B2 (ja) * 1995-09-04 2002-01-07 松下電器産業株式会社 情報フィルタ装置及び情報フィルタリング方法
JPH1063679A (ja) * 1996-08-23 1998-03-06 Nippon Telegr & Teleph Corp <Ntt> 情報提供装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
渡部勇,緩い協調:協調情報フィルタリングシステム,情報処理学会研究報告(91−HI−35),日本,1991年3月8日,Vol.91,No.18,pp.179−186

Also Published As

Publication number Publication date
JPH10240762A (ja) 1998-09-11

Similar Documents

Publication Publication Date Title
JP3244005B2 (ja) 情報フィルタ装置及び情報フィルタリング方法
CN101167075B (zh) 专有表现抽取装置、方法以及程序
CN108304375A (zh) 一种信息识别方法及其设备、存储介质、终端
CN109299245B (zh) 知识点召回的方法和装置
CN1670733A (zh) 用自然语言命令呈递表格
JP2000511671A (ja) 自動文書分類システム
CN111258995A (zh) 数据处理方法、装置、存储介质及设备
CN113886604A (zh) 一种职位知识图谱生成方法和系统
CN111753514B (zh) 一种专利申请文本的自动生成方法和装置
US20230153335A1 (en) Searchable data structure for electronic documents
WO2020009027A1 (ja) 情報検索システム
JP3260093B2 (ja) 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法
CN118410175A (zh) 基于大语言模型和知识图谱智能制造能力诊断方法及装置
CN115952277A (zh) 基于知识关系检索增强方法、模型、设备及存储介质
CN115422372A (zh) 一种基于软件测试的知识图谱构建方法和系统
JP3344953B2 (ja) 情報フィルタ装置及び情報フィルタリング方法
JP3468062B2 (ja) 情報フィルタ装置及び情報フィルタリング方法
JP2000331013A (ja) 情報問いあわせ支援装置及び情報問いあわせ支援方法
JP3244084B2 (ja) キーワード検索式生成装置及びキーワード検索式生成方法
CN115831117A (zh) 实体识别方法、装置、计算机设备和存储介质
JP3244083B2 (ja) 適応辞書装置及び適応辞書方法
JP3622668B2 (ja) 情報フィルタ装置及び情報フィルタリング方法
JP3736564B2 (ja) データ処理装置
JP2001337986A (ja) 情報フィルタ装置及び情報フィルタリング方法
JP3156703B1 (ja) メトリック学習装置及びメトリック学習方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071214

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081214

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081214

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091214

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091214

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101214

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101214

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111214

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111214

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121214

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121214

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131214

Year of fee payment: 12

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term