JP2000137731A - 情報フィルタ装置及び情報フィルタリング方法 - Google Patents

情報フィルタ装置及び情報フィルタリング方法

Info

Publication number
JP2000137731A
JP2000137731A JP10312417A JP31241798A JP2000137731A JP 2000137731 A JP2000137731 A JP 2000137731A JP 10312417 A JP10312417 A JP 10312417A JP 31241798 A JP31241798 A JP 31241798A JP 2000137731 A JP2000137731 A JP 2000137731A
Authority
JP
Japan
Prior art keywords
signal
information
keyword
metric
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10312417A
Other languages
English (en)
Other versions
JP3344953B2 (ja
Inventor
Toshiki Kanemichi
敏樹 金道
Hideyuki Yoshida
秀行 吉田
Taisuke Watanabe
泰助 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Matsushita Giken KK
Original Assignee
Matsushita Giken KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Giken KK filed Critical Matsushita Giken KK
Priority to JP31241798A priority Critical patent/JP3344953B2/ja
Priority to EP99121585A priority patent/EP0999502A3/en
Priority to US09/431,232 priority patent/US6286012B1/en
Publication of JP2000137731A publication Critical patent/JP2000137731A/ja
Application granted granted Critical
Publication of JP3344953B2 publication Critical patent/JP3344953B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99939Privileged access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 情報を分類し、かつユーザーの必要度にした
がって並べ、ユーザーに対して必要性の高い情報から順
に提供できるようにすること。 【解決手段】 ベクトル生成部25により情報に割り振
られた複数のキーワードをベクトルに変換し、使用者の
興味を反映したメトリックを生成し、さらにそれを分割
し、それぞれのメトリックを用いて使用者の興味を前記
ベクトルと前記分割されたメトリックを用いて計算され
るスコアの大きい順に情報を提示するものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子または光等を
媒体とする記憶装置や情報通信網から必要な情報を取り
出し易くする情報フィルタ装置及び情報フィルタリング
方法に関するものである。
【0002】
【従来の技術】近年の情報通信の社会基盤の進展に伴
い、情報通信網の大規模化と通信量の著しい増大に対応
する技術として、情報フィルタ装置の実現が強く望まれ
ている。この背景には、今日、個人が処理可能な情報量
に対して、個人がアクセスできる情報量が上回るように
なっていることがある。このために、大量の情報の中に
個人が必要と思う情報が埋没することが、しばしば起こ
る。
【0003】情報フィルタ装置に関連する従来技術とし
ては、特許検索などに用いられるキーワード論理式をあ
げることができる。すなわち、数十万から数百万件に及
ぶ特許情報をキーワード論理式によりフィルタリングす
るものである。
【0004】しかし、キーワード論理式を用いる従来の
方法には幾つかの問題が指摘されていた。第1は、使用
者がキーワードについての論理式を精度良く設定する必
要があるので、使用者がファイリングされているデータ
群の癖(例えば、どのような条件の基に、当該データの
キーワードが決定されているのか等)やシステムの構造
(例えば、キーワードがシソーラス体系のあるシステム
であるか否か等)を十分に知り得ていなければ良い検索
ができない点である。第2は、情報フィルタリングした
結果はキーワードについての論理式に適合するという評
価があるだけであり、たまたまキーワードでは合致して
いるが、内容は求めているものとは異なるケースであっ
たり、あるいは多くの検索結果から使用者にとって必要
度の高い情報をその結果から順に取り出すことは容易で
はない点である。
【0005】そこで、本発明者等は使用者に高度な検索
知識を要求せず、また使用者にとって真に必要なフィル
タリング結果情報のみを高い精度で取得可能な情報フィ
ルタ装置を開発した。特開平9-288683号公報に、この情
報フィルタ装置が開示されている。
【0006】図16を用いて、上記公開公報に記載の情
報フィルタ装置について説明する。この情報フィルタ装
置は、入力情報をフィルタリングする情報フィルタリン
グユニット1と、情報フィルタリングに際して必要な情
報を学習によって生成する学習ユニット2と、フィルタ
リングされた情報をディスプレイに表示するためのイン
タフェースユニット3とを備える。
【0007】情報フィルタリングユニット1は、情報に
割り振られた複数のキーワードを、符号辞書記憶部4に
格納された符号辞書を使ってベクトルに変換する。この
ベクトルとを用いてスコアを計算する。スコア計算は、
肯定メトリック記憶部5と否定メトリック記憶部6とか
ら、キーワード符号に対する肯定メトリック及び否定メ
トリックを取出して計算する。そして、計算されたスコ
アと判定パラメータ記憶部7に記憶されたパラメータと
から必要性と信頼性を計算する。
【0008】このようにして得られた入力情報に対する
必要性と信頼性とが得られたならば、未読データ記憶部
8に蓄積されている未読データを、必要性の大きい順に
並べ変える。インターフェースユニット3が必要性の大
きい順に情報を提示する一方で、提示した情報が必要か
不要かというユーザーの評価を受付ける。学習ユニット
2は、ユーザーの評価と前記複数のキーワードとからス
コア計算にもちいる行列を格納した記憶部4〜7の内容
を修正する。
【0009】
【発明が解決しようとする課題】しかしながら、上述し
た情報フィルタ装置は、使用者の興味が複数の分野を含
む場合に、情報を分野ごとに分けて提示することができ
ないという課題があった。
【0010】本発明は、上記課題を解決するものであ
り、電子又は光を媒体とする情報記憶媒体又は情報通信
網から所定の情報を取り出す場合に、情報の提示の順序
付けの仕方を変えることができ、提示する情報を分野ご
とに分けて提示することのできる情報フィルタ装置及び
情報フィルタリング方法を提供することを目的とする。
【0011】
【課題を解決するための手段】上記課題を解決するため
に本発明の情報フィルタ装置は、使用者がどんな情報を
必要とし不要としたかを表現した行列を複数に分割する
メトリック分割部と、前記メトリック分割部によって複
数に分割された行列を用いて複数の分類必要性と複数の
分類信頼性を計算する分類情報フィルタリングユニット
とを含む構成をしている。
【0012】この構成によって、複数のキーワードは、
距離の定義ができない記号から、使用者の必要度を反映
したメトリックを用いて距離を定義できるベクトル表現
へと変換され、使用者の必要度を定量化することがで
き、使用者は必要性の高い情報から順に情報を得ること
ができるとともに、複数の分類ごとに必要性の高い情報
から順に情報を得ることができるにようになる。
【0013】
【発明の実施の形態】本発明の第1の態様は、提示情報
に対する必要/不要の判定結果が当該情報に付されたキ
ーワード信号から計算されるメトリック信号の形式で記
憶されたメトリック記憶部と、前記メトリック記憶部か
らメトリック信号を取出してメトリック信号を予測され
る興味分野別に分割した分類メトリック信号を生成する
メトリック分割手段と、電子又は光を媒体とする情報記
憶媒体又は情報通信網から入力された入力情報の提示順
序を分割されたメトリック信号を使って組み替える分類
フィルタリング手段と、組み替えられた提示順序に従っ
て興味分野に入力情報を提示する提示手段と、を具備し
たものであり、ユーザーからの必要か否かの評価を示す
入力を用いて情報を分類しその情報の並べ変えを行い情
報をユーザーに必要性の高い順に提示するという作用を
有する。
【0014】本発明の第2の態様は、第1の態様のフィ
ルタリング装置において、前記分類フィルタリング手段
が、入力情報に付された複数のキーワード信号からなる
キーワード群信号を複数のキーワード信号が格納された
辞書を用いてベクトル信号に変換するベクトル変換手段
と、前記キーワード群信号から変換されたベクトル信号
と前記メトリック信号とからスコア信号を計算するスコ
ア計算手段と、計算されたスコア信号に基づいて他の未
読情報も含めた提示順序を決める順序決定手段と、を具
備するものであり、情報をユーザーに必要な順に精度高
く並べ変えるという作用を持つものである。
【0015】本発明の第3の態様は、第1又は第2の態
様の情報フィルタリング装置において、前記メトリック
記憶部が、必要と判定された提示情報に付されたキーワ
ード信号から計算された肯定メトリック信号と、不要と
判定された提示情報に付されたキーワード信号から計算
された否定メトリック信号とをメトリック信号として記
憶するものであり、メトリックをユーザーが必要とした
情報から計算されるものと、不要とした情報から計算さ
れるものの2つを用いることにより、精度の高いスコア
を計算でき、未分類および分類済みの情報をユーザーに
必要な順に精度高く並べ変えるという作用をもつもので
ある。
【0016】本発明の第4の態様は、第1から第3の態
様の情報フィルタリング装置において、肯定メトリック
信号が、入力端子から入力される信号が必要な場合のベ
クトル信号の自己相関行列であり、否定メトリック信号
は、入力端子から入力される信号が不要である場合のベ
クトル信号の自己相関行列であるものとしたことによ
り、簡単な計算でメトリックが計算でき、未分類および
分類済みの情報をユーザーに必要な順に精度高く並べ変
えるという作用を持つ。
【0017】本発明の第5の態様は、第3又は第4の態
様の情報フィルタ装置において、肯定メトリック信号及
び否定メトリック信号それぞれの行列成分である(ij)
成分を、必要とされた情報の頻度と、不要とされた情報
の頻度と、i番目のキーワード信号とj番目のキーワー
ド信号が同時に含まれた情報が必要とされた頻度と、前
記i番目のキーワード信号と前記j番目のキーワード信
号が同時に含まれた情報が不要とされた頻度とから計算
するものであり、精度高くスコア計算ができ、未分類お
よび分類済みの情報をユーザーに必要な順に精度高く並
べ変えるという作用を有する。
【0018】本発明の第6の態様は、第5の態様の情報
フィルタ装置において、肯定メトリック信号及び否定メ
トリック信号の行列成分である(ij)成分が、情報が必要
であるか不要であるかを示す確率分布と、i番目のキー
ワード信号とj番目のキーワード信号が同時に含まれた
情報が必要であるか不要であるかを示す確率分布との違
いを定量的に評価する信号としたものであり、確率分布
の違いを評価することにより、精度高くスコア計算がで
き、未分類および分類済みの情報をユーザーに必要な順
に精度高く並べ変えるという作用を有する。
【0019】本発明の第7の態様は、第1の態様におい
て、前記分類フィルタリング手段が、入力情報に付され
た複数のキーワード信号からなるキーワード群信号を複
数のキーワード信号が格納された辞書を用いてベクトル
信号に変換するベクトル変換手段と、必要な情報から構
成される肯定メトリック信号と前記ベクトル信号とを用
いて肯定スコア信号を計算する手段と、不要な情報から
構成される否定メトリック信号と前記ベクトル信号とを
用いて否定スコア信号を計算する手段と、前記肯定スコ
ア信号及び前記否定スコア信号からなる二次元平面にお
ける入力情報の分布を必要な情報及び不要な情報に分離
する直線の係数である判定パラメータ信号と前記肯定ス
コア信号並びに前記否定スコア信号とから必要性信号及
び信頼性信号を計算する必要性計算部と、前記必要性信
号の大きさにより入力情報の提示順序を決める手段とを
具備したものであり、2つのスコア信号を最適に組み合
わせることで精度の高い必要性信号を計算でき、未分類
および分類済みの情報をユーザーに必要な順に精度高く
並べ変えるという作用を持つ。
【0020】本発明の第8の態様は、第1から第7の態
様の情報フィルタ装置において、提示情報を必要とした
回数を示す全肯定回数及び提示情報を不要とした回数を
示す全否定回数を記憶する回数記憶部と、キーワード信
号を示す文字列を数字に変換する対応表と、前記文字列
がキーワード信号として含まれた情報を必要とした回数
を示す肯定回数及び前記文字列がキーワード信号として
含まれた情報を不要とした回数を示す否定回数を記憶し
た適応辞書記憶部と、提示情報に対する必要/不要の判
定結果と前記情報に含まれたキーワード信号と前記全肯
定回数と前記全否定回数と前記適応辞書記憶部に記憶さ
れた信号とから前記全肯定回数、前記全否定回数及び前
記適応辞書記憶部に記憶された信号を更新する辞書学習
部とを具備したものであり、ユーザーの必要とする情報
を取り出すために有効な辞書が適応的に構成されるとい
う作用を持つ。
【0021】本発明の第9の態様は、第8の態様の情報
フィルタ装置において、辞書の内容の更新は、必要とさ
れた情報の頻度と、不要とされた情報の頻度と、それぞ
れのキーワード信号について前記キーワード信号を含む
情報が必要とされた頻度と、前記キーワード信号を含む
情報が不要とされた頻度とから計算されるキーワードコ
スト信号を用いて行われるものであり、ユーザーの必要
とする情報を取り出すために有効な辞書が適応的に構成
されるという作用を持つ。
【0022】本発明の第10の態様は、第9の態様の情
報フィルタ装置において、それぞれのキーワード信号の
キーワードコスト信号が、情報が必要であるか不要であ
るかを示す確率分布と、前記キーワード信号を含む情報
が必要であるか不要であるかを示す確率分布との違いを
定量的に評価する信号であり、ユーザーの必要とする情
報を取り出すために有効な辞書が適応的に構成されると
いう作用を持つ。
【0023】本発明の第11の態様は、第10の態様の
情報フィルタ装置において、それぞれのキーワード信号
のキーワードコスト信号を、情報が必要であるか不要で
あるかを示す確率分布と、前記キーワード信号が含まれ
た情報が必要であるか不要であるかを示す確率分布との
違いが大きいほど大きな値の信号とし、前記キーワード
コスト信号が大きなキーワード信号を残し、小さいキー
ワード信号を破棄するものとしたので、ユーザーの必要
とする情報を取り出すために有効な辞書が適応的に構成
されるという作用を持つ。
【0024】本発明の第12の態様は、第10の態様の
情報フィルタ装置において、キーワード信号を、分類コ
ードを含むものであり、情報を分類しかつユーザーに必
要な順に精度高く並べ変えるという作用を持つ。
【0025】本発明の第13の態様は、提示情報に対す
る必要/不要の判定結果が当該情報に付されたキーワー
ド信号から計算されたメトリック信号を予測される興味
分野別に分割した分類メトリック信号を生成し、電子又
は光を媒体とする情報記憶媒体又は情報通信網から入力
された入力情報の提示順序を分割されたメトリック信号
を使って組み替え、組み替えられた提示順序に従って興
味分野に入力情報を提示するものであり、情報を分類し
ユーザーに必要な順に精度高く並べ変えるという作用を
持つ。
【0026】本発明の第14の態様は、第13の態様の
情報フィルタリング方法において、辞書を用いて複数の
キーワード信号からなるキーワード群信号をベクトル信
号に変換し、このベクトル信号と前記メトリック信号と
からスコア信号を計算し、そのスコア信号を利用して情
報の提示順序を変えるものであり、情報を分類しユーザ
ーに必要な順に精度高く並べ変えるという作用を持つ。
【0027】本発明の第15の態様は、第14の態様の
情報フィルタリング方法において、メトリック信号を、
入力端子から入力される信号が必要な場合の情報から構
成される肯定メトリック信号と、入力端子から入力され
る信号が不要である場合の情報から構成される否定メト
リック信号で構成したものであり、情報を分類しユーザ
ーに必要な順に精度高く並べ変えるという作用を持つ。
【0028】本発明の第16の態様は、第1から第12
の態様の情報フィルタ装置を用いてデータベースを再構
築するデータベース再構築装置を構成したものであり、
ユーザーに必要な情報が取り出し易いという作用を持
つ。
【0029】本発明の第17の態様は、第13から第1
5の態様の情報フィルタリング方法を用いてデータベー
スを再構築するデータベース再構築方法であり、ユーザ
ーに必要な情報が取り出し易いという作用を持つ。
【0030】以下、本発明の実施の形態について、図面
を用いて詳細に説明する。
【0031】図1に本発明の実施の形態にかかる情報フ
ィルタ装置の構成を示す。この情報フィルタ装置は、履
歴データ記憶ユニット10にユーザーがどんな「情報」
を過去に必要としたかという履歴データが記憶されてお
り、情報フィルタリングユニット11が履歴データ記憶
ユニット10の履歴データを用いて、入力「情報」のフ
ィルタリングを行う。情報フィルタリングユニット11
により実際にフィルタリングされた未読「情報」(ユー
ザーがまだ読んでいない情報)はユーザにとっての必要
性の高さに応じて並べ替えられた状態で未読データ記憶
部12に蓄積される。未読データ記憶部12に蓄積され
た「情報」はディスプレー等の分類インタフェースユニ
ット13によってユーザーが当該未読「情報」を可視で
きるようにしている。14は表示装置を示している。
【0032】また、ユーザーがどんな「情報」を必要と
したかという履歴に関する学習は教師信号を使用して行
われる。ユーザが実際に読んだ「情報」に対するユーザ
の評価が教師信号の形で分類インタフェースユニット1
3から入力され教師データ記憶部15に記憶される。ユ
ーザーがどんな「情報」を必要としたかという履歴に関
する学習は学習ユニット16によって行われる。学習ユ
ニット16が、教師データ記憶部15に記憶された教師
信号に基づいて履歴データ記憶ユニット10の履歴デー
タを更新する。
【0033】さらに、本実施の形態では「情報」を分野
毎に別けて提示するための幾つかの機能ブロックを備え
ている。履歴データ記憶ユニット10に記憶された履歴
データのうち後述する肯定メトリック信号、否定メトリ
ック信号をメトリック分割ユニット17にて複数の履歴
データに分割する。複数(本実施の形態では2個の場合
を記載)の分類情報フィルタリングユニット18−1、
18−2において、メトリック分割ユニット17にて分
割された履歴データを用いて「情報」のフィルタリング
を行って当該「情報」に対するユーザにとっての必要性
及び信頼性をそれぞれ予測する。必要性及び信頼性の予
測結果に応じて並べ替えられた状態で「情報」が分類未
読データ記憶部19−1,19−2に記憶される。分類
未読データ記憶部19−1,19−2に記憶された「情
報」は分類インタフェースユニット13を介してユーザ
に提示される。
【0034】以下に、このように構成された本実施の形
態の情報フィルタ装置の動作内容に付いて説明する。初
めに、本情報フィルタ装置の動作の概略について説明す
る。
【0035】なお、既にユーザーがどんな「情報」を過
去に必要としたかという履歴は学習済みのこととして説
明する。また、単に「情報」と称するものには、当該
「情報」に対応する1つ以上のキーワードが付されてい
るものとする。キーワードは、当該「情報」を構成する
各単語の一部あるいは全体であっても良いし、当該「情
報」を代表するために特別に付したものであっても良
い。
【0036】情報フィルタリングユニット11は、新た
に「情報」が入力されると、当該入力「情報」に付され
たキーワードに関して履歴データ記憶ユニット10から
ユーザーの過去の履歴データを読みだし、入力「情報」
の必要性を必要性信号の形で定量的に評価する。同様
に、複数の分類情報フィルタリングユニット18−1,
18−2も入力「情報」の必要性を分類メトリック信号
を用いて必要性信号の形で定量的に評価する。
【0037】各フィルタリングユニット11、18−
1,18−2で評価された入力「情報」は、未読データ
記憶部12および分類済み未読データ記憶部19−1、
19−2に記憶される。このとき、過去の未読「情報」
を含めて、情報フィルタリングユニット11並びに各分
類情報フィルタリングユニット18−1,18−2によ
って計算された各必要性信号が大きい順に並ぶように入
力「情報」の書き込み制御が行われる。
【0038】そして、ユーザーが望めば、分類インタフ
ェースユニット13では、ユーザーに必要性信号の大き
い順に新たな入力「情報」を含めた未読「情報」を1つ
ひとつ提示(例えば、ディスプレーに表示)する。
【0039】この際に、ユーザーに提示された新たな入
力「情報」を含めた未読「情報」の1つひとつがユーザ
ーにとって必要か不要かを示す教師信号をユーザーが分
類インタフェースユニット13を介して入力することに
より、分類インタフェースユニット13では、当該教師
信号を受け取り、当該「情報」とその教師信号を学習ユ
ニット16に送る。
【0040】なお、ユーザーによる教師信号の入力は、
学習ユニット16の学習能力をより高めるために実施す
るものであり、学習ユニット16の学習能力(ユーザー
がどんな「情報」を過去に必要としたかという履歴の学
習能力)が既に十分に高ければ行う必要はない。
【0041】次に、学習ユニット16では、前記提示し
た「情報」とその教師信号を用いて履歴データ記憶ユニ
ット10の履歴内容を書き換える。このように本実施の
形態の情報フィルタ装置は、より高い学習を通じてユー
ザーに適応し、ユーザーの求める「情報」を分類し、優
先的に提示することができる。
【0042】また、学習を行っていない初期状態では、
ユーザーがどんな「情報」を必要としているのか学習ユ
ニット16では分からないので、入力される全ての新た
な入力「情報」を分類インタフェースユニット13でユ
ーザーが提示を受ける毎に上述したユーザーによる教師
信号の入力は必要である。随時実施する学習を通じてや
がてユーザーに適応し、ユーザーの求める「情報」を分
類しかつ優先的に提示することができる。
【0043】ユーザーの求める「情報」を優先的に提示
するとは、より具体的な使用例で述べるとすれば、ある
「情報」データベースの母集団Aを特定のキーワードで
検索して「情報」の検索集合Bを得たとしても、当該検
索集合Bの「情報」の全てがユーザーにとっては必要で
あるとは限らないし、またユーザーにとっては「情報」
の全てが必要であってもその必要順位は当然存在するこ
とを前提としている。よって、必要から順に不要、ある
いはその必要順位に従って、分類インタフェースユニッ
ト13でユーザーに順に提示することが、ユーザーの求
める「情報」を優先的に提示することを意味する。
【0044】一方、メトリック分割ユニット17は、肯
定メトリック信号MYと否定メトリック信号MNとを複
数(本実施の形態では2つ)に分割し、分類情報フィル
タリングユニット18−1,18−2に書き込む。分類
情報フィルタリングユニット18−1,18−2は、分
割された肯定メトリック信号と否定メトリック信号とを
用いて、情報フィルタリングユニット11と同様の動作
を行い、分類され、かつ必要性の高い順に「情報」を並
べて提示する。
【0045】ここで、情報フィルタリングユニット1
1、分類情報フィルタリングユニット18−1,18−
2において未読「情報」の必要性の順位付けに使用して
いる必要性信号の計算方法について説明する。
【0046】好ましい実施の形態では、必要性信号は概
念的に次のような量として計算される。入力「情報」に
キーワードが添付されている場合を考える。一人のユー
ザーを考えると、そのユーザーが必要としている「情
報」に高い頻度または確率で付いているキーワード集合
Aと、不要としている「情報」に高い頻度または確率で
付いているキーワード集合Bと、さらにはいずれにもよ
く付く、または付かないキーワード集合Cとを考えるこ
とができる。そこで、キーワード集合Aに属するキーワ
ードには正の数値を、キーワード集合Bに属するキーワ
ードには負の値を、キーワード集合Cに属するキーワー
ドには値0をそれぞれ割り振る。
【0047】そして、新たな入力「情報」についている
1つ以上のキーワードについてそれぞれがキーワード集
合A、B、Cのどのキーワードグループに属するかを判
定し、割り振られた値を積算する。
【0048】このような計算手法によれば、キーワード
集合Aに属するキーワードが数多く含まれた「情報」
(ユーザーが必要とする可能性の高い情報)に対しては
大きな正の値を示す必要性信号が算出され、キーワード
集合Bに属するキーワードが数多く付いている「情報」
(ユーザーが不要とする可能性の高い情報)に対しては
大きな負の値を示す必要性信号が算出されることにな
る。
【0049】この必要性信号を用いてユーザーの未読
「情報」に対する必要性を予測することができる。本実
施の形態では、提示した「情報」とその「情報」に関す
るユーザーの必要/不要の評価とからキーワード(キー
ワード共起を含む)への値の割り振りを自動的に行い精
度の高い必要性信号の計算を実現し、精度高く必要性の
高い順に「情報」を並べ変えることを実現している。
【0050】そのために、本実施の形態では、「情報」
に付けられた複数のキーワードを一つのベクトルに変換
し、ユーザーが必要とした場合と不要とした場合につい
て、別々に前記ベクトルの自己相関行列を計算してい
る。
【0051】ユーザーが必要と答えた「情報」について
いたキーワードから作られた自己相関行列MYを用い
て、ベクトルVの長さSYを(1)式にて計算する。
【0052】
【数1】 と計算する。なお、ユーザが学習過程で必要と答えた
「情報」についていたキーワードから作られた自己相関
行列MYを「肯定メトリック信号」、不要と答えた情報
についていたキーワードから作られた自己相関行列MN
を「否定メトリック信号」と呼び、長さSYを肯定信号
と呼ぶものとする。
【0053】ベクトルVの元となった複数のキーワード
の中に、ユーザーが必要とする「情報」によく含まれて
いるキーワードが数多く含まれていれば、長さSYは大
きな正の値をとり、そうでない場合には0に近い値をと
るから、必要性信号を計算する上で有効である。
【0054】次に、本実施の形態の情報フィルタ装置の
各部の構成及び動作について詳しく説明する。
【0055】履歴データ記憶ユニット10は、符号辞書
記憶部21、肯定メトリック記憶部22、否定メトリッ
ク記憶部23、判定パラメータ記憶部24を備えてい
る。
【0056】符号辞書記憶部21は、キーワードなどの
複数の文字列をベクトルに変換するための符号辞書信号
を記憶している。符号辞書記憶部21に記憶された符号
辞書信号は、「情報」についているキーワードなどの文
字列Wを数字Cに変換する対応表をnofDCK個有するコー
ドブックである。
【0057】 DCK[1]=(W[1],C[1]) ・ ・ ・ DCK[nofDCK]=(W[nofDCK],C[nofDCK]) (2) 肯定メトリック記憶部22には、過去にユーザが必要と
答えたや「情報」に含まれていたキーワードから作られ
た自己相関行列で構成される肯定メトリック信号MY
(nofDCK×nofDCKの行列)が記憶されており、否定メト
リック記憶部23には、過去にユーザが不要と答えた
「情報」に含まれていたキーワードから作られた自己相
関行列で構成される否定メトリック信号MNが記憶され
ている。判定パラメータ記憶部24は、判定パラメータ
信号Qを記憶している。
【0058】情報フィルタリングユニットは、ベクトル
生成部25、スコア計算部26、必要性計算部27、未
読データ書込み制御部28を備えている。
【0059】ベクトル生成部25は、個々の「情報」に
つけられた複数のキーワード(正確には、分類コードを
含む文字列)をベクトルに変換する部分であり、キーワ
ード数信号nofKsとnofKs個のキーワード信号からなるキ
ーワード群信号Ks=(K[1],・・・,K[nofK
s])とを受けキーワード群信号Ksと符号辞書信号DCKを
用いてベクトル信号Vに変換する。
【0060】スコア計算部26は、ユーザーがどんな
「情報」を必要/不要としたという履歴を表現した肯定
メトリック信号及び否定メトリック信号を用いて、ベク
トル生成部25で変換された2つのベクトル信号Vの長
さから、ある種のスコアを表す肯定信号SYと否定信号
SNとを計算する計算部である。
【0061】必要性計算部27は肯定信号SYと否定信
号SNを受け判別パラメータ記憶部24から判定パラメ
ータ信号Qを読み出し必要性信号Nと信頼性信号Rを計
算する計算部である。
【0062】未読データ書込み制御部28は、「情報」
の本文である情報データDとキーワード数信号nofKsと
キーワード群信号Ksと必要性信号Nと信頼性信号Rと
を所定の手続きに従って後述する未読データ記憶部12
に書き込む機能を有する。
【0063】なお、未読データ記憶部12は、「情報」
の本文である情報データDとキーワード数信号nofKsと
キーワード群信号Ksと必要性信号Nと信頼性信号Rと
からなる最大nofURD個の未読データを記憶する。
【0064】 URD[1]=(N[1],R[1],nofKs[1],Ks[1],D[1]) ・ ・ ・ URD[nofURD]=(N[nofURD],R[nofURD],nofKs[nofURD], Ks[nofURD],D[nofURD]) (3) また、教師データ記憶部15は最大nofTD個の教師デー
タ信号を記憶する。
【0065】 TD[1]=(T[1],TnofKs[1],TKs[1]) ・ ・ ・ TD[nofTD]=(T[nofTD],TnofKs[nofTD],TKs[nofTD]) (4) 分類インタフェースユニット13は未読データ出力制御
部を備える。未読データ出力制御部は、制御信号DOを
受けて未読データ記憶部12からまたは分類済み未読デ
ータ記憶部19−1,19−2の中から使用者によって
選択されたいずれかの記憶部から未読データ信号URD
[1]を読み出し、表示信号DDを出力する。また、未
読データ出力制御部は、表示信号DDにしたがって表示
された「情報」がユーザーにとって必要か否かを示す教
師信号Tをユーザーから受け、教師信号Tと未読データ
信号URD[1]のキーワード数信号nofKs[1]とキ
ーワ ード群信号Ks[1]とを所定の手続きに従って
教師データ記憶部15に書き込む。
【0066】学習ユニット16は、ユーザーから入力さ
れた教師信号Tを用いて肯定/否定メトリック信号を修
正するメトリック学習を行う部分と、肯定/否定信号か
ら必要性信号を計算するためのパラメータである判定パ
ラメータ信号を修正する部分と、各部分を制御する部分
とから大きく構成される。
【0067】図2に学習ユニット16及びその周辺回路
の機能ブロックを示す。
【0068】まず、メトリック学習を行う部分の構成に
ついて説明する。学習ユニット16は、肯定メトリック
記憶部22に記憶された肯定メトリック信号MYと否定
メトリック記憶部23に記憶された否定メトリック信号
MNとを修正するメトリック学習部201を備えてい
る。メトリック学習部201は、教師データ記憶部15
から教師データTDを読み出し、上記ベクトル生成部2
5と同じ機能である学習用ベクトル生成部202で複数
のキーワードをベクトルに変換し、自己相関行列を計算
することで、肯定/否定メトリック信号を修正する。
【0069】次に、判定パラメータ信号の学習を行う部
分の構成につて説明する。学習ユニット16は、学習の
ためのスコア計算を行う学習用スコア計算部203を備
える。学習用スコア計算部203は、学習用肯定信号計
算部204と学習用否定信号計算部205とからなる。
学習用肯定信号計算部204は、学習用ベクトル生成部
202からの学習用ベクトル信号を受け学習用肯定信号
LSYを計算し、学習用否定信号計算部205は学習用
ベクトル生成部202からの学習用ベクトル信号を受け
学習用否定信号LSNを計算する。
【0070】また、学習ユニット16は判定面学習部2
06を備えている。判定面学習部206は、学習制御部
207からの判定パラメータ学習制御信号PLCを受け
て所定の方法で判定パラメータ記憶部24の判定パラメ
ータ信号を書き換える。学習制御部207は学習開始信
号LSを受けてスイッチ208、209、210とメト
リック学習部201と学習用ベクトル生成部202と学
習用スコア計算部203と判定面学習部206とを制御
する。
【0071】次に、以上のように構成された情報フィル
タ装置の各ユニットごとに図面を用いてその動作を具体
的に説明する。
【0072】情報フィルタ装置の好ましい初期状態の一
例は次のようなものである。すなわち、肯定メトリック
信号MYと否定メトリック信号MNとを(nofDCK×nofD
CK)零行列、未読データ記憶部12の未読データURD
[i]の全ての必要性信号N[i](i=1,・・・,n
ofURD)を使用するハードウエアが表現可能な最小
の値Vmin、教師データ記憶部15の教師データTD
[j]の教師信号T[j]を全て−1とした状態であ
る。
【0073】情報フィルタリングユニット11の動作を
説明する。情報フィルタリングユニット11に対して、
情報データ入力端子から情報データDが入力され、キー
ワード数信号入力端子から情報データに付けられたキー
ワードの個数を表すキーワード数信号nofKsが入力さ
れ、キーワード信号入力端子から複数のキーワードであ
るキーワード群信号Ks=(K[1],K[2],・・
・,K[nofKs])が入力される。
【0074】ベクトル生成部25においてキーワード群
信号Ksが文字列の集まりからベクトル信号Vへと変換
される。この変換によって、キーワード群信号の類似性
をベクトルの距離として計算できるようになる。
【0075】ベクトル生成部25の動作を図3のフロー
チャートに示す。同図に示すように、キーワード数信号
nofKsとキーワード群信号Ksを受けると(S30
1)、内部のベクトル信号V=(V[1],V[2],
・・・,V[nofDic])を(0,0,・・・,0)に、
キーワードカウンタ信号iを1にセットする(S30
2,303)。次に、辞書カウンタ信号jを0セットし
た後辞書カウンタ信号jを1だけ増やす(S304)。
【0076】次に、内部にnofDCK個の符号辞書信号DC
Kを有する符号辞書記憶部21から辞書カウンタjが指
定するキーワードと数字からなる符号辞書信号DCK
[j]を読み出し、符号辞書信号DCKの文字列部分W
[j]とi番目のキーワード信号K[i]とを比較する
(S305)。両者が等しくない場合には、辞書カウン
タjを1だけ増やす(S306)。両者が一致するか、
辞書カウンタjの値が符号辞書記憶部21に格納された
符号辞書信号の個数nofDiCと等しくなるまでステップS
305〜S307の処理を繰り返す。
【0077】キーワード信号K[i]と等しいW[j]
が見つかると、ベクトル信号のj番目の成分V[j]を
1にし(S308)、キーワードカウンタ信号iを1だ
け増やす(S309)。以下、同様の処理をキーワード
カウンタ信号iがキーワード数信号nofKsより大きくな
るまで実行する(S310)。
【0078】このようして、ベクトル生成部25におい
て、文字列信号からなるキーワード信号の集合体である
キーワード群信号Ksは、0と1でコード化されたnofD
CK個の成分を持ったベクトル信号Vに変換される。
【0079】次に、スコア計算部26は、キーワード群
信号Ksに過去にユーザーの必要とした情報に含まれて
いたキーワードが数多く含まれる場合に、大きな値とな
る肯定信号SYを計算する。このために、スコア計算部
26は、ベクトル生成部25からベクトル信号Vを受け
ると、肯定メトリック記憶部22から肯定メトリック信
号MYを読み出し、肯定信号SYを次式にて計算する。
【0080】
【数2】 またスコア計算部26は、キーワード群信号Ksに過去に
ユーザーの不要とした情報に含まれていたキーワードが
数多く含まれる場合に、大きな値となる否定信号SNを
計算する。このために、スコア計算部26は、否定メト
リック記憶部23から否定メトリック信号MNを読み出
し、否定信号SNを計算する。
【0081】
【数3】 肯定メトリック信号MYと否定メトリック信号MNは、
後述するようにキーワード群信号Ksとユーザーの応答
に基づいて決められる。本実施の形態では、このように
計算された肯定信号SYと否定信号SNを用いて、図9
に示したように縦軸に肯定信号SYをとり横軸に否定信
号SNをとった2次元空間上の1点に、情報データDを
対応させることができる。この2次元空間における情報
データDの分布は、ユーザーが必要とするもの(○で表
示)は主に左上部に分布し、ユーザーが不要とするもの
(×で表示)は主に右下部に分布するようになる。した
がって、図10に示したように適切な係数Qを定めるこ
とにより、ユーザーが必要とる情報データDと不要な情
報データDとを分離できる。
【0082】さらに、以下に述べるこの係数Qを用いて
計算される必要性信号Nは、上述の2次元空間で左上に
ある程、すなわち、必要性の高いと予測される情報デー
タDほど大きな値となる。したがって、必要性信号Nの
大きい順に情報データDを並べて提示すれば、ユーザー
は必要な情報を効率よく手に入れることができる。必要
性信号Nと直交する方向の信頼性信号Rは、大まかには
キーワード群信号Ksに含まれていたキーワードのうち
どのくらいのキーワード信号が辞書に含まれていたかを
示す信号である。したがって、この信頼性信号Rの大き
さは、情報フィルタが計算した必要性信号Nがどれだけ
信頼できるのかを示す。
【0083】次に、必要性計算部27は、スコア計算部
26の肯定信号計算で得られた肯定信号SYと否定信号
計算で得られた否定信号SNとを受け、判定パラメータ
記憶部24から判定パラメータ信号Qを読み出し、過去
必要であった情報についていたキーワードが多数あり、
不要であった情報についていたキーワードがほとんどな
い時に大きな値となる必要性信号Nを N=SY−Q・SN と計算し、信頼性信号Rを R=C・SY+SN と計算する。
【0084】次に、未読データ書き込み制御部28の動
作を説明する。図4のフローチャートに未読データ書き
込み制御部28の動作を示す。まず、未読データ書き込
み制御部28は、それぞれの入力端子から情報データD
とキーワード数信号nofKsとキーワード群信号Ksと受
け、必要性計算部27から必要性信号Nと信頼性信号R
とを受け、未読データ部指示端子から出力する未読デー
タ処理信号WIを0から1に変える(S401)。次
に、i=1とし(S402)、未読データ記憶部12に
記憶された未読データURD[i]の必要性信号N
[i](i=1,・・・,nofURD)を順次読み出
し、必要性信号Nと比較し(S403)、必要性信号N
が未読データURD[i]の必要性信号N[i]より大
きくなる(N≧N[i])最初の未読データの番号i1
を検出する(S404、S405)。
【0085】i1番目以降の未読データを URD[i+1]=URD[i] i=i1,・・・,
nofURD と置き換え(S406〜S409)、その後、i1番目
の未読データURD[i1]を N[i1] =N R[i1] =R nofKs[i1] =nofKs Ks[i1] =Ks D[i1] =D と必要性信号N等で置き換える(S410)。この置き
換えが終了すると、未読データ部指示端子から出力する
未読データ部指示信号WIを0に戻し(S411)、処
理を終了する。
【0086】次に、分類インタフェースユニット13で
未読データUDRを読みだし、ユーザーの応答(教師信
号T)を付加して教師データ信号TDをつくる動作に付
いて説明する。
【0087】図5は分類インタフェースユニット13の
動作を示すフローチャートである。好ましい実施の形態
では、未読データ記憶部12は、分類ラベル信号Cat
が0である分類未読データ記憶部として取り扱われる。
以下では、分類インタフェースユニットの動作の説明の
際には、未読データ記憶部12は分類ラベル信号Cat
が0である分類未読データ記憶部として取り扱う。
【0088】分類インタフェースユニット13は、デー
タ読み出し開始信号入力端子から、データ読み出し開始
信号DOが入力される(S501)。分類インタフェー
スユニット13は、アクセスすべき未読データ記憶部1
2または分類未読データ記憶部カテゴリを指定する分類
ラベル信号Catを受け取るべく予め定められた時間待
機する(S502)。前記時間内に分類ラベル信号Ca
tが入力されなかった場合、分類インタフェースユニッ
ト13は、分類ラベル信号Catに標準値(好ましい実
施の形態では、Cat=0)を設定する(S504)。
前記時間内に分類ラベル信号Catに値が入力される
か、または標準値が設定されると、分類ラベル信号Ca
tで指定される分類未読データ記憶部19−Catか
ら、1番目の未読データURD[1]を読み出し(S5
05)、未読データの必要性信号N[1]が最小値Vm
inより大きい場合には、未読データ信号URD[1]
の情報信号D[1]を表示情報信号DDとしてデータ表
示装置14に出力し、待機する(S506、S50
7)。未読データの必要性信号N[1]が最小値Vmi
nに等しい場合には、表示情報信号DDを「データな
し」としてデータ表示端子に出力し、待機する(S50
8)。
【0089】ユーザー(図示せず)は、データ表示装置
14に表示された表示情報信号DDを見て、それが必要
な情報である場合には教師信号T=1、必要でない場合
には教師信号T=0、処理を終了する場合には教師信号
T=−1として、教師信号入力端子に返す(S50
9)。教師信号T=−1の場合、処理を終了し、教師信
号T≠−1の場合には(S511)、未読データ出力制
御部28は、教師データ記憶部15の数式(3)で表わ
される教師データを TD[i]=TD[i−1], i=2,・・・,no
fTD と置き換え(S512)、1番目の教師データTD
[1]を前記教師信号Tと前記未読データのキーワード
数信号nofKs[1]とキーワード群信号Ks[1]とを
用いて T[1] =T TnofKs[1] =nofKs[1] TKs[1] =Ks[1] と置き換え(S513、S515)、未読データ記憶部
12の未読データURDを URD[i]=URD[i+1], i=1,・・・,
(nofURD−1) とし(S516、S517)、nofURD番目の未読データ
の必要性信号を N[nofURD]=(最小値Vmin) とする(S518、S519,S520)。
【0090】次に、学習ユニット16の動作について説
明する。
【0091】図6に学習制御部207の動作の概略を示
すフローチャート示す。まず、学習開始信号入力端子か
ら学習開始信号LSが入力され、学習制御部指示信号出
力端子から出力される学習制御部指示信号LIを0から
1に変え(S601)、処理中を示す。次に、スイッチ
208とスイッチ209とスイッチ210とをメトリッ
ク学習部201と学習用ベクトル生成部202が接続す
る様に切り替える(S602)。
【0092】次に、メトリック学習部201を動作し
(S603)、判定面学習部206を動作させた後(S
604)、LIを0として(S605)、処理を終了す
る。
【0093】次に、メトリック学習部201がユーザー
の応答(教師信号T)とキーワード群信号Ksとを用い
て、肯定/否定メトリック信号を修正する動作を説明す
る。
【0094】図7は、メトリック学習部201の動作フ
ローである。学習制御部207からメトリック学習制御
信号MLCを受けた(S701)メトリック学習部20
1は、肯定メトリック記憶部22から肯定メトリック信
号MYを、否定メトリック記憶部23から否定メトリッ
ク信号MNをそれぞれ読み出す。
【0095】次に、メトリック学習部201は、教師デ
ータカウンタcの値を1にする(S702)。次に教師
データ記憶部15からc番目の教師データ信号TD
[c]を読み出し(S703)、教師データTD[c]
の教師信号T[c]を調べる。教師信号T[c]が−1
でない場合(T≠−1)には(S704)、教師データ
TD[c]のキーワード数信号TnofKs[c] とキーワ
ード群信号TKs[c]とを出力する(S705)。教
師データTD[c]のキーワード数信号TnofKs[c]
とキーワード群TKs[ c]とを受けた学習用ベクト
ル生成部202は、前述の情報フィルタリングユニット
11のベクトル生成部25と同様の動作を行い、学習用
ベクトル信号LVを出力する(S706)。メトリック
学習部201は、学習用ベクトル信号LVを受け、前記
教師データTD[c]の教師信号T[c]がT=1であ
る場合には(S707)、肯定メトリック信号MYを MY[i][j]=MY[i][j]+LV[i]・L
V[j] (ここで、i,j=1〜nofDiC)と修正する(S
708)。
【0096】この処理により、肯定メトリック信号MY
は、ユーザーが必要とした情報データDについていたキ
ーワード信号(複数)に対して大きな値を持つようにな
る。その結果、前述の肯定信号SYが、ユーザーが必要
とする情報データDに対して大きくなるようになる。否
定メトリック信号MNも以下のように同様の処理がなさ
れる。
【0097】教師データTD[c]の教師信号T[c]
がT=0である場合には、否定メトリック信号MNを MN[i][j]=MN[i][j]+LV[i]・L
V[j] (ここで、i,j=1〜nofDiC)と修正する(S
709)。
【0098】教師データカウンタの値を c=c+1 と1だけ増やす(S710)。
【0099】以下、メトリック学習部201は、同様の
動作を、教師データTD[c]の教師信号T[c]がT
[c]=−1になるかまたはc=nofTDとなるまで
繰り返す。T[c]=−1またはc=nofTDとなる
と(S712)、メトリック学習の処理を終了し、メト
リック学習制御信号MLCを学習制御部207に送る。
【0100】学習制御部207は、メトリック学習部2
01からのメトリック学習制御信号MLCを受けて、ス
イッチ208を学習用ベクトル生成部202とスコア計
算部203とが接続するように切り替え、スイッチ20
9とスイッチ210を学習用ベクトル生成部202と判
定面学習部206とが接続するように切り替える。学習
制御部207は、判定面学習制御信号PLCを判定面学
習部206に送る。
【0101】次に、判定面学習部206の動作に付い
て、図8を用いて詳しく説明する。
【0102】判定面学習部206は、図10に示したよ
うに、肯定信号SYと否定信号SNを用いて2次元空間
上に表現されたユーザーが必要とする情報データDとユ
ーザーが不要とする情報データDとをもっともよく分離
する係数Qを求める。
【0103】まず、判定面学習制御信号PLCを受けて
(S801)、教師データカウンタcの値を1にする
(S802)。教師データ記憶部15からc番目の教師
データ信号TD[c]を読み出し(S803)、教師デ
ータTD[c]の教師信号T[c]を調べる(S80
4)。教師信号T[c]が−1でない場合(T≠−1)
には、教師データTD[c]のキーワード数信号TnofK
s[c]とキーワード群信号TKs[c]とを出力する
(S805)。教師データTD[c]のキーワード数信
号TnofKs[c]とキーワード群TKs[c]とを受け
た学習用ベクトル生成部202は 、前述した情報フィ
ルタリングユニット11のベクトル生成部25と同様の
動作を行い、学習用ベクトル信号LVを出力する。
【0104】学習用スコア計算部203は、前述した情
報フィルタリングユニット11のスコア計算部26と同
様の動作を行い、学習用肯定信号LSY[c]と学習用
否定信号LSN[c]とを出力し、判定面学習部206
がそれを受ける(S806)。学習用肯定信号LSY
[c]と学習用否定信号LSN[c]と教師データTD
[c]の教師信号T[c]と判定面学習用信号TC
[c]=(T[c],LSN[c],LSY[c])を
内部の記憶素子に記憶する(S807)。そして、教師
データカウンタの値を c=c+1 と1だけ増やす(S808)。
【0105】以下、判定面学習部206は、同様の動作
を、教師データTD[c]の教師信号T[c]がT
[c]=−1になるかまたはc=nofTD+1となる
まで繰り返す(S809)。T[c]=−1またはc=
nofTDとなると、学習用肯定信号LSY[c]計算
等の処理を終了する。
【0106】次に、判定面学習部206は、内部の記憶
素子に記憶された判定面学習用信号TC[c](c=
1、・・・)は、横軸をLSN[c]、縦軸をLSY
[c]とし、T[c]=1を○、T[c]=0を×で示
すと、図9に示すような分布となる。これらのうち、教
師信号T[c]=1であるものと前記教師信号T[c]
=0であるものとが、図9に示したように最もよく分離
できる判定パラメータQを、山登り法によって計算する
(S810)。
【0107】次に、判定パラメータQを判定パラメータ
記憶部24に書き込み、学習制御部207に判定面学習
制御信号PLCを送り(S811)、処理を終了する。
【0108】学習制御部207は、判定面学習部206
から判定面学習制御信号PLCを受け、学習制御部指示
信号を待機中を示す値にし、処理を終了する。
【0109】図9に示したように、上述の2つのメトリ
ック信号を用いてキーワード群信号を肯定信号SYと否
定信号SNとで表される2次元空間上で、ユーザーが必
要とする情報は主に左上に、不要な情報は右下に分布す
るようになる。したがって、上記ように適切な係数Qを
用いて必要性信号をN=SY−Q・SNとすれば、必要
性信号は、ユーザーが必要とする情報に対して大きな値
をとるようになる。
【0110】以上のような動作により、肯定メトリック
記憶部22と否定メトリック記憶部23には、使用者の
興味を反映した行列(肯定メトリック信号MYと否定メ
トリック信号MN)が生成される。
【0111】本実施の形態は、以上のようにして生成さ
れた使用者の興味を反映した行列を適切に分割すること
により、使用者ごとに適した興味の分類を実現する。
【0112】具体的には、メトリック分割ユニット17
が肯定メトリック信号MYと否定メトリック信号MNと
を読み出し、これを使用者の興味を反映したグループに
分割した分類肯定メトリック信号ClassMYと分類
否定メトリック信号ClassMNを生成し、分類情報
フィルタユニット18−1、18−2内の分類肯定メト
リック記憶部と分類否定メトリック記憶部に書き込む。
【0113】図11にメトリック分割ユニット17の構
成を示す。メトリック分割ユニット17は、枝切り処理
部1101、枝切り肯定メトリック記憶部1102、枝
切り否定メトリック記憶部1103を備える。枝切り処
理部1101は、分類パラメータ記憶部36から枝切閾
値を読み出し肯定メトリック信号MYおよび否定メトリ
ック信号MNのうち分類時にノイズとなりやすい成分を
除く枝切り処理を実行する。枝切り肯定メトリック記憶
部1102は、枝切り処理をされた肯定メトリック信号
である枝切り肯定メトリック信号CMYを記憶する記憶
部であり、枝切り否定メトリック記憶部1103は枝切
り処理をされた否定メトリック信号である枝切り否定メ
トリック信号CMNを記憶する記憶部である。
【0114】また、メトリック分割ユニット17は、枝
切りメトリック合成部1104、行列演算部1105、
行列演算制御部1106を備える。枝切りメトリック合
成部1104は、枝切り肯定メトリック信号CMYと枝
切り否定メトリック信号CMNとから枝切りメトリック
信号CMを計算する。行列演算制御部1106は枝切り
メトリック信号CMを用いて行う行列演算を制御する制
御部であり、行列演算部1105は行列演算制御部11
06によって制御される行列演算部である。
【0115】さらに、メトリック分割ユニット17は、
行列演算入力記憶部1107、分類ラベル記憶部110
8、分類メトリック書き出し部1109を備える。行列
演算入力記憶部1107は、行列演算部1105への入
力を記憶している行列演算入力記憶部であり、分類ラベ
ル記憶部1108は行列演算の結果に基づき分類ラベル
を成分とするベクトルを記憶する記憶部である。分類メ
トリック書き出し部1109は分類ラベル記憶部110
8に記憶されたベクトルの成分と枝切り肯定メトリック
信号CMY、枝切り否定メトリック信号CMNと分類パ
ラメータ記憶部36から最大分類数を読み出し、分類情
報フィルタリングユニットの分類肯定メトリック信号C
lassMYと分類否定メトリック信号ClassMN
とを設定する。
【0116】次に、メトリック分割ユニット17の動作
についてフローチャートを用いて説明する。メトリック
分割ユニット17は、学習開始信号入力端子から学習開
始信号LSが入力されると待機状態に入り、その後、学
習制御部指示信号LIの値が1から0に変わり、学習ユ
ニット16の動作が終了したことを示されると、図12
から図15のフローチャート示された以下の処理を開始
する。
【0117】図12は、枝切り処理部1101の処理を
示したフローチャートである。この処理は、肯定メトリ
ック信号MYおよび否定メトリック信号MNの各成分の
うち、あまり値の大きくないものを枝切りする処理であ
る。枝切り処理によって、行列で表現できる2つのメト
リック信号は、互いに独立な部分行列の和としてかけや
すくなる。
【0118】枝切り処理部1101は、分類開始信号入
力端子から分類開始信号CStを受け取ると、分類パラ
メータ記憶部36から枝切閾値Nlowを読み出し(S
1201)す。また、行カウンタiと列カウンタjを0
に設定する(S1202,1203)。
【0119】次に、肯定メトリック記憶部22から肯定
メトリック信号MYの(ij)成分MY[i][j]と
否定メトリック記憶部23から否定メトリック信号MN
の(ij)成分MN[i][j]とを読み出す(S12
04,1205)。
【0120】肯定メトリック信号MYの(ij)成分=
MY[i][j]と否定メトリック信号MNの(ij)
成分=MN[i][j]との和と枝切閾値Nlowとを
比較する(S1206)。
【0121】前記和が、枝切閾値Nlowより大きけれ
ば、肯定メトリック信号MYの(ij)成分=MY
[i][j]を枝切り肯定メトリック信号CMYの(i
j)成分=CMY[i][j]に、否定メトリック信号
MNの(ij)成分をMN[i][j]を枝切り肯定メ
トリック信号CMNの(ij)成分=CMN[i]
[j]に代入する(S1207,1208)。そして、
列カウンタjを一つ増やす(S1211)。以下、同様
の処理を全ての成分に対して行う。
【0122】以上の枝切り処理が終了すると、枝切り処
理部1101は、枝切りメトリック合成部1104にメ
トリック合成開始信号を送る。
【0123】枝切りメトリック合成部1104は、図1
3に記載したフローチャートにしたがって、合成処理を
実行する。まず、行カウンタiと列カウンタjを0に設
定する(S1301,1302)。そして、枝切り肯定
メトリック記憶部1102から枝切り肯定メトリック信
号CMYの(ij)成分=CMY[i][j]を読み出
し(S1303)、枝切り否定メトリック記憶部110
3から枝切り否定メトリック信号CMNの(ij)成分
=CMN[i][j]を読み出す(S1304)。
【0124】次に、枝切り肯定メトリック信号のCMY
[i][j]と枝切り否定メトリック信号のCMN
[i][j]との和を計算し、(ij)成分の分類行列
信号Classを生成する(S1305)。
【0125】そして、列カウンタjを一つ増やし(S1
306)、列カウンタjが列数NofDiCを越えるまで、同
様の処理を全ての成分に対して行う(S1307)。ま
た行カウンタiを一つ増やし(S1308)、行カウン
タが行数NofDiCを越えるまで、同様の処理を全ての成分
に対して行う(S1309)。行列演算部1105は、
その処理が終了すると、行列演算制御部1106に行列
演算開始信号を送る。
【0126】行列演算制御部1106は、行列演算開始
信号を受けると、分類行列信号Classによって独立
に変換されるベクトルを検出する処理を行う。処理の詳
細について、図14に示したフローチャートを参照しな
がら説明する。この一連の処理の目的は、分類行列によ
って互いに変換され得る入力ベクトルの成分を特定する
ことにある。その意味は、互いに変換され得る入力ベク
トルの成分には対応するキーワードが相互に関係あると
みなすことができる。したがって、互いに変換され得る
入力ベクトルの成分をいくつかのグループに分割するこ
とは、使用者の興味をいくつかに分類することに対応す
ると見なすことができる。
【0127】まず、行列演算制御部1106は、分類ラ
ベル記憶部1108に記憶された分類ラベルベクトルC
atVを0ベクトルに初期化する(S1401)。つぎ
に、カテゴリ信号Catに最初のカテゴリであることを
示す値1を代入する(S1402)。入力ベクトルを決
定するに先立ち行列演算入力記憶部1107に記憶され
た入力ベクトルCVを0ベクトルに初期化する(S14
03)。そして、成分カウンタiを0に設定する(S1
404)。成分カウンタiによって指定される分類ラベ
ルベクトルCatVの第i成分CatV[i]が0に等
しいか否かを判定する(S1405)。等しい場合に
は、入力ベクトルCVの第i成分CV[i]に1を代入
する(S1406)。これによって、ただ一つの成分が
1であり、他の成分はすべて0という初期入力ベクトル
が得られる。
【0128】この入力ベクトルに分類行列信号Clas
sを掛け、変換ベクトルCVtmpを得る(S140
7)。変換ベクトルCtmpの全ての成分に対し Ctmp[i]= Θ(Ctmp[i]) という変換を行う(S1408〜S1411)。ここ
で、関数Θは、 Θ(x)=1、 x>0 0、 その他の場合 という関数である。この成分が1または0である変換ベ
クトルCVtmpと入力ベクトルCVと比較する(S1
412)。変換ベクトルCVtmpと入力ベクトルCV
が異なる場合は、変換ベクトルCVtmpを入力ベクト
ルCVに代入し、ステップS1407に戻る(S141
5)。 変換ベクトルCVtmpと入力ベクトルCVが
等しい場合は、分類ラベルベクトルCatVを CatV=CatV+Cat・CV と変更する(S1413)。そして、カテゴリ信号Ca
tを1だけ増やし、ステップS1403に戻る。
【0129】そして、分類ラベルベクトルのすべての成
分の値が0でなくなると、処理の流れがステップS14
17から終了へ分岐する。
【0130】以上の処理により、分類ラベルベクトルC
atVは、枝切り肯定メトリック信号CMYと枝切り否
定メトリック信号CMNとから作られた分類行列信号C
lassが4つの独立な行列からなる場合、例えば、 初期状態 CatV=(0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0) Cat=1 CatV=(1,0,1,0,0,0,0,0,1,
0,1,0,0,0,0) Cat=2 CatV=(1,2,1,0,2,0,2,0,1,
0,1,2,2,0,0) Cat=3 CatV=(1,2,1,3,2,3,2,0,1,
3,1,2,2,0,3) Cat=4 CatV=(1,2,1,3,2,3,2,4,1,
3,1,2,2,4,3) というように変化する。
【0131】このようにして、互いに変換され得る入力
ベクトルの成分をいくつかのグループに分割することに
より、使用者の興味をいくつかに分類することができ
る。
【0132】次に、この結果を用いて分類情報フィルタ
リングユニットを設定する。分類ラベルベクトルCat
Vが得られると、行列演算制御部1106は、分類メト
リック書き出し部1109に書き出し開始信号を送る。
【0133】分類メトリック書き出し部1109は、書
き出し開始信号を受けて、図15のフローチャートに示
された処理を開始する。この一連の処理の目的は、枝切
り肯定メトリック信号CMYと枝切り否定メトリック信
号CMNを、分類ラベルベクトルに基づいて、最大分類
数NCmax以下の数に分割し、それぞれを分類情報フ
ィルタリングユニットの分類肯定メトリック記憶部31
と分類否定メトリック記憶部32とに書き込むことにあ
る。
【0134】まず、分類ラベルベクトルを読み出す(S
1501)。次に、分類パラメータ記憶部36から最大
分類数NCmaxを読み出す(S1502)。図1に示し
た本実施の形態の場合、分類情報フィルタリングユニッ
ト(18−1,18−2)が2個であるので、最大分類
数NCmax=2とすることが望ましい。
【0135】次に、NCmax個の分類情報フィルタリン
グユニット18−1〜NCmaxの分類肯定メトリック
信号ClassMY,分類否定メトリック信号Clas
sMNすべてを零行列に初期化する(S1503,15
04)。行カウンタiを0にし(S1505)、列カウ
ンタjを0にする(S1506)。
【0136】そして、分類ラベルベクトルの第i成分C
atV[i]が最大分類数NCmax以下であるか否か
を判断する(S1507)。CatV[i]<NCma
xであればステップS1508に進み、CatV[i]
がNCmaxより大きければステップS1515に進
む。
【0137】ステップS1508では、分類ラベルベク
トルの第i成分CatV[i]と第j成分CatV
[j]とを比較する。分類ラベルベクトルの第i成分C
atV[i]と第j成分CatV[j]とが等しかった
場合、これは2つの成分は、分類行列Classによっ
て互いに変換される。つまり独立していないことを意味
するから、枝切り肯定メトリック信号CMYの(ij)
成分=CMY[i][j]と枝切り否定メトリック信号
CMNの(ij)成分=CMN[i][j]とを読み出
す(S1509,1510)。
【0138】そして、分類番号CatV[i]の分類情
報フィルタリングユニット18−CatV[i]の分類
肯定メトリック信号ClassMYの(ij)成分に前
記枝切り肯定メトリック信号の(ij)成分を代入し、
分類否定メトリック信号ClassMNの(ij)成分
に前記枝切り否定メトリック信号の(ij)成分を代入
する(S1511,S1512)。
【0139】一方、ステップS1508において、2つ
の成分が等しくない場合、2つの成分、分類行列Cla
ssによって互いに変換されない、つまり2つの成分は
独立していることを意味する。
【0140】そして、列カウンタjを一つ増やし(S1
513)、列カウンタjの値と分類ラベルベクトルの次
元NofDiCとを比較する(S1514)。列カウンタjの
値が、分類ラベルベクトルの次元より小さければステッ
プS1508に戻る。列カウンタjの値が、分類ラベル
ベクトルの次元以上であれば、ステップS1515に進
む。
【0141】ステップS1515では、行カウンタiの
値を1だけ増やす。行カウンタiの値が分類ラベルベク
トルの次元NofDiCと比較する(S1516)。行カウン
タiの値が、分類ラベルベクトルの次元より小さければ
ステップS1506に戻る。行カウンタiの値が、分類
ラベルベクトルの次元以上であれば、処理を終了する。
【0142】以上の処理により、分類情報フィルタリン
グユニット18はすべて適切に設定(分類肯定メトリッ
ク信号と分類否定メトリック信号がともに零行列ある場
合を含む)される。
【0143】各々の分類情報フィルタリングユニット1
8の動作は、情報フィルタリングユニット11の動作と
同様であるので、説明を省略する。
【0144】なお、判定パラメータQの計算方法とし
て、ここでは、山登り法を採用したが、判定面と学習用
必要性信号LNと学習用信頼性信号LRとの距離に基づ
いて構成されるコスト関数
【0145】
【数4】 を最大にする判定面パラメータCをニュートン法、挟み
撃ち法などで求める方法であってもよい。
【0146】また、肯定メトリック信号MYと否定メト
リック信号MNの学習を忘却の効果を入れた MY[i][j]=α・MY[i][j]+LV[i]
・LV[j] MN[i][j]=β・MN[i][j]+LV[i]
・LV[j] を用いてもよい結果が得られる。ここで、αとβとは、
1より小さい正の数さらに、文献「情報処理学会技術報
告、自然言語処理101−8(1994.5.27)」
などに記載された文書からキーワード群信号とキーワー
ド数信号を生成するキーワード生成部を付加する構成を
とれば、キーワードが与えられていない情報に対しても
適用できる情報フィルタ装置を構成することができる。
【0147】タイトルがつけられた情報については、タ
イトルを構成する単語をもってキーワードとし、キーワ
ード数信号とキーワード群信号を生成してもよい。
【0148】加えて、キーワード信号は、国際特許分類
番号など分類記号を含むようにもしても、本発明の構成
を変更する必要はなく、よい結果をえることができる。
【0149】また、本発明の実施の形態では、未読デー
タURDを1つずつ提示する場合について示したが、表
示装置(図示せず)の大きさによっては、複数の未読デ
ータURDを同時に表示し、使用者が複数表示されたど
の未読データに対して応答したのかが正しく情報フィル
タ装置に伝えられるような構成を取ることは容易であ
る。
【0150】以上のように、実施の形態は、図14、図
15のフローチャートに示したように、キーワードの同
時出現に注目してユーザーの応答とキーワードとの関係
を反映した肯定メトリック信号MY、否定メトリック信
号とを分割し、この分割された2つのメトリック信号を
用いて、従来の技術では単一の評価しかできなかった必
要性を、ユーザーの興味を反映した上で複数の必要性を
算出し、それぞれの必要性の順番に並べることにより、
情報を分類しかつ必要な順番に提示するといったことが
可能になる点にある。
【0151】本発明の実施の形態の情報フィルタ装置に
よれば、ユーザーからの教師信号に基づいた学習によっ
て、ユーザーの必要とする情報に対しては、その情報が
分類されかつ必要性信号が大きな値を取るようになり、
その結果、表示装置等のインターフェースユニットに
は、ユーザーにとって必要性が高い情報が優先的に表示
されるようになる。
【0152】さらに、本実施の形態では、特開平9−288
683号公報に開示された情報フィルタ装置の実施の形態
に準拠して説明を行ったが、特開平9−288683号公報に
開示された情報フィルタ装置の実施の形態2に準拠する
構成をとることは容易である。
【0153】また、同じく特開平9−288683号公報に開
示された情報フィルタ装置の実施の形態3に開示されて
いるデータベース再構築装置に、本発明を適用し、情報
を分類しながらデータベースを再構築するデータベース
再構築装置をつくることも容易である。
【0154】
【発明の効果】以上のように、本発明は、情報に割り振
られた複数のキーワードをベクトルに変換するベクトル
生成部と、前記ベクトルと使用者からの教師信号を用い
てスコアを計算するスコア計算部と、前記スコアから必
要性と信頼性を計算する必要性計算部と、スコア計算部
がスコアを計算する際に用いるメトリックを使用者から
与えられる情報の必要/不要という単純な評価をもとに
計算するメトリック学習部とを設け、情報をユーザーの
必要度にしたがって並べ、ユーザーに対して必要性の高
い情報から順に提供することにより、初心者にも精度の
高い情報を得ることができ、更に使用者にとって必要性
の高い情報の取り出し易い情報フィルタ装置を提供する
ことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態にかかる情報フィルタ装置
のブロック結線図
【図2】上記実施の形態における学習ユニットのブロッ
ク結線図
【図3】上記実施の形態におけるベクトル生成部の動作
を説明するフローチャート
【図4】上記実施の形態における未読データ書き込み制
御部の動作を説明するフローチャート
【図5】上記実施の形態における分類インターフェース
ユニットの動作を説明するフローチャート
【図6】上記実施の形態における学習制御部の動作を説
明するフローチャート
【図7】上記実施の形態におけるメトリック学習部の動
作を説明するフローチャート
【図8】上記実施の形態における判定面学習部の動作を
説明するフローチャート
【図9】本発明の実施の形態の情報フィルタ装置の判定
面学習部の動作を説明するための図
【図10】本発明の実施の形態の情報フィルタ装置の判
定面学習部の動作を説明するための図
【図11】上記実施の形態におけるメトリック分割ユニ
ットのブロック結線図
【図12】上記実施の形態における枝切り処理部の動作
を説明するフローチャート
【図13】上記実施の形態における枝切りメトリック合
成部の動作を説明するフローチャート
【図14】上記実施の形態における行列演算制御部の動
作を説明するフローチャート
【図15】上記実施の形態における分類メトリック書出
し部の動作を説明するフローチャート
【図16】従来の情報フィルタ装置のブロック結線図
【符号の説明】
10 履歴データ記憶ユニット 11 情報フィルタリングユニット 12 未読データ記憶部 13 分類インターフェースユニット 14 データ表示装置 15 教師データ記憶部 16 学習ユニット 17 メトリック分割ユニット 18−1,18−2 分類情報フィルタリングユニット 19 分類未読データ記憶部 21 符号辞書記憶部 22 肯定メトリック記憶部 23 否定メトリック記憶部 24 判定パラメータ記憶部 25 ベクトル生成部 26 スコア計算部 27 必要性計算部 28 未読データ書込み制御部 31 分類肯定メトリック記憶部 32 分類否定メトリック記憶部 33 分類スコア計算部 34 分類必要性計算部 35 分類未読データ書込み制御部 36 分類パラメータ記憶部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 渡辺 泰助 神奈川県川崎市多摩区東三田3丁目10番1 号 松下技研株式会社内 Fターム(参考) 5B075 ND03 NK02 NK47 NR05 NR20 PQ75 PR03 PR08 UU40

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 提示情報に対する必要/不要の判定結果
    が、当該情報に付されたキーワード信号から計算される
    メトリック信号の形式で記憶されたメトリック記憶部
    と、前記メトリック記憶部からメトリック信号を取出し
    てメトリック信号を予測される分野別に分割した分類メ
    トリック信号を生成するメトリック分割手段と、電子又
    は光を媒体とする情報記憶媒体又は情報通信網から入力
    された入力情報の提示順序を、分割されたメトリック信
    号を使って組み替える分類フィルタリング手段と、組み
    替えられた提示順序に従って分野別に情報を提示する提
    示手段と、を具備する情報フィルタ装置。
  2. 【請求項2】 前記分類フィルタリング手段は、入力情
    報に付された複数のキーワード信号からなるキーワード
    群信号を複数のキーワード信号が格納された辞書を用い
    てベクトル信号に変換するベクトル変換手段と、前記キ
    ーワード群信号から変換されたベクトル信号と前記メト
    リック信号とからスコア信号を計算するスコア計算手段
    と、計算されたスコア信号に基づいて他の未読情報も含
    めた提示順序を決める順序決定手段と、を具備する請求
    項1記載の情報フィルタ装置。
  3. 【請求項3】 前記メトリック記憶部は、必要と判定さ
    れた提示情報に付されたキーワード信号から計算された
    肯定メトリック信号と、不要と判定された提示情報に付
    されたキーワード信号から計算された否定メトリック信
    号とをメトリック信号として記憶することを特徴とする
    請求項1又は請求項2に記載の情報フィルタ装置。
  4. 【請求項4】 肯定メトリック信号は、必要と判定され
    た提示情報に付されたキーワード信号からなるキーワー
    ド群信号から変換されたベクトル信号の自己相関行列で
    あり、否定メトリック信号は、不要と判定された提示情
    報に付されたキーワード信号からなるキーワード群信号
    から変換されたベクトル信号の自己相関行列であること
    を特徴とする請求項1から請求項3のいずれかに記載の
    情報フィルタ装置。
  5. 【請求項5】 肯定メトリック信号及び否定メトリック
    信号それぞれの行列成分である(ij)成分は、必要とさ
    れた情報の頻度と、不要とされた情報の頻度と、i番目
    のキーワード信号とj番目のキーワード信号が同時に含
    まれた情報が必要とされた頻度と、前記i番目のキーワ
    ード信号と前記j番目のキーワード信号が同時に含まれ
    た情報が不要とされた頻度とから計算されることを特徴
    とする請求項3又は請求項4に記載の情報フィルタ装
    置。
  6. 【請求項6】 前記肯定メトリック信号及び否定メトリ
    ック信号の行列成分である(ij)成分は、情報が必要であ
    るか不要であるかを示す確率分布と、i番目のキーワー
    ド信号とj番目のキーワード信号が同時に含まれた情報
    が必要であるか不要であるかを示す確率分布との違いを
    定量的に評価する信号であることを特徴とする請求項5
    記載の情報フィルタ装置。
  7. 【請求項7】 前記分類フィルタリング手段は、入力情
    報に付された複数のキーワード信号からなるキーワード
    群信号を複数のキーワード信号が格納された辞書を用い
    てベクトル信号に変換するベクトル変換手段と、必要な
    情報から構成される肯定メトリック信号と前記ベクトル
    信号とを用いて肯定スコア信号を計算する手段と、不要
    な情報から構成される否定メトリック信号と前記ベクト
    ル信号とを用いて否定スコア信号を計算する手段と、前
    記肯定スコア信号及び前記否定スコア信号からなる二次
    元平面における入力情報の分布を必要な情報及び不要な
    情報に分離する直線の係数である判定パラメータ信号と
    前記肯定スコア信号並びに前記否定スコア信号とから必
    要性信号及び信頼性信号を計算する必要性計算部と、前
    記必要性信号の大きさにより入力情報の提示順序を決め
    る手段と、を具備した請求項1に記載の情報フィルタ装
    置。
  8. 【請求項8】 提示情報を必要とした回数を示す全肯定
    回数及び提示情報を不要とした回数を示す全否定回数を
    記憶する回数記憶部と、キーワード信号を示す文字列を
    数字に変換する対応表と、前記文字列がキーワード信号
    として含まれた情報を必要とした回数を示す肯定回数及
    び前記文字列がキーワード信号として含まれた情報を不
    要とした回数を示す否定回数を記憶した適応辞書記憶部
    と、提示情報に対する必要/不要の判定結果と前記情報
    に含まれたキーワード信号と前記全肯定回数と前記全否
    定回数と前記適応辞書記憶部に記憶された信号とから前
    記全肯定回数、前記全否定回数及び前記適応辞書記憶部
    に記憶された信号を更新する辞書学習部とを具備した請
    求項1から請求項7のいずれか記載の情報フィルタ装
    置。
  9. 【請求項9】 辞書の内容の更新は、必要とされた情報
    の頻度と、不要とされた情報の頻度と、それぞれのキー
    ワード信号について前記キーワード信号を含む情報が必
    要とされた頻度と、前記キーワード信号を含む情報が不
    要とされた頻度とから計算されるキーワードコスト信号
    を用いて行われることを特徴とする請求項8に記載の情
    報フィルタ装置。
  10. 【請求項10】 それぞれのキーワード信号のキーワー
    ドコスト信号は、情報が必要であるか不要であるかを示
    す確率分布と、前記キーワード信号を含む情報が必要で
    あるか不要であるかを示す確率分布との違いを定量的に
    評価する信号であることを特徴とする請求項9に記載の
    情報フィルタ装置。
  11. 【請求項11】 それぞれのキーワード信号のキーワー
    ドコスト信号は、情報が必要であるか不要であるかを示
    す確率分布と、前記キーワード信号が含まれた情報が必
    要であるか不要であるかを示す確率分布との違いが大き
    いほど大きな値の信号であり、前記キーワードコスト信
    号が大きなキーワード信号を残し、小さいキーワード信
    号を破棄することを特徴とする請求項10に記載の情報
    フィルタ装置。
  12. 【請求項12】 キーワード信号は、分類コードを含む
    ことを特徴とする請求項1から請求項11のいずれかに
    記載の情報フィルタ装置。
  13. 【請求項13】 提示情報に対する必要/不要の判定結
    果が当該情報に付されたキーワード信号から計算された
    メトリック信号を予測される分野別に分割した分類メト
    リック信号を生成し、電子又は光を媒体とする情報記憶
    媒体又は情報通信網から入力された入力情報の提示順序
    を分割されたメトリック信号を使って組み替え、組み替
    えられた提示順序に従って分野別に情報を提示すること
    を特徴とする情報フィルタリング方法。
  14. 【請求項14】 辞書を用いて複数のキーワード信号か
    らなるキーワード群信号をベクトル信号に変換し、この
    ベクトル信号と前記メトリック信号とからスコア信号を
    計算し、そのスコア信号を利用して情報の提示順序を変
    えることを特徴とする請求項13に記載の情報フィルタ
    リング方法。
  15. 【請求項15】 メトリック信号は、入力端子から入力
    される信号が必要な場合の情報から構成される肯定メト
    リック信号と、入力端子から入力される信号が不要であ
    る場合の情報から構成される否定メトリック信号である
    ことを特徴とする請求項14に記載の情報フィルタリン
    グ方法。
  16. 【請求項16】 請求項1から請求項12のいずれかに
    記載の情報フィルタ装置を用いてデータベースを再構築
    するデータベース再構築装置。
  17. 【請求項17】 請求項13から請求項15のいずれか
    に記載の情報フィルタリング方法を用いてデータベース
    を再構築するデータベース再構築方法。
JP31241798A 1998-11-02 1998-11-02 情報フィルタ装置及び情報フィルタリング方法 Expired - Fee Related JP3344953B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP31241798A JP3344953B2 (ja) 1998-11-02 1998-11-02 情報フィルタ装置及び情報フィルタリング方法
EP99121585A EP0999502A3 (en) 1998-11-02 1999-10-29 Information filtering apparatus and information filtering method
US09/431,232 US6286012B1 (en) 1998-11-02 1999-11-01 Information filtering apparatus and information filtering method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31241798A JP3344953B2 (ja) 1998-11-02 1998-11-02 情報フィルタ装置及び情報フィルタリング方法

Publications (2)

Publication Number Publication Date
JP2000137731A true JP2000137731A (ja) 2000-05-16
JP3344953B2 JP3344953B2 (ja) 2002-11-18

Family

ID=18028986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31241798A Expired - Fee Related JP3344953B2 (ja) 1998-11-02 1998-11-02 情報フィルタ装置及び情報フィルタリング方法

Country Status (3)

Country Link
US (1) US6286012B1 (ja)
EP (1) EP0999502A3 (ja)
JP (1) JP3344953B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020004234A (ko) * 2000-07-04 2002-01-16 김월영 포인트제도를 이용한 정보제공자의 대우에 관한 방법
JP2002014964A (ja) * 2000-06-28 2002-01-18 Victor Co Of Japan Ltd 情報提供システム及び情報提供方法
US8442926B2 (en) 2008-01-08 2013-05-14 Mitsubishi Electric Corporation Information filtering system, information filtering method and information filtering program

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3344953B2 (ja) * 1998-11-02 2002-11-18 松下電器産業株式会社 情報フィルタ装置及び情報フィルタリング方法
AU6263101A (en) * 2000-05-26 2001-12-03 Tzunami Inc. Method and system for organizing objects according to information categories
US7174305B2 (en) * 2001-01-23 2007-02-06 Opentv, Inc. Method and system for scheduling online targeted content delivery
JP4374787B2 (ja) * 2001-02-28 2009-12-02 ブラザー工業株式会社 通信装置
US7620621B2 (en) 2001-05-01 2009-11-17 General Electric Company Methods and system for providing context sensitive information
WO2002103571A1 (en) * 2001-06-15 2002-12-27 Apogee Networks Seneric data aggregation
WO2003017065A2 (en) * 2001-08-21 2003-02-27 Apogee Networks Content ownership resolution
US20030130887A1 (en) * 2001-10-03 2003-07-10 Thurston Nathaniel Non-deterministic method and system for the optimization of a targeted content delivery
EP1514417A4 (en) * 2002-05-31 2005-06-15 Predictive Media Corp METHOD AND SYSTEM FOR STORING, LOOKING AND MANAGING AND DELIVERING TARGETED ADVERTISING
JP4349875B2 (ja) * 2003-09-19 2009-10-21 株式会社リコー 文書フィルタリング装置、文書フィルタリング方法、および文書フィルタリングプログラム

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305695A (ja) * 1995-04-28 1996-11-22 Fujitsu Ltd 文書処理装置
JPH08335265A (ja) * 1995-06-07 1996-12-17 Canon Inc 文書処理装置および方法
JPH09288683A (ja) * 1995-09-04 1997-11-04 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JPH10240762A (ja) * 1997-02-28 1998-09-11 Matsushita Electric Ind Co Ltd 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法
JPH10275160A (ja) * 1997-03-31 1998-10-13 Matsushita Giken Kk 情報フィルタ装置及び情報フィルタリング方法並びに情報フィルタリングプログラムを記録した記録媒体
EP0999502A2 (en) * 1998-11-02 2000-05-10 Matsushita Research Institute Tokyo, Inc. Information filtering apparatus and information filtering method
JP2001167132A (ja) * 1995-09-04 2001-06-22 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JP2001175690A (ja) * 1995-09-04 2001-06-29 Matsushita Electric Ind Co Ltd メトリック学習装置及びメトリック学習方法
JP2001175689A (ja) * 1995-09-04 2001-06-29 Matsushita Electric Ind Co Ltd 適応辞書装置及び適応辞書方法
JP2001184370A (ja) * 1995-09-04 2001-07-06 Matsushita Electric Ind Co Ltd キーワード検索式生成装置及びキーワード検索式生成方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5659766A (en) * 1994-09-16 1997-08-19 Xerox Corporation Method and apparatus for inferring the topical content of a document based upon its lexical content without supervision
JPH096799A (ja) * 1995-06-19 1997-01-10 Sharp Corp 文書分類装置及び文書検索装置
AU6849196A (en) * 1995-08-16 1997-03-19 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US6076082A (en) * 1995-09-04 2000-06-13 Matsushita Electric Industrial Co., Ltd. Information filtering method and apparatus for preferentially taking out information having a high necessity
GB9701866D0 (en) * 1997-01-30 1997-03-19 British Telecomm Information retrieval
US5819258A (en) * 1997-03-07 1998-10-06 Digital Equipment Corporation Method and apparatus for automatically generating hierarchical categories from large document collections
US6078916A (en) * 1997-08-01 2000-06-20 Culliss; Gary Method for organizing information

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08305695A (ja) * 1995-04-28 1996-11-22 Fujitsu Ltd 文書処理装置
JPH08335265A (ja) * 1995-06-07 1996-12-17 Canon Inc 文書処理装置および方法
JPH09288683A (ja) * 1995-09-04 1997-11-04 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JP2001167132A (ja) * 1995-09-04 2001-06-22 Matsushita Electric Ind Co Ltd 情報フィルタ装置及び情報フィルタリング方法
JP2001175690A (ja) * 1995-09-04 2001-06-29 Matsushita Electric Ind Co Ltd メトリック学習装置及びメトリック学習方法
JP2001175689A (ja) * 1995-09-04 2001-06-29 Matsushita Electric Ind Co Ltd 適応辞書装置及び適応辞書方法
JP2001184370A (ja) * 1995-09-04 2001-07-06 Matsushita Electric Ind Co Ltd キーワード検索式生成装置及びキーワード検索式生成方法
JPH10240762A (ja) * 1997-02-28 1998-09-11 Matsushita Electric Ind Co Ltd 情報フィルタ装置とデータベース再構築装置及び情報フィルタリング方法と初期化方法
JPH10275160A (ja) * 1997-03-31 1998-10-13 Matsushita Giken Kk 情報フィルタ装置及び情報フィルタリング方法並びに情報フィルタリングプログラムを記録した記録媒体
EP0999502A2 (en) * 1998-11-02 2000-05-10 Matsushita Research Institute Tokyo, Inc. Information filtering apparatus and information filtering method
US6286012B1 (en) * 1998-11-02 2001-09-04 Matsushita Research Institute Tokyo, Inc. Information filtering apparatus and information filtering method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002014964A (ja) * 2000-06-28 2002-01-18 Victor Co Of Japan Ltd 情報提供システム及び情報提供方法
KR20020004234A (ko) * 2000-07-04 2002-01-16 김월영 포인트제도를 이용한 정보제공자의 대우에 관한 방법
US8442926B2 (en) 2008-01-08 2013-05-14 Mitsubishi Electric Corporation Information filtering system, information filtering method and information filtering program

Also Published As

Publication number Publication date
EP0999502A2 (en) 2000-05-10
EP0999502A3 (en) 2004-09-22
US6286012B1 (en) 2001-09-04
JP3344953B2 (ja) 2002-11-18

Similar Documents

Publication Publication Date Title
CN109033229B (zh) 问答处理方法和装置
CN100410936C (zh) 可用于数据搜索的数据分类系统和方法
CN111460311A (zh) 基于字典树的搜索处理方法、装置、设备和存储介质
JP3344953B2 (ja) 情報フィルタ装置及び情報フィルタリング方法
CN112800170A (zh) 问题的匹配方法及装置、问题的回复方法及装置
JP3244005B2 (ja) 情報フィルタ装置及び情報フィルタリング方法
JP2001515623A (ja) コンピュータによるテキストサマリ自動生成方法
CN109299245B (zh) 知识点召回的方法和装置
GB2395807A (en) Information retrieval
CN106383836A (zh) 将可操作属性归于描述个人身份的数据
CN106933883B (zh) 基于检索日志的兴趣点常用检索词分类方法、装置
Xu et al. Improve biomedical information retrieval using modified learning to rank methods
CN113946698A (zh) 一种融合多粒度数据和近邻数据的跨媒体检索方法及系统
CN113343012B (zh) 一种新闻配图方法、装置、设备及存储介质
CN111967599A (zh) 用于训练模型的方法、装置、电子设备及可读存储介质
CN117194647B (zh) 一种用于离线环境的智能问答系统、方法及装置
JP4754849B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
US20230071102A1 (en) Machine Learned Chart Recommendation System
CN107169065B (zh) 一种特定内容的去除方法和装置
CN116010681A (zh) 一种召回模型的训练及检索方法、装置及电子设备
CN115630141A (zh) 基于社区查询和高维向量检索的科技专家检索方法
CN115269961A (zh) 内容搜索方法以及相关设备
CN115168537A (zh) 语义检索模型的训练方法、装置、电子设备及存储介质
US8271485B2 (en) Reply generation apparatus and method and program for causing computer to function as reply generating apparatus
CN114637855A (zh) 基于知识图谱的搜索方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070830

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

R370 Written measure of declining of transfer procedure

Free format text: JAPANESE INTERMEDIATE CODE: R370

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313114

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees