JPH07219957A - 情報分類装置、情報検索装置及び情報収集装置 - Google Patents
情報分類装置、情報検索装置及び情報収集装置Info
- Publication number
- JPH07219957A JPH07219957A JP6008468A JP846894A JPH07219957A JP H07219957 A JPH07219957 A JP H07219957A JP 6008468 A JP6008468 A JP 6008468A JP 846894 A JP846894 A JP 846894A JP H07219957 A JPH07219957 A JP H07219957A
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- user
- unit
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】 様々な形態の情報をキーワードを介して一元
的に扱い、ユーザの所望する情報を所望する形態で効率
良く収集・提示できるようにすること。 【構成】 情報収集装置に入力される情報に文書画像や
音声データがあれば情報変換手段3が電子的なテキスト
に変換し、これをキーワード抽出手段4を用いてキーワ
ードに変換する。ユーザが検索条件に類似した情報を任
意の形態でシステムに入力すると同様に電子的なテキス
トに変換した後、キーワード抽出手段4が抽出したキー
ワードにより装置に入力された情報を検索する。検索さ
れた情報は必要により情報変換手段3を用いてユーザの
所望する形態で出力する。 【効果】 ユーザの所望する情報をその形態によらず少
ない資源・労力で効率良く収集・提示することが出来
る。
的に扱い、ユーザの所望する情報を所望する形態で効率
良く収集・提示できるようにすること。 【構成】 情報収集装置に入力される情報に文書画像や
音声データがあれば情報変換手段3が電子的なテキスト
に変換し、これをキーワード抽出手段4を用いてキーワ
ードに変換する。ユーザが検索条件に類似した情報を任
意の形態でシステムに入力すると同様に電子的なテキス
トに変換した後、キーワード抽出手段4が抽出したキー
ワードにより装置に入力された情報を検索する。検索さ
れた情報は必要により情報変換手段3を用いてユーザの
所望する形態で出力する。 【効果】 ユーザの所望する情報をその形態によらず少
ない資源・労力で効率良く収集・提示することが出来
る。
Description
【0001】
【産業上の利用分野】本発明はデータベース、電子メー
ルサーバ、ワードプロセッサ、FAX、電話機、日本語
解析システム等において、文書のみならず文書画像や音
声の情報を分類し所望の情報を抽出するための、情報分
類装置、情報検索装置及び情報収集装置に関する。
ルサーバ、ワードプロセッサ、FAX、電話機、日本語
解析システム等において、文書のみならず文書画像や音
声の情報を分類し所望の情報を抽出するための、情報分
類装置、情報検索装置及び情報収集装置に関する。
【0002】
【従来の技術】近年の情報化社会の発展にともない、文
書以外にも画像や音声といった様々な形態の情報を大量
に処理することが可能となってきた。従来の計算機によ
る情報収集は、専門知識を持ったユーザーがデータベー
スを逐次アクセスし、所望とする情報を検索語との試行
錯誤の後に取り出すことで行っている。また、ある事柄
に付いて広く情報を集めたいという場合にも、扱えるデ
ータベースは同一のフォーマットに基づいた物である必
要が多く、ましてや音声、画像、文書など種々雑多な形
態の情報に対して同一の概念で検索できるものは存在し
なかった。
書以外にも画像や音声といった様々な形態の情報を大量
に処理することが可能となってきた。従来の計算機によ
る情報収集は、専門知識を持ったユーザーがデータベー
スを逐次アクセスし、所望とする情報を検索語との試行
錯誤の後に取り出すことで行っている。また、ある事柄
に付いて広く情報を集めたいという場合にも、扱えるデ
ータベースは同一のフォーマットに基づいた物である必
要が多く、ましてや音声、画像、文書など種々雑多な形
態の情報に対して同一の概念で検索できるものは存在し
なかった。
【0003】
【発明が解決しようとする課題】日常生活では電子化さ
れた文書情報以外にも文書画像や音声による情報を大量
に処理しなければならない。電子化された文書は従来の
技術でも十分処理可能であるが、文書画像や音声はその
ままでは整合性が悪く、一旦電子化し、さらに文字列に
変換しなければ同列には扱えなかった。しかし、文書画
像や音声から電子化された文書に変換する際に誤りを含
むのが一般的であり、それをそのまま利用対象とするこ
とは困難である。そのため、このような誤りを含む情報
さえ高い精度で扱える手段が求められている。
れた文書情報以外にも文書画像や音声による情報を大量
に処理しなければならない。電子化された文書は従来の
技術でも十分処理可能であるが、文書画像や音声はその
ままでは整合性が悪く、一旦電子化し、さらに文字列に
変換しなければ同列には扱えなかった。しかし、文書画
像や音声から電子化された文書に変換する際に誤りを含
むのが一般的であり、それをそのまま利用対象とするこ
とは困難である。そのため、このような誤りを含む情報
さえ高い精度で扱える手段が求められている。
【0004】また、ユーザがデータベースなどから所望
する情報を引き出す時に検索キーワードをキーボードな
どから直接入力する方法では、専門知識を必要とし、ユ
ーザの意図が十分伝わらない場合が多く、手数や時間が
多くかかる割に検索効率が上がらないという問題があっ
た。
する情報を引き出す時に検索キーワードをキーボードな
どから直接入力する方法では、専門知識を必要とし、ユ
ーザの意図が十分伝わらない場合が多く、手数や時間が
多くかかる割に検索効率が上がらないという問題があっ
た。
【0005】そこで、まず様々な形態の大量の情報を自
動的に分類し、即座に検索できる状態にしておくような
システムや、ユーザが所望する情報に近い文書や文書画
像、音声をシステムに例示するだけでキーワードを入力
する事なく検索意図が伝わるような優れたシステムが求
められている。
動的に分類し、即座に検索できる状態にしておくような
システムや、ユーザが所望する情報に近い文書や文書画
像、音声をシステムに例示するだけでキーワードを入力
する事なく検索意図が伝わるような優れたシステムが求
められている。
【0006】本発明は、このような要望を考慮し、文字
データのみでなく、文書画像や音声情報に付いても、手
間が掛からず処理できる情報分類装置、情報検索装置及
び情報収集装置を提供することを目的とするものであ
る。
データのみでなく、文書画像や音声情報に付いても、手
間が掛からず処理できる情報分類装置、情報検索装置及
び情報収集装置を提供することを目的とするものであ
る。
【0007】
【課題を解決するための手段】本発明は、外部のデータ
ベースやFAX、電話などからデータの受信を行なう外
部インタフェース部と、キーボードやスキャナ、マイク
などからユーザからの検索指示入力を受ける機能と、表
示装置やスピーカ、印刷装置などに検索した結果を出力
する機能とを持ったユーザインタフェース部と、それら
各インタフェース部から入力された画像、音声などの様
々な形態の情報を電子化された文字列に変換する情報変
換手段と、電子化された文字列からキーワードを抽出す
るキーワード抽出手段と、抽出されたキーワードを基に
外部インタフェース部1から入力された情報を分類する
索引作成部と、抽出されたキーワードからユーザの所望
する情報の検索条件を決定する検索条件決定部と、検索
された情報の可否をユーザが判定したときに検索条件を
変更するフィードバック制御部で構成されている。
ベースやFAX、電話などからデータの受信を行なう外
部インタフェース部と、キーボードやスキャナ、マイク
などからユーザからの検索指示入力を受ける機能と、表
示装置やスピーカ、印刷装置などに検索した結果を出力
する機能とを持ったユーザインタフェース部と、それら
各インタフェース部から入力された画像、音声などの様
々な形態の情報を電子化された文字列に変換する情報変
換手段と、電子化された文字列からキーワードを抽出す
るキーワード抽出手段と、抽出されたキーワードを基に
外部インタフェース部1から入力された情報を分類する
索引作成部と、抽出されたキーワードからユーザの所望
する情報の検索条件を決定する検索条件決定部と、検索
された情報の可否をユーザが判定したときに検索条件を
変更するフィードバック制御部で構成されている。
【0008】
【作用】本発明では、情報収集装置に入力される情報に
文書画像や音声データがあれば情報変換手段が電子的な
テキストに変換し、これをキーワード抽出手段を用いて
キーワードに変換する。ユーザが検索条件に類似した情
報を任意の形態でシステムに入力すると同様に電子的な
テキストに変換した後、キーワード抽出手段が抽出した
キーワードにより装置に入力された情報を検索する。検
索された情報は必要により情報変換手段を用いてユーザ
の所望する形態で出力する。
文書画像や音声データがあれば情報変換手段が電子的な
テキストに変換し、これをキーワード抽出手段を用いて
キーワードに変換する。ユーザが検索条件に類似した情
報を任意の形態でシステムに入力すると同様に電子的な
テキストに変換した後、キーワード抽出手段が抽出した
キーワードにより装置に入力された情報を検索する。検
索された情報は必要により情報変換手段を用いてユーザ
の所望する形態で出力する。
【0009】このようにして、大量の情報の分類と検索
において、映像や音声といった異なるフォーマットの情
報をキーワードを介して一元的に扱うことができ、さら
に情報本体でなくそれを圧縮したキーワードを扱うた
め、容量の節約が可能となり、また、情報変換部におい
て誤って変換された文字列は、辞書未登録語となる可能
性が高く、かつ出現頻度も低いため、一般にキーワード
抽出の過程でキーワードとして選ばれにくく排除される
傾向にあるので、認識誤りの影響が低減され、信頼度が
高い分類や検索が可能となり、さらに、利用者の検索意
図が詳細かつ容易にシステムに伝わるという作用が得ら
れることで、漏れの無い情報収集がタイムリーに可能と
なるばかりでなく、検索手数、時間など利用者の負担を
短縮できる。
において、映像や音声といった異なるフォーマットの情
報をキーワードを介して一元的に扱うことができ、さら
に情報本体でなくそれを圧縮したキーワードを扱うた
め、容量の節約が可能となり、また、情報変換部におい
て誤って変換された文字列は、辞書未登録語となる可能
性が高く、かつ出現頻度も低いため、一般にキーワード
抽出の過程でキーワードとして選ばれにくく排除される
傾向にあるので、認識誤りの影響が低減され、信頼度が
高い分類や検索が可能となり、さらに、利用者の検索意
図が詳細かつ容易にシステムに伝わるという作用が得ら
れることで、漏れの無い情報収集がタイムリーに可能と
なるばかりでなく、検索手数、時間など利用者の負担を
短縮できる。
【0010】
【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。
ながら説明する。
【0011】本発明の一実施例にかかる情報収集装置は
図1に示すとおり、外部のデータベースやFAX、電話
などからデータの受信と記憶の機能を持った外部インタ
フェース部1と、キーボード、スキャナ、マイクなどユ
ーザからの検索情報入力を受ける機能と、表示装置やス
ピーカ、印刷装置などへ検索した結果を出力する機能を
持ったユーザインタフェース部2と、それら各インタフ
ェース部から入力された画像、音声などの様々な形態の
情報を電子化された文字列に変換する情報変換手段3
と、電子化された文字列からキーワードを抽出するキー
ワード抽出手段4と、抽出されたキーワードを基に外部
インタフェース部1から入力された情報を分類する索引
作成部5と、抽出されたキーワードからユーザの所望す
る情報の検索条件を決定する検索条件決定部6と、検索
された情報の可否をユーザが判定したときに検索条件を
変更するフィードバック制御部7とで構成されている。
図1に示すとおり、外部のデータベースやFAX、電話
などからデータの受信と記憶の機能を持った外部インタ
フェース部1と、キーボード、スキャナ、マイクなどユ
ーザからの検索情報入力を受ける機能と、表示装置やス
ピーカ、印刷装置などへ検索した結果を出力する機能を
持ったユーザインタフェース部2と、それら各インタフ
ェース部から入力された画像、音声などの様々な形態の
情報を電子化された文字列に変換する情報変換手段3
と、電子化された文字列からキーワードを抽出するキー
ワード抽出手段4と、抽出されたキーワードを基に外部
インタフェース部1から入力された情報を分類する索引
作成部5と、抽出されたキーワードからユーザの所望す
る情報の検索条件を決定する検索条件決定部6と、検索
された情報の可否をユーザが判定したときに検索条件を
変更するフィードバック制御部7とで構成されている。
【0012】ここにユーザインタフェース部2による処
理の概要を図2により説明する。図2において、ユーザ
インタフェース部2は、検索情報入力選択手段21と検
索指示入力手段22と情報抽出手段23と出力選択手段
24と情報可否入力手段のそれぞれの処理を順に行うよ
うに構成されている。
理の概要を図2により説明する。図2において、ユーザ
インタフェース部2は、検索情報入力選択手段21と検
索指示入力手段22と情報抽出手段23と出力選択手段
24と情報可否入力手段のそれぞれの処理を順に行うよ
うに構成されている。
【0013】検索情報入力選択手段21は外部インタフ
ェース部1やスキャナ、マイク、ワープロなどに入力さ
れた情報の中からユーザの所望する情報に最も近いもの
を選択し情報変換手段3に出力するものである。このと
き情報変換手段3に出力した情報は、キーワード抽出手
段4と情報検索部6を経てキーワードという形で検索指
示入力手段22に送られる。
ェース部1やスキャナ、マイク、ワープロなどに入力さ
れた情報の中からユーザの所望する情報に最も近いもの
を選択し情報変換手段3に出力するものである。このと
き情報変換手段3に出力した情報は、キーワード抽出手
段4と情報検索部6を経てキーワードという形で検索指
示入力手段22に送られる。
【0014】次に検索指示入力手段22は、必要に応じ
て情報検索部6から送られてきたキーワードをユーザに
提示しながら、マウスやキーボードによりユーザの検索
意図やキーワードの入力を待つ状態になる。それらの入
力が完了または省略されるとキーワードや検索意図は検
索情報として情報検索部6に返され、それをもとに情報
検索部6が検索を行った結果、検索情報に該当した情報
のIDは情報抽出手段23へ送られる。
て情報検索部6から送られてきたキーワードをユーザに
提示しながら、マウスやキーボードによりユーザの検索
意図やキーワードの入力を待つ状態になる。それらの入
力が完了または省略されるとキーワードや検索意図は検
索情報として情報検索部6に返され、それをもとに情報
検索部6が検索を行った結果、検索情報に該当した情報
のIDは情報抽出手段23へ送られる。
【0015】次に情報抽出手段23は、送られてきたI
Dをもとに外部インタフェース部1に記憶されている情
報を呼び出し、ユーザに提示する。ここで提示する情報
の形態は出力選択手段24で決定される。
Dをもとに外部インタフェース部1に記憶されている情
報を呼び出し、ユーザに提示する。ここで提示する情報
の形態は出力選択手段24で決定される。
【0016】次に出力選択手段24は、送られてきた画
像や音声、文書などの情報をそのまま出力するか、用途
に依っては画像認識手段や音声認識手段、音声合成手段
をもちいることにより、ユーザの指示に従って画像、音
声、文書のいずれか任意の情報に変換して出力すること
ができる。
像や音声、文書などの情報をそのまま出力するか、用途
に依っては画像認識手段や音声認識手段、音声合成手段
をもちいることにより、ユーザの指示に従って画像、音
声、文書のいずれか任意の情報に変換して出力すること
ができる。
【0017】次に情報可否入力手段25は、ユーザが検
索されてきた情報を審査し、検索意図と一致しているか
否か判断したとき、マウスやキーボードなどでその結果
を入力することができる。入力された結果は該当する情
報のIDと可否判定という形でフィードバック制御部7
へ送られる。
索されてきた情報を審査し、検索意図と一致しているか
否か判断したとき、マウスやキーボードなどでその結果
を入力することができる。入力された結果は該当する情
報のIDと可否判定という形でフィードバック制御部7
へ送られる。
【0018】ここに、情報変換手段3による処理の概要
を図3により説明する。図3において、情報変換手段3
は、入力された各種形態の情報を制御部31で分類し、
画像情報は画像認識手段32で、音声情報は音声認識手
段33で、文字情報は文字列整形手段34でそれぞれ処
理され、キーワード抽出に適した文字情報に変換したも
のをキーワード抽出手段4へ出力するように構成されて
いる。制御部31による情報の分類は、外部インタフェ
ース部1やユーザインタフェース部2において情報入力
時にその属性となるコードを付加しておれば容易に実現
可能である。
を図3により説明する。図3において、情報変換手段3
は、入力された各種形態の情報を制御部31で分類し、
画像情報は画像認識手段32で、音声情報は音声認識手
段33で、文字情報は文字列整形手段34でそれぞれ処
理され、キーワード抽出に適した文字情報に変換したも
のをキーワード抽出手段4へ出力するように構成されて
いる。制御部31による情報の分類は、外部インタフェ
ース部1やユーザインタフェース部2において情報入力
時にその属性となるコードを付加しておれば容易に実現
可能である。
【0019】次に画像認識手段32は、入力された画像
情報から文字列を含む画像を取り出し、これを電子化し
た文字列に変換する機能を有している。これには例えば
OCR等が用いられる。
情報から文字列を含む画像を取り出し、これを電子化し
た文字列に変換する機能を有している。これには例えば
OCR等が用いられる。
【0020】次に音声認識手段33は、同様に音声情報
からノイズ以外の意味のある発声音素を取り出し、これ
を電子化した文字列に変換する機能を有している。
からノイズ以外の意味のある発声音素を取り出し、これ
を電子化した文字列に変換する機能を有している。
【0021】次に文字列整形手段34は、入力された電
子化されている文字列からコントロールコードなど除去
し、キーワード抽出手段4における形態素解析の妨げに
ならないように整形する機能を有している。
子化されている文字列からコントロールコードなど除去
し、キーワード抽出手段4における形態素解析の妨げに
ならないように整形する機能を有している。
【0022】ここに、キーワード抽出手段4による処理
の概要を図4により説明する。図4において、キーワー
ド抽出手段4は、情報変換手段3から入力された文字情
報を形態素解析手段41が辞書43を用いてキーワード
候補を作成し、統計処理部が単語生起頻度ファイル44
を参照しつつキーワードを抽出するように構成されてい
る。
の概要を図4により説明する。図4において、キーワー
ド抽出手段4は、情報変換手段3から入力された文字情
報を形態素解析手段41が辞書43を用いてキーワード
候補を作成し、統計処理部が単語生起頻度ファイル44
を参照しつつキーワードを抽出するように構成されてい
る。
【0023】形態素解析手段41は、文字情報を単語レ
ベルまで解析し、キーワードとなる可能性のある単語を
全てキーワード候補として抽出する。このとき、辞書4
3に載っている単語に関する知識を利用する。利用する
知識としてはキーワードとして選ばれることが多い品詞
である名詞の文字表記が最低限あればよい。
ベルまで解析し、キーワードとなる可能性のある単語を
全てキーワード候補として抽出する。このとき、辞書4
3に載っている単語に関する知識を利用する。利用する
知識としてはキーワードとして選ばれることが多い品詞
である名詞の文字表記が最低限あればよい。
【0024】次に統計処理部42は、キーワード候補の
出現頻度についてそれぞれの合計を取り、それと単語生
起頻度ファイル44の情報を元にキーワードの尤度を計
算し、尤度上位から任意の数だけキーワードとして出力
する機能を持つ。単語生起頻度ファイル44は、各単語
がある文書内でどの位の頻度で出現する可能性があるか
を調べた統計値である単語生起頻度を記憶している。キ
ーワード尤度の算出例としては、キーワード尤度をE、
キーワード候補の出現頻度をX、単語生起頻度Yとする
とE=aX−bY(a,bは定数)などがあり、こうす
ることで出現頻度だけでキーワードを決定する方式に比
べて、どんな文書にも高頻度で出現し、キーワードとし
てふさわしくないありふれた単語がキーワードとなるこ
とを防止する効果がある。また、単語生起頻度は分野毎
に違いがあるので、用途に依っては単語生起頻度ファイ
ルを分野別に用意し、選択してもよい。
出現頻度についてそれぞれの合計を取り、それと単語生
起頻度ファイル44の情報を元にキーワードの尤度を計
算し、尤度上位から任意の数だけキーワードとして出力
する機能を持つ。単語生起頻度ファイル44は、各単語
がある文書内でどの位の頻度で出現する可能性があるか
を調べた統計値である単語生起頻度を記憶している。キ
ーワード尤度の算出例としては、キーワード尤度をE、
キーワード候補の出現頻度をX、単語生起頻度Yとする
とE=aX−bY(a,bは定数)などがあり、こうす
ることで出現頻度だけでキーワードを決定する方式に比
べて、どんな文書にも高頻度で出現し、キーワードとし
てふさわしくないありふれた単語がキーワードとなるこ
とを防止する効果がある。また、単語生起頻度は分野毎
に違いがあるので、用途に依っては単語生起頻度ファイ
ルを分野別に用意し、選択してもよい。
【0025】次に、索引作成部5による処理の概要を図
5により説明する。図5において索引作成部5は、外部
インタフェース部1から送られた情報のIDとキーワー
ド抽出手段4から送られてくるキーワードを統合処理部
51でまとめ、索引記憶手段52へ登録及び更新を行
い、情報検索部6から送られて来るキーワードに対して
キーワード比較手段53が索引記憶手段52にアクセス
することにより、同じキーワードをもつ情報のIDを全
て情報検索部6に出力するように構成されている。
5により説明する。図5において索引作成部5は、外部
インタフェース部1から送られた情報のIDとキーワー
ド抽出手段4から送られてくるキーワードを統合処理部
51でまとめ、索引記憶手段52へ登録及び更新を行
い、情報検索部6から送られて来るキーワードに対して
キーワード比較手段53が索引記憶手段52にアクセス
することにより、同じキーワードをもつ情報のIDを全
て情報検索部6に出力するように構成されている。
【0026】索引記憶手段52は統合処理部51が提示
した情報のIDとキーワードを見てキーワード毎にID
を登録した索引を作成する。外部インタフェース部1に
おいて記憶されていた情報が削除された場合、該当する
IDは削除され、このとき、その索引に登録されている
IDがひとつも無くなればその索引も削除する。
した情報のIDとキーワードを見てキーワード毎にID
を登録した索引を作成する。外部インタフェース部1に
おいて記憶されていた情報が削除された場合、該当する
IDは削除され、このとき、その索引に登録されている
IDがひとつも無くなればその索引も削除する。
【0027】次に、情報検索部6とフィードバック制御
部7による処理の概要を図6により説明する。図6にお
いて情報検索部6は、キーワード抽出手段3から送られ
るキーワードをユーザインタフェース部2に送る一方、
それを元に検索条件設定部61が検索条件記憶手段62
にアクセスし、検索意図をユーザインタフェース部2に
出力したのち、ユーザインタフェース部2において確認
または入力されたキーワードと検索意図を見て変更があ
れば検索条件記憶手段62を更新する一方、キーワード
を索引作成部5に出力し、返ってくるIDを統計処理部
63で処理した後、ユーザインタフェース部2に送るよ
うに構成されている。また、フィードバック制御部7
は、ユーザインタフェース部2から受けた情報の可否判
定結果を処理し、条件変更依頼として検索条件設定部6
1に出力するように構成されている。
部7による処理の概要を図6により説明する。図6にお
いて情報検索部6は、キーワード抽出手段3から送られ
るキーワードをユーザインタフェース部2に送る一方、
それを元に検索条件設定部61が検索条件記憶手段62
にアクセスし、検索意図をユーザインタフェース部2に
出力したのち、ユーザインタフェース部2において確認
または入力されたキーワードと検索意図を見て変更があ
れば検索条件記憶手段62を更新する一方、キーワード
を索引作成部5に出力し、返ってくるIDを統計処理部
63で処理した後、ユーザインタフェース部2に送るよ
うに構成されている。また、フィードバック制御部7
は、ユーザインタフェース部2から受けた情報の可否判
定結果を処理し、条件変更依頼として検索条件設定部6
1に出力するように構成されている。
【0028】検索条件設定部61は入力されたキーワー
ドを用いて検索条件記憶手段62にアクセスすること
で、ユーザが過去に入力した検索意図を推定し、ユーザ
インタフェース部2に出力する機能を有している。これ
は検索条件記憶手段62に記憶されている検索意図に対
応するキーワードと一致している数が任意の閾値より多
いものがある場合、それを検索意図として出力するとい
うことで実現できる。
ドを用いて検索条件記憶手段62にアクセスすること
で、ユーザが過去に入力した検索意図を推定し、ユーザ
インタフェース部2に出力する機能を有している。これ
は検索条件記憶手段62に記憶されている検索意図に対
応するキーワードと一致している数が任意の閾値より多
いものがある場合、それを検索意図として出力するとい
うことで実現できる。
【0029】次に検索条件記憶手段62は、上記のよう
に検索意図とキーワードが対応するように、検索意図ご
とに複数のキーワードが記憶されているものである。検
索意図とはある特定の情報やユーザーの興味の対象を示
したもので、複数登録でき、必要に応じキーワードと同
様に論理和、論理積などの検索条件の設定が可能であ
る。
に検索意図とキーワードが対応するように、検索意図ご
とに複数のキーワードが記憶されているものである。検
索意図とはある特定の情報やユーザーの興味の対象を示
したもので、複数登録でき、必要に応じキーワードと同
様に論理和、論理積などの検索条件の設定が可能であ
る。
【0030】次に統計処理部63は、ある一つの検索条
件について索引作成部5から送られて来るIDの統計を
取り、多いものから順に任意の数だけIDをユーザイン
タフェース部2に送ることで検索条件に最も近い情報を
ユーザに提示すること実現している。
件について索引作成部5から送られて来るIDの統計を
取り、多いものから順に任意の数だけIDをユーザイン
タフェース部2に送ることで検索条件に最も近い情報を
ユーザに提示すること実現している。
【0031】フィードバック制御部7は、ユーザインタ
フェース部2からユーザが入力した可否判定結果である
情報のIDとその可否をみて、可とされたIDの情報か
ら得られたキーワードを検索条件設定部61内にあるキ
ーワードと足し合わせるように指示する。逆に否とされ
た場合、その情報のキーワードにしか存在しないキーワ
ードだけを検索条件設定部61内にあるキーワードから
減じる処理などを行い、検索条件の尤度を向上するよう
に変更する。
フェース部2からユーザが入力した可否判定結果である
情報のIDとその可否をみて、可とされたIDの情報か
ら得られたキーワードを検索条件設定部61内にあるキ
ーワードと足し合わせるように指示する。逆に否とされ
た場合、その情報のキーワードにしか存在しないキーワ
ードだけを検索条件設定部61内にあるキーワードから
減じる処理などを行い、検索条件の尤度を向上するよう
に変更する。
【0032】なお、本発明の各手段、各部は、コンピュ
ータを用いてソフトウェア的に実現し、あるいはそれら
各機能を有する専用のハード回路を用いて実現すること
が出来る。
ータを用いてソフトウェア的に実現し、あるいはそれら
各機能を有する専用のハード回路を用いて実現すること
が出来る。
【0033】
【発明の効果】以上述べたことから明らかなように、本
発明は、ユーザが入力される情報の形態を意識すること
なく所望する情報を少ない労力で収集することが可能と
なる。
発明は、ユーザが入力される情報の形態を意識すること
なく所望する情報を少ない労力で収集することが可能と
なる。
【0034】また、情報変換手段とキーワード抽出手段
を組み合わせた場合は、文書画像や音声の情報を認識し
て文字列に変換する際に多少の誤認識があっても、それ
らの文字列のキーワードを介して処理するため、比較的
信頼性の高い情報として扱うことが可能となるばかりで
なく、情報の圧縮効果により索引分類や検索時の計算量
やメモリ容量も節約することが可能となる。
を組み合わせた場合は、文書画像や音声の情報を認識し
て文字列に変換する際に多少の誤認識があっても、それ
らの文字列のキーワードを介して処理するため、比較的
信頼性の高い情報として扱うことが可能となるばかりで
なく、情報の圧縮効果により索引分類や検索時の計算量
やメモリ容量も節約することが可能となる。
【0035】また、フィードバック制御部によりユーザ
の判定結果を容易に次回の同様の検索に反映することが
出来る場合は、検索される情報の尤度の向上が可能とな
る。
の判定結果を容易に次回の同様の検索に反映することが
出来る場合は、検索される情報の尤度の向上が可能とな
る。
【図1】本発明の一実施例を示すブロック図である。
【図2】同実施例のユーザインタフェース部の処理を説
明するためのブロック図である。
明するためのブロック図である。
【図3】同実施例の情報変換手段の概要を示すブロック
図である。
図である。
【図4】同実施例のキーワード抽出手段の概要を示すブ
ロック図である。
ロック図である。
【図5】同実施例の索引作成部の処理を説明するための
ブロック図である。
ブロック図である。
【図6】同実施例の情報検索部とフィードバック制御部
の処理を説明するためのブロック図である。
の処理を説明するためのブロック図である。
1 外部インタフェース部 2 ユーザインタフェース部 3 情報変換手段 4 キーワード抽出手段 5 索引作成部 6 情報検索部 7 フィードバック制御部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 〆木 泰治 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 前川 英嗣 大阪府門真市大字門真1006番地 松下電器 産業株式会社内
Claims (4)
- 【請求項1】入力された、検索対象である文書、文書画
像、又は音声情報を文字列に変換する情報変換手段と、 これらの電子化された文字列から索引語を抽出するキー
ワード抽出手段と、 これら索引語により入力された情報を分類する索引作成
部と、 を備えたことを特徴とする情報分類装置。 - 【請求項2】ユーザが、検索語のかわりに入力する文
書、文書画像、又は音声情報を文字列に変換する情報変
換手段と、 これらの電子化した文字列から検索語を抽出するキーワ
ード抽出手段と、 これら検索語に応じて検索する情報を決定する情報検索
部と、 を備えたことを特徴とする情報検索装置。 - 【請求項3】請求項1記載の情報分類装置によって検索
対象の情報を分類し、請求項2記載の情報検索装置によ
ってそれらの情報を検索することでユーザの所望する情
報を収集することを特徴とする情報収集装置。 - 【請求項4】収集された情報の閲覧時にユーザが良否判
定をした結果から自動的に次回の検索条件を再設定する
フィードバック制御部を備えたことを特徴とする請求項
3記載の情報収集装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6008468A JPH07219957A (ja) | 1994-01-28 | 1994-01-28 | 情報分類装置、情報検索装置及び情報収集装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP6008468A JPH07219957A (ja) | 1994-01-28 | 1994-01-28 | 情報分類装置、情報検索装置及び情報収集装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07219957A true JPH07219957A (ja) | 1995-08-18 |
Family
ID=11693965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6008468A Pending JPH07219957A (ja) | 1994-01-28 | 1994-01-28 | 情報分類装置、情報検索装置及び情報収集装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07219957A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10133847A (ja) * | 1996-10-28 | 1998-05-22 | Casio Comput Co Ltd | 移動端末音声認識/データベース検索/リソースアクセス通信システム |
JPH10177469A (ja) * | 1996-12-16 | 1998-06-30 | Casio Comput Co Ltd | 移動端末音声認識/データベース検索/リソースアクセス通信システム |
JP2002510090A (ja) * | 1998-03-31 | 2002-04-02 | ドラゴン・システムズ・インコーポレーテッド | 対話型探索法 |
JP2007026418A (ja) * | 2005-06-13 | 2007-02-01 | Mitsubishi Electric Corp | 文書作成支援装置 |
JP2012515379A (ja) * | 2009-01-12 | 2012-07-05 | アリババ・グループ・ホールディング・リミテッド | 情報をクエリするための方法およびシステム |
US8799306B2 (en) | 2010-12-31 | 2014-08-05 | Alibaba Group Holding Limited | Recommendation of search keywords based on indication of user intention |
CN110832444A (zh) * | 2017-07-13 | 2020-02-21 | 国际商业机器公司 | 用户界面声音发出活动分类 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0229864A (ja) * | 1988-07-20 | 1990-01-31 | Toshiba Corp | キーワード抽出方式 |
JPH05127794A (ja) * | 1991-11-08 | 1993-05-25 | Ricoh Co Ltd | 入力装置 |
JPH05151268A (ja) * | 1991-11-29 | 1993-06-18 | Toshiba Corp | キーワードメデイア変換装置 |
JPH05204740A (ja) * | 1992-01-24 | 1993-08-13 | Matsushita Electric Ind Co Ltd | マルチメディアデータベース装置 |
JPH05258028A (ja) * | 1991-08-23 | 1993-10-08 | Fujitsu Ltd | マルチメディア情報処理装置 |
JPH05298261A (ja) * | 1992-04-20 | 1993-11-12 | Hitachi Ltd | 携帯型電子装置 |
JPH0721202A (ja) * | 1993-06-18 | 1995-01-24 | Sharp Corp | 非コード化情報のデータベース化方式 |
-
1994
- 1994-01-28 JP JP6008468A patent/JPH07219957A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0229864A (ja) * | 1988-07-20 | 1990-01-31 | Toshiba Corp | キーワード抽出方式 |
JPH05258028A (ja) * | 1991-08-23 | 1993-10-08 | Fujitsu Ltd | マルチメディア情報処理装置 |
JPH05127794A (ja) * | 1991-11-08 | 1993-05-25 | Ricoh Co Ltd | 入力装置 |
JPH05151268A (ja) * | 1991-11-29 | 1993-06-18 | Toshiba Corp | キーワードメデイア変換装置 |
JPH05204740A (ja) * | 1992-01-24 | 1993-08-13 | Matsushita Electric Ind Co Ltd | マルチメディアデータベース装置 |
JPH05298261A (ja) * | 1992-04-20 | 1993-11-12 | Hitachi Ltd | 携帯型電子装置 |
JPH0721202A (ja) * | 1993-06-18 | 1995-01-24 | Sharp Corp | 非コード化情報のデータベース化方式 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10133847A (ja) * | 1996-10-28 | 1998-05-22 | Casio Comput Co Ltd | 移動端末音声認識/データベース検索/リソースアクセス通信システム |
JPH10177469A (ja) * | 1996-12-16 | 1998-06-30 | Casio Comput Co Ltd | 移動端末音声認識/データベース検索/リソースアクセス通信システム |
JP2002510090A (ja) * | 1998-03-31 | 2002-04-02 | ドラゴン・システムズ・インコーポレーテッド | 対話型探索法 |
JP2007026418A (ja) * | 2005-06-13 | 2007-02-01 | Mitsubishi Electric Corp | 文書作成支援装置 |
JP2012515379A (ja) * | 2009-01-12 | 2012-07-05 | アリババ・グループ・ホールディング・リミテッド | 情報をクエリするための方法およびシステム |
US8898180B2 (en) | 2009-01-12 | 2014-11-25 | Alibaba Group Holding Limited | Method and system for querying information |
US9430568B2 (en) | 2009-01-12 | 2016-08-30 | Alibaba Group Holding Limited | Method and system for querying information |
US8799306B2 (en) | 2010-12-31 | 2014-08-05 | Alibaba Group Holding Limited | Recommendation of search keywords based on indication of user intention |
CN110832444A (zh) * | 2017-07-13 | 2020-02-21 | 国际商业机器公司 | 用户界面声音发出活动分类 |
CN110832444B (zh) * | 2017-07-13 | 2024-05-28 | 勤达睿公司 | 用户界面声音发出活动分类 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6549913B1 (en) | Method for compiling an image database, an image database system, and an image data storage medium | |
US20090234854A1 (en) | Search system and search method for speech database | |
US20040073874A1 (en) | Device for retrieving data from a knowledge-based text | |
JP2004348591A (ja) | 文書検索方法及び装置 | |
JPWO2008023470A1 (ja) | 文単位検索方法、文単位検索装置、コンピュータプログラム、記録媒体及び文書記憶装置 | |
WO2008145055A1 (fr) | Procédé pour obtenir une information de mot de restriction et pour optimiser le système du procédé d'entrée et de sortie | |
US20090276411A1 (en) | Issue trend analysis system | |
JP5296598B2 (ja) | 音声情報抽出装置 | |
US7359896B2 (en) | Information retrieving system, information retrieving method, and information retrieving program | |
KR20060020114A (ko) | 음악 검색 서비스 제공 시스템 및 방법 | |
CN115238154A (zh) | 搜索引擎优化系统 | |
US20060210171A1 (en) | Image processing apparatus | |
JPH07219957A (ja) | 情報分類装置、情報検索装置及び情報収集装置 | |
JPH1173415A (ja) | 類似文書検索装置及び類似文書検索方法 | |
JP2006251975A (ja) | テキスト分類方法ならびにその方法によるプログラム、およびテキスト分類装置 | |
CN113539235B (zh) | 文本分析与语音合成方法、装置、系统及存储介质 | |
JP2002032386A (ja) | データ処理方法、装置およびその方法を実施するプログラムを記録した記録媒体 | |
JP2000259653A (ja) | 音声認識装置及び音声認識方法 | |
JPH11232296A (ja) | 文書ファイリングシステムおよび文書ファイリング方法 | |
JP3591813B2 (ja) | データ検索方法、その装置および記録媒体 | |
WO2006003692A1 (ja) | 情報検索端末 | |
JPH10198683A (ja) | 文書画像分類方法 | |
JP2014110002A (ja) | カテゴリ決定装置及びカテゴリ決定方法 | |
JPH09185632A (ja) | 情報検索・編集方法及び装置 | |
JP7272540B2 (ja) | 情報提供システム、情報提供方法、及びデータ構造 |