JPH1166087A - 情報検索装置及び情報検索方法、並びに、情報検索プログラムを格納した記憶媒体 - Google Patents

情報検索装置及び情報検索方法、並びに、情報検索プログラムを格納した記憶媒体

Info

Publication number
JPH1166087A
JPH1166087A JP9222368A JP22236897A JPH1166087A JP H1166087 A JPH1166087 A JP H1166087A JP 9222368 A JP9222368 A JP 9222368A JP 22236897 A JP22236897 A JP 22236897A JP H1166087 A JPH1166087 A JP H1166087A
Authority
JP
Japan
Prior art keywords
search
narrowing
candidate
rule
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9222368A
Other languages
English (en)
Inventor
Masahiro Oku
雅博 奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP9222368A priority Critical patent/JPH1166087A/ja
Publication of JPH1166087A publication Critical patent/JPH1166087A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 本発明は、清音化のルールを定めることによ
りヒットすべきでない候補を排除する情報検索装置及び
方法の提供を目的とする。 【解決手段】 清音化インデックス部72を含むデータベ
ース70を検索キーによって検索する本発明の情報検索装
置は、検索キーを清音化する手段10、手段10で清音化さ
れた検索キーによってデータベースの清音化インデック
ス部を検索する手段20、手段20において得られた検索
候補を蓄積する手段30、不要な検索候補を排除するため
の絞り込みルールを含む絞り込みルール群80、手段30に
蓄積された検索候補を読み出し、ルール群を検索する手
段40、手段40において検索された絞り込みルールに従っ
て検索候補を残すか否かを決定する手段50及び手段50に
おいて残された検索結果を出力する手段60からなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索装置及び
方法に係わり、特に、利用者からの検索要求に濁音を含
む場合に、それらを清音化した検索ヒット率(再現率)
を上げる際にヒットすべきでない候補を排除する(適合
率を上げる)情報検索装置及び方法、並びに、情報検索
プログラムを格納した記憶媒体に関する。
【0002】
【従来の技術】従来、読みを検索キーとする検索におい
て再現率を上げるために、濁音を清音化してデータベー
スを検索する清音化検索が行われている。例えば、検索
キー=“なかじま”を清音化して得られた“なかしま”
を清音化検索キーとしてデータベースが検索される。こ
こで、再現率とは、検索すべき情報をどの程度検索する
ことができたかを表わす指標であり、 再現率=(検索すべき情報のうち、検索できた情報の件
数)/(検索すべき情報の件数) で表される。清音化検索には、(1)予め清音化して検
索を行なう方法と、(2)元の検索キーで検索を行った
結果として検索に失敗したとき、即ち、データベース内
に当該検索キーを持つ情報がないときに、清音化検索を
行う方法との2通りの方法がある。
【0003】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の技術では、すべての濁音を清音に変換してし
まうため、本来、清音にすべきではない音まで清音化す
るので、余分(不要)な候補まで検索し、適合率が低下
するという問題がある。例えば、検索キー=“ながし
ま”において、清音化検索キー=“なかしま”を作成し
てデータベースを検索すると、“なかしま”の元の読み
として、“ながしま”、“なかしま”の他に、“なかじ
ま”が検索される。元の検索キー=“ながしま”に対し
て“なかじま”は検索されるべきではなく、余分な候補
である。ここで、適合率とは、検索すべき情報がどの程
度余分な情報を検索することなく検索することができた
かを示す指標であり、 適合率=(検索すべき情報のうち、検索できた情報の件
数)/(検索した全件数) で表される。
【0004】本発明の目的は、上記の問題点を解決する
ため、清音化する際のルールを定めることによって、ヒ
ットすべきでない候補を排除し、適合率を上げる情報検
索装置及び方法、並びに、情報検索プログラムを格納し
た記憶媒体を提供することである。
【0005】
【課題を解決するための手段】図1は本発明の情報検索
装置の原理構成図である。同図に示す如く、インデック
ス部の濁音を清音化した清音化インデックス部72を含
むデータベース70を検索キーによって検索する本発明
の情報検索装置100は、上記検索キーを清音化する検
索キー清音化手段10と、上記検索キー清音化手段10
において清音化された検索キーによって上記データベー
ス70の清音化インデックス部72を検索する清音化検
索手段20と、上記清音化検索手段20において得られ
た検索候補を蓄積する検索候補蓄積手段30と、不要な
検索候補を排除するための絞り込みルールを含む絞り込
みルール群80と、上記検索候補蓄積手段30に蓄積さ
れた検索候補を読み出し、上記絞り込みルール群を検索
する絞り込みルール検索手段40と、上記絞り込みルー
ル検索手段40において検索された絞り込みルールに従
って、上記検索候補を検索結果として残すか否かを決定
する絞り込みルール適用手段50と、上記絞り込みルー
ル適用手段50において検索結果として残された検索候
補を出力する検索結果出力手段60とから構成される。
【0006】本発明の情報検索装置100は、清音化す
る際のルールを絞り込みルールの形で定め、絞り込みル
ールに従って検索候補を絞り込むことにより、ヒットす
べきでない検索候補を排除するので適合率が上昇する。
上記絞り込みルールは、漢字表記と、その漢字表記の可
能な読みを列挙した読みリストとから構成してもよい。
上記絞り込み適用手段50は、上記検索候補が上記絞り
込みルール検索手段40において検索された絞り込みル
ールの上記読みリスト中に存在するかどうかを判定する
手段と、存在する場合には当該検索候補を検索結果とし
て残し、存在しない場合には当該検索候補を検索結果か
ら排除する手段とを有する。
【0007】或いは、上記絞り込みルールは、漢字1文
字表記と、適用条件と、上記漢字1文字表記の読みのリ
ストとの3つ組から構成してもよい。その場合に、上記
絞り込みルール検索手段40は、上記読み出された検索
候補に含まれる漢字表記1文字によって上記絞り込みル
ール群80を検索する。上記絞り込み適用手段50は、
上記検索候補の上記漢字表記1文字が当該漢字表記1文
字によって検索に成功した絞り込みルールの適用条件を
満たす際に、当該絞り込みルールの当該漢字表記1文字
に対応した読みのリストを取得する読みリスト取得手
段、上記読み出された検索候補を構成する全ての漢字表
記1文字について取得された上記漢字表記1文字の読み
のリストから当該検索候補に対する可能な読みを生成す
る読み生成手段、及び上記読み生成手段によって生成さ
れた可能な読みの中で上記検索キーと一致する読みを持
つ検索候補を検索結果として残す手段により構成され
る。
【0008】図2は本発明の原理を説明する図である。
本発明の情報検索方法は、インデックス部の濁音を清音
化した清音化インデックス部を含むデータベースを、利
用者から入力された検索キー(清音化検索キー)によっ
て検索する情報検索方法であって、上記検索キーを清音
化する段階(ステップ10)と、上記清音化検索キーに
よって上記データベースの清音化インデックス部を検索
する段階(ステップ20)と、検索によって得られた検
索候補を検索候補蓄積部に蓄積する段階(ステップ3
0)と、(1)上記検索候補蓄積部から上記蓄積された
各検索候補を一つずつ読み出し、不要な検索候補を排除
するため予め用意された絞り込みルールを含む絞り込み
ルール群を上記読み出された検索候補によって検索する
段階(ステップ40)と、(2)検索に成功した絞り込
みルールに従って、上記検索候補を検索結果として残す
か否かを決定する段階(ステップ50)と、(3)検索
結果として残さないことが決定された上記検索候補を上
記検索候補蓄積部から削除する段階(ステップ60)
と、上記検索候補蓄積部に蓄積された全ての検索候補に
対し、上記段階(1)、(2)及び(3)を繰り返す段
階(ステップ70)と、上記検索蓄積部に残された検索
候補を利用者に提示する段階(ステップ80)とからな
る。
【0009】上記本発明の情報検索方法によれば、清音
化検索キーによって得られた検索候補の中から、利用者
の意図しない検索候補を排除することが可能となる。そ
の結果として、適合率の高い検索結果を利用者に提示す
ることができる。更に、本発明によれば、絞り込みルー
ルを漢字1文字表記と、適用条件と、上記漢字1文字表
記の読みのリストとの3つ組から構成してもよい。図3
は本発明の情報検索方法の動作フローチャートである。
同図に示す如く、インデックス部の濁音を清音化した清
音化インデックス部を含むデータベースを検索キーによ
って検索する際に、かかる絞り込みルールを適用する本
発明の情報検索方法は、上記検索キーを清音化する段階
(ステップ10)と、上記清音化された検索キーによっ
て上記データベースの清音化インデックス部を検索する
段階(ステップ20)と、検索によって得られた検索候
補を検索候補蓄積部に蓄積する段階(ステップ30)
と、(1)上記蓄積された各検索候補を上記検索候補蓄
積部から読み出す段階(ステップ41)と(2.1)上
記検索候補から漢字表記1文字を取り出し、漢字1文字
表記と、適用条件と、上記漢字1文字表記の読みのリス
トとの3つ組から構成された不要な検索候補を排除する
ための絞り込みルールを含む絞り込みルール群を上記取
り出された漢字1文字表記によって検索する段階(ステ
ップ42)と、(2.2)上記検索候補の上記漢字表記
1文字が当該漢字表記1文字によって検索に成功した絞
り込みルールの適用条件を満たすかどうかを判定する段
階(ステップ51)と、(2.3)上記漢字1文字表記
が当該絞り込みルールの上記適用条件を満たす場合に、
当該絞り込みルールの当該漢字表記1文字に対応した読
みのリストを取得する段階(ステップ52)と、(2.
4)上記読み出された検索候補を構成する全ての漢字表
記1文字について上記段階(2.1)、段階(2.2)
及び段階(2.3)を繰り返す段階(ステップ53)
と、(3)上記検索候補を構成する全ての漢字表記1文
字について取得された上記読みのリストから当該検索候
補に対する可能な読みを生成する段階(ステップ54)
と、(4)上記検索候補に対し生成された可能な読みの
中に上記検索キーと一致する可能な読みが在るかどうか
を判定する段階(ステップ55)と、(5)一致する可
能な読みが無い場合に、当該検索候補を上記検索候補蓄
積部から削除する段階(ステップ60)と、上記検索候
補蓄積部に蓄積された全ての検索候補に対し、上記段階
(1)、(2.1)、(2.2)、(2.3)、(2.
4)、(3)、(4)及び(5)を繰り返す段階(ステ
ップ70)と、上記検索蓄積部に残された検索候補を出
力する段階(ステップ80)とからなる。
【0010】ステップ42において、検索により絞り込
みルールが得られない場合には、処理が直ちにステップ
53に進むように構成してもよい。また、ステップ54
において、読みのリストが存在しない場合には、処理が
直ちにステップ60に進むように構成してもよい。更
に、本発明は、インデックス部の濁音を清音化した清音
化インデックス部を含むデータベースを検索キーによっ
て検索する情報検索プログラムを格納した記憶媒体であ
って、上記検索キーを清音化させる検索キー清音化プロ
セスと、上記清音化された検索キーによって上記データ
ベースの清音化インデックス部を検索させ、検索候補蓄
積部に蓄積させる清音化検索プロセスと、上記検索候補
蓄積部に蓄積された検索候補を読み出し、不要な検索候
補を排除するための絞り込みルールを含む絞り込みルー
ル群を検索させる絞り込みルール検索プロセスと、上記
検索された絞り込みルールに従って、上記検索候補を検
索結果として残すか否かを決定させる絞り込みルール適
用プロセスと、上記検索結果として残された検索候補を
出力させる検索結果出力プロセスとから構成されること
を特徴とする情報検索プログラムを格納する。
【0011】
【発明の実施の形態】図4は本発明の一実施例による情
報検索システムの基本構成図である。情報検索システム
は、ハードウェア的には、CPU及びメモリにより構成
することが可能であり、機能的には、検索キー清音化部
10、清音化検索部20、検索候補蓄積部30、絞り込
みルール検索部40、絞り込みルール適用部50、検索
結果出力部60から構成される。
【0012】検索キー清音化部10は、利用者から入力
された検索キーの中の濁音を清音化した清音化検索キー
を作成する。清音化検索部20は、検索キー清音化部1
0で作成された清音化検索キーを用いてデータベース7
0を検索する。検索候補蓄積部30は、清音化検索部2
0で得られた検索候補を蓄積する。絞り込みルール検索
部40は、検索候補蓄積部30に蓄積されている検索候
補を順次1つずつ読み出し、その情報に基づいて絞り込
みルール群80を検索する。絞り込みルール適用部50
は、絞り込みルール検索部40で得られた絞り込みルー
ルを検索候補に適用し、検索結果として残すべきか否か
を決定する。検索結果出力部60は、絞り込みルール適
用部50において検索結果として残された検索候補を利
用者に提示する。
【0013】図5は情報検索システムの動作の概略フロ
ー図である。以下、図5に従って図4の情報検索システ
ムの動作を説明する。 ステップ101:検索キー清音化部10は、利用者が入
力した検索キーに含まれる濁音を清音化し、清音化検索
キーを作成する。次に、作成された清音化検索キーを清
音化検索部20に送る。
【0014】ステップ102:清音化検索部20は、検
索キー清音化部10から送られてきた清音化検索キーに
よってデータベース70を検索し、検索候補を取得す
る。 ステップ103:清音化検索部20は、ステップ102
で検索候補が得られたか否かを判定する。検索候補が得
られた場合にはステップ104に進み、検索候補が得ら
れていない場合にはステップ105に進む。
【0015】ステップ104:清音化検索部20は、得
られた検索候補を検索候補蓄積部30に蓄積し、絞り込
み検索部40に制御を移す。 ステップ105:清音化検索部20は、検索候補が得ら
れなかった場合には、検索失敗として、検索結果出力部
60からその旨を利用者に提供し、処理を終了する。
【0016】ステップ106:絞り込みルール検索部4
0では、検索候補蓄積部30から検索候補を1つ読み出
す。 ステップ107:更に絞り込みルール検索部40では、
読み出した検索候補の情報を元に絞り込みルール群80
を検索する。 ステップ108:検索に成功したか否かが判定され、検
索に成功した場合にはステップ109に進み、検索に失
敗した場合にはステップ110に進む。このとき、制御
は絞り込みルール適用部50に移される。
【0017】ステップ109:絞り込みルール適用部5
0は、得られた絞り込みルールを検索候補に適用し、検
索結果として残すか否かを判定する。検索結果として残
す場合にはステップ110に進み、検索結果として残さ
ない場合にはステップ111に進む。 ステップ110:絞り込みルール適用部50は、検索結
果として残されることになった検索候補を検索候補蓄積
部30に書き戻す。
【0018】ステップ111:絞り込みルール適用部5
0は、検索結果として残さない検索候補、即ち、排除す
ることになった検索候補を検索候補蓄積部30から取り
除く。 ステップ112:絞り込みルール適用部50では、検索
候補蓄積部30内に未だ処理していない検索候補が存在
するかどうかを判定する。未処理の検索候補がある場合
には、ステップ106に戻り、絞り込みルール検索部4
に制御を移す。未処理の検索候補がない場合には、ステ
ップ113に進み、検索結果出力部60へ制御を移す。
【0019】ステップ113:検索結果出力部60は、
検索候補蓄積部30に残された内容を検索結果として利
用者に提供し、処理を終了する。
【0020】
【実施例】以下、上記絞り込みルールは、漢字表記と、
その漢字表記の可能な読みを列挙した読みリストとから
構成される本発明の第1の実施例について説明する。本
発明の第1の実施例によれば、上記絞り込み適用部50
は、上記検索候補が上記絞り込みルール検索部40にお
いて検索された絞り込みルールの上記読みリスト中に存
在するかどうかを判定する部と、存在する場合には当該
検索候補を検索結果として残し、存在しない場合には当
該検索候補を検索結果から排除する部とを有する。
【0021】図6は上記本発明の第1の実施例の説明に
用いるデータベース70の内容例である。同図には、デ
ータベース70を検索する際のキーとなる読みのフィー
ルド100、読みに含まれる濁音を清音化した清音化読
みのフィールド101、漢字表記のフィールド102、
及び、例えば、住所と電話番号とからなる情報本体のフ
ィールド103が示される。清音化読みのフィールド1
01もデータベース70を検索する際の検索キーとして
用いられる。
【0022】図7は本発明の第1の実施例による絞り込
みルール群80の内容の一例を表わす図である。絞り込
みルール群80は、絞り込みルール群を検索する際のキ
ーとなる漢字表記のフィールド104と、漢字表記10
4に対する可能な読みを列挙した読みのリストのフィー
ルド105とからなる。以下の本発明の第1の実施例の
動作の説明に使用するステップは、図5に示された情報
検索装置の動作フローチャート中のステップと対応して
いる。
【0023】利用者から検索キーとして“なかじま”が
入力されたとする。検索キー清音化部10では濁音を清
音化して、清音化検索キー=“なかしま”を作成し、清
音化検索部20に送る(ステップ101)。清音化検索
部20では、清音化検索キー=“なかしま”によって図
6に示すデータベース70を検索し、検索候補を得る
(ステップ102)。データベースは図6に示すような
構成であるため、検索候補として、(なかじま なかし
ま 中島 横浜市××区 045-xxx-xxxx)、(ながしま
なかしま 永島 横浜市○○区 045-yyy-yyyy)、
(なかしま なかしま 中島 横浜市△△区 045-zzz-
zzzz)、(ながじま なかしま 永島 横浜市○△区
045-vvv-vvvv)の4つが得られる。このように検索候補
が得られたので、処理はステップ104に進む(ステッ
プ103)。清音化検索部20では、これらの4つの検
索候補を検索候補蓄積部30に蓄積する(ステップ10
4)。
【0024】絞り込み検索部40では、検索候補蓄積部
30から検索候補を1つ読み出す(ステップ106)。
ここでは、(なかじま なかしま 中島 横浜市××区
045-xxx-xxxx)を読み出したものと仮定する。この検
索候補の漢字表記=“中島”で絞り込みルール群80を
検索する(ステップ107)。絞り込みルール群は図7
に示すような構成をなすので、検索結果として、(中島
なかじま なかしま)が得られる。このように検索に
成功したので、処理はステップ109に進む(ステップ
108)。
【0025】絞り込み適用部50では、絞り込みルール
群80の検索結果(中島 なかじまなかしま)を (な
かじま なかしま 中島 横浜市××区 045-xxx-xxx
x)に適用する。絞り込みルール群80の検索結果によ
れば、漢字表記“中島”に対して許される読みは、“な
かじま”と“なかしま”の2種類である。即ち、利用者
が入力した検索キーがこれら2種類の読みの中に含まれ
ていなければならないことを示している。本発明の第1
の実施例によれば、検索キー=“なかじま”であるた
め、この条件を満たしている。よって、(なかじま な
かしま 中島 横浜市××区 045-xxx-xxxx)を検索結
果として残し、ステップ110へ進む(ステップ10
9)。絞り込みルール適用部50では、検索結果として
残した(なかじま なかしま 中島 横浜市××区 04
5-xxx-xxxx)を検索候補蓄積部30に書き戻す(ステッ
プ110)。更に絞り込みルール適用部50では、検索
候補蓄積部30に未だ処理していない検索候補があるか
否かを調べる。本実施例の場合に、他の3件の未処理検
索候補が残っているので、ステップ106に戻る(ステ
ップ112)。
【0026】絞り込みルール検索部40は、検索候補蓄
積部30から未処理の検索候補の中の1つを読み出す
(ステップ106)。ここでは、(ながしま なかしま
永島横浜市○○区 045-yyy-yyyy)を読み出した場合
を考える。この検索候補の漢字表記=“永島”で絞り込
みルール群80を検索する(ステップ107)。絞り込
みルール群80は図7に示された構成をなすので、検索
結果として(永島 ながしま ながじま)が得られる。
このように検索に成功したので、処理はステップ109
に進む(ステップ108)。
【0027】絞り込み適用部50では、絞り込みルール
群80の検索結果(永島 ながしまながじま)を (な
がしま なかしま 永島 横浜市○○区 045-yyy-yyy
y)に適用する。絞り込みルール群80の検索結果によ
れば、漢字表記“永島”に対して許される読みは、“な
がしま”と“ながじま”の2種類である。即ち、利用者
が入力した検索キーがこれら2種類の読みの中に含まれ
ていなければならないことを示している。本発明の第1
の実施例によれば、検索キー=“なかじま”であるた
め、この条件を満足しない。よって、(ながしま なか
しま 永島 横浜市○○区 045-yyy-yyyy)を検索結果
として残さないことを決定し、ステップ111へ進む
(ステップ109)。絞り込みルール適用部50では、
検索結果として残さない(ながしま なかしま 永島
横浜市○○区 045-yyy-yyyy)を検索候補蓄積部30か
ら取り除く(ステップ111)。更に絞り込みルール適
用部50では、検索候補蓄積部30に未だ処理していな
い検索候補があるか否かを調べる。本実施例の場合に、
他の2件の未処理検索候補が残っているので、ステップ
106に戻る(ステップ112)。
【0028】上記のような処理を残りの2件(なかしま
なかしま 中島 横浜市△△区045-zzz-zzzz)、(な
がじま なかしま 永島 横浜市○△区 045-vvv-vvv
v)について行うと、(なかしま なかしま 中島 横
浜市△△区 045-zzz-zzzz)のみが検索候補として残
る。以上の処理から(なかじま なかしま 中島 横浜
市××区 045-xxx-xxxx)、(なかしま なかしま 中
島 横浜市△△区 045-zzz-zzzz)の2件が残り、検索
結果として利用者に提供され、処理は終了する(ステッ
プ113)。
【0029】以上の処理によって、検索キー=“なかじ
ま”に対して検索されるべきでない2件(ながしま な
かしま 永島 横浜市○○区 045-yyy-yyyy)、(なが
じまなかしま 永島 横浜市○△区 045-vvv-vvvv)を
排除することができ、結果として適合率の高い検索を実
現することが可能である。次に、上記絞り込みルール
が、漢字1文字表記と、適用条件と、上記漢字1文字表
記の読みのリストとの3つ組から構成される本発明の第
2の実施例について説明する。本発明の第2の実施例に
おいて、上記絞り込みルール検索部40は、上記読み出
された検索候補に含まれる漢字表記1文字によって上記
絞り込みルール群80を検索する。更に、上記絞り込み
適用手段50は、読みリスト取得部と、読み生成部と、
検索候補排除部とからなる。
【0030】読みリスト取得部は、上記検索候補の上記
漢字表記1文字が当該漢字表記1文字によって検索に成
功した絞り込みルールの適用条件を満たす際に、当該絞
り込みルールの当該漢字表記1文字に対応した読みのリ
ストを取得する。読み生成部は、上記読み出された検索
候補を構成する全ての漢字表記1文字について取得され
た上記漢字表記1文字の読みのリストから当該検索候補
に対する可能な読みを生成する。
【0031】検索候補排除部は、上記読み生成手段によ
って生成された可能な読みの中で上記検索キーと一致す
る読みを持つ検索候補だけを検索結果として残し、他の
検索候補を排除する。図8は本発明の第2の実施例によ
る絞り込みルール群80の内容の一例を表わす図であ
る。絞り込みルール群80は、絞り込みルール群を検索
する際のキーとなる漢字1文字表記のフィールド106
と、絞り込みルールを適用できるか否かの条件を示す適
用条件のフィールド107、漢字1文字表記106に対
する可能な読みを列挙した読みのリストのフィールド1
08とからなる。
【0032】以下の本発明の第2の実施例の動作の説明
に使用するステップは、図5に示された情報検索装置の
動作フローチャート中のステップと対応している。利用
者から検索キーとして“なかじま”が入力されたとす
る。検索キー清音化部10では濁音を清音化して、清音
化検索キー=“なかしま”を作成し、清音化検索部20
に送る(ステップ101)。
【0033】清音化検索部20では、清音化検索キー=
“なかしま”によって図6に示すデータベース70を検
索し、検索候補を得る(ステップ102)。データベー
スは図6に示すような構成であるため、検索候補とし
て、(なかじま なかしま 中島 横浜市××区 045-
xxx-xxxx)、(ながしま なかしま 永島 横浜市○○
区 045-yyy-yyyy)、(なかしま なかしま 中島 横
浜市△△区 045-zzz-zzzz)、(ながじま なかしま
永島 横浜市○△区 045-vvv-vvvv)の4つが得られ
る。このように検索候補が得られたので、処理はステッ
プ104に進む(ステップ103)。清音化検索部20
では、これらの4つの検索候補を検索候補蓄積部30に
蓄積する(ステップ104)。
【0034】絞り込み検索部40では、検索候補蓄積部
30から検索候補を1つ読み出す(ステップ106)。
ここでは、(なかじま なかしま 中島 横浜市××区
045-xxx-xxxx)を読み出したものと仮定する。この検
索候補の漢字表記=“中島”で絞り込みルール群80を
検索する(ステップ107)。絞り込みルール群は図7
に示すような構成をなすので、1文字目“中”に対して
(中 すべて (なかちゅう))が得られ、2文字目
“島”に対して(島 1文字目 (しま))、(島 2
文字目以降 (しま じま))の二つが得られる。この
ように検索に成功したので、処理はステップ109に進
む(ステップ108)。
【0035】絞り込み適用部50では、検索された絞り
込みルール(中 すべて (なかちゅう))から1文字
目“中”に対する可能な読みとして、“なか”と“ちゅ
う”が得られる。また、“島”は2文字目に在るので、
適用条件として2文字目以降が指定されている(島 2
文字目以降 (しま じま))のみが使用される。この
ルールから2文字目“島”に対する可能な読みとして、
“しま”、“じま”が得られる。1文字目及び2文字目
の夫々の漢字の可能な読みから、“なかしま”、“なか
じま”、“ちゅうしま”、“ちゅうじま”の4つの読み
が生成される。利用者が入力した検索キー“なかじま”
はこの中に含まれる。従って、絞り込みルール適用部5
0では、検索候補(なかじま なかしま 中島 横浜市
××区045-xxx-xxxx)は検索結果として残し、ステップ
110へ進む(ステップ109)。絞り込みルール適用
部50では、検索結果として残した(なかじま なかし
ま 中島 横浜市××区 045-xxx-xxxx)を検索候補蓄
積部30に書き戻す(ステップ110)。更に絞り込み
ルール適用部50では、検索候補蓄積部30に未だ処理
していない検索候補があるか否かを調べる。本実施例の
場合に、他の3件の未処理検索候補が残っているので、
ステップ106に戻る(ステップ112)。
【0036】絞り込みルール検索部40は、検索候補蓄
積部30から未処理の検査候補の中の1つを読み出す
(ステップ106)。ここでは、(ながしま なかしま
永島横浜市○○区 045-yyy-yyyy)を読み出した場合
を考える。この検索候補の漢字表記=“永島”の1文字
目“永”と2文字目“島”とで夫々絞り込みルール群8
0を検索する(ステップ107)。絞り込みルール群8
0は図7に示された構成をなすので、1文字目“永”に
対して(永 すべて (なが えい))が得られ、2文
字目“島”に対して(島 1文字目 (しま))、(島
2文字目以降(しま じま))の2つが得られる。こ
のように検索に成功したので、処理はステップ109に
進む(ステップ108)。
【0037】絞り込み適用部50では、検索された絞り
込みルール(永 すべて (ながえい))から1文字目
“永”に対する可能な読みとして、“なが”と“えい”
が得られる。また、“島”は2文字目に在るので、適用
条件として2文字目以降が指定されている(島 2文字
目以降 (しま じま))のみが使用される。このルー
ルから2文字目“島”に対する可能な読みとして、“し
ま”、“じま”が得られる。1文字目及び2文字目の夫
々の漢字の可能な読みから、“ながしま”、“ながじ
ま”、“えいしま”、“えいじま”の4つの読みが生成
される。しかし、利用者が入力した検索キー“なかじ
ま”はこの中に含まれない。よって、絞り込みルール適
用部50では、検索候補(ながしま なかしま 永島
横浜市○○区 045-yyy-yyyy)を検索結果として残さな
いことを決定し、ステップ111へ進む(ステップ10
9)。絞り込みルール適用部50では、検索結果として
残さない検索候補(ながしま なかしま 永島 横浜市
○○区 045-yyy-yyyy)を検索候補蓄積部30から取り
除く(ステップ111)。更に絞り込みルール適用部5
0では、検索候補蓄積部30に未だ処理していない検索
候補があるか否かを調べる。本実施例の場合に、あと2
件の未処理検索候補が残っているので、ステップ106
に戻る(ステップ112)。
【0038】上記のような処理を残りの2件(なかしま
なかしま 中島 横浜市△△区045-zzz-zzzz)、(な
がじま なかしま 永島 横浜市○△区 045-vvv-vvv
v)について行うと、(なかしま なかしま 中島 横
浜市△△区 045-zzz-zzzz)のみが検索候補として残
る。以上の処理から(なかじま なかしま 中島 横浜
市××区 045-xxx-xxxx)、(なかしま なかしま 中
島 横浜市△△区 045-zzz-zzzz)の2件が残り、検索
結果として利用者に提供され、処理は終了する(ステッ
プ113)。
【0039】以上の処理によって、検索キー=“なかじ
ま”に対して検索されるべきでない2件(ながしま な
かしま 永島 横浜市○○区 045-yyy-yyyy)、(なが
じまなかしま 永島 横浜市○△区 045-vvv-vvvv)を
排除することができ、結果として適合率の高い検索を実
現することが可能である。また、上記の実施例では、情
報検索装置100の構成要件に基づいて説明している
が、この例に限定されることなく、情報検索装置100
の各々の構成要件をソフトウェア(プログラム)で構築
し、ディスク装置等に格納しておき、必要に応じて情報
検索装置100のコンピュータにインストールしてヒッ
トすべきでない検索候補を排除する情報検索を行うこと
も可能である。さらに、構築されたプログラムをフロッ
ピーディスクやCD−ROM等の可搬記憶媒体に格納
し、このようなシステムを用いる場面で汎用的に使用す
ることも可能である。
【0040】本発明は、上記の実施例に限定されること
なく、特許請求の範囲内で種々変更・応用が可能であ
る。
【0041】
【発明の効果】以上の説明から明らかなように、本発明
の情報検索装置及び方法を用いることにより、清音化検
索キーによって得られた検索候補の中から、利用者の意
図しない検索候補を排除して、結果として適合率の高い
検索結果を利用者に提示することができるという効果が
得られる。
【図面の簡単な説明】
【図1】本発明の原理構成図である。
【図2】本発明の原理説明図である。
【図3】本発明による情報検索方法の動作フローチャー
トである。
【図4】本発明の実施例による情報検索システムの構成
図である。
【図5】本発明の実施例による情報検索システムの動作
フローチャートである。
【図6】本発明の第1の実施例によるデータベースの内
容例を示す図である。
【図7】本発明の第1の実施例による絞り込みルール群
の内容例を示す図である。
【図8】本発明の第2の実施例による絞り込みルール群
の内容例を示す図である。
【符号の説明】
10 検索キー清音化手段 20 清音化検索手段 30 検索候補蓄積手段 40 絞り込みルール検索手段 50 絞り込みルール適用手段 60 検索結果出力手段 70 データベース 72 清音化インデックス部 80 絞り込みルール群 100 情報検索装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 インデックス部の濁音を清音化した清音
    化インデックス部を含むデータベースを検索キーによっ
    て検索する情報検索装置であって、、 上記検索キーを清音化する検索キー清音化手段と、 上記検索キー清音化手段において清音化された検索キー
    によって上記データベースの清音化インデックス部を検
    索する清音化検索手段と、 上記清音化検索手段において得られた検索候補を蓄積す
    る検索候補蓄積手段と、 不要な検索候補を排除するための絞り込みルールを含む
    絞り込みルール群と、上記検索候補蓄積手段に蓄積され
    た検索候補を読み出し、上記絞り込みルール群を検索す
    る絞り込みルール検索手段と、 上記絞り込みルール検索手段において検索された絞り込
    みルールに従って、上記検索候補を検索結果として残す
    か否かを決定する絞り込みルール適用手段と、 上記絞り込みルール適用手段において検索結果として残
    された検索候補を出力する検索結果出力手段とから構成
    されることを特徴とする情報検索装置。
  2. 【請求項2】 上記絞り込みルールは、漢字表記と、そ
    の漢字表記の可能な読みを列挙した読みリストとから構
    成され、 上記絞り込み適用手段は、上記検索候補が上記絞り込み
    ルール検索手段において検索された絞り込みルールの上
    記読みリスト中に存在するかどうかを判定する手段と、
    存在する場合には該検索候補を検索結果として残し、存
    在しない場合には該検索候補を検索結果から排除する手
    段とを有することを特徴とする請求項1記載の情報検索
    装置。
  3. 【請求項3】 上記絞り込みルールは、漢字1文字表記
    と、適用条件と、上記漢字1文字表記の読みのリストと
    の3つ組から構成され、 上記絞り込みルール検索手段は、上記読み出された検索
    候補に含まれる漢字表記1文字によって上記絞り込みル
    ール群を検索し、 上記絞り込み適用手段は、 上記検索候補の上記漢字表記1文字が該漢字表記1文字
    によって検索に成功した絞り込みルールの適用条件を満
    たす際に、該絞り込みルールの該漢字表記1文字に対応
    した読みのリストを取得する読みリスト取得手段、 上記読み出された検索候補を構成する全ての漢字表記1
    文字について取得された上記漢字表記1文字の読みのリ
    ストから該検索候補に対する可能な読みを生成する読み
    生成手段、及び上記読み生成手段によって生成された可
    能な読みの中で上記検索キーと一致する読みを持つ検索
    候補を検索結果として残す手段により構成されることを
    特徴とする請求項1記載の情報検索装置。
  4. 【請求項4】 インデックス部の濁音を清音化した清音
    化インデックス部を含むデータベースを検索キーによっ
    て検索する情報検索方法であって、 (1)上記検索キーを清音化する段階と、 (2)上記清音化された検索キーによって上記データベ
    ースの清音化インデックス部を検索する段階と、 (3)検索によって得られた検索候補を検索候補蓄積部
    に蓄積する段階と、 (4)上記蓄積された各検索候補を上記検索候補蓄積部
    から読み出し、不要な検索候補を排除するための絞り込
    みルールを含む絞り込みルール群を上記読み出された検
    索候補によって検索する段階と、 (5)検索に成功した絞り込みルールに従って、上記検
    索候補を検索結果として残すか否かを決定する段階と、 (6)検索結果として残さないことが決定された上記検
    索候補を上記検索候補蓄積部から削除する段階と、 (7)上記検索候補蓄積部に蓄積された全ての検索候補
    に対し、上記段階(4)、(5)及び(6)を繰り返す
    段階と、 (8)上記検索蓄積部に残された検索候補を出力する段
    階とからなることを特徴とする情報検索方法。
  5. 【請求項5】 インデックス部の濁音を清音化した清音
    化インデックス部を含むデータベースを検索キーによっ
    て検索する情報検索方法であって、 (1)上記検索キーを清音化する段階と、 (2)上記清音化された検索キーによって上記データベ
    ースの清音化インデックス部を検索する段階と、 (3)検索によって得られた検索候補を検索候補蓄積部
    に蓄積する段階と、 (4)上記蓄積された各検索候補を上記検索候補蓄積部
    から読み出す段階と (5.1)上記検索候補から漢字表記1文字を取り出
    し、漢字1文字表記と、適用条件と、上記漢字1文字表
    記の読みのリストとの3つ組から構成された不要な検索
    候補を排除するための絞り込みルールを含む絞り込みル
    ール群を上記取り出された漢字1文字表記によって検索
    する段階と、 (5.2)上記検索候補の上記漢字表記1文字が該漢字
    表記1文字によって検索に成功した絞り込みルールの適
    用条件を満たすかどうかを判定する段階と、 (5.3)上記漢字1文字表記が該絞り込みルールの上
    記適用条件を満たす場合に、該絞り込みルールの該漢字
    表記1文字に対応した読みのリストを取得する段階と、 (5.4)上記読み出された検索候補を構成する全ての
    漢字表記1文字について上記段階(5.1)、(5.
    2)及び(5.3)を繰り返す段階と、 (6)上記検索候補を構成する全ての漢字表記1文字に
    ついて取得された上記読みのリストから該検索候補に対
    する可能な読みを生成する段階と、 (7)上記検索候補に対し生成された可能な読みの中に
    上記検索キーと一致する可能な読みが在るかどうかを判
    定する段階と、 (8)一致する可能な読みが無い場合に、該検索候補を
    上記検索候補蓄積部から削除する段階と、 (9)上記検索候補蓄積部に蓄積された全ての検索候補
    に対し、上記段階(4)、(5.1)、(5.2)、
    (5.3)、(5.4)、(6)、(7)及び(8)を
    繰り返す段階と、 (10)上記検索蓄積部に残された検索候補を出力する
    段階とからなることを特徴とする情報検索方法。
  6. 【請求項6】 インデックス部の濁音を清音化した清音
    化インデックス部を含むデータベースを検索キーによっ
    て検索する情報検索プログラムを格納した記憶媒体であ
    って、 上記検索キーを清音化させる検索キー清音化プロセス
    と、 上記清音化された検索キーによって上記データベースの
    清音化インデックス部を検索させ、検索候補蓄積部に蓄
    積させる清音化検索プロセスと、 上記検索候補蓄積手段に蓄積された検索候補を読み出
    し、不要な検索候補を排除するための絞り込みルールを
    含む絞り込みルール群を検索させる絞り込みルール検索
    プロセスと、 上記検索された絞り込みルールに従って、上記検索候補
    を検索結果として残すか否かを決定させる絞り込みルー
    ル適用プロセスと、 上記検索結果として残された検索候補を出力させる検索
    結果出力プロセスとから構成されることを特徴とする情
    報検索プログラムを格納した記憶媒体。
JP9222368A 1997-08-19 1997-08-19 情報検索装置及び情報検索方法、並びに、情報検索プログラムを格納した記憶媒体 Pending JPH1166087A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9222368A JPH1166087A (ja) 1997-08-19 1997-08-19 情報検索装置及び情報検索方法、並びに、情報検索プログラムを格納した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9222368A JPH1166087A (ja) 1997-08-19 1997-08-19 情報検索装置及び情報検索方法、並びに、情報検索プログラムを格納した記憶媒体

Publications (1)

Publication Number Publication Date
JPH1166087A true JPH1166087A (ja) 1999-03-09

Family

ID=16781262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9222368A Pending JPH1166087A (ja) 1997-08-19 1997-08-19 情報検索装置及び情報検索方法、並びに、情報検索プログラムを格納した記憶媒体

Country Status (1)

Country Link
JP (1) JPH1166087A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009277068A (ja) * 2008-05-15 2009-11-26 Aisin Aw Co Ltd 検索装置及び検索プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009277068A (ja) * 2008-05-15 2009-11-26 Aisin Aw Co Ltd 検索装置及び検索プログラム

Similar Documents

Publication Publication Date Title
JP5437557B2 (ja) 検索処理方法及び検索システム
US20020178002A1 (en) System and method for searching, analyzing and displaying text transcripts of speech after imperfect speech recognition
EP1738291A1 (en) Tree index based method for accessing automatic directory
JPH05324726A (ja) 文書データ分類装置及び文書分類機能構築装置
WO1996016374A1 (fr) Systeme de base de donnees partage par une pluralite d'appareils clients, procede de mise a jour de donnees et application a un processeur de caracteres
JPH08339378A (ja) 類似文字列の展開方法、検索方法及びそれらの装置
CA2275391C (en) File processing method, data processing device, and storage medium
JP2001318792A (ja) 固有表現抽出規則生成システムと方法およびその処理プログラムを記録した記録媒体ならびに固有表現抽出装置
JP3996125B2 (ja) 文章生成装置及び生成方法
JP6868576B2 (ja) 事象提示システムおよび事象提示装置
JPH1166087A (ja) 情報検索装置及び情報検索方法、並びに、情報検索プログラムを格納した記憶媒体
US20060136204A1 (en) Database construction apparatus and method
CN111968636B (zh) 语音请求文本的处理方法及计算机存储介质
JP2000339332A (ja) 検索インデックスを記録した媒体、検索インデックス更新方法、その装置、そのプログラムを記録した媒体
KR100452024B1 (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
JP2006004283A (ja) テキスト情報源からのキーワード抽出・絞り込み方法およびシステム
JPH1166076A (ja) データ派生装置及び方法、並びに、データ派生プログラムを格納した記憶媒体
JPH08190571A (ja) 文書検索方法
JP4574186B2 (ja) 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置
JP4319827B2 (ja) 文書検索プログラム
JPH1196170A (ja) データベース作成方法および情報検索方法および情報検索装置および記録媒体
JP3065151B2 (ja) 標準名付与システム
JP2004506960A (ja) 蓋然論マッチング・エンジン
JPH1173420A (ja) 文書処理装置及び文書処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH09212523A (ja) 全文検索方法