JPH08263472A - 文章検索方法及び装置 - Google Patents

文章検索方法及び装置

Info

Publication number
JPH08263472A
JPH08263472A JP7069164A JP6916495A JPH08263472A JP H08263472 A JPH08263472 A JP H08263472A JP 7069164 A JP7069164 A JP 7069164A JP 6916495 A JP6916495 A JP 6916495A JP H08263472 A JPH08263472 A JP H08263472A
Authority
JP
Japan
Prior art keywords
character string
sentence
input
search
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7069164A
Other languages
English (en)
Inventor
Masato Yajima
真人 矢島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7069164A priority Critical patent/JPH08263472A/ja
Publication of JPH08263472A publication Critical patent/JPH08263472A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】同音語選択誤りに起因する検索漏れをなくす。 【構成】入力部1から入力された文字列を用いて検索処
理部4にて読み辞書5を検索することで、その入力文字
列の同音語文字列を得た後、制御部2により検索対象文
記憶部6から検索対象文を1文ずつ取り出して、検索処
理部4にて入力文字列と同音語文字列により検索を行わ
せる。同音語文字列を含む文が検索された場合には、そ
の文中に、入力文字列と一緒に使われる頻度の高い文字
列が含まれているかを共起チェック部7aにより共起辞
書8aを用いてチェックさせ、また、その文中に、入力
文字列と一緒に使われることのない文字列が含まれてい
ないかを非共起チェック部7bにより非共起辞書8bを
用いてチェックさせる。このようにして求められる検索
対象文と検索文字列、更には共起文字列または非共起文
字列は対応付けて検索結果記憶部9に格納される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、大量の文書中からユー
ザが入力した検索入力文と類似している文章を検索する
ための文章検索方法及び装置に関する。
【0002】
【従来の技術】近年、日本語ワードプロセッサや光学的
文字読取装置(OCR)などの文章入力装置の普及に伴
い、従来紙やマイクロフィルムという形態で保存してい
た文書を、電子化して磁気ディスクや光磁気ディスクな
どの外部記憶装置に保存するようになってきた。
【0003】また、大量の電子化された文書データか
ら、いかにユーザが要求する文書を検索するかというテ
キスト検索技術も開発され発展しつつある。従来の検索
技術では、入力された文字列を含む文、或いは入力され
た文字列の異表記、類語などを含む文を検索するという
方式が一般的であった。
【0004】
【発明が解決しようとする課題】ところが、上記した従
来の検索技術では、検索漏れが生じることがあった。そ
こで、この検索漏れの要因を調べたところ、ワードプロ
セッサなどによる同音語の選択誤りによって、本来使用
すべき言葉の同音語(読みが同じだが表記の異なる語
句)がそのまま修正されずに保存されてしまうという事
態が起きていることにあると認識するに至った。即ち、
このような同音語選択誤りを含む文に対しては、上記従
来の検索技術では、正しく検索することはできないと認
識するに至った。
【0005】このように、入力された文字列を含む文、
或いは入力された文字列の異表記、類語などを含む文を
検索するという従来の文章検索技術では、検索対象とな
る文書内にワードプロセッサなどに起因する同音語選択
誤りの語句が含まれている場合には、本来検索すべき文
を検索することができないという問題があった。
【0006】本発明は上記事情を考慮してなされたもの
でその目的は、入力した文字列で検索する際に、この文
字列の同音語の文字列でも検索を行うことにより、同音
語選択誤りによる検索漏れがなく、精度の高い文章検索
が行える文章検索方法及び装置を提供することにある。
【0007】
【課題を解決するための手段】本発明は、入力した文字
列を含む文を検索する際に、当該入力文字列と同じ読み
の文字列を含む文も検索するようにしたことを特徴とす
るものである。本発明はまた、入力文字列と同じ読みの
文字列を含むだけでなく、当該入力文字列と一緒に使わ
れる頻度の高い文字列をも含む文を検索するようにした
ことを特徴とする。
【0008】本発明はまた、入力文字列と同じ読みの文
字列を含み、且つ当該入力文字列と一緒に使われること
のない文字列は含まない文を検索するようにしたことを
特徴とする。
【0009】本発明はまた、入力文字列と同じ読みの文
字列を含み、且つ当該入力文字列と一緒に使われる頻度
の高い文字列をも含む文、及び当該入力文字列と同じ読
みの文字列を含み、且つ当該入力文字列と一緒に使われ
ることのない文字列は含まない文を検索するようにした
ことを特徴とする。
【0010】
【作用】本発明によれば、入力した文字列と同じ読みの
文字列でも検索を行うことで、検索対象である文書内に
同音語選択誤りの文字列が含まれている場合でも、検索
漏れを防ぐことが可能となる。
【0011】また、上記同じ読みの文字列で検索した文
内に、上記入力文字列と一緒に使われる頻度の高い文字
列が含まれているかどうか、または上記入力文字列と一
緒に使われることのない文字列が含まれていないかどう
かをチェックすることで、上記入力文字列に対して同音
語選択誤りをした文を精度よく検索することができる。
【0012】
【実施例】以下、図面を参照して本発明の一実施例につ
き説明する。図1は同実施例に係る文章検索装置の構成
を示すブロック図である。図1の文章検索装置は、入力
部1、制御部2、表示部3、検索処理部4、読み辞書
5、検索対象文記憶部6、共起/非共起チェック部7、
共起/非共起辞書8、及び検索結果記憶部9から構成さ
れる。
【0013】入力部1は、例えばキーボード、OCRな
どからなる入力装置であり、文字列や種々の制御コード
(コマンド等)を入力するためのものである。制御部2
は、例えば中央処理装置(CPU)であり、文章検索装
置全体の制御を司る。ここでは制御部2は、検索処理部
4及び共起/非共起チェック部7を制御する。
【0014】表示部3は、例えばCRTディスプレイ装
置または液晶ディスプレイ装置(フラットパネルディス
プレイ装置)等の表示装置であり、入力文の文字列(以
下、入力文字列と称する)や検索対象文の文字列等の表
示に用いられる。
【0015】検索処理部4は、制御部2の制御のもと
で、検索キーとしての入力文字列と読みが同じ文字列を
読み辞書5から検索する検索処理と、入力文字列または
当該入力文字列と読みが同じ文字列を含む文を検索する
検索処理とを実行する。
【0016】読み辞書5は、文字列と、その読みとを組
にして格納したものである。検索対象文記憶部6は、検
索処理部4が検索する対象となる文(検索対象文)を格
納したものである。
【0017】共起/非共起チェック部7は、共起チェッ
ク部7a及び非共起チェック部7bから構成される。共
起チェック部7aは、制御部2の制御のもとで、共起辞
書8aを用いて、入力文字列と組になっている文字列
(以下、共起文字列と称する)を抽出し、検索された文
に共起文字列が含まれているかどうかチェックする。非
共起チェック部7bは、制御部2の制御のもとで、非共
起辞書8bを用いて、入力文字列と組になっている文字
列(以下、非共起文字列と称する)を抽出し、検索され
た文に非共起文字列が含まれているかどうかチェックす
る。
【0018】共起/非共起辞書8は、一緒に使われる
(共起する)頻度の高い文字列の組を格納した共起辞書
8aと、一緒に使われることのない文字列の組を格納し
た非共起辞書8bから構成される。
【0019】検索結果記憶部9は、検索された文と、検
索に用いた文字列(検索文字列)と、その文字列と共起
する文字列または共起しない文字列とを対応付けて格納
するためのものである。
【0020】検索対象文記憶部6、共起辞書8a並びに
非共起辞書8b(からなる共起/非共起辞書8)、及び
検索結果記憶部9は、例えばハードディスク装置や光デ
ィスク装置等の大容量外部記憶装置を用いて実現され
る。
【0021】次に、図1の構成の動作の概略を説明す
る。まず、本実施例における文章検索処理は、制御部2
の制御により、検索処理部4と、共起チェック部7a並
びに非共起チェック部7b(からなる共起/非共起チェ
ック部7)により実行される。
【0022】検索処理部4は、入力部1から入力された
文字列(入力文字列)を制御部2から与えられると、読
み辞書5の文字列を検索し、当該入力文字列と読みが同
じ文字列(以下、同音語文字列と称する)を抽出し、当
該入力文字列だけでなく、この抽出した同音語文字列も
検索キーとして、検索対象文記憶部6に記憶されている
検索対象文から、その検索キーに一致する文字列を含ん
だ文を検索し、その検索キーの文字列と、検索した検索
対象文を組にして制御部2に渡す。
【0023】制御部2は、同音語文字列で検索された検
索対象文を共起チェック部7a及び非共起チェック部7
bに渡す。共起チェック部7aは、共起辞書8aを用い
て、上記入力文字列と組になっている共起文字列を抽出
し、制御部2から渡された検索対象文に当該共起文字列
が含まれているかどうかチェックして制御部2に結果を
返す。また、非共起チェック部7bは、非共起辞書7を
用いて、上記入力文字列と組になっている非共起文字列
を抽出し、制御部2から渡された検索対象文に当該非共
起文字列が含まれているかどうかチェックして制御部2
に結果を返す。
【0024】制御部2は、共起チェック部7a及び非共
起チェック部7bのチェック結果を用いて、検索結果記
憶部9に、検索処理部4が検索した検索対象文と、その
検索キーの文字列、更には共起文字列または非共起文字
列を対応付けて格納する。
【0025】次に、図1の構成の動作の詳細を、図2乃
至図8を参照して説明する。なお、図2は読み辞書5の
データ構造例を示す図、図3は共起辞書8aのデータ構
造例を示す図、図4は非共起辞書8bのデータ構造例を
示す図、図5は動作を説明するためのフローチャート、
図6は検索対象文記憶部6に格納されている検索対象文
の一例を示す図、図7は検索結果記憶部9のデータ構造
例を示す図、図8は検索結果記憶部9に基づく検索結果
表示例を示す図である。
【0026】まず、図5に示すように、入力部1から検
索キーとなる文字列が入力されると(ステップS1)、
制御部2は、その入力文字列を検索処理部4に渡す。こ
こでは、入力文字列として、例えば「老ける」という文
字列が入力されたと仮定する。
【0027】この場合、検索処理部4は、読み辞書5か
ら、入力文字列「老ける」と読みが同じ文字列(同音語
文字列)を検索する(ステップS2)。今、読み辞書5
には、読みが「ふける」の文字列が図2のように格納さ
れているものとすると、当該読み辞書5から、入力文字
列「老ける」の同音語文字列として「更ける」「耽る」
が検索され、制御部2に渡される。
【0028】制御部2は、検索処理部4に渡す検索対象
文が検索対象文記憶部6に残っているか否かを調べ(ス
テップS3)、残っていないならば、検索処理を終了す
る(ステップS4)。これに対し、残っているならば、
検索対象文を1文取り出して検索処理部4に渡す(ステ
ップS5)。
【0029】検索処理部4は、その検索対象文を対象
に、入力文字列「老ける」、及びその同音語文字列「更
ける」「耽る」をそれぞれ検索文字列(検索キー)とし
て検索を行い、その検索対象文とそこに含まれる検索文
字列とを対応付けて制御部2に渡す(ステップS6)。
【0030】制御部2は、上記検索対象文が検索文字列
を含むかどうか判断し(ステップS7)、含まなければ
ステップS3に戻る。これに対し、含む場合には、制御
部2は、該当する検索文字列が同音語文字列であるか否
かをチェックする(ステップS8)。
【0031】もし、(検索対象文に含まれる)検索文字
列が同音語文字列でないならば、即ち入力文字列である
ならば、制御部2は、検索対象文と検索文字列とを対応
付けて検索結果記憶部9に格納する(ステップS1
2)。例えば、検索対象文記憶部6に図6のような検索
対象文が記憶されていて、当該記憶部6から図6中の1
番目の「年齢が老ける」という文がステップS5で取り
出されて、検索処理部4に渡された場合には、当該検索
処理部4において、その文「年齢が老ける」が検索文字
列「老ける」、「更ける」または「耽る」のうちの「老
ける」と対応付けられて制御部2に返される。ここで、
検索文字列「老ける」は入力文字列であることから、制
御部2は、ステップS8からステップS12に進んで、
検索対象文「年齢が老ける」と検索文字列「老ける」を
対応付けて、検索結果記憶部9に図7において符号aで
示すように格納する。
【0032】これに対し、検索対象文に含まれる検索文
字列が同音語文字列であるならば、制御部2は、その検
索対象文と入力文字列を共起チェック部7aに渡す。例
えば、図6中の2番目の検索対象文「顔が更ける」がス
テップS5で取り出されたものとすると、その検索対象
文「顔が更ける」と検索文字列「更ける」とが対応付け
てられて検索処理部4から制御部2に返される(ステッ
プS6)。この場合、検索文字列「更ける」が入力文字
列「老ける」の同音語文字列であることから(ステップ
S7,S8)、検索対象文「顔が更ける」と入力文字列
「老ける」が、制御部2から共起チェック部7aに渡さ
れる。
【0033】共起チェック部7aは、入力文字列で共起
辞書7aを検索して、当該入力文字列に対する共起文字
列を抽出し、制御部2から渡された検索対象文「顔が更
ける」に、この抽出した共起文字列が含まれるか否かを
調べて、その結果を制御部2に返す(ステップS9)。
例えば、入力文字列「老ける」で共起辞書7aが検索さ
れた場合には、当該辞書7aの内容が図3のようになっ
ているものとすると、「顔」「年齢」などの共起文字列
が共起チェック部7aにて抽出される。そして、検索対
象文「顔が更ける」に共起文字列「顔」が含まれている
ことが共起チェック部7aにて調べられ、検索対象文
「顔が更ける」と共起文字列「顔」が対応付けられて制
御部2に返される。
【0034】制御部2は、共起チェック部7のチェック
結果から、検索対象文に共起文字列が含まれているどう
かを判断する(ステップS10)。もし、検索対象文に
共起文字列が含まれているならば、制御部2は、その検
索対象文と検索文字列、及び当該共起文字列を対応付け
て検索結果記憶部9に格納する(ステップS12)。上
記の例では、図7において符号bで示すように、検索対
象文「顔が更ける」と検索文字列「更ける」と共起文字
列「顔」とが対応付けられて格納される。
【0035】これに対し、検索対象文に共起文字列が含
まれていないならば、制御部2は、その検索対象文と入
力文字列を非共起チェック部7bに渡す。例えば、検索
対象文「読書に耽る」がステップS5で取り出されたも
のとすると、その検索対象文「読書に耽る」と検索文字
列「耽る」とが対応付けられて検索処理部4から制御部
2に返される(ステップS6)。この場合、検索文字列
「耽る」が入力文字列「老ける」の同音語文字列である
ことから(ステップS7,S8)、ステップS8,S1
0を経て、検索対象文「読書に耽る」と入力文字列「老
ける」が、制御部2から非共起チェック部7bに渡され
る。
【0036】非共起チェック部7bは、入力文字列で非
共起辞書7bを検索して、当該入力文字列に対する非共
起文字列を抽出し、制御部2から渡された検索対象文
「読書に耽る」に、この抽出した非共起文字列が含まれ
るか否かを調べて、その結果を制御部2に返す(ステッ
プS11)。例えば、入力文字列「老ける」で非共起辞
書7bが検索された場合には、当該辞書7bの内容が図
4のようになっているものとすると、「秋」「読書」な
どの非共起文字列が非共起チェック部7bにて抽出され
る。そして、検索対象文「読書に耽る」に非共起文字列
「読書」が含まれていることが非共起チェック部7bに
て調べられ、検索対象文「読書に耽る」と非共起文字列
「読書」が対応付けられて制御部2に返される。
【0037】制御部2は、非共起チェック部7bのチェ
ック結果から、非共起文字列が検索対象文に含まれてい
なければ、検索対象文と検索文字列とを対応付けて検索
結果記憶部9に格納し、非共起文字列が検索対象文に含
まれているならば、検索対象文と検索文字列と、その非
共起文字列とを対応付けて検索結果記憶部9に格納する
(ステップS12)。上記の例では、検索対象文「読書
に耽る」には非共起文字列「読書」が含まれているの
で、図7において符号cで示すように、検索対象文「読
書に耽る」と検索文字列「耽る」と非共起文字列「読
書」とが対応付けられて格納される。
【0038】ステップS12が実行されると、ステップ
S3に戻り、検索対象文記憶部6内に未処理の検索対象
文がなくなるまで、上記の処理が繰り返される。なお、
本発明は前記実施例に限定されるものではない。例え
ば、前記実施例では、共起チェック部7aによる処理で
入力文字列の共起文字列が含まれる文は、非共起チェッ
クを行わずに検索結果記憶部9に格納したが、共起チェ
ック部7aによる共起チェックに続いて必ず非共起チェ
ック部7bによる非共起チェックを行う構成としても構
わない。
【0039】また、前記実施例では、検索結果の表示に
ついては特に述べていなかったが、検索結果記憶部9に
格納されている情報をもとに、種々の表示形態をとるこ
とが可能である。その際の表示形式は、制御部2によっ
て制御される。図8は、その一表示例を示すもので、検
索結果記憶部9に格納された検索対象文が全て表示部3
に表示される。この図8の表示例では、図7のように検
索対象文と組になる検索文字列が入力文字列と等しいa
のケースと、検索対象文と検索文字列と共起文字列が組
になったbのケースとが、入力文字列「老ける」に対す
る検索結果として表示され、検索対象文と検索文字列と
非共起文字列が組になったcのケースは、除外例(除外
文)として表示されている。勿論、表示方法によって
は、cのケースは表示しないようにしてもよい。また、
aのケースは、入力文字列による検索結果であり、bの
ケースは入力文字列の同音語文字列による検索結果であ
ることから、それぞれを区別して表示してもよいし、い
ずれか一方だけを表示するようにしてもよい。即ち、検
索結果記憶部9に格納されている検索対象文及び検索文
字列、共起文字列、非共起文字列の組み合わせから判別
して、表示の形態を種々変えることが可能である。要す
るに、本発明は、その要旨を逸脱しない範囲で種々変形
して実施することができる。
【0040】
【発明の効果】以上詳述したように本発明によれば、入
力した文字列を含む文だけでなく、当該入力文字列と同
じ読みの文字列を含む文を検索することにより、検索対
象とする文書内にワードプロセッサなどによる入力時の
同音語選択誤りが含まれている場合でも、ユーザの意図
した文を検索漏れを招くことなく検索できる。
【0041】また、本発明によれば、入力した文字列を
含む文だけでなく、当該入力文字列と同じ読みの文字列
を含む文を検索して、その文内に、入力文字列と一緒に
使われる頻度の高い文字列が含まれている文もしくは、
入力文字列と一緒に使われることのない文字列が含まれ
ていない文を検索することにより、検索対象とする文書
内にワードプロセッサなどによる入力時の同音語選択誤
りが含まれている場合でも、ユーザの意図した文を検索
漏れを招くことなく精度よく検索することができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文章検索装置の構成を
示すブロック図。
【図2】図1中の読み辞書5のデータ構造例を示す図。
【図3】図1中の共起辞書8aのデータ構造例を示す
図。
【図4】図1中の非共起辞書8bのデータ構造例を示す
図。
【図5】同実施例の動作を説明するためのフローチャー
ト。
【図6】図1中の検索対象文記憶部6に格納されている
検索対象文の一例を示す図。
【図7】図1中の検索結果記憶部9の検索対象文、検索
文字列、共起文字列及び非共起文字列の組からなるデー
タ構造例を示す図。
【図8】図7に示した検索結果記憶部9に基づく検索結
果表示例を示す図。
【符号の説明】
1…入力部、2…制御部、3…表示部(出力手段)、4
…検索処理部、5…読み辞書、6…検索対象文記憶部、
7a…共起チェック部、7b…非共起チェック部、8a
…共起辞書、8b…非共起辞書、9…検索結果記憶部。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力した文字列を含む文を検索する文章
    検索方法であって、 前記入力した文字列を含む文の他に、当該入力文字列と
    同じ読みの文字列を含む文を検索することを特徴とする
    文章検索方法。
  2. 【請求項2】 文字列を入力する入力手段と、 文字列と読みを組にして記憶した読み辞書と、 前記入力手段により入力された文字列と同じ読みの文字
    列を前記読み辞書から検索し、前記入力された文字列を
    含む文、及び前記同じ読みの文字列を含む文を検索する
    検索処理手段とを具備することを特徴とする文章検索装
    置。
  3. 【請求項3】 入力した文字列を含む文を検索する文章
    検索方法であって、 前記入力した文字列を含む文の他に、当該入力文字列と
    同じ読みの文字列を含む文で、且つ当該入力文字列と一
    緒に使われる頻度の高い文字列をも含む文を検索するこ
    とを特徴とする文章検索方法。
  4. 【請求項4】 文字列を入力する入力手段と、 文字列と読みを組にして記憶した読み辞書と、 同じ文に同時に使用される頻度が多い文字列の組を記憶
    した共起辞書と、 前記入力手段により入力された文字列と同じ読みの文字
    列を前記読み辞書から検索し、前記入力された文字列を
    含む文、及び前記同じ読みの文字列を含む文を検索する
    検索処理手段と、 この検索処理手段により検索された文のうち、前記同じ
    読みの文字列を含む文については、前記共起辞書を用い
    て、前記入力文字列と一緒に使われる頻度の高い文字列
    が含まれているか否かを調べる共起チェック手段と、 前記検索処理手段で検索した文と、検索に使用された文
    字列と、前記共起チェック手段で調べられた前記入力文
    字列と一緒に使われる頻度の高い文字列とを対応がとれ
    る形で保存する検索結果記憶手段と、 この検索結果記憶手段の記憶内容をもとに検索結果を出
    力する出力手段とを具備することを特徴とする文章検索
    装置。
  5. 【請求項5】 入力した文字列を含む文を検索する文章
    検索方法であって、 前記入力した文字列を含む文の他に、当該入力文字列と
    同じ読みの文字列を含む文で、且つ当該入力文字列と一
    緒に使われることのない文字列を含まない文を検索する
    ことを特徴とする文章検索方法。
  6. 【請求項6】 文字列を入力する入力手段と、 文字列と読みを組にして記憶した読み辞書と、 同じ文に同時に使用されることのない文字列の組を記憶
    した非共起辞書と、 前記入力手段により入力された文字列と同じ読みの文字
    列を前記読み辞書から検索し、前記入力された文字列を
    含む文、及び前記同じ読みの文字列を含む文を検索する
    検索処理手段と、 この検索処理手段により検索された文のうち、前記同じ
    読みの文字列を含む文については、前記非共起辞書を用
    いて、前記入力文字列と一緒に使われることのない文字
    列が含まれているか否かを調べる非共起チェック手段
    と、 前記検索処理手段で検索した文と、検索に使用された文
    字列と、前記非共起チェック手段で調べられた前記入力
    文字列と一緒に使われることのない文字列とを対応がと
    れる形で保存する検索結果記憶手段と、 この検索結果記憶手段の記憶内容をもとに検索結果を出
    力する出力手段とを具備することを特徴とする文章検索
    装置。
  7. 【請求項7】 入力した文字列を含む文を検索する文章
    検索方法であって、 前記入力した文字列を含む文の他に、当該入力文字列と
    同じ読みの文字列を含む文で、且つ当該入力文字列と一
    緒に使われる頻度の高い文字列をも含む文、及び当該入
    力文字列と同じ読みの文字列を含む文で、且つ当該入力
    文字列と一緒に使われることのない文字列を含まない文
    を検索することを特徴とする文章検索方法。
  8. 【請求項8】 文字列を入力する入力手段と、 文字列と読みを組にして記憶した読み辞書と、 同じ文に同時に使用される頻度が多い文字列の組を記憶
    した共起辞書と、 同じ文に同時に使用されることのない文字列の組を記憶
    した非共起辞書と、 前記入力手段により入力された文字列と同じ読みの文字
    列を前記読み辞書から検索し、前記入力された文字列を
    含む文、及び前記同じ読みの文字列を含む文を検索する
    検索処理手段と、 この検索処理手段により検索された文のうち、前記同じ
    読みの文字列を含む文については、前記共起辞書を用い
    て、前記入力文字列と一緒に使われる頻度の高い文字列
    が含まれているか否かを調べる共起チェック手段と、 前記検索処理手段により検索された文のうち、前記同じ
    読みの文字列を含む文については、前記非共起辞書を用
    いて、前記入力文字列と一緒に使われることのない文字
    列が含まれているか否かを調べる非共起チェック手段
    と、 前記検索処理手段で検索した文と、検索に使用された文
    字列と、前記共起チェック手段で調べられた前記入力文
    字列と一緒に使われる頻度の高い文字列と、前記非共起
    チェック手段で調べられた前記入力文字列と一緒に使わ
    れることのない文字列とを対応がとれる形で保存する検
    索結果記憶手段と、 この検索結果記憶手段の記憶内容をもとに検索結果を出
    力する出力手段とを具備することを特徴とする文章検索
    装置。
JP7069164A 1995-03-28 1995-03-28 文章検索方法及び装置 Pending JPH08263472A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7069164A JPH08263472A (ja) 1995-03-28 1995-03-28 文章検索方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7069164A JPH08263472A (ja) 1995-03-28 1995-03-28 文章検索方法及び装置

Publications (1)

Publication Number Publication Date
JPH08263472A true JPH08263472A (ja) 1996-10-11

Family

ID=13394804

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7069164A Pending JPH08263472A (ja) 1995-03-28 1995-03-28 文章検索方法及び装置

Country Status (1)

Country Link
JP (1) JPH08263472A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279227A (zh) * 2015-09-11 2016-01-27 百度在线网络技术(北京)有限公司 同音词的语音搜索处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279227A (zh) * 2015-09-11 2016-01-27 百度在线网络技术(北京)有限公司 同音词的语音搜索处理方法及装置

Similar Documents

Publication Publication Date Title
US5303150A (en) Wild-card word replacement system using a word dictionary
US5890103A (en) Method and apparatus for improved tokenization of natural language text
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
US5907821A (en) Method of computer-based automatic extraction of translation pairs of words from a bilingual text
JP2783558B2 (ja) 要約生成方法および要約生成装置
JPH05314166A (ja) 電子化辞書および辞書検索装置
JPH08263472A (ja) 文章検索方法及び装置
KR100452024B1 (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
JP2621999B2 (ja) 文書処理装置
JP2002073656A (ja) 異表記正規化処理・異表記展開処理方法および該処理方法による文書検索方法、該処理装置および文書検索装置並びにプログラム記録媒体
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JPH0353378A (ja) 同音異字および異字同音の姓を検索する氏名検索方式
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPS6389976A (ja) 言語解析装置
JP2000276479A (ja) 電子辞書装置及び電子辞書プログラムを記録した記録媒体
JPH05290030A (ja) 文書処理装置
JPH0531186B2 (ja)
JP3305343B2 (ja) 辞書編集装置
JPH0816599A (ja) 翻訳支援装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPH1139347A (ja) テキスト検索システム,インデックス作成装置,テキスト検索装置及びコンピュータ読み取り可能な記録媒体
JPH06266765A (ja) 文章検索装置
JPH0414168A (ja) 文書作成装置
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH08180057A (ja) 文書検索方法および装置