JPH01307865A - 文字列検索方式 - Google Patents

文字列検索方式

Info

Publication number
JPH01307865A
JPH01307865A JP63139874A JP13987488A JPH01307865A JP H01307865 A JPH01307865 A JP H01307865A JP 63139874 A JP63139874 A JP 63139874A JP 13987488 A JP13987488 A JP 13987488A JP H01307865 A JPH01307865 A JP H01307865A
Authority
JP
Japan
Prior art keywords
character string
special symbol
conjugation
search
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63139874A
Other languages
English (en)
Inventor
Shunichi Fukushima
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63139874A priority Critical patent/JPH01307865A/ja
Publication of JPH01307865A publication Critical patent/JPH01307865A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、予め入力された第1の文字列を対象として、
検索するために入力された第2の文字列に関する検索を
行う文字列検索方式に関するものである。
(従来の技術) 従来、第1の文字列を対象として、第2の文字列に関す
る検索を行う文字列検索方式は、ワードプロセッサにお
ける検索機能として普及している。
この場合、第1の文字列は、ワードプロセッサで作成し
た文章であり、第2の文字列は、通常、検索機能を指定
したときに、ワードプロセッサの利用者によって人力さ
れる。
以下に、NEC日本語ワードプロセッサNWP−ION
“文豪″の検索機能を例に挙げる。
ワードプロセッサで作成した文章が画面に表示されてい
る状態で、[文字サーチ]キーを押すと、画面に、次の
ように表示される(閣は、カーソルを表す)。
(文字列サーチ)[閣        ]ここで、[]
のところに、捜そうとしている文字列を入力する。例え
ば、「言う]という文字列を捜そうとするときには、次
のように入力する。
(文字列サーチ)[言う閣      ]捜そうとする
文字列(被検索文字列)を人力したところで、[実行]
キーを押すと、「文字サーチ」キーを押す前にカーソル
があった位置から後方で、文章中に最初に現れる被検索
文字列が検索され、見つかったならば、その位置が反転
表示される。この時点で、「タブ」キーを押すと、その
位置より後方の文章について、さらに検索が継続される
。「タブ」キーでなく、「実行」キーを押すと、検索は
終了する。
ワードプロセッサにおける検索機能は、主に、作成0編
集、参照など何等かの処理を行おうとする部分を捜し、
位置付けるために用いられる。そのため、被検索文字列
としては、意味のない文字もしくは文字列でなく、通常
、単語が採られる。
単語には、活用しないもの(名詞など)だけでなく、活
用するもの(動詞・形容詞・形容動詞など用言)もある
。上述のような検索機能では、単純に文字列の照合しか
行わないため、用言を検索する場合には、用言の全活用
形を想定し、それらについて繰り返し検索を行うことに
なる。例えば、文章中から[言う1という動詞を検索す
る場合には、次のような文字列を被検索文字列として、
6回の検索を繰り返す。
[言わ] (未然形A=「ない」などに続く形)[言お
] (未然形B=「う・よう」に続く形)「言い1 (
連用形A=連用中止形) [言っ] (連用形B=「な]などに続く形)[言う]
 (終止形、連体形) 「言え] (仮定形、命令形) このとき、「言う]の語幹の[言]を被検索文字列とす
る方法もあるが、この場合には、[亘葉]「1語」 「
発旦]など、[言]を含む不要な語が多く検索されてし
まう。
これに対して、特開昭61−208563号公報「文章
編集装置」、特開昭62−282364号公報「文字列
検索方式]、特開昭63−36367号公報[文章検索
装置]などでは、単語辞書を用いた被検索文字列の解析
により、用言の全活用形を生成して検索するようにして
いる。すなわち、まず被検索文字列を単語辞書と照合す
ることにより、被検索文字列が用言であるか否かを判定
し、用言である場合には、単語辞書より語幹・語尾の区
別(上記の例では、[言]が語幹で、「う」が語尾)や
活用型(「言う」の活用型は「ワ行五段活用])を得る
。活用型ごとに活用語尾のパターンは決まっているので
、次に、用言の全活用形(「言わ」 「言お」・・・・
・・「言え」)規則により生成して、文章から検索する
(発明が解決しようとする課題) 従来のワードプロセッサの検索機能では、用言を検索す
る場合、活用形ごとに検索を繰り返す必要があり、操作
が極めて煩わしい。
単語辞書を用いて被検索文字列を解析する方法では、活
用形ごとの検索を繰り返す不都合は回避されるが、単語
辞書に登録されていない用言に対処できない。また、単
語辞書は一般に作成に多大な工数を要する上に、装置に
おいて大きな容量を占める。
本発明の目的は、簡単な操作で、活用した用言の検索も
行える文字列検索方式を提供することである。
(課題を解決するための手段) 本発明は予め入力された第1の文字列を記憶する第1の
文字列記憶手段と、検索するための文字列である第2の
文字列を入力する第2の文字列入力手段と、前記第2の
文字列が予め定められた特殊記号を含むか否かを判定す
る特殊記号判定手段と、前記第2の文字列について特殊
記号より後方の文字列を終止形活用語尾とみなして活用
形ごとの文字列を生成する活用展開手段と、前記特殊記
号判定手段によって第2の文字列が特殊記号を含むと判
定された場合には、前記活用展開手段によって生成され
る文字列を前記第1の文字列から検索する文字列照合手
段とを備えたことを特徴とする文字列検索方式である。
(作用) 本発明の詳細な説明する。
第2図は動詞の活用語尾を表わす図、第3図は形容詞・
形容動詞の活用語尾を表わす図である。第2図では活用
の型の一部を省略しているが、第2図と第3図の用言(
動詞・形容詞・形容動詞)の終止形の活用語尾には、同
一のものがない。本発明は、この点に着目したものであ
る。
用言の終止形活用語尾は、複数の活用の型の間で同一の
ものはないので、終止形活用語尾から活用の型は一意に
決定できる。例えば、終止形活用語尾が「<」ならば活
用の型は動詞のカ行五段活用語尾が[りる]ならば動詞
の上一段活用であり、終止形活用語尾が「い」ならば形
容詞活用である。
そして、活用の型がわかれば、その用言のすべての活用
形の文字列は、規則により自動的に生成できる。
そこで、語幹部分と語尾部分とを区切る特殊記号を、予
め定めておき、活用形を展開した文字列検索を行う場合
には、第2の文字列として、語幹部分と語尾部分との境
界にその特殊記号を挾んだ、終止形を与えるように取り
決めておく。そして、第2の文字列が、その特殊記号を
含むがたちで与えられたときには、その特殊記号より後
方の文字列を、終止形活用語尾とみなして、すべての活
用形を展開して検索を行う。
用言の基本形は終止形であり(国語辞典には終止形が登
録されている)、人間が単独の用言を思い浮かべるとき
の自然なかたちであるがら、第2の文字列を終止形で与
えるという取り決めは、はとんど制約にならない。また
、語幹部分と語尾部分に分けるという考え方も、国語教
育で十分浸透しており、あまり負担にはならないと考え
られる。
(実施例) 図面を用いて、本発明の詳細な説明する。
第1図は本発明の文字列検索方式の一実施例の構成を示
すブロック図である。
第1図において、特殊記号判定手段4と活用展開手段5
とを除いた構成、すなわち、第1の文字列記憶手段1、
第2の文字列入力手段2、被検索文字列記憶手段3、文
字列照合手段6、表示手段7、制御手段8から成る構成
が、従来のワードプロセッサの文字列検索方式の構成に
相当する。
まず、第1図における、従来の文字列検索方式と共通の
構成要素を説明する。
第1の文字列記憶手段1は、第1の文字列を記憶する手
段である。ICメモリ、磁気ディスク装置などが用いら
れる。第1の文字列には、ワードプロセッサで作成され
た文章などが該当する。
第2の文字列入力手段2は、第2の文字列を入力する手
段である。キーボードを備えたがな漢字変換装置などが
用いられる。第2の文字列入力手段2は、入力された第
2の文字列を、被検索文字列記憶手段3に書き込む。
被検索文字列記憶手段3は、被検索文字列を記憶する手
段である。ICメモリ、磁気ディスク装置などが用いら
れる。
文字列照合手段6は、第1の文字列記憶手段1に記憶さ
れた第1の文字列と、被検索文字列記憶手段3に記憶さ
れた被検索文字列とを照合して、第1の文字列における
被検索文字列と一致する文字列の位置を検出する手段で
ある。この文字列照合手段6は、従来からよく知られた
手段であり、例えば、r文字列のパターンマツチ法1(
花田、情報処理、第24巻、第4号、第494頁〜第4
98頁、1983年4月)に記載されている方法や、r
文字列検索LSIj(山田・平田・水弁・高橋、電子情
報通信学会技術研究報告CAS87−25.1987年
5月29日)に記載されているLSIなどが用いられる
表示手段7は、第1の文字列を表示するとともに、文字
列照合手段6によって検出された被検索文字列の出現し
た位置を、他の部分と識別可能な形態で示す手段である
。CRTデイスプレィ、液晶デイスプレィ、プリンタな
どが用いられる。他の部分と識別可能な形態としては、
例えば、反転表示、色を変えた表示、アンダーラインを
付加した表示、括弧で囲んだ表示などが考えられる。
制御手段8は、他の構成要素の動作を制御する手段であ
る。コンピュータのCPUなどが用いられる。
以上の構成から成る従来のワードプロセッサの文字列検
索方式では、第2の文字列入力手段2から入力された第
2の文字列がそのまま被検索文字列となる。したがって
、例えば、次のような例文1が第1の文字列として第1
の文字列記憶手段1に記憶されていて、[言う]という
第2の文字列が人力されたときには、25文字目の「言
う]のみが検出され、15文字目の「言っ」は検出され
ない。
[モノポールは存在すると、彼は言った。
しかし、彼の言うことを、否定する学者も多い。J  
、、、、、、、、、、、、、、、、、、、、、、  例
文1次に、本発明にて加えられた特殊記号判定手段4と
活用展開手段5とを説明する。
特殊記号判定手段4は、被検索文字列記憶手段3に書き
込まれた第2の文字列が、予め定められた特殊記号を含
むか否かを判定する手段である。以下、その特殊記号と
して川]を定めて説明する。
第5図は、特殊記号判定手段4の処理内容の例を示すフ
ローチャートである。第2の文字列に特殊記号「1]が
含まれていた場合には、判定結果とじてr YES J
を出力し、そうでない場合には、判定結果としてrNO
Jを出力する。なお、判定結果は、制御手段8へ出力す
る。
活用展開手段5は、被検索文字列記憶手段3中の特殊記
号より後方の文字列を、用言の終止形活用語尾とみなし
て、活用形ごとの文字列を生成する手段である。活用展
開手段5は、例えば、第4図のような活用展開テーブル
50を検索することにより実現できる。第4図の活用展
開テーブル50の各レコードは、活用の型ごとに設け、
見出し500と展開形501とから成る。見出し500
には、終止形活用語尾が登録され、展開形501には、
その活用の型に対するすべての活用語尾がlで区切って
登録されている(展開形501では形の重複するものは
削っである)。活用展開手段5は、第2の文字列の特殊
文字より後方の文字列を、活用展開テーブル50の見出
し500と照合し、見出し500の一致したレコードの
展開形501を取り出す。そして、第2の文字列におけ
る特殊記号とその後方の文字列を、取り出された展開形
の各々の文字列に書き換えたものを生成する。そして、
活用展開手段5は、生成した文字列を、被検索文字列と
して、被検索文字列記憶手段3に書き込む。
第6図は、本実施例の動作を示すフローチャートである
。第1図における制御手段8は、特殊記号判定手段4と
活用展開手段5を加えた場合、第6図のフローチャート
のように、構成要素の動作を制御する。特殊記号判定手
段4の判定結果は、制御手段8へ送られ、その判定結果
がrYEsJであった場合に、活用展開手段5による展
開処理を実行させる。
本実施例では、例えば、第2の文字列入力手段2から「
言1う」のように、特殊記号を含む文字列が入力された
場合、特殊記号判定手段4によって、第2の文字列が特
殊記号rlJを含むと判定される。その結果、活用展開
手段5が、特殊記号「1」より後方の文字列「う」を活
用展開テーブル50がら得られる「わ」 「いj 「う
」 「え」 「お」 「っ」に置き換えて、次のような
文字列を、被検索文字列として被検索文字列記憶手段3
に書き直す。
「言わ] 「言い] 「言う] 「言え」 「言お」[
言っJ そして、文字列照合手段6が、これらの被検索文字列と
第1の文字列とを照合し、被検索文字列の出現した位置
が表示手段7によって表示される。前に示した例文1で
は、25文字目の[言うJだけでなく、15文字目の「
言っ]も検出されることになる。
ただし、本実施例では、第2の文字列中に特殊記号が含
まれないときには、従来のワードプロセッサの文字列検
索方式と同様の検索を行う。すなわち、第2の文字列と
して「言う」(特殊記号は含まない)が入力された場合
には、例文1では、25文字目の「言う」のみが検出さ
れて、15文字目野[言っ]は検出されない。
また、本発明の文字列検索方式は、第2の文字列をキー
ボードなどから入力されたものには限定しない。予め辞
書・テーブルなどに登録された文字列を、第2の文字列
として検索する場合にも、同様に適用できる。
なお、被検索文字列記憶手段3中の複数の被検索文字列
と、第1の文字列との照合方法は、文字列照合手段6の
実現方法によって、様々なバリエーションがある。被検
索文字列のひとつひとつについて、順次、第1の文字列
との照合を行う方法もあるし、複数の被検索文字列に共
通な文字列(用言の語幹部分の文字列)と第1の文字列
の一致する箇所を見つけてから、被検索文字列ごとに異
なる部分(語尾部分)を照合する方法もある。前述の文
献に記載された文字列検索LSIを用いて場合には、複
数の被検索文字列と第1の文字列との照合は、完全に並
列に行える。
さらに、本発明では、動詞・形容詞・形容動詞の活用展
開を想定しているが、助動詞の活用のなかには動詞型・
形容詞型・形容動詞型の活用を行うものもあり、それら
については、特別に方式を変更したり、辞書・テーブル
などを拡張しなくとも、本発明の方式を適用できる。例
えば、「本当らしい]における[らしい]は助動詞であ
るが、第2の文字列を「本当らし1い]とすれば、形容
詞と同等の活用展開が行われ、[本当らしく思えた]に
おける「本当らしく]や、「本当らしかった」における
[本当らしかつ]などの助動詞の活用形も検索できる。
(発明の効果) 以上説明したように、本発明によれば、語幹部分と語尾
部分の間に特殊記号を挾むという簡単な操作だけで、用
言について自動的に活用形を展開した検索が可能となる
。従来のワードプロセッサの検索方式では、用言の活用
形の数だけ検索を繰り返さねばならなかったのに比べて
、格段に操作性が向上する。また、単語辞書を用いた解
析を行う必要もないので、装置も簡単な構成で済み、そ
の上、単語辞書にない単語に対処できないというような
不都合も生じない。
また、単語辞書を用いて被検索文字列を解析する方法で
は、用言語幹と共通部分をもつ名詞(例えば、[繰り返
し] 「読み」)などが、誤って用言と判定されて、活
用形展開されて検索されてしまう可能性がある(それを
防ぐためには、検索実行指示キーを「通常検索」と[展
開検索]のように2通りに分けるなどの処置が必要で、
ある)。しかし、本発明では、利用者が第2の文字列に
特殊記号を入れるか入れないかで、意図的に区別するこ
とができる。
【図面の簡単な説明】
第1図は本発明の実施例の構成を示すブロック図、第2
図は動詞の活用語尾衣、第3図は形容詞・形容動詞の活
用語尾衣、第4図は活用展開テーブルの内容の例を表わ
す図、第5図は特殊記号判定手段4の処理内容の例を示
すフローチャト、第6図は実施例の動作を示すフローチ
ャートである。 図において、 1・・・・・第1の文字列記憶手段 2・・・・・第2の文字列入力手段 3・・・・・被検索文字列記憶手段 4・・・・・特殊記号判定手段 5・・・・・活用展開手段 6・・・・・文字列照合手段 7・・・・・表示手段 8・・・・・制御手段 である。

Claims (1)

    【特許請求の範囲】
  1. 予め入力された第1の文字列を記憶する第1の文字列記
    憶手段と、検索するための文字列である第2の文字列を
    入力する第2の文字列入力手段と、前記第2の文字列が
    予め定められた特殊記号を含むか否かを判定する特殊記
    号判定手段と、前記第2の文字列について特殊記号より
    後方の文字列を終止形活用語尾とみなして活用形ごとの
    文字列を生成する活用展開手段と、前記特殊記号判定手
    段によって第2の文字列が特殊記号を含むと判定された
    場合には、前記活用展開手段によって生成される文字列
    を前記第1の文字列から検索する文字列照合手段とを備
    えたことを特徴とする文字列検索方式。
JP63139874A 1988-06-06 1988-06-06 文字列検索方式 Pending JPH01307865A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63139874A JPH01307865A (ja) 1988-06-06 1988-06-06 文字列検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63139874A JPH01307865A (ja) 1988-06-06 1988-06-06 文字列検索方式

Publications (1)

Publication Number Publication Date
JPH01307865A true JPH01307865A (ja) 1989-12-12

Family

ID=15255575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63139874A Pending JPH01307865A (ja) 1988-06-06 1988-06-06 文字列検索方式

Country Status (1)

Country Link
JP (1) JPH01307865A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06290181A (ja) * 1993-04-05 1994-10-18 Nec Corp 派生語検索処理装置
JP2004501424A (ja) * 2000-04-18 2004-01-15 コリア・テレコム 中心用語辞典を利用した表題語の中心用語抽出方法及びそれを利用した情報検索システム及びその方法
JP2005242920A (ja) * 2004-02-27 2005-09-08 Kyocera Corp 携帯端末及びデータ表示方法
JP2011076456A (ja) * 2009-09-30 2011-04-14 Casio Computer Co Ltd 辞書機能を備えた電子機器およびプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06290181A (ja) * 1993-04-05 1994-10-18 Nec Corp 派生語検索処理装置
JP2004501424A (ja) * 2000-04-18 2004-01-15 コリア・テレコム 中心用語辞典を利用した表題語の中心用語抽出方法及びそれを利用した情報検索システム及びその方法
JP2005242920A (ja) * 2004-02-27 2005-09-08 Kyocera Corp 携帯端末及びデータ表示方法
JP4637490B2 (ja) * 2004-02-27 2011-02-23 京セラ株式会社 携帯端末及びデータ表示方法
JP2011076456A (ja) * 2009-09-30 2011-04-14 Casio Computer Co Ltd 辞書機能を備えた電子機器およびプログラム
CN102033907A (zh) * 2009-09-30 2011-04-27 卡西欧计算机株式会社 具备词典功能的电子设备
US8489389B2 (en) 2009-09-30 2013-07-16 Casio Computer Co., Ltd Electronic apparatus with dictionary function and computer-readable medium

Similar Documents

Publication Publication Date Title
JP2783558B2 (ja) 要約生成方法および要約生成装置
EP0118187B1 (en) Menu-based natural language understanding system
JPH01307865A (ja) 文字列検索方式
KR100452024B1 (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
JP2621999B2 (ja) 文書処理装置
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS62282364A (ja) 文字列検索方式
JPH01214963A (ja) 辞書引き装置
JPH07191986A (ja) 文章入力装置
JP2815911B2 (ja) 電子辞書
JP3086464B2 (ja) かな漢字変換装置
JPH04174069A (ja) 言語理解支援装置
JP2682048B2 (ja) 文章処理装置
JP2000276479A (ja) 電子辞書装置及び電子辞書プログラムを記録した記録媒体
JPH11184854A (ja) 電子辞書
JP2819766B2 (ja) 外国語電子辞書検索方式
JPH0668160A (ja) 情報検索方式
Sparrman A technique for command language syntax analysis
JPS63136264A (ja) 機械翻訳装置
JPH1139347A (ja) テキスト検索システム,インデックス作成装置,テキスト検索装置及びコンピュータ読み取り可能な記録媒体
JPH0239264A (ja) 文章処理装置
JPH0567146A (ja) データ編集装置
JPH0240767A (ja) 文章処理装置
JPS61169961A (ja) ユ−ザ辞書を備えた文字処理装置
JP2004206556A (ja) 情報表示制御装置及びプログラム