JPH02108158A - 文字列検索装置 - Google Patents

文字列検索装置

Info

Publication number
JPH02108158A
JPH02108158A JP63261130A JP26113088A JPH02108158A JP H02108158 A JPH02108158 A JP H02108158A JP 63261130 A JP63261130 A JP 63261130A JP 26113088 A JP26113088 A JP 26113088A JP H02108158 A JPH02108158 A JP H02108158A
Authority
JP
Japan
Prior art keywords
character string
string
search
extension
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63261130A
Other languages
English (en)
Inventor
Naoto Nakamura
直人 中村
Fumito Nishino
文人 西野
Akira Ochitani
亮 落谷
Naomi Sugimoto
尚美 杉本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63261130A priority Critical patent/JPH02108158A/ja
Publication of JPH02108158A publication Critical patent/JPH02108158A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 処理対象となる文書中に記述される所定の文字列を検索
する文字列検索装置に関し、 定型的な変化まで含めた文字列の検索を掻作性よく実行
できるようにすることを目的とし、指定されることにな
る検索対象の文字列に付けられる定型的な変化形の定義
を格納する文字列拡張定義部と、入力された検索対象の
文字列の記述中に、文字列の拡張を指定する記述が含ま
れているか否かを判断する拡張指定判断部と、この拡張
指定判断部が文字列の拡張の指定があると判断するとき
に、この指定内容に従い、文字列拡張定義部の定義を使
って、指定された検索対象の文字列の拡張を実行する文
字列拡張部と、処理対象となる文書中から、この文字列
拡張部により拡張された文字列のいずれかに一致すると
ころの文字列のすべてを検索する文字列検索部とを備え
るよう構成する。
機能を実現するための文字列検索装置を備えていく傾向
にある。これから、この文字列検索装置の利用が図られ
るようにするためにも、利用者にとって捏作し易い装置
構成を案出していく必要があるのである。
〔産業上の利用分野〕
本発明は、処理対象となる文書中に記述される所定の文
字列を照合により検索するよう処理する文字列検索装置
に関し、特に、定型的な変化まで含めた文字列の検索を
操作性よく実行できるようにする文字列検索装置に関す
るものである。
文書の編集機能を実現するデータ処理装置にあっては、
ワードプロセッサを利用した文書の作成・印刷といった
処理で代表されるように、文書の編集能力を高めるため
に、作成された文書を更新していくための様々な機能を
備えていくことになる。このような機能の1つとして、
作成された文書の中から指定された文字列を検索すると
いうものがあり、多くのワードプロセッサ等では、この
〔従来の技術〕 文字列検索装置では、検索対象となる文字列を指定して
いく必要がある。従来の文字列検索装置では、この指定
する数を単数であることを基本に構成していた。しかし
ながら、この構成では、検索対象となる文字列の数が複
数となる場合には、いちいち1つずつ検索していかな(
ではならないという手間が生ずることになる。
そこで、最近の文字列検索装置では、指定できる検索対
象の文字列の数を複数となるよう構成して、この指定さ
れたいずれかに一致するところの文字列のすべてを検索
できるようにするという方式を採るようになってきてい
る。このようにすれば、■、つずつ検索していくという
手間は省けることになる。
〔発明が解決しようとする課題〕
利用者は、語尾変化等の表現の“ゆらぎ”をも含めた形
での文字列に対して検索を実行したいと要求することが
ある。例えば、作成した文書中の「立たない」 「立っ
て」 「立てば」といった文字列中の「立た」 「立つ
」 「立て」といった文字列を、「建だ」 「建つ」 
「建て」に置換したいといった場合のように、自然言語
における定型的な変化形までも含めた形式で文字列の検
索をする必要がでてくることがある。
このような要求に対して、従来の文字列検索装置では、
必要とする変化形の文字列をいちいち1つずつ検索して
いくか、あるいは、−度に複数の文字列の検索指定がで
きる装置であっても、必要とする変化形の文字列をいち
いち1つずつ指定していかなければならなかった。これ
から、従来技術では、文字列の指定に対して手間がかか
るばかりか、指定の誤りを生じやすいという問題点かあ
ったのである。
本発明はかかる事情に鑑みてなされたものであって、定
型的な変化まで含めた文字列の検索を操作性よく実行で
きるようにする文字列検索装置の提供を目的とするもの
である。
(課題を解決するための手段〕 第1図は、本発明の原理構成図である。
図中、10はデータ処理装置であって、本発明に係る文
字列検索装置を実装するもの、11は文字列拡張定義部
であって、指定されることになる検索対象の文字列に付
けられる定型的な変化形の定義を格納するもの、12は
文書入力受付部であって、処理対象となる文書の受付処
理を実行するもの、13は文書記憶部であって、文書入
力受付部12が受は付けた文書を格納するもの、14は
検索文字列入力受付部であって、検索対象の文字列の受
付処理を実行するもの、15は拡張指定判断部であって
、検索文字列入力受付部14が受は付けた検索対象の文
字列の記述中に、文字列の拡張を指定する記述が含まれ
ているか否かを判断するもの、16は文字列拡張部であ
って、拡張指定判断部15が文字列の拡張の指定がある
と判断するときに、この指定内容に従い、文字列拡張定
義部11の定義を使って、指定された検索対象の文字列
の拡張を実行するもの、17は文字列検索部であって、
拡張指定判断部15により文字列の拡張の指定があると
判断されるときには、文書記憶部13に格納されている
文書中から、文字列拡張部16により拡張された文字列
のいずれかに一致するところの文字列のすべてを検索す
るよう処理し、また、拡張指定判断部15により文字列
の拡張の指定がないと判断されるときには、文書記憶部
13に格納されている文書中から、検索文字列入力受付
部14により受は付けられた文字列に一致するところの
文字列のすべてを検索するよう処理するもの、18は検
索結果表示処理部であって、文字列検索部17の検索結
果の表示処理を実行するもの、20は交会入力受付部1
2が受は付けることになる文書、30は検索文字列入力
受付部14が受は付けることなる検索対象の文字列の入
力のためのキーボード、40は検索結果表示処理部18
の表示処理内容を表示するためのデイスプレィである。
〔作用〕
本発明では、文字列拡張定義部11は、例えば日本語の
動詞の語尾の活用形を、活用の種類毎に格納することに
なる。これから、利用者が、キーボード30を介して、
検索したい動詞の文字列とその語尾の活用形の種類名と
を指定すれば、文字列拡張部16は、指定された動詞の
文字列と文字列拡張定義部11に展開されているその活
用形とを組み合わせることで、指定された動詞の活用形
を自動的に生成することになる。そして、文字列検索部
17は、この生成結果に従って、活用形を含む形式へと
拡張された動詞の検索処理に入り、処理対象となる文書
中から、拡張された文字列のいずれかに一致するところ
の文字列のすべてを検索することになる。
このように、本発明によれば、定型的な変化まで含めた
文字列の検索に際して、利用者は、個々の変化部分の指
定を行う必要がなくなり、ただ単に、文字列拡張定義部
11の定義内容を引用するための指定を行うだけで済む
ので、入力の手間が省けるとともに、入力のミスをな(
すことができるようになるのである。
〔実施例〕
以下、実施例に従って本発明の詳細な説明する。
第1図で説明したように、本発明では、文字列拡張定義
部11を設けるよう構成し、この文字列拡張定義部11
に、指定されることになる検索対象の文字列に付は加え
られる定型的な変化形の定義を格納するよう構成するも
のである。
第2図に、日本語の動詞の語尾の活用形を例にとって、
この文字列拡張定義部11の定義内容の実施例構成を示
すことにする。図中の“拡張モード名”は、格納されて
いる活用形の種類を識別するための識別名称部分を表し
、“拡張内容”は、指定された文字列に付は加えられる
ことになる活用形部分(拡張部分)が、記号「[」と記
号「]」とで囲まれた部分の記号rNで区切られた個々
の文字列であるということを表している。
具体的に説明するならば、「/するザ変/」は、指定さ
れた文字列の語尾に、「せ」「シ」「する」「すれ」と
いう4個の文字を付は加えることになるということを表
し、「/っ5段/」は、指定された文字列の語尾に、「
た」 「ち」 「っ」 「っ」「て」 「と」という6
個の文字を付は加えることになるということを表してい
る。これから、検索対象の文字列が「立」で、この「立
」に対して「1つ5段/」の拡張モードを指定するとい
うことは、第3図に示すように、「立だ」 「立ち」「
立っ」 「立つ」 「立て」 「立と」という6個の検
索対象の文字列を指定したことと等価なことになるので
ある。ここで、この図では、「立」に対して「1つ5段
/」の拡張モードを指定するということを、「立1つ5
段/」で表しである。
このように構成される文字列拡張定義部11は、書き換
え不可能なROMを用意して、文字列検索装置を提供す
るメーカーサイドで定義内容を書き込む形式で提供する
という方法を採ることも可能であるが、利用者に対して
一層の便宜を図るために、書き換え可能なメモリを用意
して、利用者自身の自由な定義を展開できるようにする
という方法を採ることも可能である。
次に、第4図のフローチャートに従って、本発明の処理
内容について説明する。
ステップlで、利用者による文書の入力が終了すると、
続くステップ2で、入力された文書に対して、利用者か
ら文字列の検索要求があるか否かを判断する。このステ
ップ2の判断で、文字列の検索要求がないと判断すると
きには、そのまま処理を終了する。一方、文字列の検索
要求があると判断するときには、ステップ3に進み、利
用者から人力されることになる検索対象の検索文字列を
受は付ける処理を行う。そして、次のステップ4で、こ
の入力された検索文字列に、文字列拡張定義部11の“
拡張モード名”を指定する拡張指定子が付いているか否
かを判断する。この拡張指定子が付いているということ
は、その“拡張モード名”が指定する“拡張内容”に従
って、入力された検索文字列の拡張処理を実行すること
を意味している。
これから、ステップ4の判断で、拡張指定子が付いてい
ると判断するときには、ステップ5に進み、その“拡張
モード名”の“拡張内容”の文字列であるところの拡張
文字列の1つを選択し、続くステップ6で、その選択さ
れた拡張文字列をステップ3で入力された検索文字列に
付は加えることで、実際の検索処理の対象となる実行検
索文字列を求める処理を行う。この処理により、上述し
た第3図の例で説明するならば、実行検索文字列の1つ
として、「立た」が求められることになる。
そして、ステップ7で、“拡張内容”のすべての拡張文
字列の選択を終了したか否かを判断して、選択を終了し
ていなければ、ステップ5に戻るよう処理する。このよ
うにして、ステップ5ないしステ、ツブ7の処理を繰り
返すことで、指定のあった′拡張内容”のすべての拡張
文字列についての実行検索文字列が求められることにな
る。すなわち、第3図の例でみるならば、「立た」 「
立ち」「立つ」 「立つ」 「立て」 「立と」が求め
られることになる。
ステップ7の判断により、すべての拡張文字列の選択を
終了したと判断するときには、ステップ8に進み、ステ
ップ1で入力された文書中に含まれる実行検索文字列の
検索処理を行う。この検索処理は、従来技術通り照合処
理に従って実行され、文書中から、求められた複数の実
行検索文字列のいずれかに一致するところの文字列のす
べてを抽出していくことで実行されることになる。一方
、ステップ4の判断により、拡張指定子が付いていない
と判断するときには、ステップ3で入力された検索文字
列が実際の検索処理の対象となるので、ステップ9に進
み、ステップ1で入力された文書中に含まれるこの検索
文字列の検索処理を行うことになる。
ステップ8及びステップ9で検索を終了すると、ステッ
プ10で検索結果の表示処理を行う。この検索結果の表
示は、第5図に示すデイスプレィ画面で例示するように
、検索した文字列にマーカーを付けるとか、反転表示す
るとか、高輝度表示するとかいう方法で実現されること
になる。この表示を終了するとステップ2に戻って、再
び、利用者から文字列の検索要求があるか否かを判断す
ることになる。
文字列拡張定義部11の“拡張モード名”を指定するた
めの拡張指定子の実現方式としては、様々なものが考え
られる。例えば第3図の「立1つ5段/」で示したよう
に、検索文字列に続けて“拡張モード名”を指定すると
いう方式を採るものであってもよいし、あるいは、検索
文字列に先行させて“拡張モード名”を指定するという
方式を採ることも可能である。前者の方式をとるならば
、文字列の拡張処理は、「1つ5段/」を“拡張内容”
の拡張文字列で置き換えていくという処理になることか
ら、第1図で説明した拡張指定判断部1.5は、この置
換処理を実行することになる文字列拡張部16が備える
ことになる。
以上図示実施例について説明したが、本発明はこれに限
定されるものではない。例えば、文字列拡張定義部11
が定義する“拡張内容”は、動詞の語尾の活用形のよう
な一般的な定型的な変化のものに限られるものではなく
、利用者の定義に基づく個別的な定型的な変化のもので
あってもよい。
また、“拡張内容”の拡張方式は、文字列の語尾に付け
るものに限られるものではなく、文字列の先頭に付くよ
うなものであってもよいのである。
〔発明の効果〕 このように、本発明によれば、自然言語における活用等
の変化を含んだ文字列の検索を、いちいち個別に指定せ
ずに、変化の形式を指定するだけで実現できるようにな
ることから、検索処理に際しての利用者の負担が軽くな
って毘作性の向上が図られるようになるとともに、誤っ
た検索文字列の指定も低減できるようになる。
【図面の簡単な説明】
第1図は本発明の原理構成図、 第2図は文字列拡張部定義部の定義内容の実施例構成図
、 第3図は文字列拡張部定義部の定義内容の説明図、 第4図は本発明が実行するフローチャート、第5図は検
索結果の表示の説明図である。 図中、10はデータ処理装置、11は文字列拡張定義部
、12は文書入力受付部、13は文書記憶部、14は検
索文字列入力受付部、15は拡張指定判断部、16は文
字列拡張部、17は文字列検索部、18は検索結果表示
処理部、20は文書、30はキーボード、40はデイス
プレィである。

Claims (1)

  1. 【特許請求の範囲】 処理対象となる文書中に記述される所定の文字列を照合
    により検索するよう処理する文字列検索装置において、 指定されることになる検索対象の文字列に付けられる定
    型的な変化形の定義を格納する文字列拡張定義部(11
    )と、 入力された検索対象の文字列の記述中に、文字列の拡張
    を指定する記述が含まれているか否かを判断する拡張指
    定判断部(15)と、 この拡張指定判断部(15)が文字列の拡張の指定があ
    ると判断するときに、この指定内容に従い、上記文字列
    拡張定義部(11)の定義を使って、指定された検索対
    象の文字列の拡張を実行する文字列拡張部(16)と、 処理対象となる文書中から、この文字列拡張部(16)
    により拡張された文字列のいずれかに一致するところの
    文字列のすべてを検索する文字列検索部(17)とを備
    えてなることを、 特徴とする文字列検索装置。
JP63261130A 1988-10-17 1988-10-17 文字列検索装置 Pending JPH02108158A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63261130A JPH02108158A (ja) 1988-10-17 1988-10-17 文字列検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63261130A JPH02108158A (ja) 1988-10-17 1988-10-17 文字列検索装置

Publications (1)

Publication Number Publication Date
JPH02108158A true JPH02108158A (ja) 1990-04-20

Family

ID=17357512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63261130A Pending JPH02108158A (ja) 1988-10-17 1988-10-17 文字列検索装置

Country Status (1)

Country Link
JP (1) JPH02108158A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004501424A (ja) * 2000-04-18 2004-01-15 コリア・テレコム 中心用語辞典を利用した表題語の中心用語抽出方法及びそれを利用した情報検索システム及びその方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004501424A (ja) * 2000-04-18 2004-01-15 コリア・テレコム 中心用語辞典を利用した表題語の中心用語抽出方法及びそれを利用した情報検索システム及びその方法

Similar Documents

Publication Publication Date Title
JPH09114852A (ja) 情報検索装置
JPH04281566A (ja) 文書検索装置
JPH02108158A (ja) 文字列検索装置
JPH08287088A (ja) 情報検索方法及びその装置
JPH07219587A (ja) 音声処理装置および方法
JP2785692B2 (ja) 辞書検索表示装置
JP2000029901A (ja) 画像検索装置及び方法
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JPH05181912A (ja) 文書検索装置
JP3537260B2 (ja) リンク付文書検索表示システム
JPH076175A (ja) 機械翻訳装置
JPH04281558A (ja) 文書検索方法および装置
JP2815911B2 (ja) 電子辞書
JPH0546662A (ja) 情報検索装置
JP3148838B2 (ja) 機械翻訳装置
JPS62203226A (ja) 文書処理装置
JPH08153112A (ja) 文書作成装置及び文書作成方法
JPH08235191A (ja) 文書検索方法及び文書検索装置
JPH1091493A (ja) データベースの構築方法
JPH07121540A (ja) 文書作成装置及び対訳制御方法
JPH09251461A (ja) 翻訳支援装置
JPH0351958A (ja) 電子辞書
JPH06131328A (ja) 文書処理方法及び装置
JPS62203228A (ja) 文書処理装置
JP2007034962A (ja) 電子辞書および電子辞書の検索方法、電子辞書の検索プログラム