JPS62282364A - Character string retrieval system - Google Patents

Character string retrieval system

Info

Publication number
JPS62282364A
JPS62282364A JP61126584A JP12658486A JPS62282364A JP S62282364 A JPS62282364 A JP S62282364A JP 61126584 A JP61126584 A JP 61126584A JP 12658486 A JP12658486 A JP 12658486A JP S62282364 A JPS62282364 A JP S62282364A
Authority
JP
Japan
Prior art keywords
character string
search
conjugation
storage means
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61126584A
Other languages
Japanese (ja)
Inventor
Shunichi Fukushima
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61126584A priority Critical patent/JPS62282364A/en
Publication of JPS62282364A publication Critical patent/JPS62282364A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To attain the retrieval a declinable word with a simple operation by generating all declensions of the declinable word automatically and retrieving them. CONSTITUTION:A character string input means 1 inputs a character string to be retrieved and a retrieval kind designation means 2 designates the retrieval of declinable word expansion. A declinable word recognition means 7 uses a declinable word stem storage means 5 and a declinable word ending storage means 6 to recognize the stem and endings of the declinable word given as the character string to be retrieved. A declension expanding means 8 reads all declension endings from the means 6 and adds the endings to the stem to generate all the declensions, which are written in a retrieval character storage means 9. A character string storage means 10 reads the character string from the retrieval character string storage means 9 to retrieve a sentence stored in a sentence storage means 4 and to find out the character position in the character string to be retrieved, and an edition control means 11 revises the character string to be retrieved displayed on a display means into the display method different from that of other character strings by means of a method such as inverted display.

Description

【発明の詳細な説明】 3、発明の詳細な説明 (産業上の利用分野) 本発明は、日本語ワードプロセッサなどにおいて、第1
の文字列を対象として第2の文字列て関する検索を行う
文字列検索方式に関するものである0 (従来の技術) 従来、第1の文字列を対象として第2の文字列に関する
検索を行う文字列検索方式は、ワードプロセッサにおけ
る検索機能として普及している。
[Detailed Description of the Invention] 3. Detailed Description of the Invention (Field of Industrial Application) The present invention is the first in a Japanese word processor, etc.
This relates to a character string search method in which a second character string is searched for a first character string. The column search method is popular as a search function in word processors.

この場合、第1の文字列は、ワードプロセッサで作成し
た文章であり、第2の文字列は、通常、検索機能を指定
したとき、ワードプロセッサの利用者によ多入力される
In this case, the first character string is a sentence created with a word processor, and the second character string is usually input frequently by the user of the word processor when the search function is specified.

以下、NEC日本語ワードプロセッサNWP−1ON’
文豪1の検索機能を例に挙げて説明する。
Below, NEC Japanese word processor NWP-1ON'
The search function of Bungo 1 will be explained as an example.

ワードプロセッサで作成した文章が画面に表示されてい
る状態で、「文字サーチ」キーを押すと、次のように画
面に表示される(■はカーソルを表す)。
If you press the ``Character Search'' key while a sentence created with a word processor is displayed on the screen, the following will be displayed on the screen (■ represents a cursor).

(文字列サーチ)〔■       〕ここで、〔〕の
ところに、捜そうとしている文字列を入力する。例えば
、「言う」という文字列を捜そうとするときには、次の
ように入力する。
(Character string search) [■] Here, enter the character string you are looking for in [ ]. For example, to search for the character string ``say'', enter the following:

(文字列サーチ)〔言う■     〕この捜そうとす
る文字列(被検索文字列)を入力したところで、「実行
」キーを押すと、「文字サーチ」キーを押す前にカーソ
ルがあった位置から後方で、文章中に最初に現れる被検
索文字列が検索され、見つかったならば、その位置が反
転表示される。この時点で、「タグ」キーを押すと、そ
の位置よシ後方の文章について、さらに検索が継続され
る。「タグ」キーでなく、「実行」キーを押すと検索は
終了する。
(Character string search) [Say ■] When you press the "Execute" key after entering this character string to search for (searched character string), the text will be searched from the position where the cursor was before pressing the "Character search" key. At the back, the first character string to be searched that appears in the sentence is searched for, and if it is found, its position is highlighted. At this point, pressing the "Tag" key will continue the search for more sentences after that position. The search ends when you press the "Execute" key instead of the "Tag" key.

(発明が解決しようとする問題点) このワードプロセップにおける検索機能は、主に、作成
・編集・参照など何等かの処理を行おうとする部分を捜
し、位置付けるために用いられる。
(Problems to be Solved by the Invention) The search function in this word processor is mainly used to search for and locate a portion to be processed in some way, such as creation, editing, or reference.

そのため、被検索文字列としては、意味のない文字もし
くは文字列でなく、通常、単語が採られる。
Therefore, the searched character string is usually a word rather than a meaningless character or character string.

しかしながら、前述のような従来の検索機能では、単純
に文字列の照合しか行わず、単語としての照合は行われ
ていない。従って、検索文字列として名詞など活用のな
い単語を採る場合は、単純な文字列の照合でも成功する
ことが多いが、活用のある用言を1文章中から検索しよ
うとする場合には、用言の全活用形を想定し、それらに
ついて繰)返し検索を行わざるを得ない。
However, conventional search functions such as those described above simply match character strings and do not match words. Therefore, when using a word without a conjugation such as a noun as a search string, simple character string matching is often successful, but when trying to search for a conjugated word in a single sentence, It is necessary to repeatedly search for all possible conjugations of the word.

例えば、文章中から「言う」という動詞を検索しようと
した場合、次のような文字列を被検索文字列として、6
回の検索を繰シ返さなければならない◇ 「言わ」(未然形i=7ないjなどに続く形)「言お」
(未然形B=「う・よう」に続く形)「言い」(連用形
A=連用中止形) 「言っ」(連用形B=「た」などに続く形)「言う」(
終止形、連体形) 「言え」(仮定形、命令形) このとき「言う」の語幹の「言」を被検索文字列とする
方法もあるが、この場合には、「言葉」「言語」 「発
言」など、「言」を含む不要な語がさらに多く検索され
てしまう。
For example, if you are trying to search for the verb "say" in a sentence, use the following character string as the searched character string.
You have to repeat the search ◇ “Koto” (form following i = 7 no j, etc.) “Koto”
(Unnatural form B = the form that follows ``u・yo'') ``I say'' (conjugated form A = the form that follows ``ta'', etc.) ``say'' (conjugated form B = the form that follows ``ta'', etc.)
Final form, adjunctive form) ``Ie'' (hypothetical form, imperative form) In this case, there is a method of using ``word'', the root word of ``say'', as the search string, but in this case, ``word'', ``language'', etc. Many more unnecessary words including ``words'' such as ``utterance'' are searched.

一方、大規模な単語辞書を用いて、検索の対象となる文
章を解析し、文章中の全単語の認定を行うことは、技術
的に可能である(長屋、辻井、山上、建部:「国語辞書
の記憶と日本語文の自動分割」、雑誌「情報処理」第1
9巻第6号、 1978)。
On the other hand, it is technically possible to use a large-scale word dictionary to analyze a sentence to be searched and to recognize all the words in the sentence (Nagaya, Tsujii, Yamagami, Takebe: ``Japanese language "Dictionary Memory and Automatic Segmentation of Japanese Sentences", Magazine "Information Processing" No. 1
9, No. 6, 1978).

従って、まずこのような解析を行った後、その解析結果
にもとづいて単語を検索するならば、正確に単語を検索
できるであろうことが期待される。
Therefore, it is expected that if such an analysis is performed first and then a word is searched based on the analysis result, the word can be searched accurately.

しかしながら、この解析に用いる単語辞書は、一般に3
万語から30万語という大きなものであり、単語辞書と
文章の照合や品詞間の文法的な接続検定など、処理量も
膨大なものになるという欠点がある。
However, the word dictionary used for this analysis is generally 3
The drawback is that it is a large project, ranging from 10,000 to 300,000 words, and requires a huge amount of processing, such as checking sentences against word dictionaries and testing grammatical connections between parts of speech.

本発明の目的は、このような欠点を除き、活用のある用
言についても簡単な操作で検索を可能とした文字列検索
方式を提供することにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide a character string search method that eliminates these drawbacks and allows searches even for conjugated terms with simple operations.

(問題点を解決するための手段) 本発明の文字列検索方式の購成は、あらかじめ入力され
た第1の文字列を対象として、検索するために入力され
た第2の文字列に関して複数の検索種別のうちの1つを
指定する検索指定手段と、用言の語幹とこの用言の活用
の種類とを記憶する用言語幹記憶手段と、前記用言の活
用語尾を前記活用の稲類と対応付けて記憶する活用語尾
記憶手段と、これら用言語幹記憶手段と活用語尾記憶手
段とを参照し前記第2の文字列中の用言とこの用言の活
用形とを認定する用言等定手段と、この用言認定手段に
よって認定された用言の全活用形を前記活用語尾記憶手
段を参照して生成する活用展開手段とを備え、前記検索
指定手段の指定による1つの検索に対して、前記活用展
開手段によって生成された前記用言の全活用形を前記第
1の文字列から検索することを特徴とする。
(Means for Solving the Problems) The character string search method of the present invention targets a first character string input in advance, and searches for a plurality of characters related to a second character string input for searching. a search specifying means for specifying one of the search types; a word stem storage means for storing the word stem of a word and the type of conjugation of the word; a conjugated ending storage means that stores the term in association with the conjugated ending, and a term that identifies the term in the second character string and the conjugated form of the term by referring to the language stem memory unit and the conjugated ending storage unit; equating means, and conjugation expansion means for generating all conjugated forms of the predicate recognized by the term recognition means with reference to the conjugation ending storage means, in one search specified by the search designation means. On the other hand, it is characterized in that all inflections of the predicate generated by the inflection expansion means are searched from the first character string.

(実施例) 次に、図面を用いて本発明の詳細な説明する。(Example) Next, the present invention will be explained in detail using the drawings.

第1図は本発明の文字列検索方式を用いたワードプロセ
ッサの一実施例の構成を示すブロック図である。図にお
いて1文字列入力手段lは、日本語文章の文字列を入力
するものであシ、キーボード、仮名漢字変換入力装置、
音声認識装置9文字認識装置などを用いることができる
。この文字列入力手段1は、挿入・削除・移動・複写な
どの編集の指令も入力し、さらに被検索文字列(第2の
文字列)も入力する。
FIG. 1 is a block diagram showing the configuration of an embodiment of a word processor using the character string search method of the present invention. In the figure, 1 character string input means 1 is for inputting a character string of a Japanese sentence, a keyboard, a kana-kanji conversion input device,
A voice recognition device, a character recognition device, etc. can be used. This character string input means 1 also inputs editing commands such as insertion, deletion, movement, and copying, and also inputs a searched character string (second character string).

検索種別指定手段2ri、複数の検索の種別を指定する
ものであり、検索の種別に対応する複数のキー、あるい
はダイヤルを設けるなどによって、実現できる。検索の
種別としては、例えば、従来の文字列として一致する箇
所を検索する「−散文字列検索」、用言に対して全活用
形を検索する「用言展開検索」などを設けることができ
る。表示手段3ri、文章の文字列、カーンル、ワード
プロセッサから利用者へのガイドもメ雫セージなどを表
示するもので、CRTディスプレイなどを用いる。
The search type designating means 2ri specifies a plurality of search types, and can be realized by providing a plurality of keys or dials corresponding to the search types. Search types include, for example, ``-scattered string search,'' which searches for matching parts as conventional character strings, and ``word expansion search,'' which searches for all conjugations of a predicate. . The display means 3ri is for displaying text strings, text messages, message messages, etc. from the word processor to the user, and uses a CRT display or the like.

文章記憶手段4は、文字列入力手段lによって入力され
、編集された文章の文字列を記憶するものであり、IC
メモリ、磁気ディスク装置などを用いることができる。
The text storage means 4 stores the character string of the text inputted and edited by the character string input means 1, and the IC
A memory, a magnetic disk device, etc. can be used.

この文章記憶手段4に記憶された文字列が、本発明の文
字列検索方式の検索の対象(第1の文字列)となる。
The character string stored in the text storage means 4 becomes the search target (first character string) of the character string search method of the present invention.

用言語幹記憶手段5は、用言の語幹とその用言の活用の
種類とを記憶するものであ夛、ICメモリ、磁気ディス
ク装置などを用いることができる。
The word stem storage means 5 is for storing the word stem of a word and the type of conjugation of the word, and may be a device such as an IC memory, a magnetic disk device, or the like.

第1表は用言語幹記憶手段5の内容の一例を示す。Table 1 shows an example of the contents of the language stem storage means 5.

第  1  表 この表において、用言語幹記憶手段5は、用言の語幹5
0とこの語幹50に対応する活用の種類51とを記憶し
たもので、用言の語幹50ri、用言の語幹(例えば「
兼」)の表記の文字コードの形態で記憶させておけばよ
く、活用の種類51ri、その種類(例えば「す賃下一
段活用」)に対応するコードを決めて、そのコードを記
憶させておけばよい。
Table 1 In this table, the word stem storage means 5 stores the word stem 5 of the word.
0 and the type of conjugation 51 corresponding to this stem 50 are memorized.
It is sufficient to memorize it in the form of a character code written as "Kane"), and then decide on the type of conjugation 51ri, the code corresponding to that type (for example, ``Suyu Shita Ichidan Utilization''), and memorize that code. Bye.

活用語尾記憶手段6は、用言の活用語尾を前記活用の種
類と対応付けで記憶するものであシ、ICメモリ、磁気
ディスク装置などを用いることができる。第2表はこの
活用語尾記憶手段6の内容の一例を示す。第2表におい
て、用言の活用の種類60ri「ガ行五段」活用、「す
行五段」活用などを示し、その活用の種類に対応する活
用語尾61〜68が示されている。61が未然形A(「
ない」などに続く形)、62が未然形B(rう・よう」
に続く形)、63が連用形人(連用中止形。
The conjugation ending storage means 6 stores the conjugation endings of the words in association with the types of conjugations, and may be an IC memory, a magnetic disk device, or the like. Table 2 shows an example of the contents of this conjugated word ending storage means 6. Table 2 shows the types of conjugations of the predicates, such as 60ri ``ga-gyo 5-dan'' conjugations, ``su-gyo 5-dan'' conjugations, etc., and conjugation endings 61 to 68 corresponding to the types of conjugations are shown. 61 is unnatural form A (``
62 is the unnatural form B (ru/you).
(form following), 63 is the continuous form (form followed by continuous form), and 63 is the continuous form.

64が連用形B(rた」などに続く形)、65が終止形
、66が連体形、67が仮定形、68が命令形であシ、
各々活用語尾の表記の文字コードが記憶される。
64 is the adjunctive form B (the form that follows r-ta, etc.), 65 is the final form, 66 is the adnominal form, 67 is the hypothetical form, 68 is the imperative form,
The character code of the notation of each conjugated word ending is stored.

〉 第2表の活用の種類60は、第1表の活用の種類51と
対応しておシ、活用の種類に対応するコードが記憶され
る。
> The usage type 60 in Table 2 corresponds to the usage type 51 in Table 1, and a code corresponding to the usage type is stored.

用言認定手段7は、用言語幹記憶手段5と活用語尾記憶
手段6とを参照し、文字列入力手段1から入力された被
検索文字列中の用言と、その用言の活用形とを認定する
。具体的には、まず、被検索文字列が、編集制御手段1
1から用言認定手段7へ送られ、用言認定手段7は、被
検索文字列の部分文字列と一致する用言の語幹を、用言
語幹記憶手段5に記憶された用言の語幹50のなかから
検索し、検索された用言の語幹に対する活用の種類につ
いて、活用語尾記憶手段6よ)活用語尾を得る。そして
、その活用語尾の一つが、被検索文字列の用言の語幹の
直後の文字列と、一致したならば、その活用語尾に対応
する活用形が、用言の活用形となる。用言の語幹の照合
だけでは、複数の候補がある場合、この活用語尾の照合
によって、候補を紋ることができる。最終的に、用言認
定手段7は、検索された用言の語幹とその用言の活用の
種類を、活用展開手段8へ送る。
The predicate recognition means 7 refers to the used language stem storage means 5 and the conjugated word ending storage means 6, and determines the predicate in the searched character string input from the character string input means 1 and the conjugated form of the predicate. certify. Specifically, first, the searched character string is
1 to the word recognition means 7, and the word recognition means 7 sends the word stem of the word that matches the substring of the searched character string to the word stem 50 of the word stored in the word stem storage means 5. The conjugation ending storage means 6) obtains the conjugation ending for the type of conjugation for the stem of the searched term. If one of the conjugated endings matches the character string immediately after the stem of the term in the searched character string, the conjugated form corresponding to that conjugated ending becomes the conjugated form of the term. If there are multiple candidates, it is possible to identify the candidates by comparing the conjugated endings only by matching the stem of the word. Finally, the term recognition means 7 sends the stem of the searched term and the type of use of the term to the use development means 8.

活用展開手段8は、活用語尾記憶手段6を参照し、用言
認定手段7によって認定された用言の全活用形を生成す
る。具体的には、活用展開手段8は、用言認定手段7か
ら、用言の語幹とその用言の活用の種類を受は取り、活
用語尾記憶手段6から、その活用の種類に対応する全活
用語尾を取υ出す。そして、それらの活用語尾を用言の
語幹と結合して、その用言の全活用形を生成する。活用
展開手段8は、生成した全活用形を、検索文字列記憶手
段9に書き込む。
The conjugation development means 8 refers to the conjugation ending storage means 6 and generates all conjugations of the predicates recognized by the predicate recognition means 7. Specifically, the conjugation development means 8 receives the stem of the word and the type of conjugation of the word from the conjugation recognition means 7, and extracts all words corresponding to the type of conjugation from the conjugation ending storage means 6. Take out the conjugated ending υ. Then, these conjugated endings are combined with the stem of the word to generate all the conjugated forms of the word. The inflection development means 8 writes all the generated inflections into the search character string storage means 9.

検索文字列記憶手段9は、「用言展開検索」のとき、活
用展開手段8によって生成された、用言の全活用形を記
憶する。また、「−散文字列検索」のときには、文字列
入力手段1よシ入力された被検索文字列が、編集制御手
段11よシ送られてきて、検索文字列記憶手段9に記憶
される。この記憶手段9としては、ICメモリ、磁気デ
ィスク装置などを用いることができる。
The search character string storage means 9 stores all conjugations of a predicate generated by the conjugation expansion means 8 during the "phrase expansion search." Further, in the case of "-dispersed character string search", the character string to be searched inputted by the character string input means 1 is sent from the editing control means 11 and stored in the search character string storage means 9. As this storage means 9, an IC memory, a magnetic disk device, etc. can be used.

文字列比較手段10は、検索文字列記憶手段9に記憶さ
れている文字列を、文章記憶手段4に記憶されている文
章の文字列から検索し、見つかった位置を編集制御手段
11へ返す。
The character string comparison means 10 searches for the character string stored in the search character string storage means 9 from the character strings of the sentences stored in the sentence storage means 4, and returns the found position to the editing control means 11.

編集制御手段111”l:、文字列入力手段lから入力
された文章の文字列を、文章記憶手段4に書き込み、ま
た1文字列入力手段1から人力される編集指令に従って
、文章記憶手段4に記憶されている文章の文字列を、書
き換える。さらに、前述の各構成要素の動作を制御し、
本発明の文字列検索方式を実現する。
Editing control means 111''l: writes the character string of the sentence input from the character string input means 1 into the sentence storage means 4, and writes it into the sentence storage means 4 according to the editing command manually input from the character string input means 1. Rewrites the memorized string of sentences.Furthermore, controls the operation of each component mentioned above,
The character string search method of the present invention is realized.

次に、「−散文字列検索」と「用言展開検索」の二連シ
について、編集制御手段11が、各構成要素をどのよう
に制御するか全、例を用いて説明する。この例では、文
章記憶手段4には、次のような文章が記憶されているも
のとする。
Next, how the editing control means 11 controls each component of the double series of "-scattered character string search" and "expanded word search" will be explained using an example. In this example, it is assumed that the following sentences are stored in the sentence storage means 4.

「モノポールは存在すると、彼は言った。しかし、彼の
言うことを、否定する学者も多い。」「−散文字列検索
」について説明する。これは、従来の文字列検索方式で
あシ、文字列人力手段1゜表示手段32文章記憶手段4
.検索文字列記厖手段92文字列比較手段io、編集制
御手段11のみが動作する。
``He said that monopoles exist. However, there are many scholars who deny what he said.'' ``-Dispersed string search'' is explained. This is a conventional character string search method.Character string manual means 1゜display means 32 text storage means 4
.. Only the search character string recording means 92, the character string comparison means io, and the editing control means 11 operate.

まず、文字列入力手段1よシ被検索文字列が入力され、
検索種別指定手段2よシ「−散文字列検索」が指定され
る。この例では、被検索文字列として、「言う」が入力
されたものとする。文字列入力手段1と検索種別指定手
段2とからの情報は、編集制御手段11へ送られ、編集
制御手段11ば、「−散文字列検索」が指定されたので
、入力された被検索文字列を検索文字列記憶手段9に!
き込む。
First, a character string to be searched is input through the character string input means 1,
The search type specifying means 2 specifies "-scattered character string search." In this example, it is assumed that "say" is input as the character string to be searched. The information from the character string input means 1 and the search type designation means 2 is sent to the editing control means 11, and since "-dispersed character string search" has been specified, the editing control means 11 selects the input search character. Search column as string storage means 9!
Get into it.

続いて、編集制御手段11は、文字列比較手段ioを起
動する。文字列比較手段10は、検索文字列記憶手段9
から被検索文字列として「言う」を読み込み、文章記憶
手段4に記憶された前記の文章から、それを検索する。
Subsequently, the editing control means 11 activates the character string comparison means io. The character string comparison means 10 is a search character string storage means 9.
``say'' is read as a character string to be searched, and it is retrieved from the sentences stored in the sentence storage means 4.

その結果、その文章の25文字目から26文字目に、被
検索文字列「言う」を見つける。そして、文字列比較手
段1゜は、編集制御手段11へ、被検索文字列の見つか
った文字位置(25−26)を送る。編集制御手一段1
1ri、文章記憶手段4に記憶されている文章を、表示
手段3に表示させているが、文字列比較手段10からの
情報を受けて、表示手段3に表示されている文字列の2
5文字目から26文字目を、反転表示など、他の文字列
とは異なる表示方法に変える。
As a result, the searched character string "say" is found from the 25th character to the 26th character of the sentence. The character string comparison means 1° then sends the character position (25-26) where the searched character string is found to the editing control means 11. Editing control means 1
1ri, the text stored in the text storage means 4 is displayed on the display means 3, but upon receiving information from the character string comparison means 10, two of the character strings displayed on the display means 3 are displayed.
Change the display method for the 5th to 26th characters to be different from other character strings, such as by displaying them in reverse.

このように、「言う」に対して「−散文字列検索」を行
った場合、25文字目から26文字目の「言う」は検索
されるが、15文字目から16文字目の「言り」は検索
されない。「言っ」が検索されることを意図的に避ける
場合には、今述べたような「−散文字列検索」を行えば
よいが、「言っ」も検索されることを望む場合は1次に
述べるような「用言展開検索」を行えばよい。
In this way, if you perform a "-scattered character string search" on "say", the 25th to 26th character "say" will be searched, but the 15th to 16th character "say" will be searched. ” will not be searched. If you want to intentionally avoid searching for ``Koi'', you can use the ``-scattered string search'' like I just described, but if you want ``Koi'' to be searched as well, use the first All you have to do is perform a ``term expansion search'' as described below.

さて、本発明の特徴である「用言展開検索」について説
明する。
Now, "term expansion search" which is a feature of the present invention will be explained.

まず、文字列入力手段1よシ被検索文字列が入力され、
検索種別指定手段2よ)「用言展開検索jが指定される
。この例でri、被検索文字列として、「言う」が入力
されたものとする。文字列入力手段1と検索種別指定手
段2とからの情報は1編集制御手段11へ送られ、偽集
制御手段11ri、「用言展開検索」が指定されたので
、入力された被検索文字列「言う」を用言認定手段7へ
送る(検索文字列記憶手段9には書き込まない)。
First, a character string to be searched is input through the character string input means 1,
Search type specifying means 2) ``Term expansion search j is specified. In this example, it is assumed that ri and ``say'' are input as the searched character string. The information from the character string input means 1 and the search type designation means 2 is sent to the 1 editing control means 11, and since the false collection control means 11ri specifies "term expansion search", the input searched character string ``say'' is sent to the predicate recognition means 7 (it is not written to the search string storage means 9).

用言認定手段7ば、編集制御手段11から被検索文字列
が送られてくると動作する。用言認定手段7d、送られ
てきた被検索文字列「言う」の部分文字列と一致する用
言の語幹を、用言語幹記憶手段5から検索する。「言う
」と一致する用言の語幹はなく、−文字削った「言」に
ついて、一致するものが見つかる(第1表参照)。そこ
で、用言認定手段7は、用言語幹記憶手段5から、との
「言」に対応する活用の種類「ワ行五段活用」を取シ出
し、活用語尾記憶手段6よシ「ワ行五段活用」に対する
活用語尾を読み出す。その結果、次のような活用語尾が
読み出される(第2表参照)。
The term recognition means 7 operates when the searched character string is sent from the editing control means 11. The term recognition means 7d searches the term stem storage means 5 for the stem of the term that matches the partial character string of the sent character string to be searched ``say''. There is no word stem that matches ``say'', but a match is found for ``go'' with the - character omitted (see Table 1). Therefore, the conjugation recognition means 7 retrieves the conjugation type ``wa-gyo 5-dan conjugation'' corresponding to the ``word'' from the conjugation stem storage means 5, and stores it in the conjugation-suffix storage means 6. Read out the conjugated ending for "Godan conjugation". As a result, the following conjugated endings are read out (see Table 2).

rわ」「お」「い」「り」「う」「う」「え」「え」そ
して、これらの中から、被検索文字列から検索された用
言の語幹を除いた文字列は「う」(これが2文字以上の
場合には、その部分文字列)と一致するものを捜す。こ
こでは、終止形と連体形の「う」が、被検索文字列から
用言の語幹を除いた文字列と一致する。そこで、用言認
定手段7は、被検索文字列として与えられた用言は、「
言」を語幹とする「ワ行五段活用」の終止形または連体
形であると認定する。そして、用言認定手段7は、「言
」と「ワ行五段活用」を、活用展開手段8へ送る。
``rwa''``o''``i''``ri''``u''``u''``e''``e'' And among these, the string excluding the stem of the term searched from the searched string is `` Search for a match with "U" (or a substring if this is two or more characters). Here, the final form and the adjunctive form "U" match the character string obtained by removing the stem of the word from the searched character string. Therefore, the term recognition means 7 determines that the term given as the searched character string is ``
It is recognized as the final form or conjunctive form of the ``wa-gyo five-dan conjugation'' with ``word'' as the root word. Then, the word recognition means 7 sends "word" and "Wa-gyo 5-dan conjugation" to the conjugation development means 8.

活用展開手段8は、用言認定手段7から情報が送られて
くると動作する。活用展開手段8は、まず、活用語尾記
憶手段6から、「ワ行五段活用」に対する全活用語尾を
読み出す。読み出された活用語尾は、用言認定手段7で
読み出したものと同一のものとなる。そして、活用展開
手段8は、それらの活用語尾を、用言認定手段7から送
られてきた用言の語幹「言」に付加して、次のような全
活用形を生成する。
The usage development means 8 operates when information is sent from the predicate recognition means 7. The conjugation development means 8 first reads out all conjugation endings for "wa-gyo 5-dan conjugation" from the conjugation ending storage means 6. The read conjugated ending is the same as the one read by the predicate recognition means 7. Then, the conjugation development means 8 adds these conjugation endings to the stem word ``word'' of the term sent from the predicate recognition means 7 to generate the following full conjugation form.

「言わ」「言お」「言い」「言っ」「言う」「言う」「
言え」「言え」 次いで、活用展開手段8は、これらの全活用形を、検索
文字列記憶手段9に書き込む。ただし、この際、同一の
文字列は削除する。従って、検索文字列記憶手段9に書
き込まれる文字列は、次の6通シである。
"Say""Say""Say""Say""Say""Say"
"Ie""Ie" Next, the conjugation development means 8 writes all these conjugations into the search character string storage means 9. However, in this case, identical character strings will be deleted. Therefore, the following six character strings are written into the search character string storage means 9.

「言わ」「言お」「言い」「言っ」「言う」「言え」そ
の後、活用展開手段8は、編集制御手段11へ、検索対
象文字列の書き込み完了を通知する。
"Say""Sayo""Say""Say""Say""Say" Thereafter, the utilization development means 8 notifies the editing control means 11 that the writing of the search target character string is completed.

それを受けて、編集制御手段11は、文字列比較手段1
0を起動する。文字列比較手段10は、検索文字列記憶
手段9から、上記の6通シの文字列を読み込み、文章記
憶手段4に記憶された前記の文章から、それらを検索す
る。その結果、その文章の15文字目から16文字目に
「言っ」を、25文字目から26文字目に「言う」を見
つける。そして、文字列比較手段10は、編集制御手段
11へ、文字列の見つかった文字位置(15−16’)
と(25−26)を送る。編集制御手段41は、文章記
憶手段4に記憶されている文章を、表示手段3に表示さ
せているが、文字列比較手段10からの情報を受けて、
表示手段3に表示されている文字列の15文字目から1
6文字目と、25文字目から26文字目とを、反転表示
など、他の文字列とは異なる表示方法に変える。
In response, the editing control means 11 controls the character string comparison means 1
Start 0. The character string comparison means 10 reads the above six character strings from the search character string storage means 9 and searches for them from the aforementioned sentences stored in the sentence storage means 4. As a result, "say" is found in the 15th to 16th characters of the sentence, and "say" is found in the 25th to 26th characters. Then, the character string comparison means 10 sends the character position (15-16') where the character string is found to the editing control means 11.
and send (25-26). The editing control means 41 displays the text stored in the text storage means 4 on the display means 3, and upon receiving information from the character string comparison means 10,
1 from the 15th character of the character string displayed on display means 3
Change the display method of the 6th character and the 25th to 26th characters to be different from other character strings, such as by displaying them in reverse.

(発明の効果) 以上説明したように、本発明の文字列検索方式によれば
、用言についての全活用形を自動的に生成した検索が可
能となる。従来、これと同様のことを行う場合、利用者
が用言の全活用形を考え、全活用形ごとの文字列検索を
繰シ返し行う必要があったが、本発明ではこれが一回の
操作で実現できる。
(Effects of the Invention) As explained above, according to the character string search method of the present invention, it is possible to perform a search in which all conjugated forms of a term are automatically generated. Conventionally, when doing something similar to this, it was necessary for the user to think of all the conjugations of the word and repeatedly search for strings for each conjugation, but with the present invention, this is done in a single operation. This can be achieved with

また、単語辞書を用いて、全文章の単語を認定した後に
、用言を抽出する方法では、数万語から数十1語の単語
辞書が必要でちゃ、処理量が膨大になるが、本発明のよ
うに用言だけならば、数百から1万語程度ですみ、処理
効率も良いという効果がある。
In addition, using a word dictionary to identify the words in all sentences and then extracting the words requires a word dictionary containing tens of thousands of words to several dozen words, resulting in an enormous amount of processing. If there are only words such as those used in inventions, only a few hundred to 10,000 words are needed, and the processing efficiency is also good.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の文字列検索方式を用いたワードプロセ
ッサの一実施例の構成を示すブロック図である。 1・・・・・・文字列入力手段、2・・・・・・検索種
別指定手段、3・・・・・・表示手段、4・・・・・・
文章記憶手段、5・・−・・・用言語幹記憶手段、6・
・・・・・活用語尾記憶手段、7・・・・・・用言認定
手段、8・・・・−・活用展開手段、9・・・・・・検
索文字列記憶手段、10・・・・・・文字列比較手段、
1、。
FIG. 1 is a block diagram showing the configuration of an embodiment of a word processor using the character string search method of the present invention. 1...Character string input means, 2...Search type designation means, 3...Display means, 4...
Sentence storage means, 5... Language stem storage means, 6.
. . . Conjugation ending storage means, 7. Term recognition means, 8. conjugation development means, 9. Search character string storage means, 10. ...String comparison means,
1.

Claims (1)

【特許請求の範囲】[Claims] あらかじめ入力された第1の文字列を対象として、検索
するために入力された第2の文字列に関して複数の検索
種別のうちの1つを指定する検索指定手段と、用言の語
幹とこの用言の活用の種類とを記憶する用言語幹記憶手
段と、前記用言の活用語尾を前記活用の種類と対応付け
て記憶する活用語尾記憶手段と、これら用言語幹記憶手
段と活用語尾記憶手段とを参照し前記第2の文字列中の
用言とこの用言の活用形とを認定する用言認定手段と、
この用言認定手段によって認定された用言の全活用形を
前記活用語尾記憶手段を参照して生成する活用展開手段
とを備え、前記検索指定手段の指定による1つの検索に
対して、前記活用展開手段によって生成された前記用言
の全活用形を前記第1の文字列から検索することを特徴
とする文字列検索方式。
A search specification means for specifying one of a plurality of search types for a second character string input for searching a first character string input in advance; a conjugation stem storage means for storing conjugation types of words; a conjugation suffix storage means for storing conjugation endings of said words in association with said conjugation types; and conjugation stem storage means and conjugation suffix storage means. a term recognition means for identifying a term in the second character string and a conjugated form of the term by referring to the term;
and a conjugation expansion means for generating all conjugations of the term recognized by the term recognition means by referring to the conjugation ending storage means, and for one search specified by the search specification means, the conjugation A character string search method, characterized in that all conjugated forms of the term generated by an expanding means are retrieved from the first character string.
JP61126584A 1986-05-30 1986-05-30 Character string retrieval system Pending JPS62282364A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61126584A JPS62282364A (en) 1986-05-30 1986-05-30 Character string retrieval system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61126584A JPS62282364A (en) 1986-05-30 1986-05-30 Character string retrieval system

Publications (1)

Publication Number Publication Date
JPS62282364A true JPS62282364A (en) 1987-12-08

Family

ID=14938792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61126584A Pending JPS62282364A (en) 1986-05-30 1986-05-30 Character string retrieval system

Country Status (1)

Country Link
JP (1) JPS62282364A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02165270A (en) * 1988-12-19 1990-06-26 Canon Inc Character processor
JPH06290181A (en) * 1993-04-05 1994-10-18 Nec Corp Processor for retrieving derivative

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02165270A (en) * 1988-12-19 1990-06-26 Canon Inc Character processor
JPH06290181A (en) * 1993-04-05 1994-10-18 Nec Corp Processor for retrieving derivative

Similar Documents

Publication Publication Date Title
JP2783558B2 (en) Summary generation method and summary generation device
JPH0567144A (en) Method and device for pre-edit supporting
JPH0731677B2 (en) Document creation / proofreading support device
JPS62282364A (en) Character string retrieval system
KR100452024B1 (en) Searching engine and searching method
JPH1011431A (en) Kanji retrieval device and method
JPH08137892A (en) Method and device for document retrieval
JPH01307865A (en) Character string retrieving system
JPH07114565A (en) Electronic dictionary
JP3574199B2 (en) Database search method
JP3086464B2 (en) Kana-Kanji conversion device
JP2893239B2 (en) Translation support dictionary search and display system
JP2634596B2 (en) Kana-Kanji conversion device
JPH08339365A (en) Method and device for documentation
JPH04281558A (en) Document retrieving device
JPS62282363A (en) Character string replacing system
JPH08185401A (en) Document retrieving device
JPS59106029A (en) Kana (japanese syllabary) kanji (chinese character) converter
JPH0350669A (en) Information processor
JPS60112175A (en) Abbreviation conversion system of kana (japanese syllabary)/kanji (chinese character) convertor
JPS61211763A (en) Natural language processor
JPH086950A (en) Machine translation apparatus with keyword translation function
JPH03208162A (en) Input device
JPS61169961A (en) Character processor provided with user dictionary
JPH06162079A (en) Parallel translation retrieving device