JP2526670B2 - Word dictionary search device - Google Patents

Word dictionary search device

Info

Publication number
JP2526670B2
JP2526670B2 JP1173443A JP17344389A JP2526670B2 JP 2526670 B2 JP2526670 B2 JP 2526670B2 JP 1173443 A JP1173443 A JP 1173443A JP 17344389 A JP17344389 A JP 17344389A JP 2526670 B2 JP2526670 B2 JP 2526670B2
Authority
JP
Japan
Prior art keywords
character
word
word dictionary
input
clock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1173443A
Other languages
Japanese (ja)
Other versions
JPH0337766A (en
Inventor
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1173443A priority Critical patent/JP2526670B2/en
Publication of JPH0337766A publication Critical patent/JPH0337766A/en
Application granted granted Critical
Publication of JP2526670B2 publication Critical patent/JP2526670B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、入力文字列と単語辞書とを照合して、入力
文字列において、単語辞書内に存在する単語が出現した
部分を検索する単語辞書検索装置に関するものである。
特に、入力文字例の各文字が複数の候補をもつような場
合にも適用できる単語辞書検索装置に関するものであ
る。
DETAILED DESCRIPTION OF THE INVENTION (Industrial field of application) The present invention is a word for collating an input character string with a word dictionary and searching for a portion in the input character string where a word existing in the word dictionary appears. The present invention relates to a dictionary search device.
In particular, the present invention relates to a word dictionary search device applicable even when each character of an input character example has a plurality of candidates.

入力文字列の各文字に複数の候補がなく一意な場合の
単語辞書検索装置は、かな漢字変換装置においてキーボ
ードから入力されたかな文字列に対する単語辞書検索を
行なう部分、機械翻訳装置・文音声変換装置・文章校正
装置などにおいてワードプロセッサなどで作成された漢
字かな混じり文字列に対する単語辞書検索を行なう部分
などに用いられている。
A word dictionary search device in the case where each character of an input character string is unique without a plurality of candidates is a part for performing a word dictionary search for a kana character string input from a keyboard in a kana-kanji conversion device, a machine translation device / sentence voice conversion device. -It is used in the lexical proofreading device, etc. for searching a word dictionary for a character string mixed with kanji and kana created by a word processor or the like.

入力文字列の各文字に複数の候補がある場合の単語辞
書検索装置は、音声認識装置や文字認識装置などにおい
て、認識結果の複数の候補文字から最も確からしい文字
を選択するための単語辞書検索部などに用いられてい
る。
The word dictionary search device when there are multiple candidates for each character of the input character string is a word dictionary search for selecting the most probable character from a plurality of candidate characters of the recognition result in a voice recognition device or a character recognition device. It is used for departments.

(従来の技術) 従来、かな漢字変換装置・文音声変換装置などにおい
て用いられている単語辞書検索方式は、基本的に、文
献:「計算機によるカナ漢字変換」(相沢・江原、NHK
技術研究、第25巻第5号、23頁〜60頁、1973年)に示さ
れている方式を引き継いでいる。すなわち、入力された
文字列から部分文字列を切り出して、その部分文字列に
表記(かな漢字変換では「かな表記」すなわち「読みが
な」)の一致する単語を単語辞書内から検索するという
処理を行なう(これを、以下では、第1の従来技術と呼
ぶことにする。) 例えば、「文章を解析する」という漢字かな混じり文
字例に対する単語辞書検索を行なう場合は、1文字目・
2文字目など各文字位置から始まる単語を検索するため
に、「文章を解析する」「章を解析する」「を解析す
る」「解析する」「析する」「する」「る」といった部
分文字列を別々に切り出す。そして、各部分文字列につ
いて、さらに、末尾を削った部分文字列も生成して、そ
の各々を単語辞書から検索する。すなわち、1文字目か
ら始まる単語を検索する際には、「文章を解析する」
「文章を解析す」「文章を解析」「文章を解」「文章
を」「文章」「文」といった部分文字列に関して、検索
を次々に繰り返し、2文字目から始まる単語を検索する
際には、「章を解析する」「章を解析す」「章を解析」
「章を解」「章を」「章」といった部分文字列に関し
て、検索を次々に繰り返すわけである。その結果、下線
を引いた文章、文、章などの部分文字列について、表記
の一致する単語が見つかることになる。
(Prior Art) The word dictionary search method conventionally used in the kana-kanji conversion device / sentence-speech conversion device is basically based on the document: “Kana-kanji conversion by computer” (Aizawa / Ehara, NHK).
Technical Research, Vol. 25, No. 5, pp. 23-60, 1973). That is, a process of extracting a partial character string from the input character string and searching a word in the word dictionary for which the partial character string has a notation (“kana notation” or “yomigana” in kana-kanji conversion) is matched. Perform (hereinafter, referred to as the first conventional technique.) For example, when performing a word dictionary search for an example of a mixture of kanji and kana such as "analyze a sentence", the first character
Partial characters such as "analyze sentence", "analyze chapter", "analyze", "analyze", "analyze", "do", "ru" in order to search for a word starting from each character position such as the second character Cut out the columns separately. Then, for each partial character string, a partial character string with the end trimmed is further generated, and each of them is searched from the word dictionary. That is, when searching for a word starting from the first letter, "analyze the sentence"
For substrings such as "analyze a sentence", "analyze a sentence", "solve a sentence", "sentence", "sentence", and "sentence", the search is repeated one after another to search for a word starting from the second character. , Analyze Chapter, Analyze Chapter, Analyze Chapter
The search is repeated one after another for substrings such as "solve chapter", "chapter", and "chapter". As a result, for the underlined sentences, sentences, chapters, and other substrings, words with matching notations can be found.

この第1の従来技術では、複数の部分文字列に対して
単語辞書の検査を繰り返すわけであるが、単語辞書の構
成を工夫しておくことによって、1つの部分文字列に対
する検索の所要時間の短縮を図っている。例えば、単語
辞書内の単語をあらかじめソートしておいて二分検索を
行なったり、1文字目・2文字目など文字ごとに分割し
て共通な部分をまとめて木構造として1文字ずつの照合
を行なうなどである。このような辞書の構造と検索方式
の工夫については、文献:“The Art of Computer Prog
ramming 3:Sorting and Searching"(D.E.Knuth,Addiso
n−Wusley,1973)に多く示されている。
In the first conventional technique, the inspection of the word dictionary is repeated for a plurality of partial character strings. However, by devising the structure of the word dictionary, the time required for the search for one partial character string can be reduced. We are trying to shorten it. For example, words in the word dictionary are sorted in advance and a binary search is performed, or characters such as the first character and the second character are divided and common parts are collected to perform a tree-structured collation for each character. And so on. For the structure of such a dictionary and devising a search method, see the article: “The Art of Computer Prog.
ramming 3: Sorting and Searching "(DEKnuth, Addiso
n-Wusley, 1973).

ただし、この第1の従来技術は、コンピュータ上の逐
次型プログラムとしての実現を想定しており、所要時間
短縮の工夫は逐次処理を枠内で工夫である。したがっ
て、入力文字列のある部分文字列と単語辞書内のある単
語の表記の文字列とを比較する処理などは、1文字ずつ
逐次行なわれる。例えば「文章を」という部分文字列と
単語辞書内の「文章」という単語の比較は、「文」と
「文」とを照合し、一致したところで「章」と「章」と
を照合し、次に、「を」に対して不一致となり失敗する
というように、1文字ずつ照合処理の繰り返しである。
However, this first conventional technique is supposed to be realized as a sequential program on a computer, and the device for shortening the required time is devised within the framework of sequential processing. Therefore, a process of comparing a partial character string of an input character string with a character string representing a word in a word dictionary is sequentially performed character by character. For example, to compare a substring "sentence" to the word "sentence" in the word dictionary, match "sentence" and "sentence", and when they match, match "chapter" and "chapter", Next, the collation process is repeated character by character such that "o" does not match and fails.

また、第1の従来技術では、入力文字列の各文字にm
個ずつ候補があるような場合は、あらかじめ、長さLの
部分文字列に対して、候補を組み合せたmL通りの文字列
を生成する必要がある。そして、それらの各々につい
て、さらに、上記のように末尾を削った部分文字列を生
成して、単語辞書内を検索することになる。
Further, in the first conventional technique, m is added to each character of the input character string.
In the case where there are candidates for each, it is necessary to generate in advance m L character strings by combining the candidates for the partial character string of length L. Then, for each of them, the partial character string with the end trimmed as described above is further generated, and the word dictionary is searched.

一方、ある長さLの文字列と入力文字列との比較の際
に、1文字ずつの照合を繰り返すのではなく、対応する
文字位置のL組の照合を同時に行なうことが考えられて
いる。その際、入力文字列をシフトレジスタに格納して
おけば、照合の位置をずらすことが、入力文字列から再
度部分文字列を切り出すのではなく、シフトレジスタ内
の全文字を一度に1文字ずらすことで実現できるように
もなる。この第2の従来技術は、特開昭63−261421号公
報「文字列処理装置」および特開昭63−261422号公報
「文字列照合装置」に述べられている。なお、この第2
の従来技術では、入力文字列に複数の候補は存在せず、
検索される文字列も1通りに限られる(単語辞書のよう
に多数ではない)。
On the other hand, when comparing a character string having a certain length L with an input character string, it is considered that the collation of L sets at corresponding character positions is performed at the same time, instead of repeating the collation of each character. At that time, if the input character string is stored in the shift register, shifting the collation position shifts all the characters in the shift register one character at a time, rather than cutting out the partial character string again from the input character string. It can also be realized. This second conventional technique is described in Japanese Patent Application Laid-Open No. 63-261421, “Character String Processing Device” and Japanese Patent Application Laid-Open No. 63-261422, “Character String Matching Device”. In addition, this second
In the prior art of, there are no multiple candidates in the input string,
The number of character strings that can be searched is also limited to one (not as many as in a word dictionary).

特開昭62−67636号公報「照合方式」および文献:
「音声日本語入力システムにおける高速な言語処理のた
めの辞書照合アルゴリズム」(浜口・鈴木、電子情報通
信学会論文誌、第J70−D巻第8号、1589頁〜1596頁198
7年)には、第3の従来技術が示されている。
Japanese Unexamined Patent Publication No. Sho 62-67636 "Reference system" and references:
"Dictionary Matching Algorithm for High-speed Language Processing in Spoken Japanese Input System" (Hamaguchi and Suzuki, Transactions of the Institute of Electronics, Information and Communication Engineers, Vol. J70-D, No. 8, pp. 1589-1596 198)
7 years), the third prior art is shown.

第3の従来技術では、入力文字列に複数の文字候補が
あることを想定している。まず、文字の種類をM(例え
ば、JISの文字コード表では、ひらがなについてM=8
3)とすると、1文字目・2文字目など各文字位置に、
Mビットのメモリを1個ずつ用意し、複数の候補文字に
対応する各ビットを1にしておく。そして、照合時は、
単語辞書内の各単語について、単語の表記の1文字目・
2文字目など文字位置ごとに、対応するMビットメモリ
から、対応する文字のビット内容(1または0)を同時
に読み出す。すべてのMビットメモリから1が読みださ
れたら、入力文字列中に単語辞書内にある単語が出現し
たことになる。
The third conventional technique assumes that the input character string has a plurality of character candidates. First, the character type is M (for example, in the JIS character code table, M = 8 for hiragana).
3), at each character position such as the first and second characters,
One M-bit memory is prepared and each bit corresponding to a plurality of candidate characters is set to 1. And at the time of matching,
For each word in the word dictionary, the first letter of the word notation
For each character position such as the second character, the bit content (1 or 0) of the corresponding character is simultaneously read from the corresponding M-bit memory. When 1 is read from all the M-bit memories, it means that a word in the word dictionary appears in the input character string.

(発明が解決しようとする課題) 第1の従来技術には、まず第1に、前述のように、多
数の部分文字列に対する単語辞書検索を繰り返さねばな
らないという欠点がある。この欠点は、入力文字列の各
文字に複数の候補がある場合に、特に顕著になる。長さ
Kの入力文字列の各文字にm個ずつ候補がある場合、最
長の部分文字列の長さをLとすると(通常、単語辞書内
の最長の単語の長さをLとする)、最大(mL×L×K)
個の部分文字列に対する検索を繰り返す必要が生ずる。
通常、あらかじめ条件を定めて、不要な部分文字列の検
索を避けるようにするので、(mL×L×K)個というの
は最悪の場合であるが、それでも検索の回数はかなり多
くなる。
(Problem to be Solved by the Invention) First, as described above, the first conventional technique has a drawback that the word dictionary search for a large number of partial character strings must be repeated. This drawback is especially noticeable when there are multiple candidates for each character in the input string. If there are m candidates for each character in the input string of length K, and the length of the longest substring is L (usually, the length of the longest word in the word dictionary is L), Maximum ( mL x L x K)
It becomes necessary to repeat the search for the respective partial character strings.
Usually, since conditions are set in advance to avoid searching for unnecessary sub-character strings, (m L × L × K) is the worst case, but the number of searches is still large.

第1の従来技術の第2の欠点は、ある部分文字列と単
語辞書内のある単語の表記の文字列との比較を、1文字
ずつ順に行なうため、比較に時間がかかるということで
ある。
A second drawback of the first conventional technique is that a certain character string is compared with a character string representing a certain word in the word dictionary one by one in order, and therefore the comparison takes time.

第2の従来技術では、第1の従来技術の第2の欠点に
対処している。しかし、第2の従来技術は、入力文字列
に複数の候補がある場合に適用できない。また、検索さ
れる文字列も1通りに限られ、単語辞書のように多数の
文字列と比較を行なうことを考えると、単語辞書内の各
単語の表記の長さの異なりが問題となって適用できな
い。
The second prior art addresses the second shortcoming of the first prior art. However, the second conventional technique cannot be applied when there are a plurality of candidates in the input character string. Also, the number of character strings to be searched is limited to one, and considering the comparison with many character strings as in a word dictionary, the difference in the notation length of each word in the word dictionary becomes a problem. Not applicable.

第3の従来技術は、第1の従来技術の2つの欠点に対
処している。しかし、入力文字列を記憶するために、文
字の種類だけのビット数をもったメモリを、文字列長だ
け用意する必要があるため、文字の種類が多数の場合は
メモリサイズがかなり大きくなってしまう問題がある。
かな漢字変換や音声認識の場合は、入力文字列がひらが
な(あるいは音素文字)で100種類程度に限定されるの
で、あまり問題にならないが、漢字かな混じり文字列を
対象とした文音声変換や機械翻訳など場合は、漢字を含
み文字の種類が3000〜4000種類にもおよぶため、メモリ
が大きくなって問題になる。
The third prior art addresses two drawbacks of the first prior art. However, in order to store the input character string, it is necessary to prepare the memory having the number of bits corresponding to the character type only for the character string length, so the memory size becomes considerably large when there are many character types. There is a problem that ends up.
In the case of kana-kanji conversion or voice recognition, the input character string is limited to about 100 types of hiragana (or phoneme characters), so it does not pose a problem, but sentence-to-speech conversion or machine translation for kanji-kana mixed character strings. In such cases, there are 3000 to 4000 types of characters, including kanji, which causes a large memory problem.

また、第3の従来技術では、入力された文字列の先頭
から始まる単語の検索しか行なわないため、2文字目か
ら始まる単語や、3文字目から始まる単語などを検索す
る場合には、入力文字列のメモリへの登録を、やり直す
必要が生じるという問題もある。
Further, in the third conventional technique, only a word starting from the beginning of the input character string is searched. Therefore, when searching a word starting from the second character or a word starting from the third character, the input character There is also a problem that it is necessary to re-register the column in the memory.

さらに、第3の従来技術では、入力文字列の先頭から
ある長さまで一致した単語が出現したことはわかるが、
その長さがいくつであるかは、その単語の単語辞書内ア
ドレスを記憶しておき、もう一度改めて、単語辞書内の
その単語の表記を調べて求める必要があった。
Further, in the third conventional technique, it can be seen that a matched word has appeared from the beginning of the input character string to a certain length,
It was necessary to memorize the address in the word dictionary of the word, determine the length of the word again, and check the notation of the word in the word dictionary again to obtain the length.

本発明の目的は、上記のような従来技術の欠点を除去
し、入力文字列の各文字に複数の候補があっても、高速
に単語辞書との照合が可能な単語辞書検索装置を提供す
ることである。加えて、検出された単語の長さも容易に
算出できる機構も備えた単語辞書検索装置を提供する。
An object of the present invention is to eliminate the above-mentioned drawbacks of the prior art, and provide a word dictionary search device capable of high-speed matching with a word dictionary even when there are a plurality of candidates for each character of an input character string. That is. In addition, a word dictionary search device provided with a mechanism for easily calculating the length of the detected word is also provided.

(課題を解決するための手段) 本発明は各文字に対して第1から第m候補(mはm≧
2なる整数)までのm種類の候補が存在する文字列の入
力装置と、n文字分(nはn≧1なる整数)のデータ巾
をもつ各アドレスに単語の表記を1個ずつ格納してn文
字に満たない部分にはあらかじめ定めた残余記号を詰め
た単語辞書メモリ(登録単語数≧2)と、前記入力装置
によって1文字に対するm種類の候補が入力されるたび
にシフトクロック1回と前記単語辞書メモリ内の全単語
数に応じた回数の判定クロックとカウンタクロックとを
発生するコントローラと、前記シフトクロックに同期し
たリセットと前記カウンタクロックに同期したカウント
アップとを行なう前記単語辞書メモリのアドレスカウン
タと、前記入力装置によって入力された文字列の第1・
第2・…・第m候補に対応し前記シフトクロックに同期
した1文字ずつの順送りを行なう各々n文字分の第1・
第2・…・第m候補シフトレジスタと、前記単語辞書メ
モリから読み出されるn文字分のデータの1文字目・2
文字目・…・n文字目に対応し該当位置の文字が前記第
1・第2文字目・…・第m候補シフトレジスタのいずれ
かの同位置の文字に一致したとき一致信号を出力し前記
残余記号に一致したとき一致信号と残余検出信号とを出
力する1文字目・2文字目・…・n文字目比較回路と、
前記判定クロックに同期して前記1文字目・2文字目・
…・n文字目比較回路のすべてから一致信号が検出され
た場合に前記入力装置によって入力された文字列中に前
記単語辞書メモリ内に存在する単語が出現したと判定す
る判定回路と、前記残余検出信号をもとに単語長を算出
する単語長算出回路とを備えたことを特徴とする単語辞
書検索装置である。
(Means for Solving the Problem) In the present invention, the first to mth candidates (m is m ≧
An input device for a character string having m types of candidates up to 2) and one word notation at each address having a data width of n characters (n is an integer of n ≧ 1) A word dictionary memory (number of registered words ≧ 2) in which predetermined residual symbols are filled in a portion less than n characters, and one shift clock each time m types of candidates for one character are input by the input device. A controller that generates a determination clock and a counter clock the number of times corresponding to the total number of words in the word dictionary memory, and a word dictionary memory that performs reset in synchronization with the shift clock and count-up in synchronization with the counter clock. An address counter and a first character string input by the input device
2nd ... The 1st for n characters each of which is forwarded character by character in synchronization with the shift clock corresponding to the mth candidate
Second ... The mth candidate shift register and the first character of the data for n characters read from the word dictionary memory.
When the character at the corresponding position corresponding to the character, ..., Nth character matches the character at the same position in any of the first, second, ..., mth candidate shift register, a match signal is output and A first-character / second-character ... N-character comparison circuit that outputs a coincidence signal and a residual detection signal when the residual symbols match.
In synchronization with the judgment clock, the first character, the second character,
··· A determination circuit for determining that a word existing in the word dictionary memory appears in the character string input by the input device when a match signal is detected from all the n-th character comparison circuits; A word dictionary search device comprising: a word length calculation circuit that calculates a word length based on a detection signal.

(実施例) 図面を用いて、本発明の構成・作用を説明する。(Example) The structure and operation of the present invention will be described with reference to the drawings.

第1図は本発明の単語辞書検索装置の第1の実施例の
構成を示すブロック図である。以下、まず、各構成要素
を説明する。
FIG. 1 is a block diagram showing the configuration of the first embodiment of the word dictionary search device of the present invention. Hereinafter, each component will be described first.

入力装置5は、各文字に対して第1候補から第m候補
(mはm≧2なる整数)までのm種類の候補が存在する
文字列を入力する装置であり、例えば、音声認識装置や
文字認識装置などである。入力装置5は、各文字に対す
るm個の候補を、同時に出力し、その出力のタイミング
を入力クロック50によってコントローラ7へ伝える。
The input device 5 is a device for inputting a character string in which m types of candidates from the first candidate to the m-th candidate (m is an integer of m ≧ 2) exist for each character. For example, a character recognition device. The input device 5 simultaneously outputs m candidates for each character, and informs the controller 7 of the output timing by the input clock 50.

単語辞書メモリ1は、n文字分(nはn≧1なる整
数)のデータ巾をもつ各アドレスに、単語の表記を1個
ずつ格納して、n文字に満たない部分には、あらかじめ
定めた残余記号を詰めたものである。第2図は、単語辞
書メモリ1の内容の例を示す図である(第2図ではn=
4としている)。第2図において、△が残余記号を表わ
している。第2図の単語辞書メモリ1のアドレスをaと
すると、「日本△△」というn(=4)文字が同時に読
み出される。単語辞書メモリ1は、ICメモリなどを用い
て実現できる。通常、漢字コードは16ビットで表現され
るので、第2図の単語辞書メモリ1のデータ巾は、16×
4=64ビットである。現在のICメモリでは、同時に読み
出せるデータ巾が8ビット程度であるから、そのような
ICメモリを8個並列に並べて実現できる。
The word dictionary memory 1 stores one notation of a word at each address having a data width of n characters (n is an integer of n ≧ 1), and a portion less than n characters is predetermined. It is packed with residual symbols. FIG. 2 is a diagram showing an example of contents of the word dictionary memory 1 (n = n in FIG. 2).
4). In FIG. 2, Δ represents the residual symbol. Assuming that the address of the word dictionary memory 1 in FIG. 2 is a, n (= 4) characters of "Japan ΔΔ" are read out at the same time. The word dictionary memory 1 can be realized by using an IC memory or the like. Normally, the kanji code is represented by 16 bits, so the data width of the word dictionary memory 1 in FIG.
4 = 64 bits. In current IC memory, the data width that can be read at the same time is about 8 bits.
It can be realized by arranging 8 IC memories in parallel.

コントローラ7は、入力装置5によって1文字に対す
るm種類の候補が入力されるたびに、シフトクロック1
回と、単語辞書メモリ1内の全単語数に応じた回数の判
定クロックとカウンタクロックとを発生する。第3図は
コントローラ7の入出力信号のタイムチャートの例であ
る。第3図のタイムチャートでは、入力装置5から入力
クロック50が入力されるたびに、まず、シフトクロック
70を1回出力(入力クロック50をそのままシフトクロッ
ク70として出力)し、続いて、判定クロック72とカウン
タクロック71とを、交互にN回出力している。ただし、
カウンタクロック71は(N−1)回でもよい。ここで、
Nは単語辞書メモリ1内の全単語数である。このような
タイムチャート通りに動作するコントローラ7は、当業
者において容易に実現可能である。
Whenever the input device 5 inputs m types of candidates for one character, the controller 7 outputs the shift clock 1
And the determination clock and the counter clock are generated a number of times corresponding to the total number of words in the word dictionary memory 1. FIG. 3 is an example of a time chart of input / output signals of the controller 7. In the time chart of FIG. 3, every time the input clock 50 is input from the input device 5, first, the shift clock is input.
70 is output once (the input clock 50 is output as it is as the shift clock 70), and subsequently, the determination clock 72 and the counter clock 71 are alternately output N times. However,
The counter clock 71 may be (N-1) times. here,
N is the total number of words in the word dictionary memory 1. The controller 7 that operates according to such a time chart can be easily realized by those skilled in the art.

アドレスカウンタ4は、シフトクロック70に同期した
リセットと、カウンタクロック71に同期したカウントア
ップとを行なうカウンタで、カウンタ値を単語辞書メモ
リ1のアドレス値として出力する。従来のカウンタICで
実現できる。
The address counter 4 is a counter that resets in synchronization with the shift clock 70 and counts up in synchronization with the counter clock 71, and outputs the counter value as the address value of the word dictionary memory 1. It can be realized with a conventional counter IC.

第i候補シフトレジスタ2は、入力装置5によって入
力された文字列の第i候補(iは1≦i≦mなる整数)
を、シフトクロック70に同期して1文字ずつ順送りしな
がら、n文字分格納するシフトレジスタである。このシ
フトレジスタ2は、入力文字列の各文字に対するm個の
候補の各々に対して設けられており、第1候補シフトレ
ジスタ、第2候補シフトレジスタ、…、第m候補シフト
レジスタのm個がある。第4図は各シフトレジスタ2の
構成例を示した図である。1文字をdビットで表現して
いる場合、第i候補シフトレジスタ2は、第4図のよう
に、シフトクロック70に同期した(d×n)個のDフリ
ップフロップで実現できる(d個並列に並べたものを、
n個直列に接続する)。並列に接続したd個が1文字に
対応し、その出力はまとめて比較回路3へ送られる。
The i-th candidate shift register 2 is the i-th candidate of the character string input by the input device 5 (i is an integer 1 ≦ i ≦ m)
Is a shift register that stores n characters while sequentially feeding each character in synchronization with the shift clock 70. The shift register 2 is provided for each of m candidates for each character of the input character string, and the m candidates of the first candidate shift register, the second candidate shift register, ... is there. FIG. 4 is a diagram showing a configuration example of each shift register 2. When one character is represented by d bits, the i-th candidate shift register 2 can be realized by (d × n) D flip-flops synchronized with the shift clock 70 as shown in FIG. The ones lined up in
n units are connected in series). The d pieces connected in parallel correspond to one character, and the outputs thereof are sent to the comparison circuit 3 collectively.

j文字目比較回路3は、アドレスカウンタ4の示す1
つのアドレスに対して単語辞書メモリ1から読み出され
るn文字分のデータのj番目(jは1≦j≦nなる整
数)の文字が、m個のシフトレジスタ2のいずれかのj
番目の文字に一致したときに一致信号30を出力し、残余
記号に一致したときに一致信号30と残余検出信号31とを
出力する回路である。この比較回路3は、単語辞書メモ
リ1のデータ巾n文字の各々に対して設けられており、
1文字目比較回路、2文字目比較回路、…、n文字目比
較回路のn個がある。第5図は、j文字目比較回路3の
構成例を示した図である。1文字をdビットで表現し
て、シフトレジスタ2がm個設けられている場合、j文
字目比較回路3は、第5図のように、(m+1)個のd
ビット比較器と、1個のORゲートで構成できる。m個の
dビット比較器は、単語辞書メモリ1から読み出されて
いるn文字データのうちj文字目と、各シフトレジスタ
2のj文字目とを比較し、残りの1個のdビット比較器
は、単語辞書メモリ1から読み出されているn文字デー
タのうちのj文字目が残余記号であるか否かを調べる。
最終的なORデートの出力では、この(m+1)個の比較
器のいずれかで、一致が検出されたときに、一致信号30
が出力される。また、単語辞書メモリ1から読み出され
ているn文字データのうちのj文字目もが残余記号であ
るか否かを調べるdビット比較器の出力は、そのまま残
余検出信号31とする。
The j-th character comparison circuit 3 has the value 1 indicated by the address counter 4.
The j-th character (j is an integer 1 ≦ j ≦ n) of the data of n characters read from the word dictionary memory 1 for one address is j of any one of the m shift registers 2.
It is a circuit that outputs the match signal 30 when the second character is matched, and outputs the match signal 30 and the residual detection signal 31 when the residual symbol is matched. The comparison circuit 3 is provided for each of the data width n characters of the word dictionary memory 1,
There are n first character comparison circuits, second character comparison circuits, ..., Nth character comparison circuits. FIG. 5 is a diagram showing a configuration example of the j-th character comparison circuit 3. When one character is represented by d bits and m shift registers 2 are provided, the j-th character comparison circuit 3 operates as shown in FIG.
It can be configured with a bit comparator and one OR gate. The m d-bit comparators compare the j-th character of the n-character data read from the word dictionary memory 1 with the j-th character of each shift register 2, and the remaining one d-bit comparison The instrument checks whether the j-th character of the n-character data read from the word dictionary memory 1 is a residual symbol.
At the final OR date output, when a match is detected in any of the (m + 1) comparators, the match signal 30
Is output. The output of the d-bit comparator for checking whether the j-th character of the n-character data read from the word dictionary memory 1 is also a residual symbol is used as the residual detection signal 31.

判定回路6は、判定クロック72に同期して、n個の比
較回路のすべてから一致信号が検出された場合に、入力
装置5によって入力された文字列中に単語辞書メモリ1
内に存在する単語が出現したと判定する回路である。第
6図は、判定回路6の構成例を示す図である。判定回路
6は、第6図のように、1個のANDゲートと1個のDフ
リップフロップで実現できる。
The determination circuit 6 synchronizes with the determination clock 72, and when a match signal is detected from all of the n comparison circuits, the determination circuit 6 includes the word dictionary memory 1 in the character string input by the input device 5.
It is a circuit that determines that a word existing in the word has appeared. FIG. 6 is a diagram showing a configuration example of the determination circuit 6. The decision circuit 6 can be realized by one AND gate and one D flip-flop as shown in FIG.

単語長算出回路8は、n個の比較回路3から出力され
る残余検出信号31をもとに単語長80を算出する回路であ
る。第9図は、単語長算出回路8の構成例を示す図であ
る。第9図の回路では、j文字目比較回路(ここでは2
≦j≦n)から残余検出信号31が届いて、(j−1)文
字目比較回路から残余検出信号31が届いていないとき
に、(j−1)を単語長80として出力する。また、1文
字目比較回路からn文字目比較回路のいずれからも残余
検出信号31が届かないときには、nの値を単語長80とし
て出力する。1文字目比較回路からn文字目比較回路の
すべてから残余検出信号31が届く場合は、0を単語長80
として出力する(ただし、これは、単語辞書メモリ1内
に単語長0の単語が含まれていることになり、通常は考
えられないケースである)。
The word length calculation circuit 8 is a circuit that calculates the word length 80 based on the residual detection signals 31 output from the n comparison circuits 3. FIG. 9 is a diagram showing a configuration example of the word length calculation circuit 8. In the circuit of FIG. 9, the j-th character comparison circuit (here, 2
When the residual detection signal 31 has arrived from ≤j≤n) and the residual detection signal 31 has not arrived from the (j-1) th character comparison circuit, (j-1) is output as the word length 80. When the residual detection signal 31 does not reach from any of the first character comparison circuit to the nth character comparison circuit, the value of n is output as the word length 80. When the residual detection signals 31 arrive from all the nth character comparison circuits from the first character comparison circuit, 0 is set to the word length 80.
(However, this is a case where the word dictionary memory 1 contains a word with a word length of 0, which is usually unthinkable).

次にこの実施例の動作を例を用いて説明する。 Next, the operation of this embodiment will be described using an example.

第7図は、n=4、m=3で入力文字列の長さが4の
ときの、第1候補シフトレジスタ・第2候補シフトレジ
スタ・第3候補シフトレジスタの内容の変化の例を示し
た図である。第7図の3×4のマトリックスは、1行が
各シフトレジスタ2の内容に対応しており、行方向が文
字位置(1〜4)、列方向が候補レベル(1〜3)を表
わしている。これらのシフトレジスタ2に入力されてい
る文字列は、1文字目の候補は第1候補から順に「日」
「白」「目」、2文字目の候補は順に「木」「本」
「大」、3文字目は順に「電」「雷」「霧」、4文字目
は順に「気」「島」「戒」である。斜線部分は文字が格
納されていないことを表わす。
FIG. 7 shows an example of changes in the contents of the first candidate shift register, the second candidate shift register, and the third candidate shift register when n = 4, m = 3 and the length of the input character string is 4. It is a figure. In the 3 × 4 matrix of FIG. 7, one row corresponds to the contents of each shift register 2, the row direction represents the character position (1 to 4), and the column direction represents the candidate level (1 to 3). There is. Regarding the character strings input to these shift registers 2, the candidates for the first character are “day” in order from the first candidate.
"White", "eyes", second character candidates are "tree""book" in order
"Large", the third character is "den", "thunder""fog", and the fourth character is "ki""island""kai" in order. The shaded area indicates that no character is stored.

第7図(a)〜(h)において、(a)→(b)→
(c)→(d)→(e)→(f)→(g)→(h)とい
う変化は、シフトクロック70が1回発生されるたびに起
こる変化を示している。そして、(a)〜(g)の各々
の状態で、カウンタクロック71と判定クロック72がN回
発生される。アドレスカウンタ4は、シフトクロック70
によってリセットされ、カウンタクロック71によってN
回カウントアップされるため、各状態で、単語辞書メモ
リ1からは、先頭の単語から末尾の単語まで順に、全単
語(N個)の表記が読み出され、n個(この例では4
個)の比較回路3において、それらと、第7図のシフト
レジスタの内容との照合が行なわれることになる。
In FIGS. 7A to 7H, (a) → (b) →
The change of (c) → (d) → (e) → (f) → (g) → (h) indicates a change that occurs each time the shift clock 70 is generated once. Then, in each of the states (a) to (g), the counter clock 71 and the determination clock 72 are generated N times. The address counter 4 has a shift clock 70
Reset by the counter clock 71
Since it is counted up times, in each state, the notation of all words (N pieces) is read from the word dictionary memory 1 in order from the first word to the last word, and n words (in this example, 4 words) are read.
7), the contents of the shift register shown in FIG. 7 are compared with each other.

その結果、各状態で、単語辞書メモリ1内の例えば次
のような単語に対して、判定回路6が出現を検出する。
そして、それらに対して、単語長算出回路の出力する単
語長は<>内の値となる。
As a result, in each state, the determination circuit 6 detects the appearance of the following words in the word dictionary memory 1, for example.
Then, for these, the word length output from the word length calculation circuit is a value within <>.

(a)該当なし (b)該当なし (c)該当なし (d)「日」<1>「日本」<2>「日本電気」<4> 「日大」<2>「白」<1>「白木」<2> 「目」<1> (e)「木」<1>「本」<1>「大」<1> (f)「電」<1>「電気」<2>「霧」<1> 「霧島」<2>「雷」<1> (g)「気」<1>「島」<1> このうち、状態(d)における第7図のシフトジスタ
内容と、単語辞書内の単語「日本」(=「日本△△」)
とを照合する際の、各比較回路3の動作を説明する。1
文字目比較回路は、「日本△△」と「日」と第1候補シ
フトレジスタの1文字目の「日」との一致により一致信
号30を発生する。2文字目比較回路は、「日本△△」の
「本」と第2候補シフトレジスタの2文字目の「本」と
の一致により一致信号30を発生する。3文字目比較回路
と4文字目比較回路はともに、「日本△△」の「△」
(残余記号)を検出して一致信号30と残余検出信号31と
を発生する。その結果、判定回路6は、すべての比較回
路3の一致信号30を受けて、単語の出現を検出すること
になる。また、そのとき、単語長検出回路8は、3文字
目比較回路と4文字目比較回路とから残余検出信号31を
受けて、2を単語長80の値として出力する。
(A) Not applicable (b) Not applicable (c) Not applicable (d) "Sun"<1>"Japan"<2>"NEC"<4>"Nihondai"<2>"White"<1>"Shiraki"<2>"Eyes"<1> (e) "Tree"<1>"Book"<1>"Large"<1> (f) "Den"<1>"Electricity"<2>"Mist<1> “Kirishima” <2> “Thunder” <1> (g) “Qi” <1> “Island” <1> Of these, the contents of the shift register in FIG. 7 in the state (d) and the word dictionary Word "Japan" (= "Japan △△")
The operation of each comparison circuit 3 when comparing and will be described. 1
The character comparison circuit generates a coincidence signal 30 when "Japan" and "Day" coincide with the first character "Day" of the first candidate shift register. The second character comparison circuit generates a coincidence signal 30 when the “book” of “Japan ΔΔ” and the second character “book” of the second candidate shift register match. Both the third character comparison circuit and the fourth character comparison circuit are "△" of "Japan △△".
(Residual symbol) is detected to generate a coincidence signal 30 and a residual detection signal 31. As a result, the decision circuit 6 receives the coincidence signals 30 of all the comparison circuits 3 and detects the appearance of the word. At that time, the word length detection circuit 8 receives the residual detection signal 31 from the third character comparison circuit and the fourth character comparison circuit and outputs 2 as the value of the word length 80.

なお、入力文字列長がKの場合、シフトレジスタ2内
での順送りは、少なくとも(K+n−1)回行なわれる
必要がある。したがって、入力装置5は、長さKの入力
文字列を入力した後、さらに、(n−1)回のダミーの
文字列入力を行なう必要がある。あるいは、コントロー
ラ7が、入力文字列の末尾を検出して、さらに、シフト
クロック70の1回とカウンタクロック71と判定クロック
72をN回ずつというサイクルを、(n−1)回繰り返す
ようにしてもよい。
When the input character string length is K, the sequential feeding in the shift register 2 needs to be performed at least (K + n-1) times. Therefore, after inputting the input character string having the length K, the input device 5 needs to further perform (n-1) dummy character string inputs. Alternatively, the controller 7 detects the end of the input character string, and further performs the shift clock 70 once, the counter clock 71, and the determination clock.
The cycle of 72 times N times may be repeated (n-1) times.

また、最初の(n−1)回の順送りの間(第7図では
(a)から(c)まで)は、入力文字列がシフトレジス
タ2の先頭まで到達していないので、単語辞書メモリ1
との照合を行なっても意味がない。そこで、その間は、
コントローラ7は、カウンタクロック71や判定クロック
ク2を発生せず、シフトクロック70のみを連続して発生
するようにしてもよい。
Further, during the first (n-1) times of sequential feeding (from (a) to (c) in FIG. 7), since the input character string has not reached the beginning of the shift register 2, the word dictionary memory 1
There is no point in matching with. So during that time,
The controller 7 may generate the shift clock 70 continuously without generating the counter clock 71 and the determination clock 2.

以上では、入力文字列の各文字にm個の候補が存在す
る一般的な場合の実施例を示したが、かな漢字変換にお
ける単語辞書検索や、ワードプロセッサで作成した文章
の解析を行なう際の単語辞書検索などでは、入力文字列
の各文字は1通りである(m=1)。第8図は、そのよ
うな場合を対象とした単語辞書検索装置の例を示すブロ
ック図である。この場合は、第2の従来技術と同様にシ
フトレジスタが1個でよく、本発明の特許請求の範囲か
らは除外している。構成要素・動作は第1図の実施例に
ついてm=1とすればよいので、説明を省略する。
In the above, an example of a general case in which there are m candidates for each character of the input character string has been shown. However, a word dictionary for word dictionary search in kana-kanji conversion or analysis of a sentence created by a word processor. In search or the like, each character in the input character string is one type (m = 1). FIG. 8 is a block diagram showing an example of a word dictionary search device for such a case. In this case, one shift register is sufficient as in the second prior art, and is excluded from the scope of the claims of the present invention. The constituent elements / operations may be m = 1 in the embodiment shown in FIG.

(発明の効果) 以上説明したように、本発明によれば、漢字のように
種類の多い文字から成る文字列に対して、各文字が複数
の候補をもっていても、高速に単語辞書との照合が可能
な単語辞書検索装置が得られる。特に、入力文字列の各
文字の候補数にも、単語辞書内の単語の表記長にもかか
わらず、入力文字列と単語辞書内の1つの単語との照合
が2クロック程度の間に行えることの効果が大きい。
(Effects of the Invention) As described above, according to the present invention, a character string composed of many kinds of characters such as Chinese characters can be collated with a word dictionary at high speed even if each character has a plurality of candidates. A word dictionary search device capable of In particular, even for the number of candidates for each character in the input character string, the input character string can be matched with one word in the word dictionary within about two clocks, regardless of the notation length of the word in the word dictionary. Is very effective.

さらに、実施例に示したように、本発明の各構成要素
は、少数のロジックICを組み合わせで実現できる。した
がって、LSI技術を利用すれば、非常に小型の装置とし
て実現できる点も長所である。それに加えて、第1の従
来技術のように、汎用計算機上のソフトウェアとして実
現されるのではなく、専用ハードウェア・特殊LSIとし
て実現できるため、クロックの周波数自体を、汎用計算
機に比べてかなり高く設定することが可能であり、この
点でも高速性が優れている。
Furthermore, as shown in the embodiments, each component of the present invention can be realized by combining a small number of logic ICs. Therefore, the advantage of using LSI technology is that it can be realized as a very small device. In addition, unlike the first conventional technology, it can be realized not as software on a general-purpose computer but as dedicated hardware / special LSI, so the clock frequency itself is considerably higher than that of a general-purpose computer. It is possible to set it, and the high speed is also excellent in this respect.

以上のような高速性から、本発明では、前述の第1の
従来技術のように単語辞書内で照合する単語数を制限せ
ず、単語辞書内の全単語との照合を行なっても、従来よ
り十分高速な単語辞書検索装置が得られると考えられる
が、その結果、単語辞書内が表記のコード順にソートさ
れている必要がないという長所も生じる。したがって、
単語の追加・削除が行なわれても、単語辞書を編成し直
す必要がなく、単語辞書のメンテナンスがきわめて容易
である。
Due to the high speed as described above, the present invention does not limit the number of words to be matched in the word dictionary as in the first conventional art described above, and even if matching is performed with all the words in the word dictionary, Although it is considered that a sufficiently high speed word dictionary search device can be obtained, as a result, there is an advantage that the word dictionary does not have to be sorted in the code order of the notation. Therefore,
Even if words are added or deleted, it is not necessary to reorganize the word dictionary, and maintenance of the word dictionary is extremely easy.

また、本発明の単語辞書検索装置では、入力文字列中
に単語辞書内にある単語が出現したことがわかるだけで
なく、その単語の長さも同時に得られるので、改めて単
語辞書から単語長を読み出す必要がなく、処理の効率が
高い。
Further, in the word dictionary search device of the present invention, not only can the word in the word dictionary appear in the input character string but also the length of the word can be obtained at the same time, so the word length is read again from the word dictionary. There is no need, and the processing efficiency is high.

【図面の簡単な説明】[Brief description of drawings]

第1図は本発明の第1の実施例の構成を示すブロック
図、第2図は単語辞書メモリ1の内容の例を示す図、第
3図はコントローラ7の入出力信号のタイムチャートの
例、第4図はシフトレジスタ2の構成例を示す図、第5
図は比較回路3の構成例を示す図、第6図は判定回路6
の構成例を示す図、第7図(a)〜(h)はシフトレジ
スタ2の内容の変化の例を示す図、第8図はm=1とし
た単語辞書検索装置の例を示すブロック図、第9図は単
語長算出回路8の構成例を示す図である。 図において、1……単語辞書メモリ、2……シフトレジ
スタ(第i候補シフトレジスタ)、3……比較回路(j
文字目比較回路)、4……アドレスカウンタ、5……入
力装置、6……判定回路、7……コントローラ、8……
単語長検出回路、30……一致信号、31……残余検出信
号、50……入力クロック、70……シフトクロック、71…
…カウンタクロック、72……判定クロックである。
1 is a block diagram showing the configuration of the first embodiment of the present invention, FIG. 2 is a diagram showing an example of the contents of the word dictionary memory 1, and FIG. 3 is an example of a time chart of input / output signals of the controller 7. , FIG. 4 is a diagram showing a configuration example of the shift register 2, and FIG.
FIG. 6 is a diagram showing a configuration example of the comparison circuit 3, and FIG. 6 is a determination circuit 6
7A to 7H are diagrams showing examples of changes in the contents of the shift register 2, and FIG. 8 is a block diagram showing an example of a word dictionary search device with m = 1. , FIG. 9 is a diagram showing a configuration example of the word length calculation circuit 8. In the figure, 1 ... Word dictionary memory, 2 ... Shift register (i-th candidate shift register), 3 ... Comparison circuit (j
(Character comparison circuit), 4 ... Address counter, 5 ... Input device, 6 ... Judgment circuit, 7 ... Controller, 8 ...
Word length detection circuit, 30 ... Match signal, 31 ... Residual detection signal, 50 ... Input clock, 70 ... Shift clock, 71 ...
… Counter clock, 72 …… Judgment clock.

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】各文字に対して第1から第m候補(mはm
≧2なる整数)までのm種類の候補が存在する文字列の
入力装置と、n文字分(nはn≧1なる整数)のデータ
巾をもつ各アドレスに単語の表記を1個ずつ格納してn
文字に満たない部分にはあらかじめ定めた残余記号を詰
めた単語辞書メモリ(登録単語数≧2)と、前記入力装
置によって1文字に対するm種類の候補が入力されるた
びにシフトクロック1回と前記単語辞書メモリ内の全単
語数に応じた回数の判定クロックとカウンタクロックと
を発生するコントローラと、前記シフトクロックに同期
したリセットと前記カウンタクロックに同期したカウン
トアップとを行なう前記単語辞書メモリのアドレスカウ
ンタと、前記入力装置によって入力された文字列の第1
・第2・………・第m候補に対応し前記シフトクロック
に同期した1文字ずつの順送りを行なう各々n文字分の
第1・第2・………・第m候補シフトレジスタと、前記
単語辞書メモリから読み出されるn文字分のデータの1
文字目・2文字目・………・n文字目に対応し該当位置
の文字が前記第1・第2・………・第m候補シフトレジ
スタのいずれかの同位置の文字または前記残余記号に一
致したとき一致信号と残余検出信号とを出力する1文字
目・2文字目・………・n文字目比較回路と、前記判定
クロックに同期して前記1文字目・2文字目・………・
n文字目比較回路のすべてから一致信号が検出された場
合に前記入力装置によって入力された文字列中に前記単
語辞書メモリ内に存在する単語が出現したと判定する判
定回路と、前記残余検出信号をもとに単語長を算出する
単語長算出回路とを備えたことを特徴とする単語辞書検
索装置。
1. First to mth candidates (m is m) for each character
An input device for a character string having m types of candidates up to ≧ 2) and one word notation at each address having a data width of n characters (n is an integer where n ≧ 1) are stored. N
A word dictionary memory (the number of registered words ≧ 2) in which predetermined residual symbols are filled in a portion less than the number of characters, and one shift clock each time m types of candidates for one character are input by the input device. A controller that generates a determination clock and a counter clock the number of times corresponding to the total number of words in the word dictionary memory, and an address of the word dictionary memory that performs reset in synchronization with the shift clock and count-up in synchronization with the counter clock. A counter and a first character string input by the input device
Second, ... ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,, The mth candidate shift register for n characters each of which is sequentially forwarded one character at a time corresponding to the mth candidate and synchronized with the shift clock. 1 of data for n characters read from the word dictionary memory
The character, the second character, ..., The character at the corresponding position corresponding to the nth character is the character at the same position in any of the first, second, ... When the first character, the second character, ..., And the nth character comparing circuit that outputs a coincidence signal and a residual detection signal, and the first character, the second character, ... In synchronization with the determination clock, ...... ・
a determination circuit for determining that a word existing in the word dictionary memory appears in the character string input by the input device when a match signal is detected from all the n-th character comparison circuits; and the residual detection signal. And a word length calculating circuit for calculating a word length based on the above.
JP1173443A 1989-07-04 1989-07-04 Word dictionary search device Expired - Lifetime JP2526670B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1173443A JP2526670B2 (en) 1989-07-04 1989-07-04 Word dictionary search device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1173443A JP2526670B2 (en) 1989-07-04 1989-07-04 Word dictionary search device

Publications (2)

Publication Number Publication Date
JPH0337766A JPH0337766A (en) 1991-02-19
JP2526670B2 true JP2526670B2 (en) 1996-08-21

Family

ID=15960569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1173443A Expired - Lifetime JP2526670B2 (en) 1989-07-04 1989-07-04 Word dictionary search device

Country Status (1)

Country Link
JP (1) JP2526670B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60147888A (en) * 1984-01-12 1985-08-03 Comput Basic Mach Technol Res Assoc Postprocessing of character recognition and device
JPS63261421A (en) * 1987-04-17 1988-10-28 Mitsubishi Electric Corp Character string processor
JPS63261422A (en) * 1987-04-17 1988-10-28 Matsushita Electric Ind Co Ltd Character string collating device

Also Published As

Publication number Publication date
JPH0337766A (en) 1991-02-19

Similar Documents

Publication Publication Date Title
JP3143079B2 (en) Dictionary index creation device and document search device
JPH07160389A (en) Data input workstation
US5138669A (en) Range-conditional character string retrieving method and system
JPH0533422B2 (en)
US5560037A (en) Compact hyphenation point data
JP2526670B2 (en) Word dictionary search device
JPH0670788B2 (en) Nest dictionary search device
JP2526678B2 (en) Word dictionary search device
JPH0670789B2 (en) Word dictionary search device
JPH04340166A (en) Retrieval device for word dictionary
JP2792147B2 (en) Character processing method and device
KR100328963B1 (en) Korean stemming method and device thereof
JPH0337754A (en) Word dictionary retriever
JPH0869474A (en) Similar character string retrieval device
JPH03110676A (en) Word dictionary retrieval device
Mustafa et al. A backward algorithm for lexical analysis of textual Arabic words
JP2744241B2 (en) Character processor
JP2004318753A (en) Device and method for converting word and phrase to data
JPS62256075A (en) Dictionary retrieving system
JP3139624B2 (en) Morphological analyzer
JPH0131229B2 (en)
JPH05324610A (en) Address notation chinese character inputting device
JPH04278664A (en) Address analysis processor
JPH01205267A (en) Word dictionary retrieving device
Lianga et al. Technical Report Classification for Selected Spell Checkers and Correctors