JPH0337754A

JPH0337754A - 単語辞書検索装置

Info

Publication number: JPH0337754A
Application number: JP1173444A
Authority: JP
Inventors: Shunichi Fukushima; 俊一福島
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1989-07-04
Filing date: 1989-07-04
Publication date: 1991-02-19

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、入力文字列とｉｉｉ、語辞書とを照合して、
入力文字列において、単語辞書内に存在する単語が１°
Ｕ現した部分を検索する単語辞書検索装置に関するもの
である。特に、入力文字列の各文字が＋１数の候補をも
つような場合にも適用できる単語辞書検索装置に関する
ものである。

入力文字列の各文字に複数の候補がなく一意な場合の単
語辞書検索装置は、かな漢字変換装置においてキーボー
ドから入力されたかな文字列に対する単語辞荘検索を行
なう部分、機械翻訳装置・文音声変換装置・文章校正装
置などにおいてワードブロセッ・す“などて作成された
漢字かな混じり文字列に対する単１梧辞書検索を行なう
部分などに用いられている。

入力文字列の各文字に複数の候補がある場合の単語辞１
！Ｊ検索装置は、音声認識装置や文字認識装置などにお
いて、認識結果の複数の候補文字から最も跪からしい文
字を選択するための単語辞書検索部などに用いられてい
右。

（従来の技術）従来、かな漢字変換′Ａ置０文詐声変換装置などにおい
て用いられている単Ｎ！目”ｒ　書検索方式は、基本的
に、文献二「計Ｓｔ：　ａｔによるカナ漢字変換］（和
訳・江原、ＮＨＫ技術研究、第２５巻第５号、２３頁〜
６０頁、１９７３年）に示されている方式を引き継いで
いる。すなわち、入力された文字列から部分文字列を切
り出して、その部分文字列に表記（かな漢字変換では「
かな表記」すなわち「読みがなＪ）の一致する単語を単
語辞書内から検索するという処理を行なう（これを、以
下では、第１の従来技術と呼ぶことにする。）例えば、「文章を解析する］という漢字かな混じり文字
列に対する単語辞１ｕ゛検索を行なう場合は、１文字１
」、２文字目など各文字位置から始まる単語を検索する
ために、「文章を解析する］　「章を解析する」　「を
解析する］　「解析する］　「析する］　「するＪ　「
る」といった部分文字列を別々に切り出す。そして、各
部分文字列について、さらに、末尾を削った部分文字列
も生成して、その各々を単語辞書から検索する。すなわ
ち、１文字目から始まる単語を検索する際には、「文章
を解析する」　「文ｉτを解析すＪ　Ｆ文章を解析Ｊ　
「文章を解」　「文章をＪ　「又全」「又Ｊといった部
分文字列に関して、検索を次々に繰り返し、２文字目か
ら始まる単語を検索する際には、「章を解析するＪ「章
を解析す］　「章を解析」　「章を解Ｊ　「章をＪｒＵ
といった部分文字列に関して、検索を次々に繰り返すわ
けである。その結果、下線を引いた部分文字列などにつ
いて、表記の一致する単語が見つかることになる。

この第１の従来技術では、複数の部分文字列に対して単
語辞身の検索を繰り返すわけであるが、単語辞書の構成
を工夫しておくことによって、１つの部分文字列に対す
る検索の所要時間の短縮を図っている１１例えば、単記
辞許内の単語をあらかじめソートしておいて二分検索を
行なったり、１文字目・２文字１ｋｌなど文字ごとに分
割して共通な部分をまとめて本構造として１文字ずつの
照合を行なうなどである３、このような辞書の構造と検
索方式の工夫については、文献：　”Ｔｈｅ　Ａｒｔ　
ｏｆ　ＣｏｍｐｕｔｅｒＰｒｏｇｒａｍｍｉｎｇ　３：
　　Ｓｏｒｔｉｎｇ　ａｎｄ　Ｓｅａｒｃｈｉｎｇ”　
（Ｄ、　Ｅ。

Ｋｎｕｔｈ、　Ａｄｄｉｓｏｎ−Ｗｅｓｌｅｙ、　１９
７３）に多く示されている。

ただし、この第１の従来技術は、コンピュータ上の逐次
型プログラムとしての実現を想定しており、所要時間短
縮の工夫は逐次処理の枠内で工夫である。したがって、
入力文字列のある部分文字列と単語１ｉ１鼾内のある単
語の表記の文字列とを比較する処理などは、１文字ずつ
逐次行なわれる。例えば「文章を」という部分文字列と
単語辞書内の「文章」という単語の比較は、「文」と１
文」とを照合し、一致したところでＦ章］と「章」とを
照合し、次に、Ｆを」に対して不一致となり失敗すると
いうように、１文字ずつ照合処理の繰り返しである。

また、第１の従来技術では、入力文字列の各文字にｍ個
ずつ候補があるような場合は、あらかじめ、長さＬの部
分文字列に剥して、候補を組み合せたｍＬ通りの文字列
を生成する必要がある。そして、それらの各々について
、さらに、上記のように末尾を削った部分文字列を４Ｌ
或し゛Ｃ１単語辞書内を検索する、二とになる。

一力、ある長さＬの文字列と入力文字列との比較の際に
、１文字ずつの照合を繰り返すのではなく、対応する文
字位置のＬ組の照合を同時に行なうことが考えられてい
る。その際、入力文字列をシフトレジスタに格納してお
けば、照合の位置をずらすことが、入力文字列から再度
部分文字列を切り出すのではなく、シフトレジスタ内の
全文字を一度に１文字ずらすことで実現できるようにも
なる。この第２の従来技術は、特開昭６３−２６１４２
１号公報「文字列処理装置］および特開昭６３−２６１
４２２号公報「文字列ｊ！ｑ合装置Ｊに述べられている
。なお、この第２の従来技術では、入力文字列に複数の
候補は存在せず、検索される文字列も１通りに限られる
（単語辞書のように多数ではない）。

特開昭６２−６７６３６号公報「照合方式Ｊおよび文献
：「音声１コ本語入カシステムにおける高速な言語処理
のための辞書照合アルゴリズム」（浜口・鈴木、電子情
報通信学会論文誌、第Ｊ７０−Ｄ巻第８号、１５８９頁
〜１５９６ｓ′ｆ　１９８７年）には、第３のｉ；を来
技術が示されている。

第３の従来技術では、入力文字列に複数の文字候補があ
ることを想定している。まず、文字の種類をＭ（例えば
、ＪＩＳの文字コード表では、ひらがなについてＭ＝８
３）とすると、１文字Ｅ１・２文字目など各文字位置に
、Ｍビットのメモリを１個ずつ用意し、複数の候補文字
に対応する各ビットを１にしておく。

そして、照合時は、単語辞１５°内の各単語について、
単語の表記の１文字目・２文字目など文字位置ごとに、
対応するＭビットメモリがら、対応する文字のビット内
容（１またはＯ）を同時に読み出す。すべてのＭビット
メモリから１が読みだされたら、入力文字列中に単語辞
穆内にある単語が出現したことになる。

（発明が解訣しようとする課題）第１の従来技術には、まず第１に、前述のように、多数
の部分文字列に対する単語辞書検索を繰り返さねばなら
ないという欠点がある。この欠点は、入力文字列の各文
字に複数の候補がある場合に、特に宣（著になる。長さ
Ｋの入力文字列の各文字にｍ個ずつ候補がある場合、最
エモの部分文字列の長さをＬどすると（通常、単語辞書
内の最長の単語の長さをＬとする）、最大（ｍ　ＸＬＸ
Ｋ）個の部分文字列に対する検索を繰り返す必要が坐す
る。通常、あらかじめ条件を定めて、不要な部分文字列
の検索を避けるようにするので、（ｍＸＬＸＫ）個とい
うのは最悪の場合であるが、それでも検索の回数はがな
り多くなる。

第１の従来技術の第２の欠点は、ある部分文字列と単語
辞書内のある単語の表記の文字列との比較を、１文字ず
つ順に行なうため、比較に時間がががるということであ
る。

第２の従来技術では、第１の従来技術の第２の欠点に対
処している。しかし、第２の従来技術は、入力文字列に
複数の候補がある場合に適用できない。

また、検索される文字列も１通りに限られ、単語辞書の
ように多数の文字列と比較を行なうことを考えると、単
語辞書検索の各単語の表記の長さの異なりが問題となっ
て適用できない。

第３σ）従来技術は、第１の従来技術の２つの欠点に対
処し°Ｃいる。しかし、入力文字列を記憶するために、
文字の種類だけのビット数をもったメモリを、文字列長
だけ用意する必要があるため、文字の種類が多数の場合
はメモリサイズがかなり大きくなっ°〔しまう問題があ
る。かな漢字変換や音声認識の場合は、入力文字列がひ
らがな（あるいは音素文字）で１００種角程度に限定さ
れるので、あまり問題にならないが、漢字かな混じり文
字列を対象とした文音声変換や機械翻訳など場合は、漢
字を含み文字の種類が３０００〜４０００種類にもおよ
ぶため、メモリが大きくなって問題になる。

また、第３の従来技術では、入力された文字列の先頭か
ら始まる単語の検索しか行なわないため、２−文字目か
ら始まる単語や、３文字目から始まる単語などを検索す
る場合には、入力文字列のメモリへの登録を、やり直す
必要が生じるという問題もある。

さらに、第３の従来技術では、入力文字列の先頭からあ
る長さまで−・致した単８Ｌｒが出現したことばわかる
が、その長さがいくつであるかは、その単語の単語辞書
内アドレスを記憶しておき、もう−度改めて、単語辞書
内のその単語の表記を調べて求める必要があった。

本発明の目的は、上記のような従来技術の欠点を除去し
、入力文字列の各文字に複数の候補があっても、高速に
単語辞書との照合が可能な単語辞書検索装置を提供する
ことである。

（課題を解決するための手段）本発明は、各文字に対して第１から第ｍ候補（ｍはｍ≧
１なる整数）までのｍ種類の候補が存在する文字列の入
力装置と、ｎ文字分（ｎはｎ≧１なる整数）のデータ巾
をもつ各アドレスに単語の表記を１個ずつ格納してｎ文
字に満たない部分にはあらかじめ定めた残余記号を詰め
た単語辞書メモリと、前記単語辞書メモリのアドレスカ
ウンタと、前記単語辞書メモリについて単語の先頭文字
に対する単語の存在範囲を示したインデックスメモリと
、前記入力装置によって入力された文字列の第１・第２
・・・・・・・第ｍ候補に対応し１文字ずつの順送りを
行なう各々ｎ文字分の第１・第２・・・・・・・第ｍ候
補シフトレジスタと、前記入力装置によって１文字に対
するｍ種類の候補が入力されるたびにシフトロック１回
と前記インデックスメモリにより前記第１・第２・・・
・・・・第ｍ候補シフトレジスタの各１文字目を先頭と
する単語の存在範囲を順次求めて前記アドレスカウンタ
に先頭アドレスをセットするセットクロックと単語数に
応じた回数の判定クロツタとカウンタクロックとを出力
するコントローラと、前記単語辞書メモリから読み出さ
れるｎ文字分のデータの１文字目・２文字目・・・・・
・・ｎ文字目に対応し該当位置の文字が前記第１・第２
・・・・・・・第ｍ候補シフトレジスタのいずれかの同
位置の文字に一致したとき一致信号を出力し前記残余記
号に一致したとき一致信号と残余検出信号とを出力する
１文字目・２文字目・・・・・・・ｎ文字目比較回路と
、前記１文字目・２文字目・・・・・・・ｎ文字目比較
回路のすべてから一致信号が検出された場合に前記入力
装置によって入力された文字列中に前記単語辞書メモリ
内に存在する単語が出現したと判定する判定回路と、前
記残余検出信号をもとに単語長を算出する単語長算出回
路とを備えたことを特徴とする単語辞書検索装置である
。

（実施例）図面を用いて、本発明の構成・作用を説明する。

第１図は本発明の単語辞書検索装置の第１の実施例の構
成を示すブロック図である。以下、まず、各構成要素を
説明する。

入力装置５は、各文字に対して第１候補から第ｍ候補（
ｍはｍ≧１なる整数）までのｍ種類の候補が存在する文
字列を入力する装置であり、例えば、音声認識装置や文
字認識装置などである。入力装置５は、各文字に対する
ｍ個の候補を、同士に出力し、その出力のタイミングを
入力クロック５０によってコントローラ７へ伝える。

単語辞書メモリ１は、ｎ文字分（ｎはｎ≧ｌなる整数）
のデータ巾をもつ各アドレスに、単語の表記を１個ずつ
格納して、ｎ文字に満たない部分には、あらかじめ定め
た残余記号を詰めたものである。第２図は、単語辞書メ
モリ１の内容の例を示す図である（第２図ではｎ＝４と
している）。第２図において、Δが残余記号を表わして
いる。第２図の単語辞書メモリ１のアドレスをａとする
と、「１」本△△］というｎ（＝　４）文字が同１１．
テに読み出される。単語辞書メモリ１は、ＩＣメモリな
どを用いて実現できる。通常、漢字コードは１６ビツト
で表現されるので、第２図の単語辞１メモリ１のデータ
巾は、１６　Ｘ　４　＝　６４ビツトである。現在のＩ
Ｃメモリでは、同時に読み出せるデータ「１】が８ビッ
ト程度であるから、そのようなＩＣメモリを８個並列に
並べて実現できる。

インデックスメモリ８は、単語辞書メモリ１について、
ある文字を表記の先頭にもつ単語群の存在範囲を示した
メモリである。第９図（ａ）は、インデックスメモリ８
の内容の例を示す図である。第９図のインデックスメモ
リ８は、ある文字に対するアドレスに、１１４語辞書メ
モリ１において、その文字を表記の先頭にもつ単語群の
存在する先頭アドレス８００と、その単語群の単語数８
０１とが記憶されている。このようなインデックスメモ
リ８は、従来のＩＣメモリを用いて実現できる。第９図
（ｂ）は、第９図（ａ）のインデックスメモリ８の内容
に対応する単語辞書メモリ１の内容の例である。単品辞
書メモリｌ内では、同・−の文字を表記の先頭にもつ単
語のアドレスが連続するように果められており、インデ
ックスメモリ８からイｑられる先頭アドレス８００と単
語数８０１とから、その存イＥ純囲（単語辞書メモリ１
内のアドレス１沌囲）が求められる。例えば、第９図（
ａ）から、　ＮＪＪに対して、先頭アドレス８００の値
としてａｌ、単語数８０１の値としてＮ１とが得られる
が、これは、第９図（ｂ）に示されているように、単語
辞書メモリ１内でｒＢＪで始まる単語は、アドレスａ１
からＮ１個、すなわち、アドレスａ１からアドレス（ａ
１＋Ｎ１−１）までの範囲に存在することを意味する。

なお、インデックスメモリ８について、ある文字に対す
るアドレスは、その文字の文字コードをそのままアドレ
ス値とするのが般も単純であるが、その文字の文字コー
ドになんらかの演算をほどこした結果の値をアドレス値
とするなどの方法も考えられる。

コントローラ７は、入力装置５によって１文字に対する
ｍ槌類の候補が入力されるたびに、インデックスメモリ
８より、ｍ個のシフトレジスタ２の各１文字目を先’ｊ
ｆｉとする単語の存在範囲を順次求めて、アドレスカウ
ンタ４を制御する。第１図では、それに加えて、シフト
レジスタ２の舶送りや、判定回路６の判定のタイミング
なども制御するように構成している。１第３図は、コン
トローラ７に人出力される制御信シ３・のタイムチャー
トの例である。第３図において、入力クロック５０は入
力装置５から入力される制御信号、シフトクロック７０
はシフトレジスタ２へ出力される制御信号、セットクロ
ック７３とカウンタクロック７１はアドレスカウンタ４
へ出力される制御信号、判定クロソク７２は判定回路６
へ出力される制御信号である。まず、シフトクロック７
０は入力クロック５０が１回入力されるたびに１回出力
される（大力クロック５０をそのままシフトクロック７
０として出力する）。このシフトクロック７０は、入力
装置５からシフトレジスタ２へ１文字読み込ませ、がっ
、シフトレジスタ２内の文字列を１文字ずつ順送りさせ
るためのものである。セットクロック７３は、シフトク
ロックメモリ７０に引き続いて、ｍ回出力される。この
セットクロック７３は、インデックスメモリ８から読み
出される先頭アドレスを、アドレスカウンタ４にセット
するための信号である。第１候補シフトレジスタの１文
字目の文字、第２候補シフトレジスクの１文字［］の文
字、・・・・・、第ｍ候補シフトレジスタの１文字目の
文字の各々について、合計出回繰り返される。セットク
ロック７３が１回出力された後に、判定クロック７２と
カウンタクロック７１とが交互に出力される。これらの
出力回数は、セットクロック７３でセットされた先頭ア
ドレスと同時にインデックスメモリ８から読み出された
単語数と同一回数である。第３図のタイムチャートでは
、第１候補シフトレジスタの１文字目、第２候補シフト
レジスタの１文字目、・・・・・、第ｍ候補シフトレジ
スタの１文字目の各々に対して、その文字を先頭文字と
する単語辞書メモリ１内の単語数が、Ｎ１個、Ｎ２個、
Ｎ個であったことを示している。ただし、カウンタクロ
ック７１は判定クロック７２よりも１回少なくともよい
１．このような夕・ｆムチヤード通りに動作するコント
ローラ７は、当業者において容易に実現可能である。

アドレスカウンタ４は、セットクロック７３に同期して
コントローラ７から指定されたカウンタ値（先頭アドレ
ス）をセットし、カウンタクロック７１に同期してカウ
ントアツプを行なうカウンタである。そして、カウンタ
値を単語辞書メモリ１のアドレス値として出力する。従
来のカウンタＩＣで実現できる。

第ｉ（ｄ補シフトレジスタ２は、入力装置５によって入
力された文字列の第ｉ候補（ｉは１≦ｉ≦ｍなる整数）
を、シフトクロック７０に同期して１文字ずつ順送りし
ながら、ｎ文字分格納するシフトレジスタである。この
シフトレジスタ２は、入力文字列の各文字に対するｍ個
の候補の各々にｊ＝Ｊシて設けられており、第１候補シ
フトレジスタ、第２候補シフトレジスタ、・・・・・、
第１候補シフトレジスタのｍ個がある。

第４図は各シフトレジスタ２の槽底例を示した図である
。１文字をｄビットで表現している場合、第１候補シフ
トレジスタ２は、第４図のように、シフトクロック７０
に同期した（ｄＸｎ）個のＤフリップフロップで実現で
きる（ｄ個並列に並べたものを、ｎ個直列に接続する）
。並列に接続したｄ（ｌｉ！ｉｆが１文字に対応し、そ
の出力はまとめて比Ｉ咬回路３へ送られる。

ｊ文字目比較回路３は、アドレスカウンタ４の示す１つ
のアドレスに対して単δをロγ１Ｊ：メモリ１から読み
出される１１文字分のデータの、ｊ番目ｑは１≦ｊ≦ｎ
なる整数）の文字が、ｍ個のシフトレジスタ２のいずれ
かのｊ番目の文字に一致したときに、一致信号３０を出
力し、残余記号に一致したときに一致信号３０と残余検
出記号３１とを出力する回路である。この比較回路３は
、単語辞書メモリ１のデータ巾ｎ文字の各々に対して設
けられており、１文字目比較回路、２文字目比較回路、
・・・・・、ｎ文字目比較回路のｎ個がある。

第５図は、ｊ文字目比較回路３の構成例を示した図であ
る。１文字をｄビットで表現して、シフトレジスタ２が
ｍ個設けられている場合、ｊ文字目比較回路３は、第５
図のように、（ｍ＋１）個のｄビット比較器と、１個の
ＯＲゲートで構成できる。ｍ個のｄビット比較器は、単
語辞書メモリ１から読み出されているｎ文字データのう
ちｊ文字目と、各シフトレジスタ２のｊ文字目とを比較
し、残りの１個のｄビット比較器は、単１ｉｉＰ絆註メ
モリ１から読み出されているｎ文字データのうちのｊ文
字目が残余記号であるか否かを調べる。瓜終的なＯＲデ
ートの出力では、この（ｍ＋１）個の比較器のいずれか
で、一致が検出されたときに、一致信号３０力咄力され
る。また、単語辞書メモリ１から読み出されているｎ文
字データのうちのｊ文字［」が残余記号であるか否かを
調べるとｄビット比校器の出力は、そのまま残余検出記
号とする。

判定回路６は、判定クロック７２に同期して、ｎ個の比
較回路のすべてから一致信号が検出された場合に、入力
装置５によって入力された文字列中に単語辞書メモリ１
内に存在する単語が出現したと判定する回路である。第
６図は、判定回路６の構成例を示す図である。判定回路
６は、第６図のように、１個のＡＮＤゲートと１個のＤ
フリップフロップで実現できる。

単語長算出回路９は、ｎ個の比較回路３から出力される
残金検出信号３１をもとに単語長９０を算出する回路で
ある。第１０図は、単語長算出回路９の構成例を示す図
である。第１０図の回路では、ｊ文字目比較回路（ここ
では２≦ｊ≦ｎ）から残余検出信号３１が届いて、（ｊ
−１）文字目比較回路から残余検出信号３１が届いてい
ないときに、（ｊ−１）を単語長９０として出力する。

また、１文字目比較回路からｎ文字目比較回路のいずれ
からも残余検出信号３１が届かないときには、ｎのイ直
を単語長９０として出力する。・１文字目比較回路から
ｎ文字目比較回路のすべてから残余検出信号３１が届く
場合は、０を単語長９０として出力する（ただし、これ
は、単語辞書メモリ１内に単語長Ｏの単語が含まれてい
ることになり、通常は考えられないケースである）。

次にこの実施例の動作を例を用いて説明する。

第７図（ａ）〜（ｈ）は、ｎ＝４、ｍ＝３で入力文字列
の長さが４のときの、第１候補シフトレジスタ・第２候
補シフトレジスタ・第３候補シフトレジスタの内容の変
化の例を示した図である。第７図の３×４のマトリック
スは、１行が各シフトレジスタ２の内容に対応しており
、行方向が文字位置（１〜４）、列方向が候補レベル（
１〜３）を表わしている。これらのシフトレジスタ２に
入力されている文字列は、１文字目の候補は第１候補か
ら順にｒ日Ｊ　「白１１」Ｊ、２文字目の候補は順１こ
「本１１本」　Ｆ大］、３文字目は順に「電］「雷」　
ｒ霧１．４文字目は順に「気１　ｒ島Ｊｒ戒］である。

、斜線部分は文字が格納されていないことを表わす。

第説１において、（ａ）−＋（ｂ）−＋（ｃ）−＋（ｄ
）−＋（ｅ）−＋（ｆ）−＋（ｇ）−＋（ｈ）という便
化は、シフトクロック７０が１回発生されるたびに起こ
る変化を示している。そして、（ａ）〜（ｇ）の各々の
状態において、ｎ個（この例では４個）の比較回路３で
、単語辞書メモリ１内の単語と第７図のシフトレジスタ
の内容との照合が行なわれる。その際、単語辞書メモリ
ｌ内の全単語とシフトレジスタ２とが照合されるのでは
なく、そのときの各シフトレジスタ２の１文字をもとに
して、単語辞書メモリ１内の照合する単語数を制限する
。例えば、状態（ｄ）では、３個のシフトレジスタ２の
内容と、まず、Ｆ日Ｊで始まる単語辞書メモリ１内の単
語群とが照合され、次に、「白Ｊで始まる単語群と照合
され、最後に、「目」で始まる単語群と照合される。こ
のような単語群の存在範囲は、インデックスメモリ８か
ら得ることができ、コントローラ７が単語辞註メモリ１
のアドレスカウンタ４を制御する。

その結果、各状態で、単語δ゛を書メモリ１内の例えば
次のような単語に対して、判定回路６が出現を検出する
。そして、それらに対して、単語長算出回路９の出力す
る単語長はく〉内の値となる。

（ａ）該当なしくｂ）該当なしくＣ）該当なしくｄ）「日Ｊ　＜１＞　１日本Ｊ　＜２＞　ｒ日本電気
］く４〉１日入Ｊ　＜２＞　ｒ白Ｊ＜１＞ｒ白木］く２
〉「目」く１〉（ｅ）「木Ｊ　＜１＞　ｒ本Ｊ　＜１＞　「大］く１〉
（ＯＵ電Ｊ　＜１＞　１電気Ｊ　＜２＞　ｒ霧１く１〉
「霧島Ｊ　＜２＞　１雷］くｌ〉（ｇ）「気Ｊ　＜ｉ＞　ｒ島］く１〉このうち、状態（ｄ）における第７図のシフトレジスタ
内容と、単語辞場内の単語１日本］（＝１日本△△」）
とを照合する際の、各比較回路３の動作を説明する。１
文字目比較回路は、「日本△△］の１日」と第１候輔シ
フトレジスタの１文字目の「日１との一致により一致信
号３０を発生ずる。２文字目比較回路は、「日本△△」
の「本１と第２候補シフトレジスタの２文字目の「本］
との一致により一致信号３０を発生ずる。３文字１］比
較回路と４文字目比較回路はともに、「日本△△Ｊの「
△」（残余記号）を検出して一致信号３０を発生ずる。

その結果、判定回路６は、すべての比較回路３の一致信
号３０を受けて、単語の出現を検出することになる。ま
た、そのとき、単語長検出回路９は、３文字目比較回路
と４文字目比較回路とから残余検出信号３１を受けて、
２を単語長９０の値として出力する。

なお、入力文字列長がＫの場合、シフトレジスタ２内で
の順送りは、少なくとも（Ｋ＋ｎ−１）回行なわれる必
要がある。したがって、入力装置５は、長さＫの入力文
字列を入力した後、さらに、（ｎ−１）回のダミーの文
字列入力を行なう必要がある。あるいは、コントローラ
７が、入力文字列の末尾を検出して、さらに、シフトク
ロック７０の１回に対応するサイクルを、（ｎ−１）回
繰り返すようにしてもよい。

また、最初の（ｎ−１）回の順送りの間（第７図では（
ａ）から（ｅ）まで）は、入力文字列がシフトレジスタ
２の先頭までｊ・１ｊ達していないので、単語辞書メモ
リ１との照合を行なっても意味がない。そこで、その間
は、コントローラ７は、セットクロック７３やカウンタ
クロック７１や判定クロック７２を発生せず、シフトク
ロック７０のみを連続して発生ずるようにしてもよい。

以上では、入力文字列の各文字にｍ個の候補が存在する
一般的な場合の実施例を示したが、かな漢字変換におけ
る単語辞書検索や、ワードプロセッサで作成した文章の
解析を行なう際の単語辞書検索などでは、入力文字列の
各文字は１通りである（ｍ＝１）。第８図は、そのよう
な場合を対象とした第２の実施例を示すブロック図であ
る。この場合は、シフトレジスタ２が１個でよい。構成
要素・動作は第１図の実施例についてｍ＝１とすればよ
いので、説明を省略する。

（発明の効果）以上説明したように、本発明によれば、漢字のように種
類の多い文字から戊る文字列に対して、各文字が複数の
ＩＸ？市をもっていＣも、高速に単語辞書との照合が可
能な単語辞書検索装置が得られる。特に入力文字列の各
文字の候補数にも、単語辞書内の単語の表記長にもかか
わらず、入力文字列と単語辞雪内の１つの単３１Ｆどの
照合が２クロック程度の間に行えることの効果が大きい
。

さらに、実施例に示したように、本発明の各構成要素は
、少数のロジックＩＣを組み合わせで実現できる。した
がって、ＬＳＩ技術を利用すれば、非常に小型の装置と
して実現できる点も長所である。

それに加えて、第１の従来技術のように、汎用計算機上
のソフトウェアとして実現されるのではなく、専用ハー
ドウェア・特殊ＬＳＩとして実現できるため、クロック
の周波数自体を、汎用計算機に比べてかなり高く設定す
ることが可能であり、この点でも高速性が優れている。

また、本発明の単語辞書検索装置では、入力文字列中に
単語辞書内にある単語が出現したことがわかるだけでな
く、その単語の長さも同時に得られるので、改めて単語
辞書から単語長を読み出す必要がなく、処理の効率が高
い。

【図面の簡単な説明】

第１図は本発明の第１の実施例の構成を示すブロソク図
、第２図は単語辞書メモリ１の内容の例を示す図、第３
図はコントローラ７の人出力信号のタイムチャートの例
、第４図はシフトレジスタ２の構成例を示す図、第５図
は比較回路３の構成例を示す図、第６図は判定回路６の
構成例を示す図、第７図（ａ）〜（ｈ）はシフトレジス
タ２の内容の変化の例を示す図、第８図は本発明の第２
の実施例を示すブロソク図、第９図（ａＸｂ）はインデ
ックスメモリ８の内容の例と単語辞書メモリ１との対応
を示す図、第１０図は単語長算出回路９の構成例を示す
図である。図において、１・・・単語辞書メモリ、２・・・シフト
レジスタ（第ｉ候補シフトレジスタ）、３・・・比較回
路匂文字目比較回路）、４・・・アドレスカウンタ、５
・・・入力装置、６０．・判定回路、７・・・コントロ
ーラ、８・・・インデックスメモリ、９・・・ｊｉｊ、
語長検出回路３０・・・−・致信号、５０・・・入力ク
ロック、７０・・シフトりＩコック、７１・・・カウン
タクロソク、７２・・・判定クロック、７３・・・セッ
トクロック、７４・・・先頭アドレスである。

Claims

【特許請求の範囲】

各文字に対して第１から第ｍ候補（ｍはｍ≧１なる整数
）までのｍ種類の候補が存在する文字列の入力装置と、
ｎ文字分（ｎはｎ≧１なる整数）のデータ巾をもつ各ア
ドレスに単語の表記を１個ずつ格納してｎ文字に満たな
い部分にはあらかじめ定めた残余記号を詰めた単語辞書
メモリと、前記単語辞書メモリのアドレスカウンタと、
前記単語辞書メモリについて単語の先頭文字に対する単
語の存在範囲を示したインデックスメモリと、前記入力
装置によって入力された文字列の第１・第２・・・・・
・・第ｍ候補に対応し１文字ずつの順送りを行なう各々
ｎ文字分の第１・第２・・・・・・・第ｍ候補シフトレ
ジスタと、前記入力装置によって１文字に対するｍ種類
の候補が入力されるたびにシフトロック１回と前記イン
デックスメモリにより前記第１・第２・・・・・・・第
ｍ候補シフトレジスタの各１文字目を先頭とする単語の
存在範囲を順次求めて前記アドレスカウンタに先頭アド
レスをセットするセットクロックと単語数に応じた回数
の判定クロックとカウンタクロックとを出力するコント
ローラと、前記単語辞書メモリから読み出されるｎ文字
分のデータの１文字目・２文字目・・・・・・・ｎ文字
目に対応し該当位置の文字が前記第１・第２・・・・・
・・第ｍ候補シフトレジスタのいずれかの同位置の文字
に一致したとき一致信号を出力し前記残余記号に一致し
たとき一致信号と残余検出信号とを出力する１文字目・
２文字目・・・・・・・ｎ文字目比較回路と、前記１文
字目・２文字目・・・・・・・ｎ文字目比較回路のすべ
てから一致信号が検出された場合に前記入力装置によっ
て入力された文字列中に前記単語辞書メモリ内に存在す
る単語が出現したと判定する判定回路と、前記残余検出
信号をもとに単語長を算出する単語長算出回路とを備え
たことを特徴とする単語辞書検索装置。