JPH0337764A - 巣語辞書検索装置 - Google Patents

巣語辞書検索装置

Info

Publication number
JPH0337764A
JPH0337764A JP1173441A JP17344189A JPH0337764A JP H0337764 A JPH0337764 A JP H0337764A JP 1173441 A JP1173441 A JP 1173441A JP 17344189 A JP17344189 A JP 17344189A JP H0337764 A JPH0337764 A JP H0337764A
Authority
JP
Japan
Prior art keywords
character
word
word dictionary
memory
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1173441A
Other languages
English (en)
Other versions
JPH0670788B2 (ja
Inventor
Shunichi Fukushima
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP1173441A priority Critical patent/JPH0670788B2/ja
Publication of JPH0337764A publication Critical patent/JPH0337764A/ja
Publication of JPH0670788B2 publication Critical patent/JPH0670788B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、入力文字列と単語辞書とを照合して、入力文
字列において、単語辞書内に存在する単語が出現した部
分を検索する単語辞書検索装置に関するものである。特
に、入力文字列の各文字が複数の候補をもつような場合
にも適用できる単語辞書検索装置に関するものである。
入力文字列の各文字に複数の候補がなく一意な場合の単
語辞書検索装置は、かな漢字変換装置においてキーボー
ドから入力されたかな文字列に対する単語辞書検索を行
なう部分、機械翻訳装置3文音声変換装置・文章校正装
置などにおいてワードプロセッサなどで作成された漢字
かな混じり文字列にス・1する単語辞書検索を行なう部
分などに用いられている。
入力文字列の各文字に複数の候補がある場合の単語辞書
検索装置は、音声認識装置や文字認識装置などにおいて
、認識結果の複数の候補文字から最も確からしい文字を
選択するための単語辞書検索部などに用いられている。
(従来の技術) 従来、かな漢字変換装置・文音声変換装置などにおいて
用いられている単語辞書検索方式は、基本的に、文献二
F計算機によるカナ漢字変換J(州浜・庄原、NHK技
術研究、第25巻第5号、23頁〜60頁、1973年
)に示されている方式を引き継いでいる。すなわち、入
力された文字列から部分文字列を切り出して、その部分
文字列に表記(かな漢字変換では「かな表記」ずなわち
「読みがな])の一致する単語を単)冶辞書内から検索
するという処理を行なう(これを、以下では、第1の従
来技術と呼ぶことにする。) 例えば、r文章を解析する]という漢字かな混じり文字
列に判する単語辞1牙検索を行なう場合は、1文字目・
2文字目など各文字位置から始まる単語を検索するため
に、「文章を解析する] 「章を解析するJ 「を解析
する] F解析する] F析する] 「する] 「る]
といった部分文字列を別々に切り出す。そして、各部分
文字列について、さらに、末尾を削った部分文字列も生
成して、その各々を単語辞書から検索する。すなわち、
1文字目から始まる単語を検索する際には、「文章を解
析する1 1文章を解析ず1 「文章を解析1 「文章
を解」 「文章をJ  ly:J rz」といった部分
文字列に関して、検索を次々に繰り返し、2文字目から
始まる単語を検索する際には、「章を解析する」「章を
解析ず] 「章を解析」 「章を解J 「章をj「全J
といった部分文字列に関して、検索を次々に繰り返すわ
けである。その結果、下線を引いた部分文字列などにつ
いて、表記の一致する単語が見つかることになる。
この第1の従来技術では、複数の部分文字列に対して単
語辞IWの検索を繰り返すわけであるが、単語辞書の溝
底を工夫しておくことによって、1つの部分文字列に対
する検索の所要時間の短縮を図っている。例えば、単語
辞書内の単語をあらかじめソートしておいて二分検索を
行なったり、1文字目・2文字目など文字ごとに分割し
て共通な部分をまとめて本構造として1文字ずつの照合
を行なうなどである。このような辞書の構造と検索方式
の工夫については、文献: ”The Art of 
ComputerProgramming 3: So
rting and Searching”(IIE。
Knuth、 Addison−Wesley、 19
73)に多く示されている。
ただし、この第1の従来技術は、コンピュータ上の逐次
型プログラムとしての実現を想定しており、所要時間短
縮の工夫は逐次処理の枠内で工夫である。したがって、
入力文字列のある部分文字列と単語辞書内のある車詔の
表記の文字列とを比較する処理などは、1文字ずつ逐次
行なわれる。例えば「文章を」という部分文字列と単語
辞書内の「文章Jという単語の比較は、「文」と「文」
とを照合し、一致したところでF章Jと「章]とを照合
し、次に、「をJに対して不一致となり失敗するという
ように、1文字ずつ照合処理の繰り返しである。
また、第1の従来技術では、入力文字列の各文字にm個
ずつ候補があるような場合は、あらかじめ、長さLの部
分文字列に対して、候補を組み合せたmL通りの文字列
を生成する必要がある。そして、それらの各々について
、さらに、上記のように末尾を削った部分文字列を生成
して、単語辞書内を検索することになる。
一方、ある長さLの文字列と入力文字列との比較の際に
、1文字ずつの照合を繰り返すのではなく、対応する文
字位置のL組の照合を同時に行なうことが考えられてい
る。その際、入力文字列をシフトレジスタに格納してお
けば、照合の位置をずらすことが、入力文字列から再度
部分文字列を切り出すのではなく、シフトレジスタ内の
全文字を一度に1文字ずらすことで実現できるようにも
なる。この第2の従来技術は、特開昭63−26142
1号公報r文字列処理装置jおよび特開昭63−261
422号公報F文字列照合装置Jに述べられている。な
お、この第2の従来技術では、入力文字列に複数の候補
は存在せず、検索される文字列も1通りに限られる(単
語辞書のように多数ではない)。
特開昭62−67636号公報「照合方式1および文献
:「音声日本語入力システムにおける高速な言語処理の
ための辞書照合アルゴリズムJ(浜口・鈴木、電子情報
通信学会論文誌、第J10−D巻第8号、1589頁〜
1596頁1987年)には、第3の従来技術が示され
ている。
第3の従来技術では、入力文字列に複数の文字候補があ
ることを想定している。まず、文字の種類をM(例えば
、JISの文字コード表では、ひらがなについてM=8
3)とすると、1文字目・2文字目など各文字位置に、
Mビットのメモリを1個ずつ用意し、複数の候補文字に
対応する各ビットを1にしておく。
そして、前金時は、単語辞19:尚の各単語について、
単語の表記の1文字目・2文字目など文字位置ごとに、
夕・を応するMピノトメモリから、対応する文字のビッ
ト内容(]または0)を同11)・に読み出す。すべて
のMビットメモリから1が読みだされたら、入力文字列
中に単語辞書内にある単語が出現したことになる。
(発明が解決しようとする課題) 第1の従来技術には、まず第1に、前述のように、多数
の部分文字列に対する単語辞書検索を繰り返さねばなら
ないという欠点がある。この欠点は、入力文字列の各文
字に複数の候補がある場合に、特に顕著になる。長さK
の入力文字列の各文字にm個ずつ候補がある場合、最長
の部分文字列の長さをLとすると(通常、単語辞書内の
最長の単語の長さをLとする)、最大(m XLXK)
個の部分文字列に対する検索を繰り返す必要が生ずる。
通常、あらかじめ条件を定めて、不要な部分文字列の検
索を避けるようにするので、(mXLXK)個というの
は最悪の場合であるが、それでも検索の回数はがなり多
くなる。
第1の従来技術の第2の欠点は、ある部分文字列と単語
辞書内のある単語の表記の文字列との比較を、1文字ず
つ順に行なうため、比較に時間がががるということであ
る。
第2の従来技術では、第1の従来技術の第2の欠点に対
処している。しかし、第2の従来技術は、入力文字列に
複数の候補がある場合に適用できない。
また、検索される文字列も1通りに限られ、単語辞書の
ように多数の文字列と比較を行なうことを考えると、単
語辞書内の各単語の表記の長さの異なりが問題となって
適用できない。
第3の従来技術は、第1の従来技術の2つの欠点に対処
している。しかし、入力文字列を記憶するために、文字
のfffi類だけのピント数をもったメモリを、文字列
長だけ用意する必要があるため、文字の種類が多数の場
合はメモリサイズがかなり大きくなってしまう問題があ
る。かな漢字変換や音声認識の場合は、入力文字列がひ
らがな(あるいは音素文字)で100種類程度に限定さ
れるので、あまり問題にならないが、漢字かな混じり文
字列を対象とした文音声変換や機絨翻訳など場合は、漢
字を含み文字の種類が3000〜4000種類にもおよ
ぶため、メモリが大きくなって問題になる。
また、第3の従来技術では、入力された文字列の先頭か
ら始まる単語の検索しか行なわないため、2文字目から
始まる単語や、3文字目から始まる単語などを検索する
場合には、入力文字列のメモリへの登録を、やり直す必
要が生じるという問題もある。
本発明の目的は、上記のような従来技術の欠点を除去し
、入力文字列の各文字に複数の候補があっても、高速に
単語辞苺との照合が可能な単語辞書検索装置を提供する
ことである。
(課題を解決するための手段) 本発明は、各文字に対して第1から第m候補(mはm≧
1なる整数)までのm種類の候補が存在する文字列の入
力装置と、n文字分(nはn≧1なる整数)のデータ巾
をもつ各アドレスに単語の表記を1個ずつ格納してn文
字に満たない部分にはあらかじめ定めた残余記号を品め
た単語辞書メモリと、前記単語辞書メモリのアドレスカ
ウンタと、前記単語辞書メモノについて単語の先頭文字
に対する単語の存在範囲を示したインデックスメモリと
、前記入力装置によって入力された文字列の第1・第2
・・・・・・・第m候補に対応し1文字ずつの順送りを
行なう各々n文字分の第1・第2・・!・・・・第m候
補シフトレジスタと、前記入力装置によって1文字に対
するm種類の候補が入力されるたびにシフトロック1回
と前記インデックスメモリにより前記第1・第2・・・
・・・・第m候補シフトレジスタの各1文字目を先頭と
する単語の存在範囲を順次求めて前記アドレスカウンタ
に先頭アドレスをセットするセットクロックと単語数に
応じた回数の判定クロックとカウンタクロックとを出力
するコントローラと、前記単語辞書メモリから読み出さ
れるn文字分のデータの1文字目・2文字目・・・・・
・・n文字目に、t、J応し該当位置の文字が前記第1
・第2・・・・門弟m候補シフトレジスタのいずれかの
同位置の文字または前記残余記号に一致したとき一致信
号を出力する1文字目・2文字目・・・・・・・11文
字目比較回路と、前記1文字目・2文字目・・・・・・
・n文字l」比較回路のすべてから一致信号が検出され
た場合に前記入力装置によって入力された文字列中に前
記単語辞書メモリ内に存在する単語が出現したと判定す
る判定回路とを備えたことを特徴とする単語辞書検索装
置である。
(実施例) 図面を用いて、本発明の構成・作用を説明する。
第1図は本発明の単語辞書検索装置の第1の実施例の構
成を示すブロック図である。以下、まず、各構成要素を
説明する。
入力装置5は、各文字に刻して第1候補から第m候補(
mはm≧1なる整数)までのm種類の候補が存在する文
字列を入力する装置であり、例えば、音声認識装置や文
字認識装置などである。入力装置5は、各文字に対する
m個の候補を、同士に出力し、その出力のタイミングを
大力クロック50によってコントローラ7へ伝える。
単語辞書メモリ1は、n文字分(nはn≧1なる整数)
のデータ1−IJをもつ各アドレスに、単語の表記を1
個ずつ格納して、n文字に満たない部分には、あらかじ
め定めた残余記号を詰めたものである。第2図は、単語
辞書メモリ1の内容の例を示す図である(第2図ではn
=4としている)。第2図において、△が残余記号を表
わしている。第2図の単語辞書メモリ1のアドレスをa
とすると、「日本△△」というn(=4)文字が同時に
読み出される。単語辞書メモリ1は、ICメモリなどを
用いて実現できる。通常、漢字コードは16ビツトで表
現されるので、第2図の単語辞書メモリ1のデータ巾は
、16X4=64ビツトである。現在のICメモリでは
、同時に読み出せるデータ巾が8ビット程度であるから
、そのようなICメモリを8個並列に並べて実現できる
インデックスメモリ8は、単語辞書メモリ1について、
ある文字を表記の先頭にもつ単語群の存在範囲を示した
メモリである。第9図(a)は、インデックスメモリ8
の内容の例を示す図である。第9図のインデックスメモ
リ8は、ある文字に対するアドレスに、単語辞書メモリ
1において、その文字を表記の先頭にもつ単語群の存在
する先頭アドレス800と、その単語群の単語数801
とが記憶されている。このようなインデックスメモリ8
は、従来のICメモリを用いて実現できる。第9図(b
)は、第9図(a)のインデックスメモリ8の内容に対
応する単語辞書メモリ1の内容の例である。単語辞書メ
モリ1内では、同一の文字を表記の先頭にもつ単語のア
ドレスが連続するように集められており、インデックス
メモリ8から得られる先・類アドレス800と単語数8
01とから、その存在範囲(単語辞書メモリ1内のアド
レス範囲)が求められる。例えば、第9図(a)から、
「IJに対して、先頭アドレス800の値としてal、
単語数801の値としてN1とが得られるが、これは、
第9図(b)に示されているように、単語辞書メモリ1
内で「[]]で始まる単語は、アドレスa1からN1個
、すなわち、アドレスa1からアドレス(a1+N1−
1)までの範囲に存在することを意味する。なお、イン
デックスメモリ8について、ある文字に対するアドレス
は、その文字の文字コードをそのままアドレス値とする
のが最も単純であるが、その文字の文字コードになんら
かの演算をほどこした結果の値をアドレス値とするなど
の方法も考えられる。
コントローラ7は、入力装置5によって1文字に対する
m種類の候補が入力されるたびに、インデックスメモリ
8より、m個のシフトレジスタ2の各1文字目を先頭と
する単語の存在範囲を順次求めて、アドレスカウンタ4
を制御する。第1図では、それに加えて、シフトレジス
タ2の順送りや、判定回路6の判定のタイミングなども
制御するように構成している。第3図は、コントローラ
7に入出力される制御信号のタイムチャートの例である
。第3図において、入力クロック50は入力装置5から
入力される制御信号、シフトク、ロック70はシフトレ
ジスタ2へ出力される制御信号、セットクロック73と
カウンタクロック71はアドレスカウンタ4へ出力され
る制御信号、判定クロック72は判定回路6へ出力され
る制御信号である。まず、シフトクロック70は入力ク
ロック50が1回入力されるたびに1回出力される(入
力クロック50をそのままシフトクロック70として出
力する)。このシフトクロッシマ0は、入力装置5から
シフトレジスタ2へ1文字読み込ませ、かつ、シフトレ
ジスタ2内の文字列を1文字ずつ順送りさせるためのも
のである。セットクロック73は、シフトクロックメモ
リ70に引き続いて、m回出力される。このセットクロ
ック73は、インデックスメモリ8から読み出される先
頭アドレスを、アドレスカウンタ4にセットするための
信号である。第1候補シフトレジスタの1文字目の文字
、第2候補シフトレジスタの1文字目の文字、・・・・
・、第m候補シフトレジスタの1文字目の文字の各々に
ついて、合計出回繰り返される。セットクロック73が
1回出力された後に、判定クロック72とカウンタクロ
ック71とが交互に出力される。これらの出力回数は、
セットクロック73でセットされた先頭アドレスと同時
にインデックスメモリ8から読み出された単語数と同一
回数である。第3図のタイムチャートでは、第1候補シ
フトレジスタの1文字目、第2候補シフトレジスタの1
文字目、・・・・・、第m候補シフトレジスタの1文字
目の各々に対して、その文字を先頭文字とする単語辞書
メモリ1内の単語数が、N1個、N2個、N個であった
ことを示している。ただし、カウンタクロック71は判
定クロック72よりも1回少なくともよい。このような
タイムチャート通りに動作するコントローラ7は、当業
者において容易に実現可能である。
アドレスカウンタ4は、セットクロック73に同期して
コントローラ7から指定されたカウンタ値(先頭アドレ
ス)をセットし、カウンタクロック71に同期してカウ
ントアツプを行なうカウンタである。そして、カウンタ
値を単語辞書メモリ1のアドレス値として出力する。従
来のカウンタICで実現できる。
第1候補シフトレジスタ2は、入力装置5によって入力
された文字列の第i候補(iは1≦i≦mなる整数)を
、シフトクロック70に同期して1文字ずつ順送りしな
がら、n文字分格納するシフトレジスタである。このシ
フトレジスタ2は、入力文字列の各文字に対するm個の
候補の各々に対して設けられており、第1候補シフトレ
ジスタ、第2候補シフトレジスタ、・・・・・、第m候
補シフトレジスタのm個がある。
第4図は各シフトレジスタ2の構成例を示した図である
。■文字をdビットで表現している場合、第・i候補シ
フトレジスタ2は、第4図のように、シフトクロック7
0に同期した(dXn)個のDフリップフロップで実現
できる(d個並列に並べたものを、n個直列に接続する
)。並列に接続したd個が1文字に対応し、その出力は
まとめて比I膜回路3へ送られる。
j文字目比較回路3は、アドレスカウンタ4の示す1つ
のアドレスに対して単語辞書メモリ1から読み出される
n文字分のデータのj番目qは1≦j≦nなる整数)の
文字が、m個のシフトレジスタ2のいずれかのj番目の
文字、または、残余記号に一致したときに、一致信号を
出力する回路である。この比較回路3は、単語辞書メモ
リ1のデータ巾n文字の各々に対して設けられており、
1文字目比較回路、2文字目比較回路、・・・・・、n
文字目比較回路のn個がある。
第5図は、j文字目比較回路3の構成例を示した図であ
る。1文字をdビットで表現して、シフトレジスタ2が
m個設けられている場合、j文字目比較回路3は、第5
図のように、(m+1)個のdビット比較器と、1個の
ORゲートで溝底できる。m個のdビット比較器は、単
語辞書メモリ1から読み出されているn文字データのう
ちj文字目と、各シフトレジスタ2のj文字目とを比較
し、残りの1個のdビット比較器は、単語辞書メモリ1
から読み出されているn文字データのうちのj文字目が
残余記号であるか否かを調べる。最終的なORデートの
出力では、この(m+1)個の比較器のいずれかで、一
致が検出されたときに、一致信号30が出力される。
判定回路6は、判定クロック72に同期して、n個の比
較回路のすべてから一致信号が検出された場合に、入力
装置5によって入力された文字列中に単語辞書メモリ1
内に存在する単語が出現したと判定する回路である。第
6図は、判定回路6の構成例を示す図である。判定回路
6は、第6図のように、1個のANDゲートと1個のD
フリップフロップで実現できる。
次にこの実施例の動作を例を用いて説明する。
第7図(a)〜(h)は、n=4、m=3で入力文字列
の長さが4のときの、第1候補シフトレジスタ・第2候
補シフトレジスタ・第3候補シフトレジスタの内容の変
化の例を示した図である。第7図の3×4のマトリック
スは、1行が各シフトレジスタ2の内容に対応しており
、行方向が文字位置(1〜4)、列方向が候補レベル(
1〜3)を表わしている。これらのシフトレジスタ2に
入力されている文字列は、1文字目の候補は第1候補か
ら順に「日1 「白] 「目1.2文字目の候補は順に
「木」 「本」 「大」、3文字目は順に「電」「雷」
 「霧1.4文字目は順に「気」 「島] 「戒1であ
る。斜線部分は文字が格納されていないことを表わす。
第咽において、(a)+(b)→(c)−+(d)−+
(e)−+(f)−+(g)−+(h)という変化は、
シフトクロック70が1回発生されるたびに起こる変化
を示している。そして、(a)〜(g)の各々の状態に
おいて、n個(この例では4個)の比較回路3で、単語
辞書メモリ1内の単語と第7図のシフトレジスタの内容
との照合が行なわれる。その際、単語辞書メモリ1内の
全単語とシフトレジスタ2とが照合されるのではなく、
そのときの各シフトレジスタ2の1文字をもとにして、
単語辞書メモリ1内の照合する単語数を制限する。例え
ば、状態(d)では、3個のシフトレジスタ2の内容と
、まず、「日」で始まる単語辞書メモリ1内の単語群と
が照合され、次に、「白]で始まる単語群と照合され、
最後に、F目」で始まる単語群と照合される。このよう
な単語群の存在範囲は、インデックスメモリ8から得る
ことができ、コントローラ7が単語辞書メモリ1のアド
レスカウンタ4を制御する。
その結果、各状態で、単語辞書メモリ1内の例えば次の
ような単語に対して、判定回路6が出現を検出する。
(a)該当なし くb)該当なし くc)該当なし くd)「日」 「日本」 「日本電気」 「日入] 「
白」「白木1 「目] (e)「本IF本]「大」 <Or電] 「電気] 「霧」 「桜島」 「雷](g
)「気1F島」 このうち、状態(d)における第7図のシフトレジスタ
内容と、単語辞出′内の単語「日本」(=「日本△△]
)とを照合する際の、各比較回路3の動作を説明する。
1文字目比較回路は、「日本△△]の「日Jと第1(e
J市シフトレジスタの1文字目のF日]との一致により
一致信号30を発生ずる。2文字目比較回路は、「日本
△△」の「本1と第2候補シフトレジスタの2文字目の
「本1との一致により一致信号30を発生する。3文字
目比較回路と4文字目比較回路はともに、「日本△△]
の「△](残余記号)を検出して一致信号30を発生ず
る。その結果、判定回路6は、すべての比較回路3の一
致信号30を受けて、単語の出現を検出することになる
なお、入力文字列長がKの場合、シフトレジスタ2内で
の順送りは、少なくとも(K+n−1)回行なわれる必
要がある。したがって、入力装置5は、長さKの入力文
字列を入力した後、さらに、(n−1)回のダミーの文
字列入力を行なう必要がある。あるいは、コントローラ
7が、入力文字列の末尾を検出して、さらに、シフトク
ロック70の1回に対応するサイクルを、(n−1)回
繰り返すようにしてもよい。
また、最初の(n−1)回の順送りの間(第7図では(
a)から(C)まで)は、入力文字列がシフトレジスタ
2の先頭まで到達していないので、単語辞書メモリ1と
の照合を行なっても意味がない。そこで、その間は、コ
ントローラ7は、セットクロック73やカウンタクロッ
ク71や判定クロック72を発生せず、シフトクロック
70のみを連続して発生するようにしてもよい。
以上では、入力文字列の各文字にm個の候補が存在する
一般的な場合の実施例を示したが、かな漢字変換におけ
る単語辞書検索や、ワードプロセッサで作成した文章の
解析を行なう際の単語辞書検索などでは、入力文字列の
各文字は1通りである(m=1)。第8図は、そのよう
な場合を対象とした第2の実力亀例を示すブロック図で
ある。この場合は、シフトレジスタ2が1個でよい。構
成要素、動作は第1図の実施例についてm=1とすれば
よいので、説明を省略する。
(発明の効果) 以上説明したように、本発明によれば、漢字のように種
類の多い文字から戒る文字列に対して、各文字が複数の
候補をもっていても、高速に単語辞書との照合が可能な
単語辞書検索装置が得られる。特に入力文字列の各文字
の候補数にも、単語辞書内の単語の表記後にもかかわら
ず、入力文字列と単語辞書内の1つの単語との照合が2
クロック程度の間に行えることの効果が大きい。
さらに、実施例に示したように、本発明の各構成要素は
、少数のロジックICを組み合わせで実現できる。した
がって、LSI技術を利用すれば、非常に小型の装置と
して実現できる点も長所である。
それに加えて、第1の従来技術のように、汎用計算機上
のソフトウェアとして実現されるのではなく、専用ハー
ドウェア・特殊LSIとして実現できるため、クロソク
の周波数自体を、汎用計算機に比べてかなり高く設定す
ることが可能であり、この点でも高速性が優れている。
【図面の簡単な説明】
第1図は本発明の第1の実施例の構成を示すブロック図
、第2図は単語辞書メモリ1の内容の例を示す図、第3
図はコントローラ7の人出力信号のタイムチャートの例
、第4図はシフトレジスタ2の構成例を示す図、第5図
は比較回路3の構成例を示す図、第6図は判定回路6の
構j戊例を示ず図、第7図(a)〜(h)はシフトレジ
スタ2の内容の変化の例を示す図、第8図は本発明の第
2の実施例を示すブロック図、第9図(aXb)はイン
デックスメモリ8の内容の例と単語辞書メモリ1との対
応を示す図である。 図において、1・・・単語辞書メモリ、2・・・シフト
レジスタ(第i候補シフトレジスタ)、3・・・比較回
路q文字目比較回路)、4・・・アドレスカウンタ、5
・・・入力装置、6・・・判定回路、7・・・コントロ
ーラ、8・・・インデックスメモリ、30−1.一致信
号、50・・・入力クロソク、70・・シフトクロック
、71・・・カウンタクロック、72・・・判定クロソ
ク、73.・・七ソ)・クロソク、74・・・先頭アド
レスである。

Claims (1)

    【特許請求の範囲】
  1. 各文字に対して第1から第m候補(mはm≧1なる整数
    )までのm種類の候補が存在する文字列の入力装置と、
    n文字分(nはn≧1なる整数)のデータ巾をもつ各ア
    ドレスに単語の表記を1個ずつ格納してn文字に満たな
    い部分にはあらかじめ定めた残余記号を詰めた単語辞書
    メモリと、前記単語辞書メモリのアドレスカウンタと、
    前記単語辞書メモリについて単語の先頭文字に対する単
    語の存在範囲を示したインデックスメモリと、前記入力
    装置によって入力された文字列の第1・第2・・・・・
    ・・第m候補に対応し1文字ずつの順送りを行なう各々
    n文字分の第1・第2・・・・・・・第m候補シフトレ
    ジスタと、前記入力装置によって1文字に対するm種類
    の候補が入力されるたびにシフトロック1回と前記イン
    デックスメモリにより前記第1・第2・・・・・・・第
    m候補シフトレジスタの各1文字目を先頭とする単語の
    存在範囲を順次求めて前記アドレスカウンタに先頭アド
    レスをセットするセットクロックと単語数に応じた回数
    の判定クロックとカウンタクロックとを出力するコント
    ローラと、前記単語辞書メモリから読み出されるn文字
    分のデータの1文字目・2文字目・・・・・・・n文字
    目に対応し該当位置の文字が前記第1・第2・・・・・
    ・・第m候補シフトレジスタのいずれかの同位置の文字
    または前記残余記号に一致したとき一致信号を出力する
    1文字目・2文字目・・・・・・・n文字目比較回路と
    、前記1文字目・2文字目・・・・・・・n文字目比較
    回路のすべてから一致信号が検出された場合に前記入力
    装置によって入力された文字列中に前記単語辞書メモリ
    内に存在する単語が出現したと判定する判定回路とを備
    えたことを特徴とする単語辞書検索装置。
JP1173441A 1989-07-04 1989-07-04 巣語辞書検索装置 Expired - Lifetime JPH0670788B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1173441A JPH0670788B2 (ja) 1989-07-04 1989-07-04 巣語辞書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1173441A JPH0670788B2 (ja) 1989-07-04 1989-07-04 巣語辞書検索装置

Publications (2)

Publication Number Publication Date
JPH0337764A true JPH0337764A (ja) 1991-02-19
JPH0670788B2 JPH0670788B2 (ja) 1994-09-07

Family

ID=15960530

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1173441A Expired - Lifetime JPH0670788B2 (ja) 1989-07-04 1989-07-04 巣語辞書検索装置

Country Status (1)

Country Link
JP (1) JPH0670788B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007073304A (ja) * 2005-09-06 2007-03-22 Auto Network Gijutsu Kenkyusho:Kk 基板実装型コネクタ
CN109660155A (zh) * 2017-08-21 2019-04-19 茂达电子股份有限公司 误差消除放大器以及马达控制电路

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057849U (ja) * 1983-09-21 1985-04-22 株式会社日立製作所 情報検索装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057849U (ja) * 1983-09-21 1985-04-22 株式会社日立製作所 情報検索装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007073304A (ja) * 2005-09-06 2007-03-22 Auto Network Gijutsu Kenkyusho:Kk 基板実装型コネクタ
CN109660155A (zh) * 2017-08-21 2019-04-19 茂达电子股份有限公司 误差消除放大器以及马达控制电路
CN109660155B (zh) * 2017-08-21 2020-08-18 茂达电子股份有限公司 误差消除放大器以及马达控制电路

Also Published As

Publication number Publication date
JPH0670788B2 (ja) 1994-09-07

Similar Documents

Publication Publication Date Title
JP3836502B2 (ja) テキスト・波形変換
JPH0675992A (ja) テキストをインデックス及び検索するための関連ワード形態の限定状態トランスジューサ
JPH01234975A (ja) 日本語文章分割装置
EP0749076B1 (en) Similar character string expanding and retrieving method and apparatus
Yousef et al. Learning meters of Arabic and English poems with Recurrent Neural Networks: a step forward for language understanding and synthesis
CN110413972B (zh) 一种基于nlp技术的表名字段名智能补全方法
JPH0337764A (ja) 巣語辞書検索装置
JP2526670B2 (ja) 単語辞書検索装置
JPH0337765A (ja) 単語辞書検索装置
JPH0337754A (ja) 単語辞書検索装置
JPH04340166A (ja) 単語辞書検索装置
JP2792147B2 (ja) 文字処理方法およびその装置
JPH03110676A (ja) 単語辞書検索装置
Rahate et al. Text Normalization and Its Role in Speech Synthesis
JPH03110675A (ja) 単語辞書検索装置
Khafajeh et al. Arabic Words Root Extraction Using Modified Successor Variety
Garcia et al. Error detection in character recognition using pseudosyllable analysis
JPH04114278A (ja) 文字列比較方式
JP2006106896A (ja) データベース登録システム、データベース検索システム、語彙索引登録方法及び異表記同一視検索方法
JPS61265633A (ja) 発音記号による辞書検索処理方式
JP2744241B2 (ja) 文字処理装置
JPH0552506B2 (ja)
JPH0588479B2 (ja)
JPS62206597A (ja) 音声認識用単語予備選択方式
JPS63265299A (ja) 音声認識装置