JPS61267885A - 単語辞書照合装置 - Google Patents

単語辞書照合装置

Info

Publication number
JPS61267885A
JPS61267885A JP60262849A JP26284985A JPS61267885A JP S61267885 A JPS61267885 A JP S61267885A JP 60262849 A JP60262849 A JP 60262849A JP 26284985 A JP26284985 A JP 26284985A JP S61267885 A JPS61267885 A JP S61267885A
Authority
JP
Japan
Prior art keywords
dictionary
word
character string
words
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60262849A
Other languages
English (en)
Other versions
JPH0634260B2 (ja
Inventor
Kazunari Egami
一成 江上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPS61267885A publication Critical patent/JPS61267885A/ja
Publication of JPH0634260B2 publication Critical patent/JPH0634260B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90348Query processing by searching ordered data, e.g. alpha-numerically ordered data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9014Indexing; Data structures therefor; Storage structures hash tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/268Lexical context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔゛産業上の利用分野〕 本発明は、文書上に記載さ詐る文章等を栴成する単語を
大容量の単語辞書により認識する単語辞書照合装置に関
するものである。
〔従来の技術〕
従来、この極の技術の応用分野の例として郵便物等に記
載される欧文住所の認識がある。たとえば、特開昭57
−146380号あるいは特開昭57−137976号
等に示されるごとく、住所単語辞書を単語の文字数(以
下「語長」という)で辞書グループ化しておき、文字読
取装置の出力文字列の語長をキーとして住所単語辞書と
照合する方式がある。
また、住所単語辞書を単語の先頭1文字が同一のものあ
るいは先頭2文字が同一のものを辞書グループ化し、文
字読取出力の第1文字あるいは第1、第2文字のコード
をキーとして住所単語辞書と照合するという方式がある
いずれも、大容量の単語辞書へのアクセス回数を単語辞
書を辞書グループ化することKより減少させ、入力文字
列との照合、認識処理の高速化をはかることを目的とし
たものである。
〔発明が解決しようとする問題点〕
このような従来の方式においては、次に示すような問題
がある。
(1)語長をキーとした単語辞書へのアクセス、照合方
式の場合 語長をキーとした単語辞書の場合、語長幅を2文字から
25文字と考えると、24のグループに分類できる。語
長をキーとすると、入力文字の読取結果に左右されず目
的の照合すべき単語辞書にアクセスできる。しかし語長
で分類した場合、登録単語の語長分布が大きな問題とな
る。たとえば、都市名の単語辞書を作る場合、その語長
分布は、語長8〜10をピークとして正規分布のような
分布をなす。従って、語長グループにより登録単語数に
大きな偏りがでる。
ピーク語長の一2〜+2語長の近傍で登録単語の半数以
上を占めることもある。このような場合、特開昭57−
146380号あるいは特開昭57−137976号等
に示されるような単語認識性能を上げるために、入力文
字列語長Nに対し単語辞書語長N−1−N+1と照合を
とる。DPマツチング手法をとると、ピーク語長近傍の
場合の単語照合時間は膨大となる。このため単語辞書の
辞書グループ化の初期の目的が十分に達成できなかった
(2)先頭1文字あるいは2文字のコードをキーとした
アクセス、照合方式の場合 アルファベットの場合、1文字で単語辞書を辞書グルー
プ化すると、最大で26のグループができる。語長キー
に比べると、登録単語の分布は先頭2文字のアルファべ
、ト順並びに対し正規分布を示さず分散化する。しかし
入力文字の第1文字が読めていなければ、大容量単語辞
書の辞書グループのすべてと照合をとらねばならないと
いう大きな問題がある。
一方、先頭2文字で単語辞書を辞書グループ化すると、
最大で26X26=676のグループができ分散化はさ
らにはかられる。また第1文字が読めなければ、第2文
字をキーとして単語辞書にアクセスすることができる。
しかし第2文字が読めなければ、単語辞書グループのす
べてと照合をとる必要がある。いずれにしても、入力文
字列の先頭2文字の読取結果いかんで照合処理時間が大
きく変わるし、また文字読取りがエラーしていれば、本
来の単語辞書の辞書グループとは照合されないという問
題がある。
〔問題点を解決するための手段〕
このような問題点を解決するために本発明は、単語を登
録記憶する登録記憶手段と、登録記憶手段を単語の文字
数より分類する分類手段と、登録記憶手段の中に登録さ
れている単語の先頭数文字のコード組合せにより単諸登
録位置を連鎖する連鎖手段と、読取文字列としての入力
文字列の文字数をキーとして入力文字列と登録記憶手段
とを照合し入力文字列の先頭数文字の読取結果組合せを
キーとして単語の連鎖をたどり登録記憶手段と照合する
手段とを設けるようにしたものである。
〔作用〕
本発明においては、文字列が入力され、この入力文字列
の先頭数文字により単語辞書に登録されている辞書グル
ープが選択され、選択された辞書グループ中の単語と入
力文字列とのマツチングがとられ単語が認識される。
〔実施例〕
第1図に本発明に係わる単語辞書照合装置の−実施例を
示す。第1図において、1は入力文字列が入力され一時
蓄えられ出力される入力単語レジスタ、2は入力文字列
の語長データbを入力する語長グループ選択部、3は語
長索引テーブルアドレスが格納される語長グループ索引
テーブルポインター、4は入力文字列の先頭2文字をも
とに参照する辞書サブグループを1つあるいは複数選ぶ
辞書サブグループ1選択部、5は辞書サブグループlの
先頭登録位置が順次セットされる辞書サブグループ1先
頭ポインター、6は辞書サブグループ1選択部4での単
語辞書の分類の選択もれを回避するために入力文字列の
第3.第4文字をもとに参照する辞書ブブグループを1
つあるいは複数選ぶ辞書サブグループ2選択部、7は辞
書サブグループ2の先頭登録位置が順次セットされる辞
書サブグループ2先頭ポインター、8は目的の登録単語
を読出すための辞書読出部、9は目的の登録単語がセッ
トされる照合辞書バッファ、10は入力文字列と照合辞
書バッファ9の内容とを照合する単語照合部、11は辞
書索引テーブルのアドレスが格納されている語長索引テ
ーブル、12.13は各語長の辞書索引テーブルのアド
レスが格納されている文字コード索引テーブル、14は
単語が登録記憶されている登録記憶手段としての単語辞
書である。語長グループ選択部2.辞書サブグループ1
選択部4および辞書サブグルー12選択部6は分類手段
、語長索引テーブル11および文字コード索引テーブル
12.13は連鎖手段、辞書読出部8.照合辞書バッフ
ァ9および単語照合部10は照合手段を構成する。シー
ケンス制御部15は単語照合の流れを制御する。
このように構成された装置の動作について説明する。
まず、本実施例の動作の概要について説明する。
単語辞書14と照合される入力文字列aは、ます語長に
よって、照合する単語辞書14の範囲を限定する。限定
された範囲に含まれる登録単語数が少なければ、その全
単語と入力文字列aの照合をとる。もし登録単語数が多
ければ、入力文字列aの先頭2文字あるいは4文字をも
とに、さらに、照合する単語辞書14の範囲を限定する
。このとき、文字読取結果のエラーのために目的の単語
辞書分類が照合範囲からはずれる可能性を極力押さえる
ため、文字コード索引テーブル12あるいは13を第3
図、第4図のごとく構成する。すなわち、分類の手法と
してよく知られたH a s h技法を用い、入力文字
列aの先頭2文字読取結果から単−語長辞書内を最大5
0の分類ができるように、第4図に示すHa s h関
数生成テーブルHtを用意する。このテーブルH1は2
文字のコードXlX1+tをもとに参照する。とくに文
字読取のエラー分布をもとにエラ゛−しやすい文字は同
一分類となるようにする。Hash関数生成テーブルH
1から第4図に示すHa s hインデックステーブル
上2を参照するためのHa s hアドレスのコード(
XB X i+1  )二Nが生成される。このHa 
s hアドレスのコードh (Xi X4+1) = 
Nカラ、照合する単語辞v14の1つの辞書サブグルー
プを参照するためのアドレスポインターが得られる。同
様に入力文字列aの第3.第4文字の2文字についても
第4図のテーブルを用意する。辞書サブグループ1選択
部4は、入力文字列の先頭2文字をもとに参照する辞書
サブグループを1つあるいは複数選ぶ。さらに辞書サブ
グループ2選択部6は、辞書サブグループ1選択部4で
の単語辞書分類の選択もれを回避するために、入力文字
列の第3.第4文字をもとに参照する辞書サブグループ
を1つあるいは複数選ぶ。また単語辞書14の登録単語
は、各語長グループ内で、第4図のグループ辞書H3に
示すように、各辞書サブグループ毎に連鎖されており、
その先頭がHa s hインデックステーブル上2に格
納されている。従って、参照する辞書サブグループのア
ドレスポインターHashインデックステーブルH2か
ら引き出すことKより辞書の連鎖をたどり目的の登録単
語はすべて辞書読出部8に読出され、照合辞書バッファ
9にセットされ、単語照合部10により人力文字列aと
照合単語バッファ9の内容とが照合される。
次に本実施例の動作について詳細に説明する。
第1図に示す構成各部の動作フローチャートは第5図〜
第10図に示される。第1図においてシーケンス制御部
15は第5図シーケンスフローチャートステップ100
のように、まず入力文字列aの各文字XttX2−−−
Xnを入力単語レジスタ1に順にセットする。次にシー
ケンス制御部15は第5図ステップ101で語長グルー
プ選択部2を起動し、セットされた入力文字列aの語長
nのデータbを語長グループ選択部2に入力する。語長
グループ選択部2は、語長索引テーブル11を参照して
n語長の辞書索引テーブルのアドレスを知る。語長索引
テーブル11の構成を第2図に示す。
語長索引テーブル11には、2語長から25までの辞書
の文字コード索引テーブルAI2〜AT25のアドレス
が格納されている。
語長グループ選択部2の動作のフローを第6図に示す。
まずステ、プ20において語長nを入力し、ステップ2
1〜25において照合すべき単語辞書14の語長nの辞
書グループを選ぶ。本実施例においては、ステップ21
においてn≦5か否かの判断をし、YESであればステ
ップ23へすすみ、NOであればステップ22へすすむ
。ステップ22において、さらに、n≦16か否かの判
断をし、YESであればステップ24へすすみ、NOで
あればステップ25へすすむ。n≦5のときのステップ
、すなわち、ステップ23においては語長nの辞書グル
ープのみ、6≦n≦16のときのステップ、すなわち、
ステップ24においては語長n −1,n、n + 1
の3つの辞書グループ、17≦n≦25のときのステッ
プ、すなわち、ステップ25においては語長n−2、n
−1、n 。
n+1.n+2の5つの辞書グループを照合すべき辞書
グループとして選ぶ。次にステップ26において第2図
に示す語長辞書索引テーブルの参照アドレスを各語長に
対して計算し、ステップ27において各語長の辞書の文
字コード索引テーブルのアドレスを知る。このアドレス
は、ステップ28において、語長グループ索引テーブル
ポインター3に格納される。
次に第5図シーケンスフローチャートステップ101.
102においてシーケンス制御部15は語長グループ索
引テーブルポインタ3から文字コード索引テーブルアド
レスを入力しテーブルに登録された単語長グループの単
語数を調べる。第3図に文字コード索引テーブルの詳細
構成を示しである。第5図ステップ102,103にお
いてステップ101にて選択された語長グループ単語登
録数が一定値より少ない場合、語長グループ全体の単語
と照合する方法を選ぶ。もし一定値より多い場合ステッ
プ104,105のようにさらに単語数を絞るために辞
書サブグループ1選択部4と辞書サブグループ2選択部
6とを順に起動する。
辞書サブグループ1選択部4は、語長により限定された
辞書グループの中で入力文字列aの先頭2文字Xl、X
−をもとに、さらに、照合すべき辞書丈プグループ範囲
を限定する。辞書サブグループ1選択部4の動作のフロ
ーを第7図に示す。まず、ステップ30において、i=
xの場合、Xl、X。
の文字読取出力を入力し、ステップ31において読めた
か否かを調べる。Xlが読めたら、先頭2文字のいずれ
かにXlという文字がくる登録単語を照合すべき辞書サ
ブグループと考え、その辞書サブグループの登録先アド
レスを知るため、ステップ32において第4図に示すH
a s h関数生成テーブル)11を参照する。Ha 
s h関数生成テーブル上1ヘアドレッシングするとい
うことは、文字コ−)”A、B、−−−、Zに対して0
 、1、−−−.25の数値を与えるとすると、 Ha
sh関数h(26・X 1 +x i+1)を調べるこ
とになる。Hash関数生成テーブルH1参照をxlA
、XIB 、−−−、XIZK対して行なうことによシ
先頭2文字のいずれがKXlという文字がくる辞書サブ
グループのRa5hアドレスが得られる。なお、Has
hアドレスの重複したものは1つを残す。第4図のイン
デックステーブルH2に示すように、本実施例ではn語
長の辞書グループを50分類し、Hashアドレスとし
て50のコードが得られるようにHash関数生成テー
ブルH1が構成されている。ステップ33においてHa
shアドレスよりHashインデックステーブルH2が
参照される。ステップ34において辞書サブグループ1
選択部4は、辞書サブグル−プの先頭登録位置を示すポ
インターを入力し、辞書サブグループ1先頭ポインター
5に順次セットしていく。
X!について終了すると1次にステップ35〜38にお
いてX2について同様のことを行なう。
これらのステップにおいて、X2A 、X、B 、−−
−。
X2zとHa s h関数値を調べ、辞書サブグルーズ
の先頭ポインターを入力し、辞書サブグループ1先頭ポ
インター5にセットする。
このようにして入力文字列aの先頭2文字X1゜X2.
をもとに照合辞書がさらに限定されたことになる。もし
先頭2文字の内1文字が読めていなければ、照合辞書サ
ブグループの範囲は狭くなるが、残り1文字がさらにエ
ラーしていれば、照合すべき辞書が範囲から落ちる危険
性がある。従って、照合すべき辞書が範囲から落ちる確
率をさらに小さく押さえ込むために入力文字列aの第3
.第4文字X3.X4について全く同様に辞書サブグル
ー12選択部6において照合辞書サブグループの範囲を
選ぶ。この場合、第4図Hash関数テーブルH1は先
頭2文字の場合と共通に用いる。Ha s hインデッ
クステーブル上2は第3図に示すように第3.第4文字
用のテーブルが用意されている。
単語辞書のリンクポインタも先頭2文字とは別にポイン
タが用意され単語の連鎖が組まれる。このことにより、
入力文字列aの先頭4文字のうち少なくとも1文字が正
しく読めていれば、照合すべき辞書は範囲から落ちるこ
となく選択されることになる。
以上の結果選択された辞書サブグループ1先頭ポインタ
ー5および辞書サブグループ2先頭ポインター7のデー
タは、辞書読出部8に送られる。
辞書グループが第5図シーケンスフローチャートのステ
ップ102から106で選ばれるとステ、ブ107で辞
書読出部8が起動される。辞書続出部8は、語長グルー
プの選択結果を語長グループ索引テーブルポインター3
から入力する。n語長の辞書グループ文字コード索引テ
ーブル3Aを第3図に示す。
辞書続出部8の動作フローを第8図に示す。まずステ、
プ40において語長グループすべての登録単語数を合計
して格納するカウンタをクリアする。次にステップ41
〜44において、第3図に示すn語長の辞書グループ索
引テーブル3人の辞書グループ登録単語数を調べるため
に語長グループ索引テーブルポインター3にセットされ
た参照すべき語長グループすべての登録単語数の合計を
とり、その結果をカウンタに格納する。
ステップ45においてカウンタの内容が単語の照合許容
最大値N以下である場合、結合子70を介して第1O図
に示すステップ56へすすむ。ステップ56〜58にお
いて語長グループすべての登録単語を単語辞書14から
読出し照“合辞書バッファ9にセットする。
ステップ45において合計値メモリの内容が単語の照合
許容最大値Nをこえている場合、第8図に示すステップ
46へすすむ。この場合、辞書読出部8は、さらに辞書
サブグループを選ぶ。ステップ46において辞書読出部
8は、辞書サブグループ1先頭ポインター5から1つの
辞書サブグループの先頭ポインターを取り出す。たとえ
ば、第4図においてMashインデックステーブルH2
のh=2サブグループが選ばれていた場合、先頭ポイン
ターは登録単語[へ〇几ONJのアドレスを示している
。ステップ47においてこの登録単語が読出され、まず
照合辞書バッファ9にセットされる。次にステップ48
において単語の一部に含まれる次の登録位置ポインター
を取り出しリンクが続いているか否かを調べる。このポ
インターはリンクエンドの場合(oooo)  がセッ
トされている。ステップ49においてリンクエンドか否
かを調べ、リンクがあればステップ47へ戻り。
そのリンクをたどり次の登録単語を読出し照合辞書バッ
ファ9にセットする。ステ、ブ47〜49においてこの
操作をリンクエンドまで続ける。
1つの辞書サブグループの読出しが終了すると、ステッ
プ50において辞書サブグループ1の登録終了か否かを
調べ、終了でなければ、ステップ46へ戻る。ステップ
46において辞書サブグループ1先頭ポインター5から
次の辞壺サブクループ先頭ポインターを読出しステップ
47〜49の処理を繰り返す。
ステップ50において辞書サブグループlが登録終了と
なると、第9図に示すステップ51〜55において辞書
サブグループ2先頭ポインター7から次のサブグループ
先頭ポインターを読出し、辞書サブグループlと同様の
処理を繰り返す。
以上の結果、入力文字列aの先頭4文字で1文字でも正
しく読めている文字があれば照合すべき辞書サブグルー
プをはずすことなく、可能な限り辞書照合範囲を限定し
て照合単語全単語辞書から読出し、照合辞書バッファ9
にセットできる。照合すべき単語が第5図フローチャー
トステップ107で準備されるとステップ108にて単
語照合部lOが起動される。単語照合部10は必要最小
限の辞書登録単語と入力文字列aを照合すればよく、高
速、かつ、正確な単語照合処理を行なうことができる。
照合結果得られた入力文字列aと一致する単語がステッ
プ109にて出力される。
〔発明の効果〕
以上説明したように本発明は、入力文字列の語長により
辞書照合範囲を限定するとともに入力文字列の先頭数文
字により辞書照合範囲を限定して照合単語を辞書から読
出し入力文字列と辞書登録単語とを照合するようにした
ので、照合すべき辞書サブグループをはずすこともなく
、高速で正確な単語照合処理を行なえる効果がある。
【図面の簡単な説明】
第1図は本発明に係わる単語辞書照合装置の一実施例を
示すブロック系統図、第2図は語長索引テーブルの構成
および文字コード索引テーブルと単語辞書の索引関係を
示す図、第3図は語長グループ索引テーブルポインター
に格納された辞書グループ文字コード索引テーブルを示
すテーブル構成図、第4図はHa s h技法を説明す
るためのチーフル構成図、第5図は装置全体の流れを示
すシーケンス制御フローチャート、第6図は語長グルー
プ選択部2の動作を説明するための70−チャート、第
7図は辞書サブグループ1選択部および辞書サブグルー
プ2選択部の動作を説明するためのフローチャート、第
8図〜第1O図は辞書続出部の動作を説明するためのフ
ローチャートである。 1°°°゛°゛入力単語レジスタ、2・・・・・・語長
グループ選択部、3・・・・・・語長グループ索引テー
ブルポインター、4・・・・・・辞書サブグループ1選
択部、5・・・・・・辞書サブグループ1先頭ポインタ
ー、6・・・・・・辞書サブグループ2選択部、7・・
・・・・辞書サブグループ2先頭ポインター、8・・・
・・・辞書読出部、9・・・・・・照合辞書バッファ、
10・・・・・・単語照合部、11・・・・・・語長索
引テーブル、12.13・・・・・・文字コード索引テ
ーブル、14・・・・・・単語辞簀、15・・・・・・
シーケンス制御部。 83 図 入     へ 躬乙図 8q 図 集to図

Claims (3)

    【特許請求の範囲】
  1. (1)文字読取部から出力される読取文字列と単語辞書
    とを照合し単語を認識する単語辞書照合装置において、
    単語を登録記憶する登録記憶手段と、前記登録記憶手段
    を単語の文字数より分類する分類手段と、前記登録記憶
    手段の中に登録されている単語の先頭数文字のコード組
    合せにより単諸登録位置を連鎖する連鎖手段と、前記読
    取文字列としての入力文字列の文字数をキーとして前記
    入力文字列と前記登録記憶手段とを照合し、前記入力文
    字列の前記先頭数文字の読取結果組合せをキーとして単
    語の連鎖をたどり前記登録記憶手段と照合する照合手段
    とを備えたことを特徴とする単語辞書照合装置。
  2. (2)連鎖手段は、登録記憶手段の中に登録されている
    単語の先頭2文字のコード組合せにより単語登録位置を
    連鎖する手段であることを特徴とする特許請求の範囲第
    1項記載の単語辞書照合装置。
  3. (3)連鎖手段は、登録記憶手段の中に登録されている
    単語の先頭2文字のコード組合せにより単語登録位置を
    連鎖するとともに、前記登録記憶手段の中に登録されて
    いる単語の第3、第4の文字の組合せにより単語登録位
    置を端鎖する手段であることを特徴とする特許請求の範
    囲第1項記載の単語辞書照合装置。
JP60262849A 1984-11-21 1985-11-21 単語辞書照合装置 Expired - Lifetime JPH0634260B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP24454484 1984-11-21
JP59-244544 1984-11-21

Publications (2)

Publication Number Publication Date
JPS61267885A true JPS61267885A (ja) 1986-11-27
JPH0634260B2 JPH0634260B2 (ja) 1994-05-02

Family

ID=17120275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60262849A Expired - Lifetime JPH0634260B2 (ja) 1984-11-21 1985-11-21 単語辞書照合装置

Country Status (2)

Country Link
US (1) US4771385A (ja)
JP (1) JPH0634260B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63204463A (ja) * 1987-02-20 1988-08-24 Sanyo Electric Co Ltd 機械翻訳装置
JPH02148174A (ja) * 1988-11-30 1990-06-07 Toshiba Corp Ocrによる住所データベース検索装置
JPH03257668A (ja) * 1990-03-08 1991-11-18 Nec Corp テーブル検索方式
JPH0424784A (ja) * 1990-05-15 1992-01-28 Canon Inc 文字処理方法
US9753638B2 (en) 2012-06-06 2017-09-05 Thomson Licensing Method and apparatus for entering symbols from a touch-sensitive screen

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450598A (en) * 1985-12-27 1995-09-12 Xerox Corporation Finite state machine data storage where data transition is accomplished without the use of pointers
US5551049A (en) * 1987-05-26 1996-08-27 Xerox Corporation Thesaurus with compactly stored word groups
US5754847A (en) * 1987-05-26 1998-05-19 Xerox Corporation Word/number and number/word mapping
US5551026A (en) * 1987-05-26 1996-08-27 Xerox Corporation Stored mapping data with information for skipping branches while keeping count of suffix endings
US4864501A (en) * 1987-10-07 1989-09-05 Houghton Mifflin Company Word annotation system
JPH02297195A (ja) * 1989-03-02 1990-12-07 Nec Corp 形態素解析方式
JPH0833806B2 (ja) * 1989-03-13 1996-03-29 富士通株式会社 データ処理装置における多国語変換処理方式
FR2660085A1 (fr) * 1990-03-20 1991-09-27 Philips Electronique Lab Dispositif de traitement de donnees et procede pour selectionner des mots de donnees contenus dans un dictionnaire.
EP0688104A2 (en) * 1990-08-13 1995-12-20 Fujitsu Limited Data compression method and apparatus
CA2076526A1 (en) * 1990-12-31 1992-07-01 Min-Wen Du Fast approximate string matching algorithms for multiple errors spelling correction
US5523946A (en) * 1992-02-11 1996-06-04 Xerox Corporation Compact encoding of multi-lingual translation dictionaries
US5701459A (en) * 1993-01-13 1997-12-23 Novell, Inc. Method and apparatus for rapid full text index creation
GB9311580D0 (en) * 1993-06-04 1993-07-21 Phonelink Data Limited Data retrieval system
WO1996016374A1 (fr) * 1994-11-21 1996-05-30 Omron Corporation Systeme de base de donnees partage par une pluralite d'appareils clients, procede de mise a jour de donnees et application a un processeur de caracteres
US5774588A (en) * 1995-06-07 1998-06-30 United Parcel Service Of America, Inc. Method and system for comparing strings with entries of a lexicon
US5913209A (en) * 1996-09-20 1999-06-15 Novell, Inc. Full text index reference compression
EP0859366A1 (en) * 1997-02-12 1998-08-19 STMicroelectronics S.r.l. Associative memory device with optimized occupation, particularly for the recognition of words
JP3587048B2 (ja) * 1998-03-02 2004-11-10 株式会社日立製作所 韻律制御方法及び音声合成装置
US6216123B1 (en) 1998-06-24 2001-04-10 Novell, Inc. Method and system for rapid retrieval in a full text indexing system
US6584458B1 (en) 1999-02-19 2003-06-24 Novell, Inc. Method and apparatuses for creating a full text index accommodating child words
US7490034B2 (en) * 2002-04-30 2009-02-10 Microsoft Corporation Lexicon with sectionalized data and method of using the same
US7340392B2 (en) * 2002-06-06 2008-03-04 International Business Machines Corporation Multiple sound fragments processing and load balancing
US7788097B2 (en) * 2002-06-06 2010-08-31 Nuance Communications, Inc. Multiple sound fragments processing and load balancing
US7421386B2 (en) * 2003-10-23 2008-09-02 Microsoft Corporation Full-form lexicon with tagged data and methods of constructing and using the same
US7398210B2 (en) * 2003-10-23 2008-07-08 Microsoft Corporation System and method for performing analysis on word variants
US7447627B2 (en) * 2003-10-23 2008-11-04 Microsoft Corporation Compound word breaker and spell checker
US7529668B2 (en) * 2004-08-03 2009-05-05 Sony Corporation System and method for implementing a refined dictionary for speech recognition
US8095575B1 (en) * 2007-01-31 2012-01-10 Google Inc. Word processor data organization
US20110090253A1 (en) * 2009-10-19 2011-04-21 Quest Visual, Inc. Augmented reality language translation system and method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4328561A (en) * 1979-12-28 1982-05-04 International Business Machines Corp. Alpha content match prescan method for automatic spelling error correction
US4498148A (en) * 1980-06-17 1985-02-05 International Business Machines Corporation Comparing input words to a word dictionary for correct spelling
JPS5854433B2 (ja) * 1980-09-11 1983-12-05 日本電気株式会社 相違度検出装置
US4503514A (en) * 1981-12-29 1985-03-05 International Business Machines Corporation Compact high speed hashed array for dictionary storage and lookup
US4597057A (en) * 1981-12-31 1986-06-24 System Development Corporation System for compressed storage of 8-bit ASCII bytes using coded strings of 4 bit nibbles

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63204463A (ja) * 1987-02-20 1988-08-24 Sanyo Electric Co Ltd 機械翻訳装置
JPH02148174A (ja) * 1988-11-30 1990-06-07 Toshiba Corp Ocrによる住所データベース検索装置
JPH03257668A (ja) * 1990-03-08 1991-11-18 Nec Corp テーブル検索方式
JPH0424784A (ja) * 1990-05-15 1992-01-28 Canon Inc 文字処理方法
US9753638B2 (en) 2012-06-06 2017-09-05 Thomson Licensing Method and apparatus for entering symbols from a touch-sensitive screen

Also Published As

Publication number Publication date
JPH0634260B2 (ja) 1994-05-02
US4771385A (en) 1988-09-13

Similar Documents

Publication Publication Date Title
JPS61267885A (ja) 単語辞書照合装置
JP3077765B2 (ja) 語彙辞書の検索範囲を削減するシステム及び方法
US6470347B1 (en) Method, system, program, and data structure for a dense array storing character strings
EP0277356B1 (en) Spelling error correcting system
JPS6262387B2 (ja)
JP3812818B2 (ja) データベース生成装置、データベース生成方法及びデータベース生成処理プログラム
JPH04205560A (ja) 情報検索処理方式および検索ファイル作成装置
JPH06282587A (ja) 文書の自動分類方法及び装置並びに分類用の辞書作成方法及び装置
JPS6262388B2 (ja)
KR100300741B1 (ko) 전체 문장의 문자 데이터의 기록매체 및 문자열 대조장치
JPH0441388B2 (ja)
JP2671311B2 (ja) 住所読取装置
JPH02148174A (ja) Ocrによる住所データベース検索装置
JPS61128367A (ja) カナ漢字変換装置
JP3722231B2 (ja) コンパクトにエンコードされて記憶されたストリングの組を有する製品
EP0649106A1 (en) Compactly stored word groups
JPH0816729A (ja) 文字認識後処理方式
JP2574741B2 (ja) 言語処理方法
JPS63268082A (ja) パタ−ン認識装置
JPH0420229B2 (ja)
JPH0646423B2 (ja) 単語辞書照合装置
JPS62107388A (ja) パタ−ン認識装置
Austin An Evaluation of Standard Spell Checking Algorithms and a Binary Neural Approach
JPH0528132A (ja) 単語辞書照合装置
JPH0340079A (ja) 文字読取装置における文字認識後処理方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term