JPH0438026B2 - - Google Patents

Info

Publication number
JPH0438026B2
JPH0438026B2 JP59004198A JP419884A JPH0438026B2 JP H0438026 B2 JPH0438026 B2 JP H0438026B2 JP 59004198 A JP59004198 A JP 59004198A JP 419884 A JP419884 A JP 419884A JP H0438026 B2 JPH0438026 B2 JP H0438026B2
Authority
JP
Japan
Prior art keywords
word
character
characters
candidate
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59004198A
Other languages
English (en)
Other versions
JPS60147888A (ja
Inventor
Eiichiro Yamamoto
Yukikazu Kaburayama
Yoshihisa Fujii
Tozen Hai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59004198A priority Critical patent/JPS60147888A/ja
Publication of JPS60147888A publication Critical patent/JPS60147888A/ja
Publication of JPH0438026B2 publication Critical patent/JPH0438026B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (1) 発明の技術分野 本発明は、文字認識に当つて文字の誤認識を防
止するための一旦認識した文字に対して行なわれ
る文字認識後処理方法及びその装置に関する。
(2) 従来の背景 一般に、文字認識装置は、用紙等に書かれた文
字を観測して当該文字の特徴を抽出した後、当該
文字の特徴と認識辞書の内容とを照合させて上記
文字を識別するようにしたものである。ところ
が、用紙等に書かれた文字が乱雑であつたり、く
せ字であるような場合には、当該文字が誤認識さ
れるという虞れがある。
(3) 従来技術とその問題点 そこで、従来にあつては、文字認識後処理方法
として、認識対象が複数文字から成る単語である
ことを前提とし、一旦認識した文字を単語単位で
再認識するようにしたものがあり、これにより、
文字の誤認識を極力防止するようにしている。即
ち、上記後処理方法は、上記入力単語を含む多数
の単語を先頭文字によつて検索可能に配列した単
語辞書を予め作成しておき、上記入力単語の各文
字を認識して類似度の高い順位から順に求められ
た候補文字列を単語単位に区画して候補単語列と
し、この候補単語列を上記単語辞書の内容と照合
させることにより、単語辞書から最適な単語を選
択するようにしたものである。
ところで、単語の文字数によつては、ある先頭
文字から始まる単語数が非常に多くなつてしまう
という事態を生ずる。このような場合において、
従来の文字認識後処理方法にあつては、上記単語
辞書は常に単語の先頭文字によつて検索される構
成になつているので、単語辞書の検索時間がかさ
み、その分、文字認識後処理の効率が悪くなると
いう不具合を生ずる。
(4) 発明の目的 本発明は以上の観点に立つて為されたものであ
つて、その目的とするところは、文字認識後処理
において、単語辞書の検索時間の短縮化を図り、
もつて処理効率を向上させるようにした文字認識
後処理方法及びその装置を提供することにある。
(5) 発明の構成 そして、本発明に係る文字認識後処理方法の基
本的構成は、複数文字から成る入力単語の各文字
を認識して求められた候補文字列を単語単位に区
画して候補単語列とし、この候補単語列を単語辞
書の内容と照合させて単語辞書から最適な単語を
選択するに際し、上記単語辞書に登録すべき単語
の文字数nに応じて索引文字位置mを先頭文字以
外で任意に設定し、上記単語辞書にはn文字から
なる単語の第m番目の文字により類別して単語を
登録しておき、上記単語辞書の登録単語群を上記
索引文字位置mの文字によつて検索可能にする一
方、上記候補単語列の上記索引文字位置mに対応
する文字を索引文字として上記単語辞書から候補
単語と同一文字数の単語を検索するようにしたも
のである。また、上記方法を実施するための装置
の基本的構成は、複数文字から成る入力単語の各
文字を認識して求められた候補文字列を単語単位
に区画した候補単語列として蓄積する蓄積手段
と、n文字からなる単語の第m番目の文字により
類別して単語を登録しておき索引文字位置mの文
字により登録単語群を検索可能にした単語辞書
と、上記蓄積手段に蓄積された候補単語列の最適
索引文字位置に対応する文字を索引文字として上
記単語辞書から候補単語と同一文字数の単語を検
索する検索手段と、上記単語辞書から検索された
単語のうち最適なものを選択する選択手段とを備
えたものである。
(6) 発明の実施例 以下、添付図面に示す実施例に基づいて本発明
に係る文字認識後処理方法及びその装置を詳細に
説明する。
第1図は文字認識装置に本発明に係る文字認識
後処理装置を付設したものを示すブロツク図であ
る。同図において、文字認識装置は、用紙等に書
かれた入力単語の各文字を光学的に読み取り該光
信号を光電変換して出力する観測部1と、この観
測部1からの文字図形を表わす電気信号に基づい
て入力文字の特徴を抽出する特徴抽出部2と、認
識対象となる文字の標準特徴を予め格納している
認識辞書3と、上記特徴抽出部2から転送される
入力文字の特徴と上記認識辞書3内の標準特徴と
を照合させて類似度の高い順位から順に認識辞書
内の文字を入力文字として識別する識別部4とを
備えている。また、文字識別後処理装置は、上記
入力単語の各文字に対して上記識別部4で識別さ
れた各候補文字列を単語単位に区画した候補単語
列として蓄積する候補単語バツフア5と、入力単
語を含む単語を予め格納している単語辞書6と、
上記候補単語列を単語辞書6の内容と照合させて
単語辞書から最適な単語を選択する単語照合部7
とを備えている。
この実施例において、上記候補単語バツフア5
は、第2図に示すように、入力単語の最大文字数
に対応するビツト数のレジスタを識別部4から得
られる候補文字数分(例えば5)だけ備えたもの
で、入力単語(文字数n、例えば3)のi(i=
1,2,3)番目の文字に対する候補文字は各レ
ジスタ5a乃至5eのi番目のアドレスに上位レ
ジスタ5aから下位レジスタ5eにかけて類似度
の高い順に格納され、各レジスタ5a乃至5eに
は上記候補単語が配設されるようになつている。
また、上記単語辞書6に登録される単語群は、
第2図に示すように、最適索引文字位置の文字に
よつて検索可能に配列されている。上記最適索引
文字位置は、登録されるべき単語の文字数によつ
て予め設定されるものであり、単語辞書6から所
定文字数の単語を検索するに当つて、先頭文字以
外の任意に設定した索引文字位置mを示すもので
ある。この実施例では、入力単語の文字数n=3
に対して索引文字位置m(=n−1)=2と設定さ
れている。
更に、単語照合部7は、第2図に示すように、
上記候補単語列の索引文字位置mに対応する文字
を索引文字として上記単語辞書6から候補単語と
同一文字数の単語を検索する検索手段と、上記単
語辞書6から検索された単語のうち最適なものを
選択する選択手段とを備えている。第2図におい
て、7aは候補単語バツフア5内の候補単語の文
字数を格納する単語文字数レジスタ、7bは登録
されるべき単語の文字数nに対する最適索引文字
位置mを格納している索引文字テーブル、7cは
上記単語文字数レジスタ7aの内容を読みとり、
しかも索引文字テーブル7bを参照して候補単語
バツフア5から索引文字を読み出す索引文字読出
回路、7dは単語辞書6内に登録されている単語
のアドレスを格納している読出アドレステーブ
ル、7eは単語文字数レジスタ7a及び索引文字
読出回路7の内容から読出アドレステーブル7d
内のアドレスを知り、単語辞書6から単語を順次
読出す単語辞書読出制御回路であり、これらは上
記検索手段を構成している。また、符号7fは単
語辞書6から読み出された単語を格納する単語レ
ジスタ、7gは類似度計算回路で、上記単語レジ
スタ7fに格納されている単語の各文字が候補単
語バツフア5の各候補文字列の何番目の順位にあ
るかを調べ、この値を各文字について加算するも
のであり、単語レジスタ7fに格納されている単
語のある文字が対応する候補文字列に存在しない
場合には、当該文字に対して候補文字数より大き
い順位を与えるようになつている。7hは類似度
計算回路7gで計算された類似度を格納する類似
度レジスタ、7iは類似度レジスタ7hに順次格
納される類似度のうち小さい値のものを更新しな
がら格納する類似度最小値レジスタ、7jは類似
度最小値レジスタ7iに格納される類似度をもつ
単語を更新しながら格納する最適単語レジスタ、
7kは比較器であり、類似度レジスタ7hの値が
類似度最小値レジスタ7iの値よりも小さいとき
類似度レジスタ7hの値を類似度最小値レジスタ
7iに格納すると共に、単語レジスタ7fの内容
を最適単語レジスタ7jに格納するものである。
そして、上記単語レジスタ7f乃至比較器7kは
上記選択手段を構成している。
次に、この実施例に係る文字認識後処理装置の
作動を説明する。今、入力単語が文字数n=3で
ある「計算機」であるとし、識別部4から入力文
字「計」に対して「訂」「計」「討」「許」「訴」の
候補文字が与えられ、入力文字「算」に対して
「算」「篤」「等」「賀」「簿」の候補文字が与えら
れ、入力文字「機」に対して「機」「磯」「横」
「欄」「精」の候補文字が与えられたとする。この
場合、候補単語バツフア5には各文字の各候補文
字が所定の順位に従つて上位レジスタ5aから下
位レジスタ5eへと順に格納され、各レジスタ5
a乃至5eには候補単語「訂算機」…が格納され
ることになる。この状態において、上記単語文字
数レジスタ7aには候補単語の文字数に応じた値
(この場合3)が格納され、この値が索引文字読
出回路7cに送られると、索引文字テーブル7b
を参照して上記索引文字読出回路7cは候補単語
バツフア5から索引文字位置m=2に対応する。
各候補単語の文字「算」「篤」「等」「賀」「簿」を
索引文字として順次読出する。すると、上記索引
文字及び単語文字数レジスタ7aの内容が上記単
語辞書読出制御回路7eに送られ、読出アドレス
テーブル7dを参照して上記単語辞書読出制御回
路7eは単語辞書6から文字数が3文字で且つ第
2番目の文字が「算」「篤」「等」「賀」「簿」であ
る単語を順次読出していく。このとき、上記索引
文字は最適なものに設定されていることから、単
語辞書6の検索時間は、候補単語列における先頭
の文字「訂」…や第3番目の文字「機」…を索引
文字とした場合に比べて短縮されている。
そして、単語辞書6から読出された単語が例え
ば「計算機」であるとすると、該単語は単語レジ
スタ7fに格納されると共に、該単語の候補単語
に対する類似度が類似度計算回路7gで計算され
る。この場合、上記単語の先頭文字「計」は候補
文字列の第2番目に位置し、上記単語の第2、第
3番目の文字「算」「機」は夫々候補文字列の第
1番目に位置することから、類似度計算回路7g
は2+1+1の計算を行ない、当該計算値4を類
似度として類似度レジスタ7hに格納する。この
状態において、先り格納されている類似度最小値
レジスタ7iの内容は「計算機」という単語が存
在しない以上、上記類似度レジスタ7hの内容よ
り大きいものであるため、上記比較器7kの動き
によつて、類似度レジスタ7hの内容が類似度最
小値レジスタ7iに格納されると共に、単語レジ
スタ7fの内容が最適単語レジスタ7jに格納さ
れる。この後、単語辞書6から読出された単語が
順次単語レジスタ7fに格納され、夫々の単語に
おける類似度が計算されて類似度レジスタ7hに
格納されるが、夫々の単語の類似度は単語「計算
機」における類似度より大きいものになるため、
類似度最小値レジスタ7i及び最適単語レジスタ
7jの内容は更新されず、元の内容を保持する。
このようにして、全単語の検索が終了すると、最
終的に類似度最小値レジスタ7iには類似度の最
小値が格納され、最適単語レジスタ7jには類似
度の最小値に対応する単語「計算機」が格納さ
れ、最適単語レジスタ7jから入力単語の最終認
識結果である最適単語「計算機」が読出される。
尚、文字認識後処理装置の具体的構成について
は、上記、実施例で示したものに限定されるもの
ではなく、単語照合部7をマイクロプロセツサを
用いて作成する等適宜設計変更して差支えない。
(7) 発明の効果 以上説明してきたように、本発明に係る文字認
識後処理方法及びその装置によれば、文字認識後
処理において単語辞書の検索時間を従来に比べて
短縮でき、その分、処理効率を向上させることが
できる。
【図面の簡単な説明】
第1図は本発明に係る文字認識後処理装置を文
字認識装置に付設したシステムの一例を示すブロ
ツク図、第2図は本発明に係る文字認識後処理装
置の一実施例を示すブロツク図である。 5…候補単語バツフア(蓄積手段)、6…単語
辞書、7…単語照合部(検索手段、選択手段)、
m…索引文字位置、n…単語辞書に登録すべき単
語の文字数。

Claims (1)

  1. 【特許請求の範囲】 1 複数文字からなる入力単語の各文字を認識し
    て求められた候補文字列を単語単位に区画して候
    補単語列とし、この候補単語列を単語辞書の内容
    と照合させて、単語辞書から最適な単語を選択す
    るに際し、上記単語辞書に登録すべき単語の文字
    数nに応じて索引文字位置mを先頭文字以外で任
    意に設定し、上記単語辞書にはn文字からなる単
    語の第m番目の文字により類別して単語を登録し
    ておき、上記単語辞書の登録単語群を上記索引文
    字位置mの文字によつて検索可能にする一方、上
    記候補単語列の上記索引文字位置mに対応する文
    字を索引文字として上記単語辞書から候補単語と
    同一文字の単語を検索するようにしたことを特徴
    とする文字認識後処理方法。 2 複数文字からなる入力単語の各文字を認識し
    て求められた候補文字列を単語単位に区画した候
    補単語列として蓄積する蓄積手段と、n文字から
    なる単語の第m番目の文字により類別して単語を
    登録しておき索引文字位置mの文字により登録単
    語群を検索可能にした単語辞書と、上記蓄積手段
    に蓄積された候補単語列の索引文字位置mに対応
    する文字を索引文字として上記単語辞書から候補
    単語と同一文字数の単語を検索する検索手段と、
    上記単語辞書から検索された単語のうち最適なも
    のを選択する選択手段とを備えてなる文字認識後
    処理装置。
JP59004198A 1984-01-12 1984-01-12 文字認識後処理方法及びその装置 Granted JPS60147888A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59004198A JPS60147888A (ja) 1984-01-12 1984-01-12 文字認識後処理方法及びその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59004198A JPS60147888A (ja) 1984-01-12 1984-01-12 文字認識後処理方法及びその装置

Publications (2)

Publication Number Publication Date
JPS60147888A JPS60147888A (ja) 1985-08-03
JPH0438026B2 true JPH0438026B2 (ja) 1992-06-23

Family

ID=11577965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59004198A Granted JPS60147888A (ja) 1984-01-12 1984-01-12 文字認識後処理方法及びその装置

Country Status (1)

Country Link
JP (1) JPS60147888A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2526670B2 (ja) * 1989-07-04 1996-08-21 日本電気株式会社 単語辞書検索装置
JPH03110676A (ja) * 1989-09-25 1991-05-10 Nec Corp 単語辞書検索装置
JP2526678B2 (ja) * 1989-09-25 1996-08-21 日本電気株式会社 単語辞書検索装置

Also Published As

Publication number Publication date
JPS60147888A (ja) 1985-08-03

Similar Documents

Publication Publication Date Title
US5774588A (en) Method and system for comparing strings with entries of a lexicon
US5579408A (en) Character recognition method and apparatus
JPH0438026B2 (ja)
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JP2839515B2 (ja) 文字読取システム
JPS63138479A (ja) 文字認識装置
JPH0259513B2 (ja)
JP2680311B2 (ja) 文字認識方式
JP5533197B2 (ja) 検索装置、ならびに、コンピュータプログラム
JP2637762B2 (ja) パターン詳細同定方式
JPH01183796A (ja) 文字認識装置
JPH0340434B2 (ja)
JP3007697B2 (ja) 単語照合装置及び単語照合方法
JPH0355874B2 (ja)
JPS58222386A (ja) 文字認識装置の修正方式
JPH06180793A (ja) ナンバープレート自動認識装置
JPH024035B2 (ja)
JPS6059487A (ja) 手書文字認識装置
JPS6252912B2 (ja)
JPH02166587A (ja) 単語検索方式
JPH0746373B2 (ja) 単語認識装置
JPS59188783A (ja) 文字判定処理方式
JPH01194088A (ja) 文字列と単語の照合装置
JPS61233882A (ja) 単語列推定方式
JPH0345431B2 (ja)