JP3121401B2 - 認識辞書及び文字認識装置 - Google Patents

認識辞書及び文字認識装置

Info

Publication number
JP3121401B2
JP3121401B2 JP03309725A JP30972591A JP3121401B2 JP 3121401 B2 JP3121401 B2 JP 3121401B2 JP 03309725 A JP03309725 A JP 03309725A JP 30972591 A JP30972591 A JP 30972591A JP 3121401 B2 JP3121401 B2 JP 3121401B2
Authority
JP
Japan
Prior art keywords
feature
value
character
classification
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03309725A
Other languages
English (en)
Other versions
JPH05120491A (ja
Inventor
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP03309725A priority Critical patent/JP3121401B2/ja
Publication of JPH05120491A publication Critical patent/JPH05120491A/ja
Application granted granted Critical
Publication of JP3121401B2 publication Critical patent/JP3121401B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識に係り、特に
大分類と詳細分類による階層的文字認識のための認識辞
書と文字認識装置に関する。
【0002】
【従来の技術】従来、このような階層的文字認識におい
ては、大分類用辞書と詳細分類用辞書と別々に備え、文
字画像より抽出した大分類用特徴量と大分類用辞書との
マッチング(大分類)を行なうことにより、詳細分類用
辞書とのマッチング(詳細分類)を行なうか否か、ある
いはその範囲を決定している(特開昭63−12608
2号等)。
【0003】
【発明が解決しようとする課題】しかし、大分類に時間
を要し、その分だけ認識処理時間が増加するという問題
がある。
【0004】本発明の目的は、大分類と詳細分類による
階層的文字認識を効率的に実行する文字認識装置と、そ
れに用いるに好適な認識辞書を提供することにある。
【0005】
【課題を解決するための手段】請求項1の発明による認
識辞書は、文字の大分類用特徴量の上限しきい値及び詳
細分類用特徴量を含む文字対応の特徴量レコードの群
と、認識しようとする文字画像の大分類用特徴量の値か
ら、それと等しい大分類用特徴量下限しきい値を持つ文
字の特徴量レコードの先頭を求めるためのテーブルとか
ら構成され、文字対応の特徴量レコードは、文字の大分
類用特徴量の下限しきい値の大きい順にソートされる。
また請求項2の発明によれば、請求項1の発明による認
識辞書において、大分類用特徴量下限しきい値が同一の
文字に対応した特徴量レコードは、大分類用特徴量の上
限しきい値の大きい順にソートされる。
【0006】請求項3の発明による文字認識装置は、文
字画像の大分類用特徴量及び詳細分類用特徴量を抽出す
る特徴抽出手段と、該特徴抽出手段により抽出された文
字画像の特徴量と請求項1または2記載の認識辞書を用
いて文字画像の候補文字を決定する認識手段とからな
り、該認識手段が、該認識辞書のテーブルを参照するこ
とによって文字画像の大分類用特徴量の値に等しい大分
類用特徴量下限しきい値を持つ文字に対応した先頭の特
徴量レコードを求め、この先頭の特徴量レコード以降の
特徴量レコードについて順次、大分類用特徴量上限しき
い値が文字画像の大分類用特徴量の値より大きいことを
条件に詳細分類用特徴量と文字画像の詳細分類用特徴量
とのマッチングを行なう構成とされる。
【0007】請求項4の発明による文字認識装置は、文
字画像の大分類用特徴量及び詳細分類用特徴量を抽出す
る特徴抽出手段と、該特徴抽出手段により抽出された文
字画像の特徴量と請求項2記載の認識辞書を用いて文字
画像の候補文字を決定する認識手段とからなり、該認識
手段が、該認識辞書のテーブルを参照することによって
文字画像の大分類用特徴量の値に等しい大分類用特徴量
下限しきい値を持つ文字に対応した先頭の特徴量レコー
ドを求め、この先頭の特徴量レコードより順次、大分類
用特徴量上限しきい値が文字画像の大分類用特徴量より
大きいことを条件に詳細分類用特徴量と文字画像の詳細
分類用特徴量とのマッチングを行ない、文字画像の大分
類用特徴量の値以下の大分類用特徴量上限しきい値を持
つ文字の特徴量レコードが出現した場合は、この特徴量
レコードの文字より次に小さい大分類用特徴量下限しき
い値を持つ文字に対応した先頭の特徴量レコードを該テ
ーブルを参照することにより求め、この先頭の特徴量レ
コードより同様の処理を再開する構成とされる。
【0008】請求項5の発明による文字認識そうちは、
画像の大分類用特徴量及び詳細分類用特徴量を抽出する
特徴抽出手段と、該特徴抽出手段により抽出された文字
画像の特徴量と請求項2記載の認識辞書を用いて文字画
像の候補文字を決定する認識手段とを有し、該認識手段
は、該認識辞書のテーブルを参照することによって文字
画像の大分類用特徴量の値に等しい大分類用特徴量下限
しきい値を持つ文字に対応した先頭の特徴量レコードを
求め、この先頭の特徴量レコードより順次、ある固定値
以上または文字画像の大分類用特徴量の値より所定値だ
け小さい値以上の大分類用特徴量下限しきい値を持つ文
字に対応した特徴量レコードに関しては、大分類用特徴
量上限しきい値が文字画像の大分類用特徴量の値より大
きいことを条件に詳細分類用特徴量と文字画像の詳細分
類用特徴量とのマッチングを行ない、該ある固定値以下
または文字画像の大分類用特徴量の値より所定値だけ小
さい値以下の大分類用特徴量下限しきい値を持つ文字に
対応した特徴量レコードに関しては、大分類用特徴量上
限しきい値が文字画像の大分類用特徴量より大きいこと
を条件に詳細分類用特徴量と文字画像の詳細分類用特徴
量とのマッチングを行うとともに、文字画像の大分類用
特徴量の値以下の大分類用特徴量上限しきい値を持つ文
字の特徴量レコードが出現した場合は、この特徴量レコ
ードの文字より次に小さい大分類用特徴量下限しきい値
を持つ文字に対応した先頭の特徴量レコードを該テーブ
ルを参照することにより求め、この先頭の特徴量レコー
ドより処理を再開する構成とする。
【0009】請求項6の発明によれば、請求項3の発明
の文字認識装置において、認識手段が、文字画像の大分
類用特徴量の値より所定値だけ小さい値以上またはある
固定値以上の大分類用特徴量下限しきい値を持つ文字に
対応した特徴量レコードに関しては、無条件に詳細分類
用特徴量のマッチングを行なう構成とされる。
【0010】請求項7の発明によれば、請求項5の発明
の文字認識装置において、認識手段が、ある固定値以上
または文字画像の大分類用特徴量の値より所定値だけ小
さい値以上の大分類用特徴量下限しきい値を持つ文字に
対応した特徴量レコードに関しては、無条件に詳細分類
用特徴量のマッチングを行なう構成とされる
【0011】
【作用】請求項1または2の発明による認識辞書は、詳
細分類用特徴量とのマッチング(詳細分類)を行なうか
否かを判定するために、大分類用特徴量の下限しきい値
及び上限しきい値を持つが、特徴量レコードは下限しき
い値の大きい順にソートされているため、特徴量レコー
ドの内容に下限しきい値を含める必要がなく、その分だ
け辞書容量を削減できる。さらに、認識しようとする文
字画像の大分類用特徴量の値より大きな下限しきい値を
持つ文字の特徴量レコードについては詳細分類の対象か
ら除外し、それ以下の下限しきい値を持つ文字の特徴量
レコードだけを詳細分類の対象とすればよいが、下限し
きい値の大きい順に特徴量レコードはソートされている
ため、ある特徴量レコードを境界として、詳細分類の対
象範囲を画することができる。
【0012】そして、文字画像の対分類用特徴量の値か
ら同じ下限しきい値を持つ先頭の特徴量レコードを求め
るためのテーブルを有するため、下限しきい値に関する
比較処理が不要となるとともに詳細分類の実行制御が極
めて容易になる。また、特徴量レコードの内容として大
分類用特徴量の上限しきい値を含むため、上限しきい値
によって詳細分類の対象をさらに絞り込み、無駄な詳細
分類による処理時間の増加を排除できる。
【0013】またさらに、請求項2の発明によれば、同
じ下限しきい値の特徴量レコードが上限しきい値の大き
い順にソートされているため、ある特徴量レコードの上
限しきい値を文字画像の大分類用特徴量を超えた場合
に、この特徴量レコード以降をスキップし、次に小さい
下限しきい値の特徴量レコードの処理に跳ぶといった制
御が容易であり、一層効率的な処理が可能となる。
【0014】請求項3の発明によれば、認識辞書のテー
ブルの参照によって、大分類用特徴量の下限しきい値の
条件を満たす特徴量レコードの範囲を一気に絞り込み、
この範囲内で上限しきい値の条件を満たす特徴量レコー
ドをさらに絞り込み詳細分類を行なう。このような大分
類に必要な時間は僅かであり、また無駄な詳細分類によ
る時間を排除できるため、効率的かつ高速の文字認識処
理が可能になる。
【0015】請求項4の発明によれば、下限しきい値に
より絞り込まれた範囲内の、ある下限しきい値の特徴量
レコード中で、上限しきい値の条件を満たさない特徴量
レコードが出現した場合、それに続く特徴量レコード
(全て上限しきい値の条件を満たさない)の処理をスキ
ップし、次に小さい下限しきい値の特徴量レコードの処
理へ跳ぶため、さらに効率的な認識処理が可能である。
【0016】請求項5または7の発明によれば、ある値
以上の下限しきい値の特徴量レコードまたは、文字画像
の大分類特徴量の値よりある値だけ小さい下限しきい値
の特徴量レコードについては、スキップ制御は行なわれ
ない。また請求項6の発明によれば、同様の範囲につい
て上限しきい値による絞り込みも行なわず、無条件に詳
細分類が行なわれる。
【0017】しかし、下限しきい値が比較的大きい範囲
や文字画像の特徴量の値に近い下限しきい値の範囲にお
いては、上限しきい値の条件を満足しない特徴量レコー
ドが出現する頻度が少ないため、スキップ制御または上
限しきい値による絞り込みを省いても影響は少なく、逆
に上限しきい値の条件判定やスキップ制御のための時間
が不要となる分だけ処理効率の面で有利になることさえ
あり得る。よって、これら発明によっても効率的な認識
処理が可能である。
【0018】
【実施例】以下、本発明の実施例について図面を用い説
明する。
【0019】実施例1 図1に文字認識装置の概略ブロック図である。文書はス
キャナ1によって2値画像として読み取られ、その画像
データは文字画像切り出し部2に入力する。文字画像切
り出し部2によって切り出された文字画像データは、文
字画像正規化部3によって正規化され特徴抽出部4に入
力する。特徴抽出部4において、文字画像データより大
分類用特徴量と詳細分類用特徴量が抽出される。ここで
は、大分類用特徴量として輪郭長が抽出されるものとし
て説明するが、これに限られるものではない。詳細分類
用特徴量は層方向ヒストグラム等である。
【0020】5は大分類と詳細分類の2段階で文字認識
を行なう認識部であり、これは詳細分類制御部6と詳細
分類部7からなる。この処理内容については後述する。
8は認識部5によって用いられる認識辞書である。12
は認識結果の出力や修正入力等のためのコンソールであ
る。
【0021】図2は認識辞書8の全体的構成図、図3は
その詳細説明図である。この認識辞書8は、連続したメ
モリ空間上に、そのアドレスの小さい方からオフセット
テーブル9と特徴量レコード群10を配置した構成であ
る。特徴量レコード群10は文字対応の多数の特徴量レ
コード11からなり、各特徴量レコード11は文字コー
ド、輪郭長(大分類用特徴量)の上限しきい値及び詳細
分類用特徴量を内容としている。
【0022】そして、輪郭長の下限しきい値が大きい文
字の特徴量レコード11ほど、アドレスの小さい側に配
置されている。すなわち、特徴量レコード11は下限し
きい値の大きい順にソートされている。さらに、同じ下
限しきい値の特徴量レコード11の相互間では、上限し
きい値の大きい順にソートされている。
【0023】オフセットテーブル9は、最小の下限しき
い値から最大の下限しきい値までの各値に対応したエン
トリーを持ち、各エントリーには、対応した下限しきい
値の先頭の特徴量レコード11へのポインタとして、こ
の先頭特徴量レコードへのテーブル9の先頭アドレスか
らのオフセットが格納されている。
【0024】次に認識部5の処理を説明する。図4はそ
の概略処理フロー図である。詳細分類制御部6は、認識
しようとする文字画像の輪郭長Lによって認識辞書8の
オフセットテーブル9を参照することにより、輪郭長L
に等しい下限しきい値を持つ先頭の特徴量レコードのア
ドレスを決定する(ステップ20)。この先頭の特徴量
レコードより順に最後の特徴量レコードまで、次のよう
な処理を行なう。
【0025】詳細分類制御部6は、一つの特徴量レコー
ドの上限しきい値と輪郭長Lとの大小比較判定を行ない
(ステップ24)、上限しきい値が輪郭長Lより大きい
ときには詳細分類部7によって、当該特徴量レコードの
詳細分類用特徴量と特徴抽出部4より入力した詳細分類
用特徴量とのマッチング、すなわち詳細分類を行なわせ
る(ステップ26)。この詳細分類では、候補文字のソ
ートも行なわれるが、これは従来と同様であるので説明
を省略する。
【0026】詳細分類制御部6は、一つの特徴量レコー
ドに対する詳細分類を終了すると、または、上限しきい
値が輪郭長L以下の場合は直ちに、次の特徴量レコード
に処理を進め、その上限しきい値と輪郭長Lとの比較判
定を行なう(ステップ24)。上限しきい値>輪郭長L
であれば詳細分類(ステップ26)を実行させ、そうで
なければ詳細分類を行なわせず、次の特徴量レコードに
処理を進める。
【0027】このようにして最後の特徴量レコードまで
処理が済むと終了と判断し(ステップ22)、詳細分類
部7に得られた候補文字を認識結果として出力させ(ス
テップ30)、一つの文字画像に対する認識処理を完了
する。
【0028】仮に、文字画像から抽出された輪郭長Lが
10で、認識辞書8が図5に示すような内容であったと
すると、「間」の特徴量レコードより最後の特徴量レコ
ードまでが処理対象となる。「間」から「装」までの特
徴量レコードでは、上限しきい値が11以上であるから
全て詳細分類が実行される。しかし、「呼」、「戸」の
特徴量レコードは上限しきい値が10以下であるため、
詳細分類は実行されない。普通、下限しきい値が小さい
と上限しきい値も小さくなるため、「戸」より後の特徴
量レコードの多くは詳細分類の対象から除外されること
になる。
【0029】なお、図5に示した下限しきい値と上限し
きい値の数値は説明用に選ばれたものである。正規化後
の文字画像サイズの大小によるが、一般的に輪郭長、そ
の下限しきい値及び上限しきい値は、数十から数百の範
囲の値をとることになる。この点は後述の他の実施例の
説明においても同様である。
【0030】実施例2 本実施例による文字認識装置も図1に示す構成である。
ただし、認識部5の処理内容が前記実施例1と一部相違
する。図6に認識部5の概略処理フローを示す。
【0031】認識部5の詳細分類制御部6は、認識しよ
うとする文字画像の輪郭長Lによって認識辞書8のオフ
セットテーブル9を参照することにより、輪郭長Lに等
しい下限しきい値を持つ先頭の特徴量レコードのアドレ
スを決定する(ステップ40)。詳細分類制御部6は、
この先頭の特徴量レコードの上限しきい値と輪郭長Lと
の大小比較判定を行ない(ステップ44)、上限しきい
値>輪郭長Lであれば、詳細分類部7によって、当該特
徴量レコードの詳細分類用特徴量と特徴抽出部4より入
力した詳細分類用特徴量とのマッチングを行なわせ(ス
テップ46)、これを終わると次の特徴量レコードへ処
理を進める(ステップ48)。
【0032】他方、上限しきい値≦輪郭長Lの場合、詳
細分類制御部6は現在処理している特徴量レコードの下
限しきい値より小さい次の下限しきい値を持つ特徴量レ
コードの先頭へのオフセットをテーブル9より求め(ス
テップ50)、この先頭の特徴量レコードの処理を開始
する。つまり、ある下限しきい値に関して上限しきい値
>輪郭長Lの条件を満たさない特徴量レコードが出現す
ると、その後の特徴量レコードに対する処理をスキップ
し、次の下限しきい値を持つ特徴量レコードへの処理に
跳ぶ。このようなスキップ・ジャンプの制御は、同じ下
限しきい値を持つ特徴量レコードを上限しきい値の大き
い順にソートしたために可能となったものである。
【0033】このようにして最後の特徴量レコードまで
処理が済むと、詳細分類制御部6は終了と判断し(ステ
ップ42)、詳細分類部7に得られた候補文字を出力さ
せ(ステップ52)、一つの文字画像に対する認識処理
を完了する。
【0034】図7は輪郭長Lが10の場合の説明図であ
る。下限しきい値が7の「呼」から、下限しきい値が6
の特徴量レコードへジャンプが起こる。この後も、下限
しきい値が小さいので当然に上限しきい値も小さくなる
ため、連続的にジャンプが起こり単時間で最終の特徴量
レコードまで到達することになる。
【0035】実施例3 本実施例による文字認識装置は図1に示す構成である。
ただし、認識部5の処理内容が前記実施例1及び2と一
部相違する。図8に認識部5の概略処理フローを示す。
【0036】本実施例は、ある特定値X以上の下限しき
い値を持つ特徴量レコードとのマッチングに関しては、
前記実施例1と同様の制御を行なうが、それより小さい
下限しきい値を持つ特徴量レコードとのマッチングに関
しては前記実施例2と同様のスキップ・ジャンプの制御
を行なう。
【0037】すなわち、詳細分類制御部6は、認識しよ
うとする文字画像の輪郭長Lによって認識辞書8のオフ
セットテーブル9を参照することにより、輪郭長Lに等
しい下限しきい値を持つ先頭の特徴量レコードのアドレ
スを決定し(ステップ60)、この先頭の特徴量レコー
ドより処理を開始するが、現在の下限しきい値がX以上
であれば(ステップ64)、上限しきい値>輪郭長Lの
条件を満たす特徴量レコードについてのみ詳細分類を行
なって行わせる制御を行なう(ステップ66〜70)。
しかし、下限しきい値<Xの場合には、上限しきい値>
輪郭長Lを満足する特徴量レコードについてのみ詳細分
類を行なわせ、この条件を満たさない特徴量レコードが
出現したときは次の下限しきい値を持つ特徴量レコード
へジャンプし処理を始めるという制御を行なう(ステッ
プ72〜78)。そして、最後の特徴量レコードまで処
理が済むと認識結果を出力させ(ステップ62,8
0)、処理を完了する。
【0038】図9において、X=7であるとすると、下
限しきい値が10の「間」から下限しきい値が7の
「音」までは、上限しきい値>輪郭長L(=10)の特
徴量レコードについて詳細分類が行なわれる。しかし、
下限しきい値が6の特徴量レコードからは、上限しきい
値≦輪郭長Lの特徴量レコードで次の下限しきい値への
ジャンプが起こる。
【0039】なお、本実施例の変形例によれば、下限し
きい値が特定値X以上の特徴量レコードに関しては、上
限しきい値>輪郭長Lの条件判定も行なわず、全ての特
徴量レコードについて無条件に詳細分類が行なわれる。
図8に示した処理フローからステップ66を省けば、こ
の変形例における認識部5の処理フローとなる。
【0040】実施例4 本実施例による文字認識装置は図1に示す構成である。
ただし、認識部5の処理内容が前記実施例3と一部相違
する。図10に認識部5の概略処理フローを示す。
【0041】本実施例と前記実施例3との相違は、前記
実施例3では下限しきい値が固定したある値X以上であ
るか否かによってマッチングの制御を切り替えたが、本
実施例では、この制御を切り替える境界の下限しきい値
を固定せず、認識しようとする文字画像の輪郭長Lから
ある値だけ小さい値に選ぶことである。また、この値以
上の下限しきい値を持つ特徴量レコードに関しては、上
限しきい値>輪郭長Lの条件判定を行なわず、全てにつ
いて詳細分類を行なうことも前記実施例3と異なる。
【0042】図10に本実施例における認識部5の概略
処理フローを示すが、図8との違いは、図8中のステッ
プ66が省かれていことと、図8のステップ64に対応
するステップ65において、現在の下限しきい値≧(輪
郭長L−N)の判定を行なっていることである。ただ
し、Nは固定値である。
【0043】図11はL=10、N=3の場合の説明図
である。下限しきい値が10から7までの特徴量レコー
ドについては無条件に詳細分類が行なわれるが、下限し
きい値が6以下の特徴量レコードに関しては、上限しき
い値の条件を満たすもののみ詳細分類が行なわれ、この
条件を満たさない特徴量レコードではジャンプが起こ
る。
【0044】なお、本実施例の変形例によれば、(輪郭
長−N)以上の下限しきい値を持つ特徴量レコードに関
して、上限しきい値>輪郭長Lの条件を満たす特徴量レ
コードについてのみ詳細分類が行なわれる。図10に示
した処理フローのステップ68の直前に、図8のステッ
プ66に対応する判定ステップを追加すれば、この変形
例における認識部5の処理フローとなる。
【0045】
【発明の効果】以上、実施例によって詳細に説明したよ
うに、本発明は次のような効果を得られるものである。
【0046】(1)請求項1または2の発明によれば、
大分類と詳細分類による階層的文字認識のために好適で
容量も小さい優れた認識辞書を実現できる。
【0047】(2)請求項3の発明によれば、大分類に
必要な時間が少なく、無駄な詳細分類による時間がな
く、効率的かつ高速の文字認識処理が可能になる。
【0048】(3)請求項4の発明によれば、下限しき
い値により絞り込まれた範囲内でスキップ・ジャンプの
制御を行なうことにより、認識処理をさらに効率化・高
速化することができる。
【0049】(4)請求項5、6または7の発明によれ
ば、スキップ制御または上限しきい値による条件判定を
制限された範囲内に限って行なわないことにより、処理
の効率化・高速化と制御の簡略化を両立させることがで
きる。
【図面の簡単な説明】
【図1】本発明による文字認識装置の構成例を示す概略
ブロック図である。
【図2】本発明による認識辞書の全体的構成例を示す図
である。
【図3】認識辞書のオフセットテーブルと特徴量レコー
ドの説明図である。
【図4】実施例1における認識処理の概略フロー図であ
る。
【図5】実施例1における認識処理の説明図である。
【図6】実施例2における認識処理の概略フロー図であ
る。
【図7】実施例2における認識処理の説明図である。
【図8】実施例3における認識処理の概略フロー図であ
る。
【図9】実施例3における認識処理の説明図である。
【図10】実施例4における認識処理の概略フロー図で
ある。
【図11】実施例4における認識処理の説明図である。
【符号の説明】
1 スキャナ 2 文字画像切り出し部 3 文字画像正規化部 4 特徴抽出部 5 認識部 6 詳細分類制御部 7 詳細分類部 8 認識辞書 9 オフセットテーブル 10 特徴量レコード群 11 特徴量レコード 12 コンソール
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−158488(JP,A) 特開 平4−373090(JP,A) 特開 平2−75089(JP,A) 特開 昭63−15383(JP,A) 特開 昭63−126082(JP,A) 特開 昭62−26588(JP,A) 特開 昭61−148585(JP,A) 特開 昭59−99586(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/62 - 9/68 JICSTファイル(JOIS)

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 大分類と詳細分類の2段階で文字を認識
    するための認識辞書であって、文字の大分類用特徴量の
    下限しきい値の大きい順にソートされた、文字の大分類
    用特徴量の上限しきい値及び詳細分類用特徴量を含む文
    字対応の特徴量レコードの群と、認識しようとする文字
    画像の大分類用特徴量の値から、それと等しい大分類用
    特徴量下限しきい値を持つ文字の特徴量レコードの先頭
    を求めるためのテーブルとからなる認識辞書。
  2. 【請求項2】 大分類用特徴量下限しきい値が同一の文
    字に対応した特徴量レコードは、大分類用特徴量の上限
    しきい値の大きい順にソートされていることを特徴とす
    る請求項1記載の認識辞書。
  3. 【請求項3】 文字画像の大分類用特徴量及び詳細分類
    用特徴量を抽出する特徴抽出手段と、該特徴抽出手段に
    より抽出された文字画像の特徴量と請求項1または2記
    載の認識辞書を用いて文字画像の候補文字を決定する認
    識手段とを有し、該認識手段は、該認識辞書のテーブル
    を参照することによって文字画像の大分類用特徴量の値
    に等しい大分類用特徴量下限しきい値を持つ文字に対応
    した先頭の特徴量レコードを求め、この先頭の特徴量レ
    コード以降の特徴量レコードについて順次、大分類用特
    徴量上限しきい値が文字画像の大分類用特徴量の値より
    大きいことを条件に詳細分類用特徴量と文字画像の詳細
    分類用特徴量とのマッチングを行なうことを特徴とする
    文字認識装置。
  4. 【請求項4】 文字画像の大分類用特徴量及び詳細分類
    用特徴量を抽出する特徴抽出手段と、該特徴抽出手段に
    より抽出された文字画像の特徴量と請求項2記載の認識
    辞書を用いて文字画像の候補文字を決定する認識手段と
    を有し、該認識手段は、該認識辞書のテーブルを参照す
    ることによって文字画像の大分類用特徴量の値に等しい
    大分類用特徴量下限しきい値を持つ文字に対応した先頭
    の特徴量レコードを求め、この先頭の特徴量レコードよ
    り順次、大分類用特徴量上限しきい値が文字画像の大分
    類用特徴量より大きいことを条件に詳細分類用特徴量と
    文字画像の詳細分類用特徴量とのマッチングを行ない、
    文字画像の大分類用特徴量の値以下の大分類用特徴量上
    限しきい値を持つ文字の特徴量レコードが出現した場合
    は、この特徴量レコードの文字より次に小さい大分類用
    特徴量下限しきい値を持つ文字に対応した先頭の特徴量
    レコードを該テーブルを参照することにより求め、この
    先頭の特徴量レコードより同様の処理を再開することを
    特徴とする文字認識装置。
  5. 【請求項5】 文字画像の大分類用特徴量及び詳細分類
    用特徴量を抽出する特徴抽出手段と、該特徴抽出手段に
    より抽出された文字画像の特徴量と請求項2記載の認識
    辞書を用いて文字画像の候補文字を決定する認識手段と
    を有し、 該認識手段は、該認識辞書のテーブルを参照することに
    よって文字画像の大分類用特徴量の値に等しい大分類用
    特徴量下限しきい値を持つ文字に対応した先頭の特徴量
    レコードを求め、この先頭の特徴量レコードより順次、 ある固定値以上または文字画像の大分類用特徴量の値よ
    り所定値だけ小さい値以上の大分類用特徴量下限しきい
    値を持つ文字に対応した特徴量レコードに関しては、大
    分類用特徴量上限しきい値が文字画像の大分類用特徴量
    の値より大きいことを条件に詳細分類用特徴量と文字画
    像の詳細分類用特徴量とのマッチングを行ない、 該ある固定値以下または文字画像の大分類用特徴量の値
    より所定値だけ小さい値以下の大分類用特徴量下限しき
    い値を持つ文字に対応した特徴量レコードに関しては、
    大分類用特徴量上限しきい値が文字画像の大分類用特徴
    量より大きいことを条件に詳細分類用特徴量と文字画像
    の詳細分類用特徴量とのマッチングを行うとともに、文
    字画像の大分類用特徴量の値以下の大分類用特徴量上限
    しきい値を持つ文字の特徴量レコードが出現した場合
    は、この特徴量レコードの文字より次に小さい大分類用
    特徴量下限しきい値を持つ文字に対応した先頭の特徴量
    レコードを該テーブルを参照することにより求め、この
    先頭の特徴量レコードより処理を再開することを特徴と
    する文字認識装置。
  6. 【請求項6】 請求項3記載の文字認識装置において、
    認識手段は、文字画像の大分類用特徴量の値より所定値
    だけ小さい値以上またはある固定値以上の大分類用特徴
    量下限しきい値を持つ文字に対応した特徴量レコードに
    関しては、無条件に詳細分類用特徴量のマッチングを行
    なうことを特徴とする文字認識装置。
  7. 【請求項7】 請求項5記載の文字認識装置において、
    認識手段は、ある固定値以上または文字画像の大分類用
    特徴量の値より所定値だけ小さい値以上の大分類用特徴
    量下限しきい値を持つ文字に対応した特徴量レコードに
    関しては、無条件に詳細分類用特徴量のマッチングを
    なうことを特徴とする文字認識装置。
JP03309725A 1991-10-29 1991-10-29 認識辞書及び文字認識装置 Expired - Fee Related JP3121401B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03309725A JP3121401B2 (ja) 1991-10-29 1991-10-29 認識辞書及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03309725A JP3121401B2 (ja) 1991-10-29 1991-10-29 認識辞書及び文字認識装置

Publications (2)

Publication Number Publication Date
JPH05120491A JPH05120491A (ja) 1993-05-18
JP3121401B2 true JP3121401B2 (ja) 2000-12-25

Family

ID=17996549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03309725A Expired - Fee Related JP3121401B2 (ja) 1991-10-29 1991-10-29 認識辞書及び文字認識装置

Country Status (1)

Country Link
JP (1) JP3121401B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH061458U (ja) * 1992-06-11 1994-01-11 住友建機株式会社 建設機械等の速度制御装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH061458U (ja) * 1992-06-11 1994-01-11 住友建機株式会社 建設機械等の速度制御装置

Also Published As

Publication number Publication date
JPH05120491A (ja) 1993-05-18

Similar Documents

Publication Publication Date Title
US8693043B2 (en) Automatic document separation
US6199103B1 (en) Electronic mail determination method and system and storage medium
US20040083224A1 (en) Document automatic classification system, unnecessary word determination method and document automatic classification method
US6327382B1 (en) Image processing method and apparatus and storage medium therefor
JPH0520500A (ja) 文書認識装置
JPH11194793A (ja) 音声ワープロ
CN110765767A (zh) 局部优化关键词的提取方法、装置、服务器及存储介质
CN117171331B (zh) 基于大型语言模型的专业领域信息交互方法、装置及设备
JP3121401B2 (ja) 認識辞書及び文字認識装置
JPH11328318A (ja) 確率テーブル作成装置、確率方式言語処理装置、認識装置、及び、記録媒体
JPH10198683A (ja) 文書画像分類方法
JP2746345B2 (ja) 文字認識の後処理方法
JP4298138B2 (ja) 情報検索方法及びその実施装置並びにその処理プログラムを記録した記録媒体
JP3267038B2 (ja) 文字認識装置
JP2940974B2 (ja) マッチング方法
JP3116453B2 (ja) 英文字認識装置
CN114444497A (zh) 一种基于多源特征的文本分类方法、终端设备及存储介质
JPH1166240A (ja) 文書認識方法および文書認識装置
CN116442769A (zh) 车载中控的交互方法及相关设备
JP3116452B2 (ja) 英文字認識装置
JPH03212783A (ja) マッチング方式
JP2004005103A (ja) 類似文書検索装置および類似文書検索方法
CN117669561A (zh) 一种无监督关键词提取方法、系统、设备及介质
JPH10198763A (ja) 文字認識装置およびコンピュータを文字認識装置として機能させるプログラムを格納したコンピュータが読取可能な記憶媒体
JP2917310B2 (ja) 単語照合における単語辞書検索方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071020

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081020

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees