JPS6272085A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6272085A
JPS6272085A JP60212856A JP21285685A JPS6272085A JP S6272085 A JPS6272085 A JP S6272085A JP 60212856 A JP60212856 A JP 60212856A JP 21285685 A JP21285685 A JP 21285685A JP S6272085 A JPS6272085 A JP S6272085A
Authority
JP
Japan
Prior art keywords
pattern
character
dictionary
input
inputted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60212856A
Other languages
English (en)
Inventor
Kenichi Maeda
賢一 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP60212856A priority Critical patent/JPS6272085A/ja
Publication of JPS6272085A publication Critical patent/JPS6272085A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は、種々の文字フォントを効果的にIH!するこ
とのできる文字認識装置に関する。
(発明の技術的背景とその問題点) 入力文字パターンと辞S1U録された還準辞1パターン
とを照合して、例えば複合類似度法や混合類似度法によ
ってその類似度を求め、上記入力文字を認識処理する文
字II装置が種々開発されて。
いる。特に印刷文字を認識する装置の普及には目覚まし
いものがある。
この種の文字認識装置にあっては、予め認識対象文字(
印刷文字)のフォントを考慮して、その辞書く標準辞書
パターン)を作成しておくことが必要である。尚、複数
種の文字フォントを考慮して辞書(辞書パターン)を作
成しておくことによリ、所謂マルチフォントに対応でき
る文字認識装置も開発されている。
ところで近年、i!電算写植技術発達に伴い、自由にデ
ザインされたフォントによる文字印刷が盛んに行われる
ようになってきた。このことは、文字0識装置にとって
は、予め認識対象とする文字のフォントを特定すること
ができないことを意味する。これ故、印刷文字の認識技
術に性能的な限界が生じることが否めなかった。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、予めフォントが特定されていな
い印刷文字についても、簡易な学習によって効果的に認
識することのできる文字認識装置を提供することにある
(発明の概要) 本発明は、複合類似度法または混合類似度法によって入
力文字をWg識処理する文字認識装置において、 上記複合類似度法または混合類似度法による辞1パター
ンとの類似度計算に供される入力文字の処理パターン、
例えば正規化処理およびボケ処理が施された文字パター
ンを記憶しておき、その入力文字に対する認識エラーや
Hlリジェクトが発生したときに、上記記憶された処理
パターンに微分操作を施してその入力文字カテゴリの辞
書パターンを即時作成し、その入力文字をHaできるよ
うにしたものである。
〔発明の効果〕
かくして本発明によれば、認識対象とする文字のフォン
トを予め特定しておくことなしに、その入力文字パター
ンに対する即時学習によって、該入力文字を効果的に認
識することが可能となる。
従って電算写植技術を用いて自由にデザインされた印刷
文字に対しても、その認識を高精度に行うことが可能と
なり、認識技術の性能な限界を高めることが可能となる
等の実用上多大なる効果が奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の実施例につき説明する。
第1図は本発明に係る第1の実施例装置の概略構成図で
ある。
パターン入力部1は、ITVカメラやCCDセンサとA
/D変換器等から構成され、印刷文字を光電変換して読
取り入力している。このパターン入力部1から入力され
た文字情報は、正規化処理部2にてその文字の大きざが
正規化された後、ボケ処理部3にてボケ操作が施される
文字の大きさの正規化は、例えばその入力文字パターン
の外接枠を求め、この外接枠を一定の大きさにするべく
、上記入力文字パターンの大きさを可変制御することに
より達せられる。またボケ操作は、文字認識処理におけ
る本質的な処理ではないが、ノイズ軽減等の効果を得る
為に施すものであり、例えばガウス関数のマスク操作等
によって実現される。これらの処理は、文字認識装置に
おける認識文字パターンに対する館処理として一般的な
ものである。
上記ボケ操作が施された入力文字の処理パターン(ボケ
パターン)は一旦ボケ・パターン・メモリ4に格納され
たのち、このメモリ4から複合類似度計算部5に与えら
れて類似度計算に供される。
この複合類似度計算部5は、辞書メモリ6に格納された
種々の認識対象カテゴリβの標準文字辞書パターンφm
(ρと、前記ボケ・パターン・メモリ4から与えられた
入力文字のボケパターンでとの複合類似度3 (j)を
、aIll(41を係数として次のようにして計算する
ものである。
このようにして各認識対象カテゴリの辞書パターンにつ
いてそれぞれ求められた前記ボケパターンの類似度値が
制御部7に与えられる。制御部7では、例えば各類似度
値に対するソーティングや閾値比較等を行い、前記入力
文字に対するtel結果を求めている。
そしてこのHa結果は、1ilI@コンソール8のディ
スプレイに表示されたり、外部IIに出力されたゆする
以上の認識処理は、認識処理に供するボケパターンを−
Hボケ・パターン・メモリ4に格納している点を除いて
、従来より提唱されている文字認識装置と同様なもので
ある。
ここで本装置が特徴とする点は、 ■ 前記複合類似度計算に供するボケパターンをボケ・
パターン・メモリ4に格納している点、■ 前記入力文
字に対する認識結果が間違っていたり、或いは認識不能
としてリジエクi−されたとき、制御コンソール8から
の上記入力文字に関する正しいカテゴリの入力を受けて
微分処理部9および正規直交化処理部10をそれぞれ起
動するようにした点にある。
微分処理部9は、前記ボケ・パターン・メモリ4に格納
されたボケパターンに対して、X方向およびy方向にそ
れぞれ微分操作を施すものである。
この微分操作は、具体的にはマスク演算によって実現さ
れる。
しかして正規直交化処理部10は、微分操作が施された
X方向微分パターン、y方向微分パターン、および前記
ボケパターンがそれぞれ正規直交化するように変換処理
し、その正規直交化されたパターンをその入力文字カテ
ゴリに関する新しい辞書パターンとしている。この辞書
パターンが前記辞書メモリ6に登録されて前記複合類似
度計算に供せられる。
尚、この新しい辞書パターンの辞書メモリ6への登録時
には、該カテゴリの古い(今までの)辞書パターンを消
去しても良いが、辞書容量に余裕がある場合には、上記
古い辞書パターンをそのまま残した上で、上記新しい辞
書パターンを登録するようにすれば良い。
このようにして正しり認識できなかった文字パターンに
対する辞書パターンの作成の為の学習が、前記ボケ・パ
ターン・メモリ4に格納されているボケパターンを用い
て即時行われ、これによって作成された新しい辞書パタ
ーンが辞書メモリ6に速やかに登録される。この結果、
上記正しく認識出来なかったパターンが再度入力される
と、その入力文字パターンを、上記新しく辞書登録され
た辞1パターンを用いて正しく認識ることが可能となる
以上のように本装置によれば、予め認識対象文字のフォ
ントを特定しておかなくても、自由にデザインされたフ
ォントの文字に対して即時適応することができる。
従って既存文献の文書情報を計算機入力する場合等、文
字認識を前提とすることなく印刷された文書の文字情報
を効果的に読取り入力することが可能となり、実用上多
大なる効果が奏せられる。
さて第2図は本発明の別の実施例装置を示す概略構成図
である。
この装置は、混合類似度法により文字認識するものであ
る。尚、第1図に示す装置と基本的に同一部分には同一
符号を付して示しである。
この装置は、正規化処理部2で正規化処理された文字パ
ターンを正規化パターンメモリ11に格納した後、ボケ
処理部3に与えるように構成されている。
そして混合類似度計算部12では、ボケ・パターン・メ
モリ4に格納された入力文字のボケパターンと、辞書メ
モリ6に辞書登録された種々カテゴリの辞書パターンと
の間で次のようにしてその混合類似度値を計算している
s′(7) x s(4−b″)(f、Φ答2/(If
 f II” IIΦ(411’)但し、Φ(4は辞書
パターンであり、bC4は係数である。
しかしてこのような混合類似度法による文字認識におい
て認識エラーや認識リジェクトが発生すると、その正し
いカテゴリの入力によってマスク操作部13、正規直交
化処理部10、および引算器14がそれぞれ起動され、
そのカテゴリに関する新しい辞書パターンの作成が行わ
れるようになっている。
即ち、マスク操作部13は、前記正規化パターン・メモ
リ11に格納された入力文字の正規化パターンを読出し
、マスク操作によって微分処理とボケ処理を施している
。つまり微分処理とボケ処理はいずれもマスク操作によ
り実現できることから、マスク操作部13では上記2つ
の処理を1度のマスク操作によって実現するようにして
いる。
このようにすれば、先の実施例に比較して計算誤差が入
込むことが少なくなり、辞書の精度を高める上で有利で
ある。
しかして今、カテゴリAの入力文字をカテゴリBの文字
であると誤って認識したとすると、前記マスク操作部1
3は、正規化パターン・メモリ11に格納されたカテゴ
リAの入力文字のパターンに従って、そのX方向微分パ
ターン、y方向微分パターン、および前記ボケパターン
をそれぞれ得る。
一方、引算器14は、間違って0!識したカテゴリBの
辞書パターンφR1(B)を前記辞書メモリ6から読出
し、この辞書パターンφm(8)の成分を前記ボケ・パ
ターン・メモリ4に格納されたカテゴリAのボケパター
ンfの成分から差引いてΦ(B)を作成する。この引算
処理によって、入力文字をカテゴリBと認識するに至っ
た成分が除去されたパターン成分が求められる。
正規直交化処理部10は、この差のパターンと前記3つ
のパターンがそれぞれ正規直交化するように変換処理し
、その正規直交化されたパターンをその入力文字のカテ
ゴリAに関する新しい辞書パターンΦ(B)としている
。この辞書パターンが前記辞書メモリ6に登録されて前
記混合類似度計算に供せられる。
このように装置を構成しても前述した実施例と同様な効
果が奏せられる。
尚、本発明は上述した各実施例に限定されるものではな
い。ここでは、認識エラーや認識リジェクトが発生する
都度、その文字パターンについて学習を行って新しい辞
書パターンを作成するようにしたが、例えば第2図に示
すようにf!’![1理に供せられるパターンを逐次外
部メモリ15に登録しておき、これらのパターンを一括
修正するようにしても良い。またマスク操作や、正規直
交化処理の手法は、その学習仕様に応じて定めれば良い
ものである。要するに本発明はその要旨を逸脱しない範
囲で種々変形して実施することができる。
【図面の簡単な説明】
第1図は本発明の一実施例装置の概略構成図、第2図は
本発明の別の実施例装置の概略構成図である。 1・・・パターン入力部、2・・・正規化処理部、3・
・・ボケ処理部、4・・・ボケ・パターン・メモリ、5
・・・複合類似度計算部、6・・・辞書メモリ、7・・
・制御部、8・・・制御コンソール、9・・・微分処理
部、10・・・正規直交化処理部、11・・・正規化メ
モリ、12・・・混合類似度計算部、13・・・マスク
操作部、14・・・引算器。 出願人代理人 弁理士 鈴江武彦 第1図

Claims (4)

    【特許請求の範囲】
  1. (1) 複合類似度法または混合類似度法によつて入力
    文字を認識処理する文字認識装置において、上記複合類
    似度法または混合類似度法による辞書パターンとの類似
    度計算に供される入力文字の処理パターンを記憶する手
    段と、この記憶された処理パターンに微分操作を施して
    その入力文字カテゴリの辞書パターンを作成する学習手
    段とを具備したことを特徴とする文字認識装置。
  2. (2) 学習手段は、入力文字の認識エラー、またはリ
    ジェクトに対する修正指示の入力によつて起動されるも
    のである特許請求の範囲第1項記載の文字認識装置。
  3. (3) 辞書パターンとの類似度計算に供される入力文
    字の処理パターンは、文字の入力パターンを正規化処理
    した後、ボケ操作を加えたものである特許請求の範囲第
    1項記載の文字認識装置。
  4. (4) 処理パターンに対する微分操作は、処理パター
    ンを2次元的に微分処理した後、正規直交化処理するも
    のである特許請求の範囲第1項記載の文字認識装置。
JP60212856A 1985-09-26 1985-09-26 文字認識装置 Pending JPS6272085A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60212856A JPS6272085A (ja) 1985-09-26 1985-09-26 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60212856A JPS6272085A (ja) 1985-09-26 1985-09-26 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6272085A true JPS6272085A (ja) 1987-04-02

Family

ID=16629442

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60212856A Pending JPS6272085A (ja) 1985-09-26 1985-09-26 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6272085A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01277981A (ja) * 1988-04-28 1989-11-08 Internatl Business Mach Corp <Ibm> 文字認識装置
JP2010198188A (ja) * 2009-02-24 2010-09-09 Toshiba Corp 画像認識装置、画像認識方法
JP2011154708A (ja) * 2011-03-24 2011-08-11 Toshiba Corp 画像認識装置、画像認識方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01277981A (ja) * 1988-04-28 1989-11-08 Internatl Business Mach Corp <Ibm> 文字認識装置
JPH0727543B2 (ja) * 1988-04-28 1995-03-29 インターナシヨナル・ビジネス・マシーンズ・コーポレーション 文字認識装置
JP2010198188A (ja) * 2009-02-24 2010-09-09 Toshiba Corp 画像認識装置、画像認識方法
US8249378B2 (en) 2009-02-24 2012-08-21 Kabushiki Kaisha Toshiba Image recognition apparatus and image recognition method
JP2011154708A (ja) * 2011-03-24 2011-08-11 Toshiba Corp 画像認識装置、画像認識方法

Similar Documents

Publication Publication Date Title
EP0621542B1 (en) Method and apparatus for automatic language determination of a script-type document
US7088873B2 (en) Bit-mapped image multi-stage analysis method
JPS6272085A (ja) 文字認識装置
EP0434871B1 (en) Character recognition method
JPH0388062A (ja) 文書作成装置
JP2713306B2 (ja) 文字認識方法
JPH01311390A (ja) 文字置換制御方式
CN116484844A (zh) 一种单据ocr识别结果纠错方法、系统、设备及介质
JPS5914078A (ja) 帳票読取装置
JPS6227874A (ja) 文字認識装置
JPS61221978A (ja) 多色図面読取装置
JPS622382A (ja) 画像処理方法
JP2917396B2 (ja) 文字認識方式
JPS5960582A (ja) 光学的文字読取装置
JPS62281089A (ja) 画像処理方法
JPH0259504B2 (ja)
JPH0137790B2 (ja)
JPH04113487A (ja) 文字認識装置
JPH04142684A (ja) 文字認識装置
JPS6252886B2 (ja)
JPS5977579A (ja) パタ−ン認識装置
JPS58203578A (ja) 文字認識装置
JPS62281088A (ja) 画像処理方法
JPH06187506A (ja) 文字認識装置
JPH07306911A (ja) Ocr読取結果修正装置