JPH01269190A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH01269190A
JPH01269190A JP63096936A JP9693688A JPH01269190A JP H01269190 A JPH01269190 A JP H01269190A JP 63096936 A JP63096936 A JP 63096936A JP 9693688 A JP9693688 A JP 9693688A JP H01269190 A JPH01269190 A JP H01269190A
Authority
JP
Japan
Prior art keywords
character
character pattern
tilt
straight lines
slope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63096936A
Other languages
English (en)
Inventor
Toru Futaki
徹 二木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63096936A priority Critical patent/JPH01269190A/ja
Publication of JPH01269190A publication Critical patent/JPH01269190A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字認識装置、特に手書き文字を認識する文字
認識装置に関するものである。
[従来の技術] 手書き文字を対象とした文字認識装置では、筆記者の癖
や記入状況の違いによって生じる文字の変形に対処する
必要がある。変形の中でもとりわけ文字の傾きは、通常
の手書き文字には頻繁に起こる変形であるため、高い正
続率の文字認識を実現するためには文字の傾きを考慮し
た認識処理が不可欠である。
文字の傾きに対応する方法として、文字パターンのモー
メントを計算し、そのモーメントの値に応じて文字パタ
ーンにアフィン変換を施し、傾きを除去した文字を得る
方法が知られている(キャッジ−1R,G、の手書き文
字のモーメント正規化: Ca5ey、R,G、 : 
Moment Normalizationof 1(
andprinted Characters、 IB
M J、RES、DEVELOP1970−9)。
[発明が解決しようとしている課題] しかしながら、上記従来例では文字の傾きを表す指標と
して2次のモーメントを用いているため、次のような欠
点があった。
(1)2次のモーメントの値は人間の認識する文字の傾
きと一致しないことがしばしば起こる。
2次のモーメントは p で定義される。ただし、X o + yoは文字パター
ンPの中心座標、Sは文字パターンPの全面積で、黒画
素についてのみ積和を行う。
この2次のモーメントを第7図の文字に対して計算する
と、124で示した点線で囲む斜めのストロークの部分
の影響でmは正の大きな値となる。しかし、第7図の文
字パターンが大きく傾いているという評価は人間の感覚
と異なり、このmの値を用いて正しい認識を行うことは
困難である。
(2)モーメントの計算は、処理が複雑なため長い計算
時間を必要とする。
本発明は、前記従来例の欠点を除去し、傾きのある文字
に対して傾きの補正を正確に行い、高い正続率での認識
を可能にする文字認識装置を提供する。
又、本発明は、傾きのある文字に対して傾きに対応して
認識を行い、高い正続率での認識を可能にする文字認識
装置を提供する。
[課題を解決するための手段] この課題を解決するために、本発明の文字認識装置は、
入力画像データから文字パターンを抽出して認識する文
字認識装置において、 文字パターンに接する複数の直線を求める直線検出手段
と、得られた前記複数の直線間の距離に基づいて、前記
文字パターンの傾きを計算する傾き計算手段と、前記文
字パターンの傾きに対応して、前記文字パターンの画像
データに変換を施す変換手段とを備える。
又、入力画像データから文字パターンを抽出して認識す
る文字認識装置において、 文字パターンに接する複数の直線を求める直線検出手段
と、得られた前記複数の直線間の距離に基づいて、前記
文字パターンの傾きを計算する傾き計算手段と、前記文
字パターンの傾きに対応して、異なる辞書に基づいて文
字の認識を行う認識手段とを備える。
[作用] かかる構成において、直線検出手段によって得られた文
字パターンに接する複数の直線間の距離に基づいて、傾
き計算手段で前記文字パターンの傾きを計算し、変換手
段でこの計算結果に対応して前記文字パターンの画像デ
ータに変換を施す。
又、直線検出手段によって得られた文字パターンに接す
る複数の直線間の距離に基づいて、傾き計算手段で前記
文字パターンの傾きを計算し、認識手段は、前記文字パ
ターンの傾きに対応でて、異なる辞書に基づいて文字の
認識を行う。
[実施例] 第1図(a)は本実施例の文字認識装置を示すブロック
図である。101は帳票等の原稿に書かれた入力画像デ
ータを電気信号に変換するスキャナ、102は電気信号
の量子化・ノイズ除去等を行う前処理部、103は入力
画像データを記憶しておく画像メモリ、104は入力画
像データから文字パターンを切り出す文字パターン切出
し部、105は文字パターンに接する直線を検出する直
線検出部、106は傾きを表す指標αを求める傾き計算
部、107は指標αの値に応じて画像データに変換を施
す変換部、108は文字パターンの特徴を抽出する特徴
抽出部、109は文字の標準パターンを登録しておく辞
書、110は辞書109を参照し候補文字を出力する文
字識別部である。
次に本実施例の文字認識装置の動作について説明する。
スキャナ101で読み取った画像データは、前処理部2
02で2値のディジタル信号に変換されノイズ除去等の
前処理を経て、画像メモリ103に記憶される。画像メ
モリ103上の画像データに対して、文字パターン切出
し部104で文字パターンを切り出し、直線検出部10
5で文字領域の四角から予め定められた角度で画像デー
タを走査し、文字パターンに接する直線を4本検出する
左上隅から画素データを走査していった時の直線の検出
の例を第2図に示す。本実施例では水平と45°の角度
で走査していって、まず最初に画素1に注目し白画素な
らば続いて画素2に注目する。同様に3.4,5.・・
・の順に画素を調べていき、黒画素にぶつかるまで走査
を続ける。そして、最初にぶつかった黒画素を含むひと
つの走査列を文字に接する直線として得ることができる
。第2図の例では画素17の次で初めて黒画素にぶつか
るので、画素16と画素17を結ぶ直線が求める直線と
なる。
以上の直線検出処理を文字パターンの画像データの四角
すべてから行うことによって第3図に示されている文字
パターン“8”では、接する直線120,121,12
2,123を得ることができる。
次に傾き計算部106で、直線検出部105で得られた
直線120,121.122,123の内、互いに向い
合う直線同士の距離、すなわち直線120と123の距
離d1及び直線121と122の距離d2を求める。そ
して、これら距離d+、dzの値から傾きを表す指標α
を計算する。
本実施例ではαを得る関数として、 の評価関数を用いている。ただし、aは正の定数である
第3図の文字の場合はd I< d 2なのでαの値は
負になる。これは文字が右に傾いていることを表してい
る。逆にαの値が正になるときは文字が左に傾いている
ことを表している。そしてαの絶対値が大きいほど傾き
が大きいことになり、αの値によって文字の傾きの方向
及び大きさを検出することができる。
αを求めるための評価関数は他に、 の形のものを用いることができる。
ここで、bは定数、 ds  =mi n  (d+、dz  )  、d、
、=max  (d+、da  )  、である。ただ
し、この場合傾きの方向は距離d1とd2との大きさを
比較することによって別個に得られる。
文字の傾きは人間の感覚に基づく量であり、定量的な評
価を厳密に行うことは不可能であるが、本実施例による
傾きを表す指標αは文字の外形情報から計算される量で
あり、文字の大局的な傾きを効果的に表現している。
傾き計算部106で求めたαの値に応じて変換部107
で文字の傾きを正規化する変換を行う。
この変換はアフィン変換で実現可能である。
変換された文字画像は特徴抽出部108で所定の特徴抽
出を行い文字識別部110へ送られて辞書1’ 09を
参照することによって候補文字が出力される。
第1図(b)は本実施例の文字認識装置のハードウェア
構成図である。
第1図(b)で、201は画像を入力するスキャナ等の
画像入力部、202は直線検出。
傾き計算、特徴抽出及び文字認識等の処理を行うCPU
、203は処理プログラムを格納するROM、204は
レジスタ等の補助記憶用のRAM、205は画像データ
を記憶する画像メモリ、206は標準パターンを登録し
ておく辞書、207は後の第2実施例で使用される第2
辞書、208は認識結果を出力する出力部である。
第4図はROM203に格納された本実施例の文字認識
装置の処理手順を示すフローチャートである。
まず、ステップS1で画像入力部201から入力された
画像データに前処理及び文字パターンの切り出しを行う
。ステップS2で文字パターンに接する複数の直線を検
出し、ステップS3で前述の式より傾きの指標αを計算
する。ステップS4で指標αに基づいて文字パターンの
画像データにアフィン変換を行い、文字パターンの傾き
を直す。ステップS5では傾きの取れた文字パターンに
対して特徴の抽出を行い、ステップS6で辞書206の
標準パターンと比較して文字の識別を行い、ステップS
7で識別結果を認識結果出力部208に出力する。
[第2実施例コ 第5図は本発明の第2実施例の文字認識装置のブロック
図である。参照番号510,511゜512.513,
514,515,516゜520で示す部分は、それぞ
れ前述の実施例の参照番号Lot、102,103,1
04゜105.106,108,110で示す部分に対
応する。
辞書切換部517では、傾き検出部から出力される傾き
を表す指標αの値を予め定めれられたしきい値と比較し
、文字識別部520で照合に用いる辞書を第1辞書51
8と第2辞書519とのいずれかから選択する。第1辞
書518は傾きの少ない文字を学習することによって得
られた辞書で、第2辞書519は傾きのある文字を学習
することによって得られた辞書である。この場合は第1
図(b)で辞書206と辞書207との2つが使用され
る。
指標αが所定のしきい値より小さい、すなわち入力文字
パターンの傾きが小さい場合は第1辞書518を選択し
、傾きが大きい場合は第2辞書519を選択するので、
文字識別部520では最適の照合が実現できる。
第6図には第2実施例の処理のフローチャートを示す。
ステップS8からステップSIOまでは第4図のステッ
プ81〜S3と同様である。
次に、本実施例では、ステップSllで、ステップSI
Oで計算した傾きの指標αと所定のしきい値とを比較し
、しきい値より小さい時はステップS12に進んで、傾
きの少ない文字の標準パターンを格納する第1辞書51
8(206)により、ステップS14で文字を識別し、
ステップS15で出力する。
一方傾きの指標αがしきい値より大きい時はステップS
13に進んで、傾きの大きい文字の標準パターンを格納
する第2辞書519(207)により、ステップS14
で文字を識別して、ステップS15で出力する。尚、辞
書の数及び分岐は2つに限らない。又、傾き易い文字と
傾きにくい文字とを分離すれば辞書の容量を更に小さく
できる。
以上説明したように、文字画像に対して予め定められた
角度で文字に接する直線を複数求め、これらの直線間の
距離から文字の傾きを表す指標αを計算し、そのαの値
に応じた変換を文字画像に施すことによって、傾きを含
んだ文字に対しても短い処理時間で高正続率の文字認識
が可能になる。
[発明の効果コ 本発明により、傾きのある文字に対して傾きの補正を正
確に行い、高い正続率での認識を可能にする文字認識装
置を提供できる。
又、傾きのある文字に対して傾きに対応して認識を行い
、高い正続率での認識を可能にする文字認識装置を提供
できる。
【図面の簡単な説明】
第1図(a)本実施例の文字認識装置のブロック図、 第1図(b)は本実施例の文字認識装置のハードウェア
構成図、 第2図は画素を走査する順番を表す図、第3図は文字に
接する直線及び直線間の距離を表す図、 第4図は本実施例の処理手順を示すフローチャート、 第5図は第2実施例の文字認識装置のブロック図、 第6図は第2実施例の処理手順を示すフローチャート、 第7図は従来技術を説明するための手書き文字例を示す
図である。 図中、101,510・・・スキャナ、102゜511
・・・前処理部、103,512・・・画像メモリ、1
04,513・・・文字パターン切出し部、105,5
14・・・直線検出部、106゜515・・・傾き計算
部、107・・・変換部、108゜516・・・特徴抽
出部、110,520・・・文字識別部、109・・・
辞書、518・・・第1辞書、519・・・第2辞書、
517・・・辞書切換部、201・・・画像入力部、2
02−CP U、203 ・ROM、204・・・RA
M、205・・・画像メモリ、206゜207・・・辞
書、208・・・認識結果出力部である。

Claims (2)

    【特許請求の範囲】
  1. (1)入力画像データから文字パターンを抽出して認識
    する文字認識装置において、 文字パターンに接する複数の直線を求める直線検出手段
    と、 得られた前記複数の直線間の距離に基づいて、前記文字
    パターンの傾きを計算する傾き計算手段と、 前記文字パターンの傾きに対応して、前記文字パターン
    の画像データに変換を施す変換手段とを備えることを特
    徴とする文字認識装置。
  2. (2)入力画像データから文字パターンを抽出して認識
    する文字認識装置において、 文字パターンに接する複数の直線を求める直線検出手段
    と、 得られた前記複数の直線間の距離に基づいて、前記文字
    パターンの傾きを計算する傾き計算手段と、 前記文字パターンの傾きに対応して、異なる辞書に基づ
    いて文字の認識を行う認識手段とを備えることを特徴と
    する文字認識装置。
JP63096936A 1988-04-21 1988-04-21 文字認識装置 Pending JPH01269190A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63096936A JPH01269190A (ja) 1988-04-21 1988-04-21 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63096936A JPH01269190A (ja) 1988-04-21 1988-04-21 文字認識装置

Publications (1)

Publication Number Publication Date
JPH01269190A true JPH01269190A (ja) 1989-10-26

Family

ID=14178221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63096936A Pending JPH01269190A (ja) 1988-04-21 1988-04-21 文字認識装置

Country Status (1)

Country Link
JP (1) JPH01269190A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244386A (ja) * 2009-04-08 2010-10-28 Canon Electronics Inc 画像読取装置、画像読取装置の制御方法、制御プログラム、及び記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010244386A (ja) * 2009-04-08 2010-10-28 Canon Electronics Inc 画像読取装置、画像読取装置の制御方法、制御プログラム、及び記憶媒体

Similar Documents

Publication Publication Date Title
US7233697B2 (en) Character recognition device and a method therefor
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
JPH01269190A (ja) 文字認識装置
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JP2788506B2 (ja) 文字認識装置
JPH11282959A (ja) 文字列照合装置、方法及び記録媒体、並びに文書分類装置、文字読み取り装置及び真贋判定装置
JP2795860B2 (ja) 文字認識装置
JPH07168911A (ja) 文書認識装置
JP4089807B2 (ja) バーコード認識方法および装置並びにプログラム
JP3606218B2 (ja) 文書分類装置、文字読み取り装置及び真贋判定装置、並びにこれらの方法
JP2973892B2 (ja) 文字認識方式
JP2747136B2 (ja) 文字認識装置
JP4248700B2 (ja) 罫線識別方法、罫線識別装置および記録媒体
JPH10214308A (ja) 文字判別方法
KR930012139B1 (ko) 문자인식을 위한 자획추출방법
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JPH06274689A (ja) 文字認識装置
JP4270767B2 (ja) 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体
JP2732753B2 (ja) ファジィパターン認識装置
CN117710985A (zh) 光学字符识别方法、装置及智能终端
JPH01191989A (ja) 文字認識方法
JPH04291479A (ja) 罫線認識方法及び表処理方法
JPH0517598B2 (ja)
Suman et al. OPTICAL CHARACTER RECOGNITION USING ANDROID
JPS6156554B2 (ja)