JPH04343193A - 2値化閾値設定方法 - Google Patents

2値化閾値設定方法

Info

Publication number
JPH04343193A
JPH04343193A JP3143885A JP14388591A JPH04343193A JP H04343193 A JPH04343193 A JP H04343193A JP 3143885 A JP3143885 A JP 3143885A JP 14388591 A JP14388591 A JP 14388591A JP H04343193 A JPH04343193 A JP H04343193A
Authority
JP
Japan
Prior art keywords
image
character
normalized
recognition
binarization threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3143885A
Other languages
English (en)
Inventor
Hideaki Yamagata
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3143885A priority Critical patent/JPH04343193A/ja
Publication of JPH04343193A publication Critical patent/JPH04343193A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置に係り、
特に文字の正規化2値画像を作成するために用いる2値
化閾値の設定方法に関する。
【0002】
【従来の技術】文字の元画像から、曲面補間を用いて正
規化サイズの多値画像を作成し、これを階調数の2分の
1の濃度を閾値として2値化することにより正規化2値
画像を作成し、これについてマッチングを行なう方法が
提案されている(塩野ほか、「方向性マッチングによる
常用手書き文字の認識」、電子通信学会論文誌  ’8
0/5、Vol.J63−D、No.5、pp.402
−409)。
【0003】また、文字認識装置において、文字画像の
文字線分の太さを検出し、検出した太さに応じて、マス
クを用い文字画像に太め処理あるいは細め処理を施して
から認識する手法が、特開昭63−280390号公報
や特開昭61−269780号公報に記載されている。
【0004】
【発明が解決しようとする課題】一般に文字認識装置の
認識系は、文字の正規化2値画像についてマッチングを
行ない認識するが、正規化2値画像の文字線分太さの変
動により認識率が左右される。
【0005】前記論文に述べられた従来技術によれば、
文字線分の太さがほぼ等しい単一フォントの場合につい
ては高い認識率を達成できるが、文字線分の太さの異な
るフォントを対象とすると、2値化閾値が固定している
ために、正規化2値画像の文字線分が変動し、期待する
認識率を得られないという問題がある。例えば文字線分
が細い明朝体に対し、正規化2値画像の文字線分が最適
な太さとなるように2値化閾値を設定すると、文字線分
の太いゴシック体などのフォントの正規化2値画像に潰
れが生じ、逆にゴシック体に2値化閾値を合わせると、
明朝体などの文字線分の細いフォントの正規化2値画像
にかすれが生じることから、十分な認識性能が得られな
い。
【0006】他方、前記公開特許公報に述べられた従来
技術のように、入力文字線分の太さに応じて太め処理ま
たは細め処理を行なうことにより、文字線分の太さの変
動を抑えることができる。しかし、マスクをかけて文字
画面全面を操作する処理は時間が非常にかかり、これを
全文字に行なうことになるので、認識速度が著しく低下
するという問題がある。
【0007】本発明の目的は、文字認識装置において、
正規化多値画像の2値化閾値の設定方法を改良すること
により、文字画像に太め処理や細め処理を施さずとも、
様々な文書に対して高い認識率を達成可能とすることに
ある。
【0008】
【課題を解決するための手段】請求項1の発明は、文書
画像より切り出した文字の元画像の正規化多値画像を作
成し、これを2値化した画像を認識系に入力し認識させ
る文字認識装置において、該正規化多値画像の画素値ヒ
ストグラムを作成し、該画素値ヒストグラムに基づき、
該正規化多値画像の2値化後の黒画素数が該認識系によ
って定まるある値に近くなる2値化閾値を決定し、これ
を該正規化多値画像の2値化閾値として設定することを
特徴とするものである。
【0009】請求項2の発明は、文書画像より切り出し
た文字の元画像の正規化多値画像を作成し、これを2値
化した画像を認識系に入力し認識させる文字認識装置に
おいて、異なった複数の2値化閾値で該正規化多値画像
をそれぞれ2値化し、得られた正規化2値画像上の文字
線分の太さを検出し、該文字線分の太さが該認識系によ
って定まるある文字線分の太さに最も近い2値化閾値を
求め、これを該正規化多値画像の2値化閾値として設定
することを特徴とするものである。
【0010】請求項3の発明は、文書画像より切り出し
た文字の元画像の正規化多値画像を作成し、これを2値
化した画像を認識系に入力し認識させる文字認識装置に
おいて、該元画像のサイズと文字線分の太さを測定し、
該サイズ及び太さを用い、該認識系によって定まる計算
式により2値化閾値を求め、これを該正規化多値画像の
2値化閾値として設定することを特徴とするものである
【0011】
【作用】文字認識装置の認識系に入力される正規化2値
画像中の黒画素数と認識率の関係を調べると、黒画素数
がある範囲内にある場合に高い認識率を得られることが
認められる。この黒画素数の範囲は認識系の認識手法に
依存するが、特定の認識系の場合、最適な黒画素数を求
めることができる。したがって、請求項1の発明によれ
ば、適用する認識系で最も認識率が高くなる黒画素数を
予め求めておくことにより、入力文書の濃淡やフォント
に適応させて最適な2値化閾値を設定できる。
【0012】また、特定の認識系では、入力される正規
化2値画像中の文字線分の太さが、ある範囲内の場合に
高い認識率が得られる。したがって、請求項2の発明に
よれば、予め適用する認識系に最適な文字線分の太さを
求めておくならば、入力文書に適応させて最適な2値化
閾値を設定できる。
【0013】同様に、特定の認識系において、文字の元
画像のサイズ及び文字線分の太さと、高い認識率が得ら
れる2値化閾値との関係を調べると、元画像のサイズ及
び文字線分太さより最適な2値化閾値を求めるための比
較的簡単な計算式を導くことができる。したがって、請
求項3の発明によれば、適用する認識系について、その
ような計算式を予め用意することによって、入力文書に
適応させて最適な2値化閾値を設定できる。
【0014】
【実施例】図1は、本発明の実施例に係る光学的文字読
み取り装置(OCR)の概略ブロック図である。
【0015】図1において、1は文書(帳票)の画像情
報を入力するスキャナ1である。文字切り出し部2にお
いて、スキャナ1からの入力画像を一時的に蓄積し、個
々の文字の画像(元画像)を切り出す。文字画像多値化
部3は、文字の元画像のサイズを正規化した多値画像を
生成する。この処理は、例えば前記論文に述べられてい
るような元画像に対して曲面補間を用いる方法によって
行なわれるが、実際的には座標と階調の関係などをテー
ブル化し処理を高速化するのが望ましい。この正規化多
値画像は文字画像2値化部5で2値化されることにより
、文字の正規化2値画像が作成されるが、この2値化に
用いられる2値化閾値は2値化閾値決定部4により設定
される。この2値化閾値の設定方法については各実施例
毎に後述する。
【0016】6は認識系であり、文字の正規化2値画像
の特徴量を抽出する特徴抽出部7、文字の標準特徴量を
登録したパターン辞書8、特徴抽出部7によって抽出さ
れた特徴量とパターン辞書8とのマッチングを行なって
候補文字を決定するマッチング部9よりなる。10は単
語知識を登録した単語辞書、11はマッチング9により
得られた文字単位の認識結果を単語辞書10内の単語知
識を用い修正する後処理部である。この後処理後の認識
結果が結果出力部12により結果ファイル13に出力さ
れる。
【0017】以下、本発明の要旨に直接関係する2値化
閾値決定部4の処理について、実施例毎に説明する。
【0018】実施例1   本実施例では、正規化2値画像の黒画素数が、認識
系6の認識手法によって定まるある値(画素数閾値)と
なるように2値化閾値を決定する。処理のフローを図2
に示す。
【0019】まず、正規化多値画像の画素値(画素濃度
)ヒストグラムを作成する(ステップ21)。このヒス
トグラムより、濃度閾値dを最高階調より変化させなが
ら、画素値ヒストグラムH(d)を加算して、各濃度閾
値までの画素数累積dotを求めて画素数閾値THと比
較することにより、画素数累積dotが初めて画素数閾
値THを越えた濃度閾値dを検出し(ステップ22,2
3,24)、この閾値濃度dを2値化閾値として文字画
像2値化部5に設定する(ステップ25)。
【0020】ここでは、正規化多値画像の正規化サイズ
が48×48ドット、階調数を16階調とし、図3に示
すような画素値ヒストグラム(黒部分)が得られたとす
る。そして、認識系6において正規化2値画像中の黒画
素数が1400個程度で最も認識率がよいとして、画素
数閾値THは1400に選ばれるとする。この場合、最
高濃度から各濃度までの画素数累積dotは図3の白部
分のようになり、d=8で画素数累積dotがTHを初
めて越える。したがって、画素濃度8を2値化閾値とし
て設定する(画素濃度が8以上の画素は黒画素、画素濃
度が8未満の画素は白画素に2値化されることになる)
【0021】実施例2   本実施例では、様々な2値化閾値を用いて実際に正
規化多値画像の2値化を行ない、2値画像上の文字線分
が最適な太さとなる2値化閾値を求める。処理フローを
図4に示すが、階調数は16階調としている。
【0022】2値化閾値を画素濃度3から画素濃度12
まで変化させ、文字画像2値化部4にて各2値化閾値で
2値化を実行させ、得られた正規化2値画像中の文字線
分の太さを検出する(ステップ31〜ステップ35)。 なお、文字線分の太さの検出は、前記特開昭63−28
0390号公報に述べられている方法などで行なえばよ
い。
【0023】次に各2値化閾値での文字線分の太さと、
認識系6で最も認識率がよい文字線分の太さと比較し、
差が最も小さい2値化閾値を選び(ステップ36)、こ
れを2値化閾値として文字画像2値化部5に設定する(
ステップ37)。
【0024】各2値化閾値で図5に示すような文字線分
の太さが得られ、認識系6では文字線分が4ドットの太
さのときに最も認識率がよい場合、2値化閾値は7に設
定されることになる。なお、最適な文字線分の太さは、
認識系6の認識手法に応じて選ぶ必要がある。
【0025】実施例3   本実施例においては、図6に示すように、文字の元
画像上で文字線分の太さと、元画像のサイズを測定し(
ステップ41)、この太さとサイズを用いて特定の計算
を行ない最適な2値化閾値を求め(ステップ42)、こ
の2値化閾値を文字画像2値化部5に設定する(ステッ
プ43)。
【0026】2値化閾値の計算式は例えば(数1)であ
るが、これは認識系6の特性に応じて最も認識率が良好
な2値化閾値が得られるように予め決定されるものであ
る。
【数1】2値化閾値=(文字線分の太さ×48×3)/
(元画像高さ×元画像幅)
【0027】例えば元画像の幅が50ドット、高さが6
0ドット、元画像上の文字線分の太さが8ドットの場合
、(数1)によれば2値化閾値は10となる。なお、2
値化閾値の計算をテーブル化してもよい。
【0028】2値化閾値を決定するために2値化処理と
文字線分太さ検出を繰り返す前記実施例2に比べ、本実
施例によれば短時間で2値化閾値を決定できる。
【0029】なお、前記各実施例において、2値化閾値
の設定処理は各入力文書毎に行なってもよいし、装置利
用者より設定指示があった時に行なってもよい。また、
1つの文字画像に基づいて2値化閾値設定の処理を行な
うとして説明したが、文字毎のばらつきの影響を避ける
ために、複数の文字画像について2値化閾値を求め、そ
の平均をとって、あるいは多数決により、設定する2値
化閾値を決定してもよい。
【0030】
【発明の効果】以上説明した如く、請求項1ないし3の
発明によれば、入力文書の濃淡やフォントに適応させて
、認識系に最適な2値化閾値を設定することができるた
め、認識速度の低下を招くような、マスクによる文字画
像に対する文字線分の太め処理や細め処理などを行なう
ことなく、様々な文書やそのコピー原稿に対し高い認識
率を達成できる。
【図面の簡単な説明】
【図1】本発明の実施例に係る文字認識装置のブロック
図である。
【図2】本発明の第1の実施例における2値化閾値設定
処理のフロー図である。
【図3】画素値ヒストグラムの例をす図である。
【図4】本発明の第2の実施例における2値化閾値設定
処理のフロー図である。
【図5】2値化閾値と文字線分の太さの関係の例を示す
図である。
【図6】本発明の第3の実施例における2値化閾値設定
処理のフロー図である。
【符号の説明】
1    スキャナ 2    文字切り出し部 3    文字画像多値化部 4    2値化閾値決定部 5    文字画像2値化部 6    認識系 7    特徴抽出部 8    パターン辞書 9    マッチング部 10  単語辞書 11  後処理部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】文書画像より切り出した文字の元画像の正
    規化多値画像を作成し、これを2値化した画像を認識系
    に入力し認識させる文字認識装置において、該正規化多
    値画像の画素値ヒストグラムを作成し、該画素値ヒスト
    グラムに基づき、該正規化多値画像の2値化後の黒画素
    数が該認識系によって定まるある値に近くなる2値化閾
    値を決定し、これを該正規化多値画像の2値化閾値とし
    て設定することを特徴とする2値化閾値設定方法。
  2. 【請求項2】文書画像より切り出した文字の元画像の正
    規化多値画像を作成し、これを2値化した画像を認識系
    に入力し認識させる文字認識装置において、異なった複
    数の2値化閾値で該正規化多値画像をそれぞれ2値化し
    、得られた2値画像上の文字線分の太さを検出し、該文
    字線分の太さが該認識系によって定まるある文字線分の
    太さに最も近い2値化閾値を求め、これを該正規化多値
    画像の2値化閾値として設定することを特徴とする2値
    化閾値設定方法。
  3. 【請求項3】文書画像より切り出した文字の元画像の正
    規化多値画像を作成し、これを2値化した画像を認識系
    に入力し認識させる文字認識装置において、該元画像の
    サイズと文字線分の太さを測定し、該サイズ及び太さを
    用い、該認識系によって定まる計算式により2値化閾値
    を求め、これを該正規化多値画像の2値化閾値として設
    定することを特徴とする2値化閾値設定方法。
JP3143885A 1991-05-20 1991-05-20 2値化閾値設定方法 Pending JPH04343193A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3143885A JPH04343193A (ja) 1991-05-20 1991-05-20 2値化閾値設定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3143885A JPH04343193A (ja) 1991-05-20 1991-05-20 2値化閾値設定方法

Publications (1)

Publication Number Publication Date
JPH04343193A true JPH04343193A (ja) 1992-11-30

Family

ID=15349292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3143885A Pending JPH04343193A (ja) 1991-05-20 1991-05-20 2値化閾値設定方法

Country Status (1)

Country Link
JP (1) JPH04343193A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102299A (ja) * 2005-09-30 2007-04-19 Oki Electric Ind Co Ltd 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102299A (ja) * 2005-09-30 2007-04-19 Oki Electric Ind Co Ltd 文字認識装置

Similar Documents

Publication Publication Date Title
US7054485B2 (en) Image processing method, apparatus and system
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
US20070253040A1 (en) Color scanning to enhance bitonal image
US6798906B1 (en) Image processing apparatus and method including line segment data extraction
US20030031366A1 (en) Image processing method and apparatus using self-adaptive binarization
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
US6731775B1 (en) Data embedding and extraction techniques for documents
US8456711B2 (en) SUSAN-based corner sharpening
EP0676891A2 (en) Method of thresholding document images
CA2601144C (en) Method and system for adaptive recognition of distorted text in computer images
US6813367B1 (en) Method and apparatus for site selection for data embedding
CN113421256B (zh) 一种点阵文本行字符投影分割方法及装置
JP2001222683A (ja) 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体
JPH04343193A (ja) 2値化閾値設定方法
RU2520407C1 (ru) Способ и система улучшения текста при цифровом копировании печатных документов
Konya et al. Adaptive methods for robust document image understanding
JP3268542B2 (ja) 微細文字画像の拡大方法
JP2785747B2 (ja) 文字読取装置
CN112053275B (zh) 抗打印扫描攻击的pdf文档水印方法及装置
NarayananV et al. SEGMENTATION OF CHARACTERS IN HISTORIC DOCUMENTS BASED ON SCALE SPACE TECHNIQUE
JPH0540848A (ja) 文書画像の領域抽出方法
JP2005063056A (ja) 画像認識装置、画像認識プログラムおよびこのプログラムが記録された記録媒体
JP2899356B2 (ja) 文字認識装置