JPH05307640A - 文字読取装置 - Google Patents

文字読取装置

Info

Publication number
JPH05307640A
JPH05307640A JP4111652A JP11165292A JPH05307640A JP H05307640 A JPH05307640 A JP H05307640A JP 4111652 A JP4111652 A JP 4111652A JP 11165292 A JP11165292 A JP 11165292A JP H05307640 A JPH05307640 A JP H05307640A
Authority
JP
Japan
Prior art keywords
character
detection
density value
cutout
maximum density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4111652A
Other languages
English (en)
Inventor
Masato Suda
正人 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4111652A priority Critical patent/JPH05307640A/ja
Publication of JPH05307640A publication Critical patent/JPH05307640A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】線で形成された文字画像およびドットで形成さ
れた文字画像に対して、常に安定した文字の検出切出し
が可能となる文字読取装置を提供する。 【構成】最大濃度値抽出部4は、多値画像メモリ3に格
納された多値の文字画像に対して繰返し走査することに
より、各走査線上での最大濃度値データを抽出する。行
検出切出部5は、この抽出された最大濃度値データから
文字行の検出切出しを行なう。ドット文字対応検出切出
部6、線文字対応検出切出部7は、それぞれの特徴を用
いて文字の検出切出しを行ない、切出した文字幅、文字
ピッチなどにより各文字の正当性評価を行ない、正当な
文字の数を出力する。検出切出文字決定部8は、これら
の正当な文字数の比較からどちらの検出切出し位置を使
用するかを決定し、検出切出しされた文字行から各文字
単位の検出切出しが行なわれる。文字認識部9は、この
検出切出しされた各文字を認識する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、たとえば、記録媒体上
の文字等を光学的に読取る文字読取装置に係り、特に、
入力される多値の文字画像から各文字単位の検出切出し
を行なう文字の検出切出し技術に関する。
【0002】
【従来の技術】従来、この種の文字読取装置における文
字の検出切出しは、まず、初めに、入力される多値の文
字画像を所定のしきい値で2値化し、2値の文字画像を
生成する。そして、この2値の文字画像をラスタ走査し
て射影パターンを求め、この求めた射影パターンから、
所定のしきい値以上のレベルを文字の領域範囲と決定す
るのが一般的である。また、記載文字が線で形成されて
いる前提から、文字画像の連結を用いたラベリング処理
による文字の検出切出しも一般的に行なわれている。
【0003】これらは、文字の離散度または文字と背景
との濃度差にもよるが、文字列内で文字間余白が充分
で、かつ、文字と背景との濃度差が充分にある場合は、
射影パターンの所定のしきい値から一意な文字の検出切
出しは容易に可能である。
【0004】しかし、文字が接近していたり、文字が接
続している場合は、射影パターンに対する複数のしきい
値から求めた複数の検出切出し文字をそれぞれ認識し、
より確からしいものを後処理(文章理解等)を用いて決
定する。たとえば、枠内記入の文字や、印刷文字などは
一意に決定しやすいが、郵便物などに記載の自由手書き
文字などは一意に検出切出しするのは難しい。
【0005】一方、文字と背景との濃度差が充分でな
く、一意に文字画像の2値化しきい値が決定できないと
きは、複数のしきい値による2値化画像を生成する。そ
して、それぞれの射影パターンから文字の検出切出し、
文字認識処理(類似度計算)を行ない、類似度結果の評
価から最終結果を決定している。
【0006】
【発明が解決しようとする課題】上記したように、従来
の文字の検出切出しは、2値の文字画像を射影パターン
で処理したり、ラベリングによる処理を用いているが、
その前提としての文字画像は連結画像である。
【0007】そのため、文字がドットで形成されている
場合は、ラベリングによる複数の離散画像から文字をま
とめ上げることは実用上技術的無駄があり、また、従来
の射影パターン処理では、他のノイズとの区別がつきに
くい場合がある。さらに、ドットの押印の強弱による入
力画像としての濃度の違う文字画像の2値化時に特徴あ
る画像を欠落させる危険がある。
【0008】そのことから、処理対象となる文字がドッ
ト文字と線文字を有する場合は、射影パターンの2値化
による処理のみでは文字として有意なドットをノイズと
して処理する危険性がある。また、ドット文字と線文字
との区別がつきにくい。
【0009】そこで、本発明は、線で形成された文字画
像およびドットで形成された文字画像に対して、常に安
定した文字の検出切出しが可能となる文字読取装置を提
供することを目的とする。
【0010】
【課題を解決するための手段】本発明の文字読取装置
は、入力される多値の文字画像に対して繰返し走査する
ことにより、各走査線上での最大濃度値データを抽出す
る最大濃度値抽出手段と、この最大濃度値抽出手段で抽
出された最大濃度値データの極大値とその位置をそれぞ
れ検出するピーク位置検出手段と、このピーク位置検出
手段で検出された極大値間の長さが所定範囲内か否かを
比較するピーク間隔比較手段と、このピーク間隔比較手
段での比較の結果、所定範囲内にある場合、その連続す
る有効所定範囲内での極大値の始点位置と終点位置をそ
れぞれ検出する第1位置検出手段と、この第1位置検出
手段で検出された始点位置と終点位置により各文字の正
当性を評価する第1評価手段と、前記最大濃度値抽出手
段で抽出された最大濃度値データを所定のしきい値で2
値化することにより、各文字の始点位置と終点位置をそ
れぞれ検出する第2位置検出手段と、この第2位置検出
手段で検出された始点位置と終点位置により各文字の正
当性を評価する第2評価手段と、前記第1,第2評価手
段の各評価結果により最終的な文字の検出切出し位置を
決定する検出切出し位置決定手段と、この検出切出し位
置決定手段で決定された検出切出し位置に基づき各文字
単位の検出切出しを行なう文字検出切出手段と、この文
字検出切出手段で検出切出しされた各文字を認識する文
字認識手段とを具備している。
【0011】
【作用】文字の検出切出し位置を、文字画像の走査方向
における各走査線上の最大濃度値データから、極大値間
の幅の連続性から求めることによる文字画像の検出切出
しと、もう一方では2値化による文字画像の検出切出し
の、両者の検出切出し結果により対象文字画像がドット
文字画像であるか、線文字画像であるか判定でき、か
つ、常に安定した文字の検出切出しが可能となる。
【0012】
【実施例】以下、本発明の一実施例について図面を参照
して説明する。
【0013】図1において、光電変換部1は、たとえ
ば、文字等が記録された記録媒体上に光を照射する光源
と、記録媒体上からの反射光を受光し、電気信号に変換
するCCD形センサなどの光電変換器と、光源からの光
を記録媒体上に導き、その反射光を光電変換器に導く光
学系などからなり、記録媒体上を光走査することにより
電気信号(アナログ信号)に変換するようになってい
る。
【0014】光電変換部1からのアナログ信号は、A/
D変換部2において多値のデジタル信号に変換され、多
値の文字画像として多値画像メモリ3に格納される。多
値画像メモリ3に格納された文字画像は、最大濃度値抽
出部4において、文字行と同方向に繰り返しラスタ走査
することにより、各走査線上での最大濃度値データが抽
出される。
【0015】次に、行検出切出部5では、上記したよう
に抽出された最大濃度値データから文字行の検出切出し
を行ない、切出した文字行画像をドット文字対応検出切
出部6、および、線文字対応検出切出部7に送る。ドッ
ト文字対応検出切出部6、および、線文字対応検出切出
部7は、それぞれの特徴を用いて文字の検出切出しを行
ない、切出した文字幅、文字ピッチなどにより、文字行
内の各文字の正当性評価を行い、正当な文字の数をそれ
ぞれ検出切出文字決定部8に出力する。
【0016】検出切出文字決定部8は、両者の正当な文
字数の比較からどちらの検出切出し位置を使用するかを
決定し、決定した検出切出し位置に基づき、検出切出し
された文字行から各文字単位の検出切出しが行なわれ
る。そして、文字認識部9において、検出切出しされた
各文字単位の認識(類似度計算など)が行なわれ、その
認識結果が出力される。
【0017】図2は、ドット文字対応検出切出部6、線
文字対応検出切出部7、および、検出切出文字決定部8
の構成を示すもので、以下、その説明を行なう。まず、
最大濃度値抽出部4では、多値画像メモリ3に格納され
た文字画像を繰り返しラスタ走査して、各走査線上での
最大濃度値データを抽出する。この抽出した最大濃度値
データを示すと、たとえば、入力文字画像がドット文字
画像の場合、図3(b)のようになり、同図(a)は多
値画像メモリ3に格納されたドット文字画像の例を示し
ている。
【0018】こうして抽出された最大濃度値データは、
2つの形態で並列処理される。まず、1つの形態は、ド
ット文字対応検出切出部6のドット文字画像に対応した
処理で、抽出された最大濃度値データは背景レベル計算
部11に入力される。背景レベル計算部11は、図4に
示すように、たとえば、N分割単位での最小濃度値から
の平均値をGmin とし、データ全体の最大濃度値をGma
x として、背景レベルGxを以下のようにして求める。
なお、背景レベルGxは、背景ノイズの影響を軽減する
ためのしきい値である。また、mは定数であり、ここで
は例えば「8」である。 Gx=Gmin +(Gmax −Gmin )/m
【0019】次に、引算器12は、最大濃度値抽出部4
で抽出された最大濃度値データから、背景レベル計算部
11で算出された背景レベルGxを引算し、その演算結
果をピーク位置検出部13に転送する。
【0020】ピーク位置検出部13は、引算器12の出
力データから極大値を検出し、その極大値の位置を検出
する。極大値の位置検出は、図5に示すように、濃度値
がFi-1 <Fi>=Fi+1 を満たすとき、Fiの位置が
検出される。
【0021】ピーク間幅計算部14は、現在の極大値位
置と次の極大値位置との幅を計算し、その演算結果をピ
ーク間幅比較部15に送る。ピーク間幅比較部15は、
ピーク間幅計算部14からの幅値を、あらかじめ設定さ
れたピーク間幅設定値と比較する。ここに、たとえば、
ピーク間幅設定値は1ドット間の許容範囲である。
【0022】この比較の結果、ピーク間幅が有効である
と、その区間の最初のピーク位置(始点位置)と最後の
ピーク位置(終点位置)を、ピーク位置検出部13で検
出された極大値からそれぞれ抽出し、ドット文字位置メ
モリ16に格納する。
【0023】次に、ドット文字評価部17は、ドット文
字位置メモリ16に格納された検出切出しの始点位置、
終点位置を、あらかじめ設定されるドット文字幅、文字
間ピッチ設定値と比較することにより、各文字の正当性
を評価し、その結果として、正当評価された正当文字数
を出力する。図6にそれらの処理結果例を示す。
【0024】もう1つの形態は、線文字対応検出切出部
7の線文字画像に対応した処理で、抽出された最大濃度
値データは2値化レベル計算部18に入力される。2値
化レベル計算部18は、図7に示すように、背景レベル
計算部11と同様に、N分割単位での最小濃度値からの
平均をGmin とし、データ全体の最大濃度値をGmaxと
して、2値化レベルGthを以下のようにして求める。な
お、nは定数であり、ここでは例えば「2」である。 Gth=Gmin +(Gmax −Gmin )/n
【0025】2値化処理部19は、最大濃度値抽出部4
で抽出された最大濃度値データを、2値化レベル計算部
18で求めた2値化レベルGthで2値化することによ
り、2値化レベルGth以上のデータを文字成分とした始
点位置、終点位置を検出し、線文字位置メモリ20に格
納する。
【0026】線文字評価部21は、線文字位置メモリ2
0に格納された検出切出しの始点位置、終点位置を、あ
らかじめ設定される線文字幅、文字間ピッチ設定値と比
較することにより、各文字の正当性を評価し、その結果
として、正当評価された正当文字数を出力する。図8に
それらの処理結果例を示す。
【0027】ドット文字評価部17の出力(たとえば、
図6の処理結果例)、および、線文字評価部21の出力
(たとえば、図8の処理結果例)は、それぞれ検切文字
選択部22に送られ、最終的な検出切出し位置が選択さ
れる。すなわち、正当文字数との比較により、ドット文
字の正当文字数が指定文字数と同等の場合は、ドット文
字位置メモリ16に格納された検出切出しの始点位置、
終点位置が、ドット文字の検出切出し位置としてアンド
回路23、オア回路25を経由して文字位置確定メモリ
26に格納される。一方、線文字の正当文字数が指定文
字数と同等の場合は、線文字位置メモリ20に格納され
た検出切出しの始点位置、終点位置が、線文字の検出切
出し位置としてアンド回路24、オア回路25を経由し
て文字位置確定メモリ26に格納される。なお、図6と
図8の例では、図6の処理結果が正当と判定され、ドッ
ト文字対応の検出切出し結果が候補として選択される。
【0028】図9(b)は、線文字画像を入力とした場
合の最大濃度値データの例である。図10は、図9
(b)に対するドット文字対応検出切出しの処理結果
例、図11は、図9(b)に対する線文字対応検出切出
しの処理結果例である。この場合、図10と図11の処
理結果から、図11の処理結果が選択される。なお、図
9(a)は多値画像メモリ3に格納された線文字画像の
例を示している。
【0029】こうして、文字位置確定メモリ26に始点
位置、終点位置が格納されると、それを最終的な文字の
検出切出し位置として、行検出切出部5で検出切出しさ
れた文字行から各文字単位の検出切出しが行なわれ、文
字認識部9へ送られる。
【0030】
【発明の効果】以上詳述したように本発明によれば、文
字の検出切出し位置を、文字画像の走査方向における各
走査線上の最大濃度値データから、極大値間の幅の連続
性から求めることによる文字画像の検出切出しと、もう
一方では2値化による文字画像の検出切出しの、両者の
検出切出し結果により対象文字画像がドット文字画像で
あるか、線文字画像であるか判定でき、かつ、常に安定
した文字の検出切出しが可能となる文字読取装置を提供
できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字読取装置の全体的
な構成を概略的に示すブロック図。
【図2】ドット文字対応検出切出部、線文字対応検出切
出部、および検出切出文字決定部の構成を詳細に示すブ
ロック図。
【図3】多値のドット文字画像とそれに対する最大濃度
値データの例を示す図。
【図4】背景レベルの算出を説明する図。
【図5】極大値の位置検出を説明する図。
【図6】図3の最大濃度値データに対するドット文字対
応の検出切出し結果の例を示す図。
【図7】2値化レベルの算出を説明する図。
【図8】図3の最大濃度値データに対する線文字対応の
検出切出し結果の例を示す図。
【図9】多値の線文字画像とそれに対する最大濃度値デ
ータの例を示す図。
【図10】図9の最大濃度値データに対するドット文字
対応の検出切出し結果の例を示す図。
【図11】図9の最大濃度値データに対する線文字対応
の検出切出し結果の例を示す図。
【符号の説明】
1…光電変換部、2…A/D変換部、3…多値画像メモ
リ、4…最大濃度値抽出部、5…行検出切出部、6…ド
ット文字対応検出切出部、7…線文字対応検出切出部、
8…検出切出文字決定部、9…文字認識部、13…ピー
ク位置検出部、14…ピーク間幅計算部、15…ピーク
間幅比較部、16…ドット文字位置メモリ、17…ドッ
ト文字評価部、18…2値化レベル計算部、19…2値
化処理部、20…線文字位置メモリ、21…線文字評価
部、22…検切文字選択部、26…文字位置確定メモ
リ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力される多値の文字画像に対して繰返
    し走査することにより、各走査線上での最大濃度値デー
    タを抽出する最大濃度値抽出手段と、 この最大濃度値抽出手段で抽出された最大濃度値データ
    の極大値とその位置をそれぞれ検出するピーク位置検出
    手段と、 このピーク位置検出手段で検出された極大値間の長さが
    所定範囲内か否かを比較するピーク間隔比較手段と、 このピーク間隔比較手段での比較の結果、所定範囲内に
    ある場合、その連続する有効所定範囲内での極大値の始
    点位置と終点位置をそれぞれ検出する第1位置検出手段
    と、 この第1位置検出手段で検出された始点位置と終点位置
    により各文字の正当性を評価する第1評価手段と、 前記最大濃度値抽出手段で抽出された最大濃度値データ
    を所定のしきい値で2値化することにより、各文字の始
    点位置と終点位置をそれぞれ検出する第2位置検出手段
    と、 この第2位置検出手段で検出された始点位置と終点位置
    により各文字の正当性を評価する第2評価手段と、 前記第1,第2評価手段の各評価結果により最終的な文
    字の検出切出し位置を決定する検出切出し位置決定手段
    と、 この検出切出し位置決定手段で決定された検出切出し位
    置に基づき各文字単位の検出切出しを行なう文字検出切
    出手段と、 この文字検出切出手段で検出切出しされた各文字を認識
    する文字認識手段とを具備したことを特徴とする文字読
    取装置。
JP4111652A 1992-04-30 1992-04-30 文字読取装置 Pending JPH05307640A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4111652A JPH05307640A (ja) 1992-04-30 1992-04-30 文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4111652A JPH05307640A (ja) 1992-04-30 1992-04-30 文字読取装置

Publications (1)

Publication Number Publication Date
JPH05307640A true JPH05307640A (ja) 1993-11-19

Family

ID=14566760

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4111652A Pending JPH05307640A (ja) 1992-04-30 1992-04-30 文字読取装置

Country Status (1)

Country Link
JP (1) JPH05307640A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008276458A (ja) * 2007-04-27 2008-11-13 Nidec Sankyo Corp 文字列認識方法及び文字列認識装置
US7962412B2 (en) 2001-11-16 2011-06-14 Seiko Epson Corporation Apparatus and method for processing a check, and a computer-readable recording medium storing a check processing control program
WO2013121647A1 (ja) * 2012-02-17 2013-08-22 オムロン株式会社 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7962412B2 (en) 2001-11-16 2011-06-14 Seiko Epson Corporation Apparatus and method for processing a check, and a computer-readable recording medium storing a check processing control program
JP2008276458A (ja) * 2007-04-27 2008-11-13 Nidec Sankyo Corp 文字列認識方法及び文字列認識装置
WO2013121647A1 (ja) * 2012-02-17 2013-08-22 オムロン株式会社 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP2013171309A (ja) * 2012-02-17 2013-09-02 Omron Corp 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム

Similar Documents

Publication Publication Date Title
JP4011646B2 (ja) 行検出方法および文字認識装置
EP0505729A2 (en) Image binarization system
JPH05307640A (ja) 文字読取装置
KR101954812B1 (ko) 필적 인식 장치 및 방법
US5637853A (en) Reading indicia by analysis of different light reflecting portions based on signal-to-noise ratios
KR20000025647A (ko) 쉐이딩 알고리즘을 이용한 영상 처리 방법
JPS62120585A (ja) イメ−ジスキヤナによるバ−コ−ド認識装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JPS6162983A (ja) 楽譜読取装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH05298482A (ja) 文字読取装置
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
JPH056549A (ja) 再生信号処理装置
JP2576370B2 (ja) Idマーク読み取り装置
WO1993017518A1 (en) Image scanner
Xiao et al. Staff lines detection and removal for camera-based music scores
JPH06282684A (ja) 文字認識装置
JP2787851B2 (ja) パターン特徴抽出装置
JPH04274583A (ja) 文字読取装置
JP2964980B2 (ja) 光学的文字認識における直線成分検出方法及び装置
JP4218179B2 (ja) パターン検出装置及び方法
JPH04260181A (ja) 文字読取装置
JPH07104907B2 (ja) 二値化回路
JPH0728953A (ja) 文字検出装置
JPH01305488A (ja) 文字の傾斜角検出装置