JP3095437B2 - 文字行検出切出装置および文字読取装置 - Google Patents

文字行検出切出装置および文字読取装置

Info

Publication number
JP3095437B2
JP3095437B2 JP03059087A JP5908791A JP3095437B2 JP 3095437 B2 JP3095437 B2 JP 3095437B2 JP 03059087 A JP03059087 A JP 03059087A JP 5908791 A JP5908791 A JP 5908791A JP 3095437 B2 JP3095437 B2 JP 3095437B2
Authority
JP
Japan
Prior art keywords
character
density value
extracting
line
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03059087A
Other languages
English (en)
Other versions
JPH04294476A (ja
Inventor
正人 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP03059087A priority Critical patent/JP3095437B2/ja
Priority to US07/786,046 priority patent/US5381488A/en
Publication of JPH04294476A publication Critical patent/JPH04294476A/ja
Application granted granted Critical
Publication of JP3095437B2 publication Critical patent/JP3095437B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、記録媒体上の文字等を
光学的に読取る文字読取装置において、入力される文字
画像から各文字行単位の検出切出しを行なう文字行検出
切出装置およびこの文字行検出切出装置を用いた文字読
取装置に関する。
【0002】
【従来の技術】この種の文字読取装置にあっては、入力
された多値の文字画像を2値の文字画像に変換した後、
文字行の検出切出しを行ない、その後、各文字の検出切
出しを行なうのが一般的である。しかし、このような2
値画像を用いる方式では、局部的に濃度レベルが低い
と、2値化画像が欠落し、特に文字の周囲が欠落する
と、文字の中心がずれ、文字認識に影響を与えてしま
う。
【0003】一方、これらを回避するため、複数の2値
化画像を抽出して文字認識し、最も認識結果のよいもの
を最終結果としたり、2値画像を複数に分割して、分割
単位での射影情報から文字の検出切出しを行なってい
る。
【0004】
【発明が解決しようとする課題】上記したように、入力
される多値の文字画像を2値の文字画像に変換した後、
文字行の検出切出し、各文字の検出切出しを行なうと、
特に文字の周囲の濃度レベルが低い場合、2値画像が欠
落し、文字の中心がずれ、文字認識に影響を与えてしま
う。また、一部の文字にノイズが混入すると、文字とノ
イズとの区別ができなくなり、さらに文字のかすれとノ
イズ混入が混在すると、文字の検出切出しが困難になる
という問題があった。
【0005】そこで、本発明は、文字認識に影響を与え
ることなく、常に安定した文字の検出切出しを行なうこ
とができ、しかも、比較的簡単な構成でそれが実現でき
文字行検出切出装置および文字読取装置を提供するこ
とを目的とする。
【0006】
【課題を解決するための手段】本発明の文字行検出切出
装置は、文字が記録された文字部と非文字部とからなる
記録媒体から多値の文字画像を読取る読取手段と、この
読取手段から読取られた多値の文字画像を文字行と同方
向に複数に分割する分割手段と、この分割手段で分割さ
れた各分割画像をそれぞれ繰返し走査することにより、
各分割画像ごとに各走査線上での最大濃度値データまた
は最小濃度値データをそれぞれ抽出する濃度値抽出手段
と、この濃度値抽出手段で抽出された各分割画像ごとの
各走査線上での最大濃度値データまたは最小濃度値デー
タの平均値を算出する平均値算出手段と、この平均値算
出手段で算出された平均値を所定の閾値で2値化するこ
とにより文字行の切出位置データを算出する切出位置算
出手段と、この切出位置算出手段で算出された切出位置
データに基づき文字行の切出しを行なう文字行切出手段
を具備している。また、本発明の文字行検出切出装置
は、文字が記録された文字部と非文字部とからなる記録
媒体から多値の文字画像を読取る読取手段と、この読取
手段から読取られた多値の文字画像を文字行と同方向に
複数に分割する分割手段と、この分割手段で分割された
各分割画像をそれぞれ繰返し走査することにより、各分
割画像ごとに各走査線上での最大濃度値データまたは最
小濃度値データをそれぞれ抽出する濃度値抽出手段と、
この濃度値抽出手段で抽出された各分割画像ごとの各走
査線上での最大濃度値データまたは最小濃度値データを
所定の閾値で2値化することにより各分割画像ごとの文
字行の高さを検出する高さ検出手段と、この高さ検出手
段で検出された各分割画像ごとの文字行の高さのうち、
高さの値が近接しているものを抽出し、この抽出した各
高さの平均値を算出する高さ平均値算出手段と、この高
さ平均値算出手段で算出された平均値に基づいて文字行
の切出しを行なう文字行切出手段とを具備している。
らに、本発明の文字読取装置は、文字が記録された文字
部と非文字部とからなる記録媒体から多値の文字画像を
読取る読取手段と、この読取手段から読取られた多値の
文字画像を文字行と同方向に複数に分割する分割手段
と、この分割手段で分割された各分割画像をそれぞれ繰
返し走査することにより、各分割画像ご とに各走査線上
での最大濃度値データまたは最小濃度値データをそれぞ
れ抽出する第1の濃度値抽出手段と、この第1の濃度値
抽出手段で抽出された各分割画像ごとの各走査線上での
最大濃度値データまたは最小濃度値データの平均値を算
出する平均値算出手段と、この平均値算出手段で算出さ
れた平均値を所定の閾値で2値化することにより文字行
の切出位置データを算出する切出位置算出手段と、この
切出位置算出手段で算出された切出位置データに基づき
文字行の切出しを行なう文字行切出手段と、この文字行
切出手段で切出された文字行内の文字画像に対して文字
行と直交する方向に繰返し走査することにより、各走査
線上での最大濃度値データまたは最小濃度値データをそ
れぞれ抽出する第2の濃度値抽出手段と、この第2の濃
度値抽出手段で抽出された各走査線上での最大濃度値デ
ータまたは最小濃度値データに基づき文字を検出する文
字検出手段と、この文字検出手段で検出された各文字を
認識する文字認識手段とを具備している。
【0007】
【作用】本発明は、入力される多値の文字画像を文字行
と同方向に複数に分割し、この分割された各分割画像を
それぞれ繰返し走査することにより、各分割画像ごとに
各走査線上での最大(または最小)濃度値データをそれ
ぞれ抽出し、この抽出された各分割画像ごとの各走査線
上での最大(または最小)濃度値データの平均値を算出
し、この算出された平均値を所定の閾値で2値化するこ
とにより文字行の切出位置データを算出し、この算出さ
れた切出位置データに基づき文字行の切出しを行なうも
のである。また、本発明は、入力される多値の文字画像
を文字行と同方向に複数に分割し、この分割された各分
割画像をそれぞれ繰返し走査することにより、各分割画
像ごとに各走査線上での最大(または最小)濃度値デー
タをそれぞれ抽出し、この抽出された各分割画像ごとの
各走査線上での最大(または最小)濃度値データを所定
の閾値で2値化することにより各分割画像ごとの文字行
の高さを検出し、この検出された各分割画像ごとの文字
行の高さのうち、高さの値が近接しているものを抽出し
て、この抽出した各高さの平均値を算出し、この算出さ
れた平均値に基づき文字行の切出しを行なうものであ
る。
【0008】なお、文字画像の濃度レベルが背景の濃度
レベルよりも高い場合は最大濃度値データを用い、文字
画像の濃度レベルが背景の濃度レベルよりも低い場合は
最小濃度値データを用いる。
【0009】
【実施例】以下、本発明の一実施例について図面を参照
して説明する。
【0010】図1において、光電変換部1は、たとえ
ば、文字等が記録された記録媒体上に光を照射する光源
と、記録媒体上からの反射光を受光し、電気信号に変換
するCCD形センサなどの光電変換器と、光源からの光
を記録媒体上に導き、その反射光を光電変換器に導く光
学系などからなり、記録媒体上を光走査することにより
電気信号(アナログ信号)に変換するようになってい
る。光電変換部1からのアナログ信号は、A/D変換部
2において多値のデジタル信号に変換され、文字画像と
して多値画像メモリ3に格納される。
【0011】多値画像メモリ3に格納された文字画像
は、分割最大・最小濃度値抽出部4において、文字記載
方向(文字行)と同方向に複数に分割され、この分割さ
れた各分割画像をそれぞれ繰返し走査することにより、
各分割画像ごとに各走査線上での最大または最小の濃度
値データが抽出される。
【0012】そして、文字検出切出部5において、分割
最大・最小濃度値抽出部4で抽出された各分割画像ごと
の最大または最小の濃度値データを用いて各文字単位の
検出切出が行なわれ、その後、文字認識部6で各文字の
認識処理が行なわれるようになっている。
【0013】図2は、最大・最小濃度値抽出部4の概略
構成図を示すもので、以下、最大濃度値データによる処
理を例にとって説明する。多値画像メモリ3から入力さ
れた文字画像は、比較器11の入力端Pと第1トライス
テート12に入力される。一方、分割最大・最小濃度値
格納メモリ13に既に格納されている最大濃度値データ
は、パルスP1(図3参照)によってオン,オフする第
2トライステート14を介して比較器11の入力端Qに
入力され、両入力端P,Qに入力されるデータの比較が
行なわれる。このとき、最大・最小切換信号が最大値を
検出するモードに設定されていれば、入力端Pの値が入
力端Qの値よりも大きいとき、その出力によりアンドゲ
ート15、オアゲート16を介してフリップフロップ1
7がセットされる。
【0014】逆に、最大・最小切換信号が最小値を検出
するモードに設定されていれば、入力端Pの値が入力端
Qの値よりも小さいとき、その出力によりノアゲート1
8、オアゲート16を介してフリップフロップ17がセ
ットされる。
【0015】次に、フリップフロップ17のセット出力
がパルスP2(図3参照)をナンドゲート19により抜
き取り、そのパルスP2が書込みパルスWTとなって分
割最大・最小濃度値格納メモリ13に印加されることに
より、ナンドゲート19の出力によってオン,オフする
第1トライステート12を通った濃度値データが新たな
最大濃度値データとして分割最大・最小濃度値格納メモ
リ13に格納される。
【0016】以上のことを時分割パルスP1,P2を用
いて分割走査線上単位で行なう。カウンタ20は、分割
最大・最小濃度値格納メモリ13の下位アドレスを発生
するもので、走査線終了信号により分割走査終了ごとに
インクリメントされる。分割制御カウンタ21は、分割
最大・最小濃度値格納メモリ13を分割構成とするため
の上位アドレスを発生するもので、走査線終了信号でリ
セットされ、分割走査終了信号でインクリメントされ
る。
【0017】図4は、たとえば、文字画像をその文字記
載方向と同方向に8分割する場合の走査信号例を示すも
のであり、クロックP1,P2は基本クロックで、走査
線終了信号間に分割走査終了信号として8つの等間隔パ
ルスが生成される。
【0018】図5は、分割単位の分割最大・最小濃度値
格納メモリ13の構成例を示すものであり、分割データ
1から分割データ8までの最大・最小の濃度値データが
格納される。
【0019】これらの処理を用いて文字の検出切出しを
行なった例が図6である。多値画像メモリ3に格納され
た文字画像は、初めに文字記載方向(文字行方向)に走
査(SG1)され、各分割走査線(DG1〜DG8)上
での最大濃度値データDD1〜DD8がそれぞれ抽出さ
れる。ここに、最大濃度値データDD1〜DD8は、各
分割走査線上での濃度値データの中で最大の濃度値デー
タが抽出される。
【0020】次に、この抽出された各分割走査線上の最
大濃度値データDD1〜DD8の平均値DAを求め、こ
の平均値DAを所定のしきい値thaで2値化すること
により、文字行の検出切出位置データha1 ,ha2 を
求める。そして、この求めた位置データha1 ,ha2
に基づき文字行の検出切出しを行なう。
【0021】図7も、これらの処理を用いて文字の検出
切出しを行なった例を示すものである。多値画像メモリ
3に格納された文字画像は、初めに文字記載方向に走査
(SX1)され、各分割走査線(DX1〜DX8)上で
の最大濃度値データDN1〜DN8がそれぞれ抽出され
る。
【0022】次に、この抽出された各分割走査線上の最
大濃度値データDN1〜DN8をそれぞれ所定の閾値
h1 〜th8 で2値化することにより、文字行の高さを
それぞれ検出する。次に、この検出した8種の高さをそ
れぞれチェック(評価)することで、8種の高さのうち
近接関係にないもの、すなわち、高さの値が大きく異な
るもの(たとえば、図7では黒く塗り潰したノイズ部分
のある文字「6」の最大濃度値データDN5から求めた
高さ)を除去して、近接関係にあるもの、すなわち、高
さの値が近接しているもの(たとえば、図7では最大濃
度値データDN1,DN2,DN3,DN4,DN6,
DN7,DN8から求めた各高さ)だけを抽出した後、
それらの各高さの平均値を求めることにより、文字行の
高さデータhb1 ,hb2 を求める。そして、この求め
た高さデータhb1 ,hb2 に基づき文字行の検出切出
しを行なう。
【0023】こうして、検出切出しされた文字行内での
文字画像に対し、たとえば、文字行と垂直方向に繰返し
走査し、各走査線上での最大濃度値データを抽出する。
次に、この抽出された各走査線上の最大濃度値データか
ら微分データを求め、この求めた微分データの極大値お
よび極小値から各文字の検出切出しを行なう。そして、
検出切出しされた各文字単位は、文字記載方向に同様の
処理を施し、文字の外接矩形座標を求め、文字の検出切
出し処理を終了する。その後、検出切出しされた各文字
の認識が行なわれる。
【0024】以上、最大濃度値データを用いた処理につ
いて説明したが、最小濃度値データを用いた処理につい
ても同様の考えが適用できる。その場合、文字画像の濃
度レベルが背景の濃度レベルよりも高い場合は最大濃度
値データを用い、文字画像の濃度レベルが背景の濃度レ
ベルよりも低い場合は最小濃度値データを用いる。
【0025】なお、前記実施例においては、文字の検出
切出しを最大(最小)濃度値データから微分データを求
めて行なっているが、たとえば、最大(最小)濃度値デ
ータを最大(最小)濃度値データで作成したヒストグラ
ムで求めた閾値で2値化することにより、文字の検出切
出を行なうことも可能である。
【0026】
【発明の効果】以上詳述したように本発明によれば、入
力される多値の文字画像を文字行と同方向に複数に分割
し、この分割された各分割画像をそれぞれ繰返し走査す
ることにより、各分割画像ごとに各走査線上での最大
(または最小)濃度値データをそれぞれ抽出し、この抽
出された各分割画像ごとの各走査線上での最大(または
最小)濃度値データに基づき文字行の検出切出しを行な
うことにより、従来のように文字認識に影響を与えるこ
となく、常に安定した文字の検出切出しを行なうことが
でき、しかも、比較的簡単な構成でそれが実現できる
字行検出切出装置および文字読取装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る文字読取装置の全体的
な構成を概略的に示すブロック図。
【図2】分割最大・最小濃度値抽出部の構成を概略的に
示すブロック図。
【図3】分割最大・最小濃度値抽出部で用いるパルスを
示す図。
【図4】文字画像の分割に用いる走査信号の例を示す
図。
【図5】分割最大・最小濃度値格納メモリの構成例を示
す図。
【図6】最大濃度値データの抽出例と文字の検出切出し
例を説明するための図。
【図7】最大濃度値データの抽出例と文字の検出切出し
例を説明するための図。
【符号の説明】
1……光電変換部、2……A/D変換部、3……多値画
像メモリ、4……分割最大・最小濃度値抽出部、5……
文字検出切出部、6……文字認識部、11……比較器、
13……分割最大・最小濃度値格納メモリ、20……カ
ウンタ、21……分割制御カウンタ。
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 G06K 9/34 G06K 9/38

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字が記録された文字部と非文字部とか
    らなる記録媒体から多値の文字画像を読取る読取手段
    と、 この読取手段から読取られた多値の文字画像を文字行と
    同方向に複数に分割する分割手段と、 この分割手段で分割された各分割画像をそれぞれ繰返し
    走査することにより、各分割画像ごとに各走査線上での
    最大濃度値データまたは最小濃度値データをそれぞれ抽
    出する濃度値抽出手段と、 この濃度値抽出手段で抽出された各分割画像ごとの各走
    査線上での最大濃度値データまたは最小濃度値データの
    平均値を算出する平均値算出手段と、 この平均値算出手段で算出された平均値を所定の閾値で
    2値化することにより文字行の切出位置データを算出す
    る切出位置算出手段と、 この切出位置算出手段で算出された切出位置データに基
    づき文字行の切出しを行なう文字行切出手段と、 を具備したことを特徴とする文字行検出切出装置。
  2. 【請求項2】 文字が記録された文字部と非文字部とか
    らなる記録媒体から多値の文字画像を読取る読取手段
    と、 この読取手段から読取られた多値の文字画像を文字行と
    同方向に複数に分割する分割手段と、 この分割手段で分割された各分割画像をそれぞれ繰返し
    走査することにより、各分割画像ごとに各走査線上での
    最大濃度値データまたは最小濃度値データをそれぞれ抽
    出する濃度値抽出手段と、 この濃度値抽出手段で抽出された各分割画像ごとの各走
    査線上での最大濃度値データまたは最小濃度値データを
    所定の閾値で2値化することにより各分割画像ごとの文
    字行の高さを検出する高さ検出手段と、 この高さ検出手段で検出された各分割画像ごとの文字行
    の高さのうち、高さの値が近接しているものを抽出し、
    この抽出した各高さの平均値を算出する高さ平均値算出
    手段と、 この高さ平均値算出手段で算出された平均値に基づいて
    文字行の切出しを行な う文字行切出手段と、 を具備したことを特徴とする文字行検出切出装置。
  3. 【請求項3】 文字が記録された文字部と非文字部とか
    らなる記録媒体から多値の文字画像を読取る読取手段
    と、 この読取手段から読取られた多値の文字画像を文字行と
    同方向に複数に分割する分割手段と、 この分割手段で分割された各分割画像をそれぞれ繰返し
    走査することにより、各分割画像ごとに各走査線上での
    最大濃度値データまたは最小濃度値データをそれぞれ抽
    出する第1の濃度値抽出手段と、 この第1の濃度値抽出手段で抽出された各分割画像ごと
    の各走査線上での最大濃度値データまたは最小濃度値デ
    ータの平均値を算出する平均値算出手段と、 この平均値算出手段で算出された平均値を所定の閾値で
    2値化することにより文字行の切出位置データを算出す
    る切出位置算出手段と、 この切出位置算出手段で算出された切出位置データに基
    づき文字行の切出しを行なう文字行切出手段と、 この文字行切出手段で切出された文字行内の文字画像に
    対して文字行と直交する方向に繰返し走査することによ
    り、各走査線上での最大濃度値データまたは最小濃度値
    データをそれぞれ抽出する第2の濃度値抽出手段と、 この第2の濃度値抽出手段で抽出された各走査線上での
    最大濃度値データまたは最小濃度値データに基づき文字
    を検出する文字検出手段と、 この文字検出手段で検出された各文字を認識する文字認
    識手段と、 を具備したことを特徴とする 文字読取装置。
JP03059087A 1990-10-31 1991-03-22 文字行検出切出装置および文字読取装置 Expired - Fee Related JP3095437B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP03059087A JP3095437B2 (ja) 1991-03-22 1991-03-22 文字行検出切出装置および文字読取装置
US07/786,046 US5381488A (en) 1990-10-31 1991-10-31 Character reading apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03059087A JP3095437B2 (ja) 1991-03-22 1991-03-22 文字行検出切出装置および文字読取装置

Publications (2)

Publication Number Publication Date
JPH04294476A JPH04294476A (ja) 1992-10-19
JP3095437B2 true JP3095437B2 (ja) 2000-10-03

Family

ID=13103212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03059087A Expired - Fee Related JP3095437B2 (ja) 1990-10-31 1991-03-22 文字行検出切出装置および文字読取装置

Country Status (1)

Country Link
JP (1) JP3095437B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0540481U (ja) * 1991-10-30 1993-06-01 俊彦 君島 配線用床材
JP2005309796A (ja) * 2004-04-22 2005-11-04 Japan Fisheries Information Service Center 構造特徴抽出装置及び同一目標判定装置及び構造特徴抽出方法及びプログラムを記録したコンピュータ読み取り可能な記録媒体及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0540481U (ja) * 1991-10-30 1993-06-01 俊彦 君島 配線用床材
JP2005309796A (ja) * 2004-04-22 2005-11-04 Japan Fisheries Information Service Center 構造特徴抽出装置及び同一目標判定装置及び構造特徴抽出方法及びプログラムを記録したコンピュータ読み取り可能な記録媒体及びプログラム
JP4532973B2 (ja) * 2004-04-22 2010-08-25 社団法人漁業情報サービスセンター 構造特徴抽出装置及び同一目標判定装置及び構造特徴抽出方法及びプログラムを記録したコンピュータ読み取り可能な記録媒体及びプログラム

Also Published As

Publication number Publication date
JPH04294476A (ja) 1992-10-19

Similar Documents

Publication Publication Date Title
EP0797812B1 (en) Dataform reader
JPS6115284A (ja) 光学的文字読取装置
JP2001043313A (ja) 文字切出し方法
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
JP2797848B2 (ja) 光学式文字読取装置
KR20000025647A (ko) 쉐이딩 알고리즘을 이용한 영상 처리 방법
JPH0548510B2 (ja)
JP2812619B2 (ja) 画像処理装置
JPS596418B2 (ja) 文字読取方式
JPH04167084A (ja) 文字読取装置
JP2590099B2 (ja) 文字読取方式
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH04260181A (ja) 文字読取装置
JP2878327B2 (ja) 文字切り出し装置
JPH10233930A (ja) 画像処理装置
JPH065548B2 (ja) バーコードリーダの信号処理方法
JP2964980B2 (ja) 光学的文字認識における直線成分検出方法及び装置
JP2506071B2 (ja) 輪郭追跡装置
JPH04294475A (ja) 文字読取装置
JPH05307640A (ja) 文字読取装置
JPH04274583A (ja) 文字読取装置
JPH02166583A (ja) 文字認識装置
JPH1040338A (ja) 光学式文字読取装置
JPH04148391A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070804

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080804

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090804

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees