JPH01213770A - 文字検出切出方式 - Google Patents

文字検出切出方式

Info

Publication number
JPH01213770A
JPH01213770A JP63328913A JP32891388A JPH01213770A JP H01213770 A JPH01213770 A JP H01213770A JP 63328913 A JP63328913 A JP 63328913A JP 32891388 A JP32891388 A JP 32891388A JP H01213770 A JPH01213770 A JP H01213770A
Authority
JP
Japan
Prior art keywords
character
characters
signal
integrated
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63328913A
Other languages
English (en)
Inventor
Tsutomu Ikeda
勉 池田
Masanori Iwamoto
岩本 昌則
Shuji Kizu
木津 修治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63328913A priority Critical patent/JPH01213770A/ja
Publication of JPH01213770A publication Critical patent/JPH01213770A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は、光学式文字読取装置において、文字を1つ
ずつ分離する文字検出切出方式に関する。
(従来の技術) たとえば、郵便物上にタイプ印刷された活字郵便番号を
光学的に読取る光学式文字読取装置においては、文字認
識を行う前に文字の検出切出しを行っている。従来のこ
のような文字検出切出方式は、たとえば第1図に示すよ
うに、郵便物上の郵便番号を光学的に走査して光電変換
する光電変換部1の出力信号をアンプ2を介して量子化
回路3へ供給し、ここで量子化することにより”1”。
O”の二値化文字パターンに変換し、この二値化文字パ
ターンにより文字検出切出回路4で文字を1つずつ分離
するようになっている。゛しかるに、通常、タイプ印刷
のにじみあるいは紙面ノイズなどが原因で、たとえば第
2図に示すように、紙面上において複数の文字が連結し
ている場合がある。なお、第2図中、5は文字情報(郵
便番号)、6はにじみなどによる複数文字の連結部であ
る。このような場合、上述した従来の方法では、それら
を分離することができず、たとえ分離できたとしても精
度の高い文字分離は不可能であった。
そこで、連結されている文字を分離可能とするものとし
て、たとえば特開昭51−5927号公報に示すような
文字切物し分離装置が提案されている。この装置では、
各文字間が直接分離し得るような字間構成の場合には二
値化文字パターンを用いた処理(二値パターン処理)に
よって分離し、相隣る文字間が直接分離不能なような字
間構成については、あらかじめ定めた字数によって按分
して求められる基準線の左右一定の帯域にわたって列方
向に多値化文字パターンの濃度の累積値を求め、その値
が最小となるような列で連結の文字を分離するものであ
る。
しかしながら、上記の装置による文字の分離は、ある基
準線の左右一定の帯域についてのみ多値パターン処理を
行い、累積値が最小となる列で強制的に分離するように
している。このため、基準線の設定の仕方によって精度
が大きく左右されるものである。すなわち、連結文字を
字数によって等分する位置に基準線を設定するものであ
るため、連結文字を構成する各文字の大きさが等しいも
のについては高精度で分離することができる。しかし、
各文字の大きさが均一でないものについては、非常に精
度が低く、このようなものではかえって後の文字認識処
理などにおける精度までをも悪くするという欠点があっ
た。
(発明が解決しようとする課題) 上述したように、従来の装置では、連結されている複数
文字を高精度にて分離することができず、特に強制的に
分離するようにしたものでは、かえりで後の文字認識処
理などにおける精度までをも悪くするという欠点があっ
た。
そこで、この発明は、連結部が検出された連結文字につ
いてはそれらを確実に分離することができ、しかも分離
後における処理の精度を低下させることのない文字検出
切出方式を提供することを目的としている。
[発明の構成] (課題を解決するための手段) この発明にあっては、記録媒体上の文字列を光学的に走
査して充電変換することによりその文字列内の各文字を
読取る光学式文字読取装置の文字検出切出方式において
、前記充電変換信号を文字の濃度に対応する信号レベル
にデジタル化することにより多値化文字パターンを得る
手段と、前記多値化文字パターンの信号レベルを文字の
配列と直交する方向に走査した各走査線ごとに信号レベ
ルの積算を行って投影積算信号を作成する手段と、この
手段により作成された積算信号の積算値の極小値部分お
よびその個数を検出する検出手段と、この検出手段によ
り検出された積算値の極小値部分で各文字を分離する分
離手段と、前記検出手段により積算信号の積算値の極小
値部分が検出されない場合、および前記極小値部分の個
数が前記文字列内の文字数と等しいか、または文字数よ
り多い場合、前記分離手段における分離動作を禁止せし
めるよう制御する制御手段とから構成されている。
(作用) この発明は、上記した手段により、多値化文字パターン
の信号レベルを文字の配列と直交する方向に走査した各
走査線ごとに信号レベルの積算を行って投影積算信号を
作成し、その積算信号の積算値がある基準値よりも小さ
くなる極小値部分およびその個数を検出するとともに、
この極小値部分の個数と文字列内の文字数とを比較し、
前記極小値部分の個数が文字数より少ない場合には、積
′n値の極小値部分で各文字を分離するようにし、極小
値部分が検出されない場合、および極小値部分の個数が
文字列内の文字数と等しいか、または文字数より多い場
合には、分離不能として文字の分離を行わないようにし
たものである。
(実施例) 以下、この発明の一実施例について図面を参照して説明
する。
第3図は、この発明を説明するためのブロック図を示す
もので、11は郵便物上の郵便番号を光学的に走査して
光電変換する光電変換部、12は光電変換部11の出力
信号を増幅する増幅器、13は増幅器12の出力信号を
量子化して“1”。
“0”の二値化文字パターンに変換する量子化回路、1
4は量子化回路13から出力される二値化文字パターン
を一時記憶する二値化パターンメモリ、15はメモリ1
4内の文字パターンにより従来と同様な文字分離を行う
とともに、このとき複数文字連結の有無を判定する文字
検出切出回路、16は増幅器12の出力信号をその濃度
に応じて多値にデジタル化して多値化文字パターンに変
換するA/D変換器、17はA/D変換器16から出力
される多値化文字パターンを一時記憶する多値化パター
ンメモリ、18は文字分離回路で、文字検出切出回路1
5の判定により複数文字連結していた場合、メモリ17
内の文字パターンの信号レベルを文字の配列と直交する
方向に走査し、各走査線ごとに信号レベルの積算を行っ
て投影積算形積算信号の谷の部分で文字を強制分離する
回路である。
次に、このような構成において、この発明による文字検
出切出方式について詳細に説明する。いま、充電変換部
11から文字情報の濃度に対応した光電変換信号が出力
されると、その信号は増幅器12を通って量子化回路1
3およびA/D変換器16にそれぞれ供給される。する
と、量子化回路13は、増幅器12の出力信号を二値化
文字パターンに変換し、それを二値化パターンメモリ1
4に記憶する。
一方、A/D変換器16は、増幅器12の出力信号をそ
の濃度に応じて多値にデジタル化して多値化文字パター
ンに変換し、それを多値化パターンメモリ17に記憶す
る。しかして、まず文字検出切出回路15は、メモリ1
4の二値化文字パターンを用いることにより、従来と同
様に文字の水平および垂直射影を作成することにより文
字の分離を行うとともに、このとき複数文字連結の有無
を判定する。すなわち、いま充電変換された文字情報が
、たとえば第4図<a>に示すように4桁の郵便番号で
、その2桁目と3桁目とが連結しているものとすると、
その水平および垂直射影は同図(b)、(C)に示すよ
うになる。この各文字パターンの水平および垂直射影に
より、同図(d)に示すように、各文字の幅Wと高さH
とを算出し、その中で幅Wが高さHよりも一定の比率以
上大きく、かつ他の文字幅のn倍程度の文字があるか否
かを判別し、あればそれは複数の文字が連結しているも
のと判定する。この場合、第4図(a)のように、2桁
目と3桁目とが連結しているので、その旨の判定信号を
出力する。
この判定信号が出力されると、その信号に応じて多値化
パターンメモリ17の対応する部分のアドレス指定が行
われ、文字分離回路18はそのアドレス指定された部分
の多値化文字パターンを文字の高さ方向に順次走査する
。すなわち、この場合は、前述したように、横書き文字
の2桁目と3桁目とが連結しているので、メモリ17の
アドレス指定された部分の多値化文字パターンは第5図
(a)に示すようになり、紙面と直交する方向に濃度に
対応したレベルを有している。この文字パターンを文字
分離回路18が図示矢印のように順次走査し、第5図(
b)に示すように、各走査線ごとに信号レベルの積算を
行い、垂直方向(文字の配列と直交する方向)の投影積
算信号を作成する。
そして、この投影積算信号の作成が終了すると、文字分
離回路18は、文字検出切出回路15で算出された各文
字の幅Wと高さHとの比などにより、連結部分に含まれ
る文字数を推定しく郵便番号などでは合計文字数は一定
であり、よって比較的容易に推定できる)、それに基い
て上記作成した投影積算信号の谷の部分(第5図の符号
7)を検出することにより、この検出した谷の部分を文
字分離点とみなして、そこで文字を強制分離する。この
場合、たとえば文字数が2個と推定されるものについて
は最も深い谷を、また3個と推定される場合は深い谷を
2個検出する。ただし、同じような深さの谷が推定文字
数以上あった場合、および谷と思われるところが無かっ
た場合は検出切出不能と判断する。
このように、量子化した単なる二値化文字パターンでは
複数の文字が連結していても、第5図(b)の投影積算
信号からも明らかなように、濃度値的には信号レベルの
差が生じる場合が多い。
そこで、文字検出切出回路15で通常の文字分離を行う
とともに、複数文字連結の有無を判定し、複数の文字が
連結していた場合、A/D変換器16で多値にデジタル
化された多値化文字パターンを用いることにより、対応
する部分を垂直方向に複数回走査し、その各走査線ごと
の信号レベルの積算を行って投影積算信号を作成する。
そして、上記連結部分に含まれる文字数を推定すること
により、上記投影積算信号の谷の部分を検出してその部
分で文字を強制分離するものである。したがって、タイ
プ印刷のにじみあるいは紙面ノイズなどが原因で複数の
文字が連結していても、それらの影響を受けることなく
確実に分離し、精度の高い文字分離が行える。
また、従来のように、二値化文字パターンのみを用いて
文字分離を行う方式に比して、同一分解能でより高い性
能の文字分離が可能となる。特に、文字の大きさに多少
のばらつきがある手書き文字などを分離する場合に有用
である。
しかも、同じような深さの谷が推定文字数以上あった場
合、および谷と思われるところが無かった場合は検出切
出不能と判断するようにしているため、誤って連結部分
以外のところで切出された文字によって後段の処理、た
とえば文字認識処理の精度が低下されるようなことが無
い。
なお、前記実施例では、文字連結部分の多値化文字パタ
ーンを垂直方向に複数回走査し、その各走査線ごとの信
号レベルの積算を行うことにより垂直方向の投影積算信
号を作成し、この投影積算信号の谷の部分を検出して文
字分離を行う場合について説明したが、たとえば上記各
走査線ごとに信号のピーク値を検出することによりその
投影パターンを作成し、この投影パターンの谷の部分を
検出して文字分離を行うようにしても良い。
また、タイプ印刷された活字郵便番号の文字分離を行う
場合について説明したが、たとえば手書きされた手書き
郵便番号における続き文字の分離を行う場合にも同様に
実施でき、さらに郵便番号に限らず、他の文字情報の文
字分離にも実施し得る。
[発明の効果] 以上、詳述したようにこの発明によれば、連結部が検出
された連結文字についてはそれらを確実に分離すること
ができ、しかも分離後における処理の精度を低下させる
ことのない文字検出切出方式を堤洪できる。
【図面の簡単な説明】
第1図は従来の文字検出切出方式を説明するためのブロ
ック図、第2図は複数の文字が連結している文字情報の
一例を示す図、第3図はこの発明の一実施例を説明する
ためのブロック図、第4図(a)〜(d)および第5図
(a)、(b)は同実施例の作用を説明するための図で
ある。 11・・・光電変換部、13・・・量子化回路、14・
・・二値化パターンメモリ、15・・・文字検出切出回
路、16・・・A/D変換器、17・・・多値化パター
ンメモリ、18・・・文字分離回路。 出願人代理人 弁理士 鈴江武彦 第1図 第2図 第3図 第4図 第5図

Claims (1)

  1. 【特許請求の範囲】 記録媒体上の文字列を光学的に走査して光電変換するこ
    とによりその文字列内の各文字を読取る光学式文字読取
    装置の文字検出切出方式において、 前記光電変換信号を文字の濃度に対応する信号レベルに
    デジタル化することにより多値化文字パターンを得る手
    段と、 前記多値化文字パターンの信号レベルを文字の配列と直
    交する方向に走査した各走査線ごとに信号レベルの積算
    を行って投影積算信号を作成する手段と、 この手段により作成された積算信号の積算値の極小値部
    分およびその個数を検出する検出手段と、この検出手段
    により検出された積算値の極小値部分で各文字を分離す
    る分離手段と、 前記検出手段により積算信号の積算値の極小値部分が検
    出されない場合、および前記極小値部分の個数が前記文
    字列内の文字数と等しいか、または文字数より多い場合
    、前記分離手段における分離動作を禁止せしめるよう制
    御する制御手段とを具備したことを特徴とする文字検出
    切出方式。
JP63328913A 1988-12-28 1988-12-28 文字検出切出方式 Pending JPH01213770A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63328913A JPH01213770A (ja) 1988-12-28 1988-12-28 文字検出切出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63328913A JPH01213770A (ja) 1988-12-28 1988-12-28 文字検出切出方式

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP7816280A Division JPS575181A (en) 1980-06-10 1980-06-10 Character detection and segmentation system

Publications (1)

Publication Number Publication Date
JPH01213770A true JPH01213770A (ja) 1989-08-28

Family

ID=18215493

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63328913A Pending JPH01213770A (ja) 1988-12-28 1988-12-28 文字検出切出方式

Country Status (1)

Country Link
JP (1) JPH01213770A (ja)

Similar Documents

Publication Publication Date Title
EP0621542B1 (en) Method and apparatus for automatic language determination of a script-type document
US4992650A (en) Method and apparatus for barcode recognition in a digital image
US5280367A (en) Automatic separation of text from background in scanned images of complex documents
US5506918A (en) Document skew detection/control system for printed document images containing a mixture of pure text lines and non-text portions
US8306325B2 (en) Text character identification system and method thereof
EP0731599B1 (en) Image processing apparatus and method therefor
US4850029A (en) Adaptive threshold circuit for image processing
WO1991017519A1 (en) Row-by-row segmentation and thresholding for optical character recognition
US6269186B1 (en) Image processing apparatus and method
US5315405A (en) Binary circuit of scanner read image data
USH681H (en) Dot matrix print detector
JPH01213770A (ja) 文字検出切出方式
JPH0131236B2 (ja)
JP2812619B2 (ja) 画像処理装置
JPH0468966A (ja) 網点背景文字諳別装置とその装置を用いた画信号処理装置
JP2590099B2 (ja) 文字読取方式
JPH02123488A (ja) 光学的文字読取装置
JP2877548B2 (ja) 文書画像の属性判別方法
JPS59109978A (ja) 光学文字読取装置
JPS6160475B2 (ja)
JPH05233878A (ja) 画像データ読み取り装置における画像データの2値化判別方式
JPH0259504B2 (ja)
JPH02191085A (ja) 画像2値化識別方法
JPH05344329A (ja) 画像領域識別装置
JPS5864578A (ja) 文字切出し装置