JPH0131236B2 - - Google Patents

Info

Publication number
JPH0131236B2
JPH0131236B2 JP55078162A JP7816280A JPH0131236B2 JP H0131236 B2 JPH0131236 B2 JP H0131236B2 JP 55078162 A JP55078162 A JP 55078162A JP 7816280 A JP7816280 A JP 7816280A JP H0131236 B2 JPH0131236 B2 JP H0131236B2
Authority
JP
Japan
Prior art keywords
character
characters
signal
pattern
integrated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55078162A
Other languages
English (en)
Other versions
JPS575181A (en
Inventor
Tsutomu Ikeda
Masanori Iwamoto
Shuji Kizu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP7816280A priority Critical patent/JPS575181A/ja
Publication of JPS575181A publication Critical patent/JPS575181A/ja
Publication of JPH0131236B2 publication Critical patent/JPH0131236B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は、光学式文字読取装置において文字を
1つずつ分離する文字検出切出方式に関する。
たとえば郵便物上にタイプ印刷された活字郵便
番号を光学的に読取る光学式文字読取装置におい
ては、文字認識を行う前に文字検出切出しを行つ
ている。従来のこのような文字検出切出方式は、
たとえば第1図に示すように、郵便物上の郵便番
号を光学的に走査して光電変換する光電変換部1
の出力信号をアンプ2を介して量子化回路3へ供
給し、ここで量子化することにより“1”、“0”
の二値化文字パターンに変換し、この二値化文字
パターンにより文字検出切出回路4で文字を1つ
ずつ分離するようになつている。しかるに通常、
タイプ印刷のにじみあるいは紙面ノイズなどが原
因で、たとえば第2図に示すように紙面上におい
て複数の文字が連結している場合がある。なお、
第2図中5は文字情報(郵便番号)、6はにじみ
などによる複数文字の連結部である。このような
場合、上述した従来の方式ではそれらを分離する
ことができず、たとえ分離できたとしても精度の
高い文字分離は不可能であつた。
本発明は上記事情に鑑みてなされたもので、そ
の目的とするところは、複数の文字が連結してい
てもそれらを確実に分離し、かつ精度の高い文字
分離が可能となる文字検出切出方式を提供するこ
とにある。
以下、本発明の一実施例について図面を参照し
て説明する。
第3図は本発明を説明するためのブロツク図を
示すもので、11は郵便物上の郵便番号を光学的
に走査して光電変換する光電変換部、12は光電
変換部11の出力信号を増幅する増幅器、13は
増幅器12の出力信号を量子化して“1”、“0”
の二値化文字パターンに変換する量子化回路、1
4は量子化回路13から出力される二値化文字パ
ターンを一時記憶する二値化パターンメモリ、1
5はメモリ14内の文字パターンにより従来と同
様な文字分離を行うとともにこのとき複数文字連
結の有無を判定する文字検出切出回路、16は増
幅器12の出力信号をその濃度に応じて多値にデ
ジタル化して多値化文字パターンに変換するA/
D変換器、17はA/D変換器16から出力され
る多値化文字パターンを一時記憶する多値化パタ
ーンメモリ、18は文字分離回路で、文字検出切
出回路15の判定により複数文字連結していた場
合、メモリ17内の文字パターンの信号レベルを
文字の配列と直交する方向に走査し、各走査線ご
とに信号レベルの積算を行つて投影積算信号を作
成して積算値(投影信号)の低い所、つまり投影
積算信号の谷の部分を検出し、その投影積算信号
の谷の部分で文字を強制分離する回路である。
次に、このような構成において本発明による文
字検出切出方式を詳細に説明する。いま光電変換
部11から文字情報の濃度に対応した光電変換信
号が出力されると、その信号は増幅器12を通つ
て量子化回路13およびA/D変換器16にそれ
ぞれ供給される。すると、量子化回路13は増幅
器12の出力信号を二値化文字パターンに変換
し、それを二値化パターンメモリ14に記憶す
る。一方、A/D変換器16は増幅器12の出力
信号をその濃度に応じて多値にデジタル化して多
値化文字パターンに変換し、それを多値化パター
ンメモリ17に記憶する。しかして、まず文字検
出切出回路15は、メモリ14の二値化文字パタ
ーンを用いることにより、従来と同様に文字の水
平および垂直射影を作成することにより文字の分
離を行うとともに、このとき複数文字連結の有無
を判定する。すなわち、いま光電変換された文字
情報がたとえば第4図aに示すように4桁の郵便
番号で、その2桁目と3桁目とが連結しているも
のとすると、その水平および垂直射影は同図b,
cに示すようになる。この各文字パターンの水平
および垂直射影により、同図dに示すように各文
字の幅Wと高さHを算出し、その中で幅Wが高さ
Hよりも一定の比率以上大きく、かつ他の文字幅
のn倍程度の文字があるか否かを判別し、あれば
それは複数の文字が連結しているものと判定す
る。この場合、第4図aのように2桁目と3桁目
とが連結しているのでその旨の判定信号を出力す
る。
この判定信号が出力されると、その信号に応じ
て多値化パターンメモリ17の対応する部分のア
ドレス指定が行われ、文字分離回路18はそのア
ドレス指定された部分の多値化文字パターンを文
字の高さ方向に順次走査する。すなわち、この場
合は前述したように横書き文字の2桁目と3桁目
とが連結しているので、メモリ17のアドレス指
定された部分の多値化文字パターンは第5図aに
示すようになり、紙面と直交する方向に濃度に対
応したレベルを有している。この文字パターンを
文字分離回路18が図示矢印のように順次走査
し、第5図bに示すように各走査線ごとに信号レ
ベルの積算を行い、垂直方向(文字の配列と直交
する方向)の投影積算信号を作成する。そして、
この投影積算信号の作成が終了すると、文字分離
回路18は文字検出切出回路15で算出された各
文字の幅Wと高さHとの比などにより、連結部分
に含まれる文字数を推定し(郵便番号などでは合
計文字数は一定であり、よつて比較的容易に推定
できる)、それに基いて上記作成した投影積算信
号の谷の部分(第5図の符号7)を検出すること
により、この検出した谷の部分を文字分離点とみ
なしてそこで文字を強制分離する。この場合、た
とえば文字数が2個と推定されるものについては
最も深い谷を、また3個と推定される場合は深い
谷を2個検出する。ただし、同じような深さの谷
が推定文字数以上あつた場合、および谷と思われ
るところが無かつた場合は検出切出不能と判断す
る。
このように、量子化した単なる二値化文字パタ
ーンでは複数の文字が連結していても、第5図b
の投影積算信号からも明らかなように、濃度値的
には信号レベルの差が生じる場合が多い。そこ
で、文字検出切出回路15で通常の文字分離を行
うとともに複数文字連結の有無を判定し、複数の
文字が連結していた場合、A/D変換器16で多
値にデジタル化された多値化文字パターンを用い
ることにより、対応する部分を垂直方向に複数回
走査し、その各走査線ごとの信号レベルの積算を
行つて投影積算信号を作成する。そして上記連結
部分に含まれる文字数を推定することにより、上
記投影積算信号の谷の部分を検出してその部分で
文字を強制分離するものである。したがつて、タ
イプ印刷のにじみあるいは紙面ノイズなどが原因
で複数の文字が連結していても、それらの影響を
受けることなく確実に分離し、精度の高い文字分
離が行える。また、従来のように二値化文字パタ
ーンのみを用いて文字分離を行う方式に比して、
同一分解能でより高い性能の文字分離が可能とな
る。
なお前記実施例では、文字連結部分の多値化文
字パターンを垂直方向に複数回走査し、その各走
査線ごとの信号レベルの積算を行うことにより垂
直方向の投影積算信号を作成し、この投影積算信
号の谷の部分を検出して文字分離を行う場合につ
いて説明したが、たとえば上記各走査線ごとに信
号のピーク値を検出することによりその投影パタ
ーンを作成し、この投影パターンの谷の部分を検
出して文字分離を行うようにしてもよい。また、
タイプ印刷された活字郵便番号の文字分離を行う
場合について説明したが、たとえば手書された手
書郵便番号における続き文字の分離を行う場合に
も同様に実施でき、さらに郵便番号に限らず、他
の文字情報の文字分離にも実施し得る。
以上詳述したように本発明によれば、複数の文
字が連結していてもそれらを確実に分離し、かつ
精度の高い文字分離が可能となる文字検出切出方
式を提供できる。
【図面の簡単な説明】
第1図は従来の文字検出切出方式を説明するた
めのブロツク図、第2図は複数の文字が連結して
いる文字情報の一例を示す図、第3図は本発明の
一実施例を説明するためのブロツク図、第4図a
〜dおよび第5図a,bは同実施例の作用を説明
するための図である。 11…光電変換部、13…量子化回路、14…
二値化パターンメモリ、15…文字検出切出回
路、16…A/D変換器、17…多値化パターン
メモリ、18…文字分離回路。

Claims (1)

  1. 【特許請求の範囲】 1 記録媒体上の文字情報を光学的に走査して光
    電変換することによりその文字情報を読取る光学
    式文字読取装置において、 前記光電変換信号を量子化することにより二値
    化文字パターンを得る手段と、 前記光電変換信号を文字の濃度に対応する信号
    レベルにデジタル化することにより多値化文字パ
    ターンを得る手段と、 前記二値化文字パターンにより文字を1つずつ
    分離するとともに、このとき前記二値化文字パタ
    ーンの水平および垂直射影により文字の高さと幅
    とを求め、この求めた文字の高さを基準とする文
    字の幅から複数文字連結の有無を判定する手段
    と、 この手段の判定により複数文字連結していた場
    合、前記多値化文字パターンの信号レベルを文字
    の配列と直交する方向に走査した各走査線ごとに
    信号レベルの積算を行つて投影積算信号を作成す
    る手段と、 この手段により作成された積算信号の積算値の
    低いところを検出する手段と、 この手段により検出した積算値の低い部分で文
    字を強制分離する手段と を具備したことを特徴とする文字検出切出方式。
JP7816280A 1980-06-10 1980-06-10 Character detection and segmentation system Granted JPS575181A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7816280A JPS575181A (en) 1980-06-10 1980-06-10 Character detection and segmentation system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7816280A JPS575181A (en) 1980-06-10 1980-06-10 Character detection and segmentation system

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP63328913A Division JPH01213770A (ja) 1988-12-28 1988-12-28 文字検出切出方式

Publications (2)

Publication Number Publication Date
JPS575181A JPS575181A (en) 1982-01-11
JPH0131236B2 true JPH0131236B2 (ja) 1989-06-23

Family

ID=13654225

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7816280A Granted JPS575181A (en) 1980-06-10 1980-06-10 Character detection and segmentation system

Country Status (1)

Country Link
JP (1) JPS575181A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603074A (ja) * 1983-06-20 1985-01-09 Ricoh Co Ltd 文字・記号抽出方法
JPS6011966A (ja) * 1983-07-01 1985-01-22 Toshiba Corp 画像処理装置
JPS60159986A (ja) * 1984-01-30 1985-08-21 Toshiba Corp 光学的文字読取装置
JPS61190679A (ja) * 1985-02-19 1986-08-25 Fujitsu Ltd 文字デ−タ処理装置
JPS6227876A (ja) * 1985-07-30 1987-02-05 Toshiba Corp 文字読取装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS515927A (ja) * 1974-07-03 1976-01-19 Nippon Electric Co

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS515927A (ja) * 1974-07-03 1976-01-19 Nippon Electric Co

Also Published As

Publication number Publication date
JPS575181A (en) 1982-01-11

Similar Documents

Publication Publication Date Title
CA2044400A1 (en) Image processing system for documentary data
JPS55138174A (en) Pattern feature extractor
US4355301A (en) Optical character reading system
US6269186B1 (en) Image processing apparatus and method
JPH0131236B2 (ja)
JP2500859B2 (ja) バ−コ−ド読取装置
JP2812619B2 (ja) 画像処理装置
JP3957471B2 (ja) 分離文字列統合装置
JPH01213770A (ja) 文字検出切出方式
JP2590099B2 (ja) 文字読取方式
JPS6037952B2 (ja) 最適二値化方式
JP3095437B2 (ja) 文字行検出切出装置および文字読取装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH0119193B2 (ja)
JPS6160475B2 (ja)
JPH07104907B2 (ja) 二値化回路
JPS6027437B2 (ja) 量子化回路
JPH02135586A (ja) 光学式文字読取装置
JPH04167084A (ja) 文字読取装置
JPH0135384B2 (ja)
JPH04288773A (ja) 属性判別方法
JPH04274583A (ja) 文字読取装置
JPS6248874B2 (ja)
JPH0475557B2 (ja)
JPH0677270B2 (ja) 文字認識装置