JP3476936B2 - Character line direction determination device - Google Patents

Character line direction determination device

Info

Publication number
JP3476936B2
JP3476936B2 JP31649494A JP31649494A JP3476936B2 JP 3476936 B2 JP3476936 B2 JP 3476936B2 JP 31649494 A JP31649494 A JP 31649494A JP 31649494 A JP31649494 A JP 31649494A JP 3476936 B2 JP3476936 B2 JP 3476936B2
Authority
JP
Japan
Prior art keywords
image
character line
pixel
processing
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31649494A
Other languages
Japanese (ja)
Other versions
JPH08171607A (en
Inventor
博 高橋
好勝 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP31649494A priority Critical patent/JP3476936B2/en
Publication of JPH08171607A publication Critical patent/JPH08171607A/en
Application granted granted Critical
Publication of JP3476936B2 publication Critical patent/JP3476936B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、たとえば、郵便物上の
宛名情報を読取る宛名読取装置において、郵便物上の宛
名領域内に記載された宛名情報を構成する宛名文字行の
方向を判別する文字行方向判別装置に関する。 【0002】 【従来の技術】たとえば、印刷あるいはタイプされた活
字文字を読取り認識する装置としては、郵便物自動読取
区分機における宛名読取装置がその代表的なものであ
る。通常、印刷あるいはタイプされた郵便番号や宛名文
字行を持つ郵便物は、大口利用者により一括発送される
ことが多く、これら利用者の同一形式の郵便物はまとめ
て処理することが必要となる。 【0003】したがって、従来、この種の郵便物を宛名
読取装置で読取る際には、文字認識が容易となるよう
に、宛名文字行の縦方向あるいは横方向の記載の区別
(つまり、文字行方向の区別)をあらかじめ設定してい
る。 【0004】しかし、本来、種々雑多な書式の郵便物を
短時間に処理する場合、あるいは、いくつもの種類の郵
便物が混在している場合、手操作による記載方向(文字
行方向)の設定は、宛名読取装置の処理能力向上および
操作上において大きな問題となる。 【0005】従来、郵便物上に記載された宛名文字行の
方向を判別する第1の手法として、たとえば、郵便物上
に印刷されている料金後納印の丸枠内部の線、または、
文字の書体方向を検出することで、宛名文字行の記載方
向を判別する方法が知られている。すなわち、料金後納
印の丸枠内部の線の方向、または、文字の書体方向と宛
名文字行の記載方向とが一致しているということを基
に、宛名文字行の方向を判別するものである。 【0006】また、従来、これとは別の第2の手法とし
て、郵便物上の文字ブロックの縦寸法および横寸法をそ
れぞれ測定し、寸法の大きい方を縦方向とするという方
法も知られている。これは、印刷あるいはタイプされた
活字文字は、特定の記号を除いては、縦寸法(高さ)の
方が横寸法(幅)よりも大きいということを利用したも
のである。 【0007】 【発明が解決しようとする課題】しかしながら、上記し
た第1の手法では、料金後納印や別納印の丸枠内部の線
の方向、または、文字の書体方向と宛名文字行の記載方
向とが一致しているということを基に、宛名文字行の方
向を判別しているため、この規則に反する郵便物の場
合、宛名文字行の方向判別を誤ってしまう。また、料金
後納印や別納印のない郵便物では、宛名文字行の方向が
判別できない。 【0008】また、上記した第2の手法では、印刷ある
いはタイプされた活字文字は、特定の記号を除いては、
縦寸法(高さ)の方が横寸法(幅)よりも大きいという
ことを基に、宛名文字行の方向を判別しているため、こ
の規則に反する活字文字(漢字等)の場合、宛名文字行
の方向判別を誤ってしまう。また、文字どうしが接近し
ている、漢字を構成している部首の間のスペースが多い
などにより、文字の上端や下端の検出を誤ると、宛名文
字行の方向判別を誤ることがある。 【0009】そこで、本発明は、従来のような制約を受
けることなく、読取物上の文字行の方向を正確に判別す
ることができる文字行方向判別装置を提供することを目
的とする。 【0010】 【課題を解決するための手段】本発明の文字行方向判別
装置は、横方向あるいは縦方向に記載された文字行が存
在する読取物上の前記文字行を含む画像を入力する画像
入力手段と、この画像入力手段により入力された画像
対し微分マトリクスを用いて横方向および縦方向にそれ
ぞれ微分する微分手段と、この微分手段により横方向お
よび縦方向に微分された各画素値の絶対値を取る処理を
行なうことにより当該画素値の符号を一致させる同符号
化手段と、この同符号化手段により符号を一致させた横
方向および縦方向の各画素値からそれぞれ極大点を検出
する極大点検出手段と、この極大点検出手段により検出
された横方向および縦方向の極大点の論理和をとること
により2値化する2値化手段と、この2値化手段により
2値化された画像に対し各画素ごとに当該画素がその周
囲の画素と孤立した値を示すときその画素を特定の値に
置き換えることにより孤立点を除去する孤立点除去手段
と、この孤立点除去手段により孤立点を除去した画像の
有効画素に注目してその近傍に有効画素が存在すればそ
の画素を同一のラベルにする処理を行なうことによりラ
ベリングするラベリング手段と、このラベリング手段に
よりラベリングされた画像に対し当該画像を含む最も小
さな外接矩形を作成することにより外接矩形化する外接
矩形化手段と、この外接矩形化手段により外接矩形化さ
れた画像のうち微小あるいは過大な大きさの外接矩形を
除去する微小・過大外接矩形除去手段と、この微小・過
大外接矩形除去手段による処理の結果、残った外接矩形
化された画像を横方向および縦方向にそれぞれクラスタ
化することにより統合する統合手段と、この統合手段
より統合された各方向の統合数をそれぞれ計数する計数
手段と、この計数手段により計数された各統合数に基づ
き前記読取物上の文字行の方向を判別する判別手段とを
具備している。 【0011】 【0012】 【0013】 【0014】 【0015】 【作用】本発明によれば、たとえば、郵便物において、
文字行の方向判別を文字の記載されている特徴に基づい
て判別するため、従来のような料金後納印や別納印の丸
枠内部の線の方向や文字の書体方向に関係なく、また、
それらが郵便物上に存在しなくても、宛名文字行の方向
を正確に判別することができる。 【0016】また、個々の文字について解析するのでは
なく、文字行全体の特徴によって文字行の方向を判別す
るため、個々の文字においての判別結果に関係なく、文
字行の方向判別が可能である。 【0017】さらに、たとえば、郵便物において、郵便
物の宛名文字行の記載方向が判別できることによって、
文字認識の際に認識方向を特定でき、他の記載方向を仮
定した文字認識をする必要がなくなる。 【0018】 【実施例】以下、本発明の一実施例について図面を参照
して説明する。図1は、本発明に係る文字行方向判別装
置が適用される郵便物の宛名読取装置の構成を示すもの
である。すなわち、この宛名読取装置は、図示矢印方向
に搬送される読取物としての郵便物P上を照明する光源
101、レンズなどの光学系102、および、郵便物P
の搬送方向と直交方向に配設されたCCD形のラインセ
ンサ103などからなり、郵便物P上の宛名文字列を含
む画像を入力する画像入力部(画像入力手段)104、
ラインセンサ103の出力信号をデジタル化するA/D
変換部105、A/D変換部105から出力される画像
データを格納する画像メモリ106、処理領域を指定す
る処理領域指定部107、画像メモリ106内の画像デ
ータの処理領域指定部107で指定された処理領域内の
画像データをブロック化するブロック化処理部108、
ブロック化処理部108でブロック化されたデータを横
方向および縦方向にそれぞれクラスタ化(統合)するク
ラスタ化処理部109、クラスタ化処理部109でクラ
スタ化された横方向および縦方向の各クラスタ数をそれ
ぞれカウントし、このカウントした横方向および縦方向
の各クラスタ数を比較し、小さいクラスタ数の統合方向
を文字行方向として出力するクラスタ数カウント・比較
部110、および、クラスタ数カウント・比較部110
から出力された文字行方向に基づき、郵便物P上の文字
を認識する文字認識部111から構成されている。 【0019】以下、各部の詳細について説明する。郵便
物Pは、その表面の宛名領域内に宛名情報を構成する宛
名文字行が横方向あるいは縦方向に記載されているもの
とし、図示しない搬送路によって図示矢印方向に搬送さ
れる。この搬送される郵便物P上の画像は、ラインセン
サ103によって光電変換され、画像に対応するアナロ
グ信号(画像信号)がA/D変換部105に送られる。 【0020】A/D変換部105では、送られてきたア
ナログ信号をデジタル信号に変換し、画像データとして
画像メモリ106に格納する。処理領域指定部107
は、ブロック化処理部108およびクラスタ化処理部1
09において処理する画像領域を指定する。 【0021】ブロック化処理部108は、画像メモリ1
06に格納された画像の処理領域指定部107で指定さ
れた領域内の画像を2値化し、ラベリング処理によって
ブロック化する。ここで、2値化処理には、様々な手法
が考えられ、たとえば、単純に所定の閾値で2値化す
る、注目画素の近傍画像の値によって2値化閾値を変動
させる、郵便物Pの画像を微分してから2値化する、な
どが考えられるが、ここでは、いずれの手法であっても
よい。また、ラベリング処理にも、種々の手法が考えら
れるが、ここでは、ラベリングの手法については特に規
定しない。 【0022】クラスタ化処理部109は、ブロック化処
理部108においてブロック化されたブロックデータを
特定の方向、この実施例では横方向および縦方向にそれ
ぞれにクラスタ化する。 【0023】クラスタ数カウント・比較部110は、ク
ラスタ化処理部109において横方向にクラスタ化され
たクラスタ数と、縦方向にクラスタ化されたクラスタ数
とを求めて、両者を比較し、クラスタ数の少ない方向を
文字行方向として出力する。すなわち、本実施例では、
一般に郵便物P上の宛名文字行は、ある一定方向に連続
して記載される特徴があり、また、広告文字は宛名文字
行と同一方向に記載される傾向がある、ということを利
用して文字行方向を判別している。 【0024】文字認識部111は、クラスタ数カウント
・比較部110から出力された文字行方向に、郵便物P
上の宛名文字を認識し、その認識結果を出力する。図2
は、前記ブロック化処理部108の構成を詳細に示すも
のである。以下に述べるブロック化処理では、処理領域
指定部107によって指定された処理領域のみに対して
処理を行なう。まず、2値化処理であるが、ここでは、
微分処理部501、同符号化処理部502、および、極
大点検出処理部503によって2値化を行なう手法につ
いて述べる。 【0025】微分処理部501は、画像メモリ106に
格納された画像を微分する。この微分処理は、ここでは
図3(a)、(c)に示した微分マトリクスを用いて、
X方向およびY方向それぞれについて行なう。 【0026】具体的には、画像メモリ106内の画像デ
ータにおいて、処理領域指定部107で指定された処理
領域が例えば図3(b)に示すような領域とすると、X
方向に対しては、図3(a)のマトリクスを、符号60
1,602,603,…といった形で順次かけてゆく。
この場合、符号601については、結果が5×1+3×
(−1)=2となり、画素座標位置(0,0)の微分値
は「2」となる。この操作を、図3(b)の画素座標位
置(4,0)、(4,1)、(4,2)、(4,3)、
(4,4)を除く全ての画素において行なう。Y方向に
ついても同様に、図3(c)のマトリクスを、画素座標
位置(0,4)、(1,4)、(2,4)、(3,
4)、(4,4)を除いて、図3(d)に示すように、
符号604,605,606,…といった形で順次かけ
てゆく。 【0027】同符号化処理部502は、微分処理部50
1で微分された画素値の絶対値をとる処理を行なう。X
方向、Y方向についての微分値がそれぞれ図4(a)、
(c)に示すものとすると、同符号化処理により、それ
ぞれ図4(b)、(d)に示すようになる。 【0028】極大点検出処理部503は、同符号化処理
部502で処理した画素値から、極大点を取出して2値
化する。たとえば、同符号化処理の結果が、X方向、Y
方向それぞれが図5(a)、(c)に示すように求めら
れたとすると、極大点の抽出方法を、たとえば、画素値
「5」以上の極大点として、それぞれ図5(b)、
(d)に示すように求められる。ここでは、極大点とし
て検出された画素を「1」、それ以外を「0」としてい
る。そして、X方向、Y方向それぞれの値の論理和(O
R)をとることにより、図5(e)に示すような結果と
なる。 【0029】孤立点除去処理部504は、極大点検出処
理部503において求められた2値化画像の孤立点を除
去する。具体的には、画像データ中に図6(a)に示す
ようなマトリクスが現れたら、図6(b)に示すように
中心画素を「0」に置き換える処理を行なう。 【0030】ラベリング処理部505は、孤立点除去処
理部504において処理した画像のラベリングを行な
う。具体的には、図7(a)に示す孤立点除去後の画像
の「1」の画素に注目し、8近傍に「1」の画素が存在
すれば、その画素を同一のラベルにするという処理を行
なう。図7(b)に、図7(a)の画像のラベリング処
理を行なった結果を示す。図のように、この場合は1つ
のラベル1001が作成される。 【0031】外接矩形化処理部506は、ラベリング処
理部505においてラベル付けされた画像を含む最も小
さな長方形を作成する。図8(a)に示すようなラベル
付けされた画像の外接矩形は、図8(b)に示すような
長方形1101となる。 【0032】ブロック化処理部108の最後として、微
小・過大ラベル除去処理部507は、外接矩形化処理部
506で作成された外接矩形のうち微小あるいは過大な
大きさの外接矩形を除去する。この大きさは、たとえ
ば、微小な外接矩形の大きさとして8×8(画素)以
下、過大な外接矩形の大きさとして120×120(画
素)以上といったように、画素値で与える。 【0033】図9は、前記処理領域指定部107におけ
る処理領域指定方法例を示している。指定方法には、郵
便物P上の画像全体、特定領域1201を除く全領域1
204(図9a)、特定領域1201からの相対領域1
202,1203(図9b,c)などであり、これらの
うちいずれか1つを指定する。 【0034】図10は、前記クラスタ化処理部109の
構成を詳細に示すものである。クラスタ化処理部109
では、ブロック化処理部108においてブロック化され
たデータを統合してクラスタ化する(以降、クラスタ化
したクラスタ部分を行とも呼ぶ)。本実施例では、ブロ
ックを統合する方向を横方向および縦方向の2方向に限
定するが、統合方向は、横方向、縦方向に限ったもので
はない。以下に述べるクラスタ化処理では、処理領域指
定部107によって指定された処理領域のみに対して処
理を行なう。 【0035】横方向統合処理部1301は、図11
(a)に示すようなブロック化された画像データを、図
11(b)に示すように横方向に統合(クラスタ化)す
る。横方向への統合方法の例を、図11(a)のブロッ
ク1401と1402との統合の場合を例に説明する。
図11(c)は、図11(a)のうちブロック140
1,1402を取出した図であるが、ブロック1401
から見てブロック1402を統合する範囲を、範囲14
04として指定する。この領域内にブロック1402が
一部でも含まれていれば、ブロック1401と1402
とを統合する。 【0036】しかし、ここでは、図11(d)に示すよ
うに、ブロック1405がブロック1401の統合範囲
1404の上端からはみ出した場合は統合しないことと
した。図11(c)における統合範囲の閾値は、たとえ
ば、a=6(画素)、b=35(画素)、c=6(画
素)、d=35(画素)として与える。 【0037】以上の処理によって、図11(a)のブロ
ック化データが、図11(b)のように3つのクラスタ
(行)1403に統合されることになる。また、縦方向
統合処理部1302は、図12(a)に示すようなブロ
ック化されたデータを、上記同様な手法で縦方向に統合
する。このような縦方向の統合処理によって、この例で
は、図12(b)に示すように5行のクラスタに統合さ
れることになる。 【0038】図13は、前記クラスタ数カウント・比較
部110の構成を詳細に示すものである。クラスタ数カ
ウント・比較部110では、まず、横方向行数カウンタ
部1601、縦方向カウンタ部1602において、それ
ぞれの統合方向における行数(クラスタ数)をカウント
する。図11、図12の例では、横方向の統合行数は
「3」、縦方向の統合行数は「5」となる。 【0039】次に、行数比較部1603では、各統合方
向のうち最も少ない行数となった方向を文字行の記載方
向として出力する。この例の場合、横方向が文字行の記
載方向として出力される。この出力結果が、郵便物P上
における宛名文字行の記載方向である。 【0040】このように、上記実施例によれば、郵便物
上における宛名文字行の記載方向の判別を、宛名文字行
の記載されている特徴に基づいて判別するため、従来の
ような料金後納印や別納印の丸枠内部の線の方向や文字
の書体方向に関係なく、また、それらが郵便物上に存在
しなくても、宛名文字行の記載方向を判別することがで
きる。 【0041】また、個々の文字について解析するのでは
なく、宛名文字行全体の特徴によって記載方向を判別す
るため、個々の文字においての判別結果に関係なく、宛
名文字行の記載方向の判別が可能である。 【0042】さらに、郵便物の宛名文字行の記載方向が
判別できることによって、文字認識の際に認識方向を特
定でき、他の記載方向を仮定した文字認識を行なう必要
がなくなる。 【0043】なお、前記実施例では、郵便物の宛名読取
装置において、郵便物上に記載された宛名情報を構成す
る宛名文字行の記載方向を判別する場合について説明し
たが、本発明はこれに限定されるものでなく、たとえ
ば、その他の帳票や有価証券などに記載された文字を読
取る文字読取装置などにおいて、文字行の方向を判別す
る場合にも同様に適用できる。 【0044】 【発明の効果】以上詳述したように本発明によれば、従
来のような制約を受けることなく、読取物上の文字行の
方向を正確に判別することができる文字行方向判別装置
を提供できる。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to, for example, an address reading apparatus for reading address information on a postal matter. The present invention relates to a character line direction determining device that determines the direction of a destination character line to be configured. 2. Description of the Related Art For example, as an apparatus for reading and recognizing printed or typed characters, an address reading apparatus in an automatic mail sorting machine is a typical example. Usually, mails with printed or typed postal codes or address lines are often sent in bulk by large users, and it is necessary to process mails of these users in the same format at once. . Therefore, conventionally, when this kind of mail is read by the address reading device, the vertical or horizontal writing of the address character line is distinguished (that is, the character line direction is changed) so that character recognition becomes easy. Is set in advance. However, when a postal matter of various formats is originally processed in a short time, or when a lot of types of postal matter are mixed, the setting of the writing direction (character line direction) by manual operation must be performed. This is a major problem in improving the processing capability and operation of the address reading device. Conventionally, as a first method for determining the direction of a destination character line described on a postal matter, for example, a line inside a round frame of a post-payment stamp printed on a postal matter, or
There is known a method of determining the writing direction of a destination character line by detecting the typeface of a character. That is, the direction of the address character line is determined based on the fact that the direction of the line inside the round frame of the post-pay stamp or the typeface direction of the character matches the writing direction of the address character line. . [0006] Conventionally, as another second technique, there has been known a method in which the vertical dimension and the horizontal dimension of a character block on a mail are measured, and the larger dimension is set as the vertical direction. I have. This is based on the fact that printed or typed characters have a larger vertical dimension (height) than a horizontal dimension (width) except for specific symbols. [0007] However, in the above-mentioned first method, the direction of the line inside the round frame of the post-paid stamp or the separate stamp, or the typeface direction of the character and the writing direction of the address character line are described. Since the direction of the address character line is determined based on the fact that the character string matches, the postal matter that violates this rule makes an incorrect determination of the direction of the address character line. In addition, the direction of the address character line cannot be determined for postal items without post-pay or post-payment stamps. [0008] In the above-mentioned second method, printed or typed characters, except for specific symbols, are:
Since the direction of the address text line is determined based on the fact that the vertical dimension (height) is larger than the horizontal dimension (width), if the type characters (Kanji etc.) violate this rule, Incorrect line direction determination. Further, if the upper and lower ends of the characters are erroneously detected because the characters are close to each other or the space between the radicals constituting the kanji is large, the direction of the address character line may be erroneously determined. SUMMARY OF THE INVENTION It is an object of the present invention to provide a character line direction discriminating apparatus capable of accurately discriminating the direction of a character line on a read object without being restricted by the prior art. According to the present invention, there is provided a character line direction discriminating apparatus for inputting an image including a character line on a reading material having a character line described in a horizontal direction or a vertical direction. input means, the input image by the image input means
On the other hand, using the differential matrix to
Differentiating means for differentiating each,
And the process of taking the absolute value of each pixel value differentiated in the vertical direction.
The same code that matches the sign of the pixel value by performing
Encoding means and a horizontal code whose codes are matched by the same encoding means.
Maximum point is detected from each pixel value in the vertical and vertical directions
Maximum point detection means and the maximum point detection means
OR of selected horizontal and vertical maxima
Binarizing means for binarizing by means of
For each pixel in the binarized image, the pixel
When an isolated value is shown with a surrounding pixel, that pixel is set to a specific value.
Isolated point removing means for removing isolated points by replacing
Of the image from which isolated points have been removed by the isolated point removing means.
Focusing on the effective pixel, if there is an effective pixel in the vicinity,
By performing the process of making the pixels of
The labeling means to be labeled and the labeling means
For the more labeled image, the smallest containing that image
A circumscribing to make a circumscribed rectangle by creating a small circumscribed rectangle
The circumscribed rectangle is formed by the rectifying means and the circumscribed rectangle.
Of the circumscribed rectangle of small or excessive size in the
The small / large circumscribed rectangle removing means to be removed
The remaining circumscribed rectangle as a result of processing by the large circumscribed rectangle removing means
Clustered images horizontally and vertically
And integrating means for integrating by reduction, to the integration means
And comprising counting means for counting more integrated each direction integration count, respectively, and discriminating means for discriminating the direction of the character line of the reading Butsujo based on each integrated number counted by the counting means. According to the present invention, for example, in mail,
In order to determine the direction of the character line based on the characteristics described in the character, regardless of the direction of the line inside the round frame of the post-pay stamp or the separate mark and the typeface of the character,
Even if they do not exist on the mail, the direction of the address character line can be accurately determined. Since the direction of a character line is determined based on the characteristics of the entire character line instead of analyzing each character, the direction of the character line can be determined regardless of the determination result of each character. . Further, for example, in a postal matter, by being able to determine the writing direction of the address character line of the postal matter,
The recognition direction can be specified at the time of character recognition, and it is not necessary to perform character recognition assuming another writing direction. An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 shows a configuration of a mail address reading device to which a character line direction discriminating device according to the present invention is applied. That is, the address reading device includes a light source 101 that illuminates a mail P as a read material conveyed in the direction of the arrow in the figure, an optical system 102 such as a lens, and a mail P.
An image input unit (image input means) 104 for inputting an image including an address character string on the mail P,
A / D for digitizing the output signal of line sensor 103
The conversion unit 105, the image memory 106 for storing the image data output from the A / D conversion unit 105, the processing region specification unit 107 for specifying the processing region, and the processing region specification unit 107 for the image data in the image memory 106. Blocking processing unit 108 for blocking image data in the processed processing area,
A clustering processing unit 109 that clusters (integrates) the data that has been blocked by the blocking processing unit 108 in the horizontal direction and the vertical direction, and the number of clusters in the horizontal and vertical directions that are clustered by the clustering processing unit 109 And a cluster count / comparator 110 and a cluster count / comparator, which compare the counted numbers of clusters in the horizontal and vertical directions and output the integration direction of the smaller number of clusters as the character line direction. 110
The character recognition unit 111 recognizes a character on the mail P based on the character line direction output from. The details of each section will be described below. The postal matter P is assumed to have address text lines constituting address information written in the horizontal or vertical direction in an address area on the front surface thereof, and are conveyed in the direction of the arrow shown in the figure by a conveyance path (not shown). The image on the conveyed mail P is photoelectrically converted by the line sensor 103, and an analog signal (image signal) corresponding to the image is sent to the A / D converter 105. The A / D converter 105 converts the transmitted analog signal into a digital signal, and stores the digital signal in the image memory 106 as image data. Processing area designation unit 107
Are the block processing unit 108 and the clustering processing unit 1
At 09, an image area to be processed is specified. The block processing unit 108 includes the image memory 1
The image in the area designated by the processing area designation unit 107 of the image stored in 06 is binarized, and is divided into blocks by labeling processing. Here, various methods are conceivable for the binarization processing. For example, binarization is simply performed using a predetermined threshold, the binarization threshold is changed according to the value of an image adjacent to the pixel of interest, For example, the image may be differentiated and then binarized, but in this case, any method may be used. Also, various methods can be considered for the labeling process, but here, the labeling method is not particularly defined. The clustering processing unit 109 clusters the block data divided by the blocking processing unit 108 in a specific direction, in this embodiment, horizontally and vertically. The cluster number counting / comparing unit 110 obtains the number of clusters clustered in the horizontal direction and the number of clusters clustered in the vertical direction in the clustering processing unit 109, compares them, and compares the two. Is output as the character line direction. That is, in this embodiment,
In general, address character lines on postal matter P are characterized in that they are written continuously in a certain direction, and advertisement characters tend to be written in the same direction as the address character lines. Character line direction is determined. The character recognizing section 111 outputs mail P in the direction of the character line output from the cluster number counting / comparing section 110.
Recognize the above address characters and output the recognition result. FIG.
7 shows the configuration of the blocking processing unit 108 in detail. In the block processing described below, processing is performed only on the processing area specified by the processing area specifying unit 107. First, the binarization process, here,
A method of performing binarization by the differential processing unit 501, the encoding processing unit 502, and the local maximum point detection processing unit 503 will be described. The differentiation processing section 501 differentiates the image stored in the image memory 106. This differentiation process uses the differentiation matrices shown in FIGS. 3A and 3C,
This is performed in each of the X direction and the Y direction. Specifically, in the image data in the image memory 106, if the processing area specified by the processing area specifying unit 107 is, for example, an area as shown in FIG.
For the direction, the matrix of FIG.
1,602,603,...
In this case, for code 601, the result is 5 × 1 + 3 ×
(−1) = 2, and the differential value of the pixel coordinate position (0, 0) is “2”. This operation is performed at the pixel coordinate positions (4, 0), (4, 1), (4, 2), (4, 3),
Performed for all pixels except (4, 4). Similarly, in the Y direction, the matrix shown in FIG. 3C is calculated using pixel coordinate positions (0, 4), (1, 4), (2, 4), (3, 4).
4) Except for (4, 4), as shown in FIG.
.., 605, 606,... The encoding processing unit 502 includes a differential processing unit 50
A process for taking the absolute value of the pixel value differentiated by 1 is performed. X
The differential values for the direction and the Y direction are respectively shown in FIG.
If it is assumed to be as shown in FIG. 4C, the same encoding process results in the states shown in FIGS. 4B and 4D, respectively. The maximum point detection processing unit 503 extracts the maximum point from the pixel values processed by the same encoding processing unit 502 and binarizes it. For example, if the result of the same encoding process is X direction, Y direction
Assuming that the directions are obtained as shown in FIGS. 5A and 5C, the method of extracting the local maximum point is, for example, a local maximum point having a pixel value “5” or more.
It is determined as shown in FIG. Here, the pixel detected as the maximum point is “1”, and the other pixels are “0”. Then, the logical sum (O) of the values in the X and Y directions is obtained.
By taking R), a result as shown in FIG. The isolated point removal processing section 504 removes the isolated points of the binarized image obtained by the local maximum point detection processing section 503. Specifically, when a matrix as shown in FIG. 6A appears in the image data, a process of replacing the center pixel with “0” is performed as shown in FIG. 6B. The labeling processing section 505 labels the image processed by the isolated point removal processing section 504. More specifically, focusing on the “1” pixel in the image after the isolated point removal illustrated in FIG. 7A, if the “1” pixel exists near 8, the pixel is labeled with the same label. Perform processing. FIG. 7B shows the result of performing the labeling process on the image of FIG. 7A. As shown, in this case, one label 1001 is created. The circumscribing rectangle processing unit 506 creates the smallest rectangle including the image labeled by the labeling processing unit 505. The circumscribed rectangle of the labeled image as shown in FIG. 8A is a rectangle 1101 as shown in FIG. 8B. At the end of the blocking processing section 108, the minute / excess label removing processing section 507 removes a circumscribed rectangle having a minute or excessive size from the circumscribed rectangles created by the circumscribed rectangle processing section 506. This size is given as a pixel value such as, for example, 8 × 8 (pixels) or less as the size of a minute circumscribed rectangle and 120 × 120 (pixels) or more as the size of an excessively large circumscribed rectangle. FIG. 9 shows an example of a processing area designating method in the processing area designating section 107. The designation method, the entire region excluding the entire image on the postal matter P, and specific region 1201 1
204 (FIG. 9a), relative area 1 from specific area 1201
202, 1203 (FIGS. 9b and 9c), and one of these is designated. FIG. 10 shows the configuration of the clustering processing section 109 in detail. Clustering processing unit 109
Then, the data blocked by the blocking processing unit 108 is integrated and clustered (hereinafter, the clustered cluster portion is also referred to as a row). In the present embodiment, the direction in which blocks are integrated is limited to two directions, the horizontal direction and the vertical direction, but the integration direction is not limited to the horizontal direction and the vertical direction. In the clustering processing described below, processing is performed only on the processing area specified by the processing area specifying unit 107. The horizontal integration processing unit 1301 is configured as shown in FIG.
The image data divided into blocks as shown in FIG. 11A is integrated (clustered) in the horizontal direction as shown in FIG. An example of the integration method in the horizontal direction will be described with reference to the integration of the blocks 1401 and 1402 in FIG.
FIG. 11C shows a block 140 in FIG.
1, 1402 is extracted, but block 1401 is shown.
From the viewpoint of integrating the block 1402,
Specify as 04. If at least one block 1402 is included in this area, blocks 1401 and 1402
And integrate. However, here, as shown in FIG. 11D, when the block 1405 protrudes from the upper end of the integration range 1404 of the block 1401, it is determined that no integration is performed. The threshold of the integrated range in FIG. 11C is given as, for example, a = 6 (pixels), b = 35 (pixels), c = 6 (pixels), and d = 35 (pixels). By the above processing, the block data shown in FIG. 11A is integrated into three clusters (rows) 1403 as shown in FIG. 11B. In addition, the vertical direction integration processing unit 1302 integrates the blocked data as shown in FIG. 12A in the vertical direction by the same method as described above. By such a vertical integration process, in this example, integration into clusters of five rows is performed as shown in FIG. FIG. 13 shows the configuration of the cluster number counting / comparing section 110 in detail. In the cluster number counting / comparing section 110, first, the horizontal row counter 1601 and the vertical counter 1602 count the number of rows (the number of clusters) in each integration direction. In the examples of FIGS. 11 and 12, the number of integrated rows in the horizontal direction is “3”, and the number of integrated rows in the vertical direction is “5”. Next, the line number comparison unit 1603 outputs the direction having the smallest number of lines among the integration directions as the writing direction of the character line. In this example, the horizontal direction is output as the writing direction of the character line. This output result is the writing direction of the address character line on the mail P. As described above, according to the above-described embodiment, since the determination of the writing direction of the address character line on the postal matter is determined on the basis of the characteristic described in the address character line, the conventional post-pay charge method is used. It is possible to determine the writing direction of the address character line regardless of the direction of the line inside the round frame of the mark or the separate mark or the typeface of the character, and even if they do not exist on the mail. Since the writing direction is determined based on the characteristics of the entire address character line instead of analyzing each character, the writing direction of the address character line can be determined regardless of the determination result of each character. It is. Further, since the writing direction of the address character line of the postal matter can be determined, the recognition direction can be specified at the time of character recognition, and it is not necessary to perform character recognition assuming another writing direction. In the above-described embodiment, a case has been described in which the address reading device for a postal matter determines the writing direction of the address character line that constitutes the address information described on the postal matter. The present invention is not limited to this. For example, the present invention can be similarly applied to a case where the direction of a character line is determined in a character reading device or the like that reads characters described in other forms or securities. As described above in detail, according to the present invention, a character line direction discrimination that can accurately discriminate the direction of a character line on a read object without being restricted by the conventional one. Equipment can be provided.

【図面の簡単な説明】 【図1】本発明に係る文字行方向判別装置が適用される
郵便物の宛名読取装置の構成を示すブロック図。 【図2】ブロック化処理部の構成を詳細に示すブロック
図。 【図3】微分処理部の微分処理を説明するための図。 【図4】同符号化処理部の同符号化処理を説明するため
の図。 【図5】極大点検出処理部の極大点検出処理を説明する
ための図。 【図6】孤立点除去処理部の孤立点除去処理を説明する
ための図。 【図7】ラベリング処理部のラベリング処理を説明する
ための図。 【図8】外接矩形化処理部の外接矩形化処理を説明する
ための図。 【図9】処理領域指定部における処理領域指定方法例を
説明するための図。 【図10】クラスタ化化処理部の構成を詳細に示すブロ
ック図。 【図11】横方向統合処理部の横方向統合処理を説明す
るための図。 【図12】縦方向統合処理部の縦方向統合処理を説明す
るための図。 【図13】クラスタ数カウント・比較部の構成を詳細に
示すブロック図。 【符号の説明】 P……郵便物(読取物)、101……光源、102……
光学系、103……ラインセンサ、104……画像入力
部(画像入力手段)、105……A/D変換部、106
……画像メモリ、107……処理領域指定部、108…
…ブロック化処理部、109……クラスタ化処理部、1
10……クラスタ数カウント・比較部、111……文字
認識部、501……微分処理部、502……同符号化処
理部、503……極大点検出処理部、504……孤立点
除去処理部、505……ラベリング処理部、506……
外接矩形化処理部、507……微小・過大ラベル除去処
理部、1301……横方向統合処理部、1302……縦
方向統合処理部、1601………横方向行数カウンタ
部、1602……縦方向カウンタ部、1603……行数
比較部。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing a configuration of a mail address reading device to which a character line direction discriminating device according to the present invention is applied. FIG. 2 is a block diagram showing a configuration of a blocking processing unit in detail. FIG. 3 is a diagram for explaining a differentiation process of a differentiation processing unit. FIG. 4 is a view for explaining the same encoding processing of the same encoding processing unit. FIG. 5 is a diagram illustrating a local maximum point detection process performed by a local maximum point detection processing unit; FIG. 6 is a view for explaining an isolated point removal process of an isolated point removal processing unit. FIG. 7 is a diagram illustrating a labeling process performed by a labeling processing unit. FIG. 8 is a diagram for explaining a circumscribed rectangle process performed by a circumscribed rectangle process unit; FIG. 9 is a view for explaining an example of a processing area designation method in a processing area designation unit. FIG. 10 is a block diagram showing the configuration of a clustering processing unit in detail. FIG. 11 is a view for explaining horizontal integration processing of a horizontal integration processing unit. FIG. 12 is a view for explaining vertical integration processing of a vertical integration processing unit. FIG. 13 is a block diagram showing the configuration of a cluster number counting / comparing unit in detail. [Description of Signs] P: Mail (reading material), 101: Light source, 102:
Optical system, 103: line sensor, 104: image input unit (image input means), 105: A / D conversion unit, 106
...... image memory 107 processing area designation unit 108
... Blocking processing unit, 109 ... Clustering processing unit, 1
10 cluster count / comparison unit 111 character recognition unit 501 differentiation processing unit 502 encoding processing unit 503 local maximum point detection processing unit 504 isolated point removal processing unit , 505 ... Labeling processing unit, 506 ...
Circumscribing rectangle processing section, 507 minute / excess label removal processing section, 1301 horizontal integration processing section, 1302 vertical integration processing section, 1601 horizontal row counter section, 1602 vertical Direction counter section, 1603... Row number comparing section.

Claims (1)

(57)【特許請求の範囲】 【請求項1】 横方向あるいは縦方向に記載された文字
行が存在する読取物上の前記文字行を含む画像を入力す
る画像入力手段と、 この画像入力手段により入力された画像に対し微分マト
リクスを用いて横方向および縦方向にそれぞれ微分する
微分手段と、 この微分手段により横方向および縦方向に微分された各
画素値の絶対値を取る処理を行なうことにより当該画素
値の符号を一致させる同符号化手段と、 この同符号化手段により符号を一致させた横方向および
縦方向の各画素値からそれぞれ極大点を検出する極大点
検出手段と、 この極大点検出手段により検出された横方向および縦方
向の極大点の論理和をとることにより2値化する2値化
手段と、 この2値化手段により2値化された画像に対し各画素ご
とに当該画素がその周囲の画素と孤立した値を示すとき
その画素を特定の値に置き換えることにより孤立点を除
去する孤立点除去手段と、 この孤立点除去手段により孤立点を除去した画像の有効
画素に注目してその近傍に有効画素が存在すればその画
素を同一のラベルにする処理を行なうことによりラベリ
ングするラベリング手段と、 このラベリング手段によりラベリングされた画像に対し
当該画像を含む最も小さな外接矩形を作成することによ
り外接矩形化する外接矩形化手段と、 この外接矩形化手段により外接矩形化された画像のうち
微小あるいは過大な大きさの外接矩形を除去する微小・
過大外接矩形除去手段と、 この微小・過大外接矩形除去手段による処理の結果、残
った外接矩形化された画像を横方向および縦方向にそれ
ぞれクラスタ化することにより 統合する統合手段と、 この統合手段により統合された各方向の統合数をそれぞ
れ計数する計数手段と、 この計数手段により計数された各統合数に基づき前記読
取物上の文字行の方向を判別する判別手段と、 を具備したことを特徴とする文字行方向判別装置。
(57) [Claims] 1. An image input means for inputting an image including a character line on a reading material in which a character line described in a horizontal direction or a vertical direction exists, and the image input means differential Mato on the input image by
Differentiate horizontally and vertically using Rix
Differentiating means and each of the differentiated in the horizontal and vertical directions by the differentiating means
By performing the process of taking the absolute value of the pixel value,
Same encoding means for matching the sign of the value, and
A local maximum point that detects the local maximum point from each pixel value in the vertical direction
Detecting means, and the horizontal and vertical directions detected by the maximum point detecting means.
Binarization by taking the logical sum of the local maximum points
Means for each pixel with respect to the image binarized by the binarizing means.
When the pixel shows a value isolated from the surrounding pixels
The isolated point is removed by replacing that pixel with a specific value.
Means for removing isolated points, and the effectiveness of the image from which isolated points have been removed by the isolated point removing means.
Focusing on the pixel, if there is an effective pixel in the vicinity, the image
By performing the processing to make the elements the same label,
And labeling means for bridging, to the labeled image by the labeling unit
By creating the smallest circumscribed rectangle containing the image
Circumscribing rectangle means for making a circumscribing rectangle, and an image circumscribed by the circumscribing rectangle means.
A small or excessively small circumscribed rectangle is removed.
Excessive circumscribed rectangle removing means and the result of processing by the minute / excessive circumscribed rectangle removing means
The circumscribed rectangularized image horizontally and vertically
And integrating means for integrating by clustering, respectively, counting means for counting each integrated each direction integration number This integration means, said reading Butsujo based on each integrated number counted by the counting means A character line direction determination device, comprising: a determination unit configured to determine a direction of a character line.
JP31649494A 1994-12-20 1994-12-20 Character line direction determination device Expired - Fee Related JP3476936B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31649494A JP3476936B2 (en) 1994-12-20 1994-12-20 Character line direction determination device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31649494A JP3476936B2 (en) 1994-12-20 1994-12-20 Character line direction determination device

Publications (2)

Publication Number Publication Date
JPH08171607A JPH08171607A (en) 1996-07-02
JP3476936B2 true JP3476936B2 (en) 2003-12-10

Family

ID=18077730

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31649494A Expired - Fee Related JP3476936B2 (en) 1994-12-20 1994-12-20 Character line direction determination device

Country Status (1)

Country Link
JP (1) JP3476936B2 (en)

Also Published As

Publication number Publication date
JPH08171607A (en) 1996-07-02

Similar Documents

Publication Publication Date Title
JP2575539B2 (en) How to locate and identify money fields on documents
US4516265A (en) Optical character reader
JP3124296B2 (en) How to detect the position and direction of the fiducial mark
US4998626A (en) Mail processing machine
US8306325B2 (en) Text character identification system and method thereof
Aradhye A generic method for determining up/down orientation of text in roman and non-roman scripts
US5805740A (en) Bar-code field detecting apparatus performing differential process and bar-code reading apparatus
US6014450A (en) Method and apparatus for address block location
US5617481A (en) Address reading apparatus and address printing apparatus using mail address position mark
JP3018949B2 (en) Character reading apparatus and method
JPH07265807A (en) Address region detector
US4596038A (en) Method and apparatus for character recognition
JP3476936B2 (en) Character line direction determination device
JP3268552B2 (en) Area extraction method, destination area extraction method, destination area extraction apparatus, and image processing apparatus
EP0076332B1 (en) Optical character reader with pre-scanner
JP3015448B2 (en) Address area detection device
JP2714012B2 (en) Address area detection device
JPH0793466A (en) Device for discriminating character kind and method therefor
JPH08305794A (en) Address line extracting device
JPS6227887A (en) Character type separating system
JP2714003B2 (en) Address area detection device
JP2573665B2 (en) Optical character reader
JP2616995B2 (en) Character recognition device
JP2963807B2 (en) Postal code frame detector
JPS6394384A (en) System for deciding direction of character row

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070926

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080926

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080926

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090926

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090926

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100926

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130926

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees