JPH0228897A - Address area detector - Google Patents

Address area detector

Info

Publication number
JPH0228897A
JPH0228897A JP63179678A JP17967888A JPH0228897A JP H0228897 A JPH0228897 A JP H0228897A JP 63179678 A JP63179678 A JP 63179678A JP 17967888 A JP17967888 A JP 17967888A JP H0228897 A JPH0228897 A JP H0228897A
Authority
JP
Japan
Prior art keywords
area
information
image
address
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63179678A
Other languages
Japanese (ja)
Other versions
JP2714012B2 (en
Inventor
Nobuaki Takagi
宣明 高木
Yoshikatsu Nakamura
中村 好勝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63179678A priority Critical patent/JP2714012B2/en
Publication of JPH0228897A publication Critical patent/JPH0228897A/en
Application granted granted Critical
Publication of JP2714012B2 publication Critical patent/JP2714012B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To detect an address-mentioned area efficiently and correctly by deleting a noise area from the feature information of the binary picture of a unit block area and after that, detecting the address-mentioned area from the projective feature of input picture information in the left area. CONSTITUTION:The image of a mail article 1 is picked up by a picture input part 2 and its output is inputted to a feature preparing part 3 and a noise area deciding part 4. The feature preparing part 3 converts this input picture into a block binary picture with the prescribed unit block area as a basis, obtains the feature information of the block binary picture in which information quantity is compressed and obtains the projective feature of the input picture information. An address area deciding part 5 deletes the noise area decided from the feature information of the block binary picture by a noise area deciding part 4 and after that, detects the address-mentioned area from the projective feature of the input picture information in the left area.

Description

【発明の詳細な説明】 [発明の目的コ (産業上の利用分野) 本発明は種々の書式で記載される書状郵便物における宛
名記載領域を高速に、且つ効率的に検出して宛名読取り
に供することのできる宛名領域検出装置に関する。
[Detailed Description of the Invention] [Purpose of the Invention (Industrial Application Field) The present invention provides a method for quickly and efficiently detecting address writing areas in letters and mail written in various formats and reading addresses. The present invention relates to an address area detection device that can be provided.

(従来の技術) 光学的文字読取装置(OCR)による文字読取に供され
る帳票のフォーマット(書式)は一般的に定められてお
り、文字読取装置は帳票の所定の領域に記載された文字
情報だけを読取対象とするように構成されている。これ
故、従来では専ら所定の書式に従い、文字記入領域を枠
組等により指定した帳票を準備するようにしている。
(Prior Art) The format of a form that is subjected to character reading by an optical character reader (OCR) is generally determined, and the character reading device reads character information written in a predetermined area of a form. It is configured to read only the following. For this reason, in the past, forms have been prepared exclusively in accordance with a predetermined format, with character entry areas designated by a frame or the like.

また種々の書式の帳票を読取り対象とする文字読取装置
にあっては、所定の位置にその書式を特定するID番号
やIDコード等をプレプリントした帳票を準備し、文字
読取装置ではこのID情報を読取ることによりその書式
を知り、読取対象とする領域の設定を行なうものとなっ
ている。例えばID情報に対応して予め設定されている
基準位置からの座標値データ等として読取り対象領域を
知り、その領域設定を行なうものとなっている。
In addition, for character reading devices that read documents in various formats, a document is prepared with preprinted ID numbers, ID codes, etc. that specify the format in a predetermined position, and the character reading device reads this ID information. By reading the file, the format is known and the area to be read is set. For example, the area to be read is known as coordinate value data from a reference position previously set in accordance with ID information, and the area is set.

ところが、例えば書状郵便物の宛名情報を読取対象とす
る文字読取装置にあっては、書状郵便物での宛名の記載
の形式(書式)自体が定まっていないので、予めその読
取対象領域を検出することが必要となる。しかも書状郵
便物の宛名情報が記載される面上の通信文や広告文、差
出人住所氏名切手、消印、郵便番号等をそれぞれ認識し
、これらの情報を除去した上で宛名記載領域を検出する
ことが必要となる。しかし上述した各種の情報をそれぞ
れ認識し、これらの記載情報と区別して宛名記載領域を
検出するには多大な処理負担が伴い、その処理効率が非
常に悪いと云う問題がある。
However, for example, in the case of a character reading device that reads the address information of letters and mails, since the format (format) in which the addresses are written in letters and letters itself is not determined, it is necessary to detect the area to be read in advance. This is necessary. Moreover, it recognizes the correspondence, advertisement, sender's address, name and stamp, postmark, postal code, etc. on the surface where address information is written on letters and mail, and detects the address writing area after removing these information. Is required. However, there is a problem in that recognizing each of the above-mentioned types of information and detecting the address writing area while distinguishing it from the written information requires a large processing load, and the processing efficiency is extremely low.

特にこの種の書状郵便物の宛名情報の読取り入力に対し
ては、例えば1秒当り10通程度の処理能力が要求され
、如何にして高速に書状郵便物の宛名記載領域を高精度
に検出し、その宛名情報を読取り入力するかが大きな課
題となる。
In particular, reading and inputting address information on this type of letter/mail requires a processing capacity of, for example, about 10 pieces per second, so how can the address writing area of letters/postal items be detected quickly and with high precision? , the major issue is how to read and input the address information.

そこで本発明者等は先に書状郵便物の入力画像を所定の
ブロック領域に区分し、各ブロック領域をその黒画素出
現頻度に従って2値化してブロック2値画像を求め、こ
のブロック2値画像の射影情報と書状郵便物に関する知
識とがら、第11図に示すような書状郵便物上部の料額
印面・郵便番号記載領域と、書状郵便物下部の差出人・
広告文記載領域とをそれぞれ検出し、これらの領域を除
く入力画像領域から宛名記載領域を検出する手法を提唱
した。このような手法によれば、書状郵便物の記載情報
を大局的な検知がら識別検出することができるので、そ
の処理速度(宛名記載領域の検出処理)の大幅な高速化
を図り得ると云う効果が奏せられる。
Therefore, the present inventors first divided the input image of letters and mail into predetermined block areas, binarized each block area according to its black pixel appearance frequency to obtain a block binary image, and obtained the block binary image. In addition to the projection information and the knowledge about letters and mail items, we have learned the amount stamp and postal code area at the top of the letter and the sender and postal code at the bottom of the letter, as shown in Figure 11.
We proposed a method that detects the advertisement text area and the addressee area from the input image area excluding these areas. According to such a method, it is possible to identify and detect the information written on letters and mail items while detecting the information in a global manner, so the processing speed (detection processing of the address writing area) can be significantly increased. is played.

ところが書状郵便物の中には第12図に例示するように
宛名情報が縦方向に横書きされ、その右側に広告文が記
載されることも多々ある。このような場合、上述したブ
ロック2値画像の射影成分と、差出人・広告文記載領域
が書状郵便物の下部領域に記載されることが多いと云う
知識情報とから、その広告文記載領域を確実に検出する
ことが困難であり、この結果、宛名記載領域を精度良く
検出することができない等の不具合があった。
However, as shown in FIG. 12, in letters and mail, address information is often written vertically and horizontally, and advertisements are often written on the right side of the address information. In such a case, based on the projection component of the block binary image mentioned above and the knowledge that the sender/advertisement writing area is often written in the lower area of letters and mail, it is possible to accurately determine the advertising writing area. As a result, there have been problems such as the inability to accurately detect the address writing area.

(発明が解決しようとする課題) このように従来の文字読取装置にあっては、書式を特定
するID情報等を参照することなしに、その書式の定ま
っていない書状郵便物における宛名情報を読取り対象と
することが困難であり、書状郵便物中の宛名記載領域を
他の情報と区別して検出してその読取対象領域を特定す
るには多大な処理負担を伴うと云う問題があった。しか
もその処理を高速に実行するかと云う点で問題があった
(Problem to be Solved by the Invention) As described above, conventional character reading devices are capable of reading address information on letters and postal items whose format is not determined without referring to ID information that specifies the format. There is a problem in that it is difficult to target the area to be read, and it requires a large processing load to detect the address writing area in letters and mail separately from other information and specify the area to be read. Moreover, there was a problem in executing the processing at high speed.

本発明はこのような事情を考慮してさなれたちので、そ
の目的とするところは、書式が定められていない書状郵
便物における宛名記載領域をその書式を特定するID情
報等を用いることなしに簡易に、且つ高速に、しかも精
度良く検出してその宛名情報の読取り入力に供すること
のできる宛名領域検出装置を提供することにある。
The present invention has been developed with these circumstances in mind, and its purpose is to fill the address writing area of letters and postal items with no specified format without using ID information or the like to specify the format. It is an object of the present invention to provide an address area detecting device which can detect address area simply, quickly, and with high precision and can read and input address information.

[発明の構成] (課題を解決するための手段) 本発明に係る宛名領域検出装置は、先ず書状郵便物の宛
名情報が記載されている面の情報を画像入力してなる入
力画像を所定の単位ブロック領域に分割し、各単位ブロ
ック領域における画像の特徴情報を、例えば2値化され
た入力画像の単位ブロック領域における画像の射影と黒
画素出現頻度としてれぞれ求める。そして各単位ブロッ
ク領域毎に求められた画像の黒画素の出現頻度に従って
各単位ブロック領域を1単位としてそれぞれ2値化表現
し、前記入力画像をブロック2値画像化してそのブロッ
ク2値画像の射影特徴を求める。
[Structure of the Invention] (Means for Solving the Problems) The address area detection device according to the present invention first inputs information on the side of a letter/postal item on which address information is written, and then inputs an input image into a predetermined image. The image is divided into unit block areas, and characteristic information of the image in each unit block area is obtained, for example, as the projection of the image in the unit block area of the binarized input image and the frequency of appearance of black pixels. Then, each unit block area is treated as one unit and binarized and expressed according to the appearance frequency of black pixels in the image determined for each unit block area, the input image is converted into a block binary image, and the block binary image is projected. Look for characteristics.

しかる後、このブロック2値画像の射影特徴と前記書状
郵便物に関する知識情報とに基づいて前記入力画像中の
宛名記載領域以外の文字記載領域を検出し、これらの検
出領域を前記入力画像領域がら削除したのち、入力画像
の残された領域での前記射影特徴から前記入力画像にお
ける宛名記載領域を検出するようにしたことを特徴とす
るものである。
Thereafter, character writing areas other than the address writing area in the input image are detected based on the projection characteristics of this block binary image and the knowledge information regarding the letter/postal item, and these detected areas are extracted from the input image area. After deletion, the address writing area in the input image is detected from the projection feature in the remaining area of the input image.

(作用) 本発明によれば、書状郵便物を撮像入力した画像を所定
の単位ブロック領域に区分し、各単位ブロック領域をそ
れぞれ1単位として2値化してなるブロック2値画像と
して大局的に捕え、このブロック2値画像の任意の矩形
領域における射影特徴を求める。そしてブロック2値画
像の任意の矩形領域における射影特徴と書状郵便物にお
ける知識とに従って検出対象とする領域以外の料額印面
・郵便番号欄部や広告・通信文部をそれぞれ検出し、こ
れらの検出領域を入力画像中から除去する。そして残さ
れた領域の射影情報を前記単位ブロック領域毎に求めら
れた射影情報を加算することにより求め、この射影情報
に従って宛名記載領域を検出するものとなっている。
(Function) According to the present invention, an image obtained by capturing and inputting a letter and postal item is divided into predetermined unit block areas, and each unit block area is treated as one unit and binarized into a block binary image. , find the projection features in an arbitrary rectangular area of this block binary image. Then, according to the projection characteristics in an arbitrary rectangular area of the block binary image and the knowledge of letters and mail items, the postal stamp face, postal code section, and advertisement/correspondence areas other than the areas to be detected are detected, and these detection areas are is removed from the input image. Then, the projection information of the remaining area is obtained by adding the projection information obtained for each unit block area, and the address writing area is detected according to this projection information.

従って各単位ブロック領域が情報の記載領域として重要
な役割を果たしているか否かを示すだけのブロック2値
画像の任意の矩形領域の射影情報から書状郵便物の各種
情報記載領域を大局的に効率良く識別し、書状郵便物に
関する知識情報に従って上記情報記載領域の種別を効果
的に判定することが可能となる。その上で、検出目的と
する宛名記載領域以外の情報記載領域を除去し、残され
た領域中における入力画像の射影情報がら宛名記載領域
を検出するので、書式が定められることのない書状郵便
物中の読取り入力の対象とする宛名記載領域を簡易に、
しかも高速に検出することが可能となる。
Therefore, from the projection information of an arbitrary rectangular area of a block binary image that only indicates whether or not each unit block area plays an important role as an information writing area, various information writing areas of letters and mail can be efficiently calculated from a global perspective. This makes it possible to effectively determine the type of the information writing area according to the knowledge information regarding letters and mail. Then, the information writing area other than the address writing area targeted for detection is removed, and the address writing area is detected from the projection information of the input image in the remaining area, so the format is not determined for letters and mail. You can easily specify the address writing area for reading input inside.
Moreover, it becomes possible to detect at high speed.

(実施例) 以下、図面を参照して本発明の一実施例につき説明する
(Example) Hereinafter, an example of the present invention will be described with reference to the drawings.

第1図は実施例装置の概略構成図であり、■はこの装置
における文字読取り対象となる書状郵便物である。イメ
ージスキャナやTV左カメラらなる画像入力部2は前記
書状郵便物lの宛先情報等が記載された面の情報を画像
入力するものであり、例えばその撮像入力画像を所定の
閾値で2値化し、2値ディジタル画像として画像メモリ
に格納して以下に示す文字読取り処理(宛先領域検出処
理)に供している。
FIG. 1 is a schematic diagram of an embodiment of the apparatus, and ``■'' indicates letters and mails to be read by this apparatus. The image input unit 2, which is an image scanner or a TV left camera, inputs information on the side of the letter/postal item L on which address information, etc. is written, and for example, binarizes the captured input image using a predetermined threshold value. , and is stored in an image memory as a binary digital image and subjected to character reading processing (destination area detection processing) described below.

特徴作成部3は画像分割部3a、射影特徴作成部3b、
黒画素頻度特徴作成部3c、 ブロック2値画像作成部
3d、ブロック射影特徴作成部30等からなり、上記入
力画像(2値ディジタル画像)を所定の単位ブロック領
域に分割し、その全体的な画像の特徴情報を検出・作成
する如く構成されている。
The feature creation unit 3 includes an image division unit 3a, a projection feature creation unit 3b,
It consists of a black pixel frequency feature creation section 3c, a block binary image creation section 3d, a block projection feature creation section 30, etc., and divides the input image (binary digital image) into predetermined unit block areas and creates the entire image. It is configured to detect and create characteristic information of.

即ち、この特徴作成部3における画像分割部3aは上記
入力画像(2値ディジタル画像)を所定の大きさの単位
ブロック領域に分割している。この画像分割部3aによ
り前記入力画像は、例えば(tex 1B)の単位ブロ
ック領域に分割される。射影特徴作成部3bはこのよう
にして画像分割部3aにて分割された各単位ブロック領
域における黒画素の射影成分を縦方向および横方向にそ
れぞれ求め、これを各単位ブロック領域での射影特徴と
している。
That is, the image dividing section 3a in the feature creating section 3 divides the input image (binary digital image) into unit block areas of a predetermined size. The input image is divided into unit block areas of (tex 1B), for example, by the image dividing section 3a. The projection feature creation section 3b thus obtains the projection components of the black pixels in each unit block area divided by the image division section 3a in the vertical and horizontal directions, and uses these as projection features in each unit block area. There is.

一方、黒画素頻度特徴作成部3cは上記単位ブロック領
域毎にそのブロック領域内における黒画素の出現頻度を
計測し、その計測値を単位ブロック領域の特徴情報とし
て求めている。この各単位ブロック領域での黒画素頻度
はブロック2値画像作成部3dにてそれぞれ所定の閾値
と比較され、その単位ブロック領域が全体的に黒画素成
分で表わされるか、或いは白画素成分で表わされるかの
判定に供される。このブロック2値画像作成部3dによ
り前記各単位ブロック領域をそれぞれ1単位として2値
表現してなるブロック2値画像が求められる。ブロック
射影特徴作成部3eは上述した如く求められたブロック
2値画像のX方向、およびY方向での射影を求め、これ
を前記入力画像の大局的な特徴情報としている。
On the other hand, the black pixel frequency feature creation section 3c measures the frequency of appearance of black pixels within the block region for each unit block region, and obtains the measured value as feature information of the unit block region. The black pixel frequency in each unit block area is compared with a predetermined threshold value in the block binary image creation section 3d, and it is determined whether the unit block area is represented entirely by black pixel components or by white pixel components. This will be used to determine whether the This block binary image creation section 3d obtains a block binary image in which each unit block area is expressed in binary terms as one unit. The block projection feature creation unit 3e obtains the projection of the block binary image obtained as described above in the X direction and the Y direction, and uses this as global feature information of the input image.

つまりこの特徴作成部3では、所定の単位ブロック領域
に分割された入力画像の各単位ブロックを、そのブロッ
ク領域での黒画素の出現頻度に応じて“1″または“O
″でそれぞれ表現したブロック2値画像を求め、且つそ
のブロック2値画像の水平方向(X方向)および垂直方
向(Y方向)での射影成分をそれぞれ求めている。また
同時に各単位ブロック領域における入力画像の射影成分
をそれぞれ求めるものとなっている。尚、この各単位ブ
ロック領域での射影成分は、後述する領域判定処理に用
いられる。
In other words, the feature creation unit 3 divides each unit block of the input image divided into predetermined unit block regions into "1" or "O" depending on the frequency of appearance of black pixels in that block region.
'', and the projected components of the block binary image in the horizontal direction (X direction) and vertical direction (Y direction) are obtained.At the same time, the input in each unit block area is obtained. The projected components of the image are determined respectively.The projected components of each unit block area are used in the area determination process described later.

しかして雑音領域判定部4は、上記特徴作成部3で求め
られた特徴情報、特に前記ブロック2値画像の任意の矩
形領域における射影情報と、書状郵便物1に関して予め
求められている知識情報とに従って、検出対象とする宛
名記載領域以外の文字記載領域を検出し、この検出領域
を雑音領域として入力画像中から除去するものである。
Therefore, the noise area determination section 4 uses the feature information obtained by the feature creation section 3, especially the projection information in an arbitrary rectangular area of the block binary image, and the knowledge information obtained in advance regarding the letter and postal item 1. Accordingly, a character writing area other than the addressee writing area to be detected is detected, and this detected area is removed from the input image as a noise area.

尚、書状郵便物1に関する知識情報は、例えば書状郵便
物1における郵便番号記載欄は、通常その郵便物の右上
方位置に設定されているとか、切手が貼付される料額印
面の領域はその郵便物の左上隅部であるとか、郵便物の
下部領域には通信文や広告文が記載されることがある等
の情報からなる。
Knowledge information regarding the letter postal item 1 includes, for example, that the postal code column in the letter postal item 1 is normally set at the upper right position of the mail piece, and that the area on the stamp face where the stamp is attached is located at the top right of the postal item. It consists of information such as the upper left corner of the mail piece, and the lower area of the mail piece where correspondence or advertisements may be written.

宛名記載領域判定部5は、上述した如く雑音領域が除去
された入力画像中の残された領域について、前記特徴抽
出部3にて求められた特徴情報、特に各単位ブロック領
域での射影情報に従い、そこでの射影情報を高速に求め
ている。そしてその射影、情報から文字記載領域での行
間ピッチや文字ピッチ等を求め、これらの情報に従って
入力画像中の宛名記載領域6を検出している。
The address writing area determination unit 5 determines the remaining area in the input image from which the noise area has been removed as described above, according to the feature information obtained by the feature extraction unit 3, especially the projection information in each unit block area. , the projection information there is obtained at high speed. Then, the line pitch, character pitch, etc. in the character writing area are determined from the projection and information, and the addressee writing area 6 in the input image is detected according to this information.

第2図は本装置における書状郵便物1の宛名領域検出処
理手続きの概略的な流れを示す図である。
FIG. 2 is a diagram showing a schematic flow of the procedure for detecting the address area of the letter/postal item 1 in this apparatus.

この処理は、例えば1秒間に10通程度の速度で連続的
に搬送されてくる書状郵便物1の像を画像入力部2にて
連続的に読取り入力することから行なわれる(ステップ
a)。このようにして読取り入力された入力画像につい
て特徴作成部3にて、その領域分割と分割された単位ブ
ロック領域での射影特徴の算出と、黒画素の出現頻度の
計測が行なわれる(ステラ、プb)。そして上記黒画素
頻度の情報に従って上述したブロック2値画像の作成が
行なわれ、そのブロック2値画像の射影情報の算出が行
なわれる(ステップC)。
This process is performed by continuously reading and inputting images of letters and mail items 1, which are continuously conveyed at a speed of, for example, about 10 per second, using the image input section 2 (step a). The feature creation unit 3 divides the input image read and input in this way, calculates the projection feature in the divided unit block areas, and measures the frequency of appearance of black pixels (Stella, Print, etc.). b). Then, the above-described block binary image is created according to the black pixel frequency information, and projection information of the block binary image is calculated (step C).

しかる後、書状郵便物1に関する知識情報を用]2 い、雑音領域判定部4による広告文記載領域等の判定と
、・その検出領域の入力画像領域中からの削除が行なわ
れる(ステップd)。この処理はブロック2値画像の任
意の矩形領域での射影成分を求め、これによって検出さ
れる文字記載領域としての矩形領域が入力画像中のどこ
に位置するか、またその大きさがどの程度であるか等を
調べ、前述した知1識情報と照し合せることによってな
される。
After that, using the knowledge information regarding the letter/postal item 1]2, the noise area determining unit 4 determines the advertisement writing area, etc., and the detected area is deleted from the input image area (step d). . This process calculates the projected component in an arbitrary rectangular area of the block binary image, and determines where in the input image the rectangular area detected as the character writing area is located and its size. This is done by checking the above information and comparing it with the above-mentioned knowledge information.

この・検出処理によって入力画像の上部に位置する料額
印面・郵便番号欄判定部が雑音領域として除去され、ま
た入力画像の下部に位置する広告文・通信文・差出人名
判定部が雑音領域として除去される。この雑音領域検出
とその検出領域の入力画像からの除去処理は、段階的に
順を追って行なうようにしても良いが、並列的に行なう
ようにすることも可゛能である。
Through this detection process, the charge stamp face/postal code field determination section located at the top of the input image is removed as a noise area, and the advertisement/correspondence/sender name determination section located at the bottom of the input image is removed as a noise area. removed. The detection of the noise region and the removal of the detected region from the input image may be performed step by step, or may be performed in parallel.

しかして宛名領域判定部5は、・上述した如く雑音領域
(検出対象外の文字記載領域)をそれぞれ除去してなる
入力画像の残された領域において、前記単位ブロック領
域毎に求められている射影酸分を縦方向および横方向に
それぞれ加算し、その残された領域における入力画像の
射影成分をそれぞれ求めている(ステップe)。そして
これらの射影情報から文字記載領域としての行間ピッチ
情報等を求め、前述した書状郵便物1の関する知識情報
に従って、入力画像中の中央部に記載される文字記載領
域だけを宛名記載領域として検出するものとなっている
(ステップf)。
Therefore, the address area determination unit 5 calculates the projections determined for each unit block area in the remaining areas of the input image obtained by removing the noise areas (character writing areas not subject to detection) as described above. The acid content is added vertically and horizontally, and the projected components of the input image in the remaining regions are determined (step e). Then, from this projection information, the line spacing information etc. for the character writing area are obtained, and according to the knowledge information regarding the letter/postal item 1 mentioned above, only the character writing area written in the center part of the input image is detected as the address writing area. (step f).

つまり前述したブロック2値画像の射影特徴に従い、単
位ブロワ・り領域が情報の記載領域であるか否か、また
データ“1”の単位ブロック領域の塊りがどのようにな
゛っているかと云う大局的な観点から宛名記載領域以外
の領域を除去したのち、残された領域゛における射影情
報を単位プロ・し”り□領域毎に求められでいる射影情
報から高速”に求め、この射影情報から検出目的とす□
る宛名゛記載領域を簡易に、効率良く検出するものとな
っている。
In other words, according to the projection characteristics of the block binary image mentioned above, it is possible to determine whether the unit blower area is an information writing area or not, and how the unit block areas of data "1" are clustered. After removing the area other than the address writing area from a global perspective, the projection information in the remaining area is calculated in a unit process. Detection purpose from information□
The address writing area can be detected easily and efficiently.

次に上述した宛名記載領域の検出処理について具体的に
説明すると、処理対象とする書状郵便物lの宛名記載面
の情報(入力画像)が、例えば第3図に示すように与え
られ、画像入力部2により2値ディジタル画像として撮
像入力されるものとする。
Next, to specifically explain the above-mentioned address writing area detection processing, the information (input image) of the address writing surface of a letter/postal item l to be processed is given as shown in FIG. 3, for example, and the image input It is assumed that the unit 2 captures and inputs the image as a binary digital image.

このような入力画像に対して特徴作成部3における画像
分割部3aは、第4図に示す如き入力画像を縦・横に区
分して所定の単位ブロック領域に分割する。この分割は
、例えば横(水平)方向400画素、縦(垂直)方向8
00画素の入力画像を縦横にそれぞれ16分割する等し
て行なわれる。この分割により、(25X50)画素領
域を単位ブロック領域とする(L6X1B)の単位ブロ
ックが設定される。
For such an input image, the image division section 3a in the feature creation section 3 vertically and horizontally divides the input image into predetermined unit block areas as shown in FIG. This division is, for example, 400 pixels in the horizontal (horizontal) direction and 8 pixels in the vertical (vertical) direction.
This is done by dividing an input image of 00 pixels into 16 pieces each in the vertical and horizontal directions. By this division, a (L6×1B) unit block is set having a (25×50) pixel area as a unit block area.

しかして黒画素頻度特徴作成部3cは、これらの各単位
ブロック領域における黒画素の出現頻度をそれぞれ計測
し、その計測結果を第5図に示すように求める。ブロッ
ク2値画像作成部3dは、第5図に示す各単位ブロック
領域の黒画素出現頻度を、例えば[50]なる閾値で弁
別して、その単位ブロック領域か大局的に見て情報の記
載領域であるか否かを示す“1“0”の情報にそれぞれ
2値化している。この結果、第6図に示すようなブロワ
り2値画像が作成され、入力画像は(L’6XIB)画
素のデータとして表現される。
The black pixel frequency feature creation unit 3c measures the frequency of appearance of black pixels in each of these unit block areas, and obtains the measurement results as shown in FIG. The block binary image creation unit 3d discriminates the appearance frequency of black pixels in each unit block area shown in FIG. The information of "1" and "0" indicating the presence or absence of the data is converted into binary information.As a result, a blower binary image as shown in Fig. 6 is created, and the input image consists of (L'6XIB) pixels. expressed as data.

このようなブロック2値画像に対して射影特徴作成部3
eは、その任意の矩形領域における水平。
For such a block binary image, the projection feature creation unit 3
e is horizontal in the arbitrary rectangular area.

垂直方向の射影成分をそのブロック2値画像の特徴情報
として求めるものとなっている。
The projected component in the vertical direction is obtained as feature information of the block binary image.

またこのとき射影特徴作成部3bは前記各単位ブロック
領域の画像情報について、第7図(a) (b)に示す
ようにその水平方向および垂直方向の射影をそれぞれ求
めている。これらの射影成分は、その単位ブロック領域
に対応して一時的に格納され、後述する宛名領域の判定
処理に供される。
At this time, the projection feature creation section 3b calculates the horizontal and vertical projections of the image information of each unit block area, as shown in FIGS. 7(a) and 7(b). These projected components are temporarily stored in correspondence with the unit block area, and are used in address area determination processing, which will be described later.

第8図はこのようなブロック2値画像の射影特徴と、書
状郵便物に関する知識情報とを用いて実行される雑音領
域判定処理の概念を模式的に示す図である。
FIG. 8 is a diagram schematically showing the concept of noise area determination processing performed using the projection features of such block binary images and knowledge information regarding letters and mail items.

即ち、雑音領域判定部4は、書状郵便物1における料額
印面・郵便番号欄がその情報部位に存在すると云う先見
的知識に従い、前記ブロック2値画像の上方部位におけ
るデータ“1“の単位プロツク領域のまとまりを検出し
、その検出領域から上の領域の全てを第・8図に示すよ
うに料額印面・郵便番号欄領域αとして検出する。そし
てこの料額印面・郵便番号欄領域αとして検出された領
域を前記ブロワ・り2値画像から削除し、その領域検出
された単位ブロック領域のデータを“O”とする。
That is, the noise area determination unit 4 detects the unit block of data "1" in the upper part of the block binary image based on the a priori knowledge that the postage stamp/postal code field of the letter/postal item 1 exists in that information part. A group of areas is detected, and the entire area above the detected area is detected as the postage stamp face/postal code field area α as shown in FIG. Then, the area detected as the postage stamp face/postal code field area α is deleted from the blower binary image, and the data of the unit block area where the area was detected is set to "O".

また雑音領域判定部4は上述した如く料額印面・郵便番
号欄領域αとして検出された領域を削除したブロック2
値画像から、今度は広告文・通信文・差出人名等が書状
郵便物の下部領域に記載されると云う先見的知識に従い
、第8図に示すように水平方向の射影特徴を、その下端
側から調べて広告文・通信文!差出人名領域β・を検出
する。この4.ようにして検出された広告文・通信文・
差出人名領域βについても前記ブロック2値画像から削
除される。
In addition, the noise area determination unit 4 uses the block 2 in which the area detected as the postal stamp/postal code column area α is deleted as described above.
From the value image, based on the a priori knowledge that advertising text, correspondence, sender's name, etc. will be written in the lower area of the letter/postal item, the horizontal projection feature is added to the lower edge of the letter as shown in Figure 8. Check out advertisements and correspondence! Detect the sender name area β. This 4. Advertising text, correspondence, etc. detected in this way
The sender name area β is also deleted from the block binary image.

以上のようにして宛名領域以外の情報記録領域α、βを
大局的な見地から判定検出し、ブロック2値画像から削
除した後、前記宛名領域判定部4による宛名記載領域6
の検出処理が行なわれる。
After determining and detecting the information recording areas α and β other than the address area from a global perspective as described above and deleting them from the block binary image, the address writing area 6 is determined by the address area determination unit 4.
Detection processing is performed.

この宛名記載領・域6の検出処理は、上述したように宛
名領域以外の情報記録領域α、βを削除した入力画像領
域において、先ず第9図に示すようにそ−の垂直方向の
射影特徴を求める。この垂直方向の射影特徴の算出は、
前記残された入力画像領域の前述した単位ブロック領域
毎に求められている垂直方向の射影成分の和を求めるこ
とにより行なわれる。
This process of detecting the address writing area/area 6 is performed by first detecting its vertical projection feature as shown in FIG. seek. The calculation of this vertical projection feature is
This is performed by determining the sum of the vertical projection components determined for each unit block area of the remaining input image area.

このようにして求められる垂直方向の射影特徴から、例
えば文字列がなす行ピッチの情報を求めたり、また射影
成分が出現する領域の入力画像に対する、位置等の情報
に従って宛名記載領域以外の領域を削除する。具体的に
は、書状郵便物の右端に行ピッチが定かでない、或いは
不安定な文字記載領域が検出された場合、これを広告文
記載領域であると判定して宛名領域検出対象領域がら削
除する。また書状郵便物1の左端に文字記載領域が検出
された場合、差出人記載領域であると判定して宛名領域
検出対象領域がら削除する。この射影情報に従う雑音領
域の削除処理は、宛名記載領域は書状郵便物1の中央部
領域であり、且つ略一定の行ピッチで整然と記載される
等の大前提に基づいて行なわれる。
From the vertical projection features obtained in this way, for example, information on the line pitch of character strings can be obtained, and areas other than the address writing area can be determined based on information such as the position of the area where the projected component appears in the input image. delete. Specifically, if a character writing area with an uncertain or unstable line pitch is detected on the right edge of a letter/postal item, this is determined to be an advertising text writing area and is deleted from the address area detection target area. . If a character writing area is detected at the left end of the letter/postal item 1, it is determined that it is a sender writing area and is deleted from the address area detection target area. The noise area deletion process according to the projection information is performed on the basic premise that the address writing area is the central area of the letter/postal item 1 and that the address writing area is written in an orderly manner at a substantially constant line pitch.

しかる後、残された入力画像領域についての水平方向お
び垂直方向の射影特徴を大10図に示すようにそれぞれ
求め、その射影パターンにより特定される矩形領域を宛
名記載領域6として検出する。
Thereafter, the horizontal and vertical projection features of the remaining input image area are obtained as shown in Figure 10, and the rectangular area specified by the projection pattern is detected as the address writing area 6.

この結果、書状郵便物の宛名記載領域6が、雑音領域の
削除が行なわれて残された中央部領域において、前記射
影パターンで示される矩形領域として精度良く求められ
ることになる。
As a result, the address writing area 6 of the letter/postal item can be accurately determined as a rectangular area shown by the projection pattern in the central area left after the noise area has been deleted.

このように本装置によれば、入力画像の情報量を大幅に
圧縮したブロック2値画像として取扱い、その特徴情報
を求めて大局的な見地から雑音領域を排除し、残された
領域における入力画像の射影特徴から宛名記載領域6を
検出するので、簡易に、且つ高速に書状郵便物の宛名領
域を検出することが可能となる。しかも宛名情報以外の
種々の情報1つ が記載されている書状郵便物の入力画像中から、宛名記
載領域だけを正確に検出することができる。
In this way, according to this device, the input image is treated as a block binary image whose information content has been significantly compressed, the characteristic information of the input image is determined, noise areas are eliminated from a global perspective, and the input image in the remaining area is Since the address writing area 6 is detected from the projection feature of , it becomes possible to detect the address area of a letter or postal item easily and quickly. Furthermore, it is possible to accurately detect only the address writing area from an input image of a letter/postal item in which one of various pieces of information other than address information is written.

この結果、宛名情報の読取り入力処理における信頼性の
向上を図ることが可能となる等の実用上多大なる効果が
奏せられる。
As a result, great practical effects can be achieved, such as the ability to improve the reliability of the address information reading and input process.

また画像を入力した時点で、各単位ブロック領域でり射
影情報をそれぞれ求めておくので、上述した一連の処理
を効率的にパイプライン処理することができ、その処理
速度の大幅な向上を図ることができる等の実用上多大な
る効果か奏せられる。
Furthermore, since the projection information is obtained for each unit block area when an image is input, the series of processes described above can be efficiently pipelined, and the processing speed can be significantly improved. It has great practical effects, such as the ability to

尚、本発明は上述した実施例に限定されるものではない
。ここでは入力画像を(LAX 1B)のブロック2値
画像に変換して宛名検出処理を行なったが、そのブロッ
ク分割数や、ブロック2値画像を得る為の閾値は、処理
対象とする書状郵便物の仕様に応じて定めれば良いもの
である。またここでは単位ブロック領域での黒画素出現
頻度からその特徴情報を求めたが、白画素の出現頻度を
特徴情報として求めることも勿論可能である。また或い
は多値入力画像をそのままブロック化し、その濃度ヒス
トグラムを求めて特徴検出することも可能である。その
他、各種領域検出に利用する知識情報も上述した例に限
定されるものではない。また本発明による領域検出処理
をIC検査等に応用することも可能であり、要するに本
発明はその要旨を逸脱しない範囲で種々変形して実施す
ることができる。
Note that the present invention is not limited to the embodiments described above. Here, the input image was converted to a (LAX 1B) block binary image and address detection processing was performed, but the number of block divisions and the threshold for obtaining the block binary image are It may be determined according to the specifications. Further, here, the feature information was obtained from the appearance frequency of black pixels in the unit block area, but it is of course possible to obtain the appearance frequency of white pixels as the feature information. Alternatively, it is also possible to block the multi-valued input image as it is, obtain its density histogram, and detect features. In addition, the knowledge information used for various area detections is not limited to the above-mentioned examples. It is also possible to apply the area detection processing according to the present invention to IC inspection, etc. In short, the present invention can be implemented with various modifications without departing from the gist thereof.

[発明の効果コ 以上説明したように本発明によれは、書状郵便物の撮像
入力画像を所定の単位ブロック領域を基本とするブロッ
ク2値画像に変換し、この情報量圧縮されたブロック2
値画像の特徴情報から雑音領域を削除した後、残された
領域での入力画像情報の射影特徴から宛名記載領域を検
出するので、簡易に且つ効率良く、しかも高速に書状郵
便物中の宛名記載領域を正確に検出することが可能とな
り、宛名情報の読取り入力処理の信頼性の向上を図り得
る等の実用上多大なる効果が奏せられる。
[Effects of the Invention] As explained above, according to the present invention, a captured input image of a letter and mail is converted into a block binary image based on a predetermined unit block area, and this block 2 whose information amount is compressed is
After removing the noise area from the feature information of the value image, the address writing area is detected from the projection characteristics of the input image information in the remaining area, so it is possible to write the address in letters and mail easily, efficiently, and at high speed. It becomes possible to accurately detect the area, and great practical effects such as improving the reliability of address information reading and input processing can be achieved.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図乃至第10図は本発明に係る宛名領域検出装置の
一実施例を示すもので、第1図は実施例装置の概略構成
図、第2図は実施例装置での処理手続きの概略的な流れ
を示す図、第3図は書状郵便物の書式例を示す図、第4
図は入力画像に対するブロック化の概念を示す図、第5
図は単位ブロック領域の黒画素出現頻度の情報例を示す
図、第6図はブロック2値画像の例を示す図、第7図は
単位ブロック領域での射影特徴の検出を模式的に示す図
、第8図はブロック2値画像からの雑音領域検出とその
領域削除の概念示す図、第9図および第10図はそれぞ
れ残された領域の画像情報の射影特徴か□らの宛名領域
検出処理を示すである。 そして第11図および第12図はそれぞれ処理対象とす
る書状郵便物の書式例を示す図である。 ■・・・書状郵便物(読取り対象)  2・・・画像入
力部、3・・・特徴作成部、3a・・・画像分割部、3
b・・・射影特徴作成部、3C・・・画素頻度特徴作成
部、3d・・・ブロック2値画像作成部、3e・・・ブ
ロック射影特徴作成部、4・・・雑音領域判定部、5・
・・宛名領域判定部、6・・・宛名領域。 第9 図 第11 図 落10 図 賂12 図
1 to 10 show an embodiment of the address area detection device according to the present invention, FIG. 1 is a schematic configuration diagram of the embodiment device, and FIG. 2 is a schematic diagram of the processing procedure in the embodiment device. Figure 3 is a diagram showing an example of the format of letters and mail; Figure 4 is a diagram showing the format of letters and mail.
Figure 5 shows the concept of blocking input images.
The figure shows an example of information on the appearance frequency of black pixels in a unit block area, Figure 6 shows an example of a block binary image, and Figure 7 schematically shows the detection of projection features in a unit block area. , Fig. 8 is a diagram showing the concept of detecting a noise area from a block binary image and deleting the area, and Figs. 9 and 10 respectively show the process of detecting an address area from the projection characteristics of the image information of the remaining area. It shows. FIG. 11 and FIG. 12 are diagrams each showing an example of the format of letters and mail items to be processed. ■...Letter/postal item (reading target) 2...Image input section, 3...Characteristic creation section, 3a...Image division section, 3
b... Projection feature creation unit, 3C... Pixel frequency feature creation unit, 3d... Block binary image creation unit, 3e... Block projection feature creation unit, 4... Noise area determination unit, 5・
. . . Address area determination unit, 6 . . . Address area. Figure 9 Figure 11 Figure 10 Figure 12 Figure

Claims (1)

【特許請求の範囲】[Claims] 書状郵便物の宛名情報が記載されている面の情報を画像
入力する画像入力部と、入力された画像を所定の単位ブ
ロック領域毎に分割して各単位ブロック領域における画
像の射影成分と黒画素頻度とをそれぞれ求める手段と、
各単位ブロック領域毎に求められた黒画素頻度に従って
各単位ブロック領域を1単位としてそれぞれ2値化表現
したブロック2値画像を求める手段と、このブロック2
値画像の射影特徴を求める手段と、このブロック2値画
像の射影特徴と前記書状郵便物に関する知識情報とに基
づいて前記入力画像中の宛名記載領域以外の文字記載領
域を検出し、これらの検出領域を前記入力画像領域から
削除する手段と、前記入力画像の残された領域での前記
射影特徴から前記入力画像における宛名記載領域を検出
する手段とを具備したことを特徴とする宛名領域検出装
置。
An image input unit that inputs information on the side where address information of letters and mail is written, and an image input unit that divides the input image into predetermined unit block areas and calculates projected components and black pixels of the image in each unit block area. a means for determining the frequency, and
means for obtaining a block binary image that is binarized and expressed with each unit block area as one unit according to the black pixel frequency obtained for each unit block area;
means for determining a projection feature of a value image, and detecting character writing areas other than address writing areas in the input image based on the projection characteristics of the block binary image and knowledge information regarding the letter/postal item; An address area detection device comprising: means for deleting an area from the input image area; and means for detecting an address writing area in the input image from the projection feature in the remaining area of the input image. .
JP63179678A 1988-07-19 1988-07-19 Address area detection device Expired - Fee Related JP2714012B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63179678A JP2714012B2 (en) 1988-07-19 1988-07-19 Address area detection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63179678A JP2714012B2 (en) 1988-07-19 1988-07-19 Address area detection device

Publications (2)

Publication Number Publication Date
JPH0228897A true JPH0228897A (en) 1990-01-30
JP2714012B2 JP2714012B2 (en) 1998-02-16

Family

ID=16069961

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63179678A Expired - Fee Related JP2714012B2 (en) 1988-07-19 1988-07-19 Address area detection device

Country Status (1)

Country Link
JP (1) JP2714012B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002265190A (en) * 2001-03-09 2002-09-18 Tadano Ltd Work bench elevating/lowering device for boom type high altitude work device
US7612918B2 (en) 2005-03-29 2009-11-03 Kabushiki Kaisha Toshiba Image processing apparatus
JP2016181211A (en) * 2015-03-25 2016-10-13 日本電気株式会社 Label area detection device, label area detection method, label area detection program, and label area detection system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002265190A (en) * 2001-03-09 2002-09-18 Tadano Ltd Work bench elevating/lowering device for boom type high altitude work device
US7612918B2 (en) 2005-03-29 2009-11-03 Kabushiki Kaisha Toshiba Image processing apparatus
JP2016181211A (en) * 2015-03-25 2016-10-13 日本電気株式会社 Label area detection device, label area detection method, label area detection program, and label area detection system

Also Published As

Publication number Publication date
JP2714012B2 (en) 1998-02-16

Similar Documents

Publication Publication Date Title
US10467464B2 (en) Document field detection and parsing
JP3338537B2 (en) Image tilt detector
CA2282764C (en) System and method for ocr assisted bar code decoding
US5120940A (en) Detection of barcodes in binary images with arbitrary orientation
US7356162B2 (en) Method for sorting postal items in a plurality of sorting passes
JP2575539B2 (en) How to locate and identify money fields on documents
JP3124296B2 (en) How to detect the position and direction of the fiducial mark
US4516265A (en) Optical character reader
Aradhye A generic method for determining up/down orientation of text in roman and non-roman scripts
JP2940936B2 (en) Tablespace identification method
JPH0228897A (en) Address area detector
JP3268552B2 (en) Area extraction method, destination area extraction method, destination area extraction apparatus, and image processing apparatus
JP2714003B2 (en) Address area detection device
JPS6325391B2 (en)
JP2861860B2 (en) Address line extraction device
JP2827960B2 (en) Address line extraction device
JP3957471B2 (en) Separating string unit
JP3715473B2 (en) Address reader
JPH01191986A (en) Slip format detector
JP3476936B2 (en) Character line direction determination device
JP2570184B2 (en) Optical character reader
JP2875330B2 (en) Character recognition method
JP2963807B2 (en) Postal code frame detector
JPH04134578A (en) Picture binarizing system
JPH04205690A (en) Character recognition device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees