JP3036559B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3036559B2
JP3036559B2 JP3336205A JP33620591A JP3036559B2 JP 3036559 B2 JP3036559 B2 JP 3036559B2 JP 3336205 A JP3336205 A JP 3336205A JP 33620591 A JP33620591 A JP 33620591A JP 3036559 B2 JP3036559 B2 JP 3036559B2
Authority
JP
Japan
Prior art keywords
rectangular
block
address
postal code
circumscribed rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP3336205A
Other languages
English (en)
Other versions
JPH05151389A (ja
Inventor
武志 場生松
一郎 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP3336205A priority Critical patent/JP3036559B2/ja
Publication of JPH05151389A publication Critical patent/JPH05151389A/ja
Application granted granted Critical
Publication of JP3036559B2 publication Critical patent/JP3036559B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置に係り、
とくに書類上に記載された文字を読み取る文字認識装置
に関する。
【0002】
【従来の技術】書類上に記載された文字の中から住所の
みを読み込むために、従来はCCDカメラやイメージス
キャナ等で書類上に記載された文字を入力画像として取
り込み、濃淡比率等の画像処理により住所記載領域を推
測していた。
【0003】
【発明が解決しようとする課題】しかしながら、上記従
来例においては、入力画像のすべてから住所の記載領域
を検出しているために、読み取り対象となる書類上に住
所以外の雑情報が多く記載されている場合には、住所を
正しく読み込めないという不都合があった。
【0004】
【発明の目的】本発明の目的は、かかる従来例の有する
不都合を改善し、とくに読み取り対象となる書類上に住
所以外の雑情報が多く記載されている場合でも、住所の
みを正しく読み取ることができる文字認識装置を提供す
ることにある。
【0005】
【課題を解決するための手段】そこで、本発明では、入
力画像に含まれる各文字毎にその文字を囲むn個の矩形
ブロックを生成すると共に水平方向をX軸とし垂直方向
をY軸とした場合にi番目(i<n:iは整数)の矩形
ブロックをブロックの左下座標(Xi,Yi)と矩形ブ
ロックのX軸方向の長さWiとY軸方向の長さHiを用
いて(Xi,Yi,Wi,Hi)という形で抽出する外
接矩形抽出部と、この外接矩形抽出部で(Xi,Yi,
Wi,Hi)という形で抽出された各矩形ブロックの内
郵便番号である矩形ブロックを検出すると共に当該郵便
番号を構成する矩形ブロックの並びを囲む矩形領域(X
p,Yp,Wp,Hp)を求める郵便番号検出部とを備
えている。 さらに、外接矩形抽出部で生成された矩形ブ
ロックの内、f、gを正の定数として次式 0≦Xi−Xp≦f かつ 0≦Yp−Yi−Hi≦g を満たす矩形領域を住所記載領域と判定する住所検出部
を備えた、という構成を採っている。これによって前述
した目的を達成しようとするものである。
【0006】
【作用】外接矩形抽出部に入力画像が入力される。外接
矩形抽出部では入力画像に含まれる各文字毎にその文字
を囲む矩形ブロックを生成する。ここで水平方向をX
軸、垂直方向をY軸とするとi番目のブロックは、ブロ
ックの左下座標(Xi,Yi)とブロックのX軸方向の
長さWiとY軸方向の長さHiを用いて(Xi,Yi,
Wi,Hi)という形で記述され、抽出される。ただ
し、ブロック数はn個でありiはn以下の正の整数であ
る。
【0007】郵便番号検出部では、外接矩形抽出部によ
って抽出された結果に基づき、例えば、次式を満たすブ
ロックの並びを郵便番号を構成するブロックであると判
定する。すなわち、(a≦Xj−Xi−Wi≦b かつ
a≦Xk−Xj−Wj≦b)と(|Yi−Yj|≦c
かつ |Yj−Yk|≦c)と(|Hi−Hj|≦d
かつ |Hj−Hk|≦d)と(Wi≦e かつ W
j≦e かつ Wk≦e)を同時に満たし、(a≦Xi
−Xl−Wl≦b かつ Yl≦Yi+Hi かつ Y
l+Hl≧Yi)を満たすブロック(Xl,Yl,W
l,Hl)が存在せず、さらに(a≦Xm−Xk−Wk
≦b かつ Ym≦Yk+Hk かつ Ym+Hm≧Y
k)を満たすブロック(Xm,Ym,Wm,Hm)が存
在しないブロックの並び{(Xi,Yi,Wi,H
i)、(Xj,Yj,Wj,Hj)、(Xk,Yk,W
k,Hk)}であること。ここで、a、b、c、d、e
は正の定数、i、j、k、l、mは相異なる正の整数で
ある。
【0008】さらに郵便番号検出部では、郵便番号を構
成するブロックの並びを囲む矩形領域(Xp,Yp,W
p,Hp)を求め郵便番号記載位置情報とする。住所検
出部では、郵便番号検出部からの郵便番号記載位置情報
(Xp,Yp,Wp,Hp)と、外接矩形抽出部の抽出
結果に基づき(0≦Xi−Xp≦f かつ 0≦Yp−
Yi−Hi≦g)を同時に満たすブロック(Xi,Y
i,Wi,Hi)で構成される矩形領域を求め、住所記
載領域情報とし出力する。ここで、f、gは正の定数で
ある。
【0009】
【発明の実施例】以下、本発明の一実施例を図1ないし
図6に基づいて説明する。
【0010】図1の実施例は、入力画像11のラベリン
グを行う外接矩形抽出部12と、外接矩形抽出部12の
ラベリング結果13に基づき所定の条件式を用いて郵便
番号の記載位置を検出する郵便番号検出部14と、外接
矩形抽出部12のラベリング結果13と郵便番号検出部
14で検出された郵便番号記載位置情報15に基づき所
定の条件式を用いて住所の記載領域を検出し住所記載領
域情報17を出力する住所検出部16とから構成されて
いる。
【0011】次に本実施例の動作について説明する。
【0012】1).外接矩形抽出部12に入力画像11
が入力される。
【0013】2).外接矩形抽出部12では、図2と図
3に示されるように入力画像11に含まれる各文字毎に
その文字を囲むブロックを生成し、ラベリング処理を行
う。ここで例えば、図4に示されるように水平方向をX
軸、垂直方向をY軸とするとi番目のブロックは、ブロ
ックの左下座標(Xi,Yi)とブロックのX軸方向の
長さWiとY軸方向の長さHiを用いて(Xi,Yi,
Wi,Hi)という形で記述され、抽出される。ただ
し、ブロック数はn個であり、iはn以下の正の整数で
ある。
【0014】3).郵便番号検出部14では、外接矩形
抽出部12からの抽出結果(ラベリング結果13に基
づき下記の条件を同時に満たすブロックの並び{(X
i,Yi,Wi,Hi)、(Xj,Yj,Wj,H
j)、(Xk,Yk,Wk,Hk)}を郵便番号を構成
するブロックとする。ただし、i、j、kはn以下で相
異なる正の整数である。
【0015】条件1:下記(1)〜(4)式を満たす。
ここで、a、b、c、d、eは正の定数である。
【0016】条件2:下記(5)式を満たすブロック
(Xl,Yl,Wl,Hl)が存在しない。ただし、l
はn以下でi、j、kのいずれとも異なる正の整数であ
る。
【0017】条件3:下記(6)式を満たすブロック
(Xm,Ym,Wm,Hm)が存在しない。ただし、m
はn以下でi、j、kのいずれとも異なる正の整数であ
る。
【0018】a≦Xj−Xi−Wi≦b かつ a≦X
k−Xj−Wj≦b・・・(1)
【0019】|Yi−Yj|≦c かつ |Yj−Yk
|≦c・・・(2)
【0020】|Hi−Hj|≦d かつ |Hj−Hk
|≦d・・・(3)
【0021】Wi≦e かつ Wj≦e かつ Wk≦
e・・・(4)
【0022】a≦Xi−Xl−Wl≦b かつ Yl≦
Yi+Hi かつ Yl+Hl≧Yi・・・(5)
【0023】a≦Xm−Xk−Wk≦b かつ Ym≦
Yk+Hk かつ Ym+Hm≧Yk・・・(6)
【0024】4).さらに郵便番号検出部14では、図
5に示されるように郵便番号を構成するブロックの並び
を囲む矩形領域(Xp,Yp,Wp,Hp)を求め、郵
便番号記載位置情報15とする。
【0025】5).住所検出部16では、郵便番号検出
部14からの郵便番号記載位置情報15と、外接矩形抽
出部12からのラベリング結果13に基づき(7)式を
同時に満たすブロック(Xi,Yi,Wi,Hi)で構
成される矩形領域を求め、住所記載領域情報17として
出力する。
【0026】0≦Xi−Xp≦f かつ 0≦Yp−Y
i−Hi≦g・・・(7)
【0027】ここで、f、gは正の定数である。
【0028】
【発明の効果】本発明は以上のように構成され機能する
ので、これによると、郵便番号の記載領域から住所記載
領域を知ることができ、これがため、読み取り対象とな
る書類上に住所以外の雑情報が多く記載されている場合
でも、住所のみを正しく読み取ることができるという従
来にない優れた文字認識装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の一実施例を示した構成図である。
【図2】入力画像に含まれる文字の例を示す説明図であ
る。
【図3】入力画像に含まれる各文字毎の矩形ブロックの
例を示す説明図である。
【図4】矩形ブロックの記述形式の一例を示す説明図で
ある。
【図5】郵便番号を構成するブロックの並びを囲む矩形
領域の例を示す説明図である。
【図6】住所検出部の検出結果の一例を示す説明図であ
る。
【符号の説明】
11 入力画像 12 外接矩形抽出部 13 ラベリング処理結果 14 郵便番号検出部 15 郵便番号記載位置情報 16 住所検出部 17 住所記載位置情報

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力画像に含まれる各文字毎にその文字
    を囲むn個の矩形ブロックを生成すると共に水平方向を
    X軸とし垂直方向をY軸とした場合にi番目(i<n:
    iは整数)の矩形ブロックをブロックの左下座標(X
    i,Yi)と矩形ブロックのX軸方向の長さWiとY軸
    方向の長さHiを用いて(Xi,Yi,Wi,Hi)と
    いう形で抽出する外接矩形抽出部と、 この外接矩形抽出部で(Xi,Yi,Wi,Hi)とい
    う形で抽出された各矩形ブロックの内郵便番号である矩
    形ブロックを検出すると共に当該郵便番号を構成する矩
    形ブロックの並びを囲む矩形領域(Xp,Yp,Wp,
    Hp)を求める郵便番号検出部と、 前記外接矩形抽出部で生成された矩形ブロックの内、
    f、gを正の定数として次式 0≦Xi−Xp≦f かつ 0≦Yp−Yi−Hi≦g を満たす矩形領域を住所記載領域と判定する住所検出部
    と、 を備えたことを特徴とする文字認識装置。
JP3336205A 1991-11-26 1991-11-26 文字認識装置 Expired - Lifetime JP3036559B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3336205A JP3036559B2 (ja) 1991-11-26 1991-11-26 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3336205A JP3036559B2 (ja) 1991-11-26 1991-11-26 文字認識装置

Publications (2)

Publication Number Publication Date
JPH05151389A JPH05151389A (ja) 1993-06-18
JP3036559B2 true JP3036559B2 (ja) 2000-04-24

Family

ID=18296724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3336205A Expired - Lifetime JP3036559B2 (ja) 1991-11-26 1991-11-26 文字認識装置

Country Status (1)

Country Link
JP (1) JP3036559B2 (ja)

Also Published As

Publication number Publication date
JPH05151389A (ja) 1993-06-18

Similar Documents

Publication Publication Date Title
JP2986383B2 (ja) ライン走査画像のためのスキューを補正する方法及びその装置
JP2930612B2 (ja) 画像形成装置
US6965703B1 (en) Optical scanner and software for correcting distorted images
JP2670273B2 (ja) 画像処理装置
JPH0731714B2 (ja) 文字成分切出し方法
US4901365A (en) Method of searching binary images to find search regions in which straight lines may be found
JP3209746B2 (ja) 文字認識システムで用いる文字位置確認装置および方法
JP3036559B2 (ja) 文字認識装置
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
JPS5845743B2 (ja) 情報処理システム
JPS6325391B2 (ja)
JP2708604B2 (ja) 文字認識方法
Misra et al. A memory efficient method for fast transposing run-length encoded images
JP2755299B2 (ja) 画像処理方法
JP2626011B2 (ja) 図面読取処理方法
JP2802132B2 (ja) 画像形成装置
JPH0750496B2 (ja) 画信号処理装置
JP2937607B2 (ja) レイアウト作成装置
JP3193472B2 (ja) 複合的な情報の構築方式
JPH09120430A (ja) 画像処理装置
JP2991735B2 (ja) バッファリング方式
JP3090928B2 (ja) 文字認識装置
JP2891211B2 (ja) 光学式文字読取装置および方法
JP2962525B2 (ja) テキストブロック認識方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000126

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080225

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090225

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100225

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110225

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110225

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120225

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120225

Year of fee payment: 12