JP3036559B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP3036559B2 JP3036559B2 JP3336205A JP33620591A JP3036559B2 JP 3036559 B2 JP3036559 B2 JP 3036559B2 JP 3336205 A JP3336205 A JP 3336205A JP 33620591 A JP33620591 A JP 33620591A JP 3036559 B2 JP3036559 B2 JP 3036559B2
- Authority
- JP
- Japan
- Prior art keywords
- rectangular
- block
- address
- postal code
- circumscribed rectangle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
Description
とくに書類上に記載された文字を読み取る文字認識装置
に関する。
みを読み込むために、従来はCCDカメラやイメージス
キャナ等で書類上に記載された文字を入力画像として取
り込み、濃淡比率等の画像処理により住所記載領域を推
測していた。
来例においては、入力画像のすべてから住所の記載領域
を検出しているために、読み取り対象となる書類上に住
所以外の雑情報が多く記載されている場合には、住所を
正しく読み込めないという不都合があった。
不都合を改善し、とくに読み取り対象となる書類上に住
所以外の雑情報が多く記載されている場合でも、住所の
みを正しく読み取ることができる文字認識装置を提供す
ることにある。
力画像に含まれる各文字毎にその文字を囲むn個の矩形
ブロックを生成すると共に水平方向をX軸とし垂直方向
をY軸とした場合にi番目(i<n:iは整数)の矩形
ブロックをブロックの左下座標(Xi,Yi)と矩形ブ
ロックのX軸方向の長さWiとY軸方向の長さHiを用
いて(Xi,Yi,Wi,Hi)という形で抽出する外
接矩形抽出部と、この外接矩形抽出部で(Xi,Yi,
Wi,Hi)という形で抽出された各矩形ブロックの内
郵便番号である矩形ブロックを検出すると共に当該郵便
番号を構成する矩形ブロックの並びを囲む矩形領域(X
p,Yp,Wp,Hp)を求める郵便番号検出部とを備
えている。 さらに、外接矩形抽出部で生成された矩形ブ
ロックの内、f、gを正の定数として次式 0≦Xi−Xp≦f かつ 0≦Yp−Yi−Hi≦g を満たす矩形領域を住所記載領域と判定する住所検出部
を備えた、という構成を採っている。これによって前述
した目的を達成しようとするものである。
矩形抽出部では入力画像に含まれる各文字毎にその文字
を囲む矩形ブロックを生成する。ここで水平方向をX
軸、垂直方向をY軸とするとi番目のブロックは、ブロ
ックの左下座標(Xi,Yi)とブロックのX軸方向の
長さWiとY軸方向の長さHiを用いて(Xi,Yi,
Wi,Hi)という形で記述され、抽出される。ただ
し、ブロック数はn個でありiはn以下の正の整数であ
る。
って抽出された結果に基づき、例えば、次式を満たすブ
ロックの並びを郵便番号を構成するブロックであると判
定する。すなわち、(a≦Xj−Xi−Wi≦b かつ
a≦Xk−Xj−Wj≦b)と(|Yi−Yj|≦c
かつ |Yj−Yk|≦c)と(|Hi−Hj|≦d
かつ |Hj−Hk|≦d)と(Wi≦e かつ W
j≦e かつ Wk≦e)を同時に満たし、(a≦Xi
−Xl−Wl≦b かつ Yl≦Yi+Hi かつ Y
l+Hl≧Yi)を満たすブロック(Xl,Yl,W
l,Hl)が存在せず、さらに(a≦Xm−Xk−Wk
≦b かつ Ym≦Yk+Hk かつ Ym+Hm≧Y
k)を満たすブロック(Xm,Ym,Wm,Hm)が存
在しないブロックの並び{(Xi,Yi,Wi,H
i)、(Xj,Yj,Wj,Hj)、(Xk,Yk,W
k,Hk)}であること。ここで、a、b、c、d、e
は正の定数、i、j、k、l、mは相異なる正の整数で
ある。
成するブロックの並びを囲む矩形領域(Xp,Yp,W
p,Hp)を求め郵便番号記載位置情報とする。住所検
出部では、郵便番号検出部からの郵便番号記載位置情報
(Xp,Yp,Wp,Hp)と、外接矩形抽出部の抽出
結果に基づき(0≦Xi−Xp≦f かつ 0≦Yp−
Yi−Hi≦g)を同時に満たすブロック(Xi,Y
i,Wi,Hi)で構成される矩形領域を求め、住所記
載領域情報とし出力する。ここで、f、gは正の定数で
ある。
図6に基づいて説明する。
グを行う外接矩形抽出部12と、外接矩形抽出部12の
ラベリング結果13に基づき所定の条件式を用いて郵便
番号の記載位置を検出する郵便番号検出部14と、外接
矩形抽出部12のラベリング結果13と郵便番号検出部
14で検出された郵便番号記載位置情報15に基づき所
定の条件式を用いて住所の記載領域を検出し住所記載領
域情報17を出力する住所検出部16とから構成されて
いる。
が入力される。
3に示されるように入力画像11に含まれる各文字毎に
その文字を囲むブロックを生成し、ラベリング処理を行
う。ここで例えば、図4に示されるように水平方向をX
軸、垂直方向をY軸とするとi番目のブロックは、ブロ
ックの左下座標(Xi,Yi)とブロックのX軸方向の
長さWiとY軸方向の長さHiを用いて(Xi,Yi,
Wi,Hi)という形で記述され、抽出される。ただ
し、ブロック数はn個であり、iはn以下の正の整数で
ある。
抽出部12からの抽出結果(ラベリング結果)13に基
づき下記の条件を同時に満たすブロックの並び{(X
i,Yi,Wi,Hi)、(Xj,Yj,Wj,H
j)、(Xk,Yk,Wk,Hk)}を郵便番号を構成
するブロックとする。ただし、i、j、kはn以下で相
異なる正の整数である。
ここで、a、b、c、d、eは正の定数である。
(Xl,Yl,Wl,Hl)が存在しない。ただし、l
はn以下でi、j、kのいずれとも異なる正の整数であ
る。
(Xm,Ym,Wm,Hm)が存在しない。ただし、m
はn以下でi、j、kのいずれとも異なる正の整数であ
る。
k−Xj−Wj≦b・・・(1)
|≦c・・・(2)
|≦d・・・(3)
e・・・(4)
Yi+Hi かつ Yl+Hl≧Yi・・・(5)
Yk+Hk かつ Ym+Hm≧Yk・・・(6)
5に示されるように郵便番号を構成するブロックの並び
を囲む矩形領域(Xp,Yp,Wp,Hp)を求め、郵
便番号記載位置情報15とする。
部14からの郵便番号記載位置情報15と、外接矩形抽
出部12からのラベリング結果13に基づき(7)式を
同時に満たすブロック(Xi,Yi,Wi,Hi)で構
成される矩形領域を求め、住所記載領域情報17として
出力する。
i−Hi≦g・・・(7)
ので、これによると、郵便番号の記載領域から住所記載
領域を知ることができ、これがため、読み取り対象とな
る書類上に住所以外の雑情報が多く記載されている場合
でも、住所のみを正しく読み取ることができるという従
来にない優れた文字認識装置を提供することができる。
る。
例を示す説明図である。
ある。
領域の例を示す説明図である。
る。
Claims (1)
- 【請求項1】 入力画像に含まれる各文字毎にその文字
を囲むn個の矩形ブロックを生成すると共に水平方向を
X軸とし垂直方向をY軸とした場合にi番目(i<n:
iは整数)の矩形ブロックをブロックの左下座標(X
i,Yi)と矩形ブロックのX軸方向の長さWiとY軸
方向の長さHiを用いて(Xi,Yi,Wi,Hi)と
いう形で抽出する外接矩形抽出部と、 この外接矩形抽出部で(Xi,Yi,Wi,Hi)とい
う形で抽出された各矩形ブロックの内郵便番号である矩
形ブロックを検出すると共に当該郵便番号を構成する矩
形ブロックの並びを囲む矩形領域(Xp,Yp,Wp,
Hp)を求める郵便番号検出部と、 前記外接矩形抽出部で生成された矩形ブロックの内、
f、gを正の定数として次式 0≦Xi−Xp≦f かつ 0≦Yp−Yi−Hi≦g を満たす矩形領域を住所記載領域と判定する住所検出部
と、 を備えたことを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3336205A JP3036559B2 (ja) | 1991-11-26 | 1991-11-26 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3336205A JP3036559B2 (ja) | 1991-11-26 | 1991-11-26 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05151389A JPH05151389A (ja) | 1993-06-18 |
JP3036559B2 true JP3036559B2 (ja) | 2000-04-24 |
Family
ID=18296724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3336205A Expired - Lifetime JP3036559B2 (ja) | 1991-11-26 | 1991-11-26 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3036559B2 (ja) |
-
1991
- 1991-11-26 JP JP3336205A patent/JP3036559B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH05151389A (ja) | 1993-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2986383B2 (ja) | ライン走査画像のためのスキューを補正する方法及びその装置 | |
JP2930612B2 (ja) | 画像形成装置 | |
US6965703B1 (en) | Optical scanner and software for correcting distorted images | |
JP2670273B2 (ja) | 画像処理装置 | |
JPH0731714B2 (ja) | 文字成分切出し方法 | |
US4901365A (en) | Method of searching binary images to find search regions in which straight lines may be found | |
JP3209746B2 (ja) | 文字認識システムで用いる文字位置確認装置および方法 | |
JP3036559B2 (ja) | 文字認識装置 | |
US6983071B2 (en) | Character segmentation device, character segmentation method used thereby, and program therefor | |
JPH0333990A (ja) | マスク処理を用いる光学式文字認識装置及び方法 | |
JPS5845743B2 (ja) | 情報処理システム | |
JPS6325391B2 (ja) | ||
JP2708604B2 (ja) | 文字認識方法 | |
Misra et al. | A memory efficient method for fast transposing run-length encoded images | |
JP2755299B2 (ja) | 画像処理方法 | |
JP2626011B2 (ja) | 図面読取処理方法 | |
JP2802132B2 (ja) | 画像形成装置 | |
JPH0750496B2 (ja) | 画信号処理装置 | |
JP2937607B2 (ja) | レイアウト作成装置 | |
JP3193472B2 (ja) | 複合的な情報の構築方式 | |
JPH09120430A (ja) | 画像処理装置 | |
JP2991735B2 (ja) | バッファリング方式 | |
JP3090928B2 (ja) | 文字認識装置 | |
JP2891211B2 (ja) | 光学式文字読取装置および方法 | |
JP2962525B2 (ja) | テキストブロック認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000126 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080225 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090225 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100225 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100225 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110225 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110225 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120225 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120225 Year of fee payment: 12 |