JPH09128478A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JPH09128478A
JPH09128478A JP7287179A JP28717995A JPH09128478A JP H09128478 A JPH09128478 A JP H09128478A JP 7287179 A JP7287179 A JP 7287179A JP 28717995 A JP28717995 A JP 28717995A JP H09128478 A JPH09128478 A JP H09128478A
Authority
JP
Japan
Prior art keywords
block
section
blocks
memory
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7287179A
Other languages
English (en)
Other versions
JP3299873B2 (ja
Inventor
Harunobu Mori
晴信 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP28717995A priority Critical patent/JP3299873B2/ja
Publication of JPH09128478A publication Critical patent/JPH09128478A/ja
Application granted granted Critical
Publication of JP3299873B2 publication Critical patent/JP3299873B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 複数枚の定型用紙を画像として一度に読み取
り、一枚一枚の領域を自動的かつ高速に抽出し、抽出し
た領域のデータを文字認識処理することで、複数名刺な
どの定形用紙に印刷された文字を一度に認識処理させ
る。 【解決手段】 Sは画像を取り込むスキャナ、M1は入
力画像用メモリ、M2,M3は周辺分布用メモリ、M
4,M5は区間座標用メモリ、Rはプログラム用RO
M、PはR内のプログラムに従って処理の流れを制御す
る制御部である。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数枚の定型用紙
を含む画像中より用紙一枚一枚の領域を自動的に抽出す
る装置に関するもので、例えば複数枚の名刺を一度に読
み取り、名刺領域を自動的に抽出し文字認識・住所録作
成を行なうために利用される。
【0002】
【従来の技術】文書を画像として読み取り、自動的に認
識を行なう場合、読み取った画像中には一つの用紙だけ
が存在し、その用紙の範囲及び傾きを調べた後に、用紙
内の認識を行なうのが一般的である。例えば、市販され
ている名刺読み取り機は名刺を一枚ずつ画像として読み
取った後、認識処理を行なっている。
【0003】
【発明が解決しようとする課題】本発明は、複数枚の定
型用紙を画像として一度に読み取り、一枚一枚の領域を
自動的かつ高速に抽出し、抽出した領域のデータを文字
認識処理することで、複数名刺などの定形用紙に印刷さ
れた文字を一度に認識処理させるものである。
【0004】
【課題を解決するための手段】請求項1の発明に係る画
像処理装置は、入力された画像の周辺分布を用いて縦方
向・横方向にそれぞれ分割し、求めた区間の長さとあら
かじめ定めた値を比較して区間を統合あるいは削除し、
縦・横両方向の区間で規定される領域のうち画素変化が
ある領域を抽出するものである。
【0005】請求項2の発明に係る画像処理装置は、請
求項1記載の画像処理装置において、求めた区間の長さ
があらかじめ定めた値の整数倍の場合、あらかじめ定め
た値の長さとなる複数個の区間に分割するものである。
【0006】請求項3の発明に係る画像処理装置は、請
求項1及び2記載の画像処理装置において、領域内の白
画素の存在の判別を領域内の複数回の直線走査によって
行なうものである。
【0007】請求項1の発明においては、あらかじめ定
めた値を元にして、縦方向・横方向の区間を統合あるい
は削除することにより、適切な大きさの領域を抽出し、
ノイズ領域を無視することができる。
【0008】請求項2の発明においては、用紙が接近
し、周辺分布を用いて用紙の領域を分離できない場合に
おいても、用紙一枚一枚の領域を抽出することを可能と
する。請求項3の発明においては、周辺分布を用いて求
めた領域に実際に用紙が存在するかを確認するため、必
要最小限の走査を行なうことで、高速な処理を可能とす
る。
【0009】
【発明の実施の形態】以下に、本発明による複数領域を
抽出する画像処理装置の一実施例について、図1〜図1
2に基づき説明する。
【0010】図1は、本発明を適用した一実施例システ
ムの構成を示す機能ブロック図である。Sは画像を取り
込むスキャナ、M1は入力画像用メモリ、M2,M3は
周辺分布用メモリ、M4,M5は区間座標用メモリ、R
はプログラム用ROM、PはR内のプログラムに従って
処理の流れを制御する制御部である。
【0011】図2〜図10は、実施例の処理の流れを示
すフローチャートである。なお、定型用紙幅をXP、定
型用紙高さをYPとする。
【0012】画像より領域を次のように抽出する。 [図2のステップ(1)]スキャナSで読み取った画像
は、入力画像用メモリM1に転送されるようにする。画
像の格納方法は、画像(横:X画素,縦:Y画素)に対
し、画像左上の画素から画像右下の画素へと順に、画素
が白の場合には“1”を、黒の場合には“0”を1by
teずつメモリに格納していく。すなわち座標(x,
y)の画素値を、メモリの(x+X×y)番目のアドレ
スに1byte単位で格納する。画像1枚につきメモリ
容量は(X×Y)byte必要である。
【0013】[図2のステップ(2)]入力画像用メモ
リM1に格納された画像をもとに、制御部Pは画像内の
周辺分布を求め、周辺分布用メモリM2,M3に値を格
納する。周辺分布とは領域内を縦方向あるいは横方向に
走査し白画素をカウントすることによって求まるもの
で、画像M1内の縦方向投影による周辺分布PPv,横
方向投影による周辺分布PPhは、iを横方向の座標,
jを縦方向の座標とするとそれぞれ以下の数式(1)、
数式(2)と表現される。
【0014】
【数1】
【0015】このとき、PPv(i)=0の区間は縦方
向に連続して求める領域がない部分、PPh(j)=0
の区間は横方向に連続して求める領域がない部分に相当
する。格納方法は、縦方向投影による周辺分布について
は、i:0〜(横画素数−1)においてPPv(i)=
0の場合は“0”を、PPv(i)≠0の場合“1”を
周辺分布メモリM2上に順に1byte単位で格納し、
横方向投影による周辺分布については、j:0〜(縦画
素数−1)においてPPh(j)=0の場合は“0”
を、PPh(j)≠0の場合“1”を周辺分布メモリM
3上に順に1byte単位で格納していく。メモリ容量
は、M2の場合:横画素数byte、M3の場合:縦画
素数byte必要である。
【0016】[図2〜図3のステップ(3)]制御部P
は周辺分布メモリM2内を走査し、M2(i)=1の区
間を求め、区間座標用メモリM4に区間開始座標値/終
了座標値を格納する(図11)。同様に、制御部Pは周
辺分布メモリM3内を走査し、M3(j)=1の区間を
求め、区間座標用メモリM5に区間開始座標値/終了座
標値を格納する。
【0017】[図4のステップ(4)]制御部Pは、区
間座標用メモリM4より区間開始/終了座標値を取り出
し、区間長を求め、区間長があらかじめ指定した値Th
sx(=用紙間の横方向距離のうちの最小値)未満の場
合、その区間データを削除する。また、区間座標用メモ
リM5より区間開始/終了座標値を取り出し、区間長を
求め、区間長があらかじめ指定した値Thsy(=用紙
間の縦方向距離のうちの最小値)未満の場合、その区間
データを削除する。これにより、ノイズ成分をデータか
ら取り除くことができる。
【0018】[図5〜図6のステップ(5)]制御部P
は、区間座標用メモリM4から隣合った2区間分の区間
開始/終了座標値を取り出し、両区間の間の距離がTh
sx以下で、両区間を統合した場合の区間長があらかじ
め指定した値Thlx(=XP+誤差)以下の場合、両
区間を統合して一つの区間データとする。また、区間座
標用メモリM5から隣合った2区間分の区間開始/終了
座標値を取り出し、両区間の間の距離がThsy以下
で、両区間を統合した場合の区間長があらかじめ指定し
た値Thly(=YP+誤差)以下の場合、両区間を統
合して一つの区間データとする。これにより、一つの領
域が周辺分布データでは複数に分かれている場合でも、
一つの領域として抽出することができる。
【0019】[図7のステップ(6)]制御部Pは、区
間座標用メモリM4より区間開始/終了座標値を取り出
し、区間長を求め、あらかじめ指定した値をThn(=
読み取り誤差)としたとき、(XP×n−Thn)≦
(区間長≦XP×n+Thn)(n:自然数)が成立す
る場合には、その区間をn個に等分する。すなわち、
[開始座標値+(i−1)×(終了座標値−開始座標
値)/n, 開始座標値+i×(終了座標値−開始座標
値)/n](i:1〜n)のn個の区間データを元デー
タの代わりにM4に格納する。また、区間座標用メモリ
M5より区間開始/終了座標値を取り出し、区間長を求
め、(YP×n−Thn)≦区間長≦(YP×n+Th
n)(n:自然数)が成立する場合には、その区間をn
個に等分する。これにより、複数の領域が周辺分布デー
タでは一つになっている場合でも、分離して抽出するこ
とができる。
【0020】[図8〜図9のステップ(7)]制御部P
は、区間座標用メモリM4より区間開始/終了座標値を
取り出し、区間長を求め、区間長があらかじめ指定した
値Thmx(=XP−誤差)未満の場合またはThlx
より大きい場合、その区間データを削除する。また、区
間座標用メモリM5より区間開始/終了座標値を取り出
し、区間長を求め、区間長があらかじめ指定した値Th
my(=YP−誤差)未満の場合またはThlyより大
きい場合、その区間データを削除する。これにより、定
型用紙以外の用紙が使用された場合に、データから取り
除くことができる。
【0021】[図10のステップ(8)]制御部Pは、
区間座標用メモリM4より横方向の区間開始/終了座標
値を、区間座標用メモリM5より縦方向の区間開始/終
了座標値をそれぞれ一つずつ取り出し、区間で囲まれた
矩形領域内に用紙が存在するかどうかを調べる。具体的
には、制御部Pは入力画像用メモリM1内を矩形左上よ
り右下方向に直線走査して白画素の個数を調べ、個数が
あらかじめ指定した値Thc(例えば用紙高さの1/
5)以上の場合、その矩形領域は求める用紙の領域であ
るとする。個数がThc未満の場合は、さらに矩形左端
中点より右方向に直線走査して白画素の個数を調べ、個
数がThc以上の場合には、その矩形領域は求める用紙
の領域であるとする(図12)。個数がThc未満の場
合は、その矩形領域内に求める用紙の領域は存在しない
とする。領域全体を走査する場合に比べ、高速に用紙が
存在するかどうかの判断が可能である。なお、走査方向
については、矩形右上より左下方向、矩形右下より左上
方向、矩形左下より右上方向、矩形上端中点より下方向
といった様々な走査を組み合わせることで領域の検出漏
れを減らすことも可能である。
【0022】上記のようにして抽出された複数の矩形領
域内に存在する画像データは、図示しない文字認識部に
導入され、各領域単位に文字認識が実行されて認識結果
は図示しない住所録メモリなどに記憶されることとな
る。
【0023】
【発明の効果】以上のように本発明は、複数枚の定型用
紙を画像として一度に読み取り、一枚一枚の領域を自動
的かつ高速に抽出し、抽出した領域のデータを文字認識
処理することで、複数名刺などの定形用紙に印刷された
文字を一度に認識処理させることが可能である。
【0024】特に請求項1に係る画像処理装置は、あら
かじめ定めたしきい値を元にして、縦方向・横方向の区
間を統合あるいは削除することにより、適切な大きさの
領域を抽出するとともにノイズ領域を無視することがで
きる。
【0025】また請求項2に係る画像処理装置は、用紙
が接近し、周辺分布を用いて複数の用紙の領域を一枚ず
つに分離できない場合においても、あらかじめ定めた用
紙の大きさを元にして、用紙一枚一枚の領域を抽出する
ことができる。
【0026】さらに請求項3に係る画像処理装置は、周
辺分布を用いて求めた領域に実際に用紙が存在するかど
うかを確認するため、必要最小限の直線走査を行なうこ
とにより、処理を高速にできる。
【図面の簡単な説明】
【図1】本発明を適用した一実施例システムの構成を示
す機能ブロック図である。
【図2】本発明を適用した一実施例システムの動作を示
すフローチャート図である。
【図3】本発明を適用した一実施例システムの動作を示
すフローチャート図である。
【図4】本発明を適用した一実施例システムの動作を示
すフローチャート図である。
【図5】本発明を適用した一実施例システムの動作を示
すフローチャート図である。
【図6】本発明を適用した一実施例システムの動作を示
すフローチャート図である。
【図7】本発明を適用した一実施例システムの動作を示
すフローチャート図である。
【図8】本発明を適用した一実施例システムの動作を示
すフローチャート図である。
【図9】本発明を適用した一実施例システムの動作を示
すフローチャート図である。
【図10】本発明を適用した一実施例システムの動作を
示すフローチャート図である。
【図11】区間座標用メモリへの値の格納方法の一実施
例を示す図である。
【図12】矩形領域内の走査方法の一実施例を示す図で
ある。
【符号の説明】
S スキャナ M1 入力画像用メモリ M2,M3 周辺分布用メモリ M4,M5 区間座標用メモリ R プログラム用ROM P 制御部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力画像の周辺分布を用いて該画像を縦
    方向及び横方向にそれぞれ区間分割し、分割された区間
    とあらかじめ定めた値とを比較して区間を統合あるいは
    削除した後、区間で規定される画像領域のうち画素変化
    がある画像領域を抽出する手段を備えることを特徴とす
    る画像処理装置。
  2. 【請求項2】 請求項1記載の画像処理装置において、
    求められた区間の長さが所定値の整数倍の場合に、あら
    かじめ定めた値の長さとなる複数個の区間に分割する手
    段を備えることを特徴とする画像処理装置。
  3. 【請求項3】 請求項1及び2記載の画像処理装置にお
    いて、分割された区間で規定される領域内の画素変化の
    判別を領域内の複数回の直線走査によって行なう手段を
    備えることを特徴とする画像処理装置。
JP28717995A 1995-11-06 1995-11-06 画像処理装置及び画像処理方法 Expired - Fee Related JP3299873B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28717995A JP3299873B2 (ja) 1995-11-06 1995-11-06 画像処理装置及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28717995A JP3299873B2 (ja) 1995-11-06 1995-11-06 画像処理装置及び画像処理方法

Publications (2)

Publication Number Publication Date
JPH09128478A true JPH09128478A (ja) 1997-05-16
JP3299873B2 JP3299873B2 (ja) 2002-07-08

Family

ID=17714108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28717995A Expired - Fee Related JP3299873B2 (ja) 1995-11-06 1995-11-06 画像処理装置及び画像処理方法

Country Status (1)

Country Link
JP (1) JP3299873B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003016424A (ja) * 2001-07-04 2003-01-17 Pfu Ltd 画像処理装置および画像処理装置の制御方法ならびにそのプログラム
JP6458239B1 (ja) * 2017-08-29 2019-01-30 株式会社マーケットヴィジョン 画像認識システム
JP2019046484A (ja) * 2018-10-16 2019-03-22 株式会社マーケットヴィジョン 画像認識システム
JP2021096800A (ja) * 2019-12-19 2021-06-24 富士フイルムビジネスイノベーション株式会社 画像処理装置及び画像処理プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003016424A (ja) * 2001-07-04 2003-01-17 Pfu Ltd 画像処理装置および画像処理装置の制御方法ならびにそのプログラム
JP6458239B1 (ja) * 2017-08-29 2019-01-30 株式会社マーケットヴィジョン 画像認識システム
JP2019045909A (ja) * 2017-08-29 2019-03-22 株式会社マーケットヴィジョン 画像認識システム
JP2019046484A (ja) * 2018-10-16 2019-03-22 株式会社マーケットヴィジョン 画像認識システム
JP2021096800A (ja) * 2019-12-19 2021-06-24 富士フイルムビジネスイノベーション株式会社 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
JP3299873B2 (ja) 2002-07-08

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
JP3338537B2 (ja) 画像傾き検出装置
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP2002056398A (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
US5592574A (en) Method and apparatus for expansion of white space in document images on a digital scanning device
JPH0418351B2 (ja)
JPH09128478A (ja) 画像処理装置
JP2002199179A (ja) 傾き検出装置
JP3502130B2 (ja) 表認識装置および表認識方法
JP2007249580A (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
JPS6343788B2 (ja)
JPS6327752B2 (ja)
JPH08185475A (ja) 画像認識装置
JP2931041B2 (ja) 表内文字認識方法
JP2827227B2 (ja) 文字認識方法
JP3668026B2 (ja) 出版物電子化処理装置
JP3031565B2 (ja) 表領域判定方法
KR930008060B1 (ko) 문서 인식방법
JP2954218B2 (ja) 画像処理方法及び装置
JPH03126188A (ja) 文字認識装置
JPH0289193A (ja) パターン変換方式
JP2991761B2 (ja) 行切出し方法
JPS63131287A (ja) 文字認識方式
JPH05135202A (ja) 文書画像読み取り装置
JPH09223189A (ja) 表処理方法および表処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees