JPH1196296A - 帳票イメージ処理方法および装置 - Google Patents

帳票イメージ処理方法および装置

Info

Publication number
JPH1196296A
JPH1196296A JP9254665A JP25466597A JPH1196296A JP H1196296 A JPH1196296 A JP H1196296A JP 9254665 A JP9254665 A JP 9254665A JP 25466597 A JP25466597 A JP 25466597A JP H1196296 A JPH1196296 A JP H1196296A
Authority
JP
Japan
Prior art keywords
image data
area
form image
character
ruled line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9254665A
Other languages
English (en)
Inventor
Kimitomo Kobayashi
公知 小林
Osamu Nakamura
修 中村
Kenji Ogura
健司 小倉
Akira Suzuki
章 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP9254665A priority Critical patent/JPH1196296A/ja
Publication of JPH1196296A publication Critical patent/JPH1196296A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【課題】 イラストや写真等のイメージは原イメージを
保存しつつ、精度の高い帳票読み取りを可能とする帳票
イメージ処理方法および装置を提供する。 【解決手段】 まず、受信帳票イメージデータを保存用
イメージメモリ部1と認識用イメージメモリ部2に格納
する。認識用の帳票イメージデータに対し、白ノイズ除
去部3で黒領域の白抜けを埋める。傾斜補正部4は、こ
の帳票イメージデータの横罫線を用いた傾斜検出を行
い、認識用の帳票イメージデータと保存用イメージメモ
リ部1の帳票イメージデータの傾斜補正を行う。書式解
析部5は、傾斜補正した認識用の帳票イメージデータの
罫線を基に認識用帳票イメージデータの文字領域を切り
出し、イメージ記入欄を検出して保存用の帳票イメージ
データからイメージ領域を切り出す。切り出した文字領
域に対しては、線分つなぎ・黒ノイズ除去部6で、線分
のつなぎ処理とノイズ除去処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識で使用す
る帳票がファクシミリ等のハーフトーンまたは写真モー
ドで入力された場合にも精度の高い文字認識と正確なイ
メージ領域の切り出し処理を可能とする帳票イメージ処
理方法および装置に関するものである。
【0002】
【従来の技術】従来の帳票読み取りシステムでは、ファ
クシミリやスキャナで入力した2値の帳票イメージデー
タを対象に文字領域の切り出し・認識およびイメージ領
域の切り出し等の処理を行っていた。しかし、2値入力
では、線図形のイメージデータはきれいに送れるが、写
真等の中間調イメージデータはつぶれやかすれが発生し
てきれいに送信出来ない。そこで写真等を送信する場合
にはハーフトーンまたは写真モード(擬似中間調)入力
の必要が出てくる。しかし、ハーフトーンまたは写真モ
ードで入力した帳票イメージデータは、帳票全体にハー
フトーン処理が施され、写真等にはきれいに見えるが、
図6に示すように文字記入欄およびイメージ記入欄等の
罫線や記入文字等の線分に白抜けや、線分周辺へのノイ
ズが発生する。このため、本来2値で入力することを前
提とした処理系では文字領域、イメージ領域を示す罫線
が正確に検出できない問題が発生する。また、仮に罫線
が検出できた場合でも文字線分が切れるため、正確な文
字認識が出来ないという問題があった。この対策とし
て、ファクシミリ等でも線図形領域と写真等の中間調イ
メージ領域を検出し、各領域に適した2値化処理を行
い、線図形、写真等の混在イメージデータをきれいに送
信出来る機能を持つファクシミリを利用する方法もあ
る。
【0003】
【発明が解決しようとする課題】しかしながら、上記し
た線図形領域と写真等の中間調イメージ領域を検出し、
各領域に適した2値化処理を行い、線図形、写真等の混
在イメージデータを送信する機能は全てのファクシミリ
に存在するわけではないし、必ずしも線図形と写真等の
領域を正確に検出できないため、各領域に適した2値化
は行われないという問題がある。
【0004】本発明は、上記した問題を解決するため、
ハーフトーンまたは写真モードで入力された帳票イメー
ジデータに対して、イラストや写真等のイメージは原イ
メージを保持しつつ精度の高い帳票読み取りを可能とす
る帳票イメージ処理方法および装置を提供することを課
題とするものである。
【0005】
【課題を解決するための手段】上記の課題を解決するた
め、本発明は、罫線枠を配置した帳票イメージデータを
入力する処理方法において、ファクシミリやスキャナで
入力された帳票イメージデータを認識用メモリと保存用
メモリに格納する過程と、前記認識用メモリに格納され
た帳票イメージデータの黒領域に生じる白抜けを埋める
過程と、前記白抜けを埋めた帳票イメージデータの罫線
を利用して認識対象となる文字領域とイメージ領域の検
出を行う過程と、前記検出した文字領域を前記白抜けを
埋めた帳票イメージデータから切り出すとともに前記検
出したイメージ領域の位置に対応する前記保存用メモリ
の帳票イメージデータの領域を切り出す過程と、を有す
ることを特徴とする。
【0006】また、前記切り出す過程の後に、前記切り
出した文字領域に対して線分のつなぎ処理およびノイズ
除去処理を行う過程を有することを特徴とする。
【0007】また、前記検出を行う過程では、認識対象
となる文字領域とイメージ領域の検出を行う前に、前記
白抜けを埋めた帳票イメージデータまたはこれと前記保
存用メモリの帳票イメージデータの傾斜を補正すること
を特徴とする。
【0008】あるいは、罫線枠を配置した帳票イメージ
データを入力する処理装置において、ファクシミリやス
キャナで入力された帳票イメージデータを認識用メモリ
と保存用メモリに格納する手段と、前記認識用メモリに
格納された帳票イメージデータの黒領域に生じる白抜け
を埋める手段と、前記白抜けを埋めた帳票イメージデー
タの罫線を利用して認識対象となる文字領域とイメージ
領域の検出を行う手段と、前記検出した文字領域を前記
白抜けを埋めた帳票イメージデータから切り出す手段
と、前記検出したイメージ領域の位置に対応する前記保
存用メモリの帳票イメージデータの領域を切り出す手段
と、を有することを特徴とする。
【0009】また、前記切り出された文字領域に対して
線分のつなぎ処理とノイズを除去する手段を有すること
を特徴とする。
【0010】また、前記検出を行う手段は、認識対象と
なる文字領域とイメージ領域の検出を行う前に、前記白
抜けを埋めた帳票イメージデータまたはこの白抜けを埋
めた帳票イメージデータと前記保存用メモリの帳票イメ
ージデータの傾斜を補正する手段を有することを特徴と
する。
【0011】本発明では、罫線および記入線分の白抜け
を埋めた帳票イメージデータに対して書式解析を行い、
文字領域を切り出し、イメージ領域の位置を検出する。
そして、切り出した文字領域はさらに線分のつなぎとノ
イズ除去処理を施して文字認識を行い、イメージ領域に
対しては白抜けの埋めや線分のつなぎ処理を施していな
い原帳票イメージデータからイメージデータの切り出し
を行う。これにより、従来処理不能であったハーフトー
ン入力帳票イメージデータの書式解析を可能とし、文字
認識精度を向上させるとともに、イメージ記入欄のハー
フトーンイメージデータも入力状態を保持して切り出せ
るようにした点が従来技術と大きく異なる。さらに、印
刷された罫線情報に対する処理と、記入文字に対する処
理を分けることで、必要な部分に対する適切な処理を可
能にするとともに処理の高速化も可能としている。
【0012】具体的には、まず受信帳票イメージデータ
をコピーして保存用帳票イメージデータと認識用帳票イ
メージデータを作成する。そして、認識用帳票イメージ
データに対して黒領域に発生する白抜けを埋めることで
横罫線を用いた傾斜検出を可能とする。次に、検出した
傾斜に基づいて認識用帳票イメージデータの傾斜補正ま
たはこれに加えて受信帳票イメージデータの傾斜補正を
行う。その後、傾斜補正した認識用帳票イメージデータ
の縦横罫線を基に、あらかじめ登録してある帳票書式に
従い認識用帳票イメージデータの文字領域を切り出し、
線分のつなぎとノイズ除去処理を行う。また、イメージ
記入欄の場合は、保存用帳票イメージデータのイメージ
記入欄からイメージ領域を切り出す。このようにするこ
とで、罫線を利用した傾斜補正や書式解析を可能にし、
かつ罫線および記入文字等の線分は帳票読み取りに適し
たイメージデータに変換して精度の高い文字認識を可能
にし、写真等のようにハーフトーンまたは写真モード入
力が適しているイメージ記入欄は入力時の原イメージを
保持したイメージ領域の切り出しを可能にする。
【0013】
【発明の実施の形態】以下、本発明の実施の形態につい
て図を用いて詳細に説明する。
【0014】図1は、本発明の一実施形態例を示すブロ
ック図であり、1は受信帳票イメージデータを保存して
おく保存用イメージメモリ部、2は受信帳票イメージデ
ータを格納する認識用イメージメモリ部、3は認識用イ
メージメモリ部2に格納された受信帳票イメージデータ
の罫線等に対して、白抜けを埋める白ノイズ除去部、4
は認識用イメージメモリ部2に格納された受信帳票イメ
ージデータの横罫線を利用して認識用イメージデータの
傾斜補正をするとともに、保存用イメージメモリ部1に
格納された受信帳票イメージデータの傾斜補正を行う傾
斜補正部、5は認識用イメージメモリ部2に格納された
受信帳票イメージデータを解析して文字記入欄およびイ
メージ記入欄の座標を検出し、文字領域およびイメージ
領域の切り出しを行う書式解析部、6は書式解析部5で
切り出された文字領域に対して線分のつなぎと黒ノイズ
除去処理を行う線分つなぎ・黒ノイズ除去部、7は線分
つなぎ・黒ノイズ除去部6で処理された文字領域を認識
する文字認識部、8は文字認識結果およびイメージ領域
の切り出し結果を外部装置に合わせて編集する結果編集
部である。
【0015】次に、図1の構成の動作例を説明する。
【0016】まず、受信帳票イメージデータを保存用イ
メージメモリ部1と認識用イメージメモリ部2格納す
る。認識用イメージメモリ部2は受信帳票イメージデー
タの格納を完了すると白ノイズ除去部3に白ノイズ除去
指示を行う。白ノイズ除去指示を受けた白ノイズ除去部
3は、図2で説明する方法で認識用イメージメモリ部2
に格納された受信帳票イメージデータの黒領域の白抜け
を埋める。
【0017】白ノイズ除去処理が完了すると、傾斜補正
部4に傾斜補正を指示する。傾斜補正の指示を受けた傾
斜補正部4は、保存用イメージメモリ部1の受信帳票イ
メージデータに対して特願平6−249201号「帳票
入力方法及び装置」または特願平7−247644号
「イメージデータ入力処理方法およびその装置」などに
示すように傾斜を検出し、傾斜に応じてイメージを回転
させることで傾斜補正を行う。これらの傾斜の検出方法
の例は、水平方向に角度を変えながら走査してそれぞれ
での黒画素をカウントし、そのカウント値が最大となる
角度を傾斜角とするものである。また、このとき検出し
た傾斜を用いて保存用イメージメモリ部1の受信帳票イ
メージデータの傾斜補正を行う。
【0018】傾斜補正が完了すると、書式解析部5に書
式解析指示を行う。書式解析指示を受けた書式解析部5
は、図3および図4で説明する方法で文字記入欄とイメ
ージ記入欄の罫線を検出し、検出した罫線座標とあらか
じめ登録してある書式定義情報に従い、文字領域とイメ
ージ領域の切り出しを行う。そして、文字領域の場合は
線分つなぎ・黒ノイズ除去部6へ転送し、イメージ領域
の場合は結果編集部8へ転送する。文字領域を受信した
線分つなぎ・黒ノイズ除去部6は、図5で説明する方法
で切れた線分のつなぎ処理および黒ノイズ除去処理を行
い、これら処理を行った文字領域を文字認識部7へ転送
する。文字領域を受信した文字認識部7は文字認識を行
い、認識結果の文字コードを結果編集部8へ渡す。結果
編集部8は、転送されてきた文字コードとイメージ領域
を編集し、外部インタフェースに合わせて編集し出力す
る。
【0019】図2は白ノイズ除去の方法例を示した図で
あり、図2(a),(b)は白ノイズ除去条件を示した
図で、10は水平3画素の中心が白画素であるという条
件を示した水平方向の白ノイズ除去条件、11は垂直3
画素の中心が白画素であるという条件を示した垂直方向
の白ノイズ除去条件、図2(c)は図6の例に対する白
ノイズ除去後のイメージデータの例を示した図である。
【0020】次に、図2の動作例を説明する。まず、受
信帳票イメージデータ全域に対して、水平方向の白ノイ
ズ除去条件10および垂直方向の白ノイズ除去条件11
で受信帳票イメージデータの全画素に対して走査しなが
ら、白ノイズ除去条件10,11に合った場所の中心白
画素を黒画素に置き換える。このような処理を全画素に
対して行うことで、図6に示すような受信帳票イメージ
データは図2(c)に示すようなイメージデータに変化
し、罫線部分の白抜けを除去出来る。
【0021】なお、本例では白ノイズ除去条件として白
画素の上下または左右の1画素が黒という条件にした
が、上下左右の4画素うち2画素が黒の場合に中心の白
画素を黒画素に変換しても類似の処理が可能である。ま
た、大きな白ノイズを処理するためには、白ノイズ条件
を変える必要がある。
【0022】図3、図4は書式解析の方法例を示す図で
ある。
【0023】このうち図3は文字記入欄およびイメージ
記入欄の検出領域を検出する方法例を示した図で、20
は傾斜補正後の受信帳票イメージデータ、21は帳票の
有効領域、22は氏名等を記入する文字記入欄、23は
イラストまたは写真を記入または添付するイメージ記入
欄、24は基準横罫線を検出するための横罫線しきい
値、25,26は横罫線しきい値24以上の横罫線黒画
素分布、27は基準縦罫線を検出するための縦罫線しき
い値、28,29は縦罫線しきい値27以上の縦罫線黒
画素分布、Y0,Y1は横罫線黒画素分布25,26の
副走査座標、X0,X1は縦罫線黒画素分布28,29
の主走査座標である。
【0024】また、図4(a)は文字領域の切り出し方
法例を示した図であり、30は文字記入欄22を示す罫
線の検出領域、31は文字記入欄22を示す横罫線を検
出するための横罫線しきい値、32は検出領域30にお
ける横罫線しきい値31以上の横罫線黒画素分布、33
は文字記入欄22を示す縦罫線を検出するための縦罫線
しきい値、34は検出領域30における縦罫線しきい値
33以上の縦罫線黒画素分布、35は文字記入欄22か
ら切り出される文字領域、C0〜C2は横罫線黒画素分
布32の副走査座標、D0〜D7は縦罫線黒画素分布3
4の主走査座標である。
【0025】また、図4(b)はイメージ領域の切り出
し方法例を示した図であり、36はイメージ記入欄23
の検出領域、37はイメージ記入欄23の横罫線を検出
するための横罫線検出しきい値、38は検出領域36に
おける横罫線しきい値37以上の横罫線黒画素分布、3
9はイメージ記入欄23の縦罫線検出するための縦罫線
検出しきい値、40は縦罫線しきい値39以上の縦罫線
黒画素分布、41はイメージ記入欄23から切り出され
るイメージ領域、E0,E1は横罫線黒画素分布38の
副走査座標、F0,F1は縦罫線黒画素分布40の主走
査座標である。
【0026】ただし、有効領域21の罫線、文字記入欄
22の罫線、イメージ記入欄23の罫線は矩形であり、
各辺は帳票の縦と横に平行とする。
【0027】次に、図3および図4の動作例を説明す
る。
【0028】まず、図3に示すように、文字記入欄22
およびイメージ記入欄23の検出領域を検出するため
に、主走査方向および副走査方向に黒画素分布をとり、
横罫線しきい値24以上の横罫線黒画素分布25,26
と横罫線しきい値27以上の縦罫線黒画素分布28,2
9を得る。そして、横罫線黒画素分布25と縦罫線黒画
素分布28の副走査座標Y0と主走査座標X0を得るこ
とで帳票の有効領域21の原点座標を得る。そして、あ
らかじめ登録してある書式定義情報(第1番目は2行8
列の文字記入欄22で有効領域21の原点X0,Y0か
ら一定の位置にある文字記入欄検出領域30内に存在
し、横罫線しきい値31、縦罫線しきい値33で、第2
番目はイメージ記入欄23でイメージ記入欄有効領域2
1の原点X0,Y0から一定の位置にある検出領域36
内に存在し、横罫線しきい値37、縦罫線しきい値39
が登録)より、副走査座標Y0と主走査座標X0を有効
領域21の原点として示される文字記入欄検出領域29
とイメージ記入欄検出領域36の位置を知ることが出来
る。
【0029】そして、図4(a)に示すように、文字記
入欄検出領域30に対して主走査方向と副走査方向に黒
画素分布をとる。そして、横罫線しきい値31以上の黒
画素分布32の副走査座標C0〜C2と縦罫線しきい値
32以上の黒画素分布34の主走査座標D1〜D7を得
る。ただし、このとき横罫線しきい値30は文字数に、
縦罫線しきい値32は行数に比例した値で書式定義情報
に登録してある。このように検出した副走査座標C0〜
C3と主走査座標D0〜D7で、文字記入欄22の各文
字記入枠の角の座標が示される。そして、各文字記入枠
の角の座標より罫線幅を考慮した内側の領域を切り出す
ことで、文字領域35を切り出すことが出来る。
【0030】次に、図4(b)に示すようにイメージ記
入欄検出領域36に対して主走査方向と副走査方向に黒
画素分布をとる。そして、横罫線しきい値37以上の黒
画素分布37の副走査座標E0,E1と縦罫線しきい値
39以上の黒画素分布40の主走査座標F0,F2を得
る。このように検出した副走査座標E0,E1と主走査
座標F0〜F1で、イメージ記入欄23の角の座標が示
される。そして、この角の座標より罫線幅を考慮した内
側の領域に対応するイメージ領域41を保存用イメージ
メモリ部1から切り出すことで、受信帳票イメージデー
タのイメージ領域41を切り出すことが出来る。
【0031】なお、本例では1種類の受信帳票の処理方
法を示したが、複数種類の受信帳票を処理する場合は特
願平7−115924号「帳票書式識別方法及び装置」
に示す方法などで受信帳票の種類を識別して本説明のよ
うに文字領域35およびイメージ領域41を切り出すこ
とが出来る。この受信帳票の識別方法の例は、予め帳票
の種類毎に罫線相互の間隔に関するデータを保持してお
いて、受信帳票の罫線の間隔をそれらの保持データと比
較することで受信帳票の種類を識別するものである。さ
らに、本例ではイメージ領域41の切り出し、加工を容
易にするため、保存用イメージメモリ部1に格納した受
信帳票イメージデータに対して傾斜補正を行ったが、イ
メージ記入欄23の位置を傾斜が判明しているため、傾
斜補正を行わないでイメージ領域41を切り出すことも
可能である。
【0032】図5は線分つなぎ処理およびノイズ除去の
方法の例を示した図である。
【0033】このうち、図5(a)〜(d)は線分のつ
なぎ処理の条件を示した図で、50は斜め右のつなぎ条
件、51は斜め左のつなぎ条件、52は水平2画素のつ
なぎ条件、53は垂直2画素のつなぎ条件である。
【0034】また、図5(e)〜(h)は黒ノイズ除去
条件を示した図で、54は1画素の黒ノイズ除去条件、
55は2画素の黒ノイズ除去条件、56は3画素の黒ノ
イズ除去条件、57は4画素の黒ノイズ除去条件であ
る。
【0035】また、図5(i)は、図2(c)の例に対
する線分つなぎおよび黒ノイズ除去処理後のイメージデ
ータを示した図である。
【0036】次に、図5の動作例を説明する。切り出さ
れた文字領域34に対して、図5(a)〜(d)で示し
た斜め右のつなぎ条件50、斜め左のつなぎ条件51、
水平2画素のつなぎ条件52、垂直2画素のつなぎ条件
53で全域を走査し、斜め右のつなぎ条件50、斜め左
のつなぎ条件51に合った場所に対しては3画素の中心
の白画素を黒画素に、水平2画素のつなぎ条件52、垂
直2画素のつなぎ条件53に合った場所に対しては黒画
素で挟まれた2画素の白を黒画素に置き換える。次に、
図5(e)〜(h)で示した黒ノイズ除去条件54〜5
7で文字領域34を走査し、周囲が白画素で囲まれた1
〜4画素の孤立点を検出した場合は、その孤立点を白画
素に変換する。このような処理を行うことで、図2
(c)に示すような文字パタンは図5(i)に示すよう
な文字パタンに変化し、線分の切れとノイズの減少させ
た文字パタンに修正することが出来る。
【0037】なお、本例では線分つなぎ処理として45
度斜め1画素と水平および垂直の2画素のつなぎと最大
4画素の孤立黒画素の除去を行う方法を示したが、これ
らは文字の大きさ、ノイズの大きさにより変化するもの
であり、類似の処理が行えればよく、この方法に限定す
るものではない。
【0038】
【発明の効果】以上説明したように、本発明によれば、
ハーフトーンまたは写真モードで受信した帳票イメージ
データに対し、罫線および文字領域を白ノイズ除去処理
で白抜けを埋めるため、あるいは、白ノイズ除去に加え
て文字領域を線分つなぎとノイズ除去処理で線分の切れ
の救済およびノイズの除去を行うため、さらにはそれら
に加えて罫線の傾斜補正を行うため、罫線検出精度は2
値入力の罫線検出精度と同等となり、文字領域はかすれ
やノイズが大幅に減少されるため、精度の高い文字認識
が可能となる利点がある。また、イメージ領域は白ノイ
ズ除去処理や線分つなぎと黒ノイズ除去処理を行わない
帳票イメージデータからの切り出しを行うため、受信帳
票イメージデータを損なうことなく切り出しが可能とな
る利点がある。さらに、罫線検出には罫線検出に必要な
白ノイズ除去処理のみを、また文字領域には線分の切れ
や黒ノイズに対する線分つなぎ処理を行うようにしたた
め、線分つなぎ処理の悪影響を罫線に及ぼさず、かつ処
理時間のかかる線分つなぎと黒ノイズ除去処理を必要な
領域のみにほどこすことが出来る利点がある。
【図面の簡単な説明】
【図1】本発明の一実施形態例を示したブロック図であ
る。
【図2】上記実施形態例での白ノイズ除去の方法例を示
した図であり、(a)〜(b)は白ノイズ除去条件の例
を示した図、(c)は白ノイズ除去後のイメージデータ
の例を示した図である。
【図3】上記実施形態例での書式解析の方法例を示す図
であり、文字記入欄およびイメージ記入欄の検出領域を
検出する方法例を示した図である。
【図4】上記実施形態例での書式解析の方法例を示す図
であり、(a)は文字領域の切り出し方法例を示した
図、(b)はイメージ領域の切り出し方法例を示した図
である。
【図5】上記実施形態例での線分つなぎ処理およびノイ
ズ除去の方法の例を示した図であり、(a)〜(d)は
線分つなぎ処理の条件の例を示した図、(e)〜(h)
は黒ノイズ除去条件の例を示した図、(i)は線分つな
ぎおよび黒ノイズ除去処理後のイメージデータの例を示
した図である。
【図6】ハーフトーン入力イメージデータの例を示した
図である。
【符号の説明】
1…保存用イメージメモリ部 2…認識用イメージメモリ部 3…白ノイズ除去部 4…傾斜補正部 5…書式解析部 6…線分つなぎ・黒ノイズ除去部 7…文字認識部 8…結果編集部 10,11…白ノイズ除去条件 20…傾斜補正後の受信帳票イメージデータ 21…帳票有効領域 22…文字記入欄 23…イメージ記入欄 24…横罫線しきい値 25〜26…横罫線の黒画素分布 27…縦罫線しきい値 28〜29…縦罫線の黒画素分布 Y0,Y1…横罫線黒画素分布25,26の副走査座標 X0、X1…縦罫線黒画素分布28,29の主走査座標 30…文字記入欄検出領域 31…横罫線しきい値 32…横罫線黒画素分布 33…縦罫線しきい値 34…縦罫線黒画素分布 35…文字領域 C0〜C2…横罫線黒画素分布32の副走査座標 D0〜D7…縦罫線黒画素分布34の主走査座標 36…イメージ記入欄検出領域 37…横罫線検出しきい値 38…横罫線の黒画素分布 39…縦罫線検出しきい値 40…縦罫線の黒画素分布 41…イメージ領域 E0,E1…横罫線黒画素分布38の副走査座標 F0,F1…縦罫線黒画素分布40の主走査座標 50…斜め右のつなぎ条件 51…斜め左のつなぎ条件 52…水平2画素のつなぎ条件 53…垂直2画素のつなぎ条件 54…1画素の黒ノイズ除去条件 55…2画素の黒ノイズ除去条件 56…3画素の黒ノイズ除去条件 57…4画素の黒ノイズ除去条件
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴木 章 東京都新宿区西新宿3丁目19番2号 日本 電信電話株式会社内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 罫線枠を配置した帳票イメージデータを
    入力する処理方法において、 ファクシミリやスキャナで入力された帳票イメージデー
    タを認識用メモリと保存用メモリに格納する過程と、 前記認識用メモリに格納された帳票イメージデータの黒
    領域に生じる白抜けを埋める過程と、 前記白抜けを埋めた帳票イメージデータの罫線を利用し
    て認識対象となる文字領域とイメージ領域の検出を行う
    過程と、 前記検出した文字領域を前記白抜けを埋めた帳票イメー
    ジデータから切り出すとともに前記検出したイメージ領
    域の位置に対応する前記保存用メモリの帳票イメージデ
    ータの領域を切り出す過程と、 を有することを特徴とする帳票イメージ処理方法。
  2. 【請求項2】 前記切り出す過程の後に、 前記切り出した文字領域に対して線分のつなぎ処理およ
    びノイズ除去処理を行う過程を有する、 ことを特徴とする請求項1に記載の帳票イメージ処理方
    法。
  3. 【請求項3】 前記検出を行う過程では、 認識対象となる文字領域とイメージ領域の検出を行う前
    に、前記白抜けを埋めた帳票イメージデータまたはこれ
    と前記保存用メモリの帳票イメージデータの傾斜を補正
    する、 ことを特徴とする請求項1または請求項2に記載の帳票
    イメージ処理方法。
  4. 【請求項4】 罫線枠を配置した帳票イメージデータを
    入力する処理装置において、 ファクシミリやスキャナで入力された帳票イメージデー
    タを認識用メモリと保存用メモリに格納する手段と、 前記認識用メモリに格納された帳票イメージデータの黒
    領域に生じる白抜けを埋める手段と、 前記白抜けを埋めた帳票イメージデータの罫線を利用し
    て認識対象となる文字領域とイメージ領域の検出を行う
    手段と、 前記検出した文字領域を前記白抜けを埋めた帳票イメー
    ジデータから切り出す手段と、 前記検出したイメージ領域の位置に対応する前記保存用
    メモリの帳票イメージデータの領域を切り出す手段と、 を有することを特徴とする帳票イメージ処理装置。
  5. 【請求項5】 前記切り出された文字領域に対して線分
    のつなぎ処理とノイズを除去する手段を有する、 ことを特徴とする請求項4に記載の帳票イメージ処理装
    置。
  6. 【請求項6】 前記検出を行う手段は、 認識対象となる文字領域とイメージ領域の検出を行う前
    に、前記白抜けを埋めた帳票イメージデータまたはこれ
    と前記保存用メモリの帳票イメージデータの傾斜を補正
    する手段を有する、 ことを特徴とする請求項4または請求項5に記載の帳票
    イメージ処理装置。
JP9254665A 1997-09-19 1997-09-19 帳票イメージ処理方法および装置 Pending JPH1196296A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9254665A JPH1196296A (ja) 1997-09-19 1997-09-19 帳票イメージ処理方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9254665A JPH1196296A (ja) 1997-09-19 1997-09-19 帳票イメージ処理方法および装置

Publications (1)

Publication Number Publication Date
JPH1196296A true JPH1196296A (ja) 1999-04-09

Family

ID=17268173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9254665A Pending JPH1196296A (ja) 1997-09-19 1997-09-19 帳票イメージ処理方法および装置

Country Status (1)

Country Link
JP (1) JPH1196296A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003008899A (ja) * 2001-06-19 2003-01-10 Fuji Xerox Co Ltd 画像処理装置
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
JP2007233489A (ja) * 2006-02-27 2007-09-13 Nec Engineering Ltd 光学式記号読取装置
JP2010244472A (ja) * 2009-04-09 2010-10-28 Hitachi Omron Terminal Solutions Corp 画像処理装置及び方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
JP2003008899A (ja) * 2001-06-19 2003-01-10 Fuji Xerox Co Ltd 画像処理装置
JP2007233489A (ja) * 2006-02-27 2007-09-13 Nec Engineering Ltd 光学式記号読取装置
JP2010244472A (ja) * 2009-04-09 2010-10-28 Hitachi Omron Terminal Solutions Corp 画像処理装置及び方法

Similar Documents

Publication Publication Date Title
US7965894B2 (en) Method for detecting alterations in printed document using image comparison analyses
JP4261005B2 (ja) 領域ベースのイメージ2値化システム
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
KR101224936B1 (ko) 화상 처리 장치, 화상 형성 장치, 및 컴퓨터 판독 가능한 매체
CA2397872C (en) Correction of distortions in form processing
JPH1196296A (ja) 帳票イメージ処理方法および装置
JP4420440B2 (ja) 画像処理装置、画像処理方法、文字認識装置、プログラムおよび記録媒体
JP3303246B2 (ja) 画像処理装置
JPH06131495A (ja) 画像情報抽出方式
JP2639165B2 (ja) 文字切出装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3391987B2 (ja) 帳票認識装置
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JPH08321942A (ja) 画像処理装置及び分割図面の画像接合方法
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JP3100619B2 (ja) 写真領域抽出装置
JP3020293B2 (ja) 属性判別方法
JP2931041B2 (ja) 表内文字認識方法
JP3381803B2 (ja) 傾き角検出装置
JP2853141B2 (ja) 画像領域識別装置
JPH0623983B2 (ja) 歪補正装置
CN113971638A (zh) 一种实现文档还原的方法、装置、计算机存储介质及终端
JPH05274472A (ja) 画像認識装置
JP2004240500A (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JPH064706A (ja) 画像処理装置