JPH1185900A - 帳票識別方法、機械読み取り可能媒体及び文字認識装置 - Google Patents

帳票識別方法、機械読み取り可能媒体及び文字認識装置

Info

Publication number
JPH1185900A
JPH1185900A JP9237982A JP23798297A JPH1185900A JP H1185900 A JPH1185900 A JP H1185900A JP 9237982 A JP9237982 A JP 9237982A JP 23798297 A JP23798297 A JP 23798297A JP H1185900 A JPH1185900 A JP H1185900A
Authority
JP
Japan
Prior art keywords
ruled line
recognized
image
frequency distribution
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9237982A
Other languages
English (en)
Inventor
Goro Bessho
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP9237982A priority Critical patent/JPH1185900A/ja
Publication of JPH1185900A publication Critical patent/JPH1185900A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】同一サイズの異種類の帳票が混在していても、
帳票の種類を識別して認識できるようにする。 【解決手段】認識したい帳票のイメージを入力し(10
1)、その罫線と交差点を検出し(103,106)、
罫線の長さと交差点数を特徴量とするヒストグラムを作
成する(108)。このヒストグラムと、同様にして各
種の空の帳票のイメージより予め作成してあるヒストグ
ラムとの距離を求め(110)、最小の距離値となった
帳票の種類を判定し(112)、その帳票に対応した帳
票定義ファイル(113)の内容を利用して、認識した
い帳票のイメージに対する文字認識を行う(114)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、帳票もしくはそれ
と類似の定型文書の文字認識に係り、特に、複数種類の
帳票の識別及び文字認識に関する。
【0002】
【従来の技術】一般に、帳票もしくは類似の定型文書の
文字認識においては、予め認識対象領域を指定してお
き、その領域内について文字認識を行う。複数種類の帳
票を処理する場合には、予め帳票の種類を識別する必要
がある。
【0003】このような帳票種類の自動識別に関して
は、入力された帳票イメージのサイズを検知し、帳票の
種類毎に予め設定されている帳票イメージのサイズと突
き合わせることによって、入力帳票の種類を識別する方
法が知られている(特開平1−276384号)。
【0004】
【発明が解決しようとする課題】上記帳票識別方法は、
帳票に種類識別のための特定のマーク等を付与する必要
がない等の利点がある。しかし、帳票のサイズに着目す
る方法であるため、サイズは同じであるがデータ記入領
域等が異なる複数種類の帳票が混在する場合には、それ
らの帳票種類を識別することができない。近年、帳票等
の各種文書に用いられる用紙が標準化される傾向にある
こともあり、同一サイズの異種類帳票の自動識別の必要
性が高まっている。
【0005】本発明の目的は、サイズに違いのない異種
類の帳票も含め、帳票の種類を確実に識別できる帳票識
別方法を提供することにある。本発明のもう一つの方法
は、同一サイズの異なった帳票が混在して入力した場合
にも、帳票種類を自動識別して適切に文字認識を行う装
置を提供することにある。
【0006】
【課題を解決するための手段】本発明の帳票識別方法の
骨子は、入力した帳票の画像の罫線、又は罫線とその交
差点を認識し、認識した罫線の度数分布、又は罫線の度
数分布及び交差点の数の組と、各種帳票について予め用
意した罫線の度数分布、又は罫線の度数分布及び交差点
の数の組とを突き合わせることにより、入力された帳票
の種類を識別することである。
【0007】本発明の文字認識装置の骨子は、上に述べ
た本発明の帳票識別方法に従って認識すべき帳票の種類
を識別するための手段と、識別した帳票種類に応じた認
識対象領域等の情報を用いて、認識すべき帳票の文字認
識を行うための手段とを具備することである。
【0008】帳票には通常、データの記入枠等のための
罫線が印刷されている。帳票の種類毎に、データの記入
枠等の形状、大きさ、複雑さが相違し、したがって、罫
線の長さの度数分布と罫線の交差点の数にもかなりの違
いがある。よって、本発明によれば、サイズに違いのな
い2種類以上の帳票が混在する場合でも、帳票の種類を
確実に識別し、また、帳票の種類に適した文字認識をす
ることができる。罫線の長さの度数分布及び罫線の交差
点の数は、基本的に帳票の入力向きに影響を受けないた
め、本発明によれば、縦向き帳票を横向きに入力したり
横向き帳票を縦向きに入力した場合にも確実な帳票識別
が可能である。
【0009】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。
【0010】図1は本発明の一実施例による文字認識装
置の機能ブロック図である。この文字認識装置は、帳票
の2値画像を入力するためのイメージスキャナ等の2値
画像入力装置101と、帳票の種類の識別に関係する部
分、及び帳票定義ファイルメモリ113及び文字認識部
114からなる。帳票種類識別に関係する部分は、マス
ターイメージメモリ102、データイメージメモリ10
4、罫線認識部103、罫線メモリ105、交差点抽出
部106、交差点メモリ107、ヒストグラム作成部1
08、ヒストグラムメモリ109、距離値計算部11
0、距離値メモリ111及び帳票判定部112からな
る。
【0011】図2及び図3は、この文字認識装置の処理
フローを示すフローチャートである。図2に示す処理
は、データが書かれていない空の帳票の画像(マスター
画像)から帳票識別用ヒストグラムを作成するためのも
のである。この処理はデータの書かれた実際の帳票の処
理に先だって行われる準備処理であり、図2には明示さ
れていないが、取り扱い得る全ての種類の帳票について
繰り返される。図3に示す処理が、実際に認識すべき帳
票に対する処理である。以下、図2及び図3に示す処理
の流れに沿い、図1に示す装置構成と関連させつつ、こ
の文字認識装置における処理を説明する。
【0012】まず図2に示す準備処理について説明す
る。ある種類の帳票のマスター画像を2値画像入力装置
101により入力し、これをマスターイメージメモリ1
02に格納する(ステップS1)。このマスター画像上
の罫線を罫線認識部103によって認識する(ステップ
S2)。この罫線認識は、例えば、マスター画像を走査
し、主走査方向及び副走査方向の一定長さ以上の黒ラン
を抽出し、一定距離内の黒ランを統合し、統合後の罫線
としてふさわしい長さを持つものを罫線と認識する周知
の方法によって行ってよい。本実施例では、帳票種類の
識別精度を高めるため、実線の罫線と点線(破線)の罫
線を区別して認識する。認識された罫線のデータ、例え
ば罫線の端点座標、実線と点線の別などが罫線メモリ1
05に格納される。また、交差点抽出部106により罫
線の交差点を抽出し、その数をカウントする(ステップ
S3)。検出された交差点数は交差点メモリ107に格
納される。交差点は、罫線データのみによって抽出する
こともできるが、本実施例では交差点の抽出精度を上げ
るため、交差点抽出部106は、罫線メモリ105に得
られた罫線データに基づいて罫線の交差点を求め、その
交差点の近傍の領域についてマスターイメージメモリ1
02内の画像を参照することにより交差点であることを
確認し、確認できたものだけをカウントする。ヒストグ
ラム作成部108は、罫線メモリ105及び交差点メモ
リ107のデータを参照し、図4に示すような実線罫線
と点線罫線の長さの度数と交差点数を特徴量としたヒス
トグラムを作成する(ステップS4)。このヒストグラ
ムは、実線罫線の長さの度数分布及び点線罫線の長さの
度数分布と罫線の交差点の数を表すものである。このヒ
ストグラムの罫線長さの階級幅は例えば10画素から2
0画素の程度に選ぶことができる。作成されたヒストグ
ラムは、その帳票の種類の辞書としてヒストグラムメモ
リ109に格納される。なお、この帳票種類の認識対象
領域等が記述された帳票定義ファイルが、別途、帳票定
義ファイルメモリ113に格納される。全ての種類の帳
票のマスター画像について同様の操作が実行され、その
ヒストグラムが作成され、辞書としてヒストグラムメモ
リ109に保存される。
【0013】このような準備操作が終わると、図3に示
す、データが記入された実際の帳票の処理が可能にな
る。この実際の帳票処理においては、まず、認識すべき
データが書かれた帳票の画像(データ画像)が2値画像
入力装置101によって入力され、データイメージメモ
リ104に格納される(ステップS5)。罫線認識部1
03によって、このデータ画像の実線及び点線の罫線が
抽出され、その罫線データが罫線メモリ105に格納さ
れる(ステップS6)。また、交差点抽出部106によ
って、それら罫線の交差点が検出されてカウントされ、
交差点数が交差点メモリ107に格納される(ステップ
S7)。そして、ヒストグラム作成部108により、罫
線データと交差点数を用いて図4に示すようなヒストグ
ラムが作成され、ヒストグラムメモリ109に格納され
る(ステップS8)。ここまでは、マスター画像を扱う
場合と同様であるが、データ画像の場合にはさらに処理
が続く。
【0014】すなわち、距離値計算部110において、
ヒストグラムメモリ109を参照し、データ画像より得
られたヒストグラムと、ある帳票種類のマスター画像よ
り得られ辞書として格納されたヒストグラムとの距離を
計算し、その距離値を距離値メモリ111に格納する
(ステップS9)。ここでは、マスター画像の特徴量i
のヒストグラム値をHMi、データ画像の特徴量iのヒ
ストグラム値をHDiとして、次式による市街地(シテ
ィブロック)距離Dを計算する。
【0015】
【数1】
【0016】辞書として格納されている他の帳票のマス
ター画像のヒストグラムとの間でも同様の距離計算(ス
テップS9)を行い、全てについて計算が終わったと判
断すると(ステップS10)、帳票判定部112におい
て、距離値メモリ111内の距離値中で最小の距離値を
探し、その距離値が得られたマスター画像に対応する帳
票種類を、現在処理している帳票の種類であると判定す
る(ステップS11)。そして、文字認識装置114に
おいて、帳票判定部112によって判定された帳票種類
の帳票定義ファイルを帳票定義ファイルメモリ113よ
り読み込み、その情報から認識対象領域を決定し、その
領域についてデータイメージメモリ104内のデータイ
メージに対する文字認識を行う(ステップ12)。これ
で1枚の帳票に対する処理が完了した。
【0017】なお、以上説明した実施例では、帳票の種
類の識別のための特徴量として罫線の長さと交差点数を
用いた。その両方を用いたほうが一般に識別の精度が向
上するが、罫線の長さだけを用いることも可能である。
また、実線の罫線と破線の罫線を区別して扱ったが、そ
の区別をしないで扱うことも可能である。ただし、区別
するほうが識別精度の面で一般に有利である。
【0018】本発明は、コンピュータを用いてプログラ
ムによって実施することも可能である。そのような一実
施例を図5により説明する。図5に示すコンピュータ
は、CPU201、メモリ202、ハードディスク装置
203、イメージスキャナ204、フロッピーディスク
やCD−ROM等のディスク記録媒体206の読み書き
を行うディスクドライブ205、キーボードやマウス等
のユーザ入力装置207、ディスプレイ装置208等を
システムバス209で接続した一般的な構成のものであ
る。
【0019】本発明を実施するために、図2に示す一連
の処理ステップを実行させるためのプログラム210
と、図3に示す一連の処理ステップを実行させるための
プログラム211がメモリ202上に置かれ、CPU2
01により実行される。これらのプログラムは、例えば
ディスク記録媒体206からディスクドライブ205に
よって読み取られ直接的にメモり202にロードされる
か、あるいは、ハードディスク装置203に一旦格納さ
れ、必要な時にメモリ202にロードされる。処理に必
要なメモリ、すなわち図1に示た各メモリ102,10
4,105,107,109,111,113は、メモ
リ202上にメモリ領域として確保される。マスター画
像より作成されたヒストグラムや帳票定義ファイルは、
繰り返し利用されるものであるから、普通、ハードディ
スク装置203に保管され、必要な時にメモり202上
に確保されたヒストグラムメモリ領域及び帳票定義ファ
イルメモリ領域に読み込まれる。マスター画像又はデー
タ画像は、例えばイメージスキャナ204によって読み
取られて入力されるか、あるいは、別途に読み取られて
ディスク媒体206に記録され、これがディスクドライ
ブ205を介して入力される。帳票定義ファイルは、例
えば、ユーザー入力装置207とディスプレイ装置20
8及び適当なテキストエディタ等を利用してユーザによ
り作成されるか、あるいは別途に作成されてディスク媒
体206を経由して取り込まれる。
【0020】
【発明の効果】以上の説明から明らかなように、本発明
によれば、帳票の種類を自動識別することができる。サ
イズに違いのない帳票の種類も識別できる。縦向き帳票
を横向きに入力したり横向き帳票を縦向きに入力した場
合にも確実な帳票識別が可能である。また、帳票種類の
識別のために必要な各種帳票毎の情報を自動的に用意す
ることができる。同一サイズの異種類の帳票を混在して
入力した場合にも、帳票の種類を自動識別し、帳票種類
に応じた適切な文字認識を行う文字認識装置を実現でき
る等の効果を得られる。
【図面の簡単な説明】
【図1】本発明の一実施例による文字認識装置の機能ブ
ロック図である。
【図2】各種帳票に関するヒストグラムを用意するため
の準備処理のフローチャートである。
【図3】データが記入された帳票の種類を識別して文字
認識を行う処理のフローチャートである。
【図4】罫線の長さと交差点数のヒストグラムの説明図
である。
【図5】本発明の他の実施例を説明するためのブロック
図である。
【符号の説明】
101 2値画像入力装置 102 マスターイメージメモリ 103 罫線認識部 104 データイメージメモリ 105 罫線メモリ 106 交差点抽出部 107 交差点メモリ 108 ヒストグラム作成部 109 ヒストグラムメモリ 110 距離値計算部 111 距離値メモリ 112 帳票判定部 113 帳票定義ファイルメモリ 114 文字認識部 201 CPU 201 メモリ 203 ハードディスク装置 204 イメージスキャナ 205 ディスクドライブ 206 ディスク記録媒体 207 ユーザ入力装置 208 ディスプレイ装置 209 システムバス 210,211 プログラム

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 帳票の画像を入力する第1ステップ、該
    第1ステップにより入力された帳票の画像の罫線を認識
    する第2ステップ、該第2ステップにより認識された罫
    線の長さの度数分布を求める第3ステップ、及び、予め
    各種の帳票について用意された罫線の長さの度数分布
    と、該第3ステップで求められた度数分布とを突き合わ
    せることにより、該第1ステップにより入力された帳票
    の種類を判定する第4ステップを有することを特徴とす
    る帳票識別方法。
  2. 【請求項2】 帳票の画像を入力する第1ステップ、該
    第1ステップで入力された帳票の画像の罫線及びその交
    差点を認識する第2ステップ、該第2ステップで認識さ
    れた罫線の長さの度数分布を求める第3ステップ、及
    び、予め各種の帳票について予め用意された罫線の長さ
    の度数分布及び罫線の交差点の数の組と、該第3ステッ
    プで求められた度数分布及び該第2ステップで認識され
    た交差点の数の組とを突き合わせることにより、該第1
    ステップで入力された帳票の種類を判定する第4ステッ
    プを有することを特徴とする帳票識別方法。
  3. 【請求項3】 帳票のマスター画像を入力する第5ステ
    ップ、該第5ステップにより入力された帳票のマスター
    画像の罫線を認識する第6ステップ、該第6ステップで
    認識された罫線の長さの度数分布を求め記憶手段に記憶
    させる第7ステップを有し、該記憶手段に記憶された罫
    線の長さの度数分布が該第4ステップにおいて該第3ス
    テップにより求められた罫線の長さの度数分布と突き合
    わされることを特徴とする請求項1記載の帳票識別方
    法。
  4. 【請求項4】 帳票のマスター画像を入力する第5ステ
    ップ、該第5ステップにより入力された帳票のマスター
    画像の罫線及びその交差点を認識する第6ステップ、該
    第6ステップで認識された罫線の長さの度数分布を求
    め、それと該第6ステップで認識された罫線の交差点の
    数の組を記憶手段に記憶させる第7ステップを有し、該
    記憶手段に記憶された罫線の長さの度数分布及び交差点
    の数の組が該第4ステップにおいて該第3ステップによ
    り求められた罫線の長さの度数分布及び該第2ステップ
    で認識された交点の数の組と突き合わされることを特徴
    とする請求項2記載の帳票識別方法。
  5. 【請求項5】 請求項1、2、3又は4記載の帳票識別
    方法の各ステップをコンピュータに実行させるためのプ
    ログラムが記録されたことを特徴とする機械読み取り可
    能媒体。
  6. 【請求項6】 画像入力のための第1手段、該第1手段
    により入力された帳票の画像の罫線を認識するための第
    2手段、該第2手段により認識された罫線の長さの頻度
    分布を求めるための第3手段、該第1手段により入力さ
    れた各種の帳票のマスター画像に関して該第3手段によ
    り求められた罫線の長さの度数分布を記憶するための第
    4手段、該第4手段に記憶されている罫線の長さの度数
    分布と、該第1手段により入力された認識すべき帳票の
    画像に関して該第3手段により求められた罫線の長さの
    度数分布とを突き合わせることにより、該認識すべき帳
    票の種類を判定する第5手段、各種の帳票の認識対象領
    域等の情報を記憶するための第6手段、該第5手段によ
    り判定された帳票の種類に対応した該第6手段に記憶さ
    れている情報を利用して該認識すべき帳票の画像に対す
    る文字認識を行うための第7手段を具備することを特徴
    とする文字認識装置。
  7. 【請求項7】 画像入力のための第1手段、該第1手段
    により入力された帳票の画像の罫線及びその交差点を認
    識するための第2手段、該第2手段により認識された罫
    線の長さの頻度分布を求めるための第3手段、該第1手
    段により入力された各種の帳票のマスター画像に関して
    該第3手段により求められた罫線の長さの度数分布及び
    該第2手段により認識された交差点の数の組を記憶する
    ための第4手段、該第4手段に記憶されている罫線の長
    さの度数分布及び交差点の数の組と、該第1手段により
    入力された認識すべき帳票の画像に関して該第3手段に
    より求められた罫線の長さの度数分布及び該第2手段に
    より認識された交差点の数の組とを突き合わせることに
    より、該認識すべき帳票の種類を判定する第5手段、各
    種の帳票の認識対象領域等の情報を記憶するための第6
    手段、該第5手段により判定された帳票の種類に対応し
    た該第6手段に記憶されている情報を利用して該認識す
    べき帳票の画像に対する文字認識を行うための第7手段
    を具備することを特徴とする文字認識装置。
JP9237982A 1997-09-03 1997-09-03 帳票識別方法、機械読み取り可能媒体及び文字認識装置 Pending JPH1185900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9237982A JPH1185900A (ja) 1997-09-03 1997-09-03 帳票識別方法、機械読み取り可能媒体及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9237982A JPH1185900A (ja) 1997-09-03 1997-09-03 帳票識別方法、機械読み取り可能媒体及び文字認識装置

Publications (1)

Publication Number Publication Date
JPH1185900A true JPH1185900A (ja) 1999-03-30

Family

ID=17023368

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9237982A Pending JPH1185900A (ja) 1997-09-03 1997-09-03 帳票識別方法、機械読み取り可能媒体及び文字認識装置

Country Status (1)

Country Link
JP (1) JPH1185900A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7106904B2 (en) 2001-04-25 2006-09-12 Hitachi, Ltd. Form identification method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7106904B2 (en) 2001-04-25 2006-09-12 Hitachi, Ltd. Form identification method

Similar Documents

Publication Publication Date Title
US6006240A (en) Cell identification in table analysis
JP2000181993A (ja) 文字認識方法および装置
CN102708365A (zh) 信息处理装置、信息处理方法以及程序
WO2002003315A1 (en) Image processing for clustering related text objects
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JP3285686B2 (ja) 領域分割方法
JP3923474B2 (ja) 文字読み取り装置
JPH1185900A (ja) 帳票識別方法、機械読み取り可能媒体及び文字認識装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH10222587A (ja) 帳票類の自動判別方法及び装置
JP3090070B2 (ja) 帳票識別方法及び装置
CN115131806B (zh) 一种基于深度学习的各类证件ocr图像信息识别方法、系统
JPH0797390B2 (ja) 文字認識装置
JP3411795B2 (ja) 文字認識装置
JPS63101983A (ja) 文字列抽出方式
JPH10269311A (ja) 帳票処理単位指定方法
JP3220226B2 (ja) 文字列方向判別方法
JP2003323586A (ja) 帳票フォーム登録方法および帳票認識方法
JP3006294B2 (ja) 光学的文字読取装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JP2003030585A (ja) 画像処理装置、方法、プログラム及び記憶媒体
JPH0573718A (ja) 領域属性識別方式
JP2000048191A (ja) 画像処理方法及び画像処理プログラムを記録した媒体
JPH11306282A (ja) 文字列領域抽出方法及び装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060607