JPH11143986A - ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体 - Google Patents

ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体

Info

Publication number
JPH11143986A
JPH11143986A JP9285709A JP28570997A JPH11143986A JP H11143986 A JPH11143986 A JP H11143986A JP 9285709 A JP9285709 A JP 9285709A JP 28570997 A JP28570997 A JP 28570997A JP H11143986 A JPH11143986 A JP H11143986A
Authority
JP
Japan
Prior art keywords
bitmap image
information
horizontal line
bitmap
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9285709A
Other languages
English (en)
Inventor
Michitoshi Sumikawa
川 道 俊 澄
Hiroyasu Takahashi
橋 弘 晏 高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP9285709A priority Critical patent/JPH11143986A/ja
Priority to US09/132,943 priority patent/US6356655B1/en
Priority to KR1019980036901A priority patent/KR100315318B1/ko
Publication of JPH11143986A publication Critical patent/JPH11143986A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 ページマークやリファレンスマークなしの帳
票をスキャナーが帳票のエッジを検出できないものであ
っても文字枠の特定と文字の認識を可能とする。また、
高速に検出できる水平線分から形成した外接長方形等を
基準としてイメージの比較を行うことにより、ビットマ
ップイメージの識別処理を高速化する。 【解決手段】OCRでページマークの無い黒色文字枠を
持つ帳票300を識別し、文字を認識する場合等、帳票
上の文字枠323、327や罫線301、303などの
水平線分を含むビットマップイメージの識別を行うに際
し、水平線分をその帳票の特徴として抽出し、その水平
線分により生成される領域に外接長方形350を形成
し、文字枠の位置の推定基準や帳票の種類を識別するた
めの情報とする。これをOCRに適用することにより、
ページマークあるいはリファレンスマークなしの帳票で
も認識可能となる。また、抽出した水平線分自体も予め
登録した帳票定義体の水平線分と比較し類似度を比較す
ることにより、より正確な帳票の識別が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、画像処理方法に関す
るものであり、より詳しくは、ビットマップ・イメージ
の識別方法に関する。
【0002】
【従来の技術】従来、帳票の識別と文字の認識処理とし
て、文字枠などの位置をイメージ上で特定するために
は、 (1)ページマークあるいはリファレンスマークを基準
として用いる方式 (2)スキャナーに帳票の背景を黒として帳票のエッジ
を検出する機能が有る場合、そのエッジを基準に用いる
方式 (3)黒色文字枠を個別に検出し、その枠とあらかじめ
定義されている枠とのマッチングをする方式 が採用されていた。
【0003】しかし、方式(1)においては、帳票にペ
ージマークあるいはリファレンスマークが必須となり、
ユーザーが使用できる領域が狭くなるなど制限が多くな
ってしまう。また、この方式では、ページマークあるい
はリファレンスマークが無い帳票に対応できないという
問題点があった。
【0004】方式(2)は、このような機能が備わって
いるOCR専用の高価なスキャナーでなければ適用でき
ないという問題点があった。
【0005】方式(3)は、黒色文字枠を検出するため
に、水平線分ばかりでなく垂直線分も特徴として抽出す
る必要があるので、処理速度が低下する。
【0006】また、前処理としてイメージそのものをス
キュー補正して、スキューが全くない状態にするので、
さらに処理が遅くなるという問題点があった。特に帳票
の内容を用いて識別する方式では、スキューや位置ずれ
のある場合は、分析ロジックが複雑になりがちであり、
処理速度が低下する傾向にあった。
【0007】
【発明が解決しようとする課題】本発明の目的は、ペー
ジマークあるいはリファレンスマークなしの帳票で、か
つスキャナーが帳票のエッジを検出できないものであっ
ても文字枠の特定と文字の認識を可能とすることにあ
る。
【0008】本発明の他の1つの目的は、高速に認識で
きる水平線分のみから形成した外接長方形を基準として
ビットマップイメージの比較を行うことにより、ビット
マップイメージの識別処理を高速化することにある。
【0009】本発明の他の1つの目的は、イメージその
ものをスキュー補正することなく、理想のイメージへマ
ッピングをすることにより、ビットマップイメージの識
別処理を高速化することにある。
【0010】本発明の他の1つの目的は、外接長方形の
4隅を仮想ページマークとすることで、従来のページマ
ークを基準とした文字枠の検出ロジックを流用し、ロジ
ックを簡明化することにある。
【0011】本発明の他の1つの目的は、外接長方形や
水平線分の定義情報を既存の帳票定義体に追加可能にす
ることで、従来の帳票定義体の情報をそのまま利用で
き、帳票定義体を作成するオペレータの負担を軽減する
ことにある。
【0012】
【課題を解決するための手段】OCRでページマークの
無い黒色文字枠を持つ帳票を識別し、文字を認識する場
合等、帳票上の文字枠や罫線などの水平線分を含むビッ
トマップイメージの識別を行うに際し、水平線分をその
帳票の特徴として抽出し、その水平線分により生成され
る領域に外接長方形を形成し、文字枠の位置の推定基準
や帳票の種類を識別するための情報とする。これをOC
Rに適用することにより、ページマークあるいはリファ
レンスマークなしの帳票でも識別可能となる。また、抽
出した水平線分自体も予め登録した帳票定義体の水平線
分と比較し類似度を比較することにより、より正確な帳
票の識別が可能となる。
【0013】本発明の一態様においては、ビットマップ
イメージの種類を特定するために複数のビットマップイ
メージの識別情報を含むビットマップイメージ定義体を
有するビットマップイメージ識別装置上で実行される複
数の水平線分イメージを含むビットマップ・イメージの
種類を識別する方法であって、(a)前記ビットマップ
イメージを走査することにより複数の水平線分の特定情
報を抽出する段階と、(b)前記複数の水平線分定義情
報に基づいて外接長方形の特定情報を抽出する段階と、
(c)前記抽出された外接長方形の特定情報と予め登録
されたビットマップイメージ定義体の外接長方形特定情
報に類似するか否かを検査する段階と、を含むビットマ
ップイメージの識別方法が提供される。なお、本願明細
書の特許請求の範囲において「ビットマップイメージの
定義体」とは、本発明の好適な実施例における帳票定義
体に対応する概念であるが、帳票に限らず、種々のビッ
トマップイメージの種類を識別するための情報を保持す
るものを含む概念である。また、本願明細書の特許請求
の範囲において「水平線分」とは、ビットマップイメー
ジの走査方向に対してほぼ平行な線分を意味する。さら
に、本願明細書の特許請求の範囲において「水平線分の
特定情報」は、線分を定義する2点の座標のみならず、
ベクトル情報等を含む概念である。
【0014】本発明の他の一態様においては、ビットマ
ップイメージの種類を特定するために複数のビットマッ
プイメージの識別情報を含むビットマップイメージ定義
体を有するビットマップイメージ識別装置上で実行され
る複数の水平線分イメージを含むビットマップ・イメー
ジの種類を識別する方法であって、(a)前記ビットマ
ップイメージを走査することにより複数の水平線分の特
定情報を抽出する段階と、(b)前記抽出された複数の
水平線分の特定情報と予め登録されたビットマップイメ
ージ定義体の水平線分の特定情報に類似するか否かを検
査する段階と、を含むビットマップイメージの識別方法
が提供される。
【0015】本発明の他の一態様においては、複数の水
平線分イメージを含むビットマップ・イメージの種類を
識別するための情報の取得方法であって、(a)前記ビ
ットマップイメージを走査することにより複数の水平線
分の特定情報を抽出する段階と、(b)前記複数の水平
線分定義情報に基づいて前記複数の水平線分のうちの2
本の少なくとも一部分をその水平辺に含む矩形の特定情
報を抽出する段階と、(c)前記複数の水平線分定義情
報に基づいて計算された傾き情報に基づいて前記矩形の
特定情報を変換する段階と、(d)前記変換された矩形
の定義情報を格納する段階と、を含むビットマップイメ
ージの識別を行うための情報の取得方法が提供される。
なお、本願明細書の特許請求の範囲において「矩形」と
は、本発明の好適な実施例における外接長方形に対応す
る概念であるが、外接長方形に限らず、特定の水平線分
に基づいて形成される矩形をも含む概念である。
【0016】本発明の他の一態様においては、ビットマ
ップイメージに含まれる文字枠の位置を認識する方法で
あって、(a)前記ビットマップイメージを走査するこ
とにより複数の水平線分の特定情報を抽出する段階と、
(b)前記複数の水平線分定義情報に基づいて外接長方
形の特定情報を抽出する段階と、(c)前記ビットマッ
プイメージに含まれる文字枠の特定情報を抽出する段階
と、(d)前記抽出された文字枠の特定情報を前記外接
長方形の1つの頂点を基準とした位置情報として格納す
る段階と、を含む文字枠の識別方法が提供される。
【0017】本発明の他の一態様においては、複数の水
平線分イメージを含むビットマップ・イメージの種類を
識別するビットマップイメージ識別装置であって、
(a)複数の水平線分イメージを含むビットマップ・イ
メージを保持する画像入力部と、(b)ビットマップイ
メージの種類を特定する複数のビットマップイメージの
識別情報を含むビットマップイメージ定義体と、(c
1)前記ビットマップイメージを走査することにより複
数の水平線分の特定情報を抽出し、(c2)前記複数の
水平線分定義情報に基づいて外接長方形の特定情報を抽
出し、(c3)前記抽出された外接長方形の特定情報と
予め登録されたビットマップイメージ定義体の外接長方
形特定情報に類似するか否かを検査する画像解析部と、
を含むビットマップイメージ識別装置が提供される。
【0018】本発明の他の一態様においては、複数の水
平線分イメージを含むビットマップ・イメージの種類を
識別するビットマップイメージ識別装置であって、
(a)複数の水平線分イメージを含むビットマップ・イ
メージを保持する画像入力部と、(b)ビットマップイ
メージの種類を特定する複数のビットマップイメージの
識別情報を含むビットマップイメージ定義体と、(c
1)前記ビットマップイメージを走査することにより複
数の水平線分の特定情報を抽出し、(c2)前記抽出さ
れた複数の水平線分の特定情報と予め登録されたビット
マップイメージ定義体の水平線分の特定情報に類似する
か否かを検査する画像解析部と、を含むビットマップイ
メージ識別装置が提供される。
【0019】本発明の他の一態様においては、複数の水
平線分イメージを含むビットマップ・イメージの種類を
識別するための情報を取得するビットマップイメージ処
理装置であって、(a1)前記ビットマップイメージを
走査することにより複数の水平線分の特定情報を抽出
し、、(a2)前記複数の水平線分定義情報に基づいて
前記複数の水平線分のうちの2本の少なくとも一部分を
その水平辺に含む矩形の特定情報を抽出し、(a3)前
記複数の水平線分定義情報に基づいて計算された傾き情
報に基づいて前記矩形の特定情報を変換する画像解析部
と、(b)前記変換された矩形の定義情報を格納するビ
ットマップイメージ定義体と、を含むビットマップイメ
ージ処理装置が提供される。
【0020】本発明の他の一態様においては、ビットマ
ップイメージに含まれる文字枠の位置を認識するビット
マップイメージ処理装置であって、(a1)前記ビット
マップイメージを走査することにより複数の水平線分の
特定情報を抽出し、(a2)前記複数の水平線分定義情
報に基づいて外接長方形の特定情報を抽出し、(a3)
前記ビットマップイメージに含まれる文字枠の特定情報
を抽出する画像解析部と、(b)前記抽出された文字枠
の特定情報を前記外接長方形の1つの頂点を基準とした
位置情報として格納するビットマップイメージ定義体
と、を含むビットマップイメージ処理装置が提供され
る。
【0021】本発明の他の一態様においては、ビットマ
ップイメージの種類を特定するために複数のビットマッ
プイメージの識別情報を含むビットマップイメージ定義
体を有するビットマップイメージ識別装置上で実行され
る複数の水平線分イメージを含むビットマップ・イメー
ジの種類を識別するイメージ処理プログラムを格納した
記録媒体であって、該イメージ処理プログラムは、
(a)前記ビットマップイメージを走査することにより
複数の水平線分の特定情報を抽出することを前記ビット
マップイメージ識別装置に指示するためのプログラムコ
ードと、(b)前記複数の水平線分定義情報に基づいて
外接長方形の特定情報を抽出することを前記ビットマッ
プイメージ識別装置に指示するためのプログラムコード
と、(c)前記抽出された外接長方形の特定情報と予め
登録されたビットマップイメージ定義体の外接長方形特
定情報に類似するか否かを検査することを前記ビットマ
ップイメージ識別装置に指示するためのプログラムコー
ドと、を含む記録媒体が提供される。
【0022】本発明の他の一態様においては、ビットマ
ップイメージの種類を特定するために複数のビットマッ
プイメージの識別情報を含むビットマップイメージ定義
体を有するビットマップイメージ識別装置上で実行され
る複数の水平線分イメージを含むビットマップ・イメー
ジの種類を識別するイメージ処理プログラムを格納した
記録媒体であって、該イメージ処理プログラムは、
(a)前記ビットマップイメージを走査することにより
複数の水平線分の特定情報を抽出することを前記ビット
マップイメージ識別装置に指示するためのプログラムコ
ードと、(b)前記抽出された複数の水平線分の特定情
報と予め登録されたビットマップイメージ定義体の水平
線分の特定情報に類似するか否かを検査することを前記
ビットマップイメージ識別装置に指示するためのプログ
ラムコードと、を含む記録媒体が提供される。
【0023】本発明の他の一態様においては、ビットマ
ップイメージ処理装置において実行され、複数の水平線
分イメージを含むビットマップ・イメージの種類を識別
するための情報の取得するイメージ処理プログラムを格
納した記録媒体であって、該イメージ処理プログラム
は、(a)前記ビットマップイメージを走査することに
より複数の水平線分の特定情報を抽出することを前記ビ
ットマップイメージ処理装置に指示するためのプログラ
ムコードと、(b)前記複数の水平線分定義情報に基づ
いて前記複数の水平線分のうちの2本の少なくとも一部
分をその水平辺に含む矩形の特定情報を抽出することを
前記ビットマップイメージ処理装置に指示するためのプ
ログラムコードと、(c)前記複数の水平線分定義情報
に基づいて計算された傾き情報に基づいて前記矩形の特
定情報を変換することを前記ビットマップイメージ処理
装置に指示するためのプログラムコードと、(d)前記
変換された矩形の定義情報を格納することを前記ビット
マップイメージ処理装置に指示するためのプログラムコ
ードと、を含む記録媒体が提供される。
【0024】本発明の他の一態様においては、ビットマ
ップイメージ処理装置において実行され、ビットマップ
イメージに含まれる文字枠の位置を認識するイメージ処
理プログラムを格納した記録媒体であって、該イメージ
処理プログラムは、(a)前記ビットマップイメージを
走査することにより複数の水平線分の特定情報を抽出す
ることを前記ビットマップイメージ処理装置に指示する
ためのプログラムコードと、(b)前記複数の水平線分
定義情報に基づいて外接長方形の特定情報を抽出するこ
とを前記ビットマップイメージ処理装置に指示するため
のプログラムコードと、(c)前記ビットマップイメー
ジに含まれる文字枠の特定情報を抽出することを前記ビ
ットマップイメージ処理装置に指示するためのプログラ
ムコードと、(d)前記抽出された文字枠の特定情報を
前記外接長方形の1つの頂点を基準とした位置情報とし
て格納することを前記ビットマップイメージ処理装置に
指示するためのプログラムコードと、を含む記録媒体が
提供される。
【0025】
【実施例】A.ハードウエア構成 以下、図面を参照して本発明の実施例を説明する。図1
を参照すると、本発明のイメージ処理システムを実施す
るためのハードウェア構成の概観図が示されている。イ
メージ処理システム100は、中央処理装置(CPU)
1とメモリ4とを含んでいる。CPU1とメモリ4は、
バス2等を介して、補助記憶装置としてのハードディス
ク装置13、31とを接続してある。フロッピーディス
ク装置(またはMO28、CD−ROM26、29等の
媒体駆動装置26、28、29、30)20はフロッピ
ーディスクコントローラ(またはIDEコントローラ2
5、SCSIコントローラ27等の各種コントローラ)
19を介してバス2へ接続されている。
【0026】フロッピーディスク装置(またはMO、C
D−ROM等の媒体駆動装置26、28、29、30)
20には、フロッピーディスク(またはMO、CD−R
OM等の媒体)が挿入され、このフロッピーディスク等
やハードディスク装置13、ROM14等の記憶媒体に
は、オペレーティングシステムと協働してCPU等に命
令を与え、本発明を実施するためのコンピュータ・プロ
グラムのコードを記録することができ、メモリ4にロー
ドされることによって実行される。このコンピュータ・
プログラムのコードは圧縮し、または、複数に分割し
て、複数の媒体にまたがって記録することもできる。同
様に、上記各種記憶媒体には入力となるイメージデータ
や処理結果のイメージデータを格納することもできる。
【0027】イメージ処理システム100は更に、ユー
ザ・インターフェース・ハードウェアを備えたシステム
とすることができ、ユーザ・インターフェース・ハード
ウェアとしては、例えば、画面位置情報を入力をするた
めのポインティング・デバイス(マウス、ジョイスティ
ック、トラックボール等)7、キー入力をサポートする
キーボード6や、イメージデータをユーザに提示するた
めのディスプレイ11、12がある。また、スピーカ2
3は、オーディオ・コントローラ21から音声信号を、
アンプ22を介して受領し、音声として出力する。
【0028】本発明のイメージ処理システム100の入
力となるイメージデータは、好適にはスキャナ31によ
って作成され、SCSIインターフェース27を介して
本イメージ処理システム100に入力される。ただし、
スキャナによって作成されたイメージデータは、SCS
Iインターフェース27ではなくパラレルポート16や
他のインターフェースを介して本イメージ処理システム
100に入力されてもよい。また、シリアルポート15
およびモデムまたは、トークンリング等の通信アダプタ
18等を介して他のコンピュータやFAX等と通信を行
い、イメージデータを受領することや、フロッピーディ
スク24等の記憶媒体からも入力可能である。さらにシ
リアルポート15等を介してデジタルカメラと接続し、
イメージデータを受領することもできる。
【0029】このように、本発明は、通常のパーソナル
コンピュータ(PC)やワークステーションや専用のO
CR、テレビやFAX等の各種家電製品に組み込まれた
コンピュータ又はこれらの組合せによって実施可能であ
ることを容易に理解できるであろう。ただし、これらの
構成要素は例示であり、その全ての構成成要素が本発明
の必須の構成要素となるわけではない。特に、本発明
は、ビットマップイメージの認識を行うものであるた
め、シリアルポート15、通信アダプタカード18、オ
ーディオ・コントローラ21、アンプ22、スピーカ2
3等の構成要素は本発明の一態様においては必須のもの
ではない。
【0030】オペレーティング・システムとしては、W
indows(マイクロソフトの商標)、OS/2(I
BMの商標)、AIX(IBMの商標)上のX−WIN
DOWシステム(MITの商標)などの、標準でGUI
マルチウインドウ環境をサポートするものが望ましい
が、特定のオペレーティング・システム環境に限定され
るものではない。
【0031】また、図1は、スタンド・アロン環境のシ
ステムを示しているが、クライアント/サーバ・システ
ムとして本発明を実現し、クライアント・マシンは、サ
ーバ・マシンに対して、イーサネット、トークン・リン
グなどでLAN接続し、クライアント・マシン側には、
後述するユーザ入力部と、画像表示部と、画像入力部の
みを配置し、その他の機能をサーバ・マシン側に配置し
てもよい。このように、サーバ・マシン側とクライアン
ト・マシン側にどのような機能を配置するかは設計に際
し自由に変更できる事項であり、複数のマシンを組合
せ、それらにどのような機能を配分し、実施するか等の
種々の変更は本発明の思想に包含される概念である。
【0032】B.システム構成 次に、図2のブロック図を参照して、本発明のシステム
構成について説明する。本発明の好適な実施例において
は、画像処理システム100は、ユーザ入力部101、
制御部103、画像解析部105、画像表示部107、
画像入力部111、及び、定義体格納部113によって
構成される。
【0033】このユーザ入力部101は、処理の開始・
終了の命令の入力や、ポインティングデバイスを使用し
た画面上の座標値の入力等をユーザより受領し、制御部
103へ伝達する機能を有する。画像入力部111は、
スキャナ等から入力された帳票イメージ等の画像情報を
保持し、その画像情報を制御部103に伝達する。画像
解析部105は、画像入力部111で保持された画像情
報を解析し、検出した線分を特定するための座標値等を
導出し、制御部103に返す。画像表示部107は、画
像入力部の保持する帳票イメージ等の画像情報や、定義
体格納部113に格納された、フィールドの位置情報
や、属性情報を表示画面上に表示する。以上説明した各
機能ブロックの詳しい機能については後に詳述する。
【0034】以上図2に示す各機能ブロックを説明した
が、これらの機能ブロックは、論理的機能ブロックであ
り、各々1つのまとまりを持ったハードウエアやソフト
ウエアによって実現されることを意味するのではなく、
複合し、または共通したハードウエアやソフトウエアに
よって実現可能である。
【0035】C.動作説明 本発明は、OCRだけに限らず、一般的なビットマップ
・イメージの認識や識別においても適用可能なものであ
るが、本発明の好適な実施例においては、本発明をOC
Rに適用した場合の例を中心に説明する。
【0036】帳票識別機能を有するOCRソフトウエア
は、文字を認識するに際し、あらかじめ文字枠の位置や
文字属性などを記述したファイル(以降帳票定義体と呼
ぶ)を使用して実際に文字が記入された帳票を識別し、
文字の記入されている場所である文字フィールドを特定
し、文字を認識/コード化している。
【0037】図3は、本発明の好適な実施例の帳票定義
体200の内容を示す概念図である。本発明の好適な実
施例の帳票定義体200には、従来の帳票定義体に対応
する帳票/文字枠定義情報部210と、本発明によって
改良された外接長方形/水平線分定義情報部230を有
している。本発明の好適な実施例における定義体格納部
113は、複数の帳票定義体200を格納している。
【0038】帳票/文字枠定義情報部210は、帳票番
号213の情報を含んでいる。また、この帳票に含まれ
る文字枠に対して、文字枠番号221、文字枠の開始位
置223(文字枠の左上の頂点の座標位置)、文字枠の
大きさ(幅及び高さの情報)225、文字数227、属
性229等の情報を管理している。
【0039】この一方、外接長方形/水平線分定義情報
部230は、各帳票毎、帳票/文字枠定義情報部210
にリンクしており、外接長方形の左上のx、y座標24
1、外接長方形の右上のx座標243、外接長方形の左
下のx、y座標245、外接長方形の右下のx座標24
7、水平線分の本数249の情報を含んでいる。また、
この帳票に含まれる線分の各々に対して、線分の開始位
置231、線分の長さ233、線分の太さ235等の情
報を管理している。この外接長方形/水平線分定義情報
部230の4隅の情報241〜247については、従来
の帳票定義体に含まれているページマーク/レファレン
スマークの定義エリアを流用することも可能である。
【0040】従来の帳票定義体(図3の帳票/文字枠定
義情報部に相当)を生成する技術は、本願発明の出願時
において公知の手法であるが、簡単に説明する。新たに
作成されたOCR用帳票を文字認識プログラムに認識さ
せるOCRの帳票定義作業(帳票定義体生成作業)を行
うに際し、古典的手法においては、帳票のサイズ、ペー
ジマーク/位置補正マーク(タイミングマークまたはリ
ファレンスマークとも呼ばれる)/文字フィールド/文
字の相対的な位置とサイズなどを物差しを使って測定
し、その数値を入力し、帳票定義体を生成していた。
【0041】しかし、この手法は、オペレータ(定義体
作成者)にとって手間のかかるものであったため、現在
いくつかの改良された手法が提案されている。一例をあ
げると、メディア・ドライブ社の「WinReader
Hand v1.5 ユーザーズ・マニュアル、フィ
ールドの設定(p19,20)」(「WinReade
r Hand」はメディア・ドライブ社の商標)に記載
されたような、黒枠の帳票では未記入の帳票イメージを
スキャナーで取り込みディスプレイ上に表示し、全ての
黒い縦線と横線を自動検出し、オペレータが直線が正し
く検出されたことを確認してから文字認識フィールドを
設定する方式がある。
【0042】また、本発明の出願人が平成8年11月2
8日に出願した特願平8−317242号公報に記載さ
れたように、文字枠を含む帳票のスキャンしたイメージ
をディスプレイ上に表示し、認識フィールドごとに左端
の文字枠内をマウスでクリックし次に同一フィールドの
右端の文字枠内をクリックすることにより自動的にフィ
ールドの指定を行う技術がある。この発明においては、
文字枠検出プログラムを実行後、図4に示すように、検
出された文字枠の再設定、属性情報の設定を行うことが
できる。
【0043】このフィールドの属性を設定すると数字項
目中の数字の「0」を誤って英字の「O」と認識するこ
とを避けることができ、また、対比する集合が少なくな
るため、高速に認識を行うことができるというメリット
がある。特に手書き文字認識では、数字の「0」と英字
の「O」等判別が困難な文字も存在するため、属性情報
を含む帳票定義体を用いなくても認識は可能であるが、
実用に耐えうる速度、及び認識率を得ることは困難であ
り、また認識した文字の以降の扱い(住所、姓名、金額
など)が不明になりやすい)。従って、帳票を認識する
処理は、通常、帳票定義体の作成とそれに基づく実帳票
の認識という2つのステップから構成されている。
【0044】本発明も、このOCR処理における帳票定
義体の作成への適用と帳票識別/文字認識への適用の2
つのステップへ応用することができる。以下、各ステッ
プにおける本発明の適用例を説明する。
【0045】C1.帳票定義体作成への適用 帳票定義体作成処理の流れは、図5に示すように、以下
の手順となる。 1.水平線分の抽出(ブロック401) 2.外接長方形の形成(ブロック403) 3.外接長方形を基準として各文字フィールドの位置お
よび認識属性を指定(ブロック405) 4.外接長方形の左上を基準とした逆回転による隅と各
文字フィールドのスキュー補正(ブロック407) 5.外接長方形の補正後の4隅の位置を保存(ブロック
409) 6.水平線分情報の保存(ブロック411)
【0046】C1.1.水平線分の抽出 まず、水平線文の抽出処理として、帳票のイメージから
水平方向の走査によって高速に処理できる水平線分のみ
を検出する。この時、文字等を形成する無用の短い線分
やノイズの影響を避けるために、水平線分の長さ及び太
さにある制限をつける。例えば長さ7mm以下あるいは
太さ0.3mm以下の線分は無視するというものであ
る。
【0047】図6は、本発明の好適な実施例において使
用される帳票であり、図7は、この水平線文の抽出処理
によって抽出された線分の概念図である。本発明の好適
な実施例においては、線分を特定する情報として、各線
分(線幅の中央)の始点、終点のx,y座標、線分の太
さの情報を線分特定情報として保持する。各線分の始点
のx,y座標、線分の長さ、太さの情報を線分特定情報
として保持することも有効である。
【0048】C1.2.外接長方形の形成 次に、抽出された水平線分の集合から帳票に唯一の平均
スキュー値を計算し、その角度を持った外接長方形を形
成する。具体的には線分情報の始点、終点のx,y座標
から各線分の傾きを求め、その平均値を平均スキュー角
とする。
【0049】また、各線分の始点の最小及び最大のy座
標、最小のx座標、各線分の最大のx座標の情報から、
外接長方形の定義情報として、外接長方形の4隅の点を
保持する。図8は、外接長方形の形成処理によって作成
された外接長方形の概念図である。
【0050】本発明の一態様においては、検出された線
分を全て包含する外接長方形を基準に帳票の比較を行う
ため、考えうる最も誤差の少ない安定した基準を得るこ
とができる。長方形の角に水平線分が無い場合(図8の
頂点345のように、外接長方形を形成する水平線分の
x座標が水平線分x座標の最大値または最小値でないと
き)は、水平線分x座標の最大値または最小値を用いて
直線方程式で算出する。
【0051】以上、「C1.1.水平線分の抽出」及び
「C1.2.外接長方形の形成」において抽出された情
報は、図3に示すように、各帳票にリンクした外接長方
形/水平線分定義情報部230に格納される。
【0052】C1.3.外接長方形を基準として文字フ
ィールドの位置及び認識属性を指定 外接長方形の左上を原点として、文字枠の相対的な位置
を決定する。本発明の一実施例においては、従来の帳票
定義体200として、帳票/文字枠定義情報部210の
みが先に作成されており、その生成されている帳票定義
体200に、外接長方形/水平線分定義情報部230を
追加している。この態様においては、各文字枠の開始位
置223のx座標y座標の値が外接長方形の左上の位置
241のx座標y座標の値によって減算される。
【0053】本発明の他の一態様においては、帳票/文
字枠定義情報部210と、外接長方形/水平線分定義情
報部230とを一連の処理で定義する。この態様におい
ては、先に抽出された外接長方形の左上の位置241を
起点として、公知の文字枠の検出プログラムを実行し、
文字枠の開始位置223の抽出を行っている。
【0054】また、外接長方形の左上の位置241と右
上の位置243をページマークとみなして使用すること
により、従来のページマークを使用したプログラムを大
きな変更を加えずに使用することができる。
【0055】C1.4.外接長方形の左上を基準とした
逆回転による隅と各文字フィールドのスキュー補正 ブロック401で求めた各線分の始点、終点の情報か
ら、水平線分の傾き(傾きの平均値)を算出し、この傾
きに基づいた回転角を用い、外接長方形の残りの3隅及
び文字枠の位置を外接長方形の左上を基に計算上の逆回
転補正をする。これによって算出された外接長方形の4
隅の位置情報を帳票定義体200の外接長方形の4隅の
位置情報241〜247と置換する。このように、イメ
ージそのものを回転させることなく、いわゆる位置情報
のマッピングのみで理論上のスキュー補正を行うので高
速に処理ができる。また、文字枠の開始位置223をス
キュー補正後の情報に置換する。
【0056】C1.5.外接長方形の補正後の4隅の位
置を保存 外接長方形の補正後の4隅の位置を、現行のページマー
クの位置情報として保存する。これにより、この補正後
の4隅の位置情報は、仮想ページマークとして現行のペ
ージマークを用いた文字枠検出ロジックに流用できる。
【0057】C1.6.水平線分情報の保存 図3に示すように、検出した水平線分の本数249、開
始位置231、長さ233、太さ235等の各種情報を
帳票定義体200に保存する。この情報は、帳票識別の
際に使用する。
【0058】C2.帳票識別/文字認識への適用 次に、帳票定義体200の作成後に行われる実際の帳票
(記入済みの帳票)認識処理への本発明の応用例を説明
する。本発明の好適な実施例における帳票識別/文字認
識の処理の流れは、図9に示すように、以下のようにな
る。 1.水平線分の抽出(ブロック431) 2.外接長方形の形成(ブロック433) 3.スキューの理論的補正(ブロック435) 4.外接長方形の類似度による絞り込み(ブロック43
7) 5.水平線分情報の類似度による絞り込み(ブロック4
39) 6.定義体情報をもとに帳票識別と文字認識(ブロック
441)
【0059】以下の説明においては、複数種類の帳票に
夫々固有の帳票定義体200が定義されており、それら
が定義体格納部113(図2)に格納されており、複数
の種類の入力帳票がどれに対応するかはOCRシステム
は、予め判らないものとする。帳票定義体200のファ
イル名は、定義体ファイルリストに登録されている。
【0060】C2.1.水平線分の抽出 帳票定義の場合と同様に、帳票のイメージから水平方向
の走査によって高速に処理できる水平線分のみを検出す
る。この時も、文字等を形成する無用の短い線分やノイ
ズの影響を避けるために、水平線分の長さ及び太さにあ
る制限をつける。
【0061】C2.2.外接長方形の形成 帳票定義の場合と同様に、抽出された水平線分の集合か
ら帳票に唯一の平均スキュー値を計算し、その角度を持
った外接長方形を形成する。
【0062】C2.3.スキューの理論的補正 C1.3とC1.4の場合と同様に文字枠の位置等を検
出し補正する。これにより帳票定義時と認識時のスキュ
ーが異なっていたり位置ずれがあっても、同じ理想イメ
ージ上で対応をとることができる。
【0063】C2.4.外接長方形の類似度による絞り
込み 形成された外接長方形の縦横の長さを帳票定義体200
の外接長方形の4隅の情報241〜247から算出され
た外接長方形の縦横の長さと比較する。あるしきい値よ
り類似度が大きい場合は次の処理に進む。不合格の場合
は別の帳票定義体と類似度比較を行う(ブロック44
3、445)。なお、本発明の好適な実施例において
は、帳票上に帳票IDが存在するか否かを検査し、帳票
IDが存在する場合は、それを認識し、帳票定義体20
0の帳票番号213と比較することにより帳票識別を完
全なものにしている。
【0064】C2.5.水平線分情報の類似度による絞
り込み 抽出された水平線分を帳票定義体に保存されている水平
線分情報と長方形内の位置、長さに関して比較する。あ
るしきい値より類似度が大きい場合は次の水平線分の比
較処理に進む。本発明の好適な実施例においては、最終
的に本数は必ずしも一致しなくてもよいものとする。こ
れは、記入された文字などによる水平線分の誤検出や検
出漏れによる影響を少なくするためである。これらの類
似度比較に合格すると次の処理に進む。不合格の場合は
別の帳票定義体と類似度比較を行う。
【0065】C2.6.定義体情報をもとに帳票識別と
文字認識 形成された外接長方形の4隅の位置情報、回転角、帳票
定義体の文字枠の位置情報や属性情報などを基に文字認
識処理を行う。(外接長方形の4隅の位置情報は、帳票
定義の場合と同様に仮想ページマークとすることで、現
行のページマークからの文字枠検出ロジックが流用でき
る。)この後にスキャンした帳票と推定した帳票とが一
致しない場合は、C2.4に戻り他の定義体を調べる。
このエラーが起こり得るのは、水平線分が一致しても帳
票が異なる場合や、水平線分の類似度のしきい値があま
い場合である。
【0066】ブロック437、439、441の条件を
満たす帳票であった場合には、その定義体の帳票に一致
する帳票としてOCRの処理を行う。いずれの帳票定義
体200に定義された帳票とも一致しない帳票の場合に
は、認識不能な帳票が入力されたものと判断し、エラー
の処理を行う。
【0067】
【発明の効果】以上説明したように、本発明によれば、
ページマークあるいはリファレンスマークなしの帳票
で、かつスキャナーが帳票のエッジを検出できないもの
であっても文字枠の特定と文字の認識が可能になる。
【0068】また、本発明によれば、高速に認識できる
水平成分のみから形成した外接長方形を基準としてビッ
トマップイメージの比較を行うことにより、ビットマッ
プイメージの識別処理を高速化することができる。
【0069】さらに、本発明によれば、イメージそのも
のをスキュー補正することなく、理想のイメージへマッ
ピングをすることにより、ビットマップイメージの識別
処理を高速化することができる。
【0070】そして、本発明によれば、外接長方形の4
隅を仮想ページマークとすることで、従来のページマー
クを基準とした文字枠の検出ロジックを流用し、ロジッ
クを簡明化することができる。
【0071】また、本発明によれば、外接長方形や水平
線分の定義情報を既存の帳票定義体に追加可能にするこ
とで、従来の帳票定義体の情報をそのまま利用でき、帳
票定義体を作成するオペレータの負担を軽減することが
できる。
【0072】
【図面の簡単な説明】
【図1】 ハードウェア構成を示すブロック図である。
【図2】 処理要素のブロック図である。
【図3】 帳票定義体の概念図である。
【図4】 属性定義を行うためのユーザインターフェー
スの一実施例を示す図である。
【図5】 本発明の好適な実施例における帳票定義体作
成処理の手順を示すフローチャートである。
【図6】 実際に各フィールドに記入された帳票が入力
された場合の、帳票のイメージを示した図である。
【図7】 帳票イメージから抽出された水平線分の概念
図である。
【図8】 帳票イメージから形成された外接長方形の概
念図である。
【図9】 本発明の好適な実施例における帳票識別/文
字認識処理の手順を示すフローチャートである。
【符号の説明】
100 画像処理システム 101 ユーザ入力部 103 制御部 105 画像解析部 107 画像表示部 109 属性情報入力制御部 111 画像入力部 113 定義体格納部 200 帳票(ビットマップ・イメージ)定義体
───────────────────────────────────────────────────── フロントページの続き (72)発明者 高 橋 弘 晏 神奈川県大和市下鶴間1623番地14 日本ア イ・ビー・エム株式会社 大和事業所内

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】ビットマップイメージの種類を特定するた
    めに複数のビットマップイメージの識別情報を含むビッ
    トマップイメージ定義体を有するビットマップイメージ
    識別装置上で実行される複数の水平線分イメージを含む
    ビットマップ・イメージの種類を識別する方法であっ
    て、 (a)前記ビットマップイメージを走査することにより
    複数の水平線分の特定情報を抽出する段階と、 (b)前記複数の水平線分定義情報に基づいて外接長方
    形の特定情報を抽出する段階と、 (c)前記抽出された外接長方形の特定情報と予め登録
    されたビットマップイメージ定義体の外接長方形特定情
    報に類似するか否かを検査する段階と、 を含むビットマップイメージの識別方法。
  2. 【請求項2】ビットマップイメージの種類を特定するた
    めに複数のビットマップイメージの識別情報を含むビッ
    トマップイメージ定義体を有するビットマップイメージ
    識別装置上で実行される複数の水平線分イメージを含む
    ビットマップ・イメージの種類を識別する方法であっ
    て、 (a)前記ビットマップイメージを走査することにより
    複数の水平線分の特定情報を抽出する段階と、 (b)前記抽出された複数の水平線分の特定情報と予め
    登録されたビットマップイメージ定義体の水平線分の特
    定情報に類似するか否かを検査する段階と、 を含むビットマップイメージの識別方法。
  3. 【請求項3】複数の水平線分イメージを含むビットマッ
    プ・イメージの種類を識別するための情報の取得方法で
    あって、 (a)前記ビットマップイメージを走査することにより
    複数の水平線分の特定情報を抽出する段階と、 (b)前記複数の水平線分定義情報に基づいて前記複数
    の水平線分のうちの2本の少なくとも一部分をその水平
    辺に含む矩形の特定情報を抽出する段階と、 (c)前記複数の水平線分定義情報に基づいて計算され
    た傾き情報に基づいて前記矩形の特定情報を変換する段
    階と、 (d)前記変換された矩形の定義情報を格納する段階
    と、 を含むビットマップイメージの識別を行うための情報の
    取得方法。
  4. 【請求項4】ビットマップイメージに含まれる文字枠の
    位置を認識する方法であって、 (a)前記ビットマップイメージを走査することにより
    複数の水平線分の特定情報を抽出する段階と、 (b)前記複数の水平線分定義情報に基づいて外接長方
    形の特定情報を抽出する段階と、 (c)前記ビットマップイメージに含まれる文字枠の特
    定情報を抽出する段階と、 (d)前記抽出された文字枠の特定情報を前記外接長方
    形の1つの頂点を基準とした位置情報として格納する段
    階と、 を含む文字枠の識別方法。
  5. 【請求項5】複数の水平線分イメージを含むビットマッ
    プ・イメージの種類を識別するビットマップイメージ識
    別装置であって、 (a)複数の水平線分イメージを含むビットマップ・イ
    メージを保持する画像入力部と、 (b)ビットマップイメージの種類を特定する複数のビ
    ットマップイメージの識別情報を含むビットマップイメ
    ージ定義体と、 (c1)前記ビットマップイメージを走査することによ
    り複数の水平線分の特定情報を抽出し、 (c2)前記複数の水平線分定義情報に基づいて外接長
    方形の特定情報を抽出し、 (c3)前記抽出された外接長方形の特定情報と予め登
    録されたビットマップイメージ定義体の外接長方形特定
    情報に類似するか否かを検査する画像解析部と、 を含むビットマップイメージ識別装置。
  6. 【請求項6】複数の水平線分イメージを含むビットマッ
    プ・イメージの種類を識別するビットマップイメージ識
    別装置であって、 (a)複数の水平線分イメージを含むビットマップ・イ
    メージを保持する画像入力部と、 (b)ビットマップイメージの種類を特定する複数のビ
    ットマップイメージの識別情報を含むビットマップイメ
    ージ定義体と、 (c1)前記ビットマップイメージを走査することによ
    り複数の水平線分の特定情報を抽出し、 (c2)前記抽出された複数の水平線分の特定情報と予
    め登録されたビットマップイメージ定義体の水平線分の
    特定情報に類似するか否かを検査する画像解析部と、 を含むビットマップイメージ識別装置。
  7. 【請求項7】複数の水平線分イメージを含むビットマッ
    プ・イメージの種類を識別するための情報を取得するビ
    ットマップイメージ処理装置であって、 (a1)前記ビットマップイメージを走査することによ
    り複数の水平線分の特定情報を抽出し、、 (a2)前記複数の水平線分定義情報に基づいて前記複
    数の水平線分のうちの2本の少なくとも一部分をその水
    平辺に含む矩形の特定情報を抽出し、 (a3)前記複数の水平線分定義情報に基づいて計算さ
    れた傾き情報に基づいて前記矩形の特定情報を変換する
    画像解析部と、 (b)前記変換された矩形の定義情報を格納するビット
    マップイメージ定義体と、 を含むビットマップイメージ処理装置。
  8. 【請求項8】ビットマップイメージに含まれる文字枠の
    位置を認識するビットマップイメージ処理装置であっ
    て、 (a1)前記ビットマップイメージを走査することによ
    り複数の水平線分の特定情報を抽出し、 (a2)前記複数の水平線分定義情報に基づいて外接長
    方形の特定情報を抽出し、 (a3)前記ビットマップイメージに含まれる文字枠の
    特定情報を抽出する画像解析部と、 (b)前記抽出された文字枠の特定情報を前記外接長方
    形の1つの頂点を基準とした位置情報として格納するビ
    ットマップイメージ定義体と、 を含むビットマップイメージ処理装置。
  9. 【請求項9】ビットマップイメージの種類を特定するた
    めに複数のビットマップイメージの識別情報を含むビッ
    トマップイメージ定義体を有するビットマップイメージ
    識別装置上で実行される複数の水平線分イメージを含む
    ビットマップ・イメージの種類を識別するイメージ処理
    プログラムを格納した記録媒体であって、 該イメージ処理プログラムは、 (a)前記ビットマップイメージを走査することにより
    複数の水平線分の特定情報を抽出することを前記ビット
    マップイメージ識別装置に指示するためのプログラムコ
    ードと、 (b)前記複数の水平線分定義情報に基づいて外接長方
    形の特定情報を抽出することを前記ビットマップイメー
    ジ識別装置に指示するためのプログラムコードと、 (c)前記抽出された外接長方形の特定情報と予め登録
    されたビットマップイメージ定義体の外接長方形特定情
    報に類似するか否かを検査することを前記ビットマップ
    イメージ識別装置に指示するためのプログラムコード
    と、 を含む記録媒体。
  10. 【請求項10】ビットマップイメージの種類を特定する
    ために複数のビットマップイメージの識別情報を含むビ
    ットマップイメージ定義体を有するビットマップイメー
    ジ識別装置上で実行される複数の水平線分イメージを含
    むビットマップ・イメージの種類を識別するイメージ処
    理プログラムを格納した記録媒体であって、 該イメージ処理プログラムは、 (a)前記ビットマップイメージを走査することにより
    複数の水平線分の特定情報を抽出することを前記ビット
    マップイメージ識別装置に指示するためのプログラムコ
    ードと、 (b)前記抽出された複数の水平線分の特定情報と予め
    登録されたビットマップイメージ定義体の水平線分の特
    定情報に類似するか否かを検査することを前記ビットマ
    ップイメージ識別装置に指示するためのプログラムコー
    ドと、 を含む記録媒体。
  11. 【請求項11】ビットマップイメージ処理装置において
    実行され、複数の水平線分イメージを含むビットマップ
    ・イメージの種類を識別するための情報の取得するイメ
    ージ処理プログラムを格納した記録媒体であって、 該イメージ処理プログラムは、 (a)前記ビットマップイメージを走査することにより
    複数の水平線分の特定情報を抽出することを前記ビット
    マップイメージ処理装置に指示するためのプログラムコ
    ードと、 (b)前記複数の水平線分定義情報に基づいて前記複数
    の水平線分のうちの2本の少なくとも一部分をその水平
    辺に含む矩形の特定情報を抽出することを前記ビットマ
    ップイメージ処理装置に指示するためのプログラムコー
    ドと、 (c)前記複数の水平線分定義情報に基づいて計算され
    た傾き情報に基づいて前記矩形の特定情報を変換するこ
    とを前記ビットマップイメージ処理装置に指示するため
    のプログラムコードと、 (d)前記変換された矩形の定義情報を格納することを
    前記ビットマップイメージ処理装置に指示するためのプ
    ログラムコードと、 を含む記録媒体。
  12. 【請求項12】ビットマップイメージ処理装置において
    実行され、ビットマップイメージに含まれる文字枠の位
    置を認識するイメージ処理プログラムを格納した記録媒
    体であって、 該イメージ処理プログラムは、 (a)前記ビットマップイメージを走査することにより
    複数の水平線分の特定情報を抽出することを前記ビット
    マップイメージ処理装置に指示するためのプログラムコ
    ードと、 (b)前記複数の水平線分定義情報に基づいて外接長方
    形の特定情報を抽出することを前記ビットマップイメー
    ジ処理装置に指示するためのプログラムコードと、 (c)前記ビットマップイメージに含まれる文字枠の特
    定情報を抽出することを前記ビットマップイメージ処理
    装置に指示するためのプログラムコードと、 (d)前記抽出された文字枠の特定情報を前記外接長方
    形の1つの頂点を基準とした位置情報として格納するこ
    とを前記ビットマップイメージ処理装置に指示するため
    のプログラムコードと、 を含む記録媒体。
JP9285709A 1997-10-17 1997-10-17 ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体 Pending JPH11143986A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP9285709A JPH11143986A (ja) 1997-10-17 1997-10-17 ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体
US09/132,943 US6356655B1 (en) 1997-10-17 1998-08-11 Apparatus and method of bitmap image processing, storage medium storing an image processing program
KR1019980036901A KR100315318B1 (ko) 1997-10-17 1998-09-08 비트맵이미지의처리방법및처리장치,비트맵이미지의처리를행하는이미지처리프로그램을저장한기억매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9285709A JPH11143986A (ja) 1997-10-17 1997-10-17 ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体

Publications (1)

Publication Number Publication Date
JPH11143986A true JPH11143986A (ja) 1999-05-28

Family

ID=17695020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9285709A Pending JPH11143986A (ja) 1997-10-17 1997-10-17 ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体

Country Status (3)

Country Link
US (1) US6356655B1 (ja)
JP (1) JPH11143986A (ja)
KR (1) KR100315318B1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6694065B2 (en) 2000-03-10 2004-02-17 Fujitsu Limited Image collating apparatus and image collating method
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
JP2010231431A (ja) * 2009-03-26 2010-10-14 Dainippon Printing Co Ltd 記事関連情報提供方法、装置、プログラム、記録媒体

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718059B1 (en) * 1999-12-10 2004-04-06 Canon Kabushiki Kaisha Block selection-based image processing
JP4401560B2 (ja) * 1999-12-10 2010-01-20 キヤノン株式会社 画像処理装置、画像処理方法、及び記憶媒体
EP1310904A4 (en) * 2000-06-02 2007-03-28 Japan Science & Tech Agency DOCUMENT PROCESSING METHOD, RECORDING MEDIA RECORDING A DOCUMENT PROCESSING PROGRAM AND DOCUMENT PROCESSOR
JP3864246B2 (ja) * 2001-05-30 2006-12-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 画像処理方法、画像処理システムおよびプログラム
US7099508B2 (en) * 2001-11-29 2006-08-29 Kabushiki Kaisha Toshiba Document identification device, document definition method and document identification method
KR100449486B1 (ko) * 2001-12-29 2004-09-22 한국전자통신연구원 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
CA2375355A1 (en) * 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
US20030214553A1 (en) * 2002-05-14 2003-11-20 Microsoft Corporation Ink regions in an overlay control
US8166388B2 (en) 2002-05-14 2012-04-24 Microsoft Corporation Overlaying electronic ink
US7158675B2 (en) * 2002-05-14 2007-01-02 Microsoft Corporation Interfacing with ink
US7925987B2 (en) * 2002-05-14 2011-04-12 Microsoft Corporation Entry and editing of electronic ink
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system
JP2005151282A (ja) * 2003-11-18 2005-06-09 Fuji Xerox Co Ltd 画像処理装置、画像処理方法、およびプログラム
US20070168382A1 (en) * 2006-01-03 2007-07-19 Michael Tillberg Document analysis system for integration of paper records into a searchable electronic database
US8014603B2 (en) * 2007-08-30 2011-09-06 Xerox Corporation System and method for characterizing handwritten or typed words in a document
US8045798B2 (en) * 2007-08-30 2011-10-25 Xerox Corporation Features generation and spotting methods and systems using same
US8340428B2 (en) 2008-04-02 2012-12-25 Xerox Corporation Unsupervised writer style adaptation for handwritten word spotting
WO2010129330A1 (en) * 2009-04-28 2010-11-11 Perceptive Software, Inc. Automatic forms processing systems and methods
CN102196112B (zh) * 2010-03-01 2014-09-24 佳能株式会社 用于检测页边界的方法和装置
EP2830024A4 (en) * 2012-03-22 2017-04-19 Glory Ltd. System for reading paper sheet serial number, and method for reading paper sheet serial number
JP5844698B2 (ja) * 2012-07-30 2016-01-20 富士通フロンテック株式会社 文字認識装置
CN104616009B (zh) * 2015-02-13 2018-05-18 广州广电运通金融电子股份有限公司 一种字符切割识别方法
JP6520279B2 (ja) * 2015-03-24 2019-05-29 富士ゼロックス株式会社 処理装置、画像処理システム、およびプログラム
US12026458B2 (en) * 2022-11-11 2024-07-02 State Farm Mutual Automobile Insurance Company Systems and methods for generating document templates from a mixed set of document types

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61289476A (ja) 1985-06-18 1986-12-19 Fujitsu Ltd 文字読取装置のフオ−マツト生成方式
JPH0223492A (ja) 1988-07-13 1990-01-25 Toshiba Corp 光学的文字読取装置
US5305396A (en) * 1992-04-17 1994-04-19 International Business Machines Corporation Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
JP3272842B2 (ja) * 1992-12-17 2002-04-08 ゼロックス・コーポレーション プロセッサベースの判定方法
JPH0721309A (ja) * 1993-06-30 1995-01-24 Matsushita Electric Ind Co Ltd 文書認識装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JP3338537B2 (ja) * 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置
US5835640A (en) * 1995-05-03 1998-11-10 Seiko Epson Corporation Method and apparatus for identifying and fixing horizontal and vertical lines in digitized images
JP3586949B2 (ja) 1995-11-16 2004-11-10 松下電器産業株式会社 帳票認識装置
JPH09185675A (ja) 1995-12-28 1997-07-15 Hitachi Ltd 様式解析方法
US5923782A (en) * 1996-08-01 1999-07-13 Nynex Science & Technology, Inc. System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
US6694065B2 (en) 2000-03-10 2004-02-17 Fujitsu Limited Image collating apparatus and image collating method
JP2010231431A (ja) * 2009-03-26 2010-10-14 Dainippon Printing Co Ltd 記事関連情報提供方法、装置、プログラム、記録媒体

Also Published As

Publication number Publication date
US6356655B1 (en) 2002-03-12
KR19990036622A (ko) 1999-05-25
KR100315318B1 (ko) 2002-01-12

Similar Documents

Publication Publication Date Title
JPH11143986A (ja) ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体
JP3113827B2 (ja) 矩形オブジェクトの認識方法及び認識装置
JP3805005B2 (ja) 画像処理装置及び光学的文字認識装置及びそれらの方法
US5410611A (en) Method for identifying word bounding boxes in text
US6600834B1 (en) Handwriting information processing system with character segmentation user interface
JP3864246B2 (ja) 画像処理方法、画像処理システムおよびプログラム
JP5357612B2 (ja) 下線除去装置
WO2020248497A1 (zh) 图片扫描件处理方法、装置、计算机设备及存储介质
JP4078009B2 (ja) 帳票における文字記録領域の検出装置、帳票における文字記録領域の検出方法、記憶媒体及び帳票フォーマット作成装置
JPH01253077A (ja) 文字列検出方法
CN113378839A (zh) 信息处理装置、信息处理方法及计算机可读介质
JP3571128B2 (ja) 図面の寸法数値認識方法及びその装置
JP3186246B2 (ja) 文書読取装置
JPH10171920A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JP5051174B2 (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム
JP7532124B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP3186712B2 (ja) 文書読取装置
JP3412998B2 (ja) 画像処理装置及びその方法
JP2755299B2 (ja) 画像処理方法
JP2023012225A (ja) 支援システム、支援方法及びプログラム
JP2002157550A (ja) 文字認識装置、文字認識方法、および記録媒体
JPH11250179A (ja) 文字認識装置および文字認識方法
JP2020095430A (ja) 情報処理装置、その制御方法とプログラム
JPH0434655A (ja) 図面読取装置
JPH10340314A (ja) 帳票処理システム、その文字認識方法およびその記録媒体