JPH11282956A - 帳票識別方法、装置および記録媒体 - Google Patents

帳票識別方法、装置および記録媒体

Info

Publication number
JPH11282956A
JPH11282956A JP10079086A JP7908698A JPH11282956A JP H11282956 A JPH11282956 A JP H11282956A JP 10079086 A JP10079086 A JP 10079086A JP 7908698 A JP7908698 A JP 7908698A JP H11282956 A JPH11282956 A JP H11282956A
Authority
JP
Japan
Prior art keywords
image
registered
fixed form
identifying
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10079086A
Other languages
English (en)
Inventor
Mitsugi Matsushita
貢 松下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10079086A priority Critical patent/JPH11282956A/ja
Publication of JPH11282956A publication Critical patent/JPH11282956A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 (修正有) 【課題】 基本構造が類似した帳票でも高精度に識別す
る。 【解決手段】 全体画像識別部5は、入力帳票画像と、
辞書3に登録されている帳票の全体画像とを照合するこ
とにより、帳票を識別する。次いで、識別された1ない
し複数の帳票について、さらに部分画像識別部6は、帳
票名などを照合することにより帳票を識別する。また、
画像の一部は文字情報である。また、登録画像の作成時
に、登録対象画像の一部を登録する。また、登録画像の
作成時に、既登録画像と登録対象画像との最も相違する
部分を登録する。また、定型帳票の画像と類似する登録
画像が複数種類あるときにのみ、画像の一部を照合す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、定型帳票の種類を
自動識別する帳票識別方法、装置および記録媒体に関す
る。
【0002】
【従来の技術】帳票を自動的に処理する帳票処理におい
て、処理対象の定型帳票が登録されている複数種類の帳
票の何れに該当しているかを識別する帳票識別方法が、
種々提案されている。
【0003】その内、最も一般的な方法としては、帳票
中の一部に帳票IDという文字を印刷しておき、その帳
票IDを照合することにより、どの帳票であるかを識別
する方法である。この方法では、帳票に必ず帳票IDを
印刷しなければならず、既に流通している帳票IDが付
いていない帳票を識別することができない。
【0004】そこで、このような帳票IDを利用せずに
帳票を識別する方法も提案されている。すなわち、この
方法は、予め識別させたい帳票を登録しておき、帳票中
の画像的特徴を用いて、パターンマッチングなどで帳票
を識別する方法であり、例えば、本出願人が先に提案し
た帳票種識別方法(特願平9−290755号)があ
る。
【0005】
【発明が解決しようとする課題】しかし、上記した方法
では、画像全体の特徴を利用して帳票を識別するので、
登録した帳票中に類似した種類の帳票、例えば、帳票の
基本構造(大きさ、罫線情報など)が全く同じで、帳票
名だけが、”発注書”と”受入書”のように異なる場合
には、精度よく識別できない。
【0006】ところで、コンピューター技術の進歩に伴
い、OCRをはじめとする文書画像認識の技術も進展
し、この文書画像認識技術を利用したシステムとして、
受発注書など定型帳票を自動的に処理する帳票処理シス
テムが実用化されている。この帳票処理システムの中
で、処理対象の定型帳票が登録されている複数種類の帳
票の何れに該当しているかを識別する方法は重要な技術
である。
【0007】特に帳票IDを利用するOCR専用帳票だ
けでなく、OCR処理を考慮していない既に流通してい
る帳票でも利用できる帳票識別方法に対しては期待が大
きい。しかし、従来の技術では、類似した帳票を精度よ
く識別できないという問題点があった。
【0008】本発明は、上記した事情を考慮してなされ
たもので、本発明の目的は、基本構造が類似した帳票で
も高精度に識別できる帳票識別方法、装置および記録媒
体を提供することにある。
【0009】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、処理対象の定型帳票が、
登録されている複数種類の帳票の何れに該当しているか
を識別する帳票識別方法であって、前記定型帳票の画像
の特徴と各登録画像の特徴とを照合することにより前記
定型帳票の画像に該当する登録画像を識別し、さらに、
前記識別された登録画像の一部と、前記定型帳票の画像
の一部とを照合することにより前記定型帳票の種類を識
別することを特徴としている。
【0010】請求項2記載の発明では、前記画像の一部
は文字情報であることを特徴としている。
【0011】請求項3記載の発明では、前記登録画像の
作成時に、登録対象画像の一部を登録することを特徴と
している。
【0012】請求項4記載の発明では、前記登録画像の
作成時に、既登録画像と登録対象画像との最も相違する
部分を登録することを特徴としている。
【0013】請求項5記載の発明では、前記定型帳票の
画像と類似する登録画像が複数種類あるときにのみ、前
記画像の一部を照合することを特徴としている。
【0014】請求項6記載の発明では、定型帳票を入力
する手段と、入力された帳票から辞書用の帳票画像を作
成する手段と、該作成された複数種類の帳票画像を登録
する手段と、入力された処理対象の定型帳票の画像の特
徴と前記各登録画像の特徴とを照合することにより前記
処理対象の定型帳票の画像に該当する登録画像を識別す
る手段と、前記識別された登録画像の一部と、前記処理
対象の定型帳票の画像の一部とを照合することにより前
記処理対象の定型帳票の種類を識別する手段を備えたこ
とを特徴としている。
【0015】請求項7記載の発明では、定型帳票を入力
する機能と、入力された帳票から辞書用の帳票画像を作
成する機能と、該作成された複数種類の帳票画像を登録
する機能と、入力された処理対象の定型帳票の画像の特
徴と前記各登録画像の特徴とを照合することにより前記
処理対象の定型帳票の画像に該当する登録画像を識別す
る機能と、前記識別された登録画像の一部と、前記処理
対象の定型帳票の画像の一部とを照合することにより前
記処理対象の定型帳票の種類を識別する機能をコンピュ
ータに実現させるためのプログラムを記録したコンピュ
ータ読み取り可能な記録媒体であることを特徴としてい
る。
【0016】
【発明の実施の形態】以下、本発明の一実施例を図面を
用いて具体的に説明する。 〈実施例1〉図1は、本発明の実施例1の構成を示す。
図において、1は画像入力部、2は帳票辞書作成部、3
は帳票辞書保存部、4は帳票識別部であり、全体画像識
別部5と、部分画像識別部6からなる。図2は、実施例
1の処理フローチャートである。
【0017】スキャナーなどの画像入力部1によって帳
票の画像を入力する(ステップ101)。帳票画像を登
録することにより辞書を作成するときには(ステップ1
02)、帳票辞書作成部2は、画像入力部1から入力さ
れた画像の特徴を登録することにより、辞書を作成する
(ステップ103)。この辞書作成時に、入力画像中の
特徴的な部分だけを取り出したり、あるいは画像全体を
帳票辞書として作成してもよい。
【0018】ここで作成する帳票辞書は、帳票識別部4
で利用されるので、識別部4で使用できるフォーマット
で辞書を作成する。また、帳票辞書作成部2において、
処理対象領域の座標値を定義したり、定義した各領域に
は、どのような文字種が記入されているか、あるいはど
のような情報が記入されているかを定義してもよい。す
なわち、例えば、帳票中の郵便番号が記入された領域で
あれば、その数字が記入される領域の座標値と、3桁、
5桁、7桁のいずれかの数字であり、この数字は郵便番
号であるという情報などを定義すればよい。
【0019】なお、帳票辞書作成部2は、帳票登録時に
利用され、帳票識別処理時には利用されないので、帳票
辞書作成部3を別システムとして構築してもよい。
【0020】帳票辞書保存部3は、上記したように帳票
辞書作成部2で作成された帳票辞書を保存する。帳票識
別部4は、画像入力部1から入力された帳票画像と帳票
辞書保存部4に保存されている帳票辞書とを照合する。
すなわち、まず、帳票識別部4の全体画像識別部5は、
帳票画像の特徴を用いて帳票を識別する(ステップ10
4)。
【0021】この識別方法としては、前掲した先の出願
の方法を用いる。この方法では、処理対象画像と登録画
像間との対応点を検出する対応点検出手段と、対応点検
出結果から変換係数を求める変換係数算出手段と、変換
係数から画像間の相違度を求める画像間相違度算出手段
と、相違度を基に帳票種を判定する帳票種判定手段とを
設け、対応点検出手段は、登録画像格納手段から1枚の
登録帳票画像を読み出し、登録帳票画像と画像格納手段
内の処理対象画像との対応する点を検出する。対応点の
検出方法としては、例えば、罫線の位置、帳票固有の文
字の印刷位置などの座標値を比較することにより対応す
る点を座標値として求める。
【0022】次いで、変換係数算出手段は、変換係数の
算出を行う。ここで変換係数とは、一方の画像上の座標
値を変換係数を用いて変換すると、他方の画像の座標値
として求められる、変換式を構成する、例えばアフィン
変換の係数などである。次いで、画像間相違度算出手段
は、画像間の相違度を算出する。相違度は上記したアフ
ィン変換の係数から求める。上記した処理を登録されて
いる帳票種のすべてについて行い、相違度を求め、帳票
種判定手段はそれらを比較し、最も相違度の小さいもの
を該当する帳票と判断し出力する。
【0023】図1、2に戻って、全体画像識別部5によ
って識別された1ないし複数の帳票について、部分画像
識別部6は、帳票中の一部分、例えば、帳票に記入され
ている帳票名(発注書、受入伝票など)の部分画像に注
目して、識別された帳票の帳票名と、入力帳票の帳票名
との照合を行うことにより帳票を識別する(ステップ1
05)。上記した部分画像に注目する方法としては、例
えば、画像の特徴を基に類似度を計算するとき、注目す
る画像部分に対して重みを大きくして計算する。
【0024】〈実施例2〉図3は、本発明の実施例2の
構成を示し、図4は、実施例2の処理フローチャートで
ある。本実施例では、実施例1の部分画像識別部を、文
字情報識別部16に置き換えて構成している。他の構成
要素は実施例1と同様である。
【0025】図4のステップ204までの処理は実施例
1と同様である。文字情報識別部16は、入力帳票中に
記入されている文字情報、例えば、帳票に記入されてい
る帳票名(発注書、受入伝票など)を用いて識別する。
上記した帳票名は例えば入力帳票画像を文字認識するこ
とによって得られる。
【0026】〈実施例3〉図5は、実施例3の構成を示
し、図6は、実施例3の処理フローチャートである。実
施例1と異なる点は、帳票辞書作成部22に部分画像登
録部23を設けた点であり、他の構成要素は実施例1と
同様である。
【0027】帳票辞書作成部22内の部分画像登録部2
3は、帳票辞書を作成する際に、帳票中の注目部分、例
えば、帳票名(発注客、受入伝票など)が記入されてい
る領域を登録する(ステップ303)。従って、ステッ
プ306では、辞書内に登録されている注目部分と、入
力帳票の注目部分との照合を行う。他の処理ステップの
内容は実施例1と同様であるので、その説明は省略す
る。
【0028】〈実施例4〉図7は、実施例4の処理フロ
ーチャートである。実施例4の構成は図5を用いる。本
実施例では、注目部分を自動的に登録する(ステップ4
03)。すなわち、帳票辞書を作成する際に、入力帳票
を登録する以前に登録されている他の種類の帳票を利用
して、帳票中の注目部分を自動的に登録する。例えば、
入力帳票を複数の部分に分割し、既に登録済の帳票との
類似度計算を各部分毎に行い、最も類似度の低い部分
(相違度が最も大きい部分)を注目部分として登録す
る。
【0029】〈実施例5〉図8は、実施例5の処理フロ
ーチャートである。実施例5の構成は図5を用いる。本
実施例では、実施例3の注目部分を複数にした場合の実
施例である。実施例3と同様にして、帳票辞書を作成す
る際に、帳票中の複数の注目部分を登録する(ステップ
503、504)。そして、ステップ507で帳票識別
を行う際に、帳票中の複数の注目部分、例えば、帳票に
記入されている帳票名(発注書、受入伝票など)など複
数の部分の画像に注目して帳票を識別する(ステップ5
07)。上記した部分画像に注目する方法としては、例
えば、画像の特徴を基に類似度を計算するとき、注目す
る画像部分に対して重みを大きくして計算する。
【0030】〈実施例6〉図9は、実施例6の処理フロ
ーチャートである。実施例6の構成は図1を用いる。本
実施例では、全体画像識別部5が、入力帳票と類似する
登録帳票が複数種類、辞書3に存在すると判定した場合
にのみ(ステップ604、605)、部分画像識別部6
は注目部分を利用した帳票識別を行う(ステップ60
6)。ステップ606の処理は実施例1と同様である。
類似帳票がない場合には、注目部分を利用した識別処理
を実行せずに処理を終了する。
【0031】〈実施例7〉図10は、本発明をソフトウ
ェアによって実現する場合の実施例である。本発明をソ
フトウェアによって実現する場合には、図10に示すよ
うに、CPU、メモリ、表示装置、ハードディスク、キ
ーボード、CD−ROMドライブ、スキャナなどからな
るコンピュータシステムを用意し、CD−ROMなどの
コンピュータ読み取り可能な記録媒体には、本発明の帳
票識別機能を実現するプログラム、帳票辞書などが記録
されている。また、処理対象となる帳票画像などはハー
ドディスクなどに格納されている。そして、該プログラ
ムが起動されると、帳票画像データが読み込まれて、帳
票識別処理を実行し、その識別結果をディスプレイなど
に出力する。
【0032】
【発明の効果】以上、説明したように、請求項1、6、
7記載の発明によれば、帳票の基本構造(大きさ、罫線
情報など)が同一で、帳票名(”発注書”、”受入
書”)のみが異なる帳票を精度よく識別することができ
る。
【0033】請求項2記載の発明によれば、文字情報を
利用しているので、帳票の基本構造が同一で、帳票名の
みが異なる帳票をより精度よく識別することができる。
【0034】請求項3記載の発明によれば、注目部分を
登録しているので、帳票の識別を高精度に行うことが可
能となる。
【0035】請求項4記載の発明によれば、注目部分を
自動的に登録できるので、ユーザーの負担が少なくな
り、より使いやすくなる。
【0036】請求項5記載の発明によれば、辞書中に類
似帳票が存在する場合にのみ、注目部分を利用して帳票
を識別しているので、類似帳票がない場合の処理量が少
なくなり、高速処理が可能となる。
【図面の簡単な説明】
【図1】本発明の実施例1の構成を示す。
【図2】本発明の実施例1の処理フローチャートであ
る。
【図3】本発明の実施例2の構成を示す。
【図4】本発明の実施例2の処理フローチャートであ
る。
【図5】本発明の実施例3の構成を示す。
【図6】本発明の実施例3の処理フローチャートであ
る。
【図7】本発明の実施例4の処理フローチャートであ
る。
【図8】本発明の実施例5の処理フローチャートであ
る。
【図9】本発明の実施例6の処理フローチャートであ
る。
【図10】本発明の実施例7の構成を示す。
【符号の説明】
1 画像入力部 2 帳票辞書作成部 3 帳票辞書保存部 4 帳票識別部 5 全体画像識別部 6 部分画像識別部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 処理対象の定型帳票が、登録されている
    複数種類の帳票の何れに該当しているかを識別する帳票
    識別方法であって、前記定型帳票の画像の特徴と各登録
    画像の特徴とを照合することにより前記定型帳票の画像
    に該当する登録画像を識別し、さらに、前記識別された
    登録画像の一部と、前記定型帳票の画像の一部とを照合
    することにより前記定型帳票の種類を識別することを特
    徴とする帳票識別方法。
  2. 【請求項2】 前記画像の一部は文字情報であることを
    特徴とする請求項1記載の帳票識別方法。
  3. 【請求項3】 前記登録画像の作成時に、登録対象画像
    の一部を登録することを特徴とする請求項1記載の帳票
    識別方法。
  4. 【請求項4】 前記登録画像の作成時に、既登録画像と
    登録対象画像との最も相違する部分を登録することを特
    徴とする請求項1記載の帳票識別方法。
  5. 【請求項5】 前記定型帳票の画像と類似する登録画像
    が複数種類あるときにのみ、前記画像の一部を照合する
    ことを特徴とする請求項1記載の帳票識別方法。
  6. 【請求項6】 定型帳票を入力する手段と、入力された
    帳票から辞書用の帳票画像を作成する手段と、該作成さ
    れた複数種類の帳票画像を登録する手段と、入力された
    処理対象の定型帳票の画像の特徴と前記各登録画像の特
    徴とを照合することにより前記処理対象の定型帳票の画
    像に該当する登録画像を識別する手段と、前記識別され
    た登録画像の一部と、前記処理対象の定型帳票の画像の
    一部とを照合することにより前記処理対象の定型帳票の
    種類を識別する手段を備えたことを特徴とする帳票識別
    装置。
  7. 【請求項7】 定型帳票を入力する機能と、入力された
    帳票から辞書用の帳票画像を作成する機能と、該作成さ
    れた複数種類の帳票画像を登録する機能と、入力された
    処理対象の定型帳票の画像の特徴と前記各登録画像の特
    徴とを照合することにより前記処理対象の定型帳票の画
    像に該当する登録画像を識別する機能と、前記識別され
    た登録画像の一部と、前記処理対象の定型帳票の画像の
    一部とを照合することにより前記処理対象の定型帳票の
    種類を識別する機能をコンピュータに実現させるための
    プログラムを記録したコンピュータ読み取り可能な記録
    媒体。
JP10079086A 1998-03-26 1998-03-26 帳票識別方法、装置および記録媒体 Pending JPH11282956A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10079086A JPH11282956A (ja) 1998-03-26 1998-03-26 帳票識別方法、装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10079086A JPH11282956A (ja) 1998-03-26 1998-03-26 帳票識別方法、装置および記録媒体

Publications (1)

Publication Number Publication Date
JPH11282956A true JPH11282956A (ja) 1999-10-15

Family

ID=13680083

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10079086A Pending JPH11282956A (ja) 1998-03-26 1998-03-26 帳票識別方法、装置および記録媒体

Country Status (1)

Country Link
JP (1) JPH11282956A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2414614A (en) * 2004-05-28 2005-11-30 Sony Uk Ltd Image processing to determine most dissimilar images
JP2007179307A (ja) * 2005-12-28 2007-07-12 Hitachi Computer Peripherals Co Ltd 帳票識別装置
JP2008165339A (ja) * 2006-12-27 2008-07-17 Mitsubishi Electric Information Systems Corp 帳票識別装置及び帳票識別プログラム
JP2011123598A (ja) * 2009-12-09 2011-06-23 Canon Inc 原稿判別装置、原稿判別方法及びプログラム
JP2017083943A (ja) * 2015-10-23 2017-05-18 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2017084299A (ja) * 2015-10-30 2017-05-18 株式会社シーイーシー 画像処理装置および画像処理方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2414614A (en) * 2004-05-28 2005-11-30 Sony Uk Ltd Image processing to determine most dissimilar images
US7630561B2 (en) 2004-05-28 2009-12-08 Sony United Kingdom Limited Image processing
JP2007179307A (ja) * 2005-12-28 2007-07-12 Hitachi Computer Peripherals Co Ltd 帳票識別装置
JP2008165339A (ja) * 2006-12-27 2008-07-17 Mitsubishi Electric Information Systems Corp 帳票識別装置及び帳票識別プログラム
JP2011123598A (ja) * 2009-12-09 2011-06-23 Canon Inc 原稿判別装置、原稿判別方法及びプログラム
JP2017083943A (ja) * 2015-10-23 2017-05-18 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2017084299A (ja) * 2015-10-30 2017-05-18 株式会社シーイーシー 画像処理装置および画像処理方法

Similar Documents

Publication Publication Date Title
US8156427B2 (en) User interface for mixed media reality
US7669148B2 (en) System and methods for portable device for mixed media system
US8195659B2 (en) Integration and use of mixed media documents
JP3602596B2 (ja) ドキュメントファイリング装置および方法
US20070047781A1 (en) Authoring Tools Using A Mixed Media Environment
US20070047002A1 (en) Embedding Hot Spots in Electronic Documents
US20070047819A1 (en) Data organization and access for mixed media document system
JP2004334334A (ja) 文書検索装置、文書検索方法及び記憶媒体
JP2004348591A (ja) 文書検索方法及び装置
JP2005018678A (ja) 帳票データ入力処理装置、帳票データ入力処理方法及びプログラム
WO2000052645A1 (fr) Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document
JP2007172077A (ja) 画像検索システム及び方法及びプログラム
EP1118959B1 (en) Method and apparatus for determining form sheet type
JPH11282956A (ja) 帳票識別方法、装置および記録媒体
JPH07200631A (ja) 電子ファイリング装置
JP4140221B2 (ja) 画像照合装置および画像照合プログラム
JP5481965B2 (ja) 情報処理装置及び情報処理プログラム
JP3648050B2 (ja) 帳票画像分類方法、帳票画像登録方法および帳票画像分類装置
JP4517822B2 (ja) 画像処理装置及びプログラム
JP2009182530A (ja) 業務処理遂行支援装置
JPH11328306A (ja) 文書画像の論理要素抽出方法、装置および記録媒体
JP3090070B2 (ja) 帳票識別方法及び装置
KR20090123523A (ko) 광학 문자 인식 시스템 및 방법
JP2001005831A (ja) ファイリング方法及びそれを格納した記録媒体
JPH07152856A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060605

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060726