JPH10240863A - タイミングマーク検出方法および記憶媒体 - Google Patents

タイミングマーク検出方法および記憶媒体

Info

Publication number
JPH10240863A
JPH10240863A JP9044102A JP4410297A JPH10240863A JP H10240863 A JPH10240863 A JP H10240863A JP 9044102 A JP9044102 A JP 9044102A JP 4410297 A JP4410297 A JP 4410297A JP H10240863 A JPH10240863 A JP H10240863A
Authority
JP
Japan
Prior art keywords
timing mark
rectangle
feature amount
extracted
timing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9044102A
Other languages
English (en)
Inventor
Keiji Kojima
啓嗣 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP9044102A priority Critical patent/JPH10240863A/ja
Publication of JPH10240863A publication Critical patent/JPH10240863A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 入力された帳票画像から精度よく、かつ高速
にタイミングマークを検出する。 【解決手段】 タイミングマーク検索範囲決定手段1
は、予め設定されているタイミングマークの位置を基
に、帳票画像におけるタイミングマークの検索範囲を決
める。矩形抽出手段2は、検索範囲内で矩形を抽出し、
特徴抽出手段3は矩形の特徴量(矩形の大きさなど)を
抽出し、距離演算手段4は、タイミングマークの特徴量
と矩形の特徴量との距離を算出し、判定手段5は、その
距離が所定の閾値以下のとき、タイミングマークとして
判定出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された帳票な
どからタイミングマークを精度よく検出するタイミング
マーク検出方法および記憶媒体に関する。
【0002】
【従来の技術】タイミングマークの検出は、定型文書の
処理に利用される。すなわち、図8に示すように、原稿
がスキャナー、FAX等から入力される際に、画像が傾
いたり(スキューしたり)、画像がずれたり、伸縮した
りするのを補正するための前処理(画像の位置合わせ)
として、タイミングマークを検出する。
【0003】タイミングマークを検出し、その検出結果
からスキュー角度、ずれ、伸縮度を抽出し、画像を補正
する。画像が補正され、位置合わせが完了すると、その
後の処理であるOCR処理に対して正確な文字領域を渡
すことができ、文字認識処理が可能になる。
【0004】図9は、タイミングマークを説明する図で
ある。タイミングマークは、画像が傾いたり(スキュー
したり)、画像がずれたり、伸縮したりするのを補正す
るために使用される基準点である。一般的には、一原稿
にタイミングマークが3点(左上、右上、左下または右
下)設けられていて、左上と右上の2点のタイミングマ
ークは、入力された画像がどの程度傾いているのか(ス
キューしているのか)、X方向にどの程度ずれ、伸縮し
ているのかを検出することができ、残るもう1点のタイ
ミングマークを利用することによって、Y方向にどの程
度ずれ、伸縮しているのかを検出することができる。
【0005】このように、画像の傾き(スキュー)、ず
れ、伸縮を補正しなければ、その後の処理であるOCR
に対して正確な文字領域の位置を渡すことができなくな
り、結果としてOCRの認識精度が低下することになる
ため、その基準点となるタイミングマークを精度よく抽
出することが要求される。
【0006】
【発明が解決しようとする課題】タイミングマークを検
出する従来の技術として、例えば特公平6−50534
号公報に記載された「マーク検出方式」がある。この方
式では、カメラ等の入力を前提にしているため、入力画
像を2値化せず、直接多値の画像に対して微分フィルタ
リング処理を行い、タイミングマークを検出するもので
ある。
【0007】しかし、上記した技術は、多値の画像を前
提とした処理であるので、処理データが多くなり、その
結果、処理時間がかかるという問題がある。
【0008】本発明の目的は、入力された帳票の2値画
像から精度よく、かつ高速にタイミングマークを検出す
るタイミングマーク検出方法および記憶媒体を提供する
ことにある。
【0009】
【課題を解決するための手段】前記目的を達成するため
に、請求項1記載の発明では、タイミングマークが印刷
された帳票を読み取ることによって得られる2値の入力
画像について、予め設定されているタイミングマークの
位置を基にタイミングマークの検索範囲を決め、該タイ
ミングマークの検索範囲内で矩形を抽出し、該抽出され
た矩形の特徴量を抽出し、予め設定されているタイミン
グマークの特徴量と前記矩形の特徴量との距離を算出
し、該算出された距離が所定の閾値を満たすとき、前記
矩形をタイミングマークとして検出することを特徴とし
ている。
【0010】請求項2記載の発明では、前記特徴量は、
抽出された矩形の大きさであることを特徴としている。
【0011】請求項3記載の発明では、前記特徴量は、
抽出された矩形の黒画素数であることを特徴としてい
る。
【0012】請求項4記載の発明では、前記特徴量は、
請求項2記載の特徴量と請求項3記載の特徴量との組み
合わせであることを特徴としている。
【0013】請求項5記載の発明では、タイミングマー
クが印刷された帳票を読み取ることによって得られる2
値の入力画像について、予め設定されているタイミング
マークの位置を基にタイミングマークの検索範囲を決め
る機能と、該タイミングマークの検索範囲内で矩形を抽
出する機能と、該抽出された矩形の特徴量を抽出する機
能と、予め設定されているタイミングマークの特徴量と
前記矩形の特徴量との距離を算出する機能と、該算出さ
れた距離が所定の閾値を満たすとき、前記矩形をタイミ
ングマークとして検出する機能をコンピュータに実現さ
せるためのプログラムを記憶した記憶媒体であることを
特徴としている。
【0014】
【発明の実施の形態】以下、本発明の一実施例を図面を
用いて具体的に説明する。 〈実施例1〉図1は、本発明の実施例の構成を示す。本
発明のタイミングマーク検出装置は、タイミングマーク
の検索範囲を決定するタイミングマーク検索範囲決定手
段1と、検索範囲内から矩形を抽出する矩形抽出手段2
と、抽出された矩形の特徴量を抽出する特徴抽出手段3
と、矩形の特徴量とタイミングマークの特徴量との距離
を算出する距離算出手段4と、距離が所定の閾値以下の
矩形をタイミングマークとして判定出力する判定手段5
から構成されている。
【0015】図2は、本発明のタイミングマーク検出処
理のフローチャートである。まず、タイミングマーク検
索範囲決定手段1は、入力された2値の入力画像につい
て、予め設定されているタイミングマークの位置(つま
り、スキューなどがないタイミングマークの位置)を基
に、タイミングマークの検索範囲を求める(ステップ1
01)。検索範囲は、スキュー、ずれ等をどの程度許容
するかによって決まる。すなわち、図3に示すように、
予め設定されたタイミングマークの位置に許容量(±
α)を加減算した座標値が、タイミングマークの検索範
囲になり、この検索範囲にタイミングマークが含まれる
ように範囲を決めればよい。また、この範囲は自動的か
つ動的に決めてもよいし、またユーザが画像を入力する
度に範囲を指定するようにしてもよい。
【0016】タイミングマークの検索範囲が決定される
と、次に、矩形抽出手段2は、タイミングマークの検索
範囲内で矩形(外接矩形)を抽出する(ステップ10
2)。この矩形抽出方法としては、黒画素の連結成分を
抽出する周知の方法を用いる。矩形の抽出処理によっ
て、通常、複数の矩形が抽出される。すなわち、タイミ
ングマークの検出範囲には、検出すべきタイミングマー
クだけではなく、文字矩形やノイズ矩形等が含まれる可
能性があり、複数の矩形とは、これらの矩形をいう。
【0017】ただし、図3に示すように、検索範囲に接
する矩形は、ノイズとして削除(無視)する。また、矩
形抽出処理が終了した時点で、矩形が抽出されなかった
ときは、タイミングマークの検出が不可能となる(ステ
ップ109)。
【0018】次いで、複数の矩形が抽出されると、特徴
抽出手段3は、各矩形から特徴量を抽出する特徴抽出処
理を行う(ステップ104)。各矩形の特徴量を求めた
後、距離算出手段4は、予め設定されているタイミング
マークの特徴量と、各矩形の特徴量との距離を算出し、
タイミングマークの候補を求める(ステップ105、1
06)。ここで、距離とは、例えば特徴量の差分をとる
相違度であり、距離が小さいほど相違度が小さく、タイ
ミングマークの候補順位が上位になる。
【0019】このようにして距離演算を行い、タイミン
グマークの候補順位として、第1候補から第n侯補まで
決まると、判定手段5は、算出された第1侯補の距離
が、予め設定されているしきい値を満足するか否かを判
定し、しきい値以下のとき、第1侯補をタイミングマー
クとして出力する(ステップ108)。このようにしき
い値との比較処理を行うことによって、文字等の部分を
タイミングマークとして誤って抽出することが防止され
る。つまり、距離演算された第1侯補をそのままタイミ
ングマークとして出力した場合には、タイミングマーク
がない画像を処理したときに、文字等の部分を誤ってタ
イミングマークとして抽出することになる。したがっ
て、タイミングマークの検出は、タイミングマークがあ
るときには精度よく検出し、タイミングマークがないと
きは、「ない(検出不可能)」と結果を出力する(ステ
ップ109)。
【0020】〈実施例2〉実施例1における特徴量とし
て、矩形抽出手段で得られた矩形の大きさ(幅、高さ)
を特徴量とする。矩形の大きさとしては、以下の3種類
を例示する。
【0021】(1)第1の例では、矩形抽出で得られた
矩形の座標値を基に、矩形の大きさ(幅、高さ)を求め
る(図4)。 (2)第2の例では、矩形抽出の途中段階の黒ランを求
める時に、求めた黒ランの始点、終点座標の平均を求
め、仮想的な矩形の大きさ(幅、高さ)を求める(図5
(a))。ただし、(b)に示すように、黒ランを統合
して生成された矩形の一番外側の黒画素の座標値の平均
を求める。 (3)第3の例では、矩形抽出の途中段階の黒ランを求
める時に、求めた黒ランの始点、終点座標の平均を求
め、仮想的な矩形の大きさ(幅、高さ)を求める(図6
(a))。ただし、第2の例とは異なり、(b)に示す
ように、黒ラン毎の座標値の平均を求める。
【0022】〈実施例3〉実施例1における特徴量とし
て、矩形抽出手段で得られた矩形の黒画素数を特徴量と
する。この特徴量は、タイミングマークと同じ大きさの
文字とタイミングマークとを区別するために有効であ
る。黒画素数は、矩形抽出の途中段階の黒ランを統合す
る時に、黒ランの長さを加算することによって求めるこ
とができる。
【0023】〈実施例4〉実施例1における特徴量とし
て、本実施例では、実施例2の特徴量である矩形の大き
さと、実施例3の特徴量である黒画素数を組み合わせ
る。特徴量を求めるときには、それぞれの特徴量を予め
設定されているタイミングマークの大きさと黒画素数で
正規化し、それぞれの値を加算することによって、一つ
の距離が求まる。例えば、 正規化後の大きさ=(大きさ×100)/予め設定され
ているタイミングマークの大きさ 正規化後の黒画素数=(黒画素数×100)/予め設定
されているタイミングマークの黒画素数 距離=正規化後の大きさ+正規化後の黒画素数。
【0024】なお、本発明は上記したものに限定され
ず、ソフトウェアによっても実現することができる。本
発明をソフトウェアによって実現する場合には、図7に
示すように、CPU、ROM、RAM、表示装置、ハー
ドディスク、キーボード、CD−ROMドライブ、スキ
ャナなどからなる汎用の処理装置を用意し、CD−RO
Mなどのコンピュータ記憶媒体には、本発明のタイミン
グマークの検出処理機能を実現するプログラムが記憶さ
れている。また、帳票などの原稿をスキャナで読み取
り、RAMなどに格納し、上記したプログラムを実行す
ることによりタイミングマークを検出する。
【0025】
【発明の効果】以上、説明したように、本発明によれ
ば、入力画像中の所定の検索範囲内から抽出された矩形
について特徴量を求め、タイミングマークの特徴量に最
も類似している矩形を第1の候補とし、しかも、その第
1候補の矩形が所定の閾値以下のものをタイミングマー
クとして検出しているので、文字などの矩形と精度よく
識別することができ、タイミングマークが印刷された様
々な帳票から正確かつ高速にタイミングマークを検出す
ることが可能になる。
【図面の簡単な説明】
【図1】本発明の実施例の構成を示す。
【図2】本発明のタイミングマーク検出処理のフローチ
ャートである。
【図3】タイミングマークの検索範囲を示す。
【図4】矩形の大きさの第1の例を示す。
【図5】(a)、(b)は矩形の大きさの第2の例を示
す。
【図6】(a)、(b)は矩形の大きさの第3の例を示
す。
【図7】本発明をソフトウェアによって実現する場合の
構成例を示す。
【図8】タイミングマークの検出処理を含む文書処理の
フローチャートを示す。
【図9】タイミングマークを説明する図である。
【符号の説明】
1 タイミングマーク検索範囲決定手段 2 矩形抽出手段 3 特徴抽出手段 4 距離演算手段 5 判定手段

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 タイミングマークが印刷された帳票を読
    み取ることによって得られる2値の入力画像について、
    予め設定されているタイミングマークの位置を基にタイ
    ミングマークの検索範囲を決め、該タイミングマークの
    検索範囲内で矩形を抽出し、該抽出された矩形の特徴量
    を抽出し、予め設定されているタイミングマークの特徴
    量と前記矩形の特徴量との距離を算出し、該算出された
    距離が所定の閾値を満たすとき、前記矩形をタイミング
    マークとして検出することを特徴とするタイミングマー
    ク検出方法。
  2. 【請求項2】 前記特徴量は、抽出された矩形の大きさ
    であることを特徴とする請求項1記載のタイミングマー
    ク検出方法。
  3. 【請求項3】 前記特徴量は、抽出された矩形の黒画素
    数であることを特徴とする請求項1記載のタイミングマ
    ーク検出方法。
  4. 【請求項4】 前記特徴量は、請求項2記載の特徴量と
    請求項3記載の特徴量との組み合わせであることを特徴
    とする請求項1記載のタイミングマーク検出方法。
  5. 【請求項5】 タイミングマークが印刷された帳票を読
    み取ることによって得られる2値の入力画像について、
    予め設定されているタイミングマークの位置を基にタイ
    ミングマークの検索範囲を決める機能と、該タイミング
    マークの検索範囲内で矩形を抽出する機能と、該抽出さ
    れた矩形の特徴量を抽出する機能と、予め設定されてい
    るタイミングマークの特徴量と前記矩形の特徴量との距
    離を算出する機能と、該算出された距離が所定の閾値を
    満たすとき、前記矩形をタイミングマークとして検出す
    る機能をコンピュータに実現させるためのプログラムを
    記憶した記憶媒体。
JP9044102A 1997-02-27 1997-02-27 タイミングマーク検出方法および記憶媒体 Pending JPH10240863A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9044102A JPH10240863A (ja) 1997-02-27 1997-02-27 タイミングマーク検出方法および記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9044102A JPH10240863A (ja) 1997-02-27 1997-02-27 タイミングマーク検出方法および記憶媒体

Publications (1)

Publication Number Publication Date
JPH10240863A true JPH10240863A (ja) 1998-09-11

Family

ID=12682263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9044102A Pending JPH10240863A (ja) 1997-02-27 1997-02-27 タイミングマーク検出方法および記憶媒体

Country Status (1)

Country Link
JP (1) JPH10240863A (ja)

Similar Documents

Publication Publication Date Title
JP4658848B2 (ja) 文字列認識方法及び文字列認識装置
JP5600723B2 (ja) 様々な文字幅を有するテキスト行の文字を分割するための方法及びシステム
JP3411472B2 (ja) パターン抽出装置
KR100383858B1 (ko) 문자인식장치의 문자추출방법 및 장치
JP2000251082A (ja) 文書画像傾き検出装置
JP3006466B2 (ja) 文字入力装置
JP2003162723A (ja) 画像処理プログラム
JP2868134B2 (ja) 画像処理方法及び装置
JPH10240863A (ja) タイミングマーク検出方法および記憶媒体
JP3466899B2 (ja) 文字認識装置及び方法並びにプログラム記憶媒体
JP3281469B2 (ja) 文書画像の傾き検出方法および装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP2630261B2 (ja) 文字認識装置
JP3712825B2 (ja) 画像処理方法、装置および記録媒体
JP3019897B2 (ja) 行切出し方法
JP3343305B2 (ja) 文字切り出し装置、及び文字切り出し方法
JPH01169686A (ja) 文字行検出装置
JP3618926B2 (ja) 文書画像の傾き検出方法
JP3000480B2 (ja) 文字領域区切り検出方法
JPH04276888A (ja) 文字読取装置
JP2576079B2 (ja) 文字切出し方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP3190794B2 (ja) 文字切り出し装置
JPH05128308A (ja) 文字認識装置
Guru et al. Skew Estimation in Digitised Documents: A Novel Approach.

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050510

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051206