JPH11175657A - 文字パターン切出し方法及びこれを用いた文字認識装置 - Google Patents

文字パターン切出し方法及びこれを用いた文字認識装置

Info

Publication number
JPH11175657A
JPH11175657A JP9347494A JP34749497A JPH11175657A JP H11175657 A JPH11175657 A JP H11175657A JP 9347494 A JP9347494 A JP 9347494A JP 34749497 A JP34749497 A JP 34749497A JP H11175657 A JPH11175657 A JP H11175657A
Authority
JP
Japan
Prior art keywords
character
image
skew amount
document
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9347494A
Other languages
English (en)
Inventor
Masatoshi Aki
昌敏 安芸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP9347494A priority Critical patent/JPH11175657A/ja
Publication of JPH11175657A publication Critical patent/JPH11175657A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文字認識対象となる帳票設計上の制限事項を
減らす。 【解決手段】 光学的に帳票表面を走査し入力した帳票
の画像イメージを基に、読取りエリア分割数算出部10
3において読取りエリア分割数を算出する。読取り位置
が帳票先端に近く先端スキュー検出量が大きい場合は文
字切出しに使用する読取りエリアを分割する分割数を増
加し、読取り位置が帳票先端から十分離れ先端スキュー
検出量が小さい場合は読取りエリア分割数を減少させ
る。この算出された分割数を使用し、文字認識イメージ
切出し部104において帳票イメージから文字認識パタ
ーンの切出しを行う。この切出したパターンに対して文
字判定を行い、文字コードを出力する。 【効果】 帳票先端から1行目の読取り位置までの間に
必要なクリアエリアを減少させることができ、より自由
に帳票を設計できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文字パターン切出し
及びこれを用いた文字認識装置に関し、特に画像入力さ
れた帳票表面に記載されている文字群について文字認識
を行うために文字パターンを切出す文字パターン切出し
方法及びこれを用いて文字認識を行う文字認識装置に関
する。
【0002】
【従来の技術】一般に、光学的文字読取り装置において
は、認識処理の前に文字認識イメージを切出す処理を行
っている。従来の装置では、文字数×文字ピッチで規定
される読取りエリアサイズを予め決定された固定サイズ
で分割を行い、この分割を行った個々のエリアに対して
スキュー補正を行って文字認識イメージの切出しを行っ
ている。
【0003】従来の文字認識装置が特開平3―1541
83号公報に記載されている。この従来の装置について
図8を参照して説明する。
【0004】図8(a)を参照すると、従来の装置は、
搬送される原稿11に光源12より光を照射し、原稿か
らの反射光を光電変換素子及びA―Dコンバータを有す
る光電変換部13で受光する。
【0005】この光電変換部13で受光した原稿からの
反射光をディジタル画像信号である多値イメージデータ
に変換し、白レベルメモリ14及び2値化回路16に出
力する。白レベルメモリ14は光電変換部13から入力
されたイメージデータを所定アドレスに記憶する。白レ
ベル修正回路15は、白レベルメモリ14の所定アドレ
スに記憶されているイメージデータを連続してそのイメ
ージデータの先端(クリアエリア)の左右から予めメモ
リに記憶している上記原稿の標準化パターンである抽出
パターンと比較する。
【0006】この比較により上記イメージデータの先端
の右端からL1、左端からL2の距離までを原稿の画像
領域とする白レベルとして白レベルメモリ14から2値
化回路に出力する。2値化回路16は、光電変換部13
から入力される多値のイメージデータと白レベル修正回
路15により抽出された白レベルとを比較して2値化す
る。シートバッファ17は、2値化回路16により2値
化されたシートイメージを所定アドレスに記憶する。
【0007】同図(b)をも参照すると、搬送中にスキ
ューの生じた原稿18についても、光源12より光が照
射され原稿からの反射光が光電変換部13に入射する。
この入射する反射光は、光電変換部13により多値のイ
メージデータに変換され白レベルメモリ14及び2値化
回路16に入力される。
【0008】白レベルメモリの所定の所定アドレスに記
憶された多値のイメージデータは、白レベル修正回路1
5により、そのイメージデータの先端の右端からL1、
左端からL2まで白レベルに変換される。この変換され
た白レベルは、2値化回路16により光電変換部13か
ら入力される多値イメージデータと比較されて2値化さ
れる。2値化されたシートイメージは、シート上の文字
が黒値に、他のシートイメージの領域が白値に変換さ
れ、スキューにより斜めの状態のままシートバッファ1
7の所定のアドレスに記憶される。
【0009】
【発明が解決しようとする課題】上述した従来技術にお
いては、以下のような問題点がある。すなわち、図9
(a)に示されているように、イメージ読み取り領域1
0内の帳票100の読取りエリアRA内に、文字群「1
2345678」が記載されているものとする。なお、
帳票搬送方向は矢印Yの方向であるものとする。
【0010】この図9(a)に示されている場合、帳票
100のスキュー量θが大で、読取りエリアの距離が帳
票先端から近い時(又は前行との距離が短い時)は、同
図(b)に示されているように、文字認識に不要な部分
(背景)Hも含めて文字切出しを行ってしまう。つま
り、同図に示されている部分BBが切出された結果であ
る。
【0011】ここで、固定サイズで文字切出しを行う場
合は、帳票の先端から1行目の読取り位置(FP)まで
の間に、固定的に規定されたクリアエリアが必要であ
る。そして、このクリアエリアが不足している場合は、
文字イメージの切出しを誤る場合がある。このため、固
定的に規定されたクリアエリアを十分に大きく設けてお
く必要があり、このことが帳票設計上の制限事項になる
という欠点がある。
【0012】本発明は上述した従来技術の欠点を解決す
るためになされたものであり、その目的は帳票設計上の
制限事項を減らし、より自由に帳票を設計できるように
した文字パターン切出し方法及びこれを用いた文字認識
装置を提供することである。
【0013】
【課題を解決するための手段】本発明による文字パター
ン切出し方法は、画像入力された帳票表面に記載されて
いる文字群について文字認識を行うために文字パターン
を切出す文字パターン切出し方法であって、画像入力さ
れた前記帳票のスキュー量を算出するスキュー量算出ス
テップと、前記文字群について前記スキュー量算出ステ
ップにおいて算出されたスキュー量に応じた分割数の文
字パターンを切出す文字パターン切出しステップとを含
むことを特徴とする。
【0014】本発明による文字認識装置は、画像入力さ
れた帳票表面に記載されている文字群について文字認識
を行う文字認識装置であって、画像入力された前記帳票
のスキュー量を算出するスキュー量算出手段と、前記文
字群について前記スキュー量算出手段によって算出され
たスキュー量に応じた分割数の文字パターンを切出す文
字パターン切出し手段とを含み、この切出した文字パタ
ーンについて文字認識を行うようにしたことを特徴とす
る。
【0015】要するに本発明では、帳票のスキュー量等
に応じて文字パターンを切出す分割数を決定し、この分
割数に分割して切出した文字パターンについて文字認識
を行っているのである。より具体的には、以下のように
なる。
【0016】すなわち、まず光学的に帳票表面を走査し
帳票イメージを入力する。入力した帳票の画像イメージ
から読取りエリア分割数の算出を行う。この算出された
読取りエリア分割数を使用して入力された帳票イメージ
より文字認識パターンの切出しを行う。この切出した文
字認識パターンに対して文字判定を行い、判定結果(文
字コード)を出力する。
【0017】入力した帳票イメージより文字認識パター
ンの切出しを行う処理で使用する切出しエリアの分割数
は読取り位置(帳票先端からの距離又は前行との距離)
と先端スキュー検出値との関係より判断する。すなわ
ち、読取り位置が帳票先端に近い又は前行との距離が小
さく先端スキュー検出量が大きい場合は文字切出しに使
用する読取りエリアを分割する分割数を増加する。ま
た、読取り位置が帳票先端から十分離れている場合又は
前行との距離が十分離れて先端スキュー検出量が小さい
場合は読取りエリア分割数を減少させる。
【0018】つまり、読取りエリア分割数は、使用する
帳票毎のイメージを採集し、採集されたイメージを解析
することにより個々に決定し規定値としてセットする。
本例では、読取り位置(帳票先端からの距離又は前行と
の距離)と先端スキューとを調べて、文字切出しに使用
する読取りエリア分割数を算出している。
【0019】
【発明の実施の形態】次に、本発明の実施の一形態につ
いて図面を参照して説明する。
【0020】図1は本発明による文字認識装置の実施の
一形態を示すブロック図である。同図において、本実施
形態による文字認識装置は、光学的に帳票表面を走査し
帳票イメージ101aを出力する画像入力部101と、
入力された帳票イメージ101aを2値化して出力する
画像データ格納部102と、読取りエリア分割数を算出
する読取りエリア分割数算出部103と、入力された読
取りエリア分割数を使用して文字認識イメージの切出し
を行う文字認識イメージ切出し部104と、文字切出し
結果に基づいて文字の認識を行う文字判定部105とを
含んで構成されている。
【0021】かかる構成において、画像入力部101
は、光学的に帳票表面を走査し帳票イメージ101aを
画像データ格納部102へ出力する。画像データ格納部
102は、入力された帳票イメージ101aを2値化し
帳票2値化イメージ103aを読取りエリア分割数算出
部103へ出力する。
【0022】読取りエリア分割数算出部103は、入力
された帳票2値化イメージ103aより読取りエリア分
割数103eを算出し文字認識イメージ切出し部104
へ出力する。文字認識イメージ切出し部104は、入力
された読取りエリア分割数103eを使用して文字認識
イメージの切出しを行う。そして、文字切出し結果であ
る文字認識イメージ104aを出力する。文字判定部1
05は、文字認識イメージ104aに対して文字判定を
行い、判定結果(文字コード)を出力する。
【0023】図2は、図1中の読取りエリア分割数算出
部103の内部構成例を示すブロック図であり、図1と
同等部分は同一符号により示されている。同図を参照す
ると、読取りエリア分割数算出部103は、帳票2値化
イメージ103aを基に帳票の先端の位置を検出する先
端検出部106と、この検出された帳票位置103bを
基に帳票スキュー量を算出する先端スキュー算出部10
7と、文字認識対象となる帳票についての書式情報を示
す読取り位置103cを出力する書式情報格納部108
と、この出力される読取り位置103cと先端スキュー
算出部107から出力される帳票スキュー量103dと
を基に読取りエリア分割数を算出する分割数算出部10
9とを含んで構成されている。なお、書式情報格納部1
08から出力される読取り位置103cは、帳票先端か
らの距離又は前行からの距離であるものとする。
【0024】かかる構成において、画像データ格納部1
02より入力された帳票2値化イメージは先端検出部1
06に入力される。先端検出部106は、入力された帳
票2値化イメージに対し、図3中の3a,3b,3c,
3dに示されている方向に黒白変化点のサーチを行う。
そして、帳票の左右及び先端部の各位置A(Rx,R
y),B(Trx,Try),C(TLx,TLy),
D(Lx,Ly)の各座標値を先端スキュー算出部10
7へ出力する。先端スキュー算出部107は先端検出部
106より入力されたLx,Rx,TLy,Tryの各
値を使用してスキュー量θの算出を行う。この場合、ス
キュー量θは、次の式(1)によって算出する。
【0025】 θ=(Try−TLy)/(Rx−Lx) …(1) 先端スキュー算出部107は、式(1)によって算出し
たスキュー量θを、帳票スキュー量103dとして分割
数算出部109へ出力する。分割数算出部109は、入
力された帳票スキュー量103dと書式情報格納部10
8より入力した読取り位置(FP)103cとを基に、
読取りエリア分割数の算出を行う。
【0026】この読取りエリア分割数は、以下のように
算出する。すなわち、先端スキュー量≧n°、かつ、読
取り位置(帳票先端又は前行との距離)≦mの場合は、
読取りエリアの分割数を予め定められた値(例えば、
「4」)+n1とする。算出された読取りエリア分割数
103eは文字認識イメージ切出し部104へ出力され
る。
【0027】ここで、上記の「n」は、帳票先端の傾き
量(スキュー量)である。すなわち、図6(a)に示さ
れているように、破線で示されている本来の位置の帳票
100´に対して、帳票100が傾いている場合に、そ
の帳票の傾き量θが、上述した「n」に相当する。
【0028】また、上記の「m」は、帳票先端から読取
りエリアの中心位置までの距離又は前行の読取りエリア
の中心位置からその行の読取りエリアの中心位置までの
距離である。例えば、図6(b)に示されているよう
に、帳票100の読取りエリアRA1については同図中
のm1が上記の「m」に相当する。また、読取りエリア
RA2については同図中に示されているM=m2−m1
が上記の「m」に相当する。
【0029】そして、上記「n1」は、帳票の傾き量θ
が一定である場合、図7(a)に示されているように帳
票100の先端から読取りエリアの中心位置までの距離
が小であるときにはその値を大とし、同図(b)に示さ
れているように帳票100の先端から読取りエリアの中
心位置までの距離が大であるときにはその値を小とす
る。
【0030】このように上記の「n1」を変化させて読
取りエリア分割数を変化制御するためには、例えば、テ
ーブルを用いる。すなわち、読取りエリア分割数算出部
103内の分割数算出部109には、帳票スキュー量1
03dを入力し、読取りエリア分割数103eを出力す
るテーブルが設けられているものとする。なお、本例に
おけるテーブルは、帳票スキュー量の他に、更に読取り
位置103c、すなわち帳票の端部から文字群が記載さ
れている部分までの距離をも入力とし、読取りエリア分
割数103eを出力とする構成である。
【0031】この分割数算出部109内のテーブルは、
以下のように構成する。すなわち、帳票スキュー量10
3dの値が大であるとき分割数を大とし、逆に帳票スキ
ュー量103dの値が小であるとき分割数を小とする。
また、帳票の端部から文字群が記載されている部分まで
の距離が小であるとき分割数を大とし、逆にその距離が
大であるとき分割数を小とする。つまり、この読取りエ
リア分割数は、スキュー量に正比例し、距離に反比例す
るのである。このような関係になるようにテーブルを構
成し、読取りエリア分割数の値を増減すれば良い。
【0032】図4(a)には、読取り位置が帳票先端に
近く(距離が小)、かつ帳票スキュー量が大である場合
が示されている。なお、同図(a)において、図9と同
等部分は同一符号により示されている。
【0033】同図(a)に示されている場合には、イメ
ージ読み取り領域10内の帳票100の読取りエリアR
A内に記載されている「12345678」が、同図
(b)に示されているように2つの部分に分割される。
すなわち、「1234」の部分B1及び「5678」の
部分B2に分割される。
【0034】一方、図5(a)には、読取り位置が帳票
先端に近く(距離が小)、かつ帳票スキュー量が小であ
る場合が示されている。なお、同図(a)において、図
5や図9と同等部分は同一符号により示されている。
【0035】同図(a)に示されている場合には、イメ
ージ読み取り領域10内の帳票100の読取りエリアR
A内に記載されている「12345678」は、同図
(b)に示されているように分割されない。すなわち、
「12345678」の全てを含む1つの部分B0とし
て文字認識対象となる。
【0036】以上のように本装置においては、画像入力
された帳票表面に記載されている文字群について文字認
識を行うために従来とは異なる文字パターン切出し方法
が採用されているのである。すなわち、まず最初に画像
入力された帳票のスキュー量(傾き量)を算出し、次に
帳票表面の文字群についてスキュー量に応じた分割数の
文字パターンを切出すのである。
【0037】こうすることによって、帳票を設計する上
での制限を緩和することができる。すなわち帳票先端か
ら1行目の読取り位置までの間に必要なクリアエリアを
減少させることができ、また各行間のクリアエリアを減
少させることができるのである。
【0038】請求項の記載に関連して本発明は更に次の
態様をとりうる。
【0039】(1)前記スキュー量算出ステップは、帳
票の左右及び先端部の各位置の各座標値に応じて前記ス
キュー量を算出することを特徴とする請求項1又は2記
載の文字パターン切出し方法。
【0040】(2)前記スキュー量算出手段は、帳票の
左右及び先端部の各位置の各座標値に応じて前記スキュ
ー量を算出することを特徴とする請求項3〜6のいずれ
かに記載の文字認識装置。
【0041】
【発明の効果】以上説明したように本発明は、画像入力
された帳票のスキュー量を算出し、帳票表面の文字群に
ついてスキュー量に応じた分割数の文字パターンを切出
して文字認識することにより、帳票を設計する上で、帳
票先端から1行目の読取り位置までの間に必要なクリア
エリアを減少させることができ、また各行間のクリアエ
リアを減少させることができるという効果がある。
【図面の簡単な説明】
【図1】本発明の実施の一形態による文字認識装置の構
成を示すブロック図である。
【図2】図1中の読取りエリア分割数算出部の内部構成
例を示す図である。
【図3】入力された帳票イメージの先端検出動作等を説
明するための図である。
【図4】読取り位置が帳票先端に近く、かつ帳票スキュ
ー量が大である場合を示す図である。
【図5】読取り位置が帳票先端に近く、かつ帳票スキュ
ー量が小である場合を示す図である。
【図6】(a)は帳票先端の傾きである「n」の定義を
説明するための図、(b)は帳票先端から読取りエリア
の中心までの距離等である「m」の定義を説明するため
の図である。
【図7】(a)及び(b)は、読取りエリア分割数を変
化させるための値である「n1」の定義を説明するため
の図である。
【図8】(a)は従来の文字認識装置の構成を示すブロ
ック図、(b)は帳票の読取り状態を示す図である。
【図9】(a)は図8の文字認識装置による帳票読取り
状態を示す図、(b)は文字の切出し例を示す図であ
る。
【符号の説明】
101 画像入力部 102 画像データ格納部 103 読取りエリア分割数算出部 104 文字認識イメージ切出し部 105 文字判定部 106 先端検出部 107 先端スキュー算出部 108 書式情報格納部 109 分割数算出部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 画像入力された帳票表面に記載されてい
    る文字群について文字認識を行うために文字パターンを
    切出す文字パターン切出し方法であって、画像入力され
    た前記帳票のスキュー量を算出するスキュー量算出ステ
    ップと、前記文字群について前記スキュー量算出ステッ
    プにおいて算出されたスキュー量に応じた分割数の文字
    パターンを切出す文字パターン切出しステップとを含む
    ことを特徴とする文字パターン切出し方法。
  2. 【請求項2】 文字パターン切出しステップは、前記算
    出されたスキュー量の他、前記帳票表面において該帳票
    の端部から前記文字群が記載されている部分までの距離
    に応じた分割数の文字パターンを切出すことを特徴とす
    る請求項1記載の文字パターン切出し方法。
  3. 【請求項3】 画像入力された帳票表面に記載されてい
    る文字群について文字認識を行う文字認識装置であっ
    て、画像入力された前記帳票のスキュー量を算出するス
    キュー量算出手段と、前記文字群について前記スキュー
    量算出手段によって算出されたスキュー量に応じた分割
    数の文字パターンを切出す文字パターン切出し手段とを
    含み、この切出した文字パターンについて文字認識を行
    うようにしたことを特徴とする文字認識装置。
  4. 【請求項4】 前記文字パターン切出し手段は、前記ス
    キュー量を入力とし前記分割数を出力とするテーブルを
    含むことを特徴とする請求項3記載の文字認識装置。
  5. 【請求項5】 文字パターン切出し手段は、前記算出さ
    れたスキュー量の他、前記帳票表面において該帳票の端
    部から前記文字群が記載されている部分までの距離に応
    じた分割数の文字パターンを切出すことを特徴とする請
    求項3又は43記載の文字認識装置。
  6. 【請求項6】 前記文字パターン切出し手段は、前記ス
    キュー量及び前記距離を入力とし前記分割数を出力とす
    るテーブルを含むことを特徴とする請求項5記載の文字
    認識装置。
JP9347494A 1997-12-17 1997-12-17 文字パターン切出し方法及びこれを用いた文字認識装置 Withdrawn JPH11175657A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9347494A JPH11175657A (ja) 1997-12-17 1997-12-17 文字パターン切出し方法及びこれを用いた文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9347494A JPH11175657A (ja) 1997-12-17 1997-12-17 文字パターン切出し方法及びこれを用いた文字認識装置

Publications (1)

Publication Number Publication Date
JPH11175657A true JPH11175657A (ja) 1999-07-02

Family

ID=18390611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9347494A Withdrawn JPH11175657A (ja) 1997-12-17 1997-12-17 文字パターン切出し方法及びこれを用いた文字認識装置

Country Status (1)

Country Link
JP (1) JPH11175657A (ja)

Similar Documents

Publication Publication Date Title
US7636483B2 (en) Code type determining method and code boundary detecting method
US7440618B2 (en) Apparatus for extracting rules line from multiple-valued image
US7949187B2 (en) Character string recognition method and device
JPH07256214A (ja) 郵便物の宛名読取装置および郵便物の宛名領域判別装置および郵便物の宛名印刷装置
US6968085B2 (en) Document matching and annotation lifting
US7123768B2 (en) Apparatus and method for detecting a pattern
IL98293A (en) A method for distinguishing between text and graphics
JP2008011135A (ja) 画像処理装置および画像処理プログラム
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP2003115031A (ja) 画像処理装置および方法
JPH11175657A (ja) 文字パターン切出し方法及びこれを用いた文字認識装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3586911B2 (ja) 枠線認識装置
JP2758255B2 (ja) 光学式文字読取装置における帳票端検出方法
JP2964980B2 (ja) 光学的文字認識における直線成分検出方法及び装置
JP3556408B2 (ja) 領域抽出方法
JP2674475B2 (ja) 文字読取装置
JP4218179B2 (ja) パターン検出装置及び方法
JP2001038303A (ja) 宛名読取装置
JP3361905B2 (ja) 光学的文字読取装置
JPH11232463A (ja) 画像認識装置および方法
JPH11161739A (ja) 文字認識装置
JPH064705A (ja) 画像処理装置
JPH1196295A (ja) 情報処理装置及び情報処理方法
JPH11175659A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050301