JPH06266887A - フォーマット作成方法およびそれを用いた光学文字読取装置 - Google Patents

フォーマット作成方法およびそれを用いた光学文字読取装置

Info

Publication number
JPH06266887A
JPH06266887A JP5053962A JP5396293A JPH06266887A JP H06266887 A JPH06266887 A JP H06266887A JP 5053962 A JP5053962 A JP 5053962A JP 5396293 A JP5396293 A JP 5396293A JP H06266887 A JPH06266887 A JP H06266887A
Authority
JP
Japan
Prior art keywords
character
character frame
image
format
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5053962A
Other languages
English (en)
Inventor
Kazuhiro Kushima
和弘 九嶋
Masatoshi Kurata
正敏 倉田
Masao Michino
正雄 道野
Kumiko Koike
久美子 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5053962A priority Critical patent/JPH06266887A/ja
Publication of JPH06266887A publication Critical patent/JPH06266887A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 実際に読み取り処理に供される帳票をそのま
ま用いることにより、簡便かつ正確にフォーマットの自
動生成を行うことが可能なフォーマット作成技術および
光学文字読取技術を提供する。 【構成】 フォーマット作成制御部4はイメージ入力部
1よりドロップアウトカラー文字枠をドロップアウトし
ないイメージを取り込む。帳票抽出部5は帳票イメージ
を抽出する。文字枠抽出部6で求めた文字枠座標を座標
補正部7で予め指定した帳票サイズと帳票イメージを対
応付けて補正し、補正した座標をフォーマット9の座標
とする。更に前記座標を仮のフォーマット10の座標と
し、該フォーマットを元にメモリ3のドロップアウトカ
ラー文字枠をドロップアウトした帳票イメージより文字
抽出部11にて文字を抽出し、文字認識部12にて文字
コードを得る。その文字コードをフォーマット9の文字
種等のフィールド情報として反映する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、フォーマット作成技術
およびそれを用いた光学文字読取技術に係わり、特に、
フォーマット作成作業の効率化などに適用して有効な技
術に関する。
【0002】
【従来の技術】従来の光学文字読取装置においては、フ
ォーマットの座標指定に関して文字枠を記入した帳票の
帳票画像を読込み文字枠を抽出し、フォーマットの座標
指定を自動的に行っていた。
【0003】この種の方式として関連するものには、例
えば、特開昭61−289476号公報に開示される技
術が挙げられる。当該技術では、特定の文字枠内に記入
される文字種毎に当該文字枠を異なる線種で印刷し、線
種の弁別によって文字種を判別させようとするものであ
る。
【0004】
【発明が解決しようとする課題】ところで、通常、光学
文字読取装置に供される帳票の文字枠は、文字認識処理
の効率化などのために、目的の読み取り文字とは異なる
特定のドロップアウトカラーで印刷されている。このた
め、上記の前者の従来技術では、枠抽出を行う為に通常
の文字と同様の色等の態様で文字枠が印刷された帳票を
フォーマット生成用に特別に用意する(たとえばドロッ
プアウトカラーで文字枠が印刷された帳票から同サイズ
の白黒コピーをとってフォーマット作成に使用する)必
要があり、文字枠記入に手間がかかるという問題があっ
た。さらに、実際の帳票とは異なる帳票を用いてフォー
マットを決定するため、たとえば帳票の搬送系などの癖
がフォーマットに反映されず、文字枠の位置が、フォー
マット作成時と実際の読み取り時とで微妙に異なり、読
み取り精度が低下する懸念もある。
【0005】また、後者の従来技術では、文字種毎に、
文字枠の線種を変化させて印刷する必要があり、帳票に
おける文字枠の印刷作業が必要以上に煩雑になるという
問題がある。
【0006】本発明の目的は、実際に読み取り処理に供
される帳票をそのまま用いることにより、簡便かつ正確
にフォーマットの自動生成を行うことが可能なフォーマ
ット作成技術を提供することにある。
【0007】本発明の他の目的は、文字枠の座標のみな
らず、当該文字枠によって特定されるフィールドのフィ
ールド属性をも含む詳細なフォーマットを簡便かつ正確
に設定することが可能なフォーマット作成技術を提供す
ることにある。
【0008】本発明のさらに他の目的は、実際に読み取
り処理に供される帳票をそのまま用いることにより、簡
便かつ正確にフォーマットの自動生成を行うことが可能
な光学文字読取技術を提供することにある。
【0009】本発明のさらに他の目的は、文字枠の座標
のみならず、当該文字枠によって特定されるフィールド
のフィールド属性をも含む詳細なフォーマットを簡便か
つ正確に設定することが可能な光学文字読取技術を提供
することにある。
【0010】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述および添付図面から明らかに
なるであろう。
【0011】
【課題を解決するための手段】本願において開示される
発明のうち、代表的なものの概要を簡単に説明すれば、
下記のとおりである。
【0012】すなわち、本発明は、ドロップアウト仕様
で印刷された文字枠内に記入または印刷された文字を読
み取る光学文字読取操作に用いられる帳票のフォーマッ
ト作成方法において、帳票から文字枠の画像を取り込
み、当該画像から帳票における文字枠の座標情報を抽出
する第1の操作、および個々の文字枠内に記入または印
刷され、当該文字枠によって特定されるフィールドのフ
ィールド属性を指定する文字の画像を、文字枠の画像と
同時または個別に取り込み、個々の文字枠に関する座標
情報およびフィールド属性情報を決定する第2の操作の
少なくとも一方からなるものである。
【0013】また、本発明は、ドロップアウト仕様で印
刷された文字枠内に記入または印刷された文字を読み取
る光学文字読取装置において、文字枠をドロップアウト
して当該文字枠内に記入または印刷された文字を読み取
ると同時に、文字枠をドロップアウトしないイメージを
入力することが可能な第1のイメージ入力手段、また
は、切替え可能な複数の光源色を持ち、ドロップアウト
仕様の文字枠の色とは異なる光源色を用いた入力操作に
より、文字枠をドロップアウトしないイメージを入力す
ることが可能な第2のイメージ入力手段と、第1または
第2のイメージ入力手段から得られた文字枠を含むイメ
ージから、文字枠を選択的に抽出する手段と、帳票サイ
ズに対する入力されたイメージの伸縮を計算し、当該帳
票上の文字枠の座標を決定する手段とからなるものであ
る。
【0014】また、本発明は、請求項2記載の光学文字
読取装置において、文字枠の座標に基づいて、当該文字
枠内に記入または印刷され、当該文字枠で特定されるフ
ィールドのフィールド属性を指定する文字を認識してフ
ィールド属性を確定する手段を備え、個々の文字枠の座
標と、当該文字枠に関するフィールド情報とからなる帳
票のフォーマットを生成するものである。
【0015】また、本発明は、請求項2または3記載の
光学文字読取装置において、文字枠と当該文字枠内に記
入または印刷された文字からなるイメージから文字枠お
よび文字の画像を弁別する手段を備え、帳票における文
字枠の座標の決定と、当該文字枠内に記入または印刷さ
れ、当該文字枠で特定されるフィールドのフィールド属
性を指定する文字を認識してのフィールド属性の決定と
を行うものである。
【0016】
【作用】上記した本発明の光学文字読取装置によれば、
たとえば、帳票のドロップアウトカラー文字枠をドロッ
プアウトしないイメージとドロップアウトカラー文字枠
をドロップアウトするイメージを同時または別々に入力
した後、文字枠をドロップアウトしないイメージから帳
票イメージを検出し、予め指定された帳票サイズにより
補正量を求めた後、帳票イメージ内の文字枠を抽出し座
標を得る。更に、この座標を補正量分補正し、文字枠座
標を得る、という操作が可能になる。
【0017】これにより、特別にフォーマット作成用の
帳票を用意することなく、実際に読み取り処理に供され
る帳票のイメージ入力を行うという簡便な操作で、正確
な文字枠の座標等のフォーマット情報を得ることが可能
となる。
【0018】また、フォーマット作成に使用する帳票の
各文字枠内に、当該文字枠によって特定されるフィール
ドにおける文字種等のフィールド属性を指定する特定の
文字を記入しておき、上記で求めた文字枠の座標より仮
のフォーマットを生成し、文字枠をドロップアウトした
イメージから文字を抽出し、文字認識によって各文字枠
のフィールドから得られた特定の前記文字に基づいて、
対応するフィールドのフィールド属性を自動的に決定す
ることにより、文字枠の座標のみならず、フィールド属
性をも含めたフォーマット作成を容易に行うことが可能
となる。
【0019】
【実施例】以下、本発明の一実施例であるフォーマット
作成方法および光学文字読取装置について、添付の図面
を参照しながら詳細に説明する。
【0020】図1は、本発明の一実施例であるフォーマ
ット作成方法が実施される光学文字読取装置の構成の一
例を示すブロック図であり、図2および図3は、その一
部をさらに詳細に示すブロック図である。また、図4お
よび図5は、その作用の一例を示す概念図であり、図
6、図7および図8は、その作用の一例を示すフローチ
ャートである。
【0021】本実施例の光学文字読取装置は、文字読取
装置と、制御装置とからなる。
【0022】文字読取装置は、イメージ入力部1、文字
認識制御部2、メモリ3、文字抽出部11、文字認識部
12からなる。
【0023】制御装置は、表示/入力装置8、フォーマ
ット作成制御部4、所定のメモリ等に格納されたフォー
マット9および仮のフォーマット10、帳票抽出部5、
文字枠抽出部6、座標補正部7からなる。
【0024】イメージ入力部1は、たとえば、図2に例
示されるように、帳票20に異なる色の光21aおよび
光22aを照射する複数の光源21および光源22と、
帳票20からの反射光に対し、光21aおよび22aの
各々について選択的に感応する複数の光センサ23およ
び光センサ24と、光電気変換回路25と、二値化回路
26とで構成されており、文字枠20aを一方の光21
aまたは光22aと同一色のドロップアウトカラーで印
刷しておき、文字枠20aをドロップアウトした文字2
0bのみの画像と、文字枠20aおよび文字20bの双
方を含む画像の二つを、一回の帳票20の搬送操作で同
時に取り込むことが可能な構成となっている。
【0025】なお、イメージ入力部1としては、図2に
例示した構成に限らず、図3に例示されるように、異な
る光21aおよび22aの双方に感応する単一の光セン
サ27を配置し、複数の光源21および光源22の一方
を選択的に点灯させることにより、文字枠20aをドロ
ップアウトした文字20bのみの画像と、文字枠20a
および文字20bの双方を含む画像の二つを、帳票20
の個別の搬送操作で(都合2回)取り込むことが可能な
構成としてもよい。
【0026】以下、本実施例の作用の一例を説明する。
【0027】文字認識制御部2は、図2に例示した構成
のイメージ入力部1より、図4(a)に例示される帳票2
0を二値化したイメージ入力を行った図4(b) のドロッ
プアウトカラー文字枠20aをドロップアウトした帳票
イメージ、及び図4(c) のドロップアウトカラー文字枠
20aをドロップアウトしない帳票イメージ、を同時に
入力後、図4(c) のドロップアウトカラー文字枠をドロ
ップアウトしない帳票イメージを取り込み、メモリ3に
格納する。続いて前記帳票イメージをフォーマット作成
制御部4に送り、帳票抽出部5で上記帳票イメージの白
ラン(走査方向に連続する白画素)と黒ラン(走査方向
に連続する黒画素)との変化点から、帳票イメージの帳
票端4点の座標を得る。
【0028】文字枠抽出部6では、上記帳票イメージよ
り帳票イメージ内の文字枠20aの抽出を行い文字枠座
標を得る。文字枠抽出部6では、二値化したイメージの
結線処理を行った上で白塊領域に対して文字枠20aの
パターンマッチングを行い更に文字枠許容値のチェック
を行い、文字枠を抽出し、座標を得る。
【0029】更に表示/入力装置8より予め入力された
帳票長、幅により座標補正部7で文字枠座標の補正を行
い、文字データを読み取るための読取領域の座標として
フォーマット9に反映する。
【0030】座標補正部7では、図5に示すように帳票
端座標と帳票長、幅により文字枠座標の補正を行う。
【0031】ここで、帳票端4点座標を(Xa,Y
a),(Xb,Yb),(Xc,Yc),(Yd,Y
d),帳票長をL、帳票幅をW、文字枠座標を(Xo,
Yo)とすれば、帳票20上の文字枠20aの位置を次
式により求める。
【0032】 帳票上の垂直位置:Y=L・(Yo−Ya)/(Yb−Ya) ・・・・・(1) 帳票上の水平位置:X=W・(Xo−Xa)/(Xc−Xa) ・・・・・(2) また、上記処理にて求まった文字枠の座標を利用し、仮
のフォーマット10を生成後、メモリ3に蓄えてあるド
ロップアウトカラーの文字枠20aをドロップアウトす
る帳票イメージを仮のフォーマット10を元に文字抽出
部11にて文字パターンの切出しを行い文字認識部12
にて文字パターンのマッチング処理を行い文字コードを
得る。
【0033】上記文字コードは、当該文字が記載されて
いた文字枠20aによって特定されるフィールドのフィ
ールド属性(例えば文字種等)としてフォーマット9に
反映する。たとえば、英字(数字)(日本語)が記載さ
れるべき文字枠20a内にフォーマット生成時に所定の
英字(数字)(平仮名)を記入しておくことにより、当
該フィールドは英字(数字)(日本語)が記載されるべ
きフィールドであると認識させ、フォーマットの文字種
情報に自動的に反映させ、実際の光学文字読取操作にお
いて、たとえば、記入文字種の正誤判定などの処理の便
に供する。
【0034】このような一連のフォーマット作成処理の
フローチャートを図6に示す。
【0035】また、イメージ入力部1が図3に例示され
るような構成の場合は、表示/入力装置8より予め帳票
のドロップアウトカラー色及び、帳票サイズを入力し、
イメージ入力部1より入力されたドロップアウトカラー
と異なる光源色でイメージを入力することにより、図4
(c) のドロップアウトカラー文字枠をドロップアウトし
ない帳票イメージを文字認識制御部2に取り込む。後
は、上記と同様な処理を行うことにより文字枠の座標を
正確に得る。
【0036】すなわち、この場合には、図7のフローチ
ャートに例示されるように、文字枠20aおよびフィー
ルド属性を示す文字20bの各々の画像を2回の帳票2
0の読み込み操作によって個別に取り込むことになる。
【0037】さらに、図8のフローチャートに例示され
るように、文字枠20aが付加されたままで文字20b
の画像を認識できる機能(黒線枠認識機能)を有する場
合には、単一の光源および単一のセンサからなる組み合
わせのイメージ入力部1にて、1回の帳票20の読み込
み操作で、文字枠20aの座標および文字20b(フィ
ールド属性)の双方を確定することができる。
【0038】このように、本実施例によれば、帳票サイ
ズと帳票イメージを対応付けて補正するので、正確な座
標補正ができ、正確なフォーマット作成が可能となる。
また、実際に使用される帳票20を用いるので、イメー
ジ入力部1における図示しない搬送系の実際の帳票20
に対する癖なども反映した、より正確なフォーマット作
成が可能となる。
【0039】また、フォーマット作成に使用する実際の
帳票20の各文字枠20aの各々に、当該文字枠20a
内に記入されるべき文字種等のフィールド属性を指定す
る文字を記入しておき、上記座標を使用し、文字認識を
行うことにより、文字種等のフィールド属性も含むより
詳細な帳票20のフォーマットを簡便かつ正確に同時に
生成することが可能となる。
【0040】以上本発明者によってなされた発明を実施
例に基づき具体的に説明したが、本発明は前記実施例に
限定されるものではなく、その要旨を逸脱しない範囲で
種々変更可能であることはいうまでもない。
【0041】
【発明の効果】本願において開示される発明のうち、代
表的なものによって得られる効果を簡単に説明すれば、
以下のとおりである。
【0042】本発明のフォーマット作成方法によれば、
実際に読み取り処理に供される帳票をそのまま用いるこ
とにより、簡便かつ正確にフォーマットの自動生成を行
うことができる、という効果が得られる。また、文字枠
の座標のみならず、当該文字枠によって特定されるフィ
ールドのフィールド属性をも含む詳細なフォーマットを
簡便かつ正確に設定することができる、という効果が得
られる。
【0043】また、本発明の光学文字読取装置によれ
ば、実際に読み取り処理に供される帳票をそのまま用い
ることにより、簡便かつ正確にフォーマットの自動生成
を行うことができる、という効果が得られる。また、文
字枠の座標のみならず、当該文字枠によって特定される
フィールドのフィールド属性をも含む詳細なフォーマッ
トを簡便かつ正確に設定することができる、という効果
が得られる。
【図面の簡単な説明】
【図1】本発明の一実施例であるフォーマット作成方法
が実施される光学文字読取装置の構成の一例を示すブロ
ック図である。
【図2】その一部をさらに詳細に示すブロック図であ
る。
【図3】同じく、その一部をさらに詳細に示すブロック
図である。
【図4】その作用の一例を示す概念図である。
【図5】同じく、その作用の一例を示す概念図である。
【図6】その作用の一例を示すフローチャートである。
【図7】同じく、その作用の一例を示すフローチャート
である。
【図8】同じく、その作用の一例を示すフローチャート
である。
【符号の説明】
1 イメージ入力部 2 文字認識制御部 3 メモリ 4 フォーマット作成制御部 5 帳票抽出部 6 文字枠抽出部 7 座標補正部 8 表示/入力装置 9 フォーマット 10 仮のフォーマット 11 文字抽出部 12 文字認識部 20 帳票 20a 文字枠 20b 文字 21 光源 21a 光 22 光源 22a 光 23 光センサ 24 光センサ 25 光電気変換回路 26 二値化回路 27 光センサ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小池 久美子 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 ドロップアウト仕様で印刷された文字枠
    内に記入または印刷された文字を読み取る光学文字読取
    処理に用いられる帳票のフォーマット作成方法であっ
    て、前記帳票から前記文字枠の画像を取り込み、当該画
    像から前記帳票における前記文字枠の座標情報を抽出す
    る第1の操作、および個々の前記文字枠内に記入または
    印刷され、当該文字枠によって特定されるフィールドの
    フィールド属性を指定する文字の画像を、前記文字枠の
    画像と同時または個別に取り込み、個々の前記文字枠に
    関する座標情報およびフィールド属性情報を決定する第
    2の操作の少なくとも一方からなることを特徴とするフ
    ォーマット作成方法。
  2. 【請求項2】 ドロップアウト仕様で印刷された文字枠
    内に記入または印刷された文字を読み取る光学文字読取
    装置であって、前記文字枠をドロップアウトして当該文
    字枠内に記入または印刷された前記文字を読み取ると同
    時に、前記文字枠をドロップアウトしないイメージを入
    力することが可能な第1のイメージ入力手段、または、
    切替え可能な複数の光源色を持ち、前記ドロップアウト
    仕様の前記文字枠の色とは異なる前記光源色を用いた入
    力操作により、前記文字枠をドロップアウトしないイメ
    ージを入力することが可能な第2のイメージ入力手段
    と、前記第1または第2のイメージ入力手段から得られ
    た前記文字枠を含む前記イメージから、前記文字枠を選
    択的に抽出する手段と、前記帳票サイズに対する入力さ
    れた前記イメージの伸縮を計算し、当該帳票上の前記文
    字枠の座標を決定する手段とからなることを特徴とする
    光学文字読取装置。
  3. 【請求項3】 前記文字枠の座標に基づいて、当該文字
    枠内に記入または印刷され、当該文字枠で特定されるフ
    ィールドのフィールド属性を指定する文字を認識してフ
    ィールド属性を確定する手段を備え、個々の前記文字枠
    の前記座標と、当該文字枠に関するフィールド情報とか
    らなる前記帳票のフォーマットを生成することを特徴と
    する請求項2記載の光学文字読取装置。
  4. 【請求項4】 前記文字枠と当該文字枠内に記入または
    印刷された文字からなるイメージから前記文字枠および
    前記文字の画像を弁別する手段を備え、前記帳票におけ
    る前記文字枠の座標の決定と、当該文字枠内に記入また
    は印刷され、当該文字枠で特定されるフィールドのフィ
    ールド属性を指定する文字を認識してのフィールド属性
    の決定とを行うことを特徴とする請求項2または3記載
    の光学文字読取装置。
JP5053962A 1993-03-15 1993-03-15 フォーマット作成方法およびそれを用いた光学文字読取装置 Pending JPH06266887A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5053962A JPH06266887A (ja) 1993-03-15 1993-03-15 フォーマット作成方法およびそれを用いた光学文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5053962A JPH06266887A (ja) 1993-03-15 1993-03-15 フォーマット作成方法およびそれを用いた光学文字読取装置

Publications (1)

Publication Number Publication Date
JPH06266887A true JPH06266887A (ja) 1994-09-22

Family

ID=12957314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5053962A Pending JPH06266887A (ja) 1993-03-15 1993-03-15 フォーマット作成方法およびそれを用いた光学文字読取装置

Country Status (1)

Country Link
JP (1) JPH06266887A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8189921B2 (en) 2008-03-31 2012-05-29 Fujitsu Frontech Limited Character recognition device
JP2022186026A (ja) * 2021-06-04 2022-12-15 AI inside株式会社 プログラム、情報処理装置及び方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8189921B2 (en) 2008-03-31 2012-05-29 Fujitsu Frontech Limited Character recognition device
JP2022186026A (ja) * 2021-06-04 2022-12-15 AI inside株式会社 プログラム、情報処理装置及び方法

Similar Documents

Publication Publication Date Title
JPH0738681B2 (ja) 領域認識装置
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
JP3018949B2 (ja) 文字読取装置およびその方法
US5649028A (en) Connect-the-dots drawing production device
CN117079297A (zh) 一种继电保护定值核对方法、系统、设备及介质
JPH06266887A (ja) フォーマット作成方法およびそれを用いた光学文字読取装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JPH06131495A (ja) 画像情報抽出方式
JPH0997309A (ja) 文字抽出装置
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JPH06111057A (ja) 光学的文字読取装置
JPH0223492A (ja) 光学的文字読取装置
JPH0661112B2 (ja) パタ−ン認識方式
JPS63101983A (ja) 文字列抽出方式
JPH0789361B2 (ja) 帳票登録装置
JP2863671B2 (ja) 印字フォーマット作成装置
JP3249231B2 (ja) マイクロフィルムリーダのマスキング方法および装置
JPH0520459A (ja) パターン認識方法およびその装置
JPH0735509A (ja) 切手検出装置
JP3356819B2 (ja) マーク認識装置
JPH09259196A (ja) 光学的文字読み取り装置及びこの制御方法
JPH0528313A (ja) 光学情報読取装置
JPH0425986A (ja) 文字読取装置及び文字読取方法
JPH07210625A (ja) Ocr装置のフォーマット制御方法
JPH08123872A (ja) 光学式文字読取装置