JPH0916714A - 多色文字画像読取装置 - Google Patents

多色文字画像読取装置

Info

Publication number
JPH0916714A
JPH0916714A JP7159490A JP15949095A JPH0916714A JP H0916714 A JPH0916714 A JP H0916714A JP 7159490 A JP7159490 A JP 7159490A JP 15949095 A JP15949095 A JP 15949095A JP H0916714 A JPH0916714 A JP H0916714A
Authority
JP
Japan
Prior art keywords
character
color
image
multicolor
character image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7159490A
Other languages
English (en)
Other versions
JP3720078B2 (ja
Inventor
Yasuhiro Okada
康裕 岡田
Miyuki Hayashi
美由紀 林
Takashi Hirano
敬 平野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP15949095A priority Critical patent/JP3720078B2/ja
Publication of JPH0916714A publication Critical patent/JPH0916714A/ja
Application granted granted Critical
Publication of JP3720078B2 publication Critical patent/JP3720078B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 多色の複数種類の帳票の画像を抽出して標準
帳票を設定し、区分用の枠との相対位置を保持して文字
の認識を行う多色文字画像読取装置を得る。 【構成】 文字画像入力の指定された色毎に範囲を設定
して範囲位置と色とをフィールド毎にまとめた標準帳票
を作成する多色帳票読取フォーマット作成変更手段と、
多色帳票読取フォーマット作成変更手段で作成された標
準多色帳票と文字画像入力とを比較して入力の帳票の種
別を判定する帳票種別判定手段と、この判定した種別に
基づいて上記文字画像入力から対象領域を抽出する画像
抽出手段と、この抽出した読取領域と判定した種別の標
準帳票の対応フィールドの設定値とから読取対象文字を
切り出す文字切り出し手段と、この切り出された領域毎
の読取対象文字を認識する文字認識手段を備えた。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は標準として設定した帳票
と比較して、多色の文字画像の入力から画像の抽出、文
字の認識を行う多色の文字画像読取装置に関するもので
ある。
【0002】
【従来の技術】従来の帳票読取装置は、帳票作成時に使
用した色指定情報を用いてドロップアウトさせるデータ
と、認識処理の対象とするデータに変換して認識対象の
みに文字認識処理を行っていた。図34は、特開平2−
123488号公報に開示されている従来の帳票読取装
置を示すブロック図である。図において、511はカラ
ーセンサ、512は帳票、513はレンズ、514は量
子化部、515、516、517はイメージメモリ、5
18は制御部、519は色判定制御部、520は文字認
識部である。図35は、フィールド枠、文字枠と記入文
字が存在する画像に対する量子化部の出力例を示す図で
ある。図において、531はフィールド枠、532は文
字枠、533は記入文字である。図中、実線、斜線、網
かけは色の違いを示す。図36は、文字切り出しの動作
説明図である。図において、541は文字切り出し位置
である。図37は、文字切り出し結果を示す図である。
図において、551、552、553、554は個々の
文字切り出し結果である。図38は、フィールド枠、プ
レプリントと記入文字が存在する画像に対する量子化部
の出力例を示す図である。図において、561はフィー
ルド枠、562はプレプリント、563は記入文字であ
る。図中、実線、斜線、網かけは色の違いを示す。図3
9は、文字列切り出し結果を示す図である。図におい
て、571はプレプリント”年”に対する文字列、57
2はプレプリント”月”に対する文字列である。
【0003】次に上記構成の装置の動作について説明す
る。まず読取領域を示す枠が任意の色で印刷され、文字
が黒色で記録された帳票512と、読取領域ごとに記入
された色を指定するコード(色指定コード)と指定され
た色をドロップアウトさせるか、または認識処理の対象
とするかを指定するコード(認識指定コード)を格納し
たフォーマット情報を用意する。カラーセンサ511
で、帳票512を読み取り赤、青、緑の各成分に分解し
て光電変換を行い、量子化部514で量子化したデータ
をイメージメモリ515〜517に格納する。制御部5
18は、外部から与えられるフォーマット情報に設定さ
れた色指定コードから各色成分毎の色成分データに変換
し、色判定制御部519に出力する。色判定制御部51
9は、色成分データとイメージメモリ515〜517に
格納された読取領域内画素位置の濃度情報との比較を行
い、判定結果に基づいて2値の帳票イメージを生成す
る。文字認識部520は、2値イメージについて文字認
識処理を行う。例えば、フォーマット情報に文字枠の印
刷色を示す色指定コードとそれをドロップアウトさせる
ことを示すコードを設定した場合、色判定制御部519
では色指定コードに属する色は消去され白データに、そ
れ以外の色は黒データに変換する。文字認識部520で
は、そのイメージを対象に文字を認識する。
【0004】上記により動作する従来装置に対して図3
5に示す画像が量子化部514から得られ、フォーマッ
ト情報に文字枠の印刷色、フィールド枠の印刷色を示す
色指定コードとそれをドロップアウトさせることを示す
コードを設定した場合、色判定制御部519では文字枠
532とフィールド枠531を白データに、記入文字5
33を黒データに変換する。さらに、記入文字533が
図35のように文字が文字枠の中央に記入されず文字同
士が近接して記入された場合や帳票画像がずれて入力さ
れた場合には、文字切り出しが正常に動作せず、図36
に示す誤った文字切り出し位置541が得られる。元の
枠はドロップアウトされて区分が不明になり、この結
果、図37の551と552に示す誤った文字切り出し
結果が得られる。従って、文字認識部520では誤った
認識結果を出力する。
【0005】また、上記により動作する従来装置に対し
て図38に示す画像が量子化部514から得られ、フォ
ーマット情報にプレプリントの印刷色、フィールド枠の
印刷色を示す色指定コードとそれをドロップアウトさせ
ることを示すコードを設定した場合、色判定制御部51
9ではフィールド枠561とプレプリント562を白デ
ータに、記入文字563を黒データに変換する。色判定
制御部519から出力された図39に示す2値イメージ
について、文字認識処理を行う。この時既に、図38に
示すプレプリント562は画像から消滅してしまうた
め、プレプリントの区切りがわからない。そのため、図
39に示すように”年”に対応して”S61”571の
画像が、”月”に対応して”2”572の画像が抽出さ
れ、誤った文字列切り出し結果が得られる場合がある。
【0006】
【発明が解決しようとする課題】従来の帳票読取装置は
以上のように構成されていて区分用の枠はドロップアウ
トで除去され、記入文字と記入文字以外の帳票構成要素
との相対関係が不明であるため、正確に画像抽出や文字
認識ができないという課題があった。また更に、帳票の
読取を行う前に、あらかじめ読み込む帳票に対応したフ
ォーマット情報を特定しておかねばならず、登録外の複
数種類の帳票を混在して読み込むことができない。また
読取帳票の新規設計や変更を行う場合、フォーマット情
報に色指定コードを逐一設定する必要があり、フォーマ
ット情報の設定作業に手間がかかるという課題もあっ
た。
【0007】本発明は上記のような課題を解決するため
になされたものであり、複数種類のフィールドが混在し
た多色の文字画像の入力に対して正確に画像抽出や文字
認識が行え、また、フォーマットの設定フィールドに対
して色情報を容易に設定できる多色文字画像読取装置を
得ることを目的とする。
【0008】
【課題を解決するための手段】この発明に係る多色文字
画像読取装置は、文字画像入力の指定された色毎に範囲
を設定して範囲位置と色とをフィールド毎にまとめた標
準帳票を作成する多色帳票読取フォーマット作成変更手
段と、この多色帳票読取フォーマット作成変更手段で作
成された標準帳票と文字画像入力とを比較して入力の帳
票の種別を判定する帳票種別判定手段と、この帳票種別
判定手段で判定した種別に基づいて上記文字画像入力か
ら対象領域を抽出する画像抽出手段と、この画像抽出手
段で抽出した読取領域と帳票種別判定手段で判定した種
別の標準帳票の対応フィールドの設定値とから読取対象
文字を切り出す文字切り出し手段と、この文字切り出し
手段で切り出された領域毎の読取対象文字に文字認識処
理を行い文字を認識する文字認識手段を備えた。
【0009】また基本構成に更に、文字画像入力に対し
て類似した色成分を持つ画素を統合して指定の色とする
色統合手段を付加した。
【0010】また基本構成に更に、画像抽出手段で抽出
した画像と、上記文字認識手段出力の認識結果を出力す
る結果出力手段を付加した。
【0011】また更に、多色帳票読取フォーマット作成
変更手段は、特定の色に対応する画像のみを抽出して出
力し、範囲位置と色の設定を変更できるようにした。
【0012】また更に、帳票種別判定手段は、標準帳票
と、文字画像入力の各々の色情報で帳票種別を判定する
ようにした。
【0013】また更に、帳票種別判定手段は、標準帳票
と文字画像入力の各々の色情報に加え、各色毎のフィー
ルド毎にデータを対応付けて帳票種別を判定するように
した。
【0014】また更に、文字切り出し手段は、フィール
ドの色情報と、文字画像入力との相対位置情報を用いて
文字画像入力の切り出しを行うようにした。
【0015】また更に、画像抽出手段は、対象領域から
複数の色情報を抽出して重畳出力するようにした。
【0016】
【作用】この発明による多色文字画像読取装置は、入力
された文字画像情報からフィールド毎に範囲位置と色と
のデータがまとめられて標準帳票が記憶され、新しい文
字画像入力はこれら標準帳票と比較されて帳票の種別が
判定され、判定された標準帳票のデータに基づいて対象
領域が抽出され、更に標準帳票の領域とから文字が切り
出され、切り出された文字に対して文字認識がされる。
【0017】また更に、入力の文字画像情報で類似の色
成分を持つ情報はまとめて1つの色であるとして記憶ま
たは比較される。
【0018】また更に、文字画像入力から抽出した読取
領域の画像と、文字認識結果が重畳して出力される。
【0019】また更に、入力の文字画像または標準帳票
の特定範囲の画像が抽出され、範囲位置と色の設定が自
由に変更できる。
【0020】また更に、標準帳票と、文字画像入力の各
々の色情報が比較されてそれに基づいて帳票種別が判定
される。
【0021】また更に、標準帳票と文字画像入力の各々
の色情報に加え、各色毎のフィールド毎のデータが比較
されて帳票種別が判定される。
【0022】また更に、フィールドの色情報と文字画像
入力との相対位置情報により文字画像入力の切り出しが
行われる。
【0023】また更に、文字画像情報の対象領域から複
数の色情報が抽出され、重畳出力される。
【0024】
【実施例】
実施例1.図1は本発明の一実施例である多色文字画像
読取装置の全体構成を示す構成ブロック図である。本実
施例では、全体構成のうち、読み込んだ帳票のフィール
ドと称する部分領域毎の領域範囲とその色を確定してい
く多色帳票読取フォーマット作成変更手段の構成動作を
説明する。図1において、1は多色帳票を画像入力装置
に入力することにより得られる多色帳票画像を示す。2
は上記多色帳票画像から画像抽出して後に述べるように
多くのフィールドに区分して属性をまとめて標準帳票と
して登録された多色帳票読取フォーマット群を記憶した
メモリである。3は上記の多色帳票読取フォーマットに
含まれるデータの作成・変更を行う多色帳票読取フォー
マット作成・変更手段、4は上記多色の文字画像の入力
に対して類似した色成分を持つ画素を統合し、上記多色
帳票画像の色成分値を代表値に分類する色統合手段、5
は上記多色帳票読取フォーマット群に登録された個々の
標準帳票に含まれる読取領域及び色の情報と、上記色統
合手段によって統合された画像情報とを比較し、対応す
る多色帳票読取フォーマット(標準帳票)を特定して帳
票の種別を判定する帳票種別判定手段、6は上記色統合
手段によって作成された画像情報から多色帳票読取フォ
ーマットに規定される特定領域の画像情報を抽出する画
像抽出手段、7は上記画像抽出手段によって抽出された
画像情報から文字の切り出しを行い、文字領域の画像を
出力する文字切り出し手段、8は上記文字切り出し手段
によって得られた画像を認識し、対応する文字コード及
び色情報を出力する文字認識手段である。9は上記画像
抽出手段と上記文字切り出し手段から出力される画像お
よび上記文字認識手段から出力される文字コード、色情
報を編集出力する結果出力手段である。
【0025】図2は、多色帳票読取フォーマット作成・
変更手段の詳細構成図である。即ち、帳票サイズや帳票
を構成するフィールド枠・文字枠・記入文字などの帳票
構成要素の帳票内位置・サイズ・名称・色などのデータ
を得て、帳票内の文字の認識や特定領域内の画像を抽出
するために参照する帳票読取フォーマット(標準帳票)
を作成したり変更したりする。図において、多色帳票画
像1は、画像入力装置で入力された帳票画像である。多
色画像表示制御手段22は、多色帳票画像1の入力範囲
として帳票画像内の表示範囲を決定する。通常は、帳票
画像全体を表示するような決定を行う。多色画像表示手
段23は、帳票画像1のうち多色画像表示制御手段22
によって決定された範囲を表示する。画像範囲指定手段
24は、たとえばマウスのような座標入力装置を用い
て、多色画像表示手段23によって表示された多色画像
のうち、特定領域または帳票構成要素を指定・選択す
る。指定範囲への色情報設定/変更手段25は、画像範
囲指定手段24によって指定・選択された多色帳票画像
1内の特定領域または帳票構成要素に対して、色情報を
設定/変更する。読取フォーマット構造設定手段26
は、多色帳票画像1内の文字を認識したり特定領域を抽
出したりする際に参照するフィールド数・フィールド位
置・フィールド内文字数などのフォーマットデータを設
定する手段である。この手段によって、読取フォーマッ
トの具体的なデータ(フィールド数が4であるなど)の
うち、色に関するデータが空または既定値(任意の値)
の、読取フォーマットが作成される。読取フォーマット
への色情報設定手段27は、指定範囲への色情報設定/
変更手段25によって設定/変更された色情報を、読取
フォーマット構造設定手段26が作成した読取フォーマ
ットに設定する。
【0026】図3は多色帳票読取フォーマットのデータ
の例を示す説明図である。図において、31はフィール
ドを特定する項目、32はフィールド枠色の属性要素を
指示する項目、33は32の属性要素に対する指定値、
34はフィールドを特定する項目、35はフィールド内
の文字枠色の属性要素を指示する項目、36は35の属
性要素に対する指定値である。37はフィールド1の文
字切り出し条件の指定値、38はフィールド1の文字認
識対象、39は背景色の指定値、301はフィールド2
の文字切り出し条件(1)の指定値、302はフィール
ド2の文字切り出し条件(2)の指定値、303はフィ
ールド2のプレプリント(1)の位置指定値、304は
フィールド2のプレプリント(2)の位置指定値、30
5はフィールド2のプレプリント色の指定値、306は
フィールド2の文字認識対象の指定値、307は記入文
字色の指定値、308はフィールド3の画像切り出し条
件の指定値、309はフィールド3のフィールド枠色の
指定値、310はフィールド3の画像切り出し対象色
(1)の指定値、311は画像切り出し対象色(2)の
指定値、312は多色帳票読取フォーマット、313は
色情報である。
【0027】図4は多色帳票画像の例を示す図である。
図において、40はプレプリントされた”社員番号”の
文字、41は同じくプレプリント”入社年月”、42は
プレプリント”氏名(印)”、43はプレプリント”自
宅周辺図”、44は社員番号に対応する記入フィールド
枠、45は入社年月に対応する記入フィールド枠、46
は氏名(印)に対する記入フィールド枠、、47は自宅
周辺図に対するフィールド枠、48は社員番号に対する
フィールド内文字枠、49は入社年月に対するフィール
ド内プレプリントである。
【0028】次に、図2にしたがって、多色帳票読取フ
ォーマット28を作成する手順を説明する。ここで、多
色画像表示制御手段22は通常動作を行い、多色画像の
全体を表示することを決定するものとする。読取フォー
マット構造設定手段26が作成する読取フォーマットの
例を図3に示す。読取フォーマットは、1項目につき1
行で設定され、たとえば項目31にはフィールドを特定
するデータ、「フィールド1」と記述されている。項目
32は項目32に関する属性を表す詳細項目であり、
「フィールド1」の「フィールド枠色」に関してのデー
タが設定されていることを記述する。項目33は項目3
1・項目32に対する具体的なデータを表し、「黒」
「赤」などの色名もしくは色の成分値が記述されるが、
図3においては項目33はまだ設定されていない。
【0029】多色帳票画像1を読み込み、多色画像表示
手段23によって表示している例を図4に示す。操作者
は、図4に示される多色画像を見ながら、画像範囲指定
手段24を用いてその一部を選択または範囲指定する。
たとえば、図4中のフィールド枠45に示される帳票構
成要素を選択したものとする。画像からの色情報獲得手
段29は、画像範囲指定手段24により指示された指定
範囲内画像の色情報を取得する。操作者が図4のフィー
ルド枠45を選択した状態で、図3のフィールド枠色の
設定値33部分を選択すると、読取フォーマットへの色
情報設定手段27は画像からの色情報獲得手段29によ
り取得した色情報を図3のフィールド枠色の設定値33
に設定する。
【0030】本実施例では、色の指定が1種類の例を示
したが、これに限らず複数の色を指定することもでき
る。以上のように本実施例によれば、操作者は多色帳票
画像中の帳票構成要素または特定領域を選択/範囲指定
するだけで、多色帳票読取フォーマットに色情報を容易
に設定することができ、多色帳票読取フォーマット(標
準帳票)を設定することができる。
【0031】実施例2.本実施例では、全体構成の中の
色統合手段と、帳票種別判定手段の動作を説明する。図
5は多色帳票画像の例であり、図4の多色帳票画像にデ
ータが記入されたものである。図において、点線で囲ま
れた領域50は社員番号記入欄の領域である。図6は色
統合手段4の動作を説明するための図5の枠50を拡大
して色の区別を表した図である。即ち、社員番号記入欄
の領域50に対する処理例である。図7は、帳票種別判
定手段5の動作を説明するための図であり、図5とは異
なった文字画像入力に対し、標準帳票に記述した色情報
に従い、要素データを分類した色分類要素データであ
る。図において、71は色Aに対応した色分類要素デー
タ、72は色Bに対応した色分類要素データ、73は多
色帳票読取フォーマットに未登録の色に対応した色分類
要素データである。図8は、帳票種別判定手段5の動作
を説明するための図であり、多色帳票読取フォーマット
と色分類要素データとの照合動作を説明するものであ
る。図において、81は多色帳票読取フォーマットであ
る。図9は、帳票種別判定手段5の動作を説明するため
の、図8とは異なった文字画像の図である。図におい
て、90は色分類要素データ上の文字と対応がつかない
多色帳票読取フォーマットに記述された文字、91は色
分類要素データ上の表領域と対応つかない多色帳票読取
フォーマットに記述された表領域、92は多色帳票読取
フォーマットに記述された表領域と対応付かない色分類
要素データ上の表領域、93は多色帳票読取フォーマッ
トに記述された文字と対応は付くが色が異なっている色
分類要素データ上の文字、94は81とは異なる多色帳
票読取フォーマットである。
【0032】次に動作について説明する。図5に示した
多色帳票画像を参照しながら、色統合手段4と帳票種別
判別手段5の動作を説明する。図5に示した多色帳票画
像の部分領域50に対して色統合手段4を適用した場
合、色統合手段4では多色帳票画像上の各画素毎に色成
分値を調べ、類似した色成分値を有する画素を幾つかの
代表値に分類する。この処理は例えば、色成分値による
クラスタリングを行うことにより実現できる。次に、同
じ代表値に分類される画素について領域の連続性を求め
てグループ化する。これにより、同じ代表値に分類され
かつ画像上で連接する画素群が抽出できる。この処理は
例えば、各画素の代表値を用いたラベリング処理を行う
ことにより実現できる。これにより、図6に示した61
で示す画素群を抽出する。最後に、61で示す画素群に
ついて要素データ(各要素毎の位置と形状、代表値の色
成分値)を算出する。これを図3の対応するフィールド
のデータとして記憶する。実際の処理は多色帳票画像全
体に対して行う。即ち、入力の帳票の全部のフィールド
について処理を行い、データを記憶する。
【0033】色統合手段4の終了後、帳票種別判定手段
5を実行する。帳票種別判定手段5では、多色帳票読取
フォーマット群2と色統合手段4で抽出したフィールド
毎の要素データをもとにして、入力した多色帳票の文字
画像1の帳票種別を判定する。まず、多色帳票読取フォ
ーマット群2から1つの標準帳票を選ぶ。次に、選んだ
標準帳票に記述した色情報に従ってフィールド毎の要素
データを分類し、色分類要素データを作成する。ここ
で、選んだ標準帳票にN種類の色が記述されている場
合、要素データはN+1個(N種類の色+それ以外の
色)に分類する。例えば、入力の文字画像の要素データ
が要素A(色のRGB成分値がR100,G50,B7
0)、要素B(R100,G60,B70)、要素C
(R50,G50,B50)、要素D(R20,G2
0,B10)であり、一方、標準帳票には色A(R10
0±20,G50±10,B70±10)、色B(R5
0±5,G50±10,B50±10)が記述された場
合、要素A、Bが色Aに、要素Cが色Bに分類され、要
素Dは標準帳票に未登録の色として分類される。具体的
には、図5の入力の文字画像の例に基づいて、図7に示
す色分類要素データが作成できる。
【0034】次に、作成した色分類要素データに基づい
て文字と表領域、罫線を抽出する。即ち、図8に示すよ
うに、色分類要素データとして抽出した文字、表領域を
標準帳票81に記述した文字、表領域と対応付ける。こ
こで対応付けは、帳票上に描かれた文字や表領域の位
置、大きさ、色、文字コード、表の構造等の情報を用い
て最適となるように行う。更に、対応付けの結果を基に
して、標準帳票と入力された多色帳票画像1の類似度を
判定する。この類似性は、文字、表領域を対応付けた際
の、位置、大きさ、色、文字コード、表の構造等の違い
や、対応が付かずに残った文字、表領域の個数等から求
める。ここで、表の構造の違いは、多色帳票読取フォー
マットに記述した表を構成する罫線と、色分類要素デー
タとして抽出した罫線とを対応付ける手法により求め
る。これは例えば、出願平6−76795、「表を含む
帳票処理装置」により実現できる。例えば、図9は、図
8に示したものとは異なる多色帳票読取フォーマット9
4で各フィールド毎の色分類要素データの文字、表領域
対応付け結果を示している。ここで多色帳票読取フォー
マット上の文字90と表領域91は、色分類要素データ
の既知の文字、表領域と対応付かない。また、色分類要
素データとして抽出した表領域92は標準帳票上の表領
域と対応が付かない。さらに、色分類要素データとして
抽出した文字93は、標準帳票上の文字とは対応が付く
が、その色が異なる。そのため、例えば図9に示した他
の標準帳票94と、入力の図5の多色帳票画像1との類
似度は、図8の標準帳票81との類似度に比べて低くな
る。
【0035】以降、上記処理を多色帳票読取フォーマッ
ト群2に格納された複数の標準帳票に対して行ない、各
標準帳票毎に類似度を算出する。そして、類似度が最も
高い標準帳票が、入力した多色帳票画像(文字画像)1
の種別であるとする。ただし、最も高い類似度であって
も、類似の度合いが所定値より低い場合や、(最も高い
類似度) −( 2番目に高い類似度)が小さい場合は、
入力した多色帳票画像1の種別判定が不能として、入力
の多色帳票画像1を棄却する。ここで棄却されない場合
は、作成した色分類要素データと、類似度が最も高い標
準帳票の番号と、文字、表領域の対応付け結果を出力す
る。
【0036】本実施例では各フィールドでの画素単位に
帳票種別判定を行なう例を示したが、複数画素からなる
小領域を単位として帳票種別判定を行なうことも可能で
ある。本実施例では、帳票種別を判定するため文字と表
領域を対応付ける例を示したが、文字、表領域以外の写
真領域等も同時に対応付けることが可能である。以上の
ように本実施例によれば、複数種類の帳票を混在した読
取においても帳票の種別が判定でき、帳票の印刷ムラな
どが発生した画像品質の悪い多色帳票画像に対しても正
確な帳票種別判定が行える。
【0037】実施例3.本実施例では、多色帳票読取フ
ォーマット作成変更手段に付加機構を加えて特定の色の
画像のみを抽出したり、その色情報を変更する動作を説
明する。図10は、多色帳票読取フォーマット作成・変
更のための操作ボタンを示した図である。図において、
11は色範囲縮小ボタン、12は色範囲拡大ボタンを示
す。
【0038】色情報を標準帳票に設定した後、設定した
色情報が正確でないために画像抽出/文字認識に不具合
が発生する場合に、読取フォーマットの色情報を変更す
る手順について説明する。例えば、多色帳票読取フォー
マットが図3のように定まっているものとし、色情報3
3は「色B」に、色情報36は「色C」に既に決まってい
るものとする。次に、読取対象の帳票を画像入力装置に
入力し多色帳票画像1を得る。図3に示す情報を格納し
た標準帳票のみを多色帳票読取フォーマット群2に格納
し、この画像データを色統合手段4に入力した上で、帳
票種別判定手段5を動作させる。こうして、多色帳票画
像1と標準帳票との対応をとったフィールド毎の色分類
要素データが得られる。この色分類要素データを多色画
像表示制御手段22に入力する。多色画像表示制御手段
22では、画像全体を表示させるような決定を行う通常
モードではなく色情報修正モードがあり、色情報の値が
「色C」である色分類要素データのみを表示させるよう
な制御を行う。多色画像表示制御手段22の制御によ
り、多色画像表示手段23によって色情報の値が「色
C」であるような色分類要素データのみが表示される。
図3に示す読み取りフォーマットによれば、色情報の値
が「色C」であるような帳票構成要素は「フィールド
1」の「文字枠色」であるから、多色帳票画像のうち、
文字枠48のみが表示されるはずである。
【0039】操作者は図4の文字枠48のみが表示され
ているかどうかを画面上で確認し、もし文字枠48が表
示されなかったり、文字枠48以外にも帳票構成要素ま
たは特定領域が表示されている場合には、多色画像表示
制御手段22のモードを多色帳票画像全体を表示させる
ように変更する。たとえば「色C」と「色B」が似ている
ために、文字枠48のみならずフィールド枠44まで表
示されてしまったとする。操作者は、指定範囲への色情
報設定/変更手段25により、色Cの色範囲を変更す
る。この場合は、色範囲縮小ボタン11を押下し色Cの
色の範囲を縮小することにより、色Bとの混同を防止す
ることができる。また文字枠49が表示されなかった場
合は、色範囲拡大ボタン12を押下し色Cの色の範囲を
拡大することにより、文字枠49を抽出できるように色
の調整をする。
【0040】本実施例では、色範囲の設定を縮小・拡大
で設定する例を示したが、数値の直接入力、赤、青、緑
などの色属性単独の調整、最大値のみ・最小値のみを対
象とした変更などによって行うことも可能である。以上
にように本実施例によれば、多色帳票読取フォーマット
に設定された色情報が実際に有効に作用するかどうかを
簡単に調べ、不都合があっても簡単に修正することがで
きる。
【0041】実施例4.本実施例では、文字切り出し手
段の動作を説明する。図11は、文字枠がある場合の文
字切り出し手段7の動作を説明するフローチャートであ
る。図12は、フィールド枠色に対応した画像情報を示
した図である。図において131は図35に示した画像
531と同じものである。図13は、文字枠色に対応し
た画像情報を示した図である。図において132は図3
5に示した画像532と同一である。図14は、標準帳
票133に未登録の色に対応した画像情報を示した図で
ある。図において133は図35に示した画像533と
同一である。図15は、文字枠色に対応した画像情報に
対する文字枠切り出しの動作を説明する図である。図に
おいて、151は文字枠切り出し位置である。図16
は、文字認識対象画像情報と文字枠切り出し位置との関
係を示した図である。図において151は図15に示し
た同番の画像と同じものである。図17は、文字切り出
し結果を示した図である。
【0042】次に、文字枠がある場合の文字切り出し手
段の動作を説明する。図11のフローチャートをもと
に、図35の画像領域に対する動作を図12ないし、図
17の画像情報例を参照しながら説明する。また、標準
帳票は図3のように定まっているものとし、色情報33
は「色B」に、色情報36は「色C」に既に決まっている
ものとする。また、入力の文字画像の認識に際して、各
領域の位置は各々相対的に認識されるものとする。
【0043】帳票種別判定手段5から得た領域に対応す
る画像情報を対象として文字切り出しを行う。帳票種別
判定手段5から得た領域に対応する画像情報は、標準帳
票に登録された色で分類されている。色Bに対しては図
12に示す画像、色Cに対しては図13に示す画像、標
準帳票に未登録の色に対しては図14に示す画像が色統
合手段4および帳票種別判定手段5により得られてい
る。まずステップS111で、文字切り出し対象画像の
抽出を行う。この場合、図3に示すように標準帳票には
文字切り出し条件として、文字枠準拠37が選択されて
いる。さらに、文字枠色は標準帳票により色C36に設
定されている。そこで文字切り出し対象画像として色C
を選択し、図13に示す色Cに対する画像情報を抽出す
る。
【0044】ステップS112では、図13の画像を対
象に文字枠切り出し処理を行う。文字枠切り出しは、垂
直方向に画像ヒストグラムを抽出し、多色帳票読取フォ
ーマットに格納された文字枠ピッチを元に等ピッチで切
り出し候補点を設定する。さらにこの切り出し候補点を
左右にずらして、切り出し候補点上のヒストグラム値の
和が最小となる候補点列を文字枠切り出し位置とする。
これにより図13に対して、図15に示した文字枠切り
出し位置151が得られる。
【0045】ステップS113では、文字認識対象画像
の抽出を行う。この場合、多色帳票読取フォーマットに
は文字認識対象として、(フィールド枠色以外かつ背景
色以外かつ文字枠色以外)38が選択されている。ま
た、背景色には色F39、フィールド枠色には色B3
3、文字枠色には色C36が設定されている。そこで文
字認識対象として色F以外かつ色B以外かつ色C以外に
該当する色を選択する。これにより、文字認識対象画像
として図14の画像を得る。
【0046】ステップS114では、ステップS113
で得た文字認識対象画像に、各々の画像の相対位置は先
に認識されているので、ステップS112で得た文字枠
切り出し位置を重ねて、文字を切り出す。図16に文字
認識対象画像と文字切り出し位置の関係、図17に文字
切り出し結果を示す。文字認識は文字認識手段8によ
り、図17の文字切り出し結果の個々の切り出し結果に
ついて認識を行う。これは極く通常に行われている手段
なので構成と動作の詳細説明は省略する。
【0047】本実施例では、文字枠、フィールド枠の形
状は実線の長方形で構成されているが、円やひし形など
の他の形状、また破線、波線などを用いてもよい。また
本実施例では、文字枠色、フィールド枠色、文字認識対
象の色指定が1種類の例を示したが、これに限らず複数
種類の色を指定することができる。また本実施例では、
最終的に文字を認識する例を示したが、これに限らず文
字切り出しの結果画像を出力することもできる。以上の
ように本実施例によれば、フィールド毎の色情報と位置
情報を得て相対位置が定まるので、多色帳票に記入した
文字が文字枠の中央に記入されず文字同士が近接して記
入された場合や帳票画像がずれて入力された場合でも、
正確に文字を切り出すことができ、ひいては文字を正確
に認識することができる。
【0048】実施例5.本実施例では、文字切り出し手
段の動作を説明する。図18は、プレプリントがある場
合の文字切り出し手段7の動作を説明するフローチャー
トである。図19は、帳票種別判定手段5から得た領域
に対応する帳票画像の例を示す図である。図において、
191はフィールド枠、192はプレプリント画像
(1)、193はプレプリント画像(2)であり、19
4は記入文字である。図20は、図19に示した領域内
でのフィールド枠色に対応した画像情報を示した図であ
る。図において191は図19のそれと同一画像であ
る。図21は、図19に示した領域内でのプレプリント
色に対応した画像情報を示した図である。図において1
92、193は図19のそれと同一でそれぞれ年、月の
プレプリントである。図22は、図19に示した領域内
での記入文字色に対応した画像情報を示した図である。
図において194は図19のそれと同一である。
【0049】図23は、文字記入領域抽出の処理内容を
説明するための枠等の画像図である。図において、23
1はプレプリント(1)に対する文字記入領域(1)、
232はプレプリント(2)に対する文字記入領域
(2)である。図24は、文字列切り出しの動作を説明
するための画像図である。図において、194は記入文
字、231、232は図23で示した枠である。図25
は、文字列切り出しの結果を示す図である。図におい
て、251はプレプリント(1)に対応する文字列切り
出し結果、252はプレプリント(2)に対応する文字
列切り出し結果であり、194は図19に示す記入文字
である。図26は、文字切り出しの結果を示す図であ
る。図において、261はプレプリント(1)に対応す
る第1文字目の文字切り出し結果、262はプレプリン
ト(1)に対応する第2文字目の文字切り出し結果、2
63はプレプリント(2)に対応する第1文字目の文字
切り出し結果、264はプレプリント(2)に対応する
第2文字目の文字切り出し結果である。
【0050】次に、プレプリントがある場合の文字切り
出し手段の動作を説明する。図18のフローチャートを
もとに、図19の画像入力に対する動作を、図20ない
し図26の画像情報例を参照しながら説明する。帳票種
別判定手段5から得た領域に対応する画像情報を対象と
して文字切り出しを行う。帳票種別判定手段5から得た
領域に対応する画像情報は、標準帳票に登録された色で
分類されている。色Bに対しては図20に示す画像、色
Dに対しては図21に示す画像、色Eに対しては図22
に示す画像が色統合手段4により得られている。まずス
テップS181で、プレプリント切り出し対象画像の抽
出を行う。この場合、図3に示す多色帳票読取フォーマ
ットには、文字切り出し条件(1)としてプレプリント
文字(1)準拠301、文字切り出し条件(2)として
プレプリント文字(2)準拠302が選択されている。
さらに、プレプリント文字(1)の記入座標303、プ
レプリント文字(2)の記入座標304とともに、プレ
プリント色が色D305が設定されている。そこでプレ
プリント切り出し対象画像として色Dを選択し、図21
に示す色Dに対する画像情報を抽出する。
【0051】ステップS182では、図21に示す画像
情報を対象にプレプリント切り出し処理を行う。プレプ
リント切り出しは垂直方向に画像ヒストグラムを抽出
し、多色帳票読取フォーマットに格納されたプレプリン
トの位置を用いて切り出す。この場合プレプリント文字
は2つあり、プレプリント(1)の記入座標303がプ
レプリント(2)の記入座標304より左にあることを
利用して、図21のプレプリント画像(1)192がプ
レプリント(1)に、プレプリント画像(2)193が
プレプリント(2)と対応が付く。次に、図20のフィ
ールド枠色に対する画像情報と、図21のプレプリント
色に対する画像を重畳した図23の画像情報を用いて文
字記入領域の抽出を行う。プレプリント(1)に対応付
いたプレプリント画像(1)192より左方にある領域
を文字記入領域(1)191として抽出し、プレプリン
ト(2)に対応付いたプレプリント画像(2)193よ
り左方、プレプリント(1)に対応付いたプレプリント
画像(1)192より右方にある領域を文字記入領域
(2)232として抽出する。文字記入領域の上端・下
端は、フィールド枠191の上下端位置を基準に求め
る。
【0052】ステップS183では、文字認識対象画像
の抽出を行う。この場合、多色帳票読取フォーマットに
は文字認識対象として、記入文字色306が選択されて
いる。また、記入文字色には色E307が設定されてい
る。そこで文字認識対象画像として色Eに該当する色を
選択する。これにより、文字認識対象画像として図22
の画像を得る。ステップS184では、図24に示すよ
うに、ステップS183で得た文字認識対象画像に、ス
テップS182で得た文字記入領域を重ね、文字列を切
り出す。文字列は図25に示すプレプリント(1)に対
応する文字列切り出し結果251と、プレプリント
(2)に対応する文字列切り出し結果252に分割され
る。
【0053】ステップS185では、ステップS184
で得られた文字列切り出し結果から各文字を切り出す。
文字切り出しは垂直方向に画像ヒストグラムを抽出し、
ヒストグラムの塊を切り出すことより水平方向の切り出
し位置を求める。次に左右の切り出し座標に挾まれた塊
画像を、上から下に走査し最初に黒画素にぶつかる点を
上端、下から上に走査し最初に黒画素にぶつかる点を下
端とする。文字切り出しの結果、図26に示すようにプ
レプリント(1)に対応する第1文字目の文字切り出し
結果261、プレプリント(1)に対応する第2文字目
の文字切り出し結果262、プレプリント(2)に対応
する第1文字目の文字切り出し結果263、プレプリン
ト(2)に対応する第2文字目の文字切り出し結果26
4に分割される。
【0054】文字認識は文字認識手段8により、図26
の文字切り出し結果の個々の切り出し結果について認識
を行う。この時、切り出し結果261、262の認識結
果は、プレプリント(1)つまり”年”に対応する認識
結果となる。同様に、切り出し結果263、264の認
識結果は、プレプリント(2)つまり”月”に対応する
認識結果となる。
【0055】本実施例では、プレプリントは文字で記入
された例を示したが、これに限らず記号や絵などを用い
てもよい。また本実施例では、プレプリント色の色指定
が1種類の例を示したが、これに限らず、プレプリント
色を各々のプレプリントに対して指定することにより複
数種類の色を指定することができる。また本実施例で
は、帳票読取フォーマットに格納されたプレプリント情
報とプレプリント画像とを位置情報で対応付けたが、こ
れに限らず色情報、形状情報などを用いて対応をとるこ
ともできる。また本実施例では、文字記入領域の抽出を
プレプリント画像の隣接位置から抽出したが、これに限
らずプレプリント画像から一定量離れた位置など自由に
設定できる。以上のように本実施例によれば、プレプリ
ントがある多色帳票に記入した文字をプレプリントに対
応付けて正確に切り出すことができ、ひいては文字を正
確に認識することができる。
【0056】実施例6.本実施例では、画像抽出手段の
動作を説明する。図27は、画像抽出手段6の動作を説
明するフローチャートである。図28は、帳票種別判定
手段5から得た領域に対応する帳票画像の例を示す図で
ある。図において、281はフィールド枠、282は記
入文字、283は記入文字色、フィールド枠色、背景色
のいずれにも該当しない色で記載された印影である。図
29は図28に示した領域内での、フィールド枠色に対
応した画像情報を示した図である。図において281は
図28中の枠と同じ画像である。図30は図28に示し
た領域内での、記入文字色に対応した画像情報を示した
図である。図において282は図28中の記入文字と同
じ画像である。図31は図28に示した領域内での、多
色帳票読取フォーマットに未登録の色に対応した画像情
報を示した図である。図において283は図28中の印
影と同じものである。図32は、画像情報の重畳を説明
するための説明画像図である。図において282、28
3は図28中の対応する画像と同じである。
【0057】図27のフローチャートをもとに、図28
ないし図32の具体的な画像例を参照しながら画像抽出
手段6の動作を説明する。多色帳票読取フォーマットに
は、図3に示したものを適用する。帳票種別判定手段5
から得た領域に対応する画像情報を対象として画像抽出
を行う。帳票種別判定手段5から得た領域に対応する画
像情報は、多色帳票読取フォーマットに登録された色で
分類されている。例えば、色Bに対しては図29に示す
画像、色Eに対しては図30に示す画像、多色帳票読取
フォーマットに未登録の色に対しては図31に示す画像
が色統合手段4および帳票種別判定手段5により得られ
ている。
【0058】まずステップS271で、多色帳票読取フ
ォーマットに格納された画像切り出し条件で指定された
構成要素の色で構成される画像を抽出する。この場合、
図3の多色帳票読取フォーマットには画像切り出し条件
としてフィールド枠準拠308、フィールド枠色として
色B309が設定されているので、図29に示す色Bに
対する画像情報を抽出する。ステップS272では、図
29の画像情報に内包される画像情報をフィールド枠自
身を含んで抽出する。ステップS273では、記入文字
画像の抽出を行う。この場合、多色帳票読取フォーマッ
トには画像切り出し対象色(1)として、記入文字色3
10が選択されている。さらに、記入文字色には色E3
07が設定されている。そこで色Eに該当する色を内包
画像情報から抽出する。抽出した画像情報は図30と同
一の画像情報となる。ステップS273では、記入文字
以外の画像抽出を行う。この場合、多色帳票読取フォー
マットには画像切り出し対象色(2)として、(記入文
字色以外かつ背景色以外かつフィールド枠色以外)31
1が選択されている。さらに、記入文字色には色E30
7、背景色には色F39、フィールド枠色には色B30
9が設定されている。そこで(色E以外かつ色F以外か
つ色B以外)に該当する色を内包画像から抽出する。抽
出した画像情報は図31と同一の画像情報となる。
【0059】ステップS275では、ステップS27
3、ステップS274で得た抽出画像の重畳を行う。具
体的には、ステップS273で得た抽出画像とステップ
S274で得た抽出画像の重畳した画像の抽出を多色帳
票読取フォーマットの指示に従い抽出する。多色帳票読
取フォーマットには、310、312に示した2つの画
像切り出し対象色が選択されているので図30と図31
を重畳した図32の画像が出力される。本実施例では、
画像切り出し対象色を2つに設定した場合の例を示した
が、これに限らず、3以上の種類及び全色などを設定し
てもよい。
【0060】また本実施例では、フィールド枠は長方形
の例を示したが、これに限らず円やひし形などの他の形
状を設定することもできる。また本実施例では、記入文
字色と多色帳票読取フォーマットに未登録の色について
の例を示したが、文字枠色やフィールド枠色などを指定
することにより、他の要素も抽出することができる。ま
た本実施例では、1つの領域に対して1回だけ画像抽出
手段を適用したが、画像切り出し対象色のみが異なり他
の条件が同一のフィールドを複数個定義して、同一領域
に対して複数回画像抽出手段を適用することにより、印
影のみの画像、記入文字色のみの画像の各々を抽出する
ことも可能である。以上のように本実施例によれば多色
帳票で枠で領域設定された画像から、色によって区別さ
れた構成要素を自由に抽出することができ、必要とする
画像を効率よく抽出することができる。
【0061】実施例7.本実施例では、結果出力手段の
動作を説明する。図33は、結果出力手段9の動作を説
明するフローチャートである。次に、結果出力手段9の
動作を図1および図33を用いて説明する。まずステッ
プS331において、画像抽出手段6および文字切り出
し手段7で取得した画像や、文字認識手段8で得た文字
認識結果を結果出力手段9に入力する。ステップS33
2では、文字認識結果および取得画像の表示の実行の有
無を判定する。表示の有無の指定は多色帳票読取フォー
マットにより指定する。S333では、多色帳票読取フ
ォーマットに基づいた表示と、画像色に基づいた表示の
どちらかを選択する。表示色の選択指定は多色帳票読取
フォーマットにより指定する。ここで多色帳票読取フォ
ーマットに基づいた表示が選択されている場合には、S
334で、文字認識結果と取得画像を多色帳票読取フォ
ーマットに記述した文字色と取得画像の色で表示装置に
表示する。また、画像色に基づいた表示が選択されてい
る場合には、S335で、文字認識結果と取得画像を多
色帳票画像1から求めた文字の色および取得画像の色を
用いて表示する。例えば、画像色に基づいた表示では、
多色帳票画像1に記入された文字列の一部が赤、残りの
文字が黒で書かれていた場合、赤い文字部分に対応する
文字認識結果を赤色で、黒い文字部分に対応する文字認
識結果を黒色で表示する。その後S336では、表示し
た文字認識結果や画像に対して、オペレータが誤読文字
の修正作業等を加工行ない、その加工した結果をデータ
ファイル化する。S337では、作成したデータファイ
ルを記憶装置に格納し、処理を終了する。これとは逆
に、文字認識結果と取得画像を表示しない場合は、取得
した画像と文字認識結果を直接データファイル化して、
記憶装置に格納後、処理を終了する。
【0062】本実施例では、表示の有無、表示色の選択
は多色帳票読取フォーマットにより指定した例を示した
が、操作者が対話的に指定してもよい。また本実施例で
は、結果出力手段9は画像色もしくは多色帳票読取フォ
ーマットに指定した色で出力するように構成したが、画
像色と色帳票読取フォーマットに記述した色が異なる場
合に色の異なる領域を画面に表示する構成としてもよ
い。以上のように本実施例によれば、入力画像や多色帳
票読取フォーマットと同一色で表示でき修正作業を誤り
なく円滑に進めることができる。
【0063】
【発明の効果】以上のようにこの発明によれば、標準帳
票を設定または変更する多色帳票読取フォーマット作成
変更手段と、文字画像入力の帳票の種別を判定する帳票
種別判定手段と、判定した種別に基づいて文字画像入力
から対象領域を抽出する画像抽出手段と、この抽出した
読取領域と判定した種別の標準帳票の対応フィールドの
設定値とで対象文字を切り出す文字切り出し手段と、こ
の読取対象文字に対する文字認識手段を備えたので、色
の異なる複数種類のフィールドを持つ文字画像入力に対
しても、切り出し位置を正確にして文字画像認識ができ
る効果がある。
【0064】また更に、類似した色成分を統合して指定
の色とする色統合手段を付加したので、認識する色の種
類を減らして比較時間を短縮できる効果が加わる。
【0065】また更に、抽出した画像と、文字認識結果
を出力する結果出力手段を付加したので、確認と訂正が
容易になる効果が加わる。
【0066】また更に、特定の色の画像のみを抽出して
出力し、範囲位置と色の設定を変更できるようにしたの
で、装置の動作が確認でき、また動作の補正も容易にで
きる効果もある。
【0067】また更に、標準多色帳票と文字画像入力の
色情報で帳票種別を判定するようにしたので、詳細な帳
票の区別ができる効果もある。
【0068】また更に、各色毎のフィールド毎にデータ
を対応付けて帳票種別を判定するようにしたので、色が
類似した帳票でも区別でき、また他の任意の標準帳票の
フィールドの情報を利用できる効果もある。
【0069】また更に、フィールドの色情報と文字画像
入力との相対位置情報を用いて文字画像入力の切り出し
を行うようにしたので、文字を記入枠の位置に併せて読
み取って誤認識を防ぐ効果もある。
【0070】また更に、対象領域から複数の色情報を抽
出して重畳出力するようにしたので、必要とする画像を
効率よく抽出でき、また文字画像情報を正確に認識でき
る効果もある。
【図面の簡単な説明】
【図1】 本発明の一実施例である多色文字画像読取装
置の構成図である。
【図2】 実施例1および実施例3で示す多色帳票読取
フォーマット作成・変更手段の構成ブロック図である。
【図3】 多色帳票読取フォーマット群メモリに格納さ
れる標準帳票のデータの例を示す図である。
【図4】 入力の文字画像を読み込んで得た多色帳票画
像の例を示す図である。
【図5】 実施例2における多色帳票画像の一例を示す
図である。
【図6】 実施例2における色統合手段4の動作を説明
するための拡大した枠の図である。
【図7】 実施例2における帳票種別判定手段5の動作
を説明するための図である。
【図8】 実施例2のおける帳票種別判定手段5の照合
動作を説明するための図である。
【図9】 実施例2における帳票種別判定手段5の動作
を説明するための別の画像図である。
【図10】 実施例3における色情報の変更用の操作ボ
タンを示す図である。
【図11】 実施例4における文字切り出し手段7の処
理動作を示すフローチャート図である。
【図12】 実施例4におけるフィールド枠色に分類さ
れる色分類要素データを示す図である。
【図13】 実施例4における文字枠色に分類される色
分類要素データを示す図である。
【図14】 実施例4における標準帳票に未登録の色に
分類される色分類要素データを示す図である。
【図15】 実施例4における文字枠切り出し結果を示
す図である。
【図16】 実施例4における文字切り出し対象と文字
切り出し位置との関係を示す図である。
【図17】 実施例4における文字切り出し結果の例を
示す図である。
【図18】 実施例5における文字切り出し手段7の処
理動作を示すフローチャート図である。
【図19】 実施例5における多色帳票画像の一例を示
す図である。
【図20】 実施例5におけるフィールド枠色に分類さ
れる色分類要素データを示す図である。
【図21】 実施例5におけるプレプリント色に分類さ
れる色分類要素データを示す図である。
【図22】 実施例5における記入文字色に分類される
色分類要素データを示す図である。
【図23】 実施例5における文字列領域抽出の動作を
説明するための枠等の画像図である。
【図24】 実施例5における文字列切り出しの動作を
説明するための画像図である。
【図25】 実施例5における文字列切り出し結果を示
す図である。
【図26】 実施例5における文字切り出し結果を示す
図である。
【図27】 実施例6における画像抽出手段の処理動作
を示すフローチャート図である。
【図28】 実施例6における多色帳票画像の一例を示
す図である。
【図29】 実施例6におけるフィールド枠色に分類さ
れる色分類要素データを示す図である。
【図30】 実施例6における記入文字色に分類される
色分類要素データを示す図である。
【図31】 実施例6における標準帳票に未登録の色に
分類される色分類要素データを示す図である。
【図32】 実施例6における記入文字色と標準帳票に
未登録の色を重畳した画像を示す図である。
【図33】 実施例7における結果出力手段の処理動作
を示すフローチャート図である。
【図34】 従来の多色帳票処理装置の構成ブロック図
である。
【図35】 文字枠のある多色帳票画像の一例を示す図
である。
【図36】 従来の読取装置による文字切り出し動作を
説明するための図である。
【図37】 図35記載の入力に対する従来の文字切り
出し結果を示す図である。
【図38】 プレプリントのある多色帳票画像の一例を
示す図である。
【図39】 図38記載の入力に対する従来の文字切り
出し結果を示す図である。
【符号の説明】
1 多色帳票画像、2 多色帳票読取フォーマット(標
準帳票)群メモリ、3多色帳票読取フォーマット作成・
変更手段、4 色統合手段、5 帳票種別判定手段、6
画像抽出手段、7 文字切り出し手段、8 文字認識
手段、9 結果出力手段、24 画像範囲指定手段、2
5 色情報設定/変更手段、26 読取フォーマット構
造設定手段、27 読取フォーマットへの色情報設定手
段。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 文字画像入力の指定された色毎に範囲を
    設定して範囲位置と色とをフィールド毎にまとめた標準
    帳票を作成する多色帳票読取フォーマット作成変更手段
    と、 上記多色帳票読取フォーマット作成変更手段で作成され
    た標準帳票と、上記文字画像入力を比較して入力の帳票
    の種別を判定する帳票種別判定手段と、 上記帳票種別判定手段で判定した種別に基づいて上記文
    字画像入力から対象領域を抽出する画像抽出手段と、 上記画像抽出手段で抽出した読取領域と、上記帳票種別
    判定手段で判定した種別の標準帳票の対応フィールドの
    設定値とから読取対象文字を切り出す文字切り出し手段
    と、 上記文字切り出し手段で切り出された領域毎の読取対象
    文字を認識する文字認識手段を備えた多色文字画像読取
    装置。
  2. 【請求項2】 基本構成に更に、文字画像入力に対して
    類似した色成分を持つ画素を統合して指定の色とする色
    統合手段を付加したことを特徴とする請求項1記載の多
    色文字画像読取装置。
  3. 【請求項3】 基本構成に更に、画像抽出手段で抽出し
    た画像と、上記文字認識手段出力の認識結果を出力する
    結果出力手段を付加したことを特徴とする請求項1記載
    の多色文字画像読取装置。
  4. 【請求項4】 また更に、多色帳票読取フォーマット作
    成変更手段は、特定の色に対応する画像のみを抽出して
    出力し、範囲位置と色の設定を変更できるようにしたこ
    とを特徴とする請求項1記載の多色文字画像読取装置。
  5. 【請求項5】 また更に、帳票種別判定手段は、標準帳
    票と、文字画像入力の各々の色情報で帳票種別を判定す
    ることを特徴とする請求項1記載の多色文字画像読取装
    置。
  6. 【請求項6】 また更に、帳票種別判定手段は、標準帳
    票と文字画像入力の各々の色情報に加え、各色毎のフィ
    ールド毎にデータを対応付けて帳票種別を判定すること
    を特徴とする請求項5記載の多色文字画像読取装置。
  7. 【請求項7】 また更に、文字切り出し手段は、フィー
    ルドの色情報と、文字画像入力との相対位置情報を用い
    て文字画像入力の切り出しを行うことを特徴とする請求
    項1記載の多色文字画像読取装置。
  8. 【請求項8】 また更に、画像抽出手段は、対象領域か
    ら複数の色情報を抽出して重畳出力することを特徴とす
    る請求項1記載の多色文字画像読取装置。
JP15949095A 1995-06-26 1995-06-26 多色文字画像読取装置 Expired - Fee Related JP3720078B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP15949095A JP3720078B2 (ja) 1995-06-26 1995-06-26 多色文字画像読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP15949095A JP3720078B2 (ja) 1995-06-26 1995-06-26 多色文字画像読取装置

Publications (2)

Publication Number Publication Date
JPH0916714A true JPH0916714A (ja) 1997-01-17
JP3720078B2 JP3720078B2 (ja) 2005-11-24

Family

ID=15694910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15949095A Expired - Fee Related JP3720078B2 (ja) 1995-06-26 1995-06-26 多色文字画像読取装置

Country Status (1)

Country Link
JP (1) JP3720078B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7508986B2 (en) 2003-11-28 2009-03-24 Canon Kabushiki Kaisha Document recognition device, document recognition method and program, and storage medium
JP2009245036A (ja) * 2008-03-31 2009-10-22 Fujitsu Frontech Ltd 文字認識装置
JP5997808B1 (ja) * 2015-06-18 2016-09-28 株式会社Pfu 画像処理装置、日付識別装置、画像処理方法、および、プログラム
JP2017068562A (ja) * 2015-09-30 2017-04-06 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7508986B2 (en) 2003-11-28 2009-03-24 Canon Kabushiki Kaisha Document recognition device, document recognition method and program, and storage medium
JP2009245036A (ja) * 2008-03-31 2009-10-22 Fujitsu Frontech Ltd 文字認識装置
US8189921B2 (en) 2008-03-31 2012-05-29 Fujitsu Frontech Limited Character recognition device
JP5997808B1 (ja) * 2015-06-18 2016-09-28 株式会社Pfu 画像処理装置、日付識別装置、画像処理方法、および、プログラム
JP2017068562A (ja) * 2015-09-30 2017-04-06 富士ゼロックス株式会社 情報処理装置及びプログラム

Also Published As

Publication number Publication date
JP3720078B2 (ja) 2005-11-24

Similar Documents

Publication Publication Date Title
US6466694B2 (en) Document image processing device and method thereof
US7765480B2 (en) Image processing apparatus, image processing method, and a computer-readable storage medium containing a computer program for image processing recorded thereon
JP3258122B2 (ja) 画像処理装置
DE60312572T2 (de) Verfahren und Gerät zum Konvertieren digitaler Bilder von Handzeichnungen zur weiteren Verwendung in einem strukturierten Text/Graphik Editor.
CN101848303B (zh) 图像处理装置、图像形成装置以及图像处理方法
US7532757B2 (en) Image processing apparatus, control method therefor, and program
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US20020015525A1 (en) Image processor for character recognition
US20110209044A1 (en) Document image generating apparatus, document image generating method and computer program
US20040179717A1 (en) Printing system, method of inspecting print data, method of classifying print inspection result and program
EP1538564A2 (en) Image processing system and image processing method
JP2016139982A (ja) 画像処理装置、および画像形成システム
JP4217575B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
US9277094B2 (en) Image processing apparatus and recording medium
US7227997B2 (en) Image recognition apparatus, image recognition method, and image recognition program
US20050034067A1 (en) Document processor, printing system, method of adding object to document and program
US8355577B2 (en) Image processing apparatus and method
JPH0916714A (ja) 多色文字画像読取装置
JP2004502258A (ja) 1対1比較による漢字の校正システム
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2000029198A (ja) 検版装置、画像処理装置および記録媒体
JP2005352735A (ja) 文書ファイル作成支援装置、文書ファイル作成支援方法及びそのプログラム
JP4710707B2 (ja) 追記情報処理方法、追記情報処理装置、およびプログラム
JPH09245099A (ja) 帳票作成装置
JP3637771B2 (ja) 文書編集出力装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050406

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050907

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080916

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090916

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees