JPH06111057A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH06111057A
JPH06111057A JP4256582A JP25658292A JPH06111057A JP H06111057 A JPH06111057 A JP H06111057A JP 4256582 A JP4256582 A JP 4256582A JP 25658292 A JP25658292 A JP 25658292A JP H06111057 A JPH06111057 A JP H06111057A
Authority
JP
Japan
Prior art keywords
character
color
label
format information
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4256582A
Other languages
English (en)
Inventor
Hiroyuki Harashima
裕之 原島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4256582A priority Critical patent/JPH06111057A/ja
Publication of JPH06111057A publication Critical patent/JPH06111057A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】フォーマット情報の登録のための作業負担を軽
減させることを可能とする。 【構成】文字等が記録された用紙についてのカラー画像
を検出する走査部10と、このカラー画像を格納するた
めのシートメモリ20と、格納されたカラー画像から、
色毎に、連結した画素の集合からなるラベル画像を検出
し、色毎にラベル画像を格納するラベリング部30と、
各色の各ラベル画像について文字及び文字記入枠を含む
何れの属性であるか識別するラベル識別部40と、文字
記入枠と識別されたラベル画像の配列に基づいて文字記
入枠列を判定する文字記入枠列判定部50と、文字記入
枠列に基づいてフォーマット情報を作成するフォーマッ
ト情報作成部60と、作成されたフォーマット情報に従
い、文字と識別されたラベル画像について文字認識を行
なう文字認識部70とを具備して構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、複数の色が使用された
用紙に記録された文字の読取りを行なう光学的文字読取
装置に関する。
【0002】
【従来の技術】一般に、帳票等に記入された文字等の読
取りを行なう光学的文字読取装置は、黒色を有効(文字
データ)、白色を無効(背景)とする白黒(2値)画像
を処理の対象としている。そのため、帳票等に対して光
学的走査を行なって画像を検出する走査部では、あるし
きい値に基づいて、白/黒に対応する2値化が行なわれ
ている。
【0003】このため、光学的文字読取装置の処理対象
とされる帳票に文字記入枠や読取りの不要な文字等を印
刷するために用いられる色は、光学的文字読取装置(の
走査部におけるしきい値理論)では白色と判定される
色、すなわちドロップアウトカラーと呼ばれる色が使用
される。このドロップアウトカラーは、走査部において
使用される光源の波長に応じて決定される。
【0004】一般に、光学的文字読取装置では、帳票に
記入された文字について認識を行なうために、文字パタ
ーンの切出しを行なう必要がある。この際、帳票イメー
ジにおける文字パターンの位置を示す座標値が必要とな
る。この文字パターンの位置は、文字記入枠の位置とな
る。従来では、文字記入枠列の位置(座標)を示す情報
を、予め光学的文字読取装置にフォーマット情報として
登録しておく必要があった。
【0005】
【発明が解決しようとする課題】このように従来の光学
的文字読取装置では、文字記入枠の位置を示すフォーマ
ット情報を予め登録しておく必要があった。このフォー
マット情報としては、文字記入枠列の座標情報、帳票先
端からの距離・帳票左端からの距離・文字枠の間隔など
を含んでいるが、これらの情報を実際の帳票上で測定し
て求める作業が必要となってしまう。この座標情報の値
に間違いがあると、光学的文字読取装置は正常に文字読
取りができなくなってしまうために、確実な測定が必要
であり、その作業負担が大きかった。
【0006】本発明は前記のような点に鑑みてなされた
もので、フォーマット情報の登録のための作業負担を軽
減させることが可能な光学的文字読取装置を提供するこ
とを目的とする。
【0007】
【課題を解決するための手段】本発明は、文字等が記録
された用紙について光学的走査を行ない、カラー画像を
検出する走査手段と、前記走査手段によって検出された
カラー画像を格納するための格納手段と、前記格納手段
に格納されたカラー画像から、色毎に、連結した画素の
集合からなるラベル画像を検出すると共に、色毎にラベ
ル画像を格納するラベリング手段と、前記ラベリング手
段によって検出された各色の各ラベル画像について、文
字及び文字記入枠を含む何れの属性であるかを識別する
ラベル識別手段と、前記ラベル識別手段によって属性が
文字記入枠と識別されたラベル画像の配列に基づいて、
文字記入枠列を判定する文字記入枠列判定手段と、前記
文字記入枠列判定手段による判定結果に基づいて、文字
認識のためのフォーマット情報を作成するフォーマット
情報作成手段と、前記フォーマット情報作成手段によっ
て作成されたフォーマット情報に従い、前記ラベル識別
手段によって属性が文字と識別されたラベル画像につい
て文字認識を行なう文字認識手段とを具備して構成す
る。
【0008】
【作用】このような構成によれば、複数の色が混在する
用紙から検出されたカラー画像について、色毎に文字に
対応するラベル画像が検出され、それぞれについて文字
及び文字記入枠を含む何れの属性であるか識別される。
その中で文字記入枠の並びから文字記入枠列が判定され
フォーマット情報が自動的に作成される。従って、市販
されている光学的文字読取装置用ではない一般の帳票の
読取りを行なうような場合であっても、フォーマット情
報の登録などの特別な作業が不要となる。
【0009】
【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は同実施例に係わる光学的文字読取装置の
構成を示すブロック図である。図1に示すように、本発
明の光学的文字読取装置は、走査部10、シートメモリ
20、ラベリング部30、ラベル識別部40、文字記入
枠列判定部50、フォーマット情報作成部60、及び文
字認識部70によって構成される。
【0010】走査部10は、処理対象とする用紙等をカ
ラー画像として光学的に走査し、カラー画像信号をシー
トバッファ20に出力するものである。シートバッファ
20は、走査部10における光学的走査によって得られ
たカラー画像を、例えば1用紙分格納するものである。
ラベリング部30は、シートバッファ20に格納された
カラー画像から、色毎に画素の連結性によりラベル付け
を行ない、その画像(以下、ラベル画像と称する)を格
納するものである。ラベル識別部40は、ラベリング部
30によって検出された各色のラベル画像について、大
きさ、形状などの幾何学的情報に基づいて、文字パター
ン、文字記入枠など、どの属性であるかを識別する。文
字記入枠列判定部50は、ラベル識別部40により文字
枠と識別されたラベル画像について、色情報及び配列に
より文字枠列を判定・抽出する。フォーマット情報作成
部60は、文字記入枠列判定部50によって検出された
情報により、文字認識に供される文字パターンを切出す
ためのフォーマット情報を作成する。文字認識部70
は、フォーマット情報作成部60によって作成されたフ
ォーマット情報に従って、ラベル識別部40によって文
字と識別されたラベル画像を切出し、文字認識処理を行
なう。
【0011】次に、本実施例の動作について説明する。
【0012】まず、処理対象とする用紙は、走査部10
において走査され、カラー画像として検出される。検出
されたカラー画像は、シートバッファ20に格納され
る。
【0013】ラベリング部30は、シートバッファ20
に1用紙分のカラー画像が格納されると、カラー画像に
ついて色毎に画像の連結性を調べ、連結される集合毎に
ラベル付けを行なってラベル毎の画像(ラベル画像)を
色毎に格納する。
【0014】色毎のイメージについてラベル付けが行な
われると、ラベル識別部40は、ラベリング部30に格
納されている各色の各ラベル画像毎の属性を識別する。
例えば、ラベル画像の大きさが、あるしきい値より小さ
く、かつ矩形である場合に文字記入枠と識別し、大きい
場合に絵・写真・背景等であると識別し、小さいが矩形
でない場合に文字であると識別する。
【0015】図2はラベル識別部40による属性識別を
説明するための図である。例えば図2(a)に示すよう
な帳票がある場合に、文字記入枠及び数字に対応するラ
ベル画像はしきい値より小さいと判別され、絵に対応す
るラベル画像はしきい値より大きいと判別される。
【0016】さらに、例えばしきい値より小さいと判別
されたラベル画像についてX方向,Y方向に射影をと
り、その射影値に基づいて文字記入枠のであるか否かを
識別する。図2(b)に示すように、枠のラベル画像の
射影は特徴があるので、図2(c)に示すような文字の
ラベル画像と区別することができる。
【0017】文字記入枠列抽出部50は、文字記入枠と
識別されたラベル画像について、その色、及び位置情報
により文字列を抽出・生成する。文字記入枠列は、文字
記入枠列抽出部50により、ラベル画像間のユークリッ
ド距離を調べ、1つの文字記入枠の領域が抽出され、合
わせて文字記入枠の並びの方向(縦書き・横書き等)も
識別される。図3は文字記入枠列抽出を説明するための
図である。
【0018】図3に示すように、1つのラベル画像に注
目し、このラベル画像の周辺に位置するラベル画像との
距離を求める。その結果、距離が短い方のラベル画像
を、同じ文字記入枠列の並びとする。
【0019】文字列抽出部50によって文字列が抽出さ
れると、フォーマット情報作成部60は、文字記入枠列
の位置を示す座標、すなわち図4に示すように帳票の先
端及び左端からの距離(Y,X)、及び文字記入枠の間
隔(ピッチ、P)から、各色毎に文字認識のためのフォ
ーマット情報を作成する。
【0020】読取りの対象とする文字記入枠は、例えば
図示せぬ表示装置に文字記入枠領域を表示し、キーボー
ド、マウス等の入力装置を用いて任意の文字記入枠領域
を指定させることにより選択可能である。
【0021】フォーマット情報作成部60によってフォ
ーマット情報が作成されると、文字認識部70は、フォ
ーマット情報の座標情報と、文字の属性をもったラベリ
ング部30に格納された文字に対応するラベル画像につ
いて、文字記入枠の配列の方向に従って、1文字毎に認
識処理を行なう。
【0022】すなわち、文字認識部70は、文字のラベ
ル画像について、フォーマット情報が示す文字記入枠の
並びの方向に従って順次ラベル画像について文字認識を
行なう。これにより、用紙に記録された文字の並びの順
に文字認識結果が得られることになるため、処理対象と
する用紙に記録される文字の並びは特に限定されない。
また、各色毎にフォーマット情報が作成されるので、例
えば赤色の文字が縦書き、青色の文字が横書きであるよ
うな場合であっても、各色の文字を正しい順で文字認識
することができる。
【0023】フォーマット情報作成部60によって作成
されたフォーマット情報は、同一の形態の用紙に記録さ
れた文字の読み取りを行なう際に利用することができ
る。この場合、各用紙毎にフォーマット情報を作成する
必要がなくなる。
【0024】このようにして、用紙に記録された文字記
入枠を抽出し、その並びに応じてフォーマット情報を作
成し、このフォーマット情報を用いて文字認識を行なう
ので、処理対象とする用紙の文字記入枠の位置を測定し
て登録する必要なく、複数の色が混在している場合であ
っても、各色毎の文字について正しい文字認識の結果が
得られる。
【0025】
【発明の効果】以上のように本発明によれば、検出され
たカラー画像から色毎にラベル画像を抽出し、その中の
文字記入枠に対応するラベル画像の並びに応じてフォー
マット情報を作成し、このフォーマット情報を用いて文
字認識を行なうので、特別なフォーマット情報登録のた
めの作業を必要とすることなく、市販されている一般の
伝票や光学的文字読取装置による処理を前提としていな
い帳票等の、様々な色が用いられた用紙に記録されてい
る文字の読取りが可能となるものである。
【図面の簡単な説明】
【図1】本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図。
【図2】ラベル識別部40による属性識別を説明するた
めの図。
【図3】文字記入枠列抽出を説明するための図。
【図4】フォーマット情報を説明するための図。
【符号の説明】
10…走査部、20…シートメモリ、30…ラベリング
部、40…ラベル識別部、50…文字記入枠列判定部、
60…フォーマット情報作成部、70…文字認識部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文字等が記録された用紙について光学的
    走査を行ない、カラー画像を検出する走査手段と、 前記走査手段によって検出されたカラー画像を格納する
    ための格納手段と、 前記格納手段に格納されたカラー画像から、色毎に、連
    結した画素の集合からなるラベル画像を検出すると共
    に、色毎にラベル画像を格納するラベリング手段と、 前記ラベリング手段によって検出された各色の各ラベル
    画像について、文字及び文字記入枠を含む何れの属性で
    あるかを識別するラベル識別手段と、 前記ラベル識別手段によって属性が文字記入枠と識別さ
    れたラベル画像の配列に基づいて、文字記入枠列を判定
    する文字記入枠列判定手段と、 前記文字記入枠列判定手段による判定結果に基づいて、
    文字認識のためのフォーマット情報を作成するフォーマ
    ット情報作成手段と、 前記フォーマット情報作成手段によって作成されたフォ
    ーマット情報に従い、前記ラベル識別手段によって属性
    が文字と識別されたラベル画像について文字認識を行な
    う文字認識手段と、 を具備したことを特徴とする光学的文字読取装置。
JP4256582A 1992-09-25 1992-09-25 光学的文字読取装置 Pending JPH06111057A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4256582A JPH06111057A (ja) 1992-09-25 1992-09-25 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4256582A JPH06111057A (ja) 1992-09-25 1992-09-25 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPH06111057A true JPH06111057A (ja) 1994-04-22

Family

ID=17294638

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4256582A Pending JPH06111057A (ja) 1992-09-25 1992-09-25 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH06111057A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10154191A (ja) * 1996-11-26 1998-06-09 Nec Corp 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
JP2010225112A (ja) * 2009-03-25 2010-10-07 Toppan Printing Co Ltd データ生成装置およびデータ生成方法
US8189921B2 (en) 2008-03-31 2012-05-29 Fujitsu Frontech Limited Character recognition device
JP2014235694A (ja) * 2013-06-05 2014-12-15 株式会社日立情報通信エンジニアリング 帳票処理装置、帳票処理方法、帳票処理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10154191A (ja) * 1996-11-26 1998-06-09 Nec Corp 帳票識別方法及び装置並びに帳票識別プログラムを記録した媒体
US8189921B2 (en) 2008-03-31 2012-05-29 Fujitsu Frontech Limited Character recognition device
JP2010225112A (ja) * 2009-03-25 2010-10-07 Toppan Printing Co Ltd データ生成装置およびデータ生成方法
JP2014235694A (ja) * 2013-06-05 2014-12-15 株式会社日立情報通信エンジニアリング 帳票処理装置、帳票処理方法、帳票処理プログラム

Similar Documents

Publication Publication Date Title
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
JP2007081458A (ja) 画像処理装置および画像処理装置の制御方法
JP2007072642A (ja) 画像処理装置および画像処理装置の制御方法
JPH06111057A (ja) 光学的文字読取装置
JPH06131495A (ja) 画像情報抽出方式
JPH06111060A (ja) 光学的文字読取装置
JP2877380B2 (ja) 光学的文字読取装置
JP2925300B2 (ja) 光学的文字読取装置
JP2925275B2 (ja) 光学的文字読取装置
JPH0252329A (ja) 画像情報記録・読取方法
JP3412441B2 (ja) 画像処理装置
JP3006294B2 (ja) 光学的文字読取装置
JPH0388085A (ja) 光学的文字読取装置
JPS62295192A (ja) 光学文字画像読取装置
JPH10124610A (ja) 光学式文字読取装置
JP2925270B2 (ja) 文字読取装置
JP2573665B2 (ja) 光学文字読取装置
JPH06176193A (ja) 光学的文字読取装置
JPH08171609A (ja) 文字列高速抽出装置
JPH05274473A (ja) 光学的文字読取装置
JPH0820669B2 (ja) 画像情報記録・読取方法
JP2001126025A (ja) Ocr用フォーマットパラメータ作成方法
JPS62295191A (ja) 光学文字画像読取装置
JPH0528314A (ja) 光学的文字読取装置
JP2001312695A (ja) ラベル領域検出装置、ラベル領域検出方法及び記録媒体