JPH06203204A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH06203204A
JPH06203204A JP4347968A JP34796892A JPH06203204A JP H06203204 A JPH06203204 A JP H06203204A JP 4347968 A JP4347968 A JP 4347968A JP 34796892 A JP34796892 A JP 34796892A JP H06203204 A JPH06203204 A JP H06203204A
Authority
JP
Japan
Prior art keywords
color
character
area
image
designated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4347968A
Other languages
English (en)
Inventor
Toshiyuki Yoshitake
敏幸 吉武
東善 ▲はい▼
Touzen Hai
Misako Suwa
美佐子 諏訪
Haruo Akimoto
晴雄 秋元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4347968A priority Critical patent/JPH06203204A/ja
Publication of JPH06203204A publication Critical patent/JPH06203204A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】本発明は文字認識装置に関し、非ドロップアウ
トカラーにより印刷された文字枠内に書かれた文字も正
確に認識することができるようにすることを目的とす
る。 【構成】帳票1を多色で入力する画像入力手段2と、帳
票1に記入される文字3、または帳票1に印刷された文
字枠4部分の色を指定する色指定手段5と、画像入力手
段2により得られた入力帳票画像6から、色指定手段5
により指定された色の領域を抽出する色領域抽出手段7
と、色領域抽出手段7により抽出された色領域から文字
パターン部分を切り出す文字領域抽出手段8とを有して
構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置に関し、
特に、帳票に記入された手書き文字を認識する文字認識
装置に関するものである。
【0002】近年、コンピュータ等の情報処理装置の普
及に伴い、これらの装置への入力手段として、紙等に書
いた手書きの文字や印刷文字を読み取る文字認識の技術
が要求されている。この文字認識装置では、予め設計さ
れた帳票上の特定の位置に記入された手書きの文字や印
刷文字を光学的に読み取って認識するものであり、光学
的文字認識装置において使用される帳票は、人間が記入
するのに不便ではなく、かつ、文字認識装置による読み
取り精度が高いことが必要となる。
【0003】
【従来の技術】一般に、文字認識のためのOCR帳票で
は、文字の記入位置を特定するために、文字枠が必要で
ある。しかし、文字を認識する処理においては、文字枠
は余分なものであり、文字認識の邪魔になる存在であ
り、認識処理を行う前に文字枠を取り除く必要がある。
【0004】そして、従来、上記文字枠の存在により認
識が不能になるのを防止するための手法としては、文字
枠を薄い赤や薄い青の特殊なインクにより印刷すること
が行われている。この手法は、ドロップアウトカラーで
印刷された文字枠が読み取り装置に反応しなことを利用
するもので、スキャン時に鉛筆あるいはボールペンで書
かれた文字のみが読み取り装置に取り込まれる。
【0005】
【発明が解決しようとする課題】しかし、ドロップアウ
トカラーによる文字枠の印刷は、特殊インクを使用する
ために、コストが非常に高い上に、ドロップアウトに使
用できる色も少なく、さらに、ドロップアウトカラー
は、人間が見にくく、帳票記入もしにくいという欠点を
有するものであった。
【0006】本発明は、以上の欠点を解消すべくなされ
たものであって、非ドロップアウトカラーにより印刷さ
れた文字枠内に書かれた文字も正確に認識することので
きる文字認識装置を提供することを目的とする。
【0007】
【課題を解決するための手段】図1に本発明の原理図を
示す。図中2は帳票設計によって予め定められた部分の
画像を多色で読み込む画像入力手段であり、画像入力手
段1により読み取られた入力帳票画像6は、色領域抽出
手段7において特定の色領域のみが抽出される。
【0008】色領域抽出手段7において抽出する色情報
を格納するために、色領域抽出手段7には、色指定手段
5が接続される。また、色領域抽出手段7により抽出さ
れた特定色の色領域は、文字領域抽出手段8において文
字3として切り出される。
【0009】
【作用】画像入力手段2において読み込まれた入力帳票
画像6は、予め帳票1に印刷された文字枠4や、認識対
象となる、後から書き込まれた文字3、あるいは印刷さ
れた文字3を含み、さらに、例えばRGBおのおのN階
調で表現される色情報が含まれる。
【0010】色指定手段5は、上述した入力帳票画像6
から文字3、あるいは文字3以外の部分を色情報に基づ
いて特定するために必要な色を指定する。指定される色
データは、例えば図2に示すように、R(赤)がTr1
〜Tr2、G(緑)がTg1〜Tg2、B(青)がTb
1〜Tb2、のような形で表現される。
【0011】色の指定は、上記のようなRGBの範囲で
するか、または、予めデータベースに登録されている色
見本を指定することによって行われ、色データベースに
おいて、予め色見本とそのRGBの数値的データの対応
が格納される。
【0012】例えば色指定手段5において、ある特定の
色見本を指定した場合、色データベースは、該色見本に
対応する値、すなわち、RがTr1〜Tr2、GがTg
1〜Tg2、BがTb1〜Tb2という数値を返す。
【0013】色領域抽出手段7は、色指定手段5におい
て指定された色データと同じ色を持つ領域を取り出す。
具体的には、色指定手段5から得られた数値的な色デー
タと入力帳票画像6の各画素の色素値を比較し、RがT
r1〜Tr2の範囲内で、GがTg1〜Tg2の範囲内
で、かつ、BがTb1〜Tb2の範囲内であれば、その
画素が対象画素として取り出される。
【0014】文字領域抽出手段8は、帳票設計で予め指
定された指定色が文字3か文字枠4部分かの情報に基づ
き、切り出された色領域を使用して文字3の切り出しを
行う。
【0015】色指定手段5において文字3の色が指定さ
れた場合、色領域抽出手段7で切り出された領域を文字
領域抽出手段8において文字領域として抽出し、認識処
理部に送る。
【0016】図3(a)に切り出し例を示す。本例は、
文字部分3が黒、文字枠部分4が赤、指定色が黒の場合
を示している。一方、色指定手段5における指定色が文
字枠4の場合、画像中で一定以上の濃度を持ち、色領域
抽出手段7で切り出された領域以外の領域を文字領域抽
出手段8において文字領域として抽出し、認識処理部へ
送る。
【0017】図3(b)に切り出し例を示す。本例は、
文字部分3が黒、文字枠部分4が赤、指定色が赤の場合
を示す。
【0018】
【実施例】以下、本発明の望ましい実施例を添付図面に
基づいて詳細に説明する。図4は本発明の実施例を示す
ブロック図である。画像入力部(画像入力手段2)は、
文字記入位置等のデータが格納された帳票データ10を
参照し、帳票設計において予め定められた部分の画像を
多色で入力する。多色で入力された画像は例えばRGB
おのおの0〜15の16階調で表現される。ここで数値
が大きいほど明るさが大きいものとする。
【0019】帳票データ10は、帳票設計において設定
されるもので、入力すべき文字3が記入される場所を
(X1,Y1)−(X2,Y2)という矩形で記入し
て、指定色とその種類(文字3、文字枠4)を指定し該
帳票データ10の色情報に基づいて色指定部(色指定手
段5)における指定色がセットされる。
【0020】色指定部5は、後述する色領域抽出部(色
領域抽出手段7)での切り出しに使用する色を指定す
る。色の指定は、予めデータベースに登録されている色
見本を指定するか、色を数値的に表現した色データとし
て指定する。例えば、指定色として赤色を使用する場合
は、色見本の赤を指定するか、Rが14〜15、Gが0
〜1、Bが0〜1というように数値の範囲で指定する。
【0021】帳票データ10に色見本が指定された場
合、色データベース11を参照し、色見本に対応する色
データを得る。色データベース11は、複数の色見本を
格納する色見本格納部11aと、各色見本に対応する色
データを格納する色データ格納部11bからなり、色指
定部5から色見本の参照があった場合、その色見本に対
応する色データを色指定部5に返す。
【0022】色領域抽出部7は、色指定部5から得られ
た色データのある領域を取り出すもので、色指定部5か
ら得られた数値的な色データと画像の各画素の色素値を
比較し、その画素の色が指定色であればその画素を取り
出す。
【0023】図5に色領域抽出部7における動作フロー
を示す。なお、以下の説明において、Ar(i,j)は
入力画像の赤色成分を、Ag(i,j)は入力画像の緑
色成分を、Ab(i,j)は入力画像の青色成分を、C
(i,j)は色領域画像を、B(i,j)は原画像の2
値化画像を、M(i,j)は文字3画像を各々示すもの
とする。
【0024】色抽出は、全ての画素について色データと
の比較を行うことによりなされるもので、RがTr1〜
Tr2、GがTg1〜Tg2、BがTb1〜Tb2とい
う数値で与えられる色データが指定された場合には、全
ての画素について、その閾値の範囲内に含まれるか否か
が演算され、閾値内であれば、対象画素は抽出対象とし
てC(i,j)=1が代入され、閾値外であれば、画素
は抽出対象外としてC(i,j)=0が代入される。
【0025】一方、文字領域抽出部(文字領域抽出手段
8)は、切り出し切替部8aと、原画像2値化部8b
と、比較部8cとを備え、帳票設計で予め指定された指
定色が文字3部分か文字枠4部分かの情報に基づき、切
り出された色領域を使用して文字3の切り出しを行う。
【0026】すなわち、切り出し切替部8aでは、指定
色が文字領域か文字枠領域かによって、処理を切り替え
る。指定色が文字3領域であれば、図6の動作フローに
示すように、色領域抽出部7で抽出された全ての画素に
対してM(i,j)=C(i,j)を代入して、抽出画
素が文字画像を構成する画素であるとし、そのまま文字
3画像として認識処理部12へ渡す。
【0027】一方、指定色が文字3の色でない場合に
は、色領域を原画像2値化部8bへ渡し、制御を原画像
2値化部8bへ移す。原画像2値化部8bでは、地の色
(紙の色)である白色以外の色のある領域を色に関係な
く取り出すように動作する。すなわち、例えばRGBの
各階調を16階調とすると、白色は各値が最大値の15
を示すので、RGBのすべての色成分が閾値(例えば1
4)以上の画素を白として、それ以外の領域を2値画像
として白を0(B(i,j)=0)、白以外を1(B
(i,j)=1)として取り出す。ここで、地の色は白
に固定されたわけではなく帳票データ10で色データと
して指定してもよい。
【0028】また、比較部8cでは色領域抽出部7で得
られた色領域画像と原画像の2値化画像を比較し、白以
外の領域で指定色以外の画像(原画像の2値化画像が
1、すなわちB(i,j)=1でかつ色領域画像が0
(C(i,j)=0))を1、他を0としても文字3画
像を作成し認識処理部12へ渡す。
【0029】以上のようにして得られた文字画像は、認
識処理部12において、認識辞書13とのパターンマッ
チングを行い、文字3の認識を行う。なお、上記実施例
においては、指定色を帳票データ10に予め記入してお
くようにしたが、図7に示すように、帳票1上の予め定
められた位置にマーカー領域9を設け、該マーカー領域
9を枠と同じ色で印刷しておいて、色指定部5でマーカ
ー領域9の色を読み取って文字枠4の指定色とするよう
にして、指定色を認識する帳票1自身から取り込んで数
値化してもよい。
【0030】また、上記マーカー領域9を使用する筆記
具で埋めさせて、色指定部5ではその色を読み取って筆
記具の色を文字3の指定色とするようにして、指定色を
認識する帳票1自身から取り込んで数値化してもよい。
【0031】
【発明の効果】以上の説明から明らかなように、本発明
による文字認識装置によれば、コストの高いドロップア
ウトカラーを使用することなく、人間の見やすいカラー
印刷を利用した帳票を使って、より効率的な文字の認識
が可能になる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】色データの指定状態を示す説明図である。
【図3】文字領域の切り出しを示す説明図である。
【図4】本発明の実施例を示すブロック図である。
【図5】色領域抽出部の動作を示すフローチャートであ
る。
【図6】文字領域抽出部の動作を示すフローチャートで
ある。
【図7】本発明の他の実施例に使用する帳票を示す図で
ある。
【符号の説明】
1 帳票 2 画像入力手段 3 文字 4 文字枠 5 色指定手段 6 入力帳票画像 7 色領域抽出手段 8 文字領域抽出手段 9 マーカー領域
フロントページの続き (72)発明者 秋元 晴雄 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】帳票(1)を多色で入力する画像入力手段
    (2)と、 帳票(1)に記入される文字(3)、または帳票(1)に印刷
    された文字枠(4)部分の色を指定する色指定手段(5)
    と、 画像入力手段(2)により得られた入力帳票画像(6)か
    ら、色指定手段(5)により指定された色の領域を抽出す
    る色領域抽出手段(7)と、 色領域抽出手段(7)により抽出された色領域から文字パ
    ターン部分を切り出す文字領域抽出手段(8)とを有する
    文字認識装置。
  2. 【請求項2】前記色指定手段(5)において文字(3)の色
    を指定し、 色領域抽出手段(7)により抽出された色領域を文字領域
    として切り出す請求項1記載の文字認識装置。
  3. 【請求項3】前記色指定手段(5)において帳票(1)の文
    字枠(4)と地の色を指定し、 色領域抽出手段(7)により抽出された色領域以外の領域
    を文字領域として切り出す請求項1記載の文字認識装
    置。
  4. 【請求項4】前記帳票(1)には、色指定手段(5)への指
    定色を指定するマーカー領域(9)が設けられ、 画像入力手段(2)による画像入力時にマーカー領域
    (9)を読み取って色指定手段(5)における指定色を設
    定する請求項1、2または3記載の文字認識装置。
JP4347968A 1992-12-28 1992-12-28 文字認識装置 Pending JPH06203204A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4347968A JPH06203204A (ja) 1992-12-28 1992-12-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4347968A JPH06203204A (ja) 1992-12-28 1992-12-28 文字認識装置

Publications (1)

Publication Number Publication Date
JPH06203204A true JPH06203204A (ja) 1994-07-22

Family

ID=18393839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4347968A Pending JPH06203204A (ja) 1992-12-28 1992-12-28 文字認識装置

Country Status (1)

Country Link
JP (1) JPH06203204A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096913A (ja) * 1995-06-15 1997-01-10 Nec Corp 文字認識装置
JP2007233890A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP2009193429A (ja) * 2008-02-15 2009-08-27 Mitsubishi Electric Corp 画像読取装置
US7729534B2 (en) 2004-03-22 2010-06-01 Canon Kabushiki Kaisha Image-processing device and image-processing method for extracting a recognition-target area including a character from a target image
JP2010225013A (ja) * 2009-03-25 2010-10-07 Hitachi Omron Terminal Solutions Corp 記番号認識装置、紙葉類処理装置、自動取引処理装置、及び記番号認識方法
JP2010244331A (ja) * 2009-04-07 2010-10-28 Mitsubishi Electric Corp 画像読取装置
JP2011197794A (ja) * 2010-03-17 2011-10-06 Fujitsu Frontech Ltd マークカード読取装置および方法
US8326028B2 (en) 2007-12-26 2012-12-04 Hitachi Computer Peripherals Co., Ltd. Dropout color processing method and processing apparatus using same

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096913A (ja) * 1995-06-15 1997-01-10 Nec Corp 文字認識装置
US7729534B2 (en) 2004-03-22 2010-06-01 Canon Kabushiki Kaisha Image-processing device and image-processing method for extracting a recognition-target area including a character from a target image
JP2007233890A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP4623377B2 (ja) * 2006-03-03 2011-02-02 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
US8326028B2 (en) 2007-12-26 2012-12-04 Hitachi Computer Peripherals Co., Ltd. Dropout color processing method and processing apparatus using same
JP2009193429A (ja) * 2008-02-15 2009-08-27 Mitsubishi Electric Corp 画像読取装置
JP2010225013A (ja) * 2009-03-25 2010-10-07 Hitachi Omron Terminal Solutions Corp 記番号認識装置、紙葉類処理装置、自動取引処理装置、及び記番号認識方法
JP2010244331A (ja) * 2009-04-07 2010-10-28 Mitsubishi Electric Corp 画像読取装置
JP2011197794A (ja) * 2010-03-17 2011-10-06 Fujitsu Frontech Ltd マークカード読取装置および方法

Similar Documents

Publication Publication Date Title
US4933984A (en) Document analysis system
US5235653A (en) Document analysis system
US20040179733A1 (en) Image reading apparatus
JP3018949B2 (ja) 文字読取装置およびその方法
EP0896294B1 (en) Method for document rendering and character extraction
KR20010015046A (ko) 구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자자동 인식 방법
JPH06203204A (ja) 文字認識装置
US20020054706A1 (en) Image retrieval apparatus and method, and computer-readable memory therefor
IL98293A (en) A method for distinguishing between text and graphics
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
Najoua et al. A robust approach for Arabic printed character segmentation
JP3955467B2 (ja) 画像処理プログラム及び画像処理装置
JPH0916713A (ja) 画像領域分割方法
JPH06111057A (ja) 光学的文字読取装置
JP2000331117A (ja) 文書読取システム
JP2003123076A (ja) 画像処理装置及び画像処理プログラム
JPH08212294A (ja) 光学式文字読取装置
JPH08194772A (ja) 光学的文字読取り装置
JP2002352223A (ja) 読取プログラム、読取方法および記録媒体
JPS6327990A (ja) 文字認識方法
JPH0652156A (ja) 文書処理方法及び装置
Strouthopoulos et al. A page layout analysis system
JPH06251192A (ja) 光学的文字読み取り装置
JPH06176193A (ja) 光学的文字読取装置
JPH08212296A (ja) 光学式文字読取装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20011016