JP3742358B2 - Optical character recognition apparatus and program - Google Patents

Optical character recognition apparatus and program Download PDF

Info

Publication number
JP3742358B2
JP3742358B2 JP2002092775A JP2002092775A JP3742358B2 JP 3742358 B2 JP3742358 B2 JP 3742358B2 JP 2002092775 A JP2002092775 A JP 2002092775A JP 2002092775 A JP2002092775 A JP 2002092775A JP 3742358 B2 JP3742358 B2 JP 3742358B2
Authority
JP
Japan
Prior art keywords
plane
image
reading
color
full
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002092775A
Other languages
Japanese (ja)
Other versions
JP2003288546A (en
Inventor
敏浩 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002092775A priority Critical patent/JP3742358B2/en
Publication of JP2003288546A publication Critical patent/JP2003288546A/en
Application granted granted Critical
Publication of JP3742358B2 publication Critical patent/JP3742358B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、フルカラーイメージの帳票読取定義体を用いて文字認識処理を行う光学的文字認識装置に関する。
【0002】
また、本発明は、フルカラーイメージの帳票読取定義体を作成する帳票定義ツール用プログラムに関する。
【0004】
【従来の技術】
帳票読取定義体を用いて文字認識処理を行うOCR(Optical Character Recognition)システムに於いて、従来では、帳票を単位に、ドロップアウトカラーを決めて認識処理をおこなっていた。即ち、従来、OCR帳票の設計に於いては、赤系、緑系、青系等の単色のドロップアウトカラーを用いて帳票を作成し、その帳票をスキャナで読取ったイメージ画像からドロップアウトカラー以外の色のイメージ画像を対象に文字認識を行っていた。
【0005】
近年、この種、帳票OCRシステムに於いて、スキャナ、文字認識用パーソナルコンピュータ等の高速化、および記憶装置の低廉化等に伴い、ある行は青色、ある行はオレンジ色のように、1行または複数行単位で色を変えて作成された帳票を対象とした文字認識が行われるようになってきた。
【0006】
被読取帳票のフルカラーイメージを用いて文字認識を行うことで、フィールド単位にドロップアウトカラーを設定できるようになり、これによって帳票設計の自由度が著しく向上する。
【0007】
しかしながら、被読取帳票のフルカラーイメージの文字認識は、帳票読取定義体のフィールド定義の際に、フィールド認識時に必要なドロップアウトカラーを指定し、読取時にそのドロップアウトカラーに対応するプレーンをフルカラーイメージから選択することにより行われていた。ここで、例えば、赤ドロップアウト、緑ドロップアウト、青ドロップアウトは、それぞれフルカラーイメージの赤プレーン、緑プレーン、青プレーンに対応する。
【0008】
この種、フルカラーイメージの帳票読取機構に於いて、各読取フィールドに於ける画面の表示機能、出力イメージの記憶機能等を実現する際、その画面、出力イメージ等をフルカラーイメージのまま扱うと、画像データが非常に大きいため処理速度が遅くなたり、メモリ容量の制限等から、実用上の問題が生じることがあった。また、読取時のプレーンを使用して二値化したイメージを画面用イメージなどに使用した場合は、フィールドの枠、文言等がドロップアウトしてしまい、全体のイメージを正しく把握できないという問題が生じていた。
【0009】
そこで、フルカラーイメージの画面の表示イメージ、出力イメージ等をそれぞれ処理速度、記憶容量等に影響を及ぼさない程度に最適化する手段が必要になるが、従来では操作性並びに経済性を満足する簡易で有効な最適化手段が存在しなかった。
【0010】
【発明が解決しようとする課題】
上述したように、従来では、読取ったフルカラーイメージの画面の表示イメージ、出力イメージ等をそれぞれ処理速度、記憶容量等に影響を及ぼさない程度に最適化する有効な手段が存在しないという問題があった。
【0011】
本発明は上記実情に鑑みなされたもので、フルカラーイメージの帳票読取時に於ける画面の表示イメージ、出力イメージ等をそれぞれ簡単な構成で、容易にかつ効率よく最適化でき、これにより経済性並びに操作性に優れたフルカラーイメージ読取時に於ける画面の表示機能並びに出力イメージの記憶機能を実現することのできる光学的文字認識装置およびプログラムを提供することを目的とする。
【0012】
【課題を解決するための手段】
本発明は、フルカラーイメージ読取の帳票読取定義の際に、フィールド認識のドロップアウトカラーに対応するプレーンだけでなく、フィールドイメージを画面に表示する際のプレーン、および出力イメージ生成する際のプレーン等を任意に色指定できる機構を有して、読取実行時に、前記指定に従い選択されたプレーンを用いて最適な画面、出力イメージを取得できるようにしたことを特徴とする。
【0013】
即ち、本発明は、被読取帳票のフルカラーイメージを取得するスキャナと、 前記スキャナで取得した前記被読取帳票のフルカラーイメージに対し、読取フィールド毎に、当該読取フィールドのドロップアウトカラーに対応したプレーンと、表示用イメージ生成用のプレーンと、出力イメージ生成用のプレーンとが設定される帳票読取定義体をグラフィックユーザインタフェースにより作成する帳票定義ツールと、前記帳票定義ツールで作成した前記帳票読取定義体を記憶する定義体記憶装置と、前記定義体記憶装置に記憶された前記帳票読取定義体を用いて、前記読取フィールドを単位に、前記フルカラーイメージから前記ドロップアウトカラーの設定に従う文字読取を実行し、前記フルカラーイメージから前記表示用イメージ生成用のプレーンに従う二値イメージの画面を生成し、前記フルカラーイメージから出力イメージ生成用のプレーンに従う二値の出力イメージを生成する制御装置と、前記制御装置で生成した二値イメージの画面を表示する表示装置と、前記制御装置で生成した二値の出力イメージを記憶する出力イメージ記憶装置とを具備した光学的文字認識装置を特徴とする。
【0014】
また、本発明は、フルカラーイメージの帳票読取定義体を読取フィールドを単位に作成する帳票定義ツールに於いて、前記帳票読取定義体に、文字読取時のドロップアウトカラーに対応するプレーン、画面表示用のプレーン、出力イメージ用のプレーンの少なくともいずれかを任意に設定するグラフィックユーザインタフェースを具備したことを特徴とする。
【0015】
また、本発明は、フルカラーイメージの帳票読取に適用される帳票読取定義体に、読取フィールドを単位に、画面表示用のプレーンを設定可能とし、その設定された画面表示用のプレーンを用いて前記フルカラーイメージから二値イメージの画面を生成し表示することを特徴とする。
【0016】
また、本発明は、フルカラーイメージの帳票読取に適用される帳票読取定義体に、読取フィールドを単位に、出力イメージ用のプレーンを設定可能とし、その設定された出力イメージ用のプレーンを用いて前記フルカラーイメージから二値イメージデータを生成し記憶することを特徴とする。
【0017】
上記した本発明の帳票読取定義体を用いた画面の表示イメージ生成機能、出力イメージ生成機能を具備することにより、フルカラーイメージの帳票読取時に於ける画面の表示イメージ、出力イメージ等をそれぞれ簡単な構成で、容易にかつ効率よく所望の二値イメージに最適化でき、これにより経済性並びに操作性に優れたフルカラーイメージ読取時に於ける画面の表示機能、並びに出力イメージの記憶機能を実現できる。更に、画面表示用のプレーン、出力イメージ用のプレーンを任意に設定するグラフィックユーザインタフェース(GUI)を具備した帳票定義ツールを適用することにより、帳票読取定義体のフォーマット定義要素をGUIにて木構造で表示して、そのフォーマット定義要素を、マウス等のポインティングデバイスのドラッグアンドドロップ等の簡単な操作で各読取フィールド毎に帳票読取定義体に定義できることから、簡単かつ容易に、所望する最適な二値イメージの画面、並びに出力イメージを取得できる。
【0018】
【発明の実施の形態】
以下、図面を参照して本発明の一実施形態を説明する。
【0019】
図1は、本発明に係る帳票OCRシステムの構成を示すブロック図であり、スキャナ10、制御装置11、制御装置11内に設けられた帳票定義ツール121およびOCR制御プログラム122、メモリ13、帳票定義体記憶装置14、出力イメージ記憶装置(HDD)15、表示装置16等を備えて構成される。
【0020】
スキャナ10は、フルカラーのスキャナであって、被読取帳票上をスキャン(読取走査)して読み取った被読取帳票のフルカラーイメージを制御装置11に送出する。
【0021】
制御装置11は、帳票OCRシステム全体の制御を司るもので、帳票定義ツール121、およびOCR制御プログラム122の各処理を実行する制御機能を持つ。
【0022】
帳票定義ツール121は、フルカラーイメージの帳票読取定義体(FC)を作成するためのGUI機能をもつソフトウェアモジュールであり、本発明の実施形態に於いては、図2に示す処理手順に従い、図4に示すプレーン選択テーブル141へのプレーン設定を含む帳票読取定義体(FC)の作成処理機能を実現する。
【0023】
OCR制御プログラム122は、帳票読取定義体(FC)を用いた文字認識処理を含むOCRシステム全体の制御を行う処理機能を有し、本発明の実施形態に於いては、図3に示す処理手順に従い、図4に示すプレーン選択テーブル141を参照して、当該プレーン選択テーブル141に設定された各プレーンを用いた、二値イメージの画面の生成並びに表示機能、二値の出力イメージの生成並びに保存機能を実現する。
【0024】
メモリ13は、制御装置11の各種処理に供されるRAM構成の記憶装置であり、本発明の実施形態に於いては、スキャナ10で読み取った被読取帳票のフルカラーイメージが展開される。
【0025】
帳票定義体記憶装置14は、制御装置11の制御の下に、上記帳票定義ツール121により作成された帳票読取定義体(FC)を記憶する。本発明の実施形態に於いては、図4に示すプレーン選択テーブル141を含んだ帳票読取定義体(FC)を記憶する。
【0026】
出力イメージ記憶装置15は、制御装置11の制御の下に、読取結果の出力イメージを保存する大容量記憶装置であり、例えばハードディスク装置(HDD)により構成される。本発明の実施形態に於いては、上記プレーン選択テーブル141を用いてRAM13に記憶されるフルカラーイメージから生成された二値の出力イメージが読取フィールドを単位に格納される。
【0027】
表示装置16は、制御装置11の制御の下に、帳票定義ツール121のGUI画面、読取結果の画面等を表示するカラーモニタであり、本発明の実施形態に於いては、上記プレーン選択テーブル141を用いてRAM13に記憶されるフルカラーイメージから生成された二値イメージの画面が読取フィールドを単位に表示される。
【0028】
図2は、本発明の一実施形態に於ける、帳票読取定義体(FC)の作成処理手順を示すフローチャートであり、制御装置11が帳票定義ツール121を起動することにより実行される。
【0029】
図3は、本発明の一実施形態に於ける、文字認識処理時の画面および出力イメージの生成並びに出力処理手順を示すフローチャートであり、プレーン選択テーブル141に定義された表示用イメージのプレーンを用いて二値イメージの画面を生成し表示装置16に表示する。また、プレーン選択テーブル141に定義された出力イメージ用のプレーンを用いて二値の出力イメージを生成し出力イメージ記憶装置15に保存する。
【0030】
図4は、本発明の一実施形態に於ける、帳票読取定義体(FC)に設けられたプレーン選択テーブル141の一構成例を示したもので、ここでは、帳票読取定義体(FC)に定義された読取フィールド(フィールド1,2,3,…)それぞれに対応して、ドロップアウトカラーに対応するプレーン、表示用イメージのプレーン、出力イメージ用のプレーンがそれぞれ定義(設定)され、フルカラーイメージ上で選択プレーンして用いられる。
【0031】
図4では、ドロップアウトカラーに対応するプレーン設定領域を「読取」、表示用イメージのプレーン設定領域を「表示」、出力イメージ用のプレーン設定領域を「出力」として示し、その各設定領域に設定されたプレーンについて、赤プレーンを「R」、緑プレーンを「G」、青プレーンを「B」で示している。ここでは、説明を簡素にするため、「R」「G」「B」3色のプレーンのみを用いた例を示しているが、これに限らず、「R」「G」「B」を組み合わせた、より多くの色のプレーンを用いることも可能である。
【0032】
ここで、上記各図を参照して本発明の一実施形態に於ける動作を説明する。
【0033】
まず、フルカラーイメージの帳票読取定義体(FC)を作成し取得する際の処理手順について、図2に示すフローチャートを参照して説明する。このフルカラーイメージの帳票読取定義体作成処理は、制御装置11が帳票定義ツール121を起動することにより実行される。
【0034】
この帳票定義ツール121による帳票読取定義体(FC)の作成処理では、まず、新規に読取を行うフルカラーの被読取帳票をスキャナ10にてスキャニングし、そのスキャナ10より取得したフルカラーイメージを制御装置11によってメモリ13上に展開して、その被読取帳票に於ける帳票読取定義体(FC)の作成を開始する(図2ステップS1,S2)。
【0035】
上記帳票読取定義体(FC)の作成処理に於いては、まず上記メモリ13上に展開されたフルカラーイメージを表示装置16に表示して、帳票定義ツール121のGUI画面上で、読取フィールドを設定する。続いて、GUI画面上の各読取フィールド毎に、文字読取時のドロップアウトカラーに対応するプレーン、表示用イメージのプレーン、出力イメージ用のプレーンを設定することにより、制御装置11の内部メモリに被読取帳票のフルカラーイメージの帳票読取定義体(FC)が作成される(図2ステップS3,S4)。
【0036】
この帳票読取定義体(FC)の作成時に於けるGUIでは、帳票読取定義体(FC)のフォーマット定義要素を木構造で表示し、この木構造で表示されたフォーマット定義要素を、ユーザがマウス等のポインティングデバイスを用いてドラッグアンドドロップ等により任意に移動し複写し必要に応じて値を入力することで、簡単かつ迅速に、帳票全体の各読取フィールドと、その各読取フィールド毎の上記各プレーンとを設定することができる。この制御装置11の内部メモリ上に作成された帳票読取定義体(FC)は、帳票定義体記憶装置14に保存される(図2ステップS5)。この際、図4に示すように、上記GUI上で指定した文字読取時のドロップアウトカラーに対応するプレーン、表示用イメージのプレーン、出力イメージ用のプレーンは、帳票読取定義体(FC)のプレーン選択テーブル141に設定される。
【0037】
次に、帳票定義体記憶装置14に記憶された帳票読取定義体(FC)のプレーン選択テーブル141を用いて、被読取帳票の文字読取後の画面表示、および出力イメージの保存処理について、図3に示すフローチャートを参照して説明する。
【0038】
被読取帳票の読取処理に於いて、制御装置11は、OCR制御プログラム122に従い、まず帳票定義体記憶装置14に記憶された帳票読取定義体(FC)を制御装置11内の内部メモリにロードする(図3ステップS11)。
【0039】
スキャナ10より被読取帳票のフルカラーイメージを取得すると、その都度、帳票読取定義体(FC)のプレーン選択テーブル141を参照し、帳票全体のフルカラーイメージについて、読取フィールドを単位に文字読取処理を実行する(図3ステップS12)。この際、制御装置11は、帳票読取定義体(FC)のプレーン選択テーブル141の設定に従い、被読取帳票の読取フィールドを単位に、フルカラーイメージからドロップアウトカラーに対応するプレーンを選択して文字読取を行う。例えば、図4の例では、読取時のフィールド1は赤プレーン「R」がドロップアウトカラーとして設定され、フィールド2は青プレーン「B」が、フィールド3は緑プレーン「G」が、フィールド4は赤プレーン「R」がドロップアウトカラーに設定されているので、その設定された色を対象にドロップアウトして文字読取を行う。その読取出力に基づき制御装置11では文字認識が実行される。
【0040】
次に、この文字認識処理した読取フィールドについて、図4に示す帳票読取定義体(FC)のプレーン選択テーブル141を参照し、当該プレーン選択テーブル141に設定された表示用イメージ生成用のプレーンを用いて、上記フルカラーイメージから二値イメージの画面を生成し、表示装置16に表示する(図3ステップS13)。例えば、図4の例では、表示時のフィールド1は青プレーン「B」が表示カラーとして設定され、フィールド2は赤プレーン「R」が、フィールド3は赤プレーン「R」が、フィールド4は青プレーン「B」が表示カラーに設定されているので、その色のプレーンを選択してフルカラーイメージが二値の表示イメージとなって表示装置16に表示される。この結果、この二値イメージの表示と認識結果とを同時に表示させることにより、表示項目と文字認識結果とが対応させて見ることが出来るため、認識が正しく実行された否かが判別でき、また認識文字の修正などにも利用することができる。
【0041】
更に、同じくプレーン選択テーブル141に設定された、出力イメージ生成用のプレーンを用いて、上記フルカラーイメージから二値の出力イメージを生成し、出力イメージ記憶装置15に保存する(図3ステップS14)。例えば、図4の例では、出力時のフィールド1は青プレーン「B」が出力カラーとして設定され、フィールド2は緑プレーン「G」が、フィールド3は赤プレーン「R」が、フィールド4は緑プレーン「G」が出力カラーに設定されているので、その色のプレーンを選択してフルカラーイメージを二値化して出力イメージ記憶装置15に保存することが出来る。
【0042】
このようにして、帳票読取定義体(FC)のプレーン選択テーブル141に任意色のプレーンを設定して、その設定したプレーンを用い、フルカラーイメージから二値の画面、および出力イメージを生成できることから、、簡単かつ容易に、所望する最適な二値イメージの画面表示、並びに出力イメージを取得することができる。
【0043】
尚、上記した実施形態では、帳票読取定義体(FC)のプレーン選択テーブル141に、ドロップアウトカラーに対応するプレーン、表示用イメージのプレーン、出力イメージ用のプレーンを設定したが、これに加えて、画像処理の種類(例えば鮮鋭2値化イメージ)等を指定して、読取時にその画像処理を実行できるようにすることにより、さらに最適な画面イメージ、出力イメージを得ることができる。
【0044】
【発明の効果】
以上詳記したように本発明によれば、フルカラーイメージの帳票読取時に於ける画面の表示イメージ、出力イメージ等をそれぞれ簡単な構成で、容易にかつ効率よく最適化でき、これにより、経済性、並びに操作性に優れた、フルカラーイメージ読取時に於ける画面の表示機能、並びに出力イメージの記憶機能を備えたフルカラーイメージ対応の帳票OCRが実現できる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る帳票OCRシステムの構成を示すブロック図。
【図2】上記実施形態に於ける帳票読取定義体の作成処理手順を示すフローチャート。
【図3】上記実施形態に於ける文字認識処理時の画面および出力イメージの生成並びに出力処理手順を示すフローチャート。
【図4】本発明の一実施形態に於ける帳票読取定義体に設けられたプレーン選択テーブルの一構成例を示す図。
【符号の説明】
10…スキャナ
11…制御装置
12…帳票定義ツール
13…メモリ
14…帳票定義体記憶装置
15…出力イメージ記憶部装置(HDD)
16…表示装置
141…プレーン選択テーブル
FC…帳票定義体
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an optical character recognition apparatus that performs character recognition processing using a full-color image form reading definition body.
[0002]
The present invention also relates to a program for a form definition tool for creating a full color image form reading definition body.
[0004]
[Prior art]
In an OCR (Optical Character Recognition) system that performs character recognition processing using a form reading definition body, conventionally, recognition processing is performed by determining a dropout color for each form. In other words, conventionally, in the design of an OCR form, a form is created using a single color dropout color such as red, green or blue, and the form other than the dropout color is read from the image read by the scanner. The character recognition was performed on the image image of the color.
[0005]
In recent years, in this type of form OCR system, as a scanner, a character recognition personal computer, etc. have been speeded up and storage devices have become cheaper, one line is blue and one line is orange. Alternatively, character recognition has been performed for forms created by changing colors in units of multiple lines.
[0006]
By performing character recognition using a full-color image of the form to be read, it becomes possible to set a dropout color for each field, thereby significantly improving the degree of freedom in designing the form.
[0007]
However, the character recognition of the full-color image of the form to be read specifies the dropout color required at the time of field recognition when defining the field of the form reading definition body, and the plane corresponding to the dropout color is read from the full-color image at the time of reading. Was done by choosing. Here, for example, red dropout, green dropout, and blue dropout correspond to the red plane, green plane, and blue plane of the full-color image, respectively.
[0008]
In this type of full-color image form reading mechanism, when realizing the display function of the screen in each reading field, the storage function of the output image, etc. Since the data is very large, the processing speed may be slow, and there may be practical problems due to memory capacity limitations. In addition, when a binarized image using a plane at the time of reading is used for a screen image, etc., the field frame, wording, etc. will drop out, causing a problem that the entire image cannot be grasped correctly. It was.
[0009]
Therefore, there is a need for means to optimize the display image and output image of the full-color image to the extent that they do not affect the processing speed, storage capacity, etc., but in the past it was simple and satisfied with operability and economy. There was no effective optimization means.
[0010]
[Problems to be solved by the invention]
As described above, there has been a problem in the prior art that there is no effective means for optimizing the display image and output image of the read full-color image to the extent that they do not affect the processing speed, storage capacity, etc., respectively. .
[0011]
The present invention has been made in view of the above circumstances, and it is possible to easily and efficiently optimize the display image, output image, etc. of the screen when reading a full-color image with a simple configuration. It is an object of the present invention to provide an optical character recognition apparatus and program capable of realizing a display function of a screen and a storage function of an output image when reading a full color image excellent in performance.
[0012]
[Means for Solving the Problems]
The present invention provides not only a plane corresponding to a field recognition dropout color but also a plane for displaying a field image on a screen, a plane for generating an output image, and the like when defining a form reading for full color image reading. It is characterized in that it has a mechanism that can arbitrarily specify a color, and an optimal screen and output image can be acquired using a plane selected according to the specification at the time of reading.
[0013]
That is, the present invention provides a scanner that acquires a full color image of a read form, and a plane corresponding to a dropout color of the read field for each read field with respect to the full color image of the read form acquired by the scanner. A form definition tool for creating a form reading definition body in which a display image generation plane and an output image generation plane are set by a graphic user interface; and the form reading definition body created by the form definition tool. Using the definition storage device to be stored and the form reading definition stored in the definition storage device, the character reading according to the setting of the dropout color from the full color image is performed in units of the reading field, A pre-production for generating the display image from the full-color image. A control device that generates a binary image screen according to a screen and generates a binary output image according to an output image generation plane from the full-color image, and a display that displays the binary image screen generated by the control device. An optical character recognition device comprising: a device; and an output image storage device for storing a binary output image generated by the control device.
[0014]
Further, the present invention provides a form definition tool for creating a full-color image form reading definition body in units of reading fields, wherein the form reading definition body includes a plane corresponding to a dropout color at the time of character reading and a screen display. A graphic user interface for arbitrarily setting at least one of the plane and the output image plane.
[0015]
Further, the present invention makes it possible to set a screen display plane in units of reading fields in a form reading definition body applied to reading a full-color image form, and using the set screen display plane, It is characterized by generating and displaying a binary image screen from a full-color image.
[0016]
Further, the present invention makes it possible to set an output image plane in units of reading fields in a form reading definition body applied to reading a full-color image form, and using the set output image plane, Binary image data is generated from a full color image and stored.
[0017]
By providing a screen display image generation function and an output image generation function using the above-described form reading definition body of the present invention, the screen display image and the output image at the time of reading a full-color image form can be simply configured. Therefore, it is possible to easily and efficiently optimize a desired binary image, thereby realizing a screen display function and an output image storage function when reading a full color image having excellent economy and operability. Further, by applying a form definition tool having a graphic user interface (GUI) for arbitrarily setting a plane for screen display and an output image plane, the format definition element of the form reading definition body is a tree structure in the GUI. The format definition elements can be defined in the form reading definition body for each reading field by a simple operation such as dragging and dropping with a pointing device such as a mouse. The screen of the value image and the output image can be acquired.
[0018]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
[0019]
FIG. 1 is a block diagram showing the configuration of a form OCR system according to the present invention, which includes a scanner 10, a control apparatus 11, a form definition tool 121 and an OCR control program 122 provided in the control apparatus 11, a memory 13, and a form definition. It comprises a body storage device 14, an output image storage device (HDD) 15, a display device 16, and the like.
[0020]
The scanner 10 is a full-color scanner, and sends a full-color image of a read form that has been read by scanning (reading scanning) the read form to the control device 11.
[0021]
The control device 11 controls the entire form OCR system and has a control function for executing the processes of the form definition tool 121 and the OCR control program 122.
[0022]
The form definition tool 121 is a software module having a GUI function for creating a full-color image form reading definition body (FC). In the embodiment of the present invention, according to the processing procedure shown in FIG. The creation processing function of the form reading definition body (FC) including the plane setting in the plane selection table 141 shown in FIG.
[0023]
The OCR control program 122 has a processing function for controlling the entire OCR system including character recognition processing using a form reading definition body (FC). In the embodiment of the present invention, the processing procedure shown in FIG. Referring to the plane selection table 141 shown in FIG. 4, the screen generation and display function of the binary image and the generation and storage of the binary output image using each plane set in the plane selection table 141 are performed. Realize the function.
[0024]
The memory 13 is a storage device having a RAM configuration used for various processes of the control device 11. In the embodiment of the present invention, a full-color image of a form to be read read by the scanner 10 is developed.
[0025]
The form definition storage device 14 stores the form reading definition (FC) created by the form definition tool 121 under the control of the control device 11. In the embodiment of the present invention, a form reading definition body (FC) including the plane selection table 141 shown in FIG. 4 is stored.
[0026]
The output image storage device 15 is a large-capacity storage device that stores an output image of a read result under the control of the control device 11, and is configured by, for example, a hard disk device (HDD). In the embodiment of the present invention, a binary output image generated from a full color image stored in the RAM 13 using the plane selection table 141 is stored in units of reading fields.
[0027]
The display device 16 is a color monitor that displays the GUI screen of the form definition tool 121, the screen of the reading result, and the like under the control of the control device 11. In the embodiment of the present invention, the plane selection table 141 is displayed. A binary image screen generated from a full color image stored in the RAM 13 is displayed in units of reading fields.
[0028]
FIG. 2 is a flowchart showing a procedure for creating a form reading definition body (FC) according to an embodiment of the present invention, which is executed when the control device 11 activates the form definition tool 121.
[0029]
FIG. 3 is a flowchart showing a screen and output image generation and output processing procedure during character recognition processing according to an embodiment of the present invention, and uses display image planes defined in the plane selection table 141. The binary image screen is generated and displayed on the display device 16. Also, a binary output image is generated using the output image plane defined in the plane selection table 141 and stored in the output image storage device 15.
[0030]
FIG. 4 shows an example of the configuration of the plane selection table 141 provided in the form reading definition body (FC) according to the embodiment of the present invention. Here, the form reading definition body (FC) is shown in FIG. A plane corresponding to the dropout color, a display image plane, and an output image plane are defined (set) for each of the defined reading fields (fields 1, 2, 3,...), And a full color image. Used as a selection plane above.
[0031]
In FIG. 4, the plane setting area corresponding to the dropout color is indicated as “read”, the plane setting area for the display image is indicated as “display”, and the plane setting area for the output image is indicated as “output”. The red plane is indicated by “R”, the green plane is indicated by “G”, and the blue plane is indicated by “B”. Here, in order to simplify the description, an example using only three planes of “R”, “G”, and “B” is shown, but not limited to this, “R”, “G”, and “B” are combined. It is also possible to use more color planes.
[0032]
Here, the operation in one embodiment of the present invention will be described with reference to the respective drawings.
[0033]
First, a processing procedure when creating and acquiring a full color image form reading definition body (FC) will be described with reference to the flowchart shown in FIG. The full color image form reading definition body creation process is executed when the control device 11 activates the form definition tool 121.
[0034]
In the process of creating a form reading definition body (FC) by the form definition tool 121, first, a full-color read form to be newly read is scanned by the scanner 10, and the full-color image acquired from the scanner 10 is scanned by the control device 11. Is developed on the memory 13 and the creation of a form reading definition body (FC) in the form to be read is started (steps S1 and S2 in FIG. 2).
[0035]
In the creation process of the form reading definition body (FC), first, the full color image developed on the memory 13 is displayed on the display device 16 and the reading field is set on the GUI screen of the form definition tool 121. To do. Subsequently, for each reading field on the GUI screen, the plane corresponding to the dropout color at the time of character reading, the plane for the display image, and the plane for the output image are set, so that the internal memory of the control device 11 is covered. A full-color image form reading definition body (FC) of the reading form is created (steps S3 and S4 in FIG. 2).
[0036]
In the GUI when creating this form reading definition body (FC), the format definition elements of the form reading definition body (FC) are displayed in a tree structure, and the user can display the format definition elements displayed in this tree structure by a mouse or the like. By simply dragging and dropping using a pointing device, copy and input values as needed, each reading field of the entire form and each plane for each reading field can be easily and quickly And can be set. The form reading definition body (FC) created on the internal memory of the control device 11 is stored in the form definition body storage device 14 (step S5 in FIG. 2). At this time, as shown in FIG. 4, the plane corresponding to the dropout color at the time of character reading specified on the GUI, the plane for the display image, and the plane for the output image are planes of the form reading definition body (FC). It is set in the selection table 141.
[0037]
Next, screen display after reading characters of a form to be read and output image saving processing using the plane selection table 141 of the form reading definition body (FC) stored in the form definition body storage device 14 will be described with reference to FIG. This will be described with reference to the flowchart shown in FIG.
[0038]
In the reading process of the form to be read, the control device 11 first loads the form reading definition body (FC) stored in the form definition body storage device 14 into the internal memory in the control device 11 in accordance with the OCR control program 122. (FIG. 3, step S11).
[0039]
Each time a full-color image of a form to be read is acquired from the scanner 10, a character reading process is executed for each full-color image of the entire form with reference to the plane selection table 141 of the form reading definition body (FC). (FIG. 3, step S12). At this time, the control device 11 reads a character by selecting a plane corresponding to the dropout color from the full color image in units of the reading field of the read form according to the setting of the plane selection table 141 of the form reading definition body (FC). I do. For example, in the example of FIG. 4, in the field 1 at the time of reading, the red plane “R” is set as the dropout color, the field 2 is the blue plane “B”, the field 3 is the green plane “G”, and the field 4 is Since the red plane “R” is set as the dropout color, the character is read by dropping out the set color. Based on the read output, the control device 11 performs character recognition.
[0040]
Next, for the read field subjected to the character recognition processing, the plane selection table 141 of the form reading definition body (FC) shown in FIG. 4 is referred to, and the display image generation plane set in the plane selection table 141 is used. Then, a binary image screen is generated from the full-color image and displayed on the display device 16 (step S13 in FIG. 3). For example, in the example of FIG. 4, the display plane 1 is set with the blue plane “B” as the display color, the field 2 is the red plane “R”, the field 3 is the red plane “R”, and the field 4 is blue. Since the plane “B” is set as the display color, the plane of that color is selected and the full color image is displayed on the display device 16 as a binary display image. As a result, since the display of the binary image and the recognition result are displayed simultaneously, the display item and the character recognition result can be viewed in correspondence with each other. It can also be used to correct recognized characters.
[0041]
Further, using the output image generation plane set in the plane selection table 141, a binary output image is generated from the full color image and stored in the output image storage device 15 (step S14 in FIG. 3). For example, in the example of FIG. 4, in the output field 1, the blue plane “B” is set as the output color, the field 2 is the green plane “G”, the field 3 is the red plane “R”, and the field 4 is green. Since the plane “G” is set as the output color, the full color image can be binarized by selecting the plane of that color and stored in the output image storage device 15.
[0042]
In this way, a plane of arbitrary color is set in the plane selection table 141 of the form reading definition body (FC), and a binary screen and an output image can be generated from the full color image using the set plane. Therefore, it is possible to obtain a desired optimal binary image screen display and an output image easily and easily.
[0043]
In the above-described embodiment, the plane corresponding to the dropout color, the display image plane, and the output image plane are set in the plane selection table 141 of the form reading definition body (FC). By specifying the type of image processing (for example, a sharp binarized image) and the like so that the image processing can be executed at the time of reading, a further optimal screen image and output image can be obtained.
[0044]
【The invention's effect】
As described above in detail, according to the present invention, it is possible to easily and efficiently optimize the display image, output image, and the like of the screen when reading a full-color image, each with a simple configuration. In addition, it is possible to realize a full-color image-compatible form OCR having an excellent operability and a screen display function when reading a full-color image and a storage function of an output image.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a form OCR system according to an embodiment of the present invention.
FIG. 2 is a flowchart showing a procedure for creating a form reading definition body in the embodiment.
FIG. 3 is a flowchart showing a screen and output image generation and output processing procedure during character recognition processing in the embodiment.
FIG. 4 is a diagram showing a configuration example of a plane selection table provided in a form reading definition body in an embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 10 ... Scanner 11 ... Control apparatus 12 ... Form definition tool 13 ... Memory 14 ... Form definition body memory | storage device 15 ... Output image memory | storage part apparatus (HDD)
16 ... Display device 141 ... Plane selection table FC ... Form definition body

Claims (2)

被読取帳票のフルカラーイメージを取得するスキャナと、
前記スキャナで取得した前記被読取帳票のフルカラーイメージに対し、読取フィールド毎に、当該読取フィールドのドロップアウトカラーに対応したプレーンと、表示用イメージ生成用のプレーンと、出力イメージ生成用のプレーンとをそれぞれ定義したプレーン選択テーブルを設けた帳票読取定義体を記憶する定義体記憶装置と、
前記定義体記憶装置に記憶された前記プレーン選択テーブルを用いて、前記読取フィールドを単位に、前記フルカラーイメージから前記ドロップアウトカラーの設定に従う文字読取を実行し、前記フルカラーイメージから前記表示用イメージ生成用のプレーンに従う二値イメージの画面を生成し、前記フルカラーイメージから出力イメージ生成用のプレーンに従う二値の出力イメージを生成する制御装置と、
前記制御装置で生成した二値イメージの画面を表示する表示装置と、
前記制御装置で生成した二値の出力イメージを記憶する出力イメージ記憶装置と
を具備したことを特徴とする光学的文字認識装置。
A scanner that acquires a full-color image of the form to be read;
For the full color image of the read form acquired by the scanner, for each reading field, a plane corresponding to the dropout color of the reading field, a display image generation plane, and an output image generation plane A definition storage device for storing a form reading definition body provided with a plane selection table defined respectively;
Using the plane selection table stored in the definition storage device, character reading is performed from the full color image according to the setting of the dropout color in units of the reading field, and the display image is generated from the full color image. A control device for generating a binary image screen according to a plane for generating a binary output image according to a plane for generating an output image from the full color image;
A display device for displaying a screen of a binary image generated by the control device;
An optical character recognition device comprising: an output image storage device for storing a binary output image generated by the control device.
帳票のカラーイメージを帳票読取定義体を用いて文字認識する光学的文字読取装置において、
前記光学的文字読取装置が、前記帳票読取定義体に、被読取帳票上の各読取フィールドと、その読取フィールドに対応して、文字読取時のドロップアウトカラーに対応するプレーンと、表示イメージ生成用のプレーンと、出力イメージ生成用のプレーンとをそれぞれ定義したプレーン選択テーブルを設定する機能と、
前記光学的文字読取装置が、前記帳票読取定義体に設定された前記プレーン選択テーブルを用いて、前記読取フィールドを単位に、前記帳票のカラーイメージから前記ドロップアウトカラーの設定に従う文字認識を実行し、前記帳票のカラーイメージから前記表示イメージ生成用のプレーンに従う二値イメージを生成し、前記帳票のカラーイメージから出力イメージ生成用のプレーンに従う二値のイメージを生成する機能と、
を実現させるためのプログラム。
In an optical character reader that recognizes a color image of a form using a form reading definition body,
The optical character reader includes, in the form reading definition body, each reading field on the read form, a plane corresponding to a dropout color at the time of reading a character corresponding to the reading field, and a display image generation A function to set a plane selection table that defines each plane and output image generation plane,
The optical character reader performs character recognition according to the setting of the dropout color from the color image of the form for each reading field, using the plane selection table set in the form reading definition body. Generating a binary image according to the display image generation plane from the color image of the form, and generating a binary image according to the output image generation plane from the color image of the form;
A program to realize
JP2002092775A 2002-03-28 2002-03-28 Optical character recognition apparatus and program Expired - Lifetime JP3742358B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002092775A JP3742358B2 (en) 2002-03-28 2002-03-28 Optical character recognition apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002092775A JP3742358B2 (en) 2002-03-28 2002-03-28 Optical character recognition apparatus and program

Publications (2)

Publication Number Publication Date
JP2003288546A JP2003288546A (en) 2003-10-10
JP3742358B2 true JP3742358B2 (en) 2006-02-01

Family

ID=29237507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002092775A Expired - Lifetime JP3742358B2 (en) 2002-03-28 2002-03-28 Optical character recognition apparatus and program

Country Status (1)

Country Link
JP (1) JP3742358B2 (en)

Also Published As

Publication number Publication date
JP2003288546A (en) 2003-10-10

Similar Documents

Publication Publication Date Title
US7716600B2 (en) Interface
JP3895492B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium storing program for causing computer to execute the method
JP3836527B2 (en) Apparatus and method for image editing of structural images
JP2009545814A (en) Image layout constraint generation
US20110264711A1 (en) Computer based method and system for generating custom dynamic templates
WO2018203374A1 (en) Line drawing automatic coloring program, line drawing automatic coloring device, and program for graphical user interface
JPH0877330A (en) Method for processing image and device therefor
US20060055944A1 (en) Image processing apparatus, image processing method and program
US20110078566A1 (en) Systems, methods, tools, and user interface for previewing simulated print output
JP2000215322A (en) Image processor, and recording medium with image processing program recorded therein
US20090037516A1 (en) Information processing apparatus and method
JP2001084245A (en) Device and method for processing document
JP2000148794A (en) Device and method for image retrieval and computer- readable memory
JP3742358B2 (en) Optical character recognition apparatus and program
US20060055984A1 (en) Image processing apparatus, image processing method and program
JP3974105B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium storing program for causing computer to execute the method
CN101114279A (en) Document production support device, methods thereof and storage medium
JP3890096B2 (en) Image editing system
DE102005035188A1 (en) Interface device for coupling image processing modules
JP2011128710A (en) Display device, display system, display control method and display control program
JP5020862B2 (en) Line drawing processing apparatus and program
JP3705201B2 (en) Image forming program and image forming apparatus
KR100416420B1 (en) Method and system of modifing an web page
JPH10162093A (en) Commodity information allocation device
CN115291992B (en) Auxiliary labeling method for graphic user interface picture, electronic equipment and storage medium

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051110

R151 Written notification of patent or utility model registration

Ref document number: 3742358

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081118

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091118

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101118

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101118

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111118

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111118

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121118

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131118

Year of fee payment: 8

EXPY Cancellation because of completion of term