JPH06251191A - Image processing device - Google Patents

Image processing device

Info

Publication number
JPH06251191A
JPH06251191A JP5036520A JP3652093A JPH06251191A JP H06251191 A JPH06251191 A JP H06251191A JP 5036520 A JP5036520 A JP 5036520A JP 3652093 A JP3652093 A JP 3652093A JP H06251191 A JPH06251191 A JP H06251191A
Authority
JP
Japan
Prior art keywords
image
information
color
shape
uniformity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5036520A
Other languages
Japanese (ja)
Inventor
Kazuji Kiyono
和司 清野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5036520A priority Critical patent/JPH06251191A/en
Publication of JPH06251191A publication Critical patent/JPH06251191A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To leave the image of a character that is an object of reading. etc., and to surely eliminate an unrequited image without increasing burden on work. CONSTITUTION:This device is constituted of a knowledge information storage part 18 to store color information to classify a color at every color, uniformity information to specify regularity. and shape information to specify shape for a color image, a color information extraction part 14a which extracts the image at every color based on the information stored in the knowledge information storage part 18, a uniformity extraction part 14b which extracts the image with regularity, a shape information extraction part 14c which extracts the image with prescribed shape, an image classification processing part 14d which classifies a required image part and another image part on the basis of the image extracted by each of the extraction parts 14a-14c, respectively, and an unrequired image elimination part 14e which eliminates a classified another image from the color image set as a processing object.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、光学的にイメージを検
出し、このイメージに対して処理を行なう光学的文字読
取装置(OCR)やテキストリーダに好適な画像処理装
置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing apparatus suitable for an optical character reader (OCR) or a text reader which optically detects an image and processes the image.

【0002】[0002]

【従来の技術】一般に、光学的文字読取装置(OCR)
やテキストリーダは、帳票等の用紙を光学的に走査する
ことによってイメージを検出し、このイメージをもとに
文字の認識を行なっている。
2. Description of the Related Art Generally, an optical character reader (OCR)
A text reader detects an image by optically scanning a sheet such as a form, and recognizes a character based on the image.

【0003】テキストリーダは、処理対象とする文書等
のフォーマットが特定されておらず、文字イメージを自
動的に検出し、この文字イメージを認識(イメージから
文字コードへ変換する)するようになっている。
The text reader has not specified the format of a document or the like to be processed, and is adapted to automatically detect a character image and recognize the character image (convert the image into a character code). There is.

【0004】従って、市販されているような既存の帳票
(シート)には、罫線や文字記入位置を示す文字枠や、
その他記入欄の項目名(「金額」「番号」「住所」等)
のように元から印刷されてあって認識の対象としない文
字があるため、これらの不要なイメージを取り除くため
のフォームリムーバル機能が設けられている。このフォ
ームリムーバル機能によって不要なイメージを除くこと
で、後続する処理を容易に行なうことができる。
Therefore, in an existing form (sheet) that is commercially available, a ruled line, a character frame indicating a character entry position,
Other entry field names ("amount", "number", "address", etc.)
There is a form removal function for removing these unnecessary images because there are characters that are originally printed and are not recognized. By removing unnecessary images by this form removal function, subsequent processing can be easily performed.

【0005】フォームリムーバル機能の手法としては、
処理対象となる文字等が記入されていない帳票(ブラン
クシート)のイメージを予め登録しておき、読取り処理
を実行する際に、処理対象とする帳票のイメージとブラ
ンクシートのイメージとを比較して一致する部分を削除
することにより、不要な部分を削除することができる。
As a method of the form removal function,
An image of a form (blank sheet) in which characters or the like to be processed are not registered is registered in advance, and when the reading process is executed, the image of the form to be processed is compared with the blank sheet image. Unnecessary parts can be deleted by deleting the matching parts.

【0006】一方、処理対象とする帳票のフォーマット
が予め決められている光学的文字読取装置では、処理対
象とする帳票のフォーマットを示す情報(フォーマット
コントロール情報)を登録しておき、この情報に従って
文字の読取りを行なう。フォーマットコントロール情報
としては、帳票における罫線位置、文字枠位置、各種項
目の位置等、詳細な内容となっている。
On the other hand, in an optical character reading apparatus in which the format of the form to be processed is predetermined, information indicating the format of the form to be processed (format control information) is registered, and characters are written according to this information. Read. The format control information has detailed contents such as a ruled line position in a form, a character frame position, and positions of various items.

【0007】[0007]

【発明が解決しようとする課題】このように従来では、
光学的走査によって検出したイメージから不要な部分の
イメージを取り除くために、ブランクシートのイメージ
を登録しておき、このイメージをもとにして行なう手法
や、処理対象とする帳票に対してフォーマットコントロ
ール情報を登録しておくことにより、必要とする情報が
記録されている位置を判別するなどの手法が用いられて
いる。
As described above, in the prior art,
A blank sheet image is registered in order to remove unnecessary parts from the image detected by optical scanning, and a method to perform based on this image and format control information for the form to be processed By registering, the method of determining the position where the required information is recorded is used.

【0008】しかしながら、ブランクシートのイメージ
を登録しておく手法では、ブランクシートのイメージ
と、処理対象とするイメージとを、対応させて比較しな
ければいけないため、イメージ検出の際に生ずるずれ
や、掠れによって、確実に不要な部分の削除ができない
場合があった。
However, in the method of registering the image of the blank sheet, it is necessary to compare the image of the blank sheet and the image to be processed in correspondence with each other. There was a case where the unnecessary part could not be surely deleted due to blurring.

【0009】また、フォーマットコントロール情報を登
録する手法では、処理対象とする帳票毎に詳細な情報の
登録が必要となっている。例えば、検出対象とする全て
の罫線位置、文字枠位置、項目位置などを、帳票が異な
る毎に、それぞれ登録しなければならないために、非常
に作業負担が大きく、また読取りの対象となる帳票のタ
イプが限定されるという問題があった。
Further, in the method of registering format control information, it is necessary to register detailed information for each form to be processed. For example, all ruled line positions, character frame positions, item positions, etc. to be detected have to be registered for each different form, so that the work load is very large and the form to be read is There was a problem that types were limited.

【0010】本発明は前記のような点に鑑みてなされた
もので、作業負担を増大させることなく、読取りの対象
とする文字等のイメージを残し、不要なイメージを確実
に除去することが可能な画像処理装置を提供することを
目的とする。
The present invention has been made in view of the above points, and it is possible to leave an image of a character or the like to be read and reliably remove an unnecessary image without increasing the work load. It is an object of the present invention to provide a simple image processing device.

【0011】[0011]

【課題を解決するための手段】本発明は、カラーイメー
ジに対する、色毎に分類するための色情報、規則性を特
定するための均一性情報、及び形状を特定するための形
情報とを記憶するための情報記憶手段と、処理対象とす
るカラーイメージについて、前記情報記憶手段に記憶さ
れた色情報に基づいて、色毎にイメージを抽出する色情
報抽出手段と、前記処理対象とするカラーイメージにつ
いて、前記情報記憶手段に記憶された均一性情報に基づ
いて、規則性のあるイメージを抽出する均一性抽出手段
と、前記処理対象とするカラーイメージについて、前記
情報記憶手段に記憶された形情報に基づいて、所定の形
状のイメージを抽出する形情報抽出手段と、前記色情報
抽出手段、前記均一性抽出手段、及び前記形情報抽出手
段のそれぞれによって抽出されたイメージをもとに、必
要とするイメージ部分とその他のイメージ部分とを分類
するイメージ分類手段と、前記イメージ分類手段によっ
て分類されたその他のイメージ部分を、前記処理対象と
するカラーイメージから除去する不要イメージ除去手段
とを具備したことを特徴とする。
SUMMARY OF THE INVENTION The present invention stores color information for classifying each color image, uniformity information for specifying regularity, and shape information for specifying shape. Information storage means for storing the color image to be processed, color information extraction means for extracting an image for each color based on the color information stored in the information storage means, and the color image to be processed Regarding the uniformity information stored in the information storage means, the uniformity extraction means for extracting a regular image based on the uniformity information stored in the information storage means, and the shape information stored in the information storage means for the color image to be processed. On the basis of the shape information extracting means for extracting an image of a predetermined shape, the color information extracting means, the uniformity extracting means, and the shape information extracting means. An image classifying means for classifying a required image part and other image parts based on the image extracted by the above, and a color image to be processed by the other image parts classified by the image classifying means. And an unnecessary image removing unit for removing the unnecessary image.

【0012】[0012]

【作用】このような構成によれば、処理対象とするカラ
ーイメージから不要なイメージ部分を除去するために、
色、均一性、及び形に基づいて行なわれる。また、これ
らの特徴を抽出するために参照される情報が、処理実行
機能と独立して用意される。従って、不要なイメージ部
分を除去する高精度のフォームリムーバル機能が実現さ
れ、また処理対象とするイメージの変更等に容易に対処
できる。
According to this structure, in order to remove unnecessary image portions from the color image to be processed,
It is based on color, uniformity, and shape. In addition, the information referred to in order to extract these characteristics is prepared independently of the processing execution function. Therefore, a highly accurate form removal function for removing an unnecessary image portion is realized, and it is possible to easily deal with a change in an image to be processed.

【0013】[0013]

【実施例】以下、図面を参照して本発明の一実施例を説
明する。図1は本発明の一実施例に係わる画像処理装置
の構成を示すブロック図である。本実施例の画像処理装
置は、テキストリーダ等の文字読取り装置として実現さ
れているものとする。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the arrangement of an image processing apparatus according to an embodiment of the present invention. It is assumed that the image processing apparatus of this embodiment is realized as a character reader such as a text reader.

【0014】図1に示すように画像処理装置は、カラー
スキャナ10、イメージ用記憶部12、イメージ処理部
14、文字認識部16、知識情報記憶部18、理解結果
記憶部20、及び登録部22によって構成されている。
As shown in FIG. 1, the image processing apparatus includes a color scanner 10, an image storage unit 12, an image processing unit 14, a character recognition unit 16, a knowledge information storage unit 18, an understanding result storage unit 20, and a registration unit 22. It is composed by.

【0015】カラースキャナ10は、処理対象とする帳
票等を光学的に走査することによって、カラーの多値イ
メージを検出するものである。イメージ用記憶部12
は、カラースキャナ10によって検出された帳票イメー
ジを記憶するためのものである。 イメージ処理部14
は、イメージ用記憶部12に記憶されたイメージから、
知識情報記憶部18に記憶された情報を参照しながら、
不要なイメージ部分を除去するための処理を行なうもの
である。イメージ処理部14には、色情報抽出部14
a、均一性抽出部14b、形情報抽出部14c、イメー
ジ分類処理部14d、及び不要イメージ除去部14eが
設けられている。
The color scanner 10 detects a multi-valued color image by optically scanning a form or the like to be processed. Image storage unit 12
Is for storing the form image detected by the color scanner 10. Image processing unit 14
From the image stored in the image storage unit 12,
While referring to the information stored in the knowledge information storage unit 18,
This is a process for removing an unnecessary image portion. The image processing unit 14 includes a color information extraction unit 14
a, a uniformity extraction unit 14b, a shape information extraction unit 14c, an image classification processing unit 14d, and an unnecessary image removal unit 14e are provided.

【0016】色情報抽出部14aは、帳票イメージ中の
各領域を色別に分類するものである。均一性抽出部14
bは、色情報抽出部14aによって抽出されたイメージ
中の各領域から、均一性(詳細については後述する)を
示す部分を抽出するものである。形情報抽出部14c
は、帳票イメージ中の各領域を、その形に基づいて分類
するものである。前記各抽出部14a〜14cによって
帳票イメージのフォーマット理解が行なわれる。
The color information extraction unit 14a classifies each area in the form image by color. Uniformity extraction unit 14
In b, a portion showing uniformity (details will be described later) is extracted from each region in the image extracted by the color information extracting unit 14a. Shape information extraction unit 14c
Is for classifying each area in the form image based on its shape. The format of the form image is understood by the extraction units 14a to 14c.

【0017】イメージ分類処理部14dは、前記各抽出
部14a〜14cの抽出結果に基づいて、読取り対象と
するイメージ部分と、非読取り対象イメージ部分とを分
類するものである。不要イメージ除去部14e、イメー
ジ分類処理部14dによって分類された非読取り対象イ
メージ部分を削除するものである。
The image classification processing unit 14d classifies the image portion to be read and the non-reading image portion based on the extraction results of the extraction units 14a to 14c. The non-read target image portion classified by the unnecessary image removing unit 14e and the image classification processing unit 14d is deleted.

【0018】文字認識部16は、イメージ処理部14に
よって非読取り対象イメージ部分が削除されたイメージ
部分について、フォーマット理解の結果を参照しながら
文字認識処理を行なう。
The character recognition unit 16 performs character recognition processing on the image portion from which the non-read target image portion has been deleted by the image processing unit 14 with reference to the result of format understanding.

【0019】知識情報記憶部18は、帳票イメージから
文字を読取るために必要な知識情報を記憶するためのも
のである。知識情報記憶部18には、色情報記憶部18
a、均一性情報記憶部18b、及び形情報記憶部18c
が、フォーマット理解用の知識情報として記憶される。
また、文字認識部16における文字認識の際に参照され
る文字認識辞書18dが記憶される。
The knowledge information storage section 18 is for storing knowledge information necessary for reading characters from a form image. The knowledge information storage unit 18 includes a color information storage unit 18
a, the uniformity information storage unit 18b, and the shape information storage unit 18c
Is stored as knowledge information for understanding the format.
In addition, a character recognition dictionary 18d that is referred to when the character recognition unit 16 recognizes a character is stored.

【0020】理解結果記憶部20は、色情報抽出部14
a、均一性抽出部14b、及び形情報抽出部14cによ
って得られるフォーマット理解の結果を記憶するための
ものである。理解結果記憶部20に記憶された情報は、
文字認識部16における文字認識処理の際に参照され
る。
The understanding result storage unit 20 includes a color information extraction unit 14
This is for storing the result of format understanding obtained by a, the uniformity extraction unit 14b, and the shape information extraction unit 14c. The information stored in the understanding result storage unit 20 is
It is referred to in the character recognition processing in the character recognition unit 16.

【0021】登録部22は、マンマシンインターフェイ
スを司るものであり、知識情報記憶部18に記憶される
情報を登録するものである。登録部22には、キーボー
ドや表示装置等の入出力装置が設けられている。なお、
図1に示す各部は、図示せぬ制御装置によって動作が制
御されているものとする。
The registration unit 22 controls the man-machine interface and registers the information stored in the knowledge information storage unit 18. The registration unit 22 is provided with an input / output device such as a keyboard and a display device. In addition,
The operation of each unit shown in FIG. 1 is assumed to be controlled by a control device (not shown).

【0022】ここで、知識情報記憶部18に記憶される
フォーマット理解用の各種情報について、図2を参照し
て説明する。色情報記憶部18aは、帳票イメージ中の
色に関する情報が登録されている。例えば、帳票イメー
ジ中の罫線や文字枠の色は「赤」、文字は「黒」のよう
に登録する。色情報抽出部14aは、これらの情報に従
って、指定された色のイメージを色毎に分類する。
Here, various types of information for format understanding stored in the knowledge information storage unit 18 will be described with reference to FIG. The color information storage unit 18a has registered therein information about colors in the form image. For example, the color of the ruled line or the character frame in the form image is registered as “red” and the character is registered as “black”. The color information extraction unit 14a classifies the image of the designated color for each color according to these pieces of information.

【0023】均一性情報記憶部18bは、イメージ中の
ビットの並びの規則性に関する情報、すなわちビットの
並びが直線、点線、円等を特定する情報が登録されてい
る。例えば、nビット以上、座標値xのビットが連続し
ている場合には垂線(直線)のように登録する。均一性
抽出部14bは、これらの情報に従って、均一性を示す
イメージ部分を抽出する。この際、均一性抽出部14b
は、処理対象とする帳票イメージの傾きや掠れ等を考慮
して、ある程度の幅を持たせてイメージの抽出を行な
う。
The uniformity information storage section 18b has registered therein information relating to the regularity of the arrangement of bits in the image, that is, information identifying the straight line, the dotted line, the circle, etc. of the arrangement of bits. For example, if the number of bits of the coordinate value x is n or more and consecutive, the registration is made as a vertical line (straight line). The uniformity extracting unit 14b extracts an image portion showing uniformity according to these pieces of information. At this time, the uniformity extraction unit 14b
Considers the inclination and blurring of the form image to be processed, and extracts the image with a certain width.

【0024】形情報記憶部18cは、イメージの形に関
する情報が登録されている。例えば、4つの直線によっ
て矩形が形成されていれば表であり、矩形枠内に存在す
る垂線は表のカラムを分ける位置等のように登録され
る。形情報抽出部14cは、これらの情報に従って、イ
メージを形により分類する。
The shape information storage section 18c stores information about the shape of an image. For example, if a rectangle is formed by four straight lines, it is a table, and the vertical line existing in the rectangular frame is registered as a position where columns of the table are divided. The shape information extracting unit 14c classifies the image according to the shape according to these pieces of information.

【0025】この結果、理解結果記憶部20には、読取
り対象とするイメージ部分と非読取り対象イメージ部分
とを区分する情報を服務、各抽出部14a〜14cによ
って分類されたイメージに関する情報が記憶される。
As a result, the understanding result storage unit 20 stores information for distinguishing the image portion to be read from the image portion not to be read, and the information on the images classified by the extraction units 14a to 14c. It

【0026】次に、本実施例の動作について説明する。
ここでは、図3に示すような帳票イメージがカラースキ
ャナ10によって検出され、イメージ用記憶部12に記
憶されているものとする。説明を簡単にするために、図
3に示すイメージの線(枠)部分は「赤」、文字部分は
「黒」であるとし、イメージに不要な傾きがないものと
する。また、知識情報記憶部18には、図2に示す内容
の情報が登録されているものとする。
Next, the operation of this embodiment will be described.
Here, it is assumed that the form image as shown in FIG. 3 is detected by the color scanner 10 and stored in the image storage unit 12. In order to simplify the explanation, it is assumed that the line (frame) portion of the image shown in FIG. 3 is “red” and the character portion is “black”, and that the image has no unnecessary inclination. In addition, it is assumed that the knowledge information storage unit 18 is registered with information having the content shown in FIG.

【0027】まず、イメージ処理部14の色情報抽出部
14aは、色情報記憶部18aに登録された色情報を参
照しながら、イメージを色毎に分類する。ここでは、枠
部分のイメージと、文字部分のイメージとに分類され
る。
First, the color information extraction unit 14a of the image processing unit 14 classifies the image for each color with reference to the color information registered in the color information storage unit 18a. Here, the image is classified into a frame image and a character image.

【0028】次に、均一性抽出部14bは、均一性情報
記憶部18bに登録された均一性情報を参照しながら均
一性を示すイメージ部分を抽出する。ここでは、枠部分
のイメージから、x方向にnビット以上連続するビット
列が横線分、y方向にmビット以上連続するビット列が
縦線分として抽出される。
Next, the uniformity extracting unit 14b extracts the image portion showing the uniformity while referring to the uniformity information registered in the uniformity information storage unit 18b. Here, from the image of the frame portion, a bit string continuous with n bits or more in the x direction is extracted as a horizontal line segment, and a bit string continuous with m bits or more in the y direction is extracted as a vertical line segment.

【0029】次に、形情報抽出部14cは、形情報記憶
部18cに登録された形情報を参照しながら、イメージ
の形状をもとに分類する。ここでは、均一性抽出部14
bによって抽出された線分の接続状態を判別し、矩形枠
や矩形枠内の領域を分割する線分(縦線分、横線分)等
を分類する。
Next, the shape information extraction unit 14c classifies the images based on the shape of the image with reference to the shape information registered in the shape information storage unit 18c. Here, the uniformity extraction unit 14
The connection state of the line segment extracted by b is determined, and the line segment (vertical line segment, horizontal line segment) that divides the rectangular frame or the area within the rectangular frame is classified.

【0030】こうした結果は、理解結果記憶部20に記
憶される。イメージ分類処理部14dは、理解結果記憶
部20に記憶された内容に基づいて、読取り対象とする
イメージ部分と、非読取り対象イメージ部分とを分類す
る。例えば、イメージ分類処理部14dは、矩形枠内を
読取り対象とするイメージ部分とし、その他を非読取り
対象イメージ部分とする。
These results are stored in the understanding result storage section 20. The image classification processing unit 14d classifies the image portion to be read and the non-reading image portion based on the contents stored in the understanding result storage unit 20. For example, the image classification processing unit 14d regards the inside of the rectangular frame as the image portion to be read, and the other as the non-read target image portion.

【0031】不要イメージ除去部14eは、イメージ分
類処理部14dによって非読取り対象イメージと分類さ
れた部分、すなわち矩形枠外の文字等を含む全てのイメ
ージや、矩形枠内の全ての線分等を除去する。この結
果、認識処理の対象とする文字のイメージのみが残る。
The unnecessary image removing unit 14e removes the portion classified by the image classification processing unit 14d as the non-read target image, that is, all the images including the characters outside the rectangular frame and all the line segments within the rectangular frame. To do. As a result, only the image of the character to be recognized remains.

【0032】文字認識部16は、不要イメージ除去部1
4eによって得られた認識処理の対象とするイメージに
ついて、文字認識辞書18dを参照して文字認識処理を
行なう。ここで文字認識部16は、理解結果記憶部20
に記憶された、カラムの区分を示す線分の位置関係等に
基づいて、例えば線分によって区切られるカラムの単位
毎に文字認識を行ない、認識結果を出力する。
The character recognition unit 16 includes an unnecessary image removing unit 1
The character recognition processing is performed on the image to be subjected to the recognition processing obtained by 4e with reference to the character recognition dictionary 18d. Here, the character recognition unit 16 uses the understanding result storage unit 20.
Character recognition is performed for each unit of the columns separated by the line segment based on the positional relationship of the line segments indicating the column divisions stored in, and the recognition result is output.

【0033】このようにして、知識情報記憶部18に記
憶された情報をもとに、帳票イメージに対してフォーマ
ット理解を行ない、この結果を用いて文字認識処理を行
なう。すなわち、帳票イメージに対して、色、均一性、
及び形に基づいて、フォーマット理解が行なわれるの
で、確実に処理対象とするイメージと不要なイメージと
を分類することができ、精度の良い高品質のフォームリ
ムーバル機能が実現される。
In this way, the format image of the form image is understood based on the information stored in the knowledge information storage unit 18, and the character recognition process is performed using the result. That is, for the form image, color, uniformity,
Since the format is understood on the basis of the shape and the shape, it is possible to reliably classify the image to be processed and the unnecessary image, and it is possible to realize an accurate and high quality foam removal function.

【0034】また、従来のフォーマットコントロール情
報のように厳密な情報ではないため、情報の登録が容易
であり、かつ帳票イメージの位置ずれや傾きに対しても
対応できる柔軟性をもつので処理対象とする帳票(シー
ト)の種類が特定されず汎用性が向上する。
Further, since it is not strict information like the conventional format control information, it is easy to register the information and has the flexibility to cope with the positional deviation and the inclination of the form image, so that it can be processed. The versatility is improved because the type of form (sheet) to be processed is not specified.

【0035】さらに、知識情報記憶部18に独立させ
て、色、均一性、及び形に関する各情報を登録すること
ができるので、処理対象とする帳票の変更に対しても容
易に対処することができる。
Furthermore, since information about color, uniformity, and shape can be registered independently in the knowledge information storage unit 18, it is possible to easily deal with changes in the form to be processed. it can.

【0036】なお、前記実施例においては、文字読取り
装置として実現される例について説明したが、カラーに
よるイメージから不要な部分を除去する機能(フォーム
リムーバル機能)を有する画像処理装置に適用すること
ができる。また、前記実施例における知識情報記憶部1
8に記憶された情報は説明を簡単にするための一例であ
って、その内容は任意に登録することができる。
In the above embodiment, the example realized as a character reading device has been described, but it can be applied to an image processing device having a function (form removal function) of removing an unnecessary portion from a color image. it can. Further, the knowledge information storage unit 1 in the above embodiment
The information stored in 8 is an example for simplifying the description, and the content can be arbitrarily registered.

【0037】[0037]

【発明の効果】以上のように本発明によれば、処理対象
とするカラーイメージから不要なイメージ部分を除去す
るために、色、均一性、及び形に基づいて行なわれ、ま
た、これらの特徴を抽出するために参照される情報が、
処理実行機能と独立して用意されるので、処理対象毎に
詳細な情報を登録することなく、処理対象とするイメー
ジの変更に柔軟に対処し、高精度に読取りの対象とする
文字等のイメージを残し、不要なイメージを確実に除去
することが可能となるものである。ことが可能となるも
のである。
As described above, according to the present invention, unnecessary image portions are removed from a color image to be processed on the basis of color, uniformity, and shape. The information referenced to extract
Since it is prepared independently of the processing execution function, you can flexibly deal with changes in the image to be processed without registering detailed information for each processing target, and the image of characters etc. to be read with high accuracy Therefore, it is possible to remove unnecessary images without fail. It is possible.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例に係わる画像処理装置の構成
を示すブロック図。
FIG. 1 is a block diagram showing the configuration of an image processing apparatus according to an embodiment of the present invention.

【図2】本実施例における知識情報記憶部18に記憶さ
れるフォーマット理解用の各種情報について説明するた
めの図。
FIG. 2 is a diagram for explaining various types of information for format understanding stored in a knowledge information storage unit 18 in the present embodiment.

【図3】本実施例における動作を説明するための帳票イ
メージの一例を示す図。
FIG. 3 is a diagram showing an example of a form image for explaining the operation in the present embodiment.

【符号の説明】[Explanation of symbols]

10…カラースキャナ、12…イメージ用記憶部、14
…イメージ処理部、14a…色情報抽出部、14b…均
一性抽出部、14c…形情報抽出部、14d…イメージ
分類処理部、14e…不要イメージ除去部、16…文字
認識部、18…知識情報記憶部、18a…色情報記憶
部、18b…均一性情報記憶部、18c…形情報記憶
部、18d…文字認識辞書、20…理解結果記憶部、2
2…登録部。
10 ... Color scanner, 12 ... Image storage unit, 14
Image processing unit 14a Color information extraction unit 14b Uniformity extraction unit 14c Shape information extraction unit 14d Image classification processing unit 14e Unnecessary image removal unit 16 Character recognition unit 18 Knowledge information Storage unit, 18a ... Color information storage unit, 18b ... Uniformity information storage unit, 18c ... Shape information storage unit, 18d ... Character recognition dictionary, 20 ... Understanding result storage unit, 2
2 ... Registration department.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 カラーイメージに対する、色毎に分類す
るための色情報、規則性を特定するための均一性情報、
及び形状を特定するための形情報とを記憶するための情
報記憶手段と、 処理対象とするカラーイメージについて、前記情報記憶
手段に記憶された色情報に基づいて、色毎にイメージを
抽出する色情報抽出手段と、 前記処理対象とするカラーイメージについて、前記情報
記憶手段に記憶された均一性情報に基づいて、規則性の
あるイメージを抽出する均一性抽出手段と、 前記処理対象とするカラーイメージについて、前記情報
記憶手段に記憶された形情報に基づいて、所定の形状の
イメージを抽出する形情報抽出手段と、 前記色情報抽出手段、前記均一性抽出手段、及び前記形
情報抽出手段のそれぞれによって抽出されたイメージを
もとに、必要とするイメージ部分とその他のイメージ部
分とを分類するイメージ分類手段と、 前記イメージ分類手段によって分類されたその他のイメ
ージ部分を、前記処理対象とするカラーイメージから除
去する不要イメージ除去手段と、 を具備したことを特徴とする画像処理装置。
1. Color information for classifying color images into color images, uniformity information for specifying regularity,
And information storing means for storing shape information for specifying the shape, and a color for extracting an image for each color based on the color information stored in the information storing means for the color image to be processed. Information extracting means, a uniformity extracting means for extracting a regular image based on the uniformity information stored in the information storing means for the color image to be processed, and the color image to be processed With respect to each of the shape information extracting means for extracting an image of a predetermined shape based on the shape information stored in the information storing means, the color information extracting means, the uniformity extracting means, and the shape information extracting means. Image classification means for classifying required image parts and other image parts based on the images extracted by The image processing apparatus characterized by other image portions which are classified by kind means, equipped with a, and unnecessary image removing means for removing from a color image to be the processing target.
JP5036520A 1993-02-25 1993-02-25 Image processing device Pending JPH06251191A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5036520A JPH06251191A (en) 1993-02-25 1993-02-25 Image processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5036520A JPH06251191A (en) 1993-02-25 1993-02-25 Image processing device

Publications (1)

Publication Number Publication Date
JPH06251191A true JPH06251191A (en) 1994-09-09

Family

ID=12472099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5036520A Pending JPH06251191A (en) 1993-02-25 1993-02-25 Image processing device

Country Status (1)

Country Link
JP (1) JPH06251191A (en)

Similar Documents

Publication Publication Date Title
JP2575539B2 (en) How to locate and identify money fields on documents
JPH06251191A (en) Image processing device
JP3171626B2 (en) Character recognition processing area / processing condition specification method
JP2575408B2 (en) Postal address reading device for mail
JPH06111057A (en) Optical character reader
JP3006294B2 (en) Optical character reader
JP3015448B2 (en) Address area detection device
JPS6227887A (en) Character type separating system
JPH07152856A (en) Optical character reader
JPH04309B2 (en)
JPH01191986A (en) Slip format detector
JPH04139593A (en) Postal code number recognition device
JPH01201789A (en) Character reader
JPH0498586A (en) Image forming device
JPS62295192A (en) Optical character image reader
JPH02166580A (en) Optical character reader and its character reading method
JPH06176193A (en) Optical character reader
JPS61190676A (en) Document registering system
JPH02195488A (en) Character recognizing device
JP2001307020A (en) Character recognizing device
JPH06333085A (en) Optical character reader
JPS62103784A (en) Character reader
JPH04346188A (en) Document recognizing device
JPS60144885A (en) Information input device
JPH0528314A (en) Optical character reader