JPH0423184A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH0423184A
JPH0423184A JP2128641A JP12864190A JPH0423184A JP H0423184 A JPH0423184 A JP H0423184A JP 2128641 A JP2128641 A JP 2128641A JP 12864190 A JP12864190 A JP 12864190A JP H0423184 A JPH0423184 A JP H0423184A
Authority
JP
Japan
Prior art keywords
color
image
picture image
read
labeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2128641A
Other languages
Japanese (ja)
Inventor
Hiroyuki Harashima
原島 裕之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2128641A priority Critical patent/JPH0423184A/en
Publication of JPH0423184A publication Critical patent/JPH0423184A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To read a colored general document by invalidating a picture image sorted into the color of a picture part designated by position information obtained by a designating means, and binarizing successively the picture image of a remaining color in a labeling part. CONSTITUTION:A scanning part 1 reads document as a color picture image, and a sheet buffer 2 holds the read color picture image. Then, a display part 3 displays the color picture image in the buffer 2. The labeling part 5 sorts the color picture image into the picture of every color, and holds the picture image of every color, and a binarizing part 6 invalidates the picture image sorted into the color of the picture part designated by the position information obtained by an operating part 4, and binarizes successively the picture image of the remaining color in the labeling part 5. A character recognizing part 7 executes successively the character recognition of the picture image binarized by the binarizing part 6. Thus, the multi-color-printed general document can be read.

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明はカラー画像を読み取る光学的文字読取装置に関
する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] (Field of Industrial Application) The present invention relates to an optical character reading device for reading color images.

(従来の技術) 従来の光学的文字読取装FI!(以降OCRと称する)
は黒色を有効、白色を無効として白黒画像をその読み取
り対象としている。このため、前記OCRの画像を走査
して光電変換する走査部では、得られた画像データをあ
る閾値で区別することにより白/黒のいずれかのデータ
に2値化している。
(Prior art) Conventional optical character reading system FI! (hereinafter referred to as OCR)
The black-and-white image is read as a black-and-white image, with black as valid and white as invalid. For this reason, in the scanning section that scans the OCR image and performs photoelectric conversion, the obtained image data is binarized into either white or black data by distinguishing the obtained image data using a certain threshold value.

又、読み取り対象帳票の手書き文字枠に使われている色
として、前記OCRの走査部には白色に見える(ドロッ
プアウトと呼ぶ)色を使用することにより文字枠を読み
取らず、この文字枠内に書がれな手書き文字のみを読み
取るようにしていることがあった。但し、前記ドロップ
アウトする色は走査部で使用する光源の波長により決定
されている。
In addition, by using a color that appears white to the OCR scanning unit (called dropout) as the color used for the handwritten character frame of the document to be read, the character frame is not read and the text is not read within the character frame. There were times when I tried to read only sloppy handwriting. However, the dropout color is determined by the wavelength of the light source used in the scanning section.

このような従来のOCRにて雑誌等の様々な色を使用し
て多色印刷された一般文書を読み取りたい場合、前記ド
ロップアウトする色で文字が書かれている文書では文字
が2値化時にドロップアウトして読めなかったり、或い
は背景と文字が共に有効になって両者を2値化時に分離
することができず、やはり文字を読み取ることができな
いという不具合があった。従って、従来のOCRはカラ
ー化された一般文書を読み取ることができないという欠
点があった。
When you want to read a general document printed in multiple colors using various colors, such as a magazine, using conventional OCR, if the document has text written in the color that drops out, the text will be lost when it is binarized. There were problems in that the text would drop out and be unreadable, or the background and text would both become effective and they could not be separated during binarization, resulting in the text being unreadable. Therefore, conventional OCR has the disadvantage that it cannot read general documents that are colored.

(発明が解決しようとする課題) 上記の如〈従来のOCRは白黒画像を読み取り対象とし
ているため、多色印刷された一般文書を読み取ることが
出来ないという欠点があった。
(Problems to be Solved by the Invention) As mentioned above, since conventional OCR scans black and white images, it has the disadvantage that it cannot read general documents printed in multiple colors.

そこで本発明は上記の欠点を除去するもので、多色印刷
された一般文書を読み取ることができる光学的文字読取
装置を提供することを目的としている。
SUMMARY OF THE INVENTION The present invention aims to eliminate the above-mentioned drawbacks and provides an optical character reading device capable of reading general documents printed in multiple colors.

〔発明の構成〕[Structure of the invention]

(課題を解決するための手段) 本発明の光学的文字読取装置は、帳票をカラー画像イメ
ージとして読み取る読取手段と、この読取手段にて読み
取られたカラー画像イメージを保持する保持手段と、こ
の保持手段内のカラー画像イメージを表示する表示手段
と、前記表示手段に表示されたカラー画像イメージの任
意の1点の位置情報を指定する指定手段と、前記保持手
段内のカラー画像イメージを色毎の画像に分類して各色
毎の画像イメージを保持するラベリング手段と、前記指
定手段によって得られる位置情報で指定された前記画像
部分の色に分類された画像イメージを無効とし、前記ラ
ベリング部内の残り色の画像イメージを順次2値化する
2値化手段と、この2値化手段によって2値化された画
像イメージの文字認識を順次行う文字認識手段とを具備
した構成を有する。
(Means for Solving the Problems) The optical character reading device of the present invention includes a reading means for reading a form as a color image, a holding means for holding the color image read by the reading means, and a holding means for holding the color image read by the reading means. display means for displaying a color image in the means; designation means for specifying positional information of any one point of the color image displayed on the display means; a labeling means for classifying into images and holding an image for each color; and a labeling means for disabling the image classified into the color of the image portion specified by the position information obtained by the specifying means, and disabling the remaining color in the labeling section. The present invention has a configuration including a binarization means for sequentially binarizing the image images, and a character recognition means for sequentially performing character recognition of the image images binarized by the binarization means.

(作用) 本発明の光学的文字読取装置において、読取手段は帳票
をカラー画像イメージとして読み取る。
(Operation) In the optical character reading device of the present invention, the reading means reads the form as a color image.

保持手段は前記読取手段にて読み取られたカラー画像イ
メージを保持する。表示手段は前記保持手段内のカラー
画像イメージを表示する。指定手段は前記表示手段に表
示されたカラー画像イメージの任意の1点の位置情報を
指定する。ラベリング手段は前記保持手段内のカラー画
像イメージを色毎の画像に分類して各色毎の画像イメー
ジを保持する。2値化手段は前記指定手段によって得ら
れる位置情報で指定された前記画像部分の色に分類され
た画像イメージを無効とし、前記ラベリング部内の残り
色の画像イメージを順次2値化する。
The holding means holds the color image read by the reading means. Display means displays the color image image within said holding means. The specifying means specifies positional information of any one point in the color image displayed on the display means. The labeling means classifies the color images in the holding means into images for each color and holds the image for each color. The binarization means invalidates the image classified into the color of the image portion designated by the position information obtained by the designation means, and sequentially binarizes the remaining color images in the labeling section.

文字認識手段は前記2値化手段によって2値化された画
像イメージの文字認識を順次行う。
The character recognition means sequentially performs character recognition of the image image binarized by the binarization means.

(実施例) 以下、本発明の一実施例を図面を参照して説明する。第
1図は本発明の光学的文字読取装置の一実施例を示した
ブロック図である。1は入力される多色刷りの帳票を走
査してカラー画像を得る走査部、2は走査部1より得ら
れたカラー画像データを1帳票分格納するシートバッフ
ァ、3はシートバッファ2に格納されたカラー画像の入
力イメージをカラー表示する表示部、4は表示部3の任
意の1点を指定して制御部1に入力する操作部、5はシ
ートバッファ2に格納されたカラー画像イメージの色毎
の画素の連結性を1まとまりとしてラベル付けを行った
後、各ラベル毎に画像を蓄えるラベリング部、6は操作
部4で指定された位置情報を制御部8を介して与えられ
ると、ラベリング部5に対して前記与えられた位置にあ
る色と同じ色のラベルによって分類される画像を無効に
して2値化を行う2値化部、7は2値化部6から出力さ
れた2値化画像のパターンに対して文字の認識を行う文
字認識部、8はシートバッファ2に格納されたカラーイ
メージを表示部3へ出力して表示させると共に、操作部
4から前記位置情報を少なくとも2回以上入力して、こ
れら位置情報を2値化部6へ与えて文字認識処理制御を
行う制御部である。
(Example) Hereinafter, an example of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of the optical character reading device of the present invention. 1 is a scanning unit that scans an input multicolor printing form to obtain a color image; 2 is a sheet buffer that stores color image data obtained from scanning unit 1 for one form; 3 is stored in sheet buffer 2. A display section displays the input color image in color; 4 is an operation section for specifying any one point on the display section 3 and inputting it to the control section 1; 5 is a display section for each color of the color image stored in the sheet buffer 2; A labeling section 6 stores an image for each label after labeling the connectivity of the pixels as a group; 6 is a labeling section that stores an image for each label; 5 is a binarization unit that performs binarization by invalidating the image classified by the label of the same color as the color at the given position, and 7 is a binarization unit output from the binarization unit 6. A character recognition unit 8 that recognizes characters from the image pattern outputs the color image stored in the sheet buffer 2 to the display unit 3 for display, and also outputs the position information from the operation unit 4 at least twice or more. This is a control unit that inputs the position information and provides it to the binarization unit 6 to control character recognition processing.

ここで、シートバッファ2は保持手段を、表示部3は表
示手段を、操作部4と制御部8は指定手段を、ラベリン
グ部5はラベリング手段を、2値化部6は2値化手段を
、文字認識部7は文字認識手段を構成している。
Here, the sheet buffer 2 serves as a holding means, the display section 3 serves as a display means, the operation section 4 and the control section 8 serve as specifying means, the labeling section 5 serves as a labeling means, and the binarization section 6 serves as a binarization means. , the character recognition section 7 constitutes character recognition means.

次に本実施例の動作について説明する。まず読み取り対
象帳票は走査部1により光電変換されてカラー画像デー
タ(入力カラーイメージ)となり、このカラー画像デー
タがシートバッファ2に格納される。制御部8はシート
バッファ2に格納されたカラー画像データを読み出して
これを表示部3に与えることにより、表示部3にシート
バッファ2に格納されているカラーイメージを表示させ
る。
Next, the operation of this embodiment will be explained. First, the document to be read is photoelectrically converted by the scanning unit 1 to become color image data (input color image), and this color image data is stored in the sheet buffer 2 . The control unit 8 reads out the color image data stored in the sheet buffer 2 and supplies it to the display unit 3, thereby causing the display unit 3 to display the color image stored in the sheet buffer 2.

これと同時に、ラベリング部5はシートバッファ2に格
納されているカラー画像の各色毎の画素の連結性を調べ
、連結した画素の集合毎にラベル付けを行い、このラベ
ル付けを行った画像を各ラベル毎に蓄える動作を行う。
At the same time, the labeling unit 5 examines the connectivity of pixels for each color of the color image stored in the sheet buffer 2, labels each set of connected pixels, and labels each image with this labeling. Performs storage operation for each label.

即ち、例えばシートバッファ2に赤、青、黄色の部分で
成るカラー画像が格納された場合、ラベリング部3は赤
、青、黄色毎にラベル付け(この例では3つのラベルが
付けられる)を行い、赤の部分の画像、青の部分の画像
及び黄色の部分の画像をそれぞれ分離して蓄える動作を
行う。
That is, for example, when a color image consisting of red, blue, and yellow parts is stored in the sheet buffer 2, the labeling unit 3 labels each of red, blue, and yellow (in this example, three labels are attached). , the image of the red part, the image of the blue part, and the image of the yellow part are separated and stored.

一方、オペレータは表示部3に表示されたカラー画像を
見て例えば文字の背景となる色部分の一点をマウス、カ
ーソル等に指定して、この位置情報を制御部8に知らせ
る。例えば背景が複数の色の場合、例えば赤色の背景の
1点と青色の背景の1点を指定する。これにより、操作
部4はオペレータが指定した赤色の背景の1点と青色の
背景の1点の位置情報を制御部8に出力する。制御部8
はこのようにして入力された位置情報を2値化部6へ与
える。2値化部6は上記の如くして制御部8から与えら
れる位置情報の部分の色に対応するラベル情報を無効に
しく例えばラベル番号を負にする)、残ったラベルの画
像のみを有効にして2値化する。
On the other hand, the operator looks at the color image displayed on the display section 3, uses a mouse, cursor, etc., to specify, for example, a point in the colored part that will become the background of the characters, and notifies the control section 8 of this positional information. For example, if the background has multiple colors, one point on the red background and one point on the blue background are designated, for example. Thereby, the operation unit 4 outputs to the control unit 8 the position information of one point on the red background and one point on the blue background specified by the operator. Control unit 8
provides the thus input position information to the binarization section 6. As described above, the binarization unit 6 invalidates the label information corresponding to the color of the position information part given from the control unit 8 (for example, makes the label number negative), and validates only the image of the remaining label. and convert it into a binary value.

ここで、赤のラベル番号を(1)、青のラベル番号を(
2)、黄色のラベル番号を(3)とすると、2値化部6
は上記の例では赤と青のラベル番号を負にして無効とす
るため、黄色のラベル番号のみが有効になる。従って、
2値化部6はラベリング部5に蓄積されているラベル(
3)の黄色の画素の連結から成る黄色の画像に対しての
み2値化を行い、得られた2値化パターンを文字認識部
7に送る。文字認識部7は2値化部6から送られてくる
2値化パターンに対して文字認識を行い、その結果を制
御部8に知らせる。ここで、2値化部6により2値化さ
れるラベル番号が複数ある場合、2値化部6は各ラベル
毎に2値化を行なってその2値化パターンを文字認識部
7に送るため、文字認識部7は有効なラベルに対応する
画像毎に複数回にわたって文字認識処理を行うことにな
る。
Here, set the red label number to (1) and the blue label number to (1).
2), if the yellow label number is (3), the binarization unit 6
In the above example, the red and blue label numbers are made negative and invalid, so only the yellow label number is valid. Therefore,
The binarization unit 6 converts the labels stored in the labeling unit 5 (
Binarization is performed only on the yellow image formed by the connection of yellow pixels in step 3), and the resulting binarized pattern is sent to the character recognition section 7. The character recognition section 7 performs character recognition on the binarized pattern sent from the binarization section 6, and notifies the control section 8 of the result. Here, if there are multiple label numbers to be binarized by the binarization unit 6, the binarization unit 6 binarizes each label and sends the binarized pattern to the character recognition unit 7. , the character recognition unit 7 performs character recognition processing multiple times for each image corresponding to a valid label.

本実施例によれば、多色印刷された雑誌等の一般文書を
読み取る際に、読み取った画像を各色毎に分解して蓄積
し、読み取りたくない色の画像を指定し、これら画像を
除き、残った画像に対してのみ2値化を行って文字の認
識を行わせることができるため、ドロップアウトが生ぜ
ず且つ、背景と文字が共に有効となることを防止して、
カラーの文字を正確に読み取ることができる。
According to this embodiment, when reading general documents such as magazines printed in multiple colors, the read images are separated and stored for each color, images of colors that you do not want to read are specified, and these images are removed. Since it is possible to perform character recognition by binarizing only the remaining image, dropouts do not occur and both the background and characters are prevented from being valid.
Color text can be read accurately.

〔発明の効果〕〔Effect of the invention〕

以上記述した如く本発明の光学的文字読取装置によれば
、多色印刷された一般文書を読み取ることができる。
As described above, according to the optical character reading device of the present invention, general documents printed in multiple colors can be read.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の光学的文字読取装置の一実施例を示し
たブロック図である。 1・・・走査部     訃・・シートバッファ3・・
・表示部     4・・・操作部5・・・ラベリング
部  6・・・2値化部7・・・文字認識部   8・
・・制御部代理人 弁理士 本 1)  崇
FIG. 1 is a block diagram showing an embodiment of the optical character reading device of the present invention. 1...Scanning section...Sheet buffer 3...
・Display section 4...Operation section 5...Labeling section 6...Binarization section 7...Character recognition section 8.
...Control Department Agent Patent Attorney Hon 1) Takashi

Claims (1)

【特許請求の範囲】[Claims] 帳票をカラー画像イメージとして読み取る読取手段と、
この読取手段にて読み取られたカラー画像イメージを保
持する保持手段と、この保持手段内のカラー画像イメー
ジを表示する表示手段と、前記表示手段に表示されたカ
ラー面像イメージの任意の1点の位置情報を指定する指
定手段と、前記保持手段内のカラー画像イメージを色毎
の画像に分類して各色毎の画像イメージを保持するラベ
リング手段と、前記指定手段によって得られる位置情報
で指定された前記画像部分の色に分類された画像イメー
ジを無効とし、前記ラベリング部内の残り色の画像イメ
ージを順次2値化する2値化手段と、この2値化手段に
よって2値化された画像イメージの文字認識を順次行う
文字認識手段とを具備したことを特徴とする光学的文字
読取装置。
a reading means for reading the form as a color image;
A holding means for holding the color image read by the reading means, a display means for displaying the color image in the holding means, and a display means for displaying the color surface image displayed on the display means. a specifying means for specifying positional information; a labeling means for classifying the color images in the holding means into images for each color and holding the image for each color; binarization means for invalidating the image classified into the color of the image portion and sequentially binarizing the remaining color images in the labeling section; What is claimed is: 1. An optical character reading device comprising character recognition means for sequentially performing character recognition.
JP2128641A 1990-05-18 1990-05-18 Optical character reader Pending JPH0423184A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2128641A JPH0423184A (en) 1990-05-18 1990-05-18 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2128641A JPH0423184A (en) 1990-05-18 1990-05-18 Optical character reader

Publications (1)

Publication Number Publication Date
JPH0423184A true JPH0423184A (en) 1992-01-27

Family

ID=14989847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2128641A Pending JPH0423184A (en) 1990-05-18 1990-05-18 Optical character reader

Country Status (1)

Country Link
JP (1) JPH0423184A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA019566B1 (en) * 2005-02-22 2014-04-30 Дзе Риджентс Оф Дзе Юниверсити Оф Мичиган Small molecule inhibitors of mdm2

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA019566B1 (en) * 2005-02-22 2014-04-30 Дзе Риджентс Оф Дзе Юниверсити Оф Мичиган Small molecule inhibitors of mdm2

Similar Documents

Publication Publication Date Title
CN101295359B (en) Image processing method and image processing apparatus
JP3018949B2 (en) Character reading apparatus and method
CN111738901A (en) Storage medium and image processing apparatus
IL98293A (en) Method of discriminating between text and graphics
JPH0423184A (en) Optical character reader
JPH06203204A (en) Character recognition device
JPH0291789A (en) Character recognizing system
USH524H (en) Image processing system for converting monochrome bank check images to multicolor bank check images
JP2000123181A (en) Device and method for automatically selecting scan area
JPH06111057A (en) Optical character reader
JP2003196592A (en) Program for processing image, and image processor
JPS6227887A (en) Character type separating system
JPH02123486A (en) Optical character reader
JPH06176193A (en) Optical character reader
JPS5949671A (en) Optical character reader
Cracknell et al. A colour classification approach to form dropout
JP2925300B2 (en) Optical character reader
JPH0528314A (en) Optical character reader
JPH11306282A (en) Method and device for extracting character string area
JPH02187883A (en) Document reader
JPH08249421A (en) Recognizing method for reverse character
JP2980636B2 (en) Character recognition device
JPH03214381A (en) Optical character reader
JPS6063687A (en) Information processing system
Xingyuan et al. A statistical form reading system