JPS63167991A - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPS63167991A
JPS63167991A JP61311922A JP31192286A JPS63167991A JP S63167991 A JPS63167991 A JP S63167991A JP 61311922 A JP61311922 A JP 61311922A JP 31192286 A JP31192286 A JP 31192286A JP S63167991 A JPS63167991 A JP S63167991A
Authority
JP
Japan
Prior art keywords
image
character
graphic
recognition result
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61311922A
Other languages
Japanese (ja)
Inventor
Hiroyuki Harashima
原島 裕之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61311922A priority Critical patent/JPS63167991A/en
Publication of JPS63167991A publication Critical patent/JPS63167991A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To perform image processing even when there is a graphic area present at an optional place by retrieving extraction information specified according to the recognition result of a character recognizing means, and outputting a graphic form image when there is a recognition result corresponding to it. CONSTITUTION:A slip P is read by a read part 1 and converted into image data, which is stored in an image buffer 2. A labeling part 3 scans the data to detect a character string image and a graphic image, labels them respectively, and generates a label table wherein those label are related with each other and stores the table in a label storage part 4. An image extraction part 7 retrieves the extraction information read out of a format information storage part 5 among character string image recognized by a character recognition part 6 and when there is a recognition result corresponding to it, the storage part 4 is referred to and graphic images relative to the recognition result corresponding to the extraction information is read out of the buffer 2, and then processed and outputted.

Description

【発明の詳細な説明】 [発明の口約] (産業上の利用分野) 本発明は文字の認識および図形のイメージ処理を行う文
字認識装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Statement of the Invention] (Field of Industrial Application) The present invention relates to a character recognition device that performs character recognition and graphic image processing.

(従来の技術) 従来から、各種事務処理分野において、帳票を読取って
文字を認識する文字認識装置が広く用いられている。
(Prior Art) Character recognition devices that read forms and recognize characters have been widely used in various business processing fields.

このような文字認識装置においては、帳票を読取って全
体のイメージを得、このイメージを基にして文字を認識
することが行われている。
In such a character recognition device, a document is read to obtain an overall image, and characters are recognized based on this image.

したがって帳票のイメージを出力するイメージ処理を行
うことが可能であり、フォーマット情報でイメージ処理
領域を指定することにより、lPI票の、たとえば図形
のイメージ処理を行うことが可能である。
Therefore, it is possible to perform image processing that outputs an image of a form, and by specifying an image processing area using format information, it is possible to perform image processing of, for example, a graphic image of an IPI form.

しかしながら、このような従来の文字認識装置では、た
とえば文書の任意の箇所に図形が存在する一般文書等の
帳票では、イメージ処理領域をフォーマット情報により
指定することが不可能であり、図形のイメージ処理を行
うことが困難であった。
However, with such conventional character recognition devices, it is impossible to specify the image processing area using format information, for example, in forms such as general documents where graphics exist anywhere in the document. It was difficult to do so.

(発明が解決しようとする問題点) 本発明は上記従来の問題点を解決するためのもので、文
書中の任意の箇所に図形領域が存在する帳票であっても
図形領域のイメージ処理を行うことのできる文字認識装
置を提供することを目的とする。
(Problems to be Solved by the Invention) The present invention is intended to solve the above conventional problems, and performs image processing of graphic areas even in forms where graphic areas exist anywhere in the document. The purpose of this invention is to provide a character recognition device that can perform the following functions.

[発明の構成コ (問題を解決するための手段) 本発明は上記目的を達成するなめに、帳票を読取ってI
!票のイメージを得る読取手段と、この読取手段によっ
て得られた帳票のイメージを格納するイメージ格納手段
と、このイメージ格納手段を走査して文字列イメージお
よび図形イメージを検出しこの検出した文字列イメージ
および図形イメージにそれぞれラベル付けをするラベル
付け手段と、このラベル付け手段によってラベル付けさ
れた文字列イメージに対応するラベルとこの文字列イメ
ージと関連する図形イメージのラベルとを関連付けて格
納するラベルテーブル格納手段と、図形イメージを抽出
するための抽出情報指定手段と、前記イメージ格納手段
に格納されている文字列イメージから文字認識をする文
字認識手段と、この文字認識手段の認識結果から前記抽
出情報指定手段で指定された抽出情報を検索しこの抽出
情報に対応した認識結果が存在するときには前記ラベル
テーブル格納手段を参照して前記抽出情報に対応した認
識結果に関連する図形イメージを前記イメージ格納手段
から読み出して出力するイメージ抽出手段とを具備した
ものである。
[Configuration of the invention (means for solving the problem) In order to achieve the above object, the present invention
! A reading means for obtaining an image of the form, an image storage means for storing the image of the form obtained by the reading means, a character string image and a graphic image by scanning the image storage means, and a character string image detected by scanning the image storage means. and a labeling means for labeling each figure image, and a label table storing a label corresponding to a character string image labeled by this labeling means and a label of a figure image related to this character string image in association with each other. storage means, extraction information specification means for extracting a figure image, character recognition means for character recognition from the character string image stored in the image storage means, and extracting information from the recognition result of the character recognition means. The extracted information specified by the specifying means is searched, and when a recognition result corresponding to this extracted information exists, the image storing means refers to the label table storage means and stores a graphic image related to the recognition result corresponding to the extracted information. and an image extracting means for reading out and outputting the image.

(作用) そして本発明は、文字認識手段の認識結果から、抽出情
報指定手段で指定された抽出情報を検索しこの抽出情報
に対応した認識結果が存在するときにはラベルテーブル
格納手段を参照して抽出情報に対応した認識結果に関連
する図形イメージをイメージ格納手段から読み出して出
力するように構成したので、文書中の任意の箇所に図形
領域が存在する帳票であっても図形領域のイメージ処理
を行うことができる。
(Operation) The present invention searches for extracted information specified by the extracted information specifying means from the recognition result of the character recognition means, and when there is a recognition result corresponding to this extracted information, extracts it by referring to the label table storage means. Since the configuration is configured so that the graphic image related to the recognition result corresponding to the information is read out from the image storage means and output, image processing of the graphic area can be performed even if the document has a graphic area anywhere in the document. be able to.

(実施例) 以下本発明の一実施例を図面に基づいて詳細に説明する
6 第1図は本発明の一実施例の文字認識装置の構成を示す
ブロック図である。
(Embodiment) An embodiment of the present invention will be described below in detail with reference to the drawings.6 Fig. 1 is a block diagram showing the configuration of a character recognition device according to an embodiment of the present invention.

同図において、1は帳票を光学的に操作して読取り帳票
全体のイメージを得る読取部、2は帳票イメージを暫定
的に格納するイメージバッファ、3は格納された帳票イ
メージを走査して文字列イメージおよび図形イメージを
検出し、この検出した文字列イメージおよび図形イメー
ジにそれぞれラベル付けを行うラベル付け部、4はラベ
ル付け孤3によりラベル付けされた文字列イメージに対
応するラベルトこの文字列イメージと関連する図形イメ
ージのラベルとを関連付けて格納するラベルテーブル格
納部、5はフォーマット情報記憶部であり、帳票上に記
入された文字を読取るための各種情報、たとえば読取り
文字のII票上での位置、文字ピッチ、帳票上の文字記
入位置に記入されるべき文字種の指定とともに、所定の
図形イメージを抽出するための抽出情報が記憶されてい
る。この抽出情報を含むフォーマット情報は、帳票の種
類ごとに用意され、予め記憶されている。また6はイメ
ージバッファ2に格納されている文字列イメージから文
字の認識を行う文字認識部、7は文字認識部6により認
識された文字列イメージの認識結果からフォーマット情
報記憶部5に記憶された抽出情報で指定された抽出情報
を検索してこの抽出情報に対応した認識結果が存在する
ときにラベルテーブル格納部4を参照して抽出情報に対
応した認識結果に関連する図形イメージをイメージバッ
ファ2から読出して出力するイメージ抽出部、8はホス
トシステムとのデータの入出力を司どるインターフェイ
ス部、9は各部の制御を司どる制御部である。
In the figure, 1 is a reading unit that optically operates the form to obtain an image of the entire form, 2 is an image buffer that temporarily stores the form image, and 3 is a character string that scans the stored form image. A labeling section 4 detects an image and a figure image and labels the detected character string image and figure image, respectively. A label table storage unit stores labels of related graphic images in association with each other, and 5 is a format information storage unit that stores various information for reading characters written on a form, such as the position of the read character on the II form. , character pitch, and designation of the type of character to be written in the character entry position on the form, as well as extraction information for extracting a predetermined graphic image. Format information including this extracted information is prepared for each type of form and stored in advance. Further, 6 is a character recognition unit that recognizes characters from the character string image stored in the image buffer 2, and 7 is a recognition result of the character string image recognized by the character recognition unit 6, which is stored in the format information storage unit 5. When the extraction information specified by the extraction information is searched and there is a recognition result corresponding to this extraction information, the label table storage unit 4 is referred to and the graphic image related to the recognition result corresponding to the extraction information is stored in the image buffer 2. 8 is an interface section that controls data input/output with the host system; 9 is a control section that controls each section.

このように構成された文字認識装置では、次のようにし
て帳票の文字の認識および図形のイメージ処理の出力が
行われる。
In the character recognition device configured as described above, recognition of characters on a form and output of graphic image processing are performed in the following manner.

第2図は、読取られるべき帳票を示す平面図である。こ
の帳票Pには、横書きの文字列L1、L2、L3および
図形Gが記録されている。
FIG. 2 is a plan view showing a form to be read. On this form P, horizontally written character strings L1, L2, L3 and a figure G are recorded.

そしてこの帳票Pは、まず読取部1により読取られイメ
ージデータに変換される。そして変換されたイメージデ
ータは暫定的にイメージバッファ2に格納される。この
後、ラベル付け部3によりイメージバッファ2に格納さ
れたイメージデータを走査して文字列イメージおよび図
形イメージを検出し、これらの文字列イメージおよび図
形イメージにそれぞれラベル付けを行う、このラベル付
けは、第3図に示すように、第2図に示した帳票Pの文
字列L1、L2、L3にラベル■、■、■が付けられ、
図形Gにラベル■が付けられる0次に、ラベル付けされ
た文字列イメージに対応するラベルとこの文字列イメー
ジと関連する図形イメージのラベルとを関連付けてラベ
ルテーブルを作成しラベルテーブル格納部4に格納する
。上述のラベルテーブルは、第4図に示すように、各文
字列イメージに対応するラベル■、■、■が格納され、
この場合ではラベル■の文字列イメージに関連する図形
イメージのラベルである属性ラベル■が対応して格納さ
れている。
This form P is first read by the reading section 1 and converted into image data. The converted image data is then temporarily stored in the image buffer 2. Thereafter, the labeling unit 3 scans the image data stored in the image buffer 2 to detect character string images and graphic images, and labels these character string images and graphic images respectively. , as shown in FIG. 3, labels ■, ■, ■ are attached to the character strings L1, L2, L3 of the form P shown in FIG.
A label ■ is attached to the figure G. Next, a label table is created by associating the label corresponding to the labeled character string image with the label of the figure image related to this character string image, and the label table is stored in the label table storage unit 4. Store. As shown in FIG. 4, the above-mentioned label table stores labels ■, ■, ■ corresponding to each character string image,
In this case, an attribute label ■, which is a label of a graphic image related to a character string image of label ■, is stored in correspondence.

フォーマット情報記憶部5に記憶されている抽出情報は
、第5図に示すように、対象とする文字あるいは文字列
であるキーワードにとして「A図」(Aは任意の英字)
と指定されており、また「A図」から所定の距離内の図
形を対象とするように指定されている。
As shown in FIG. 5, the extracted information stored in the format information storage unit 5 is a keyword "A figure" (A is any alphabetic character), which is a target character or character string.
It is specified that figures within a predetermined distance from "Figure A" are to be targeted.

この後、イメージ抽出部7は文字認識部6によりイメー
ジバッファ2の文字列イメージを走査して文字の認識を
行う、そして、文字認識部6により認識された文字列イ
メージの文字の認識結果の中からフォーマット情報記憶
部5がら読出した抽、弘情報(キーワードK)を検索し
、この抽出情報に対応した認識結果(A図)が存在する
ときに、ラベルテーブル格納部4を参照して抽出情報に
対応した認識結果に関連する(属性ラベルが存在する)
図形イメージをイメージバッファ2から読出してイメー
ジ処理し出力する。
After that, the image extracting unit 7 uses the character recognition unit 6 to scan the character string image in the image buffer 2 to recognize the characters, and the character recognition result of the character string image recognized by the character recognition unit 6 is The extraction information (keyword K) read from the format information storage unit 5 is searched, and when there is a recognition result (Figure A) corresponding to this extraction information, the label table storage unit 4 is referred to and the extraction information is retrieved. related to the recognition result corresponding to (attribute label exists)
A graphic image is read out from the image buffer 2, processed, and output.

したがって、この実施例では、文書の任意の箇所に図形
が存在する一般文書等の帳票であっても、イメージ処理
を行う図形イメージを抽出情報および文字列イメージの
文字認識の結果および抽出情報に基づいてラベルテーブ
ルを参照して図形イメージを抽出しイメージ処理の出力
を行うことが可能である。
Therefore, in this embodiment, even if it is a form such as a general document in which a figure exists anywhere in the document, the figure image to be subjected to image processing is based on the extraction information, the result of character recognition of the character string image, and the extraction information. It is possible to extract a graphic image by referring to the label table and output the image processing.

[発明の効果] 以上説明したように本発明の文字認識装置は、文字認識
手段の認識結果から、抽出情報指定手段で指定された抽
出情報を検索しこの抽出情報に対応した認識結果が存在
するときにはラベルテーブル格納手段を参照して抽出情
報に対応した認識結果に関連する図形イメージをイメー
ジ格納手段から読み出して出力するように構成したので
、文書中の任意の箇所に図形領域が存在する帳票であっ
ても図形領域のイメージ処理を行うことが可能である。
[Effects of the Invention] As explained above, the character recognition device of the present invention searches for extracted information specified by the extracted information specifying means from the recognition results of the character recognition means, and there exists a recognition result corresponding to this extracted information. Since the configuration is configured so that the graphic image related to the recognition result corresponding to the extracted information is read from the image storage means and output by referring to the label table storage means, it is possible to read a graphic image related to the recognition result corresponding to the extracted information from the image storage means and output it. Even if there is, it is possible to perform image processing on the graphic area.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例の文字認識装置の構成を示す
ブロック図、第2図は読取るべきvA票を説明するため
の平面図、第3図はラベル付け部における第2図のラベ
ル付けを説明するための図、第4図はラベルテーブルを
説明するための図、第5図はキーワードを説明するため
の図である。 1・・・・・・・・・読取部 2・・・・・・・・・イメージバッファ3・・・・・・
・・・ラベル付け部 4・・・・・・・・・ラベルテーブル格納部5・・・・
・・・・・フォーマット情報記憶部6・・・・・・・・
・文字認識部 7・・・・・・・・・イメージ抽出部 用願人      株式会社 東芝 代理人 弁理士  須 山 佐 − 第2図 箆4図 第5L
Fig. 1 is a block diagram showing the configuration of a character recognition device according to an embodiment of the present invention, Fig. 2 is a plan view for explaining a vA slip to be read, and Fig. 3 is a label shown in Fig. 2 in the labeling section. FIG. 4 is a diagram for explaining the label table, and FIG. 5 is a diagram for explaining keywords. 1...Reading unit 2...Image buffer 3...
... Labeling section 4 ... Label table storage section 5 ...
...Format information storage unit 6...
・Character recognition section 7...Image extraction section Applicant: Toshiba Corporation Patent attorney Satoshi Suyama - Figure 2, Figure 4, Figure 5L

Claims (1)

【特許請求の範囲】[Claims] (1)帳票を読取つて帳票のイメージを得る読取手段と
、この読取手段によって得られた帳票のイメージを格納
するイメージ格納手段と、このイメージ格納手段を走査
して文字列イメージおよび図形イメージを検出しこの検
出した文字列イメージおよび図形イメージにそれぞれラ
ベル付けをするラベル付け手段と、このラベル付け手段
によってラベル付けされた文字列イメージに対応するラ
ベルとこの文字列イメージと関連する図形イメージのラ
ベルとを関連付けて格納するラベルテーブル格納手段と
、図形イメージを抽出するための抽出情報指定手段と、
前記イメージ格納手段に格納されている文字列イメージ
から文字認識をする文字認識手段と、この文字認識手段
の認識結果から前記抽出情報指定手段で指定された抽出
情報を検索しこの抽出情報に対応した認識結果が存在す
るときには前記ラベルテーブル格納手段を参照して前記
抽出情報に対応した認識結果に関連する図形イメージを
前記イメージ格納手段から読み出して出力するイメージ
抽出手段とを具備したことを特徴とする文字認識装置。
(1) A reading means that reads a form to obtain an image of the form, an image storage means that stores the image of the form obtained by this reading means, and a character string image and a graphic image are detected by scanning this image storage means. A labeling means for labeling each of the detected character string image and figure image, a label corresponding to the character string image labeled by this labeling means, and a label of the figure image related to this character string image. a label table storage means for storing the images in association with each other; an extraction information specifying means for extracting the graphic image;
a character recognition means for character recognition from a character string image stored in the image storage means; and a character recognition means for searching the extracted information specified by the extraction information specifying means from the recognition result of the character recognition means and corresponding to the extracted information. The present invention is characterized by comprising an image extracting means that refers to the label table storage means when a recognition result exists, reads out from the image storage means a graphic image related to the recognition result corresponding to the extracted information, and outputs it. Character recognition device.
JP61311922A 1986-12-29 1986-12-29 Character recognition device Pending JPS63167991A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61311922A JPS63167991A (en) 1986-12-29 1986-12-29 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61311922A JPS63167991A (en) 1986-12-29 1986-12-29 Character recognition device

Publications (1)

Publication Number Publication Date
JPS63167991A true JPS63167991A (en) 1988-07-12

Family

ID=18023038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61311922A Pending JPS63167991A (en) 1986-12-29 1986-12-29 Character recognition device

Country Status (1)

Country Link
JP (1) JPS63167991A (en)

Similar Documents

Publication Publication Date Title
US6671684B1 (en) Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document
JP4461769B2 (en) Document retrieval / browsing technique and document retrieval / browsing device
JPH11161681A (en) Device and method for displaying retrieval result, and computer-readable recording medium where series of instructions are recorded to output retrieval result
JPH0750483B2 (en) How to store additional information about document images
US6510243B1 (en) Image processing apparatus for managing image data
JP2005018678A (en) Form data input processing device, form data input processing method, and program
US5675672A (en) Two dimensional linker for character string data
US8208726B2 (en) Method and system for optical character recognition using image clustering
JP2008022159A (en) Document processing apparatus and document processing method
JP2000322417A (en) Device and method for filing image and storage medium
US5854860A (en) Image filing apparatus having a character recognition function
CN116092108A (en) Method, system and storage medium for generating PDF file by scanning entity document
JP4136282B2 (en) Image processing apparatus, image processing method, and storage medium
JPS63167991A (en) Character recognition device
JP4480109B2 (en) Image management apparatus and image management method
JPH0934903A (en) File retrieval device
JP4143245B2 (en) Image processing method and apparatus, and storage medium
JP2009182530A (en) Business processing execution support device
JP2004280514A (en) Pdf file and system for forming pdf file
JPS6154569A (en) Document poicture processing system
JP3412998B2 (en) Image processing apparatus and method
JPS62134765A (en) Electronic retrieving method for dictionary of chinese character explained in japanese
JPS638988A (en) Character reader
JP2002222195A (en) Document selection device and method therefor
JPH06149889A (en) Electronic filing system