JPS63167991A - Character recognition device - Google Patents
Character recognition deviceInfo
- Publication number
- JPS63167991A JPS63167991A JP61311922A JP31192286A JPS63167991A JP S63167991 A JPS63167991 A JP S63167991A JP 61311922 A JP61311922 A JP 61311922A JP 31192286 A JP31192286 A JP 31192286A JP S63167991 A JPS63167991 A JP S63167991A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- graphic
- recognition result
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 238000002372 labelling Methods 0.000 claims abstract description 11
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
Description
【発明の詳細な説明】
[発明の口約]
(産業上の利用分野)
本発明は文字の認識および図形のイメージ処理を行う文
字認識装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Statement of the Invention] (Field of Industrial Application) The present invention relates to a character recognition device that performs character recognition and graphic image processing.
(従来の技術)
従来から、各種事務処理分野において、帳票を読取って
文字を認識する文字認識装置が広く用いられている。(Prior Art) Character recognition devices that read forms and recognize characters have been widely used in various business processing fields.
このような文字認識装置においては、帳票を読取って全
体のイメージを得、このイメージを基にして文字を認識
することが行われている。In such a character recognition device, a document is read to obtain an overall image, and characters are recognized based on this image.
したがって帳票のイメージを出力するイメージ処理を行
うことが可能であり、フォーマット情報でイメージ処理
領域を指定することにより、lPI票の、たとえば図形
のイメージ処理を行うことが可能である。Therefore, it is possible to perform image processing that outputs an image of a form, and by specifying an image processing area using format information, it is possible to perform image processing of, for example, a graphic image of an IPI form.
しかしながら、このような従来の文字認識装置では、た
とえば文書の任意の箇所に図形が存在する一般文書等の
帳票では、イメージ処理領域をフォーマット情報により
指定することが不可能であり、図形のイメージ処理を行
うことが困難であった。However, with such conventional character recognition devices, it is impossible to specify the image processing area using format information, for example, in forms such as general documents where graphics exist anywhere in the document. It was difficult to do so.
(発明が解決しようとする問題点)
本発明は上記従来の問題点を解決するためのもので、文
書中の任意の箇所に図形領域が存在する帳票であっても
図形領域のイメージ処理を行うことのできる文字認識装
置を提供することを目的とする。(Problems to be Solved by the Invention) The present invention is intended to solve the above conventional problems, and performs image processing of graphic areas even in forms where graphic areas exist anywhere in the document. The purpose of this invention is to provide a character recognition device that can perform the following functions.
[発明の構成コ
(問題を解決するための手段)
本発明は上記目的を達成するなめに、帳票を読取ってI
!票のイメージを得る読取手段と、この読取手段によっ
て得られた帳票のイメージを格納するイメージ格納手段
と、このイメージ格納手段を走査して文字列イメージお
よび図形イメージを検出しこの検出した文字列イメージ
および図形イメージにそれぞれラベル付けをするラベル
付け手段と、このラベル付け手段によってラベル付けさ
れた文字列イメージに対応するラベルとこの文字列イメ
ージと関連する図形イメージのラベルとを関連付けて格
納するラベルテーブル格納手段と、図形イメージを抽出
するための抽出情報指定手段と、前記イメージ格納手段
に格納されている文字列イメージから文字認識をする文
字認識手段と、この文字認識手段の認識結果から前記抽
出情報指定手段で指定された抽出情報を検索しこの抽出
情報に対応した認識結果が存在するときには前記ラベル
テーブル格納手段を参照して前記抽出情報に対応した認
識結果に関連する図形イメージを前記イメージ格納手段
から読み出して出力するイメージ抽出手段とを具備した
ものである。[Configuration of the invention (means for solving the problem) In order to achieve the above object, the present invention
! A reading means for obtaining an image of the form, an image storage means for storing the image of the form obtained by the reading means, a character string image and a graphic image by scanning the image storage means, and a character string image detected by scanning the image storage means. and a labeling means for labeling each figure image, and a label table storing a label corresponding to a character string image labeled by this labeling means and a label of a figure image related to this character string image in association with each other. storage means, extraction information specification means for extracting a figure image, character recognition means for character recognition from the character string image stored in the image storage means, and extracting information from the recognition result of the character recognition means. The extracted information specified by the specifying means is searched, and when a recognition result corresponding to this extracted information exists, the image storing means refers to the label table storage means and stores a graphic image related to the recognition result corresponding to the extracted information. and an image extracting means for reading out and outputting the image.
(作用)
そして本発明は、文字認識手段の認識結果から、抽出情
報指定手段で指定された抽出情報を検索しこの抽出情報
に対応した認識結果が存在するときにはラベルテーブル
格納手段を参照して抽出情報に対応した認識結果に関連
する図形イメージをイメージ格納手段から読み出して出
力するように構成したので、文書中の任意の箇所に図形
領域が存在する帳票であっても図形領域のイメージ処理
を行うことができる。(Operation) The present invention searches for extracted information specified by the extracted information specifying means from the recognition result of the character recognition means, and when there is a recognition result corresponding to this extracted information, extracts it by referring to the label table storage means. Since the configuration is configured so that the graphic image related to the recognition result corresponding to the information is read out from the image storage means and output, image processing of the graphic area can be performed even if the document has a graphic area anywhere in the document. be able to.
(実施例)
以下本発明の一実施例を図面に基づいて詳細に説明する
6
第1図は本発明の一実施例の文字認識装置の構成を示す
ブロック図である。(Embodiment) An embodiment of the present invention will be described below in detail with reference to the drawings.6 Fig. 1 is a block diagram showing the configuration of a character recognition device according to an embodiment of the present invention.
同図において、1は帳票を光学的に操作して読取り帳票
全体のイメージを得る読取部、2は帳票イメージを暫定
的に格納するイメージバッファ、3は格納された帳票イ
メージを走査して文字列イメージおよび図形イメージを
検出し、この検出した文字列イメージおよび図形イメー
ジにそれぞれラベル付けを行うラベル付け部、4はラベ
ル付け孤3によりラベル付けされた文字列イメージに対
応するラベルトこの文字列イメージと関連する図形イメ
ージのラベルとを関連付けて格納するラベルテーブル格
納部、5はフォーマット情報記憶部であり、帳票上に記
入された文字を読取るための各種情報、たとえば読取り
文字のII票上での位置、文字ピッチ、帳票上の文字記
入位置に記入されるべき文字種の指定とともに、所定の
図形イメージを抽出するための抽出情報が記憶されてい
る。この抽出情報を含むフォーマット情報は、帳票の種
類ごとに用意され、予め記憶されている。また6はイメ
ージバッファ2に格納されている文字列イメージから文
字の認識を行う文字認識部、7は文字認識部6により認
識された文字列イメージの認識結果からフォーマット情
報記憶部5に記憶された抽出情報で指定された抽出情報
を検索してこの抽出情報に対応した認識結果が存在する
ときにラベルテーブル格納部4を参照して抽出情報に対
応した認識結果に関連する図形イメージをイメージバッ
ファ2から読出して出力するイメージ抽出部、8はホス
トシステムとのデータの入出力を司どるインターフェイ
ス部、9は各部の制御を司どる制御部である。In the figure, 1 is a reading unit that optically operates the form to obtain an image of the entire form, 2 is an image buffer that temporarily stores the form image, and 3 is a character string that scans the stored form image. A labeling section 4 detects an image and a figure image and labels the detected character string image and figure image, respectively. A label table storage unit stores labels of related graphic images in association with each other, and 5 is a format information storage unit that stores various information for reading characters written on a form, such as the position of the read character on the II form. , character pitch, and designation of the type of character to be written in the character entry position on the form, as well as extraction information for extracting a predetermined graphic image. Format information including this extracted information is prepared for each type of form and stored in advance. Further, 6 is a character recognition unit that recognizes characters from the character string image stored in the image buffer 2, and 7 is a recognition result of the character string image recognized by the character recognition unit 6, which is stored in the format information storage unit 5. When the extraction information specified by the extraction information is searched and there is a recognition result corresponding to this extraction information, the label table storage unit 4 is referred to and the graphic image related to the recognition result corresponding to the extraction information is stored in the image buffer 2. 8 is an interface section that controls data input/output with the host system; 9 is a control section that controls each section.
このように構成された文字認識装置では、次のようにし
て帳票の文字の認識および図形のイメージ処理の出力が
行われる。In the character recognition device configured as described above, recognition of characters on a form and output of graphic image processing are performed in the following manner.
第2図は、読取られるべき帳票を示す平面図である。こ
の帳票Pには、横書きの文字列L1、L2、L3および
図形Gが記録されている。FIG. 2 is a plan view showing a form to be read. On this form P, horizontally written character strings L1, L2, L3 and a figure G are recorded.
そしてこの帳票Pは、まず読取部1により読取られイメ
ージデータに変換される。そして変換されたイメージデ
ータは暫定的にイメージバッファ2に格納される。この
後、ラベル付け部3によりイメージバッファ2に格納さ
れたイメージデータを走査して文字列イメージおよび図
形イメージを検出し、これらの文字列イメージおよび図
形イメージにそれぞれラベル付けを行う、このラベル付
けは、第3図に示すように、第2図に示した帳票Pの文
字列L1、L2、L3にラベル■、■、■が付けられ、
図形Gにラベル■が付けられる0次に、ラベル付けされ
た文字列イメージに対応するラベルとこの文字列イメー
ジと関連する図形イメージのラベルとを関連付けてラベ
ルテーブルを作成しラベルテーブル格納部4に格納する
。上述のラベルテーブルは、第4図に示すように、各文
字列イメージに対応するラベル■、■、■が格納され、
この場合ではラベル■の文字列イメージに関連する図形
イメージのラベルである属性ラベル■が対応して格納さ
れている。This form P is first read by the reading section 1 and converted into image data. The converted image data is then temporarily stored in the image buffer 2. Thereafter, the labeling unit 3 scans the image data stored in the image buffer 2 to detect character string images and graphic images, and labels these character string images and graphic images respectively. , as shown in FIG. 3, labels ■, ■, ■ are attached to the character strings L1, L2, L3 of the form P shown in FIG.
A label ■ is attached to the figure G. Next, a label table is created by associating the label corresponding to the labeled character string image with the label of the figure image related to this character string image, and the label table is stored in the label table storage unit 4. Store. As shown in FIG. 4, the above-mentioned label table stores labels ■, ■, ■ corresponding to each character string image,
In this case, an attribute label ■, which is a label of a graphic image related to a character string image of label ■, is stored in correspondence.
フォーマット情報記憶部5に記憶されている抽出情報は
、第5図に示すように、対象とする文字あるいは文字列
であるキーワードにとして「A図」(Aは任意の英字)
と指定されており、また「A図」から所定の距離内の図
形を対象とするように指定されている。As shown in FIG. 5, the extracted information stored in the format information storage unit 5 is a keyword "A figure" (A is any alphabetic character), which is a target character or character string.
It is specified that figures within a predetermined distance from "Figure A" are to be targeted.
この後、イメージ抽出部7は文字認識部6によりイメー
ジバッファ2の文字列イメージを走査して文字の認識を
行う、そして、文字認識部6により認識された文字列イ
メージの文字の認識結果の中からフォーマット情報記憶
部5がら読出した抽、弘情報(キーワードK)を検索し
、この抽出情報に対応した認識結果(A図)が存在する
ときに、ラベルテーブル格納部4を参照して抽出情報に
対応した認識結果に関連する(属性ラベルが存在する)
図形イメージをイメージバッファ2から読出してイメー
ジ処理し出力する。After that, the image extracting unit 7 uses the character recognition unit 6 to scan the character string image in the image buffer 2 to recognize the characters, and the character recognition result of the character string image recognized by the character recognition unit 6 is The extraction information (keyword K) read from the format information storage unit 5 is searched, and when there is a recognition result (Figure A) corresponding to this extraction information, the label table storage unit 4 is referred to and the extraction information is retrieved. related to the recognition result corresponding to (attribute label exists)
A graphic image is read out from the image buffer 2, processed, and output.
したがって、この実施例では、文書の任意の箇所に図形
が存在する一般文書等の帳票であっても、イメージ処理
を行う図形イメージを抽出情報および文字列イメージの
文字認識の結果および抽出情報に基づいてラベルテーブ
ルを参照して図形イメージを抽出しイメージ処理の出力
を行うことが可能である。Therefore, in this embodiment, even if it is a form such as a general document in which a figure exists anywhere in the document, the figure image to be subjected to image processing is based on the extraction information, the result of character recognition of the character string image, and the extraction information. It is possible to extract a graphic image by referring to the label table and output the image processing.
[発明の効果]
以上説明したように本発明の文字認識装置は、文字認識
手段の認識結果から、抽出情報指定手段で指定された抽
出情報を検索しこの抽出情報に対応した認識結果が存在
するときにはラベルテーブル格納手段を参照して抽出情
報に対応した認識結果に関連する図形イメージをイメー
ジ格納手段から読み出して出力するように構成したので
、文書中の任意の箇所に図形領域が存在する帳票であっ
ても図形領域のイメージ処理を行うことが可能である。[Effects of the Invention] As explained above, the character recognition device of the present invention searches for extracted information specified by the extracted information specifying means from the recognition results of the character recognition means, and there exists a recognition result corresponding to this extracted information. Since the configuration is configured so that the graphic image related to the recognition result corresponding to the extracted information is read from the image storage means and output by referring to the label table storage means, it is possible to read a graphic image related to the recognition result corresponding to the extracted information from the image storage means and output it. Even if there is, it is possible to perform image processing on the graphic area.
第1図は本発明の一実施例の文字認識装置の構成を示す
ブロック図、第2図は読取るべきvA票を説明するため
の平面図、第3図はラベル付け部における第2図のラベ
ル付けを説明するための図、第4図はラベルテーブルを
説明するための図、第5図はキーワードを説明するため
の図である。
1・・・・・・・・・読取部
2・・・・・・・・・イメージバッファ3・・・・・・
・・・ラベル付け部
4・・・・・・・・・ラベルテーブル格納部5・・・・
・・・・・フォーマット情報記憶部6・・・・・・・・
・文字認識部
7・・・・・・・・・イメージ抽出部
用願人 株式会社 東芝
代理人 弁理士 須 山 佐 −
第2図
箆4図
第5LFig. 1 is a block diagram showing the configuration of a character recognition device according to an embodiment of the present invention, Fig. 2 is a plan view for explaining a vA slip to be read, and Fig. 3 is a label shown in Fig. 2 in the labeling section. FIG. 4 is a diagram for explaining the label table, and FIG. 5 is a diagram for explaining keywords. 1...Reading unit 2...Image buffer 3...
... Labeling section 4 ... Label table storage section 5 ...
...Format information storage unit 6...
・Character recognition section 7...Image extraction section Applicant: Toshiba Corporation Patent attorney Satoshi Suyama - Figure 2, Figure 4, Figure 5L
Claims (1)
、この読取手段によって得られた帳票のイメージを格納
するイメージ格納手段と、このイメージ格納手段を走査
して文字列イメージおよび図形イメージを検出しこの検
出した文字列イメージおよび図形イメージにそれぞれラ
ベル付けをするラベル付け手段と、このラベル付け手段
によってラベル付けされた文字列イメージに対応するラ
ベルとこの文字列イメージと関連する図形イメージのラ
ベルとを関連付けて格納するラベルテーブル格納手段と
、図形イメージを抽出するための抽出情報指定手段と、
前記イメージ格納手段に格納されている文字列イメージ
から文字認識をする文字認識手段と、この文字認識手段
の認識結果から前記抽出情報指定手段で指定された抽出
情報を検索しこの抽出情報に対応した認識結果が存在す
るときには前記ラベルテーブル格納手段を参照して前記
抽出情報に対応した認識結果に関連する図形イメージを
前記イメージ格納手段から読み出して出力するイメージ
抽出手段とを具備したことを特徴とする文字認識装置。(1) A reading means that reads a form to obtain an image of the form, an image storage means that stores the image of the form obtained by this reading means, and a character string image and a graphic image are detected by scanning this image storage means. A labeling means for labeling each of the detected character string image and figure image, a label corresponding to the character string image labeled by this labeling means, and a label of the figure image related to this character string image. a label table storage means for storing the images in association with each other; an extraction information specifying means for extracting the graphic image;
a character recognition means for character recognition from a character string image stored in the image storage means; and a character recognition means for searching the extracted information specified by the extraction information specifying means from the recognition result of the character recognition means and corresponding to the extracted information. The present invention is characterized by comprising an image extracting means that refers to the label table storage means when a recognition result exists, reads out from the image storage means a graphic image related to the recognition result corresponding to the extracted information, and outputs it. Character recognition device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61311922A JPS63167991A (en) | 1986-12-29 | 1986-12-29 | Character recognition device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61311922A JPS63167991A (en) | 1986-12-29 | 1986-12-29 | Character recognition device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63167991A true JPS63167991A (en) | 1988-07-12 |
Family
ID=18023038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61311922A Pending JPS63167991A (en) | 1986-12-29 | 1986-12-29 | Character recognition device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63167991A (en) |
-
1986
- 1986-12-29 JP JP61311922A patent/JPS63167991A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6671684B1 (en) | Method and apparatus for simultaneous highlighting of a physical version of a document and an electronic version of a document | |
JP4461769B2 (en) | Document retrieval / browsing technique and document retrieval / browsing device | |
JPH11161681A (en) | Device and method for displaying retrieval result, and computer-readable recording medium where series of instructions are recorded to output retrieval result | |
JPH0750483B2 (en) | How to store additional information about document images | |
US6510243B1 (en) | Image processing apparatus for managing image data | |
JP2005018678A (en) | Form data input processing device, form data input processing method, and program | |
US5675672A (en) | Two dimensional linker for character string data | |
US8208726B2 (en) | Method and system for optical character recognition using image clustering | |
JP2008022159A (en) | Document processing apparatus and document processing method | |
JP2000322417A (en) | Device and method for filing image and storage medium | |
US5854860A (en) | Image filing apparatus having a character recognition function | |
CN116092108A (en) | Method, system and storage medium for generating PDF file by scanning entity document | |
JP4136282B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JPS63167991A (en) | Character recognition device | |
JP4480109B2 (en) | Image management apparatus and image management method | |
JPH0934903A (en) | File retrieval device | |
JP4143245B2 (en) | Image processing method and apparatus, and storage medium | |
JP2009182530A (en) | Business processing execution support device | |
JP2004280514A (en) | Pdf file and system for forming pdf file | |
JPS6154569A (en) | Document poicture processing system | |
JP3412998B2 (en) | Image processing apparatus and method | |
JPS62134765A (en) | Electronic retrieving method for dictionary of chinese character explained in japanese | |
JPS638988A (en) | Character reader | |
JP2002222195A (en) | Document selection device and method therefor | |
JPH06149889A (en) | Electronic filing system |