JPH02123486A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPH02123486A
JPH02123486A JP63277930A JP27793088A JPH02123486A JP H02123486 A JPH02123486 A JP H02123486A JP 63277930 A JP63277930 A JP 63277930A JP 27793088 A JP27793088 A JP 27793088A JP H02123486 A JPH02123486 A JP H02123486A
Authority
JP
Japan
Prior art keywords
character
color
reading
form image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63277930A
Other languages
Japanese (ja)
Inventor
Hidenori Yamamoto
山本 秀範
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63277930A priority Critical patent/JPH02123486A/en
Publication of JPH02123486A publication Critical patent/JPH02123486A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To improve the efficiency of character reading work from a document by setting up the position of a reading field and the format and sort of a character recorded in the position on the basis of information recorded in a document at the time of supplying the document to character reading processing. CONSTITUTION:In case of executing character reading processing, a document 30 is optically scanned by a color scanner 12, an output from the scanner 12 is quantized by a quantizing part 13 and stored in a sheet buffer 14. At that time, the density information of respective color components (red, green and blue) of each picture element is expressed by 8 bits and stored. A control part 11 outputs color specification information stored in a reading field for recording operation defining data to a color detecting part 15 and reads out data stored in the buffer 14 in each picture element. The color detecting part 15 detects whether the read data are specified color data or not and a character frame detecting part 17 finds out a picture element position based upon the detected result and stores the position in a built-in memory. The, the image of each color part is developed by a command from the control part 11.

Description

【発明の詳細な説明】[Detailed description of the invention]

[発明の目的] (産業上の利用分野) 本発明は、帳票に記録された文字の読取を行なう光学的
文字読取装置に関する。 (従来の技術) 一般に、光学的文字読取装置では、読取処理の対象とす
る帳票を光学的に走査して帳票イメージを検出する。光
学的文字読取装置は、この帳票イメージからフォーマッ
トコントロール情報(以下、FC情報と略称する)と呼
ばれる読取制御情報に基づいて文字認識処理を行なう。 FC情報には、文字が記録される読取フィールドの位置
を示す情報、この読取フィールドに記録される文字の字
体・字種を示す情報1文字認識結果をチエツクするため
のチエツクコードを示す情報等が設定される。 光学的文字読取装置は、このFC情報に基づいて例えば
認識処理部において文字認識処理を行なう。認識処理部
では、帳票イメージから読取−ノイールドの位置を示す
情報によって指定される部分のイメージ、つまり文字パ
ターンを読出して1文字毎に切出しを行なう。そして、
読取フィールドに対応する字体・字種を示す情報によっ
て指定される文字認識用の辞書と、切出された文字パタ
ーンとを照合することによって文字の認識を行なう。 こうして得られた認識結果は、チエツクコードによって
正しく認識されたか否かチエツクされる。 このチエツクコードは、帳票に記録されている文字が複
数の数字の場合、この数字の例えば合計を記録しておく
ものである。そ(7て、文字認識処理の結果得られた数
字の合計と、このチェックコドとして記録された数字と
の比較を行ない、一致すれば正しく文字(数字)の読取
りが行なわれたと判断するものである。 このような、文字認識処理に用いられるFC情報は、一
般にはFC定義用シー1・を光学的文字読取装置によっ
て読取らけることによ7って設定している。このFC定
義用シートには、読取対象とする帳票の読取フィールド
位置、この読取フィールドに記録される文字の字体・字
種を示す情報を含んだ各種読取制御に用いられる情報が
オペ1ノータによって記録される。光学的文字読取装置
は、FC定義用シートに記録された各種情報に基づいて
認識処理を行なうために用いられるFC情報を生成する
。 (発明が解決しようとする課題) このような、文字認識処理を制御するだめのFC情報は
、帳票のフォーマットによってそれぞれ設定しなりれば
ならない。このため、読取処理の対象とする帳票に応じ
て、オペレータは、FC定義用シートに各種FC情報を
設定するための情報を記入するという作業が必要となり
、非常に煩わI7いという問題があった。 本発明は前記のような点に鑑みてなされたもので、帳票
に記録された文字の認識処理を行なう際に必要な読取制
御情報(FC情報)を、読取処理の勾象とする帳票に応
じて予め設定することなく文字の読取りを行なうことが
i’iJ能な光学的文字読取装置を提供することを]」
的とする。 [発明の構成] (課題を解決するだめの手段) 本発明は、少なくとも一つの読取フィールドがカラー印
刷され、同フィールドには、その印刷色に固有の字体・
字種の文字が記録される帳票を光学的に走査I7、各画
素の色情報を含む第1の帳票イメー ジを検出して帳票
イメージ格納手段に格納する。そして、帳票イメージ格
納手段に格納された第1の帳票イメージから、予め設定
された複数の色に一ついて各色毎にその色からなる第2
の帳票イメージを検出し、この第2の帳票イメージから
その色による読取フィールドの位置を検出する。 こうして検出された読取フィールド位置をもとに、同フ
ィールドに記録されている同フィールドの色に固有な字
体・字種の文字パターンを前記第1の帳票イメージから
切出し、切lidされた文字バタンについて、この文字
パターンに固有の字体・字種の情報に基づいて認識処理
を行なうように構成するものである。 (作用) このようにして構成される光学的文字読取装置では、帳
票を文字読取処理に供する際に、この帳票における読取
フィールドの位置、及び同フィルドに記録される文字の
字体・字種等を示す読取処理のための情報が、帳票に記
録された情報(カラー印刷された読取フィールド等)に
基づいて設定される。 (実施例) 以下、図面を参照して本発明の一実施例を説明する。第
1図は、同実施例に係わる光学的文字読取装置の構成を
示すブロック図である。第1図に示す光学的文字読取装
置は、図示せぬホストコンピュータの制御のもとに、帳
票に記録された文字等の読取処理を行なう。ホストコン
ピュータは、システム全体を制御するものであり、制御
部11に対して文字認識処理の起動等の指示を与える。 制御部11は、ホストコンピュータから与えられる指示
に従い、後述する各部の制御を行なうことによって帳票
に記録された文字の読取りを行なう。 カラースキャナ12は、読取対象とする帳票を搬送させ
ながら光学的に走査する。カラースキャナ12には、量
子化部13が接続され、カラースキャナ12により検出
された信号を多値のデジタル信号に量子化しシートバッ
ファ14に格納する。シートバッファ14は、読取帳票
の各画素位置における色成分(例えば赤、緑、青)の濃
度情報(第1の帳票イメージ)を格納する。シートバッ
ファ14に格納されたデータは、制御部11の指示に応
じて色検出部15、または文字切出し部16に読出され
る。色検出部15は、制御部11から与えられる色指定
情報に応じて、各画素位置のデータが指定された色デー
タであるか否かを検出する。色検出部15には、文字枠
検出部17が接続されている。文字枠検出部17は、色
検出部15による各画素位置の色データの検出結果に応
じて、内部に設けられているメモリ(図示せず)に、制
御部11により指定された色からなる二次元パターン(
第2の帳票イメージ)を展開する。そして、文字枠検出
部17は、メモリに展開された帳票イメージから、読取
フィールドを示す枠を検出し、この枠の帳票上における
位置情報(座標情報)を文字切出し部16に出力する。 文字切出し部16は、シートバッファ14から文字枠検
出部17からの位置情報によって指定される部分のイメ
ージデータ(文字パターン)を読出し、2値のデータに
変換して内部に設けられているメモリに格納する。文字
切出し部16は、イメージデータから1文字毎の文字パ
ターンを切出し、認識部18に出力する。また、認識部
18には、字体・字種指定情報格納部19が接続されて
いる。字体・字種指定情報格納部19は、制御部11か
らの色指定情報によって、これに対応する字体・字種を
指定する字体・字種コードを認識部18に出力する。認
識部18は、字体・字種コードによって指定される辞書
データを辞書格納部20から読出して、文字切出し部1
6からの文字パターンとの照合を行なう。辞書格納部2
0には、字体1字種毎に分類された文字認識処理を行な
う際の基準文字パターンとなる辞書データが格納されて
いる。認識部18における文字認識結果は、演算チエツ
ク部21に保持される。演算チエツク部21は、後述す
る演算定義用データと、一般の文字認識データとを分類
して格納する。演算チエツク部21は、演算定義用デー
タに基づいて、一般の文字認識データが正しく認識され
たものか否かをチエツクする。こうして得られた文字読
取結果は、制御部11を介してホストコンピュータに出
力される。 次に、同実施例の動作を説明する。 まず、同実施例における光学的文字読取装置において、
文字読取処理が行なわれる帳票について説明する。光学
的文字読取装置によって、読取処理が行なわれる帳票3
0は、第2図に示すように、4つの読取フィールド31
〜34と、非読取対象領域85、 Hが設けられている
。読取フィールド81〜84は、帳票30の左上からF
1〜F4のカウント番号が付けられている。また、読取
フィールド31を示す枠は赤色で印刷され、読取フィー
ルド32.84を示す枠は青色で印刷され、読取フィー
ルド33を示す枠は紫色で印刷されている。非読取対象
領域85゜8Bには、読取対象としない帳票に必要な記
載事項、または絵等が記録される。 また、読取フィールド31〜34は、枠の印刷色に応じ
て記録される文字の字体・字種が予め規定されている。 ここでは、青色枠の読取フィールド32゜84にはJI
S−Bフォントによる数字、紫色枠の読取フィールド3
3には手書き文字による英数字、赤色枠の読取フィール
ド31にはJ I S−Bフォントによる英数字が記録
されるものとする。また、読取フィールド(赤色枠> 
31には、演算定義用データが記録される。この演算定
義用データは、例えばrF2−10>6+F3−6−F
4−7Jという演算式が記録されるものとする。この演
算定祝用デー タは、読取フィールド32に記録された
左から10桁1」からの6文字と読取フィールド33の
6文字とを合t1しまた結果が、読取フィールド34の
7文字と一致するか否かを演算チエツクすることを指示
するものである。なお、読取フィールド31−34に記
録される読取対象とする文字は、黒色によ・)で記録さ
れるものとする。 ここで、前記のような規定に従って文字が記録された帳
票30に′〕いて文字読取処理を行なう。はじめに、帳
票30は、カラースキャナ12によって光学的に走査さ
れる。カラースキャナ12からの出力は、量子化部13
によって量子化されシートバッファ14に格納される。 シートバッファ14では、例えば各画素毎に色成分(赤
、緑、青)の濃度情報が8ビットで表わされて格納され
ている。 制御部11は、はじめに演算定義用データ記録用の読取
フィールド31を示す色指定情報(つまり、赤色を示す
情報)を色検出部15に出力する。そして、シートバッ
ファ14に格納されたデータを画素毎に読出す。色検出
部15は、読出されたデータが] 1 色指定情報によって指定される色データであるか否か、
各色成分の濃度情報に基づいて検出する。 文字枠検出部17は、色検出部15における検出結果に
基づいて、色指定情報によ−って指定された色データと
検出された画素位置を“1“と15、それ以外を“0”
とし7て内部に設けられたメモリに格納する。つまり、
文字枠検出部17におい゛C1制御部11からの色指定
情報によ−って指定される色部分(読取フィールドを示
す枠)のイメージが展開される。文字枠検出部17は、
メモリに展開された二次元パターンから、読取フィール
ドを示す枠を検出する。つまり、二次元パターンから線
分を検出し、この線分が予め設定された読取フィールド
を示す枠の規定に適合するか否かによって判断する。 したがって、例えば非読取対象領域35.38を示す枠
が赤色で印刷されている場合であっても、この枠のサイ
ズが読取フィールドと1.て規定されたものでなければ
、読取フィールドを示す枠として検出されない。文字枠
検出部17は、読取フィールド31枠として検出された
イメージの位置を示す座標情報を文字切出l一部16に
出力すると共に、制御部11に色指定情報によって指定
された色による読取フィールドが存在することを通知す
る。(なお、指定された色による読取フィールドが存在
しない場合には、この旨を制御部11に通知する。そし
て、制御部11は、別の印刷色による読取フィールドの
処理に移る。)制御部11は、文字枠検出部17からの
通知に応じて、字体・字種指定情報格納部19に色指定
情報(ここCは、赤色を示す情報)を出力する。字体・
字種指定情報格納部19には、色指定情報と字体・字種
コードが対応づけられたテーブルが設定されている。字
体・字種指定情報格納部19は、色指定情報に応じてJ
II−Bフォント。 英数字を示す字体・字種コードを認識部18に出力する
。また、制御部11は、文字枠検出部17から赤色印刷
による読取フィールド31の存在が通知されると、演算
チエツク部21に対して認識処理の対象と
[Object of the Invention] (Industrial Application Field) The present invention relates to an optical character reading device that reads characters recorded on a form. (Prior Art) Generally, an optical character reading device detects a form image by optically scanning a form to be subjected to reading processing. The optical character reading device performs character recognition processing from this form image based on reading control information called format control information (hereinafter abbreviated as FC information). The FC information includes information indicating the position of the reading field where characters are recorded, information indicating the font/type of the characters recorded in this reading field, information indicating the check code for checking the result of character recognition, etc. Set. The optical character reading device performs character recognition processing, for example, in a recognition processing section based on this FC information. The recognition processing section reads out the image of the portion designated by the information indicating the position of the read-no-yield from the form image, that is, the character pattern, and cuts out each character. and,
Character recognition is performed by comparing the extracted character pattern with a dictionary for character recognition specified by information indicating the font/type of font corresponding to the reading field. The recognition result thus obtained is checked by a check code to see if it has been correctly recognized. If the characters recorded on the form are a plurality of numbers, this check code is used to record, for example, the total of these numbers. (7) The total number of numbers obtained as a result of character recognition processing is compared with the number recorded as this check code, and if they match, it is determined that the characters (numbers) were read correctly. Such FC information used in character recognition processing is generally set by reading the FC definition sheet 1 with an optical character reader. The operator records information used for various reading controls, including information indicating the reading field position of the form to be read and the font and type of characters recorded in this reading field. The character reading device generates FC information used to perform recognition processing based on various information recorded on the FC definition sheet. (Problem to be Solved by the Invention) It is possible to control such character recognition processing. Each FC information must be set depending on the format of the form.Therefore, depending on the form to be read, the operator has to set the information for setting various FC information on the FC definition sheet. The present invention has been made in view of the above-mentioned problems, and it is necessary to fill in the characters recorded on the form. An object of the present invention is to provide an optical character reading device that is capable of reading characters without setting reading control information (FC information) in advance according to the form to be read.
target [Structure of the Invention] (Means for Solving the Problems) In the present invention, at least one reading field is printed in color, and the field has a font and font unique to the printing color.
The form on which the characters of the font type are recorded is optically scanned I7, and a first form image including color information of each pixel is detected and stored in the form image storage means. Then, from the first form image stored in the form image storage means, one of a plurality of preset colors is selected, and a second form image consisting of that color is selected for each color.
The second form image is detected, and the position of the reading field according to its color is detected from this second form image. Based on the reading field position detected in this way, a character pattern unique to the color of the same field recorded in the same field is cut out from the first form image, and the character pattern that has been cut out is cut out from the first form image. , the recognition process is performed based on information on the font and type of font specific to this character pattern. (Function) In the optical character reading device configured in this manner, when a form is subjected to character reading processing, the position of the reading field in the form and the font, type, etc. of the characters recorded in the same field are determined. Information for the reading process shown is set based on information recorded on the form (reading field printed in color, etc.). (Example) Hereinafter, an example of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of an optical character reading device according to the same embodiment. The optical character reading device shown in FIG. 1 performs a process of reading characters recorded on a form under the control of a host computer (not shown). The host computer controls the entire system, and gives instructions to the control unit 11, such as starting character recognition processing. The control section 11 reads characters recorded on a form by controlling each section described below in accordance with instructions given from the host computer. The color scanner 12 optically scans the form to be read while transporting it. A quantization unit 13 is connected to the color scanner 12 and quantizes the signal detected by the color scanner 12 into a multivalued digital signal and stores it in a sheet buffer 14 . The sheet buffer 14 stores density information (first form image) of color components (for example, red, green, and blue) at each pixel position of the read form. The data stored in the sheet buffer 14 is read out to the color detection section 15 or the character cutting section 16 according to instructions from the control section 11. The color detection section 15 detects whether the data at each pixel position is the specified color data according to the color specification information given from the control section 11. A character frame detection section 17 is connected to the color detection section 15 . The character frame detection unit 17 stores two frames of colors specified by the control unit 11 in an internal memory (not shown) according to the detection results of color data at each pixel position by the color detection unit 15. Dimensional pattern (
Expand the second form image). Then, the character frame detection unit 17 detects a frame indicating a reading field from the form image developed in the memory, and outputs position information (coordinate information) of this frame on the form to the character cutting unit 16. The character cutting section 16 reads image data (character pattern) of a portion specified by the position information from the character frame detection section 17 from the sheet buffer 14, converts it into binary data, and stores it in an internal memory. Store. The character cutting section 16 cuts out a character pattern for each character from the image data and outputs it to the recognition section 18. Further, a font/type designation information storage section 19 is connected to the recognition section 18 . Based on the color specification information from the control unit 11, the font/font type specification information storage unit 19 outputs a font/font type code that specifies the corresponding font/type to the recognition unit 18. The recognition unit 18 reads dictionary data specified by the font/character type code from the dictionary storage unit 20 and sends it to the character segmentation unit 1.
Matching is performed with the character patterns from 6 onwards. Dictionary storage section 2
0 stores dictionary data that serves as a reference character pattern when performing character recognition processing classified into each type of font. The character recognition results in the recognition section 18 are held in the arithmetic check section 21. The calculation check section 21 classifies and stores calculation definition data, which will be described later, and general character recognition data. The operation check section 21 checks whether the general character recognition data is correctly recognized based on the operation definition data. The character reading results obtained in this way are output to the host computer via the control section 11. Next, the operation of this embodiment will be explained. First, in the optical character reading device in the same embodiment,
A form on which character reading processing is performed will be explained. Form 3 to be read by an optical character reading device
0, four reading fields 31 as shown in FIG.
34 and non-reading target areas 85 and H are provided. The reading fields 81 to 84 are F from the top left of the form 30.
Count numbers 1 to F4 are assigned. Further, the frame indicating the reading field 31 is printed in red, the frame indicating the reading field 32.84 is printed in blue, and the frame indicating the reading field 33 is printed in purple. In the non-reading area 85° 8B, entries, pictures, etc. necessary for a form that is not to be read are recorded. Further, in the reading fields 31 to 34, the font and type of characters to be recorded are predefined according to the printing color of the frame. Here, the reading field 32°84 in the blue frame has JI
Numbers in S-B font, reading field 3 in purple frame
3 is recorded with handwritten alphanumeric characters, and the red-framed reading field 31 is recorded with alphanumeric characters in JIS-B font. In addition, the reading field (red frame>
In 31, calculation definition data is recorded. This calculation definition data is, for example, rF2-10>6+F3-6-F
It is assumed that an arithmetic expression 4-7J is recorded. This data for calculation is the sum of the 6 characters from the 10th digit 1 from the left recorded in the reading field 32 and the 6 characters in the reading field 33, and the result matches the 7 characters in the reading field 34. This is an instruction to perform an arithmetic check to determine whether or not to do so. It is assumed that the characters to be read recorded in the reading fields 31-34 are recorded in black (.). Here, character reading processing is performed on the form 30 on which characters have been recorded according to the above-mentioned regulations. First, the form 30 is optically scanned by the color scanner 12. The output from the color scanner 12 is sent to a quantizer 13.
is quantized and stored in the sheet buffer 14. In the sheet buffer 14, for example, density information of color components (red, green, blue) is expressed and stored in 8 bits for each pixel. The control section 11 first outputs color designation information (that is, information indicating red) indicating the reading field 31 for recording calculation definition data to the color detection section 15 . Then, the data stored in the sheet buffer 14 is read out pixel by pixel. The color detection unit 15 determines whether the read data is the color data specified by the color specification information;
Detection is performed based on density information of each color component. Based on the detection result in the color detection unit 15, the character frame detection unit 17 sets the color data specified by the color specification information and the detected pixel position to “1” and 15, and the others to “0”.
It is stored in the internal memory as 7. In other words,
The character frame detection section 17 develops an image of the color portion (frame indicating the reading field) designated by the color designation information from the C1 control section 11. The character frame detection unit 17
A frame indicating a reading field is detected from the two-dimensional pattern developed in memory. In other words, a line segment is detected from the two-dimensional pattern, and a judgment is made based on whether or not this line segment conforms to the preset definition of a frame indicating a reading field. Therefore, for example, even if the frame indicating the non-reading target area 35.38 is printed in red, the size of this frame is 1.5 mm larger than the reading field. If the frame is not specified as such, it will not be detected as a frame indicating a reading field. The character frame detection unit 17 outputs coordinate information indicating the position of the image detected as the frame of the reading field 31 to the character cutout l portion 16, and also outputs coordinate information indicating the position of the image detected as the frame of the reading field 31 to the control unit 11. Notify the existence of (Note that if there is no reading field with the specified color, this is notified to the control unit 11.Then, the control unit 11 moves on to processing the reading field with another printing color.)Control unit 11 outputs color designation information (here C is information indicating red) to the font/character type designation information storage section 19 in response to the notification from the character frame detection section 17. Font/
The character type designation information storage section 19 is set with a table in which color designation information is associated with font/font type codes. The font/character type designation information storage section 19 stores J according to the color designation information.
II-B font. A font/character type code indicating an alphanumeric character is output to the recognition unit 18. Further, when the control unit 11 is notified of the existence of the reading field 31 printed in red from the character frame detection unit 17, the control unit 11 informs the calculation check unit 21 that it is a target for recognition processing.

【7ている文
字が演算定義用データであることを通知する。文字切出
し部16は、文字枠検出部17で検出された読取フィー
ルド31内に黒色で記録され]3 た文字のイメージデータをシートバッファ14から読込
み格納する。そして、文字切出1,2部]6は、1文字
毎に文字パターンを切出【7て認識部18に出力する。 認識部18は、字体・字種指定情報格納部19から与え
られる字体・字種コードに対応する辞書データを辞書格
納部20から読出し、文字切出し部16によって切出さ
れた文字パターンとの照合を行なう。認識部18におい
て得られた文字認識結果は、演算チエツク部21に出力
される。演算チエツク部21は、認識処理の対象として
いる文字が演算定義用データであることを制御部11か
ら通知されているため、認識部18における文字認識結
果を演算定義用データとして保持する。演算チエツク部
21は、読取フィールド31についての文字認識処理が
終了すると、制御部11にこの旨を通知する。 こうして、制御部】】は、赤色枠の読取フィールド31
について処理が終了したことを通知されると、次に青色
により印刷された読取フィールド32.34の読取処理
を行なう。つまり、色検出部15に対して青色を示す色
指定情報を出力する。以下、赤色枠読取フィールド31
の処理と同様に行なう。ただし、赤色枠の読取フィール
ド31以外は、一般の読取対象とする文字が記録される
読取フィールドである(演算定義用データではない)た
め、制御部11から演算チエツク部21に対して演算定
義用データであるという通知は行なわない。そして、読
取フィールド32〜34についての文字認識結果は、演
算定義用データと分類されて演算チエツク部21に保持
される。 こうして、各印刷色(赤、青、紫)の読取フィールド3
1〜84について文字認識処理が終了すると、演算チエ
ツク部21は、演算定義用データに基づいて文字認識処
理の結果得られた文字について演算チエツクを行なう。 読取フィールド31には、演算定義用データとしてrF
2−10>6+F3−6−F4−7Jという演算式が記
録されているため、これに応じて演算チエツクを行なう
。演算チエツク部21は、認識結果について演算チエツ
クを行なった後、文字認識処理の結果得られた文字デー
タ、及び演算チエツクの結果を制御部11を介してホス
トコンピュータに出力する。演算チエツク部21におい
て、文字認識結果に正しく認識されなかった文字がある
と判断されると、表示器(図示せず)等によってオペレ
ータに通知するようにする。 なお、前記実施例においては、読取フィールドを示す枠
の印刷に用いられる色は、赤、青、紫の三色としたが、
これに限るものではない。また、印刷色に対応する字体
・字種は、任意に設定することが可能である。 さらに、演算定義用データは、前記実施例に用いた形式
に限るものではなく、システムにより自由に定義される
。 [発明の効果コ 以上のように本発明によれば、帳票に記録された文字の
認識処理を行なう際に必要な読取制御情報(FC情報)
である読取フィールドの位置、及び同フィールドに記録
される文字に対応する字体・字種を示す情報を、帳票に
応じて予め設定することなく文字の読取りを行なうこと
が可能となる。このため、帳票の文字読取作業を効率的
に行なうことができるようになるものである。
[Notifies that the character indicated by 7 is data for calculation definition. The character cutting section 16 reads image data of the character recorded in black in the reading field 31 detected by the character frame detecting section 17 from the sheet buffer 14 and stores it therein. Then, the character cutout parts 1 and 2] 6 cut out a character pattern for each character [7] and output it to the recognition unit 18. The recognition unit 18 reads dictionary data corresponding to the font/character type code given from the font/character type specification information storage unit 19 from the dictionary storage unit 20, and compares it with the character pattern cut out by the character cutting unit 16. Let's do it. The character recognition result obtained by the recognition section 18 is output to the arithmetic check section 21. Since the arithmetic check section 21 is notified by the control section 11 that the character to be recognized is the arithmetic definition data, the arithmetic check section 21 holds the character recognition result in the recognition section 18 as the arithmetic definition data. When the character recognition process for the reading field 31 is completed, the arithmetic check section 21 notifies the control section 11 of this fact. In this way, the control section]] reads the reading field 31 in the red frame.
When it is notified that the processing has been completed, the next step is to read the reading fields 32 and 34 printed in blue. That is, color designation information indicating blue is output to the color detection section 15. Below, red frame reading field 31
Perform the same process as . However, the fields other than the reading field 31 in the red frame are reading fields in which characters to be read in general are recorded (not data for calculation definition). There is no notification that it is data. The character recognition results for the reading fields 32 to 34 are classified as calculation definition data and held in the calculation check section 21. In this way, the reading field 3 for each printing color (red, blue, purple)
When the character recognition process for characters 1 to 84 is completed, the arithmetic check section 21 performs an arithmetic check on the characters obtained as a result of the character recognition process based on the arithmetic definition data. The read field 31 contains rF as calculation definition data.
Since the arithmetic expression 2-10>6+F3-6-F4-7J is recorded, an arithmetic check is performed accordingly. The arithmetic check section 21 performs an arithmetic check on the recognition result, and then outputs the character data obtained as a result of the character recognition process and the result of the arithmetic check to the host computer via the control section 11. If the arithmetic check section 21 determines that there is a character that has not been correctly recognized in the character recognition results, the operator is notified through a display (not shown) or the like. In addition, in the above embodiment, the three colors used for printing the frame indicating the reading field were red, blue, and purple.
It is not limited to this. Furthermore, the font and type of font corresponding to the printing color can be set arbitrarily. Furthermore, the calculation definition data is not limited to the format used in the above embodiments, but can be freely defined by the system. [Effects of the Invention] As described above, according to the present invention, reading control information (FC information) necessary for recognition processing of characters recorded on a form.
It becomes possible to read characters without setting in advance information indicating the position of a reading field and the font/type of characters corresponding to the characters recorded in the field depending on the form. Therefore, it becomes possible to efficiently read the characters on the form.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例に係わる光学的文字読取装置
の構成を示すブロック図、第2図は同実施例に用いられ
る帳票の構成を示す図である。 11・・・制御部、12・・・カラースキャナ、13・
・・量子化部、14・・・シートバッファ、15・・・
色検出部、16・・・文字切出し部、17・・・文字枠
検出部(読取フィールド位置検出手段)18・・・認識
部、19・・・字体・字種指定情報格納部、2o・・・
辞書格納部、21・・・演算チエツク部。 出願人代理人 弁理士 鈴江武彦
FIG. 1 is a block diagram showing the structure of an optical character reading device according to an embodiment of the present invention, and FIG. 2 is a diagram showing the structure of a form used in the same embodiment. 11...Control unit, 12...Color scanner, 13.
...Quantization unit, 14... Sheet buffer, 15...
Color detection section, 16... Character cutting section, 17... Character frame detection section (reading field position detection means) 18... Recognition section, 19... Font/character type specification information storage section, 2o...・
Dictionary storage section, 21... Arithmetic check section. Applicant's agent Patent attorney Takehiko Suzue

Claims (1)

【特許請求の範囲】 少なくとも一つの読取フィールドがカラー印刷され、同
フィールドには、その印刷色に固有の字体・字種の文字
が記録される帳票と、 前記帳票を光学的に走査して各画素の色情報を含む第1
の帳票イメージを検出する帳票イメージ検出手段と、 前記帳票イメージ検出手段により検出された第1の帳票
イメージを格納する帳票イメージ格納手段と、 前記帳票イメージ格納手段に格納された第1の帳票イメ
ージから、予め設定されたいくつかの色について各色毎
にその色からなる第2の帳票イメージを検出し、この第
2の帳票イメージからその色による読取フィールドの位
置を検出する読取フィールド位置検出手段と、 前記読取フィールド位置検出手段によって検出された読
取フィールド位置をもとに、同フィールドに記録されて
いる文字パターンを前記第1の帳票イメージから切出す
文字切出し手段と、 前記文字切出し手段により切出された文字パターンにつ
いて、この文字パターンに固有の字体・字種の情報に基
づいて認識処理を行なう認識処理手段と、 を具備したことを特徴とする光学的文字読取装置。
[Claims] At least one reading field is printed in color, and the field is provided with a document in which characters of a font and font type unique to the printed color are recorded, and the document is optically scanned to read each document. the first containing the color information of the pixel;
a form image detection means for detecting a form image; a form image storage means for storing a first form image detected by the form image detection means; and a form image storage means for storing a first form image detected by the form image detection means; , a reading field position detecting means for detecting a second form image made of each color for each of several preset colors, and detecting the position of the reading field according to the color from the second form image; character cutting means for cutting out a character pattern recorded in the field from the first form image based on the reading field position detected by the reading field position detecting means; An optical character reading device comprising: recognition processing means for performing recognition processing on a character pattern based on information on a font/type specific to the character pattern.
JP63277930A 1988-11-02 1988-11-02 Optical character reader Pending JPH02123486A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63277930A JPH02123486A (en) 1988-11-02 1988-11-02 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63277930A JPH02123486A (en) 1988-11-02 1988-11-02 Optical character reader

Publications (1)

Publication Number Publication Date
JPH02123486A true JPH02123486A (en) 1990-05-10

Family

ID=17590265

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63277930A Pending JPH02123486A (en) 1988-11-02 1988-11-02 Optical character reader

Country Status (1)

Country Link
JP (1) JPH02123486A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0438246A2 (en) * 1990-01-19 1991-07-24 Canon Kabushiki Kaisha Method and device for outputting multicolor document
EP0575134A2 (en) * 1992-06-15 1993-12-22 Canon Kabushiki Kaisha Method and apparatus for printing according to a graphic language
JPH10154191A (en) * 1996-11-26 1998-06-09 Nec Corp Business form identification method and device, and medium recording business form identification program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0438246A2 (en) * 1990-01-19 1991-07-24 Canon Kabushiki Kaisha Method and device for outputting multicolor document
EP0575134A2 (en) * 1992-06-15 1993-12-22 Canon Kabushiki Kaisha Method and apparatus for printing according to a graphic language
EP0575134A3 (en) * 1992-06-15 1994-12-28 Canon Kk Method and apparatus for printing according to a graphic language.
JPH10154191A (en) * 1996-11-26 1998-06-09 Nec Corp Business form identification method and device, and medium recording business form identification program

Similar Documents

Publication Publication Date Title
US8439262B2 (en) Image capture apparatus and method
EP0353842A2 (en) Technique for reading bar codes
US4962432A (en) Selective retrieval of data from microfilm images of different forms by reading a memory index form cord (bar code) recorded on each image frame
US5038379A (en) Image information searching apparatus
CN111738901A (en) Storage medium and image processing apparatus
JPH02123486A (en) Optical character reader
JPH07152856A (en) Optical character reader
JPS5949671A (en) Optical character reader
JP3006294B2 (en) Optical character reader
JP2529421B2 (en) Character recognition device
JP2005208872A (en) Image processing system
JPH0661112B2 (en) Pattern recognition method
JPH01199285A (en) Optical character reader
JP2833040B2 (en) Optical character reader
JPH04251395A (en) Optical character/graphic reader
JPH06251192A (en) Optical character reader
JPH0528314A (en) Optical character reader
JPH06176193A (en) Optical character reader
JPH06314321A (en) Image data base system, control ledger and editing method
JPH0469785A (en) Optical information reader
JPH021354A (en) Recording device
JPH01144181A (en) Optical character reader
JPH0362281A (en) Optical character reading device
JPH0423184A (en) Optical character reader
JPH06259594A (en) Method an device for processing optical read data