JP2570571B2 - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JP2570571B2
JP2570571B2 JP5112446A JP11244693A JP2570571B2 JP 2570571 B2 JP2570571 B2 JP 2570571B2 JP 5112446 A JP5112446 A JP 5112446A JP 11244693 A JP11244693 A JP 11244693A JP 2570571 B2 JP2570571 B2 JP 2570571B2
Authority
JP
Japan
Prior art keywords
identification number
form identification
characters
character pattern
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5112446A
Other languages
Japanese (ja)
Other versions
JPH06301808A (en
Inventor
章夫 深沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP5112446A priority Critical patent/JP2570571B2/en
Publication of JPH06301808A publication Critical patent/JPH06301808A/en
Application granted granted Critical
Publication of JP2570571B2 publication Critical patent/JP2570571B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】この発明は、光学文字読取装置に
関し、特に種類(帳票フォーマット)の異なる帳票の混
在読み取りを可能とする光学文字読取装置に関するもの
である。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an optical character reader, and more particularly to an optical character reader capable of reading forms of different types (form formats) in a mixed manner.

【0002】[0002]

【従来の技術】従来、この種の光学文字読取装置では、
種類の異なる帳票の混在読み取りができるように、各帳
票間に渡って共通に作成された帳票識別エリア(以下、
IDフィールドと称す)を最初に読み取り、この読み取
ったIDフィールドに記入されている帳票識別番号を認
識し、この認識した帳票識別番号から帳票の種類を識別
し、この識別した帳票に対応する帳票フォーマット情報
を自動的に選択し、この選択した帳票フォーマット情報
に従って帳票データの読み取りを行うものとしている。
2. Description of the Related Art Conventionally, in this type of optical character reading apparatus,
A form identification area (hereinafter, referred to as a common form) created between all forms to enable mixed reading of different types of forms
First, the form ID is read, the form identification number written in the read ID field is recognized, the form type is identified from the recognized form identification number, and the form format corresponding to the identified form is recognized. The information is automatically selected, and the form data is read in accordance with the selected form format information.

【0003】なお、特開昭60−45883号公報に
は、ラインバッファに入力された文字パターンを認識す
る手段と、認識された文字パターンが帳票識別コードで
ない場合に次の文字パターンを入力するために帳票の位
置を補正する手段とによって、IDフィールドの行位置
が任意に設定された帳票の混在読み取りを行う技術が記
載されている。
Japanese Unexamined Patent Publication No. 60-45883 discloses a means for recognizing a character pattern input to a line buffer and a method for inputting the next character pattern when the recognized character pattern is not a form identification code. Describes a technique for performing mixed reading of a form in which the row position of the ID field is set arbitrarily by means for correcting the position of the form.

【0004】[0004]

【発明が解決しようとする課題】しかしながら、従来の
光学文字読取装置では、最初に読み取るべきフィール
ド、すなわち帳票識別番号が記入されているIDフィー
ルドの文字数は、各帳票間で一定であることをその前提
条件としている。このため、帳票識別番号の桁数および
位置が帳票間で共通であっても、その帳票識別番号の記
入されているIDフィールドの文字数が帳票間で異なる
場合には、種類の異なる帳票の混在読み取りができない
という問題が生じていた。特に、IDフィールドに記入
されている文字が活字である場合には、IDフィールド
内の記入文字列の途中から帳票識別番号が始まるような
場合、帳票識別番号のみを切り出して認識することが非
常に困難となっていた。すなわち、一般に活字文字はプ
リンタ装置で印字されるため、その特性上、左右の「印
字ずれ」が発生し易い。したがって、光学文字読取装置
において、活字文字を読み取る場合には、上述した「印
字ずれ」を考慮し、フォーマット情報で指定された位置
より前の位置から文字パターンの切り出しを行ってい
る。このため、IDフィールド内の記入文字列の途中か
ら始まる帳票識別番号を切り出す際、その帳票識別番号
の前の文字パターンまでをも切り出してしまう虞れがあ
り、帳票識別番号のみの切り出しが非常に困難とな
る。。
However, in the conventional optical character reading apparatus, it is required that the number of characters in a field to be read first, that is, an ID field in which a form identification number is written is constant between forms. It is a prerequisite. For this reason, even if the number of digits and the position of the form identification number are common between forms, if the number of characters in the ID field in which the form identification number is entered differs between forms, mixed reading of forms of different types is performed. There was a problem that it was not possible. In particular, when the characters entered in the ID field are printed characters, if the form identification number starts in the middle of the entered character string in the ID field, it is very easy to cut out and recognize only the form identification number. It was difficult. That is, in general, printed characters are printed by a printer device, and therefore, right and left “print misalignment” easily occurs due to their characteristics. Therefore, when reading a printed character in the optical character reading device, a character pattern is cut out from a position before the position specified by the format information in consideration of the above-described “printing deviation”. For this reason, when cutting out the form identification number starting from the middle of the character string entered in the ID field, there is a possibility that even the character pattern before the form identification number may be cut out, and it is very difficult to cut out only the form identification number. It will be difficult. .

【0005】本発明はこのような課題を解決するために
なされたもので、その目的とするところは、IDフィー
ルドの文字数が帳票間で異なっていても種類の異なる帳
票の混在読み取りが可能で、かつIDフィールド内の記
入文字列の途中から帳票識別番号が始まっていてもこれ
を精度よく容易に切り出すことが可能な光学文字読取装
置を提供することにある。
The present invention has been made to solve such a problem, and an object of the present invention is to enable mixed reading of different types of forms even if the number of characters in an ID field differs between forms. Further, an object of the present invention is to provide an optical character reader capable of easily and accurately cutting out a form identification number even if the form identification number starts in the middle of a character string entered in an ID field.

【0006】[0006]

【課題を解決するための手段】このような目的を達成す
るために、本発明は、帳票のイメージを読み取りイメー
ジデータとしてデータ格納手段へ格納するイメージ読取
手段と、帳票識別番号の文字数,切り出し位置,順/逆
の切り出し方向を情報として記憶する記憶手段と、この
記憶手段に記憶された情報を読み出し、この情報によっ
て指定される文字数,切り出し位置,順/逆の切り出し
方向に基づき、データ格納手段に格納されているイメー
ジデータから文字パターンを切り出す文字パターン切出
手段と、この文字パターン切出手段により切り出された
文字パターンから帳票識別番号を認識し、この帳票識別
番号から帳票の種類を識別する帳票識別手段とを備えた
ものである。
In order to achieve the above object, the present invention provides an image reading means for reading an image of a form and storing it as image data in a data storage means, the number of characters of a form identification number, and a cutout position. , Storage means for storing the forward / reverse cutout direction as information, and information stored in the storage means, and data storage means based on the number of characters specified by the information, the cutout position, and the forward / reverse cutout direction. Character pattern extracting means for extracting a character pattern from the image data stored in the printer, a form identification number is recognized from the character pattern cut out by the character pattern extracting means, and a form type is identified from the form identification number. And a form identification means.

【0007】[0007]

【作用】したがってこの発明によれば、予め記憶された
帳票識別番号の文字数,切り出し位置,順/逆の切り出
し方向に基づいてイメージデータから文字パターンが切
り出され、この切り出された文字パターンから帳票識別
番号が認識され、この認識された帳票識別番号から帳票
の種類が識別される。
Therefore, according to the present invention, a character pattern is cut out from image data based on the number of characters of the form identification number stored in advance, a cutout position, and a forward / reverse cutout direction, and a form identification is performed from the cut out character pattern. The number is recognized, and the type of the form is identified from the recognized form identification number.

【0008】[0008]

【実施例】以下、本発明を実施例に基づき詳細に説明す
る。図1はこの発明の一実施例の要部を示すブロック図
である。同図において、1は走査部であり、帳票(図示
せず)のイメージを走査し、これによって読み取ったイ
メージをイメージデータ(データ102)としてスキャ
ンバッファ6へ格納する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described below in detail based on embodiments. FIG. 1 is a block diagram showing a main part of an embodiment of the present invention. In FIG. 1, reference numeral 1 denotes a scanning unit which scans an image of a form (not shown) and stores the read image in the scan buffer 6 as image data (data 102).

【0009】7はメモリであり、IDフィールド内の帳
票識別番号の文字数,切り出し位置,順/逆の切り出し
方向および読取対象となる種類の異なる各帳票に対応し
た帳票フォーマット情報が予め格納されている。
Reference numeral 7 denotes a memory, in which form format information corresponding to each form of different types to be read, and the number of characters of the form identification number in the ID field, a cutout position, a forward / reverse cutout direction, and a type to be read. .

【0010】2は選択部であり、走査部1からの信号1
01で起動し、メモリ7に格納されている帳票識別番号
の文字数,切り出し位置,順/逆の切り出し方向を選択
して読み出し、データ201として出力する。
Reference numeral 2 denotes a selection unit, and a signal 1 from the scanning unit 1
In step S 01, the number of characters of the form identification number stored in the memory 7, the cutout position, and the forward / reverse cutout direction are selected and read out, and output as data 201.

【0011】3は順/逆指定文字数切出部であり、選択
部2からのデータ201に従って、スキャンバッファ6
に格納されているイメージデータ(データ601)のI
Dフィールドからの文字パターンの切り出しを、指定さ
れた切り出し位置から指定された切り出し方向へ指定さ
れた文字数だけ実施する。
Reference numeral 3 denotes a forward / reverse designated character number extracting section, which scans the scan buffer 6 in accordance with the data 201 from the selecting section 2.
Of the image data (data 601) stored in
A character pattern is cut out from the D field by a specified number of characters in a specified cutout direction from a specified cutout position.

【0012】すなわち、順/逆指定文字数切出部3は、
切り出し方向が順方向として指定された場合には、ID
フィールドの先頭文字から指定された文字数で文字パタ
ーンの切り出しを行い、逆方向として指定された場合に
は、IDフィールドの最終文字から指定された文字数で
文字パターンの切り出しを行う。
That is, the forward / reverse designated character number extracting unit 3
If the cutout direction is specified as the forward direction, the ID
A character pattern is cut out from the first character of the field by a specified number of characters, and when the reverse direction is specified, a character pattern is cut out from the last character of the ID field by the specified number of characters.

【0013】4は帳票識別部であり、順/逆指定文字数
切出部3から切り出された文字パターン(データ30
1)から帳票識別番号を認識し、この帳票識別番号から
帳票の種類を識別する。また、識別した帳票に対応する
帳票フォーマット情報をメモリ7から選択して読み出
し、データ401として出力する。
Reference numeral 4 denotes a form identification unit, which is a character pattern (data 30) extracted from the forward / reverse designated character number extracting unit 3.
The form identification number is recognized from 1), and the form type is identified from the form identification number. Also, form format information corresponding to the identified form is selected and read from the memory 7 and output as data 401.

【0014】5は文字認識部であり、帳票識別部4から
のデータ401(帳票フォーマット情報)に従って、ス
キャンバッファ6に格納されているイメージデータ(デ
ータ601)から文字パターンを切り出して認識し、帳
票データの読み取りを行う。
Reference numeral 5 denotes a character recognition unit which cuts out and recognizes a character pattern from the image data (data 601) stored in the scan buffer 6 in accordance with the data 401 (form format information) from the form identification unit 4. Read data.

【0015】次に、図2および図3を参照しながら、本
実施例特有の動作について説明する。
Next, an operation specific to the present embodiment will be described with reference to FIGS.

【0016】図2はIDフィールドの左端側に帳票識別
番号が存在する帳票の例であり、同図(a)においては
IDフィールドの文字数が6文字、同図(b)において
はIDフィールドの文字数が2文字、同図(c)におい
てはIDフィールドの文字数が4文字とされており、そ
の先頭文字から2文字が帳票識別番号であって、各帳票
はその帳票識別番号が異なっている。すなわち、各帳票
は、その種類が異なっている。
FIG. 2 shows an example of a form in which a form identification number exists at the left end of the ID field. In FIG. 2A, the number of characters in the ID field is 6, and in FIG. Are two characters, and in FIG. 10C, the number of characters in the ID field is four characters. Two characters from the first character are form identification numbers, and the forms have different form identification numbers. That is, each form has a different type.

【0017】この場合、選択部2は、メモリ7から帳票
識別番号の文字数「2文字」,切り出し位置「Xs」,
切り出し方向「順方向」を選択して読み出し、データ2
01として出力する。
In this case, the selection unit 2 stores the number of characters of the form identification number “2 characters”, the cutout position “Xs”,
Select the cutout direction “forward” and read out the data 2
Output as 01.

【0018】順/逆指定文字数切出部3は、データ20
1に従い、スキャンバッファ6に格納されているイメー
ジデータ(データ601)のIDフィールドからの文字
パターンの切り出しを、Xsの位置から順方向に2文字
分実行する。
The forward / reverse designated character number extracting section 3 stores the data 20
According to No. 1, the extraction of the character pattern from the ID field of the image data (data 601) stored in the scan buffer 6 is executed for two characters in the forward direction from the position of Xs.

【0019】このように、本実施例によれば、IDフィ
ールドの文字数が帳票間で異なる場合でも、選択部2か
らの情報に従ってIDフィールドから帳票識別番号を示
す文字パターンが切り出されるので、種類の異なる帳票
の混在読み取りを行うことができるようになる。
As described above, according to the present embodiment, even when the number of characters in the ID field differs between forms, the character pattern indicating the form identification number is cut out from the ID field in accordance with the information from the selection unit 2. Mixed reading of different forms can be performed.

【0020】図3はIDフィールドの右端側に帳票識別
番号が存在する帳票の例であり、同図(a)においては
IDフィールドの文字数が6文字、同図(b)において
はIDフィールドの文字数が3文字、同図(c)におい
てはIDフィールドの文字数が4文字とされており、そ
の最終文字から2文字が帳票識別番号であって、各帳票
はその帳票識別番号が異なっている。すなわち、各帳票
は、その種類が異なっている。
FIG. 3 shows an example of a form in which a form identification number exists at the right end of the ID field. In FIG. 3A, the number of characters in the ID field is 6, and in FIG. Are three characters, and in FIG. 3C, the number of characters in the ID field is four characters. Two characters from the last character are form identification numbers, and the forms have different form identification numbers. That is, each form has a different type.

【0021】この場合、選択部2は、メモリ7から帳票
識別番号の文字数「3文字」,切り出し位置「Xe」,
切り出し方向「逆方向」を選択して読み出し、データ2
01として出力する。
In this case, the selection unit 2 stores the number of characters of the form identification number “3 characters”, the cut-out position “Xe”,
Select the cutout direction "reverse direction" and read out the data 2
Output as 01.

【0022】順/逆指定文字数切出部3は、データ20
1に従い、スキャンバッファ6に格納されているイメー
ジデータ(データ601)のIDフィールドからの文字
パターンの切り出しを、Xeの位置から逆方向に3文字
分実行する。
The forward / reverse designated character number extracting section 3 stores the data 20
According to No. 1, the extraction of the character pattern from the ID field of the image data (data 601) stored in the scan buffer 6 is executed for three characters in the reverse direction from the position of Xe.

【0023】図3(a),(c)に示した帳票ではID
フィールド内の記入文字列の途中から帳票識別番号が始
まっている。この場合、選択部2からの情報に基づき、
IDフィールドの最終文字から指定された文字数で文字
パターンが切り出されるため、IDフィールドに記入さ
れている文字が活字であったとしても、また手書きであ
ったとしても、帳票識別番号を示す文字パターンのみを
精度よくかつ容易に切り出すことができる。
In the forms shown in FIGS. 3A and 3C, the ID
The form identification number starts in the middle of the character string entered in the field. In this case, based on the information from the selection unit 2,
Since the character pattern is cut out from the last character of the ID field by the specified number of characters, even if the characters entered in the ID field are printed or handwritten, only the character pattern indicating the form identification number Can be cut out accurately and easily.

【0024】[0024]

【発明の効果】以上説明したことから明らかなように本
発明によれば、予め記憶された帳票識別番号の文字数,
切り出し位置,順/逆の切り出し方向に基づいてイメー
ジデータから文字パターンが切り出され、この切り出さ
れた文字パターンから帳票識別番号が認識され、この認
識された帳票識別番号から帳票の種類が識別されるの
で、IDフィールドの文字数が帳票間で異なっていても
種類の異なる帳票の混在読み取りが可能となる。また、
本発明によれば、IDフィールドに記入されている文字
が活字や手書きで、IDフィールド内の記入文字列の途
中から帳票識別番号が始まっていても、これを精度よく
且つ容易に切り出すことが可能となる。
As is apparent from the above description, according to the present invention, the number of characters of the form identification number stored in advance,
A character pattern is cut out from the image data based on the cutout position and forward / reverse cutout direction, a form identification number is recognized from the cut out character pattern, and a form type is identified from the recognized form identification number. Therefore, even if the number of characters in the ID field is different between forms, mixed reading of forms of different types becomes possible. Also,
According to the present invention, it is possible to accurately and easily cut out the form identification number even if the characters entered in the ID field are printed or handwritten and the form identification number starts in the middle of the entered character string in the ID field. Becomes

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例の要部を示すブロック図であ
る。
FIG. 1 is a block diagram showing a main part of an embodiment of the present invention.

【図2】IDフィールドの左端側に帳票識別番号が存在
する種類の異なる帳票の例を示す図である。
FIG. 2 is a diagram illustrating an example of a different type of form in which a form identification number exists on the left end side of an ID field.

【図3】IDフィールドの右端側に帳票識別番号が存在
する種類の異なる帳票の例を示す図である。
FIG. 3 is a diagram illustrating an example of a different type of form in which a form identification number exists on the right end side of an ID field.

【符号の説明】[Explanation of symbols]

1 走査部 2 選択部 3 順/逆指定文字数切出部 4 帳票識別部 5 文字認識部 6 スキャンバッファ 7 メモリ Reference Signs List 1 scanning unit 2 selection unit 3 forward / reverse specified number of characters extraction unit 4 form identification unit 5 character recognition unit 6 scan buffer 7 memory

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 帳票のイメージを読み取り、この読み取
ったイメージからその帳票に作成された帳票識別エリア
に記入されている帳票識別番号を認識し、この認識した
帳票識別番号からその帳票の種類を識別し、この識別し
た帳票に対応する帳票フォーマット情報に従って帳票デ
ータの読み取りを行う光学文字読取装置において、 帳票のイメージを読み取りイメージデータとしてデータ
格納手段へ格納するイメージ読取手段と、 帳票識別番号の文字数,切り出し位置,順/逆の切り出
し方向を情報として記憶する記憶手段と、 この記憶手段に記憶された情報を読み出し、この情報に
よって指定される文字数,切り出し位置,順/逆の切り
出し方向に基づき、前記データ格納手段に格納されてい
るイメージデータから文字パターンを切り出す文字パタ
ーン切出手段と、 この文字パターン切出手段により切り出された文字パタ
ーンから帳票識別番号を認識し、この帳票識別番号から
前記帳票の種類を識別する帳票識別手段とを備えたこと
を特徴とする光学文字読取装置。
An image of a form is read, a form identification number entered in a form identification area created on the form is recognized from the read image, and a type of the form is identified from the recognized form identification number. An optical character reader for reading form data according to the form format information corresponding to the identified form, wherein: an image reading means for reading the form image and storing it in the data storage means as image data; Storage means for storing the cutout position and the forward / reverse cutout direction as information; and reading out the information stored in the storage means, based on the number of characters specified by the information, the cutout position, and the forward / reverse cutout direction. Statement for extracting character pattern from image data stored in data storage means Character pattern extracting means; and a form identification means for recognizing a form identification number from the character pattern cut out by the character pattern extracting means and identifying the type of the form from the form identification number. Optical character reader.
JP5112446A 1993-04-16 1993-04-16 Optical character reader Expired - Fee Related JP2570571B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5112446A JP2570571B2 (en) 1993-04-16 1993-04-16 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5112446A JP2570571B2 (en) 1993-04-16 1993-04-16 Optical character reader

Publications (2)

Publication Number Publication Date
JPH06301808A JPH06301808A (en) 1994-10-28
JP2570571B2 true JP2570571B2 (en) 1997-01-08

Family

ID=14586840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5112446A Expired - Fee Related JP2570571B2 (en) 1993-04-16 1993-04-16 Optical character reader

Country Status (1)

Country Link
JP (1) JP2570571B2 (en)

Also Published As

Publication number Publication date
JPH06301808A (en) 1994-10-28

Similar Documents

Publication Publication Date Title
US4914709A (en) Method for identifying unrecognizable characters in optical character recognition machines
US5280544A (en) Optical character reading apparatus and method
US4974260A (en) Apparatus for identifying and correcting unrecognizable characters in optical character recognition machines
JPH03161873A (en) Electronic filing device having data base constructing function
US7142733B1 (en) Document processing method, recording medium recording document processing program and document processing device
JP2570571B2 (en) Optical character reader
JP3959451B2 (en) Image reading system
JP2784004B2 (en) Character recognition device
JPH0528302A (en) Character reader
JP2931485B2 (en) Character extraction device and method
JPH07262317A (en) Document processor
JP2665226B2 (en) Character recognition device
JP2674020B2 (en) Optical character recognition device
JP2003085477A (en) Character recognizing device and correcting method of character recognition result
JPH06243285A (en) Character recognition method
JP3310063B2 (en) Document processing device
JP2001265317A (en) Bitmap font, method and device for generating bitmap font, method and device for generating document data using dedicated font characters, and method and device for recognizing characters
JP2000207488A (en) Character recognizing method and device nd record medium
JPS62295192A (en) Optical character image reader
JP2000353207A (en) Picture reading system
WO1990015398A1 (en) Method and apparatus for identifying unrecognizable characters in optical character recognition machines
JPH06251192A (en) Optical character reader
JPS6326789A (en) Character recognizing device
JPH05342409A (en) Character recognizing device
JPH08194772A (en) Optical character reader

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071024

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081024

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091024

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees