JPS61100873A - Optical character/graphic reading device - Google Patents
Optical character/graphic reading deviceInfo
- Publication number
- JPS61100873A JPS61100873A JP59222605A JP22260584A JPS61100873A JP S61100873 A JPS61100873 A JP S61100873A JP 59222605 A JP59222605 A JP 59222605A JP 22260584 A JP22260584 A JP 22260584A JP S61100873 A JPS61100873 A JP S61100873A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- ocr
- stored
- character
- memory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、光学文字/図形読み取り装置に係り、特にス
ペーシング帳票を使用し、帳票設計イメージの侭記入し
た帳票データを読み取って、光学文字/図形読み取り装
置(OCR)の為の帳票フォーマットを作成する方法に
関する。[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to an optical character/figure reading device, and in particular, uses a spacing form to read form data written on the side of a form design image to read optical characters. /Relates to a method for creating a form format for a graphic reader (OCR).
従来の光学文字/図形読み取り装置においては、人力帳
票のフォーマットを作成する為の入力方法に対して、徹
底した汎用化が図られていた為、各種のフォーマットの
帳票に対して、容易に対応できる利点があったが、記入
項目が多く、光学文字/図形読み取り装置(以下OCR
と云う)での処理量が多くなり、メモリ容量の増大化と
、プログラムの開発費の増大化に伴うコスト高となる問
題があり、簡単で、且つマンマシンインタフェースの良
い、OCRの為の帳票フォーマットを作成するテークの
入力方法が待たれていた。In conventional optical character/figure reading devices, the input method for manually creating form formats has been thoroughly generalized, so it can easily handle forms in a variety of formats. Although it had advantages, there were many entries and optical character/graphic reader (hereinafter referred to as OCR)
There is a problem that the amount of processing increases, the memory capacity increases, and the cost increases due to the increase in program development costs. A method for inputting takes to create a format has been awaited.
一般的な、OCRの構成図を示すと、第3図の通りとな
り、1はマイクロプロセッサ(MPtl)、 2はプロ
グラムメモリ(PM)、 3はワークメモリ(WM)、
4は画像メモU (GM)、 5は前処埋合IL、
61は光電変換部、6は光学部、7は機構部、71は機
構制御部。The configuration diagram of a general OCR is shown in Figure 3, where 1 is a microprocessor (MPtl), 2 is a program memory (PM), 3 is a work memory (WM),
4 is image memo U (GM), 5 is preprocessing IL,
61 is a photoelectric conversion section, 6 is an optical section, 7 is a mechanism section, and 71 is a mechanism control section.
8はファイルメモリ(FM)、 9は外部インタフェー
ス部、 10はディスプレイ装置(DISP)、 11
ばキーボードである。8 is a file memory (FM), 9 is an external interface section, 10 is a display device (DISP), 11
For example, it is a keyboard.
従来方式においては、
■OCRの為の帳票フォーマットを作成する場合、ディ
スプレイ装置(DISP) 10に表示された画面を見
ながら、所謂会話処理で、所要のデータをキーボード1
1から人力し、該入力されたデータを基に、該ocRの
為の帳票フォーマットを作成していた。In the conventional method, ■When creating a form format for OCR, while looking at the screen displayed on the display device (DISP) 10, the required data is entered on the keyboard 1 using so-called conversation processing.
Starting from scratch, a form format for the ocR was created based on the input data.
具体的には、例えば、本OCRに設けられているキーホ
ード11を操作して、マイクロプロセッサ【MPU)
lがプログラムメモリ(PM) 2に格納されている、
フォーマット解析プログラム21を実行すると、先ずO
CRにおけるファイルメモリ(FM) 8から、画面フ
ォーマット定義データを読み出し、該ディスプレイ装置
(DISP) 10にOCRの為の帳票フォーマットを
作成する為の会話処理用の画面を表示するので、操作者
は、該画面を見ながら会話形式で、順次必要とするデー
タを、該キーボード11から入力する。Specifically, for example, by operating the key fob 11 provided in this OCR, the microprocessor (MPU)
l is stored in program memory (PM) 2,
When the format analysis program 21 is executed, first O
The screen format definition data is read from the file memory (FM) 8 in the CR, and the display device (DISP) 10 displays a dialog processing screen for creating a form format for OCR, so the operator can: While looking at the screen, the user sequentially enters the required data from the keyboard 11 in a conversational manner.
該入力されたデータは、フォーマット作成プログラム2
3によって処理し、OCRの為の帳票7オーマツトをテ
ーブルの形に作成していた。The input data is stored in the format creation program 2.
3, and created a 7-ormat document in the form of a table for OCR.
■OCRの為の帳票フォーマy I・を作成する場合の
他の人力方法は、上記帳票のサイズ1文字フィールドの
左端位置1文字間隔、文字種別等を、特定のフォーマッ
ト入力帳票(フォーマット制:lUシート)に人手で記
入しておき、該帳票をOCRで読み取ることによりOC
Rの為の帳票フォーマットを作成していた。■Another manual method when creating a form formatter for OCR is to change the size of the above form by specifying the left end position of the 1 character field, 1 character interval, character type, etc. in a specific format input form (format system: lU). OC sheet) is filled in manually, and the form is read by OCR.
I was creating a form format for R.
具体的には、上記フォーマット解析プログラム21によ
って、機構制御プログラム24が起動され、上記フォー
マット制御シートかOCRに読み取られると、該シート
の各データが文字認、識プログラム22により認識され
、上記フォーマット作成プログラム23によって、OC
Rの為の帳票フォーマットをテーブルの形に作成してい
た。Specifically, when the mechanism control program 24 is started by the format analysis program 21 and the format control sheet is read by the OCR, each data on the sheet is recognized by the character recognition and recognition program 22, and the format is created. By program 23, OC
I was creating a form format for R in the form of a table.
従って、従来方式においては、会話処理、Otj?入力
処理、の何れの方法においても、実際に使用する帳票の
イメージが得られないと云う問題と、処理帳票に対して
数値パラメータを人手で記入していた為、寸法等の精度
の要求されるバラノータに対して、記入誤り等が発生す
ると、一連の入力処理をやり直す必要がある等の問題が
あった。Therefore, in the conventional method, conversation processing, Otj? Regardless of the input processing method, there is a problem that it is not possible to obtain an image of the form that will actually be used, and because numerical parameters are entered manually on the processing form, precision of dimensions etc. is required. For Baranota, there is a problem in that if an entry error occurs, it is necessary to redo a series of input processes.
本発明は上記従来の欠点に鑑み、帳票設計イメージの侭
記入されたデータを直接読み取り、認識することによっ
て、OCRの為の帳票フォーマットデータを作成する方
法を提供することを目的とするものである。In view of the above-mentioned conventional drawbacks, the present invention aims to provide a method for creating form format data for OCR by directly reading and recognizing data written in a form design image. .
この目的は、ドロップアウトカラーで印刷されたスペー
シング帳票に、記入規則に従って、実際に使用する帳票
イメージで記入された帳票と、該帳票上の文字、及び図
形を直接認識する手段とを備え、その認識された上記ス
ペーシング帳票から、大量に処理すべき帳票に対する光
学文字/図形読み取り装置(OCR)の為の帳票フォー
マットを作成する手段を備えた本発明の光学文字/図形
読み取り装置によって達成される。This purpose is to provide a spacing form printed in dropout color with a form that is filled in according to the filling rules with an image of the form that will actually be used, and a means for directly recognizing characters and figures on the form. This is achieved by the optical character/graphic reader (OCR) of the present invention, which is equipped with means for creating a form format for an optical character/graphic reader (OCR) for a large number of forms to be processed from the recognized spacing form. Ru.
即ち、本発明によれば、フォーマット入力帳票乙こ、ド
ロップアウトカラーで印刷されたスペーシング帳票を使
用し、該スペーシング帳票に、実際の帳票に合わせて、
文字読み取り枠1図形人力伜を記入し、各粋の一部に処
理方法を記入して、OCRに読み取りを行わせ、各枠デ
ータをOCRが検出することにより、読み取り位置の算
出を行い、各枠内の記入文字から読み取り方法の決定を
行い、OCRの為の帳票フォーマットとするようにした
ものであるので、スペーシング帳票に記入した帳票設計
イメージの侭で、OCRの為の帳票フォーマットのデー
タか作成でき、簡単で、且つマンマシンインタフェース
の良い、OCRの為の帳票フォーマットを作成する為の
データ入力方法か得られる効果がある。That is, according to the present invention, a spacing form printed in dropout color is used in the format input form, and the spacing form is printed in accordance with the actual form.
Fill in the character reading frame 1 figure, write the processing method in a part of each text, have the OCR read it, and the OCR detects each frame data to calculate the reading position and Since the reading method is determined from the characters written in the frame and the form is formatted for OCR, the form design image filled in the spacing form is used to create the data for the form format for OCR. The present invention has the advantage of providing a data input method for creating a form format for OCR that is simple, easy to use, and has a good man-machine interface.
〔実施例] 以下本発明の実施例を図面によって詳述する。〔Example] Embodiments of the present invention will be described in detail below with reference to the drawings.
第1図は、本発明を実施して、OCRの為の帳票フォー
マットを作成する概念を説明する図であり、第2図は、
第3図で説明したOCRのプログラムメモリ(P)1)
2に格納されている、本発明を実施するのに必要な各
処理プログラムの一例を示した図である。FIG. 1 is a diagram explaining the concept of creating a form format for OCR by implementing the present invention, and FIG.
OCR program memory (P) 1) explained in Figure 3
2 is a diagram showing an example of each processing program necessary to implement the present invention, which is stored in the computer.
第1図において、(a)はトロンブアウトカラーで印刷
されたスペーシング帳票を示したもので、縦のグリッド
間隔は、例えば1.02mm、横のグリッド間隔は、例
えば0.635mmで、この帳票をOCRで読み取って
も、上記グリッドは読み取られることがない。In Figure 1, (a) shows a spacing form printed in trombe-out color, where the vertical grid spacing is, for example, 1.02 mm, and the horizontal grid spacing is, for example, 0.635 mm. Even when a form is read using OCR, the grid is not read.
(b> は上記スペーシング帳票上において、OCRの
為の帳票設計を行う場合の記入規則を示したもので、「
枠属性」で示した活字枠2手書き枠2画像枠毎に、[縦
/横グリ・ノド数」等が示されている。(b> indicates the entry rules when designing a form for OCR on the above spacing form.
For each type frame 2 handwriting frame 2 image frame indicated by ``frame attribute'', ``vertical/horizontal grid/number of gutter'', etc. are shown.
上記記入規則に従って、記入された例を示したものが(
c)であり、■は手書き文字入力枠の例を示しており、
■は画像入力枠の例を示しており、■ば活字文字人力枠
の例を示している。An example of filling in according to the above entry rules is (
c), ■ indicates an example of a handwritten character input frame,
■ indicates an example of an image input frame, and ■ indicates an example of a manually input frame for printed characters.
(d)は、(c)で示した、例えば手書き枠■に記入さ
れた文字(1〜)に対する処理例を示したもので、運用
段階でOCRに入力された大量の帳票を処理する場合の
処理方法を示しているので、それぞれの文字がOCRの
為の帳票フォーマ・71−テーブルデータとして、各文
字枠対応で、ファイルメモリ(FM) 8に格納される
。(d) shows an example of processing the characters (1 to 1) written in the handwriting frame ■ shown in (c), for example, when processing a large number of forms input to OCR at the operational stage. Since the processing method is shown, each character is stored in the file memory (FM) 8 as a form former 71-table data for OCR in correspondence with each character frame.
次に、第2図によって、上記スペーシング帳票の具体的
な処理方法を説明する。Next, a specific method of processing the spacing form will be explained with reference to FIG.
先ず、本OCRのキーボード’llによって、殿構制御
プログラム25が起動され、機構制御部71から機構部
7を制御して、当該スペーシング帳票か光学部6に入力
される。First, the temple structure control program 25 is activated by the keyboard 'll of this OCR, and the mechanism control section 71 controls the mechanism section 7 to input the spacing form into the optical section 6.
この時、光学部6で読み取られた光信号が、光電変換部
61で2値データに変換され、前処理部5を経由して画
像メモリ(GM) 4に格納される。At this time, the optical signal read by the optical section 6 is converted into binary data by the photoelectric conversion section 61, and stored in the image memory (GM) 4 via the preprocessing section 5.
該スペーシング帳票データの、画像メモリ(GM)4に
対する格納が完了すると、肥大枠検出プログラム26が
起動され、当該スペーシング帳票上に記入されている各
種の枠データが読み取られ、ワークメモリ(闇)3に格
納される。When the storage of the spacing form data in the image memory (GM) 4 is completed, the enlarged frame detection program 26 is started, and various frame data written on the spacing form is read and stored in the work memory (GM). )3.
この場合、先ず「行切り出し」か行われる。具体的には
、画像メモリ(GM) 4から、上記スペーシング帳票
の2値情報を、行単位で読み出し、該行を構成している
画素データに連続した黒1即ち1゛か存在することを検
出して、最初の横枠を検出する。In this case, "line cutting" is first performed. Specifically, the binary information of the above-mentioned spacing form is read out from the image memory (GM) 4 on a line-by-line basis, and it is determined that there is a continuous black 1, that is, 1' in the pixel data constituting the line. Detect to find the first horizontal frame.
同じ操作が繰り返されて、次の横枠を検出することによ
り、ある文字入力枠に対する「行切り出し」が完了する
。By repeating the same operation and detecting the next horizontal frame, "line cutting" for a certain character input frame is completed.
以下同じようにして、複数個の文字入力枠1画像入力枠
の「行切り出し」か行われる。Thereafter, "line cutting" of a plurality of character input frames and one image input frame is performed in the same manner.
次に、上記「行切り出し」か行われた枠に関して、行枠
の存在する範囲で、「列切り出し」を行い、各列につい
て、連続した黒の画素列を検出すると、複数個の文字枠
か認識され、それぞれの文字枠についての、上記「行切
り出し」情報、「列切り出し」情報が、上記ワークメモ
リ(Wl’l) 3に格納される。Next, for the frame that has been subjected to the above-mentioned "row cutting", "column cutting" is performed within the range where the row frame exists, and if a continuous black pixel string is detected for each column, multiple character frames can be extracted. The "line cutting" information and "column cutting" information for each character frame are stored in the work memory (Wl'l) 3.
次に、文字/図形認識プログラム27が起動され、上記
ワークメモリ(WM) 3に格納されている「行切り出
し」、「列切り出し」情報と、当該認識プログラムがテ
ーブルとして持っている、第1図(1))で説明した枠
規則情報から、それぞれの枠の特徴を認識して、前述の
手書き文字入力枠、活字文字入力枠、画像入力枠とを識
別し、それぞれの枠の特徴パラメータを、同じワークメ
モリ(WM) 3に格納する。Next, the character/figure recognition program 27 is started, and the "row cutting" and "column cutting" information stored in the work memory (WM) 3 and the table shown in FIG. From the frame rule information explained in (1)), the characteristics of each frame are recognized, the aforementioned handwritten character input frame, printed character input frame, and image input frame are identified, and the characteristic parameters of each frame are determined by Stored in the same work memory (WM) 3.
同じようにして、例えば、手書き文字入力枠に記入され
ている文字を認識して、その特徴パラメータを、各文字
枠情報に対応させて、ワークメモIJ (WM) 3に
格納する。当該認識された文字は、第1図で説明したよ
うに、枠内データの処理方法を示すものである。In the same way, for example, characters written in a handwritten character input box are recognized, and their feature parameters are stored in the work memo IJ (WM) 3 in association with each character box information. The recognized character indicates the method of processing the data within the frame, as explained in FIG.
この段階で、OCRの為の帳票フォーマット作成プログ
ラム28が起動され、上記ワークメモリ餉1)3に格納
されている各種データに基づいて、当該帳票フォーマッ
トテーブルを作成し、ファイルメモリ(F)1) 8に
格納する。At this stage, the form format creation program 28 for OCR is activated, creates the form format table based on the various data stored in the work memory 1) 3, and creates the form format table in the file memory (F) 1). Store in 8.
このように、本発明においては、スペーシング帳票上に
記入された帳票イメーンに基ついて、直接に、運用時の
帳票読み込みに必要な帳票フォーマットチーフルを作成
できる所に特徴かある。As described above, the present invention is characterized in that a form format file necessary for reading the form during operation can be created directly based on the form image written on the spacing form.
運用時においては、上記と同しようにして、公知の方法
によって、画像メモリ(GM) 4に読み込まれた帳票
データから、ファイルメモリ(FM) 8に格納されて
いる、上記帳票フォーマットテーブルを参照して、当該
帳票の各枠内に記入されているデータを認識し、外部イ
ンタフェース部9を通して、ホスト計算機に送出する。During operation, in the same manner as above, the form format table stored in the file memory (FM) 8 is referred to from the form data read into the image memory (GM) 4 using a known method. Then, the data entered in each frame of the form is recognized and sent to the host computer through the external interface section 9.
以上、詳細に説明したように、本発明の光学文字/図形
読み取り装置は、フォーマット入ノj帳票に、ドロンプ
アウトカラーで印刷されたスペーシング帳票を使用し、
該スペーシング帳票に、実際の帳票に合わせて、文字読
み取り枠1図形入力枠を記入し、各枠の一部に処理方法
を記入して、OCRに読み取りを行わせ、各枠データを
OCRが検出することにより、読み取り位置の算出を行
い、各枠内の記入文字から読み取り方法の決定を行い、
OCRの為の帳票フォーマットとするようにしたもので
あるので、スペーシング帳票に記入した帳票設計イメー
ジの侭で、OCRの為の帳票フォーマットのデータが作
成でき、簡単で、且つマンマシンインタフェースの良い
、0(、Hの為の帳票フォーマットを作成する為のデー
タ入力方法か得られる効果がある。As described above in detail, the optical character/figure reading device of the present invention uses a spacing form printed in drop-out color on a formatted form,
In the spacing form, fill in the character reading frame 1 figure input frame according to the actual form, write the processing method in a part of each frame, have the OCR read it, and OCR will read each frame data. By detecting it, the reading position is calculated, and the reading method is determined from the characters written in each frame.
Since it is designed to be a form format for OCR, data in the form format for OCR can be created based on the form design image entered in the spacing form, which is easy and has a good man-machine interface. ,0(,H) has the effect of providing a data input method for creating a form format for H.
第1図は、本発明を実施して、OCRの為の帳票フォー
マットを作成する概念を説明する図。
第2図は本発明を実施するのに必要な各処理プログラム
を示した図である。
第3図は光学文字/図形読み取り装置(OCR)の構成
例をブロック図で示し1こ図、・
である。
図面において、
lはマイクロプロセッサ(MPU)。
2はプログラムメモリ(PM)。
3はワークメモリ(WM)、 4は画像メモリ(GM)
。
5は前処理部、 6ば光学部。
61は光電変換部、 7は機構部。
71は機構制御部、 8フアイルメモリ(FM>
。
9外部インタフェース部。
10はディスプレイ装置(DISP)。
11はキーボード。
21〜28は各種処理プログラム。
をそれぞれ示す。
耳 1 (2)
fα)FIG. 1 is a diagram illustrating the concept of creating a form format for OCR by implementing the present invention. FIG. 2 is a diagram showing each processing program necessary to implement the present invention. Figure 3 shows a block diagram of an example of the configuration of an optical character/graphic reader (OCR). In the drawing, l represents a microprocessor (MPU). 2 is a program memory (PM). 3 is work memory (WM), 4 is image memory (GM)
. 5 is a preprocessing section, and 6 is an optical section. 61 is a photoelectric conversion section, and 7 is a mechanism section. 71 is a mechanism control unit, 8 file memory (FM>
. 9 External interface section. 10 is a display device (DISP). 11 is the keyboard. 21 to 28 are various processing programs. are shown respectively. Ear 1 (2) fα)
Claims (1)
、記入規則に従って、実際に使用する帳票イメージで記
入された帳票と、該帳票上の文字、及び図形を直接認識
する手段とを備え、その認識された上記スペーシング帳
票から、大量に処理すべき帳票に対する光学文字/図形
読み取り装置(OCR)の為の帳票フォーマットを作成
する手段を備えたことを特徴とする光学文字/図形読み
取り装置。A spacing form printed in dropout color is provided with a form filled in with the image of the form actually used according to the entry rules, and a means for directly recognizing the characters and figures on the form, and the recognized An optical character/graphic reading device comprising means for creating a form format for an optical character/graphic reading device (OCR) for a large number of forms to be processed from the spacing form.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59222605A JPS61100873A (en) | 1984-10-23 | 1984-10-23 | Optical character/graphic reading device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59222605A JPS61100873A (en) | 1984-10-23 | 1984-10-23 | Optical character/graphic reading device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61100873A true JPS61100873A (en) | 1986-05-19 |
Family
ID=16785078
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59222605A Pending JPS61100873A (en) | 1984-10-23 | 1984-10-23 | Optical character/graphic reading device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61100873A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011076581A (en) * | 2009-09-04 | 2011-04-14 | Ricoh Co Ltd | Image processing apparatus, system and method, and program |
JP2014071697A (en) * | 2012-09-28 | 2014-04-21 | Omron Corp | Image processing system and image processing method |
-
1984
- 1984-10-23 JP JP59222605A patent/JPS61100873A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011076581A (en) * | 2009-09-04 | 2011-04-14 | Ricoh Co Ltd | Image processing apparatus, system and method, and program |
US9307109B2 (en) | 2009-09-04 | 2016-04-05 | Ricoh Company, Ltd. | Image processing apparatus, image processing system, and image processing method |
JP2014071697A (en) * | 2012-09-28 | 2014-04-21 | Omron Corp | Image processing system and image processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5231579A (en) | Method and system for displaying and processing image of form document | |
JP4356847B2 (en) | Field definition information generation method, line and field definition information generation device | |
US5867596A (en) | Method for diagram recognition by using recognizing rules and system for implementing the method | |
JP2005216203A (en) | Table format data processing method and table format data processing apparatus | |
JP6856916B1 (en) | Information processing equipment, information processing methods and information processing programs | |
JPS61100873A (en) | Optical character/graphic reading device | |
JP2000322417A (en) | Device and method for filing image and storage medium | |
JPH11219394A (en) | Automatic various financial chart input device | |
JPH08161314A (en) | Document display device | |
JPH01243174A (en) | System for defining business form data processing | |
JP2682873B2 (en) | Recognition device for tabular documents | |
Labarga et al. | An Extensible System for Optical Character Recognition of Maintenance Documents | |
WO2024027827A1 (en) | Method for inputting handwritten form data into a pdf electronic form | |
JPH0991107A (en) | Paper format register device | |
JPH0789361B2 (en) | Form registration device | |
JPH04293185A (en) | Filing device | |
JPH0429089B2 (en) | ||
JPS62190565A (en) | Device for making fair copy of hand-written pattern | |
JPH11184949A (en) | Slip processing device and storage medium | |
JPH0452866A (en) | Automatic formation system for operation program | |
CN116303237A (en) | Image data structure capable of backtracking errors and labeling method | |
JPH10340314A (en) | Document processing system, character recognition method therefor and record medium therefor | |
JPS63204486A (en) | Character input device | |
JPH056245A (en) | Method and device for processing image | |
JPH04353964A (en) | Document generation device |