JPS60146373A - Pattern recognition system - Google Patents

Pattern recognition system

Info

Publication number
JPS60146373A
JPS60146373A JP59001914A JP191484A JPS60146373A JP S60146373 A JPS60146373 A JP S60146373A JP 59001914 A JP59001914 A JP 59001914A JP 191484 A JP191484 A JP 191484A JP S60146373 A JPS60146373 A JP S60146373A
Authority
JP
Japan
Prior art keywords
character
information
image
symbols
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59001914A
Other languages
Japanese (ja)
Other versions
JPH0661112B2 (en
Inventor
Yasuaki Nakano
中野 康明
Kunihiro Okada
邦弘 岡田
Osamu Kunisaki
国崎 修
Hiromichi Fujisawa
藤沢 浩道
Masao Michino
道野 正雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59001914A priority Critical patent/JPH0661112B2/en
Publication of JPS60146373A publication Critical patent/JPS60146373A/en
Publication of JPH0661112B2 publication Critical patent/JPH0661112B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To facilitate specification of format information by utilizing a document form where characters (including marks) are entered and by feeding out and recognizing them. CONSTITUTION:A control part 2 feeds-out a character pattern from a document form image. An output of the feed-out processing includes a character pattern and its position information, which are stored in a memory 5. A character pattern is recognized in a character recognition part 6, and a character code of the recognized result is stored in the memory 5 as related to the position information. Characters which cannot be recognized are displayed on a keyboard display 7, and an operator inputs a right answer. After all characters have been recognized, the control part 2 executes field generation processing. An input document form is converted into a digital image in a photoelectric converter 4 and stored in the memory 5. The character recognition part 6 carries out character feeding-out and recognition through a known method by utilizing format information in terms of the documents form image stored in the memory 5.

Description

【発明の詳細な説明】 〔発明の牙υ用分野〕 本発明はバター7認識方式に係り、特に帳票上の文字記
入位置の情報によって出力書式を制御する場合に適した
文字・記号の認識方式に関する。
[Detailed Description of the Invention] [Field of the Invention] The present invention relates to a butter 7 recognition method, and is particularly a character/symbol recognition method suitable for controlling an output format based on information on the position of writing characters on a form. Regarding.

〔発明の背景〕[Background of the invention]

従来の文字認識装置は、帳票エツジから計測した位置に
より文字枠を規定し、その文字枠について出力書式(た
とえばカードイメージ上のカラム位りやチェック形式(
演算チェックの方式など)を指示する簀式情報を帳票様
ごとに規定していた。
Conventional character recognition devices define a character frame based on the position measured from the edge of the form, and specify an output format (for example, column position on a card image or check format) for that character frame.
Screen style information that instructs the method of checking calculations, etc.) was specified for each form type.

以下、文字枠の位置、出力書式、チェック形式など帳票
檎に付随してだめられる情報を書式情報と呼ぶ。しかし
ながら、書式情報の指定方法が難しいためこれを1−易
化する方法が要望されている。
Hereinafter, information stored along with a form, such as the position of a character frame, output format, and check format, will be referred to as format information. However, since the method of specifying format information is difficult, there is a need for a method that simplifies this process.

また、既存の帳票は文字認識を意識していないため文字
枠のないものがあシ、このようなものは文字枠の指定が
困難である。また、黒色の文字や表・線など(以下ブレ
プリントと呼ぶ)が妨害情報となシ、読取対象文字を切
シ出すことが困難な場合も多い。
In addition, existing forms do not have character recognition in mind, so some do not have character frames, and it is difficult to specify character frames for such documents. Furthermore, black characters, tables, lines, etc. (hereinafter referred to as blemish prints) may act as interfering information, and it is often difficult to cut out the characters to be read.

〔発明の目的〕[Purpose of the invention]

本発明の目的は上述した欠点に鑑みて、書式情報の指定
が容易にできるパターン認識装置を提供することにあシ
、さらに、上記の特別な場曾としてブレプリントを有す
る帳票を用いたときも書式情報の指定が容易にできるパ
ターン認識方式を提供することにある。
SUMMARY OF THE INVENTION In view of the above-mentioned drawbacks, an object of the present invention is to provide a pattern recognition device that can easily specify format information. An object of the present invention is to provide a pattern recognition method that allows format information to be easily specified.

〔発明の概要〕[Summary of the invention]

上記の目的を達成するため、本発明においては帳票上に
文字(記号を含む)を記入したものを用い、この文子を
切り出して認識する。切シ出し時に文字の記入位−が計
測できるのでこれから文字枠の位置情報を生盛し、文字
認識結果からその、は味を理解して出力書式などの情報
を生成し、これらから一式i%[を生成することにより
上記の目的を達成する。
In order to achieve the above object, in the present invention, characters (including symbols) are written on a form, and these letters are cut out and recognized. Since the position of the characters can be measured when cutting out the characters, the position information of the character frame can be generated from this, the character recognition result can be understood to generate information such as the output format, and from this, a set of i% The above purpose is achieved by generating [.

〔発明の実施例〕[Embodiments of the invention]

以下、本発明の一犬施例を第1図により説明する。第1
図は本発明の認識方式を実施する装置の構成を示すブロ
ック図で6る。装置の各部はバス1に接続され、全体の
動作は制御部2により制御される。−票3の上の情報は
光−変遺装+tt4にょシ走食、光亀変換、ディジタル
化を経てメモリ5の中に格納される。以下の説明では省
略するが、尚効率符号化によシイメージの表現に必要な
メモリ童を節約することもコスト上有/luになること
がある。また、以下の説明では1画素1ビツトに二値化
するものとするが、1画素を多値で表現してもよくまた
カラースキャナにょシ色情報を・N4してもよい。
Hereinafter, a one-dog embodiment of the present invention will be explained with reference to FIG. 1st
The figure is a block diagram showing the configuration of a device implementing the recognition method of the present invention. Each part of the device is connected to a bus 1, and the overall operation is controlled by a controller 2. - The information on ticket 3 is stored in the memory 5 through photo-transformation + tt4 photo-transformation, phototransformation, and digitization. Although not described in the following, saving the memory required for expressing the image by efficient encoding may also be advantageous in terms of cost. Further, in the following explanation, it is assumed that one pixel is binarized into one bit, but one pixel may be expressed with multiple values, or the color information may be expressed by a color scanner.

使用に当って、まず使用する帳票に書式情報を指示する
文字を記入したもの(以下これ全書式指示帳票と呼ぶ)
を読み取らせる。本実施例では帳票はドロップアウトカ
ラーで印刷しであるものとし、帳票イメージの中で紀人
文手だけが黒で表現されているものとする。ここで使用
する文字としては英字大文字のみを・k用するものとし
、後述する切り出し処理を単純化しているが、英字に限
らず片仮名、数字めるいは漢字などを使用してもよい。
When using the form, first write characters indicating format information on the form to be used (hereinafter referred to as the full format instruction form).
have them read. In this embodiment, it is assumed that the form is printed in a dropout color, and that only the characters written by Kijin Bunte are expressed in black in the form image. As for the characters used here, only uppercase alphabetic letters are used for ``k'' to simplify the extraction process described later, but not only alphabetical characters but also katakana, numbers, kanji, etc. may be used.

上記の1脹票イメージから1flJ御部2によシ文字パ
ターンを切り出す。切り出し処理の詳mlについては後
述する。切り出し処理の出力は文字パターンとその位置
情報で69、これらはメモリ5に格納される。文字パタ
ーンは文子認識部6によシ認威され、認識結果の文字コ
ードは位置清報に関連付けら几る形でメモリ5に格納さ
れる。認識不能文子がめったときはキーボードディスプ
レイ7に表示し、オペレータが正解を入力する。全ての
文字パターンを認識し終ったのち、制御部2によシ、フ
ィールド生成処理を行う。本実施例ではたとえば第2図
(A)のように記入された文字に対し、第2図(lのよ
うに文子の外接四辺形を作シ、同一文字に対する外接四
辺形を果めて第2図(C)に示すような長方形の領域を
生成する。この領域は文子認識装置に2いてフィールド
と呼ばれるものに対応し、一連の文子データが記入され
る枠を表す。フィールド生成処理の詳細については後述
する。谷フィールドに対しては異る文子コードが割#)
当てられているので、この文字コードがフィールドの識
別情報となシ、またフィールド内の文字数を計数するこ
とによりjt犬記入文字数がわかる。フィールドの識別
情報と各種の書式1H報との対応付は処理は制御部2に
より大行される。その対応付は処理の、#測については
後述する。前記の最大記入文字数も1式情報に含める。
A character pattern is cut out for 1flJ control section 2 from the above 1-slip image. Details of the extraction process will be described later. The output of the cutting process is a character pattern and its position information 69, which are stored in the memory 5. The character pattern is recognized by the sentence recognition section 6, and the character code resulting from the recognition is stored in the memory 5 in a form that is associated with the position information. When an unrecognizable sentence is rarely found, it is displayed on the keyboard display 7, and the operator inputs the correct answer. After all character patterns have been recognized, the control section 2 performs field generation processing. In this embodiment, for example, for a character written as shown in FIG. 2 (A), a circumscribed quadrilateral of a letter is created as shown in FIG. 2 (l), and a circumscribed quadrilateral for the same character is A rectangular area as shown in Figure (C) is generated. This area corresponds to what is called a field in the sentence recognition device, and represents a frame in which a series of sentence data is written. Details of the field generation process will be described later.A different Fumiko code is used for the valley field.)
This character code is used as identification information for the field, and by counting the number of characters in the field, the number of characters entered in the jt dog can be determined. The process of associating field identification information with various format 1H reports is carried out by the control unit 2. The correspondence will be described later in the processing, and the # measurement will be described later. The above-mentioned maximum number of characters to be entered is also included in the one-format information.

書式情報はメモリ5の中に格納されるが、出力装置t8
に出力してもよい。簀式指示情報全体をキャラクタイメ
ージでキーボードディスプレイ7の上に表示することも
有効である。
The format information is stored in the memory 5, while the output device t8
You can also output to It is also effective to display the entire screen-style instruction information as a character image on the keyboard display 7.

i式指示帳票の処理が終了すると入力帳票の処理に入る
。人力帳票は光電変m装置4によりディジタルイメージ
にfmされ、帳票イメージがメモリ5に、洛納され・り
。メモリ5に格納ざn/こ上記の帳票イメージに対して
、文字認誠部6は公用の手法に従って、−武1#様(メ
モリ5の中にある)を用いた文+−切り出しと認識とを
行う。認識結果のチェックも簀式・1#報によって行わ
れるが、チェック処理ケ文子認識部6と制御品2のいず
れに行わせてもよい。認、、lt績釆が出力装置に転送
され、次の入力1脹票の処理に移る。
When the processing of the i-type instruction form is completed, processing of the input form begins. The manual form is converted into a digital image by the photoelectric conversion device 4, and the form image is stored in the memory 5. Stored in the memory 5 For the above form image, the character recognition section 6 extracts and recognizes the sentence using - Take 1# (in the memory 5) according to the official method. I do. Although the recognition result is also checked using the screen type 1# report, either the check processing card recognition unit 6 or the control product 2 may perform the check. The results are transferred to the output device, and the process moves on to the next input slip.

久に111制御部2における処理の詳細について述べる
。第3図は切り出し処理の流れ因をPA’l>(pro
gram Analys+s l)iagram)形式
で誓いだものである。301は初期化で、輪郭数Kを0
にセットする。302,303の二重ループによシ1隈
票イメージP(iIJ)を走食し、304〜308の処
理を繰シ返す。304では黒画素を構出する。伏出し/
ことき、305〜310の処4!を行う。305ではK
を1だけ増す。306のループでは304で演出した黒
画素を出発点として輪郭トレースを行い、306ではそ
の一郭におけるx+yffl標の最小値と最大値Xm1
a HXmmx +)’1111111 )’5axk
lfl出する。307では(Xm1m gyallと(
Xゆall l Yta&工)を対角頂点とする四辺形
の狽城をパターンバッファ(メモリ5の中の領域)の第
に會目の領域に伝送する。309では帳票イメージ甲で
上記の四辺形′唄域について・直を消去する(P(x、
y)=0りるいは2とおく処理7行うン。31υでは上
記の四辺形狽城の中心座標(、xh 、Yk)を輩録す
る。以上の処理によって、文子パターンが切り出される
ことは明らかでδシ、J辰票イメージを走査し終った時
点でのKは文子パターン個数を表す。
The details of the processing in the 111 control unit 2 will be described shortly. Figure 3 shows the flow factors of the extraction process.
gram Analysis+s l)iagram) format. 301 is initialization and sets the number of contours K to 0.
Set to . A double loop of steps 302 and 303 is used to scan one square image P (iIJ), and the processes of steps 304 to 308 are repeated. In 304, black pixels are constructed. Hidden/
Kotoki, 305-310 place 4! I do. K in 305
Increase by 1. In the loop of 306, the outline is traced using the black pixel created in 304 as a starting point, and in 306, the minimum value and maximum value of the x+yffl mark in that area are traced.
a HXmmx +)'1111111)'5axk
lfl out. In 307 (Xm1m gyall and (
A quadrilateral structure having diagonal vertices at XYALL YTA & ENG is transmitted to the first area of the pattern buffer (area in the memory 5). In 309, delete the ``direction'' of the above quadrilateral ' song area in the form image A (P(x,
Set y)=0 or 2 and perform process 7. At 31υ, record the center coordinates (, xh, Yk) of the above quadrilateral castle. It is clear that the above-described processing cuts out the Bunko patterns, and K represents the number of Bunko patterns at the time when the J-print image is scanned.

久に第4図にフィールド生成処理の流れ図をPAD形式
で示す。400はフィールド数Mの初期値を0とする。
FIG. 4 shows a flowchart of field generation processing in PAD format. 400, the initial value of the number of fields M is 0.

401は文子数にの回数だけ402−413を繰シ返す
ループである。402では第に文字の認識結果几(k)
がスペースであるか否かを調べる。スペースでないとき
403〜413を行う。403ではフィールド番号Mを
1増しフィールド内文字数LMの初期値を1と2くなど
の初期化を行う。404は、k+1以;赤の認識結果に
ついて几(k)と同じか否かt調べるだめのループでろ
る。405の判定によシ、第j文字が第に文字と同一で
める(R(j)=R(k))とき、406〜408ケ行
う。406は文字数をまたり4′j0’4 Ll 7は
6文子の中心位置(xJlyJンの′)ち、璃小値x、
、y、と最大値xb。
401 is a loop that repeats 402-413 as many times as Fumiko. 402, the character recognition result 几(k)
Check whether is a space. If it is not a space, perform steps 403 to 413. In step 403, initialization is performed such as incrementing the field number M by 1 and decrementing the initial value of the number of characters LM in the field by 1 and 2. 404 is a loop in which it is checked whether t is the same as 几(k) for the recognition result of k+1 or more; red. According to the determination in step 405, when the jth character is the same as the first character (R(j)=R(k)), steps 406 to 408 are performed. 406 is the number of characters, 4'j0'4 Ll 7 is the center position of 6 sentences (xJlyJ's'), and the small value x,
, y, and the maximum value xb.

’jbとを・演出ターる。408ではkL(Nをスペー
スにひきかえることにより同一処理を以後は行わないよ
りにしている。404のループが終了すると、回−結果
を有する文字の又手数りと、その座標の最大、最小値が
められている。409は、Xとyとについて最大値と最
小値の差を比較し、縦に同一文字が並んでいるか、横に
並んでいるかを補足する(本美施列では同一文字は1行
に誓くとしている。なお、この栄件は必然的なものでは
なく説明を単純にするために仮に設定したものでめる。
'jb and the director. In 408, kL(N is replaced with a space so that the same process will not be performed again. When the loop in 404 is completed, the number of times of the character with the result, and the maximum and minimum values of its coordinates. 409 compares the difference between the maximum and minimum values for He swears in one line.This honor is not a necessary one, but is a temporary one set to simplify the explanation.

)縦簀きのときは410の処理を行い、X座標の平均値
の上下δをフィールドの横鴨とする。
) In the case of a vertical screen, the process of 410 is performed, and the upper and lower δ of the average value of the X coordinate are set as the horizontal duck of the field.

縦の冒さは、最小値と最大値の間外側にδだけ余裕をと
ったものをとる。横書きのときは411の処理を行う。
The vertical length is determined by leaving a margin of δ outside between the minimum and maximum values. When writing horizontally, process 411 is performed.

412はフィールド情報の転送であり、フィールド着号
M1文字e L M 、フィールドの外側のt%標(X
’s 、 Xb 、 Y−、Yb ) 、フィールド識
別情報R(k)を転送する。413ではR(k)會スペ
ースでクリアする。従って、401のループが終ったと
き、ヱでのフィールドについて上i4己の情報が伝送さ
れて2シ、几は全てスペースとなる。なお、不処理はフ
ィールド内文子数Lwが1の4甘でも正しく動作する。
412 is the transfer of field information, field number M1 character e L M, t% mark (X
's, Xb, Y-, Yb), field identification information R(k) is transferred. At 413, clear with R(k) meeting space. Therefore, when the loop 401 is completed, the information of the upper i4 is transmitted for the field 2, and all of the fields 2 and 4 become spaces. Note that non-processing operates correctly even when the number of text children in the field Lw is 1, which is 4.

筐た、フィールド1−−Eたけ文字数から文子記入ピッ
チを計其して歓送してもよい。
In addition, the pitch of Fumiko's entry may be calculated from the number of characters in field 1--E and sent.

次に、第5図にフィールドの識別1#報と誓式情報との
対応付は処理の匝れ図をPAD形式で示す。
Next, FIG. 5 shows a processing diagram of the correspondence between the field identification 1# information and the oath ceremony information in PAD format.

この処理では識別1肯報を几と令して誓いである。In this process, the confirmation of identification 1 is strictly ordered.

501は、あらかじめ登録された錘式情報の個数Nだけ
以下の処理ケ繰り返すループである。第n着目の齋式消
報には見出し情報として文字符号G(n)が含まれてい
る。502ではRとQ(n)とを比較する。一致したと
きは、503で第04目のd穴情報rフィールド用の畜
式情報エリアに転送する。
501 is a loop that repeats the following processing by the number N of pieces of weight type information registered in advance. The n-th Sai-style Newsletter includes the character code G(n) as heading information. At 502, R and Q(n) are compared. If they match, in step 503, the information is transferred to the livestock type information area for the 04th d-hole information r field.

実施例では誉式指示帳票に記入する文子として英字を用
いて説明したがこnに限ることなく仮名や漢字なども匣
用できることは上述の通りでるるまた、同一文子の配列
として縦あるいは横1行だけでlく訊数行に誉いてもよ
く、L字形や1字形に膏いてもよい。′また、フィール
ド指定として同一文子の4続だけでなく、各種の省略形
式を使ったシ、枠を補助i己号に使ったシすることもで
きる。
In the example, the explanation was given using English letters as the letters to be filled in on the honor style instruction form, but as mentioned above, it is not limited to these, and kana and kanji can also be used. It can be written in just a few lines, or it can be written in an L shape or a single character shape. 'Furthermore, as field specifications, it is possible not only to specify a quartet of the same sentence, but also to use various abbreviations and to use a frame as an auxiliary symbol.

第6図にいろいろなフィールド指定の変形の例を示す。FIG. 6 shows examples of various field specification modifications.

第8図で(A)は結合龜己号として直朦を用いた丙でめ
ゐ。(H)は枠で囲った領域を一つのフィールドとし、
フィールド識別記号(文字Aで表す)とフィールド同文
字数(この例では5である)を日己人した例である。(
C)は枠の中にフィールド識別記号のみを記入し、フィ
ールド同文字数や文字ピッチはその識別記号に対応する
誉式情報から得るものである。このフィールド識別記号
が特定の文字であるとき、このフィールドはイメージエ
リアでろって文子の切り出し・認識を行わずイメージの
転送のみケ行うようにすることもできる。(JJ)は頂
戴指定を四隅のみで行った例、(E)はIA@指定を角
カッコで行ったl/Llでのる。
In Figure 8, (A) is a double character using Naoto as the connecting name. In (H), the area surrounded by a frame is one field,
This is an example in which the field identification symbol (represented by the letter A) and the same number of characters in the field (5 in this example) are Japanese and Japanese. (
In C), only the field identification symbol is written in the frame, and the number of characters in the same field and the character pitch are obtained from the Homare style information corresponding to the identification symbol. When this field identification symbol is a specific character, this field can be set to an image area so that only the image is transferred without cutting out or recognizing the text. (JJ) is an example in which the top designation is made only in the four corners, and (E) is an example in which the IA@ designation is made in square brackets as l/Ll.

上記の変形に2いて必要な線〇抽出について説明する。The line 〇 extraction necessary for the above transformation will be explained.

第7図は第6図(11)めるいは((,1)に示した長
方形の構出の処理の一例を示す流れ図である。701で
は輪郭抽出を行う。7o2で全ての同輪郭について、7
03〜707の処理を味9返しその内輪郭が長方形か否
か調べる。703はエラー7ラグをリセットする。70
4のループでは輪郭を一周し、705の四隅懺出の処理
を繰シ返すっ706のループでは輪郭を一周し上記の四
隅から計算した仮想的な四辺と各点の距離を計算する。
FIG. 7 is a flowchart showing an example of processing for the rectangular structure shown in FIG. 7
Repeat steps 03 to 707 nine times and check whether the outline is rectangular or not. 703 resets error 7 lag. 70
In loop 4, the process goes around the contour and repeats the four corner extraction process in 705. In loop 706, the process goes around the contour and calculates the distance between each point and the virtual four sides calculated from the four corners.

この距離が必る聞直ε以上であるときは仮想辺と輪郭が
離れている(直ン一でない)揚曾でろC1707でエラ
ーフラグをセットし、ループを脱出する。706のルー
プが終了したときエラーフラグがリセット状態であるな
らばこの内輪郭は長方形でりるとする。な−、説明を省
略したが相隣る仮想二辺のなす角がほぼ直角でめること
を調べるのも・ぼ幼でめる。
If this distance is greater than or equal to the required distance ε, an error flag is set in C1707 where the virtual side and the contour are far apart (not directly aligned), and the loop is exited. If the error flag is in a reset state when the loop 706 is completed, the inner contour is assumed to be a rectangle. Although I have omitted the explanation, it is easy for young children to find out that the angles formed by two adjacent imaginary sides are almost right angles.

仄に1#48図により第二の実施・列を説明する。本実
施例は第一図と同一の4成であるが、制御部2によるI
b1JiII41の流れρS異なっている。不実施例使
用する1成票は通虐のfM色で枠や文字が印刷されたも
のでの9、この枠や文子會以下ではプレプリントと呼ぶ
。第8図は本犬雁列の制御の流nを示す流n図(PAD
形式)でめる。801r1.各種の初期化を行う。80
2でVま何も文子・記号の記入されてい・ヱい帳票のイ
メージ(無記入帳票イメージ)Aでメモリ5の中に格納
する。次に803で誉式指示−脹票の帳票イメージB’
cメそり内に取9込む。
The second implementation/column will be briefly explained with reference to Figure 1#48. This embodiment has the same four components as in FIG.
The flow of b1JiII41 is different. The non-example 1 slip used is 9 with a frame and letters printed in the common fM color.This frame and Bunkokai are referred to as preprints hereafter. Figure 8 is a flow diagram (PAD
format). 801r1. Performs various initializations. 80
In step 2, V is stored in the memory 5 as an image of a form with letters and symbols written on it (an image of a blank form). Next, in 803, honor style instruction - form image B' of the invoice
Insert 9 into the C mesori.

804では誉式指示帳票イメージBから無記入帳票イメ
ージAを差し引き、誓式指示のために記入さnた文字パ
ターンだけを含む1成票イメージPを侍ゐ。805は第
一の実施例における文子切p出し・6g鐵・書式情報生
成の処理であり、誓式情報Fが生成きれる。806以降
が絖み取るべき入力帳票の処理のループであシ、806
は入力帳票がなくなるまで処理を続けるととt示す。8
07では人力・脹票イメージCをメモリ内に取り込む。
At 804, the blank form image A is subtracted from the honor ceremony instruction form image B to obtain a single form image P that includes only the character pattern filled in for the oath ceremony instruction. Reference numeral 805 is the process of generating sentence cutout, 6g iron, and format information in the first embodiment, and oath ceremony information F can be generated. 806 and subsequent steps are the input form processing loop that should be cleared, 806
indicates that the processing will continue until there are no more input forms. 8
In step 07, the human power/expansion image C is loaded into the memory.

808ではイメージC7JhらイメージA全差し引き、
読み柩シ対象文子パターンにけを言む帳票イメージQを
得る。809ではd式創4i F ’x用いて上記のイ
メージQ〃λら文字の切り出し、7鴫に行う。
In 808, image C7Jh and image A are all subtracted,
A form image Q is obtained that criticizes the target Fumiko pattern. In 809, characters are cut out from the above image Q〃λ using d formula creation 4i F'x, and the characters are cut out into 7 squares.

810はg砿枯釆を出力する。人力1脹票がなくなると
806のループを脱出し、811で終了処理を行う。
810 outputs g 砿Karashi. When there are no more votes left, the process exits from the loop at 806 and completes the process at 811.

第−及び第二の央〃也例では、人力帳票【光−変換して
直ちに処理するとしたが、無記入帳票、41:式指示帳
票、入力I隈票のいず肚かを、るるいはその全てを光電
変換したとき帳票イメージr一旦外部記憶#:直(例え
ば光ディスク)に記憶させたのち、上記の外部記憶装置
から帳票イメージエリアみ出したものを処理するように
してもよい。このようにすれば、光ディスクに最初はイ
メージの形で記憶させてVいた文書を時1司的余裕のお
るときに処理して、そのうちの一部分のみを認識させて
符号化することができ、請求誓、見積誉その他の定形文
簀において可変部分のみを符号化することが可能となる
In the first and second central examples, it was assumed that the manual form [optical conversion] would be processed immediately, but any of the blank form, 41: formula instruction form, and input I area form could be processed by Rurui or When all of them are photoelectrically converted, the form image r may be stored directly in an external storage (for example, an optical disk), and then the form image area protruding from the external storage device may be processed. In this way, a document that is initially stored in the form of an image on an optical disk can be processed at a moment's leisure, and only a portion of it can be recognized and encoded. It becomes possible to encode only the variable parts in oaths, estimates, and other fixed forms.

〔発明の効果〕〔Effect of the invention〕

本発明によれば、非常に簡単な形で書式情報の用足かで
ざるので、きわめてkい易い文字認識装置が実現できる
。ざらに、帳票上にjcE人する誉式指示情報を単純な
形で表現してひき、詳細な情報を別途定義して結付する
こともできるので書式情報の追加修正が藺牟である。ま
た、既存の帳票をそのまま文子認識用に転用することも
簡単でめるので帳票の新規設計や印刷の手間が省ける。
According to the present invention, it is possible to realize a character recognition device that is extremely easy to use because it uses format information in a very simple form. Roughly speaking, it is possible to express the honor style instruction information on the form in a simple form, and then define detailed information separately and connect it, so it is necessary to add and modify the format information. Furthermore, existing forms can be easily used for sentence recognition, which saves the effort of designing new forms and printing them.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本蛇明の一実施例の4成を示すブロック図、第
2図は帳票イメージを説明するための原理図、第3図か
ら第8図は第1図の+1tlJ御部2にiける処理の流
れ図でるる。 1・・・バス、2・・・+ttlJ 4部、4・・・光
電f換部、5・・・メ第 2 日 (A)(B) (す J¥、 3 目 第 4 口 [育。 − 閂 第 !5 日 (D)(E) 第 7 凹 第 δ 口 第1頁の続き @発明者 遺賢 正雄小I 鴎
Fig. 1 is a block diagram showing the four components of one embodiment of the present invention, Fig. 2 is a principle diagram for explaining the form image, Figs. A flowchart of the process of opening is displayed. 1...Bus, 2...+ttlJ 4th part, 4...Photoelectric conversion part, 5...Me 2nd day (A) (B) (SuJ\, 3rd eye 4th mouth [Iku. − No. 5 (D) (E) No. 7 Concave No. δ Continuation of the first page @ Inventor Iken Masao Elementary School I Kaoru

Claims (1)

【特許請求の範囲】 1、入力帳票に記載された記号を認識し、該認識された
記号の間の関連を判定して同一群に属する記号の存在す
る領域を検出し、上記検出された領域の情報と記号とか
ら書式情報を生成することを特徴とするパターン認識方
式。 2、特許請求の範囲第1項の記載において、認識された
記号の中で同一記号の組を咲出して同一群に属すると判
定するとともに、上記の記号と書式1#報との変換テー
ブルを別途与えることを特徴とするパターン認識方式。 3、特許請求の範囲第1項の記載において線を抽出しそ
の囲む領域を検出し、認識された記号と上記の線で囲ま
れた領域との関連を判定することによって同一群に属す
る記号の存在する領域を検出することを特徴とするパタ
ーン認識方式。 4、特許請求の範囲第1項の記載において、予めディジ
タル画像の形に変換された基準帳票イメージを記憶して
おき、入力帳票イメージ力・ら上記の基準帳票イメージ
に含まれる部分を消去したのち、記号の認識を行うこと
を特徴とするパターン認識方式。 5、特許請求の範囲第1項の記載において、入力11辰
票のイメージ?一旦外部記憶装置に記憶させたのち、上
記外部記憶装置から読み出した入力1隈票イメージを認
識することを特徴とするパターン認識方式。
[Claims] 1. Recognize the symbols written on the input form, determine the relationship between the recognized symbols, and detect the area where symbols belonging to the same group exist, and the detected area A pattern recognition method characterized by generating format information from information and symbols. 2. In the description of claim 1, a set of the same symbols is identified among the recognized symbols and determined to belong to the same group, and a conversion table between the above symbols and the format 1# information is created. A pattern recognition method characterized by being provided separately. 3. In the description of claim 1, a line is extracted, an area surrounded by the line is detected, and a relationship between a recognized symbol and the area surrounded by the line is determined, thereby identifying symbols belonging to the same group. A pattern recognition method characterized by detecting existing areas. 4. In the statement of claim 1, after storing a standard form image converted into a digital image in advance and erasing the portion included in the standard form image from the input form image, , a pattern recognition method characterized by symbol recognition. 5. In the description of claim 1, is there an image of input 11? A pattern recognition method characterized by recognizing an input one-square image read out from the external storage device after it is once stored in the external storage device.
JP59001914A 1984-01-11 1984-01-11 Pattern recognition method Expired - Lifetime JPH0661112B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59001914A JPH0661112B2 (en) 1984-01-11 1984-01-11 Pattern recognition method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59001914A JPH0661112B2 (en) 1984-01-11 1984-01-11 Pattern recognition method

Publications (2)

Publication Number Publication Date
JPS60146373A true JPS60146373A (en) 1985-08-02
JPH0661112B2 JPH0661112B2 (en) 1994-08-10

Family

ID=11514847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59001914A Expired - Lifetime JPH0661112B2 (en) 1984-01-11 1984-01-11 Pattern recognition method

Country Status (1)

Country Link
JP (1) JPH0661112B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60183688A (en) * 1984-03-02 1985-09-19 Nec Corp Optical character reading system
JPS63113787A (en) * 1986-10-31 1988-05-18 Nec Corp On-slip data input system for character recognition device
JPH03134784A (en) * 1989-10-20 1991-06-07 Hitachi Ltd Optical reader

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57114974A (en) * 1981-01-09 1982-07-17 Toshiba Corp Optical character reader

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57114974A (en) * 1981-01-09 1982-07-17 Toshiba Corp Optical character reader

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60183688A (en) * 1984-03-02 1985-09-19 Nec Corp Optical character reading system
JPS63113787A (en) * 1986-10-31 1988-05-18 Nec Corp On-slip data input system for character recognition device
JPH03134784A (en) * 1989-10-20 1991-06-07 Hitachi Ltd Optical reader

Also Published As

Publication number Publication date
JPH0661112B2 (en) 1994-08-10

Similar Documents

Publication Publication Date Title
US20070294138A1 (en) Sheet processing system, sheet processing method, program, and optically read sheet
JPS60146373A (en) Pattern recognition system
JPS58208865A (en) Document producing device
JP2001126010A (en) Document processor, document definition generation method and area extraction method and storage medium
JPS6245581B2 (en)
JP2893781B2 (en) Character recognition device
JPS594358Y2 (en) Character control device in character correction
JP2682873B2 (en) Recognition device for tabular documents
JPS61198376A (en) Optical character reader
JPS5668869A (en) Optical character reader
JPS6095689A (en) Optical character reader
JPS62212888A (en) Drawing frame removing system for automatic drawing reader
JPH0351950A (en) Character output device
JPS62123581A (en) Document picture input device
JPH0266681A (en) Drawing processor
JPH02195488A (en) Character recognizing device
JPH03188579A (en) Image generating device
JPH0433079A (en) Table processing system
JPS5688572A (en) Character read system
JPS6037083A (en) Handwriting character recognizing device
JPH09245189A (en) Image processor
JPS63173187A (en) Character input device
JPS6277684A (en) Optical reader
JPS6292081A (en) Optical character reader
JPH03214379A (en) Character recognizing device

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term