JPS581822B2 - Kogakumojiyomitorisouchiniokeru Mojikiridashiboshiki - Google Patents

Kogakumojiyomitorisouchiniokeru Mojikiridashiboshiki

Info

Publication number
JPS581822B2
JPS581822B2 JP50136172A JP13617275A JPS581822B2 JP S581822 B2 JPS581822 B2 JP S581822B2 JP 50136172 A JP50136172 A JP 50136172A JP 13617275 A JP13617275 A JP 13617275A JP S581822 B2 JPS581822 B2 JP S581822B2
Authority
JP
Japan
Prior art keywords
character
characters
detected
dummy
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP50136172A
Other languages
Japanese (ja)
Other versions
JPS5260533A (en
Inventor
引地博
岡光宣
秋山昌久
小木戸広
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP50136172A priority Critical patent/JPS581822B2/en
Publication of JPS5260533A publication Critical patent/JPS5260533A/en
Publication of JPS581822B2 publication Critical patent/JPS581822B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は帳票に記入された文字等を光学的に読取る光学
文字読取装置に係り、特に所定の大きさより大きく記入
された文字や2個以上の文字が連なって記入された文字
等を光学的に走査し、文字切り出しを行なう文字切り出
し方式に関する。
[Detailed Description of the Invention] The present invention relates to an optical character reading device that optically reads characters written on a form, and particularly for characters written larger than a predetermined size or two or more characters written in a row. The present invention relates to a character extraction method that optically scans and extracts characters.

一般に手書き文字を光学的に読取る装置においては、そ
の機構が複雑である。
Generally, devices for optically reading handwritten characters have a complicated mechanism.

たとえ、その記載方法に記入枠等の制約を設けたとして
も、記載する者によっては、記入枠からはみ出して記入
したり、文字と文字を連ねて記入したり、さまざまであ
る。
Even if restrictions are placed on the writing method, such as a writing frame, there are various ways in which the person filling in the information may write outside the writing frame, or fill in letters consecutively.

従って、この様に帳票に記入された文字を1文字ずつ切
り出す必要がある。
Therefore, it is necessary to cut out the characters written on the form one by one.

従来、この種の光学文字読取装置においては文字パター
ンを認識するために、帳票に記入された文字を光学的に
走査し、電気信号に変換した文字情報を1文字ずつ切り
出す機能を附加し前処理部において文字パターンのスタ
ートを検出し、文字パターンのエンド或いは最大走査本
数によって文字の切り出しを行なっている。
Conventionally, in order to recognize character patterns, this type of optical character reading device optically scans the characters written on a form, converts the character information into electrical signals, and then adds a function to cut out character information one character at a time and performs preprocessing. The start of the character pattern is detected in the section, and characters are cut out according to the end of the character pattern or the maximum number of scans.

しかしながら、この様な光学文字読取装置においては、
最大走査本数になると、そこで文字エンドにならなくて
も文字の切り出しは終了する。
However, in such optical character reading devices,
When the maximum number of scans is reached, character extraction ends even if the end of the character is not reached.

このため所定の大きさより大きな文字や、2個以上の文
字が連なって記入された様な場合には、文字エンドでな
く、最大走査本数になった所で文字の切り出しが行なわ
れ、大きな文字にあっては最大走査本数分によって切り
出された部分と、残りの部分とに分離された、言うなら
ば2文字として切り出しが行なわれ、記入した文字数よ
りも切り出された文字数がふえるということになる。
Therefore, if a character is larger than the specified size or two or more characters are written in a row, the character will be cut out at the maximum number of scans, not at the end of the character. In this case, the part cut out by the maximum number of scan lines and the remaining part are separated, so to speak, and cut out is performed as two characters, resulting in the number of cut out characters being greater than the number of written characters.

このために、次段の文字認識部において、最大走査本数
で切り出された部分と、残りの部分について、それぞれ
判別が行なわれるが、特に残りの部分については、どの
様な文字になるか保障はなく、読取り誤りがしばしば発
生する。
For this reason, the character recognition unit in the next stage discriminates between the part cut out with the maximum number of scans and the remaining part, but there is no guarantee as to what kind of characters the remaining part will be. reading errors often occur.

また、2個以上の文字が連なって記入された場合にも、
最大走査本数によって文字の切り出しが行なわれるため
、記入された文字と切り出された文字との間にずれが生
じ、記入された文字よりも切り出された文字の数の方が
多くなり、文字認識部で誤読されることがある。
Also, if two or more characters are entered in a row,
Since characters are cut out according to the maximum number of scan lines, there is a gap between the written characters and the cut out characters, and the number of cut out characters is greater than the written characters, and the character recognition unit may be misread.

このため、帳票上に記入枠を設けて、その記入枠内に文
字を記入し、記入枠とその枠内に記入された文字とを別
々に検出し、記入枠からの信号によって文字情報の切り
出しを行なっている方法もあるが、この方法では記入枠
と文字との認識を別別に行なわなければならず、記入枠
と文字との2つの検出装置が必要となり、機構的にも、
構造的にも複雑となる他、光学文字読取装置自体が高価
となる欠点があった。
For this purpose, a writing frame is provided on the form, characters are written in the writing frame, the writing frame and the characters written in the frame are detected separately, and character information is extracted based on the signal from the writing frame. There is a method that does this, but in this method, the entry frame and the characters must be recognized separately, requiring two detection devices for the entry frame and the characters, and mechanically.
In addition to being structurally complex, the optical character reading device itself has the disadvantage of being expensive.

本発明の目的は上記した様な従来技術の欠点を.除去し
、所定の太きさより大きな文字や、2個以上の文字が連
なって記入された場合であっても適切な文字切り出しを
行ない、しかも従来技術における様な文字記入枠の検出
装置を特に必要とせず、比較的安価に達成される光掌文
字読取装置における文字切り出し方式を提供することに
ある。
The purpose of the present invention is to overcome the drawbacks of the prior art as described above. Even if a character is larger than a predetermined thickness or two or more characters are written in a row, appropriate character extraction is performed, and a character writing frame detection device as in the prior art is particularly required. It is an object of the present invention to provide a character extraction method in an optical palm character reading device that can be achieved at a relatively low cost.

本発明は上記目的を達成する為に、光学的に走査され、
電文信号に変換された文字パターンを順次取り込む複数
個のパターンレジスタを設け、このパターンレジスタに
対応し、文字のスタート部分、エンド部分を検出するた
めの手段を付加すると共に、1走査ごとにそのカウント
が更新される走査カウンタの値が最大走査本数に達した
にも拘らず文字エンドが検出されない場合には、ダミー
走査フラグをセットし、■走査ごとにカウントアップさ
れるダミー走査カウンタがある値になるまでダミー走査
を行ない、その後次の文字のスタート部分を検出する様
にし、少なくとも前記最大走査本数による文字パターン
を切り出し、帳票に記人された文字数に比べ切り出され
た文字数が多くなるということを防止し、文字の切り出
し誤りをなくしたものである。
In order to achieve the above object, the present invention uses optical scanning,
A plurality of pattern registers are provided that sequentially capture character patterns converted into telegram signals, and means for detecting the start and end parts of characters corresponding to these pattern registers is added, and the count is performed for each scan. If the end of a character is not detected even though the value of the scan counter that is updated has reached the maximum number of scans, a dummy scan flag is set, and the dummy scan counter that is incremented every scan is set to a certain value. Perform dummy scanning until the start of the next character is detected, cut out a character pattern based on at least the maximum number of scans, and check that the number of cut out characters is greater than the number of characters recorded on the form. This prevents errors in cutting out characters.

以下、図面に基いて本発明の一実施例につき詳細に説明
する。
Hereinafter, one embodiment of the present invention will be described in detail based on the drawings.

まず、本発明を実施する場合、その対象となる光学文字
読取装置について説明する。
First, an optical character reading device to which the present invention is implemented will be described.

第1図は光学文字読取装置の各部分をブロック図にて表
わしたものである。
FIG. 1 is a block diagram showing each part of the optical character reading device.

12は帳票送り機構部で、読取りを行なうためホッパ内
から帳票を順次1枚ずつ送り出す。
Reference numeral 12 denotes a form feeding mechanism section which sequentially feeds out forms one by one from the hopper for reading.

13は帳票送り機構部12から送り出された帳票上を光
学的に走査し、文字を読み取り、読み取られた文字を電
気信号に変換する読取りヘッド部であり、14は電気信
号に変換された文字情報から1文字ずつ切り出しを行な
い、文字の位置の正規化、ノイズ除去を行なう前処理部
である,15は前処理部14で1文字ずつ切り出され、
正規化された文字を判別する文字認識部、16は読取っ
たデータが正しいか否かをチェックするためのデータチ
ェック部である。
Reference numeral 13 denotes a reading head unit that optically scans the form sent out from the form feeding mechanism unit 12, reads characters, and converts the read characters into electrical signals. Reference numeral 14 indicates character information converted into electrical signals. 15 is a preprocessing unit that extracts characters one by one from , normalizes the character position, and removes noise.
A character recognition unit 16 identifies normalized characters, and a data check unit 16 checks whether the read data is correct.

11は上記各部の制御を行なうための制御部である。Reference numeral 11 denotes a control section for controlling each of the above-mentioned sections.

第2図を参照すると、光学文字読取装置について、より
明確に理解される。
With reference to FIG. 2, the optical character reader will be more clearly understood.

読取りヘッド部は、一般にレーザ発信器21、垂直ミラ
ー22、レンズ23、水平ミラー24、光電子増倍管2
6を有している。
The read head section generally includes a laser transmitter 21, a vertical mirror 22, a lens 23, a horizontal mirror 24, and a photomultiplier tube 2.
6.

レーザ発信器21から発射された光は垂直ミラー22に
よって反射されながら垂直方向に走査される。
The light emitted from the laser transmitter 21 is reflected by the vertical mirror 22 and scanned in the vertical direction.

その光はレンズ23を通って水平ミラー24によって、
帳票25上を水平方向に走査される。
The light passes through the lens 23 and passes through the horizontal mirror 24.
The form 25 is scanned in the horizontal direction.

第3図に、その走査方向の様子が示されている。FIG. 3 shows the situation in the scanning direction.

第3図においてSが文字スタート、Eが文字エンドとな
る。
In FIG. 3, S is the start of a character and E is the end of the character.

この様に走査され、帳票25から反射した光は文字部分
が光電子増倍管26によって感知され、電気信号に変換
され、2値化信号として前処理部14(第1図)に送ら
れる。
The character portion of the light reflected from the form 25 after being scanned in this manner is detected by the photomultiplier tube 26, converted into an electrical signal, and sent to the preprocessing section 14 (FIG. 1) as a binary signal.

前処理部14では、電気信号に変換された文字情報から
1文字ずつ文字の切り出しが行なわれる。
In the preprocessing section 14, characters are extracted one character at a time from the character information converted into electrical signals.

これについて、本発明に特徴的な文字の切り出しが行な
われるということが以下の説明から容易に理解される。
Regarding this, it will be easily understood from the following explanation that character extraction, which is characteristic of the present invention, is performed.

第4図を参照して、本発明による文字切り出し方式につ
いて説明する。
The character extraction method according to the present invention will be explained with reference to FIG.

図において、読取りヘッド部41は帳票上に記入された
文字を光学的に走査し、文字情報を電気信号に変換し、
2値化した文字パターン信号を作成する。
In the figure, a reading head unit 41 optically scans characters written on a form, converts character information into electrical signals,
Create a binary character pattern signal.

2値化された文字パターン信号は順次パターンレジスタ
42に転送される。
The binarized character pattern signals are sequentially transferred to the pattern register 42.

次にパターンレジスク42上のマスク論理の文字スター
ト論理部43によって文字のスタートが検出され、順次
文字パターンは文字認識論理部46に転送される。
Next, the start of a character is detected by the character start logic 43 of the mask logic on the pattern register 42, and the character pattern is sequentially transferred to the character recognition logic 46.

その後マスク論理の文字エンド論理部44で文字のエン
ドが検出されると、文字エンド論理部44から文字認識
論理部46へ信号が発せられ、文字パターンが文字認識
論理部46へ転送されることが停止される。
Thereafter, when the end of the character is detected in the character end logic section 44 of the mask logic, a signal is issued from the character end logic section 44 to the character recognition logic section 46 so that the character pattern can be transferred to the character recognition logic section 46. will be stopped.

これによって1文字分の切り出しが終了したことになり
、文字認識論理部46において、切り出された文字の認
識が行なわれる。
This means that the extraction of one character is completed, and the character recognition logic unit 46 recognizes the extracted character.

帳票上の文字を光学的に走査する場合には、予め最大走
査本数が定められているが、最大走査本数に達したにも
拘らず、文字エンド論理部44において文字エンドが検
出されない時には、ダミー走査論理部45によって、文
字パターンが文字認識論理部46へ転送されることが停
止される。
When optically scanning characters on a form, the maximum number of scan lines is predetermined, but if the character end logic unit 44 does not detect a character end even though the maximum number of scan lines has been reached, a dummy Scanning logic 45 stops the transfer of character patterns to character recognition logic 46 .

同時に文字スタートが検出された時にも文字認識論理部
46への文字パターンの転送は停止される。
At the same time, the transfer of the character pattern to the character recognition logic unit 46 is also stopped when a character start is detected.

ダミー走査論理部45では文字エンドが検出されない場
合に、引き続いて走査を行ないこの時に文字エンドが検
出されると、はじめて文字スタート論理が有効となり、
再び文字の切り出しが開始される。
If the dummy scanning logic unit 45 does not detect the end of a character, it continues scanning, and when the end of a character is detected at this time, the character start logic becomes valid for the first time.
Character cutting begins again.

第5図に基いて、本発明を更に詳細に説明する。The present invention will be explained in more detail based on FIG.

図において、パターンレジスタ51は3個のパターンレ
ジスタ511,512,513から成る。
In the figure, pattern register 51 consists of three pattern registers 511, 512, and 513.

勿論、このレジスタの数は3個に限らず、4個或い.は
5個等一般に複数のレジスタであればよい。
Of course, the number of registers is not limited to three, but may be four or . In general, a plurality of registers such as five registers may be used.

各各のパターンレジスタ511,512,513の先頭
から3個のフリツプフロツプI1,12,13,21,
23,31,32,33は文字スタート、及び文字エン
ドを検出するためのものである。
Three flip-flops I1, 12, 13, 21, from the beginning of each pattern register 511, 512, 513,
23, 31, 32, and 33 are for detecting the start of a character and the end of a character.

光,学的走査に対応し、2値化された文字パターンは順
次パターンレジスタ51の先頭部分から矢印α方向にシ
フトされながら取り込まれていく。
Corresponding to optical and optical scanning, the binarized character patterns are sequentially taken in from the beginning of the pattern register 51 while being shifted in the direction of the arrow α.

従って、文字スタート部分があると、前記各レジスクの
先頭部分の3個のフリツプフロツプで文字スタートが検
出される。
Therefore, if there is a character start part, the character start is detected by the three flip-flops at the beginning of each register.

勿論文字エンド部分の場合にあってもこのフリツプフロ
ツプ上をシフトされながら通過するため必ず文字エンド
が検出される。
Of course, even in the case of the end of a character, the end of the character is always detected because it passes over this flip-flop while being shifted.

各パターンレジスタ511,512,513の先頭部分
にある3個のフリツプフロツプは文字スタート、文字エ
ンドを検出するものであるが、この数はノイズ除去等を
考慮し複数個が適当である。
The three flip-flops at the beginning of each pattern register 511, 512, 513 are for detecting the start and end of a character, and it is appropriate to have a plurality of flip-flops in consideration of noise removal and the like.

フリツブフロツプ11乃至33によって検出された文字
スタート、及び文字エンド信号はマスク論理56に入る
The character start and character end signals detected by flipflops 11-33 enter mask logic 56.

マスク論理56の入力11乃至33が入力端子となる。Inputs 11 to 33 of the mask logic 56 serve as input terminals.

文字スタートが検出された場合には文字スタートフラグ
53がセットされ、文字エンドが検出された場合には文
字エンドフラグ52がセットされる。
When a character start is detected, a character start flag 53 is set, and when a character end is detected, a character end flag 52 is set.

走査カウンタ55は文字スタートが検出されると、文字
スタートフラグ53からの信号によってカウント動作を
開始するカウンタであって、帳票上を垂直方向に1走査
される毎に1ずつカウントアップする。
The scanning counter 55 is a counter that starts a counting operation in response to a signal from the character start flag 53 when a character start is detected, and counts up by 1 each time the form is scanned in the vertical direction.

メモリ54は文字パターンを記憶する記憶装置であり、
文字スタートが検出されると、1走査毎にパターンレジ
スタ51に順次取り込まれる文字パターンを記憶してい
く。
The memory 54 is a storage device that stores character patterns;
When a character start is detected, character patterns are sequentially taken into the pattern register 51 for each scan and are stored in the pattern register 51.

最大走査本数レジスタ57は、帳票上の1文字に対して
垂直方向に走査する最大走査本数を格納しているレジス
タであり、この最大走査本数レジスタ57と走査カウン
タ55からの信号はアンドゲート501に入っている。
The maximum number of scans register 57 is a register that stores the maximum number of scans perpendicularly scanning one character on a form, and the signals from this maximum number of scans register 57 and the scan counter 55 are sent to an AND gate 501. It's in.

即ち、走査カウンタ55の値が最大走査本数に達した時
にアンドゲート501の出力信号が前記文字エンドフラ
グ52及びダミー走査フラグ59に与えられる。
That is, when the value of the scan counter 55 reaches the maximum number of lines to be scanned, the output signal of the AND gate 501 is applied to the character end flag 52 and the dummy scan flag 59.

勿論、走査カウンタ55の値が最大走査本数に達する前
に、マスク論理56によって文字エンドが検出されると
、走査カウンタ55のカウント動作は停止され、1文字
分の文字パターンがすべてメモリ54に取り込まれる。
Of course, if the end of a character is detected by the mask logic 56 before the value of the scan counter 55 reaches the maximum number of scans, the counting operation of the scan counter 55 is stopped and the entire character pattern for one character is loaded into the memory 54. It will be done.

末だ、文字エンドが検出されないままに、走査カウンタ
55の値が最大走査本数レジスタ57の値に値すると、
ダミー走査フラグ59がセットされ、ダミー走査カウン
タ58がクリアされる。
Finally, if the value of the scan counter 55 is equal to the value of the maximum scan number register 57 without the character end being detected,
A dummy scan flag 59 is set and a dummy scan counter 58 is cleared.

この後ダミー走査が行なわれる。After this, dummy scanning is performed.

ダミー走査は通常文字記入枠からはみ出して記入された
文字や連なって記入された文字に対して行なわれる。
Dummy scanning is normally performed on characters written outside the character entry frame or characters written consecutively.

ダミー走査の走査本数は予めダミー走査レジスタ60に
格納されており、ダミー走査カウンタ58は1走査毎に
順次カウントアップされ、このダミー走査カウンタ58
とダミー走査レジスタ60との値が一致した時に、アン
ドゲ−ト502の出力によつてダミー走査フラグ59及
び文字スタートフラグ53がリセットされる。
The number of dummy scans is stored in advance in the dummy scan register 60, and the dummy scan counter 58 is sequentially counted up for each scan.
When the values in the dummy scan register 60 and dummy scan register 60 match, the dummy scan flag 59 and the character start flag 53 are reset by the output of the AND gate 502.

勿論、ダミー走査カウンタ58の値がダミー走査レジス
タ60の値に達する前に文字エンドが検出された場合に
も、ダミー走査フラグ59はリセットされる。
Of course, even if the end of a character is detected before the value of the dummy scan counter 58 reaches the value of the dummy scan register 60, the dummy scan flag 59 is reset.

次に本発明による文字切り出し力式の動作について説明
する。
Next, the operation of the character cutting force type according to the present invention will be explained.

帳票上の文字記入枠内には文字回(第5図斜線部分)が
記入され、1文字を切り出すのに必要な最大走査本数を
25本、ダミー走査本数を3本とする。
Character times (shaded areas in Figure 5) are written in the character entry frame on the form, and the maximum number of scans required to cut out one character is 25, and the number of dummy scans is 3.

この場合、最大走査本数は1文字を切り出すのに1文字
分の文字記入枠を何本で走査するかを基準として設定す
る。
In this case, the maximum number of lines to be scanned is set based on how many lines are required to scan a character entry frame for one character to cut out one character.

まず、帳票上を光学的に走査することによって,パター
ンレジスタ51に順次左か右に向って各レジスクに対し
ては矢印a力向から文字パターンが入ってくる。
First, by optically scanning a form, a character pattern enters the pattern register 51 sequentially to the left or to the right in the direction of arrow a for each register.

各レジスタ511,512,513のフリツブフロツブ
11乃至33の内て文字スタートが検出されるとマスク
論理56によって文字スタートフラグ53がセットされ
る。
When a character start is detected in flipflops 11 to 33 of each register 511, 512, 513, a character start flag 53 is set by mask logic 56.

この時走査カウンタ55のカウント動作が始められ、該
カウンタ55は1走査毎にカウントアップされると共に
走査された文字パターンがパターンレジスタ51とりわ
けパターンレジスク513から順次メモリ54へ転送さ
れる。
At this time, the counting operation of the scan counter 55 is started, and the counter 55 counts up for each scan, and the scanned character pattern is sequentially transferred from the pattern register 51, particularly the pattern register 513, to the memory 54.

マスク論理56によって文字エンドが検出されると文字
エンドフラグ52がセットされ、メモリ54への1文字
分の文字パターンの転送は終了する。
When the end of a character is detected by the mask logic 56, the character end flag 52 is set, and the transfer of the character pattern for one character to the memory 54 is completed.

従って、この場合には正常な文字切り出しが行なわれた
ことになる。
Therefore, in this case, normal character extraction was performed.

しかしながら、文字エンドが検出されないままに、走査
カウンタ55の値が最大走査本数レジスタ57の値、即
ち25本に達すると、走査カウンタ55と最大走査本数
レジスタ57との一致がとれ、ダミー走査フラグ59が
セットされる。
However, when the value of the scan counter 55 reaches the value of the maximum scan number register 57, that is, 25 lines, without the character end being detected, the scan counter 55 and the maximum scan number register 57 match, and the dummy scan flag 59 is set.

これによってダミー走査カウンタ58が初期値にリセッ
トされ、ダミー走査1走査毎にカウントアップしていく
As a result, the dummy scan counter 58 is reset to the initial value and counts up every dummy scan.

ここで、ダミー走査中に於いては、ダミー走査フラグ5
9がセットされていると、文字スタートフラグ53がセ
ットされていてもパターンレジスタ51の文字パターン
はメモリ54へは転送されない。
Here, during dummy scanning, the dummy scanning flag 5
If 9 is set, the character pattern in the pattern register 51 will not be transferred to the memory 54 even if the character start flag 53 is set.

この際中に、マスク論理56によって文字エンドが検出
されると、文字エンドフラグ52がセットされ、前記2
5本の走査迄の文字パターンが切り出される。
During this time, if the mask logic 56 detects the end of a character, the character end flag 52 is set and the second
Character patterns up to five scans are cut out.

その後は次の文字のスタート部分の検出に備えられる。After that, preparation is made to detect the start of the next character.

ダミー走査中に文字エンドが検出されず、ダミー走査カ
ウンク58の値がダミー走査レジスタ60の値、即ち”
3”本に一致すると、ダミー走査フラグ59はリセツト
される。
During the dummy scan, the end of a character is not detected, and the value of the dummy scan count 58 is the value of the dummy scan register 60, that is, "
If the number matches 3'', the dummy scan flag 59 is reset.

この時は前記25本の走査迄の文字パターンを切り出し
される。
At this time, character patterns up to the 25 scanned lines are cut out.

その後は次の文字のスタート部分の検出のために備えら
れる。
Thereafter, provision is made to detect the start of the next character.

これによって切り出された文字が第6図b又はdに示さ
れている。
Characters cut out in this way are shown in FIG. 6b or 6d.

尚、ajCは従来技術による文字切り出しを示すもので
、a乃至dについて上段の文字が切り出し前、下段の文
字は切り出し後を示している。
Incidentally, ajC indicates character cutting according to the conventional technique, and for a to d, the characters in the upper row show before cutting out, and the characters in the lower row show after cutting out.

本発明による文字切り出し方式は走査カウンク55の値
が最大走査本数に達した場合であっても、ダミー走査中
にパターンレジスクに取り込まれる文字パターンはノイ
ズとし除去される。
In the character cutout method according to the present invention, even when the value of the scan count 55 reaches the maximum number of scans, the character pattern taken into the pattern resist during dummy scanning is treated as noise and removed.

例えば、同図aが3個の文字として切り出されるのに対
し、bは完全に2文字に分離されて切り出される。
For example, while a in the figure is cut out as three characters, b is completely separated into two characters and cut out.

dに示される様にグミー走査中に文字エンドが検出され
ると、ここで1文字の切り出しは終了する。
When the end of a character is detected during gummy scanning as shown in d, the extraction of one character ends here.

この場合、メモリ54に格納される文字パターンは最大
走査本数25本に達した所までに切り出された文字パタ
ーンである。
In this case, the character patterns stored in the memory 54 are the character patterns cut out until the maximum number of scanned lines reaches 25.

この後次の文字のスタートが検出されると、前述した方
法と同じ様な経過をとって次の文字の切り出しが行なわ
れる。
Thereafter, when the start of the next character is detected, the next character is cut out in the same manner as described above.

またbに示される様にダミー走査中に文字エンドが検出
されず、ダミー走査カウンタ55の値がダミー走査レジ
スタ60の値即ち3本に達すると、ダミー走査の終了時
点が次の文字のスタートとなり、この場合も最大走査本
数25本に達した所までに切り出された文字パターンが
メモリ54へ格納される。
Also, as shown in b, if the end of a character is not detected during dummy scanning and the value of the dummy scanning counter 55 reaches the value of the dummy scanning register 60, that is, 3 lines, the end of the dummy scanning becomes the start of the next character. In this case as well, the character patterns cut out until the maximum number of scanned lines reaches 25 are stored in the memory 54.

この様な文字切り出し方式においては、文字記入枠から
はみ出して文字が記入されている場合(第6図d)でも
、最大走査本数によって1文字の切り出しが行なわれた
後、文字切り出しで残った部分に対してはダミー走査に
よって最大3本までメモリ54に取り込まないために、
従来の様に記入された文字数よりも切り出された文字数
が多くなることもなく、万一、文字パターンとして切り
出されても3本以内であればノイズとして処理されるた
め、文字の切り出し誤りが極端に少なくなる。
In this type of character extraction method, even if a character is written outside the character entry frame (Fig. 6 d), after one character is extracted according to the maximum number of scans, the portion remaining after character extraction is In order not to import up to three images into the memory 54 by dummy scanning,
Unlike in the past, the number of characters cut out is not greater than the number of characters written, and even if a character pattern is cut out, if it is less than three, it will be treated as noise, making it extremely unlikely that a character will be cut out incorrectly. becomes less.

また、文字記入枠を越えて2文字連続して記入された様
な場合(第6図b)でも、ダミー走査によって文字切り
出しが行なわれ、記入された文字よりも切り出された文
字が多くなるということはなくなる。
In addition, even in cases where two characters are written consecutively beyond the character entry frame (Figure 6b), characters are cut out by dummy scanning, and there are more characters cut out than written characters. That will no longer be the case.

更に帳票記入者のために文字記入枠を設けるにしても、
文字切り出しのために文字記入枠検出装置の如き特別な
手段は必要とされない。
Furthermore, even if a text entry frame is provided for the person filling out the form,
No special means such as a character entry frame detection device is required for character extraction.

上記実施例においては、ダミー走査中に文字エンドが検
出されても、最大走査本数に達した所までについて文字
切り出しを行なう場合について述べたが、もし、ダミー
走査中に文字エンドが検出された場合(第6図d)には
、文字スタートからダミー走査中に検出された文字エン
ドまでを切り出す様にすることも容易である。
In the above embodiment, even if the end of a character is detected during dummy scanning, the characters are cut out until the maximum number of scans is reached. However, if the end of a character is detected during dummy scanning, (FIG. 6d), it is also easy to cut out from the start of the character to the end of the character detected during dummy scanning.

こうずることによって次段の文字認識部分における認識
誤りはかなり減少する。
By doing this, recognition errors in the next stage of character recognition are considerably reduced.

更に上記実施例においては、パターンレジスタ51を3
個、各パターンレジスタに対して文字スクート、文字エ
ンドを検出するためのフリツプフロツプを各3個を設け
た場合について述べたが、本発明はこれに限定されるも
のではなくそれらパターンレジスタの数及び文字スター
ト文字エンドを検出するためのフリツブフロツプの数は
適宜設定すればよい。
Furthermore, in the above embodiment, the pattern register 51 is
Although a case has been described in which three flip-flops are provided for each pattern register to detect the character scoot and the character end, the present invention is not limited to this, and the present invention is not limited to this. The number of flip-flops for detecting the start character end may be set appropriately.

また、文字記入枠の大きさに応じて最大走査本数がセッ
トされるレジスタ5γの値を変えたり、或いは文字記入
枠の間隔に応じてダミー走査本数がセットされるレジス
ク60の値を適宜変えることも容易である。
Furthermore, the value of the register 5γ where the maximum number of scan lines is set according to the size of the character entry frame can be changed, or the value of the register 60 where the dummy number of scan lines can be set according to the interval of the character entry frame can be changed as appropriate. is also easy.

こうすることによつて、かなり汎用性のある文字切り出
しが行なえる。
By doing this, character extraction can be performed with considerable versatility.

以上詳述した様に本発明によれば、文字記入枠を越えて
記入された文字に対してもダミー走査を行なうことによ
って記入された文字よりも切り出された文字が多くなる
ということはなくなり、かつ安価にして性能の良い文字
切り出しが可能となる。
As described in detail above, according to the present invention, by performing dummy scanning even for characters written beyond the character entry frame, it is possible to prevent the number of cut out characters from becoming more than the written characters. In addition, it is possible to cut out characters at low cost and with good performance.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は光学文字読取装置の要部ブロック図第2図は光
学的走査及び読み取り部を示す図、第3図は光学的走査
方向を示す図、第4図は本発明による文字切り出しの説
明に供する前処理部の概略的ブロック図、第5図は本発
明による文字切り出しの説明に,供する前処理部を示す
図第6図は連続した文字及び大きく記人された文字を切
り出した場合について示した図でa,Cは従来例、b,
dは本発明による実施例を示す。 符号の説明、51・・・・・・パターンレジスク、52
・・・・・・文字エンドフラグ、53・・・・・・文字
スタートフラグ、54・・・・・・メモリ、55・・・
・・・走査カウンタ、56・・・・・・マスク論理、5
7・・・・・・最大走査本数レジスタ、58・・・・・
・ダミー走査カウンタ、59・・・・・・ダミー走査フ
ラグ、60・・・・・・ダミー走査レジスタ。
FIG. 1 is a block diagram of the main parts of an optical character reading device. FIG. 2 is a diagram showing the optical scanning and reading section. FIG. 3 is a diagram showing the optical scanning direction. FIG. 4 is an explanation of character cutting according to the present invention. FIG. 5 is a schematic block diagram of a preprocessing unit used for explaining character extraction according to the present invention, and FIG. 6 is a diagram showing a preprocessing unit used for cutting out continuous characters and large characters. In the figure shown, a and C are conventional examples, b,
d shows an example according to the present invention. Explanation of symbols, 51...Pattern resist, 52
...Character end flag, 53...Character start flag, 54...Memory, 55...
...Scanning counter, 56...Mask logic, 5
7...Maximum scanning number register, 58...
- Dummy scan counter, 59...Dummy scan flag, 60...Dummy scan register.

Claims (1)

【特許請求の範囲】[Claims] 1 帳票上を所定方向に複数回光学的に走査し、該帳票
に記入された文字を読取る光学文字読取装置において、
光学的に走査され、電気信号に変換された文字パターン
を順次取り込む複数のパターンレジスクと、該パターン
レジスクの各々に対応して設けられた1文字のスタート
部分及びエンド部分を検出する手段と、スタート部分が
検出されると、1走査される毎にそのカウント値を更新
し、ある一定値までカウントする走査カウンタと、該カ
ウンタがある一定値に達しても前記文字のエンド部分が
検出されないときに、ダミー走査を行ないこのダミー走
査の1走査毎にそのカウント値が更新されるダミー走査
カウンクを有し、該ダミー走査カウンタのカウント値が
一定値に達しても文字のエンド部分が検出されない場合
には、前記走査カウンタがカウントした一定値までの走
査に対応する文字パターンを切り出す様に構成したこと
を特徴とする文字切り出し方式。
1. In an optical character reading device that optically scans a form multiple times in a predetermined direction and reads characters written on the form,
A plurality of pattern registers that sequentially capture character patterns that have been optically scanned and converted into electrical signals, and means for detecting a start part and an end part of one character provided corresponding to each of the pattern registers. , a scanning counter that updates its count value every time it is scanned once the start part is detected and counts up to a certain value; and even if the counter reaches a certain value, the end part of the character is not detected. Sometimes, a dummy scan is performed and a dummy scan counter is provided whose count value is updated every time the dummy scan is performed, and even if the count value of the dummy scan counter reaches a certain value, the end part of the character is not detected. In this case, the character cutting method is characterized in that the character pattern is cut out corresponding to scanning up to a certain value counted by the scanning counter.
JP50136172A 1975-11-14 1975-11-14 Kogakumojiyomitorisouchiniokeru Mojikiridashiboshiki Expired JPS581822B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP50136172A JPS581822B2 (en) 1975-11-14 1975-11-14 Kogakumojiyomitorisouchiniokeru Mojikiridashiboshiki

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP50136172A JPS581822B2 (en) 1975-11-14 1975-11-14 Kogakumojiyomitorisouchiniokeru Mojikiridashiboshiki

Publications (2)

Publication Number Publication Date
JPS5260533A JPS5260533A (en) 1977-05-19
JPS581822B2 true JPS581822B2 (en) 1983-01-13

Family

ID=15168998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50136172A Expired JPS581822B2 (en) 1975-11-14 1975-11-14 Kogakumojiyomitorisouchiniokeru Mojikiridashiboshiki

Country Status (1)

Country Link
JP (1) JPS581822B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS49115617A (en) * 1973-02-21 1974-11-05

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS49115617A (en) * 1973-02-21 1974-11-05

Also Published As

Publication number Publication date
JPS5260533A (en) 1977-05-19

Similar Documents

Publication Publication Date Title
US4926492A (en) Optical character reading apparatus and method
JP2644041B2 (en) Character recognition device
JPS581822B2 (en) Kogakumojiyomitorisouchiniokeru Mojikiridashiboshiki
JP2797848B2 (en) Optical character reader
JPH0291789A (en) Character recognizing system
JP2975720B2 (en) Optical character reader
JP2840020B2 (en) ID card
JP2922356B2 (en) Character recognition processor
JP3095437B2 (en) Character line detection cutout device and character reading device
JP3391987B2 (en) Form recognition device
JPH0272497A (en) Optical character reader
JP2877380B2 (en) Optical character reader
JPH03212779A (en) Device for recognizing character
JPS5886668A (en) Ocr facsimile system
JP3047857B2 (en) Optical character reader
JPS58109973A (en) Printer with print character echo check function
JPH0210471B2 (en)
JPH07271902A (en) Optical character reader
JPH01245376A (en) Character segmenting device for character reader
JPH10233930A (en) Image processor
JPH0426153B2 (en)
JPH05274473A (en) Optical character reader
JPS60110091A (en) Character recognizing system
JPH08194777A (en) Processing method for inputting and recognizing handwritten character
JPH039506B2 (en)