JPS594068B2 - Character detection cutting device - Google Patents

Character detection cutting device

Info

Publication number
JPS594068B2
JPS594068B2 JP53096775A JP9677578A JPS594068B2 JP S594068 B2 JPS594068 B2 JP S594068B2 JP 53096775 A JP53096775 A JP 53096775A JP 9677578 A JP9677578 A JP 9677578A JP S594068 B2 JPS594068 B2 JP S594068B2
Authority
JP
Japan
Prior art keywords
character
block
black
constant
address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53096775A
Other languages
Japanese (ja)
Other versions
JPS5525104A (en
Inventor
広海 難波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP53096775A priority Critical patent/JPS594068B2/en
Publication of JPS5525104A publication Critical patent/JPS5525104A/en
Publication of JPS594068B2 publication Critical patent/JPS594068B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 この発明は光学式文字読取装置における文字検出切出装
置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a character detection and cutting device in an optical character reading device.

一般に、文字読取装置においては、たとえば帳票などに
記載された文字列から1文字ずつを検出切出し、その認
識を行うようにしている。
In general, character reading devices detect and cut out characters one by one from a character string written on a form, for example, and perform recognition.

このうち、文字を検出切出する手段としては、従来次の
ようなものが知られている。(ハ 予じめ帳票に所定間
隔の枠を設定してその枠内に文字を記載しておく。
Among these, the following methods are conventionally known as means for detecting and cutting out characters. (C) Set frames at predetermined intervals on the form in advance and write the characters within the frames.

そして、帳票上の枠を検出することにより各文字情報を
切出す。(2)予じめ帳票に「L」 、「−」 、「・
」などの文字あるいは記号を基準位置として記載し、そ
の基準位置に基づく所定領域に文字を記載しておく。そ
して、帳票上の上記基準位置を検出し5 てそれと相対
的に一定な領域に基づいた各文字情報を切出す。(3)
予じめ帳票の一側端を基準位置とし、その基準位置に基
づく帳票上の所定領域に文字を記載しておく。
Then, each character information is cut out by detecting the frame on the form. (2) Write "L", "-", "・" on the form in advance.
A character or symbol such as "" is written as a reference position, and the character is written in a predetermined area based on the reference position. Then, the above-mentioned reference position on the form is detected, and each piece of character information is cut out based on a relatively constant area. (3)
One side edge of the form is set as a reference position in advance, and characters are written in a predetermined area on the form based on the reference position.

そして、帳票の一側端を検出してそj0れと相対的に一
定な領域に基づいた各文字情報を切出す。(4)帳票上
に記載された文字列の一端を検出し、その位置から一定
の領域に基づく各文字情報を切出す。
Then, one side edge of the form is detected and each piece of character information is cut out based on an area that is relatively constant with that edge. (4) Detect one end of the character string written on the form, and cut out each character information based on a certain area from that position.

15(5)第1図に示すように、帳票上に記載された文
字列の垂直方向射影(文字列および各文字の横方向の幅
が得られる)Jを作成し、これにより切出し領域にを検
出して各文字情報を切出す。
15(5) As shown in Figure 1, create a vertical projection J of the character string written on the form (obtaining the horizontal width of the character string and each character), and use this to create a cutout area. Detect and extract each character information.

(6)上記(ハ〜(5)のいずれかの方法によつて各文
字90情報の検出切出を行い、かつその周辺における多
数の各文字情報の検出切出を行い、これらの各文字情報
を認識比較することによつて正確な切出領域を改めて設
定することにより正確な文字情報を切出す。25ところ
で、上記の手段にはそれぞれ問題点があつた。
(6) Detecting and cutting out information on each of the 90 characters using any of the methods (c) to (5) above, and detecting and cutting out a large number of pieces of character information in the vicinity thereof, and extracting each of these character information By recognizing and comparing the characters, an accurate extraction area is set again, and accurate character information is extracted.25 However, each of the above-mentioned means has its own problems.

つまり、(1)〜(3)の手段では、帳票上における文
字の印字精度が厳しく制限されるとともに、特に(ハに
おける枠などの設定などによつて帳票の美観が損なわれ
てしまう。(4)の手段では、帳票に30記載する文字
ピッチを一定にしたり、あるいは帳票に記載されている
文字のピッチに応じて切出し領域を可変しなければなら
ず、面倒であり、さらに帳票に記載する文字がラインプ
リンタによるものであれば、文字周辺のノイズによつて
切出し領35域が全く異なる可能性がある。(5)の手
段では、たとえばカタカナの「ソ」、「ツ」、「ハ」、
「り玉「ル」などのように複数のブロックから成る種類
の文字が連続した場合、第2図のように切出し領域Kを
誤つてしまう恐れがある。この場合、普通の単プロツク
から成る文字であつても、その文字の印字品質が低下し
て線幅や文字間隔が変化したり、文字周辺にノイズが存
在していれば切出し領域を誤つてしまう恐れがある。(
6)の手段では、1つの文字情報に対して多数回の認識
操作が必要であり、そのため正確な文字情報を切出すま
での所要時間が長くなつてしまう。この場合、上記所要
時間を短縮しようとすれば、ハードウエア構成が複雑化
し、コストの上昇につながつてしまう。この発明は上記
のような事情に鑑みてなされたもので、その目的とする
ところは、記録媒体における文字の位置、印字品質およ
び種類などにかかわらず、しかも短時間のうちに正確な
文字の検出切出を行うことができる文字検出切出装置を
提供するものである。以下、この発明の一実施例を図面
を参照して説明する。
In other words, with the means (1) to (3), the printing accuracy of characters on the form is severely limited, and the aesthetic appearance of the form is impaired, especially by setting the frame in (C). (4) ), the pitch of the characters written on the form must be kept constant, or the cutout area must be varied according to the pitch of the characters written on the form, which is troublesome, and furthermore, the characters written on the form have to be changed. If it is made by a line printer, the cutout area 35 may be completely different depending on the noise around the characters.With the method (5), for example, katakana "so", "tsu", "ha",
When characters of a type consisting of a plurality of blocks are consecutive, such as ``Ritama ``RU'', there is a risk that the cutout area K may be mistaken as shown in FIG. In this case, even if the character is made up of ordinary single blocks, the printing quality of the character may deteriorate and the line width or character spacing may change, or if there is noise around the character, the cropping area may be incorrectly identified. There is a fear. (
With the method 6), recognition operations are required many times for one piece of character information, which increases the time required to extract accurate character information. In this case, if an attempt is made to shorten the required time, the hardware configuration will become complicated, leading to an increase in cost. This invention was made in view of the above-mentioned circumstances, and its purpose is to accurately detect characters in a short time regardless of the position, print quality, type, etc. of the characters on the recording medium. An object of the present invention is to provide a character detection and cutting device capable of cutting out characters. An embodiment of the present invention will be described below with reference to the drawings.

第3図において、1はフライングスポツト・スキヤナな
どの陰極線管(以後CRTと略称する)で、制御部2か
らの座標指令により画面上の発光箇所が順次移動するよ
うになつている。このCRTlの光点は、レンズ3を介
して被記録媒体たとえば張票4に投影されるようになつ
ている。この場合、CATlによつて帳票4に投影され
る光点は、その帳票4の図示左上方部から下方向つまり
矢印Y方向に移動する線走査となり、その線走査は矢印
X方向に順次移つて行くようになつている。そして、こ
のようなフライングスポツトスキヤナ走査による帳票4
からの反射光は、光電子増倍管5で電気信号に変換され
、その電気信号は量子化回路6でデイジタル信号に変換
されるようになつている。この量子化回路6の出力は、
走査位置が帳票4上の文字に対応したときにいわゆる黒
プロツク信号(論理61゛信号)となり、文字に対応し
ないときにいわゆる白プロツク信号(論理10゛信号)
となるもので、第1カウンタ7、パターンレジスタ8に
それぞれ供給されるとともに、オア回路9の一方の入力
端に供給されるようになつている。上記第1カウンタ7
は、黒プロツクが存在する期間だけ制御部2から供給さ
れる走査クロツク信号(1本の走査ごとに発せられる)
をカウントするもので、その内容は帳票4の文字に対す
る垂直方向射影として制御部2に供給されるとともに、
制御部2から供給されるクリア信号によつて1本の走査
が終了するごとにクリアされるようになつている。上記
パターンレジスタ8は、量子化回路6の出力によつて量
子化文字パターンを形成するもので、その内容は認識部
(図示しない)によつて認識されるようになつている。
一方、上記オア回路9の出力は、水平射影レジスタ10
に供給され、このレジスタ10の内容は上記オア回路9
の他方の入力端に供給されるようになつている。このレ
ジスタ10は、量子化回路6の出力を一時記憶するもの
であるが、その内容が上記オア回路9を介して循環する
ことにより、走査ごとの黒プロツク信号および白プロツ
ク信号が加算的に記憶されるようになつている。そして
、このレジスタ10の内容は、制御部2の制御動作によ
つて1文字分の走査終了毎にクリアされるようになつて
いる。こうして、レジスタ10には、各文字を水平方向
に投影した水平方向射影が形成され、それは第2カウン
タ11に供給されるようになつている。この第2カウン
タ11は、黒プロツクが存在する期間だけ制御部2から
供給される走査プロツク信号をカウントするもので、そ
の内容は制御部2に供給されるとともに、1本の走査が
終了することに制御部2から供給されるクリア信号によ
つてクリアされるようになつている。そして、上記制御
部2は、たとえばマイクロコンピユータなどで構成され
るもので、複数個のアドレスを有する記憶部(たとえば
ランダムアクセスメモリなど)が備えられている。
In FIG. 3, reference numeral 1 denotes a cathode ray tube (hereinafter abbreviated as CRT) such as a flying spot scanner, in which light emitting points on the screen are sequentially moved by coordinate commands from a control section 2. The light spot of this CRTl is projected onto a recording medium, for example, a bulletin board 4 through a lens 3. In this case, the light spot projected onto the form 4 by CATl becomes a line scan that moves downward from the upper left part of the form 4 in the figure, that is, in the direction of arrow Y, and the line scan moves sequentially in the direction of arrow X. I'm starting to go there. Then, the form 4 obtained by such flying spot scanner scanning is
The reflected light is converted into an electric signal by a photomultiplier tube 5, and the electric signal is converted into a digital signal by a quantization circuit 6. The output of this quantization circuit 6 is
When the scanning position corresponds to a character on the form 4, it becomes a so-called black block signal (logic 61' signal), and when it does not correspond to a character, it produces a so-called white block signal (logic 10' signal).
The signal is supplied to the first counter 7 and the pattern register 8, respectively, and to one input terminal of the OR circuit 9. The first counter 7
is a scanning clock signal (issued for each scan) supplied from the control unit 2 only during the period when a black block exists.
The contents are supplied to the control unit 2 as a vertical projection on the characters on the form 4, and
It is designed to be cleared each time one scan is completed by a clear signal supplied from the control section 2. The pattern register 8 forms a quantized character pattern based on the output of the quantization circuit 6, and its contents are recognized by a recognition section (not shown).
On the other hand, the output of the OR circuit 9 is transmitted to the horizontal projection register 10.
The contents of this register 10 are supplied to the OR circuit 9.
is supplied to the other input terminal of the . This register 10 temporarily stores the output of the quantization circuit 6, and by circulating the contents through the OR circuit 9, the black block signal and white block signal for each scan are stored additively. It is becoming more and more common. The contents of this register 10 are cleared by the control operation of the control section 2 every time one character is scanned. In this way, a horizontal projection of each character is formed in the register 10, which is supplied to the second counter 11. This second counter 11 counts the scanning block signal supplied from the control section 2 only during the period when the black block exists, and its contents are supplied to the control section 2 and also indicates when one scanning is completed. It is designed to be cleared by a clear signal supplied from the control section 2. The control section 2 is composed of, for example, a microcomputer, and is equipped with a storage section (for example, a random access memory) having a plurality of addresses.

上記記憶部には、ブラツクアドレス(BLACK)、ホ
ワイトアドレス(WHITE)およびトータルアドレス
(TOTAL)と称する3つのアドレスが指定されてい
る。上記ブラツクアドレスは連続した黒プロツクに対応
する走査本数、ホワイトアドレスは連続した白プロツク
に対応する走査本数、さらにトータルアドレスは総走査
本数を累計するものである。また、制御部2には、黒プ
ロツクを検知するブラツクフラグ(BLACK−FF)
が備えられ、前走査内に黒プロツクがあつたか否かの状
態が常に貯えられるようになつている。こうして、制御
部2は、上記第1カウンタ7および第2カウンタ11の
内容と、上記記憶部の各アドレスおよびブラツクフラグ
の内容とを予じめ設定した各種条件に基づいて比較する
ことにより、文字の検出および切出しに対する適格な制
御を行うようになつている。次に、上記のような構成に
おいて動作を説明する。
Three addresses called a black address (BLACK), a white address (WHITE), and a total address (TOTAL) are specified in the storage section. The black address is the number of scans corresponding to consecutive black blocks, the white address is the number of scans corresponding to consecutive white blocks, and the total address is the total number of scans. The control unit 2 also has a black flag (BLACK-FF) for detecting black blocks.
is provided so that the status of whether or not there was a black block in the previous scan is always stored. In this way, the control section 2 compares the contents of the first counter 7 and the second counter 11 with the contents of each address and black flag of the storage section based on various preset conditions, thereby controlling the The system provides appropriate control over the detection and extraction of Next, the operation in the above configuration will be explained.

この場合、第4図のタイムチヤートおよび第5図のフロ
ーチヤートを参照して説明する。まず、前記帳票4に対
する走査の開始に先立ち、ステツプ50において、制御
部2から出力されるクリア信号によつてレジスタ10が
クリアされるとともに、制御部2における記憶部のブラ
ツクアドレス、ホワイトアドレス、トータルアドレスが
それぞれタリアされ、かつブラツクフラグがりセツトさ
れる。さらに、ステツプ51において制御部2から出力
される波形aのクリア信号によつて第1、第2カウンタ
7,11がそれぞれクリアされる。そして、上記波形a
のクリア信号の終了時、制御部2からCRTlに波形C
OY方向走査信号が供給される。上記Y方向走査信号は
、図示C1−C2間が1本の走査に対する走査期間とな
り、また制御部2から出力される波形bの帰線信号によ
つて図示C2−C3間が次の走査に対する帰線期間とな
る。一方、上記X方向偏向信号は、上記波形aのクリア
信号の終了ごとに所定の電圧だけ増加していき、帳票4
に対する走査位置を図示X方向に1ビツトシフトさせる
。こうして、ステツプ52における1本の走査ごとに制
御部2から波形eの走査クロツタ信号が出力され、その
走査クロツク信号は量子化回路6から出力される黒プロ
ツク信号の期間だけ第1カウンタ7でカウントされる。
This case will be explained with reference to the time chart of FIG. 4 and the flow chart of FIG. 5. First, prior to the start of scanning the form 4, in step 50, the register 10 is cleared by a clear signal output from the control section 2, and the black address, white address, and total information in the storage section of the control section 2 are cleared. Each address is cleared and a black flag is set. Furthermore, in step 51, the first and second counters 7 and 11 are cleared, respectively, by the clear signal of waveform a output from the control section 2. And the above waveform a
When the clear signal ends, the waveform C is sent from the control unit 2 to the CRT1.
An OY direction scanning signal is supplied. In the Y-direction scanning signal, the period between C1 and C2 shown in the figure becomes a scanning period for one scan, and the period between C2 and C3 shown in the figure becomes a return signal for the next scan due to the retrace signal of waveform b output from the control section 2. Line period. On the other hand, the X-direction deflection signal increases by a predetermined voltage every time the clear signal of waveform a ends, and the
Shifts the scanning position for 1 bit in the X direction in the figure. In this way, a scanning clock signal of waveform e is outputted from the control section 2 for each scan in step 52, and the scanning clock signal is counted by the first counter 7 only during the period of the black block signal outputted from the quantization circuit 6. be done.

また、上記走査クロツク信号は、レジスタ10における
黒プロツクの期間だけ第2カウンタ11でカウントされ
る。そして、制御部2では、次のような制御動作が実施
される。まず、1本の走査が終了するごとにステツプ5
3で記憶部のトータルアドレスが1インクリメントされ
る。このトータルアドレスの内容つまり総走査本数は、
ステツプ54で定数T1よりも大であるか否かに比較さ
れ、大の場合にはステツプ54でリジエクト(REJE
CT)されて検出切出不能となる。上記定数T1は、文
字ピツチの1.3倍程度に相当する走査本数である。一
方、上記ステツプ54において、トータルアドレスの内
容が定数T1以下の場合には、ステツプ56で第1カウ
ンタ7の内容が定数T2よりも大であるか否か比較され
、大の場合には文字プロツクが存在していると判断され
る。上記定数T2は、黒プロツクの幅が文字プロツクと
判断できる最小幅に相当する走査本数である。そして、
ステツプ57でブラツクアドレスが1インクリメントさ
れる。このブラツクアドレスの内容は、ステツプ58で
定数T3よりも大であるか否か比較され、大の場合には
ステツプ59でリジエクトされて検出切出不能となる。
上記定数T3は、文字ピツチに略相当する黒プロツク連
続走査本数である。上記ステツプ58において、ブラツ
クアドレスの内容が定数T3以下の場合には、ステツプ
60でブラツクフラグがチエツクされ、このブラツクフ
ラグがりセツト状態つまり1本前の走査に黒プロツクが
存在しない場合、現時点の黒プロツクが上記白プロツク
から変化したものであると判断される。しかるのち、現
時点の黒プロツクにより、ステツプ61でブラツクフラ
グがセツトされる。さらに、ステツプ62では、ホワイ
トアドレスの内容が定数T4よりも大であるか否か比較
され、大の場合には現時点までの黒データをノイズとみ
なし、ステツプ63でブラツクアドレスの内容が「1」
にされる。この場合、上記ステツプ63でブラツクアド
レスの内容をクリア状態つまり「0」にしないで「1」
にしておくことにより、現時点の黒プロツクが次の走査
に対する始まりとなる。上記定数T4は、複数プロツタ
から成る文字の各プロツク間距離よりも大きい値に相当
する走査本数である。一方、上記ステツプ62において
、ホワイトアドレスの内容が定数T4以下であれば、現
時点までの黒プロツクをノイズとみなすことなく、これ
によりブラツクアドレスの内容は変えない。そして、ス
テツプ64で、ホワイトアドレスの内容がクリアされる
とともに、次の走査位置への1ビツトシフトがなされる
。なお、上記ステツプ60において、ブラツクフラツグ
がセツト状態であれば、黒プロツクが連続していると判
断され、上記ステツプ64へ移る。こうして、上記制御
動作が繰返されるが、その制御途中のステツプ56にお
いて、第1カウンタ7の内容が定数T2以下であれば、
文字プロツクではない領域つまり白プロツクと判断され
る。
Further, the scanning clock signal is counted by the second counter 11 only during the period of the black block in the register 10. The control unit 2 performs the following control operations. First, each time one scan is completed, step 5 is performed.
3, the total address of the storage section is incremented by one. The content of this total address, that is, the total number of scans is
In step 54, it is compared to see if it is greater than the constant T1, and if it is greater, it is rejected (REJE) in step 54.
CT), making detection and cutting impossible. The constant T1 is the number of scan lines corresponding to about 1.3 times the character pitch. On the other hand, if the content of the total address is less than or equal to the constant T1 in step 54, it is compared in step 56 to see if the content of the first counter 7 is greater than the constant T2, and if so, the character block is is judged to exist. The constant T2 is the number of scan lines corresponding to the minimum width of a black block that can be determined to be a character block. and,
At step 57, the black address is incremented by one. The content of this black address is compared in step 58 to see if it is greater than a constant T3, and if it is greater, it is rejected in step 59, making detection and extraction impossible.
The constant T3 is the number of continuous scans of black blocks approximately corresponding to the character pitch. In step 58, if the content of the black address is less than or equal to the constant T3, the black flag is checked in step 60, and if the black flag is set, that is, if there is no black block in the previous scan, the current black It is determined that the block has changed from the white block. Thereafter, a black flag is set in step 61 due to the current black block. Furthermore, in step 62, the content of the white address is compared to see if it is greater than the constant T4, and if it is, the black data up to the present time is regarded as noise, and in step 63, the content of the black address is set to "1".
be made into In this case, in step 63 above, the contents of the black address are not cleared, that is, set to "0", but set to "1".
The current black block becomes the beginning for the next scan. The constant T4 is the number of scan lines that corresponds to a value larger than the distance between each plot of a character consisting of a plurality of plotters. On the other hand, in step 62, if the content of the white address is less than or equal to the constant T4, the black block up to the present time is not regarded as noise, and therefore the content of the black address is not changed. Then, in step 64, the contents of the white address are cleared and a 1-bit shift is performed to the next scanning position. If the black flag is set in step 60, it is determined that black blocks are continuous, and the process proceeds to step 64. In this way, the above control operation is repeated, but at step 56 during the control, if the content of the first counter 7 is equal to or less than the constant T2,
It is determined that the area is not a character block, that is, a white block.

そして、ステツプ65でホワイトアドレスが1インクリ
メントされるとともに、ブラツクフラグがりセツトされ
る。しかるのち、ステツプ66で第2カウンタ11の内
容が定数T5以下であるか否か比較され、以下の場合に
はステツプ67に移る。このステツプ67では、ブラツ
クアドレスの内容が定数T6以下であるか否か比較され
、以下の場合には現時点までの黒プロツクをノイズとみ
なし、ステツプ68でトータルアドレスの内容がホワイ
トアドレスにロードされるとともに、レジスタ10がク
リアされる。すなわちこれは、現時点までを全て白プロ
ツクと判断するものである。上記定数T5は、ノイズと
みなしてもよい黒プロツクの高さである。また、上記定
数T5は、ノイズとみなしてもよい黒プロツクの幅に相
当する走査本数である。そして、上記ステツプ66でカ
ウンタ11の内容が定数T5以下でない場合、上記ステ
ツプ67でブラツクアドレスの内容が定数T6以下でな
い場合および上記ステツプ68の経過後は、ステツプ6
9に移る。
Then, in step 65, the white address is incremented by 1 and the black flag is set. Thereafter, in step 66, the content of the second counter 11 is compared to see if it is less than or equal to the constant T5, and in the following cases, the process moves to step 67. In this step 67, the contents of the black address are compared to see if they are less than or equal to the constant T6, and in the following cases, the black blocks up to the present time are regarded as noise, and the contents of the total address are loaded into the white address in step 68. At the same time, register 10 is cleared. In other words, this determines that everything up to this point is a white block. The constant T5 is the height of the black block which may be considered as noise. Further, the constant T5 is the number of scans corresponding to the width of the black block, which may be regarded as noise. If the content of the counter 11 is not less than the constant T5 in step 66, if the content of the black address is not less than the constant T6 in step 67, and after step 68 has passed, step 6 is executed.
Move on to 9.

このステツプ69では、トータルアドレスの内容が定数
T7よりも大であるか否か比較され、大の場合には、ス
テツプ70でホワイトアドレスの内容が定数T8よりも
大であるか否か比較される。上記定数T7は、文字走査
終了とすることができる最低走査本数で、文字ピツチの
半分程度に相当するものである。また、上記定数T8は
、白プロツクの幅をブランクとするべき白プロツク連続
走査本数で、略文字ピツチに相当するものである。さら
に、上記ステツプ70の比較結果が否定の場合には、ス
テツプ71でホワイトアドレスの内容が定数T,と同値
であるか否か比較される 上記定数T,は、第6図に示
す読取対象文字例のうち、複数プロツクから成る文字「
ツ」、「ソ」の各プロツク間距離よりも大きく、かつ隣
接文字間隔の最小値よりも小さい値に相当する走査本数
である。そして、上記ステツプ71の比較結果が否定の
場合には、ステツプ72でホワイトアドレスの内容が定
数TlOと同値であるか否か比較される。上記定数Tl
Oは、第6図の読取対象文字例をその垂直方向射影(高
さ)および水平方向射影(幅)のプロツクの大きさにつ
いて6L0(大)、゛M”(中)、゛S゛(小)に分類
した下表において、垂直方向射影が1L゛のプロツク、
1S”のプロツクと1S”のプロツク、さらに1S”゜
のプロツタと6M゛のプロツクとから成る文字に対応す
るもので、隣接文字間隔の最小値以下の適当な値に相当
する走査本数である。さらに、上記ステツプ72の比較
結果が肯定の場合には、ステツプ73でブラツクアドレ
スの内容が定数Tllよりも大で、かつ定数T,2以下
であるか否か比較される。
In this step 69, the content of the total address is compared to see if it is greater than the constant T7, and if so, in step 70, the content of the white address is compared to see if it is greater than the constant T8. . The constant T7 is the minimum number of scans that can complete character scanning, and corresponds to about half the character pitch. The constant T8 is the number of continuous scans of white blocks whose width should be blanked, and corresponds to the approximate character pitch. Further, if the comparison result in step 70 is negative, the content of the white address is compared in step 71 to see if it is the same as the constant T. The constant T is the character to be read shown in FIG. In the example, the character consisting of multiple blocks "
This is the number of scanned lines that corresponds to a value that is larger than the distance between the blocks of "T" and "S" and smaller than the minimum value of the adjacent character spacing. If the result of the comparison in step 71 is negative, then in step 72 it is compared to see if the content of the white address is the same as the constant TlO. The above constant Tl
O is 6L0 (large), ゛M'' (medium), ゛S゛ (small) for the vertical projection (height) and horizontal projection (width) of the character example to be read in Figure 6. ), in the table below, the vertical projection is 1L,
This corresponds to a character consisting of a 1S'' block, a 1S'' block, a 1S'' plotter, and a 6M'' block, and the number of scan lines corresponds to an appropriate value less than the minimum value of the adjacent character interval. Further, if the comparison result in step 72 is affirmative, it is compared in step 73 to see if the contents of the black address are greater than constant Tll and less than constant T,2.

上記定数Tll,Tl,は、上表において、垂直方向射
影が″L゛のプロツク、”S゜”のプロツクと“S1の
プロツク、さらに″S゜゛のプロツクと6M1のプロツ
クとから成る文字に対応するもので、このうち定数Tl
lは各プロツクの垂直方向射影の幅の和の最小値よりも
小さな値に相当する走査本数、定数T,2は文字ピツチ
よりもやや小さな値に相当する走査本数である。そして
、上記ステツプ73の比較結果が肯定の場合には1文字
走査終了となり、パターンレジスタ8内の量子化文字パ
ターンが認識部(図示しない)によつて認識されるとと
もに、次の1文字走査に移る。この場合、上記ステツプ
69,72,73′の比較結果がそれぞれ否定の場合に
は、検出切出がなされることなく、前記ステツプ51に
戻る。さらに、上記ステツプ70の比較結果において、
ホワイトアドレスの内容が定数T8よりも大きい場合に
はステツプ74でブランク(BLANK)領域と判断さ
れ、1文字走査終了となる。また、上記ステツプ71の
比較結果が肯定の場合は、ステツプ75でブラツタアド
レスの内容が定数Tl3よりも大であるか否か比較され
、大の場合にはステツプ76で第2カウンタ11の内容
が定数Tl4と同値またはそれ以下であるか否か比較さ
れる。
The above constants Tll, Tl, correspond to the characters in the above table whose vertical projection consists of a block of "L", a block of "S゜" and a block of "S1", and a block of "S゛" and a block of 6M1. Among these, the constant Tl
l is the number of scanning lines corresponding to a value smaller than the minimum value of the sum of the widths of the vertical projections of each block, and the constant T, 2 is the number of scanning lines corresponding to a value slightly smaller than the character pitch. If the comparison result in step 73 is positive, one character scanning is completed, the quantized character pattern in the pattern register 8 is recognized by the recognition section (not shown), and the next one character scanning is started. Move. In this case, if the comparison results at steps 69, 72, and 73' are negative, the process returns to step 51 without performing detection extraction. Furthermore, in the comparison result of step 70 above,
If the content of the white address is larger than the constant T8, it is determined in step 74 that it is a blank area, and one character scanning ends. If the comparison result in step 71 is affirmative, step 75 compares the contents of the bratta address to see if it is greater than constant Tl3, and if so, step 76 compares the contents of the second counter 11. is compared to see if it is equal to or less than the constant Tl4.

上記定数T,3は、上表において、垂直方向射影および
水平方向射影のプロツクの大きさがともに”S゛の文字
に対応するもので、垂直方向 (射影の幅が最小値より
も小さな値に相当する走査本数である。また、定数Tl
4は、上表において、水平方向射影のプロツクの大きさ
が6S゛の文字に対応するもので、水平方向射影の高さ
が最大値よりもやや小さな値に相当するものである。そ
し 1て、上記ステツプ76の比較結果が肯定の場合に
は、1文字走査終了となり、パターンレジスタ8内の量
子化文字パターンが認識部によつて認識されるとともに
、次の1文字走査に移る。こうして、たとえば「バ]な
どの複数プロツクから成る文字 Jの検出切出が完了す
る。この場合、上記ステツプ75,76の比較結果が否
定の場合には、前記ステツプ51に戻る。さらに、上記
ステツプ72の比較結果が否定の場合には、ステツプJ
モVでホワイトアドレスの内 二容が定数Tl5と同値
であるか否か比較される。
The above constant T, 3 corresponds to the letter "S" in which both the vertical projection and horizontal projection widths are smaller than the minimum value in the table above. This is the corresponding number of scans.Also, the constant Tl
4 corresponds to the character 6S'' in the horizontal projection block size in the above table, and corresponds to a value whose horizontal projection height is slightly smaller than the maximum value. Then, if the comparison result in step 76 is positive, one character scanning is completed, the quantized character pattern in the pattern register 8 is recognized by the recognition section, and the next one character scanning is started. . In this way, the detection and extraction of the character J consisting of multiple blocks such as "B" is completed. In this case, if the comparison results in steps 75 and 76 are negative, the process returns to step 51. If the comparison result in step 72 is negative, step J
In MoV, the contents of the white address are compared to see if they are the same as the constant Tl5.

上記定数Tl5は、上表において、垂直方向射影が2つ
のプロツクから成る文字のプロツク間距離の最大値より
も大きな値に相当する走査本数である。そして、上記ス
テツプJモVの比較結果が肯定の場合には、ステツプ78
でブラツクアドレスの内容が定数T,6よりも大である
か否か比較される。上記定数Tl6は、土表において、
垂直方向射影のプロツクの大きさが6M1の文字に対応
し、文字ピツチの最小値よりも小さな値に相当する走査
本数である。上記ステツプ78の比較結果が肯定の場合
には、ステツプ79で第2カウンタ11の内容が上記定
数Tl4よりも大であるか否か比較される。このステツ
プ79の比較結果が肯定の場合には、1つの文字走査終
了となり、たとえば「ハ」、「ル」などの複数プロツク
から成る文字が検出切出される。この場合、上記ステツ
プJモV,78,79の比較結果がそれぞれ否定の場合に
は前記ステツプ51に戻る。ここで、上述した制御動作
を各種検出条件についてまとめると、〔リジエクト条件
〕 7T0TAL>Tl 4BLACK>T3 〔ノイズ条件〕 0 (BLACK<T6)△(カウンタ11くT5)1
(WHITE>T4)の後、黒プロツクに到達した場合
にそれ以前の黒プロツクをノイズとみなす。
The constant Tl5 is the number of scan lines corresponding to a value larger than the maximum value of the inter-block distance of a character whose vertical projection consists of two blocks in the above table. Then, if the comparison result in step JMoV is affirmative, step 78 is performed.
The contents of the black address are compared to see if they are greater than the constant T, 6. The above constant Tl6 is, at the soil surface,
The vertical projection block size corresponds to a character of 6M1, and the number of scan lines corresponds to a value smaller than the minimum character pitch. If the comparison result in step 78 is affirmative, step 79 compares the content of the second counter 11 to see if it is greater than the constant Tl4. If the comparison result in step 79 is affirmative, one character scanning is completed, and characters consisting of a plurality of blocks, such as "Ha" and "R", are detected and cut out. In this case, if the comparison results at steps J, V, 78, and 79 are negative, the process returns to step 51. Here, to summarize the above-mentioned control operation with respect to various detection conditions: [Reject condition] 7T0TAL>Tl 4BLACK>T3 [Noise condition] 0 (BLACK<T6)△(Counter 11 x T5) 1
After (WHITE>T4), when a black block is reached, the previous black block is regarded as noise.

〔ブランク検出条件〕[Blank detection conditions]

4(TOTAL>T7)△いHTE>T8)〔文字検出
条件〕の (TOTAL>T7)A(WHITE−Tl
O)△(TllくBLACK<Tl2)1(TOTAL
>T7)A(WIIITE=T9)△(BLACK>T
l3)△(第2カウンタ11≦Tl4)@ (TOTA
L>T7)△いHTE=Tl5)△(BLACK>Tl
6)△蔦2カウンタ11〉Tl4)となる。
4 (TOTAL>T7)△HTE>T8) [Character detection conditions] (TOTAL>T7)A(WHITE-Tl
O) △(TllkuBLACK<Tl2)1(TOTAL
>T7)A(WIIITE=T9)△(BLACK>T
l3)△(second counter 11≦Tl4) @ (TOTA
L>T7)△HTE=Tl5)△(BLACK>Tl
6) △vine 2 counter 11>Tl4).

しかして、正確に文字が検出切出され、パターンレジス
タ8内の文字パターンの認識がなされる。
Thus, the characters are accurately detected and cut out, and the character pattern in the pattern register 8 is recognized.

そして、上記検出条件について説明する。前記表から明
らかなように、第6図の読取対象文字例は垂直方向射影
で5種類の文字群に分類されるが、複数プロツクから成
る文字「ハ」,「l月,「ル],「ツ」,「ソ」ばS”
のプロツクどSnのプロツタあるいは6snのプロツク
と″M”のプロツクから構成されている。ところが、゛
S゛の1つのブカツクあるいは6M″の1つのプロツタ
だけで構成されている文字も存在するから、垂直方向射
影内の黒プロツクの幅だけでは正確な検出切出ができな
い。このため、この実施例では、垂直方向射影の他に水
平方向射影を使用し、これらの射影によつて各プロツク
間隔およびプロツク高さを得るようにしている。つまり
、前述した文字検出条件のうち、条件のは垂直方向射影
のプロツクの幅が1L゛である文字が対応するものであ
る。さらに、条件1は、垂直方向射影のプロツクの幅お
よび水平方向射影のプロツクの高さがともに0S″であ
る文字「]」 ,「・」,「I」 ,[゛」,「0」,
「s」が対応するものである。また、条件7は垂直方向
射影のプロツクの幅が6M゛の文字が対応するものであ
る。ところで、垂直方向射影が2つのプロツクから成る
文字のうち、たとえば「ツ],「ソ」においては、走査
位置が各プロツクの中間に到達したとき、ステツプ71
のWHITE−T9あるいはステツプ69のTOTAL
>T7が肯定されないため、上記条件7,7に対応しな
い場合がある。
Then, the above detection conditions will be explained. As is clear from the above table, the example characters to be read in Figure 6 are classified into five types of character groups by vertical projection, and the characters ``ha'', ``l month'', ``ru'', and ``, which are composed of multiple blocks, are classified into five types of character groups by vertical projection. TS”, “So” baS”
This block consists of an Sn plotter or a 6sn block and an "M" block. However, since there are characters that are composed of only one block of ``S'' or one plotter of 6M'', accurate detection and cutting cannot be performed using only the width of the black block in the vertical projection.For this reason, In this embodiment, horizontal projection is used in addition to vertical projection, and each block spacing and block height are obtained by these projections.In other words, among the character detection conditions described above, the corresponds to a character whose vertical projection block width is 1L''.Furthermore, condition 1 corresponds to a character whose vertical projection block width and horizontal projection block height are both 0S''. “]”, “・”, “I”, [゛”, “0”,
"s" corresponds to this. Condition 7 corresponds to characters whose vertical projection block width is 6M. By the way, among the characters whose vertical projection consists of two blocks, for example, for "T" and "S", when the scanning position reaches the middle of each block, step 71 is executed.
WHITE-T9 or TOTAL of step 69
>T7 is not affirmed, so conditions 7 and 7 may not be met.

また、同様に垂直方向射影が2つのプロツタから成る文
字のうち、たとえば「ハ」,「1月,「ル」においては
、走査位置が各プロツクの中間に到達したとき、ステツ
プ76のカウンタ11〈Tl4あるいはステツプJモVの
WHITE=Tl5が肯定されないため、上記条件7,
7に対応しない場合がある。このような場合には、2つ
のプロツクの走査終了時、2つのプロツクの幅の累計(
ブラツクアドレスの内容)が定数Tllよりも大でしか
も定数Tl2以下となることにより、つまりステツプ7
3のTllくBLACK<Tl2に対応することにより
、検出切出しとなる。なお、上記実施例では、フライン
グスポツトスキヤナ走査方式を採用しているが、その走
査方式に限定はなく、たとえば次に示すようなものでも
よい。
Similarly, among the characters whose vertical projections consist of two plotters, for example, "c", "January", and "ru", when the scanning position reaches the middle of each plotter, the counter 11 of step 76 < Since Tl4 or WHITE=Tl5 of step JMoV is not affirmed, the above condition 7,
7 may not be compatible. In such a case, at the end of scanning the two blocks, the cumulative width of the two blocks (
Since the content of the black address) is greater than the constant Tll and less than the constant Tl2, that is, step 7
Detection cutting is performed by corresponding to Tll of 3 and BLACK<Tl2. Although the above embodiment employs a flying spot scanner scanning method, the scanning method is not limited, and may be, for example, as shown below.

(1)半導体線スキヤナを文字列に平行に移動させる方
式。
(1) A method in which the semiconductor wire scanner is moved parallel to the character string.

(2)レーザ光線を回転反射鏡によつて文字列上をラス
タースキヤンする方式。
(2) A method in which a laser beam is raster scanned over a character string using a rotating reflector.

(3)文字列の幅の視野を有する線走査器を固定し、こ
の線走査器に対して帳票をその文字列と垂直な方向に移
動しながら走査し、その走査による文字パターンを記憶
装置に格納しておき、さらに記憶装置内の文字パターン
を上記実施例の走査と同様の方式で読取るもの。
(3) A line scanner with a field of view the width of a character string is fixed, the form is scanned by the line scanner while moving in a direction perpendicular to the character string, and the character pattern resulting from the scanning is stored in a storage device. The character pattern stored in the storage device is read in the same manner as the scanning method used in the above embodiment.

また、文字プロツクの高さは水平方向射影を作成するこ
とにより判断しているが、たとえば走査によつて黒プロ
ツクが検出される位置(上下方向)の最大値および最小
値を求め、その最大値と最小値との差を文字プロツクご
とに求めるようにしてもよい。
In addition, the height of a character block is determined by creating a horizontal projection. The difference between and the minimum value may be calculated for each character block.

このように、この発明は上記実施例に限定されるもので
はなく、この発明の要旨を変えない範囲で種々変形実施
可能なことは勿論である。
As described above, the present invention is not limited to the embodiments described above, and it goes without saying that various modifications can be made without departing from the gist of the invention.

以上述べたようにこの発明によれば、垂直方向射影を第
1の計数手段で計数し、水平方向射影を第2の計数手段
で計数し、上記第1、第2の計数手段の計数結果に応じ
て文字を形成するプロツクの幅、高さ、プロツク間隔を
決定するようにしたので、記録媒体における文字の位置
、印字品質および種類にかかわらず、しかも短時間のう
ちに各文字情報を正確に検出切出すことができる文字検
出切出装置が提供できる。
As described above, according to the present invention, the vertical projections are counted by the first counting means, the horizontal projections are counted by the second counting means, and the counting results of the first and second counting means are combined. Since the width, height, and block spacing of the blocks that form characters are determined accordingly, each character information can be accurately recorded in a short time regardless of the position of the character on the recording medium, print quality, and type. A character detection and cutting device capable of detecting and cutting out characters can be provided.

【図面の簡単な説明】[Brief explanation of drawings]

第1図および第2図は文字の垂直方向射影とその切出し
領域を示す図、第3図はこの発明の一実施例を示す構成
図、第4図は同実施例における動作を説明するためのタ
イムチヤート、第5図は同実施例における動作を説明す
るためのフローチヤート、第6図は読取対象文字列を示
す図である。 1・・・・・・陰極線管(CRT)、2・・・・・・制
御部、3・・・・・・レンズ、4・・・・・・帳票、5
・・・・・・光電子増倍管、6・・・・・・量子化回路
、7・・・・・・第1カウンタ、8・・・・・・パター
ンレジスタ、9・・・・・・オア回路、10・・・・・
・水平射影レジスタ、11・・・・・・第2カウンタ。
1 and 2 are diagrams showing the vertical projection of characters and their cutout areas, FIG. 3 is a block diagram showing an embodiment of the present invention, and FIG. 4 is a diagram for explaining the operation of the embodiment. A time chart, FIG. 5 is a flowchart for explaining the operation in the same embodiment, and FIG. 6 is a diagram showing character strings to be read. 1... Cathode ray tube (CRT), 2... Control unit, 3... Lens, 4... Form, 5
...Photomultiplier tube, 6...Quantization circuit, 7...First counter, 8...Pattern register, 9... OR circuit, 10...
- Horizontal projection register, 11...Second counter.

Claims (1)

【特許請求の範囲】[Claims] 1 文字の上下方向の線走査を文字列に沿つて移動する
ことにより文字を読取る文字読取装置において、垂直方
向射影を計数する第1の計数手段と、水平方向射影を計
数する第2の計数手段と、前記第1、第2の計数手段の
計数結果に応じて文字を形成するブロックの幅、高さ、
ブロック間隔を決定する制御手段とを具備したことを特
徴とする文字検出切出装置。
1. In a character reading device that reads characters by moving vertical line scans along a character string, a first counting means counts vertical projections and a second counting means counts horizontal projections. and the width and height of the block forming the character according to the counting results of the first and second counting means,
A character detection and cutting device comprising: a control means for determining a block interval.
JP53096775A 1978-08-09 1978-08-09 Character detection cutting device Expired JPS594068B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP53096775A JPS594068B2 (en) 1978-08-09 1978-08-09 Character detection cutting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP53096775A JPS594068B2 (en) 1978-08-09 1978-08-09 Character detection cutting device

Publications (2)

Publication Number Publication Date
JPS5525104A JPS5525104A (en) 1980-02-22
JPS594068B2 true JPS594068B2 (en) 1984-01-27

Family

ID=14174003

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53096775A Expired JPS594068B2 (en) 1978-08-09 1978-08-09 Character detection cutting device

Country Status (1)

Country Link
JP (1) JPS594068B2 (en)

Also Published As

Publication number Publication date
JPS5525104A (en) 1980-02-22

Similar Documents

Publication Publication Date Title
US5101448A (en) Method and apparatus for processing a document by utilizing an image
US4562594A (en) Method and apparatus for segmenting character images
JPS594068B2 (en) Character detection cutting device
JPH07230525A (en) Method for recognizing ruled line and method for processing table
JPH07120390B2 (en) Character cutout method
JPH0373916B2 (en)
JP2957729B2 (en) Line direction determination device
JPH10336428A (en) Image processing unit
JPH11316797A (en) Method and device for discriminating area of document image
JP2003317107A (en) Method and device for ruled-line detection
JPH0223904B2 (en)
JP2957739B2 (en) Line direction determination device
JP2000222577A (en) Method and device for ruled line processing, and recording medium
JPH04359393A (en) Optical character reader
JP2957740B2 (en) Line direction determination device
JP2859307B2 (en) Character extraction device
JP2929710B2 (en) Character reading method
JP2001209755A (en) Device and method for correcting miswriting and computer readable recording medium with miswriting correction program stored therein
JPH10233930A (en) Image processor
JPH06350851A (en) Background density detection device
JPS6045884A (en) Character frame delecting device for character recognizer
JPS59206987A (en) Letter recognizing device
JPH07325878A (en) Recognizing method for character
JPH0634254B2 (en) Character line cutting device
JPH0793479A (en) Optical character reader