JPS62200490A - Optical character reader - Google Patents

Optical character reader

Info

Publication number
JPS62200490A
JPS62200490A JP61043260A JP4326086A JPS62200490A JP S62200490 A JPS62200490 A JP S62200490A JP 61043260 A JP61043260 A JP 61043260A JP 4326086 A JP4326086 A JP 4326086A JP S62200490 A JPS62200490 A JP S62200490A
Authority
JP
Japan
Prior art keywords
character
pattern
reading
line
pattern data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61043260A
Other languages
Japanese (ja)
Inventor
Tomio Sakata
坂田 富生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP61043260A priority Critical patent/JPS62200490A/en
Publication of JPS62200490A publication Critical patent/JPS62200490A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To recognize a character even when invasion and projection occur between adjoining rows by cutting out the character pattern of one character unit based upon the reading sight information of respective characters and reading the character. CONSTITUTION:The variable density information of a slip is quantized by a photoelectric converting part 1, converted to binary digital pattern data and inputted to a pattern buffer 2. The pattern buffer 2 stores the pattern data of at least one row of the character row. The stored pattern data are supplied to an upper lower direction reading sight detecting part 3 and the detecting data of an upper lower direction sight scope are supplied from the upper lower direction reading sight detecting part 3 to a character cutting-out part 4. A character cutting-out part 4 executes the character cutting-out from the pattern data based upon the detecting data of the upper lower direction sight scope and supplies the cut-out character pattern to a recognizing processing part 5. The recognition processing part 5 inputs the character pattern, executes the character recognition and outputs a candidate category to the external part as the character recognizing result.

Description

【発明の詳細な説明】 (発明の目的) (産業上の利用分野) 本発明は光学的文字読取装置に関する。[Detailed description of the invention] (Purpose of the invention) (Industrial application field) The present invention relates to an optical character reading device.

(従来の技術) 従来、光学的文字読取装置(以下、0CR)は、帳票上
に記載された複数の文字行から読取対象となる文字行の
読取を行うために、ホストからフォーマット情報の提供
を受け、文字行位置を設定し、文字行中心位置に対し所
定の幅の領域を定めて文字行読取りを行うものである。
(Prior Art) Conventionally, an optical character reading device (hereinafter referred to as OCR) receives format information from a host in order to read a target character line from among multiple character lines written on a form. The character line position is then set, and an area of a predetermined width is defined with respect to the center position of the character line to read the character line.

即ら、帳票上の濃淡情報は、文字行中心位置を中心とし
て予め設定された範囲で光電変換され、得られたパター
ンデータがパターンバッファに格納される。パターンバ
ッファに格納されたパターンデータには、隣接する文字
行からの侵入や、隣接する文字行へのはみ出しがないと
の前提で、文字の切出しと文字認識が行われるものであ
る。
That is, the shading information on the form is photoelectrically converted in a preset range centered on the center position of the character line, and the obtained pattern data is stored in a pattern buffer. Character extraction and character recognition are performed on the premise that the pattern data stored in the pattern buffer does not intrude from adjacent character lines or protrude into adjacent character lines.

(発明が解決しようとする問題点) しかしながら、文字行の行間ビッヂが小さい場合には、
現実には文字行から文字の一部がはみ出したり、隣接行
から他の文字の一部が侵入したりするので、リジェクト
や誤読が多発してしまう。
(Problem to be solved by the invention) However, when the line spacing between character lines is small,
In reality, parts of characters protrude from a character line, or parts of other characters invade from adjacent lines, resulting in frequent rejections and misreadings.

このため、従来、OCR用の読取帳票は、文字行ピッチ
を充分広くとらざるをえず、帳票サイズに比べて通常の
文鳥より記載文字数が少な(なり、OCRによる文字処
理効率を低下させてしまうという問題点があった。
For this reason, conventionally, documents read for OCR have had to have a sufficiently wide character line pitch, and compared to the document size, the number of written characters is smaller than that of a normal sparrow (which reduces the efficiency of character processing by OCR). There was a problem.

本発明は上記従来技術の事情を考慮してなされたもので
、帳票に記載された文字が隣接文字行にはみだしたり、
あるいは隣接文字行から他文字行の文字が侵入したりし
ても正しく文字の切出しを行うことができ、帳票に記載
できる単位面積当りの文字数を、多くすることができる
光学的文字読取装置を提供することを目的とする。
The present invention has been made in consideration of the above-mentioned circumstances of the prior art.
Or, to provide an optical character reading device that can correctly cut out characters even if characters from another character line invade from an adjacent character line, and can increase the number of characters per unit area that can be written on a form. The purpose is to

〔発明の構成〕[Structure of the invention]

(問題点を解決するための手段) 上記目的を達成するために本発明は、帳票上の濃淡情報
をパターンデータに変換する変換部と、前記帳票上に記
載された文字のうち少なくとも1行分の前記パターンデ
ータを格納するパターンバッファと、このパターンバッ
ファに格納されたパターンデータを走査してそれぞれの
文字の少なくとも一方向についての読取視野を検出する
読取視野検出部と、前記読取視野検出部からの検出情報
にもとづいて1文字単位の文字パターンの切出しを行う
文字切出し部と、前記切出された文字パターンをFi!
識する認識部とを備えたことを特徴とする。
(Means for Solving the Problems) In order to achieve the above object, the present invention includes a conversion unit that converts shading information on a form into pattern data, and at least one line of characters written on the form. a pattern buffer for storing the pattern data; a reading field detecting section for scanning the pattern data stored in the pattern buffer to detect a reading field of view in at least one direction of each character; A character cutting section cuts out a character pattern in units of characters based on the detection information of the Fi!
It is characterized by being equipped with a recognition section that recognizes the

(作 用) 本発明によれば以上のように光学的文字読取装置を構成
したので、文字がはみ出していても正しい読取視野範囲
を定めることができる。
(Function) According to the present invention, since the optical character reading device is configured as described above, it is possible to determine the correct reading field of view even if the characters protrude.

(実施例) 以下、図面第1図乃至第3図を参照して本発明の一実施
例による光学的文字読取装置を説明する。
(Embodiment) An optical character reading device according to an embodiment of the present invention will be described below with reference to FIGS. 1 to 3 of the drawings.

本実施例では、記載された文字が@票に対して横方向に
配列しているいわゆる横行文字配列の帳票を読取る場合
について説明する。
In this embodiment, a case will be described in which a document with a so-called horizontal character arrangement, in which written characters are arranged horizontally with respect to the @ slip, is read.

第1図に示すように、帳票の濃淡情報は光電変換部1に
より光電変換された後、a子化されて例えば2値のデジ
タルパターンデータに変換され、パターンバッファ2に
入力される。パターンバッファ2は、少なくとも文字行
1行分のパターンデータを格納する。ここで入カバター
ンデータのうち少なくとも文字行の1行分をパターンバ
ッファ2に格納するのは、本実施例が文字読取の対象と
なる目的とする文字行(以下、読取行)の文字読取りを
行うときに、隣接行から文字の1部が侵入し、あるいは
読取行から隣接行に文字の1部がはみ出すような場合を
着目しているからである。パターンバッファ2に格納さ
れたパターンデータは、上下方向読取視野検出部3に供
給され、上下方向視野範囲の検出データが上下方向読取
視野検出部3から文字切出し部4に供給される。ここで
、上下方向とは、帳票の横方向に配列した文字行(横行
)に対して直交する縦方向、いわば紙面内の上下方向の
ことである。文字切出し部4は上下方向視野範囲の検出
データに基づいて、パターンデータから文字切出しをお
こない、切出された文字パターンをvt識処理部5に供
給する。!!!!!識処理部5は文字パターンを入力し
て文字認識を行い、候補カテゴリーを文字III結果と
して外部に出力する。
As shown in FIG. 1, the shading information of the form is photoelectrically converted by a photoelectric converter 1, converted into a-digital data, converted into, for example, binary digital pattern data, and inputted into a pattern buffer 2. The pattern buffer 2 stores pattern data for at least one character line. The reason why at least one character line of the input cover pattern data is stored in the pattern buffer 2 is because this embodiment is designed to read characters in the target character line (hereinafter referred to as a reading line). This is because we are focusing on cases where part of a character intrudes from an adjacent line or part of a character protrudes from a read line into an adjacent line. The pattern data stored in the pattern buffer 2 is supplied to the vertical reading field of view detection section 3, and the detection data of the vertical direction reading field of view is supplied from the vertical direction reading field of view detection section 3 to the character cutting section 4. Here, the vertical direction refers to the vertical direction perpendicular to the character lines (horizontal lines) arranged in the horizontal direction of the form, so to speak, the vertical direction within the plane of the paper. The character cutting section 4 cuts out characters from the pattern data based on the detection data of the vertical visual field range, and supplies the cut out character pattern to the VT recognition processing section 5. ! ! ! ! ! The recognition processing unit 5 inputs a character pattern, performs character recognition, and outputs a candidate category to the outside as a character III result.

上下方向読取視野検出部3はパターンバッファ2に格納
されたパターンデータを走査して以下の手順により読取
行文字の上下方向視野範囲を検出する。まず、上下方向
読取視野検出部3は、パターンデータを走査し、読取行
の文字が上下の隣接行へはみ出しているか否かを検出す
る(以下、はみ出し検出)。次に、同様にして上下隣接
行から読取行に侵入があるか否かを検出する(以下、侵
入検出)。もし侵入が検出された場合には、その侵入部
分をパターンデータから消去する(以下、消去)。上記
により上下方向視野範囲を検出し、その検出データを文
字切出し部4に供給する。文字切出し部4は、この検出
データに基づいて公知の技術によりパターンデータから
文字切出しを行い、認識処理部5に切出された文字パタ
ーンを供給する。認識処理部5は入力した文字パターン
を公知の技術によって文字認識し、認識文字コードを出
力する。
The vertical reading field of view detecting section 3 scans the pattern data stored in the pattern buffer 2 and detects the vertical field of view range of the read line characters according to the following procedure. First, the vertical reading field of view detection unit 3 scans the pattern data and detects whether or not the characters in the read line protrude into the vertically adjacent lines (hereinafter referred to as protrusion detection). Next, in the same manner, it is detected whether or not there is an intrusion into the reading line from the upper and lower adjacent lines (hereinafter referred to as intrusion detection). If an intrusion is detected, the intruded portion is deleted from the pattern data (hereinafter referred to as deletion). The vertical viewing range is detected as described above, and the detected data is supplied to the character cutting section 4. Based on this detection data, the character cutting section 4 cuts out characters from the pattern data using a known technique, and supplies the cut out character pattern to the recognition processing section 5. The recognition processing unit 5 recognizes the input character pattern using a known technique and outputs a recognized character code.

以下、更に詳細に上下方向読取視野検出部3の動作を第
2図及び第3図を参照して説明する。第2図は読取対象
である帳票の読取行の1部分を拡大して示した説明図で
、数字「2」が読取行に記載され、隣接する上の行から
斜線が侵入している場合を例示したものである。即ち、
パターンバッファ2に格納されたパターンデータには読
取行に隣接行から侵入が生じていることとなる。
Hereinafter, the operation of the vertical reading field of view detection section 3 will be explained in more detail with reference to FIGS. 2 and 3. Figure 2 is an explanatory diagram showing an enlarged view of a part of the reading line of the form to be read, and shows a case where the number "2" is written on the reading line and a diagonal line intrudes from the adjacent upper line. This is an example. That is,
This means that the pattern data stored in the pattern buffer 2 has an intrusion into the read line from an adjacent line.

上下方向読取視野検出部3は、はみ出し検出、侵入検出
及び消去の操作を以下のように行う。なお、以下の説明
では読取行の上方に隣接する隣接行から侵入がある場合
、又は読取行から上方の隣接行にはみ出しがある場合に
ついての上方視野範囲を検出する場合を説明するが、下
方の隣接行と読取行との関係も同様であるので、下方視
野範囲の検出についての説明は省略する。
The vertical reading field of view detection unit 3 performs protrusion detection, intrusion detection, and erasing operations as follows. In addition, in the following explanation, we will explain the case where the upper visual field range is detected when there is intrusion from the adjacent row above the reading row, or when there is protrusion from the reading row into the adjacent row above, but Since the relationship between the adjacent row and the reading row is the same, a description of the detection of the lower visual field range will be omitted.

第1ステツプでは、上下方向読取視野検出部ははみ出し
検出を行う。
In the first step, the vertical reading field of view detection section performs protrusion detection.

先づ、読取行の行内の第1番目の文字(第2図における
数字「2」)について、仮の視野上方境界を第2図中、
Y=MSKU、X=MSKL 〜MSKRに設定する。
First, for the first character in the reading line (the number "2" in Figure 2), the upper boundary of the temporary visual field is set as shown in Figure 2.
Set Y=MSKU, X=MSKL to MSKR.

ここでX及びYは、パターンデータに対して設けられた
X軸、Y軸アドレス座標である。また、MΔSKOは読
取行の中心位置のY座標であり、M S K U G、
t M A S K Cに対して予め設定された幅だけ
隔って仮定された仮の視野上端座標である。同様に、M
SKLは文字ピッチ情報によって定められた仮の文字左
端座標、MSKRは文字ピッチ情報によって定められた
仮の文字右端座標である。なお、上記MASKCを設定
する読取行の中心位置、MSKL、及びMSKRを設定
する文字ピッチ情報は、上位のホストからOCRに提供
されるフォーマット情報に含まれた情報である。上方は
み出し検出は、Y−MSKUl、:おいてxをMSKL
からMSKRl、:移動し、第2図で右方向に黒ビツト
サーチを行うことにより行われる。黒ビットが検出され
なければ仮に設定された視野上端座標MSKLJをその
ま)視野上端座標MASKUとする。このときには、視
野上端座標MASKUより下方に文字が位置しているか
らである。
Here, X and Y are X-axis and Y-axis address coordinates provided for the pattern data. Furthermore, MΔSKO is the Y coordinate of the center position of the reading line, and M S K U G,
t M A S K These are tentative visual field upper end coordinates that are assumed to be separated by a preset width from C. Similarly, M
SKL is a temporary character left end coordinate determined by the character pitch information, and MSKR is a temporary character right end coordinate determined by the character pitch information. Note that the center position of the reading line for setting the MASKC, the character pitch information for setting the MSKL, and MSKR are information included in the format information provided from the host to the OCR. For upward protrusion detection, set x to MSKL with Y-MSKUl, :
This is performed by moving from MSKRl to : and performing a black bit search in the right direction in FIG. If no black bit is detected, the temporarily set visual field upper end coordinate MSKLJ is used as the visual field upper end coordinate MASKU. This is because at this time, the character is located below the visual field upper end coordinate MASKU.

しかし、上記黒ビツトサーチで黒ビットが検出された場
合には上方隣接行からの侵入もしくは上方隣接行へのは
み出しが生じていることとなる。
However, if a black bit is detected in the above black bit search, it means that there is an intrusion from an upper adjacent row or an overflow to an upper adjacent row.

この場合には第2のステップに移行し、侵入かはみ出し
かの識別を行うこととなる。
In this case, the process moves to the second step, in which it is determined whether the object is an intrusion or an extrusion.

まず、上記第1ステツプで黒ビットが検出されると、そ
の黒ビツト検出位置(第2図中、Pl)から右廻りに輪
郭追跡を行う。追跡の途中で上部境界Y座標であるU 
L M Tを越えた場合には(第2図中、P2)上方隣
接行から侵入が生じていると判断し、侵入フラグUIV
Fをセットして追跡を中止し、後述の第3のステップに
移行させる。
First, when a black bit is detected in the first step, contour tracing is performed clockwise from the black bit detection position (Pl in FIG. 2). In the middle of tracking, U is the upper boundary Y coordinate.
If LMT is exceeded (P2 in Figure 2), it is determined that the intrusion has occurred from the upper adjacent row, and the intrusion flag UIV is set.
Set F to stop tracking and proceed to the third step described below.

ここでULMTは、上方隣接行の中心位置と読取行中心
位置との中間位置から、予め定められた幅だけ上方に設
定された上部境界Y座標で、いわば上方へのはみ出し境
界を示す境界座標となるものである。侵入が生じたと判
断されたときは第3のステップに移行する。第3のステ
ップでは、輪郭追跡を開始した位U(第2図中、Pl)
から白ビツトサーチを行う。そして白ビットを検出した
場合(第2図中、P )には、その点P3から再び黒ビ
ツトサーチを行う。
Here, ULMT is the upper boundary Y coordinate set upward by a predetermined width from the intermediate position between the center position of the upper adjacent row and the reading line center position, and is a boundary coordinate indicating an upwardly protruding boundary. It is what it is. When it is determined that an intrusion has occurred, the process moves to the third step. In the third step, the position U (Pl in Fig. 2) where contour tracking is started is
Perform white bit search from . If a white bit is detected (P in FIG. 2), the black bit search is performed again from that point P3.

この黒ビツトサーチにより再び黒ビットが検出されると
、その検出位置(第2図中、P4)から6遍りに輪郭追
跡を行う。この輪郭追跡によって上記ULMTに達する
ことなく上記MSKUに追跡が戻った場合には(第2図
中、P5)、読取行文字に上方のはみ出しが生じていた
と判断し、このはみ出し部分の上端座標を求める。そし
て、MSKUに戻った位置(第2図中、P5)から再び
MSKRの方向に黒ビツトサーチを続ける。
When a black bit is detected again by this black bit search, the contour is traced six times from the detected position (P4 in FIG. 2). If the contour tracking returns to the MSKU without reaching the ULMT (P5 in Figure 2), it is determined that an upward protrusion has occurred in the read line character, and the upper end coordinates of this protruding portion are determined. demand. Then, the black bit search is continued again in the direction of MSKR from the position returned to MSKU (P5 in FIG. 2).

第2のステップではみ出しが生じていたと判断された場
合には第4のステップに移行する。第4のステップでは
、求められた各はみ出し部分の上端座標の内から最上端
の座標を求め、最上端座標の最小値から1ビツト上方の
座標を視野上端座標MASKUとするようにセットする
If it is determined in the second step that protrusion has occurred, the process moves to the fourth step. In the fourth step, the coordinate of the uppermost end is determined from among the upper end coordinates of each protruding portion, and the coordinate 1 bit above the minimum value of the uppermost coordinate is set as the visual field upper end coordinate MASKU.

前記の第2のステップで侵入と判断され侵入フラグUI
VFがセットされている場合には、第5のステップに移
行し、侵入ブロックの消去を行う。
It is determined that there is an intrusion in the second step, and the intrusion flag UI is displayed.
If VF is set, the process moves to the fifth step and erases the intruding block.

一方、上記のステップで侵入もはみ出しも無いと判断さ
れたときは上下方向視野の検出操作は終了することとな
る。
On the other hand, if it is determined in the above step that there is no intrusion or protrusion, the vertical visual field detection operation ends.

さて、第5のステップでは上方隣接行からの侵入検出と
消去とが行われる。以下、第3図を参照して第5のステ
ップの動作を説明する。第3図は読取行への侵入の様子
を例示した説明図である。
Now, in the fifth step, intrusion detection and erasure from the upper adjacent row are performed. The operation of the fifth step will be explained below with reference to FIG. FIG. 3 is an explanatory diagram illustrating how the reading line is invaded.

(a)は侵入したものが、読取行の文字と分離している
場合を示し、(b)は侵入したものが読取行の文字と接
触している場合を示している。
(a) shows the case where the intruding object is separated from the characters on the reading line, and (b) shows the case where the intruding object is in contact with the characters on the reading line.

まず、読取行の行内の1番目の文字(第3図における数
字「2」)について、視野上方境界をY=MASKU、
!:L、X=MASKL−MASKRに設定する。そし
て、Y=MASKUにおいてXをMASKLからMAS
KRに移動し、第3図で右方向に黒ビツトサーチを行う
。なお、この黒ビツトサーチで検出されるものは上記第
2のステップの結果として侵入ブロックのみである。黒
ビットが検出されたら、その位置(第3図(a)中、P
l)から左廻りに輪郭追跡を行う。追跡の途中で上方侵
入境界Y座標U I LMTに達するか、又は追跡長が
追跡長について予め設定した閾値CLMTを越える場合
には、上方隣接行からの侵入が正確な読取行文字認識を
不可能にしているものとみなし、リジェクトフラグをセ
ットして動作を終了する。ここで、U I LMTは、
読取行中心位置から予め設定された幅だけ上方に設けら
れた、いわば上方からの侵入許容限界を示す境界座標で
ある。一方、輪郭追跡によってもY座標がUILMTに
達することなく、又は、追跡長がCLMT以内であり、
かつY座標がMASKUに戻ったならば(第3図(a)
中、P2)、さらに輪郭追跡を続行する。そして、再び
Y座標がMASKUに戻ることなくLJLMTに達した
ならば(第3図(a)中、P3)、上方からの侵入は分
離した侵入ブロックとみなし、侵入部分の消去を行う。
First, for the first character in the reading line (number "2" in Figure 3), set the upper boundary of the visual field as Y=MASKU,
! : Set L, X=MASKL-MASKR. Then, at Y=MASKU, change X from MASKL to MAS
Move to KR and perform a black bit search to the right in Figure 3. Note that what is detected in this black bit search is only the intrusion block as a result of the second step. When a black bit is detected, its position (in Fig. 3(a), P
Contour tracking is performed counterclockwise from l). If the upper intrusion boundary Y coordinate U I LMT is reached in the middle of tracking, or if the tracking length exceeds the threshold CLMT set in advance for the tracking length, intrusion from the upper adjacent line makes accurate reading line character recognition impossible. It is assumed that this is the case, the reject flag is set, and the operation ends. Here, U I LMT is
These are boundary coordinates that are provided a predetermined width above the center position of the reading line and indicate the permissible limit of intrusion from above. On the other hand, even with contour tracking, the Y coordinate does not reach UILMT, or the tracking length is within CLMT,
And if the Y coordinate returns to MASKU (Fig. 3 (a)
Medium, P2), further contour tracking is continued. If the Y coordinate reaches LJLMT without returning to MASKU again (P3 in FIG. 3(a)), the intrusion from above is regarded as a separate intrusion block, and the intrusion portion is erased.

しかし、上記のP2からの輪郭追跡の続行でY座標がL
JLMTに達することなく、再びMASKUに戻った場
合(第3図(b)中、P  ’)、又は、追跡長が前記
CLMTを越えた場合、あるいはU I LMTに達し
た場合(第3図(b)中、P4)には、読取行の文字(
第3図(b)中、数字「2」)と侵入(第3図(b)中
、斜線)とが接触しているものとみなし、リジェクトフ
ラグをセットし動作を終了する。
However, by continuing the contour tracing from P2 above, the Y coordinate becomes L.
If it returns to MASKU again without reaching JLMT (P' in Figure 3 (b)), or if the tracking length exceeds the CLMT, or if it reaches U I LMT (Figure 3 ( In b), P4), the characters on the reading line (
It is assumed that the number "2" in FIG. 3(b) is in contact with the intrusion (hatched in FIG. 3(b)), a reject flag is set, and the operation is terminated.

さて、上記において、上方からの侵入ブロックであると
判断され、しかも侵入が軽度で、かつ読取行文字と分離
しでいる場合には(第3図(a)参照)、P −P2の
輪郭追跡点と、直線P1P2とで囲まれた部分を公知の
手法により消去する。しかして、上記により上下方向読
取視野検出部3ははみ出し検出、侵入検出又は消去を行
い、文字切出し部4は上下方向視野範囲内で文字切出し
処理を行うものである。
Now, in the above case, if it is determined that the block has invaded from above, and the intrusion is slight and is separated from the read line characters (see Figure 3 (a)), the outline of P-P2 can be traced. The portion surrounded by the point and the straight line P1P2 is erased using a known method. As described above, the vertical reading field of view detection section 3 performs protrusion detection, intrusion detection, or erasure, and the character cutting section 4 performs character cutting processing within the vertical field of view.

なお、本発明は上記実施例に限定8れるものではない。Note that the present invention is not limited to the above embodiments.

例えば上下一方向のみ読取視野を検出するようにしても
よい。また帳票の記載は横行文字配列に限られず、縦行
文字配列でちJ:い。
For example, the reading field of view may be detected only in one direction, up or down. Also, the entries on the form are not limited to the horizontal character arrangement, but can also be written in the vertical character arrangement.

〔発明の効果〕〔Effect of the invention〕

以上通り本発明によれば帳票から得られたパターンデー
タを走査して、各文字の一定方向についての読取視野を
検出し、その読取視野情報にもとづいて1文字単位の文
字パターンの切出しを行い、文字読取を行うようにした
ので、たとえ帳票に記載される行間ビットが狭く、隣接
行間で侵入やはみ出しが生じても文字の認識を行うこと
ができる。
As described above, according to the present invention, pattern data obtained from a form is scanned, the reading field of view of each character in a certain direction is detected, and character patterns are cut out for each character based on the reading field of view information. Since the characters are read, even if the line spacing bits written on the form are narrow and there is intrusion or protrusion between adjacent lines, the characters can be recognized.

その結果、帳票に記載できる単位面積当りの文字数を多
きくすることができOCRによる、文字読取の処理効率
を大幅に改善することができる。
As a result, the number of characters that can be written on a form per unit area can be increased, and the processing efficiency of character reading by OCR can be greatly improved.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例による光学的文字読取装置を
示すブロック図、第2図及び第3図は同光学的文字読取
装置の動作を説明するための説明図である。 1・・・光電変換部、2・・・パターンバッファ、3・
・・上下方向読取視野検出部、4・・・文字切り出し部
、5・・・認識処理部。
FIG. 1 is a block diagram showing an optical character reading device according to an embodiment of the present invention, and FIGS. 2 and 3 are explanatory diagrams for explaining the operation of the optical character reading device. 1... Photoelectric conversion unit, 2... Pattern buffer, 3...
. . . Vertical reading field of view detection unit, 4 . . . Character cutting unit, 5 . . . Recognition processing unit.

Claims (1)

【特許請求の範囲】[Claims] 1、帳票上の濃淡情報をパターンデータに変換する変換
部と、前記帳票上に記載された文字のうち少なくとも1
行分の前記パターンデータを格納するパターンバッファ
と、このパターンバッファに格納されたパターンデータ
を走査してそれぞれの文字の少なくとも一方向について
の読取視野を検出する読取視野検出部と、前記読取視野
検出部からの検出情報にもとづいて1文字単位の文字パ
ターンの切出しを行う文字切出し部と、前記切出された
文字パターンを認識する認識部とを備えたことを特徴と
する光学的文字読取装置。
1. A conversion unit that converts the shading information on the form into pattern data, and at least one of the characters written on the form.
a pattern buffer that stores the pattern data for a line; a reading field detection section that scans the pattern data stored in the pattern buffer to detect a reading field of view in at least one direction of each character; What is claimed is: 1. An optical character reading device comprising: a character cutting section that cuts out a character pattern in units of characters based on detection information from the section; and a recognition section that recognizes the cut out character pattern.
JP61043260A 1986-02-28 1986-02-28 Optical character reader Pending JPS62200490A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61043260A JPS62200490A (en) 1986-02-28 1986-02-28 Optical character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61043260A JPS62200490A (en) 1986-02-28 1986-02-28 Optical character reader

Publications (1)

Publication Number Publication Date
JPS62200490A true JPS62200490A (en) 1987-09-04

Family

ID=12658880

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61043260A Pending JPS62200490A (en) 1986-02-28 1986-02-28 Optical character reader

Country Status (1)

Country Link
JP (1) JPS62200490A (en)

Similar Documents

Publication Publication Date Title
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JPH02293989A (en) Character recognizing device
JPS62200490A (en) Optical character reader
JP2006277149A (en) Character and image segmentation device, character and image segmentation method, and program
JP3710164B2 (en) Image processing apparatus and method
JPH06139338A (en) Fingerprint pattern classifying device
JP2877380B2 (en) Optical character reader
JP2975720B2 (en) Optical character reader
JP3083609B2 (en) Information processing apparatus and character recognition apparatus using the same
JP2001014427A (en) Method and device for detecting reference mark and optical character reader
JPH0373916B2 (en)
JP2708604B2 (en) Character recognition method
JP2993533B2 (en) Information processing device and character recognition device
JP3127413B2 (en) Character recognition device
JP3084833B2 (en) Feature extraction device
JP2954218B2 (en) Image processing method and apparatus
JPH03126188A (en) Character recognizing device
JPH04311283A (en) Line direction discriminating device
JPH03219384A (en) Character recognizing device
JP4571447B2 (en) Character image extraction program, character image extraction method, and character image extraction apparatus
JP2004013188A (en) Business form reading device, business form reading method and program therefor
JPS61196382A (en) Character segmenting system
JPH08221518A (en) Optical character reader
JPH07129723A (en) Method and device for table recognition
JPH08339424A (en) Device and method for image processing