JPH07120391B2 - Character cutting device - Google Patents
Character cutting deviceInfo
- Publication number
- JPH07120391B2 JPH07120391B2 JP61135474A JP13547486A JPH07120391B2 JP H07120391 B2 JPH07120391 B2 JP H07120391B2 JP 61135474 A JP61135474 A JP 61135474A JP 13547486 A JP13547486 A JP 13547486A JP H07120391 B2 JPH07120391 B2 JP H07120391B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- contact
- contour
- character pattern
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字切出し装置に関し、特に帳票等から光学的
に読込まれた文字パターンを1文字毎に切出す装置(例
えば、光学文字読取り装置)において、複数の点により
接触した文字と文字とを分離し切出すのに好適な文字切
出し装置に関する。The present invention relates to a character cutting device, and more particularly to a device for cutting out a character pattern optically read from a form or the like for each character (for example, an optical character reading device). In the above, the present invention relates to a character cutout device suitable for separating and cutting out a character and a character touched by a plurality of points.
従来、光学文字読取り装置等において接触文字を分離し
切出す場合は、まず、入力された文字パターンが接触文
字か否かを判定し、接触文字であると判定した場合は、
接触文字パターンの分割を行う。なお、ここで、接触し
た文字か否かの判定は、入力された文字パターンのX方
向幅Wと、指定の文字記入枠幅あるいはピッチPとを比
較して行う。つまり、W≧KP(K:定数)ならば接触した
文字と判定する。一般に、K≒1.5の値が使われてい
る。Conventionally, when a contact character is separated and cut out in an optical character reader or the like, first, it is determined whether the input character pattern is a contact character, and if it is determined that it is a contact character,
The touch character pattern is divided. Here, the judgment as to whether or not it is a touched character is made by comparing the X-direction width W of the input character pattern with the specified character entry frame width or pitch P. That is, if W ≧ KP (K: constant), it is determined that the character is touched. Generally, a value of K≈1.5 is used.
また、接触文字数はN=W/Pにより算出し、小数点以下
を四捨五入等して求めている。このような方式では、記
入された文字が一定間隔で記入されていることが前提で
あり、指定の文字ピッチPに対し、記入された文字幅あ
るいはピッチが異なる接触文字の分離には限界がある。Also, the number of contact characters is calculated by N = W / P and rounded off to the right of the decimal point. In such a method, it is premised that the written characters are written at regular intervals, and there is a limit to the separation of contact characters having different written character widths or pitches with respect to a specified character pitch P. .
例えば、特開昭57-45676号公報に開示されている切出し
方式では、上下枠から各文字までの距離を算出して変化
点を検出し、これに基づいて接触文字を切断する方式を
提案しているが、文字が重なり合って接触した場合に
は、本来の接触点以外で切断されてしまうという問題が
あった。For example, in the clipping method disclosed in Japanese Patent Laid-Open No. 57-45676, a method is proposed in which the distance from the upper and lower frames to each character is calculated to detect a change point, and the contact character is cut based on this. However, there is a problem that when the characters overlap and come into contact with each other, the characters are cut at a point other than the original contact point.
また、特開昭57-5181号公報に開示されている切出し方
式では、多重化パターンを用いたアナログ的な信号レベ
ルの差により接触文字を切断する方式を提案している
が、接触部分の濃度が濃い場合には切断点の検出が難か
しいという問題があった。Further, in the cutout method disclosed in Japanese Patent Laid-Open No. 57-5181, a method of cutting a touch character by an analog signal level difference using a multiplexed pattern is proposed. There was a problem that it was difficult to detect the cut point when the density was high.
結局、上記従来技術は、いずれも、光学文字読取り装置
等において帳票等の文字を読取らせる場合、文字記入枠
を大きく、また、1文字単位に間隔を空けて設けなけれ
ばならず、帳票が大きくなり、用紙の使用効率が悪くな
るという問題を生ずるものであった。After all, in any of the above-mentioned conventional techniques, when the characters of a form or the like are read by an optical character reading device or the like, the character entry frame must be large, and a space must be provided for each character. However, the size of the sheet becomes large and the efficiency of use of the sheet deteriorates.
このような問題を解消するため、本出願人は、先に、接
触した文字の輪郭を、接触した文字の上側となる輪郭と
下側となる輪郭とに分割し、上側と下側の輪郭の距離の
変化を利用して、接触点を検出し接触文字を分離する文
字切出し方式を提案している(特開昭59-160274号公報
参照)。この切出し方式では、文字パターンの上側の輪
郭と下側の輪郭との距離をX方向各点について求め、こ
のようにして求めた輪郭差分の極小値から閾値を決定
し、上述の輪郭差分が閾値以下から閾値以上へと変化す
る点を接触点とするものである。In order to solve such a problem, the present applicant first divides the contour of the touched character into an upper contour and a lower contour of the touched character, and divides the upper contour and the lower contour. A character cutting method has been proposed in which a contact point is detected and a contact character is separated by utilizing a change in distance (see Japanese Patent Laid-Open No. 59-160274). In this clipping method, the distance between the upper contour and the lower contour of the character pattern is obtained for each point in the X direction, and a threshold value is determined from the minimum value of the contour difference thus obtained. A point that changes from below to a threshold value or more is a contact point.
本発明に係る文字切出し装置は、この切出し方式を更に
改良した方式に基づくものであり、文字と文字とが複数
の点で接触している場合にも対処できるようにしたもの
である。すなわち、本発明の目的は、従来技術における
前述の如き問題点を解消し、文字と文字とが複数の点で
接触している場合にも安定して接触点を検出し、1文字
単位に分離し切出すことが可能な文字切出し装置を提供
することにある。The character cutout device according to the present invention is based on a system obtained by further improving this cutout system, and can deal with a case where characters are in contact with each other at a plurality of points. That is, the object of the present invention is to solve the above-mentioned problems in the prior art, to stably detect a contact point even when characters are in contact with each other at a plurality of points, and separate the characters into character units. It is to provide a character cutting device capable of cutting out.
本発明の上述の目的は、帳票等から光学的に読込まれた
文字パターンを1文字毎に切出す文字切出し装置におい
て、文字パターンの幅(X方向幅)を検出して接触文字
であるか否かを判定する第1の検出手段と、内輪郭の存
在の有無とその個数を検出する第2の検出手段と、文字
と文字とが多点(複数の点)により接触した場合に発生
する複数の内輪郭と文字パターンの外輪郭とから、文字
パターンのY方向部分幅を検出する第3の検出手段、お
よび、前記第1の検出手段により接触文字と判定された
文字パターンについて、前記第2の検出手段により内輪
郭の存在を検出した場合に、該内輪郭の位置および個数
に基づいて、前記第3の検出手段により検出された文字
パターンのY方向部分幅の変化点を接触点として、1文
字単位に切出す文字切出し制御手段を有することを特徴
とする文字切出し装置によって達成される。The above object of the present invention is to detect whether or not a character pattern is a contact character by detecting the width (width in the X direction) of the character pattern in a character cutting device that cuts out a character pattern optically read from a form or the like for each character. A first detecting means for determining whether or not there is an inner contour, a second detecting means for detecting the presence or absence of the inner contour and the number of the inner contour, and a plurality of characters generated when the characters come into contact with each other at multiple points (a plurality of points). The third detecting means for detecting the Y-direction partial width of the character pattern from the inner contour of the character pattern and the outer contour of the character pattern, and the second pattern for the character pattern determined to be the contact character by the first detecting means. When the presence of the inner contour is detected by the detecting means, the change point of the Y-direction partial width of the character pattern detected by the third detecting means is set as the contact point based on the position and the number of the inner contour. Sentences cut out in single character units It is accomplished by character extraction apparatus characterized by having a cutout control unit.
本発明に係る文字切出し装置においては、文字パターン
のX方向幅が一定値以上である場合に接触文字であると
判定し、文字パターンの中心付近に内輪郭が存在するか
否かを調べ、内輪郭がn個存在すれば(n+1)点にお
いて接触した文字パターであると判定するとともに、こ
れらn個の内輪郭を文字と文字とが複数の点で接触して
いることにより発生したものと判定する。そして、文字
と文字とが複数の点で接触していると判定された文字パ
ターンの外輪郭を、この外輪郭の左端の点と右端の点に
おいて文字パターンの上側外輪郭と下側外輪郭とに分け
る。In the character cutting device according to the present invention, when the width of the character pattern in the X direction is equal to or larger than a certain value, it is determined that the character is a contact character, and it is checked whether an inner contour exists near the center of the character pattern. If there are n contours, it is determined that it is a character pattern that touches at (n + 1) points, and it is determined that these n inner contours have occurred due to the characters touching at multiple points. To do. Then, the outer contour of the character pattern determined to be in contact with the character at a plurality of points, the upper outer contour and the lower outer contour of the character pattern at the left end point and the right end point of this outer contour. Divide into
簡単のため、文字と文字とが2点で接触しているとした
場合、文字と文字とが2点で接触していることにより発
生したと判定された内輪郭についても、外輪郭と同様に
して、上側内輪郭と下側内輪郭とに分ける。次に、この
上側外輪郭と上側内輪郭との距離をX方向各点について
求め、上側輪郭差分とし、同様に、下側輪郭差分を求め
る。このような手順により求めた上側輪郭差分の変化点
を利用して、2つの接触点のうち上側の接触点を検出
し、下側輪郭差分の変化点を利用して下側の接触点を検
出する。そして、検出した接触点において、文字を1文
字毎に分離する。For the sake of simplification, when it is assumed that characters are in contact with each other at two points, an inner contour determined to be caused by contact between two characters is also similar to the outer contour. To divide into an upper inner contour and a lower inner contour. Next, the distance between the upper outer contour and the upper inner contour is calculated for each point in the X direction, and the upper contour difference is obtained. Similarly, the lower contour difference is obtained. Using the change point of the upper contour difference obtained by such a procedure, the upper contact point of the two contact points is detected, and the lower contact point is detected using the change point of the lower contour difference. To do. Then, the characters are separated for each character at the detected contact point.
以下、本発明の実施例を図面に基づいて詳細に説明す
る。Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
第1図は、本発明の一実施例に係る光学文字読取り装置
のブロック図である。図において、11は帳票等から光学
的に読取られた読取りパターンから1つの文字パターン
を抽出する文字パターン抽出部、12は抽出された文字パ
ターンが接触文字であるか否かを判定する接触文字判定
部、13は接触文字と判定された文字パターンを1文字単
位に分離し切出す接触文字分離部、14は未知の入力文字
パターンと標準文字パターンとの照合を行い、文字パタ
ーンの認識を行う認識部、15は標準文字パターンが格納
されている辞書部を示している。FIG. 1 is a block diagram of an optical character reader according to an embodiment of the present invention. In the figure, 11 is a character pattern extraction unit that extracts one character pattern from a read pattern optically read from a form, and 12 is a contact character determination that determines whether or not the extracted character pattern is a contact character. Part, 13 is a contact character separation part that separates and cuts out character patterns that have been determined to be contact characters on a character-by-character basis, and 14 is a recognition that recognizes character patterns by matching unknown input character patterns with standard character patterns Reference numeral 15 denotes a dictionary portion in which standard character patterns are stored.
上述の如く構成された本実施例に係る光学文字読取り装
置の動作の概要を、以下、説明する。The outline of the operation of the optical character reading apparatus according to this embodiment configured as described above will be described below.
帳票等から読取られた文字は文字パターン抽出部11に送
られる。文字パターン抽出部11では、1つの文字パター
ンを抽出して、接触文字判定部12へ送る。接触文字判定
部12は、文字パターン抽出部11から送られてきた文字パ
ターンが接触文字であるか否かを前述した従来の如き方
法で判定し、接触文字であると判定した文字パターン
は、接触文字分離部13へ送る。なお、接触文字でないと
判定した文字パターンは、認識部14へ送られ、辞書部15
と照合され認識される。接触文字分離部13では、接触文
字判定部12から送られた文字パターンを1文字単位に分
離し、認識部14へ送る。The characters read from the form or the like are sent to the character pattern extraction unit 11. The character pattern extraction unit 11 extracts one character pattern and sends it to the contact character determination unit 12. The contact character determination unit 12 determines whether the character pattern sent from the character pattern extraction unit 11 is a contact character by the conventional method described above, and the character pattern determined to be the contact character is a contact character. Send to the character separation unit 13. The character pattern that is determined not to be a contact character is sent to the recognition unit 14 and the dictionary unit 15
And is recognized as. The contact character separation unit 13 separates the character pattern sent from the contact character determination unit 12 into character units and sends it to the recognition unit 14.
次に、各部の動作の詳細を説明する。Next, the operation of each unit will be described in detail.
まず、文字パターン抽出部11の動作について説明する。
文字パターンの輪郭の抽出例を、第2図に示した。文字
パターン抽出部11は、第2図(A),(B)に示す如
く、読取りパターン20の輪郭を追跡し、外輪郭21と内輪
郭31を抽出する。なお、ここで、内輪郭の抽出は、例え
ば、特開昭61-59568号公報第3頁左上欄4〜7行目に記
載されている如き方法で行う。次に、第2図(C)に示
す如く、抽出した輪郭上の各点のX座標,Y座標を、第2
図(D)に示す如く、輪郭座標テーブル100に書込む。First, the operation of the character pattern extraction unit 11 will be described.
An example of extracting the outline of a character pattern is shown in FIG. As shown in FIGS. 2A and 2B, the character pattern extraction unit 11 traces the contour of the read pattern 20 and extracts the outer contour 21 and the inner contour 31. The inner contour is extracted by the method described in JP-A-61-59568, page 3, upper left column, lines 4 to 7, for example. Next, as shown in FIG. 2C, the X and Y coordinates of each point on the extracted contour are
The outline coordinate table 100 is written as shown in FIG.
次に、接触文字判定部12および接触文字分離部13の動作
について説明する。第3図は、接触文字判定部12の動作
を示すフローチャート、また、第4図は、接触文字分離
部13の動作を示すフローチャートである。また、ここで
の例としての、2点で接触している文字が分離されるま
での過程を、第5図〜第10図に示す。以下、第3図〜第
10図を用いて、接触文字判定部12および接触文字分離部
13の動作について説明する。Next, the operations of the contact character determination unit 12 and the contact character separation unit 13 will be described. FIG. 3 is a flow chart showing the operation of the touch character determining unit 12, and FIG. 4 is a flow chart showing the operation of the touch character separating unit 13. Also, as an example here, the process until the characters touching at two points are separated is shown in FIGS. Below, from FIG.
Using the figure 10, the contact character determination unit 12 and the contact character separation unit
The operation of 13 will be described.
まず、接触文字判定部12の動作について説明する。接触
文字判定部12は、第3図のステップ501の処理により、
第5図に示す如く、文字パターン抽出部11により抽出さ
れた文字パターンの外輪郭21のX座標最小値Xmin o22と
X座標最大値Xmax o23との差から、文字パターンのX方
向幅(以下、単に「幅」ともいう)を求める。そして、
前述の如く、この文字パターンの幅がある一定値以上の
場合に、当該文字パターンを接触文字と判定する。First, the operation of the contact character determination unit 12 will be described. The contact character determination unit 12 executes the processing of step 501 in FIG.
As shown in FIG. 5, from the difference between the X coordinate minimum value Xmin o22 and the X coordinate maximum value Xmax o23 of the outer contour 21 of the character pattern extracted by the character pattern extraction unit 11, the width in the X direction of the character pattern (hereinafter, Simply called "width"). And
As described above, when the width of this character pattern is equal to or larger than a certain value, the character pattern is determined as a contact character.
次に、第3図のステップ502の処理により、接触文字と
判定した文字パターンが、文字と文字とが1点において
接触しているパターンか、文字と文字とが複数の点にお
いて接触しているパターンかを、文字パターンの中心付
近に内輪郭が何個存在するかによって調べる。すなわ
ち、文字パターンの中心付近に内輪郭がn個存在する
と、(n+1)点において接触していると判定する。Next, in the process of step 502 in FIG. 3, the character pattern determined to be a contact character is a pattern in which characters are in contact with each other at one point, or characters are in contact with each other at multiple points. The pattern is checked by the number of inner contours near the center of the character pattern. That is, if there are n inner contours near the center of the character pattern, it is determined that they are in contact at point (n + 1).
ここでは、2点において接触していると判定される。な
お、この、文字パターンの中心付近に内輪郭が存在する
という判定は、例えば、内輪郭31のX座標最小値Xmin i
32とX座標最大値Xmax i33を求め、前述の文字パターン
の外輪郭21のX座標最小値Xmin o22とX座標最大値Xmax
o23との関係が次式を満足する場合、つまり、文字パタ
ーンのX方向の中心に内輪郭がかかっている場合とす
る。Here, it is determined that the two points are in contact with each other. It should be noted that this determination that the inner contour exists near the center of the character pattern is made by, for example, the minimum X coordinate value Xmin i of the inner contour 31.
32 and the maximum X coordinate value Xmax i33 are obtained, and the minimum X coordinate value Xmin o22 and the maximum X coordinate value Xmax of the outer contour 21 of the character pattern are obtained.
It is assumed that the relationship with o23 satisfies the following expression, that is, the inner contour is applied to the center of the character pattern in the X direction.
Xmin i≦(Xmin o+Xmax o)/≦Xmax i……(1) また、3文字以上が接触している場合には、 Xmin i≦(Xmin o+α)/≦Xmax i ……(2) とすることができる。ここで、αは予め指定された書式
情報による1文字の記入枠幅とすることができる。ま
た、内輪郭の位置の判定にY方向の条件を付加すること
も可能である。Xmin i ≤ (Xmin o + Xmax o) / ≤ Xmax i ...... (1) If three or more characters are in contact, Xmin i ≤ (Xmin o + α) / ≤ Xmax i ...... (2) You can Here, α can be a one-character entry frame width based on predesignated format information. It is also possible to add a condition in the Y direction to the determination of the position of the inner contour.
次に、接触文字分離部13の動作について説明する。接触
文字分離部13は、第4図のステップ601の処理により、
接触文字判定部12において2点において接触していると
判定された文字パターンの外輪郭21を、第6図(A),
(B)に示す如く、X座標最小値Xmin o22とX座標最大
値Xmax o23により、上側外輪郭41と下側外輪郭42とに分
ける。Next, the operation of the contact character separation unit 13 will be described. The contact character separation unit 13 executes the processing of step 601 in FIG.
The outer contour 21 of the character pattern determined to be in contact at two points by the contact character determination unit 12 is shown in FIG.
As shown in (B), the upper outer contour 41 and the lower outer contour 42 are divided according to the X coordinate minimum value Xmin o22 and the X coordinate maximum value Xmax o23.
次に、文字と文字とが複数の点において接触したことに
より発生した内輪郭、つまり、上述の式(1)あるいは
(2)を満足する内輪郭31も、外輪郭21と同様に上側内
輪郭51と下側内輪郭52とに分ける。Next, as with the outer contour 21, the inner contour 31 generated by the contact between the characters at a plurality of points, that is, the inner contour 31 satisfying the above-described formula (1) or (2), also has the upper inner contour. 51 and the lower inner contour 52.
次に、第4図のステップ602の処理により、第7図
(A)に示す如く、上側外輪郭41と上側内輪郭51とのY
方向距離(Y方向部分幅)を、上側内輪郭のX座標最小
値Xmin i32からX座標最大値Xmax i33まで求める。この
ようにして求めた上側輪郭差分61を、第7図(C)に示
す。同様にして、下側輪郭差分62を求める(第7図
(B),(D)参照)。Next, by the processing of step 602 in FIG. 4, as shown in FIG. 7 (A), the Y of the upper outer contour 41 and the upper inner contour 51 is compared.
The directional distance (Y-direction partial width) is calculated from the X coordinate minimum value Xmin i32 to the X coordinate maximum value Xmax i33 of the upper inner contour. The upper contour difference 61 thus obtained is shown in FIG. 7 (C). Similarly, the lower-side contour difference 62 is obtained (see FIGS. 7B and 7D).
次に、第4図のステップ603の処理により、第8図
(A)に示す如く、上側輪郭差分61の最小値を検出し、
上側閾値TU71を下記の式により決定する。Next, as shown in FIG. 8 (A), the minimum value of the upper contour difference 61 is detected by the processing of step 603 in FIG.
The upper threshold T U 71 is determined by the following formula.
TU=上側輪郭差分61の最小値+β ……(3) ここで、βはある一定値とする。T U = minimum value of upper contour difference 61 + β (3) Here, β is a constant value.
次に、第4図のステップ603の処理により、上述の上側
輪郭差分61が、上述の上側閾値TU71以下となる点73〜74
(第8図(A)参照)を検出する。そして、この点73〜
74の中で、文字パターンの中心72に最も近い点74を、上
側接触点として検出する(第9図(A)参照)。以下、
下側の接触点についても同様に、下側外輪郭42と下側内
輪郭52とを用いて、下側接触点84を検出する(第8図
(A),第9図(A)参照)。Next, by the processing of step 603 in FIG. 4, points 73 to 74 at which the above-described upper contour difference 61 becomes equal to or less than the above-mentioned upper threshold T U 71.
(See FIG. 8A) is detected. And this point 73 ~
Among the 74, the point 74 closest to the center 72 of the character pattern is detected as the upper contact point (see FIG. 9A). Less than,
Similarly, for the lower contact point, the lower contact point 84 is detected using the lower outer contour 42 and the lower inner contour 52 (see FIGS. 8 (A) and 9 (A)). .
最後に、上側接触点74と下側接触点84において、文字パ
ターンを2つの文字に分離する。第10図(A),(B)
に示す、分離した1文字パターン91,92は、認識部14へ
送られる。Finally, at the upper contact point 74 and the lower contact point 84, the character pattern is separated into two characters. Figure 10 (A), (B)
The separated one-character patterns 91 and 92 shown in FIG.
上記実施例によれば、文字と文字とが2点において接触
している場合にも、安定に、1文字単位に分離し切出す
ことができる。According to the above-described embodiment, even when characters are in contact with each other at two points, it is possible to stably separate and cut out in units of one character.
なお、上記実施例においては、文字と文字とが2点にお
いて接触している場合の分離動作を説明したが、文字と
文字とが1点のみにおいて接触している場合の分離動作
は、前述の特開昭59-160274号公報記載の方式によるこ
とも可能であることは言うまでもない。In the above embodiment, the separating operation when the characters are in contact with each other at two points has been described. However, the separating operation when the characters are in contact with each other at only one point is as described above. It goes without saying that the method described in JP-A-59-160274 can also be used.
次に、本発明の他の実施例を説明する。本実施例は、文
字と文字とが3点以上において接触している場合の分離
動作に関するものである。Next, another embodiment of the present invention will be described. The present embodiment relates to a separating operation when characters are in contact with each other at three or more points.
第11図は、「0」と「3」とが、内輪郭の個数n=2、
つまり(n+1)=3点で接触しているパターンの例を
示すものであり、第12図,第13図は、このような多点接
触文字の分離を説明するための図である。In FIG. 11, “0” and “3” indicate that the number of inner contours is n = 2,
That is, an example of a pattern in which (n + 1) = 3 points of contact is shown, and FIGS. 12 and 13 are diagrams for explaining such separation of multi-point contact characters.
まず、接触文字判定部12の動作について説明する。接触
文字判定部12は、前述の式(1)あるいは式(2)を満
足する内輪郭(230,240)がn個あるため、文字と文字
とが(n+1)点により接触した文字パターンであると
判定する。次に、上述の内輪郭(230,240)にY方向の
位置について上から順に、C1(230),C2(240),…,Cn
と符号を付ける。このとき、文字パターンの外輪郭210
は、C0とする。First, the operation of the contact character determination unit 12 will be described. Since there are n inner contours (230, 240) satisfying the above-described formula (1) or formula (2), the contact character determination unit 12 determines that the character pattern is a character pattern in which characters contact each other at (n + 1) points. To do. Next, C 1 (230), C 2 (240), ..., Cn in order from the top with respect to the position in the Y direction on the above-mentioned inner contour (230, 240).
And sign. At this time, the outer contour of the character pattern 210
Is C 0 .
次に、接触文字分離部13の動作について説明する。接触
文字分離部13は、接触文字パターンの外輪郭C0(210)
と接触により発生したn個の内輪郭C1(230),C2(24
0),…,Cnを、前記実施例と同様に、上側輪郭C0U(21
1),C1U(231),C2U(241),…CnUと、下側輪郭C0L(2
12),C1L(232),C2L(242),…,CnLとに、第12図に示
す如く分類し(第12図参照)、輪郭差分を求め、閾値を
設定して接触点を検出する。Next, the operation of the contact character separation unit 13 will be described. The touch character separation unit 13 determines the outer contour C 0 (210) of the touch character pattern.
N inner contours C 1 (230), C 2 (24
0), ..., Cn are set to the upper contour C 0U (21
1), C 1U (231), C 2U (241), ... Cn U and lower contour C 0L (2
12), C 1L (232), C 2L (242), ..., Cn L , as shown in FIG. 12 (see FIG. 12), the contour difference is calculated, the threshold value is set, and the contact point is set. To detect.
このとき、輪郭差分を求める輪郭の組み合せを、第13図
(A),(B),(C)に示す如く、C0U(211)−C1U
(231),C1L(231)−C2U(241),…,CnL−C0L(212)
とすることにより、(n+1)個の接触点を検出可能と
なる。ここで、輪郭差分を求めるX方向範囲は、上述の
輪郭の組み合せにおいて、両輪郭が存在する範囲とす
る。At this time, as shown in FIGS. 13A, 13B, and 13C, the combination of contours for obtaining the contour difference is C 0U (211) −C 1U
(231), C 1L (231) -C 2U (241), ..., Cn L -C 0L (212)
As a result, (n + 1) contact points can be detected. Here, the X-direction range for obtaining the contour difference is a range in which both contours exist in the combination of the contours described above.
本実施例によれば、文字と文字とが3点以上において接
触している場合にも、1文字単位に分離し、切出すこと
が可能である。According to the present embodiment, even when characters are in contact with each other at three or more points, it is possible to separate and cut out in units of one character.
なお、上記実施例は本発明の一例を示したものであり、
本発明はこれに限定されるべきものではないことは言う
までもないことである。In addition, the above embodiment shows an example of the present invention,
It goes without saying that the present invention should not be limited to this.
例えば、前述の実施例において、輪郭差分に変化が現わ
れない場合にも接触点を検出可能とするため、前記内輪
郭のX座標の最小点,最大点におけるY座標を無限大と
することにより、輪郭差分に強制的に変化を出すことも
できる。これは、前記内輪郭のX座標の最小点,最大点
が接触点である場合が多いことに由来するもので、この
ような処理により、輪郭差分に変化が現われない場合に
も、接触点を検出可能になる。For example, in the above-described embodiment, the contact point can be detected even when the contour difference does not change, so that the Y coordinate at the minimum point and the maximum point of the X coordinate of the inner contour is set to infinity. It is also possible to force a change in the contour difference. This is because the minimum point and the maximum point of the X-coordinate of the inner contour are often contact points, and even if the contour difference does not change by such processing, the contact point is determined. It becomes detectable.
以上、詳細に説明した如く、本発明によれば、文字と文
字とが複数の点で接触している場合にも安定して接触点
を検出し、1文字単位に分離し切出すことが可能な文字
切出し装置を実現できるという顕著な効果を奏するもの
である。As described above in detail, according to the present invention, even when characters are in contact with each other at a plurality of points, the contact points can be stably detected, and the characters can be separated into individual characters and cut out. This has the remarkable effect of realizing a simple character cutting device.
第1図は本発明の一実施例に係る光学文字読取り装置の
ブロック図、第2図は文字パターンの輪郭の抽出例を示
す図、第3図は接触文字判定部の動作を説明するフロー
チャート、第4図は接触文字分離部の動作を説明するフ
ローチャート、第5図〜第10図は2点接触文字が分離さ
れるまでの過程を説明するための図、第11図〜第13図は
多点(3点)接触文字の場合の説明図である。 11:文字パターン抽出部、12:接触文字判定部、13:接触
文字分離部、14:認識部、15:辞書部。FIG. 1 is a block diagram of an optical character reader according to an embodiment of the present invention, FIG. 2 is a diagram showing an example of extracting the outline of a character pattern, and FIG. 3 is a flow chart for explaining the operation of a contact character determination unit. FIG. 4 is a flow chart for explaining the operation of the contact character separation unit, FIGS. 5 to 10 are diagrams for explaining the process until the two-point contact character is separated, and FIGS. 11 to 13 are many. It is explanatory drawing in the case of a point (3 points) contact character. 11: character pattern extraction unit, 12: contact character determination unit, 13: contact character separation unit, 14: recognition unit, 15: dictionary unit.
───────────────────────────────────────────────────── フロントページの続き (72)発明者 花野井 歳弘 神奈川県小田原市国府津2880番地 株式会 社日立製作所小田原工場内 (56)参考文献 特開 昭57−45676(JP,A) 特開 昭57−5181(JP,A) 特開 昭59−160274(JP,A) 特開 昭61−59568(JP,A) ─────────────────────────────────────────────────── ─── Continuation of the front page (72) Inventor Toshihiro Hananoi 2880 Kokufu, Odawara City, Kanagawa Prefecture Odawara Plant, Hitachi, Ltd. (56) References JP 57-45676 (JP, A) JP 57 -5181 (JP, A) JP-A-59-160274 (JP, A) JP-A-61-59568 (JP, A)
Claims (1)
ンを1文字毎に切出す文字切出し装置において、文字パ
ターンの幅(X方向幅)を検出して接触文字であるか否
かを判定する第1の検出手段と、内輪郭の存在の有無と
その個数を検出する第2の検出手段と、文字と文字とが
多点(複数の点)により接触した場合に発生する複数の
内輪郭と文字パターンの外輪郭とから、文字パターンの
Y方向部分幅を検出する第3の検出手段、および、前記
第1の検出手段により接触文字と判定された文字パター
ンについて、前記第2の検出手段により内輪郭の存在を
検出した場合に、該内輪郭の位置および個数に基づい
て、前記第3の検出手段により検出された文字パターン
のY方向部分幅の変化点を接触点として、1文字単位に
切出す文字切出し制御手段を有することを特徴とする文
字切出し装置。1. A character slicing device for slicing out, for each character, a character pattern optically read from a form or the like, and detecting the width (width in the X direction) of the character pattern to determine whether or not it is a contact character. First detecting means for detecting the presence or absence of inner contours and second detecting means for detecting the number of inner contours, and a plurality of inner contours generated when characters are in contact with each other at multiple points (a plurality of points) And a contour of the character pattern, the third detecting means for detecting the Y-direction partial width of the character pattern, and the second detecting means for the character pattern determined to be the contact character by the first detecting means. When the presence of the inner contour is detected by, the change point of the Y-direction partial width of the character pattern detected by the third detecting means is used as the contact point based on the position and the number of the inner contour, and the character unit is used. Character cut-out system Character extraction apparatus characterized by comprising means.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61135474A JPH07120391B2 (en) | 1986-06-11 | 1986-06-11 | Character cutting device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61135474A JPH07120391B2 (en) | 1986-06-11 | 1986-06-11 | Character cutting device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62293387A JPS62293387A (en) | 1987-12-19 |
JPH07120391B2 true JPH07120391B2 (en) | 1995-12-20 |
Family
ID=15152559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61135474A Expired - Lifetime JPH07120391B2 (en) | 1986-06-11 | 1986-06-11 | Character cutting device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07120391B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63298493A (en) * | 1987-05-28 | 1988-12-06 | Matsushita Electric Ind Co Ltd | Optical character reader |
JPS6436385A (en) * | 1987-07-31 | 1989-02-07 | Matsushita Electric Ind Co Ltd | Character recognition device |
-
1986
- 1986-06-11 JP JP61135474A patent/JPH07120391B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS62293387A (en) | 1987-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH07200155A (en) | Detection of nonobjective result of pen-type computer system | |
JPH07120391B2 (en) | Character cutting device | |
EP0206829A2 (en) | Character input apparatus | |
JPH05225399A (en) | Document processor | |
JPH0520794B2 (en) | ||
JP3457094B2 (en) | Character recognition device and character recognition method | |
JP2569103B2 (en) | Character detection method | |
JPH04352295A (en) | System and device for identifing character string direction | |
JP3167799B2 (en) | Online handwritten character recognition device | |
JP4136257B2 (en) | Character recognition device, character recognition method, and storage medium | |
JP3457376B2 (en) | Character correction method in optical reader | |
JP3075808B2 (en) | Document processing device | |
JPH0522947B2 (en) | ||
JP2929919B2 (en) | Optical character extraction device | |
JP2877380B2 (en) | Optical character reader | |
JPS59160274A (en) | Character cutting system | |
JP2570415B2 (en) | Character extraction method | |
JP3039427B2 (en) | Character extraction method and method | |
JP2865286B2 (en) | Online handwritten character recognition device | |
JPH10162104A (en) | Character recognition device | |
KR100361176B1 (en) | Method for recognizing written multi-character | |
JPH0578873B2 (en) | ||
JPS62260287A (en) | On-line recognition system for handwritten character | |
JPH01265378A (en) | European character recognizing system | |
JPH0281283A (en) | Character recognizing method |