JPH0368431B2 - - Google Patents

Info

Publication number
JPH0368431B2
JPH0368431B2 JP58240335A JP24033583A JPH0368431B2 JP H0368431 B2 JPH0368431 B2 JP H0368431B2 JP 58240335 A JP58240335 A JP 58240335A JP 24033583 A JP24033583 A JP 24033583A JP H0368431 B2 JPH0368431 B2 JP H0368431B2
Authority
JP
Japan
Prior art keywords
separation
character
separation candidate
section
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP58240335A
Other languages
Japanese (ja)
Other versions
JPS60132281A (en
Inventor
Yoshitake Tsuji
Hiroshi Asai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58240335A priority Critical patent/JPS60132281A/en
Priority to US06/683,576 priority patent/US4635290A/en
Priority to DE8484115985T priority patent/DE3486104T2/en
Priority to DE3486241T priority patent/DE3486241T2/en
Priority to EP91100048A priority patent/EP0428499B1/en
Priority to EP84115985A priority patent/EP0146147B1/en
Publication of JPS60132281A publication Critical patent/JPS60132281A/en
Publication of JPH0368431B2 publication Critical patent/JPH0368431B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 本発明は、紙面上に記載された文字列イメージ
を個々の文字に分離する文字分離装置に関するも
のである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a character separation device that separates a character string image written on paper into individual characters.

各種印刷文字群を光学的に読み取る装置(以
下、OCRと呼ぶ)において、一連の文字を認識
する場合、各文字を1字毎に分離して文字認識部
に送出してやる必要がある。ところで、郵便物や
大量の文書をOCRにより読み取る場合、印刷物
の品質や印字スタイルが多種存在しており、それ
等を読取対象として取り扱う必要が生じる。この
ような場合、紙面上の文字列イメージに、文字間
に接触が生じたり、1文字が2文字以上に分離す
る状態が生じ、これらを効率良く取り扱うことが
できる文字分離手法が要求される。従来、このよ
うな読取り対象の制約条件が緩和された人力デー
タも含まれる場合、個々のケースに有効と思われ
る機能を追加した文字分離手法が適用されてい
る。しかし、このように個々のケースに対応した
機能を適宜追加することは文字分離の精度を低下
させたり、あるいは、個々の対象物毎に異なつた
機能を持つ文字分離装置を開発する必要性が生じ
る。
When recognizing a series of characters in a device that optically reads various groups of printed characters (hereinafter referred to as OCR), it is necessary to separate each character one by one and send it to a character recognition unit. By the way, when reading mail or a large amount of documents using OCR, there are many different qualities and printing styles of printed matter, and it is necessary to handle these as objects to be read. In such a case, characters may come into contact with each other in the character string image on the paper, or one character may be separated into two or more characters, and a character separation method that can efficiently handle these situations is required. Conventionally, when human data with relaxed constraints on the reading target is included, character separation methods have been applied that add functions that are considered effective in each case. However, adding functions corresponding to individual cases as appropriate may reduce the accuracy of character separation, or it may become necessary to develop character separation devices with different functions for each individual object. .

そこで、本発明の目的は、上記従来の問題点を
解決するために文字ピツチ及び空白情報を用い
て、順次、分離候補区間を設定し、各分離候補区
間の間で各分離候補位置間の距離の分散や平均距
離と文字ピツチとのずれ量に関する分散を最小と
するような文字分離候補位置の系列を動的計画法
を用いて算出することによつて、文字間に接触す
るイメージが生じた場合や1文字が2文字以上に
分離する状態が生じても特殊な機能を追加するこ
となく容易にしかも精度良く文字分離候補位置を
決定することができる文字分離装置を提供するこ
とにある。
SUMMARY OF THE INVENTION In order to solve the above-mentioned conventional problems, it is an object of the present invention to sequentially set separation candidate sections using character pitch and blank information, and to determine the distance between each separation candidate position between each separation candidate section. By using dynamic programming to calculate a series of character separation candidate positions that minimize the variance of the variance and the variance of the deviation between the average distance and character pitch, an image of contact between characters was created. To provide a character separation device capable of easily and accurately determining a character separation candidate position without adding any special function even when a character is separated into two or more characters.

以下、本発明について図面を用いて詳細に説明
する。
Hereinafter, the present invention will be explained in detail using the drawings.

第1図a,b,cは、部分文字列イメージの一
例を用いて、本発明における文字分離の分離候補
区間設定方法の一例を説明するための図である。
なお、印刷物の品質や印字スタイルが多種存在す
る読取対象における文字分離を行う場合、最初に
文字ピツチを検出する必要がある。文字ピツチ検
出装置としては、例えば、同一出願人による特願
昭58−160763号明細書「文字ピツチ検出装置」
(以下引用例1とする)で示されるような文字ピ
ツチ検出装置があり、このような装置を用いて一
連の文字行イメージから文字ピツチを検出するこ
とができる。
FIGS. 1a, b, and c are diagrams for explaining an example of a separation candidate section setting method for character separation in the present invention using an example of a partial character string image.
Note that when performing character separation in a reading target where there are various print qualities and printing styles, it is necessary to first detect the character pitch. As a character pitch detection device, for example, Japanese Patent Application No. 160763/1983 filed by the same applicant, “Character Pitch Detection Device”
There is a character pitch detection device as shown in (hereinafter referred to as Cited Example 1), and by using such a device, character pitch can be detected from a series of character line images.

第1図aは、文字間の接触イメージや1文字が
2文字にスプリツトする場合を含む文字列イメー
ジを斜線部で示し、図中Pは文字ピツチを示して
いる。第1図aの部分文字列イメージを垂直投影
すると、第1図bで示す投影分布が得られ、黒地
領域(図中、斜線部)、白地領域に分離すること
ができる。文字ピツチPは、第1図aで示した文
字列イメージから例えば前記の引用例1で示され
ているような「文字ピツチ検出装置」を用いても
良いし、予め既知であれば、その既定値を用いて
も良い。ここで、第1図aで示した接触文字
(amu)及びスプリツトした文字hを正しく1文
字単位に分離するためには、その文字の分離開始
位置を正しく予測することが必要である。例え
ば、図において、接触文字イメージ“a”と
“m”とでは、aの方がわずかに小さいため、そ
の切り出し開始位置は、接触文字イメージ
(amu)の始端より少し左の方になる。このよう
な接触文字の位置ずれの補正は、従来、例えば文
字イメージを参照することによつて行われてい
た。そのため、文字イメージの接触の度合等によ
り、イメージを参照することによつて処理時間を
要するにもかかわらず、正しく分離位置を決定す
ることができない場合が生じる。そこで、本発明
における文字分離位置の決定方法はまず、第1図
aで示したような文字行イメージにおいて、第1
図bで示したような投影分布等から抽出された白
地領域(以下、空白と呼ぶ)及び黒地領域(以
下、文字塊と呼ぶ)の位置及び大きさを抽出す
る。例えば、第1図bに示すような文字塊幅Vi
(i=1,…4)及び空白サイズWi(i=1,…
4)、更には、それらの位置情報が公知の技術に
よつて、得られる。次に、前もつて得られた文字
ピツチP及び閾値T1、T2を用いて、文字分離位
置を設定することが可能な区間(以下、許容区間
と呼ぶ)を、例えば、次に示す条件(1)、(2)を用い
て設定することができる。
In FIG. 1a, a character string image including a contact image between characters and a case where one character is split into two characters is shown by diagonal lines, and P in the figure shows a character pitch. When the partial character string image in FIG. 1a is vertically projected, the projection distribution shown in FIG. 1b is obtained, and it can be separated into a black background area (shaded area in the figure) and a white background area. The character pitch P may be determined from the character string image shown in FIG. A value may also be used. In order to correctly separate the touching characters (amu) and the split character h shown in FIG. 1A into individual characters, it is necessary to accurately predict the separation start position of the characters. For example, in the figure, between the touching character images "a" and "m", since a is slightly smaller, its extraction start position is slightly to the left of the starting edge of the touching character image (amu). Conventionally, correction of such positional deviation of touching characters has been performed by, for example, referring to character images. Therefore, depending on the degree of contact between the character images, it may not be possible to correctly determine the separation position, even though it takes processing time to refer to the images. Therefore, in the method of determining character separation positions in the present invention, first, in a character line image as shown in FIG.
The positions and sizes of white background areas (hereinafter referred to as blanks) and black background areas (hereinafter referred to as character blocks) extracted from the projection distribution etc. as shown in FIG. 2 are extracted. For example, the character block width Vi as shown in Figure 1b
(i=1,...4) and blank size Wi(i=1,...
4) Furthermore, their location information is obtained using known techniques. Next, using the previously obtained character pitch P and threshold values T 1 and T 2 , an interval (hereinafter referred to as an allowable interval) in which a character separation position can be set is determined, for example, under the following conditions. It can be set using (1) and (2).

条件(1) 空白となる区間は許容区間とする。Condition (1) Blank sections are allowed sections.

条件(2) 任意の文字塊幅Viにおいて、Vi>P+
T1を満たす黒地領域のうち、文字塊幅Viの両
端からT2までの黒地領域を除いた区間は、許
容区間とする。
Condition (2) For any character block width Vi, Vi>P+
Among the black areas that satisfy T 1 , the section excluding the black area from both ends of the character block width Vi to T 2 is an allowable section.

上述した条件(1)及び条件(2)を満足する許容区間
は例えば、第1図aの文字列イメージに対して、
第1図cの図中A1,A2,A3,A4,A5で示す区間
として得られる。尚、上述した閾値T1及びT2は、
文字ピツチPの関数として、与えても良い。ま
た、閾値T1は前記引用例1に示される文字ピツ
チPを推定した時の推定誤差等に基づいて設定し
ても良い。次に、本発明における文字分離位置の
決定は、前述した許容区間内で、文字ピツチP及
び閾値T3を用いて、順次第1図cで示すような
分離候補区間k(但し、k≧0)を設定し、各分
離候補区間k内の分離候補位置x(k,ik)(但
し、ik≧1であり、分離候補区間k内の相対番号
を表わす)に対して、それぞれの分離候補位置間
の距離d(k,k+1;ik,ik+1)を算出し、各分
離候補区間kにおいて算出される距離d(k,k
+1;ik,ik+1)の分散σ2 d及び平均値μdと文字ピ
ツチPとのずれの2乗誤差(μd−P)2からなる評
価尺度Uを計算し、その評価尺度を最小とするよ
うな分離候補位置x(k,ik)(k≧0)の系列を
求めることによつて行われる。そこで、上述した
分離候補区間kの設定方法の一例について、第1
図cを用いて説明する。
For example, the permissible interval that satisfies the above-mentioned conditions (1) and (2) is as follows for the character string image in Figure 1a:
These are obtained as sections A 1 , A 2 , A 3 , A 4 , and A 5 in the diagram of FIG. 1c. In addition, the threshold values T 1 and T 2 mentioned above are
It may be given as a function of character pitch P. Further, the threshold value T 1 may be set based on the estimation error when estimating the character pitch P shown in Cited Example 1 above. Next, character separation positions in the present invention are determined within the above-mentioned allowable interval using the character pitch P and the threshold value T 3 in order of separation candidate interval k (however, k≧0 ) , and each separation is The distance d (k, k+1; i k , i k+1 ) between candidate positions is calculated, and the distance d (k, k
+1; i k , i k+1 ) and the squared error (μ d - P) of the deviation between the average value μ d and the character pitch P. This is done by finding a sequence of separation candidate positions x(k, i k ) (k≧0) that minimizes Therefore, regarding an example of the method of setting the separation candidate section k described above, the first
This will be explained using Figure c.

第1図cにおける黒点は、分離候補区間k(但
し、k=0,1,2,3,4)内の各分離候補位
置x(k,ik)を示しており、上述した許容区間
内で、下記に示す式(3)の関係を満たす位置とし
て、順次設定される。
The black dots in FIG . The positions are sequentially set as positions that satisfy the relationship of equation (3) shown below.

|d(k,k+1:ik,ik+1)−P|≦T3 ……(1) 式(1)において、距離d(k,k+1;ik,ik+1
は、分離候補区間k+1の分離候補位置x(k+
1,ik+1)と分離候補区間kの分離候補位置x
(k,ik)との距離x(k+1,ik+1)−x(k+1,
ik)を示している。例えば、第1図cにおける分
離候補位置x(1,1)と分離候補位置x(2,
2)との距離d(1,2;1,2)において、|P
−d(1,2;1,2)|≦P+T3を満足してい
る。また、分離候補区間0の分離候補位置x(0,
1)から式(1)で示した関係式を満足する位置は、
第1図cの白点で示すような6個の位置がある
が、上述した許容区間内に属する白点は、第1図
cの黒点で示すように、2個となり、分離候補区
間1の分離候補位置はx(1,1),x(1,2)
の2つの位置として求まる。尚、上述した閾値
T3は前述したような閾値T1のように文字ピツチ
Pの関数として与えることができる。次に、評価
尺度Uを用いて、最適な分離候補位置を求めるに
あたり、終端状態となる分離候補区間は、例え
ば、文字行の終端となる空白内のみ設定できると
しても良いし、前述した空白サイズWiが文字ピ
ツチPに対して、Wi>T4・P(但し、T4は閾値
である)を満たす許容区間内に設定できるとして
も良い。後者の方法を採用すると、例えば、第1
図cにおける領域Eが終端状態となる許容区間と
して検出される。更に、評価尺度Uを計算するに
あたり、次に設定すべき分離候補区画(k+1)
を分離候補区間kより前述した式(1)を用いて設定
する場合、式(1)を満たす分離候補区間(k+1)
がすべて許容区間でなければ、分離候補区間kを
終端状態となる分離候補区間kとすることができ
る。一方、評価尺度Uを用いて最適な分離候補位
置を求めるための始端状態となる分離候補区間
は、すでに検出された終端状態となる分離候補区
間の位置に基づいて設定することができる。
|d(k, k+1: i k , i k+1 )−P |≦T 3 ...(1) In equation (1), the distance d(k, k+1; i k , i k+1 )
is the separation candidate position x(k+
1, i k+1 ) and separation candidate position x of separation candidate section k
Distance x(k+ 1 ,i k+1 )−x(k+1,
i k ). For example, the separation candidate position x (1, 1) and the separation candidate position x (2,
2), at the distance d(1,2;1,2), |P
-d(1,2;1,2)|≦P+T 3 is satisfied. Also, separation candidate position x(0,
From 1) to the position that satisfies the relational expression shown in equation (1),
There are six positions as shown by the white dots in Figure 1c, but there are two white dots that belong to the above-mentioned tolerance interval as shown by the black dots in Figure 1c. Separation candidate positions are x (1, 1), x (1, 2)
It can be found as two positions. In addition, the threshold value mentioned above
T 3 can be given as a function of the character pitch P, like the threshold T 1 described above. Next, when determining the optimal separation candidate position using the evaluation scale U, the separation candidate section that becomes the terminal state may be set only within the blank space that is the end of the character line, or the blank size described above may be set. It is also possible that W i can be set within a permissible interval that satisfies Wi>T 4 ·P (where T 4 is a threshold) with respect to character pitch P. If the latter method is adopted, for example, the first
Region E in FIG. c is detected as a permissible section in which the terminal state occurs. Furthermore, in calculating the evaluation scale U, the separation candidate section (k+1) to be set next is
is set using the above-mentioned formula (1) from the separation candidate interval k, the separation candidate interval (k+1) that satisfies formula (1)
If all of the separation candidate sections k are not permissible sections, the separation candidate section k can be set as the separation candidate section k that becomes the terminal state. On the other hand, the separation candidate section that becomes the starting end state for determining the optimal separation candidate position using the evaluation scale U can be set based on the position of the separation candidate section that becomes the end state that has already been detected.

尚、本発明の文字分離における分離候補区間設
定方法は、上述した条件以外でも、文字ピツチ
P、文字塊幅Vi、空白サイズWiに基づいて設定
できることは言うまでもない。
It goes without saying that the separation candidate section setting method for character separation of the present invention can be set based on the character pitch P, the character block width Vi, and the blank size Wi in addition to the conditions described above.

第2図は本発明における最適な文字分離位置を
抽出するための原理を説明するための図である。
図において、黒点で示した位置は、第1図cで示
した分離候補区間k(k=0,…4)の各分離候
補位置x(k,ik)の値を示している。また、文
字ピツチPは20である場合を示している。更に、
本発明の原理を簡単に説明するために、分離対象
となる文字列イメージは、第1図cにおける分離
候補区間0から分離候補区間4までとする。ま
ず、記号の定義を行う。記号μd(r,n;ir,io
(但し、1≦r<n)は、分離候補区間rの分離
候補位置x(r,ir)から分離候補区間nの分離
候補位置x(n,io)に到るまでの各分離候補区
間で任意に選択されたn−r+1個の分離候補位
置x(r,ir),x(r+1,ir+1),…,x(n,io

から得られるn−r個の距離d(r,r+1;ir
ir+1)d(r+1,r+2;ir+1,ir+2)…,d(n
−1,n;io-1,io)の平均値を示す。記号σ2 d
(r,n;ir,io)(但し、1≦r≦n)は、分離
候補区間rの分離候補位置x(r,ir)から分離
候補区間nの分離候補位置x(n,io)に到るま
での各分離候補区間で任意に選択されたn−r+
1個の分離候補位置x(r,ir),x(r+1,
ir+1),…,x(n,io)から得られるn−r個の
距離d(r,r+1;ir,ir+1),d(r+1,r+
2;ir+1,ir+2)の前述した平均値μd(r,n;ir
io)における分散を示す。そこで、始端状態とな
る分離候補区間r(第2図においてはr=0であ
る)から終端状態となる分離候補区間n(第2図
においてはn=4)に到るまでの文字分離位置
は、式(2)で示す評価尺度Uを最小とするような分
離候補位置x(r,ir),x(r+1,ir+1),…,
x(n,io)を求めることによつて得られる。
FIG. 2 is a diagram for explaining the principle for extracting optimal character separation positions in the present invention.
In the figure, the positions indicated by black dots indicate the values of each separation candidate position x(k, i k ) in the separation candidate section k (k=0, . . . 4) shown in FIG. 1c. Further, the case where the character pitch P is 20 is shown. Furthermore,
In order to simply explain the principle of the present invention, character string images to be separated are from separation candidate section 0 to separation candidate section 4 in FIG. 1c. First, let's define the symbols. Symbol μ d (r, n; i r , i o )
(However, 1≦r<n) represents each separation candidate from separation candidate position x (r, i r ) of separation candidate section r to separation candidate position x (n, i o ) of separation candidate section n. n−r+1 separation candidate positions x(r, i r ), x(r+1, i r+1 ), ..., x(n, i o
)
n-r distances d(r, r+1; i r ,
i r+1 ) d(r+1, r+2; i r+1 , i r+2 )…, d(n
-1, n; io-1 , io ). symbol σ 2 d
(r, n; i r , i o ) (1≦r≦n) is calculated from the separation candidate position x (r, i r ) in the separation candidate section r to the separation candidate position x (n, n−r+ arbitrarily selected in each separation candidate interval up to i o )
One separation candidate position x(r, i r ), x(r+1,
n-r distances d (r, r+1; i r , i r+1 ), d(r+1, r+
2; i r+1 , i r+2 ), the above-mentioned average value μ d (r, n; i r ,
i o ). Therefore, the character separation position from the separation candidate section r (r = 0 in Fig. 2) which is the start state to the separation candidate section n (n = 4 in Fig. 2) which is the end state is , separation candidate positions x(r, i r ), x(r+1, i r+1 ), ..., which minimize the evaluation scale U shown in equation (2).
It can be obtained by finding x(n, io ).

U(r,n)=β・σ2 d(r,n;ir,io) +(1+β)・(μd(r,n;ir,io)−P)2 ……(2) 式(2)における重み係数βは、0≦β≦1を満た
す。ここで、式(2)を最小にするような分離候補位
置のより具体的な実現方法は、以下に示す動的計
画法を用いて、メモリ容量を費やすことなく行う
ことができる。そこで、分離候補区間k+1にお
ける任意の分離候補位置x(k+1,ik+1)にお
いて、1つ前の分離候補区間k(但し、k=0は、
始端状態を含む分離候補区間とする。)の任意の
分離候補位置x(k,ik)(但し、ik=1,2…hk
とし、hk≧1とする)から式(2)を満足する分離候
補位置x(k+1,ik)に到る最適な分離候補位
置x(k,ik)を後述する漸化式を用いて求める
ことができる。まず、距離d(k,k+1;ik
ik+1)(但し、ik=1,2…hk)を求め、以下に示
す式(3−1),式(3−2),式(3−3)を計
算する。
U(r,n)=β・σ 2 d (r, n; i r , i o ) +(1+β)・(μ d (r, n; i r , i o )−P) 2 ... (2) The weighting coefficient β in equation (2) satisfies 0≦β≦1. Here, a more specific method for realizing separation candidate positions that minimizes Equation (2) can be performed without consuming memory capacity using the dynamic programming method described below. Therefore, at any separation candidate position x (k+1, i k+1 ) in separation candidate section k+1, the previous separation candidate section k (however, if k=0,
This is the separation candidate section that includes the start state. ) for any separation candidate position x(k, i k ) (where i k =1,2...h k
The optimal separation candidate position x (k, i k ) that satisfies equation (2) is determined from the separation candidate position x (k + 1, i k ) from h k ≥ 1) using the recurrence formula described below. can be found. First, the distance d(k, k+1; i k ,
i k+1 ) (where i k =1, 2...h k ), and calculate equations (3-1), (3-2), and (3-3) shown below.

μd(0,k+1;i0,ik+1)=1/k+1 {k・μ* d(0,k;i0,ik) +d(k,k+1;ik,ik+1)} ……(3−1) D(k+1)=D*(k)+d2 (k,k+1;ik,ik+1) ……(3−2) U(0,k+1)=β・(D(k+1)/k+1−μ2 d (0,k+1;i0,ik))2 +(1-β)(μd(0,k+1;i0,ik)−P)2
……(3−3) 分離候補区間kのhk個の分離候補位置x(k,
1),…x(k,hk)に対して、式(3−3)の評
価尺度U(0,k+1)を最小とする分離候補位
置x(k,ik)が分離候補区間k+1の任意の分
離候補位置x(k+1,ik+1)への最適な分離候
補位置となる。
μ d (0, k+1; i 0 , i k+1 )=1/k+1 {k・μ * d (0, k; i 0 , i k ) +d(k, k+1; i k , i k+1 ) } ...(3-1) D(k+1)=D * (k)+d 2 (k, k+1; i k , i k+1 ) ...(3-2) U(0, k+1)=β・( D(k+1)/k+1−μ 2 d (0, k+1; i 0 , i k )) 2 +(1−β)(μ d (0, k+1; i 0 , i k )−P) 2
...(3-3) h k separation candidate positions x(k,
1), ... x (k, h k ), the separation candidate position x (k, i k ) that minimizes the evaluation scale U (0, k + 1) of equation (3-3) is the separation candidate position x (k, i k ) of the separation candidate section k + 1. This becomes the optimal separation candidate position for an arbitrary separation candidate position x (k+1, i k+1 ).

ここで、始端状態となる分離候補区間0におけ
る各分離候補位置x(0,i0)(第2図においてi0
=1となる)において、式(3−1)に示す最適
な平均値μ* d(0,0;i0,i0)=0,式(3−2)
に示す最適な距離d(−1,0;i-1,i0)の2乗
累積和D*(0)=0とする。分離候補区間kの各
分離候補位置x(k,ik)には上述した最適な平
均値μ* d(0,k;ik,i0)及び最適な距離d(k−
1,k;ik-1,ik)の2乗の累積和D*(k−1,
k)を記憶しておけば、次の分離候補区間k+1
の各分離候補位置x(k+1,ik+1)における分
離候補区間kの最適な分離候補位置x(k,ik
が求められる。尚、式(3−3)における1項
は、式(2)で示した分散σ2 d((0,k+1;i0,ik+1

の別の表現方法になつている。
Here, each separation candidate position x (0, i 0 ) in separation candidate section 0, which is the start state (i 0 in FIG.
= 1), the optimal average value μ * d (0, 0; i 0 , i 0 ) = 0 shown in equation (3-1), equation (3-2)
Assume that the cumulative sum of squares of the optimal distance d (-1, 0; i -1 , i 0 ) shown in is D * (0)=0. Each separation candidate position x (k, i k ) of separation candidate section k has the above-mentioned optimal average value μ * d (0, k; i k , i 0 ) and optimal distance d (k−
1, k; i k-1 , i k ) cumulative sum D * (k-1,
k), the next separation candidate section k+1
The optimal separation candidate position x (k, i k ) of separation candidate section k at each separation candidate position x (k+1 , i k+1 )
is required. Note that the first term in equation (3-3) is the variance σ 2 d ((0, k+1; i 0 , i k+1
)
It has become a different way of expressing.

次に、第2図を用いて、式(3−1),式(3
−3)の計算過程を説明する。図において、カツ
コで示した値は、それぞれ各分離候補区間k(k
=0,1,2,3,4)の各分離候補位置x(k,
ik)において、式(3−1)及び式(3−3)の
漸化式で示された平均値μ* d(0,k;i0,ik)及び
評価尺度U(0,k)を示しており、分離候補位
置x(k−1,ik-1)からの最適な値として算出
したものである。尚、本説明では、式(3−3)
における重み係数βは、0.5とした場合について
述べる。また、図における矢印は、それぞれ、最
適な分離候補位置の系列を示している。例えば、
分離候補位置x(2,1)は位置39であり、分離
候補位置x(1,1)との距離d(1,1;1,
1)は19となる。そこで、分離候補位置x(1,
1)を通る分離候補位置x(2,1)における平
均値μd(0,2)は、式(3−1)及び図より
1/2・(1×20+19)となり、値19.5となる。次 に、分離候補位置x(1,1)には、式(3−2)
で示されるD*(1)=202が記憶されている(図中、
省略)のため、式(3−2)を用いて、D(2)=
202+192となる。そこで、分離候補位置x(1,
1)を通る分離候補位置x(2,1)における評
価尺度U(0,2)はU(0,2)=0.5(202+192
2 −19.52)+0.5・(19.5−20)2となり、値0.38とな
る。同様に、分離候補位置x(1,2)を通る分
離候補位置x(2,1)における評価尺度U(0,
2)も計算され(但し、計算は省略する)、値
1.26となる。そこで、分離候補位置x(2,1)
に対して2つの評価尺度U(0,2)のうち、最
小値をとると、1つ前の分離候補区間1における
最適な分離候補位置はx(1,1)となり、また、
平均値μ* d(0,2)=19.5、評価尺度U(0,2)=
0.38が選択される。以下、同様な操作を式(3−
1)、式(3−2)、式(3−3)で示した漸化式
を用いて、行うことによつて、第2図で示したよ
うに、各分離候補位置x(k,ik)(k=0,1,
2,3,4)における評価尺度U(0,k)(但
し、k=0,1,2,3,4)が計算される。
Next, using Figure 2, equation (3-1) and equation (3
-3) The calculation process will be explained. In the figure, the values shown in brackets are for each separation candidate section k (k
=0,1,2,3,4) for each separation candidate position x(k,
i k ), the average value μ * d (0, k; i 0 , i k ) and the evaluation scale U (0, k ), which is calculated as the optimal value from the separation candidate position x (k-1, i k-1 ). In addition, in this explanation, formula (3-3)
The case where the weighting coefficient β in is set to 0.5 will be described. Further, each arrow in the figure indicates a series of optimal separation candidate positions. for example,
The separation candidate position x (2, 1) is the position 39, and the distance from the separation candidate position x (1, 1) is d (1, 1; 1,
1) becomes 19. Therefore, the separation candidate position x(1,
The average value μ d (0,2) at the separation candidate position x(2,1) passing through 1) is 1/2·(1×20+19) from equation (3-1) and the figure, and has a value of 19.5. Next, for the separation candidate position x (1, 1), formula (3-2) is used.
D * (1) = 20 2 shown by is stored (in the figure,
(omitted), using equation (3-2), D(2)=
20 2 + 19 2 . Therefore, the separation candidate position x(1,
The evaluation scale U (0, 2) at the separation candidate position x (2, 1) passing through 1) is U (0, 2) = 0.5 (20 2 + 19 2 /
2 -19.5 2 ) + 0.5・(19.5 - 20) 2 , giving a value of 0.38. Similarly, the evaluation scale U(0,
2) is also calculated (however, the calculation is omitted), and the value
It becomes 1.26. Therefore, separation candidate position x (2, 1)
If the minimum value is taken from the two evaluation scales U(0,2) for
Average value μ * d (0, 2) = 19.5, evaluation scale U (0, 2) =
0.38 is selected. Below, similar operations are performed using the formula (3-
1), equation (3-2), and equation (3-3), each separation candidate position x(k, i k ) (k=0,1,
2, 3, 4), the evaluation scale U(0, k) (where k=0, 1, 2, 3, 4) is calculated.

次に、前述したように、終端状態となる分離候
補区間内の分離候補位置x(4,2),x(4,
3),x(4,4)のうち、評価尺度U(0,4)
が最小となる分離候補位置x(4,2)を文字分
離の終了位置として選択する。そこで、最適な分
離候補位置の系列を文字分離の終了位置x(4,
2)より逆にたどることによつて、x(4,2)=
81,x(3,3)=60,x(2,2)=20,x(1,
1)=20,x(0,1)=0として求めることがで
きる。
Next, as described above, separation candidate positions x(4,2), x(4,
3), among x(4,4), the evaluation scale U(0,4)
The separation candidate position x (4, 2) with the minimum is selected as the end position of character separation. Therefore, we set the series of optimal separation candidate positions to the character separation end position x(4,
2) By tracing backwards, x(4,2)=
81, x (3, 3) = 60, x (2, 2) = 20, x (1,
1)=20, x(0,1)=0.

第3図は、本発明の具体的一実施例を示す論理
ブロツク図である。走査部1は、紙面上に記載さ
れた文字列イメージを光学的に走査して、電気信
号に変換し、2値量子化後、文字列イメージメモ
リ2へ書き込む。文字塊抽出部3は、文字列イメ
ージメモリ2に格納された文字列イメージから文
字塊を順次抽出し、各文字塊の位置及び幅及び高
さを文字塊情報レジスタ21へ格納する。尚、こ
のような文字塊抽出部3は、公知の技術を用いて
求めることができる。文字ピツチ検出部4は、文
字塊情報レジスタ21に格納された各文字塊の位
置及び文字塊幅、更には文字の高さを用いて、文
字ピツチPを推定し、文字ピツチ情報レジスタ2
2に格納する。尚、このような文字ピツチ検出部
4は、同一出願人による前記引用例1の明細書で
示されている技術を用いて求めることができる
し、また予め文字ピツチPが既知であれば、与え
られた文字ピツチPを用いても良い。パラメータ
情報レジスタ30は、本発明で用いる種々の閾値
や重み係数であるパラメータT1,T2,T3,T4
T5,βを格納する。許容区間抽出部5は、第1
図を用いて述べた条件(1)及び条件(2)を満足する許
容区間を抽出する。最初に、条件(1)で示した空白
となる許容区間は、文字塊情報レジスタ21に格
納された複数個の文字塊の位置及び文字塊幅Vi
を用いて、空白となる位置及び空白サイズが比較
回路等によつて抽出される。次に、条件(2)で示し
た黒地領域内の許容区間は、最初に、各文字塊幅
Viが、文字ピツチ情報レジスタ22に格納され
た文字ピツチPとパメータ情報レジスタ30に格
納されたパラメータT1との和P+T1より大きい
か否かを比較し、大きければ、各文字塊幅Viの
両端からパラメータ情報レジスタT2で示された
値までを除いて、文字塊幅Viを含む区間を許容
区間として抽出する。以上のようにして、抽出さ
れた条件(1)を満たす空白となる許容区間及び条件
(2)を満たす黒地領域内の許容区間が抽出され、許
容区間情報レジスタ23に、抽出された各許容区
間の位置及び幅が格納される。終端候補区間抽出
部6は、文字行イメージに対応して、順次許容区
間レジスタ23に格納された許容区間のうち、空
白となる許容区間Wiについて、パラメータ情報
レジスタ30に格納されたパラメータT4及び文
字ピツチPとの積T4・Pを算出し、積T4・Pと
空白となる許容区間Wiとを比較することによつ
て、積T4・Pよりも大きくなる許容区間Wiを検
出する。次に、許容区間Wiの始端から、パラメ
ータT5と文字ピツチPとの積T5・P(但しT5
T4)までの許容区間を算出し、更に許容区間Wi
の直前に存在する文字塊幅Vi始端から文字ピツ
チP及びパラメータT1との和P+T1内の許容区
間を算出して、上述した2つの許容区間の論理和
を、終端候補区間として、順次、終端候補区間レ
ジスタ24に格納する。
FIG. 3 is a logic block diagram showing a specific embodiment of the present invention. A scanning unit 1 optically scans a character string image written on a paper surface, converts it into an electrical signal, and writes it into a character string image memory 2 after binary quantization. The character block extraction unit 3 sequentially extracts character blocks from the character string image stored in the character string image memory 2, and stores the position, width, and height of each character block in the character block information register 21. Note that such a character chunk extraction unit 3 can be obtained using a known technique. The character pitch detection unit 4 estimates the character pitch P using the position and character block width of each character block stored in the character block information register 21, and furthermore, the height of the character.
Store in 2. Incidentally, such a character pitch detection section 4 can be obtained using the technique shown in the specification of Cited Example 1 by the same applicant, and if the character pitch P is known in advance, The character pitch P may be used. The parameter information register 30 stores parameters T 1 , T2, T 3 , T 4 , which are various threshold values and weighting coefficients used in the present invention.
Store T 5 and β. The permissible interval extraction unit 5
A permissible interval that satisfies condition (1) and condition (2) described using the diagram is extracted. First, the allowable blank interval shown in condition (1) is based on the positions of multiple character blocks and the character block width Vi stored in the character block information register 21.
Using this, the blank position and blank size are extracted by a comparison circuit or the like. Next, the permissible interval within the black background area shown in condition (2) is determined by the width of each character block.
It is compared whether Vi is larger than the sum P+T 1 of the character pitch P stored in the character pitch information register 22 and the parameter T 1 stored in the parameter information register 30, and if it is, the width of each character block Vi is Excluding the values from both ends to the value indicated by the parameter information register T2 , the section including the character block width Vi is extracted as a permissible section. As described above, the blank allowable interval and conditions that satisfy the extracted condition (1)
Tolerable sections within the black background area that satisfy (2) are extracted, and the position and width of each extracted allowable section are stored in the allowable section information register 23. The terminal candidate section extraction unit 6 extracts the parameters T 4 and 4 stored in the parameter information register 30 for the blank allowable section Wi among the allowable sections sequentially stored in the allowable section register 23 corresponding to the character line image. By calculating the product T 4・P with the character pitch P and comparing the product T 4・P with the blank allowable interval Wi, detect the allowable interval Wi that is larger than the product T 4・P. . Next, from the start of the allowable interval Wi, the product T 5 · P of the parameter T 5 and the character pitch P (however, T 5
Calculate the allowable interval up to T 4 ) and further calculate the allowable interval Wi
Calculate the permissible interval within the sum P + T 1 of the character pitch P and the parameter T 1 from the character block width Vi that exists immediately before, and use the logical sum of the two permissible intervals described above as the end candidate interval, and sequentially calculate It is stored in the end candidate section register 24.

第4図a及びbに終端候補区間抽出部6によつ
て、抽出される終端候補区間の一例を示す。第4
図aの場合、終端区間は、図中T5・Pで示した
区間として求められる。第4図bの場合、終端区
間は、図中最後の矢印で示した区間であり、
T5・PとP+T1との論理和のうち、空白となる
許容区間となつている。分離候補区間抽出部7
は、第1図cを用いて説明したような分離候補区
間kの各分離候補位置x(k,ik)を許容区間情
報レジスタ23及びパラメータ情報レジスタ30
に格納された許容区間及びパラメータを用いて、
順次抽出する。尚、文字分離開始位置を含む始端
分離候補区間0の各分離候補位置x(0,i0)(但
し、i0=1,2…h0)は制御部10によつて、最
初に、文字列イメージの始端から文字ピツチPに
基づいて設定される一定範囲の空白となる許容区
間内の各分離候補位置より求められ、最適分離位
置情報レジスタ26に格納されているものとす
る。そこで、分離候補区間抽出部7は、すでに、
抽出され最適分離候補位置レジスタ26に格納さ
れた分離候補区間k(但し、k=0,1,2…)
の分離候補位置x(k,ik)(但し、ik=1,2…
hk)から式(1)を満たす許容区間内に属する分離候
補位置x(k+1,ik+1)を算出する。即ち、分
離候補区間kの第1番目の分離候補位置x(k,
1)から文字ピツチPとパラメータ情報レジスタ
30に格納されたパラメータT3を用いてx(k,
1)+P−T3となる位置を算出し、更に分離候補
区間kの最後の分離候補位置x(k,hk)から文
字ピツチPとパラメータT3を用いて、x(k,
hk)+P+T3となる位置を算出する。上記2つの
位置x(k,1)+P−T3,x(k,hk)+P+T3
によつて得られる区間の各分離候補位置のうち、
論理積をとることによつて前述した許容区間に属
する分離候補位置を分離候補区間k+1の各分離
候補位置x(k+1,ik+1)(但し、ik+1=1,2
…hk+1)として抽出し、分離候補位置情報レジス
タ25に格納される。評価尺度演算部8に、分離
候補位置情報レジスタ25の内容が入力された
時、最適分離位置情報レジスタ26には、すでに
演算された分離候補区間0から分離候補区間kま
での各分離候補位置x(0,i0)(但し、i0=1…
h0),x(1,i1)(但し、i1=1…h1…x(k,
ik)(但し、ik=1…hk)が格納されている。更
に、分離候補区間m(m=0…k)の各分離候補
位置x(m,in)(但し、in=1…hn)に対応し
て、評価尺度演算部8によつて、式(3−1)よ
り計算された平均値μ* d(0,m;i0,in)、式(3
−2)より計算された距離の2乗の累積和D*(k)、
式(3−3)より計算された評価尺度U(0,m)
及び直前の分離候補区間m−1の最適な分離候補
位置x(m−1,in-1)が格納されている。尚、
制御部10によつて、分離候補区間0の各分離候
補位置x(0,i0)が格納された時、各分離候補
位置x(0,i0)に対応して格納される平均値μ* d
(0,0;i0,i0)及び距離の2乗の累積和D*
(0)は0が格納されているものとする。そこで、
評価尺度演算部8は、分離候補位置情報レジスタ
25より順次転送される分離候補位置x(k+1,
ik)において、最初に最適分離位置情報レジスタ
26に格納された分離候補区間kの各分離候補位
置x(k,ik)(但し、ik=1,2…hk)における
距離d(k,k+1;ik,ik+1)を算出し、更にそ
の平均値μ* d(0,k;i0,ik)、距離の2乗累積和
D*(k)及びパラメータ情報レジスタ30に記憶さ
れたパラメータβを用いて、順次、式(3−1)
で示した漸化式μd(0,k+1;i0,ik+1)=
1/k+1{k・μ* d(0,k;i0,ik)+d(k,k
+ 1;ikik+1)、式(3−2)で示した漸化式D(k
+1)=D*(k)+d2(k,k+1;ik,ik+1)、式(3
−3)で示した漸化式U(0,k+1)=β・
(D(k+1)/k+1−μ2 d(0,k+1;i0,ik+1
))2+(1 −β)・(μd(0,k+1);i0,ik+1)−P)2を計

することによつて、直前の分離候補区間kの分離
候補位置x(k,ik)(但し、ik=1…hk)に対す
る評価尺度U(0,k+1)を算出する。
FIGS. 4a and 4b show an example of a terminal candidate section extracted by the terminal candidate section extraction section 6. Fourth
In the case of figure a, the terminal section is determined as the section indicated by T5 ·P in the figure. In the case of Fig. 4b, the terminal section is the section indicated by the last arrow in the figure,
Of the logical sum of T 5 ·P and P + T 1 , it is a blank allowable interval. Separation candidate section extraction unit 7
is the separation candidate position x(k, i k ) of the separation candidate area k as explained using FIG.
Using the tolerance interval and parameters stored in
Extract sequentially. Note that each separation candidate position x (0, i 0 ) (however, i 0 = 1, 2...h 0 ) of the starting edge separation candidate section 0 including the character separation start position is determined by the control unit 10 first. It is assumed that the separation candidate positions are determined from each separation candidate position within a certain range of blank allowable intervals set based on the character pitch P from the starting end of the column image, and are stored in the optimum separation position information register 26. Therefore, the separation candidate section extraction unit 7 has already
Separation candidate section k extracted and stored in the optimal separation candidate position register 26 (k = 0, 1, 2...)
Separation candidate position x (k, i k ) (where i k = 1, 2...
From h k ), a separation candidate position x (k+1, i k+1 ) belonging to the allowable interval that satisfies equation (1) is calculated. That is, the first separation candidate position x(k,
1), x( k ,
1) Calculate the position where +P-T 3 , and then calculate x( k ,
Calculate the position where h k )+P+T 3 . The above two positions x (k, 1) + P - T 3 , x (k, h k ) + P + T 3
Of each separation candidate position in the section obtained by
By performing a logical product, the separation candidate positions belonging to the above-mentioned permissible interval are determined as each separation candidate position x (k+1, i k+1 ) in the separation candidate interval k+1 (where i k+1 =1, 2
... h k+1 ) and stored in the separation candidate position information register 25. When the contents of the separation candidate position information register 25 are input to the evaluation scale calculation unit 8, the optimum separation position information register 26 contains the already calculated separation candidate positions x from separation candidate section 0 to separation candidate section k. (0, i 0 ) (however, i 0 = 1...
h 0 ), x (1, i 1 ) (where i 1 = 1...h 1 ) , ...x(k,
i k ) (where i k =1...h k ) are stored. Furthermore, corresponding to each separation candidate position x (m, i n ) (where i n =1... h n ) of the separation candidate section m (m=0...k), the evaluation scale calculation unit 8 calculates the following: The average value μ * d (0, m; i 0 , i n ) calculated from equation (3-1), equation (3
−2) Cumulative sum of squared distances D * (k),
Evaluation scale U (0, m) calculated from formula (3-3)
and the optimal separation candidate position x(m-1,in -1 ) of the immediately preceding separation candidate section m-1 are stored. still,
When each separation candidate position x (0, i 0 ) of separation candidate section 0 is stored by the control unit 10, the average value μ stored corresponding to each separation candidate position x (0, i 0 ) * d
(0, 0; i 0 , i 0 ) and the cumulative sum of the square of the distance D *
It is assumed that 0 is stored in (0). Therefore,
The evaluation scale calculation unit 8 receives separation candidate positions x(k+1,
i k ) , the distance d ( k, k+1; i k , i k+1 ), and further calculate its average value μ * d (0, k; i 0 , i k ), and the cumulative sum of squares of the distances.
Using D * (k) and the parameter β stored in the parameter information register 30, formula (3-1)
The recurrence formula μ d (0, k+1; i 0 , i k+1 )=
1/k+1{k・μ * d (0, k; i 0 , i k )+d(k, k
+ 1; i k i k+1 ), recurrence formula D (k
+1) = D * (k) + d 2 (k, k+1; i k , i k+1 ), equation (3
-3) recurrence formula U(0,k+1)=β・
(D(k+1)/k+1−μ 2 d (0, k+1; i 0 , i k+1
)) 2 + (1 − β)・(μ d (0, k+1); i 0 , i k+1 ) − P) 2 , the separation candidate position x of the previous separation candidate section k is calculated. An evaluation scale U(0, k+1) for (k, i k ) (where i k =1...h k ) is calculated.

次に、hk個の分離候補位置x(k,ik)のうち、
評価尺度U(0,k+1)が最小となる分離候補
位置x(k,ik)を分離候補位置x(k+1,ik+1
へ到達する1つ前の最適な分離候補位置x(k,
ik)として求め、更に、評価尺度U(0,k+1)
の最小値及び評価尺度U(0,k+1)が最小値
となる平均値μ* d(0,k+1;i0,ik)、及び距離
の2乗累積和D*(k+1)をそれぞれ分離候補位
置x(k+1,ik)と共に、最適分離位置情報レ
ジスタ26に格納する。評価尺度演算部8におい
て、以上述べた演算処理を分離候補位置情報レジ
スタ25より順次転送されるすべての分離候補位
置x(k+1,ik+1)に対して行われると、制御
部10は、分離候補区間抽出部6に次の分離候補
区間k+2の各分離候補位置x(k+2,ik+2
を抽出するように要求し、前述した同様な操作が
繰り返される。ここで、制御部10は、評価尺度
演算部8によつて、最適分離位置情報レジスタ2
6に転送された分離候補区間k+1の分離候補位
置x(k+1,ik+1)が終端区間情報レジスタ2
4に格納された終端候補区間に到着したか否かを
調べ、到達しない場合には、上述した要求のみを
分離候補区間抽出部6に出力する。一方、分離候
補位置x(k+1,ik+1)が終端候補区間に到着
した場合、制御部10は、上述した要求を分離候
補区間抽出部6に出力し、次の分離候補区間k+
2の各分離候補位置x(k+2,ik+2)(但し、
ik+2=1…hk+2)が前述したように評価尺度演算
部8で評価された後、制御部10によつて、最適
分離位置情報レジスタ26に記憶された分離候補
位置x(k,ik)のうち、上述した終端候補区間
内にある複数個の分離候補位置x(n,ik)の評
価尺度U(0,n)が最小となる分離候補位置x
(n,io)を評価した区間内の終点位置として検
出され、終点位置となる分離候補位置x(n,io
に到達する最適な分離候補位置の系列が、最適分
離位置情報レジスタ26を用いて、終点位置とな
る分離候補位置x(n,io)から順次、分離候補
位置x(n−1,io-1),…x(0,i0)と逆にたど
ることによつて抽出され、文字分離位置レジスタ
27に記憶される。
Next, among the h k separation candidate positions x(k, i k ),
The separation candidate position x (k, i k ) where the evaluation scale U (0, k + 1) is the minimum is determined as the separation candidate position x (k + 1, i k +1 )
The optimal separation candidate position x(k,
i k ), and further, the evaluation scale U(0, k+1)
The average value μ * d (0, k + 1; i 0 , i k ) at which the minimum value of It is stored in the optimum separation position information register 26 together with the position x(k+1, i k ). When the evaluation scale calculation unit 8 performs the above-mentioned calculation processing on all separation candidate positions x (k+1, i k+1 ) sequentially transferred from the separation candidate position information register 25, the control unit 10 The separation candidate section extraction unit 6 inputs each separation candidate position x (k+2, i k+2 ) of the next separation candidate section k+2.
, and the same operations described above are repeated. Here, the control unit 10 uses the evaluation scale calculation unit 8 to control the optimum separation position information register 2.
The separation candidate position x (k+1, i k+1 ) of the separation candidate section k+1 transferred to the end section information register 2
It is checked whether the end candidate section stored in section 4 has been reached, and if it has not been reached, only the above-mentioned request is output to the separation candidate section extraction section 6. On the other hand, when the separation candidate position x (k+1, i k+1 ) arrives at the terminal candidate section, the control unit 10 outputs the above-mentioned request to the separation candidate section extraction section 6, and selects the next separation candidate section k+
2, each separation candidate position x (k+2, i k+2 ) (however,
After the separation candidate position x ( k, i k ), the separation candidate position x at which the evaluation scale U (0, n) of the plurality of separation candidate positions x (n, i k ) within the above-mentioned terminal candidate section is the minimum.
Separation candidate position x (n, i o ) that is detected as the end point position in the interval where (n, i o ) is evaluated and becomes the end point position
The series of optimal separation candidate positions that reach the separation candidate position x (n-1, i o -1 ) , .

次に制御部10は、前述した終点位置x(n,
io)から最初に検出される文字塊の始端までの空
白となる許容区間内で、文字ピツチPに基づいて
設定される一定範囲を次に分離すべき部分文字列
イメージの始端となる分離候補区間0として、最
適分離位置情報レジスタ26に格納し、前述した
ような操作を行うように、指令する。このように
して、文字列イメージメモリ2に格納された文字
列イメージの文字分離位置が文字分離位置レジス
タ27に格納され、上述した文字塊情報レジスタ
21に記憶された各文字塊の高さ及び文字分離位
置レジスタ27に格納された文字分離位置を用い
ることによつて、1文字単位に分離することがで
きる。
Next, the control unit 10 controls the aforementioned end point position x(n,
A separation candidate that will be the start of the substring image to be separated next in a certain range set based on the character pitch P within the blank allowable interval from i o ) to the start of the first detected character block. It is stored in the optimum separation position information register 26 as section 0, and commands are given to perform the operations described above. In this way, the character separation position of the character string image stored in the character string image memory 2 is stored in the character separation position register 27, and the height and character of each character block stored in the above-mentioned character block information register 21 are stored. By using the character separation position stored in the separation position register 27, it is possible to separate each character.

第5図は、第3図における評価尺度演算部8の
具体的な一実施例を示す論理ブロツク図である。
FIG. 5 is a logical block diagram showing a specific embodiment of the evaluation scale calculating section 8 in FIG.

前述したように分離候補位置情報レジスタ25
に分離候補区間k+1の各分離候補位置x(k+
1,ik+1)(但し、ik+1=1…hk+1)が格納される
と、第3図で示した制御部10によつて、分離候
補位置x(k+1,ik+1)が距離算出部81及び
分離候補位置群レジスタ261の所定の位置へ転
送され、分離候補区間k+1はステージレジスタ
80及び分離候補位置群レジスタ261の所定の
位置に格納される。距離算出部81に分離候補位
置x(k+1,ik+1)が格納されると、制御部1
0によつて、分離候補位置群レジスタ261に格
納された分離候補区間kの各分離候補位置x(k,
ik)(但し、ik=1…hk)が順次、距離算出部81
に転送される。ここで第3図で示した最適分離位
置情報レジスタ26は分離候補位置群レジスタ2
61,連接情報群レジスタ262,最適統計量群
レジスタ263、最適評価値群レジスタ264か
ら構成される。距離算出部8は分離候補位置x
(k+1,ik+1)と順次転送される分離候補位置
との距離d(k,k+1;ik,ik+1)=x(k+1,
ik+1)−x(k,ik)を算出する。
As mentioned above, the separation candidate position information register 25
, each separation candidate position x(k+
1, i k+1 ) (where i k+1 =1...h k+1 ), the control unit 10 shown in FIG . +1 ) is transferred to a predetermined position in the distance calculation unit 81 and separation candidate position group register 261, and separation candidate section k+1 is stored in a predetermined position in the stage register 80 and separation candidate position group register 261. When the separation candidate position x (k+1, i k+1 ) is stored in the distance calculation unit 81, the control unit 1
0, each separation candidate position x(k,
i k ) (where i k =1...h k ) are sequentially calculated by the distance calculation unit 81
will be forwarded to. Here, the optimum separation position information register 26 shown in FIG. 3 is the separation candidate position group register 2.
61, a connection information group register 262, an optimal statistics group register 263, and an optimal evaluation value group register 264. The distance calculation unit 8 calculates the separation candidate position x
Distance d(k, k+ 1 ; i k , i k+1 )=x(k+1,
i k+1 )−x(k, i k ).

統計量算出部82は、前述した式(3−1)及
び軸(3−2)で示した漸化式に基づいて、平均
値μd(0,k+1;i0,ik+1)及び距離の2乗累積
和D(k)を算出する。即ち、平均値μd(0,k+
1;i0,ik+1)は読み出された最適統計群レジス
タ263に格納された分離候補位置x(k,ik
における平均値μ* d(0,k;i0,ik)、距離算出部
81の出力d(k,k+1;ik,ik+1)ステージレ
ジスタ80の内容である分離区間k+1及びkを
用いて、計算式 μd(0,k+1;i0,ik+1)=1/k+1{k・μ* d (0,k;i0,ik)+d(k,k+1;ik,ik+1) により算出される。一方、距離の2乗累積和D
(k+1)は読み出された最適統計群レジスタ2
63に格納された分離候補位置x(k,ik)にお
ける距離の2乗累積和D*(k)と距離算出部81の
出力d(k,k+1;ik,ik+1)を用いて、計算式 D(k+1)=D*(k)+d (k,k+1;ik,ik+1) により算出される。統計量算出部82より算出さ
れた平均値μd(0,k+1;i0,ik+1)、及び距離
の2乗累積和D(k+1)はそれぞれ統計量格納
レジスタ82に格納される。評価値算出部84
は、前述した式(3−2)に基づいて、評価尺度
U(0,k+1)の値を算出する。即ち、評価値
U(0,k+1)は、第3図で示した文字ピツチ
P及びパラメータ情報レジスタ30に格納された
パラメータβ及び統計量格納レジスタ83の内容
及びステージレジスタ80の内容を用いて、計算
式 U(0,k+1)=β・(D(k+1)/k+1−μ2 d (0,k+1;i0,ik+1))2+(1-β) ・(μd(0,k+1;i0,ik+1)−P)2 により算出される。次に、比較部85において、
評価算出部84の出力である評価値と最小評価値
レジスタ86の内容を比較し、評価値算出部84
の出力が、最小評価値レジスタ86の内容よりも
小さければ、その出力信号線851の出力信号8
51Sを“ON”にする。尚、最小評価値レジス
タ86の内容は、最初非常に大きな値がセツトさ
れているものとする。
The statistics calculation unit 82 calculates the average value μ d (0, k+1; i 0 , i k+1 ) and Calculate the cumulative sum of squared distances D(k). That is, the average value μ d (0, k+
1; i 0 , i k+1 ) is the separation candidate position x (k, i k ) stored in the read optimal statistical group register 263
The average value μ * d (0, k; i 0 , i k ), the output d (k, k+1; i k , i k+1 ) of the distance calculation unit 81 and the separated sections k+1 and k which are the contents of the stage register 80 Using the calculation formula μ d (0,k+1;i 0 ,i k+1 )=1/k+1{k・μ * d (0,k;i 0 ,i k )+d(k,k +1; i k , i k+1 ). On the other hand, the cumulative sum of squared distances D
(k+1) is the read optimal statistical group register 2
Using the squared cumulative sum D * (k) of the distance at the separation candidate position x(k, i k ) stored in 63 and the output d(k, k+1; i k , i k+1 ) of the distance calculation unit 81, It is calculated using the calculation formula D(k+1)=D * (k)+d (k, k+1; i k , i k+1 ). The average value μ d (0, k+1; i 0 , i k+1 ) and the cumulative sum of squares of distances D(k+1) calculated by the statistics calculation unit 82 are stored in the statistics storage register 82, respectively. Evaluation value calculation unit 84
calculates the value of the evaluation scale U(0, k+1) based on the above-mentioned formula (3-2). That is, the evaluation value U(0, k+1) is calculated using the character pitch P shown in FIG. Calculation formula U(0,k+1)=β・(D(k+1)/k+1−μ 2 d (0, k+1; i 0 , i k+1 )) 2 +(1−β) ・(μ d ( 0, k+1; i 0 , i k+1 )−P) 2 . Next, in the comparison section 85,
The evaluation value output from the evaluation calculation unit 84 is compared with the contents of the minimum evaluation value register 86, and the evaluation value calculation unit 84
If the output is smaller than the contents of the minimum evaluation value register 86, the output signal 8 of the output signal line 851 is
Turn 51S “ON”. It is assumed that the contents of the minimum evaluation value register 86 are initially set to a very large value.

出力信号線851Sが“ON”になると、ゲー
ト回路53が開いて、評価値算出部84の出力が
最小評価値レジスタ86に転送される。
When the output signal line 851S is turned “ON”, the gate circuit 53 is opened and the output of the evaluation value calculation unit 84 is transferred to the minimum evaluation value register 86.

また、出力信号851Sが“ON”になると、
統計量格納レジスタ83に格納された平均値μd
(0,k+1;i0,ik+1)及び距離の2乗累積和D
(k+1)が、ゲート回路52が開くことによつ
て、最小統計量レジスタ88に格納される。
Also, when the output signal 851S turns “ON”,
Average value μ d stored in statistics storage register 83
(0, k+1; i 0 , i k+1 ) and cumulative sum of squares of distance D
(k+1) is stored in the minimum statistic register 88 by opening the gate circuit 52.

更に、出力信号851Sが“ON”になると、
ゲート回路51が開くことによつて、距離算出部
81に転送された分離候補区間kの分離候補位置
x(k,ik)における位置情報k及びikが連接情報
レジスタ87に格納される。
Furthermore, when the output signal 851S becomes “ON”,
By opening the gate circuit 51, the position information k and i k at the separation candidate position x (k, i k ) of the separation candidate section k transferred to the distance calculation unit 81 is stored in the connection information register 87.

以上の操作を最適分離位置情報261に格納さ
れた分離候補区間kの分離候補位置x(k,ik
(但し、ik=1…hkに対して行われる。
The above operation is performed at the separation candidate position x (k, i k ) of the separation candidate section k stored in the optimal separation position information 261.
(However, this is performed for i k =1...h k .

次に、第3図で示した制御部10は分離候補レ
ジスタ25より距離算出部に転送された分離候補
位置x(k+1,ik+1)における最適な平均値μ*
(0,k+1;i0,ik+1)及び最適な距離の2乗累
積和D*(k+1)として、最小統計量レジスタ8
8の内容を最小統計量群レジスタ263に転送
し、分離候補位置x(k+1,ik+1)の最適な評
価値として、最小評価値レジスタ86の内容を最
小評価値群レジスタ264へ転送し、更に、分離
候補区間kにおける分離候補位置x(k+1,ik
への最適な分離パス情報として、連接情報レジス
タ87の内容を連接情報群レジスタ263へ転送
する。
Next, the control unit 10 shown in FIG .
(0, k+1; i 0 , i k+1 ) and the minimum statistics register 8 as the cumulative sum of squares of the optimal distance D * (k+1)
8 is transferred to the minimum statistics group register 263, and the contents of the minimum evaluation value register 86 are transferred to the minimum evaluation value group register 264 as the optimal evaluation value of the separation candidate position x (k+1, i k+ 1 ). , Furthermore, the separation candidate position x (k+1, i k ) in the separation candidate section k
The contents of the linkage information register 87 are transferred to the linkage information group register 263 as the optimal separation path information to the linkage information register 263.

次に、最小評価値レジスタ86の内容に、初期
値(非常に大きな値)をセツトする。
Next, the contents of the minimum evaluation value register 86 are set to an initial value (a very large value).

以上の操作を繰り返すことによつて分離候補区
間k+1のすべての分離候補位置x(k+1,
ik+1)(但し、ik+1=1,2…hk+1)に対して、最
適な評価値及び最適な分離パスが得られる。
By repeating the above operations, all separation candidate positions x(k+1,
i k+1 ) (where i k+1 =1, 2...h k+1 ), an optimal evaluation value and an optimal separation path can be obtained.

尚、本発明の具体的な別の実現方法として、通
常のマイクロコンピユータを用いて、実現できる
ことは言うまでもない。
It goes without saying that another specific method of implementing the present invention is to use an ordinary microcomputer.

以上、述べたように、本発明を適用することに
よつて、文字間の接触が生じてもまた、1文字が
2文字以上にスプリツトする場合が生じても、容
易にしかも安定に、一文字単位の分離を行うこと
が可能となる。
As described above, by applying the present invention, even if there is contact between characters or if one character is split into two or more characters, it is possible to easily and stably It becomes possible to separate the

【図面の簡単な説明】[Brief explanation of drawings]

第1図は部分文字列イメージの一例を用いて、
本発明における文字分離の分離候補区間設定方法
の一例を説明するための図、第2図は本発明にお
ける最適な文字分離位置を抽出するための原理を
説明するための図、第3図は本発明の具体的一実
施例を示す論理ブロツク図、第4図は第3図にお
ける終端候補区間抽出部6によつて、抽出される
終端候補区間の一例を示す。第5図は第3図にお
ける評価尺度演算部8の具体的な一実施例を示す
論理ブロツク図である。 図において、1は走査部、2は文字列イメージ
メモリ、3は文字塊抽出部、21は文字塊情報レ
ジスタ、4は文字ピツチ検出部、22は文字ピツ
チ情報レジスタ、30はパラメータ情報レジス
タ、5は許容区間抽出部、23は許容区間情報レ
ジスタ、6は終端候補区間抽出部、24は終端候
補区間レジスタ、7は分離候補区間抽出部、25
は分離候補位置情報レジスタ、8は評価尺度演算
部、26は最適分離位置情報レジスタ、27は文
字分離位置レジスタ、10は制御部、80はステ
ージレジスタ、81は距離算出部、261は分離
候補位置群レジスタ、262は連接情報群レジス
タ、263は最適統計量群レジスタ、264は最
適評価値群レジスタ、82は統計量算出部、83
は統計量格納レジスタ、84は評価値算出部、8
5は比較部、86は最小評価値レジスタである。
Figure 1 uses an example of a partial string image,
A diagram for explaining an example of a separation candidate section setting method for character separation in the present invention, FIG. 2 is a diagram for explaining the principle for extracting an optimal character separation position in the present invention, and FIG. FIG. 4, a logical block diagram illustrating a specific embodiment of the invention, shows an example of a terminal candidate section extracted by the terminal candidate section extracting section 6 in FIG. FIG. 5 is a logical block diagram showing a specific embodiment of the evaluation scale calculating section 8 in FIG. In the figure, 1 is a scanning unit, 2 is a character string image memory, 3 is a character block extraction unit, 21 is a character block information register, 4 is a character pitch detection unit, 22 is a character pitch information register, 30 is a parameter information register, 5 23 is a permissible interval extraction unit, 23 is an allowable interval information register, 6 is a terminal candidate interval extractor, 24 is a terminal candidate interval register, 7 is a separation candidate interval extractor, 25
8 is a separation candidate position information register, 8 is an evaluation scale calculation unit, 26 is an optimal separation position information register, 27 is a character separation position register, 10 is a control unit, 80 is a stage register, 81 is a distance calculation unit, 261 is a separation candidate position group register, 262 is a connection information group register, 263 is an optimal statistics group register, 264 is an optimal evaluation value group register, 82 is a statistics calculation unit, 83
is a statistics storage register, 84 is an evaluation value calculation unit, 8
5 is a comparison section, and 86 is a minimum evaluation value register.

【特許請求の範囲】[Claims]

1 現金の収集時に装置の外部に引きだし可能な
現金収納部と、 該現金収納部と、現金の入出金口との間で現金
の収納、繰り出し、及び搬送を行う現金出納機構
と、 該現金出納機構の現金搬送経路において搬送途
上の現金の種別を鑑別する鑑別部と、 該鑑別部よりの鑑別結果信号を受信することに
より、該現金収納部に収容される現金の数量を計
数する計数手段とを有する現金取扱装置におい
て、 該現金収納部が装置の外部に引き出されたこと
を検出する検出手段と、 該検出手段の発する検出出力を受信したことに
より、該計数手段の計数値をクリヤするクリヤ手
段とを備えることを特徴とする現金取扱装置。
1. A cash storage section that can be pulled out to the outside of the device when collecting cash; a cash accounting mechanism that stores, dispenses, and transports cash between the cash storage section and a cash deposit/withdrawal port; and the cash transaction mechanism. a discrimination section that discriminates the type of cash being conveyed on the cash conveyance route of the mechanism; and a counting means that counts the amount of cash stored in the cash storage section by receiving a discrimination result signal from the discrimination section. A cash handling device having: a detection means for detecting that the cash storage section has been pulled out of the device; and a clearing means for clearing the count value of the counting means upon receiving a detection output emitted by the detection means. A cash handling device comprising: means.

JP58240335A 1983-12-20 1983-12-20 Character separating device Granted JPS60132281A (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP58240335A JPS60132281A (en) 1983-12-20 1983-12-20 Character separating device
US06/683,576 US4635290A (en) 1983-12-20 1984-12-19 Sectioning apparatus and method for optical character reader systems
DE8484115985T DE3486104T2 (en) 1983-12-20 1984-12-20 SEPARATOR AND METHOD FOR OPTICAL CHARACTER READING DEVICES.
DE3486241T DE3486241T2 (en) 1983-12-20 1984-12-20 Device and method for character spacing for optical character recognition systems.
EP91100048A EP0428499B1 (en) 1983-12-20 1984-12-20 Character pitch detector apparatus and method for optical character reader systems
EP84115985A EP0146147B1 (en) 1983-12-20 1984-12-20 Sectioning apparatus and method for optical character reader system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58240335A JPS60132281A (en) 1983-12-20 1983-12-20 Character separating device

Publications (2)

Publication Number Publication Date
JPS60132281A JPS60132281A (en) 1985-07-15
JPH0368431B2 true JPH0368431B2 (en) 1991-10-28

Family

ID=17057949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58240335A Granted JPS60132281A (en) 1983-12-20 1983-12-20 Character separating device

Country Status (1)

Country Link
JP (1) JPS60132281A (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61175878A (en) * 1985-01-31 1986-08-07 Mitsubishi Electric Corp Document reading device
JP2570415B2 (en) * 1988-04-28 1997-01-08 セイコーエプソン株式会社 Character extraction method
JP2565150B2 (en) * 1988-04-28 1996-12-18 セイコーエプソン株式会社 Character cutting method
JP2730996B2 (en) * 1989-10-18 1998-03-25 富士ファコム制御株式会社 How to extract contact characters from Japanese documents

Also Published As

Publication number Publication date
JPS60132281A (en) 1985-07-15

Similar Documents

Publication Publication Date Title
US4590606A (en) Multi-function image processing system
JP2000353215A (en) Character recognition device and recording medium where character recognizing program is recorded
JP3099771B2 (en) Character recognition method and apparatus, and recording medium storing character recognition program
JPH0368431B2 (en)
JPS626272B2 (en)
JPS5991582A (en) Character reader
JP2017199326A (en) Character reading device
EP0076332A1 (en) Optical character reader with pre-scanner
JP3957471B2 (en) Separating string unit
JPH0433075B2 (en)
JP4731748B2 (en) Image processing apparatus, method, program, and storage medium
JP2630261B2 (en) Character recognition device
Tsuji et al. Character image segmentation
JPH0259502B2 (en)
JP4231476B2 (en) An image processing method for collating an input image inputted with a printed matter or a sticker label of a container with a master image registered in advance
JP2778436B2 (en) Character segmentation device
JPH05128308A (en) Character recognition device
JP2005284503A (en) Paper sheets recognition apparatus
JPH11203405A (en) Character recognition device, its method and program recording medium
JPS6024677A (en) Character separating device
JPH0365584B2 (en)
JP4580520B2 (en) Character recognition method and character recognition apparatus
JP2004164489A (en) Device and method for discriminating securities
JPS58214969A (en) Character reading device
JPH0222427B2 (en)

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term