JPH0498477A - Character segmenting method - Google Patents

Character segmenting method

Info

Publication number
JPH0498477A
JPH0498477A JP2212593A JP21259390A JPH0498477A JP H0498477 A JPH0498477 A JP H0498477A JP 2212593 A JP2212593 A JP 2212593A JP 21259390 A JP21259390 A JP 21259390A JP H0498477 A JPH0498477 A JP H0498477A
Authority
JP
Japan
Prior art keywords
character
width
column direction
input
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2212593A
Other languages
Japanese (ja)
Other versions
JP2995818B2 (en
Inventor
Keiko Abe
阿部 惠子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2212593A priority Critical patent/JP2995818B2/en
Publication of JPH0498477A publication Critical patent/JPH0498477A/en
Application granted granted Critical
Publication of JP2995818B2 publication Critical patent/JP2995818B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

PURPOSE:To precisely execute the segmenting of a character by discriminating the form of the input character automatically even when an operator does not set the longitudinal/lateral ratio of the input chracter and the like by discriminating the form of the input character statistically. CONSTITUTION:Individual character string width H is found with projecting plural character strings in a column direction respectively and an individual input character is projected in the column direction and in a width direction orthogonal to the column direction respectively. Then, individual character blocks 13A, 13B, 13C... are found and length with the largest frequency between length (w) and (h) of the column direction and the width direction of the individ ual block is regarded as the length of the column direction and the width direc tion of a character pattern 15 to represent the input character. Moreover, a pattern similar to the character pattern 15 is defined as a basic character frame 16 and the segmenting of the input character is executed with the basic charac ter frame 16 as a unit. Thus, the segmenting of a separated character etc., can be executed precisely by using the form of the discriminated character without depending on a character pitch.

Description

【発明の詳細な説明】 二産業上の利用分野] 本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認識装置に適用さ
れる文字切り出し方法j二関する。
[Detailed Description of the Invention] [Second Industrial Application Fields] The present invention is directed to a character extraction method applied to a character recognition device suitable for use, for example, in recognizing characters in a printed document and converting them into character codes. Two matters.

[発明の概要] 本発明は、例えば印刷文書の文字を認識して文字コード
に変換する場合に使用して好適な文字認識装置に適用さ
れる文字切り出し方法に関し、複数の文字列を夫々列方
向に投影して個々の文字列幅を求め、上記複数の文字列
中の個々の入力文字を夫々列方向及び該列方向に直交す
る幅方向に投影することにより個々の文字ブロックを求
め、これら個々の文字ブロックの列方向及び幅方向の長
さの内で最も頻度の大きい長さを上記入力文字を代表す
る文字パターンの列方向及び幅方向の長さとみなし、上
記個々の文字列幅の分布の内で最も頻度の大きい文字列
幅を一辺として上記入力文字を代表する文字パターンに
相似なパターンを基本文字枠とし、該基本文字枠を単位
として上記入力文字の切り出しを行うことにより、オペ
レータがその入力文字の縦横比等を設定しなくとも自動
的にその入力文字の形状を判別して文字の切り出しが正
確に行えるようにしたものである。
[Summary of the Invention] The present invention relates to a character cutting method that is applied to a character recognition device suitable for use when recognizing characters in a printed document and converting them into character codes, for example. The width of each character string is determined by projecting each of the input characters in the plurality of character strings in the column direction and the width direction orthogonal to the column direction to determine each character block. The length with the highest frequency among the lengths in the column direction and width direction of the character block is regarded as the length in the column direction and width direction of the character pattern representing the above input character, and the length of the above individual character string width distribution is calculated. A basic character frame is a pattern similar to a character pattern representative of the input characters, with the width of the character string that has the highest frequency as one side, and the operator cuts out the input characters using the basic character frame as a unit. The shape of the input character is automatically determined and the character can be accurately cut out without setting the aspect ratio of the input character.

また、本発明は、複数の文字列を夫々列方向に投影して
個々の文字列幅を求約1上記複数の文字列中の個々の入
力文字を夫々列方向及び該列方向に直交する幅方向に投
影することにより個々の文字ブロックを求め、これら個
々の文字ブロックの列方向及び幅方向の長さの内で最も
頻度の大きい長さを上記入力文字を代表する文字パター
ンの列方向及び幅方向の長さとみなし、上記複数の文字
列の認識対象とする文字列において、先頭の文字の立ち
上がり部から上記入力文字を代表する文字パターンの列
方向の長さを中心として所定幅の領域にウィンドウを設
定し、該ウィンドウ内で上配詔識対象とする文字列を幅
方向に投影して投影値が最小となる上記列方向の谷部位
置を求め、該谷部位置の投影値と上記ウィンドウ内の他
の投影値との勾配の最大値が所定値を超えた場合には上
記谷部位置で文字の切り出しを行うと共に、該文字の切
り出しを行った位置を基準として次のウィンドウを設定
し、上記谷部位置の投影値と上記ウィンドウ内の他の投
影値との勾配の最大値が上記所定値以下である場合には
上記谷部位置から更に上記入力文字を代表する文字パタ
ーンの列方向の長さを中心として所定幅の領域に新たな
ウィンドウを設定することにより、投影では分離できな
い連結文字ブロックからでも正確に個々の文字の切り出
しが出来るようにしたものである。
In addition, the present invention calculates the width of each character string by projecting each of the plurality of character strings in the column direction.1. Obtain individual character blocks by projecting them in the direction, and calculate the most frequent length of each character block in the column direction and width direction of the character pattern representing the input character. A window is created in a predetermined width area centered on the length in the column direction of the character pattern representing the input character, starting from the rising edge of the first character in the character string to be recognized among the multiple character strings. , project the character string to be distributed in the width direction within the window, find the valley position in the column direction where the projected value is the minimum, and calculate the projected value of the valley position and the window above. If the maximum value of the gradient with respect to other projection values in , if the maximum value of the gradient between the projection value at the trough position and the other projection values in the window is less than the predetermined value, then further from the trough position in the column direction of the character pattern representing the input character. By setting a new window in an area of a predetermined width centered around the length of , it is possible to accurately cut out individual characters even from connected character blocks that cannot be separated by projection.

また、本発明は、複数の文字列を夫々列方向に投影して
個々の文字列幅を求め、上記複数の文字列中の個々の入
力文字を夫々列方向及び該列方向に直交する幅方向に投
影することにより個々の文字ブロックを求め、これら個
々の文字ブロックの列方向及び幅方向の長さの内で最も
頻度の大きい長さ−を上記入力文字を代表する文字パタ
ーンの列方向及び幅方向の長さとみなし、上記値々の文
字列幅の分布の内で最も頻度の大きい文字列幅を一辺と
して上記入力文字を代表する文字パターンに相似なパタ
ーンを基本文字枠とし、上記複数の文字列の内の認識対
象とする文字列に属する先頭の文字ブロックを基準とし
て上記基本文字枠の中に入る文字ブロックを統合して切
り出し、以下上記切り出された文字ブロックの次の文字
ブロックを基準として上記基本文字枠の中に入る文字ブ
ロックを統合して切り出していくことにより、文字ピッ
チが変動しても更に分離文字であっても正確に文字の切
り出しができるようにしたものである。
Further, the present invention projects each of a plurality of character strings in the column direction to determine the width of each character string, and projects each input character in the plurality of character strings in the column direction and in the width direction perpendicular to the column direction. Obtain individual character blocks by projecting them onto The character string width with the highest frequency among the character string width distribution of the above values is regarded as the length in the direction, and the basic character frame is a pattern similar to the character pattern representing the input characters above, and the above multiple characters are The character blocks that fall within the above basic character frame are integrated and cut out based on the first character block belonging to the character string to be recognized in the string, and the character blocks next to the above cut out character block are then used as the reference. By integrating and cutting out the character blocks that fit within the basic character frame, it is possible to accurately cut out characters even if the character pitch fluctuates or even if the characters are separated.

[従来の技術] 例えば活版印刷において作業者が活字を拾う工程を自動
化するためには、タイプ印刷等で作成された原稿の各文
字を認識して文字コードに変換する文字認識装置が必要
である。
[Prior Art] For example, in order to automate the process in which a worker picks up type in letterpress printing, a character recognition device is required that recognizes each character in a manuscript created by type printing and converts it into a character code. .

第22図は従来の文字認識装置の一例を示し、この第2
2図において、(1)は原稿読取部であり、この原稿読
取部(1)から原稿の1ペ一ジ分の濃淡に対応する原文
字信号S1が文字列切出し部(2)に供給される。この
原文字信号S1は原稿を所定の密度でドツト分解し、黒
いドツトをハイレベル“1” 白いドツトをローレベル
“0″で表わしたものであるが、各ドツトの濃度を複数
ビットの2進数で表わす場合もある。
FIG. 22 shows an example of a conventional character recognition device.
In Fig. 2, (1) is a document reading section, and from this document reading section (1), an original character signal S1 corresponding to the shading of one page of the document is supplied to a character string cutting section (2). . This original character signal S1 is obtained by dividing the document into dots at a predetermined density, and represents black dots as high level "1" and white dots as low level "0".The density of each dot is expressed as a multi-bit binary number. Sometimes it is expressed as

文字列切出し部(2)は第1段前処理部(3)、第2段
前処理部(4)及び第3段前処理部(5)より構成され
、原文字信号S1には第1段前処理部(3)において雑
音の除去及び原稿の回転補正がなされ、第2段前処理部
(4)において文字領域AR(第23TyJ参照)がそ
の他の領域(写真、図面等の領域)から区分されてその
文字領域ARに含まれるイメージデータだけが抽出され
、第3段前処理部(5)においてその抽出された文字領
域ARに含まれる文字列A R1,A R2,・・・・
に対応する文字列信号S4が抽出される。
The character string extraction unit (2) is composed of a first stage preprocessing unit (3), a second stage preprocessing unit (4), and a third stage preprocessing unit (5). The preprocessing unit (3) removes noise and corrects the rotation of the document, and the second stage preprocessing unit (4) separates the character area AR (see 23rd TyJ) from other areas (areas for photographs, drawings, etc.). Then, only the image data included in the character area AR is extracted, and in the third stage preprocessing section (5), the character strings A R1, A R2, . . . included in the extracted character area AR are extracted.
A character string signal S4 corresponding to is extracted.

この文字列信号S4の抽出を行なうには、第23図で示
す如く、文字領域ARの各ドツトの位置を水平方向にと
ったX軸と垂直方向にとったY軸とよりなる(X、Y)
座標で表わし、各ドツトの“1″又は“0”の値をY軸
上に投影して和をとることによりY投影YPを生成する
。そして、二のY投影YPを所定の闇値レベルで2値化
すると、この2値化した信号の内のハイレベル“1”の
区間が夫々文字列A R1,A R2,・・・・に対応
する如くなり、文字列信号S4は後続の文字切出し部(
6)に供給される。
In order to extract this character string signal S4, as shown in FIG. )
Expressed in coordinates, the Y projection YP is generated by projecting the "1" or "0" value of each dot onto the Y axis and calculating the sum. Then, when the second Y projection YP is binarized at a predetermined dark value level, the sections of high level "1" in this binarized signal become character strings A R1, A R2, etc. The character string signal S4 corresponds to the character string signal S4 at the subsequent character cutting part (
6).

文字切出し部(6)においては、例えば第24図Aに示
す1番目の文字列ARi の文字列信号s4をX軸上に
投影してX投影XPを生成し、このX投影XPを最小レ
ベル(値が2)のH値THIで2値化することにより粗
切出し信号DTI  (第24図C)を得て、このX投
影XPを中程度のレベルの閾値TH2(第24図D)で
2値化することにより細切出し信号DT2(第24図E
)を得る。同様に粗切出し信号DTIがハイレベル“1
”の区間だけで個々にY投影YPを生成することにより
、Y方向の切出し信号を生成することができる。そして
、最終的に第24図Aに示す如く、例えば文字「て−に
ついてはこの文字に外接する外接枠(9)の内部でハイ
レベル“1”となると共に、分離文字である1−い」に
つい゛ては分離されている各部に外接する外接枠(11
)、 (12>  の内部でハイレベル“1″′となる
切出し信号が得られ、入力される文字列信号S4からそ
の切出し信号がハイレベル“1”となる部分だけを順次
切出した信号が基本矩形切出し文字信号S7となる。
In the character cutting section (6), for example, the character string signal s4 of the first character string ARi shown in FIG. 24A is projected onto the X axis to generate an X projection XP, and this A coarse cutout signal DTI (Fig. 24C) is obtained by binarizing with the H value THI having a value of 2), and this X projection XP is binarized with a medium level threshold TH2 (Fig. 24D). The fine cutting signal DT2 (Fig. 24E
). Similarly, the coarse cutting signal DTI is at high level “1”.
By individually generating the Y projection YP only in the section ``, it is possible to generate a cutout signal in the Y direction.Finally, as shown in FIG. 24A, for example, for the character At the same time, the high-level "1" becomes "1" inside the circumscribing frame (9) circumscribing the , and the separating character "1-ii" becomes a high level "1" inside the circumscribing frame (9) circumscribing the separated parts.
), (12> A cutout signal with a high level "1"' is obtained inside, and the basic signal is a signal in which only the parts where the cutout signal becomes a high level "1" are sequentially cut out from the input character string signal S4. This becomes a rectangular cut-out character signal S7.

尚、第24図Eの細切出し信号DT2は各文字のより微
細な構造を調べる場合に使用される。また、第24図A
の分離文字である「い」については外接枠(11)、 
(12) が2個あるため、後に文字識別の段階で統合
を行なう必要がある。
Incidentally, the fine cutting signal DT2 in FIG. 24E is used when examining the finer structure of each character. Also, Figure 24A
For "i", which is a separating character, use the circumscribed frame (11),
Since there are two (12), it is necessary to integrate them later at the character identification stage.

(7)は文字識別部を示し、この文字識別部(7)は基
本矩形切出し文字信号s7を各外接枠毎に取込んで文字
認識を行なう。具体的には、先ず位置による分類を行な
い、第24図Aの文字例ARi  に対して上半分の範
囲に存在する文字(r’」、V″」。
Reference numeral (7) indicates a character recognition section, and this character recognition section (7) takes in the basic rectangular cut-out character signal s7 for each circumscribed frame and performs character recognition. Specifically, first, classification is performed by position, and characters (r''', V'''' that exist in the upper half of the character example ARi in FIG. 24A) are classified.

「°」など)及び下半分に存在する文字(「。」。(such as "°") and characters present in the bottom half (such as ".").

r、J、 r、  Jなど)を第1特徴文字としてパタ
ーンマツチングを行って、対応する文字コード(J I
 Sコードなど)を付与する。これで識別ができない場
合には、外接枠の幅をW、高さをhとして、縦横比h 
/ w及び相対的大きさによる分類を行なう。即ち、縦
横比h / wがCI<h/w<0.5の範囲に入るか
、1.5<h/wの範囲に入るかによって分類を行なう
。更に、平均的な大きさの外接枠の幅をWR、高さをh
Rとして、縦相対比h/hR及び横相対比W/WRの値
が夫々0〈h/hR<0.5及び0<w/wR<0.5
の範囲に入るか否かによって分類を行ない。上述の範囲
に入る文字を第2特徴文字としてパターンマツチングを
行なう。
r, J, r, J, etc.) as the first characteristic character, and perform pattern matching to find the corresponding character code (J I
S code, etc.). If identification is not possible with this, the width of the circumscribing frame is W, the height is h, and the aspect ratio is h.
/w and relative size. That is, classification is performed depending on whether the aspect ratio h/w falls within the range of CI<h/w<0.5 or 1.5<h/w. Furthermore, the width of the average-sized circumscribing frame is WR, and the height is h.
As R, the values of the vertical relative ratio h/hR and the horizontal relative ratio W/WR are 0<h/hR<0.5 and 0<w/wR<0.5, respectively.
Classification is performed based on whether or not it falls within the range of . Pattern matching is performed using characters within the above range as second characteristic characters.

また、第1及び第2特徴文字に分類されない文字に対し
ては個別に記憶されているドツトパターンとのパターン
マツチングを行ない、所定の合致度が得られた場合には
その文字コードを付与する。
Furthermore, for characters that are not classified as the first or second characteristic characters, pattern matching is performed with individually stored dot patterns, and if a predetermined degree of matching is obtained, that character code is assigned. .

それでもKIJ Wiできない文字が残った場合には、
その外接枠を更に複数の微少外接枠に分離する再切出し
及び後に続く外接枠と合体させる統合の動作が実行され
る。尚、最終的に認識できな5)文字が残った場合には
、その文字には認識できない文字であることを示すリジ
ェクトコードが付与される。
If there are still characters that cannot be used with KIJ Wi,
The operations of re-cutting the circumscribing frame to further separate it into a plurality of minute circumscribing frames and integrating the circumscribing frame with the subsequent circumscribing frame are executed. Note that, if an unrecognizable 5) character ultimately remains, a reject code is given to that character to indicate that it is an unrecognizable character.

その文字識別部(7)で生成された原稿の1ペ一ジ分の
文字コードは文字の位置や大きさを示す情報と共に所定
の記憶装置に記憶される。更に、認識結果が正しいかど
うかをオペレータが判定できる様に、その文字コードに
対応する文字のビデオ信号が陰極線管等の表示部(8)
に供給され、この表示部(8)の表示画面には原稿に対
応した形式で認識結果としての一部の文字が表示される
。この場合、認識できなかった文字の部分には高輝度の
矩形のブランクが表示される。従って、修正対象文字や
認識できない文字が存在する場合には、オペレータはワ
ードプロセッサと同じ要領でその部分に所望の文字を打
込むことができる。
The character code for one page of the document generated by the character identification section (7) is stored in a predetermined storage device along with information indicating the position and size of the character. Furthermore, the video signal of the character corresponding to the character code is displayed on a display unit (8) such as a cathode ray tube so that the operator can judge whether the recognition result is correct or not.
Some characters as the recognition result are displayed on the display screen of the display unit (8) in a format corresponding to the document. In this case, a high-intensity rectangular blank is displayed in the portion of the character that cannot be recognized. Therefore, if a character to be corrected or a character that cannot be recognized exists, the operator can input the desired character into that part in the same way as a word processor.

第24図例のように個々の文字が完全に分離されている
場合には「い」のような分離文字を除くと比較的文字の
識別確率は高いが、例えば新聞の記事の如く文字のピッ
チが短く投影によっては個々の文字を完全には分離でき
ないような文字列(以下、「連結文字ブロック−という
)には、文字を切り出すための特別な方法が必要になる
When the individual characters are completely separated as in the example in Figure 24, the probability of identifying the characters is relatively high except for separated characters such as ``i'', but the pitch of the characters, such as in a newspaper article, is For character strings that are so short that individual characters cannot be completely separated by projection (hereinafter referred to as a "concatenated character block"), a special method is required to cut out the characters.

従来そのような特別な方法としては、オペレータが文字
ピッチを設定してこの文字ピッチに合わせて文字を切り
出していく方法、文字の縦横比を略1と仮定して文字を
切りだして行く方法及び活字のI準的な大きさを予め与
えておく方法等が知られている。、丈だ、電子通信学会
論文誌’ 85/8. Vol。
Conventionally, such special methods include a method in which an operator sets a character pitch and cuts out characters according to this character pitch, a method in which characters are cut out assuming the character's aspect ratio is approximately 1, and A method is known in which a standard size of printed characters is given in advance. , Journal of the Institute of Electronics and Communication Engineers' 85/8. Vol.

J68−D、 No、 8. pp’、 1497−1
504 には、線形2乗誤差関数及び2個のパラメータ
を用いて文字ピッチ(文字ピッチが変化する場合をも含
む)を推定し、この推定された文字ピッチを用いて文字
を切り出す方′法が開示されている。尚、その文字ピッ
チが変化する場合は、英文の所謂バリアプルピッチの他
に和文においても組版時の所謂追込み又は追い出し操作
によって生じることがある。
J68-D, No. 8. pp', 1497-1
504, there is a method of estimating character pitch (including cases where the character pitch changes) using a linear squared error function and two parameters, and cutting out characters using this estimated character pitch. Disclosed. Incidentally, when the character pitch changes, it may occur not only due to so-called variable pitch in English text but also in Japanese text due to so-called fill-in or expulsion operation during typesetting.

[発胡が解決しようとする課題コ しかしながら、文字の縦横比等を予め設定しておく方法
ではその縦横比が異なる文字パターン(文字フォント)
ををする文字に対しては誤った切り圧しが行われたり、
誤った組合せの文字統合が行われたりする虞がある。具
体的に例えば文字の縦横比を全角文字用の1に設定する
と、新聞で使用されるような縦横比が0.76〜0.7
9の文字の正確な切り出しが困難になる。これに関して
、文字の縦横比等を予め設定するといっても、認識対象
とする文書の文字の縦横比をオペレータが正確に測定す
るのは困難である不都合もある。
[The problem that Hatsuko is trying to solve]However, the method of setting the character aspect ratio in advance does not allow for character patterns (character fonts) with different aspect ratios.
Incorrect cutting pressure may be applied to characters that use
There is a possibility that an incorrect combination of characters may be integrated. Specifically, for example, if the character aspect ratio is set to 1 for full-width characters, the aspect ratio used in newspapers will be 0.76 to 0.7.
It becomes difficult to accurately cut out the character 9. In this regard, even if the aspect ratio of the characters is set in advance, there is a disadvantage that it is difficult for the operator to accurately measure the aspect ratio of the characters of the document to be recognized.

また、所定のパラメータを用いて文字ピッチを推定する
方法ではオペレータの操作が煩雑になると共に、判定方
法及び処理内容が複雑である不都合がある。
Further, the method of estimating the character pitch using predetermined parameters has the disadvantage that the operator's operations are complicated and the determination method and processing contents are complicated.

また、従来は特に「い」及び「三」のような分離文字の
認識確率が低い不都合があった。
Furthermore, conventional methods have had the disadvantage that the probability of recognition of separated characters such as "i" and "san" is particularly low.

本発明は斯かる点に鑑み、文字認識装置における文字切
り出しの工程において先ず認識対象とする文書の文字の
大きさ等の形状を自動的に判別できるようにすることを
目的とする。
In view of the above, an object of the present invention is to enable automatic determination of the size and shape of characters of a document to be recognized in a character recognition process in a character recognition device.

また、本発明は、その判別した文字の形状を用いて連結
文字ブロックからでも正確に文字の切り出しができるよ
うにすることを目的とする。
Another object of the present invention is to make it possible to accurately cut out characters even from connected character blocks using the determined character shapes.

更に、本発明はその判別した文字の形状を用いて文字ピ
ッチに依存することなく正確に分離文字等の切り出しが
できるようにすることを目的とする。
A further object of the present invention is to use the determined character shape to accurately cut out separated characters, etc., without depending on the character pitch.

[課題を解決するための手段] 本発明による第1の文字切り出し方法は、例えば第3図
及び第4図に示す如く、複数の文字列を夫々列方向に投
影して個々の文字列幅Hを求め、上記複数の文字列中の
個々の入力文字を夫々列方向及び該列方向に直交する幅
方向に投影することにより個々の文字ブロック(13A
、 13B、 13C,・・・・)を求め、これら個々
の文字ブロックの列方向及び幅方向の長さw、hの内で
最も頻度の大きい長さを上記入力文字を代表する文字パ
ターン(15)の列方向及び幅方向の長さとみなし、上
記例々の文字列幅Hの分布の内で最も頻度の大きい文字
列幅を一辺として上記入力文字を代表する文字パターン
(15)に相似なパターンを基本文字枠(16)とし、
該基本文字枠(16)を単位として上記入力文字の切り
出しを行うようにしたものである。
[Means for Solving the Problems] A first character cutting method according to the present invention projects a plurality of character strings in the column direction and calculates the width H of each character string, as shown in FIGS. 3 and 4, for example. By projecting each input character in the plurality of character strings in the column direction and the width direction perpendicular to the column direction,
, 13B, 13C,...), and the most frequent length w and h in the column direction and width direction of these individual character blocks is determined as the character pattern (15 ) is regarded as the length in the column direction and width direction, and a pattern similar to the character pattern (15) representing the input characters above, with the character string width having the highest frequency among the distributions of the character string widths H as one side. Let be the basic character frame (16),
The input characters are cut out using the basic character frame (16) as a unit.

また、本発明による第2の文字切り出し方法は、例えば
第5図に示す如く、複数の文字列を夫々列方向に投影し
て個々の文字列幅を求め、上記複数の文字列中の個々の
入力文字を夫々列方向及び該列方向に直交する幅方向に
投影することにより個々の文字ブロックを求t、これら
個々の文字ブロックの列方向及び幅方向の長さの内で最
も頻度の大きい長さを上記入力文字を代表する文字パタ
ーン(17)の列方向及び幅方向の長さとみなし、例え
ば第18図に示す如く上記複数の文字列の認識対象とす
る文字列において、先頭の文字の立ち上がり部から上記
入力文字を代表する文字パターン(17)の列方向の長
さを中心として所定幅の領域にウィンドウ(21)を設
定し、該ウィンドウ内で上記認識対象とする文字列を幅
方向に投影して投影値(22)が最小となる上記列方向
の谷部位置1.、、。を求め、該谷部位置の投影値と上
記ウィンドウ内の他の投影値との勾配の最大値が所定値
を超えた場合には上記谷部位置で文字の切り出しを行う
と共に、該文字の切り出しを行った位置を基準として次
のウィンドウ(25)を設定し、上記谷部位置の投影値
と上記ウィンドウ内の他の投影値との勾配の最大値が上
記所定値以下である場合には上記谷部位置から更に上記
入力文字を代表する文字パターンの列方向の長さを中心
として所定幅の領域に新たなウィンドウを設定するよう
にしたものである。
Further, the second character cutting method according to the present invention, for example, as shown in FIG. Each character block is calculated by projecting the input characters in the column direction and the width direction orthogonal to the column direction, respectively, and the length that has the highest frequency among the lengths of these individual character blocks in the column direction and the width direction is calculated. The length is regarded as the length in the column direction and the width direction of the character pattern (17) representing the input characters, and for example, as shown in FIG. A window (21) is set in an area of a predetermined width centering on the length in the column direction of the character pattern (17) representing the input characters, and the character string to be recognized is displayed in the width direction within the window. Valley position 1 in the column direction where the projected value (22) is the minimum. ,,. is calculated, and if the maximum value of the gradient between the projection value at the valley position and other projection values in the window exceeds a predetermined value, the character is cut out at the valley position, and the character is cut out. The next window (25) is set based on the position where the above-mentioned trough position has been performed, and if the maximum value of the slope between the projection value at the valley position and the other projection values within the above-mentioned window is below the above-mentioned predetermined value, the above-mentioned A new window is set in an area of a predetermined width further from the trough position and centered on the length in the column direction of the character pattern representative of the input characters.

また、本発明による第3の文字切り出し方法は、例えば
第5図に示す如く、複数の文字列を夫々列方向に投影し
て個々の文字列幅を求め、上記複数の文字列中の個々の
入力文字を夫々列方向及び該列方向に直交する幅方向に
投影することにより個々の文字ブロックを求め、これら
個々の文字ブロックの列方向及び幅方向の長さの内で最
も頻度の大きい長さを上記入力文字を代表する文字パタ
ーン(17〉の列方向及び幅方向の長さとみなし、上記
例々の文字列幅の分布の内で最も頻度の大きい文字列幅
を一辺として上記入力文字を代表する文字パターン(1
7)に相似なパターンを基本文字枠(18)とし、例え
ば第12図及び第14図に示す如く、上記複数の文字列
の内のJ R対象とする文字列に属する先頭の文字ブロ
ック(19A)  を基準として上記基本文字枠(18
)の中に入る文字ブロックを統合して切り圧し、以下上
記切り出された文字ブロックの次の文字ブロックを基準
として上記基本文字枠(18)の中に入る文字ブロック
を統合して切り出していくようにしたものである。
Further, a third character cutting method according to the present invention, for example, as shown in FIG. Obtain individual character blocks by projecting the input characters in the column direction and the width direction perpendicular to the column direction, and calculate the most frequent length among the lengths of these individual character blocks in the column direction and width direction. is considered to be the length of the character pattern (17) in the column direction and width direction that represents the above input character, and the character string width with the highest frequency among the above examples of character string width distribution is taken as one side to represent the input character. character pattern (1
7) is used as the basic character frame (18), and as shown in FIGS. 12 and 14, the first character block (19A ) based on the basic character frame (18
), and then cut out the character blocks that fall within the basic character frame (18), using the next character block of the cut out character block as a reference. This is what I did.

また、本発明による第4の文字切り出し方法は、その第
3の文字切り出し方法において、上記複数の文字列が縦
書きの場合には、上記複数の文字列の内の認識対象とす
る文字列に属する文字ブロックを縦方向の座標を基準と
して順位付けするようにしたものである。
Further, in the fourth character extraction method according to the present invention, in the third character extraction method, when the plurality of character strings are written vertically, the character string to be recognized among the plurality of character strings is The character blocks to which they belong are ranked based on their vertical coordinates.

また、本発明による第5の文字切り出し方法はその第3
の文字切り出し方法において、上記複数の文字列が横書
きの場合には、上記複数の文字列の内の認識対象とする
文字列に属する文字ブロックを横方向の座標を基準とし
て順位付けするようにしたものである。
Further, the fifth character cutting method according to the present invention is the third
In the character extraction method, if the multiple character strings are written horizontally, the character blocks that belong to the character string to be recognized among the multiple character strings are ranked based on the horizontal coordinates. It is something.

[作用コ 斯かる第1の文字切り出し方法によれば、それら個々の
入力文字を囲む文字ブロックの縦方向及び横方向の長さ
の内で最も頻度の大きい長さが入力文字を代表する文字
パターン(15)の列方向及び幅方向の長さとみなされ
、それら個々の文字列幅Hの分布の内で最も頻度の大き
い文字列幅を一辺としてその入力文字を代表するパター
ン(15)に相似なパターンが基本文字枠(16)とさ
れる。
[Operation: According to the first character extraction method, the character pattern whose length is most frequent among the lengths in the vertical and horizontal directions of the character blocks surrounding each input character is representative of the input characters. A pattern similar to pattern (15), which is considered to be the length in the column direction and width direction of (15), and represents the input character with the most frequent character string width as one side in the distribution of each character string width H. is the basic character frame (16).

従って、オペレータが入力文字の形状を指定しなくとも
自動的に入力文字を代表する文字パターン(15)の形
状が判別される。この場合、最も頻度の大きい長さが採
用されているので、その入力文字の中に含まれる特殊な
文字(ルビ文字等)によりその入力文字の形状の判別が
左右されることがない。
Therefore, the shape of the character pattern (15) representing the input character is automatically determined without the operator specifying the shape of the input character. In this case, since the length with the highest frequency is adopted, the determination of the shape of the input character is not influenced by special characters (such as ruby characters) included in the input character.

更にその基本文字枠(16)を単位として上記入力文字
の切り8しを行うことにより、入力文字がどのような形
状であっても入力文字の切り出しを正確に行うことが出
来る。
Furthermore, by cutting the input character using the basic character frame (16) as a unit, the input character can be accurately cut out regardless of the shape of the input character.

また、斯かる第2の文字切り出し方法によれば、先頭の
文字の立ち上がり部からその入力文字を代表する文字パ
ターンの列方向の長さを中心として所定幅の領域にウィ
ンドウ(21)が設定され、このウィンドウ内でその認
識対象とする文字列を幅方向に投影して投影値(22)
が最小となるその列方向の谷部位置1 sinが求めら
れ、この谷部位置の投影値とそのウィンドウ内の他の投
影値との勾配の最大値が所定値を超えた場合にはその谷
部位置で文字の切り出しが行われる。この場合、一般に
連結文字ブロックであっても各文字の境界部は谷状に凹
むので、例えばその入力文字が連結文字ブロックを構成
していて個々の文字間の境界部の投影値が0にならない
場合であっても、その文字間の境界部の投影値が比較的
大きく凹む極小値となっている限り、その連結文字ブロ
ック内の文字を正確に切り出すことができる。
Further, according to the second character extraction method, a window (21) is set in an area of a predetermined width from the rising edge of the first character to the length of the character pattern representing the input character in the column direction. , project the character string to be recognized in this window in the width direction and calculate the projection value (22)
The valley position 1 sin in the column direction at which the minimum Characters are cut out at the copy position. In this case, even if it is a connected character block, the boundary between each character is generally concave in the shape of a valley, so for example, if the input characters form a connected character block, the projection value of the boundary between individual characters will not be 0. Even in such a case, as long as the projected value of the boundary between the characters is a minimum value with a relatively large depression, the characters in the connected character block can be accurately extracted.

また、斯かる第3の文字切り出し方法によれば、認識対
象とする文字列の中に分離文字が存在すると、その分離
文字の内の上位側の文字ブロックを基準としてその基本
文字枠(18)の中に入る文字ブロックが統合して切り
出されるので、その分離文字も正確に切り出される。こ
の場合、その基本文字枠(18)を基準として文字が切
り出されるので、入力文字のピッチが変化しても正確に
その分離文字の切り出しが行われる。
Further, according to the third character extraction method, when a separated character exists in a character string to be recognized, the basic character frame (18) is set based on the upper character block of the separated character. Since the character blocks inside are cut out together, the separated characters are also cut out accurately. In this case, since characters are cut out using the basic character frame (18) as a reference, even if the pitch of the input character changes, the separated characters can be cut out accurately.

また、斯かる第4の文字切り出し方法によれば、その入
力文字列が縦書きの場合にその縦方向の座標に沿って座
標値の小さい文字ブロックを基準としてその基本文字枠
に入る文字ブロックが統合して切り出される。
Further, according to the fourth character extraction method, when the input character string is written vertically, the character block that fits into the basic character frame is determined based on the character block with the smaller coordinate value along the vertical coordinate. It is integrated and cut out.

また、斯かる第5の文字切り出し方法によれば、その入
力文字列が横書きの場合にその横方向の座標に沿って座
標値の小さい文字ブロックを基準としてその基本文字枠
に入る文字ブロックが統合して切り出される。
Furthermore, according to the fifth character extraction method, when the input character string is written horizontally, the character blocks that fit into the basic character frame are integrated along the horizontal coordinates using the character block with the smaller coordinate value as a reference. and then cut out.

!実施例コ 以下、本発明の〜実施例につき第1図〜第21図を参照
して説明しよう。本例は印刷文書の文字列の中の各文字
を認識して文字コードを出力する文字認識装置で使用さ
れる文字切り出し方法に本発明を適用したものである。
! Embodiments Hereinafter, embodiments of the present invention will be explained with reference to FIGS. 1 to 21. In this example, the present invention is applied to a character extraction method used in a character recognition device that recognizes each character in a character string of a printed document and outputs a character code.

その文字認識装置の全体構成は従来の第22図例と同様
であるが、文字列切り出し部(2)及び文字切り出し5
(6)の動作が異なっている。以下、本例におけるそれ
ら切り出し部(2)及び(6)の動作につき説明する。
The overall configuration of the character recognition device is the same as the conventional example shown in FIG.
The operation of (6) is different. The operations of the cutout sections (2) and (6) in this example will be explained below.

本例では入力文字の縦横比を自動的に求めることができ
るが、最初に認識対象とする文字列が横書きである場合
について、この縦横比を求めるときの文字切り出し部等
の動作につき説明する。
In this example, the aspect ratio of the input character can be automatically determined, but first, the operation of the character cutting section and the like when determining the aspect ratio will be explained in the case where the character string to be recognized is written horizontally.

第1図Aの英文はその横書きの複数の文字列(正確には
口文字行」である)の例を示し、この文字列を列方向(
X方向)に投影してy投影YPを得た後に、このy投影
YPを閾値TH3で2値化して各文字列の文字列高さH
(X方向に垂直なX方向の幅)を求める。各文字を数十
ドツトX数十ドツトに分解してそのy投影YPの分解能
を1ドツトとすると、その閾値TH3は例えばその分解
能である1に設定する。そして、その文字列高さHが1
になる部分はノイズであるとして無視すると、その文字
列高さHが2以上の部分が夫々文字列として検出された
ことになる。この検出された各文字列を第1図已に示す
如くX方向に投影してX投影XPを求める。
The English text in Figure 1A shows an example of multiple character strings written horizontally (more precisely, ``mouth character lines''), and this character string is written in the column direction (
After projecting in the X direction) to obtain the y projection YP, this y projection YP is binarized with a threshold value TH3 to obtain the character string height H
(Width in the X direction perpendicular to the X direction) is determined. If each character is decomposed into several tens of dots x several tens of dots and the resolution of the y projection YP is one dot, the threshold TH3 is set to, for example, 1, which is the resolution. And the character string height H is 1
If we ignore the portions where the character string height H is 2 or more, each portion is detected as a character string. Each detected character string is projected in the X direction as shown in FIG. 1 to obtain the X projection XP.

第2図は横書きの和文の1個の文字列のX投影XPの拡
大図を示し、この第2図において、1個の文字「手」の
X投影XPが所定の閾値を超える領域の長さを横方向(
X方向)の長さWとして、他の個々の文字についても横
方向の長さを求める。
Figure 2 shows an enlarged view of the X projection XP of one character string in horizontally written Japanese text. horizontally (
As the length W (in the X direction), the horizontal lengths of other individual characters are also determined.

また、その文字「手」をX方向に投影してこの投影が所
定の閾値を超える領域の長さを縦方向(X方向)の長さ
hとして、他の個々の文字についても夫々縦方向の長さ
を求める。その高さhx幅Wの矩形のブロック(13)
をその文字の文字ブロックと称する。
In addition, the length of the area where the character "hand" is projected in the X direction and this projection exceeds a predetermined threshold is defined as the length h in the vertical direction (X direction), and the length of the other individual characters in the vertical direction is also Find the length. Rectangular block (13) with height h x width W
is called the character block of that character.

第3図Aは和文の文字列高さHの文字列ARiより文字
ブロック(13A)、 (13B)、 (13C)、 
(130)、・・・・を抽出した結果を示し、第3図B
は英文の文字列高さH′の文字列ARjより文字ブロッ
ク(14A)。
Figure 3A shows character blocks (13A), (13B), (13C),
Figure 3B shows the results of extracting (130),...
is a character block (14A) from the character string ARj of English character string height H'.

(14日)、 (14C)、 (140)、・・・・を
抽出した結果を示す。
The results of extracting (14th), (14C), (140), etc. are shown.

第3図Aにおいては、分離文字である・判」、「い」等
は夫々複数の文字ブロックに分解されている。本例では
先ずその文字列高さHの分布の統計をとる。具体的には
、その高さHの範囲を2〜9、10−19.20〜29
.・・・・にグループ分けして、各グループの度数及び
各グループ内の平均値を求める。
In FIG. 3A, separate characters such as "・" and "i" are each separated into a plurality of character blocks. In this example, first, statistics on the distribution of the character string height H are taken. Specifically, the height H ranges from 2 to 9, 10-19.20 to 29
.. ..., and calculate the frequency of each group and the average value within each group.

これはその文字列高さHのヒストグラムを作成するのと
同じである。そして、最も度数の大きい最頻部の平均値
HBを求める。第4図に示す如く、その最頻部の平均値
HBが最も出現頻度の高い文字列の高さになる。
This is the same as creating a histogram of the character string height H. Then, the average value HB of the most frequent part with the highest frequency is determined. As shown in FIG. 4, the average value HB of the most frequent part becomes the height of the character string that appears most frequently.

各文字ブロックの縦横比はh / wで表されるが、本
例では切り出した全ての文字ブロックの内で縦横比が 0.75≦h / w≦1. 25   ・・・・(1
)を充足する文字ブロックだけを選び出して、これら選
び出した文字ブロックの縦方向の長さ(高さ)h及び横
方向の長さ(幅)Wの分布の統計をとる。
The aspect ratio of each character block is expressed as h/w, but in this example, the aspect ratio of all cut out character blocks is 0.75≦h/w≦1. 25...(1
), and the distribution of the vertical length (height) h and the horizontal length (width) W of these selected character blocks is taken.

これは縦横比が1の全角文字の文字ブロックに略相似す
る文字ブロックを有する文字について分布を調べること
を意味し、縦横比が0.5≦h/w≦0.7の範囲にあ
る半角文字等を除外することを意味する。従って、例え
ば高さ及び幅が夫々全角文字の高さ及び幅の1/2のル
ビ文字(2分ルビ)及び3分ルビ等についても、式(1
)を充足する限り統計の対象となる。具体的には、縦方
向の長さh及び横方向の長さWを夫々θ〜9.10〜1
9.20〜29.・・・・にグループ分けして各グルー
プの度数及び平均値を調べ、長さh及びWについて夫々
度数の最も大きい最頻のグループの平均値hb及びwb
求める。
This means examining the distribution of characters that have character blocks that are approximately similar to character blocks of full-width characters with an aspect ratio of 1, and half-width characters whose aspect ratio is in the range of 0.5≦h/w≦0.7. It means to exclude such things. Therefore, for example, for ruby characters whose height and width are half the height and width of full-width characters (half-width ruby) and three-minute ruby, etc., the formula (1
) are subject to statistics as long as they satisfy the following criteria. Specifically, the length h in the vertical direction and the length W in the horizontal direction are respectively θ~9.10~1
9.20-29. ..., and check the frequency and average value of each group, and calculate the average values hb and wb of the most frequent group with the largest frequency for lengths h and W, respectively.
demand.

但し、入力文書が英文のように半角文字が主体である文
書の場合には、その統計をとる縦横比の範囲は半角文字
等を中心にすることがある。
However, if the input document is a document mainly composed of half-width characters, such as English, the range of aspect ratios for which statistics are taken may center on half-width characters.

第4図に示す如く本例では、それら平均値hb及びwb
を夫々入力文字のパターン(入力フォント)の平均枠(
15)の縦方向の長さ及び横方向の長さとする。そして
、文字列高さが最頻部の平均値であるHBの文字列から
その入力フォントの平均枠(15)に相似な領域を切り
出して得られるブロックを基本文字枠(16)とする。
As shown in FIG. 4, in this example, the average values hb and wb
is the average frame of the input character pattern (input font) (
15) length in the vertical direction and length in the horizontal direction. Then, a block obtained by cutting out an area similar to the average frame (15) of the input font from the HB character string whose character string height is the average value of the most frequent part is defined as a basic character frame (16).

即ち、その基本文字枠(16)の横方向の長さをWBと
すると、このWBは次式より求めることができる。
That is, assuming that the horizontal length of the basic character frame (16) is WB, this WB can be obtained from the following equation.

WB=HB−wb/h b    −・・・(2)これ
ら入力フォントの平均枠(15)及び基本文字枠(16
)は後述のように連結文字ブロックの切り出し等に利用
される。これら基本文字枠等は入力文字に応じて自動的
に設定されるので、入力文書の文字の大きさ等に依存す
ることなく常に最適な文字の切り出しを行うことができ
る。この場合、般にルビ文字(例えば2分ルビ)は全角
文字等の被ルビ文字に対して縦方向及び横方向の長さが
夫々1/2なので、そのルビ文字の基本文字枠としては
高さ及び幅が夫々被ルビ文字の基本文字枠(16)の1
/2である枠を用いる。
WB=HB-wb/h b - (2) Average frame (15) and basic character frame (16) of these input fonts
) is used to cut out connected character blocks, etc., as described later. Since these basic character frames and the like are automatically set according to the input characters, it is possible to always perform optimal character extraction without depending on the character size of the input document. In this case, ruby characters (for example, half-ruby) are generally 1/2 the vertical and horizontal lengths of ruby-covered characters such as full-width characters, so the basic character frame for that ruby character should be the height. and width is 1 of the basic character frame (16) of ruby characters respectively.
/2 is used.

一方、入力文書が第5図に示す如く縦書きの場合には、
各文字列の幅Wについて度数分布の統計をとることによ
り最頻部の平均値WBが得られる。
On the other hand, if the input document is written vertically as shown in Figure 5,
By taking statistics on the frequency distribution for the width W of each character string, the average value WB of the most frequent part can be obtained.

そして、個々の文字ブロックについて式(1)の条件の
下でそれら文字ブロックの縦方向及び横方向の長さり、
Wの統計をとり、最頻部の平均値の長さhb及びwbを
得る。この縦書きの場合の入力フォントの平均枠は(1
7)となり、その文字列幅の最頻部の平均値WBを一辺
の長さとしてその入力フォントの平均枠(17)に相似
するブロックが基本文字枠(18)となる。この基本文
字枠(18)の高さHBは次式により求することができ
る。
Then, the lengths of each character block in the vertical and horizontal directions under the condition of formula (1),
Statistics on W are taken to obtain the lengths hb and wb of the average value of the most frequent part. The average frame of the input font in this case of vertical writing is (1
7), and a block similar to the average frame (17) of the input font with the average value WB of the most frequent part of the character string width as the length of one side becomes the basic character frame (18). The height HB of this basic character frame (18) can be determined by the following formula.

HB=WB−h b/wb   ・・・・(3)上述の
ように本例によれば個々の文字ブロックの縦方向及び横
方向の長さり、wの統計をとり、最頻部の平均値の長さ
を夫々入力フォントの平均枠の縦方向及び横方向の長さ
としているので、ルビ文字及び分離文字の部分のパター
ン等に影響されることなく、入力文字の通常の入力フォ
ントの大きさを正確に検出できる利益がある。この場合
、オペレータが外部よりパラメータを設定する必要がな
いので、オペレータの負担が軽減されている。
HB=WB-h b/wb (3) As mentioned above, according to this example, statistics are taken on the vertical and horizontal lengths of each character block, w, and the average value of the most frequent part is calculated. Since the length of is set to the vertical and horizontal length of the average frame of the input font, the size of the input character is the same as the normal input font size without being affected by the patterns of ruby characters and separated characters. There is an advantage in being able to accurately detect In this case, there is no need for the operator to set parameters from outside, so the burden on the operator is reduced.

入力文書が新聞の杜説く縦書き)である場合に実際に度
数分布の統計をとった結果について説明するに、第6図
は全文字列の幅Wの度数分布を示し、第7図及び第8図
は夫々個々の文字ブロックの幅W及び高さhの度数分布
を示す。第6図より文字列幅Wの最頻部(40≦W≦4
9)の平均値は47であるため、基本文字枠(18) 
(第5図参照)の幅WBは47となる。また、第7図及
び第8図より文字ブロックの幅Wの最頻部(40≦W≦
49)の平均値は43であり、高さhの最頻部(30≦
h≦39)の平均値は33であるため、入力フォントの
平均枠(17)の幅wb及び高さhbは夫々43及び3
3になる。
To explain the results of actually taking statistics on the frequency distribution when the input document is vertical writing, Figure 6 shows the frequency distribution of the width W of all character strings, and Figure 7 and Figure 8 shows the frequency distribution of the width W and height h of each individual character block. From Figure 6, the most frequent part of the character string width W (40≦W≦4
9) is 47, so the basic character frame (18)
(See FIG. 5) has a width WB of 47. Also, from FIG. 7 and FIG. 8, the most frequent part of the width W of the character block (40≦W≦
The average value of 49) is 43, and the most frequent part of height h (30≦
Since the average value of h≦39) is 33, the width wb and height hb of the average frame (17) of the input font are 43 and 3, respectively.
It becomes 3.

従って、縦横比hb/wbは0.7674となり、式(
3)より基本文字枠(18)の高さHBは HB =47・33/43 =36 となる。
Therefore, the aspect ratio hb/wb is 0.7674, and the formula (
From 3), the height HB of the basic character frame (18) is HB = 47·33/43 = 36.

また、入力文書が新平家物語(縦書き)である場合に実
際に度数分布の統計をとった結果について説明するに、
第9図は全文字列の幅Wの度数分布を示し、第10図及
び第11図は夫々個々の文字ブロックの幅W及び高さh
の度数分布を示す。第9図より文字列幅Wの最頻部の平
均値は41であり、第10図及び第11図より文字ブロ
ックの幅Wの最頻部の平均値は35且つ高さhの最頻部
の平均値は35である。従って、入力フォントの平均枠
及び基本文字枠の縦横比は1となる。
Also, to explain the results of actually calculating frequency distribution statistics when the input document is Shinheike Monogatari (vertical writing),
Figure 9 shows the frequency distribution of the width W of all character strings, and Figures 10 and 11 show the width W and height h of individual character blocks, respectively.
shows the frequency distribution of From Figure 9, the average value of the most frequent part of the character string width W is 41, and from Figures 10 and 11, the average value of the most frequent part of the character block width W is 35, and the most frequent part of the height h. The average value of is 35. Therefore, the aspect ratio of the average frame and basic character frame of the input font is 1.

次に、上述の基本文字枠を用いて文字を切り出す方法の
一例につき第12図〜第17図を参照して説明する。本
例は入力文字の文字ピ・ソチは必ずしも一定ではないが
基本的な文字枠は一定であるとして、分離文字であれば
分離している各文字ブロックを統合して文字を切り出し
ていく方法である。
Next, an example of a method for cutting out characters using the basic character frame described above will be described with reference to FIGS. 12 to 17. In this example, the characters of the input characters are not necessarily constant, but the basic character frame is constant, and if it is a separated character, the method is to cut out the character by integrating each separated character block. be.

第12図は切り出し対象とする縦書きの入力文字の文字
ブロックの例を示し、この第12図において、(19A
)、 (19B)、・・・・は全角文字等の被ルビ文字
の文字ブロック、(27)はルビ文字の文字ブロックで
ある。これらの文字ブロックの横方向の長さW及び縦方
向の長さhの度数分布の最頻部の平均値及び各文字列の
幅の最頻部の平均値を用いて、第5図に示す基本文字枠
(18)の高さHB及び幅WBが得られる。また、被ル
ビ文字のブロックとルビ文字のブロックとは横方向(X
方向)の位置により区別できるので、ルビ文字について
はルビ文字用の基本文字枠を用いて別途切り出しを行う
FIG. 12 shows an example of a character block of vertically written input characters to be cut out, and in this FIG. 12, (19A
), (19B), . . . are character blocks of ruby characters such as full-width characters, and (27) is a character block of ruby characters. Using the average value of the most frequent part of the frequency distribution of the horizontal length W and vertical length h of these character blocks and the average value of the most frequent part of the width of each character string, the results shown in Figure 5 are calculated. The height HB and width WB of the basic character frame (18) are obtained. Also, blocks of ruby characters and blocks of ruby characters are separated in the horizontal direction (X
Since ruby characters can be distinguished by their position (direction), ruby characters are separately extracted using a basic character frame for ruby characters.

その切り出し対象とする文字列の被ルビ文字の文字ブロ
ックを列方向、即ち縦方向(X方向)にそのy座標の値
が小さい順に順位付けする。第12回倒の文字ブロック
の順序は(19A)、 (19B)、 (19C)。
The character blocks of ruby characters in the character string to be extracted are ranked in the column direction, that is, in the vertical direction (X direction) in descending order of the value of their y coordinate. The order of the letter blocks in the 12th round is (19A), (19B), (19C).

(190)、・・・・となる。そして、それら文字ブロ
ックの内で横方向(X方向)の座標が最も小さい文字ブ
ロックの右辺のX方向の座標を基準点x0 とする。
(190), etc. Then, the X-direction coordinate of the right side of the character block with the smallest horizontal (X-direction) coordinate among these character blocks is set as the reference point x0.

第13図のフローチャートを参照して文字ブロックの統
合手順につき説明するに、先ずステップ(101)  
においてy座標が’11sである1番目の文字ブロック
b、を文字統合用の文字バッファに登録する。この文字
バッファとは第22図の装置中の文字切り出し部(6)
に付加されるメモリであり、この文字バッファに登録す
ることはその文字ブロックb、の内部のドツトパターン
をそのメモリに書き込むことを意味する。その後ステッ
プ(102)  で第14図に示す如く、その文字ブロ
ックb1 の上辺に基本文字枠(18)の上辺を一致さ
せ、その基本文字枠(18)の左辺を基準点X。に一致
させた後に、(i+1)番目の文字ブロックを切り出し
対象にするため、ステップ(103)  でその(i二
1)をjと置く。
To explain the character block integration procedure with reference to the flowchart in FIG. 13, first, step (101)
The first character block b whose y coordinate is '11s' is registered in the character buffer for character integration. This character buffer is the character extraction unit (6) in the device shown in Figure 22.
This is a memory added to the character block b, and registering it in this character buffer means writing the dot pattern inside the character block b into that memory. Thereafter, in step (102), as shown in FIG. 14, the upper side of the basic character frame (18) is made to match the upper side of the character block b1, and the left side of the basic character frame (18) is set as the reference point X. After matching, in order to make the (i+1)th character block the target of extraction, in step (103), set (i21) as j.

そして、その文字ブロックbjの上辺のyWllllで
あるyJs等の4頂点の座標データを取り込み(ステッ
プ(104) ) 、そのブロックbJがその基本文字
枠(18)の中に一部でも入っているかどうかを調べる
(ステップ(105) )  その基本文字枠(18)
の下辺のy座標は(yi−+HB)であるので、次の式
(4)が成立すればその文字ブロックb、はその基本ブ
ロック(18)に一部でも入っていることになる。
Then, the coordinate data of the four vertices such as yJs, which is yWllll on the upper side of the character block bj, is imported (step (104)), and it is checked whether the block bJ is even partially contained within the basic character frame (18). (Step (105)) Its basic character frame (18)
Since the y-coordinate of the lower side of is (yi-+HB), if the following equation (4) holds true, then the character block b is included even partially in the basic block (18).

yJs<y、+HB   ・・・・(4)この式(4)
が成立しないときは、その文字ブロックb、はその最初
の文字ブロックb、とは異なる文字に属すると判断して
、文字切り出し部の動作はステップ(107)  に進
んでその文字バッファにそれまでに登録されているデー
タが文字識別部(第22図の(7))に渡され、この文
字識別部でノ々ターンマツチング等により文字の識別が
行われる(ステップ(108) ) その式(4)が成立するときにはステ・ンプ(106)
に進み、文字ブロックbエ と文字ブロックb、とがX
方向に隣接すると共に両ブロックのX方向の間隔ΔWが
その基本文字枠(18)の幅WBの1/2未満であるか
どうかが調べられる。即ち、0≦Δw < W B /
 2    ・・・・(5)が成立するときには、第1
4図に示す如くそれら文字ブロックb、及びす、は夫々
成る共通の分離文字の構成要素であると考えられるので
、ステップ(110)  に移行してその文字ブロック
b、を文字ノ<ッファに登録した後に、更に(j+1)
番目の文字ブロックの統合を行うかどうかを判断するた
め、変数」の値を1だけ増分させてから(ステップ(1
11))、再びステップ(104)に戻って文字ブロッ
クb、のデータを取り込む。
yJs<y, +HB...(4) This formula (4)
If this does not hold, it is determined that the character block b belongs to a different character from the first character block b, and the operation of the character segmentation unit proceeds to step (107) to store all characters in the character buffer up to that point. The registered data is passed to the character recognition section ((7) in Figure 22), and this character recognition section identifies the characters by non-turn matching, etc. (step (108)). ) holds, step (106)
Proceed to character block b and character block b, and
It is checked whether the blocks are adjacent in the direction and the interval ΔW in the X direction between the two blocks is less than 1/2 of the width WB of the basic character frame (18). That is, 0≦Δw<W B /
2...When (5) holds, the first
As shown in Figure 4, the character blocks b, and , are considered to be constituent elements of a common separate character, so the process moves to step (110) and the character block b is registered in the character buffer. After that, further (j+1)
To determine whether to merge the th character block, increment the value of the variable by 1 (step (1
11)), the process returns to step (104) again and the data of character block b is fetched.

また、式(5)が成立しないときにはステ、ノブ(10
9)に移行して、第15図に示すようにそれら文字ブロ
ックb1  とす、とがX方向に隣接して且つその下側
の文字ブロックb、が完全に基本文字枠(18)に含ま
れているかどうかを調べる。その文字ブロックb、の下
辺のy座標を’lteとすると、文字ブロックb1  
とす、とがX方向に隣接して且つその下側の文字ブロッ
クbjが完全に基本文字枠(18)に含まれているとい
う条件は次の式で表現することができる。
In addition, if the formula (5) does not hold, the stem, knob (10
9), as shown in Fig. 15, the character blocks b1 and b, which are adjacent to each other in the X direction and the character block b below them, are completely included in the basic character frame (18). Find out if it is. If the y-coordinate of the lower side of the character block b is 'lte, then the character block b1
The condition that and and are adjacent in the X direction and that the character block bj below them is completely included in the basic character frame (18) can be expressed by the following equation.

y0≦yJs  且つ y4.≦y、、+HB・・・・
(6) そして、式(6)が成立するときには両文字ブロックb
、及びす、は共通の分離文字の構成要素であると判断し
てステップ(110)  に移行してその文字ブロック
bj を文字バッファに登録し、その式(6)が成立し
ないときには更にステップ(112)に移行する。
y0≦yJs and y4. ≦y,, +HB...
(6) Then, when formula (6) holds true, both character blocks b
It is determined that , and are components of a common separated character, and the process moves to step (110) to register that character block bj in the character buffer.If the equation (6) does not hold, then step (112) is performed. ).

このステップ(112)  においては、第16図に示
す如く下側の文字ブロックbJ は基本文字枠(18)
と一部が重なった状態で存在する。この場合、本例では
その文字ブロックb、と基本文字枠(18)との重なり
面積mを求杓、この重なり面積mがその文字ブロックb
、の面積の1/2よりも大きいかどうかを調べる(ステ
ップ(113))。この重なり面積mがその文字ブロッ
クb、の面積の1/2よりも大きいときには、その文字
ブロックb」がその基本文字枠(18)の最初の文字ブ
ロックb1  と共に共通の分離文字を構成する確率が
高いと判断して、更にステップ(114)  に移行し
てその文字ブロックbj とその次の文字ブロックbk
 (−に=J+1)とのX方向の間隔Δhを求める。
In this step (112), as shown in Fig. 16, the lower character block bJ is a basic character frame (18).
It exists in a partially overlapping state. In this case, in this example, the overlapping area m between the character block b and the basic character frame (18) is calculated, and this overlapping area m is the character block b.
, is larger than 1/2 of the area of (step (113)). When this overlapping area m is larger than 1/2 of the area of the character block b, there is a probability that the character block b'' forms a common separated character with the first character block b1 of its basic character frame (18). It is judged that the character block bj and the next character block bk are determined to be high, and the process moves to step (114).
(−=J+1) and the distance Δh in the X direction is determined.

また、その文字ブロックbj の高さをhj として、
本例ではその高さり、及び間隔Δhが次の式を充足する
かどうかを調べる(ステップ(115))。
Also, let the height of the character block bj be hj,
In this example, it is checked whether the height and the interval Δh satisfy the following expression (step (115)).

h、<HB/4  且つ Δh<HB/3・・・・(7
) そして、式(7)が成立するときには、ブロックbt 
とbj とは共通の分離文字を構成すると判断してその
文字ブロックb、を文字バッファに登録してから(ステ
ップ(116))、次の文字ブロックのデータを取り込
むためにステップ(117)  でJの値を1だけ増分
した後に再びステップ(104)に戻る。
h, < HB/4 and Δh < HB/3 (7
) Then, when equation (7) holds true, block bt
It is determined that bj and bj constitute a common separation character, and the character block b is registered in the character buffer (step (116)). In order to import the data of the next character block, J is entered in step (117). After incrementing the value by 1, the process returns to step (104).

一方、式(7)が成立しないとき及びステップ(113
)で重なり面積mが小さいときには、本例の文字切り出
し部はその下側の文字ブロックb、はその基本文字枠(
18)には属さないと判断して、ステップ(117)を
介してステップ(104)に戻る。この場合には、ステ
ップ(105)で式(4)が成立しないので、動作はス
テップ(107)  に移行して文字ブロックb、まで
の文字バッファのデータが文字識別部に供給される。
On the other hand, when equation (7) does not hold and step (113
) and the overlapping area m is small, the character cutting part in this example is the lower character block b, and the basic character frame (
18), and returns to step (104) via step (117). In this case, since equation (4) does not hold in step (105), the operation moves to step (107) and data in the character buffer up to character block b is supplied to the character identification section.

切り出し対象とする分離文字が例えば4個の文字ブロッ
クより構成される場合には、先頭の文字ブロックbI 
 に続いて3個の文字ブロックがその文字バッファに登
録され、この登録後の文字バッファの内容が文字識別部
に渡される。その後、切り出された直後の文字ブロック
を新たな先頭の文字ブロックとして第13図の文字統合
が適用される。
If the separated character to be extracted is composed of, for example, four character blocks, the first character block bI
Subsequently, three character blocks are registered in the character buffer, and the contents of the character buffer after registration are passed to the character identification unit. Thereafter, the character integration shown in FIG. 13 is applied with the character block immediately after being cut out as the new leading character block.

上述のように本例によれば、先頭の文字ブロックを基準
として基本文字枠に入るか又は所定量以上型なる文字ブ
ロックを統合するようにしているので、文字ピッチが変
動するような場合でも簡単なアルゴリズムで正確に分離
文字の切り出しを行うことができる利益がある。
As mentioned above, according to this example, character blocks that fit into the basic character frame or have a predetermined amount or more are integrated based on the first character block, so even if the character pitch fluctuates, it can be easily handled. This method has the advantage of being able to accurately extract separated characters using a sophisticated algorithm.

尚、上述実施例のステップ(114)及び(115)で
は式(7)を用いて文字ブロックb、がその基本文字枠
に属するかどうかを判定しているが、その他に例えば第
16図に示すように上側の文字ブロックb1とその文字
ブロックb、とのX方向の間隔Δqを求め、この間隔Δ
qが間隔Δhよりも小さいときにその文字ブロックb、
がその基本文字枠に属すると判定する方法もある。
In addition, in steps (114) and (115) of the above embodiment, it is determined whether character block b belongs to the basic character frame using equation (7), but in addition, for example, as shown in FIG. Find the interval Δq in the X direction between the upper character block b1 and its character block b, and calculate this interval Δ
When q is smaller than the interval Δh, the character block b,
There is also a method to determine that belongs to the basic character frame.

また、切り出し対象とする文字列が第17図に示す如く
横書きである場合には、個々の文字より文字ブロック(
2OA)、 (20B)、・・・・を抽出した後にこれ
ら文字ブロックを横方向(X方向)に座標値の小さい順
序で順位付けする。第17図例の文字ブロックの順序は
(2OA)、 (20B)、 (20C)、 (200
)、・・・・となる。
Furthermore, if the character string to be extracted is horizontally written as shown in Figure 17, character blocks (
After extracting 2OA), (20B), . . . , these character blocks are ranked in the horizontal direction (X direction) in descending order of coordinate values. The order of the character blocks in the example in Figure 17 is (2OA), (20B), (20C), (200
), etc.

そして、先頭の文字ブロック(2OA)  より基本文
字枠を用いて文字の切り出しを行う。
Then, characters are extracted from the first character block (2OA) using the basic character frame.

次に上述の統計的に求めた入力フォントの平均枠(例え
ば第5図の平均枠(17) )を用いて連結文字ブロッ
クより文字を切り出していくときの文字切り出し部の動
作につき説明する。連結文字ブロックでは文字同士の境
界部の投影値が0にならないので、このような場合の文
字の切り出しを強制切り出しと呼ぶ。
Next, the operation of the character cutting section when cutting out characters from a connected character block using the above-mentioned statistically determined average frame of the input font (for example, the average frame (17) in FIG. 5) will be explained. In a connected character block, the projection value at the boundary between characters does not become 0, so character extraction in such a case is called forced extraction.

第18図は強制切り出しの対象とする縦書きの文字列の
例を示し、この文字列の列方向にドツト単位で座標1を
設定する。この場合、先頭の文字のパターンの内で最も
高い位置にあるドツトの座標lの値を0 (始点)とす
る。また、予め個々の文字をX方向及びX方向に投影し
て式(1)の縦横比の条件を充足する文字ブロックの高
さh及び幅Wの度数分布を求め、最頻部の平均値より入
力フォントの平均枠の高さbb及び幅wbを求めておく
FIG. 18 shows an example of a vertically written character string to be subjected to forced extraction, and coordinates 1 are set in units of dots in the column direction of this character string. In this case, the value of the coordinate l of the dot at the highest position in the first character pattern is set to 0 (starting point). In addition, the frequency distribution of the height h and width W of a character block that satisfies the aspect ratio condition of formula (1) is calculated by projecting each character in the The average frame height bb and width wb of the input font are determined in advance.

その式(1)よりその入力フォントは全角文字の入力フ
ォントと考える二とができる。
From equation (1), the input font can be considered as an input font of double-byte characters.

本例では、その入力フォントの平均枠の高さhbを強制
切り出しパラメータCとする。但し、切り出し対象とす
る文字列が横書きであるときには、その強制切り出しパ
ラメータCはその平均枠の幅wbとする。即ち、縦書き
のときには c=h b    ・・・・(8) が成立し、横書きのときには c=wb    ・・・・(9) が成立する。
In this example, the average frame height hb of the input font is set as the forced extraction parameter C. However, when the character string to be cut out is written horizontally, the forced cutout parameter C is set to the average width wb of the frame. That is, in vertical writing, c=h b (8) holds true, and in horizontal writing, c=wb (9) holds true.

入力文字列が縦書きの場合には、その文字列を横方向(
X方向)に投影して得られたy投影YPが0を含まずに
1.50を超えて連続する部分は連結文字ブロックであ
ると判断して、強制切り出しアルゴリズムを適用する。
If the input string is written vertically, the string is written horizontally (
A continuous portion in which the y projection YP obtained by projecting in the X direction) exceeds 1.50 without including 0 is determined to be a connected character block, and a forced extraction algorithm is applied.

第19図の強制切り出しの手順を示すフローチャートを
参照して第18図の連結文字ブロックより文字を切り出
すときの文字切り出し部の動作につき説明するに、第1
8図例ではc=hb=34であるとする。
The operation of the character cutting section when cutting out characters from the connected character block in FIG. 18 will be explained with reference to the flowchart showing the forced cutting procedure in FIG. 19.
In the example shown in FIG. 8, it is assumed that c=hb=34.

先ず第19図のステップ(11B)  において、中央
変数midの値として強制切り出しパラメータCの値を
そのまま代入した後に、ステップ(119)  にて半
値幅w(=10)を用いて下限変数midm及び上限変
数m1dpの値を次のように設定する。
First, in step (11B) of FIG. 19, the value of the forced extraction parameter C is directly substituted as the value of the central variable mid, and then in step (119), the lower limit variable midm and the upper limit are set using the half width w (=10). The value of the variable m1dp is set as follows.

midm = m i d −W    ・・・・(1
0)midp = m i d +W    ・−・・
(ll)その下限変数midmで定まる座標と上限変数
m1dpで定まる座標との中間部である幅20の領域が
最初のウィンドウ(21)となる。そして、座標iの関
数としてその文字列の横方向へのy投影であるYP(1
)を求め(ステップ(120)Lそのウィンドウ(21
)の中でそのYP(i)(第18図のヒストグラム(2
2))が最小となるときのiの値1111!lを求める
(ステップ(121))。y投影が最小となる1の値が
複数存在するときには例えば最も大きい値を採用する。
midm = mid - W (1
0) midp = mid + W ・−・・
(ll) An area with a width of 20, which is the intermediate part between the coordinates determined by the lower limit variable midm and the coordinates determined by the upper limit variable m1dp, becomes the first window (21). Then, YP(1
) (step (120) L that window (21
), its YP(i) (histogram (2
2)) is the minimum value of i, 1111! Find l (step (121)). When there are multiple values of 1 that give the minimum y projection, the largest value is adopted, for example.

そして、ステップ(122)  で1が1.1、のとき
のy投影であるY P (1sin )  が閾値TH
Vよりも小さいかどうかを調べる。そのy投影がその閾
値THy以上であるときには、文字切り出し部の動作は
ステップ(123)  に移行してその結果に対応する
処理が施される。具体的には後述のステップ(131)
  に移行して半角切り出しの可否を検討するか、又は
一応その11RI11 の位置で文字を切り出して文字
認識部に渡して文字認識ができるかどうか試す等の処理
が施される。
Then, in step (122), Y P (1 sin ), which is the y projection when 1 is 1.1, becomes the threshold TH
Check whether it is smaller than V. When the y projection is equal to or greater than the threshold value THy, the operation of the character cutting section moves to step (123), and processing corresponding to the result is performed. Specifically, step (131) described below
Processing is performed, such as moving to 11 and examining whether half-width extraction is possible, or cutting out a character at the 11RI11 position and passing it to the character recognition unit to see if it can be recognized.

そのYP (i、th)が閾値THyよりも小さいとき
には、更にステップ(124)  にてそのウィンドウ
(21)内でそのl +alh を中心としてそのYP
(i)の負の勾配の絶対値の最大値Δmが測定される。
When the YP (i, th) is smaller than the threshold THy, in step (124), the YP is determined within the window (21) with the center l + alh.
The maximum absolute value Δm of the negative slope of (i) is measured.

即ち、成る変数δを用いてその最大値Δmは次式%式% それと共に、ステップ−(125)にてそのウィンドウ
(21)内でそのl +alhを中心としてそのYP(
i)の正の勾配の最大値Δpが測定される。即ち、変数
δを用いてその最大値Δpは次式で表される。
That is, using the variable δ, its maximum value Δm is determined by the following formula % Formula % At the same time, in step -(125), within the window (21), the YP(
The maximum value Δp of the positive slope of i) is measured. That is, using the variable δ, its maximum value Δp is expressed by the following equation.

lai、、<l  ≦ l +aln+δ      
・・・・(13)第18図例のヒストグラム(22)に
おいて、直線(23)の負の勾配の絶対値が6mに対応
し、直線(24)の正の勾配が△pに対応する。そして
ステップ(126)において、それら最大値Δm及び△
pが共に闇値THOより大きいかどうかが調べられ、そ
れら最大値が共にその闇値THOより大きいときにはス
テップ(127)  にて強制切り出しが行われる。強
制切り出しとは、座標lの値が1 +a1..の位置を
文字の境界部であるとみなして、0≦lく] 1111
’l の範囲の文字パターンを文字認識部に渡すことを
いう。即ち、本例ではそのウィンドウ(21)内のy投
影であるYP (i)が1m1mInで谷状に凹むと共
にその谷の傾斜が所定量以上であるときに、その1=1
alt+ の位置が文字の境界部であるとみなすのであ
る。具体的にそのウィンドウ(21)における1 *I
h の値を35であるとすると、第20図に示す文字パ
ター ンが切り出される。
lai,,<l ≦ l +aln+δ
(13) In the histogram (22) of the example in FIG. 18, the absolute value of the negative slope of the straight line (23) corresponds to 6 m, and the positive slope of the straight line (24) corresponds to Δp. Then, in step (126), the maximum values Δm and Δ
It is checked whether p are both larger than the dark value THO, and if both of the maximum values are larger than the dark value THO, forced extraction is performed in step (127). Forced cutting means that the value of coordinate l is 1 + a1. .. Assuming that the position is the boundary of the character, 0≦l] 1111
'l' refers to passing the character pattern in the range to the character recognition section. That is, in this example, when YP (i), which is the y projection within the window (21), is depressed in the shape of a valley by 1 m1 mIn and the slope of the valley is more than a predetermined amount, then 1=1.
The position of alt+ is considered to be the boundary between characters. Specifically, 1 *I in that window (21)
Assuming that the value of h is 35, the character pattern shown in FIG. 20 is cut out.

その強制切り出し後のステップ(128)  にて、中
央変数midの値を次のように更新した後に文字切り出
し部の動作はステップ(129)へ進む。
In step (128) after the forced extraction, the value of the central variable mid is updated as follows, and then the operation of the character extraction section proceeds to step (129).

m 1 d −(]+*i。+1)=C−・・・(14
)これは前回文字の境界部であるとみなした座標である
11.7 の次の1座標を新たな始点として、この新た
な始点を基準として新たなウィンドウを設定することを
意味する。このステップ(129)  では次に切り出
すべき文字がまだ存在するかどうかが調べられ、切り出
すべき文字がまだ存在するときにはステップ(119)
  に戻り下限変数midm及び上限変数m1dpの値
が新たな値に更新される。
m1d-(]+*i.+1)=C-...(14
) This means that the next coordinate after 11.7, which is the coordinate previously considered to be the boundary of the character, is set as a new starting point, and a new window is set based on this new starting point. In this step (129), it is checked whether there are still characters to be cut out next, and if there are still characters to be cut out, step (119) is carried out.
The value of the lower limit variable midm and upper limit variable m1dp is updated to new values.

前回のウィンドウ(21)における1 +ai+a は
35であるため、式(14)より今回の中央変数mid
の値は70になり、第18図に示す如<1=70の位置
を中心とする輻20の領域が新たなウィンドウ(25)
になる。
Since 1 +ai+a in the previous window (21) is 35, the current central variable mid
The value of becomes 70, and the area of radius 20 centered at the position <1=70 is created as a new window (25) as shown in Figure 18.
become.

そして、この新たなウィンドウ(25)内でのその文字
列のy投影YP (i)のヒストグラム(26)の中で
傾斜が所定量以上ある谷部の座標1の値が新たな1 m
lh となる。この1 sin の値を71であるとす
ると、第21図に示す如き文字パターンが切り出され、
以下その1 mih の次の座標を始点として次のウィ
ンドウが設定される。また、ステップ(129)で次に
切り出す文字が存在しないときはその余った文字パター
ンのデータを文字認識部へ渡した後に(ステップ(13
0))、その文字の切り出しが終了する。
Then, in the histogram (26) of the y-projection YP (i) of that character string within this new window (25), the value of the coordinate 1 of the valley where the slope is greater than or equal to a predetermined amount is set to a new value of 1 m.
It becomes lh. Assuming that the value of 1 sin is 71, a character pattern as shown in Fig. 21 is cut out,
Thereafter, the next window is set with the next coordinate of 1 mih as the starting point. In addition, if there is no character to be cut out next in step (129), the data of the remaining character pattern is passed to the character recognition section (step (13)).
0)), the extraction of that character is completed.

また、ステップ(126)  において勾配の絶対値Δ
m及びΔpが共に閾値THO以下であるときには、その
1=11+sの位置は文字の境界部ではないとみなして
、ステップ(131)で半角文字の切り出しができるか
どうかを判定する。この場合の半角文字とは座標lに沿
う高さが先に求めた文字フォントの平均枠の高さhb(
=c)の1/2である文字をいい、本例では中央変数m
 i dよりC/2を差し引いてステップ(119)〜
(122)までを実行して谷部が存在するかどうかを調
べる。その谷部が存在するときにはステップ(132)
  にてその中央変数midから正式にC/2を差し引
いてステップ(119)に移行して、半角文字の切り出
しを行う。
Also, in step (126), the absolute value of the gradient Δ
When both m and Δp are less than the threshold THO, the position of 1=11+s is considered not to be a character boundary, and it is determined in step (131) whether a half-width character can be cut out. In this case, the height of the half-width character along the coordinate l is the average height of the character font frame hb (
= 1/2 of c), and in this example, the central variable m
Subtract C/2 from i d and proceed to step (119) ~
Execute steps up to (122) to check whether a valley exists. Step (132) when the valley exists
At step (119), C/2 is formally subtracted from the central variable mid, and half-width characters are extracted.

このように半角文字が混入している場合には、その・切
り出し対象とする文字の上に括弧記号が付されているよ
うな場合がある。
When half-width characters are mixed in like this, a parenthesis symbol may be placed above the character to be extracted.

一方、ステップ(131)  で半角文字の切り出しが
できないときには、ステップ(133) で中央変数m
1dO値にCを加算してからステップ(129)  に
移行する。これは全角文字の切り出しも亨角文字の切り
出しもできないので、ウィンドウの位置を更に全角文字
の高さ分のCだけ移動させることを意味する。これ以後
は既に述べた手順に従って更に文字の切り出しが実行さ
れる。
On the other hand, if half-width characters cannot be extracted in step (131), the central variable m is determined in step (133).
After adding C to the 1dO value, the process moves to step (129). Since it is not possible to cut out full-width characters or wide-width characters, this means that the window position is further moved by C, which is the height of the full-width characters. After this, further character extraction is performed according to the procedure already described.

上述のように本例によれば、統計的に求めた文字フォン
トの平均枠の大きさに合わせてウィンドウが設定され、
このウィンドウ内の文字列の投影値に傾斜が急な谷部が
存在したときにその谷部が文字間の境界部であると判定
されるので、連結文字ブロックであっても正確に文字の
切り出しを行うことができる利益がある。この場合、統
計的に求めた文字フォントの平均枠の大きさが使用され
るので、認識対象とする全角文字の縦横比が1でない場
合であっても正確に文字の切り出しを行うことができる
As mentioned above, according to this example, the window is set according to the statistically determined average frame size of the character font,
When a steep valley exists in the projected value of a character string in this window, that valley is determined to be a boundary between characters, so even if it is a connected character block, characters can be accurately cut out. There are profits that can be made. In this case, since the statistically determined average frame size of the character font is used, even if the aspect ratio of the full-width character to be recognized is not 1, the character can be accurately extracted.

更に本例ではステップ(131)  で示すように半角
文字の切り出しができるかどうかを判定するステップが
設けられているので、全角文字の連結のみならず半角文
字の連結した文字ブロックからも個々の文字を正確に切
り出すことができる。
Furthermore, in this example, as shown in step (131), there is a step for determining whether half-width characters can be extracted, so it is possible to extract individual characters not only from a concatenation of full-width characters but also from a character block consisting of concatenated half-width characters. can be cut out accurately.

尚、本発明は上述実施例に限定されず本発明の要旨を逸
脱しない範囲で種々の構成を採り得ることは勿論である
It goes without saying that the present invention is not limited to the above-mentioned embodiments, and that various configurations can be adopted without departing from the gist of the present invention.

[発明の効果] 本発明よる第1の文字切り出し方法によれば、統計的に
入力文字の形状が判別されるので、オペレータがその入
力文字の縦横比等を設定しなくとも自動的にその入力文
字の形状を判別して文字の切り出しが正確に行える利益
がある。
[Effects of the Invention] According to the first character extraction method of the present invention, the shape of the input character is statistically determined, so the input character can be automatically extracted without the operator having to set the aspect ratio of the input character. There is an advantage that the shape of the character can be determined and the character can be cut out accurately.

また、第2の文字切り出し方法によれば、所定のウィン
ドウ内の投影の傾斜が急な谷部が文字の境界部とみなさ
れるので、単なる投影では分離できない連結文字ブロッ
クからでも正確に個々の文字の切り出しが出来る利益が
ある。
In addition, according to the second character extraction method, the steeply sloped valleys of the projection within a predetermined window are regarded as character boundaries, so individual characters can be accurately separated even from connected character blocks that cannot be separated by simple projection. There is profit that can be extracted from

また、第3〜第5の文字切り出し方法によれば、統計的
に検出された基本文字枠を用いて文字の切り出しが行わ
れるので、文字ピッチが変動しても更に分離文字であっ
ても正確に文字の切り出しができる利益がある。
In addition, according to the third to fifth character extraction methods, characters are extracted using the statistically detected basic character frame, so even if the character pitch fluctuates or the character is separated, it is accurate. has the advantage of being able to cut out characters.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例の文字ブロックの袖出過程を
示す線図、第2図は文字列のy方向への投影の例を示す
拡大図、第3図は切り出された文字ブロック、の例を示
す線図、第4図及び第5図は夫々実施例の横書き文字列
の基本文字枠及び縦書き文字列の基本文字枠を示す線図
、第6図は文字列の幅の度数分布の一例を示す線図、第
7図及び第8図は夫々第6図例に対応する文字ブロック
の輻及び高さの度数分布の一例を示す線図、第9図は文
字列の幅の度数分布の他の例を示す線図、第10図及び
第11図は夫々第9図例に対応する文字ブロックの輻及
び高さの度数分布の一例を示す線図、第12図は一実施
例で切り出し対象とする縦書きの文字ブロックの例を示
す線図、第13図は一実施例の文字ブロックの統合手順
を示すフローチャート図、第14図〜第16図は夫々そ
の統合手順の説明に供する線図、第17図は横書きの文
字ブロックの例を示す線図、第18図は一実施例で強制
切り出しの対象とする連結文字ブロックの例を示す線図
、第19図は一実施例の強制切り出しの手順を示すフロ
ーチャート図、第20図及び第21図は夫々強制切り出
しの結果の例を示す線図、第22図は従来の文字認識装
置の全体構成を示す機能ブロック図、第23図は従来の
文字列の切り出しの説明に供する線図、第24図は従来
の原矩形切り出し動作の説明に供する線図である。 (1)は原稿読み取り部、(2)は文字列切り出し部、
(6)は文字切り出し部、(7)は文字識別部、(13
)は文字ブロック、(15)及び(17)は夫々入力フ
ォントの平均枠、(16)及び(18)は夫々基本文字
枠、(21)及び(25)は夫々ウィンドウである。 代  理  人 松  隈  秀  盛 を杯 a合する41台(3) 第16図 統合する4合(2) 第15図 項書き文字ブロックのJ′j 第17図 第18図 第20図 強^り切ソエしの腿−1(2) 第21図
Fig. 1 is a diagram showing the process of protruding a character block according to an embodiment of the present invention, Fig. 2 is an enlarged view showing an example of projection of a character string in the y direction, and Fig. 3 is a cut-out character block. , FIG. 4 and FIG. 5 are line diagrams showing the basic character frame of the horizontally written character string and the basic character frame of the vertically written character string, respectively, in the example, and FIG. 6 is a diagram showing the width of the character string. A diagram showing an example of the frequency distribution, Figures 7 and 8 are diagrams showing an example of the frequency distribution of the convergence and height of the character block corresponding to the example in Figure 6, respectively, and Figure 9 is the width of the character string. 10 and 11 are diagrams showing an example of the frequency distribution of the convergence and height of character blocks corresponding to the example in FIG. 9, and FIG. 12 is a diagram showing another example of the frequency distribution. A line diagram showing an example of a vertically written character block to be cut out in an embodiment, FIG. 13 is a flowchart showing a procedure for integrating character blocks in an embodiment, and FIGS. 14 to 16 respectively show the integration procedure. Diagrams for explanation: FIG. 17 is a diagram showing an example of a horizontally written character block; FIG. 18 is a diagram showing an example of a connected character block that is subject to forced extraction in one embodiment; FIG. 20 and 21 are diagrams showing examples of the results of forced extraction, respectively. FIG. 22 is a functional block diagram showing the overall configuration of a conventional character recognition device. FIG. 23 is a diagram for explaining conventional character string extraction, and FIG. 24 is a diagram for explaining conventional original rectangle extraction operation. (1) is the original reading section, (2) is the character string cutting section,
(6) is a character cutting section, (7) is a character identification section, (13
) are character blocks, (15) and (17) are average frames of the input font, (16) and (18) are basic character frames, respectively, and (21) and (25) are windows, respectively. Deputy Hide Hitomatsu Kuma 41 units that combine a cup (3) Figure 16 4 units that integrate (2) Figure 15 J'j of the item writing character block Figure 17 Figure 18 Figure 20 strong ^ Cut-out thigh-1 (2) Figure 21

Claims (1)

【特許請求の範囲】 1、複数の文字列を夫々列方向に投影して個々の文字列
幅を求め、上記複数の文字列中の個々の入力文字を夫々
列方向及び該列方向に直交する幅方向に投影することに
より個々の文字ブロックを求め、 これら個々の文字ブロックの列方向及び幅方向の長さの
内で最も頻度の大きい長さを上記入力文字を代表する文
字パターンの列方向及び幅方向の長さとみなし、上記個
々の文字列幅の分布の内で最も頻度の大きい文字列幅を
一辺として上記入力文字を代表する文字パターンに相似
なパターンを基本文字枠とし、 該基本文字枠を単位として上記入力文字の切り出しを行
うようにした事を特徴とする文字切り出し方法。 2、複数の文字列を夫々列方向に投影して個々の文字列
幅を求め、上記複数の文字列中の個々の入力文字を夫々
列方向及び該列方向に直交する幅方向に投影することに
より個々の文字ブロックを求め、 これら個々の文字ブロックの列方向及び幅方向の長さの
内で最も頻度の大きい長さを上記入力文字を代表する文
字パターンの列方向及び幅方向の長さとみなし、上記複
数の文字列の認識対象とする文字列において、先頭の文
字の立ち上がり部から上記入力文字を代表する文字パタ
ーンの列方向の長さを中心として所定幅の領域にウィン
ドウを設定し、該ウィンドウ内で上記認識対象とする文
字列を幅方向に投影して投影値が最小となる上記列方向
の谷部位置を求め、該谷部位置の投影値と上記ウィンド
ウ内の他の投影値との勾配の最大値が所定値を超えた場
合には上記谷部位置で文字の切り出しを行うと共に、該
文字の切り出しを行った位置を基準として次のウィンド
ウを設定し、 上記谷部位置の投影値と上記ウィンドウ内の他の投影値
との勾配の最大値が上記所定値以下である場合には上記
谷部位置から更に上記入力文字を代表する文字パターン
の列方向の長さを中心として所定幅の領域に新たなウィ
ンドウを設定するようにした事を特徴とする文字切り出
し方法。 3、複数の文字列を夫々列方向に投影して個々の文字列
幅を求め、上記複数の文字列中の個々の入力文字を夫々
列方向及び該列方向に直交する幅方向に投影することに
より個々の文字ブロックを求め、 これら個々の文字ブロックの列方向及び幅方向の長さの
内で最も頻度の大きい長さを上記入力文字を代表する文
字パターンの列方向及び幅方向の長さとみなし、上記個
々の文字列幅の分布の内で最も頻度の大きい文字列幅を
一辺として上記入力文字を代表する文字パターンに相似
なパターンを基本文字枠とし、 上記複数の文字列の内の認識対象とする文字列に属する
先頭の文字ブロックを基準として上記基本文字枠の中に
入る文字ブロックを統合して切り出し、以下上記切り出
された文字ブロックの次の文字ブロックを基準として上
記基本文字枠の中に入る文字ブロックを統合して切り出
していくようにした事を特徴とする文字切り出し方法。 4、上記複数の文字列が縦書きの場合には、上記複数の
文字列の内の認識対象とする文字列に属する文字ブロッ
クを縦方向の座標を基準として順位付けするようにした
請求項3記載の文字切り出し方法。 5、上記複数の文字列が横書きの場合には、上記複数の
文字列の内の認識対象とする文字列に属する文字ブロッ
クを横方向の座標を基準として順位付けするようにした
請求項3記載の文字切り出し方法。
[Claims] 1. Obtaining the width of each character string by projecting each of the plurality of character strings in the column direction, and projecting each input character in the plurality of character strings in the column direction and perpendicular to the column direction. Obtain individual character blocks by projecting them in the width direction, and calculate the most frequent length of each character block in the column direction and width direction of the character pattern representing the input character. Regarded as the length in the width direction, a basic character frame is a pattern similar to the character pattern representative of the input characters, with the most frequent character string width in the distribution of the individual character string widths as one side, and the basic character frame A character extraction method characterized in that the input character is extracted in units of . 2. Obtaining the width of each character string by projecting each of the plurality of character strings in the column direction, and projecting each input character in the plurality of character strings in the column direction and the width direction perpendicular to the column direction. Find each character block by , and consider the most frequent length of each character block in the column direction and width direction as the length in the column direction and width direction of the character pattern representing the input character. , In the character string to be recognized among the plurality of character strings, a window is set in an area of a predetermined width centered on the length in the column direction of the character pattern representing the input character from the rising part of the first character, and Project the character string to be recognized in the window in the width direction, find the valley position in the column direction where the projected value is the minimum, and compare the projected value of the valley position with other projected values in the window. If the maximum value of the slope exceeds a predetermined value, the character is cut out at the valley position, and the next window is set based on the position where the character was cut out, and the projection of the valley position is performed. If the maximum value of the gradient between the value and the other projected values in the window is less than the predetermined value, then a predetermined value is added from the trough position to the center of the length of the character pattern representing the input character in the column direction. A character cutting method characterized by setting a new window in a width area. 3. Obtaining the width of each character string by projecting each of the plurality of character strings in the column direction, and projecting each input character in the plurality of character strings in the column direction and the width direction perpendicular to the column direction. Find each character block by , and consider the most frequent length of each character block in the column direction and width direction as the length in the column direction and width direction of the character pattern representing the input character. , A basic character frame is a pattern similar to the character pattern representative of the input characters, with the most frequent character string width among the above individual character string width distributions as one side, and the recognition target among the above plurality of character strings is set as a basic character frame. The character blocks that fall within the above basic character frame are integrated and cut out using the first character block belonging to the character string as a reference, and the character blocks that fall within the above basic character frame are then cut out using the next character block of the above cut out character block as a reference. A character cutting method characterized by cutting out character blocks by integrating them. 4. When the plurality of character strings are written vertically, the character blocks belonging to the character string to be recognized among the plurality of character strings are ranked based on the vertical coordinates. How to cut out characters as described. 5. When the plurality of character strings are written horizontally, character blocks belonging to the character string to be recognized among the plurality of character strings are ranked based on horizontal coordinates. How to cut out characters.
JP2212593A 1990-08-10 1990-08-10 Character extraction method Expired - Fee Related JP2995818B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2212593A JP2995818B2 (en) 1990-08-10 1990-08-10 Character extraction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2212593A JP2995818B2 (en) 1990-08-10 1990-08-10 Character extraction method

Publications (2)

Publication Number Publication Date
JPH0498477A true JPH0498477A (en) 1992-03-31
JP2995818B2 JP2995818B2 (en) 1999-12-27

Family

ID=16625267

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2212593A Expired - Fee Related JP2995818B2 (en) 1990-08-10 1990-08-10 Character extraction method

Country Status (1)

Country Link
JP (1) JP2995818B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013101616A (en) * 2011-11-09 2013-05-23 Canon Inc Method and system for dividing characters of text row having various character widths
JP2018519574A (en) * 2016-01-05 2018-07-19 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 Text image processing method and apparatus

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013101616A (en) * 2011-11-09 2013-05-23 Canon Inc Method and system for dividing characters of text row having various character widths
JP2018519574A (en) * 2016-01-05 2018-07-19 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 Text image processing method and apparatus
US10572728B2 (en) 2016-01-05 2020-02-25 Tencent Technology (Shenzhen) Company Limited Text image processing method and apparatus

Also Published As

Publication number Publication date
JP2995818B2 (en) 1999-12-27

Similar Documents

Publication Publication Date Title
JP2822189B2 (en) Character recognition apparatus and method
US6178263B1 (en) Method of estimating at least one run-based font attribute of a group of characters
US6226402B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US7519226B2 (en) Form search apparatus and method
JP2000181993A (en) Character recognition method and device
CN113139445A (en) Table recognition method, apparatus and computer-readable storage medium
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
JPH09311905A (en) Line detecting method and character recognition device
JPH0498477A (en) Character segmenting method
JPH07230525A (en) Method for recognizing ruled line and method for processing table
JPH11191135A (en) Japanese/english discriminating method for document image, document recognizing method and recording medium
JP2902097B2 (en) Information processing device and character recognition device
JPH08305794A (en) Address line extracting device
JP3220226B2 (en) Character string direction determination method
JP2859307B2 (en) Character extraction device
JP3127413B2 (en) Character recognition device
JPH06215181A (en) Character/character string segmenting method and character recognizing device
JPH07319998A (en) Method for segmenting character
JPS63126082A (en) Character recognizing system
JPH05135204A (en) Character recognition device
JP2974167B2 (en) Large Classification Recognition Method for Characters
JP2000113101A (en) Method and device for segmenting character
JPH05108882A (en) Character recognition device
JPH10214308A (en) Character discrimination method
JPH0632074B2 (en) Normalization method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees