JPS6033678A - Underline detecting method - Google Patents

Underline detecting method

Info

Publication number
JPS6033678A
JPS6033678A JP58142738A JP14273883A JPS6033678A JP S6033678 A JPS6033678 A JP S6033678A JP 58142738 A JP58142738 A JP 58142738A JP 14273883 A JP14273883 A JP 14273883A JP S6033678 A JPS6033678 A JP S6033678A
Authority
JP
Japan
Prior art keywords
underline
character
image data
candidate
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58142738A
Other languages
Japanese (ja)
Inventor
Mamoru Maeda
護 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58142738A priority Critical patent/JPS6033678A/en
Publication of JPS6033678A publication Critical patent/JPS6033678A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To detect accurately an underline connected to characters by recognizing characters after masking a unit of character image data and an underline candidate part by a horizontal projection and deciding the underline from the result of character recognition. CONSTITUTION:A character cutting-out underline detecting part 4 cuts out each character image data within an image memory part 2 for each break of a vertical projection detected by a vertical projection detecting part 3 and then gives a horizontal scanning to the lowest column from the highest column of the cut- out image data to detect the top and bottom parts of the image. Then a horizontal scanning is carried out from the bottom part to the top part to obtain a horizontal projection. The presence of an underline candidate is decided if a horizontal projection corresponding to the underline length exists at the underline position. Then the underline candidate is masked when the existence of just one horizontal projection is decided. Then characters are recognized at a character recognizing part 6. Based on the result of this recognition, an underline is detected.

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、文字認識装置におけるアンダーライン検出方
法に関する。
DETAILED DESCRIPTION OF THE INVENTION [Technical Field] The present invention relates to an underline detection method in a character recognition device.

〔従来技術〕[Prior art]

文字認識装置において、アンダーライン付き文字の認識
を行うには、1文字単位に切り出された文字イメージデ
ータからアンダーライン部分をマーi h −f−X 
、I/、゛萌+i+−11z(1’+ +−出1.− 
t+ 、7 %7 J/ −−’r −/ンを検出する
必要がある。
In order to recognize underlined characters in a character recognition device, mark the underlined part from the character image data cut out in units of characters.
, I/,゛Moe+i+-11z(1'+ +-out1.-
It is necessary to detect t+, 7%7 J/--'r-/n.

従来のアンダーライン検出方法は、文字イメージデータ
に所定長以上の水平方向の白ランが垂直方向に続き、そ
の下に所定長以上の黒ランが続き、さらにその下に所定
長以上の白ランが続いた場合に、アンダーライン有りと
判定する(特開昭56−500905号)。 しかしこ
の方法では、文字と連結したアンダーラインを正しく検
出できず、認識エラーを引き起こすことがある。
In the conventional underline detection method, a horizontal white run of a predetermined length or longer continues vertically in character image data, followed by a black run of a predetermined length or longer, and below that a white run of a predetermined length or longer. If it continues, it is determined that there is an underline (Japanese Patent Laid-Open No. 56-500905). However, with this method, underlines connected to characters cannot be detected correctly, which may cause recognition errors.

〔目 的〕〔the purpose〕

本発明の目的は、文字と連結したアンダーラインを正確
に検出できるアンダーライン検出方法を提供することに
ある。
An object of the present invention is to provide an underline detection method that can accurately detect underlines connected to characters.

本発明の他の目的は、アンダーライン伺き文字の認識率
の向上に寄与できるアンダーライン検出方法を提供する
ことにある。
Another object of the present invention is to provide an underline detection method that can contribute to improving the recognition rate of underlined characters.

〔実施例〕〔Example〕

第1図は本発明に係る文字認識装置の概略ブロック図で
ある。スキャナー(図示されていない)から入力される
イメージデータはノイズ除去・行切山部lに入力され、
孤立点除去と行切出しが行]〕れ、切り出さ4した1行
分のイメージデータがイメージメモリ部2に記憶される
。この時に、垂直射影検出部3により1行分のイメージ
データの垂直射影が検出される。なお、行切出しは公知
の射影法等によって行われるが、アンダーライン部分も
含めたイメージデータが切り出さ、11.る。
FIG. 1 is a schematic block diagram of a character recognition device according to the present invention. Image data input from a scanner (not shown) is input to a noise removal/line cutting section l,
Isolated point removal and line cutting are performed [row]], and the image data for one line that has been cut out is stored in the image memory section 2. At this time, the vertical projection detection section 3 detects the vertical projection of one row of image data. Incidentally, line cutting is performed by a known projection method, etc., and the image data including the underline portion is cut out. Ru.

行切出しを終了すると、文字切出・アンダーライン検出
部4は垂直射影検出部3て検出された垂直射影の切れ日
毎に、イメージメモリ部2内の個々の文字イメージデー
タを切り出した後、第2図のフローチャー1−にしたが
った処理を行う。
When line cutting is finished, the character cutting/underline detecting unit 4 cuts out individual character image data in the image memory unit 2 for each vertical projection break date detected by the vertical projection detecting unit 3, and then cuts out the individual character image data in the image memory unit 2. Processing according to flowchart 1- in the figure is performed.

まず文字イメージデータを最上列から最下列に向って水
平走査し、最初に黒画素が見つかる列をイメージの頂部
、最後に黒画素か見つかる列を−rメージの底部として
検出する(G>)。つぎに文字イメージデータを底部か
ら頂部に向って水平走査し、水平射影をめる( +21
)。
First, the character image data is horizontally scanned from the top row to the bottom row, and the first row in which a black pixel is found is detected as the top of the image, and the last row in which a black pixel is found is detected as the bottom of the -r image (G>). Next, horizontally scan the character image data from the bottom to the top to obtain the horizontal projection (+21
).

アンダーライン位置にアンダーラインの長さに相当する
値(思画素数)の水平射影か存在すれば、アンダーライ
ン候補が存在すると判定する(■)。
If there is a horizontal projection of a value (the expected number of pixels) corresponding to the length of the underline at the underline position, it is determined that an underline candidate exists (■).

アンダーライン候補が無いと判定された場合、その文字
イメージデータをそのままイメージメモリ部2よりマス
キング部5を通して文字認識装置6へ送り、確定文字認
識を行わせる((■)。認識結果はホスト(図示されて
いない)へ送られる。
If it is determined that there is no underline candidate, the character image data is sent as is from the image memory section 2 through the masking section 5 to the character recognition device 6 for final character recognition ((■).The recognition results are sent to the host (not shown). (not sent).

アンダーライン候補が存在する場合、水)V−射影が1
つだけあるか判定する(■)。第3図に示すような文字
とアンダーラインとが分離している場合、判定結果はN
Oとなる。第4図または第5図に示すような文字とアン
ダーラインとが連結している場合は、判定結果はYES
どなる。
If there is an underline candidate, water) V-projection is 1
Determine whether there are only one (■). If the characters and underline are separated as shown in Figure 3, the judgment result is N.
It becomes O. If the characters and underlines are connected as shown in Figure 4 or Figure 5, the judgment result is YES.
bawl.

ステップ■の判定がNoの場合、アンダーライン候補を
アンダーラインとしで検出し、イメージメモリ2より文
字イメージデータを文字認識部6へ送り確定文字認識を
行わせるが、その際に、マスキング部5によって文字イ
メージデータのアンダーライン候補部分をマスクさせ、
またアンダーラインコードを付加する(0+@)。認識
された文字コードは、アンターラインコー1〜が付加さ
れホストへ送られる。
If the determination in step (■) is No, the underline candidate is detected as an underline, and the character image data is sent from the image memory 2 to the character recognition unit 6 for final character recognition. Mask the underline candidate part of the character image data,
Also, add an underline code (0+@). The recognized character code is sent to the host with an underscore code 1- added thereto.

ステップ(頂の判定結果がYESの場合、文字イメージ
データをアンダーライン候補部分をマスクして文字認識
部6へ送り、仮文字認識を行わせる(■、■)。仮文字
認識の結果は文字切出・アンダーライン検出部4にυ、
えられる。
Step (If the top determination result is YES, the character image data is sent to the character recognition unit 6 with the underline candidate portion masked, and provisional character recognition is performed (■, ■).The result of provisional character recognition is υ in the out/underline detection section 4,
available.

仮文字認識によった認識された文字が、第5図のパター
ンに相当するrr 9 nであるか判定する((す)。
It is determined whether the character recognized by the temporary character recognition is rr 9 n corresponding to the pattern in FIG. 5 ((S)).

YESならば、″リシエクl−−9”=1−1−4文字
a忍識部6を介してホストに送り、ホストによるリシェ
ク1〜処理を行わせる(■))。このような文字イメー
ジデータは、9″′にアンダーラインが連結したものか
、アンダーライン熱しの” g ”か、あるいは11 
g++にアンターラインが付いたものか区分できないた
め、リジエク1〜処理を行うのである。ホスト側のリレ
エン1−処理は、(1)単純にリジエタ1へ文字とし処
理する、(11)前後の文字にアンターラインが付いて
いない場合は′g゛′とじ、アンダーラインが付いてい
る示合はリジエク1〜記号を表示し、−1r /−?l
 t −JJ i−) X 1次if; ly ’J>
 #’l R−筈がtえら才しる。
If YES, "Resheku l--9" = 1-1-4 characters a is sent to the host via the intelligence unit 6, and the host performs recheque 1~processing (■)). Such character image data is 9″′ with an underline, “g” with an underline, or 11
Since it is not possible to distinguish whether g++ has an underline or not, rejiku 1~ processing is performed. Relayen 1-processing on the host side is (1) simply processing it as a character to regiator 1, (11) if the preceding and following characters do not have an underline, they are marked with 'g゛', and the underlined characters are If so, display the symbol 1~ and -1r/-? l
t -JJ i-) X primary if; ly 'J>
#'l R-I'm very talented.

ステップ■の判定結果かNOの場合、仮文字認識による
認識文字が”y″′(第4図)、”l”(縦棒)、11
 p Hlll、++のいずJしかであるか判定する(
(11)。これらの各文字はアンダーライン部分をマス
クした文字イメージデータでも容易に区別できるから、
仮文字認識の結果に確定しても支障はなく、またアンダ
ーライン候補をアンダーラインとして検出してよい。し
たがって、判定&11果がYESの場合、仮文字認識で
得られた文字コートをアンダーラインコードを付加し1
文字認識部6経山にてホストへ送る(■)。
If the judgment result in step ■ is NO, the characters recognized by temporary character recognition are "y"' (Figure 4), "l" (vertical bar), 11
Determine whether there is only one J of p Hllll, ++ (
(11). Each of these characters can be easily distinguished even in character image data with the underlined part masked, so
There is no problem even if the result of temporary character recognition is determined, and underline candidates may be detected as underlines. Therefore, if the result of judgment &11 is YES, the character code obtained by temporary character recognition is added with an underline code and 1
The character recognition unit 6 sends it to the host (■).

ステップ■の判定結果かNoの場合、その文字イメージ
データは大文字”E”、”z”などであり、アンダーラ
イン候補はアンダーラインではない。
If the determination result in step (2) is No, the character image data is a capital letter "E", "z", etc., and the underline candidate is not an underline.

そこで、アンダーライン1侯補部分をマスクすることな
く、文字イメージデータをそのまま文字認識部6へ送り
、確定文字認識を行わせる(@)。
Therefore, the character image data is sent as is to the character recognition unit 6 without masking the underline 1 complement part, and fixed character recognition is performed (@).

なお、ステップ■の仮文字認識は、アンダーライン候補
部分をマスクした文字イメージデータが、′9′″、I
I I ++、 11 PIl、 If yll、 I
Z 11のイメージデータのいずれと一致するかを知る
ことができればよいから、文字t、ど識部6とは別に改
番プた簡単なパターン比較手段によ−1て行うようにし
てもよい。
In addition, in the provisional character recognition in step
I I ++, 11 PIl, If yll, I
Since it is only necessary to know which of the image data of Z 11 matches, it is possible to use a simple pattern comparison means such as a number change, in addition to the character t and identification part 6, to perform the process.

〔効 果〕〔effect〕

本発明は以上詳述したように、水平射影によってアンダ
ーライン候補を検出し、アンダーライン候補があり水平
射影が1つの文字イメージデータをアンダーライン候浦
部分をマスクしてから文字認識を行い、その結果にした
がってアンダーライン候補が本当の)7ンダーラインで
あるか判定するため、文字と連結したアンダーラインを
正確に検出することができ、またアンダーラインの誤検
出による文学認識エラーを;賊らし認識、i4iを向」
二できるという効果を奏する。
As described in detail above, the present invention detects underline candidates by horizontal projection, masks character image data with underline candidates and one horizontal projection, and then performs character recognition. Based on the result, it is determined whether the underline candidate is a true 7-dahline or not, so it is possible to accurately detect underlines connected to characters, and it also prevents literary recognition errors due to false detection of underlines; plagiarism recognition. , towards i4i'
It has the effect of being able to do two things.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明に係る文字認識装置の概略フロック図、
第2図はアンダーライン防出処理のフロー図、第3図は
アンターラインと文字か分RL Lだパターンの一例を
示す図、第4図ど第5図はそれぞれアンダーラインと文
字が連結したパターンの例を示す図である。 1・・・ノイズ除去・打切山部、2・ イメージメモリ
部、3・・・垂直射影検出部、4・文字切出・アンダー
ライン検出部、′ 5・・・マスキング部、6・・・文
字認識部。 代理人弁理士 鈴 木 誠j・°゛、ハ)第1図 第2図
FIG. 1 is a schematic block diagram of a character recognition device according to the present invention;
Figure 2 is a flow diagram of underline prevention processing, Figure 3 is a diagram showing an example of an underline and character pattern, and Figures 4 and 5 are patterns in which underlines and characters are connected. It is a figure showing an example. 1... Noise removal/truncation peak part, 2... Image memory part, 3... Vertical projection detection part, 4... Character extraction/underline detection part,' 5... Masking part, 6... Character Recognition part. Representative Patent Attorney Makoto Suzuki・°゛、c) Figure 1 Figure 2

Claims (1)

【特許請求の範囲】[Claims] (1)文字イメージデータの水平射影からアンダーライ
ン候補が存在するか判定し、アンダーライン候補があり
かつ水平射影が1つの文字イメージデータはアンダーラ
イン候補の部分をマスクして文字認識を行い、その結果
によってアンダーライン候補がアンダーラインであるか
判定することを特徴とするアンダーライン検出方法。
(1) Determine whether an underline candidate exists based on the horizontal projection of character image data, and for character image data that has an underline candidate and one horizontal projection, perform character recognition by masking the underline candidate part. An underline detection method characterized by determining whether an underline candidate is an underline based on the result.
JP58142738A 1983-08-04 1983-08-04 Underline detecting method Pending JPS6033678A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58142738A JPS6033678A (en) 1983-08-04 1983-08-04 Underline detecting method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58142738A JPS6033678A (en) 1983-08-04 1983-08-04 Underline detecting method

Publications (1)

Publication Number Publication Date
JPS6033678A true JPS6033678A (en) 1985-02-21

Family

ID=15322427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58142738A Pending JPS6033678A (en) 1983-08-04 1983-08-04 Underline detecting method

Country Status (1)

Country Link
JP (1) JPS6033678A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5859929A (en) * 1995-12-01 1999-01-12 United Parcel Service Of America, Inc. System for character preserving guidelines removal in optically scanned text

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5859929A (en) * 1995-12-01 1999-01-12 United Parcel Service Of America, Inc. System for character preserving guidelines removal in optically scanned text

Similar Documents

Publication Publication Date Title
US8059868B2 (en) License plate recognition apparatus, license plate recognition method, and computer-readable storage medium
CN104200210B (en) A kind of registration number character dividing method based on component
RU2014112237A (en) ENTERING DATA FROM IMAGES OF DOCUMENTS WITH FIXED STRUCTURE
JPH07302304A (en) Apparatus for analysis of character of image
CN111814673A (en) Method, device and equipment for correcting text detection bounding box and storage medium
CN110598575B (en) Form layout analysis and extraction method and related device
JP2893814B2 (en) Plate cutout device for automatic car number reader
JPS6033678A (en) Underline detecting method
JP2006155126A (en) Vehicle number recognition device
JPH0410087A (en) Base line extracting method
JP2011018175A (en) Character recognition apparatus and character recognition method
JPH04112283A (en) Character separating system
JP2000357287A (en) Method and device for number plate recognition
JPH02116987A (en) Character recognizing device
CN106372632B (en) A method of the leakage based on OCR is known text and is detected automatically
JPH10207978A (en) Character pattern collating method and device therefor
JPH0728935A (en) Document image processor
JP2002366893A (en) Document recognizing method
JPH0524555B2 (en)
JP2982221B2 (en) Character reader
JPH03160582A (en) Method for separating ruled line and character in document picture data
JPH08305794A (en) Address line extracting device
JP3541093B2 (en) Document image inclination detection method and apparatus
JPH02230484A (en) Character recognizing device
JPH06215181A (en) Character/character string segmenting method and character recognizing device