JPH0459670B2 - - Google Patents

Info

Publication number
JPH0459670B2
JPH0459670B2 JP60109613A JP10961385A JPH0459670B2 JP H0459670 B2 JPH0459670 B2 JP H0459670B2 JP 60109613 A JP60109613 A JP 60109613A JP 10961385 A JP10961385 A JP 10961385A JP H0459670 B2 JPH0459670 B2 JP H0459670B2
Authority
JP
Japan
Prior art keywords
character string
histogram
character
line width
line position
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP60109613A
Other languages
English (en)
Other versions
JPS61267184A (ja
Inventor
Masanao Takaoka
Atsushi Shimoyama
Juji Isobe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60109613A priority Critical patent/JPS61267184A/ja
Publication of JPS61267184A publication Critical patent/JPS61267184A/ja
Publication of JPH0459670B2 publication Critical patent/JPH0459670B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔概要〕 行幅が一定な文字列の横方向のヒストグラムを
作成し、この文字列ヒストグラムをスライスレベ
ルを変えてスライスし、そのスライス幅が基準行
幅値に等しくなつた時の文字列ヒストグラムのス
ライス点位置から文字列の行位置を検出する。こ
れにより、文字列の周辺に高レベルで且つ大きな
汚れが存在していても十分な精度で、且つ、効率
的な文字列の行位置の検出を行うことが出来る。
〔産業上の利用分野〕
本発明は、活字文字や印字文字等、行幅が一定
な文字列の行位置検出方式、特に文字列の周辺に
高レベルで且つ大きな汚れが存在している場合に
も好適な文字列の行位置検出方式に関する。
〔従来の技術〕
文字認識を行う場合、各文字毎のデータの読み
取りを行う為の前処理として、各文字列について
その行位置の検出が行われる。
文字列の行位置の検出は、通常文字読取り装置
によつて検出される印刷用紙と文字の検出レベル
差を利用して行われていた。そして、印刷用紙に
汚れが存在する場合は、スレシヨルド回路や雑音
除去回路等により汚れ部分を除去して文字列の行
位置検出を行つていた。
〔発明が解決しようとする問題点〕
スレシヨルド回路や雑音除去回路等により汚れ
部分を除去して文字列の行位置検出を行を従方方
式は、薄い汚れや点状の小さな汚れを除去するこ
とは可能ではあるが、第2図Aに示すN1〜N6
な、レベルが高く、且つ、大きさも大きい汚れに
対しては、それを除去することが出来なかつた。
第2図Aは7Bフオントの印字文字列の例を示
したものであるが、この様に、横方向にレベルが
高く長く幅をもつた汚れN1〜N6が生じた場合に
は、従来方式では、N1〜N3,N4〜N6の位置を
誤つて行位置として検出する危険があつた。
〔問題点を解決するための手段〕
従来の文字列の行位置検出方式における前述の
問題点を解決する為に本発明が講じた手段を、第
1図を参照して説明する。
第1図は、本発明の構成をブロツク図で示した
ものである。
第1図において、110は印刷用紙で、行幅が
一定な文字列が印刷されている。
120は文字読取り手段で、文字列の横方向
(文字列と同じ方向)の走査線上に存在する各文
字部分又は汚れ部分を読取つて出力する。
130は文字列ヒストグラム作成手段で、文字
読取り手段120から入力されたデータに基づい
て、文字列の横方向のヒストグラムを作成する。
140は文字列行位置検出手段で、文字列ヒス
トグラムをスライスレベルを変えてスライスし、
そのスライス幅が基準行幅値に等しくなつた時の
文字列ヒストグラムのスライス点位置から、文字
列の行位置の検出を行う。
〔作用〕
第1図に示す構成を持つた本発明の作用を、第
2図を参照して説明する。
第2図Aは行幅が一定な文字列を示したもの
で、図には7Bフオントの文字列が例示されてい
る。同図Bは、同図Aの文字列における横方向の
文字列ヒストグラムを示したものである。
横方向の文字列ヒストグラムは、横方向の走査
線上に存在する各文字部分又は汚れ部分の長さに
比例する量をヒストグラムで示したものである。
第2図Bから解る様に、活字文字や印字文字
等、行幅が一定な文字列においては、本来の文字
列のヒストグラムHG(L)のレベルは、汚れ部
分のヒストグラムHG(Nu),HG(NL)よりも高
くなつている。又、本来の文字列ヒストグラム
HG(L)の行幅LWは略一定である。この性質
は、7Bフオントの様に、上下端部分に文字構成
部分が多い文字形体の文字列の場合に顕著に現れ
る。
本発明は、この新規な知見に基づき、横方向の
文字列ヒストグラムにおける文字列部分と汚れ部
分のヒストグラムのレベル差を利用して、文字列
の周囲に高レベルの大きい汚れが存在する場合で
も、文字列の行位置を確実に検出出来る様にした
ものである。
文字読取り手段120は、印刷用紙110上に
印刷された文字列の横方向の走査線上に存在する
各文字部分又は汚れ部分を読取つて出力する。
文字列ヒストグラム作成手段130は、文字読
取り手段120が読み取つたデータに基づいて、
第2図Bに示す様に、文字列の横方向のヒストグ
ラムを作成する。
文字列行位置検出手段140は、文字列ヒスト
グラム作成手段130が作成した文字列の横方向
ヒストグラムをスライスレベルSLを変えてスラ
イスし、そのスライス幅が本来の文字列ヒストグ
ラムHG(L)の行幅値に基づいて設定された基
準行幅値に等しくなつた時に文字列ヒストグラム
のスライス点位置U2,L2から、文字列の行位置
を検出する。
これにより、文字列の周辺に高レベルで且つ大
きな汚れが存在している場合でも、その文字列の
行位置を十分な精度で、且つ、効率良く検出する
ことが出来る。
〔実施例〕
本発明の一実施例を、第2図及び第3図を参照
して説明する。
第3図において、印刷用紙110は、文字読取
り手段120、文字列ヒストグラム作成手段13
0、及び行位置検出手段140については、既に
第1図で説明した通りである。
文字読取り手段120として例えば公知の光学
的文字読取り装置が用いられ、印刷用紙110上
の文字列を読み取つて得られた文字画像から、横
方向の走査線上に存在する各文字部分又は汚れ部
分のデータが黒ビツト列の形で出力される。
文字列ヒストグラム作成手段130において、
131はカウンタで、文字読取り器120から入
力された横方向の走査線上に存在する各文字部分
又は汚れ部分のデータである黒ビツト数をカウン
トする。
132はヒストグラム作成部で、カウンタ13
1から入力されたカウント値及び文字読取り手段
120から入力された横方向走査線の縦方向の座
標データに基づいて、文字列の横方向のヒストグ
ラムを作成する。
文字列行位置検出手段140において、141
はスライスレベル設定部で、文字列ヒストグラム
のスライスレベルSL(第2図B参照)を設定す
る。142は行幅検出部で、スライスレベルSL
でスライスされた文字列ヒストグラムの上下のス
ライス点位置U,Lより文字列の行幅(LW:
ULの距離)を検出する。
143は基準行幅設定部で、文字列の行幅の基
準値が設定される。この基準行幅値は、文字列の
行幅のバラツキや、文字列の配列方向と文字読取
り器121の走査方向のバラツキ等を考慮して、
ある幅を持つて設定される。
144は比較部で、行幅検出部142から入力
された文字列の行幅値LWと基準行幅設定部14
3から入力された基準行幅値SLWを比較する。
LW>SLWの時は、スライスレベル設定部141
に制御信号を送つてそのスライスレベルを上げる
様に制御する。LW=SLWになつた時は、行位置
検出部145に制御信号を送つて、行位置の検出
を行わせる。
行位置検出部145は、比較部144から制御
信号を受けると、行幅検出部142からの座標デ
ータから、文字列の行位置の検出を行う。
(動作の説明) 第3図の実施例の動作を、第2図を参照して説
明する。
文字読取り手段120は、印刷用紙110上に
印刷された文字列を横方向に走査して文字列の各
文字の読み取りを行い、その出力をカウンタ13
1に加える。
文字列を横方向に走査することにより、文字読
取り器121からは、その横歩行の走査線上に存
在する各文字部分又は汚れ部分のデータが黒ビツ
ト列の形で出力される。黒ビツト列の黒ビツト数
は、対応する文字部分又は汚れ部分の長さに比例
する。
カウンタ131は、文字読取り手段120から
入力された黒ビツト列の黒ビツト数をカウントす
るこにより、各横方向の走査線上に存在する全て
の文字部分又は汚れ部分の長さを示すカウント値
を出力して、ヒストグラム作成部132に加え
る。
ヒストグラム作成部132は、カウンタ131
から入力された各軸方向走査線に対するカウント
値及び文字読取り手段120から入力された各横
方向走査線の座標データに基づいて、第2図Bに
示す、文字列の横方向のヒストグラムを作成す
る。このヒストグラムは、本来の文字列ヒストグ
ラムHG(L)と汚れ部分のヒストグラムHG
(Nu),HG(NL)で形成されている。
行幅検出部142は、スライスレベル設定部1
41より入力されたスライスレベルSLでヒスト
グラム作成部132から入力されたヒストグラム
をスライスし、スライスされた文字列ヒストグラ
ムの上下のスライス、U,Lより文字列の行幅
LWを検出する。行幅LWのデータは比較的14
4に加えられ、上下のスライス点U,Lの座標デ
ータは行位置検出部145に加えられる。
比較部144は、行幅検出部142から入力さ
れた文字列の行幅値LWと基準行幅設定部143
から入力された基準行幅値SLWを比較する。LW
>SLWの時は、スライスレベル設定部141の
スライスレベルを上げる様に制御し、LW=SLW
になつた時に、行位置検出部145に制御信号を
送つて行位置の検出を行わせる。
スライスレベル設定部141のスライスレベル
は、最初は第2図Bに示す様に、汚れ力N1〜N6
のヒストグラムHG(Nu)及びHG(NL)よりも低
いスライスレベルSL1に設定されている。従つ
て、行幅検出部142によつて検出された行幅値
LW1はSWLよりも大きくなるので、比較部14
4は、スライスレベルSLのレベルを上げる。
スライスレベル設定部141の設定するスライ
スレベルの値が増大し、そのスライスレベルSL2
が本来の文字列ヒストグラムHG(L)をスライ
スする様になると、検出される行幅値LW2は基
準行幅値SLWと等しくなる。この時、比較部1
44は行位置検出部145に制御信号を送つて、
行位置検出を行わせる。又、行幅検出部142か
らは、スライスレベルSL2が文字列ヒストグラム
HG(L)をスライスした時の上下のスライス点
U2,L2の座標データが行位置検出部145に加
えられる。
行位置検出部145は、比較部144から制御
信号を受けると、行幅検出部142から入力され
た上下のスライス点U2,L2の座標データより、
文字列の行位置を検出する。文字列の行位置は、
文字列ヒストグラムHG(L)の上側のスライス
点U2、下側のスライス点L2、又は両者を平均す
ることにより得られる文字列の中央位置の座標に
よつて示される。
(他の実施例) 本発明は、更に次の様な態様で実施することが
出来る。
前述の実施例は基準行幅値SLWが一定の場合
であつた。
印刷用紙110上の文字は、第4図AおよびB
に示すように、文字が鮮明な場合もあり、また薄
かつたり不鮮明な場合もある。第4図Aで示す鮮
明な場合のみを対象にしたのが前述の実施例であ
り、この場合はヒストグラムHGは鮮明に表われ
るため、あらかじめ設定された基準行幅値SLW0
をもつて判定させることができる。しかし、第4
図Bで示すように、文字が不鮮明な場合は、出力
されるヒストグラムHGは、ヒストグラム値も低
下するが、文字の幅も不鮮明となり、かつ狭くな
る。したがつて、このような不鮮明な文字に対し
ても、鮮明な場合の基準行幅値SLW0で判定させ
ると、判定不能となる場合が生じる。
この場合は、第4図Cに示すように、基準行幅
値SLWをスライスレベルSLによつて変化させ
る。すなわち、スライスレベルSLが小の時は、
基準行幅値SLWをSLW0より少し大にし、スライ
スレベルSLが増加するに従つてSLWを小さくす
る。
このように、基準行幅値SLWをスライスレベ
ルによつて変化させることによつて文字が不鮮明
な場合のヒストグラムHGの幅が変化しても対処
することができる。
なお、このように基準行幅値SLWを変化させ
ると、正確な値SLW0より多少の誤差を生じる。
この誤差をも問題にする場合は、SLW0より小さ
くなつた分の1/2を行位置検出結果に補正すれば
よい。
第3図のスライスレベル設定部141より基準
行幅設定部143への点線は、スライスレベル設
定部141より出力されるスライスレベルSLを
基準行幅設定部143が受けて、基準行幅設定部
141は入力されたスライスレベルSLに対応す
る基準行幅値SLWを出力する。
なお、スライスレベルSLと文字列ヒストグラ
ムGH(L)の行幅値の対応関係は、その文字列
に用いられている文字形体から統計的に決められ
る。
〔発明の効果〕
以上説明した様に、本発明によれば、文字列の
周辺に高レベルで且つ大きな汚れが存在している
場合でも、十分な精度をもつて本来の文字列の行
位置の検出を行うことが出来る。又、スライスレ
ベルを変え、得られた文字列の行幅値と基準行幅
値を比較することにより本来の文字列の行位置の
検出が可能となるので、行位置の検出を効率良く
行うことが出来る。
【図面の簡単な説明】
第1図……本発明の構成のブロツク説明図、第
2図……本発明の文字列ヒストグラムの説明図、
第3図……本発明の一実施例の説明図、第4図…
…基準行幅値をスライスレベルによつて変化させ
る場合の説明図。 第1図において、110……印刷用紙、120
……文字読取り手段、130……文字列ヒストグ
ラム作成手段、140……文字列行位置検出手
段。

Claims (1)

  1. 【特許請求の範囲】 1 行幅が一定な文字列の行位置検出方式におい
    て、 (a) 文字列と横方向のヒストグラムを作成する文
    字列ヒストグラム作成手段130と、 (b) 文字列ヒストグラムをスライスレベルを変え
    てスライスし、そのスライス幅が基準行幅値に
    等しくなつた時の文字列ヒストグラムのスライ
    ス点(U,L)の位置から文字列の行位置を検
    出する文字列行位置検出手段140、 を設けたことを特徴とする文字列の行位置検出方
    式。 2 文字列行位置検出手段140において、基準
    行幅値がスライスレベルに対応して可変であるこ
    とを特徴とする特許請求の範囲第1項記載の文字
    列の行位置検出方式。
JP60109613A 1985-05-22 1985-05-22 文字列の行位置検出方式 Granted JPS61267184A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60109613A JPS61267184A (ja) 1985-05-22 1985-05-22 文字列の行位置検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60109613A JPS61267184A (ja) 1985-05-22 1985-05-22 文字列の行位置検出方式

Publications (2)

Publication Number Publication Date
JPS61267184A JPS61267184A (ja) 1986-11-26
JPH0459670B2 true JPH0459670B2 (ja) 1992-09-22

Family

ID=14514734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60109613A Granted JPS61267184A (ja) 1985-05-22 1985-05-22 文字列の行位置検出方式

Country Status (1)

Country Link
JP (1) JPS61267184A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63214888A (ja) * 1987-03-03 1988-09-07 Mazda Motor Corp 画像処理方法
JPH087031A (ja) * 1994-06-22 1996-01-12 Nec Corp 文字枠検出装置

Also Published As

Publication number Publication date
JPS61267184A (ja) 1986-11-26

Similar Documents

Publication Publication Date Title
EP0054439A2 (en) Character segmentation method
US20050238252A1 (en) System and method of determining image skew using connected components
US5966473A (en) Method and apparatus for recognizing a quadrilateral object contained in an input bitmap image
JPH0459670B2 (ja)
EP0602180A1 (en) LOCATION OF CHARACTERS FOR IDENTIFICATION OF CHARACTERS.
JPH04352295A (ja) 文字列方向判別装置
JPH0373916B2 (ja)
JPH087031A (ja) 文字枠検出装置
JP2924440B2 (ja) 住所記載領域検出装置
JPS59180783A (ja) 光学的文字読取装置
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JP3381803B2 (ja) 傾き角検出装置
JP2001291058A (ja) 文字認識装置及び記録媒体
JPH053632B2 (ja)
JP2511131B2 (ja) 文字認識装置
JPH03122786A (ja) 光学的文字読取装置
JPH06325197A (ja) バーコード認識方法
JP3116622B2 (ja) 印字済み行検出方法
JPH09106438A (ja) 等幅フォントにおける幅の検出方法および装置
JPH05128308A (ja) 文字認識装置
JPH11232388A (ja) 文書・帳票認識システム
JPH03282895A (ja) 光学的文字読取装置
JPS6139172A (ja) 文字検出切出方式
JPH10171924A (ja) 文字認識装置
JP2690483B2 (ja) 文字行切出し方法