JPH0620091A - 文字サイズ抽出方法 - Google Patents

文字サイズ抽出方法

Info

Publication number
JPH0620091A
JPH0620091A JP4172304A JP17230492A JPH0620091A JP H0620091 A JPH0620091 A JP H0620091A JP 4172304 A JP4172304 A JP 4172304A JP 17230492 A JP17230492 A JP 17230492A JP H0620091 A JPH0620091 A JP H0620091A
Authority
JP
Japan
Prior art keywords
character
width
histogram
height
character size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4172304A
Other languages
English (en)
Inventor
Ayumi Tachibana
亜由美 橘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4172304A priority Critical patent/JPH0620091A/ja
Publication of JPH0620091A publication Critical patent/JPH0620091A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 長体・正体・平体文字において、文字切り出
しを行うための文字サイズの決定を自動的に行う。 【構成】 入力された文書画像から黒画素連結成分の外
接矩形を抽出する。各行において、文字列方向と垂直に
重なった外接矩形を統合する(基本矩形)。文字サイ
ズ、行間が変化する行を検出することにより、領域に分
割する。分割領域毎に、基本矩形の幅/高さについてヒ
ストグラムを作成し、長体・正体・平体文字を判別し、
文字の幅/高さを算出する。文字の幅/高さより、文字
サイズを決定する。 【効果】 基本矩形の幅/高さのヒストグラムより、長
体・正体・平体文字の判別を行い、文字の幅/高さを算
出するため、マニュアルで設定する必要がなく、正確に
文字サイズを決定することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語文書をスキャナ
等の画像読み取り装置から画像データとして読み込み、
1文字ずつ認識する日本語文字認識装置における、文字
サイズ抽出方法に関するものである。
【0002】
【従来の技術】一般に、文字の幅と高さは等しいことか
ら、従来は、行を抽出し、行の幅即ち行の高さを文字の
幅、高さに決定していた。
【0003】
【発明が解決しようとする課題】しかしながら、平体文
字(正体文字を横に偏平したもの)や長体文字(正体文
字を縦に偏平したもの)の場合、文字の幅と高さは等し
くないので、正確に文字サイズを決定できず、あらかじ
め、マニュアルで設定する必要があった。
【0004】
【課題を解決するための手段】本発明は、上記課題を解
決するため、各行において、文字列方向と垂直に重なる
外接矩形を統合し(基本矩形)、文字サイズ、行間が変
化する行を検出することにより領域に分割し、分割領域
毎に、基本矩形の幅/高さについてヒストグラムを作成
する。ヒストグラムより長体・正体・平体文字のいずれ
であるかを判別し、文字の幅/高さを算出し、文字サイ
ズを決定する。
【0005】
【作用】本発明は上記した構成により、長体・正体・平
体文字のいずれであるかを自動的に判別し、文字の幅/
高さを算出するため、マニュアルで設定する必要がな
く、正確に文字サイズを決定することができる。
【0006】
【実施例】図1、図2は、それぞれ、本発明の一実施例
における文字サイズ抽出方法を用いた文字認識装置の機
能ブロック図、装置ブロック図である。図1において、
1は、スキャナ等の画像読み取り装置から文書画像を入
力する画像入力部、2は、入力された文書画像から黒画
素連結成分の外接矩形を抽出する外接矩形抽出部、3
は、外接矩形を基に行を切り出す行切り出し部、4は、
各行において、文字列方向と垂直に重なった外接矩形を
統合する基本矩形作成部、5は、文字サイズ、行間の変
化行を検出し、領域に分割する領域分割部、6は、基本
矩形の幅/高さについてヒストグラムを作成するヒスト
グラム作成部、7は、ヒストグラム作成部で作成したヒ
ストグラムより、長体・正体・平体文字の判別を行う長
体・正体・平体判別部、8は、文字サイズを決定する文
字サイズ算出部、9は、文字サイズを出力する出力部で
ある。
【0007】図2において、10は、文書画像を画像デ
ータとして読み込むスキャナ、11は、全体の制御を行
なう中央演算処理装置(以下、CPUと略称する)、1
2は、リードオンリメモリであり、CPUが実行する制
御プログラムを記憶しているプログラム領域13、長
体、正体、平体ブロック分割テーブル14から構成され
る。15は、ランダムアクセスメモリであり、スキャナ
10から読み込んだ画像データを記憶する文書画像記憶
領域16、基本矩形記憶領域17、ヒストグラム領域1
8、分割領域記憶領域19、文字サイズ記憶領域20か
ら構成される。21は、表示装置である。
【0008】以上のように構成された本実施例の処理手
順について、図3に示すフローチャートに従って、以下
その動作を説明する。
【0009】s1では、スキャナ10から文書画像を入
力し、文書画像記憶領域16に格納する。
【0010】s2では、文書画像の黒画素連結部分の外
接矩形を抽出する。s3では、抽出された外接矩形よ
り、行を切り出す。
【0011】s4では、文字列方向と垂直に重なった外
接矩形を統合し(基本矩形)、基本矩形記憶領域17に
格納する。例として、図8(a)の文書画像の最初の行
が(b)のような場合、外接矩形、基本矩形は(c)、
(d)のようになる。
【0012】s5では、文字サイズ、あるいは行間が変
化する行を検出し、領域に分割する。
【0013】s6では、基本矩形の幅/高さについてヒ
ストグラムを作成する。s7で、現在の行が、s5で分
割された領域の最終行である場合、s9へ、そうでない
場合、s8で対象行を次の行に設定し、s6を繰り返
す。
【0014】s9では、ヒストグラムより、長体・正体
・平体文字の判定を行う。s10では、文字の幅/高さ
を決定し、文字サイズを算出する。s5、s6、s9、
s10については、後で詳述する。
【0015】次に、領域の分割について、図4に示すフ
ローチャートに従って、その動作を説明する。例とし
て、図8(a)の文書画像の各行の幅、行間が図9のよ
うなものであったとし、以下、説明する。
【0016】s13では、行の幅の平均ave1を最初
の行の幅に、行間の平均ave2を0に初期設定する。
【0017】s14では、行の幅、行間を算出する。s
15では、現在の行の幅、行間が、それぞれave1、
ave2と等しいかどうか判定し、等しい場合、s16
へ、等しくない場合、s19へ移行する。この判定は、 ave1×th1≦行の幅≦ave1×th2 かつ (ave2=0 または ave2×th1≦行 間≦ave2×th2) (th1=0.85、th2=1/0.85) (1) を満たす場合、等しいとする。図9の例では、2行目
で、ave1=75、ave2=0であるので、 ave1×th1=75×0.85=63.8、ave
1×th2=75×(1/0.85)=88.2 で、(1)式を満たし、等しいと判定する。また、3行
目では、ave1=77、ave2=82であるので、 ave1×th1=77×0.85=65.5、ave
1×th2=77×(1/0.85)=90.6 ave2×th1=82×0.85=69.7、ave
2×th2=82×(1/0.85)=96.5 で、(1)式を満たさないので、等しくないと判定す
る。
【0018】s16では、文書画像内の全ての行につい
て処理が終了していれば、s19へ移行し、終了してい
なければ、s17へ移行する。
【0019】s17では、ave1を、ave1と現在
の行の幅の平均値に更新し、ave2 を、ave2が0
の時は、現在の行間に、0でない時は、ave2と現在
の行間の平均値に更新し、s18で対象行を次の行に設
定し、s14へ戻って処理を繰り返す。図9の例では、
1行目の時、ave1=75、ave2=0であるの
で、 ave1=(ave1+75)/2=75、ave2=
0 に更新され、2行目の時、ave1=75、ave2=
0であるので、 ave1=(ave1+78)/2=76.5、ave
2=82 に更新される。
【0020】s19では、処理中の行を文字サイズ、行
間の変化行とし、直前の行を分割領域の最終行と決定
し、分割領域記憶領域19に格納し、終了する。図9よ
り、1行目〜2行目、3行目〜5行目、6行目、7行目
〜9行目が、分割領域となる。
【0021】次に、基本矩形の幅/高さのヒストグラム
の作成について、図5に示すフローチャートに従って、
その動作を説明する。例として、図8(d)の行の幅、
基本矩形の幅、高さが、図10のようなものであったと
し、以下、説明する。
【0022】s20では、行の幅を仮文字幅に設定す
る。図10より、仮文字幅は、75となる。
【0023】s21では、基本矩形の幅が、仮文字幅×
th3(th3=0.5)以上である場合、s22へ、
そうでない場合、s24へ移行する。これは、分離文
字、半角文字等を除くためである。図10より、仮文字
幅×th3=75×0.5=37.5であるので、基本
矩形A、B、C、D、F、G、H、I、J、K、M、
N、O、P、Q、Tの場合、s22へ移行し、基本矩形
E、L、R、S、Uの場合、s24へ移行する。
【0024】s22では、基本矩形の幅/高さを算出
し、s23で、ヒストグラム領域18にその値を加算す
る。ヒストグラムは、0.1単位とする。図10より、
基本矩形Aの場合、幅/高さ=55/51=1.08
で、ヒストグラムの1.1のところを、+1する。
【0025】s24では、行に含まれる全ての基本矩形
について処理が終了していれば、ヒストグラムの作成を
終了し、終了していなければs25で、対象矩形を次の
基本矩形に設定し、s21へ戻って処理を繰り返す。図
8(d)の行の全ての基本矩形について処理が終了する
と、図11に示すようなヒストグラムが作成される。図
8(a)の文書画像について処理が終了し、s5で分割
された1行目〜2行目の領域で、図11のようなヒスト
グラムが作成されたものとする。
【0026】次に、長体・正体・平体文字の判定につい
て、図6に示すフローチャートに従って、その動作を説
明する。例として、図11のヒストグラムにより、以
下、説明する。
【0027】s26では、ヒストグラムを、図12に示
す長体・正体・平体ブロック分割テーブル14に示すよ
うに、5個のブロックに分割する。
【0028】s27では、各ブロックについて、及び全
体について、ヒストグラムの度数の総計を算出する。図
11のヒストグラムでは、図12に示すようになる。
【0029】s28では、最大の度数のブロックを抽出
する。図12より、ブロック4が最大の度数となる。
【0030】s29では、最大の度数のブロックが、長
体のブロックであれば、s30へ移行し、そうでなけれ
ば、s32へ移行する。
【0031】s30では、正体のブロックと、平体のブ
ロックの度数の和が、全体の度数×th4(th4=
0.2)より大きければ、s31へ移行し、そうでなけ
れば、長体と判定し、終了する。図12より、全体の度
数×th4=32×0.2=6となり、最大の度数のブ
ロックが長体のブロックであっても、正体のブロックと
平体のブロックの度数の和が6より、大きければ、長体
と判定しない。これは、分離文字や、半角文字が多く含
まれた文書の場合を考慮しているためである。
【0032】s31では、正体のブロックのうち、最大
の度数のブロックを抽出し、s33へ移行する。
【0033】s32では、最大のブロックが、正体であ
れば、s33へ移行し、そうでなければ、平体と判定
し、終了する。
【0034】s33では、平体のブロックの度数が、全
体の度数×th4より大きければ、s34へ移行し、そ
うでなければ、正体と判定し、終了する。これも、s3
0と同様であり、最大の度数のブロックが正体のブロッ
クであっても、平体のブロックの度数が6より、大きけ
れば、正体と判定しない。
【0035】s34では、平体のブロックのうち、最大
の度数のブロックを抽出し、平体と判定し、終了する。
【0036】次に、文字の幅/高さの決定と文字サイズ
の決定について、図5に示すフローチャートに従って、
その動作を説明する。
【0037】s35では、決定したブロックに含まれる
基本矩形の幅/高さの平均と、最大高さを算出する。図
8(b)の行では、決定したブロックに含まれる基本矩
形はA、C、D、G、H、I、J、N、P、Qであるの
で、基本矩形の幅/高さの平均は、 (1.08+1.27+ …… +1.29+1.1
8)/11=1.24 となる。また、基本矩形の最大高さは、66となる。
【0038】s36では、文字の幅/高さを基本矩形の
幅/高さの平均に決定する。図8(b)の行では、文字
の幅/高さ=1.24に決定する。
【0039】s37では、文字の高さを基本矩形の最大
高さに決定する。図8(b)の行では、文字の高さ=6
6に決定する。
【0040】s38では、文字の幅を文字の高さ×文字
の幅/高さに決定する。図8(b)の行では、文字の幅
=66×1.24=82となる。以上の処理で算出され
た文字サイズを文字サイズ記憶領域20に格納する。
【0041】s39では、文書画像に含まれる全ての行
について文字サイズが決定していれば文字サイズ決定を
終了し、そうでなければs40で対象行を次の行に設定
し、s35へ戻って処理を繰り返す。
【0042】以上、横書き文書の場合について説明を行
ったが、縦書き文書の場合でも、同様に処理することが
できる。
【0043】
【発明の効果】本発明は、基本矩形の幅/高さのヒスト
グラムより、長体・正体・平体文字の判別を行い、文字
の幅/高さを算出するため、マニュアルで設定する必要
がなく、正確に文字サイズを決定することができる優れ
た文字サイズ抽出方法である。
【図面の簡単な説明】
【図1】本発明の一実施例における文字サイズ抽出方法
を用いた装置の機能ブロック図
【図2】本実施例における文字サイズ抽出方法を用いた
装置の装置ブロック図
【図3】本実施例の処理手順を示すフローチャート
【図4】本実施例における領域の分割の処理手順を示す
フローチャート
【図5】本実施例における基本矩形の幅/高さのヒスト
グラムの作成の処理手順を示すフローチャート
【図6】本実施例における長体・正体・平体文字の判定
の処理手順を示すフローチャート
【図7】本実施例における文字の幅/高さの決定と文字
サイズの決定の処理手順を示すフローチャート
【図8】本実施例における文字サイズ抽出方法を説明す
るための説明図
【図9】本実施例における行の幅、行間の例を示す図
【図10】本実施例における行の幅、基本矩形の幅、高
さの例を示す図
【図11】本実施例におけるヒストグラムの例を示す図
【図12】本実施例における長体・正体・平体ブロック
分割テーブルを示す図
【符号の説明】
1 画像入力部 2 外接矩形抽出部 3 行切り出し部 4 基本矩形作成部 5 領域分割部 6 ヒストグラム作成部 7 長体・正体・平体文字判別部 8 文字サイズ算出部 9 出力部 10 スキャナ 11 中央演算処理装置(CPU) 12 リードオンリメモリ(ROM) 13 プログラム領域 14 長体・正体・平体ブロック分割テーブル 15 ランダムアクセスメモリ(RAM) 16 文書画像記憶領域 17 基本矩形記憶領域 18 ヒストグラム領域 19 分割領域記憶領域 20 文字サイズ記憶領域 21 表示装置

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力された文書画像から黒画素連結成分の
    外接矩形を抽出し、各行において、文字列方向と垂直に
    重なった外接矩形を統合し、文字サイズ、行間が変化す
    る行を検出することにより領域に分割し、分割領域毎
    に、基本矩形の幅/高さについてヒストグラムを作成
    し、ヒストグラムより長体・正体・平体文字のいずれで
    あるか判別し、文字の幅/高さを決定し、文字の幅/高
    さより、文字切り出しを行うための文字サイズを抽出す
    ることを特徴とする文字サイズ抽出方法。
JP4172304A 1992-06-30 1992-06-30 文字サイズ抽出方法 Pending JPH0620091A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4172304A JPH0620091A (ja) 1992-06-30 1992-06-30 文字サイズ抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4172304A JPH0620091A (ja) 1992-06-30 1992-06-30 文字サイズ抽出方法

Publications (1)

Publication Number Publication Date
JPH0620091A true JPH0620091A (ja) 1994-01-28

Family

ID=15939444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4172304A Pending JPH0620091A (ja) 1992-06-30 1992-06-30 文字サイズ抽出方法

Country Status (1)

Country Link
JP (1) JPH0620091A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103872A (ja) * 2010-11-10 2012-05-31 Sharp Corp 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
US10594890B2 (en) * 2016-02-11 2020-03-17 Hewlett-Packard Development Company, L.P. Compressing each object in an electronic document

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012103872A (ja) * 2010-11-10 2012-05-31 Sharp Corp 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体
CN102592299A (zh) * 2010-11-10 2012-07-18 夏普株式会社 文件生成装置和文件生成方法
US9110871B2 (en) 2010-11-10 2015-08-18 Sharp Kabushiki Kaisha Correcting a document character size based on the average value of each character size
US10594890B2 (en) * 2016-02-11 2020-03-17 Hewlett-Packard Development Company, L.P. Compressing each object in an electronic document

Similar Documents

Publication Publication Date Title
JPH05347698A (ja) ハイライト領域検出方法
JPH0620092A (ja) 文書画像の領域識別方法
US5050229A (en) Method and apparatus for thinning alphanumeric characters for optical character recognition
EP0457534A2 (en) Image processing method and apparatus
EP1074953A2 (en) Image retrieval apparatus and method
JPH0620091A (ja) 文字サイズ抽出方法
US6356657B1 (en) Image processing method and apparatus for discriminating an input image area or an attribute of image information in the discriminated area
JPH07129713A (ja) 文字認識装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP3548234B2 (ja) 文字認識方法及び装置
JP3187895B2 (ja) 文字領域抽出方法
JPH0962763A (ja) バーコードの検出方法
JP2000040122A (ja) 文字切り出し方法
JPH05282492A (ja) 文字サイズ抽出方法
JPH0679348B2 (ja) 行切り出し方法
JPS62165284A (ja) 文字列抽出方式
JP3355234B2 (ja) 画像2値化装置
JP2926842B2 (ja) 文字切出し回路
JPH0676105A (ja) 文書認識システム
JPH0918702A (ja) 画像処理装置及び方法
JPH08272987A (ja) 画像処理方法及びその装置
JPH02263272A (ja) 文書画像処理装置
JPH09130612A (ja) 画像処理装置
JPH08241376A (ja) 文字認識装置および文字認識方法
JPH04205394A (ja) 光学的文字読取装置