JPH10254994A - サイズ識別方法および記憶媒体 - Google Patents
サイズ識別方法および記憶媒体Info
- Publication number
- JPH10254994A JPH10254994A JP9060380A JP6038097A JPH10254994A JP H10254994 A JPH10254994 A JP H10254994A JP 9060380 A JP9060380 A JP 9060380A JP 6038097 A JP6038097 A JP 6038097A JP H10254994 A JPH10254994 A JP H10254994A
- Authority
- JP
- Japan
- Prior art keywords
- line
- rectangle
- document image
- size
- height
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Processing Or Creating Images (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
を精度よく行う。 【解決手段】 文字切り出し部4は、切り出された行か
ら文字画像の外接矩形を切り出す。サイズ識別部5は、
行内の矩形の幅、高さの平均を求め、所定の幅、高さを
満たす矩形について、その高さの最大値を求め、サイズ
算出部53は、高さの最大値と解像度を基にサイズを算
出する。
Description
なく、行毎にフォントサイズを精度よく識別するサイズ
識別方法および記憶媒体に関する。
字画像の認識処理によって単に文字コードを求めるにと
どまらず、そのサイズやフォント等の属性を求めること
が要求される。ところで、従来の文字認識装置は入力画
像中の文字パターンを認識し、その文字コードを出力す
るもので、文字属性の一つであるサイズを識別してその
識別結果を出力することが困難であった。
て、例えば特開平4−306783号公報に記載された
第1の技術、特開平6−176188号公報に記載され
た第2の技術が提案されている。
は、外接矩形の幅と高さを用いて文字サイズを識別する
手法を採っているが、これは一文字毎に文字サイズを求
める方法であるので、一文字毎に、その大きさに相当の
ばらつきが出てしまうという問題点があった。また、文
書画像を画像入力装置から入力したときの解像度情報を
用いていないので、文書中の相対的なサイズしか検出さ
れず、絶対的なサイズ(つまり、ポイント数や級数な
ど)が得られないという問題点もあった。
文字毎に文字サイズを求める方法であるが、この方法で
は文字毎に基準となるサイズのテーブルを保持し、その
テーブルを参照することによって文字サイズを算出して
いる。しかし、この方法では文字毎のテーブルを作成す
るのに多大な労力を要すると共に、文字認識処理を必要
とし、さらに、プログラムサイズが増大するという問題
点があった。
結果が一行内で一文字毎にばらつきが生じると共に、相
対的なサイズしか得られず、しかもプログラムサイズが
増大してしまう。
もので、本発明の目的は、文字認識することなくフォン
トサイズの識別を行うことにより、プログラムサイズが
小さく、かつ高速、高精度にフォントサイズを識別する
もので、行毎に行に属する全文字の外接矩形の高さの最
大値または行に属する全文字の外接矩形に対する回帰直
線から得られる情報と、画像入力時の解像度情報を基に
行毎にフォントサイズを識別するサイズ識別方法および
記憶媒体を提供することにある。
に、請求項1記載の発明では、入力された文書画像から
行毎に、行に属する全文字の外接矩形の高さの最大値を
求め、前記文書画像を入力したときの解像度と前記最大
値とを基に行のフォントサイズを算出することを特徴と
している。
値を求める外接矩形は、全文字の外接矩形の高さの平均
値に所定の定数を乗じた値よりも大きい高さで、かつ、
全文字の外接矩形の幅の平均値に所定の定数を乗じた値
よりも大きい幅の矩形であることを特徴としている。
画像から行毎に、行に属する全矩形の左の辺(横書きの
場合)または上の辺(縦書きの場合)の中点に対して回
帰直線を求め、該回帰直線を少なくとも一つの矩形と交
わる範囲において上下または左右に最大限に平行移動
し、上または右に平行移動した第1の直線と下または左
に平行移動した第2の直線との距離を求め、前記文書画
像を入力したときの解像度と前記距離とを基に行のフォ
ントサイズを算出することを特徴としている。
求める矩形は、行に属する全文字の外接矩形の高さの平
均値に所定の定数を乗じた値よりも大きい高さで、か
つ、全文字の外接矩形の幅の平均値に所定の定数を乗じ
た値よりも大きい幅の矩形であることを特徴としてい
る。
画像から行毎に、行に属する全文字の外接矩形の高さの
最大値を求める機能と、前記文書画像を入力したときの
解像度と前記最大値とを基に行のフォントサイズを算出
する機能をコンピュータに実現させるためのプログラ
ム、あるいは、入力された文書画像から行毎に、行に属
する全矩形の左の辺(横書きの場合)または上の辺(縦
書きの場合)の中点に対して回帰直線を求める機能と、
該回帰直線を少なくとも一つの矩形と交わる範囲におい
て上下または左右に最大限に平行移動し、上または右に
平行移動した第1の直線と下または左に平行移動した第
2の直線との距離を求める機能と、前記文書画像を入力
したときの解像度と前記距離とを基に行のフォントサイ
ズを算出する機能をコンピュータに実現させるためのプ
ログラムを記憶したことを特徴としている。
用いて具体的に説明する。 〈実施例1〉図1は、本発明の実施例1の構成を示す。
実施例1のサイズ識別装置は、文書を2値画像として読
む込む画像入力部1と、画像データなどを蓄えるメモリ
2と、文書画像から文字画像のみを行単位に抽出する行
切り出し部3と、行切り出し部3で抽出された行の画像
から文字画像のみを抽出し、その外接矩形を求める文字
切り出し部4と、サイズ識別をするサイズ識別部5と、
全体を制御する制御部6と、識別結果を出力する結果出
力部7から構成されている。
形の幅、高さを求める矩形幅、高さ抽出部51と、矩形
の幅、高さの平均を算出する平均算出部52と、矩形の
高さの最大値と文書画像の解像度からサイズを算出する
サイズ算出部53から構成されている。
示す。図2を参照しながら、実施例1の動作を説明す
る。
により、識別対象である原稿を画像情報として本装置内
のメモリ2に取り込む。処理ステップS102では、行
切り出し部3は、文書画像から文字画像のみを行単位に
抽出する行切り出し処理を行う。処理ステップS103
では、文字切り出し部4は、行切り出し部3で抽出され
た行の画像から文字画像のみを抽出し、その外接矩形を
求める文字切り出し処理を行う。
行カウンタiを1にセットする。処理ステップS105
では、サイズ識別部5の矩形幅、高さ抽出部51は、行
に属する矩形の幅、高さを抽出し、平均算出部52は、
行に属する全矩形の高さの平均(meanH)を求め
る。処理ステップSl06では、平均算出部52は、行
に属する全矩形の幅の平均(meanW)を求める。
矩形の高さの最大値Hを0に初期化する。処理ステップ
S108では、メモリ2内の文字カウンタjを0にリセ
ツトする。
53は、矩形の幅、高さが以下の条件を全て満たすか否
かを判定し、満たせば処理ステップS110に進み、満
たさなければ処理ステップS111に進む。
1)であり、例えば0.5である。
最大値Hをhに更新する。処理ステップS111では、
文字カウンタjを1だけインクリメントする。処理ステ
ップS112では、注目行に他に文字矩形があるか否か
を判定し、ある場合には処理ステップS109に進み、
ない場合には処理ステップS113に進む。
53は、Hと文書画像の解像度から以下の式によって文
字サイズを算出する。すなわち、ポイント数と実際の大
きさ(インチ)は、 1[point]=1[inch]/72 の関係があるので、求めるポイント数は Sline[point]=H[pixel]×72/
r[dpi] となる。ここで、 Sline:各行のポイント数 H:外接矩形の高さの最大値 r:解像度[dpi] 処理ステップS114では、未処理の行があるか否かを
判定する。未処理の行があれば処理ステップS105に
進み、なければ処理を終了する。
構成を示す。実施例2のサイズ識別装置は、実施例1と
同様に、文書を2値画像として読む込む画像入力部21
と、画像データなどを蓄えるメモリ22と、文書画像か
ら文字画像のみを行単位に抽出する行切り出し部23
と、行切り出し部23で抽出された行の画像から文字画
像のみを抽出し、その外接矩形を求める文字切り出し部
24と、サイズ識別をするサイズ識別部25と、全体を
制御する制御部26と、識別結果を出力する結果出力部
27から構成されている。
る全矩形の高さの平均、全矩形の幅の平均を算出する平
均算出部251と、行内の文字矩形から回帰直線を求め
る回帰直線算出部252と、回帰直線を基に行の高さを
算出する行高さ算出部253と、行の高さと文書画像の
解像度からサイズを算出するサイズ算出部254から構
成されている。
示す。図5を用いて実施例2の処理動作を説明する。
1により、識別対象である原稿を画像情報として本装置
内のメモリ22に取り込む。処理ステップS202で
は、行切り出し部23は、文書画像から文字画像のみを
行単位に抽出する行切り出し処理を行う。
部24は、行切り出し部23で抽出された行の画像から
文字画像のみを抽出し、その外接矩形を求める文字切り
出し処理を行う。処理ステップS204では、メモリ2
2内の行カウンタiを0にリセットする。
25内の平均算出部251は、行に属する全矩形の高さ
の平均(meanH)を求める。処理ステップS206
では、平均算出部251は行に属する全矩形の幅の平均
(meanW)を求める。処理ステツプS207では、
メモリ22内の文字カウンタjを0にリセツトする。
部252は、矩形の幅、高さが以下の条件を全て満たす
か否かを判定し、満たせば処理ステップS209に進
み、満たさなければ処理ステップS210に進む。
1)であり、例えば0.5である。
を満たす矩形に「適フラグ」を立てる。処理ステップS
210では、メモリ22内の文字カウンタjを1だけイ
ンクリメントする。処理ステップS211では、注目行
に他に文字矩形があるか否かを判定し、ある場合にはス
テップS208に進み、ない場合にはステップS212
に進む。
部252は、「適フラグ」の立っている全矩形に対して
回帰直線を求める。処理ステップS213では、行高さ
算出部253は、回帰直線を少なくとも一つの適フラグ
の立っている矩形と交わる範囲で最も外側まで平行移動
することによって得られる2直線を求め、2直線の距離
を求める。この距離が行の高さHaとなる。
の高さを説明する図である。すなわち、ステップS20
8の条件を満たす全ての外接矩形について((a)は、
全ての矩形が条件を満たす場合、(b)では条件を満た
さない矩形を除く場合)、矩形の左の辺の中点に対して
回帰直線を求める。この回帰直線を上下方向に、最も外
側の矩形と交差するまで平行移動させ、交差したときの
2直線間の距離を行の高さとする。なお、縦書きの場合
は、矩形の上の辺の中点に対して回帰直線を求め、この
回帰直線を左右方向に平行移動させる。
254は、行の高さHaと文書画像の解像度から以下の
式によって文字サイズを算出する。すなわち、ポイント
数と実際の大きさ(インチ)は、 1[point]=1[inch]/72 の関係があるので、求めるポイント数は Sline[point]=Ha[pixel]×72
/r[dpi] となる。ここで、 Sline:各行のポイント数 Ha:行の高さ r:解像度 処理ステップS215では、未処理の行があるか否かを
判定する。未処理の行があれば処理ステップS205に
進み、なければ処理を終了する。
されず、ソフトウェアによっても実現することができ
る。本発明をソフトウェアによって実現する場合には、
図6に示すように、CPU、ROM、RAM、表示装
置、ハードディスク、キーボード、CD−ROMドライ
ブ、スキャナなどからなる汎用の処理装置を用意し、C
D−ROMなどのコンピュータ記憶媒体には、本発明の
サイズ識別機能を実現するプログラムが記録されてい
る。また、識別対象となる原稿はスキャナから取り込
む。
ば、文書画像の文字のサイズを精度良く識別することが
可能となり、文書画像を再現するときに特に有効であ
る。また、文字認識処理や辞書を必要としないので、高
速かつサイズの小さいプログラムによって装置を構成す
ることができる。
説明する図である。
Claims (5)
- 【請求項1】 入力された文書画像から行毎に、行に属
する全文字の外接矩形の高さの最大値を求め、前記文書
画像を入力したときの解像度と前記最大値とを基に行の
フォントサイズを算出することを特徴とするサイズ識別
方法。 - 【請求項2】 前記高さの最大値を求める外接矩形は、
全文字の外接矩形の高さの平均値に所定の定数を乗じた
値よりも大きい高さで、かつ、全文字の外接矩形の幅の
平均値に所定の定数を乗じた値よりも大きい幅の矩形で
あることを特徴とする請求項1記載のサイズ識別方法。 - 【請求項3】 入力された文書画像から行毎に、行に属
する全矩形の左の辺(横書きの場合)または上の辺(縦
書きの場合)の中点に対して回帰直線を求め、該回帰直
線を少なくとも一つの矩形と交わる範囲において上下ま
たは左右に最大限に平行移動し、上または右に平行移動
した第1の直線と下または左に平行移動した第2の直線
との距離を求め、前記文書画像を入力したときの解像度
と前記距離とを基に行のフォントサイズを算出すること
を特徴とするサイズ識別方法。 - 【請求項4】 前記回帰直線を求める矩形は、行に属す
る全文字の外接矩形の高さの平均値に所定の定数を乗じ
た値よりも大きい高さで、かつ、全文字の外接矩形の幅
の平均値に所定の定数を乗じた値よりも大きい幅の矩形
であることを特徴とする請求項3記載のサイズ識別方
法。 - 【請求項5】 入力された文書画像から行毎に、行に属
する全文字の外接矩形の高さの最大値を求める機能と、
前記文書画像を入力したときの解像度と前記最大値とを
基に行のフォントサイズを算出する機能をコンピュータ
に実現させるためのプログラム、あるいは、入力された
文書画像から行毎に、行に属する全矩形の左の辺(横書
きの場合)または上の辺(縦書きの場合)の中点に対し
て回帰直線を求める機能と、該回帰直線を少なくとも一
つの矩形と交わる範囲において上下または左右に最大限
に平行移動し、上または右に平行移動した第1の直線と
下または左に平行移動した第2の直線との距離を求める
機能と、前記文書画像を入力したときの解像度と前記距
離とを基に行のフォントサイズを算出する機能をコンピ
ュータに実現させるためのプログラムを記憶した記憶媒
体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06038097A JP3711186B2 (ja) | 1997-03-14 | 1997-03-14 | サイズ識別方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06038097A JP3711186B2 (ja) | 1997-03-14 | 1997-03-14 | サイズ識別方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10254994A true JPH10254994A (ja) | 1998-09-25 |
JP3711186B2 JP3711186B2 (ja) | 2005-10-26 |
Family
ID=13140490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06038097A Expired - Fee Related JP3711186B2 (ja) | 1997-03-14 | 1997-03-14 | サイズ識別方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3711186B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7630581B2 (en) * | 2004-06-30 | 2009-12-08 | Ricoh Company, Ltd. | Correcting image distortion caused by scanning |
JP2016062412A (ja) * | 2014-09-19 | 2016-04-25 | コニカミノルタ株式会社 | 画像処理システム、フォントサイズ決定方法及びフォントサイズ決定プログラム |
-
1997
- 1997-03-14 JP JP06038097A patent/JP3711186B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7630581B2 (en) * | 2004-06-30 | 2009-12-08 | Ricoh Company, Ltd. | Correcting image distortion caused by scanning |
JP2016062412A (ja) * | 2014-09-19 | 2016-04-25 | コニカミノルタ株式会社 | 画像処理システム、フォントサイズ決定方法及びフォントサイズ決定プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3711186B2 (ja) | 2005-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US5075895A (en) | Method and apparatus for recognizing table area formed in binary image of document | |
JP4300098B2 (ja) | オブジェクト識別方法とその装置、プログラム及び記録媒体 | |
US7146047B2 (en) | Image processing apparatus and method generating binary image from a multilevel image | |
JPH10254994A (ja) | サイズ識別方法および記憶媒体 | |
JP3912463B2 (ja) | 論理構造抽出装置及び論理構造抽出方法 | |
JP3488678B2 (ja) | 画像分類装置 | |
JP2917427B2 (ja) | 図面読取装置 | |
JP3019897B2 (ja) | 行切出し方法 | |
JP4616522B2 (ja) | 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体 | |
JP2812391B2 (ja) | パターン処理方法 | |
JP3077929B2 (ja) | 文字切出し方式 | |
JP3100825B2 (ja) | 線認識方法 | |
JPH08185477A (ja) | 画像分類装置 | |
JP3024234B2 (ja) | 文書画像の罫線抽出装置 | |
JPH0816719A (ja) | 文字切り出し方法とこれを用いた文字認識方法及び装置 | |
JP2982221B2 (ja) | 文字読み取り装置 | |
JP2003317107A (ja) | 罫線抽出方法及び装置 | |
JPH0573718A (ja) | 領域属性識別方式 | |
JP3502130B2 (ja) | 表認識装置および表認識方法 | |
JP2003346083A (ja) | 文字認識装置、文字認識方法、プログラムおよび記憶媒体、および文字認識システム | |
JPH03217993A (ja) | 文字サイズ認識装置 | |
JPH03126188A (ja) | 文字認識装置 | |
JPH1021332A (ja) | 非線形正規化方法 | |
JPH05189604A (ja) | 光学的文字読取装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050203 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050809 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050812 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080819 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090819 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090819 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100819 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100819 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110819 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110819 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120819 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120819 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130819 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |