JP2008152811A - 文字サイズ推定方法、装置および記録媒体 - Google Patents

文字サイズ推定方法、装置および記録媒体 Download PDF

Info

Publication number
JP2008152811A
JP2008152811A JP2008068081A JP2008068081A JP2008152811A JP 2008152811 A JP2008152811 A JP 2008152811A JP 2008068081 A JP2008068081 A JP 2008068081A JP 2008068081 A JP2008068081 A JP 2008068081A JP 2008152811 A JP2008152811 A JP 2008152811A
Authority
JP
Japan
Prior art keywords
character
rectangle
character size
frequency distribution
run
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008068081A
Other languages
English (en)
Other versions
JP4381455B2 (ja
Inventor
Tsutomu Oishi
勉 大石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008068081A priority Critical patent/JP4381455B2/ja
Publication of JP2008152811A publication Critical patent/JP2008152811A/ja
Application granted granted Critical
Publication of JP4381455B2 publication Critical patent/JP4381455B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】画像中の文字サイズを精度よく推定する。
【解決手段】閾値設定部58は、ラン頻度の分布を基に閾値を求める。連結矩形抽出部59は、主副走査方向に抽出されたランについて、閾値より大きなランのみを対象に連結矩形を抽出し、罫線抽出部60は、抽出された連結矩形から罫線を抽出する。文字矩形判定部61は、主走査方向/副走査方向の何れにも3本以上の罫線が存在していれば、文字矩形として判定する。
【選択図】図12

Description

本発明は、画像中の文字サイズを推定する文字サイズ推定方法、装置および文字サイズ推定処理プログラムを記録した記録媒体に関する。
文字認識などを行う際に、その前処理として文字サイズが抽出される。例えば、文書画像を短冊状に分割して得られる各領域内の投影データを用いて文字サイズを抽出するもの(特許文献1を参照)、文書画像の周辺分布から画素塊の縦幅、横幅を算出することにより文字サイズを抽出するもの(特許文献2を参照)、長体、正体、平体文字を判別し、文字の幅/高さを基に文字サイズを決定するもの(特許文献3を参照)、手書き文字列の第1方向の文字寸法を推定する際に、ファーストマージ後の第2方向寸法の中から、大きい方からn番目にある寸法値を選択し、これを基に文字サイズ推定値を求めるもの(特許文献4を参照)、白ランレングスの平均値から文字サイズを推定するもの(特許文献5を参照)などが挙げられる。
特許第2569151号公報 特開平5−89283号公報 特開平5−282492号公報 特開平7−21312号公報 特開平7−184034号公報
ところで、従来、表を処理する場合に、その表に含まれる文字サイズなどを予め推定することなく、予定された文字サイズ以下ならば、線などとして誤認識することは少ない。しかし、予定された文字サイズよりも大きな文字サイズを含む表などでは、文字内に存在する直線成分を罫線として誤認識する可能性が高くなるという問題があった。
本発明の目的は、画像中の文字サイズを精度よく推定する文字サイズ推定方法、装置および記録媒体を提供することにある。
前記目的を達成するために、請求項1記載の発明では、入力された画像から所定の閾値を用いて罫線を抽出し、該罫線の数を基に文字矩形であるか否かを判定し、文字矩形と判定された矩形を用いて文字サイズを推定することを特徴としている。
請求項2記載の発明では、前記画像の主走査方向および副走査方向におけるランの頻度分布を求め、該頻度分布を基に前記所定の閾値を設定することを特徴としている。
請求項3記載の発明では、前記頻度分布の微分値を基に所定の閾値を設定することを特徴としている。
請求項4記載の発明では、前記頻度分布に対してデジタルフィルタ処理を行うことを特徴としている。
請求項5記載の発明では、前記頻度分布を基に所定の閾値を設定するとき、頻度分布のピークよりも大きい部分に閾値を設定することを特徴としている。
請求項6記載の発明では、前記文字矩形内の連結矩形を構成するランの属性情報として、文字であることを記録し、該文字であるランに対応した画像上のデータを消去することを特徴としている。
請求項7記載の発明では、入力された画像から所定の閾値を用いて罫線を抽出する手段と、該罫線の数を基に文字矩形であるか否かを判定する手段と、文字矩形と判定された矩形を用いて文字サイズを推定する手段を備えたことを特徴としている。
請求項8記載の発明では、前記画像の主走査方向および副走査方向におけるランの頻度分布を求める手段と、該頻度分布を基に前記所定の閾値を設定する手段を備えたことを特徴としている。
請求項9記載の発明では、前記閾値を設定する手段は、前記頻度分布の微分値を基に所定の閾値を設定することを特徴としている。
請求項10記載の発明では、前記頻度分布に対してデジタルフィルタ処理を行う手段を備えたことを特徴としている。
請求項11記載の発明では、前記閾値を設定する手段は、前記頻度分布を基に所定の閾値を設定するとき、頻度分布のピークよりも大きい部分に閾値を設定することを特徴としている。
請求項12記載の発明では、前記文字矩形内の連結矩形を構成するランの属性情報として、文字であることを記録する手段と、該文字であるランに対応した画像上のデータを消去する手段を備えたことを特徴としている。
請求項13記載の発明では、請求項1乃至6のいずれか1項に記載の文字サイズ推定方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体であることを特徴としている。
請求項1、7、13記載の発明によれば、文字内に存在する直線成分を利用しているので、ノイズに強い文字矩形の判定が可能になる。
請求項2、8、13記載の発明によれば、従来の固定閾値では抽出できない短い罫線を抽出することができる。また、分布自体は表の大きさに依存しないため、大きな表や小さな表を同じ処理方法によって処理することができる。つまり、本発明の処理方法は解像度に依存しない。
請求項3、9、13記載の発明によれば、分布の微分値から閾値を推定しているので、より正確な閾値推定が可能となる。
請求項4、10、13記載の発明によれば、分布にのっている高周波ノイズを除去しているので、より正確な閾値の推定が可能となる。
請求項5、11、13記載の発明によれば、縦線、横線を含む表枠だけではなく、単なる直線からなる分布に対しても適切な閾値を推定できる。
請求項6、12、13記載の発明によれば、ランに属性情報を付与しているので、文字に相当するランの原画消去処理を高速に行うことができる。
以下、発明の実施の形態について図面により詳細に説明する。
(実施例1)
図1は、本発明の実施例1の構成を示し、図2は、実施例1の処理フローチャートを示す。図において、1は画像入力部、2は原画メモリ、3はラン抽出部、4は連結矩形抽出部、5は頻度計数部、6はピーク検出部、7は文字サイズ出力部である。
以下、図2を参照しながら、実施例1の処理動作を説明する。スキャナなどの画像入力部1で原稿を読み取り、入力画像を原画メモリ2に格納する(ステップ101)。ラン抽出部3は、原画メモリ2内の画像データの主走査方向(または副走査方向)についてランを抽出しメモリに格納する(ステップ102)。
次いで、連結矩形抽出部4は、主走査方向における抽出されたランを用いて連結矩形の抽出を行う(ステップ103)。頻度計数部5は、抽出された矩形の縦サイズ(あるいは横サイズ)について頻度を計数する(ステップ104)。ピーク検出部6は、頻度分布上で、縦サイズの小さい方から、微分値の符号が変化する点を探索し、この点をピークとする(ステップ105)。文字サイズ出力部7は、上記したピークを文字サイズとして出力する(ステップ106)。
このように、頻度分布のピークを使用することにより、画像中で一番多い文字のサイズを推定することができる。
上記した実施例では、矩形の縦横分布のピークで文字サイズを推定しているが、ある文字サイズは、全て同じ大きさではなく、文字によってバラツキがある。そこで、このバラツキを吸収するために、矩形の縦横分布の終わり値で文字サイズを推定する。すなわち、ピークを検出した後、ピークから縦サイズの大きい方を探索し、頻度が一定値以下になった点を文字サイズとする。
さらに、複数の文字サイズを使用している場合に、その複数の文字サイズを推定するために、ピークを探索した後、探索した全てのピークについて、ピークから縦サイズの大きい方を探索し、頻度が一定値以下になった点を文字サイズとする。
図3は、2つの文字サイズを含む文字矩形の縦サイズ頻度分布の一例を示す。同じ文字サイズの文字に関して、抽出された連結矩形の横サイズはバラツキが多いが、縦サイズは図に示すように、ある一定範囲に収まる特性がある。この特性は漢字や英語によらない。そして、分布の塊となっている領域(図では2つの領域)を見つけ出すことにより、読み込んだ画像中に存在する文字サイズを推定している。
つまり、図3の例で、ピークを文字サイズとして出力とする場合は、40(ドット)が文字サイズとして推定される。また、ピークから縦サイズの大きい方を探索し、頻度が一定値以下になった点を文字サイズとする場合は、図3の例で、頻度が一定値(例えば2)以下になった点、つまり45(ドット)が文字サイズとして推定される。さらに、複数の文字サイズを推定する場合には、頻度が一定値(例えば2)以下になった点である65(ドット)も文字サイズとして推定される。
(実施例2)
実施例2は、表処理などに先だって連結矩形抽出が行われるが、この抽出された矩形が文字であるか否かを予め判定しておくことにより、より正確に文字サイズを推定する実施例である。また、文字に含まれる直線成分を利用して文字矩形を判定することにより、より正確な文字サイズの推定を行う。
図4は、本発明の実施例2の構成を示し、図5は、実施例2の処理フローチャートを示す。図4において、21は画像入力部、22は原画メモリ、23はラン抽出部、24は連結矩形抽出部、25は罫線抽出部、26は文字矩形判定部、27は頻度計数部、28はピーク検出部、29文字サイズ出力部である。
以下、図5を参照しながら、実施例2の処理動作を説明する。スキャナなどの画像入力部21で原稿を読み取り、入力画像を原画メモリ22に格納する(ステップ201)。ラン抽出部23は、原画メモリ22内の画像データの主走査方向についてランを抽出し、メモリに格納する(ステップ202)。
次いで、連結矩形抽出部24は、主走査方向において抽出されたランについて、所定の閾値(固定閾値)より大きなランのみを対象に連結矩形の抽出を行い(ステップ203)、罫線抽出部25は、抽出された連結矩形から罫線(直線成分)を抽出する(ステップ204)。副走査方向についても同様の処理を行い(ステップ206)、罫線を抽出する。
文字矩形判定部26は、主走査方向/副走査方向の何れにも3本以上の罫線が存在していれば(ステップ207)、文字矩形として判定する(ステップ208)。上記した処理を全ての矩形について処理する(ステップ209)。
頻度計数部27は、文字矩形と判定された矩形の縦サイズについて頻度を計数する(ステップ210)。ピーク検出部28は、頻度分布上で、縦サイズの小さい方から、微分値の符号が変化する点を探索し、この点をピークとする(ステップ211)。文字サイズ出力部29は、上記したピークから縦サイズの大きい方を探索し、頻度がある一定値以下になった点を文字サイズとして出力する(ステップ212)。
(実施例3)
文字矩形同士が接触していて、推定された文字サイズを超える大きさの矩形を形成しても、単位面積当たりの罫線数を基に文字矩形として推定する実施例である。つまり、推定された文字サイズを一片とする方形領域の面積を1単位として、この方形領域よりも大きな連結矩形について、その単位面積当たりの罫線数を算出し、その罫線数から文字矩形を判定する。
図6は、本発明の実施例3の構成を示し、図7、8は、実施例3の処理フローチャートを示す。実施例3では、実施例2の構成に、さらに連結矩形抽出部30、罫線抽出部31、文字矩形判定部32を追加している。また、図8の処理フローチャートにおいて、ステップ312までの処理は実施例2と同様である。ただし、ステップ308で判定された文字矩形は仮文字矩形とする。
以下の処理を仮文字矩形と判定された全ての矩形について行う。連結矩形抽出部30は、主走査方向において、固定閾値より大きなランのみを対象に連結矩形の抽出を行い(ステップ313)、罫線抽出部31は、抽出された連結矩形から罫線(直線成分)を抽出する(ステップ314)。副走査方向についても同様の処理を行い、罫線を抽出する。
文字矩形判定部32は、主走査方向/副走査方向について、罫線数を(現在処理中の矩形面積/推定された文字サイズの面積)で割って、単位面積(ドットの2乗)当たりの罫線数を求め(ステップ315)、主走査方向/副走査方向の何れにも、単位面積当たりの罫線数が3本以上存在すれば、文字矩形として判定する(ステップ316)。
(実施例4)
実施例4は、芯線処理によって文字矩形を判定することにより、より正確な文字サイズを推定する実施例である。図9は、本発明の実施例4の構成を示し、図10は、本発明の実施例4の処理フローチャートである。図において、40は画像入力部、41は原画メモリ、42はラン抽出部、43は連結矩形抽出部、44はID付与部、45は芯線矩形抽出部、46は文字矩形判定部、47は頻度計数部、48はピーク検出部、49は文字サイズ出力部である。
スキャナなどの画像入力部40で原稿を読み取り、入力画像を原画メモリ41に格納する(ステップ401)。ラン抽出部42は、原画メモリ41内の画像データの主走査方向についてランを抽出しメモリに格納する(ステップ402)。連結矩形抽出部43は、メモリ上のランを使って連結矩形を抽出し、ID付与部44は連結矩形に矩形ID(シリアル番号)を付与し、その矩形IDを、その連結矩形成分を構成する全てのランにも付与する(ステップ403)。
芯線矩形抽出部45は、同じ矩形IDをもつランについて、ランの中点のみの芯線を使用して矩形を抽出し(ステップ404)、副走査方向についても同様の処理を行い、芯線矩形を抽出する(ステップ406)。図11は、芯線矩形の一例を示す。
文字矩形判定部46は、主走査方向/副走査方向の何れにも3個以上の芯線矩形が存在すれば(ステップ407)、文字矩形と判定する(ステップ408)。この処理を全ての矩形について行う(ステップ409)。以下、実施例2と同様に処理して文字サイズを出力する。
(実施例5)
従来の方法では、固定閾値を用いて罫線を抽出している。このため、表の中に含まれる文字の大きさよりも少し大きな長さを持った線を抽出することが難しい。これは、あらゆるドキュメントにおいて文字内に罫線が抽出されないような、ある程度大きな固定の閾値を設定する必要があるためである。このように、従来の方法では、ある程度大きな固定の閾値を設定しているので、文字内の疑似罫線の抽出を抑えることができるが、逆に、文字サイズよりも少し大きい程度の短い罫線を抽出することができない。
そこで、本実施例では、閾値を固定値ではなく、読み取り原稿の特徴から閾値を推定し、この閾値を基に罫線を判別している。
図12は、実施例5の構成を示す。図13は、実施例5の処理フローチャートである。入力画像を原画メモリ52に格納し(ステップ501)、ラン抽出部53は、主走査方向においてランを抽出しメモリに格納する(ステップ502)。連結矩形抽出部54は、メモリ上のランを使って連結矩形を抽出し、ID付与部55は連結矩形に矩形ID(シリアル番号)を付与し、その矩形IDを、その連結矩形成分を構成する全てのランにも付与する(ステップ503)。矩形ID選択部56は、ある特定の(つまり、処理対象となる)連結矩形(矩形ID)を選択し(ステップ504)、頻度計数部57は指定された矩形IDをもつランを検索し、頻度を計数する(ステップ505)。
次いで、閾値設定部58は、ラン頻度の分布を基に閾値を求める(ステップ506)。連結矩形抽出部59は、主走査方向における抽出されたランについて、上記算出された閾値より大きなランのみを対象に連結矩形の抽出を行う(ステップ507)。罫線抽出部60は、抽出された連結矩形から罫線を抽出する(ステップ508)。副走査方向についても同様の処理を行い(ステップ510)、罫線を抽出する。
文字矩形判定部61は、主走査方向/副走査方向の何れにも3本以上の罫線が存在していれば(ステップ511)、文字矩形として判定する(ステップ512)。以下の処理は実施例2と同様である。
(実施例6)
一般的に、縦線と横線を含む表の枠の連結矩形成分のラン頻度分布は、図14に示すようになる。すなわち、ランレングス1〜10が縦線のラン分布であり、10〜28が縦線あるいは横線に接触している文字のラン分布となっている。29以上のラン分布は横線のラン分布である。図14の分布では、閾値を29に設定することにより、横線のみが抽出できる。分布の微分値がゼロ、つまりラン分布が変化しなくなったら、その点が閾値となる。本実施例では、この閾値を探索するために差分を使用している。
図15は、実施例6の構成を示す。実施例5と相違する点は、差分計算部65を設けた点である。図16は、実施例6の処理フローチャートを示す。
差分計算部65は、頻度分布についてランレングスの小さい方から順に、隣の頻度との差分を求める(ステップ606)。閾値設定部58は、差分がゼロとなったランレングスを閾値とする(ステップ607)。以下、実施例5と同様に、連結矩形抽出部59は、主走査方向において、設定された閾値より大きなランのみを対象に連結矩形の抽出を行い(ステップ608)、罫線抽出部60は抽出された連結矩形から罫線を抽出する(ステップ609)。
(実施例7)
オフィスで作成される表を含む文書のラン分布は、概ね図14に示す傾向となるが、上記した実施例6のように差分を求めたとき、ノイズ等によって、ランレングス値29より小さい値でも隣の分布頻度値と一致することがある。あるいは、29より大きいランレングスでも、頻度値としては10またはそれ以上の頻度値となる場合もあり、頻度値が隣と一致する場合が必ずあるとは限らない。これは、ラン分布にのっている高周波成分のノイズが原因である。
一般に、高周波成分ノイズはFIR(Finit Impulse Response)型デジタルフィル夕で除去することができる。そこで、本実施例では、デジタルフィル夕を使用して、高周波ノイズに相当する部分を除去する。
図17は、実施例7の構成を示し、実施例6の構成にさらにフィルタ処理部66を付加したものである。また、図18は、実施例7の処理フローチャートを示す。ステップ701〜705、ステップ707〜712は、実施例6の処理と同様である。ステップ706では、フィルタ処理部66において、頻度分布に対してデジタルフィルタ(ローパスフィルタ)をかけて高周波ノイズを除去する。
(実施例8)
図19は、横線のみのラン分布を示す。ラン分布を連結矩形単位でとると、表の枠を構成する連結矩形や、横線を構成する連結矩形が含まれる。横線のみの連結矩形を、閾値33の付近で取り出すためには、ラン分布のピークより大きい位置で、微分値がゼロになる点を探せば良い。
図20は、実施例8の構成を示す。実施例7と相違する点は、ピーク検出部67を設けた点と、差分計算部65の処理内容が異なる点である。図21は、実施例8の処理フローチャートである。
ステップ806までの処理は実施例7と同様である。ステップ807では、ピーク検出部67は、頻度分布におけるランレングスの小さい方から、2次微分値がゼロあるいは微分値の符号が変化する点を探索し、ピークとする。次いで、差分計算部65は、ピークより後方で、隣の頻度との差分を求める(ステップ808)。閾値設定部58は、差分がゼロとなったランレングスを閾値とする(ステップ809)。以下の処理は、実施例7と同様であるので、説明を省略する。
(実施例9)
表を認識する際には、連結矩形抽出を繰返し行う必要があり、その都度、原画からランを抽出して、連結矩形を抽出すると処理に時間を要する。そこで、ラン情報のみをあらかじめ用意しておくことにより、ランを使った他の特徴量の抽出等の処理時間を短縮できる。
つまり、ランの属性を保持することで、処理の結果を累積的に保持できるため、認識が終了したランを、その次の認識処理から除くことができ、その結果、認識処理全体の処理時間の短縮が可能となる。同時にラン単位で認識が可能となるため、細部にわたって精度の高い認識処理が可能となる。また、ラン情報に変換されているため、各種の画像処理を短時間で行うことができる。
図22は、実施例9の構成を示す。この実施例では、実施例8の構成にさらに属性情報記録部68と文字データ消去部69を付加している。また、図23は、実施例9の処理フローチャートである。ステップ903において、ラン抽出部53は、抽出したランに対応するラン属性情報(例えば文字、線などの属性)を保持する領域を確保する。
属性情報記録部68は、文字矩形判定部61で文字矩形として判定された矩形内において、連結矩形を構成するランに文字であることを示すマークを記録する(ステップ918)。文字サイズが出力された後、文字データ消去部69では、抽出されたランを調べ、文字であるマークが付与されているランに対応する原画上の黒画素を消去する(ステップ922)。
なお、ラン属性情報としては、この他に、ランが線、写真などの画像、ノイズ、線ノイズ、背景などのどれに属しているかを示す属性を保持するようにしてもよい。
(実施例10)
実施例10は、本発明をソフトウェアによって実現する場合の実施例である。図24は、実施例10のシステム構成例を示す。CD−ROMなどの記録媒体には、本発明の文字サイズ推定処理機能または処理手順が記録されていて、これをシステムにインストールする。スキャナなどにセットされた原稿を読み取り、メモリ上に展開された原稿画像から文字矩形を抽出し、抽出された文字矩形のサイズを推定し、その結果をディスプレイなどに表示出力する。
本発明の実施例1の構成を示す。 本発明の実施例1の処理フローチャートを示す。 2つの文字サイズを含む文字矩形の縦サイズ頻度分布の一例を示す。 本発明の実施例2の構成を示す。 本発明の実施例2の処理フローチャートを示す。 本発明の実施例3の構成を示す。 本発明の実施例3の処理フローチャートを示す。 図7の続きの処理フローチャートを示す。 本発明の実施例4の構成を示す。 本発明の実施例4の処理フローチャートを示す。 芯線矩形の一例を示す。 本発明の実施例5の構成を示す。 本発明の実施例5の処理フローチャートを示す。 一般的な表を含むランの頻度分布を示す。 本発明の実施例6の構成を示す。 本発明の実施例6の処理フローチャートを示す。 本発明の実施例7の構成を示す。 本発明の実施例7の処理フローチャートを示す。 横線のみのラン分布を示す。 本発明の実施例8の構成を示す。 本発明の実施例8の処理フローチャートを示す。 本発明の実施例9の構成を示す。 本発明の実施例9の処理フローチャートを示す。 本発明の実施例10の構成を示す。
符号の説明
1 画像入力部
2 原画メモリ
3 ラン抽出部
4 連結矩形抽出部
5 頻度計数部
6 ピーク検出部
7 文字サイズ出力部

Claims (13)

  1. 入力された画像から所定の閾値を用いて罫線を抽出し、該罫線の数を基に文字矩形であるか否かを判定し、文字矩形と判定された矩形を用いて文字サイズを推定することを特徴とする文字サイズ推定方法。
  2. 前記画像の主走査方向および副走査方向におけるランの頻度分布を求め、該頻度分布を基に前記所定の閾値を設定することを特徴とする請求項1記載の文字サイズ推定方法。
  3. 前記頻度分布の微分値を基に所定の閾値を設定することを特徴とする請求項2記載の文字サイズ推定方法。
  4. 前記頻度分布に対してデジタルフィルタ処理を行うことを特徴とする請求項2または3記載の文字サイズ推定方法。
  5. 前記頻度分布を基に所定の閾値を設定するとき、頻度分布のピークよりも大きい部分に閾値を設定することを特徴とする請求項2記載の文字サイズ推定方法。
  6. 前記文字矩形内の連結矩形を構成するランの属性情報として、文字であることを記録し、該文字であるランに対応した画像上のデータを消去することを特徴とする請求項1記載の文字サイズ推定方法。
  7. 入力された画像から所定の閾値を用いて罫線を抽出する手段と、該罫線の数を基に文字矩形であるか否かを判定する手段と、文字矩形と判定された矩形を用いて文字サイズを推定する手段を備えたことを特徴とする文字サイズ推定装置。
  8. 前記画像の主走査方向および副走査方向におけるランの頻度分布を求める手段と、該頻度分布を基に前記所定の閾値を設定する手段を備えたことを特徴とする請求項7記載の文字サイズ推定装置。
  9. 前記閾値を設定する手段は、前記頻度分布の微分値を基に所定の閾値を設定することを特徴とする請求項8記載の文字サイズ推定装置。
  10. 前記頻度分布に対してデジタルフィルタ処理を行う手段を備えたことを特徴とする請求項8または9記載の文字サイズ推定装置。
  11. 前記閾値を設定する手段は、前記頻度分布を基に所定の閾値を設定するとき、頻度分布のピークよりも大きい部分に閾値を設定することを特徴とする請求項8記載の文字サイズ推定装置。
  12. 前記文字矩形内の連結矩形を構成するランの属性情報として、文字であることを記録する手段と、該文字であるランに対応した画像上のデータを消去する手段を備えたことを特徴とする請求項7記載の文字サイズ推定装置。
  13. 請求項1乃至6のいずれか1項に記載の文字サイズ推定方法をコンピュータに実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008068081A 2008-03-17 2008-03-17 文字サイズ推定方法、装置および記録媒体 Expired - Fee Related JP4381455B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008068081A JP4381455B2 (ja) 2008-03-17 2008-03-17 文字サイズ推定方法、装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008068081A JP4381455B2 (ja) 2008-03-17 2008-03-17 文字サイズ推定方法、装置および記録媒体

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP11690699A Division JP4129898B2 (ja) 1999-04-23 1999-04-23 文字サイズ推定方法および装置

Publications (2)

Publication Number Publication Date
JP2008152811A true JP2008152811A (ja) 2008-07-03
JP4381455B2 JP4381455B2 (ja) 2009-12-09

Family

ID=39654835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008068081A Expired - Fee Related JP4381455B2 (ja) 2008-03-17 2008-03-17 文字サイズ推定方法、装置および記録媒体

Country Status (1)

Country Link
JP (1) JP4381455B2 (ja)

Also Published As

Publication number Publication date
JP4381455B2 (ja) 2009-12-09

Similar Documents

Publication Publication Date Title
KR102403964B1 (ko) 화상 처리 장치, 화상 처리 방법, 및 저장 매체
JP4271878B2 (ja) 映像中の文字検索方法及び装置並びに文字検索処理プログラム
Das et al. A fast algorithm for skew detection of document images using morphology
JPH11219407A (ja) 文書画像認識装置および文書画像認識プログラムの記憶媒体
JP6900164B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2009266232A (ja) キーワード識別方法及装置
US9280725B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP2007073048A (ja) 文字列イメージを垂直に分離するプログラム、方法及び装置、指定文字列を抽出するプログラム、方法及び装置
JP2017535891A (ja) テキストを検出する方法およびその装置
JP4791295B2 (ja) 罫線抽出プログラム、罫線抽出装置、罫線抽出方法
JP2011070558A (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
JP2006277398A (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
US9049400B2 (en) Image processing apparatus, and image processing method and program
JPH09311905A (ja) 行検出方法および文字認識装置
JP2010002991A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4129898B2 (ja) 文字サイズ推定方法および装置
JP4381455B2 (ja) 文字サイズ推定方法、装置および記録媒体
JP6019939B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4089849B2 (ja) 罫線処理装置および記録媒体
JP2012022413A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2008004116A (ja) 映像中の文字検索方法及び装置
JPH04352295A (ja) 文字列方向判別装置
JP7292984B2 (ja) 行分割装置および方法、ならびにプログラム
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP2002297638A (ja) 文書画像からのタイトル抽出方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090909

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090915

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees