JP2000306041A - 文字サイズ推定方法および記録媒体 - Google Patents
文字サイズ推定方法および記録媒体Info
- Publication number
- JP2000306041A JP2000306041A JP11116906A JP11690699A JP2000306041A JP 2000306041 A JP2000306041 A JP 2000306041A JP 11116906 A JP11116906 A JP 11116906A JP 11690699 A JP11690699 A JP 11690699A JP 2000306041 A JP2000306041 A JP 2000306041A
- Authority
- JP
- Japan
- Prior art keywords
- character
- rectangle
- size
- character size
- frequency distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
データの主走査方向についてランを抽出する。連結矩形
抽出部4は、抽出されたランを用いて連結矩形を抽出
し、頻度計数部5は、抽出された矩形の縦サイズについ
て頻度を計数する。ピーク検出部6は、頻度分布上で、
縦サイズの小さい方から、微分値の符号が変化する点を
探索し、この点をピークとし、文字サイズ出力部7は、
ピークを文字サイズとして出力する。
Description
ズを推定する文字サイズ推定方法および文字サイズ推定
処理プログラムを記録した記録媒体に関する。
して文字サイズが抽出される。例えば、文書画像を短冊
状に分割して得られる各領域内の投影データを用いて文
字サイズを抽出するもの(特許第2569151号)、
文書画像の周辺分布から画素塊の縦幅、横幅を算出する
ことにより文字サイズを抽出するもの(特開平5−89
283号公報を参照)、長体、正体、平体文字を判別
し、文字の幅/高さを基に文字サイズを決定するもの
(特開平5−282492号公報を参照)、手書き文字
列の第1方向の文字寸法を推定する際に、ファーストマ
ージ後の第2方向寸法の中から、大きい方からn番目に
ある寸法値を選択し、これを基に文字サイズ推定値を求
めるもの(特開平7−21312号公報を参照)、白ラ
ンレングスの平均値から文字サイズを推定するもの(特
開平7−184034号公報を参照)などが挙げられ
る。
処理する場合に、その表に含まれる文字サイズなどを予
め推定することなく、予定された文字サイズ以下なら
ば、線などとして誤認識することは少ない。しかし、予
定された文字サイズよりも大きな文字サイズを含む表な
どでは、文字内に存在する直線成分を罫線として誤認識
する可能性が高くなるという問題があった。
度よく推定する文字サイズ推定方法および記録媒体を提
供することにある。
に、請求項1記載の発明では、入力された画像から連結
矩形を抽出し、該矩形の縦幅または横幅の頻度分布を求
め、該頻度分布を基に前記画像に含まれる文字のサイズ
を推定することを特徴としている。
ピークを検索し、該ピークに対応するサイズを文字サイ
ズとすることを特徴としている。
ピークを検索し、該ピークからサイズの大きい方向へ探
索したとき、頻度値が所定値よりも小さくなったところ
のサイズを文字サイズとすることを特徴としている。
微分値の符号が反転する全ての点を検索し、該点からサ
イズの大きい方向へ探索したとき、頻度値が所定値より
も小さくなったところのサイズを文字サイズとし、複数
の文字サイズを推定することを特徴としている。
矩形が文字矩形であるか否かを判定し、文字矩形と判定
された矩形を用いて文字サイズを推定することを特徴と
している。
文字サイズの面積と、抽出された矩形の面積とを基に単
位面積当たりの罫線数を算出し、該罫線数を基に文字矩
形であるか否かをさらに判定することを特徴としてい
る。
あるか否かの判定は、前記抽出された連結矩形に含まれ
るランの中心点を用いて矩形を抽出し、該抽出された矩
形数を基に判定することを特徴としている。
から所定の閾値を用いて罫線を抽出し、該罫線の数を基
に文字矩形であるか否かを判定し、文字矩形と判定され
た矩形を用いて文字サイズを推定することを特徴として
いる。
査方向および副走査方向におけるランの頻度分布を求
め、該頻度分布を基に前記所定の閾値を設定することを
特徴としている。
の微分値を基に所定の閾値を設定することを特徴として
いる。
に対してデジタルフィルタ処理を行うことを特徴として
いる。
を基に所定の閾値を設定するとき、頻度分布のピークよ
りも大きい部分に閾値を設定することを特徴としてい
る。
内の連結矩形を構成するランの属性情報として、文字で
あることを記録し、該文字であるランに対応した画像上
のデータを消去することを特徴としている。
像から連結矩形を抽出する機能と、該矩形の縦幅または
横幅の頻度分布を算出する機能と、該頻度分布を基に前
記画像に含まれる文字のサイズを推定する機能をコンピ
ュータに実現させるためのプログラムを記録したコンピ
ュータ読み取り可能な記録媒体であることを特徴として
いる。
用いて具体的に説明する。 (実施例1)図1は、本発明の実施例1の構成を示し、
図2は、実施例1の処理フローチャートを示す。図にお
いて、1は画像入力部、2は原画メモリ、3はラン抽出
部、4は連結矩形抽出部、5は頻度計数部、6はピーク
検出部、7は文字サイズ出力部である。
理動作を説明する。スキャナなどの画像入力部1で原稿
を読み取り、入力画像を原画メモリ2に格納する(ステ
ップ101)。ラン抽出部3は、原画メモリ2内の画像
データの主走査方向(または副走査方向)についてラン
を抽出しメモリに格納する(ステップ102)。
における抽出されたランを用いて連結矩形の抽出を行う
(ステップ103)。頻度計数部5は、抽出された矩形
の縦サイズ(あるいは横サイズ)について頻度を計数す
る(ステップ104)。ピーク検出部6は、頻度分布上
で、縦サイズの小さい方から、微分値の符号が変化する
点を探索し、この点をピークとする(ステップ10
5)。文字サイズ出力部7は、上記したピークを文字サ
イズとして出力する(ステップ106)。
ことにより、画像中で一番多い文字のサイズを推定する
ことができる。
ークで文字サイズを推定しているが、ある文字サイズ
は、全て同じ大きさではなく、文字によってバラツキが
ある。そこで、このバラツキを吸収するために、矩形の
縦横分布の終わり値で文字サイズを推定する。すなわ
ち、ピークを検出した後、ピークから縦サイズの大きい
方を探索し、頻度が一定値以下になった点を文字サイズ
とする。
場合に、その複数の文字サイズを推定するために、ピー
クを探索した後、探索した全てのピークについて、ピー
クから縦サイズの大きい方を探索し、頻度が一定値以下
になった点を文字サイズとする。
の縦サイズ頻度分布の一例を示す。同じ文字サイズの文
字に関して、抽出された連結矩形の横サイズはバラツキ
が多いが、縦サイズは図に示すように、ある一定範囲に
収まる特性がある。この特性は漢字や英語によらない。
そして、分布の塊となっている領域(図では2つの領
域)を見つけ出すことにより、読み込んだ画像中に存在
する文字サイズを推定している。
として出力とする場合は、40(ドット)が文字サイズ
として推定される。また、ピークから縦サイズの大きい
方を探索し、頻度が一定値以下になった点を文字サイズ
とする場合は、図3の例で、頻度が一定値(例えば2)
以下になった点、つまり45(ドット)が文字サイズと
して推定される。さらに、複数の文字サイズを推定する
場合には、頻度が一定値(例えば2)以下になった点で
ある65(ドット)も文字サイズとして推定される。
だって連結矩形抽出が行われるが、この抽出された矩形
が文字であるか否かを予め判定しておくことにより、よ
り正確に文字サイズを推定する実施例である。また、文
字に含まれる直線成分を利用して文字矩形を判定するこ
とにより、より正確な文字サイズの推定を行う。
図5は、実施例2の処理フローチャートを示す。図4に
おいて、21は画像入力部、22は原画メモリ、23は
ラン抽出部、24は連結矩形抽出部、25は罫線抽出
部、26は文字矩形判定部、27は頻度計数部、28は
ピーク検出部、29文字サイズ出力部である。
理動作を説明する。スキャナなどの画像入力部21で原
稿を読み取り、入力画像を原画メモリ22に格納する
(ステップ201)。ラン抽出部23は、原画メモリ2
2内の画像データの主走査方向についてランを抽出し、
メモリに格納する(ステップ202)。
向において抽出されたランについて、所定の閾値(固定
閾値)より大きなランのみを対象に連結矩形の抽出を行
い(ステップ203)、罫線抽出部25は、抽出された
連結矩形から罫線(直線成分)を抽出する(ステップ2
04)。副走査方向についても同様の処理を行い(ステ
ップ206)、罫線を抽出する。
査方向の何れにも3本以上の罫線が存在していれば(ス
テップ207)、文字矩形として判定する(ステップ2
08)。上記した処理を全ての矩形について処理する
(ステップ209)。
矩形の縦サイズについて頻度を計数する(ステップ21
0)。ピーク検出部28は、頻度分布上で、縦サイズの
小さい方から、微分値の符号が変化する点を探索し、こ
の点をピークとする(ステップ211)。文字サイズ出
力部29は、上記したピークから縦サイズの大きい方を
探索し、頻度がある一定値以下になった点を文字サイズ
として出力する(ステップ212)。
て、推定された文字サイズを超える大きさの矩形を形成
しても、単位面積当たりの罫線数を基に文字矩形として
推定する実施例である。つまり、推定された文字サイズ
を一片とする方形領域の面積を1単位として、この方形
領域よりも大きな連結矩形について、その単位面積当た
りの罫線数を算出し、その罫線数から文字矩形を判定す
る。
図7,8は、実施例3の処理フローチャートを示す。実
施例3では、実施例2の構成に、さらに連結矩形抽出部
30、罫線抽出部31、文字矩形判定部32を追加して
いる。また、図8の処理フローチャートにおいて、ステ
ップ312までの処理は実施例2と同様である。ただ
し、ステップ308で判定された文字矩形は仮文字矩形
とする。
の矩形について行う。連結矩形抽出部30は、主走査方
向において、固定閾値より大きなランのみを対象に連結
矩形の抽出を行い(ステップ313)、罫線抽出部31
は、抽出された連結矩形から罫線(直線成分)を抽出す
る(ステップ314)。副走査方向についても同様の処
理を行い、罫線を抽出する。
査方向について、罫線数を(現在処理中の矩形面積/推
定された文字サイズの面積)で割って、単位面積(ドッ
トの2乗)当たりの罫線数を求め(ステップ315)、
主走査方向/副走査方向の何れにも、単位面積当たりの
罫線数が3本以上存在すれば、文字矩形として判定する
(ステップ316)。
て文字矩形を判定することにより、より正確な文字サイ
ズを推定する実施例である。図9は、本発明の実施例4
の構成を示し、図10は、本発明の実施例4の処理フロ
ーチャートである。図において、40は画像入力部、4
1は原画メモリ、42はラン抽出部、43は連結矩形抽
出部、44はID付与部、45は芯線矩形抽出部、46
は文字矩形判定部、47は頻度計数部、48はピーク検
出部、49は文字サイズ出力部である。
み取り、入力画像を原画メモリ41に格納する(ステッ
プ401)。ラン抽出部42は、原画メモリ41内の画
像データの主走査方向についてランを抽出しメモリに格
納する(ステップ402)。連結矩形抽出部43は、メ
モリ上のランを使って連結矩形を抽出し、ID付与部4
4は連結矩形に矩形ID(シリアル番号)を付与し、そ
の矩形IDを、その連結矩形成分を構成する全てのラン
にも付与する(ステップ403)。
つランについて、ランの中点のみの芯線を使用して矩形
を抽出し(ステップ404)、副走査方向についても同
様の処理を行い、芯線矩形を抽出する(ステップ40
6)。図11は、芯線矩形の一例を示す。
査方向の何れにも3個以上の芯線矩形が存在すれば(ス
テップ407)、文字矩形と判定する(ステップ40
8)。この処理を全ての矩形について行う(ステップ4
09)。以下、実施例2と同様に処理して文字サイズを
出力する。
用いて罫線を抽出している。このため、表の中に含まれ
る文字の大きさよりも少し大きな長さを持った線を抽出
することが難しい。これは、あらゆるドキュメントにお
いて文字内に罫線が抽出されないような、ある程度大き
な固定の閾値を設定する必要があるためである。このよ
うに、従来の方法では、ある程度大きな固定の閾値を設
定しているので、文字内の疑似罫線の抽出を抑えること
ができるが、逆に、文字サイズよりも少し大きい程度の
短い罫線を抽出することができない。
なく、読み取り原稿の特徴から閾値を推定し、この閾値
を基に罫線を判別している。
は、実施例5の処理フローチャートである。入力画像を
原画メモリ52に格納し(ステップ501)、ラン抽出
部53は、主走査方向においてランを抽出しメモリに格
納する(ステップ502)。連結矩形抽出部54は、メ
モリ上のランを使って連結矩形を抽出し、ID付与部5
5は連結矩形に矩形ID(シリアル番号)を付与し、そ
の矩形IDを、その連結矩形成分を構成する全てのラン
にも付与する(ステップ503)。矩形ID選択部56
は、ある特定の(つまり、処理対象となる)連結矩形
(矩形ID)を選択し(ステップ504)、頻度計数部
57は指定された矩形IDをもつランを検索し、頻度を
計数する(ステップ505)。
布を基に閾値を求める(ステップ506)。連結矩形抽
出部59は、主走査方向における抽出されたランについ
て、上記算出された閾値より大きなランのみを対象に連
結矩形の抽出を行う(ステップ507)。罫線抽出部6
0は、抽出された連結矩形から罫線を抽出する(ステッ
プ508)。副走査方向についても同様の処理を行い
(ステップ510)、罫線を抽出する。
査方向の何れにも3本以上の罫線が存在していれば(ス
テップ511)、文字矩形として判定する(ステップ5
12)。以下の処理は実施例2と同様である。
表の枠の連結矩形成分のラン頻度分布は、図14に示す
ようになる。すなわち、ランレングス1〜10が縦線の
ラン分布であり、10〜28が縦線あるいは横線に接触
している文字のラン分布となっている。29以上のラン
分布は横線のラン分布である。図14の分布では、閾値
を29に設定することにより、横線のみが抽出できる。
分布の微分値がゼロ、つまりラン分布が変化しなくなっ
たら、その点が閾値となる。本実施例では、この閾値を
探索するために差分を使用している。
5と相違する点は、差分計算部65を設けた点である。
図16は、実施例6の処理フローチャートを示す。
レングスの小さい方から順に、隣の頻度との差分を求め
る(ステップ606)。閾値設定部58は、差分がゼロ
となったランレングスを閾値とする(ステップ60
7)。以下、実施例5と同様に、連結矩形抽出部59
は、主走査方向において、設定された閾値より大きなラ
ンのみを対象に連結矩形の抽出を行い(ステップ60
8)、罫線抽出部60は抽出された連結矩形から罫線を
抽出する(ステップ609)。
む文書のラン分布は、概ね図14に示す傾向となるが、
上記した実施例6のように差分を求めたとき、ノイズ等
によって、ランレングス値29より小さい値でも隣の分
布頻度値と一致することがある。あるいは、29より大
きいランレングスでも、頻度値としては10またはそれ
以上の頻度値となる場合もあり、頻度値が隣と一致する
場合が必ずあるとは限らない。これは、ラン分布にのっ
ている高周波成分のノイズが原因である。
nit Impulse Response)型デジタ
ルフィル夕で除去することができる。そこで、本実施例
では、デジタルフィル夕を使用して、高周波ノイズに相
当する部分を除去する。
6の構成にさらにフィルタ処理部66を付加したもので
ある。また、図18は、実施例7の処理フローチャート
を示す。ステップ701〜705、ステップ707〜7
12は、実施例6の処理と同様である。ステップ706
では、フィルタ処理部66において、頻度分布に対して
デジタルフィルタ(ローパスフィルタ)をかけて高周波
ノイズを除去する。
布を示す。ラン分布を連結矩形単位でとると、表の枠を
構成する連結矩形や、横線を構成する連結矩形が含まれ
る。横線のみの連結矩形を、閾値33の付近で取り出す
ためには、ラン分布のピークより大きい位置で、微分値
がゼロになる点を探せば良い。
7と相違する点は、ピーク検出部67を設けた点と、差
分計算部65の処理内容が異なる点である。図21は、
実施例8の処理フローチャートである。
様である。ステップ807では、ピーク検出部67は、
頻度分布におけるランレングスの小さい方から、2次微
分値がゼロあるいは微分値の符号が変化する点を探索
し、ピークとする。次いで、差分計算部65は、ピーク
より後方で、隣の頻度との差分を求める(ステップ80
8)。閾値設定部58は、差分がゼロとなったランレン
グスを閾値とする(ステップ809)。以下の処理は、
実施例7と同様であるので、説明を省略する。
形抽出を繰返し行う必要があり、その都度、原画からラ
ンを抽出して、連結矩形を抽出すると処理に時間を要す
る。そこで、ラン情報のみをあらかじめ用意しておくこ
とにより、ランを使った他の特徴量の抽出等の処理時間
を短縮できる。
理の結果を累積的に保持できるため、認識が終了したラ
ンを、その次の認識処理から除くことができ、その結
果、認識処理全体の処理時間の短縮が可能となる。同時
にラン単位で認識が可能となるため、細部にわたって精
度の高い認識処理が可能となる。また、ラン情報に変換
されているため、各種の画像処理を短時間で行うことが
できる。
施例では、実施例8の構成にさらに属性情報記録部68
と文字データ消去部69を付加している。また、図23
は、実施例9の処理フローチャートである。ステップ9
03において、ラン抽出部53は、抽出したランに対応
するラン属性情報(例えば文字、線などの属性)を保持
する領域を確保する。
1で文字矩形として判定された矩形内において、連結矩
形を構成するランに文字であることを示すマークを記録
する(ステップ918)。文字サイズが出力された後、
文字データ消去部69では、抽出されたランを調べ、文
字であるマークが付与されているランに対応する原画上
の黒画素を消去する(ステップ922)。
ランが線、写真などの画像、ノイズ、線ノイズ、背景な
どのどれに属しているかを示す属性を保持するようにし
てもよい。
フトウェアによって実現する場合の実施例である。図2
4は、実施例10のシステム構成例を示す。CD−RO
Mなどの記録媒体には、本発明の文字サイズ推定処理機
能または処理手順が記録されていて、これをシステムに
インストールする。スキャナなどにセットされた原稿を
読み取り、メモリ上に展開された原稿画像から文字矩形
を抽出し、抽出された文字矩形のサイズを推定し、その
結果をディスプレイなどに表示出力する。
記載の発明によれば、連結矩形の縦横幅の分布から文字
サイズの推定が可能になる。
も多く存在する文字矩形の文字サイズを推定することが
できる。
も多く存在する文字矩形の文字サイズのばらつきを吸収
しながら推定することができる。
数存在する文字サイズを推定することができる。
あるか否かの判定を行っているので、より正確に文字サ
イズの推定が可能になる。
士が接触している場合などでも、文字矩形であるか否か
の判定が可能になる。
処理によって文字矩形を判定することができる。
在する直線成分を利用しているので、ノイズに強い文字
矩形の判定が可能になる。
閾値では抽出できない短い罫線を抽出することができ
る。また、分布自体は表の大きさに依存しないため、大
きな表や小さな表を同じ処理方法によって処理すること
ができる。つまり、本発明の処理方法は解像度に依存し
ない。
分値から閾値を推定しているので、より正確な閾値推定
が可能となる。
っている高周波ノイズを除去しているので、より正確な
閾値の推定が可能となる。
線を含む表枠だけではなく、単なる直線からなる分布に
対しても適切な閾値を推定できる。
性情報を付与しているので、文字に相当するランの原画
消去処理を高速に行うことができる。
す。
度分布の一例を示す。
す。
す。
す。
す。
す。
す。
す。
す。
Claims (14)
- 【請求項1】 入力された画像から連結矩形を抽出し、
該矩形の縦幅または横幅の頻度分布を求め、該頻度分布
を基に前記画像に含まれる文字のサイズを推定すること
を特徴とする文字サイズ推定方法。 - 【請求項2】 前記頻度分布のピークを検索し、該ピー
クに対応するサイズを文字サイズとすることを特徴とす
る請求項1記載の文字サイズ推定方法。 - 【請求項3】 前記頻度分布のピークを検索し、該ピー
クからサイズの大きい方向へ探索したとき、頻度値が所
定値よりも小さくなったところのサイズを文字サイズと
することを特徴とする請求項1記載の文字サイズ推定方
法。 - 【請求項4】 前記頻度分布の微分値の符号が反転する
全ての点を検索し、該点からサイズの大きい方向へ探索
したとき、頻度値が所定値よりも小さくなったところの
サイズを文字サイズとし、複数の文字サイズを推定する
ことを特徴とする請求項1記載の文字サイズ推定方法。 - 【請求項5】 前記抽出された矩形が文字矩形であるか
否かを判定し、文字矩形と判定された矩形を用いて文字
サイズを推定することを特徴とする請求項1記載の文字
サイズ推定方法。 - 【請求項6】 前記推定された文字サイズの面積と、抽
出された矩形の面積とを基に単位面積当たりの罫線数を
算出し、該罫線数を基に文字矩形であるか否かをさらに
判定することを特徴とする請求項5記載の文字サイズ推
定方法。 - 【請求項7】 前記文字矩形であるか否かの判定は、前
記抽出された連結矩形に含まれるランの中心点を用いて
矩形を抽出し、該抽出された矩形数を基に判定すること
を特徴とする請求項5記載の文字サイズ推定方法。 - 【請求項8】 入力された画像から所定の閾値を用いて
罫線を抽出し、該罫線の数を基に文字矩形であるか否か
を判定し、文字矩形と判定された矩形を用いて文字サイ
ズを推定することを特徴とする文字サイズ推定方法。 - 【請求項9】 前記画像の主走査方向および副走査方向
におけるランの頻度分布を求め、該頻度分布を基に前記
所定の閾値を設定することを特徴とする請求項8記載の
文字サイズ推定方法。 - 【請求項10】 前記頻度分布の微分値を基に所定の閾
値を設定することを特徴とする請求項8記載の文字サイ
ズ推定方法。 - 【請求項11】 前記頻度分布に対してデジタルフィル
タ処理を行うことを特徴とする請求項9または10記載
の文字サイズ推定方法。 - 【請求項12】 前記頻度分布を基に所定の閾値を設定
するとき、頻度分布のピークよりも大きい部分に閾値を
設定することを特徴とする請求項8記載の文字サイズ推
定方法。 - 【請求項13】 前記文字矩形内の連結矩形を構成する
ランの属性情報として、文字であることを記録し、該文
字であるランに対応した画像上のデータを消去すること
を特徴とする請求項8記載の文字サイズ推定方法。 - 【請求項14】 入力された画像から連結矩形を抽出す
る機能と、該矩形の縦幅または横幅の頻度分布を算出す
る機能と、該頻度分布を基に前記画像に含まれる文字の
サイズを推定する機能をコンピュータに実現させるため
のプログラムを記録したコンピュータ読み取り可能な記
録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11690699A JP4129898B2 (ja) | 1999-04-23 | 1999-04-23 | 文字サイズ推定方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11690699A JP4129898B2 (ja) | 1999-04-23 | 1999-04-23 | 文字サイズ推定方法および装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008068081A Division JP4381455B2 (ja) | 2008-03-17 | 2008-03-17 | 文字サイズ推定方法、装置および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000306041A true JP2000306041A (ja) | 2000-11-02 |
JP4129898B2 JP4129898B2 (ja) | 2008-08-06 |
Family
ID=14698579
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11690699A Expired - Fee Related JP4129898B2 (ja) | 1999-04-23 | 1999-04-23 | 文字サイズ推定方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4129898B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009081791A1 (ja) * | 2007-12-21 | 2009-07-02 | Nec Corporation | 情報処理システム、その方法及びプログラム |
JP2012039217A (ja) * | 2010-08-04 | 2012-02-23 | Ricoh Elemex Corp | 画像形成装置、画像形成方法および画像形成プログラム |
US8391606B2 (en) | 2010-05-24 | 2013-03-05 | Fuji Xerox Co., Ltd. | Image processing device, image processing method, and computer readable medium |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03196281A (ja) * | 1989-12-25 | 1991-08-27 | Sharp Corp | キャラクタ認識装置 |
JPH05233873A (ja) * | 1991-11-29 | 1993-09-10 | Ricoh Co Ltd | 領域分割方法 |
JPH09190492A (ja) * | 1996-01-11 | 1997-07-22 | Canon Inc | 情報処理装置及び方法 |
JPH10240935A (ja) * | 1997-02-25 | 1998-09-11 | Ricoh Co Ltd | 線図形画像処理方法及び機械読み取り可能な媒体 |
-
1999
- 1999-04-23 JP JP11690699A patent/JP4129898B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03196281A (ja) * | 1989-12-25 | 1991-08-27 | Sharp Corp | キャラクタ認識装置 |
JPH05233873A (ja) * | 1991-11-29 | 1993-09-10 | Ricoh Co Ltd | 領域分割方法 |
JPH09190492A (ja) * | 1996-01-11 | 1997-07-22 | Canon Inc | 情報処理装置及び方法 |
JPH10240935A (ja) * | 1997-02-25 | 1998-09-11 | Ricoh Co Ltd | 線図形画像処理方法及び機械読み取り可能な媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009081791A1 (ja) * | 2007-12-21 | 2009-07-02 | Nec Corporation | 情報処理システム、その方法及びプログラム |
US8391606B2 (en) | 2010-05-24 | 2013-03-05 | Fuji Xerox Co., Ltd. | Image processing device, image processing method, and computer readable medium |
JP2012039217A (ja) * | 2010-08-04 | 2012-02-23 | Ricoh Elemex Corp | 画像形成装置、画像形成方法および画像形成プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4129898B2 (ja) | 2008-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102403964B1 (ko) | 화상 처리 장치, 화상 처리 방법, 및 저장 매체 | |
US5452374A (en) | Skew detection and correction of a document image representation | |
JP4271878B2 (ja) | 映像中の文字検索方法及び装置並びに文字検索処理プログラム | |
US5335290A (en) | Segmentation of text, picture and lines of a document image | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP4366011B2 (ja) | 文書処理装置及び方法 | |
JPH11219407A (ja) | 文書画像認識装置および文書画像認識プログラムの記憶媒体 | |
JP2001109844A (ja) | 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置 | |
JP2010074342A (ja) | 画像処理装置、画像形成装置、及びプログラム | |
JP2000306041A (ja) | 文字サイズ推定方法および記録媒体 | |
JP4089849B2 (ja) | 罫線処理装置および記録媒体 | |
JPH0773271A (ja) | 領域分割方法 | |
JP4381455B2 (ja) | 文字サイズ推定方法、装置および記録媒体 | |
JP2012022413A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JPH04352295A (ja) | 文字列方向判別装置 | |
JP2008004116A (ja) | 映像中の文字検索方法及び装置 | |
JP2007295210A (ja) | 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体 | |
JP4731748B2 (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
JP2000259826A (ja) | 罫線抽出方法、装置および記録媒体 | |
JP2001236464A (ja) | 文字抽出方法、文字抽出装置及び記憶媒体 | |
JP2000306102A (ja) | 罫線識別方法および記録媒体 | |
JP2000163571A (ja) | 罫線認識方法、装置および記録媒体 | |
JP3380024B2 (ja) | ドキュメントイメージ処理方法およびドキュメントイメージ処理装置 | |
JPH0822507A (ja) | 文書認識装置 | |
JP4439054B2 (ja) | 文字認識装置及び文字枠線の検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050316 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080317 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080514 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080515 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110530 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120530 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120530 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130530 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130530 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |