JP3406942B2 - 画像処理装置及び方法 - Google Patents
画像処理装置及び方法Info
- Publication number
- JP3406942B2 JP3406942B2 JP25211594A JP25211594A JP3406942B2 JP 3406942 B2 JP3406942 B2 JP 3406942B2 JP 25211594 A JP25211594 A JP 25211594A JP 25211594 A JP25211594 A JP 25211594A JP 3406942 B2 JP3406942 B2 JP 3406942B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- character area
- character
- information
- new
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
詳しくは入力画像の像域分離を行う画像処理装置及び方
法に関するものである。
置、複写機、ファクシミリ等の電子装置において、入力
される画像を認識するには、その入力画像が認識対象と
なる文字のみで構成されることを前提としている。
段として、スペクトル分析方式の様に入力画像のフーリ
ェスペクトルを分析し各種領域に分割する方式を用いた
ものや、特開昭64−45889号公報の様に垂直及び
水平方向の射影を交互に繰り返して取り周辺分布の情報
から領域を分割していく方式を用いたものなどがある。
従来技術では、図や写真等の領域内に文字があった場合
にそれが図として誤って判別されたり、逆に図や写真の
一部であるのに文字として判別されたりするという問題
点があった。
った場合に、文字領域矩形内に図や写真等の実画素が混
入するといった問題点があった。
り、文字のみではなく、それに図や写真等が混在してい
ても、文字領域をより確実に認識することを可能ならし
める画像処理装置及び方法を提供しようとするものであ
る。
画像処理装置は以下の構成を備える。すなわち、入力さ
れた画像中の有意な画素が連続する領域と、当該領域の
領域固有の位置情報、サイズ情報、画素情報を示す状態
情報とを抽出する抽出手段と、前記抽出手段により抽出
された領域の状態情報に応じて、各領域の属性を判定す
る判定手段と、前記判定手段で文字と判定された文字領
域と他の文字領域とが近接するか否か判断し、当該近接
すると判断された文字領域どうしを合併して新たな文字
領域を作成し、前記新たな文字領域の状態情報を抽出す
る合併手段と、前記新たな文字領域の状態情報と、前記
判定手段で非文字と判定された非文字領域の状態情報と
に基づいて、当該新たな文字領域と前記非文字領域とが
重複しているか、重複しているのであれば前記新たな文
字領域が前記非文字領域に内包されるか、それともその
一部が重なっているかを判断する重なり判断手段と、前
記新たな文字領域と前記非文字領域とが重複する場合、
前記新たな文字領域の状態情報と、前記非文字領域の状
態情報と、前記新たな文字領域が前記非文字領域に内包
されるか、それともその一部が重なっているかに基づい
て、当該新たな文字領域の属性を再判定する再判定手段
とを備える。
を備える。すなわち、入力された画像中の有意な画素が
連続する領域と、当該領域の領域固有の位置情報、サイ
ズ情報、画素情報を示す状態情報とを抽出する抽出工程
と、前記抽出工程により抽出された領域の状態情報に応
じて、各領域の属性を判定する判定工程と、前記判定工
程で文字と判定された文字領域と他の文字領域とが近接
するか否か判断し、当該近接すると判断された文字領域
どうしを合併して新たな文字領域を作成し、前記新たな
文字領域の状態情報を抽出する合併工程と、前記新たな
文字領域の状態情報と、前記判定工程で非文字と判定さ
れた非文字領域の状態情報とに基づいて、当該新たな文
字領域と前記非文字領域とが重複しているか、重複して
いるのであれば前記新たな文字領域が前記非文字領域に
内包されるか、それともその一部が重なっているかを判
断する重なり判断工程と、前記新たな文字領域と前記非
文字領域とが重複する場合、前記新たな文字領域の状態
情報と、前記非文字領域の状態情報と、前記新たな文字
領域が前記非文字領域に内包されるか、それともその一
部が重なっているかに基づいて、当該新たな文字領域の
属性を再判定する再判定工程とを備える。
を詳細に説明する。
ロック図である。
部であり、例えばイメージスキャナである。但し、入力
部101からは画像が入力されればよいので、ファクシ
ミリ受信機(復号器を含む)や、画像データを記憶して
いる記憶媒体の駆動装置であっても良いのは勿論であ
る。
う演算処理部(CPU)、103は制御プログラムや、
各種データを記憶しておく記憶部である。尚、この記憶
部103には、読み取り画像を記憶するだけの容量を持
ったRAMが含まれる。104は演算処理結果や画像処
理結果、及び画像データを出力する出力部、105は本
文やセパレータや表、図形等を抽出する領域抽出部、1
06は図形等の矩形領域に重複している文字矩形領域を
検出し、真に文字矩形領域か否かを再度判別する属性再
判別部である。
画像処理手順(記憶部103にプログラムとして記憶さ
れている)を示すフローチャートである。以下、同フロ
ーチャートに従って説明する。
ら元画像を入力し、記憶部103に記憶する。
度が閾値Rdpi以上であれば、縦mドット、横nドッ
トの論理和をとって新たにm×n画素を1画素に縮小
し、解像度が閾値Rdpi未満であれば縦pドット、横
qドットの論理和をとって新たにp×q画素を1画素に
縮小する。
q画像中に1ドットでも黒画素が有れば縮小画像は黒と
なる。
つスキャンし、黒画素をサーチする。そして、黒画素が
発見されると、その画素にラベルを付加する。このと
き、上下・左右・斜めで連続している画素には同一ラベ
ルを付け、同時に矩形をかたどっていく。但し、実施例
では、処理を簡略化するため、従前に処理を行ったライ
ンと注目ラインとの間でラベル付け処理を行う(後続す
るラインは処理対象としない)。
素A(以下、単に画素)には矩形ラベル“1”が付けら
れる。そして、図5に示すような矩形データを記憶部1
03に作成する。矩形データは、まず、画素Aの座標
(Xa,Xb)を矩形の始点とし、画素数を“1”、画
素Aと同じラベル“1”を付加して矩形データとする。
向に移動し、画素Bを検出することになる。この画素B
は連続していない(1行目であるのでもちろん上からも
連続画素はない)ので、ラベル“2”が付けられ、この
画素Bの座標(Xb,Yb)を矩形の始点と終点とし、
画素数を“1”、矩形を区別するための矩形ラベルに画
素と同じラベル“2”を付加して記憶部103に矩形デ
ータ(図5(A)参照)を作成する。つまり、この時点
では画素A、Bとは互いに独立しているものとして扱わ
れる。
目)のラベリングが終了したら2行目に移る。
“1”の画素Aと上から連続しているので画素ラベル
“1”を付加し、矩形ラベル“1”の矩形データに対し
画素数“1”を加算して計2画素とする。矩形ラベルは
変わらず“1”のままである。そして、矩形座標は終点
のみを(Xa,Ya)から(Xa,Yc)へと更新する
(始点の座標は変わらない)。
の左上隅を、矩形の終点とはその右下隅の座標を言う。
素Dは画素Cに隣接すると共に、画素Bにも斜めに連続
している。従って、画素Dは勿論、画素Bのラベルを
“1”へと変更し、矩形ラベル“1”の画素数を計4個
に更新する。また、画素A〜Dが1つの矩形ラベルを表
わしているので、その始点座標は(Xa,Ya)、終点
座標は(Xb,Yd)へと更新する。
ては矩形ラベル“0”として無効とする(矩形ラベル
“2”を新たに使用することを許可する)。
に移る。
続している。従ってこの画素Eに画素ラベル“1”に付
加し、矩形ラベル“1”の矩形データに対し画素数を1
加算させ、計5画素とする。矩形ラベルは変わらず
“1”のままで、矩形ラベル1の始点座標を(Xa,Y
a)から(Xe,Ya)へ、終点座標を(Xb,Yd)
から(Xb,Ye)へと更新する。
し、ラベリングと矩形のかたどりを行う。
域について、それぞれ矩形データを得ることになる。次
に、ラベリングと矩形のかたどりの後、本文に該当する
矩形、図形または写真、表等に該当する矩形、セパレー
タに該当する矩形等を、矩形の幅W、高さH、面積S、
面積に対する画素の数すなわち画素密度D(これらは矩
形データを用いて計算する事により容易に求まる、つま
り、画素数/面積である)を用いて区別する。そして、
区別結果は、図5(B)に示す属性値を各矩形データの
“属性”項目に与えることで行われる。
6のフローチャート及び図7を用いて説明する。
つ高さHが幅Wの閾値Tw2倍以上(S603)、もし
くは幅Wが閾値Tw1より大きくかつ高さHが幅Wの閾
値Tw3倍以上(S604)である場合とする。この場
合、注目矩形データの属性には、縦長セパレータとして
属性「−3」として統一し(S614)、矩形を構成す
る画素ラベルは属性とは別にそのまま保持しておく。
様にして(S605,S606)、縦長セパレータとし
て注目矩形データの属性を「−3」にする。
d1以下の時(S607)、カギ型などの変形セパレー
タと見なして属性を「−3」にする(S614)。
情報を区切り線であるので、その長さはあるものの、そ
の幅は小さいという特性がある。上記判別は、これを利
用していることになる。
で(S608)、画素密度Dが閾値Td2未満(S60
9)ならば表と見なして属性を「−4」にし(S61
5)、画素密度Dが閾値Td2以上ならば図形または写
真とみなして属性を「−5」にする(S616)。
わけであるから、その面積に対する画素密度は低く、図
形や写真等は画素密度は罫線より高いという特徴を利用
していることになる。
Ts2以上の場合であって(S610)、画素密度Dが
閾値Td3以上(S611)の矩形や、幅W及び高さH
が共に閾値Tw4以上でかつ画素密度DがTd5以上の
時(S613)の矩形も図形または写真とみなして属性
を「−5」にする。
Tw2以上の場合であって(S610)、画素密度Dが
閾値Td4未満(S612)の矩形を表とみなし属性を
「−4」にする(S615)。
該当する矩形、セパレータに該当する矩形等を検出し、
残った矩形を本文として属性は初期値のままにしておく
(S617)。
た矩形は横方向に縮小画素が連続して横長の矩形になり
やすく、縦書き文章であれば、本文として残った矩形は
縦長になりやすい。理由は、先に説明したように、m×
nの画素ブロック中の各画素を論理和して1個の縮小画
素を形成するためであり、文章としての文字の流れに沿
った文字間が、その行間より狭いために画像縮小処理を
行うと隣接する文字が接続状態になるからである。
を算出し、平均幅wが平均高さhより大きい場合は横書
きの多い章と見なし、平均高さhを1文字の文字サイズ
とする。逆に平均高さhが平均幅wより大きい場合は縦
書きの多い文章と見なし、平均幅wを1文字の文字サイ
ズとする。
ままの本文に該当する矩形を合併する。
定された矩形A1と矩形Bとの合併を考える。矩形A1
に対してX方向に対してPx,Y方向に対してPyだけ
拡張した仮想矩形A1′を考え、A1′に対してその周
囲に接触或は内包する、本文であると判定された矩形が
あるかサーチし、矩形Bの様に接触していれば矩形A1
と矩形Bを合併して新しく合併矩形A2を作成し、矩形
A1の矩形データを更新する。この結果、矩形Bのデー
タは不要になるので無効とする。ただし、この時Px,
Pyは文字サイズ等から求めた値である。
に分割された状態まで合併していく(図9)と同時に、
矩形データの組方向に、それが横書きであれば0、縦書
きであれば1として記憶してゆく。
数を計数し、矩形データに記憶する。
に段落ごとに組方向が検出されており、この例の場合横
書きということが判明しているので、Y軸方向に矩形の
ヒストグラムを取り(画素の頻度)、Y軸方向の谷(行
間に相当する)の数に1を加算した数を行数とみなす。
図示の場合、谷の和は“6”になるので、その数に1を
加算した数“7”が行数として計算され、矩形データの
“行数”の項目に記憶される。
106の処理を図11、図12を用い、その手順を図1
3のフローチャートに従って説明する。
2)の場合は、ステップS1301、1302で矩形領
域同士が重複しているものの図形矩形領域(1101)
からはみ出していると判明するので、ステップS130
3で文字矩形領域(1102)内の行数が閾値L1と比
較される。この例の場合、7行である事があらかじめ領
域抽出手段によって判明しているので(矩形データ内に
記憶されているので)ステップS1309で文字矩形領
域として再度判別される事になる。
であるはずの領域が文字矩形領域(1202)として抽
出されており、ステップS1302でその文字矩形領域
(1202)は図形矩形領域(1201)に完全に内包
しているとして判定される。そこでステップS1307
に進み、図形矩形領域(1201)の面積が閾値S1と
比較される。
の面積はあらかじめ領域抽出手段によって判明し、矩形
データ内に記憶されており、もし図形矩形領域(120
1)の面積が閾値S1以下であれば文字であると仮判定
されている矩形領域(1202)はステップS1310
において図形矩形領域として再度判別され、矩形データ
内に記憶されていた属性データを図形に変更される事に
なる。
小さい図形の矩形領域内に実際に文字が存在するという
ことはないからである。
閾値S1より大であれば、その図形の一部に対しての説
明文等のある可能性も出てくる。従って、文字矩形領域
(1202)はステップS1308において文字矩形領
域(1202)内の行数が所定の閾値L1(例えばL1
=2)と比較される。行数はあらかじめ領域抽出手段に
よって判明し、矩形データ内に記憶されているので、条
件を満たせない場合、文字矩形領域(1202)はステ
ップS1310において図形矩形領域として再度判別さ
れ、矩形データ内に記憶されていた属性データが図形に
変更される事になる。
して求めた各種領域の矩形データを画像データと共に出
力部104から出力する。
(縮小するまえの画像)を出力する。また、当然のこと
ながら、出力する矩形データの各座標値やサイズ等は、
原画像に対応した情報にする。
に応じて縮小する対象の画素ブロックサイズを2段階に
変化させたが、3段階或いはそれ以上であっても良い。
つまり、解像度に応じで縮小する画素の占める面積割合
の変化を小さくする。
低でも、行と行の間の空白部分(上記例では谷の部分)
は残ることが望ましいから、縮小対象となる画素ブロッ
クのサイズは任意に設定できた方が良い。これによっ
て、行間の異なる原稿画像に対してもケースに応じて正
しく認識することが可能になる。
手段を挿入することによって、図形等の実画素が混入し
ているか否かを判別し、次に文字行分割手段を挿入する
事によって、図形等の実画素が混入していたと判明した
文字矩形領域を行に分割する。
は段落にまとまった文字矩形領域(1401)と重複し
ており、図15(B)の矩形データ1404から図形の
画素ラベルにnが付けられている事がわかる。次に文字
の矩形領域1401内の実画素を順次探索し、各実画素
の画素ラベルがnであるものの有無を検査すること(図
16の符号1405参照)で、図形の実画素が文字の矩
形領域内に混入しているか否かが判定できる。
域内に混入している場合、図15に例を示すように、実
画素が入っている文字の矩形領域の射影(黒画素の有無
のみをとる)を用いて、周辺分布の形状から各行矩形の
座標を検出する。この時、文字の実画素の画素ラベルと
図の実画素の画素ラベルは異なるので、文字の画素のみ
から容易に射影をとることができる。
書きであることが分かっているので、横方向に射影をと
り、各行の存在するY座標を定める(図17の符号15
01)。次に各行の文字画素の縦方向への射影をとりX
座標を定め(符号1502)、各行ごとの矩形データを
作成し座標等を記憶させる。
CR等の認識処理の際に文字矩形領域内の図形の実画素
を認識対象から外し、認識率等の向上をはかれる。
ャートによって示されるのは容易に想到できよう。
字矩形領域の概説矩形の1画素分外側の画素を追跡し、
画素の有無を調査する事でも、文字以外の画素の文字矩
形領域への混入を知ることができ、処理時間の短縮もは
かれる。
領域抽出手段で行数を計数する際に行矩形の座標を検出
しておければ、実画素混入判定手段の後、もし図形の実
画素が文字の矩形領域内に混入している場合、矩形デー
タの作成のみの処理となり、処理時間の短縮がはかれ
る。
示すように、画像縮小処理後の黒画素数をY軸(縦軸)
に対して計数する。また、同様にX軸(横軸)に対して
画像縮小後の黒画素を計数することで図示のように、Y
軸、X軸それぞれの方向における黒画素の分布を示すヒ
ストグラムを取る。横書きの場合には、図示の如くX軸
方向における黒画素の分布は1つにまとまり、Y軸方向
における黒画素の分布は途切れた状態になる。X軸及び
Y軸方向にヒストグラムを取ったとき、黒画素がまとま
った領域における軸方向(X軸の場合には水平方向、Y
軸に対しては垂直方向)の長さをw、それに直交する黒
画素の度数方向をhと定義し、X軸、Y軸方向にとって
ヒストグラムを区別するために数字1、2を付加する
と、図示のようにまとまった黒画素の1つの領域をh
1、w1とh2、w2で定義できる。ここで、h1より
もw1が長く、h2よりもw2のほうが長いので、Y軸
方向の谷の数に1を加算した数を行数と見なし、再度組
方向を横書きであると検出することによって、組方向が
あらかじめ判明していない場合でも、行数の計数及び組
方向検出が同時に可能となり、あらかじめ判明していた
場合には、組方向検出の正確度を向上させることが可能
である。
入力手段と領域抽出手段と属性再判別手段を用いて、入
力画像に対し、複数の属性に分類して矩形領域等を抽出
し、本文に該当する矩形領域のうち図形または写真に該
当する矩形領域に重複するか否かを判別して、図形また
は写真の矩形領域に重複していると検出された文字矩形
領域が真に文字矩形領域か否かを再度判別する事によっ
て、画像処理全体の処理時間の大幅な増加や、既存のプ
ログラムの大幅な変更なしに、図や写真等の領域内の
文字領域の判別精度の向上、図や写真の一部を文字と
する誤判定の減少等がはかれる効果がある。
再度真の文字矩形領域であることが判明した矩形領域に
対して、実画素混入判定手段と文字行分割手段を用い
て、図形等の実画素が混入しているか否かを判別し、図
形等の実画素が混入していたと判明した文字矩形領域を
行に分割する事によって、画像処理全体の処理時間の大
幅な増加や、既存のプログラムの大幅な変更なしに、
文字領域矩形内に図や写真等の実画素が混入する事を防
ぐ効果がある。
システムに適用しても、1つの機器から成る装置に適用
しても良い。また、本発明はシステム或は装置にプログ
ラムを供給することによって達成される場合にも適用で
きることは言うまでもない。
字のみではなく、それに図や写真等が混在していても、
文字領域をより確実に認識することが可能になる。
すブロック図である。
すフローチャートである。
すフローチャートである。
示す図である。
示す図である。
ーチャートである。
Sでの切り分けを示す図である。
図である。
とに分割された状態まで合併処理を行った例を示す図で
ある。
を計数する処理の例を示す図である。
の例を示す図である。
の例を示す図である。
を示すフローチャートである。
判定処理の例を示す図である。
示す図である。
の例を示す図である。
数を計数する処理の例を示す図である。
Claims (16)
- 【請求項1】 入力された画像中の有意な画素が連続す
る領域と、当該領域の領域固有の位置情報、サイズ情
報、画素情報を示す状態情報とを抽出する抽出手段と、 前記抽出手段により抽出された領域の状態情報に応じ
て、各領域の属性を判定する判定手段と、 前記判定手段で文字と判定された文字領域と他の文字領
域とが近接するか否か判断し、当該近接すると判断され
た文字領域どうしを合併して新たな文字領域を作成し、
前記新たな文字領域の状態情報を抽出する合併手段と、 前記新たな文字領域の状態情報と、前記判定手段で非文
字と判定された非文字領域の状態情報とに基づいて、当
該新たな文字領域と前記非文字領域とが重複している
か、重複しているのであれば前記新たな文字領域が前記
非文字領域に内包されるか、それともその一部が重なっ
ているかを判断する重なり判断手段と、 前記新たな文字領域と前記非文字領域とが重複する場
合、前記新たな文字領域の状態情報と、前記非文字領域
の状態情報と、前記新たな文字領域が前記非文字領域に
内包されるか、それともその一部が重なっているかに基
づいて、当該新たな文字領域の属性を再判定する再判定
手段とを備えることを特徴とする画像処理装置。 - 【請求項2】 前記合併手段で合併された際には、行数
の情報が前記状態情報に追加されることを特徴とする請
求項1に記載の画像処理装置。 - 【請求項3】 前記再判定手段は、前記状態情報に含ま
れる各領域固有の位置情報、サイズ情報、画素情報、前
記合併手段で合併された際の行数情報のうち、少なくと
も1つの情報を用いて、前記新たな文字領域の属性を再
判定することを特徴とする請求項2に記載の画像処理装
置。 - 【請求項4】 前記抽出手段は、更に、画像を縮小する
縮小手段を備え、 前記縮小手段で縮小された画像中の有意な画素が連続す
る領域と、当該領域の状態情報とを抽出することを特徴
とする請求項1に記載の画像処理装置。 - 【請求項5】 前記縮小手段は、入力された画像中のm
×n画素領域内の各画素の値を論理和する論理演算手段
を含み、当該論理演算結果を1画素の値として出力する
ことを特徴とする請求項4に記載の画像処理装置。 - 【請求項6】 前記論理演算手段におけるm、nは、入
力画の解像度に応じて変化させることを特徴とする請求
項5に記載の画像処理装置。 - 【請求項7】 更に、前記再判定手段で再判定された属
性に当該新たな文字領域の属性を変更する属性変更手段
を備えることを特徴とする請求項1に記載の画像処理装
置。 - 【請求項8】 入力された画像中の有意な画素が連続す
る領域と、当該領域の領域固有の位置情報、サイズ情
報、画素情報を示す状態情報とを抽出する抽出手段と、 前記抽出手段により抽出された領域の状態情報に応じ
て、各領域の属性を判定する判定手段と、 前記判定手段で文字と判定された文字領域と他の文字領
域とが近接するか否か判断し、当該近接すると判断され
た文字領域どうしを合併して新たな文字領域を作成し、
前記新たな文字領域の状態情報を抽出する合併手段と、 前記新たな文字領域と、前記判定手段で非文字と判定さ
れた非文字領域とが重複する場合、前記新たな文字領域
の状態情報と前記非文字領域の状態情報と、前記新たな
文字領域が前記非文字領域に内包されるか、それともそ
の一部が重なっているかに基づいて、当該新たな文字領
域の属性を再判定する再判定手段と、 前記再判定手段により文字領域であると再判定された新
たな文字領域内に、前記非文字領域の有意な画素が混入
しているか否かを判定する混入判定手段と、 前記混入判定手段で前記非文字領域の有意な画素が混入
していたと判定された場合、前記新たな文字領域を行に
分割する文字行分割手段とを備えることを特徴とする画
像処理装置。 - 【請求項9】 入力された画像中の有意な画素が連続す
る領域と、当該領域の領域固有の位置情報、サイズ情
報、画素情報を示す状態情報とを抽出する抽出工程と、 前記抽出工程により抽出された領域の状態情報に応じ
て、各領域の属性を判定する判定工程と、 前記判定工程で文字と判定された文字領域と他の文字領
域とが近接するか否か判断し、当該近接すると判断され
た文字領域どうしを合併して新たな文字領域を作成し、
前記新たな文字領域の状態情報を抽出する合併工程と、 前記新たな文字領域の状態情報と、前記判定工程で非文
字と判定された非文字領域の状態情報とに基づいて、当
該新たな文字領域と前記非文字領域とが重複している
か、重複しているのであれば前記新たな文字領域が前記
非文字領域に内包されるか、それともその一部が重なっ
ているかを判断する重なり判断工程と、 前記新たな文字領域と前記非文字領域とが重複する場
合、前記新たな文字領域の状態情報と、前記非文字領域
の状態情報と、前記新たな文字領域が前記非文字領域に
内包されるか、それともその一部が重なっているかに基
づいて、当該新たな文字領域の属性を再判定する再判定
工程とを備えることを特徴とする画像処理方法。 - 【請求項10】 前記合併工程で合併された際には、前
記状態情報に行数の情報が追加されることを特徴とする
請求項9に記載の画像処理方法。 - 【請求項11】 前記再判定工程は、前記状態情報に含
まれる各領域固有の位置情報、サイズ情報、画素情報、
前記合併工程で合併された際の行数情報のうち、少なく
とも1つの情報を用いて、前記新たな文字領域の属性を
再判定することを特徴とする請求項10に記載の画像処
理方法。 - 【請求項12】 前記抽出工程は、更に、画像を縮小す
る縮小工程を備え、前記縮小工程で縮小された画像中の
有意な画素が連続する領域と、当該領域の状態情報とを
抽出することを特徴とする請求項9に記載の画像処理方
法。 - 【請求項13】 前記縮小工程は、入力された画像中の
m×n画素領域内の各画素の値を論理和する論理演算工
程を含み、当該論理演算結果を1画素の値として出力す
ることを特徴とする請求項12に記載の画像処理方法。 - 【請求項14】 前記論理演算工程におけるm、nは、
入力画像の解像度に応じて変化させることを特徴とする
請求項13に記載の画像処理方法。 - 【請求項15】 更に、前記再判定工程で再判定された
属性に当該新たな文字領域の属性を変更する属性変更工
程を備えることを特徴とする請求項9に記載の画像処理
方法。 - 【請求項16】 入力された画像中の有意な画素が連続
する領域と、当該領域の領域固有の位置情報、サイズ情
報、画素情報を示す状態情報とを抽出する抽出工程と、 前記抽出工程により抽出された領域の状態情報に応じ
て、各領域の属性を判定する判定工程と、 前記判定工程で文字と判定された文字領域と他の文字領
域とが近接するか否か判断し、当該近接すると判断され
た文字領域どうしを合併して新たな文字領域を作成し、
前記新たな文字領域の状態情報を抽出する合併工程と、 前記新たな文字領域と、前記判定手段で非文字と判定さ
れた非文字領域とが重複する場合、前記新たな文字領域
の状態情報と前記非文字領域の状態情報と、前記新たな
文字領域が前記非文字領域に内包されるか、それともそ
の一部が重なっているかに基づいて、当該新たな文字領
域の属性を再判定する再判定工程と、 前記再判定工程により文字領域であると再判定された新
たな文字領域内に、前記非文字領域の有意な画素が混入
しているか否かを判定する混入判定工程と、 前記混入判定工程で前記非文字領域の有意な画素が混入
していたと判定された場合、前記新たな文字領域を行に
分割する文字行分割工程とを備えることを特徴とする画
像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25211594A JP3406942B2 (ja) | 1994-10-18 | 1994-10-18 | 画像処理装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25211594A JP3406942B2 (ja) | 1994-10-18 | 1994-10-18 | 画像処理装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08115380A JPH08115380A (ja) | 1996-05-07 |
JP3406942B2 true JP3406942B2 (ja) | 2003-05-19 |
Family
ID=17232690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP25211594A Expired - Fee Related JP3406942B2 (ja) | 1994-10-18 | 1994-10-18 | 画像処理装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3406942B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4616522B2 (ja) * | 2001-07-12 | 2011-01-19 | 株式会社リコー | 文書認識装置、文書画像の領域識別方法、プログラム及び記憶媒体 |
WO2020054067A1 (ja) * | 2018-09-14 | 2020-03-19 | 三菱電機株式会社 | 画像情報処理装置、画像情報処理方法、及び画像情報処理プログラム |
-
1994
- 1994-10-18 JP JP25211594A patent/JP3406942B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08115380A (ja) | 1996-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5335290A (en) | Segmentation of text, picture and lines of a document image | |
US5854854A (en) | Skew detection and correction of a document image representation | |
US6731788B1 (en) | Symbol Classification with shape features applied to neural network | |
US6614930B1 (en) | Video stream classifiable symbol isolation method and system | |
US6173073B1 (en) | System for analyzing table images | |
EP0543599A2 (en) | Method and apparatus for image hand markup detection | |
EP1017011A2 (en) | Block selection of table features | |
JP2002042143A (ja) | 枠認識装置及び記録媒体 | |
US5502777A (en) | Method and apparatus for recognizing table and figure having many lateral and longitudinal lines | |
JP3406942B2 (ja) | 画像処理装置及び方法 | |
JP3186246B2 (ja) | 文書読取装置 | |
JPH11265422A (ja) | マーク認識方法及び装置並びに記録媒体 | |
JP3171626B2 (ja) | 文字認識の処理領域・処理条件指定方法 | |
JP3095470B2 (ja) | 文字認識装置 | |
US20030002062A1 (en) | Image processing apparatus, method and program, and storage medium | |
JP3186712B2 (ja) | 文書読取装置 | |
JP3190794B2 (ja) | 文字切り出し装置 | |
JPH0830725A (ja) | 画像処理装置及び方法 | |
JP3100825B2 (ja) | 線認識方法 | |
JPH05159062A (ja) | 文書認識装置 | |
JPH11242716A (ja) | 画像処理方法および記録媒体 | |
JP3534997B2 (ja) | 罫線抽出装置および方法 | |
JP4878057B2 (ja) | 文字認識方法,プログラム及び記録媒体 | |
JP3666903B2 (ja) | 画像処理方法および装置 | |
JP2917394B2 (ja) | 文字認識装置及び文字切り出し方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20000522 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080307 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090307 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100307 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100307 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110307 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120307 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130307 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140307 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |