JP2002175532A - 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体 - Google Patents

画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体

Info

Publication number
JP2002175532A
JP2002175532A JP2000373841A JP2000373841A JP2002175532A JP 2002175532 A JP2002175532 A JP 2002175532A JP 2000373841 A JP2000373841 A JP 2000373841A JP 2000373841 A JP2000373841 A JP 2000373841A JP 2002175532 A JP2002175532 A JP 2002175532A
Authority
JP
Japan
Prior art keywords
image data
pixel
pixel group
value
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000373841A
Other languages
English (en)
Inventor
Masahiro Kato
雅弘 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2000373841A priority Critical patent/JP2002175532A/ja
Publication of JP2002175532A publication Critical patent/JP2002175532A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 背景が一様でない多値画像であって、かつ、
反転文字が混在する原稿についても、文字抽出を良好に
行えるようにする。 【解決手段】 複数画素からなる画像データを取得する
と、その画像データに対して所定の参照範囲内に属する
画素が持つ値の代表値を算出し、算出した代表値よりも
所定値以上大きい値を有する第1の画素群を前記画像デ
ータから抽出するとともに、当該代表値よりも所定値以
上小さい値を有する第2の画素群を前記画像データから
抽出し、これら第1の画素群および第2の画素群の両方
を基に、前記画像データから特定の画像領域を抽出す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、取得した画像デー
タから特定の画素を含む画像領域、特に文字領域を抽出
するための画像処理装置、画像処理方法および画像処理
プログラムを記録した記憶媒体に関する。
【0002】
【従来の技術】近年、ワードプロセッサやパーソナルコ
ンピュータ(以下「PC」と称す)等を用いた電子デー
タを出力形態とする電子文書作成装置の普及に加え、イ
ンターネットやイントラネット等によりオフィスや家庭
を取り巻くネットワーク環境が急速に発達しており、情
報の作成、伝達、蓄積を行うために電子データ化された
文書が広く用いられている。ところが、一方では、古く
から親しまれた紙の印刷物のように、電子文書に対して
いわゆるハード文書と呼ぶことができるこれらの情報を
利用したいというニーズも多い。このような、電子デー
タ化された文書とハード文書とを混在して利用するため
には、ハード文書による情報を何らかの手段を用いて電
子データに変換する必要が生じる。
【0003】これを実現する最も基本的な手法は、ハー
ド文書をスキャナを用いてデジタル化したラスター画像
データそのものを、電子データとして利用することであ
る。ただし、このような電子データは、文章や写真、図
形や表といった文書の構成要素がどのようなものであろ
うと、文書全体が一律に単なる画素の集合として表現さ
れてしまうため、電子文書作成装置等で作成された文書
と同等に文書内の文章や図形を自由に検索、編集すると
いった多岐にわたる利用が困難である。
【0004】これを解決するために、従来、原稿となる
ハード文書上の画像を、例えば写真領域、図形領域、表
領域、あるいは縦書き文章領域や横書き文章領域といっ
た有意な属性を持つ複数の領域に分割し、所望の領域を
抽出して活用する手法が提案されている。例えば、多く
のPC用文字認識ソフトウエアでは、レイアウト認識処
理という名目で、入力した原稿画像を文章領域、表領
域、図形領域などに分割し、文章表現であれば段組を踏
まえた上で文字認識処理を行い、表領域であれば「表」
であるという認識とともにその構造を解析し、罫線と文
字を分離した後に文字認識処理を行うものがある。ただ
し、これら従来のものは、例えば新聞記事の本文欄のよ
うに、文字領域では背景が存在しないか、または一様な
色背景を持つ原稿画像データを前提としているため、絵
柄などの存在により背景が一様でない多値原稿画像デー
タについては適用できないという難点がある。
【0005】このような難点に対し、本願発明の発明者
らは、特願平11−304923号において、文字を線
分の集合と捉え、予め定めた幅を持ち、かつ、周辺より
も画素の持つ値が大きい線分および周辺よりも画素の持
つ値が小さい線分を抽出することで、背景が一様でない
多値原稿画像データについても、文字や罫線を抽出する
ことのできる手法を提案している。この手法について簡
単に説明すると、先ず、予め抽出したい線分の線幅に対
応した線分基本要素を決定しておき、当該線分基本要素
を用いて原稿画像データを走査し、原稿画像データ上の
画素の値に基づき注目領域が線分の一部であると判定で
きる場合には、当該線分基本要素で覆われた領域を検出
・膨張させて線分候補領域を抽出する。そして、当該線
分候補領域に属する全て画素を注目画素とし、移動平均
法などの二値化処理を用いて文字を表す線分を抽出する
ものである。この手法によれば、多値画像中の様々な濃
度を持つ文字や罫線を抽出することができる。
【0006】
【発明が解決しようとする課題】しかしながら、上述し
た従来の技術、すなわち特願平11−304923号に
て提案した手法では、文字や罫線を構成する線分の抽出
にあたって、予め抽出したい線分の線幅に対応した線分
基本要素を決定しておき、当該線分基本要素を用いて原
稿画像データを走査した後に二値化処理を行うが、抽出
処理の高速化やその処理負荷の低減等を考慮すると、さ
らに簡略化した処理で抽出を行い得るようにすることが
好ましい。
【0007】また、抽出処理に対しては、処理の高速化
や負荷低減等と同様に、更なる抽出精度の向上も望まれ
ている。例えば、反転文字のように局所的に文字と背景
の画素値が入れ替わる場合、特に反転装飾されている文
字の背景部分(白黒の二値画像において反転文字を考え
たとき、文字を白く抜いている黒画素の領域)の面積が
極めて小さい場合であっても、文字抽出を良好に行い得
るようにすることが望ましい。
【0008】そこで、本発明は、上述した事情を鑑み、
背景が一様でない多値画像であって、かつ、反転文字が
混在する画像であっても、文字や罫線の抽出を迅速かつ
精度良く行うことのできる画像処理装置、画像処理方法
および画像処理プログラムを記録した記憶媒体を提供す
ることを目的とする。
【0009】
【課題を解決するための手段】本発明は上記目的を達成
するために案出された画像処理装置で、複数画素からな
る画像データを取得するデータ取得手段と、前記データ
取得手段が取得した画像データに対して所定の参照範囲
内に属する画素が持つ値の代表値を算出する代表値算出
手段と、前記代表値算出手段が算出した代表値よりも所
定値以上大きい値を有する第1の画素群を抽出する第1
画素群抽出手段と、前記代表値算出手段が算出した代表
値よりも所定値以上小さい値を有する第2の画素群を抽
出する第2画素群抽出手段と、前記第1の画素群と前記
第2の画素群との両方を基に前記データ取得手段が取得
した画像データから特定の画像領域を抽出する画像領域
抽出手段とを備えることを特徴とするものである。
【0010】また、本発明に係る画像処理方法は、複数
画素からなる画像データを取得すると、当該画像データ
に対して所定の参照範囲内に属する画素が持つ値の代表
値を算出し、算出した代表値よりも所定値以上大きい値
を有する第1の画素群を前記画像データから抽出すると
ともに、当該代表値よりも所定値以上小さい値を有する
第2の画素群を前記画像データから抽出し、前記第1の
画素群と前記第2の画素群との両方を基に前記画像デー
タから特定の画像領域を抽出することを特徴とする。
【0011】また、本発明に係る画像処理プログラムを
記録した記憶媒体は、コンピュータ読み取り可能な画像
処理プログラムを記録した記憶媒体であって、複数画素
からなる画像データを取得すると、当該画像データに対
して所定の参照範囲内に属する画素が持つ値の代表値を
算出し、算出した代表値よりも所定値以上大きい値を有
する第1の画素群を前記画像データから抽出するととも
に、当該代表値よりも所定値以上小さい値を有する第2
の画素群を前記画像データから抽出し、前記第1の画素
群と前記第2の画素群との両方を基に前記画像データか
ら特定の画像領域を抽出することを特徴とする。
【0012】上記構成の画像処理装置、上記手順の画像
処理方法、または上記手順の画像処理プログラムを記録
した記憶媒体によれば、所定の参照範囲の代表値より
も、所定値以上大きい値を有する第1の画素群と、所定
値以上小さい値を有する第2の画素群とを、それぞれ処
理対象となる画像データから抽出する。これにより、例
えば白背景中の黒文字部分や色背景中の白文字部分のよ
うに、線分を構成すると考えられる画素群が抽出される
ことになる。したがって、その抽出結果を基に例えば文
字領域といった特定の画像領域を抽出することで、予め
抽出すべき線分の線幅決定等を要することなく、多値画
像中における文字等を抽出し得るようになる。しかも、
例えば反転文字が混在し、かつ、その反転装飾されてい
る文字の背景部分が極めて小さな場合であっても、第1
の画素群と第2の画素群との両方を基に画像領域の抽出
を行うことで、反転文字装飾部分の背景部面積に拘わら
ず安定してその文字を抽出できるようになる。
【0013】また、本発明に係る画像処理装置は、複数
画素からなる画像データを取得するデータ取得手段と、
前記データ取得手段が取得した画像データの各画素を異
なる閾値で二値化して、互いに異なる二つの二値画像デ
ータを生成する二値化手段と、前記二値化手段が生成し
た二つの二値画像データから連結画素成分を抽出する連
結画素抽出手段と、前記連結画素抽出手段が抽出した連
結画素成分の中から従属成分と判定できるものを前記二
つの二値画像データ上から除去する従属成分除去手段
と、前記二つの二値画像データにおいて一方の二値画像
データに基づき新たに求めた連結画素成分を他方の二値
画像データへ反映させる連結画素成分補完手段と、前記
従属成分除去手段による除去後および前記連結画素成分
補完手段による反映後の二つの二値画像データを統合し
て出力二値画像データを生成する二値画像統合手段とを
備えることを特徴とするものである。
【0014】また、本発明に係る画像処理方法は、複数
画素からなる画像データを取得すると、当該画像データ
の各画素を異なる閾値で二値化して互いに異なる二つの
二値画像データを生成し、生成した二つの二値画像デー
タから連結画素成分を抽出し、抽出した連結画素成分の
中から従属成分と判定できるものを前記二つの二値画像
データ上から除去し、前記二つの二値画像データにおい
て一方の二値画像データに基づき新たに求めた連結画素
成分を他方の二値画像データへ反映させ、前記従属成分
の除去後および前記連結画素成分の反映後の二つの二値
画像データを統合して出力二値画像データを生成するこ
とを特徴とする。
【0015】また、本発明に係る画像処理プログラムを
記録した記憶媒体は、コンピュータ読み取り可能な画像
処理プログラムを記録した記憶媒体であって、複数画素
からなる画像データを取得すると、当該画像データの各
画素を異なる閾値で二値化して互いに異なる二つの二値
画像データを生成し、生成した二つの二値画像データか
ら連結画素成分を抽出し、抽出した連結画素成分の中か
ら従属成分と判定できるものを前記二つの二値画像デー
タ上から除去し、前記二つの二値画像データにおいて一
方の二値画像データに基づき新たに求めた連結画素成分
を他方の二値画像データへ反映させ、前記従属成分の除
去後および前記連結画素成分の反映後の二つの二値画像
データを統合して出力二値画像データを生成することを
特徴とする。
【0016】上記構成の画像処理装置、上記手順の画像
処理方法、または上記手順の画像処理プログラムを記録
した記憶媒体によれば、処理対象となる画像データの各
画素を異なる閾値で二値化して二つの二値画像データを
生成し、それぞれの二値画像データから連結画素成分を
抽出する。これにより、例えば白背景中の黒文字部分や
色背景中の白文字部分のように、線分を構成すると考え
られる連結画素成分が抽出されることになる。そして、
抽出した連結画素成分の中から、従属成分と判定できる
ものを除去する。ここで、従属成分とは、単独で文字線
分等の一要素を構成するものではなく、要素中の一部分
(例えば絵柄の一構成部分)に過ぎないものをいう。さ
らには、一方の二値画像データに基づき新たに求めた連
結画素成分を他方の二値画像データへ反映させる。つま
り、例えば反転文字を構成する連結画素成分のように、
単なる二値化では抽出困難と考えられる連結画素成分
を、二つの二値画像データ同士で互いに補完して抽出す
る。したがって、従属成分の除去後および連結画素成分
の反映後の二つの二値画像データを統合して出力二値画
像データを生成すれば、その出力二値画像データよって
例えば文字領域を特定することができ、予め抽出すべき
線分の線幅決定等を要することなく、多値画像中におけ
る文字等を抽出し得るようになる。しかも、例えば反転
文字が混在し、かつ、その反転装飾されている文字の背
景部分が極めて小さな場合であっても、異なる閾値で二
値化して二つの二値画像データを用いて画像領域の抽出
を行うことで、反転文字装飾部分の背景部面積に拘わら
ず安定して文字等を抽出できるようになる。
【0017】
【発明の実施の形態】以下、図面に基づき本発明に係る
画像処理装置、画像処理方法および画像処理プログラム
を記録した記憶媒体について説明する。
【0018】先ず、本発明に係る画像処理装置の概略構
成について説明する。図1は、本発明の一実施形態に係
る画像処理装置(以下「本装置」と称す)の構成を概略
的に示したブロック図である。図例のように、本装置
は、画像入力部1と、画像格納部2と、画像二値化部3
と、連結画素成分抽出部4と、微小ノイズ除去部5と、
従属成分除去部6と、表/罫線抽出部7と、連結画素成
分補完部8と、文字候補抽出部9と、背景除去部10
と、ユーザインタフェース(以下「U/I」と略す)部
11と、制御部12と、これらの各部を結ぶバス13
と、を備えている。
【0019】画像入力部1は、処理対象となる原稿画像
データを取得するものである。具体的には、例えば、ス
キャナやデジタルカメラ等のように光学的に原稿画像デ
ータを取得する手段であってもよいし、また、予めデジ
タル化された画像データが格納された記憶媒体やネット
ワークを通じて、原稿画像データを取得する手段であっ
てもよい。なお、ここでは、取得対象となる原稿画像デ
ータが、例えばR(赤)、G(緑)、B(青)の各色成
分毎に複数画素からなるデジタルデータであるものとす
る。
【0020】画像格納部2は、画像入力部1が取得した
原稿画像データをはじめ、後述する他の処理部で処理さ
れた二値画像データやラベル画像データ等を格納するも
のである。この画像格納部2としては、画像データを専
用に格納する画像メモリであってもよいし、様々な演算
処理を行うために利用されるRAM(Random AccessMem
ory)やハードディスク、リムーバルディスク等といっ
た汎用の記憶媒体であってもよい。
【0021】画像二値化部3は、画像格納部2に格納さ
れた原稿画像データを読み出し、詳細を後述するような
二値化処理を実施した後に、その結果である二値画像デ
ータを画像格納部2に格納するものである。
【0022】連結画素成分抽出部4は、画像二値化部3
で作成され画像格納部2内に格納された二値画像データ
を参照して、連結画素成分を抽出するとともに、ラベリ
ング処理を実施するものである。連結画素成分とは、隣
接した画素同士が連結して一つの塊を形成している画素
群のことをいう。また、ラベリング処理とは、各画素に
ラベル値を付加する処理をいう。ただし、特定の関係を
有する一つの画素群、さらに具体的には連結画素成分を
構成する各画素については、同一のラベル値が付加され
るものとする。連結画素成分抽出部4では、このような
ラベリング処理によって付加されたラベル値を、画素毎
にラベル画像データとして画像格納部2に格納する。ま
た、連結画素成分抽出部4では、ラベリング処理によっ
て得られた各連結画素成分の外接矩形を作成し、その外
接矩形の大きさの算出を行うようにもなっている
【0023】微小ノイズ除去部5は、連結画素成分抽出
部4が抽出した連結画素成分の中から、微小ノイズを抽
出して除去するものである。微小ノイズとは、連結画素
成分の中で、線分等を構成するものではなく、単なるノ
イズ成分と判定されるものをいう。微小ノイズ除去部5
では、微小ノイズか否かの判定を、連結画素成分の外接
矩形の大きさに基づいて行うようになっている。
【0024】従属成分除去部6は、微小ノイズ除去部5
にて微小ノイズではないと判定された連結画素成分につ
いて、その連結画素成分が従属成分であるか否かを判定
し、従属成分であればこれを除去するものである。従属
成分とは、単独で文字線分等の一要素を構成するもので
はなく、要素中の一部分(例えば絵柄の一構成部分)に
過ぎないものをいう。
【0025】表/罫線抽出部7は、従属成分除去部6に
て従属成分ではないと判定された連結画素成分の中か
ら、表罫線またはフィールドセパレータに相当する連結
画素成分を抽出するものである。表/罫線抽出部7で
は、その抽出を、連結画素成分抽出部4が作成した連結
画素成分の外接矩形の大きさを参照しつつ行うようにな
っている。
【0026】連結画素成分補完部8は、表/罫線抽出部
7にて表罫線またはフィールドセパレータではないと判
定された連結画素成分に対し、必要に応じて補完処理を
行うものである。補完処理としては、例えば、連結画素
成分が文字を構成する一要素である場合に、その連結画
素成分の一部分が欠けている等、文字を構成する要素と
して不完全な部分を二値画像データ上で補完する処理
や、連結画素成分が反転文字の背景部である場合に、そ
の内部輪郭情報を用いて本来文字を構成する連結画素成
分として抽出すべき画素を二値画像データ上に生成する
処理が挙げられる。
【0027】文字候補抽出部9は、連結画素成分補完部
8での補完処理を経た後の二値画像データに対し、連結
画素成分抽出部4により再度ラベリング処理を実施し
て、ラベル画像データの更新および各連結画素成分の外
接矩形の再抽出を行った後、その外接矩形の大きさが文
字としては大きすぎると判定される連結画素成分を絵柄
等の一部分であるとみなして除去し、除去されずに残さ
った連結画素成分を文字候補とするものである。
【0028】背景除去部10は、文字候補抽出部9で抽
出された文字候補である連結画素成分の中から、文字で
はなく背景の一部であるとみなすことができるものを抽
出して除去するものである
【0029】U/I部11は、本装置を利用するユーザ
からの指示要求を取得したり、そのユーザへの必要な情
報の提供を行うものである。具体的には、キーボード、
マウス、タッチパネル、マイク、ディスプレイ、スピー
カ等といった情報入出力装置によって構成されたもので
ある。
【0030】制御部12は、上述した各部、すなわち本
装置全体の動作制御を行うものである。
【0031】なお、上述したうちの画像格納部2および
U/I部11を除く各部は、例えば所定プログラムを実
行するマイクロコンピュータ等によりソフトウエア的に
構成しても、あるいは所定機能を有した電子回路等によ
りハードウエア的に構成してもよい。したがって、本装
置は、CD−ROM等のコンピュータ読み取り可能な記
録媒体に記録された画像処理プログラムを、予めコンピ
ュータ装置にインストールしておくことで実現したり、
あるいは必要に応じてその都度読み出すことによって実
現することが考えられる。
【0032】次に、以上のように構成された画像処理装
置全体の動作の概要、すなわち本発明に係る画像処理方
法の概要について説明する。図2は、本実施形態におけ
る画像処理装置全体の処理動作例の概要を示すフローチ
ャートである。なお、本装置全体では、図2に示すフロ
ーチャートの処理を実施する前に、予め所定の初期化が
実施されるものとする。ただし、その初期化処理につい
ては、本発明の要旨に影響を与えないため、その説明を
省略する。同様に、本装置の本質的な動作を実現するに
あたり、間接的に必要なその他の動作処理に関しても、
ここではその説明を省略するる。
【0033】図2に示すように、本装置では、画像入力
部1が原稿画像データを取得すると、その原稿画像デー
タを画像格納部2に格納する(ステップ101、以下ス
テップを「S」と略す)。さらには、その原稿画像デー
タの解像度に従い、後述する二値化処理時の周辺画素参
照範囲、微小ノイズとみなす連結画素成分の大きさ、表
/フィールドセパレータとみなす連結画素成分の大き
さ、文字候補とみなす連結画素成分の大きさ等、といっ
た各種パラメータを決定する(S102)。
【0034】その後における処理には、周辺の画素の値
(例えば濃度値、以下「画素値」と称す)よりも高い値
を持つ画素によって構成される文字および表罫線/フィ
ールドセパレータを抽出する処理系統(S103〜S1
09)と、周辺の画素値よりも低い値を持つ画素によっ
て構成される文字および表罫線/フィールドセパレータ
を抽出する処理系統(S110〜S116)との二つが
存在する。これらの処理系統は、並列処理が可能であ
る。
【0035】各処理系統では、いずれも、画像二値化部
3による二値化処理(S103,S110)、連結画素
成分抽出部4による連結画素成分の抽出および外接矩形
の作成処理(S104,S111)、微小ノイズ除去部
5による微小ノイズの除去処理(S105,S11
2)、従属成分除去部6による従属成分の除去処理(S
106,S113)、表/罫線抽出部7による表罫線ま
たはフィールドセパレータに相当する連結画素成分の抽
出処理(S107,S114)、連結画素成分補完部8
による補完処理(S108,S115)、文字候補抽出
部9による文字候補の抽出処理(S109,S11
6)、が順に行われる。
【0036】そして、各処理系統における文字候補の抽
出結果を基に、これらの両方を統合した後、あるいはい
ずれか一方を選択した後に、背景除去部10による背景
除去処理を経て(S117)、本装置から文字を構成す
る画素からなる画像領域、すなわち文字領域が抽出され
ることになる。
【0037】このような文字領域の抽出は、画像入力部
1がRGBの各色成分からなる原稿画像データを取得す
ることから、各色成分のそれぞれについて個別に行うよ
うにする。そして、各色成分についての文字領域の抽出
結果を統合した統合文字領域を、最終的な抽出領域とす
る。ただし、例えば単色の文字についての領域のみを抽
出する場合のように、明らかに各色成分についての処理
が不要である場合には、RGBの各色成分の中からいず
れか一つを選択し、その一つの色成分データを画像入力
部1が取得した原稿画像データとするようにしてもよ
い。また、RGBの各色成分に対する色変換処理を行っ
て、例えばY(イエロー)、M(マゼンタ)、C(サイ
アン)、K(ブラック)の各色成分からなる新たな画像
データを生成する場合には、その新たな画像データを画
像入力部1が取得した原稿画像データとし、新たな各色
成分データまたはそのうちのいずれか一つのについて、
文字領域の抽出処理を行うことも考えられる。
【0038】このようにして文字領域の抽出を行うと、
本装置では、その抽出結果を文字認識処理等を行うため
の入力データとして用いる。すなわち、本装置が有す
る、または本装置と接続する他の装置が有する、文字認
識処理等を行うための機能への入力データとし、当該機
能に原稿画像データについての文字認識処理等を行わせ
る。
【0039】次に、上述した処理動作のうち、画像二値
化部3が行う二値化処理(図2におけるS103,S1
10)について詳しく説明する。図3および図4は、各
処理系統に共通な二値化処理の考え方を示す説明図であ
り、注目画素を黒、周辺参照画素範囲を斜線で示してい
る。
【0040】二値化処理を行うのにあたって、画像二値
化部3は、先ず、画像格納部2に格納された処理対象と
なる原稿画像データの全画素を順次注目画素とし、その
注目画素を中心とした周辺画素参照範囲内の画素値の代
表値を算出する。
【0041】このとき、周辺画素参照範囲の大きさは、
既に説明したステップ(図2のS102参照)にて原稿
画像データの解像度に基づいて決定されたものを用い
る。この決定は、例えば原稿画像データの解像度が高い
ほど周辺画素参照範囲も大きく、その周辺画素参照範囲
に属する画素数が多くなる、といった具合に行われる。
このように決定された周辺画素参照範囲を用いること
で、画像二値化部3では、文字を構成すると考えられる
線分抽出を、原稿画像データの解像度に依らず、的確に
行い得るようになる。
【0042】具体的には、周辺画素参照範囲の大きさ
が、幅RefWndWidth、高さRefWndHeight で表される矩形
で定義されていれば、原稿画像データの解像度に従い、
例えば図3(a)に示すように、注目画素を中心として
幅RefWndWidthをW1に設定し、高さRefWndHeightをH
1に設定する。ただし、注目画素の位置が例えば図3
(b)に示すように画像の端部である場合には、その注
目画素に対してRefWndWidth <W1なる幅と、RefWndHe
ight<H1なる高さを持つ周辺画素参照範囲を設定す
る。
【0043】なお、周辺画素参照範囲の決定に関して
は、解像度の他に、予め設定しておいた抽出すべき文字
線分の幅に応じて決定してもよいし、U/I部11を通
してユーザが本装置の利用時に当該文字線幅を指定して
もよく、これらの場合であっても文字線分の抽出が的確
に行えると考えられる。ただし、いずれの場合にも、周
辺画素参照範囲が大きくなるほど抽出できる文字線幅も
太くなるが、その周辺画素参照範囲内の画素値の代表値
を算出するのに必要な演算量も多くなるので、原稿画像
データの種類や本装置の利用目的等に応じて適切な大き
さを決定する。
【0044】また、代表値としては、例えば周辺画素参
照範囲内の画素値の平均値を算出する。ただし、代表値
は、平均値ではなく、周辺画素参照範囲に属する画素値
の中央値とすることも考えられる。
【0045】そして、画像二値化部3は、周辺画素値よ
りも高い値を持つ画素についての処理系統においては、
算出した平均値(図3中の斜線で示す周辺画素の平均画
素値)に所定値を加えた値を閾値THbin1とし、注目画
素(図3中の黒色画素)の値が閾値THbin1以上であれ
ばその注目画素の値を「1」とし、注目画素の値が閾値
THbin1未満であればその注目画素の値を「0」とする
二値化を行う。すなわち、画像二値化部3は、注目画素
値から平均値を差し引いた値が所定値以上であれば、そ
の注目画素の値を「1」とし、それ以外の場合は「0」
とする二値化を行う。この二値化によって得られる二値
画像データ(以下「二値画像データA」と称す)は、画
像格納部2に格納されることになる。
【0046】また、画像二値化部3は、周辺画素値より
も低い値を持つ画素についての処理系統においては、算
出した平均値から所定値を引いた値を閾値THbin2
し、注目画素の値が閾値THbin2以下であればその注目
画素の値を「1」とし、注目画素の値が閾値THbin2
超えればその注目画素の値を「0」とする二値化を行
う。すなわち、画像二値化部3は、平均値から注目画素
値を差し引いた値が所定値以上であれば、その注目画素
の値を「1」とし、それ以外の場合は「0」とする二値
化を行う。ここで得られる二値画像データ(以下「二値
画像データB」と称す)も、画像格納部2に格納される
ことになる。
【0047】このときに用いる閾値THbin1,THbin2
は、抽出すべき文字色やその背景色等を考慮して、予め
設定されているものとする。このことは、文字色やその
背景色等に応じて、閾値THbin1,THbin2を適宜設定
しても良いといえる。
【0048】以上のような二値化処理を画像二値化部3
が行うことで、原稿画像データからは、周辺画素値より
も一定幅以上高い値を持つ画素および低い値を持つ画
素、すなわち線分を構成する可能性の極めて高い画素が
抽出されることになる。このような画像二値化部3によ
る二値化処理は、一般に移動平均法として知られるもの
で、背景画素の画素値が変動するような原稿画像データ
においても、固定閾値を用いた二値化処理に比べて、文
字を構成する画素を抽出する際に良好な結果が得られる
ようになる。
【0049】なお、これらの二値化処理を高速に行うた
めに、周辺画素の代表値(平均値等)を算出する際に
は、周辺画素参照範囲内の全ての画素値を利用するので
はなく、その周辺画素参照範囲において所定の位置にあ
る画素の値だけを用いるようにしてもよい。図4は、代
表値を算出する際に参照する画素を、図3(a)に示し
た場合に対して、主走査方向で1ライン毎に間引いて利
用した例を示している。
【0050】次に、連結画素成分抽出部4が行う連結画
素成分の抽出および外接矩形の作成処理(図2における
S104,S111)について詳しく説明する。図5
は、抽出された連結画素成分とその外接矩形の一具体例
を示す説明図である。
【0051】画像二値化部3が上述したような二値化処
理を行うと、連結画素成分抽出部4は、その二値化処理
の結果、各処理系統毎に画像格納部2内に格納された二
値画像データA,Bをそれぞれ参照し、連結画素成分を
抽出するとともに、各連結画素成分毎に外接矩形を作成
する。このとき、連結画素成分抽出部4では、周囲8近
傍で二値画像データの値が「1」の画素同士が隣接して
いれば、これらに同一のラベル値を付加するラベリング
処理を実施し、同一のラベル値が与えられた画素群を連
結画素成分とする。なお、ラベリング処理自体は一般的
な画像処理であるため、ここでは詳細な説明を省略する
が、本実施形態では有意なラベルは「1」以降の整数と
し、画素がラベル値を持たない場合にはラベル画像デー
タの画素値を「0」とする。また、ラベリング処理によ
って各処理系統毎に作成したラベル画像データは、それ
ぞれ画像格納部2に格納しておくものとする。
【0052】そして、このようなラベリング処理により
連結画素成分を抽出した後、連結画素成分抽出部4は、
各連結画素成分の外接矩形を仮想的に作成し、その外接
矩形の縦横辺の長さを取得する。例えば、図5に示すよ
うな連結画素成分に対して外接矩形を作成した場合、そ
の外接矩形は、幅RectWidth、高さRectHeightという矩
形となる。
【0053】次に、微小ノイズ除去部5が行う微小ノイ
ズの除去処理(図2におけるS105,S112)につ
いて詳しく説明する。
【0054】連結画素成分抽出部4が上述したような連
結画素成分の抽出および外接矩形の作成処理を行うと、
微小ノイズ除去部5は、抽出された外接矩形の大きさを
基に、各連結画素成分が微小ノイズであるか否かを判定
する。例えば図5に示した連結画素成分を例とした場合
であれば、予め定めた微小ノイズ閾値に対し、その連結
画素成分の外接矩形の幅RectWidth、および高さRectHei
ghtの両方とも小さければ、微小ノイズ除去部5は、そ
の連結画素成分を微小ノイズとみなす。
【0055】そして、連結画素成分を微小ノイズと判定
した場合には、画像格納部2に格納してあるラベル画像
データを参照し、微小ノイズと判定した連結画素成分を
構成する画素のラベル値を「0」として除外するととも
に、対応する座標の二値画像データについても、その値
を全て「0」とする。このようにして、微小ノイズ除去
部5は、各処理系統とも、連結画素成分抽出部4に抽出
された連結画素成分の中から微小ノイズを抽出して除去
する。
【0056】次に、従属成分除去部6が行う従属成分の
除去処理(図2におけるS106,S113)について
詳しく説明する。
【0057】ここで、先ず、従属成分除去部6が除去対
象とする従属成分について説明する。図6〜8は、従属
成分除去処理の一具体例を示す説明図である。
【0058】例えば、図6(a)を原稿画像データと仮
定する。この原稿画像データは、画素値「0」の背景画
素と、その背景画素中に画素値「255」を持つ画素と
から構成される矩形領域(実線で囲まれる閉領域)を有
している。そして、その原稿画像データに対し、幅およ
び高さともに3画素の矩形領域を周辺画素参照範囲と
し、その周辺画素参照範囲の平均画素値に対し50以上
高い値を持つ画素を「1」とする二値化(図2中のS1
03において、閾値THbin1=50という条件)を考え
る。図6(b)は、図6(a)で示した原稿画像データ
の全ての画素を注目画素とし、上記の周辺画素参照範囲
内で平均画素値を求めた平均画像データである。なお、
注目画素が画像端部の場合、図3(b)に示すようにし
て周辺画素を参照している。
【0059】図7(a)は、図6(a)に示す原稿画像
データの各画素値から図6(b)に示す平均画像データ
の対応する画素値の差分を求めた差分画像データを示し
ている。この差分画像データにおいて、閾値THbin1
50以上の画素値を持つ画素を「1」とし、それ以外の
画素を「0」とする二値化を行うと、図7(b)に示す
二値画像データを得ることができる。この二値画像デー
タにおいて、「1」の画素値を持つ画素から構成される
連結画素成分(2本の実線で囲まれる閉領域)に着目す
ると、その連結画素成分は、図7(a)に示す原稿画像
データ中の矩形領域の端部に相当することがわかる。こ
のように、画像二値化部3による二値化の結果、原稿画
像データ中のある領域の一部分のみが連結画素成分とし
て抽出されるような場合に、その連結画素成分を他の領
域の従属成分であると定義する。
【0060】同様に、図8(a)を原稿画像データと仮
定する。この原稿画像データも、画素値「0」の背景画
素と、その背景画素中に画素値「255」を持つ画素と
から構成される矩形領域(実線で囲まれる閉領域)を有
している。そして、上述の場合と全く同様の条件で二値
化処理する場合を考える。図8(b)は、図8(a)で
示す原稿画像データの全ての画素を注目画素とし、その
周辺画素参照範囲内で平均画素値を求めた平均画像デー
タであり、図8(c)は、図8(a)に示す原稿画像デ
ータの各画素値から図8(b)に示す平均画像データの
対応する画素値の差分を求めた差分画像データを示して
いる。そして、図8(d)は、最終的な二値化結果であ
る二値画像データを示している。この二値画像データに
おいて、「1」の画素値を持つ画素から構成される連結
画素成分(実線で囲まれる閉領域)に着目すると、図6
および図7で示した場合とは異なり、その連結画素成分
が図8(a)に示す原稿画像データ中の矩形領域と同一
であることが確認できる。このように、画像二値化部3
による二値化の結果、原稿画像データ中のある領域その
ものが連結画素成分として抽出されるような場合には、
その連結画素成分を他の領域の従属成分ではないと定義
する。
【0061】続いて、以上のような従属成分を除去する
ための処理手順について説明する。図9は従属成分の除
去処理の手順の一例を示すフローチャートであり、図1
0はその際に処理される注目連結画素成分の周囲画素の
一具体例を示す説明図である。なお、従属成分の除去処
理は、対象となる二値画像データの違いを除いて、各処
理系統とも同様に行われるものとする。
【0062】図9に示すように、従属成分の除去処理に
あたって、従属成分除去部6は、先ず、画像格納部2に
格納されているラベル画像データを取得する(S20
1)。続いて、従属成分除去部6は、注目連結画素成分
を構成するラベル画素データの画素と同じ座標を持つ、
画像格納部2に格納されている原稿画像データの画素値
を参照し、その平均画素値を算出する(S202)。さ
らに、従属成分除去部6は、その連結画素成分を取り囲
む周囲の画素について、原稿画像データ上の画素値を取
得する(S203)。
【0063】これにより、例えば図10に示すように配
置された連結画素成分と、画素値を参照すべき周囲画素
とが得られるようになる。図例では、黒画素が連結画素
成分を表し、斜線画素が当該連結画素成分の周囲の画素
を示している。ここで、周囲の画素参照幅は、1画素と
しているが、これに限らず任意の画素幅に設定してよ
い。例えば、連結画素成分の画素数に応じて設定しても
よいし、その連結画素成分の外接矩形の大きさに応じて
設定してもよい。また、原稿画像の解像度に応じて設定
することも考えられる。
【0064】注目連結画素成分の周囲画素の画素値を取
得すると、次いで、従属成分除去部6は、図9に示すよ
うに、その画素値を参照して、先のステップ(S20
2)で算出した連結画素成分の平均画素値を中心として
予め定めた範囲閾値THrange内に納まる画素の数を算
出する(S204)。そして、範囲閾値THrange内に
納まる周囲画素の画素数が全周囲画素の数に占める割合
を算出し、その割合の値と予め定めた割合閾値TH
ratioとを比較する(S205)。
【0065】この比較の結果、範囲閾値THrange内に
納まる周囲画素数の割合が、全周囲画素数に対してTH
ratio以上である場合には、従属成分除去部6は、注目
連結画素成分が従属成分であると判定し(S206)、
画像格納部2に格納されているラベル画像データから当
該連結画素成分を構成するラベル値を持つ画素を除外す
るとともに、二値画像データから対応する座標の画素値
を「0」とする(S208)。一方、比較結果がTH
ratio未満である場合には、従属成分除去部6は、注目
連結画素成分が従属画素成分ではないと判定する(S2
07)。
【0066】その後、従属成分除去部6は、このような
処理を全ての連結画素成分に対して実施したか否かを判
定し(S209)、全ての連結画素成分に対して実施し
た場合には従属成分の除去処理を終了する。これによ
り、連結画素成分抽出部4に抽出された連結画素成分の
中からは、微小ノイズに続いて従属成分も除去されるこ
とになる。
【0067】次に、表/罫線抽出部7が行う表罫線また
はフィールドセパレータの抽出処理(図2におけるS1
07,S114)について説明する。表/罫線抽出部7
は、従属成分除去部6によって従属成分とは判定されな
かった連結画素成分に対して、その連結画素成分が表罫
線であるのか、またはフィールドセパレータであるのか
を判定し、これらに該当する場合にはその連結画素成分
の外接矩形により覆われる矩形領域を表領域と判定す
る。なお、この表/罫線抽出部7における処理について
は、既に様々な手法が提案されており、それら公知の技
術を利用すればよいため、ここでその詳細な説明を省略
する。
【0068】次に、連結画素成分補完部8が行う補完処
理(図2におけるS108,S115)について詳しく
説明する。
【0069】ここで、先ず、連結画素成分補完部8が行
う補完処理の必要性について説明する。図11および図
12は、補完処理の必要性を表す具体例の説明図であ
る。
【0070】例えば、図11(a)および図12(a)
とも、画素値を「0」とする白色の背景の原稿上に、画
素値を「255」とする黒色の文字と、黒色背景部を持
つ反転文字(白抜き文字)が存在している原稿画像デー
タであると仮定する。さらに、両図において破線で示し
た矩形の大きさを、画像二値化部3が二値化処理を行う
際に用いる周辺画素参照範囲の大きさであると仮定す
る。
【0071】図11では、同図(a)から確認できるよ
うに、周辺画素参照範囲に対し黒色の背景部が十分大き
な面積を有するため、反転文字を構成する各画素を注目
画素として周辺画素参照範囲内の平均画素値を算出した
場合、その平均画素値は「255」に極めて近い値とな
ることが容易に想像できる。その結果、平均画素値と反
転文字を構成する画素が持つ画素値との間では大きな開
きが生じ、画像二値化部3が閾値THbin2を用いて二値
化処理を行うと、同図(c)に示す二値画像データが得
られることになる。これと同様に、同図(b)は、画像
二値化部3が閾値THbin1を用いて二値化処理を行った
際に得られる二値画像データの例を示している。
【0072】これに対して、図12では、同図(a)か
ら確認できるように、周辺画素参照範囲に対し黒色の背
景部が非常に小さな面積しか持たないため、反転文字を
構成する各画素を注目画素として周辺画素参照範囲内の
平均画素値を算出した場合、その平均画素値は「0」に
近い値となってしまう。その結果、平均画素値と反転文
字を構成する画素が持つ画素値との間に十分な開きがな
くなり、画像二値化部3が閾値THbin2を用いて二値化
処理を行っても、同図(c)に示すように文字を構成す
る連結画素成分が得られなくなってしまう。逆に、反転
文字の背景部である黒色矩形領域が、黒色の文字と同様
に、二値化処理によって同図(b)に示す二値画像デー
タのように抽出されてしまうことになる。
【0073】連結画素成分補完部8では、このような原
稿画像データからも文字情報を余すことなく抽出するこ
とを目的として補完処理を行う。すなわち、表/罫線抽
出部7で表罫線またはフィールドセパレータではないと
判定された連結画素成分について、その連結画素成分が
反転装飾文字の背景部である場合のように、その連結画
素成分自体は文字ではないものの文字の形状を反映して
いる連結画素成分の内部輪郭情報を利用し、文字を構成
すべき連結画素成分を補完、または生成する。
【0074】続いて、連結画素成分補完部8が行う補完
処理の手順について説明する。図13は、補完処理の手
順の一例を示すフローチャートである。なお、図中にお
いて、S301〜S304の各ステップは図2中のS1
08のステップの詳細に相当し、S401〜S404の
各ステップは図2中のS115のステップの詳細に相当
する。
【0075】図13に示すように、補完処理にあたっ
て、連結画素成分補完部8は、先ず、画像格納部2に格
納されている各処理系統の二値画像データA,Bについ
て、表/罫線抽出部7により表領域と判定された領域を
除き、各画素の値を反転させた反転二値画像データ
A′,B′をそれぞれ作成する(S301,S40
1)。そして、連結画素成分補完部8は、作成した反転
二値画像データA′,B′を参照して、連結画素成分を
抽出し、さらに各連結画素成分毎に外接矩形を作成する
(S302,S402)。連結画素成分の抽出は、既に
説明した連結画素成分抽出部4の場合と同様に、ラベリ
ング処理を実施してラベル画像データを取得することで
実現すればよい。そのため、連結画素成分補完部8は、
補完用ラベル画像データの作成およびその補完用ラベル
画像データの画像格納部2への格納を、各処理系統につ
いて行うことになる。
【0076】各連結画素成分毎に外接矩形を作成する
と、続いて、連結画素成分補完部8は、その外接矩形の
大きさにより対応する連結画素成分が文字候補である
か、それ以外であるかを判定する。そして、文字候補で
はないと判定した連結画素成分については、画像格納部
2に格納してある補完用ラベル画像データを参照し、そ
の連結画素成分を構成する画素のラベル値を「0」とす
ることで除外する(S303,S403)。例えば、連
結画素成分補完部8では、連結画素成分の外接矩形の幅
RectWidthおよび高さRectHeightの両方とも、予め定め
た最小文字候補閾値よりも大きく、かつ、その幅RectWi
dthおよび高さRectHeightの両方とも、予め定めた最大
文字候補閾値よりも小さい場合に限り、その連結画素成
分を文字候補とみなす。
【0077】そして、連結画素成分補完部8は、反転二
値画像データA′から抽出した連結画素成分のうちで、
文字候補として残した連結画素成分を構成する補完用ラ
ベル画像データの画素に着目し、画像格納部2に格納し
てある二値画像データBについて、対応する座標の画素
値を「1」とする(S304)。さらには、これと同様
に、反転二値画像データB′から抽出した連結画素成分
のうちで、文字候補として残した連結画素成分を構成す
る補完用ラベル画像データの画素に着目し、画像格納部
2に格納してある二値画像データAについて、対応する
座標の画素値を「1」とする(S404)。
【0078】図14および図15は、上述したステップ
(S304)において、文字候補となる連結画素成分の
生成を示している。図14(a)は、図12(a)の場
合と同様に、画像二値化部3による二値化処理では反転
文字を取得できない原稿画像データの例である(白画素
は「0」、黒画素は「255」の値を持つ)。また、図
14(b)は、図14(a)を原稿画像データとして画
像二値化部3による二値化処理を実施した結果、得られ
る二値画像データAを示している(白画素は「0」、黒
画素は「1」の値を持つ)。このとき、図12(b)お
よび(c)の関係からも明らかなように、画像二値化部
3による二値化処理を実施した結果、得られる二値画像
データBは、図14(c)に示すように全く連結画素成
分が存在しないことが容易に想像できる。
【0079】図15(a)は、図14(b)に示す二値
画像データAの各画素値を反転した反転二値画像データ
A′を示している。ここで、この反転二値画像データ
A′の連結画素成分を抽出し、その外接矩形を作成する
ことで、各連結画素成分の大きさを取得した後、最大の
連結画素成分と反転文字の背景部を構成していた連結画
素成分が文字候補ではないと判定されて除外されたとす
ると、図15(b)に示す連結画素成分だけが残ること
になる。したがって、上述したステップ(S304)に
おいて、図15(b)で示す連結画素成分全てを、図1
4(c)で示す二値画像データBへ割り当てることで、
画像二値化部3による二値化処理(図2中のS110)
では抽出できなかった反転文字列を構成する連結画素成
分を二値画像データに反映できることがわかる。
【0080】つまり、連結画素成分補完部8が以上のよ
うな補完処理を行うことにより、本装置では、例えば図
12(a)や図14(a)に示した原稿画像データにつ
いても、反転文字列を構成する連結画素成分を取得する
ことができるようになる。
【0081】次に、文字候補抽出部9が行う文字候補の
抽出処理(図2におけるS109,S116)について
詳しく説明する。
【0082】文字候補抽出部9は、連結画素成分補完部
8による連結画素成分の補完処理を実施した後、画像格
納部2に格納されている二値画像データA,Bからそれ
ぞれ文字候補を抽出する。この抽出処理は、連結画素成
分補完部8が文字候補以外を除去する処理(図13にお
けるS303,S403)と同様に実施することで実現
可能であるが、画像格納部2に格納されているラベル画
像データには、二値画像データA,Bに対して補完また
は新たに生成された連結画素成分が反映されていない。
そこで、文字候補抽出部9では、画像格納部2に格納さ
れている二値画像データAを参照し、再度連結画素成分
を抽出して、ラベル画像データを更新し、更新後の各連
結画素成分毎に外接矩形を作成する。そして、その外接
矩形の大きさ基づいて文字候補を抽出し、文字候補とは
判定されなかった連結画素成分を構成するラベル画像デ
ータ上の画素のラベル値を「0」とすることでその連結
画素成分を除外するとともに、二値画像データAについ
ても対応する座標の画素値を全て「0」とする。また、
文字候補抽出部9は、二値画像データBについても、全
く同様の処理を行う。
【0083】次に、背景除去部10が行う背景除去処理
(図2におけるS117)について詳しく説明する。
【0084】背景除去部10での背景除去処理にあたっ
ては、表/罫線抽出部7が抽出した表罫線/フィールド
セパレータ(図2におけるS107,S114参照)
と、文字候補抽出部9が抽出した文字候補(図2におけ
るS109,S116参照)とが統合され、最終的な出
力二値画像データが作成されるものとする。この統合処
理においては、例えば一方の処理系統で抽出された文字
候補を構成する連結画素成分と、他方の処理系統で抽出
された文字候補を構成する連結画素成分とを、それぞれ
1つの画像データに統合する際に、両者が隣接して存在
する箇所ではどちらか一方を背景をみなし除外する。
【0085】図16は、文字候補の統合例を示す説明図
である。図16(a)は、図14(a)に示す原稿画像
データに対し、一方の処理系統(図2におけるS103
〜S109)にて得られる二値画像データAを示してお
り、同図(b)は、図14(a)に示す原稿画像データ
に対し、他方の処理系統(図2におけるS110〜S1
16)にて得られる二値画像データBを示している。こ
れら二値画像データA,Bについて、単に互いの論理和
二値画像を作成すると、図16(c)に示すようにな
り、文字につぶれが発生する。背景除去部10による背
景除去処理は、この現象を回避することが目的である。
【0086】図17は背景除去処理の手順の一例を示す
フローチャートであり、図18はその背景除去処理の一
具体例を示す説明図である。背景除去部10は、背景除
去処理にあたって、図17に示すように、先ず、一方の
処理系統の結果である二値画像データAと、他方の処理
系統の結果である二値画像データBとを基に、その論理
和画像データを作成する(S501)。
【0087】例えば、図18に示すように、同図(a)
を二値画像データAと仮定し、同図(b)を二値画像デ
ータBと仮定したとき、同図(c)が両者の論理和二値
画像データに相当する。また、先に示した図16を例と
すれば、同図(a)を二値画像データAと仮定し、同図
(b)を二値画像データBと仮定したとき、同図(c)
が両者の論理和二値画像データに相当する。
【0088】論理和画像データを作成すると、続いて、
背景除去部10は、図17に示すように、その論理和二
値画像データに対して膨張処理を施し、その膨張処理後
の膨張画像データを画像格納部2に格納する(S50
2)。ここでは、図16(c)や図18(c)に示す例
のように、二値画像データAによる連結画素成分と二値
画像データBによる連結画素成分とが、接触を含めて極
めて近い距離で存在している場合に、どちらか一方を背
景とみなして除外する必要があるため、両者が近傍に存
在しているかどうかを判断するために膨張処理を利用す
る。すなわち、膨張処理の膨張画素数を距離とし、膨張
処理により融合する二値画像データAの連結画素成分と
二値画像データBの成分が存在した場合、両者は近傍の
距離に存在するものと判定できる。膨張画素数は予め定
めた画素数を用いても良いし、原稿画像データの解像度
に応じて設定するようにしても良い。また、U/I部1
1を通してユーザが本装置の利用時に指定してもよい。
図16(d)は、同図(c)に対して膨張処理を実施し
た膨張画像を示す図である。
【0089】このような膨張処理を実施して膨張画像デ
ータを画像格納部2に格納した後、背景除去部10は、
図17に示すように、その画像格納部2に格納された膨
張画像データを参照して、ラベリング処理により連結画
素成分を抽出する。そして、このとき生成される統合ラ
ベル画像データを画像格納部2に格納する(S50
3)。その後、背景除去部10は、画像格納部2に格納
された統合ラベル画像データにおいて各連結画素成分に
注目し、その連結画素成分が二値画像データAの成分と
二値画像データBの成分の両方とも包含しているか否か
を判定する(S504)。
【0090】この判定の結果、連結画素成分が二値画像
データAの成分と二値画像データBの成分の両方とも包
含していれば、背景除去部10は、その連結画素成分の
周囲画素についての画素値、すなわち画像格納部2に格
納されている原稿画像データ上で対応する座標の画素値
を取得し、その平均画素値を算出する(S505)。図
18(e)は、同図(d)で示す膨張済み連結画素成分
の周囲画素を斜線で示している。
【0091】さらに、背景除去部10は、その連結画素
成分に包含される二値画像データAおよび二値画像デー
タBのそれぞれの画素について、画像格納部2に格納さ
れている原稿画像データ上で対応する画素値を取り出
し、それぞれの平均画素値A,Bを算出する。そして、
算出した平均画素値A,Bのうちから、周囲画素の平均
画素値の算出結果により近い方を選択する。背景除去部
10は、ここで選択した平均画素値を持つ成分を背景で
あると判定し、二値画像データAまたは二値画像データ
Bにおいて対応する画素の値を「0」とすることで、背
景に属す画素を除去する(S506)。
【0092】背景除去部10は、このような背景除去処
理を、抽出した全ての連結画素成分に対して実施し(S
507)、その後、最終的な出力二値画像データとして
背景除去処理を終えた二値画像データAと二値画像デー
タBの論理輪画像を作成する。図18(f)は、上述し
た一連の処理により最終的に得られる二値画像データの
例を示している。同様に、図19は、図14(a)で示
す原稿画像データに対し、最終的に得られる出力二値画
像データの例を示している。
【0093】なお、本実施形態では、画素値を「0」と
する白色の背景の原稿上に、画素値を「255」とする
黒色の文字と、黒色背景部を持つ反転文字(白抜き文
字)が存在している原稿画像データを例に挙げて説明し
たが、本発明はこれに限定されるものではない。すなわ
ち、背景と文字を構成する画素が二値化処理により本実
施形態で説明したように分離することができれば、
「0」および「255」以外の画素値を持った原稿画像
データであっても、文字領域の抽出を良好に行えること
はいうまでもない。
【0094】
【発明の効果】以上に説明したように、本発明によれ
ば、二値画像だけではなく背景が一様でない多値画像中
からも、文字や罫線を的確に抽出することができるよう
になる。特に、例えば反転文字のように、局所的に文字
と背景の画素値が入れ替わる場合であっても、これらを
良好に抽出することが可能となる。しかも、その際に線
分幅に対応した線分基本要素の決定等を行う必要がない
ので、従来よりも簡略化した処理で抽出処理を行宇こと
ができ、結果として抽出処理の高速化やその処理負荷の
低減等を実現することが可能となる。
【図面の簡単な説明】
【図1】 本発明に係る画像処理装置の一例の概略構成
を示すブロック図である。
【図2】 本発明に係る画像処理装置全体の処理動作の
一例の概要を示すフローチャートである。
【図3】 本発明における二値化処理の考え方を示す説
明図(その1)である。
【図4】 本発明における二値化処理の考え方を示す説
明図(その2)である。
【図5】 本発明における連結画素成分とその外接矩形
の一具体例を示す説明図である。
【図6】 本発明における従属成分除去処理の一具体例
を示す説明図(その1)である。
【図7】 本発明における従属成分除去処理の一具体例
を示す説明図(その1)である。
【図8】 本発明における従属成分除去処理の一具体例
を示す説明図(その1)である。
【図9】 本発明における従属成分除去処理の手順の一
例を示すフローチャートである。
【図10】 本発明における従属成分除去処理にて処理
される注目連結画素成分の周囲画素の一具体例を示す説
明図である。
【図11】 本発明における補完処理の必要性を表す一
具体例の説明図(その1)である。
【図12】 本発明における補完処理の必要性を表す一
具体例の説明図(その2)である。
【図13】 本発明における補完処理の手順の一例を示
すフローチャートである。
【図14】 本発明において処理される画像データおよ
び連結画素成分の一具体例を示す説明図(その1)であ
る。
【図15】 本発明において処理される画像データおよ
び連結画素成分の一具体例を示す説明図(その2)であ
る。
【図16】 本発明における文字候補の統合例を示す説
明図である。
【図17】 本発明における背景除去処理の手順に一例
を示すフローチャートである。
【図18】 本発明における背景除去処理一具体例を示
す説明図である。
【図19】 本発明により最終的に得られる出力二値画
像データの一具体例を示す説明図である。
【符号の説明】
1…画像入力部、2…画像格納部、3…画像二値化部、
4…連結画素成分抽出部、5…微小ノイズ除去部、6…
従属成分除去部、7…表/罫線抽出部、8…連結画素成
分補完部、9…文字候補抽出部、10…背景除去部、1
1…U/I部、12…制御部、13…バス
フロントページの続き Fターム(参考) 5B029 AA02 CC28 CC29 DD05 EE12 EE13 EE17 5C077 NN02 PP27 PP46 PP65 PQ20 RR15 5L096 AA02 AA06 BA17 EA02 EA05 EA43 FA03 FA18 FA32 FA44 GA28 GA36 GA38 GA51

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 複数画素からなる画像データを取得する
    データ取得手段と、 前記データ取得手段が取得した画像データに対して所定
    の参照範囲内に属する画素が持つ値の代表値を算出する
    代表値算出手段と、 前記代表値算出手段が算出した代表値よりも所定値以上
    大きい値を有する第1の画素群を抽出する第1画素群抽
    出手段と、 前記代表値算出手段が算出した代表値よりも所定値以上
    小さい値を有する第2の画素群を抽出する第2画素群抽
    出手段と、 前記第1の画素群と前記第2の画素群との両方を基に前
    記データ取得手段が取得した画像データから特定の画像
    領域を抽出する画像領域抽出手段とを備えることを特徴
    とする画像処理装置。
  2. 【請求項2】 前記代表値算出手段が算出する代表値
    は、所定の参照範囲内に属する画素の持つ値の平均値で
    あることを特徴とする請求項1記載の画像処理装置。
  3. 【請求項3】 前記代表値算出手段が算出する代表値
    は、所定の参照範囲内に属する画素の持つ値の中央値で
    あることを特徴とする請求項1記載の画像処理装置。
  4. 【請求項4】 前記第1の画素群と前記第2の画素群と
    の両方またはいずれか一方は、線分を構成する画素群に
    相当することを特徴とする請求項1,2または3記載の
    画像処理装置。
  5. 【請求項5】 前記代表値算出手段が代表値を算出する
    際に用いる参照範囲は、前記データ取得手段が取得した
    画像データの解像度に応じて決定されたものであること
    を特徴とする請求項1〜4のいずれか1項に記載の画像
    処理装置。
  6. 【請求項6】 前記代表値算出手段が代表値を算出する
    際に用いる参照範囲は、抽出すべき線分の幅に応じて決
    定されたものであることを特徴とする請求項1〜4のい
    ずれか1項に記載の画像処理装置。
  7. 【請求項7】 前記第1の画素群により囲まれる画素を
    用いて前記第2の画素群を補完するとともに、前記第2
    の画素群により囲まれる画素を用いて前記第1の画素群
    を補完する画素群補完手段を備えることを特徴とする請
    求項1〜6のいずれか1項に記載の画像処理装置。
  8. 【請求項8】 前記画素群補完手段は、反転文字を構成
    する画素群を補完することを特徴とする請求項7記載の
    画像処理装置。
  9. 【請求項9】 前記データ取得手段は、複数色成分を有
    したカラー画像データを構成する中から一つの色成分デ
    ータを選択し、これを画像データとして取得するもので
    あることを特徴とする請求項1〜8のいずれか1項に記
    載の画像処理装置。
  10. 【請求項10】 前記データ取得手段は、複数色成分を
    有したカラー画像データを取得し、当該カラー画像デー
    タから新たな画像データを生成するものであることを特
    徴とする請求項1〜8のいずれか1項に記載の画像処理
    装置。
  11. 【請求項11】 前記データ取得手段は、複数色成分を
    有したカラー画像データを取得するものであり、 前記画像領域抽出手段は、各複数色成分について画像領
    域を抽出し、その抽出結果を統合した統合画像領域を最
    終的な抽出画像領域とするものであることを特徴とする
    請求項1〜8のいずれか1項に記載の画像処理装置。
  12. 【請求項12】 前記画像領域抽出手段は、前記特定の
    画像領域として文字領域を抽出することを特徴とする請
    求項1〜11のいずれか1項に記載の画像処理装置。
  13. 【請求項13】 前記画像領域抽出手段は、前記第1の
    画素群と前記第2の画素群とを統合して前記特定の画像
    領域の抽出を行うことを特徴とする請求項1〜12のい
    ずれか1項に記載の画像処理装置。
  14. 【請求項14】 前記画像領域抽出手段は、前記第1の
    画素群と前記第2の画素群とが近い距離に存在する場合
    に、いずれか一方の画素群を選択して前記特定の画像領
    域の抽出を行うことを特徴とする請求項1〜11のいず
    れか1項に記載の画像処理装置。
  15. 【請求項15】 複数画素からなる画像データを取得す
    るデータ取得手段と、 前記データ取得手段が取得した画像データの各画素を異
    なる閾値で二値化して、互いに異なる二つの二値画像デ
    ータを生成する二値化手段と、前記二値化手段が生成し
    た二つの二値画像データから連結画素成分を抽出する連
    結画素抽出手段と、 前記連結画素抽出手段が抽出した連結画素成分の中から
    従属成分と判定できるものを前記二つの二値画像データ
    上から除去する従属成分除去手段と、 前記二つの二値画像データにおいて一方の二値画像デー
    タに基づき新たに求めた連結画素成分を他方の二値画像
    データへ反映させる連結画素成分補完手段と、 前記従属成分除去手段による除去後および前記連結画素
    成分補完手段による反映後の二つの二値画像データを統
    合して出力二値画像データを生成する二値画像統合手段
    とを備えることを特徴とする画像処理装置。
  16. 【請求項16】 複数画素からなる画像データを取得す
    ると、当該画像データに対して所定の参照範囲内に属す
    る画素が持つ値の代表値を算出し、 算出した代表値よりも所定値以上大きい値を有する第1
    の画素群を前記画像データから抽出するとともに、当該
    代表値よりも所定値以上小さい値を有する第2の画素群
    を前記画像データから抽出し、 前記第1の画素群と前記第2の画素群との両方を基に前
    記画像データから特定の画像領域を抽出することを特徴
    とする画像処理方法。
  17. 【請求項17】 前記第1の画素群により囲まれる画素
    を用いて前記第2の画素群を補完するとともに、前記第
    2の画素群により囲まれる画素を用いて前記第1の画素
    群を補完することを特徴とする請求項16記載の画像処
    理方法。
  18. 【請求項18】 複数画素からなる画像データを取得す
    ると、当該画像データの各画素を異なる閾値で二値化し
    て互いに異なる二つの二値画像データを生成し、 生成した二つの二値画像データから連結画素成分を抽出
    し、 抽出した連結画素成分の中から従属成分と判定できるも
    のを前記二つの二値画像データ上から除去し、 前記二つの二値画像データにおいて一方の二値画像デー
    タに基づき新たに求めた連結画素成分を他方の二値画像
    データへ反映させ、 前記従属成分の除去後および前記連結画素成分の反映後
    の二つの二値画像データを統合して出力二値画像データ
    を生成することを特徴とする画像処理方法。
  19. 【請求項19】 コンピュータ読み取り可能な画像処理
    プログラムを記録した記憶媒体であって、 複数画素からなる画像データを取得すると、当該画像デ
    ータに対して所定の参照範囲内に属する画素が持つ値の
    代表値を算出し、 算出した代表値よりも所定値以上大きい値を有する第1
    の画素群を前記画像データから抽出するとともに、当該
    代表値よりも所定値以上小さい値を有する第2の画素群
    を前記画像データから抽出し、 前記第1の画素群と前記第2の画素群との両方を基に前
    記画像データから特定の画像領域を抽出することを特徴
    とする画像処理プログラムを記録した記憶媒体。
  20. 【請求項20】 前記第1の画素群により囲まれる画素
    を用いて前記第2の画素群を補完するとともに、前記第
    2の画素群により囲まれる画素を用いて前記第1の画素
    群を補完することを特徴とする請求項19記載の画像処
    理プログラムを記録した記憶媒体。
  21. 【請求項21】 コンピュータ読み取り可能な画像処理
    プログラムを記録した記憶媒体であって、 複数画素からなる画像データを取得すると、当該画像デ
    ータの各画素を異なる閾値で二値化して互いに異なる二
    つの二値画像データを生成し、 生成した二つの二値画像データから連結画素成分を抽出
    し、 抽出した連結画素成分の中から従属成分と判定できるも
    のを前記二つの二値画像データ上から除去し、 前記二つの二値画像データにおいて一方の二値画像デー
    タに基づき新たに求めた連結画素成分を他方の二値画像
    データへ反映させ、 前記従属成分の除去後および前記連結画素成分の反映後
    の二つの二値画像データを統合して出力二値画像データ
    を生成することを特徴とする画像処理プログラムを記録
    した記憶媒体。
JP2000373841A 2000-12-08 2000-12-08 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体 Pending JP2002175532A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000373841A JP2002175532A (ja) 2000-12-08 2000-12-08 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000373841A JP2002175532A (ja) 2000-12-08 2000-12-08 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体

Publications (1)

Publication Number Publication Date
JP2002175532A true JP2002175532A (ja) 2002-06-21

Family

ID=18843144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000373841A Pending JP2002175532A (ja) 2000-12-08 2000-12-08 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体

Country Status (1)

Country Link
JP (1) JP2002175532A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008076445A (ja) * 2006-09-19 2008-04-03 Ricoh Co Ltd 投影型表示装置、投影型表示方法、該方法を実行させるプログラム及び該プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2008310817A (ja) * 2007-06-18 2008-12-25 Sharp Corp テキストマップの中からライン構造を検出する方法および画像処理装置
JP2009140243A (ja) * 2007-12-06 2009-06-25 Seiko Epson Corp 画像処理プログラム及び画像処理装置
JP2010003325A (ja) * 2005-10-05 2010-01-07 Sony Corp 表示装置および表示方法
JP2012010188A (ja) * 2010-06-25 2012-01-12 Fuji Xerox Co Ltd 画像処理装置およびプログラム
US8704804B2 (en) 2005-10-05 2014-04-22 Japan Display West Inc. Display apparatus and display method
JP2020052894A (ja) * 2018-09-28 2020-04-02 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010003325A (ja) * 2005-10-05 2010-01-07 Sony Corp 表示装置および表示方法
US8704804B2 (en) 2005-10-05 2014-04-22 Japan Display West Inc. Display apparatus and display method
JP2008076445A (ja) * 2006-09-19 2008-04-03 Ricoh Co Ltd 投影型表示装置、投影型表示方法、該方法を実行させるプログラム及び該プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2008310817A (ja) * 2007-06-18 2008-12-25 Sharp Corp テキストマップの中からライン構造を検出する方法および画像処理装置
US8000535B2 (en) 2007-06-18 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for refining text segmentation results
JP2009140243A (ja) * 2007-12-06 2009-06-25 Seiko Epson Corp 画像処理プログラム及び画像処理装置
JP2012010188A (ja) * 2010-06-25 2012-01-12 Fuji Xerox Co Ltd 画像処理装置およびプログラム
JP2020052894A (ja) * 2018-09-28 2020-04-02 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
JP7248944B2 (ja) 2018-09-28 2023-03-30 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム

Similar Documents

Publication Publication Date Title
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP4366011B2 (ja) 文書処理装置及び方法
JP5361574B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP5298831B2 (ja) 画像処理装置及びプログラム
JP2003132358A (ja) 画像処理方法、装置およびシステム
JP2001060247A (ja) 画像処理装置および画像処理方法
KR102090973B1 (ko) 정보 처리장치, 정보 처리방법, 및 기억매체
JP2003152995A (ja) 画像処理装置
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JP4408495B2 (ja) 画像処理方法及び画像処理装置
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2002175532A (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録した記憶媒体
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
CN108804652B (zh) 封面图片的生成方法、装置、存储介质和电子装置
JP2005275854A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JPH0612540B2 (ja) 文書作成支援装置
JP2009093628A (ja) 文書データ作成装置、文書データ作成方法および文書データ作成プログラム
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US8165404B2 (en) Method and apparatus for creating document data, and computer program product
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP6148426B1 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4207256B2 (ja) カラー画像の領域分割方法およびプログラム記憶媒体
JP6613625B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
JP2001043312A (ja) 文書画像処理装置