JP5407582B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP5407582B2 JP5407582B2 JP2009147259A JP2009147259A JP5407582B2 JP 5407582 B2 JP5407582 B2 JP 5407582B2 JP 2009147259 A JP2009147259 A JP 2009147259A JP 2009147259 A JP2009147259 A JP 2009147259A JP 5407582 B2 JP5407582 B2 JP 5407582B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel block
- image
- character
- color
- pixel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
これに関連する技術として、例えば、特許文献1には、文書を、複数のバイナリ前景平面を有する複合ラスターコンテンツフォーマットで画像データに変換するシステム及び方法を提供することを課題とし、画像データを線毎に分析して、類似の色及びエッジ特徴を有する画素を特定し、1つの線上にあるこれらの画素と別の線上の画素とは、両者が類似の特徴を共有する場合にはリンクされ、これらのリンクされた画素同士は領域としてグループ化され、この領域の平均色が計算され、画素が属する領域を特定する画像マップが、領域の最終的なテーブルと共に生成されることが開示されている。
請求項1の発明は、多値画像を受け付ける画像受付手段と、前記画像受付手段によって受け付けられた多値画像から文字部分の画像である第1の画素塊を抽出する第1の画素塊抽出手段と、前記第1の画素塊抽出手段によって抽出された第1の画素塊に包含されており、該第1の画素塊に接しており、前記文字内部の画像である第2の画素塊を抽出する第2の画素塊抽出手段と、前記第1の画素塊抽出手段によって抽出された第1の画素塊の色を決定する第1の色決定手段と、前記第2の画素塊抽出手段によって抽出された第2の画素塊の色を決定する第2の色決定手段と、前記第1の画素塊抽出手段によって抽出された第1の画素塊が含まれている2値画像と前記第1の色決定手段によって決定された第1の画素塊の色と前記第2の画素塊抽出手段によって抽出された第2の画素塊が含まれている2値画像と前記第2の色決定手段によって決定された第2の画素塊の色に基づいて文書を生成する文書生成手段を具備し、前記第1の色決定手段は、前記多値画像から前記第1の画素塊が配置されている位置の画素を取り出し、該取り出した画素値の平均値を第1の画素塊の色として決定し、前記第2の色決定手段は、前記多値画像から前記第2の画素塊が配置されている位置の画素を取り出し、該取り出した画素値の平均値を第2の画素塊の色として決定することを特徴とする画像処理装置である。
なお、1つの画素領域として、1文字の画像となる場合が多い。ただし、実際に人間が文字として認識できる画素領域である必要はない。文字の一部分、文字を形成しない画素領域等もあり、何らかの画素の塊であればよい。例えば、円や線のような線画であってもよい。以下、「文字」、「線画」、「文字部分」又は「文字部画像」という場合は、特に断りがない限り「画素塊」の意で用いる。
これらは、文字や線画などを含んだ画像をJPEG等の変換符号化で圧縮すると、文字や線画部の歪が大きくなるという問題を解消するものである。
これらの画像圧縮方式では、文字や線画を抽出する。そして、抽出した文字や線画の色データを決定する。さらに、その抽出した文字や線画の領域を補間する。つまり、原画像から前述の文字や線画を除去することであり。より具体的な処理として、例えば、原画像から文字や線画を抜き取って、周囲の画素値で穴埋めすることである。
文字や線画は2値データとして、MH(Modified Huffman)、MMR(Modified Modified READ(Relative Element Address Designate))、JBIG(Joint Bi−level Image experts Group)等の2値データ圧縮方式で符号化されて、文書の一部を構成する(特許文献1)。又は、文字や線画は、ベクトルデータに変換され、文書の一部を構成する(特許文献2)。
さらに、原画像から前述の文字や線画を除去した後のバックグラウンド画像は、JPEG等の多値画像圧縮方式で符号化されて、文書の一部を構成する。
図28の例に示されるように、赤色で描画された文字(「ABC」、赤色文字2801)と、黒色で描画された文字(「DEF」、黒色文字2802)と、非文字線画部(家が描かれたの画像部分、家画像2803)からなる画像2800が存在する場合、赤色文字の「ABC」のみを抽出した2値画像2805と、黒色文字の「DEF」のみを抽出した2値画像2806と、残りの部分である多値画像2807とに分割し、それぞれの画像を独立に符号化する。また、「ABC」を抽出した2値画像2805の色が赤であり、「DEF」を抽出した2値画像2806の色が黒であるという情報を別途付与する。
残りの部分である多値画像2807を、バックグラウンド画像と呼ぶ。バックグラウンド画像では、文字部分を抜き出して、抜き出した穴を周囲の画素値で埋めることによって、JPEGなどの多値画像圧縮に適した画像とする。赤色文字2801(「ABC」)や黒色文字2802(「DEF」)を抜き出して、その文字の周囲の画素値(白色)で埋めることで、文字のようなエッジ成分のない滑らかなバックグラウンド画像を形成している。
図29に示す例での一番下の層であるバックグラウンド画像2910(複数色からなる多値画像)に対しては、JPEG等の多値画像形式で圧縮を行う。その他の層(2値画像2920〜2980)に対しては、2値画像符号化方式で圧縮する。各2値画像符号化層の画像には色情報が付与されているため、復号時にはその色を付与して復号する。そして、この描画の順序を定めてもよい。例えば、これらの層からなる文書を復号して再生する場合、バックグラウンド画像2910を最初に描画し、次に、2値画像2920、2値画像2930、2値画像2940、・・・、2値画像2980と次々に描画させるように、描画順序を定めて、この描画順序を文書に含めてもよい。
例えば、文字「O」の画像を例として挙げる。図2は、対象画像の例1を示す説明図である。文字「O」の外側は灰色とする。また、文字「O」の文字色は黒とする。さらに、文字「O」の内部の文字色は外側と同じ灰色とする。
図3は、図2の例に示した対象画像の例1から文字部分を抜き出して穴埋め処理をした画像の例を示す説明図である。文字の内側と外側が同じ色である場合は、図3に例示するように、平らな画像を実現できる。このような平らな画像はJPEG画像圧縮方式に適した画像である。
文字の内部と外部が違う色の場合である。図4は、対象画像の例2Aを示す説明図である。図4に例示するように、文字「O」の外側は灰色とする。また、文字「O」の文字色は黒とする。さらに、文字「O」の内部の色は外側とは違う濃い灰色とする。
例えば、このような画像が発生する第1のケースとして、文字の外側と内側で異なる色を使うようなデザインの場合がある。
又は、第2のケースとして、文字をスキャナで読み取るときに強調フィルタをかけて文字のエッジを強調する場合がある。つまり、文字を読みやすくするために、このような強調が行われる。図5は、対象画像の例2Bを示す説明図である。このような強調フィルタをかける場合、図5に例示するような単なる円(内部は同一色である円)を読み取ったとしても、エッジ強調効果によって、図4に例示したものと同じように周囲が濃い色になってしまう場合がある。
図6は、対象画像の例2(図4に示した対象画像の例2A又は図5に示した対象画像の例2Bをスキャナで読み取った画像であり、エッジ強調がなされた画像、以下、同じ)から文字部分を抜き出した例を示す説明図である。濃い灰色部分(文字の内部)がバックグラウンドに残存すると、黒部分(文字部分)を抽出した結果、図6の例に示す斜線部は文字部分(すなわち穴埋め処理を行う部分)であるため、周囲の画素を用いて、穴埋め処理を行うこととなる。
図7は、対象画像の例2から文字部分(例2Bではエッジ強調効果によって黒い色となった部分、以下、同じ)を抜き出して穴埋め処理をした画像の例を示す説明図である。穴埋め処理に用いる周囲の画素には、濃い灰色(文字の内部)と薄い灰色(文字の外側)の濃度の違いがあるため、穴埋め処理を行っても、結局、図3に例示したような平らな画像を実現することはできない。例えば、図6に例示した斜線部を穴埋め処理すると、図7の例のようになり、エッジが残存する。
本実施の形態は、例えば、図4に例示した黒部分が「文字部分」として抽出されているとき、文字の内部の濃い灰色部分は、バックグラウンドではなく、「文字内部」として別に抽出するものである。
つまり、例えば、特許文献1に示されるような画像圧縮方式に適用する場合には、図4の例のような文字抽出結果では、黒の部分(文字部分)だけが2値画像(第1の画素塊の2値画像)として圧縮されることになる。本実施の形態では、さらに、濃い灰色部分(文字内部)を、別の2値画像(第2の画素塊の2値画像)として抽出する。図8は、対象画像の例2内の文字部分と文字内部の例を示す説明図である。図8(a)は文字部分を抽出した2値画像の例を示しており、図8(b)は文字内部を抽出した2値画像の例を示している。
画像圧縮を行う場合、前述の第1の画素塊の2値画像と第2の画素塊の2値画像の両方を2値画像用の圧縮方式で圧縮する。そして、第1の画素塊の2値画像には黒の色情報を付加しておく、さらに、第2の画素塊の2値画像には濃い灰色という色情報を付加しておく。このようにすることで、特許文献1ではバックグラウンドとなっていた文字内部を別の2値画像として分け、その後は特許文献1と同等の圧縮を行うことができる。
図9に例示した斜線部を周囲の画素を用いて穴埋めすると、図10に示す例となる。つまり、平らな穴埋め画像を生成している。
バックグラウンド画像の穴埋め処理を行わない場合、図4に例示したものをそのままJPEGなどで非可逆圧縮することになる。図11は、対象画像の例2に対して非可逆圧縮を行い復元した例を示す説明図である。図11に例示する白い領域はエッジ領域であるため、JPEGなどの非可逆圧縮に起因するノイズが発生しやすい領域である。ところが、本実施の形態では図9に例示した斜線部の領域を上書きすることになるため、図11に例示した白い部分を隠してしまう。
画像圧縮を行う場合、前述の第1のベクトルデータと第2のベクトルデータの両方を保持する。第1のベクトルデータには黒の色情報と位置情報を付加しておく。さらに、第2のベクトルデータには濃い灰色という色情報と位置情報を付加しておく。このようにすることで、特許文献2が開示している技術に適用するようにしてもよい。
特許文献2が開示している技術に適用した場合も、特許文献1が開示している技術に適用する場合と同等に、穴埋め処理の結果、図10に例示したような、平らなバックグラウンド画像を得ることとなる。
特許文献3等が開示している手法を用いて、対象画像の各画素を文字部分と、非文字部分の2種類に分離することができる。このとき、文字部分の画素を1、非文字部分の画素を0とする2値画像を生成することができる。この2値画像において、画素値が1の場所を「文字部分」とする。
特許文献1に開示されているように、複数の色の2値画像を抽出する場合がある。この場合には、色毎に複数の2値画像が生成される。以下の議論は、個々の2値画像に対して独立に考えればよい。
なお、前述の画素値は一例であって、文字部分が0で非文字部分が1でもよいし、2値画像ではなく、多値画像であってもよい。多値画像の場合に、例えば、文字部分が128で、非文字部分が128以外等様々なバリエーションがある。いずれにせよ、前述の文字部分が1、非文字部分が0の2値画像に変換できる形式であればよい。
以下、2値画像に対し、便宜的に画素値1を黒画素、画素値0を白画素と呼ぶことにする。文字部分は黒画素、非文字部分は白画素となる。
図12は、文字部分と非文字部分の例を示す説明図である。図12の例で、文字部分が黒画素、非文字部分が白画素となっている。図13は、文字部分をラベリング処理した結果の例を示す説明図である。ラベルL1からラベルL7のラベルが付与されている。なお、図13では、単にラベルを示す線が見やすいように、文字部分を薄い灰色で表現しているが、実際には黒画素であることに注意されたい。
この黒白反転画像に対して、ラベリング処理を行う。図15は、文字部分と非文字部分の例から非文字部分をラベリング処理した結果の例を示す説明図である。ラベルL8からラベルL14のラベルが付与されている。なお、図15では、単にラベルを示す線が見やすいように、非文字部分を薄い灰色で表現しているが、実際には黒画素であることに注意されたい。
各領域の外周に接している領域の数は1に限定される。なぜなら、外周に接している領域の数が2以上であるとすると、どこかの2×2画素領域中に存在する領域の種類数(つまり、自分自信の領域と接している領域の数)が3以上となってしまう。これは、対象が2値画像であるという前提に反するものとなってしまう。したがって、前述の結論となる。
ある非文字部分の領域(ラベルP)の外周に接する文字部分の領域のラベルがQであるとする。このとき、
「ラベルPの領域は、ラベルQの文字部分の文字内部である」
と定義する。
ここで注意しなければいけないのは、ラベルQの文字部分の文字内部は、ラベルPのみに限定されない場合がある点である。例えば、図13の例におけるラベルL4の文字部分の文字内部としては、図15におけるラベルL12とラベルL13の2つがある。
例えば、図13におけるラベルL3はラベルL2の領域内に包含されているため、ラベルL2とラベルL3をあわせて一つの文字として認識すべきである。また、ラベルL5とラベルL6とラベルL7もあわせて一つの文字として認識すべきである。このような場合は、ラベルL2、ラベルL3を1文字として組み合わせてもよい。ここで、ラベルL2とラベルL3を組み合わせたラベルをラベルL23とする。また、ラベルL5、ラベルL6、ラベルL7を1文字として組み合わせてもよい。ここで、ラベルL5、ラベルL6、ラベルL7を組み合わせたラベルをラベルL567とする。
この場合、下記のように表現する。
「ラベルL10の領域は、ラベルL23の文字部分の文字内部である」
「ラベルL11の領域は、ラベルL23の文字部分の文字内部である」
「ラベルL14の領域は、ラベルL567の文字部分の文字内部である」
例えば、文字部分が2値画像の外周に接している場合がある。図16は、文字部分が2値画像の端に接している場合の例を示す説明図である。図16に示す例のような場合、左上の領域1601の外周は、2値画像の外周と、文字部分の両方に接している。このような場合も、「外周すべてに接する単一の文字部分の領域が存在しない場合」に相当するため、文字内部ではないと判断する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
文字抽出モジュール110において、文字部分が抽出される。例えば、特許文献3に開示されている手法で文字を抽出し、その抽出した文字部分の色を決定する。そして、その抽出された文字部分を含む画像を生成する。例えば、特許文献1に開示されている手法で文字をそれぞれ色の異なるN枚(Nは文字部分の色数となる)の2値画像に分離して表現する。なお、色の決定は、受け付けた多値画像から、その文字部分が配置されている位置の画素を取り出して、その画素値の平均値等を求めることによって決定する。
そして、N枚の2値画像を文字内部抽出モジュール120、バックグラウンド穴埋め処理モジュール140、出力文書生成処理モジュール150へ渡す。また、その2値画像の色の情報を出力文書生成処理モジュール150へ渡す。
文字内部抽出モジュール120では、文字抽出モジュール110によって生成されたN枚の2値画像からそれぞれ独立に文字内部を抽出する処理を行う。
例えば、図12の例に示すような2値画像を受け付けるとする。ここでは文字部分が1、それ以外が0となる2値画像であるとする。
この2値画像から文字内部を抽出する。抽出する方法として前述したように、文字部分をラベリングし、さらに、受け取った2値画像を反転して、非文字部分をラベリングする。非文字部分のうち、外周がすべて文字部分であるラベルのみを文字内部とする。
2値画像の周囲1画素を画素値0の領域にする。この画素値0の領域にするとは、2値画像の周囲に画素値0の1画素の領域を付加すること、つまり2値画像のサイズを大きくすることの他に、強制的に2値画像の周囲1画素を画素値0に変更すること(この場合、2値画像のサイズは変更なし)が含まれる。これによって、文字部分が2値画像の端に存在するということはなくなる。
ここで残った画素値0の領域が文字内部の領域である。画素値を反転する(画素値0を1にし、画素値1を0にする)と図20に示す例となる。図20は、2値画像から文字内部を抽出した例を示す説明図である。なお、ここでは文字内部は画素値1の部分である。
そして、その抽出された文字内部を含む画像を生成する。例えば、特許文献1に開示されている手法で文字内部をそれぞれ色の異なるM枚(Mは文字内部の色数となる)の2値画像に分離して表現する。なお、色の決定は、受け付けた多値画像から、その文字部分が配置されている位置の画素を取り出して、その画素値の平均値等を求めることによって決定する。なお、色の決定は、受け付けた多値画像から、その文字内部が配置されている位置の画素を取り出して、その画素値の平均値等を求めることによって決定する。
そして、M枚の2値画像、各々の2値画像の色の情報を出力文書生成処理モジュール150へ渡す。
そして、出力文書生成処理モジュール150は、生成した文書を出力する。ここで、文書を出力するとは、例えば、文書データベース等の文書記憶装置へ文書を書き込むこと、メモリーカード等の記憶媒体に記憶すること等の他に、プリンタ等の印刷装置で印刷すること、ディスプレイ等の表示装置に表示すること等も含まれる。
ステップS1702では、文字抽出モジュール110が、対象とする多値画像の受付を行う。
ステップS1704では、文字抽出モジュール110が、その多値画像内の文字部分を抽出し、その文字部分の色の決定を行う。
ステップS1706では、文字内部抽出モジュール120が、ステップS1704で抽出された文字部分に基づいて、前述したような文字内部の抽出を行う。
ステップS1708では、文字内部色決定モジュール130が、ステップS1706で抽出された文字内部の色を決定する。
ステップS1710では、バックグラウンド穴埋め処理モジュール140が、文字部分と文字内部の領域に対して、バックグラウンド画像の穴埋め処理を行う。
ステップS1712では、出力文書生成処理モジュール150が、ステップS1710で穴埋め処理されたバックグラウンド画像、文字部分の2値画像、文字内部の2値画像、それぞれの2値画像の色に基づいて、文書の生成処理を行う。
ステップS1714では、出力文書生成処理モジュール150が、ステップS1712で生成した文書の出力を行う。
なお、ステップS1710の処理は省略してもよい。また、ステップS1708とステップS1710は順序を逆にしてもよいし、並行して行うようにしてもよい。
前述の第1の実施の形態では、文字部分や文字内部を2値画像で表現したが、これらをベクトルデータで表現することもできる。
出力文書生成処理モジュール150は、第1の実施の形態と同様に文字抽出モジュール110から文字部分の2値画像(例えば、図18に例示する文字部分の2値画像)と文字内部色決定モジュール130から文字内部の2値画像(例えば、図20に例示する文字内部の2値画像)を受け取る。これらの2値画像を特許文献2に開示されているような手法を用いて、ベクトルデータに変換(ベクトル化)して、そのベクトルデータに基づいて文書を生成する。生成する文書として、例えばPDFで規定されているフォーマットにしたがって記述するようにしてもよい。そのPDFのフォーマットでは、ベクトルデータで記述された閉領域に、文字色を付与することができるため、文字抽出モジュール110や文字内部色決定モジュール130で決定された色を付与したPDFデータを作成すればよい。
なお、ベクトル化とは、文字部分、文字内部の画像を対象として、直線、円弧、ベジエ曲線、面、塗り潰し等の数式(アルゴリズム等を含む)等の描画情報によってその画像を表現するものである。また、ベクトル化には、アウトライン化を含む。アウトライン化とは、文字部分の輪郭形状をベジエのような曲線等で近似して表す方法である。このような手法の例として、特開2006−253892号公報に記載の技術を挙げることができる。
第3の実施の形態である画像処理装置は、図21に示すように、文字抽出モジュール2110、単一文字抽出モジュール2120、文字内部抽出モジュール2130、文字内部色決定モジュール2140、バックグラウンド穴埋め処理モジュール2150、出力文書生成処理モジュール2160を有している。
第1の実施の形態や第2の実施の形態では、対象画像の全体を処理したが、個々の文字毎に処理するものである。
文字抽出モジュール2110、文字内部抽出モジュール2130、文字内部色決定モジュール2140、バックグラウンド穴埋め処理モジュール2150、出力文書生成処理モジュール2160は、それぞれ第1の実施の形態の文字抽出モジュール110、文字内部抽出モジュール120、文字内部色決定モジュール130、バックグラウンド穴埋め処理モジュール140、出力文書生成処理モジュール150に該当し、これらの第1の実施の形態と同等のものはその説明を省略し、異なるところを主に説明する。
単一文字抽出モジュール2120は、文字抽出モジュール2110、文字内部抽出モジュール2130と接続されている。単一文字抽出モジュール2120は、文字抽出モジュール2110によって生成された2値画像内の文字部分を抽出して、その文字部分毎に2値画像を生成する。例えば、特許文献2に開示されているような手法を用いて、文字抽出モジュール2110によって生成された2値画像から個々の文字を1文字ずつ抽出する。より具体的には、文字部分の連結画素塊を一つの文字として抽出する。又は、外接矩形が重なっている連結画素塊は一つの文字として抽出するようにしてもよい。その抽出した文字部分からなる2値画像を文字内部抽出モジュール2130へ渡す。なお、その2値画像の元の多値画像における位置情報も文字内部抽出モジュール2130へ渡す。
このようにして、図23に例示するように、一つの文字部分を抽出した2値画像を生成する。なお、抽出した文字の数だけ2値画像を生成することになる。
バックグラウンド穴埋め処理モジュール2150は、文字抽出モジュール2110、文字内部抽出モジュール2130、出力文書生成処理モジュール2160と接続されている。バックグラウンド穴埋め処理モジュール2150は、文字部分と文字内部の2値画像、文字内部の位置情報に基づいて、多値画像から文字と文字内部を除去した場合の穴埋め処理を行う。
出力文書生成処理モジュール2160は、文字抽出モジュール2110、文字内部色決定モジュール2140、バックグラウンド穴埋め処理モジュール2150と接続されている。出力文書生成処理モジュール2160は、文字内部色決定モジュール2140が生成した文字内部毎に色の異なる2値画像を受け取り、同じ色の2値画像を合成して、M枚の2値画像を生成する。又は、文字内部をその位置情報を用いてベクトルデータに変換して文書の生成処理を行えばよい。
ステップS2202では、文字抽出モジュール2110が、対象とする多値画像の受付を行う。
ステップS2204では、文字抽出モジュール2110が、その多値画像内の文字部分を抽出し、その文字部分の色の決定を行う。
ステップS2206では、単一文字抽出モジュール2120が、ステップS2204で抽出された文字部分からさらに単一文字の抽出を行う。
ステップS2208では、文字内部抽出モジュール2130が、ステップS2206で抽出された文字毎に文字内部の抽出を行う。
ステップS2210では、文字内部色決定モジュール2140が、ステップS2208で抽出された文字内部の色を決定する。
ステップS2212では、バックグラウンド穴埋め処理モジュール2150が、文字部分と文字内部の領域に対して、バックグラウンド画像の穴埋め処理を行う。
ステップS2214では、出力文書生成処理モジュール2160が、文字毎の文字内部の2値画像を色毎に合成して、ステップS2212で穴埋め処理されたバックグラウンド画像、文字部分の2値画像、合成した文字内部の2値画像、それぞれの2値画像の色に基づいて、文書の生成処理を行う。
ステップS2216では、出力文書生成処理モジュール2160が、ステップS2214で生成した文書の出力を行う。
なお、ステップS2212の処理は省略してもよい。また、ステップS2210とステップS2212は順序を逆にしてもよいし、並行して行うようにしてもよい。
PDFなどの文書の再生において画像を張り合わせる場合、出力ビューアの精度によっては、隣り合っているはずの画素の間に隙間ができてしまう場合がある。また、ベクトル化を行った場合には、そのベクトル化の際の桁落ち等によって文字部分や文字内部の形状が変化してしまうことが起こるため、文字部分と文字内部の間に隙間ができてしまう可能性がある。そこで、第4の実施の形態では、その隙間をなくすために、文字内部を膨張させるようにしたものである。
そして、出力文書生成処理モジュール150(第3の実施の形態の場合は出力文書生成処理モジュール2160)において、文書を再生するときに、文字内部の2値画像(又はベクトルデータ)を描画し、その上に文字部分の2値画像(又はベクトルデータ)を描画することになるような文書の生成を行えばよい。
そして、その場合は、出力文書生成処理モジュール150(第3の実施の形態の場合は出力文書生成処理モジュール2160)において、文書を再生するときに、文字部分の2値画像(又はベクトルデータ)を先に描画し、その上に文字内部の2値画像(又はベクトルデータ)を描画することになるような文書の生成を行えばよい。
つまり、文書を再生するときの描画順序として、膨張された画素塊を先として、膨張されていない画素塊を後にするものであり、結果として膨張された画素塊の上に膨張されていない画素塊を上書きすることとなる。
第5の実施の形態である画像処理装置は、図25に示すように、文字抽出モジュール2510、単一文字抽出モジュール2520、文字内部抽出モジュール2530、文字外部色決定モジュール2540、文字内部色決定モジュール2550、文字内部除去処理モジュール2560、バックグラウンド穴埋め処理モジュール2570、出力文書生成処理モジュール2580を有している。
第3の実施の形態においては、すべての文字内部を文書内に記述している。しかし、必ずしもすべての文字内部を最終的な文書内に記述する必要はない。文字の内部と外部の色が同じ場合は、記述の必要のない文字内部となる。例えば、図2の例に示されたような場合である。
そこで、文字外部の色と、文字内部の色を比較して、その色差が予め定めておいた閾値よりも大であるときのみ文字内部を最終的な出力文書に記述することにする。処理としては、文字外部色と文字内部色の色差が閾値より小である場合、文字内部を除去するものである。
文字抽出モジュール2510は、単一文字抽出モジュール2520、バックグラウンド穴埋め処理モジュール2570、出力文書生成処理モジュール2580と接続されている。
単一文字抽出モジュール2520は、文字抽出モジュール2510、文字内部抽出モジュール2530と接続されている。
文字内部抽出モジュール2530は、単一文字抽出モジュール2520、文字外部色決定モジュール2540、文字内部色決定モジュール2550、文字内部除去処理モジュール2560と接続されている。
文字の外部色を決定する方式としては、種々あり、例えば下記の(1)、(2)のうちのいずれかを利用するようにしてもよい。
(1)単一文字抽出モジュール2520による単一の文字部分を抽出するときに、その文字部分をすべて含む矩形を抽出する。文字外部色決定モジュール2540は、文字部分と文字内部を除いた部分の矩形内の領域にあたる多値画像内の画素の色の平均値を、文字部分の外部色とする。
(2)文字外部色決定モジュール2540は、文字部分を膨張させる。膨張させてできた2値画像から、文字部と文字内部を除去する。除去した結果の領域にあたる多値画像内の画素の色の平均値を、文字部分の外部色とする。
文字内部除去処理モジュール2560は、文字内部抽出モジュール2530、文字外部色決定モジュール2540、文字内部色決定モジュール2550、バックグラウンド穴埋め処理モジュール2570、出力文書生成処理モジュール2580と接続されている。文字内部除去処理モジュール2560は、文字内部色決定モジュール2550によって決定された文字内部の色と文字外部色決定モジュール2540によって決定された文字部分の外側の色との比較結果に基づいて、その文字内部を除去する。「文字内部を除去する」ことによって、出力文書生成処理モジュール2580では、その文字内部は用いずに文書を生成することとなり、バックグラウンド穴埋め処理モジュール2570では、その文字内部を補間することを要しないこととなる。
例えば、予め定められた閾値と、文字内部の色と文字外部の色との色差を比較する。色差としては、RGBデータのユークリッド距離、Lab色空間のユークリッド距離、YCbCr色空間のユークリッド距離、その他の計算等、様々なものを利用することができる。
色差が閾値よりも大であるときは、文字内部を第3の実施の形態と同様に、バックグラウンド穴埋め処理モジュール2570、出力文書生成処理モジュール2580で利用する。
色差が閾値よりも小であるときは、文字内部を除去する。すなわち、該当する文字内部はバックグラウンド穴埋め処理モジュール2570、出力文書生成処理モジュール2580では利用しない。
色差が閾値に等しいときは、文字内部を除去するか否かは適切に定めておけばよい。
ここで、文字内部のラベル(連結領域)が複数ある場合は、各ラベル領域毎に文字内部色を決定し、さらに、そのラベル領域を除去するか否かは、各ラベル領域毎に独立に定めればよい。
出力文書生成処理モジュール2580は、文字抽出モジュール2510、文字内部除去処理モジュール2560、バックグラウンド穴埋め処理モジュール2570と接続されている。文字内部除去処理モジュール2560の結果に基づいて、前述した文書の生成処理を行う。つまり、文字内部が除去されなかったところは、その文字内部を含めて文書を生成する。結果として、文字内部が除去されたところは、その文字内部は含まないように文書が生成される。
ステップS2602では、文字抽出モジュール2510が、対象とする多値画像の受付を行う。
ステップS2604では、文字抽出モジュール2510が、その多値画像内の文字部分を抽出し、その文字部分の色の決定を行う。
ステップS2606では、単一文字抽出モジュール2520が、ステップS2604で抽出された文字部分からさらに単一文字の抽出を行う。
ステップS2608では、文字内部抽出モジュール2530が、ステップS2606で抽出された文字毎に文字内部の抽出を行う。
ステップS2610では、文字内部色決定モジュール2550が、ステップS2608で抽出された文字内部の色を決定する。
ステップS2612では、文字外部色決定モジュール2540が、各文字毎の文字外部色の決定を行う。
ステップS2614では、文字内部除去処理モジュール2560が、ステップS2610で決定された文字内部の色とステップS2612で決定された文字外部の色とを比較して、文字内部の除去処理を行う。
ステップS2616では、バックグラウンド穴埋め処理モジュール2570が、文字部分と除去されなかった文字内部の領域に対して、バックグラウンドの穴埋め処理を行う。
ステップS2618では、出力文書生成処理モジュール2580が、文字毎の除去されなかった文字内部の2値画像を色毎に合成して、ステップS2616で穴埋め処理されたバックグラウンド画像、文字部分の2値画像、合成した文字内部の2値画像、それぞれの2値画像の色に基づいて、文書の生成処理を行う。
ステップS2620では、出力文書生成処理モジュール2580が、ステップS2618で生成した文書の出力を行う。
なお、ステップS2616の処理は省略してもよい。また、ステップS2610とステップS2612は順序を逆にしてもよいし、並行して行うようにしてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…文字内部抽出モジュール
130…文字内部色決定モジュール
140…バックグラウンド穴埋め処理モジュール
150…出力文書生成処理モジュール
1601…領域
2110…文字抽出モジュール
2120…単一文字抽出モジュール
2130…文字内部抽出モジュール
2140…文字内部色決定モジュール
2150…バックグラウンド穴埋め処理モジュール
2160…出力文書生成処理モジュール
2510…文字抽出モジュール
2520…単一文字抽出モジュール
2530…文字内部抽出モジュール
2540…文字外部色決定モジュール
2550…文字内部色決定モジュール
2560…文字内部除去処理モジュール
2570…バックグラウンド穴埋め処理モジュール
2580…出力文書生成処理モジュール
Claims (10)
- 多値画像を受け付ける画像受付手段と、
前記画像受付手段によって受け付けられた多値画像から文字部分の画像である第1の画素塊を抽出する第1の画素塊抽出手段と、
前記第1の画素塊抽出手段によって抽出された第1の画素塊に包含されており、該第1の画素塊に接しており、前記文字内部の画像である第2の画素塊を抽出する第2の画素塊抽出手段と、
前記第1の画素塊抽出手段によって抽出された第1の画素塊の色を決定する第1の色決定手段と、
前記第2の画素塊抽出手段によって抽出された第2の画素塊の色を決定する第2の色決定手段と、
前記第1の画素塊抽出手段によって抽出された第1の画素塊が含まれている2値画像と前記第1の色決定手段によって決定された第1の画素塊の色と前記第2の画素塊抽出手段によって抽出された第2の画素塊が含まれている2値画像と前記第2の色決定手段によって決定された第2の画素塊の色に基づいて文書を生成する文書生成手段
を具備し、
前記第1の色決定手段は、前記多値画像から前記第1の画素塊が配置されている位置の画素を取り出し、該取り出した画素値の平均値を第1の画素塊の色として決定し、
前記第2の色決定手段は、前記多値画像から前記第2の画素塊が配置されている位置の画素を取り出し、該取り出した画素値の平均値を第2の画素塊の色として決定する
ことを特徴とする画像処理装置。 - 前記第1の画素塊抽出手段によって抽出された第1の画素塊を含む画像を生成する画像生成手段
をさらに具備し、
前記第2の画素塊抽出手段は、前記画像生成手段によって生成された画像から前記第2の画素塊を抽出し、該第2の画素塊を含む画像を生成し、
前記文書生成手段は、前記画像生成手段によって生成された画像と前記第1の色決定手段によって決定された第1の画素塊の色と前記第2の画素塊抽出手段によって生成された画像と前記第2の色決定手段によって決定された第2の画素塊の色に基づいて文書を生成する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記画像受付手段によって受け付けられた多値画像から前記第1の画素塊と前記第2の画素塊の領域を該多値画像内の画素に基づいて補間する領域補間手段
をさらに具備し、
前記文書生成手段は、さらに領域補間手段によって補間された多値画像を用いて文書を生成する
ことを特徴とする請求項1又は2に記載の画像処理装置。 - 前記画像生成手段が生成する画像は2値画像であり、
前記文書生成手段は、前記画像生成手段によって生成された2値画像と、前記第2の画素塊抽出手段によって抽出された第2の画素塊を含む2値画像を含めた文書を生成する
ことを特徴とする請求項2又は3に記載の画像処理装置。 - 前記文書生成手段は、前記画像生成手段によって生成された画像と前記第2の画素塊抽出手段によって抽出された第2の画素塊を含む画像をベクトルデータに変換して、該ベクトルデータに基づいて文書を生成する
ことを特徴とする請求項2又は3に記載の画像処理装置。 - 前記画像生成手段によって生成された画像内の前記第1の画素塊を抽出して、該第1の画素塊毎に画像を生成する画素塊画像生成手段
をさらに具備し、
前記第2の画素塊抽出手段は、前記画素塊画像生成手段によって生成された第1の画素塊毎の画像から前記第2の画素塊を抽出する
ことを特徴とする請求項2から5のいずれか一項に記載の画像処理装置。 - 前記画素塊画像生成手段によって生成された第1の画素塊毎の画像と前記第2の画素塊抽出手段によって抽出された第2の画素塊に基づいて、該第1の画素塊の外側の色を決定する第3の色決定手段と、
前記第2の色決定手段によって決定された第2の画素塊の色と前記第3の色決定手段によって決定された第1の画素塊の外側の色との比較結果に基づいて、該第2の画素塊を除去する第2の画素塊除去手段
をさらに具備することを特徴とする請求項6に記載の画像処理装置。 - 前記第1の画素塊抽出手段によって抽出された第1の画素塊又は前記第2の画素塊抽出手段によって抽出された第2の画素塊を膨張する膨張手段
をさらに具備し、
前記文書生成手段は、前記膨張手段によって膨張された第1の画素塊又は第2の画素塊に基づいて、文書を生成する
ことを特徴とする請求項1から7のいずれか一項に記載の画像処理装置。 - 前記文書生成手段は、前記膨張手段が第1の画素塊又は第2の画素塊のうちいずれか一方の画素塊を膨張させた場合は、文書の再生のときに該膨張させた画像塊を他方の画素塊よりも先に描画するように文書を生成する
ことを特徴とする請求項8に記載の画像処理装置。 - コンピュータを、
多値画像を受け付ける画像受付手段と、
前記画像受付手段によって受け付けられた多値画像から文字部分の画像である第1の画素塊を抽出する第1の画素塊抽出手段と、
前記第1の画素塊抽出手段によって抽出された第1の画素塊に包含されており、該第1の画素塊に接しており、前記文字内部の画像である第2の画素塊を抽出する第2の画素塊抽出手段と、
前記第1の画素塊抽出手段によって抽出された第1の画素塊の色を決定する第1の色決定手段と、
前記第2の画素塊抽出手段によって抽出された第2の画素塊の色を決定する第2の色決定手段と、
前記第1の画素塊抽出手段によって抽出された第1の画素塊が含まれている2値画像と前記第1の色決定手段によって決定された第1の画素塊の色と前記第2の画素塊抽出手段によって抽出された第2の画素塊が含まれている2値画像と前記第2の色決定手段によって決定された第2の画素塊の色に基づいて文書を生成する文書生成手段
として機能させ、
前記第1の色決定手段は、前記多値画像から前記第1の画素塊が配置されている位置の画素を取り出し、該取り出した画素値の平均値を第1の画素塊の色として決定し、
前記第2の色決定手段は、前記多値画像から前記第2の画素塊が配置されている位置の画素を取り出し、該取り出した画素値の平均値を第2の画素塊の色として決定する
ことを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009147259A JP5407582B2 (ja) | 2009-06-22 | 2009-06-22 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009147259A JP5407582B2 (ja) | 2009-06-22 | 2009-06-22 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011004302A JP2011004302A (ja) | 2011-01-06 |
JP5407582B2 true JP5407582B2 (ja) | 2014-02-05 |
Family
ID=43561849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009147259A Active JP5407582B2 (ja) | 2009-06-22 | 2009-06-22 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5407582B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5697649B2 (ja) | 2012-11-27 | 2015-04-08 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07220028A (ja) * | 1994-02-02 | 1995-08-18 | Fuji Xerox Co Ltd | 文字認識装置 |
JP4504096B2 (ja) * | 2004-05-26 | 2010-07-14 | 株式会社リコー | 画像処理装置、プログラム、及び記憶媒体 |
JP4089905B2 (ja) * | 2004-06-22 | 2008-05-28 | 株式会社リコー | 画像処理装置、画像処理方法、プログラム及び情報記録媒体 |
JP4345609B2 (ja) * | 2004-08-12 | 2009-10-14 | 富士ゼロックス株式会社 | 画像処理装置およびプログラム |
JP4411244B2 (ja) * | 2005-04-22 | 2010-02-10 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム |
JP2007005907A (ja) * | 2005-06-21 | 2007-01-11 | Ricoh Co Ltd | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 |
JP4936524B2 (ja) * | 2006-12-28 | 2012-05-23 | キヤノン株式会社 | 画像処理システムおよび画像処理方法 |
JP4766030B2 (ja) * | 2007-10-11 | 2011-09-07 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
-
2009
- 2009-06-22 JP JP2009147259A patent/JP5407582B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011004302A (ja) | 2011-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4600491B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4123299B1 (ja) | 画像処理装置及び画像処理プログラム | |
JP5047051B2 (ja) | 画像処理装置及び画像符号化方法 | |
JP4766030B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5206503B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5304529B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5407582B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5206468B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2005204206A (ja) | 画像処理装置、画像処理用プログラム及び記憶媒体 | |
JP4894664B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP4720633B2 (ja) | 画像処理システムおよび画像処理プログラム | |
JP4872780B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP4383187B2 (ja) | 画像処理装置、画像処理用プログラム及び記憶媒体 | |
JP5200993B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4831089B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6481301B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4237642B2 (ja) | 画像処理装置、画像処理用プログラム及び記憶媒体 | |
JP4770863B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4650958B2 (ja) | 画像処理装置、方法およびプログラム | |
JP2006222940A (ja) | 画像処理装置 | |
JP4992758B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6701845B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2005303506A (ja) | 画像処理装置、画像処理方法、画像処理用プログラム及び記憶媒体 | |
JP2008199249A (ja) | 画像処理装置、画像符号化装置、画像処理プログラム及び画像符号化プログラム | |
JP2011166765A (ja) | 画像形成装置及び画像形成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120518 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130201 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130408 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131008 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131021 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5407582 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |