JP4396710B2 - 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム - Google Patents

画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム Download PDF

Info

Publication number
JP4396710B2
JP4396710B2 JP2007023148A JP2007023148A JP4396710B2 JP 4396710 B2 JP4396710 B2 JP 4396710B2 JP 2007023148 A JP2007023148 A JP 2007023148A JP 2007023148 A JP2007023148 A JP 2007023148A JP 4396710 B2 JP4396710 B2 JP 4396710B2
Authority
JP
Japan
Prior art keywords
image
result
processing
binarization
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007023148A
Other languages
English (en)
Other versions
JP2008193234A (ja
Inventor
俊浩 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2007023148A priority Critical patent/JP4396710B2/ja
Publication of JP2008193234A publication Critical patent/JP2008193234A/ja
Application granted granted Critical
Publication of JP4396710B2 publication Critical patent/JP4396710B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラムに関し、特に文字画像の2値化処理を行なうことができる画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラムに関する。
近年、情報の電子化が進み、文書を紙ではなく、電子化して保存あるいは送信する需要が高まっている。これに伴ない、複写機、スキャナ、MFP(Multi Function Peripherals)などでスキャンした画像データを電子化する処理が行なわれている。
また、MFPは白黒からカラーへ移行しつつあり、カラーMFPでスキャンした原稿を、直接メールで送信する機能が一般的に普及している。
しかしながら、A4サイズのフルカラー原稿を300dpiでスキャンすると、データ容量は約25MBに達し、メール送信用としては使うに耐えない容量となる。
そのため、スキャンデータを圧縮して送信するのが一般的である。画像全体に対して同一の圧縮を行なう場合において、ファイルサイズを小さくし過ぎると文字が読めなくなり、文字が読める程度にすると十分にファイルサイズを小さくすることができないという、トレードオフが発生する。
そこで、スキャンした文書に対し、文字領域とその他の領域を判別し、判別した領域に応じて解像度や圧縮方法を変えることで、ファイルサイズの低減と文字の判読性の向上を達成することが考えられている。文字と判別された箇所は、単語や行単位で2値化し、1つの代表色を設定するものである。
また、文字と判別した領域は、文字の判読性を保つために、高解像度のまま2値化する。文字以外と判別した領域は、階調性を保つために、2値化せずに低解像度化した後、高圧縮を行なう。
文字領域を2値化したり、文字以外の領域に対して高圧縮を行なうのは、ファイルサイズを低減するためである。
画像処理に関する技術として、下記特許文献1は、OCR(文字認識処理)結果を利用して、原稿の向きを判定する方法を開示している。
特許文献2は、2値化したデータをOCR結果に置き換え、ファイルサイズを低減させる手法を開示している。
特開平8−202887号公報 特開平11−238117号公報
スキャン画像の文字領域を2値化すると、文字の輪郭の濃度の薄い部分において、がたつきが発生することがある。文字認識処理を行なうことで、がたつきのないきれいな文字の再現が可能である。しかし、認識率を100%にすることは困難であるため、全てをOCR結果に置き換えることは好ましくない。
この発明はそのような問題点を解決するためになされたものであり、スキャン画像の文字領域を適切に補正することができる画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラムを提供することを目的としている。
上記目的を達成するためこの発明のある局面に従うと、画像処理装置は、処理の対象となる画像を入力する入力手段と、画像の中の文字が存在する領域に対して、2値化処理を行なう2値化手段と、画像の中の文字が存在する領域に対して、文字認識処理を行なう文字認識手段と、文字認識処理の結果に基づいて、2値化処理された画像の補正を行なう補正手段とを備え、補正手段は、2値化処理された画像のがたつきを低減させるために、文字認識処理の結果から得られたイメージデータと、2値化手段の2値化処理結果であるイメージデータとに基づいてAND処理を実行した結果、文字認識処理の結果と2値化手段の2値化処理結果とのデータの差が大きい場合は、補正手段は、文字認識結果が間違っていると判断し、補正を行なわず、2値化処理後のイメージデータを出力し、文字認識処理の結果と、2値化手段の2値化処理結果とのデータの差が小さい場合は、AND処理後のイメージデータを出力する。
好ましくは入力手段は、スキャナと、スキャナでのスキャン画像の領域を判別し、文字部分を抽出する抽出手段とを含む。
好ましくは補正手段は、補正により文字のがたつきが軽減される場合のみ、補正を行なう。
好ましくは画像処理装置は、補正手段で補正が行なわれた後のデータをファイル化するファイル化手段をさらに備える。
好ましくはファイル化手段は、PDF、XPSその他の階層を持つファイルを作成する。
この発明の他の局面に従うと画像処理装置の制御方法は、処理の対象となる画像を入力する入力ステップと、画像の中の文字が存在する領域に対して、2値化処理を行なう2値化ステップと、画像の中の文字が存在する領域に対して、文字認識処理を行なう文字認識ステップと、文字認識処理の結果に基づいて、2値化処理された画像の補正を行なう補正ステップとを備え、補正ステップは、2値化処理された画像のがたつきを低減させるために、文字認識処理の結果から得られたイメージデータと、2値化処理の結果であるイメージデータとに基づいてAND処理を実行した結果、文字認識処理の結果と2値化処理の結果とのデータの差が大きい場合は、文字認識結果が間違っていると判断し、補正を行わず、2値化処理後のイメージデータを出力し、文字認識処理の結果と2値化処理の結果とのデータの差が小さい場合は、AND処理後のイメージデータを出力する。
この発明のさらに他の局面に従うと画像処理装置の制御プログラムは、処理の対象となる画像を入力する入力ステップと、画像の中の文字が存在する領域に対して、2値化処理を行なう2値化ステップと、画像の中の文字が存在する領域に対して、文字認識処理を行なう文字認識ステップと、文字認識処理の結果に基づいて、2値化処理された画像の補正を行なう補正ステップとをコンピュータに実行させ、補正ステップは、2値化処理された画像のがたつきを低減させるために、文字認識処理の結果から得られたイメージデータと、2値化処理の結果であるイメージデータとに基づいてAND処理を実行した結果、文字認識処理の結果と2値化処理の結果とのデータの差が大きい場合は、文字認識結果が間違っていると判断し、補正を行わず、2値化処理後のイメージデータを出力し、文字認識処理の結果と2値化処理の結果とのデータの差が小さい場合は、AND処理後のイメージデータを出力する。
これらの発明に従うと、スキャン画像の文字領域を適切に補正することができる画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラムを提供することが可能となる。
以下、本発明の実施の形態の1つにおけるMFPについて説明する。
MFPは、画像データを領域別に圧縮する。具体的には、以下の処理を行なう。
(1) スキャンしたデータに対して領域判別処理を行ない、文字部分とそれ以外の部分に分離する。
(2) 文字部分は高解像度のまま2値化し、同じ色の文字を統合し、文字の色を決定し、MMR圧縮のような可逆の圧縮を行なう。
(3) 文字以外の部分は解像度を落とし、JPEG圧縮のような非可逆の圧縮を強くかける。
この方法により、文字の判読性とデータの圧縮性を両立させたファイルを生成することができる。
またMFPは、文字部分に対して文字認識処理(OCR)を行ない、文字認識処理の結果を利用し、2値化された文字画像のがたつきを低減させる。これにより、画質向上を図ることができる。
より具体的には、以下の画像処理が行なわれる。
(1) MFP等にて原稿をスキャンする。
(2) スキャン画像(イメージデータ)に対して領域判別を行ない、文字部分を抽出する。また、文字以外の部分を分離する。
(3) 抽出した文字部分を2値化する。
(4) 2値化した文字部分に対して、文字認識(OCR)を行なう。
(5) OCR結果をイメージ化したデータと、2値化データとを比較し、がたつき部分の補正を行なう。具体的には、OCR結果をイメージ化したデータと、2値化データとのAND処理を行なうことで、がたつきを低減させる。
(6) 文字部分と背景部分に対して、それぞれ圧縮処理を行なう。
(7) 圧縮処理されたデータを、階層ファイル化する。ここでは具体的には、高圧縮PDFファイル(ファイルサイズの小さなPDFファイル)を作成するものとする。
このような処理による効果は、以下のとおりである。
(a) 文字のがたつきを低減させることができる。
(b) 文字の途切れを低減させることができる。
なお、この方法の前提になっているのは、スキャンしたイメージデータから文字部分を正確に抽出することである。文字が正確に抽出できなければ、その部分が高圧縮化されるため、文字が読めなくなってしまうからである。
また、MFPでスキャンされる原稿は、Word、Excel等の一般的なオフィス原稿から、雑誌・カタログ等の図や写真を多く含む原稿まで様々であり、且つ使われている文字の大きさや文字の色等もさまざまである為、考えられる全ての文字を正確に判別するのは難しい。そこで、OCR結果をイメージ化したデータと、2値化データとの差が大きい場合は、がたつきの補正をしないこととすると、OCRの認識間違いによる致命的なミスを防ぐことができる。
図1は、MFPの概略構成を示す図である。
図を参照してMFP100は、スキャナ101と、入力画像処理部103と、記憶部105と、CPU107と、ネットワークI/F部109と、モデム・NCU111と、操作パネル113と、出力画像処理部115と、プリントエンジン117とを備える。
スキャナ101は、原稿をスキャンするスキャン処理部を構成する。スキャナ101は、原稿を読取り、イメージデータを出力する。読取られたイメージデータは、入力画像処理部103に送られる。
入力画像処理部103は、入力画像の色変換、色補正、解像度変換、領域判別等の処理を行なう。処理されたデータは、記憶部(メモリ、ハードディスク)105にて保持される。記憶部105は、DRAM等の電子メモリと、ハードディスク等の磁気メモリ等で構成される。
CPU107は、MFPの全体的な制御、操作キーの検出、操作パネルの表示、入力されたデータの画像ファイル(JPEG、PDF、TIFF等)への変更、および電子メールの作成等を行なう。
ネットワークI/F部109は、電子メール等をネットワーク151へ送信するI/F部分であり、プロトコルの作成等を行なう。
出力画像処理部115は、スクリーン制御、スムージング処理、PWM制御等を行なう。エンジン部117は、出力画像処理部115で生成されたデータを、用紙に印字する。エンジン部117は、カラーMFPであれば、イエロー、マゼンタ、シアン、ブラックの4色のトナーを用い、画像を生成する。
モデム、NCU111は、ファクシミリ送受信の変復調、ファクシミリの通信プロトコル、電話回線153とのI/F等を行なう。
操作パネル113は操作部を構成し、操作キーと表示部にて構成される。宛先の入力、スキャン条件の選択、画像ファイルフォーマットの選択、処理の開始/中断等のユーザへのI/F処理を行なう。
図2は、MFPが実行する、原稿をスキャンし、そのイメージデータをPDFに変換する処理を示すフローチャートである。
ステップS101において、スキャナ101により原稿をスキャンするスキャン処理が行なわれる。読取られたイメージデータは、TIFF、JPG、BMP、その他の画像フォーマットにて、入力画像処理部103に送られる。
ステップS103〜S115での処理が、PDFファイルの生成処理である。
ステップS103においては、領域判別の前処理が行なわれる。またここでは、画像形式の変換、解像度変換、下地除去等の処理が行われる。
ステップS105において、領域判別処理が行なわれる。ここでは、図、写真、文字等の領域の判別を行なう。イメージデータは、文字領域、罫線領域、およびそれ以外の領域(すなわち図や写真領域等の背景領域)に分けられる。
領域判別処理では、図/写真/下地判定処理や、文字判定処理、網点除去処理、2値化処理、文字色決定処理等の処理を行なっている。
文字領域に対しては、ステップS107で領域統合処理が行なわれる。これは、近似色の文字矩形を統合する処理である。その後ステップS109で圧縮処理が行なわれる。
背景領域に対しては、ステップS111で低解像度化処理が実行され、ステップS113で圧縮処理が行なわれる。
文字領域、背景領域に対しては、それぞれ最適な解像度にて、最適な圧縮が行なわれる。たとえば、文字領域は、文字が正確に読めるように高い解像度で、MMR圧縮方式のような可逆性の圧縮を行なう。背景領域は、画質よりも、ファイルサイズが小さくなることを優先し、低い解像度で、JPEG圧縮方式のような非可逆性の圧縮を行なう。
ステップS115において、文字領域と背景領域が合成され、コンパクトPDFファイルへの変換が行なわれる。
図3は、コンパクトPDFファイルの構成イメージを示す図である。
なお、この例はPDFの仕様の具体例を示すものであり、ファイルの構成は図3の構成イメージに限る必要はない。
PDFファイルは、図の左で全体の概略構成が示されるように、ファイルヘッダ部Hと、ボディ部Bと、相互参照表Rと、トレーラTとを含んでいる。
ファイルヘッダ部Hには、PDF仕様のバージョンが記されている。ボディ部Bには、文書の内容が記されている。相互参照表Rには、ボディ部B内のオブジェクトの位置が記載されている。トレーラTには、PDFファイルのオブジェクト数や、カタログ辞書のオブジェクト番号が記載されている。
図の中央にボディ部Bの詳細が示されている。ボディ部Bは、文書情報(日付等)と、1ページ目のデータブロックと、2ページ目のデータブロックと、・・・、最終ページのデータブロックと、子ページ辞書(1ページ目)と、子ページ辞書(2ページ目)と、・・・、子ページ辞書(最終ページ)と、親ページ辞書と、カタログ辞書とを含む。
カタログ辞書は親ページ辞書の番号を、親ページ辞書はページ数や子ページ辞書の番号を、子ページ辞書は子データブロックの書式等をそれぞれ記載している。
図の右側に子ページのデータブロックの詳細が示されている。図にあるように、1ページのデータブロックは、1つの背景レイヤと、複数の文字(+罫線)レイヤとから構成される。背景レイヤには、JPEG圧縮されたデータが格納されており、文字レイヤには、2値化後にMMR圧縮されたデータが格納されている。データブロックの最後に、レイヤ情報を記載する部分がある。この部分には、各レイヤの位置や、文字の色(文字レイヤのみ)が記載される。この欄に、算出された文字色が記載される。
なおファイル化の形式としては、PDF、XPS等の階層を持つファイルやその他のファイルの形式を用いることができる。
図4は、図2の領域判別処理(S105)の内容を示すフローチャートである。
図中のステップS201〜S207は、図/写真等の背景領域を判別する処理(SA)を示し、ステップS209〜S217は、文字領域を判別する処理(SB)を示し、ステップS219〜S223は、文字の2値化処理(SC)を示す。
ステップS201において、明度算出が行なわれる。これは、入力されたフルカラー24bitのイメージ画像から、明度を計算し、8bitの明度画像を生成する処理である。最初に明度データを作成するのは、以降の領域判別処理が(判別精度と演算負荷の点を考慮して)主に明度データを対象にしているからである。
ステップS203で、スムージング処理が行なわれる。これは、生成された明度画像にスムージング処理を行なうものである。スムージングすることによりノイズを除去し、誤検出を減らす効果がある。
ステップS205において、写真ブロック検出処理が行なわれる。これは、生成されたスムージング画像を、2値化・ラベリング処理することにより、イメージ画像中に含まれる複数の写真ブロックの位置を検出する処理である。2値化・ラベリングするのは、以降の写真判定処理が、図/写真の連続した矩形毎に処理を行い、矩形毎に判定するからである。
ステップS207で、図/写真等の判定処理が行なわれる。これは、ステップS205で検出した複数の写真ブロックを、ブロック内の画像の特性に応じて、より詳細に分類するものである。たとえば、図領域であるか、写真領域であるか、下地領域であるか、表領域であるか、テキスト領域であるか、の判別が行なわれる。ここでの判定結果は、文字の判別処理にて利用される。
ステップS209およびS211では、ステップS201およびS203と同様に、それぞれ明度算出処理、およびスムージング処理が行なわれる。これらの処理は、ステップS201およびS203と同様の処理であるが、パラメータは文字判定用に最適化されている。
ステップS213でエッジ抽出処理が行なわれる。これは、スムージングされたデータに対してエッジ抽出を行なうものである。写真領域のように明度の2値化データを使わずにエッジ抽出を行なうのは、明度の高い領域の文字や反転文字を検出するためである。
ステップS215で、罫線分離処理が行なわれる。これは、文字判定精度を上げる為、文字と罫線を分離するものである。罫線分離は、画像全体に対して行なう。
ステップS217で文字判定処理が行なわれる。これは、前段(ステップS201〜S207)で判別された領域に応じて、文字の判定処理を行なうものである。
ステップS219では、網点除去が行なわれる。これは、ステップS217で文字と判定されたブロックに対し、網点除去処理を行なうものである。網点除去処理を行なうことで、文字背景の網点部分をゴミとし、2値化することを防ぐ効果がある。
ステップS221で、文字の2値化処理が行なわれる。これは、網点除去された各ブロックに対し、2値化処理を行ない、文字ブロック内で文字と背景を分離するものである。文字部分を2値化することで、ファイルサイズを小さくすることができる。
ステップS223で、文字色の決定処理が行なわれる。これはステップS221で文字と判定された部分に対応する元のRGB画像データから、文字の色を決定するものである。文字色の決定は、文字ブロック毎に行われ、1つの文字ブロックに対して1色が割り当てられる。また、複数の文字ブロックの、ブロック間の距離と、算出した文字色の差から、近傍で似た色の文字ブロックを統合し、文字ブロック数を減らす。文字ブロック数を減らすことによって、ファイルサイズを小さくする効果がある。
図5は、図4の文字の2値化処理(S221)の内容を示すフローチャートである。
ここでは画像データの座標(X,Y)=(10,20)および(110,40)を対角とする矩形に、“お祈り申し上げます”という文字が存在する場合の処理を例に説明する。
前段の文字判定処理(図4のステップS217)にて、この文字矩形の座標値(文字部分を囲う最小矩形のmin-max座標値)が生成されている。その領域に対する明度データのヒストグラムを、ステップS301にて作成する。
図6は、ヒストグラムの具体例を示す図である。
ヒストグラムは、文字の部分と背景部分にピークを持つ形状となる。文字のエッジ付近は濃度が薄くなる為、文字領域のヒストグラムはある程度の幅を持つ。
図5のステップS303において、ヒストグラムの形状から閾値を決定する。
ヒストグラムのノイズを取る為に、ヒストグラムに対して何度か積分処理を施した後、図6に示されるようにヒストグラムの谷の部分を見つけ、谷の部分を閾値とする。
次にステップS305において、決定された閾値にて2値化処理を行なう。2値化処理の結果、図5の画像D1のように、文字のエッジ付近に多少のがたつきが発生することがある。
ステップS307において、画像D1または文字矩形内のイメージデータを用いて、文字認識処理(OCR)を行なう。すなわち、文字認識処理の対象としては、明度データを用いても良いし、ステップS305で作成した2値化データを用いても良い。文字認識処理において、文字コード、フォント種類、確度(正しく認識できているかどうか)、サイズ、スペルチェック結果等を判定する。
次に、ステップS309で文字認識処理の結果をイメージに展開する。これは、キャラクタのコードなどに基づきイメージデータを作成するものである。画像D2がイメージ展開された画像の例である。画像D1は2値化画像であり、がたつきが目立つが、画像D2はキャラクタデータから作成される予め保存されていた画像であるため、がたつきのない画像である。
ステップS311において、2値化データ(D1)と、イメージに変換したOCRデータ(D2)との位置、サイズを調整する。両者のサイズが異なる場合は、イメージ変換データ(D2)を変倍し、2値化データ(D1)と同サイズに合わせる。
ステップS313で、ステップS311で調整された画像を用いて、がたつき補正を行なう。具体的には、画像D1およびD2のANDを取ることで、画像D1のがたつきを補正し、修正データD3を得る。
これにより、がたつきの少ない2値化データを取得することができる。また、単にOCRデータを用いると、OCRの認識誤りによって誤った文字列がファイル化されてしまうおそれがあるが、本実施の形態では2値化データとOCRデータとからファイル化する文字列画像を作成するため、OCRの認識誤りの影響を小さくすることができる。
なおここでは画像のがたつき補正としてAND処理を例に挙げたが、2つの画像データに基づきがたつき補正を行なう画像処理であれば、どのようなものを採用しても良い。
[変形例]
図7は、変形例における文字画像の処理を示すフローチャートである。
文字領域の2値化およびOCR処理後、ステップS401でOCRによる認識確度とスペルチェック結果を入力し、一定の基準を満たすかの判定を行なう。YESであれば、ステップS403で2値化データ(D1)と、イメージに変換したOCRデータ(D2)との位置、サイズを調整し、両画像のAND画像を作成する。
AND画像を作成する場合において、両画像を重ね合わせ、差分を抽出し、その差分が小さいかを判定する(S405)。ステップS405でYESであれば、ステップS407で差分の箇所毎に、補正前後の周辺のがたつき(直線性)を検出し、補正した方ががたつきが低減されるかを判定する。がたつきは、文字の輪郭の変化点(輪郭の向きが変わる点)の数や、輪郭の直線部分の長さを用いることで判定することができる。
ステップS407でYESである場合に、ステップS409でAND処理後の画像をファイル化する画像とする(補正を行なう)。
ステップS401で確度やスペルチェック結果が悪い場合(一定値より小さい場合)、ステップS405で差分が大きい場合(一定値より大きい場合、すなわちOCR結果が誤りであると考えられる場合)、またはステップS407で補正してもがたつきが低減しない場合は、ステップS411でAND処理前の2値化画像をファイル化する画像とする(補正を行なわない)。
[その他]
本発明はMFP、ファクシミリ装置、複写機、PCなどの画像処理装置に対して実施することができる。
また、上述の実施の形態における処理は、ソフトウエアによって行なっても、ハードウエア回路を用いて行なってもよい。
また、上述の実施の形態における処理を実行するプログラムを提供することもできるし、そのプログラムをCD−ROM、フレキシブルディスク、ハードディスク、ROM、RAM、メモリカードなどの記録媒体に記録してユーザに提供することにしてもよい。また、プログラムはインターネットなどの通信回線を介して、装置にダウンロードするようにしてもよい。
なお、上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
MFPの概略構成を示す図である。 MFPが実行する、原稿をスキャンし、そのイメージデータをPDFに変換する処理を示すフローチャートである。 コンパクトPDFファイルの構成イメージを示す図である。 図2の領域判別処理(S105)の内容を示すフローチャートである。 図4の文字の2値化処理(S221)の内容を示すフローチャートである。 ヒストグラムの具体例を示す図である。 変形例における文字画像の処理を示すフローチャートである。
符号の説明
101 スキャナ、103 入力画像処理部、105 記憶部、107 CPU、109 ネットワークI/F部、111 モデム・NCU、113 操作パネル、115 出力画像処理部、117 プリントエンジン。

Claims (7)

  1. 処理の対象となる画像を入力する入力手段と、
    前記画像の中の文字が存在する領域に対して、2値化処理を行なう2値化手段と、
    前記画像の中の文字が存在する領域に対して、文字認識処理を行なう文字認識手段と、
    前記文字認識処理の結果に基づいて、前記2値化処理された画像と前記文字認識処理の結果の補正を行なう補正手段とを備え、
    前記補正手段は、前記2値化処理された画像のがたつきを低減させるために、前記文字認識処理の結果から得られたイメージデータと、前記2値化手段の2値化処理結果であるイメージデータとに基づいてAND処理を実行した結果、前記文字認識処理の結果と前記2値化手段の2値化処理結果とのデータの差が大きい場合は、前記補正手段は、文字認識結果が間違っていると判断し、補正を行なわず、2値化処理後のイメージデータを出力し、前記文字認識処理の結果と、前記2値化手段の2値化処理結果とのデータの差が小さい場合は、AND処理後のイメージデータを出力する、画像処理装置。
  2. 前記入力手段は、スキャナと、前記スキャナでのスキャン画像の領域を判別し、文字部分を抽出する抽出手段とを含む、請求項1に記載の画像処理装置。
  3. 前記補正手段は、補正により文字のがたつきが軽減される場合のみ、補正を行なう、請求項1または2に記載の画像処理装置。
  4. 前記補正手段で補正が行なわれた後のデータをファイル化するファイル化手段をさらに備えた、請求項1から3のいずれかに記載の画像処理装置。
  5. 前記ファイル化手段は、PDF、XPSその他の階層を持つファイルを作成する、請求項4に記載の画像処理装置。
  6. 処理の対象となる画像を入力する入力ステップと、
    前記画像の中の文字が存在する領域に対して、2値化処理を行なう2値化ステップと、
    前記画像の中の文字が存在する領域に対して、文字認識処理を行なう文字認識ステップと、
    前記文字認識処理の結果に基づいて、前記2値化処理された画像の補正を行なう補正ステップとを備え、
    前記補正ステップは、前記2値化処理された画像のがたつきを低減させるために、前記文字認識処理の結果から得られたイメージデータと、前2値化処理の結果であるイメージデータとに基づいてAND処理を実行した結果、前記文字認識処理の結果と前記2値化処理の結果とのデータの差が大きい場合は、文字認識結果が間違っていると判断し、補正を行わず、2値化処理後のイメージデータを出力し、前記文字認識処理の結果と前記2値化処理の結果とのデータの差が小さい場合は、AND処理後のイメージデータを出力する、画像処理装置の制御方法。
  7. 処理の対象となる画像を入力する入力ステップと、
    前記画像の中の文字が存在する領域に対して、2値化処理を行なう2値化ステップと、
    前記画像の中の文字が存在する領域に対して、文字認識処理を行なう文字認識ステップと、
    前記文字認識処理の結果に基づいて、前記2値化処理された画像の補正を行なう補正ステップとを備え、
    前記補正ステップは、前記2値化処理された画像のがたつきを低減させるために、前記文字認識処理の結果から得られたイメージデータと、前記2値化処理の結果であるイメージデータとに基づいてAND処理を実行した結果、前記文字認識処理の結果と前記2値化処理の結果とのデータの差が大きい場合は、文字認識結果が間違っていると判断し、補正を行わず、2値化処理後のイメージデータを出力し、前記文字認識処理の結果と前記2値化処理の結果とのデータの差が小さい場合は、AND処理後のイメージデータを出力する、処理をコンピュータに実行させる、画像処理装置の制御プログラム
JP2007023148A 2007-02-01 2007-02-01 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム Expired - Fee Related JP4396710B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007023148A JP4396710B2 (ja) 2007-02-01 2007-02-01 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007023148A JP4396710B2 (ja) 2007-02-01 2007-02-01 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム

Publications (2)

Publication Number Publication Date
JP2008193234A JP2008193234A (ja) 2008-08-21
JP4396710B2 true JP4396710B2 (ja) 2010-01-13

Family

ID=39752925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007023148A Expired - Fee Related JP4396710B2 (ja) 2007-02-01 2007-02-01 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム

Country Status (1)

Country Link
JP (1) JP4396710B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5315833B2 (ja) 2008-07-28 2013-10-16 ウシオ電機株式会社 フィラメントランプ
JP6107756B2 (ja) 2014-07-11 2017-04-05 コニカミノルタ株式会社 電子文書生成システム、電子文書生成装置およびプログラム
JP6892625B2 (ja) * 2016-07-29 2021-06-23 ブラザー工業株式会社 データ処理装置、および、コンピュータプログラム

Also Published As

Publication number Publication date
JP2008193234A (ja) 2008-08-21

Similar Documents

Publication Publication Date Title
JP4631133B2 (ja) 文字認識処理のための装置、方法及び記録媒体
JP4753638B2 (ja) 文書圧縮方法、文書を圧縮するためのシステム、及び画像処理装置
JP4333708B2 (ja) 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム
JP4135752B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US8369623B2 (en) Image forming apparatus that automatically creates an index and a method thereof
JP4329764B2 (ja) 画像処理装置および罫線抽出プログラム
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
US8055079B2 (en) Image processing method, image processing apparatus, and image forming apparatus
US20060008114A1 (en) Image processing system and image processing method
JP4424309B2 (ja) 画像処理装置、文字判定プログラム、および文字判定方法
JP5972578B2 (ja) 画像処理装置、画像形成装置、プログラム、記録媒体
US20090284801A1 (en) Image processing apparatus and image processing method
JP5049920B2 (ja) 画像処理装置及び画像処理方法
JP4796486B2 (ja) 画像処理装置
JP2011008549A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP4861362B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP4396710B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP2009147562A (ja) 画像処理装置、方法、並びにプログラム
JP2000295468A (ja) 画像処理装置
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
US11288536B2 (en) Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP2010287178A (ja) 画像処理装置、画像読取装置、複合機、画像処理方法、プログラム、記録媒体
JP5517028B2 (ja) 画像処理装置
US20080043269A1 (en) Method and apparatus for processing image containing picture and characters
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090519

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090821

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090929

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091012

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121030

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees