JP2005348279A - 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 - Google Patents

画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2005348279A
JP2005348279A JP2004168016A JP2004168016A JP2005348279A JP 2005348279 A JP2005348279 A JP 2005348279A JP 2004168016 A JP2004168016 A JP 2004168016A JP 2004168016 A JP2004168016 A JP 2004168016A JP 2005348279 A JP2005348279 A JP 2005348279A
Authority
JP
Japan
Prior art keywords
image
ruled line
specific attribute
extracting
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004168016A
Other languages
English (en)
Inventor
Fumihiro Hasegawa
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2004168016A priority Critical patent/JP2005348279A/ja
Priority to EP20050250226 priority patent/EP1555804A3/en
Priority to CNB2005100543009A priority patent/CN100356768C/zh
Priority to US11/037,172 priority patent/US20050180645A1/en
Publication of JP2005348279A publication Critical patent/JP2005348279A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)

Abstract

【課題】
視認性を低下させずにファイルサイズの大幅な圧縮が可能になる。
【課題を解決するための手段】
原画像から特定属性を持つ部分を抽出する特定属性部抽出手段111と、前記原画像中に含まれる罫線を抽出する罫線抽出手段112と、特定属性部抽出手段により抽出した前記特定属性部を原画像から消去した特定属性部消去画像を生成する特定属性部消去画像生成手段113と、前記特定属性部抽出手段により抽出した前記特定属性部の色を決定する特定属性部色決定手段114と、前記特性属性部の画像を前記特定属性部色決定手段により決定した色により彩色した特定属性部彩色画像を少なくとも1つ生成する特定属性部彩色画像生成手段115と、を備えることを特徴とする。
【選択図】 図1

Description

本発明は、多値の文書画像を、文字の視認性を犠牲にせずにデータサイズを大幅に小さくすることができる画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体に関する。
従来、多値画像を二値化し、当該二値画像を解析して文字を抽出し、多値画像の文字部を周辺色で置換する技術が知られている。たとえば、特開2003−046746(文献1)に記載の技術では、原画像を二値化してレイアウトの解析を行い、文字領域情報および二値化した画像データに基づき、原画像における文字部をその周囲色で塗りつぶしている。この技術では、罫線を抽出し、多値画像の罫線部を周辺色で塗りつぶし、文字は再現せずに、消去したビットマップの罫線に代えて、ベクトル化した罫線を書き込む。この技術によれば、罫線をベクトル図形で表現することで、原画像の表等のフォーマットを再現することができる。
また、特開2002−135592に記載の技術では、原画像から線分を抽出し、線分のみの画像と、線分を消去した画像をを生成し、線分消去した画像の、線分が存在していた部分を特定色(黒、または線分画像を減色処理した色)で置換することで、視認性を向上させている。しかし、この技術では、特定色で原画像を描き直しているに過ぎないため、ファイルサイズを縮小することはできない。
さらに、特開平11−308463に記載の技術では、多値画像を階調画像と非階調画像(文字画像)とに分離し、階調画像中の非階調画像に対応する部分を周辺色で置換している。この技術では、画像を、周波数成分により等色領域であることを判断して文字と非文字に分離しており、罫線が細い場合には、周囲との混色が発生しやすく等色にはなりにくく精度が高まらない。
加えて、特開2000−181990に記載の技術では、ランとその連結矩形に基づいて罫線を抽出し、画像から罫線を消去する。この技術では、罫線を抽出はできるが、二値画像のみが対象で、また、その後の処理は異なる。
特開2003−046746 特開2002−135592 特開平11−308463 特開2000−181990
本発明の目的は、多値の文書画像を、文字の視認性を犠牲にせずにデータサイズを大幅に小さくすることができる画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体を提供することにある。
本発明の画像処理装置は、原画像から特定属性を持つ部分を抽出する特定属性部抽出手段と、前記原画像中に含まれる罫線を抽出する罫線抽出手段と、前記特定属性部抽出手段により抽出した前記特定属性部を原画像から消去した特定属性部消去画像を生成する特定属性部消去画像生成手段と、前記特定属性部抽出手段により抽出した前記特定属性部の色を決定する特定属性部色決定手段と、前記特性属性部の画像を前記特定属性部色決定手段により決定した色により彩色した特定属性部彩色画像を少なくとも1つ生成する特定属性部彩色画像生成手段とを備えることを特徴とする。
本発明の画像処理装置では、前記特定属性部抽出手段を、前記原画像を二値化した二値化原画像を生成する二値化原画像生成手段と、前記二値化原画像生成手段が生成した二値化原画像中の前記特定属性部を認識する特定属性部認識手段とを備えるように構成でき、前記罫線抽出手段は、前記二値化原画像生成手段により生成した二値化原画像から罫線を抽出するようにできる。
本発明の画像処理装置では、前記特定属性部抽出手段が、さらに、前記罫線抽出手段により抽出した前記罫線を、前記二値化原画像から消去して罫線消去二値化画像を生成する罫線消去二値化画像生成手段と、前記罫線消去二値化画像生成手段により生成した罫線消去二値化画像から連結成分を抽出する連結成分抽出手段と、前記連結成分抽出手段により抽出した連結成分のサイズを分類する連結成分サイズ分類手段とを備えるように構成できる。
本発明の画像処理装置では、前記連結成分サイズ分類手段の処理後の画像に対して、罫線消去二値化画像生成手段により消去した前記罫線を再び描き入れる罫線再描画手段を備えることができる。
本発明の画像処理装置では、前記罫線抽出手段が、同色とみなせる長いランを抽出する同色長ラン抽出手段と、前記同色長ラン抽出手段により抽出した前記長いランを構成要素とする連結成分を生成する長ラン連結成分生成手段とを備えるように構成できる。
本発明の画像処理装置では、前記罫線抽出手段が、同色とみなせる短いランを抽出する同色短ラン抽出手段と、前記同色短ラン抽出手段により抽出した前記短いランを構成要素とする連結成分を生成する短ラン連結成分生成手段と備えるように構成できる。
本発明の画像処理装置では、前記罫線抽出手段が、同色とみなせる長いランを抽出する同色長ラン抽出手段と、前記同色長ラン抽出手段により抽出した前記長いランを構成要素とする連結成分を生成する長ラン連結成分生成手段と、同色とみなせる短いランを抽出する同色短ラン抽出手段と、前記同色短ラン抽出手段により抽出した前記短いランを構成要素とする連結成分を生成する短ラン連結成分生成手段とを備えるように構成できる。
本発明の画像処理方法は、原画像から特定属性を持つ部分を抽出する特定属性部抽出ステップと、前記原画像中に含まれる罫線を抽出する罫線抽出ステップと、前記特定属性部抽出ステップにおいて抽出した前記特定属性部を原画像から消去した特定属性部消去画像を生成する特定属性部消去画像生成ステップと、前記特定属性部抽出ステップにおいて抽出した前記特定属性部の色を決定する特定属性部色決定ステップと、前記特性属性部の画像を前記特定属性部色決定ステップにおいて決定した色により彩色した画像を少なくとも1つ生成する特定属性部彩色画像生成ステップとを備えることを特徴とする。
本発明の画像処理方法では、前記特定属性部抽出ステップを、前記原画像を二値化した二値化原画像を生成する二値化原画像生成ステップを備えるように構成でき、前記罫線抽出ステップは、前記二値化原画像生成ステップにおいて生成した二値化原画像から罫線を抽出するようにできる。
本発明の画像処理方法では、前記特定属性部抽出ステップが、前記罫線抽出ステップにおいて抽出した前記罫線を、前記二値化原画像から消去して罫線消去二値化画像を生成する罫線消去二値化画像生成ステップと、前記罫線消去二値化画像生成ステップにおいて生成した罫線消去二値化画像から連結成分を抽出する連結成分抽出ステップが、前記連結成分抽出ステップにおいて抽出した連結成分のサイズを分類する連結成分サイズ分類ステップとを備えるようにできる。
本発明の画像処理方法では、前記連結成分サイズ分類ステップの処理後の画像に対して、罫線消去二値化画像生成ステップにおいて消去した前記罫線を再び描き入れる罫線再描画ステップを備えるようにできる。
本発明の画像処理方法では、前記罫線抽出ステップが、同色とみなせる長いランを抽出する同色長ラン抽出ステップと、前記同色長ラン抽出ステップにおいて抽出した前記長いランを構成要素とする連結成分を生成する長ラン連結成分生成ステップとを備えるようにできる。
本発明の画像処理方法では、前記罫線抽出ステップが、同色とみなせる短いランを抽出する同色短ラン抽出ステップと、前記同色短ラン抽出ステップにおいて抽出した前記短いランを構成要素とする連結成分を生成する短ラン連結成分生成ステップとを備えるようにできる。
本発明の画像処理方法では、前記罫線抽出ステップが、同色とみなせる長いランを抽出する同色長ラン抽出ステップと、前記同色長ラン抽出ステップにおいて抽出した前記長いランを構成要素とする連結成分を生成する長ラン連結成分生成ステップと、同色とみなせる短いランを抽出する同色短ラン抽出ステップと、前記同色短ラン抽出ステップにおいて抽出した前記短いランを構成要素とする連結成分を生成する短ラン連結成分生成ステップとを備えるようにできる。
本発明の画像処理プログラムは、上記した画像処理方法における各ステップを実行するプログラムからなることを特徴とするもので、本発明のコンピュータに読み取り可能な記録媒体には、これらプログラムが記録される。
本発明によれば、視認性を低下させずにファイルサイズの大幅な圧縮が可能になる。すなわち、JPEG圧縮は画素値の変動が激しい画像については圧縮効率があまりよくないが、文字部をJPE以外の圧縮法(文字に適したMMR等の圧縮)により符号化するので圧縮効率が高くなる。また、文字部分は色数を大幅に減らしているので(たとえば、二値化しているので)これも圧縮効率がよくなる。画質的には、文字を二値画像として再現すると、輪郭が明瞭となるので視認性は向上する傾向がある。
また、本発明では、罫線に接触する文字も、二値画像として再現されるので、視認性に優れるうえ、ファイルサイズが節約できる。また、罫線そのものを二値画像として再現することも可能である。この場合も高い視認性とファイルサイズ節約が期待できる。
図1は本発明の画像処理装置の一実施形態を示す機能ブロック図である。
図1において画像処理装置11は、特定属性部抽出手段111と、罫線抽出手段112と、特定属性部消去画像生成手段113と、特定属性部色決定手段114と、特定属性部彩色画像生成手段115と、罫線再描画手段116と、符号化手段117とを備えている。
特定属性部抽出手段111は、原画像OGから特定属性を持つ部分(特定属性部:本実施形態では文字部分)を抽出することができる(特定属性情報をEPで示す)。特定属性は、本実施形態では文字属性である。また、本実施形態では、特定属性部抽出手段111は、二値化原画像生成手段1111と、特定属性部抽出手段1112と、罫線消去二値化画像生成手段1113と、連結成分抽出手段1114と、連結成分サイズ分類手段1115とを備えている。
二値化原画像生成手段1111は、原画像OGを二値化した二値化原画像OGBを生成する。特定属性部認識手段1112は、二値化原画像生成手段1111が生成した二値化原画像OGB中の特定属性部の認識処理を行う。
罫線消去二値化画像生成手段1113は、罫線抽出手段112により抽出した罫線を、二値化原画像OGBから消去して罫線消去二値化画像OGB′を生成する。
連結成分抽出手段1114は、罫線消去二値化画像生成手段1113により生成した罫線消去二値化画像OGB′から連結成分LEを抽出する、
連結成分サイズ分類手段1115は、連結成分抽出手段1114により抽出した連結成分のサイズを分類する。この分類結果が、特定属性情報EPである。
罫線抽出手段112は、原画像OG中に含まれる罫線を抽出する。本実施形態では、罫線抽出手段112は、二値化原画像生成手段1111により生成した二値化原画像OGBから罫線FBを抽出するものとする。
特定属性部消去画像生成手段113は、特定属性部抽出手段111により抽出した特定属性部(文字部分)を原画像から消去した特定属性部消去画像OGEを生成する。
特定属性部色決定手段114は、特定属性部抽出手段111により抽出した特定属性部(文字部分)の色を決定する。この色情報をLCとする。
特定属性部彩色画像生成手段115は、特性属性部(文字部分)の画像を特定属性部色決定手段114により決定した色により彩色した特定属性部彩色画像CGGを少なくとも1つ生成する。
罫線再描画手段116は、連結成分サイズ分類手段の処理後の画像に対して、罫線消去二値化画像生成手段により消去した罫線FBを再び描き入れる。
符号化手段117は、特定属性部を消去した画像と、特定属性部のみからなる画像とから圧縮画像を生成する。
本実施形態では、画像処理装置11により、原画像を文字の視認性を犠牲にせずに大幅なサイズ削減を実現することができる。
図2により図1の画像処理装置11の処理の流れを説明する。
画像処理装置11に、イメージスキャナなどを用いて多値の原画像が入力され(S101)ると、前述したように二値化原画像生成手段1111が、原画像OGを二値化した二値化原画像OGBを生成する(S102)。
次いで、特定属性部認識手段1112が、原画像OGから特定属性部(本実施形態では文字部分)の位置を特定する(S103)。文字の位置を画素単位で知ることができる。
文字部分の位置を特定する技術は周知であり、多値画像から文字部分の位置を直接特定することもできるし(特開2002−288589等参照)、多値画像から二値化原画像OGBを生成し、この二値化原画像OGBから文字部分の位置を特定することもできる(特開平6−20092等参照)。
特定属性部の抽出は、S103において認識した特定属性部以外の黒画素を消去する(黒画素を背景色(通常は白)に変換する)ことにより行われる(S104)。また、罫線抽出手段112により罫線抽出を行う(S105)。本実施形態では、罫線の抽出は前述したように二値化画像生成手段1111により生成した二値化原画像OGBに基づき行う。さらに、罫線消去二値化原画像生成手段1113により罫線を消去する(S106)。すなわち、罫線を白画素に変更することで消去する。なお、S104からS106の処理は、順序を入れ替えることができる。
上記のようにして罫線消去二値化原画像OGB′が作成される。
次に、連結成分抽出手段1114により、罫線消去二値化原画像OGB′から黒画素の連結成分を抽出し(S107)、大きすぎるサイズの連結成分と小さすぎるサイズの連結成分を消去する(S108)。小さすぎるサイズの連結成分は、ノイズ等、文字でない可能性が高いうえ、このまま二値画像にすれば圧縮効率が低下するためである。また、文字領域の特定は技術的に難しく、必ずしも正しい文字領域が抽出されるとは限らない。そのため、原画像OGに図の領域や写真の領域がある場合、この領域を文字と誤認識する可能性もある。したがって、大きすぎるサイズの連結成分は文字以外の可能性が高い。また、大きなサイズの連結成分が実際には文字である場合、この処理では誤って背景に分類されることになるが、サイズが大きいので人間の目からは十分読み取ることができる。
ここで、もし罫線を消去していない場合、罫線に接触している文字は、罫線と同一の連結成分となり、サイズが大きくなりすぎて抽出できなくなる。よって、罫線消去を行うことは罫線に接触した文字を抽出することを容易にする効果がある。たとえば、文字と罫線とを分離しないで、サイズにより文字を抽出する場合、図3(A)に示すように文字の一部が、独立した文字として認識され、または文字の一部と罫線とがイメージとして認識されてしまうが、文字と罫線とを分離した場合には、サイズにより文字を抽出したとしても、図3(B)に示すように正確に文字の認識がなされる。
罫線は単色であることが多いので、二値画像で再現しても視認性は低下しない。そこで、文字以外を消去した罫線消去二値化原画像OGB′に対し、再び罫線を描画し、二値画像として再現されるようにする(S109)。
なお、写真部分など罫線でない部分を罫線として抽出すると、これを二値画像で再現すると色数が極端に減少して画質低下を招く。このような場合は本処理を省略することも可能である。この場合、罫線は背景画像として再現されることになる。
この後、特定属性部消去画像生成手段113により、特定属性部(特定属性部)を消去した特定属性部消去画像OGEを作る(S110)。具体的には罫線消去二値化原画像OGB′中の、文字部分の画素を周囲の色で置き換えた画像を作ればよい。この特定属性部消去画像OGEは、具体的には、二値化原画像OGBから特定属性部(文字部分)および罫線が除去された画像である。
この後、特定属性部色決定手段により、特定属性部の色を決定する(S111)。文字を構成する黒画素の位置にある、カラー画像の画素色をすべて求め、このデータから多く使われている色を数色選んで代表色とすることができる。そして、画素ごと、または連結成分ごとに文字を構成する画素がどの代表色に最も近いかを判断する。
特定属性部彩色画像生成手段115により、特定属性部(画素ごとまたは連結成分ごとに彩色した色を持つ)を有する特定属性部彩色画像CGGを生成する(S112)。この画像は、限られた色のみをもつ多値画像でもよいし、色ごとに1つずつ二値画像を持っていてもよい。ここでは、二値画像を色ごとに1つずつ持つこととする。
符号化手段117により、生成された特定属性部を消去した画像と、特定属性部のみからなる画像から圧縮画像を生成する(S113)。たとえば前者はJPEG圧縮、後者はMMR圧縮を行うとファイルサイズが効率的に小さくなる。
次に、統合ファイル作成手段118により、特定属性部を消去した画像に、特定属性画素のみからなる画像を重ね合わせて表示できる形で合成する(S114)。これらを重ね合わせてみれば、背景の上に文字が貼り付いている形となり、原画像OGと同様に見ることができる。
図4は原画像OGに写真等のイメージIMが含まれている場合の本発明の画像処理装置の実施形態を示す機能ブロック図、図5は当該画像処理装置による処理の流れを示す説明図である。図4の構成は、概略、図1の構成と同じであるが、多値イメージ抽出手段119が、原画像OGから写真等のイメージIMを文字と分離して抽出する点が図1とは異なる。
本実施形態では、原画像OGには、イメージIMと、罫線FB付きの文字LTが記載されている。
この原画像OGから、イメージIM部分が抽出された多値原画像OG1と、全体を二値化した画像(二値化原画像OGB)が作成される(A1,A2)。特定属性部抽出手段111が二値化原画像OGBから特定属性部(文字部分)を抽出し(A3)、罫線抽出手段112が二値化原画像OGBから罫線を抽出し罫線再描画手段116による再描画がなされる(A4)とともに、特定部分色決定手段114により二値化原画像OGBに彩色が施され、罫線消去二値化原画像OGB′が作成される(A5)。
この後、イメージIM,罫線部分FB(これらが特定属性部消去画像OGEとなる)と、罫線消去二値化原画像OGB′(特定属性部(文字部分))とが符号化手段117により符号化され、統合ファイル作成手段118により統合される(A6)。
図6から図9は、罫線抽出手段112による罫線抽出を行う場合を詳細に説明する。図6は、罫線抽出手段112の詳細を示す図であり、(A)では、罫線抽出手段112は、同色とみなせる長いランを抽出する同色長ラン抽出手段1121と、同色長ラン抽出手段1121により抽出した長いランを構成要素とする連結成分を生成する長ラン連結成分生成手段1122とを備えている。また、図6(B)では、罫線抽出手段112は、同色とみなせる短いランを抽出する同色短ラン抽出手段1123と、同色短ラン抽出手段1123により抽出した短いランを構成要素とする連結成分を生成する短ラン連結成分生成手段1124とを備えている。
図6(A)の罫線抽出手段112は、黒画素のラン(水平または垂直方向に連続した黒画素群)のうち長いものだけを抽出し、この長いラン同士が接触しているものをまとめて連結成分としてグループ化する。そして、ランの方向に長く、ランと垂直方向が短い、細長い連結成分だけを罫線とみなす。
また、図6(B)の罫線抽出手段112は、黒画素のランのうち短いものだけを抽出し、これらから連結成分を抽出する。そして、ランの方向に短く、ランと垂直方向が長い、細長い連結成分だけを文字とみなす。
図6(A),(B)のうち何れを用いてもよい。図6(A)の罫線抽出手段112は、図7(A1),(A2),(A3)の下段に示すように、傾き、乱れに強く、また小さな画素も抽出することができ、逆に図6(B)の罫線抽出手段112は、図7(B1),(B2),(B3)に示すように、傾き、乱れに弱く、また小さな画素を抽出することができない(各図において上段は原画像OGを示し下段の塗潰しは罫線抽出手段112による抽出画像を示す)。また、図6(A)の罫線抽出手段112は、図8(A)に示すように罫線を認識できるが、図6(B)の罫線抽出手段112は、図8(B)に示すように罫線を認識できない(各図において上段は原画像OGを示し下段の塗潰しは罫線抽出手段112による抽出画像を示す)。
上記のように図6(A)、(B)の罫線抽出手段112にはそれぞれ一長一短があるので、両方の機能を奏する罫線抽出手段を用いれば、罫線の抽出漏れは少なくなる。
以上の処理で、視認性を低下させずにファイルサイズの大幅な圧縮が可能になる。すなわち、JPEG圧縮は画素値の変動が激しい画像については圧縮効率があまりよくないが、ここで述べた方法で文字部分を消去すれば、文字部の画素値変動がなくなるので効率がよくなる。また、文字部分は色数を大幅に減らしているのでこれも圧縮効率がよくなる。画質的には、文字を二値画像として再現すると、輪郭が明瞭となるので視認性は向上する傾向がある。
本発明の画像処理装置の一実施形態を示す機能ブロック図である。 図1の画像処理装置の処理の流れを示す説明図である。 (A)は図1の画像処理装置において文字の一部が独立した文字として認識され、または文字の一部と罫線とがイメージとして認識されてしまう様子を示す図、(B)は図1の画像処理装置において文字が正確に認識される様子を示す図である。 原画像に写真等のイメージが含まれている場合の本発明の画像処理装置の実施形態を示す機能ブロック図である。 図4の画像処理装置による処理の流れを示す説明図である。 (A)は罫線抽出手段が同色長ラン抽出手段と長ラン連結成分生成手段とを備えている罫線抽出手段を示す図、(B)は罫線抽出手段が同色短ラン抽出手段と短ラン連結成分生成手段とを備えている罫線抽出手段を示す図である。 (A1),(A2),(A3)は図6(A)の罫線抽出手段による罫線抽出の様子を示す図、(B1),(B2),(B3)は図6(A)の罫線抽出手段による罫線抽出の様子を示す図である。 (A)は図6(A)の罫線抽出手段が文字と接触した罫線を認識できる様子を示す図、(B)の罫線抽出手段が文字と接触した罫線を認識できない様子を示す図である。
符号の説明
11 画像処理装置
111 特定属性部抽出手段
112 罫線抽出手段
113 特定属性部消去画像生成手段
114 特定属性部色決定手段
115 特定属性部彩色画像生成手段
116 罫線再描画手段
117 符号化手段
1111 二値化原画像生成手段
1112 特定属性部抽出手段
1113 罫線消去二値化画像生成手段
1114 連結成分抽出手段
1115 連結成分サイズ分類手段

Claims (16)

  1. 原画像から特定属性を持つ部分を抽出する特定属性部抽出手段と、
    前記原画像中に含まれる罫線を抽出する罫線抽出手段と、
    前記特定属性部抽出手段により抽出した前記特定属性部を原画像から消去した特定属性部消去画像を生成する特定属性部消去画像生成手段と、
    前記特定属性部抽出手段により抽出した前記特定属性部の色を決定する特定属性部色決定手段と、
    前記特性属性部の画像を前記特定属性部色決定手段により決定した色により彩色した特定属性部彩色画像を少なくとも1つ生成する特定属性部彩色画像生成手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記特定属性部抽出手段が、
    前記原画像を二値化した二値化原画像を生成する二値化原画像生成手段と、
    前記二値化原画像生成手段が生成した二値化原画像中の前記特定属性部を認識する特定属性部認識手段と、
    を備え、
    前記罫線抽出手段は、前記二値化原画像生成手段により生成した二値化原画像から罫線を抽出する、
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記特定属性部抽出手段が、さらに
    前記罫線抽出手段により抽出した前記罫線を、前記二値化原画像から消去して罫線消去二値化画像を生成する罫線消去二値化画像生成手段と、
    前記罫線消去二値化画像生成手段により生成した罫線消去二値化画像から連結成分を抽出する連結成分抽出手段と、
    前記連結成分抽出手段により抽出した連結成分のサイズを分類する連結成分サイズ分類手段と、
    を備えることを特徴とする請求項2に記載の画像処理装置。
  4. 前記連結成分サイズ分類手段の処理後の画像に対して、罫線消去二値化画像生成手段により消去した前記罫線を再び描き入れる罫線再描画手段を備えることを特徴とする請求項3に記載の画像処理装置。
  5. 前記罫線抽出手段が、
    同色とみなせる長いランを抽出する同色長ラン抽出手段と、
    前記同色長ラン抽出手段により抽出した前記長いランを構成要素とする連結成分を生成する長ラン連結成分生成手段と、
    を備えることを特徴とする請求項1から4の何れかに記載の画像処理装置。
  6. 前記罫線抽出手段が、
    同色とみなせる短いランを抽出する同色短ラン抽出手段と、
    前記同色短ラン抽出手段により抽出した前記短いランを構成要素とする連結成分を生成する短ラン連結成分生成手段と、
    を備えることを特徴とする請求項1から4の何れかに記載の画像処理装置。
  7. 前記罫線抽出手段が、
    同色とみなせる長いランを抽出する同色長ラン抽出手段と、
    前記同色長ラン抽出手段により抽出した前記長いランを構成要素とする連結成分を生成する長ラン連結成分生成手段と、
    同色とみなせる短いランを抽出する同色短ラン抽出手段と、
    前記同色短ラン抽出手段により抽出した前記短いランを構成要素とする連結成分を生成する短ラン連結成分生成手段と、
    を備えることを特徴とする請求項1から4の何れかに記載の画像処理装置。
  8. 原画像から特定属性を持つ部分を抽出する特定属性部抽出ステップと、
    前記原画像中に含まれる罫線を抽出する罫線抽出ステップと、
    前記特定属性部抽出ステップにおいて抽出した前記特定属性部を原画像から消去した特定属性部消去画像を生成する特定属性部消去画像生成ステップと、
    前記特定属性部抽出ステップにおいて抽出した前記特定属性部の色を決定する特定属性部色決定ステップと、
    前記特性属性部の画像を前記特定属性部色決定ステップにおいて決定した色により彩色した画像を少なくとも1つ生成する特定属性部彩色画像生成ステップと、
    を備えることを特徴とする画像処理方法。
  9. 前記特定属性部抽出ステップが、前記原画像を二値化した二値化原画像を生成する二値化原画像生成ステップを備え、
    前記罫線抽出ステップは、前記二値化原画像生成ステップにおいて生成した二値化原画像から罫線を抽出する、
    ことを特徴とする請求項8に記載の画像処理方法。
  10. 前記特定属性部抽出ステップが、
    前記罫線抽出ステップにおいて抽出した前記罫線を、前記二値化原画像から消去して罫線消去二値化画像を生成する罫線消去二値化画像生成ステップと、
    前記罫線消去二値化画像生成ステップにおいて生成した罫線消去二値化画像から連結成分を抽出する連結成分抽出ステップと、
    前記連結成分抽出ステップにおいて抽出した連結成分のサイズを分類する連結成分サイズ分類ステップと、
    を備えることを特徴とする請求項9に記載の画像処理方法。
  11. 前記連結成分サイズ分類ステップの処理後の画像に対して、罫線消去二値化画像生成ステップにおいて消去した前記罫線を再び描き入れる罫線再描画ステップを備えることを特徴とする請求項10に記載の画像処理方法。
  12. 前記罫線抽出ステップが、
    同色とみなせる長いランを抽出する同色長ラン抽出ステップと、
    前記同色長ラン抽出ステップにおいて抽出した前記長いランを構成要素とする連結成分を生成する長ラン連結成分生成ステップと、
    を備えることを特徴とする請求項8から11の何れかに記載の画像処理方法。
  13. 前記罫線抽出ステップが、
    同色とみなせる短いランを抽出する同色短ラン抽出ステップと、
    前記同色短ラン抽出ステップにおいて抽出した前記短いランを構成要素とする連結成分を生成する短ラン連結成分生成ステップと、
    を備えることを特徴とする請求項8から11の何れかに記載の画像処理方法。
  14. 前記罫線抽出ステップが、
    同色とみなせる長いランを抽出する同色長ラン抽出ステップと、
    前記同色長ラン抽出ステップにおいて抽出した前記長いランを構成要素とする連結成分を生成する長ラン連結成分生成ステップと、
    同色とみなせる短いランを抽出する同色短ラン抽出ステップと、
    前記同色短ラン抽出ステップにおいて抽出した前記短いランを構成要素とする連結成分を生成する短ラン連結成分生成ステップと、
    を備えることを特徴とする請求項8から11の何れかに記載の画像処理方法。
  15. 請求項8から14の何れかに記載の画像処理方法における各ステップを実行するプログラムからなることを特徴とする画像処理プログラム。
  16. 請求項15に記載のプログラムを記録したコンピュータに読み取り可能な記録媒体。
JP2004168016A 2004-01-19 2004-06-07 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体 Pending JP2005348279A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2004168016A JP2005348279A (ja) 2004-06-07 2004-06-07 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
EP20050250226 EP1555804A3 (en) 2004-01-19 2005-01-18 Image processing apparatus, image processing program and storage medium
CNB2005100543009A CN100356768C (zh) 2004-01-19 2005-01-19 图像处理设备和图像处理方法
US11/037,172 US20050180645A1 (en) 2004-01-19 2005-01-19 Image processing apparatus, image processing program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004168016A JP2005348279A (ja) 2004-06-07 2004-06-07 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体

Publications (1)

Publication Number Publication Date
JP2005348279A true JP2005348279A (ja) 2005-12-15

Family

ID=35500198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004168016A Pending JP2005348279A (ja) 2004-01-19 2004-06-07 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体

Country Status (1)

Country Link
JP (1) JP2005348279A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260057B2 (en) 2007-07-12 2012-09-04 Ricoh Company, Limited Image processing apparatus that obtains a ruled line from a multi-value image

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260057B2 (en) 2007-07-12 2012-09-04 Ricoh Company, Limited Image processing apparatus that obtains a ruled line from a multi-value image

Similar Documents

Publication Publication Date Title
JP4603807B2 (ja) 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体
US7936929B2 (en) Image processing method and apparatus for removing noise from a document image
US8417029B2 (en) Image processing apparatus and method, including fill-up processing
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JP4364809B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP2000207489A (ja) 文字抽出方法、装置および記録媒体
JP2007158725A (ja) 画像処理装置及び画像処理方法並びにプログラム
US8810877B2 (en) Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
JP2005348279A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP4324058B2 (ja) 画像処理装置及びその方法
JP2005210650A (ja) 画像処理装置
JP4504096B2 (ja) 画像処理装置、プログラム、及び記憶媒体
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP2002236921A (ja) 文書画像認識方法、文書画像認識装置及び記録媒体
JP4228905B2 (ja) 画像処理装置及びプログラム
JP2005190010A (ja) 画像処理装置
JP4650958B2 (ja) 画像処理装置、方法およびプログラム
JP4383187B2 (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP4218541B2 (ja) 情報埋込み装置および情報検証装置、ならびにその情報検証方法
JP4587167B2 (ja) 画像処理装置及び画像処理方法
JPH08202824A (ja) 文書画像認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080724

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080729

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080929

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081028