JP2005159662A - 画像処理装置、画像処理プログラム及び画像処理方法 - Google Patents

画像処理装置、画像処理プログラム及び画像処理方法 Download PDF

Info

Publication number
JP2005159662A
JP2005159662A JP2003394428A JP2003394428A JP2005159662A JP 2005159662 A JP2005159662 A JP 2005159662A JP 2003394428 A JP2003394428 A JP 2003394428A JP 2003394428 A JP2003394428 A JP 2003394428A JP 2005159662 A JP2005159662 A JP 2005159662A
Authority
JP
Japan
Prior art keywords
image
character
code
document image
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003394428A
Other languages
English (en)
Inventor
Fumihiro Hasegawa
史裕 長谷川
Toshio Miyazawa
利夫 宮澤
Hideaki Yamagata
秀明 山形
Toshifumi Yamaai
敏文 山合
Toshihiro Suzuki
俊博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003394428A priority Critical patent/JP2005159662A/ja
Publication of JP2005159662A publication Critical patent/JP2005159662A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 文書画像にとり重要な文字情報の符号化による画像品質の低下を抑えながら全体として圧縮効果を高めること。
【解決手段】 取得した原文書画像から文字の属性をもつ領域を抽出し、得た文字領域情報を基にJPEG2000の符号化方式により文字領域に対して多く、他の領域には少なく符号量を割り当て(S103)、符号化を行う。符号化された画像データをファイル化し管理可能な形で保存場所に蓄積したり、通信インターフェイスを介して転送する。
【選択図】 図1

Description

本発明は、文書画像を登録、管理する文書管理システムなどに利用される入力画像の処理装置に関し、視認性の低下を抑えながら圧縮保存する処理及び検索用のデータを付加する処理を行う画像処理装置、画像処理プログラム及び画像処理方法に関する。
大量の紙文書の保管に要するスペースや利用時の文書管理にかかるコストを低減させるために、紙文書を電子画像としてファイル化し、管理するシステムは既に様々な形態の文書管理システムとして実現されている。身近な例としては、文書画像を電子ファイルとしてハードディスクなどの大容量を持つ記録媒体に蓄積し、ユーザーからの呼び出しに応じて画面表示したり、印刷を行うことができるようなシステムがある。
一般に、画像はファイルサイズが大きいため、文書を大量に蓄積するとハードディスクの容量が不足し勝ちになる。また、ネットワーク上にハードディスクを置き、これをネットワーク越しに複数の端末から共通利用する場合には、ファイルサイズの大きさがレスポンスタイムの低下を招くことがある。こうした事態を回避するために、画像に圧縮をかけることによりデータ量を小さくして、ファイルを保存する記録媒体にできるだけ多くのファイルが蓄積できるようにし、またネットワークにおけるデータの転送量をできるだけ少なくするような方法を適用している。
この場合、静止画像に対して圧縮をかけることができる方式として知られているJPEGなどを用いて、画像ファイルのサイズを小さくしている。JPEGは、一般的で優れた圧縮方法ではあるが、画像全体を一律に圧縮するので圧縮率はそれほど大きくない。
一律に圧縮することによる画像全体の圧縮率の低下を改善し、画像の圧縮率を高めるために提案された従来技術として、下記特許文献1を挙げることができる。特許文献1には、画像の内容に合わせた符号化(圧縮)方法を適用するものである。即ち、画像を重要度の高低により領域分割し、クラスが低いと判断された領域には符号の発生量を抑えることで、圧縮効率を高めている。ただし、この例は動画を対象にしたものであり、領域分割の判断とクラスの判断をエッジ、テクスチャ解析、或いは画像の動きデータによって行うものを提案している。
ところで、電子ファイルとして蓄積する文書画像を管理する場合に、蓄積ファイルに検索キー(例えばキーワード)等の管理情報を付与して登録し、検索や管理に利用するという方法が一般的に採用されている。こうした検索キー等の管理情報の付与は、ファイル作成時に手入力によって行う場合もあるが、手間の掛かる作業であり、この作業を自動的に行うための提案がなされており、下記特許文献2にその例を示すことができる。特許文献2には、スキャナ読み取りした文書画像中から文字認識によりタイトル等の文字コード列を取得し、それを文書画像に対応付けて管理テーブルに登録することにより、タイトルによって文書画像の検索を可能とする文書画像処理装置が示されている。
特開2001−045494号公報 特開2001−034763号公報
しかしながら、画像の圧縮率を高めるために提案された上記特許文献1に示す従来技術は動画を対象としたものであり、文書画像にそのままは適用できない。例えば、文書画像は文字がもっとも重要な情報であるため、この領域だけに多くの符合を割こうとしても、上記特許文献1のように単にエッジを頼りに領域分割すると、比較的強いエッジを持つ写真部などにも多くの符号が割かれ、圧縮効率が低下する。また、テクスチャ解析は、文字そのものには規則的なパターンがないので、これを用いて文字領域を検出することはできない。さらに、画像の動きを用いた方法も、静止画である文書画像には適用できない。
また、蓄積ファイルに検索キー等の管理情報を自動付与する上記特許文献2に示す従来技術は、ファイルサイズの長大化を抑制するという点を考慮していないので、タイトル抽出したあとの文書画像にさらにタイトル情報を付すので、ファイルサイズはさらに大きくなってしまう。
本発明は、上記した従来技術の問題点に鑑み、これを解決するためになされたもので、その解決課題は、文書画像にとって重要な文字情報の符号化による視認性(画像品質)の低下を抑えながら全体として圧縮効果を高めることにある。また、符号化により文書画像のデータ圧縮を行う際に、ファイルサイズの長大化の抑制を図りながら検索キー等の管理情報を付与することにある。
請求項1の発明は、設定を可変とした符号量で文書画像を符合化することが可能な画像処理装置であって、文書画像から文字属性をもつ領域を抽出する手段と、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当てる手段と、割り当てた符合量に応じて各領域の画像を符号化する手段を備えたことを特徴とする画像処理装置である。
請求項2の発明は、設定を可変とした符号量で文書画像を符合化することが可能な画像処理装置であって、文書画像に予め設定されている文字記入領域情報を取得する手段と、取得した文字記入領域情報に示される領域に他の領域より多くの符合量を割り当てる手段と、割り当てた符合量に応じて各領域の画像を符号化する手段を備えたことを特徴とする画像処理装置である。
請求項3の発明は、請求項1又は2に記載された画像処理装置において、符号化された文書画像にテキストデータを付加する手段を備えたことを特徴とするものである。
請求項4の発明は、請求項3に記載された画像処理装置において、対象とする文書画像をテキストデータとして文字認識処理する手段を備え、前記符号化された文書画像に付加する手段に用いるテキストデータが文字認識により得たデータであることを特徴とするものである。
請求項5の発明は、対象とする文書画像から文字属性をもつ領域を抽出する処理手順と、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当て、符合量を調整する処理手順と、割り当てた符合量に応じて各領域の画像を符号化する処理手順をコンピュータに実行させるためのプログラムである。
請求項6の発明は、対象とする文書画像に予め設定されている文字記入領域情報を取得する処理手順と、取得した文字記入領域情報に他の領域より多くの符合量を割り当て、符合量を調整する処理手順と、割り当てた符合量に応じて各領域の画像を符号化する処理手順をコンピュータに実行させるためのプログラムである。
請求項7の発明は、請求項5又は6に記載されたプログラムにおいて、符号化された文書画像にテキストデータを付加する処理手順を実行させるためのプログラムを備えたことを特徴とするプログラムである。
請求項8の発明は、請求項7に記載されたプログラムにおいて、対象とする文書画像をテキストデータとして文字認識する処理手順を実行させ、得られるデータを符号化された文書画像に付加する前記テキストデータとすることを特徴とするプログラムである。
請求項9の発明は、対象とする文書画像から文字属性をもつ領域を抽出するステップと、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当て、符合量を調整するステップと、割り当てた符合量に応じて各領域の画像を符号化するステップを有する画像処理方法である。
(1)請求項1,2,5,6,9の発明によると、文字属性をもつ領域に他の領域より多くの符合量を割り当てる符合量の調整をして各領域の画像を符号化するようにしたので、文字情報の符号化による画像品質(視認性)の低下を抑えながら全体として圧縮効果を高めることが可能になる。
(2)請求項3,4,7,8の発明によると、符号化された文書画像にテキストデータを付加することにより、ファイルサイズの長大化の抑制を図りながら検索キー等の管理情報を付与することによりファイル管理機能が高度化され、しかも文字認識処理を組み込むことにより自動的に管理情報が付与され、さらに利便性の向上を図ることが可能になる。
本発明を添付する図面とともに示す以下の実施形態に基づき説明する。なお、下記実施形態においては、実施形態1では符号量調整方式による画像の符号化処理に関して、実施形態2では符号化に合わせて文書画像へテキストデータを付加する処理について、又実施形態3ではコンピュータを利用した実施形態について説明する。
「実施形態1」
本実施形態は、処理対象となる文書画像中の最も大切な情報は文字であるという前提で、文書画像を符号化して圧縮をかける処理を行う際に、文字領域に多くの符号を割り当てることで、この領域の復号画像における視認性(画像品質)の低下を抑制し、文字領域以外の領域への符合の割り当てを少なくして全体の圧縮効率を高めることを意図するものである。
カラー画像は特にファイルサイズが大きいので圧縮することが求められる。見栄えをあまり落とさずにファイルサイズを小さくするために、本実施形態ではJPEG2000(カラー静止画の標準)に規定される方式による圧縮を用いる。JPEG2000が規定する方式はウェーブレット変換を用いて画像を符号化し、データを圧縮するものであるが、そのときに特定の画像領域に符号を多く割り当て、別の領域に割り当てる符号を減らす調整が可能である。符号が多く割り当てた部分は高品質の画像が得られるので、大切な場所に多くの符号を割り当てれば画質とファイルサイズの面で効率的な圧縮が可能となる。
図3は、文書画像に上記したJPEG2000の符号量調整方式による符号化(圧縮)を行う際の処理過程を説明し、符号量調整の効果を示す概念図である。この例は、多くの符合量を割り当てる特定の領域を文字領域(図中、破線で枠囲いをした領域)として、原画像に符号量調整方式による符号化(圧縮)を行っている。圧縮された画像を復号化したときには、符号量調整の結果として、文書画像中の文字領域は高品質を保持するが、文字以外の写真イメージ等が低品質になって表れることを示している。この場合、品質の低い部分は文書としてあまり重要でない部分であるとしてので、画像全体としての価値が下がることはなく、それよりも重要度の高い部分を高品質に保ったまま、ファイルサイズを小さくできるメリットが大きい。
特定の領域に多くの符合量を割り当てることを可能にするこの符号量調整方式を用いる場合に、領域を特定する必要があり、本例では文字領域を特定の領域とするので、文書画像中の文字領域の位置情報を得る。文字領域の位置情報を得る方法としては、原文書画像を解析し、解析結果から文字領域を特定する方法を用いることが可能である。また、文書が定型のアンケート用紙などの場合には、アンケートの記入欄の場所が予め規定されており、情報として重要な場所はこの記入欄である。そこで、画像解析によらずに規定された記入欄の情報を予め保存しておき、この情報をもとに処理時に条件設定を行う方法を用いることによって、実施することも可能である。
図1は、本実施形態に係る画像処理フローを示すチャートであり、図2は、本実施形態に係る画像処理装置の構成を示すブロック図である。
先ず、図2を参照して本実施形態に係る画像処理装置の構成を説明すると、画像取得手段101は、処理対象の原文書画像を取得、格納しておく手段(例えば、カラー画像データを出力するスキャナ、撮像装置などの原稿読み取り装置或いは読み取り画像データを受信する手段により実施し得る)であり、画像取得手段101で取得した原画像データを特定属性領域抽出手段102と、符号化手段104とに送出する。
特定属性領域抽出手段102は、本例では文書画像を解析して文字領域を特定する手段で、ここで得られる領域情報は符合量割り当て手段103に送出される。なお、文書が定型で、文字欄等の文字領域が規定されている場合には、特定属性領域抽出手段102に代わる手段として、装置が予め保持している文字記入欄の領域データを取り出して、設定する操作を行う手段で置き換えることにより実施することが可能である。
符合量割り当て手段103は、特定属性領域抽出手段102から受け取る文字領域情報に基づいて、文字領域にそれ以外の領域よりも多くの符合量を割く符合量の割り当て行い、割り当てた符合量の設定を符号化手段104に送出する。
符号化手段104は、画像取得手段101から受け取る文書画像を符合量割り当て手段103が各領域に割り当てた符合量に従って符号化し、符号化した文書画像データを格納する。
次に、本実施形態に係る画像処理手順を図1のフローチャートを参照して説明する。なお、以下の説明は、上記画像処理装置の動作説明を兼ねる。
図1のフローによると、まず、処理対象となる原文書画像を画像取得手段101によって取得する(ステップS101)。なお、ここで取得される画像は、RGB 3色の色成分を持つカラー画像とする。
次に、取得した原文書画像から特定属性領域抽出手段102によって文字領域等の特定の属性をもつ領域を抽出する(ステップS102)。本例のように、属性が文字領域の場合は、文字認識処理の前処理として行われる既存の文字領域識別技術を適用することができる。上記した文字領域識別技術は、例えば、同色とみなせる画素、或いは黒画素をランとして抽出し、それらの連結成分を求め、得た連結成分を文字候補とみなして近接する連結成分同士を統合して文字行を生成する、といった方法によって文字領域の抽出を行う(例えば、特開2002−288589号公報、特開平6−20092号公報、参照)。また、アンケートの文字記入欄などの文字記入領域の場合は、記入領域情報が既知量として扱えるので、その情報を別に持っておき、使用時に取り出して、設定する操作を行う手段により文字領域情報を得る。
この後、得られた文字領域情報に基づき符合量割り当て手段103によって符号量の割り当てを行う(ステップS103)。JPEG2000に準拠する方式では、画像全体の符合量が設定できる上に、設定枠の中で画質を低下させたくない特定の領域に対して他の領域に対するよりも多くの符合量を割り当てる調整が可能である。特定の領域情報を前段の抽出ステップS102により得ているので、この領域情報から領域の大きさを求め、特定領域以外の領域の大きさとを対比し、その結果をもとにそれぞれの領域に対し割り当てる符合量を決める。
本例では、文字領域に対して多くの符号を割り当てるので、その分、他の領域に割り当てる符号は減ることになる。なお、ここでは特定属性をもつ領域には多くの符号を割り当てたが、逆に少ない符号量を割り当てるという方法をとるようにしても良い。例えば、特定領域としてノイズばかりの領域が抽出された場合には、ここには符号量をあまり割かず、ノイズ領域以外の他の部分に多くの符合量を割くことで、圧縮の効率を上げることも可能である。
符合量の割り当てを行った後、JPEG2000に準拠する符号化手段104によって符号化を行う(ステップS104)。JPEG2000による符号化は、ウェーブレット変換を用いて割り当てた符合量に従い各々の領域の画像データを圧縮する。文字領域に対して多くの符号を割り当てるので、他の領域はその分だけ符合量の割り当てが少なく圧縮率が高い。
符号化の終了後、符号化された画像データにファイルとして扱うために必要な処理を施して管理可能な形態で保存場所に蓄積したり、或いは通信インターフェイスを介して利用側に転送するための出力を行う(ステップS105)。
「実施形態2」
本実施形態は、処理対象となる文書画像を符号化して圧縮をかける処理を行う際に、ファイルサイズの長大化の抑制を図りながら検索キー等の管理情報を付与することを意図するものである。即ち、上記「実施形態1」に示したJPEG2000等の符号量調整方式による符号化(圧縮)を行う際の処理過程に加えて、検索キーとして利用可能なテキストデータを符号化(圧縮)された画像データに付与する処理を行うことにより、この意図を実現するものである。
本実施形態に示すJPEG2000に準拠する符号化では、約65KBの任意のデータでコメント挿入が可能なデータ構成をとっているので、ここにテキストデータを付加することによりこれを管理情報として用いるが可能となる。付加するテキストデータは、下記の実施形態に示すように、文字認識手段によって対象とする文書画像を文字認識処理して得られたデータを付加することにより、自動化が可能である。なお、付加するテキストデータの入力の方法として、ユーザーが原画像を見ながら手入力する方法によって行っても良い。テキストデータを付加することにより、キーワードによる検索も可能になり、大量の文書画像を保管している場合に所望のものを探し出す場合に便利である。
図4は、本実施形態に係る画像処理フローを示すチャートであり、図5は、本実施形態に係る画像処理装置の構成を示すブロック図である。
図5を参照して本実施形態に係る画像処理装置の構成を説明すると、画像取得手段201は、処理対象の原文書画像を取得、格納しておく手段(例えば、カラー画像データを出力するスキャナ、撮像装置などの原稿読み取り装置或いは読み取り画像データを受信する手段により実施し得る)であり、画像取得手段201で取得した原画像データを特定属性領域抽出手段202と、符号化手段204と、文字認識手段205とに送出する。
特定属性領域抽出手段202は、符合量の割り当てに使用する領域を特定するために文書画像の属性を解析しその属性を持つ領域を抽出する手段である。本例では文字属性を持つ領域を抽出する手段であり、得られる文字領域データは符合量の割り当てに使用されるが、文字認識処理の前処理としも共通に用いる。従って、ここで得られる領域情報は符合量割り当て手段203と、文字認識手段205とに送出する。なお、文書が定型で、文字記入欄等の領域が規定されている場合には、特定属性領域抽出手段202に代わる手段として、装置に予め保持しておいた文字記入欄の領域データを取り出して、設定する操作を行う手段で置き換えることにより実施することが可能である。
符合量割り当て手段203は、特定属性領域抽出手段202から受け取る文字領域情報に基づいて、文字領域とそれ以外の領域について各領域の大きさに応じた符合量の割り当て行い、割り当てた符合量の設定を符号化手段204に送出する。
符号化手段204は、画像取得手段201から受け取る文書画像を符合量割り当て手段203が各領域に割り当てた符合量に従って符号化し、符号化したデータをテキストデータ付加手段206に送出する。
文字認識手段205は、画像取得手段201と特定属性領域抽出手段202から受け取る文書画像と文字領域情報をもとに文字認識処理を行い、認識結果として得たテキストデータをテキストデータ付加手段206に送出する。
テキストデータ付加手段206は、文字認識手段205からのテキストデータを符号化手段204から受け取る符号化した文書画像データに付加し、この処理を終えた文書画像データを格納する。
次に、本実施形態に係る画像処理手順を図4のフローチャートを参照して説明する。なお、以下の説明は、上記した画像処理装置(図5)の動作説明を兼ねる。
図4のフローによると、まず、処理対象となる原文書画像を画像取得手段201によって取得する(ステップS201)。なお、ここで取得される画像は、RGB 3色の色成分を持つカラー画像とする。
次に、符号量の調整を行う領域情報を得るために、前段で取得した原文書画像から特定属性領域抽出手段102によって文字領域等の特定の属性をもつ領域を抽出する(ステップS102)。本例では、属性が文字領域であるから、文字認識処理の前処理として行われる文字領域識別技術を適用し、本例ではその結果を文書画像に付加するテキストデータを得るために行う後段の文字認識にも用いるようにする。
ここで適用する文字領域識別技術は、例えば、同色とみなせる画素、或いは黒画素をランとして抽出し、それらの連結成分を求め、得た連結成分を文字候補とみなして近接する連結成分同士を統合して文字行を生成する、といった方法によって文字領域の抽出を行う(例えば、特開2002−288589号公報、特開平6−20092号公報、参照)。また、アンケートの記入欄などの文字記入領域の場合は、記入場所が既知量として扱えるので、その情報を別に持っておき、使用時に取り出して、設定する操作を行う手段により文字領域情報を得るようにしても良い。
次に、文字認識手段205により、前段で得られた文字領域情報をもとにその領域に含まれる画像情報から文字を認識する処理を行い、認識結果として得た文字・文字列をテキストデータとして表現する(ステップS203)。ここで用いる文字認識技術は、基本的には対象領域から文字とみなせる画像を切り出し、辞書と照合することにより文字を認識し、対応するテキストデータへの変換を行う既存の技術を適用することにより実現可能である。
ただし、本実施形態では認識した文字はテキストデータとして処理対象の文書画像に付加して、文書の検索、管理情報として用いるという目的があり、またJPEG2000に準拠する符号化方式のデータ構成におけるコメント挿入箇所を用いるという制約条件を考慮して、一定のデータ量で文書が識別できる例えばタイトルのような文字列を選ぶと良い。なお、特定属性領域抽出手段202で得られる領域情報が予め設定された文字記入欄である場合は、この領域情報を利用して文字認識処理をおこなう原画像内の範囲を限定することができ、処理の高速化や不要なテキストが付加されるのを防止することに有効である。
また、この文字認識ステップは、後段のテキスト付加ステップまでに行えば良いので、符号化ステップの後に行うような手順でもかまわない。
この後、ステップS202で得られた文字領域情報に基づき符合量割り当て手段203によって符号量の割り当てを行う(ステップS204)。JPEG2000に準拠する方式では、画像全体の符合量が設定できる上に、設定枠の中で画質を低下させたくない特定の領域に対して他の領域に対するよりも多くの符合量を割り当てる調整が可能である。特定の領域情報を前段の抽出ステップS202により得ているので、この領域情報から領域の大きさを求め、特定領域以外の領域の大きさとを対比し、その結果をもとにそれぞれの領域に対し割り当てる符合量を決める。
本例では、文字領域に対して多くの符号を割り当てるので、その分、他の領域に割り当てる符号は減ることになる。なお、ここでは特定属性をもつ領域には多くの符号を割り当てたが、逆に少ない符号量を割り当てるという方法をとるようにしても良い。例えば、特定領域としてノイズばかりの領域が抽出された場合には、ここには符号量をあまり割かず、ノイズ領域以外の他の部分に多くの符合量を割くことで、圧縮の効率を上げることも可能である。
符合量の割り当てを行った後、JPEG2000に準拠する符号化手段204によって符号化を行う(ステップS205)。JPEG2000による符号化は、ウェーブレット変換を用いて割り当てた符合量に従い各々の領域の画像データを圧縮する。文字領域に対して多くの符号を割り当てるので、他の領域はその分だけ符合量の割り当てが少なく圧縮率が高い。
符号化の終了後、テキストデータ付加手段206によって、符号化された画像データにステップS203で得た文字・文字列のテキストデータを付加する(ステップS206)。本実施形態ではJPEG2000により符号化された画像のデータフォーマットにおけるコメント挿入箇所を用いてこのテキストデータの付加を行う。
テキストデータを付加した後、符号化された画像にはファイルとして扱うために必要となる処理が施され、管理可能な形態で保存場所に蓄積したり、或いは通信インターフェイスを介して利用側に転送するための出力を行う(ステップS207)。
「実施形態3」
本実施形態は、符号量調整方式による符号化(圧縮)を行う上記実施形態1、2に示した画像処理フローにおける処理手順を実行させる手段として、汎用のコンピュータを利用した実施形態を示すものである。
図6は、本実施形態の処理装置の構成を示す。図6に示すように、本実施形態は、汎用の処理装置(コンピュータ)により実施する例を示すものであり、構成要素としてCPU401、メモリ402、ハードディスクドライブ403、入力装置404、CD−ROMドライブ405、ディスプレイ406、マウスなどを用意する。また、CD−ROMドライブ405が用いるCD−ROMなどの記録媒体407には、上記実施形態1、2に示した画像を処理する手段が有する処理機能を実現させ、或いは画像処理フローに示した処理手順を実行するためのプログラム(ソフトウェア)が記録されている。
処理対象の文書画像は、スキャナー等の入力装置404により入力され、例えばハードディスク403などに格納され、そこから取り出されて上記画像処理を施された後に再びハードディスク403に保存される。CPU401は、記録媒体407から上記した処理機能、手順を実現するプログラムを読み出し、プログラムに従って符号量調整方式による符号化(圧縮)処理を対象文書画像に実行する。また、ハードディスク403に保存された画像は、ディスプレイ406に出力することにより、処理結果を確認することが可能である。
本発明に係る画像処理フロー(実施形態1)を示すチャートである。 本発明に係る画像処理装置(実施形態1)の構成を示すブロック図である。 文書画像にJPEG2000の符号化を行う際の処理過程を説明し、符号量調整の効果を示す概念図である。 本発明に係る画像処理フロー(実施形態2)を示すチャートである。 本発明に係る画像処理装置(実施形態2)の構成を示すブロック図である。 汎用コンピュータを利用した実施形態を示す。
符号の説明
101,201・・・画像取得手段、 102,202・・・特定属性領域抽出手段、
103,203・・・符合量割り当て手段、104,204・・・符号化手段、
205・・・文字認識手段、 206・・・テキストデータ付加手段、
401・・・CPU、 402・・・メモリ、
403・・・ハードディスクドライブ、 404・・・入力装置、
405・・・CD−ROMドライブ、 406・・・ディスプレイ、
407・・・記録媒体。

Claims (9)

  1. 設定を可変とした符号量で文書画像を符合化することが可能な画像処理装置であって、文書画像から文字属性をもつ領域を抽出する手段と、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当てる手段と、割り当てた符合量に応じて各領域の画像を符号化する手段を備えたことを特徴とする画像処理装置。
  2. 設定を可変とした符号量で文書画像を符合化することが可能な画像処理装置であって、文書画像に予め設定されている文字記入領域情報を取得する手段と、取得した文字記入領域情報に示される領域に他の領域より多くの符合量を割り当てる手段と、割り当てた符合量に応じて各領域の画像を符号化する手段を備えたことを特徴とする画像処理装置。
  3. 請求項1又は2に記載された画像処理装置において、符号化された文書画像にテキストデータを付加する手段を備えたことを特徴とする画像処理装置。
  4. 請求項3に記載された画像処理装置において、対象とする文書画像をテキストデータとして文字認識処理する手段を備え、前記符号化された文書画像に付加する手段に用いるテキストデータが文字認識により得たデータであることを特徴とする画像処理装置。
  5. 対象とする文書画像から文字属性をもつ領域を抽出する処理手順と、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当て、符合量を調整する処理手順と、割り当てた符合量に応じて各領域の画像を符号化する処理手順をコンピュータに実行させるためのプログラム。
  6. 対象とする文書画像に予め設定されている文字記入領域情報を取得する処理手順と、取得した文字記入領域情報に他の領域より多くの符合量を割り当て、符合量を調整する処理手順と、割り当てた符合量に応じて各領域の画像を符号化する処理手順をコンピュータに実行させるためのプログラム。
  7. 請求項5又は6に記載されたプログラムにおいて、符号化された文書画像にテキストデータを付加する処理手順を実行させるためのプログラムを備えたことを特徴とするプログラム。
  8. 請求項7に記載されたプログラムにおいて、対象とする文書画像をテキストデータとして文字認識する処理手順を実行させ、得られるデータを符号化された文書画像に付加する前記テキストデータとすることを特徴とするプログラム。
  9. 対象とする文書画像から文字属性をもつ領域を抽出するステップと、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当て、符合量を調整するステップと、割り当てた符合量に応じて各領域の画像を符号化するステップを有する画像処理方法。
JP2003394428A 2003-11-25 2003-11-25 画像処理装置、画像処理プログラム及び画像処理方法 Pending JP2005159662A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003394428A JP2005159662A (ja) 2003-11-25 2003-11-25 画像処理装置、画像処理プログラム及び画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003394428A JP2005159662A (ja) 2003-11-25 2003-11-25 画像処理装置、画像処理プログラム及び画像処理方法

Publications (1)

Publication Number Publication Date
JP2005159662A true JP2005159662A (ja) 2005-06-16

Family

ID=34720500

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003394428A Pending JP2005159662A (ja) 2003-11-25 2003-11-25 画像処理装置、画像処理プログラム及び画像処理方法

Country Status (1)

Country Link
JP (1) JP2005159662A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007049328A (ja) * 2005-08-09 2007-02-22 Nec Electronics Corp 画像情報読取装置、携帯端末及び画像情報読取方法
CN102663360A (zh) * 2012-03-30 2012-09-12 中南大学 一种钢铁板坯编码自动识别方法以及钢铁板坯跟踪系统
CN105786016A (zh) * 2016-03-31 2016-07-20 深圳奥比中光科技有限公司 无人机以及rgbd图像的处理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007049328A (ja) * 2005-08-09 2007-02-22 Nec Electronics Corp 画像情報読取装置、携帯端末及び画像情報読取方法
CN102663360A (zh) * 2012-03-30 2012-09-12 中南大学 一种钢铁板坯编码自动识别方法以及钢铁板坯跟踪系统
CN105786016A (zh) * 2016-03-31 2016-07-20 深圳奥比中光科技有限公司 无人机以及rgbd图像的处理方法
CN105786016B (zh) * 2016-03-31 2019-11-05 深圳奥比中光科技有限公司 无人机以及rgbd图像的处理方法

Similar Documents

Publication Publication Date Title
JP5528121B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US8977066B2 (en) Image compression using sub-resolution images
US8331671B2 (en) Image processing apparatus and image encoding method related to non-photo image regions
US8655085B2 (en) Burst mode image compression and decompression
KR101332912B1 (ko) 화상 처리 장치, 화상 처리 방법 및 컴퓨터 판독가능 저장 매체
JP2005141758A (ja) Jpeg2000圧縮領域からの文書の検索及び類似度マッチングのための特徴を生成する方法、装置及び製造物品
JP2002027256A (ja) 多様な圧縮率制約を受ける画質制御によるデジタル・ドキュメントの圧縮方法
JP2007074030A (ja) 画像処理装置及び方法
JP2007158510A (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US20180324438A1 (en) Method, device, and computer-readable medium for compressing image
JP4708888B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
JP2008028717A (ja) 画像処理装置および方法、プログラム
JP4364809B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP3938534B2 (ja) 画像処理装置及び方法、画像形成装置、並びにプログラム
CN1453724A (zh) 墨滴群集显式表示的二级图像压缩
JP2005012768A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
US20030016875A1 (en) Image encoder, image encoding method, recording medium and computer data signal embodied in a carrier wave
JP2010146218A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2007306560A (ja) 文書画像データのページ境界の処理方法
Berkner et al. SmartNails: display-and image-dependent thumbnails
JP2002158982A (ja) 画像処理方法、装置及びコンピュータ可読媒体
JP2005159662A (ja) 画像処理装置、画像処理プログラム及び画像処理方法
US8270722B2 (en) Image processing with preferential vectorization of character and graphic regions
JP4375782B2 (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP2008147712A (ja) 画像処理装置および画像処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060726

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080227

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080716