JP2005159662A

JP2005159662A - 画像処理装置、画像処理プログラム及び画像処理方法

Info

Publication number: JP2005159662A
Application number: JP2003394428A
Authority: JP
Inventors: Fumihiro Hasegawa; 史裕長谷川; Toshio Miyazawa; 利夫宮澤; Hideaki Yamagata; 秀明山形; Toshifumi Yamaai; 敏文山合; Toshihiro Suzuki; 俊博鈴木
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2003-11-25
Filing date: 2003-11-25
Publication date: 2005-06-16

Abstract

【課題】文書画像にとり重要な文字情報の符号化による画像品質の低下を抑えながら全体として圧縮効果を高めること。
【解決手段】取得した原文書画像から文字の属性をもつ領域を抽出し、得た文字領域情報を基にＪＰＥＧ２０００の符号化方式により文字領域に対して多く、他の領域には少なく符号量を割り当て（Ｓ１０３）、符号化を行う。符号化された画像データをファイル化し管理可能な形で保存場所に蓄積したり、通信インターフェイスを介して転送する。
【選択図】図１

Description

本発明は、文書画像を登録、管理する文書管理システムなどに利用される入力画像の処理装置に関し、視認性の低下を抑えながら圧縮保存する処理及び検索用のデータを付加する処理を行う画像処理装置、画像処理プログラム及び画像処理方法に関する。

大量の紙文書の保管に要するスペースや利用時の文書管理にかかるコストを低減させるために、紙文書を電子画像としてファイル化し、管理するシステムは既に様々な形態の文書管理システムとして実現されている。身近な例としては、文書画像を電子ファイルとしてハードディスクなどの大容量を持つ記録媒体に蓄積し、ユーザーからの呼び出しに応じて画面表示したり、印刷を行うことができるようなシステムがある。
一般に、画像はファイルサイズが大きいため、文書を大量に蓄積するとハードディスクの容量が不足し勝ちになる。また、ネットワーク上にハードディスクを置き、これをネットワーク越しに複数の端末から共通利用する場合には、ファイルサイズの大きさがレスポンスタイムの低下を招くことがある。こうした事態を回避するために、画像に圧縮をかけることによりデータ量を小さくして、ファイルを保存する記録媒体にできるだけ多くのファイルが蓄積できるようにし、またネットワークにおけるデータの転送量をできるだけ少なくするような方法を適用している。
この場合、静止画像に対して圧縮をかけることができる方式として知られているＪＰＥＧなどを用いて、画像ファイルのサイズを小さくしている。ＪＰＥＧは、一般的で優れた圧縮方法ではあるが、画像全体を一律に圧縮するので圧縮率はそれほど大きくない。
一律に圧縮することによる画像全体の圧縮率の低下を改善し、画像の圧縮率を高めるために提案された従来技術として、下記特許文献１を挙げることができる。特許文献１には、画像の内容に合わせた符号化（圧縮）方法を適用するものである。即ち、画像を重要度の高低により領域分割し、クラスが低いと判断された領域には符号の発生量を抑えることで、圧縮効率を高めている。ただし、この例は動画を対象にしたものであり、領域分割の判断とクラスの判断をエッジ、テクスチャ解析、或いは画像の動きデータによって行うものを提案している。

ところで、電子ファイルとして蓄積する文書画像を管理する場合に、蓄積ファイルに検索キー（例えばキーワード）等の管理情報を付与して登録し、検索や管理に利用するという方法が一般的に採用されている。こうした検索キー等の管理情報の付与は、ファイル作成時に手入力によって行う場合もあるが、手間の掛かる作業であり、この作業を自動的に行うための提案がなされており、下記特許文献２にその例を示すことができる。特許文献２には、スキャナ読み取りした文書画像中から文字認識によりタイトル等の文字コード列を取得し、それを文書画像に対応付けて管理テーブルに登録することにより、タイトルによって文書画像の検索を可能とする文書画像処理装置が示されている。
特開２００１−０４５４９４号公報特開２００１−０３４７６３号公報

しかしながら、画像の圧縮率を高めるために提案された上記特許文献１に示す従来技術は動画を対象としたものであり、文書画像にそのままは適用できない。例えば、文書画像は文字がもっとも重要な情報であるため、この領域だけに多くの符合を割こうとしても、上記特許文献１のように単にエッジを頼りに領域分割すると、比較的強いエッジを持つ写真部などにも多くの符号が割かれ、圧縮効率が低下する。また、テクスチャ解析は、文字そのものには規則的なパターンがないので、これを用いて文字領域を検出することはできない。さらに、画像の動きを用いた方法も、静止画である文書画像には適用できない。
また、蓄積ファイルに検索キー等の管理情報を自動付与する上記特許文献２に示す従来技術は、ファイルサイズの長大化を抑制するという点を考慮していないので、タイトル抽出したあとの文書画像にさらにタイトル情報を付すので、ファイルサイズはさらに大きくなってしまう。
本発明は、上記した従来技術の問題点に鑑み、これを解決するためになされたもので、その解決課題は、文書画像にとって重要な文字情報の符号化による視認性（画像品質）の低下を抑えながら全体として圧縮効果を高めることにある。また、符号化により文書画像のデータ圧縮を行う際に、ファイルサイズの長大化の抑制を図りながら検索キー等の管理情報を付与することにある。

請求項１の発明は、設定を可変とした符号量で文書画像を符合化することが可能な画像処理装置であって、文書画像から文字属性をもつ領域を抽出する手段と、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当てる手段と、割り当てた符合量に応じて各領域の画像を符号化する手段を備えたことを特徴とする画像処理装置である。
請求項２の発明は、設定を可変とした符号量で文書画像を符合化することが可能な画像処理装置であって、文書画像に予め設定されている文字記入領域情報を取得する手段と、取得した文字記入領域情報に示される領域に他の領域より多くの符合量を割り当てる手段と、割り当てた符合量に応じて各領域の画像を符号化する手段を備えたことを特徴とする画像処理装置である。
請求項３の発明は、請求項１又は２に記載された画像処理装置において、符号化された文書画像にテキストデータを付加する手段を備えたことを特徴とするものである。
請求項４の発明は、請求項３に記載された画像処理装置において、対象とする文書画像をテキストデータとして文字認識処理する手段を備え、前記符号化された文書画像に付加する手段に用いるテキストデータが文字認識により得たデータであることを特徴とするものである。
請求項５の発明は、対象とする文書画像から文字属性をもつ領域を抽出する処理手順と、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当て、符合量を調整する処理手順と、割り当てた符合量に応じて各領域の画像を符号化する処理手順をコンピュータに実行させるためのプログラムである。
請求項６の発明は、対象とする文書画像に予め設定されている文字記入領域情報を取得する処理手順と、取得した文字記入領域情報に他の領域より多くの符合量を割り当て、符合量を調整する処理手順と、割り当てた符合量に応じて各領域の画像を符号化する処理手順をコンピュータに実行させるためのプログラムである。
請求項７の発明は、請求項５又は６に記載されたプログラムにおいて、符号化された文書画像にテキストデータを付加する処理手順を実行させるためのプログラムを備えたことを特徴とするプログラムである。
請求項８の発明は、請求項７に記載されたプログラムにおいて、対象とする文書画像をテキストデータとして文字認識する処理手順を実行させ、得られるデータを符号化された文書画像に付加する前記テキストデータとすることを特徴とするプログラムである。
請求項９の発明は、対象とする文書画像から文字属性をもつ領域を抽出するステップと、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当て、符合量を調整するステップと、割り当てた符合量に応じて各領域の画像を符号化するステップを有する画像処理方法である。

（１）請求項１，２，５，６，９の発明によると、文字属性をもつ領域に他の領域より多くの符合量を割り当てる符合量の調整をして各領域の画像を符号化するようにしたので、文字情報の符号化による画像品質（視認性）の低下を抑えながら全体として圧縮効果を高めることが可能になる。
（２）請求項３，４，７，８の発明によると、符号化された文書画像にテキストデータを付加することにより、ファイルサイズの長大化の抑制を図りながら検索キー等の管理情報を付与することによりファイル管理機能が高度化され、しかも文字認識処理を組み込むことにより自動的に管理情報が付与され、さらに利便性の向上を図ることが可能になる。

本発明を添付する図面とともに示す以下の実施形態に基づき説明する。なお、下記実施形態においては、実施形態１では符号量調整方式による画像の符号化処理に関して、実施形態２では符号化に合わせて文書画像へテキストデータを付加する処理について、又実施形態３ではコンピュータを利用した実施形態について説明する。
「実施形態１」
本実施形態は、処理対象となる文書画像中の最も大切な情報は文字であるという前提で、文書画像を符号化して圧縮をかける処理を行う際に、文字領域に多くの符号を割り当てることで、この領域の復号画像における視認性（画像品質）の低下を抑制し、文字領域以外の領域への符合の割り当てを少なくして全体の圧縮効率を高めることを意図するものである。
カラー画像は特にファイルサイズが大きいので圧縮することが求められる。見栄えをあまり落とさずにファイルサイズを小さくするために、本実施形態ではＪＰＥＧ２０００（カラー静止画の標準）に規定される方式による圧縮を用いる。ＪＰＥＧ２０００が規定する方式はウェーブレット変換を用いて画像を符号化し、データを圧縮するものであるが、そのときに特定の画像領域に符号を多く割り当て、別の領域に割り当てる符号を減らす調整が可能である。符号が多く割り当てた部分は高品質の画像が得られるので、大切な場所に多くの符号を割り当てれば画質とファイルサイズの面で効率的な圧縮が可能となる。

図３は、文書画像に上記したＪＰＥＧ２０００の符号量調整方式による符号化（圧縮）を行う際の処理過程を説明し、符号量調整の効果を示す概念図である。この例は、多くの符合量を割り当てる特定の領域を文字領域（図中、破線で枠囲いをした領域）として、原画像に符号量調整方式による符号化（圧縮）を行っている。圧縮された画像を復号化したときには、符号量調整の結果として、文書画像中の文字領域は高品質を保持するが、文字以外の写真イメージ等が低品質になって表れることを示している。この場合、品質の低い部分は文書としてあまり重要でない部分であるとしてので、画像全体としての価値が下がることはなく、それよりも重要度の高い部分を高品質に保ったまま、ファイルサイズを小さくできるメリットが大きい。
特定の領域に多くの符合量を割り当てることを可能にするこの符号量調整方式を用いる場合に、領域を特定する必要があり、本例では文字領域を特定の領域とするので、文書画像中の文字領域の位置情報を得る。文字領域の位置情報を得る方法としては、原文書画像を解析し、解析結果から文字領域を特定する方法を用いることが可能である。また、文書が定型のアンケート用紙などの場合には、アンケートの記入欄の場所が予め規定されており、情報として重要な場所はこの記入欄である。そこで、画像解析によらずに規定された記入欄の情報を予め保存しておき、この情報をもとに処理時に条件設定を行う方法を用いることによって、実施することも可能である。

図１は、本実施形態に係る画像処理フローを示すチャートであり、図２は、本実施形態に係る画像処理装置の構成を示すブロック図である。
先ず、図２を参照して本実施形態に係る画像処理装置の構成を説明すると、画像取得手段１０１は、処理対象の原文書画像を取得、格納しておく手段（例えば、カラー画像データを出力するスキャナ、撮像装置などの原稿読み取り装置或いは読み取り画像データを受信する手段により実施し得る）であり、画像取得手段１０１で取得した原画像データを特定属性領域抽出手段１０２と、符号化手段１０４とに送出する。
特定属性領域抽出手段１０２は、本例では文書画像を解析して文字領域を特定する手段で、ここで得られる領域情報は符合量割り当て手段１０３に送出される。なお、文書が定型で、文字欄等の文字領域が規定されている場合には、特定属性領域抽出手段１０２に代わる手段として、装置が予め保持している文字記入欄の領域データを取り出して、設定する操作を行う手段で置き換えることにより実施することが可能である。
符合量割り当て手段１０３は、特定属性領域抽出手段１０２から受け取る文字領域情報に基づいて、文字領域にそれ以外の領域よりも多くの符合量を割く符合量の割り当て行い、割り当てた符合量の設定を符号化手段１０４に送出する。
符号化手段１０４は、画像取得手段１０１から受け取る文書画像を符合量割り当て手段１０３が各領域に割り当てた符合量に従って符号化し、符号化した文書画像データを格納する。

次に、本実施形態に係る画像処理手順を図１のフローチャートを参照して説明する。なお、以下の説明は、上記画像処理装置の動作説明を兼ねる。
図１のフローによると、まず、処理対象となる原文書画像を画像取得手段１０１によって取得する（ステップＳ１０１）。なお、ここで取得される画像は、ＲＧＢ３色の色成分を持つカラー画像とする。
次に、取得した原文書画像から特定属性領域抽出手段１０２によって文字領域等の特定の属性をもつ領域を抽出する（ステップＳ１０２）。本例のように、属性が文字領域の場合は、文字認識処理の前処理として行われる既存の文字領域識別技術を適用することができる。上記した文字領域識別技術は、例えば、同色とみなせる画素、或いは黒画素をランとして抽出し、それらの連結成分を求め、得た連結成分を文字候補とみなして近接する連結成分同士を統合して文字行を生成する、といった方法によって文字領域の抽出を行う（例えば、特開２００２−２８８５８９号公報、特開平６−２００９２号公報、参照）。また、アンケートの文字記入欄などの文字記入領域の場合は、記入領域情報が既知量として扱えるので、その情報を別に持っておき、使用時に取り出して、設定する操作を行う手段により文字領域情報を得る。

この後、得られた文字領域情報に基づき符合量割り当て手段１０３によって符号量の割り当てを行う（ステップＳ１０３）。ＪＰＥＧ２０００に準拠する方式では、画像全体の符合量が設定できる上に、設定枠の中で画質を低下させたくない特定の領域に対して他の領域に対するよりも多くの符合量を割り当てる調整が可能である。特定の領域情報を前段の抽出ステップＳ１０２により得ているので、この領域情報から領域の大きさを求め、特定領域以外の領域の大きさとを対比し、その結果をもとにそれぞれの領域に対し割り当てる符合量を決める。
本例では、文字領域に対して多くの符号を割り当てるので、その分、他の領域に割り当てる符号は減ることになる。なお、ここでは特定属性をもつ領域には多くの符号を割り当てたが、逆に少ない符号量を割り当てるという方法をとるようにしても良い。例えば、特定領域としてノイズばかりの領域が抽出された場合には、ここには符号量をあまり割かず、ノイズ領域以外の他の部分に多くの符合量を割くことで、圧縮の効率を上げることも可能である。
符合量の割り当てを行った後、ＪＰＥＧ２０００に準拠する符号化手段１０４によって符号化を行う（ステップＳ１０４）。ＪＰＥＧ２０００による符号化は、ウェーブレット変換を用いて割り当てた符合量に従い各々の領域の画像データを圧縮する。文字領域に対して多くの符号を割り当てるので、他の領域はその分だけ符合量の割り当てが少なく圧縮率が高い。
符号化の終了後、符号化された画像データにファイルとして扱うために必要な処理を施して管理可能な形態で保存場所に蓄積したり、或いは通信インターフェイスを介して利用側に転送するための出力を行う（ステップＳ１０５）。

「実施形態２」
本実施形態は、処理対象となる文書画像を符号化して圧縮をかける処理を行う際に、ファイルサイズの長大化の抑制を図りながら検索キー等の管理情報を付与することを意図するものである。即ち、上記「実施形態１」に示したＪＰＥＧ２０００等の符号量調整方式による符号化（圧縮）を行う際の処理過程に加えて、検索キーとして利用可能なテキストデータを符号化（圧縮）された画像データに付与する処理を行うことにより、この意図を実現するものである。
本実施形態に示すＪＰＥＧ２０００に準拠する符号化では、約６５ＫＢの任意のデータでコメント挿入が可能なデータ構成をとっているので、ここにテキストデータを付加することによりこれを管理情報として用いるが可能となる。付加するテキストデータは、下記の実施形態に示すように、文字認識手段によって対象とする文書画像を文字認識処理して得られたデータを付加することにより、自動化が可能である。なお、付加するテキストデータの入力の方法として、ユーザーが原画像を見ながら手入力する方法によって行っても良い。テキストデータを付加することにより、キーワードによる検索も可能になり、大量の文書画像を保管している場合に所望のものを探し出す場合に便利である。

図４は、本実施形態に係る画像処理フローを示すチャートであり、図５は、本実施形態に係る画像処理装置の構成を示すブロック図である。
図５を参照して本実施形態に係る画像処理装置の構成を説明すると、画像取得手段２０１は、処理対象の原文書画像を取得、格納しておく手段（例えば、カラー画像データを出力するスキャナ、撮像装置などの原稿読み取り装置或いは読み取り画像データを受信する手段により実施し得る）であり、画像取得手段２０１で取得した原画像データを特定属性領域抽出手段２０２と、符号化手段２０４と、文字認識手段２０５とに送出する。
特定属性領域抽出手段２０２は、符合量の割り当てに使用する領域を特定するために文書画像の属性を解析しその属性を持つ領域を抽出する手段である。本例では文字属性を持つ領域を抽出する手段であり、得られる文字領域データは符合量の割り当てに使用されるが、文字認識処理の前処理としも共通に用いる。従って、ここで得られる領域情報は符合量割り当て手段２０３と、文字認識手段２０５とに送出する。なお、文書が定型で、文字記入欄等の領域が規定されている場合には、特定属性領域抽出手段２０２に代わる手段として、装置に予め保持しておいた文字記入欄の領域データを取り出して、設定する操作を行う手段で置き換えることにより実施することが可能である。
符合量割り当て手段２０３は、特定属性領域抽出手段２０２から受け取る文字領域情報に基づいて、文字領域とそれ以外の領域について各領域の大きさに応じた符合量の割り当て行い、割り当てた符合量の設定を符号化手段２０４に送出する。
符号化手段２０４は、画像取得手段２０１から受け取る文書画像を符合量割り当て手段２０３が各領域に割り当てた符合量に従って符号化し、符号化したデータをテキストデータ付加手段２０６に送出する。
文字認識手段２０５は、画像取得手段２０１と特定属性領域抽出手段２０２から受け取る文書画像と文字領域情報をもとに文字認識処理を行い、認識結果として得たテキストデータをテキストデータ付加手段２０６に送出する。
テキストデータ付加手段２０６は、文字認識手段２０５からのテキストデータを符号化手段２０４から受け取る符号化した文書画像データに付加し、この処理を終えた文書画像データを格納する。

次に、本実施形態に係る画像処理手順を図４のフローチャートを参照して説明する。なお、以下の説明は、上記した画像処理装置（図５）の動作説明を兼ねる。
図４のフローによると、まず、処理対象となる原文書画像を画像取得手段２０１によって取得する（ステップＳ２０１）。なお、ここで取得される画像は、ＲＧＢ３色の色成分を持つカラー画像とする。
次に、符号量の調整を行う領域情報を得るために、前段で取得した原文書画像から特定属性領域抽出手段１０２によって文字領域等の特定の属性をもつ領域を抽出する（ステップＳ１０２）。本例では、属性が文字領域であるから、文字認識処理の前処理として行われる文字領域識別技術を適用し、本例ではその結果を文書画像に付加するテキストデータを得るために行う後段の文字認識にも用いるようにする。
ここで適用する文字領域識別技術は、例えば、同色とみなせる画素、或いは黒画素をランとして抽出し、それらの連結成分を求め、得た連結成分を文字候補とみなして近接する連結成分同士を統合して文字行を生成する、といった方法によって文字領域の抽出を行う（例えば、特開２００２−２８８５８９号公報、特開平６−２００９２号公報、参照）。また、アンケートの記入欄などの文字記入領域の場合は、記入場所が既知量として扱えるので、その情報を別に持っておき、使用時に取り出して、設定する操作を行う手段により文字領域情報を得るようにしても良い。

次に、文字認識手段２０５により、前段で得られた文字領域情報をもとにその領域に含まれる画像情報から文字を認識する処理を行い、認識結果として得た文字・文字列をテキストデータとして表現する（ステップＳ２０３）。ここで用いる文字認識技術は、基本的には対象領域から文字とみなせる画像を切り出し、辞書と照合することにより文字を認識し、対応するテキストデータへの変換を行う既存の技術を適用することにより実現可能である。
ただし、本実施形態では認識した文字はテキストデータとして処理対象の文書画像に付加して、文書の検索、管理情報として用いるという目的があり、またＪＰＥＧ２０００に準拠する符号化方式のデータ構成におけるコメント挿入箇所を用いるという制約条件を考慮して、一定のデータ量で文書が識別できる例えばタイトルのような文字列を選ぶと良い。なお、特定属性領域抽出手段２０２で得られる領域情報が予め設定された文字記入欄である場合は、この領域情報を利用して文字認識処理をおこなう原画像内の範囲を限定することができ、処理の高速化や不要なテキストが付加されるのを防止することに有効である。
また、この文字認識ステップは、後段のテキスト付加ステップまでに行えば良いので、符号化ステップの後に行うような手順でもかまわない。

この後、ステップＳ２０２で得られた文字領域情報に基づき符合量割り当て手段２０３によって符号量の割り当てを行う（ステップＳ２０４）。ＪＰＥＧ２０００に準拠する方式では、画像全体の符合量が設定できる上に、設定枠の中で画質を低下させたくない特定の領域に対して他の領域に対するよりも多くの符合量を割り当てる調整が可能である。特定の領域情報を前段の抽出ステップＳ２０２により得ているので、この領域情報から領域の大きさを求め、特定領域以外の領域の大きさとを対比し、その結果をもとにそれぞれの領域に対し割り当てる符合量を決める。
本例では、文字領域に対して多くの符号を割り当てるので、その分、他の領域に割り当てる符号は減ることになる。なお、ここでは特定属性をもつ領域には多くの符号を割り当てたが、逆に少ない符号量を割り当てるという方法をとるようにしても良い。例えば、特定領域としてノイズばかりの領域が抽出された場合には、ここには符号量をあまり割かず、ノイズ領域以外の他の部分に多くの符合量を割くことで、圧縮の効率を上げることも可能である。
符合量の割り当てを行った後、ＪＰＥＧ２０００に準拠する符号化手段２０４によって符号化を行う（ステップＳ２０５）。ＪＰＥＧ２０００による符号化は、ウェーブレット変換を用いて割り当てた符合量に従い各々の領域の画像データを圧縮する。文字領域に対して多くの符号を割り当てるので、他の領域はその分だけ符合量の割り当てが少なく圧縮率が高い。

符号化の終了後、テキストデータ付加手段２０６によって、符号化された画像データにステップＳ２０３で得た文字・文字列のテキストデータを付加する（ステップＳ２０６）。本実施形態ではＪＰＥＧ２０００により符号化された画像のデータフォーマットにおけるコメント挿入箇所を用いてこのテキストデータの付加を行う。
テキストデータを付加した後、符号化された画像にはファイルとして扱うために必要となる処理が施され、管理可能な形態で保存場所に蓄積したり、或いは通信インターフェイスを介して利用側に転送するための出力を行う（ステップＳ２０７）。

「実施形態３」
本実施形態は、符号量調整方式による符号化（圧縮）を行う上記実施形態１、２に示した画像処理フローにおける処理手順を実行させる手段として、汎用のコンピュータを利用した実施形態を示すものである。
図６は、本実施形態の処理装置の構成を示す。図６に示すように、本実施形態は、汎用の処理装置（コンピュータ）により実施する例を示すものであり、構成要素としてＣＰＵ４０１、メモリ４０２、ハードディスクドライブ４０３、入力装置４０４、ＣＤ−ＲＯＭドライブ４０５、ディスプレイ４０６、マウスなどを用意する。また、ＣＤ−ＲＯＭドライブ４０５が用いるＣＤ−ＲＯＭなどの記録媒体４０７には、上記実施形態１、２に示した画像を処理する手段が有する処理機能を実現させ、或いは画像処理フローに示した処理手順を実行するためのプログラム（ソフトウェア）が記録されている。
処理対象の文書画像は、スキャナー等の入力装置４０４により入力され、例えばハードディスク４０３などに格納され、そこから取り出されて上記画像処理を施された後に再びハードディスク４０３に保存される。ＣＰＵ４０１は、記録媒体４０７から上記した処理機能、手順を実現するプログラムを読み出し、プログラムに従って符号量調整方式による符号化（圧縮）処理を対象文書画像に実行する。また、ハードディスク４０３に保存された画像は、ディスプレイ４０６に出力することにより、処理結果を確認することが可能である。

本発明に係る画像処理フロー（実施形態１）を示すチャートである。本発明に係る画像処理装置（実施形態１）の構成を示すブロック図である。文書画像にＪＰＥＧ２０００の符号化を行う際の処理過程を説明し、符号量調整の効果を示す概念図である。本発明に係る画像処理フロー（実施形態２）を示すチャートである。本発明に係る画像処理装置（実施形態２）の構成を示すブロック図である。汎用コンピュータを利用した実施形態を示す。

符号の説明

１０１，２０１・・・画像取得手段、１０２，２０２・・・特定属性領域抽出手段、
１０３，２０３・・・符合量割り当て手段、１０４，２０４・・・符号化手段、
２０５・・・文字認識手段、２０６・・・テキストデータ付加手段、
４０１・・・ＣＰＵ、４０２・・・メモリ、
４０３・・・ハードディスクドライブ、４０４・・・入力装置、
４０５・・・ＣＤ−ＲＯＭドライブ、４０６・・・ディスプレイ、
４０７・・・記録媒体。

Claims

設定を可変とした符号量で文書画像を符合化することが可能な画像処理装置であって、文書画像から文字属性をもつ領域を抽出する手段と、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当てる手段と、割り当てた符合量に応じて各領域の画像を符号化する手段を備えたことを特徴とする画像処理装置。
設定を可変とした符号量で文書画像を符合化することが可能な画像処理装置であって、文書画像に予め設定されている文字記入領域情報を取得する手段と、取得した文字記入領域情報に示される領域に他の領域より多くの符合量を割り当てる手段と、割り当てた符合量に応じて各領域の画像を符号化する手段を備えたことを特徴とする画像処理装置。
請求項１又は２に記載された画像処理装置において、符号化された文書画像にテキストデータを付加する手段を備えたことを特徴とする画像処理装置。
請求項３に記載された画像処理装置において、対象とする文書画像をテキストデータとして文字認識処理する手段を備え、前記符号化された文書画像に付加する手段に用いるテキストデータが文字認識により得たデータであることを特徴とする画像処理装置。
対象とする文書画像から文字属性をもつ領域を抽出する処理手順と、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当て、符合量を調整する処理手順と、割り当てた符合量に応じて各領域の画像を符号化する処理手順をコンピュータに実行させるためのプログラム。
対象とする文書画像に予め設定されている文字記入領域情報を取得する処理手順と、取得した文字記入領域情報に他の領域より多くの符合量を割り当て、符合量を調整する処理手順と、割り当てた符合量に応じて各領域の画像を符号化する処理手順をコンピュータに実行させるためのプログラム。
請求項５又は６に記載されたプログラムにおいて、符号化された文書画像にテキストデータを付加する処理手順を実行させるためのプログラムを備えたことを特徴とするプログラム。
請求項７に記載されたプログラムにおいて、対象とする文書画像をテキストデータとして文字認識する処理手順を実行させ、得られるデータを符号化された文書画像に付加する前記テキストデータとすることを特徴とするプログラム。
対象とする文書画像から文字属性をもつ領域を抽出するステップと、抽出された文字属性をもつ領域に他の領域より多くの符合量を割り当て、符合量を調整するステップと、割り当てた符合量に応じて各領域の画像を符号化するステップを有する画像処理方法。