JP5264675B2

JP5264675B2 - 画像処理装置及び画像処理方法

Info

Publication number: JP5264675B2
Application number: JP2009241811A
Authority: JP
Inventors: 真明安永; 淳田畑; 俊一女川; 浩樹菅野
Original assignee: Toshiba Corp; Toshiba TEC Corp
Current assignee: Toshiba Corp; Toshiba TEC Corp
Priority date: 2008-10-20
Filing date: 2009-10-20
Publication date: 2013-08-14
Anticipated expiration: 2029-10-20
Also published as: JP2010098744A

Description

本発明は、画像圧縮技術に関わり、特にビットマップを辞書化して圧縮する技術に関する。

従来、２値画像を効率よく圧縮するために、画像ビットマップを辞書化してインデックス（該当辞書番号とその配置）と辞書を圧縮データとする方式を標準化したものとしてＪＢＩＧ２があった。一方、ＯＣＲを圧縮に適用する際に、ＯＣＲ結果の確からしさに応じて画像処理や信号変換・可逆・非可逆を切り替えたり（特許文献１）、辞書圧縮においてＯＣＲの文字単位でビットマップを辞書化したり（特許文献２）、表があったりＯＣＲで特定の文字があれば変換するファイルフォーマット（ＣＳＶ、ハイパーリンク）を変更したりする（特許文献３）技術が開示されている。

しかしながら、ＯＣＲを圧縮に適用した方式では、情報そのものの重要度という概念が無いため、重要な情報がＯＣＲ・圧縮画像双方から欠落するおそれがある。

本発明の目的は、情報に応じた圧縮が可能な画像処理装置及び画像処理方法を提供することにある。

本発明の一実施形態に係る画像処理装置は、入力画像を分析する分析手段と、前記分析手段の分析結果に基づき第１のグループに属する第１の画像を第１の圧縮率で圧縮し、第２のグループに属する第２の画像を前記第１の圧縮パラメータより画像劣化をする可能性のある第２の圧縮パラメータで圧縮する圧縮手段と、を備える。なお、圧縮パラメータは、圧縮方法や劣化具合を設定できるパラメータとする。

本発明の一実施形態に係る画像処理方法は、入力画像を分析し、分析結果に基づき第１のグループに属する第１の画像を第１の圧縮パラメータで圧縮し、第２のグループに属する第２の画像を前記第１の圧縮パラメータより画像劣化をする可能性のある第２の圧縮パラメータで圧縮する。

本発明によれば、情報に応じた圧縮が可能な画像処理装置及び画像処理方法を提供できる。

本発明の実施形態１−１に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。レイアウト解析部１００２の概略構成の一例を示すブロック図である。レイアウト解析部１００２の動作の一例を示す図である。画像部品化部１００３の概略構成の一例を示す図である。部品画像算出の一例を示す図である。文字認識部１００４の概略構成の一例を示す図である。文字分析部１００５の概略構成の一例を示す図である。画像辞書化部１００６の概略構成の一例を示す図である。キーワードＴＡＢＬＥ１００５−２の一例を示す図である。パラメータＴＡＢＬＥ１００６−３の一例を示す図である。本発明の実施形態１−２に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。文字分析部１００５Ａの概略構成の一例を示す図である。キーワードＴＡＢＬＥ１００５Ａ−２のＴＡＢＬＥデータの一例を示す図である。本発明の実施形態２−１に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。レイアウト解析部２００２の概略構成の一例を示すブロック図である。オブジェクト属性判定部２００２−４の動作を除いた領域検出動作の一例を示す図である。オブジェクト属性判定部２００２−４の概略構成の一例を示す図である。オブジェクト判定データの一例を示す図である。オブジェクトの属性判定動作の一例を示す。画像部品化部２００３の概略構成の一例を示す図である。部品画像算出の一例を示す図である。画像辞書化部２００４の概略構成の一例を示す図である。オブジェクト属性情報２０１２とマッチングパラメータ２００４−５との関係を示す図である。本発明の実施形態２−２に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。レイアウト解析部２００２Ａの概略構成の一例を示す図である。白地、非白地判定の一例を示す図である。画像辞書化部２００４Ａの概略構成の一例を示す図である。非白地を準可逆、白地を非可逆にする例を示す図である。白地上の文字に比べて、非白地上の文字が不安定になり易いことを示す図である。本発明の実施形態２−３に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。画像辞書化部２００４Ｂの概略構成の一例を示す図である。入力画像の一例を示す図である。図３１に示す入力画像に対応した辞書情報の一例を示す図である。入力画像の一例を示す図である。図３３に示す入力画像の先頭文字で圧縮し、この入力画像を復元した画像の一例を示す図である。図３３に示す入力画像の中の最適文字で圧縮し、この入力画像を復元した画像の一例を示す図である。本発明の実施形態３−１に係る画像処理装置による圧縮処理の概念を示す図である。本発明の実施形態３−１に係る画像処理装置の詳細構成の一例を示す図である。本発明の実施形態３−１に係る画像処理装置の全体構成の一例を示す図である。本発明の実施形態３−１に係る圧縮処理の一例を示す図である。入力画像の一例を示す図である。図４０に示す入力画像に対応した辞書バッファの状態１を示す図である。図４０に示す入力画像に対応した辞書バッファの状態２を示す図である。図４０に示す入力画像に対応した辞書バッファの状態３を示す図である。図４０に示す入力画像に対応した辞書バッファの状態４を示す図である。図４０に示す入力画像に対応した辞書バッファの状態５を示す図である。図４０に示す入力画像の先頭文字で圧縮し、この入力画像を復元した画像の一例を示す図である。図４０に示す入力画像の中の最適文字で圧縮し、この入力画像を復元した画像の一例を示す図である。本発明の実施形態３−２に係る画像処理装置の詳細構成の一例を示す図である。本発明の実施形態３−２に係る画像処理装置の全体構成の一例を示す図である。 Symbolの画質向上の一例を示す図である。本発明の実施形態４に係る画像処理装置の概略構成を示す図である。本発明の実施形態４に係る画像処理装置の復号手段による復号処理のイメージを示す図である。本発明の実施形態４−１に係る画像処理装置の詳細構成の一例を示す図である。本発明の実施形態４−１に係る画像処理装置の全体構成の一例を示す図である。本発明の実施形態４−１に係る圧縮処理の一例を示す図である。図４０に示す入力画像に対応した辞書バッファの状態１を示す図である。図４０に示す入力画像に対応した辞書バッファの状態２を示す図である。図４０に示す入力画像に対応した辞書バッファの状態３を示す図である。図４０に示す入力画像に対応した辞書バッファの状態４を示す図である。図４０に示す入力画像に対応した辞書バッファの状態５を示す図である。図４０に示す入力画像に対応した辞書バッファの状態６を示す図である。図４０に示す入力画像を圧縮し復元した画像の一例を示す図である。本発明の実施形態４−２に係る画像処理装置の詳細構成の一例を示す図である。本発明の実施形態４−２に係る画像処理装置の全体構成の一例を示す図である。本発明の実施形態４−２に係る圧縮処理の一例を示す図である。入力画像の一例を示す図である。図６６に示す入力画像を緩い一致条件で圧縮し復元した復元画像の一例を示す図である。図６６に示す入力画像を厳しい一致条件で圧縮し復元した復元画像の一例を示す図である。図６６に示す入力画像を適切な一致条件で圧縮し復元した復元画像の一例を示す図である。本発明の実施形態５−１に係る画像処理装置の全体構成の一例を示す図である。入力画像の一例を示す図である。図７１に示す入力画像の左端の文字の処理結果を示す図である。図７１に示す入力画像の左から２番目の文字の処理結果を示す図である。図７１に示す入力画像の左から３番目の文字の処理結果を示す図である。図７１に示す入力画像の右端の文字の処理結果を示す図である。本発明の実施形態５−１に係る画像処理装置のマッチングパラメータ決定部５００１の詳細を示す図である。本発明の実施形態５−２に係る画像処理装置の全体構成の一例を示す図である。図７１に示す入力画像の左端の文字の処理結果を示す図である。図７１に示す入力画像の左から２番目の文字の処理結果を示す図である。図７１に示す入力画像の左から３番目の文字の処理結果を示す図である。図７１に示す入力画像の右端の文字の処理結果を示す図である。画像圧縮装置の一例を示す図である。テンプレートマッチングの精度向上・高速化に関する技術の一例を説明するための図である。本発明の実施形態６に係る画像処理装置の全体構成の一例を示す図である。補間画像を利用した画像圧縮の一例を示す図である。補間画像を利用した画像圧縮の一例を示す図である。補間画像を利用した画像圧縮の一例を示す図である。

以下、図面を参照し、本発明の実施形態について説明する。

図１は、本発明の実施形態１−１に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。図１に示すように、画像処理装置の画像処理は、制御部１０１９により制御される。スキャナ１００１は、入力画像（原稿画像）に対応した入力画像信号１０１０を出力する。レイアウト解析部１００２は、所定のレイアウト解析技術を用いて、入力画像信号１０１０に含まれたオブジェクトのレイアウトを解析し、オブジェクト配置情報１０１１を出力する。画像部品化部１００３は、所定の画像部品化技術とオブジェクト配置情報１０１１を用いて、画像信号１０１０を部品画像１０１２に変換する。

文字認識部１００４は、所定の文字認識技術を用いて、部品画像１０１２に対応した文字コード１０１３を出力し、文字分析部１００５は、文字コード１０１３から文字分析情報１０１４を算出する。

画像辞書化部１００６は、所定のビットマップ辞書化技術と文字分析情報１０１４を用いて、部品画像１０１２に対応した画像辞書１０１５と辞書インデックス１０１５を出力する。画像符号化部１００７は、画像辞書１０１５と辞書インデックス１０１５に対応した符号データ１０１７を出力する。画像ファイル部１００８は、文字コード１０１３と符号データ１０１７に対応した検索可能圧縮ファイル１０１８を生成する。

図２は、レイアウト解析部１００２の概略構成の一例を示すブロック図である。縮小処理部１００２−１は、入力画像信号１０１０を既定の縮小率で縮小し、縮小画像１００２−４を出力する。連結画素探索部１００２−２は、所定のチェインアルゴリズムで８方向探索して、画素の連結した領域の左上座標、左下座標、右上座標、右下座標である領域情報１００２−５を出力する。領域情報１００２−５の座標は、縮小処理部１００２−１で縮小処理した座標系であるので、領域座標変換部１００２−３は、領域情報１００２−５を、入力画像１０１０と同じ座標系に変換し、オブジェクト配置情報１０１１として出力する。

図３は、レイアウト解析部１００２の動作の一例を示す図である。図３に示すように、入力画像信号１０１０に対応した入力画像の文字領域が一つの塊で部品画像として生成されているのがわかる。

図４は、画像部品化部１００３の概略構成の一例を示す図である。縦方向画素カウント部１００３−１、横方向画素カウント部１００３−２は、オブジェクト配置情報１０１１の座標単位で、画像信号１０１０を分割し、それぞれ縦軸、横軸への画素カウントの射影を算出し、縦方向の射影１００３−６、横方向の射影１００３−７として出力する。比較器１００３−３は、射影値の分散の大きいほうを選択するよう、セレクタ１００３−４を操作するよう制御信号１００３−８を出力する。画素分割部１００３−５は、選択された射影値を用いて、入力画像信号１０１０を分割して部品画像１０１２を出力する。

図５は、部品画像算出の一例を示す図である。画像部品化部１００３は、縦方向の射影１００３−６と横方向の射影１００３−７を比較し、分散の大きい横方向の射影を選択し、画素分割部１００３−５で、射影に対して閾値処理を行うことで、横方向の分割座標を算出し（点線）、図５に示す「Ａ」「Ｂ」「Ｃ」「Ｄ」「Ｅ」…で示された単位で部品画像１０１２として出力する。

図６は、文字認識部１００４の概略構成の一例を示す図である。文字マッチング部１００４−１は、入力された部品画像１０１２を変倍・２値化・特徴量算出などを行い、その特徴量を文字コード辞書１００４−２のデータと比較し、最も一致度が高い辞書の文字コードを文字コード１０１３として出力する。

図７は、文字分析部１００５の概略構成の一例を示す図である。キーワードマッチング部１００５−１は、文字コード１０１３を所定文字数バッファリングして、キーワードＴＡＢＬＥ１００５−２から所定文字数からなるキーワード１００５−３を読み出しマッチングして、キーワードＴＡＢＬＥ１００５−２に登録されているキーワード１００５−３と一致しているかどうかを文字分析情報１０１４として出力する。

図８は、画像辞書化部１００６の概略構成の一例を示す図である。ビットマップマッチング部１００６−１は、上記辞書化の過程で保持したビットマップ１００６−４が登録されているビットマップ辞書１００６−２と、マッチングパラメータ１００６−５が格納されているパラメータＴＡＢＬＥ１００６−３とからデータを受け取る。マッチング部１００６−１は、所定の位置シフトとマッチング処理を組み合せて、部品画像１０１２がビットマップ辞書１００６−２に存在するかどうか判断し、存在すれば、その辞書インデックス（辞書のインデックスと画像上の部品画像の位置情報）１０１６を出力する。マッチング部１００６−１は、対応するビットマップパターンが辞書に無ければ、その部品画像１０１２を辞書に登録してインデックスを付与する。

このマッチング動作時に、文字分析情報１０１４に応じてその属性に応じたマッチングパラメータ１００６−５がパラメータＴＡＢＬＥ１００６−３から読み出されることで、文字の情報レベルに応じた圧縮が行なわれる。なお、キーワードマッチング部１００５−１が所定文字数分バッファリングして文字列として文字情報分析する仕組みであるので、それに連動してビットマップマッチング部１００６−１も部品画像１０１２をバッファリングして、分析結果と連動して処理する構成を取っている。

このようにして、入力原稿の頁内の全オブジェクトに対する辞書化が終了すれば、辞書情報を画像辞書１０１５として出力する。

そして画像符号化部１００７は、画像辞書１０１５を所定の画像圧縮技術（例えばランレングス）で圧縮し、辞書インデックス１０１６と合わせて符号データ１０１７として出力し、画像ファイル部１００８で文字コード１０１３と符号データ１０１７からなる検索可能な圧縮ファイル１０１８を生成する。

図９Ａ及び図９Ｂは、文字分析情報とマッチング精度パラメータの関係の一例を示す図である。図９Ａに示すように、キーワードＴＡＢＬＥ１００５−２には、第１のグループに属する情報が登録される。つまり、キーワードＴＡＢＬＥ１００５−２には、数字とアルファベットを間違い易い”ｏ”、”ｌ”、”０”、”１”と、会社名”ＸＹＺ．ＣｏＬｔｄ”とアルファベット部を数字に間違えた”ＸＹＺ．Ｃ０Ｌｔｄ”が登録されており、夫々文字分析情報１、２、登録外のデータは０となっている。

図９Ｂに示すように、パラメータＴＡＢＬＥ１００６−３では文字分析情報１０１４に応じて
０：非可逆（通常のマッチング精度のパラメータ）
１：準可逆（通常より若干精度を高めた、完全一致に近い結果が得られるパラメータ）
２：可逆（ぴったり一致したもののみを一致したとみなすパラメータ）
となっている。このため、会社名の様な重要な情報は可逆（第１の圧縮パラメータの圧縮）で、数字とアルファベットなどＯＣＲで間違い易いがユーザが見て間違いと判る可能性があるデータは準可逆（第１の圧縮パラメータより画像劣化をする可能性のある第２の圧縮パラメータの圧縮）、それ以外は非可逆（第２の圧縮パラメータより画像劣化をする可能性のある第３の圧縮パラメータの圧縮）と、文字の情報レベルに応じてマッチング精度を変えることで、圧縮による情報の劣化をカバーすると共に高圧縮が実現できる。なお、本例では会社名等もＯＣＲで間違える可能性を考慮して２重に登録している。なお、圧縮パラメータは、圧縮方法や劣化具合を設定できるパラメータとする。

以上により、ＯＣＲの結果から算出される情報のレベルに応じて、圧縮パラメータを制御できるので、画質・情報のバランスの取れた高圧縮ファイルが生成できる。

また、上記実施形態では、圧縮方式は辞書化方式で統一して記述したが、可逆圧縮は辞書マッチングを介さずに、直接圧縮する構成にして圧縮速度を向上する方式を取ることも可能である。

また、文字分析情報はキーワードを元に、有無という単純なルールで構成したが、分析情報の構成としては、例えば”￥”や”＄”という特定のキーワードに続く数字又は数列（長さは不定）というルールを適用すれば、単なる数字でなく金額という概念の情報として制御可能になる。

またＯＣＲでは実際の文字よりも文字数が増減する可能性があるが（例えば”ＸＹＺＣｏＬｔｄ”等）、それらを考慮してキーワード登録をしてより確実性を増すことも可能であるし、ＯＣＲの確からしさ情報を利用して、その様な候補に対するマッチング範囲を制御して高速化することも可能である。

更には、アルファベット等の英字、ひらがな、漢字等の言語種別に応じて、辞書化対象に入れるか、入れないか、マッチング精度変える等の構成や、言語種別において、例えばアルファベットの”ｍ”や”ｎ”の出現頻度多さと間違い易さのバランスで制御することで画質と情報のバランスを考慮した制御を実現できる。

また、画像部品化部で部品化したデータを文字認識、画像辞書化で共通に使用したが両者の対象文字が特定できれば、当然別々の構成を取ることも可能であり、レイアウト解析方法や、文字認識の方法、辞書化や圧縮方法等は本実施形態に限定されるものではなく、パラメータの制御方法・可逆非可逆などの適用方法も本実施形態に限定されるものではない。

図１０は、本発明の実施形態１−２に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。図１０に示す画像処理装置において、実施形態１−１と共通するブロックには、図１の画像処理装置に付与した符号と同一の符号を付与している。

文字分析部１００５Ａ、文字分析部１００５Ａからの出力である文字分析情報１０１４Ａ、画像ファイル部１００８Ａ、検索可能な圧縮ファイル１０１８Ａが、実施形態１−１と若干異なる点である。また、ＭＭＲ圧縮部１００９Ａ、全面圧縮データ１０１９Ａが、追加されている。

図１１は、文字分析部１００５Ａの概略構成の一例を示す図である。キーワードＴＡＢＬＥ１００５Ａ−２が、実施形態１−１と異なる。図１２は、キーワードＴＡＢＬＥ１００５Ａ−２のＴＡＢＬＥデータの一例を示す図である。図１２に示すように文字分析情報１０１４Ａは、０〜３の４レベルで示される。実施形態１−１では０〜２の３レベルであったが、実施形態１−１では０〜３の４レベルである。キーワードＴＡＢＬＥ１００５Ａ−２には、”Confidential”及び、その単語”Confidential”のＯＣＲで間違えるリスクの高いキーワードが登録され、これら登録キーワードに対してレベル３（文字分析情報１０１４Ａ）が設定される。

ＭＭＲ圧縮１００９Ａは、所定の２値圧縮方法で全面２値画像として、画像全体を可逆圧縮し、全面圧縮データ１０１９Ａとして出力する。画像ファイル部１００８Ａは、文字分析情報１０１４Ａが”３”を示したとき以外は、実施形態１−１と同様、符号データ１０１７と文字コード１０１３から検索可能な圧縮ファイル１０１８Ａを生成する。文字分析情報１０１４Ａが”３”を示したときは、全面圧縮データ１０１９Ａと文字コード１０１３から検索可能な圧縮ファイル１０１８Ａを生成する。

以上により、”Confidential等の文書全体が非常に重要である可能性がある文書を情報劣化のリスクのある圧縮方式でなく、劣化の無い圧縮方式で圧縮ファイルを生成できるので、画質と情報のバランスを考慮した圧縮ファイルを提供できる。

以下に、上記した実施形態１−１と１−２についてまとめる。

（１）画像処理装置は、画像を入力する画像入力部と該画像を文字認識し文字情報を出力する文字認識部と、該画像をパラメータで可逆、非可逆等の圧縮性能を制御できる画像圧縮部を持つことを特徴とする画像処理装置であって、該文字情報を分析する文字分析部を持ち、該画像圧縮部は該文字分析結果に応じて圧縮性能を制御する。文字認識結果で圧縮率を制御するので、高画質・高圧縮を実現できる。

（２）画像処理装置は、画像を入力する画像入力部と該画像を文字認識し文字情報を出力する文字認識部と、該画像を部品化し部品画像を出力する画像部品化部と該部品画像を辞書化し画像辞書と該部品画像の辞書インデックスを出力する画像辞書化部と、該画像辞書と該辞書インデックスを符号化する画像符号化部持つことを特徴とする画像処理装置であって、該文字情報を分析する文字分析部を持ち、該画像辞書化部は該文字分析結果に応じて辞書化精度を制御する。文字認識結果で辞書化方式のマッチング度を制御するので、高画質・高圧縮を実現できる。

（３）画像処理装置は、画像を入力する画像入力部と該画像を文字認識し文字情報を出力する文字認識部と、該画像を部品化し部品画像を出力する画像部品化部と該部品画像を辞書化し画像辞書と該部品画像の辞書インデックスを出力するか辞書化せずに独立画像として出力する画像辞書化部と、該画像辞書と該辞書インデックス及び該独立画像を符号化する画像符号化部持つことを特徴とする画像処理装置であって、該文字情報を分析する文字分析部を持ち、該画像辞書化部は該文字分析結果に応じて画像辞書か独立画像を選択出力する。文字認識結果でインデックス／非インデックス符号化を切り替えるので高画質・高圧縮・高速を実現できる。

（４）画像処理装置は、画像を入力する画像入力部と該画像を文字認識し文字情報を出力する文字認識部と、該画像をパラメータで可逆、非可逆等の圧縮性能を制御できる画像圧縮部を持つことを特徴とする画像処理装置であって、該文字情報を分析する文字分析部を持ち、該画像圧縮部は該文字分析結果に応じて圧縮性能を制御し、該文字分析結果とはキーワードや文字種別等の特定の文字である。文字認識結果で特定のキーワードは可逆になる確率を高めるので、高画質・高圧縮を実現できる。

（５）画像処理装置は、画像を入力する画像入力部と該画像を文字認識し文字情報を出力する文字認識部と、該画像をパラメータで可逆、非可逆等の圧縮性能を制御できる画像圧縮部を持つことを特徴とする画像処理装置であって、該文字情報を分析する文字分析部を持ち、該画像圧縮部は該文字分析結果に応じて圧縮性能を制御し、該文字分析結果とはキーワードや文字種別等の特定の文字及びその文字に似た文字である。文字認識結果で特定のキーワード及びそれに近似したデータとそれ以外で圧縮を制御するので、ＯＣＲの精度も考慮して、高画質・高圧縮を実現できる。

（６）画像処理装置は、画像を入力する画像入力部と該画像を文字認識し文字情報を出力する文字認識部と、該画像をパラメータで可逆、非可逆等の圧縮性能を制御できる画像圧縮部を持つことを特徴とする画像処理装置であって、該文字情報を分析する文字分析部を持ち、該画像圧縮部は該文字分析結果に応じて圧縮性能を制御し、該文字分析結果とは言語種別である。文字認識結果で言語種別に応じて圧縮を制御するので、英語・ひらがな等言語を表現する文字の特性に応じた制御が出来るので、高画質・高圧縮を実現できる。

（７）画像処理装置は、画像を入力する画像入力部と該画像を文字認識し文字情報を出力する文字認識部と、該画像をパラメータで可逆、非可逆等の圧縮性能を制御できる画像圧縮部を持つことを特徴とする画像処理装置であって、該文字情報を分析する文字分析部を持ち、該画像圧縮部は該文字分析結果に応じて圧縮性能を制御し、該文字分析結果とは言語種別と該言語における当該文字の出現頻度である。文字認識結果で言語種別に応じて圧縮を制御するので、英語・ひらがな等言語を表現する文字とその言語における文字の特性に応じた制御が出来るので、高画質・高圧縮・高速を実現できる。

（８）画像処理装置は、画像を入力する画像入力部と該画像を文字認識し文字情報を出力する文字認識部と、該画像を異なる圧縮方式で圧縮できる画像圧縮部を持つことを特徴とする画像処理装置であって、該文字情報を分析する文字分析部を持ち、該画像圧縮部は該文字分析結果に応じて圧縮方式を制御する。文字認識結果で辞書化方式のマッチング度を制御するので、高画質・高圧縮を実現できる。

以上により、例えば、文字認識結果の文字コード情報から、特定キーワードやＯＣＲと辞書マッチング双方で欠落し易い“ｌ”や“１”等の抽出された文字コードが属するビットマップは可逆圧縮する。更には、言語の種別に応じて辞書化精度を制御し、字数の多い漢字などは辞書化対象からはずし、高圧縮化する。

以上により、抽出した文字情報に応じて画像品質を制御できるので、重要な情報の欠落を避けることができる。重要な情報とは、登録キーワード、数字、間違え易い文字・数字である。また、圧縮率向上のため、画数の多い漢字・漢字そのもの、言語で辞書マッチングしない。もしくは、言語を判定して、その言語で出現頻度の多い字の精度をゆるく（高圧縮）したり、厳しく（高画質）したり、インデックス張替え（高速）したりする。辞書化方法は、マッチング精度を厳しく（可逆辞書化）したり、辞書化対象からはずしたり（非辞書化圧縮）する。更に、登録キーワードを見つけると、ＪＢＩＧ２だけでなく全般の圧縮率を低くしたり、全面ＪＰＥＧで処理したりする。

以下、非辞書化と辞書化について例示する。

爨→画数が多い（文字コードで判断）ため非辞書化
丸→画数が少ないため辞書化
○、ｏ、Ｏ、０→マッチングを間違うと（ＯＣＲ・辞書共）意味が異なるため非辞書化で可逆圧縮
１，２，３…→マッチングを間違うと重大なミスにつながるので非辞書化し可逆圧縮
￥、＄のある前後の文字→マッチングを間違うと重大なミスにつながるので非辞書化し可逆圧縮
秘・キーワード・会社名・人物名→マッチングを間違うと重大なミスにつながるので非辞書化し可逆圧縮
アルファベット・数字・ひらがな・カナ→辞書化、漢字→非辞書化
なお、上記した可逆圧縮とは第１の圧縮パラメータの圧縮であり、元の画像を１００％に限りなく近い状態で再現することができる圧縮である。準可逆圧縮とは第１の圧縮パラメータより画像劣化をする可能性のある第２の圧縮パラメータの圧縮であり、元の画像をほぼ忠実に再現することができる圧縮である。非可逆圧縮とは第２の圧縮パラメータより画像劣化をする可能性のある第３の圧縮パラメータの圧縮であり、元の画像をおよそ忠実に再現することができる圧縮である。なお、圧縮パラメータは、圧縮方法や劣化具合を設定できるパラメータとする。

図１３は、本発明の実施形態２−１に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。図１３に示すように、画像処理装置の画像処理は、制御部２００６により制御される。スキャナ２００１は、入力画像（原稿画像）に対応した入力画像信号２０１０を出力する。レイアウト解析部２００２は、所定のレイアウト解析技術を用いて、スキャナ２００１から入力された画像信号２０１０に対応したオブジェクト配置情報２０１１とオブジェクト属性情報２０１２を出力する。

画像部品化部２００３は、オブジェクト配置情報２０１１を用いて、入力画像信号２０１０に対応した部品画像２０１３を出力する。

画像辞書化部２００４は、所定のビットマップ辞書化技術とオブジェクト属性情報２０１２を用いて、部品画像２０１３に対応した画像辞書２０１４と辞書インデックス２０１５を出力し、画像符号化部２００５で符号データ２０１６を生成出力する。

図１４は、レイアウト解析部２００２の概略構成の一例を示すブロック図である。縮小処理部２００２−１は、入力画像信号２０１０を既定の縮小率で縮小し、縮小画像信号２００２−６を出力する。連結画素探索部２００２−２は、所定のチェインアルゴリズムで８方向探索して、画素の連結した領域の左上座標、左下座標、右上座標、右下座標である領域情報２００２−７を出力する。領域情報２００２−７の座標は、縮小処理部２００２−１で縮小処理した座標系であるので、領域座標変換部２００２−３は、領域情報２００２−７を、入力画像２０１０と同じ座標系に変換し、オブジェクト配置情報２０１１として出力する。

一方、オブジェクト属性判定部２００２−４は、入力画像の頁内の領域情報２００２−７を集計して、ＴＡＢＬＥ２００２−５から読み出したオブジェクト判定データ２００２−８と比較し、オブジェクト属性情報２０１２を出力する。

図１５は、オブジェクト属性判定部２００２−４の動作を除いた領域検出動作の一例を示す図である。

入力画像２０１０を縮小処理することで、縮小画像２００２−６では、文字等が連結した画素になることがわかる。この画像に対して所定のチェインアルゴリズムを用いて、連結した領域を算出すると、図１５の点線で示したような各固まり毎の複数の領域２００２−７が算出される。この領域２００２−７の座標を変換すれば、座標系を縮小前に戻したオブジェクト配置情報２０１１が算出される。

図１６は、オブジェクト属性判定部２００２−４の概略構成の一例を示す図である。領域情報２００２−７を用いて、各領域毎の高さ２００２−４−４＝Ｈを以下のように求める。

Ｈ＝ＭＩＮ（｜左上Ｘ座標−右下Ｘ座標｜、｜左上Ｙ座標−右下Ｙ座標｜）
入力画像の頁内の各オブジェクトの高さの中央値を領域高さ中央値２００２−４−５として算出する。

領域距離算出部２００２−４−２は、各領域のセンター座標２００２−４−６を求め、各センター座標毎に最も近いセンター座標２００２−４−７と２００２−４−８を求め、判断部２００２−４−３に出力する。

判断部２００２−４−３では、各領域毎の高さ２００２−４−４と領域高さ中央値２００２−４−５の差分を取り、既定値より大きいかどうか領域高さ差分として計算する。

センター符号、センター差分はそれぞれ以下の式で算出する。

差分Ａ＝２００２−４−６ − ２００２−４−７
差分Ｂ＝２００２−４−６ − ２００２−４−８
センター符号＝差分Ａ×差分Ｂの符号
センター差分＝｜｜差分Ａ｜−｜差分Ｂ｜｜
即ち、センター符号は、処理領域の上下もしくは左右夫々に近いオブジェクトが存在すれば負、下に二つ等と同一方向に並んだときは正となる。

センター差分は、各オブジェクトと対象オブジェクトの距離の差が２つとも大きいか差がある状態を算出する。

そこで、図１７に示すオブジェクト判定データを用いて、オブジェクトの属性を判定し、オブジェクト属性情報２０１２として出力する。

図１８は、オブジェクトの属性判定動作の一例を示す。図１８中の各斜線が判定対象オブジェクトであり、ｏｂｊ１、ｏｂｊ２が選択された最も近い２つのオブジェクトとすると、図１８（ａ）、図１８（ｂ）は、高さが他のオブジェクトより大きいか、最上位の位置に属するなどで、タイトルの可能性が高い。

図１８（ｃ）は高さは小さく、配置も他のオブジェクト内であるが、２つのオブジェクト間の距離に違いがあるため、段落の変わり目などの見出し語の可能性が高い。

図１８（ｄ）は何れでもないので、通常の本文の可能性が高い。

図１９は、画像部品化部２００３の概略構成の一例を示す図である。横方向画素カウント部２００３−２及び横方向画素カウント部２００３−２は、オブジェクト配置情報２０１１の座標単位で、画像信号２０１０を分割し、縦軸、横軸への画素カウントの射影を算出し、縦方向の射影２００３−６、横方向の射影２００３−７として出力する。

比較器２００３−３は、射影値の分散の大きいほうを選択するよう、セレクタ２００３−４を操作するよう制御信号２００３−８を出力する。

画素分割部２００３−５は、選択された射影値を用いて、画像２０１０を分割して部品画像２０１３を出力する。

図２０は、部品画像算出の一例を示す図である。画像部品化部２００３は、縦方向の射影２００３−６と横方向の射影２００３−７を比較し、分散の大きい横方向の射影を選択し、画素分割部２００３−５で、射影に対して閾値処理を行うことで、横方向の分割座標を算出し（点線）、図２０に示す「Ａ」「Ｂ」「Ｃ」「Ｄ」「Ｅ」…で示された単位で部品画像１０１２として出力する。

図２１は、画像辞書化部２００４の概略構成の一例を示す図である。ビットマップマッチング部２００４−１は、上記辞書化の過程で保持したビットマップ２００４−４が登録されているビットマップ辞書２００４−２と、マッチングパラメータ２００４−５が格納されているパラメータＴＡＢＬＥ２００４−３とからデータを受け取る。ビットマップマッチング部２００４−１は、所定の位置シフトとマッチング処理を組み合せて、部品画像２０１３がビットマップ辞書２００４−２に存在するかどうか判断し、存在すれば、その辞書インデックス（辞書のインデックスと画像上の部品画像の位置情報）２０１５を出力する。ビットマップマッチング部２００４−１は、対応するビットマップパターンが辞書に無ければ、その部品画像２０１３を辞書に登録してインデックスを付与する。

このマッチング動作時に、オブジェクト属性情報２０１２に応じてその属性に応じたマッチングパラメータ２００４−５がＴＡＢＬＥ２００４−３から読み出されることで、オブジェクト属性に応じた圧縮が行なわれる。例えば図２２に示されるように、タイトルや見出し語だった場合重要な情報である可能性が高いのでマッチング精度を厳しくするパラメータ２００４−５が読み出され、それ以外は通常のマッチング精度パラメータ２００４−５が出力される。

このように、入力原稿の頁内の全オブジェクトに対する辞書化が終了すれば、辞書情報を画像辞書２０１４として出力する。

そして画像符号化部２００５は、画像辞書２０１４を所定の画像圧縮技術（例えばランレングス）で圧縮し、辞書インデックス２０１５と合わせて符号データ２０１６として出力する。

以上により、例えば図１８（ａ）（ｂ）（ｃ）に示されるようなタイトル等の重要な情報は、可逆や低圧縮率で圧縮し、情報の重要度が若干下がるデータはより高圧縮処理を行うので、画質・情報劣化のバランスのとれた高圧縮ファイルが生成できる。

また、本実施形態では、タイトル・見出し語を例に挙げたが、属性情報は本実施形態に限定されるものではなく、例えば表を抽出した場合、その内部はより重要なデータである可能性が高いため同様に他のオブジェクトと圧縮率を変えるようにしてもよい。

なお、レイアウト解析方法や、そこから算出されるオブジェクト属性情報、辞書化や圧縮方法等は本実施形態に限定されるものではなく、パラメータの制御方法・可逆非可逆などの適用方法も本実施形態に限定されるものではない。

図２３は、本発明の実施形態２−２に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。図２３に示す画像処理装置において、実施形態２−１と共通するブロックには、図１３の画像処理装置に付与した符号と同一の符号を付与している。

レイアウト解析部２００２Ａ、オブジェクト濃度属性２０１２Ａ、画像辞書化部２００４Ａが、実施形態２−１と若干異なる点である。

図２４は、レイアウト解析部２００２Ａの概略構成の一例を示す図である。レイアウト解析部２００２Ａの構成は、レイアウト解析部２００２の構成と基本的に同一だが、領域濃度判定部２００２−６Ａを持ち、オブジェクト濃度属性２０１２Ａを出力する点が異なる。領域濃度判定部２００２−６Ａは、図２５に示すように領域内のヒストグラムを算出し、白地かどうか判定する。

図２６は、画像辞書化部２００４Ａの概略構成の一例を示す図である。画像辞書化部２００４Ａは、オブジェクト属性情報２０１２とオブジェクト濃度属性２０１２Ａを用いてマッチング精度パラメータ２００４−５を算出する。

例えば、図２７に示すように、非白地は準可逆、白地は非可逆にする。つまり、オブジェクトが白地かどうかで圧縮率を変える。これは図２８に示すように非白地上の文字は、背景が編点表現されていたりすることが多いため、２値化してビットマップを生成すると白地に比べ形状が不安定になり易いため、非白地の圧縮率を低めに設定することで劣化を防いでいる。

逆の観点で効率よく圧縮することに重点を置けば、図２８（ｂ）の２値化のコブは情報で無いとしてマッチング精度を緩めて、非白地の情報を効率よく圧縮することができるのも明らかである。

また、ビットマップ辞書２００４−２に優先的に白地上の文字のビットマップを登録するようにしてもよく、非白地上の文字を読み易くすることも可能である。

図２９は、本発明の実施形態２−３に係る画像処理装置（画像圧縮装置）の概略構成を示すブロック図である。図２９に示す画像処理装置において、実施形態２−１と共通するブロックには、図１３の画像処理装置に付与した符号と同一の符号を付与している。

画像辞書化部２００４Ｂ、画像辞書化部２００４Ｂの出力である画像ビットマップ２０１７が、実施形態２−１と若干異なる点である。

図３０は、画像辞書化部２００４Ｂの概略構成の一例を示す図である。判断部２００４−８Ｂは、オブジェクト属性情報２０１２を受け取り、オブジェクト属性情報２０１２がタイトルや見出しであれば、セレクタ２００４−９Ｂを操作し、部品画像２０１３を画像ビットマップ２０１７として出力し、タイトルや見出し以外（その他）であればマッチング部２００４−１に入力して、実施形態２−１と同様、辞書マッチング処理を行う。

画像符号化部２００５Ｂは、画像辞書２０１４及び画像ビットマップ２０１７を実施形態２−１と同様に可逆圧縮技術で圧縮し、辞書インデックス２０１５と画像ビットマップ２０１７の位置情報を合わせて符号データ２０１６Ｂとして出力する。

以上により、可逆処理したいオブジェクト情報は辞書化せずに直接可逆圧縮することで、圧縮の速度を高速に出来る。

なお、本実施形態では画像辞書２０１４、画像ビットマップ２０１７を同一の可逆圧縮を用いた例を示したが両者の圧縮方式を変えたり、圧縮パラメータを変えるようにしてもよい。

以下に、上記した実施形態２−１、２−２、２−３についてまとめる。

（１）画像処理装置は、画像を入力する画像入力部と、該画像からオブジェクト配置情報を出力するレイアウト解析部と該画像と該オブジェクト配置情報から画像を部品化して部品画像を出力する画像部品化部と該部品画像を圧縮する画像符号化部を持つことを特徴とする画像処理装置であって、該レイアウト解析部はオブジェクト属性を出力し、該画像符号化部は該オブジェクト属性に応じて圧縮率を制御する。レイアウト解析結果を元に圧縮率を制御できるので高画質・高圧縮な圧縮ファイルを提供できる。

（２）画像処理装置は、画像を入力する画像入力部と、該画像からオブジェクト配置情報を出力するレイアウト解析部と該画像と該オブジェクト配置情報から画像を部品化して部品画像を出力する画像部品化部と該部品画像を辞書化し画像辞書と該部品画像の辞書インデックスを出力する画像辞書化部と、該画像辞書と該辞書インデックスを符号化する画像符号化部を持つことを特徴とする画像処理装置であって、該レイアウト解析部はオブジェクト属性を出力し、該画像辞書化部は該オブジェクト属性に応じて辞書化精度を制御する。レイアウト解析結果を元に辞書精度を制御できるので高画質・高圧縮な圧縮ファイルを提供できる。

（３）画像処理装置は、画像を入力する画像入力部と、該画像からオブジェクト配置情報を出力するレイアウト解析部と該画像と該オブジェクト配置情報から画像を部品化して部品画像を出力する画像部品化部と該部品画像を辞書化し画像辞書と該部品画像の辞書インデックスを出力する画像辞書化部と、該画像辞書と該辞書インデックスを符号化する画像符号化部を持つことを特徴とする画像処理装置であって、該レイアウト解析部はオブジェクト属性を出力し、該画像辞書化部は該オブジェクト属性に応じて辞書化精度を制御し、該オブジェクト属性とは文書の見出し、表等である。見出しや表等オブジェクト属性を元に辞書精度を制御できるので高画質・高圧縮な圧縮ファイルを提供できる。

（４）画像処理装置は、画像を入力する画像入力部と、該画像からオブジェクト配置情報を出力するレイアウト解析部と該画像と該オブジェクト配置情報から画像を部品化して部品画像を出力する画像部品化部と該部品画像を辞書化し画像辞書と該部品画像の辞書インデックスを出力する画像辞書化部と、該画像辞書と該辞書インデックスを符号化する画像符号化部を持つことを特徴とする画像処理装置であって、該レイアウト解析部はオブジェクト属性を出力し、該画像辞書化部は該オブジェクト属性に応じて辞書化精度を制御し、該オブジェクト属性とは下地の有無である。下地上の文字かどうかなど、文字等の所属する領域属性に応じて辞書精度を制御できるので、高画質・高圧縮な圧縮ファイルを提供できる。

（５）画像処理装置は、画像を入力する画像入力部と、該画像からオブジェクト配置情報を出力するレイアウト解析部と該画像と該オブジェクト配置情報から画像を部品化して部品画像を出力する画像部品化部と該部品画像を辞書化し画像辞書と該部品画像の辞書インデックスを出力する画像辞書化部と、該画像辞書と該辞書インデックスを符号化する画像符号化部を持つことを特徴とする画像処理装置であって、該レイアウト解析部はオブジェクト属性を出力し、該画像辞書化部は該オブジェクト属性が白下地を含むオブジェクト属性を優先的に該画像辞書化する。下地上の文字を優先的に辞書ビットマップとして使用するので高画質・高圧縮な圧縮ファイルを提供できる。

（６）画像処理装置は、画像を入力する画像入力部と、該画像からオブジェクト配置情報を出力するレイアウト解析部と該画像と該オブジェクト配置情報から画像を部品化して部品画像を出力する画像部品化部と該部品画像を辞書化し画像辞書と該部品画像の辞書インデックスを出力する画像辞書化部と、該画像辞書と該辞書インデックスを符号化する画像符号化部を持つことを特徴とする画像処理装置であって、該レイアウト解析部はオブジェクト属性を出力し、該画像辞書化部は該オブジェクト属性に応じて該辞書圧縮を行なうかどうか制御する。レイアウト解析結果を元に辞書圧縮方式を行なうか制御するので、高画質・高圧縮な圧縮ファイルを提供できる。

以上により、ＪＢＩＧ２やＯＣＲを実現するためのレイアウト解析処理結果に応じて、領域の情報や原稿タイプを判断し、辞書化圧縮のマッチング精度や非辞書化圧縮の適用などを制御するので、高速に高画質・高圧縮な辞書圧縮ファイルを提供できる。即ち、レイアウト解析結果に応じて重要な領域などを判断し、圧縮率等を制御するので高速に高画質・高圧縮な圧縮ファイルを生成できると共に、生成された圧縮画像をＯＣＲ処理しても精度を確保することが可能な圧縮ファイルを提供することが出来る。つまり、抽出した領域情報に応じて画像品質を制御できるので、重要な情報の欠落を避けることができる。例えば、重要な情報とは、文書の見出し、表、表、グラフ等の見出しである。また、全般的な精度向上のために、白地上の文字かどうかで圧縮パラメータ等を切り替えることで、２値化等で生成される文字画像の品質を補完することもできる。または辞書のベースビットマップを白地上の文字を中心に選択することもできる。例えば、タイトル・見出しらしいと判断された領域は可逆圧縮して、確実に画像ファイルとして情報を視認できると共に、辞書圧縮ファイルにＯＣＲを掛けた時のＯＣＲ精度を確保する。表を抽出したときは、表領域を可逆圧縮したり、数字しかない可能性が高いので、マッチングパラメータを変えたり、圧縮方法を変えたりする。

なお、上記した可逆圧縮とは第１の圧縮パラメータの圧縮であり、元の画像を１００％に限りなく近い状態で再現することができる圧縮である。準可逆圧縮とは第１の圧縮パラメータより画像劣化をする可能性のある第２の圧縮パラメータの圧縮であり、元の画像をほぼ忠実に再現することができる圧縮である。非可逆圧縮とは第２の圧縮パラメータよりより画像劣化をする可能性のある第３の圧縮パラメータよりの圧縮であり、元の画像をおよそ忠実に再現することができる圧縮である。

次に、本発明の実施形態３について説明する。

同一文字毎等で一つの辞書ビットマップを形成し、その辞書ビットマップと位置情報を保存することにより画像を圧縮する方法がある。しかしながら、辞書として登録される辞書ビットマップは、最初に出現した新規のビットマップを登録しているだけであり、必ずしも辞書として最適な形状のビットマップを選択しているわけではない。

データを圧縮する技術として多くの圧縮方法が考えられる。ハフマン符号化に代表されるエントロピー符号化や算術符号化等がある。その前処理としてユニバーサル符号化（辞書化・辞書に基づいた符号化（dictionary-based coding））という手法がある（以下『辞書化』と記述する）。

ジャコブ・ジヴ（Jacob Ziv）とエイブラハム・レンペル（Abraham Lempel）によって開発されたデータ圧縮アルゴリズムであるＬＺ７７やＬＺ７８は既出のキャラクタの発生位置とその長さを保存することにより圧縮する方法であり、基本的にキャラクタコードの圧縮方法である。

この仕組みを画像に適応したものがISO/IEC14492で国際標準となっている２値圧縮技術のＪＢＩＧ２のSymbolDictionaryである。SymbolDictionaryとは、画像の領域をひとつの辞書ＢＭＰとして捉え（例えば１文字のＢＭＰ）、共通するものは同じ辞書ＢＭＰとして取り扱い、辞書ＢＭＰと位置情報を持つことにより圧縮する方法である。これらは特定のパターンを持つ画像（文字画像やハーフトーン画像等）に対しても効果を発揮する。

上記ＪＢＩＧ２のSymbolDictionaryの辞書圧縮の具体例を以下に示す。

例えば図３１に示すような『ＡＢＣＢＡＤ』という入力画像があった場合、通常は『ＡＢＣＢＡＤ』を素直に全部画像として圧縮していた。辞書圧縮では『Ａ』という画像は２つあるため、『Ａ』という画像は一つだけ持ち、あとは位置情報を持つことによりデータの削減を図る。このようなデータ圧縮の場合、辞書化により以下のようなデータを作成することになる。

辞書（Ｓｙｍｂｏｌ）４種類：『Ａ』『Ｂ』『Ｃ』『Ｄ』（図３２）
辞書（Ｓｙｍｂｏｌ）位置情報６種類：（画像Ａ：位置（０，０））、（画像Ｂ：位置（６，０））、（画像Ｃ：位置（１２，０））、（画像Ｂ：位置（１８，０））、（画像Ａ：位置（２４，０））、（画像Ｄ：位置（３０，０））
これらのデータを作成する上で、辞書化対象画像抽出処理（何を辞書候補とするか）が必要となる（連結画素抽出・文字抽出）。抽出した辞書候補が既存の辞書（Ｓｙｍｂｏｌ）と同一と判定できるか否かを判定し、同一であれば辞書（Ｓｙｍｂｏｌ）位置情報を登録、異なると判断されれば辞書（Ｓｙｍｂｏｌ）情報と辞書（Ｓｙｍｂｏｌ）位置情報を登録する仕組みを持つ辞書化処理を行い、最終的に辞書（Ｓｙｍｂｏｌ）情報と辞書（Ｓｙｍｂｏｌ）位置情報を圧縮することにより高圧縮化を実現している。

１００％ではない画素一致率で同一辞書（Ｓｙｍｂｏｌ）とみなす辞書圧縮方式においては、初めに辞書（Ｓｙｍｂｏｌ）として登録された画像がそのまま出力画像に反映される。この為、一旦と辞書として登録された画像に問題がある場合（例えば文字の一部が欠けているなど）、その不良な辞書（Ｓｙｍｂｏｌ）が出力結果に反映されてしまう。

その対策としてはあらかじめフォントの辞書（Ｓｙｍｂｏｌ）を持っておき、該当するものがあればその辞書（Ｓｙｍｂｏｌ）を用い、なければベクトル化（準可逆）するという方法がある（特開２００５−２０８８７２）。しかし文字のベクトル化は圧縮率の低下が懸念事項として挙がる。

さらに、上記した圧縮、復元処理の一例について説明する。

図３３は、入力画像の一例を示す図である。例えば、画像処理装置が、左から右、上から下に辞書候補画像を探索し、辞書ビットマップを作成するケースを想定する。辞書化は非可逆であり、多少の画素の差は同一辞書とみなす。このケースでは、以下のようにして画像が圧縮され復元される。

（１）一番初めに発見された文字（左）が辞書として登録されてしまう。

（２）中央は左の文字と同一文字と判断されてしまう。

（３）右の文字は左の文字と同一文字と判断されてしまう。

（４）このようにして作成されたデータの復元画像は、図３４に示すように、入力画像の左の文字が３つ並ぶ形になってしまう。

そこで、本発明の実施形態３では、辞書候補画像を一定量保持しておき、辞書候補画像の中から他の同一と判定された辞書侯補画像との一致度の高いものを辞書（Ｓｙｍｂｏｌ）情報として蓄えておくことにより、文字欠け等の画質不具合を低減させることができる。つまり、本発明の実施形態３では、辞書として登録するかを判定するビットマップを保存しておき、より良いビットマップを辞書として登録する。これにより、辞書化の処理順に依存されること無く（初めに辞書登録されたビットマップ形状に依存されること無く）、より入力画像に近い画像を保つことができる。

具体的には、同一辞書と判定されたビットマップ群を以下のように判定し辞書ＢＭＰを決定する。

（１）白画素と黒画素の変化点が最も少ないものを採用する。

（２）ノイズ画素が最も少ないものを採用する。

（３）ＯＣＲ判定をし、最も一致度が高いものを採用する。

これにより、辞書化の処理順に依存されること無く（初めに辞書登録されたビットマップ形状に依存されること無く）、より入力画像に近い画像を保つことができる。

例えば、本発明の実施形態３に係る画像処理装置（画像圧縮装置）は、以下のようにして画像を圧縮し復元することができる
（１）一番初めに発見された文字（左）を辞書として登録する。

（２）中央の文字は左の文字と同一文字と判断する。辞書候補画像（中央の文字）はバッファに保存する。

（３）右の文字は左の文字と同一文字と判断する。辞書候補画像（右の文字）はバッファに保存する。

（４）辞書収集が終了したら、同一文字と判断された文字の中でノイズの少ないものを選択し（中央の文字）、辞書ビットマップとして登録する（画素の連結性が高い：ランが最も繋がっている）。

（５）復元画像は、図３５に示すように、入力画像の中央の文字が３つ並ぶ形になる。

以下、本発明の実施形態３について詳細に説明する。

図３６は、本発明の実施形態３−１に係る画像処理装置（画像圧縮装置）による圧縮処理の概念を示す図であり、図３８は、本発明の実施形態３−１に係る画像処理装置（画像圧縮装置）の全体構成の一例を示す図であり、図３７は、本発明の実施形態３−１に係る画像処理装置（画像圧縮装置）の詳細構成の一例を示す図である。また、図３９は、本発明の実施形態３−１に係る圧縮処理の一例を示す図である。図３６に示す画像処理装置は、図３７及び図３８に示す画像処理装置に対応し、主に、図３７及び図３８に示す画像処理装置を参照し、実施形態３−１に係る圧縮処理を説明する。

Symbol一致判定部３００１は、辞書化対象データＤ３００２と辞書バッファ３００５に存在するSymbol情報Ｉ３００４が一致しているか否かを比較・判定し、一致判定結果Ｒ３００３(一致していないなら一致していないという情報、一致しているのなら一致しているSymbolのID番号)を出力するSymbol比較部３００１−１とSymbol比較結果出力部３００１−２を持つ。

Symbol一致判定部３００１は、既知の手段・方法で一致を判定し、必ず１００％画素が一致していなければならないわけではなく、ある程度似ているものは同じと判定する手段・方法も含む。

Symbol・一致Symbol情報・Symbol位置情報登録部３００２の動作について説明する。辞書化対象データＤ３００２にIDを割り振り、辞書化対象データＤ３００２とそのIDを辞書バッファ３００５のSymbol情報バッファ３００５−１に登録するSymbol情報・ID登録部３００２と、そのIDと位置情報を辞書バッファ３００５のSymbol位置情報バッファ３００５−２登録するID・Symbol位置情報登録部３００２−２と、もし一致判定結果Ｒ３００３が他のSymbol(Symbol候補画像)と一致しているという結果であれば、一致しているSymbolのID番号を辞書バッファ３００５の一致Symbol情報バッファ３００５−３に登録する一致Symbol情報登録部３００２−３を持つ。

Symbol決定部３００３の動作について説明する。ユーザの指定するシンボル修正フラグがONの時(ユーザがSymbolの最適化を行いたい時)、辞書バッファ３００５にある同一と判定されたSymbol(Symbol候補画像)の中で最も一致度が高いSymbolを最終的なSymbolとして採用する最終Symbol決定部３００３−１と、それに伴いSymbol位置情報バッファ３００５−２のSymbol位置情報のIDを修正するSymbol位置情報ID修正部３００３−２と、Symbol情報バッファ３００３−１の不要になった(Symbolとして選ばれなかった)Symbol情報を削除する不要Symbol情報削除部３００３−３を持つ。

辞書情報出力部３００４は、辞書情報出力フラグＦ３００１がONの場合は、辞書バッファ３００５にあるSymbol情報バッファ３００５−１とSymbol位置情報バッファ３００５−２の情報(Symbol情報Ｉ３００４とSymbol位置情報Ｉ３００５)を出力するように制御し、出力後に辞書バッファ３００５(Symbol情報バッファ３００５−１とSymbol位置情報バッファ３００５−２を含む)を初期化する信号を、辞書バッファ初期化部３００４−２に送るゲート３００４−１(辞書情報出力フラグＦ３００１がOFFの場合はゲートは上記のような出力・初期化処理はしない)と、辞書バッファ３００５(Symbol情報バッファ３００５−１とSymbol位置情報バッファ３００５−２・一致Symbol情報バッファ３００５−３を含む)を初期化する辞書バッファ初期化部３００４−２を持つ。

例えば図４０に示す画像が入力されたとする。ここでは、辞書登録がすべて終わったら最適と思われる辞書を選ぶ作業例で説明をする。

辞書化対象データ抽出部３０００の動作について説明する。まず図４０の入力画像から辞書化対象データＤ３００１を抽出する（ＳＴ３００１）。左から右、上から下に黒画素を探索すると(1,1)の黒画素が見つかる(左上を(0,0)とする)。

(1,1)の黒画素の連結成分を抽出することにより図４０の左端の『T』を候補として得ることができる(辞書化対象データの抽出方法は既知の方法を適用)。

Symbol一致判定部３００１の動作について説明する。辞書化対象データ抽出部３０００で得られた辞書化対象データＤ３００１と辞書バッファ３００５に存在するSymbolを比較する（ＳＴ３００２）。今回は比較するSymbolが辞書バッファ３００５に登録されていないので、不一致という結果(一致判定結果Ｒ３００２)を出力する（ＳＴ３００３、ＮＯ）。なお、意図的にあらかじめ辞書バッファに特定Symbolを入れておくことも可能。

Symbol・一致Symbol情報・Symbol位置情報登録部３００２の動作について説明する。もし一致判定結果Ｒ３００２が『一致』なら（ＳＴ３００３、ＹＥＳ）、以下の作業を行う（ＳＴ３００６）。

・辞書化対象データＤ３００２をSymbolとして辞書バッファ３００５に登録
・それがどの既存Symbolと一致しているのかという情報を辞書バッファ３００５に登録
・当該Symbolがどの位置にあるのかを示す情報を辞書バッファ３００５に登録
一致判定結果Ｒ３００２が『不一致』なら（ＳＴ３００３、ＮＯ）、以下の作業を行う（ＳＴ３００５）。

・辞書化対象データＤ３００１をSymbolとして辞書バッファ３００５に登録
・当該Symbolがどの位置にあるのかを示す情報を辞書バッファ３００５に登録
本実施形態３−１では、まず『不一致』なので（ＳＴ３００３、ＮＯ）、
・左端の『T』という画像をSymbolとして辞書バッファ３００５に登録（ＳＴ３００５）・左端の『T』の位置が(1,1)にあるという情報を辞書バッファ３００５に登録（ＳＴ３００５）
この状態を図４１に示す。

続いて次の辞書化対象データ抽出部３０００の作業を行う。つまり、入力画像から辞書化対象データＤ３００１を抽出する（ＳＴ３００１）。ここでは先に登録・判定されたSymbolは除外して抽出を行う。

左から右、上から下に黒画素を探索すると(10,1)の黒画素が見つかる(左上を(0,0)とする：左端の『T』は登録済みなので除外して探索する：本抽出部に画像を入力する時点で該当の『T』を削除しておくのもあり)。

(10,1)の黒画素の連結成分を抽出することにより、図４０の左から２番目のTを候補として得ることができる(辞書化対象データの抽出方法は既知の方法を適用)。

Symbol一致判定部３００１の動作について説明する。辞書化対象データ抽出部３０００で得られた辞書化対象データＤ３００１と辞書バッファ３００５に存在するSymbolを比較する（ＳＴ３００２）。今回は比較するSymbolが辞書バッファ３００５に存在するので比較を行う。左端の『T』があらかじめ登録されているので、それと左から2番目の『T』とを比較する。ここでは一致という結果(一致判定結果Ｒ３００２)を出力するとする（ＳＴ３００３、ＹＥＳ）。判定方法は、既知の方法を適用することができる
Symbol・一致Symbol情報・Symbol位置情報登録部３００２の動作について説明する。本実施形態３−１では、『一致』なので（ＳＴ３００３、ＹＥＳ）、
・左から2番目の『T』という画像をSymbolとして辞書バッファ３００５に登録（ＳＴ３００４）
・左から2番目の『T』が左端の『T』と一致しているという情報を辞書バッファ３００５に登録（ＳＴ３００４）
・左から２番目の『T』の位置が(10,1)にあるという情報を辞書バッファ３００５に登録（ＳＴ３００４）
この状態を図４２に示す。

続いて、次の辞書化対象データ抽出部３０００の作業を行う。つまり、入力画像から辞書化対象データＤ３００１を抽出する（ＳＴ３００１）。ここでは先に登録・判定されたSymbolは除外して抽出を行う。

左から右、上から下に黒画素を探索すると(19,1)の黒画素が見つかる(左上を(0,0)とする：左端とその右隣の『T』は登録済みなので除外して探索する：本抽出部に画像を入力する時点で該当の『T』を削除しておくのもあり)。

(19,1)の黒画素の連結成分を抽出することにより図４０のIを候補として得ることができる。辞書化対象データの抽出方法は、既知の方法を適用できる。

Symbol一致判定部３００１の動作について説明する。辞書化対象データ抽出部３０００で得られた辞書化対象データＤ３００１と辞書バッファ３００５に存在するSymbolを比較する（ＳＴ３００２）。今回は比較するSymbolが辞書バッファ３００５に存在するので比較を行う。左端とその右隣の『T』とを比較する。ここでは不一致という結果(一致判定結果Ｒ３００２)を出力するとする（ＳＴ３００３、ＮＯ）。判定方法は、既知の方法を適用することができる。

Symbol・一致Symbol情報・Symbol位置情報登録部３００２の動作について説明する。本実施形態３−１では、『不一致』なので（ＳＴ３００３、ＮＯ）、
・『I』という画像をSymbolとして辞書バッファ3005に登録（ＳＴ３００５）
・『I』の位置が(19,1)にあるという情報を辞書バッファ3005に登録（ＳＴ３００５）
この状態を図４３に示す。

左から右、上から下に黒画素を探索すると(22,1)の黒画素が見つかる(左上を(0,0)とする：左から『T』『T』『I』は登録済みなので除外して探索する：本抽出部に画像を入力する時点で該当のデータを削除しておくのもあり)。

(22,1)の黒画素の連結成分を抽出することにより図４０の右端のTを候補として得ることができる。辞書化対象データの抽出方法は、既知の方法を適用することができる。

Symbol一致判定部３００１の動作について説明する。辞書化対象データ抽出部３０００で得られた辞書化対象データＤ３００１と辞書バッファ３００５に存在するSymbolを比較する（ＳＴ３００２）。今回は比較するSymbolが辞書バッファ３００５に存在するので比較を行う。

この時は『T』と『I』が辞書バッファ３００５に登録されているので、『T』は左端の『T』とその右隣の『T』は同一判定されているので、左端の『T』とのみ比較する。同一判定された比較対象が複数ある場合、全部に対して比較する方法も可とする。

ここでは一致という結果(一致判定結果Ｒ３００２)を出力する（ＳＴ３００３、ＹＥＳ）。判定方法は、既知の方法を適用することができる。

Symbol・一致Symbol情報・Symbol位置情報登録部３００２の動作について説明する。本実施形態３−１では、『一致』なので（ＳＴ３００３、ＹＥＳ）、
・右端の『T』という画像をSymbolとして辞書バッファ3005に登録（ＳＴ３００４）
・右端の『T』が左端の『T』と一致しているという情報を辞書バッファ3005に登録（ＳＴ３００４）
・右端の『T』の位置が(22,1)にあるという情報を辞書バッファ3005に登録（ＳＴ３００４）
この状態を図４４に示す。

ユーザは予定しているすべての辞書登録が終わったので（ＳＴ３００６、ＹＥＳ）、Symbol決定フラグＦ３００６をONにし、Symbolの最終決定を行った後（ＳＴ３００７）、辞書出力フラグＦ３００１をONにしSymbol情報Ｉ３００４とSymbol位置情報Ｉ３００５を出力する（ＳＴ３００８）。

Symbol決定部３００３は、辞書バッファにある同一SymbolとされたSymbolのうち、最も誤差の小さいSymbolを選択する(後述の判断例を参照)。その選択されたSymbolを同一Symbol候補の代表として登録し、その他の同一Symbolは削除する。それに伴い位置情報とのリンク等を修正する。

同一Symbolと判定されたものがひとつも無ければ、必然的に存在するsymbolが代表のSymbolとなる。

もし同一Symbolと判定されたものが2つの場合は、ノイズの少ないものを採用する。その他の方法として、先に登録された方を採用 / エッジが滑らかなものを採用するという方法も可能である。

続いて、判断の一例を示す。

・ID1のSymbolは、以下の通りである。

ID1とID2のSymbolは4画素異なる
ID1とID4のSymbolは7画素異なる
⇒合計11画素異なる
・ID2のSymbolは、以下の通りである。

ID2とID１のSymbolは4画素異なる
ID2とID4のSymbolは4画素異なる
⇒合計8画素異なる
・ID4のSymbol、以下の通りである。

ID4とID1のSymbolは7画素異なる
ID4とID2のSymbolは4画素異なる
⇒合計11画素異なる
最終的なSymbolが決定した後は、それに併せてSymbol位置情報のIDを修正し、選ばれず不要となったSymbol情報を削除する。この場合、上記判断例のID1とID4のSymbol情報が削除される。

最終的な辞書バッファの状態を図４５に示す。

辞書情報出力部３００４の動作について説明する。辞書バッファ３００５に存在するSymbol情報Ｉ３００３とSymbol位置情報Ｉ３００４を出力する。

以上により、初めに辞書候補として挙がった画像を辞書(Symbol)として登録した場合（図４６及び図４７参照）に比べて、画質が良くなる確率が高いという利点がある。

また、以下１〜３に示すように、Symbol決定部の処理の開始タイミングをユーザが意図的に調整できるため、辞書バッファを節約しながら高画質なデータを作成することができる。

１．指定辞書バッファ量に達したとき
２．登録Symbol(仮登録を含む)が指定数に達したとき
３．同一Symbolが指定数に達したとき(指定のSymbolのみSymbol決定をする)
図４９は、本発明の実施形態３−２に係る画像処理装置（画像圧縮装置）の全体構成の一例を示す図であり、図４８は、本発明の実施形態３−２に係る画像処理装置の詳細構成の一例を示す図である。

本実施形態３−２は、ユーザが指定した時のみSymbol候補画像を辞書バッファ３００５に登録することができる。実施形態３−１と異なる部分を中心に説明する。つまり、Symbol・一致Symbol情報・Symbol位置情報登録部３００６の動作について説明する。Symbol候補画像登録フラグＦ３００７がONの場合、辞書化対象データＤ３００２にIDを割り振り、辞書化対象データＤ３００２とそのIDを辞書バッファ３００５のSymbol情報バッファ３００５−１に登録し、Symbol候補画像登録フラグＦ３００７がOFFの場合は、一致判定結果Ｒ３００３が不一致だった時のみ、辞書化対象データＤ３００２にIDを割り振り、辞書化対象データＤ３００２とそのIDを辞書バッファ３００５のSymbol情報バッファ３００５−１に登録するSymbol情報・ID登録部３００６−２と、登録したいSymbol(もしくはSymbol候補画像)のIDと位置情報を辞書バッファ３００５のSymbol位置情報バッファ３００５−２に登録するID・Symbol位置情報登録部３００６−２と、もしSymbol候補画像登録フラグＦ３００７がONの場合で一致判定結果Ｒ３００３が他のSymbol(Symbol候補画像)と一致している場合、一致しているSymbolのID番号を辞書バッファ３００５の一致Symbol情報バッファ３００５−３に登録する一致Symbol情報登録部３００６−３を持つ。

ユーザはSymbol候補画像として辞書化対象データＤ３００２を辞書バッファ３００５に登録したい時はSymbol候補画像登録フラグＦ３００７をONにし、そうでない時はOFFに設定をする。

Symbol候補画像登録フラグＦ３００７がONの時、Symbol・一致Symbol情報・Symbol位置情報登録部３００６は、Symbol・一致Symbol情報・Symbol位置情報登録部3002と同様の動作をし、Symbol候補画像を辞書バッファ3005に貯めていく。

Symbol候補画像登録フラグＦ３００７がOFFの時、Symbol・一致Symbol情報・Symbol位置情報登録部３００６は、マッチングが不一致の場合のみSymbolを新たに辞書バッファ３００５に登録する。一致の場合は、一致しているSymbolのIDと位置情報を辞書バッファ３００５に登録、不一致の場合は、新規登録したSymbolのIDとその位置情報を辞書バッファ３００５に登録する。Symbol候補画像の蓄積は行わない。

このような仕組みを持つことにより、使用メモリ量を抑えつつ画質を向上させることができる。

例えば、ユーザは以下のような処理を行うことにより使用メモリ量を限定させ、画質を向上させることができる。

（１）使用メモリ量が規定値に達するまでSymbol候補画像を蓄える。

（２）使用メモリ量が規定値を超えたら、Symbolを選定し、不要なSymbol候補画像を削除する。

（３）辞書化処理を行う。

以下に、上記した実施形態３−１と３−２についてまとめる。

（１）画像処理装置は、文字毎に一つの辞書ビットマップを形成し、その辞書ビットマップと位置情報を保存することにより画像を圧縮する装置であって、同一辞書と判定されたビットマップ群を、（ａ）白画素と黒画素の変化点が最も少ないものを採用する、（ｂ）ノイズ画素が最も少ないものを採用する、（ｃ）ＯＣＲ判定をし、最も一致度が高いものを採用する、のように判定し、辞書ＢＭＰを決定する。

より具体的には、以下の通りである。

（２）画像処理装置は、画像情報を辞書ビットマップ(Symbol)とその位置情報に分離し保存することにより圧縮する画像を入力として辞書化対象データ(辞書候補画像)を出力する辞書化対象データ抽出部と、辞書化対象データを入力として、辞書バッファに登録されているSymbolと一致しているか否かを判定するSymbol一致判定部と、辞書化対象データと一致判定結果を入力として、Symbolが一致している場合は、辞書化対象データ(Symbol)と、一致Symbolの情報(ID等)とSymbol位置情報を辞書バッファに登録する、Symbolが一致していない場合は、辞書化対象データ(Symbol)と、Symbol位置情報を辞書バッファに登録する、Symbol・一致Symbol情報・Symbol位置情報登録部と、辞書バッファのSymbol情報とSymbol位置情報を出力する辞書情報出力部を備える画像処理装置であって、
辞書化対象データの画像をSymbolとの一致判定後も、symbol候補画像として辞書バッファに保存しておき、同一のSymbolと判定されたSymbol候補画像の中で、最も画素の一致度の高いSymbol候補画像をSymbolとして登録する。

（３）画像処理装置は、画像情報を辞書ビットマップ(Symbol)とその位置情報に分離し保存することにより圧縮する画像を入力として辞書化対象データ(辞書候補画像)を出力する辞書化対象データ抽出部と、辞書化対象データを入力として、辞書バッファに登録されているSymbolと一致しているか否かを判定するSymbol一致判定部と、辞書化対象データと一致判定結果を入力として、Symbolが一致している場合は、辞書化対象データ(Symbol)と、一致Symbolの情報(ID等)とSymbol位置情報を辞書バッファに登録する、Symbolが一致していない場合は、辞書化対象データ(Symbol)と、Symbol位置情報を辞書バッファに登録する、Symbol・一致Symbol情報・Symbol位置情報登録部と、辞書バッファのSymbol情報とSymbol位置情報を出力する辞書情報出力部とを備える画像処理装置であって、任意のタイミングで、辞書化対象データの画像をSymbolとの一致判定後も、symbol候補画像として辞書バッファに保存しておき、同一のSymbolと判定されたSymbol候補画像の中で、最も画素の一致度の高いSymbol候補画像をSymbolとして登録させたり、従来の圧縮処理装置と同じ動作をさせたりすることができる。

次に、本発明の実施形態４について説明する。

同一文字毎等で一つの辞書ビットマップを形成し、その辞書ビットマップを圧縮し、その画像圧縮データと位置情報を保存することにより画像を圧縮する方法がある。しかしながら、この方法で作成される辞書ビットマップはあくまで入力された画像の形状に依存するものであり、スキャン画像等は特に辞書ビットマップの圧縮率は良いとは限らない。

さらに詳述すると、スキャン画像等において辞書圧縮を適用しようと考えた場合、同一文字でも画素が100%一致する確率は非常に少ないので、ある程度同じと思われる対象は同一辞書(symbol)とみなす辞書圧縮がある。スキャン画像においてはノイズ等が載っている可能性が高く、辞書として登録されたSymbolにも存在すると思われる。これは最終的な出力画像の画質劣化の要因となる。

その対策としてはあらかじめきれいなフォントの辞書(symbol)を持っておき、該当するものがあればその辞書(symbol)を用い、なければベクトル化(準可逆)するという方法がある(特開２００５−２０８８７２)。しかし文字のベクトル化は圧縮率の低下が懸念事項として挙がる。

そこで、本発明の実施形態４に係る画像処理装置（画像圧縮装置）は、Symbolを適時最適化(エッジ鮮鋭化・ノイズ除去)を行うことにより、Symbolの画質を向上させることができる共に高圧縮化するというものである（図５０参照）。つまり、本発明の実施形態４に係る画像処理装置は、辞書ビットマップを圧縮率が高くなるように(例：ランを繋げる：形状に特徴をもたせる等)形状を変形することにより圧縮率を高くする。これにより効率的な辞書ビットマップの圧縮をすることができる。

具体的には、図５１及び図５２に示すように、本発明の実施形態４に係る画像処理装置は、電子データを入力とし、辞書化対象範囲を出力する辞書化対象範囲決定部と、電子データと辞書化対象範囲を入力とし、辞書ビットマップとするか否かを判定する辞書化判定結果を出力する辞書化判定部と、電子データと辞書化判定結果を入力とし、辞書化判定結果が辞書ビットマップを作成する判定の場合に辞書ビットマップ情報を作成し出力する辞書BMP作成部と、辞書化対象範囲と辞書化判定結果と辞書バッファ(辞書ビットマップ情報群)を入力とし、辞書化対象となる辞書ビットマップ情報とその位置を関連付けた文字位置情報を出力する文字位置情報作成部と、辞書バッファの辞書ビットマップ情報群のデータを圧縮がし易い形に形状変換し出力する辞書ビットマップ形状変換部を備える。辞書バッファとは、辞書BMP作成部から出力された辞書ビットマップ情報をまとめて管理するバッファである。

さらに、詳しく説明すると、形状変換部の入力に入力画像・文字位置情報を加えることにより、入力データを考慮して辞書ビットマップの形状を変更する。また、辞書情報生成手段が入力パラメータで制御される。このような構成をとることにより、より効率的な辞書ビットマップの圧縮をすることができる。

以下、本発明の実施形態４について詳細に説明する。

図５１は、本発明の実施形態４−１に係る画像処理装置（画像圧縮装置）による圧縮処理の概念を示す図であり、図５４は、本発明の実施形態４−１に係る画像処理装置（画像圧縮装置）の全体構成の一例を示す図であり、図５３は、本発明の実施形態４−１に係る画像処理装置（画像圧縮装置）の詳細構成の一例を示す図である。また、図５５は、本発明の実施形態４−１に係る圧縮処理の一例を示す図である。図５１に示す画像処理装置は、図５３及び図５４に示す画像処理装置に対応し、主に、図５３及び図５４に示す画像処理装置を参照し、実施形態４−１に係る圧縮処理を説明する。

Symbol一致判定部４００１は、辞書化対象データＤ４００２と辞書バッファ４００５に存在するSymbol情報Ｉ４００４が一致しているか否かを比較・判定し、一致判定結果Ｒ４００３(一致していないなら一致していないという情報、一致しているのなら一致しているSymbolのID番号)を出力するSymbol比較部４００１−１とSymbol比較結果出力部４００１−２を持つ。

Symbol一致判定部４００１は、既知の手段・方法であり、必ず１００％画素が一致していなければならないわけではなく、ある程度似ているものは同じと判定する手段・方法も含む。

Symbol・Symbol位置情報登録部４００２は、辞書化対象データＤ４００２を新規のSymbol情報として登録し、ID番号を割り振り、辞書バッファ４００５のSymbol情報バッファ４００５−１に登録するSymbol情報ID登録部４００２−１と、登録する辞書化対象データＤ４００２が画像中の何処にあるかを示した位置情報と、そのSymbolのIDを辞書バッファ４００５のSymbol位置情報バッファ４００５−２に登録するID・Symbol位置情報登録部４００２−２を持つ。

また、一致判定結果Ｒ４００３が辞書化対象データＤ４００２とSymbol情報が一致していないと判定する結果だった場合は、Symbol情報・ID登録部４００２−１の処理を行った後で、ID・Symbol位置情報登録部４００２−２の処理をするように、一致判定結果Ｒ４００３が辞書化対象データＤ４００２とSymbol情報があるIDのSymbolと一致していると判定する結果だった場合は、ID・Symbol位置情報登録部４００２−２の処理を振り分けるセレクタを持つ。

Symbol修正部４００３は辞書バッファ４００５にあるSymbolの画質を向上させるため、エッジの凸凹を滑らかにするエッジ鮮鋭化部４００３−１と、ノイズ等のノイズを除去するノイズ除去部４００３−２を持つ。

この修正処理は新規のSymbolが辞書バッファ４００５に登録される度に、新規登録のSymbolに対して行われる。

辞書情報出力部４００４は辞書情報出力フラグＦ４００１がONの場合は、辞書バッファ４００５にあるSymbol情報バッファ４００５−１とSymbol位置情報バッファ４００５−２の情報(Symbol情報Ｉ４００４とSymbol位置情報Ｉ４００５)を出力するように制御し、出力後に辞書バッファ４００５(Symbol情報バッファ４００５−１とSymbol位置情報バッファ４００５−２を含む)を初期化する信号を、辞書バッファ初期化部４００４−２に送るゲート４００４−１(辞書情報出力フラグＦ４００１がOFFの場合はゲートは上記のような出力・初期化処理はしない)と、辞書バッファ４００５(Symbol情報バッファ４００５−１とSymbol位置情報バッファ４００５−２を含む)を初期化する辞書バッファ初期化部４００３−２を持つ。

本実施形態４−１では、ユーザが以下のように入力信号を制御した場合について説明する。

・上記説明した図４０の画像を入力画像とする。

・辞書情報出力フラグＦ４００１は最終ページ以外常にOFFとし、最終ページの辞書登録がすべて終わった時点でONとする。すべての処理が終わったらSymbol情報Ｉ４００４とSymbol位置情報Ｉ４００５を出力する。

続いて、辞書化処理の一例を説明する。辞書化対象データ抽出部４０００の動作について説明する。まず図４０の１ページ目の入力画像から辞書化対象データＤ４００２を抽出する（ＳＴ４００１）。

左から右、上から下に黒画素を探索すると(1,1)の黒画素が見つかる(左上を(0,0)とする)。(1,1)の黒画素の連結成分を抽出することにより図４０の１ページ目の画像の左端の『T』を候補として得ることができる。辞書化対象データの抽出方法は既知の方法を適用することができる。

Symbol一致判定部４００１の動作について説明する。辞書化対象データ抽出部４０００で得られた辞書化対象データＤ４００２と辞書バッファ４００５に存在するSymbolを比較する（ＳＴ４００２）。今回は比較するSymbolが辞書バッファ４００５に登録されていないので、不一致という結果(一致判定結果Ｒ４００３)を出力する（ＳＴ４００３、ＮＯ）。なお、意図的にあらかじめ辞書バッファ４００５に特定Symbolを入れておくことも可能である。

Symbol・Symbol位置情報登録部４００２の動作を説明する。もし一致判定結果Ｒ４００３が『一致(該当するID番号)』なら（ＳＴ４００３、ＹＥＳ）、以下の作業を行う（ＳＴ４００４）。

・一致しているSymbol情報がどれかわかる情報(ID)を辞書バッファ４００５に登録（ＳＴ４００４
・当該Symbolがどの位置にあるのかを示す情報を辞書バッファ４００５に登録（ＳＴ４００４）
一致判定結果Ｒ４００３が『不一致』なら（ＳＴ４００３、ＮＯ）、以下の作業を行う（ＳＴ４００５）。

・辞書化対象データ1003をSymbolとして辞書バッファ４００５に登録（ＳＴ４００５）
・当該Symbolがどの位置にあるのかを示す情報を辞書バッファ４００５に登録（ＳＴ４００５）
本実施例では、まず『不一致』なので（ＳＴ４００３、ＮＯ）、・１ページ目の左端の『T』をSymbolとして辞書バッファ４００５に登録（ＳＴ４００５）・『T』が1ページ目の(1,1)の位置にあるという情報を辞書バッファ４００５に登録（ＳＴ４００５）
この時の辞書バッファ４００５の状態を図５６に示す。

Symbol修正部４００３は、辞書バッファ４００５に新規のSymbolが登録されたらそのSymbolに対して、エッジを滑らかにする処理(エッジ鮮鋭化処理４００３−１)と、ノイズ等のノイズ除去をする(ノイズ除去部４００３−２)（ＳＴ４００６）。

この時の辞書バッファ４００５の状態を図５７に示す。

続いて次の辞書化対象データ抽出部４０００の作業を行う。図４０の１ページ目の入力画像から辞書化対象データＤ４００２を抽出する（ＳＴ４００１）。ここでは先に登録・判定されたSymbolは除外して抽出を行う。

左から右、上から下に黒画素を探索すると(10,1)の黒画素が見つかる(左上を(0,0)とする：左端の『T』は登録済みなので除外して探索する：本抽出部に画像を入力する時点で該当の『T』を削除しておくことも可能)。

(10,1)の黒画素の連結成分を抽出することにより図４０の左から２番目の『T』を候補として得ることができる。辞書化対象データの抽出方法は、既知の方法を適用することができる。

Symbol一致判定部４００１の動作について説明する。辞書化対象データ抽出部４０００で得られた辞書化対象データＤ４００２と辞書バッファ４００５に存在するSymbolを比較する（ＳＴ４００２）。今回は比較するSymbolが辞書バッファ４００５に登録さているので比較を行う。左端の『T』と比較する。ここでは左端の『T』と一致という結果(一致判定結果Ｒ４００３)を出力する（ＳＴ４００３、ＹＥＳ）。判定方法は既知の方法を適用することができる。

Symbol・Symbol位置情報登録部４００２の動作について説明する。『左端の『T』と一致』なので、
・一致しているSymbolが左端の『T』とわかる情報(ID番号)を辞書バッファ４００５に登録（ＳＴ４００４）
・この『T』が(10,1)にあるという位置情報を辞書バッファ４００５に登録（ＳＴ４００４）
この時の辞書バッファ４００５の状態を図５８に示す。

Symbol修正部４００３は、今回は新規登録されたSymbolは無いので特に処理は行わない。

続いて次の辞書化対象データ抽出部４０００の作業を行う。図４０の２ページ目の入力画像から辞書化対象データＤ４００２を抽出する（ＳＴ４００１）。ここでは先に登録・判定されたSymbolは除外して抽出を行う。

左から右、上から下に黒画素を探索すると(19,1)の黒画素が見つかる(左上を(0,0)とする：左二つの『T』は登録済みなので除外して探索する：本抽出部に画像を入力する時点で該当の『T』を削除しておくことも可能）。

(19,1)の黒画素の連結成分を抽出することにより図４０の『I』を候補として得ることができる。辞書化対象データの抽出方法は、既知の方法を適用することができる。

Symbol一致判定部４００１の動作について説明する。辞書化対象データ抽出部４０００で得られた辞書化対象データＤ４００２と辞書バッファ４００５に存在するSymbolを比較する（ＳＴ４００２）。今回は比較するSymbolが辞書バッファ４００５に登録さているので比較を行う。『T』と比較する。ここでは不一致という結果(一致判定結果Ｒ４００３)を出力する（ＳＴ４００３、ＮＯ）。判定方法は、既知の方法を適用することができる。

Symbol・Symbol位置情報登録部４００２の動作について説明する。『不一致』なので（ＳＴ４００３、ＮＯ）、
・『I』をSymbolとして辞書バッファ４００５に登録（ＳＴ４００５）
・『I』が(19,1)の位置にあるという情報を辞書バッファ４００５に登録（ＳＴ４００５）
この時の辞書バッファ４００５の状態を図５９に示す。

この時の辞書バッファ４００５の状態を図６０に示す。

続いて次の辞書化対象データ抽出部４０００の作業を行う。辞書化対象データ抽出部４０００は、図４０の２ページ目の入力画像から辞書化対象データＤ４００２を抽出する（ＳＴ４００１）。ここでは先に登録・判定されたSymbolは除外して抽出を行う。

左から右、上から下に黒画素を探索すると(19,1)の黒画素が見つかる(左上を(0,0)とする：左二つの『T』と『I』は登録済みなので除外して探索する：本抽出部に画像を入力する時点で該当の『T』『I』を削除しておくことも可能）。

(22,1)の黒画素の連結成分を抽出することにより図４０の右端の『T』を候補として得ることができる。辞書化対象データの抽出方法は、既知の方法を適用することができる。

Symbol一致判定部４００１の動作について説明する。辞書化対象データ抽出部４０００で得られた辞書化対象データＤ４００２と辞書バッファ４００５に存在するSymbolを比較する（ＳＴ４００２）。今回は比較するSymbolが辞書バッファ４００５に登録さているので比較を行う。『T』『I』と比較する。ここでは左端の『T』と一致という結果(一致判定結果Ｒ４００３)を出力する（ＳＴ４００３、ＹＥＳ）。判定方法は、既知の方法を適用することができる。

Symbol・Symbol位置情報登録部４００２の動作について説明する。『左端の『T』と一致』なので（ＳＴ４００３、ＹＥＳ）、
・一致しているSymbolが左端の『T』とわかる情報(ID番号)を辞書バッファ４００５に登録（ＳＴ４００４）
・この『T』が2ページ目の(10,1)にあるという位置情報を辞書バッファ４００５に登録（ＳＴ４００４）
この時の辞書バッファ４００５の状態を図６１に示す。

ユーザは予定しているすべての辞書登録が終わったので（ＳＴ４００７、ＹＥＳ）、辞書情報出力フラグＦ４００１をONにし、Symbol情報Ｉ４００４とSymbol位置情報Ｉ４００５を取り出す。

辞書情報出力部４００３は、辞書情報出力フラグＦ４００１がONであるので辞書バッファ４００５にあるSymbol情報Ｉ４００４とSymbol位置情報Ｉ４００５を出力し（ＳＴ４００８）、その後辞書バッファ４００５を初期化する（ＳＴ４００９）。

以上により、初めに辞書候補として挙がった画像をそのまま辞書(Symbol)として登録した場合に比べて、画質が良くなるという利点がある。初めに辞書候補として挙がった画像をそのまま辞書(Symbol)として登録した場合には、図４６に示すような復号画像となってしまう。これに対して本実施形態４−１の復号結果は、図６２に示すようになる。

図６４は、本発明の実施形態４−２に係る画像処理装置（画像圧縮装置）の全体構成の一例を示す図であり、図６３は、本発明の実施形態４−２に係る画像処理装置（画像圧縮装置）の詳細構成の一例を示す図である。図６５は、本発明の実施形態４−２に係る圧縮処理の一例を示す図である。

Symbol修正部４００６は、ユーザの指定するSymbol修正タイミングで（ＳＴ４００６ａ、ＹＥＳ）、Symbolのエッジ鮮鋭化処理やノイズ除去部の処理が動作する（ＳＴ４００６ｂ）処理部である。これにより、登録されたSymbolをすぐに修正することによって生じる、『一致する辞書候補画像がsymbolを修正しない従来のものと変わる』といった現象を防ぐことができる。ユーザの修正したいタイミングでSymbolの修正を行えるという利点がある。

以下に、上記した実施形態４−１と４−２についてまとめる。

（１）画像処理装置は、電子データを入力とし、辞書化対象範囲を出力する辞書化対象範囲決定部と、電子データと辞書化対象範囲を入力とし、辞書ビットマップとするか否かを判定する辞書化判定結果を出力する辞書化判定部と、電子データと辞書化判定結果を入力とし、辞書化判定結果が辞書ビットマップを作成する判定の場合に辞書ビットマップ情報を作成し出力する辞書BMP作成部と、辞書化対象範囲と辞書化判定結果と辞書バッファ(辞書ビットマップ情報群)を入力とし、辞書化対象となる辞書ビットマップ情報とその位置を関連付けた文字位置情報を出力する文字位置情報作成部と、辞書バッファの辞書ビットマップ情報群のデータを圧縮がし易い形に形状変換し出力する辞書ビットマップ形状変換部を備える。さらに、形状変換部の入力に入力画像・文字位置情報を加えることにより、入力データを考慮して辞書ビットマップの形状を変更する。さらに、辞書情報生成手段が入力パラメータで制御される。

より具体的には、以下の通りである。

（２）画像処理装置は、画像情報を辞書ビットマップ(Symbol)とその位置情報に分離し保存することにより圧縮する画像を入力として辞書化対象データ(辞書候補画像)を出力する辞書化対象データ抽出部と、辞書化対象データを入力として、辞書バッファに登録されているSymbolと一致しているか否かを判定するSymbol一致判定部と、辞書化対象データと一致判定結果を入力として、Symbolが一致している場合は、辞書化対象データ(Symbol)と、一致Symbolの情報(ID等)とSymbol位置情報を辞書バッファに登録する、Symbolが一致していない場合は、辞書化対象データ(Symbol)と、Symbol位置情報を辞書バッファに登録する、Symbol・Symbol位置情報登録部と、辞書バッファのSymbol情報とSymbol位置情報を出力する辞書情報出力部と、を備え、辞書バッファのSymbolに対し輪郭を滑らかにする処理と、ノイズ除去処理をする。

（３）画像処理装置は、画像情報を辞書ビットマップ(Symbol)とその位置情報に分離し保存することにより圧縮する画像を入力として辞書化対象データ(辞書候補画像)を出力する辞書化対象データ抽出部と、辞書化対象データを入力として、辞書バッファに登録されているSymbolと一致しているか否かを判定するSymbol一致判定部と、辞書化対象データと一致判定結果を入力として、Symbolが一致している場合は、辞書化対象データ(Symbol)と、一致Symbolの情報(ID等)とSymbol位置情報を辞書バッファに登録する、Symbolが一致していない場合は、辞書化対象データ(Symbol)と、Symbol位置情報を辞書バッファに登録する、Symbol・Symbol位置情報登録部と、辞書バッファのSymbol情報とSymbol位置情報を出力する辞書情報出力部と、を備え、辞書バッファのSymbolに対し輪郭を滑らかにする処理と、ノイズ除去処理をユーザの指定するタイミングで行う。

次に、本発明の実施形態５について説明する。

画像同士を比較し、お互いが同一のものかを比較したり、ある第一の画像と同じ画像が第二の画像中に存在するか否か等を調べたりして、画像を圧縮する技術が提案されている。

ISO/IEC14492は、国際標準となっている２値圧縮技術のJBIG2の技術を開示している。これは画像のある領域や文字(文字列等)をひとつの辞書画像として捉え(例えば１文字の画像)、共通するものは同じ辞書画像として扱い、辞書画像と位置情報を持つことによりデータを圧縮する方法である。これらは特定のパターンを持つ画像(文字画像やハーフトーン画像等)に対して効果を発揮する。これをスキャン画像に応用し、特定のパターン(画像)を探しながら辞書画像とマッチングを行い、一致するものが無ければ辞書に登録していくことによりスキャン画像の高圧縮化を実現できる。

特開２００６−２３９７６は、画像中に任意のテンプレート画像と同じ・もしくは同じような画像が存在するかを調べる技術を開示している。特開２００６−２３９７６の基本技術はテンプレートマッチング法と呼ばれ、画像中にテンプレート画像(第一の画像)と同じ画像が無いかを調べる為に、第二の画像に対して第一の画像を少しずつずらしながらマッチング(比較)をする技術である。このテンプレートマッチングのマッチング精度を保った上で計算量を削減する方法として、特開２００６−２３９７６のような提案がされている。この技術はテンプレートマッチングにおいて、テンプレートのノイズ量とテンプレート特徴量を用いて、テンプレートをずらしながら走査するときの「ずらし量」と画像の変形を考慮した「変形量」、画像の抽出可否を決定する「閾値」の３パラメータを自動で設定するものである。これらはテンプレートの特徴に併せて３つのパラメータを自動で設定するものでありテンプレートに応じたマッチングの判断ができる。

上記２つの方法は似たように画像同士を比較する方法であるが、比較する画像を探し・作りながら比較し辞書を作成する技術と、あらかじめ比較する画像があり似たような画像が別画像にないかを比較する技術という点で大きく異なる。

ISO/IEC14492では、図８２に示すような処理装置を用いることにより、入力画像から特徴画像(例えば文字)を抽出し、同じ文字画像は１つの辞書画像として保持し、それに対応する位置情報を持つことによりデータ量を削減することにより圧縮することが可能である。しかし図８２のような処理装置では、特徴画像毎の特徴を捉えた一致判定(特徴画像毎にマッチングパラメータを設定)ができないので、誤判定をする可能性が高い。

特開２００６−２３９７６は、テンプレートマッチングの精度向上・高速化に関する技術を開示している。図８３に示すように、特開２００６−２３９７６に開示された技術では、テンプレート画像に合わせて画像抽出可否を決定する「閾値」やテンプレート画像の「ずらし量」、画像の「変形量」を決定しているが、これはテンプレート画像に対して一意に決定しており探索対象となる画像の特徴を用いていない為、対象画像によっては全く効果が無い可能性がある。この技術はテンプレート情報を用いて上記３パラメータを決定するが、これはテンプレートマッチングにのみ適用可能であり、ISO/IEC14492のような、入力画像から同一の特徴画像(例えば文字)を抽出し、辞書画像を作成するような場合に構成からして異なるので適用できない(そもそも図８２のような装置にはテンプレートマッチングのようなずらし量等の概念は無いし、比較目的や実現する為の構成が全く異なる)。

実施形態５に係る画像処理装置（画像圧縮装置）は、２値や多値の入力画像から特定のパターン(画像)を探しながら辞書画像とマッチングを行い、一致するものが無ければ辞書に登録する装置であって、画像マッチングの誤判定を減らすことに優れる。動的に辞書を作成する時に判断するSymbol(Pattern)と辞書画像の一致判定を行うパラメータを、辞書画像と比較するSymbol(Pattern)画像の情報を用いて自動で決定する。

実施形態５に係る画像処理装置は、任意の入力画像からある領域を取り出し、その領域画像が１つ以上の辞書画像と一致しているかを判断し、一致していなければ辞書に登録する。実施形態５に係る画像処理装置は、以下のような各部によって構成される。

・領域画像抽出部
・マッチングパラメータ決定部
・一致判定部
・辞書登録部
（・辞書）
実施形態５に係る画像処理装置は、上記構成により、入力領域画像毎に最適なマッチングパラメータでマッチング判定をすることができ、誤判定を減らしつつ辞書を作成することができる。

図６６に示す入力画像から文字を抽出し文字と辞書の一致判定を行い、最小限の辞書画像を作成したい場合について説明する。

実施形態５に係る画像処理装置を適用しない場合、つまりlossyパラメータの場合(一致判定条件が緩いもの)、以下のように判定される。

・両端のAは一致と判定
・中央のｌと１も一致と判定
最終的な画像は図６７に示すようになり、『l』と『１』の区別がつかなくなる。

また、near-losslessパラメータの場合(一致判定条件が厳しいもの)、以下のように判定される。

・両端のAは不一致と判定
・中央のｌと１も不一致と判定
『l』『１』を区別する為にパラメータを厳しくすると、最終的な画像は図６８に示すようになり、両端の『A』も一致しなくなり、高圧縮できなくなる。

実施形態５に係る画像処理装置は、サイズの大きいSymbolの比較はlossyパラメータで、サイズの小さいSymbolの比較はnear-losslessパラメータで処理する。その結果、以下のように判定される。

・両端のAは一致と判定
・中央のｌと１も不一致と判定
この場合、最終的な画像は図６９に示すようになる。つまり、上記条件を加えることにより必要な画質を保ちつつ、効果的に圧縮することができる。

以下、本発明の実施形態５について詳細に説明する。

図７０は、本発明の実施形態５−１に係る画像処理装置（画像圧縮装置）の全体構成の一例を示す図であり、図７６は、本発明の実施形態５−１に係る画像処理装置（画像圧縮装置）のマッチングパラメータ決定部５００１の詳細を示す図である。

実施形態５−１に係る画像処理装置は、２値や多値の入力画像から特徴画像（文字画像）を抽出し、同じと思われる文字は同一の辞書画像として抽出することにより入力画像に存在する文字タイプを抽出する。なお、特徴画像は、文字画像以外に、記号やテクスチャ等の繰り返し発生し得る特徴を持つ画像すべてを指す。

実施形態５−１に係る画像処理装置は、２値や多値の入力画像を入力することにより、入力画像に含まれる重複しない２値や多値の文字画像を得ることができる。これにより２値や多値の入力画像中にどのようなタイプの文字が存在するかを確認することができる。これは例えば非常用漢字(特殊文字)が使われていないかの確認等に使える。

図７１は、入力画像の一例を示し、図７２〜図７５は、辞書バッファ５００３にバッファリングされた入力画像の一例を示す図である。特徴画像抽出部５０００は、例えば、図７１に示す入力画像から、既存の文字切り出し処理を用いて、文字を順に抽出し、図７２〜図７５に示す特徴画像（特徴画像情報Ｉ５００１）を出力する。

図７６は、上記したマッチングパラメータを決定するマッチングパラメータ決定部５００１の概略構成を示すブロック図である。マッチングパラメータ決定部５００１は、特徴画像抽出部５０００より抽出された特徴画像情報Ｉ５００１を入力として、マッチングパラメータの決定を行う。ここでマッチングパラメータとは画像同士が一致・不一致しているか否かを判定するための閾値やマッチングアルゴリズムのサブファンクションの動作のON/OFFを制御をする為のパラメータである。

これらのパラメータを特徴画像情報Ｉ５００１より決定する。このパラメータの決定方法として、特徴画像情報Ｉ５００１の画像幅・高さを用いて決定する。マッチングパラメータ決定部５００１は、『画像幅×２＜画像高さ』である場合にはマッチング条件を厳しくする等といった条件が示されており、マッチングパラメータを決定する。

例えば、『画像幅×２＜画像高さ』の場合はマッチング条件が厳しくなるようにマッチングパラメータを調整、『画像幅×２＞＝画像高さ』の場合はマッチング条件が緩くなるようにマッチングパラメータを調整する。

図７２に示す入力画像の左端の『Ａ』という特徴画像は後者の条件に当てはまるので、マッチング条件が緩いパラメータが選択される。ここで決定したマッチングパラメータＰ５００３が出力される。

その他のマッチングパラメータの決定方法としては、以下のようなものが挙げられる。

（１）徴画像情報のメタデータ(画像幅・高さ・解像度・注釈情報等)を抽出し、その情報を用いてマッチングパラメータを決定する。

例１：画像幅を用いる
fやl等幅の狭い文字は誤判定し易い場合があるので、幅の狭い文字のみ一致条件を厳しくして誤判定を減らすことができる。

例２：注釈(文字タイプ：日・英・数字)
言語間のマッチングミスを減らすことができる。１(数字のイチ）とｌ(英語の小文字のエル）も明確に分離できる。

（２）特徴画像情報のノイズ量を抽出し、その情報を用いてパラメータを決定する。例えば２値画像の単純２値画像と誤差拡散文字を明確に区別できる。

（３）特徴画像情報の色数をカウントし、その情報を用いてマッチングパラメータを決定する。あらかじめ色情報を見ておくことにより、カラー用のマッチング条件に変えるといったことができ、マッチング精度向上や処理の高速化が可能となる。

（４）特徴画像情報の線幅を抽出し、その情報を用いてマッチングパラメータを決定する。細い線は少し太くなってしまっただけでも目立つので、その対処方法として有効である。すべて一律で一致判定を厳しくすると、あまり線幅の変化が分からない太い線の一致判定率が悪くなる。

（５）特徴画像情報の傾きを抽出し、その情報を用いてマッチングパラメータを決定する。文章などの場合は少し傾いただけでも目立つので、その対処方法として有効である。

一致判定部５００２は、特徴画像情報Ｉ５００１とマッチングパラメータ決定部５００１で決定したマッチングパラメータＰ５００２を入力として、特徴画像情報Ｉ５００１が辞書バッファ５００３に登録されている辞書画像と一致(類似)しているかを判定する。その結果(一致・不一致)を一致判定フラグＦ５００４として出力する。

例えば、この時点では辞書には何も登録されていないので、一致判定フラグＦ５００４を不一致として出力する。

辞書登録部５００４は、一致判定フラグＦ５００４が不一致だった場合、特徴画像情報Ｉ５００１を辞書バッファ５００３に登録する。一致判定フラグＦ５００４が一致だった場合、特徴画像情報Ｉ５００１を辞書バッファ５００３へ登録しない。

図７２に示すケースでは、一致判定フラグＦ５００４は不一致なので、特徴画像情報Ｉ５００１を辞書バッファ５００３に登録する。同様の処理を次の「１」「ｌ」「Ａ」についても行い、図７２〜図７５は、両端のＡのみ一致した例を示す。

一致判断条件(マッチング条件)を固定にしてしまっている場合、例えばマッチング条件を一律で厳しくしてしまった場合は、図７１に示す入力画像の文字がすべて不一致と判定されてしまい、一致と判断して欲しいレベルの文字の違いまで不一致とされてしまう。

逆にマッチング条件を一律で緩くしてしまった場合、両端の「Ａ」は一致と判定されるが、中央の「１(イチ)」と「ｌ(エル)」も同じと判定されてしまい、復元時に望む情報が得られない。

本実施形態５−１の画像処理装置は、マッチングパラメータを動的に変更させることにより、あらかじめ間違え易いと思われる特徴画像のみマッチング条件を厳しくすることが可能となる為、望む結果を得やすくなる。

図７７は、本発明の実施形態５−２に係る画像処理装置（画像圧縮装置）の全体構成の一例を示す図である。

実施形態５−２に係る画像処理装置は、２値や多値の入力画像から特徴画像（文字画像）を抽出し、同じと思われる文字は同一の辞書画像として保存し、さらにその位置情報を保存することにより必要なデータ量を削減することができる。特徴画像は文字画像以外に、記号やテクスチャ等の繰り返し発生し得る特徴を持つ画像すべてを指す。

実施形態５−２に係る画像処理装置は、２値や多値の入力画像を入力することにより、入力画像に含まれる重複しない２値や多値の文字画像と、各々入力画像に存在していた位置情報を得ることができる。これらの情報を得ることにより、ISO/IEC14492のSymbolDictionaryのJBIG2等を用いて画像の高圧縮化が実現できる。

図７１は、入力画像の一例を示し、図７８〜図８１は、辞書バッファ５００３にバッファリングされた入力画像と、位置情報バッファ５００５にバッファリングされた位置情報の一例を示す図である。特徴画像抽出部５０００は、例えば、図７１に示す入力画像から、既存の文字切り出し処理を用いて、文字を順に抽出し、図７８〜図８１に示す特徴画像（特徴画像情報Ｉ５００１）を出力する。まず、左の『Ａ』という文字画像(特徴画像情報Ｉ５００１)を抽出し、その位置情報(特徴画像位置情報Ｉ５００２)も出力する。

マッチングパラメータ決定部５００１は、特徴画像抽出部５０００より抽出された特徴画像情報Ｉ５００１を入力として、マッチングパラメータの決定を行う。ここでマッチングパラメータとは画像同士が一致・不一致しているか否かを判定するための閾値やマッチングアルゴリズムのサブファンクションの動作のON/OFFを制御をする為のパラメータである。

上記したマッチングパラメータを決定するマッチングパラメータ決定部５００１は、図７６に示す通りである。

図７８に示す入力画像の左端の『Ａ』という特徴画像は後者の条件に当てはまるので、マッチング条件が緩いパラメータが選択される。ここで決定したマッチングパラメータＰ５００３が出力される。

もし、一致している場合は、一致している辞書情報（ID等：一致辞書情報Ｉ５００５)も出力する。

辞書登録部５００４は、一致判定フラグＦ５００４が不一致だった場合、特徴画像情報Ｉ５００１にID番号等の管理情報を付与して辞書バッファ５００３に登録する。また登録判定フラグＦ５００６をONにし、登録したという情報を出力する。また登録した辞書情報(ID等：登録辞書情報Ｉ５００７)も出力する。一致判定フラグＦ５００４が一致だった場合、辞書バッファ５００３への登録は行わないし、登録辞書情報Ｉ５００６の出力も不要である。

図７８に示すケースでは、一致判定フラグＦ５００４は不一致なので、特徴画像情報Ｉ５００１に『ID番号=１』という管理情報を付与して辞書バッファ５００３に登録する。また登録した辞書情報(『ID=1』：登録辞書情報Ｉ５００７)も出力する。位置情報登録部５００５は、特徴画像の位置情報を位置情報バッファ５００６に登録する。

一致判定フラグＦ５００４が一致だった場合は、一致辞書情報Ｉ５００５と特徴画像位置情報Ｉ５００２の情報をリンクさせて位置情報バッファ５００６に登録する。一致判定フラグＦ５００４が不一致だった場合は、登録辞書情報Ｉ５００６と特徴画像位置情報Ｉ５００２の情報をリンクさせて位置情報バッファ５００６に登録する。

図７８に示すように、この時点(左の『Ａ』)では不一致なので、ID1：座標(0,0)といった情報を位置情報バッファ５００６に保存する。図７８は、この時点での辞書バッファ５００３と位置情報バッファ５００６の状態を示す図である。

同様の処理を次の「１」「ｌ」「Ａ」についても行い、図７８〜図８１は、両端のＡのみ一致した例を示す。

パラメータを固定にしてしまっている場合、例えばマッチング条件を一律で厳しくしてしまった場合は、図５の入力画像の文字がすべて不一致と判定されてしまう為、データ量が削減できない。

本実施形態５−２の画像処理装置は、マッチングパラメータを動的に変更させることにより、あらかじめ間違え易いと思われる特徴画像のみマッチング条件を厳しくすることが可能となる為、望む結果を得易くなる。そのため画質(情報)を保った上でデータ量を削減することができる(両端のＡは一致、中央の2文字は不一致(図７１のような結果))。

以下に、上記した実施形態５−１と５−２についてまとめる。

（１）画像処理装置は、任意の入力画像からある領域を取り出し、その領域画像が１つ以上の辞書画像と一致しているかを判断し、一致していなければ辞書に登録するような画像処理装置であって、入力画像から1つ以上の領域画像を生成する領域画像作成部と、領域画像作成部で作成された領域画像を入力としてマッチングパラメータを決定し出力するマッチングパラメータ決定部と、領域画像作成部で作成された領域画像と辞書にある辞書画像が一致しているかをマッチングパラメータ決定部で決定したマッチングパラメータで判定する一致判定部と、一致判定部で判定された一致判定結果が不一致と判断された場合、領域画像を辞書に登録する辞書登録部と、を備える。

より具体的には、以下の通りである。

（２）画像処理装置は、入力画像を特徴画像を抽出する特徴画像抽出部と、特徴画像とマッチングパラメータを入力として、特徴画像と辞書に登録されている辞書画像が一致しているのかを判定し、一致判定結果を出力する一致判定部と、一致判定結果と特徴画像を入力として、一致判定結果が不一致の場合のみ特徴画像情報を辞書に登録する画像処理装置であって、特徴画像を入力としてマッチングパラメータを決定するマッチングパラメータ決定部を備える。特徴画像の特徴に併せてマッチングをすることができるので、高精度なマッチング(一致判定)が可能となる。よって高精度な辞書画像を得ることができる。

（３）画像処理装置は、画像から特徴画像を抽出し特徴画像情報と特徴画像の位置情報を出力する特徴画像抽出部と、特徴画像とマッチングパラメータを入力として、特徴画像と辞書に登録されている辞書画像が一致しているのかを判定し、一致判定結果と一致している辞書の情報を出力する一致判定部と、特徴画像と一致判定部の出力である一致判定結果を入力とし、不一致の場合のみ特徴画像を辞書に登録し登録した辞書の情報を出力する辞書登録部と、特徴画像の位置情報と、一致判定結果、一致判定部から一致判定された場合のみに出力される一致辞書情報と、不一致だった場合のみ辞書登録部から出力される登録辞書情報を入力とし、一致判定結果が一致であれば一致辞書情報と特徴画像位置情報をリンクさせて辞書の位置情報として出力、不一致であれば登録辞書情報と特徴画像位置情報をリンクさせて辞書の位置情報として出力する位置情報登録部を備える画像処理装置であって、特徴画像を入力としてマッチングパラメータを決定するマッチングパラメータ決定部を備える。特徴画像の特徴に併せてマッチングをすることができるので、高精度なマッチング(一致判定)が可能となる。また辞書画像とその位置情報を出力するので、画質不具合の少ない高精度・高圧縮な辞書圧縮ファイルが生成できる。

次に、本発明の実施形態６について説明する。

２値画像を効率よく圧縮するために、画像ビットマップを辞書化してインデックス（該当辞書番号とその配置）と辞書を圧縮データとする方式を標準化したものとしてISO/IEC14492のJBIG2圧縮がある。JBIG2は文字領域・ハーフトーン領域・それ以外の領域と分類し各々適した圧縮方式を適用した方式である。

しかしこのようなSymbolとその位置情報を保存することにより圧縮させる方式(辞書圧縮)において、ある程度の異なりは同じと判断しSymbolを置き換える場合、マッチングをミスすると最悪の場合、文字などの情報が異なってしまう(情報が変化してしまう)。

そこで、実施形態６に係る画像処理装置（画像圧縮装置）は、図８５〜図８７に示すように、辞書データとは別に、非可逆マッチングにより発生する画質劣化を補う補完画像を作成し、復号時に重ね合わせることにより画質劣化を低減することができる。

図８４は、本発明の実施形態６に係る画像処理装置（画像圧縮装置）の全体構成の一例を示す図である。画像処理装置は、マッチング判定部６０００、辞書６００１、セレクタ６００２、差分画素抽出部６００３、差分画素登録部６００４、差分画像バッファ６００５を備える。

具体的には、図８５に示すように、マッチング判定部６０００及び辞書６００１による非可逆マッチングによる辞書圧縮において、差分画素抽出部６００３が黒画素が白画素に変化する画素を抽出し、差分画素登録部６００４が抽出画素群をその他の画像として持ち、差分画像バッファ６００５が復号時に差分画像を出力し、差分画像と辞書データと重ね合わせることにより画素変化を防ぐ。なお、黒画素：bit=1、白画素：bit=0とする。

また、図８６に示すように、マッチング判定部６０００及び辞書６００１による非可逆マッチングによる辞書圧縮において、差分画素抽出部６００３が白画素が黒画素に変化する画素を抽出し、差分画素登録部６００４が抽出画素群をその他の画像として持ち、差分画像バッファ６００５が復号時に差分画像を出力し、差分画像と辞書データと重ね合わせることにより画素変化を防ぐ。なお、黒画素：bit=1、白画素：bit=0とする。

また、図８７に示すように、マッチング判定部６０００及び辞書６００１による非可逆マッチングによる辞書圧縮において、差分画素抽出部６００３が情報が変化する画素を抽出し、差分画素登録部６００４が抽出画素群をその他の画像として持ち、差分画像バッファ６００５が復号時に差分画像を出力し、差分画像と辞書データと重ね合わせることにより画素変化を防ぐ。なお、黒画素：bit=1、白画素：bit=0とする。

以下に、上記した実施形態６についてまとめる。

（１）画像処理装置は、Symbolとその位置情報を保存し、画像を圧縮する場合に、ある程度の異なりは同じと判断しSymbolを置き換える場合に発生する、画素の差を差分画像として保存する。これにより、効果的に圧縮を行うことができ、かつ辞書化(非可逆マッチング)による情報劣化を低減させる。状況に応じて多少の画質劣化を気にしないような場合は、辞書情報の復号のみ実行し、高速表示(差分画像の復号をしない)が可能である。このように高速表示／画質優先表示を切り替えることができる。

より具体的には、以下の通りである。

（２）画像処理装置は、画像情報を辞書ビットマップとその位置情報に分離し保存することにより圧縮する画像を入力とし、辞書化対象画像(Symbol画像)を出力するSymbol抽出部と、Symbol画像を入力とし、それが辞書に登録されている辞書Symbolと一致しているかを判定し、一致判定結果を出力するSymbol一致判定部と、Symbol画像と一致判定結果を入力とし、Symbolが一致している場合は、一致辞書Symbolの情報とSymbol位置情報を辞書バッファに登録、Symbolが一致していない場合は、Symbol情報とSymbol位置情報を辞書に登録するSymbol・Symbol位置情報登録部と、を備え、2値Symbol画像情報と辞書データを入力として、Symbolと辞書データが一致しているかを判定するマッチング判定部６０００と、2値Symbolを辞書に登録されているSymbolに置き換えることにより、画素情報が変化する画素を抽出する差分画素抽出部６００３と、差分画素抽出部の出力である差分画像を差分画像バッファに登録する差分画素登録部６００４と、差分画素抽出部の処理をするか否かを切り替えるセレクタ６００２と、を備える。

なお、本願発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適当な組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
以下、本願の出願当初の特許請求の範囲に記載された発明を付記する。
［１］
入力画像を分析する分析手段と、
前記分析手段の分析結果に基づき第１のグループに属する第１の画像を第１の圧縮パラメータで圧縮し、第２のグループに属する第２の画像を前記第１の圧縮パラメータより画像劣化をする可能性のある第２の圧縮パラメータで圧縮する圧縮手段と、
を備えた画像処理装置。
［２］
前記分析手段は、前記入力画像に含まれた各文字情報を認識し、
前記圧縮手段は、文字認識結果に基づき前記第１のグループに属する第１の文字画像を前記第１の圧縮パラメータで圧縮し、前記第２のグループに属する第２の文字画像を前記第２の圧縮パラメータで圧縮する［１］に記載の画像処理装置。
［３］
前記圧縮手段は、前記第２の文字情報と同一と判定された第３の文字画像を、前記第２の画像に対応した第２の符号化情報により圧縮する［２］に記載の画像処理装置。
［４］
前記圧縮手段は、前記第１の文字画像に対応した第１の符号化情報を生成し、前記第１の文字画像を前記第１の符号化情報により圧縮し、前記第２の文字画像に対応した第２の符号化情報を生成し、前記第２の文字画像を前記第２の符号化情報により圧縮し、前記第３の文字画像を前記第２の符号化情報により圧縮する［３］に記載の画像処理装置。
［５］
前記圧縮手段は、前記第１の文字画像に対応した前記第１の符号化情報と第１の位置情報を生成し、前記第２の文字情報に対応した前記第２の符号化情報と第２の位置情報を生成し、前記第１の文字画像を前記第１の符号化情報と前記第１の位置情報により圧縮し、前記第２の文字画像を前記第２の符号化情報と前記第２の位置情報により圧縮し、前記第３の文字画像を前記第２の符号化情報と前記第３の文字情報に対応した第３の位置情報により圧縮する［４］に記載の画像処理装置。
［６］
前記分析手段は、文字認識結果に基づき所定の文字列毎に被圧縮画像を作成する［２］に記載の画像処理装置。
［７］
前記分析手段は、文字認識結果に基づき数字の画像を前記第１の圧縮パラメータで圧縮する［２］に記載の画像処理装置。
［８］
前記分析手段は、文字認識結果に基づき特定のキーワードに続く数字又は数列の画像を前記第１の圧縮パラメータで圧縮する［２］に記載の画像処理装置。
［９］
前記分析手段は、前記入力画像に含まれた文字・非文字領域情報のレイアウトを分析し、
前記圧縮手段は、レイアウト分析結果に基づき前記第１のグループに属する見出し、表、又はグラフの画像を前記第１の圧縮パラメータで圧縮し、前記第２のグループに属する前記見出し、表、又はグラフに該当しない画像を前記第２の圧縮パラメータで圧縮する［１］に記載の画像処理装置。
［１０］
入力画像を分析し、
分析結果に基づき第１のグループに属する第１の画像を第１の圧縮パラメータで圧縮し、第２のグループに属する第２の画像を前記第１の圧縮パラメータより画像劣化をする可能性のある第２の圧縮パラメータで圧縮する画像処理方法。

１００１…スキャナ、１００２…レイアウト解析部、１００３…画像部品化部、１００４…文字認識部、１００５…文字分離部、１００６…画像辞書化部、１００７…画像符号化部、１００８…画像ファイル部

特開２００７−８６９５６号公報特開２００５−３０１６６３号公報特開２００７−２５８１５号公報

Claims

第１の登録キーワード、及び前記第１の登録キーワードの誤認識のパターンである第２の登録キーワードを登録し、誤認識されやすい数字又はアルファベットを登録する登録手段と、
入力画像を分析する分析手段と、
前記分析手段の分析結果に基づき前記第１の登録キーワードに該当する第１の文字列画像を第１の圧縮パラメータで可逆圧縮し、前記第２の登録キーワードに該当する第２の文字列画像を第１の圧縮パラメータで可逆圧縮し、前記登録された数字又はアルファベットに該当する画像を前記第１の圧縮パラメータより画像劣化をする可能性のある第２の圧縮パラメータで可逆圧縮する圧縮手段と、
を備える画像処理装置。
前記圧縮手段は、前記第１の文字列画像に対応した第１の符号化情報を生成し、前記第１の文字列画像を前記第１の符号化情報により圧縮し、前記第２の文字列画像に対応した第２の符号化情報を生成し、前記第２の文字列画像を前記第２の符号化情報により圧縮し、前記文字画像を前記第２の符号化情報により圧縮する請求項１に記載の画像処理装置。
前記分析手段は、文字認識結果に基づき所定の文字列毎に被圧縮画像を作成する請求項１に記載の画像処理装置。
前記圧縮手段は、文字認識結果に基づき、誤認識されやすい数字又はアルファベットの画像を前記第２の圧縮パラメータで圧縮する請求項１に記載の画像処理装置。
入力画像を分析し、
分析結果に基づき第１の登録キーワードに該当する第１の文字列画像を第１の圧縮パラメータで可逆圧縮し、前記第１の登録キーワードの誤認識のパターンである第２の登録キーワードに該当する第２の文字列画像を前記第１の圧縮パラメータで可逆圧縮し、誤認識されやすい数字又はアルファベットに該当する画像を前記第１の圧縮パラメータより画像劣化をする可能性のある第２の圧縮パラメータで可逆圧縮する画像処理方法。