JP4280508B2 - 位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法 - Google Patents
位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法 Download PDFInfo
- Publication number
- JP4280508B2 JP4280508B2 JP2003025140A JP2003025140A JP4280508B2 JP 4280508 B2 JP4280508 B2 JP 4280508B2 JP 2003025140 A JP2003025140 A JP 2003025140A JP 2003025140 A JP2003025140 A JP 2003025140A JP 4280508 B2 JP4280508 B2 JP 4280508B2
- Authority
- JP
- Japan
- Prior art keywords
- page
- packet length
- positional deviation
- image
- reference point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Description
【発明の属する技術分野】
本発明は、位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法に関する。
【0002】
【従来の技術】
画像入力技術およびその出力技術の進歩により、画像に対して高精細化の要求が、近年非常に高まっている。例えば、画像入力装置として、デジタルカメラ(Digital Camera)を例にあげると、300万以上の画素数を持つ高性能な電荷結合素子(CCD:Charge Coupled Device)の低価格化が進み、普及価格帯の製品においても広く用いられるようになってきた。そして、このピクセル数の増加傾向は、なおしばらくは続くと言われている。
【0003】
一方、画像出力・表示装置に関しても、例えば、レーザプリンタ、インクジェットプリンタ、昇華型プリンタ等のハード・コピー分野における製品、そして、CRTやLCD(液晶表示デバイス)、PDP(プラズマ表示デバイス)等のフラットパネルディスプレイのソフト・コピー分野における製品の高精細化・低価格化は目を見張るものがある。
【0004】
こうした高性能・低価格な画像入出力製品の市場投入効果によって、高精細画像の大衆化が始まっており、今後はあらゆる場面で、高精細画像の需要が高まると予想されている。実際、パーソナルコンピュータ(Personal Computer)やインターネットをはじめとするネットワークに関連する技術の発達は、こうしたトレンドをますます加速させている。特に最近は、携帯電話やノートパソコン等のモバイル機器の普及速度が非常に大きく、高精細な画像を、あらゆる地点から通信手段を用いて伝送あるいは受信する機会が急増している。
【0005】
これらを背景に、高精細画像の取扱いを容易にする画像圧縮伸長技術に対する高性能化あるいは多機能化の要求は、今後ますます強くなっていくことは必至と思われる。
【0006】
そこで、近年においては、こうした要求を満たす画像圧縮方式の一つとして、高圧縮率でも高画質な画像を復元可能なJPEG2000という新しい方式が規格化されつつある。かかるJPEG2000においては、画像を矩形領域(タイル)に分割することにより、少ないメモリ環境下で圧縮伸長処理を行うことが可能である。すなわち、個々のタイルが圧縮伸長プロセスを実行する際の基本単位となり、圧縮伸長動作はタイル毎に独立に行うことができる。
【0007】
ところで、一般に、紙文書(原稿)を電子化して保存するような場合には、以下に示すような処理を順番に実行することになる。まず、紙文書(原稿)をスキャナやデジタルスチルカメラ等の画像入力装置を使用して一枚ずつ読み込む。次いで、読み込んだ画像データをJPEGやJPEG2000等の符号化データに画像圧縮装置を使用して変換する。最後に、圧縮処理した符号化データを記憶装置に記憶保存する。
【0008】
しかしながら、複数の紙文書(原稿)をスキャナ等の画像入力装置を使用して読み込む場合、電子化された紙文書(原稿)のページ座標の原点位置が、紙文書(原稿)毎に異なってしまうことがある。ここで、ページ座標とは電子化された紙文書(原稿)上に設けられた座標であり、図21に示すように、ページ座標の原点位置とはその電子化された紙文書(原稿)の原稿範囲における1つの角部である。すなわち、電子化された紙文書(原稿)のページ座標の原点位置が紙文書(原稿)毎に異なるということは、図21に示すように、スキャナ等の画像入力装置に設けられた読取範囲の絶対座標(読取座標)に対する相対的な位置関係が紙文書(原稿)毎に異なるということになる。
【0009】
このように電子化された紙文書(原稿)のページ座標の原点位置が紙文書(原稿)毎に異なるような場合には、それらの紙文書(原稿)に対して画像検索処理を実行した際に、精度の高い検索結果を得ることができない。
【0010】
そこで、このようなページ座標の位置ずれを補正するために、再度、紙文書(原稿)の位置合せを行うようにしている。
【0011】
【発明が解決しようとする課題】
しかしながら、入力する紙文書(原稿)について一枚一枚位置合せを行うことは、多数の紙文書(原稿)が入力対象である場合には、事実上不可能である。
【0012】
また、画像圧縮装置を使用して変換されたJPEGやJPEG2000等の符号化データに基づいてページ座標の位置ずれを補正する手法が検討されているが、符号化された周波数変換係数値を復号化し、さらに、逆量子化するという複雑な処理が必要であることから、処理時間が長くなり処理速度が遅いという問題がある。
【0013】
本発明の目的は、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することができる位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法を提供することである。
【0014】
【課題を解決するための手段】
本発明の位置ずれ補正装置は、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析手段と、この構文解析手段の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出手段と、この位置ずれ量検出手段により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動手段と、を備える。
【0015】
したがって、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点が参照ページのページ座標の画像基準点に一致するように移動させられる。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することが可能になる。
【0016】
本発明は、前記位置ずれ補正装置において、前記構文解析手段における構文解析条件を指定する条件指定手段を備える。
【0017】
したがって、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することが可能になる。
【0018】
本発明は、前記位置ずれ補正装置において、前記位置ずれ量検出手段は、前記構文解析手段の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取手段と、このパケット長読取手段により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶手段と、前記パケット長読取手段により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出手段と、を備える。
【0019】
したがって、参照ページに対する現ページの画像基準点の位置ずれ量が、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出される。これにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることが可能になる。
【0020】
本発明は、前記位置ずれ補正装置において、分割単位である矩形領域は、タイルである。
【0021】
したがって、周波数変換として離散ウェーブレット変換を用いることが可能になる。
【0022】
本発明は、前記位置ずれ補正装置において、分割単位である矩形領域は、プレシンクトである。
【0023】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0024】
本発明は、前記位置ずれ補正装置において、分割単位である矩形領域は、コード・ブロックである。
【0025】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0026】
本発明は、前記補正装置において、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動手段によるページ座標の移動による位置ずれ補正を行わない。
【0027】
したがって、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことにより、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することが可能になる。
【0028】
本発明の画像処理装置は、静止画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化する画像圧縮装置と、この画像圧縮装置により圧縮符号化された静止画像データの所定領域についての符号列データに基づき、参照ページに対する現ページの画像基準点の位置ずれを補正する前記補正装置と、を備える。
【0029】
したがって、画像を圧縮処理する際に、請求項1ないし7のいずれか一記載の発明と同様の作用を奏する画像処理装置を提供することが可能になる。
【0030】
本発明のプログラムは、コンピュータにインストールされるか、あるいは解釈されて実行されるプログラムであって、前記コンピュータに、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析機能と、この構文解析機能の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出機能と、この位置ずれ量検出機能により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動機能と、を実行させる。
【0031】
したがって、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点が参照ページのページ座標の画像基準点に一致するように移動させられる。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することが可能になる。
【0032】
本発明は、前記プログラムにおいて、前記構文解析機能における構文解析条件を指定する条件指定機能を前記コンピュータに実行させる。
【0033】
したがって、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することが可能になる。
【0034】
本発明は、前記プログラムにおいて、前記位置ずれ量検出機能は、前記構文解析機能の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取機能と、このパケット長読取機能により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶機能と、前記パケット長読取機能により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出機能と、を前記コンピュータに実行させる。
【0035】
したがって、参照ページに対する現ページの画像基準点の位置ずれ量が、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出される。これにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることが可能になる。
【0036】
本発明は、前記プログラムにおいて、分割単位である矩形領域は、タイルである。
【0037】
したがって、周波数変換として離散ウェーブレット変換を用いることが可能になる。
【0038】
本発明は、前記おいて、分割単位である矩形領域は、プレシンクトである。
【0039】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0040】
本発明は、前記プログラムにおいて、分割単位である矩形領域は、コード・ブロックである。
【0041】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0042】
本発明は、前記プログラムにおいて、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動機能によるページ座標の移動による位置ずれ補正を前記コンピュータに実行させない。
【0043】
したがって、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことにより、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することが可能になる。
【0044】
本発明の記憶媒体は、前記プログラムを記憶している。
【0045】
したがって、この記憶媒体に記憶されたプログラムをコンピュータに読み取らせることにより、前記発明と同様の作用を得ることが可能になる。
【0046】
本発明の位置ずれ補正方法は、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析工程と、この構文解析工程の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出工程と、この位置ずれ量検出工程により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動工程と、を含む。
【0047】
したがって、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点が参照ページのページ座標の画像基準点に一致するように移動させられる。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することが可能になる。
【0048】
本発明は、前記位置ずれ補正方法において、前記構文解析工程における構文解析条件を指定する条件指定工程を含む。
【0049】
したがって、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することが可能になる。
【0050】
本発明は、前記位置ずれ補正方法において、前記位置ずれ量検出工程は、前記構文解析工程の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取工程と、このパケット長読取工程により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶工程と、前記パケット長読取工程により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出工程と、を含む。
【0051】
したがって、参照ページに対する現ページの画像基準点の位置ずれ量が、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出される。これにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることが可能になる。
【0052】
本発明は、前記位置ずれ補正方法において、分割単位である矩形領域は、タイルである。
【0053】
したがって、周波数変換として離散ウェーブレット変換を用いることが可能になる。
【0054】
本発明は、前記位置ずれ補正方法において、分割単位である矩形領域は、プレシンクトである。
【0055】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0056】
本発明は、前記位置ずれ補正方法において、分割単位である矩形領域は、コード・ブロックである。
【0057】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0058】
本発明は、前記位置ずれ補正方法において、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動工程によるページ座標の移動による位置ずれ補正を行わない。
【0059】
したがって、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことにより、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することが可能になる。
【0060】
【発明の実施の形態】
本発明の実施の一形態を図1ないし図20に基づいて説明する。
【0061】
最初に、本発明の前提となる「階層符号化アルゴリズム」及び「JPEG2000アルゴリズム」の概要について説明する。
【0062】
図1は、JPEG2000方式の基本となる階層符号化アルゴリズムを実現するシステムの機能ブロック図である。このシステムは、色空間変換・逆変換部101、2次元ウェーブレット変換・逆変換部102、量子化・逆量子化部103、エントロピー符号化・復号化部104、タグ処理部105の各機能ブロックにより構成されている。
【0063】
このシステムが従来のJPEGアルゴリズムと比較して最も大きく異なる点の一つは変換方式である。JPEGでは離散コサイン変換(DCT:Discrete Cosine Transform)を用いているのに対し、この階層符号化アルゴリズムでは、2次元ウェーブレット変換・逆変換部102において、離散ウェーブレット変換(DWT:Discrete Wavelet Transform)を用いている。DWTはDCTに比べて、高圧縮領域における画質が良いという長所を有し、この点が、JPEGの後継アルゴリズムであるJPEG2000でDWTが採用された大きな理由の一つとなっている。
【0064】
また、他の大きな相違点は、この階層符号化アルゴリズムでは、システムの最終段に符号形成を行うために、タグ処理部105の機能ブロックが追加されていることである。このタグ処理部105で、画像の圧縮動作時には圧縮データが符号列データとして生成され、伸長動作時には伸長に必要な符号列データの解釈が行われる。そして、符号列データによって、JPEG2000は様々な便利な機能を実現できるようになった。例えば、ブロック・ベースでのDWTにおけるオクターブ分割に対応した任意の階層(デコンポジション・レベル)で、静止画像の圧縮伸長動作を自由に停止させることができるようになる(後述する図3参照)。
【0065】
原画像の入出力部分には、色空間変換・逆変換101が接続される場合が多い。例えば、原色系のR(赤)/G(緑)/B(青)の各コンポーネントからなるRGB表色系や、補色系のY(黄)/M(マゼンタ)/C(シアン)の各コンポーネントからなるYMC表色系から、YUVあるいはYCbCr表色系への変換又は逆変換を行う部分がこれに相当する。
【0066】
次に、JPEG2000アルゴリズムについて説明する。
【0067】
カラー画像は、一般に、図2に示すように、原画像の各コンポーネント111(ここではRGB原色系)が、矩形をした領域によって分割される。この分割された矩形領域は、一般にブロックあるいはタイルと呼ばれているものであるが、JPEG2000では、タイルと呼ぶことが一般的であるため、以下、このような分割された矩形領域をタイルと記述することにする(図2の例では、各コンポーネント111が縦横4×4、合計16個の矩形のタイル112に分割されている)。このような個々のタイル112(図2の例で、R00,R01,…,R15/G00,G01,…,G15/B00,B01,…,B15)が、画像データの圧縮伸長プロセスを実行する際の基本単位となる。従って、画像データの圧縮伸長動作は、コンポーネント毎、また、タイル112毎に、独立に行われる。
【0068】
画像データの符号化時には、各コンポーネント111の各タイル112のデータが、図1の色空間変換・逆変換部101に入力され、色空間変換を施された後、2次元ウェーブレット変換部102で2次元ウェーブレット変換(順変換)が施されて、周波数帯に空間分割される。
【0069】
図3には、デコンポジション・レベル数が3の場合の、各デコンポジション・レベルにおけるサブバンドを示している。すなわち、原画像のタイル分割によって得られたタイル原画像(0LL)(デコンポジション・レベル0)に対して、2次元ウェーブレット変換を施し、デコンポジション・レベル1に示すサブバンド(1LL,1HL,1LH,1HH)を分離する。そして引き続き、この階層における低周波成分1LLに対して、2次元ウェーブレット変換を施し、デコンポジション・レベル2に示すサブバンド(2LL,2HL,2LH,2HH)を分離する。順次同様に、低周波成分2LLに対しても、2次元ウェーブレット変換を施し、デコンポジション・レベル3に示すサブバンド(3LL,3HL,3LH,3HH)を分離する。図3では、各デコンポジション・レベルにおいて符号化の対象となるサブバンドを、網掛けで表してある。例えば、デコンポジション・レベル数を3としたとき、網掛けで示したサブバンド(3HL,3LH,3HH,2HL,2LH,2HH,1HL,1LH,1HH)が符号化対象となり、3LLサブバンドは符号化されない。
【0070】
次いで、指定した符号化の順番で符号化の対象となるビットが定められ、図1に示す量子化・逆量子化部103で対象ビット周辺のビットからコンテキストが生成される。
【0071】
この量子化の処理が終わったウェーブレット係数は、個々のサブバンド毎に、「プレシンクト」と呼ばれる重複しない矩形に分割される。これは、インプリメンテーションでメモリを効率的に使うために導入されたものである。図4に示したように、一つのプレシンクトは、空間的に一致した3つの矩形領域からなっている。更に、個々のプレシンクトは、重複しない矩形の「コード・ブロック」に分けられる。これは、エントロピー・コーディングを行う際の基本単位となる。
【0072】
ウェーブレット変換後の係数値は、そのまま量子化し符号化することも可能であるが、JPEG2000では符号化効率を上げるために、係数値を「ビットプレーン」単位に分解し、画素あるいはコード・ブロック毎に「ビットプレーン」に順位付けを行うことができる。
【0073】
ここで、図5はビットプレーンに順位付けする手順の一例を示す説明図である。図5に示すように、この例は、原画像(32×32画素)を16×16画素のタイル4つで分割した場合で、デコンポジション・レベル1のプレシンクトとコード・ブロックの大きさは、各々8×8画素と4×4画素としている。プレシンクトとコード・ブロックの番号は、ラスター順に付けられており、この例では、プレンシクトが番号0から3まで、コード・ブロックが番号0から3まで割り当てられている。タイル境界外に対する画素拡張にはミラーリング法を使い、可逆(5,3)フィルタでウェーブレット変換を行い、デコンポジション・レベル1のウェーブレット係数値を求めている。
【0074】
また、タイル0/プレシンクト3/コード・ブロック3について、代表的な「レイヤ」構成の概念の一例を示す説明図も図5に併せて示す。変換後のコード・ブロックは、サブバンド(1LL,1HL,1LH,1HH)に分割され、各サブバンドにはウェーブレット係数値が割り当てられている。
【0075】
レイヤの構造は、ウェーブレット係数値を横方向(ビットプレーン方向)から見ると理解し易い。1つのレイヤは任意の数のビットプレーンから構成される。この例では、レイヤ0,1,2,3は、各々、1,3,1,3のビットプレーンから成っている。そして、LSB(Least Significant Bit:最下位ビット)に近いビットプレーンを含むレイヤ程、先に量子化の対象となり、逆に、MSB(Most Significant Bit:最上位ビット)に近いレイヤは最後まで量子化されずに残ることになる。LSBに近いレイヤから破棄する方法はトランケーションと呼ばれ、量子化率を細かく制御することが可能である。
【0076】
図1に示すエントロピー符号化・復号化部104では、コンテキストと対象ビットから確率推定によって、各コンポーネント111のタイル112に対する符号化を行う。こうして、原画像の全てのコンポーネント111について、タイル112単位で符号化処理が行われる。最後にタグ処理部105は、エントロピー符号化・復号化部104からの全符号化データを1本の符号列データに結合するとともに、それにタグを付加する処理を行う。
【0077】
図6には、この符号列データの1フレーム分の概略構成を示している。この符号列データの先頭と各タイルの符号データ(bit stream)の先頭にはヘッダ(メインヘッダ(Main header)、タイル境界位置情報等であるタイルパートヘッダ(tile part header))と呼ばれるタグ情報が付加され、その後に、各タイルの符号化データが続く。なお、メインヘッダ(Main header)には、符号化パラメータや量子化パラメータが記述されている。そして、符号列データの終端には、再びタグ(end of codestream)が置かれる。また、図7は、符号化されたウェーブレット係数値が収容されたパケットをサブバンド毎に表わしたコード・ストリーム構造を示すものである。図7に示すように、タイルによる分割処理を行っても、あるいはタイルによる分割処理を行わなくても、同様のパケット列構造を持つことになる。
【0078】
一方、符号化データの復号化時には、画像データの符号化時とは逆に、各コンポーネント111の各タイル112の符号列データから画像データを生成する。この場合、タグ処理部105は、外部より入力した符号列データに付加されたタグ情報を解釈し、符号列データを各コンポーネント111の各タイル112の符号列データに分解し、その各コンポーネント111の各タイル112の符号列データ毎に復号化処理(伸長処理)を行う。このとき、符号列データ内のタグ情報に基づく順番で復号化の対象となるビットの位置が定められるとともに、量子化・逆量子化部103で、その対象ビット位置の周辺ビット(既に復号化を終えている)の並びからコンテキストが生成される。エントロピー符号化・復号化部104で、このコンテキストと符号列データから確率推定によって復号化を行い、対象ビットを生成し、それを対象ビットの位置に書き込む。このようにして復号化されたデータは周波数帯域毎に空間分割されているため、これを2次元ウェーブレット変換・逆変換部102で2次元ウェーブレット逆変換を行うことにより、画像データの各コンポーネントの各タイルが復元される。復元されたデータは色空間変換・逆変換部101によって元の表色系の画像データに変換される。
【0079】
以上が、「JPEG2000アルゴリズム」の概要である。
【0080】
以下、本発明の実施の一形態について説明する。なお、ここでは、JPEG2000を代表とする画像圧縮伸長技術に関する例について説明するが、言うまでもなく、本発明は以下の説明の内容に限定されるものではない。
【0081】
本実施の形態のサーバコンピュータ及びクライアントコンピュータは、そのコンピュータにインストールされるか、あるいは解釈されて実行される画像処理プログラムによって動作制御されて画像処理を実行する。本実施の形態では、そのような画像処理プログラムを記憶する記憶媒体も紹介する。
【0082】
図8は、本実施の形態におけるシステム構築例を示す模式図である。
【0083】
本実施の形態の画像データ処理システムでは、サーバコンピュータ2にLAN(Local Area Network)等のネットワーク3を介して画像処理装置であるクライアントコンピュータ4が複数台接続されたサーバクライアントシステム1を想定する。このサーバクライアントシステム1は、スキャナやデジタルカメラ等の画像入力装置5及びプリンタ等の画像出力装置6をネットワーク3上でシェアし得る環境が整えられている。また、ネットワーク3上には、マルチファンクションペリフェラルと称されるMFP7が接続され、このMFP7が画像入力装置5や画像出力装置6として機能するように環境が構築されていても良い。
【0084】
このようなサーバクライアントシステム1は、例えばイントラネット8を介して別のサーバクライアントシステム1とのデータ通信可能に構築され、インターネット通信網9を介して外部環境とデータ通信可能に構築されている。
【0085】
サーバコンピュータ2は、文書管理サーバ2aとデータ変換サーバ2bとで構成されている。文書管理サーバ2aは、各種文書の画像イメージを画像データとして記憶する文書管理機能を発揮するものである。データ変換サーバ2bは、例えば画像データにOCR(Optical Character Reader)処理を施してテキストデータを抽出する等のデータ変換機能を発揮するものである。
【0086】
以下においては、本発明の特長的な機能を発揮する画像処理装置であるクライアントコンピュータ4について説明する。
【0087】
図9は、本実施の形態における画像処理装置としてのクライアントコンピュータ4のモジュール構成図である。クライアントコンピュータ4は、情報処理を行うCPU(Central Processing Unit)11、情報を格納するROM(Read Only Memory)12及びRAM(Random Access Memory)13等の一次記憶装置14、後述する圧縮符号を記憶する記憶部であるHDD(Hard Disk Drive)15等の二次記憶装置16、情報を保管したり外部に情報を配布したり外部から情報を入手するためのCD−ROMドライブ等のリムーバブルディスク装置17、ネットワーク3を介して画像入力装置5や外部の他のコンピュータと通信により情報を伝達するためのネットワークインターフェース18、処理経過や結果等を操作者に表示するCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等の表示装置19、並びに操作者がCPU11に命令や情報等を入力するためのキーボード20、マウス等のポインティングディバイス21等から構成されており、これらの各部間で送受信されるデータをバスコントローラ22が調停して動作する。
【0088】
このようなクライアントコンピュータ4では、ユーザが電源を投入するとCPU11がROM12内のローダーというプログラムを起動させ、HDD15よりオペレーティングシステムというコンピュータのハードウェアとソフトウェアとを管理するプログラムをRAM13に読み込み、このオペレーティングシステムを起動させる。このようなオペレーティングシステムは、ユーザの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。オペレーティングシステムのうち代表的なものとしては、Windows(登録商標)、UNIX(登録商標)等が知られている。これらのオペレーティングシステム上で走る動作プログラムをアプリケーションプログラムと呼んでいる。
【0089】
ここで、クライアントコンピュータ4は、アプリケーションプログラムとして、画像処理プログラムをHDD15に記憶している。この意味で、HDD15は、画像処理プログラムを記憶する記憶媒体として機能する。
【0090】
また、一般的には、クライアントコンピュータ4のHDD15等の二次記憶装置16にインストールされる動作プログラムは、CD−ROMやDVD−ROM等の光情報記録メディアやFD等の磁気メディア等に記録され、この記録された動作プログラムがHDD15等の二次記憶装置16にインストールされる。このため、CD−ROM等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体も、画像処理プログラムを記憶する記憶媒体となり得る。さらには、画像処理プログラムは、例えばネットワークインターフェース18を介して外部から取り込まれ、HDD15等の二次記憶装置16にインストールされても良い。
【0091】
クライアントコンピュータ4は、オペレーティングシステム上で動作する画像処理プログラムが起動すると、この画像処理プログラムに従い、CPU11が各種の演算処理を実行して各部を集中的に制御する。クライアントコンピュータ4のCPU11が実行する各種の演算処理のうち、本実施の形態の特長的な処理について以下に説明する。
【0092】
ここで、クライアントコンピュータ4のCPU11が実行する各種の演算処理により実現される機能について説明する。図10に示すように、画像処理装置であるクライアントコンピュータ4は、画像入力装置5で読み取った画像データを圧縮符号化する画像圧縮装置4aと、画像入力装置5で読み取られた入力原稿の位置ずれを補正するための位置ずれ補正装置4bと、の各機能をCPU11が実行する各種の演算処理により実現する。
【0093】
画像圧縮装置4aは、周波数変換にDCTを使ったJPEG、あるいは周波数変換にDWTを使ったJPEG2000アルゴリズムによって、デジタル画像データを符号化する。本実施の形態における画像圧縮装置4aは、画像のデジタル画素値信号を「JPEG2000アルゴリズム」に従って圧縮符号化する。なお、「JPEG2000アルゴリズム」に従った圧縮符号化処理については、図1で示した空間変換・逆変換部101、2次元ウェーブレット変換・逆変換部102、量子化・逆量子化部103、エントロピー符号化・復号化部104、タグ処理部105の説明において前述したので、ここでの説明は省略する。この画像圧縮装置4aにおける処理により、元の画像のR,G,Bの各コンポーネントの画像データは、フレーム毎に1又は複数(通常は複数)のタイルに分割され、このタイル毎に階層的に圧縮符号化された符号化データとなる。
【0094】
位置ずれ補正装置4bは、図11に示すような画像入力装置5に設けられた「読取座標」と、入力原稿の上に設けられた「ページ座標」との位置関係を、複数の入力原稿の間で一定に保つためのものである。つまり、画像入力装置5の「読取座標」の画像基準点である原点位置に対する複数の入力原稿についてのページ座標の画像基準点である原点位置を一定にするものである。なお、図11に示すように、画像入力装置5による読取範囲は、1または複数の矩形領域に分割されている。
【0095】
このような位置ずれ補正装置4bは、画像圧縮装置4aから出力される符号列データに基づいて、画像入力装置5で読み取られた入力原稿の位置ずれを各原稿毎に検出し、この位置ずれを補正するものである。この位置ずれ補正装置4bは、図12に示すように、符号列の入力を受け付ける符号列入力手段41、構文解析手段42、位置ずれ量検出手段43、抽出条件指定手段44、補正決定手段45、ページ座標移動手段46の各種手段から構成される。これらの各種手段は、前述の画像処理プログラムにしたがってCPU11が行う処理により実現している。なお、リアルタイム性が重要視される場合には、処理を高速化する必要がある。そのためには、論理回路(図示せず)を別途設け、論理回路の動作により各種手段の機能を実現するようにするのが望ましい。
【0096】
次に、位置ずれ補正装置4bを構成する各部について説明する。
【0097】
構文解析手段42は、画像圧縮装置4aから入力された符号列データの構文すなわちヘッダ部に記述されているデータを解読し、位置ずれ量検出手段43に「ヘッダ部情報」を出力するものである。ここで、図13は構文解析手段42によるヘッダ部情報の読み取りを示す説明図である。図13に示すように、ペイロード部のデータ量、すなわち、「パケット長」は、周波数変換係数値の数の和(周波数変換係数値の符号量)であって、ヘッダ部に記述されている。ここでは、周波数変換係数値はウェーブレット係数値である。そして、構文解析手段42は、このヘッダ部情報を読み取って位置ずれ量検出手段43に対して出力する。
【0098】
抽出条件指定手段44は、位置ずれ量検出手段43に対して必要十分な情報だけを提供すべく、画像圧縮装置4aから入力された符号列データについての矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域を各々指定する条件指定手段として機能するものである。このように符号列データについて、矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域を任意に指定することにより、位置ずれ量の精度と検出処理速度を、ユーザの望みに応じて最適化することが可能である。すなわち、位置ずれ量の検出精度と検出処理速度の間にあるトレード・オフ関係を考慮に入れて、高速化を重視する場合には、小さな矩形領域の、輝度成分の低域サブバンドだけに注目すればよい。逆に、正確な位置ずれ補正が必要な場合は、注目する矩形領域の面積を大きくし、サブバンドを高域まで調べればよい。
【0099】
位置ずれ量検出手段43は、概略的には、画像入力装置5で読み取った原稿の現ページに係る符号データのヘッダ部情報と、事前に記憶してある参照ページに係る符号データのヘッダ部情報を各々比較し、現ページの位置ずれ量を検出するものである。より具体的には、構文解析手段42から受け取った「ヘッダ部情報」に基づいて、画像入力装置5で読み取られた入力原稿の位置ずれ量を各原稿毎に検出し、補正決定手段45に出力するものである。なお、カラー画像の場合、輝度成分のみを使うと、位置ずれ量の検出が更に簡便、かつ高速になる。
【0100】
ここで、位置ずれ量検出手段43による画像入力装置5で読み取られた入力原稿の位置ずれ量の検出について説明する。ここでは、ペイロード部のデータ量、すなわち、「パケット長」に基づいて画像入力装置5で読み取られた入力原稿の位置ずれ量を検出する手法について説明する。ここで、図14は位置ずれ量検出手段43の構成を示すブロック図である。図14に示すように、ヘッダ部情報を受け取った位置ずれ量検出手段43は、そのヘッダ部情報から入力原稿のパケット長データを読み取る(パケット長読取手段43a)。そして、参照ページとする入力原稿については、読み取った入力原稿のパケット長データを記憶しておく(パケット長記憶手段43b)。画像入力装置5で読み取られた入力原稿の位置ずれ量は、符号量の変化量、すなわち、パケット長の変化量に現れることから、現ページと参照ページとの間におけるパケット長の差分を求めることにより(差分検出手段43c)、画像入力装置5で読み取られた入力原稿の位置ずれ量を検出することができる。
【0101】
ここで、図15は符号量差と位置ずれ量との関係を示す説明図である。図15に示すように、画像入力装置5で読み取られた入力原稿の位置ずれ量は符号量差(パケット長の差分値)の絶対値が増加するに従って大きくなることがわかる。すなわち、符号量差(パケット長の差分値)に関して、現ページと参照ページとの間で変化が無い、あるいは非常に少ない場合は、現ページと参照ページとの間に位置ずれは無いか非常に少ないと、みなすことができる。逆に、符号量差(パケット長の差分値)の絶対値の変化が大きい場合は、現ページと参照ページとの間の位置ずれ量が大きい、あるいは、書類の種類が異なる、とみなすことができる。
【0102】
補正決定手段45は、位置ずれ量検出手段43から受け取った「画像入力装置5で読み取られた入力原稿の位置ずれ量」に基づいて、ページ座標の移動(位置ずれ補正)を行うか否かを決定するものである。例えば、位置ずれ量が、ユーザが予め指定した閾値以下であれば、ページ座標の移動(位置ずれ補正)は行わないようにする。一方、位置ずれ量が、閾値を超えている場合には、ページ座標の移動(位置ずれ補正)を行うようにする。すなわち、補正決定手段45は、位置ずれ量が小さく、ページ座標の移動(位置ずれ補正)の必要がないと判断した場合には、画像入力装置5に対してその旨を示す制御信号を出力する。また、位置ずれ量が補正可能な程度であると判断した場合には、補正決定手段45は、ページ座標移動手段46に対して「画像入力装置5で読み取られた入力原稿の位置ずれ量」を出力する。
【0103】
ページ座標移動手段46は、補正決定手段45から受け取った「画像入力装置5で読み取られた入力原稿の位置ずれ量」に応じて、入力原稿のページ座標の原点を参照ページのページ座標の画像基準点に一致するように移動させるものである。
【0104】
以上説明したような位置ずれ補正装置4bによる位置ずれ補正処理の内容を、図16の位置ずれ補正装置4bによる位置ずれ補正処理の流れを示すフローチャートを参照しつつ更に詳細に説明する。この位置ずれ補正処理は、画像入力装置5による原稿の全領域の読取(本スキャン)が実行される前段階のプレスキャンの際に実行されるものである。なお、このプレスキャンにおいては、図17に示すように、原稿の全領域を読み取るのではなく、読取座標上で定義された四隅に位置し各4個の矩形領域で形成された四つの領域を位置ずれ検出用の領域として読み取り、画像圧縮装置4aで圧縮符号化する。なお、符号列がJPEG2000フォーマットである場合、矩形領域として、タイル、プレシンクトあるいはコード・ブロックを用いることができる。
【0105】
図16に示すように、位置ずれ補正処理は、まず、画像入力装置5によって読み取られた一の原稿を参照ページとし、この参照ページの位置ずれ検出用の各領域の圧縮符号を取得すると(ステップS1のY)、この各領域の符号量を算出して記憶する(ステップS2)。以上の処理により、参照ページの位置ずれ検出用の各領域の符号量が記憶保持されることになる。
【0106】
このような状態で、画像入力装置5によって読み取られた他の原稿を現ページとし、この現ページの位置ずれ検出用の各領域の圧縮符号を取得すると(ステップS4のY)、この各領域の符号量を算出する(ステップS5)。
【0107】
続くステップS5では、現ページの各領域の符号量を参照ページの各領域の符号量と比較し、位置ずれ量を算出する。
【0108】
ここで、図18は参照ページと現ページとにおける「画像入力装置5で読み取られた入力原稿の位置ずれ量」を示す一例である。図18に示す例では、参照ページの位置ずれ検出用の領域と現ページの位置ずれ検出用の領域とを比較すると、ページ座標が僅かにずれていることが解かる。前述したように、このようなずれ量は、符号量の変化量、すなわち、パケット長の変化量に現れることから、現ページの領域と参照ページの領域との間におけるパケット長の差分を求めることにより検出することができる。
【0109】
ステップS5において位置ずれ量が算出されると、その算出された位置ずれ量が、予め規定されている上限値と比較される(ステップS6)。この上限値は、例えば原稿が読取範囲からはみ出したことが判るように設定しておく。そして、位置ずれ量が上限値を超えた場合は(ステップS6のN)、画像入力装置5に対して原稿の再読み取りを指示する制御信号を出力し、現ページの位置ずれ検出用の各領域の圧縮符号の取得に待機する(ステップS3)。
【0110】
一方、位置ずれ量が上限値を超えない場合は(ステップS6のY)、ユーザが予め指定した閾値と位置ずれ量とが比較される(ステップS7)。
【0111】
位置ずれ量が閾値を超えている場合には(ステップS7のN)、ステップS8に進み、ページ座標の移動(位置ずれ補正)を行う。ページ座標の移動は、画像入力装置5で読み取られた現ページの画素値(読取座標ごとに与えられる)を、位置ずれ量分だけシフトさせることにより行われる。
【0112】
そして、ページ座標の移動後の現ページの位置ずれ検出用の各領域の圧縮符号を取得すると(ステップS4のY)、この各領域の符号量を算出し(ステップS5)、位置ずれ量が閾値以下になるまで(ステップS7のY)、ステップS8におけるページ座標の移動、すなわち、位置ずれ補正が繰り返される。図19に位置ずれ補正前と位置ずれ補正完了後の現ページを示す。なお、図19に示した例では、現ページの位置ずれ量は、水平・垂直方向だけである。本実施の形態の位置ずれ補正装置4bは、読み取られる原稿が読取座標に対して傾いている場合にも、対応することができる。位置ずれ量とずれ方向の関係は、事前に詳細に求めておくことが必要であることは言うまでもない。
【0113】
また、図20は位置ずれ補正前と位置ずれ補正完了後の位置ずれ量と符号量差の関係を示すものである。図20に示すように、位置ずれ量をより効率的に求めるために、最初の位置ずれ量検出処理は、低域サブバンドのみを対象に行い、順次サブバンドを高域にまで移動していく方法が有効である。
【0114】
そして、位置ずれ量がユーザが予め指定した閾値以下の場合には(ステップS7のY)、画像入力装置5に対して原稿の本スキャン処理(現ページの全領域の読取処理)を実行させるための制御信号を送信し(ステップS9)、プレスキャン処理を終了する。
【0115】
ここに、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点が参照ページのページ座標の画像基準点に一致するように移動させられる。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することが可能になる。
【0116】
なお、本実施の形態においては、原画像にタイル分割処理を施した場合について説明したが、これに限るものではない。原画像に対してタイル分割を行わない場合でも、プレシンクトやコード・ブロックを矩形領域として利用すれば、タイル分割を行った場合と同様に、参照ページに対する現ページの画像基準点の位置ずれ量を検出することが可能である。
【0117】
【発明の効果】
本発明の位置ずれ補正装置によれば、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析手段と、この構文解析手段の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出手段と、この位置ずれ量検出手段により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動手段と、を備え、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させることにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することができる。
【0118】
本発明によれば、前記位置ずれ補正装置において、前記構文解析手段における構文解析条件を指定する条件指定手段を備え、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することができる。
【0119】
本発明によれば、前記位置ずれ補正装置において、前記位置ずれ量検出手段は、前記構文解析手段の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取手段と、このパケット長読取手段により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶手段と、前記パケット長読取手段により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出手段と、を備え、参照ページに対する現ページの画像基準点の位置ずれ量を、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出することにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることができる。
【0120】
本発明によれば、前記位置ずれ補正装置において、分割単位である矩形領域は、タイルであることにより、周波数変換として離散ウェーブレット変換を用いることができる。
【0121】
本発明によれば、前記位置ずれ補正装置において、分割単位である矩形領域は、プレシンクトであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0122】
本発明によれば、前記位置ずれ補正装置において、分割単位である矩形領域は、コード・ブロックであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0123】
本発明によれば、前記位置ずれ補正装置において、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動手段によるページ座標の移動による位置ずれ補正を行わないことにより、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことで、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することができる。
【0124】
本発明の画像処理装置によれば、静止画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化する画像圧縮装置と、この画像圧縮装置により圧縮符号化された静止画像データの所定領域についての符号列データに基づき、参照ページに対する現ページの画像基準点の位置ずれを補正する前記位置ずれ補正装置と、を備えることにより、画像を圧縮処理する際に、前記発明と同様の作用効果を奏する画像処理装置を提供することができる。
【0125】
本発明のプログラムによれば、コンピュータにインストールされるか、あるいは解釈されて実行されるプログラムであって、前記コンピュータに、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析機能と、この構文解析機能の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出機能と、この位置ずれ量検出機能により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動機能と、を実行させ、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動することにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することができる。
【0126】
本発明によれば、前記プログラムにおいて、前記構文解析機能における構文解析条件を指定する条件指定機能を前記コンピュータに実行させ、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することができる。
【0127】
本発明によれば、前記プログラムにおいて、前記位置ずれ量検出機能は、前記構文解析機能の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取機能と、このパケット長読取機能により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶機能と、前記パケット長読取機能により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出機能と、を前記コンピュータに実行させ、参照ページに対する現ページの画像基準点の位置ずれ量を、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出することにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることができる。
【0128】
本発明によれば、前記プログラムにおいて、分割単位である矩形領域は、タイルであることにより、周波数変換として離散ウェーブレット変換を用いることができる。
【0129】
本発明によれば、前記プログラムにおいて、分割単位である矩形領域は、プレシンクトであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0130】
本発明によれば、前記プログラムにおいて、分割単位である矩形領域は、コード・ブロックであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0131】
本発明によれば、前記プログラムにおいて、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動機能によるページ座標の移動による位置ずれ補正を前記コンピュータに実行させないことにより、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことで、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することができる。
【0132】
本発明の記憶媒体によれば、前記プログラムを記憶していることにより、この記憶媒体に記憶されたプログラムをコンピュータに読み取らせることで、前記発明と同様の作用効果を得ることができる。
【0133】
本発明の位置ずれ補正方法によれば、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析工程と、この構文解析工程の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出工程と、この位置ずれ量検出工程により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動工程と、を含み、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動することにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することができる。
【0134】
本発明によれば、前記位置ずれ補正方法において、前記構文解析工程における構文解析条件を指定する条件指定工程を含み、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することができる。
【0135】
本発明によれば、前記位置ずれ補正方法において、前記位置ずれ量検出工程は、前記構文解析工程の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取工程と、このパケット長読取工程により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶工程と、前記パケット長読取工程により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出工程と、を含み、参照ページに対する現ページの画像基準点の位置ずれ量を、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出することにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることができる。
【0136】
本発明によれば、前記位置ずれ補正方法において、分割単位である矩形領域は、タイルであることにより、周波数変換として離散ウェーブレット変換を用いることができる。
【0137】
本発明によれば、前記位置ずれ補正方法において、分割単位である矩形領域は、プレシンクトであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0138】
本発明によれば、前記位置ずれ補正方法において、分割単位である矩形領域は、コード・ブロックであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0139】
本発明によれば、前記位置ずれ補正方法において、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動工程によるページ座標の移動による位置ずれ補正を行わないことにより、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことで、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することができる。
【図面の簡単な説明】
【図1】本発明の前提となるJPEG2000方式の基本となる階層符号化アルゴリズムを実現するシステムの機能ブロック図である。
【図2】原画像の各コンポーネントの分割された矩形領域を示す説明図である。
【図3】デコンポジション・レベル数が3の場合の、各デコンポジション・レベルにおけるサブバンドを示す説明図である。
【図4】プレシンクトを示す説明図である。
【図5】ビットプレーンに順位付けする手順の一例を示す説明図である。
【図6】符号列データの1フレーム分の概略構成を示す説明図である。
【図7】符号化されたウェーブレット係数値が収容されたパケットをサブバンド毎に表わしたコード・ストリーム構造を示す説明図である。
【図8】本発明の実施の一形態のシステム構築例を示す模式図である。
【図9】画像処理装置としてのクライアントコンピュータのモジュール構成図である。
【図10】画像処理装置の構成を示す機能ブロック図である。
【図11】画像入力装置に設けられた「読取座標」と、入力原稿の上に設けられた「ページ座標」との位置関係を示す説明図である。
【図12】位置ずれ補正装置の構成を示す機能ブロック図である。
【図13】構文解析手段によるヘッダ部情報の読み取りを示す説明図である。
【図14】位置ずれ量検出手段の構成を示すブロック図である。
【図15】符号量差と位置ずれ量との関係を示す説明図である。
【図16】位置ずれ補正装置による位置ずれ補正処理の流れを示すフローチャートである。
【図17】位置ずれ検出用の各領域を示す説明図である。
【図18】参照ページと現ページとにおける「画像入力装置で読み取られた入力原稿の位置ずれ量」の一例を示す説明図である。
【図19】位置ずれ補正前と位置ずれ補正完了後の現ページを示す説明図である。
【図20】位置ずれ補正前と位置ずれ補正完了後の位置ずれ量と符号量差の関係を示す説明図である。
【図21】画像入力装置に設けられた「読取座標」と、入力原稿の上に設けられた「ページ座標」との位置関係を示す説明図である。
【符号の説明】
4 画像処理装置
4a 画像圧縮装置
4b 位置ずれ補正装置
15 記憶媒体
42 構文解析手段
43 位置ずれ検出手段
44 条件指定手段
46 ページ座標移動手段
43a パケット長読取手段
43b パケット長記憶手段
43c 差分検出手段
Claims (6)
- 静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析手段と、
この構文解析手段の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出手段と、
この位置ずれ量検出手段により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動手段とを備え、
前記位置ずれ量検出手段は、
前記構文解析手段の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取手段と、
このパケット長読取手段により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶手段と、
前記パケット長読取手段により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出手段と、
を備える位置ずれ補正装置。 - 前記構文解析手段における構文解析条件を指定する条件指定手段を備える請求項1記載の位置ずれ補正装置。
- コンピュータにインストールされるか、あるいは解釈されて実行されるプログラムであって、前記コンピュータに、
静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析機能と、
この構文解析機能の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出機能と、
この位置ずれ量検出機能により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動機能とを前記コンピュータに実行させ、
前記位置ずれ量検出機能は、
前記構文解析機能の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取機能と、
このパケット長読取機能により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶機能と、
前記パケット長読取機能により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出機能と、
を前記コンピュータに実行させるコンピュータに読取り可能なプログラム。 - 前記構文解析機能における構文解析条件を指定する条件指定機能を前記コンピュータに実行させる請求項3記載のプログラム。
- 静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析工程と、
この構文解析工程の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出工程と、
この位置ずれ量検出工程により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動工程とを含み、
前記位置ずれ量検出工程は、
前記構文解析工程の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取工程と、
このパケット長読取工程により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶工程と、
前記パケット長読取工程により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出工程と、
を含む位置ずれ補正方法。 - 前記構文解析工程における構文解析条件を指定する条件指定工程を含む請求項5記載の位置ずれ補正方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003025140A JP4280508B2 (ja) | 2003-01-31 | 2003-01-31 | 位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003025140A JP4280508B2 (ja) | 2003-01-31 | 2003-01-31 | 位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004234565A JP2004234565A (ja) | 2004-08-19 |
JP4280508B2 true JP4280508B2 (ja) | 2009-06-17 |
Family
ID=32953496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003025140A Expired - Fee Related JP4280508B2 (ja) | 2003-01-31 | 2003-01-31 | 位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4280508B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5612371B2 (ja) * | 2010-06-11 | 2014-10-22 | 富士フイルム株式会社 | 画像位置合わせ装置および方法並びにプログラム |
CN107331029B (zh) * | 2017-06-23 | 2019-09-20 | 深圳怡化电脑股份有限公司 | 纸币错位检测方法、装置、设备及存储介质 |
-
2003
- 2003-01-31 JP JP2003025140A patent/JP4280508B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004234565A (ja) | 2004-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4111268B2 (ja) | サムネイル画像の表示方法、サーバコンピュータ、クライアントコンピュータ及びプログラム | |
JP4064196B2 (ja) | クライアントコンピュータ、サーバコンピュータ、プログラム、記憶媒体、画像データ処理システム及び画像データ処理方法 | |
JP4111926B2 (ja) | 画像処理装置、プログラム、記憶媒体及び画像送信方法 | |
US7352908B2 (en) | Image compression device, image decompression device, image compression/decompression device, program for executing on a computer to perform functions of such devices, and recording medium storing such a program | |
JP4128438B2 (ja) | 画像処理装置、プログラム、記憶媒体及び画像編集方法 | |
US7386175B2 (en) | Modifying wavelet division level before transmitting data stream | |
US7526134B2 (en) | Image processing apparatus, program, recording medium, and data decompression method | |
US7627185B2 (en) | Hierarchically compressing and coding and storing image data | |
US7430327B2 (en) | Image processing apparatus, image processing program, and storage medium | |
US7526133B2 (en) | Image processing apparatus, image processing program, and storage medium | |
US7492951B2 (en) | Image processing method and apparatus, and computer-readable storage medium | |
JP2004242290A (ja) | 画像処理装置および画像処理方法、画像編集処理システム、画像処理プログラム及び記憶媒体 | |
EP1635576A1 (en) | Image processing device and image processing program | |
JP4723543B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP4280508B2 (ja) | 位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法 | |
JP4489474B2 (ja) | 画像処理装置、プログラムおよび記録媒体 | |
JP4014085B2 (ja) | 画像処理装置、プログラム及び記憶媒体 | |
JP4323178B2 (ja) | 検索対象制限装置、画像処理装置、プログラム、記憶媒体及び検索対象制限方法 | |
JP4052952B2 (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP3961966B2 (ja) | 不要部除去装置、画像処理装置、プログラム、記憶媒体及び不要部除去方法 | |
JP4093870B2 (ja) | 画像処理装置、プログラムおよび記憶媒体 | |
JP4010957B2 (ja) | 画像処理装置、プログラム、記憶媒体および画像形成装置 | |
JP4374063B2 (ja) | 画像処理装置、プログラム及び記憶媒体 | |
JP2005223407A (ja) | 画像処理装置及びプログラム | |
JP2004201048A (ja) | 画像情報処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041008 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051116 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20051021 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081117 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090123 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090217 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090316 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120319 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140319 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |