JP2004234565A - Displacement correction device, image processor, program, storage medium, and displacement correction method - Google Patents

Displacement correction device, image processor, program, storage medium, and displacement correction method Download PDF

Info

Publication number
JP2004234565A
JP2004234565A JP2003025140A JP2003025140A JP2004234565A JP 2004234565 A JP2004234565 A JP 2004234565A JP 2003025140 A JP2003025140 A JP 2003025140A JP 2003025140 A JP2003025140 A JP 2003025140A JP 2004234565 A JP2004234565 A JP 2004234565A
Authority
JP
Japan
Prior art keywords
page
image
packet length
displacement
reference point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003025140A
Other languages
Japanese (ja)
Other versions
JP4280508B2 (en
Inventor
Yutaka Sano
豊 佐野
Akio Matsubara
章雄 松原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003025140A priority Critical patent/JP4280508B2/en
Publication of JP2004234565A publication Critical patent/JP2004234565A/en
Application granted granted Critical
Publication of JP4280508B2 publication Critical patent/JP4280508B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a displacement correction device capable of correcting a displacement of an image reference point of the present page to a reference page without going through a complicated processing of decoding and inversely quantizing code string data. <P>SOLUTION: The displacement amount of the image reference point of the present page to the reference page is detected on the basis of the analysis result of the syntax of code string data formed by frequency-converting and hierarchically compression-encoding a pixel value of every rectangular section of a predetermined area of static image data divided to a plurality of sections (step S5), and the image reference point of page coordinates of the present page is moved so as to match with the image reference point of page coordinates of the reference page according to the displacement amount (step S8). Accordingly, the displacement of the image reference point of the present page to the reference page can be corrected without going through the complicated processing of decoding and inversely quantizing the code string data. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法に関する。
【0002】
【従来の技術】
画像入力技術およびその出力技術の進歩により、画像に対して高精細化の要求が、近年非常に高まっている。例えば、画像入力装置として、デジタルカメラ(Digital Camera)を例にあげると、300万以上の画素数を持つ高性能な電荷結合素子(CCD:Charge Coupled Device)の低価格化が進み、普及価格帯の製品においても広く用いられるようになってきた。そして、このピクセル数の増加傾向は、なおしばらくは続くと言われている。
【0003】
一方、画像出力・表示装置に関しても、例えば、レーザプリンタ、インクジェットプリンタ、昇華型プリンタ等のハード・コピー分野における製品、そして、CRTやLCD(液晶表示デバイス)、PDP(プラズマ表示デバイス)等のフラットパネルディスプレイのソフト・コピー分野における製品の高精細化・低価格化は目を見張るものがある。
【0004】
こうした高性能・低価格な画像入出力製品の市場投入効果によって、高精細画像の大衆化が始まっており、今後はあらゆる場面で、高精細画像の需要が高まると予想されている。実際、パーソナルコンピュータ(Personal Computer)やインターネットをはじめとするネットワークに関連する技術の発達は、こうしたトレンドをますます加速させている。特に最近は、携帯電話やノートパソコン等のモバイル機器の普及速度が非常に大きく、高精細な画像を、あらゆる地点から通信手段を用いて伝送あるいは受信する機会が急増している。
【0005】
これらを背景に、高精細画像の取扱いを容易にする画像圧縮伸長技術に対する高性能化あるいは多機能化の要求は、今後ますます強くなっていくことは必至と思われる。
【0006】
そこで、近年においては、こうした要求を満たす画像圧縮方式の一つとして、高圧縮率でも高画質な画像を復元可能なJPEG2000という新しい方式が規格化されつつある。かかるJPEG2000においては、画像を矩形領域(タイル)に分割することにより、少ないメモリ環境下で圧縮伸長処理を行うことが可能である。すなわち、個々のタイルが圧縮伸長プロセスを実行する際の基本単位となり、圧縮伸長動作はタイル毎に独立に行うことができる。
【0007】
ところで、一般に、紙文書(原稿)を電子化して保存するような場合には、以下に示すような処理を順番に実行することになる。まず、紙文書(原稿)をスキャナやデジタルスチルカメラ等の画像入力装置を使用して一枚ずつ読み込む。次いで、読み込んだ画像データをJPEGやJPEG2000等の符号化データに画像圧縮装置を使用して変換する。最後に、圧縮処理した符号化データを記憶装置に記憶保存する。
【0008】
しかしながら、複数の紙文書(原稿)をスキャナ等の画像入力装置を使用して読み込む場合、電子化された紙文書(原稿)のページ座標の原点位置が、紙文書(原稿)毎に異なってしまうことがある。ここで、ページ座標とは電子化された紙文書(原稿)上に設けられた座標であり、図21に示すように、ページ座標の原点位置とはその電子化された紙文書(原稿)の原稿範囲における1つの角部である。すなわち、電子化された紙文書(原稿)のページ座標の原点位置が紙文書(原稿)毎に異なるということは、図21に示すように、スキャナ等の画像入力装置に設けられた読取範囲の絶対座標(読取座標)に対する相対的な位置関係が紙文書(原稿)毎に異なるということになる。
【0009】
このように電子化された紙文書(原稿)のページ座標の原点位置が紙文書(原稿)毎に異なるような場合には、それらの紙文書(原稿)に対して画像検索処理を実行した際に、精度の高い検索結果を得ることができない。
【0010】
そこで、このようなページ座標の位置ずれを補正するために、再度、紙文書(原稿)の位置合せを行うようにしている。
【0011】
【発明が解決しようとする課題】
しかしながら、入力する紙文書(原稿)について一枚一枚位置合せを行うことは、多数の紙文書(原稿)が入力対象である場合には、事実上不可能である。
【0012】
また、画像圧縮装置を使用して変換されたJPEGやJPEG2000等の符号化データに基づいてページ座標の位置ずれを補正する手法が検討されているが、符号化された周波数変換係数値を復号化し、さらに、逆量子化するという複雑な処理が必要であることから、処理時間が長くなり処理速度が遅いという問題がある。
【0013】
本発明の目的は、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することができる位置ずれ補正装置、画像処理装置、プログラム、記憶媒体及び位置ずれ補正方法を提供することである。
【0014】
【課題を解決するための手段】
請求項1記載の発明の位置ずれ補正装置は、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析手段と、この構文解析手段の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出手段と、この位置ずれ量検出手段により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動手段と、を備える。
【0015】
したがって、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点が参照ページのページ座標の画像基準点に一致するように移動させられる。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することが可能になる。
【0016】
請求項2記載の発明は、請求項1記載の位置ずれ補正装置において、前記構文解析手段における構文解析条件を指定する条件指定手段を備える。
【0017】
したがって、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することが可能になる。
【0018】
請求項3記載の発明は、請求項1または2記載の位置ずれ補正装置において、前記位置ずれ量検出手段は、前記構文解析手段の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取手段と、このパケット長読取手段により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶手段と、前記パケット長読取手段により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出手段と、を備える。
【0019】
したがって、参照ページに対する現ページの画像基準点の位置ずれ量が、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出される。これにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることが可能になる。
【0020】
請求項4記載の発明は、請求項1ないし3のいずれか一記載の位置ずれ補正装置において、分割単位である矩形領域は、タイルである。
【0021】
したがって、周波数変換として離散ウェーブレット変換を用いることが可能になる。
【0022】
請求項5記載の発明は、請求項1ないし3のいずれか一記載の位置ずれ補正装置において、分割単位である矩形領域は、プレシンクトである。
【0023】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0024】
請求項6記載の発明は、請求項1ないし3のいずれか一記載の位置ずれ補正装置において、分割単位である矩形領域は、コード・ブロックである。
【0025】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0026】
請求項7記載の発明は、請求項1ないし6のいずれか一記載の位置ずれ補正装置において、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動手段によるページ座標の移動による位置ずれ補正を行わない。
【0027】
したがって、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことにより、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することが可能になる。
【0028】
請求項8記載の発明の画像処理装置は、静止画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化する画像圧縮装置と、この画像圧縮装置により圧縮符号化された静止画像データの所定領域についての符号列データに基づき、参照ページに対する現ページの画像基準点の位置ずれを補正する請求項1ないし7のいずれか一記載の位置ずれ補正装置と、を備える。
【0029】
したがって、画像を圧縮処理する際に、請求項1ないし7のいずれか一記載の発明と同様の作用を奏する画像処理装置を提供することが可能になる。
【0030】
請求項9記載の発明のプログラムは、コンピュータにインストールされるか、あるいは解釈されて実行されるプログラムであって、前記コンピュータに、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析機能と、この構文解析機能の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出機能と、この位置ずれ量検出機能により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動機能と、を実行させる。
【0031】
したがって、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点が参照ページのページ座標の画像基準点に一致するように移動させられる。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することが可能になる。
【0032】
請求項10記載の発明は、請求項9記載のプログラムにおいて、前記構文解析機能における構文解析条件を指定する条件指定機能を前記コンピュータに実行させる。
【0033】
したがって、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することが可能になる。
【0034】
請求項11記載の発明は、請求項9または10記載のプログラムにおいて、前記位置ずれ量検出機能は、前記構文解析機能の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取機能と、このパケット長読取機能により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶機能と、前記パケット長読取機能により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出機能と、を前記コンピュータに実行させる。
【0035】
したがって、参照ページに対する現ページの画像基準点の位置ずれ量が、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出される。これにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることが可能になる。
【0036】
請求項12記載の発明は、請求項9ないし11のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、タイルである。
【0037】
したがって、周波数変換として離散ウェーブレット変換を用いることが可能になる。
【0038】
請求項13記載の発明は、請求項9ないし11のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、プレシンクトである。
【0039】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0040】
請求項14記載の発明は、請求項9ないし11のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、コード・ブロックである。
【0041】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0042】
請求項15記載の発明は、請求項9ないし14のいずれか一記載のプログラムにおいて、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動機能によるページ座標の移動による位置ずれ補正を前記コンピュータに実行させない。
【0043】
したがって、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことにより、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することが可能になる。
【0044】
請求項16記載の発明の記憶媒体は、請求項9ないし15のいずれか一記載のプログラムを記憶している。
【0045】
したがって、この記憶媒体に記憶されたプログラムをコンピュータに読み取らせることにより、請求項9ないし15のいずれか一記載の発明と同様の作用を得ることが可能になる。
【0046】
請求項17記載の発明の位置ずれ補正方法は、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析工程と、この構文解析工程の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出工程と、この位置ずれ量検出工程により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動工程と、を含む。
【0047】
したがって、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点が参照ページのページ座標の画像基準点に一致するように移動させられる。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することが可能になる。
【0048】
請求項18記載の発明は、請求項17記載の位置ずれ補正方法において、前記構文解析工程における構文解析条件を指定する条件指定工程を含む。
【0049】
したがって、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することが可能になる。
【0050】
請求項19記載の発明は、請求項17または18記載の位置ずれ補正方法において、前記位置ずれ量検出工程は、前記構文解析工程の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取工程と、このパケット長読取工程により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶工程と、前記パケット長読取工程により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出工程と、を含む。
【0051】
したがって、参照ページに対する現ページの画像基準点の位置ずれ量が、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出される。これにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることが可能になる。
【0052】
請求項20記載の発明は、請求項17ないし19のいずれか一記載の位置ずれ補正方法において、分割単位である矩形領域は、タイルである。
【0053】
したがって、周波数変換として離散ウェーブレット変換を用いることが可能になる。
【0054】
請求項21記載の発明は、請求項17ないし19のいずれか一記載の位置ずれ補正方法において、分割単位である矩形領域は、プレシンクトである。
【0055】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0056】
請求項22記載の発明は、請求項17ないし19のいずれか一記載の位置ずれ補正方法において、分割単位である矩形領域は、コード・ブロックである。
【0057】
したがって、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることが可能になる。また、検出単位をタイルよりも小さな画像領域にすることが可能になる。
【0058】
請求項23記載の発明は、請求項17ないし22のいずれか一記載の位置ずれ補正方法において、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動工程によるページ座標の移動による位置ずれ補正を行わない。
【0059】
したがって、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことにより、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することが可能になる。
【0060】
【発明の実施の形態】
本発明の実施の一形態を図1ないし図20に基づいて説明する。
【0061】
最初に、本発明の前提となる「階層符号化アルゴリズム」及び「JPEG2000アルゴリズム」の概要について説明する。
【0062】
図1は、JPEG2000方式の基本となる階層符号化アルゴリズムを実現するシステムの機能ブロック図である。このシステムは、色空間変換・逆変換部101、2次元ウェーブレット変換・逆変換部102、量子化・逆量子化部103、エントロピー符号化・復号化部104、タグ処理部105の各機能ブロックにより構成されている。
【0063】
このシステムが従来のJPEGアルゴリズムと比較して最も大きく異なる点の一つは変換方式である。JPEGでは離散コサイン変換(DCT:Discrete Cosine Transform)を用いているのに対し、この階層符号化アルゴリズムでは、2次元ウェーブレット変換・逆変換部102において、離散ウェーブレット変換(DWT:Discrete Wavelet Transform)を用いている。DWTはDCTに比べて、高圧縮領域における画質が良いという長所を有し、この点が、JPEGの後継アルゴリズムであるJPEG2000でDWTが採用された大きな理由の一つとなっている。
【0064】
また、他の大きな相違点は、この階層符号化アルゴリズムでは、システムの最終段に符号形成を行うために、タグ処理部105の機能ブロックが追加されていることである。このタグ処理部105で、画像の圧縮動作時には圧縮データが符号列データとして生成され、伸長動作時には伸長に必要な符号列データの解釈が行われる。そして、符号列データによって、JPEG2000は様々な便利な機能を実現できるようになった。例えば、ブロック・ベースでのDWTにおけるオクターブ分割に対応した任意の階層(デコンポジション・レベル)で、静止画像の圧縮伸長動作を自由に停止させることができるようになる(後述する図3参照)。
【0065】
原画像の入出力部分には、色空間変換・逆変換101が接続される場合が多い。例えば、原色系のR(赤)/G(緑)/B(青)の各コンポーネントからなるRGB表色系や、補色系のY(黄)/M(マゼンタ)/C(シアン)の各コンポーネントからなるYMC表色系から、YUVあるいはYCbCr表色系への変換又は逆変換を行う部分がこれに相当する。
【0066】
次に、JPEG2000アルゴリズムについて説明する。
【0067】
カラー画像は、一般に、図2に示すように、原画像の各コンポーネント111(ここではRGB原色系)が、矩形をした領域によって分割される。この分割された矩形領域は、一般にブロックあるいはタイルと呼ばれているものであるが、JPEG2000では、タイルと呼ぶことが一般的であるため、以下、このような分割された矩形領域をタイルと記述することにする(図2の例では、各コンポーネント111が縦横4×4、合計16個の矩形のタイル112に分割されている)。このような個々のタイル112(図2の例で、R00,R01,…,R15/G00,G01,…,G15/B00,B01,…,B15)が、画像データの圧縮伸長プロセスを実行する際の基本単位となる。従って、画像データの圧縮伸長動作は、コンポーネント毎、また、タイル112毎に、独立に行われる。
【0068】
画像データの符号化時には、各コンポーネント111の各タイル112のデータが、図1の色空間変換・逆変換部101に入力され、色空間変換を施された後、2次元ウェーブレット変換部102で2次元ウェーブレット変換(順変換)が施されて、周波数帯に空間分割される。
【0069】
図3には、デコンポジション・レベル数が3の場合の、各デコンポジション・レベルにおけるサブバンドを示している。すなわち、原画像のタイル分割によって得られたタイル原画像(0LL)(デコンポジション・レベル0)に対して、2次元ウェーブレット変換を施し、デコンポジション・レベル1に示すサブバンド(1LL,1HL,1LH,1HH)を分離する。そして引き続き、この階層における低周波成分1LLに対して、2次元ウェーブレット変換を施し、デコンポジション・レベル2に示すサブバンド(2LL,2HL,2LH,2HH)を分離する。順次同様に、低周波成分2LLに対しても、2次元ウェーブレット変換を施し、デコンポジション・レベル3に示すサブバンド(3LL,3HL,3LH,3HH)を分離する。図3では、各デコンポジション・レベルにおいて符号化の対象となるサブバンドを、網掛けで表してある。例えば、デコンポジション・レベル数を3としたとき、網掛けで示したサブバンド(3HL,3LH,3HH,2HL,2LH,2HH,1HL,1LH,1HH)が符号化対象となり、3LLサブバンドは符号化されない。
【0070】
次いで、指定した符号化の順番で符号化の対象となるビットが定められ、図1に示す量子化・逆量子化部103で対象ビット周辺のビットからコンテキストが生成される。
【0071】
この量子化の処理が終わったウェーブレット係数は、個々のサブバンド毎に、「プレシンクト」と呼ばれる重複しない矩形に分割される。これは、インプリメンテーションでメモリを効率的に使うために導入されたものである。図4に示したように、一つのプレシンクトは、空間的に一致した3つの矩形領域からなっている。更に、個々のプレシンクトは、重複しない矩形の「コード・ブロック」に分けられる。これは、エントロピー・コーディングを行う際の基本単位となる。
【0072】
ウェーブレット変換後の係数値は、そのまま量子化し符号化することも可能であるが、JPEG2000では符号化効率を上げるために、係数値を「ビットプレーン」単位に分解し、画素あるいはコード・ブロック毎に「ビットプレーン」に順位付けを行うことができる。
【0073】
ここで、図5はビットプレーンに順位付けする手順の一例を示す説明図である。図5に示すように、この例は、原画像(32×32画素)を16×16画素のタイル4つで分割した場合で、デコンポジション・レベル1のプレシンクトとコード・ブロックの大きさは、各々8×8画素と4×4画素としている。プレシンクトとコード・ブロックの番号は、ラスター順に付けられており、この例では、プレンシクトが番号0から3まで、コード・ブロックが番号0から3まで割り当てられている。タイル境界外に対する画素拡張にはミラーリング法を使い、可逆(5,3)フィルタでウェーブレット変換を行い、デコンポジション・レベル1のウェーブレット係数値を求めている。
【0074】
また、タイル0/プレシンクト3/コード・ブロック3について、代表的な「レイヤ」構成の概念の一例を示す説明図も図5に併せて示す。変換後のコード・ブロックは、サブバンド(1LL,1HL,1LH,1HH)に分割され、各サブバンドにはウェーブレット係数値が割り当てられている。
【0075】
レイヤの構造は、ウェーブレット係数値を横方向(ビットプレーン方向)から見ると理解し易い。1つのレイヤは任意の数のビットプレーンから構成される。この例では、レイヤ0,1,2,3は、各々、1,3,1,3のビットプレーンから成っている。そして、LSB(Least Significant Bit:最下位ビット)に近いビットプレーンを含むレイヤ程、先に量子化の対象となり、逆に、MSB(Most Significant Bit:最上位ビット)に近いレイヤは最後まで量子化されずに残ることになる。LSBに近いレイヤから破棄する方法はトランケーションと呼ばれ、量子化率を細かく制御することが可能である。
【0076】
図1に示すエントロピー符号化・復号化部104では、コンテキストと対象ビットから確率推定によって、各コンポーネント111のタイル112に対する符号化を行う。こうして、原画像の全てのコンポーネント111について、タイル112単位で符号化処理が行われる。最後にタグ処理部105は、エントロピー符号化・復号化部104からの全符号化データを1本の符号列データに結合するとともに、それにタグを付加する処理を行う。
【0077】
図6には、この符号列データの1フレーム分の概略構成を示している。この符号列データの先頭と各タイルの符号データ(bit stream)の先頭にはヘッダ(メインヘッダ(Main header)、タイル境界位置情報等であるタイルパートヘッダ(tile part header))と呼ばれるタグ情報が付加され、その後に、各タイルの符号化データが続く。なお、メインヘッダ(Main header)には、符号化パラメータや量子化パラメータが記述されている。そして、符号列データの終端には、再びタグ(end of codestream)が置かれる。また、図7は、符号化されたウェーブレット係数値が収容されたパケットをサブバンド毎に表わしたコード・ストリーム構造を示すものである。図7に示すように、タイルによる分割処理を行っても、あるいはタイルによる分割処理を行わなくても、同様のパケット列構造を持つことになる。
【0078】
一方、符号化データの復号化時には、画像データの符号化時とは逆に、各コンポーネント111の各タイル112の符号列データから画像データを生成する。この場合、タグ処理部105は、外部より入力した符号列データに付加されたタグ情報を解釈し、符号列データを各コンポーネント111の各タイル112の符号列データに分解し、その各コンポーネント111の各タイル112の符号列データ毎に復号化処理(伸長処理)を行う。このとき、符号列データ内のタグ情報に基づく順番で復号化の対象となるビットの位置が定められるとともに、量子化・逆量子化部103で、その対象ビット位置の周辺ビット(既に復号化を終えている)の並びからコンテキストが生成される。エントロピー符号化・復号化部104で、このコンテキストと符号列データから確率推定によって復号化を行い、対象ビットを生成し、それを対象ビットの位置に書き込む。このようにして復号化されたデータは周波数帯域毎に空間分割されているため、これを2次元ウェーブレット変換・逆変換部102で2次元ウェーブレット逆変換を行うことにより、画像データの各コンポーネントの各タイルが復元される。復元されたデータは色空間変換・逆変換部101によって元の表色系の画像データに変換される。
【0079】
以上が、「JPEG2000アルゴリズム」の概要である。
【0080】
以下、本発明の実施の一形態について説明する。なお、ここでは、JPEG2000を代表とする画像圧縮伸長技術に関する例について説明するが、言うまでもなく、本発明は以下の説明の内容に限定されるものではない。
【0081】
本実施の形態のサーバコンピュータ及びクライアントコンピュータは、そのコンピュータにインストールされるか、あるいは解釈されて実行される画像処理プログラムによって動作制御されて画像処理を実行する。本実施の形態では、そのような画像処理プログラムを記憶する記憶媒体も紹介する。
【0082】
図8は、本実施の形態におけるシステム構築例を示す模式図である。
【0083】
本実施の形態の画像データ処理システムでは、サーバコンピュータ2にLAN(Local Area Network)等のネットワーク3を介して画像処理装置であるクライアントコンピュータ4が複数台接続されたサーバクライアントシステム1を想定する。このサーバクライアントシステム1は、スキャナやデジタルカメラ等の画像入力装置5及びプリンタ等の画像出力装置6をネットワーク3上でシェアし得る環境が整えられている。また、ネットワーク3上には、マルチファンクションペリフェラルと称されるMFP7が接続され、このMFP7が画像入力装置5や画像出力装置6として機能するように環境が構築されていても良い。
【0084】
このようなサーバクライアントシステム1は、例えばイントラネット8を介して別のサーバクライアントシステム1とのデータ通信可能に構築され、インターネット通信網9を介して外部環境とデータ通信可能に構築されている。
【0085】
サーバコンピュータ2は、文書管理サーバ2aとデータ変換サーバ2bとで構成されている。文書管理サーバ2aは、各種文書の画像イメージを画像データとして記憶する文書管理機能を発揮するものである。データ変換サーバ2bは、例えば画像データにOCR(Optical Character Reader)処理を施してテキストデータを抽出する等のデータ変換機能を発揮するものである。
【0086】
以下においては、本発明の特長的な機能を発揮する画像処理装置であるクライアントコンピュータ4について説明する。
【0087】
図9は、本実施の形態における画像処理装置としてのクライアントコンピュータ4のモジュール構成図である。クライアントコンピュータ4は、情報処理を行うCPU(Central Processing Unit)11、情報を格納するROM(Read OnlyMemory)12及びRAM(Random Access Memory)13等の一次記憶装置14、後述する圧縮符号を記憶する記憶部であるHDD(Hard Disk Drive)15等の二次記憶装置16、情報を保管したり外部に情報を配布したり外部から情報を入手するためのCD−ROMドライブ等のリムーバブルディスク装置17、ネットワーク3を介して画像入力装置5や外部の他のコンピュータと通信により情報を伝達するためのネットワークインターフェース18、処理経過や結果等を操作者に表示するCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等の表示装置19、並びに操作者がCPU11に命令や情報等を入力するためのキーボード20、マウス等のポインティングディバイス21等から構成されており、これらの各部間で送受信されるデータをバスコントローラ22が調停して動作する。
【0088】
このようなクライアントコンピュータ4では、ユーザが電源を投入するとCPU11がROM12内のローダーというプログラムを起動させ、HDD15よりオペレーティングシステムというコンピュータのハードウェアとソフトウェアとを管理するプログラムをRAM13に読み込み、このオペレーティングシステムを起動させる。このようなオペレーティングシステムは、ユーザの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。オペレーティングシステムのうち代表的なものとしては、Windows(登録商標)、UNIX(登録商標)等が知られている。これらのオペレーティングシステム上で走る動作プログラムをアプリケーションプログラムと呼んでいる。
【0089】
ここで、クライアントコンピュータ4は、アプリケーションプログラムとして、画像処理プログラムをHDD15に記憶している。この意味で、HDD15は、画像処理プログラムを記憶する記憶媒体として機能する。
【0090】
また、一般的には、クライアントコンピュータ4のHDD15等の二次記憶装置16にインストールされる動作プログラムは、CD−ROMやDVD−ROM等の光情報記録メディアやFD等の磁気メディア等に記録され、この記録された動作プログラムがHDD15等の二次記憶装置16にインストールされる。このため、CD−ROM等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体も、画像処理プログラムを記憶する記憶媒体となり得る。さらには、画像処理プログラムは、例えばネットワークインターフェース18を介して外部から取り込まれ、HDD15等の二次記憶装置16にインストールされても良い。
【0091】
クライアントコンピュータ4は、オペレーティングシステム上で動作する画像処理プログラムが起動すると、この画像処理プログラムに従い、CPU11が各種の演算処理を実行して各部を集中的に制御する。クライアントコンピュータ4のCPU11が実行する各種の演算処理のうち、本実施の形態の特長的な処理について以下に説明する。
【0092】
ここで、クライアントコンピュータ4のCPU11が実行する各種の演算処理により実現される機能について説明する。図10に示すように、画像処理装置であるクライアントコンピュータ4は、画像入力装置5で読み取った画像データを圧縮符号化する画像圧縮装置4aと、画像入力装置5で読み取られた入力原稿の位置ずれを補正するための位置ずれ補正装置4bと、の各機能をCPU11が実行する各種の演算処理により実現する。
【0093】
画像圧縮装置4aは、周波数変換にDCTを使ったJPEG、あるいは周波数変換にDWTを使ったJPEG2000アルゴリズムによって、デジタル画像データを符号化する。本実施の形態における画像圧縮装置4aは、画像のデジタル画素値信号を「JPEG2000アルゴリズム」に従って圧縮符号化する。なお、「JPEG2000アルゴリズム」に従った圧縮符号化処理については、図1で示した空間変換・逆変換部101、2次元ウェーブレット変換・逆変換部102、量子化・逆量子化部103、エントロピー符号化・復号化部104、タグ処理部105の説明において前述したので、ここでの説明は省略する。この画像圧縮装置4aにおける処理により、元の画像のR,G,Bの各コンポーネントの画像データは、フレーム毎に1又は複数(通常は複数)のタイルに分割され、このタイル毎に階層的に圧縮符号化された符号化データとなる。
【0094】
位置ずれ補正装置4bは、図11に示すような画像入力装置5に設けられた「読取座標」と、入力原稿の上に設けられた「ページ座標」との位置関係を、複数の入力原稿の間で一定に保つためのものである。つまり、画像入力装置5の「読取座標」の画像基準点である原点位置に対する複数の入力原稿についてのページ座標の画像基準点である原点位置を一定にするものである。なお、図11に示すように、画像入力装置5による読取範囲は、1または複数の矩形領域に分割されている。
【0095】
このような位置ずれ補正装置4bは、画像圧縮装置4aから出力される符号列データに基づいて、画像入力装置5で読み取られた入力原稿の位置ずれを各原稿毎に検出し、この位置ずれを補正するものである。この位置ずれ補正装置4bは、図12に示すように、符号列の入力を受け付ける符号列入力手段41、構文解析手段42、位置ずれ量検出手段43、抽出条件指定手段44、補正決定手段45、ページ座標移動手段46の各種手段から構成される。これらの各種手段は、前述の画像処理プログラムにしたがってCPU11が行う処理により実現している。なお、リアルタイム性が重要視される場合には、処理を高速化する必要がある。そのためには、論理回路(図示せず)を別途設け、論理回路の動作により各種手段の機能を実現するようにするのが望ましい。
【0096】
次に、位置ずれ補正装置4bを構成する各部について説明する。
【0097】
構文解析手段42は、画像圧縮装置4aから入力された符号列データの構文すなわちヘッダ部に記述されているデータを解読し、位置ずれ量検出手段43に「ヘッダ部情報」を出力するものである。ここで、図13は構文解析手段42によるヘッダ部情報の読み取りを示す説明図である。図13に示すように、ペイロード部のデータ量、すなわち、「パケット長」は、周波数変換係数値の数の和(周波数変換係数値の符号量)であって、ヘッダ部に記述されている。ここでは、周波数変換係数値はウェーブレット係数値である。そして、構文解析手段42は、このヘッダ部情報を読み取って位置ずれ量検出手段43に対して出力する。
【0098】
抽出条件指定手段44は、位置ずれ量検出手段43に対して必要十分な情報だけを提供すべく、画像圧縮装置4aから入力された符号列データについての矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域を各々指定する条件指定手段として機能するものである。このように符号列データについて、矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域を任意に指定することにより、位置ずれ量の精度と検出処理速度を、ユーザの望みに応じて最適化することが可能である。すなわち、位置ずれ量の検出精度と検出処理速度の間にあるトレード・オフ関係を考慮に入れて、高速化を重視する場合には、小さな矩形領域の、輝度成分の低域サブバンドだけに注目すればよい。逆に、正確な位置ずれ補正が必要な場合は、注目する矩形領域の面積を大きくし、サブバンドを高域まで調べればよい。
【0099】
位置ずれ量検出手段43は、概略的には、画像入力装置5で読み取った原稿の現ページに係る符号データのヘッダ部情報と、事前に記憶してある参照ページに係る符号データのヘッダ部情報を各々比較し、現ページの位置ずれ量を検出するものである。より具体的には、構文解析手段42から受け取った「ヘッダ部情報」に基づいて、画像入力装置5で読み取られた入力原稿の位置ずれ量を各原稿毎に検出し、補正決定手段45に出力するものである。なお、カラー画像の場合、輝度成分のみを使うと、位置ずれ量の検出が更に簡便、かつ高速になる。
【0100】
ここで、位置ずれ量検出手段43による画像入力装置5で読み取られた入力原稿の位置ずれ量の検出について説明する。ここでは、ペイロード部のデータ量、すなわち、「パケット長」に基づいて画像入力装置5で読み取られた入力原稿の位置ずれ量を検出する手法について説明する。ここで、図14は位置ずれ量検出手段43の構成を示すブロック図である。図14に示すように、ヘッダ部情報を受け取った位置ずれ量検出手段43は、そのヘッダ部情報から入力原稿のパケット長データを読み取る(パケット長読取手段43a)。そして、参照ページとする入力原稿については、読み取った入力原稿のパケット長データを記憶しておく(パケット長記憶手段43b)。画像入力装置5で読み取られた入力原稿の位置ずれ量は、符号量の変化量、すなわち、パケット長の変化量に現れることから、現ページと参照ページとの間におけるパケット長の差分を求めることにより(差分検出手段43c)、画像入力装置5で読み取られた入力原稿の位置ずれ量を検出することができる。
【0101】
ここで、図15は符号量差と位置ずれ量との関係を示す説明図である。図15に示すように、画像入力装置5で読み取られた入力原稿の位置ずれ量は符号量差(パケット長の差分値)の絶対値が増加するに従って大きくなることがわかる。すなわち、符号量差(パケット長の差分値)に関して、現ページと参照ページとの間で変化が無い、あるいは非常に少ない場合は、現ページと参照ページとの間に位置ずれは無いか非常に少ないと、みなすことができる。逆に、符号量差(パケット長の差分値)の絶対値の変化が大きい場合は、現ページと参照ページとの間の位置ずれ量が大きい、あるいは、書類の種類が異なる、とみなすことができる。
【0102】
補正決定手段45は、位置ずれ量検出手段43から受け取った「画像入力装置5で読み取られた入力原稿の位置ずれ量」に基づいて、ページ座標の移動(位置ずれ補正)を行うか否かを決定するものである。例えば、位置ずれ量が、ユーザが予め指定した閾値以下であれば、ページ座標の移動(位置ずれ補正)は行わないようにする。一方、位置ずれ量が、閾値を超えている場合には、ページ座標の移動(位置ずれ補正)を行うようにする。すなわち、補正決定手段45は、位置ずれ量が小さく、ページ座標の移動(位置ずれ補正)の必要がないと判断した場合には、画像入力装置5に対してその旨を示す制御信号を出力する。また、位置ずれ量が補正可能な程度であると判断した場合には、補正決定手段45は、ページ座標移動手段46に対して「画像入力装置5で読み取られた入力原稿の位置ずれ量」を出力する。
【0103】
ページ座標移動手段46は、補正決定手段45から受け取った「画像入力装置5で読み取られた入力原稿の位置ずれ量」に応じて、入力原稿のページ座標の原点を参照ページのページ座標の画像基準点に一致するように移動させるものである。
【0104】
以上説明したような位置ずれ補正装置4bによる位置ずれ補正処理の内容を、図16の位置ずれ補正装置4bによる位置ずれ補正処理の流れを示すフローチャートを参照しつつ更に詳細に説明する。この位置ずれ補正処理は、画像入力装置5による原稿の全領域の読取(本スキャン)が実行される前段階のプレスキャンの際に実行されるものである。なお、このプレスキャンにおいては、図17に示すように、原稿の全領域を読み取るのではなく、読取座標上で定義された四隅に位置し各4個の矩形領域で形成された四つの領域を位置ずれ検出用の領域として読み取り、画像圧縮装置4aで圧縮符号化する。なお、符号列がJPEG2000フォーマットである場合、矩形領域として、タイル、プレシンクトあるいはコード・ブロックを用いることができる。
【0105】
図16に示すように、位置ずれ補正処理は、まず、画像入力装置5によって読み取られた一の原稿を参照ページとし、この参照ページの位置ずれ検出用の各領域の圧縮符号を取得すると(ステップS1のY)、この各領域の符号量を算出して記憶する(ステップS2)。以上の処理により、参照ページの位置ずれ検出用の各領域の符号量が記憶保持されることになる。
【0106】
このような状態で、画像入力装置5によって読み取られた他の原稿を現ページとし、この現ページの位置ずれ検出用の各領域の圧縮符号を取得すると(ステップS4のY)、この各領域の符号量を算出する(ステップS5)。
【0107】
続くステップS5では、現ページの各領域の符号量を参照ページの各領域の符号量と比較し、位置ずれ量を算出する。
【0108】
ここで、図18は参照ページと現ページとにおける「画像入力装置5で読み取られた入力原稿の位置ずれ量」を示す一例である。図18に示す例では、参照ページの位置ずれ検出用の領域と現ページの位置ずれ検出用の領域とを比較すると、ページ座標が僅かにずれていることが解かる。前述したように、このようなずれ量は、符号量の変化量、すなわち、パケット長の変化量に現れることから、現ページの領域と参照ページの領域との間におけるパケット長の差分を求めることにより検出することができる。
【0109】
ステップS5において位置ずれ量が算出されると、その算出された位置ずれ量が、予め規定されている上限値と比較される(ステップS6)。この上限値は、例えば原稿が読取範囲からはみ出したことが判るように設定しておく。そして、位置ずれ量が上限値を超えた場合は(ステップS6のN)、画像入力装置5に対して原稿の再読み取りを指示する制御信号を出力し、現ページの位置ずれ検出用の各領域の圧縮符号の取得に待機する(ステップS3)。
【0110】
一方、位置ずれ量が上限値を超えない場合は(ステップS6のY)、ユーザが予め指定した閾値と位置ずれ量とが比較される(ステップS7)。
【0111】
位置ずれ量が閾値を超えている場合には(ステップS7のN)、ステップS8に進み、ページ座標の移動(位置ずれ補正)を行う。ページ座標の移動は、画像入力装置5で読み取られた現ページの画素値(読取座標ごとに与えられる)を、位置ずれ量分だけシフトさせることにより行われる。
【0112】
そして、ページ座標の移動後の現ページの位置ずれ検出用の各領域の圧縮符号を取得すると(ステップS4のY)、この各領域の符号量を算出し(ステップS5)、位置ずれ量が閾値以下になるまで(ステップS7のY)、ステップS8におけるページ座標の移動、すなわち、位置ずれ補正が繰り返される。図19に位置ずれ補正前と位置ずれ補正完了後の現ページを示す。なお、図19に示した例では、現ページの位置ずれ量は、水平・垂直方向だけである。本実施の形態の位置ずれ補正装置4bは、読み取られる原稿が読取座標に対して傾いている場合にも、対応することができる。位置ずれ量とずれ方向の関係は、事前に詳細に求めておくことが必要であることは言うまでもない。
【0113】
また、図20は位置ずれ補正前と位置ずれ補正完了後の位置ずれ量と符号量差の関係を示すものである。図20に示すように、位置ずれ量をより効率的に求めるために、最初の位置ずれ量検出処理は、低域サブバンドのみを対象に行い、順次サブバンドを高域にまで移動していく方法が有効である。
【0114】
そして、位置ずれ量がユーザが予め指定した閾値以下の場合には(ステップS7のY)、画像入力装置5に対して原稿の本スキャン処理(現ページの全領域の読取処理)を実行させるための制御信号を送信し(ステップS9)、プレスキャン処理を終了する。
【0115】
ここに、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点が参照ページのページ座標の画像基準点に一致するように移動させられる。これにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することが可能になる。
【0116】
なお、本実施の形態においては、原画像にタイル分割処理を施した場合について説明したが、これに限るものではない。原画像に対してタイル分割を行わない場合でも、プレシンクトやコード・ブロックを矩形領域として利用すれば、タイル分割を行った場合と同様に、参照ページに対する現ページの画像基準点の位置ずれ量を検出することが可能である。
【0117】
【発明の効果】
請求項1記載の発明の位置ずれ補正装置によれば、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析手段と、この構文解析手段の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出手段と、この位置ずれ量検出手段により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動手段と、を備え、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させることにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することができる。
【0118】
請求項2記載の発明によれば、請求項1記載の位置ずれ補正装置において、前記構文解析手段における構文解析条件を指定する条件指定手段を備え、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することができる。
【0119】
請求項3記載の発明によれば、請求項1または2記載の位置ずれ補正装置において、前記位置ずれ量検出手段は、前記構文解析手段の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取手段と、このパケット長読取手段により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶手段と、前記パケット長読取手段により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出手段と、を備え、参照ページに対する現ページの画像基準点の位置ずれ量を、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出することにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることができる。
【0120】
請求項4記載の発明によれば、請求項1ないし3のいずれか一記載の位置ずれ補正装置において、分割単位である矩形領域は、タイルであることにより、周波数変換として離散ウェーブレット変換を用いることができる。
【0121】
請求項5記載の発明によれば、請求項1ないし3のいずれか一記載の位置ずれ補正装置において、分割単位である矩形領域は、プレシンクトであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0122】
請求項6記載の発明によれば、請求項1ないし3のいずれか一記載の位置ずれ補正装置において、分割単位である矩形領域は、コード・ブロックであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0123】
請求項7記載の発明によれば、請求項1ないし6のいずれか一記載の位置ずれ補正装置において、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動手段によるページ座標の移動による位置ずれ補正を行わないことにより、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことで、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することができる。
【0124】
請求項8記載の発明の画像処理装置によれば、静止画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化する画像圧縮装置と、この画像圧縮装置により圧縮符号化された静止画像データの所定領域についての符号列データに基づき、参照ページに対する現ページの画像基準点の位置ずれを補正する請求項1ないし7のいずれか一記載の位置ずれ補正装置と、を備えることにより、画像を圧縮処理する際に、請求項1ないし7のいずれか一記載の発明と同様の作用効果を奏する画像処理装置を提供することができる。
【0125】
請求項9記載の発明のプログラムによれば、コンピュータにインストールされるか、あるいは解釈されて実行されるプログラムであって、前記コンピュータに、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析機能と、この構文解析機能の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出機能と、この位置ずれ量検出機能により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動機能と、を実行させ、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動することにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することができる。
【0126】
請求項10記載の発明によれば、請求項9記載のプログラムにおいて、前記構文解析機能における構文解析条件を指定する条件指定機能を前記コンピュータに実行させ、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することができる。
【0127】
請求項11記載の発明によれば、請求項9または10記載のプログラムにおいて、前記位置ずれ量検出機能は、前記構文解析機能の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取機能と、このパケット長読取機能により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶機能と、前記パケット長読取機能により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出機能と、を前記コンピュータに実行させ、参照ページに対する現ページの画像基準点の位置ずれ量を、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出することにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることができる。
【0128】
請求項12記載の発明によれば、請求項9ないし11のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、タイルであることにより、周波数変換として離散ウェーブレット変換を用いることができる。
【0129】
請求項13記載の発明によれば、請求項9ないし11のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、プレシンクトであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0130】
請求項14記載の発明によれば、請求項9ないし11のいずれか一記載のプログラムにおいて、分割単位である矩形領域は、コード・ブロックであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0131】
請求項15記載の発明によれば、請求項9ないし14のいずれか一記載のプログラムにおいて、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動機能によるページ座標の移動による位置ずれ補正を前記コンピュータに実行させないことにより、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことで、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することができる。
【0132】
請求項16記載の発明の記憶媒体によれば、請求項9ないし15のいずれか一記載のプログラムを記憶していることにより、この記憶媒体に記憶されたプログラムをコンピュータに読み取らせることで、請求項9ないし15のいずれか一記載の発明と同様の作用効果を得ることができる。
【0133】
請求項17記載の発明の位置ずれ補正方法によれば、静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析工程と、この構文解析工程の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出工程と、この位置ずれ量検出工程により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動工程と、を含み、静止画像データの所定領域を矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文の解析結果に基づいて検出された参照ページに対する現ページの画像基準点の位置ずれ量に応じ、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動することにより、符号列データを復号化し逆量子化するという複雑な処理を経ることなく参照ページに対する現ページの画像基準点の位置ずれを補正することができる。
【0134】
請求項18記載の発明によれば、請求項17記載の位置ずれ補正方法において、前記構文解析工程における構文解析条件を指定する条件指定工程を含み、例えば、構文解析条件として矩形領域の面積、コンポーネント(色成分)の数、サブバンドの帯域等を任意に指定することにより、位置ずれ量の精度と検出処理速度をユーザの望みに応じて最適化することができる。
【0135】
請求項19記載の発明によれば、請求項17または18記載の位置ずれ補正方法において、前記位置ずれ量検出工程は、前記構文解析工程の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取工程と、このパケット長読取工程により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶工程と、前記パケット長読取工程により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出工程と、を含み、参照ページに対する現ページの画像基準点の位置ずれ量を、静止画像データの所定領域についての現ページと参照ページとの周波数変換係数値の符号量であるパケット長を比較することにより検出することにより、参照ページに対する現ページの画像基準点の位置ずれ量の検出に際し、符号化された周波数変換係数値を復号化し、更に逆量子化するという複雑な処理が不要となるので、参照ページに対する現ページの画像基準点の位置ずれ量を高速、かつ、正確に求めることができる。
【0136】
請求項20記載の発明によれば、請求項17ないし19のいずれか一記載の位置ずれ補正方法において、分割単位である矩形領域は、タイルであることにより、周波数変換として離散ウェーブレット変換を用いることができる。
【0137】
請求項21記載の発明によれば、請求項17ないし19のいずれか一記載の位置ずれ補正方法において、分割単位である矩形領域は、プレシンクトであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0138】
請求項22記載の発明によれば、請求項17ないし19のいずれか一記載の位置ずれ補正方法において、分割単位である矩形領域は、コード・ブロックであることにより、タイル分割をしない場合(全画像領域=タイル)にも、タイル単位と同じように、参照ページに対する現ページの画像基準点の位置ずれ量検出の高速化を図ることができ、また、検出単位をタイルよりも小さな画像領域にすることができる。
【0139】
請求項23記載の発明によれば、請求項17ないし22のいずれか一記載の位置ずれ補正方法において、参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動工程によるページ座標の移動による位置ずれ補正を行わないことにより、例えば、所定値を原稿が読取範囲からはみ出したことが判るような値に設定しておくことで、ページ座標の移動による位置ずれ補正が不可能な場合にまで、位置ずれ補正を実行することを回避することができる。
【図面の簡単な説明】
【図1】本発明の前提となるJPEG2000方式の基本となる階層符号化アルゴリズムを実現するシステムの機能ブロック図である。
【図2】原画像の各コンポーネントの分割された矩形領域を示す説明図である。
【図3】デコンポジション・レベル数が3の場合の、各デコンポジション・レベルにおけるサブバンドを示す説明図である。
【図4】プレシンクトを示す説明図である。
【図5】ビットプレーンに順位付けする手順の一例を示す説明図である。
【図6】符号列データの1フレーム分の概略構成を示す説明図である。
【図7】符号化されたウェーブレット係数値が収容されたパケットをサブバンド毎に表わしたコード・ストリーム構造を示す説明図である。
【図8】本発明の実施の一形態のシステム構築例を示す模式図である。
【図9】画像処理装置としてのクライアントコンピュータのモジュール構成図である。
【図10】画像処理装置の構成を示す機能ブロック図である。
【図11】画像入力装置に設けられた「読取座標」と、入力原稿の上に設けられた「ページ座標」との位置関係を示す説明図である。
【図12】位置ずれ補正装置の構成を示す機能ブロック図である。
【図13】構文解析手段によるヘッダ部情報の読み取りを示す説明図である。
【図14】位置ずれ量検出手段の構成を示すブロック図である。
【図15】符号量差と位置ずれ量との関係を示す説明図である。
【図16】位置ずれ補正装置による位置ずれ補正処理の流れを示すフローチャートである。
【図17】位置ずれ検出用の各領域を示す説明図である。
【図18】参照ページと現ページとにおける「画像入力装置で読み取られた入力原稿の位置ずれ量」の一例を示す説明図である。
【図19】位置ずれ補正前と位置ずれ補正完了後の現ページを示す説明図である。
【図20】位置ずれ補正前と位置ずれ補正完了後の位置ずれ量と符号量差の関係を示す説明図である。
【図21】画像入力装置に設けられた「読取座標」と、入力原稿の上に設けられた「ページ座標」との位置関係を示す説明図である。
【符号の説明】
4 画像処理装置
4a 画像圧縮装置
4b 位置ずれ補正装置
15 記憶媒体
42 構文解析手段
43 位置ずれ検出手段
44 条件指定手段
46 ページ座標移動手段
43a パケット長読取手段
43b パケット長記憶手段
43c 差分検出手段
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a displacement correction device, an image processing device, a program, a storage medium, and a displacement correction method.
[0002]
[Prior art]
2. Description of the Related Art Due to advances in image input technology and output technology thereof, demands for higher definition of images have been extremely increased in recent years. For example, taking a digital camera (Digital Camera) as an example of an image input device, the price of a high-performance charge coupled device (CCD: Charge Coupled Device) having more than 3 million pixels has been reduced, and the price range has become widespread. Products have come to be widely used. It is said that this increasing tendency of the number of pixels will continue for a while.
[0003]
On the other hand, with regard to image output / display devices, for example, products in the hard copy field such as laser printers, ink jet printers and sublimation printers, and flat devices such as CRTs, LCDs (liquid crystal display devices), and PDPs (plasma display devices). The high definition and low price of products in the field of soft copy of panel displays are remarkable.
[0004]
Due to the effect of bringing high-performance, low-cost image input / output products to the market, the popularization of high-definition images has begun, and it is expected that demand for high-definition images will increase in all scenes in the future. Indeed, the development of technologies related to networks, such as personal computers and the Internet, is accelerating these trends. In particular, recently, mobile devices such as mobile phones and notebook personal computers have become very popular, and opportunities to transmit or receive high-definition images from any point using communication means have been rapidly increasing.
[0005]
Against this background, the demand for higher performance or multifunctional image compression / decompression technology that facilitates the handling of high-definition images will inevitably increase in the future.
[0006]
Therefore, in recent years, a new method called JPEG2000, which can restore a high-quality image even at a high compression ratio, is being standardized as one of the image compression methods satisfying such demands. In JPEG2000, by dividing an image into rectangular areas (tiles), it is possible to perform compression / expansion processing in a small memory environment. That is, each tile is a basic unit when executing the compression / decompression process, and the compression / decompression operation can be performed independently for each tile.
[0007]
By the way, generally, when a paper document (original document) is digitized and stored, the following processes are sequentially executed. First, paper documents (original documents) are read one by one using an image input device such as a scanner or a digital still camera. Next, the read image data is converted into encoded data such as JPEG or JPEG2000 using an image compression device. Finally, the compressed encoded data is stored in a storage device.
[0008]
However, when reading a plurality of paper documents (documents) using an image input device such as a scanner, the origin position of the page coordinates of the digitized paper documents (documents) differs for each paper document (document). Sometimes. Here, the page coordinates are coordinates provided on the digitized paper document (document), and as shown in FIG. 21, the origin position of the page coordinates is the origin position of the digitized paper document (document). One corner in the document range. That is, the fact that the origin position of the page coordinates of the digitized paper document (document) differs for each paper document (document) means that the reading range provided in an image input device such as a scanner as shown in FIG. This means that the relative positional relationship with respect to the absolute coordinates (read coordinates) differs for each paper document (original).
[0009]
If the origin position of the page coordinates of the digitized paper document (original) is different for each paper document (original), an image search process is performed on those paper documents (original). In addition, a highly accurate search result cannot be obtained.
[0010]
Therefore, in order to correct such a positional deviation of the page coordinates, the position of the paper document (original document) is adjusted again.
[0011]
[Problems to be solved by the invention]
However, it is practically impossible to perform registration for each input paper document (original document) when a large number of paper documents (original documents) are to be input.
[0012]
Also, a method of correcting a position shift of page coordinates based on coded data such as JPEG or JPEG2000 converted using an image compression device is being studied. However, a method of decoding a coded frequency conversion coefficient value is proposed. Further, since complicated processing such as inverse quantization is required, there is a problem that the processing time is long and the processing speed is low.
[0013]
An object of the present invention is to provide a position shift correction apparatus and an image processing apparatus capable of correcting a position shift of an image reference point of a current page with respect to a reference page without going through a complicated process of decoding and dequantizing code string data. , A program, a storage medium, and a position shift correction method.
[0014]
[Means for Solving the Problems]
The position shift correcting apparatus according to the first aspect of the present invention is created by dividing a predetermined area of the still image data into one or a plurality of rectangular areas, frequency-converting pixel values for each of the rectangular areas, and hierarchically compressing and encoding. Syntactic analysis means for analyzing the syntax of the encoded code string data, and displacement amount detection means for detecting the displacement amount of the image reference point of the current page with respect to the reference page to be compared based on the analysis result of the syntax analysis means And a page coordinate moving means for moving the image reference point of the page coordinates of the current page so as to match the image reference point of the page coordinates of the reference page in accordance with the amount of displacement detected by the displacement amount detecting means. , Is provided.
[0015]
Therefore, the predetermined page of the still image data is subjected to the frequency conversion of the pixel value for each rectangular area and hierarchically compression-encoded, and the current page relative to the reference page detected based on the analysis result of the syntax of the code string data created. The image reference point at the page coordinates of the current page is moved according to the displacement amount of the image reference point so as to match the image reference point at the page coordinates of the reference page. This makes it possible to correct the displacement of the image reference point of the current page with respect to the reference page without going through a complicated process of decoding and dequantizing the code string data.
[0016]
According to a second aspect of the present invention, there is provided the positional deviation correcting device according to the first aspect, further comprising condition specifying means for specifying syntax analysis conditions in the syntax analysis means.
[0017]
Therefore, for example, by arbitrarily specifying the area of the rectangular region, the number of components (color components), the band of the subband, and the like as the parsing conditions, the accuracy of the displacement amount and the detection processing speed can be adjusted according to the user's desire. It becomes possible to optimize.
[0018]
According to a third aspect of the present invention, in the position shift correcting apparatus according to the first or second aspect, the position shift amount detecting means determines a packet length of a packet constituting code string data based on an analysis result of the syntax analyzing means. Packet length reading means to be read, packet length storage means for storing one packet length read by the packet length reading means as the packet length of a reference page to be compared, and packet length reading means to be read by the packet length reading means. And a difference detecting means for detecting a difference value between the packet length of the current page and the packet length of the reference page as a positional shift amount of an image reference point with respect to the reference page of the current page.
[0019]
Therefore, the amount of displacement of the image reference point of the current page with respect to the reference page is detected by comparing the packet length, which is the code amount of the frequency conversion coefficient value between the current page and the reference page for a predetermined area of the still image data. You. This eliminates the need for a complicated process of decoding the coded frequency transform coefficient value and further performing inverse quantization upon detecting the amount of displacement of the image reference point of the current page with respect to the reference page. It is possible to quickly and accurately determine the amount of displacement of the image reference point of the current page.
[0020]
According to a fourth aspect of the present invention, in the position shift correcting device according to any one of the first to third aspects, the rectangular area as a division unit is a tile.
[0021]
Therefore, a discrete wavelet transform can be used as the frequency transform.
[0022]
According to a fifth aspect of the present invention, in the position shift correcting apparatus according to any one of the first to third aspects, the rectangular area as a division unit is a precinct.
[0023]
Therefore, even when the tile division is not performed (all image areas = tiles), it is possible to speed up the detection of the amount of displacement of the image reference point of the current page with respect to the reference page, as in the case of the tile unit. Further, it becomes possible to set the detection unit to an image area smaller than the tile.
[0024]
According to a sixth aspect of the present invention, in the position shift correcting device according to any one of the first to third aspects, the rectangular area as a division unit is a code block.
[0025]
Therefore, even when the tile division is not performed (all image areas = tiles), it is possible to speed up the detection of the amount of displacement of the image reference point of the current page with respect to the reference page, as in the case of the tile unit. Further, it becomes possible to set the detection unit to an image area smaller than the tile.
[0026]
According to a seventh aspect of the present invention, in the position shift correcting apparatus according to any one of the first to sixth aspects, when the position shift amount of the image reference point of the current page with respect to the reference page exceeds a predetermined value, the page shift is performed. The position shift is not corrected by moving the page coordinates by the coordinate moving means.
[0027]
Therefore, for example, by setting the predetermined value to a value that indicates that the document is out of the reading range, the positional deviation correction is executed until the positional deviation can not be corrected by moving the page coordinates. Can be avoided.
[0028]
An image processing apparatus according to the present invention is an image compression apparatus that divides still image data into one or a plurality of rectangular areas, frequency-converts pixel values for each of the rectangular areas, and hierarchically compresses and codes the image data. 8. The positional deviation according to claim 1, wherein the positional deviation of an image reference point of a current page with respect to a reference page is corrected based on code string data of a predetermined area of the still image data compression-encoded by the compression device. A correction device.
[0029]
Therefore, it is possible to provide an image processing apparatus that performs the same operation as the invention according to any one of claims 1 to 7 when compressing an image.
[0030]
The program according to the ninth aspect of the present invention is a program that is installed on a computer or interpreted and executed by the computer, wherein the predetermined area of the still image data is divided into one or a plurality of rectangular areas. A syntax analysis function that analyzes the syntax of code string data created by frequency-converting pixel values for each rectangular area and hierarchically compressing and encoding them, and a reference to be compared based on the analysis result of this syntax analysis function A position shift amount detection function for detecting the position shift amount of the image reference point of the current page with respect to the page, and referring to the image reference point of the page coordinates of the current page according to the position shift amount detected by the position shift amount detection function. And a page coordinate moving function for moving the page so as to match the image reference point of the page coordinates.
[0031]
Therefore, the predetermined page of the still image data is subjected to the frequency conversion of the pixel value for each rectangular area and hierarchically compression-encoded, and the current page relative to the reference page detected based on the analysis result of the syntax of the code string data created. The image reference point at the page coordinates of the current page is moved according to the displacement amount of the image reference point so as to match the image reference point at the page coordinates of the reference page. This makes it possible to correct the displacement of the image reference point of the current page with respect to the reference page without going through a complicated process of decoding and dequantizing the code string data.
[0032]
According to a tenth aspect of the present invention, in the program according to the ninth aspect, the computer causes the computer to execute a condition specifying function for specifying a syntax analysis condition in the syntax analysis function.
[0033]
Therefore, for example, by arbitrarily specifying the area of the rectangular region, the number of components (color components), the band of the subband, and the like as the parsing conditions, the accuracy of the displacement amount and the detection processing speed can be adjusted according to the user's desire. It becomes possible to optimize.
[0034]
According to an eleventh aspect of the present invention, in the program according to the ninth or tenth aspect, the position shift amount detection function reads a packet length of a packet constituting code string data based on an analysis result of the syntax analysis function. A reading function, a packet length storage function for storing the one packet length read by the packet length reading function as the packet length of a reference page to be compared, and a current page read by the packet length reading function And a difference detection function of detecting a difference value between the packet length of the reference page and the packet length of the reference page as a positional shift amount of an image reference point with respect to a reference page of a current page.
[0035]
Therefore, the amount of displacement of the image reference point of the current page with respect to the reference page is detected by comparing the packet length, which is the code amount of the frequency conversion coefficient value between the current page and the reference page for a predetermined area of the still image data. You. This eliminates the need for a complicated process of decoding the coded frequency transform coefficient value and further performing inverse quantization upon detecting the amount of displacement of the image reference point of the current page with respect to the reference page. It is possible to quickly and accurately determine the amount of displacement of the image reference point of the current page.
[0036]
According to a twelfth aspect of the present invention, in the program according to any one of the ninth to eleventh aspects, the rectangular area as a division unit is a tile.
[0037]
Therefore, a discrete wavelet transform can be used as the frequency transform.
[0038]
According to a thirteenth aspect of the present invention, in the program according to any one of the ninth to eleventh aspects, the rectangular area as a division unit is a precinct.
[0039]
Therefore, even when the tile division is not performed (all image areas = tiles), it is possible to speed up the detection of the amount of displacement of the image reference point of the current page with respect to the reference page, as in the case of the tile unit. Further, it becomes possible to set the detection unit to an image area smaller than the tile.
[0040]
According to a fourteenth aspect of the present invention, in the program according to any one of the ninth to eleventh aspects, the rectangular area that is a division unit is a code block.
[0041]
Therefore, even when the tile division is not performed (all image areas = tiles), it is possible to speed up the detection of the amount of displacement of the image reference point of the current page with respect to the reference page, as in the case of the tile unit. Further, it becomes possible to set the detection unit to an image area smaller than the tile.
[0042]
According to a fifteenth aspect of the present invention, in the program according to any one of the ninth to fourteenth aspects, when the positional shift amount of the image reference point of the current page with respect to the reference page exceeds a predetermined value, the page coordinate movement function is performed. The computer does not cause the computer to execute the displacement correction due to the movement of the page coordinates.
[0043]
Therefore, for example, by setting the predetermined value to a value that indicates that the document is out of the reading range, the positional deviation correction is executed until the positional deviation can not be corrected by moving the page coordinates. Can be avoided.
[0044]
A storage medium according to a sixteenth aspect stores the program according to any one of the ninth to fifteenth aspects.
[0045]
Therefore, by causing a computer to read the program stored in the storage medium, it is possible to obtain the same operation as the invention according to any one of claims 9 to 15.
[0046]
According to a seventeenth aspect of the present invention, there is provided a position shift correction method, wherein a predetermined area of still image data is divided into one or a plurality of rectangular areas, and a pixel value is frequency-converted for each of the rectangular areas and hierarchically compression-encoded. A syntax analysis step of analyzing the syntax of the encoded code string data, and a displacement detection step of detecting a displacement of an image reference point of the current page with respect to a reference page to be compared based on the analysis result of the syntax analysis step. And a page coordinate moving step of moving the image reference point of the page coordinates of the current page so as to match the image reference point of the page coordinates of the reference page according to the position shift amount detected in the position shift amount detection step. ,including.
[0047]
Therefore, the predetermined page of the still image data is subjected to the frequency conversion of the pixel value for each rectangular area and hierarchically compression-encoded, and the current page relative to the reference page detected based on the analysis result of the syntax of the code string data created. The image reference point at the page coordinates of the current page is moved so as to match the image reference point at the page coordinates of the reference page according to the amount of displacement of the image reference point. This makes it possible to correct the displacement of the image reference point of the current page with respect to the reference page without going through complicated processing of decoding and dequantizing the code string data.
[0048]
According to an eighteenth aspect of the present invention, in the position shift correcting method according to the seventeenth aspect, a condition specifying step of specifying a syntax analysis condition in the syntax analysis step is included.
[0049]
Therefore, for example, by arbitrarily specifying the area of the rectangular region, the number of components (color components), the band of the subband, and the like as the parsing conditions, the accuracy of the displacement amount and the detection processing speed can be adjusted according to the user's desire. It becomes possible to optimize.
[0050]
According to a nineteenth aspect of the present invention, in the position shift correction method according to the seventeenth or eighteenth aspect, the position shift amount detecting step determines a packet length of a packet constituting code string data based on an analysis result of the syntax analysis step. A packet length reading step for reading, a packet length storing step for storing the one packet length read in the packet length reading step as the packet length of a reference page to be compared, and a packet length reading step for reading the packet length. And detecting a difference value between the packet length of the current page and the packet length of the reference page as a positional shift amount of an image reference point with respect to the reference page of the current page.
[0051]
Therefore, the amount of displacement of the image reference point of the current page with respect to the reference page is detected by comparing the packet length, which is the code amount of the frequency conversion coefficient value between the current page and the reference page for a predetermined area of the still image data. You. This eliminates the need for a complicated process of decoding the coded frequency transform coefficient value and further performing inverse quantization upon detecting the amount of displacement of the image reference point of the current page with respect to the reference page. It is possible to quickly and accurately determine the amount of displacement of the image reference point of the current page.
[0052]
According to a twentieth aspect of the present invention, in the method of any one of the seventeenth to nineteenth aspects, the rectangular area, which is a division unit, is a tile.
[0053]
Therefore, a discrete wavelet transform can be used as the frequency transform.
[0054]
According to a twenty-first aspect of the present invention, in the position shift correction method according to any one of the seventeenth to nineteenth aspects, the rectangular area as a division unit is a precinct.
[0055]
Therefore, even when the tile division is not performed (all image areas = tiles), it is possible to speed up the detection of the amount of displacement of the image reference point of the current page with respect to the reference page, as in the case of the tile unit. Further, it becomes possible to set the detection unit to an image area smaller than the tile.
[0056]
According to a twenty-second aspect of the present invention, in the position shift correcting method according to any one of the seventeenth to nineteenth aspects, the rectangular area as a division unit is a code block.
[0057]
Therefore, even when the tile division is not performed (all image areas = tiles), it is possible to speed up the detection of the amount of displacement of the image reference point of the current page with respect to the reference page, as in the case of the tile unit. Further, it becomes possible to set the detection unit to an image area smaller than the tile.
[0058]
According to a twenty-third aspect of the present invention, in the position shift correcting method according to any one of the seventeenth to twenty-second aspects, when the shift amount of the image reference point of the current page with respect to the reference page exceeds a predetermined value, The position shift is not corrected by moving the page coordinates in the coordinate moving step.
[0059]
Therefore, for example, by setting the predetermined value to a value that indicates that the document is out of the reading range, the positional deviation correction is executed until the positional deviation can not be corrected by moving the page coordinates. Can be avoided.
[0060]
BEST MODE FOR CARRYING OUT THE INVENTION
One embodiment of the present invention will be described with reference to FIGS.
[0061]
First, the outlines of the “hierarchical encoding algorithm” and the “JPEG2000 algorithm” which are the premise of the present invention will be described.
[0062]
FIG. 1 is a functional block diagram of a system for realizing a hierarchical coding algorithm which is a basic of the JPEG2000 system. This system includes a color space conversion / inverse transformation unit 101, a two-dimensional wavelet transformation / inverse transformation unit 102, a quantization / inverse quantization unit 103, an entropy coding / decoding unit 104, and a tag processing unit 105. It is configured.
[0063]
One of the biggest differences between this system and the conventional JPEG algorithm is the conversion method. In JPEG, discrete cosine transform (DCT: Discrete Cosine Transform) is used, whereas in the hierarchical coding algorithm, a two-dimensional wavelet transform / inverse transform unit 102 uses discrete wavelet transform (DWT: Discrete Wavelet Transform). ing. DWT has an advantage that the image quality in a high compression area is better than DCT, and this is one of the main reasons why DWT was adopted in JPEG2000 which is a successor algorithm of JPEG.
[0064]
Another major difference is that in the hierarchical coding algorithm, a functional block of the tag processing unit 105 is added in order to form a code at the last stage of the system. The tag processing unit 105 generates compressed data as code string data at the time of image compression operation, and interprets code string data required for decompression at the time of decompression operation. The JPEG2000 can realize various convenient functions by using the code string data. For example, the compression / expansion operation of a still image can be freely stopped at an arbitrary layer (decomposition level) corresponding to octave division in a DWT on a block basis (see FIG. 3 described later).
[0065]
In many cases, a color space conversion / inverse conversion 101 is connected to the input / output portion of the original image. For example, an RGB color system composed of R (red) / G (green) / B (blue) components of a primary color system, and Y (yellow) / M (magenta) / C (cyan) components of a complementary color system The conversion or inverse conversion from the YMC color system to the YUV or YCbCr color system corresponds to this.
[0066]
Next, the JPEG2000 algorithm will be described.
[0067]
Generally, in a color image, as shown in FIG. 2, each component 111 (here, the RGB primary color system) of the original image is divided by a rectangular area. The divided rectangular area is generally called a block or a tile. In JPEG2000, it is generally called a tile. Hereinafter, such a divided rectangular area is referred to as a tile. (In the example of FIG. 2, each component 111 is divided into a total of 16 rectangular tiles 112, 4 × 4 vertically and horizontally.) When such individual tiles 112 (in the example of FIG. 2, R00, R01,..., R15 / G00, G01,..., G15 / B00, B01,. Is the basic unit of Therefore, the compression / decompression operation of the image data is performed independently for each component and for each tile 112.
[0068]
At the time of encoding image data, the data of each tile 112 of each component 111 is input to the color space conversion / inverse conversion unit 101 of FIG. 1 and subjected to color space conversion. A dimensional wavelet transform (forward transform) is performed, and spatial division into frequency bands is performed.
[0069]
FIG. 3 shows subbands at each decomposition level when the number of decomposition levels is three. That is, a two-dimensional wavelet transform is performed on the tile original image (0LL) (decomposition level 0) obtained by dividing the original image into tiles, and the subbands (1LL, 1HL, 1LH) indicated by the decomposition level 1 are obtained. , 1HH). Subsequently, two-dimensional wavelet transform is performed on the low-frequency component 1LL in this layer to separate the subbands (2LL, 2HL, 2LH, 2HH) shown in the decomposition level 2. Similarly, two-dimensional wavelet transform is performed on the low-frequency component 2LL in the same manner to separate the sub-bands (3LL, 3HL, 3LH, 3HH) shown in the decomposition level 3. In FIG. 3, the subbands to be coded at each decomposition level are shaded. For example, when the number of decomposition levels is 3, the subbands (3HL, 3LH, 3HH, 2HL, 2LH, 2HH, 1HL, 1LH, 1HH) indicated by shading are to be encoded, and the 3LL subbands are encoded. Is not converted.
[0070]
Next, bits to be encoded are determined in the designated order of encoding, and the quantization / inverse quantization unit 103 shown in FIG. 1 generates a context from bits around the target bits.
[0071]
The wavelet coefficients after the quantization process are divided into non-overlapping rectangles called “precincts” for each subband. This was introduced to make efficient use of memory in the implementation. As shown in FIG. 4, one precinct is formed of three spatially coincident rectangular areas. Further, each precinct is divided into non-overlapping rectangular "code blocks". This is a basic unit when performing entropy coding.
[0072]
The coefficient value after wavelet transform can be quantized and encoded as it is. However, in JPEG2000, in order to increase the encoding efficiency, the coefficient value is decomposed into “bit plane” units, and each pixel or code block is decomposed. "Bit planes" can be ranked.
[0073]
Here, FIG. 5 is an explanatory diagram showing an example of a procedure for prioritizing bit planes. As shown in FIG. 5, in this example, the original image (32 × 32 pixels) is divided into four 16 × 16 pixel tiles, and the size of the precinct of the decomposition level 1 and the size of the code block are as follows. Each has 8 × 8 pixels and 4 × 4 pixels. The numbers of precincts and code blocks are assigned in raster order. In this example, the precincts are assigned numbers 0 to 3, and the code blocks are assigned numbers 0 to 3. The pixel expansion outside the tile boundary is performed by using a mirroring method, performing a wavelet transform using a reversible (5, 3) filter, and obtaining a wavelet coefficient value of decomposition level 1.
[0074]
FIG. 5 also shows an explanatory diagram showing an example of a typical “layer” configuration concept of tile 0 / precinct 3 / code block 3. The converted code block is divided into subbands (1LL, 1HL, 1LH, 1HH), and each subband is assigned a wavelet coefficient value.
[0075]
The layer structure is easy to understand when the wavelet coefficient value is viewed from the horizontal direction (bit plane direction). One layer is composed of an arbitrary number of bit planes. In this example, layers 0, 1, 2, and 3 are made up of 1, 3, 1, and 3 bit planes, respectively. A layer including a bit plane closer to LSB (Least Significant Bit: Least Significant Bit) is subject to quantization first, and conversely, a layer closer to MSB (Most Significant Bit: Most Significant Bit) is quantized to the end. It will remain without being. A method of discarding from a layer close to the LSB is called truncation, and it is possible to finely control the quantization rate.
[0076]
The entropy encoding / decoding unit 104 shown in FIG. 1 performs encoding on the tile 112 of each component 111 by probability estimation from the context and the target bit. In this way, the encoding process is performed on all the components 111 of the original image in tile 112 units. Finally, the tag processing unit 105 performs a process of combining all the encoded data from the entropy encoding / decoding unit 104 into one piece of code string data and adding a tag thereto.
[0077]
FIG. 6 shows a schematic configuration of one frame of the code string data. At the head of the code string data and the head of the code data (bit stream) of each tile, tag information called a header (main header, tile part header as tile boundary position information, etc.) is provided. This is followed by coded data for each tile. Note that the main header (Main header) describes coding parameters and quantization parameters. Then, a tag (end of codestream) is placed again at the end of the code string data. FIG. 7 shows a code stream structure in which packets containing encoded wavelet coefficient values are represented for each subband. As shown in FIG. 7, the same packet sequence structure is obtained even if the division processing using tiles is performed or the division processing is not performed using tiles.
[0078]
On the other hand, when the encoded data is decoded, the image data is generated from the code string data of each tile 112 of each component 111, contrary to the encoding of the image data. In this case, the tag processing unit 105 interprets the tag information added to the code string data input from the outside, decomposes the code string data into code string data of each tile 112 of each component 111, and A decoding process (decompression process) is performed for each code string data of each tile 112. At this time, the positions of the bits to be decoded are determined in the order based on the tag information in the code string data, and the quantization / dequantization unit 103 sets the peripheral bits of the target bit position (the A context is generated from the sequence of (finished). The entropy coding / decoding unit 104 performs decoding by probability estimation from the context and the code string data, generates a target bit, and writes it to the position of the target bit. Since the data decoded in this way is spatially divided for each frequency band, the two-dimensional wavelet transform / inverse transform unit 102 performs an inverse two-dimensional wavelet transform on the data to obtain each component of the image data. The tile is restored. The restored data is converted by the color space conversion / inverse conversion unit 101 into the original color system image data.
[0079]
The above is the outline of the “JPEG2000 algorithm”.
[0080]
Hereinafter, an embodiment of the present invention will be described. Here, an example relating to an image compression / decompression technique represented by JPEG2000 will be described, but needless to say, the present invention is not limited to the content of the following description.
[0081]
The server computer and the client computer according to the present embodiment perform image processing by being operation-controlled by an image processing program installed on the computer or interpreted and executed. In the present embodiment, a storage medium that stores such an image processing program is also introduced.
[0082]
FIG. 8 is a schematic diagram illustrating a system configuration example according to the present embodiment.
[0083]
In the image data processing system according to the present embodiment, a server client system 1 in which a plurality of client computers 4 as image processing apparatuses are connected to a server computer 2 via a network 3 such as a LAN (Local Area Network) is assumed. The server client system 1 is provided with an environment in which an image input device 5 such as a scanner or a digital camera and an image output device 6 such as a printer can be shared on a network 3. Further, an MFP 7 called a multifunction peripheral may be connected to the network 3, and an environment may be constructed such that the MFP 7 functions as the image input device 5 or the image output device 6.
[0084]
Such a server client system 1 is configured to be able to perform data communication with another server client system 1 via, for example, an intranet 8, and is configured to be able to perform data communication with an external environment via an Internet communication network 9.
[0085]
The server computer 2 includes a document management server 2a and a data conversion server 2b. The document management server 2a exhibits a document management function of storing image images of various documents as image data. The data conversion server 2b exerts a data conversion function such as extracting text data by performing an OCR (Optical Character Reader) process on the image data.
[0086]
In the following, a description will be given of a client computer 4 which is an image processing device that exhibits the characteristic functions of the present invention.
[0087]
FIG. 9 is a module configuration diagram of the client computer 4 as the image processing device according to the present embodiment. The client computer 4 includes a CPU (Central Processing Unit) 11 for performing information processing, a ROM (Read Only Memory) 12 for storing information, a primary storage device 14 such as a RAM (Random Access Memory) 13, and a storage for storing a compression code to be described later. A secondary storage device 16 such as a hard disk drive (HDD) 15 as a unit, a removable disk device 17 such as a CD-ROM drive for storing information, distributing information to the outside, and obtaining information from the outside, a network A network interface 18 for transmitting information through communication with the image input device 5 and other external computers via the CRT 3; a CRT (Cathode Ray Tube) or an LCD for displaying the progress of processing and results to the operator; It comprises a display device 19 such as a Liquid Crystal Display, a keyboard 20 for the operator to input commands and information to the CPU 11, a pointing device 21 such as a mouse, and the like, and data transmitted and received between these units. Are operated by the bus controller 22.
[0088]
In such a client computer 4, when the user turns on the power, the CPU 11 starts a program called a loader in the ROM 12, reads a program called an operating system, which manages the hardware and software of the computer, from the HDD 15 into the RAM 13. Start. Such an operating system starts a program, reads information, and saves information in response to a user operation. As typical operating systems, Windows (registered trademark), UNIX (registered trademark), and the like are known. The operation programs running on these operating systems are called application programs.
[0089]
Here, the client computer 4 stores an image processing program in the HDD 15 as an application program. In this sense, the HDD 15 functions as a storage medium that stores the image processing program.
[0090]
Generally, an operation program installed in the secondary storage device 16 such as the HDD 15 of the client computer 4 is recorded on an optical information recording medium such as a CD-ROM or a DVD-ROM or a magnetic medium such as an FD. Then, the recorded operation program is installed in the secondary storage device 16 such as the HDD 15. Therefore, a portable storage medium such as an optical information recording medium such as a CD-ROM or a magnetic medium such as an FD can be a storage medium for storing the image processing program. Further, the image processing program may be fetched from outside via, for example, the network interface 18 and installed in the secondary storage device 16 such as the HDD 15.
[0091]
When the image processing program running on the operating system is activated, the client computer 4 causes the CPU 11 to execute various arithmetic processes according to the image processing program and control each unit intensively. Among the various arithmetic processes executed by the CPU 11 of the client computer 4, the characteristic processes of the present embodiment will be described below.
[0092]
Here, functions realized by various arithmetic processes executed by the CPU 11 of the client computer 4 will be described. As shown in FIG. 10, a client computer 4 serving as an image processing device includes an image compression device 4 a that compresses and encodes image data read by an image input device 5, and a position shift of an input document read by the image input device 5. The functions of the position error correction device 4b for correcting the error and the various functions are realized by various arithmetic processes executed by the CPU 11.
[0093]
The image compression device 4a encodes digital image data by JPEG using DCT for frequency conversion or JPEG2000 algorithm using DWT for frequency conversion. The image compression device 4a according to the present embodiment compresses and encodes a digital pixel value signal of an image according to the “JPEG2000 algorithm”. Note that, regarding the compression encoding processing according to the “JPEG2000 algorithm”, the spatial transform / inverse transform unit 101, the two-dimensional wavelet transform / inverse transform unit 102, the quantization / inverse quantize unit 103, the entropy code shown in FIG. The description of the encryption / decryption unit 104 and the tag processing unit 105 has been described above, and a description thereof will be omitted. By the processing in the image compression device 4a, the image data of each of the R, G, and B components of the original image is divided into one or a plurality (usually, a plurality) of tiles for each frame. The data becomes compression-encoded data.
[0094]
The misregistration correction device 4b determines the positional relationship between the “read coordinates” provided on the image input device 5 as shown in FIG. 11 and the “page coordinates” provided on the input document. It is intended to keep it constant between them. That is, the origin position, which is the image reference point of the page coordinates of the plurality of input documents, with respect to the origin position, which is the image reference point of the “read coordinates” of the image input device 5, is made constant. As shown in FIG. 11, the reading range of the image input device 5 is divided into one or a plurality of rectangular areas.
[0095]
The misregistration correction device 4b detects the misregistration of the input document read by the image input device 5 for each document based on the code string data output from the image compression device 4a, and detects the misregistration. It is to be corrected. As shown in FIG. 12, the displacement correcting device 4b includes a code string input means 41 for receiving a code string input, a syntax analyzing means 42, a displacement amount detecting means 43, an extraction condition specifying means 44, a correction determining means 45, It comprises various means of the page coordinate moving means 46. These various means are realized by processing performed by the CPU 11 according to the above-described image processing program. When real-time performance is important, it is necessary to speed up the processing. To this end, it is desirable to separately provide a logic circuit (not shown) and realize the functions of various units by the operation of the logic circuit.
[0096]
Next, each component of the displacement correcting device 4b will be described.
[0097]
The syntax analysis unit 42 decodes the syntax of the code string data input from the image compression device 4 a, that is, the data described in the header, and outputs “header information” to the displacement detection unit 43. . Here, FIG. 13 is an explanatory diagram showing reading of the header section information by the syntax analysis means 42. As shown in FIG. 13, the data amount of the payload portion, that is, the “packet length” is the sum of the number of frequency conversion coefficient values (the code amount of the frequency conversion coefficient value) and is described in the header portion. Here, the frequency transform coefficient value is a wavelet coefficient value. Then, the syntax analysis unit 42 reads the header part information and outputs it to the positional deviation amount detection unit 43.
[0098]
The extraction condition designating unit 44 provides an area and a component (color component) of a rectangular region for the code string data input from the image compression device 4a in order to provide only necessary and sufficient information to the displacement amount detecting unit 43. It functions as condition specifying means for specifying the number and the sub-band. By arbitrarily specifying the area of the rectangular area, the number of components (color components), and the band of the sub-band in the code string data in this manner, the accuracy of the displacement amount and the detection processing speed can be adjusted according to the user's desire. It is possible to optimize. That is, taking into account the trade-off relationship between the detection accuracy of the displacement amount and the detection processing speed, when emphasizing high speed, focus only on the low-frequency sub-band of the luminance component in a small rectangular area. do it. Conversely, when accurate misregistration correction is required, the area of the rectangular region of interest may be increased, and the sub-bands may be checked up to the high band.
[0099]
The position shift amount detecting means 43 is generally composed of header part information of the code data relating to the current page of the document read by the image input device 5 and header part information of the code data relating to the reference page stored in advance. Are compared with each other to detect the displacement amount of the current page. More specifically, based on the “header information” received from the syntax analysis unit 42, the position deviation amount of the input document read by the image input device 5 is detected for each document and output to the correction determination unit 45. Is what you do. In the case of a color image, if only the luminance component is used, the amount of displacement can be detected more easily and at a higher speed.
[0100]
Here, detection of the amount of displacement of the input document read by the image input device 5 by the displacement amount detecting means 43 will be described. Here, a method for detecting the amount of displacement of the input document read by the image input device 5 based on the data amount of the payload portion, that is, the “packet length” will be described. Here, FIG. 14 is a block diagram showing the configuration of the displacement amount detecting means 43. As shown in FIG. 14, upon receiving the header information, the displacement detecting means 43 reads the packet length data of the input document from the header information (packet length reading means 43a). For the input document to be used as the reference page, the packet length data of the read input document is stored (packet length storage unit 43b). Since the amount of displacement of the input document read by the image input device 5 appears in the amount of change in the code amount, that is, the amount of change in the packet length, it is necessary to determine the difference in the packet length between the current page and the reference page. (Difference detecting means 43 c), it is possible to detect the positional deviation amount of the input document read by the image input device 5.
[0101]
Here, FIG. 15 is an explanatory diagram showing the relationship between the code amount difference and the position shift amount. As shown in FIG. 15, it can be seen that the positional deviation amount of the input document read by the image input device 5 increases as the absolute value of the code amount difference (difference value of packet length) increases. That is, if there is no change or a very small amount of code amount difference (difference value of packet length) between the current page and the reference page, there is no positional deviation between the current page and the reference page or very little. If it is small, it can be considered. Conversely, if the change in the absolute value of the code amount difference (difference value of the packet length) is large, it can be considered that the positional deviation amount between the current page and the reference page is large, or that the types of documents are different. it can.
[0102]
The correction determining unit 45 determines whether to move the page coordinates (positional deviation correction) based on the “positional deviation amount of the input document read by the image input device 5” received from the positional deviation amount detection unit 43. To decide. For example, if the displacement amount is equal to or less than a threshold value specified in advance by the user, the movement of the page coordinates (displacement correction) is not performed. On the other hand, when the displacement exceeds the threshold, the movement of the page coordinates (displacement correction) is performed. That is, when the correction determining unit 45 determines that the positional deviation amount is small and it is not necessary to move the page coordinates (positional deviation correction), the correction determining unit 45 outputs a control signal to that effect to the image input device 5. . If it is determined that the positional deviation amount can be corrected, the correction determining unit 45 determines the “positional deviation amount of the input document read by the image input device 5” for the page coordinate moving unit 46. Output.
[0103]
The page coordinate moving means 46 determines the origin of the page coordinates of the input document in accordance with the “position shift amount of the input document read by the image input device 5” received from the correction determining means 45 based on the image coordinates of the page coordinates of the reference page. It is moved to match the point.
[0104]
The details of the position shift correction processing by the position shift correction device 4b described above will be described in more detail with reference to the flowchart of FIG. 16 showing the flow of the position shift correction processing by the position shift correction device 4b. This misregistration correction processing is executed at the time of pre-scanning before the reading (main scan) of the entire area of the document by the image input device 5 is performed. In this pre-scan, as shown in FIG. 17, instead of reading the entire area of the document, four areas formed at four corners and located at four corners defined on the read coordinates are formed. The image is read as an area for detecting a displacement, and compression-encoded by the image compression device 4a. When the code string is in the JPEG2000 format, a tile, a precinct, or a code block can be used as a rectangular area.
[0105]
As shown in FIG. 16, in the position shift correction processing, first, one document read by the image input device 5 is set as a reference page, and a compression code of each area for position shift detection of the reference page is obtained (step (Y in S1), the code amount of each area is calculated and stored (step S2). By the above processing, the code amount of each area for detecting the displacement of the reference page is stored and held.
[0106]
In such a state, another document read by the image input device 5 is set as the current page, and the compression code of each area for detecting the displacement of the current page is obtained (Y in step S4). The code amount is calculated (step S5).
[0107]
In the following step S5, the code amount of each area of the current page is compared with the code amount of each area of the reference page to calculate the amount of displacement.
[0108]
Here, FIG. 18 is an example showing “a positional shift amount of the input document read by the image input device 5” between the reference page and the current page. In the example shown in FIG. 18, comparing the area for detecting the displacement of the reference page with the area for detecting the displacement of the current page, it can be seen that the page coordinates are slightly shifted. As described above, since such a shift amount appears in the change amount of the code amount, that is, the change amount of the packet length, it is necessary to calculate the difference in the packet length between the current page area and the reference page area. Can be detected.
[0109]
When the displacement amount is calculated in step S5, the calculated displacement amount is compared with a predetermined upper limit value (step S6). This upper limit is set so that, for example, it is possible to recognize that the document has run out of the reading range. If the displacement exceeds the upper limit (N in step S6), a control signal for instructing the image input device 5 to re-read the document is output, and each area for detecting the displacement of the current page is output. (Step S3).
[0110]
On the other hand, if the displacement does not exceed the upper limit (Y in step S6), the threshold value designated by the user and the displacement are compared (step S7).
[0111]
If the displacement amount exceeds the threshold value (N in step S7), the process proceeds to step S8, in which the page coordinates are moved (displacement correction). The movement of the page coordinates is performed by shifting the pixel value (given for each read coordinate) of the current page read by the image input device 5 by the amount of positional deviation.
[0112]
Then, when the compression code of each area for detecting the displacement of the current page after the movement of the page coordinates is obtained (Y in step S4), the code amount of each area is calculated (step S5), and the displacement amount becomes a threshold. Until the following (Y in step S7), the movement of the page coordinates in step S8, that is, the displacement correction is repeated. FIG. 19 shows the current page before the positional deviation correction and after the completion of the positional deviation correction. In the example shown in FIG. 19, the displacement of the current page is only in the horizontal and vertical directions. The misregistration correction device 4b according to the present embodiment can cope with a case where a document to be read is inclined with respect to the read coordinates. It goes without saying that the relationship between the displacement amount and the displacement direction needs to be determined in advance in detail.
[0113]
FIG. 20 shows the relationship between the amount of displacement and the code amount difference before and after the completion of the displacement correction. As shown in FIG. 20, in order to more efficiently obtain the displacement amount, the first displacement amount detection processing is performed only on the low frequency sub-band, and the sub-bands are sequentially moved to the high frequency band. The method is effective.
[0114]
If the amount of displacement is equal to or smaller than the threshold value specified in advance by the user (Y in step S7), the image input device 5 is caused to execute the main scan process of the original (the process of reading the entire area of the current page). Is transmitted (step S9), and the pre-scan process ends.
[0115]
Here, the current page with respect to the reference page detected based on the analysis result of the syntax of the code string data created by frequency-converting the pixel value of each of the predetermined areas of the still image data for each rectangular area and hierarchically compressing and encoding them Is moved so that the image reference point of the page coordinates of the current page coincides with the image reference point of the page coordinates of the reference page. This makes it possible to correct the displacement of the image reference point of the current page with respect to the reference page without going through complicated processing of decoding and dequantizing the code string data.
[0116]
In the present embodiment, the case where the original image is subjected to the tile division processing has been described, but the present invention is not limited to this. Even when the tile division is not performed on the original image, if the precinct or the code block is used as a rectangular area, the positional deviation amount of the image reference point of the current page with respect to the reference page can be calculated as in the case of performing the tile division. It is possible to detect.
[0117]
【The invention's effect】
According to the misalignment correction apparatus of the present invention, a predetermined area of the still image data is divided into one or a plurality of rectangular areas, and a pixel value is frequency-converted for each of the rectangular areas and hierarchically compression-encoded. Parsing means for analyzing the syntax of the code string data created by the method, and a displacement amount for detecting a displacement amount of the image reference point of the current page with respect to the reference page to be compared based on the analysis result of the syntax analyzing means Detecting means and page coordinate movement for moving the image reference point of the page coordinates of the current page so as to match the image reference point of the page coordinates of the reference page in accordance with the amount of displacement detected by the displacement amount detecting means. Means for analyzing the syntax of code string data created by frequency-converting pixel values of a predetermined area of the still image data for each rectangular area and compressively coding them hierarchically. By moving the image reference point of the page coordinates of the current page so as to match the image reference point of the page coordinates of the reference page in accordance with the amount of displacement of the image reference point of the current page with respect to the reference page detected based on It is possible to correct the displacement of the image reference point of the current page with respect to the reference page without going through complicated processing of decoding and dequantizing the code string data.
[0118]
According to a second aspect of the present invention, in the position shift correcting apparatus according to the first aspect, there is provided condition specifying means for specifying syntax analysis conditions in the syntax analysis means. By arbitrarily specifying the number of (color components), sub-bands, and the like, it is possible to optimize the accuracy of the displacement amount and the detection processing speed according to the user's desire.
[0119]
According to a third aspect of the present invention, in the position shift correcting device according to the first or second aspect, the position shift amount detecting unit is configured to determine a packet of a packet constituting code string data based on an analysis result of the syntax analyzing unit. Packet length reading means for reading the length, packet length storage means for storing the one packet length read by the packet length reading means as the packet length of the reference page to be compared, and packet length reading means Difference detecting means for detecting a difference value between the read packet length of the current page and the packet length of the reference page as a positional deviation amount of an image reference point with respect to the reference page of the current page, The amount of misalignment of the image reference point of the current page is calculated based on the frequency between the current page and the reference page for a predetermined area of the still image data. By detecting by comparing the packet length, which is the code amount of the conversion coefficient value, upon detecting the amount of displacement of the image reference point of the current page with respect to the reference page, the encoded frequency conversion coefficient value is decoded, and Since the complicated process of inverse quantization becomes unnecessary, the amount of displacement of the image reference point of the current page with respect to the reference page can be quickly and accurately obtained.
[0120]
According to the fourth aspect of the present invention, in the position shift correcting apparatus according to any one of the first to third aspects, the rectangular area as a division unit is a tile, and thus a discrete wavelet transform is used as a frequency transform. Can be.
[0121]
According to the fifth aspect of the present invention, in the position shift correcting apparatus according to any one of the first to third aspects, the rectangular area as a division unit is precinct, and is not divided into tiles (all image areas). = Tile), it is possible to speed up the detection of the displacement of the image reference point of the current page with respect to the reference page in the same manner as in the tile unit, and to set the detection unit to an image area smaller than the tile. Can be.
[0122]
According to a sixth aspect of the present invention, in the position shift correcting apparatus according to any one of the first to third aspects, when the rectangular area as a division unit is a code block, the rectangular area is not divided into tiles. Similarly to the tile unit, it is possible to speed up the detection of the displacement amount of the image reference point of the current page with respect to the reference page, and to set the detection unit to an image area smaller than the tile. can do.
[0123]
According to a seventh aspect of the present invention, in the position shift correcting apparatus according to any one of the first to sixth aspects, when the shift amount of the image reference point of the current page with respect to the reference page exceeds a predetermined value, By not performing the position shift correction by the movement of the page coordinates by the page coordinate movement means, for example, by setting a predetermined value to a value that can be recognized that the original is out of the reading range, the movement of the page coordinates is improved. It is possible to avoid executing the position shift correction even when the position shift correction due to is not possible.
[0124]
According to the image processing apparatus of the present invention, an image compression apparatus divides still image data into one or a plurality of rectangular areas, frequency-converts pixel values for each of the rectangular areas, and hierarchically compresses and codes the image data. 8. The image compression apparatus according to claim 1, wherein a displacement of an image reference point of a current page with respect to a reference page is corrected based on code string data of a predetermined area of the still image data compression-encoded by the image compression apparatus. With the provision of the misalignment correction device, it is possible to provide an image processing device having the same operation and effect as the invention according to any one of claims 1 to 7 when compressing an image.
[0125]
According to a ninth aspect of the present invention, there is provided a program which is installed on a computer or interpreted and executed, wherein the predetermined area of the still image data is divided into one or a plurality of rectangular areas. Then, based on the analysis result of the syntax analysis function, a syntax analysis function for analyzing the syntax of the code string data created by frequency-converting and hierarchically compressing and encoding the pixel value for each rectangular area, A position shift amount detecting function for detecting a position shift amount of an image reference point of the current page with respect to a reference page, and an image reference point of a page coordinate of the current page according to the position shift amount detected by the position shift amount detection function. And a page coordinate moving function for moving the still image data so as to match the image reference point of the page coordinates of the reference page. Is calculated based on the analysis result of the syntax of the code string data created by frequency-converting the pixel value for each rectangular area and hierarchically compressing and encoding the positional deviation amount of the image reference point of the current page with respect to the reference page detected based on the analysis result. Accordingly, by moving the image reference point of the page coordinates of the current page so as to match the image reference point of the page coordinates of the reference page, the reference can be performed without going through a complicated process of decoding and dequantizing the code string data. The displacement of the image reference point of the current page with respect to the page can be corrected.
[0126]
According to the tenth aspect of the present invention, in the program according to the ninth aspect, the computer causes the computer to execute a condition specifying function for specifying a parsing condition in the parsing function. By arbitrarily specifying the number of components (color components), the band of the sub-band, and the like, the accuracy of the amount of displacement and the detection processing speed can be optimized according to the user's desire.
[0127]
According to an eleventh aspect of the present invention, in the program according to the ninth or tenth aspect, the displacement detection function reads a packet length of a packet constituting code string data based on an analysis result of the syntax analysis function. A packet length reading function, a packet length storage function of storing the one packet length read by the packet length reading function as the packet length of a reference page to be compared, and a packet length reading function read by the packet length reading function. Causing the computer to execute a difference detection function of detecting a difference value between the packet length of the current page and the packet length of the reference page as a positional shift amount of an image reference point with respect to the reference page of the current page. Relative to the current page for a predetermined area of the still image data. Detected by comparing the packet length, which is the code amount of the frequency conversion coefficient value with the reference page, to detect the amount of displacement of the image reference point of the current page with respect to the reference page, the encoded frequency conversion coefficient value Since the complicated process of decoding and inverse quantization is unnecessary, the amount of displacement of the image reference point of the current page with respect to the reference page can be quickly and accurately obtained.
[0128]
According to the twelfth aspect of the present invention, in the program according to any one of the ninth to eleventh aspects, since the rectangular area as a division unit is a tile, a discrete wavelet transform can be used as a frequency transform.
[0129]
According to a thirteenth aspect of the present invention, in the program according to any one of the ninth to eleventh aspects, the rectangular area as a division unit is a precinct, so that tile division is not performed (all image area = tile). In addition, similarly to the tile unit, it is possible to speed up the detection of the displacement amount of the image reference point of the current page with respect to the reference page, and it is possible to set the detection unit to an image area smaller than the tile.
[0130]
According to a fourteenth aspect of the present invention, in the program according to any one of the ninth to eleventh aspects, the rectangular area, which is a unit of division, is a code block, and is not tile-divided (all image areas = Similarly to the tile unit, it is possible to speed up the detection of the displacement amount of the image reference point of the current page with respect to the reference page, and to set the detection unit to an image area smaller than the tile. it can.
[0131]
According to a fifteenth aspect of the present invention, in the program according to any one of the ninth to fourteenth aspects, when the positional shift amount of the image reference point of the current page with respect to the reference page exceeds a predetermined value, the page coordinates are set. By not allowing the computer to execute the position shift correction by moving the page coordinates by the movement function, for example, by setting a predetermined value to a value that indicates that the original is out of the reading range, the movement of the page coordinates can be improved. It is possible to avoid executing the position shift correction even when the position shift correction due to is not possible.
[0132]
According to the storage medium of the present invention, since the program according to any one of claims 9 to 15 is stored, the program stored in the storage medium can be read by a computer. The same function and effect as the invention described in any one of Items 9 to 15 can be obtained.
[0133]
According to the misalignment correction method of the present invention, a predetermined area of the still image data is divided into one or a plurality of rectangular areas, and a pixel value is frequency-converted for each of the rectangular areas and hierarchically compression-encoded. A parsing step of parsing the syntax of the code string data created by the method, and a displacement amount for detecting a displacement amount of the image reference point of the current page with respect to a reference page to be compared based on the analysis result of the parsing step. A detection step, and a page coordinate movement for moving the image reference point of the page coordinate of the current page so as to match the image reference point of the page coordinate of the reference page in accordance with the displacement detected in the displacement detection step. And analyzing the syntax of code string data created by frequency-converting pixel values of each predetermined area of the still image data for each rectangular area and hierarchically compressing and encoding them. Moving the image reference point of the page coordinates of the current page to match the image reference point of the page coordinates of the reference page in accordance with the amount of displacement of the image reference point of the current page with respect to the reference page detected based on the result. Accordingly, it is possible to correct the displacement of the image reference point of the current page with respect to the reference page without going through complicated processing of decoding and dequantizing the code string data.
[0134]
According to the eighteenth aspect of the present invention, in the position shift correcting method according to the seventeenth aspect, a condition specifying step of specifying a parsing condition in the parsing step is included. By arbitrarily specifying the number of (color components), sub-bands, and the like, it is possible to optimize the accuracy of the displacement amount and the detection processing speed according to the user's desire.
[0135]
According to a nineteenth aspect of the present invention, in the position shift correction method according to the seventeenth or the eighteenth aspect, the position shift amount detecting step is a packet of a packet constituting code string data based on an analysis result of the syntax analysis step. A packet length reading step of reading a length, a packet length storing step of storing the one packet length read in the packet length reading step as the packet length of a reference page to be compared, and a packet length reading step. Detecting a difference value between the read packet length of the current page and the packet length of the reference page as a positional shift amount of an image reference point with respect to the reference page of the current page. The amount of displacement of the image reference point of the current page is determined by comparing the current page and the reference page for a predetermined area of the still image data. By detecting by comparing the packet length, which is the code amount of the wave number conversion coefficient value, upon detecting the positional shift amount of the image reference point of the current page with respect to the reference page, decode the encoded frequency conversion coefficient value, Further, since a complicated process of inverse quantization is not required, the positional shift amount of the image reference point of the current page with respect to the reference page can be obtained quickly and accurately.
[0136]
According to a twentieth aspect of the present invention, in the positional deviation correction method according to any one of the seventeenth to nineteenth aspects, the rectangular area as a division unit is a tile, so that a discrete wavelet transform is used as a frequency transform. Can be.
[0137]
According to the twenty-first aspect of the present invention, in the position shift correction method according to any one of the seventeenth to nineteenth aspects, the rectangular area, which is a unit of division, is not divided into tiles due to being a precinct (all image areas). = Tile), it is possible to speed up the detection of the displacement of the image reference point of the current page with respect to the reference page in the same manner as in the tile unit, and to set the detection unit to an image area smaller than the tile. Can be.
[0138]
According to a twenty-second aspect of the present invention, in the position shift correction method according to any one of the seventeenth to nineteenth aspects, when the rectangular area that is a division unit is a code block, tile division is not performed. Similarly to the tile unit, it is possible to speed up the detection of the displacement amount of the image reference point of the current page with respect to the reference page, and to set the detection unit to an image area smaller than the tile. can do.
[0139]
According to a twenty-third aspect of the present invention, in the misalignment correction method according to any one of the seventeenth to twenty-second aspects, when the misalignment amount of the image reference point of the current page with respect to the reference page exceeds a predetermined value, By not performing the position shift correction by the movement of the page coordinates in the page coordinate movement step, for example, by setting a predetermined value to a value at which the document is found to be out of the reading range, the movement of the page coordinates is improved. It is possible to avoid executing the position shift correction until the position shift correction due to is impossible.
[Brief description of the drawings]
FIG. 1 is a functional block diagram of a system for realizing a hierarchical coding algorithm which is a basis of the JPEG2000 system on which the present invention is based.
FIG. 2 is an explanatory diagram showing a divided rectangular area of each component of an original image.
FIG. 3 is an explanatory diagram showing subbands at each decomposition level when the number of decomposition levels is three.
FIG. 4 is an explanatory diagram showing a precinct.
FIG. 5 is an explanatory diagram showing an example of a procedure for ranking bit planes.
FIG. 6 is an explanatory diagram showing a schematic configuration of one frame of code string data.
FIG. 7 is an explanatory diagram showing a code stream structure in which packets containing encoded wavelet coefficient values are represented for each subband.
FIG. 8 is a schematic diagram showing a system construction example according to an embodiment of the present invention.
FIG. 9 is a module configuration diagram of a client computer as an image processing apparatus.
FIG. 10 is a functional block diagram illustrating a configuration of an image processing apparatus.
FIG. 11 is an explanatory diagram showing a positional relationship between “read coordinates” provided on the image input device and “page coordinates” provided on an input document.
FIG. 12 is a functional block diagram illustrating a configuration of a position shift correction device.
FIG. 13 is an explanatory diagram showing reading of header section information by the syntax analysis means.
FIG. 14 is a block diagram showing a configuration of a displacement amount detecting means.
FIG. 15 is an explanatory diagram showing a relationship between a code amount difference and a position shift amount.
FIG. 16 is a flowchart illustrating a flow of a position shift correction process performed by the position shift correction device.
FIG. 17 is an explanatory diagram showing each area for detecting a position shift.
FIG. 18 is an explanatory diagram illustrating an example of “a positional shift amount of an input document read by an image input device” between a reference page and a current page.
FIG. 19 is an explanatory diagram showing a current page before position shift correction and after position shift correction is completed.
FIG. 20 is an explanatory diagram showing a relationship between a displacement amount and a code amount difference before and after completion of the displacement correction.
FIG. 21 is an explanatory diagram illustrating a positional relationship between “read coordinates” provided on the image input device and “page coordinates” provided on an input document.
[Explanation of symbols]
4 Image processing device
4a Image compression device
4b Position shift correction device
15 Storage media
42 Syntax analysis means
43 Position shift detecting means
44 Condition specifying means
46 Page coordinate movement means
43a Packet length reading means
43b Packet length storage means
43c Difference detection means

Claims (23)

静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析手段と、
この構文解析手段の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出手段と、
この位置ずれ量検出手段により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動手段と、
を備える位置ずれ補正装置。
Syntactic analysis means for analyzing a syntax of code string data created by dividing a predetermined area of the still image data into one or a plurality of rectangular areas, frequency-converting pixel values for each of the rectangular areas, and hierarchically compressively encoding the pixel values; ,
A displacement amount detecting means for detecting a displacement amount of an image reference point of a current page with respect to a reference page to be compared, based on an analysis result of the syntax analyzing means;
Page coordinate moving means for moving the image reference point of the page coordinates of the current page so as to match the image reference point of the page coordinates of the reference page, in accordance with the position shift amount detected by the position shift amount detecting means,
Misalignment correction device comprising:
前記構文解析手段における構文解析条件を指定する条件指定手段を備える請求項1記載の位置ずれ補正装置。2. The apparatus according to claim 1, further comprising condition specifying means for specifying a syntax analysis condition in said syntax analysis means. 前記位置ずれ量検出手段は、
前記構文解析手段の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取手段と、
このパケット長読取手段により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶手段と、
前記パケット長読取手段により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出手段と、
を備える請求項1または2記載の位置ずれ補正装置。
The displacement amount detecting means includes:
Packet length reading means for reading a packet length of a packet constituting code string data based on an analysis result of the syntax analysis means;
Packet length storage means for storing the one packet length read by the packet length reading means as the packet length of a reference page to be compared;
Difference detecting means for detecting a difference value between the packet length of the current page read by the packet length reading means and the packet length of the reference page as a positional shift amount of an image reference point with respect to the reference page of the current page;
The position shift correction device according to claim 1 or 2, further comprising:
分割単位である矩形領域は、タイルである請求項1ないし3のいずれか一記載の位置ずれ補正装置。4. The apparatus according to claim 1, wherein the rectangular area serving as a division unit is a tile. 分割単位である矩形領域は、プレシンクトである請求項1ないし3のいずれか一記載の位置ずれ補正装置。4. The apparatus according to claim 1, wherein the rectangular area as a division unit is a precinct. 分割単位である矩形領域は、コード・ブロックである請求項1ないし3のいずれか一記載の位置ずれ補正装置。4. The apparatus according to claim 1, wherein the rectangular area as a division unit is a code block. 参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動手段によるページ座標の移動による位置ずれ補正を行わない請求項1ないし6のいずれか一記載の位置ずれ補正装置。7. The image forming apparatus according to claim 1, wherein when the displacement of the image reference point of the current page with respect to the reference page exceeds a predetermined value, the displacement of the page coordinates by the page coordinate moving means is not corrected. Misalignment correction device. 静止画像データについて1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化する画像圧縮装置と、
この画像圧縮装置により圧縮符号化された静止画像データの所定領域についての符号列データに基づき、参照ページに対する現ページの画像基準点の位置ずれを補正する請求項1ないし7のいずれか一記載の位置ずれ補正装置と、
を備える画像処理装置。
An image compression apparatus that divides still image data into one or a plurality of rectangular regions, frequency-converts pixel values for each of the rectangular regions, and hierarchically compresses and codes the image data;
8. The image compression apparatus according to claim 1, wherein a displacement of an image reference point of a current page with respect to a reference page is corrected based on code string data of a predetermined area of the still image data compression-encoded by the image compression apparatus. A displacement correction device;
An image processing apparatus comprising:
コンピュータにインストールされるか、あるいは解釈されて実行されるプログラムであって、前記コンピュータに、
静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析機能と、
この構文解析機能の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出機能と、
この位置ずれ量検出機能により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動機能と、
を実行させるコンピュータに読取り可能なプログラム。
A program installed or interpreted and executed on a computer, wherein the computer has
A syntax analysis function for analyzing the syntax of code string data created by dividing a predetermined area of the still image data into one or a plurality of rectangular areas, frequency-converting pixel values for each of the rectangular areas, and hierarchically compressively encoding the pixel values; ,
A displacement detection function for detecting a displacement of an image reference point of the current page with respect to a reference page to be compared based on an analysis result of the syntax analysis function;
A page coordinate movement function for moving the image reference point of the page coordinate of the current page so as to match the image reference point of the page coordinate of the reference page in accordance with the amount of displacement detected by the displacement amount detection function;
A computer-readable program that causes a computer to execute.
前記構文解析機能における構文解析条件を指定する条件指定機能を前記コンピュータに実行させる請求項9記載のプログラム。The program according to claim 9, wherein the program causes the computer to execute a condition specifying function for specifying a syntax analysis condition in the syntax analysis function. 前記位置ずれ量検出機能は、
前記構文解析機能の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取機能と、
このパケット長読取機能により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶機能と、
前記パケット長読取機能により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出機能と、
を前記コンピュータに実行させる請求項9または10記載のプログラム。
The position shift amount detection function includes:
A packet length reading function for reading a packet length of a packet constituting code string data based on an analysis result of the syntax analysis function;
A packet length storage function of storing the one packet length read by the packet length reading function as the packet length of the reference page to be compared;
A difference detection function of detecting a difference value between the packet length of the current page read by the packet length reading function and the packet length of the reference page as a positional shift amount of an image reference point with respect to the reference page of the current page,
The program according to claim 9, wherein the program is executed by the computer.
分割単位である矩形領域は、タイルである請求項9ないし11のいずれか一記載のプログラム。The program according to any one of claims 9 to 11, wherein the rectangular area as a division unit is a tile. 分割単位である矩形領域は、プレシンクトである請求項9ないし11のいずれか一記載のプログラム。The program according to any one of claims 9 to 11, wherein the rectangular area as a division unit is a precinct. 分割単位である矩形領域は、コード・ブロックである請求項9ないし11のいずれか一記載のプログラム。The program according to any one of claims 9 to 11, wherein the rectangular area as a division unit is a code block. 参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動機能によるページ座標の移動による位置ずれ補正を前記コンピュータに実行させない請求項9ないし14のいずれか一記載のプログラム。15. The computer according to claim 9, wherein the computer does not execute the correction of the positional deviation by moving the page coordinates by the page coordinate moving function when the positional deviation amount of the image reference point of the current page with respect to the reference page exceeds a predetermined value. The program according to (1). 請求項9ないし15のいずれか一記載のプログラムを記憶している記憶媒体。A storage medium storing the program according to claim 9. 静止画像データの所定領域について1又は複数の矩形領域に分割し当該矩形領域毎に画素値を周波数変換し階層的に圧縮符号化することにより作成した符号列データの構文を解析する構文解析工程と、
この構文解析工程の解析結果に基づき、比較の対象となる参照ページに対する現ページの画像基準点の位置ずれ量を検出する位置ずれ量検出工程と、
この位置ずれ量検出工程により検出された位置ずれ量に応じて、現ページのページ座標の画像基準点を参照ページのページ座標の画像基準点に一致するように移動させるページ座標移動工程と、
を含む位置ずれ補正方法。
A syntax analysis step of analyzing a syntax of code string data created by dividing a predetermined area of the still image data into one or a plurality of rectangular areas, frequency-converting pixel values for each of the rectangular areas, and hierarchically compressively encoding the pixel values; ,
A displacement detection step of detecting a displacement of an image reference point of the current page with respect to a reference page to be compared based on an analysis result of the syntax analysis step;
A page coordinate moving step of moving the image reference point of the page coordinates of the current page so as to match the image reference point of the page coordinates of the reference page in accordance with the position shift amount detected in the position shift amount detection step;
Misalignment correction method including:
前記構文解析工程における構文解析条件を指定する条件指定工程を含む請求項17記載の位置ずれ補正方法。The method according to claim 17, further comprising a condition specifying step of specifying a parsing condition in the parsing step. 前記位置ずれ量検出工程は、
前記構文解析工程の解析結果に基づき、符号列データを構成するパケットのパケット長を読み取るパケット長読取工程と、
このパケット長読取工程により読み取られた一の前記パケット長を比較の対象となる参照ページの前記パケット長として記憶するパケット長記憶工程と、
前記パケット長読取工程により読み取られた現ページの前記パケット長と前記参照ページの前記パケット長との差分値を、現ページの参照ページに対する画像基準点の位置ずれ量として検出する差分検出工程と、
を含む請求項17または18記載の位置ずれ補正方法。
The displacement amount detecting step includes:
A packet length reading step of reading a packet length of a packet constituting code string data based on an analysis result of the syntax analysis step;
A packet length storing step of storing the one packet length read in the packet length reading step as the packet length of a reference page to be compared;
A difference detection step of detecting a difference value between the packet length of the current page read by the packet length reading step and the packet length of the reference page as a positional shift amount of an image reference point with respect to a reference page of the current page,
19. The method according to claim 17, further comprising:
分割単位である矩形領域は、タイルである請求項17ないし19のいずれか一記載の位置ずれ補正方法。20. The method according to claim 17, wherein the rectangular area as a division unit is a tile. 分割単位である矩形領域は、プレシンクトである請求項17ないし19のいずれか一記載の位置ずれ補正方法。20. The method according to claim 17, wherein the rectangular area serving as a division unit is a precinct. 分割単位である矩形領域は、コード・ブロックである請求項17ないし19のいずれか一記載の位置ずれ補正方法。20. The method according to claim 17, wherein the rectangular area serving as a division unit is a code block. 参照ページに対する現ページの画像基準点の位置ずれ量が所定値を超えた場合には、前記ページ座標移動工程によるページ座標の移動による位置ずれ補正を行わない請求項17ないし22のいずれか一記載の位置ずれ補正方法。23. The image forming apparatus according to claim 17, wherein when the positional shift amount of the image reference point of the current page with respect to the reference page exceeds a predetermined value, the positional shift is not corrected by moving the page coordinates in the page coordinate moving step. Correction method of position shift.
JP2003025140A 2003-01-31 2003-01-31 Misalignment correction apparatus, image processing apparatus, program, storage medium, and misalignment correction method Expired - Fee Related JP4280508B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003025140A JP4280508B2 (en) 2003-01-31 2003-01-31 Misalignment correction apparatus, image processing apparatus, program, storage medium, and misalignment correction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003025140A JP4280508B2 (en) 2003-01-31 2003-01-31 Misalignment correction apparatus, image processing apparatus, program, storage medium, and misalignment correction method

Publications (2)

Publication Number Publication Date
JP2004234565A true JP2004234565A (en) 2004-08-19
JP4280508B2 JP4280508B2 (en) 2009-06-17

Family

ID=32953496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003025140A Expired - Fee Related JP4280508B2 (en) 2003-01-31 2003-01-31 Misalignment correction apparatus, image processing apparatus, program, storage medium, and misalignment correction method

Country Status (1)

Country Link
JP (1) JP4280508B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011255060A (en) * 2010-06-11 2011-12-22 Fujifilm Corp Method, apparatus, and program for aligning images
CN107331029A (en) * 2017-06-23 2017-11-07 深圳怡化电脑股份有限公司 Bank note dislocation detection method, device, equipment and storage medium

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011255060A (en) * 2010-06-11 2011-12-22 Fujifilm Corp Method, apparatus, and program for aligning images
CN107331029A (en) * 2017-06-23 2017-11-07 深圳怡化电脑股份有限公司 Bank note dislocation detection method, device, equipment and storage medium
CN107331029B (en) * 2017-06-23 2019-09-20 深圳怡化电脑股份有限公司 Bank note dislocation detection method, device, equipment and storage medium

Also Published As

Publication number Publication date
JP4280508B2 (en) 2009-06-17

Similar Documents

Publication Publication Date Title
JP4064196B2 (en) Client computer, server computer, program, storage medium, image data processing system, and image data processing method
US7352908B2 (en) Image compression device, image decompression device, image compression/decompression device, program for executing on a computer to perform functions of such devices, and recording medium storing such a program
JP4093405B2 (en) Image processing apparatus, program, and storage medium
JP2004194146A (en) Displaying method of thumbnail image, server computer, client computer, and program
JP2004194152A (en) Image processing apparatus, program, storage medium, and image editing method
JP2004221836A (en) Image processor, program, storage medium, and code expanding method
US7627185B2 (en) Hierarchically compressing and coding and storing image data
US7430327B2 (en) Image processing apparatus, image processing program, and storage medium
US7526133B2 (en) Image processing apparatus, image processing program, and storage medium
JP2004242290A (en) Image processing apparatus and image processing method, image edit processing system, image processing program, and storage medium
JP3952459B2 (en) Image processing apparatus, program, storage medium, and image processing method
JP2004214828A (en) Image processing apparatus, image processing method, computer program for image processing, and storage medium for storing the image processing computer program
JP4723543B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP4280508B2 (en) Misalignment correction apparatus, image processing apparatus, program, storage medium, and misalignment correction method
JP4489474B2 (en) Image processing apparatus, program, and recording medium
JP4323178B2 (en) Search object restriction device, image processing apparatus, program, storage medium, and search object restriction method
JP4014085B2 (en) Image processing apparatus, program, and storage medium
JP4052952B2 (en) Image processing apparatus, image processing method, program, and storage medium
JP2002369202A (en) Image compression device, image expansion device, image compressing method, image expanding method, program and recording medium stored with the program
JP3961966B2 (en) Unnecessary part removing apparatus, image processing apparatus, program, storage medium, and unnecessary part removing method
JP4124436B2 (en) Motion estimation device, program, storage medium, and motion estimation method
JP2004056260A (en) Image decoder, image processor, program, recording medium and image decoding method
JP2003339047A (en) Image compression device, image decompression device, image compression/decompression device, image compression method, image decompression method, program, and recording medium recording the program
JP4093870B2 (en) Image processing apparatus, program, and storage medium
JP4010957B2 (en) Image processing apparatus, program, storage medium, and image forming apparatus

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041008

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051116

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090217

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090316

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120319

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140319

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees