JP4138459B2 - 低解像度画像作製方法及び装置 - Google Patents

低解像度画像作製方法及び装置 Download PDF

Info

Publication number
JP4138459B2
JP4138459B2 JP2002336773A JP2002336773A JP4138459B2 JP 4138459 B2 JP4138459 B2 JP 4138459B2 JP 2002336773 A JP2002336773 A JP 2002336773A JP 2002336773 A JP2002336773 A JP 2002336773A JP 4138459 B2 JP4138459 B2 JP 4138459B2
Authority
JP
Japan
Prior art keywords
image
image data
wavelet
resolution image
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002336773A
Other languages
English (en)
Other versions
JP2003242497A (ja
Inventor
バークナー キャサリン
ニーラマニ ラメシュ
ウォルフ グレッグ
ピー ボーリック マーティン
イー ハート ピーター
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of JP2003242497A publication Critical patent/JP2003242497A/ja
Application granted granted Critical
Publication of JP4138459B2 publication Critical patent/JP4138459B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/36Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
    • G09G5/37Details of the operation on graphic patterns
    • G09G5/373Details of the operation on graphic patterns for modifying the size of the graphic pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4084Scaling of whole images or parts thereof, e.g. expanding or contracting in the transform domain, e.g. fast Fourier transform [FFT] domain scaling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/393Enlarging or reducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • G09G2340/0407Resolution change, inclusive of the use of different resolutions for different screen areas
    • G09G2340/0414Vertical resolution change
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/04Changes in size, position or resolution of an image
    • G09G2340/0407Resolution change, inclusive of the use of different resolutions for different screen areas
    • G09G2340/0421Horizontal resolution change
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/14Solving problems related to the presentation of information to be displayed
    • G09G2340/145Solving problems related to the presentation of information to be displayed related to small screens

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Digital Computer Display Output (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理の分野に係り、特に、画像の小さい表現である低解像度画像を作製する方法及び装置に関する。
【0002】
本願発明は、本願の優先権主張日と同日の2002年1月10日に出願され、本願と同一出願人に譲渡された米国特許出願第02−044420号に関連している。
【0003】
【従来の技術】
サムネイルは、殆どのマルチメディア・アプリケーション及び文書アプリケーションに対して非常に望ましいグラフィカル・ユーザ・インタフェース構成要素である。サムネイルは、完全な画像を表すためサイズ変更された小型の画像であり、一部のアプリケーションでは、サムネイルをクリックすることによって完全な画像が表示される。サイズ変更は、典型的に、従来の平滑化と、引き続くダウンサンプリングとによって行われる。ウェブページ上の一覧表のような殆どの従来のアプリケーションでは、サムネイルのサイズは固定されている。このようなサムネイル表示における共通の問題は、屡々、観察者は画像情報を認識できず、画像情報が希望通りに役に立たない、ということである。
【0004】
最近のマルチメディア通信ツールは、夫々のキャンバスに様々なソースの画像を自由形式で構成することができる。この場合、サムネイルのサイズは変化しても構わない。このようなアプリケーションでは、固定サイズのサムネイルへの表示の仕方の問題の他に、所与の画像に対する適切なサムネイルサイズ若しくは形状を構成する付加的な問題が生じる。例えば、訪問者のキオスクから撮影されるような人物の写真を表現する場合、写真の顔部分のダウンサンプル画像はサムネイルとして十分であるが、ウェブ文書の場合、タイトルは完全解像度で表示するようが役に立つ。
【0005】
非特許文献1には、モニター若しくは携帯電話のような特定の装置へ画像をトランスコーディングする方法が記載されている。非特許文献2に記載されたアプローチは、画像の明確に選択されたパーツだけが特定の解像度で送信されるように拡張される。この明確化は送信者によって行われるものであり、自動的には行われない。
【0006】
サムネイルを作製する幾つかのソフトウェアパッケージが存在する。これらのソフトウェアパッケージは速度を重点的に取り扱うが、何れのソフトウェアパッケージも、従来のダウンサンプリングを用いて、画像全体のサイズを、ユーザ定義サイズ、若しくは、アプリケーション定義サイズにサイズ変換する。このため、画像は、屡々、観察者によって認識できなくなる。
【0007】
非特許文献3では、強調サムネイルが文書のより優れた表現を与えるため導入される。強調は、従来通りに作製されたサムネイルのコントラストを低下させ、光学式文字認識(OCR)システムを用いて検出されるより大きいフォントにキーワードを重ね合わせることによって行われる。この結果として、改良度は制限され、テキストを含む画像だけに適用可能である。
【0008】
ダウンサンプリング前の画像のフィルタリング(コントラスト強調、エッジ強調)は、観察者がサムネイルを認識する能力を高める(非特許文献4を参照。)。そうであるとしても、画像情報は、屡々、観察者に気付かれない。
【0009】
ビデオ要約を作製するため、個別のフレームに特定のサイズ/解像度が与えられたビデオフレームのグループ分けを表示する方法がある(非特許文献5を参照。)。フレームのサイズ変更は、実際の画像内容ではなく、ビデオシーケンスにおけるフレームの重要性を測定することによって決定される。
【0010】
ページレイアウトの領域は多数の論文で議論されている。典型的に、文書の画像内容は、不都合なことに、殆どの場合にある小さい画像若しくはグラフィックスを伴うテキストであると考えられるので、連結したコンポーネントを判定するためのクラスタリング技術を含むテキスト固有の演算を実行する。ページレイアウトの一般的な方法の一つは、非特許文献6に記載されている。
【0011】
従来の一つの画像ファイルフォーマットは、(例えば、ラプラシアン・ピラミッドによって作製される)多数の解像度の画像を保持する。その結果として、この画像ファイルフォーマットは、通常、ウェーブレット符号化画像のファイルよりも大規模になるという点で不利である。この画像ファイルフォーマットは、オプションとして、特定のパラメータをファイルに組み込む。これらのパラメータは、例えば、アスペクト比、対象の矩形、フィルタリング若しくはコントラストの調整に関連する。パラメータは、ファイルの作成者によって設定され、ファイルの受取者はこのパラメータを使用しても使用しなくてもよい。
【0012】
【非特許文献1】
モーハン(Mohan, R)、スミス(Smith, J.R.)及びリー(Li, C. ?S.)著、「ユニバーサルアクセスのためのマルチメディア・インターネット・コンテンツ適合(Adapting Multimedia Internet Content for Universal Access)」、IEEE Trans. Multimedia、第1巻、第1号、1999年、p.104−114
【非特許文献2】
リー(Lee, K.)、チャン(Chang, H.S.)、チョウイ(Choi, H.)及びサル(Sull, S.)著、「ユニバーサルマルチメディアアクセスのための認知に基づく画像トランスコーディング(Perception-based image transcoding for universal multimedia access)」、ICIP 2001、画像処理国際会議予稿集、ギリシャ、2001年
【非特許文献3】
ウッドラフ(Woodruff, A.)、フォールリング(Faulring, A.)、ローゼンホルツ(Rosenholtz, R.)、モリソン(Morrison, J.)及びピローリ(Pirolli, P.)著、「ウェブ検索のためのサムネイルの用法(Using Thumbnails to Search Web)」、SIGCHI’01予稿集、シアトル、2001年4月
【非特許文献4】
バートン(Burton, C.A)、ジョンストン(Johnston, L.J.)及びゾネンベルグ(Sonenberg, E.A.)著、「事例研究:サムネイル画像認識の経験的調査(Case study: an empirical investigation of thumbnail image recognition)」、ビジュアライゼーション・コンファレンス1995(Visualization Conference 1995)予稿集
【非特許文献5】
ウチハシ(Uchihasi, S.)、フート(Foote, J.)、ギルゲンゾーン(Girgensohn, A.)及びボレツキー(Boreczky, J.)著、「ビデオマンガ:意味的に重要なビデオサマリーの作製(Video Manga: Generating Semantically Meaningful Video Summaries)」、第7回ACM国際マルチメディア・コンファレンス(Seventh ACM International Multimedia Conference)予稿集、オーランド、1999年
【非特許文献6】
オー・ゴーマン(O’Gorman, L.)著、「ページレイアウト解析のための文書スペクトラム(The Document Spectrum for Page Layout Analysis)」、IEEE Trans. Image Proc.、第15巻、第11号、1993年、p.1162−1173
【0013】
【発明が解決しようとする課題】
本発明は、画像を受け取り、画像のウェーブレット表現から低解像度画像を作製する方法及び装置を提供する。
【0014】
【課題を解決するための手段】
低解像度画像の表示の形式(例えば、サイズ、形状、マルチスケールコラージュ)は、画像の内容と、低解像度画像を表示するための表示装置の物理特性と、を補償するように選択される。
【0015】
【発明の実施の形態】
本発明は、以下の詳細な記述と、種々の実施例についての添付図面とによって、完全に理解されるであろう。但し、本発明は特定の実施例に限定して理解されるべきではなく、実施例は説明と理解のためだけに用いられる。
【0016】
以下では、特定の表示装置に表示されるときに視覚的に認識できる情報を含む画像表現を計算するため、画像内容、並びに、例えば、非限定的な例として、1インチ当たりのドット数(dpi)解像度、絶対画素解像度、視野角当たりの画素数、利得関数(ガンマ応答)、コントラスト及び輝度のような表示装置の物理特性を考慮して画像の小サイズの表現を自動作製する方法及び装置を説明する。以下で説明する技術は、画像のウェーブレット表現と、画像内容を表すパラメータとを使用する。
【0017】
さらに、ここでの技術は、表示装置の物理特性にリンクされたパラメータを使用する。典型的なインターネットアプリケーションでは、画像は、モニター、メディアボード、デジタルカメラディスプレイ、個人情報端末(PDA)、携帯電話機のような数種類の表示装置に表示される。これらの表示装置は、例えば、1インチ当たりのドット数、画素数、コントラスト、輝度などの物理特性が異なる。
【0018】
以下の記述では、多数の細部について説明される。しかし、本発明は、これらの特定の細部を用いることなく実施されることが当業者に明らかであろう。それ以外の場合に、周知の構造及び装置は、本発明を分かり難くすることを避けるため、詳細ではなく、ブロック図形式で示される。
【0019】
以下の詳細な説明の一部分は、コンピュータメモリ内でのデータビットに対する演算のアルゴリズム及び記号表現の観点で記述されている。これらのアルゴリズム的な記述及び表現は、データ処理技術の当業者が自分の業績の要旨を他の当業者へ最も効率的に伝えるために使用する手段である。ここで説明するアルゴリズムは、一般的なアルゴリズムがそうであるように、所望の結果を導く首尾一貫した手順の系列である。手順(ステップ)は、物理量の物理的操作を必要とする手順である。必然的ではないが通常は、これらの量は、記憶、転送、合成、比較、及び、その他の操作を行うことができる電気信号又は磁気信号の形式をとる。主として、一般的な用法であるとの理由から、これらの信号は、ビット、値、要素、シンボル、文字、項、数などによって指定することが時に好都合であることがわかる。
【0020】
しかし、これらの用語及び類義語は、適切な物理量と関連付けられ、物理量に与えられた便宜的なラベルに過ぎない。特に断らない限り、以下の説明から明らかであるように、「処理」、「コンピューティング」、「計算」、「決定」、或いは、「表示」のような用語を利用する記述は、コンピュータシステム若しくは類似した電子コンピューティング装置の動作及び処理を示すものであり、コンピュータシステムのレジスタ及びメモリ内で物理(電子)量として表現されたデータを操作し、同じように、コンピュータシステムのメモリ若しくはレジスタ、又は、他の情報記憶装置、情報伝送装置、若しくは、情報表示装置内で物理量として表現された他のデータへ変換する。
【0021】
本発明は、以下で説明する動作を実行する装置に関する。この装置は、特に、要求された用途に応じて構成されるか、或いは、選択的に作動され、若しくは、コンピュータに記憶されたコンピュータプログラムを用いて再構成される汎用コンピュータを含む。このようなコンピュータプログラムは、たとえば、フレキシブルディスク、光ディスク、CD−ROM、光磁気ディスクなどを含む任意のタイプのディスクや、読み出し専用メモリ(ROM)や、ランダム・アクセス・メモリ(RAM)や、EPROMや、EEPROMや、磁気若しくは光カードや、電子命令を記憶するため適した任意のタイプの媒体のような、コンピュータシステムバスに接続された、コンピュータ読み取り可能な記憶媒体に記憶されるが、これらの例示的な記憶媒体に制限されるものではない。
【0022】
ここで説明するアルゴリズム及びディスプレイは、本来的に特定のコンピュータ若しくはその他の装置に関連付けられたものではない。種々の汎用システムが、ここで教示された事項に応じたプログラムと共に使用される。或いは、要求された方法の手順を実行するため、より専用化された装置を構成した方が便利な場合もある。多様なこれらのシステムに対し要求される構成は、以下の記載から明らかになる。さらに、本発明は、特定のプログラミング言語に基づいて説明されていない。以下で説明するような本発明の教示事項を実現するために、多様なプログラミング言語を使用できることが認められるであろう。
【0023】
機械読み取り可能な媒体は、機械(たとえば、コンピュータ)によって読み取り可能な形式で情報を記憶若しくは伝送する任意のメカニズムを含む。たとえば、機械読み取り可能な媒体は、読み出し専用メモリ(ROM)と、ランダム・アクセス・メモリ(RAM)と、磁気ディスク記憶媒体と、光記憶媒体と、フラッシュメモリ装置と、電気的、光学的、音響的若しくはその他の形式の伝搬信号(たとえば、搬送波、赤外線信号、デジタル信号など)と、を含む。
【0024】
図1は、表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。この処理は、後述の他の処理と同様に、ハードウェア、ソフトウェア、或いは、両者の組み合わせにより構成された処理ロジックによって実行される。
【0025】
図1を参照するに、処理ロジックは、最初に画像を受け取る(処理ステップ101)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製する(処理ステップ102)。低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される。
【0026】
図2は、表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図2を参照するに、処理ロジックは、最初に画像を受け取る(処理ステップ201)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ202)。図1に対して、図2では、物理特性は、1インチ当たりのドット数(dpi)解像度と、絶対画素解像度と、観察距離と、コントラストと、輝度を含む。
【0027】
〔ダウンサンプリング倍率の表示装置依存レンジの決定〕
ウェーブレット表現は、画像情報を種々の解像度レベル1...Lの情報に分離する。図3は、典型的なウェーブレット分解の説明図である。サイズN×Mの画像301が、例えば、各次元において4倍の倍率でダウンサンプリングされるウェーブレット分解で与えられる場合、ウェーブレット逆変換は、レベル3...Lで実行される。この逆変換の結果は、レベル2のLL成分(すなわち、原画像をダウンサンプリングしたもの)である。ダウンサンプリング後の画像のサイズは、M/(2)×N/(2)である。縮小画像は、ウェーブレット分解のレベル1及び2における高域通過係数に含まれる詳細情報を含まない。
【0028】
表示装置パラメータに基づいて、レベル1とレベルLの間の適当な表示レベルのレンジは、以下のように決定される。一実施例において、画像のサイズが表示装置の画素サイズよりも大きい場合(例えば、画像のサイズが2048×2048であり、モニター解像度のサイズが1024×768である場合)、画像は、モニターディスプレイ上で完全に見えるようにするために、少なくとも2回以上ダウンサンプリングしなければならない。従って、絶対表示解像度は、ダウンサンプリング倍率に下限を与える(すなわち、表示レベルLに関するいわゆるLmin)。
【0029】
図4は、 表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図4を参照するに、処理ロジックは画像を受け取る(処理ステップ401)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ402)。図4に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像を何回(何倍)もダウンサンプリングする(処理ステップ403)。ダウンサンプリングの回数(倍率)は、低解像度画像が表示装置で完全に見えるようにするため十分に大きい。例えば、画像が2048×2046画素であり、モニターの表示解像度が1024×768画素であり、ダウンサンプリングが1回行われたとき、画像は、モニターの表示エリアに収まらないが、ダウンサンプリングが2回行われると、画像はモニターの表示エリアに収まる。
【0030】
表示装置上の画像の可視性に影響を与える別の要因は、1インチ当たりのドット数(dpi)で表される相対表示解像度である。例えば、モニターの相対解像度が75dpiであり、プリンタの解像度が600dpiであり、大型ディスプレイのステイ解像度は25dpiである。別のテストでは他の結果も得られる(例えば、テキスト認識)。主観的なテストから判定されるように、視覚的に認識可能な対象若しくは構造の最小サイズは、直径が約2mmである。このサイズは、所与のdpi解像度に対するドットサイズに変換される。75dpiモニターの場合、このサイズは47ドットになる。一実施例において、最小可視対象直径Dminは、ドット数単位で、
Dmin=(最小対象直径mm単位)*(dpi解像度)/25.4
によって表される。
【0031】
コントラストや輝度のような表示装置の物理特性に基づいて、Dminの選定は少し変化する。一実施例において、この変化は、式中、定数Cdeviceとして表現され、特定の表示装置のため調整される。一実施例において、コントラスト又は輝度が小さい場合、この定数Cdeviceは大きい。
Dmin=Cdevice*(最小可視対象直径mm単位)*(dpi解像度)/25.4 (0)
minは、観察距離及び視野角にも依存する。一実施例において、dpi解像度と観察距離の間の比は一定である。
【0032】
小スケール構造は、高解像度スケールと関連した多数の分解レベルに亘る分解レベルにウェーブレット係数として現れる。一実施例において、n回のダウンサンプリング後に視覚的に認識できるようにするため、小スケール構造のドットサイズDは、n回のダウンサンプリング後のDminよりも大きい。したがって、不等式:
D/2n>Dmin
が有効である。その結果として、レベルn...Lで非零であるウェーブレット係数に対応する構造だけが、選択された表示装置で視覚的に認識できるものとして適格である。このように、レベル1...n−1は、逆変換中に全く考慮されないので、視覚的に認識可能な情報を与えない。以下のレベル:
Lmax(D)=log2(D/Dmin)=log2(D)-log2(Dmin) (1)
は、ドットサイズ直径Dの対象のダウンサンプリング倍率の上限を与える。この直接の結果として、
【0033】
【数1】
Figure 0004138459
は、サイズN×Mの画像全体に対するダウンサンプリング倍率の上限である。Lmax及びLminは、実現可能な表示スケールのレンジ:
λ=[Lmin,Lmax] (3)
を形成する。
【0034】
限界Lmaxは、おそらく、殆どの画像に対して非常に大きい。屡々、画像は、自然画像のように、粗い構造と細かい構造を略同程度の割合で含むか、若しくは、テキスト画像のような多数の細かい構造を含む。粗い構造と細かい構造の割合に応じて、自然画像はテキスト画像よりも多数回に亘ってダウンサンプリングされ、それにもかかわらず、視覚的に認識可能な情報を提示する。したがって、一実施例において、ウェーブレット係数に含まれる情報は、
min≦Ldisplay≦Lmax (4)
という条件と、レベルLdisplayにおけるLL成分は重要な画像情報を含むという条件の下で、所与の画像に対して、最大ダウンサンプリング倍率Ldisplayを決定するため使用される。図5は、サンプリング倍率(表示スケール)の概要の説明図である。倍率は、実現可能な全てのダウンサンプリング倍率のライン501に沿って示されている。レンジの限界Lmin502及びLmax503は、dpi解像度、絶対画素解像度、輝度及びコントラスト、観察距離のような表示パラメータ、並びに、画像サイズのような画像パラメータに依存する。これらのパラメータの他に、Ldisplay504は画像内容に依存する。別の係数、log(画像サイズ)506は、実現可能な全てのダウンサンプリング倍率のライン501の一方の端に存在する。
【0035】
図6は、表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図6を参照するに、処理ロジックは画像を受け取る(処理ステップ601)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ602)。本例の場合、低解像度画像のサイズは、画像内の対象の最小可視対象直径に依存する。最小可視対象直径は、少なくとも多数のドットである。ドット数は、表示装置の1インチ当たりドット数に比例的に依存する。
【0036】
図7は、表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図7を参照するに、処理ロジックは画像を受け取る(処理ステップ701)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ702)。本例の場合、低解像度画像のサイズは、画像内の対象の最小可視対象直径に依存する。最小可視対象直径は、少なくともドット数である。ドット数は、表示装置の1インチ当たりドット数に比例的に依存する。図7に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ703)。この回数は、対象の直径におけるドット数が少なくとも最小可視対象直径のドット数よりも多くなるようなあまり大きくない数である。例えば、最小対象直径が20ドットであり、対象直径が100ドットである場合、2回のダウンサンプリングによって得られる直径は25ドットである。3回のダウンサンプリングによって得られる直径は12ドットである。12ドットは20ドット未満であるため、対象をダウンサンプリングすることができる回数は、2回に過ぎない。
【0037】
図8は、表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図8を参照するに、処理ロジックは画像を受け取る(処理ステップ801)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ802)。図8に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ803)。この回数は、画像内の粗い構造と画像内の細かい構造の比に比例的に依存する。
【0038】
〔画像及び装置に依存するスケールLDISPLAYの決定〕
表示スケールLDISPLAYは、装置依存型表示レンジ[Lmin,Lmax]におけるウェーブレット係数の分布から計算される。一実施例において、大きい係数は画像のエッジに対応し、小さい係数は重要ではない小スケール構造と雑音に対応する。一実施例において、分解におけるレベルは、画像の視覚的認識を可能にさせるため、そのレベルのLL成分が最も重要な情報を収容するように決定される。以下に、二つのアプローチを記述する。
【0039】
一実施例において、最良表示スケールは、ある種の解像度レベルから画像全体に対して決定される(すなわち、大域的スケール選択)。他の一実施例において、画像(又は、そのウェーブレット分解)はセルに分割され、各セルに対する最良表示スケールが独立に決定される(すなわち、局所的スケール選択)。これらのアプローチについては以下で詳述する。
【0040】
〔大域的スケール選択〕
一実施例において、大域的スケール選択問題は以下の通り数学的に定式化される。サイズM×Nの画像のウェーブレット分解を考える。W LL(X)は、レベルmにおける画像Xの全てのLL係数の集合を表す。同様に、W HL(X)、W LH(X)及びW HH(X)は、それぞれ、レベルmにおけるHL帯域、LH帯域及びHH帯域における全てのウェーブレット係数の集合を表す。
【0041】
Mは、低解像度バージョンX=W LL(X)に含まれる情報の重要性を反映する指標を表す。この重要性指標は、例えば、非限定的な例として、エネルギー、エントロピーなどのような一つ以上の因子に基づいて定義してもよい。
【0042】
最良表示レベルLdisplyは、式:
【0043】
【数2】
Figure 0004138459
によって計算される。実際に得られる結果は、
Lsiaplay LL(X)=XLdisplay
のように定義される。
【0044】
多種多様なアプローチが存在する。二つの異なるアプローチの中には、最大エネルギー若しくはエントロピーによるスケール選択と、2−クラスラベリングによるスケール選択と、が含まれる。
【0045】
〔最大エネルギー/エントロピーによるスケール選択〕
一実施例において、表示スケールは、解像度のレベルに亘ってウェーブレット係数の傾向を特徴付け、傾向のレベルの変化を検出することによって決定される。傾向に対する一つの規準はサブバンドにおけるエネルギーである。ELH[m]がテキスト画像に対するレベルmにおけるサブバンドLHのウェーブレット係数のエネルギーを表す場合、傾向は、典型的に、
LH[L]<ELH[L−1]<...<ELH[1]
である。同じ傾向は、他の二つのサブバンド方向HL及びHHに対しても妥当である。写真的自然画像の傾向は、
LH[L]>ELH[L−1]>...>ELH[1]
という反対の挙動を示す。主として小さいフォントのテキストを含む画像は、全てのスケールに対してテキスト傾向に従う。中間サイズのテキストを含む画像は、やや大きいスケールm...Lではテキスト傾向に従い、小さいスケール1...m−1では写真傾向に切り替わる。したがって、小さい方のスケールに含まれる情報は、大きい方のスケールに含まれる情報よりも少なく、スケールmへのダウンサンプリングは、画像内の殆どの重要な情報を維持し続ける。そこで、表示スケールは、mとなるように選定される。一実施例では、エネルギーはレベルE(m)の関数として見なされ、大域的最大値が存在するスケール[Lmin,Lmax]は、以下の式:
【0046】
【数3】
Figure 0004138459
によって決定される。
【0047】
一実施例において、E(m)は選択されたサブバンド(例えば、LH若しくはHL若しくはHH)のエネルギーである。他の一実施例において、E(m)は重み付きサブバンドの和である(例えば、αELH(m)+βEHL(m)+γEHH(m))。更に別の一実施例において、E(m)は、全てのサブバンドの中の最大エネルギーである(例えば、max(ELH(m),EHL(m),EHH)。
【0048】
エネルギーに関して、例えば、式(6)を式(5)と比較すると、式1の重要性指標Mは、レベルmにおけるウェーブレット係数のエネルギーを評価し、以下の式:
【0049】
【数4】
Figure 0004138459
のように表現される。エントロピーMがサブバンドのエントロピーHを評価する場合、
【0050】
【数5】
Figure 0004138459
の用に表現される。それ以外の場合の計算も同じである。
【0051】
図9は、一実施例による表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図9を参照するに、処理ロジックは画像を受け取る(処理ステップ901)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ902)。図9に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ903)。この回数は、例えば、図30に示されるように、重要性指標が増加する傾向から重要性指標が減少する傾向へ変化するときの回数である。
【0052】
図10は、所与の表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図10を参照するに、処理ロジックは画像を受け取る(処理ステップ1001)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ1002)。図10に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ1003)。この回数は、例えば、図30に示されるように、重要性指標が増加する傾向から重要性指標が減少する傾向へ変化するときの回数である。本例の場合、重要性指標はエネルギーである。従って、この回数は、エネルギーの増加傾向からエネルギーの減少傾向へ傾向が変化する時点での回数である。
【0053】
図11は、所与の表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図11を参照するに、処理ロジックは画像を受け取る(処理ステップ1101)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ1102)。図4に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ1103)。この回数は、例えば、図30に示されるように、重要性指標が増加する傾向から重要性指標が減少する傾向へ変化するときの回数である。本例の場合、重要性指標は、選択されたサブバンド内のウェーブレット係数の重要性指標である。従って、この回数は、選択されたサブバンド内のウェーブレット係数の重要性指標の増加傾向から、選択されたサブバンド内のウェーブレット係数の重要性指標の減少傾向へ傾向が変化する時点での回数である。
【0054】
図12は、所与の表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図12を参照するに、処理ロジックは画像を受け取る(処理ステップ1201)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ1202)。図4に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ1203)。この回数は、例えば、図30に示されるように、重要性指標が増加する傾向から重要性指標が減少する傾向へ変化するときの回数である。本例の場合、重要性指標は重み付きサブバンド内のウェーブレット係数の和の重要性指標である。従って、この回数は、重み付きサブバンド内のウェーブレット係数の和の重要性指標の増加傾向から、重み付きサブバンド内のウェーブレット係数の和の重要性指標の減少傾向へ傾向が変化する時点での回数である。
【0055】
図13は、所与の表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図13を参照するに、処理ロジックは画像を受け取る(処理ステップ1301)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ1302)。図4に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ1303)。この回数は、例えば、図30に示されるように、重要性指標が増加する傾向から重要性指標が減少する傾向へ変化するときの回数である。本例の場合、重要性指標は全てのサブバンドからのウェーブレット係数の最大重要性指標である。従って、この回数は、全てのサブバンドからのウェーブレット係数の最大重要性指標の増加傾向から、全てのサブバンドからのウェーブレット係数の最大重要性指標の減少傾向へ傾向が変化する時点での回数である。
【0056】
多数の雑音を含む画像の場合、Ldisplayの決定によって、主に雑音を含むスケールが生じる。したがって、雑音と画像を区別するための付加的な規準は、このケースを取り除くため有効である。一実施例において、雑音は、ウェーブレット雑音除去を使用してウェーブレット係数から除かれる。このため使用できる一つの雑音除去技術は、
文献:ドノホ(Donoho, D.L.)著、「ソフト・スレシュホールディングによる雑音除去(Denoising by soft-thresholding)」、IEEE Transactions on Information Theory、第41巻、第3号、1995年、p.613−627
に記載されている。或いは、使用できる別の技術は、本願の優先権主張日と同日の2002年1月10日に出願され、本願と同一出願人に譲渡された米国特許出願第02−044420号に記載されている。一実施例において、雑音除去後に、表示スケールの決定は、上記の式(6)のように実行される。
【0057】
図14は、表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図14を参照するに、処理ロジックは画像を受け取る(処理ステップ1401)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ1402)。図14に示されるように、低解像度画像の作製の一部として、処理ロジックはウェーブレット係数の雑音を除去する(処理ステップ1403)。
【0058】
他の一実施例において、計算の複雑さを低下させるため、ウェーブレット係数は、全てのあり得るスケール(レベル)で同時には考慮されるのではなく、最初に、最も粗いスケールから考慮され始め、次に、一つずつ精細なスケールが取り込まれ、各レベルを取り込んだ後、表示スケールLdisplayが決定可能であるかどうかが検査される。このようなアプローチの一実施例を説明する。
【0059】
一つのアプローチでは、処理ロジックは、レベルE(m)の関数としてエネルギーを決定する。mが増加する場合、
E(m−1)≦E(m)
である限り、処理ロジックは、
E(m+1)
を計算する。もし、
m=Lmin
であるならば、処理ロジックは、
display=Lmin
として設定する。もし、
E(m−1)>E(m)
であるならば、処理ロジックは、レベルm−1での一つ以上のサブバンド内の雑音除去後の係数と元の係数との間の誤りの比率が所定の閾値を上回る場合に、実現可能な表示スケールLdisplayとして、レベルmを棄却する。例えば、一実施例において、所定の閾値は0.7である。それ以外の場合、処理ロジックは、
display=m−1
を選定する。
【0060】
図15は、二つの例示的な画像に対し表示装置に表示したときに視覚的に認識できる画像表現を計算するアプローチの結果の説明図である。
【0061】
代替的な一実施例では、重要性指標エネルギーに基づいて傾向を決定する代わりに、重要性指標エントロピーを使用することができる。エントロピーは、係数を符号化するため要するビット数を決定する。表示スケールは、レベルmで係数のエネルギーをエントロピーで置き換えることによって、式(9)と同じような形式で決定される。
【0062】
図16は、表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図16を参照するに、処理ロジックは画像を受け取る(処理ステップ1601)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ1602)。図16に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ1603)。この回数は、重要性指標が増加する傾向から重要性指標が減少する傾向へ変化するときの回数である。本例の場合、重要性指標はエントロピーである。したがって、この回数は、エントロピーの増加傾向から、エントロピーの減少傾向へ傾向が変化する時点での回数である。
【0063】
一実施例において、エネルギーの代用として、全てのサブバンドにおけるエネルギーの和が含まれ、最大エネルギーを使用し、上述のような線形結合を使用する。
【0064】
〔最大重要比によるスケール選択〕
代替的な一実施例において、式(6)とは異なる規準が表示スケールを決定するため使用される。この規準は、全ウェーブレット係数が重要な係数のクラスと重要ではない係数のクラスに分離される2−クラスラベリングに基づき、重要な係数と重要ではない係数の最大比を有するスケールが、
display=arg maxm=Lmin,...,Lmax((μ(重要な係数)/μ(重要ではない係数)) (12)
のように決定される。式中、μはデータのクラスを示す。一実施例において、この指標は、クラス内のデータポイントのカウント数である。他の一実施例では、この指標は、重み付きカウント数である(例えば、画像の中央部分の重みが大きい。)。
【0065】
2−クラスラベリングにおいて、Mは、レベルmにおける重要ウェーブレット係数のパーセンテージを表す。この重要性は、係数が所定の閾値よりも大きいかどうかを検査することによって決定される。別の方法は、mよりも大きいスケールからの情報を決定の際に取り込むことである。一例として、係数が次に大きいスケールにおける係数のエネルギーの所与のパーセンテージを上回るかどうかを検査する。パーセンテージ閾値は、表示装置或いはアプリケーションに依存してもよい。別の例では、係数毎に局所エントロピーを推定し、その値が次に大きいスケールにおける係数のエネルギーの所与のパーセンテージを上回るかどうかを検査する。
【0066】
一実施例において、式(1)のコスト関数は、以下の通りである。
レベルmでの重要な係数のパーセンテージが所与の閾値Tよりも小さいか、又は、レベルn≧mにおける重要な係数のパーセンテージが閾値Tよりも小さい場合、
Cost(M(W LL(X))=0
であり、
レベルmでの重要な係数のパーセンテージが所与の閾値T以上であり、レベルn≧mにおける重要な係数のパーセンテージが閾値Tよりも大きい場合、
Cost(M(W LL(X))=レベルmでの重要な係数のパーセンテージである。
【0067】
図17は、表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図17を参照するに、処理ロジックは画像を受け取る(処理ステップ1701)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ1702)。図17に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ1703)。この回数は、重要な係数のクラスのウェーブレット係数と重要でない係数のクラスのウェーブレット係数との比が最高になるときの回数である。
【0068】
2−クラスラベリング問題を解決するアプローチはパターン認識の分野において周知である。例えば、
文献:デューダ(Duda, R.O.)、ハート(Hart, P.E.)及びストーク(Stork, D.G.)著、「パターン分類(Pattern Classification)」、第2版、ワイリー(Wiley)、ニューヨーク、2000年
を参照のこと。スケール毎に解決される2−クラスラベリング問題は、ベイズの決定理論を使用して解決される。確率モデルに取り込まれる画像データは係数の大きさ、又は、局所エントロピーである。
【0069】
〔局所的スケール選択〕
局所的スケール選択は、画像若しくはウェーブレットドメインにおける区分を必要とし、係数若しくは画素のグループ分けを考慮する必要がある。グルーピングは、アプリケーションによって与えても、ユーザが与えてもよく、或いは、画像データから決定してもよい。
【0070】
画像ドメインのセグメントへのパーティション(区分)
一実施例において、画像は、2次元セグメント(例えば、J2Kにおけるタイル)に分割され、次に、大域的スケール選択が上述のように実行される。
【0071】
一実施例では、表示スケールを選択し、そのスケールでのLL成分を画像表現として選定する代わりに、特定のスケールでの画像の一部(例えば、細かいスケールのテキスト、粗いスケールの背景)が選択される。このような局所的スケール選択を実行するため、画像はセグメントに区分される。一実施例において、セグメントは個別の係数である。他の一実施例において、セグメントは、係数のカバーグループであり、例えば、正方形、長方形などの形状をしている。
【0072】
区分が(例えば、セグメントサイズ及び形状サイズによって)選定された後、上述の大域的スケール選択の場合と同じアプローチが区分のセグメントS毎に適用される。その結果として、各S(i)は、表示スケールLdisplay(i)が割当てられる。パターン認識の観点では、結果は、セグメントの(Lmax−Lmin)−クラスラベリングである。
【0073】
図18Aは、所与の表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図18Aを参照するに、処理ロジックは画像を受け取る(処理ステップ1801)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ1802)。作製処理の一部として、処理ロジックは、画像をセグメントに区分する(処理ステップ803)。処理ロジックは、次に、各セグメントをある回数ダウンサンプリングする(処理ステップ1804)。セルのダウンサンプリングは画像のダウンサンプリングと同じ方法で実行される。
【0074】
一実施例において、特定の表示スケール(例えば、Ldisplay=2)と関連した画像の一部(例えば、セグメント)だけが表示される。選択されたセグメントは、連結した成分にグループ分けされるか、又は、組み込まれる。例えば、殆どの画像表示装置の場合、画像表示装置は矩形状であるため、画像情報の矩形状の表示が好まれる。多数のアプローチを利用して、m−クラスラベリング結果に基づいて矩形を選択することができる。一実施例では、Ldisplay=2の全てのセグメントを収容する最大境界ボックスが選定される。この実施例は、ボックスに対する孤立した地帯が非常に大きくなる可能性がある点で不利である。他の一実施例では、以下のような比R(2):
R(2)=μ(Ldisplay=2の矩形内のセグメント)/μ(Ldisplay≠2の矩形内のセグメント) (13)
が最大になる矩形を選択することによって、このような影響を回避するアプローチが使用される。ここで、μは式(12)における指標を表す。このような矩形の一例が図18Bに示されている。他の一実施例で使用されるアプローチは、
R(m)=μ(Ldisplay=mの矩形内のセグメント)/μ(Ldisp lay≠mの矩形内のセグメント) (14)
を最大にする矩形を選択する。
【0075】
換言すると、大域的スケール選択と局所的スケール選択を組み合わせる(Lmax−Lmin)−クラスラベリング問題は、結局、以下で詳述される特定アプリケーションにおける圧縮画像に対する設計上の選択の問題である。
【0076】
ウェーブレットドメインのセルへの区分
ウェーブレットドメインをセルに区分するとき、ウェーブレットドメインはウェーブレットセルに分割される。測定規準M(x)は、低解像度データポイントのグループXに対する情報内容を示す。
【0077】
x∈Xである場合を考える。xの情報内容は、解像度レベルmでサポート内にxを含むM以上の全てのウェーブレットセルレベルのエネルギー若しくはエントロピーの寄与度を計算することからM(x)によって計算される。エネルギー若しくはエントロピーは、ウェーブレットセルの解像度とそのサイズに応じてスケーリングされる。コスト関数は、予め記述された形状(例えば、矩形)又は所与のサイズに適合する全てのデータポイントの測定情報内容を合計する。コスト関数の最大出力を生ずるこれらのポイントを選定することにより、特定の解像度での原画像の一部が認識可能な情報を含むサイズの減少した画像に対して選定される。
【0078】
図19は、表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図19を参照するに、処理ロジックは画像を受け取る(処理ステップ1901)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ1902)。作製処理の一部として、処理ロジックは、例えば、JPEG2000符号ユニットを使用して、画像をセグメントに区分する(処理ステップ1903)。処理ロジックは、次に、選択されたセル内の係数によって記述された画像内容を表示し、ここで、セルはセグメンテーションアルゴリズムによって選択される。より詳しい情報については、本願の優先権主張日と同日の2002年1月10日に出願され、本願と同一出願人に譲渡された米国特許出願第02−044420号を参照のこと。
【0079】
図20は、大域的スケール選択に基づく画像作製処理の一実施例のフローチャートである。処理ステップ2001で画像データが受け取られる。処理ステップ2002で、L−レベルウェーブレット分解におけるウェーブレット係数の重要性を記述するデータは、計算/抽出される。データは、レベルに依存するべきであり、所与の解像度レベルのウェーブレット係数のエネルギー若しくはエントロピーでもよい。処理ステップ2003において、表示スケールLdisplayが決定される。
display<Lmin
であるならば、LdisplayはLminと一致するように設定される。
display>Lmax
であるならば、LdisplayはLmaxと一致するように設定される。最後に、処理ステップ2004において、ウェーブレット分解のレベルLdisplayでのLL成分が表示される。
【0080】
図21は、局所的スケール選択に基づく画像作製処理の一実施例のフローチャートである。処理ステップ2101において、出力表示用の画像データ、特定用途設計選択範囲、及び、ユーザ嗜好が受け取られる。処理ステップ2102において、L−レベルウェーブレット分解のセルCへの区分が選択される。処理ステップ2103において、L−レベルウェーブレット分解におけるウェーブレット係数の重要性を記述するデータが計算/抽出される。データは、レベルに依存するべきであり、所与の解像度レベルのウェーブレット係数のエネルギー若しくはエントロピーでもよい。処理ステップ2104において、各セルC(i)に対して、表示スケールLdisplay(i)が決定される。
display(i)<Lmin
であるならば、Ldisplay(i)はLminと一致するように設定される。
display(i)>Lmax
であるならば、Ldisplay(i)はLmaxと一致するように設定される。処理ステップ2105において、同じ表示スケールをもつセルのクラス(Lmin−Lmaxクラス)が形成される。処理ステップ2106において、形状及びサイズのような特定用途設計選択範囲が考慮され、所与の設計における同じ表示スケールクラスに属する最も良く適合するセルのグループが決定される。最後に、処理ステップ2107において、対応したクラスの表示レベルにおける選択されたグルーピングの純粋なLL成分若しくは修正されたLL成分が表示される。
【0081】
図22は、大域的スケール選択と局所的スケール選択の組み合わせに基づく画像作製処理の一実施例のフローチャートである。処理ステップ2201において、出力表示用の画像データ、特定用途設計選択範囲、及び、ユーザ嗜好が受け取られる。処理ステップ2202において、L−レベルウェーブレット分解におけるウェーブレット係数の重要性を記述するデータが計算/抽出される。データは、レベル及びセルに依存するべきであり、所与の解像度レベルのウェーブレット係数のエネルギー若しくはエントロピーでもよい。処理ステップ2203において、表示スケールLdisplayが決定される。
【0082】
判定ステップ2204において、
【0083】
【数6】
Figure 0004138459
である場合、処理ステップ2205は、選択されたLL成分の表示レベルが、
【0084】
【数7】
Figure 0004138459
となり、表示画素サイズ又は固定サイズ及び形状に適合するように、画像に基づいて局所的スケール変換を実行する。それ以外の場合、処理ステップ2207において、ウェーブレット分解のレベルLDISPLAYにおけるLL成分が表示される(すなわち、大域的スケール分解)。
【0085】
一つの拡張例として、最大化は、予め記述された形状に関して計算可能であるが、可変サイズ、固定サイズのフレキシブル形状、又は、可変サイズのフレキシブル形状について計算してもよい。
【0086】
このことを数学的に定式化すると次のようになる。
【0087】
集合Xの区分Pは、集合p,p∈Pのp≠pである全てのペアに対して、
【0088】
【数8】
Figure 0004138459
かつ
【0089】
【数9】
Figure 0004138459
となるようなXの部分集合の集合である。
【0090】
【数10】
Figure 0004138459
ここで、P HL、P LH及びP HHは、夫々、I HL、I LH及びI HHの区分である。
【0091】
認識可能な内容を伴う縮小サイズ画像は、出力境界及び出力画像内容によって与えられる。境界は、形状(例えば、矩形)とサイズ(例えば、68×80画素)とによって与えられる。境界を画像内容で埋めるため、画像の解像度と、境界を見つけるためのアンカーポイント位置が決定される(例えば、解像度画像Xにおける座標(10,20))。長方形又は正方形のためのアンカーポイントは、左上隅でもよく、円形のためのアンカーポイントは中心でもよい。
【0092】
第1のケースでは、出力境界の所定の形状及びサイズが与えられた場合、最大化問題は、
【0093】
【数11】
Figure 0004138459
のように表される。認識可能な内容を含む縮小サイズ画像は、
【0094】
【数12】
Figure 0004138459
のように定義される。
【0095】
第2のケースでは、更に、認識可能な内容を含む縮小サイズ画像のテンプレートのサイズが可変である場合、最大化問題は、
【0096】
【数13】
Figure 0004138459
のようになる。認識可能な内容を含む縮小サイズ画像は、
【0097】
【数14】
Figure 0004138459
のように定義される。
【0098】
第3のケースでは、出力境界のアンカーポイント、認識可能な内容を含む縮小サイズ画像のテンプレートのサイズ及び形状が可変である場合、最大化問題は、
【0099】
【数15】
Figure 0004138459
のように表される。認識可能な内容を含む縮小サイズ画像は、
【0100】
【数16】
Figure 0004138459
のように定義される。
【0101】
このケースでは、ベクトル(Ldisplay,Adisplay,Ndisplay,Sdisplay)は、認識可能な内容を含む縮小サイズ画像を決定する。
【0102】
第1のケースにおいて、認識可能な内容を含む固定縮小サイズ画像に対する位置及び解像度の選択は、画像内容及び表示装置に依存する。認識可能な内容境界を含む縮小サイズ画像のサイズ及び形状は、アプリケーション若しくはユーザに依存する。第2のケースでは、位置、解像度及び認識可能な画像サイズを含む縮小サイズが画像が画像内容及び表示装置に依存し、第3のケースでは、認識可能な内容を含む縮小サイズ画像の解像度、サイズ、及び、形状は、画像内容及び表示装置に依存する。
【0103】
4次元ベクトル(Ldisplay,Adisplay,Ndisplay,Sdisplay)は、認識可能な内容を含む縮小サイズ画像を決定する。ベクトルのエントリーをベクトル化させることにより、拡張することが可能である。このケースでは、認識可能な内容を含む縮小サイズ画像は、特定の出力境界を含む選択された解像度セグメントの集まりである。これらのセグメントは、これらのセグメントの完全解像度版が、重なり合って、或いは、重なり合い無しに、画像全体を覆うように選定される。これは、マルチステージコラージュと呼ばれる。
【0104】
一般的に、画像が与えられると、この方法は、ベクトル(Ldisplay,Adisplay,Ndisplay,Sdisplay)に関する所与の制約条件の組に対して最適サムネイルを作製する。この場合、認識可能な内容を含む縮小サイズ画像は、特別に選択された解像度セグメントの組み合わせである。スカラー及びベクトルの場合、内挿、外挿、ワープ、ぼかしのような後処理が解像度セグメントに適用され得る。
【0105】
〔JPEG2000画像符号器によって作製されたメタデータを使用するスケール選択〕
JPEG2000(J2K)画像符号器によって作製された画像の符号ストリームは、ウェーブレットドメイン画像データを、パケット、符号ブロック、或いは、タイルのような構造的ユニットに並べ替える。これらのユニットは、零ビットプレーン数、又は、単位符号長さのような特徴を含むヘッダ情報を格納する。一実施例において、これらの特徴は、重要性指標M(例えば、エントロピー)及びコスト関数Costを決定するため使用される。ウェーブレットドメイン画像データの区分は、符号ユニット(例えば、符号ブロック)を選定することによって与えられる。これらのデータは、実際の画像データを復号化することなく簡単に入手可能であり、縮小サイズ画像の作製を非常に素早く実現できるようになる。
【0106】
J2Kメタデータを使用してスケール選択を実行するため、ウェーブレットドメインのセルへの区分は符号ブロックによって与えられる。画像ドメインはタイルによって与えてもよい。
【0107】
大域的スケール選択のため、サブバンドのエントロピーは、サブバンドに含まれる符号ブロックの長さの合計として与えられる。大域的スケール選択と共に説明された上述の指標を適用して、認識可能な内容を含む縮小サイズ画像を計算することができる。
【0108】
局所的スケール選択において、画像がタイルで与えられた場合、画像ドメインのセグメントへの区分に関して説明した上述の局所的スケール選択アプローチが使用される。或いは、J2Kメタデータを使用する局所的スケール選択では、ウェーブレットドメインのセルへの区分に関して説明した局所的スケール選択アプローチが使用され、ウェーブレットセルは符号ブロックであり、Mは符号ブロックのエントロピーを評価する。
【0109】
大域的スケール選択と局所的スケール選択の組み合わせが使用される。例えば、出力境界サイズ及び形状に制約が無い場合、大域的選択が最初に試される。その後、解像度の計算値がレンジxから外れる場合、局所的スケール選択が開始される。一実施例では、局所的スケール選択は、ある制約条件下(例えば、形状が矩形である。)で開始される。例えば、画像が正方形である場合、大域的スケール選択は正方形を生ずる。大域的スケール選択が巧く作動しないとき、形状は特定のサイズを超えない正方形であるという制約条件下で、局所的スケール選択が適用される。
【0110】
以下では、2台の異なる表示装置のため大域的スケール選択と局所的スケール選択を組み合わせた例を説明する。2台の異なる表示装置は、一方がCRTデスクトップ型モニターであり、もう一方がPDA(携帯情報端末)装置のLCDディスプレイである場合を考える。これらの表示装置の物理特性は、表1に掲載されている通りである。
【0111】
【表1】
Figure 0004138459
次の表2は、パラメータLLmin、Dmin及びLmaxの計算値の一覧である。パラメータCdeviceは、例えば、表示コントラスト比と、基準ディスプレイのコントラスト比との比を調整することにより、或いは、使用することによって設定される。
【0112】
【表2】
Figure 0004138459
大域的スケール選択は、CRT装置に対して、Ldisplay=5を決定する。LCD装置に対する大域的スケール選択は、Ldisplay=5である。しかし、これは、Lmaxよりも長い。したがって、局所的スケール選択が始まり、300×300が正方形形状が固定され、最も良く適合する、すなわち、コスト関数を最大化する、位置と区間[0,Lmax]内の解像度Lが探索される。
【0113】
〔アプリケーション〕
大域的並びに局所的スケール選択の概念を縮小サイズ画像を作製するため考えられる設計上の選択範囲に組み込む幾つかの方法がある。一般的に、これらの方法は5つのグループに分離される。
【0114】
一実施例において、一つの画像セグメントだけの情報を含む画像がこのセグメントの計算された表示スケールでのLL成分が固定サイズの所定の形状(例えば、68×68画素の矩形)に適合するように作製される。このようにして。画像は、計算された表示スケールでのセグメントのLL成分を含む。
【0115】
図23は、所与の表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図23を参照するに、処理ロジックは画像を受け取る(処理ステップ2301)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ2302)。図23に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ2303)。この回数は、選択されたセグメントが所与の固定サイズを最も良く近似するときの回数である。
【0116】
一実施例において、特定のLL解像度レベルLdisplayでの画像の一つのセグメントだけの情報を含む縮小サイズ画像が作製される。縮小サイズ画像の形状は固定であるが、そのサイズはフレキシブルである。例えば、縮小サイズ画像の形状は、幅と高さの比がある値Rの矩形でもよい。縮小サイズ画像は、対象となる比がRの全ての矩形について最良適合基準を充たすように、関連した解像度における画像セグメントを含む。
【0117】
図24は、所与の表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図24を参照するに、処理ロジックは画像を受け取る(処理ステップ2401)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ2402)。図24に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ2403)。この回数は、セグメントの形状が所与の固定形状を最も良く近似するときの回数である。
【0118】
一実施例において、特定の解像度での画像の一つのセグメントだけの情報を含む縮小サイズ画像が作製される。縮小サイズ画像の形状及びサイズはフレキシブルである。
【0119】
図25は、所与の表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。図25を参照するに、処理ロジックは画像を受け取る(処理ステップ2501)。処理ロジックは、次に、画像のウェーブレット表現から低解像度画像を作製し、このとき、低解像度画像のサイズは、画像の内容と、低解像度画像を表示する表示装置の物理特性と、に基づいて選択される(処理ステップ2502)。図25に示されるように、低解像度画像の作製の一部として、処理ロジックは、画像をある回数ダウンサンプリングする(処理ステップ2503)。この回数は、選択されたセグメントの解像度が所与の固定解像度を最も良く近似するときの回数である。
【0120】
一実施例において、画像の幾つかのセグメントを含む縮小サイズ画像が作製され、各セグメントは、その表示レベルにおけるLL成分で表示される(すなわち、マルチスケールコラージュ)。
【0121】
一実施例において、画像の幾つかのセグメントを含む縮小サイズ画像が作製される。各セグメントは、表示レベルでのLL成分の値並びに表示されたセグメントの形状に影響を与える後処理がLL成分に対して更に実行され、その表示レベルにおけるLL成分で表示される。このような後処理演算の例には、外挿、ぼかし、定形化、強調、融合、ワーピング、モーフィングなどが含まれる。縮小サイズ画像の設計空間は以下の表3のように抽象化される。
【0122】
【表3】
Figure 0004138459
図26は、一実施例による縮小サイズ画像の設計上の選択範囲の説明図である。一実施例によれば、全画像2601から、画像セグメント2602が選択される。セグメント2602の縮小表現2603は、セグメント2602をある回数だけダウンサンプリングすることによって作製される。この回数は、セグメントのサイズが所与の固定サイズ(例えば、68×68画素)を最も良く近似するときの回数である。他の一実施例によれば、全画像2604から、画像セグメント2605が選択される。セグメント2605の縮小表現2606は、セグメント2605をある回数だけダウンサンプリングすることによって作製される。この回数は、セグメントの解像度が所与の固定解像度(例えば、固定幅/高さ比の矩形)を最も良く近似するときの回数である。他の一実施例によれば、全画像2607から、画像セグメント2608が選択される。セグメント2608の縮小表現2609は、セグメント2608をある回数だけダウンサンプリングすることによって作製される。この回数は、セグメントの形状が所与の固定形状(例えば、形状リストから選択されたけ以上と、フレキシブル(=制約の無い)サイズ)を最も良く近似するときの回数である。
【0123】
図27は、典型的な縮小サイズ画像の設計上の選択範囲の説明図である。一実施例において、選択された画像セグメント2701−2707は、個別に種々の限度でダウンサンプリングされる。得られたマルチスケールコラージュは、例えば、元のセグメントの対応部分のサイズの25%のサイズのセグメント2708、2712及び2713を含む。セグメント2709及び2710は、例えば、元のセグメントの対応部分のサイズの50%である。セグメント2714は、元のセグメントの対応部分のサイズの12.5%である。最後に、セグメント2711は、元の対応部分であるセグメント2704のサイズの100%のサイズのまま維持される。
【0124】
一実施例において、選択された画像セグメント2715−2721は、LL成分からある倍率でアップサンプリングされる。得られたマルチスケールコラージュにおいて、例えば、セグメント2722、2726及び2727は、スケール選択されたLL成分から2倍の倍率でアップサンプリングされる。セグメント2723及び2724は、スケール選択されたLL成分から1倍の倍率でアップサンプリングされる。セグメント2728は、スケール選択されたLL成分から3倍の倍率でアップサンプリングされる。最後に、セグメント2725は、元の対応部分であるセグメント2718から元のサイズのまま保たれる。
【0125】
一実施例において、選択された画像セグメント2729−2735は、セグメント2715−2721と同じようにアップサンプリングされる。さらに、得られたマルチスケールコラージュにおける対応した各セグメント2736−2742は、強調、ワーピング、ぼかしなどの後処理が施される。
【0126】
上記の実施例は、デジタルカメラディスプレイ、デジタル写真アルバムソフトウェア、画像ブラウジング、ビデオ要約、ページレイアウト、及び、ウェブページ設計に適用され得る。このようなアプリケーションにおいて、表示レンジパラメータLmin及びLmaxは、一実施例では、ユーザによって設定され、縮小サイズ画像作製システムの使用中に調整することができる。一実施例のオペレーティングシステムにおいて、絶対画像解像度のようなパラメータは、ユーザの介入を全く要求することなく、ディスプレイ設置条件から抽出される。上記の説明では、ウェーブレット分解に普通に現れる倍率2のダウンサンプリングだけが考慮されている。しかし、当業者には、縮小サイズ画像作製のアプローチは、特定の解像度で選択されたセグメントの内挿又は外挿によって、2の累乗以外のサンプリング比に拡張できることが明らかである。
【0127】
図28は、所与の表示装置に表示したときに視覚的に認識できる画像表現を計算する装置の一実施例の構成図である。装置2801は、画像を受け取る受信ユニット2802と、受信ユニット2802に接続された処理ユニット2803と、を含む。処理ユニット2803は、画像のウェーブレット表現から低解像度画像を作製する。低解像度画像のサイズは、低解像度画像を表示させるため、画像の内容と、表示装置(図示せず)の物理特性と、を補償するように選択される。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、低解像度画像を表示装置上で完全に見えるようにするために十分な回数で画像をダウンサンプリングする。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、画像内の粗い構造と画像内の細かい構造の比に比例的に依存する回数で、画像をダウンサンプリングする。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、係数から雑音を除去する。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、重要な特徴のクラス内のウェーブレット係数と,重要でない特徴のクラス内のウェーブレット係数との比が最高になる回数で、画像をダウンサンプリングする。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、セグメントのサイズが所与の固定サイズを最も良く近似する回数で、画像のセグメントをダウンサンプリングする。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、セグメントの形状が所与の固定形状を最も良く近似する回数で、画像のセグメントをダウンサンプリングする。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、セグメントの解像度が所与の固定解像度を最も良く近似する回数で、画像のセグメントをダウンサンプリングする。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、対象の直径のドット数が少なくとも最小可視対象直径のドット数と同じ大きさになる回数で、画像をダウンサンプリングする。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、重要性指標の増加から重要性指標の減少へ傾向が変化する回数で、画像をダウンサンプリングする。一実施例において、画像のウェーブレット表現から低解像度画像を作製するため、処理ユニット2803は、画像をセルセグメントに区分し、セグメントをダウンサンプリングする。一実施例において、画像をセルに区分するため、処理ユニット2803は、JPEG2000符号ユニットにより画像を区分する。
【0128】
上記の技術は、カラーに拡張することができる。カラー画像の場合、これらの全技術は、あるクロマティックバンド(例えば、L*inCIEL*uv、YinYuv、或いは、sRGBのG)のうちの一つ、一部、或いは、全部に対して使用され得る。二つ以上のクロマティックバンドが使用される場合、結果を合成するための技術が使用される。また、上記の技術は、時間(例えば、動画、ビデオ)に拡張することができる。このような場合、対象は、サムネイルを追跡するため識別され、及び/又は、キーフレームの所在が見つけられ、次に、処理される。
【0129】
〔コンピュータシステムの例〕
図29は、上記の演算うちの一つ以上の演算を実行するコンピュータシステムのブロック図である。図29を参照するに、コンピュータシステム2900は、典型的なクライアント2950若しくはサーバー2900のコンピュータシステムを含む場合もある。コンピュータシステム2900は、情報を通信するための通信機構若しくはバス2911と、バス2911に接続され情報を処理するプロセッサ2912と、を含む。プロセッサ2912は、例えば、Pentium(登録商標)、PowerPC(登録商標)などのマイクロプロセッサを具備するが、これらのマイクロプロセッサに限定されるものではない。
【0130】
システム2900は、バス2911に接続され、情報と、プロセッサ2912によって実行される命令とを保持するランダム・アクセス・メモリ(RAM)、或いは、その他のダイナミック記憶装置2904(メインメモリと呼ばれる)を更に具備する。メインメモリ2904は、プロセッサ2912による命令の実行中に、一時的な値、或いは、その他の中間情報を保持するためにも使用される。
【0131】
コンピュータシステム2900は、バス2911に接続され、プロセッサ2912用のスタティック情報及び命令を保持するリード・オンリ・メモリ(ROM)及び/又はその他のスタティック記憶装置2906と、磁気ディスク若しくは光ディスクと対応したディスクドライブのようなデータ記憶装置2907と、を更に具備する。データ記憶装置2907は、バス2911に接続され、情報及び命令を保持する。
【0132】
コンピュータシステム2900は、バス2911に接続され情報をコンピュータユーザへ表示する、陰極線管(CRT)若しくは液晶ディスプレイ(LCD)のような表示装置2921にも接続される。英数字及びその他のキーを含む英数字入力装置2922は、バス2911に接続され、情報及びコマンド選択をプロセッサ2912へ通信する。補助ユーザ入力装置は、マウス、トラックボール、スタイラスペン、若しくは、カーソル方向キーのようなカーソル制御器2923であり、方向情報及びコマンド選択をプロセッサ2921へ通信し、表示装置2921上のカーソル移動を制御する。
【0133】
バス2911に接続された別の装置は、ハードコピー装置2924であり、命令、データ、若しくは、その他の情報を、用紙のような媒体、若しくは、同じようなタイプの媒体に印刷するため使用される。更に、スピーカー及び/又はマイクロホンのようなサウンド録音及び再生装置がバス2911へ随意的に接続され、コンピュータシステム2900とのオーディオインタフェースを実現する。バスに接続されるその他の装置には、電話機又はハンドヘルド・パーム型装置と通信するための有線/無縁通信機器2925が含まれる。
【0134】
尚、コンピュータシステム2900及び関連したハードウェアのコンポーネントの一部若しくは全部が本発明で使用できる。しかし、これらのコンポーネントの一部若しくは全部を含む他のコンピュータシステムの構成もあり得ることが認められる。
【0135】
以上の説明から、本発明の多数の代替及び変更が当業者に明らかになるであろう。しかし、例示のために解説され、図示された具体的な実施例は、本発明を制限することを意図していないことに注意する必要がある。したがって、多数の実施例の詳細の説明は、本発明に不可欠であると考えられる事項だけが記載された請求項に挙げられた事項の範囲を制限することを意図したものではない。
【図面の簡単な説明】
【図1】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図2】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図3】典型的なウェーブレット分解の説明図である。
【図4】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図5】多数のサンプリング係数(表示スケール)の説明図である。
【図6】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図7】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図8】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図9】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図10】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図11】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図12】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図13】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図14】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図15】二つの例示的な画像に対し表示装置に表示したときに視覚的に認識できる画像表現を計算するアプローチの結果の説明図である。
【図16】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図17】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図18A】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図18B】選択された矩形の一例の説明図である。
【図19】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図20】大域的スケール選択に基づく画像作製処理の一実施例のフローチャートである。
【図21】局所的スケール選択に基づく画像作製処理の一実施例のフローチャートである。
【図22】大域的スケール選択と局所的スケール選択の組み合わせに基づく画像作製処理の一実施例のフローチャートである。
【図23】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図24】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図25】表示装置に表示したときに視覚的に認識できる画像表現を計算する処理の一実施例のフローチャートである。
【図26】設計上の選択の例の説明図である。
【図27】付加的な設計上の選択の例の説明図である。
【図28】表示装置に表示したときに視覚的に認識できる画像表現を計算する装置の一実施例のブロック図である。
【図29】コンピュータシステムの一例のブロック図である。
【図30】ダウンサンプリングの回数と重要性指標の関係を示す図である。

Claims (23)

  1. 表示装置に表示するための低解像度画像データを画像データから作成する低解像度画像データ作成方法であって、
    画像データを受け取る受信ステップと、
    前記受信ステップで受信した画像データのウェーブレット表現に含まれるウェーブレット係数と、前記表示装置の物理的特性とに基づいて、ダウンサンプリング回数を決定するダウンサンプリング回数決定ステップと、
    前記画像データのウェーブレット表現を、前記ダウンサンプリング回数決定ステップで決定されたダウンサンプリング回数、ダウンサンプリングして低解像度画像データを作成する作成ステップと
    からなる低解像度画像データ作成方法。
  2. 前記ダウンサンプリング回数決定ステップは、
    前記表示装置の物理的特性から前記ダウンサンプリング回数の上限と下限とを決定し、
    当該ダウンサンプリング回数の上限と下限との間の範囲内のウェーブレット分解レベルのウェーブレット係数に基づいて、前記ダウンサンプリング回数を決定すること
    を特徴とする請求項1に記載の低解像度画像データ作成方法。
  3. 前記ダウンサンプリング回数は、前記ダウンサンプリング回数の上限と下限との範囲に含まれること、
    を特徴とする請求項2に記載の低解像度画像データ作成方法。
  4. 前記ダウンサンプリング回数決定ステップは、
    前記ウェーブレット係数から算出される重要性指標に基づいて前記ダウンサンプリング回数を決定すること
    を特徴とする請求項2又は3に記載の低解像度画像データ作成方法。
  5. 前記重要性指標は、
    それぞれの前記ウェーブレット分解レベルにおける、選択されたサブバンドのウェーブレット係数から算出されたエネルギーであり、
    前記ダウンサンプリング回数は、ウェーブレット分解レベルに応じて、前記算出したエネルギーが増加する傾向から減少する傾向に変化するときのウェーブレット分解レベルに基づいて決定されること
    を特徴とする請求項4に記載の低解像度画像データ作成方法。
  6. 前記ダウンサンプリング回数決定ステップは、
    前記受信ステップで受信した画像データのウェーブレット表現に含まれるウェーブレット係数の、重要係数と非重要係数の比に基づいて、前記ダウンサンプリング回数を決定すること
    を特徴とする請求項2又は3に記載の低解像度画像データ作成方法。
  7. 前記重要係数と非重要係数は、
    各ウェーブレット係数を第1の閾値と比較することにより判定されること
    を特徴とする請求項6に記載の低解像度画像データ作成方法。
  8. 前記ダウンサンプリング回数は、
    各ウェーブレット分解レベルにおける前記重要係数と非重要係数の比を第2の閾値と比較することにより決定されること
    を特徴とする請求項6又は7に記載の低解像度画像データ作成方法。
  9. 前記重要係数と非重要係数の比は、ウェーブレット分解レベルごとに算出され、
    前記ダウンサンプリング回数は、前記重要係数と非重要係数の比が最高になるときのウェーブレット分解レベルに基づき決定されること
    を特徴とする請求項6又は7に記載の低解像度画像データ作成方法。
  10. ウェーブレット分解レベルmのレベルにおける重要係数と非重要係数の比が前記第2の閾値より小さい場合、又は、レベルn≧mのレベルにおける重要係数と非重要係数の比が前記第2の閾値よりも小さい場合、レベルmの前記重要係数と非重要 係数の比の費用関数はゼロにされ、
    ウェーブレット分解レベルmのレベルにおける重要係数と非重要係数の比が前記第2の閾値より大きく、且つ、レベルn≧mのレベルにおける重要係数と非重要係数の比が前記第2の閾値よりも大きい場合、レベルmの前記重要係数と非重要係数の比の費用関数はレベルmの前記重要係数と非重要係数の比の値にされること
    を特徴とする請求項8に記載の低解像度画像データ作成方法。
  11. 前記表示装置の物理特性は、1インチ当たりのドット数解像度、絶対画素解像度、コントラスト比、輝度、観察距離、視野角当たりの画素数、及び、利得関数からなる群より選択された少なくとも一つの特性を含む、請求項1乃至10のいずれか1に記載の低解像度画像データ作成方法。
  12. 表示装置に表示するための低解像度画像データを画像データから作成する低解像度画像データ作成装置であって、
    画像データを受け取る受信ユニットと、
    前記受信ユニットに接続された処理ユニットであり、前記受信ユニットが受信した前記画像データのウェーブレット表現に含まれるウェーブレット係数と、前記表示装置の物理的特性とに基づいて、ダウンサンプリング回数を決定し、且つ、前記画像データのウェーブレット表現を、決定されたダウンサンプリング回数、ダウンサンプリングして低解像度画像データを作成する処理ユニット
    を有する低解像度画像データ作成装置。
  13. 前記処理ユニットは、
    前記表示装置の物理的特性から前記ダウンサンプリング回数の上限と下限とを決定し、
    当該ダウンサンプリング回数の上限と下限との間の範囲内のウェーブレット分解レベルのウェーブレット係数に基づいて、前記ダウンサンプリング回数を決定すること
    を特徴とする請求項12に記載の低解像度画像データ作成装置。
  14. 前記ダウンサンプリング回数は、前記ダウンサンプリング回数の上限と下限との範囲に含まれること、
    を特徴とする請求項13に記載の低解像度画像データ作成装置。
  15. 前記処理ユニットは、
    前記ウェーブレット係数から算出される重要性指標に基づいて前記ダウンサンプリング回数を決定すること
    を特徴とする請求項13又は14に記載の低解像度画像データ作成装置。
  16. 前記重要性指標は、
    それぞれの前記ウェーブレット分解レベルにおける、選択されたサブバンドのウェーブレット係数から算出されたエネルギーであり、
    前記処理ユニットは、ウェーブレット分解レベルに応じて、前記算出したエネルギーが増加する傾向から減少する傾向に変化するときのウェーブレット分解レベルに基づいて、前記ダウンサンプリング回数を決定すること
    を特徴とする請求項15に記載の低解像度画像データ作成装置。
  17. 前記処理ユニットは、
    前記受信ユニットが受信した画像データのウェーブレット表現に含まれるウェーブレット係数の、重要係数と非重要係数の比に基づいて、前記ダウンサンプリング回数を決定すること
    を特徴とする請求項13又は14に記載の低解像度画像データ作成装置。
  18. 前記重要係数と非重要係数は、
    各ウェーブレット係数を第1の閾値と比較することにより判定されること
    を特徴とする請求項17に記載の低解像度画像データ作成装置。
  19. 前記処理ユニットは、
    各ウェーブレット分解レベルにおける前記重要係数と非重要係数の比を第2の閾値と比較することにより、前記ダウンサンプリング回数を決定すること
    を特徴とする請求項17又は18に記載の低解像度画像データ作成装置。
  20. 前記処理ユニットは、
    前記重要係数と非重要係数の比を、ウェーブレット分解レベルごとに算出し、
    前記重要係数と非重要係数の比が最高になるときのウェーブレット分解レベルに基づき、前記ダウンサンプリング回数を決定すること
    を特徴とする請求項17又は18に記載の低解像度画像データ作成装置。
  21. 前記処理ユニットは、
    ウェーブレット分解レベルmのレベルにおける重要係数と非重要係数の比が前記第2の閾値より小さい場合、又は、レベルn≧mのレベルにおける重要係数と非重要係数の比が前記第2の閾値よりも小さい場合、レベルmの前記重要係数と非重要係数の比の費用関数をゼロにし、
    ウェーブレット分解レベルmのレベルにおける重要係数と非重要係数の比が前記第2の閾値より大きく、且つ、レベルn≧mのレベルにおける重要係数と非重要係数の比が前記第2の閾値よりも大きい場合、レベルmの前記重要係数と非重要係数の比の費用関数をレベルmの前記重要係数と非重要係数の比の値にすること
    を特徴とする請求項19に記載の低解像度画像データ作成装置。
  22. 前記表示装置の物理特性は、1インチ当たりのドット数解像度、絶対画素解像度、コントラスト比、輝度、観察距離、視野角当たりの画素数、及び、利得関数からなる群より選択された少なくとも一つの特性を含む、請求項12乃至21のいずれか1に記載の低解像度画像データ作成装置。
  23. コンピュータによって実行されるときに、請求項1乃至11のいずれか1に記載の低解像度画像データ作成方法をコンピュータに実行させるためのプログラム。
JP2002336773A 2002-01-10 2002-11-20 低解像度画像作製方法及び装置 Expired - Fee Related JP4138459B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US044603 2002-01-10
US10/044,603 US7095907B1 (en) 2002-01-10 2002-01-10 Content and display device dependent creation of smaller representation of images

Publications (2)

Publication Number Publication Date
JP2003242497A JP2003242497A (ja) 2003-08-29
JP4138459B2 true JP4138459B2 (ja) 2008-08-27

Family

ID=27787397

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002336773A Expired - Fee Related JP4138459B2 (ja) 2002-01-10 2002-11-20 低解像度画像作製方法及び装置

Country Status (2)

Country Link
US (2) US7095907B1 (ja)
JP (1) JP4138459B2 (ja)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP3870193B2 (ja) 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
AUPS271002A0 (en) * 2002-05-31 2002-06-20 Canon Kabushiki Kaisha Embedding a multiresolution compressed thumbnail image in a compressed image file
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7116716B2 (en) 2002-11-01 2006-10-03 Microsoft Corporation Systems and methods for generating a motion attention model
US7260261B2 (en) * 2003-02-20 2007-08-21 Microsoft Corporation Systems and methods for enhanced image adaptation
US20050188326A1 (en) * 2004-02-25 2005-08-25 Triworks Corp. Image assortment supporting device
US8659619B2 (en) * 2004-03-26 2014-02-25 Intellectual Ventures Fund 83 Llc Display device and method for determining an area of importance in an original image
US7629989B2 (en) * 2004-04-02 2009-12-08 K-Nfb Reading Technology, Inc. Reducing processing latency in optical character recognition for portable reading machine
US9053754B2 (en) 2004-07-28 2015-06-09 Microsoft Technology Licensing, Llc Thumbnail generation and presentation for recorded TV programs
US7986372B2 (en) * 2004-08-02 2011-07-26 Microsoft Corporation Systems and methods for smart media content thumbnail extraction
US7474793B2 (en) * 2004-09-02 2009-01-06 Hewlett-Packard Development Company, L.P. Methods for compression using a denoiser
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US20070112811A1 (en) * 2005-10-20 2007-05-17 Microsoft Corporation Architecture for scalable video coding applications
US8180826B2 (en) 2005-10-31 2012-05-15 Microsoft Corporation Media sharing and authoring on the web
US7773813B2 (en) 2005-10-31 2010-08-10 Microsoft Corporation Capture-intention detection for video content analysis
US8196032B2 (en) * 2005-11-01 2012-06-05 Microsoft Corporation Template-based multimedia authoring and sharing
US7599918B2 (en) 2005-12-29 2009-10-06 Microsoft Corporation Dynamic search with implicit user intention mining
CN100389591C (zh) * 2006-04-13 2008-05-21 北京中星微电子有限公司 一种对二维数字信号进行缩放的方法
US7859543B2 (en) * 2006-06-29 2010-12-28 Apple Inc. Displaying images
US7680348B2 (en) * 2006-07-21 2010-03-16 Xerox Corporation System and method for compressing and scaling images
KR100820678B1 (ko) * 2006-09-28 2008-04-11 엘지전자 주식회사 디지털 비디오 레코더에서의 데이터 전송장치 및 방법
US7941002B2 (en) * 2006-12-01 2011-05-10 Hewlett-Packard Development Company, L.P. Apparatus and methods of producing photorealistic image thumbnails
TW200830859A (en) * 2007-01-12 2008-07-16 Prolific Technology Inc Image capture apparatus
US8583637B2 (en) * 2007-03-21 2013-11-12 Ricoh Co., Ltd. Coarse-to-fine navigation through paginated documents retrieved by a text search engine
US8584042B2 (en) * 2007-03-21 2013-11-12 Ricoh Co., Ltd. Methods for scanning, printing, and copying multimedia thumbnails
US8812969B2 (en) 2007-03-21 2014-08-19 Ricoh Co., Ltd. Methods for authoring and interacting with multimedia representations of documents
US20080235564A1 (en) * 2007-03-21 2008-09-25 Ricoh Co., Ltd. Methods for converting electronic content descriptions
US20090003712A1 (en) * 2007-06-28 2009-01-01 Microsoft Corporation Video Collage Presentation
WO2009051900A2 (en) * 2007-10-17 2009-04-23 Exxonmobil Upstream Research Company Method to adapt a template dataset to a target dataset by using curvelet representations
WO2009070449A1 (en) * 2007-11-30 2009-06-04 Mitsubishi Electric Research Laboratories, Inc. Content aware resizing of images and videos
US20090179913A1 (en) * 2008-01-10 2009-07-16 Ali Corporation Apparatus for image reduction and method thereof
US8290285B2 (en) * 2008-06-23 2012-10-16 Mediatek Inc. Method and related apparatuses for decoding multimedia data
US8040810B2 (en) * 2008-11-26 2011-10-18 Mitsubishi Electric Research Laboratories, Inc. Method for routing packets in wireless ad-hoc networks with probabilistic delay guarantees
US8331677B2 (en) * 2009-01-08 2012-12-11 Microsoft Corporation Combined image and text document
US8400473B2 (en) * 2009-06-24 2013-03-19 Ariel Shamir Multi-operator media retargeting
US8405681B2 (en) * 2009-06-24 2013-03-26 Ariel Shamir Image comparison by asymmetric dynamic warping
DE102009043705A1 (de) * 2009-10-01 2011-04-07 Silicon Micro Sensors Gmbh Verfahren und Kamerasystem zur Erzeugung von Bildern zur Übermittlung an eine externe Steuereinheit
JP2012118832A (ja) * 2010-12-02 2012-06-21 Sony Corp 情報処理装置、情報処理方法及びプログラム
US9271035B2 (en) 2011-04-12 2016-02-23 Microsoft Technology Licensing, Llc Detecting key roles and their relationships from video
CN102903094B (zh) * 2011-07-25 2015-09-02 株式会社理光 电子文档栅格化方法和电子文档栅格化装置
CN103067715B (zh) 2013-01-10 2016-12-28 华为技术有限公司 深度图像的编解码方法和编解码装置
CN103067716B (zh) * 2013-01-10 2016-06-29 华为技术有限公司 深度图像的编解码方法和编解码装置
CN104717555B (zh) 2013-12-11 2018-01-02 华为技术有限公司 视频码流的获取方法及装置
US20160085762A1 (en) * 2014-09-23 2016-03-24 Smoothweb Technologies Ltd. Multi-Scene Rich Media Content Rendering System
KR102331599B1 (ko) * 2014-12-03 2021-11-30 엘지전자 주식회사 비디오 신호 처리 방법 및 이를 위한 장치

Family Cites Families (117)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3506327A (en) 1964-04-23 1970-04-14 Battelle Development Corp Wavefront reconstruction using a coherent reference beam
US3950103A (en) 1972-10-27 1976-04-13 Canadian Patents And Development Limited Method and apparatus to determine spatial distribution of magnitude and phase of electro-magnetic fields especially optical fields
DE2640157C2 (de) 1976-09-07 1982-10-07 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und Anordnung zum redundanzvermindernden Codieren von Bildern
DE2640140C2 (de) 1976-09-07 1982-10-07 Philips Patentverwaltung Gmbh, 2000 Hamburg Verfahren und Anordnung zur redundanzvermindernden Bildcodierung
US4136954A (en) 1976-12-29 1979-01-30 Jamieson John A Imaging apparatus including spatial-spectral interferometer
US4223354A (en) 1978-08-30 1980-09-16 General Electric Company Phase corrected raster scanned light modulator and a variable frequency oscillator for effecting phase correction
US4393456A (en) 1981-03-19 1983-07-12 Bell Telephone Laboratories, Incorporated Digital filter bank
EP0070948B1 (fr) 1981-07-28 1985-07-10 International Business Machines Corporation Procédé de codage de la voix et dispositif de mise en oeuvre dudit procédé
US4437087A (en) 1982-01-27 1984-03-13 Bell Telephone Laboratories, Incorporated Adaptive differential PCM coding
US4674125A (en) 1983-06-27 1987-06-16 Rca Corporation Real-time hierarchal pyramid signal processing apparatus
US4599567A (en) 1983-07-29 1986-07-08 Enelf Inc. Signal representation generator
US4652881A (en) 1984-01-10 1987-03-24 Lewis Bernard L Efficient adaptive filter bank
FR2577084B1 (fr) 1985-02-01 1987-03-20 Trt Telecom Radio Electr Systeme de bancs de filtres d'analyse et de synthese d'un signal
US4701006A (en) 1985-02-20 1987-10-20 Stanford University Optical-digital hologram recording
US4751742A (en) 1985-05-07 1988-06-14 Avelex Priority coding of transform coefficients
GB2181318B (en) 1985-10-04 1989-12-28 Sony Corp Two-dimensional finite impulse response filters
US4760563A (en) 1986-01-09 1988-07-26 Schlumberger Technology Corporation Seismic exploration using exactly invertible discrete transformation into tau-p space
US4929223A (en) 1986-02-18 1990-05-29 Adolph Coors Company Packaging alignment system
DE3732085A1 (de) 1986-03-26 1989-04-06 Ant Nachrichtentech Digitaler filterbaum
US4663660A (en) 1986-06-20 1987-05-05 Rca Corporation Compressed quantized image-data transmission technique suitable for use in teleconferencing
GB8621994D0 (en) 1986-09-12 1986-10-22 Crosfield Electronics Ltd Image processing
US4868868A (en) 1986-09-30 1989-09-19 Oki Electric Industry Co., Ltd. Sub-band speech analyzing and synthesizing device
FR2606576B1 (fr) 1986-11-07 1989-02-03 Labo Electronique Physique Dispositif pour transmettre des images de television haute definition dans des canaux a bande etroite
GB2197766B (en) 1986-11-17 1990-07-25 Sony Corp Two-dimensional finite impulse response filter arrangements
US4815023A (en) 1987-05-04 1989-03-21 General Electric Company Quadrature mirror filters with staggered-phase subsampling
US4817182A (en) 1987-05-04 1989-03-28 General Electric Company Truncated subband coding of images
BE1000643A5 (fr) 1987-06-05 1989-02-28 Belge Etat Procede de codage de signaux d'image.
EP0294957B1 (en) 1987-06-09 1995-04-12 Sony Corporation Motion vector processing in digital television images
US4837517A (en) 1987-07-16 1989-06-06 Schlumberger Technology Corporation Spatial frequency method and apparatus for investigating earth conductivity with high vertical resolution by induction techniques
US4785349A (en) 1987-10-05 1988-11-15 Technology Inc. 64 Digital video decompression system
US4936665A (en) 1987-10-25 1990-06-26 Whitney Theodore R High resolution imagery systems and methods
US4881075A (en) 1987-10-15 1989-11-14 Digital Equipment Corporation Method and apparatus for adaptive data compression
US5156943A (en) 1987-10-25 1992-10-20 Whitney Theodore R High resolution imagery systems and methods
US4827336A (en) 1987-12-18 1989-05-02 General Electric Company Symbol code generation processing from interframe DPCM of TDM'd spatial-frequency analyses of video signals
US4858017A (en) 1988-01-22 1989-08-15 The Trustees Of Columbia University In The City Of New York System and method for hierarchal image encoding and decoding
US5018210A (en) 1988-03-25 1991-05-21 Texas Instruments Incorporated Pattern comparator with substage illumination and polygonal data representation
US4985927A (en) 1988-03-25 1991-01-15 Texas Instruments Incorporated Method of detecting and reviewing pattern defects
US5095447A (en) 1988-03-25 1992-03-10 Texas Instruments Incorporated Color overlay of scanned and reference images for display
US5001764A (en) 1988-03-25 1991-03-19 Texas Instruments Incorporated Guardbands for pattern inspector
US4897717A (en) 1988-03-30 1990-01-30 Starsignal, Inc. Computer-based video compression system
EP0339589A3 (en) 1988-04-28 1992-01-02 Sharp Kabushiki Kaisha Orthogonal transform coding system for image data
US4982283A (en) 1988-05-06 1991-01-01 General Electric Company Line-sequential pyramid processing of a plurality of raster-scanned image variables
US4899147A (en) 1988-06-03 1990-02-06 Unisys Corporation Data compression/decompression apparatus with throttle, start-up and backward read controls
US4829378A (en) 1988-06-09 1989-05-09 Bell Communications Research, Inc. Sub-band coding of images with low computational complexity
US4904073A (en) 1988-08-10 1990-02-27 Aware, Inc. Fractal tiling for multiple mirror optical devices
FR2637400B1 (fr) 1988-09-30 1990-11-09 Labo Electronique Physique Dispositif de traitement ameliore d'un signal echographique
US4929946A (en) 1989-02-09 1990-05-29 Storage Technology Corporation Adaptive data compression apparatus including run length encoding for a tape drive system
FR2643986B1 (fr) 1989-03-03 1991-05-17 Thomson Csf Procede d'analyse d'un signal par ondelettes
US4918524A (en) 1989-03-14 1990-04-17 Bell Communications Research, Inc. HDTV Sub-band coding using IIR filter bank
JPH02305182A (ja) 1989-05-19 1990-12-18 Fuji Photo Film Co Ltd 画像信号圧縮符号化装置
US5072308A (en) 1989-06-21 1991-12-10 International Mobile Machines Corporation Communication signal compression system and method
US4987480A (en) 1989-07-11 1991-01-22 Massachusetts Institute Of Technology Multiscale coding of images
US4974187A (en) 1989-08-02 1990-11-27 Aware, Inc. Modular digital signal processing system
US5073964A (en) 1989-08-04 1991-12-17 Aware, Inc. Signal processing device and method
US5241395A (en) 1989-08-07 1993-08-31 Bell Communications Research, Inc. Adaptive transform coding using variable block size
US5014134A (en) 1989-09-11 1991-05-07 Aware, Inc. Image compression method and apparatus
US5097261A (en) 1989-11-22 1992-03-17 International Business Machines Corporation Data compression for recording on a record medium
US5173880A (en) 1989-12-26 1992-12-22 Exxon Production Research Company Method of generating seismic wavelets using seismic range equation
US5068911A (en) 1990-02-09 1991-11-26 Aware, Inc. Method and apparatus for representing an image
US4973961A (en) 1990-02-12 1990-11-27 At&T Bell Laboratories Method and apparatus for carry-over control in arithmetic entropy coding
US5103306A (en) 1990-03-28 1992-04-07 Transitions Research Corporation Digital image compression employing a resolution gradient
US4999705A (en) 1990-05-03 1991-03-12 At&T Bell Laboratories Three dimensional motion compensated video coding
DE4016172C1 (ja) 1990-05-19 1991-03-28 Werner 5900 Siegen De Ackermann
US5101446A (en) 1990-05-31 1992-03-31 Aware, Inc. Method and apparatus for coding an image
US5128757A (en) 1990-06-18 1992-07-07 Zenith Electronics Corporation Video transmission system using adaptive sub-band coding
ATE143758T1 (de) 1990-07-11 1996-10-15 Philips Electronics Nv Vorrichtung zur ableitung eines kompatiblen zeilensprungfernsehsignals mit geringer auflösung und anderen komponenten eines hochauflösenden zeilensprungfernsehsignals sowie vorrichtung zur wiederherstellung des originalsignals
US5148498A (en) 1990-08-01 1992-09-15 Aware, Inc. Image coding apparatus and method utilizing separable transformations
US5081645A (en) 1990-08-06 1992-01-14 Aware, Inc. Novel spread spectrum codec apparatus and method
US5128791A (en) 1990-08-13 1992-07-07 Bell Communications Research, Inc. Multi-channel HDTV system
US5097331A (en) 1990-08-24 1992-03-17 Bell Communications Research, Inc. Multiple block-size transform video coding using an asymmetric sub-band structure
US5049992A (en) 1990-08-27 1991-09-17 Zenith Electronics Corporation HDTV system with receivers operable at different levels of resolution
US5049993A (en) 1990-10-03 1991-09-17 Bell Communications Research, Inc. Format conversion preprocessing method and circuit
GB2252002B (en) 1991-01-11 1995-01-04 Sony Broadcast & Communication Compression of video signals
JP3012698B2 (ja) 1991-01-29 2000-02-28 オリンパス光学工業株式会社 画像データの符号化装置および符号化方法
US5121191A (en) 1991-03-15 1992-06-09 Aware, Inc. Method and apparatus for coding motion pictures
US5276525A (en) 1991-03-22 1994-01-04 Bell Communications Research, Inc. Two-dimensional block scanning for subband image and video coding
US5262958A (en) 1991-04-05 1993-11-16 Texas Instruments Incorporated Spline-wavelet signal analyzers and methods for processing signals
AU1996292A (en) 1991-05-17 1992-12-30 Analytic Sciences Corporation, The Continuous-tone image compression
US5235434A (en) 1991-06-27 1993-08-10 Polaroid Corporation Method and apparatus for selectively adjusting the brightness of large regions of an image
US5349348A (en) 1991-08-15 1994-09-20 International Business Machines Corporation Multi-mode data stream generator
US5315670A (en) 1991-11-12 1994-05-24 General Electric Company Digital data compression system including zerotree coefficient coding
US5442458A (en) 1991-12-18 1995-08-15 Eastman Kodak Company Method and associated apparatus for encoding bitplanes for improved coding efficiency
GB2262854B (en) 1991-12-24 1995-05-24 Sony Broadcast & Communication Image processing apparatus
US5347479A (en) 1991-12-27 1994-09-13 Nec Corporation Small-size wavelet transform apparatus
CA2088082C (en) 1992-02-07 1999-01-19 John Hartung Dynamic bit allocation for three-dimensional subband video coding
US5321776A (en) 1992-02-26 1994-06-14 General Electric Company Data compression system including successive approximation quantizer
KR0150955B1 (ko) 1992-05-27 1998-10-15 강진구 비트고정을 위한 영상압축방법과 신장방법 및 그 장치
US5511151A (en) 1992-06-10 1996-04-23 Canon Information Systems, Inc. Method and apparatus for unwinding image data
US5379355A (en) 1992-08-24 1995-01-03 Ricoh Corporation Data encoding using one or more adaptive decision trees
US5412741A (en) 1993-01-22 1995-05-02 David Sarnoff Research Center, Inc. Apparatus and method for compressing information
US5414780A (en) 1993-01-27 1995-05-09 Immix Method and apparatus for image data transformation
IL104636A (en) 1993-02-07 1997-06-10 Oli V R Corp Ltd Apparatus and method for encoding and decoding digital signals
US5381145A (en) 1993-02-10 1995-01-10 Ricoh Corporation Method and apparatus for parallel decoding and encoding of data
US5420891A (en) 1993-03-18 1995-05-30 New Jersey Institute Of Technology Multiplierless 2-band perfect reconstruction quadrature mirror filter (PR-QMF) banks
GB2281465B (en) 1993-08-27 1997-06-04 Sony Uk Ltd Image data compression
US5495292A (en) 1993-09-03 1996-02-27 Gte Laboratories Incorporated Inter-frame wavelet transform coder for color video compression
US5453945A (en) 1994-01-13 1995-09-26 Tucker; Michael R. Method for decomposing signals into efficient time-frequency representations for data compression and recognition
JP2673778B2 (ja) * 1994-02-22 1997-11-05 国際電信電話株式会社 動画像の復号化における雑音低減装置
US5541594A (en) 1994-03-28 1996-07-30 Utah State University Foundation Fixed quality source coder with fixed threshold
US5534925A (en) 1994-05-02 1996-07-09 Cognitech Inc. Image compression by optimal reconstruction
CA2172559A1 (en) * 1995-03-24 1996-09-25 Barry H. Schwab Secure digital interactive system for unique product identification and sales
US6141452A (en) * 1996-05-13 2000-10-31 Fujitsu Limited Apparatus for compressing and restoring image data using wavelet transform
US6055340A (en) * 1997-02-28 2000-04-25 Fuji Photo Film Co., Ltd. Method and apparatus for processing digital images to suppress their noise and enhancing their sharpness
US5995644A (en) * 1997-06-30 1999-11-30 Siemens Corporate Research, Inc. Robust and automatic adjustment of display window width and center for MR images
US6707948B1 (en) * 1997-11-17 2004-03-16 The Regents Of The University Of California Image compression for memory-constrained decoders
US6041143A (en) * 1998-04-14 2000-03-21 Teralogic Incorporated Multiresolution compressed image management system and method
US6456340B1 (en) * 1998-08-12 2002-09-24 Pixonics, Llc Apparatus and method for performing image transforms in a digital display system
US6363381B1 (en) * 1998-11-03 2002-03-26 Ricoh Co., Ltd. Compressed document matching
US6785411B1 (en) * 1999-08-05 2004-08-31 Matsushita Electric Industrial Co., Ltd. Image analyzing apparatus and image analyzing method
US7236637B2 (en) * 1999-11-24 2007-06-26 Ge Medical Systems Information Technologies, Inc. Method and apparatus for transmission and display of a compressed digitized image
US20020057385A1 (en) * 2000-07-14 2002-05-16 Mingui Sun Data processing for fast transmission of webpages
US6975753B2 (en) * 2000-09-13 2005-12-13 Canon Kabushiki Kaisha Image processing apparatus, image processing method, program for implementing said method, and storage medium therefor
JP4612782B2 (ja) * 2000-09-27 2011-01-12 キヤノン株式会社 画像処理装置、及びその方法、並びにプログラム、記憶媒体
AUPR110400A0 (en) * 2000-10-30 2000-11-23 Canon Kabushiki Kaisha Image transfer optimisation
US6463181B2 (en) * 2000-12-22 2002-10-08 The United States Of America As Represented By The Secretary Of The Navy Method for optimizing visual display of enhanced digital images
US7024045B2 (en) * 2001-08-21 2006-04-04 Sun Microsystems, Inc. Dynamic bandwidth adaptive image compression/decompression scheme
US6978211B2 (en) * 2003-12-08 2005-12-20 Halliburton Energy Services, Inc. Methods and systems for using wavelet analysis in subterranean applications

Also Published As

Publication number Publication date
US20070047841A1 (en) 2007-03-01
US7095907B1 (en) 2006-08-22
US7474791B2 (en) 2009-01-06
JP2003242497A (ja) 2003-08-29

Similar Documents

Publication Publication Date Title
JP4138459B2 (ja) 低解像度画像作製方法及び装置
JP4510069B2 (ja) 画像処理装置、画像表示装置、画像形成装置、画像処理方法、コンピュータプログラム及び記憶媒体
US8634644B2 (en) System and method for identifying pictures in documents
US7613363B2 (en) Image superresolution through edge extraction and contrast enhancement
USRE43742E1 (en) Method and system for enhanced detail-in-context viewing
JP5063140B2 (ja) 書類オブジェクトを選択する方法、装置及び記憶媒体
JP4427342B2 (ja) 文書分析情報を使用して文書を再フォーマット化する方法及び製造物
US8265415B2 (en) Apparatus and method for transforming image in mobile device
JP4035474B2 (ja) ウェーブレット係数を用いた非線形画像処理方法、装置
US8005319B2 (en) Method for digitally magnifying images
US20040205623A1 (en) Intelligent virtual paging paradigm
JP2006074770A (ja) 多重解像度セグメンテーションおよび充填
US6721458B1 (en) Artifact reduction using adaptive nonlinear filters
US7305618B2 (en) Methods for multimedia content repurposing
US20100086207A1 (en) Content aware image resizing for text and contone images
Li et al. Example based single-frame image super-resolution by support vector regression
Xie et al. Feature dimensionality reduction for example-based image super-resolution
Berkner et al. SmartNails: display-and image-dependent thumbnails
US6927780B2 (en) Fast text/graphics resolution improvement with chain-code table look-up
JP2013008142A (ja) 画像処理装置、画像処理方法及び画像処理プログラム
Bosch et al. Anisotropic representations for superresolution of hyperspectral data
Lin et al. Image super-resolution by estimating the enhancement weight of self example and external missing patches
Safonov et al. Content-Aware Image Resizing
EP1459552A2 (en) Methods for multimedia content repurposing
Singhal et al. Spatially Adaptive Rendering of Images for Display on Mobile Devices

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080520

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080605

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110613

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120613

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130613

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees