JP2003153007A - 画像重要度に基づく画像圧縮制御システム及び方法 - Google Patents

画像重要度に基づく画像圧縮制御システム及び方法

Info

Publication number
JP2003153007A
JP2003153007A JP2002212942A JP2002212942A JP2003153007A JP 2003153007 A JP2003153007 A JP 2003153007A JP 2002212942 A JP2002212942 A JP 2002212942A JP 2002212942 A JP2002212942 A JP 2002212942A JP 2003153007 A JP2003153007 A JP 2003153007A
Authority
JP
Japan
Prior art keywords
image
importance
images
features
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002212942A
Other languages
English (en)
Inventor
Andreas E Savakis
イー サヴァキス アンドレア
Majid Rabbani
ラッバーニ マジド
Stephen P Etz
ポール エッツ スティーヴン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JP2003153007A publication Critical patent/JP2003153007A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/162Detection; Localisation; Normalisation using pixel segmentation or colour matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Abstract

(57)【要約】 【課題】 本発明は、画像を格付けし、格付けの高い画
像の品質がより高品質で維持されるように、各画像に適
用される圧縮量を変えるため格付けの結果を使用するデ
ジタル画像処理技術の提供を目的とする。 【解決手段】 本発明の方法は、画像重要度に基づいて
クラスタ内の画像を格付けすることによって画像の圧縮
を自動的に変更する。格付け処理は、各画像及び画像の
内容の一つ以上の特徴と関連した一つ以上の量を計算す
る。一つ以上の特徴には画像の内容が含まれる。本発明
は、一人以上の観察者の意見に基づいて訓練された推論
アルゴリズムを用いてこの量を処理し、格付けを作成す
るためこの量が画像に適用し、格付けに基づいて画像を
可変的に圧縮する。格付けが低い画像は格付けが高い画
像よりも圧縮量が多い。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般的に画像処理
の分野に係り、特に、画像評価及び画像理解の分野に関
する。
【0002】
【従来の技術】画像評価及び画像理解が扱う問題は、知
的能力を備えた人間は簡単に解決するが、完全に自動化
されたコンピュータシステムによって解決するとことは
困難であるような問題である。画像理解問題は、主被写
体の検出、シーン分類、空及び草の検出、人物の検出、
方向の自動検出などを含む写真アプリケーションにおい
て重要であると考えられる。写真のグループを処理する
種々のアプリケーションの場合、画像を論理的順序で格
付け(ランク付け)することが重要であり、これによ
り、画像はその順序に従って処理され、取り扱われ得
る。関心のある写真アプリケーションは、デジタル画像
のグループが自動的にデジタル写真アルバムに編集され
る自動アルバム化処理である。自動アルバム化処理は、
画像を別々のイベントに分類し、次に、可能であれば、
各イベントをある種の論理的順序で並べる。この順序
は、画像の相対的な内容に関して、すなわち、ある種の
画像が他の画像よりも優先される可能性があるという確
信に基づく、少なくともある程度の注目度を意味する。
【0003】典型的に、画像のグループを固定記憶装置
空間に保存するデジタル映像システムは、グループ内の
全ての画像に同じレベルの圧縮を適用する。このような
状況は、デジタルカメラ、可搬型(着脱式)ディスクな
どに蓄積された画像の場合に生じる。しかし、このアプ
ローチは、画像間の重要度又は注目度(アピール)の差
を考慮しない。屡々、注目度の高い画像の視覚的品質を
維持することが望ましく、注目度の低い画像の視覚的品
質を低下させることは許容される。したがって、画像を
相対的な注目度に関して格付けし、注目度の高い画像の
品質がより高品質で維持されるように、各画像に適用さ
れる圧縮量を変えるため格付けの結果を使用するデジタ
ルシステムを獲得することが望ましい。
【0004】画像評価問題の性質に起因して、すなわ
ち、自動システムは、高レベルの知的な人の(理解)プ
ロセスを表わす結果を生成することが期待されるので、
評価システムの設計は困難ではあるが興味深い仕事であ
る。特定の視覚的印象に対する文書を作成若しくは編集
することを目的として、テキスト及び図形データの心理
的効果の評価の研究が取り組まれてきた(たとえば、米
国特許第5,875,265号明細書及び米国特許第5,424,945号
明細書を参照せよ)。
【0005】
【発明が解決しようとする課題】米国特許第5,875,265
号では、システムは、視覚的特徴のオペレータが使用す
るため表示される感覚的(微妙な)言語へ対応関係を定
めるため、場合によってはオペレータの補助の下で、画
像を解析する。このシステムの難しさは、視覚的特徴が
主として低レベルの特徴、すなわち、必ずしも画像内容
とは関連しない色及びテクスチャに基づくことであり、
かつ、言語記述は画像の相対的な格付けに使用すること
が困難である。米国特許第5,424,945号は、文書中のテ
キスト及び図形の心理的効果を評価するシステムを開示
する。この米国特許第5,424,945号の欠点は、特定の内
容に関してではなく、文書の全体的な視覚的印象を評価
する点であり、そのため、相対的な格付けの開発のため
の有用性が低減している。これらのシステムは、複雑で
あり、かつ、心理的効果の識別へ向けられている上に、
既存の画像の評価及び利用ではなく、知覚的(認知)印
象の解析及び作成に集中している。
【0006】本発明は、上記の問題点の解決を目的とす
る。
【0007】
【課題を解決するための手段】一実施例によれば、グル
ープ内の画像に対する圧縮量は、圧縮される画像の画像
重要度及び/又は画像注目度に関する値を表す品質係数
を用いて制御される。他の一実施例によれば、圧縮は視
覚的品質に基づいて制御され、更に別の一実施例によれ
ば、圧縮は出力ファイルサイズに基づいて制御される。
何れの実施例の場合も、圧縮レベルを決定する画像パラ
メータは画像重要度及び/又は画像注目度である。
【0008】画像重要度又は画像注目度の判定は、すな
わち、画像の重要性、関心若しくは魅力の程度の判定
は、ある種の特徴についての画像の評価に基づいて行わ
れ、各デジタル画像の一つ以上の特徴と関連付けられた
一つ以上の量が計算され、非筒以上の量は個別のデジタ
ル画像の内容に属する一つ以上の特徴を含む。この量
は、一人以上の観察者の意見に基づいて訓練された推論
アルゴリズムを用いて処理され、この推論アルゴリズム
から各画像を評価する出力が得られる。
【0009】本発明の独立した局面では、デジタル画像
の内容に属する特徴は、少なくとも人物に関連した特徴
と被写体に関連した特徴のうちの一方を含む。また、色
彩或いは鮮明度のようなデジタル画像の一つ以上の客観
的な指標(測度)に関する補助的な量が計算される。推
論アルゴリズムの結果は、画像の集合(グループ)内の
各画像の質を格付けするため処理される。各画像に適用
される圧縮量は、画像自体で決められるか、或いは、デ
ジタル画像のグループに対して決められるような画像の
重要性、関心若しくは魅力の程度に基づいて変更され
る。
【0010】本発明は、画像重要度に基づいてクラスタ
内の画像を格付けすることによって画像の圧縮を自動的
に変更する。格付け処理は、各画像及び画像の内容の一
つ以上の特徴と関連した一つ以上の量を計算する。本発
明は、一人以上の観察者の意見に基づいて訓練された推
論アルゴリズムを用いて量を処理し、格付けを作成する
ためこの量を画像に適用する。本発明は、格付けに基づ
いて画像を可変的に圧縮し、格付けが低い画像は格付け
が高い画像よりも圧縮される量(度合い)が大きい。解
析された特徴は、人物に関連した特徴及び被写体に関連
した特徴を含む。客観的特徴は、色彩、鮮明度、色内容
に関する代表量、及び、画像アスペクト形式の特異性な
どを含み得る。推論アルゴリズムは、候補画像のグラン
ドトゥルース調査から訓練され、ベイズネットワークで
ある。画像の内容は、画像重要度及び/又は画像注目度
に関連した値を表わす複数の係数を用いて制御され、画
像重要度及び/又は画像注目度に関連した値を表す出力
ファイルサイズに基づいて制御される。画像の内容は、
更に、出力画像の視覚的品質を用いて制御される。
【0011】本発明の一つの効果は、人が介入しなくて
も一つ以上の画像の評価を実行し得ることである。画像
のグループの圧縮のような画像のグループを取り扱う種
々のアプリケーションにおいて、アルゴリズム的評価
は、画像を自動的に格付けすることが可能であり、画像
は相対的な重要性に応じて効率的に圧縮される。
【0012】本発明の上記並びにその他の局面、目的、
特徴及び効果は、以下の好ましい実施例の詳細な説明、
請求項に記載された事項、及び、添付図面によって、よ
り明瞭に理解され認識されるであろう。
【0013】
【発明の実施の形態】以下の記述では、本発明の好まし
い一実施例による方法を説明する。本実施例による方法
は、ソフトウェアプログラムとして実現可能である。当
業者は、このようなソフトウェアの均等物をハードウェ
アの形で構成できることを容易に認めるであろう。画像
処理アルゴリズム及び方法は周知であるので、以下の記
述は、特に、本発明による方法の一部を形成するアルゴ
リズム及びシステム、並びに、本発明による方法と非常
に直接的に協働するアルゴリズム及び方法に向けられ
る。このようなアルゴリズム及びシステム、並びに、そ
れらに関連した画像信号を生成し、或いは、画像信号を
処理するハードウェア及び/又はソフトウェアのその他
の局面は、特に図示、或いは、説明されていないが、こ
のようなシステム、アルゴリズム、コンポーネント、及
びそれらの要素は周知である。以下の記述において、上
記の説明を前提とすることにより、全てのソフトウェア
をコンピュータプログラムとして実現することは従来通
りであり、常套的な技術である。
【0014】さらに、実施例で使用されるようなコンピ
ュータプログラムは、コンピュータ読取可能な記録媒体
に保存される。コンピュータ読取可能な記録媒体は、た
とえば、磁気ディスク(たとえば、フレキシブルディス
ク)、若しくは、時期テープのような磁気記憶媒体、光
ディスク、光テープ、若しくは、機械読取可能なバーコ
ードのような光学記憶媒体、ランダムアクセスメモリ
(RAM)、若しくは、読出し専用メモリ(ROM)の
ような固体電子記憶装置、又は、コンピュータプログラ
ムを格納するため利用されるその他の物理装置若しくは
媒体を含む。
【0015】画像のグループを取り扱う多様なアプリケ
ーションにおいて、相対的な値、及び/又は、本質的な
値に関して画像を格付けすることが重要であり、これに
より、画像は、これらの値に応じて処理され若しくは取
り扱われる。上述のように、現在、関心のある写真アプ
リケーションは、デジタル画像のグループが自動的にデ
ジタル写真アルバムに編成される自動アルバム処理であ
る。自動アルバム処理は、画像を別個のイベントにクラ
スタリングし、各イベントをある種の論理的な順序に並
べる。この論理的な順序は、画像注目度及び画像重要度
の2種類の関連した画像の評価に基づいて行われる。画
像注目度は、個々の画像に固有の重要性、関心若しくは
魅力の程度を表わし、これに対し、画像重要度は、イベ
ント若しくはグループ中の各画像の他の画像に対する相
対的な重要性、関心若しくは魅力を表わす。
【0016】評価が獲得されると、画像のグループ内で
最重要画像、たとえば、ページレイアウト内で最も注意
を惹くに違いない画像、を選択することが望ましい。し
たがって、画像評価アルゴリズムは、自動画像補正アー
キテクチャに巧く適合する。評価アルゴリズムは、各イ
ベントの画像に作用し、各画像に評価値(たとえば、重
要度値及び/又は注目度値)を割り当てることが期待さ
れる。評価値は、特定のグループ内のあらゆる画像と関
連付けられたメタデータであるとみなされ、他のアルゴ
リズムによって利用される。このような提案システムに
おいて、ページレイアウトアルゴリズムは、入力とし
て、各イベント内の全画像の相対的な評価値を採用す
る。
【0017】しかし、提案システムでは、システムアー
キテクチャのタイプと、評価用の実効的な特徴の選択に
関して、多数の率直な疑問が生じる。他の画像理解問題
への適用に成功したアーキテクチャは、特徴抽出段と、
引き続く分類段とに基づいている。特徴抽出に関して、
特徴の集合を選択することが必要である。このため、二
つのアプローチが考えられる。1番目のアプローチは、
直観的に画像評価値に何らかの関連性があると思われる
特徴を選択する。2番目のアプローチは、制御された実
験によって獲得された経験に基づいて特徴を選択する。
このような実験は公表されていないので、意味のある特
徴を指定するであろうデータを獲得するためグランドト
ゥルース調査が行われた。グランドトゥルース調査の結
果は、特徴選択と、分類器の訓練とに使用される。
【0018】図1を参照するに、重要度値を計算する画
像重要度ネットワーク10は、特徴抽出段12と分類段
14の2段により構成される。特徴抽出段12は、多数
のアルゴリズムを利用する。各アルゴリズムは、ある種
の画像特徴特性値を測定するよう設計され、特徴の定量
的指標がアルゴリズムの出力の値によって表現される。
特徴抽出段12の出力は、ある種の特徴の存在(若しく
は不在)の統計的証拠を表現し、この出力は、次に、分
類段14によって、重要度値を計算するため統合され
る。重要度値は、たとえば、0から100まで変化し、
処理された画像が重要度画像である確率(確からしさ)
又は確信度を示す。重要度が、図4に示されるように別
個の画像重要度ネットワーク10.1、10.
2、...、10.Nにおいて画像のグループに対して
計算された後、重要度値は比較段16で比較され、夫々
の正規化段16.1、16.2、...、16.Nで正
規化される。最高の画像重要度値をもつ画像は、グルー
プの重要度画像として選択される。
【0019】特徴の集合は、観察者の優先傾向のグラン
ドトゥルース調査に基づいて特徴抽出段12のために選
択された。グランドトゥルース調査によって、重要度画
像の選択のために重要である特徴は、鮮明度、コントラ
スト、フィルム粒子、及び、露出のような従来の画質測
定基準と強い関連性がない、ということが判明した。但
し、これらの従来の画質測定手段のうちの一つ以上は、
評価値の計算の際に依然として有用である。選択された
特徴は、一般的に、(a)人物に関連した特徴、(b)
主被写体に関連した特徴、及び(c)画像の客観的指標
に関連した特徴の3種類のカテゴリーに分割される。図
1を参照するに、人物に関連した特徴は、肌面積検出器
20と、クローズアップ検出器22と、人物検出器24
とによって抽出される。入力画像iは、典型的に、人物
関連特徴抽出器20、22及び24による処理に適した
中間値を生成するため、肌検出器26及び顔検出器28
によって処理される。主被写体に関連した特徴は、主被
写体検出器34からの出力に基づいて、構造検出器30
及び被写体寸法検出器32によって抽出される。構図検
出器30は、図3に示されるように、主被写体分散アル
ゴリズム30.1、主被写体中心性アルゴリズム30.
2、及び、主被写体コンパクト性アルゴリズム30.3
の幾つかの構図関連主被写体アルゴリズムにより構成さ
れる。主被写体データは、クラスタリング段31でクラ
スタ化され、構図関連アルゴリズム30.2及び30.
3、並びに、被写体寸法アルゴリズム32へ供給され
る。画像の客観的指標に関連した特徴は、鮮明度検出器
36、色彩検出器38、及び、独自フォーマット検出器
40によって抽出される。さらに、画像の色内容が画像
のグループに対してどの程度代表的であるかに関する客
観的指標は、代表色内容検出器42によって抽出され
る。
【0020】図1に示された特徴集合は画像重要度を表
わす値を計算するため使用され、画像重要度を表わす値
はグループ内において画像の他の画像に対する相対的な
重要性、関心若しくは魅力の程度として定義される。各
画像はグループ内の他の画像に対して評価する必要があ
るので、画像重要度計算は、図4に示されるように画像
重要度ネットワーク10.1、10.2、...、1
0.Nのネットワークの形で実現され、画像重要度ネッ
トワークは、対応した画像重要度値に関して画像に得点
を付与する。実際には、一つの画像重要度ネットワーク
10が設けられ、画像の系列の画像重要度を定めるため
繰り返し用いられる。この場合、順次に取得された結果
は、比較器16へ入力するため、中間記憶装置(図示せ
ず)に保存される。図2に示された特徴集合は、図1に
示された特徴集合の部分集合であり、画像注目度を表わ
す値を計算するため使用される。画像注目度は、絶対的
な意味で、すなわち、他の画像との対比を行うことな
く、画像の重要性、関心若しくは魅力の本質的な程度と
して定義される。このため、図2に示された特徴は、こ
れらの特徴がその画像だけに基づいて画像を評価してい
る限り、独立顕著性のある特徴であると呼ばれる。これ
に対し、二つの補助的な特徴、すなわち、独自フォーマ
ット特徴及び代表色特徴が図1に示されている。これら
の特徴は、他の画像と関連付ける必要がある指標である
限り、相対顕著性のある特徴であると呼ばれる。しか
し、これらの相対顕著性のある特徴は、独立顕著性のあ
る特徴だけから重要度の十分な指標が得られる限りにお
いては、随意的な特徴である。したがって、注目度及び
重要度の両方の評価は、独立顕著性のある特徴を必要と
し、重要度の評価だけが相対顕著性のある特徴を必要と
する。
【0021】図1及び2による特徴集合の抽出は、後述
のように、対応した特徴量の計算を必要とする。
【0022】[客観的特徴]客観的特徴は、他のタイプ
の特徴と比較して最も計算が簡単であり、かつ、最も矛
盾のない結果を与える。客観的特徴を計算するための方
法は既に利用可能であり、映像科学の殆どの技術は、客
観的特徴の指標に基づいている。多くの客観的特徴を計
算することが潜在的に可能であるが、画像重要度と画像
注目度(図1及び図2)の両方の目的のためには色彩
(カラフルネス)及び鮮明度だけが考慮され、さらに、
画像重要度(図1)のためには、独自フォーマット及び
代表色が追加的に考慮される。コントラスト及びノイズ
などの他の客観的指標は、ある種の状況において有用で
あるとされ、本発明の範囲に含まれることが意図され
る。
【0023】[色彩]色彩検出器38は、色彩の豊富な
ピクチャが様々な色相で高い飽和度を表示する色を有す
るという観察に基づいて、色彩の定量的な指標を与え
る。これは、様々な色相について高い飽和度の色の存在
を調べることによってグランドトゥルース調査で決定さ
れた。画像データは、sRGB色空間の画像データであ
ると仮定した。特に、図6に示されるように、色彩検出
器38は、色彩を計算するために以下の手順を実施す
る。最初に、ステップ60において、入力画像値iは輝
度/クロミナンス空間へ変換される。このような多くの
変換が当業者には公知であり、本発明と組み合わせてう
まく使用される。望ましい変換は、以下の式、
【0024】
【数1】 に従って実行され、式中、中間色(Neutral)は輝度の
指標であり、緑−マゼンタ(Green−Magenta)と照度
(Illumination)はクロミナンスの指標である。ステッ
プ62において、クロミナンス平面(照度、緑−マゼン
タ)は、図7に示されるような角度欄(ビン)と称され
る12の色度平面ウェッジへ分割され量子化される。次
に、ステップ64において、各画素は、そのクロミナン
ス成分が角度欄の境界内に収まる場合、その角度欄のう
ちの一つと関連付けられる。飽和度のレベル(原点から
の距離)は、ステップ66において各角度欄の各画素に
対して計算される。ステップ68において各角度欄を占
める高い飽和度の画素の数が測定される。ここで、高い
飽和度の画素とはクロミナンス平面における原点からの
距離が一定の閾値T(たとえば、T=0.33)を
超える画素である。各角度欄について、ステップ70に
おいて、高い飽和度の画素の数がある閾値T(たとえ
ば、T=250画素)を超える場合、その欄は有効で
あると決定される。ステップ72において、色彩(Colo
rfulness)は以下の式、
【0025】
【数2】 に従って計算される。尚、このカラフルさの定義によれ
ば、12の欄の中の10の欄が使用されていると、色彩
は1.0であり、画像は最もカラフルであるとされる。
【0026】[鮮明度]鮮明度検出器36は、画像中の
鮮明度特徴を見つけるために以下の手順を実施する。 (a)画像は境界線に沿って20%の水準で切り取ら
れ、緑チャネルを抽出することによりグレースケールへ
変換される。 (b)画像のエッジは、ノイズを減少させるために3×
3の平均化フィルタを適用した後にSobel演算子を
用いて緑チャネル中で検出される。 (c)エッジヒストグラムが形成され、エッジヒストグ
ラムの90番目の百分位数を超えるエッジが最も強いエ
ッジを含む領域であると同定される。 (d)最も強いエッジの領域はメジアンフィルタリング
によって洗練され、最も強いエッジの統計値が計算され
る。 (e)最も強いエッジの平均は鮮明度の推定値を与え
る。
【0027】鮮明度の検出のために使用される方法の更
に詳細については、ここに参考のため引用された、本願
と同一出願人による1999年3月23日に出願された米国特
許出願第09/274,645号、発明者Andreas Savakis及びAl
exander Loui、発明の名称"AMethod for Automatically
Detecting Digital Images that are Undesirablefor
Placing in Albums"に記載されている。
【0028】[フォーマット独自性]グランドトゥルー
ス調査の参加者は、APSの「パノラマ」モードで撮影
された写真はかなり重要度画像に値する、と指摘した。
グランドトゥルースデータの予備分析は、その写真がグ
ループ中のただ一つのパノラマ写真であれば、重要度画
像として選択される可能性が高くなることを示した。相
対的な特徴である「フォーマット独自性」はこの性質を
表わす。
【0029】独自フォーマット検出器40は、グループ
中の各画像iについて以下のアルゴリズム、
【0030】
【数3】 を実施する。但し、フォーマットfは画像の長い画素寸
法lと短い画素寸法s に基づくものである。フォー
マット独自性Uは、
【0031】
【数4】 と表わされる。
【0032】[代表色]代表色検出器42は、画像の色
をどれだけ象徴的であるかを決定するために以下の手順
を行う。
【0033】1.各画像iについて、(RGB又は輝度
/クロミナンス空間中で)カラーヒストグラムh
(R,G,B)を計算する。
【0034】2.以下の式、
【0035】
【数5】 に従って全ての画像ヒストグラムの平均を取ることによ
り、グループについての平均カラーヒストグラムを見つ
ける。
【0036】3.各画像iについて、画像のヒストグラ
ムと平均カラーヒストグラムとの間の距離(ユークリッ
ド距離又はヒストグラム交差距離)を、以下の式、
【0037】
【数6】 に従って計算する。
【0038】4.以下の式、
【0039】
【数7】 に従って、手順3において計算された距離の最大を見つ
ける。
【0040】5.以下の式、
【0041】
【数8】 に従って、各距離を最大距離(0乃至1の範囲で可変)
で割り算することによって代表指標rを得る。
【0042】[人物関連特徴]人物関連特徴は、画像重
要度を決定するときに重要であるが、たとえば、笑って
いる人物、カメラの方に向いている人物等といった人物
に関連する多くの明確な属性は、計算するのが困難であ
る。肌検出方法は、人物が存在するか否か、肌部分の面
積の大きさ、及び、クローズアップの量などの幾つかの
人物関連特徴を計算する。
【0043】[肌及び顔の検出]肌検出器26によって
用いられる肌検出方法、及び、顔検出器28によって用
いられる顔検出方法は、ここに参考のため引用された、
本願と同一出願人による、1998年7月9日に発明者H. C.
Lee及びH. Nicponskiの名前で出願された、発明の名称
が"A Method for Detecting Human Faces in Digitized
Images"である米国特許出願第09/112,661号明細書に
開示される方法に基づく。
【0044】図8を参照するに、米国特許出願第09/11
2,661号に開示された方法が概略的に示される。入力画
像は、ステップS102において、優勢な全体照明を補
償するため色バランス調整される。色バランス調整は、
(r,g,b)値から(L,s,t)値への変換を含
む。(L,s,t)空間中、L軸は色の明るさを表わ
し、s軸及びt軸はクロマ軸を表わす。s成分は、昼光
からタングステン光まで、青から赤までの光源の変化を
近似的に表わす。t成分は、緑とマゼンタの間の軸を表
わす。中間色への平均化のような簡単な方法を含む多数
の周知の色バランスアルゴリズムをこの手順に使用する
ことができる。次に、ステップS104において、kモ
ードクラスタ化アルゴリズムが色セグメント化のために
使用される。このアルゴリズムは、ここに参考のため引
用された米国特許第5,418,895号明細書に記載されてい
る。基本的に、(L,s,t)空間中の3次元色ヒスト
グラムは、入力カラー画像から形成され、クラスタ化ア
ルゴリズムによって処理される。この手順の結果によ
り、連結された各領域にユニークなラベルの付けられた
領域マップが得られる。各領域について、平均化された
ルミナンス及び色度がステップS106で計算される。
これらの特徴は、条件付き確率及び適応閾値処理に基づ
いて、可能な肌領域(候補肌領域)を予測するために使
用される。ステップS108において、各肌領域に最も
よい楕円を当てはめることにより、各肌領域のスケール
及び平面内の回転ポーズの推定値が得られる。これらの
推定値の近傍でスケール及び平面内の回転ポーズの範囲
を用いることにより、ステップS110において、仮の
顔特徴を同定するために、一連の線形フィルタリング手
順が各顔領域に対して適用される。ステップS112に
おいて、領域が実際に顔特徴を表す尤度と、領域が表す
顔特徴のタイプとを予測するために多数の確率計量が用
いられる。
【0045】先行するスクリーニング手順を通った特徴
は、ステップS114において、予想顔についての初期
特徴として使用される。投影幾何学を用いることによ
り、3つの初期特徴の同定は、頭部の姿勢の候補範囲を
定義する。顔の姿勢の各候補は、包括的な3次元の頭部
モデル及び顔特徴の位置の変化の範囲と共に、残りの顔
特徴の位置を予測するために使用される。予測された特
徴の位置が見つかるかどうかを調べるために、候補顔特
徴のリストが探索される。候補顔特徴の位置及び向きが
予測された位置及び向きに近ければ、その特徴の有効性
の確率的推定値に影響が及ぶ。
【0046】ステップS116において、顔の存在を示
す累積された証拠を理解するために、頭部のベイズネッ
トワーク確率モデルが使用される。ネットワークの事前
確率は、様々な向きとスケールの頭部が含まれる大量の
学習画像の組から抽出される。ネットワークは、候補顔
の予想された特徴から始まり、ネットワークの推定確率
は、計算された計量とテンプレートに対する空間的な一
致度に基づく。次に、ネットワークは、これらの初期条
件から始めて、顔の存在の確率の大域的な推定値へ収束
するまで実行される。この確率は、固い閾値と比較さ
れ、或いは、2値評価が必要でなければ確率形式のまま
にされる。この肌及び顔検出方法の更なる詳細は、ここ
に参考のため引用された米国特許出願第09/112,661号明
細書に記載されている。
【0047】[肌面積]写真中の肌/顔面積の割合は、
その割合自体を特徴として得るために、或いは、人物検
出及びクローズアップ検出の予備段階として、肌面積検
出器20によって計算される。そのため、肌面積検出器
20の出力は、分類段14に接続されると共に、クロー
ズアップ検出器22及び人物検出器24へ接続される。
肌面積は、0乃至1の範囲の連続的な変数であり、人物
関連特徴の数に相関する。たとえば、等距離から撮影さ
れた写真に関して、肌面積が増加するということは、写
真に写っている人物が増えることを意味し、「集合写
真」であるという明確な標識と相関する。或いは、2枚
の写真に同数の人物が写っている場合、肌面積が増加す
ることは倍率が大きくなることを示し、これは「クロー
ズアップ」という明確な属性と相関する。肌面積の増加
に関するその他の説明として、被写体の配置を理由に挙
げることも可能である。
【0048】[クローズアップ]クローズアップ検出器
22は、クローズアップを判定するために以下の手段を
使用する。 (a)肌検出が実行され、結果として得られたマップが
(境界線から25%離れた)中央領域で調べられる。 (b)クローズアップは、画像の中央部分における肌面
積の割合として決められる。
【0049】ある種の場合に、肌検出よりも顔検出の方
がクローズアップの判定に適している。
【0050】[人物の存否]人物の存否は、画像中にか
なりの量の肌面積が存在する場合には、人物検出器24
によって検出される。画像中の肌画素の割合が計算さ
れ、肌の割合が画素数の閾値T(たとえば、T=2
0画素)を超えるときに人物が存在すると想定される。
人物の存否は、人物が存在する場合に1、存在しない場
合に0を示す2進数で表される2値特徴である。
【0051】[構図特徴]良い構図は画像重要度の非常
に重要な積極的な属性であり、悪い構図は一般的には消
極的な属性である。画像の構図の自動評価は非常に困難
であり、場合によっては主観的である。良い構図は、三
分の一の法則といった多数の一般的な周知の法則に従う
が、このような規則は、しばしば撮影者の感覚を表現す
るため守られない。
【0052】[主被写体検出]主被写体検出器34によ
って用いられる検出器は、本願と同一出願人による、19
98年12月31日に出願された、発明者がJ. Luo、S. Etz及
びA. Singhalであり、発明の名称が"Method for Automa
tic Determination of Main Subjects in Consumer Ima
ges"である、米国特許出願第09/223,860号明細書に開示
されている。図9には、米国特許出願第09/223,860号に
開示された主被写体検出方法を概略的に表わすブロック
図が示される。まず、ステップS200において、自然
のシーンの入力画像が撮影され、デジタル形式で記憶さ
れる。次に、ステップS202において、画像は均質な
性質の幾つかの領域へセグメント化される。次に、ステ
ップS204において、領域セグメントは、目的のない
無目的知覚グループ化を通じて類似性指標に基づいて、
より大きい領域へグループ化され、ステップS206に
おいて、目的のあるグループ化(合目的グループ化は特
定の物体に関連する)を通じて知覚的に一貫した物体に
対応するより大きい領域へ更にグループ化される。ステ
ップS208において、領域は、構造的顕著性特徴と意
味論的顕著性特徴の二つの独立した相補的な顕著性特徴
について評価される。ステップS208aにおいて、低
レベル早期視覚特徴の組及び幾何学的特徴の組を含む構
造的顕著性特徴が抽出され、これらの特徴は、独立顕著
性特徴の組及び相対顕著性特徴の組を生成するため更に
処理される。ステップS208bにおいて、前景(例え
ば人物)又は背景(例えば空、草)のいずれかの一部で
ある可能性の高いキー被写体物の形式で意味論的顕著性
特徴が検出され、意味論的な手がかり及びシーン前後関
係の手がかりを与える。ステップ210において、両方
のタイプの証拠がベイズネットに基づく推論エンジンを
用いて統合され、ステップ212で主被写体の最終確信
度マップが得られる。
【0053】画像の意味論的な解釈のためには、単一の
規準では明らかに不十分である。人間の脳は、先験的な
知識と、実世界の被写体及びシナリオについての膨大な
記憶とを有しており、シーン中の興味深い被写体又は主
な被写体を評価するために異なる主観的な規準を組み合
わせる。拡張的な特徴リストに含まれる特徴、すなわ
ち、場所、寸法、明るさ、色彩、テクスチャ十分性、キ
ー被写体物、形状、対称性、空間的関係(包囲性/オク
ルージョン性)、境界性、屋内/屋外、向き、(適用可
能であれば)深度、及び(ビデオシーケンスについて適
用可能であれば)動きは、主被写体検出のような多少と
も漠然としたタスクを実行するときに人間の脳に影響を
与えると考えられる。
【0054】低レベル早期視覚特徴には、色、明るさ、
及びテクスチャが含まれる。幾何学的特徴には、場所
(中心性)、空間的関係(境界性、隣接性、包囲性、オ
クルージョン性)、寸法、形状、及び対称性が含まれ
る。意味論的特徴には、肌、顔、空、草、及び、他の緑
の草木が含まれる。当業者は、本発明の範囲を逸脱する
ことなく、より多くの特徴を定義することが可能であ
る。主被写体検出アルゴリズムの更なる詳細は、ここに
参考のため引用された米国特許出願第09/223,860号明細
書に記載されている。
【0055】上述の主被写体検出アルゴリズムは計算集
約的なアルゴリズムであり、被写体関連特徴のより小さ
い組に基づいて被写体検出を行なう他のアルゴリズムが
使用される。ここで考えられる全ての構図指標は、主被
写体確信度マップに関する指標であるため、最も計算的
に効率的な局面、たとえば、殆ど「中心性」指標に関係
する局面にシステムを集中させることが可能である。こ
れらの局面は、主被写体の判定の際に考慮されるので、
ある程度の精度を犠牲にして、全体の計算上の複雑さを
軽減する。このように、アルゴリズムを再び学習させる
ことなく、特徴を排除できることは、主被写体検出アル
ゴリズムにおいて使用されるベイズネットワークの有用
な性質である。第2に、主被写体検出器50に供給され
る画像は正しい面が上向きであることがわかっているな
らば有利である。シーン中の領域の空間的な場所と関連
した被写体関連特徴は、この知識を反映するよう変更さ
れる。たとば、主被写体検出器50は、シーンの向きが
わからない場合、主被写体領域の中心が加重された分布
を想定するが、向きがわからない場合、底辺の中心が加
重された分布を想定する。
【0056】図3を参照するに、主被写体検出器50に
おいて主被写体確信度マップが計算された後、主被写体
確信度マップは、クラスタ化段31において、強度値の
k平均クラスタ化を用いて三つの領域へ分割される。三
つの領域は、主被写体の一部である可能性が高い画素、
主被写体の一部である可能性が低い画素、及び、中間画
素に対応する。量子化されたマップに基づいて、以下図
5A乃至図5Dを参照して説明されるように、主被写体
の寸法、中心性、コンパクト性、関心(分散)の特徴が
計算される。
【0057】[主被写体分散]写真の内容を特徴付ける
ための一つの方法は、写真の興味深さ、すなわち、関心
度を示すことである。重要度画像選択のため、以下の特
徴を備えた画像は関心度が高い画像であると考えられ
る。 ・主被写体は、フレーム内での配置によって関心度が高
くなる。 ・主被写体は、写真のかなり大きい面積を構成するが、
フレーム全体を構成するものではない。 ・背景は、主被写体から注意を逸らす孤立した物体を含
まない。
【0058】各画像の関心度の推定値は、主被写体マッ
プ中の分散を推定することによって計算される。この特
徴は、主に反例としての価値があり、すなわち、関心度
の高くない画像は重要度画像とするべきではない。特
に、図5Aに示されるように、主被写体分散検出器3
0.1は主被写体分散を計算するために以下の手順を行
う。最初に、ステップS10において、全ての被写体確
信度マップ値の統計的な分散vが計算される。ステップ
S12において、主被写体分散特徴yは、以下の式、 y=min(1,2.5*sqrt(v)/127.
5) によって計算される。
【0059】[主被写体中心性]主被写体の中心性は、
量子化された主被写体確信度マップにおける画像中心と
高い確率(或いは中間の確率)の領域の重心との間の距
離として計算される。特に、図5Bに示されるように、
主被写体中心性検出器30.2は、主被写体中心性を計
算するため以下の手順を実行する。最初に、ステップS
20において、最高値クラスタの重心の画素座標が測位
される。ステップS22において、画像中心から重心ま
でのユークリッド距離jが計算される。ステップS24
において、ユークリッド距離jを画像の短辺に沿った画
素の数で除算することにより、正規化された距離kが計
算される。ステップS26において、主被写体中心性特
徴mは、以下の式、 m=min(k,l) に従って計算される。
【0060】[主被写体寸法]主被写体の寸法は、量子
化された主被写体確信度マップにおける高い確率(並び
に、随意的には中間の確率)の領域の寸法によって決定
される。主被写体寸法は、高い確率(並びに、随意的に
は中間の確率)の領域によって占められる中央面積(境
界から25%)の割合として表現される。特に、図5C
に示されるように、主被写体寸法検出器32は、主被写
体の寸法を計算するため以下の手順を行なう。最初に、
ステップS30において、最高値クラスタと画像面積の
矩形状中心部1/4が交差する部分の画素数fが計数さ
れる。ステップS32において、主被写体寸法特徴g
は、以下の式、 g=f/N に従って計算される。但しNは画素の総数を表す。
【0061】[主被写体コンパクト性]主被写体のコン
パクト性は、量子化された主被写体確信度マップにおけ
る高い確率(並びに、随意的には中間の確率)の領域に
対する境界矩形を計算し、次に、主被写体によって占領
された境界矩形の割合を調べることによって推定され
る。特に、図5Dに示されるように、主被写体コンパク
ト性検出器30.3は、主被写体のコンパクト性を計算
するため以下の手順を行なう。最初に、ステップS40
において、最高値クラスタ中の画素数aが計数される。
ステップS42において、最高値クラスタ中の全画素を
含む最小ボックス(境界ボックス)が計算され、ステッ
プS44において、境界ボックスの面積bが画素単位で
計算される。ステップS46において、主被写体のコン
パクト性特徴eは、以下の式、 e=min(1,max(0,2*(a/b−0.
2))) によって計算される。但し、eは0乃至1(0及び1を
含む)の値となる。
【0062】[分類段階]上述のアルゴリズムによって
生成される特徴量は、分類段14に適用される。分類段
14は、望ましくは、独立顕著性特徴及び/又は相対顕
著性特徴を入力として受け入れ、画像評価(重要度及び
注目度)値を発生するよう学習される推論エンジンであ
る。異なる証拠は、人間の観察者による実際の画像の評
価であるグランドトゥルース調査の結果から得られた知
識に従って、相互に競合し、或いは、相互に補強する。
競合及び補強は、推論エンジンの推論ネットワークによ
って解決される。好適な推論エンジンはベイズネットワ
ークである。
【0063】ベイズネット(たとえば、J. Pearl, Prob
abilistic Reasoning in Intelligent Systems, San Fr
ancisco, CA: Morgan Kaufmann, 1988を参照)は、グラ
フ内の様々なエンティティ間の因果関係を表現する非循
環性の有向グラフである。リンクの向きはグラフ中の様
々なエンティティ間の因果関係を表わし、リンクの方向
が因果を表わす。評価は、様々なエンティティ間の結合
確率分布関数(PDF)についての知識に基づいて行な
われる。ベイズネットの利点には、不確実性の特徴付け
が明示的であること、計算が効率的であること、構築及
び保守が容易であること、学習が迅速であること、及
び、ネットワーク構造及びそのパラメータの変化に対し
素早く適応することが含まれる。ベイズネットは以下の
4つの構成要素からなる。 ・Priors:ベイズネット中の様々なノードについ
ての最初の確信度。・条件付き確率行列(CPM):ベ
イズネット中の2つの連結されたノード間の関係につい
ての専門知識。 ・証拠:ベイズネットに入力される特徴検出器からの観
察結果。 ・Posteriors:ベイズネットを通じて証拠が
伝播された後の最終的な計算された確信度。
【0064】学習のための最も重要な構成要素は、図1
中、CPM段15.1...15.9(図2中、15.
1...15.7)として示されるCPMの組である。
なぜならば、CPM段は、利用可能な特定のアプリケー
ションについてのドメイン知識を表わすからである。C
PMの導出は、ベイズネットのような推論エンジンを利
用する分野の熟練者には周知であるが、以下の説明で
は、典型的なCPMの導出について考える。
【0065】図1及び図2を参照するに、本例のシステ
ムにおいて単純な2階層ベイズネットが使用される。重
要度(又は注目度)スコアは根ノードにおいて決定さ
れ、全ての特徴検出器は葉ノードにある。各リンクは、
同じ階層の他のリンクから条件付きで独立していると仮
定され、各リンクを別々に学習することによって、すな
わち、他のリンクから独立した所与のリンクについてC
PMを導出することによって、ネット全体が都合よく学
習されることに注意する必要がある。この仮定は、実際
には破られることが多いが、独立性による簡単化によっ
て、容易に実施できるようになり、妥当な結果が得られ
る。これにより、他の分類器又は推論エンジンとの比較
用の基準が得られる。
【0066】[確率論的推論]全ての特徴は、ベイズネ
ットによって統合され、重要度値又は注目度値を生ず
る。一方で、異なる証拠は、他の証拠と相互に競合する
か、若しくは、矛盾する。他方で、異なる証拠は、典型
的な写真シーンの事前モデル又は知識に従って、相互に
補強し合う。競合及び補強は共に、ベイズネットに基づ
く推論エンジンによって解決される。
【0067】図10を参照するに、様々な特徴検出器間
の条件的独立性を仮定する本発明では、2階層ベイズネ
ットが用いられる。重要度値又は注目度値は根ノード4
4で決定され、全ての特徴検出器は葉ノード46にあ
る。各画像について一つのベイズネットが有効である。
本発明は、本発明の範囲を逸脱することなく、3階層以
上の階層を有するベイズネットと共に使用できると理解
される。
【0068】[ベイズネットの学習]ベイズネットの利
点の一つは、各リンクが同じ階層にある他のリンクとは
独立になることである。従って、ベイズネットは、各リ
ンクを別々に学習することにより、すなわち、他のリン
クとは独立した所与のリンクについてCPM15.
1...15.9を導出することによって、ネット全体
を学習させるのに便利である。一般的に、根特徴ノード
対毎にCPMを得るため2つの方法が使用される。
【0069】1.専門知識を用いる方法 これはアドホックな方法である。専門家は、アピール性
の高い画像が与えられた場合に、高出力又は低出力を生
じる各特徴検出器の条件付き確率を得るため助言を求め
られる。
【0070】2.偶然性テーブルを用いる方法 これは、サンプリング・相関方法である。各特徴検出器
の多数の観察結果は、重要度又は注目度についての情報
と共に記録される。これらの観察結果は、偶然性テーブ
ルを作成するため一つに集められ、偶然性テーブルは、
正規化されたときに、CPM15.1、...、15.
9として使用される。この方法は、ニューラルネットワ
ーク型の学習(訓練)に似ている。本発明ではこの方法
が望ましい。
【0071】一例として任意の特徴についてのCPMに
ついて考える。この行列は、グランドトゥルース及び特
徴検出器から導出された偶然性テーブルを用いて生成さ
れる。特徴検出器は、一般的には、2値決定(テーブル
1を参照)を行なわため、CPMを導出するときには分
数的な頻度計数が用いられる。CPMのエントリは、以
下の式、
【0072】
【数9】 によって決定される。式中、Iは全ての学習画像グルー
プの組であり、Rはグループi中の全画像の組であ
り、nはグループiについての観察結果(観察者)の
数である。更に、Fは画像rについてのMラベル特徴
ベクトル、TはLレベルのグランドトゥルース・ベク
トル、Pは正規化定数係数のL×Lの対角行列を表わ
す。たとえば、表1における画像1、4、5、7は、表
2におけるボックス00、11、10、01に寄与す
る。全ての確信度値は適正な確信度センサによって正規
化されている。中心性についてのCPMの第1の列の直
感的な解釈として、高い特徴値を有する画像の注目度
は、高い特徴値をもたない画像の注目度の2倍になる可
能性がある。
【0073】
【表1】
【0074】
【表2】 以上の通り、本発明はベイズネットについて使用する場
合について説明されているが、ベイズネットの代わりに
異なる推論エンジンを使用してもよい。たとえば、B.
D. Ripleyによる"Pattern Recognition and Neural Net
works", (Cambridge University Press, 1996) には、
多種の分類器が記載され、この分類器は、正しい特徴を
備えることが通常は最も重要視され、パターン認識問題
を解くために使用される。このような分類器は、線形判
別式解析法、柔軟な判別式、(フィードフォワード)ニ
ューラルネットワーク、ノン・パラメトリック法、木構
造分類器、確信度ネットワーク(たとえば、ベイズネッ
トワーク)を含む。これらの方法に関する当業者には明
らかであるように、上述の分類器は、いずれも、本発明
を実施するための推論エンジンとして採用可能である。
【0075】[コンピュータシステム]本発明の説明に
おいて、本発明は、好ましくは、パーソナルコンピュー
タのような任意の周知のコンピュータシステムに利用さ
れることが明らかである。したがって、コンピュータシ
ステムについての詳細な説明は行わない。また、画像
は、’(たとえば、デジタルカメラによって)コンピュ
ータシステムに直接入力されるか、又は、コンピュータ
システムへ入力される前に(たとえば、ハロゲン化銀フ
ィルムのような原像を操作することによって)デジタル
化される。
【0076】図11を参照するに、本発明を実施するコ
ンピュータシステム110が示されている。コンピュー
タシステム110は、本発明の好ましい実施例を説明す
る目的のため例示されたものであり、本発明は、図示さ
れるようなコンピュータシステム110に限定されるこ
とがなく、任意の電子処理システムで使用される。コン
ピュータシステム110は、ソフトウェアプログラムを
取得し実行し、他の処理機能を実行するマイクロプロセ
ッサベースユニット112を含む。ディスプレイ114
は、マイクロプロセッサベースユニット112に電気的
に接続され、たとえば、グラフィカル・ユーザ・インタ
フェースを用いて、ソフトウェアに付随したユーザ関連
情報を表意する。キーボード116は、マイクロプロセ
ッサベースユニット112に接続され、ユーザがソフト
ウェアに情報を入力できるようにさせる。入力のためキ
ーボード116を使用する代わりに、従来技術において
周知のように、マウス118を使用し、ディスプレイ1
14上でセレクタ120を移動させ、セレクタ120が
上に重なった項目を選択してもよい。
【0077】コンパクトディスク読出し専用メモリ(C
D−ROM)装置122は、マイクロプロセッサベース
ユニット112に接続され、典型的にソフトウェアプロ
グラムを収容したコンパクトディスク124を介して、
ソフトウェアプログラム及びその他の情報をマイクロプ
ロセッサベースユニット112へ入力する手段を提供す
る。本発明によれば、このソフトウェアプログラムは、
ここで説明する画像評価プログラム、並びに、自動画像
圧縮プログラムのように画像評価プログラムの出力を利
用するプログラムを含む。さらに、フレキシブルディス
ク126は、ソフトウェアプログラムを収容し、マイク
ロプロセッサベースユニット112に挿入され、ソフト
ウェアプログラムをマイクロプロセッサユニットへ入力
してもよい。さらに、マイクロプロセッサベースユニッ
ト112は、従来技術において周知の如く、ソフトウェ
アプログラムを内部に保存するようにプログラムしても
よい。マイクロプロセッサベースユニット112は、更
に、ローカル・エリア・ネットワーク若しくはインター
ネットのような外部ネットワークへのネットワークコネ
クション127、たとえば、電話回線、を具備する。こ
の場合、プログラムは、遠隔サーバーに保持され、遠隔
サーバーから入手され、或いは、必要に応じてダウンロ
ードされる。プリンタ128は、マイクロプロセッサベ
ースユニット12に接続され、コンピュータシステム1
0の出力のハードコピーを印刷する。
【0078】画像は、従来から知られているように、
(パーソナルコンピュータメモリカード国際機構の規定
に基づく)PCMCIAカードのようなパーソナルコン
ピュータカード(PCカード)130を介して、ディス
プレイ114に表示される。PCMCIAカードは、デ
ジタル化された画像がカード130内に電子的に埋め込
まれている。PCカード130は、ディスプレイ114
上に画像が視覚的に表示されるように、最終的にマイク
ロプロセッサベースユニット112に挿入される。画像
は、コンパクトディスク124、フレキシブルディスク
126、若しくは、ネットワークコネクション127を
介して入力される。PCカード130、フレキシブルデ
ィスク126若しくはコンパクトディスク124に蓄積
された画像、又は、ネットワークコネクション127を
経由した画像は、デジタルカメラ(図示せず)若しくは
スキャナ(図示せず)のような種々のソースから取得さ
れる。
【0079】図12は、画像の圧縮量を決定するため画
像重要度及び注目度を利用する本発明の一局面の説明図
である。より詳細には、項目1200は、本発明の画像
重要度及び注目度プロセッサ1202に入力された非圧
縮画像を表現する。プロセッサ1202は、上述の処理
を使用して、各画像の重要度及び注目度を決定する。画
像は、高重要度/注目度1210から低重要度/注目度
1214へ格付け1210〜1214される。画像は、
圧縮器1204で圧縮される。より詳細には、画像は、
圧縮比若しくは再生画像品質を制御することが可能であ
る通例的な圧縮技術、たとえば、JPEG静止画像圧縮
標準を用いて圧縮される(Digital compression and co
ding of continuous−tone still images − Part I: R
equirements and Guidelines (JPEG), ISO/IEC Interna
tional Standard 10918−1, ITU−R Recommendation T.
81, 1993、W.B. Pennbaker and J.L. MItchell, JPEG S
till Image Data Compression Standard, Van Norstrad
Reinhold, New York, 1993、又は、ISO/IEC Internati
onal Standard 15444−1、若しくは、ITU−T Recommend
ation T.800:JPEG 2000 Image Coding Systemに記載さ
れるJPEG2000を参照のこと)。
【0080】しかし、圧縮器1204は、全ての画像を
均等に圧縮するのではなく、高重要度/注目度を有する
画像が低重要度/注目度の画像よりも圧縮される度合い
が小さくなるように、選択的に圧縮する。低重要度画像
を高圧縮率で圧縮する理論的根拠は、ユーザが低重要度
/注目度の画像のディテールに対してあまり関心がな
く、かつ、必要性を感じない、という前提に基づいてい
る。これに対し、ユーザは、高重要度/注目度画像のデ
ィテールをよく調べたいという気持ちに駆られるであろ
う。したがって、本発明は、高重要度/注目度画像の方
のディテールをより多く維持する。
【0081】図12の右側に示されるように、高重要度
/注目度画像1210は、比較的に圧縮の程度が低い
(1220)。低重要度/注目度画像1214は、かな
り圧縮の程度が高い(1224)。残りの画像1211
乃至1213は、同様に、項目1221〜1223に示
されるように扱われる。
【0082】図13は、画像重要度/注目度の程度を圧
縮パラメータに変換する好ましい一実施例の説明図であ
る。重要度/注目度の程度は横軸に示され、特定のアル
ゴリズムを使用した場合に得られる圧縮の程度を制御す
る圧縮パラメータは、y軸に示される。一般的に、低重
要度/注目度画像は、高圧縮率で圧縮され、高重要度/
注目度画像は、低圧縮率で圧縮されるか、若しくは、全
く圧縮されないまま保持される。本発明は、図13に示
された圧縮曲線が広範囲のシステム要求条件及び圧縮ア
ルゴリズムの選択に対処するように設計可能である、と
いう点で非常に柔軟性に富む。次に、この点を更に説明
するため、数通りの実施例を挙げる。
【0083】本発明の一実施例において、選択された圧
縮方法はJPEG圧縮標準であり、y軸に示された圧縮
パラメータは、後述のように品質係数QFである。QF
値のレンジは、典型的に、0から100の範囲で選択さ
れ、QF=+100は圧縮無しを表わし、QF=0は、
JPEGで達成可能な最大圧縮を生じる。図14に示さ
れるように、重要度/注目度スコアは、(QFmin,Q
max)のレンジに収まる品質係数にマッピングされ
る。ここで、QFmin及びQFmaxは、アプリケーション
の要求条件に応じて定められる。QF値の規定について
詳述する。
【0084】簡単には、JPEG圧縮を使用する場合、
デジタル画像は、画素値からなる8×8のブロックにフ
ォーマットされ、離散コサイン変換(DCT)として公
知の線形逆相関変換が各ブロックに適用去れ、DCT係
数の8×8のブロックが生成される。DCT係数は、次
に、周波数依存形均一スケーラ(拡大縮小)量子化器を
用いて、正規化され量子化される。
【0085】JPEG標準の場合、係数毎に別個の量子
化幅サイズを指定することが可能である。これにより、
ユーザは、係数毎に量子化によって生じる歪みを制御で
きるようになる。量子化器幅サイズは、種々のDCT係
数の相対的な知覚重要性に基づいて設計すること、或い
は、アプリケーションに依存したその他の規準に従って
設計することが可能である。8×8形の各ブロック内の
64個のDCT係数に対応した量子化器幅サイズは、量
子化テーブル、すなわち、Qテーブルと呼ばれる8×8
形のユーザ定義配列の要素によって指定される。Qテー
ブルは、JPEGシステムにおいて、圧縮ファイルサイ
ズ及び圧縮解除(伸長)画像品質を制御するため主要な
コンポーネントである。
【0086】量子化変換係数の各ブロックは、エネルギ
ーが概ね減少する順番に量子化係数を並べ替える予め定
義されたジグザグ走査を用いて、1次元ベクトルに順序
付けられる。通常、この結果として、ランレングス符号
化法によって効率的に符号化することが可能である零量
子化値の長いランが得られる。個別の非零量子化値と、
それよりも前に続く零値の個数は、ハフマン符号化法の
ような最小冗長度符号化スキームを使用して、振幅/振
幅のペアとして符号化される。2進符号化変換係数は、
Qテーブル規約のような情報を収容する画像ヘッダと共
に、記憶装置に保持されるか、又は、チャネルを経由し
て送信される。
【0087】上述の通り、JPEGにおける圧縮ファイ
ルサイズに対して画質を巧く調整する機能は、Qテーブ
ルの要素を操作することによって実現される。一般的
に、Qテーブルの64個の成分の中の各成分は、所望の
画質及びファイルサイズ(又は、等価的には、所望の圧
縮率若しくはビットレート)、又は、画質を達成するた
め、相互に独立して操作される。しかし、殆どのアプリ
ケーションでは、一般的に、基本Qテーブルの全要素が
単一の定数を用いて単純にスケール倍(拡大・縮小)さ
れる。たとえば、所与のQテーブルの全要素に、単位元
よりも大きいスケール係数を乗算することは、各係数の
量子化を粗くし、画質を低下させるであろう。しかし、
同時に、ファイルサイズは縮小される。これに対し、単
位元よりも小さいスケール係数を乗算することによっ
て、量子化は精細化され、画質は向上するが、ファイル
サイズが大きくなる。画質を圧縮ファイルサイズとの関
係で巧く調整するためのこのスケーリング法は、インデ
ィペンデント(独立系)JPEGグループ(IJG)を
含むJPEG圧縮製品の多数の開発者によって提言され
ている。IJGのフリーソフトウェアは、JPEG圧縮
用ツールとして最も普及しているソフトウェアであろ
う。このソフトウェアの最新バージョンは、現時点で、 ftp://ftp.uu.net/graphics/jpeg/ から入手可能である。このIJGの実装形態では、IJ
G品質係数(QF)として知られているパラメータを使
用して基準Qテーブルを拡大縮小する。IJG品質係数
は、以下の関係に従って、1乃至100の値を倍数スケ
ーリング因子に変換する。
【0088】すなわち、QFの値は、0(最低品質)か
ら100(最高品質)の範囲に亘る。QF=50におい
て、基準Qテーブルの全要素は1でスケーリングされ
る。1〜100のレンジ内のQFの値に対し、もし、
QF<50 であるならば、 QF=5000/QFで
あり、さもなければ、 QF=200−2×QFであ
る。
【0089】百分率で表現されたQFの値が基準テーブ
ルを拡大縮小するため使用される。たとえば、QF=2
0であるならば、QFテーブルの要素は、2.50倍さ
れる。QF=100であるならば、Qテーブルの要素
は、1にセットされる。QF=0の場合、Qテーブルの
要素は255(JPEGによる最大許容値)にセットさ
れる。
【0090】既に説明したように、また、図14に示さ
れるように、本発明において、重要度/注目度スコア
は、レンジ(QFmin,QFmax)内のQF値にマッピン
グされ、ここで、Qテーブル(QF値で拡大されてい
る)と、QFmin及びQFmaxとは、アプリケーションの
要求に応じて、ユーザによって指定される。当業者に
は、品質係数QF値を定義するために、IJGによって
使用された定義以外の方法もあり得ることが明らかであ
ろう。このような変更は、圧縮パラメータを品質係数に
関連付ける考え方を逸脱することなく、請求項に記載さ
れた範囲内で、開示された実施例に対してなし得るであ
ろう。
【0091】本発明の他の実施例において、圧縮法とし
てJPEG圧縮標準が選択され、図13のy軸に示され
た圧縮パラメータは、圧縮率又は生成された圧縮ファイ
ルのサイズである。この様子は図15に示されている。
図15では、ユーザは、特定のアプリケーションによっ
て許容可能な最小ファイルサイズRmin(又は、最大圧
縮率CRmax)を定義する。また、ユーザは、この特定
のアプリケーションで必要とされる最高画質を得ること
ができる最大ファイルサイズRmax(又は、最小圧縮率
CRmin)を定義する。次に、ユーザは、アプリケーシ
ョンの要求に基づいて、重要度/注目度スコアを圧縮フ
ァイルサイズ(又は圧縮率)に関係付ける曲線を指定す
る。この曲線の一例が図15に示されている。所与の重
要度/注目度スコアに対し、得られた圧縮率は、画像を
圧縮するための目標として使用される。JPEG圧縮
は、固定レートの圧縮方式ではないので、目標ファイル
サイズ(又は圧縮率)を達成するまでに、数回の圧縮の
繰り返しが必要であることに注意する必要がある。
【0092】本発明の他の実施例において、選択された
圧縮法は、JPEG2000圧縮標準であり、図13の
y軸で示された圧縮パラメータは、直前で説明した実施
例と同様に、圧縮率又は得られた圧縮ファイルサイズで
ある。JPEG2000標準は、画像を目標ファイルサ
イズまで簡単に圧縮することが可能であるため、本実施
例の場合に、所望の圧縮率若しくはファイルサイズを達
成するために繰り返しは不要である。
【0093】JPEG若しくはJPEG2000以外の
画像圧縮方法を利用できること、並びに、圧縮及び圧縮
解除後の再生画像の品質に関係するような圧縮パラメー
タを定義する他の手段を利用できることは、当業者には
明らかである。本発明の重要な特徴は、重要度/注目度
スコアが、画像を圧縮するため使用される圧縮パラメー
タの選択に影響を与えることによって、画像に適用され
る圧縮の程度を制御する手段として、又は、再生(圧縮
/圧縮解除)画像品質を制御する手段として、任意の所
望の形式で使用できることである。
【0094】画像が大量の記憶空間を必要とすること
は、画像処理の世界に固有の問題を生じさせる。したが
って、画像圧縮は、当面の記憶装置技術の記憶容量を拡
大するために一般的に使用される。しかし、このような
画像圧縮は、かなりの量のディテールを失わせ、圧縮後
の画質を低下させる。本発明は、より重要な(重要度/
注目度がより高い)画像のディテールの方を多く維持す
ることによって、この記憶空間の問題を解決する。さら
に、本発明によれば、あまり有用ではない可能性が高い
画像(重要度/注目度の低い画像)の圧縮量を増加さ
せ、記憶空間の消費量を節約することができる。事実
上、低重要度/注目度画像の方の圧縮量を増大させるこ
とにより、より高重要度/注目度の画像を圧縮しないま
まで保つ(若しくは、低い圧縮レベルを利用する)ため
に要する付加的な記憶空間を補うことが可能である。
【0095】本発明の主要なテーマはデジタル画像理解
技術であり、このデジタル画像処理技術は、デジタル画
像を認識し、それにより、人間が理解可能な対象、属性
又は条件に対して有用な意味を割り当て、このようにし
て獲得された結果をデジタル画像の更なる処理で用いる
ため、デジタル画像をデジタル処理する技術を意味する
と理解される。
【図面の簡単な説明】
【図1】画像の重要度値を計算するネットワークの構成
図である。
【図2】画像の注目度値を計算するネットワークの構成
図である。
【図3】図1及び2に示されるような主被写体検出の構
成要素の詳細ブロック図である。
【図4】画像のグループの相対的な重要度値を計算する
ネットワークアーキテキチャの構成図である
【図5A】図3示された主被写体検出を構成している方
法の詳細図(その1)である。
【図5B】図3示された主被写体検出を構成している方
法の詳細図(その2)である。
【図5C】図3示された主被写体検出を構成している方
法の詳細図(その3)である。
【図5D】図3示された主被写体検出を構成している方
法の詳細図(その4)である。
【図6】画像の色彩を判定する方法の詳細図である。
【図7】色彩特徴計算のため使用される色度平面の説明
図である。
【図8】肌及び顔の検出方法の説明図である。
【図9】図5に示されるような主被写体検出の詳細図で
ある。
【図10】図1及び2に示されたネットワークで使用さ
れる2レベルベイズネットの説明図である。
【図11】本発明を実施するコンピュータシステムの略
構成図である。
【図12】本発明の画像圧縮システムの構成図である。
【図13】本発明による好ましい圧縮スキームを表わす
グラフである。
【図14】本発明による品質係数を表わすグラフであ
る。
【図15】本発明による圧縮ファイルサイズを表わすグ
ラフである。
【符号の説明】
20 肌面積検出器 22 クローズアップ検出器 24 人物検出器 26 肌検出器 28 顔検出器 30 構図検出器 32 被写体寸法検出器 34 主被写体検出器 36 鮮明度検出器 38 色彩検出器 40 独自フォーマット検出器 42 代表色内容検出器 1200 画像 1202 画像重要度及び注目度プロセッサ 1204 圧縮器 1210 最高重要度/注目度画像 1211,1212,1213 中間重要度/注目度
画像 1214 最低重要度/注目度画像 1220 最低圧縮率画像 1221,1222,1223 中間圧縮率画像 1224 最高圧縮率画像
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マジド ラッバーニ アメリカ合衆国 ニューヨーク 14534 ピッツフォード ウェックスフォード・グ レン 36 (72)発明者 スティーヴン ポール エッツ アメリカ合衆国 フロリダ 34293 ヴェ ニス ランドー・コート 4023 Fターム(参考) 5C057 AA01 EA01 EA02 EA07 EM09 EM16 5C059 MA00 MA23 MC11 PP01 PP15 PP16 TA46 TB08 TC24 TC34 TD05 TD08 TD10 TD12 UA02 5C078 AA09 BA57 CA22 DA01 DB07 5L096 AA02 FA00 FA15

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 各画像の内容を含む一つ以上の特徴に関
    連した一つ以上の量を計算し、 一人以上の観察者の意見に基づいて訓練された推論アル
    ゴリズムを用いて該量を処理し、 該量を格付けすべき該画像に適用することにより、 画像重要度に基づいて画像を格付けする手順と、 該格付けに応じて該画像を可変的に圧縮する手順と、を
    有する画像を自動的に圧縮する方法。
  2. 【請求項2】 該特徴は、人物に関連した特徴と被写体
    に関連した特徴のうちの少なくとも一方の特徴を含む、
    請求項1記載の方法。
  3. 【請求項3】 第1の格付けがなされた第1の画像が、
    該第1の格付けよりも高い第2の格付けがなされた第2
    の画像よりも大量に圧縮されるように、該画像が可変的
    に圧縮される、請求項1記載の方法。
JP2002212942A 2001-07-23 2002-07-22 画像重要度に基づく画像圧縮制御システム及び方法 Pending JP2003153007A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/911,299 US6832006B2 (en) 2001-07-23 2001-07-23 System and method for controlling image compression based on image emphasis
US911299 2001-07-23

Publications (1)

Publication Number Publication Date
JP2003153007A true JP2003153007A (ja) 2003-05-23

Family

ID=25430048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002212942A Pending JP2003153007A (ja) 2001-07-23 2002-07-22 画像重要度に基づく画像圧縮制御システム及び方法

Country Status (3)

Country Link
US (1) US6832006B2 (ja)
EP (1) EP1280107A3 (ja)
JP (1) JP2003153007A (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006115011A (ja) * 2004-10-12 2006-04-27 Sharp Corp 行動履歴記録装置、行動履歴管理システム、行動履歴記録方法およびプログラム
JP2006246376A (ja) * 2005-03-07 2006-09-14 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2006277402A (ja) * 2005-03-29 2006-10-12 Nec Corp データ圧縮装置及び方法並びにデータ圧縮用プログラム
JP2007025758A (ja) * 2005-07-12 2007-02-01 Gen Tec:Kk 人の顔画像抽出方法及び同装置
US7409110B2 (en) 2004-06-29 2008-08-05 Seiko Epson Corporation Image retrieval system, image retrieval program and storage medium and image retrieval method
JP2009200757A (ja) * 2008-02-21 2009-09-03 Fujitsu Ltd 映像データ処理装置、プログラム及び方法
US7734104B2 (en) 2005-11-30 2010-06-08 Sony Computer Entertainment Inc. Image coding apparatus, image decoding apparatus and image processing system
JP2011055204A (ja) * 2009-09-01 2011-03-17 National Institute Of Advanced Industrial Science & Technology 動画像の圧縮方法及び圧縮装置
JP2011525012A (ja) * 2008-06-02 2011-09-08 イーストマン コダック カンパニー デジタルコンテンツ記録のための意味論的イベント検出
JP2013506198A (ja) * 2009-09-25 2013-02-21 イーストマン コダック カンパニー デジタル画像の美的品質の推定方法
JP2014519091A (ja) * 2011-05-12 2014-08-07 アップル インコーポレイテッド 存在センサ
US10402624B2 (en) 2011-05-12 2019-09-03 Apple Inc. Presence sensing
JP2019148994A (ja) * 2018-02-27 2019-09-05 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP2020518191A (ja) * 2017-07-11 2020-06-18 ソニー株式会社 ディープニューラルネットワークを用いた、視覚的品質を維持した量子化パラメータ予測
US10817594B2 (en) 2017-09-28 2020-10-27 Apple Inc. Wearable electronic device having a light field camera usable to perform bioauthentication from a dorsal side of a forearm near a wrist

Families Citing this family (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6754383B1 (en) * 2000-07-26 2004-06-22 Lockheed Martin Corporation Lossy JPEG compression/reconstruction using principal components transformation
US7194128B1 (en) 2000-07-26 2007-03-20 Lockheed Martin Corporation Data compression using principal components transformation
US7191103B2 (en) * 2001-08-08 2007-03-13 Hewlett-Packard Development Company, L.P. Predominant color identification in digital images
JP4139154B2 (ja) * 2001-08-30 2008-08-27 株式会社リコー 画像通信装置
US7130864B2 (en) * 2001-10-31 2006-10-31 Hewlett-Packard Development Company, L.P. Method and system for accessing a collection of images in a database
NZ515527A (en) * 2001-11-15 2003-08-29 Auckland Uniservices Ltd Method, apparatus and software for lossy data compression and function estimation
US10242255B2 (en) * 2002-02-15 2019-03-26 Microsoft Technology Licensing, Llc Gesture recognition system using depth perceptive sensors
US9959463B2 (en) * 2002-02-15 2018-05-01 Microsoft Technology Licensing, Llc Gesture recognition system using depth perceptive sensors
US6976026B1 (en) * 2002-03-14 2005-12-13 Microsoft Corporation Distributing limited storage among a collection of media objects
TWI281126B (en) * 2002-03-19 2007-05-11 Intervideo Digital Technology Image detection method based on region
US7356190B2 (en) * 2002-07-02 2008-04-08 Canon Kabushiki Kaisha Image area extraction method, image reconstruction method using the extraction result and apparatus thereof
JP2004062804A (ja) * 2002-07-31 2004-02-26 Ricoh Co Ltd 画像の分類方法、画像特徴量空間表示方法、プログラムおよび記録媒体
US7181062B2 (en) * 2002-08-30 2007-02-20 Lockheed Martin Corporation Modular classification architecture for a pattern recognition application
FR2846835B1 (fr) * 2002-11-05 2005-04-15 Canon Kk Codage de donnees numeriques combinant plusieurs modes de codage
US8363951B2 (en) 2007-03-05 2013-01-29 DigitalOptics Corporation Europe Limited Face recognition training method and apparatus
US7317815B2 (en) * 2003-06-26 2008-01-08 Fotonation Vision Limited Digital image processing composition using face detection information
US7471846B2 (en) * 2003-06-26 2008-12-30 Fotonation Vision Limited Perfecting the effect of flash within an image acquisition devices using face detection
US7620218B2 (en) * 2006-08-11 2009-11-17 Fotonation Ireland Limited Real-time face tracking with reference images
US8948468B2 (en) * 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US7792970B2 (en) 2005-06-17 2010-09-07 Fotonation Vision Limited Method for establishing a paired connection between media devices
US7616233B2 (en) * 2003-06-26 2009-11-10 Fotonation Vision Limited Perfecting of digital image capture parameters within acquisition devices using face detection
US8494286B2 (en) 2008-02-05 2013-07-23 DigitalOptics Corporation Europe Limited Face detection in mid-shot digital images
US7440593B1 (en) 2003-06-26 2008-10-21 Fotonation Vision Limited Method of improving orientation and color balance of digital images using face detection information
US8593542B2 (en) * 2005-12-27 2013-11-26 DigitalOptics Corporation Europe Limited Foreground/background separation using reference images
US9692964B2 (en) 2003-06-26 2017-06-27 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US7362368B2 (en) * 2003-06-26 2008-04-22 Fotonation Vision Limited Perfecting the optics within a digital image acquisition device using face detection
US7844076B2 (en) * 2003-06-26 2010-11-30 Fotonation Vision Limited Digital image processing using face detection and skin tone information
US8896725B2 (en) * 2007-06-21 2014-11-25 Fotonation Limited Image capture device with contemporaneous reference image capture mechanism
US8553949B2 (en) 2004-01-22 2013-10-08 DigitalOptics Corporation Europe Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US8330831B2 (en) * 2003-08-05 2012-12-11 DigitalOptics Corporation Europe Limited Method of gathering visual meta data using a reference image
US7315630B2 (en) 2003-06-26 2008-01-01 Fotonation Vision Limited Perfecting of digital image rendering parameters within rendering devices using face detection
US8498452B2 (en) * 2003-06-26 2013-07-30 DigitalOptics Corporation Europe Limited Digital image processing using face detection information
US7565030B2 (en) * 2003-06-26 2009-07-21 Fotonation Vision Limited Detecting orientation of digital images using face detection information
US7269292B2 (en) * 2003-06-26 2007-09-11 Fotonation Vision Limited Digital image adjustable compression and resolution using face detection information
US8682097B2 (en) * 2006-02-14 2014-03-25 DigitalOptics Corporation Europe Limited Digital image enhancement with reference images
US8989453B2 (en) * 2003-06-26 2015-03-24 Fotonation Limited Digital image processing using face detection information
US8155397B2 (en) * 2007-09-26 2012-04-10 DigitalOptics Corporation Europe Limited Face tracking in a camera processor
US7574016B2 (en) * 2003-06-26 2009-08-11 Fotonation Vision Limited Digital image processing using face detection information
US9129381B2 (en) * 2003-06-26 2015-09-08 Fotonation Limited Modification of post-viewing parameters for digital images using image region or feature information
US7587068B1 (en) 2004-01-22 2009-09-08 Fotonation Vision Limited Classification database for consumer digital images
WO2005015355A2 (en) * 2003-08-07 2005-02-17 Matsushita Electric Industrial Co., Ltd. Automatic image cropping system and method for use with portable devices equipped with digital cameras
US7382903B2 (en) 2003-11-19 2008-06-03 Eastman Kodak Company Method for selecting an emphasis image from an image collection based upon content recognition
US7564994B1 (en) 2004-01-22 2009-07-21 Fotonation Vision Limited Classification system for consumer digital images using automatic workflow and face detection and recognition
US7551755B1 (en) 2004-01-22 2009-06-23 Fotonation Vision Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US7555148B1 (en) 2004-01-22 2009-06-30 Fotonation Vision Limited Classification system for consumer digital images using workflow, face detection, normalization, and face recognition
US7558408B1 (en) 2004-01-22 2009-07-07 Fotonation Vision Limited Classification system for consumer digital images using workflow and user interface modules, and face detection and recognition
US20050168595A1 (en) * 2004-02-04 2005-08-04 White Michael F. System and method to enhance the quality of digital images
JP2005303991A (ja) * 2004-03-15 2005-10-27 Fuji Photo Film Co Ltd 撮像装置、撮像方法、及び撮像プログラム
EP1589444A3 (en) * 2004-04-21 2008-03-12 Samsung Electronics Co., Ltd. Method, medium, and apparatus for detecting situation change of digital photos and method, medium, and apparatus for situation-based photo clustering in digital photo album
US8320641B2 (en) 2004-10-28 2012-11-27 DigitalOptics Corporation Europe Limited Method and apparatus for red-eye detection using preview or other reference images
US7715597B2 (en) * 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
US8503800B2 (en) * 2007-03-05 2013-08-06 DigitalOptics Corporation Europe Limited Illumination detection using classifier chains
US7315631B1 (en) * 2006-08-11 2008-01-01 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
JP2006295890A (ja) * 2005-03-15 2006-10-26 Fuji Photo Film Co Ltd アルバム作成装置、アルバム作成方法、及びプログラム
US7693304B2 (en) * 2005-05-12 2010-04-06 Hewlett-Packard Development Company, L.P. Method and system for image quality calculation
CA2610467C (en) * 2005-06-03 2014-03-11 The Commonwealth Of Australia Matrix compression arrangements
US20070024888A1 (en) * 2005-07-27 2007-02-01 Bailey Eliot N Protecting valuable media
US7783085B2 (en) * 2006-05-10 2010-08-24 Aol Inc. Using relevance feedback in face recognition
US7907755B1 (en) * 2006-05-10 2011-03-15 Aol Inc. Detecting facial similarity based on human perception of facial similarity
US7467222B2 (en) * 2006-05-12 2008-12-16 Shutterfly, Inc. Image ranking for imaging products and services
EP2033142B1 (en) 2006-06-12 2011-01-26 Tessera Technologies Ireland Limited Advances in extending the aam techniques from grayscale to color images
WO2008015586A2 (en) * 2006-08-02 2008-02-07 Fotonation Vision Limited Face recognition with combined pca-based datasets
US7916897B2 (en) * 2006-08-11 2011-03-29 Tessera Technologies Ireland Limited Face tracking for controlling imaging parameters
US7403643B2 (en) * 2006-08-11 2008-07-22 Fotonation Vision Limited Real-time face tracking in a digital image acquisition device
US8055067B2 (en) 2007-01-18 2011-11-08 DigitalOptics Corporation Europe Limited Color segmentation
JP4254873B2 (ja) * 2007-02-16 2009-04-15 ソニー株式会社 画像処理装置及び画像処理方法、撮像装置、並びにコンピュータ・プログラム
EP2115662B1 (en) 2007-02-28 2010-06-23 Fotonation Vision Limited Separating directional lighting variability in statistical face modelling based on texture space decomposition
WO2008109622A1 (en) 2007-03-05 2008-09-12 Fotonation Vision Limited Face categorization and annotation of a mobile phone contact list
JP4970557B2 (ja) 2007-03-05 2012-07-11 デジタルオプティックス・コーポレイション・ヨーロッパ・リミテッド デジタル画像取込装置における顔検索及び検出
US7916971B2 (en) * 2007-05-24 2011-03-29 Tessera Technologies Ireland Limited Image processing method and apparatus
US20090164192A1 (en) * 2007-12-21 2009-06-25 General Instrument Corporation Efficient message representations for belief propagation algorithms
US7855737B2 (en) * 2008-03-26 2010-12-21 Fotonation Ireland Limited Method of making a digital camera image of a scene including the camera user
CN101588450B (zh) 2008-05-19 2013-08-14 株式会社日立制作所 记录再现装置及方法
JP5072757B2 (ja) * 2008-07-24 2012-11-14 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP5547730B2 (ja) * 2008-07-30 2014-07-16 デジタルオプティックス・コーポレイション・ヨーロッパ・リミテッド 顔検知を用いた顔及び肌の自動美化
WO2010063463A2 (en) * 2008-12-05 2010-06-10 Fotonation Ireland Limited Face recognition using face tracker classifier data
US9152292B2 (en) * 2009-02-05 2015-10-06 Hewlett-Packard Development Company, L.P. Image collage authoring
US8379917B2 (en) 2009-10-02 2013-02-19 DigitalOptics Corporation Europe Limited Face recognition performance using additional image features
US8760517B2 (en) 2010-09-27 2014-06-24 Apple Inc. Polarized images for security
FR2973540B1 (fr) * 2011-04-01 2013-03-29 CVDM Solutions Procede d'extraction automatisee d'un planogramme a partir d'images de lineaire
US8433132B2 (en) 2011-04-12 2013-04-30 Sony Corporation Method for efficient representation and processing of color pixel data in digital pathology images
US8787454B1 (en) * 2011-07-13 2014-07-22 Google Inc. Method and apparatus for data compression using content-based features
US9894269B2 (en) 2012-10-31 2018-02-13 Atheer, Inc. Method and apparatus for background subtraction using focus differences
US9311361B1 (en) * 2013-03-15 2016-04-12 Google Inc. Algorithmically determining the visual appeal of online content
US9224213B2 (en) * 2013-12-31 2015-12-29 Facebook, Inc. Systems and methods for context based image compression
EP3021583B1 (en) 2014-11-14 2019-10-23 Axis AB Method of identifying relevant areas in digital images, method of encoding digital images, and encoder system
US9804392B2 (en) 2014-11-20 2017-10-31 Atheer, Inc. Method and apparatus for delivering and controlling multi-feed data
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
GB2558644A (en) * 2017-01-13 2018-07-18 Nokia Technologies Oy Video encoding
CN107194464B (zh) * 2017-04-25 2021-06-01 北京小米移动软件有限公司 卷积神经网络模型的训练方法及装置
JP6998968B2 (ja) * 2017-09-05 2022-01-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ ディープニューラルネットワークの実行方法、実行装置、学習方法、学習装置及びプログラム
EP3935581A4 (en) 2019-03-04 2022-11-30 Iocurrents, Inc. DATA COMPRESSION AND COMMUNICATION USING MACHINE LEARNING
CN110826584B (zh) * 2019-04-29 2020-07-17 当家移动绿色互联网技术集团有限公司 仿真图像处理方法、装置、存储介质及电子设备
US11496769B2 (en) 2019-09-27 2022-11-08 Apple Inc. Neural network based image set compression
CN112149712B (zh) * 2020-08-19 2023-06-06 中国地质大学(武汉) 一种高效的高光谱遥感数据压缩与分类模型的构建方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58215882A (ja) * 1982-06-07 1983-12-15 インタ−ナシヨナル ビジネス マシ−ンズ コ−ポレ−シヨン ドキユメント分類方法
JPS61133776A (ja) * 1984-12-03 1986-06-21 Canon Inc 画像デ−タ圧縮装置
JPS6299869A (ja) * 1985-10-25 1987-05-09 Fuji Photo Film Co Ltd 情報圧縮方法
US5991515A (en) * 1992-11-10 1999-11-23 Adobe Systems Incorporated Method and apparatus for compressing and decompressing data prior to display
US5418895A (en) 1992-11-25 1995-05-23 Eastman Kodak Company Method for displaying a high quality digital color image on a limited color display
US5424945A (en) 1993-08-31 1995-06-13 Xerox Corporation System for evaluating a psychological effect of a document
AU698055B2 (en) * 1994-07-14 1998-10-22 Johnson-Grace Company Method and apparatus for compressing images
US5535311A (en) * 1994-07-28 1996-07-09 Hewlett-Packard Company Method and apparatus for image-type determination to enable choice of an optimum data compression procedure
DE69519462T2 (de) * 1994-09-30 2001-06-13 Sanyo Electric Co Bildübertragungssystem und Verfahren zur Datenreduktion von Farbbildern mittels Farbtabellen und Zusammenfassung von Bildbereichen
GB9422738D0 (en) * 1994-11-10 1995-01-04 Univ Western Ontario Context-based, adaptive, progressive, lossless compression of still continuous -tone images
JP3063073B2 (ja) 1995-06-30 2000-07-12 富士ゼロックス株式会社 画像解析表現付加装置
US5838833A (en) * 1995-06-30 1998-11-17 Minolta Co., Ltd. Fractal image compression method and device and fractal image restoration method and device
US6014133A (en) * 1996-06-14 2000-01-11 Seiko Epson Corporation Data transmitter/receiver apparatus, data transmitter, data receiver, and data compression method
JPH10210466A (ja) * 1997-01-27 1998-08-07 Xing:Kk データ圧縮装置
US6121969A (en) * 1997-07-29 2000-09-19 The Regents Of The University Of California Visual navigation in perceptual databases
US6185253B1 (en) * 1997-10-31 2001-02-06 Lucent Technology, Inc. Perceptual compression and robust bit-rate control system
US6731807B1 (en) * 1998-09-11 2004-05-04 Intel Corporation Method of compressing and/or decompressing a data set using significance mapping
AU2001241620A1 (en) * 2000-02-22 2001-09-03 Visualgold.Com, Inc. System and method for image processing
US6674908B1 (en) * 2002-05-04 2004-01-06 Edward Lasar Aronov Method of compression of binary data with a random number generator

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7409110B2 (en) 2004-06-29 2008-08-05 Seiko Epson Corporation Image retrieval system, image retrieval program and storage medium and image retrieval method
JP4511304B2 (ja) * 2004-10-12 2010-07-28 シャープ株式会社 行動履歴記録装置、行動履歴管理システム、行動履歴記録方法およびプログラム
JP2006115011A (ja) * 2004-10-12 2006-04-27 Sharp Corp 行動履歴記録装置、行動履歴管理システム、行動履歴記録方法およびプログラム
JP4656497B2 (ja) * 2005-03-07 2011-03-23 株式会社リコー 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2006246376A (ja) * 2005-03-07 2006-09-14 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び情報記録媒体
JP2006277402A (ja) * 2005-03-29 2006-10-12 Nec Corp データ圧縮装置及び方法並びにデータ圧縮用プログラム
JP2007025758A (ja) * 2005-07-12 2007-02-01 Gen Tec:Kk 人の顔画像抽出方法及び同装置
US7734104B2 (en) 2005-11-30 2010-06-08 Sony Computer Entertainment Inc. Image coding apparatus, image decoding apparatus and image processing system
JP2009200757A (ja) * 2008-02-21 2009-09-03 Fujitsu Ltd 映像データ処理装置、プログラム及び方法
JP2011525012A (ja) * 2008-06-02 2011-09-08 イーストマン コダック カンパニー デジタルコンテンツ記録のための意味論的イベント検出
JP2011055204A (ja) * 2009-09-01 2011-03-17 National Institute Of Advanced Industrial Science & Technology 動画像の圧縮方法及び圧縮装置
JP2013506198A (ja) * 2009-09-25 2013-02-21 イーストマン コダック カンパニー デジタル画像の美的品質の推定方法
JP2014519091A (ja) * 2011-05-12 2014-08-07 アップル インコーポレイテッド 存在センサ
US10402624B2 (en) 2011-05-12 2019-09-03 Apple Inc. Presence sensing
JP2020518191A (ja) * 2017-07-11 2020-06-18 ソニー株式会社 ディープニューラルネットワークを用いた、視覚的品質を維持した量子化パラメータ予測
JP7026878B2 (ja) 2017-07-11 2022-03-01 ソニーグループ株式会社 ディープニューラルネットワークを用いた、視覚的品質を維持した量子化パラメータ予測
US10817594B2 (en) 2017-09-28 2020-10-27 Apple Inc. Wearable electronic device having a light field camera usable to perform bioauthentication from a dorsal side of a forearm near a wrist
US11036844B2 (en) 2017-09-28 2021-06-15 Apple Inc. Wearable electronic device having a light field camera
JP2019148994A (ja) * 2018-02-27 2019-09-05 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP7030561B2 (ja) 2018-02-27 2022-03-07 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム

Also Published As

Publication number Publication date
US20030059121A1 (en) 2003-03-27
US6832006B2 (en) 2004-12-14
EP1280107A2 (en) 2003-01-29
EP1280107A3 (en) 2006-02-01

Similar Documents

Publication Publication Date Title
JP2003153007A (ja) 画像重要度に基づく画像圧縮制御システム及び方法
JP4335476B2 (ja) 画像の顕著性及びアピール性に基づいて写真印画の数、寸法、及び、倍率を変更する方法
US6738494B1 (en) Method for varying an image processing path based on image emphasis and appeal
US6671405B1 (en) Method for automatic assessment of emphasis and appeal in consumer images
JP3373008B2 (ja) 画像像域分離装置
US6847733B2 (en) Retrieval and browsing of database images based on image emphasis and appeal
US7212668B1 (en) Digital image processing system and method for emphasizing a main subject of an image
US8755596B2 (en) Studying aesthetics in photographic images using a computational approach
US6952286B2 (en) Doubleprint photofinishing service with the second print having subject content-based modifications
CN100517328C (zh) 显示控制装置和方法
US7917518B2 (en) Compositional balance and color driven content retrieval
TWI426774B (zh) 用於針對jpeg壓縮歷史紀錄分類為壓縮影像的方法、及用於針對影像是否已經過jpeg壓縮而分類影像的設備及影像分類方法
EP1231565A1 (en) Image colour correction based on image pattern recognition, the image pattern including a reference colour
US20080317358A1 (en) Class-based image enhancement system
JP4098021B2 (ja) シーン識別方法および装置ならびにプログラム
WO2005066896A2 (en) Detection of sky in digital color images
US20120163715A1 (en) Convex clustering for chromatic content modeling
US20030026476A1 (en) Scaled image generating apparatus and method, image feature calculating apparatus and method, computer programs therefor, and image data structure
JP4340842B2 (ja) 画像処理方法および画像処理装置、画像処理プログラム、記憶媒体
Schröder et al. Automatic color correction based on generic content based image analysis
JPH06251147A (ja) 映像特徴処理方法
JP3977291B2 (ja) 画像再生方法及び画像処理装置
CN115700800A (zh) 一种夜间图像质量评价方法
JP5656050B2 (ja) 画像評価装置および画像評価方法
Ciocca et al. Integrating imaging and vision for content-specific image enhancement

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070807