JPH08265753A

JPH08265753A - 標準化された肖像画像を圧縮及び圧縮復元する方法及び装置

Info

Publication number: JPH08265753A
Application number: JP7332355A
Authority: JP
Inventors: Lawrence A Ray; エイレイローレンス; Richard N Ellson; エヌエルソンリチャード; Maxime Elbaz; エルバズマキシム
Original assignee: Eastman Kodak Co
Current assignee: Eastman Kodak Co
Priority date: 1994-12-21
Filing date: 1995-12-20
Publication date: 1996-10-11
Also published as: CN1150282A; BR9505965A; DE69504289D1; EP0718807B1; DE69504289T2; EP0718807A3; AR000238A1; ZA959491B; EP0718807A2

Abstract

(57)【要約】（修正有）【課題】最小のビット数で肖像画画像をエンコードす
る方法及び装置を提供する。【解決手段】肖像画像の選択された組内で見いだされ
た特徴を表す標準化されたアドレス可能な画像特徴の集
合を形成する。標準化された特徴の集合に作り上げられ
た画像特徴と同じ大きさ及び特徴の向きであるよう標準
化される。標準化処理はまた圧縮されるべき画像中及び
組内の共通のアドレス可能な集合を確立するために用い
られる画像に存在する多数の輝度の変化を最小化するよ
う輝度バランス特徴を具体化する。圧縮されるべき画像
は特徴のアドレス可能な集合内の特徴と一つづつ比較さ
れ、集合からの最良適合特徴は集合内のそれぞれの特徴
のビット表現アドレスにより圧縮されるべき画像と関連
づけられる。この表現を達成するのに必要なビット数は
ベクトル量子化技術の使用と多くの特徴は顔のような画
像中心軸について垂直及び／又は水平に対称であるとい
う認識により減少される。

Description

【発明の詳細な説明】

【０００１】関連する出願の相互参照本出願は以下に関係する：Ｒａｙ、Ｅｌｌｓｏｎ、Ｇａ
ｎｄｈｉによる１９９３年１０月２９日出願の米国特許
出願０８／１４５０５１、「ＭｅｔｈｏｄＡｎｄＡ
ｐｐａｒａｔｕｓＦｏｒＩｍａｇｅＣｏｍｐｒｅｓ
ｓｉｏｎ、ＳｔｏｒａｇｅａｎｄＲｅｔｒｉｅｖａ
ｌＯｎＭａｇｎｅｔｉｃＴｒａｎｓａｃｔｉｏｎ
Ｃａｒｄｓ」とＲａｙ、Ｅｌｌｓｏｎによる１９９３
年１０月２９日出願の米国特許出願０８／１４５２８
４、「ＣｏｍｐｒｅｓｓｉｏｎＭｅｔｈｏｄＦｏｒ
ＡＳｔａｎｄａｒｄｉｚｅｄＩｍａｇｅＬｉｂ
ｒａｒｙ」とＲａｙ、Ｅｌｌｓｏｎによる１９９３年１
０月２９日出願の米国特許出願０８／１４４７５３、
「ＭｅｔｈｏｄＡｎｄＡｐｐａｒａｔｕｓＦｏｒ
ＤａｔａＥｎｃｏｄｉｎｇＷｉｔｈＲｅｓｅｒ
ｖｅｄＶａｌｕｅ」とＲａｙ、Ｅｌｌｓｏｎ、Ｅｌｂ
ａｚによる同日の出願のコダック文書番号７１４１２号
の「ＭｅｔｈｏｄＡｎｄＡｐｐａｒａｔｕｓＦｏ
ｒＴｈｅＦｏｒｍａｔｉｏｎＯｆＳｔａｎｄａ
ｒｄｉｚｅｄＩｍａｇｅＴｅｍｐｌａｔｅｓ」上記
引用特許出願の教示はここにその全てを参考として引用
する。

【０００２】

【発明の属する技術分野】本発明はデジタル画像圧縮及
び圧縮復元（伸長）に関する。特に本発明の技術は白黒
階調のある肖像画像を５００ビット以下に圧縮して記憶
することを可能にする。

【０００３】

【従来の技術】一般に画像圧縮は１画像に対する記憶の
必要量を減少するために見いだされた圧縮復元（ｄｅｃ
ｏｍｐｒｅｓｓｉｏｎ）で画像を回復する。すべての圧
縮／圧縮復元過程が画像をその元の形に回復するわけで
はない。元の形に戻す方法は「無損失」法と呼ばれる。
一般的に無損失法は、画像を変化させ画質のある程度の
劣化を引き起こす損失法によるのに比べてより高度に画
像を圧縮することはできない。高い圧縮率が要求される
応用では損失法が最も頻繁に用いられる。

【０００４】画像は空間的相関を含むことにより圧縮さ
れうる。この相関は隣接する画素値の差が画像のダイナ
ミックレンジに比べて小さいことを意味する。基本的な
経験則は相関が大きいほど視覚画像の忠実度の損失なし
により高い圧縮率に対するより大きな潜在能力を意味す
る。画像圧縮法のほとんど全ては広い統計的方法にその
基礎を有する。ある方法はより洗練されており局部統計
学上に基づいて圧縮アルゴリズムを変化させている
（Ｍ．Ｒａｂｂａｎｉ，Ｊ．Ｐ．Ｊｏｎｅｓ著の「Ｄｉ
ｇｉｔａｌＩｎａｇｅＣｏｍｐｒｅｓｓｉｏｎＴ
ｅｃｈｎｉｑｕｅｓ」Ｖｏｌ．，Ｔ７７，ＳＰＩＥ出
版、Ｂｅｌｌｉｎｇｈａｍ，ワシントン、１９９１年を
参照）。しかしながらこれらの技術の全ては画像の特徴
及び画像の位置の先立つ知識がないものとして適用され
る。統計学は隣接画素間の相関を説明する；が、異なる
画像の対応する位置内の画素の群間の相関については説
明しない。

【０００５】圧縮アルゴリズムは動画の連続したフレー
ムのような画像の動きの連続を扱うために開発されてき
た（ＢｅｒｎｄＪａｈｎｅ著の「ＤｉｇｉｔａｌＩ
ｍａｇｅＰｒｏｃｅｓｓｉｎｇ：Ｃｏｎｃｅｐｔ
ｓ，Ａｌｇｏｒｉｔｈｍｓ，ａｎｄＳｃｉｅｎｔｉｆ
ｉｃＡｐｐｌｉｃａｔｉｏｎｓ」Ｓｐｒｉｎｇｅｒ−
Ｖｅｒｌａｇ出版、ベルリン、１９９１年参照）。時間
的に近接して撮られた画像はその間に高い度合いの相関
を有し、画像セグメントの動きとして画像間の差を決定
することは大きな圧縮率につながる。画像と画像の相関
のこの型は増加する歪みにさらされている画像に対して
うまく働く。

【０００６】他の画像の補正は画像と画像の相関を有す
るが、動きの連続が有する動きのアルゴリズムでうまく
圧縮されない程度ではない。行方不明の子供の絵のライ
ブラリを考えてみよう。この画像の補正に対して顔があ
る共通の特徴を共有するように画素の位置に基づく画像
と画像の大きな度合いの相関がある。所与の画像内の空
間的相関とちょうど同じように異なる画像にわたるこの
相関は圧縮を向上するのに利用されうる。

【０００７】画像ライブラリの解析は画像内の位置に基
づく画像の忠実度の相対的重要性の知識をもたらす。実
際、子供の顔上の良い画像の忠実度を維持することは頭
髪又は肩の忠実度よりも重要であり、頭髪又は肩は今度
は背景としてより重要になる。画像圧縮は視覚的画像の
忠実度がより重要でない領域でより効果を発揮する。多
くの応用で元の画像の向き及び量子化の保持は画像内に
含まれる視覚的情報の維持より重要ではない。特に行方
不明の子供のライブラリ内の画像に対して、肖像（ポー
トレイト）の内の子供の同一性はもとの画像又は圧縮の
助けにより処理された画像のどちらからも同じく容易に
確証できる場合、処理された画像をライブラリに入れる
のに損失はない。この原則は元の画像を規格化されたフ
ォーマットに入れることにより処理された画像のライブ
ラリを作るのに適用できる。行方不明の子供の肖像に対
して、これは目を水平に、画像の境界に対して頭を中心
にするよう各子供の頭を方向づけることを含む。一旦構
成されれば、これらの規格化された画像は画像と画像と
の相関を加える標準化の知識によりうまく圧縮される。

【０００８】ベクトル量子化（ＶＱ）として知られる圧
縮方法からの技術は画像の部分間の相関を見つけるのに
有用である。ベクトル量子化ＶＱによる圧縮は固定率の
損失のある高率の圧縮の応用にうまく適合する（Ｒ．
Ｍ．Ｇｒａｙ著の「ＶｅｃｔｏｒＱｕａｎｔｉｚａｔ
ｉｏｎ」ＩＥＥＥＡＳＳＰ誌，４−２９頁、１９８４
年４月を参照）。この方法は画像を小さな断片又は「画
像ブロック」に分解する。それからこれらのブロックは
一般にコードブックとして知られる画像ブロックの所定
の組内の他の画像ブロックに対して照合される。照合ア
ルゴリズムは一般に最小二乗誤差法（ＭＳＥ）である。
画像ブロックの組があらかじめ決められているので、組
への１つの登録は単純な目次により参照されうる。結果
として多画素ブロックは単一の番号で参照される。その
ような方法を用いて画像に対するビット数は計上されう
る。多数のビットが画像ブロック毎に割り当てられる場
合にコードブックの大きさが増加されうるか又はブロッ
クの大きさがより小さくされうるかのどちらかである。

【０００９】従来技術ではコードブックはトレーニング
組として知られている多数の画像を表す集合から形成さ
れる。画像は画像ブロックに分割される。それで画像ブ
ロックは例えば８ｘ８画像ブロックに対し、空間が６４
次元を有するような高次元のベクトル空間内のベクトル
として考えられる。画像ブロックは画像内のトレーニン
グ組の各画像から選択される。一旦全てのベクトルがト
レーニング組から決められると、クラスターが見いださ
れ、代表的な要素が各クラスターに割り当てられる。ク
ラスターはトレーニング組の要素と該要素が割り当てら
れたクラスターの代表との間の全体の結合距離を最小に
するような方法で決められる。選択する技術はＬｉｎｄ
−Ｂｕｚｏ−Ｇｒａｙ（ＬＢＧ）アルゴリズムである
（Ｙ．Ｌｉｎｄ他著の「ＡｎＡｌｇｏｒｉｔｈｍｆ
ｏｒＶｅｃｔｏｒＱｕａｎｔｉｚｅｒＤｅｓｉｇ
ｎ」ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｏ
ｍｍｕｎｉｓａｔｉｏｎｓ，Ｖｏｌ．ＣＯＭ−２８，Ｎ
ｏ．１，８４−９５頁、１９８０年を参照）。クラスタ
ーの数はブロックに対して計上されたビットの数により
決められる。ｎビットが計上されている場合、コードブ
ックは２ⁿまでのクラスターの代表又はコードベクトル
を含みうる。

【００１０】上記引用の特許出願ではＲａｙ、Ｅｌｌｓ
ｏｎ、Ｇａｎｄｈｉによる米国特許出願０８／１４５０
５１及びＲａｙ、Ｅｌｌｓｏｎによる米国特許出願０８
／１４５２８４の両方は画像のライブラリ内の標準化さ
れた特徴の利点により画質の最小の損失で非常に高い圧
縮比を可能にするシステムを記載している。これらの特
許出願はライブラリ内の画像の共通の特徴を抽出し、こ
れを画像標準化の基本として用いる処理を記載してい
る。いったん標準化されたライブラリ画像内に標準化さ
れると、画像は圧縮され、続いて元のライブラリ画像の
損失のある表現に圧縮復元される。

【００１１】上記引用された特許出願の技術の概要は以
下を含む：標準化：最も重要な画像特徴を選択する。選択された特
徴を増強するためにライブラリから代表的な画像の組を
処理する。

【００１２】代表的な画像内に選択された特徴を配置す
る。画像特徴の位置に対する拘束を決める。画像特徴位
置拘束に合うように画像を処理する。特徴の表現又は画
質の望ましいレベルに基づき画像の領域を割り当てる。
各副領域に対して画像の画像対画像相関を決める。

【００１３】画像ブロック内の副領域の分割及びコード
ブックの大きさに基づき各副領域に対する画像情報の記
憶容量を割り当てる。相関の利点を有するようコードブ
ックを構成する。特徴を増強するよう画像を処理する。
選択された特徴を画像内に配置する。

【００１４】画像特徴配置拘束に合うように画像を処理
することにより画像を標準化する。副領域及びそれらの
画像ブロックに基づき画像を分割する。各領域に対して
画像を最良に近似するコードブック内のエントリを決め
る。これが圧縮された画像であるときに各画像ブロック
に対する一連のコードブック値を記憶する。圧縮復元一連のコードブック値からコードブック値を抽出する。

【００１５】一連のコードブック値内の対応する副領域
の位置に基づきコードブックを決める。上記決定された
コードブック値からコードブック値に基づき画像ブロッ
クを抽出する。画像ブロックを副領域内の近似画像ブロ
ック位置にコピーする。

【００１６】全ての画像ブロック位置がエントリ画像内
に満たされるまで画像ブロックを挿入し続ける。磁気取
引カードの単一トラックに対する国際規格を満足する方
式で圧縮された顔画像を記憶するために、圧縮された顔
画像データは５００ビット以下でなければならない（Ｉ
ＳＯ７８１１参照）。この容量は磁気トラックのビット
容量を更に減少するある予約された文字の存在により更
に妥協される。Ｒａｙ、Ｅｌｌｓｏｎによる１９９３年
１０月２９日出願の米国特許出願０８／１４４７５３、
「ＭｅｔｈｏｄＡｎｄＡｐｐａｒａｔｕｓＦｏｒ
ＤａｔａＥｎｃｏｄｉｎｇＷｉｔｈＲｅｓｅｒ
ｖｅｄＶａｌｕｅ」にはデータの制限は４５１ビット
のトラックの一つに対して情報理論的最大記憶容量を有
するように示されている。その出願はまた拘束されない
データの４４２ビットを記憶するエンコード方法を記載
している。

【００１７】４４２ビット内へ顔画像を記憶する場合の
ように目標ビット数が極端に小さいときには上記の圧縮
／圧縮復元処理は満足できる質の顔画像を提供できな
い。満足できる画質は画像から個人を識別することを企
てたときに望まれる。付加的な改善がより要求される確
認システムに対する圧縮された画像の質において必要で
ある。より特徴的には改善の機会はコードブック形成、
画像標準化、画像ブロック対称性に存在する。

【００１８】従来の圧縮方法はＬＢＧアルゴリズムと称
されるトレーニングに基づくコードブック形成処理を用
いていた。このアルゴリズムはクラスター化アルゴリズ
ムと称されるアルゴリズムの組を形成する一つである。
このアルゴリズムの特徴はデータ組内の所定の群の数を
三井だし、最適な方法でその群に対する代表を選択する
ことである。ＬＢＧアルゴリズムの場合にはデータ組は
多数の画像からの画素のブロックからなり、そのアルゴ
リズムはデータ組を最良に代表する所定の数のブロック
を見いだすために作動する。何がよいかを測定するため
の多くのマトリックスがある一方で最も通常の物はユー
クリッド的な意味での最小距離、即ち画素間の差の２乗
の和である。群の代表はしばしば群の重心（ｃｅｎｔｒ
ｏｉｄ）であり、即ち群内のブロックの平均である。Ｌ
ＢＧアルゴリズムは最初に群の割り当てを作り、各群に
対する重心を選択し、最近接重心を選択することにより
データ組の要素を重心に対して再割り当てすることによ
り処理する。再割り当ては新たなグループかを形成し、
アルゴリズムは収束が生ずるまで反復的なやり方で継続
可能である。

【００１９】多くの場合には多数の群が所望の数で開始
する一方で再割り当て処理は群の全体の数を減少する。
結果は他の群の付加はよりよい全体の結果を与える故に
準最適である。この故に能動群の数を維持する方法が望
まれる。起こりうる他の問題は極端に少ない数のメンバ
ーを有するよう減少されうることである。群が単一メン
バーを有する場合には重心はそのメンバーであり、メン
バーとその重心との間の距離はゼロであり、クラスター
が残る。ここでの結果はある群は大きく、よりよい集団
の結果は大きな群を割ることにより達成されうる。

【００２０】好ましい方法は群の数を計数することによ
り能動群の数を維持し、各群に対して延長、即ち群の直
径を決定し、ある群がメンバーを有さない場合には最大
の延長の群を２つのより小さな群に分割することであ
る。過剰に小さな群の問題はアウトライアーとしてこれ
らの群のデータ要素を扱うように処理され、データ組か
らそれらを除去することである。この処理は注意してな
されなければならず、さもなければデータ要素の非常に
多くが廃棄される。

【００２１】顔画像内の相関の一つの型は顔の左右の側
の間の概略鏡像対称である。前面に近い遠近肖像でしば
しば大きな度合いの相関が中心線に近い顔の部分間に存
在する。特に目の上及び下の部分を描くために用いられ
る画像ブロックは高度に対称的な相関を示す。しかしな
がら顔の中心線に沿って、対称のレベルは若干異なる角
度から見たときに鼻の現れ方の変動により低下する。必
要なことは鼻の上に有害な対称性の拘束を課すことなし
に顔の中心線の周辺の領域内の人間の顔の自然な対称性
を探すことにより圧縮された肖像画像を記憶するのに必
要なビット数を更に減少する方法である。

【００２２】人間の顔の幾何配置は本質的な対称性を有
する一方で肖像に対する照明の条件は高度に非対称的で
ある。これは人間の顔の肖像の左右の側間の照度の不均
衡を生ずる。必要なことは顔画像肖像標準化のより高い
程度を達成するために及び人間の顔画像の自然な対称性
を増強するために人間の顔肖像の照明をバランスする方
法である。

【００２３】輝度及び画像特徴の両方の標準化により特
徴化されたコードブックは画像内で特殊な位置で予想さ
れた画像内容をよりよく表すよう発展されうる。コード
ブック特徴化はＳｅｘｔｏｎによる米国特許第５０８６
４８０号、「ＶｉｄｅｏＩｍａｇｅＰｒｏｃｅｓｓ
ｉｎｇ」に記載され、ここでは２つのコードブックの使
用が教示されている。この方法は両方のコードブックを
精力的に捜索することにより２つのコードブックのうち
から最良のコードベクトルを見いだし、そして最良の適
合が見いだされたコードブックにフラグを付ける。正味
の結果はフラグが選択されたコードブックを示す異なる
コードベクトルの数が可能な２つのコードブックを含む
「超コードブック」である。コードブック選択は画像の
領域の内容の先験的な知識から生じない；Ｓｅｘｔｏｎ
は画像毎のコードブック毎にどのコードブックが用いら
れるかを計算する。より大きな圧縮の機会はコードブッ
クフラグを記憶する必要を除去することである。

【００２４】肖像画画像のある領域はどんな顕著な値も
個人の識別に対して貢献しない。例えば肩の領域は識別
処理に対して最小の値であり、更にこの領域は通常衣服
により覆われ、これは同じ個人に対しても高度に変化す
る。そのような領域内にほとんどの値が置かれない故に
画像をエンコードするためのビットの割り当てはまた減
少される。本発明ではこれらの領域の幾つかはもしあっ
たとしてもほとんど割り当てられず、画像データは隣接
するブロックの画像データから合成される。これはより
重要な領域をエンコードするためにより多くのビットの
割り当てを許容する。

【００２５】

【発明が解決しようとする課題】本発明の目的は最小の
ビット数で肖像画画像をエンコードすることである。

【００２６】

【課題を解決するための手段】本発明の一つの好ましい
方法はａ．規格化された方向及び位置で少なくとも一つの予
想された特徴を配置するようにデジタル化された画像を
選択されたクラスから標準化し；ｂ．選択されたクラスから標準化された画像により表
される特徴に対して予想された配置を決定し；ｃ．選択されたクラスの標準化された画像から各特徴
に対して予想された位置で現れる画像内容を抽出し；ｄ．各特徴に対して段階ｃの抽出された画像内容から
似た特徴のアドレス可能な集合を形成する各段階からな
るデジタル化された画像の選択されたクラス内の特徴を
表す画像特徴のアドレス可能な集合を形成する方法であ
る。

【００２７】画像の選択されたクラスを表すコードベク
トルにより画像特徴のアドレス可能な集合を形成する本
発明の装置の実施例は選択された画像特徴に対する好ま
しい位置を含む画像の選択されたクラスに対する標準を
確立する手段と；各画像の選択されたクラス内から少な
くとも一つの選択された画像特徴を配置する手段と；少
なくとも一つの選択された画像特徴が確立された標準に
より配置される標準化された幾何画像を形成するために
各画像の選択されたクラスを操作する手段と；標準化さ
れた幾何画像からそれぞれが問題の画像特徴を表す特徴
ブロックを抽出する手段と；全ての似た特徴ブロックを
一つの群に集めるグループ化手段と；各群に対してそれ
ぞれの群を表すコードベクトルにより画像特徴のアドレ
ス可能な集合を形成する手段とからなる。

【００２８】本発明の全体の目的は取引カードのカード
保持者の識別処理で用いられる適切な質の顔画像を形成
する技術を提供することである。本発明は肖像画画像の
圧縮、記憶、検索を可能にし、ここで圧縮された肖像画
画像データは国際規格により特徴づけられるように取引
カードの単一トラック内に記憶可能である。本発明は更
にコードブック作成、顔画像の照明条件を標準化するた
めの輝度バランス方法、対称的な顔領域に対する連結さ
れた画像ブロックの改善されたトレーニング方法を付加
することにより従来技術の圧縮方法を更に改善する。

【００２９】上記より本発明の目的は最小のビット数で
肖像画画像をエンコードすることである。本発明の他の
目的はコード化された画像を迅速にデコードするデコー
ド化技術を提供することである。本発明の更に他の目的
は改善されたコード化された肖像画画像を提供すること
である。

【００３０】本発明のその他の目的はエンコードから問
題の領域でない画像の部分を除去する能力を提供するこ
とである。本発明の更なる目的は実際の画像データの欠
如に対して似た画像内容を挿入することを可能にする技
術を提供することにある。

【００３１】

【発明の実施の形態】以下に本発明の一部であり同じ部
分は同じ記号で表された図面を参照して本発明の上記の
及び他の目的を更に詳細に説明する。図１のブロック図
は本発明の機能の概略を示す。図１内ではトレーニング
画像１０はトレーニング画像１０を整合したフォーマッ
トの標準化されたトレーニング画像に処理する標準化器
内にロードされる。標準化されたトレーニング画像はト
レーニング画像ブロックを生成するよう特徴テンプレー
ト１４を用いて更に処理され、その機能はトレイナー１
６により表される。トレイナー１６はトレーニング画像
ブロックに基づくコードベクトルからなるコードブック
を形成する。特徴テンプレート１４と結合されたコード
ブックは圧縮及び圧縮復元処理に対する基本となる。例
えば２０である標準化された画像は標準化器１２の機能
を用いて肖像のような元画像から形成される。エンコー
ドされるべき標準化された画像２０がデータ圧縮器２２
に送られるときに圧縮器は圧縮された画像２４を形成す
る。圧縮された画像は将来の使用のために記憶され及び
／又は転送される。好ましくは圧縮復元器２６により圧
縮器２２で用いられたのと同じ同じ特徴テンプレートと
コードブックを用いてなされる圧縮復元処理は復元画像
２８を提供する。

【００３２】図２の（Ａ）は前面の顔の肖像である画像
を示す。この画像の例では顔は傾けられ、画像の中心に
関して平行移動されて（中心から外されて）いる。元の
画像に依存して画像内の顔の位置及び大きさの他の変動
が生じうる。本発明で最大の結果を達成するために顔の
大きさ、位置、向きは標準化されるべきである。画像上
で操作するために画像は画素値のマトリックスとしてデ
ジタルフォーマットに移行される。画像のデジタルフォ
ーマット（画素値）は本発明の一部ではないスキャン及
び／又は他のよく知られたデジタル処理技術によりえら
れる。それからデジタル画像は例えば図２３に示される
表示器２０２のような表示装置上に表示され、標準化処
理は標準化された幾何画像を形成するよう適用される。
画像は特徴テンプレート１４に関するテンプレート要素
間の質の整合を提供するように標準化される（詳細は後
で説明する）。処理は画像対象の左右の目の中央を位置
決めすることにより図２の（Ａ）の画像から開始する。
図２の（Ｂ）では部分的に標準化された幾何画像である
新たなデジタル画像は必要なら図２の（Ａ）の元画像を
回転し、平行移動することにより形成される。回転及び
平行移動は所定の水平軸に沿って、中心垂直軸に関して
等しく離間された左右の目の中央を位置決めするように
よく知られた画像処理操作を用いてソフトウエア内で達
成される。図２の（Ｃ）は標準化された幾何画像を形成
するためにスケーリング処理により大きさを変えられた
図２の（Ｂ）の画像を示す。

【００３３】図３を参照するに標準化された幾何画像を
形成する処理フローはその機能を識別するために「画像
の選択」とラベルされた操作ブロック３０から始まるフ
ローブロックの左の列から始まる。図に示されるフロー
ブロックの全てはそれらの機能によりラベルされる。選
択処理はテンプレート１４で処理された画像を有するよ
うな個人の前面の顔画像の存在に基づき選択される。選
択処理に含まれるのは画像のデジタルマトリックス表現
の形成である。デジタルマトリックスは操作３２で操作
者に対して表示するためにシステム内に次にロードされ
る（図２２のシステムを参照）。上記のように操作者は
操作３４で左右の目の点を位置決めし操作３６で標準化
された幾何画像を形成するために画像の顔部分の必要と
されるいかなる回転、平行移動、再スケーリングをもな
す。それから標準化された幾何画像は操作３８で記憶さ
れる。

【００３４】より特徴的には本発明の好ましい実施例で
は画像の標準幾何配置は画像の上端から２８画素、仮想
的な垂直中心線のそれぞれの側上に８画素の位置の目の
中心を有する幅が５６画素、高さが６４画素の画像の大
きさになるよう設定される。左右の目の中央を識別する
ことはマウス、デジタル書き込みタブレット、ライトペ
ン、又は接触感応スクリーンのような装置により駆動さ
れるカーソルを用いて中央を指示する人間の操作者に最
初の画像を表示することによりなされる。代替的な方法
は特徴捜索プログラムを用いて処理を自動化することで
ある。一実施例では人間の操作者は目の位置を位置決め
し、プロセッサは操作者が特定した位置の小さな近傍周
辺に限定される目の発見捜索方法を通して位置を精密に
調整する。

【００３５】なされた画像の大きさ及び目の位置調整と
共に輝度の標準化過程がなされる。ブロックの右側列で
偶数ラベルされた４０ー５４は標準化された幾何画像の
輝度は得られた標準化された幾何画像が将来の使用のた
めに記憶されるよう画像対象の曝される照明での変化可
能性を減少し、皮膚の階調を所定の値に調整して鏡映的
な高輝度を減少し、影を減少するために処理される。ト
レーニング画像の輝度の変動を標準化するために用いら
れる３つの空間的スケールがある；それは光のレベル／
方向に対して大きく、側方の光からの非対称な影を補正
することに対して中間で、ガラス、宝石、皮膚からの鏡
映的な高輝度の減少に対して小さい。これらの過程は画
像内の平均輝度レベルを変化する。コントラストと称さ
れる輝度レベルの変動は特徴を識別するのに有用なある
特徴を強調するためにまた調整されるが、カラー画像を
白黒階調に変換するときは減少される。

【００３６】記憶する前の画像標準化処理の最終段階は
顔の平均輝度、即ち鼻の一般的な近傍で見られる平均照
明を設定値にシフトすることである。本発明の好ましい
実施例では明るい皮膚の色調の人に対しては設定値は１
６５であり、中間の皮膚の色調の人に対しては設定値は
１５５であり、暗い皮膚の色調の人に対しては設定値は
１３５である。ここで形成された標準化されたデジタル
画像は画素値の記憶可能なマトリックスにより表現され
る。

【００３７】図４は標準化された画像と共に用いられる
テンプレート１４のレイアウトを示す。テンプレート１
４はＡからＭとラベルされた６４のテンプレート要素内
に分割される。要素は人間の顔の１３の対応する特徴に
関して配置され、例えばＡとラベルされたテンプレート
要素は頭の上端で頭髪の特徴に対応し、Ｇとラベルされ
たテンプレート要素は目に対応する。図８、９、１０の
表は残りのテンプレート要素の更なる記載を提供する。
本発明の好ましい実施例は６４テンプレート及び１３特
徴でなされるが、これらの数は状況に沿って変化され
え、本発明の方法の構成を制限するものではない。テン
プレートのある領域はどの要素に対しても割り当てられ
ていない。これらの割り当てられない領域はコードブッ
クからの情報の検索に基づきそれらの画像内容を有さな
い。画像内容をこれらの領域に割り当てる方法は以下に
説明する隣接する領域の割り当てに基づく。テンプレー
トの大きさは幅が５６画素で高さが６４画素の標準化さ
れた画像の幾何配置に整合する。テンプレート要素の大
きさは表現しようとする顔の特徴の大きさに依存する。
例えばＧは標準化された画像内の目の大きさに関し、要
素Ｇの両方の例は標準化された画像内の目の位置に配置
される。

【００３８】図５を参照するに影を付けられたテンプレ
ート要素は以下に詳細に説明する左右を裏返した性質を
割り当てられている。図６を参照するに影を付けられた
テンプレート要素は以下にまた詳細に説明する上下を裏
返した性質を割り当てられている。テンプレート要素は
一以上の性質を割り当てられるものである。

【００３９】テンプレートの他の性質は連結である。図
７に影を付けられた領域は連結の部分である点プレート
要素の配置を示す。この特定の実施例では要素の７つの
連結された対が存在する。連結は例えば中央の左でＧは
中央の右でのＧに連結されるように影を付けられたテン
プレート要素の各対間で水平である。７つの連結された
対は好ましい実施例として示され、連結は２以上の群及
び類似のラベルされた要素のどの組の間でも生じうる。

【００４０】図からわかるようにテンプレート１４は一
連のデータ記録を表す一連のテンプレート要素からな
り、ここで各記録は好ましい実施例では位置、大きさ、
ラベル、左右の性質、上下の性質、連結を記述する。他
の及び／又は付加的な要因を有する記録は必要が生じた
ときに形成される。テンプレート１４はテンプレート要
素の分布及び大きさを記録する。各テンプレート要素は
コードブック１８（図１を参照）と画像に対応する空間
配置に割り当てられる。上記のようにテンプレート１４
は長方形画素領域からなる６４のテンプレート要素から
なる。これらのテンプレート要素はそれぞれが顔の特徴
の異なる型に対応する１３の異なるコードブックの一つ
に割り当てられる。コードブック１８は４ｘ１６，８ｘ
８，８ｘ５，４ｘ１０，４ｘ６，又は８ｘ４のいずれか
の画素の均一な大きさのコードベクトルの集合である。
コードブック１８内にあるコードベクトルはトレイナー
１６（図１）によりトレーニング画像から抽出された画
像ブロックから形成される。

【００４１】図８では表は図４から７に示されるテンプ
レート要素Ａ−Ｍの性質を記述する。コードブックの最
初にリストされた性質はコードブックが含むコードベク
トルの数であり、これは１２８又は２５６である。これ
らの数は両方とも２の冪乗であり、特にそれらは２⁷及
び２⁸である。これは７ビット又は８ビットインデック
スの全範囲を用いるコードベクトルを特定するために用
いられるコードブックインデックスとして利点である。
コードブックのインデックス長さは８又は７のどちらか
として図５の表に示される。コードブックに対する画像
ブロックの次元はリストされた第二及び第三の性質であ
り、画素でのブロックの幅及び画素でのブロックの高さ
として与えられる。ブロック当たりの画素数はブロック
幅とブロック高さの積である。第四のリストされた性質
はコードブックに割り当てられた特定の実施例の特徴テ
ンプレート内のテンプレート要素の発生数である。第五
にリストされた特徴の性質は唯一性の性質であり、これ
らのテンプレート要素が何回唯一選択されたかを示す
（これは連結されたテンプレート要素の各組の一つのメ
ンバーを除去する）。第六にリストされた特徴の性質は
コードブックから選択されたコードベクトルを記憶する
ために割り当てられたビットの数である。これは唯一の
テンプレート要素の数とビット内のインデックス長さの
積である。特徴ビット行内のエントリの和は４４２であ
り、これは拘束されない２進数の記録として圧縮された
画像を記憶するために必要なビットの全数である。斯く
して特徴テンプレートは図４ー７のマップと図８に示さ
れた表の両方を構築するために必要とされる全ての情報
を含む。図９と１０の表はデータの形で図４ー７のマッ
プを示す。

【００４２】図１１に示されるトレイナー１６の操作フ
ローを参照するに、第一のブロックであるブロック７０
０は標準化されたトレーニング画像のロードを表す。こ
れは肖像画像の代表と考えられる画像の集合であり、こ
れはこのトレーニング処理により形成されたコードブッ
ク１８を用いて圧縮するために圧縮器２２に送られる。
第一の画像ブロックはブロック７０２により代表される
ような選択されたコードブックの型に対する画像から抽
出される。次に抽出された画像ブロックは上記の上下及
び左右の裏返しの性質のようなそれらの対称性の型に基
づいて方向付けられる。次のブロックは決定ブロック７
０６であり、標準化された画像トレーニング組内の他の
画像の存在をチェックする。一般に２０００画像がこの
トレーニング処理に対して推薦される。組内に他の画像
がある場合には処理は図に示されるようにブロック７０
２にループバックする。そうでなければブロック７０８
に進み、ここでは重心はランダムな画像ブロックとして
初期化される。好ましい実施例では重心は画像ブロック
の第一のシーケンスとして初期化される。次にブロック
７１０を参照するに各画像ブロックはブロック７０８で
決められた最も近い重心に割り当てられる。ブロック７
１２では閾値より相互に近接する重心は結合される。例
えば２つの重心が非常に接近するとしてフラグ付けされ
た所定の距離より小さくなるよう決定された場合にはそ
れらは結合され、全ての画像ブロックは単一の重心に割
り当てられ、他の重心は割り当てられないままである。
ブロック７１４を参照するに大きな延長の重心は割り当
てられない重心で分割される。これは重心がそれに割り
当てられた異なるコードベクトル間で非常に大きな距離
を有する場合にはこの重心は２つの重心に分割され、こ
こでこれらのコードベクトルに割り当てられた新たな重
心の一つは前の段階からの割り当てられていない重心か
ら来る。ブロック７１６では最小に占有された重心は割
り当てられず、それで大きく延長するように決定された
残りの重心を分割するよう用いられる。ブロック７１８
では再近接の重心は共に結合される。更に再びブロック
７２０での結合処理から得られた新たに割り当てられて
いない重心を取り、大きな延長のそれ以上の重心は分割
される。ブロック７２２を参照するに新たな位置は各重
心に対して見いだされる。この処理が要求されるのは画
像ブロックの割り当てを種々の重心に対して組み替える
ことにおいて重心に割り当てられたコードベクトルの中
心の位置は実質的に変化されるからである。各重心群に
割り当てられたコードベクトルの群の中心に対する新た
な位置は重心はいかにして画像ブロック再割り当て処理
を通して動くかを決めるために計算される。ブロック７
２４を参照するに最近接重心に対するこれらの画像ブロ
ックの各一つの割り当てはなされ、それ故に重心はビッ
トの周辺で動き、一つの重心に割り当てられた画像ブロ
ックのあるものは実際に他の重心により近いことが可能
である。

【００４３】ブロック７２６を参照するに重心は最大か
ら最小に占有されるよう再配列される。この再配列は将
来の反復で再割り当て処理を加速する。ブロック７２８
では収束テストがなされる。収束が完全でない場合には
処理はブロック７１２に戻り、ここでは近接しすぎてい
る重心は結合される。収束が完全である場合には処理は
ブロック７３０に進み、ここでは重心は新たに形成され
たコードブックのコードベクトルとして記憶される。

【００４４】図１２を参照するにコードベクトルの部分
集合が示され、特徴の型Ａ，Ｇ，Ｍに対応するコードブ
ックに対して詳細に示される。図１２の特徴要素Ｇ１２
３は図３、４ー７、８、１５のテンプレート内の左右の
目要素に対応する。同様にして図８のＡ４６は図３、４
ー７、８、１５内に示されたテンプレートの左上隅の髪
の毛に対応する。

【００４５】図１３はフローチャートの形で画像の種々
のテンプレート要素に対する最良適合コードベクトルを
見いだす処理を示す。この処理はブロック９００、９０
２に示される標準化された画像のロード又は標準化され
るべき画像のロードで開始する。標準化された画像は図
１のブロック２０に対応し、ブロック９０２により表さ
れる処理の結果である。

【００４６】ブロック９０４では第一のテンプレート要
素に対応する次の画像ブロックは標準化された画像から
抽出される。抽出された画像ブロックはブロック９０６
に示されるように水平に裏返す及び／又は垂直に裏返す
性質の対称の型に基づいて方向付けられる。ブロック９
０８ではコードブックからの最良適合コードベクトルの
インデックスがそのテンプレート要素に対する特徴の型
に対応するコードブック内のコードベクトル全てと比較
されることにより見いだされる。比較ブロック９１０は
テンプレート内に記憶されている情報に基づきブロック
が連結されているかどうかを決定する。ブロックが連結
されている場合にはフローはブロック９１４に進み、こ
こでどのくらい良い整合が生じたかを表す値が記憶され
る。本発明の特定の実施例ではこれら２つの画像ブロッ
クとコードベクトルとの間の平均２乗誤差の比較は他の
良さの測定が既に考えられているにもかかわらず適合の
良さの測定として用いられる。ブロック９１６では好ま
しい実施例として適合からの値は群内の他の連結ブロッ
クと比較される。ブロック９１８では最良の値を有する
コードベクトルは選択され、この場合には平均２乗誤差
テストに対して最低の値である。このベクトルはコード
ブックからの最良適合コードベクトルのインデックスと
してブロック９１２で用いられる。画像ブロックが連結
されていない場合にはブロック９１２に直接進む。ブロ
ック９１２から処理はこれはテンプレート内で最後の要
素であるかどうかを決定する他の比較ブロックであるブ
ロック９２０に進む。そうでない場合には処理はブロッ
ク９０４に戻り、次のテンプレート要素に対応する次の
画像ブロックを抽出する。それが最後の画像ブロックで
ある場合には処理はブロック９２２内の圧縮された画像
ビットストリームを構築する処理に進む。構築処理は図
１４に示される。

【００４７】次に図１４では、ブロック９５０でビット
ストリームポインタＢＰＳはゼロに設定され、テンプレ
ート要素ポインタＴＰもまたゼロに設定される。ブロッ
ク９５２ではテンプレート要素数ＴＰが検索される。ブ
ロック９５４はテンプレート要素が連結されるかどうか
を決定する決定ブロックである。テンプレート要素が連
結されていない場合には処理はこれは連結群の最初の発
生かどうかを決定する第一の決定ブロック９５６に進
む。その要素が連結群の最初の発生の場合には処理は以
下に説明するブロック９５８に進む。それが連結群の最
初の発生でない場合には処理は以下に説明するブロック
９６６に進む。

【００４８】ブロック９５８を参照するに「ＢＮ」とラ
ベルされたテンプレート要素からビット数が検索され
る。このビット数はテンプレート要素のコードベクトル
インデックスをエンコードするのに用いられる。好まし
い実施例ではこれらはテンプレート要素当たり７又は８
ビットのいずれかである。ボックス９６０に進んでコー
ドベクトルインデックスはＢＮビットでエンコードされ
る。

【００４９】ブロック９６２ではビット位置ＢＳＰで開
始するビット数ＢＮが挿入される。ブロック９６４でビ
ットストリームポインタＢＳＰはＢＮだけ増加され、ブ
ロック９６６ではテンプレート要素ポインタが一だけ増
加される。決定点９６８はテンプレート要素は使われ切
ったかを訊ね、答えが「イエス」の場合にはビットスト
リームはブロック９７０で完了する。答えが「ノウ」で
あり、更にテンプレートが存在する場合には処理ループ
はブロック９５２に戻り、処理は継続する。

【００５０】図１５は図１２、１３に記載された最良適
合コードベクトル比較処理の特徴的な標準化された画像
に対する結果を示す。図１５で各テンプレート要素はそ
れに割り当てられた文字及び数の両方を有する。文字は
テンプレート要素に対応する特徴の型を示し、数は良さ
の測定の実施例による最良適合コードベクトルのインデ
ックスを示す。

【００５１】図１６の表は左の列から右の列へシーケン
ス内に配列された数を有する最良コードベクトルを示
し、それは図９及び１０の表内に示されるテンプレート
要素のシーケンスに対応して下方へ向かう。図９、１０
に当てはまるテンプレート要素のシーケンスを維持する
ことは重要であり、それにより図１４に示される処理は
圧縮された画像ビットストリームを正確に翻訳するビッ
トストリームポインタを有する。図１６に示される最良
コードベクトル数のそれぞれに対するインデックス長さ
はインデックス長さとして図８に示される表からの特徴
の型のインデックス長さに対応する。最良のコードベク
トル数の表現はインデックス長さに対応する長さを有す
るビット表現でビット表現列内で２進数表現として示さ
れる。２進数が不充分なディジットを有する場合にはそ
のビット表現の先の列内のインデックス長さに対応する
２進長さを有するようゼロを詰める。ビット表現列内の
２進数ディジットが連続する場合には左の列から開始
し、下へ進み、それから右の列に入り、得られた４４２
ビット２進数は最終的な圧縮された画像出力に対応す
る。これは図１の圧縮された画像２４に対応する。

【００５２】図１７はデジタル記憶の手段を有する取引
カード１２０を示す。この記憶手段は磁気エンコードの
ような種々の手段により、又はバーコードパターンによ
り達成されうる。磁気記憶の場合には通常の方法は磁気
記憶領域１２２に対して図１７に示されるようにトラッ
ク１、トラック２、トラック３により示されるような複
数のトラックを有する。

【００５３】図１８を参照するに圧縮されたビットスト
リームは復元された画像を形成するよう圧縮復元され
る。ビットストリームポインタＢＳＰはゼロに初期化さ
れ、テンプレート要素ポインタＴＰはブロック３０２で
ゼロに設定される。処理はブロック３０４に進み、ここ
ではテンプレート要素ＴＰは検索される。ブロック３０
６ではテンプレート要素が連結されているかどうかに関
する決定がなされる。連結されていない場合には処理は
ブロック３０８に進む。連結されている場合には処理は
決定ブロック３０８に進む。決定ブロック３０８はこれ
が連結された群の第一の発生かどうかを決定する。それ
が処理である場合にはブロック３１０へ進む。それが処
理でない場合にはブロック３１２へ進む。

【００５４】ブロック３１０を参照するにコードベクト
ルインデックス及びコードブック型に対するビットＢＮ
の数はテンプレート要素から抽出される。ＢＳＰ＋ＢＮ
−１を介したＢＳＰのビットはブロック３１４での圧縮
されたビットストリームから抽出される。ビットストリ
ームポインタはブロック３１６内でＢＮだけ増加され
る。それから処理はブロック３１８に進む。ブロック３
１２へ戻るフローを再び辿るとその群の最初の発生でな
い結合された群がある場合に連結群の前の発生からコー
ドベクトルインデックスはコピーされる。前の発生はブ
ロック３１８に移動する。ブロック３１８では示された
コードブック型からのインデックスコードベクトルが検
索される。このコードベクトルは特定の画像からの特徴
型を表す。テンプレート要素はブロックがどのように向
けられていなければならないかを示す。ブロック３２０
ではテンプレート要素により示されるようにブロックを
向ける。示されている場合には水平、左右裏返し又は垂
直、上下裏返しがなされる。ブロック３２２ではテンプ
レート要素により示された位置内のブロックは画像内に
挿入される。ブロック３２４ではテンプレートポインタ
ＴＰは１だけ増加される。決定ブロック３２６は全ての
テンプレート要素が用いられたかどうかを決定する。そ
うでなければ処理はブロック３０４に戻り、継続する。
全てのテンプレートが用いられた場合には処理は図１９
内の点Ａに移動する。

【００５５】図１９ではインデックスを構築する処理が
示される。次に処理はそれらに割り当てられているテン
プレート要素を有さないそれらの領域を構成する。それ
らしい画素はブロック３２８でそれらの領域に対して用
いられる。ブロック３３０内の画像ブロックは平滑化さ
れねばならないそれらの間の継ぎ目を有し、この処理は
ブロック３３０に示される。継ぎ目の平滑化は水平及び
垂直の両方の継ぎ目を横切る平均を取ることにより達成
される。ブロック３３２では再構成された画像のコント
ラストは増強される。これは画像の全ダイナミックレン
ジ０ー２５５が再構成された画像内で用いられることを
確かにする。好ましい実施例ではこれは簡単な線形再ス
ケール化によりなされる。ブロック３３４では空間的に
依存するランダムノイズが付加される。これは画像の中
心に関してなされ、画像の中心は非常に少なく、周辺の
画像ノイズは更により強調される。ブロック３３６では
再構成された画像は出力される。出力された画像は図１
のブロック２８の復元された画像に対応する。

【００５６】図５、６はどのテンプレート要素がそれぞ
れ左右及び上下の裏返しの性質を有するかを示す。これ
らの裏返しの性質を有するテンプレート要素はまた図９
及び１０の表内で真／偽フラグで示される。裏返される
べき図２０でのコードベクトルは画素を表す箱を介して
対角線により識別される。図２１は裏返しの性質の図２
０内のコードベクトルに対する適用を示し、ここで図５
内の影を付けられたテンプレート要素に対応する図２０
内の全てのコートベクトルは左右を裏返され、図６内の
影を付けられたテンプレート要素に対応する図２０内の
全てのコートベクトルは上下を裏返される。あるテンプ
レート要素は図２０から図２１のコードベクトル方向へ
コードベクトルの平行移動で裏返され、裏返しは関連す
る要素内でもなされる。

【００５７】次の段階は図２１の方向付けられたコード
ベクトルモザイクに基づく図２２に示される最終画像の
画像処理操作により形成される。図２１のモザイクはコ
ードベクトルからのその構成の結果としてある視覚的に
好ましくないアーティファクトを有しうる。これらのア
ーティファクトは画像処理アルゴリズムのある組み合わ
せで減少されうる。

【００５８】好ましい実施例ではよく知られた画像処理
操作の組み合わせはコードベクトル境界を横切る平滑
化、コントラスト増強、失われた画像領域を満たすため
の線形補間、空間的に依存するランダムノイズの付加を
含むように適用される。平滑化操作は３つの連続した画
素、Ｐ₁，Ｐ₂．Ｐ₃を考えることにより説明され、ここ
でＰ₁，Ｐ₂は１つのコードベクトルであり、Ｐ₃は付加
的なコードベクトルである。画素Ｐ₂は以下の結果によ
り置き換えられる：（Ｐ₁＋２＊Ｐ₂＋Ｐ₃）／４コントラスト増強はモザイクに対して最小画素値ｍｉｎ
と最大画素値ｍａｘとを決定することにより達成され
る。モザイクの各画素値Ｐ_curは以下の式によりＰ_n _ewに
より置き換えられる：Ｐ_new＝２５５＊（Ｐ_cur−ｍｉｎ）／（ｍａｘ−ｍｉｎ）どのテンプレート要素にも対応しない特徴テンプレート
の領域は線形補間を用いて満たされる。各領域に対して
境界画素の知られている値は平均画素値を計算するため
に用いられる。知られている境界に対向する知られてい
ない隅はこの平均値に対して設定される。割り当てられ
ない内部の画素の残りは線形補間により計算される。本
発明の好ましい実施例では特徴テンプレートの隅にそれ
ぞれ位置するそのような４つの割り当てられない領域が
ある。

【００５９】加えられる空間的なランダムノイズは以下
により決定される：ｎ（ｉ，ｊ）＝ｖ＊ｓｑｒｔ（（ｉ−２８）＊＊２＋（ｊ−３２）＊＊２）＊ｒａｎｄｖ＝ノイズ振幅ここでｉ＝影響される画素の列ｊ＝影響される画素の行及びｒａｎｄは範囲（ー１から１）での浮動小数点の疑
似乱数である。値ｎ（ｉ，ｊ）は位置（ｉ，ｊ）での画
素に加えられる。得られた画素が２５５以上である場合
にはそれは２５５にクリップされ、ゼロ以下の場合には
０に設定される。図２２はこれらの操作により処理され
た後の画像を表す。他の画像処理操作は他の状況で用い
られ、好ましい実施例は制限されるとは考えられないも
のである。

【００６０】図２３は本発明が実施される装置１００を
示す。装置１００は写真プリント８０又はネガ画像８２
のようなデジタルでない画像を画像のデジタル表現に変
換する手段１０２からなる。一般に変換は画素値をアナ
ログの形で表す信号を出力するスキャナー１０４でなさ
れる。アナログ／デジタル変換器１０６はアナログ画素
値をスキャンされた画像のデジタル値表現に変換するた
めに用いられる。デジタル画像の他の入力源はワークス
テーション２００内への直接入力である。本発明の好ま
しい実施例の装置ではワークステーション２００はオペ
レーティングシステムとしてＵＮＩＸが走り、標準Ｃプ
ログラム言語を用いてエンコードされたサンスパーク
１０である。デジタル画像の表示はソフトウエア、キー
ボード２０４、マウス２０６制御の下で操作される表示
器２０２による。デジタル画像はまたＣＤ読み出し器２
０８又は他の同様な装置によりシステム内に導入され
る。本発明の方法により形成されたテンプレートはＣｄ
乗に記憶するためにＣＤ書き込み器２１０にダウンロー
ドされ、プリンター２１２によりハードコピープリント
され、データ記憶領域内にエンコードされるよう取引カ
ード書き込み器３２７にダウンロードされ、又はモデム
２１４と伝送線により遠隔地で更に処理又は記憶される
よう伝送される。

【００６１】

【発明の効果】本発明の利点は以下の通りである：圧縮
された画像を表現するために必要なビットの数は実質的
に減少される。皮膚の平均輝度の画像間の変動の減少は
良く整合されたブロックを提供するよう顔領域内でコー
ドブックの能力を改善する。

【００６２】連結されたテンプレート要素の使用は圧縮
された画像の記憶に要するビット数を増加しないで画質
を向上する。テンプレート要素に関係しない画像の領域
が隣接するテンプレート要素に基づき再構成されること
を許容する。改善されたトレーニング過程を介して高品
質コードブックを提供する。

【００６３】本発明の好ましい実施例と考えられること
が示されている一方で多くの変更及び改良が本発明の真
の精神から離れることなくその中でなされる。故に請求
項ではそのような変更及び改良の全てにわたり本発明の
真の範囲に含まれるよう意図されている。

【図面の簡単な説明】

【図１】本発明の処理フローの概略をブロック図の形で
示す図である。

【図２】（Ａ），（Ｂ）．（Ｃ）にそれぞれ傾けられ、
標準化された位置に回転され、標準化された大きさにさ
れた前面の顔画像を示す。

【図３】本発明の標準化の方法をフローチャートの形で
示す図である。

【図４】テンプレート内のテンプレート要素の位置及び
大きさを示す図である。

【図５】左右が裏返しの性質を有するテンプレート内の
テンプレート要素の位置及び大きさを影を付けられた領
域で示す図である。

【図６】上下が裏返しの性質を有するテンプレート内の
テンプレート要素の位置及び大きさを影を付けられた領
域で示す図である。

【図７】連結されたテンプレート内のテンプレート要素
の位置及び大きさを影を付けられた領域で示す図であ
る。

【図８】本発明の特定の実施例のテンプレート内の肖像
の特徴及びそれらの特性を表の形で示す図である。

【図９】本発明の特定の実施例のテンプレート内の各要
素に対するテンプレート要素データ記録を示す図であ
る。

【図１０】本発明の特定の実施例のテンプレート内の各
要素に対するテンプレート要素データ記録を示す図であ
る。

【図１１】本発明のコードブックを作るためのトレーニ
ングの方法をフローチャートの形で示す図である。

【図１２】本発明の特定の実施例で用いられる各特徴の
型と関係するコードベクトルの集合を示す図である。

【図１３】圧縮のモデルをフローチャートの形で示す図
である。

【図１４】圧縮されたビットストリームを構成する方法
をフローチャートの形で示す図である。

【図１５】圧縮された画像に対して番号づけられ、ラベ
ルされるコードベクトルを示す図である。

【図１６】画像に対する圧縮されたビット表現を示す図
である。

【図１７】データ記憶手段を有する取引カードを示す図
である。

【図１８】本発明の圧縮復元の方法をフローチャートで
示す図である。

【図１９】図１８に続く本発明の圧縮復元の方法をフロ
ーチャートで示す図である。

【図２０】少なくとも一つの裏返しの性質を有するより
軽度に陰影づけられたコードベクトルを有する特徴型コ
ードベクトル集合から抽出されたコードベクトルを示す
図である。

【図２１】全ての裏返しの性質を実施した後のコードベ
クトルを示す図である。

【図２２】最終画像を示す図である。

【図２３】本発明の方法が実施される好ましいシステム
配置を示す図である。

【符号の説明】

１０トレーニング画像１２標準化器１４特徴テンプレート１６トレイナー１８コードブック２０標準化された画像２２圧縮機２４圧縮された画像２６圧縮復元器２８圧縮復元された画像８０写真プリント８２ネガフィルム１００装置１０２手段１０４スキャナー１０６変換器１２０取引カード１２２記憶領域（複数トラック）２００ワークステイション２０２表示器２０４キーボード２０６マウス２０８ＣＤ読み出し器２１０ＣＤ書き込み器２１２プリンター２１４モデム２１６取引カード書き込み器Ａ−Ｍテンプレート要素

───────────────────────────────────────────────────── フロントページの続き (72)発明者マキシムエルバズアメリカ合衆国，ニューヨーク 14617, ロチェスター，セツランド・ドライヴ 61 番

Claims

【特許請求の範囲】

【請求項１】ａ．規準化された方向及び位置で少な
くとも一つの予想された特徴を配置するように選択され
たクラスからのデジタル化された画像を標準化し；ｂ．選択されたクラスの標準化された画像により表さ
れる特徴に対して予想された配置を決定し；ｃ．選択されたクラスの標準化された画像から各特徴
に対して予想された位置に現れる画像内容を抽出し；ｄ．各特徴に対して段階ｃの抽出された画像内容から
似た特徴のアドレス可能な集合を形成する各段階からな
るデジタル化された画像の選択されたクラス内の特徴を
表す画像特徴のアドレス可能な集合を形成する方法。
【請求項２】ａ．選択された画像特徴に対する好ま
しい配置を含む画像に対する標準を確立し；ｂ．複数の画像から１つの画像を選択し；ｃ．選択された画像内の選択された特徴の少なくとも
一つを配置し；ｄ．少なくとも一つの選択された特徴が標準に応じて
位置される標準化された幾何画像を形成するために選択
された画像を操作し；ｅ．標準化された幾何画像内の画像特徴に応答する標
準化された画像を形成するために標準化された幾何画像
を変更し；ｆ．それぞれが問題の特徴を表す特徴ブロックを標準
化された画像から抽出し；ｇ．複数の画像の残りに対して段階ｂからｆを繰り返
し；ｈ．全ての似た特徴画像ブロックを１つの組内に集
め；ｉ．各組に対して組を表す特徴コードベクトルのアド
レス可能な集合を形成し；ｊ．段階ｃからｆを抽出された特徴ブロックを形成す
るために圧縮されるべき特徴画像に適用し；ｋ．段階ｊから抽出された特徴ブロックを段階ｉの特
徴コードベクトルのアドレス可能な集合と比較し；ｌ．各特徴ブロックに対して最良適合のアドレスを記
録する各段階からなる特徴画像を圧縮する方法。
【請求項３】圧縮された画像を表すデジタルデータを
その上に記録され、ここで該デジタルデータは４千から
４４２ビットの範囲であり、ここで該デジタルデータは
請求項２の圧縮方法から得られる各特徴ブロックに対し
て最良整合のアドレスを表す処理カード。
【請求項４】選択された画像特徴に対する好ましい配
置を含む選択されたクラスの画像に対する標準を確立す
る手段と；選択されたクラスの各画像内から少なくとも
一つの選択された画像特徴を配置する手段と；少なくと
も一つの選択された画像特徴が確立された標準に応じて
位置される標準化された幾何画像を形成するために選択
されたクラスの各画像を操作する手段と；標準化された
幾何画像からそれぞれが問題の画像特徴を表す特徴ブロ
ックを抽出する手段と；全ての似た特徴ブロックを一つ
の群に集めるグループ化手段と；各群に対してそれぞれ
の群を表すコードベクトルにより画像特徴のアドレス可
能な集合を形成する手段とからなる選択されたクラスの
画像を表すコードベクトルにより画像特徴のアドレス可
能な集合を形成する装置。