JPH08265753A - 標準化された肖像画像を圧縮及び圧縮復元する方法及び装置 - Google Patents

標準化された肖像画像を圧縮及び圧縮復元する方法及び装置

Info

Publication number
JPH08265753A
JPH08265753A JP7332355A JP33235595A JPH08265753A JP H08265753 A JPH08265753 A JP H08265753A JP 7332355 A JP7332355 A JP 7332355A JP 33235595 A JP33235595 A JP 33235595A JP H08265753 A JPH08265753 A JP H08265753A
Authority
JP
Japan
Prior art keywords
image
feature
block
standardized
template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7332355A
Other languages
English (en)
Inventor
Lawrence A Ray
エイ レイ ローレンス
Richard N Ellson
エヌ エルソン リチャード
Maxime Elbaz
エルバズ マキシム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JPH08265753A publication Critical patent/JPH08265753A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/20Individual registration on entry or exit involving the use of a pass
    • G07C9/22Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder
    • G07C9/25Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder using biometric data, e.g. fingerprints, iris scans or voice recognition
    • G07C9/257Individual registration on entry or exit involving the use of a pass in combination with an identity check of the pass holder using biometric data, e.g. fingerprints, iris scans or voice recognition electronically

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Image Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Character Discrimination (AREA)
  • Collating Specific Patterns (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 最小のビット数で肖像画画像をエンコードす
る方法及び装置を提供する。 【解決手段】 肖像画像の選択された組内で見いだされ
た特徴を表す標準化されたアドレス可能な画像特徴の集
合を形成する。標準化された特徴の集合に作り上げられ
た画像特徴と同じ大きさ及び特徴の向きであるよう標準
化される。標準化処理はまた圧縮されるべき画像中及び
組内の共通のアドレス可能な集合を確立するために用い
られる画像に存在する多数の輝度の変化を最小化するよ
う輝度バランス特徴を具体化する。圧縮されるべき画像
は特徴のアドレス可能な集合内の特徴と一つづつ比較さ
れ、集合からの最良適合特徴は集合内のそれぞれの特徴
のビット表現アドレスにより圧縮されるべき画像と関連
づけられる。この表現を達成するのに必要なビット数は
ベクトル量子化技術の使用と多くの特徴は顔のような画
像中心軸について垂直及び/又は水平に対称であるとい
う認識により減少される。

Description

【発明の詳細な説明】
【0001】関連する出願の相互参照 本出願は以下に関係する:Ray、Ellson、Ga
ndhiによる1993年10月29日出願の米国特許
出願08/145051、「Method And A
pparatusFor Image Compres
sion、 Storage andRetrieva
l On Magnetic Transaction
Cards」とRay、Ellsonによる1993
年10月29日出願の米国特許出願08/14528
4、「Compression Method For
A Standardized Image Lib
rary」とRay、Ellsonによる1993年1
0月29日出願の米国特許出願08/144753、
「Method And Apparatus For
Data Encoding With Reser
ved Value」とRay、Ellson、Elb
azによる同日の出願のコダック文書番号71412号
の「Method And Apparatus Fo
r The Formation Of Standa
rdized Image Templates」上記
引用特許出願の教示はここにその全てを参考として引用
する。
【0002】
【発明の属する技術分野】本発明はデジタル画像圧縮及
び圧縮復元(伸長)に関する。特に本発明の技術は白黒
階調のある肖像画像を500ビット以下に圧縮して記憶
することを可能にする。
【0003】
【従来の技術】一般に画像圧縮は1画像に対する記憶の
必要量を減少するために見いだされた圧縮復元(dec
ompression)で画像を回復する。すべての圧
縮/圧縮復元過程が画像をその元の形に回復するわけで
はない。元の形に戻す方法は「無損失」法と呼ばれる。
一般的に無損失法は、画像を変化させ画質のある程度の
劣化を引き起こす損失法によるのに比べてより高度に画
像を圧縮することはできない。高い圧縮率が要求される
応用では損失法が最も頻繁に用いられる。
【0004】画像は空間的相関を含むことにより圧縮さ
れうる。この相関は隣接する画素値の差が画像のダイナ
ミックレンジに比べて小さいことを意味する。基本的な
経験則は相関が大きいほど視覚画像の忠実度の損失なし
により高い圧縮率に対するより大きな潜在能力を意味す
る。画像圧縮法のほとんど全ては広い統計的方法にその
基礎を有する。ある方法はより洗練されており局部統計
学上に基づいて圧縮アルゴリズムを変化させている
(M.Rabbani,J.P.Jones著の「Di
gital Inage Compression T
echniques」Vol.,T77,SPIE出
版、Bellingham,ワシントン、1991年を
参照)。しかしながらこれらの技術の全ては画像の特徴
及び画像の位置の先立つ知識がないものとして適用され
る。統計学は隣接画素間の相関を説明する;が、異なる
画像の対応する位置内の画素の群間の相関については説
明しない。
【0005】圧縮アルゴリズムは動画の連続したフレー
ムのような画像の動きの連続を扱うために開発されてき
た(Bernd Jahne著の「Digital I
mage Processing: Concept
s,Algorithms,and Scientif
ic Applications」Springer−
Verlag出版、ベルリン、1991年参照)。時間
的に近接して撮られた画像はその間に高い度合いの相関
を有し、画像セグメントの動きとして画像間の差を決定
することは大きな圧縮率につながる。画像と画像の相関
のこの型は増加する歪みにさらされている画像に対して
うまく働く。
【0006】他の画像の補正は画像と画像の相関を有す
るが、動きの連続が有する動きのアルゴリズムでうまく
圧縮されない程度ではない。行方不明の子供の絵のライ
ブラリを考えてみよう。この画像の補正に対して顔があ
る共通の特徴を共有するように画素の位置に基づく画像
と画像の大きな度合いの相関がある。所与の画像内の空
間的相関とちょうど同じように異なる画像にわたるこの
相関は圧縮を向上するのに利用されうる。
【0007】画像ライブラリの解析は画像内の位置に基
づく画像の忠実度の相対的重要性の知識をもたらす。実
際、子供の顔上の良い画像の忠実度を維持することは頭
髪又は肩の忠実度よりも重要であり、頭髪又は肩は今度
は背景としてより重要になる。画像圧縮は視覚的画像の
忠実度がより重要でない領域でより効果を発揮する。多
くの応用で元の画像の向き及び量子化の保持は画像内に
含まれる視覚的情報の維持より重要ではない。特に行方
不明の子供のライブラリ内の画像に対して、肖像(ポー
トレイト)の内の子供の同一性はもとの画像又は圧縮の
助けにより処理された画像のどちらからも同じく容易に
確証できる場合、処理された画像をライブラリに入れる
のに損失はない。この原則は元の画像を規格化されたフ
ォーマットに入れることにより処理された画像のライブ
ラリを作るのに適用できる。行方不明の子供の肖像に対
して、これは目を水平に、画像の境界に対して頭を中心
にするよう各子供の頭を方向づけることを含む。一旦構
成されれば、これらの規格化された画像は画像と画像と
の相関を加える標準化の知識によりうまく圧縮される。
【0008】ベクトル量子化(VQ)として知られる圧
縮方法からの技術は画像の部分間の相関を見つけるのに
有用である。ベクトル量子化VQによる圧縮は固定率の
損失のある高率の圧縮の応用にうまく適合する(R.
M.Gray著の「Vector Quantizat
ion」IEEE ASSP誌,4−29頁、1984
年4月を参照)。この方法は画像を小さな断片又は「画
像ブロック」に分解する。それからこれらのブロックは
一般にコードブックとして知られる画像ブロックの所定
の組内の他の画像ブロックに対して照合される。照合ア
ルゴリズムは一般に最小二乗誤差法(MSE)である。
画像ブロックの組があらかじめ決められているので、組
への1つの登録は単純な目次により参照されうる。結果
として多画素ブロックは単一の番号で参照される。その
ような方法を用いて画像に対するビット数は計上されう
る。多数のビットが画像ブロック毎に割り当てられる場
合にコードブックの大きさが増加されうるか又はブロッ
クの大きさがより小さくされうるかのどちらかである。
【0009】従来技術ではコードブックはトレーニング
組として知られている多数の画像を表す集合から形成さ
れる。画像は画像ブロックに分割される。それで画像ブ
ロックは例えば8x8画像ブロックに対し、空間が64
次元を有するような高次元のベクトル空間内のベクトル
として考えられる。画像ブロックは画像内のトレーニン
グ組の各画像から選択される。一旦全てのベクトルがト
レーニング組から決められると、クラスターが見いださ
れ、代表的な要素が各クラスターに割り当てられる。ク
ラスターはトレーニング組の要素と該要素が割り当てら
れたクラスターの代表との間の全体の結合距離を最小に
するような方法で決められる。選択する技術はLind
−Buzo−Gray(LBG)アルゴリズムである
(Y.Lind他著の「An Algorithm f
or Vector Quantizer Desig
n」IEEE Transactions on Co
mmunisations,Vol.COM−28,N
o.1,84−95頁、1980年を参照)。クラスタ
ーの数はブロックに対して計上されたビットの数により
決められる。nビットが計上されている場合、コードブ
ックは2n までのクラスターの代表又はコードベクトル
を含みうる。
【0010】上記引用の特許出願ではRay、Ells
on、Gandhiによる米国特許出願08/1450
51及びRay、Ellsonによる米国特許出願08
/145284の両方は画像のライブラリ内の標準化さ
れた特徴の利点により画質の最小の損失で非常に高い圧
縮比を可能にするシステムを記載している。これらの特
許出願はライブラリ内の画像の共通の特徴を抽出し、こ
れを画像標準化の基本として用いる処理を記載してい
る。いったん標準化されたライブラリ画像内に標準化さ
れると、画像は圧縮され、続いて元のライブラリ画像の
損失のある表現に圧縮復元される。
【0011】上記引用された特許出願の技術の概要は以
下を含む:標準化: 最も重要な画像特徴を選択する。選択された特
徴を増強するためにライブラリから代表的な画像の組を
処理する。
【0012】代表的な画像内に選択された特徴を配置す
る。画像特徴の位置に対する拘束を決める。画像特徴位
置拘束に合うように画像を処理する。特徴の表現又は画
質の望ましいレベルに基づき画像の領域を割り当てる。
各副領域に対して画像の画像対画像相関を決める。
【0013】画像ブロック内の副領域の分割及びコード
ブックの大きさに基づき各副領域に対する画像情報の記
憶容量を割り当てる。相関の利点を有するようコードブ
ックを構成する。特徴を増強するよう画像を処理する。
選択された特徴を画像内に配置する。
【0014】画像特徴配置拘束に合うように画像を処理
することにより画像を標準化する。副領域及びそれらの
画像ブロックに基づき画像を分割する。各領域に対して
画像を最良に近似するコードブック内のエントリを決め
る。これが圧縮された画像であるときに各画像ブロック
に対する一連のコードブック値を記憶する。圧縮復元 一連のコードブック値からコードブック値を抽出する。
【0015】一連のコードブック値内の対応する副領域
の位置に基づきコードブックを決める。上記決定された
コードブック値からコードブック値に基づき画像ブロッ
クを抽出する。画像ブロックを副領域内の近似画像ブロ
ック位置にコピーする。
【0016】全ての画像ブロック位置がエントリ画像内
に満たされるまで画像ブロックを挿入し続ける。磁気取
引カードの単一トラックに対する国際規格を満足する方
式で圧縮された顔画像を記憶するために、圧縮された顔
画像データは500ビット以下でなければならない(I
SO7811参照)。この容量は磁気トラックのビット
容量を更に減少するある予約された文字の存在により更
に妥協される。Ray、Ellsonによる1993年
10月29日出願の米国特許出願08/144753、
「Method And Apparatus For
Data Encoding With Reser
ved Value」にはデータの制限は451ビット
のトラックの一つに対して情報理論的最大記憶容量を有
するように示されている。その出願はまた拘束されない
データの442ビットを記憶するエンコード方法を記載
している。
【0017】442ビット内へ顔画像を記憶する場合の
ように目標ビット数が極端に小さいときには上記の圧縮
/圧縮復元処理は満足できる質の顔画像を提供できな
い。満足できる画質は画像から個人を識別することを企
てたときに望まれる。付加的な改善がより要求される確
認システムに対する圧縮された画像の質において必要で
ある。より特徴的には改善の機会はコードブック形成、
画像標準化、画像ブロック対称性に存在する。
【0018】従来の圧縮方法はLBGアルゴリズムと称
されるトレーニングに基づくコードブック形成処理を用
いていた。このアルゴリズムはクラスター化アルゴリズ
ムと称されるアルゴリズムの組を形成する一つである。
このアルゴリズムの特徴はデータ組内の所定の群の数を
三井だし、最適な方法でその群に対する代表を選択する
ことである。LBGアルゴリズムの場合にはデータ組は
多数の画像からの画素のブロックからなり、そのアルゴ
リズムはデータ組を最良に代表する所定の数のブロック
を見いだすために作動する。何がよいかを測定するため
の多くのマトリックスがある一方で最も通常の物はユー
クリッド的な意味での最小距離、即ち画素間の差の2乗
の和である。群の代表はしばしば群の重心(centr
oid)であり、即ち群内のブロックの平均である。L
BGアルゴリズムは最初に群の割り当てを作り、各群に
対する重心を選択し、最近接重心を選択することにより
データ組の要素を重心に対して再割り当てすることによ
り処理する。再割り当ては新たなグループかを形成し、
アルゴリズムは収束が生ずるまで反復的なやり方で継続
可能である。
【0019】多くの場合には多数の群が所望の数で開始
する一方で再割り当て処理は群の全体の数を減少する。
結果は他の群の付加はよりよい全体の結果を与える故に
準最適である。この故に能動群の数を維持する方法が望
まれる。起こりうる他の問題は極端に少ない数のメンバ
ーを有するよう減少されうることである。群が単一メン
バーを有する場合には重心はそのメンバーであり、メン
バーとその重心との間の距離はゼロであり、クラスター
が残る。ここでの結果はある群は大きく、よりよい集団
の結果は大きな群を割ることにより達成されうる。
【0020】好ましい方法は群の数を計数することによ
り能動群の数を維持し、各群に対して延長、即ち群の直
径を決定し、ある群がメンバーを有さない場合には最大
の延長の群を2つのより小さな群に分割することであ
る。過剰に小さな群の問題はアウトライアーとしてこれ
らの群のデータ要素を扱うように処理され、データ組か
らそれらを除去することである。この処理は注意してな
されなければならず、さもなければデータ要素の非常に
多くが廃棄される。
【0021】顔画像内の相関の一つの型は顔の左右の側
の間の概略鏡像対称である。前面に近い遠近肖像でしば
しば大きな度合いの相関が中心線に近い顔の部分間に存
在する。特に目の上及び下の部分を描くために用いられ
る画像ブロックは高度に対称的な相関を示す。しかしな
がら顔の中心線に沿って、対称のレベルは若干異なる角
度から見たときに鼻の現れ方の変動により低下する。必
要なことは鼻の上に有害な対称性の拘束を課すことなし
に顔の中心線の周辺の領域内の人間の顔の自然な対称性
を探すことにより圧縮された肖像画像を記憶するのに必
要なビット数を更に減少する方法である。
【0022】人間の顔の幾何配置は本質的な対称性を有
する一方で肖像に対する照明の条件は高度に非対称的で
ある。これは人間の顔の肖像の左右の側間の照度の不均
衡を生ずる。必要なことは顔画像肖像標準化のより高い
程度を達成するために及び人間の顔画像の自然な対称性
を増強するために人間の顔肖像の照明をバランスする方
法である。
【0023】輝度及び画像特徴の両方の標準化により特
徴化されたコードブックは画像内で特殊な位置で予想さ
れた画像内容をよりよく表すよう発展されうる。コード
ブック特徴化はSextonによる米国特許第5086
480号、「Video Image Process
ing」に記載され、ここでは2つのコードブックの使
用が教示されている。この方法は両方のコードブックを
精力的に捜索することにより2つのコードブックのうち
から最良のコードベクトルを見いだし、そして最良の適
合が見いだされたコードブックにフラグを付ける。正味
の結果はフラグが選択されたコードブックを示す異なる
コードベクトルの数が可能な2つのコードブックを含む
「超コードブック」である。コードブック選択は画像の
領域の内容の先験的な知識から生じない;Sexton
は画像毎のコードブック毎にどのコードブックが用いら
れるかを計算する。より大きな圧縮の機会はコードブッ
クフラグを記憶する必要を除去することである。
【0024】肖像画画像のある領域はどんな顕著な値も
個人の識別に対して貢献しない。例えば肩の領域は識別
処理に対して最小の値であり、更にこの領域は通常衣服
により覆われ、これは同じ個人に対しても高度に変化す
る。そのような領域内にほとんどの値が置かれない故に
画像をエンコードするためのビットの割り当てはまた減
少される。本発明ではこれらの領域の幾つかはもしあっ
たとしてもほとんど割り当てられず、画像データは隣接
するブロックの画像データから合成される。これはより
重要な領域をエンコードするためにより多くのビットの
割り当てを許容する。
【0025】
【発明が解決しようとする課題】本発明の目的は最小の
ビット数で肖像画画像をエンコードすることである。
【0026】
【課題を解決するための手段】本発明の一つの好ましい
方法は a. 規格化された方向及び位置で少なくとも一つの予
想された特徴を配置するようにデジタル化された画像を
選択されたクラスから標準化し; b. 選択されたクラスから標準化された画像により表
される特徴に対して予想された配置を決定し; c. 選択されたクラスの標準化された画像から各特徴
に対して予想された位置で現れる画像内容を抽出し; d. 各特徴に対して段階cの抽出された画像内容から
似た特徴のアドレス可能な集合を形成する各段階からな
るデジタル化された画像の選択されたクラス内の特徴を
表す画像特徴のアドレス可能な集合を形成する方法であ
る。
【0027】画像の選択されたクラスを表すコードベク
トルにより画像特徴のアドレス可能な集合を形成する本
発明の装置の実施例は選択された画像特徴に対する好ま
しい位置を含む画像の選択されたクラスに対する標準を
確立する手段と;各画像の選択されたクラス内から少な
くとも一つの選択された画像特徴を配置する手段と;少
なくとも一つの選択された画像特徴が確立された標準に
より配置される標準化された幾何画像を形成するために
各画像の選択されたクラスを操作する手段と;標準化さ
れた幾何画像からそれぞれが問題の画像特徴を表す特徴
ブロックを抽出する手段と;全ての似た特徴ブロックを
一つの群に集めるグループ化手段と;各群に対してそれ
ぞれの群を表すコードベクトルにより画像特徴のアドレ
ス可能な集合を形成する手段とからなる。
【0028】本発明の全体の目的は取引カードのカード
保持者の識別処理で用いられる適切な質の顔画像を形成
する技術を提供することである。本発明は肖像画画像の
圧縮、記憶、検索を可能にし、ここで圧縮された肖像画
画像データは国際規格により特徴づけられるように取引
カードの単一トラック内に記憶可能である。本発明は更
にコードブック作成、顔画像の照明条件を標準化するた
めの輝度バランス方法、対称的な顔領域に対する連結さ
れた画像ブロックの改善されたトレーニング方法を付加
することにより従来技術の圧縮方法を更に改善する。
【0029】上記より本発明の目的は最小のビット数で
肖像画画像をエンコードすることである。本発明の他の
目的はコード化された画像を迅速にデコードするデコー
ド化技術を提供することである。本発明の更に他の目的
は改善されたコード化された肖像画画像を提供すること
である。
【0030】本発明のその他の目的はエンコードから問
題の領域でない画像の部分を除去する能力を提供するこ
とである。本発明の更なる目的は実際の画像データの欠
如に対して似た画像内容を挿入することを可能にする技
術を提供することにある。
【0031】
【発明の実施の形態】以下に本発明の一部であり同じ部
分は同じ記号で表された図面を参照して本発明の上記の
及び他の目的を更に詳細に説明する。図1のブロック図
は本発明の機能の概略を示す。図1内ではトレーニング
画像10はトレーニング画像10を整合したフォーマッ
トの標準化されたトレーニング画像に処理する標準化器
内にロードされる。標準化されたトレーニング画像はト
レーニング画像ブロックを生成するよう特徴テンプレー
ト14を用いて更に処理され、その機能はトレイナー1
6により表される。トレイナー16はトレーニング画像
ブロックに基づくコードベクトルからなるコードブック
を形成する。特徴テンプレート14と結合されたコード
ブックは圧縮及び圧縮復元処理に対する基本となる。例
えば20である標準化された画像は標準化器12の機能
を用いて肖像のような元画像から形成される。エンコー
ドされるべき標準化された画像20がデータ圧縮器22
に送られるときに圧縮器は圧縮された画像24を形成す
る。圧縮された画像は将来の使用のために記憶され及び
/又は転送される。好ましくは圧縮復元器26により圧
縮器22で用いられたのと同じ同じ特徴テンプレートと
コードブックを用いてなされる圧縮復元処理は復元画像
28を提供する。
【0032】図2の(A)は前面の顔の肖像である画像
を示す。この画像の例では顔は傾けられ、画像の中心に
関して平行移動されて(中心から外されて)いる。元の
画像に依存して画像内の顔の位置及び大きさの他の変動
が生じうる。本発明で最大の結果を達成するために顔の
大きさ、位置、向きは標準化されるべきである。画像上
で操作するために画像は画素値のマトリックスとしてデ
ジタルフォーマットに移行される。画像のデジタルフォ
ーマット(画素値)は本発明の一部ではないスキャン及
び/又は他のよく知られたデジタル処理技術によりえら
れる。それからデジタル画像は例えば図23に示される
表示器202のような表示装置上に表示され、標準化処
理は標準化された幾何画像を形成するよう適用される。
画像は特徴テンプレート14に関するテンプレート要素
間の質の整合を提供するように標準化される(詳細は後
で説明する)。処理は画像対象の左右の目の中央を位置
決めすることにより図2の(A)の画像から開始する。
図2の(B)では部分的に標準化された幾何画像である
新たなデジタル画像は必要なら図2の(A)の元画像を
回転し、平行移動することにより形成される。回転及び
平行移動は所定の水平軸に沿って、中心垂直軸に関して
等しく離間された左右の目の中央を位置決めするように
よく知られた画像処理操作を用いてソフトウエア内で達
成される。図2の(C)は標準化された幾何画像を形成
するためにスケーリング処理により大きさを変えられた
図2の(B)の画像を示す。
【0033】図3を参照するに標準化された幾何画像を
形成する処理フローはその機能を識別するために「画像
の選択」とラベルされた操作ブロック30から始まるフ
ローブロックの左の列から始まる。図に示されるフロー
ブロックの全てはそれらの機能によりラベルされる。選
択処理はテンプレート14で処理された画像を有するよ
うな個人の前面の顔画像の存在に基づき選択される。選
択処理に含まれるのは画像のデジタルマトリックス表現
の形成である。デジタルマトリックスは操作32で操作
者に対して表示するためにシステム内に次にロードされ
る(図22のシステムを参照)。上記のように操作者は
操作34で左右の目の点を位置決めし操作36で標準化
された幾何画像を形成するために画像の顔部分の必要と
されるいかなる回転、平行移動、再スケーリングをもな
す。それから標準化された幾何画像は操作38で記憶さ
れる。
【0034】より特徴的には本発明の好ましい実施例で
は画像の標準幾何配置は画像の上端から28画素、仮想
的な垂直中心線のそれぞれの側上に8画素の位置の目の
中心を有する幅が56画素、高さが64画素の画像の大
きさになるよう設定される。左右の目の中央を識別する
ことはマウス、デジタル書き込みタブレット、ライトペ
ン、又は接触感応スクリーンのような装置により駆動さ
れるカーソルを用いて中央を指示する人間の操作者に最
初の画像を表示することによりなされる。代替的な方法
は特徴捜索プログラムを用いて処理を自動化することで
ある。一実施例では人間の操作者は目の位置を位置決め
し、プロセッサは操作者が特定した位置の小さな近傍周
辺に限定される目の発見捜索方法を通して位置を精密に
調整する。
【0035】なされた画像の大きさ及び目の位置調整と
共に輝度の標準化過程がなされる。ブロックの右側列で
偶数ラベルされた40ー54は標準化された幾何画像の
輝度は得られた標準化された幾何画像が将来の使用のた
めに記憶されるよう画像対象の曝される照明での変化可
能性を減少し、皮膚の階調を所定の値に調整して鏡映的
な高輝度を減少し、影を減少するために処理される。ト
レーニング画像の輝度の変動を標準化するために用いら
れる3つの空間的スケールがある;それは光のレベル/
方向に対して大きく、側方の光からの非対称な影を補正
することに対して中間で、ガラス、宝石、皮膚からの鏡
映的な高輝度の減少に対して小さい。これらの過程は画
像内の平均輝度レベルを変化する。コントラストと称さ
れる輝度レベルの変動は特徴を識別するのに有用なある
特徴を強調するためにまた調整されるが、カラー画像を
白黒階調に変換するときは減少される。
【0036】記憶する前の画像標準化処理の最終段階は
顔の平均輝度、即ち鼻の一般的な近傍で見られる平均照
明を設定値にシフトすることである。本発明の好ましい
実施例では明るい皮膚の色調の人に対しては設定値は1
65であり、中間の皮膚の色調の人に対しては設定値は
155であり、暗い皮膚の色調の人に対しては設定値は
135である。ここで形成された標準化されたデジタル
画像は画素値の記憶可能なマトリックスにより表現され
る。
【0037】図4は標準化された画像と共に用いられる
テンプレート14のレイアウトを示す。テンプレート1
4はAからMとラベルされた64のテンプレート要素内
に分割される。要素は人間の顔の13の対応する特徴に
関して配置され、例えばAとラベルされたテンプレート
要素は頭の上端で頭髪の特徴に対応し、Gとラベルされ
たテンプレート要素は目に対応する。図8、9、10の
表は残りのテンプレート要素の更なる記載を提供する。
本発明の好ましい実施例は64テンプレート及び13特
徴でなされるが、これらの数は状況に沿って変化され
え、本発明の方法の構成を制限するものではない。テン
プレートのある領域はどの要素に対しても割り当てられ
ていない。これらの割り当てられない領域はコードブッ
クからの情報の検索に基づきそれらの画像内容を有さな
い。画像内容をこれらの領域に割り当てる方法は以下に
説明する隣接する領域の割り当てに基づく。テンプレー
トの大きさは幅が56画素で高さが64画素の標準化さ
れた画像の幾何配置に整合する。テンプレート要素の大
きさは表現しようとする顔の特徴の大きさに依存する。
例えばGは標準化された画像内の目の大きさに関し、要
素Gの両方の例は標準化された画像内の目の位置に配置
される。
【0038】図5を参照するに影を付けられたテンプレ
ート要素は以下に詳細に説明する左右を裏返した性質を
割り当てられている。図6を参照するに影を付けられた
テンプレート要素は以下にまた詳細に説明する上下を裏
返した性質を割り当てられている。テンプレート要素は
一以上の性質を割り当てられるものである。
【0039】テンプレートの他の性質は連結である。図
7に影を付けられた領域は連結の部分である点プレート
要素の配置を示す。この特定の実施例では要素の7つの
連結された対が存在する。連結は例えば中央の左でGは
中央の右でのGに連結されるように影を付けられたテン
プレート要素の各対間で水平である。7つの連結された
対は好ましい実施例として示され、連結は2以上の群及
び類似のラベルされた要素のどの組の間でも生じうる。
【0040】図からわかるようにテンプレート14は一
連のデータ記録を表す一連のテンプレート要素からな
り、ここで各記録は好ましい実施例では位置、大きさ、
ラベル、左右の性質、上下の性質、連結を記述する。他
の及び/又は付加的な要因を有する記録は必要が生じた
ときに形成される。テンプレート14はテンプレート要
素の分布及び大きさを記録する。各テンプレート要素は
コードブック18(図1を参照)と画像に対応する空間
配置に割り当てられる。上記のようにテンプレート14
は長方形画素領域からなる64のテンプレート要素から
なる。これらのテンプレート要素はそれぞれが顔の特徴
の異なる型に対応する13の異なるコードブックの一つ
に割り当てられる。コードブック18は4x16,8x
8,8x5,4x10,4x6,又は8x4のいずれか
の画素の均一な大きさのコードベクトルの集合である。
コードブック18内にあるコードベクトルはトレイナー
16(図1)によりトレーニング画像から抽出された画
像ブロックから形成される。
【0041】図8では表は図4から7に示されるテンプ
レート要素A−Mの性質を記述する。コードブックの最
初にリストされた性質はコードブックが含むコードベク
トルの数であり、これは128又は256である。これ
らの数は両方とも2の冪乗であり、特にそれらは27
び28である。これは7ビット又は8ビットインデック
スの全範囲を用いるコードベクトルを特定するために用
いられるコードブックインデックスとして利点である。
コードブックのインデックス長さは8又は7のどちらか
として図5の表に示される。コードブックに対する画像
ブロックの次元はリストされた第二及び第三の性質であ
り、画素でのブロックの幅及び画素でのブロックの高さ
として与えられる。ブロック当たりの画素数はブロック
幅とブロック高さの積である。第四のリストされた性質
はコードブックに割り当てられた特定の実施例の特徴テ
ンプレート内のテンプレート要素の発生数である。第五
にリストされた特徴の性質は唯一性の性質であり、これ
らのテンプレート要素が何回唯一選択されたかを示す
(これは連結されたテンプレート要素の各組の一つのメ
ンバーを除去する)。第六にリストされた特徴の性質は
コードブックから選択されたコードベクトルを記憶する
ために割り当てられたビットの数である。これは唯一の
テンプレート要素の数とビット内のインデックス長さの
積である。特徴ビット行内のエントリの和は442であ
り、これは拘束されない2進数の記録として圧縮された
画像を記憶するために必要なビットの全数である。斯く
して特徴テンプレートは図4ー7のマップと図8に示さ
れた表の両方を構築するために必要とされる全ての情報
を含む。図9と10の表はデータの形で図4ー7のマッ
プを示す。
【0042】図11に示されるトレイナー16の操作フ
ローを参照するに、第一のブロックであるブロック70
0は標準化されたトレーニング画像のロードを表す。こ
れは肖像画像の代表と考えられる画像の集合であり、こ
れはこのトレーニング処理により形成されたコードブッ
ク18を用いて圧縮するために圧縮器22に送られる。
第一の画像ブロックはブロック702により代表される
ような選択されたコードブックの型に対する画像から抽
出される。次に抽出された画像ブロックは上記の上下及
び左右の裏返しの性質のようなそれらの対称性の型に基
づいて方向付けられる。次のブロックは決定ブロック7
06であり、標準化された画像トレーニング組内の他の
画像の存在をチェックする。一般に2000画像がこの
トレーニング処理に対して推薦される。組内に他の画像
がある場合には処理は図に示されるようにブロック70
2にループバックする。そうでなければブロック708
に進み、ここでは重心はランダムな画像ブロックとして
初期化される。好ましい実施例では重心は画像ブロック
の第一のシーケンスとして初期化される。次にブロック
710を参照するに各画像ブロックはブロック708で
決められた最も近い重心に割り当てられる。ブロック7
12では閾値より相互に近接する重心は結合される。例
えば2つの重心が非常に接近するとしてフラグ付けされ
た所定の距離より小さくなるよう決定された場合にはそ
れらは結合され、全ての画像ブロックは単一の重心に割
り当てられ、他の重心は割り当てられないままである。
ブロック714を参照するに大きな延長の重心は割り当
てられない重心で分割される。これは重心がそれに割り
当てられた異なるコードベクトル間で非常に大きな距離
を有する場合にはこの重心は2つの重心に分割され、こ
こでこれらのコードベクトルに割り当てられた新たな重
心の一つは前の段階からの割り当てられていない重心か
ら来る。ブロック716では最小に占有された重心は割
り当てられず、それで大きく延長するように決定された
残りの重心を分割するよう用いられる。ブロック718
では再近接の重心は共に結合される。更に再びブロック
720での結合処理から得られた新たに割り当てられて
いない重心を取り、大きな延長のそれ以上の重心は分割
される。ブロック722を参照するに新たな位置は各重
心に対して見いだされる。この処理が要求されるのは画
像ブロックの割り当てを種々の重心に対して組み替える
ことにおいて重心に割り当てられたコードベクトルの中
心の位置は実質的に変化されるからである。各重心群に
割り当てられたコードベクトルの群の中心に対する新た
な位置は重心はいかにして画像ブロック再割り当て処理
を通して動くかを決めるために計算される。ブロック7
24を参照するに最近接重心に対するこれらの画像ブロ
ックの各一つの割り当てはなされ、それ故に重心はビッ
トの周辺で動き、一つの重心に割り当てられた画像ブロ
ックのあるものは実際に他の重心により近いことが可能
である。
【0043】ブロック726を参照するに重心は最大か
ら最小に占有されるよう再配列される。この再配列は将
来の反復で再割り当て処理を加速する。ブロック728
では収束テストがなされる。収束が完全でない場合には
処理はブロック712に戻り、ここでは近接しすぎてい
る重心は結合される。収束が完全である場合には処理は
ブロック730に進み、ここでは重心は新たに形成され
たコードブックのコードベクトルとして記憶される。
【0044】図12を参照するにコードベクトルの部分
集合が示され、特徴の型A,G,Mに対応するコードブ
ックに対して詳細に示される。図12の特徴要素G12
3は図3、4ー7、8、15のテンプレート内の左右の
目要素に対応する。同様にして図8のA46は図3、4
ー7、8、15内に示されたテンプレートの左上隅の髪
の毛に対応する。
【0045】図13はフローチャートの形で画像の種々
のテンプレート要素に対する最良適合コードベクトルを
見いだす処理を示す。この処理はブロック900、90
2に示される標準化された画像のロード又は標準化され
るべき画像のロードで開始する。標準化された画像は図
1のブロック20に対応し、ブロック902により表さ
れる処理の結果である。
【0046】ブロック904では第一のテンプレート要
素に対応する次の画像ブロックは標準化された画像から
抽出される。抽出された画像ブロックはブロック906
に示されるように水平に裏返す及び/又は垂直に裏返す
性質の対称の型に基づいて方向付けられる。ブロック9
08ではコードブックからの最良適合コードベクトルの
インデックスがそのテンプレート要素に対する特徴の型
に対応するコードブック内のコードベクトル全てと比較
されることにより見いだされる。比較ブロック910は
テンプレート内に記憶されている情報に基づきブロック
が連結されているかどうかを決定する。ブロックが連結
されている場合にはフローはブロック914に進み、こ
こでどのくらい良い整合が生じたかを表す値が記憶され
る。本発明の特定の実施例ではこれら2つの画像ブロッ
クとコードベクトルとの間の平均2乗誤差の比較は他の
良さの測定が既に考えられているにもかかわらず適合の
良さの測定として用いられる。ブロック916では好ま
しい実施例として適合からの値は群内の他の連結ブロッ
クと比較される。ブロック918では最良の値を有する
コードベクトルは選択され、この場合には平均2乗誤差
テストに対して最低の値である。このベクトルはコード
ブックからの最良適合コードベクトルのインデックスと
してブロック912で用いられる。画像ブロックが連結
されていない場合にはブロック912に直接進む。ブロ
ック912から処理はこれはテンプレート内で最後の要
素であるかどうかを決定する他の比較ブロックであるブ
ロック920に進む。そうでない場合には処理はブロッ
ク904に戻り、次のテンプレート要素に対応する次の
画像ブロックを抽出する。それが最後の画像ブロックで
ある場合には処理はブロック922内の圧縮された画像
ビットストリームを構築する処理に進む。構築処理は図
14に示される。
【0047】次に図14では、ブロック950でビット
ストリームポインタBPSはゼロに設定され、テンプレ
ート要素ポインタTPもまたゼロに設定される。ブロッ
ク952ではテンプレート要素数TPが検索される。ブ
ロック954はテンプレート要素が連結されるかどうか
を決定する決定ブロックである。テンプレート要素が連
結されていない場合には処理はこれは連結群の最初の発
生かどうかを決定する第一の決定ブロック956に進
む。その要素が連結群の最初の発生の場合には処理は以
下に説明するブロック958に進む。それが連結群の最
初の発生でない場合には処理は以下に説明するブロック
966に進む。
【0048】ブロック958を参照するに「BN」とラ
ベルされたテンプレート要素からビット数が検索され
る。このビット数はテンプレート要素のコードベクトル
インデックスをエンコードするのに用いられる。好まし
い実施例ではこれらはテンプレート要素当たり7又は8
ビットのいずれかである。ボックス960に進んでコー
ドベクトルインデックスはBNビットでエンコードされ
る。
【0049】ブロック962ではビット位置BSPで開
始するビット数BNが挿入される。ブロック964でビ
ットストリームポインタBSPはBNだけ増加され、ブ
ロック966ではテンプレート要素ポインタが一だけ増
加される。決定点968はテンプレート要素は使われ切
ったかを訊ね、答えが「イエス」の場合にはビットスト
リームはブロック970で完了する。答えが「ノウ」で
あり、更にテンプレートが存在する場合には処理ループ
はブロック952に戻り、処理は継続する。
【0050】図15は図12、13に記載された最良適
合コードベクトル比較処理の特徴的な標準化された画像
に対する結果を示す。図15で各テンプレート要素はそ
れに割り当てられた文字及び数の両方を有する。文字は
テンプレート要素に対応する特徴の型を示し、数は良さ
の測定の実施例による最良適合コードベクトルのインデ
ックスを示す。
【0051】図16の表は左の列から右の列へシーケン
ス内に配列された数を有する最良コードベクトルを示
し、それは図9及び10の表内に示されるテンプレート
要素のシーケンスに対応して下方へ向かう。図9、10
に当てはまるテンプレート要素のシーケンスを維持する
ことは重要であり、それにより図14に示される処理は
圧縮された画像ビットストリームを正確に翻訳するビッ
トストリームポインタを有する。図16に示される最良
コードベクトル数のそれぞれに対するインデックス長さ
はインデックス長さとして図8に示される表からの特徴
の型のインデックス長さに対応する。最良のコードベク
トル数の表現はインデックス長さに対応する長さを有す
るビット表現でビット表現列内で2進数表現として示さ
れる。2進数が不充分なディジットを有する場合にはそ
のビット表現の先の列内のインデックス長さに対応する
2進長さを有するようゼロを詰める。ビット表現列内の
2進数ディジットが連続する場合には左の列から開始
し、下へ進み、それから右の列に入り、得られた442
ビット2進数は最終的な圧縮された画像出力に対応す
る。これは図1の圧縮された画像24に対応する。
【0052】図17はデジタル記憶の手段を有する取引
カード120を示す。この記憶手段は磁気エンコードの
ような種々の手段により、又はバーコードパターンによ
り達成されうる。磁気記憶の場合には通常の方法は磁気
記憶領域122に対して図17に示されるようにトラッ
ク1、トラック2、トラック3により示されるような複
数のトラックを有する。
【0053】図18を参照するに圧縮されたビットスト
リームは復元された画像を形成するよう圧縮復元され
る。ビットストリームポインタBSPはゼロに初期化さ
れ、テンプレート要素ポインタTPはブロック302で
ゼロに設定される。処理はブロック304に進み、ここ
ではテンプレート要素TPは検索される。ブロック30
6ではテンプレート要素が連結されているかどうかに関
する決定がなされる。連結されていない場合には処理は
ブロック308に進む。連結されている場合には処理は
決定ブロック308に進む。決定ブロック308はこれ
が連結された群の第一の発生かどうかを決定する。それ
が処理である場合にはブロック310へ進む。それが処
理でない場合にはブロック312へ進む。
【0054】ブロック310を参照するにコードベクト
ルインデックス及びコードブック型に対するビットBN
の数はテンプレート要素から抽出される。BSP+BN
−1を介したBSPのビットはブロック314での圧縮
されたビットストリームから抽出される。ビットストリ
ームポインタはブロック316内でBNだけ増加され
る。それから処理はブロック318に進む。ブロック3
12へ戻るフローを再び辿るとその群の最初の発生でな
い結合された群がある場合に連結群の前の発生からコー
ドベクトルインデックスはコピーされる。前の発生はブ
ロック318に移動する。ブロック318では示された
コードブック型からのインデックスコードベクトルが検
索される。このコードベクトルは特定の画像からの特徴
型を表す。テンプレート要素はブロックがどのように向
けられていなければならないかを示す。ブロック320
ではテンプレート要素により示されるようにブロックを
向ける。示されている場合には水平、左右裏返し又は垂
直、上下裏返しがなされる。ブロック322ではテンプ
レート要素により示された位置内のブロックは画像内に
挿入される。ブロック324ではテンプレートポインタ
TPは1だけ増加される。決定ブロック326は全ての
テンプレート要素が用いられたかどうかを決定する。そ
うでなければ処理はブロック304に戻り、継続する。
全てのテンプレートが用いられた場合には処理は図19
内の点Aに移動する。
【0055】図19ではインデックスを構築する処理が
示される。次に処理はそれらに割り当てられているテン
プレート要素を有さないそれらの領域を構成する。それ
らしい画素はブロック328でそれらの領域に対して用
いられる。ブロック330内の画像ブロックは平滑化さ
れねばならないそれらの間の継ぎ目を有し、この処理は
ブロック330に示される。継ぎ目の平滑化は水平及び
垂直の両方の継ぎ目を横切る平均を取ることにより達成
される。ブロック332では再構成された画像のコント
ラストは増強される。これは画像の全ダイナミックレン
ジ0ー255が再構成された画像内で用いられることを
確かにする。好ましい実施例ではこれは簡単な線形再ス
ケール化によりなされる。ブロック334では空間的に
依存するランダムノイズが付加される。これは画像の中
心に関してなされ、画像の中心は非常に少なく、周辺の
画像ノイズは更により強調される。ブロック336では
再構成された画像は出力される。出力された画像は図1
のブロック28の復元された画像に対応する。
【0056】図5、6はどのテンプレート要素がそれぞ
れ左右及び上下の裏返しの性質を有するかを示す。これ
らの裏返しの性質を有するテンプレート要素はまた図9
及び10の表内で真/偽フラグで示される。裏返される
べき図20でのコードベクトルは画素を表す箱を介して
対角線により識別される。図21は裏返しの性質の図2
0内のコードベクトルに対する適用を示し、ここで図5
内の影を付けられたテンプレート要素に対応する図20
内の全てのコートベクトルは左右を裏返され、図6内の
影を付けられたテンプレート要素に対応する図20内の
全てのコートベクトルは上下を裏返される。あるテンプ
レート要素は図20から図21のコードベクトル方向へ
コードベクトルの平行移動で裏返され、裏返しは関連す
る要素内でもなされる。
【0057】次の段階は図21の方向付けられたコード
ベクトルモザイクに基づく図22に示される最終画像の
画像処理操作により形成される。図21のモザイクはコ
ードベクトルからのその構成の結果としてある視覚的に
好ましくないアーティファクトを有しうる。これらのア
ーティファクトは画像処理アルゴリズムのある組み合わ
せで減少されうる。
【0058】好ましい実施例ではよく知られた画像処理
操作の組み合わせはコードベクトル境界を横切る平滑
化、コントラスト増強、失われた画像領域を満たすため
の線形補間、空間的に依存するランダムノイズの付加を
含むように適用される。平滑化操作は3つの連続した画
素、P1,P2.P3を考えることにより説明され、ここ
でP1,P2は1つのコードベクトルであり、P3は付加
的なコードベクトルである。画素P2は以下の結果によ
り置き換えられる: (P1+2*P2+P3)/4 コントラスト増強はモザイクに対して最小画素値min
と最大画素値maxとを決定することにより達成され
る。モザイクの各画素値Pcurは以下の式によりPn ew
より置き換えられる: Pnew=255*(Pcur−min)/(max−min) どのテンプレート要素にも対応しない特徴テンプレート
の領域は線形補間を用いて満たされる。各領域に対して
境界画素の知られている値は平均画素値を計算するため
に用いられる。知られている境界に対向する知られてい
ない隅はこの平均値に対して設定される。割り当てられ
ない内部の画素の残りは線形補間により計算される。本
発明の好ましい実施例では特徴テンプレートの隅にそれ
ぞれ位置するそのような4つの割り当てられない領域が
ある。
【0059】加えられる空間的なランダムノイズは以下
により決定される: n(i,j)=v*sqrt((i−28)**2+(j−32)**2)*r and v=ノイズ振幅 ここで i=影響される画素の列 j=影響される画素の行 及びrandは範囲(ー1から1)での浮動小数点の疑
似乱数である。値n(i,j)は位置(i,j)での画
素に加えられる。得られた画素が255以上である場合
にはそれは255にクリップされ、ゼロ以下の場合には
0に設定される。図22はこれらの操作により処理され
た後の画像を表す。他の画像処理操作は他の状況で用い
られ、好ましい実施例は制限されるとは考えられないも
のである。
【0060】図23は本発明が実施される装置100を
示す。装置100は写真プリント80又はネガ画像82
のようなデジタルでない画像を画像のデジタル表現に変
換する手段102からなる。一般に変換は画素値をアナ
ログの形で表す信号を出力するスキャナー104でなさ
れる。アナログ/デジタル変換器106はアナログ画素
値をスキャンされた画像のデジタル値表現に変換するた
めに用いられる。デジタル画像の他の入力源はワークス
テーション200内への直接入力である。本発明の好ま
しい実施例の装置ではワークステーション200はオペ
レーティングシステムとしてUNIXが走り、標準Cプ
ログラム言語を用いてエンコードされたサン スパーク
10である。デジタル画像の表示はソフトウエア、キー
ボード204、マウス206制御の下で操作される表示
器202による。デジタル画像はまたCD読み出し器2
08又は他の同様な装置によりシステム内に導入され
る。本発明の方法により形成されたテンプレートはCd
乗に記憶するためにCD書き込み器210にダウンロー
ドされ、プリンター212によりハードコピープリント
され、データ記憶領域内にエンコードされるよう取引カ
ード書き込み器327にダウンロードされ、又はモデム
214と伝送線により遠隔地で更に処理又は記憶される
よう伝送される。
【0061】
【発明の効果】本発明の利点は以下の通りである:圧縮
された画像を表現するために必要なビットの数は実質的
に減少される。皮膚の平均輝度の画像間の変動の減少は
良く整合されたブロックを提供するよう顔領域内でコー
ドブックの能力を改善する。
【0062】連結されたテンプレート要素の使用は圧縮
された画像の記憶に要するビット数を増加しないで画質
を向上する。テンプレート要素に関係しない画像の領域
が隣接するテンプレート要素に基づき再構成されること
を許容する。改善されたトレーニング過程を介して高品
質コードブックを提供する。
【0063】本発明の好ましい実施例と考えられること
が示されている一方で多くの変更及び改良が本発明の真
の精神から離れることなくその中でなされる。故に請求
項ではそのような変更及び改良の全てにわたり本発明の
真の範囲に含まれるよう意図されている。
【図面の簡単な説明】
【図1】本発明の処理フローの概略をブロック図の形で
示す図である。
【図2】(A),(B).(C)にそれぞれ傾けられ、
標準化された位置に回転され、標準化された大きさにさ
れた前面の顔画像を示す。
【図3】本発明の標準化の方法をフローチャートの形で
示す図である。
【図4】テンプレート内のテンプレート要素の位置及び
大きさを示す図である。
【図5】左右が裏返しの性質を有するテンプレート内の
テンプレート要素の位置及び大きさを影を付けられた領
域で示す図である。
【図6】上下が裏返しの性質を有するテンプレート内の
テンプレート要素の位置及び大きさを影を付けられた領
域で示す図である。
【図7】連結されたテンプレート内のテンプレート要素
の位置及び大きさを影を付けられた領域で示す図であ
る。
【図8】本発明の特定の実施例のテンプレート内の肖像
の特徴及びそれらの特性を表の形で示す図である。
【図9】本発明の特定の実施例のテンプレート内の各要
素に対するテンプレート要素データ記録を示す図であ
る。
【図10】本発明の特定の実施例のテンプレート内の各
要素に対するテンプレート要素データ記録を示す図であ
る。
【図11】本発明のコードブックを作るためのトレーニ
ングの方法をフローチャートの形で示す図である。
【図12】本発明の特定の実施例で用いられる各特徴の
型と関係するコードベクトルの集合を示す図である。
【図13】圧縮のモデルをフローチャートの形で示す図
である。
【図14】圧縮されたビットストリームを構成する方法
をフローチャートの形で示す図である。
【図15】圧縮された画像に対して番号づけられ、ラベ
ルされるコードベクトルを示す図である。
【図16】画像に対する圧縮されたビット表現を示す図
である。
【図17】データ記憶手段を有する取引カードを示す図
である。
【図18】本発明の圧縮復元の方法をフローチャートで
示す図である。
【図19】図18に続く本発明の圧縮復元の方法をフロ
ーチャートで示す図である。
【図20】少なくとも一つの裏返しの性質を有するより
軽度に陰影づけられたコードベクトルを有する特徴型コ
ードベクトル集合から抽出されたコードベクトルを示す
図である。
【図21】全ての裏返しの性質を実施した後のコードベ
クトルを示す図である。
【図22】最終画像を示す図である。
【図23】本発明の方法が実施される好ましいシステム
配置を示す図である。
【符号の説明】
10 トレーニング画像 12 標準化器 14 特徴テンプレート 16 トレイナー 18 コードブック 20 標準化された画像 22 圧縮機 24 圧縮された画像 26 圧縮復元器 28 圧縮復元された画像 80 写真プリント 82 ネガフィルム 100 装置 102 手段 104 スキャナー 106 変換器 120 取引カード 122 記憶領域(複数トラック) 200 ワークステイション 202 表示器 204 キーボード 206 マウス 208 CD読み出し器 210 CD書き込み器 212 プリンター 214 モデム 216 取引カード書き込み器 A−M テンプレート要素
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マキシム エルバズ アメリカ合衆国,ニューヨーク 14617, ロチェスター,セツランド・ドライヴ 61 番

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 a. 規準化された方向及び位置で少な
    くとも一つの予想された特徴を配置するように選択され
    たクラスからのデジタル化された画像を標準化し; b. 選択されたクラスの標準化された画像により表さ
    れる特徴に対して予想された配置を決定し; c. 選択されたクラスの標準化された画像から各特徴
    に対して予想された位置に現れる画像内容を抽出し; d. 各特徴に対して段階cの抽出された画像内容から
    似た特徴のアドレス可能な集合を形成する各段階からな
    るデジタル化された画像の選択されたクラス内の特徴を
    表す画像特徴のアドレス可能な集合を形成する方法。
  2. 【請求項2】 a. 選択された画像特徴に対する好ま
    しい配置を含む画像に対する標準を確立し; b. 複数の画像から1つの画像を選択し; c. 選択された画像内の選択された特徴の少なくとも
    一つを配置し; d. 少なくとも一つの選択された特徴が標準に応じて
    位置される標準化された幾何画像を形成するために選択
    された画像を操作し; e. 標準化された幾何画像内の画像特徴に応答する標
    準化された画像を形成するために標準化された幾何画像
    を変更し; f. それぞれが問題の特徴を表す特徴ブロックを標準
    化された画像から抽出し; g. 複数の画像の残りに対して段階bからfを繰り返
    し; h. 全ての似た特徴画像ブロックを1つの組内に集
    め; i. 各組に対して組を表す特徴コードベクトルのアド
    レス可能な集合を形成し; j. 段階cからfを抽出された特徴ブロックを形成す
    るために圧縮されるべき特徴画像に適用し; k. 段階jから抽出された特徴ブロックを段階iの特
    徴コードベクトルのアドレス可能な集合と比較し; l. 各特徴ブロックに対して最良適合のアドレスを記
    録する各段階からなる特徴画像を圧縮する方法。
  3. 【請求項3】 圧縮された画像を表すデジタルデータを
    その上に記録され、ここで該デジタルデータは4千から
    442ビットの範囲であり、ここで該デジタルデータは
    請求項2の圧縮方法から得られる各特徴ブロックに対し
    て最良整合のアドレスを表す処理カード。
  4. 【請求項4】 選択された画像特徴に対する好ましい配
    置を含む選択されたクラスの画像に対する標準を確立す
    る手段と;選択されたクラスの各画像内から少なくとも
    一つの選択された画像特徴を配置する手段と;少なくと
    も一つの選択された画像特徴が確立された標準に応じて
    位置される標準化された幾何画像を形成するために選択
    されたクラスの各画像を操作する手段と;標準化された
    幾何画像からそれぞれが問題の画像特徴を表す特徴ブロ
    ックを抽出する手段と;全ての似た特徴ブロックを一つ
    の群に集めるグループ化手段と;各群に対してそれぞれ
    の群を表すコードベクトルにより画像特徴のアドレス可
    能な集合を形成する手段とからなる選択されたクラスの
    画像を表すコードベクトルにより画像特徴のアドレス可
    能な集合を形成する装置。
JP7332355A 1994-12-21 1995-12-20 標準化された肖像画像を圧縮及び圧縮復元する方法及び装置 Pending JPH08265753A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36133894A 1994-12-21 1994-12-21
US361338 1994-12-21

Publications (1)

Publication Number Publication Date
JPH08265753A true JPH08265753A (ja) 1996-10-11

Family

ID=23421636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7332355A Pending JPH08265753A (ja) 1994-12-21 1995-12-20 標準化された肖像画像を圧縮及び圧縮復元する方法及び装置

Country Status (7)

Country Link
EP (1) EP0718807B1 (ja)
JP (1) JPH08265753A (ja)
CN (1) CN1150282A (ja)
AR (1) AR000238A1 (ja)
BR (1) BR9505965A (ja)
DE (1) DE69504289T2 (ja)
ZA (1) ZA959491B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006228232A (ja) * 2005-02-18 2006-08-31 Fujitsu Ltd 文字分割プログラム、文字分割装置および文字分割方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2319380B (en) * 1996-11-15 1998-09-30 Daewoo Electronics Co Ltd Method and apparatus for controlling a descrambling device
EP1091560A1 (en) 1999-10-05 2001-04-11 Hewlett-Packard Company Method and apparatus for scanning oversized documents
CN103020576B (zh) * 2011-09-20 2015-09-30 华晶科技股份有限公司 特征数据压缩装置、多方向人脸侦测系统及其侦测方法
JP5962937B2 (ja) * 2012-04-20 2016-08-03 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 画像処理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8710737D0 (en) * 1987-05-06 1987-06-10 British Telecomm Video image encoding
WO1992002000A1 (en) * 1990-07-17 1992-02-06 British Telecommunications Public Limited Company A method of processing an image
US5331544A (en) * 1992-04-23 1994-07-19 A. C. Nielsen Company Market research method and system for collecting retail store and shopper market research data
US5574573A (en) * 1993-10-29 1996-11-12 Eastman Kodak Company Compression method for a standardized image library
US5466918A (en) * 1993-10-29 1995-11-14 Eastman Kodak Company Method and apparatus for image compression, storage, and retrieval on magnetic transaction cards

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006228232A (ja) * 2005-02-18 2006-08-31 Fujitsu Ltd 文字分割プログラム、文字分割装置および文字分割方法

Also Published As

Publication number Publication date
CN1150282A (zh) 1997-05-21
BR9505965A (pt) 1997-12-23
DE69504289D1 (de) 1998-10-01
EP0718807B1 (en) 1998-08-26
DE69504289T2 (de) 1999-03-04
EP0718807A3 (ja) 1996-07-10
AR000238A1 (es) 1997-05-28
ZA959491B (en) 1996-06-29
EP0718807A2 (en) 1996-06-26

Similar Documents

Publication Publication Date Title
JP2968582B2 (ja) デジタルデータを処理するための方法および装置
JP4903854B2 (ja) デジタル画像におけるオブジェクト検出方法
JP2766200B2 (ja) 磁気トランザクションカードの画像の圧縮、記憶及び取り出し方法とその装置
US5574573A (en) Compression method for a standardized image library
US7295704B2 (en) Image compression usable with animated images
US6914699B1 (en) Image processing
US6968092B1 (en) System and method for reduced codebook vector quantization
US20120294524A1 (en) Enhanced Multilayer Compression of Image Files Using OCR Systems
US20090324065A1 (en) Image processing apparatus and method
US6687411B1 (en) Image coding/decoding method and recording medium having program for this method recorded thereon
Elad et al. Low bit-rate compression of facial images
CN101163188A (zh) 图像处理装置和方法、图像读取装置和图像形成装置
US20170366700A1 (en) Method and device for picture-based barcode decoding
Paschalakis et al. Real-time face detection and tracking for mobile videoconferencing
JPH08265753A (ja) 標準化された肖像画像を圧縮及び圧縮復元する方法及び装置
US20230394871A1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
US5394191A (en) Methods for synthesis of texture signals and for transmission and/or storage of said signals, and devices and systems for performing said methods
US5295202A (en) Method and apparatus for replicating a two-color original image with foreground and background colors exchanged
Fu Color image quality measures and retrieval
JP2901906B2 (ja) 複数品質取引カード画像の方法及び装置
EP0718788A2 (en) Method and apparatus for the formation of standardized image templates
JP3065332B2 (ja) 画像処理方法
JPH0998295A (ja) カラー画像のデータ圧縮方法
JPH04236574A (ja) 画像符号化方式
CN115330629A (zh) 卷积神经网络的卸妆方法、装置、设备及可读存储介质