JPH08249469A - 標準化画像テンプレートの形成方法及び装置 - Google Patents

標準化画像テンプレートの形成方法及び装置

Info

Publication number
JPH08249469A
JPH08249469A JP7332356A JP33235695A JPH08249469A JP H08249469 A JPH08249469 A JP H08249469A JP 7332356 A JP7332356 A JP 7332356A JP 33235695 A JP33235695 A JP 33235695A JP H08249469 A JPH08249469 A JP H08249469A
Authority
JP
Japan
Prior art keywords
image
template
feature
images
elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7332356A
Other languages
English (en)
Inventor
Lawrence A Ray
エイ レイ ローレンス
Richard N Ellson
エヌ エルソン リチャード
Maxime Elbaz
エルバズ マキシム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eastman Kodak Co
Original Assignee
Eastman Kodak Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eastman Kodak Co filed Critical Eastman Kodak Co
Publication of JPH08249469A publication Critical patent/JPH08249469A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/37Individual registration on entry or exit not involving the use of a pass in combination with an identity check using biometric data, e.g. fingerprints, iris scans or voice recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 本発明の技術は似た特徴の画像の圧縮及び圧
縮復元で特に有用である特徴テンプレートの形成を可能
にする。更に詳細には特徴テンプレートはこれらの特徴
を良く相関された領域内に配置するよう方向付けられ、
スケール化される似た画像特徴の整合的な組を有する画
像の大きな集合の圧縮及び圧縮復元を可能にする。 【解決手段】 特徴テンプレートは複数のテンプレート
要素を含み、各々は画像の特定の特徴を表し、データは
各テンプレート要素の属性を表す。特徴テンプレートを
形成する好ましい方法は: 標準化画像を収容するため
に特徴テンプレートの寸法を確立し; 標準化画像内の
似た特徴を収容するために該特徴テンプレートを複数の
特徴型内に分割し; 各特徴型に対して少なくとも一つ
のテンプレート要素を割り当て; そのように形成され
た特徴テンプレートの再構成を実施するために該特徴テ
ンプレートの寸法内に全ての割り当てられたテンプレー
ト要素の位置を記録する各段階からなる。

Description

【発明の詳細な説明】
【0001】関連する出願の相互参照 本出願は以下に関係する:Ray、Ellson、Ga
ndhiによる1993年10月29日出願の米国特許
出願08/145051、「Method And A
pparatusFor Image Compres
sion、 Storage andRetrieva
l On Magnetic Transaction
Cards」とRay、Ellsonによる1993
年10月29日出願の米国特許出願08/14528
4、「Compression Method For
A Standardized Image Lib
rary」とRay、Ellsonによる1993年1
0月29日出願の米国特許出願08/144753、
「Method And Apparatus For
Data Encoding With Reser
ved Value」とRay、Ellson、Elb
azによる同日の出願のコダック文書番号71250号
の「Method For Compressing
And Decompressing Standar
dized Portrait Images」 上記引用特許出願の開示はここにその全てを参考として
引用する。
【0002】
【発明の属する技術分野】本発明はデジタル画像処理に
関し、より詳細には画像を適切に表現するためのデジタ
ル標準化画像特徴テンプレートを形成する方法及び関連
する装置に関する。
【0003】
【従来の技術】行方不明の子供の肖像の集合のような類
似の画像内容の画像のライブラリを考える。この画像の
集合では顔がある共通の特徴を共有するような画素位置
に基づく画像間の相関の大きな度合いが存在する。異な
る画像にわたるこの相関は所定の画像内の空間的な相関
とちょうど同じであり、圧縮を改善するために活用され
うる。
【0004】画像ライブラリの解析は画像内の位置に基
づく画像の忠実度の相対的重要性の知識をもたらす。画
像が行方不明の子供の識別に用いられる場合には子供の
顔上の良い画像の忠実度を維持することは頭髪又は肩の
忠実度よりも重要であり、頭髪又は肩は今度は背景とし
てより重要になる。画像圧縮は視覚的画像の忠実度がよ
り重要でない領域でより効果を発揮する。
【0005】多くの応用で元の画像の向き及び量子化の
保持は画像内に含まれる視覚的情報の維持より重要では
ない。特に行方不明の子供のライブラリ内の画像に対し
て、肖像(ポートレイト)の内の子供の同一性はもとの
画像又は圧縮の助けにより処理された画像のどちらから
も同じく容易に確証できる場合、処理された画像をライ
ブラリに入れるのに損失はない。この原則は元の画像を
規格化されたフォーマットに入れることにより処理され
た画像のライブラリを作るのに適用できる。行方不明の
子供の肖像に対して、これは目を水平に、画像の境界に
対して頭を中心にするよう各子供の頭を方向づけること
を含む。一旦構成されれば、これらの規格化された画像
は画像と画像との相関を加える標準化の知識によりうま
く圧縮される。
【0006】ベクトル量子化(VQ)として知られる圧
縮方法からの技術は画像の部分間の相関を見つけるのに
有用である。ベクトル量子化VQによる圧縮は固定率の
損失のある高率の圧縮の応用にうまく適合する(R.
M.Gray著の「Vector Quantizat
ion」IEEE ASSP誌,4−29頁、1984
年4月を参照)。この方法は画像を小さな断片又は「画
像ブロック」に分解する。それからこれらのブロックは
一般に符号表として知られる画像ブロックの所定の組内
の他の画像ブロックに対して照合される。照合アルゴリ
ズムは一般に最小二乗誤差法(MSE)である。画像ブ
ロックの組があらかじめ決められているので、組への1
つの登録は単純な目次により参照されうる。結果として
多画素ブロックは単一の番号で参照される。そのような
方法を用いて画像に対するビット数は計上されうる。多
数のビットが画像ブロック毎に割り当てられる場合に符
号表の大きさが増加されうる。同様に多数のビットが画
像に割り当てられている場合には画像ブロックの数は増
加されうる(故に各ブロックの大きさが減少される)。
【0007】コードブックは最初にトレーニング画像組
として知られている代表的な画像の集合から形成するこ
とにより決定される。次に画像は画像ブロックに分割さ
れ、画像ブロックは例えば8x8画像ブロックに対し、
空間が64次元を有するような高次元のベクトル空間内
のベクトルとして考えられる。画像ブロックは画像内の
トレーニング組の各画像内の所定の領域から選択され
る。一旦全てのベクトルがトレーニング組から決められ
ると、クラスターが見いだされ、代表的な要素が各クラ
スターに割り当てられる。クラスターはトレーニング組
の要素と該要素が割り当てられたクラスターの代表との
間の全体の結合距離を最小にするような方法で決められ
る。選択する技術はLind−Buzo−Gray(L
BG)アルゴリズムである(Y.Lind他著の「An
Algorithm for Vector Qua
ntizer Design」IEEE Transa
ctions on Communisations,
Vol.COM−28,No.1,84−95頁、19
80年を参照)。クラスターの数はブロックに対して計
上されたビットの数により決められる。nビットが計上
されている場合、符号表は2n までのクラスターの代表
又は符号ベクトルを含みうる。
【0008】上記引用の特許出願ではRay、Ells
on、Gandhiによる米国特許出願08/1450
51及びRay、Ellsonによる米国特許出願08
/145284の両方は画像のライブラリ内の標準化さ
れた特徴の利点により画質の最小の損失で非常に高い圧
縮比を可能にするシステムを記載している。この圧縮方
法は予想可能性を改善するために標準化により形成され
る内蔵された画像間相関の利点を有し、故に標準化画像
のトレーニング及び8x8画素コードベクトルからなる
複数のコードブックを形成することにより圧縮性を改善
する。
【0009】これらの特許出願はライブラリ内の画像の
共通の特徴を抽出し、これを画像標準化の基本として用
いる処理を記載している。いったん標準化されたライブ
ラリ画像内に標準化されると、画像は圧縮され、続いて
元のライブラリ画像の損失のある表現に圧縮復元され
る。上記引用された特許出願の従来技術の概要は以下を
含む:標準化: 最も重要な画像特徴を選択する:選択された特徴を増強
するためにライブラリから代表的な画像の組を処理す
る:代表的な画像内に選択された特徴を配置する:画像
特徴の位置に対する拘束を決める:画像特徴位置拘束に
合うように画像を処理する:特徴の表現又は画質の望ま
しいレベルに基づき画像の領域を割り当てる:各副領域
に対して画像の画像対画像相関を決める:画像ブロック
内の副領域の分割及びコードブックの大きさに基づき各
副領域に対する画像情報の記憶容量を割り当てる:相関
の利点を有するようコードブックを構成する:特徴を増
強するよう画像を処理する:選択された特徴を画像内に
配置する:画像特徴配置拘束に合うように画像を処理す
ることにより画像を標準化する:副領域及びそれらの画
像ブロックに基づき画像を分割する:各領域に対して画
像内容を最良に近似するコードブック内のエントリを決
める:これが圧縮された画像であるときに各画像ブロッ
クに対する一連のコードブック値を記憶する。圧縮復元 一連のコードブック値からコードブック値を抽出する:
一連のコードブック値内の対応する副領域の位置に基づ
きコードブックを決める:上記決定されたコードブック
値からコードブック値に基づき画像ブロックを抽出す
る:画像ブロックを副領域内の近似画像ブロック位置に
コピーする:全ての画像ブロック位置がエントリ画像内
に満たされるまで画像ブロックを挿入し続ける。磁気取
引カードの単一トラックに対する国際規格を満足する方
式で圧縮された顔画像を記憶するために、圧縮された顔
画像データは500ビット以下でなければならない(I
SO7811/2参照)。
【0010】500ビット以下に顔画像を記憶する場合
のように目標ビット数が極端に小さいときには上記の圧
縮/圧縮復元処理はある確認及び識別応用で用いるため
の満足できる質の顔画像を提供できない。付加的な技術
がより要求される確認システムに対する圧縮された画像
の質を更に改善するために必要である。改善の機会は特
殊化されたコードブック形成、画像標準化、画像ブロッ
ク対称性に存在する。
【0011】画像内の顔の位置及び向きの標準化をして
さえも人間の顔の幾何配置は本質的な対称性を有する一
方で肖像に対する照明の条件は高度に非対称的である。
これは人間の顔の肖像の左右の側間の照度の不均衡を生
ずる。必要なことは顔画像肖像標準化のより高い程度を
達成するために及び人間の顔画像の自然な対称性を増強
するために人間の顔肖像の照明をバランスする方法であ
る。
【0012】輝度及び画像特徴の両方の標準化によりコ
ードブックは画像内で特殊な位置で予想された画像内容
をよりよく表すよう発展されうる。コードブック特徴化
はSextonによる米国特許第5086480号、
「Video Image Processing」に
記載され、ここでは2つのコードブックの使用が記載さ
れている。この圧縮方法は両方のコードブックを精力的
に捜索することにより2つのコードブックのうちから最
良のコードベクトルを見いだし、そして最良の適合が見
いだされたコードブックにフラグを付ける。正味の結果
はフラグが選択されたコードブックを示す異なるコード
ベクトルの数が可能な2つのコードブックを含む「超コ
ードブック」である。コードブック選択は画像の領域の
内容の先験的な知識から生じない;Sextonは画像
毎のコードブック毎にどのコードブックが用いられるか
を計算する。より大きな圧縮の機会はコードブックフラ
グを記憶する必要を除去することである。
【0013】Sextonの方法は両方のコードブック
で全てのコードベクトルが同じ寸法を有することを要求
するものである。更にまた上記のRayの従来技術では
画像を等しい大きさの画像ブロック内に分割する。圧縮
された肖像画の質を改善する他の方法は顔画像内の相関
を用いることであり、それは顔の左右の側の間の概略鏡
像対称である。前面に近い遠近肖像でしばしば大きな度
合いの相関が中心線に近い顔の部分間に存在する。特に
目の上及び下の部分を描くために用いられる画像ブロッ
クは高度に対称的な相関を示す。しかしながら顔の中心
線に沿って、対称のレベルは若干異なる角度から見たと
きに鼻の現れ方の変動により低下する。必要なことは鼻
の上に有害な対称性の拘束を課すことなしに顔の中心線
の周辺の領域内の人間の顔の自然な対称性を探すことに
より圧縮された肖像画像を記憶するのに必要なビット数
を更に減少する方法である。
【0014】画像のある領域はどんな顕著な値も個人の
識別に対して貢献しない。例えば肩の領域は識別処理に
対して最小の値であり、更にこの領域は通常衣服により
覆われ、これは同じ個人に対しても高度に変化する。そ
のような領域内にほとんどの値が置かれない故に画像を
エンコードするためのビットの割り当てはまた減少され
る。本発明ではこれらの領域の幾つかはもしあったとし
てもほとんど割り当てられず、画像データは隣接するブ
ロックの画像データから合成される。これはより重要な
領域をエンコードするためにより多くのビットの割り当
てを許容する。
【0015】
【発明が解決しようとする課題】本発明の目的は画像の
関連する組に対するデータ記憶要求を減少するシステム
内で用いられ得る特徴テンプレートを提供することであ
る。
【0016】
【課題を解決するための手段】本発明の技術は似た特徴
の画像の圧縮及び圧縮復元での特定の利用を見いだす画
像特徴テンプレートの形成を可能にする。更に詳細には
特徴テンプレートはこれらの特徴を良く相関した領域に
配置するよう方向付け、スケール化されうる似た画像特
徴の整合的な組を有する画像の大きな集合の圧縮及び圧
縮復元を可能にする。
【0017】本発明の特徴テンプレートはそれぞれが対
象の特徴を表す複数のテンプレート要素と;各テンプレ
ート要素の属性を表すデータとからなる。特徴テンプレ
ートを形成する好ましい方法は標準化画像を収容するた
めに特徴テンプレートの寸法を確立し;標準化画像内の
似た特徴を収容するために該特徴テンプレートを複数の
特徴型内に分割し;各特徴型に対して少なくとも一つの
テンプレート要素を割り当て;そのように形成された特
徴テンプレートの再構成を実施するために該特徴テンプ
レートの寸法内に全ての割り当てられたテンプレート要
素の位置を記録する各段階からなる。
【0018】上記から本発明の目的は画像の関連する組
に対するデータ記憶要求を減少するシステム内で用いら
れ得る特徴テンプレートを提供することである。
【0019】
【発明の実施の形態】以下に同じ符号は同じ部分を示
し、本発明の一部分をなす図を参照して本発明の上記の
及び他の目的を更に詳細に説明する。図1の(A)は前
面の顔の肖像である画像を示す。この画像の例では顔は
傾けられ、画像の中心に関して平行移動されて(中心か
ら外されて)いる。元の画像に依存して画像内の顔の位
置及び大きさの他の変動が生じうる。本発明で最大の結
果を達成するために顔の大きさ、位置、向きは標準化さ
れるべきである。画像上で操作するために画像は一般に
画素値のマトリックスとしてデジタルフォーマットに移
行される。画像のデジタルフォーマット(画素値)は元
画像をデジタル化される電気信号値に変換するために元
画像をスキャンすることにより得られる。それからデジ
タル画像フォーマットは画像を表示装置上に表示し、標
準化処理は表示された画像に対して及び標準化された幾
何画像を形成するよう表示された画像を形成する画素値
に対して適用されるよう用いられる。画像はテンプレー
トに関するテンプレート要素間の質の整合を提供するよ
うに標準化される(詳細は後で説明する)。処理は画像
対象の左右の目の中央を位置決めすることにより図1の
(A)の画像から開始する。図1の(B)では部分的に
標準化された幾何画像を表す顔画像の新たなデジタル画
像は必要なら図1の(A)の元画像を回転し、平行移動
することにより形成される。回転及び平行移動は所定の
水平軸に沿って、中心垂直軸に関して等しく離間された
左右の目の中央を位置決めするようによく知られた画像
処理操作を用いて達成される。図1の(C)は画像を標
準の大きさにスケーリング処理することにより標準化さ
れた幾何的な顔画像を形成するために大きさを変えられ
た図1の(B)の画像を示す。
【0020】図2を参照するに標準化された幾何画像を
形成する方法は「画像の選択」とラベルされた操作ブロ
ックから始まるフローブロックの左の列から始まる。選
択処理は本発明のテンプレートで処理された画像を有す
るような個人の前面の顔画像の利用可能性に基づき選択
される。選択処理に含まれるのは利用可能な画像のデジ
タルマトリックス表現の形成である。デジタルマトリッ
クスは操作者に対して表示するためにシステム内に次に
ロードされる(図15のシステムを参照)。上記のよう
に操作者は左右の目の点を位置決めし標準化された幾何
画像を形成するために画像の顔部分の必要とされるいか
なる回転、平行移動、再スケーリングをもなす。
【0021】より特徴的には本発明の好ましい実施例で
は図1の(C)の標準画像と図2のフローチャートに関
して画像の標準幾何配置は画像の上端から28画素、仮
想的な垂直中心線のそれぞれの側上に8画素の位置の目
の中心を有する幅が56画素、高さが64画素の画像の
大きさになるよう設定される。左右の目の中央を識別す
ることはマウス、デジタル書き込みタブレット、ライト
ペン、又は接触感応スクリーンのような装置により駆動
されるカーソルを用いて中央を指示する人間の操作者に
最初の画像を表示することによりなされる。代替的な方
法は特徴捜索プログラムを用いて処理を自動化すること
である。人間の操作者は目の位置を位置決めし、プロセ
ッサは操作者が特定した位置の小さな近傍周辺に限定さ
れる目の発見捜索方法を通して位置を精密に調整する。
標準化の次の段階は目の位置を所定の配置に標準化する
ために画像を変化することである。一般的にはこれは画
像の平行移動、スケール化、回転の標準化画像処理操作
からなる。
【0022】なされた画像の大きさ及び目の位置調整と
共に標準化幾何的画像は記憶され、輝度の標準化過程が
なされる。この過程はフローブロックの偶数ラベルされ
た40ー52により表される。デジタル化された画像の
輝度の変動を標準化するために用いられる3つの空間的
スケールがある;それは光のレベル/方向に対して大き
く、側方の光からの非対称な影を補正することに対して
中間で、ガラス、宝石、皮膚からの鏡映的な高輝度の減
少に対して小さい。これらの過程は画像内の平均輝度レ
ベルを変化する。特徴を識別するのに有用なある特徴は
白黒階調肖像で緩和される傾向にある。コントラストと
称される輝度レベルの変動はまたこれらの特徴を増強す
るために調整される。
【0023】ブロック50で表された機能的な操作は顔
の平均輝度、即ち鼻の一般的な近傍で見られる平均照明
を設定値にシフトすることである。本発明の好ましい実
施例では明るい皮膚の色調の人に対しては設定値は16
5であり、中間の皮膚の色調の人に対しては設定値は1
55であり、暗い皮膚の色調の人に対しては設定値は1
35である。ブロック50で形成された標準化されたデ
ジタル画像は機能ブロック52に応答して記憶される画
素値の記憶可能なマトリックスにより表現される。
【0024】図3は図2の標準化された画像と共に用い
られるテンプレート30のレイアウトを示す。テンプレ
ート30はAからMとラベルされた64のテンプレート
要素内に分割される。要素は人間の顔の13の対応する
特徴に関して配置され、例えばAとラベルされたテンプ
レート要素は頭の上端で頭髪の特徴に対応し、Gとラベ
ルされたテンプレート要素は目に対応する。似たラベル
を有するテンプレート要素は特徴の表現で分割する。図
7、8、9、の表は残りのテンプレート要素の更なる記
載を提供する。本発明の好ましい実施例は64テンプレ
ート及び13特徴でなされるが、これらの数は状況に沿
って変化されえ、本発明の方法の構成を制限するもので
はない。テンプレートのある領域はどの要素に対しても
割り当てられていない。これらの割り当てられない領域
はコードブックからの情報の検索に基づきそれらの画像
内容を有さない。画像内容をこれらの領域に割り当てる
方法は以下に説明する隣接する領域の割り当てに基づ
く。テンプレートの大きさは幅が56画素で高さが64
画素の標準化された画像の幾何配置に整合する。テンプ
レート要素の大きさは表現しようとする顔の特徴の大き
さに依存する。例えばGは標準化された画像内の目の大
きさに関し、要素Gの両方の例は標準化された画像内の
目の位置に配置される。
【0025】図4を参照するに影を付けられたテンプレ
ート要素は以下に詳細に説明する左右を裏返した性質を
割り当てられている。図5を参照するに影を付けられた
テンプレート要素は以下にまた詳細に説明する上下を裏
返した性質を割り当てられている。テンプレートの他の
性質は連結である。図6に影を付けられた領域は連結の
部分である点プレート要素の配置を示す。この特定の実
施例では要素の7つの連結された対が存在する。連結は
例えば中央の左でGは中央の右でのGに連結されるよう
に影を付けられたテンプレート要素の各対間で水平であ
る。7つの連結された対は好ましい実施例として示さ
れ、連結は2以上の群及び類似のラベルされた要素のど
の組の間でも生じうる。
【0026】テンプレート30は一連のデータ記録を表
す一連のテンプレート要素からなり、ここで各記録は好
ましい実施例では位置、大きさ、ラベル、左右の性質、
上下の性質、連結を記述する。他の及び/又は付加的な
要因を有する記録は必要が生じたときに形成される。テ
ンプレート30はテンプレート要素の分布及び大きさを
記録する。各テンプレート要素はコードブックと画像内
の空間配置に割り当てられる。(テンプレートのある部
分はテンプレート要素を有さず、これらの領域は以下に
詳細に説明する。)図3に示されるテンプレートは長方
形画素領域からなる64のテンプレート要素からなる。
これらのテンプレート要素はそれぞれが顔の特徴の異な
る型に対応する13の異なるコードブックの一つに割り
当てられる(A−Mとラベルされる)。コードブックは
4x16,8x8,8x5,4x10,4x6,又は8
x4のいずれかの画素の均一な大きさのコードベクトル
の集合である。コードブック内にあるコードベクトルは
画像特徴のライブラリから得られる。
【0027】図7を参照するにラベルA−Mは人間の顔
に対する特徴型を表す。ラベル行内のラベルA−Mのそ
れぞれに関する人間の特徴はラベル行のすぐ下にある行
である。図7の残りは各特徴の発生数及び唯一の発生数
に沿った関連するラベルのそれぞれに対するテンプレー
ト要素の幅及び高さとしての情報を提供する。唯一の発
生は連結された独立なテンプレート要素の数を示す(連
結された要素は単一の唯一の発生としてカウントされ
る)。
【0028】図8、9はテンプレート要素データ記録を
示す。これらのデータ記録は各テンプレート要素の属性
を表し、左上方向の画素座標、幅、高さ、左右の裏返し
性質、上下の裏返し性質、連結群の記録、特徴型に対す
るデータ記録フィールドを含む。連結群の記録がー1の
場合には連結は生じない。連結群の他の値はその群のテ
ンプレート要素を識別する。図6の上端の2つのテンプ
レート要素Dは連結され、図8、9の表の連結群列内の
同じ連結群番号0を与えられる。
【0029】以下の説明の参照は図7、8、9、10で
なされる。図7で参照された特徴型はタイルの集合とし
て図10に示される。例えば目の特徴である特徴型Gに
対する集合内のタイル1は画素の配列として表される目
の画像である。特徴型Gに対する集合内の他のタイル2
から2nは目の他の画像である。好ましい実施例では各
特徴型に対する各集合内のタイルの数はある正の整数n
に対して2nである。集合内のタイルはそれらが画像特
徴を表すような視覚的に類似の性質を共有する。異なる
特徴型からのタイルの比較は一般に視覚的に類似ではな
い。
【0030】図11はテンプレート要素をタイルへの割
り当てとした画像を示す。図11のテンプレート要素の
それぞれはそれに関連する番号を有し、この番号はテン
プレート要素の特徴型に対するタイルに対応する。例え
ばテンプレート要素60は特徴型Aであり、図10内の
頭髪の特徴型タイルAの集合内の46の番号の関係する
タイルを有する。同様にして目の特徴型に対するテンプ
レート要素62は123と番号づけられ、これは図10
内のGとラベルされた目の特徴型集合内の番号123を
有するタイルに対応する。同じ連結群内のテンプレート
要素(目の特徴型テンプレート要素62と64のよう
な)は同一のタイル番号を有するものである。連結され
た要素の識別を容易にするためにそれらは図11内で太
字の番号で印刷されている。
【0031】図11内の各テンプレート要素に割り当て
られたタイル番号はタイルの似たラベルされた特徴型集
合から似た番号のタイルを検索するのに用いられる。検
索されたタイルはタイル番号を含むテンプレート要素と
して同じ位置に配置される。得られたタイルの集合体は
図12のモザイクを形成する。次に選択されたタイルは
裏返しにされる。図4、5はどのテンプレート要素がそ
れぞれ左右及び上下の裏返しの性質を有するかを示す。
これらの裏返しの性質を有するテンプレート要素はまた
図8、9の表内で真/偽フラグで示される。裏返される
べき図12でのタイルは画素を表す箱を介して対角線に
より識別される。図13は裏返しの性質の図12内のタ
イルに対する適用を示し、ここで図4内の影を付けられ
たテンプレート要素に対応する図12内の全てのコート
ベクトルは左右を裏返され、図5内の影を付けられたテ
ンプレート要素に対応する図20内の全てのコートベク
トルは上下を裏返される。あるテンプレート要素は図1
2から図13のタイル方向へタイルの平行移動で裏返さ
れ、裏返しは関連する要素内でもなされる。
【0032】次の段階は図13の方向付けられたタイル
モザイクに基づく最終画像の画像処理操作により形成さ
れる。図13のモザイクはタイルからのその構成の結果
としてある視覚的に好ましくないアーティファクトを有
しうる。これらのアーティファクトは画像処理アルゴリ
ズムのある組み合わせで減少されうる。好ましい実施例
ではよく知られた画像処理操作の組み合わせはタイル境
界を横切る平滑化、コントラスト増強、失われた画像領
域を満たすための線形補間、空間的に依存するランダム
ノイズの付加を含むように適用される。平滑化操作は3
つの連続した画素、P1,P2.P3を考えることにより
説明され、ここでP1,P 2は1つのタイルであり、P3
は付加的なタイルである。画素P2は以下の結果により
置き換えられる: (P1+2*P2+P3)/4 コントラスト増強はモザイクに対して最小画素値min
と最大画素値maxとを決定することにより達成され
る。モザイクの各画素値Pcurは以下の式によりPn ew
より置き換えられる: Pnew=255*(Pcur−min)/(max−mi
n) どのテンプレート要素にも対応しない特徴テンプレート
の領域は線形補間を用いて満たされる。各領域に対して
境界画素の知られている値は平均画素値を計算するため
に用いられる。知られている境界に対向する知られてい
ない隅はこの平均値に対して設定される。割り当てられ
ない内部の画素の残りは線形補間により計算される。本
発明の好ましい実施例では特徴テンプレートの隅にそれ
ぞれ位置するそのような4つの割り当てられない領域が
ある。
【0033】加えられる空間的なランダムノイズは以下
により決定される: n(i,j)=v*sqrt((i−28)**2+
(j−32)**2)*rand v=ノイズ振幅 ここで i=影響される画素の列 j=影響される画素の行 及びrandは範囲(ー1から1)での浮動小数点の疑
似乱数である。値n(i,j)は位置(i,j)での画
素に加えられる。得られた画素が255以上である場合
にはそれは255に設定され、ゼロ以下の場合には0に
設定される。図14はこれらの操作により処理された後
の画像を表す。他の画像処理操作は他の状況で用いら
れ、好ましい実施例は制限されるとは考えられないもの
である。
【0034】図15は本発明が実施される装置100を
示す。装置100は写真プリント80又はネガ画像82
のようなデジタルでない画像を画像のデジタル表現に変
換する手段102からなる。一般に変換は画素値をアナ
ログの形で表す信号を出力するスキャナー104でなさ
れる。アナログ/デジタル変換器106はアナログ画素
値をスキャンされた画像のデジタル値表現に変換するた
めに用いられる。デジタル画像の他の入力源はワークス
テーション200内への直接入力である。本発明の好ま
しい実施例の装置ではワークステーション200はオペ
レーティングシステムとしてUNIXが走り、標準Cプ
ログラム言語を用いてエンコードされたサン スパーク
10である。デジタル画像の表示はソフトウエア、キー
ボード204、マウス206制御の下で操作される表示
器202による。デジタル画像はまたCD読み出し器2
08又は他の同様な装置によりシステム内に導入され
る。本発明の方法及び装置により形成されたテンプレー
トはCD上に記憶するためにCD書き込み器210にダ
ウンロードされ、プリンター212によりハードコピー
プリントされ、記憶カード(取引カードのような)上に
書き込まれ、又はモデム214と伝送線により遠隔地で
更に処理又は記憶されるよう伝送される。
【0035】本発明の他の使用は肖像画以外の画像の圧
縮を含む。他の特徴型は例えば署名と金額と住所等によ
り銀行と顧客番号をチェックするような銀行小切手に関
する特徴を示しうる。人間の顔と同様にこれらの特徴は
各小切手に対して同じ位置に配置される傾向にある。本
発明の好ましい実施例と考えられることが示されている
一方で多くの変更及び改良が本発明の真の精神から離れ
ることなくその中でなされる。故に請求項ではそのよう
な変更及び改良の全てにわたり本発明の真の範囲に含ま
れるよう意図されている。
【図面の簡単な説明】
【図1】(A),(B).(C)にそれぞれ傾けられ、
標準化された位置に回転及び平行移動され、標準化され
た大きさにされた前面の顔画像を示す。
【図2】本発明の標準化の方法をフローチャートの形で
示す図である。
【図3】テンプレート内のテンプレート要素の位置及び
大きさを示す図である。
【図4】左右が裏返しの性質を有するテンプレート内の
テンプレート要素の位置及び大きさを影を付けられた領
域で示す図である。
【図5】上下が裏返しの性質を有するテンプレート内の
テンプレート要素の位置及び大きさを影を付けられた領
域で示す図である。
【図6】連結されたテンプレート内のテンプレート要素
の位置及び大きさを影を付けられた領域で示す図であ
る。
【図7】テンプレート内の肖像の特徴、それらの関連し
たラベル及びそれらの特性を表の形で示す図である。
【図8】図3ー6に示されたテンプレート内の各要素に
対するテンプレート要素データ記録を示す図である。
【図9】図3ー6に示されたテンプレート内の各要素に
対するテンプレート要素データ記録を示す図である。
【図10】本発明の特定の実施例で用いられる各特徴の
型A−Mと関係するタイルの集合を示す図である。
【図11】圧縮された画像に対して番号づけられ、ラベ
ルされるタイルを示す図である。
【図12】少なくとも一つの裏返しの性質を有するより
軽度に陰影づけられたタイルを有する特徴型タイル集合
から抽出されたタイルを示す図である。
【図13】全ての裏返しの性質を実施した後のタイルを
示す図である。
【図14】最終画像を示す図である。
【図15】本発明の方法が実施される好ましい装置配置
を示す図である。
【符号の説明】
30 テンプレート 60 特徴型Aに対するテンプレート要素 62 目の特徴型に対する第一のテンプレート要素 64 目の特徴型に対する第二のテンプレート要素 80 写真プリント 82 ネガフィルム 100 装置 102 手段 104 スキャナー 106 変換器 120 取引カード 122 記憶領域(複数トラック) 200 ワークステイション 202 表示器 204 キーボード 206 マウス 208 CD読み出し器 210 CD書き込み器 212 プリンター 214 モデム 216 取引カード書き込み器 A−M テンプレート要素
フロントページの続き (72)発明者 マキシム エルバズ アメリカ合衆国,ニューヨーク 14617, ロチェスター,セツランド・ドライヴ 61 番

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】それぞれが対象の特徴を表す複数のテンプ
    レート要素と;各テンプレート要素の属性を表すデータ
    とからなる特徴テンプレート。
  2. 【請求項2】標準化画像を収容するために特徴テンプレ
    ートの寸法を確立し;標準化画像内の似た特徴を収容す
    るために該特徴テンプレートを複数の特徴型に分割し;
    各特徴型に対して少なくとも一つのテンプレート要素を
    割り当て;そのように形成された特徴テンプレートの再
    構成を実施するために該特徴テンプレートの寸法内に全
    ての割り当てられたテンプレート要素の位置を記録する
    各段階からなる特徴テンプレートを形成する方法。
JP7332356A 1994-12-21 1995-12-20 標準化画像テンプレートの形成方法及び装置 Pending JPH08249469A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US36135294A 1994-12-21 1994-12-21
US361352 1999-07-26

Publications (1)

Publication Number Publication Date
JPH08249469A true JPH08249469A (ja) 1996-09-27

Family

ID=23421698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7332356A Pending JPH08249469A (ja) 1994-12-21 1995-12-20 標準化画像テンプレートの形成方法及び装置

Country Status (6)

Country Link
EP (1) EP0718788A2 (ja)
JP (1) JPH08249469A (ja)
CN (1) CN1150283A (ja)
AR (1) AR000239A1 (ja)
BR (1) BR9505966A (ja)
ZA (1) ZA959492B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10038902B2 (en) 2009-11-06 2018-07-31 Adobe Systems Incorporated Compression of a collection of images using pattern separation and re-organization
CN102982501B (zh) * 2012-11-19 2015-07-01 山东神思电子技术股份有限公司 一种图像样本标定方法
CN104021138B (zh) * 2014-04-23 2017-09-01 北京智谷睿拓技术服务有限公司 图像检索方法及图像检索装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668222A (ja) * 1992-08-24 1994-03-11 Casio Comput Co Ltd モンタージュ作成装置
JPH08141212A (ja) * 1994-11-24 1996-06-04 Taito Corp モンタージュ機能を有するゲーム機

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8710737D0 (en) * 1987-05-06 1987-06-10 British Telecomm Video image encoding
GB8910749D0 (en) * 1989-05-10 1989-06-28 Sherman Robin L Methods and apparatus for obtaining information for characterising a person or animal
US5151951A (en) * 1990-03-15 1992-09-29 Sharp Kabushiki Kaisha Character recognition device which divides a single character region into subregions to obtain a character code
JP3040466B2 (ja) * 1990-07-17 2000-05-15 ブリテイッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 画像処理方法
US5237627A (en) * 1991-06-27 1993-08-17 Hewlett-Packard Company Noise tolerant optical character recognition system
US5246253A (en) * 1991-10-17 1993-09-21 Mykrantz John R Garden planning kit
US5331544A (en) * 1992-04-23 1994-07-19 A. C. Nielsen Company Market research method and system for collecting retail store and shopper market research data
US5365596A (en) * 1992-12-17 1994-11-15 Philip Morris Incorporated Methods and apparatus for automatic image inspection of continuously moving objects
US5574573A (en) * 1993-10-29 1996-11-12 Eastman Kodak Company Compression method for a standardized image library

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0668222A (ja) * 1992-08-24 1994-03-11 Casio Comput Co Ltd モンタージュ作成装置
JPH08141212A (ja) * 1994-11-24 1996-06-04 Taito Corp モンタージュ機能を有するゲーム機

Also Published As

Publication number Publication date
EP0718788A2 (en) 1996-06-26
EP0718788A3 (ja) 1996-07-17
CN1150283A (zh) 1997-05-21
BR9505966A (pt) 1997-12-23
ZA959492B (en) 1996-07-10
AR000239A1 (es) 1997-05-28

Similar Documents

Publication Publication Date Title
US11010955B2 (en) Point cloud mapping
US5754697A (en) Selective document image data compression technique
US5825917A (en) Region-based image processing method, image processing apparatus and image communication apparatus
US6246791B1 (en) Compression/decompression algorithm for image documents having text, graphical and color content
US6587583B1 (en) Compression/decompression algorithm for image documents having text, graphical and color content
JP2968582B2 (ja) デジタルデータを処理するための方法および装置
CA1235514A (en) Video recognition system
US7376266B2 (en) Segmented layered image system
US8548241B2 (en) Enhanced multilayer compression of image files using OCR systems
US7088870B2 (en) Image region filling by example-based tiling
CN101163188B (zh) 图像处理装置和方法、图像读取装置和图像形成装置
US7848567B2 (en) Determining regions of interest in synthetic images
JPH07184058A (ja) 標準化画像ライブラリ用の圧縮方法
EP1104199A1 (en) Image coding/decoding method and recorded medium on which program is recorded
US8731058B1 (en) Method and apparatus for processing video data
JPH08249469A (ja) 標準化画像テンプレートの形成方法及び装置
JP2901906B2 (ja) 複数品質取引カード画像の方法及び装置
JPH08265753A (ja) 標準化された肖像画像を圧縮及び圧縮復元する方法及び装置
US20220157077A1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
AU785095B2 (en) Image processing method, apparatus therefor and storing medium
US5751858A (en) Moving picture coding apparatus
JPH04236574A (ja) 画像符号化方式
JPH01108678A (ja) 画像電子ファイル装置
Dixit Hardware And Software Architectural Considerations In Image And Graphics Processing
Aguado et al. S3TC IMAGE COMPRESSION USING CLUSTERING