JP2003523587A

JP2003523587A - ビジュアルアテンションシステム

Info

Publication number: JP2003523587A
Application number: JP2001560954A
Authority: JP
Inventors: スタンティフォード、フレデリック・ウォーウィック・マイケル
Original assignee: British Telecommunications PLC
Current assignee: British Telecommunications PLC
Priority date: 2000-02-17
Filing date: 2001-02-08
Publication date: 2003-08-05
Anticipated expiration: 2021-02-08
Also published as: CA2400085C; CN1430767A; WO2001061648A3; US6934415B2; KR100821847B1; EP1281164B1; EP1281164A2; US20020081033A1; JP4732660B2; KR20020075918A; AU2001232029A1; CA2400085A1; CN1214349C; WO2001061648A2

Abstract

(57)【要約】目視可能なスクリーン内の最も顕著な特徴を予備的な訓練なしにシーン内部で近隣との間の類似性を見付ける上での困難性を測定することによって識別する。ある領域内のピクセルはシーン内の他の部分の大部分が似ている領域では、目視での注目について低測度の得点（スコア）を得る。これに対して、画像の他の部分とはたくさんの非類似を有している領域は目視での注目について高測度を集めることになる。この発明は試行錯誤プロセスを使用して画像の部分間での非類似を見つけるようにして、提示されることができる異常についての予備知識を必要としない。この発明はピクセル間の依存性を処理することの使用を避けて、各ピクセルについての直截的な並列実施を可能にしている。この発明は広い応用を有しているものであり、健康上のスクリーニングと品質管理プロセスにおける異常パターンの探索、及びサインや広告の目視可能性（ビジビリティ）を評価するための目視に係る人間工学的解析で使用される。この発明は、可変レート画像圧縮を与えるために画像プロセッサに対して顕著な特徴の測度を提供する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】

この発明は静止画像もしくはビデオシーケンス内部に含まれている目立ったオ
ブジェクトの位置決めをするためのシステムに係り、限定するわけではないが、
とくに画像圧縮システムにより使用されるシステムに関する。

【０００２】

【従来の技術】

人間の視覚に係る眼と脳との知覚系（human visual eye-brain perceptual sy
stem）は提示されたシーン（情景）の一番重要な特徴を識別、同定するのに非常
に優れていて、大部分の自動化システムにとって必要とされているような予備的
な学習訓練なしでも、背景とか周囲の分布（ポピュレーション）からある種の違
いがあるオブジェクトを識別するのに非常によくできている。しかし、オートメ
ーションが望まれる若干の応用が存在し、例えば作業が非常に頻繁に反復される
とか、データ量が莫大な場合である。特定の例は医学的な顕微鏡の検鏡板に塗っ
た少量の（smear）サンプルを癌細胞識別のために検査することである。このよ
うな情況下では、大きな数のサンプルが検査されなければならず、しかも異常は
まれであり、人間である観察者の注意が緩んでしまって、探しているその特徴を
見過してしまうことがある。

【０００３】区別することができる画像内のオブジェクトを自動的に識別するシステムは、
また視覚上の情景（ビジュアルシーン、以下、visualを目視上とか目視可能なと
訳出する）内の重要な主体（principal subject）の位置の識別同定、情報サイ
ン（標識）の設計と位置決め、また目視可能な表示装置の長ったらしくしかも高
価な人間的因子の試行に代るものといった例のように数多くの他の目的にとって
も望ましいこととされている。

【０００４】

【発明が解決しようとする課題】

目視上注目されるところを測定するための既存のシステムは、画像から前もっ
て特定した特徴（フィーチャ、例えば色、強度、配向）を抽出し、つぎに分類器
（例えばニューラル網）を学習訓練させて、大きく注目を集めるところ（ハイア
テンション）の領域を識別、同定する。これらの学習訓練ができるモデルは、そ
の画像内で探し求められている特徴の選択に大きく依存していて、システムの設
計と試験とのために使用されたものと殆んど類似性のないような新しい目視可能
な素材を処理することができない。逆説的な（パラドキシカルな）言い方をする
と、ある特徴は、学習訓練をしたシステムによってそうと同定されることになる
には奇形変形の仕方が過度であると単純にされるものである。このようなシステ
ムはまた予め選定した特徴を処理するためにかなりの計算処理資源を必要として
おり、さらに加えて、このような負荷は処理の範囲が拡大されて、もっと特徴が
加えられるのに伴って無制限に増加するものである。

【０００５】既知の画像圧縮システムの大部分は画像を一定の圧縮レートでしたがって一定
の圧縮品質でだけ圧縮できるという不都合を備えている。既知の可変レート圧縮
システムは画像内の関心のある領域に従り圧縮レートを自動的に変えることがで
きない。大部分の場合には、関心のある領域だけを高品質で圧縮しながら、画像
のその余の部分（背景のようなところ）を低品質でのみ圧縮することで十分であ
ろう。圧縮品質と画像ファイルサイズとは互に他に依存しているので、これは圧
縮された画像ファイルにとって必要とされるスペース（空間）の全体量を減らす
ことになる。職業的な（プロフェッショナルの）Ｗｅｂ設計者により使用されて
いる一つの技術は、ＪＰＥＧでの圧縮前に画像の背景を単純にぼんやりさせる（
blur）ことである。これは背景が連続しているトーンで作られるように強制し、
それによって画像内の空間周波数量を低減する。このように前処理された画像は
その記憶要件を最大３０％まで減らされていて、この量はぼんやりさせていない
画像に対して比較したぼんやりしている量に依存している。手によって画像をぼ
んやりさせることは大層労働力を意識させるものであり、画像によっては価値あ
るほどに十分なスペースを節減できないことになりかねない。

【０００６】ジョイント・ピクチャ・専門家集団（ＪＰＥＧ）は新しい画像圧縮規格、ＪＰ
ＥＧ２０００について作業を進めており、これはまた画像内で関心のある特定領
域を画像のその余の部分よりも高品質で圧縮できるようにしている。しかしなが
ら、関心のある領域の自動識別、同定は依然として問題となっている。

【０００７】

【課題を解決するための手段】

この発明によると、目視上注目される領域を識別するために、目視可能な画像
を処理する方法が提供されていて、この方法は、各ピクセルが値を有しているピ
クセルのアレイとして画像を記憶する段階と、該アレイから試験ピクセルを選択
する段階と、各試験ピクセルについて、該試験ピクセルの近隣にあるいくつかの
近隣シーケンスのピクセルを選択する段階と、該アレイから比較ピクセルを選択
する段階と、選ばれた近隣シーケンスのピクセルが該試験ピクセルに対してもっ
ているのと同じそれぞれの位置関係を、該比較ピクセルに対して、もっていると
して選ばれた比較ピクセルの近隣にあるピクセルのシーケンスを識別する段階と
、該選ばれた近隣シーケンスの値を、該識別されたシーケンスの値と、所定の整
合規準に従り比較する段階と、各試験ピクセルについての目視上注目される測度
を、比較結果が不整合となった相手である試験ピクセルについて行なわれた比較
の回数に依存して生成する段階とを備えた方法である。

【０００８】この方法はまた画像のシーケンスにも適用できる。

【０００９】好ましい構成では、各比較ピクセルについて、試験ピクセルに隣接している選
ばれたピクセルのいくつかが、比較ピクセルに隣接している対応するピクセルと
実質的には類似していない強度値を有しているとすると、異常値（anomaly valu
e）がインクレメントされ、別の比較ピクセルを用いて同じ試験ピクセルとの比
較が繰返されて、比較ピクセルが選ばれるまで続き、選ばれた比較ピクセルにつ
いては、すべての選ばれたピクセルが試験ピクセルの近隣にある対応するピクセ
ルと実質的に類似している強度値をもつものとなり、この場合、別の近隣のシー
ケンスが選ばれて処理が繰返される。

【００１０】前に大きな異常値を発生したことがある近隣ピクセルシーケンスが後の試験ピ
クセルの解析用に選ばれるとするとこの処理は最も効率的に動作することが見付
かっている。そこで好ましいのは、処理が大きな異常値が生成された対象となっ
ている近隣シーケンスパターンを記憶する段階と、後の試験ピクセルについて、
後の試験ピクセルとのそれぞれの位置関係として該記憶された近隣シーケンスと
同じ位置関係をもつ近隣シーケンスを選ぶ段階とを含むことである。

【００１１】この発明の別な特徴によると、目視可能な画像もしくはこの種の画像のシーケ
ンスを目視上注目される領域を位置決めするために処理する装置が提供されてい
て、この装置は、各ピクセルが値を有しているピクセルのアレイとして画像を記
憶する手段と、該アレイから試験ピクセルを選択する手段と、該試験ピクセルの
近隣にあるピクセルについての近隣シーケンスを選択する手段と、該アレイから
比較ピクセルを選択する手段と、選ばれたピクセルについての近隣シーケンスが
該試験ピクセルに対してもっているのと同じそれぞれの位置関係を、該比較ピク
セルに対してもっているとして選ばれた比較ピクセルの近隣にあるピクセルのシ
ーケンスを識別する手段と、該選ばれた近隣シーケンスの値を、該識別されたシ
ーケンスの値と、所定の整合規準に従り比較する手段と、各試験ピクセルについ
ての目視上注目される測定を、不整合シーケンスと識別する比較数に依存して、
生成する手段とを備えた装置である。

【００１２】この装置は、適切にプログラムされた、汎用計算機として実施されているのが
よい。

【００１３】この発明はまたこの発明の方法を実行するためにプログラムされた計算機と、
ディジタル計算機の内部メモリ内に直接ロードできる計算機プログラム製品にま
で展開され、そこにはソフトウェアコード部分があって、上記で特定した段階を
実行するのにあてられる。

【００１４】また別な特徴によると、この発明は次のものを用意している。すなわち、計算
機で使用可能な媒体上に記憶された計算機プログラム製品であって、計算機をし
て各ピクセルが値を有しているピクセルのアレイとして画像を記憶するようにさ
せる計算機が読取り可能なプログラム手段と、該計算機をして該アレイから試験
ピクセルを選ぶようにさせる計算機が読取り可能なプログラム手段と、該計算機
をして、各試験ピクセルについて、該試験ピクセルの近隣にあるピクセルについ
ての近隣シーケンスを選ぶようにさせる計算機が読取り可能なプログラム手段と
、計算機をして該アレイから比較ピクセルを選ぶようにさせる計算機が読取り可
能なプログラム手段と、計算機をして、該試験ピクセルに対してピクセルについ
ての選ばれた近隣シーケンスと同じそれぞれの位置関係を比較ピクセルに対して
もっている、選ばれた比較ピクセルの近隣にある該ピクセルについてのシーケン
スを識別させる計算機が読取り可能なプログラム手段と、計算機をして、該選ば
れた近隣シーケンスの値を該識別されたシーケンスと所定の整合規準に従り比較
させる計算機が読取り可能なプログラム手段と、計算機をして各試験ピクセルに
ついての目視上注意される測度を、該比較で不整合となった比較の数に依存して
、生成させる計算機が読取り可能なプログラム手段とを備えた計算機プログラム
製品である。

【００１５】この発明は目視可能なシーン内部の重要な主体を識別、同定（アイデンティフ
ァイ）するために使用できるものであり、一番大きな異常値を有するピクセルを
含んでいる領域を識別することによっている。目視可能なシーンの中の所与のオ
ブジェクトに与えられているビジュアル・アテンション（目視上注目されるとこ
ろ）についての測度（あるいは尺度、メジャー）を判断するために使用されても
よく、ここではそのシーンの他の部分について生成された異常値をそのオブジェ
クトを表わしているピクセルについて生成された異常値と比較することにより測
度が決められる。

【００１６】この処理（プロセス）が繰返されるという性質をもっていることが並列処理に
手助けをしていて、いくつかの試験ピクセルが互に並列に処理されること、また
各試験ピクセルについて、近隣ピクセルのいくつかのシーケンスが並列に処理さ
れてもよいことに注目されたい。

【００１７】シーンについての他の類似の要素間での強度についての小さな変動を許すよう
にするために、値の比較は値についての小さな差異は二つのピクセルが整合と考
えられるようにできることが好ましく、また“実質的に類似している（同じもの
）（substantially similar）”と上述したのはこの意味であると理解されるべ
きことである。このしきい値差についての値は異なるサイクルで変えることがで
き、これらの値は記憶されて処理の後のサイクルで再使用される要素間で適切な
差別（違い）を作っている。

【００１８】カラー画像については、強度値は三要素（赤，緑，青；ＲＧＢ）ベクトルであ
ってよい。代って他の色空間である色相（hue）、飽和（saturation）、ルミナ
ンス（luminance）などが使用されてもよい。

【００１９】この発明はシーン内の近隣間での類似度（similarity）を見付ける際の困難さ
を測定することによって目視可能なシーン内での顕著性（saliency；突出度）を
識別、同定する。ある領域のピクセルは、その領域がシーンの他のかなりの部分
と類似していれば目視上注目されることでは低い測度の得点とすることになる。
これに対して、画像の他の部分とは数多くの非類似をもつ領域は、得点される異
常値が大きくなるので、目視上注目されることでは高い測定を誘引することにな
る。

【００２０】この発明は試行錯誤処理を使用して画像の部分間での非類似を見出すようにし
、かつ顕著性を判断するために異常の性質についての前もっての知識を必要とし
ていない。この方法はピクセル間での処理の依存性を使用することを避けていて
、各ピクセルについて直截的な並列実施を可能にしている。

【００２１】

【発明の実施の形態】

添付の図面を参照して、例をあげて、好ましい実施例を記述して行く。

【００２２】図４に示した部品は、スキャナ（走査器）のような入力手段４１と、中央処理
装置（ＣＰＵ）４２と、ビデオディスプレイユニット（ＶＤＵ）とかプリンタの
ような出力ユニット４３と、メモリ４４と、計算処理装置（計算プロセッサ）４
５とを備えている。メモリ（記憶装置）にはメモリ（ストア）４４０，４４４〜
４４６と、レジスタ４４１，４４７〜４４９と、カウンタ４４２，４４３とが含
まれている。データとプログラムで計算機を制御するためのものがメモリ４４内
に記憶される。ＣＰＵ４２はこの情報を用いて計算機の機能を制御する。

【００２３】ここで図１と４とを考察すると、解析対象の画像４０は入力手段によってアク
セスされて、画像メモリ４４０内にディジタル形式で記憶され、記憶はピクセル
ｘのアレイＡとして行なわれ、ここで各ピクセルは色（カラー）強度（ｒ_ｘ，ｇ _ｘ，ｂ_ｘ）としてピクセルの属性となっているものを有していて、グレイレベル
画像の場合には単一のグレイスケール強度値ｔ_ｘを有することになる。

【００２４】ピクセルｘはそこでアレイＡから選ばれて（段階１）、その強度値（ｒ_ｘ，ｇ _ｘ，ｂ_ｘ）もしくはｔ_ｘが試験ピクセルレジスタ４４１内に記憶される。いくつ
かの試験ピクセルが並列に処理されてよいが、例示の目的では一つだけがここで
は考察されることになる。

【００２５】異常カウントｃ_ｘは異常カウンタ４４２に記憶されていて、ピクセル比較Ｉ_ｘの数のカウント（計数値）は比較カウンタ４４３内に記憶されていて、その両方
がゼロに設定される（段階２）。

【００２６】サーチ戦略（ストラテジィ）が次にＣＰＵ４２により選ばれて（段階３，４，
５）、近隣グループ定義メモリ４４４に送られる。各サーチ戦略は一組の色差し
きい値（Δｒ_ｘ，Δｇ_ｘ,Δｂ_ｘ）（あるいはグレイレベルの場合には単一のし
きい値Δｔ_ｘ）（段階３）と近隣グループ定義（段階４，５）とを備えている。

【００２７】色相、飽和、値（ＨＳＶ）空間内でカラー画像に作用するこの発明の別な実施
例では、Δｈ_ｘ，Δｓ_ｘ，Δｖ_ｘ色差しきい値が使用されており、これについて
はもう少し詳しく後で述べる。カラー画像についてこの発明の実施例で使用され
るしきい値は、ピクセル間の比較が実行されるカラー空間に依存することになる
。

【００２８】この発明の別の実施例では色差しきい値は前もって決められていて、新しい近
隣グループ定義戦略の選定毎に変わることはない。

【００２９】最初にサーチ戦略がＣＰＵ４２によってランダムに生成されることになり、も
しその戦略が差を識別するのに不適当であるとすると、そのサイクルは排斥され
（段階９以降）、新しい戦略が選ばれる。成功する戦略はサーチ戦略メモリ４４
５内に後続の再使用のために記憶されるようにできる（段階１１）。

【００３０】段階３で選んだ色差しきい値は二つのピクセルが類似していると考えられるべ
きかどうかを決める。この差しきい値はある最小値を越えていなければならず、
そうでないと類似が何も見付からないことになるのであるが、そうかといって大
きすぎると、多すぎるくらいの類似が見付かることになる。

【００３１】近隣グループを定義するために、半径ｕ_ｘがある境界内でランダムに選ばれる
（段階４）。この値はｘの近隣の拡がり（範囲）を決めており、この中ではピク
セル類似比較が計算プロセッサ４５により行なわれる。ｕ_ｘ上の境界は目視上の
注目を設定する特徴（フィーチャ）のスケール（寸法）によって決められ、この
スケールは画像が解析される目的に依存することになる。差しきい値のように、
選定はこういった限界の内部ではランダムであり、区別を与えることに失敗する
選定は排斥される（段階９）。

【００３２】試験ピクセルｘの近隣の中の中でｎ個のピクセルｘ_ｊのシーケンスが画像メモ
リ４４０から選ばれる（段階５）。ここでもまた、選定はランダムであり、選定
は次による。

【００３３】 dist（ｘ_ｊ，ｘ_(ｊ−１）＜ｕ_ｘここでｊ＝１，…，ｎであり、またｘ₀＝ｘである。

【００３４】選定がランダムであるから、このようなピクセルのシーケンスは必ずしも互に
近隣にある必要はないし、いかなる意味でも連続しているということにならない
。

【００３５】このようなシーケンスの例が図２に示されていて、ここでは試験ピクセル（箱
で示す）はそれと関係しているシーケンス（陰影はつけていない）を有している
。一般にｎ＝３で、ｕ_ｘ＝１である。ある場合には、ｕ_ｘはｊとともに変る。こ
れはピクセルが広い領域から選ばれるようにしながら、選ばれたピクセルのいく
つかが試験ピクセルｘ_ｊに近くにあることを確かにしている。dist（ｘ_ｊ，ｘ₍
_ｊ−１)）の値は何でもよい適当な単位で定義でき、例えばピクセルの寸法でよ
い。近隣シーケンスの定義は近隣グループ定義メモリ４４４内に記憶される。

【００３６】この発明の他の実施例では、ｎ個のピクセルｘ_ｊのシーケンスで試験ピクセル
ｘの近隣にあるものが画像メモリ４４０から選ばれ（段階５）、選定は次による
。

【００３７】 dist（ｘ_０，ｘ_ｊ）＜ｕ_ｘここでｊ＝１，…，ｎであり、またｘ_０＝ｘである。

【００３８】前に生成されたサーチ戦略は、ＣＰＵ４２によって先取り選択されてよい。こ
れらのサーチ戦略は、（１）近隣ピクセルシーケンス定義ｘ_ｊと、（２）関係す
る色差しきい値（Δｒ_ｘ，Δｇ_ｘ，Δｂ_ｘ）であって、サーチ戦略メモリ４４５
内に記憶されている。この記憶は、後に論じられる段階１１での、先行する試験
ピクセルについての大きな異常に関する得点を得るという結果として行われる。
この戦略はランダムに生成された候補をプロセッサ４２が現在の近隣グルーム定
義メモリに向けて、条件が満足されるときに供給される。この条件は、このよう
な記憶された規準（すなわち、戦略）が使い尽くされることとなっている。

【００３９】同じように、たくさんの類似の画像を処理するときには、（例えば動いている
画像の中とか、医学的な微量の試料を塗った顕微鏡用検顕板（smear）の試験の
ような類似画像の大量組の処理では）、先行する試験について大きな異常得点を
得ている試験シーケンスがサーチ戦略メモリ４４５から検索読出し（レトリーブ
）されてよい。

【００４０】ピクセルｙはランダムに選ばれて（段階６）、現在の比較ピクセルとなるよう
にされ（これは図２の箱で示されている）このアイデンテティ（識別子ＩＤ）が
比較ピクセルレジスタ４４７内に記憶される。

【００４１】比較カウンタ４４３に記憶されているＩ_ｘの値はインクレメントされる（段階
７）。近隣グループ定義レジスタ４４４のコンテンツ（内容）はそこで計算プロ
セッサ４５により使用されて、試験グループｘ_ｊを形成する一組のピクセル（レ
ジスタ４４８）と、比較グループｙ_ｊを形成する一組のピクセル（レジスタ４４
９）とを定義し、比較グループの各ピクセルｙ_ｊは、試験ピクセルｘに対して試
験グループ内の対応するピクセルｘ_ｊがもっているのと同じ位置関係を比較ピク
セルｙに対して持つことになる（段階９）。計算プロセッサ４５はそこで各ピク
セルｘ_ｊ（図２で陰影のあるもの）を対応するピクセルｙ_ｊ（これも陰影がある
）と比較し、この比較には近隣グループ定義メモリ４４４から検索読取られたし
きい値が用いられる。ピクセルｙは試験ピクセルｘと類似しているとして識別されるが、その条件は、
｜ｒ_ｙ−ｒ_ｘ｜＜Δｒ_ｘ，｜ｇ_ｙ−ｇ_ｘ｜＜Δｇ_ｘ，及び｜ｂ_ｙ−ｂ_ｘ｜＜Δｂ _ｘである。すべてのグレイレベル画像については｜ｔ_ｙ−ｔ_ｘ｜＜Δｔ_ｘである。別の実施例では、計算がＨＳＶ色空間（カラースペース）で実行され、ピクセル
ｙは試験ピクセルｘと類似しているとして識別され、その条件は、｜ｖ_ｙ−ｖ_ｘ｜＜Δｖ_ｘ，｜ｓ_ｙ−ｓ_ｘ｜＜Δｓ_ｘ，及び｜ｈ_ｙ−ｈ_ｘ｜＜Δｈ _ｘであり、ここでΔｈ_ｘ＝Ｚ^＊（２−ｖ_ｘ）^＊（２−ｓ_ｘ）である。Ｚはｈ_ｘに
依存しているしきい値の経験的テーブル内に記憶されている。これがｖ_ｘとｓ_ｘとの小さい値に対してΔｈ_ｘが大きくなるという結果をもたらしている。二値画
像についてこの発明の方法の動作を加速するために、比較ピクセルｙは試験ピク
セルｘと整合するように選ばれてよい（すなわち、“白”とか“黒”とかである
背景ピクセルを無視することである）。

【００４２】カラーもしくはグレイレベル画像については、動作速度は比較ピクセルメモリ
４４６内に記憶されるようにしてよい比較グループから比較ピクセルｙを選ぶこ
とによって増大されるようにできる。比較グループは図１２に示したように選ぶ
ことができる。目視上注目されるところの測度が比較グループ内のピクセルの全
てについて生成されると、新しい比較グループが、ピクセルは一番大きな目視上
注目されるところの測度を生成しているピクセルの近くにある、ピクセル（複数
）から選ばれてよい。

【００４３】試験グループ内のピクセルのすべてが比較グループ内の対応するピクセルｙ_ｊと類似であるとすると、処理は新しい比較規準を選び（段階４，５）、また新し
い比較ピクセルｙを選ぶ（段階６）によって繰返される。もし（図２に示したよ
うに）試験グループ内でいくつかのピクセルｘ_ｊが上述の類似性定義に従り、比
較グループ内でのカウントｃ_ｘで異常カウントレジスタ４４２に記憶されている
ものがインクレメントされる（段階１０）。別の比較ピクセルｙがランダムに選
ばれて、比較ピクセルレジスタ４４７内に記憶され（段階６に戻る）、近隣グル
ープ定義メモリ４４４から検索された近隣グループ定義が使用され、新しい比較
近隣グループを比較グループレジスタ４４９に向けて供給して、試験グループレ
ジスタ４４８内に記憶された試験グループとの比較にあてられる。一組のピクセ
ルｘ_ｊが試験グループレジスタ４４８内に保存されていて、その期間は画像の他
の部分との整合に失敗するまで続く。このような組はｘの在る場所（locality）
についての区別できる顕著な特徴を表わしていて、整合の失敗が起れば起るほど
顕著性があることになる。もっと多くの比較ピクセルｙが試験ピクセルｘとの整
合に失敗するとなると、異常カウンタ４４２内に記憶されている異常値ｃ_ｘがも
っと大きくなる。逆に、試験ピクセルｘがより多くの整合を生じさせると、しき
い値Ｌが比較カウンタ４４３によって到達されるときには異常値についての値が
より低いものとなる。エル（ｌ）回の比較がされる度毎に、この処理によりもた
らされる結果の異常値ｃ_ｘは、試験ピクセルｘについて整合がとれなかったラン
ダムに選ばれたピクセルの割合の測度であると考えられてよい。

【００４４】処理が継続するにつれて、成功するサーチ規準が次第に明らかになる。このサ
ーチ規準は言い換えるとΔｒ_ｘ，Δｇ_ｘ，Δｂ_ｘとｕ_ｘの値と、近隣シーケンス
の組合せであって、大きなｃ_ｘの値を生成するものである。もし、ｎ個のピクセ
ルｘ_ｊのシーケンスと、対応する色差しきい値（Δｒ_ｘ，Δｇ_ｘ，Δｂ_ｘ）が異
常カウンタ４４２内に記憶されたｃ_ｘの異常値をして、整合が見付かる前に、し
きい値Ｍと到達するようにさせるものであるとすると、近隣グループ定義メモリ
４４４内に記憶されたサーチ戦略はサーチ戦略メモリ４４５にコピィされて（段
階１１）将来の使用にあてられるが、これはすでに記憶されていないことを条件
とする。大きな異常値を生成した規準はこうしてサーチ戦略メモリ４４５で利用
可能であり、別なサイクルでの適当な値を選択するために使用される（段落４，
５）。一旦、整合が見付かると、処理が再開され、新しいサーチ戦略（色差しき
い値及び近隣の組）で近隣グループ定義メモリ４４４に記憶されているものが使
用される（段階９）。ここではサーチ戦略メモリ４４５からの検索か、ランダム
生成されたものかのいずかが使用される。

【００４５】反復値Ｉ_ｘで比較カウンタ４４３内に記憶されているものがしきい値Ｌに到達
するときには、反復処理は停止し（段階８）、現在の異常値ｃ_ｘであって異常カ
ウンタ４４２内に記憶されているものが出力ユニット４３でピクセルｘについて
の異常値として出力される。最終の異常値ｃ_ｘは試験ピクセルｘについての目視
上注目される測度であり、これは全体でＬ回の試行となるうちの試行の数であっ
て、この数はランダムに選ばれたピクセルｙについての対応している近隣との整
合に失敗したピクセルｘのランダムに選ばれた近隣の本来の特性（すなわちカラ
ー）についての試行数である。ｃ_ｘについての大きな値はピクセルｘがその画像
のその余の部分と不整合の程度が大きいことを示しており、その結果、ピクセル
ｘが目視上注目に値するオブジェクトの一部であることを示している。

【００４６】出力ユニット４３は一般に記憶媒体であり、この媒体はプリンタとか、目視可
能な表示ユニットなどによる表示用にあるいは後続の処理のために各ピクセルの
異常値を記憶するのであって、例えば、後の処理は画像圧縮であって、これは後
で図５〜１１を参照して記述することにする。

【００４７】この発明は三つの値（Ｒ，Ｇ，Ｂ／Ｈ，Ｓ，Ｖ）あるいは単一の値（グレイレ
ベル）をもつポイント（点）の二次元画像を参照して記述されてきたのであるが
、この方法はｐの値をもつポイントを有するｎ次元画像にも拡張できることは理
解できよう。

【００４８】ｐの値があるポイントを使用する場合には二つのピクセルが類似しているかど
うかを、上述の段階９でグレイレベル、ＲＧＢ及びＨＳＶ画像についてした評価
のための機能はｐの値についての比較に拡張されることになる。

【００４９】ｎ次元画像の場合には近隣ピクセルの選択はｎ次元距離測度を用いて行なわれ
、段階５で近隣グループを選ぶようにする。このようにして、この発明の方法を
ビデオシーケンス内の継続するフレームのシーケンスに対して応用することがで
き、この例では使用される次元の一つが時間となっている。

【００５０】この発明の二つの単純化した例で使用されているものについて記述することに
する。図２ａはモノクローム画像であり、いくつかの垂直方向特徴と一個の対角
特徴を有しているものを示す。図２ａから見とれることは、垂直方向特徴の一つ
からのあるピクセルについての近隣の組を形成しているピクセルのグループが他
の垂直方向の特徴からの近隣のピクセルのグループと整合することになるという
ことである。しかしながら、対角特徴のピクセル形成部分は他の特徴からのピク
セルと整合がとれそうもない。対角特徴内での別のピクセルについても、試験ピ
クセルか比較ピクセルのいずれかの近隣ピクセルがこの特徴の端を越えて延びて
いるとすると整合をとるのに失敗することになる。そこで、いずれかの近隣組に
ついて整合を得る確率は、垂直特徴の一つについての形成部分と比較すると、対
角特徴のピクセル形成部分については極めて僅かなものになる。

【００５１】例示の実施形態では、ピクセルは規則的な直線で囲まれた図形による埋めつく
し（regular rectilinear tessellation）を形成しているが、この処理はピクセ
ルの他の構成についても適切とされる。もしアレイが不規則であると各ピクセル
ｙ_ｊの比較ピクセルｙに対する位置関係は、各ピクセルｘ_ｊの試験ピクセルｘに
対する位置関係と正確に同じでなくてよいが、それぞれはできる限り正確に対応
している位置に密接するようにする。

【００５２】この処理には他のプロセスよりも好都合ないくつかの点がある。第一に、この
処理は画像のコンテンツについて何の仮定も置いておらず、測定処理の一部とし
てコンテンツに関係する有用な特徴を抽出できて、これによりどんな画像中の素
材（マテリアル）にも適応することができる。第二に、このプロセスはどんなピ
クセルの構成にも等しく応用されることであり、ピクセルが矩形のアレイに並べ
られていても、ら線状のアレイでも、あるいは不規則パターンであってもよい。
第三に、この処理は各ピクセルｘ_iに応用できることであり、この際には他のピ
クセルと関係している計算に何ら依存しないので、それにより数多くのピクセル
に同時に並列に適用してよい。これが意味するところは、並列実施では、結果が
ビデオ素材から実時間すなわちずっと高速で得られることである。第四に、この
アルゴリズムは進化したプロセスに基づいているので、このプロセスでは試行が
規則上厳格な励行を求められる（rigor）正規に許されているソフトウェアプロ
セスで用意されなければならないということがないという好都合さがある。若干
のサイクルは有用な結果を作り出さないことがあり、例えば結果に明らかな冗長
さが含まれていることが理由となっている（例をあげると、同じピクセルを一度
ならず含んでいる近隣ピクセルｘ_ｊのシーケンスがある）。このようなサイクル
は顕著な特徴を識別とそこなった他のサイクルと同じように排斥され、その際に
はこのようなシーケンスを識別することが必要とされている特種排斥プロセスを
用いなくてよい。これが試行について顕著な候補を正確に構築するために求めら
れる計算処理上の負荷を取除いている。

【００５３】以下の簡単化した例では、この処理が黒白画像に応用され、しかもこの画像が
完全に１と０との画像である。この場合にはΔｔ_i＝１／２，ｎ＝３，Ｌ＝１０
０，またｕ_ｊ＝１である。第一の例（図２ａ，２ｂ）は“ポップアウト（popout
）”（注：見たときに、とくに目立つ形のこと）についての古典的な問題をあげ
ていて、この問題では形状についてのある種の形式が異なる形状で囲まれている
ときに登場する。

【００５４】図２ａの各ピクセルに属している目視上注目される測度は図２ｂのチャートに
示されている。たて軸は異常値（試行数Ｌの百分率としてある）を各ピクセルに
ついて示している。異常値ｃ_iは垂直方向バーについてよりも対角バーについて
非常に高いものとなっている。

【００５５】図３ａは目視上注目されるところでのクラスタ化の効果を示すもので、ここで
は垂直方向線のグループ形成がもっと広幅に分離されている他部の中に置かれて
いる。この発明の処理を用いる結果が図３ｂに示されている。ここでもまたクラ
スタ化したラインがより大きな異常得点を得ている。

【００５６】この処理は予備的な前もっての知識をサーチされる異常についての性質につい
て求めていない。異常は方向であってよいし（図２のような場合）、間隔であっ
てよいし（図３ａのような場合）、形状、長さ、色、もしくは他の特性であって
よい。

【００５７】この発明は多数の分野で広範囲の応用をもつものである。第一に、目視可能な
シーンの中での重要な主体の識別は、フィルタをかけていない目視可能なコンテ
ンツの分類における第一の本質的な段階である。このことはまた最もむづかしい
ものでもある。一度この段階が達成されると、手操作によるタグ付けが続き、あ
るいはいろいろな範囲のテンプレートマッチングとか他の自動化技術であって、
このように識別された特徴の認識にあてられるものとかが続く。

【００５８】この発明の方法を用いる画像圧縮の方法を図５ないし１１を参照して記述して
行くことにするが、最初はこの発明による画像データの圧縮方法の概観を図５ａ
，５ｂを参照して用意することとする。

【００５９】離散的余弦変換（Discrete Cosine Transform）を用いる画像の圧縮は既知で
ある。数多くの画像圧縮アルゴリズムは、ＪＰＥＧがその例であるが、このよう
な圧縮を使用し、またよく動作することが証明済みである。ＤＣＴを用いる原理
は、画像内のピクセルが二次元信号として取扱えるということであり、これがＤ
ＣＴによって周波数ドメインに変換される。色と輝度に変化がほとんどない画像
内の領域は、低い空間周波数をもつ領域であり、これに対して、色と輝度とに大
きな変化をもつ領域は高い空間周波数をもつ領域である。研究により示されたと
ころは、人間の眼は高い空間周波数に対しては非常に敏感であるというのではな
いことと、この事実が圧縮に使えるということであった。さらにもっと重要なこ
とは低い空間周波数についての情報をもつことであり、それによって高い空間周
波数はもとの画像を合理的な妥当な品質で回復するために伝送されたり記憶され
たりする必要がないということである。高圧縮率（レート）については空間周波
数に対する人間の感度のモデルが使用され、これがある周波数についてのフィル
タとして取扱うことができる。

【００６０】標準的な圧縮アルゴリズムは関心のある領域が画像内で自動的に特定できて、
それにより、その領域が背景よりも高品質で圧縮できるということを許さないの
で圧縮は最適とはならない。もしある画像がｎバイトの寸法をもつことを求めら
れるとすると、全体の画像が求められたファイル寸法に適するように同じ品質で
圧縮されなければならないが、これがときによっては品質が非常に貧弱で不満足
なものであることを意味しかねない。画像の中にはいつもある部分があって、そ
こが他よりもっと関心のあるところとなっていて、またそうではなく僅かな関心
しかない部分もある。通常は人物に関心があり、背景には関心がない。したがっ
て、背景を非常に高い圧縮率で（低品質で）、また画像のその余の部分を非常に
低い圧縮率（高品質）で圧縮するのが好都合ということになる。もし平均の圧縮
率が一定の圧縮率で圧縮された画像についてと同じであるとすると、結果として
のファイルサイズは同じことになる。しかし、可変圧縮率で圧縮した画像は、看
者に対して、この画像の方が全体の画像について一定の圧縮率で圧縮したものよ
りも、よい印象を与えることになる。

【００６１】この発明の方法は、ユーザがある画像を圧縮するのに、その画像の異なる部分
について異なる品質レベルを用いてすることができるようにしている。品質のレ
ベルはビジュアル・アテンション・マップ（ＶＡ−マップ）３０を用いて画像内
のある領域について判断される。このマップは簡単に作れる。圧縮後にはＶＡ−
マップ３０は圧縮された画像データの一部を形成することになる。

【００６２】入力画像はＲＧＢ画像であり、言い換えると、そのピクセルは三原色Ｒ，Ｇ，
Ｂ（赤緑青）の和として表わされる。この三原色の各々が０〜２５５の間の整数
とにより表わされる。もともモノクローム画像も等しく使用されてよい。

【００６３】入力画像はＹＣｂＣｒカラー空間に変換され、同時に成分であるルミナンス（
Ｙ）とクロミナンス（ＣｂとＣｒ）とに分解される。人間の眼はカラー（色）の
変化よりも輝度（ブライトネス）の変化により敏感であるから、二色成分Ｃｂ，
Ｃｒが４：１：１ダウンサンプリング機構を用いてダウンサンプルされる。

【００６４】次にこれらの成分が８×８ピクセルブロック３２に区分され、各ブロックは圧
縮アルゴリズムにより個別に取扱いがされる。すべての成分（Ｙ，Ｃｂ，Ｃｒ）
について各方向のサンプルの数が８の倍数でなければならず、それで後の処理の
ための完全なピクセルブロックが用意される。入力画像がこの要件に適っていな
いとすると、追加のサンプルが人為的に作り出されてブロック内の空になってい
るピクセル空間内に充填される。ダウンサンプリングが理由となって、ｘ方向と
ｙ方向とのブロックの数はＹ成分について２の倍数でなければならず、このこと
は後に説明する。

【００６５】あるブロックが周波数ドメインにＦＤＣＴ（フォワードＤＣＴ）１４により変
換される。結果の係数はそこで量子化器１６によって量子化される。量子化はデ
ータの低減に通じ、画像圧縮に対する鍵（キー）となっている。量子化後となる
と、画像は誤差（エラー）なしには再構築することができない。しかし量子化テ
ーブル１８を用いることによって、このテーブルが人間の空間周波数に対する感
度を実現するものとなっていて、エラーは認知することができない程小さいもの
とすることができる。量子化のレベルは量子化係数２０により影響を受けていて
、この係数２０が使用された、その画像についてのＶＡマップ３０により可変品
質レベルを作るようにしている。

【００６６】量子化の後に、各ブロックはジグザグスキャナ２２により６４次元ベクトルに
変換される。これが低い空間周波数についての係数をベクトルの始め（低インデ
ックス）に置き、また高い空間周波数についての係数を終り（高インデックス）
に置く。高周波数についての係数は量子化の結果としてゼロとなるから、ゼロの
長いシーケンスがジグザグスキャニングプロセスによって作られる。ジグザグベ
クトルはそこでランレングスエンコーダ２４でエンコードされて、その結果が二
つのアレイ、すなわちランレングスアレイ２６とレベルアレイ２８の中に記憶さ
れる。最後に、すべてのブロックが処理されてしまうと、こういった二つのアレ
イがエントロピィコーダ５０によってエントロピーコーデングされ、結果のバイ
トアレイ５２が出力ファイルにＶＡ−マップ３０と画像についての一般情報と一
緒に出力ファイルに書込まれる。ファイルフォーマットについては後述する。

【００６７】画像のデコード（解圧縮）をここで図６ａ，６ｂを参照して記述することとし
、それからコーダとエンコーダとの個々の部分の機能について図７ない１１を参
照して記述する。

【００６８】画像データのデコードと画像の再構成とは上述のコーデング処理の逆となって
いる。バイトアレイ５２内の画像データはまずエントロピィデコードがエントロ
ピーデコーダ６０によつて行なわれ、結果が単一の８×８ブロックについてのア
レイに区分される。単一のブロック２６，２８についてのアレイは次にランレン
グスデコーダ６２によりランレングスデコードされ逆ジグザグスキャナ６４を用
いて８×８サンプルマトリックスとして記録されて、解量子化器（デクオンタイ
ザ）６６により量子化が解かれ、その際には適切な量子化テーブル１８がＶＡ−
マップ３０から得られた情報と一緒に用いられている。次にデータが周波数ドメ
インから成分サンプル値に戻る変換にかけられ、ここでは逆ＤＣＴ６７が使用さ
れ、結果が各成分について異なるアレイ内に記憶される。最期に、三つの成分ア
レイが使用されて最終画像が編成される。ＣｂとＣｒとの成分は線形補間フィル
タ６８，６９を用いてアップサンプルされる。結果として得られた画像はもとの
画像よりも大きくなりそうであり、その理由としてブロックパッデング（block
padding）があげられ、また画像はもとのサイズにクロップ（crop，トリミング
）されなければならない。

【００６９】もとのＲＧＢ画像から８×８ピクセルブロック３２（図５，６）を形成するこ
とについて、図７と８を参照してより詳細に記述して行く。

【００７０】ＲＧＢ値からＹ，Ｃｂ，Ｃｒ値への変換は次の式で与えられる。

【００７１】Ｙ＝rnd（0.299・Ｒ＋0.587・Ｇ＋0.114・Ｂ）Ｃｂ＝「−0.1687・Ｒ−0.3313・Ｇ＋0.5・Ｂ＋128」Ｃｒ＝「0.5・Ｒ−0.4187・Ｇ−0.0813・Ｂ＋128」ここでＲ，Ｇ，Ｂは［０，２５５］の範囲内にあり、Ｙ，Ｃｂ，Ｃｒもまた［０
，２５５］の範囲内にある。Ｒ，Ｇ，ＢとＹ，Ｃｂ，Ｃｒとは整数である。

【００７２】ＣｂとＣｒ成分は４：１：１ダウンサンプラ機構を用いてダウンサンプルされ
る。ｘとｙとの方向で毎第二のピクセルについて、三成分のすべてが記憶される
。他のピクセルについてはＹ成分だけが記憶される。これが意味するのは毎四つ
のＹサンプルについて一つのＣｂサンプルと一つのＣｒサンプルとがあることで
ある。このダウンサンプリングが模式的に図７に示されている。こうしてＣｂと
ＣｒとのアレイがＹアレイの大きさのちょうど１／４となる。これができるのは
人間の眼がカラー（Ｃｂ，Ｃｒ）よりも輝度（Ｙ）での変化にずっと敏感である
ことによる。

【００７３】前述しているようにダウンサンプリングはデータ量をファクタ２だけ減らす。
ダウンサンプリングとすべての成分が８×８ピクセルブロックに分けられるとい
う事実とが理由となって、後の処理にとって必要とされるサンプルの数はすべて
の成分についてｘとｙとの方向で８の倍数となる必要がある。

【００７４】図７に示されるように、８×８サンプルのブロックを形成するためには、８×
８入力サンプル（ＲＧＢサンプル）のアレイはＹ成分について必要とされ、また
、１６×１６入力サンプル（ＲＧＢサンプル）のアレイがＣｂとＣｒとの成分に
ついて必要とされる。１６×１６入力サンプルアレイはマクロブロックと呼ばれ
る。空へ成分についての関心のレベルは、マクロブロックを形成している四つの
サンプルブロックのＶＡ−マップ内で定義される関心についての最大レベルとし
て定義される。

【００７５】ｘとｙとの方向の８×８ピクセルブロックの数は［数１］で与えられる。

【００７６】

【数１】

【００７７】これらの式でwidth（幅）は入力画像のｘ方向における入力サンプル（ピクセ
ル）の数であり、またheight（高さ）はｙ方向における入力サンプル（ピクセル
）の数である。サンプルが境界で加えられた後に画像内で必要とされるサンプル
の全数は［数２］によって計算される。

【００７８】

【数２】

【００７９】境界で加えられることになるサンプルの数は［数３］によって計算される。

【数３】

【００８０】ここでwidthは幅をheightは高さをそれぞれ表わす。

【００８１】追加のサンプルは高い空間周波数が何も生成されないように加えられなければ
ならない。これが行なわれるのは、境界サンプルで拡張することによる。このこ
とは簡単に実施され、また水平または垂直の周波数のいずれかがない形で自動的
に作り出せる。しかしながら、その境界における画像のコンテンツに依存して、
一方向における高い周波数は依然として作られてよい。まず、すべての行が境界
における最新のサンプルでパッド（詰めること）され、次に列が後でパッドされ
る。画像からの８×８ピクセルブロックの編成（フォーメーション）が模式的に
図８に示されている。

【００８２】画像の圧縮を解くために、上述のカラー変換の逆が［数４］で定義される。

【００８３】

【数４】

【００８４】逆カラー変換については、Ｒ，Ｇ，Ｂについての結果値は、丸めが理由となっ
て［０，２５５］の有効範囲を越えてもよい。したがって、超過した値はそれぞ
れ最小値及び最大値まで切り詰められる（クランプされる）。

【００８５】離散的余弦変換（ＤＣＴ）がサンプルを周波数ドメインに変換するために使用
される。フォワード離散的余弦変換（ＦＤＣＴ）で変換器１４により使用される
ものが［数５］によって定義される。

【００８６】

【数５】

【００８７】ここで成分サンプルｓ_ｘ,ｙはＦＤＣＴの計算に先立ってＤＣレベルシフトさ
れていて、各サンプルから１２８を原産することによってゼロの周りにそれらの
中心が来るようにしている。

【００８８】この画像の圧縮を解くために逆離散的余弦変換（ＩＤＣＴ）が逆離散的余弦変
換器６７によって使用され、この変換が［数６］で定義される。

【００８９】

【数６】

【００９０】ＤＣレベルシフトを戻すために、１２８が各サンプルｓ_ｘ,ｙにＩＤＣＴの計
算の後で加えられる。

【００９１】量子化器１６は次のように動作する。変換器１６からの６４のＤＣＴ係数の各
々は量子化器１６によって、量子化テーブル１８内に記憶されている値を用いて
量子化される。各係数についての量子化器ステップサイズＳ_ｕ，ｖが量子化テー
ブルからの対応する要素Ｑ_ｕ，ｖに量子化係数を乗算した値から計算される。こ
こで乗数である係数はＶＡ−マップ３０によって定義された品質のレベルを表わ
している。量子化テーブルは人間の眼の空間周波数感度を反映していて、経験的
に求められる。二つの異なる量子化テーブルは一つがルミナンス成分（Ｙ）につ
いてであり、また一つがクロミナンス成分（ＣｂとＣｒ）についてのものである
。一般に、クロミナンス係数の量子化のためのステップサイズはルミナンス係数
のためのものよりも大きく、その理由は、人間の眼がルミナンスの誤差に対して
、クロミナンスの誤差に対するよりも、敏感であることによる。

【００９２】量子化は［数７］により定義される。

【００９３】

【数７】

【００９４】ここで因子ｑ_ｌはＶＡ−マップ１０によって定義される品質レベル因子である
。この発明の実施例ではＶＡ−マップは品質についての四つのレベルをサポート
していて、これが２ビットを用いて記憶されていて、これらのレベルが品質レベ
ル因子を定義する適切な数に写像される。品質についての個々のレベルについて
の品質レベル因子は圧縮された画像ファイル内に記憶される。

【００９５】画像の解圧縮については、逆量子化関数が［数８］により与えられる。

【００９６】

【数８】

【００９７】この発明の実施例では、ルミナンス係数についての量子化テーブルは表１で定
義される。

【００９８】

【表１】

【００９９】また、クロミナンス係数についての量子化テーブルは表２で定義される。

【０１００】

【表２】

【０１０１】量子化の後には、６４の係数は数多くのゼロを含むことになり、とくに高い周
波数係数についてはそれが言える。ゼロの長いシーケンスを作るためには、この
６４の係数は８×８マトリックスから６４次元ベクトルｚに変換されて、図９に
模式的に示すように、ジグザグスキャナ２２によってジグザグシーケンスに再順
序付けされる。

【０１０２】ジグザク走査（スキャニング）から生じたベクトルがゼロの長いシーケンスを
含んでいることから、ランレングスコーデングがデータ量を減らすために使用さ
れる。

【０１０３】このベクトル内の各値は二つの出力値であって、ランレベルコンビネーション
（組合せ）と呼ばれているものにより表わされ、一つは先行するゼロの数を定義
し、一つはゼロのシーケンスの後に続くゼロでない値のレベル（数値）を定義す
る。最後にランレングスエンコードした値に続くすべての値がそのベクトル内で
ゼロであれば、（０，０）である特別のランレングス組合せが使用される。この
特殊組合せはブロックの終り（ＥＯＢ，エンドオブブロック）組合せと呼ばれる
。

【０１０４】ＤＣＴの性質が原因となって、ベクトルの第一の要素は変換された画像データ
のＤＣ係数となっている。このＤＣ係数はＡＣ係数とは違った取扱いを受ける。
エンコードされることになる値は、前のＤＣ項からの現在のＤＣ項の差である。
これがエンコードすべき数をより小さいものとして、これが後続のエントロピー
コーデングにおけるデータ量を減らすのに役立つことになる。ランとレベルとに
ついての二つの値は二つのアレイとしてランレングスエンコーダ２４により出力
される。二つのアレイはランレングスアレイ２６とレベルアレイ２８であって、
これらは８×８ピクセルブロックのすべてが一旦処理されると、エントロピーエ
ンコーダ５０によって使用されて、データ量をさらに減らすようにする。

【０１０５】レベルは［数９］によって計算される。

【０１０６】

【数９】

【０１０７】また解圧縮のために、逆レベルエンコーデングが［数１０］により計算される。

【０１０８】

【数１０】

【０１０９】ランレングスエンコーデングの例は次による。この例ではランレベル組合せは
（ｒ，ｌ）と書かれ、ここでｒはゼロのランレングスであり、またｌはこのゼロ
に続くレベルである。ランレングスエンデングについての入力レベルが、 {-126,26,43,2,2,1,1,0,0,0,1,0,0,-1,-1,0,0,0,0,0,…,0}（全部で６４の値）
であり、また先のＤＣ項−１１９である。ランレングスエンコードしたデータは
そこで次になる。 (0,-7),(0,26),(0,13),(0,2),(0,2),(0,1),(0,1),(3,1),(2,-1),(0,-1),(0,0) 二つの出力ベクトルは次のように見えることになる（グレイ値は前のブロックか
らの値である） {…2,4,0,23,0,0,0,0,0,0,0,0,3,2,0,0，}（ランベクトル）また、 {…-1,1,2,-1,0,-7,26,43,2,2,1,1,1,-1,-1,0}（レベルベクトル）。

【０１１０】ランレングスエンコーデングの後で、ランベクトルとレベルベクトルとは組合
されてエントロピーエンコーダによってエントロピイエンコードされることは図
５ｂで前に示した通りである。これはピクセル当りのビット数を減らす。エント
ロピイエンコーデングは一番頻繁に発生するランレベル組合せについての修正さ
れたHuffman（ハフマン）テーブルによって行なわれる。頻繁に発生する組合せ
を表わすのに使用されるコードについてのビット数が小さくなると、ラン・レベ
ル組合せが発生する頻度は高くなる。画像ファイルサイズを最少に保つために、
固定のテーブルが使用される。このテーブルは試験画像の大きな組から経験的に
得られたものである。ある画像については、ダイナミック（動的）ハフマンコー
ドテーブルがより小さなファイルサイズに導くことができるが、しかし大部分の
場合にはこの発明のこの実施例で使用されるハフマンコートテーブルは一番小さ
なファイルサイズに導くものとなっている。

【０１１１】ランレベル組合せは次のやり方を用いてエンコードされる：エンコードのためにラン・レベル組合せについてハフマンコードテーブル内にエ
ントリィがあるとすると、そのときはこのテーブルからのコードが使用される。
正と負とのレベルをエンコードするために、符号ビットがテーブルから採用され
たコードの先頭に置かれる；・ある種のラン・レベル組合せについてハフマンテーブル内にエントリィがなけ
ればそのときは次の標準コーデングのやり方が使用されなければならない。

【０１１２】標準コーデングは符号ビットを“１”に設定し、続いて二つの可能なエスケー
プ（ＥＳＣ１，ＥＳＣ２マーカ）の一つを設定することによって達成される。次
の６ビットは符号なし二値コードとしてランレングスを表わし、また最後にレベ
ルが続く。このレベルは符号付き二値コードとしてエンコードされることになる
。もし、レベルが［−１２７，１２７］の中にあれば、ＥＳＣ１マーカが使用さ
れて、８ビットを用いてレベルがエンコードされる。もし、レベルが［−２５５
，２５５］の中にあれば、ＥＳＣ２マーカが使用されて、９ビットを用いてレベ
ルがエンコードされる。この段階では、レベルは［−２５５，２５５］をはみ出
すことができず、これが最大９ビットだけでレベルをエンコードするのに十分で
あるという理由となっている。事実上、係数の最大絶対値は２００よりも小さい
ものとなることになる。

【０１１３】最も普通のラン・レベル組合せについては、次の表３〜７で定義されるような
ハフマンコードが使用される。このテーブルはランとレベルとで種分けされてい
て、エンコード用に使用できる。エンコーダはラン・レベル組合せを用いて対応
するハフマンコードを一覧参照（ルックアップ）する。

【０１１４】

【表３】

【０１１５】

【表４】

【０１１６】

【表５】

【０１１７】

【表６】

【０１１８】同じ情報が画像データをデコードするために使用されるる表３〜６はコードレ
ングスによって種分けされている。この表はエントロピーデコーダ６０（図６ｂ
）により使用され、このデコーダ６０は受取ったコードとそのコードレングス（
コード長）とを用いてラン・レベル組合せをルックアップする。

【０１１９】

【表７】

【０１２０】

【表８】

【０１２１】

【表９】

【０１２２】

【表１０】

【０１２３】ハフマンコードの若干のサンプルを表１１に示す。

【０１２４】

【表１１】

【０１２５】この発明のこの実施例で使用される方法により圧縮された画像の全成分は下か
ら上へまた左から右へ（ボトム・アップ・レフト・トウ・ライト）のやり方で処
理される。これが意味することは、ある成分の第一のブロックが入力画像の下左
隅にあり、次のブロックがその右にあるというふうにそのブロックラインの端ま
で進ということであり、次のブロックラインは前のブロックラインの上にあり、
すべてのブロックラインは左で始まるということである。このプロセスは図１０
に示されている。

【０１２６】各ブロックはエントロピーエンコーデングまでは個別に取扱われるのでブロッ
クデータ流（ストリーム）を作ることの異なるやり方がたくさん存在する。すべ
ての画像データを実際に受取る前に画像はデコードされる必要がないのでインタ
ーリーブがされていない構造が選ばれており、その理由はアルゴリズムを単純に
することと、処理時間を短縮することがあげられる。これが意味するところは、
Ｙ成分の全ブロックが先ず処理されて記憶され、それに続いてＣｂ成分について
の全ブロックが、そして最後にＣｒ成分についての全ブロックが処理されて記憶
されることである。進行形のデコード／エンコードがまた可能であり、後に記述
される。結果のデータ流を図１１に示す。

【０１２７】この発明の方法に用いて圧縮された画像はこの実施例では次のようなファイル
フォーマット（ここではVACIMGファイルと呼ぶ）で記憶される。

【０１２８】この発明のこの実施例はビジュアルアテンションマップ（ＶＡ−マップ）を用
いて画像を圧縮し、このマップが関心のある異なるレベルで圧縮すべき画像内の
異なる領域を定義する。四つのレベルがこの実施例で使用されているが、もっと
レベルあっても少いレベルでも望むところにより使用可能である。関心のある各
レベルに対応する領域は各々がそれ自体の圧縮レートで圧縮され、これによって
背景は画像の他の部分よりも高い圧縮率で（かつ低品質で）圧縮できるようにな
る。圧縮された画像はそこでファイル内に記憶され、このファイルも、ＶＡ−マ
ップを含んでいる。高い圧縮率というのがこの発明のこの実施例の目標の一つで
あるから、画像についての情報は必要最小限がファイルに記憶される。画像につ
いての一般的な情報のすべてが先ずファイルに来て、次にＶＡ−マップが続き、
それから圧縮された画像データがファイルに来る。画像についての一般的な情報
はｘ及びｙ方向におけるサンプル数と、四つの可能なレベルのすべてについての
品質のレベルとで構成されている。あるファイルがVACIMGファイルであるかどう
かを応用が検出できるようにするために、ファイルシグネチャが一般的な画像情
報の前部に挿入される。

【０１２９】表１２はVACIMG画像により使用されるファイルフォーマットの概要を与えてい
る。

【０１３０】

【表１２】

【０１３１】すべてのバイトはバイト内の標準のウインドウズビットアラインメントを用いて
ファイルに書込まれる。このファイルは文字“Ｖ”，“Ａ”，“Ｃ”，“Ｉ”，
“Ｍ”及び“Ｇ”を表わしている６バイトで始まる。次にサンプル数、幅と高さ
とが続く。両方とも符号なしの１６ビット整数として記憶される。最高位（最重
要度）バイトが最初に来る。これに四つの品質レベルが続き、これらが符号なし
の８ビット整数として記憶される。次にＶＡ−マップが来て、このマップは関心
のあるレベル（と、したがって、圧縮のレベル）を記憶する。ＶＡ−マップは８
×８ピクセルブロックについて２ビットで表わされている。ｘ及びｙ方向のブロ
ック数は前記の式で与えられ、この式が使用されて、ＶＡ−マップにより使用さ
れるバイト数が次のように計算される。すなわち、ｋ＝ｂｘ_Ｙｂｙ_Ｙ／４最後にすべての圧縮された画像データが続く。圧縮された画像データについて使
用されたバイトの数はデコーダにとっては不知である。デコーダに与えられたす
べてのバイトを使用して画像を再構築しなければならず、ファイルの終りに到達
したときには自動的にデコードを終結させなければならない。

【０１３２】ＶＡ−マップを用いることは、画像について進行形の（プログレッシブ）デコ
ーデングを可能とし、この場合には画像の一番関心のある部分が先ずデコードさ
れる。画像成分のＤＣＴ係数を記憶するために非インターリーブ構造を用いるの
に代って、インターリーブした構造を用いることができ、それによってあるブロ
ックを再構成するためのすべての情報がデータ流の中で一緒に接近するようにす
る。これが受信側にとって受取った画像を完全なファイルを受取る前に、解圧縮
を開始して、組み上げることができるようにする。これはワールドワイドウエブ
（ＷＷＷ）、無線応用プロトコル（ＷＡＰ）電話、あるいはビデオフォンにとっ
てもいえることであるが、こういった技術にとって極めて有用となる。ＪＰＥＧ
はすでに進行形のエンコーデングを提供しているが、ビジュアルアテンション（
目視上注目）に基づいた画像圧縮を用いることから得ることができる利点が存在
する。最も重要とされているブロック（レベル３のブロック）が最初におくられ
るようにでき、それにレベル２のブロック、レベル１のブロックが続き、最後に
背景ブロック（レベル０のブロック）が続く。これが意味することは、受信側が
画像の“メッセージ”をかなり早くに得て、受信者が十分な情報を受取ってしま
うと、データ流を切断することを決意することもできるということである。大部
分の応用では、画像はピクセルの固定シーケンスとして送られていて、例えば左
下隅で始まってライン毎に上方へ画像が走査される。したがって、画像の“メッ
セージ”を得るためには、全体の画像が送られて再構成されるまで待たなければ
ならないことになる。ＶＡ−マップを用いることは、重要なピクセルを先ず送り
、それに続いて次に重要なピクセルをという順序で続くことができ、それによっ
てメッセージを得るのに十分な情報があるところでデータ流を切断することがで
きる。この技術はビデオ流の送りを、狭い帯域幅の網上で、妥当な品質で可能と
している。とくに、ビデオフォンにとっては、この技術は多少の背景情報の損失
を伴うものの低い帯域幅で画像を提供することになる。

【０１３３】もし帯域幅が全体の画像を送るのに狭すぎるときにはデコーダとエンコーダと
がいつでもブロックの送りを停止でき、このときは一番重要なブロックの送信だ
けが行なわれる。受信側で改良された画像を得るためには。全体の画像は背景も
また更新するために毎度しばしば送られねばならない。しかしながら、ほとんど
のときには一番重要なブロックだけを置換すれば十分であり、新しいブロックで
置換えできないときには前の画像の背景ブロックを用いることで足りる。

【０１３４】また自動的にブロックをぼんやりさせることも可能であり、対象となるブロッ
クはＶＡ−マップ内での低いＶＡレベルが原因となって量子化が低いレベルでデ
コードされたものである。これはメモリや帯域幅のオーバーヘッド（計算機負荷
）を伴わずにデコードされた画像の知覚上の品質を改善する。

【０１３５】この発明の別な応用には設計と警告標識（例えば道路標識）の位置についての
人間工学的な考慮を含んでいて、その目的とするところは標識を目立つように描
くことであり、このことは試行錯誤のプロセスとしばしばなっているところであ
り、これが公衆にとって危険をその間に与えることがある。目視上の注目につい
ての客観的な測度（言い換えれば、提案された環境の中にある、意図された観衆
の視ている標識の中で標識とかあるいはその他の何かが主要な主体となっている
かどうかを識別する測度）が設計プロセスを改良して、不十分な目立ち方の試験
標識によって生ずる事故の危険を減らすことになる。他の識別たとえば広告のよ
うなものと、インターネット“ウエブサイト”のような表示スクリーンの配置と
いったものの目視上のインパクトもまたこのプロセスを用いて最適化されて、特
定の場所での注目度を最大のものとする。

【０１３６】この発明はまた背景もしくは周辺の密度分布（ポピュレーション）からある点
で異なっているオブジェクトを識別することもできる。例えば、癌にかかった細
胞は周辺の健康な細胞内には存在しない特徴を有していることにより識別できる
。眼によるこのような以上の識別は非常に労力を要するプロセスであり、その理
由には多数のサンプルが調べられることと、癌細胞の比較的希有なこと（rarity
）とが挙げられる。人間の観察者は眼にかかるひずみ（ストレイン，いわゆるス
トレス）と疲労との結果として注意が変えることが知られている。

【０１３７】別な例として素粒子物理学者により使用される泡箱写真では、新しいしかも異
常な粒子軌跡のパターンがこのプロセスによって識別できる。関心のある大部分
の軌跡はこれまでに未発見の粒子で未知の性質をもつものによって生成されたも
のであるから、このようなサーチのためのテンプレートを工夫することは不可能
である。

【０１３８】他の例には、繊維製品等のテクスチャの目視的な提示における欠陥の客観的な
検出であり、これが織物やマイクロチップ配置の製造プロセスについて、あるい
は他のプロセスで表面欠陥が避けられないものの品質力保証を改善する。

【０１３９】その他の応用では周囲と正号していないオブジェクトの存在の認識がセキュリ
ティサーベイランス（安全調査）の分野で数多くの応用を有している。このよう
な対象（オブジェクト）は保安要員が早くに注目しないとすると、重大な危害を
もたらすことになる。同じように、衛星画像内に存在する異常なオブジェクトは
生態系（エコロジー）の局所的変化とか有用な知的情報を顕在化できる。

【０１４０】この発明はまた人間の視覚のモデルとして役立つものであり、いろいろな課題
への応用をもち、この課題の中では人間の挙動性質を長くしかも経費を要する人
間因子についての試行に代るものとしてエミュレートするのが必要とされている
。

【０１４１】この発明が応用を見出すことができる他の分野にはビデオ素材についての改善
された描画が含まれ、ここでは知覚上重要な領域がより詳細に描画され、学生生
徒の注目を集めるために教材を強調したり、高い注目をもつオブジェクトについ
ての外形線をつけるように画像編集をしたりして、それにより切断されて例えば
複合用に使用されるようにしたり、また鉄道、道路上の安全信号を、目視上注目
されるレベルについての自動監視を介して、自動チェックすることが含まれてい
る。

【図面の簡単な説明】

【図１】プロセスを模式的に示す図。

【図２】この発明による方法で処理されることになる画像を表わし、ピクセルｘ_ｊ，ｙ _ｊの二つの組についての比較プロセスを示す図（図２ａ）と、これらの画像につ
いて生成された異常値の写像を示す図（図２ｂ）。

【図３】この発明による方法で処理されることになる第二の画像を表わす図（図３ａ）
、およびこれらの画像について生成された異常値の写像を示す図（図３ｂ）。

【図４】この発明を実行できる汎用計算機の基本的な部品を模式的に示す図。

【図５】ともにこの発明による画像コーダを示す図（図５ａ、ｂ）。

【図６】ともにこの発明による画像デコーダを示す図（図６ａ、ｂ、ｃ）。

【図７】４：１：１ダウンサンプリング技術を示す図。

【図８】ある画像をブロックとブロックパッデングに分けることを示す図。

【図９】ジグザグ走査を示す図。

【図１０】画像ボトムアップ及び左から右への処理を示す図。

【図１１】インターリーブされていないデータ流の例を示す図。

【図１２】処理速度を高めるために比較ピクセル群を選択する例を示す図。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ，ＴＲ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＧＷ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＧＨ，ＧＭ，ＫＥ，ＬＳ，ＭＷ，ＭＺ，ＳＤ，ＳＬ，ＳＺ，ＴＺ，ＵＧ，ＺＷ)，ＥＡ(ＡＭ，ＡＺ，ＢＹ，ＫＧ，ＫＺ，ＭＤ，ＲＵ，ＴＪ，ＴＭ)，ＡＥ，ＡＧ，ＡＬ，ＡＭ，ＡＴ，ＡＵ，ＡＺ，ＢＡ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＢＺ，ＣＡ，ＣＨ，ＣＮ，ＣＲ，ＣＵ，ＣＺ，ＤＥ，ＤＫ，ＤＭ，ＤＺ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＤ，ＧＥ，ＧＨ，ＧＭ，ＨＲ，ＨＵ，ＩＤ，ＩＬ，ＩＮ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＣ，ＬＫ，ＬＲ，ＬＳ，ＬＴ，ＬＵ，ＬＶ，ＭＡ，ＭＤ，ＭＧ，ＭＫ，ＭＮ，ＭＷ，ＭＸ，ＭＺ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＳＬ，ＴＪ，ＴＭ，ＴＲ，ＴＴ，ＴＺ，ＵＡ，ＵＧ，ＵＳ，ＵＺ，ＶＮ，ＹＵ，ＺＡ，ＺＷ (72)発明者スタンティフォード、フレデリック・ウォーウィック・マイケルイギリス国、アイピー12・３エルエイチ、サフォーク、ウッドブリッジ、ボイトン、シープスター（番地なし) Ｆターム(参考） 5C057 EA01 EA02 EA07 EM09 EM13 EM16 GH03 5C059 MA00 MA23 MC11 MC38 ME02 ME05 PP01 PP15 PP16 TA46 TB08 TC34 UA02 5L096 AA02 AA06 GA36 GA41 HA07 JA11 KA07

Claims

【特許請求の範囲】

【請求項１】目視上注目される領域を識別するために、目視可能な画像を処
理する方法であって、各ピクセルが値を有しているピクセルのアレイとして画像を記憶する段階と、該アレイから試験ピクセルを選択する段階と、各試験ピクセルについて、該試験ピクセルの近隣にあるいくつかの近隣シーケン
スのピクセルを選択する段階と、該アレイから比較ピクセルを選択する段階と、選ばれた近隣シーケンスのピクセルが該試験ピクセルに対してもっているのと同
じそれぞれの位置関係を、該比較ピクセルに対して、もっているとして選ばれた
比較ピクセルの近隣にあるピクセルのシーケンスを識別する段階と、該選ばれた近隣シーケンスの値を、該識別されたシーケンスの値と、所定の整合規準に従り比較する段階と、各試験ピクセルについての目視上注目される測度を、比較結果が不整合となった
相手である試験ピクセルについて行なわれた比較の回数に依存して生成する段階
とを備えた方法。
【請求項２】各比較ピクセルについて、該試験ピクセルの近隣の該選ばれ
たピクセルのいくつかが該比較ピクセル近隣の対応するピクセルの値と実質的に
は同じでない値をもっているときには、異常値がインクレメントされ、処理が別
の比較ピクセルを用いて、同じ試験ピクセルで比較ピクセルが選ばれるまで繰返
されて、これによってすべての選ばれたピクセルが試験ピクセルの近隣の該対応
するピクセルと実質的に同じとなる値をもつことになり、この場合に別の近隣シ
ーケンスが選ばれて、処理が繰返される、請求項１記載の方法。
【請求項３】複数の試験ピクセルが同時に解析される、請求項１または２
記載の方法。
【請求項４】複数の比較ピクセルが与えられた試験ピクセルと同時に比較
される、請求項１，２，３のいずれか１項記載の方法。
【請求項５】前記値がカラー画像を表わしている三元ベクトルである、請
求項１ないし４のいずれか１項記載の方法。
【請求項６】近隣シーケンスに加えて、別の可変サーチ規準が選ばれる、
請求項１ないし５のいずれか記載の方法。
【請求項７】前記別の可変サーチ規準が二つのピクセル値は実質的に同じ
であるかどうかを判断するためのしきい値を含んでいる、請求項６記載の方法。
【請求項８】請求項１ないし７のいずれか１項に記載の方法であって、該
方法は高い異常値が生成されたサーチ規準についての値を記憶し、かつ後続の試
験ピクセルについて同じサーチ規準を選ぶ段階を含んでいる方法。
【請求項９】請求項１ないし８のいずれか１項に記載の方法であって、目
視可能なシーン内の重要な主体が一番大きな異常値をもつピクセルを含んでいる
領域の識別によって同定される方法。
【請求項１０】請求項１ないし８のいずれか１項に記載の方法であって、
目視可能なシーン内での所与のオブジェクトに対して与えられる目視上注目され
る測度が、そのオブジェクトを表わしているピクセルについて生成された異常値
を該シーンの他の部分について生成された異常値との比較によって判断される方
法。
【請求項１１】画像圧縮の方法であって、請求項１ないし１０のいずれか
１項により目視上注目される領域を位置決めするように画像を処理することと、
目視上注目される局所的領域に従り該画像を、目視上低く注目される領域を備え
た該画像の領域よりもより高精度でコード化することとを備えた画像圧縮方法。
【請求項１２】目視上注目される局所的領域が該画像のコード化のための
量子化レベルを選ぶために使用される、請求項１１記載の画像圧縮方法。
【請求項１３】目視可能な画像もしくはこの種の画像のシーケンスを目視
上注目される領域を位置決めするために処理する装置であって、各ピクセルが値を有しているピクセルのアレイとして画像を記憶する手段と、該アレイから試験ピクセルを選択する手段と、該試験ピクセルの近隣にあるピクセルについての近隣シーケンスを選択する手段
と、該アレイから比較ピクセルを選択する手段と、選ばれたピクセルについての近隣シーケンスが該試験ピクセルに対してもってい
るのと同じそれぞれの位置関係を、該比較ピクセルに対してもっているとして選
ばれた比較ピクセルの近隣にあるピクセルのシーケンスを識別する手段と、該選ばれた近隣シーケンスの値を、該識別されたシーケンスの値と、所定の整合
規準に従り比較する手段と、各試験ピクセルについての目視上注目される測定を、不整合シーケンスと識別す
る比較数に依存して、生成する手段とを備えた装置。
【請求項１４】請求項１ないし１２のいずれか１項の方法を実行するよう
にプログラムされた計算機。
【請求項１５】ディジタル計算機の内部メモリ内に直接ロードできる計算
機プログラム製品であって、該製品が計算機上で実行されるときには、請求項１
ないし１２のいずれか１項に記載の段階を実行するためのソフトウェアコード部
分を備えている計算機プログラム製品。
【請求項１６】計算機で使用可能な媒体上に記憶された計算機プログラム
製品であって、計算機をして各ピクセルが値を有しているピクセルのアレイとして画像を記憶す
るようにさせる計算機が読取り可能なプログラム手段と、該計算機をして該アレイから試験ピクセルを選ぶようにさせる計算機が読取り可
能なプログラム手段と、該計算機をして、各試験ピクセルについて、該試験ピクセルの近隣にあるピクセ
ルについての近隣シーケンスを選ぶようにさせる計算機が読取り可能なプログラ
ム手段と、計算機をして該アレイから比較ピクセルを選ぶようにさせる計算機が読取り可能
なプログラム手段と、計算機をして、該試験ピクセルに対してピクセルについての選ばれた近隣シーケ
ンスと同じそれぞれの位置関係を比較ピクセルに対してもっている、選ばれた比
較ピクセルの近隣にある該ピクセルについてのシーケンスを識別させる計算機が
読取り可能なプログラム手段と、計算機をして、該選ばれた近隣シーケンスの値を該識別されたシーケンスと所定
の整合規準に従り比較させる計算機が読取り可能なプログラム手段と、計算機をして各試験ピクセルについての目視上注目される測度を、該比較で不整
合となった比較の数に依存して、生成させる計算機が読取り可能なプログラム手
段とを備えた計算機プログラム製品。
【請求項１７】目視上注目される領域を識別する、目視可能な画像のシー
ケンスを処理する方法であって、各ピクセルが値を有しているピクセルの多次元アレイとして画像のシーケンスを
記憶する段階と、該アレイから試験ピクセルを選択する段階と、各試験ピクセルについて、該試験ピクセルの近隣にあるピクセルについてのいく
つかの近隣シーケンスを選択する段階と、該アレイから比較ピクセルを選択する段階と、選ばれた近隣シーケンスのピクセルが該試験ピクセルに対してもっているのと同
じそれぞれの位置関係を、該比較ピクセルに対して、もっているとして選ばれた
比較ピクセルの近隣にあるピクセルのシーケンスを識別する段階と、該選ばれた近隣シーケンスの値を、該識別されたシーケンスと、所定の整合規準
に従り比較する段階と、各試験ピクセルについての目視上注目される測度を、該比較結果が不整合となっ
た相手である試験ピクセルについて行なわれた比較の回数に依存して生成する段
階とを備えた方法。