JP3848514B2 - 顕著性算出装置及び方法 - Google Patents

顕著性算出装置及び方法 Download PDF

Info

Publication number
JP3848514B2
JP3848514B2 JP2000045684A JP2000045684A JP3848514B2 JP 3848514 B2 JP3848514 B2 JP 3848514B2 JP 2000045684 A JP2000045684 A JP 2000045684A JP 2000045684 A JP2000045684 A JP 2000045684A JP 3848514 B2 JP3848514 B2 JP 3848514B2
Authority
JP
Japan
Prior art keywords
saliency
image
image data
feature
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000045684A
Other languages
English (en)
Other versions
JP2001236508A (ja
Inventor
隆 鳥生
利生 遠藤
誠 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000045684A priority Critical patent/JP3848514B2/ja
Publication of JP2001236508A publication Critical patent/JP2001236508A/ja
Application granted granted Critical
Publication of JP3848514B2 publication Critical patent/JP3848514B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、表示されている画像内における各部分の重要性を測る尺度として画像各部の顕著性を算出する装置及び方法に関する。
【0002】
【従来の技術】
人が画像を観察する場合には、特に意識することなく画像内の特定の部分に着目することが多い。これは、その部分が他の部分とは異なる特徴を有する場合に多く見られる。このように、人が画像を観察したときに人の目の注意が向きやすい程度を表す評価尺度を「顕著性」と呼んでいる。
【0003】
例えば、図1に示すような画像を観察した場合には、人の目の注意は、1本だけ傾いている線に向けられることから、この部分が他の部分に比べて顕著性が高いものと考えられる。
【0004】
かかる顕著性を定量化して算出する方法としては、種々の方法が考えられている。例えば、イッティ氏(L.Itti)らによる「高速画像解析のための視覚顕著性モデル("A model of Silency-based Visual Attention for Rapid Scene Analysis",IEEE Transactions on Pattern Analysis and Machine Intelligence 1998;20(11):1254-1259.)」においては、画像各部の明るさや色、線方向等の局所的な変動量を各部の特徴として算出して、それらの重み付け平均値を求めることで顕著性と定義している。例えば図1のような場合には、1本だけ傾いている線の部分で線方向の変動量が大きく評価されることになる。同様の方法が、ウォルフ氏(J.M.Wolfe)による「視覚による検索の修正モデル("Guided search 2.0:a revised model of visual search",Psychonomic Bulletin Review, vol.1, pp.202 -238,1994.)」にも開示されている。
【0005】
図2は、このような従来の顕著性算出方法における処理の流れ図である。まず顕著性算出対象となる画像を入力し(ステップS21)、画像各部において線方向の変動量(周囲の線方向との差)等を各部の特徴として算出する(ステップS22)。そして、それらの特徴に基づいて顕著性を算出して(ステップS23)、顕著性マップ等を用いて出力表示する(ステップS24)。ここで「顕著性マップ」とは、定量化された画像の顕著性を、顕著性算出の対象となった画像と同一の座標上で色の濃淡等を用いて表示したものの総称を意味する。
【0006】
【発明が解決しようとする課題】
しかし、上述した顕著性の算出方法では、画像から抽出するべき特徴の種類が固定されており、どの特徴でもって顕著性を評価すれば最も的確に顕著性を判断することができるのかは問わないという問題点があった。
【0007】
すなわち、あらかじめ指定した一又は二以上の特徴の種類に基づいて顕著性を算出するため、仮に顕著性抽出対象となる画像に明らかに周囲と異なっている部分が有ったとしても、指定されている特徴の種類と相異していれば顕著性が高いものとは判断されないという不都合が生じてしまうからである。
【0008】
また、上述した算出方法では、人間の経験や記憶といった要素を考慮に入れて顕著性を算出することができないという問題点もあった。
【0009】
例えば、図3(a)においては、普段から見慣れている文字である‘5’の中に1つだけ‘2’があることを容易に見つけることができる。すなわち、文字‘2’については顕著性が高いものと判断することが容易である。
【0010】
それに対し、図3(b)は、図3(a)と同じ画像を90度回転させただけの画像であるにもかかわらず、図3(a)と同じ文字‘2’を見つけることが図3(a)の場合と比べて困難となっている。すなわち、画像自体を90度回転させたことによって、‘5’や‘2’といった文字が普段から目にすることのない図形となってしまったことが原因と考えられ、顕著性の判断には人間の経験や記憶が大きく作用しているものと考えられる。
【0011】
また、図4(a)においては、普段から見慣れている文字である‘N’の中から‘N’の反転文字を見つけることは容易である。一方、図4(a)全体を左右反転した図4(b)においては、普段見かけない‘N’の反転文字の中から普段見慣れている文字である‘N’を見つけることは、図4(a)の場合と比べて困難となっている。したがって、この例においても、顕著性の判断には人間の経験や記憶が大きく作用しているものと考えられる。
【0012】
本発明は、上記問題点を解消するべく、画像成分の顕著性を算出する場合に、人間の経験や記憶の度合を考慮して算出することのできる顕著性算出装置及び方法を提供することを目的とする。
【0013】
【課題を解決するための手段】
上記目的を達成するために本発明にかかる顕著性算出装置は、顕著性算出の対象となる第1の画像データを入力する画像入力部と、第1の画像データの各部の特徴を抽出する特徴抽出部と、抽出された各部の特徴に基づいて顕著性を定量化する顕著性算出部と、算出された顕著性を表示出力する出力表示部とを含む顕著性算出装置であって、学習対象となる第2の画像データを複数入力する学習画像群入力部と、複数の第2の画像データに基づいて特徴の種類を事前に学習し、決定しておく特徴種類決定部とをさらに含み、特徴種類決定部で決定された特徴の種類を特徴抽出部に入力し、特徴抽出部で特徴の種類と第1の画像データに基づいて各部の特徴を抽出することを特徴とする。
【0014】
かかる構成により、学習画像によって抽出すべき特徴の種類を変動させることができ、画像データに見合った特徴の種類に基づいて顕著性を判断することができる。したがって、かかる学習効果を人間の経験や記憶の度合と擬制することにより、より人の感覚に近似した顕著性の判断が可能となる。
【0015】
また、本発明にかかる顕著性算出装置は、出力表示部で出力された顕著性に基づいて、第1の画像データの中から顕著性の高い領域である第3の画像データを抽出する領域抽出部をさらに含み、学習画像群入力部の代わりに、領域抽出部によって抽出された第3の画像データを入力する抽出領域再入力部を含み、特徴種類決定部において第3の画像データに基づいて特徴の種類を学習し、特徴抽出部で抽出すべき特徴の種類を再決定することが好ましい。顕著性を判断した画像に基づいて、新たな特徴の種類を設定することができることから、繰り返し顕著性を算出することにより人の感覚に近似した顕著性の判断が可能となるからである。
【0016】
また、本発明にかかる顕著性算出装置は、特徴種類決定部においてKL変換を用いることが好ましい。さらに、本発明にかかる顕著性算出装置は、顕著性算出部においてKL変換を用いることが好ましい。限られた個数の特徴によって画像データをより忠実に表現するための一つの方法だからである。
【0017】
また、本発明は、上記のような顕著性算出装置の機能をコンピュータの処理ステップとして実行するソフトウェアを特徴とするものであり、具体的には、顕著性算出の対象となる第1の画像データを入力する工程と、第1の画像データの各部の特徴を抽出する工程と、抽出された各部の特徴に基づいて顕著性を定量化する工程と、算出された顕著性を表示出力する工程とを含む顕著性算出方法であって、学習対象となる第2の画像データを複数入力する工程と、複数の第2の画像データに基づいて特徴の種類を事前に学習し、決定しておく工程とをさらに含み、決定された特徴の種類と第1の画像データに基づいて各部の特徴を抽出する方法並びにそのような工程をプログラムとして記録したコンピュータ読み取り可能な記録媒体であることを特徴とする。
【0018】
かかる構成により、コンピュータ上へ当該プログラムをロードさせ実行することで、学習画像によって抽出すべき特徴の種類を変動させることができ、画像データに見合った特徴の種類に基づいて顕著性を判断することができる。したがって、かかる学習効果を人間の経験や記憶の度合と擬制することにより、より人の感覚に近似した顕著性の判断ができる顕著性算出装置を実現することが可能となる。
【0019】
【発明の実施の形態】
(実施の形態1)
以下、本発明の実施の形態1にかかる顕著性算出装置について、図面を参照しながら説明する。図5は本発明の実施の形態1にかかる顕著性算出装置の構成図である。図5において、51は画像入力部を、52は特徴抽出部を、53は顕著性算出部を、54は出力表示部を、それぞれ示し、この構成である限りにおいては従来の顕著性算出装置とは何ら相異しない。
【0020】
本実施の形態1は、特徴抽出時において、事前に複数の画像群によって学習した特徴の種類に基づいて特徴を決定する点、すなわち学習する画像によって抽出すべき特徴の種類が変動する点において、従来例と相違する。つまり、かかる機能を実現するために、学習画像群入力部521及び特徴種類決定部522を有する点に特徴を有する。
【0021】
本実施の形態1にかかる顕著性算出装置は、まず図5において、画像入力部51から顕著性抽出の対象となる画像を入力する。入力媒体としては、スキャナやデジタルカメラ等が一般的であるが、これに限定されるものではない。また、ファイルに保存されているビットマップイメージやTIFFファイル、JPEGファイル等であっても良い。
【0022】
次に、特徴抽出部52で顕著性算出対象画像から特徴を抽出することになるが、本実施の形態1では事前に特徴種類決定部522において、抽出の対象となる特徴の種類を決定しておくことができる。
【0023】
すなわち、まず学習画像群入力部521から学習の対象となる画像を入力する。例えば、アルファベットが記載されている画像やひらがな、あるいは片仮名が記載されている画像等、複数の画像を、画像入力部51と同様にスキャナ等の入力媒体を用いて入力しておくことになる。学習画像群入力部521から入力された画像において特徴を有すると判断された特徴の種類が、人が画像の顕著性を判断する際の経験や記憶等に相当するものとなる。
【0024】
そして、特徴種類決定部522では、入力された画像群に基づいて、顕著性を算出するべき特徴の種類を決定する。具体的には、以下の処理を行うことになる。
【0025】
まず、入力された学習画像全体から特徴を有する局所領域を所定の方法によって検出する。そのために、例えば学習画像の一部の大きさを有する窓領域を定め、窓領域を学習画像の上下左右端からドット単位等で移動させながら、学習画像全体の中から特徴を有する局所領域を検出する等の方法が考えられるが、特にかかる方法に限定されるものではない。
【0026】
そして、各局所領域内の画像パターンをベクトルとみなして、各局所領域に対応するベクトルすべてに基づいて共分散行列を算出する。ここで、共分散行列Pとは、(数1)で表すことができる行列をいい、n個のm次元ベクトルviから、その分散の程度を求めるべく算出されるものである。
【0027】
【数1】
Figure 0003848514
【0028】
(数1)において、ベクトルvaveは、n個のm次元ベクトルviの単純平均値を、添字‘T’は転置行列であることを、それぞれ示している。したがって、求める共分散行列Pは、m行m列の正方行列となる。
【0029】
選択すべき特徴の種類は、かかる共分散行列の固有ベクトルのうち、固有値が大きなベクトルから順に、固有値の総和が一定のしきい値に達するまで選択することで得る。こうして選択されたq個の固有ベクトルe1、e2、…、eqを主要固有ベクトルと呼ぶ。
【0030】
したがって、学習画像の各局所領域の画像パターンは、これらq個の主要固有ベクトルの重み付け線形和でもって近似される。すなわち、重み付け線形和を求めるべく、KL展開によって各画像パターンの主要固有ベクトルを重みとして求め、画像パターンを表すベクトルvと各主要固有ベクトルeiの(iは1からqまでの自然数)の内積Qを(数2)のように求めることで、q個の特徴ベクトルを定めることになる。
【0031】
【数2】
Figure 0003848514
【0032】
従来の方法では、主要固有ベクトルが固定であり、顕著性算出の基準となる特徴の種類が固定されているのに対し、本実施の形態1によれば主要固有ベクトルがサンプル画像の種類によって変動する。すなわち、サンプル画像がアルファベットを表示した画像であればアルファベットについては特徴ベクトルの一つとして選択されることになる。
【0033】
なお、KL展開は限られた個数の特徴で画像パターンをできるだけ忠実に表現するための一つの手法にすぎず、多数の学習パターンを限られた個数の特徴で近似的に表現できる方法で有れば、どのような方法を用いても良い。
【0034】
こうして算出されたq個の内積を各局所領域における特徴の種類とみなし、q次元の特徴ベクトルとすると、仮に入力画像のある局所領域の画像パターンと類似したパターンが多数の学習パターンの中に頻繁に出現していれば、この画像パターンは抽出された特徴によって比較的忠実に再現できる。
【0035】
再現の忠実度は、その画像パターンの二乗ノルムと特徴ベクトルの二乗ノルムの差でもって評価することができる。その差が画像パターンを特徴ベクトルで表したときの残差を表しており、小さければ小さいほど忠実に再現できていることを示している。
【0036】
次に、顕著性算出部53において、求まった主要固有ベクトルに基づいて選択された特徴に基づいて顕著性を算出する。具体的には、以下のような処理を行うことになる。
【0037】
まず、各局所領域から抽出された特徴ベクトルのすべてを対象としてKL変換を行い、上述したのと同様にr個の主要固有ベクトルe1、e2、…、erを求める。次に、各局所領域から抽出された特徴ベクトルとr個の主要固有ベクトルのそれぞれとの内積を二次特徴ベクトルとして算出する。
【0038】
こうして求めたr個の二次特徴ベクトルの二乗ノルムと、各局所領域の画像パターンをベクトルとみなした時の二乗ノルムとの差を算出して、各局所領域ごとの顕著性を表す指標とする。
【0039】
例えば図6に示すように画像パターンのベクトル61がn次元(図6では表記簡略化のため3次元空間で表記する。)であったとすると、特徴ベクトル62を求めることはq次元の空間上(図6では表記簡略化のため2次元の平面で表記する。)へ射影することに該当する。そして、二次特徴ベクトル63を求めることは、q次元の空間上の点をr次元の空間上(図6では表記簡略化のため直線で表記する。)へ射影することに該当する。すなわち、KL変換を経るごとに次元の小さな空間へと変換されていくことになる。そして、求める二乗ノルムの差64は、画像パターンのベクトル61と二次特徴ベクトル63との差を示す太線部分となる。
【0040】
かかる処理によって求まる顕著性は、ある局所領域の画像パターンを入力画像におけるすべての局所領域におけるパターンの特徴集合から定まるq個の主要固有ベクトルの重み付け線形和で近似したときの残差を表している。すなわち、ある局所領域の画像パターンが、それ以外の領域におけるパターンと類似していないときは顕著性が高くなる。また、ある局所領域の画像パターンが学習画像における局所パターンと類似していないときにも顕著性が高くなる。
【0041】
また、画像から特徴を抽出する前処理として、各局所領域において同時生起行列Oを算出することも考えられる。同時生起行列Oとは、(数3)で示すような行列をいい、画像上の1点における画素値I(x,y)と当該1点を平行移動した点における画素値I(x+i,y+j)との積の総和を表すものである。
【0042】
【数3】
Figure 0003848514
【0043】
かかる行列による前処理を行うことで、平行移動に対する画像パターン認識の変動を最小限に抑制することができる。例えば、図7に示すように、画像が大きく、一部について窓によって認識する場合において、窓(a)では文字‘5’が窓の右側に位置していると認識されるのに対し、窓(b)では文字‘5’が窓の左側に位置していると認識されてしまう。これらを別画像と認識したのでは、単なる平行移動であり同一画像パターンとして認識すべき画像であっても、異なる特徴を有すると認識されるおそれがあり、特徴の種類として抽出すべき次元数の限定されている本実施の形態1においては、数多くの特徴を抽出することとなって好ましくない。
【0044】
そこで、窓位置の操作による窓の位置変化によっては別パターンと認識せず、平行移動しても値が変わらないように同時生起行列Oの算出処理をしておくことで、数少ない特徴で本質的な差異を抽出することが可能となる。
【0045】
最後に、出力表示部54において、顕著性マップとして算出した顕著性について出力表示する。例えば図8及び図9は、同時生起行列を求めた上で、実際に顕著性を算出した出力結果の例示図である。なお、図8及び図9はそれぞれ図3と図4に対応した出力表示を示している。
【0046】
まず、図8(a)では、顕著性の高い文字のところが白く表示されている。図8(a)においては、顕著性の高いところが1箇所だけであることから、その部分に注意が引かれることで‘2’の文字を容易に見つけることが可能となる。
【0047】
一方、図8(b)では、すべての文字について顕著性が同程度に高くなっていることから、一つ一つの文字に順に注意が引かれることになり、‘2’の文字を見つけるまでに想到の時間を要することがわかる。
【0048】
同様に図9(a)では、顕著性の高い文字のところが白く表示されている。一方、図9(b)では、文字‘N’ではない‘N’の反転文字の部分で顕著性が高くなっているので、文字‘N’を見つけることが困難となっていることが明らかである。
【0049】
上述した本発明の実施の形態1にかかる顕著性算出装置を実現するプログラムの処理の流れは図10に示すようになる。
【0050】
まず、顕著性算出の対象となる画像を入力する前に、サンプルとなる学習画像群を入力し(ステップ101)、各画像の各局所領域に対応するベクトルすべてに基づいて共分散行列を算出する(ステップS102)。そして、共分散行列に基づいてKL変換等することによって主要固有ベクトルを特徴の種類として決定する(ステップS103)。
【0051】
特徴の種類が確定した後に、顕著性算出対象となる画像を入力する(ステップS104)。そして、まず主要固有ベクトルに基づいて特徴ベクトルを算出する(ステップS105)。次に、算出された特徴ベクトルに基づいてKL変換等によって再度主要固有ベクトルを決定し(ステップS106)、二次特徴ベクトルを算出する(ステップS107)。
【0052】
最後に、各画像の各局所領域に対応するベクトルと二次特徴ベクトルとの二乗ノルムの差を算出して(ステップS108)、顕著性マップとして出力表示する(ステップS109)。
【0053】
一方、上述した方法は、あらかじめ多数の学習画像群を準備しておく方法であるが、例えば図11に示すような構成とすることで、算出した顕著性に基づいて画像の部分領域を抽出して、当該抽出領域と特徴の種類に基づいて特徴の種類を漸次更新していくことも考えられる。
【0054】
図11において、111は領域抽出部を、112は抽出領域再入力部を、113は同時生起行列算出部を、114は共分散行列更新部を、それぞれ示す。なお、同時生起行列算出部113は必須の構成要件ではない。
【0055】
図11では、一旦顕著性マップとして出力された結果に基づいて、領域抽出部111によって顕著性が高いと判断された部分領域を抽出する点に特徴を有する。すなわち、出力された顕著性マップから改めて領域抽出部111によって各部の特徴を抽出して、抽出した画像データを再度抽出領域再入力部112から入力する。再入力された画像データに基づいて再度同時生起行列算出部113において同時生起行列を算出し、共分散行列更新部114において共分散行列を更新することでKL変換をやり直し、主要固有ベクトル自体を再計算しようとするものである。
【0056】
こうすることで、システムを使えば使うほど、すなわちシステム上の経験を多く積めば積むほど、適切な特徴の種類を用いて顕著性を判断することができるようになる顕著性算出装置を実現することが可能となる。
【0057】
以上のように本実施の形態1によれば、学習画像データや顕著性が高いと判断された画像データによって抽出すべき特徴の種類を変動させることができ、画像データに見合った特徴の種類に基づいて顕著性を判断することができる。したがって、かかる学習効果を人間の経験や記憶の度合と擬制することにより、より人の感覚に近似した顕著性の判断が可能となる。
【0058】
本実施の形態にかかる顕著性算出装置は、様々な分野において応用が可能である。例えば、画面の表示領域に制限のある携帯端末等への適用が考えられる。図12は本発明の一実施例にかかる顕著性算出装置を用いた携帯端末における処理流れ図である。
【0059】
一般に、携帯端末のような小画面に大きな画像を表示する場合には、画像を縮小して表示することになるが、単純に縮小して表示する方法では、画面の表示密度の関係上、細部の表示がされない場合が多い。かかる表示上の問題を解消するべく、画像の一部を切り出して表示することが良く行われる。本実施例では、入力される画像の顕著性を求め、画像内において顕著性の高い部分、すなわち画像内において重要な部分領域を切り出して表示することを目的としている。
【0060】
図12では、まず表示すべき画像データの全体を入力し(ステップS121)、画像データ全体にわたって顕著性を算出することで、当該画像データ全体における顕著性マップを求める(ステップS122)。かかる顕著性の算出に、本実施の形態にかかる顕著性算出方法を用いている。
【0061】
次に、携帯端末で表示できるサイズには物理的な制約があることから、表示可能な画像領域サイズを指定するとともに(ステップS123)、当該画像領域サイズの窓を表示画像データ全体について順次ラスタ走査し(ステップS124)、窓の位置を変えるごとに窓領域内の顕著性を算出する(ステップS125)。この顕著性の算出にも、本実施の形態にかかる顕著性算出方法を用いる。
【0062】
そして、顕著性が最も高いと判断された窓領域を切り出し領域として選択することで(ステップS126)、携帯端末の画面へ最も顕著性の高い画面、すなわち利用者にとって重要な情報が最も多く含まれていると判断される部分の画像が表示される(ステップS127)。
【0063】
こうすることで、顕著性が高い情報が最も多く含まれていると判断される画像データを、すなわち人が見て重要な部分であると判断できる部分を携帯端末の画面上に表示することができるとともに、画像データを縮小して表示しているわけではないので、画像の細部を消失しているという弊害も解消できる。
【0064】
また、TVカメラによる異常監視システムの無人化への適用も考えられる。図13は本発明の他の実施例にかかる顕著性算出装置を用いた異常監視システムにおける処理流れ図である。
【0065】
図13では、画像を入力する入力媒体はテレビカメラであり、カメラから常時動画像として、あるいは一定時間間隔ごとの静止画像として、監視対象となる画像データを入力する(ステップS131)。そして、カメラにより入力された画像データの顕著性を算出する(ステップS132)。すなわち、動画像については一定時間間隔ごとの画像データについての顕著性を、静止画像については各々の顕著性を算出する。かかる顕著性の算出には本実施の形態にかかる顕著性算出方法を用いている。
【0066】
そして、顕著性が突然増加したり、急激に増加した場合を検出することで(ステップS133:Yes)、異常が発生したものと判断する(ステップS134)。例えば、普段は人の出入りのない場所を常時監視しておき、顕著性を算出しておくと、人や他の生物の画像が入力されると顕著性が非常に高く算出される。したがって、実際に人が監視カメラを常時覗いていなくても、顕著性の定量値による自動判断によって人や生物等の進入を容易に監視することが可能となる。
【0067】
さらに、ウェブ画面等の設計において利用者に見て欲しい情報について顕著性を高めるように配置する等の宣伝広告強化補助を行う画面作成支援装置として応用することも考えられる。図14は本発明の他の実施例にかかる顕著性算出装置を用いたウェブ画面上の注意喚起システムにおける処理流れ図である。
【0068】
図14では、まず初期の設計画面を顕著性算出の対象画像として入力する(ステップS141)。そして、対象画像の顕著性を算出して顕著性マップを作成する(ステップS142)。かかる顕著性の算出には本実施の形態にかかる顕著性算出方法を用いている。
【0069】
次に、利用者に見て欲しい情報を表示するオブジェクトを指定し(ステップS143)、当該オブジェクトが画像上で占めている領域について領域内の顕著性を算出する(ステップS144)。かかる顕著性の算出には本実施の形態にかかる顕著性算出方法を用いている。
【0070】
かかるオブジェクト領域の顕著性が、事前に定めておいた所定のしきい値Tよりも大きい場合には、画面表示において十分な顕著性を有するものと判断して処理を終了する(ステップS145:Yes)。逆に、事前に定めておいたしきい値Tよりも小さい場合には(ステップS145:No)、十分な顕著性を有していないものと判断して、対象画面の設計の変更を行った後に(ステップS146)、同様の処理を繰り返す。かかる設計変更として考えられるのは、オブジェクトの色や配置等の変更であることは言うまでもない。
【0071】
なお、本発明の実施の形態にかかる顕著性算出装置を実現するプログラムを記憶した記録媒体は、図15に示す記録媒体の例に示すように、CD−ROM152−1やフロッピーディスク152−2等の可搬型記録媒体152だけでなく、通信回線の先に備えられた他の記憶装置151や、コンピュータ153のハードディスクやRAM等の記録媒体154のいずれでも良く、プログラム実行時には、プログラムはローディングされ、主メモリ上で実行される。
【0072】
また、本発明の実施の形態にかかる顕著性算出装置により生成された二次特徴ベクトル等を記録した記録媒体も、図15に示す記録媒体の例に示すように、CD−ROM152−1やフロッピーディスク152−2等の可搬型記録媒体152だけでなく、通信回線の先に備えられた他の記憶装置151や、コンピュータ153のハードディスクやRAM等の記録媒体154のいずれでも良く、例えば本発明にかかる顕著性算出装置を利用する際にコンピュータ153により読み取られる。
【0073】
【発明の効果】
以上のように本発明にかかる顕著性算出装置によれば、学習画像データや顕著性が高いと判断された画像データによって抽出すべき特徴の種類を変動させることができ、画像データに見合った特徴の種類に基づいて顕著性を判断することができる。したがって、かかる学習効果を人間の経験や記憶の度合と擬制することにより、より人の感覚に近似した顕著性の判断が可能となる。
【図面の簡単な説明】
【図1】 顕著性判断の例示図
【図2】 従来の顕著性算出方法における処理流れ図
【図3】 顕著性判断の例示図
【図4】 顕著性判断の例示図
【図5】 本発明の実施の形態にかかる顕著性算出装置の基本構成図
【図6】 本発明の実施の形態にかかる顕著性算出装置における顕著性算出プロセスの説明図
【図7】 本発明の実施の形態にかかる顕著性算出装置におけるパターン認識の説明図
【図8】 本発明の実施の形態にかかる顕著性算出装置における出力表示の例示図
【図9】 本発明の実施の形態にかかる顕著性算出装置における出力表示の例示図
【図10】 本発明の実施の形態にかかる顕著性算出装置における処理の流れ図
【図11】 本発明の実施の形態にかかる顕著性算出装置の構成図
【図12】 本発明の一実施例にかかる顕著性算出装置における処理の流れ図
【図13】 本発明の他の実施例にかかる顕著性算出装置における処理の流れ図
【図14】 本発明の他の実施例にかかる顕著性算出装置における処理の流れ図
【図15】 記録媒体の例示図
【符号の説明】
51 画像入力部
52 特徴抽出部
53 顕著性算出部
54 出力表示部
61 画像パターンのベクトル
62 特徴ベクトル
63 二次特徴ベクトル
64 二乗ノルムの差
111 領域抽出部
112 抽出領域再入力部
113 同時生起行列算出部
114 共分散行列算出部
151 回線先の記憶装置
152 CD−ROMやフロッピーディスク等の可搬型記録媒体
152−1 CD−ROM
152−2 フロッピーディスク
153 コンピュータ
154 コンピュータ上のRAM/ハードディスク等の記録媒体
521 学習画像群入力部
522 特徴種類決定部

Claims (7)

  1. 学習パターンを近似的に表現できる所定の方法により各局所領域における画像パターンを近似しそれらの変動量を算出する顕著性の算出の対象となる第1の画像データを入力する画像入力部と、
    学習対象となる第2の画像データを複数入力する学習画像群入力部と、
    複数の前記第2の画像データから画像パターンを算出し、それらの画像パターンに対して、限られた個数の特徴で近似的に表現できる所定の方法により、主要固有ベクトルを事前に学習し、当該主要固有ベクトルを特徴の種類として決定しておく特徴種類決定部と、
    前記所定の方法により各局所領域における画像パターンが近似表現された前記第1の画像データの各局所領域の特徴ベクトルに対して、再度、限られた個数の特徴で近似的に表現できる所定の方法により、近似表現の2次特徴ベクトルを算出する特徴抽出部と、
    各局所領域の画像パターンベクトルと2次特徴ベクトルの2乗ノルムの差を算出して、顕著性を定量化する顕著性算出部と、
    算出された顕著性を顕著性マップとして表示出力する出力表示部とを含む顕著性算出装置。
  2. 前記出力表示部で出力された顕著性に基づいて、前記第1の画像データの中から顕著性の高い領域である第3の画像データを抽出する領域抽出部をさらに含み、
    前記学習画像群入力部の代わりに、前記領域抽出部によって抽出された前記第3の画像データを入力する抽出領域再入力部を含み、前記特徴種類決定部において前記第3の画像データに基づいて特徴の種類を学習し、前記特徴抽出部で抽出すべき特徴の種類を再決定する請求項1記載の顕著性算出装置。
  3. 前記特徴種類決定部においてKL変換を用いる請求項1又は2記載の顕著性算出装置。
  4. 前記顕著性算出部においてKL変換を用いる請求項1から3のいずれか一項に記載の顕著性算出装置。
  5. 前記画像パターンとして同時生起行列を用いる、請求項1に記載の顕著性算出装置。
  6. 学習パターンを近似的に表現できる所定の方法により各局所領域における画像パターンを近似しそれらの変動量を算出する顕著性の算出の対象となる第1の画像データを入力する工程と、
    学習対象となる第2の画像データを複数入力する工程と、
    複数の前記第2の画像データから画像パターンを算出し、それらの画像パターンに対して、限られた個数の特徴で近似的に表現できる所定の方法により、主要固有ベクトルを事前に学習し、当該主要固有ベクトルを特徴の種類として決定しておく工程と、
    前記所定の方法により各局所領域における画像パターンが近似表現された前記第1の画像データの各局所領域の特徴ベクトルに対して、再度、限られた個数の特徴で近似的に表現できる所定の方法により、近似表現の2次特徴ベクトルを算出する工程と、
    各局所領域の画像パターンベクトルと2次特徴ベクトルの2乗ノルムの差を算出して、顕著性を定量化する工程と、
    算出された顕著性を顕著性マップとして表示出力する工程とを含む顕著性算出方法。
  7. 学習パターンを近似的に表現できる所定の方法により各局所領域における画像パターンを近似しそれらの変動量を算出する顕著性算出の対象となる第1の画像データを入力するステップと、
    学習対象となる第2の画像データを複数入力するステップと、
    複数の前記第2の画像データから画像パターンを算出し、それらの画像パターンに対して、限られた個数の特徴で近似的に表現できる所定の方法により、主要固有ベクトルを事前に学習し、当該主要固有ベクトルを特徴の種類として決定しておくステップと、
    前記所定の方法により各局所領域における画像パターンが近似表現された前記第1の画像データの各局所領域の特徴ベクトルに対して、再度、限られた個数の特徴で近似的に表現できる所定の方法により、近似表現の2次特徴ベクトルを算出するステップと、
    各局所領域の画像パターンベクトルと2次特徴ベクトルの2乗ノルムの差を算出して、顕著性を定量化するステップと、
    算出された顕著性を顕著性マップとして表示出力するステップとをコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2000045684A 2000-02-23 2000-02-23 顕著性算出装置及び方法 Expired - Fee Related JP3848514B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000045684A JP3848514B2 (ja) 2000-02-23 2000-02-23 顕著性算出装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000045684A JP3848514B2 (ja) 2000-02-23 2000-02-23 顕著性算出装置及び方法

Publications (2)

Publication Number Publication Date
JP2001236508A JP2001236508A (ja) 2001-08-31
JP3848514B2 true JP3848514B2 (ja) 2006-11-22

Family

ID=18568224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000045684A Expired - Fee Related JP3848514B2 (ja) 2000-02-23 2000-02-23 顕著性算出装置及び方法

Country Status (1)

Country Link
JP (1) JP3848514B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4161659B2 (ja) 2002-02-27 2008-10-08 日本電気株式会社 画像認識システム及びその認識方法並びにプログラム
FR2888375A1 (fr) * 2005-07-06 2007-01-12 Thomson Licensing Sa Procede d'obtention d'une carte de saillance a partir d'une pluralite de cartes de saillances etablies a partir de grandeurs visuelles differentes
JP2007148835A (ja) 2005-11-28 2007-06-14 Fujitsu Ten Ltd 物体判別装置、報知制御装置、物体判別方法および物体判別プログラム
JP5016541B2 (ja) 2008-04-01 2012-09-05 富士フイルム株式会社 画像処理装置および方法並びにプログラム
JP5416663B2 (ja) * 2010-07-12 2014-02-12 日本放送協会 画像評価装置および画像評価プログラム
JP6135283B2 (ja) 2013-04-26 2017-05-31 オムロン株式会社 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP6232982B2 (ja) 2013-12-02 2017-11-22 オムロン株式会社 画像処理装置、画像処理方法およびプログラム
JP6330385B2 (ja) 2014-03-13 2018-05-30 オムロン株式会社 画像処理装置、画像処理方法およびプログラム
JP6669376B2 (ja) * 2014-10-31 2020-03-18 キヤノン株式会社 画像処理装置及びその制御方法、並びにプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06105398B2 (ja) * 1986-03-31 1994-12-21 株式会社東芝 パタ−ン認識学習装置
JPH05280960A (ja) * 1992-03-30 1993-10-29 Fuji Photo Film Co Ltd 欠陥検査装置
JP3225179B2 (ja) * 1995-07-04 2001-11-05 シャープ株式会社 パターン欠陥検査装置
JP3447572B2 (ja) * 1998-07-31 2003-09-16 株式会社山武 部品の接続良否検査方法
JP2000207566A (ja) * 1999-01-18 2000-07-28 Ricoh Co Ltd テクスチャ特徴抽出装置

Also Published As

Publication number Publication date
JP2001236508A (ja) 2001-08-31

Similar Documents

Publication Publication Date Title
CN108416377B (zh) 柱状图中的信息提取方法及装置
EP1768058B1 (en) Information processing apparatus and control method therefor
TWI254891B (en) Face image detection method, face image detection system, and face image detection program
JP2008537198A (ja) 人工知能を使用した外来のアプリケーションユーザインタフェースからの情報のインテリジェントインポート
WO2002073521A2 (en) Automatic algorithm generation
WO2020240809A1 (ja) 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム
JP6985856B2 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
CN108682007A (zh) 基于深度随机森林的jpeg图像重采样自动检测方法
JP2010134957A (ja) パターン認識方法
WO2004042392A1 (ja) 画像解析支援方法、画像解析支援プログラムおよび画像解析支援装置
CN110069129A (zh) 确定系统和确定方法
CN112906794A (zh) 一种目标检测方法、装置、存储介质及终端
JP4303092B2 (ja) 年齢推定装置、年齢推定方法および年齢推定プログラム
JP3848514B2 (ja) 顕著性算出装置及び方法
CN112950561A (zh) 光纤端面缺陷检测方法、设备及存储介质
CN117854072B (zh) 一种工业视觉缺陷自动标注方法
CN114332473A (zh) 目标检测方法、装置、计算机设备、存储介质及程序产品
JP5311899B2 (ja) パターン検出器の学習装置、学習方法及びプログラム
CN112598031A (zh) 一种蔬菜病害检测方法及系统
CN108876776B (zh) 一种分类模型生成方法、眼底图像分类方法及装置
CN117437691A (zh) 一种基于轻量化网络的实时多人异常行为识别方法及系统
JP5407897B2 (ja) 画像分類方法、装置、及びプログラム
CN114792300B (zh) 一种基于多尺度注意力x光断针检测方法
CN113034420B (zh) 一种频率空间域特征的工业产品表面缺陷分割方法及系统
CN114550179A (zh) 对手写汉字黑板板书进行指导的方法、系统及设备

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050920

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060825

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090901

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100901

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees