JP2004234612A - 画像記述システムおよび方法 - Google Patents

画像記述システムおよび方法 Download PDF

Info

Publication number
JP2004234612A
JP2004234612A JP2003066399A JP2003066399A JP2004234612A JP 2004234612 A JP2004234612 A JP 2004234612A JP 2003066399 A JP2003066399 A JP 2003066399A JP 2003066399 A JP2003066399 A JP 2003066399A JP 2004234612 A JP2004234612 A JP 2004234612A
Authority
JP
Japan
Prior art keywords
image
description
feature
feature amount
descriptors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003066399A
Other languages
English (en)
Other versions
JP4336813B2 (ja
Inventor
Eiji Kasuya
英司 粕谷
Akio Yamada
昭雄 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2003066399A priority Critical patent/JP4336813B2/ja
Priority to US10/506,091 priority patent/US20060023946A1/en
Priority to EP03777276A priority patent/EP1569448A4/en
Priority to PCT/JP2003/015574 priority patent/WO2004054253A1/ja
Publication of JP2004234612A publication Critical patent/JP2004234612A/ja
Application granted granted Critical
Publication of JP4336813B2 publication Critical patent/JP4336813B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Abstract

【課題】適切な特徴量を用いて容易に画像を記述できる画像記述システムおよび方法を提供する。
【解決手段】画像記述スキーム記憶部106には、画像の種別ごとに、矩形画像記述スキーム、任意形状画像記述スキーム、ビデオシーケンス記述スキーム、ビデオオブジェクト記述スキームが格納されている。画像記述スキーム検索部105は、指定された画像の種別に対応する記述スキームを検索する。読み出された画像記述スキームに基づいて、抽出できるビジュアル特徴量の種類を所定のフォームで表示部102に表示させる。ビジュアル特徴量抽出部107は、指定された画像より指定されたビジュアル特徴量の抽出を行う。記述ファイル生成部108は、抽出されたビジュアル特徴量およびパラメータをビジュアル記述子により記述した記述ファイルを生成する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明はマルチメディア情報の種々の特徴を記述するためのシステムおよび方法に関する。
【0002】
【従来の技術】
インターネットに代表されるネットワークの広帯域化に伴って、テキスト(文字)情報だけでなく映像や音声を含むマルチメディア情報がオンラインで広く一般に提供されるようになっている。このことは、ユーザが多種多様な情報に容易にアクセスできるという利点がある反面、あまりに多量かつ多様な情報が提供されるために、本当に必要で役に立つ情報へアクセスすることがますます困難になるという皮肉な現象も現れている。
【0003】
このような状況おいてマルチメディア情報を効率的に検索、フィルタリングあるいは組織化する手段として、メタデータを検索対象とする技術が注目されている。メタデータはマルチメディアコンテンツから抽出された特徴を一定の形式で簡潔に表現したものであり、これを直接の検索対象とすることで検索の効率化を図ることができる。特に、視覚的/聴覚的情報は具体的な言葉では表現しにくいことが多く、より感性に近い情報を定量化してメタデータとして表現する方が適している。
【0004】
このような背景のもとで、マルチメディアコンテンツのメタデータに対する統一的な表記方法がMPEG−7によって提供された。そのなかの通称MPEG−7 Visualは、ビジュアルコンテンツの信号的特徴(以下、ビジュアル特徴量と呼ぶ。)を記述する標準化フォーマットISO/IEC 15938−3を提供するパートである。MPEG−7 Visualでは、ビジュアルコンテンツのビジュアル特徴量およびビジュアル特徴量を記述するためのビジュアル記述子の生成方法が定められている。なお、ビジュアルコンテンツには、デジタル写真のような矩形画像、クリップアート等の任意形状画像、矩形フレームの集合である矩形動画像(ビデオシーケンス)、動画像の中の任意形状領域あるいは物体のシーケンスであるビデオオブジェクトなどが含まれる。
【0005】
以下、ビジュアル記述子の例としてエッジ記述子:EdgeHistogram を取り上げ、既存の画像記述システムについて説明する。
【0006】
EdgeHistogram はローカルエッジ情報をヒストグラム化したもので、画像を4x4の区画に分割し、区画毎に所定の5タイプのエッジがどのくらい存在するかを、それぞれ3ビットで記述するための記述子である。EdgeHistogram 特徴量は以下のように生成する。
【0007】
D = [Eij (i=1,2,..,16, j=1,2,…,5)]。
【0008】
ここで、Eijはブロックi(ラスタースキャン順)における第jエッジ要素を示す。記述子構築は以下のように行なう。まず、画像を縦横4区画の合計16分割する。次に、各区画においてマスク演算により各方向のエッジを検出する。演算出力が閾値を超えた場合にヒストグラムの対応するビンに1票を投じることによって特徴量が構築される。
【0009】
生成された特徴量は、MPEG−7 Visualパートで表1のように規定されているシンタックスに基づき、例えば表2のように記述される。
【0010】
【表1】
Figure 2004234612
【0011】
【表2】
Figure 2004234612
MPEG−7 Visualで定められたビジュアル記述子により画像の信号特徴を記述するシステムが、”MPEG−7 XM Software”として提供されている。このシステムでは、利用者が記述子を生成する対象となる画像を指定するとともに、抽出するビジュアル特徴量を選択する。これによって、選択されたビジュアル記述子を構成するビジュアル特徴量が指定された画像から抽出される。こうして、抽出されたビジュアル特徴量がビジュアル記述子により記述された記述ファイルが生成される。
【0012】
記述子を用いた画像記述に関しては種々提案されている。たとえば特開2002−170116号公報には、記述子に十分な空間情報を埋め込み、そのコンテンツに基づいて画像を記述することで、画像の識別を容易にする方法が開示されている(要約、段落番号0011〜0012)。
【0013】
【特許文献1】
特開2002−170116号公報(要約、段落番号0011〜0012)。
【0014】
【発明が解決しようとする課題】
上述したように、メタデータはマルチメディアコンテンツから抽出された特徴を一定の形式で簡潔に表現したものであり、これを直接の検索対象とすることで検索の効率化を図っている。したがって、マルチメディアコンテンツを適切に表現するメタデータをどのように生成するかは、検索の効率化及び精度に直接影響する重要なファクタである。
【0015】
しかしながら、上記従来のシステムでは、画像の種別により利用できる記述子、利用できない記述子があるにもかかわらず、画像の種別に関係なく全てのビジュアル記述子を用いて画像を記述していた。このために、ある種別の画像に対して不適切な記述子で画像記述が実行される場合がある。たとえば、静止画像である矩形画像が動きアクティビティ記述子によって記述する場合などである。
【0016】
また、ある特定タイプのシステムに向けて作成された記述ファイルを他のシステムで直接利用するためには、全てのビジュアル記述子についての利用ツールをサポートしなくてならない。このためにシステム規模が非常に大きくなるという問題もあった。
【0017】
本発明の目的は、ビジュアルコンテンツに対して適切な特徴量を抽出できる画像記述システムおよび方法を提供することにある。
【0018】
本発明の他の目的は、サポートするツールの種類を最適化することによりシステム構成を簡易にした画像記述システムを提供することにある。
【0019】
本発明のさらに他の目的は、画像に対する記述ファイルの記述方式が適切であるか否かを検証できる画像記述システムおよび方法を提供することにある。
【0020】
【課題を解決するための手段】
本発明による画像記述システムおよび方法は、画像の種別ごとに定義された記述スキームを格納しておき、画像が指定された時に、当該指定画像の種別に対応する記述スキームを検索することで指定画像から抽出可能な特徴量を特定し、表示部に表示する。この特定された特徴量にしたがって指定画像から特徴量を抽出し、指定画像の記述ファイルを生成する。特定された特徴量を選択可能に表示することが望ましい。特に、表示された特徴量のうち類似したものの間では、用途に応じて少なくとも1つの選択を行うのが望ましい。
【0021】
このように構成することで、有意義なビジュアル特徴量の選択が容易となり、かつ、指定画像を的確に表現したビジュアル特徴量を抽出がすることができる。
【0022】
また、画像の種別ごとに記述スキームを定義しておくことによりサポートするべき特徴量および記述ツールの種類を必要最小限にすることができ、システム構成を簡略化できる。
【0023】
さらに、指定画像の種別に対応する記述スキームを用いて、生成された記述ファイルを検証するのが望ましい。このように生成された記述ファイルを元の画像記述スキームと照らし合わせることにより、画像に対する記述ファイルの記述方式が適切であるか否かを検証でき、画像検索の効率及び精度をさらに向上させることができる。
【0024】
【発明の実施の形態】
以下、図面を参照しながら、本発明の実施形態について詳細に説明する。
【0025】
システム構成
図1は、本発明の第1実施形態による画像記述システムの構成を示すブロック図である。図1において、入力部101は、キーボードやポインティングデバイスなどの入力デバイスからなり、ビジュアル特徴量を抽出する対象となる画像の指定、抽出するビジュアル特徴量の指定、あるいは、種々の命令の入力を行うことができる。表示部102はモニタであり、後述するビジュアル特徴量選択画面を表示し、入力部101と協働してユーザインタフェースを提供する。本システムのプログラム制御プロセッサ103は、制御プログラム104を実行することによりビジュアル特徴量抽出に関する処理やシステム全体の動作を制御する。
【0026】
本実施形態による画像記述システムには、画像記述スキーム検索部105、画像記憶スキーム記憶部106、ビジュアル特徴量抽出部107、記述ファイル生成部108が設けられている。画像記述スキーム検索部105、ビジュアル特徴量抽出部107および記述ファイル生成部108は、プログラム制御プロセッサ103の制御のもとで、後述する画像記述スキーム検索、ビジュアル特徴量抽出および記述ファイル生成をそれぞれ実行する。
【0027】
画像記述スキーム記憶部106には、複数の画像記述スキームが格納されている。ここでは、矩形画像記述スキーム200、イメージクリップ(任意形状画像)記述スキーム300、ビデオシーケンス(矩形動画像)記述スキーム400およびビデオオブジェクト記述スキーム500、あるいは、これらから選択された少なくとも1つの画像記述スキームが格納されている。これら画像記述スキームについては、後で詳細に説明する。
【0028】
画像記述スキーム検索部105は、プログラム制御プロセッサ103から画像記述スキーム検索指令を受け取ると、指定された画像の種別に対応する記述スキームを画像記述スキーム記憶部106から検索する。読み出された画像記述スキームを元に、指定された画像より抽出できるビジュアル特徴量の種類が所定のフォームで表示部102に表示される(詳しくは後述する)。
【0029】
ビジュアル特徴量抽出部107は、ビジュアル特徴量抽出指令を受け取ると、画像データ記憶部110から指定された画像を入力し、その画像から指定されたビジュアル特徴量の抽出を行う。記述ファイル生成部108は、抽出されたビジュアル特徴量およびパラメータをビジュアル記述子により記述した記述ファイルを生成する。こうして生成された記述ファイルは記述ファイル記憶部109に格納され、画像検索等に利用される。
【0030】
画像記述スキーム
(1)矩形画像記述スキーム
ディジタル写真といった矩形画像の信号的特徴を記述する目的で矩形画像記述スキームを設計する。ディジタルフォトアーカイブなど、ディジタル画像アーカイブより類似する信号パターンを持つ画像を検索するのが主目的である。
【0031】
矩形画像より得られる信号的特徴は、1) 色分布、 2)色配置、 3) 色温度、 4) 照明条件補正色、 5) エッジ、および、 6)テクスチャの6グループに分類される。各グループに属するビジュアル特徴量は、以下のようにそれぞれ定められる。
【0032】
1) DominantColor / ScalableColor / ColorStructure
2) ColorLayout
3) ColorTemperature
4) IlluminationInvariantColor
5) EdgeHistogram
6) HomogeneousTexture / TextureBrowsing。
【0033】
各グループにおいて類似するビジュアル特徴量がある場合には、全てを併用するのは適切ではなく、目的に応じて1個あるいは複数個を選択できるようにするのが望ましい。色分布およびテクスチャを表す複数のビジュアル特徴量の使い分けを表3に例示する。
【0034】
【表3】
Figure 2004234612
色分布を表す3つの特徴量は、表3に示すように使い分けられる。すなわち、(1)限定色領域の正確な記述にはDominantColor、(2)広く使われている既存のカラーヒストグラムとの互換性が求められるアプリケーションなど汎用的製品にはScalableColor、(3)医用画像などコストより精度がとにかく求められる用途にはColorStructureがそれぞれ適している。したがって、これら用途に応じて、DominantColor、ScalableColorおよびColorStructure の少なくとも1つを選択できるように矩形画像記述スキームを設計する。
【0035】
テクスチャをあらわす2つの特徴量の使い分けは、模様のラフなブラウジングのみが必要である場合にはTexture Browsingが、より精度が求められる用途にはHomogeniousTextureが適している。したがって、HomogeniousTexture およびTextureBrowsing のうち少なくとも1つをテクスチャを表す特徴量として選択できるように矩形画像記述スキームを設計する。さらに、色分布、色配置、色温度、照明条件補正色、エッジ、テクスチャのうち、必要な信号的特徴を選択できるように矩形画像記述スキームを設計する。
【0036】
図2は、本実施形態における矩形画像記述スキームに含まれる記述ツールを示す模式図である。図2に示すように、矩形画像記述スキーム200は、動画像の特定フレームまたは矩形の静止画像の信号特徴量を定める。矩形画像記述スキーム200は、色分布記述201、色配置記述202、エッジ記述203、色温度記述204、照明条件補正色記述205、および、テクスチャ記述206を含む。
【0037】
図3は、XML(eXtensible Markup Language)による矩形画像記述スキームの例を示す図である。記述スキームは任意の言語で実行され、任意の含められた記述(もしくはそれよりも多くの記述)を含む。なお、図3において、element要素内の name属性で示された名称は任意であるが、typeで示されている記述子の特徴を表す名称が望ましい。
【0038】
(2)イメージクリップ記述スキーム
クリップアートといった任意形状を持つ画像の信号的特徴を記述する目的で、イメージクリップ記述スキームを設計する。コンテンツ制作に用いる素材のアーカイブなどより類似する信号パターンを持つクリップを検索するのが主目的である。
【0039】
矩形画像より得られる信号的特徴は全て任意形状画像に適応できる。任意形状画像より得られる信号的特徴は、矩形画像より得られる信号的特徴に加え、形状特徴を得ることができる。形状特徴を表すビジュアル特徴量には、ContourShapeおよびRegionShapeが存在するが、双方を併用するのは適切ではなく、目的に応じて少なくとも1つを選択できるようにする必要がある。矩形画像記述スキームに加えて、形状特徴を表す2つのビジュアル特徴量の使い分けを表4に示す。
【0040】
【表4】
Figure 2004234612
表4に示すように、閉曲線記述が可能でなおかつ強固な回転体性が必要な場合はContourShape、それ以外の一般的な用途ではRegionShapeが適している。したがって、ContourShapeおよびRegionShapeのうち少なくとも1つを形状を表す特徴量として選択できるようにイメージクリップ記述スキームを設計する。
【0041】
図4は本実施形態におけるイメージクリップ記述スキームに含まれる記述ツールを示す模式図である。イメージクリップ記述スキームは、任意形状を持つ画像の信号的特徴をを定める。図4に示すように、イメージクリップ記述スキーム300は、形状記述301と、矩形画像記述スキーム200に含まれる色分布記述201、色配置記述202、エッジ記述203、色温度記述204、照明条件補正色記述205およびテクスチャ記述206とを含む。これらのうち必要な信号的特徴を選択できるようにイメージクリップ画像記述スキームが設計される。
【0042】
図5は、XML(eXtensible Markup Language)によるイメージクリップ記述スキームの例を示す図である。記述スキームは任意の言語で実行され、任意の含められた記述(もしくはそれよりも多くの記述)を含む。なお、図5において、element要素内の name属性で示された名称は任意であるが、typeで示されている記述子の特徴を表す名称が望ましい。
【0043】
(3)ビデオシーケンス記述スキーム
動画像の信号的特徴を記述する目的でビデオシーケンス記述スキームを設計する。ビデオアーカイブより類似する信号パターンを持つビデオを検索するのが主目的である。
【0044】
動画像より得られる信号的特徴は、(1) 矩形画像に対する特徴量の時系列データ、(2)動画像に含まれる全てのフレームを代表する特徴量、(3)動き、の3グループに分類する。各グループに属するビジュアル特徴量を以下のように定めることができる。
【0045】
1) VisualTimeSeries
2) GofGopColor
3) MotionActivity。
【0046】
特徴量を付与する単位として、動画像に含まれるフレームに対する記述を行う場合には 時系列配列コンテナ(VisualTimeSeries)、動画像全体に対する記述を行う場合には 代表特徴量コンテナ(GofGopColor) を利用することができる。また双方を利用することもできる。好きな位置に特徴量記述子を割り付けることができる。
【0047】
コンテナはあるコンテンツの一部分を記述する特徴量記述子群をまとめて取り扱うための接着剤として働く。VisualTimeSeriesは時間軸上に並んだ特徴量記述子を一括して表記するもので、固定間隔に記述子を配置するRegular VisualTimeSeriesと、可変間隔に記述子を配置するIrregular VisualTimeSeriesの2種類があるが、各フレーム位置に特徴量記述子を割り付けることができる。また、GofGopColorは動画像全体に対して1つの特徴量記述子を割り付けることができる。
【0048】
ビデオシーケンス記述スキームに含まれる時系列データ、代表特徴量および動きより必要な信号的特徴を選択できるようにビデオシーケンス記述スキームを設計する。表5はビデオシーケンス記述スキームを表す。
【0049】
【表5】
Figure 2004234612
図6は本実施形態におけるビデオシーケンス記述スキームに含まれる記述ツールを示す模式図である。ビデオシーケンス記述スキームは、ビデオシーケンス(複数のフレームの集合)の信号的特徴を定める。ビデオシーケンス記述スキーム400は矩形画像に対する特徴量の時系列配列コンテナ401、動画像に含まれる全てのフレームを代表する特徴量コンテナ402および動きアクティビティ記述403を含む。
【0050】
図7は、XML(eXtensible Markup Language)によるビデオシーケンス記述スキームの例を示す図である。記述スキームは任意の言語で実行され、任意の含められた記述(もしくはそれよりも多くの記述)を含む。なお、図7において、element要素内の name属性で示された名称は任意であるが、typeで示されている記述子の特徴を表す名称が望ましい。
【0051】
(4)ビデオオブジェクト記述スキーム
MPEG−4におけるVideo Object のように、動画像中の任意形状領域や物体の信号的特徴を記述する目的でビデオオブジェクト記述スキームを設計する。コンテンツ制作に用いるビデオオブジェクトのアーカイブなどより類似する信号パターンを持つビデオオブジェクトを検索するのが主目的である。
【0052】
ビデオシーケンスより得られる信号的特徴は全てビデオオブジェクトに適応できる。任意形状画像より得られる信号的特徴は、矩形画像より得られる信号的特徴に加え、オブジェクトの動き情報や形状の時間変移を得ることができる。ビデオオブジェクトより得られる信号的特徴は、1) 物体動き情報、および、2)形状変化の2グループに分類する。各グループに属するビジュアル特徴量を以下のように定めることができる。
【0053】
1) MotionTrajectory / ParametricMotion
2) ShapeVariation
物体動き情報を表すビジュアル特徴量には、MotionTrajectoryおよびParametricMotionが存在するが、双方を併用するのは適切ではなく、目的に応じて少なくとも1つを選択できるようにする必要がある。これらビジュアル特徴量の使い分けを表6に示す。
【0054】
【表6】
Figure 2004234612
Parametric Motionは領域の全体的な動きをアフィン変換、透視変換など5種類の動きモデルで近似する。剛体近似できる物体の動き記述が目的である。
【0055】
Motion Trajectoryは領域の代表点(例えば重心)の時系列位置変化を表すもので、時間軸上のサンプリング点における位置とサンプリング点間の補間方法を記述する。人物の歩行軌跡などを表現することにより、例えば監視カメラ映像データベースで特定の行動をした人をピックアップするなどの用途が考えられる。
【0056】
したがって、MotionTrajectoryおよびParametricMotion のうちいずれか1つを形状を表す特徴量として選択できるようにビデオオブジェクト記述スキームを設計する。さらに、ビデオシーケンス記述スキームに含まれる時系列データ、代表特徴量、動き、より必要な信号的特徴を選択できるように動画像記述スキームを設計する。
【0057】
図8は本実施形態におけるビデオオブジェクト記述スキームに含まれる記述ツールを示す模式図である。ビデオオブジェクト記述スキーム500は、動画像中の任意形状領域や物体の信号的特徴を定める。ビデオオブジェクト記述スキーム500は、ビデオオブジェクトに対する物体動き記述501、形状変化記述502、および、矩形動画像(ビデオシーケンス)記述スキーム400に含まれる全てのフレームを代表する特徴量を含む。
【0058】
図9はXML(eXtensible Markup Language)によるビデオシーケンス記述スキームの例を示す図である。記述スキームは任意の言語で実行され、任意の含められた記述(もしくはそれよりも多くの記述)を含む。なお、図9において、element要素内の name属性で示された名称は任意であるが、typeで示されている記述子の特徴を表す名称が望ましい。
【0059】
ビジュアル特徴量選択画面の表示例
(1)矩形画像の場合
図10は、指定画像が矩形画像の場合のビジュアル特徴量選択画面の一例を示す図である。すでに述べたように、矩形画像記述スキーム200は、色分布記述201、色配置記述202、エッジ記述203、色温度記述204、照明条件補正色記述205、および、テクスチャ記述206を含む(図2参照)。本実施形態では、図3のXML記述例を実行することで、ユーザがこれらの記述ツールから必要な信号的特徴を選択できるように画面表示される。
【0060】
図10に示すように、色分布(Color Distribution)601、色配置(Spatial Distribution of Color)602、照明条件補正色(Illumination Independent Color)603、色温度(Color Temperature)604、エッジ分布(Spatial Distribution of Edges)605、および、模様(Homogeneous Pattern)606がマウス等のポインティングデバイスを用いて選択可能に表示される。
【0061】
すでに述べたように、色分布601については、DominantColor、ScalableColorおよびColorStructure のうち少なくとも1つを選択できる。また、模様606についてもHomogeniousTextureおよび TextureBrowsing のうち少なくとも1つを選択できるように表示される。また、ボタン607をマウス等によりクリックすることで、選択したビジュアル特徴量の抽出を開始することができる。
【0062】
このように矩形画像に適切な画像記述スキームを定義しておくことにより、矩形画像に適切な特徴量のみを選択・抽出できる画像記述システムを提供することができる。
【0063】
(2)任意形状画像の場合
図11は、指定画像が任意形状画像の場合のビジュアル特徴量選択画面の一例を示す図である。すでに述べたように、イメージクリップ記述スキーム300は、形状記述301、色分布記述201、色配置記述202、エッジ記述203、色温度記述204、照明条件補正色記述205、および、テクスチャ記述206を含む(図4参照)。本実施形態では、図5のXML記述例を実行することで、ユーザがこれらの記述ツールから必要な信号的特徴を選択できるように画面表示される。
【0064】
図11に示すように、色分布(Color Distribution)701、色配置(Spatial Distribution of Color)702、照明条件補正色(Illumination Independent Color)703、色温度(Color Temperature)704、エッジ分布(Spatial Distribution of Edges)705、模様(Homogeneous Pattern)706、および、形状(Shape)707がマウス等のポインティングデバイスを用いて選択可能に表示される。
【0065】
すでに述べたように、形状707については RegionShapeおよび ContourShape のうちいずれか1つのみ選択できる。また、色分布701については、DominantColor、ScalableColorおよびColorStructure のうち少なくとも1つを選択でき、模様706についてもHomogeniousTextureおよび TextureBrowsing のうち少なくとも1つを選択できるように表示される。
【0066】
所望の記述が選択されると、OKボタンをマウス等によりクリックすることで、選択したビジュアル特徴量の抽出を開始することができる。このように任意形状画像に適切なイメージクリップ記述スキームを定義しておくことにより、任意形状画像に適切な特徴量のみを選択・抽出できる画像記述システムを提供することができる。
【0067】
(3)ビデオシーケンスの場合
図12は、指定画像が矩形動画像の場合のビジュアル特徴量選択画面の一例を示す図である。すでに述べたように、ビデオシーケンス記述スキーム400は時系列配列コンテナ401、代表特徴量コンテナ402および動きアクティビティ記述403を含む(図6参照)。本実施形態では、図7のXML記述例を実行することで、ユーザがこれらの記述ツールから必要な信号的特徴を選択できるように画面表示される。
【0068】
図12に示すように、時系列配列(VisualTimeSeries)801に割り付ける矩形画像記述スキームに含まれるビジュアル特徴量、、代表特徴量 (GofGopColor)802に割り付ける矩形画像記述スキームに含まれるビジュアル特徴量、および、動きアクティビティ(MotionActivity)803がマウス等のポインティングデバイスを用いて選択可能に表示される。
【0069】
所望の記述が選択されると、OKボタンをマウス等によりクリックすることで、選択したビジュアル特徴量の抽出を開始することができる。このように矩形動画像に適切なビデオシーケンス記述スキームを定義しておくことにより、矩形動画像に適切な特徴量のみを選択・抽出できる画像記述システムを提供することができる。
【0070】
(4)ビデオオブジェクトの場合
図13は、指定画像が任意形状動画像の場合のビジュアル特徴量選択画面の一例を示す図である。すでに述べたように、ビデオオブジェクト記述スキーム500は、ビデオオブジェクトに対する物体動き記述501、形状変化記述502、および、矩形動画像(ビデオシーケンス)記述スキーム400に含まれる全てのフレームを代表する特徴量を含む(図8参照)。本実施形態では、図9のXML記述例を実行することで、ユーザがこれらの記述ツールから必要な信号的特徴を選択できるように画面表示される。
【0071】
図13に示すように、時系列配列(VisualTimeSeries)901に割り付ける矩形画像記述スキームに含まれるビジュアル特徴量、、代表特徴量 (GofGopColor)902に割り付ける矩形画像記述スキームに含まれるビジュアル特徴量、動きアクティビティ(MotionActivity)903、物体動き(Motion)904、および、形状変化(Shape Variation)905がマウス等のポインティングデバイスを用いて選択可能に表示される。
【0072】
すでに述べたように、物体動き904については MotionTrajectoryおよび ParameterMotion のうち少なくとも1つを選択できる。所望の記述が選択されると、OKボタンをマウス等によりクリックすることで、選択したビジュアル特徴量の抽出を開始することができる。このように任意形状動画像に適切なビデオオブジェクト記述スキームを定義しておくことにより、任意形状動画像に適切な特徴量を選択・抽出できる画像記述システムを提供することができる。
【0073】
画像記述動作
次に、本実施形態の全体的動作について詳細に説明する。
【0074】
図14は、本実施形態による画像記述動作を示すフローチャートである。まず、画像記述スキーム記憶部106には画像記述スキームが種別ごとに検索可能に格納されている。すなわち、図1に示すように、画像記述スキーム記憶部106に、矩形画像記述スキーム200、任意形状画像記述スキーム300、ビデオシーケンス記述スキーム400、および、ビデオオブジェクト記述スキーム500を記憶させ、また、ビジュアル特徴量を抽出する際に必要となるパラメータの設定を行う(ステップA1)。
【0075】
利用者は記述ファイルを生成する対象となる画像を入力部101から指定する(ステップA2)。記述する対象となる画像の指定は、画像ファイル名を直接入力してもよいし、あらかじめ一覧表示された画像からユーザが選択するようにしてもよい。
【0076】
指定された画像が特定されると、プログラム制御プロセッサ103は画像記述スキーム検索部105に当該希望画像の記述スキームの検索を指示する。画像記述スキーム検索部105は、指定された画像の種別をキーとして画像記述スキーム記憶部106を検索する。(ステップA3)。
【0077】
指定された画像の種別に対応する画像記述スキームが見つかると、画像記述スキーム検索部105はその画像記述スキームを読み出しプログラム制御プロセッサ103へ返す。プログラム制御プロセッサ103は、読み出された画像記述スキームより、指定された画像より抽出できる特徴量がどれであるのかを可視化し、表示部102に表示する(ステップA4)。
【0078】
具体的には、矩形画像が指定された場合には、読み出された矩形画像記述スキームを参照して、図10に示すように表示する(ステップA3.1)。任意形状画像が指定された場合には、読み出された任意形状画像記述スキームを参照して、図11に示すように表示する(ステップA3.2)。ビデオシーケンスが指定された場合には、読み出されたビデオシーケンス記述スキームを参照して、図12に示すように表示する(ステップA3.3)。ビデオオブジェクトが指定された場合には、読み出されたビデオオブジェクト記述スキームを参照して、図13に示すように表示する(ステップA3.4)。なお、これら表示は、入力部101からの指示により行うこともできる。
【0079】
利用者は表示部102に表示された抽出可能特徴量の一覧より、抽出する特徴量を入力部101から指定する(ステップA5)。指定された特徴量が特定されると、プログラム制御プロセッサ103はビジュアル特徴量抽出部107に当該希望特徴量の抽出を指示する。ビジュアル特徴量抽出部107は、画像データ記憶部110から指定された画像を読み込み、その画像から特定された特徴量を抽出する(ステップA6)。
【0080】
記述ファイル生成部108は、ビジュアル特徴量抽出部107より生成された特徴量およびパラメータをビジュアル記述子により記述し(ステップA7)、記述されたデータを記述ファイルとして生成する(ステップA8)。記述ファイルは記述ファイル記憶部109に格納されてもよい。
【0081】
上述したように、第1実施形態では、入力部101より画像が指定されると、画像記述スキーム検索部105が画像の種別に応じた画像記述スキームを検索し、指定された画像から抽出できるビジュアル特徴量を図10〜図13に例示するような形式で表示する。従って、抽出するビジュアル特徴量を利用者が容易に指定できる。また、サポートするツールの種類を必要最小限にすることができるために、システム構成を簡易にした画像記述システムを提供することができる。
【0082】
生成された記述ファイルは、ある特定の画像に対する記述ファイルに含まれる特徴量と他の画像に対する記述ファイルに含まれる特徴量の類似度を評価することにより、類似した画像を検索する類似画像検索などにも利用できる。したがって、適切な記述ファイルのみが類似画像検索等に利用されるために、検索の信頼性及び精度を向上させることができる。
【0083】
(第2実施形態)
図15は、本発明の第2実施形態による画像記述システムの構成を示すブロック図である。本発明の第2実施形態は、図1に示す第1実施形態に加えて、さらに記述ファイル検証部111を含む。
【0084】
記述ファイル検証部111は、画像記述スキーム検索部105で得られた画像記述スキームを読み込み、記述ファイル生成部108で生成された記述ファイルが正しいか否か検証する。具体的には、記述ファイルに記述されている特徴量の種類が、画像記述スキーム内で定義されており、かつ記述ファイルが画像記述スキームで規定された記述方法に従っているか否かを確認する。記述ファイルが画像記述スキームで規定された記述方法に従っている場合は、記述ファイルを出力する。
【0085】
上述したように、第2実施形態では、記述ファイル検証部111を設け、画像記述スキームと記述ファイルとを照らし合わせることにより、画像に対する記述ファイルの記述方式が適切であるか否かを検証できる。
【0086】
生成された記述ファイルは、ある特定の画像に対する記述ファイルに含まれる特徴量と他の画像に対する記述ファイルに含まれる特徴量の類似度を評価することにより、類似した画像を検索する類似画像検索などにも利用できる。したがって、適切な記述ファイルのみが類似画像検索等に利用されるために、検索の信頼性及び精度をさらに向上させることができる。
【0087】
(第3実施形態)
図16は、本発明の第3実施形態による画像記述システムの構成を示すブロック図である。
【0088】
本実施形態による画像記述システムは、図1に示す画像記述スキーム検索部105、ビジュアル特徴量抽出部107、記述ファイル生成部108および記述ファイル検証部111をプログラム制御プロセッサ120によりソフトウエア的に実装している。すなわち、プログラム制御プロセッサ120は、メモリに格納されている画像記述プログラム121を実行することで、第1および第2実施形態で説明したものと等価な画像記述機能を実現することができる。入力部101、表示部102、画像記述スキーム記憶部106、記述ファイル記憶部109および画像データ記憶部110は、画像記述プログラム121を実行しているプログラム制御プロセッサ120によって、第1および第2実施形態と同様に制御され、本発明による画像記述システムが実現される。
【0089】
(第4実施形態)
本発明の第4実施形態は、画像記述スキーム記憶部106に、静止画像を記述する静止領域記述スキーム、矩形フレームの集合を記述する矩形動画像記述スキーム、および、ビデオオブジェクトを記述するビデオオブジェクト記述スキームが格納されている点で図1に示す第1実施形態と異なる。なお、矩形動画像記述スキームおよびビデオオブジェクト記述スキームは、第1実施形態に使用されたものと同様である。
【0090】
静止画像( StillPicture )記述スキーム
あらゆる静止画像の信号的特徴を記述する目的で静止画像記述スキームを設計する。ディジタルフォトアーカイブなど、ディジタル画像アーカイブより類似する信号パターンを持つ画像を検索するのが主目的である。
【0091】
静止画像より得られる信号的特徴は、1) 色分布、 2)色配置、 3) 色温度、 4) 照明条件補正色、 5) エッジ、6)テクスチャ、および、7)形状、のグループに分類される。各グループに属するビジュアル特徴量は、以下のようにそれぞれ定められる。
【0092】
1) DominantColor / ScalableColor / ColorStructure
2) ColorLayout
3) ColorTemperature
4) IlluminationInvariantColor
5) EdgeHistogram
6) HomogeneousTexture / TextureBrowsing
7) ContourShape / RegionShape。
【0093】
色分布、テクスチャ、形状のグループにおける類似するビジュアル特徴量については、全てを併用するのは適切ではなく、目的に応じて1個あるいは複数個を選択できるようにする必要がある。ビジュアル特徴量の内容、使い分け方法については、第1実施形態で述べたものと同一であるからここでは省略する(たとえば、表3および表4を参照)。
【0094】
図17は、XML(eXtensible Markup Language)による静止領域記述スキームの例を示す図である。記述スキームは任意の言語で実行され、任意の含められた記述(もしくはそれよりも多くの記述)を含む。なお、図17において、element要素内の name属性で示された名称は任意であるが、typeで示されている記述子の特徴を表す名称が望ましい。
【0095】
記述スキームの数を第1実施形態に比べて減らすことにより、システム構成を簡易にした画像記述システムを提供することができる。
【0096】
(第5実施形態)
本発明の第5実施形態は、画像記述スキーム記憶部106に、静止画像を記述する静止領域記述スキーム、動画像を記述する動画像記述スキームが格納されている点で第1実施形態と異なる。ただし、静止領域記述スキームは、上述した第4実施形態に記載のものと同様である。
【0097】
動画像記述スキーム
動画像の信号的特徴を記述する目的で動画像記述スキームを設計する。動画像より得られる信号的特徴は、(1) 矩形画像に対する特徴量の時系列データ、(2)動画像に含まれる全てのフレームを代表する特徴量、(3)動きアクティビティ、(4) 物体動き情報、および、(5)形状変化の5グループに分類する。各グループに属するビジュアル特徴量を以下のように定めることができる。
【0098】
1) VisualTimeSeries
2) GofGopColor
3) MotionActivity
4) MotionTrajectory / ParametricMotion
5) ShapeVariation。
【0099】
なお、ビジュアル特徴量の内容、使い分け方法については、第1実施形態で述べたものと同一であるからここでは省略する(たとえば、表6参照)。
【0100】
図18は、XML(eXtensible Markup Language)による動画像記述スキームの例を示す図である。記述スキームは任意の言語で実行され、任意の含められた記述(もしくはそれよりも多くの記述)を含む。なお、図18において、element要素内の name属性で示された名称は任意であるが、typeで示されている記述子の特徴を表す名称が望ましい。
【0101】
記述スキームの数を第1実施形態に比べて減らすことにより、システム構成を簡易にした画像記述システムを提供することができる。
【0102】
【発明の効果】
以上詳細に説明したように、本発明によれば、入力部より画像が指定されると、画像の種別に応じた画像記述スキームが取り出され、抽出可能な適切なビジュアル特徴量が表示される。このために、有意義なビジュアル特徴量の選択が容易となり、かつ、指定画像を的確に表現したビジュアル特徴量を抽出がすることができる。このために画像検索の効率及び精度を向上させることができる。
【0103】
また、画像の種別ごとに記述スキームを定義しておくことによりサポートするべき特徴量抽出、および記述ツールの種類を必要最小限にすることができ、システム構成を簡易にした画像記述システムを提供することができる。
【0104】
さらに、以上のようにして生成された記述ファイルを画像記述スキームと照らし合わせることにより、画像に対する記述ファイルの記述方式が適切であるか否かを検証でき、画像検索の効率及び精度をさらに向上させることができる。
【図面の簡単な説明】
【図1】本発明の第1実施形態による画像記述システムの構成を示すブロック図である。
【図2】本実施形態における矩形画像記述スキームに含まれる記述ツールを示す模式図である。
【図3】XML(eXtensible Markup Language)による矩形画像記述スキームの例を示す図である。
【図4】本実施形態におけるイメージクリップ記述スキームに含まれる記述ツールを示す模式図である。
【図5】XML(eXtensible Markup Language)によるイメージクリップ記述スキームの例を示す図である。
【図6】本実施形態におけるビデオシーケンス記述スキームに含まれる記述ツールを示す模式図である。
【図7】XML(eXtensible Markup Language)によるビデオシーケンス記述スキームの例を示す図である。
【図8】本実施形態におけるビデオオブジェクト記述スキームに含まれる記述ツールを示す模式図である。
【図9】XML(eXtensible Markup Language)によるビデオオブジェクト記述スキームの例を示す図である。
【図10】指定画像が矩形画像の場合のビジュアル特徴量選択画面の一例を示す図である。
【図11】指定画像が任意形状画像の場合のビジュアル特徴量選択画面の一例を示す図である。
【図12】指定画像が矩形動画像の場合のビジュアル特徴量選択画面の一例を示す図である。
【図13】指定画像が任意形状動画像の場合のビジュアル特徴量選択画面の一例を示す図である。
【図14】本実施形態による画像記述動作を示すフローチャートである。
【図15】本発明の第2実施形態による画像記述システムの構成を示すブロック図である。
【図16】本発明の第3実施形態による画像記述システムの構成を示すブロック図である。
【図17】XML(eXtensible Markup Language)による静止領域記述スキームの例を示す図である。
【図18】XML(eXtensible Markup Language)による動画像記述スキームの例を示す図である。
【符号の説明】
101 入力部
102 表示部
103 プログラム制御プロセッサ
104 制御プログラム
105 画像記述スキーム検索部
106 画像記述スキーム記憶部
107 ビジュアル特徴量抽出部
108 記述ファイル生成部
109 記述ファイル記憶部
110 画像データ記憶部
111 記述ファイル検証部
121 画像記述プログラム

Claims (34)

  1. 画像の信号特徴量を記述する画像記述システムにおいて、
    画像の種別ごとに定義された記述スキームを格納する格納手段と、
    画像が指定されると、前記格納手段から当該指定画像の種別に対応する記述スキームを参照し、前記指定画像から抽出することができる特徴量を特定する制御手段と、
    を有することを特徴とする画像記述システム。
  2. 前記指定画像から前記特定された特徴量に関するデータを抽出し、前記指定画像の記述ファイルを生成する記述ファイル生成手段をさらに有することを特徴とする請求項1記載の画像記述システム。
  3. 前記制御手段は、前記特定された特徴量を選択可能に前記表示部に表示することを特徴とする請求項1記載の画像記述システム。
  4. 前記指定画像から前記特定された特徴量のうち選択された特徴量に関するデータを抽出し、前記指定画像の記述ファイルを生成する記述ファイル生成手段をさらに有ることを特徴とする請求項3記載の画像記述システム。
  5. 前記指定画像の種別に対応する記述スキームを用いて前記記述ファイル生成手段により生成された記述ファイルを検証する記述ファイル検証手段をさらに有することを特徴とする請求項2または4に記載の画像記述システム。
  6. 前記格納手段は、矩形画像を記述する矩形画像記述スキーム、任意形状画像を記述する任意形状画像記述スキーム、矩形フレームの集合である動画像を記述する矩形動画像記述スキーム、および、矩形フレームの集合である動画像内の任意形状の対象を記述するビデオオブジェクト記述スキームのうち少なくとも1つを格納することを特徴とする請求項1記載の画像記述システム。
  7. 前記矩形画像記述スキームは、色分布、色配置、色温度、照明条件補正色、エッジ分布、および、テクスチャを少なくとも含む複数の特徴量のうち1つ以上の特徴量を有することを特徴とする請求項6記載の画像記述システム。
  8. 前記1つ以上の特徴量の各々は少なくとも1つの選択可能な記述子からなり、
    前記色分布特徴量は、DominantColor、ScalableColorおよびColorStructure を少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能であり、
    前記テクスチャ特徴量は、HomogeneousTexture および TextureBrowsingを少なくとも含む複数の記述子からなり、このうち少なくとも1つを選択可能である、
    ことを特徴とする請求項7記載の画像記述システム。
  9. 前記任意形状画像記述スキームは、色分布、色配置、色温度、照明条件補正色、エッジ分布、テクスチャ、および、形状を少なくとも含む複数の特徴量のうち1つ以上の特徴量を有することを特徴とする請求項6記載の画像記述システム。
  10. 前記1つ以上の特徴量の各々は少なくとも1つの選択可能な記述子からなり、
    前記形状特徴量は、ContourShapeおよびRegionShapeを少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択されることを特徴とする請求項9記載の画像記述システム。
  11. 前記矩形動画像記述スキームは、前記矩形フレームの時系列データ、代表特徴量および動きアクティビティを少なくとも含む複数の特徴量のうち1つ以上の特徴量を含むことを特徴とする請求項6記載の画像記述システム。
  12. 前記1つ以上の特徴量の各々は少なくとも1つの選択可能な記述子からなり、
    前記時系列データは、色分布、色配置、色温度、照明条件補正色、エッジ分布、および、テクスチャを少なくとも含む複数の特徴量のうち1つ以上の特徴量を有し、各特徴量は少なくとも1つの選択可能な記述子からなり、
    前記色分布特徴量は、DominantColor、ScalableColorおよびColorStructure を少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能であり、
    前記テクスチャは、HomogeneousTexture および TextureBrowsingを少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能である、
    ことを特徴とする請求項11記載の画像記述システム。
  13. 前記代表特徴量は、色分布、色配置、色温度、照明条件補正色、エッジ分布、および、テクスチャを少なくとも含む複数の特徴量のうち1つ以上の特徴量を有し、各特徴量は少なくとも1つの選択可能な記述子からなり、
    前記色分布特徴量は、DominantColor、ScalableColorおよびColorStructure を少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能であり、
    前記テクスチャは、HomogeneousTexture および TextureBrowsingを少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能である、
    ことを特徴とする請求項11記載の画像記述システム。
  14. 前記ビデオオブジェクト記述スキームは、前記矩形フレームの時系列データ、代表特徴量、動きアクティビティ、物体動き、および、形状変化を少なくとも含む複数の特徴量のうち1つ以上の特徴量を有することを特徴とする請求項6記載の画像記述システム。
  15. 前記1つ以上の特徴量の各々は少なくとも1つの選択可能な記述子からなり、前記物体動きは、MotionTrajectoryおよび ParameterMotionを少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能であることを特徴とする請求項14記載の画像記述システム。
  16. 前記時系列データは、色分布、色配置、色温度、照明条件補正色、エッジ分布、および、テクスチャを少なくとも含む複数の特徴量のうち1つ以上の特徴量を有し、各特徴量は少なくとも1つの選択可能な記述子からなり、
    前記色分布特徴量は、DominantColor、ScalableColorおよびColorStructure を少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能であり、
    前記テクスチャは、HomogeneousTexture および TextureBrowsingを少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能である、
    ことを特徴とする請求項14記載の画像記述システム。
  17. 前記代表特徴量は、色分布、色配置、色温度、照明条件補正色、エッジ分布、および、テクスチャを少なくとも含む複数の特徴量のうち1つ以上の特徴量を有し、各特徴量は少なくとも1つの選択可能な記述子からなる、
    前記色分布特徴量は、DominantColor、ScalableColorおよびColorStructure を少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能であり、
    前記テクスチャは、HomogeneousTexture および TextureBrowsingを少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能である、
    ことを特徴とする請求項14記載の画像記述システム。
  18. 画像の信号特徴量を記述する画像記述方法において、
    画像の種別ごとに定義された記述スキームを格納し、
    画像が指定されると、当該指定画像の種別に対応する記述スキームを検索して前記指定画像から抽出することができる特徴量を特定し、
    前記指定画像から抽出することができる特徴量を選択可能に表示する、
    ことを特徴とする画像記述方法。
  19. さらに、
    前記表示された特徴量から所望の特徴量を選択し、
    前記所望の特徴量に従って前記指定画像から特徴量を抽出して記述ファイルを生成する、
    ことを特徴とする請求項18記載の画像記述方法。
  20. さらに、
    前記指定画像の種別に対応する記述スキームを用いて前記生成された記述ファイルを検証する、
    ことを特徴とする請求項19記載の画像記述方法。
  21. コンピュータに、画像の信号特徴量を記述する画像記述処理を実行させるためのプログラムにおいて、
    画像が指定されると、画像の種別ごとに定義された記述スキームを格納した記憶部から当該指定画像の種別に対応する記述スキームを検索するステップと、
    検索された記述スキームに基づいて前記指定画像から抽出することができる特徴量を特定するステップと、
    前記指定画像から抽出することができる特徴量を選択可能に表示するステップと、
    を有することを特徴とする画像記述プログラム。
  22. さらに、
    前記表示された特徴量から所望の特徴量が選択されると、前記所望の特徴量に従って前記指定画像から特徴量を抽出して記述ファイルを生成するステップ
    を有することを特徴とする請求項21記載の画像記述プログラム。
  23. さらに、
    前記指定画像の種別に対応する記述スキームを用いて前記生成された記述ファイルを検証するステップ
    を有することを特徴とする請求項22記載の画像記述プログラム。
  24. 前記格納手段は、静止画像の特徴量を記述する静止画像記述スキーム、矩形フレームの集合である動画像を記述する矩形動画像記述スキーム、および、矩形フレームの集合である動画像内の任意形状の対象を記述するビデオオブジェクト記述スキームのうち少なくとも1つを格納することを特徴とする請求項1記載の画像記述システム。
  25. 前記静止画像記述スキームは、色分布特徴量、色配置特徴量、色温度特徴量、照明条件補正色特徴量、エッジ分布特徴量、および、テクスチャ特徴量を少なくとも含む複数の特徴量のうち1つ以上の特徴量を有することを特徴とする請求項24記載の画像記述システム。
  26. 前記1つ以上の特徴量の各々は少なくとも1つの選択可能な記述子からなり、
    前記色分布特徴量は、DominantColor、ScalableColorおよびColorStructure を少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能であり、
    前記色配置特徴量は、ColorLayout を少なくとも含む記述子からなり、このうち少なくとも1つが選択可能であり、
    前記色温度特徴量は、ColorTemperature を少なくとも含む記述子からなり、このうち少なくとも1つが選択可能であり、
    前記照明条件補正色特徴量は、IlluminationInvariantColor を少なくとも含む記述子からなり、このうち少なくとも1つが選択可能であり、
    前記エッジ分布特徴量は、EdgeHistogram を少なくとも含む記述子からなり、このうち少なくとも1つが選択可能であり、
    前記テクスチャ特徴量は、HomogeneousTexture および TextureBrowsingを少なくとも含む複数の記述子からなり、このうち少なくとも1つを選択可能である、
    ことを特徴とする請求項25記載の画像記述システム。
  27. 前記静止画像記述スキームは、さらに、形状特徴量を含み、
    前記形状特徴量は、RegionShape および ContourShape を少なくとも含む複数の記述子からなり、このうち少なくとも1つを選択可能であることを特徴とする請求項25記載の画像記述システム。
  28. 前記格納手段は、静止画像の特徴量を記述する静止画像記述スキームおよび動画像を記述する動画像記述スキームのうち少なくとも1つを格納することを特徴とする請求項1記載の画像記述システム。
  29. 前記動画像記述スキームは、前記動画像のフレームの時系列データ、前記動画像の代表特徴量、および、前記動画像の動きアクティビティを少なくとも含む複数の特徴量のうち1つ以上の特徴量を有し、各特徴量は少なくとも1つの記述子を選択可能に含むことを特徴とする請求項28記載の画像記述システム。
  30. 前記動画像記述スキームは、さらに、前記動画像の動き記述および前記動画像の形状変化記述を含むことを特徴とする請求項29記載の画像記述システム。
  31. 指定された画像の種別に対応する記述スキームを参照して前記指定画像から抽出することができる特徴量を特定する画像記述システムにおいて用いられる記述スキームにおいて、
    色分布特徴量、色配置特徴量、色温度特徴量、照明条件補正色特徴量、エッジ分布特徴量、および、テクスチャ特徴量を少なくとも含む複数の特徴量のうち1つ以上の特徴量を有し、
    前記色分布特徴量は、DominantColor、ScalableColorおよびColorStructure を少なくとも含む複数の記述子からなり、このうち少なくとも1つが選択可能であり、
    前記色配置特徴量は、ColorLayout を少なくとも含む記述子からなり、このうち少なくとも1つが選択可能であり、
    前記色温度特徴量は、ColorTemperature を少なくとも含む記述子からなり、このうち少なくとも1つが選択可能であり、
    前記照明条件補正色特徴量は、IlluminationInvariantColor を少なくとも含む記述子からなり、このうち少なくとも1つが選択可能であり、
    前記エッジ分布特徴量は、EdgeHistogram を少なくとも含む記述子からなり、このうち少なくとも1つが選択可能であり、
    前記テクスチャ特徴量は、HomogeneousTexture および TextureBrowsingを少なくとも含む複数の記述子からなり、このうち少なくとも1つを選択可能である、
    ことを特徴とする記述スキーム。
  32. 前記記述スキームは、さらに、形状特徴量を含み、
    前記形状特徴量は、RegionShape および ContourShape を少なくとも含む複数の記述子からなり、このうち少なくとも1つを選択可能であることを特徴とする請求項31記載の記述スキーム。
  33. 指定された画像の種別に対応する記述スキームを参照して前記指定画像から抽出することができる特徴量を特定する画像記述システムにおいて用いられる記述スキームにおいて、
    動画像のフレームの時系列データ、前記動画像の代表特徴量、および、前記動画像の動きアクティビティを少なくとも含む複数の特徴量のうち1つ以上の特徴量を有し、各特徴量は少なくとも1つの記述子を選択可能に含むことを特徴とする請求項28記載の画像記述システム。
  34. 前記動画像記述スキームは、さらに、前記動画像の動き記述および前記動画像の形状変化記述を含むことを特徴とする請求項29記載の画像記述システム。
JP2003066399A 2002-12-06 2003-03-12 画像記述システムおよび方法 Expired - Fee Related JP4336813B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2003066399A JP4336813B2 (ja) 2002-12-06 2003-03-12 画像記述システムおよび方法
US10/506,091 US20060023946A1 (en) 2002-12-06 2003-12-05 Image description system and method thereof
EP03777276A EP1569448A4 (en) 2002-12-06 2003-12-05 IMAGE DESCRIPTION SYSTEM AND ASSOCIATED METHOD
PCT/JP2003/015574 WO2004054253A1 (ja) 2002-12-06 2003-12-05 画像記述システムおよびその方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002355268 2002-12-06
JP2003066399A JP4336813B2 (ja) 2002-12-06 2003-03-12 画像記述システムおよび方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008275304A Division JP4692784B2 (ja) 2002-12-06 2008-10-27 画像記述システムにおける特徴量選択プログラム、特徴量選択方法および装置

Publications (2)

Publication Number Publication Date
JP2004234612A true JP2004234612A (ja) 2004-08-19
JP4336813B2 JP4336813B2 (ja) 2009-09-30

Family

ID=32510603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003066399A Expired - Fee Related JP4336813B2 (ja) 2002-12-06 2003-03-12 画像記述システムおよび方法

Country Status (4)

Country Link
US (1) US20060023946A1 (ja)
EP (1) EP1569448A4 (ja)
JP (1) JP4336813B2 (ja)
WO (1) WO2004054253A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
KR20080006399A (ko) * 2006-07-12 2008-01-16 삼성전자주식회사 디바이스의 상세정보를 제공하는 호스트 단말기, 그의디바이스 상세정보 제공방법 및 호스트 단말기로부터상세정보를 제공받는 디바이스
JP4849339B2 (ja) * 2007-03-30 2012-01-11 ソニー株式会社 情報処理装置および方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5085746A (en) * 1990-09-10 1992-02-04 North Carolina State University Method of fabricating scanning tunneling microscope tips
JP3780623B2 (ja) * 1997-05-16 2006-05-31 株式会社日立製作所 動画像の記述方法
EP2199973A3 (en) * 1997-06-09 2010-09-08 Seiko Epson Corporation An image processing apparatus and method, and an image evaluation device and method
US6052492A (en) * 1997-12-09 2000-04-18 Sun Microsystems, Inc. System and method for automatically generating an image to represent a video sequence
JP3615657B2 (ja) * 1998-05-27 2005-02-02 株式会社日立製作所 映像検索方法及び装置ならびに記録媒体
KR100305591B1 (ko) * 1998-07-22 2001-11-30 오길록 관절점기반동작정보를사용한동영상검색방법
US6389181B2 (en) * 1998-11-25 2002-05-14 Eastman Kodak Company Photocollage generation and modification using image recognition
US6396963B2 (en) * 1998-12-29 2002-05-28 Eastman Kodak Company Photocollage generation and modification
JP3619426B2 (ja) * 1999-06-10 2005-02-09 松下電器産業株式会社 光ディスク再生装置、及び光ディスク再生方法
JP3738631B2 (ja) * 1999-09-27 2006-01-25 三菱電機株式会社 画像検索システムおよび画像検索方法
CN100409234C (zh) * 2000-03-23 2008-08-06 三菱电机株式会社 图像检索配送系统和图像检索配送方法
JP4491902B2 (ja) * 2000-04-04 2010-06-30 ソニー株式会社 摺動型グラフックウィンドウを用いたメディアコンテンツとのインターラクティブシステム
JP3810268B2 (ja) * 2000-04-07 2006-08-16 シャープ株式会社 オーディオビジュアルシステム
JP2001333389A (ja) * 2000-05-17 2001-11-30 Mitsubishi Electric Research Laboratories Inc ビデオ再生システムおよびビデオ信号処理方法
JP3784289B2 (ja) * 2000-09-12 2006-06-07 松下電器産業株式会社 メディア編集方法及びその装置
US8020183B2 (en) * 2000-09-14 2011-09-13 Sharp Laboratories Of America, Inc. Audiovisual management system
US7062084B2 (en) * 2000-12-01 2006-06-13 Sharp Laboratories Of America, Inc. Method for image description using color and local spatial information
JP4889159B2 (ja) * 2001-05-14 2012-03-07 富士通株式会社 データ検索システムおよびデータ検索方法
JP2004234613A (ja) * 2002-12-02 2004-08-19 Nec Corp 映像記述システムおよび方法、映像識別システムおよび方法

Also Published As

Publication number Publication date
US20060023946A1 (en) 2006-02-02
WO2004054253A1 (ja) 2004-06-24
EP1569448A1 (en) 2005-08-31
EP1569448A4 (en) 2010-04-21
JP4336813B2 (ja) 2009-09-30

Similar Documents

Publication Publication Date Title
JP5934653B2 (ja) 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置
US7716157B1 (en) Searching images with extracted objects
US9665960B1 (en) Image-based item location identification
Marques et al. Content-based image and video retrieval
JP5503046B2 (ja) 形状に基づく画像検索
US8724908B2 (en) System and method for labeling a collection of images
JP4902499B2 (ja) 画像表示装置、画像表示方法、および画像表示システム
JP4413844B2 (ja) 画像表示制御装置
US20090150376A1 (en) Mutual-Rank Similarity-Space for Navigating, Visualising and Clustering in Image Databases
US8731308B2 (en) Interactive image selection method
US20180089228A1 (en) Interactive image selection method
EP2168064A1 (en) System and method of saving digital content classified by person-based clustering
JP4948607B2 (ja) 画像検索装置、画像分類装置及び方法並びにプログラム
Bobier et al. Content-based image retrieval using hierarchical temporal memory
US9613059B2 (en) System and method for using an image to provide search results
JP4692784B2 (ja) 画像記述システムにおける特徴量選択プログラム、特徴量選択方法および装置
JP4336813B2 (ja) 画像記述システムおよび方法
JP2010073194A (ja) 画像処理装置、画像処理方法およびプログラム
US20180189602A1 (en) Method of and system for determining and selecting media representing event diversity
JP2006221509A (ja) 設計情報管理装置、設計情報管理方法及び設計情報管理プログラム
US20040086203A1 (en) Database registration system and database registration method
JP2011145796A (ja) 検索キー情報生成支援装置及び検索キー情報生成支援プログラム
Cavalcanti et al. A survey on automatic techniques for enhancement and analysis of digital photography
JP2003022445A (ja) 情報検索装置,情報検索方法並びにこの方法を実施するためのコンピュータプログラム及びこのプログラムを記録した媒体
Schaefer et al. Intuitive image database browsing to support image annotation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080826

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090527

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090609

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120710

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120710

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130710

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees