JP2008217701A - メタデータ付与装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体 - Google Patents

メタデータ付与装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP2008217701A
JP2008217701A JP2007057702A JP2007057702A JP2008217701A JP 2008217701 A JP2008217701 A JP 2008217701A JP 2007057702 A JP2007057702 A JP 2007057702A JP 2007057702 A JP2007057702 A JP 2007057702A JP 2008217701 A JP2008217701 A JP 2008217701A
Authority
JP
Japan
Prior art keywords
image
metadata
keyword
unit
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007057702A
Other languages
English (en)
Inventor
Tomoaki Yamamoto
智昭 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2007057702A priority Critical patent/JP2008217701A/ja
Publication of JP2008217701A publication Critical patent/JP2008217701A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】分類対象が動画像である場合に対しても適用可能なメタデータ付与装置とメタデータ付与方法を提供する。
【解決手段】入力映像Iinのフレーム画像Ifの画像特徴ベクトルFv_QUERYが画像データベース検索部320に読み込まれると、画像データベース検索部320は、類似した画像特徴ベクトルfviを画像データベース200から抽出し、その画像ベクトルfviに関連付けられているキーワードkwを、その画像特徴ベクトルFv_QUERYで表されるフレーム画像Ifの内容や特徴を説明する情報として決定する。メタデータ付与部330のメタデータ書込部332は、映像データバッファ340中のメタデータ格納部342に記憶されている対応するメタデータを、この決定した決定するキーワードkwに基づいて更新する。
【選択図】 図1

Description

本発明は、画像、特に動画像等を含む入力映像に対し、自動的にその映像自身の内容や特徴を説明する情報を取得し、メタデータとして付与するメタデータ作成装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体に関する。
通信技術及び情報処理技術の進歩により、通信及び情報処理における画像データの利用が、近年、飛躍的に拡大している。この結果、ウェブ(Web:World Wide Web)上でやり取りされる画像データには、ウェブ上の大量の画像データの中から所望の画像データの検索及び選択を容易にするために、その画像データ自身の内容や特徴を説明する情報が画像データ自体のメタデータとして付与されているようになっている。
画像データの自身の内容や特徴を説明する情報を含むメタデータは、様々なアプリケーションでの画像データの利用を考慮した場合、理想的には、当該メタデータが付加された画像データを多角的な視点から捉えた、精度の高い、豊富なシーケンシャルデータであることが望ましい。
通常、画像データにメタデータとして付加される、その画像データ自身の内容や特徴を説明する情報は、画像データの作成者側が、予めその画像データの用途を想定して、人手により付与する方法が一般的であった。しかしながら、大量の既存の画像データに対して、ユーザが個別に想定し得る様々な観点で、検索対象又は提供対象の画像データについて、内容や特徴を説明する情報を人手により付与することは、その作業量を考えた場合、実現が困難であった。
そこで、画像データ自身の内容や特徴を説明する情報を画像データのメタデータに自動的に付与する方法として、従来、次に述べるような第1及び第2の自動付与方法が提案されている。
第1の自動付与方法は、例えば非特許文献1に記載されているように、入力された画像データ自体の画像認識によって、又はこの画像データに付随する音声データの音響処理もしくは自然言語処理によって、入力された画像データ自体からその内容や特徴を説明する情報を抽出して、この抽出した情報を画像データのメタデータとして自動付与する方法である。
また、第2の自動付与方法は、例えば非特許文献2に記載されているように、ウェブから知識を獲得し、その獲得知識を実世界の画像の分類や自動キーワード付与等に利用又は応用して、実世界の画像の自動分類を行う方法である。
そして、この2つの従来技術を比較した場合、第1の方法では、メタデータとして付与する画像データ自身の内容や特徴を説明する情報の抽出対象が、メタデータの付与対象であり、分類対象でもある、入力された画像データ自体又はその付随する音声データに限定されてしまうのに対して、第2の方法では、その抽出対象がウェブ上に存在する多様なメタデータの付与された画像データである、という違いがある。そのため、この第2の方法によれば、第1の方法に比べて、メタデータを利用した抽出対象の画像データの数と種類が多くなることによって、観点,認識の推移等にも柔軟に対応でき、画像データ自身の内容や特徴を説明する情報が取得できる、というメリットがある。
このような「ウェブから知識を獲得し、その獲得知識を利用又は応用して、実世界の画像の自動分類を行う」という、従来の第2の方法について、図31乃至図33に基づいて、具体的に説明する。
図32は、上述した従来の第2の方法を用いたメタデータ付与システムの構成図である。
図33は、図32に示したメタデータ付与システムの、画像データに対してのメタデータ付与処理のフローチャートである。
図34は、図32に示したメタデータ付与システムの、動画像をも含んだ映像データに対してのメタデータ付与処理のフローチャートである。
なお、以下の説明では、単に‘画像データ’と称する場合は、この‘画像データ’中には動画像を含まないものとし、特に動画像をも含む場合については‘映像データ’と称し、両者を区別する。
図32に示すように、第2の方法を用いたメタデータ付与システム900は、WWW(World Wide Web)画像収集システム910,データベース920,画像分類システム930,及び動画像メタデータ付与装置940を備えて構成されている。
図33に示すように、ユーザは、まず、予めWWW画像収集システム910に対して、画像分類システム930に未知画像が入力された際に備えて、この未知画像に関して分類したい分類クラスを表すキーワード(単語)を入力しておく(ステップS9010)。これにより、WWW画像収集システム910は、WWW950から、この入力したキーワードがメタデータとして付与されている画像データを収集する(ステップS9020)。そして、この収集結果として得られたWWW910からの画像データは、この入力したキーワードそれぞれで表した分類クラス毎に、データベース920に保存される (ステップS9030)。
一方、画像分類システム930は、分類したい未知画像(静止画)がテスト画像として入力されると(ステップS9040)、このテスト画像の視覚的特徴を表す画像特徴ベクトルを用いて、テスト画像に係る類似画像の検索を、データベース920に対して行う。画像分類システム930は、このテスト画像に係る類似画像の検索結果を基に、検索された類似画像の中、最も類似度の高い画像が所属している分類クラスを、入力されたテスト画像の分類クラスとして決定するようになっている(ステップS9050)。
そして、この従来の第2の方法を用いたメタデータ付与システム900を利用すれば、動画像に対してメタデータを付与することも可能となる。この場合は、図34に示すように、画像分類システム930に対して動画像メタデータ付与装置940は作動するようになる。
図34に示すように、この動画像メタデータ付与装置940に、分類したい未知映像(動画像)が入力されると(ステップS9042)、動画像メタデータ付与装置940は、動画像の連続したコマをそれぞれが形成するフレーム画像を取得し(ステップS9044)、この取得したフレーム画像それぞれをテスト画像として画像分類システム930に入力する(ステップS9046)。これにより、画像分類システム930は、動画像メタデータ付与装置940から未知映像(動画像)のフレーム画像がテスト画像として入力される度に、図33により説明した静止画の場合のステップS9050に示した処理と同様にして、フレーム画像の画像特徴ベクトルを用いて、このフレーム画像に係る類似画像の検索をデータベース920に対して行い、この検索結果に基づいてフレーム画像の分類クラス(キーワードkw)を決定、取得する(ステップS9052)。そして、この画像分類システム930によって取得されたフレーム画像の分類クラスは、動画像からなる入力映像の当該フレーム画像に係るメタデータとして、動画像メタデータ付与装置940に供給され、動画像メタデータ付与装置940は、入力された動画像の対応するフレーム画像のメタデータにこの取得した分類クラスを付与する(ステップS9054)。そして、画像分類システム930は、入力映像としての分類したい未知映像(動画像)が終了するまで(ステップS9056)、この未知映像(動画像)のフレーム画像それぞれをテスト画像(分類したい未知画像)とした、フレーム画像それぞれに係る分類クラスの決定、取得を繰り返し行うことで、入力映像が未知映像(動画像)である場合であっても、分類クラスに係るメタデータの自動付与が実現できるようになっている。
NHK技研 R&D No.95 2006 一般画像自動分類の実現へ向けたWorld Wide Webからの画像知識の獲得:人口知能学会論文誌 19巻5号I(2004)
しかしながら、上述の「ウェブから知識を獲得し、その獲得知識を利用又は応用して、実世界の画像の自動分類を行う」という第2の方法では、入力映像の分類クラスを決定する際に用いるキーワードは、ユーザによって予め入力された、分類したいクラスを表す単語(分類基準キーワード)を基にしたものである。そして、この分類クラスを決定する際に用いる分類クラスを表す単語自体は、ユーザが、分類クラスをメタデータとして付与する分類対象の入力映像の用途等を考慮しながらその映像データ自身の内容や特徴を解釈し、分類基準キーワードの選定者の視点で決定する。この結果、自身の内容や特徴を説明する情報がメタデータとして付加された映像データについての様々なアプリケーションでの利用を考えた場合、多角的な視点の関係から、上述した従来技術の第2の方法は次のような問題点があった。
すなわち、
1.画像自身の内容や特徴を説明する情報のメタデータは、分類対象(キーワード付与対象)の画像と同じ分類クラスに属する類似画像にメタデータとして付与されているキーワードから選択されるが、そのメタデータすなわち類似画像の選択範囲が、ユーザが入力した分類基準キーワードという分類クラスの「枠」の範囲内の母集団に限定されるため、分類対象の映像データにメタデータとして付与される、映像データ自身の内容や特徴を説明する情報に、偏りが生じる可能性がある、
2.分類クラス選択用の分類基準キーワードは、分類基準キーワードの選定者としてのユーザ自身の視点を基に選定されるため、分類基準キーワードの選定者でもあるユーザ自身の選定視点に偏りが生じている場合には、この偏りに起因して、メタデータ付与システムは、分類対象の映像データに付与するメタデータに偏りを生じさせてしまう。この結果、「適切な分類クラスのキーワードの選択がなされている否か」といった点について、信頼性の問題が残ることになる、
3.なお、この2.で述べた、メタデータとして付与された映像データ自身の内容や特徴を説明する情報についての偏り及び信頼性の問題は、異なる視点からの解釈による複数の基準キーワードを使って、メタデータ付与を希望する分類対象の映像データに関しての該当する分類クラスの数を増やし、メタデータ付与のための分類基準キーワードの母集団を増やすことによって回避できる。しかしながら、分類基準キーワードすなわち分類クラスの数を増やし、メタデータ付与のための分類基準キーワードの母集団を大きくすることは、分類対象の映像データに付与されるメタデータのノイズ増加につながり、付与されるメタデータの信頼性が低下する、
という問題があった。
また、上述した第2の方法を、図32に示した動画像メタデータ付与装置940を用いて、未知映像(動画像)の内容や特徴を説明する情報のメタデータ付与に適用する場合でも、その分類クラス選択用の基準キーワードの選定は、ユーザによって画像(静止画)を分類対象として行われているだけである。そのため、従来のメタデータ付与システムの場合は、動画像中のフレーム画像に対してのメタデータ付与については想定していなかった。
本発明は、上記した問題点を解決するためになされたものであって、入力された分類対象の画像/映像データに対して、その画像/映像データ自身の内容や特徴を説明する情報を含むメタデータを付与する場合に、メタデータの付与対象の画像/映像データの特徴を抽出して、この特徴を基に予め蓄積された画像データを参照し、メタデータ付与のための母集団を抽出することが可能なメタデータ作成装置、メタデータ付与方法、及びメタデータ付与プログラムを提供する。
これにより、従来の、ユーザが選定した基準キーワードを用いた、上述したメタデータ付与の問題点を改善し、さらに分類対象が動画像である場合に対しても適用可能なメタデータ付与装置とメタデータ付与方法を提供することを目的としている。
本発明は上述の課題に対してなされたものであり、本発明のメタデータ付与装置は、画像の視覚的特徴を表す画像特徴ベクトル、及び画像自身の内容及び特徴を説明するキーワードを収集する画像データ収集部と、該画像データ収集部が収集した画像の画像特徴ベクトル及びキーワードを記録する画像データベースと、入力映像に対して、映像自身の内容や特徴を説明する情報を入力映像の映像データのメタデータに付与して映像出力する動画メタデータ付与部と、を備え、前記画像データ収集部は、前記画像データベースに記録する画像の画像特徴ベクトル及びキーワードを、ウェブ上の画像データ並びにテキストから収集し、当該収集した画像特徴ベクトル及びキーワードを画像毎に対応付けて前記画像データベースに記録し、前記動画メタデータ付与部は、入力映像を形成するフレーム画像と、前記画像データベースに記録されている画像との類似性を両者の画像特徴ベクトルの類似性から判断し、前記画像データベースの類似と判断された画像特徴ベクトルに対応付けられたキーワードを、入力映像の映像データにメタデータとして付与して映像出力することを特徴とする。
また、本発明のメタデータ付与方法は、画像の視覚的特徴を表す画像特徴ベクトル、及び画像自身の内容及び特徴を説明するキーワードを収集する画像データ収集ステップ、該画像データ収集ステップによって収集した画像の画像特徴ベクトル及びキーワードを画像データベースに記録する記録ステップ、入力映像に対して、映像自身の内容や特徴を説明する情報を入力映像の映像データのメタデータに付与して映像出力する動画メタデータ付与ステップを有し、前記画像データ収集ステップは、前記画像データベースに記録する画像の画像特徴ベクトル及びキーワードを、ウェブ上の画像データ並びにテキストから収集し、当該収集した画像特徴ベクトル及びキーワードを画像毎に対応付けて前記画像データベースに記録し、前記動画メタデータ付与ステップは、入力映像を形成するフレーム画像と、前記画像データベースに記録されている画像との類似性を両者の画像特徴ベクトルの類似性から判断し、前記画像データベースの類似と判断された画像特徴ベクトルに対応付けられたキーワードを、入力映像の映像データにメタデータとして付与して映像出力する
ことを特徴とする。
また、本発明は、コンピュータを、上述したメタデータ付与装置として機能させるためのプログラムである。
また、本発明は、コンピュータを、上述したメタデータ付与装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体ある。
本発明に開示される技術を利用することにより、動画像も含む様々な映像データに対して、映像データ自身の内容や特徴を表す情報を含んだメタデータを、フレーム単位に付与することが可能となる。
そして、付与する分類クラスの判断の根拠となる知識を、ルールベースではなく、ウェブ上の知識に求めることによって、映像データ自身の内容や特徴を表す情報を含んだメタデータについて、より一般的な付与、世相を反映した付与が可能となる。
以下、本発明のメタデータ付与装置,及びメタデータ付与方法について、図面とともに説明する。
図1は、本発明に係るメタデータ付与装置の概略構成図である。
本発明のメタデータ付与装置10は、図1に示すように、画像データ収集部100と、画像データベース(画像DB)200と、動画メタデータ付与部300とを備えて構成されている。
画像データ収集部100は、インターネット50上のウェブページから、映像データにメタデータとして付与するための映像データ自身の内容や特徴を説明する情報を収集し、この収集した情報を画像データベース200に蓄積する。
画像データ収集部100は、ウェブ上に存在する画像データを大量に収集(取得)することを特徴とする。画像データ収集部100は、収集したウェブページの画像iそれぞれについて、その画像データの画像特徴ベクトルfvと、その画像を説明する関連キーワードkw又はその集合であるキーワード群[kw]とを取得して、画像データベース200に記憶する。
画像データベース200は、画像データ収集部100によって取得された、画像データそれぞれの画像特徴ベクトルfvと、同じく取得されたその関連キーワードkw又はキーワード群[kw]とを対応付けて、保存及び蓄積する。
動画メタデータ付与部300は、分類対象の映像入力として、自身の内容や特徴を説明する情報をメタデータとして付加しておきたい静止画や動画像等からなる入力映像Iinの映像データを読み込んで、この映像データに対して、映像データ自身の内容や特徴を説明する情報のメタデータを付与し、このメタデータが付加された入力映像データを出力映像Ioutとして映像出力するものである。
上述した構成からなるメタデータ付与装置10は、その装置機能に基づいて、2つの装置機能部分に大別される。
その第1の装置機能部分は、画像データ収集部100及び画像データベース200によって構成され、インターネット50から画像データを収集し、分類対象の映像データにメタデータとして付与するための、映像データ自身の内容や特徴を説明するための情報としてのキーワードkwを収集・蓄積する装置機能部分である。
また、その第2の装置機能部分は、画像データベース200及び動画メタデータ付与部300によって構成され、入力映像Iinに、その映像データ自身の内容や特徴を説明する情報として好適なキーワードkwを取得してメタデータとして付加し、このメタデータが付与された出力映像データを、出力映像Ioutとして映像出力する装置機能部分である。
次に、上述した2つの装置機能部分を備えて構成される本発明のメタデータ付与装置10について、各部100,200,300の構成の相違に応じて、それぞれ実施の形態及び実施例に分けて、説明する。
<第1の実施の形態>
<画像データ収集部>
図2は、第1の実施の形態に係るメタデータ付与装置における画像データ収集部の構成図である。
画像データ収集部100は、画像データを収集し、分類対象の映像データにメタデータとして付加するための情報等を収集する第1の装置機能部分である。本実施の形態に係るメタデータ付与装置10では、画像データ収集部100は、ページ取得部110と、画像取得部120と、画像特徴ベクトル算出部130と、タグ情報取得部140とを備えて構成されている。
ページ取得部110は、定期的に、多くのウェブページ(ホームページ)が登録されているウェブサイト(ウェブサーバ)を検索・巡回して、画像が掲載されているウェブページを自動取得する。
このページ取得部110による、具体的なウェブサイトの巡回・検索は、例えば、サーチエンジン‘Google(登録商標)’の「多くの良質なホームページからリンクされているホームページは、やはり良質なホームページである」 という再帰的な関係を基に全てのホームページの重要度を判定した‘PageRank(登録商標)’のような、各ウェブサイトのホームページ毎の重要度判定等に関してのホームページ評価情報に基づいて行われる。ページ取得部110は、各ウェブサイトから別途取得したホームページ評価情報に基づいて、データの信頼性や正確性が保証された複数の適切なウェブページそれぞれを定期的に巡回・検索し、各巡回・検索先でそのウェブページの配信を受け、ウェブサイトからウェブページのウェブデータを取得する構成になっている。そして、ページ取得部110は、その取得したウェブページのウェブデータを、画像取得部120及びタグ情報取得部140に供給する。
画像取得部120は、ページ取得部110で取得された検索・巡回先のウェブページ(ホームページ)上に画像iが掲載されている、すなわち検索・巡回先のウェブページのウェブデータに画像データ(画像ファイル)が含まれている場合は、その画像データを抽出する構成になっている。画像取得部120は、抽出した画像データを画像特徴ベクトル算出部130に供給する。
画像特徴ベクトル算出部130は、画像取得部120が取得したウェブページ(ホームページ)上の各画像データに基づいて、その画像内容の特徴を抽出した画像特徴ベクトルfvを算出する構成になっている。この画像特徴ベクトルfvは、その画像データに基づく画像を、例えば色彩,テクスチャ,輪郭等に代表される、項目別の特徴量で構成される多次元ベクトルによって表現したものである。画像特徴ベクトル算出部130は、検索・巡回先のウェブページ上の画像iそれぞれを、このような画像特徴ベクトルfvによって表現することによって、図1に示した動画メタデータ付与部300の、後述する画像データベース検索部320による類似画像検索を行い易いようにしている。
ここで、画像特徴ベクトル算出部130によって作成される画像特徴ベクトルfvについて、図3によって説明する。
図3は、画像特徴ベクトル算出部の構成を示すブロック図を示す。
画像特徴ベクトル算出部130は、上述した色彩,テクスチャ,輪郭等といった、特徴項目それぞれに応じた特徴量算出部130-1〜130-Nを備えた構成になっている。画像特徴ベクトル算出部130は、画像取得部120から取得した画像iの画像データが入力されると、それぞれの特徴量算出部130-1〜130-Nが、この取得画像iに係るそれぞれ特徴量f1〜fNを算出して、特徴量f1〜fNを成分とする画像特徴ベクトルfvi を生成して出力する。なお、この場合、Nは、特徴量算出部130-1〜130-Nの個数、すなわち特徴項目数を表すものとする。
このように、画像特徴ベクトル算出部130は、取得画像iが入力される毎に、次のような関係式で表せる画像特徴ベクトルfviを算出する構成になっている。
画像iの画像特徴ベクトルfvi : fvi=(f1i, f2i, ・・・, fNi)
一方、タグ情報取得部140は、ページ取得部110によって取得されたウェブページのHTML文書(又は HTMLファイル、HTMLソース)で用いる制御文としてのタグ(tag)の情報を利用して、画像取得部120が取得した画像データに関連するキーワードkwを取得する。
ここで、このタグ情報取得部140によるキーワードkwの取得の仕方について、図4に示すHTML文書を例に、具体的に説明する。
図4は、HTML文書におけるタグ情報の例についての説明図であり、図4(a)は、HTML文書中における<img>タグの記述例を示したもので、図4(b)は、同じくHTML文書中における<table>タグの記述例を示したものである。
図4(a)は、HTML文書で画像データ(画像ファイル)を表示するために用いる制御文としての<img>タグの記述例を示したものである。図示の例では、<img>タグの‘src’属性で指定した画像ファイル“xxx.jpg”が“富士山”の画像データであるものとし、この“xxx.jpg”の画像ファイルを表示できない(表示しない)ブラウザを考慮して、‘alt’属性によってこの画像ファイル“xxx.jpg”の代わりに、テキスト(文字列)「富士山」が表示されることが指定されている。なお、同図中において、その<img>タグの‘width’属性は、画像の幅をピクセル又はパーセンテージで指定するものであり、‘height’属性は、画像の高さをピクセル又はパーセンテージで指定するものである。
そして、タグ情報取得部140は、このような、画像ファイル“xxx.jpg”を表示するために用いる制御文としての<img>タグの中から、ブラウザがその画像ファイル“xxx.jpg”を表示できないときに代わりに表示する、‘alt’属性によって指定されたテキスト(文字列)の「富士山」を抽出して、これを“富士山”の画像ファイル“xxx.jpg”に関してのキーワードkwとして取得する。このような、タグ情報取得部140による画像ファイルに関してのキーワードkwの取得構成は、<img>タグ中の‘alt’属性によって指定され、画像の代わりに表示される代替テキスト(文字列)が、通常、画像内容を表現する端的なキーワードkwになっていることが多いことに基づいている。
したがって、図4(a)に示したHTML文書の場合は、タグ情報取得部140は、ブラウザによって画像データ(画像ファイル)が表示できない場合に表示される代替テキスト(文字列)を、キーワードkwとして取得することになる。
一方、図4(b)は、HTML文書でテーブル(表)を作成するために用いる制御文としての<table>タグの記述例を示したものである。図示の例では、<table>タグの‘background’属性で指定したテーブルの背景画像の画像ファイル“xxx.jpg”が“富士山”の画像であるものとし、その<tr>タグ中の‘th’属性で指定したテーブルの前景のテーブルヘッダ部分の行の記述が「富士山」のテキスト(文字列)であり、そのテキスト(文字列)「富士山」の‘style’属性で指定したスタイルシートが“color:white”であることが指定されている。
そして、タグ情報取得部140は、このような場合、テーブルを作成するために用いる制御文としての<table>タグ中の‘background’属性から、テーブルの背景画像の画像ファイル“xxx.jpg”を抽出すると、同じく<table>タグ中の<tr>タグ中において‘th’属性で指定されたテーブルの前景のテーブルヘッダ部分の「富士山」のテキスト(文字列)を抽出して、これを“富士山”の画像ファイル“xxx.jpg”に関してのキーワードkwとして取得する。このような、タグ情報取得部140による画像ファイルに関してのキーワードkwの取得構成は、<table>タグの‘background’属性によって指定された背景画像に関しては、<table>タグ中の<tr>タグ中において‘th’属性で指定されたテーブルヘッダ部分のテキスト(文字列)が、通常、画像ファイル“xxx.jpg”を表現する端的なキーワードkwになっていることが多いことに基づいている。
したがって、図4(b)に示したHTML文書の場合は、タグ情報取得部140は、テーブルの背景画像が指定されている場合は、その前景のテーブルヘッダ部分のテキスト(文字列)を、キーワードkwとして取得することになる。
なお、上述したようなキーワードkwの取得に当たって、キーワードkwの取得対象のテキスト(文字列)が上述したように名詞(例えば「富士山」)で指定されているものの他に、文章で指定されているものもある。このような場合には、タグ情報取得部140は、この取得したテキスト(文字列)の文章から、形態素解析を利用して、名詞,形容詞を抽出することによって、その画像に関連するキーワードkwを取得する構成になっている。なお、このタグ情報取得部140によるキーワードkwの取得構成は、上記説明した構成に限られるものではなく、他にも、タグ情報取得部140は、新たに定義された画像データに関連するタグ情報を利用して、その画像内容に関してのキーワードkwを取得することもできる。このようにして、タグ情報取得部140は、画像を含むウェブページ(ホームページ)のHTML文書のタグの情報を解析して、ウェブページ上の画像に関連するキーワードkwを取得する。
その上で、この画像データ収集部100によって収集された、インターネット50上の検索・巡回先の各ウェブページの画像データそれぞれに関連して画像特徴ベクトルfviやキーワードkwは、入力映像(分類したい未知映像)にその映像データ自身の内容や特徴を説明する情報をメタデータとして付与する際の利用に備えて、画像データベース200に記録保持される。
図5は、図2に示した画像データ収集部による、上述した画像データ収集処理のフローチャートである。
図5に示すように、本実施例の画像データ収集部100は、まず、ページ取得部110がインターネット50上の検索・巡回先のウェブサイトにアクセスし、そのウェブページ(ホームページ)の配信を受ける。その際、ページ取得部110は、その配信を受けたウェブページが画像のあるウェブページである場合には、そのウェブページを取得して、画像取得部120及びタグ情報取得部140に供給する。これに対し、ページ取得部110は、その配信を受けたウェブページに画像がない場合は、インターネット50上の次の検索・巡回先のウェブサイトにアクセスし、そのウェブページ(ホームページ)の配信を受ける(ステップS1010)。
画像取得部120は、ページ取得部110から、取得したウェブページが供給されると、その中の画像データを取得し、この取得した画像データを画像特徴ベクトル算出部130に供給する。画像特徴ベクトル算出部130は、この画像取得部120から供給された画像データの供給に基づいて、この画像データによる画像の種々の特徴量に基づく多次元ベクトルからなる画像特徴ベクトルfvi を算出する(ステップS1020)。
これに対し、同じくページ取得部110から取得したウェブページが供給されるタグ情報取得部140は、画像取得部120による画像取得処理、及び画像特徴ベクトル算出部130による画像特徴ベクトル算出処理との同期をとって、画像特徴ベクトル算出部130が画像特徴ベクトルfvi を算出する画像データの関連するテキスト情報を、そのウェブページのHTML文書のタグ情報を解析することによって取得する(ステップS1030)。そして、タグ情報取得部140は、その取得した画像データに関連するテキスト情報が、名詞,形容詞である場合にはこれをキーワードkwとしてそのまま取得し、文章である場合には形態素解析を利用してその文章中の名詞,形容詞を抽出し、これをキーワードkwとして取得する(ステップS1040)。
そして、画像特徴ベクトル算出部130及びタグ情報取得部140は、画像データ毎に対応付けて、算出した画像特徴ベクトルfviと取得したキーワードkwとを、後述する画像データベース200へ出力、保存していく(ステップS1050)。
これにより、画像データ収集部100は、その検索・巡回先のウェブサイトの画像データ毎に対して、画像特徴ベクトルfviの算出処理と、タグ情報取得によるキーワードkwの取得処理とを繰り返し行うことによって、画像特徴ベクトルfvが形成する多次元ベクトル空間中に、キーワードkwの分布を生成していく。
なお、上述した画像データ収集部100の構成の説明では、画像データ収集部100は、画像データを取得したウェブページ上から、タグ情報取得部140によってそのHTML文書中の関連するタグ情報を利用して、取得した画像データに対応したキーワードkwを生成する構成としたが、画像データ収集部100は、ウェブページ上から取得した画像データに関連する情報を、タグ情報を利用する以外の方法によってキーワードkwを取得することも可能である。
<画像データ収集部の第1の変形例>
図6は、図2とは別構成からなる画像データ収集部の構成図ある。
例えば、図6に示した画像データ収集部100では、図2に示した画像データ収集部100の構成に対し、そのタグ情報取得部140に代え、ページ構成解析部150が備えられている構成になっている。その余のページ取得部110,画像取得部120,及び画像特徴ベクトル算出部130については、図2に示した画像データ収集部100のページ取得部110,画像取得部120,及び画像特徴ベクトル算出部130の構成と同じである。
この場合、ページ構成解析部150は、ウェブページ上の、取得した画像データによる画像iの近くに配置されているテキストは、その画像iを高頻度で説明しているという事実に基づき、画像取得部120が画像データを取得したウェブページの構成を解析して、画像取得部120が取得した画像データによる画像iに関連する、ウェブページ上の文章を抽出する構成になっている。そして、ページ構成解析部150は、この抽出した文章から名詞,形容詞を抽出して、画像iに関してのキーワードkwを取得する構成になっている。
このページ構成解析部150による、取得画像iに関するキーワードkwの具体的な取得方法としては、画像iの近くに配置されているテキストに限らず、様々なページ構成解析による取得方法が可能である。
具体的には、ウェブページ上で取得画像iの近くに表示配置される文章が複数ある場合等を考慮して、ページ構成解析部150は、画像iの最も近くに表示配置され、かつその余の文章に対しては離れて孤立配置されている文章を抽出し、その文章中から名詞,形容詞を抽出して、画像iに関してのキーワードkwを取得することも可能である。
また、ページ構成解析部150は、キーワードkwを取得する画像iからリンクされているウェブページ上の文章が存在するか否かを確認して、存在する場合にはこのリンクされている文章を取得し、この取得した文章から名詞,形容詞を抽出して、画像に関してのキーワードkwを取得することも可能である。
さらに、ページ構成解析部150は、ウェブページ上の文章中から抽出された、キーワードkwになり得る名詞,形容詞が多数あるような場合には、抽出した名詞それぞれ,形容詞それぞれについて、文章中の文字属性(例えば、サイズ,色,太字,ブリンク,等)に基づいて重み付けを行い、抽出したか名詞又は形容詞それぞれの重みに基づいて、画像に関してのキーワードkwを取得することも可能である。
ページ構成解析部150は、このような様々なページ構成解析による取得方法を、選択的に、又は必要に応じて組み合わせて利用することによって、画像iに関して取得するキーワードkwのノイズの低減をはかり、キーワードkwの効率的な取得が行える。
図7は、図6に示した画像データ収集部による画像データ収集処理のフローチャートである。
図7に示すように、本実施例の画像データ収集部100の場合も、ウェブページ(ホームページ)の取得(ステップS1010)、ウェブページからの画像データの取得及びその画像特徴ベクトルfviの算出(ステップS1020)については、前述した実施例の画像データ収集部100の場合と変わらない。本実施例の画像データ収集部100では、ページ取得部110が取得したウェブページは、画像取得部120とともに、前述したタグ情報取得部140に代わるページ構成解析部150に供給される。ページ構成解析部150は、ページ取得部110が取得したウェブページに関して、画像取得部120が取得する画像iの近くに配置されている文章,画像iからリンクされている文章等を、ページ構成解析して取得する(ステップS1032)。そして、ページ構成解析部150は、これら取得した関連文章中から形態素解析を利用して関連文章中に含まれる名詞,形容詞を抽出し、さらにこれら抽出した名詞又は形容詞それぞれについて、文章中の文字属性(例えば、サイズ,色,太字,ブリンク,等)に基づいて重み付けを行い、その結果に基づいてこれら抽出した名詞又は形容詞の中から、画像iに関してのキーワードkwを抽出する(ステップS1042)。そして、画像特徴ベクトル算出部130及びページ構成解析部150は、画像データ毎に対応付けて、算出した画像特徴ベクトルfviと取得したキーワードkwとを、後述する画像データベース200へ出力、保存していく(ステップS1052)。
これにより、本実施例の画像データ収集部100も、その検索・巡回先のウェブサイトの画像データ毎に対して、画像特徴ベクトルfviの算出処理と、ページ構成解析によるキーワードkwの取得処理とを繰り返し行うことによって、画像特徴ベクトルfvが形成する多次元ベクトル空間中に、キーワードkwの分布を生成していく。
<画像データ収集部の第2の変形例>
図8は、さらに別の構成からなる画像データ収集部の変形例を示したものである。
例えば、図8に示した画像データ収集部100は、図2又は図6に示した画像データ収集部100の構成に対し、そのタグ情報取得部140又はページ構成解析部150に代え、画像内データ取得部160が備えられている構成になっている。画像内データ取得部160は、画像取得部120から検索・巡回先のウェブサイトから取得した画像データが供給され、この画像データに基づいてその画像iに関してのキーワードkwの取得処理を行う。その余のページ取得部110,画像取得部120,及び画像特徴ベクトル算出部130については、図2又は図6に示した画像データ収集部100のページ取得部110、画像取得部120、及び画像特徴ベクトル算出部130の構成と同じである。
画像内データ取得部160は、画像取得部120が取得した画像iの画像データ(画像ファイル)自身に付与されている既存のメタデータを参照し、キーワードkwを取得する構成になっている。具体的には、画像内データ取得部160は、その画像データ(画像ファイル)自身の既存のメタデータから、その画像iに関してのキーワードkwを取得する構成になっている。
例えば、画像取得部120が取得した画像iが、例えばデジタルカメラで撮影された画像のような、JPEG画像のデータ形式をベースに撮影情報等を埋め込むことを可能にした画像ファイル形式の画像データ、例えば‘exif(exchangeable image file format)’の画像ファイル形式で保存されている画像データである場合、その画像データには、TIFF(Tagged Image File Format)形式で記録された画像データ自身を説明する情報、すなわち「タグ」と呼ばれる、撮影日時,画素数,圧縮情報,絞り値,シャッター速度,ホワイトバランス,GPS(Global Positioning System)情報,等といった情報が、既存のメタデータとして含まれている。
画像内データ取得部160は、このような画像を説明するメタデータが付随している画像iを取得した画像取得部120から、その画像データが供給され、この付随したメタデータを抽出して、その中の画像を特徴付けるのに適した情報をキーワードkwとして取得し、画像データベース200へ出力する構成になっている。
図9は、図8に示した画像データ収集部による画像データ収集処理のフローチャートである。
図9に示すように、本実施例の画像データ収集部100の場合も、ウェブページ(ホームページ)の取得(ステップS1010)、ウェブページからの画像データの取得及びその画像特徴ベクトルの算出(ステップS1020)については、前述した実施例の画像データ収集部100と変わらない。本実施例の画像データ収集部100の場合は、画像取得部120が取得した画像データ(画像ファイル)は、その画像特徴ベクトルの算出処理を行う画像特徴ベクトル算出部130とともに、前述したタグ情報取得部140又はページ構成解析部150に代わる、画像内データ取得部160に供給される。画像内データ取得部160は、画像取得部120が取得した画像iの画像データ(画像ファイル)に付随したメタデータを抽出する(ステップS1034)。画像内データ取得部160は、その抽出したメタデータとして含まれる画像データ自身を説明する情報を形態素解析を利用して取得し、その中から、この画像iを特徴付けるのに適した情報を抽出し、この抽出した情報を画像iに関してのキーワードkwとして取得する(ステップS1044)。
そして、画像特徴ベクトル算出部130及び画像内データ取得部160は、画像データ及び画像毎に対応付けて、算出した画像特徴ベクトルfviと取得したキーワードkwとを、後述する画像データベース200へ出力、保存していく(ステップS1054)。
これにより、本実施例の画像データ収集部100も、その検索・巡回先のウェブサイトの画像データ毎に対して、画像特徴ベクトルfviの算出処理と、画像内データの取得によるキーワードkwの取得処理とを繰り返し行うことによって、画像特徴ベクトルfvが形成する多次元ベクトル空間中に、キーワードkwの分布を生成していく。
このように、本実施の形態に係るメタデータ付与装置10の画像データ収集部100は、その画像取得部120によって取得した画像iに関して、上述したタグ情報取得部140,ページ構成解析部150,画像内データ取得部160等といった構成によって、取得した画像i自身の内容や特徴を説明する情報としてのキーワードkwを取得することができる。
そして、これらタグ情報取得部140,ページ構成解析部150,画像内データ取得部160等といったキーワード取得部については、図2,6,8にそれぞれ示した画像データ収集部100の実施例では、これら各部140,150,160の中のいずれか1つを備えていることとして説明したが、これら各部140,150,160の中の全部又は幾つかを組み合わせて用いること、さらに各部140,150,160をウェブページのジャンルや信頼度等といった属性毎に使い分けることによって、画像i内容や特徴を説明する情報としてのキーワードkwの精度を高めることもできる。
<画像データベース>
一方、図10は、画像データベースのデータ保持構成についての一実施例を示した図である。
例えば図2に示した画像データ収集部100の場合を例に説明すると、画像データベース200は、画像特徴ベクトル算出部130によって算出されたウェブページ上の画像i1,i2,i3,i4,i5,…それぞれに対応した画像特徴ベクトルfv1,fv2,fv3,fv4,fv5,…と、タグ情報取得部140によって取得されたウェブページ上の画像i1,i2,i3,i4,i5,…それぞれに対応したキーワード群[kw_a],[kw_b, kw_c, kw_d],[kw_a],[kw_d],[kw_b,kw_d],…とが、互いに対応付けられ、記録保持されて構築される。つまり、本実施例の場合は、図2に示した画像データ収集部100の関係から、画像データベース200はその情報源としてインターネット50上に公開されている膨大なウェブページ(ホームページ)上の情報、その中でも静止画像をその情報源として利用している。
図10に示すような、画像特徴ベクトルfvとキーワード群[kw]との対からなる画像データベース200によれば、いずれかの画像特徴ベクトルfvを指定することによって、所定の画像特徴ベクトルfvを有する画像iから取得された、当該画像i自身の内容や特徴を説明するための情報としてのキーワード群[kw]を引き出せる構成になっている。
図11は、画像データベースに保持される画像特徴ベクトルとキーワード群との対応関係の説明図である。
図11に示すように、画像データベース200においては、ウェブページ上の画像i,i2,i3,i4,i5,…それぞれは、図3に示した画像特徴ベクトル算出部130のN個の特徴量算出部130-1〜130-Nによって形成されるベクトル空間内の画像特徴ベクトルfv,fv2,fv3,fv4,fv5,…それぞれが指し示す点として表される。これにより、画像ii,i2,i3,i4,i5,…それぞれに対応したキーワード群[kw_a],[kw_b, kw_c, kw_d],[kw_a],[kw_d],[kw_b,kw_d],…それぞれの構成キーワードkw_a,kw_b,kw_c, kw_d,…は、多元ベクトル空間内の該当する画像特徴ベクトルfvが指し示す点に存在することを意味している。したがって、図2で述べた画像データ収集部100により、ウェブページ上の画像iの収集を繰り返し行っていくことによって、画像特徴ベクトルfvが存在するベクトル空間中に、キーワードkwの分布が形成されていくことになる。
このようにして取得したキーワード群[kw]は、ウェブ上のデータを利用しているため、様々な観点で画像iについて記述された情報が内包されている。そのため、キーワード群[kw]を形成する各キーワードkwについて、所定の画像iに対するその時代の総意としての解釈や、さらに今までになかった画像iについても新語による解釈を得られることが、本実施の形態のメタデータ付与装置10における画像データ収集方法、画像データベース200の構築方法の利点である。
もちろん、画像データベース200に画像特徴ベクトルfvとともに保持されるキーワード群[kw]は、ウェブ上の情報以外であっても、本実施の形態のメタデータ付与装置10における画像データ収集方法、画像データベース200の構築方法を適用することは可能である。ただし、上述のようなメリットを実現するためには、多くの人が参加する形でリアルタイムに情報が更新形成されていく情報源から、前述した画像データ収集部100が情報源における画像iについての情報の収集を繰り返し行っていく必要がある。
本実施の形態のメタデータ付与装置10では、このように構成されている画像データベース200を用いて、類似画像検索、及び類似している画像に関連付けられているキーワード群の取得を実現する。本実施の形態のメタデータ付与装置10では、次に説明する動画メタデータ付与部300によって、この画像データベース200を用いて、分類対象として入力される動画像を含む入力映像に対して、類似画像検索によらないキーワードkwの決定が可能となっている。
<動画メタデータ付与部>
次に、図1に示したメタデータ付与装置10における動画メタデータ付与部300の実施例の構成について説明する。
動画メタデータ付与部300は、メタデータの付与対象であり分類対象である、入力された映像データに対して、画像データベース200に画像毎に対応付けられて蓄積されている画像特徴ベクトルfv及びキーワード群[kw]の情報を利用して、入力された映像データのフレーム単位で、映像データ自身の内容や特徴を説明する情報を、メタデータとして付与する。
図12は、本実施例の動画メタデータ付与部の構成図である。
本実施例の動画メタデータ付与部300は、映像データ入力部310と、画像データベース検索部320と、メタデータ付与部330と、映像データバッファ340と、映像データ出力部350と備えて構成されている。
映像データ入力部310は、自身の内容や特徴を説明する情報を含むメタデータを付与したい、分類対象の入力映像(動画像)Iinを入力する構成になっている。
画像データベース検索部320は、入力映像Iinを構成するフレーム画像の画像特徴ベクトルFvと類似した画像特徴ベクトルfvを画像データベース200から検索し、その画像特徴ベクトルfvに付随する情報すなわちキーワードkwを取得する構成になっている。
メタデータ付与部330は、メタデータを付与する分類対象の入力映像Iinからそのフレーム画像Ifを取得し、画像データベース検索部320から画像データベース200を検索して得たキーワードkwを取得して、入力映像Iinのフレーム画像If毎に画像自身の内容や特徴を説明する情報を含むメタデータを付与する構成になっている。
映像データバッファ340は、メタデータ付与部330が入力映像Iinにメタデータの付与を行っている間、映像データを一時保管する構成にもなっている。
映像データ出力部350は、メタデータ付与部330によってメタデータが付与された入力映像Iout、すなわち自身の内容や特徴を説明する情報を含むメタデータが付加された映像データIoutの映像出力を行う構成になっている。
次に、動画メタデータ付与部300の上述した各部の構成について、詳細に説明する。
図13は、映像データ入力部及び映像データバッファの構成図を示したものである。
映像データ入力部310は、メタデータを付与したい分類対象の入力映像Iinを動画メタデータ付与部300へ取り込むための窓口として機能し、本例では、フレーム画像取得部311と、画像特徴ベクトル算出部312と、メタデータひな形生成部313とを備えて構成されている。
ここでは、画像自身の内容や特徴に関する情報のメタデータを付与したい入力映像Iinとして、CCD等で撮影された映像情報だけのデータのような映像データを想定する。なお、動画等のマルチメディアコンテンツを検索するための内容記述データであるMPEG‐7よるメタデータや、デジタル放送及びインターネット双方のネットワークからマルチメディアコンテンツを検索するためのTV‐Anytimeによるメタデータが映像コンテンツに埋め込まれたMPEG2‐TS等のような映像データのように、既存の定型メタデータが付随している映像データでも、適用可能である。
フレーム画像取得部311は、メタデータを付与するために取り込まれた入力映像(ここでは、動画像)Iinから、その連続したコマを形成するフレーム画像Ifを取得し、取得したフレーム画像Ifを入力映像Iinの形成順(入力映像Iinの時間経過)に沿って画像特徴ベクトル算出部312に出力する構成になっている。
画像特徴ベクトル算出部312は、図2に示した画像データ収集部100の画像特徴ベクトル算出部130と同様にして、フレーム画像取得部311が取得した入力画像Iinのフレーム画像Ifの特徴を抽出した多次元の画像特徴ベクトルFvを算出する構成になっている。画像特徴ベクトル算出部312は、算出した画像特徴ベクトルFvを、映像データバッファ340中の、画像特徴ベクトルFvを入力映像Iinの形成順に対応付けて保持する画像特徴ベクトル格納部341へ格納する。
メタデータひな形生成部313は、入力映像Iinの映像データがMPEG2‐TS等のように、予めMPEG‐7やTV‐Anytimeによる既存のメタデータが付与されているか否かを確認し、既存のメタデータがないことを確認すると、入力映像Iinの内容や特徴を説明する情報をフレーム単位で入力映像Iinに埋め込むためのメタデータのひな形を作成し、そのひな形のメタデータを映像データバッファ340中のメタデータ格納部342に、画像特徴ベクトルFvの場合と同様に、入力映像Iinの形成順に対応付けて保存する。なお、メタデータのひな形としては、本実施例の場合は、後にECG(Electronic Contents Guide)を構成するためのコンテンツメタデータとユーザの嗜好等を記述するためのコンシューマメタデータとのひな形が作成される。また、メタデータひな形生成部313は、入力映像Iinの映像データに予めMPEG‐7やTV‐Anytimeによる既存のメタデータがある場合には、既存のメタデータをそのまま、メタデータのひな形として映像データバッファ340中のメタデータ格納部342にフレーム単位で保存する。
また、映像データ入力部310では、メタデータ付与部330によって、入力映像Iinの映像データにフレーム単位でメタデータを付与する際に発生するタイムラグを吸収するために、入力映像Iinの映像データを映像データバッファ340中の映像データ格納部343にそのまま一時保存する構成にもなっている。
そのため、映像データバッファ340には、上述した映像データ入力部310の各部構成に対応して、画像特徴ベクトル格納部341,メタデータ格納部342,及び映像データ格納部343が形成される。
図14は、本実施例のメタデータ付与部の構成図を示したものである。
メタデータ付与部330は、画像特徴ベクトル読込部331と、メタデータ書込部332とを備えた構成になっている。
画像特徴ベクトル読込部331は、画像データベース検索部320で画像データベース200の画像中から最も類似している画像を検索するために、映像データバッファ340の画像特徴ベクトル格納部341に格納保持されている入力映像Iinのフレーム単位で算出した画像特徴ベクトルFv_QUERYを順次読み込み、画像データベース検索部320に供給する。
メタデータ書込部332は、画像特徴ベクトル読込部331によって画像データベース検索部320に読み込ませた入力映像Iinのフレーム単位の画像特徴ベクトルFv_QUERYとの同期をはかって、画像データベース検索部320から、その戻り値として、画像特徴ベクトル読込部331から読み込んだ画像特徴ベクトルFv_QUERYに最も類似している画像特徴ベクトルfvを有する画像と対に記録されているキーワード群[kw]を受ける。そして、メタデータ書込部332は、映像データバッファ340中のメタデータ格納部342に格納されている、メタデータひな形生成部313によって形成された対応するフレームのひな形のメタデータを、このキーワード群[kw]で更新する。
画像データベース検索部320は、画像特徴ベクトル読込部331を介して映像データバッファ340の画像特徴ベクトル格納部341から読み込んだ、入力映像Iinのフレーム単位で算出した画像特徴ベクトルFv_QUERYについて、図10で示した画像データベース200に格納されている画像特徴ベクトルfv,fv2,fv3,fv4,fv5,…の中から、最も類似している画像特徴ベクトル、例えばfviを検索する。
画像データベース検索部320は、この検索処理を行うと、その呼び出し元であるメタデータ付与部330へ返し、メタデータ付与部330のメタデータ書込部332によって、図10に示した映像データ入力部310のメタデータひな形生成部313により生成された、映像データバッファ340中のメタデータ格納部342における対応するメタデータのデータ内容を、この検索した画像特徴ベクトルfviに対応して得たキーワードkwに基づいて更新する。
図15は、画像データベース検索部による画像データベースに格納されている画像特徴ベクトルの検索についての一実施例の説明図である。なお、図15では、説明簡便のため、画像特徴ベクトル読込部331によって読み込まれた、入力映像Iinのフレーム単位の画像特徴ベクトルFv_QUERYを、特徴ベクトル1,2による2次元の画像特徴ベクトル空間で表してある。また、同図中に、中抜き丸印‘○’で表した点それぞれは、図10に示した画像データベース200に格納されている各画像の画像特徴ベクトルfv,fv2,fv3,fv4,fv5,…を表したものである。
画像データベース検索部320は、画像特徴ベクトル読込部331から、読み込んだ入力映像Iinのフレーム単位で算出した画像特徴ベクトルFv_QUERYが入力されると、この画像特徴ベクトル空間中で、最も近接している画像データベース200内の画像特徴ベクトルfviを検索する。
画像データベース検索部320は、この検索を、画像特徴ベクトルFv_QUERYと画像特徴ベクトルfv,fv2,fv3,fv4,fv5,…それぞれとの間のベクトル間距離の計算を行って、各距離の比較を行うことによって求める。すなわち、画像データベース検索部320は、画像特徴ベクトルFv_QUERYに対してベクトル間距離が最も小さい関係にある画像特徴ベクトルfviを求めることによって、読み込んだ入力映像Iinのフレーム画像に最も類似している、画像データベース200内の画像を特定する。図15の場合は、黒く塗り潰して示した黒丸印‘●’の点で表された画像特徴ベクトルfviが最も近接しているため、この画像特徴ベクトルfviのキーワード群[kw]が、メタデータ付与部330に画像データベース検索部320からの戻り値として返される。
なお、画像データベース検索部320による、読み込んだ画像特徴ベクトルFv_QUERYについての画像データベース200の検索に基づく、キーワード群[kw]の取得構成は、上述した図15に示した構成に限られるものではない。
図16は、画像データベース検索部による画像データベースに格納されている画像特徴ベクトルの検索についての別の実施例の説明図である。
図16に示す場合では、画像データベース検索部320は、読み込んだ画像特徴ベクトルFv_QUERYが示す画像特徴ベクトル空間の十字○印で示した点から、所定距離Rの範囲内にその指す点がある画像データベース200内の画像特徴ベクトルfvi全てを対象として検索する。そして、画像データベース検索部320は、これら検索した画像特徴ベクトルfviそれぞれに対応する画像データベース200内のキーワード群[kw]の間で、例えば、最も多数のキーワード群[kw]に含まれているキーワードkw、すなわち画像特徴ベクトルfviに対応付けられる頻度が最も高いキーワードkwを取得したり、又はこれら検索した画像特徴ベクトルfvi全ての中の所定数以上の画像特徴ベクトルfviに含まれているキーワードkwの中から、上位N個のキーワードkwを取得する構成になっている。その上で、画像データベース検索部320は、この取得した1乃至はN個のキーワードkwを戻り値の新たなキーワード群[kw]として、メタデータ付与部330のメタデータ書込部332に供給する。すなわち、本例の場合は、画像データベース検索部320は、戻り値としてのキーワード群[kw]に含まれるキーワードkwの取得構成が、図15に示した取得構成よりもより柔軟な取得構成になっている。
図14に示したメタデータ付与部330では、その画像特徴ベクトル読込部331よって画像データベース検索部320に読み込ませた入力映像Iinのフレーム単位の画像特徴ベクトルFv_QUERYに関して、画像データベース検索部320からその戻り値としてのキーワード群[kw](この場合のキーワード群[kw]には、0乃至複数個のキーワードkwが含まれる)がメタデータ書込部332に供給されると、メタデータ書込部332は、入力映像のフレーム単位の画像特徴ベクトルFv_QUERYとの同期をはかって、映像データバッファ340中の、メタデータひな形生成部313により生成されたメタデータ格納部342の対応するメタデータに、この供給されたキーワード群[kw]を構成するキーワードkwを追加して更新する。
そして、映像データバッファ340のメタデータひな形生成部313のメタデータの更新状況に応じて、図12に示した映像データ出力部350では、映像データバッファ340のメタデータ格納部342の更新されたメタデータ、及び映像データ格納部343に一時保存されている入力映像Iinの映像データを基に、メタデータが付与された入力映像Ioutの出力を行う構成になっている。
図17は、本実施例の映像データ出力部の構成図である。
本実施例の場合、映像データ出力部350は、マルチプレクサ351を用いて構成されている。
マルチプレクサ351には、映像データバッファ340のメタデータ格納部342から、画像データベース検索部320によってメタデータ付与部330を介して更新された、入力映像Iinのフレーム単位の画像データの内容や特徴を説明する情報を含むメタデータが供給され、同じく映像データバッファ340の映像データ格納部343からは、このメタデータが付加される、入力映像Iinの対応するフレーム単位の画像データが供給される構成になっている。そして、マルチプレクサ351は、入力映像Iinの最初(最初のフレーム)から終了(最後のフレーム)まで、上述したようにして、入力映像Iinに対してフレーム単位でメタデータの付与を行い、入力映像Iinの内容や特徴を説明する情報を含むメタデータがフレーム単位で付与された入力映像Ioutの映像出力を行う構成になっている。
したがって、上述したメタデータ付与装置10の動画メタデータ付与部300の各部は、入力映像の1フレーム単位に、入力映像Iinの内容や特徴を説明する情報を含むメタデータを、人手を必要とすることなく、自動的に付与することができる。また、入力映像Iinの1フレーム単位に、入力映像Iinの内容や特徴を説明する情報を含むメタデータを付与する必要がない場合でも、例えば、その映像データ入力部310のフレーム画像取得部311が取得する、入力映像Iinのフレーム単位の画像の取得間隔、画像特徴ベクトル算出部312が画像特徴ベクトルFvを算出するフレーム画像Ifの算出間隔、等を任意に調整することによって、メタデータ付与に必要なリソースを削減することも可能である。また、図15,図16に示したメタデータ付与部330による画像データベース200の画像特徴ベクトルfvの検索構成においても、その検索する距離Rや頻度等といった検索基準要素の値を変更することで、ユーザの目的希望に合った範囲で入力映像Iinにメタデータとして付与するキーワードkwを抽出することもでき、入力映像Iinの分類もユーザの意向を反映させながら適確に行うことができる。
なお、上記説明では、説明簡便のため、入力映像Iinとして、既存の定型メタデータが付随していない映像情報のみから構成される映像データを例に説明したが、既存の定型メタデータが付随している映像データの場合であっても、例えば、映像データ入力部310で入力映像Iinの映像データのデータ形式を判別し、その判別したデータ形式に応じてフレーム画像取得部311で入力映像Iinのフレーム画像Ifを取得する一方、映像データ出力部350は、映像データバッファ340のメタデータ格納部342に格納されているメタデータから入力映像Iinの映像データのデータ形式を判別し、その判別したデータ形式に合わせて、既存の定型メタデータに入力映像Iinの内容や特徴を説明する情報としての取得したキーワード群[kw]を付加することによって、対応できるようになっている。
図18は、図12に示した動画メタデータ付与部による動画メタデータ付与処理のフローチャートである。
図18に示すように、本実施例の動画メタデータ付与部300は、まず、入力映像Iinが供給されると、映像データ入力部310は、入力映像Iinの映像データがMPEG2−TS等の、MPEG−7やTV-Anytime等といった既存のメタデータが付随している映像データであるか、映像情報だけの映像データであるかの判別を行う(ステップS3010)。映像データ入力部310は、入力映像Iinの映像データが映像情報だけの映像データである場合は、そのメタデータひな形生成部313がメタデータのひな形を作成し(ステップS3020)、これを映像データバッファ340のメタデータ格納部342に格納しておく(ステップS3030)。また、映像データ入力部310は、既存のメタデータが付随している映像データである場合は、そのメタデータひな形生成部313は、メタデータのひな形を作成することなく、その既存のメタデータを映像データバッファ340のメタデータ格納部342に格納して展開しておく(ステップS3030)。
このように、本実施例の動画メタデータ付与部300では、メタデータの付与されている映像(MPEG2−TS等)とメタデータの付与されていない映像とを共通に扱うことを可能としている。
そして、映像データ入力部310では、そのフレーム画像取得部311が入力映像Iinの映像データからメタデータを付与するフレーム画像Ifを取得するともに(ステップS3040)、画像特徴ベクトル算出部312は、そのフレーム画像の画像特徴を表現する画像特徴ベクトルFvを算出し(ステップS3050)、映像データバッファ340の画像特徴ベクトル格納部341へ算出した画像特徴ベクトルFv(すなわち、画像特徴ベクトルFv_QUERY)を保存する(ステップS3060)。さらに、映像データ入力部310は、そのフレーム画像を取得した入力映像Iinの映像データ自体も、映像データバッファ340の映像データ格納部343へ保存する(ステップS3070)。
このようにして、映像データバッファ340の画像特徴ベクトル格納部341に画像特徴ベクトルFv_QUERYが保存され、メタデータ格納部342にメタデータが保存されると、メタデータ付与部330及び画像データベース検索部320によって、画像特徴ベクトル格納部341に保存された画像特徴ベクトルFv_QUERYを基に、その入力映像Iinの取得したフレーム画像Ifに適したキーワード群[kw]を、画像データベース200を検索して決定する作業が行われる(ステップS3080)。
より具体的には、メタデータ付与部330の画像特徴ベクトル読込部331によって、入力映像Iinの映像データから取得したフレーム画像Ifの画像特徴ベクトルFv_QUERYが画像データベース検索部320に読み込まれると、画像データベース検索部320は、例えば、図15に示したように、画像特徴ベクトルFv_QUERYに最も近接した画像特徴ベクトルfviを画像データベース200から抽出し、その画像ベクトルfviに関連付けられているキーワードkwを、その画像特徴ベクトルFv_QUERYで表されるフレーム画像Ifの内容や特徴を説明する情報として決定する(ステップS3080)。
そして、メタデータ付与部330及び画像データベース検索部320によって、メタデータとして対応するフレーム画像Ifの内容や特徴を説明する情報としてのキーワードkwが決定されると(ステップS3080)、メタデータ付与部330のメタデータ書込部332は、映像データバッファ340中のメタデータ格納部342に記憶されている対応するメタデータを、この決定した決定するキーワードkwに基づいて更新する(ステップS3090)。
そして、映像データ入力部310,メタデータ付与部330,及び画像データベース検索部320では、上述のステップS3040〜S3090で示したフレーム単位の処理を、映像データバッファ340中のメタデータ格納部342に記憶されている入力映像Iinのフレーム全てについて終了するまで(ステップS3100)、繰り返し行う。その上で、動画メタデータ付与部300の映像データ出力部350からは、フレーム単位で画像の内容や特徴を説明する情報を含むメタデータが付加された映像データIoutが映像出力される。
このようにして、本実施の形態のメタデータ付与装置10の動画メタデータ付与部300では、上述した動画メタデータ付与方法により、1フレーム単位で入力映像Iinの内容や特徴を説明したメタデータ付与が行われる。
そして、上述した動画メタデータ付与方法によれば、人手を必要とすることなく、映像の1フレーム毎に対して、画像の内容や特徴を説明したメタデータを付与していくことができ、非常に有用である。また、この画像の内容や特徴を説明したメタデータを入力映像Iinの1フレーム毎に付与する必要がない場合は、例えば、連続するフレーム画像間でそれぞれの内容や特徴についての変化が乏しいような場合には、数フレーム毎に上述のメタデータ付与を行うことで、メタデータ付与に必要なリソースを削減することもできる。
なお、上述した動画メタデータ付与方法における、映像データ出力部350におけるメタデータと、入力映像Iinの映像データの対応するフレームとの同期方法については、上記説明した以外にも、種々の同期方法がある。例えば、入力映像Iin内のフレームと同期する情報(タイムコード等)を用いれば、映像ファイルとは別ファイルにメタデータを用意して、映像ファイルとメタデータファイルとを別々に一緒に出力しても問題ない。さらに、入力されるリアルタイム情報に対して、後述するシーンの区切れ(シーンの転換点)等に対応した特定のメタデータが発生した時点で、イベントを発生させるといったシステムを構築することも当然可能である。
<第2の実施の形態>
前述した第1の実施の形態の、入力映像Iinの1フレーム毎又は数フレーム毎にメタデータを付与していくメタデータ付与装置10では、例えば、同じシーンが連続している部分(動きがほとんどない映像区間)を有する入力映像Iinの場合でも、入力映像Iinの1フレーム毎に、映像自身の内容や情報を説明する情報を含むメタデータを決定して付与していくため、入力映像Iinに対するメタデータ付与方法が合理的ではない。
そのため、このような同じようなシーンが連続している部分を有する入力映像Iinについては、意味的に連続したある区間では、画像自身の内容や情報を説明する情報を含むメタデータとして、その区間を形成する連続した複数のフレームに、その区間の内容や特徴を表す適切な共通な情報を付与していく方がより望ましい。
そこで、本実施の形態のメタデータ付与装置10は、その動画メタデータ付与部300が、前述した第1の実施の形態とは異なり、入力映像Iinの画像データの中、メタデータを付与する区間を決定し、その付与区間内で適切なメタデータを選定する構成になっている。
<共通する構成、相違する構成>
本実施の形態のメタデータ付与装置10は、その概略構成レベルに関して、図1に示した第1の実施の形態のメタデータ付与装置10の概略構成と変わることはない。そして、その画像データ収集部100の構成についても、図2,図6又は図8に示した前述した第1の実施の形態の画像データ収集部100の構成と同じである。
本実施の形態のメタデータ付与装置10では、その動画メタデータ付与部300の構成が、その概略構成レベルに関しては図12に示した前述した第1の実施の形態の動画メタデータ付与部300の構成と変わることはないが、その各部の構成が、上記した課題の関係から、一部異なるようになっている。
そのため、本実施の形態によるメタデータ付与装置10を説明するに当たっては、前述した第1の実施の形態のメタデータ付与装置10との相違部分についてのみ説明し、同一及び同様な部分については、同一符号を付し、その詳細な説明は省略する。
<動画メタデータ付与部>
図19は、本実施の形態に係るメタデータ付与装置の、動画メタデータ付与部における映像データ入力部の実施例の構成図である。
動画メタデータ付与部300の映像データ入力部310は、フレーム画像取得部311と、画像特徴ベクトル算出部312と、メタデータひな形生成部313とに加えて、付与区間検出部314が設けられている。
映像データ入力部310は、第1の実施の形態の場合と同様に、メタデータを付与したい分類対象の入力映像Iinを動画メタデータ付与部300へ取り込むための窓口として機能する。
付与区間検出部314は、画像特徴ベクトル算出部312から、フレーム画像取得部311が入力画像Iinの時間経過に沿って取得する各フレーム画像の画像特徴ベクトルの算出結果が供給される構成になっている。付与区間検出部314は、この画像特徴ベクトル算出部312から供給される画像特徴ベクトルの変化の度合いが予め設定されている所定条件に適合したか否かを監視して、類似画像からなるフレーム画像Ifが入力映像Iinの時間経過に沿って連続する区間、すなわち画像自身の内容や特徴を説明する情報に関して同じ情報をメタデータとして付与する区間を検出する。
そのため、付与区間検出部314は、例えば、画像特徴ベクトル算出部312から入力映像Iinの時間経過に沿って順次供給される画像特徴ベクトルの算出結果の変化が急激であるならば、入力映像Iinにおける意味的なシーン(ショット)が変化したと認識する類似区間認識アルゴリズムや、入力映像Iinにおける2つのシーンがフレーム間で切換わるカット点を検出するカット点検出アルゴリズム、等を用いて、入力映像Iinにおけるシーンの区切れ(シーンの転換点)を検出する。そして、付与区間検出部314は、シーンの区切れを検出すると、例えば、シーンの転換点に該当することを示す情報を、メタデータひな形生成部313によって生成された映像データバッファ340中のメタデータ格納部342に格納されている、このシーンの区切れの始まりに該当するフレームのひな形のメタデータに追加して更新する。
これにより、類似する意味的なシーン(ショット)が連続する類似区間に該当する、連続した複数のフレーム画像それぞれを対象に、換言すれば,あるシーンの転換点から次のシーンの転換点までの区間を形成するフレーム画像Ifそれぞれを対象に、後述のメタデータ付与部330及び画像データベース検索部320によって、映像自身の内容や特徴を説明するための同じキーワードkwを付与することが可能になっている。そのため、映像データバッファ340中のメタデータ格納部342には、この付与区間検出部314によって、事前に同じキーワードkwを付与するフレーム画像の区間が定義できるようになっている。
具体的には、動画メタデータ付与部300では、ある1つのフレーム画像Ifiが、入力映像Iinの形成順(入力映像Iinの時間経過)で隣り合うその前・後のフレーム画像Ifi-1,Ifi+1と全く類似関係にない場合は、付与区間検出部314によって、このある1つのフレーム画像Ifiに対して1対1に対応した1つの付与区間が与えられることなる。この場合、このある1つのフレーム画像Ifiに対応するメタデータには、シーンの転換点に該当することを示す情報が追加され、次の後のフレーム画像Ifi+1に対応するメタデータにも、シーンの転換点に該当することを示す情報が追加されて、このある1つのフレーム画像Ifiが1対1に対応した1つの付与区間が与えられることになる。
本実施の形態の映像データバッファ340は、図13に示した映像データバッファ340と同様に、入力映像Iinの形成順(入力映像Iinの時間経過)に沿ってフレーム画像毎の算出した画像特徴ベクトルFvが格納される画像特徴ベクトル格納部341,入力映像Iinの内容や特徴を説明する情報を入力映像Iinのフレーム単位で埋め込むためのひな形のメタデータが入力映像Iinのフレーム画像Ifに対応付けて格納されるメタデータ格納部342,及び入力映像Iinの映像データをそのまま一時保存する映像データ格納部343が形成されている。
さらに本実施の形態では、ひな形のメタデータが格納されるメタデータ格納部342は、さらに、同じキーワードkwを付与するフレーム画像の区間を示すためのシーンの転換点に該当することを示す情報が、付与区間検出部314によってシーンの転換点に該当するフレーム画像に対応したひな形のメタデータに追加されて更新されるようになっている点が、図13に示した映像データバッファ340の場合と異なる。
図20は、本実施の形態に係るメタデータ付与装置の、動画メタデータ付与部におけるメタデータ付与部の実施例の構成図である。
メタデータ付与部330は、図14に示した第1の実施の形態に係るメタデータ付与装置のメタデータ付与部330と同様に、画像特徴ベクトル読込部331と、メタデータ書込部332とが備えられているとともに、さらに、メタデータ読込部333,キーワードバッファ334,及びキーワード決定部335が追加して備えられている。
メタデータ読込部333は、映像データバッファ340中のメタデータ格納部342に格納されている、同じキーワードkwを付与するメタデータ付与区間を示すためのシーンの転換点に該当することを示す情報に基づいて、フレーム毎のひな形としてのメタデータを、入力映像Iinの形成順(入力映像Iinの時間経過)に沿って、メタデータ付与区間毎に分けて読み込む。
メタデータ読込部333は、1つのメタデータ付与区間を形成する1又は複数のフレーム画像に対応したひな形のメタデータを読み込む度に、そのメタデータ付与区間における全フレーム画像分のひな形のメタデータを、そのフレーム画像の形成順どおりに、画像特徴ベクトル読込部331と、メタデータ書込部332とにそれぞれ供給する。
画像特徴ベクトル読込部331は、第1の実施の形態の場合とは少し異なり、メタデータ読込部333から、あるメタデータ付与区間における全フレーム画像分のメタデータそれぞれが供給されると、このあるメタデータ付与区間の全フレーム画像それぞれに対応する画像特徴ベクトルFv_QUERYを、映像データバッファ340の画像特徴ベクトル格納部341から全て読み込む。
そして、画像特徴ベクトル読込部331は、このあるメタデータ付与区間における全てのフレーム画像それぞれに対応する画像特徴ベクトルFv_QUERYを、入力映像Iinにおけるフレーム画像の形成順、すなわちメタデータ付与区間におけるフレーム順に沿って、画像データベース検索部320に順次供給する。
画像データベース検索部320は、この画像特徴ベクトル読込部331からその形成順で供給される、メタデータ付与区間に含まれるフレーム画像それぞれの画像特徴ベクトルFv_QUERYについて、画像データベース200に格納されている画像特徴ベクトルfvの中から、予め定められた所定条件の範囲内で類似している画像特徴ベクトルfviと、その画像特徴ベクトルfviに対応したキーワード群[kw]とを検索する。
ここで、この予め定められた所定条件の範囲内で類似している画像特徴ベクトルfviとは、その画像特徴ベクトルFv_QUERYの周辺の画像特徴ベクトル空間、すなわちその画像特徴ベクトルFv_QUERYに対して所定距離tの範囲内の画像特徴ベクトル空間に指す点が所在する1又は複数の画像特徴ベクトルfviである。
図21は、上述した本実施の形態に係るメタデータ付与装置の、画像データベース検索部によるキーワード取得についての説明図である。
図21では、あるメタデータ付与区間のフレーム画像の画像特徴ベクトルFv_QUERYとして、説明簡便のため、画像特徴ベクトル読込部331から3つの画像特徴ベクトルFv_QUERY(すなわち、Fv_QUERY1,Fv_QUERY2,Fv_QUERY3)が供給されたものとして説明する。
図21において、図中、十字○印で示した各点は、画像特徴ベクトルFv_QUERY1,Fv_QUERY2,Fv_QUERY3それぞれが画像特徴ベクトル空間内で指す点であり、この十字○印の各点を中心とした破線で示された円形の範囲内は、画像特徴ベクトルFv_QUERY1,Fv_QUERY2,Fv_QUERY3それぞれに関しての所定距離tの範囲内の、画像特徴ベクトル空間内の検索対象領域である。
画像データベース検索部320は、例えば、図中で十字○印の点で示した、同じメタデータ付与区間に含まれるフレーム画像の画像特徴ベクトルFv_QUERY(すなわち、Fv_QUERY1,Fv_QUERY2,Fv_QUERY3)毎に、画像データベース200から、画像特徴ベクトルFv_QUERYに対して所定距離tの範囲内の画像特徴ベクトル空間に指す点が所在する画像特徴ベクトルfvi全てと、その各画像特徴ベクトルfviに対応したキーワード群[kw]とを検索する。
図21において、黒く塗り潰した黒丸印‘●’の個々の点、又は中抜き丸印‘○’の個々の点は、画像データ収集部100によって収集され画像データベース200に格納されているウェブページ上の各画像iの画像特徴ベクトルfviそれぞれが指す点に該当する。
ここで、例えば、画像データベース検索部320が、メタデータ付与区間内に含まれる1つのフレーム画像の画像特徴ベクトルFv_QUERYについて、図10に示した画像データベース200から、この画像特徴ベクトルFv_QUERYに対して所定距離tの範囲内の画像特徴ベクトル空間内にその指す点が所在する画像特徴ベクトルfviを検索し、画像特徴ベクトルfv,fv2,fv3,fv4,fv5と、この画像特徴ベクトルfv,fv2,fv3,fv4,fv5,…それぞれに対応したキーワード群[kw_a],[kw_b, kw_c, kw_d],[kw_a],[kw_d],[kw_b,kw_d] ,…とを取得した場合を想定する。
本実施の形態では、上述したようにして、画像データベース検索部320は、画像特徴ベクトルFv_QUERYから所定距離tの範囲内の画像特徴ベクトルfv,fv2,fv3,fv4,fv5,…、及びこの画像特徴ベクトルfv,fv2,fv3,fv4,fv5,…それぞれに対応するキーワード群[kw_a],[kw_b, kw_c, kw_d],[kw_a],[kw_d],[kw_b,kw_d] ,…を画像データベース200から検索すると、前述した第1の実施の形態とは異なり、この取得したキーワード群[kw_a],[kw_b, kw_c, kw_d],[kw_a],[kw_d],[kw_b,kw_d] ,…から、この画像特徴ベクトルFv_QUERYで表される1つのフレーム画像の内容や特徴を説明する情報としてのキーワード群[kw]を決定しない構成になっている。
その代わりに、本実施の形態の画像データベース検索部320は、キーワードバッファ334にメタデータ付与区間に対応して作成されている、図22に示すようなキーワードテーブル334tに、今回取得したキーワード群[kw_a],[kw_b, kw_c, kw_d],[kw_a],[kw_d],[kw_b,kw_d] ,…から抽出されたキーワードkw_a,kw_b,kw_c,kw_d,…に対応付けて、そのキーワードkwを含む検索結果の画像特徴ベクトルfvを追加格納する。
図22は、キーワードバッファに形成され、画像データベース検索部が検索した画像特徴ベクトル及びそのキーワード群を格納するキーワードテーブルの一実施例を示した図である。
キーワードバッファ334には、メタデータ付与区間に対応して、キーワードkwの違い (kw_a,kw_b,kw_c, kw_d,kw_d,…)別に、それぞれのキーワードkwを有する画像特徴ベクトルFv_QUERYの周辺の画像特徴ベクトルfvi ([fv,fv3],[fv,fv3,fv5],[fv2],[fv2,fv4,,fv5,],[fv23],…)を格納するためのキーワードテーブル334tが形成される。すなわち、このキーワードバッファ334のメタデータ付与区間に対応したキーワードテーブル334tは、そのメタデータ付与区間におけるキーワードkw(kw_a,kw_b,kw_c, kw_d,kw_d,…)毎に、そのキーワードkwをキーワード群[kw] に含む画像特徴ベクトルfviを格納したヒストグラムとして機能し、キーワードテーブル334tでは、この画像特徴ベクトルfviの数によってメタデータ付与区間内のキーワードkw毎の重み付けがなされる。
キーワード決定部335は、図22で説明したような、キーワードバッファ334のキーワードテーブル334tに格納されている、メタデータ付与区間毎の相異なるキーワードkwそれぞれに該当する画像特徴ベクトルfviのヒストグラムの一時記憶内容に基づいて、このメタデータ付与区間に含まれる画像特徴ベクトルFv_QUERY全てに対して(例えば、図21に示すメタデータ付与区間においては、画像特徴ベクトルFv_QUERY1,Fv_QUERY2,Fv_QUERY3それぞれに対して)付与するための、共通の映像自身の内容や特徴を説明する情報としてのキーワードkw又はキーワード群[kw]を、統計処理を用いて決定する。そして、キーワード決定部335は、メタデータ付与区間毎に決定した、メタデータ付与区間を形成するフレーム画像それぞれに共通のキーワードkw又はキーワード群[kw]を、メタデータ書込部332に供給する。
キーワード決定部335は、上述したメタデータ付与区間毎のフレーム画像全てに関しての共通なキーワードkw及びキーワード群[kw]の決定を、例えば、対応付けられて格納されている特徴ベクトルfviの数が最も多いキーワードkwや、対応付けられて格納されている特徴ベクトルfviの数が多い上位N個のキーワードkwを抽出して、この抽出した最も多いキーワードkw、又はこの最も多いキーワードkwをも含めた上位N個のキーワードkwからなるキーワード群[kw]を、該当するメタデータ付与区間におけるフレーム画像それぞれに共通のはキーワード群[kw]として決定する。
メタデータ書込部332は、このキーワード決定部335から、メタデータ付与区間毎に決定された、そのメタデータ付与区間に含まれるフレーム画像それぞれに共通なキーワード群[kw]の供給を受ける度に、そのメタデータ付与区間毎におけるフレーム画像それぞれにキーワード群[kw]を、ひな形のメタデータとの同期をとって、映像データバッファ340のメタデータ格納部342に格納されている該当メタデータ付与区間のフレーム画像のひな形のメタデータに追加して更新する。
したがって、本実施の形態の場合は、映像データバッファ340中の、入力映像Iinにおける形成順(入力映像Iinの時間経過)に沿ったフレーム画像それぞれのひな形のメタデータにおける、メタデータ付与区間に該当するひな形のメタデータ部分には、第1の実施の形態で説明したように個々のフレーム画像と1対1に対応して決定されたキーワードキーワード群[kw]ではなく、メタデータ付与区間の複数のフレーム画像に対応して決定された共通なキーワード群[kw]が追加更新されて、メタデータ付与区間を形成するフレーム画像それぞれで、映像自身の内容や特徴を表す情報が同じになる。そのため、入力映像Iinにおける、同じシーンが連続して意味的に連続した区間では、その区間を形成する連続した複数のフレームそれぞれに、メタデータとしてその区間の内容や特徴を表す共通な情報を付与していくことができる。
図23は、図20に示した動画メタデータ付与部による動画メタデータ付与処理のフローチャートである。
図23に示すように、本実施例の動画メタデータ付与部300は、まず、入力映像Iinが供給されると、映像データ入力部310は、入力映像Iinの映像データがMPEG2−TS等の、MPEG−7やTV-Anytime等といった既存のメタデータが付随している映像データであるか、映像情報だけの映像データであるかの判別を行う(ステップS3010)。映像データ入力部310は、入力映像Iinの映像データが映像情報だけの映像データである場合は、そのメタデータひな形生成部313がメタデータのひな形を作成し(ステップS3020)、これを映像データバッファ340のメタデータ格納部342に格納しておく(ステップS3030)。また、映像データ入力部310は、既存のメタデータが付随している映像データである場合は、そのメタデータひな形生成部313は、メタデータのひな形として、その既存のメタデータを映像データバッファ340のメタデータ格納部342にそのまま格納して展開しておく(ステップS3030)。
そして、映像データ入力部310は、そのフレーム画像取得部311が入力映像Iinの映像データからメタデータを付与するフレーム画像Ifを取得するともに(ステップS3040)、画像特徴ベクトル算出部312は、そのフレーム画像の画像特徴を表現する画像特徴ベクトルFvを算出し(ステップS3050)、映像データバッファ340の画像特徴ベクトル格納部341へ算出した画像特徴ベクトルFv(すなわち、画像特徴ベクトルFv_QUERY)を保存する(ステップS3060)。
また、映像データ入力部310の付与区間検出部314は、画像特徴ベクトル算出部312で算出した画像特徴ベクトルFvに基づいて、類似区間認識アルゴリズムや、カット点検出アルゴリズム、等を用いて、入力映像Iinにおけるシーンの区切れ(シーンの転換点)を検出し、シーンの転換点に該当することを示す情報を、メタデータひな形生成部313によって生成された映像データバッファ340中のメタデータ格納部342に格納されている、このシーンの区切れの始まりに該当するフレームのメタデータ部分に追加して更新することによって、キーワードkwの付与区間を定義する(ステップS3062)。
加えて、映像データ入力部310は、そのフレーム画像を取得した入力映像Iinの映像データ自体も、映像データバッファ340の映像データ格納部343へ保存する(ステップS3070)。
映像データ入力部310は、上述のステップS3040〜S3070で示したフレーム単位の処理を、映像データバッファ340中のメタデータ格納部342に記憶されている入力映像Iinのフレーム全てについて終了するまで(ステップS3100)、繰り返し行う。
その一方で、動画メタデータ付与部300のメタデータ付与部330では、次のような処理を行う。
メタデータ付与部330では、そのキーワードバッファ334に、図22で説明したような、画像データベース200から検索した画像特徴ベクトルfvi及び該当するキーワードkwを対応付けて一時記憶するための、キーワードkwの付与区間毎に対応したキーワードテーブル334tを作成する(ステップS3110)。
メタデータ読込部333は、映像データ入力部310の付与区間検出部314によってシーンの転換点に関する情報が追加更新された映像データバッファ340のメタデータ格納部342から、メタデータ付与区間を形成する1又は複数のフレーム画像に対応したひな形のメタデータを読み込み、そのメタデータ付与区間における全フレーム画像分のひな形のメタデータを、そのフレーム画像の形成順どおりに、画像特徴ベクトル読込部331と、メタデータ書込部332とにそれぞれ供給する(ステップS3120)。
画像特徴ベクトル読込部331は、そのメタデータ付与区間の全フレーム画像それぞれに対応する画像特徴ベクトルFv_QUERYを、映像データバッファ340の画像特徴ベクトル格納部341から順番に読み込む(ステップS3130)。
画像データベース検索部320は、画像特徴ベクトル読込部331からメタデータ付与区間の形成順で供給される、メタデータ付与区間内の1つフレーム画像の画像特徴ベクトルFv_QUERYを取得し、画像データベース200に格納されている画像特徴ベクトルfvの中から、予め定められた所定条件の範囲内で類似している画像特徴ベクトルfviそれぞれを検索し、この検索した画像特徴ベクトルfviで表される画像の内容や特徴を表す情報としてのキーワード群[kw]を取得する(ステップS3140)。
画像データベース検索部320は、この類似している画像特徴ベクトルfviと、各画像特徴ベクトルfvi毎に取得した、その画像特徴ベクトルfviで表される画像の内容や特徴を表す情報としてのキーワードkw又はキーワード群[kw]に含まれるキーワードkwとを、キーワードバッファ334に作成されたこのメタデータ付与区間に対応するキーワードテーブル334tに対応付けて追加格納し、図22に示すような、キーワードkw毎の、画像データベース200から検索した画像特徴ベクトルfviを示したヒストグラムを作成する(ステップS3150)。
画像特徴ベクトル読込部331及び画像データベース検索部320では、上述のステップS3140〜S3150で示した画像データベース200の検索処理が、映像データバッファ340中のメタデータ格納部342に記憶されている入力映像Iinのメタデータ付与区間のフレーム全てについて終了するまで(ステップS3160)、繰り返し行われる。
メタデータ付与部330では、メタデータ付与区間のフレーム全てについての画像データベース200の検索処理を終了すると(ステップS3160)、キーワード決定部335が、キーワードバッファ334に形成されたこのメタデータ付与区間に対応したキーワードテーブル334tによる、キーワードkw別の画像特徴ベクトルfviのヒストグラムに基づいて、このメタデータ付与区間に付与するキーワードkw又はキーワード群[kw]を決定する(ステップS3170)。
メタデータ書込部332は、この決定されたメタデータ付与区間のキーワードkw又はキーワード群[kw]をキーワード決定部335から受け、映像データバッファ340中のメタデータ格納部342に格納されている、該当するメタデータ付与区間のフレームのひな形のメタデータに追加して更新する(ステップS3180)。
そして、動画メタデータ付与部300では、上述のステップS3120〜S3180で示したメタデータ付与区間の処理が、映像データバッファ340中のメタデータ格納部342に記憶されている入力映像Iinのメタデータ付与区間全てについて終了するまで(ステップS3190)、繰り返し行われる。
このようにして、本実施の形態のメタデータ付与装置10の動画メタデータ付与部300では、上述した動画メタデータ付与方法により、入力映像Iinにおける、同じシーンが連続して意味的に連続した区間では、その区間を形成する連続した複数のフレームそれぞれに、メタデータとしてその区間の内容や特徴を表す共通な情報を付与していくことができる。
また、本実施の形態のメタデータ付与装置10では、メタデータ付与部330の画像データベース検索部320は、第1の実施の形態の画像データベース検索部320のように、画像特徴ベクトルFv_QUERYで表される1つのフレーム画像についての内容や特徴を説明する情報としてのキーワード群[kw]を決定しない構成になっている。その理由について、図21を用いて具体的に説明する。
図21において、あるメタデータ付与区間のフレーム画像の画像特徴ベクトルFv_QUERYとして、画像特徴ベクトル読込部331から3つの画像特徴ベクトルFv_QUERY1,Fv_QUERY2,Fv_QUERY3が供給されている場合を想定する。
仮に、図21において、黒丸印‘●’の点で表された、画像データベース200に格納されている各画像特徴ベクトルfviは、その対応付けられているキーワード群[kw]にキーワードkw_fだけしか含まれておらず、同様に中抜き丸印‘○’の点で表された画像データベース200に格納されている各画像特徴ベクトルfviも、その対応付けられているキーワード群[kw]にキーワードkw_gだけしか含まれていない場合を、想定する。
この場合、動画メタデータ付与部300、特に画像データベース検索部320の構成が第1の実施の形態の動画メタデータ付与部300、特に画像データベース検索部320のように、メタデータ付与区間を考慮せず、個々のフレーム画像と1対1に対応したキーワードkw又はキーワード群[kw]を決定するものであると、図21に示すような場合は、同じようなシーンのフレーム画像であっても、換言すれば、映像の内容や特徴を説明するためのメタデータが変化してほしくない部分であっても、メタデータがメタデータ付与区間内のフレーム画像毎に変化してしまう可能性がある。
具体的には、画像特徴ベクトルFv_QUERY1の場合は、例えば、その十字○印で指す点に最も近接している黒丸印‘●’ の点で表された画像特徴ベクトルfviのキーワードkw_fが、同様にして、画像特徴ベクトルFv_QUERY2に関しては,最も近接している中抜き丸印‘○’の点で表された画像特徴ベクトルfviのキーワードkw_fが、画像特徴ベクトルFv_QUERY3それぞれに関しては、最も近接している黒丸印‘●’ の点で表された画像特徴ベクトルfviのキーワードkw_fが、キーワードkwとして検索されることになる。
これに対して、本実施の形態のメタデータ付与装置10における動画メタデータ付与部300の画像データベース検索部320の場合は、ステップS3140,S3150で示した画像データベース200の検索処理を、入力映像Iinのメタデータ付与区間のフレーム画像全てについて行った後、同じ若しくは類似するシーンについてのフレーム画像が連続するメタデータ付与区間を考慮して、このメタデータ付与区間のフレーム全体についての画像データベース200の検索処理結果に基づいて、メタデータ付与区間のキーワード群[kw]を決定するので、メタデータがメタデータ付与区間内のフレーム画像毎に変化してしまうことがない。
また、本実施の形態においては、動画メタデータ付与部300の画像データベース検索部320では、メタデータ付与区間に含まれるフレーム画像それぞれの画像特徴ベクトルFv_QUERYについて、画像データベース200に格納されている画像特徴ベクトルfvの中から、予め定められた所定条件の範囲内で類似している画像特徴ベクトルfviと、その画像特徴ベクトルfviに対応したキーワード群[kw]とを検索する構成になっている。
そこで、同じメタデータ付与区間に含まれる、相異なるフレーム画像の画像特徴ベクトルFv_QUERYそれぞれについて画像データベース検索部320が画像データベース200を検索して得た画像特徴ベクトルfvが重複するような場合、すなわち、同じメタデータ付与区間に含まれる、相異なるフレーム画像それぞれの画像データベース200を検索するための距離tの範囲が互いに重なり合うような場合には、両画像特徴ベクトルFv_QUERYで画像データベース200から重複して検索される画像特徴ベクトルfvに関し、キーワードバッファ334の該当するキーワード付与区間のキーワードテーブルに、同じキーワードkwに対応して同じ画像特徴ベクトルfvが重複して格納されないようにすることによって、所定条件の範囲を決定する距離tの大きさ等に基づいたフレーム間での検索対象領域の重複による影響を解消できる。
具体的には、画像データベース検索部320が、画像データベース200からの検索で取得した画像特徴ベクトルfviを、同じく取得した対応するキーワード群[kw]のキーワードkwそれぞれに基づいて、キーワードバッファ334のメタデータ付与区間のキーワードテーブル334tに格納する際、既にキーワードテーブル334tの同じキーワードkwに対応して、今回取得した画像特徴ベクトルfviは既に格納されているか否かを確認する。そして、画像データベース検索部320は、既に格納されている場合には、このキーワードkwについてキーワードテーブル334tへの格納を取り止めたり、既に格納されているキーワードkwに上書きして、重複しないように格納する。
<第2の実施の形態の変形例>
上述した第2の実施の形態の動画メタデータ付与部300の画像データベース検索部320において、反対に、キーワード付与区間に含まれる形成順が連続したフレーム画像それぞれの画像データベース200を検索するための距離tが小さい場合は、例えば図24に示した画像特徴ベクトルFv_QUERY1,Fv_QUERY2,Fv_QUERY3それぞれの距離(半径)tで規定される所定条件の範囲同士の間に隙間領域が介在し、この隙間領域に指す点が位置する画像データベース200の画像特徴ベクトルfviに対応したキーワード群[kw]が、キーワード付与区間に含まれるフレーム画像の画像特徴ベクトルFv_QUERY(Fv_QUERY1,Fv_QUERY2,Fv_QUERY3)の決定に反映されない場合が生じるおそれがある。本変形例は、このような連続したフレーム画像の画像特徴ベクトルFv_QUERY(Fv_QUERY1,Fv_QUERY2,Fv_QUERY3)間の隙間領域に所在する画像データベース200の画像特徴ベクトルfviをも、キーワード付与区間に含まれるフレーム画像の画像特徴ベクトルFv_QUERY(Fv_QUERY1,Fv_QUERY2,Fv_QUERY3)の決定に反映できるようにして、キーワード付与区間に含まれるフレーム画像に対してより的確なキーワード群[kw]を設定できるようにしたものである。
図24は、本変形例に係るメタデータ付与装置の、画像データベース検索部によるキーワード取得についての説明図である。
本変形例のメタデータ付与装置10の場合、その動画メタデータ付与部300の画像データベース検索部320の構成が、上述した第2の実施の形態のメタデータ付与装置10の場合と異なる。
本変形例の画像データベース検索部320は、画像特徴ベクトル読込部331からその形成順で供給される、メタデータ付与区間に含まれるフレーム画像それぞれの画像特徴ベクトルFv_QUERYについて、メタデータ付与区間内の画像特徴ベクトルFv_QUERY全てをその形成順に一時保持し、メタデータ付与区間内の画像特徴ベクトルFv_QUERYそれぞれの画像特徴ベクトル空間内の指す点(図24中、十字○印で表された各点)を、対応するフレーム画像それぞれの形成順に通る曲線からなる、メタデータ付与区間内の画像特徴ベクトルFv_QUERYの移動軌跡Lを作成する。
したがって、この作成された画像特徴ベクトルFv_QUERYの移動軌跡Lの始点は、メタデータ付与区間における形成順が最初のフレーム画像の画像特徴ベクトルFv_QUERY(図24では、画像特徴ベクトルFv_QUERY1が該当する)が画像特徴ベクトル空間内で指す点になり、移動軌跡Lの終点は、メタデータ付与区間における形成順が最後のフレーム画像の画像特徴ベクトルFv_QUERY(図24では、画像特徴ベクトルFv_QUERY3が該当する)が画像特徴ベクトル空間内で指す点に対応する。
その上で、本変形例の画像データベース検索部320は、このメタデータ付与区間内の画像特徴ベクトルFv_QUERYの移動軌跡Lに基づいて、画像データベース200に対する検索対象領域を作成する。本変形例の画像データベース検索部320の場合、検索対象領域として、このメタデータ付与区間内の画像特徴ベクトルFv_QUERYの移動軌跡L上から、予め定められた所定条件(図24では、距離tが該当する)に基づいた検査対象領域を作成する。
画像データベース検索部320は、このメタデータ付与区間内の画像特徴ベクトルFv_QUERYの移動軌跡L上から距離tの範囲内の検索対象領域で、画像データベース200から、その指す点がこの検索対象領域内に所在している画像特徴ベクトルfvi全てを、このメタデータ付与区間内のフレーム画像の少なくともいずれかと類似する画像特徴ベクトルfvとして検索して抽出する。
その上で、画像データベース検索部320は、この抽出した画像特徴ベクトルfviそれぞれと、この各画像特徴ベクトルfviに対応したキーワード群[kw]とを対応付けて、メタデータ付与部330に検索結果として供給する構成になっている。
そして、画像データベース検索部320は、図22に示したキーワードバッファ334にメタデータ付与区間に対応して形成されている、キーワードkwの違い別に、それぞれのキーワードkwを有する画像特徴ベクトルFv_QUERYの周辺の画像特徴ベクトルfvi を格納するためのキーワードテーブル334tに、検索した画像特徴ベクトルfviそれぞれと、この各画像特徴ベクトルfviに対応したキーワード群[kw]に含まれるキーワードkwとを格納していく構成になっている。
なお、このキーワードテーブル334tに基づいて、キーワード決定部335が、上述したメタデータ付与区間毎のフレーム画像全てに関しての共通なキーワード群[kw]の決定を行う処理及びそのための構成については、本変形例のメタデータ付与装置10の場合も、上述した第2の実施の形態のメタデータ付与装置10の場合も同じである。
したがって、本変形例の画像データベース検索部320を用いたメタデータ付与装置10によれば、メタデータ付与区間毎についてのキーワード群[kw]の決定のために用いる画像特徴ベクトルfviの母数が、キーワード付与区間に含まれる形成順が連続したフレーム画像それぞれの画像データベース200を検索するための所定条件の範囲を規定する距離dが小さい場合であっても、メタデータ付与区間内の画像特徴ベクトルFv_QUERYの移動軌跡Lに沿って隣り合う画像特徴ベクトルFv_QUERYの範囲同士の間に隙間領域が介在することがないので、その決定のために用いる画像特徴ベクトルfvi の母数をより多く、合理的に利用することができ、より適切なキーワード群[kw]の決定ができる。
<第3の実施の形態>
本実施の形態のメタデータ付与装置10は、その動画メタデータ付与部300が、第2の実施の形態によるメタデータ付与装置10と同様に、入力映像Iinの画像データの中、メタデータを付与する区間を決定し、その付与区間内で適切なメタデータを選定する構成になっている。
図25は、第3の実施の形態に係るメタデータ付与装置の、画像データベース検索部によるキーワード取得についての説明図である。
図25において、画像特徴空間に□印の点で指す点が表されている画像特徴ベクトルfvi それぞれは、それぞれ自身に対応したキーワード群[kw]にキーワードkw_pを含む、画像データベース200に格納されている画像特徴ベクトルfvi それぞれである。また、画像特徴空間に△印の点で指す点が表されている画像特徴ベクトルfvi それぞれは、それぞれ自身に対応したキーワード群[kw]にキーワードkw_qを含む、画像データベース200に格納されている画像特徴ベクトルfvi それぞれである。
そして、図中、実線又は破線で囲った領域の範囲内に所在する、□印又は△印で指す点が表されている点画像特徴ベクトルfviは、メタデータ付与装置10の動画メタデータ付与部300における、キーワードバッファ334のキーワードテーブル334tに保持されている画像特徴ベクトルfviと等価である。
これにより、メタデータ付与装置10では、その画像データベース検索部320が、キーワードテーブル334tに蓄積されているキーワードkw_p,kw_q,…の中で、どのキーワードkw_p,kw_qがどれほどの確からしさをメタデータ付与区間に対して有するかということが算出できる。
図25において、×印で示した2つの点は、あるメタデータ付与区間内の2つのフレーム画像それぞれの画像特徴ベクトルFv_QUERY(Fv_QUERY1,Fv_QUERY2)を示す。また、実線又は破線で囲った領域は、メタデータ付与区間内の画像特徴ベクトルFv_QUERY(Fv_QUERY1,Fv_QUERY2)、又はこれらの移動軌跡Lに対する、距離tの範囲内の、画像データベース200に格納された画像特徴ベクトルfvi の検索対象領域である。
ここでは、図25(a)において、2つのフレーム画像それぞれの画像特徴ベクトルFv_QUERY(Fv_QUERY1,Fv_QUERY2)を有するメタデータ付与区間に付与されるキーワード群[kw]が、キーワードkw_pを含むものであるか、キーワードkw_qを含むものであるかを判別するものとして説明する。
このような場合における、メタデータ付与区間に付与されるキーワード群[kw]としての唯一のキーワードkwの判定の仕方としては、
まず、各画像特徴ベクトルFv_QUERY1,Fv_QUERY2毎に対応したキーワード群[kw]としての唯一のキーワードkwの判定方法として、第1の実施の形態のメタデータ付与装置10の動画メタデータ付与部300のように、
(1-1) 図15で説明したように、画像特徴ベクトルFv_QUERY1,Fv_QUERY2それぞれの×印で示した画像特徴空 間内の指す点に対して、最も近接する画像データベース200に格納された画像特徴ベクトルfvi のキーワードkwを取得して判定する方法、
(1-2) 図16で説明したように、画像特徴ベクトルFv_QUERY1,Fv_QUERY2それぞれの×印で示した画像特徴空間内の指す点を中心に所定距離tの範囲内の検索対象領域に所在する、画像データベース200に格納された画像特徴ベクトルfvi の中で、最も多数の、又は上位N個の画像特徴ベクトルfviが有するキーワードkwを取得して判定する方法、
がある。
また、各画像特徴ベクトルFv_QUERY1,Fv_QUERY2がそれぞれ表すフレーム画像を含むメタデータ付与区間に付与される唯一のキーワードkwの判定方法としては、第2の実施の形態のメタデータ付与装置10の動画メタデータ付与部300のように、
(2-1) 予めメタデータ付与区間の画像特徴ベクトルFv_QUERY1,Fv_QUERY2毎に上記(1-1),(1-2)で述べた判定方法によって取得したキーワードkwそれぞれを基にして、画像特徴ベクトルFv_QUERYに付与されている最も数の多いキーワードkwや、画像特徴ベクトルの形成順に最も多く連続するキーワードkwを判定する方法(すなわち、第2の実施の形態に対する比較例として説明した、「個々のフレーム画像と1対1に対応したキーワードkw又はキーワード群[kw]を予め決定しておき、利用する」判定方法)、
(2-2) 第2の実施の形態のように、画像特徴ベクトルFv_QUERY1,Fv_QUERY2それぞれの×印で示した画像特徴空間内の指す点を基に、メタデータ付与区間内の画像特徴ベクトルFv_QUERY1,Fv_QUERY2を総合したメタデータ付与区間のための検索対象領域を設定し、この検索対象領域に所在する、画像データベース200に格納された画像特徴ベクトルfvi の中で、最も多数の画像特徴ベクトルfviが有するキーワードkwを取得して判定する方法、
がある。
さらに、前記(2-2)のメタデータ付与区間に付与される唯一のキーワードkwの判定方法における、メタデータ付与区間のための検索対象領域としては、
(3-2) 図21を用いて説明した第2の実施の形態のような、画像特徴ベクトルFv_QUERY1,Fv_QUERY2それぞれの×印で示した画像特徴空間内の指す点を中心に所定距離tの範囲内の検索対象領域同士を合わせた論理和からなる領域を検索対象領域、
(3-2) 図24を用いて説明した第2の実施の形態の変形例のような、画像特徴ベクトルFv_QUERY1,Fv_QUERY2それぞれの×印で示した画像特徴空間内の指す点を基に、画像特徴ベクトルFv_QUERY1,Fv_QUERY2がそれぞれ表すフレーム画像の移動軌跡Lを作成し、この移動軌跡Lから所定距離tの範囲内の検索対象領域、
がある。
ここで、図25(a)に示した、画像特徴ベクトルFv_QUERY1,Fv_QUERY2にあっては、メタデータ付与装置10が、これら画像特徴ベクトルFv_QUERY1,Fv_QUERY2がそれぞれ表すフレーム画像を含むメタデータ付与区間に、唯一のキーワードkwを付与しようとした場合に、そのキーワードkwの判定について、特殊ケースとして、次のような問題点が生じる。
・例えば、メタデータ付与区間に付与する唯一のキーワードkwの判定方法として前記(2-1)の方法を用い、その画像特徴ベクトル毎のキーワードの判定方法としては前記(1-1)の方法を用いた場合には、画像特徴ベクトルFv_QUERY1に最も近接する画像データベース200に格納された画像特徴ベクトルは、△印の点で表される、特定のキーワードkw_qを含む画像特徴ベクトルfvi になるのに対して、画像特徴ベクトルFv_QUERY2に最も近接する画像データベース200に格納された画像特徴ベクトルは、□印の点で表される、特定のキーワードkw_pを含む画像特徴ベクトルfvi になるため、前記(1-1)の方法を用いてメタデータ付与区間に付与する唯一のキーワードkwを判定できない。これは、メタデータ付与区間に含まれる2つにフレーム画像それぞれの画像特徴ベクトルFv_QUERY1,Fv_QUERY2それぞれに対して、キーワードkw_q,kw_pが同じように近接しているため、メタデータ付与区間に付与するキーワードkwとしては、キーワードkw_q,kw_pいずれも確からしいことによるものである。
・例えば、メタデータ付与区間に付与される唯一のキーワードkwの判定方法として前記(2-1)の方法を用い、さらに、その画像特徴ベクトル毎のキーワードの判定方法としては前記(1-2)を用いた場合には、画像特徴ベクトルFv_QUERY1に対して所定距離tの範囲内にある画像データベース200に格納された画像特徴ベクトルfvi は、キーワードkw_qに対応した△印の点を指す画像特徴ベクトルfviの数が“3”、キーワードkw_pに対応した△印の点を指す画像特徴ベクトルfviの数が“3”になり、同様に、画像特徴ベクトルFv_QUERY2に対して所定距離tの範囲内にある画像データベース200に格納された画像特徴ベクトルfvi も、キーワードkw_qに対応した△印の点を指す画像特徴ベクトルfviの数が“3”、キーワードkw_pに対応した△印の点を指す画像特徴ベクトルfviの数が“3”になるため、前記(1-2)の方法を用いてメタデータ付与区間に付与する唯一のキーワードkwを判定できない。これは、画像特徴ベクトルFv_QUERY1,Fv_QUERY2いずれとも、その所定距離tの範囲内に、キーワードkw_qを含む画像特徴ベクトルfvi ,及びkw_pを含む画像特徴ベクトルfvが同数あるため、メタデータ付与区間に付与するキーワードkwとしては、キーワードkw_q,kw_pいずれも確からしいことによるものである。
・例えば、メタデータ付与区間に付与される唯一のキーワードkwの判定方法として前記(2-1)の方法を用いた場合には、画像特徴ベクトルFv_QUERY1,Fv_QUERY2がそれぞれ表すフレーム画像の移動軌跡Lから所定距離tの範囲内の検索対象領域には、キーワードkw_qに対応した△印の点を指す画像特徴ベクトルfviの数が“9”、キーワードkw_pに対応した△印の点を指す画像特徴ベクトルfviの数も“9”になるため、前記(2-1)の方法では、メタデータ付与区間に付与する唯一のキーワードkwを判定できない。これは、キーワードkw_qを含む画像特徴ベクトルfvi ,kw_pを含む画像特徴ベクトルfvが同数あるため、メタデータ付与区間に付与するキーワードkwとしては、キーワードkw_q,kw_pいずれも確からしいことによるものである。
このような特殊ケースの場合は、上述した(1-1),(1-2),(2-1),(2-2),(3-1),(3-2)のような、画像特徴ベクトル空間内で画像特徴ベクトルFv_QUERYが指す点を中心にした所定距離d,tの範囲内に所在する、画像データベース200に格納されている画像特徴ベクトルfv及びこの特徴ベクトルfvに対応するキーワード群[kw]についての検索結果だけでは、メタデータ付与区間に付与する唯一の、又は厳選された複数のキーワードkwの判定が行えない。
本実施の形態のメタデータ付与装置10は、画像データ収集部100によってウェブ上から収集された多数の画像iが格納されている画像データベース200から、入力映像Iinのメタデータ付与区間毎に、唯一の又は厳選された複数の適確なキーワードkwを映像自身の内容又は特徴を説明する情報としてそのメタデータに付与する場合に、検索されたキーワードkw毎に、自身のキーワード群[kw]にこの検索されたキーワードkwを含む画像特徴ベクトルfvの画像特徴ベクトル空間内全体での分布状況を参考にして、メタデータ付与区間に含まれるフレーム画像それぞれに付与する唯一又は厳選された複数のキーワードkwとしての適性を考慮するようにしたメタデータ付与装置10である。
<共通する構成、相違する構成>
本実施の形態のメタデータ付与装置10は、その概略構成レベルに関して、図1に示した第1,第2の実施の形態のメタデータ付与装置10の概略構成と変わることはない。そして、その画像データ収集部100の構成についても、図2,図6又は図8に示した前述した第1,第2の実施の形態の画像データ収集部100の構成と同じである。
本実施の形態のメタデータ付与装置10では、その動画メタデータ付与部300の構成が、その概略構成レベルに関しては図12に示した前述した第1,第2の実施の形態の動画メタデータ付与部300の構成と変わることはないが、その各部の構成が、上記した課題の関係から、一部異なるようになっている。また、この動画メタデータ付与部300の各部の構成変化に伴い、画像データベース200も画像データ収集部100によって取得されたウェブページ上の画像iの画像特徴ベクトルfviとキーワードkwとの格納対応付けの仕方も異なるようになっている。
そのため、本実施の形態によるメタデータ付与装置10を説明するに当たっては、前述した第1の実施の形態のメタデータ付与装置10との相違部分についてのみ説明し、同一及び同様な部分については、同一符号を付し、その詳細な説明は省略する。
<画像データベース>
画像データベース200は、本実施の形態では、図10に示したような、画像特徴ベクトルfv1,fv2,fv3,fv4,fv5,…と、タグ情報取得部140,ページ構成解析部150,又は画像内データ取得部160によって取得されたウェブページ上の画像i1,i2,i3,i4,i5,…それぞれに対応したキーワード群[kw_a],[kw_b, kw_c, kw_d],[kw_a],[kw_d],[kw_b,kw_d],…とが、互いに対応付けられ、記録保持されたデータ保持構成に代え、図22に示したメタデータ付与部330のキーワードバッファ334と同様な図26に示す如くの、画像データ収集部100によって取得されたウェブページ上の画像i1,i2,i3,i4,i5,…全てを対象に、取得したキーワードkwの違い (kw_a,kw_b,kw_c, kw_d,kw_d,…)別に、それぞれのキーワードkwを自身のキーワード群[kw]に含む、ウェブページ上の画像i1,i2,i3,i4,i5,…の画像特徴ベクトルfv1,fv2,fv3,fv4,fv5,…が互いに対応付けられ、記録保持されたデータ保持構成になっている。
図26は、本実施の形態に係るメタデータ付与装置の、画像データベースに保持される画像特徴ベクトルとキーワード群との対応関係の説明図である。
また、画像データベース200には、入力映像Iinと類似する画像iの類似判別の際に同じ画像特徴ベクトルfviについての入力映像Iinとの類似性判別作業の重複作業を避けて検索効率の向上をはかるため、画像データ収集部100によって取得されたウェブページ上の画像取得した画像iそれぞれの画像特徴ベクトルfv1,fv2,fv3,fv4,fv5,…の一覧も格納された構成になっている。
このように、図22に示したキーワードバッファ334とメタデータ付与部330と同様な、キーワードkw毎にウェブページ上の画像i1,i2,i3,i4,i5,…の画像特徴ベクトルfv1,fv2,fv3,fv4,fv5,…を対応付けた画像データベース200の構成によれば、いずれかのキーワードkwを指定することによって、そのキーワードkwを自身のキーワード群[kw]に含む画像特徴ベクトルfvそれぞれと、その画像特徴ベクトルfvの総数(そのキーワードkwを有する画像iの総数Nx)と引き出せる構成になっている。
<動画メタデータ付与部>
図27は、本実施の形態に係るメタデータ付与装置の、動画メタデータ付与部におけるメタデータ付与部の実施例の構成図である。
メタデータ付与部330は、図20に示した第2の実施の形態に係るメタデータ付与装置のメタデータ付与部330と同様に、画像特徴ベクトル読込部331と、メタデータ書込部332と、メタデータ読込部333と、キーワードバッファ334と、キーワード決定部335とが備えられているとともに、さらに、領域決定部336,及び制御部337が追加して備えられている。
また、画像データベース検索部320は、キーワードリスト取得部321と、画像特徴ベクトル数取得部322とを有する構成になっている。
領域決定部336は、画像特徴ベクトル読込部331からその形成順で供給される、メタデータ付与区間のフレーム画像それぞれの画像特徴ベクトルFv_QUERYを基に、メタデータ付与区間毎に、そのフレーム画像それぞれの画像特徴ベクトルFv_QUERYそれぞれについて画像データベース200から類似する画像特徴ベクトルfvを抽出するための画像特徴ベクトル空間内の範囲、すなわち検索対象領域を決定する。
本実施の形態では、領域決定部336は、この検索対象領域の決定を、前述した第2の実施の形態の変形例では画像データベース検索部320が前記(3-2)の方法を用いて行っていた、メタデータ付与区間内のフレーム画像それぞれの画像特徴ベクトルFv_QUERYの移動軌跡Lの作成と、この移動軌跡Lから所定距離tの範囲内の算出とに基づいて、図24を用いて説明したようにして行う構成になっている。
領域決定部336は、メタデータ付与区間毎に、このメタデータ付与区間内のフレーム画像それぞれの画像特徴ベクトルFv_QUERYの移動軌跡Lから所定距離tの範囲内からなる、画像特徴ベクトル空間内における検索対象領域の領域決定データを、制御部337に供給する。
制御部337は、領域決定部336からメタデータ付与区間毎に対応した、画像特徴ベクトル空間内における検索対象領域の領域決定データの供給を受け、メタデータ付与区間毎に、画像データベース検索部320が、その対応する領域決定データにより規定された画像特徴ベクトル空間内の検索対象領域内で、このメタデータ付与区間内のフレーム画像の少なくともいずれかと類似する画像特徴ベクトルfvの検索を行うのを実行制御する。
そして、制御部337は、この画像データベース検索部320による検索結果を受け、キーワードバッファ334への格納制御を行う。
画像データベース検索部320は、キーワードリスト取得部321と、画像特徴ベクトル数取得部322との、2つの検索部を有する。
画像データベース検索部320のキーワードリスト取得部321は、制御部337からメタデータ付与区間毎に対応した画像特徴ベクトル空間内の検索対象領域の領域決定データの供給を受け、画像データベース200から、この検索対象領域内にその指す点が所在する画像特徴ベクトルfv全てを抽出するとともに、この抽出した全ての画像特徴ベクトルfvそれぞれを基に、全ての画像特徴ベクトルfvの中のいずれかの画像特徴ベクトルfvのキーワード群[kw]に含まれるキーワードkw全てを取得する。そして、キーワードリスト取得部321は、この取得したキーワードkw全てを制御部337に供給し、制御部337は、図28に示すようなキーワードテーブル334tに、今回取得したキーワードkwを展開する。
一方、画像データベース検索部320の画像特徴ベクトル数取得部322は、キーワードリスト取得部321による、検索対象領域内から抽出した全ての画像特徴ベクトルfvそれぞれと、この抽出した全ての画像特徴ベクトルfvの中のいずれかの画像特徴ベクトルfvのキーワード群[kw]に含まれるキーワードkw全てを基に、この抽出したキーワードkw毎に、このキーワードkwを自身のキーワード群[kw]に含む今回取得された画像特徴ベクトルfvの検索総数、すなわちこのキーワードkwを自身のキーワード群[kw]に含んで検索対象領域内にその指す点が所在する画像特徴ベクトルfvの検索総数‘count_x’と、このキーワードkwを自身のキーワード群[kw]に含む画像特徴ベクトル空間内の画像特徴ベクトルfvの検索対象総数‘N_x’とを、図26に示した画像データベース200の対応するキーワードkwについての格納データに基づいて算出する。
そして、画像特徴ベクトル数取得部322は、キーワードkw毎の、このキーワードkwを自身のキーワード群[kw]に含む検索対象領域内にその指す点が所在する画像特徴ベクトルfvの検索総数‘count_x’、及びこのキーワードkwを自身のキーワード群[kw]に含む画像特徴ベクトル空間内の画像特徴ベクトルfvの検索対象総数‘N_x’を制御部337に供給し、制御部337は、図28に示すようなキーワードテーブル334tに、その展開されたキーワードkwに対応させて追加格納する。
図28は、キーワードバッファに形成され、画像データベース検索部が検索した画像特徴ベクトル及びそのキーワード群を格納するキーワードテーブルの一実施例を示した図である。
キーワードバッファ334のキーワードテーブル334tには、メタデータ付与区間に対応して、画像データベース検索部320のキーワードリスト取得部321によって取得されて展開されたキーワードkwの違い (kw_a,kw_b,kw_c, kw_d,kw_d,…)別に、画像データベース検索部320の画像特徴ベクトル数取得部322によって取得された、そのキーワードkwを自身のキーワード群[kw]に含む検索対象領域内にその指す点が所在する画像特徴ベクトルfvの検索総数‘count_x’と、そのキーワードkwを自身のキーワード群[kw]に含む画像特徴ベクトル空間内の画像特徴ベクトルfvの検索対象総数‘N_x’ とが、対応付けられて格納されている。
キーワード決定部335は、あるメタデータ付与区間に関して、画像データベース検索部320のキーワードリスト取得部321によって取得したキーワードkwのキーワードテーブル334tへの展開が終了し、かつ画像特徴ベクトル数取得部322によってこの展開されたキーワードkwそれぞれについての画像特徴ベクトルfvの検索総数‘count_x’と検索対象総数‘N_x’ とがキーワードテーブル334tに格納されると、キーワードkwの適切度合い‘prob_x’を算出する。
キーワード決定部335は、キーワードkwの適切度合い‘prob_x’を、キーワードバッファ334のこのメタデータ付与区間に対応するキーワードテーブル334tのキーワードkwそれぞれについて、その画像特徴ベクトルfvの検索総数‘count_x’を検索対象総数‘N_x’で除した値として算出する。
prob_x = count_x / N_x
そして、キーワード決定部335は、キーワードバッファ334のこのメタデータ付与区間に対応するキーワードテーブル334tのキーワードkw全てについて、キーワードkwそれぞれについてのキーワードkwの適切度合い‘prob_x’の算出を完了したならば、このメタデータ付与区間に含まれるフレーム画像それぞれに共通なキーワード群[kw]として決定する構成になっている。
この場合、キーワード決定部335は、キーワードテーブル334tのキーワードkwそれぞれについて算出したキーワードkwの適切度合い‘prob’の値を比較し、最も適切度合い‘prob’ の値が高いキーワードkw、又は適切度合い‘prob’ の値が上位N個のキーワードkwからなるキーワード群[kw]を、該当するメタデータ付与区間におけるフレーム画像それぞれに共通のキーワード群[kw]として決定する。
したがって、本実施の形態の場合は、図25(a)に示した、前述の (1-1),(1-2),(2-1),(2-2),(3-1),(3-2)のような、画像特徴ベクトル空間内で画像特徴ベクトルFv_QUERYが指す点を中心にした所定距離d,tの範囲内に所在する、画像データベース200に格納されている画像特徴ベクトルfv及びこの特徴ベクトルfvに対応するキーワード群[kw]についての検索結果だけでは、メタデータ付与区間に付与する唯一の、又は厳選された複数のキーワードkwの判定が行えない場合であっても、メタデータ付与区間に付与するキーワードkwを決定することができる。
すなわち、キーワードkwそれぞれをキーワード群[kw]に含む画像特徴ベクトルfvそれぞれの画像特徴ベクトル空間内全体での分布状況を基にした、メタデータ付与区間を表すキーワードkwとしての確からしさ、すなわち適切度合い‘prob’ の値から、メタデータ付与区間に付与するキーワードkwを決定することができる。
具体的には、図25(a)に示したメタデータ付与区間内の2つのフレーム画像それぞれの画像特徴ベクトルFv_QUERY(Fv_QUERY1,Fv_QUERY2)の状況にあっても、図25(b),(c) に示すように、この場合は、□印の点で表されるキーワードkw_pを含む画像特徴ベクトルfvi 、及び△印の点で表されるキーワードkw_qを含む画像特徴ベクトルfvi毎に分離した状態で、キーワードkw_q,kw_pそれぞれについて適切度合い‘prob’を求め、メタデータ付与区間に付与する唯一のキーワードkwを決定することができる。
例えば、図25(b) に示すように、□印の点で表されるキーワードkw_pについては、検索総数‘count_xp’は‘9’、検索対象総数‘N_xP’は‘16’ 、適切度合い‘prob’ は‘9/16’になり、図25(c) に示すように、△印の点で表されるキーワードkw_qについては、検索総数‘count_xq’は‘9’、検索対象総数‘N_xq’は‘12’ 、適切度合い‘prob’ は‘9/12’になり、△印の点で表されるキーワードkw_qを唯一のキーワードkwとして決定することになる。
図29は、図27に示した動画メタデータ付与部による動画メタデータ付与処理のフローチャートである。
なお、本実施例の動画メタデータ付与部300において、その映像データ入力部310が入力映像Iinに対して行う各処理は、図23に示した、第2の実施の形態のメタデータ付与装置10における動画メタデータ付与部300の映像データ入力部310によるステップS3010〜S3100の処理と同様なので、図29においては同一符号ステップS3010〜S3100を付し、各処理の説明は省略する。
図29において、動画メタデータ付与部300では、その映像データ入力部310 が入力映像Iinに対するステップS3010〜S3100に示す映像入力処理を行う一方で、メタデータ付与部330では、次のような処理を行う。
メタデータ付与部330では、そのキーワードバッファ334に、図22で説明したような、画像データベース200から検索した画像特徴ベクトルfvi及び該当するキーワードkwを対応付けて一時記憶するための、キーワードkwの付与区間毎に対応したキーワードテーブル334tを作成する(ステップS3110)。
メタデータ読込部333は、映像データ入力部310の付与区間検出部314によってシーンの転換点に関する情報が追加更新された映像データバッファ340のメタデータ格納部342から、メタデータ付与区間を形成する1又は複数のフレーム画像に対応したひな形のメタデータを読み込み、そのメタデータ付与区間における全フレーム画像分のひな形のメタデータを、そのフレーム画像の形成順どおりに、画像特徴ベクトル読込部331と、メタデータ書込部332とにそれぞれ供給する(ステップS3120)。
画像特徴ベクトル読込部331は、そのメタデータ付与区間の全フレーム画像それぞれに対応する画像特徴ベクトルFv_QUERYを、映像データバッファ340の画像特徴ベクトル格納部341から読み込む(ステップS3132)。
領域決定部336は、画像特徴ベクトル読込部331からその形成順で供給される、メタデータ付与区間のフレーム画像それぞれの画像特徴ベクトルFv_QUERYを基に、メタデータ付与区間毎に、例えば図25(a)に示すような、このメタデータ付与区間内のフレーム画像それぞれの画像特徴ベクトルFv_QUERYの移動軌跡Lから所定距離tの範囲内からなる、画像特徴ベクトル空間内における検索対象領域Dを決定し、この制御部337に供給する(ステップS3134)。
画像データベース検索部320のキーワードリスト取得部321は、制御部337からメタデータ付与区間毎に対応した画像特徴ベクトル空間内の検索対象領域の領域決定データの供給を受け、画像データベース200から、この検索対象領域内にその指す点が所在する画像特徴ベクトルfv全てを抽出するとともに、この抽出した全ての画像特徴ベクトルfvそれぞれを基に、全ての画像特徴ベクトルfvの中のいずれかの画像特徴ベクトルfvのキーワード群[kw]に含まれるキーワードkw全てを取得する。そして、キーワードリスト取得部321は、この取得したキーワードkw全てを制御部337に供給し、制御部337は、図28に示すようなキーワードテーブル334tに、今回取得したキーワードkwを展開する(ステップS3142)。
そして、画像データベース検索部320の画像特徴ベクトル数取得部322は、画像データベース検索部320が取得したキーワードkw全ての中で、後述するステップS3152,S3154,S3156の処理を行ったキーワードkwの数を計数するためのカウンタjの値をリセットする(ステップS3144)。
その上で、画像特徴ベクトル数取得部322は、この抽出した全ての画像特徴ベクトルfvの中のいずれかの画像特徴ベクトルfvのキーワード群[kw]に含まれるキーワードkw全ての中、カウンタjの値に対応する順番(この場合の順番は、j+1番目)のキーワードkwについて、このキーワードkwを自身のキーワード群[kw]に含む今回取得された画像特徴ベクトルfvの検索総数、すなわちこのキーワードkwを自身のキーワード群[kw]に含んで検索対象領域内にその指す点が所在する画像特徴ベクトルfvの検索総数‘count_x[j]’と、このキーワードkwを自身のキーワード群[kw]に含む画像特徴ベクトル空間内の画像特徴ベクトルfvの検索対象総数‘N_x[j]’とを、図26に示した画像データベース200の対応するキーワードkwについての格納データを基づいて算出する(ステップS3152,S3154)。
キーワード決定部335は、カウンタjの値に対応する順番(j+1番目)のキーワードkwについて、画像特徴ベクトル数取得部322によって算出された画像特徴ベクトルfvの検索総数‘count_x[j]’と検索対象総数‘N_x[j]’ とを基に、このキーワードkwの適切度合い‘prob_x[j]’を、
prob_x[j] = count_x[j] / N_x[j]
を演算することによって算出する (ステップS3156)。
そして、画像特徴ベクトル数取得部322は、この算出したカウンタjの値に対応する順番のキーワードkwの適切度合い‘prob_x[j]’を制御部337に供給し、制御部337は、図28に示すようなキーワードテーブル334tに、この算出したキーワードkwの適切度合い‘prob_x[j]’を追加格納し、 ステップS3152,S3154,S3156の処理を行ったキーワードkwの数を計数するためのカウンタjの値をインクリメントする(ステップS3158)。
その上で、画像特徴ベクトル数取得部322は、このカウンタjの値がステップS3142でキーワードリスト取得部321が取得したキーワードkwの総数に達しているか否かを判別することによって、このメタデータ付与区間に対応するキーワードテーブル334tに展開されたキーワードkw全てについて、キーワードkwそれぞれについてのキーワードkwの適切度合い‘prob_x’の算出を完了したか否かを判別する(ステップS3160)。
そして、画像特徴ベクトル数取得部322は、キーワードkwの適切度合い‘prob_x’の算出がキーワードkw全てについて未だ完了ししていない場合は、カウンタjの値に対応する次の順番のキーワードkwについて、上述したステップS3152〜S3160の処理を繰り返し行う一方、キーワードkwの適切度合い‘prob_x’の算出がキーワードkw全てについて完了している場合は、キーワード決定部335が、このメタデータ付与区間に含まれるフレーム画像それぞれに共通なキーワード群[kw]を決定する。
この場合、キーワード決定部335は、キーワードテーブル334tのキーワードkwそれぞれについて算出したキーワードkwの適切度合い‘prob_x’の値を比較し、最も適切度合い‘prob_x’ の値が上位N個のキーワードkwからなるキーワード群[kw]を、該当するメタデータ付与区間におけるフレーム画像それぞれに共通のキーワード群[kw]として決定する(ステップS3160)。
メタデータ書込部332は、この決定されたキーワード群[kw]をキーワード決定部335から受け、映像データバッファ340中のメタデータ格納部342に格納されている、該当するメタデータ付与区間のフレームのひな形のメタデータに追加して更新する(ステップS3180)。
そして、動画メタデータ付与部300では、上述のステップS3110〜S3180で示したメタデータ付与区間の処理が、映像データバッファ340中のメタデータ格納部342に記憶されている入力映像Iinのメタデータ付与区間全てについて終了するまで(ステップS3190)、繰り返し行われる。
このようにして、本実施の形態のメタデータ付与装置10の動画メタデータ付与部300では、上述した動画メタデータ付与方法により、入力映像Iinにおける、同じシーンが連続して意味的に連続した区間では、その区間を形成する連続した複数のフレームそれぞれに、メタデータとしてその区間の内容や特徴を表す共通なより適確な情報を付与していくことができる。
具体的には、画像データベース200から検索した検査対象領域内にその指す点が所在する各画像特徴ベクトルfvに対応付けられたキーワード群[kw] のそれぞれキーワードkwについて、どのキーワードkwがメタデータ付与区間どれほどの確からしさを持つかといった、キーワードkwの適切度合い‘prob_x’の値が算出できるようになっている。すなわち、図25 (b)、(c)に示したように、抽出したキーワードkwそれぞれについて、検査対象領域内と、検査対象領域外も含む画像特徴ベクトル空間全体とで分離した状態で、抽出したキーワードkwそれぞれの画像特徴ベクトル空間における配置上の特徴を比較考慮して、メタデータ付与区間に付与するためのより適確なキーワードkwを決定することができる。これにより、抽出したキーワードkw毎の、画像特徴ベクトル空間における偏在についても考慮したキーワード選択を行うことができる。
<その他の実施の形態>
ここで、上述した各実施の形態によるメタデータ付与装置10では、第1の装置機能部分としての、画像データ収集部100及び画像データベース200によって構成され、インターネット50から画像データを収集し、分類対象の映像データにメタデータとして付与するための、映像データ自身の内容や特徴を説明するための情報としてのキーワードkwを収集・蓄積する装置機能部分、第2の装置機能部分としての、画像データベース200及び動画メタデータ付与部300によって構成され、入力映像Iinに、その映像データ自身の内容や特徴を説明する情報として好適なキーワードkwを取得してメタデータとして付加し、このメタデータが付与された出力映像データを、出力映像Ioutとして映像出力する装置機能部分を、1つのシステムとして説明してきたが、これは第1,第2の装置機能部分、並びに画像データ収集部100,画像データベース200,動画メタデータ付与部300の各部が、1つの場所に内包させられる必要があるということではなく、あくまで説明のためのものである。具体的には、上述した各実施の形態によるメタデータ付与装置10は、インターネット上のサービスとして一部を独立させる方法、家庭内でサーバークライアントシステムを構築し分離させる方法等にも適用可能である。さらに具体的には、例えば、画像データ収集部100,画像データベース200,動画メタデータ付与部300は多くのユーザが共通的に利用できるデータベースシステムであり、このシステムを例えばウェブサーバー上に構成することも可能である。そして、このようなシステム構成を採用することによって、ユーザが購入する製品のコスト低減、もしくはユーザの所有しているシステムの計算リソースの低減も可能になる。また、ロボットビジョン等、大規模HDDを持てないシステムにおいても利用できる。
また、放送コンテンツやインターネットで動画像を提供するポータルサイト等、コンテンツを提供する側がこのシステムを利用することも当然考えられる。
そこで、MPEG2−TSに特化した場合のシステム構成について、図30,図31に基づき説明する。
図30は、その他の実施の形態のメタデータ付与装置における、動画メタデータ付与部における映像データ入力部の一実施例の構成図である。
本実施例の映像データ入力部310は、放送コンテンツやインターネットでMPEG2−TSによる形式の映像が入力映像Iinである場合のように、入力映像Iinの元々付与されているメタデータにセグメント情報が存在する場合の、動画メタデータ付与部300における特化した映像データ入力部310の構成を示している。本実施例の場合、デマルチプレクサは、入力映像Iinのコンテンツデータから、このセグメント情報を含むメタデータ,映像データ,音声データをそれぞれ分離する構成になっている。そのため、本実施例の場合では、図19に示した映像データ入力部310では設けられていた付与区間検出部314は必要なく、メタデータ内のセグメント情報を、そのままシーンの転換点に該当することを示す情報として利用することができる。そして、図20,図27と同様な構成であるため図示省略したメタデータ付与部330では、メタデータ読込部333がこのメタデータ内のセグメント情報を取得することに基づいて、データ付与区間の処理を行う構成になっている。
さらに、本実施例の映像データ入力部310では、入力映像Iinの、元々セグメント情報を含むメタデータが、そのまま映像データバッファ340のメタデータ格納部342に格納されるため、メタデータひな形生成部313を必要としない。
図31は、その他の実施の形態のメタデータ付与装置における、動画メタデータ付与部における映像データ入力部の別の実施例の構成図である。
本実施例の映像データ入力部310は、放送コンテンツやインターネットでMPEG2−TSによる形式の映像が入力映像Iinである場合であっても、そのメタデータにセグメント情報が存在しない場合の構成を示したものである。
本実施例の映像データ入力部310では、セグメント情報以外のメタデータの情報を解析するメタデータ情報解析部315、付与区間検出部314が備えられ、図19に示した映像データ入力部310と、メタデータひな形生成部313を必要としない以外は、ほぼ同じ構成となっている。
そして、上述した各実施の形態で説明したメタデータ付与装置10それぞれは、コンピュータに対応するメタデータ付与方法を実行させるプログラムを用いれば、PC等の機器をメタデータ付与装置10として機能させることも可能である。
以上に説明してきたメタデータ付与装置10、またメタデータ付与方法を用いて、入力映像Iinに対するメタデータ付与を行うことにより、映像−画像−テキスト間でのリンクが同時に形成されるため、クロスメディア変換等、様々なアプリケーションが想定される。
また、テキストとイメージ、動きといった今まで結びつけることが難しかったメディア間の共起関係を構成することもできる。
さらに、このようなリンク関係を用いることで、テキスト間、映像間の類似性も定義することができる。例えば画像に関連付けられているテキストを分析すると、類似性の高いテキストは多くの画像において共有されている。また映像においても、類似性の高い映像はより多くの画像、テキストを持つ。本手法は入力映像Iin、特に動画像についてのメタデータ付与にフィーチャーをあてて技術を開示しているが、これによりメタデータ付与以外にも、例えばテキスト−映像相互間の検索装置等に適用することができるのはいうまでもない。
本発明のメタデータ付与装置の概略構成図である。 第1の実施の形態に係るメタデータ付与装置の、画像データ収集部の構成図である。 図2に示した画像データ収集部における画像特徴ベクトル算出部の構成を示すブロック図である。 HTML文書におけるタグ情報の例についての説明図である。 図2に示した画像データ収集部による画像データ収集処理のフローチャートである。 図2とは別構成の画像データ収集部の変形例の構成図ある。 図7に示した画像データ収集部による画像データ収集処理のフローチャートである。 さらに別の構成からなる画像データ収集部の変形例の構成図ある。 図8に示した画像データ収集部による画像データ収集処理のフローチャートである。 画像データベースのデータ保持構成についての一実施例を示した図である。 画像データベースに保持される画像特徴ベクトルとキーワード群との対応関係の説明図である。 第1の実施の形態に係るメタデータ付与装置の、動画メタデータ付与部の構成図である。 図12に示した映像データ入力部及び映像データバッファの構成図である。 図12に示したメタデータ付与部の構成図である。 図12に示した画像データベース検索部による、画像データベースに格納されている画像特徴ベクトルの検索についての一実施例の説明図である。 画像データベース検索部による画像データベースに格納されている画像特徴ベクトルの検索についての別の実施例の説明図である。 図12に示した映像データ出力部の一実施例の構成図である。 図9に示した動画メタデータ付与部による動画メタデータ付与処理のフローチャートである。 第2の実施の形態に係るメタデータ付与装置の、動画メタデータ付与部における映像データ入力部の構成図である。 第2の実施の形態に係るメタデータ付与装置の、動画メタデータ付与部におけるメタデータ付与部の実施例の構成図である。 第2の実施の形態に係るメタデータ付与装置の、画像データベース検索部によるキーワードkwの取得についての説明図である。 第2の実施の形態に係るメタデータ付与装置の、キーワードバッファに形成され、画像データベース検索部が検索した画像特徴ベクトル及びそのキーワード群を格納するキーワードテーブルの一実施例を示した図である。 図20に示した動画メタデータ付与部による動画メタデータ付与処理のフローチャートである。 第2の実施の形態の変形例に係るメタデータ付与装置の、画像データベース検索部によるキーワード取得についての説明図である。 第3の実施の形態に係るメタデータ付与装置の、画像データベース検索部によるキーワード取得についての説明図である。 第3の実施の形態に係るメタデータ付与装置の、画像データベースに保持される画像特徴ベクトルとキーワード群との対応関係の説明図である。 第3の実施に係るメタデータ付与装置の、動画メタデータ付与部におけるメタデータ付与部の実施例の構成図である。 第3の実施の形態に係るメタデータ付与装置の、キーワードバッファに形成され、画像データベース検索部が検索した画像特徴ベクトル及びそのキーワード群を格納するキーワードテーブルの一実施例を示した図である。 図27に示した動画メタデータ付与部による動画メタデータ付与処理のフローチャートである。 その他の実施の形態のメタデータ付与装置における、動画メタデータ付与部における映像データ入力部の一実施例の構成図である。 その他の実施の形態のメタデータ付与装置における、動画メタデータ付与部における映像データ入力部の別の実施例の構成図である。 従来のメタデータ付与システムの構成図である。 従来のメタデータ付与システムの、画像データに対してのメタデータ付与処理のフローチャートである。 従来のメタデータ付与システムの、動画像をも含んだ映像データに対してのメタデータ付与処理のフローチャートである。
符号の説明
10 メタデータ付与装置、 50 インターネット、
100 画像データ収集部、 110 ページ取得部、
120 画像取得部、 130 画像特徴ベクトル算出部、
140 タグ情報取得部、 150 ページ構成解析部、
160 画像内データ取得部、 200 画像データベース、
300 動画メタデータ付与部、 310 映像データ入力部、
311 フレーム画像取得部、 312 画像特徴ベクトル算出部、
313 メタデータひな形生成部、 314 付与区間検出部、
315 メタデータ情報解析部、 320 画像データベース検索部、
321 キーワードリスト取得部、 322 画像特徴ベクトル数取得部、
330 メタデータ付与部、 331 画像特徴ベクトル読込部、
332 メタデータ書込部、 333 メタデータ読込部、
334 キーワードバッファ、 334t キーワードテーブル、
335 キーワード決定部、 336 領域決定部、
337 制御部、 340 映像データバッファ、
341 画像特徴ベクトル格納部、 342 メタデータ格納部、
343 映像データ格納部、 350 映像データ出力部、
351 マルチプレクサ、 900 メタデータ付与システム、
910 WWW画像収集システム、 920 データベース、
930 画像分類システム、
940 動画像メタデータ付与装置

Claims (17)

  1. 画像の視覚的特徴を表す画像特徴ベクトル、及び画像自身の内容及び特徴を説明するキーワードを収集する画像データ収集部と、
    該画像データ収集部が収集した画像の画像特徴ベクトル及びキーワードを記録する画像データベースと、
    入力映像に対して、映像自身の内容や特徴を説明する情報を入力映像の映像データのメタデータに付与して映像出力する動画メタデータ付与部と、
    を備え、
    前記画像データ収集部は、
    前記画像データベースに記録する画像の画像特徴ベクトル及びキーワードを、ウェブ上の画像データ並びにテキストから収集し、当該収集した画像特徴ベクトル及びキーワードを画像毎に対応付けて前記画像データベースに記録し、
    前記動画メタデータ付与部は、
    入力映像を形成するフレーム画像と、前記画像データベースに記録されている画像との類似性を両者の画像特徴ベクトルの類似性から判断し、前記画像データベースの類似と判断された画像特徴ベクトルに対応付けられたキーワードを、入力映像の映像データにメタデータとして付与して映像出力する
    ことを特徴とするメタデータ付与装置。
  2. 前記画像データベースは、
    前記画像データ収集部によって収集された画像の画像特徴ベクトルと、
    当該収集された画像の画像特徴ベクトルに関連付けられているキーワードと
    を対として記録することを特徴とする請求項1記載のメタデータ付与装置。
  3. 前記画像データベースは、
    前記画像データ収集部によって収集された画像のキーワードと、
    当該収集されたキーワードに関連付けられている画像の画像特徴ベクトルと
    を対として記録することを特徴とする請求項1記載のメタデータ付与装置。
  4. 分類対象として入力された入力映像の映像データに、画像データベースから当該入力映像の内容や特徴を説明するキーワードを取得して、メタデータとして付与して映像出力するメタデータ付与装置であって、
    分類対象の入力映像の映像データを取り込む映像データ入力部と、
    該映像データ入力部によって取り込まれた入力映像の映像データを一時記録しておく映像データバッファと、
    前記画像データベースに画像毎に記録されている画像特徴ベクトルの中から、該映像データバッファに一時記録された入力映像の連続した又は所定間隔を空けたフレーム画像単位で、当該フレーム画像と類似する前記画像データベースに記録されている画像を両者の画像特徴ベクトルの類似性に基づいて検索し、前記画像データベースに当該類似画像の画像特徴ベクトルに対応付けられて記録されているキーワードを取得する画像データベース検索部と、
    該画像データベース検索部によって検索されたキーワードを、前記映像データバッファに一時記録されている映像データにメタデータとして付与するメタデータ付与部と、
    前記映像データバッファから、該メタデータ付与部によってキーワードがメタデータとして付与された映像データを映像出力する映像出力部と
    を備えていることを特徴とするメタデータ付与装置。
  5. 前記画像データベース検索部は、入力映像のフレーム画像と前記画像データベースに画像毎に記録されている画像特徴ベクトルとの類似性を、両者の画像特徴ベクトル間の距離に基づいて判断することを特徴とする請求項4記載のメタデータ付与装置。
  6. 分類対象として入力された入力映像の映像データに、画像データベースから当該入力映像の内容や特徴を説明するキーワードを取得して、メタデータとして付与して映像出力するメタデータ付与装置であって、
    分類対象の入力映像の映像データを取り込む映像データ入力部と、
    該映像データ入力部によって取り込まれた入力映像の映像データを一時記録しておく映像データバッファと、
    該映像データ入力部によって取り込まれた入力映像について、当該入力映像の時間経過に沿って連続するフレーム画像に対して共通するキーワードをメタデータとして付与するメタデータ付与区間を検出するメタデータ付与区間検出部と、
    前記画像データベースに画像毎に記録されている画像特徴ベクトルの中から、該映像データバッファに一時記録された入力映像のメタデータ付与区間単位に、当該メタデータ付与区間に含まれるフレーム画像に類似する前記画像データベースに記録されている画像を両者の画像特徴ベクトルの類似性に基づいて検索し、前記画像データベースに当該類似画像の画像特徴ベクトルに対応付けられて記録されているキーワードを取得する画像データベース検索部と、
    該画像データベース検索部によってメタデータ付与区間単位に検索されたキーワードを、前記映像データバッファに一時記録されている映像データの当該メタデータ付与区間に対するメタデータとして付与するメタデータ付与部と、
    前記映像データバッファから、該メタデータ付与部によってメタデータ付与区間単位にキーワードがメタデータとして付与された映像データを映像出力する映像出力部と
    を備えていることを特徴とするメタデータ付与装置。
  7. 前記メタデータ付与区間検出部は、
    入力映像の類似度の高い連続シーン毎、カット点毎、又は入力映像の画像データの既存メタデータに含まれている情報に基づいて、メタデータ付与区間を検出する
    ことを特徴とする請求項6記載のメタデータ付与装置。
  8. 前記画像データベース検索部は、
    前記メタデータ付与区間検出部によって検出されたメタデータ付与区間中に含まれる全フレーム画像について、類似画像検索によりキーワードを取得する
    ことを特徴とする請求項6記載のメタデータ付与装置。
  9. 前記メタデータ付与部は、
    前記画像データベース検索部によってメタデータ付与区間単位に取得されたキーワードの中から、映像データに対して実際にメタデータとして付与するキーワードを、当該キーワードと対応付けられて検索された画像特徴ベクトルの個数に基づいて決定するキーワード決定部
    を有すること特徴とする請求項6記載のメタデータ付与装置。
  10. 前記キーワード決定部は、
    メタデータ付与区間中で画像データに対応付けられた頻度の高い上位所定数個のキーワードを、メタデータ付与区間に対して実際にメタデータとして付与するキーワードメタデータとして付与する
    ことを特徴とする請求項9記載のメタデータ付与装置。
  11. 前記メタデータ付与部には、前記メタデータ付与区間検出部によって検出されたメタデータ付与区間に含まれる入力映像のフレーム画像が描く画像特徴ベクトル空間の軌跡に基づいて、画像特長ベクトル空間における画像特徴ベクトルの検索対象領域を決定する領域決定部を有し、
    前記キーワード決定部は、
    取得されたキーワード毎に、画像特長ベクトル空間内に存在する対応付けられた画像特徴ベクトルの個数を分母、検索対象領域内に存在する対応付けられた画像特徴ベクトルの個数を分子とし、
    その比率をもってキーワードの確からしさとした上で、
    その値が高い上位所定数個のキーワードを実際にメタデータ付与区間にメタデータとして付与するキーワードとして決定する
    ことを特徴とする請求項9記載のメタデータ付与装置。
  12. 前記メタデータ付与部は、
    キーワードをメタデータとして書き込む際には、
    メタデータの付随した入力映像が入力された場合、映像データバッファに付随しているメタデータを展開し、その枠組みに対してキーワードを追記し、
    メタデータが付随していない場合は、該映像データバッファにメタデータのひな形を作成し、作成されたメタデータの枠組みに対してキーワード群を追記する
    ことを特徴とする請求項1記載のメタデータ付与装置。
  13. 画像の視覚的特徴を表す画像特徴ベクトル、及び画像自身の内容及び特徴を説明するキーワードを収集する画像データ収集ステップ、
    該画像データ収集ステップによって収集した画像の画像特徴ベクトル及びキーワードを画像データベースに記録する記録ステップ、
    入力映像に対して、映像自身の内容や特徴を説明する情報を入力映像の映像データのメタデータに付与して映像出力する動画メタデータ付与ステップ
    を有し、
    前記画像データ収集ステップは、
    前記画像データベースに記録する画像の画像特徴ベクトル及びキーワードを、ウェブ上の画像データ並びにテキストから収集し、当該収集した画像特徴ベクトル及びキーワードを画像毎に対応付けて前記画像データベースに記録し、
    前記動画メタデータ付与ステップは、
    入力映像を形成するフレーム画像と、前記画像データベースに記録されている画像との類似性を両者の画像特徴ベクトルの類似性から判断し、前記画像データベースの類似と判断された画像特徴ベクトルに対応付けられたキーワードを、入力映像の映像データにメタデータとして付与して映像出力する
    ことを特徴とするメタデータ付与方法。
  14. 分類対象として入力された入力映像の映像データに、画像データベースから当該入力映像の内容や特徴を説明するキーワードを取得して、メタデータとして付与して映像出力するメタデータ付与方法であって、
    分類対象の入力映像の映像データを取り込む映像データ入力ステップ、
    該映像データ入力ステップによって取り込まれた入力映像の映像データを映像データバッファに一時記録しておく一時記録ステップ、
    前記画像データベースに画像毎に記録されている画像特徴ベクトルの中から、該映像データバッファに一時記録された入力映像の連続した又は所定間隔を空けたフレーム画像単位で、当該フレーム画像と類似する前記画像データベースに記録されている画像を両者の画像特徴ベクトルの類似性に基づいて検索し、前記画像データベースに当該類似画像の画像特徴ベクトルに対応付けられて記録されているキーワードを取得する画像データベース検索ステップ、
    該画像データベース検索ステップによって検索されたキーワードを、前記映像データバッファに一時記録されている映像データにメタデータとして付与するメタデータ付与ステップ、
    前記映像データバッファから、該メタデータ付与ステップによってキーワードがメタデータとして付与された映像データを映像出力する映像出力ステップ
    を有することを特徴とするメタデータ付与方法。
  15. 分類対象として入力された入力映像の映像データに、画像データベースから当該入力映像の内容や特徴を説明するキーワードを取得して、メタデータとして付与して映像出力するメタデータ付与方法であって、
    分類対象の入力映像の映像データを取り込む映像データ入力ステップ、
    該映像データ入力ステップによって取り込まれた入力映像の映像データを映像データバッファに一時記録しておく一時記憶ステップ、
    該映像データ入力ステップによって取り込まれた入力映像について、当該入力映像の時間経過に沿って連続するフレーム画像に対して共通するキーワードをメタデータとして付与するメタデータ付与区間を検出するメタデータ付与区間検出ステップ、
    前記画像データベースに画像毎に記録されている画像特徴ベクトルの中から、該映像データバッファに一時記録された入力映像のメタデータ付与区間単位に、当該メタデータ付与区間に含まれるフレーム画像に類似する前記画像データベースに記録されている画像を両者の画像特徴ベクトルの類似性に基づいて検索し、前記画像データベースに当該類似画像の画像特徴ベクトルに対応付けられて記録されているキーワードを取得する画像データベース検索ステップ、
    該画像データベース検索ステップによってメタデータ付与区間単位に検索されたキーワードを、前記映像データバッファに一時記録されている映像データの当該メタデータ付与区間に対するメタデータとして付与するメタデータ付与ステップ、
    前記映像データバッファから、該メタデータ付与ステップによってメタデータ付与区間単位にキーワードがメタデータとして付与された映像データを映像出力する映像出力ステップ、
    を有していることを特徴とするメタデータ付与方法。
  16. コンピュータを、請求項1,4,又は6記載のメタデータ付与装置として機能させるためのプログラム。
  17. コンピュータを、請求項1,4,又は6記載のメタデータ付与装置として機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2007057702A 2007-03-07 2007-03-07 メタデータ付与装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体 Pending JP2008217701A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007057702A JP2008217701A (ja) 2007-03-07 2007-03-07 メタデータ付与装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007057702A JP2008217701A (ja) 2007-03-07 2007-03-07 メタデータ付与装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JP2008217701A true JP2008217701A (ja) 2008-09-18

Family

ID=39837631

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007057702A Pending JP2008217701A (ja) 2007-03-07 2007-03-07 メタデータ付与装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP2008217701A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010093342A (ja) * 2008-10-03 2010-04-22 Canon Inc 映像サーバ装置、映像クライアント装置、映像送受信システム及び情報処理方法
JP2010198111A (ja) * 2009-02-23 2010-09-09 Nippon Telegr & Teleph Corp <Ntt> メタデータ抽出サーバ、メタデータ抽出方法およびプログラム
JP2010283542A (ja) * 2009-06-03 2010-12-16 Nippon Telegr & Teleph Corp <Ntt> メタデータ検索装置、メタデータ検索方法、メタデータ検索プログラム、及びメタデータ検索システム
JP2012049830A (ja) * 2010-08-26 2012-03-08 Nippon Telegr & Teleph Corp <Ntt> 映像管理装置、方法、及びプログラム
JP2014038602A (ja) * 2012-08-17 2014-02-27 Naver Corp キャプチャしたイメージを用いた動画分析装置、方法およびコンピュータ読み取り可能な記録媒体
JP2016167236A (ja) * 2015-03-10 2016-09-15 富士ゼロックス株式会社 画像処理装置及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204990A (ja) * 1992-01-29 1993-08-13 Hitachi Ltd 動画像情報のキーワード付与方法
JPH05282380A (ja) * 1992-03-31 1993-10-29 Nippon Telegr & Teleph Corp <Ntt> 動画像検索方法
JPH11224256A (ja) * 1998-02-05 1999-08-17 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法および情報検索プログラムを記録した記録媒体
JP2005352718A (ja) * 2004-06-10 2005-12-22 Nippon Telegr & Teleph Corp <Ntt> 代表画像選択装置,代表画像選択方法および代表画像選択プログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204990A (ja) * 1992-01-29 1993-08-13 Hitachi Ltd 動画像情報のキーワード付与方法
JPH05282380A (ja) * 1992-03-31 1993-10-29 Nippon Telegr & Teleph Corp <Ntt> 動画像検索方法
JPH11224256A (ja) * 1998-02-05 1999-08-17 Nippon Telegr & Teleph Corp <Ntt> 情報検索方法および情報検索プログラムを記録した記録媒体
JP2005352718A (ja) * 2004-06-10 2005-12-22 Nippon Telegr & Teleph Corp <Ntt> 代表画像選択装置,代表画像選択方法および代表画像選択プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010093342A (ja) * 2008-10-03 2010-04-22 Canon Inc 映像サーバ装置、映像クライアント装置、映像送受信システム及び情報処理方法
JP2010198111A (ja) * 2009-02-23 2010-09-09 Nippon Telegr & Teleph Corp <Ntt> メタデータ抽出サーバ、メタデータ抽出方法およびプログラム
JP2010283542A (ja) * 2009-06-03 2010-12-16 Nippon Telegr & Teleph Corp <Ntt> メタデータ検索装置、メタデータ検索方法、メタデータ検索プログラム、及びメタデータ検索システム
JP2012049830A (ja) * 2010-08-26 2012-03-08 Nippon Telegr & Teleph Corp <Ntt> 映像管理装置、方法、及びプログラム
JP2014038602A (ja) * 2012-08-17 2014-02-27 Naver Corp キャプチャしたイメージを用いた動画分析装置、方法およびコンピュータ読み取り可能な記録媒体
JP2016167236A (ja) * 2015-03-10 2016-09-15 富士ゼロックス株式会社 画像処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US11461392B2 (en) Providing relevant cover frame in response to a video search query
US10922350B2 (en) Associating still images and videos
US20220035827A1 (en) Tag selection and recommendation to a user of a content hosting service
Wang et al. Event driven web video summarization by tag localization and key-shot identification
CN101021855B (zh) 基于内容的视频检索系统
US10438050B2 (en) Image analysis device, image analysis system, and image analysis method
US8385660B2 (en) Mixed media reality indexing and retrieval for repeated content
CN102112987A (zh) 大规模图像注释的统计方法
US20140193048A1 (en) Retrieving Visual Media
JP2008217701A (ja) メタデータ付与装置,メタデータ付与方法,メタデータ付与プログラム,及びメタデータ付与プログラムを記録した記録媒体
KR100896336B1 (ko) 영상 정보 기반의 동영상 연관 검색 시스템 및 방법
Luo et al. Exploring large-scale video news via interactive visualization
KR101934108B1 (ko) 이미지 군집화 및 공유 방법, 그리고 이를 구현한 시스템 및 어플리케이션
CN110933520B (zh) 一种基于螺旋摘要的监控视频展示方法及存储介质
JP4544047B2 (ja) Web画像検索結果分類提示方法及び装置及びプログラム及びプログラムを格納した記憶媒体
KR20230051995A (ko) 실감형 확장현실 콘텐츠 관리 플랫폼
KR102281266B1 (ko) 영상 내 자막 키워드 추출 및 순위 산정 시스템 및 방법
KR20090015266A (ko) 비디오 식별을 통한 유해 동영상 검열 시스템 및 방법
TWI693524B (zh) 專屬個性化圖片搜尋優化方法
KR101575819B1 (ko) 동영상 검색 및 제공 방법
Cheng Research on Sports News Video Retrieval Based on Feature Extraction Algorithm
CN117648504A (zh) 媒体资源序列的生成方法、装置、计算机设备和存储介质
Luo et al. Knowledge Mining and Visualization on News Webpages and Large-Scale News Video Database
CN115033738A (zh) 一种标签扩展方法、装置、电子设备和存储介质
KR20180107042A (ko) 이미지 군집화 및 공유 방법, 그리고 이를 구현한 시스템 및 어플리케이션

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090218

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111101

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120417