JP2008226110A - 情報処理装置、情報処理方法および制御プログラム - Google Patents
情報処理装置、情報処理方法および制御プログラム Download PDFInfo
- Publication number
- JP2008226110A JP2008226110A JP2007066648A JP2007066648A JP2008226110A JP 2008226110 A JP2008226110 A JP 2008226110A JP 2007066648 A JP2007066648 A JP 2007066648A JP 2007066648 A JP2007066648 A JP 2007066648A JP 2008226110 A JP2008226110 A JP 2008226110A
- Authority
- JP
- Japan
- Prior art keywords
- metadata
- image
- moving image
- still image
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
【課題】動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、有用な検索用メタデータの作成を容易とする。
【解決手段】画像情報処理装置は、動画像あるいは静止画像に関連づけられた関連コンテンツから動画像あるいは静止画像を検索するのに用いる原検索用メタデータを抽出し、メタデータ候補記憶部を参照して、原検索用メタデータから検索用メタデータのフィルタリングを行い、原検索用メタデータを動画像あるいは静止画像に付与すべき検索用メタデータとする。
【選択図】図5
【解決手段】画像情報処理装置は、動画像あるいは静止画像に関連づけられた関連コンテンツから動画像あるいは静止画像を検索するのに用いる原検索用メタデータを抽出し、メタデータ候補記憶部を参照して、原検索用メタデータから検索用メタデータのフィルタリングを行い、原検索用メタデータを動画像あるいは静止画像に付与すべき検索用メタデータとする。
【選択図】図5
Description
本発明は、情報処理装置、情報処理方法および制御プログラムに係り、特に静止画像や動画像等のコンテンツの検索用メタデータの作成容易化技術に関する。
近年、ディジタルカメラやデジタルビデオ、カメラ付携帯電話等の普及により、個人が保存している画像等のコンテンツは増加する一方である。代表的なコンテンツであるデジタル画像データには、ディジタルカメラの機能によって、撮影日時を示す情報等を含むメタデータが付加されることが多い。このメタデータに含まれる情報を利用すれば、例えば特定の日に撮影されたデジタル画像データを検索することができ、デジタル画像データの管理の一助となる。ところが、一般的なメタデータに含まれる情報は、撮影日時や撮影時の条件(ISO感度、シャッタースピードなど)を示す情報であり、コンテンツの内容に関連する情報は含まれない。このため、メタデータに含まれる情報を用いても、コンテンツの内容に基づく管理を行うことは困難であった。
ダブリンコアやMPEG−7など、メタデータの体系も整備されているが、これらの体系に基づいてメタデータを作成、入力する作業は専門家ではない人々には困難な作業であった。
特開2005−196598号
ダブリンコアやMPEG−7など、メタデータの体系も整備されているが、これらの体系に基づいてメタデータを作成、入力する作業は専門家ではない人々には困難な作業であった。
これを解決するため、特許文献1記載の技術においては、コンテンツ間を連携することによりメタデータを増加、更新する技術が開示されている。
しかしながら、特許文献1記載の技術では、連携対象のコンテンツとしては、属性の同一(同種)のコンテンツを使用することが前提であり、属性の異なるコンテンツを連携させた場合、無用なメタデータが増加してしまうという問題があった。
そこで、本発明の目的は、動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、有用な検索用メタデータの作成が容易となる情報処理装置、情報処理方法および制御プログラムを提供することにある。
しかしながら、特許文献1記載の技術では、連携対象のコンテンツとしては、属性の同一(同種)のコンテンツを使用することが前提であり、属性の異なるコンテンツを連携させた場合、無用なメタデータが増加してしまうという問題があった。
そこで、本発明の目的は、動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、有用な検索用メタデータの作成が容易となる情報処理装置、情報処理方法および制御プログラムを提供することにある。
上記課題を解決するため、本発明の第一形態は、動画像あるいは静止画像に関連づけられた関連コンテンツから前記動画像あるいは前記静止画像を検索するのに用いる原検索用メタデータを抽出するメタデータ抽出部と、前記動画像あるいは前記静止画像に付与される検索用メタデータの候補となるメタデータ候補を記憶したメタデータ候補記憶部と、前記メタデータ候補記憶部を参照して、前記原検索用メタデータから前記検索用メタデータのフィルタリングを行うフィルタリング部と、を備えたことを特徴としている。
上記構成によれば、メタデータ抽出部は、動画像あるいは静止画像に関連づけられた関連コンテンツから動画像あるいは静止画像を検索するのに用いる原検索用メタデータを抽出する。
これによりフィルタリング部は、メタデータ候補記憶部を参照して、前記原検索用メタデータから前記検索用メタデータのフィルタリングを行う。
したがって、動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、原検索用メタデータに含まれる無用な検索用メタデータを除去して、有用な検索用メタデータを作成することが容易となる。
これによりフィルタリング部は、メタデータ候補記憶部を参照して、前記原検索用メタデータから前記検索用メタデータのフィルタリングを行う。
したがって、動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、原検索用メタデータに含まれる無用な検索用メタデータを除去して、有用な検索用メタデータを作成することが容易となる。
また、本発明の第二形態は、第一形態の情報処理装置において、前記フィルタリング部は、前記原検索用メタデータの重要度あるいは出現確率が一定値以上の場合に、前記原検索用メタデータを前記検索用メタデータとすることを特徴としている。
上記構成によれば、フィルタリング部は、原検索用メタデータの重要度あるいは出現確率が一定値以上の場合に、原検索用メタデータを検索用メタデータとすることとなるので、有用な検索用メタデータを作成することができる。
上記構成によれば、フィルタリング部は、原検索用メタデータの重要度あるいは出現確率が一定値以上の場合に、原検索用メタデータを検索用メタデータとすることとなるので、有用な検索用メタデータを作成することができる。
また、本発明の第三形態は、第一形態または第二形態の情報処理装置において、前記メタデータ候補記憶部は、前記メタデータ候補となる語句をその出現確率に対応づけて記憶し、前記出現確率は、前記動画像若しくは前記静止画像と、前記動画像若しくは前記静止画像に対応するテキストデータとで構成されるコンテンツにおいて、前記動画像若しくは前記静止画像を表示する画像枠の近傍に配置された前記テキストデータに出現する語句の出現確率を用いることを特徴としている。
したがって、動画像あるいは静止画像を表示する画像枠の近傍に配置された、より当該画像枠内の画像に関連すると考えられる語句の出現確率を用いてフィルタリングを行えるため、より関連性の高い語句を検索用メタデータとして作成することが可能となる。
したがって、動画像あるいは静止画像を表示する画像枠の近傍に配置された、より当該画像枠内の画像に関連すると考えられる語句の出現確率を用いてフィルタリングを行えるため、より関連性の高い語句を検索用メタデータとして作成することが可能となる。
また、本発明の第四形態は、第一形態ないし第三形態のいずれかに記載の情報処理装置において、前記メタデータ候補記憶部は、前記動画像若しくは前記静止画像と、前記動画像若しくは前記静止画像を検索するのに用いるメタデータが対応づけられた画像データベースを参照して前記メタデータ候補を記憶することを特徴としている。
上記構成によれば、メタデータ候補の信頼性が高くなり、より確実に最適な検索用メタデータを作成することが可能となる。
上記構成によれば、メタデータ候補の信頼性が高くなり、より確実に最適な検索用メタデータを作成することが可能となる。
また、本発明の第五形態は、第一形態ないし第五形態のいずれかに記載の情報処理装置において、前記メタデータ候補記憶部は、前記動画像若しくは前記静止画像と、前記動画像若しくは前記静止画像に対応するテキストデータを含むコンテンツを参照して前記メタデータ候補を記憶することを特徴としている。
上記構成によれば、メタデータ候補記憶部に記憶しているメタデータ候補としてより信頼性の高い語句を用いることが可能となり、ひいては、より信頼性の高い検索用メタデータを得ることが可能となる。
上記構成によれば、メタデータ候補記憶部に記憶しているメタデータ候補としてより信頼性の高い語句を用いることが可能となり、ひいては、より信頼性の高い検索用メタデータを得ることが可能となる。
本発明の第六形態は、第一形態ないし第五形態のいずれかに記載の情報処理装置において、楽曲データと前記楽曲データを検索するのに用いる楽曲検索用メタデータを記憶する楽曲データベースを備え、前記メタデータ抽出部は、前記動画像あるいは前記静止画像に関連づけられた前記楽曲データに対応する前記楽曲検索用メタデータを抽出することを特徴としている。
上記構成によれば、動画像あるいは静止画像に関連づけられた楽曲に対応する楽曲検索用メタデータを原検索用メタデータとして抽出することができるので、より検索用メタデータとして採用される可能性の高い原検索用メタデータを得ることが可能となる。
上記構成によれば、動画像あるいは静止画像に関連づけられた楽曲に対応する楽曲検索用メタデータを原検索用メタデータとして抽出することができるので、より検索用メタデータとして採用される可能性の高い原検索用メタデータを得ることが可能となる。
また、本発明の第七形態は、動画像あるいは静止画像に付与される検索用メタデータの候補となるメタデータ候補を記憶したメタデータ候補記憶部と演算部とを有する情報処理装置を用いた情報処理方法であって、前記演算部が、動画像あるいは静止画像に関連づけられた関連コンテンツから前記動画像あるいは前記静止画像を検索するのに用いる原検索用メタデータを抽出するメタデータ抽出過程と、前記演算部が、前記メタデータ候補記憶部を参照して、前記原検索用メタデータから前記検索用メタデータのフィルタリングを行うフィルタリング過程と、を備えたことを特徴としている。
上記構成によれば、動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、原検索用メタデータに含まれる無用な検索用メタデータを除去して、有用な検索用メタデータを作成することが容易となる。
上記構成によれば、動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、原検索用メタデータに含まれる無用な検索用メタデータを除去して、有用な検索用メタデータを作成することが容易となる。
また、本発明の第八形態は、動画像あるいは静止画像に付与される検索用メタデータの候補となるメタデータ候補を記憶したメタデータ候補記憶部を有する情報処理装置をコンピュータにより制御するための制御プログラムであって、前記動画像あるいは前記静止画像に関連づけられた関連コンテンツから前記動画像あるいは前記静止画像を検索するのに用いる原検索用メタデータを抽出させ、前記メタデータ候補記憶部を参照して、前記原検索用メタデータから前記検索用メタデータのフィルタリングを行わせる、ことを特徴としている。
上記構成によれば、動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、原検索用メタデータに含まれる無用な検索用メタデータを除去して、有用な検索用メタデータを作成することが容易となる。
この場合において、制御プログラムをコンピュータ読取可能な記録媒体に記録するようにしても良い。
上記構成によれば、動画像あるいは静止画像に対し、さまざまなコンテンツを利用して検索用メタデータを付与するに際し、原検索用メタデータに含まれる無用な検索用メタデータを除去して、有用な検索用メタデータを作成することが容易となる。
この場合において、制御プログラムをコンピュータ読取可能な記録媒体に記録するようにしても良い。
次に図面を参照して本発明の好適な実施形態について説明する。
図1は、実施形態の画像情報処理装置の概要構成ブロック図である。
画像情報処理装置10は、パーソナルコンピュータとして構成されており、画像処理を行う画像情報処理装置本体11と、各種画像入力を行う画像入力装置12と、各種操作を行うためのキーボード、マウスなどの入力装置13と、各種表示を行う液晶ディスプレイなどの表示装置14と、印刷を行うプリンタなどの出力装置15と、各種データを記憶するハードディスク装置などの外部記憶装置16と、を備えている。
画像情報処理装置本体11は、当該画像情報処理装置本体11全体の制御を行うマイクロプロセッサユニット(MPU)21と、各種制御プログラムを含む各種データを記憶するROM22と、MPU21のワークエリアとして機能するRAM23と、LAN、インターネットなどの外部の通信ネットワークとの間のインタフェース動作を行う通信インタフェース部24と、を備えている。
図1は、実施形態の画像情報処理装置の概要構成ブロック図である。
画像情報処理装置10は、パーソナルコンピュータとして構成されており、画像処理を行う画像情報処理装置本体11と、各種画像入力を行う画像入力装置12と、各種操作を行うためのキーボード、マウスなどの入力装置13と、各種表示を行う液晶ディスプレイなどの表示装置14と、印刷を行うプリンタなどの出力装置15と、各種データを記憶するハードディスク装置などの外部記憶装置16と、を備えている。
画像情報処理装置本体11は、当該画像情報処理装置本体11全体の制御を行うマイクロプロセッサユニット(MPU)21と、各種制御プログラムを含む各種データを記憶するROM22と、MPU21のワークエリアとして機能するRAM23と、LAN、インターネットなどの外部の通信ネットワークとの間のインタフェース動作を行う通信インタフェース部24と、を備えている。
図2は、画像情報処理装置の機能ブロック図である。
画像情報処理装置10は、大別すると、映像・画像入力部31と、テキスト抽出部32と、形態素解析部33と、レイアウト解析部34と、重要語句抽出部35と、フィルタリング部36と、出現確率算出部37と、を備えている。
画像情報処理装置10は、大別すると、映像・画像入力部31と、テキスト抽出部32と、形態素解析部33と、レイアウト解析部34と、重要語句抽出部35と、フィルタリング部36と、出現確率算出部37と、を備えている。
映像・画像入力部31は、放送電波、通信ネットワークあるいはICメモリカードなどのデータ記憶媒体を介して動画像データ(動画[あるいは映像]に対応)あるいは静止画像データ(静止画に対応)を入力する。具体的には、様々な画像フォーマットの画像を、様々な圧縮形式、ファイル形式を有するファイルや、スキャナ、ディジタルカメラ、ディジタルビデオカメラなどの入力装置から抽出あるいは受け取ることとなる。この場合において、圧縮形式としては、JPEG、MPEG−4、H.264等が挙げられる。
テキスト抽出部32は、XHTML(個人のホームページ、ブログなど)、送受信した電子メール、XML(楽曲の検索用メタデータなど)で記述されているハイパーテキストデータからタグ情報以外のテキストデータを抽出する。
形態素解析部33は、ブログなどのテキストデータあるいは音声認識部により音声認識したテキストデータに対応するテキストの形態素解析を行い、単語(語句)を抽出し、必要に応じてステミングを行う。
形態素解析部33は、ブログなどのテキストデータあるいは音声認識部により音声認識したテキストデータに対応するテキストの形態素解析を行い、単語(語句)を抽出し、必要に応じてステミングを行う。
レイアウト解析部34は、ブログやホームページなどのように、動画像あるいは静止画像と、テキストとが混在してレイアウトされている場合、動画像あるいは静止画像と、テキストとの位置関係を明らかにする。
重要語句抽出部35は、複数の関連コンテンツから、最も関連が深い関連コンテンツ(コンテンツiと表記)、からメタデータとする語句を抽出する。
この場合において、関連コンテンツを代表する語句、すなわち、当該関連コンテンツの中で重要度の高い語句を、動画像あるいは静止画像を最も良く表現する語句とみなして、重要語句と表現する。
ここでは、TF/IDF(Term Frequency & Inverse Document Frequency)処理によって重要度を算出する。そして、重要語句抽出部35は、下記式(1)によって、形態素解析部33によりコンテンツiから抽出された各々の語句jの重要度tfidf(i,j)を求める。
この場合において、関連コンテンツを代表する語句、すなわち、当該関連コンテンツの中で重要度の高い語句を、動画像あるいは静止画像を最も良く表現する語句とみなして、重要語句と表現する。
ここでは、TF/IDF(Term Frequency & Inverse Document Frequency)処理によって重要度を算出する。そして、重要語句抽出部35は、下記式(1)によって、形態素解析部33によりコンテンツiから抽出された各々の語句jの重要度tfidf(i,j)を求める。
以下、具体的に説明する。
まず、コンテンツiにおける語句jの出現頻度をFreq(i,j)とし、関連コンテンツでの出現頻度に関わるtf(i,j)を算出する。
tf(i,j)=log(Freq(i,j)+1)/log(コンテンツiの総語句数)
ここで、tf(i,j)は、関連コンテンツのテキストデータにおける出現頻度をもとに、語句の重要度を表す指標である。言い換えれば、コンテンツ中に多く出現する語句が、重要な語句とみなされる。
まず、コンテンツiにおける語句jの出現頻度をFreq(i,j)とし、関連コンテンツでの出現頻度に関わるtf(i,j)を算出する。
tf(i,j)=log(Freq(i,j)+1)/log(コンテンツiの総語句数)
ここで、tf(i,j)は、関連コンテンツのテキストデータにおける出現頻度をもとに、語句の重要度を表す指標である。言い換えれば、コンテンツ中に多く出現する語句が、重要な語句とみなされる。
次にdf(j)を語句jが出現するコンテンツ数として、idf(j)を算出する。
idf(j)=log(N/dt(j))
ここで、idf(j)は、検索された全てのコンテンツのうち、語句tが出現するコンテンツのテキストデータの数を語句tの出現頻度として計算したものである。
さらに、コンテンツiにおける、語句jの重要度を、
tfidf(i,j)=tf(i,j)×idf(j)
とする。したがって、検索用メタデータを選択する場合には、このtfidf(i,j)の値の大きい順に所定個数を選択すればよい。
idf(j)=log(N/dt(j))
ここで、idf(j)は、検索された全てのコンテンツのうち、語句tが出現するコンテンツのテキストデータの数を語句tの出現頻度として計算したものである。
さらに、コンテンツiにおける、語句jの重要度を、
tfidf(i,j)=tf(i,j)×idf(j)
とする。したがって、検索用メタデータを選択する場合には、このtfidf(i,j)の値の大きい順に所定個数を選択すればよい。
フィルタリング部36は、動画像あるいは静止画像に付与される検索用メタデータの候補となる後述するメタデータ候補に基づいて、検索用メタデータの元となる原検索用メタデータを動画像あるいは静止画像に付与すべき検索用メタデータとするためのフィルタリングを行う。
この場合において、メタデータ候補となる語句は、重要度の比較的高い語句あるいは出現確率が比較的高い語句が用いられる。
この場合において、メタデータ候補となる語句は、重要度の比較的高い語句あるいは出現確率が比較的高い語句が用いられる。
具体的には、重要度の高い語句をメタデータ候補としている場合には、フィルタリング後の
tfidf(i,j)=tfidf(i,j)×P(j)
の値が一定値以上の場合、あるいは、後述する出現確率算出部37が算出した語句jの出現確率P(j)が一定値以上の場合に検索用メタデータとして使用するようにフィルタリングすれば良い。
tfidf(i,j)=tfidf(i,j)×P(j)
の値が一定値以上の場合、あるいは、後述する出現確率算出部37が算出した語句jの出現確率P(j)が一定値以上の場合に検索用メタデータとして使用するようにフィルタリングすれば良い。
出現確率算出部37は、以下のいずれかを用いて出現確率を算出する。
第1の手法としては、メタデータが付与された映像画像データベース(コンテンツ)を参照し、付加されている検索用メタデータを使用する。
また、第2の手法として、動画像あるいは静止画像、およびテキストデータを含むコンテンツ(例えば、ブログ、ホームページを含むウェブページなど)を利用し、動画像あるいは静止画像に関連すると推定されるテキストデータに含まれる語句を検索用メタデータとして使用する。
第1の手法としては、メタデータが付与された映像画像データベース(コンテンツ)を参照し、付加されている検索用メタデータを使用する。
また、第2の手法として、動画像あるいは静止画像、およびテキストデータを含むコンテンツ(例えば、ブログ、ホームページを含むウェブページなど)を利用し、動画像あるいは静止画像に関連すると推定されるテキストデータに含まれる語句を検索用メタデータとして使用する。
図3は、コンテンツとしてのブログのレイアウト例の説明図である。
本実施形態において、コンテンツとしてのブログなどからメタデータ候補辞書を作成する場合、動画像あるいは静止画像を表示している画像枠の近傍のテキストを使用する。
ここで、近傍とは、以下のように規定している。
第1には、レイアウトから映像画像の説明として使われている可能性が高い文章の場合であり、この場合には、動画像あるいは静止画像を表示している画像枠の上方あるいは下方に接してレイアウトされ、かつ「写真」、「映像」などと、説明箇所と推定できるキーワードが含まれているテキストである。
第2には、動画像あるいは静止画像を表示している画像枠から数行または数列離れてレイアウトされているテキストである。これらのテキストは、経験的に当該動画像あるいは当該静止画像の説明をしている可能性が高いからである。
第3には、XHTMLなどの特定のタグ内に現れるテキストの場合であり、例えば、IMGタグでは、表示する画像を記述するが、このタグ内に合わせて記述されているテキストは当該動画像あるいは当該静止画像の説明をしている可能性が高いからである。
上述したように、ブログのように動画像あるいは静止画像と、テキストが含まれている場合、動画像あるいは静止画像を表示している画像枠の近傍には、当該動画像あるいは静止画像に関する説明がテキストデータとして記述されている場合が多い。
そこで、図3の例の場合、ブログのページBPには、動画像あるいは静止画像を表示している画像枠GFと、画像枠GFの周りに配置されたテキスト(図中、実線および破線で模式的に示す)TX1、TX21、TX22と、が含まれている。
ブログのページに含まれるテキストのうち、実線で示す位置に配置されたテキストTX1は、動画像あるいは静止画像を表示している画像枠GFの近傍にレイアウトされており、破線で示すテキストTX21、TX22は、画像枠GFから離れてレイアウトされている。
本実施形態において、コンテンツとしてのブログなどからメタデータ候補辞書を作成する場合、動画像あるいは静止画像を表示している画像枠の近傍のテキストを使用する。
ここで、近傍とは、以下のように規定している。
第1には、レイアウトから映像画像の説明として使われている可能性が高い文章の場合であり、この場合には、動画像あるいは静止画像を表示している画像枠の上方あるいは下方に接してレイアウトされ、かつ「写真」、「映像」などと、説明箇所と推定できるキーワードが含まれているテキストである。
第2には、動画像あるいは静止画像を表示している画像枠から数行または数列離れてレイアウトされているテキストである。これらのテキストは、経験的に当該動画像あるいは当該静止画像の説明をしている可能性が高いからである。
第3には、XHTMLなどの特定のタグ内に現れるテキストの場合であり、例えば、IMGタグでは、表示する画像を記述するが、このタグ内に合わせて記述されているテキストは当該動画像あるいは当該静止画像の説明をしている可能性が高いからである。
上述したように、ブログのように動画像あるいは静止画像と、テキストが含まれている場合、動画像あるいは静止画像を表示している画像枠の近傍には、当該動画像あるいは静止画像に関する説明がテキストデータとして記述されている場合が多い。
そこで、図3の例の場合、ブログのページBPには、動画像あるいは静止画像を表示している画像枠GFと、画像枠GFの周りに配置されたテキスト(図中、実線および破線で模式的に示す)TX1、TX21、TX22と、が含まれている。
ブログのページに含まれるテキストのうち、実線で示す位置に配置されたテキストTX1は、動画像あるいは静止画像を表示している画像枠GFの近傍にレイアウトされており、破線で示すテキストTX21、TX22は、画像枠GFから離れてレイアウトされている。
そこで、出現確率算出部37は、レイアウト解析部34の解析結果に基づいて、図3に実線で示すように、画像枠GFの近傍に配置されているテキストTX1は、画像枠GF内に表示されている動画像あるいは静止画像と関連が高いと推定して、この領域のテキストTX1に含まれる語句を検索用メタデータとして使用することとなる。
これに対し、出現確率算出部37は、画像枠GFから離れてレイアウトされているテキストTX21、TX22は画像枠GF内に表示されている動画像あるいは静止画像と関連が低いと推定してこれらの領域のテキストTX21、TX22に含まれる語句を検索用メタデータとして使用することはない。
これに対し、出現確率算出部37は、画像枠GFから離れてレイアウトされているテキストTX21、TX22は画像枠GF内に表示されている動画像あるいは静止画像と関連が低いと推定してこれらの領域のテキストTX21、TX22に含まれる語句を検索用メタデータとして使用することはない。
このように、出現確率算出部37が、ホームページあるいはブログに含まれるテキスト(データ)から出現確率を算出するのは、年月とともに新しく使われるようになる新規な語句(新語)を含めて検索用メタデータとして使用できるようにするためである。
そして、出現確率算出部37は、上記の各コンテンツから以下のように、語句jの出現確率P(j)を求める。
語句jの出現確率P(j)=語句jの出現数/Σ(語句jの出現数)
次に実施形態の動作について説明する。
そして、出現確率算出部37は、上記の各コンテンツから以下のように、語句jの出現確率P(j)を求める。
語句jの出現確率P(j)=語句jの出現数/Σ(語句jの出現数)
次に実施形態の動作について説明する。
図4は、実施形態の処理フローチャートである。
図5は、実施形態の概要動作説明図である。
まず、画像情報処理装置10は、検索用メタデータを生成する動画像あるいは静止画像の関連コンテンツ41を検索用メタデータのソースとして選択して(ステップS100)、関連コンテンツに含まれる語句の重要度を算出して原検索用メタデータを抽出する(ステップS200)。
具体的には、画像情報処理装置10は、映像・画像入力部31として機能し、画像検索用メタデータの付与対象である動画像あるいは静止画像(図中、映像画像と記載)が入力された場合には(ステップS11)、入力された動画像あるいは静止画像に関連し、テキスト(データ)を含んで構成されるコンテンツである関連コンテンツ41から、検索用メタデータMDを生成するための原検索用メタデータMD0の抽出を行う(ステップS12)。
図5は、実施形態の概要動作説明図である。
まず、画像情報処理装置10は、検索用メタデータを生成する動画像あるいは静止画像の関連コンテンツ41を検索用メタデータのソースとして選択して(ステップS100)、関連コンテンツに含まれる語句の重要度を算出して原検索用メタデータを抽出する(ステップS200)。
具体的には、画像情報処理装置10は、映像・画像入力部31として機能し、画像検索用メタデータの付与対象である動画像あるいは静止画像(図中、映像画像と記載)が入力された場合には(ステップS11)、入力された動画像あるいは静止画像に関連し、テキスト(データ)を含んで構成されるコンテンツである関連コンテンツ41から、検索用メタデータMDを生成するための原検索用メタデータMD0の抽出を行う(ステップS12)。
関連コンテンツ41としては、例えば、個人のホームページ、ブログ、個人が送受信した電子メール、新聞やイベントに関連したホームページなどが挙げられ、これらは何れも、画像検索用メタデータの付与対象である動画像あるいは静止画像が撮影された日時、場所、イベントに関する情報を含むものである。
例えば、関連コンテンツがブログである場合には、旅行や家庭行事に関する記述が含まれる可能性が高いからである。また、関連コンテンツが電子メールの場合には、旅行や家庭行事に関する内容が送受信される可能性が高いからである。
例えば、関連コンテンツがブログである場合には、旅行や家庭行事に関する記述が含まれる可能性が高いからである。また、関連コンテンツが電子メールの場合には、旅行や家庭行事に関する内容が送受信される可能性が高いからである。
また、画像情報処理装置10は、関連コンテンツ41から検索用メタデータMDを生成するための原検索用メタデータMD0の抽出処理と並行して、楽曲および当該楽曲に対応する検索用メタデータを含む楽曲データベース42から検索用メタデータMDを生成するための原検索用メタデータMD0の抽出処理を行う(ステップS13)。なお、この楽曲データベースも論理的に関連コンテンツ41として扱うことも可能である。
図6は、楽曲データベースの一例の説明図である。
楽曲データベース42は、例えば、楽曲名を表す楽曲名データ42Aと、アーティスト名を格納したアーティスト名データ42Bと、楽曲が属するジャンル名を格納したジャンルデータ42Cと、曲の説明や印象などを表す検索用メタデータとしての曲説明・印象データ42Dと、を備えている。
例えば、楽曲名を表す楽曲名データ42A=「A」の楽曲のアーティスト名データ42B=「演奏者1」であり、ジャンルデータ42C=「ポップス」であり、曲説明・印象データ42D=「リズミカル、軽快」となっている。
楽曲データベース42は、例えば、楽曲名を表す楽曲名データ42Aと、アーティスト名を格納したアーティスト名データ42Bと、楽曲が属するジャンル名を格納したジャンルデータ42Cと、曲の説明や印象などを表す検索用メタデータとしての曲説明・印象データ42Dと、を備えている。
例えば、楽曲名を表す楽曲名データ42A=「A」の楽曲のアーティスト名データ42B=「演奏者1」であり、ジャンルデータ42C=「ポップス」であり、曲説明・印象データ42D=「リズミカル、軽快」となっている。
次に画像情報処理装置10は、後述するメタデータ候補辞書に含まれる出現確率を用いて、原検索用メタデータMD0である語句の重要度を計算しなおし(ステップS300)、重要度の高い語句が検索用メタデータとして適切と考え、所定の個数の語句を検索用メタデータとしてフィルタリングにより選択する(ステップS400)。
具体的には、画像情報処理装置10は、フィルタリング部36として機能し、メタデータ候補辞書43に予め格納されているメタデータ候補語句を用いて、入力された原検索用メタデータMD0のフィルタリングを行って(ステップS14)、検索用メタデータMDを生成することとなる。
具体的には、画像情報処理装置10は、フィルタリング部36として機能し、メタデータ候補辞書43に予め格納されているメタデータ候補語句を用いて、入力された原検索用メタデータMD0のフィルタリングを行って(ステップS14)、検索用メタデータMDを生成することとなる。
ここで、メタデータ候補辞書について説明する。
図7は、メタデータ候補辞書の一例の説明図である。
メタデータ候補辞書43は、メタデータ候補となる語句を格納した語句データ43Aと、語句データ43Aに対応するともに出現確率算出部37において求めた出現確率に相当する値を有する出現確率データ43Bと、を記憶している。
図7は、メタデータ候補辞書の一例の説明図である。
メタデータ候補辞書43は、メタデータ候補となる語句を格納した語句データ43Aと、語句データ43Aに対応するともに出現確率算出部37において求めた出現確率に相当する値を有する出現確率データ43Bと、を記憶している。
ここで、出現確率データの値は、動画像あるいは静止画像の検索用メタデータとして使われる頻度の情報が含まれている。すなわち、動画像あるいは静止画像の検索用メタデータとして使われる頻度が低い場合には、対応する語句は、動画像あるいは静止画像の検索用メタデータとしてふさわしくないと考えられる。
具体的には、図7に示す例の場合、語句データ43A=「リズミカル」、「軽快」は、出現確率データ43Bの値が低いため動画像あるいは静止画像の検索用メタデータとしてふさわしくないとされ、語句データ43A=「癒される」は、出現確率データ43Bの値が高いため動画像あるいは静止画像の検索用メタデータとしてふさわしいとされる。
具体的には、図7に示す例の場合、語句データ43A=「リズミカル」、「軽快」は、出現確率データ43Bの値が低いため動画像あるいは静止画像の検索用メタデータとしてふさわしくないとされ、語句データ43A=「癒される」は、出現確率データ43Bの値が高いため動画像あるいは静止画像の検索用メタデータとしてふさわしいとされる。
この場合において、メタデータ候補となる語句は、動画像・静止画像データベース44と、動画像あるいは静止画像およびそれに対応するテキストデータを含むコンテンツ45と、から予め抽出して(ステップS15、S16)、記憶している。
動画像・静止画像データベース44は、動画像あるいは静止画像と、これらに対応する検索用メタデータと、を格納しているデータベースである。
また、動画像あるいは静止画像およびそれに対応するテキストデータを含むコンテンツ45としては、新聞社のサイトのウェブページやブログ等が含まれる。
動画像・静止画像データベース44は、動画像あるいは静止画像と、これらに対応する検索用メタデータと、を格納しているデータベースである。
また、動画像あるいは静止画像およびそれに対応するテキストデータを含むコンテンツ45としては、新聞社のサイトのウェブページやブログ等が含まれる。
以上の説明のように本実施形態によれば、簡単な操作で検索に有用な検索用メタデータMDを生成し、増加させることができる。
また、他の関連コンテンツあるいは楽曲データベースなどマルチメディアデータに付与されている検索用メタデータを使用するので、感性的な検索用メタデータを容易に利用することができる。
また、他の関連コンテンツあるいは楽曲データベースなどマルチメディアデータに付与されている検索用メタデータを使用するので、感性的な検索用メタデータを容易に利用することができる。
さらに動画像あるいは静止画像に既に使われている検索用メタデータを使って、原検索用メタデータをフィルタリングして所望の検索用メタデータを生成するので、不要な、ノイズ的な語句が検索用メタデータとして含まれることがなく、有用な検索用メタデータを容易に得ることが可能となる。
なお、上記実施形態において、図1に示した構成は、主としてハードウェア構成により、或いはハードウェアとソフトウェアとの協働により実現されるものであり、画像情報処理装置10を構成する各部の具体的形態や物理的態様については任意である。
以上の説明においては、画像情報処理装置10は、具体的には、パーソナルコンピュータ、PDA、携帯型電話機等に適用可能であるが、デジタルスチルカメラ、ディジタルビデオカメラ、スキャナ、プロジェクタ、テレビ、プリンタおよびその他の画像データを処理する電子機器に実装または接続することが可能である。
以上の説明においては、上記各機能を実現するための制御プログラムが、予めROM22に格納されている場合について説明したが、制御プログラムを、コンピュータ(CPU)読取可能な記録媒体に記録するようにしてもよい。このような構成であれば、コンピュータによってプログラムが記憶媒体から読み取られ、読み取られたプログラムに従ってコンピュータが処理を実行すると、上記各実施形態と同等の作用および効果が得られる。
ここで、記憶媒体とは、RAM、ROM等の半導体記憶媒体、FD、HD等の磁気記憶型記憶媒体、CD、CDV、LD、DVD等の光学的読取方式記憶媒体、MO等の磁気記憶型/光学的読取方式記憶媒体であって、電子的、磁気的、光学的等の読み取り方法のいかんにかかわらず、コンピュータで読み取り可能な記憶媒体であれば、どのような記憶媒体であってもよい。
また、インターネット、LANなどの通信ネットワークおよび通信インタフェース部24を介して制御用プログラムをダウンロードし、インストールして実行するように構成することも可能である。
以上の説明においては、上記各機能を実現するための制御プログラムが、予めROM22に格納されている場合について説明したが、制御プログラムを、コンピュータ(CPU)読取可能な記録媒体に記録するようにしてもよい。このような構成であれば、コンピュータによってプログラムが記憶媒体から読み取られ、読み取られたプログラムに従ってコンピュータが処理を実行すると、上記各実施形態と同等の作用および効果が得られる。
ここで、記憶媒体とは、RAM、ROM等の半導体記憶媒体、FD、HD等の磁気記憶型記憶媒体、CD、CDV、LD、DVD等の光学的読取方式記憶媒体、MO等の磁気記憶型/光学的読取方式記憶媒体であって、電子的、磁気的、光学的等の読み取り方法のいかんにかかわらず、コンピュータで読み取り可能な記憶媒体であれば、どのような記憶媒体であってもよい。
また、インターネット、LANなどの通信ネットワークおよび通信インタフェース部24を介して制御用プログラムをダウンロードし、インストールして実行するように構成することも可能である。
10…画像画像情報処理装置、11…画像情報処理装置本体、12…画像入力装置、13…入力装置、14…表示装置、15…出力装置、16…外部記憶装置、22…ROM、23…RAM、24…通信インタフェース部、31…映像・画像入力部、32…テキスト抽出部、33…形態素解析部、34…レイアウト解析部、35…重要語句抽出部、36…フィルタリング部、37…出現確率算出部、41…関連コンテンツ、42…楽曲データベース、42A…楽曲名データ、42B…アーティストデータ、42B…アーティスト名データ、42C…ジャンルデータ、42D…曲説明・印象データ、43…メタデータ候補辞書、43A…語句データ、43B…出現確率データ、44…動画像・静止画像データベース、45…コンテンツ、TX1、TX21、TX22…テキスト、GF…画像枠、MD…検索用メタデータ、MD0…原検索用メタデータ。
Claims (8)
- 動画像あるいは静止画像に関連づけられた関連コンテンツから前記動画像あるいは前記静止画像を検索するのに用いる原検索用メタデータを抽出するメタデータ抽出部と、
前記動画像あるいは前記静止画像に付与される検索用メタデータの候補となるメタデータ候補を記憶したメタデータ候補記憶部と、
前記メタデータ候補記憶部を参照して、前記原検索用メタデータから前記検索用メタデータのフィルタリングを行うフィルタリング部と、
を備えたことを特徴とする情報処理装置。 - 請求項1記載の情報処理装置において、
前記フィルタリング部は、前記原検索用メタデータの重要度あるいは出現確率が一定値以上の場合に、前記原検索用メタデータを前記検索用メタデータとすることを特徴とする情報処理装置。 - 請求項1または請求項2記載の情報処理装置において、
前記メタデータ候補記憶部は、前記メタデータ候補となる語句をその出現確率に対応づけて記憶し、
前記出現確率は、前記動画像若しくは前記静止画像と、前記動画像若しくは前記静止画像に対応するテキストデータとで構成されるコンテンツにおいて、前記動画像若しくは前記静止画像を表示する画像枠の近傍に配置された前記テキストデータに出現する語句の出現確率を用いることを特徴とする情報処理装置。 - 請求項1ないし請求項3のいずれかに記載の情報処理装置において、
前記メタデータ候補記憶部は、前記動画像若しくは前記静止画像と、前記動画像若しくは前記静止画像を検索するのに用いるメタデータが対応づけられた画像データベースを参照して前記メタデータ候補を記憶することを特徴とする情報処理装置。 - 請求項1ないし請求項4のいずれかに記載の情報処理装置において、
前記メタデータ候補記憶部は、前記動画像若しくは前記静止画像と、前記動画像若しくは前記静止画像に対応するテキストデータを含むコンテンツを参照して前記メタデータ候補を記憶することを特徴とする情報処理装置。 - 請求項1ないし請求項5のいずれかに記載の情報処理装置において、
楽曲データと前記楽曲データを検索するのに用いる楽曲検索用メタデータを記憶する楽曲データベースを備え、
前記メタデータ抽出部は、前記動画像あるいは前記静止画像に関連づけられた前記楽曲データに対応する前記楽曲検索用メタデータを抽出することを特徴とする情報処理装置。 - 動画像あるいは静止画像に付与される検索用メタデータの候補となるメタデータ候補を記憶したメタデータ候補記憶部と演算部とを有する情報処理装置を用いた情報処理方法であって、
前記演算部が、動画像あるいは静止画像に関連づけられた関連コンテンツから前記動画像あるいは前記静止画像を検索するのに用いる原検索用メタデータを抽出するメタデータ抽出過程と、
前記演算部が、前記メタデータ候補記憶部を参照して、前記原検索用メタデータから前記検索用メタデータのフィルタリングを行うフィルタリング過程と、
を備えたことを特徴とする情報処理方法。 - 動画像あるいは静止画像に付与される検索用メタデータの候補となるメタデータ候補を記憶したメタデータ候補記憶部を有する情報処理装置をコンピュータにより制御するための制御プログラムであって、
前記動画像あるいは前記静止画像に関連づけられた関連コンテンツから前記動画像あるいは前記静止画像を検索するのに用いる原検索用メタデータを抽出させ、
前記メタデータ候補記憶部を参照して、前記原検索用メタデータから前記検索用メタデータのフィルタリングを行わせる、
ことを特徴とする制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007066648A JP2008226110A (ja) | 2007-03-15 | 2007-03-15 | 情報処理装置、情報処理方法および制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007066648A JP2008226110A (ja) | 2007-03-15 | 2007-03-15 | 情報処理装置、情報処理方法および制御プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008226110A true JP2008226110A (ja) | 2008-09-25 |
Family
ID=39844610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007066648A Pending JP2008226110A (ja) | 2007-03-15 | 2007-03-15 | 情報処理装置、情報処理方法および制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008226110A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010092476A (ja) * | 2008-10-09 | 2010-04-22 | Xerox Corp | 表示方法、システムおよび格納媒体 |
JP2011076566A (ja) * | 2009-10-02 | 2011-04-14 | Sharp Corp | 情報処理装置、端末装置、サーバ装置、通信システム、表示制御方法、プログラム、およびコンピュータ読取り可能な記録媒体 |
JP2013011967A (ja) * | 2011-06-28 | 2013-01-17 | Kddi Corp | 公開コンテンツのキーワードに基づく関連情報を配信する関連情報配信プログラム、サーバ及び方法 |
WO2014102992A1 (ja) * | 2012-12-28 | 2014-07-03 | 株式会社日立製作所 | データ加工システムおよびデータ加工方法 |
JP2018033048A (ja) * | 2016-08-25 | 2018-03-01 | Jcc株式会社 | メタデータ生成システム |
CN110688835A (zh) * | 2019-09-03 | 2020-01-14 | 重庆邮电大学 | 一种基于词语特征值的法律专有领域词发现方法及装置 |
-
2007
- 2007-03-15 JP JP2007066648A patent/JP2008226110A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010092476A (ja) * | 2008-10-09 | 2010-04-22 | Xerox Corp | 表示方法、システムおよび格納媒体 |
JP2011076566A (ja) * | 2009-10-02 | 2011-04-14 | Sharp Corp | 情報処理装置、端末装置、サーバ装置、通信システム、表示制御方法、プログラム、およびコンピュータ読取り可能な記録媒体 |
JP2013011967A (ja) * | 2011-06-28 | 2013-01-17 | Kddi Corp | 公開コンテンツのキーワードに基づく関連情報を配信する関連情報配信プログラム、サーバ及び方法 |
WO2014102992A1 (ja) * | 2012-12-28 | 2014-07-03 | 株式会社日立製作所 | データ加工システムおよびデータ加工方法 |
JP5903171B2 (ja) * | 2012-12-28 | 2016-04-13 | 株式会社日立製作所 | データ加工システムおよびデータ加工方法 |
JPWO2014102992A1 (ja) * | 2012-12-28 | 2017-01-12 | 株式会社日立製作所 | データ加工システムおよびデータ加工方法 |
JP2018033048A (ja) * | 2016-08-25 | 2018-03-01 | Jcc株式会社 | メタデータ生成システム |
CN110688835A (zh) * | 2019-09-03 | 2020-01-14 | 重庆邮电大学 | 一种基于词语特征值的法律专有领域词发现方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7912829B1 (en) | Content reference page | |
US7715625B2 (en) | Image processing device, image processing method, and storage medium storing program therefor | |
US8380492B2 (en) | System and method for text cleaning by classifying sentences using numerically represented features | |
US8423537B2 (en) | Method and arrangement for handling of information search results | |
US8312388B2 (en) | Information processing apparatus, information processing method and computer readable medium | |
US20010049700A1 (en) | Information processing apparatus, information processing method and storage medium | |
US7979785B1 (en) | Recognizing table of contents in an image sequence | |
US20080079693A1 (en) | Apparatus for displaying presentation information | |
US20140195532A1 (en) | Collecting digital assets to form a searchable repository | |
US20100131534A1 (en) | Information providing system | |
JP2006235910A (ja) | 写真画像検索装置、写真画像検索方法、記録媒体、およびプログラム | |
US20180189929A1 (en) | Adjusting margins in book page images | |
EP2831775A1 (en) | Information processing terminal and method, and information management apparatus and method | |
JP2008226110A (ja) | 情報処理装置、情報処理方法および制御プログラム | |
JP4589910B2 (ja) | 会話記録ブログ化装置 | |
US10216989B1 (en) | Providing additional information for text in an image | |
JP2006202081A (ja) | メタデータ生成装置 | |
JP2009064148A (ja) | 情報処理装置、情報処理装置の制御方法および制御プログラム | |
JP2007114942A (ja) | メタデータ生成装置およびメタデータ生成方法 | |
JP2007140603A (ja) | アーリーアダプタ抽出方法及び装置及びプログラム及び話題語予測方法及び装置及びプログラム | |
JP5687312B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
US20140136963A1 (en) | Intelligent information summarization and display | |
CN113407775B (zh) | 视频搜索方法、装置及电子设备 | |
JP2008160512A (ja) | 再生装置、電子機器、再生方法、および、プログラム | |
JP2006215681A (ja) | 文書内容把握支援システム |