JP5337420B2 - 動画検索装置、動画検索方法及びコンピュータプログラム - Google Patents

動画検索装置、動画検索方法及びコンピュータプログラム Download PDF

Info

Publication number
JP5337420B2
JP5337420B2 JP2008181887A JP2008181887A JP5337420B2 JP 5337420 B2 JP5337420 B2 JP 5337420B2 JP 2008181887 A JP2008181887 A JP 2008181887A JP 2008181887 A JP2008181887 A JP 2008181887A JP 5337420 B2 JP5337420 B2 JP 5337420B2
Authority
JP
Japan
Prior art keywords
moving image
image data
search
metadata
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008181887A
Other languages
English (en)
Other versions
JP2010020630A (ja
Inventor
彰 曽我
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xing Inc
Original Assignee
Xing Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xing Inc filed Critical Xing Inc
Priority to JP2008181887A priority Critical patent/JP5337420B2/ja
Publication of JP2010020630A publication Critical patent/JP2010020630A/ja
Application granted granted Critical
Publication of JP5337420B2 publication Critical patent/JP5337420B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、動画データの検索を行う動画検索方法、該動画検索方法を実施する動画検索装置、及びコンピュータを該動画検索装置として機能させるためのコンピュータプログラムに関する。
使用者からアップロードされた動画データをオンライン上で自由に閲覧できるように蓄積した動画投稿サイトが実用化されている。動画投稿サイトは、動画データに付されたメタデータ、例えば題名をキーワード検索することによって、使用者所望の動画データを検索し、サムネイル画像を一覧表示するように構成されている。一覧においては、例えば視聴回数が多い動画データから昇順に表示される。
また、使用者からアップロードされた動画データを電子アルバムとして蓄積し、オンライン上で電子アルバムの閲覧を行うことが可能な電子アルバムシステムが実用化されている。該電子アルバムシステムは、動画データに付加された題名、撮影日時データ等に基づいて特定の動画データを検索し、検索された動画データを再生するように構成されている。
一方、動画の画質を評価する装置として、MPEG等で圧縮された動画の画質劣化を検出する画質評価装置が提案されている(例えば、特許文献1)。
特開2003−87442号公報
しかしながら、従来の動画検索方法では、動画データの画質、内容等を客観的に評価せずに検索結果を一覧表示するため、使用者が所望している動画データを優先的に一覧表示できていないという問題があった。
例えば、全く同じ被写体を撮影した2つの動画データがアップロードされており、一方の動画Aはブロックノイズ、手ぶれがひどいが、他方の動画Bは、動画Aに比べてブロックノイズが少なく、手ぶれも無いような場合を考えてみる。この場合、動画Bを優先的に一覧表示すべきであるが、動画Aの視聴回数が動画Bよりも多いと、動画Aが優先的に一覧表示されることになる。なお、動画投稿サイトの使用者から動画データに対する評価を受け付け、該評価が高い順で動画を一覧表示する動画投稿サイトもあるが、使用者による主観的な評価に基づくものであり、必ずしも使用者が所望する動画データを一覧表示できていない。
また、従来の動画投稿サイトにおいては、使用者によって動画データに付された題名、又は該動画データに対して投稿されたコメント等を手掛かりにして動画データをキーワード検索しているが、題名、コメント等は使用者によって主観的に選択されているため、検索精度が悪いという問題があった。
本発明は斯かる事情に鑑みてなされたものであり、動画データに含まれる複数のフレーム画像毎に、該フレーム画像、例えば該フレーム画像の含まれる文字情報に基づいて検索用のメタデータを生成し、また動画データを客観的に評価するように構成することにより、従来の動画検索方法に比べて、使用者が所望する動画データを精度良く検索及び一覧表示することができる動画検索装置、動画検索方法及びコンピュータプログラムを提供することを目的とする。
本発明の他の目的は、映像シーン毎にメタデータを生成するように構成することによって、各映像シーンの内容を客観的に示したメタデータに基づいて使用者が所望する動画データを精度良く検索及び一覧表示することができる動画検索装置を提供することにある。
本発明の他の目的は、検索キーワードをより多く含む動画データを高く評価するように構成することによって、使用者が所望する動画データをより精度良く検索及び一覧表示することができる動画検索装置を提供することにある。
本発明の他の目的は、使用者が所望する動画データとして、流行性が高い動画データを優先的に一覧表示することができる動画検索装置を提供することにある。
本発明の他の目的は、使用者が所望する動画データとして、画質が良い動画データを優先的に一覧表示することができる動画検索装置を提供することにある。
本発明の他の目的は、使用者が所望する動画データとして、ブロックノイズが小さい動画データを優先的に一覧表示することができる動画検索装置を提供することにある。
本発明の他の目的は、使用者が所望する動画データとして、手ぶれが小さい動画データを優先的に一覧表示することができる動画検索装置を提供することにある。
本発明に係る動画検索装置は、複数のフレーム画像からなる動画データを複数記憶した記憶装置から特定の動画データを検索するための検索キーワードを受け付け、受け付けた検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索する動画検索装置において、動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成するメタデータ生成手段と、動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価する評価手段と、検索キーワードをメタデータに含む動画データを検索する検索手段と、検索して得た動画データが複数である場合、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成する一覧生成手段とを備え、前記評価手段は、複数の情報資源を記憶している外部装置から、動画データに含まれるフレーム画像の特徴量を有する情報資源を検索し、該特徴量を有する情報資源の数を取得する手段を備え、動画データに含まれるフレーム画像の特徴量を有する情報資源の数が多い程、動画データを高く評価するようにしてあることを特徴とする。
本発明に係る動画検索装置は、複数のフレーム画像からなる動画データを複数記憶した記憶装置から特定の動画データを検索するための検索キーワードを受け付け、受け付けた検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索する動画検索装置において、動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成するメタデータ生成手段と、動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価する評価手段と、検索キーワードをメタデータに含む動画データを検索する検索手段と、検索して得た動画データが複数である場合、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成する一覧生成手段とを備え、前記評価手段は、動画データに含まれるフレーム画像を構成する画素の階調値を変更する画質補正を行い、補正後のフレーム画像を構成する画素の階調値、及び補正前のフレーム画像を構成する画素の階調値を比較する手段を備え、各階調値の差が大きい程、前記動画データを低く評価するようにしてあることを特徴とする。
本発明に係る動画検索装置は、前記メタデータ生成手段は、フレーム画像から文字領域を抽出する手段と、抽出された文字領域から文字を認識する文字認識手段とを備え、文字認識によって得られた文字をメタデータとして生成するようにしてあることを特徴とする。
本発明に係る動画検索装置は、動画データに含まれる複数のフレーム画像夫々の輝度を比較することによって、映像シーンが切り替わる境界のフレーム画像を特定する手段を備え、前記メタデータ生成手段は、映像シーン毎に、各映像シーンを構成する一のフレーム画像に基づいて動画データのメタデータを生成するようにしてあることを特徴とする。
本発明に係る動画検索装置は、前記評価手段は、検索キーワードを含むメタデータをより多く含む動画データを高く評価するようにしてあることを特徴とする。
本発明に係る動画検索装置は、前記評価手段は、複数の情報資源を記憶している外部装置から、動画データに関連付けられたメタデータを含む情報資源を検索し、該メタデータを含む情報資源の数を取得する手段を備え、該情報資源の数が多い程、動画データを高く評価するようにしてあることを特徴とする。
本発明に係る動画検索装置は、動画データに係る撮影地点を示す撮影位置情報と、該撮影位置情報が示す撮影地点の地名とを対応付けた地名情報を記憶する手段を備え、前記評価手段は、動画データに撮影位置情報が付加されている場合、該撮影位置情報及び地名情報に基づいて撮影地点の地名を特定する手段と、複数の情報資源を記憶している外部装置から、特定された地名を含む情報資源を検索し、該地名を含む情報資源の数を取得する手段とを備え、動画データの撮影位置情報に係る地名を含む情報資源の数が多い程、動画データを高く評価するようにしてあることを特徴とする。
本発明に係る動画検索装置は、前記評価手段は、動画データに含まれるフレーム画像からブロックノイズのエッジを検出し、ブロックノイズのエッジが大きい程、前記動画データを低く評価するようにしてあることを特徴とする。
本発明に係る動画検索装置は、前記評価手段は、動画データに含まれる複数のフレーム画像の端部に含まれる被写体を比較することで、該被写体の振動量を算出する手段を備え、該振動量が大きい程、前記動画データを低く評価するようにしてあることを特徴とする。
本発明に係る動画検索方法は、CPUが、複数のフレーム画像からなる動画データを複数記憶した記憶装置から特定の動画データを検索するための検索キーワードを受け付け、受け付けた検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索する動画検索方法において、CPUが、動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成するステップと、CPUが、動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価するステップと、CPUが、検索キーワードをメタデータに含む動画データを検索するステップと、検索して得た動画データが複数である場合、CPUが、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成するステップとを有し、動画データを評価するステップは、CPUが、複数の情報資源を記憶している外部装置から、動画データに含まれるフレーム画像の特徴量を有する情報資源を検索し、該特徴量を有する情報資源の数を取得するステップを含み、動画データに含まれるフレーム画像の特徴量を有する情報資源の数が多い程、動画データを高く評価することを特徴とする。
本発明に係るコンピュータプログラムは、コンピュータに、複数のフレーム画像からなる動画データを複数記憶した記憶装置から、検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索させるコンピュータプログラムにおいて、コンピュータに、動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成させるステップと、コンピュータに、動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価させるステップと、コンピュータに、検索キーワードをメタデータに含む動画データを検索させるステップと、コンピュータに、検索して得た動画データが複数である場合、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成させるステップとを有し、動画データを評価するステップは、複数の情報資源を記憶している外部装置から、動画データに含まれるフレーム画像の特徴量を有する情報資源を検索し、該特徴量を有する情報資源の数を取得するステップを含み、動画データに含まれるフレーム画像の特徴量を有する情報資源の数が多い程、動画データを高く評価することを特徴とする。
本発明に係るコンピュータプログラムは、コンピュータに、複数のフレーム画像からなる動画データを複数記憶した記憶装置から、検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索させるコンピュータプログラムにおいて、コンピュータに、動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成させるステップと、コンピュータに、動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価させるステップと、コンピュータに、検索キーワードをメタデータに含む動画データを検索させるステップと、コンピュータに、検索して得た動画データが複数である場合、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成させるステップとを有し、動画データを評価させるステップは、動画データに含まれるフレーム画像を構成する画素の階調値を変更する画質補正を行い、補正後のフレーム画像を構成する画素の階調値、及び補正前のフレーム画像を構成する画素の階調値を比較させるステップを含み、各階調値の差が大きい程、前記動画データを低く評価することを特徴とする。
本発明にあっては、メタデータ生成手段は、動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて動画データのメタデータを生成する。該メタデータは、動画データを検索する際に使用する情報であり、動画データに基づいて生成されるため、使用者が生成するメタデータに比べて客観性が高い。
評価手段は、動画データに含まれるフレーム画像、又はメタデータに基づいて動画データを評価する。該評価は、フレーム画像、又はメタデータに基づいて行われるため、使用者の評価をそのまま利用する場合に比べて客観性が高い。
そして、検索手段は、検索キーワードをメタデータに含む動画データを検索し、一覧生成手段は、検索して得た複数の動画データのサムネイル画像又はメタデータを、各動画データの評価結果に基づいて配列した一覧を生成する。
従って、従来の動画検索方法に比べて、使用者が所望する動画データを精度良く検索し、一覧表示することが可能になる。
なお、動画データを記憶した記憶装置は、必ずしも動画検索装置を構成するものでは無い。即ち、動画検索装置の外部にある記憶装置から動画データを検索する構成も本発明に含まれる。
本発明にあっては、フレーム画像から文字領域を抽出し、抽出された文字領域から文字を認識し、文字認識によって得られた文字をメタデータとして生成する。従って、従来の動画検索方法に比べて、使用者が所望する動画データを客観的に精度良く検索し、一覧表示することが可能になる。
本発明にあっては、動画データに含まれる複数のフレーム画像夫々の輝度を比較することによって、映像シーンが切り替わる境界のフレーム画像を特定、つまり、動画データを複数の映像シーンに区分けする。なお、厳密には、境界のフレーム画像は、時系列順に並ぶ2つの映像シーンがあった場合、いずれかの映像シーンに含まれるものであるが、いずれの映像シーンに含まれるものであっても良い。
そして、映像シーン毎に、各映像シーンを構成する一のフレーム画像、つまり少なくとも一のフレーム画像に基づいて動画データのメタデータを生成する。従って、動画データに複数の映像シーンが含まれている場合、各映像シーンの内容を示したメタデータに基づいて動画データを検索することが可能になる。よって、使用者が所望する動画データをより精度良く検索し、一覧表示することが可能になる。
本発明にあっては、動画データに係るメタデータが複数生成される。そして、検索キーワードを含むメタ情報をより多く含む動画データをより高く評価する。従って、使用者が所望する動画データをより精度良く検索し、一覧表示することが可能になる。
本発明にあっては、動画データに関連付けられたメタデータを含む情報資源を、外部装置から検索し、該メタデータを含む情報資源の数を取得する。評価手段は、メタデータを含む情報資源の数が多い程、動画データを高く評価する。
情報資源は、例えばニュース関連の写真、画像、音声、HTML文書、XML文書等であり、流行性を反映しているため、動画データをそのテーマの流行性という観点から評価するための基準として利用することができる。つまり、動画データのテーマの流行性が高い場合、該動画データに関連する情報資源の数は多く、動画データのテーマの流行性が低い場合、該動画データに関連する情報資源の数は少ない傾向がある。
従って、動画データを流行性という観点から評価し、使用者が所望する動画データとして、流行性が高い動画データを優先的に一覧表示することが可能になる。
なお、情報資源の検索及びメタデータを含む情報資源の数を特定する処理は、動画検索装置で実行するように構成しても良いし、外部の情報検索装置に検索及び情報資源の数を要求し、その結果を取得するように構成しても良い。
本発明にあっては、動画データに付加された撮影位置情報と、撮影位置情報及び該撮影位置情報が示す地名を対応付けた地名情報とに基づいて撮影地点の地名を特定する。そして、動画データの撮影地点の地名を含む情報資源を、外部装置から検索し、該メタデータを含む情報資源の数を取得する。評価手段は、前記地名を含む情報資源の数が多い程、動画データを高く評価する。動画の撮影地点に流行性が高い被写体がある場合、該動画データに関連する情報資源の数は多く、動画の撮影地点に流行性が高い被写体が無い場合、該動画データに関連する情報資源の数は少ない傾向がある。
従って、動画データの撮影地点における被写体の流行性という観点から評価し、使用者が所望する動画データとして、流行性が高い動画データを優先的に一覧表示することが可能になる。
本発明にあっては、動画データに含まれるフレーム画像の特徴量と共通する特徴量を含む情報資源を、外部装置から検索し、該特徴量を含む情報資源の数を取得する。基本的な原理は前記発明等と同様であり、評価手段は、前記特徴量を含む情報資源の数が多い程、動画データを高く評価する。
従って、動画データを流行性という観点から評価し、使用者が所望する動画データとして、流行性が高い動画データを優先的に一覧表示することが可能になる。
本発明にあっては、動画データに含まれるフレーム画像の画質を補正し、補正後のフレーム画像を構成する画素の階調値、及び補正前のフレーム画像を構成する画素の階調値を比較することにより、動画データを評価する。
従って、画質という観点から動画データを評価し、使用者が所望する動画データとして、画質が良い動画データを優先的に一覧表示することが可能になる。
本発明にあっては、動画データに含まれるフレーム画像からエッジを抽出することによってブロックノイズのエッジを検出し、ブロックノイズのエッジが大きいほど、動画データを低く評価する。
従って、ブロックノイズという観点から動画データを評価し、使用者が所望する動画データとして、ブロックノイズが小さい動画データを優先的に一覧表示することが可能になる。
本発明にあっては、動画データに含まれる複数のフレーム画像の端部に含まれる被写体を比較することで、該被写体の振動量を算出し、該振動量が大きい程、前記動画データを低く評価する。
従って、手ぶれという観点から動画データを評価し、使用者が所望する動画データとして、手ぶれが小さい動画データを優先的に一覧表示することが可能になる。
本発明によれば、従来の動画検索方法に比べて、使用者が所望する動画データを精度良く検索及び一覧表示することができる。
本発明によれば、各映像シーンの内容を客観的に示したメタデータに基づいて使用者が所望する動画データを精度良く検索及び一覧表示することができる。
本発明によれば、検索キーワードをより多く含む動画データを高く評価し、使用者が所望する動画データをより精度良く検索及び一覧表示することができる。
本発明によれば、使用者が所望する動画データとして、流行性が高い動画データを優先的に一覧表示することができる。
本発明によれば、使用者が所望する動画データとして、画質が良い動画データを優先的に一覧表示することができる。
本発明によれば、使用者が所望する動画データとして、ブロックノイズが小さい動画データを優先的に一覧表示することができる。
本発明によれば、使用者が所望する動画データとして、手ぶれが小さい動画データを優先的に一覧表示することができる。
以下、本発明をその実施の形態を示す図面に基づいて詳述する。
図1は、本発明の実施の形態に係る動画検索システムの構成を示す模式図である。本発明の実施の形態に係る動画検索システムは、情報資源記憶部5を有する通信装置4と、通信装置4から情報資源を検索する情報検索装置6と、動画データ記憶部2から動画データを検索し、検索して得た動画データを種々の観点から評価し、評価の高い順で検索結果を一覧表示する機能を有する動画投稿サイトとしての動画検索装置1と、携帯電話端末7と、端末装置8とを備える。各装置は、通信網Nを介して接続されており、各種データを送受信するように構成されている。本発明に係る動画検索装置1は、動画データを構成するフレーム画像毎に検索用のメタデータを生成し、更に動画データをテーマの流行性、画質、ブロックノイズの有無、手ぶれの程度、使用者評価等に基づいて総合的に評価し、動画データの検索結果を評価が高い順で一覧表示することによって、使用者が所望する動画データを精度良く検索及び一覧表示することを可能にしたものである。
図2は、動画検索装置1の構成を模式的に示すブロック図である。動画検索装置1は、装置全体を制御するCPU10を備えたコンピュータである。CPU10には、ROM11、RAM12、外部記憶装置13、内部記憶装置15、マウス、キーボード等の入力装置14、液晶ディスプレイ、CRT等の出力装置16、通信部17及びI/F部18がバス19を介して接続されている。
ROM11は、コンピュータの動作に必要な制御プログラムを記憶したマスクROM、EEPROM等の不揮発性メモリである。
RAM12は、CPU10の演算処理を実行する際に生ずる各種データを一時記憶するDRAM、SRAM等の揮発性メモリである。
外部記憶装置13は、本発明の実施の形態に係るコンピュータプログラム9aをコンピュータ読み取り可能に記録したCD−ROM、DVD−ROM等の記録媒体9からデータを読み取る光ディスクドライブである。
内部記憶装置15は、例えばハードディスクであり、外部記憶装置13が記録媒体9から読み取ったコンピュータプログラム9aを記録する。
通信部17は、通信網Nを介して情報検索装置6、通信装置4、携帯電話端末7及び端末装置8との間で情報資源の検索要求、動画データ、その他各種データを送受信するためのインタフェースである。
I/F部18には、動画データを記憶する動画データ記憶部2、及び地図データを記憶する地図データ記憶部3が接続されており、CPU10は、I/F部18を介して、動画データ及び地図データの読み出し、及び動画データの書き込みを行うように構成されている。地図データには、GPS情報が示す地点の地名を示す情報が含まれている。
CPU10は、内部記憶装置15が記憶しているコンピュータプログラム9aをRAM12に読み出して実行することにより、本発明に係る動画検索方法を実施する。
図3は、情報検索装置6及び通信装置4の構成を模式的に示すブロック図である。情報検索装置6は、装置全体を制御するCPU60を備えたコンピュータである。CPU60には、ROM61、RAM62、外部記憶装置63、内部記憶装置65、マウス、キーボード等の入力装置64、液晶ディスプレイ、CRT等の出力装置66、通信部67がバス68を介して接続されている。ROM61及び内部記憶装置65は、情報検索装置6の動作に必要な制御プログラムを記憶しており、CPU60は、ROM61及び内部記憶装置65から制御プログラムをRAM62に読み出して実行することにより、通信装置4の情報資源記憶部5に格納されている情報資源の検索を行う。
通信装置4は、装置全体を制御するCPU40を備えたウェブサーバとしてのコンピュータである。CPU40には、ROM41、RAM42、外部記憶装置43、内部記憶装置45、マウス、キーボード等の入力装置44、液晶ディスプレイ、CRT等の出力装置46、通信部47、及びI/F部48がバス49を介して接続されている。I/F部48には、複数の情報資源を記憶する情報資源記憶部5が接続されている。情報資源は、例えばニュース関連のHTML文書、XML文書、写真、画像、カラオケ音声等のデータである。なお、情報資源の種類はこれらに限定されない。ROM41及び内部記憶装置45は、通信装置4の動作に必要な制御プログラムを記憶しており、CPU40は、ROM41及び内部記憶装置45から制御プログラムをRAM42に読み出して実行することにより、情報資源の提供を行うウェブサーバ機能を実現する。ウェブサーバ機能は、ハイパーテキスト転送プロトコルにて情報検索装置6、携帯電話端末7、端末装置8等から情報資源の送信要求を受け付け、情報資源を送信要求元に送信する機能を有する。
図1に示した携帯電話端末7は、所謂GPS機能を有するカメラ付き携帯である。携帯電話端末7は、装置全体を制御する図示しないCPUを備えている。CPUには、ROM、RAM、記憶部、他の携帯電話端末7又は動画検索装置1との間で各種データを送受信する通信部、番号ボタン、十字キー、決定ボタン、メニューボタン等の操作部、携帯電話端末7の使用者が発話した音声を電気信号に変換して送信するマイクロホン、表示部、音声出力部、撮像部、GPS処理部、及び時計部がバスを介して接続されている。ROMは、CPUの動作に必要なプログラムを記憶しており、CPUは、ROMが記憶しているプログラムをRAMに読み出して実行することにより、動画データの送受信、動画データの検索要求等を行う。撮像部は、レンズ、該レンズにて結像した像を電気信号に変換するCCD、CMOS等の撮像素子、撮像素子にて変換された電気信号をデジタルの動画データにAD変換し、AD変換された動画データに各種画像処理を施す画像処理部等を備えている。GPS処理部は、GPS受信機を備えている。GPS受信機は、GPS衛星からの電波を受信し携帯電話端末7の現在位置を測定する。携帯電話端末7は、撮像部にて撮像処理を行った場合、撮像部で得られた動画データに、GPS処理部で得られた緯度及び経度を示すGPS情報、時計部が計時して得られた撮影日時データ等をメタデータとして付加し、記憶部に記憶するように構成されている。
端末装置8は、装置全体を制御する図示しないCPUを備えたウェブクライアント機能を有するパーソナルコンピュータである。
図4は、動画データのアップロードに係る携帯電話端末7及び動画検索装置1の処理手順を示すフローチャートである。まず、携帯電話端末7は、図示しない記憶部から動画データを読み取り(ステップS11)、読み取った動画データの題名の編集を受け付ける(ステップS12)。題名の編集を終えた場合、携帯電話端末7は、題名が付加された動画データを動画検索装置1に送信する(ステップS13)。
図5は、動画データのデータ構造を概念的に示す説明図である。例えば、動画データは、時系列順の複数のフレーム画像と、該動画データの題名と、複数のフレーム画像夫々に基づいて生成されたメタデータ、動画の撮影地点を示すGPS情報と、動画データの評価を示す動画データ評価ポイントとを含む。アップロード時においては、メタデータ及び動画評価ポイントは付されていない状態にある。なお、題名もメタ情報の一種である。
動画検索装置1のCPU10は、携帯電話端末7から送信された動画データを通信部17にて受信する(ステップS14)。そして、CPU10は、受信した動画データを動画評価サイトに掲載する(ステップS15)。
次いで、CPU10は、メタデータの生成に係るサブルーチンを呼び出して、動画データに含まれる複数のフレーム画像に基づいてメタデータを生成する(ステップS16)。そして、CPU10は、生成したメタデータを該動画データに関連付け(ステップS17)、メタデータが関連付けられた動画データを内部記憶装置15に記憶させ(ステップS18)、処理を終える。
ステップS17における関連付けは、例えば、動画データのヘッダ部分に包含させることによって行う。なお、動画データと、メタデータとを関連付けることができるのであれば、テーブルなどを用いた他の方法を採用しても良い。
なお、上述のフローチャートでは、題名の編集を無条件で受け付けるように構成してあるが、動画検索装置1は、ステップS16で生成したメタデータの文字列と、題名とを比較し、該文字列及び題名の関連性が低い場合、携帯電話端末7へ警告を発するように構成しても良い。また、動画検索装置1は、ステップS16で生成されたメタデータを携帯電話端末7へ送信し、適切な題名の入力を促すように構成しても良い。
図6は、メタデータの生成に係る動画検索装置1の処理手順を示すフローチャートである。メタデータの生成に係るサブルーチンが呼び出された場合、CPU10は、動画データに含まれる一のフレーム画像から文字領域、所謂テロップの領域を抽出し(ステップS31)、抽出された文字領域に含まれる文字列を文字認識する(ステップS32)。そして、CPU10は、文字認識によって得られた文字列に基づいてメタデータとして生成する(ステップS33)。例えば、文字列を分節し、単語を抽出し、該単語をメタデータとする。なお、文字領域が抽出されなかった場合、前記一のフレーム画像についてはメタデータの生成が行われない。
次いで、CPU10は、動画データを構成する全フレーム画像のメタデータを生成したか否かを判定する(ステップS34)。全フレーム画像のメタデータの生成が行われていないと判定した場合(ステップS34:NO)、CPU10は、処理をステップS31に戻す。全フレーム画像のメタデータの生成を行ったと判定した場合(ステップS34:YES)、CPU10は、処理を終える。
動画評価サイトは、動画検索装置1が携帯電話端末7、端末装置8等の外部装置に対して提供するサービスである。動画検索装置1は、携帯電話端末7又は端末装置8から送信された動画データの送信要求を受信した場合、撮影日時、題名等の検索キーワードに基づいて動画データを、動画データ記憶部2から検索し、検索された動画データを送信要求元に送信する。また、動画検索装置1は、動画データと共に、提供した動画データに対する動画評価サイト使用者(動画評価サイトを使用する使用者)の評価を受け付けるための評価受付動画データを送信元に送信する。そして、携帯電話端末7又は端末装置8から特定の動画データを評価する情報が送信された場合、動画検索装置1は、動画データを評価する情報を内部記憶装置15に記憶させる。
また、動画検索サイトは、投稿された動画データの評価を定期的に行う。以下、動画データの評価方法を説明する。
図7は、動画データの評価に係る動画検索装置1の処理手順を示すフローチャートである。動画検索装置1のCPU10は、動画データについて、流行、画質、ブロックノイズの有無、手ぶれの有無、使用者評価等、種々の観点から総合的な評価を行う。
サブルーチンが呼び出された場合、CPU10は、評価対象の動画データが初評価を受ける動画データであるか否かを判定する(ステップS51)。
初評価を受ける動画データであると判定した場合(ステップS51:YES)、CPU10は、動画データの画質を評価する(ステップS52)。具体的には、動画データに含まれる一又は複数のフレーム画像に対して階調値を変更するといった所定の画質補正処理を行い、補正後の動画データを構成する各画素の階調値と、補正前の動画データを構成する各画素の階調値とを比較し、各画素の階調値の変化が小さい程、動画データの画質を高く評価する。各画素の階調値は、例えばRGB成分夫々の階調値、又は各画素の輝度値である。以下、各画素の階調値は256階調として説明する。補正の前後で各画素の階調値の変化が0である場合、満点として評価する。
所定の画質補正処理は、例えばカラーバランス、コントラスト等を補正する処理であり、所謂スマート補正、レベル補正、コントラスト補正、カラー補正等が挙げられる。具体的には、動画に含まれるフレーム画像内の最も暗い画素の階調値を黒(階調値0)、フレーム画像内の最も明るい画素の階調値を白(階調値255)に対応付ける補正を行う。また、他の明るさを有する画素の階調値は、各階調値の度数分布が偏って分布しないように1〜254の階調値に対応付けられる。例えば、フレーム画像内の最も暗い画素の階調値が30、最も明るい画素の階調値が200である場合、階調値30を階調値0に、階調値200を階調値255に変換する補正を行う。そして、フレーム画像内の他の階調値31〜199は、1〜254の範囲で対応付けられる。このように補正することにより、カラーバランス及びコントラストを補正することができる。
なお、スマート補正、レベル補正、コントラスト補正、カラー補正を峻別することはできないが、各補正内容の概要は次の通りである。即ち、スマート補正とは、フレーム画像全体のカラーバランスを補正し、シャドウ部分(階調値0)及びハイライト部分(階調値255)が鮮明になるように補正する処理であり、コントラスト補正は、フレーム画像の色合いを変化させずにフレーム画像の全体的な明暗のみを補正する処理であり、レベル補正は、フレーム画像全体のコントラストと、色かぶり又はカラーキャストとを補正する処理であり、カラー補正は、フレーム画像全体のシャドウ部分、中間調部分、及びハイライト部分を識別し、コントラスト及びカラーバランスを補正する処理である。
次いで、CPU10は、ブロックノイズの大きさに基づいて動画データを評価する(ステップS53)。具体的には、動画データに含まれるフレーム画像からブロックノイズのエッジを検出し、ブロックノイズのエッジが大きい程、動画データを低く評価する。
なお、ブロックノイズとは、動画データの量子化及び逆量子化による量子化誤差が原因となって発生するノイズである。量子化及び逆量子化は、例えば8×8画素のブロック毎に行われるため、該ブロックの境界部分に画像の不連続性が発生する。このため、ブロックノイズが大きい動画には、タイル状のモザイク模様が発生する。
次いで、CPU10は、手ぶれの大きさに基づいて動画データを評価する(ステップS54)。具体的には、CPU10は、動画データに含まれる時系列順の複数のフレーム画像の枠部分を比較することによって、枠部分の振動量を算出する。例えば、一のフレーム画像の枠部に含まれる水平方向1ライン分の各画素の輝度値を記憶する。そして、他のフレーム画像の枠部に含まれる水平方向1ライン分の各画素の輝度値の並びと、先に記憶した輝度の並びとを比較し、一定の相関を有する水平ラインを特定する。輝度の並びが一定の相関を有している場合、共通の被写体の画像を構成した水平ラインと推定される。同様に、他のフレーム画像についても相関が高い水平ラインを特定する。そして、各水平ラインの垂直方向における位置関係に基づいて手ぶれが発生しているか否か、手ぶれの大きさを算出することができる。つまり、垂直方向に振動する水平ラインの振動数が所定振動数以上である場合、手ぶれが発生していると判定することができる。振動数が所定振動数未満である場合、使用者が意図的にカメラを上下させて動画を撮影したと考えられる。また、水平ラインの振幅の大きさから、手ぶれの大きさを算出することができる。
なお、水平ラインを用いた場合を説明したが、垂直ラインについても同様の処理を行うことによって、左右方向の手ぶれの大きさを算出することができる。
ステップS54の処理を終えた場合、又は初評価を受ける動画データでは無いと判定した場合(ステップS51:NO)、CPU10は、動画データの流行性評価に係るサブルーチンを呼び出して、動画データの流行性を評価する(ステップS55)。そして、CPU10は、動画評価サイトを通じて携帯電話端末7又は端末装置8から収集して内部記憶装置15に記憶してある動画評価サイト使用者の評価を読み出し、該評価の平均値を算出することによって、使用者評価を行い(ステップS56)、処理を終える。
使用者の評価を適度に加味することによって、メタデータのみでは評価できない評価要素も評価対象にすることができる。ただし、動画データをより客観的に評価したい場合、使用者評価を利用しないように構成しても良い。
次いで、CPU10は、動画評価ポイント、即ちステップS52乃至56で算出されたポイントの動画評価ポイント、即ち総合得点を算出する(ステップS57)。動画評価ポイントは、流行性、画質、使用者評価が高い程高得点になる。また、ブロックノイズ、手ぶれが大きい場合、動画評価ポイントが減点される。なお、二回目以降の評価においては、ステップS52〜54の処理を実行しないが、初評価時にステップS52〜54で算出されたポイントを用いて動画評価ポイントを算出する。ステップS52〜54で算出されるポイントは、時間経過によって変化しないためである。
そして、CPU10は、算出された動画評価ポイントを動画データに関連付け(ステップS58)、処理を終える。なお、動画データとの関連付けは、例えば、図5に示すように動画データのヘッダに動画評価ポイントを含ませることによって行う。
図8は、動画データの流行性評価に係るサブルーチンの処理手順を示すフローチャートである。動画検索装置1のCPU10は、評価対象の動画データに付加されたメタデータを抽出する(ステップS71)。そして、CPU10は、抽出したメタデータの文字列を含む情報資源の検索を要求する要求データを情報検索装置6に送信する(ステップS72)。なお、メタデータの数は、複数であっても良い。
情報検索装置6のCPU60は、動画検索装置1から送信された要求データを受信し(ステップS73)、要求データを受信した場合、前記抽出したメタデータの文字列を含む情報資源を通信装置4から検索する(ステップS74)。そして、CPU60は、検索された情報資源の数を示す情報資源数データを動画検索装置1に送信する(ステップS75)。
動画検索装置1のCPU10は、情報検索装置6から送信された情報資源数データを受信し(ステップS76)、受信した情報資源数データに基づいて動画データを評価する(ステップS77)。具体的には、情報資源数データで示される情報資源数が多い程、動画データを高く評価し、情報資源数が小さい程、動画データを低く評価する。
次に、動画データの検索及び一覧表示の方法を説明する。
図9は、動画検索に係る動画検索装置1の処理手順を示すフローチャートである。携帯電話端末7は、検索キーワード、及び動画検索要求データを動画検索装置1に送信する(ステップS91)。
動画検索装置1のCPU10は、携帯電話端末7から送信された検索キーワード、及び動画検索要求データを通信部17にて受信し(ステップS92)、受信した検索キーワードにて、該検索キーワードを題名及びメタ情報に含む動画データを検出する(ステップS93)。例えば、検索キーワードが「桜」、「春」、「京都」である場合、メタデータに「桜」、「春」、「京都」の文字が含まれている動画データを検索する。
なお、動画データには複数のメタデータが含まれているため、検索キーワードを含む所定数以上のメタデータが含まれている動画データを検索するように構成しても良い。また、題名に前記検索キーワードが含まれていることを必須とせず、該検索キーワードを含むメタデータを所定数以上含む動画データも検索するように構成しても良い。更に、検索キーワードを含むメタデータを少なくとも一つ含む動画データを検索するように構成しても良い。
次いで、CPU10は、検索された各動画データから、該動画データの動画評価ポイントを抽出する(ステップS94)。そして、CPU10は、検索して得た動画データを示すサムネイル画像及び題名を、動画評価ポイントの昇順で配列した一覧を生成し(ステップS95)、生成した一覧に係る一覧データを通信部17にて携帯電話端末7へ送信する(ステップS96)。
携帯電話端末7のCPUは、動画検索装置1から送信された一覧データを受信し(ステップS97)、受信した一覧データに基づいて動画データの検索結果一覧を表示し(ステップS98)、処理を終える。
図10は、携帯電話端末7に表示された検索結果一覧を示す模式図である。図10に示すように、検索結果一覧は、検索して得た複数の動画データ夫々のサムネイル画像V1,V2・・・及び題名を縦方向に配列してなる。各動画データのサムネイル画像V1,V2・・・は、対応する動画評価ポイントの順で上下に配列している。サムネイル画像V1の側には、該サムネイル画像に係る動画データの題名が表示され、更に、該動画データの投稿日、投稿者、再生回数、動画評価ポイントが表示されている。
サムネイル画像V1,V2・・・に係る動画データは、いずれも同じ被写体を同じように撮影したものであるが、画質、手ぶれ、ブロックノイズの程度が異なる。サムネイル画像V1に係る動画データは、画質が良く、手ぶれ、ブロックノイズも無いため、他の動画データに比べて動画評価ポイントが高く、検索結果一覧の上部に表示されている。サムネイル画像V2に係る動画データは画質が悪いため、動画評価ポイントが低く、サムネイル画像V1の下側に表示されている。被写体の破線で示した部分は、輪郭部分がぼやけていることを示している。同様に、サムネイル画像V3に係る動画データは手ぶれがあり、サムネイル画像V4に係る動画データは、ブロックノイズが発生しており、サムネイル画像V5に係る動画データは、手ぶれがあり、しかもブロックノイズも発生している。
このように、本発明によれば、同じ被写体を撮影した動画データであっても、画質が良く、手ぶれ、ブロックノイズが無い動画データから順に一覧表示される。
使用者は、検索結果の一覧の中から所望の動画データを見つけることができた場合、対応するサムネイル画像を選択することによって、動画データを動画検索装置1から取得し、再生することができる。
このように構成された実施の形態に係る動画検索装置1、動画検索方法及びコンピュータプログラム9aにあっては、動画データを構成するフレーム画像毎に、該フレーム画像に基づいて検索用のメタデータを生成するため、従来の動画検索方法に比べて、使用者が所望する動画データを客観的に精度良く検索することができる。
また、使用者が所望する動画データとして、流行性が高い動画データを高く評価し、優先的に一覧表示することができる。
更に、使用者が所望する動画データとして、画質が良い動画データを高く評価し、優先的に一覧表示することができる。
更にまた、使用者が所望する動画データとして、ブロックノイズが小さい動画データを高く評価し、優先的に一覧表示することができる。
更にまた、使用者が所望する動画データとして、手ぶれが小さい動画データを高く評価し、優先的に一覧表示することができる。
(変形例1)
変形例1に係る動画検索装置1、動画検索方法、及びコンピュータプログラム9aは、メタ情報の生成方法のみが異なるため、以下ではメタ情報の生成方法を説明する。
図11は、変形例1におけるメタデータの生成に係る動画検索装置1の処理手順を示すフローチャートである。CPU10は、複数のフレーム画像夫々の平均輝度を算出する(ステップS111)。そして、CPU10は、時系列順で隣り合うフレーム画像間の平均輝度の差分を算出し、該差分が所定以上であるフレーム画像を映像シーンの切り替わり箇所として特定する(ステップS112)。
次いで、CPU10は、一の映像シーンの動画データに含まれるフレーム画像から文字領域を抽出し(ステップS113)、抽出された文字領域に含まれる文字列を文字認識する(ステップS114)。そして、CPU10は、テンプレート画像を用いたパターン認識によって、フレーム画像に特定の形状パターン、例えばサッカーボールの亀甲柄等を認識する(ステップS115)。
ステップS115の処理を終えた場合、文字認識結果又はパターン認識結果に基づいてメタデータを生成する(ステップS116)。なお、動画検索装置1は、予めテンプレート画像と、検索用の文字列とを対応付けて内部記憶装置15及び記録媒体9に記憶しており、パターン検出に成功したテンプレート画像に対応する文字列を内部記憶装置15から読み出して、該文字列をメタデータとする。また、映像シーン毎に一のメタデータのみを生成するように構成しても良いし、映像シーン毎に複数のメタデータを生成するように構成しても良い。
次いで、CPU10は、全映像シーンのメタデータを生成したか否かを判定する(ステップS117)。メタデータが生成されていない映像シーンがあると判定した場合(ステップS117:NO)、CPU10は、処理をステップS113に戻す。全映像シーンのメタデータを生成したと判定した場合(ステップS117:YES)、CPU10は修理を終える。
変形例1に係る動画検索方法、動画検索装置1、コンピュータプログラムにあっては、動画に文字情報が含まれていない場合であっても、メタ情報を生成し、動画データの検索精度を向上させることができる。
また、各映像シーンの内容を客観的に示したメタデータに基づいて使用者が所望する動画データを精度良く検索及び一覧表示することができる。
更に、映像シーン毎に一のメタデータのみを生成するように構成した場合、効率的に動画データの検索用メタデータを生成することができる。
なお、映像シーンの切り替わりをフレーム画像の平均輝度の変化によって検出する例を説明したが、輝度スペクトルの形状を比較することによって、映像シーンの切り替わりを検出するようにしても良い。
(変形例2)
変形例2に係る動画検索装置1、動画検索方法、及びコンピュータプログラム9aは、動画データの検索及び一覧生成方法のみが異なるため、以下では動画データの検索及び一覧生成方法を説明する。
図12は、変形例2の動画検索に係る動画検索装置1の処理手順を示すフローチャートである。携帯電話端末7は、検索キーワード、及び動画検索要求データを動画検索装置1に送信する(ステップS211)。
動画検索装置1のCPU10は、携帯電話端末7から送信された検索キーワード、及び動画検索要求データを通信部17にて受信し(ステップS212)、受信した検索キーワードにて、該検索キーワードをメタ情報に含む動画データを検出する(ステップS213)。
次いで、CPU10は、検索された各動画データから、該動画データの動画評価ポイントを抽出する(ステップS214)。そして、CPU10は、動画データ毎に、検索キーワードが含まれているメタ情報の数に基づいて動画データを再評価する(ステップS215)。具体的には、一の動画データに含まれている全メタ情報の数と、該メタ情報の内、検索キーワードが含まれているメタ情報の数とを算出し、検索キーワードが含まれているメタ情報の割合を算出する。そして、該割合が高い程、動画データの内容が検索キーワードに近いものとしてより高く評価する。
ステップS215の処理を終えた場合、CPU10は、ステップS95〜98と同様の処理をステップS216〜219で実行する。
変形例2に係る動画検索装置1、動画検索方法及びコンピュータプログラム9aにあっては、使用者が所望する動画データをより精度良く検索及び一覧表示することができる。
(変形例3)
変形例3に係る動画検索装置1、動画検索方法、及びコンピュータプログラム9aは、動画データの流行性評価の方法のみが異なるため、以下では動画データの流行性評価の方法を説明する。
図13は、変形例3における動画データの流行性評価に係るサブルーチンの処理手順を示すフローチャートである。動画検索装置1のCPU10は、評価対象の動画データに付加されたメタデータを抽出する(ステップS311)。そして、CPU10は、抽出したメタデータの文字列を用いて情報資源の検索が行われた回数を要求する要求データを情報検索装置6に送信する(ステップS312)。
情報検索装置6のCPU60は、動画検索装置1から送信された要求データを受信し(ステップS313)、要求データを受信した場合、前記抽出したメタデータの文字列を用いて情報資源の検索が行われた回数を内部記憶装置65から読み出す(ステップS314)。そして、CPU60は、読み出された回数を示す回数データを動画検索装置1へ送信する(ステップS315)。
動画検索装置1のCPU10は、情報検索装置6から送信された回数データを受信し(ステップS316)、受信した回数データに基づいて動画データを評価する(ステップS317)。つまり、回数データが多い程、動画データを高く評価する。
変形例3にあっては、上述の実施の形態と同様、従来の動画検索方法に比べて、使用者が所望する動画データを客観的に精度良く検索することができる。
(変形例4)
変形例4に係る動画検索装置1、動画検索方法、及びコンピュータプログラム9aは、動画データの流行性評価の方法のみが異なるため、以下では動画データの流行性評価の方法を説明する。
図14は、変形例4における動画データの流行性評価に係るサブルーチンの処理手順を示すフローチャートである。動画検索装置1のCPU10は、評価対象の動画データを含み、情報資源の検索を要求する要求データを情報検索装置6に送信する(ステップS411)。
情報検索装置6のCPU60は、動画検索装置1から送信された要求データを受信し(ステップS412)、要求データを受信した場合、前記動画データから特徴量を抽出し(ステップS413)、抽出された特徴量に基づいて前記動画データに関連する情報資源を検索する(ステップS414)。そして、CPU60は、検索された情報資源の数を示す情報資源数データを動画検索装置1に送信する(ステップS415)。
特徴量としては、例えば、特開平11−96368に開示されているように、動画から島の外形形状を抽出し、その外形形状のエッジ画素の点列をフーリエ級数展開して求めた係数を採用すると良い。情報検索装置6のCPU60は、要求データに含まれる動画データから抽出した特徴量と、情報資源記憶部5が記憶している動画データの特徴量とを比較することで類似度、即ち各係数の偏差を算出し、類似度が所定値以上である場合、評価対象の動画データに関連する情報資源と判断する。
また、特徴量として、動画に表れる特徴色を採用しても良い。情報検索装置6のCPU60は、例えば予め定められた彩度の高い色であって、所定面積以上の動画部分を占める色を特徴量として抽出する。該特徴量を用いた場合、例えば森林の写真に関連する動画として、同じような緑色を基調とした森林の動画データが検索される。
動画検索装置1のCPU10は、情報検索装置6から送信された情報資源数データを受信し(ステップS416)、受信した情報資源数データに基づいて動画データを評価する(ステップS417)。
変形例4にあっては、上述の実施の形態と同様、従来の動画検索方法に比べて、使用者が所望する動画データを客観的に精度良く検索することができる。
なお、実施の形態にあっては、動画投稿サイトを一例として説明したが、本発明は他の各種サービスに適用しても良い。例えば、動画データを一覧表示して提供する電子アルバムシステム、所謂コミュニティーに写真を掲載するサービスに本発明を適用しても良い。
また、実施の形態及び変形例にあっては、一台の動画検索装置1が、動画検索処理を実行するように構成してあるが、言うまでもなく複数台のコンピュータで分散処理させても良い。
更にまた、実施の形態及び変形例で示した動画データの評価方法は一例であり、客観的に評価できるのであれば他の評価方法を採用しても良い。例えば、動画データに付随する音声データを音声認識する手段と、音声認識によって得られた文字情報に基づいてメタデータを生成する手段とを動画検索装置に備え、該メタデータに基づいて動画データを評価するように構成しても良い。また、音声データに係るメタデータを用いて動画データを評価する場合、カラオケに関連する情報資源、例えば、楽曲のタイトル、歌詞、ランキング等を含む情報資源を通信装置から検索して、動画データを評価するように構成しても良い。
更に、情報資源の検索を情報検索装置に実行させる構成であるが、情報資源の検索処理を動画検索装置が行うように構成しても良い。
更に、今回開示された実施の形態はすべての点で例示であって、制限的なものではない。本発明の範囲は、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれる。
本発明の実施の形態に係る動画検索システムの構成を示す模式図である。 動画検索装置の構成を模式的に示すブロック図である。 情報検索装置及び通信装置の構成を模式的に示すブロック図である。 動画データのアップロードに係る携帯電話端末及び動画検索装置の処理手順を示すフローチャートである。 動画データのデータ構造を概念的に示す説明図である。 メタデータの生成に係る動画検索装置の処理手順を示すフローチャートである。 動画データの評価に係る動画検索装置の処理手順を示すフローチャートである。 動画データの流行性評価に係るサブルーチンの処理手順を示すフローチャートである。 動画検索に係る動画検索装置の処理手順を示すフローチャートである。 携帯電話端末に表示された検索結果一覧を示す模式図である。 変形例1におけるメタデータの生成に係る動画検索装置の処理手順を示すフローチャートである。 変形例2の動画検索に係る動画検索装置の処理手順を示すフローチャートである。 変形例3における動画データの流行性評価に係るサブルーチンの処理手順を示すフローチャートである。 変形例4における動画データの流行性評価に係るサブルーチンの処理手順を示すフローチャートである。
符号の説明
1 動画検索装置
2 動画データ記憶部
3 地図データ記憶部
4 通信装置
5 情報資源記憶部
6 情報検索装置
7 携帯電話端末
8 端末装置
9 記録媒体
9a コンピュータプログラム
10 CPU
17 通信部
60 CPU
67 通信部
N 通信網

Claims (7)

  1. 複数のフレーム画像からなる動画データを複数記憶した記憶装置から特定の動画データを検索するための検索キーワードを受け付け、受け付けた検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索する動画検索装置において、
    動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成するメタデータ生成手段と、
    動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価する評価手段と、
    検索キーワードをメタデータに含む動画データを検索する検索手段と、
    検索して得た動画データが複数である場合、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成する一覧生成手段と
    を備え
    前記評価手段は、
    複数の情報資源を記憶している外部装置から、動画データに含まれるフレーム画像の特徴量を有する情報資源を検索し、該特徴量を有する情報資源の数を取得する手段を備え、
    動画データに含まれるフレーム画像の特徴量を有する情報資源の数が多い程、動画データを高く評価するようにしてあることを特徴とする動画検索装置。
  2. 複数のフレーム画像からなる動画データを複数記憶した記憶装置から特定の動画データを検索するための検索キーワードを受け付け、受け付けた検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索する動画検索装置において、
    動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成するメタデータ生成手段と、
    動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価する評価手段と、
    検索キーワードをメタデータに含む動画データを検索する検索手段と、
    検索して得た動画データが複数である場合、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成する一覧生成手段と
    を備え
    前記評価手段は、
    動画データに含まれるフレーム画像を構成する画素の階調値を変更する画質補正を行い、補正後のフレーム画像を構成する画素の階調値、及び補正前のフレーム画像を構成する画素の階調値を比較する手段を備え、各階調値の差が大きい程、前記動画データを低く評価するようにしてあることを特徴とする動画検索装置。
  3. 前記メタデータ生成手段は、
    フレーム画像から文字領域を抽出する手段と、
    抽出された文字領域から文字を認識する文字認識手段と
    を備え、
    文字認識によって得られた文字をメタデータとして生成するようにしてある
    ことを特徴とする請求項1又は請求項2に記載の動画検索装置。
  4. 動画データに含まれる複数のフレーム画像夫々の輝度を比較することによって、映像シーンが切り替わる境界のフレーム画像を特定する手段を備え、
    前記メタデータ生成手段は、
    映像シーン毎に、各映像シーンを構成する一のフレーム画像に基づいて動画データのメタデータを生成するようにしてある
    ことを特徴とする請求項1乃至請求項3のいずれか一つに記載の動画検索装置。
  5. CPUが、複数のフレーム画像からなる動画データを複数記憶した記憶装置から特定の動画データを検索するための検索キーワードを受け付け、受け付けた検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索する動画検索方法において、
    CPUが、動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成するステップと、
    CPUが、動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価するステップと、
    CPUが、検索キーワードをメタデータに含む動画データを検索するステップと、
    検索して得た動画データが複数である場合、CPUが、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成するステップと
    を有し、
    動画データを評価するステップは、
    CPUが、複数の情報資源を記憶している外部装置から、動画データに含まれるフレーム画像の特徴量を有する情報資源を検索し、該特徴量を有する情報資源の数を取得するステップを含み、動画データに含まれるフレーム画像の特徴量を有する情報資源の数が多い程、動画データを高く評価する
    とを特徴とする動画検索方法。
  6. コンピュータに、複数のフレーム画像からなる動画データを複数記憶した記憶装置から、検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索させるコンピュータプログラムにおいて、
    コンピュータに、動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成させるステップと、
    コンピュータに、動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価させるステップと、
    コンピュータに、検索キーワードをメタデータに含む動画データを検索させるステップと、
    コンピュータに、検索して得た動画データが複数である場合、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成させるステップと
    を有し、
    動画データを評価するステップは、
    複数の情報資源を記憶している外部装置から、動画データに含まれるフレーム画像の特徴量を有する情報資源を検索し、該特徴量を有する情報資源の数を取得するステップを含み、動画データに含まれるフレーム画像の特徴量を有する情報資源の数が多い程、動画データを高く評価する
    とを特徴とするコンピュータプログラム。
  7. コンピュータに、複数のフレーム画像からなる動画データを複数記憶した記憶装置から、検索キーワード、及び各動画データに関連付けられたメタデータに基づいて動画データを検索させるコンピュータプログラムにおいて、
    コンピュータに、動画データに含まれる複数のフレーム画像毎に、該フレーム画像に基づいて前記動画データのメタデータを生成させるステップと、
    コンピュータに、動画データに含まれるフレーム画像、又は動画データに関連付けられたメタデータに基づいて該動画データを評価させるステップと、
    コンピュータに、検索キーワードをメタデータに含む動画データを検索させるステップと、
    コンピュータに、検索して得た動画データが複数である場合、複数の動画データ夫々のサムネイル画像又は各動画データのメタデータを、各動画データの評価結果に基づいて配列した一覧を生成させるステップと
    を有し、
    動画データを評価するステップは、
    動画データに含まれるフレーム画像を構成する画素の階調値を変更する画質補正を行い、補正後のフレーム画像を構成する画素の階調値、及び補正前のフレーム画像を構成する画素の階調値を比較するステップを含み、各階調値の差が大きい程、前記動画データを低く評価する
    とを特徴とするコンピュータプログラム。
JP2008181887A 2008-07-11 2008-07-11 動画検索装置、動画検索方法及びコンピュータプログラム Active JP5337420B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008181887A JP5337420B2 (ja) 2008-07-11 2008-07-11 動画検索装置、動画検索方法及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008181887A JP5337420B2 (ja) 2008-07-11 2008-07-11 動画検索装置、動画検索方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2010020630A JP2010020630A (ja) 2010-01-28
JP5337420B2 true JP5337420B2 (ja) 2013-11-06

Family

ID=41705442

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008181887A Active JP5337420B2 (ja) 2008-07-11 2008-07-11 動画検索装置、動画検索方法及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5337420B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9185326B2 (en) 2010-06-11 2015-11-10 Disney Enterprises, Inc. System and method enabling visual filtering of content
JP5052696B1 (ja) * 2011-07-27 2012-10-17 武 櫻井 動画公開装置、方法、及びコンピュータプログラム
JP5052695B1 (ja) * 2011-07-27 2012-10-17 武 櫻井 動画公開装置、方法、及びコンピュータプログラム
JP2020010394A (ja) * 2019-09-19 2020-01-16 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および検索結果取得方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3804819B2 (ja) * 1999-11-05 2006-08-02 富士写真フイルム株式会社 プリントシステム
JP2001344591A (ja) * 2000-05-31 2001-12-14 Nippon Telegr & Teleph Corp <Ntt> 画像管理・表示方法、および画像管理・表示装置、並びに記録媒体
JP4732418B2 (ja) * 2002-04-12 2011-07-27 三菱電機株式会社 メタデータ処理方法
JP2008033399A (ja) * 2006-07-26 2008-02-14 Fujifilm Corp 情報提供システム

Also Published As

Publication number Publication date
JP2010020630A (ja) 2010-01-28

Similar Documents

Publication Publication Date Title
JP5612310B2 (ja) 顔認識のためのユーザーインターフェース
JP5847070B2 (ja) サーバ装置及び撮影装置
US20080018503A1 (en) Method and apparatus for encoding/playing multimedia contents
US20080195924A1 (en) Method and apparatus for encoding multimedia contents and method and system for applying encoded multimedia contents
CN101356800A (zh) 内容拍摄装置
JP2006236218A (ja) 電子アルバム表示システム、電子アルバム表示方法、及び電子アルバム表示プログラム
JP2009232250A (ja) 番組情報表示装置および番組情報表示方法
JP5337420B2 (ja) 動画検索装置、動画検索方法及びコンピュータプログラム
JP2008035125A (ja) 撮像装置、画像処理方法およびプログラム
JPH08331495A (ja) 撮影機能付き電子アルバムシステム
JP4870503B2 (ja) カメラ、ブログ管理システム
JP2005039359A (ja) 画像再生装置及びプログラム
CN104978389B (zh) 方法、系统、服务器和客户端
JP2014130536A (ja) 情報管理装置、サーバ及び制御方法
JP2009246479A (ja) 画像評価方法、画像評価システム、画像評価装置及びコンピュータプログラム
CN1825945A (zh) 商用消息搜索方法和设备及伴随信息提供方法和设备
US20220086334A1 (en) Program, information processing device, and information processing system
JP2008271239A (ja) カメラ、コンテンツ作成方法、及びプログラム
WO2010126042A1 (ja) コンテンツ出力システム
JP2003069925A (ja) 付帯情報入力方法および装置並びにプログラム
JP2017184021A (ja) コンテンツ提供装置及びコンテンツ提供プログラム
US20140189769A1 (en) Information management device, server, and control method
JP4920534B2 (ja) スライドショー生成システム及びこのシステムを有するカメラ
JPWO2006016461A1 (ja) 撮像装置
JP2014175733A (ja) 画像再生装置および画像再生プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110316

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130805

R150 Certificate of patent or registration of utility model

Ref document number: 5337420

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150