JP4462922B2 - 動画像検索情報生成装置、動画像要約情報生成装置、および要約情報生成方法 - Google Patents

動画像検索情報生成装置、動画像要約情報生成装置、および要約情報生成方法 Download PDF

Info

Publication number
JP4462922B2
JP4462922B2 JP2003434626A JP2003434626A JP4462922B2 JP 4462922 B2 JP4462922 B2 JP 4462922B2 JP 2003434626 A JP2003434626 A JP 2003434626A JP 2003434626 A JP2003434626 A JP 2003434626A JP 4462922 B2 JP4462922 B2 JP 4462922B2
Authority
JP
Japan
Prior art keywords
scene
moving image
summary information
search
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003434626A
Other languages
English (en)
Other versions
JP2004104836A (ja
JP2004104836A5 (ja
Inventor
秀一 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2003434626A priority Critical patent/JP4462922B2/ja
Publication of JP2004104836A publication Critical patent/JP2004104836A/ja
Publication of JP2004104836A5 publication Critical patent/JP2004104836A5/ja
Application granted granted Critical
Publication of JP4462922B2 publication Critical patent/JP4462922B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • G06F16/739Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/786Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using motion, e.g. object motion or camera motion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate

Description

本発明は、動画像を検索するための情報を生成する装置(動画像検索情報生成装置)、動画像の要約情報を生成する装置(動画像要約情報生成装置)、および動画像の要約情報を格納する格納フォーマット(動画像要約情報格納フォーマット)に関し、より詳細には、動画像を構成する複数個のシーンの中から、所望のシーンを効率的に検索して取出すことを可能とする動画像検索情報生成装置、動画像要約情報生成装置、および動画像要約情報格納フォーマットに関する。
コンピュータの性能の向上、記憶装置の大容量化、通信のためのインフラストラクチャーの整備などにより、大量の画像をデータベース化しておき必要なときに必要な画像を配信するサービスなどが普及しつつある。画像をデジタル化する技術も普及しているため、個人で動画像のデータベースを構築することも可能である。
このように動画像をデータベース化すると、その中からいかにして所望の動画像を検索するかが問題となる。本発明は、そのような動画像の検索の技術の改良に関する。
本明細書において使用する「動画像」という用語は、RGB(Red,Green,Blue)信号からなる、加工されていない動画像データ、およびMPEG(Moving Picture Experts Group)などのように、デジタル化され、所定の動画圧縮方式によって符号化された動画像データの両者を含むものとする。
「シーン」という用語は、連続する複数の画像フレームからなる、動画像の構成単位であって、例えば録画の開始から停止までの1回の撮影で得られた動画像、または編集済みの動画像の中で、二つの編集点で両端を区切られた一連の動画像のことをいう。編集箇所がフェード、ディゾルブなどの特殊な効果を含んでいる場合も含む。一つのシーンは複数個のシーンを含んでもよい。
「シーンチェンジ点」とは、二つのシーンが切替わる時間軸上の位置を指し、シーンが切替わった直後のシーンの先頭フレームを「シーンチェンジフレーム」という。
「キーフレーム」とは、検索などで利用される、各シーンまたは動画像全体を代表するような特徴的なフレームをいう。
動画像データは、時間軸に沿って変化する画像情報からなるコンテンツである。動画像データは、その全てが検索の対象となる。したがって、所望の動画像を検索するための最も単純な方法は、動画像の全体を見て所望の動画像を選ぶことである。しかし、動画像の全体を見るためにはある時間を要する。したがって、データベースに登録されている動画像の数が増えると、所望の動画像を取出すために要する時間が極めて大きくなる。したがってこの方法は現実的ではない。
効率的に動画像を検索するための一般的な方法では、予め各動画像の内容を代表する種々の検索のための情報(検索情報)を各動画像について用意し、これに基づいて所望の動画像を検索する。
検索情報として用いられる情報は、画像に付加された情報(付加情報)、画像の特性を表わす情報(特性情報)、および画像の概要を表わす情報(概要情報)を含む。付加情報は、動画像に附随して用意されるタイトルまたは説明文を含む。特性情報は、画像信号から導出される輝度値の頻度もしくはフレーム間での動き情報など、画像の特性を表わす情報を含む。概要情報は、画像の特性情報または外部からの入力によって定められるシーンチェンジ点またはキーフレームなどを含む。
上記した情報の中で、特性情報は特に便利でかつ重要である。たとえば動画像を代表するキーフレームは特性情報を利用して選択できる。特性情報は数値化することが容易で、所望の動画像の特性を特性情報の形で数値化すれば、要求された特性情報と一致する特性を有する動画像を抽出することも容易にできる。以下の説明では「検索情報」とはこの特性情報のことをいうものとする。
一般に動画像は複数個のシーンを含む。検索者が動画像を検索するのは、多くの場合、検索の対象となる1または複数の動画像から、動画像中に含まれている所望のフレームまたは所望のシーンを発見するためである。検索情報を用いて動画像の中から所望のフレームまたはシーンを発見するための基本的な方法は、予め各フレームに関する検索情報または各シーンに関する検索情報を求めて記録しておき、これらに基づいてフレームまたはシーンの選択を行なうことである。
この点に関し特許文献1には、シーンチェンジ点を検出するためのフレームの特徴量として、フレームごとの動きベクトルの総和、ならびに、フレームを構成する複数個の小領域の、フレーム内およびフレーム間の連続度を用いる装置および方法が開示されている。
また特許文献2には、各シーン内の動きベクトルの大きさの平均値および画像の色ヒストグラムをシーンの特徴量として用いて、各シーンの代表画像を画像インデックスとして表示する際の制御方法が開示されている。
こうした従来技術を考慮して、動画像を検索するための情報を記録するための装置(動画像検索情報記録装置)および動画像を検索するための装置(動画像検索装置)を作成したとすれば、以下に示すようなものとなると考えられる。
図1を参照して、想定された従来の動画像検索情報記録装置は、入力される動画像データを解析してシーンに分割し、シーンの分割位置(シーンチェンジ)などの動画像の構造を表わす情報(動画像構造情報)を出力するための解析部601と、解析部601の出力と入力された動画像データとを受けるように接続され、解析部601から出力された動画像構造情報および動画像データに基づいて、シーン内の各フレームに対応する動きベクトルの総和などの、画像の要約情報を検索情報として生成し、出力するフレーム単位の検索情報生成部602と、フレーム単位の検索情報生成部602の出力を受けるように接続され、フレーム単位の検索情報生成部602から出力されるフレーム単位の要約情報に基づいて、あるシーンの全体に対する動きベクトルの大きさの平均値などの要約情報を検索情報として生成し出力するためのシーン単位の検索情報生成部603と、解析部601から出力される動画像構造情報、フレーム単位の検索情報生成部602から出力される各フレーム単位の検索情報、およびシーン単位の検索情報生成部603から出力されるシーン全体に対する検索情報を、所定の形式に配置することにより、動画像に対応する検索情報を生成し出力するための動画像の検索情報生成部604と、もとの動画像データと、動画像の検索情報生成部604から出力される、動画像に対応する検索情報とを対応付けて記録媒体606に記憶するための記録部605とを含む。
なお、1フレームは、動画像を時間的に分割した単位であると考えることができる。したがってフレームは時間分割ブロックの一例と呼ぶことができる。
図2を参照して、想定される従来の画像検索装置は、記録媒体606から動画像検索情報および動画像データを読出すための読出部701と、読出部701から供給される各動画像検索情報を保持し、検索情報に対する要求を受けて、シーン単位の検索情報またはフレーム単位の検索情報を動画像の構造情報とともに出力するための検索情報管理部702と、シーン単位の検索の要求を受けて、検索情報管理部702にシーン単位の検索情報と動画像構造情報とを要求し、受取ったシーン単位の検索情報と動画像構造情報とに基づいて、検索要求に合致したシーンを検出して、検出されたシーンに関する情報を出力するためのシーン単位の検索実行部703と、フレーム単位の検索の要求を受けて、検索情報管理部702に対してシーン内のフレーム単位の検索情報および動画像構造情報を要求し、受取ったシーン内のフレーム単位の検索情報および動画像情報に基づいて、検索要求に合致したシーンまたはフレームを検出して、検出されたシーンまたはフレームに関する情報を出力するためのフレーム単位の検索実行部704と、シーン単位の検索実行部703およびフレーム単位の検索実行部704から出力される、検出されたシーンに関する情報または検出されたフレームに関する情報に基づいて、それら検出されたシーンまたはフレームに対応する画像データを読出部701を介して取出し、出力するためのデータ管理部705と、オペレータから与えられる検索指示に応答し、検索要求をシーン単位の検索実行部703またはフレーム単位の検索実行部704に与え、データ管理部705から与えられる動画像データを検索結果として表示する処理を繰返し、検索終了時には検索結果を出力するための検索制御部706とを含む。
図1に示される装置は以下のように動作することが想定される。動画像データが入力されると、解析部601がその動画像データをシーン単位に分割する。解析部601はまた、動画像構造情報を出力する。
フレーム単位の検索情報生成部602は、解析部601から出力された動画像構造情報および動画像データに基づいて、シーン内のフレームに対応する要約情報を生成する。フレーム単位の検索情報生成部602はさらに、こうして生成された要約情報をシーン単位の検索情報生成部603および動画像の検索情報生成部604に検索情報として出力する。
シーン単位の検索情報生成部603は、フレーム単位の検索情報生成部602から与えられたフレーム単位の要約情報に基づき、シーン全体に対する要約情報を生成する。シーン単位の検索情報生成部603はさらに、こうして生成された要約情報をシーン単位の検索情報生成部603に検索情報として与える。
動画像の検索情報生成部604は、解析部601から動画像構造情報を、フレーム単位の検索情報生成部602からフレーム単位の検索情報を、シーン単位の検索情報生成部603からシーン全体のための検索情報をそれぞれ受け、所定の形式で配置して動画像に対応する検索情報を生成する。動画像の検索情報生成部604は、こうして生成された、動画像に対応する検索情報を記録部605に与える。
記録部605は、もとの動画像データと、動画像の検索情報生成部604から与えられた検索情報とを記録媒体606に記録する。このとき記録部605は、記録される動画像データと検索情報とが対応していることを示す情報を動画像データまたは検索情報のいずれか一方または双方に付加するか、または動画像データおよび検索情報とは別に記録する。
図2を参照して、従来の検索装置は以下のように動作することが想定される。検索の開始時に、オペレータは検索制御部706に対して検索指示を与える。検索制御部706は、この検索指示に応答してシーン単位の検索、またはフレーム単位の検索のいずれかを選択する。
たとえばシーン単位の検索が選択されたものとする。すると、検索制御部706はシーン単位の検索実行部703に対して検索の要求を与える。シーン単位の検索実行部703はこの要求に応答して、検索情報管理部702に対してシーン単位の検索情報と動画像構造情報とを要求し、検索情報管理部702から出力されたシーン単位の検索情報と動画像情報とを受取る。
シーン単位の検索実行部703は、このシーン単位の検索情報と動画像構造情報とに基づいて、検索制御部706から与えられた検索要求に合致したシーンを検出する。そしてシーン単位の検索実行部703は、検出されたシーンに関する情報をデータ管理部705に対して出力する。
データ管理部705は、シーン単位の検索実行部703から与えられたシーンに関する情報に基づいて、対応する画像データを読出部701を介して記録媒体606から読出し、検索制御部706に与える。
検索制御部706は、この画像データを表示する。オペレータは、表示された画像データを見て、次の検索方針を決め、次の検索指示を検索制御部706に与える。以下、同様の処理が繰返される。
こうして、オペレータが取出したいと考えていた画像が取出されると検索は終了する。検索結果は検索制御部706から出力される。
従来の技術では、シーンに関する検索情報は、そのシーンに含まれるフレーム単位の検索情報に基づいて生成されている。これは、シーンを構成する最小の単位はフレームであると一般的に認識されていることによる。
特開平9−284702号公報 特開平7−38842号公報
このように個々のフレーム単位の検索情報に基づいてシーンの検索情報を生成すると、各フレームを小領域に分割して得られる、各フレーム内の空間的な特徴(画面分割ブロック単位の検索情報)を検索情報として利用することができる。しかし、これらの従来の装置では時間軸上である長さを有するシーン全体にわたる、画像の空間的な特徴を扱うことができないという問題がある。この明細書では、このようにシーン全体にわたる、画像の空間的な特徴を「空間分割ブロック単位の検索情報」と呼ぶ。
たとえば、画面の中央部に激しく動く物体が映っている、という特徴を有するシーンを取出そうとする場合を考える。従来の技術では、このようなシーンをシーン単位の検索情報から検索することができず、各シーンに含まれる各フレームに付加された検索情報まで降りて検索する必要がある。そのため従来の技術では、そのような検索は効率が極めて低くなる。
本発明は、従来技術の、上記したような問題点に鑑みてなされたものであり、シーンの特徴を的確に表わす新たな指標を用いて動画像検索を効率的に行なうことを可能とする動画像の検索情報を記録する装置および動画像を検索するための装置を提供することを目的とする。
本発明の他の目的は、シーンを時間的なブロックに分割してその特徴を抽出するだけでなく、シーンを、時間軸上では分割せず、空間的にのみ分割してシーンの別の特徴を抽出することにより、動画像の検索を効率的に行なうことを可能とする、動画像検索情報生成装置、動画像要約情報生成装置、および動画像要約情報格納フォーマットを提供することである。
本発明のさらに他の目的は、シーンの特徴を的確に表わす新たな指標を用いて動画像の検索を効率的に行なうことが可能で、かつ検索のための情報の情報量が少なくて済む、動画像検索情報生成装置、動画像要約情報生成装置、および動画像要約情報格納フォーマットを提供することである。
上記目的を達成するために、本発明のある局面に従うと、動画像検索情報生成装置は、1以上のシーンからなる動画像データを検索するための検索情報を生成する動画像検索情報生成装置であって、動画像データに基づいて、シーンの各々に対応して検索情報を生成する検索情報生成部を備え、検索情報生成部は、シーンの各々について、当該シーンを空間的に分割することにより、時間方向には当該シーンの長さを持った複数の空間分割ブロックを構成し、この空間分割ブロック単位の要約情報を生成するための第1の要約情報生成手段を含む。さらに、上記要約情報は、空間分割ブロック内の動画像データに基づいて算出される画像特性を示した数値情報であって、当該シーン内での相対値で与えられる。
また、シーンの各々は、連続する動画像データが時間軸上で分割されたものであり、動画像検索情報生成装置は、シーンの各々の動画像データ中の位置を表わす動画像構造情報を出力する動画像構造情報出力部をさらに備え、検索情報生成部は、動画像構造情報と動画像データとに基づいて、シーンの各々に対応した検索情報を生成することが好ましい。
また、第1の要約情報生成手段は、シーンを空間的に分割する際に、空間方向に定義される2つの方向において予め定める数に分割することが好ましい。
また、第1の要約情報生成手段は、シーンを空間的に分割する際に、予め定める2のべき乗数に分割することが好ましい。
また、検索情報生成部はさらに、シーンの各々について、当該シーンを時間的に分割することにより、空間方向には当該シーンの画像サイズを持った複数の時間分割ブロックを構成し、この時間分割ブロック単位の要約情報を生成するための第2の要約情報生成手段を含むことが好ましい。
さらに、検索情報生成部は、シーンの各々について、当該シーン全体の要約情報を生成するための第3の要約情報生成手段を含むことが好ましい。
本発明の他の局面に従うと、動画像検索情報生成装置は、1以上のシーンからなる動画像データを検索するための検索情報を生成する動画像検索情報生成装置であって、動画像データに基づいて、シーンの各々に対応して検索情報を生成する検索情報生成部を備え、検索情報生成部は、シーンの各々について、当該シーンを構成する複数のフレームの各々を同一の方法で複数のブロックに分割し、複数のフレームの対応する位置にある複数のブロックを集めてシーンに対する複数の空間分割ブロックを形成し、この空間分割ブロック単位の要約情報を生成するための第1の要約情報生成手段を含む。
また、第1の要約情報生成手段は、フレームを複数のブロックに分割する際に、空間方向に定義される2つの方向において予め定める数に分割することが好ましい。
または、第1の要約情報生成手段は、フレームを複数のブロックに分割する際に、予め定める2のべき乗数に分割することが好ましい。
本発明のさらに他の局面に従うと、動画像要約情報生成装置は、1以上のシーンからなる動画像データの要約情報を生成する動画像要約情報生成装置であって、シーンの各々について、当該シーンを空間的に分割することにより、時間方向には当該シーンの長さを持った複数の空間分割ブロックを構成し、この空間分割ブロック単位の要約情報を生成するための第1の要約情報生成手段を備える。さらに、上記要約情報は、空間分割ブロック内の動画像データに基づいて算出される画像特性を示した数値情報であって、当該シーン内での相対値で与えられる。
また、第1の要約情報生成手段は、シーンを空間的に分割する際に、空間方向に定義される2つの方向において予め定める数に分割することが好ましい。
または、第1の要約情報生成手段は、シーンを空間的に分割する際に、予め定める2のべき乗数に分割することが好ましい。
また、動画像要約情報生成装置は、シーンの各々について、当該シーンを時間的に分割することにより、空間方向には当該シーンの画像サイズを持った複数の時間分割ブロックを構成し、この時間分割ブロック単位の要約情報を生成するための第2の要約情報生成手段をさらに備えることが好ましい。
また、動画像要約情報生成装置は、シーンの各々について、当該シーン全体を単位とする要約情報を生成するための第3の要約情報生成手段をさらに備えることが好ましい。
本発明のさらに他の局面に従うと、記録媒体は、1以上のシーンからなる動画像データを検索するための検索情報が、検索情報と動画像データとの対応情報とともに記録された記録媒体であって、検索情報は、シーンの各々について、当該シーンを空間的に分割することにより得られる、時間方向には当該シーンの長さを持った複数の空間分割ブロックを単位とする要約情報を含む。
また、検索情報はさらに、シーンの各々について、当該シーンを時間的に分割することにより得られる、空間方向には当該シーンの画像サイズを持った複数の時間分割ブロックを単位とする要約情報を含むことが好ましい。
また、検索情報はさらに、シーンの各々について、当該シーン全体の要約情報を含むことが好ましい。
本発明のさらに他の局面に従うと、記録媒体は、1以上のシーンからなる動画像データの要約情報が記録された記録媒体であって、シーンの各々について、当該シーンを空間的に分割することにより得られる、時間方向には当該シーンの長さを持った複数の空間分割ブロックを単位とする要約情報を記録している。
また、記録媒体は、シーンの各々について、当該シーンを時間的に分割することにより得られる、空間方向には当該シーンの画像サイズを持った複数の時間分割ブロックを単位とする要約情報をさらに記録していることが好ましい。
また、記録媒体は、シーンの各々について、当該シーン全体を単位とする要約情報をさらに記録していることが好ましい。
本発明のさらに他の局面に従うと、動画像要約情報生成装置は、1以上のシーンからなる動画像データの要約情報を生成する動画像要約情報生成装置であって、シーンの各々について、当該シーンを構成する複数のフレームの各々を同一の方法で複数のブロックに分割し、複数のフレームの対応する位置にある複数のブロックを集めてシーンに対する複数の空間分割ブロックを形成し、この空間分割ブロック単位の要約情報を生成するための第1の要約情報生成手段を備える。
また、第1の要約情報生成手段は、フレームを複数のブロックに分割する際に、空間方向に定義される2つの方向において予め定める数に分割することが好ましい。
または、第1の要約情報生成手段は、フレームを複数のブロックに分割する際に、予め定める2のべき乗数に分割することが好ましい。
本発明のさらに他の局面に従うと、動画像要約情報格納フォーマットは、動画像データを構成する1以上のシーンの各々について、当該シーンを空間的に分割することにより得られる、時間方向には当該シーンの長さを持った複数の空間分割ブロックを単位とする要約情報であって、空間分割ブロック内の動画像データに基づいて算出される画像特性を示した数値情報であり、かつ当該シーン内での相対値で与えられる空間分割ブロック単位の要約情報を、空間分割ブロックの分割数を表わす指定情報とともに格納することを特徴とする。
また、分割数は、空間方向に定義される2つの方向において予め定まる数であることが好ましい。
または、分割数は、予め定まる2のべき乗数であることが好ましい。
また、動画像要約情報格納フォーマットは、シーンの各々について、当該シーン全体を単位とする要約情報を格納することが好ましい。
図3に、本実施の形態にかかる動画像検索情報記録装置40のブロック図を示す。図3を参照して、この動画像検索情報記録装置40は、動画像データを受け、動画像の構造を解析してシーンに分割し、シーンチェンジ点などの動画像構造情報を出力するための解析部101と、動画像データと、解析部101から出力される動画像構造情報とを受け、各シーンに含まれる各フレームの画像データに対する要約情報(フレームという時間分割ブロックを単位とする要約情報)を生成し出力するための第1の検索情報生成部102と、解析部101から出力された動画像構造情報、および動画像データを受け、各シーンに関する検索情報として、シーン内の全てのフレームの同一分割ブロック位置の画像データから構成される空間分割ブロックの要約情報を生成し出力するための第2の検索情報生成部103と、第1の検索情報生成部102から出力されたシーン内の各フレーム(時間分割ブロック)に対する要約情報、および/または、第2の検索情報生成部103から出力されたシーン内の各空間分割ブロックに対する要約情報を入力とし、第1の検索情報生成部102からの要約情報、および/または第2の検索情報生成部103からの要約情報の一方または双方に基づき、シーン全体に対する要約情報を生成し出力するための第3の検索情報生成部104と、第1の検索情報生成部102から出力された要約情報、第2の検索情報生成部103から出力された要約情報、第3の検索情報生成部104から出力される要約情報、および解析部101から出力される動画像構造情報を所定の形式に配置することにより、動画像に対応する検索情報を生成し出力するための第4の検索情報生成部105と、第4の検索情報生成部105から出力される、動画像に対する検索情報と、もとの動画像データとを受け、それらの一方または双方に検索情報と動画像データとの対応情報などを付加するかまたは別データとし、検索情報および動画像データとの対応情報などを記録媒体107に記録するための記録部106とを含む。
本願発明の装置が扱う動画像データは、RGB信号などの原画像信号、MPEG(Moving Picture Experts Group)などの動画圧縮方式を用いて符号化された画像データのいずれでも良い。本実施の形態では、説明の簡便のため、動画像データは符号化されたものであると仮定する。
図3に示された各ブロックの機能についてさらに詳細に以下に説明する。解析部101は、動画像を時間的な小単位(シーン)に分割する。そのために解析部101は、画像データ中のシーンチェンジ点の検出を行なう。解析部101はこの例では、符号化画像データに含まれる符号化ブロックの予測モードの、フレーム内での頻度情報を用いてシーンチェンジ点を検出する。
たとえば、図4を参照して、解析部101は、動画像120の中の第1のシーンチェンジフレーム130、第2のシーンチェンジフレーム132、第3のシーンチェンジフレーム134、第4のシーンチェンジフレーム136を検出する。それによって解析部101は、第1のシーンチェンジフレーム130と第2のシーンチェンジフレーム132との間の画像データ(第1のシーンチェンジフレーム130を含む)からなる第1のシーン140、第2のシーンチェンジフレーム132と第3のシーンチェンジフレーム134との間の画像データ(第2のシーンチェンジフレーム132を含む)からなる第2のシーン142、第3のシーンチェンジフレーム134と第4のシーンチェンジフレーム136との間の画像データ(第3のシーンチェンジフレーム134を含む)からなる第3のシーン144、および第4のシーンチェンジフレーム136から動画像120の最後までの画像データ(第4のシーンチェンジフレーム136を含む)からなる第4のシーン146とに動画像120を分割する。すなわち、解析部101は、動画像120をこの例では4つのシーン140、142、144、146に分割する。
解析部101は、第1のシーンチェンジフレーム130、第2のシーンチェンジフレーム132、第3のシーンチェンジフレーム134、第4のシーンチェンジフレーム136などのシーンチェンジフレームの、画像データ中の位置を表わす情報を、動画像構造情報として出力する機能を有する。
図5を参照して、第1の検索情報生成部102は、解析部101から出力された動画像構造情報に基づいて動画像データを分割することにより得られたあるシーン160に対して以下のような処理を行なって、シーン160に含まれる各フレームの要約情報を作成する。なおシーン160はフレーム162Aから162Nを含むものとする。
第1の検索情報生成部102は、フレーム162A〜162Nの各々について、動きベクトルのフレーム内の頻度情報166Aから166Nを求める。また第1の検索情報生成部102は、フレーム162A〜162Nの各々における動きベクトルの平均値168Aから168Nを求める。
このようにして求められた頻度情報166と平均値情報168とが、この例では各フレームの要約情報170を構成する。要約情報は、フレーム番号の関数(すなわち時間の関数)として与えられる。
この要約情報は、シーン160に含まれる各フレームの空間内に分布する情報を圧縮して得られた検索情報である。各フレームは、画像を時間的に分割した単位であって、時間分割ブロックの一種である。したがって要約情報170は、時間分割ブロック単位の検索情報ということができる。
第2の検索情報生成部103は、解析部101から出力された動画像構造情報(シーンチェンジ位置の情報)と、動画像データとを受ける。第2の検索情報生成部103はこの動画像構造情報と動画像データとを用いて以下のようにして空間分割ブロックに対する要約情報を生成する。
なおここで空間分割ブロックとは以下のようなものをいう。一つのシーン内の全てのフレームの各々を同じ方法で複数個の分割ブロックに空間的に分割する。それら全てのフレームの、対応する位置の分割ブロックの全体をそのシーンの空間分割ブロックと呼ぶ。したがって、一つのシーンがn個のフレームを含み、各フレームがm個の分割ブロックに分割される場合には、そのシーンはm個の空間分割ブロックに分割され、各空間分割ブロックはn個の分割ブロックを含む。
具体的には、図6を参照して、第2の検索情報生成部103ではシーン160に対して以下のような処理が行なわれる。前述のとおり、シーン160が複数個のフレーム162A〜162Nを含むものとする。これらフレーム162A〜162Nが各々、M個の分割ブロックに空間的に分割される。ここで、分割ブロックとは、画像面を複数に分割したときの、各小領域を指す。たとえば図6に示されるフレーム162Aは、複数個の分割ブロック180A1から180AMに分割される。他のフレーム162Bから162Nも同様である。
そして、複数個のフレーム162A〜162Nの各々の、同じ位置の分割ブロックによって、シーン160の一つの空間分割ブロックが形成される。たとえばN個のフレームの各々のM番目の分割ブロックの集合(その要素の数はNと等しい。)によって空間分割ブロック182−Mが形成される。他の空間分割ブロックも同様に形成される。
こうして得られたM個の空間分割ブロックの各々に対して、時間軸方向に分布する情報を圧縮して要約情報188を生成する。ここでいう要約情報188は、各空間分割ブロックに対する要約情報であり、各空間分割ブロックに含まれる分割ブロックの、フレーム内の位置(座標)に対する関数値である。
典型的には、要約情報188は、頻度情報184と平均値情報186とを含む。頻度情報184としては、各符号化ブロックの予測モードの空間分割ブロック内の頻度情報、または動き補償予測符号化時の動きベクトルの空間分割ブロック内の頻度情報を用いることができる。たとえば図示されていないが空間分割ブロック182−1からは頻度情報184Aが得られ、空間分割ブロック182−2からは頻度情報184Bが得られ、以下同様にして空間分割ブロック182−Mからは頻度情報184Mが得られる。
また平均値情報186としては、空間分割ブロック内の動きベクトルの総和もしくは平均値を用いることができる。たとえば図示されていないが空間分割ブロック182−1からは平均値情報186Aが得られ、空間分割ブロック182−2からは平均値情報186Bが得られ、以下同様にして空間分割ブロック182−Mからは平均値情報186Mが得られる。
これ以外にも要約情報としては、空間分割ブロック内の動きベクトルの標準偏差などを用いることもできる。
第3の検索情報生成部104は、第1の検索情報生成部102から出力された要約情報、または、第2の検索情報生成部103から出力された要約情報を受け、これらの一方または双方に基づいて、シーン全体に対する要約情報を生成し出力する。
ここで、シーン全体に対する要約情報とは、シーンを検索する際に用いられる検索情報である。シーン全体に対する要約情報としては、動きベクトル、輝度値、または色差値などの、シーン全体における頻度情報、平均値、標準偏差などを用いることができる。
第4の検索情報生成部105は、第1の検索情報生成部102から出力された要約情報と、第2の検索情報生成部103から出力された要約情報と、第3の検索情報生成部104から出力された要約情報と、解析部101から出力された動画像構造情報とを所定の形式に配置することにより、動画像に対応する検索情報を生成し出力して記録部106に与える。
記録部106は、第4の検索情報生成部105から出力された、動画像に対応する検索情報と、もとの動画像データとを受けて、検索情報のみ、または検索情報と動画像データとを記録媒体107に記録する。このとき記録部106は、動画像データと検索情報とが対応していることを示す情報を動画像データもしくは検索情報のいずれか一方もしくは双方に付加するか、または動画像データおよび検索情報とは別データとして記録する。
上に構造と一般的動作とを説明した本実施の形態にかかる動画像検索情報記録装置40において用いられる検索情報としては、動き補償予測符号化された動画像データに含まれる動きベクトルに基づいて得られる動きの大きさの情報を用いるものとする。
より具体的には、時間分割ブロック(フレーム)単位の検索情報は、シーン内の各フレームに対して、各符号化ブロックに付加された動きベクトルから求められた、フレーム全体における動きベクトルの絶対値の総和として求められる。なお、動きベクトルの絶対値の総和にかえて動きベクトルの絶対値の平均としても同じことである。実際、一フレームに含まれる符号化ブロックの数が定まっていれば、動きベクトルの絶対値の総和とその平均値との一方から容易に他方が求められる。
空間分割ブロック単位の検索情報としては、各空間分割ブロックにおける動きベクトルの絶対値の総和が使用される。ここでも、動きベクトルの総和に替えてその平均を検索情報として用いることができる。空間分割ブロックを構成する各分割ブロックが符号化ブロックと一致する場合には、各分割ブロックに対応する動きベクトルの数は1となる。各分割ブロックが複数個の符号化ブロックを含む場合には、各分割ブロックに対応する動きベクトルの数はその分割ブロックに含まれる符号化ブロックの数と等しい。
または空間分割ブロック単位の検索情報は、各空間分割ブロック内での動きベクトルの絶対値の総和を、空間分割ブロックを構成する分割ブロックの数で除した値でもよい。この場合の分割ブロックの数は、シーンを構成するフレームの数と等しい。さらにまた、空間分割ブロック単位の検索情報は、各空間分割ブロック内での動きベクトルの絶対値の総和を、空間分割ブロックを構成する分割ブロックに含まれる符号化ブロックの数の総和で除した値でもよい。
時間分割ブロックまたは空間分割ブロックの検索情報として、動きベクトルの絶対値の総和を用いたとすると、シーンに含まれる全ての動きベクトルの絶対値の総和を計算することができる。本実施の形態では、こうして得られた総和をシーン単位の検索情報とする。
次に、空間分割ブロック単位での検索情報の生成に用いられる分割ブロックの具体例について説明する。図7に示されるように、シーン160がフレーム162A〜162Nからなっているものとする。これらフレーム162A〜162Nの動きベクトルの絶対値の総和から、シーン160のシーン単位検索情報Iが求められる。
図8に示されるように、フレーム162A〜162Nはそれぞれ、2×2個の分割ブロックに分割されているものとする。すなわちフレーム162A〜162Nはそれぞれ4つの分割ブロックに分割されている。たとえばフレーム162Aは4つの分割ブロック190A1から190A4に分割される。以下のフレームについても図示しないが同様である。たとえばフレーム162Bはフレーム190B1から190B4に分割される、などである。したがって先の空間分割ブロックの説明からわかるように、シーン160は4つの空間分割ブロックに分割され、これら4つの空間分割ブロックに対して、各空間分割ブロック内の動きベクトルの絶対値の総和からそれぞれ空間分割ブロック単位の検索情報I1からI4がいずれも実数値として求められる。
したがって、シーン160のためのシーン検索情報として、たとえばこれら検索情報I,I1,I2,I3,I4を順番に配列して得られる{I,I1,I2,I3,I4}を用いることができる。この検索情報をもとの画像データとともに記録すればよい。
ただし、上記した検索情報は冗長性を含む。これは、この例ではシーン単位検索情報Iが空間分割ブロック単位の検索情報の和と等しいことによる。たとえばシーン単位検索情報Iは、空間分割ブロック単位の検索情報I1からI4より求めることができる。または、空間分割ブロック単位の検索情報I1からI4のうちの任意の3つとシーン単位検索情報Iとから、空間分割ブロック単位の検索情報の残りの一つを計算することができる。
そこで、本実施の形態の装置では、I4については検索情報には含ませないようにする。さらに本実施の形態の装置では、各空間分割ブロック単位検索情報のそのままの値ではなく、シーン単位の検索情報に対する各空間分割ブロック単位検索情報の値の百分率で示す。第1から第3の空間分割ブロックの検索情報の、シーン単位の検索情報Iに対する比率をP1、P2およびP3とすれば、このときの空間分割ブロック単位の検索情報は図9に示されるようにして求められる。すなわち、第1の空間分割ブロックとシーン単位検索情報とから第1の空間分割ブロックの検索情報P1が計算される。第2の空間分割ブロックとシーン単位検索情報とから第2の空間分割ブロックの検索情報P2が計算される。第3の空間分割ブロックとシーン単位検索情報とから第3の空間分割ブロックの検索情報P3が計算される。第4の空間分割ブロックについて検索情報を求めると冗長となるので、求めることはしない。つまり、シーン160は4つの空間分割ブロックに分割されるが、そのうち3つの検索情報を求めればよい。一般的にPkは、Pk=100×Ik/Iによって求められる。
このように空間分割ブロックの検索情報として、シーン単位検索情報に対する百分率として記録すると、以下のような利点が得られる。第1に検索情報を記録するための信号のダイナミックレンジが制限されるため、より効率的に検索情報を記録できる。すなわち記録される情報量がそうでない場合より減少する。第2に、検索情報の値が正規化されるため、別々のシーンに付された検索情報を互いに比較することが可能となる。第3に、既に述べたとおり、記録すべき変数を一つ省略することができる。
このようにして動画像検索情報が第4の検索情報生成部105によって生成され、記録部106を介して記録媒体107に記録される。
さて、図3に示された動画像検索情報記録装置40によって記録媒体107に記録された動画像データおよび検索情報を用いて動画像検索をする装置について以下説明する。図10を参照して、この実施の形態にかかる動画像検索装置50は、記録媒体107に記録された動画像データとその検索情報とを読出すための読出部501と、読出部501により読出された動画像の検索情報を保持し、検索要求に応じてシーン単位検索情報、空間分割ブロック単位検索情報、または時間分割ブロック単位検索情報を、動画像構造情報とともに出力するための検索情報管理部502と、シーン単位の検索要求に応答して、検索情報管理部502に対して要求を出し、検索情報管理部502からシーン全体に対する検索情報と、動画像構造情報とを受け、シーン単位の検索要求に合致したシーンを検出して、検出されたシーンに関する情報を出力するための第1の検索実行部503と、空間分割ブロック単位の検索要求に応答して、検索情報管理部502に対して要求を出し、検索情報管理部502から受取った、シーン内の各空間分割ブロックに対する要約情報と、動画像構造情報とに基づいて、検索要求に合致したシーンを検出して検出されたシーンに関する情報を出力するための第2の検索実行部504と、時間分割ブロック単位の検索要求に応答して検索情報管理部502に対して要求を出し、検索情報管理部502から受取ったシーン内の各フレームに対する要約情報と、動画像構造情報とに基づいて検索要求に合致したシーンまたはフレームを検出し、検出されたシーンまたはフレームに関する情報を出力するための第3の検索実行部505と、読出部501によって読出された動画像情報を保持し、第1の検索実行部503、第2の検索実行部504または第3の検索実行部505から出力される検索結果に基づいて、検索結果に基づき検出されるシーンまたはフレームの画像データを出力するためのデータ管理部506と、オペレータからの検索指示入力に応答して、シーン単位の検索要求を第1の検索実行部503に、空間分割ブロック単位の検索要求を第2の検索実行部504に、または時間分割ブロック単位の検索要求を第3の検索実行部505に、それぞれ出力し、その結果データ管理部506から出力されるシーンまたはフレームの画像データを表示し、検索終了時には検索結果を出力するための検索制御部507とを含む。
この動画像検索装置50は以下のように動作する。検索開始時、オペレータは検索制御部507に対して検索指示を与える。検索制御部507は、この検索指示に応じて、シーン単位の検索、空間分割ブロック単位での検索、または時間分割ブロック単位での検索のいずれかを選択し、第1の検索実行部503、第2の検索実行部504、または第3の検索実行部505のいずれかに対して検索要求を出す。
第1の検索実行部503、第2の検索実行部504、第3の検索実行部505のうち、検索制御部507から検索要求を受取ったものは、検索情報管理部502から与えられる動画像構造情報と、シーン単位、空間分割ブロック単位、または時間分割ブロック(フレーム)単位の要約情報に基づいて、検索要求に合致したシーンまたはフレームを検出し、検出されたシーンまたはフレームに関する情報をデータ管理部506に与える。
データ管理部506は、第1の検索実行部503、第2の検索実行部504または第3の検索実行部505から受取った、シーンまたはフレームに関する情報に対応するシーンまたはフレームの画像を動画像データから抽出し検索制御部507に与える。
検索制御部507は、データ管理部506から与えられた画像を表示する。表示された画像により、オペレータはその画像が所望のシーンであるかどうかを判断し、所望のシーンであれば検索結果を出力するように指示を検索制御部507に与える。検索制御部507はこの指示に応答して、検索結果を出力する。
検索制御部507により表示された画像が所望のシーンを表わすものではなかった場合、オペレータはさらに次の検索指示を検索制御部507に与える。以下検索制御部507は上述したのと同様の動作を行なって、検索結果のシーンの表示を行なう。以下、検索が終了するまでこの動作を繰返す。
具体的な動画像検索の例について説明する。この実施の形態では、検索情報として、動き補償予測符号化された動画像データに含まれる動きベクトルに基づいて得られる動きの大きさに関する情報を用いる。
所望のシーンまたはシーン内のフレームは、次のようにして検索される。
シーン単位の検索情報を利用すると、たとえば全体的に動きの大きなシーンと、全体的に動きの小さなシーンとを選別することができる。
空間分割ブロック単位の検索情報を利用すると、たとえば一シーンにわたって動きが空間的に遍在するようなシーンと、動きが空間的に比較的均等に分布するシーンとを選別できる。また、動きの遍在する部分が画像のどの部分かを指定することができる。たとえば、画像の中央部分に激しく動く部分(被写体)があるシーン、または画像の下半分に激しく動く部分があるシーン(空を含む画像)などを選び出すことができる。
本実施の形態では、空間分割ブロックという、従来は考慮されていなかったものを単位とする検索情報をシーンの検索に用いる。そのため、次のような効果が得られる。
図11から図13を参照して、図12(A)に示すシーンAと、図13(A)に示すシーンBとについて、図11(A)に示す基準となるシーンとの類似度を計算する場合を考える。こうした「類似度」計算により、基準となるシーンと類似した動き特徴を有するシーンを検出することができる。図12から図13は、シーン単位の検索情報のみを用いた場合を示す。
図11から図13の(B)に、それぞれの(A)に示す画像に対するシーン単位検索情報を示す。図11から図13の(A)に示されるように、シーンAおよびシーンBは、基準となるシーンに対して、シーン全体として同じような動きの強さを持っている。そのため、図11から図13の(B)に示されるように、対応のシーン単位検索情報も同様の値となる。すなわち、シーンA、Bのいずれも、基準となるシーンと類似していると判断される。
続いて、図14から図16を参照して、空間分割ブロック単位の検索情報を用いた場合の類似度検索の特徴について説明する。図14から図16の(A)にはそれぞれ基準となるシーン、シーンA、Bを示す。図示されるように、各シーンの各フレームは4つの分割ブロックを含む。そのうちそれぞれ第1から第3の分割ブロックからなる空間分割ブロックに対して、空間分割ブロック単位の検索情報P1、P2およびP3が計算されている。また図14から図16の(B)に示すように、基準となるシーン、シーンAおよびBに対するシーン単位の検索情報はほぼ同じ値である。
しかし、図14から図16の(C)に示されるように、空間分割ブロック単位の検索情報で各シーンを比較すると、次の事実が分る。すなわち、シーンAの方が、基準となるシーンの空間分割ブロック単位検索情報の分布と類似した分布を有する。これは、シーンBでは人物が右の方によっているため、空間的に動きの偏りができるためである。基準となるシーンおよびシーンAはいずれも、人物がほぼ中央にいる。したがって、基準となるシーンと類似したシーンとしてシーンAは検出されるが、シーンBは検出されない。つまり、シーン全体としての動きはシーンA、Bとも基準となるシーンと類似している場合であっても、動きが遍在しているか否かによってシーンを選別することができる。
さらに、フレーム(時間分割ブロック)単位の検索情報を利用すれば、たとえばシーン内の特に動きの激しいフレーム、逆に動きの止まっているようなフレームを選別することができる。
上記したシーン単位の検索情報、空間分割ブロック単位での検索情報、および時間分割ブロック単位での検索情報を組合わせることによって、さらに細かく所望のシーンの検索をすることができる。
たとえば、全体的に動きの大きなシーンを選び、特に画像の中央部分に激しく動く部分を持つシーンに絞り込み、さらに絞り込まれた各シーン内の、特に動きの激しいフレームをキーフレームとして取出す、という形で動画像検索を実行することができる。
このように、本実施の形態の装置によれば、多面的な条件指定により、画像の動きなどの画像特徴に基づいて、所望のシーンの画像を効率的に検索することができる。検索に要する時間も短縮される。
上記した実施の形態は、本発明を実施するための一つの例に過ぎない。この他にも種々の変形をこれらの装置に対して行なうことができる。
たとえば、この実施の形態の装置では解析部101が自動的に動画像データに対する信号解析によりシーンチェンジ点を見出している。しかし本発明はこれには限定されず、たとえばオペレータが動画像を見て、オペレータの主観によって動画像の構造を解析しシーンの分割位置にタグを付すようにしてもよい。この場合解析部101は、動画像データを同様に解析するが、その際、動画像データに付されたタグを見て動画像をシーンに分割する。
上記した実施の形態では、フレームの要約情報の頻度情報166として動き補償予測符号化時の動きベクトルのフレーム内頻度情報を用いた。しかしこの発明はこれには限定されず、頻度情報として各符号化ブロックの予測モードのフレーム内頻度情報を用いることもできる。
また、要約情報としては、上記したほかに、フレーム内の動きベクトルの総和もしくは標準偏差、または原画像信号もしくは復号画像信号を用いて計算されるフレーム内の平均輝度値、もしくは平均色差値などを用いてもよい。
検索方法および手順は、ここに示した組合せには限定されない。選択される候補を絞り込む順序を変えることも可能である。また、生成される検索情報によっても、検索のための方法およびその手順は変化する。
またたとえば、上記した実施の形態の装置では、空間分割ブロックとして、1フレームを2×2=4分割した分割ブロックの1シーンにわたる集合を用いた。分割の個数は4個には限定されない。たとえば図17に示されるように4×4、8×8、またはそれ以上の数による分割を行なうことも可能である。4×4分割の場合には、百分率で表わした空間分割ブロック単位検索情報はP1からP15である。P16は100%から他の空間分割ブロックの検索情報の和を減ずることにより得られる。8×8分割の場合には、百分率で表わした空間分割ブロック単位検索情報はP1からP63である。P64も100%から他の空間分割ブロックの検索情報の和を減ずることにより得られる。
さらに、このように複数通りの分割方法のいずれを用いるかを選択できるようにしてもよい。この場合、選択された個数(「解像度」と呼ぶことができる。)にしたがって分割された分割ブロックによって空間分割ブロックを構成し、その各々に対して検索情報を求める。さらに、検索情報を記録するときには、シーン単位検索情報と、選択された解像度による空間分割ブロック単位の検索情報に加えて、図18にその値と分割数との対応関係が示される分割数指定フラグを検索情報に付加する。分割数指定フラグが「0」であれば{P1,P2,P3}、「1」であれば{P1,P2,…,P15}、「2」であれば{P1,P2,…,P63}、「3」であれば{P1,P2,…,P256}の空間分割ブロック単位の検索情報が記録される。
このように空間分割ブロックの解像度を複数通り指定できることにより、以下のような効果が生じる。
まず、画像のうち上下左右のおおまかな画像の動きの分布を知りたいという、比較的簡易な検索のみが要求されるデータベースでは、2×2など、小さな分割数を用いる。検索情報の記録量を抑えることができる。
画像の特定の一部または離れた2つの部分で動きが大きいシーンを抽出したい、というような要求が頻繁にあるデータベースでは、8×8など、比較的大きな分割数を用いる。高機能な検索を実現することができる。高解像度の検索情報は、低解像度の検索情報を含むので、低解像度の検索が必要なときにも、低解像度の検索情報を重複して持つ必要はない。
以上説明した実施の形態では、2×2、4×4、および8×8のように、縦方向の分割数と横方向の分割数とが等しく、かついずれも2のべき乗である。こうした分割数を選択的に用いると、分割の解像度が異なる空間分割ブロック単位検索情報を記録したデータベース間においても検索情報の間の対応付けが可能となる。また、異なる分割解像度どうしでの検索情報を比較することも可能となる。
さらに、図19に示されるように、複数種類の解像度の空間分割ブロック単位の検索情報を階層的に記録してもよい。たとえば、シーンの検索情報は、シーン単位の検索情報200と、2×2分割による空間分割ブロック単位の検索情報202と、4×4分割による空間分割ブロック単位の検索情報204と、8×8分割による空間分割ブロック単位の検索情報206とを含む。
この階層構造では、ある層の空間分割ブロック単位の検索情報は、一段高解像度の4つの空間ブロック単位の検索情報で表わされる。したがって、各層において、4つの空間分割ブロック単位の検索情報のうちの一つを記録しなくとも、検索に必要な全ての情報を得ることができる。
図19に示した例による検索情報は、図17に示した8×8にフレームを分割して形成される空間分割ブロックを単位とする検索情報を記録するのと同じ解像度の検索情報を含む。一方で図19に示した検索情報によれば、他の解像度の検索情報を容易に得ることができるという利点を有する。
上に説明した実施の形態では、シーン内の全フレームを、2×2、4×4、8×8などのようにn×nの配置に分割して、空間分割ブロックを形成している。しかし本発明によれば、フレームの分割方法はこれには限られない。たとえば図20から図24に示されるような形でフレームを分割して、得られた空間分割ブロックを単位として検索情報を生成するようにしてもよい。図20から図24に示した例では、シーン内の全フレームを2のべき乗(2n)個(図20ではn=2、図21ではn=3、図22ではn=4、図23ではn=5、図24ではn=6)に分割している。このような分割方法を用いても、上に述べた実施の形態の装置で得られたものと同様の検索機能を実現するための検索情報を生成することができる。
図20〜図24に示したようなフレームの分割方法によっても、上に記載した実施の形態と同様に、異なる解像度の検索情報同士の対応付けが容易である。また、異なる解像度の検索情報を互いに容易に比較することができる。
なお、図5に示される例の場合は、たとえばフレーム162Nを一つの時間分割ブロック164Nとして要約情報を求めている。しかし本発明はこうした実現例に限定されない。たとえば一つの時間分割ブロックが2以上のフレームを含むようにしてもよい。また、各フレームをサブサンプリングしてサブフレームを生成し、一時間分割ブロックが一または複数個のサブフレームを含むようにしてもよい。またシーン内のフレームを適宜間引いて、間引いた各フレームに対する要約情報を用いるとしてもよい。
なお、図6に示される例または図8に示される例の場合は、空間分割ブロックに含まれる全ての分割ブロックを用いて空間分割ブロックの要約情報を求めている。しかし本発明はこうした実現例に限定されない。必ずしも空間分割ブロック内の全ての分割ブロックに対応する画像データを用いる必要はなく、分割ブロックを適当に間引いて、または分割ブロック内の画像データを適当に間引いて、空間分割ブロックの要約情報を生成してもよい。
なお、図5および図6を参照して説明した、時間分割ブロック単位もしくは空間分割ブロック単位の検索情報、またはシーン単位の検索情報を生成する際に、動画像を撮影したカメラの動きによるバックグラウンドの動きへの影響を除くために、カメラの動きに相当する動きベクトル分を補正して検索情報を生成するようにしてもよい。
さらに、上記した実施の形態では、動画像検索情報記録装置40と動画像検索装置50とは分離された別の装置である。そして検索情報は記録媒体107を介して動画像検索情報記録装置40から動画像検索装置50に渡されている。これに替えて、例えば、図3に示す第1の検索情報生成部102、第2の検索情報生成部103、第3の検索情報生成部104で生成された各種の検索情報を、解析部101から出力される動画像構造情報とあわせて、直接図10の検索情報管理部502に渡すようにしてもよい。この場合の検索処理は、いわゆるリアルタイム検索と呼ばれる。
上記した実施の形態でフレームを分割した分割ブロックは、符号化ブロックと一致してもよい。符号化ブロックとは別の、適当な大きさのブロックを新たに定義してもよい。上の実施の形態では、分割ブロックは対称形であり、かつ分割ブロックの配置も対称である。しかし分割ブロックを新しく定義する場合には、ブロックが対称形である必要はない。またブロックの配置に関しても対称である必要はない。また、画像面内を適当に間引くことも可能である。すなわち、画像内に分割ブロックが含まれない領域があってもよい。また、分割ブロックが部分的に重複してもよい。すなわち、画像内に複数の分割ブロックに含まれる領域があってもよい。
上記した実施の形態では、図3に示される第3の検索情報生成部104は、第1の検索情報生成部102から出力される要約情報および第2の検索情報生成部103から出力される要約情報を受けて、シーン全体に関する要約情報を生成している。しかし本発明はこのような実現例には限定されない。たとえば第3の検索情報生成部104は、入力された画像データから直接にシーン全体に関する要約情報を生成するようにしてもよい。
また、上記した実施の形態では、各種の要約情報(検索情報)を、物理的に定義された一シーンを単位として求めている。しかし検索情報を、シーンを単位として求める必要は必ずしもない。たとえば1つのシーンを複数に分割したサブシーンを単位として検索情報を求めてもよい。すなわち「シーン」という語は「サブシーン」をも意味する。逆に、複数のシーンからなる複合シーンを単位として検索情報を求めることもできる。すなわち「シーン」という語は、「複数のシーンの集まり」をも意味する。
また、上記した実施の形態では、1つの動画像データに対して検索情報を生成し、記録し、検索を実行しているが、本発明はこうした実現例に限定されない。すなわち、複数の動画像データを検索の対象とし、検索情報を生成し、記録し、複数の動画像データ中から所望のシーンまたはフレームを検索することも想定するものである。
その一例として、図25に示す、複数のシーンの各々が独立した動画像データとして蓄積されている画像データベースからの動画像検索を考える。昨今の、動画像を撮影することが可能なデジタルカメラなどで動画像の撮影を行なった場合には、各撮影された動画像、すなわち1回の録画開始から録画停止までの1シーンを表わす動画像データが、それぞれ独立したデータファイルとして生成される。したがって、図25に示すような画像データベースも容易に想起できる。
このような画像データベースに対して、図3に示される動画像検索情報記録装置40によって検索情報を生成する。このとき、入力される動画像データは、データベースに存在する複数の動画像データである。格動画像データは既にシーンに分解されている(1つの動画像データは各々一つのシーンのみを含んでいる)ため、動画像構造情報は不要である。したがって解析部101では動画像の構造解析を行なう必要はない。第1、第2、第3の検索情報生成部102、103、104は、動画像データからそれぞれフレーム(時間分割ブロック)、空間分割ブロック、シーン全体に対する要約情報を生成する。第4の検索情報生成部105は、これらの要約情報を所定の形式に配置して動画像に対する検索情報を生成する。記録部106は、各動画像データと各動画像に対応する検索情報とを受け、各動画像データと検索情報との対応情報をいずれか一方もしくは双方に付加するか、または別データとし、検索情報と対応情報とを記録媒体107に記録する。記録媒体107を元の画像データベース内としてもよい。また、各検索情報は各々独立して記録しても、または画像データベースに対応する検索情報としてまとめて記録してもよい。
また、このような画像データベースならびに生成および記録された検索情報から、図10に示される動画像検索装置によって検索を実行する。このとき、読出部501で読出され検索情報管理装置502で管理されるのは、データベースに存在する複数の動画像データに対応した検索情報であり、各動画像データに対応した動画像構造情報は不要である。第1、第2、第3の検索実行部503、504、505ではそれぞれ、対応する検索情報を用いて検索要求と合致したシーンまたはフレームを検出し、検出されたシーンまたはフレームに関する情報を出力する。データ管理部506および検索制御部507は前記した実施の形態と同様に動作し、検索結果が得られる。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
想定された従来の動画像の検索情報記録装置の概略ブロック図である。 想定された従来の動画像の検索装置の概略ブロック図である。 本発明の一実施の形態にかかる動画像検索情報記録装置のブロック図である。 本発明の一実施の形態にかかる動画像検索情報記録装置において、動画像をシーンに分解する過程を示す図である。 本発明の一実施の形態にかかる動画像検索情報記録装置において、時間分割ブロック単位の検索情報が生成される過程を示す図である。 本発明の一実施の形態にかかる動画像検索情報記録装置において、空間分割ブロック単位の検索情報が生成される過程を示す図である。 本発明の一実施の形態にかかる動画像検索情報記録装置におけるシーン単位の検索情報の概念を説明するための図である。 本発明の一実施の形態にかかる動画像検索情報記録装置における空間分割ブロック単位の検索情報の概念を説明するための図である。 本発明の一実施の形態にかかる動画像検索情報記録装置における、冗長性を排した空間分割ブロック単位の検索情報の概念を説明するための図である。 本発明の一実施の形態にかかる動画像検索装置のブロック図である。 シーン単位検索情報による類似度検索における、基準となるシーンを示す図である。 シーン単位検索情報による類似度検索における、一つのシーンを示す図である。 シーン単位検索情報による類似度検索における、他のシーンを示す図である。 空間分割ブロック単位検索情報による類似度検索における、基準となるシーンを示す図である。 空間分割ブロック単位検索情報による類似度検索における、一つのシーンを示す図である。 空間分割ブロック単位検索情報による類似度検索における、他のシーンを示す図である。 本発明の一実施の形態にかかる動画像検索情報記録装置において、シーン単位検索情報の記録と、空間分割ブロック単位の検索情報の選択的な記録という概念を示す図である。 分割指定数フラグの値の意味を表形式で示す図である。 本発明の一実施の形態にかかる動画像検索情報記録装置における、シーン単位の検索情報の記録と、空間分割ブロック単位の検索情報の階層的な記録という概念を表わす図である。 フレームを22個に分割するときの分割例を示す図である。 フレームを23個に分割するときの分割例を示す図である。 フレームを24個に分割するときの分割例を示す図である。 フレームを25個に分割するときの分割例を示す図である。 フレームを26個に分割するときの分割例を示す図である。 動画像データがシーン単位に分割して蓄積されている動画像データベースを示す図である。
符号の説明
101 解析部、102 第1の検索情報生成部、103 第2の検索情報生成部、104 第3の検索情報生成部、105 第4の検索情報生成部、106 記録部、107 記録媒体、501 読出部、502 検索情報管理部、503 第1の検索実行部、504 第2の検索実行部、505 第3の検索実行部、506 データ管理部、507 検索制御部、601 解析部、602 フレーム単位の検索情報生成部、603 シーン単位の検索情報生成部、604 動画像の検索情報生成部、605 記録部、606 記録媒体、701 読出部、702 検索情報管理部、703 シーン単位の検索実行部、704 フレーム単位の検索実行部、705 データ管理部、706 検索制御部。

Claims (24)

  1. 1以上のシーンからなる動画像データを検索するための検索情報を生成する動画像検索情報生成装置であって、
    前記動画像データに基づいて、前記シーンの各々に対応して要約情報を前記検索情報として生成する検索情報生成部を備え、
    前記検索情報生成部は、前記シーンの各々について、当該シーンを空間的に分割することにより、時間方向には当該シーンの長さを持った複数の空間分割ブロックを構成し、この空間分割ブロック単位の前記要約情報を生成するための第1の要約情報生成手段を含み、
    前記空間分割ブロック単位の要約情報の各々は、前記空間分割ブロックの動画像データに基づいて算出される画像特性を示した数値情報であって、当該シーン内での他の空間分割ブロックに対する相対値で与えられる、動画像検索情報生成装置。
  2. 前記シーンの各々は、連続する動画像データが時間軸上で分割されたものであり、
    前記シーンの各々の前記動画像データ中の位置を表わす動画像構造情報を出力する動画像構造情報出力部をさらに備え、
    前記検索情報生成部は、前記動画像構造情報と前記動画像データとに基づいて、前記シーンの各々に対応した検索情報を生成する、請求項1に記載の動画像検索情報生成装置。
  3. 前記第1の要約情報生成手段は、前記シーンを空間的に分割する際に、空間方向に定義される2つの方向において予め定める数に分割することを特徴とする、請求項1に記載の動画像検索情報生成装置。
  4. 前記第1の要約情報生成手段は、前記シーンを空間的に分割する際に、予め定める2のべき乗数に分割することを特徴とする、請求項1に記載の動画像検索情報生成装置。
  5. 前記検索情報生成部はさらに、前記シーンの各々について、当該シーンを時間的に分割することにより、空間方向には当該シーンの画像サイズを持った複数の時間分割ブロックを構成し、この時間分割ブロック単位の要約情報を生成するための第2の要約情報生成手段を含む、請求項1に記載の動画像検索情報生成装置。
  6. 前記検索情報生成部はさらに、前記シーンの各々について、当該シーン全体の要約情報を生成するための第3の要約情報生成手段を含む、請求項5に記載の動画像検索情報生成装置。
  7. 前記検索情報生成部はさらに、前記シーンの各々について、当該シーンを時間的に分割することにより、空間方向には当該シーンの画像サイズを持った複数の時間分割ブロックを構成し、この時間分割ブロック単位の要約情報を生成するための第2の要約情報生成手段を含む、請求項3または4に記載の動画像検索情報生成装置。
  8. 前記検索情報生成部はさらに、前記シーンの各々について、当該シーン全体の要約情報を生成するための第3の要約情報生成手段を含む、請求項7に記載の動画像検索情報生成装置。
  9. 前記検索情報生成部はさらに、前記シーンの各々について、当該シーン全体の要約情報を生成するための第3の要約情報生成手段を含む、請求項1、3および4のいずれかに記載の動画像検索情報生成装置。
  10. 1以上のシーンからなる動画像データを検索するための検索情報を生成する動画像検索情報生成装置であって、
    前記動画像データに基づいて、前記シーンの各々に対応して要約情報を前記検索情報として生成する検索情報生成部を備え、
    前記検索情報生成部は、前記シーンの各々について、当該シーンを構成する複数のフレームの各々を同一の方法で複数のブロックに分割し、前記複数のフレームの対応する位置にある複数の前記ブロックを集めて前記シーンに対する複数の空間分割ブロックを形成し、この空間分割ブロック単位の前記要約情報を生成するための第1の要約情報生成手段を含
    前記空間分割ブロック単位の要約情報の各々は、前記空間分割ブロック毎の動画像データに基づいて算出される画像特性を示した数値情報であって、当該シーン内での他の空間分割ブロックに対する相対値で与えられる、動画像検索情報生成装置。
  11. 前記第1の要約情報生成手段は、前記フレームを前記複数のブロックに分割する際に、空間方向に定義される2つの方向において予め定める数に分割することを特徴とする、請求項10に記載の動画像検索情報生成装置。
  12. 前記第1の要約情報生成手段は、前記フレームを前記複数のブロックに分割する際に、予め定める2のべき乗数に分割することを特徴とする、請求項10に記載の動画像検索情報生成装置。
  13. 1以上のシーンからなる動画像データの要約情報を生成する動画像要約情報生成装置であって、
    前記シーンの各々について、当該シーンを空間的に分割することにより、時間方向には当該シーンの長さを持った複数の空間分割ブロックを構成し、この空間分割ブロック単位の前記要約情報を生成するための第1の要約情報生成手段を備え、
    前記空間分割ブロック単位の要約情報の各々は、前記空間分割ブロックの動画像データに基づいて算出される画像特性を示した数値情報であって、当該シーン内での他の空間分割ブロックに対する相対値で与えられる、動画像要約情報生成装置。
  14. 前記第1の要約情報生成手段は、前記シーンを空間的に分割する際に、空間方向に定義される2つの方向において予め定める数に分割することを特徴とする、請求項13に記載の動画像要約情報生成装置。
  15. 前記第1の要約情報生成手段は、前記シーンを空間的に分割する際に、予め定める2のべき乗数に分割することを特徴とする、請求項13に記載の動画像要約情報生成装置。
  16. 前記シーンの各々について、当該シーンを時間的に分割することにより、空間方向には当該シーンの画像サイズを持った複数の時間分割ブロックを構成し、この時間分割ブロック単位の要約情報を生成するための第2の要約情報生成手段をさらに備える、請求項13に記載の動画像要約情報生成装置。
  17. 前記シーンの各々について、当該シーン全体を単位とする要約情報を生成するための第3の要約情報生成手段をさらに備える、請求項13〜16のいずれかに記載の動画像要約情報生成装置。
  18. 1以上のシーンからなる動画像データの要約情報を生成する動画像要約情報生成装置であって、
    前記シーンの各々について、当該シーンを構成する複数のフレームの各々を同一の方法で複数のブロックに分割し、前記複数のフレームの対応する位置にある複数の前記ブロックを集めて前記シーンに対する複数の空間分割ブロックを形成し、この空間分割ブロック単位の前記要約情報を生成するための第1の要約情報生成手段を備え、
    前記空間分割ブロック単位の要約情報の各々は、前記空間分割ブロック毎の動画像データに基づいて算出される画像特性を示した数値情報であって、当該シーン内での他の空間分割ブロックに対する相対値で与えられる、動画像要約情報生成装置。
  19. 前記第1の要約情報生成手段は、前記フレームを前記複数のブロックに分割する際に、空間方向に定義される2つの方向において予め定める数に分割することを特徴とする、請求項18に記載の動画像要約情報生成装置。
  20. 前記第1の要約情報生成手段は、前記フレームを前記複数のブロックに分割する際に、予め定める2のべき乗数に分割することを特徴とする、請求項18に記載の動画像要約情報生成装置。
  21. 1以上のシーンからなる動画像データを検索するための要約情報を生成するための要約情報生成装置における要約情報生成方法であって、
    前記要約情報生成装置が、前記シーンの各々について、当該シーンを空間的に分割することにより、時間方向に当該シーンの長さを持った複数の空間分割ブロックを構成するステップと、
    前記要約情報生成装置が、前記空間分割ブロック単位の前記要約情報を生成するステップとを備え、
    前記要約情報を生成するステップは、前記空間分割ブロック単位の前記要約情報として、前記空間分割ブロック毎の動画像データに基づいて算出される画像特性を示した数値情報であって、当該シーン内での他の空間分割ブロックに対する相対値を算出するステップを含む、要約情報生成方法。
  22. 前記空間分割ブロックの分割数は、空間方向に定義される2つの方向において予め定まる数であることを特徴とする、請求項21に記載の要約情報生成方法
  23. 前記空間分割ブロックの分割数は、予め定まる2のべき乗数であることを特徴とする、請求項21に記載の要約情報生成方法
  24. 前記要約情報生成装置が、前記シーンの各々について、当該シーン全体を単位とする要約情報を生成するステップをさらに備える、請求項21〜23のいずれかに記載の要約情報生成方法
JP2003434626A 1999-06-30 2003-12-26 動画像検索情報生成装置、動画像要約情報生成装置、および要約情報生成方法 Expired - Fee Related JP4462922B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003434626A JP4462922B2 (ja) 1999-06-30 2003-12-26 動画像検索情報生成装置、動画像要約情報生成装置、および要約情報生成方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP18460699 1999-06-30
JP33901999 1999-11-30
JP2003434626A JP4462922B2 (ja) 1999-06-30 2003-12-26 動画像検索情報生成装置、動画像要約情報生成装置、および要約情報生成方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2001508725A Division JP4027662B2 (ja) 1999-06-30 2000-06-29 動画像検索装置、および動画像検索情報管理装置

Publications (3)

Publication Number Publication Date
JP2004104836A JP2004104836A (ja) 2004-04-02
JP2004104836A5 JP2004104836A5 (ja) 2007-06-21
JP4462922B2 true JP4462922B2 (ja) 2010-05-12

Family

ID=26502587

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2001508725A Expired - Fee Related JP4027662B2 (ja) 1999-06-30 2000-06-29 動画像検索装置、および動画像検索情報管理装置
JP2003434626A Expired - Fee Related JP4462922B2 (ja) 1999-06-30 2003-12-26 動画像検索情報生成装置、動画像要約情報生成装置、および要約情報生成方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2001508725A Expired - Fee Related JP4027662B2 (ja) 1999-06-30 2000-06-29 動画像検索装置、および動画像検索情報管理装置

Country Status (8)

Country Link
US (2) US7092040B1 (ja)
EP (2) EP1195692B1 (ja)
JP (2) JP4027662B2 (ja)
KR (1) KR100486047B1 (ja)
CN (1) CN1371502B (ja)
DE (1) DE60036288T2 (ja)
ES (1) ES2288859T3 (ja)
WO (1) WO2001003005A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021002719A1 (ko) * 2019-07-03 2021-01-07 한국과학기술원 비디오 처리 방법 및 장치

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7075683B1 (en) * 1999-02-15 2006-07-11 Canon Kabushiki Kaisha Dynamic image digest automatic editing system and dynamic image digest automatic editing method
DE60036288T2 (de) 1999-06-30 2008-05-29 Sharp K.K. Dynamisches bildsuch-informations-aufzeichnungsgerät und dynamische bildsuchvorrichtung
US7996191B2 (en) * 2001-08-10 2011-08-09 Jon Milton Foster Property development utilizing structure depicted in a motion picture or television show
US7167574B2 (en) 2002-03-14 2007-01-23 Seiko Epson Corporation Method and apparatus for content-based image copy detection
JP2004234613A (ja) * 2002-12-02 2004-08-19 Nec Corp 映像記述システムおよび方法、映像識別システムおよび方法
US7532804B2 (en) 2003-06-23 2009-05-12 Seiko Epson Corporation Method and apparatus for video copy detection
EP1498848A3 (en) * 2003-07-18 2007-03-07 Samsung Electronics Co., Ltd. GoF/GoP texture description, and texture-based GoF/GoP retrieval
US7856054B1 (en) * 2003-11-14 2010-12-21 Apple Inc. Scene change identification during encoding of compressed video
JP4699476B2 (ja) * 2005-10-27 2011-06-08 三菱電機株式会社 映像要約装置
US8009861B2 (en) * 2006-04-28 2011-08-30 Vobile, Inc. Method and system for fingerprinting digital video object based on multiresolution, multirate spatial and temporal signatures
US20090079840A1 (en) * 2007-09-25 2009-03-26 Motorola, Inc. Method for intelligently creating, consuming, and sharing video content on mobile devices
US8174579B2 (en) * 2008-08-22 2012-05-08 Panasonic Corporation Related scene addition apparatus and related scene addition method
JP4725690B2 (ja) 2009-01-23 2011-07-13 日本電気株式会社 映像識別子抽出装置
US8731292B2 (en) * 2011-01-07 2014-05-20 Alcatel Lucent Method and apparatus for comparing videos
CN102595116B (zh) 2011-01-14 2014-03-12 华为技术有限公司 多图像块划分的编解码方法和装置
JP5798497B2 (ja) * 2012-01-20 2015-10-21 ルネサスエレクトロニクス株式会社 移動量検出装置、移動体検出装置及び移動量検出方法
JP2013210845A (ja) * 2012-03-30 2013-10-10 Secom Co Ltd 移動物体照合装置
CN113632493A (zh) * 2019-03-13 2021-11-09 北京字节跳动网络技术有限公司 变换跳过模式中的子块变换
KR102364628B1 (ko) * 2019-07-03 2022-02-18 한국과학기술원 비디오 처리 방법 및 장치
US20230171328A1 (en) * 2021-12-01 2023-06-01 Tencent America LLC Method and apparatus for split rendering for lightfield/immersive media using proxy edge cloud architecture

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3060433B2 (ja) * 1991-08-12 2000-07-10 日本電信電話株式会社 動きベクトル算出方法
JPH06153146A (ja) * 1992-11-04 1994-05-31 Matsushita Electric Ind Co Ltd 動画像のシーンチェンジ検出装置および編集装置
JPH0738842A (ja) 1993-06-29 1995-02-07 Toshiba Corp 動画編集装置
US5719643A (en) * 1993-08-10 1998-02-17 Kokusai Denshin Denwa Kabushiki Kaisha Scene cut frame detector and scene cut frame group detector
JPH07152779A (ja) * 1993-11-29 1995-06-16 Toshiba Corp 動画インデックス検出処理方法及び動画インデックス検出処理機能を持つ動画処理装置
US5805733A (en) * 1994-12-12 1998-09-08 Apple Computer, Inc. Method and system for detecting scenes and summarizing video sequences
US5485611A (en) * 1994-12-30 1996-01-16 Intel Corporation Video database indexing and method of presenting video database index to a user
US5779108A (en) * 1995-06-15 1998-07-14 Calmar Inc. Pressure venting trigger sprayer
JP3597271B2 (ja) * 1995-09-19 2004-12-02 Kddi株式会社 動画像のカット点画像検出装置
US5819286A (en) * 1995-12-11 1998-10-06 Industrial Technology Research Institute Video database indexing and query method and system
JPH09182019A (ja) * 1995-12-26 1997-07-11 Sony Corp 映像信号記録装置及び再生装置
US5661524A (en) * 1996-03-08 1997-08-26 International Business Machines Corporation Method and apparatus for motion estimation using trajectory in a digital video encoder
JPH09284702A (ja) 1996-04-09 1997-10-31 Oki Electric Ind Co Ltd シーン変化フレーム検出方法および装置
DE19618625C1 (de) * 1996-05-09 1997-10-23 Daimler Benz Ag Flüssigkeitsgekühlter Kolben für Verbrennungsmotoren
US5778108A (en) * 1996-06-07 1998-07-07 Electronic Data Systems Corporation Method and system for detecting transitional markers such as uniform fields in a video signal
US6400853B1 (en) * 1997-03-19 2002-06-04 Canon Kabushiki Kaisha Image retrieval apparatus and method
US6427048B2 (en) * 1997-04-28 2002-07-30 Sony Corporation Apparatus and method for recording, reproducing and displaying a video signal received by a signal receiver
JP3780623B2 (ja) * 1997-05-16 2006-05-31 株式会社日立製作所 動画像の記述方法
US6125229A (en) * 1997-06-02 2000-09-26 Philips Electronics North America Corporation Visual indexing system
JPH11103441A (ja) * 1997-09-26 1999-04-13 Matsushita Electric Ind Co Ltd クリップ表示方法とその表示装置
DE60036288T2 (de) 1999-06-30 2008-05-29 Sharp K.K. Dynamisches bildsuch-informations-aufzeichnungsgerät und dynamische bildsuchvorrichtung

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021002719A1 (ko) * 2019-07-03 2021-01-07 한국과학기술원 비디오 처리 방법 및 장치

Also Published As

Publication number Publication date
CN1371502A (zh) 2002-09-25
JP2004104836A (ja) 2004-04-02
JP4027662B2 (ja) 2007-12-26
EP1195692B1 (en) 2007-09-05
KR100486047B1 (ko) 2005-05-03
ES2288859T3 (es) 2008-02-01
EP1195692A1 (en) 2002-04-10
DE60036288D1 (de) 2007-10-18
US7884884B2 (en) 2011-02-08
EP1835421A2 (en) 2007-09-19
US20060164560A1 (en) 2006-07-27
KR20020019482A (ko) 2002-03-12
CN1371502B (zh) 2010-05-05
US7092040B1 (en) 2006-08-15
WO2001003005A1 (fr) 2001-01-11
EP1195692A4 (en) 2004-04-21
DE60036288T2 (de) 2008-05-29
EP1835421A3 (en) 2009-04-22

Similar Documents

Publication Publication Date Title
JP4462922B2 (ja) 動画像検索情報生成装置、動画像要約情報生成装置、および要約情報生成方法
EP1024444B1 (en) Image information describing method, video retrieval method, video reproducing method, and video reproducing apparatus
KR100492437B1 (ko) 화상 검색 시스템 및 화상 검색 방법
KR100986401B1 (ko) 콘텐츠 처리 방법
JP3612227B2 (ja) 物体抽出装置
WO2000045600A1 (en) Method of image feature encoding and method of image search
US7266771B1 (en) Video stream representation and navigation using inherent data
EP0470194A1 (en) Method and apparatus for manipulating digital video data
JPH10320400A (ja) 映像の検索方法および装置
CN101401060A (zh) 内容访问树
JP3930504B2 (ja) 物体抽出装置
CN102682817B (zh) 剧本编辑装置、方法和系统以及图像拍摄装置及其控制方法
JP2009004999A (ja) 映像データ管理装置
JPWO2014065033A1 (ja) 類似画像検索装置
CN102663715A (zh) 超分辨率方法和装置
JP2008166895A (ja) 映像表示装置及びその制御方法、プログラム、記録媒体
US20060078308A1 (en) Video reproducing apparatus
KR100540748B1 (ko) 내용 기반 검색을 위한 개선된 질의 방법 및 그 방법을구현하기 위한 프로그램을 저장한 기록매체
JP2824994B2 (ja) カラー画像処理装置
US6341294B1 (en) Image processing apparatus for retrieving moving image data
JP4652389B2 (ja) メタデータ処理方法
JP3499729B2 (ja) 複数映像の時空間統合、管理方法及びその装置並びにそのプログラムを記録した記録媒体
JP2004336808A (ja) 映像の検索方法および装置
JP3594754B2 (ja) 映像の時空間管理・表示・アクセス方法及び装置
JP2005173897A (ja) 画像処理装置及び画像処理方法及びプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070508

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100209

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100216

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140226

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees