JP2011151647A - シーン検索装置、シーン検索方法、およびシーン検索プログラム - Google Patents

シーン検索装置、シーン検索方法、およびシーン検索プログラム Download PDF

Info

Publication number
JP2011151647A
JP2011151647A JP2010011968A JP2010011968A JP2011151647A JP 2011151647 A JP2011151647 A JP 2011151647A JP 2010011968 A JP2010011968 A JP 2010011968A JP 2010011968 A JP2010011968 A JP 2010011968A JP 2011151647 A JP2011151647 A JP 2011151647A
Authority
JP
Japan
Prior art keywords
information
scene
resolution
search
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010011968A
Other languages
English (en)
Inventor
Tadaaki Nishino
匡昭 西埜
Atsushi Mizutome
敦 水留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010011968A priority Critical patent/JP2011151647A/ja
Publication of JP2011151647A publication Critical patent/JP2011151647A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)

Abstract

【課題】コンテンツ映像の解像度によって特定出演者の出演時間帯情報が異なることをユーザに通知し、コンテンツから適切なシーン検索を可能とする技術を提供する。
【解決手段】ユーザ入力部101は、ユーザからの検索条件などを入力する。番組情報デコード部108は、録画コンテンツに含まれる番組情報を抽出する。解像度別番組情報解析部109は、抽出した番組情報から解像度毎のシーン情報を作成する。解像度別シーン検索部110は、シーン情報からユーザが入力した検索条件に基づいた検索を実行し、解像度毎の特定番組検索結果情報を作成する。シーン画面作成部111は、解像度別シーン検索部110が作成した特定番組検索結果情報から結果表示画面を作成する。再生制御部112は、ユーザが指定したシーンの再生を制御する。
【選択図】図1

Description

本発明は、複数の画角を有するコンテンツから、特定のシーン検索を行うことが可能なシーン検索装置、シーン検索方法、およびシーン検索プログラムに関する。
近年、H.264/SVC(Scalable Video Coding)のように、スケーラブル映像符号化技術が検討されている。H.264/SVCとはH.264/AVC(Advanced Video Coding)の拡張機能であり、複数の解像度レイヤによって構成されている。H.264/SVCでは、解像度レイヤを組み合わせることにより、複数の解像度で映像を復号することができる。たとえば、H.264/SVCは、一つのコンテンツに対して、垂直画素数480ピクセル、水平画素数640ピクセルのStandard Definition(以下SDという)の解像度の映像を階層化して符号化することができる。また、垂直画素数1080ピクセル、水平画素数1920ピクセルのHigh Definition(以下HDという)の解像度の映像を階層化して符号化することができる。さらに、垂直画素数2160ピクセル、水平画素数4096ピクセルの4K2Kなどの解像度の映像を階層化して符号化することもできる。
また、近年、コンテンツから特定のシーンを検索するシーン検索技術も注目されている(たとえば、特許文献1,2を参照。)。ここで、シーン検索とはコンテンツに対して、特定の人物などが出演している映像の開始終了時間(以下、出演時間帯情報という)を検索する技術である。たとえば、特許文献1には、コンテンツから特定シーンを検索するものとして、時間帯情報を含む番組情報からユーザが指定する特定の情報を検索する技術が開示されている。また、特許文献2には、字幕情報を解析し、ユーザが指定する特定の情報を検索し時間軸とともに表示する技術が開示されている。
特開2009−55643号公報 特開2008−294584号公報
ところで、H.264/SVCでは、解像度が異なる映像を階層化して符号化しているため、解像度によって映っている画角が異なることも考えられる(たとえば、SDにおける顔のアップや、4K2Kにおける全景映像など)。このように解像度によって画角が異なることは、H.264/SVCコンテンツに対してシーン検索を行う場合、ユーザが視聴中の映像の解像度によって該当するシーンの時間帯情報が異なってくるおそれが生じる。上述した従来技術では、映像の画角の違いによって時間帯情報が異なることは想定されていないため、シーン検索に支障をきたすことになる。
本発明は、上述した従来技術による問題点を解消するため、コンテンツ映像の解像度によって特定出演者の出演時間帯情報が異なることをユーザに通知し、コンテンツから適切なシーン検索を可能とする技術を提供することを目的とする。さらに、解像度と時間帯情報とを自由に組み合わせてコンテンツ映像の再生を行うことで、所望のシーン検索を容易に実行することが可能な技術を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明にかかるシーン検索装置は、画角の異なる複数の解像度の映像からシーン検索を行うシーン検索装置であって、シーン検索を行うための検索条件を入力するユーザ入力手段と、映像データから番組情報を含むセクションデータを分離する信号分離手段と、前記信号分離手段により分離された前記セクションデータのデコードを行い、番組情報を抽出する番組情報デコード手段と、前記番組情報デコード手段により抽出された番組情報の解析を行い、番組名、解像度情報、解像度毎の出演者、出演者毎の出演時間帯情報を含む情報が関連付けられたシーン情報を作成する解像度別番組情報解析手段と、前記解像度別番組情報解析手段により作成されたシーン情報に対して、前記ユーザ入力手段により入力された検索条件に基づいた検索を実行し、前記検索条件と一致する番組名、解像度情報、出演者、当該出演者の出演時間帯情報を含む特定番組検索結果情報を作成する解像度別シーン検索手段と、前記解像度別シーン検索手段により作成された特定番組検索結果情報をユーザに提示するための結果表示画面を作成するシーン画面作成手段と、を備えていることを特徴とする。
本発明によれば、映像コンテンツから特定のシーン検索を行う際、映像コンテンツの解像度毎に特定出演者の出演時間帯情報が異なることをユーザが容易に認識することができ、適切なシーン検索が可能になる。さらに、ユーザが視聴したいコンテンツの解像度と時間帯情報とを自由に組み合わせてコンテンツ映像の再生を行うことで、所望のシーン検索を容易に実行することが可能になる。
第1実施形態のシーン検索装置の構成を示すブロック図である。 第1実施形態に適用されるH.264/SVCの解像度レイヤ毎に設定される画角の違いについての説明ための図である。 第1実施形態のシーン情報について説明するための図である。 第1実施形態によるシーン情報作成の手順を示すフローチャートである。 第1実施形態によるシーン検索の手順を示すフローチャートである。 特定番組検索結果情報の一例を示す図である。 結果表示画面の一例を示す図である。 第1実施形態によるシーン再生処理の手順を示すフローチャートである。 第2実施形態にかかるシーン検索装置の構成を示すブロック図である。 第3実施形態によるシーン再生処理の手順を示すフローチャートである。
以下、添付図面を参照して、本発明にかかるシーン検索装置、シーン検索方法、およびシーン検索プログラムの好適な実施形態を詳細に説明する。
(第1実施形態)
本実施形態では、動画像コンテンツからシーン検索を行う。検索対象の動画像コンテンツデータは、Moving Picture Experts Group−2 Transport Stream(以下、MPEG−2 TSという)のストリームデータである。MPEG−2 TSにはH.264/SVCで符号化された映像データ、音声データ、セクションデータが多重化されている。そこで、まず、図2を参照して、本実施形態に適用されるH.264/SVC(Scalable Video Coding)の映像符号化の構成について説明する。
H.264/SVCコンテンツ20は、複数の階層構造に相当する複数の解像度レイヤによって構成されている。解像度レイヤは、ベースレイヤとエンハンスレイヤ1,2の2種類に分けられる。ベースレイヤとエンハンスレイヤ1,2を組み合わせることにより、復号映像21〜23に示すように複数の解像度で映像を復号することができる。この場合、ベースレイヤのみを復号することで復号映像21は低解像度映像となり、ベースレイヤに加えてエンハンスレイヤ1,2を復号することで高解像度映像となる。
本実施形態に適用されるH.264/SVCでは、SD(Standard Definition)、HD(High Definition)、4K2Kの3種類の解像度レイヤで映像が復号される。ベースレイヤのみを復号した場合は、SD解像度の復号映像21が生成される。ベースレイヤとエンハンスレイヤ1で復号した場合は、HD解像度の復号映像22が生成される。ベースレイヤとエンハンスレイヤ1,2で復号した場合は、4K2K解像度の復号映像が生成される。つまり、どのレイヤを復号するかによって、任意の解像度の映像データが得られる。以下、ベースレイヤとエンハンスレイヤを総称してレイヤと呼ぶこととする。
次に、第1実施形態に適用されるH.264/SVCの解像度レイヤ毎に設定される画角の違いについて説明する。H.264/SVCでは、ベースレイヤの復号映像21に対して、エンハンスレイヤ1,2の復号映像22、23の上下左右フレーム端点のオフセット位置を定義することができる。そのため、ベースレイヤの復号映像の画角31とエンハンスレイヤ1,2を含めた復号映像の画角32、33とで異なる画角を定義することができる。なお、フレーム端点のオフセット位置は、シーケンス全体の符号化に関わる情報が記述されているシーケンス・パラメータ・セットや、スライスの符号化に関わる情報が記述されているプリフィックスNALユニットで定義される。
このように、第1実施形態に適用されるH.264/SVCでは、復号される解像度レイヤの組み合わせによって、異なる画角が設定される。そのため、復号映像21〜23間で復号映像上に表示される人物等の情報が異なる。例えば、SD解像度の映像(復号映像21)には出演者A、HD解像度の映像(復号映像22)には出演者A,B、4K2K解像度の映像(復号映像23)には出演者A,B,Cが映っている。このように視聴する解像度の映像によって映っている出演者などの情報が異なるため、レイヤ毎に異なる番組情報が付加される。
ところで、番組情報とは番組に関連するイベント識別子、番組名、放送日、番組内容、レイヤ識別子、解像度情報、出演者、当該出演者の出演時間帯情報が関連付けられた情報である。番組情報はセクションデータのService Information(以下SIという)に含まれるEvent Information Table(以下EITという)に記述される。H.264/SVCではレイヤ毎に出演者が違う可能性があるため、レイヤ毎に出演者、出演者に対応する出演時間帯情報が存在する。例えば、番組識別子はevent_id、レイヤ識別子はdependency_idが記述されている。dependency_idとはH.264/SVCでレイヤを識別することができる情報である。解像度情報はdependency_idに対応する解像度の情報が記述されている。出演時間帯情報は特定の出演者が出演している番組開始からの出演開始時間と出演終了時間の情報である。
次に、図3を参照して、本実施形態で作成、利用するシーン情報について説明する。シーン情報40は、番組毎のイベント識別子41、番組名42、総録画時間43、レイヤ識別子44、解像度情報45、解像度毎の出演者46、出演者毎の出演時間帯情報47が関連付けられたテーブルである。セクションデータのSIに含まれるEITに記述されている番組情報を解析することでシーン情報40を作成する。このシーン情報40を参照することで、特定番組毎のイベント識別子、番組名、総録画時間、レイヤ識別子、解像度情報などを検索することができる。また、特定番組のシーン情報を参照することで、解像度毎の出演者、出演者毎の出演時間帯情報を検索することができる。詳細は後述する。
次に、本実施形態のシーン検索装置の構成について説明する。図1は、本発明の第1実施形態にかかるシーン検索装置100の構成を示すブロック図である。
ユーザ入力部101は、リモコンから受信した信号に基づいて、後述する録画制御部102、解像度別シーン検索部110、再生制御部112の制御を行う。ユーザ入力部101は、録画指示、録画チャンネル情報などの録画に関する信号を受信した場合は、録画チャンネル情報を録画制御部102へ出力する。検索指示、検索条件(番組名、検索文字列)などの検索に関する信号を受信した場合は、検索条件を解像度別シーン検索部110へ出力する。また、再生指示、移動指示などの再生に関する信号を受信した場合は、移動指示情報を再生制御部112へ出力する。
録画制御部102は、ユーザ入力部101から入力された録画チャネル情報に基づき、映像信号の録画制御を行う。録画制御部102は、ユーザ入力部101から入力された録画チャンネル情報を、信号受信部103へ出力し、信号受信部103から前記録画チャンネル情報に対応するMPEG2−TSデータを受け取る。録画制御部102は、受け取ったMPEG2−TSデータを記録部105に出力する。信号受信部103は、録画制御部102から入力された録画チャンネル情報に対応する周波数を選択し、アンテナ、通信から入力された映像信号の復調処理を行い、MPEG2−TSデータを作成する。信号受信部103は、生成したMPEG2−TSデータを録画制御部102へ出力する。
信号分離部104は、再生制御部112から入力されたイベント識別子、出演時間帯情報を基に、記録部105からイベント識別子、出演時間帯情報に対応するMPEG2−TSデータを取り出す。信号分離部104は、取り出したMPEG2−TSデータを、映像Elementary Stream(以下映像ESという)、音声Elementary Stream(以下音声ESという)、番組情報を含むセクションデータに分離する。そして、映像ESを映像デコード部107へ、音声ESを音声デコード部106へ、セクションデータを番組情報デコード部108へそれぞれ出力する。
記録部105は、録画制御部102から入力されたMPEG2−TSデータ、解像度別番組情報解析部109から入力されたシーン情報を蓄積する。音声デコード部106は、信号分離部104から入力された音声ESをデコードし、音声データを作成する。音声デコード部106は、作成した音声データをスピーカーに出力する。映像デコード部107は、信号分離部104から入力された映像ESに対して、再生制御部112から入力されたレイヤ識別子に対応するレイヤのデコードを行い、レイヤ識別子に対応する映像データを作成し、映像データを表示合成部113へ出力する。番組情報デコード部108は、信号分離部104から入力されたセクションデータのデコードを行い、番組情報を作成し、作成した番組情報を解像度別番組情報解析部109へ出力する。解像度別番組情報解析部109は、番組情報デコード部108から入力された番組情報の解析を行い、解像度毎のシーン情報を作成し、作成したシーン情報を記録部105へ出力する。
解像度別シーン検索部110は、記録部105からシーン情報を取り出し、ユーザ入力部101から入力された検索条件情報に一致する情報を解像度毎に検索し、特定番組検索結果情報を作成する。解像度別シーン検索部110は、特定番組検索結果情報をシーン画面作成部111へ出力する。なお、特定番組検索結果情報についての詳細は、後述する。 シーン画面作成部111は、解像度別シーン検索部110から入力された特定番組検索結果情報を基に結果表示画面を作成し、作成した結果表示画面を表示合成部113へ出力する。
再生制御部112は、ユーザ入力部101から入力された移動指示とシーン画面作成部111が作成した結果表示画面に基づき、再生するシーンを特定する。そして、シーンに対応するイベント識別子、時間帯情報を信号分離部104へ出力し、レイヤ識別子を映像デコード部107へ出力する。表示合成部113は、映像デコード部107から入力された映像データと、シーン画面作成部111から入力された結果表示画面とを合成し、合成データを表示装置へ出力する。
続いて、本実施形態のシーン検索装置100によるシーン情報作成の手順を説明する、図4は、本発明の第1実施形態にかかるシーン検索装置100によるシーン情報作成の手順を示すフローチャートである。まず、信号分離部104が、記録部105から記録したMPEG2−TSデータを取り出し、このMPEG2−TSデータからセクションデータを分離する(ステップS101)。ここで分離されたセクションデータは番組情報デコード部108へ送られる。次に、番組情報デコード部108が、信号分離部104から受け取ったセクションデータをデコードし、番組情報を取り出す(ステップS102)。ここで取り出された番組情報は、解像度別番組情報解析部109へ送られる。
続いて、解像度別番組情報解析部109が、番組情報に含まれるすべての解像度のシーン情報が作成されているか否かを判断する(ステップS103)。ここですべての解像度のシーン情報が作成されていない場合(ステップS103:No)は、解像度別番組情報解析部109が、シーン情報が作成されていない解像度に対応する番組情報を解析し、解像度毎のシーン情報を作成する(ステップS104)。ここで作成されるシーン情報は、図3に示されたシーン情報40が該当する。すなわち、解像度別番組情報解析部109は、番組情報のevent_idをイベント識別子41へ格納する。また、番組名を番組名42へ格納する。さらに、録画時間の総時間を求め、求めた総時間を総録画時間43へ格納する。dependency_idをレイヤ識別子44へ格納する。解像度情報を解像度情報45へ格納する。出演者を出演者46へ格納する。当該出演者の出演者時間帯情報を時間帯情報47へ格納する。
より具体的には、例えば、図3において、番組A、解像度SDのシーン情報を作成する場合、解像度別番組情報解析部109は、イベント識別子41に「0」を格納する。続けて、番組名42に「番組A」を格納する。総録画時間43に「5分」を格納する。レイヤ識別子44に「0」を格納する。解像度情報45にイベント識別子「0」に対応する「SD」を格納する。出演者46に出演者名、例えば「aさん」、「bさん」を格納する。時間帯情報47に出演者「aさん」の出演時間帯、例えば「30秒〜1分12秒、2分〜3分10秒」、出演者「bさん」の出演時間帯、例えば「0秒〜20秒、30秒〜1分12秒」を格納する。以上のような処理を行うことで、解像度毎のシーン情報40が作成される。この後、解像度別番組情報解析部109は、解析していない解像度があるのかを確認するため再度ステップS103の処理を行う。一方、ステップS103においてすべての解像度のシーン情報が作成されている場合(ステップS103:Yes)は、解像度別番組情報解析部109が、作成されたすべての解像度のシーン情報40を記録部105へ送り、保存する(ステップS105)。
次に、本実施形態にかかるシーン検索装置によるシーン検索の手順を説明する。図5は、本発明の第1実施形態にかかるシーン検索装置によるシーン検索の手順を示すフローチャートである。まず、ユーザ入力部101が、リモコンから検索条件(番組名、検索文字列)、検索指示を受け取る(ステップS201)。そして、ユーザ入力部101は、検索指示を基に検索を行うと判断し、番組名、検索文字列を解像度別シーン検索部110へ送る。例えば、ユーザ入力部101が、リモコンから番組名「番組A」、検索文字列「aさん」を受け取った場合には、「番組A」、「aさん」を解像度別シーン検索部110へ送る。
次に、解像度別シーン検索部110が、シーン情報の番組名とユーザ入力部101から入力された番組名とが一致するか否かを判断する(ステップS202)。ここで、入力された番組名と比較するのは、図4に示されたフローチャートの手順によって作成されたシーン情報の番組名42である(図3参照)。ステップS202においてシーン情報の番組名と入力された番組名とが一致しない場合(ステップS202:No)は、解像度別シーン検索部110は、該当するシーンがない旨を表示部に表示し、ユーザに通知する(ステップS203)。この後、再度ステップS201の処理を行う。
一方、ステップS202においてシーン情報の番組名と入力された番組名とが一致する場合(ステップS202:Yes)は、解像度別シーン検索部110が、ユーザ入力部101から入力された番組名に対応するシーン情報を取り出す(ステップS204)。例えば、解像度別シーン検索部110が、シーン情報の番組名42と「番組A」が一致するシーン情報を取り出す。次に、解像度別シーン検索部110が、シーン情報に含まれる解像度の映像内のすべての出演者を検索したか否かを判断する(ステップS205)。
ステップS205においてすべての出演者を検索していない場合(ステップS205:No)は、解像度別シーン検索部110が、検索していない解像度の映像に対応する出演者と検索文字列とが一致するか否かを判断する(ステップS206)。ここで、出演者と検索文字列とが一致しない場合(ステップS206:No)は、再度ステップS205の処理を実行する。
一方、ステップS206において出演者と検索文字列とが一致する場合(ステップS206:Yes)は、解像度別シーン検索部110が、特定番組検索結果情報を作成する(ステップS207)。この特定番組検索結果情報は、シーン情報から出演者と検索文字列と一致するイベント識別子、番組名、総録画時間、レイヤ識別子、解像度情報、出演者、時間帯情報を取り出して作成されるものである。この特定番組検索結果情報が後に行う処理で用いるシーン情報になる。この特定番組検索結果情報の一例を図6に示す。特定番組検索結果情報50は、ユーザが入力した番組名に基づき、検索文字列に対応するイベント識別子51、番組名52、総録画時間53、レイヤ識別子54、解像度情報55、解像度毎の出演者56、出演者毎の出演時間帯情報57を関連付けたテーブルである。この特定番組検索結果情報50は、図3に示したシーン情報40に対応するものである。特定番組検索結果情報50が作成された後は、再度ステップS205の処理が実行される。
ステップS205においてすべての出演者を検索した場合(ステップS205:Yes)は、解像度別シーン検索部110が、検索文字列と出演者とが一致するか否かを判断する(ステップS208)。ここで検索文字列と出演者とが一致しない場合(ステップS208:No)は、ステップS203へ移行する。ステップS208において検索文字列と出演者とが一致する場合(ステップS208:Yes)は、シーン画面作成部111が、シーン情報(特定番組検索結果情報)に基づき、結果表示画面を作成する(ステップS209)。
ここで、図7を参照し、ステップS209の処理により作成される結果表示画面の一例について説明する。結果表示画面60は、特定番組、特定の検索条件の番組名61、レイヤ毎の解像度情報62、レイヤ毎の再生時間63、レイヤ毎の特定出演者の出演時間帯情報64が認識可能な画面である。本実施形態では、図6に示した番組名52の「番組A」を基に番組名61を、解像度情報55の「SD」、「HD」、「4K2K」を基に解像度62を、出演時間帯情報57に含まれる時間情報の合計を求め再生時間63を作成する。さらに、総録画時間53の「5分」と出演時間帯情報57の時間情報を基に、総時間バー65、時間帯バー66を図式化して作成する。時間帯バー66は、総時間バー65に対して、出演者の出演時間帯を相対的に示すように図式化されたものである。このようにして結果表示画面60が得られる。最後に、表示合成部113がステップS209で作成された結果表示画面60を表示装置に表示する(ステップS210)。なお、総時間バー65及び時間帯バー66は帯状の図式に限られず、円状などの他の図式であってもよい。
以上のような処理を行うことにより、MPEG2−TSデータ中に含まれる番組情報が解析される。そして、すべての録画コンテンツのイベント識別子、番組名、総録画時間、レイヤ識別子、解像度情報、出演者、当該出演者の時間帯情報を管理し、シーン検索を行うことができる。
次に、ユーザ入力部101から入力された移動指示とシーン画面作成部111が作成した結果表示画面に基づき特定されるシーンの再生処理について説明する。図8は、本発明の第1実施形態にかかるシーン検索装置によるシーン再生処理の手順を示すフローチャートである。まず、ユーザ入力部101が、リモコンから移動指示、再生指示を受ける(ステップS301)。ここで、ユーザ入力部101は、再生指示を基に再生を行うと判断し、移動指示を再生制御部112へ送る。
次に、再生制御部112が、シーン画面作成部111が作成した結果表示画面60とユーザ入力部101から受け取った移動指示に基づき、再生時間63を選択しているか時間帯バー66を選択しているかを判断する(ステップS302)。ステップS302において再生時間63が選択されている場合は、再生制御部112が、イベント識別子と、選択された再生時間に対応する出演時間帯情報と、再生時間に対応するレイヤ識別子を取得する(ステップS303)。例えば、図7に示した例において、再生時間63の「1分52秒」が選択された場合を考える。このときは、図6に示した例における、イベント識別子「0」と、「1分52秒」に対応するレイヤ識別子54「0」と、出演時間帯情報57「30秒〜1分12秒、2分〜3分10秒」を取得する。
一方、ステップS302において時間帯バー66が選択されている場合は、再生制御部112が、イベント識別子と、選択された時間帯バーに対応する出演時間帯情報と、時間帯バーに対応するレイヤ識別子を取得する(ステップS304)。例えば、図7に示した例において、SD解像度の2つ目の時間帯バーが選択された場合を考える。このときは、図6に示した例における、イベント識別子「0」と、時間帯バーに対応するレイヤ識別子54「0」と、出演時間帯情報57に含まれる「2分〜3分10秒」を取得する。
続いて、再生制御部112が、取得したイベント識別子と出演時間帯情報を信号分離部104へ、レイヤ識別子を映像デコード部107へ渡す(ステップS305)。ステップS303、ステップS304で取得した例に基づいて示すと、イベント識別子「0」、出演時間帯情報「2分〜3分10秒」を信号分離部104へ、レイヤ識別子「0」を映像デコード部107へ渡す。
次に、信号分離部104が、再生制御部112からイベント識別子と出演時間帯情報を受け取り、記録部105からイベント識別子と出演時間帯情報に対応するMPEG2−TSデータを取り出す(ステップS306)。ここでは、イベント識別子「0」に対応するMPEG2−TSデータを特定し、出演時間帯情報「2分〜3分10秒」に対応するMPEG2−TSデータを切り出す。そして、信号分離部104は取り出したMPEG2−TSデータを映像ES、音声ESに分離し、映像ESを映像デコード部107へ、音声ESを音声デコード部106へ渡す。
さらに、映像デコード部107が、信号分離部104から受け取ったから映像ESと再生制御部112から受け取ったレイヤ識別子とを基に、映像をデコードし、映像データを作成する(ステップS307)。例えば、レイヤ識別子「0」に対応するレイヤを映像ESから取り出し、映像のデコードを行う。そして、映像デコード部107は、作成した映像データを表示合成部113へ渡す。
最後に、映像、音声の出力を行う(ステップS308)。具体的には、表示合成部113が、映像デコード部107から受け取った映像データを表示装置に渡し、映像表示を行う。また、音声デコード部106が、受け取った音声ESをデコードし、スピーカーから音声を発生させる。
以上説明したように、第1実施形態では、録画したMPEG2−TSデータ中に含まれる番組情報を解析し、シーン情報を作る。これにより、すべての録画コンテンツのイベント識別子、番組名、総録画時間、レイヤ識別子、解像度情報、出演者、当該出演者の出演時間帯情報を管理することができ、シーン検索を容易に行うことができる。また、レイヤ毎にシーン検索結果を表示することで、レイヤ毎に再生可能なシーンがあることをユーザが認識できるようになり、ユーザがシーンを選択し再生を行うことができる。
なお、本実施形態では、記録部105がシーン検索装置100に内蔵されている例を示したが、光ディスクやシリコンディスクなど可搬ストレージや、通信手段によって接続される外部のストレージとしてもよい。また、本実施形態では、アンテナ、通信から映像を録画し、録画したデータに対して検索を行う例を示したが、録画データは他の録画装置により録画されたデータであってもよい。
(第2実施形態)
第1実施形態では、セクションデータに含まれる番組情報を解析し、シーン情報を作り、シーン検索を行う例を示した。この第2実施形態では、映像データを解析し、シーン情報を作る例を示す。
図9は、本発明の第2実施形態にかかるシーン検索装置の構成を示すブロック図である。本実施形態のシーン検索装置200は、番組情報を解析しシーン情報を作成する解像度別番組情報解析部109(図1参照)に代え、映像を解析し、シーン情報を作成する解像度別映像解析部201を備えたことが特徴である。以下、図9において、第1実施形態のシーン検索装置100と同様の機能を備えた構成部には同一の符号を付し、説明は省略する。
解像度別映像解析部201は、映像デコード部107からすべての解像度の映像を入力し、入力された映像に対して顔認識処理を行う顔認識手段を含み、映像内の登場する人物の特徴を抽出する。抽出した特徴と人物名が対応付けられた特徴とを比較し、特徴が近いと判断されれば、人物名が判別できる。この判断を例えば5秒単位で行い、特定の人物が映っている時間を特定し、解像度毎の出演者の出演時間帯情報を作成する。顔認識処理はすべての解像度、すべての人物に対して行い、シーン情報を作成する。なお、顔認識処理については、例えば特開2008−181303号公報に記載されている方法により行うことが可能であるが、映像に映っている人物名を特定することが可能な方法であればどのようなものでもよい。
以上のように、第2実施形態では、映像を解析することによりシーン情報を作成することができる。このため、H.264/SVCに番組情報が付加されていない場合でも、レイヤ毎に再生可能なシーンがあることをユーザが認識できるようになり、ユーザがシーンを選択し再生を行うことができる。
(第3実施形態)
第1実施形態および第2実施形態では、番組情報や映像データを解析してシーン情報を作り、シーン検索を行う例を示した。第3実施形態では、再生時にユーザがレイヤと特定出演者の出演時間帯情報を自由に組み合わせて再生する例を示す。なお、本実施形態を実現するための装置構成は、第1実施形態のシーン検索装置100と同様であるため、説明は省略する。
以下、本実施形態におけるシーン再生処理について説明する。図10は、本発明の第3実施形態にかかるシーン検索装置によるシーン再生処理の手順を示すフローチャートである。図10に示すフローチャートにおいて、ステップS401の処理は図8のステップS301の処理と同様であり、またステップS402の処理もステップS302と同様であるため、説明は省略する。また、図10のステップS406以降の処理は、図8のステップS305以降の処理と同じであるため、説明を省略する。
図10のステップS402において再生時間63が選択されている場合は、再生制御部112が、イベント識別子と、選択された再生時間に対応する出演時間帯情報を取得する(ステップS403)。例えば、図7に示した例において、再生時間63の「1分52秒」が選択された場合を考える。このときは、図6に示した例における、イベント識別子「0」と、出演時間帯情報57「30秒〜1分12秒、2分〜3分10秒」を取得する。
一方、ステップS402において時間帯バー66が選択されている場合は、再生制御部112が、イベント識別子と、選択された時間帯バーに対応する出演時間帯情報を取得する(ステップS404)。例えば、図7に示した例において、SD解像度の2つ目の時間帯バーが選択された場合を考える。このときは、図6に示した例における、イベント識別子「0」と、出演時間帯情報57に含まれる「2分〜3分10秒」を取得する。
続いて、再生制御部112が、映像に含まれるすべての解像度情報を表示し、どの解像度で再生するのかをユーザに選択させ、選択させた解像度に対応するレイヤ識別子を取得する(ステップS405)。例えば、再生制御部112は、どの解像度の映像を再生するのかをユーザに選択させるため「SD」「HD」「4K2K」を表示装置に表示する。そして、ユーザが解像度「4K2K」を選択した場合、解像度「4K2K」に対応するイベント識別子「2」を取得する。
以上のような処理により、再生時にユーザに解像度選択させることができるため、ユーザが所望する出演者の出演時間帯情報、解像度を自由に組み合わせることが可能になる。この結果、ユーザは所望の出演者の時間帯、解像度の映像を視聴することができる。なお、上記各実施形態で示した各工程は、ネットワークまたは各種記憶媒体を介して取得したソフトウェア(プログラム)をコンピュータ等の処理装置(CPU、プロセッサ)にて実行することで実現できる。
100,200 シーン検索装置
108 番組情報デコード部
109 解像度別番組情報解析部
110 解像度別シーン検索部
111 シーン画面作成部
201 解像度別映像解析部

Claims (6)

  1. 複数の解像度の映像からシーン検索を行うシーン検索装置であって、
    シーン検索を行うための検索条件を入力するユーザ入力手段と、
    映像データから番組情報を抽出する番組情報デコード手段と、
    前記番組情報デコード手段により抽出された番組情報の解析を行い、解像度情報、解像度毎の出演者、出演者毎の出演時間帯情報の少なくとも一つを含む情報が関連付けられたシーン情報を作成する解像度別番組情報解析手段と、
    前記解像度別番組情報解析手段により作成されたシーン情報に対して、前記ユーザ入力手段により入力された検索条件に基づいた検索を実行し、前記検索条件と一致する解像度情報、出演者、前記出演者の出演時間帯情報の少なくとも一つを含む特定番組検索結果情報を作成する解像度別シーン検索手段と、
    前記解像度別シーン検索手段により作成された特定番組検索結果情報をユーザに表示するための結果表示画面を作成するシーン画面作成手段と、
    を備えていることを特徴とするシーン検索装置。
  2. 前記シーン画面作成手段は、前記解像度ごとに前記出演者の出演時間帯情報を総時間に対して相対的に図式化して表示することを特徴とする請求項1記載のシーン検索装置。
  3. 前記出演者の人物の特徴を抽出する顔認識手段をさらに備え、
    前記解像度別番組情報解析手段は、前記顔認識手段が判別した出演者の出演時間帯情報に基づいて前記シーン情報を作成することを特徴とする請求項1記載のシーン検索装置。
  4. 再生すべき映像の解像度情報をユーザに選択させ、選択された前記解像度情報に関連付けられた前記出演者の出演時間帯情報によって特定される映像を再生する再生制御手段をさらに含むことを特徴とする請求項1記載のシーン検索装置。
  5. 複数の解像度の映像からシーン検索を行うシーン検索方法であって、
    シーン検索を行うための検索条件を入力するユーザ入力工程と、
    映像データから番組情報を抽出する番組情報デコード工程と、
    前記番組情報デコード工程により抽出された番組情報の解析を行い、解像度情報、解像度毎の出演者、出演者毎の出演時間帯情報の少なくとも一つを含む情報が関連付けられたシーン情報を作成する解像度別番組情報解析工程と、
    前記解像度別番組情報解析工程により作成されたシーン情報に対して、前記ユーザ入力工程により入力された検索条件に基づいた検索を実行し、前記検索条件と一致する解像度情報、出演者、前記出演者の出演時間帯情報の少なくとも一つを含む特定番組検索結果情報を作成する解像度別シーン検索工程と、
    前記解像度別シーン検索工程により作成された特定番組検索結果情報をユーザに表示するための結果表示画面を作成するシーン画面作成工程と、
    を備えていることを特徴とするシーン検索方法。
  6. 請求項5に記載のシーン検索方法をコンピュータに実行させることを特徴とするシーン検索プログラム。
JP2010011968A 2010-01-22 2010-01-22 シーン検索装置、シーン検索方法、およびシーン検索プログラム Pending JP2011151647A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010011968A JP2011151647A (ja) 2010-01-22 2010-01-22 シーン検索装置、シーン検索方法、およびシーン検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010011968A JP2011151647A (ja) 2010-01-22 2010-01-22 シーン検索装置、シーン検索方法、およびシーン検索プログラム

Publications (1)

Publication Number Publication Date
JP2011151647A true JP2011151647A (ja) 2011-08-04

Family

ID=44538239

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010011968A Pending JP2011151647A (ja) 2010-01-22 2010-01-22 シーン検索装置、シーン検索方法、およびシーン検索プログラム

Country Status (1)

Country Link
JP (1) JP2011151647A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011199525A (ja) * 2010-03-18 2011-10-06 Canon Inc チャプタ情報作成装置及びその制御方法
JP2016122884A (ja) * 2014-12-24 2016-07-07 株式会社東芝 電子機器、及び録画方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011199525A (ja) * 2010-03-18 2011-10-06 Canon Inc チャプタ情報作成装置及びその制御方法
JP2016122884A (ja) * 2014-12-24 2016-07-07 株式会社東芝 電子機器、及び録画方法

Similar Documents

Publication Publication Date Title
JP6493765B2 (ja) 情報処理装置および方法
KR100904098B1 (ko) 다수의 비디오 스트림의 리스팅 및 네비게이팅 방법, 장치및 시스템
US8655146B2 (en) Collection and concurrent integration of supplemental information related to currently playing media
JP5652642B2 (ja) データ生成装置およびデータ生成方法、データ処理装置およびデータ処理方法
JP2004357239A (ja) 映像システムの映像表示方法及び画像処理装置
JP2010028224A (ja) 映像処理装置
KR101537665B1 (ko) 콘텐츠 재생 방법 및 장치
US8989255B2 (en) Content reception apparatus and content reception apparatus control method
JP2011151647A (ja) シーン検索装置、シーン検索方法、およびシーン検索プログラム
JP2010016521A (ja) 映像処理装置および映像処理方法
JP4746952B2 (ja) 文書表示方法及び文書表示装置
JP2013026700A (ja) 映像コンテンツ選択装置及び映像コンテンツ選択方法
JP4285099B2 (ja) データ再生方法及びデータ再生装置
JP2008177679A (ja) 録画再生装置、そのデータ制御方法
JP2002330390A (ja) 録画装置
US8897616B2 (en) Apparatus and method for upconverting content data
KR101299245B1 (ko) 관심영역을 복호화하는 영상재생장치 및 그 방법
JP2002199348A (ja) 情報受信記録再生装置
US20120082435A1 (en) Moving image display device
JP5002293B2 (ja) 番組表示装置及び番組表示方法
JP2003244612A (ja) 動画処理装置および動画処理プログラム、記録媒体
JP2010283488A (ja) インターネット情報映像化収集装置
JP2011199525A (ja) チャプタ情報作成装置及びその制御方法
JP2006270793A (ja) ダイジェスト録画システム
JP2006148839A (ja) 放送装置、受信装置、及びこれらを備えるデジタル放送システム