JP5667773B2 - 情報作成装置及びその制御方法 - Google Patents

情報作成装置及びその制御方法 Download PDF

Info

Publication number
JP5667773B2
JP5667773B2 JP2010063244A JP2010063244A JP5667773B2 JP 5667773 B2 JP5667773 B2 JP 5667773B2 JP 2010063244 A JP2010063244 A JP 2010063244A JP 2010063244 A JP2010063244 A JP 2010063244A JP 5667773 B2 JP5667773 B2 JP 5667773B2
Authority
JP
Japan
Prior art keywords
video
information
angle
view
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010063244A
Other languages
English (en)
Other versions
JP2011199525A (ja
JP2011199525A5 (ja
Inventor
匡昭 西埜
匡昭 西埜
水留 敦
敦 水留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2010063244A priority Critical patent/JP5667773B2/ja
Priority to US13/043,143 priority patent/US9025930B2/en
Priority to CN2011100699370A priority patent/CN102196230B/zh
Publication of JP2011199525A publication Critical patent/JP2011199525A/ja
Publication of JP2011199525A5 publication Critical patent/JP2011199525A5/ja
Application granted granted Critical
Publication of JP5667773B2 publication Critical patent/JP5667773B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8211Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being a sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability

Description

本発明は、映像を頭出し再生するための情報を作成する情報作成装置及びその制御方法に関し、特にある映像の一部である部分映像を頭出し再生するための情報を作成する情報作成装置及びその制御方法に関する。
従来、ビデオカメラや放送波の録画装置などにおいて、記録中又は再生中の映像コンテンツのシーンの切り替わり位置などを検出し、検出した位置を特定する情報をチャプタ情報として作成することが知られている。チャプタ情報は、例えば映像コンテンツのデータに記録され、映像コンテンツの頭出し再生や編集操作などに利用される。
例えば、特許文献1には、映像コンテンツのフレーム間の差分から当該フレーム間のシーンの切り替わりを検出し、チャプタ情報を自動作成することが記載されている。
一方、映像コンテンツの階層符号化手法の例として、H.264/AVC(Advanced Video Coding)の拡張規格であるH.264/SVC(Scalable Video Coding)が規格化されている。階層符号化手法を用いると、一つの映像ストリームデータ中に複数の解像度の映像を階層化して符号化できる。例えば、同一の映像コンテンツについて、水平640画素、垂直480画素のSD解像度、水平4096画素、垂直2160画素の4K2K解像度など、複数の解像度の映像を階層化して1つのストリームデータに符号化することが出来る。
また、SD解像度の階層は顔のアップ、4K2K解像度の階層は人物の全体像など、階層間で画角を異ならせることも可能である。
特開2006−108729号公報
階層符号化された映像コンテンツに対して、従来のようにシーンの切り替わりを検出して自動的にチャプタ情報を作成する場合、階層間で画角が同じであれば、ある1つの階層で従来の手法を適用してチャプタ情報を作成し、全階層で共通利用することができる。
しかし、階層間で画角が異なる映像コンテンツの場合、ある階層でシーンが切り替わっても、他の階層ではシーンの切り替わりがない、といったことが起こりうる。例えば、高解像度の階層では複数の人物を含んだシーンの映像であり、低解像度の階層では複数の人物の一人の顔のアップの映像である場合を考える。この場合、高解像度の階層での映像に大きな変化が無くても、低解像度の階層が他の人物のアップに切り替わることが起こりうる。そのため、符号化階層で画角の異なる階層符号化がなされた映像コンテンツにおいては、画角の異なる階層ごとにチャプタ情報を作成する必要が生じる。
例えば特許文献1に記載された方法を用いてチャプタ情報を作成する場合、画角が異なる符号化階層ごとに映像を解析してシーンの切り替わりを検出する必要があり、処理が増加するという問題がある。特に、ある階層のシーン解析を行うにはその階層を復号する必要があるため、解析処理の増加以上に処理が増加する。
本発明はこのような従来技術の課題に鑑みなされたものである。本発明は、ある映像の一部である部分映像について、頭出し再生をするための情報を簡便な方法で生成する情報作成装置およびその制御方法を提供する。
上述の目的は、画角の異なる映像を含んだ複数の映像が階層符号化された映像のデータから、映像を頭出し再生するための所定の情報を作成する情報作成装置であって、データに含まれる複数の映像の画角情報に基づいて、複数の映像のうち、最広画角の映像の一部の映像である部分映像の空間的な位置を判別する判別手段と、判別された空間的な位置の一定期間における移動距離が所定の閾値以上である場合に、部分映像に対する所定の情報を作成する作成手段と、を有することを特徴とする情報作成装置によって達成される。
このような構成により、本発明によれば、ある映像の一部である部分映像について、頭出し再生をするための情報を簡便な方法で生成する情報作成装置およびその制御方法を提供できる。
本発明の実施形態に係るチャプタ情報作成装置の構成例を示すブロック図。 本発明で利用可能なH.264/SVC映像データストリームの構成例を示す図。 階層符号化される、画角が異なる映像の構成例を示す図。 本発明の実施形態における画角情報の具体例を示す図。 本発明の実施形態のチャプタ情報作成装置における狭画角画像に対するチャプタ情報作成動作を説明するフローチャート。 本発明の実施形態のチャプタ情報作成装置が作成するチャプタ情報テーブルの例を示す図。 狭画角映像の切り替わりの例を説明する図。
以下、本発明の例示的な実施形態について、図面を参照して詳細に説明する。
図1は、本発明の実施形態に係るチャプタ情報作成装置100の構成例を示すブロック図である。なお、本実施形態に係るチャプタ情報作成装置100は録画機器であるものとして説明するが、本発明は階層符号化された映像コンテンツを復号可能な任意の装置において実施可能である。ビデオレコーダやビデオカメラのような録画装置はもちろん、ビデオディスクプレーヤやメディアプレーヤのような、記録媒体に蓄積された符号化映像の再生装置や、これら録画装置や再生装置と同様の機能を有する任意の機器において好適に実施しうる。
図において、UI(User Interface)制御部101は、キーやボタン(図示せず)に対するユーザ操作を受信し、受信内容に基づいて録画制御部102の制御を行う。
録画制御部102は、UI制御部101の制御に基づき、外部から入力される映像コンテンツデータを記録部103に記録する。
本実施形態において、外部から入力される映像データはMoving Picture Experts Group-2 Transport Stream (以下、MPEG2 TS)形式のストリームデータであるとする。また、映像データには、音声データが音声Elementary Stream(以下音声ES)として、また階層符号化された映像データが映像Elementary Stream(以下映像ES)として多重化されているものとする。なお、映像ESは例えばH.264/SVC形式であるとする。階層符号化された映像データには、ベースレイヤと少なくとも1つのエンハンスレイヤが含まれる。ベースレイヤの映像とエンハンスレイヤの映像とが共通した画角を有する場合、ベースレイヤは映像コンテンツを再生するために最低限必要な情報を含み、エンハンスレイヤはベースレイヤによる映像の品質を向上させるためのデータを含む。本実施形態においては、少なくとも2つのレイヤ(ベースレイヤを含んでも含まなくてもよい)に、異なる画角の映像が符号化されているものとする。そして、異なる画角の映像は、最も画角の広い映像(最広画角映像)と、最広画角映像の一部の領域に対応する画角を有する映像であるものとする。さらに、説明及び理解を容易にするため、映像の空間解像度は各レイヤで同等であるものとする。
なお、録画制御部102が受信する映像コンテンツデータは、放送、記録媒体、ネットワークなどの各種伝送媒体を介して入力されてよい。放送により映像コンテンツデータが入力される場合には、例えば前段におけるチューナ(不図示)によって選局がなされているものとする。あるいは、録画制御部102がチューナを有しており、UI制御部101からのチャンネル選択指示によって特定のチャンネルのストリームデータを抽出してもよい。
録画制御部102はさらに、記録部103に記録した映像コンテンツデータを信号分離部104に出力する。
記録部103はハードディスクドライブ、Blu-rayディスクドライブ、半導体記憶装置などの記憶装置に、録画制御部102から入力されたMPEG2-TSデータを記録する。さらに、後述する狭画角チャプタ情報作成部108と共通チャプタ情報作成部111が作成したチャプタ情報テーブルを記憶装置に記録する。
信号分離部104は、録画制御部102から入力されたMPEG2-TSデータを映像ESと音声ESデータに分離し、映像ESデータを映像デコード部109と画角情報抽出部105へ、音声ESを音声デコード部112へそれぞれ出力する。
画角情報抽出部105は、信号分離部104から入力された映像ESに含まれる、符号化に関する情報から、階層符号化のベースレイヤの映像の画角情報、エンハンスレイヤの映像の画角のオフセット情報(ベースレイヤの画角との差分情報)を抽出する。このように、画角情報は、ベースレイヤという特定のレイヤの映像の画角情報と、特定のレイヤの映像以外のレイヤ(エンハンスレイヤ)の映像の画角情報とを有している。なお、後述するように、オフセット情報は、ベースレイヤの映像における、エンハンスレイヤの映像の相対的な位置を特定する情報である。具体的には、画角情報抽出部105は、映像ESのSPS(Sequence Parameter Set)からこれらの情報を抽出する。さらに画角情報抽出部105は、AU(Access Unit)からレイヤ識別子dependency_idを抽出する。画角情報抽出部105は、抽出したベースレイヤの画角情報、エンハンスレイヤの画角のオフセット情報、レイヤ識別子、を画角差判定部106へ出力する。
画角差判定部106は、画角情報抽出部105から入力されたベースレイヤの画角情報、エンハンスレイヤの画角のオフセット情報、レイヤ識別子を基に、エンハンスレイヤの画角情報を計算し、各レイヤの画角の大小を判定する。
画角差判定部106は、
レイヤの画角/最広画角レイヤの画角
が予め定められた閾値以下の場合は、ベースレイヤの画角情報、エンハンスレイヤの画角のオフセット情報、レイヤ識別子を画角位置判定部107へ出力する。さらに画角差判定部106は、最広画角レイヤ識別子を映像デコード部109へ出力する。このように、画角差判定部106は、レイヤのうち、最広画角レイヤの画角に対する比が閾値以下のレイヤ(狭画角レイヤ)を判別して画角位置判定部107に通知する。閾値の設定により、複数のレイヤのうち、移動距離によってチャプタを付与するレイヤ(画角)の範囲を変更することができる。
画角位置判定部107は、画角差判定部106からのベースレイヤの画角情報、エンハンスレイヤの画角のオフセット情報、最広画角レイヤ識別子を基に、最広画角レイヤの画角に対する比が閾値以下の画角の狭画角レイヤの映像の中心位置を順次算出する。そして、順次算出した中心位置から、一定時間における狭画角レイヤの中心の移動距離が予め定めた閾値以上ならば、画角位置判定部107は狭画角レイヤの映像のシーンが切り替わったと判断する。そして、画角位置判定部107は、狭画角チャプタ情報作成部108へ狭画角レイヤ識別子と、時間情報を出力する。この時間情報は、例えば最新の中心位置を算出した映像フレームに対応する時間情報である。
第1のチャプタ情報作成手段としての狭画角チャプタ情報作成部108は、画角位置判定部107から入力された狭画角レイヤ識別子、時間情報から、レイヤ識別子と時間情報を関連付けてチャプタ情報テーブルを作成し、記録部103へ保存する。
映像デコード部109は信号分離部104から入力された映像ESと画角差判定部106から入力された最広画角レイヤ識別子を基に、最広画角レイヤのデコードを行い、映像データを作成する。そして、映像デコード部109は、映像データを例えば表示装置である外部装置と、第2のチャプタ情報作成手段としての映像解析部110へ出力する。
映像解析部110は、従来の映像変化量識別技術を使い、映像デコード部109から入力された映像データを解析し、例えばフレーム間の差の大きさが閾値以上である場合に映像が切り替わったものと検出し、時間情報を共通チャプタ情報作成部111へ出力する。映像解析部110が映像の切り替わりを判定する処理は、映像の各フレームに対して行っても良いし、数フレームごとに行ってもよい。
共通チャプタ情報作成部111は、映像解析部110から入力された時間情報を、最広画角レイヤと狭画角レイヤのレイヤ識別子と関連付けてチャプタ情報テーブルを作成する。共通チャプタ情報作成部は、作成したチャプタ情報テーブルを記録部103へ保存する。なお、共通チャプタ情報作成部111は、映像解析部110から入力された時間情報を全てのレイヤ識別子と関連付けてチャプタ情報テーブルを作成してもよい。
音声デコード部112は、信号分離部104から入力された音声ESをデコードし、音声データを作成し、音声データをスピーカーに出力する。
図2を参照して、本実施形態で利用するH.264/SVCで符号化された映像データストリーム200の構成について説明する。ここでは、映像データストリーム200が、ベースレイヤと1つのエンハンスレイヤの2階層に階層符号化されているものとする。映像データストリーム200において、SPS(Sequence Parameter Set)201は、複数のピクチャをまとめたシーケンス全体の符号化に係る情報が含まれたヘッダである。また、PPS(Picture Parameter Set)202は、ピクチャ全体に係る符号化情報が含まれたヘッダである。AU(Access Unit)203には、複数のスライスデータがまとめられている。
スライスデータは、スライスの符号化データがまとめられたNAL(Network Abstraction Layer)ユニットと呼ばれる単位データの一つである。スライスデータのヘッダとしてプリフィックスNALユニットと呼ばれる拡張ヘッダが付加され、レイヤ識別子としての情報であるdependency_idが記述されている。dependency_id を参照することでレイヤを選択することができる。SPS201にはそのレイヤに符号化されている映像の垂直方向及び水平方向画角に関する情報が格納される。ベースレイヤのSPS0 204にはベースレイヤの映像の垂直画角及び水平画角に関する情報が格納される。エンハンスレイヤのSPS1 205にはベースレイヤの映像に対する垂直画角及び水平画角の差に関するオフセット情報が記述されている。SPS201に含まれる情報の詳細については後述する。
図3を参照して、本実施形態の映像データストリーム200に符号化されている映像コンテンツの構成例について説明する。上述の通り、本実施形態で用いる映像コンテンツはベースレイヤと1つのエンハンスレイヤの2階層に階層符号化されている。そして、ベースレイヤはSD解像度、エンハンスレイヤは4K2K解像度と解像度が異なるほか、画角も異なる。具体的には、エンハンスレイヤの映像302が人物303、人物304、人物305を含んだ全景映像、ベースレイヤの映像301が人物303の顔部分のアップ映像であるとする。従って、エンハンスレイヤが最広画角レイヤになる。また、ベースレイヤの画角は、エンハンスレイヤの画角に対する比が閾値以下であるものとする。従って、ベースレイヤは狭画角レイヤである。また、狭画角映像は最広画角の映像の一部の領域であり、最広画角映像とは包含関係にある。
このような映像コンテンツを階層符号化した際の各レイヤの画角に関する情報について、図4を参照して説明する。ここでは、各レイヤの映像の縦横のサイズ(画素数やマクロブロック数など)がそれぞれ垂直画角および水平画角に対応し、画角に関する情報として利用できるものとする。また、各レイヤの映像の縦横比が共通とは限らないため、レイヤ間の画角の大小を比較する場合には、各レイヤの映像に含まれる画素やマクロブロックの総数をその映像の画角の大きさとして用いる。
以下の説明では、映像のサイズを画素数で表すものとする。この場合、ベースレイヤの映像401について、横のサイズBH=640、縦のサイズVH=480である。また、エンハンスレイヤの映像402の画角のオフセット情報は、ベースレイヤの映像401に対するエンハンスレイヤの映像402の左上角の位置の差と右下角の位置の差の組み合わせにより表されるとする。オフセット情報が画素数で表されるとすると、図3の映像構成におけるオフセット情報は、左上角のオフセット情報403(LH,LV)=(1096,660)、右下角のオフセット情報404(RH,RV)=(2360,1020)である。なお、LH,RHは水平オフセット、LV,RVは垂直オフセットである。オフセットはベースレイヤの周縁から外側に向かって正の値をとるものとする。従って、少なくとも、LH,LV,RH,RVがいずれも負の場合には、サイズを比較するまでもなくエンハンスレイヤの方が狭画角であることがわかる。また、本実施形態のように、狭画角レイヤの映像が最広画角のレイヤの映像の一部である場合には、オフセット情報のいずれかに負の値が含まれているエンハンスレイヤはベースレイヤよりも狭画角であると判別できる。
図5のフローチャートを用いて、本実施形態のチャプタ情報作成装置における、狭画角映像に対するチャプタ情報作成動作について説明する。
S101において画角情報抽出部105は、映像ESを信号分離部104から受け取り、AUに記述されているレイヤ識別子dependency_idを抽出する。また、画角情報抽出部105は、映像ESのSPS201からベースレイヤの画角情報(BH,BV)=(640,480)とエンハンスレイヤの画角のオフセット情報(LH,LV)=(1096,660)、(RH,RV)=(2360,1020)を抽出する。そして、画角情報抽出部105は抽出したベースレイヤの画角情報とエンハンスレイヤの画角のオフセット情報、レイヤ識別子を画角差判定部106へ出力する。
S102において画角差判定部106は、画角情報抽出部105から受け取ったベースレイヤの画角情報と個々のエンハンスレイヤの画角のオフセット情報、レイヤ識別子から個々のエンハンスレイヤの映像サイズを画角の大きさとして求める。ここでは映像の大きさの単位が画素であるため、画角の大きさは縦の画素数×横の画素数として求められる。そして、ベースレイヤの映像の縦、横のサイズと、個々のエンハンスレイヤの映像の縦、横のサイズから、最広画角レイヤを判別する。
図3の例のように狭画角レイヤの映像が最広画角レイヤの映像の一部である場合は、正の値のオフセット情報を有するエンハンスレイヤの映像はベースレイヤの映像より広画角である。同様に、負の値のオフセット値を有するエンハンスレイヤの映像はベースレイヤの映像より狭画角である。
図3の例の映像では、オフセット情報は正であり、ベースレイヤと1つのエンハンスレイヤのみからなるため、画角差判定部106は、エンハンスレイヤが広画角(最広画角)レイヤと判断する。
また、画角差判定部106は、エンハンスレイヤの横のサイズEH=BH+LH+RH、エンハンスレイヤの縦のサイズEV=BV+LV+RVを算出する。図3の例では、(EH、EV)=(4096、2160)である。そして、画角差判定部106は、ベースレイヤの映像の画角としてBH×BVを、またエンハンスレイヤの映像の画角(最広画角)としてEH×EVをそれぞれ求める。
S103において、画角差判定部106は、S102で求めた、ベースレイヤの画角と最広画角の大きさから、最広画角映像に対する比が閾値以下の画角を有する狭画角映像を検出する。具体的には画角差判定部106は最広画角/ベースレイヤの画角≧Nか判別する。そして画角差判定部106は、比がN以上であればS104へ処理を進め、比がN未満であれば処理をS101へ戻す。あるいは、ベースレイヤの画角/最広画角≦Nを判別してもよい。本実施形態ではNを2とし、大きさの比が2倍以上であるのか判定を行うが、Nの値は装置の処理能力が高いほど大きくするなど、条件に応じて適宜設定することができる。本実施形態では、最広画角/ベースレイヤの画角=(4096×2160)/(640×480)=28.8となり、画角の比が2以上となり、ベースレイヤは狭画角レイヤである。
S104において、画角位置判定部107は、ベースレイヤの画角情報とエンハンスレイヤの画角のオフセット情報から狭画角レイヤの映像の中心位置を求める。具体的には、広画角レイヤの映像の左下の点を原点としたXY座標系に狭画角レイヤの映像を配置し、狭画角レイヤの映像の中心位置を求める。中心位置の座標を(X1,Y1)とすると、X1=|LH|+BH/2、Y1=|RV|+BV/2として求めることができる。本実施形態では、(X1,Y1)=(1416,1250)となる。
S105において、画角位置判定部107は、同じ狭画角レイヤについて前SPSの情報から計算した映像の中心座標(X0,Y0)と現在のSPSの情報から計算した中心座標(X1,Y1)の移動距離を計算し、移動距離がM以上か判断する。具体的には
(X1−X0)+(Y1−Y0)≧M
が成り立つか判断する。
なお、移動距離の計算は、定期的に行うことができ、例えば狭画角レイヤの映像の各フレームに対して行っても良いし、数フレームごとに行ってもよい。従って、S105で求められる移動距離は、予め定められた一定期間における移動距離に相当する。
中心座標の移動距離がM以上の場合、画角位置判定部107は、その狭画角レイヤのレイヤ識別子dependency_idと現在の再生時間を狭画角チャプタ情報作成部108へ送信し、処理をS106に進める。ここで送信される現在の再生時間が、当該狭画角レイヤの映像に対するチャプタ情報に相当する。一方、中心座標の移動距離がM未満と判断されれば、画角位置判定部107は処理をS101へ戻す。本実施形態では、Mの値として狭画角映像の横のサイズとするが、Mの値は適宜設定することができる。
S106において、狭画角チャプタ情報作成部108は、画角位置判定部107から受け取った狭画角のレイヤ識別子dependency_idと、現在の再生時間を関連付けたチャプタ情報テーブルを作成し、チャプタ情報テーブルを記録部103へ記録する。
ここで、図6を参照して、狭画角チャプタ情報作成部108が作成するチャプタ情報テーブル500について説明する。
チャプタ情報テーブル500にはレイヤ識別子とチャプタ時間を関連付けて記録し、当該映像コンテンツについてのチャプタ情報を管理するテーブルである。レイヤ識別子フィールド501には対応するチャプタ情報(チャプタ時間)が適用されるレイヤの識別子が記録される。従って、全レイヤに共通したチャプタ情報であれば、レイヤ識別子フィールド501には映像ESに含まれる全レイヤのレイヤ識別子dependency_idが記録される。また、特定のレイヤの映像にのみ適用されるチャプタ情報については、該当するレイヤのレイヤ識別子のみがレイヤ識別子フィールド501に記録される。チャプタ時間フィールド502にはチャプタ情報として、チャプタの先頭を表す時間が映像コンテンツの先頭からの経過時間として記録される。
ここで、図7を参照して、共通チャプタ情報と狭画角チャプタ情報が作成される映像状態の例を説明する。共通チャプタ情報は複数のレイヤにおいて映像の内容が大きく変化した(シーンチェンジした)際に作成される。
最広画角レイヤの映像602が大きく変化した場合には、狭画角レイヤの映像も大きく変化するものとして、少なくとも狭画角レイヤに共通したチャプタ情報を作成する。あるいは、全レイヤに共通したチャプタ情報を作成してもよい。最広画角レイヤにおけるチャプタ情報の作成は、例えば従来の映像変化量識別技術を使い、最広画角レイヤの映像602を解析して映像の大きな変化が検出された際にチャプタ情報を生成する。例えばフレーム間の差の大きさが閾値以上である場合に映像が切り替わったものと検出してチャプタ情報を作成することができる。映像解析部110が映像の切り替わりを判定する処理は、映像の各フレームに対して行っても良いし、数フレームごとに行ってもよい。なお、最広画角レイヤの画角/レイヤの画角が一定の値未満であるレイヤについては、最広画角レイヤと同様に共通チャプタ情報が作成されてもよいし、チャプタ情報を作成しなくてもよい。
一方、上述したように、狭画角レイヤの映像に対するチャプタ情報は、例えば狭画角映像の位置が601から606に移動した場合のように、移動距離が閾値以上であることが検出された際に作成される。
本実施形態によれば、画角の異なる複数の映像が階層符号化された映像データのうち、最広画角レイヤの映像に対しては映像の解析に基づいてチャプタ情報を作成する。また、狭画角レイヤの映像については、最広画角レイヤと同じチャプタ情報に加え、映像を解析せずに一定期間での移動距離に基づいてチャプタ情報を作成する。そのため、個々の符号化レイヤについて映像を解析する場合に対して処理負荷を大幅に軽減しながら、各レイヤの映像に対するチャプタ情報を生成することが可能になる。
(他の実施形態)
上述の実施形態では、エンハンスレイヤが最広画角レイヤである2レイヤの階層符号化映像データに対して本発明を適用した例を説明した。しかし、ベースレイヤが最広画角レイヤであってもよい。この場合には、上述のS102の画角の判定において、例えばエンハンスレイヤの画角のオフセット情報の値が負であることを確認して、ベースレイヤがエンハンスレイヤより広画角と判断することができる。そして、エンハンスレイヤの映像の画角をEH×EV、広画角レイヤの映像の画角をBH×BVとして求めればよい。
また、上述の実施形態では、エンハンスレイヤが1つである例について記載したが、複数のエンハンスレイヤが含まれる場合にも同様に対応できる。この場合、最広画角レイヤの映像に対する狭画角レイヤの映像の画角の比較処理を最広画角レイヤ以外のレイヤの数と等しい回数繰り返し行えばよい。
さらに、本実施形態では、SPS内のエンハンスレイヤの画角のオフセット情報を利用したが、映像ストリームデータ中の各スライスに関する符号化情報が格納されているスライスヘッダから、エンハンスレイヤの画角のオフセット情報を取得してもよい。
また、狭画角レイヤの映像のシーンチェンジの判断基準として、一定期間での映像の中心位置の移動距離を用いたが、狭画角レイヤの映像の移動距離が求められはどのような座標を用いてもよい。例えば、4角のいずれかの座標であってもよい。
また、レイヤ間で映像の画質、特に空間解像度が異なる場合には、各レイヤの映像の空間解像度を共通としてから、画角の大きさの比較を行えばよい。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (23)

  1. 画角の異なる映像を含んだ複数の映像が階層符号化された映像のデータから、該映像を頭出し再生するための所定の情報を作成する情報作成装置であって、
    前記データに含まれる前記複数の映像の画角情報に基づいて、前記複数の映像のうち、最広画角の映像の一部の映像である部分映像の空間的な位置を判別する判別手段と、
    前記判別された空間的な位置の一定期間における移動距離が所定の閾値以上である場合に、前記部分映像に対する前記所定の情報を作成する作成手段と、
    を有することを特徴とする情報作成装置。
  2. 前記作成手段は、前記最広画角の映像を解析し、前記最広画角のシーンが切り替わった場合に前記最広画角の映像に対する前記所定の情報を作成することを特徴とする請求項1記載の情報作成装置。
  3. 前記作成手段は、前記最広画角の映像に対して前記所定の情報を作成する際、前記部分映像に対する前記所定の情報作成することを特徴とする請求項2記載の情報作成装置。
  4. 前記移動距離は、前記部分映像のフレーム間における移動距離であることを特徴とする請求項2または3記載の情報作成装置。
  5. 前記判別手段は、前記映像の各フレームに対して、前記部分映像の空間的な位置を判別することを特徴とする請求項1から4のいずれか1項に記載の情報作成装置。
  6. 前記判別手段は、前記映像の所定の複数フレームごとに、前記部分映像の空間的な位置を判別することを特徴とする請求項1から4のいずれか1項に記載の情報作成装置。
  7. 前記作成手段は、前記部分映像の前記最広画角の映像に対する大きさの割合が、所定の閾値以下であって、かつ前記部分映像の前記空間的な位置の一定期間における移動距離が前記所定の閾値以上である場合に前記部分映像に対する前記所定の情報を作成することを特徴とする請求項から4のいずれか1項に記載の情報作成装置。
  8. 前記判別手段は、前記部分映像の中心位置の座標を前記部分映像の前記空間的な位置として判別することを特徴とする請求項1から7のいずれか1項に記載の情報作成装置。
  9. 前記判別手段は、前記部分映像の中心位置の座標を、前記映像の大きさを示す情報と、前記部分映像の、前記映像に対する相対的位置を特定する情報とに基づいて判別することを特徴とする請求項8に記載の情報作成装置。
  10. 前記作成手段は、前記部分映像の時間情報を前記所定の情報として生成することを特徴とする請求項1から9のいずれか1項に記載の情報作成装置。
  11. 前記作成手段は、前記部分映像の前記移動距離前記所定の閾値以上であると判断された際の前記部分映像の時間情報を前記所定の情報として生成することを特徴とする請求項10記載の情報作成装置。
  12. 画角の異なる映像を含んだ複数の映像が階層符号化された映像のデータから、該映像を頭出し再生するための所定の情報を作成する情報作成装置の制御方法であって、
    前記データに含まれる前記複数の映像の画角情報に基づいて、前記複数の映像のうち、最広画角の映像の一部の映像である部分映像の空間的な位置を判別する判別工程と、
    前記判別された空間的な位置の一定期間における移動距離が所定の閾値以上である場合に、前記部分映像に対する前記所定の情報を作成する作成工程と、
    を有することを特徴とする情報作成装置の制御方法。
  13. 前記作成工程において、前記最広画角の映像を解析し、前記最広画角のシーンが切り替わった場合に前記最広画角の映像に対する前記所定の情報を作成することを特徴とする請求項12記載の情報作成装置の制御方法。
  14. 前記作成工程において、前記最広画角の映像に対して前記所定の情報を作成する際、前記部分映像に対する前記所定の情報作成することを特徴とする請求項13記載の情報作成装置の制御方法。
  15. 前記移動距離は、前記部分映像のフレーム間における移動距離であることを特徴とする請求項13または14記載の情報作成装置の制御方法。
  16. 前記判別工程において、前記映像の各フレームに対して、前記部分映像の空間的な位置を判別することを特徴とする請求項12から15のいずれか1項に記載の情報作成装置の制御方法。
  17. 前記判別工程において、前記映像の所定の複数フレームごとに、前記部分映像の空間的な位置を判別することを特徴とする請求項12から15のいずれか1項に記載の情報作成装置の制御方法。
  18. 前記作成工程において、前記部分映像の前記最広画角の映像に対する大きさの割合が、所定の閾値以下であって、かつ前記部分映像の前記空間的な位置の一定期間における移動距離が前記所定の閾値以上である場合に前記部分映像に対する前記所定の情報を作成することを特徴とする請求項12から15のいずれか1項に記載の情報作成装置の制御方法。
  19. 前記判別工程において、前記部分映像の中心位置の座標を前記部分映像の空間的な位置として判別することを特徴とする請求項12から18のいずれか1項に記載の情報作成装置の制御方法。
  20. 前記判別工程において、前記部分映像の中心位置の座標を、前記映像の大きさを示す情報と、前記部分映像の、前記映像に対する相対的位置を特定する情報とに基づいて判別することを特徴とする請求項19に記載の情報作成装置の制御方法。
  21. 前記作成工程において、前記部分映像の時間情報を前記所定の情報として生成することを特徴とする請求項12から20のいずれか1項に記載の情報作成装置の制御方法。
  22. 前記作成工程において、前記部分映像の前記移動距離前記所定の閾値以上であると判断された際の前記部分映像の時間情報を前記所定の情報として生成することを特徴とする請求項21記載の情報作成装置の制御方法。
  23. コンピュータを、請求項1から1のいずれか1項に記載の情報作成装置の各手段として機能させるためのプログラム。
JP2010063244A 2010-03-18 2010-03-18 情報作成装置及びその制御方法 Expired - Fee Related JP5667773B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010063244A JP5667773B2 (ja) 2010-03-18 2010-03-18 情報作成装置及びその制御方法
US13/043,143 US9025930B2 (en) 2010-03-18 2011-03-08 Chapter information creation apparatus and control method therefor
CN2011100699370A CN102196230B (zh) 2010-03-18 2011-03-18 章信息创建设备及其控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010063244A JP5667773B2 (ja) 2010-03-18 2010-03-18 情報作成装置及びその制御方法

Publications (3)

Publication Number Publication Date
JP2011199525A JP2011199525A (ja) 2011-10-06
JP2011199525A5 JP2011199525A5 (ja) 2013-04-25
JP5667773B2 true JP5667773B2 (ja) 2015-02-12

Family

ID=44603524

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010063244A Expired - Fee Related JP5667773B2 (ja) 2010-03-18 2010-03-18 情報作成装置及びその制御方法

Country Status (3)

Country Link
US (1) US9025930B2 (ja)
JP (1) JP5667773B2 (ja)
CN (1) CN102196230B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9705746B2 (en) * 2012-03-11 2017-07-11 Avago Technologies General Ip (Singapore) Pte. Ltd. Channel bonding for layered content
WO2018164930A1 (en) * 2017-03-08 2018-09-13 Vid Scale, Inc. Improving motion vector accuracy by sharing cross-information between normal and zoom views

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3320197B2 (ja) * 1994-05-09 2002-09-03 キヤノン株式会社 画像編集装置及びその方法
US6957350B1 (en) * 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
CA2208950A1 (en) * 1996-07-03 1998-01-03 Xuemin Chen Rate control for stereoscopic digital video encoding
US6233356B1 (en) * 1997-07-08 2001-05-15 At&T Corp. Generalized scalability for video coder based on video objects
JPH11331851A (ja) * 1998-05-13 1999-11-30 Matsushita Electric Ind Co Ltd 低ビットレート動画符号化装置
JP2000165859A (ja) * 1998-11-25 2000-06-16 Sony Corp 画像処理システム、画像圧縮装置、画像伸長装置、および記録媒体
US6977664B1 (en) * 1999-09-24 2005-12-20 Nippon Telegraph And Telephone Corporation Method for separating background sprite and foreground object and method for extracting segmentation mask and the apparatus
JP2001326901A (ja) * 2000-05-18 2001-11-22 Sharp Corp 動画像シーン情報管理装置
US7929610B2 (en) * 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
US7039113B2 (en) * 2001-10-16 2006-05-02 Koninklijke Philips Electronics N.V. Selective decoding of enhanced video stream
JP4334898B2 (ja) * 2003-03-26 2009-09-30 シャープ株式会社 データベース構築装置、データベース構築プログラム、画像検索装置、画像検索プログラム、及び画像記録再生装置
WO2005004487A1 (ja) * 2003-06-30 2005-01-13 Mitsubishi Denki Kabushiki Kaisha 画像符号化装置及び画像符号化方法
JP4005060B2 (ja) * 2004-06-30 2007-11-07 株式会社ソニー・コンピュータエンタテインメント 情報処理システム、プログラムおよびゲームキャラクタ移動制御方法
JP2006060279A (ja) * 2004-08-17 2006-03-02 Matsushita Electric Ind Co Ltd 動画再生装置
JP4393333B2 (ja) 2004-09-30 2010-01-06 キヤノン株式会社 映像記録再生装置、方法及びプログラム
JP4647343B2 (ja) * 2005-02-28 2011-03-09 富士フイルム株式会社 フォトムービー作成装置及びフォトムービー作成プログラム
US7110605B2 (en) * 2005-02-04 2006-09-19 Dts Az Research, Llc Digital intermediate (DI) processing and distribution with scalable compression in the post-production of motion pictures
CN101204092B (zh) * 2005-02-18 2010-11-03 汤姆森许可贸易公司 从低分辨率图像导出高分辨率图像的编码信息的方法以及实施所述方法的编码和解码设备
US7961963B2 (en) * 2005-03-18 2011-06-14 Sharp Laboratories Of America, Inc. Methods and systems for extended spatial scalability with picture-level adaptation
JP4208898B2 (ja) * 2006-06-09 2009-01-14 株式会社ソニー・コンピュータエンタテインメント 対象物追跡装置および対象物追跡方法
JP4831623B2 (ja) * 2007-03-29 2011-12-07 Kddi株式会社 動画像の顔インデックス作成装置およびその顔画像追跡方法
CN101098476A (zh) * 2007-07-12 2008-01-02 刘西红 磁盘阵列中数据读取进行视频信息输出的优化方法
JP4433027B2 (ja) * 2007-09-21 2010-03-17 ソニー株式会社 信号処理装置、信号処理方法、およびプログラム
JP2011503968A (ja) * 2007-11-05 2011-01-27 トムソン ライセンシング 高速チャネル切り替え及び増加された誤り耐性のためのスケーラブルビデオ符号化方法
WO2009078056A1 (ja) * 2007-12-14 2009-06-25 Fujitsu Limited 移動物検知装置及び移動物検知プログラム
JP2009181216A (ja) * 2008-01-29 2009-08-13 Toshiba Corp 電子機器および画像処理方法
JP5528008B2 (ja) * 2008-07-17 2014-06-25 キヤノン株式会社 再生装置及び再生方法
JP2011151647A (ja) * 2010-01-22 2011-08-04 Canon Inc シーン検索装置、シーン検索方法、およびシーン検索プログラム

Also Published As

Publication number Publication date
JP2011199525A (ja) 2011-10-06
CN102196230A (zh) 2011-09-21
US20110229109A1 (en) 2011-09-22
CN102196230B (zh) 2013-07-31
US9025930B2 (en) 2015-05-05

Similar Documents

Publication Publication Date Title
KR101987820B1 (ko) 고 해상도 컨텐츠를 처리하는 컨텐츠 처리 장치 및 그 방법
TWI238002B (en) Method for selecting the de-interlacing algorithm of dynamic image
KR100906957B1 (ko) 서브-프레임 메타데이터를 이용한 적응 비디오 프로세싱
JP5197910B2 (ja) デジタル情報信号を受信する装置
JP4707713B2 (ja) 映像記録装置及びシーンチェンジ抽出方法
JP4974984B2 (ja) 映像記録装置及び方法
US20100033632A1 (en) Information processing apparatus, information processing method, display control apparatus, display controlling method , and program
JP2003532316A (ja) 独立コード化領域を特徴とする画像シーケンス圧縮
EP1411522A2 (en) Determining a scene change point
JPH11284948A (ja) サムネイル作成方法及びサムネイル表示方法
JP2006319690A (ja) 動画像符号化装置
JP5667773B2 (ja) 情報作成装置及びその制御方法
JP4182747B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
US9277270B2 (en) Image processing apparatus capable of extracting frame image data from video data and method for controlling the same
US20070133950A1 (en) Reproduction apparatus, reproduction method, recording method, image display apparatus and recording medium
JP2009194550A (ja) 画質調整装置、画質調整方法及びプログラム
JP5036882B2 (ja) 映像記録装置、映像記録方法、映像音声記録装置、及び映像音声記録方法
JP2002010254A (ja) 特徴点検出方法および記録再生装置
KR101299245B1 (ko) 관심영역을 복호화하는 영상재생장치 및 그 방법
JP2006166290A (ja) 画像記録装置および方法、並びにプログラム
CN111699530B (zh) 记录装置及记录方法
JP5425972B2 (ja) 映像音声記録装置及び映像音声記録方法
JP2009232319A (ja) 動画符号化装置、動画再生装置、記録媒体、動画符号化プログラム、および動画再生プログラム
JP2008533890A (ja) 複数のビデオ信号を単一のエンコードされたビデオ信号としてエンコードする方法および装置ならびにそのようなエンコードされたビデオ信号をデコードする方法および装置
JP2009302734A (ja) 動画再生装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130307

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140403

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141215

R151 Written notification of patent or utility model registration

Ref document number: 5667773

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees