JP4841688B2 - 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置 - Google Patents

動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置 Download PDF

Info

Publication number
JP4841688B2
JP4841688B2 JP2010276445A JP2010276445A JP4841688B2 JP 4841688 B2 JP4841688 B2 JP 4841688B2 JP 2010276445 A JP2010276445 A JP 2010276445A JP 2010276445 A JP2010276445 A JP 2010276445A JP 4841688 B2 JP4841688 B2 JP 4841688B2
Authority
JP
Japan
Prior art keywords
management information
moving image
information
encoding
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010276445A
Other languages
English (en)
Other versions
JP2011097612A (ja
Inventor
正真 遠間
洋 矢羽田
航 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2010276445A priority Critical patent/JP4841688B2/ja
Publication of JP2011097612A publication Critical patent/JP2011097612A/ja
Application granted granted Critical
Publication of JP4841688B2 publication Critical patent/JP4841688B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/322Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier used signal is digitally coded
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2541Blu-ray discs; Blue laser DVR discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/7921Processing of colour television signals in connection with recording for more than one processing mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、輝度レベルの閾値に従って前景と背景が分離可能な符号化ストリームを生成する際に、閾値を切り替えて動画像を符号化する動画像符号化方法、動画像記録方法、動画像再生方法、および、符号化ストリームを記録した記録媒体等に関する。
従来の技術である、DVD−Videoディスク(以下単にDVDと呼ぶ)について説明する。
図1は、DVDの構造を示した図である。図1の下段に示すように、DVDディスク上にはリード・インからリード・アウトまでの間に論理アドレス空間が設けられ、論理アドレス空間の先頭からファイルシステムのボリューム情報が記録され、続いて映像音声などのアプリケーションデータが記録されている。
ファイルシステムとは、ISO9660やUDF(Universal Disc Format)のことであり、ディスク上のデータをディレクトリまたはファイルと呼ばれる単位で表現する仕組みである。日常使っているPC(パーソナルコンピュータ)の場合でも、FATまたはNTFSと呼ばれるファイルシステムを通すことにより、ディレクトリやファイルという構造でハードディスクに記録されたデータがコンピュータ上で表現され、ユーザビリティを高めている。
DVDの場合、UDFおよびISO9660の両方を使用しており(両方を合わせて「UDFブリッジ」と呼ぶ事がある)、UDFまたはISO9660のどちらのファイルシステムドライバによってもデータの読み出しができるようになっている。勿論、書き換え型のDVDディスクであるDVD−RAM/R/RWでは、これらファイルシステムを介し、物理的にデータの読み、書き、削除が可能である。
DVD上に記録されたデータは、UDFブリッジを通して、図1左上に示すようなディレクトリまたはファイルとして見ることができる。ルートディレクトリ(図中「ROOT」)の直下に「VIDEO_TS」と呼ばれるディレクトリが置かれ、ここにDVDのアプリケーションデータが記録されている。アプリケーションデータは、複数のファイルとして記録され、主なファイルとして以下のものがある。
VIDEO_TS.IFO ディスク再生制御情報ファイル
VTS_01_0.IFO ビデオタイトルセット#1再生制御情報ファイル
VTS_01_0.VOB ビデオタイトルセット#1ストリームファイル
.....
拡張子として2つの種類が規定されており、「IFO」は再生制御情報が記録されたファイルであって、「VOB」はAVデータであるMPEGストリームが記録されたファイルである。再生制御情報とは、DVDで採用されたインタラクティビティ(ユーザの操作に応じて再生を動的に変化させる技術)を実現するための情報や、メタデータのようなタイトルやAVストリームに付属する情報などのことである。また、DVDでは一般的に再生制御情報のことをナビゲーション情報と呼ぶことがある。
再生制御情報ファイルは、ディスク全体を管理する「VIDEO_TS.IFO」と、個々のビデオタイトルセット(DVDでは複数のタイトル、言い換えれば異なる映画や異なるバージョンの映画を1枚のディスクに記録することが可能である。)毎の再生制御情報である「VTS_01_0.IFO」がある。ここで、ファイル名ボディにある「01」はビデオタイトルセットの番号を示しており、例えば、ビデオタイトルセット#2の場合は、「VTS_02_0.IFO」となる。
図1の右上部は、DVDのアプリケーション層でのDVDナビゲーション空間であり、前述した再生制御情報が展開された論理構造空間である。「VIDEO_TS.IFO」内の情報は、VMGI(Video Manager Information)として、「VTS_01_0.IFO」または、他のビデオタイトルセット毎に存在する再生制御情報はVTSI(Video Title Set Information)としてDVDナビゲーション空間に展開される。
VTSIの中にはPGC(Program Chain)と呼ばれる再生シーケンスの情報であるPGCI(Program Chain Information)が記述されている。PGCIは、Cellの集合とコマンドと呼ばれる一種のプログラミング情報によって構成されている。Cell自身はVOB(Video Objectの略であり、MPEGストリームを指す)の一部区間または全部区間の集合であり、Cellの再生は、当該VOBのCellによって指定された区間を再生することを意味している。
コマンドは、DVDの仮想マシンによって処理されるものであり、ブラウザ上で実行されるJava(登録商標)スクリプトなどに近いものである。しかしながらJava(登録商標)スクリプトが論理演算の他にウィンドウやブラウザの制御(例えば、新しいブラウザのウィンドウを開くなど)を行うのに対して、DVDのコマンドは、論理演算の他にAVタイトルの再生制御、例えば、再生するチャプタの指定などを実行するだけのものである点で異なっている。
Cellはディスク上に記録されているVOBの開始および終了アドレス(ディスク上での論理記録アドレス)をその内部情報として有しており、プレーヤは、Cellに記述されたVOBの開始および終了アドレス情報を使ってデータの読み出し、再生を実行する。
図2はAVストリーム中に埋め込まれているナビゲーション情報を説明する概略図である。DVDの特徴であるインタラクティビティは前述した「VIDEO_TS.IFO」や「VTS_01_0.IFO」などに記録されているナビゲーション情報だけによって実現されているのではなく、幾つかの重要な情報はナビゲーションパック(ナビパックまたは、NV_PCKと称する)と呼ばれる専用キャリアを使いVOB内に映像、音声データと一緒に多重化されている。
ここでは簡単なインタラクティビティの例としてメニューを説明する。メニュー画面上には、幾つかのボタンが現れ、夫々のボタンには当該ボタンが選択実行された時の処理が定義されている。また、メニュー上では一つのボタンが選択されており(ハイライトによって選択ボタン上に半透明色がオーバーレイされており該ボタンが選択状態であることをユーザに示す)、ユーザは、リモコンの上下左右キーを使って、選択状態のボタンを上下左右の何れかのボタンに移動させることが出来る。リモコンの上下左右キーを使って、選択実行したいボタンまでハイライトを移動させ、決定する(決定キーを押す)ことによって対応するコマンドのプログラムが実行される。一般的には対応するタイトルやチャプタの再生がコマンドによって実行されている。
図2の左上部はNV_PCK内に格納される制御情報の概要を示している。
NV_PCK内には、ハイライトカラー情報と個々のボタン情報などが含まれている。ハイライトカラー情報には、カラーパレット情報が記述され、オーバーレイ表示されるハイライトの半透明色が指定される。ボタン情報には、個々のボタンの位置情報である矩形領域情報と、当該ボタンから他のボタンへの移動情報(ユーザの上下左右キー操作夫々に対応する移動先ボタンの指定)と、ボタンコマンド情報(当該ボタンが決定された時に実行されるコマンド)が記述されている。
メニュー上のハイライトは、図2の中央右上部に示すように、オーバーレイ画像として作られる。オーバーレイ画像は、ボタン情報の矩形領域情報にカラーパレット情報の色をつけた物である。このオーバーレイ画像は図2の右部に示す背景画像と合成されて画面上に表示される。
上述のようにして、DVDではメニューを実現している。また、ナビゲーションデータの一部をNV_PCKを使ってストリーム中に埋め込んでいるのは、ストリームと同期して動的にメニュー情報を更新したり(例えば、映画再生の途中5分〜10分の間にだけメニューが表示されるなど)、同期タイミングが問題となりやすいアプリケーションの場合でも、問題なく実現できるようにしたためである。また、もう一つの大きな理由は、NV_PCKには特殊再生を支援するための情報を格納し、DVD再生時の早送り、巻き戻しなどの非通常再生時にも円滑にAVデータをデコードし再生させる等、ユーザの操作性を向上させるためである。
図3は、DVDのストリームであるVOBのイメージである。図に示すように、映像、音声、字幕などのデータ(図3のa段)は、MPEGシステム規格(ISO/IEC13818−1)に基づいて、パケットおよびパック化し(図3のb段)、夫々を多重化して1本のMPEGプログラムストリームにしている(図3のc段)。また、前述した通りインタラクティブを実現するためのボタンコマンドを含んだNV_PCKも一緒に多重化をされている。
MPEGシステムの多重化の特徴は、多重化する個々のデータは、そのデコード順に基づくビット列になっているが、多重化されるデータ間、即ち、映像、音声、字幕の間は必ずしも再生順に基づいてビット列が形成されている訳ではない。これは多重化したMPEGシステムストリームのデコーダモデル(一般にSystem Target Decoder、またはSTDと呼ばれる(図3のd段))が多重化を解いた後に個々のエレメンタリストリームに対応するデコーダバッファを持ち、デコードタイミングまでに一時的にデータを蓄積している事に由来している。例えばDVD−Videoで規定されるデコーダバッファは、個々のエレメンタリストリーム毎にサイズが異なり、映像に対しては、232KB、音声に対しては4KB、字幕に対しては52KBを夫々有している。
即ち、映像データと並んで多重化されている字幕データが必ずしも同一タイミングでデコードもしくは再生されているわけでは無い。
一方、次世代DVD規格としてBD(Blu−ray Disc)がある。
DVDでは、標準画質(Standard Definition画質)の映像に対する、パッケージ配信(DVD−Video規格)やアナログ放送の記録(DVD Video Recording規格)を目的としてきたが、BDでは、高精度画質(High
Definition画質)のデジタル放送をそのまま記録する(Blu−ray Disc Rewritable規格、以下BD−RE)ことができる。
しかしながら、BD−RE規格は広くデジタル放送の記録を目的としているため、特殊再生の支援情報などが最適化されていない。将来的に、高精度映像をデジタル放送よりも高レートでパッケージ配信させることを考えると(BD−ROM規格)、非通常再生時でもユーザにストレスを与えない仕組みが必要となってくる。
また、BDにおける動画像の符号化方式の1つとして、MPEG−4 AVC(Advanced Video Coding)が採用されている。MPEG−4 AVCとは、ISO/IEC(国際標準化機構 国際電気標準会議)のJTC1/SC29/WG11とITU−T(国際電気通信連合 電気通信標準化部門)が共同で策定した高圧縮率の次世代符号化方式である。
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号化処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。
参照画像を持たず画面内予測符号化を行うものをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うものをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるものをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして2枚のピクチャを参照することが可能である。参照画像(参照ピクチャ)は符号化および復号化の基本単位であるブロックごとに指定することができるが、符号化を行ったビットストリーム中に先に記述される方の参照ピクチャを第1参照ピクチャ、後に記述される方を第2参照ピクチャとして区別する。ただし、これらのピクチャを符号化および復号化する場合の条件として、参照するピクチャが既に符号化および復号化されている必要がある。
符号化する画像から、画面内予測、あるいは画面間予測から得られた予測信号を引き算した残差信号は、周波数変換して量子化した後に、可変長符号化されて符号化ストリームとして出力される。MPEG−4 AVCには、可変長符号化の方式としてCAVLC(Context−Adaptive Variable Length Coding:コンテキスト適応型可変長符号化)とCABAC(Context−Adaptive Binary Arithmetic Coding:コンテキスト適応型2値算術符号化)の2種類があり、ピクチャ単位で切り替えることができる。ここで、コンテキスト適応型とは、周囲の状況に応じて効率の良い符号化方式を適応的に選択する方式である。
次に、異なる符号化方式(あるいは、異なる属性の動画像)が混在し得るストリーム、及び、そのようなストリームを受信した復号装置における復号処理について説明する。ここでは、2つの例、つまり、可変長符号化方式(CAVLC/CABAC)が混在し得る第1の例と、ピクチャ内ピクチャにおいて輝度キーによる透過処理を行う際に用いられる輝度の閾値が混在し得る第2の例とを説明する。
まず、異なる符号化方式(あるいは、異なる属性の動画像)が混在し得るストリームの第1の例、つまり、可変長符号化方式(CAVLC/CABAC)が混在し得る例について説明する。図4は、MPEG−4 AVCのストリームにおいて、ランダムアクセス可能な単位を構成するピクチャに適用される可変長符号化の方式を示す例である。ここで、MPEG−4 AVCでは、MPEG−2ビデオのGOP(Group of Pictures)に相当する概念は無いが他のピクチャに依存せずに復号化できる特別なピクチャ単位でデータを分割すればGOPに相当するランダムアクセス可能な単位が構成できるので、これをランダムアクセス単位(RAU)と呼ぶことにする。図4に示すように、可変長符号化の方式としてCABAC、あるいはCAVLCが適用されるかがピクチャ単位で切り替わる。
次に、CABACとCAVLCとでは可変長復号時の処理が異なるため、図5A〜図5Cを参照してそれぞれの可変長復号処理について説明する。図5Aは、CABACにより可変長符号化されたデータの復号処理であるCABAD(Context−Adaptive Binary Arithmetic Decoding:コンテキスト適応型2値算術復号)と、CAVLCにより可変長符号化されたデータの復号処理であるCAVLD(Context−Adaptive Variable Length Decoding:コンテキスト適応型可変長復号)とを行う画像復号化装置のブロック図を示す。
CABADを伴う画像復号化処理は次のように行われる。まず、CABACが適用された符号化データVinがストリームバッファ5001に入力される。続いて、算術復号部5002は、ストリームバッファから符号化データVrを読み出して算術復号を行い、2値データBin1を2値データバッファ5003に入力する。2値データ復号処理部5004は、2値データバッファ5003から2値データBin2を取得して、2値データを復号し、復号後の2値データDin1を画素復元部5005に入力する。画素復元部5005は、2値復号データDin1に対して逆量子化、逆変換、および動き補償などを行い、画素を復元し、復号データVoutを出力する。図5Bは、CABACが適用された符号化データを復号開始してから、画素復元処理を実施するまでの動作を示すフローチャートである。まず、ステップ5001において、CABACが適用された符号化データVinを算術復号して、2値データを生成する。次に、ステップ5002において、1以上のピクチャなど、所定のデータ単位分の2値データが揃ったかどうか判定し、揃った際にはステップS5003に進み、揃っていない場合にはステップS5001の処理を繰り返す。ここで、2値データのバッファリングを行うのは、CABACでは、ピクチャあるいはマクロブロックあたりの2値データの符号量が著しく大きくなることがあり、それに伴い算術復号の処理負荷も著しく増加し得るため、ワーストケースにおいても途切れのない再生を実現するためには、予め一定量の算術復号処理を行っておく必要があるためである。ステップS5003では、2値データを復号し、ステップS5004において画素復元処理を実施する。このように、CABADにおいては、ステップS5001およびステップS5002において所定のデータ単位分の2値データが揃うまで画素復元処理を開始できないため、復号開始時に遅延が発生する。
CAVLDを伴う画像復号化処理は次のように行われる。まず、CAVLCが適用された符号化データVinがストリームバッファ5001に入力される。続いて、CAVLD部5006は、可変長復号処理を行い、VLD復号データDin2を画素復元部5005に入力する。画素復元部5005は、逆量子化、逆変換、および動き補償などを行い、画素を復元し、復号データVoutを出力する。図5Cは、CAVLCが適用された符号化データを復号開始してから、画素復元処理を実施するまでの動作を示すフローチャートである。まず、ステップS5005においてCAVLDを行い、続いて、ステップS5004において画素復元処理を実施する。このように、CAVLDにおいては、CABADとは異なり、画素復元処理を開始する前に、所定のデータ単位分のデータが揃うまで待つ必要がないとともに、2値データバッファ5003のような、可変長復号処理における中間バッファをもつ必要がない。
図6は、図4の例のように、ストリームの途中で可変長符号化の方式が切り替わるストリームを復号する、従来の復号装置の動作を示すフローチャートである。なお、本明細書において、復号装置及び復号方法は、それぞれ、動画像再生装置及び動画像再生方法の一例である。
まず、ステップS5101において、ピクチャに適用された可変長符号化方式を示す情報を取得して、ステップS5102に進む。ステップS5102では、復号順で直前のピクチャと現ピクチャとで可変長符号化の方式が切り替わったかどうかを判定する。CABADとCAVLDとでは、可変長復号処理におけるバッファの管理方法が異なるため、可変長符号化の方式が切り替わった際には、ステップS5103に進んでバッファ管理の切替え処理を行い、可変長符号化の方式が切り替わっていなければステップS5104に進む。ステップS5104において可変長符号化方式がCAVLCであるかどうか判定し、CAVLCである際にはステップS5105に進んでCAVLD処理を行い、CABACである際にはステップS5106に進む。ステップS5106では、復号順で直前のピクチャと現ピクチャとで可変長符号化の方式が切り替わったかどうか判定し、切り替わった際にはステップS5107に進み、図5のステップS5001とステップS5002に示すように、所定のデータ単位分の2値データが揃うまで算術復号を行ってから、2値データを復号する。ステップS5106で可変長符号化の方式が切り替わっていないと判定された際には、ステップS5108に進み、通常のCABAD処理を行う。ここで、通常のCABAD処理とは、CAVLCからCABACに切り替わる、あるいはCABACが適用されたストリームの復号を開始する際に必要であった2値データのバッファリングを行わない処理である。最後に、ステップS5109において画素復元処理を実施する。
次に、異なる符号化方式(あるいは、異なる属性の動画像)が混在し得るストリームの第2例、つまり、ピクチャ内ピクチャにおいて輝度キーによる透過処理を行う際に用いられる輝度の閾値(動画像の属性)が混在し得る例について説明する。BD−ROMなどのパッケージメディアでは、本編映像にオーバーレイしてディレクターズ・カット(監督による解説映像)など、本編とは異なる映像を表示するアプリケーションがあり、このようなアプリケーションをピクチャ内ピクチャと呼ぶ。図7は、ピクチャ内ピクチャを説明する図である。図7(a)は画像の表示プレーンを示し、プレーン2がプレーン1にオーバーレイして表示される。図7(b)と図7(c)は、それぞれ、プレーン1とプレーン2に表示する画像を示し、プレーン2の表示画像がプレーン1の表示画像にオーバーレイして表示される(図7(d))。ピクチャ内ピクチャのケースでは、プレーン1に表示されるのが本編映像、プレーン2に表示されるのが本編とは異なる映像となる。ここで、プレーン2に表示される映像をそのままオーバーレイしてしまうと、プレーン1の画像が完全に隠れてしまうため、プレーン2の画像には輝度キーによる透過処理が行われる。以下に、輝度キーによる透過処理について説明する。透過処理においては、画像内の各画素の輝度値に応じて当該画素を透過して表示するかどうかを切替える。具体的には、次のようになる。
1.輝度値が0以上で、所定の閾値YL以下である場合、当該画素は完全に透過(透過率が1)とする。
2.輝度値が所定の閾値YLを超える場合、当該画素は透過せず(透過率が0)に、輝度値に示されるように表示する。
図7(c)において、黒塗りの領域は輝度値が前記所定の閾値YL以下であり、その他の領域は、輝度値が前記所定の閾値YLを超えるものとすると、図7(d)に示されるように、プレーン2の画像をプレーン1にオーバーレイする際に、黒塗りの領域は透過させ、それ以外の領域は透過させずに表示する。つまり、プレーン2の画像のうち、輝度が閾値YLを超える領域(画素)だけが、プレーン1の画像にオーバーレイされ、表示される。これにより、プレーン2は、輝度レベルの閾値に従って前景と背景に分離され、前景だけがプレーン1にオーバーレイされて表示され、ピクチャ内ピクチャが実現される。
特開2000−228656号公報
Proposed SMPTE Standard for Television: VC−1 Compressed Video Bitstream Format and Decoding Process, Final Committee Draft 1 Revision 6, 2005.7.13
以上のような異なる符号化方式(あるいは、異なる属性の動画像)が混在し得るストリームを受信した復号装置は、復号処理において切り替え処理が必要とされるために、処理負荷が大きくなるという問題がある。図8は、従来の多重化装置により生成された従来の記録媒体において輝度キーによる透過処理を実現する際の課題について説明する図である。図8は、輝度キーによる透過処理を行う映像が連続再生される区間を示し、区間1、区間2、区間3が順に再生される。ここで、透過率を1として透過して表示する画素における輝度値の閾値が、区間1では20、区間2では40、区間3では30となっているため、区間の切替わりにおいて、透過して表示する画素における輝度値の閾値を変更する必要がある。輝度値の閾値が変更されると、プレーンを合成する際の動作の変更が必要となり、動作の変更に伴う遅延が発生する。この結果、途切れなく再生されるべき各区間の切替わり部分において、再生が途切れるという課題がある。
このように、従来の画像符号化方式により生成されたストリームが多重化された従来の記録媒体を再生する際には、再生区間毎に輝度キーの閾値が変更されるため、前記閾値の切り替わりに伴って、再生時における輝度値の閾値処理において遅延が発生するという課題がある。
本発明は、再生時の処理負荷を増大させることなく再生途切れを発生させない動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法及び動画像再生装置を提供することを目的とする。
本発明は、以上の課題を解決するためになされたものである。
本発明に係る動画像符号化方法は、連続再生の対象となる区間(連続再生区間)においては、符号化方式(あるいは、動画像の属性)を切り替えることなく動画像を符号化しておくとともに、その区間においては符号化方式が固定であることを示すフラグ情報を含む管理情報を作成しておくことを特徴とする。
より具体的には、ピクチャ内ピクチャのケースに対応した発明として、本発明に係る動画像符号化方法は、第1動画像と、前記第1動画像にオーバーレイするための第2動画像とを含む映像ストリームを符号化する動画像符号化方法であって、前記オーバーレイでは、前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけが前記第1動画像にオーバーレイされ、前記動画像符号化方法は、前記映像ストリームのうち、部分区間の集まりであって、連続再生の対象となる区間である連続再生区間を決定する連続再生区間決定ステップと、前記連続再生区間決定ステップで決定された連続再生区間においては前記閾値を変更しないという制約を満たすように、前記連続再生区間を構成する複数の部分区間における前記第1及び第2動画像を符号化する符号化ステップと、前記連続再生区間においては前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とを含む管理情報を作成する管理情報作成ステップと、前記符号化ステップで符号化された前記第1及び第2動画像と前記管理情報作成ステップで作成された管理情報とを結合して出力する結合ステップとを含むことを特徴とする。
また、本発明に係る動画像符号化装置は、第1動画像と、前記第1動画像にオーバーレイするための第2動画像とを含む映像ストリームを符号化する動画像符号化装置であって、前記オーバーレイでは、前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけが前記第1動画像にオーバーレイされ、前記動画像符号化装置は、前記映像ストリームのうち、部分区間の集まりであって、連続再生の対象となる区間である連続再生区間を決定する連続再生区間決定部と、前記連続再生区間決定部で決定された連続再生区間においては前記閾値を変更しないという制約を満たすように、前記連続再生区間を構成する複数の部分区間における前記第1及び第2動画像を符号化する符号化部と、前記連続再生区間においては前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とを含む管理情報を作成する管理情報作成部と、前記符号化部で符号化された前記第1及び第2動画像と前記管理情報作成部で作成された管理情報とを結合して出力する結合部とを備えることを特徴とする。
また、本発明に係る動画像記録方法は、第1動画像と、前記第1動画像にオーバーレイするための第2動画像とを含む映像ストリームを符号化して記録媒体に記録する動画像記録方法であって、前記オーバーレイでは、前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけが前記第1動画像にオーバーレイされ、前記動画像記録方法は、前記映像ストリームのうち、部分区間の集まりであって、連続再生の対象となる区間である連続再生区間を決定する連続再生区間決定ステップと、前記連続再生区間決定ステップで決定された連続再生区間においては前記閾値を変更しないという制約を満たすように、前記連続再生区間を構成する複数の部分区間における前記第1及び第2動画像を符号化する符号化ステップと、前記連続再生区間においては前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とを含む管理情報を作成する管理情報作成ステップと、前記符号化ステップで符号化された前記第1及び第2動画像と前記管理情報作成ステップで作成された管理情報とを結合して記録媒体に記録する結合ステップとを含むことを特徴とする。
また、本発明に係る記録媒体は、コンピュータ読み取り可能なデータが記録された記録媒体であって、前記データには、第1動画像と、前記第1動画像にオーバーレイするための第2動画像とを含む映像ストリーム、及び、前記映像ストリームを管理する情報である管理情報が含まれ、前記オーバーレイでは、前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけが前記第1動画像にオーバーレイされ、前記映像ストリームでは、部分区間の集まりであって、連続再生の対象となる区間である連続再生区間においては前記閾値を変更しないという制約を満たすように、前記連続再生区間を構成する複数の部分区間における前記第1及び第2動画像が符号化されており、前記管理情報には、前記連続再生区間においては前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とが含まれることを特徴とする。
また、本発明に係る動画像再生方法は、符号化された第1及び第2動画像を含む映像ストリームを復号化し、前記第2動画像を前記第1動画像にオーバーレイして表示する動画像再生方法であって、前記映像ストリームに対応する管理情報を取得し、取得した管理情報を解釈する管理情報処理ステップと、前記管理情報処理ステップでの解釈に従って、前記第1及び第2動画像を復号化する復号化ステップと、復号化された前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけを、復号化された前記第1動画像にオーバーレイして表示する表示ステップとを含み、前記管理情報処理ステップでは、前記管理情報に、前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報が含まれるか否かを判断し、前記表示ステップでは、前記管理情報処理ステップで前記管理情報に前記フラグ情報と、前記閾値を示す情報とが含まれると判断された場合に、前記閾値を示す情報を用いて、現部分区間における前記オーバーレイ表示をすることを特徴とする。
また、本発明に係る動画像再生装置は、符号化された第1及び第2動画像を含む映像ストリームを復号化し、前記第2動画像を前記第1動画像にオーバーレイして表示する動画像再生装置であって、前記映像ストリームに対応する管理情報を取得し、取得した管理情報を解釈する管理情報処理部と、前記管理情報処理部による解釈に従って、前記第1及び第2動画像を復号化する復号化部と、復号化された前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけを、復号化された前記第1動画像にオーバーレイして表示する表示部とを備え、前記管理情報処理部は、前記管理情報に、前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とが含まれるか否かを判断し、前記表示部は、前記管理情報処理部で前記管理情報に前記フラグ情報と、前記閾値を示す情報とが含まれると判断された場合に、前記閾値を示す情報を用いて、現部分区間における前記オーバーレイ表示をすることを特徴とする。
また、本発明に係る動画像再生システムは、上記記録媒体と、前記記録媒体に記録されたデータを読み出して再生する動画像再生装置とを備える動画像再生システムであって、前記動画像再生装置は、前記記録媒体から管理情報を読み出して解釈する管理情報処理部と、前記管理情報処理部による解釈に従って、前記記録媒体から前記第1及び第2動画像を読み出して復号化する復号化部と、復号化された前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけを、復号化された前記第1動画像にオーバーレイして表示する表示部とを備え、前記管理情報処理部は、前記管理情報に、前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とが含まれるか否かを判断し、前記表示部は、前記管理情報処理部で前記管理情報に前記フラグ情報と、前記閾値を示す情報とが含まれると判断された場合に、前記閾値を示す情報を用いて、現部分区間における前記オーバーレイ表示をすることを特徴とする。
なお、本発明は、以上のような動画像符号化方法、動画像符号化装置、動画像記録方法、記録媒体、動画像再生方法、動画像再生装置および動画像再生システムとして実現できるだけでなく、上記各方法に含まれるステップをコンピュータに実行させるプログラムとして実現したり、そのプログラムが記録されたDVD等のコンピュータ読み取り可能な記録媒体として実現したり、上記各装置をLSI等の半導体集積回路として実現してもよい。
以上のように、本発明の動画像符号化方法等によれば、連続再生の対象となる区間においては、符号化方式(あるいは、動画像の属性)を切り替えることなく動画像が符号化されるとともに、その区間においては符号化方式が固定であることを示すフラグ情報を含む管理情報を作成される。これにより、このようなデータ構造の動画像及び管理情報を受け取った(あるいは、記録媒体から読み出した)再生装置は、符号化方式あるいは動画像の属性の切り替わりを監視する処理が不要となり、処理負荷が軽減される。
つまり、ピクチャ内ピクチャについては、連続再生区間内の動画像の符号化データにおいて、各画素を透過して表示するかどうかの判定に用いる輝度値の閾値を固定としたことで、閾値の切り替わりに起因する再生時の遅延をなくし、シームレスな再生を実現できる。このため、動画像、グラフィクス、あるいは静止画などに動画像をオーバーレイして表示させるパッケージメディア、配信アプリケーションなどの再生品質を向上できる。また、前記アプリケーションを実現する再生装置の処理負荷を軽減できることから、その実用的価値が高い。
図1は、DVDの構成図である。 図2は、ハイライトの構成図である。 図3は、DVDでの多重化の例を示す図である。 図4は、従来のMPEG−4 AVCストリームにおいてピクチャ単位に適用される可変長符号化方式の例を示す図である。 図5Aは、CABACとCAVLCが適用された符号化ストリームを復号する復号装置の構成を示すブロック図である。 図5Bは、CABACが適用された符号化ストリームを復号する動作を示すフローチャートである。 図5Cは、CAVLCが適用された符号化ストリームを復号する動作を示すフローチャートである。 図6は、従来の復号装置の動作を示すフローチャートである。 図7は、ピクチャ内ピクチャにおける表示例を説明する図である。 図8は、輝度キーの閾値が連続再生区間内で切り替わることに起因する課題を説明する図である。 図9は、実施の形態1の記録媒体に格納されるMPEG−4 AVCストリームにおいてピクチャ単位に適用される可変長符号化の方式の例を示す図である。 図10は、記録媒体において、可変長符号化の方式が固定である単位を示すフラグ情報の格納例を示す図である。 図11は、記録媒体を再生する復号装置の動作を示すフローチャートである。 図12は、多重化装置の構成を示すブロック図である。 図13は、多重化装置の動作を示すフローチャートである。 図14は、図13中のS5201の具体例を示すフローチャートである。 図15は、図13中のS5202の具体例を示すフローチャートである。 図16は、図13中のS5204及びS5205の他の具体例を示すフローチャートである。 図17は、図13中のS5202の具体例を示すフローチャートである。 図18は、BDのデータ階層図である。 図19は、BD上の論理空間の構成図である。 図20は、BDプレーヤの概要ブロック図である。 図21は、BDプレーヤの構成ブロック図である。 図22は、BDのアプリケーション空間の説明図である。 図23は、MPEGストリーム(VOB)の構成図である。 図24は、パックの構成図である。 図25は、AVストリームとプレーヤ構成の関係を説明する図である。 図26は、トラックバッファへのAVデータ連続供給モデル図である。 図27は、VOB情報ファイル構成図である。 図28は、タイムマップの説明図である。 図29は、プレイリストファイルの構成図である。 図30は、プレイリストに対応するプログラムファイルの構成図である。 図31は、BDディスク全体管理情報ファイルの構成図である。 図32は、グローバルイベントハンドラを記録するファイルの構成図である。 図33は、タイムイベントの例を説明する図である。 図34は、ユーザイベントの例を説明する図である。 図35は、グローバルイベントハンドラの例を説明する図である。 図36は、仮想マシンの構成図である。 図37は、プレーヤ変数テーブルの図である。 図38は、イベントハンドラ(タイムイベント)の例を示す図である。 図39は、イベントハンドラ(ユーザイベント)の例を示す図である。 図40は、プレーヤの基本処理のフローチャートである。 図41は、プレイリスト再生処理のフローチャートである。 図42は、イベント処理のフローチャートである。 図43は、字幕処理のフローチャートである。 図44は、輝度キーの閾値を連続再生区間内固定とした例を説明する図である。 図45は、シームレス再生区間において輝度キーの値が固定とすることを説明する図である。 図46は、輝度キーの閾値が固定であることを保証するフラグを説明する図である。 図47は、本発明の記録媒体におけるピクチャ内ピクチャ動作を説明する図である。 図48は、プライマリ・ビデオとセカンダリ・ビデオの多重化について説明する図である。 図49は、本発明の実施の形態2のピクチャ内ピクチャ動作を実現する多重化方法の動作を示すフローチャートである。 図50は、本発明の実施の形態2のピクチャ内ピクチャ動作を実現する多重化方法において、管理情報を生成する動作を説明するフローチャートである。 図51は、本発明の実施の形態2の多重化装置の構成を示すブロック図である。 図52は、ピクチャ内ピクチャのメタ情報に格納される表示属性情報の例を示す図である。 図53は、多重化装置5200によって生成される管理情報のデータ構造を示す図であり、図53(a)は、管理情報の一つであるプレイリストのデータ要素を示し、図53(b)は、シームレス接続される再生区間を示すプレイリストの例を示す図である。 図54は、本発明の実施の形態2のピクチャ内ピクチャ動作を行うプレーヤの動作を示すフローチャートである。 図55Aは、実施の形態3における記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示す図である。 図55Bは、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示す図である。 図55Cは、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す図である。
本発明に係る動画像符号化方法は、連続再生の対象となる区間(連続再生区間)においては、符号化方式(あるいは、動画像の属性)を切り替えることなく動画像を符号化しておくとともに、その区間においては符号化方式が固定であることを示すフラグ情報を含む管理情報を作成しておくことを特徴とする。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
まず、異なる符号化方式(あるいは、異なる属性の動画像)が混在し得るストリームの第1の例、つまり、可変長符号化方式(CAVLC/CABAC)が混在し得る例について、本発明の第1の実施の形態として、説明する。
本実施の形態では、BD−ROMなどのパッケージメディアなどにおいて、動画像の符号化データを復号する際に、可変長符号化方式が切り替わることによる復号動作の遅延、また、同時に必要となるバッファ管理方法の切替えに伴う処理負荷の増加を抑えることのできる記録媒体、およびその再生装置について説明する。ここで、動画像の符号化方式はMPEG−4 AVCとするが、ストリームの途中で可変長符号化方式を切り替えることのできる他の符号化方式であってもよい。
本実施の形態の記録媒体に格納されるMPEG−4 AVCストリームにおいては、可変長符号化の方式を切り替えることのできる単位が制約されるとともに、切替え単位が制約されていること、あるいは制約された切替え単位を示す情報が管理情報に格納される。
図9は、MPEG−4 AVCのストリームにおける、可変長符号化方式の切替え単位の制約例を示す。BD−ROMなどのパッケージメディアにおいては、プレイリストなどによって、動画像の符号化データを連続して再生する単位(以降、連続再生単位と呼ぶ)が示されるため、連続再生単位において可変長符号化方式を固定とすれば、連続して再生される区間において、可変長符号化方式の切替えに伴う復号動作の遅延や、バッファ管理方法の切り替わりによる処理負荷の増加は発生しない。従って、本実施の形態では、連続再生単位において可変長符号化方式を固定とする。図9(a)と図9(b)は、それぞれ、連続再生単位において可変長符号化の方式をCAVLCのみ、CABACのみに制限した例を示す。さらに、連続して再生されるクリップの接続条件には、シームレス接続と、非シームレス接続の2種類がある。ここでの接続とは、同一クリップ内の複数の区間を接続するケースを含めるものとする。非シームレス接続においては、例えば、オープンGOPへの接続時のように復号動作にギャップが発生することがあるため、可変長符号化方式の切り替わりも許容することにして、シームレス接続される連続再生単位において可変長符号化の方式を固定としてもよい。
なお、クリップやランダムアクセス単位(RAU)など連続再生単位とは異なる単位において可変長符号化の方式を固定としてもよい。図9(c)と図9(d)は、クリップ単位で固定とした例、図9(e)はランダムアクセス単位で固定とした例を示す。
次に、管理情報においては、MPEG−4 AVCのストリームにおいて、可変長符号化方式の切替え単位が制約されていることを示すフラグ情報が格納される。ここでは、符号化方式の識別情報をフラグとして使用する。図10は、BD−ROMにおけるフラグの格納例を示す。BD−ROMにおいては、プレイリストから参照される各クリップの符号化方式は、管理情報内のStreamCodingInfoと呼ばれる領域に格納されるため、ここで符号化方式がMPEG−4 AVCであることが示される際には、連続再生単位において可変長符号化の方式が固定であるとする。なお、可変長符号化の方式がCABACであるかCAVLCであるかを別途示してもよい。
なお、可変長符号化方式の切替え単位が制約されていることを示すフラグを別途規定して格納してもよいし、さらに、切替え単位を示す情報を格納してもよい。また、これらの情報は、MPEG−4 AVCのストリーム内に格納してもよい。例えば、ランダムアクセス単位内のピクチャにおいて可変長符号化の方式が固定であることを示す情報を、ランダムアクセス単位の先頭ピクチャにおけるSEI(Supplemental Enhancement Information)、あるいはUnspecifiedのタイプを持つNAL(Network Abstraction Layer)ユニットに格納できる。
なお、MPEG−4 AVCでは、ピクチャ単位の初期化情報を示すPPS(Picture Parameter Set)内のentropy_coding_mode_flagにおいて、可変長符号化の方式がCAVLCであるかCABACであるかが示される。従って、一定の区間において可変長符号化の方式が固定である際には、当該区間におけるピクチャが参照する全てのPPSにおいて、entropy_coding_mode_flagのフィールド値が固定となる。MPEG−4 AVCでは、復号順で所定の区間に存在するピクチャから参照されないPPSを、前記所定の区間に格納することも許されるが、区間内のピクチャから参照されないPPSにおけるentropy_coding_mode_flagのフィールド値については特に制限する必要はない。例えば、ランダムアクセス単位RAU内のピクチャが参照するPPSは、全てランダムアクセス単位RAU内に存在することが保証されるが、ランダムアクセス単位RAU内のピクチャから参照されないPPSがランダムアクセス単位内に存在してもよい。このとき、参照されないPPSは復号に影響しないため、entropy_coding_mode_flagのフィールド値については制限しなくてもよい。ただし、所定区間に含まれるPPSにおけるentropy_coding_mode_flagのフィールド値を一意に定めたほうが扱いが簡単であるため、参照されないPPSも含めてフィールド値を固定としてもよい。
図11は、本実施の形態の記録媒体における連続再生単位の復号動作を示すフローチャートである。連続再生単位においては可変長符号化の方式が固定であるため、図6の従来の復号動作とは異なり、復号途中での2値データのバッファリング、およびバッファ管理方法の切替えは不要となる。各ステップの動作については、図6において同一符号を附したステップと同一であるため、説明を省略する。
さらに、新規の符号化方式として、現在、SMPTE(The Society of
Motion Picture and Television Engineers)でVC−1(非特許文献1)の規格が策定中である。VC−1では、マクロブロック(16×16画素の大きさを有する単位)の符号化方法を示す種々のフラグが定義されている。フラグとしては例えば、スキップマクロブロックであるか否か、フィールドモード/フレームモードのいずれであるか、ダイレクトモードマクロブロックであるか否か、等がある。
拡張された符号化ツールの一つに、ビットプレーン符号化がある。ビットプレーン符号化は、上記のマクロブロックの符号化方法を示すフラグを示す際に用いられる。ビットプレーン符号化では、これらのフラグを1ピクチャ分まとめて、ピクチャヘッダで示すことができる。一般的に隣接するマクロブロックは相関が高いため、フラグにも相関が高くなる。よって、隣接する複数のマクロブロックのフラグをまとめて符号化することにより、フラグを表現する符号量を削減することができる。
ビットプレーン符号化では、7種類の符号化方法が規定されている。うち1つはマクロブロックヘッダで各フラグを符号化する方法であり、この方法はローモード(RAW MODE)と呼ばれ、MPEG−2ビデオ方式やMPEG−4ビジュアル方式と同様の方法となる。残りの6つの方法は、1ピクチャ分のフラグをまとめて符号化する方法であり、隣接するマクロブロックのフラグをどのようにまとめて符号化するかにより、異なる方法が定義されている。この6つの方法としては、例えば、左右に隣接する2つのマクロブロックのフラグをまとめて符号化する方法、水平方向に並ぶ一列のマクロブロックのフラグがすべて「0」であればそれを1ビットの「0」で表し、一列のマクロブロックのフラグに1つでも「1」があれば各フラグをそのまま符号化する方法、等がある。
ビットプレーン符号化でこの7種類のいずれの方法を用いるかは、フラグ毎に独立して、ピクチャ単位で変更することができる。
ここで、ビットプレーン符号化において、マクロブロックヘッダで各フラグを符号化する方法のみを使う場合をモード1、1ピクチャ分のフラグをまとめて符号化する方法のみを使う場合をモード2とすると、モード1とモード2とでは復号時の動作が異なるため、モードの切り替わり部分において処理の負荷が増大し、遅延が発生することがある。そこで、上記可変長符号化の切り替わり単位を制約したのと同様に、ビットプレーン符号化についてもモード1とモード2の切り替わり単位を制約してもよい。例えば、連続再生単位、あるいはシームレス接続される連続再生単位において、モードを固定とする。また、ビットプレーン符号化のモードが所定の単位において固定であることを示すフラグ情報を管理情報に含めてもよい。例えば、StreamCodingInfoにより示される符号化方式をフラグ情報として使用し、符号化方式がVC−1であると示される際には所定の単位においてビットプレーン符号化のモードが固定であるとできる。
さらに、マクロブロックヘッダで各フラグを符号化する方法と1ピクチャ分のフラグをまとめて符号化する方法を共に使える場合をモード3とすると、VC−1の使用される環境に応じて、モード1とモード3を使い分けるケースがある。例えば、処理能力が低い端末向けにはモード1を使い、処理能力が高い端末向けにはモード3を使うことができる。このようなケースでは、所定の再生単位においてモード1、あるいはモード3のどちらか一方に固定することが有効である。さらに、モード1、あるいはモード3のどちらか一方に固定されていることを示すフラグ情報、あるいは、どちらのモードに固定されているかを示す情報を、管理情報、あるいは符号化ストリームに格納できる。なお、モード2とモード3を使い分けてもよい。
図12は、本実施の形態の多重化方法を実現する多重化装置5100の構成を示すブロック図である。多重化装置5100は、切替え単位決定部5101、切替え情報生成部5102、符号化部5103、システム多重化部5104、管理情報作成部5105、結合部5106を備える。以下に、各部の動作について説明する。
切替え単位決定部5101は、可変長符号化の方式を切り替えられる単位を決定し、決定した切替え単位Unitを切替え情報生成部5102、および符号化部5103に入力する。切替え単位は予め定められているものとするが、外部から設定できるようにしてもよい。切替え情報生成部5102は、切替え単位Unitに基づいて、可変長符号化を切替え可能な単位を示す切替え情報SwInfを生成し、管理情報作成部5105に入力する。符号化部5103は、切替え単位Unitの制約を満たすように各クリップのデータを符号化し、符号化データCdata1をシステム多重化部5104に入力する。システム多重化部5104は、符号化データCdata1をシステム多重化し、ストリーム情報StrInf1を管理情報作成部5105に入力し、多重化データMdata1を結合部5106に入力する。BD−ROMではシステム多重化の方式として、ソースパケットと呼ばれる、MPEG−2のトランスポートストリームに4バイトのヘッダを付加した方式が用いられる。また、ストリーム情報StrInf1は、タイムマップなど、多重化データMdata1についての管理情報を生成するための情報を含む。管理情報作成部5105は、ストリーム情報StrInf1に基づいて生成したタイムマップ、および切替え情報SwInfなどを含む管理情報CtrlInf1を生成し、結合部5106に入力する。結合部5106は、管理情報CtrlInf1と多重化データMdata1を結合して記録データDout1として出力する。
なお、オーサリングツールなどでデータを作成する際には、符号化データの生成と、システム多重化あるいは管理情報の作成を別々の装置で行うことがあるが、そのような場合でも、各装置の動作は多重化装置5100における各部と同一にすればよい。
図13は、本実施の形態における記録媒体に格納された多重化データを作成するための多重化方法の動作を示すフローチャートである。本実施の形態の多重化方法は、可変長符号化の方式を切り替えられる単位を決定するステップ(ステップS5201)、決定した単位に基づいてクリップを符号化するステップ(ステップS5202)、および可変長符号化の切替え単位を示すフラグ情報を生成するステップ(ステップS5204)とを備える点において、従来の多重化方法と異なる。
まず、ステップS5201において、可変長符号化の方式を切り替えられる単位を決定する。すなわち、連続再生単位、クリップ、あるいはランダムアクセス単位のいずれの単位で切替え可能であるかを決定する。続いて、ステップS5202では、ステップS5201で決定した切替え単位に基づいてMPEG−4 AVCのクリップのデータを符号化する。ステップS5203では、最終クリップの符号化が終了したかどうかを判定し、終了したと判定された際にはステップS5204に進み、終了していないと判定されればステップS5202に戻りクリップの符号化を繰り返す。ステップS5204では、可変長符号化の切替え単位を示すフラグ情報を生成し、ステップS5205に進む。ステップS5205では、ステップS5204において生成したフラグ情報を含む管理情報を作成し、管理情報とクリップのデータとを多重化して出力する。
図14は、図13中の可変長符号の方式を切り替えられる単位を決定するステップ(S5201)の具体例を示すフローチャートである。同図では、可変長符号の方式を切り替えられる最小単位を図9(c)、図9(d)に示したクリップとしている。ここで、クリップとは、記録媒体上ではAVデータのファイルとして格納され、例えば、MPEG−4 AVCの1つのストリームや、VC−1の1つのストリームを格納した1つのファイルを指す。また、クリップは、トランスポートスリームでは、TSパケットの識別子によって特定されるストリームを指す。
図14において、切り替え単位決定部5101は、符号化対象のピクチャがクリップの開始ピクチャであるか否かを判定し(S5201a)、開始ピクチャでない場合つまりクリップの途中のピクチャである場合には、当該クリップの符号化では可変長符号の方式を切り替え不可と決定する(S5201f)。
開始ピクチャである場合、切り替え単位決定部5101は、開始ピクチャのクリップが、符号化済の直前のクリップとシームレス接続されるか否かを判定し(S5201b)、シームレス接続される場合には、開始ピクチャのクリップの符号化では可変長符号の方式を切り替え不可と決定する(S5201f)。
シームレス接続されない場合、切り替え単位決定部5101は、開始ピクチャのクリップが、マルチアングルを構成するアングルに対応するクリップであるか否かを判定し(S5201c)、当該アングルに対応するクリップである場合には開始ピクチャのクリップの符号化では、当該マルチアングルを構成するアングル間では可変長符号の方式を切り替え不可と決定する(S5201f)。ここで、各アングルにシームレスに接続できるシームレス・マルチアングルにおいては、各アングルの可変長符号化の方式は、マルチアングル区間の直前のクリップと同一の方式に決定される。一方、各アングルにシームレスに接続できることが保証されないノンシームレス・マルチアングルにおいては、各アングルにおいて可変長符号化の方式が同一であれば、当該方式がマルチアングル区間の直前のクリップと異なっていてもよい。
また、切り替え単位決定部5101は、符号化対象のピクチャがクリップの開始ピクチャであって、S5201b〜S5201cのいずれにも該当しない場合(noの場合)には、開始ピクチャのクリップの可変長符号化方式を、符号化済の直前のクリップに対して切り替え可能と決定する(S5201e)。
このように図14のフローチャートでは、切り替え単位決定部5101において切り替えられないと決定されるクリップは、(a)トランスポートストリームのパケット識別子によって特定されるクリップ、(b)シームレス接続の対象となる複数のクリップ、(c)マルチアングルを構成する各アングルに対応する複数のクリップと決定される。なお、S5201a〜S5201cの判定は、どの順序で行ってもよい。なお、マルチアングルの場合についても、シームレス・マルチアングルにおいてのみ、可変長符号化方式を切り替え不可としてもよい。また、クリップはファイル名などパケット識別子とは異なる情報により識別してもよい。また、図14において可変長符号の方式を切り替えられる最小単位が図9(c)、図9(d)に示したクリップである場合を説明したが、図9(e)のようなRAUを最小単位としてもよい。その場合、図中の「クリップ」を「RAU」に読み替えた処理を行えばよい。
図15は、図13中のクリップ符号化ステップ(S5202)の具体例を示すフローチャートである。図15では、MPEG−4 AVCの符号化を行う場合を示している。同図において、符号化部5103は、クリップの符号化開始に先立って当該クリップの可変長符号の方式を切り替え可能か否かを判定する(S5202a)。この判定は、図14での決定に従う。符号化部5103は、切り替え可能と判定された場合には当該クリップの可変長符号化方式を任意に決定し(S5202b)、切り替え可能でないと判定された場合には当該クリップの可変長符号化方式を互いにシームレス接続される直前の、あるいは同一のマルチアングルを構成する他のクリップと同じ方式に決定する(S5202c)。さらに、符号化部5103は、決定された可変長符号化方式を示すフラグをピクチャパラメータセットPPSに設定し(S5202d)、決定された可変長符号化方式に従って当該クリップを符号化する(S5202e)。このフラグは、MPEG4−AVCでは、entoropy_coding_mode_flagと呼ばれる。
このように、符号化部5103は、切り替え可能でないと判定された連続再生区間のクリップに対して可変長符号化の方式を切り替えないで、動画像を符号化することにより符号化データCdata1を生成する。
図16は、図13中のフラグ情報生成ステップ(S5204)および管理情報生成ステップ(S5205)の具体例を示すフローチャートである。
同図において切替え情報生成部5102は、符号化部5103によって符号化されたクリップが、可変長符号化方式を切り替え可能と判定されたクリップであるか否かを判定し(S5204a)、切り替え可能と判定されたクリップである場合には、可変長符号化の方式が固定でないことを示すフラグ情報を生成し、当該クリップに対応付けてフラグ情報をメモリのワーク領域に蓄積し(S5204b)、切り替え可能と判定されたクリップでない場合には、可変長符号化の方式が固定であることを示すフラグ情報を生成し、当該クリップに対応付けてフラグ情報をメモリのワーク領域に蓄積する(S5204c)。さらに、切替え情報生成部5102は、当該クリップが、符号化部5103によって符号化された最後のクリップであるか否かを判定し(S5204d)、最後のクリップでなければ上記S5204a〜S5204cを繰り返し、最後のクリップであればメモリのワーク領域に蓄積されたフラグ情報を切り替え情報SwInfとして管理情報作成部5105に出力する。
さらに、管理情報作成部5105は、プレイリストを含む管理情報を生成し(S5205a)、切り替え情報SwInfを参照して、プレイリストに含まれるプレイアイテムに可変長符号化の方式が固定であることを示すフラグ情報を付加する(S5205b)。なお、フラグ情報は、直前のプレイアイテムにより参照される再生区間と可変長符号化の方式が同一であるかどうかを示すものであってもよい。ここで、プレイリストは、1つ以上のプレイアイテムの再生順を示す。プレイアイテムは、再生すべきクリップを指す情報であり、1つのクリップの全部または一部を再生区間として指す。また、上記フラグ情報は、プレイアイテムに付加されている他のパラメータと兼用してもよい。その場合、例えば、クリップがシームレス接続されることを意味するパラメータ(例えば"connect
ion_condition=5")を上記フラグ情報と兼用することができる。なぜなら、図14において、切り替えられないと決定される連続再生区間(可変長符号化の方式が固定である区間)は、(a)トランスポートストリームのパケット識別子によって特定されるクリップ、(b)シームレス接続の対象となる複数のクリップ、(c)マルチアングルを構成する各アングルに対応する複数のクリップであり、このうち(b)はシームレス接続が前提だからである。また、マルチアングル区間であるかどうかは、"is_multi_angle"と呼ばれるフラグによって示すことができるため、本フラグを可変長符号化の方式が固定であることを示すフラグと兼用してもよい。これにより、管理情報のデータ量を削減することができる。
図17は、図13中のクリップ符号化ステップ(S5202)の他の具体例を示すフローチャートである。図17では、VC−1の符号化を行う場合を示している。同図において、符号化部5103は、クリップの符号化開始に先立って当該クリップの可変長符号の方式を、ローモードとそれ以外のモードとの間で切り替え可能か否かを判定する(S5202a)。この判定は、図14での決定に従う。符号化部5103は、切り替え可能と判定された場合には当該クリップのビットプレーン符号化の方式を任意に決定し(S5202f)、切り替え可能でないと判定された場合には当該クリップのビットプレーン符号化方式を直前のクリップと同じ方式に決定する(S5202g)。符号化部5103は、決定されたビットプレーン符号化方式がローモード(RAW MODE)であるかそれ以外の方式であるかを判定する(S5202h)。符号化部5103は、モードを示す情報をピクチャ単位に付加し、ローモード(RAW MODE)であると判定された場合、マクロブロックMB毎の所定の情報を各マクロブロックにおいて符号化し(S5202i)、ローモード(RAW MODE)でないと判定された場合、マクロブロックMB毎の所定の情報をピクチャの先頭にまとめて設定し、当該クリップを符号化する(S5202j)。なお、前記モードを示す情報は、VC−1においてはIMODEと呼ばれるフィールドにより示される。
このように、符号化部5103は、切り替え可能でないと判定された連続再生区間のクリップに対してビットプレーン符号化の方式を切り替えないで、動画像を符号化することにより符号化データCdata1を生成する。
なお、上記プレイリストは光ディスクにおける使用に限定されるものではなく、ネットワーク経由でストリームを受信する際に、まずプレイリストを受信して解析し、受信するストリームを決定した後に、実際のストリームの受信を開始するような使い方も可能である。また、ストリームをRTP(Real−time Transport Protocol)のパケットやTSパケットなどにパケット化してからIP(Internet Protocol)網で伝送する際にも、再生制御情報として、例えばSDP(Session Description Protocol)などにより、再生区間において可変長符号化の方式が固定であるかどうかを示してもよい。
以下に、本実施の形態に係る動画像符号化方法により生成したデータを格納したBD−ROMディスクのデータ構造、および当該ディスクを再生するプレーヤの構成について示す。
(ディスク上の論理データ構造)
図18は、BD−ROMの構成、特にディスク媒体であるBDディスク104と、ディスクに記録されているデータ101、102、103の構成を示す図である。BDディスク104に記録されるデータは、AVデータ103と、AVデータに関する管理情報およびAV再生シーケンスなどのBD管理情報102と、インタラクティブを実現するBD再生プログラム101である。本実施の形態では、説明の都合上、映画のAVコンテンツを再生するためのAVアプリケーションを主眼においてのBDディスクの説明を行うが、他の用途として用いても勿論同様である。
図19は、上述したBDディスクに記録されている論理データのディレクトリ・ファイル構成を示した図である。BDディスクは、他の光ディスク、例えばDVDやCDなどと同様にその内周から外周に向けてらせん状に記録領域を持ち、内周のリード・インと外周のリード・アウトの間に論理データを記録できる論理アドレス空間を有している。また、リード・インの内側にはBCA(Burst Cutting Area)と呼ばれるドライブでしか読み出せない特別な領域がある。この領域はアプリケーションから読み出せないため、例えば著作権保護技術などに利用されることがある。
論理アドレス空間には、ファイルシステム情報(ボリューム)を先頭に映像データなどのアプリケーションデータが記録されている。ファイルシステムとは従来技術で説明した通り、UDFやISO9660などのことであり、通常のPCと同じように記録されている論理データをディレクトリ、ファイル構造を使って読み出しする事が可能になっている。
本実施例の場合、BDディスク上のディレクトリ、ファイル構造は、ルートディレクトリ(ROOT)直下にBDVIDEOディレクトリが置かれている。このディレクトリはBDで扱うAVコンテンツや管理情報などのデータ(図18で説明した101、102、103)が格納されているディレクトリである。
BDVIDEOディレクトリの下には、次の7種類のファイルが記録されている。
BD.INFO(ファイル名固定)
「BD管理情報」の一つであり、BDディスク全体に関する情報を記録したファイルである。BDプレーヤは最初にこのファイルを読み出す。
BD.PROG(ファイル名固定)
「BD再生プログラム」の一つであり、BDディスク全体に関わる再生制御情報を記録したファイルである。
XXX.PL(「XXX」は可変、拡張子「PL」は固定)
「BD管理情報」の一つであり、シナリオ(再生シーケンス)であるプレイリスト情報を記録したファイルである。プレイリスト毎に1つのファイルを持っている。
XXX.PROG(「XXX」は可変、拡張子「PROG」は固定)
「BD再生プログラム」の一つであり、前述したプレイリスト毎の再生制御情報を記録したファイルである。プレイリストとの対応はファイルボディ名(「XXX」が一致する)によって識別される。
YYY.VOB(「YYY」は可変、拡張子「VOB」は固定)
「AVデータ」の一つであり、VOB(従来例で説明したVOBと同じ)を記録したファイルである。VOB毎に1つのファイルを持っている。
YYY.VOBI(「YYY」は可変、拡張子「VOBI」は固定)
「BD管理情報」の一つであり、AVデータであるVOBに関わるストリーム管理情報を記録したファイルである。VOBとの対応はファイルボディ名(「YYY」が一致する)によって識別される。
ZZZ.PNG(「ZZZ」は可変、拡張子「PNG」は固定)
「AVデータ」の一つであり、字幕およびメニューを構成するためのイメージデータPNG(W3Cによって標準化された画像フォーマットであり「ピング」と読む)を記録したファイルである。1つのPNGイメージ毎に1つのファイルを持つ。
(プレーヤの構成)
次に、前述したBDディスクを再生するプレーヤの構成について図20および図21を用いて説明する。
図20は、プレーヤの大まかな機能構成を示すブロック図である。
BDディスク201上のデータは、光ピックアップ202を通して読み出される。読み出されたデータは夫々のデータの種類に応じて専用のメモリに転送される。BD再生プログラム(「BD.PROG」または「XXX.PROG」ファイルの中身)はプログラム記録メモリ203に、BD管理情報(「BD.INFO」、「XXX.PL」または「YYY.VOBI」)は管理情報記録メモリ204に、AVデータ(「YYY.VOB」または「ZZZ.PNG」)はAV記録メモリ205に夫々転送される。
プログラム記録メモリ203に記録されたBD再生プログラムはプログラム処理部206によって、管理情報記録メモリ204に記録されたBD管理情報は管理情報処理部207によって、また、AV記録メモリ205に記録されたAVデータはプレゼンテーション処理部208によって夫々処理される。
プログラム処理部206は、管理情報処理部207より再生するプレイリストの情報やプログラムの実行タイミングなどのイベント情報を受け取りプログラムの処理を行う。また、プログラムでは再生するプレイリストを動的に変える事が可能であり、この場合は管理情報処理部207に対してプレイリストの再生命令を送ることで実現する。プログラム処理部206は、ユーザからのイベント、即ちリモコンキーからのリクエストを受け、ユーザイベントに対応するプログラムがある場合は、それを実行する。
管理情報処理部207は、プログラム処理部206の指示を受け、対応するプレイリストおよびプレイリストに対応したVOBの管理情報を解析し、プレゼンテーション処理部208に対象となるAVデータの再生を指示する。また、管理情報処理部207は、プレゼンテーション処理部208より基準時刻情報を受け取り、時刻情報に基づいてプレゼンテーション処理部208にAVデータ再生の停止指示を行い、また、プログラム処理部206に対してプログラム実行タイミングを示すイベントを生成する。
プレゼンテーション処理部208は、映像、音声、字幕/イメージ(静止画)の夫々に対応するデコーダを持ち、管理情報処理部207からの指示に従い、AVデータのデコードおよび出力を行う。映像データ、字幕/イメージの場合は、デコード後に夫々の専用プレーン、ビデオプレーン210およびイメージプレーン209に描画され、合成処理部211によって映像の合成処理が行われTVなどの表示デバイスへ出力される。
このように図20に示すように、BDプレーヤは図18で示したBDディスクに記録されているデータ構成に基づいた機器構成をとっている。
図21は前述したプレーヤ構成を詳細化したブロック図である。図21では、AV記録メモリ205はイメージメモリ308とトラックバッファ309に、プログラム処理部206はプログラムプロセッサ302とUOPマネージャ303に、管理情報処理部207はシナリオプロセッサ305とプレゼンテーションコントローラ306に、プレゼンテーション処理部208はクロック307、デマルチプレクサ310、イメージプロセッサ311、ビデオプロセッサ312とサウンドプロセッサ313に夫々対応/展開している。
BDディスク201から読み出されたVOBデータ(MPEGストリーム)はトラックバッファ309に、イメージデータ(PNG)はイメージメモリ308に夫々記録される。デマルチプレクサ310がクロック307の時刻に基づき、トラックバッファ309に記録されたVOBデータを抜き出し、映像データをビデオプロセッサ312に音声データをサウンドプロセッサ313に夫々送り込む。ビデオプロセッサ312およびサウンドプロセッサ313は夫々MPEGシステム規格で定める通りに、デコーダバッファとデコーダから夫々構成されている。即ち、デマルチプレクサ310から送りこまれる映像、音声夫々のデータは、夫々のデコーダバッファに一時的に記録され、クロック307に従い個々のデコーダでデコード処理される。
イメージメモリ308に記録されたPNGは、次の2つの処理方法がある。
イメージデータが字幕用の場合は、プレゼンテーションコントローラ306によってデコードタイミングが指示される。クロック307からの時刻情報をシナリオプロセッサ305が一旦受け、適切な字幕表示が行えるように、字幕表示時刻(開始および終了)になればプレゼンテーションコントローラ306に対して字幕の表示、非表示の指示を出す。プレゼンテーションコントローラ306からデコード/表示の指示を受けたイメージプロセッサ311は対応するPNGデータをイメージメモリ308から抜き出し、デコードし、イメージプレーン314に描画する。
次に、イメージデータがメニュー用の場合は、プログラムプロセッサ302によってデコードタイミングが指示される。プログラムプロセッサ302が何時イメージのデコードを指示するかは、プログラムプロセッサ302が処理しているBDプログラムに因るものであって一概には決まらない。
イメージデータおよび映像データは、図20で説明したように夫々デコード後にイメージプレーン314、ビデオプレーン315に出力され、合成処理部316によって合成後出力される。
BDディスク201から読み出された管理情報(シナリオ、AV管理情報)は、管理情報記録メモリ304に格納されるが、シナリオ情報(「BD.INFO」および「XXX.PL」)はシナリオプロセッサ305へ読み込み処理される。また、AV管理情報(「YYY.VOBI」)はプレゼンテーションコントローラ306によって読み出され処理される。
シナリオプロセッサ305は、プレイリストの情報を解析し、プレイリストによって参照されているVOBとその再生位置をプレゼンテーションコントローラ306に指示し、プレゼンテーションコントローラ306は対象となるVOBの管理情報(「YYY.VOBI」)を解析して、対象となるVOBを読み出すようにドライブコントローラ317に指示を出す。
ドライブコントローラ317はプレゼンテーションコントローラ306の指示に従い、光ピックアップを移動させ、対象となるAVデータの読み出しを行う。読み出されたAVデータは、前述したようにイメージメモリ308またはトラックバッファ309に読み出される。
また、シナリオプロセッサ305は、クロック307の時刻を監視し、管理情報で設定されているタイミングでイベントをプログラムプロセッサ302に投げる。
プログラム記録メモリ301に記録されたBDプログラム(「BD.PROG」または「XXX.PROG」)は、プログラムプロセッサ302によって実行処理される。プログラムプロセッサ302がBDプログラムを処理するのは、シナリオプロセッサ305からイベントが送られてきた場合か、UOPマネージャ303からイベントが送られてきた場合である。UOPマネージャ303は、ユーザからリモコンキーによってリクエストが送られてきた場合に、プログラムプロセッサ302に対するイベントを生成する。
(アプリケーション空間)
図22は、BDのアプリケーション空間を示す図である。
BDのアプリケーション空間では、プレイリスト(PlayList)が一つの再生単位になっている。プレイリストはセル(Cell)の連結で、連結の順序により決定される再生シーケンスである静的なシナリオと、プログラムによって記述される動的なシナリオを有している。プログラムによる動的なシナリオが無い限り、プレイリストは個々のセルを順に再生するだけであり、また、全てのセルの再生を終了した時点でプレイリストの再生は終了する。一方で、プログラムは、プレイリストを超えての再生記述や、ユーザ選択またはプレーヤの状態によって再生する対象を動的に変えることが可能である。典型的な例としてはメニューがあげられる。BDの場合、メニューとはユーザの選択によって再生するシナリオと定義でき、プログラムによってプレイリストを動的に選択することである。
ここで言うプログラムとは、時間イベントまたはユーザイベントによって実行されるイベントハンドラの事である。
時間イベントは、プレイリスト中に埋め込まれた時刻情報に基づいて生成されるイベントである。図21で説明したシナリオプロセッサ305からプログラムプロセッサ302に送られるイベントがこれに相当する。時間イベントが発行されると、プログラムプロセッサ302はIDによって対応付けられるイベントハンドラを実行処理する。前述した通り、実行されるプログラムが他のプレイリストの再生を指示することが可能であり、この場合には、現在再生されているプレイリストの再生は中止され、指定されたプレイリストの再生へと遷移する。
ユーザイベントは、ユーザのリモコンキー操作によって生成されるイベントである。ユーザイベントは大きく2つのタイプに分けられる。一つ目は、カーソルキー(「上」「下」「左」「右」キー)または「決定」キーの操作によって生成されるメニュー選択のイベントである。メニュー選択のイベントに対応するイベントハンドラはプレイリスト内の限られた期間でのみ有効であり(プレイリストの情報として、個々のイベントハンドラの有効期間が設定されている)、リモコンの「上」「下」「左」「右」キーまたは「決定」キーが押された時に有効なイベントハンドラを検索して、有効なイベントハンドラがある場合は当該イベントハンドラが実行処理される。他の場合は、メニュー選択のイベントは無視されることになる。
二つ目のユーザイベントは、「メニュー」キーの操作によって生成されるメニュー呼び出しのイベントである。メニュー呼び出しのイベントが生成されると、グローバルイベントハンドラが呼ばれる。グローバルイベントハンドラはプレイリストに依存せず、常に有効なイベントハンドラである。この機能を使うことにより、DVDのメニューコール(タイトル再生中に音声、字幕メニューなどを呼び出し、音声または字幕を変更後に中断した地点からのタイトル再生を実行する機能等)を実装することができる。
プレイリストで静的シナリオを構成する単位であるセル(Cell)はVOB(MPEGストリーム)の全部または一部の再生区間を参照したものである。セルはVOB内の再生区間を開始、終了時刻の情報として持っている。個々のVOBと一対になっているVOB管理情報(VOBI)は、その内部にデータの再生時刻に対応した記録アドレスのテーブル情報であるタイムマップ(Time MapまたはTMAP)を有しており、このタイムマップによって前述したVOBの再生、終了時刻をVOB内(即ち対象となるファイル「YYY.VOB」内)での読み出し開始アドレスおよび終了アドレスを導き出すことが可能である。なおタイムマップの詳細は後述する。
(VOBの詳細)
図23は、本実施例で使用するMPEGストリーム(VOB)の構成図である。
図23に示すように、VOBは複数のVOBU(Video Object Unit)によって構成されている。VOBUは、MPEGビデオストリームで言うGOP(Group Of Pictures)を基準として、音声データも含んだ多重化ストリームとしての一再生単位である。VOBUは1.0秒以下のビデオ再生時間を持ち、通常は0.5秒程度の再生時間を持っている。
VOBU先頭のTSパケット(MPEG−2 Transport Stream Packet)は、シーケンスヘッダとそれに続くGOPヘッダとIピクチャ(Intra−coded)を格納しており、このIピクチャからの復号が開始可能なようになっている。また、このVOBU先頭のIピクチャの先頭を含むTSパケットのアドレス(開始アドレス)と、この開始アドレスからIピクチャの最後を含むTSパケットまでのアドレス(終了アドレス)と、このIピクチャの再生開始時刻(PTS)をタイムマップで管理している。したがって、タイムマップのエントリはVOBU先頭のTSパケットごとに与えられている。
VOBUは、その内部にビデオパケット(V_PKT)とオーディオパケット(A_PKT)を有している。各パケットは188バイトであり、図23に図示してはいないが、各TSパケットの直前には、そのTSパケットの相対的なデコーダ供給開始時刻であるATS(Arrival Time Stamp)が付与されている。
ATSを各TSパケットごとに付与するのは、このTSストリームのシステムレートが固定レートでなく、可変レートであるためである。一般的にシステムレートを固定にする場合にはNULLパケットと呼ばれるダミーのTSパケットを挿入することになるが、限られた記録容量の中に高画質で記録するためには、可変レートが適しており、BDではATS付きのTSストリームとして記録している。
図24は、TSパケットの構成を示した図である。
図24に示すように、TSパケットは、TSパケットヘッダと、適用フィールドと、ペイロード部から構成される。TSパケットヘッダにはPID(Packet Identifier)が格納され、これにより、TSパケットがどのような情報を格納しているのか識別される。適用フィールドにはPCR(Program Clock Reference)が格納される。PCRはストリームをデコードする機器の基準クロック(System Time Clock、STCと呼ぶ)の参照値である。機器は典型的にはPCRのタイミングでシステムストリームをデマルチプレクスし、ビデオストリーム等の各種ストリームを再構築する。ペイロードにはPESパケットが格納される。
PESパケットヘッダには、DTS(Decoding Time Stamp)とPTS(Presentation Time Stamp)が格納される。DTSは当該PESパケットに格納されるピクチャ/オーディオフレームのデコードタイミングを示し、PTSは映像音声出力等のプレゼンテーションタイミングを示す。ビデオデータおよびオーディオデータといったエレメンタリデータは、PESパケットペイロード(PES Packet Payload)と呼ばれるパケット(PES Packet)のデータ格納領域に先頭から順次入れられていく。PESパケットヘッダには、ペイロードに格納してあるデータがどのストリームなのかを識別するためのID(stream_id)も記録されている。
TSストリームの詳細についてはISO/IEC13818−1で規定されており、BDで特徴的なのはATSを各TSパケットごとに付与したことである。
(VOBのインターリーブ記録)
次に図25および図26を用いてVOBファイルのインターリーブ記録について説明する。
図25上段は、前述したプレーヤ構成図の一部である。図の通り、BDディスク上のデータは、光ピックアップを通してVOB即ちMPEGストリームであればトラックバッファへ入力され、PNG即ちイメージデータであればイメージメモリへと入力される。
トラックバッファはFIFOであり、入力されたVOBのデータは入力された順にデマルチプレクサへと送られる。この時、前述したATSに従って個々のTSパケットはトラックバッファから引き抜かれデマルチプレクサを介してビデオプロセッサまたはサウンドプロセッサへとデータが送り届けられる。一方で、イメージデータの場合は、どのイメージを描画するかはプレゼンテーションコントローラによって指示される。また、描画に使ったイメージデータは、字幕用イメージデータの場合は同時にイメージメモリから削除されるが、メニュー用のイメージデータの場合は、そのメニュー描画中はイメージメモリ内にそのまま残される。これはメニューの描画はユーザ操作に依存しており、ユーザの操作に追従してメニューの一部分を再表示もしくは異なるイメージに置き換えることがあり、その際に再表示される部分のイメージデータをデコードし易くするためである。
図25下段は、BDディスク上でのVOBファイルおよびPNGファイルのインターリーブ記録を示す図である。一般的にROM、例えばCD−ROMやDVD−ROMの場合、一連の連続再生単位となるAVデータは連続記録されている。これは、連続記録されている限り、ドライブは順次データを読み出し、デコーダに送り届けるだけで良いが、連続データが分断されてディスク上に離散配置されている場合は、個々の連続再生区間の間でシーク操作が入ることになり、この間データの読み出しが止まることになり、データの供給が止まる可能性があるからである。BDの場合も同様に、VOBファイルは連続領域に記録することができる方が望ましいが、例えば字幕データのようにVOBに記録されている映像データと同期して再生されるデータがあり、VOBファイルと同様に字幕データも何らかの方法によってBDディスクから読み出す事が必要になる。
字幕データの読み出し方法の一手段として、VOBの再生開始前に一まとめで字幕用のイメージデータ(PNGファイル)を読み出してしまう方法がある。しかしながら、この場合には大量のメモリが必要となり、非現実的である。
そこで、VOBファイルを幾つかのブロックに分けて、イメージデータとインターリーブ記録する方式を使用している。図25下段はそのインターリーブ記録を説明した図である。
VOBファイルとイメージデータを適切にインターリーブ配置することで、前述したような大量の一時記録メモリ無しに、必要なタイミングでイメージデータをイメージメモリに格納することが可能になる。しかしながらイメージデータを読み出している際には、VOBデータの読み込みは当然のことながら停止することになる。
図26は、この問題を解決するトラックバッファを使ったVOBデータ連続供給モデルを説明する図である。
既に説明したように、VOBのデータは、一旦トラックバッファに蓄積される。トラックバッファへのデータ入力レート(Va)とトラックバッファからのデータ出力レート(Vb)の間に差(Va>Vb)を設けると、BDディスクからデータを読み出し続けている限り、トラックバッファのデータ蓄積量は増加をしていくことになる。
図26の上段に記すようにVOBの一連続記録領域が論理アドレスの"a1"から"a2"まで続くとする。"a2"から"a3"の間は、イメージデータが記録されていて、VOBデータの読み出しが行えない区間であるとする。
図26の下段は、トラックバッファの内部を示す図である。横軸が時間、縦軸がトラックバッファ内部に蓄積されているデータ量を示している。時刻"t1"がVOBの一連続記録領域の開始点である"a1"の読み出しを開始した時刻を示している。この時刻以降、トラックバッファにはレートVa−Vbでデータが蓄積されていくことになる。このレートは言うまでもなくトラックバッファの入出力レートの差である。時刻"t2"は一連続記録領域の終了点である"a2"のデータを読み込む時刻である。即ち時刻"t1"から"t2"の間レートVa−Vbでトラックバッファ内はデータ量が増加していき、時刻"t2"でのデータ蓄積量B(t2)は下式によって求めることができる。
B(t2) = (Va−Vb)×(t2−t1) (式1)
この後、BDディスク上のアドレス"a3"まではイメージデータが続くため、トラックバッファへの入力は0となり、出力レートである"−Vb"でトラックバッファ内のデータ量は減少していくことになる。これは読み出し位置"a3"まで、時刻でいう"t3"までになる。
ここで大事なことは、時刻"t3"より前にトラックバッファに蓄積されているデータ量が0になると、デコーダへ供給するVOBのデータが無くなってしまい、VOBの再生がストップしてしまう可能性がある。しかしながら、時刻"t3"でトラックバッファにデータが残っている場合には、VOBの再生がストップすることなく連続できることを意味している。
この条件は下式によって示すことができる。
B(t2) ≧ Vb×(t3−t2) (式2)
即ち、式2を満たすようにイメージデータ(非VOBデータ)の配置を決めればよい事になる。
(ナビゲーションデータ構造)
図27から図33を用いて、BDのナビゲーションデータ(BD管理情報)構造について説明をする。
図27は、VOB管理情報ファイル("YYY.VOBI")の内部構造を示した図である。
VOB管理情報は、当該VOBのストリーム属性情報(Attribute)とタイムマップを有している。ストリーム属性は、ビデオ属性(Video)、オーディオ属性(Audio#0〜Audio#m)を個々に持つ構成となっている。特にオーディオストリームの場合は、VOBが複数本のオーディオストリームを同時に持つことができることから、オーディオストリーム数(Number)によって、データフィールドの有無を示している。
下記はビデオ属性(Video)の持つフィールドと夫々が持ち得る値である。
圧縮方式(Coding):
MPEG1
MPEG2
MPEG4
MPEG4−AVC(Advanced Video Coding)
解像度(Resolution):
1920x1080
1440x1080
1280x720
720x480
720x565
アスペクト比(Aspect):
4:3
16:9
フレームレート(Framerate):
60
59.94(60/1.001)
50
30
29.97(30/1.001)
25
24
23.976(24/1.001)
下記はオーディオ属性(Audio)の持つフィールドと夫々が持ち得る値である。
圧縮方式(Coding):
AC3
MPEG1
MPEG2
LPCM
チャンネル数(Ch):
1〜8
言語属性(Language):
タイムマップ(TMAP)はVOBU毎の情報を持つテーブルであって、当該VOBが有するVOBU数(Number)と各VOBU情報(VOBU#1〜VOBU#n)を持つ。個々のVOBU情報は、VOBU先頭TSパケット(Iピクチャ開始)のアドレスI_startと、そのIピクチャの終了アドレスまでのオフセットアドレス(I_end)、およびそのIピクチャの再生開始時刻(PTS)から構成される。
なお、I_endの値はオフセット値、すなわちIピクチャのサイズを持たせるのではなく、実際のIピクチャの終了アドレスを持たせてもよい。
図28はVOBU情報の詳細を説明する図である。
広く知られているように、MPEGビデオストリームは高画質記録するために可変ビットレート圧縮されることがあり、その再生時間とデータサイズ間に単純な相関はない。逆に、音声の圧縮規格であるAC3は固定ビットレートでの圧縮を行っているため、時間とアドレスとの関係は1次式によって求めることができる。しかしながらMPEGビデオデータの場合は、個々のフレームは固定の表示時間、例えばNTSCの場合は1フレームは1/29.97秒の表示時間を持つが、個々のフレームの圧縮後のデータサイズは絵の特性や圧縮に使ったピクチャタイプ、いわゆるI/P/Bピクチャによってデータサイズは大きく変わってくる。従って、MPEGビデオの場合は、時間とアドレスの関係は一次式の形で表現することは不可能である。
当然の事として、MPEGビデオデータを多重化しているMPEGシステムストリーム、即ちVOBも時間とデータサイズとを一次式の形で表現することは不可能である。このため、VOB内での時間とアドレスとの関係を結びつけるのがタイムマップ(TMAP)である。
このようにして、ある時刻情報が与えられた場合、先ずは当該時刻がどのVOBUに属するのかを検索(VOBU毎のPTSを追っていく)して、当該時刻の直前のPTSをTMAPに持つVOBUに飛びこみ(I_startで指定されたアドレス)、VOBU先頭のIピクチャから復号を開始し、当該時刻のピクチャから表示を開始する。
次に図29を使って、プレイリスト情報("XXX.PL")の内部構造を説明する。
プレイリスト情報は、セルリスト(CellList)とイベントリスト(EventList)から構成されている。
セルリスト(CellList)は、プレイリスト内の再生セルシーケンスであり、本リストの記述順でセルが再生される事になる。セルリスト(CellList)の中身は、セルの数(Number)と各セル情報(Cell#1〜Cell#n)である。
セル情報(Cell#)は、VOBファイル名(VOBName)、当該VOB内での開始時刻(In)および終了時刻(Out)と、字幕テーブル(SubtitleTable)を持っている。開始時刻(In)および終了時刻(Out)は、夫々当該VOB内でのフレーム番号で表現され、前述したタイムマップを使うことによって再生に必要なVOBデータのアドレスを得る事ができる。
字幕テーブル(SubtitleTable)は、当該VOBと同期再生される字幕情報を持つテーブルである。字幕は音声同様に複数の言語を持つことができ、字幕テーブル(SubtitleTable)は、最初の情報である言語数(Number)とそれに続く個々の言語ごとのテーブル(Language#1〜Language#k)から構成されている。
各言語のテーブル(Language#)は、言語情報(Lang)と、個々に表示される字幕の字幕情報数(Number)と、個々に表示される字幕の字幕情報(Speech#1〜Speech#j)から構成され、字幕情報(Speech#)は対応するイメージデータファイル名(Name)、字幕表示開始時刻(In)および字幕表示終了時刻(Out)と、字幕の表示位置(Position)から構成されている。
イベントリスト(EventList)は、当該プレイリスト内で発生するイベントを定義したテーブルである。イベントリストは、イベント数(Number)に続いて個々のイベント(Event#1〜Event#m)から構成され、個々のイベント(Event#)は、イベントの種類(Type)、イベントのID(ID)、イベント発生時刻(Time)と有効期間(Duration)から構成されている。
図30は、個々のプレイリスト毎のイベントハンドラ(時間イベントと、メニュー選択用のユーザイベント)を持つイベントハンドラテーブル("XXX.PROG")である。
イベントハンドラテーブルは、定義されているイベントハンドラ/プログラム数(Number)と個々のイベントハンドラ/プログラム(Program#1〜Program#n)を有している。各イベントハンドラ/プログラム(Program#)内の記述は、イベントハンドラ開始の定義(<event_handler>タグ)と前述したイベントのIDと対になるイベントハンドラのID(ID)を持ち、その後に当該プログラムもFunctionに続く括弧"{"と"}"の間に記述する。前述の"XXX.PL"のイベントリスト(EventList)に格納されたイベント(Event#1〜Event#m)は"XXX.PROG"のイベントハンドラのID(ID)を用いて特定される。
次に図31を用いてBDディスク全体に関する情報("BD.INFO")の内部構造を説明する。
BDディスク全体情報は、タイトルリスト(TitleList)とグローバルイベント用のイベントテーブル(EventList)から構成されている。
タイトルリスト(TitleList)は、ディスク内のタイトル数(Number)と、これに続く各タイトル情報(Title#1〜Title#n)から構成されている。個々のタイトル情報(Title#)は、タイトルに含まれるプレイリストのテーブル(PLTable)とタイトル内のチャプタリスト(ChapterList)を含んでいる。プレイリストのテーブル(PLTable)はタイトル内のプレイリストの数(Number)と、プレイリスト名(Name)即ちプレイリストのファイル名を有している。
チャプタリスト(ChapterList)は、当該タイトルに含まれるチャプタ数(Number)と個々のチャプタ情報(Chapter#1〜Chapter#n)から構成され、個々のチャプタ情報(Chapter#)は当該チャプタが含むセルのテーブル(CellTable)を持ち、セルのテーブル(CellTable)はセル数(Number)と個々のセルのエントリ情報(CellEntry#1〜CellEntry#k)から構成されている。セルのエントリ情報(CellEntry#)は当該セルを含むプレイリスト名と、プレイリスト内でのセル番号によって記述されている。
イベントリスト(EventList)は、グローバルイベントの数(Number)と個々のグローバルイベントの情報を持っている。ここで注意すべきは、最初に定義されるグローバルイベントは、ファーストイベント(FirstEvent)と呼ばれ、BDディスクがプレーヤに挿入された時、最初に呼ばれるイベントである。グローバルイベント用イベント情報はイベントタイプ(Type)とイベントのID(ID)だけを持っている。
図32は、グローバルイベントハンドラのプログラムのテーブル("BD.PROG")である。
本テーブルは、図30で説明したイベントハンドラテーブルと同一内容である。
(イベント発生のメカニズム)
図33から図35を使ってイベント発生のメカニズムについて説明する。
図33はタイムイベントの例である。
前述したとおり、タイムイベントはプレイリスト情報("XXX.PL")のイベントリスト(EventList)で定義される。タイムイベントとして定義されているイベント、即ちイベントタイプ(Type)が"TimeEvent"の場合、イベント生成時刻("t1")になった時点で、ID"Ex1"を持つタイムイベントがシナリオプロセッサからプログラムプロセッサに対してあげられる。プログラムプロセッサは、イベントID"Ex1"を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施例の場合では、2つのボタンイメージの描画を行うなどを行うことができる。
図34はメニュー操作を行うユーザイベントの例である。
前述したとおり、メニュー操作を行うユーザイベントもプレイリスト情報("XXX.PL")のイベントリスト(EventList)で定義される。ユーザイベントとして定義されるイベント、即ちイベントタイプ(Type)が"UserEvent"の場合、イベント生成時刻("t1")になった時点で、当該ユーザイベントがレディとなる。この時、イベント自身は未だ生成されてはいない。当該イベントは、有効期間情報(Duration)で記される期間レディ状態にある。
図34に描くように、ユーザがリモコンキーの「上」「下」「左」「右」キーまたは「決定」キーを押した場合、先ずUOPイベントがUOPマネージャによって生成されプログラムプロセッサに上げられる。プログラムプロセッサは、シナリオプロセッサに対してUOPイベントを流し、シナリオプロセッサはUOPイベントを受け取った時刻に有効なユーザイベントが存在するかを検索し、対象となるユーザイベントがあった場合は、ユーザイベントを生成し、プログラムプロセッサに持ち上げる。プログラムプロセッサでは、イベントID"Ev1"を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施例の場合では、プレイリスト#2の再生を開始する。
生成されるユーザイベントには、どのリモコンキーがユーザによって押されたかの情報は含まれていない。選択されたリモコンキーの情報は、UOPイベントによってプログラムプロセッサに伝えられ、仮想プレーヤが持つレジスタSPRM(8)に記録保持される。イベントハンドラのプログラムは、このレジスタの値を調べ分岐処理を実行することが可能である。
図35はグローバルイベントの例である。
前述したとおり、グローバルイベントはBDディスク全体に関する情報("BD.INFO")のイベントリスト(EventList)で定義される。グローバルイベントとして定義されるイベント、即ちイベントタイプ(Type)が"GlobalEvent"の場合、ユーザのリモコンキー操作があった場合にのみイベントが生成される。
ユーザが"メニュー"を押した場合、先ずUOPイベントがUOPマネージャによって生成されプログラムプロセッサに上げられる。プログラムプロセッサは、シナリオプロセッサに対してUOPイベントを流し、シナリオプロセッサは、該当するグローバルイベントを生成し、プログラムプロセッサに送る。プログラムプロセッサでは、イベントID"menu"を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施例の場合ではプレイリスト#3の再生を開始している。
本実施例では、単に"メニュー"キーと呼んでいるが、DVDのように複数のメニューキーがあってもよい。各メニューキーに対応するIDを夫々定義することで対応することが可能である。
(仮想プレーヤマシン)
図36を用いてプログラムプロセッサの機能構成を説明する。
プログラムプロセッサは、内部に仮想プレーヤマシンを持つ処理モジュールである。仮想プレーヤマシンはBDとして定義された機能モデルであって、各BDプレーヤの実装には依存しないものである。即ち、どのBDプレーヤにおいても同様の機能を実行できることを保証している。
仮想プレーヤマシンは大きく2つの機能を持っている。プログラミング関数とプレーヤ変数(レジスタ)である。プログラミング関数は、Java(登録商標)Scriptをベースとして、以下に記す機能をBD固有関数として定義している。
リンク関数:現在の再生を停止し、指定するプレイリスト、セル、時刻からの再生を開始する
Link(PL#,Cell#,time)
PL# : プレイリスト名
Cell# : セル番号
time : セル内での再生開始時刻
PNG描画関数:指定PNGデータをイメージプレーンに描画する
Draw(File,X,Y)
File : PNGファイル名
X : X座標位置
Y : Y座標位置
イメージプレーンクリア関数:イメージプレーンの指定領域をクリアする
Clear(X,Y,W,H)
X : X座標位置
Y : Y座標位置
W : X方向幅
H : Y方向幅
プレーヤ変数は、プレーヤの状態を示すシステムパラメータ(SPRM)と一般用途として使用可能なゼネラルパラメータ(GPRM)とがある。
図37はシステムパラメータ(SPRM)の一覧である。
SPRM(0) : 言語コード
SPRM(1) : 音声ストリーム番号
SPRM(2) : 字幕ストリーム番号
SPRM(3) : アングル番号
SPRM(4) : タイトル番号
SPRM(5) : チャプタ番号
SPRM(6) : プログラム番号
SPRM(7) : セル番号
SPRM(8) : 選択キー情報
SPRM(9) : ナビゲーションタイマー
SPRM(10) : 再生時刻情報
SPRM(11) : カラオケ用ミキシングモード
SPRM(12) : パレンタル用国情報
SPRM(13) : パレンタルレベル
SPRM(14) : プレーヤ設定値(ビデオ)
SPRM(15) : プレーヤ設定値(オーディオ)
SPRM(16) : 音声ストリーム用言語コード
SPRM(17) : 音声ストリーム用言語コード(拡張)
SPRM(18) : 字幕ストリーム用言語コード
SPRM(19) : 字幕ストリーム用言語コード(拡張)
SPRM(20) : プレーヤリージョンコード
SPRM(21) : 予備
SPRM(22) : 予備
SPRM(23) : 再生状態
SPRM(24) : 予備
SPRM(25) : 予備
SPRM(26) : 予備
SPRM(27) : 予備
SPRM(28) : 予備
SPRM(29) : 予備
SPRM(30) : 予備
SPRM(31) : 予備
なお、本実施例では、仮想プレーヤのプログラミング関数をJava(登録商標)Scriptベースとしたが、Java(登録商標)Scriptではなく、UNIX(登録商標) OSなどで使われているB−Shellや、Perl Scriptなど他のプログラミング関数であっても構わなく、言い換えれば、本発明はJava(登録商標)Scriptに限定されるものでは無い。
(プログラムの例)
図38および図39は、イベントハンドラでのプログラムの例である。
図38は、2つの選択ボタンを持ったメニューの例である。
セル(PlayList#1.Cell#1)先頭でタイムイベントを使って図38左側のプログラムが実行される。ここでは、最初にゼネラルパラメータの一つGPRM(0)に"1"がセットされている。GPRM(0)は、当該プログラムの中で、選択されているボタンを識別するのに使っている。最初の状態では、左側に配置するボタン1が選択されている事を初期値として持たされている。
次に、PNGの描画を描画関数であるDrawを使ってボタン1、ボタン2夫々について行っている。ボタン1は、座標(10,200)を起点(左端)としてPNGイメージ"1black.png"を描画している。ボタン2は、座標(330,200)を起点(左端)としてPNGイメージ"2white.png"を描画している。
また、本セル最後ではタイムイベントを使って図38右側のプログラムが実行される。ここでは、Link関数を使って当該セルの先頭から再度再生するように指定している。
図39は、メニュー選択のユーザイベントのイベントハンドラの例である。
「左」キー、「右」キー、「決定」キー何れかのリモコンキーが押された場合夫々に対応するプログラムがイベントハンドラに書かれている。ユーザがリモコンキーを押した場合、図34で説明したとおり、ユーザイベントが生成され、図39のイベントハンドラが起動されることになる。本イベントハンドラでは、選択ボタンを識別しているGPRM(0)の値と、選択されたリモコンキーを識別するSPRM(8)を使って分岐処理を行っている。
条件1)ボタン1が選択されている、かつ、選択キーが「右」キーの場合
GPRM(0)を2に再設定して、選択状態にあるボタンを右ボタン2に変更する。
ボタン1、ボタン2のイメージを夫々書き換える。
条件2)選択キーが「決定(OK)」の場合で、ボタン1が選択されている場合
プレイリスト#2の再生を開始する。
条件3)選択キーが「決定(OK)」の場合で、ボタン2が選択されている場合
プレイリスト#3の再生を開始する。
上記のようにして実行処理が行われる。
(プレーヤ処理フロー)
次に図40から図43を用いてプレーヤでの処理フローを説明する。
図40は、AV再生までの基本処理フローである。
図40(a)に示されるように、BDディスクを挿入すると(S101)、BDプレーヤはBD.INFOファイルの読み込みと解析(S102)、BD.PROGの読み込み(S103)を実行する。BD.INFOおよびBD.PROGは共に管理情報記録メモリに一旦格納され、シナリオプロセッサによって解析される。
続いて、シナリオプロセッサは、BD.INFOファイル内のファーストイベント(FirstEvent)情報に従い、最初のイベントを生成する(S104)。生成されたファーストイベントは、プログラムプロセッサで受け取られ、当該イベントに対応するイベントハンドラを実行処理する(S105)。
ファーストイベントに対応するイベントハンドラには、最初に再生するべきプレイリスト情報が記録されていることが期待される。仮に、プレイリスト再生が指示されていない場合には、図40(b)に示されるように、プレーヤは何も再生することなく、ユーザイベントを受け付けるのを待ち続けるだけになる(S201)。BDプレーヤはユーザからのリモコン操作を受け付けると、UOPマネージャはプログラムプロセッサに対してUOPイベントを立ち上げる(S202)。
プログラムプロセッサは、UOPイベントがメニューキーかを判別し(S203)、メニューキーの場合は、シナリオプロセッサにUOPイベントを流し、シナリオプロセッサがユーザイベントを生成する(S204)。プログラムプロセッサは生成されたユーザイベントに対応するイベントハンドラを実行処理する(S205)。
図41は、PL再生開始からVOB再生開始までの処理フローである。
前述したように、ファーストイベントハンドラまたはグローバルイベントハンドラによってプレイリスト再生が開始される(S301)。シナリオプロセッサは、再生対象のプレイリスト再生に必要な情報として、プレイリスト情報"XXX.PL"の読み込みと解析(S302)、プレイリストに対応するプログラム情報"XXX.PROG"の読み込みを行う(S303)。続いてシナリオプロセッサは、プレイリストに登録されているセル情報に基づいてセルの再生を指示する(S304)。セル再生は、シナリオプロセッサからプレゼンテーションコントローラに対して要求が出される事を意味し、プレゼンテーションコントローラはAV再生を開始する(S305)。
AV再生の開始(S401)をすると、プレゼンテーションコントローラは再生するセルに対応するVOBの情報ファイル(YYY.VOBI)を読み込みおよび解析をする(S402)。プレゼンテーションコントローラは、タイムマップを使って再生開始するVOBUとそのアドレスを特定し、ドライブコントローラに読み出しアドレスを指示し、ドライブコントローラは対象となるVOBデータを読み出し(S403)、VOBデータがデコーダに送られ再生が開始される(S404)。
VOB再生は、当該VOBの再生区間が終了するまで続けられ(S405)、終了すると次のセル再生開始ステップS304へ移行する。次にセルが無い場合は、再生が停止する(S406)。
図42は、AV再生開始後からのイベント処理フローである。
BDプレーヤはイベントドリブン型のプレーヤモデルである。プレイリストの再生を開始すると、タイムイベント系、ユーザイベント系、字幕表示系のイベント処理プロセスが夫々起動され、平行してイベント処理を実行するようになる。
S500系の処理(図42(a))は、タイムイベント系の処理フローである。
プレイリスト再生開始後(S501)、プレイリスト再生が終了しているかを確認するステップ(S502)を経て、シナリオプロセッサは、タイムイベント発生時刻になったかを確認する(S503)。タイムイベント発生時刻になっている場合には、シナリオプロセッサはタイムイベントを生成し(S504)、プログラムプロセッサがタイムイベントを受け取りイベントハンドラを実行処理する(S505)。
ステップS503でタイムイベント発生時刻になっていない場合、または、ステップS505でイベントハンドラ実行処理後は再度ステップS502へ戻り、上述した処理を繰り返す。また、ステップS502でプレイリスト再生が終了したことが確認されると、タイムイベント系の処理は強制的に終了する。
S600系の処理(図42(b))は、ユーザイベント系の処理フローである。
プレイリスト再生開始後(S601)、プレイリスト再生終了確認ステップ(S602)を経て、UOP受付確認ステップの処理に移る(S603)。UOPの受付があった場合、UOPマネージャはUOPイベントを生成し(S604)、UOPイベントを受け取ったプログラムプロセッサはUOPイベントがメニューコールであるかを確認し(S605)、メニューコールであった場合は、プログラムプロセッサはシナリオプロセッサにイベントを生成させ(S607)、プログラムプロセッサはイベントハンドラを実行処理する(S608)。
ステップS605でUOPイベントがメニューコールで無いと判断された場合、UOPイベントはカーソルキーまたは「決定」キーによるイベントである事を示している。この場合、現在時刻がユーザイベント有効期間内であるかをシナリオプロセッサが判断し(S606)、有効期間内である場合には、シナリオプロセッサがユーザイベントを生成し(S607)、プログラムプロセッサが対象のイベントハンドラを実行処理する(S608)。
ステップS603でUOP受付が無い場合、ステップS606で現在時刻がユーザイベント有効期間に無い場合、または、ステップS608でイベントハンドラ実行処理後は再度ステップS602へ戻り、上述した処理を繰り返す。また、ステップS602でプレイリスト再生が終了したことが確認されると、ユーザイベント系の処理は強制的に終了する。
図43は字幕処理のフローである。
プレイリスト再生開始後(S701)、プレイリスト再生終了確認ステップ(S702)を経て、字幕描画開始時刻確認ステップに移る(S703)。字幕描画開始時刻の場合、シナリオプロセッサはプレゼンテーションコントローラに字幕描画を指示し、プレゼンテーションコントローラはイメージプロセッサに字幕描画を指示する(S704)。ステップS703で字幕描画開始時刻で無いと判断された場合、字幕表示終了時刻であるかを確認する(S705)。字幕表示終了時刻であると判断された場合は、プレゼンテーションコントローラがイメージプロセッサに字幕消去指示を行い、描画されている字幕をイメージプレーンから消去する(S706)。
字幕描画ステップS704終了後、字幕消去ステップS706終了後、または、字幕表示終了時刻確認ステップS705で当該時刻でないことが判断された場合、ステップS702に戻り、上述した処理を繰り返す。また、ステップS702でプレイリスト再生が終了したことが確認されると、字幕表示系の処理は強制的に終了する。
(実施の形態2)
次に、異なる符号化方式(あるいは、異なる属性の動画像)が混在し得るストリームの第2例、つまり、ピクチャ内ピクチャにおいて輝度キーによる透過処理を行う際に用いられる輝度の閾値(動画像の属性)が混在し得る例について、本発明の第2の実施の形態として、説明する。
本実施の形態では、BD−ROMなどのパッケージメディアなどにおいて、ピクチャ内ピクチャによる再生時に、透過処理を行うかどうかを示す輝度値の閾値が切替わることによる再生動作の遅延を解消できる記録媒体、多重化方法、多重化装置、およびその再生装置について説明する。
本実施の形態の記録媒体では、輝度キーによる透過処理を実施するストリームにおいては、連続再生の単位において、画像表示時に透過処理するかどうかを判定する輝度値の閾値が制約されていること、あるいは、制約されていることを示す情報が管理情報に格納される。
本実施の形態の記録媒体、多重化方法、多重化装置、および再生装置は、実施の形態1における記録媒体のデータ構造、および、多重化方法あるいは再生装置における動作と構成要素の基本部分を同じくするため、以下では本実施の形態に特徴的な部分についてのみ説明する。
図44は、本実施の形態の記録媒体に格納されるストリームにおける輝度キーの閾値の例を示す。図44の例では、シームレスに接続される各区間における輝度キーの閾値が全て20と固定されるため、輝度キーの閾値の切替わりに伴う遅延が発生せずに、シームレスな接続を実現できる。
また、本実施の形態の記録媒体では、シームレスに接続される再生区間における輝度キーに関する情報が、管理情報に格納される。図45は、輝度キーに関する情報を、ピクチャ内ピクチャのメタ情報の一部として格納する例を示す。図45(a)は、輝度キーが有効であるかどうかを示すフラグ情報luma_key_validについて示す。輝度キーが有効(luma_key_validが1)であれば、輝度キーの閾値に基づいて画像を透過処理して表示し、輝度キーが有効でなければ(luma_key_validが0)、透過処理をせずに表示する。図示するように、シームレスに接続される各再生区間においては、luma_key_validの値は固定となる。つまり、シームレスに接続される各再生区間では、輝度キーが有効であるか、有効でないかのどちらか一方に固定される。図45(b)は、輝度キーを適用する際に、透過して表示すると決定する輝度値の閾値luma_key_upper_limitについて示す。例えば、luma_key_upper_limitが20であれば、輝度値が20以下の画素は透過して表示し、輝度値が20を超える画素については透過せずに表示する。図中に示すように、シームレスに接続される各再生区間においては、luma_key_upper_limitの値は同一となる。ここで、luma_key_upper_limitの情報は、輝度キーが有効である場合に参照されるため、輝度キーが有効である場合にのみ、輝度キーの閾値を示す情報を設定してもよい。
輝度キーによる透過処理を実施するプレーヤにおいては、輝度キーの閾値が固定であることが保証されていれば、輝度キーの閾値処理における閾値の変更が不要であるため、予め輝度キーの閾値が固定であると判定できることが望ましい。図46は、輝度キーの閾値が固定であることを保証するフラグについて説明する図である。図46の例では、輝度キーの閾値が固定であることを示すフラグ情報luma_key_fixed_flagが、各再生区間の属性情報の一部として格納される。luma_key_fixed_flagは、当該再生区間における輝度キーの閾値が、直前の再生区間における輝度キーの閾値と同一であるかどうかを示す。図46(a)は、輝度キーの閾値が固定であることが示される(luma_key_fixed_flagが1)例である。この例では、各再生区間はシームレスに接続され、それら再生区間では輝度キーの閾値が固定であることが保証される。図46(b)は、輝度キーの閾値が固定であることが保証されない(luma_key_fixed_flagが0)例である。各再生区間はシームレス接続の対象ではなく、各再生区間で輝度キーの閾値は可変である。なお、luma_key_fixed_flagは、連続して再生される区間全体に対して設定してもよいし、連続再生区間を構成する各再生区間に対して設定してもよい。さらに、各再生区間について設定する際には、各再生区間はプレイアイテムにより指される再生区間を示すこととして、再生区間内で輝度キーの閾値が固定であるかどうかを、プレイアイテム単位に設定される再生情報に含めてもよい。ここで、輝度キーの閾値が固定であるかどうかは、現プレイアイテムと直前のプレイアイテムにより指される再生区間がシームレス接続できるかどうかを示す情報などと兼用して1つのフラグにまとめてもよい。また、輝度キーが適用されるかどうかを示す情報についても同様に格納できる。
ここで、シームレス接続には、実施の形態1と同様の種類があり、異なるアングルのストリームにシームレスに接続できるシームレス・マルチアングルなども含まれる。シームレス・マルチアングルにおいては、各アングルにおいて、輝度キーが有効であるかどうか、あるいは、輝度キーの閾値が同一となる。また、シームレス接続の種類としては、(1)接続の前後においてMPEG−2システム規格におけるSTC(System Time Clock)などの基準クロックの値が連続しないケース(タイプ1のシームレス接続)と、(2)接続の前後においてMPEG−2システム規格におけるSTC(System Time Clock)などの基準クロックの値が連続するケース(タイプ2のシームレス接続)、など複数の種類がある。従って、タイプ1のシームレス接続であるかどうか、あるいは、タイプ2のシームレス接続であるかどうかを示す情報によりシームレス接続されることが示されれば、これら情報により、連続する2つの再生区間において輝度キーの閾値が固定であると示すことができる。
図47は、ピクチャ内ピクチャにおいて、輝度キーを適用する例について説明する。ピクチャ内ピクチャでは、プライマリ・ビデオと呼ばれる主映像に、セカンダリ・ビデオと呼ばれる副映像がオーバーレイして表示される。このとき、セカンダリ・ビデオに対して輝度キーによる透過処理が有効であれば、透過処理が実施され、有効でなければ透過処理は実施されない。図47(a)は、ビデオの表示プレーンを示し、図47(b)と図47(c)に示すように、プレーン1がプライマリ・ビデオの表示用、プレーン2がセカンダリ・ビデオの表示用である。図47(d)に示すように、セカンダリ・ビデオをプライマリ・ビデオにオーバーレイして表示する。この例では、図47(c)に示す黒塗りの部分が輝度キーによる透過処理により透過して表示される。セカンダリ・ビデオとしては、複数のストリームを切替え可能であるが、図47(e)、図47(f)、図47(g)では、2本のセカンダリ・ビデオが存在する例について示し、図47(e)は、プライマリ・ビデオにおける各再生区間の表示のタイムライン、図47(f)は、第1のセカンダリ・ビデオにおける各再生区間の表示タイムライン、図47(g)は、第2のセカンダリ・ビデオにおける各再生区間の表示タイムラインを示す。例えば、図47(f)において区間1−1と区間1−2がシームレス接続されるとすると(図中(1))、区間1−1と区間1−2では、輝度キーによる透過処理が有効であるかどうか、および、有効である場合には輝度キーの閾値が、それぞれ同一となる。また、第1のセカンダリ・ビデオにおける区間1−2から、第2のセカンダリ・ストリームにおける区間2−3への接続がシームレス接続であるとすると(図中(2))、区間1−2と区間2−3においても輝度キーに関連する情報が同一となる。さらに、各再生区間の接続部分以外における接続(図中(3))の連続性を確保するために、区間1−3と区間2−3との間でも輝度キーに関連する情報を同一としてもよい。
次に、プライマリ・ビデオとセカンダリ・ビデオはトランスポートストリームなどに多重化して記録されるが、図48は多重化の方法について示す。図48(a)は、プライマリ・ビデオとセカンダリ・ビデオを同一のトランスポートストリームに多重化した例であり、図48(b)は、プライマリ・ビデオとセカンダリ・ビデオを異なるトランスポートストリームに多重化した例である。このように、プライマリ・ビデオとセカンダリ・ビデオは、同一のトランスポートストリームに多重化してもよいし、異なるトランスポートストリームに多重化してもよい。
図49は、本実施の形態における記録媒体に格納された多重化データを作成するための多重化方法の動作を示すフローチャートである。本実施の形態の多重化方法は、輝度キーを有効とするかどうかを切替えられる単位を決定するステップ(ステップS5301)、決定した単位に基づいてクリップの動画像を符号化するステップ(ステップS5302)、所定の再生区間毎に輝度キーに関するフラグ情報を生成するステップ(ステップS5304)、および、ステップS5304において生成した輝度キーに関するフラグ情報を含む管理情報を生成するステップ(S5305)とを備える点において、従来の多重化方法と異なる。
つまり、本実施の形態における多重化方法は、第1動画像と、第1動画像にオーバーレイするための第2動画像とを含む映像ストリームを符号化する動画像符号化方法であって、映像ストリームのうち、部分区間の集まりであって連続再生の対象となる区間である連続再生区間を決定し、当該連続再生区間においては、輝度キーが有効であるかどうか、又は、輝度キーによる透過処理に用いられる閾値のいずれか一方あるいは両方により定義される輝度キー属性が固定となるように各再生区間の映像ストリームを符号化するステップ(S5301〜S5303)と、1つあるいは複数の再生区間毎に前記輝度キー属性を生成するステップ(S5304)と、連続再生区間においては前記輝度キー属性が固定であることを示すフラグ情報を含む管理情報を作成するステップ(S5305)とを含む。以下、これらのステップを詳細に説明する。
まず、ステップS5301において、輝度キーを有効とするかどうかを切替えられる単位を決定する。すなわち、連続再生単位、クリップ、あるいはランダムアクセス単位のいずれの単位で切替え可能であるかを決定する。続いて、ステップS5302では、ステップS5301で決定した切替え単位に基づいてクリップのデータを符号化する。なお、ステップS5301では、輝度キーの閾値を切替えられるかどうかについても判定し、判定結果に基づいて、ステップS5302においてクリップのデータを符号化してもよい。ステップS5303では、最終クリップの符号化が終了したかどうかを判定し、終了したと判定された際にはステップS5304に進み、終了していないと判定されればステップS5302に戻りクリップの符号化を繰り返す。ステップS5304では、所定の再生区間毎に輝度キーに関する属性情報を作成、ステップS5305に進む。所定の再生区間とは、プレイリストにより指される再生区間とするが、クリップ、あるいはランダムアクセス単位としてもよい。ステップS5305では、ステップS5304において生成した属性情報を含む管理情報を作成し、管理情報とクリップのデータとを多重化して出力する。ここで、連続する2つの再生区間がシームレス接続できるかどうかを示す情報を管理情報に含めてもよい。シームレス接続される各再生区間では、輝度キーを有効とするかどうかは固定とするため、ステップS5301では、シームレス接続される各再生区間においては、輝度キーを有効とするかどうかは切替え不可であると決定する。さらに、ステップS5302では、シームレス接続される各再生区間において、輝度キーを有効とする場合には、輝度キーの透過処理を行う際の閾値が同一となるように符号化する。なお、ステップS5301において輝度キーを有効とするかどうかを切替えられる単位の決定する際の詳細な動作については、図14に示した本実施の形態1の多重化方法と同様の動作を適用できる。
図50は、図49中のフラグ情報生成ステップ(S5304)および管理情報生成ステップ(S5305)の具体例を示すフローチャートである。ステップS5304aでは、符号化されたクリップが、輝度キーの有効と無効を切替え可能と判定されたクリップであるか否かを判定し、切り替え可能と判定されたクリップである場合には、輝度キーが有効であるか否かが固定でないことを示すフラグ情報を生成し、当該クリップに対応付けてフラグ情報をメモリのワーク領域に蓄積し(S5304b)、切り替え可能と判定されたクリップでない場合には、輝度キーが有効であるか否かが固定であることを示すフラグ情報を生成し、当該クリップに対応付けてフラグ情報をメモリのワーク領域に蓄積する(S5304c)。ここで、フラグ情報は、プレイアイテムにより指される再生区間など所定の再生区間毎に、輝度キーが有効であるかどうかを示す情報と、輝度キーが有効である場合には、輝度キーの閾値とを含む。ステップS5304dでは、当該クリップが、符号化された最後のクリップであるか否かを判定し、最後のクリップでなければ上記S5304a〜S5304cを繰り返し、最後のクリップであればステップS5304eに進む。ステップS5304eでは、プレイアイテム毎の輝度キーに関する情報を含むピクチャ内ピクチャ用のメタ情報を生成し、ステップS5305fでは、ピクチャ内ピクチャ用のメタ情報とプレイリスト、およびランダムアクセスに必要な情報などを含む管理情報を生成する。プレイリストには、連続する2つの再生区間がシームレス接続可能かどうか、および、シームレス接続のタイプを示す情報を含める。
なお、管理情報内には、セカンダリ・ビデオのトランスポートストリームあるいは符号化ストリームを識別するインデックス情報が含まれるため、インデックス番号によりセカンダリ・ビデオであると示されるトランスポートストリームあるいは符号化ストリームに対してのみ、管理情報内に輝度キーに関する情報を含めてもよい。
また、上記ではピクチャ内ピクチャ動作のセカンダリ・ビデオにおける、輝度キーに基づいた透過処理について述べたが、本発明はこれに限定されるものではなく、複数の表示プレーンが存在する場合において、所定のプレーンよりも手前に表示されるプレーンにおける画像の表示全般に適用できる。例えば、静止画やコンピュータ・グラフィクスなどに、静止画や動画をオーバーレイして表示することが可能である。さらに、異なる表示プレーンに表示される複数の画像に対して、輝度キーによる透過処理を実施してもよい。
また、輝度キーの閾値などに応じて、半透過など、0と1以外の透過率として表示することにしてもよい。
ピクチャ内ピクチャにおいて、輝度キーによる透過処理とは異なる再生動作について制約してもよい。例えば、シームレス接続される再生区間を跨いで高速再生や逆再生などの特殊再生を行う際に、セカンダリ・ビデオを表示するかどうかを固定してもよい。つまり、特殊再生時には、セカンダリ・ビデオを常に表示する、または、表示しない、のいずれか一方に固定する。また、特殊再生時にセカンダリ・ビデオを表示する際には、輝度キーの閾値を固定とするなど、輝度キーによる透過処理と特殊再生とを関連付けてもよい。その際、特殊再生時におけるセカンダリ・ビデオの表示の有無を示すフラグ情報の値を固定とする、あるいは、当該フラグ値が固定であることを示すフラグ情報などのフラグ情報により、ピクチャ内ピクチャにおける特殊再生時の制約を保証してもよい。
なお、プライマリ・ビデオとセカンダリ・ビデオの符号化方式は、例えばMPEG−4 AVC、MPEG−2ビデオ、VC−1などが可能である。ここで、プライマリ・ビデオがMPEG−4 AVCであれば、セカンダリ・ビデオもMPEG−4 AVCとするなど、プレーヤで対応する組み合わせを削減するためにプライマリ・ビデオとセカンダリ・ビデオの符号化方式の組み合わせを制約してもよい。
図51は、本実施の形態の多重化方法を実施する多重化装置5200の構成を示すブロック図である。多重化装置5200は、第1動画像と、第1動画像にオーバーレイするための第2動画像とを含む映像ストリームを符号化する動画像符号化装置の一例であり、切替え単位決定部5201、切替え情報生成部5202、符号化部5203、システム多重化部5204、管理情報作成部5205、結合部5206を備える。ここで、オーバーレイでは、第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけが第1動画像にオーバーレイされる。以下に、各部の動作について説明する。
切替え単位決定部5201は、映像ストリームのうち、部分区間の集まりであって、連続再生の対象となる区間である連続再生区間を決定する処理部であり、ここでは、輝度キーを切り替えられる単位を決定し、決定した切替え単位Unit2を切替え情報生成部5202、および符号化部5203に入力する。切替え単位は予め定められているものとするが、外部から設定できるようにしてもよい。
切替え情報生成部5202は、切替え単位Unit2に基づいて、プレイリストにより指される再生単位毎の輝度キーの属性情報を示す輝度キー情報LumaInf2を生成し、管理情報作成部5205に入力する。例えば、連続再生区間においては、上記閾値が固定であることを示すフラグ情報を生成する。
なお、切替え情報生成部5202は、オーバーレイにおける各種表示処理を指定する複数の表示属性情報を生成するが、その複数の表示属性情報の生成においては、複数の表示属性情報のうち、連続再生区間を構成する複数の部分区間において内容が切り替わる表示属性情報の個数が予め定められた一定値以下となるように、表示属性情報を生成する。具体的には、図52に示されるように、切替え情報生成部5202は、ピクチャ内ピクチャのメタ情報として、(i)上記閾値、つまり、輝度キー適用時に透過率が1であるとみなす輝度値の閾値が直前の再生区間と現在の再生区間とで同一であるか(1)否か(0)を示すフラグ、あるいは輝度キーの閾値、(ii)プライマリ・ビデオ画像にオーバーレイするセカンダリ・ビデオ画像の表示位置が直前の再生区間と現在の再生区間とで同一であるか(1)否か(0)を示すフラグ、あるいは表示位置の座標情報、及び、(iii)プライマリ・ビデオ画像にオーバーレイするセカンダリ・ビデオ画像のスケーリング(拡大率)が直前の再生区間と現在の再生区間とで同一であるか(1)否か(0)を示すフラグ、あるいはスケーリング方法を指定する情報等の表示属性情報を生成するが、その複数の表示属性情報の生成においては、複数の表示属性情報のうち、切り替え可能な表示属性情報の個数が予め定められた一定値(例えば、2個)以下となるように、表示属性情報を生成する。この制約により、連続再生区間において値が切り替わる表示属性情報の個数が一定数以下に抑えられることが保証され、再生装置における切り替え処理に伴う処理負荷が軽減される。
符号化部5203は、切替え単位決定部5201で決定された連続再生区間においては上記閾値を変更しないという制約を満たすように、連続再生区間を構成する複数の部分区間における第1及び第2動画像を符号化する処理部であり、ここでは、切替え単位Unit2の制約を満たすように各クリップのデータを符号化し、符号化データCdata2をシステム多重化部5204に入力する。具体的には、符号化部5203は、連続再生区間においては、第2動画像のうちオーバーレイする画像領域の輝度が上記閾値を超え、かつ、オーバーレイしない(透過処理を施す)画像領域の輝度が上記閾値以下となるように、第2動画像を構成する画素の輝度値を補正(係数を乗じたり、オフセット値を加算したり等)する。
なお、符号化部5203は、切替え単位決定部5201で決定された連続再生区間だけでなく、デコーダモデルに従ってシームレスに接続される複数の部分区間においても、上記閾値を変更しないという制約を満たすように、複数の部分区間における第1及び第2動画像を符号化してもよい。つまり、上述したデコーダモデルでは、2つの部分区間がシームレスに接続されなければならないケースが規定されているので、そのような2つの部分区間においては、予め、上記閾値を変更しないという制約を満たすように、第1及び第2動画像を符号化しておくのが好ましい。
システム多重化部5204は、符号化データCdata2をシステム多重化し、ストリーム情報StrInf2を管理情報作成部5205に入力し、多重化データMdata2を結合部5206に入力する。BD−ROMではシステム多重化の方式として、ソースパケットと呼ばれる、MPEG−2のトランスポートストリームに4バイトのヘッダを付加した方式が用いられる。また、ストリーム情報StrInf2は、タイムマップなど、多重化データMdata2についての管理情報を生成するための情報を含む。なお、システム多重化部5204は、連続再生区間を構成する複数の部分区間が、トランスポートストリームのパケット識別子によって特定されるように、多重化をしてもよい。これにより、上記閾値が固定されているクリップがパケット識別子によって特定され得る。
管理情報作成部5205は、切替え情報生成部5202からの指示に従って、連続再生区間においては上記閾値が固定であることを示すフラグ情報や上記表示属性情報を含む管理情報を作成する処理部の一例であり、ここでは、ストリーム情報StrInf2に基づいて生成したタイムマップ、および輝度キー情報LumaInf2などを含む管理情報CtrlInf2を生成し、結合部5206に入力する。
結合部5206は、符号化部5203で符号化された第1及び第2動画像と管理情報作成部5205で作成された管理情報とを結合して出力する処理部であり、ここでは、管理情報CtrlInf2と多重化データMdata2を結合して記録データDout2として出力する。
以上のように構成された多重化装置5200は、図49、図50に示されるフローチャートに従った多重化動作をし、その結果、図44〜図48に示される管理情報や符号化ストリームを生成する。
図53は、この多重化装置5200によって生成される管理情報のデータ構造を示す図である。図53(a)は、管理情報の一つであるプレイリストのデータ要素を示し、図53(b)は、シームレス接続される(Connection_condition=5の)再生区間を示すプレイリストの例を示す。多重化装置5200は、図53(a)に示されるように、プレイリストとして、「プレイアイテム」、「サブプレイアイテム」及び「ピクチャ内ピクチャのメタ情報」を作成する。ここで、「プレイアイテム」は、図53(b)に示されるように、プライマリ・ビデオにおける各再生区間の情報(クリップにおける再生開始時刻と再生終了時刻など)や再生区間の間の接続条件などを示し、「サブプレイアイテム」は、セカンダリ・ビデオにおける各再生区間の情報(クリップにおける再生開始時刻と再生終了時刻など)や再生区間の間の接続条件などを示し、「ピクチャ内ピクチャのメタ情報」は、ピクチャ内ピクチャを再生する際の、セカンダリ・ビデオの表示属性情報(輝度キー、表示位置、スケーリングなど)を示す。なお、プレイアイテム及びサブプレイアイテムに対応するプライマリ・ビデオのクリップは、プレイアイテムのインデックス番号により関連付けられる。
このように、多重化装置5200は、上記閾値が固定であることを示すフラグ情報を、連続再生区間を構成する複数の部分区間(図中の「再生区間」)それぞれに対応する再生情報(図中の「メタ情報」)として生成する。具体的には、そのフラグ情報を、プレイリストに含まれるプレイアイテムに対応する再生情報(図中の「メタ情報」)として生成する。
なお、オーサリングツールなどでデータを作成する際には、符号化データの生成と、システム多重化あるいは管理情報の作成を別々の装置で行うことがあるが、そのような場合でも、各装置の動作は多重化装置5200における各部と同一にすればよい。
また、この多重化装置5200は、符号化ストリームを生成する動画像符号化装置として適用されるだけでなく、BD等の光ディスク、SD(Secure Digital)カードなどのフラッシュメモリ、あるいはハードディスクなどの記録媒体に符号化ストリームを記録する動画像記録装置として適用され得る。そのためには、多重化装置5200が備える出力段である結合部5206が、符号化部5203で符号化された第1及び第2動画像と管理情報作成部5205で作成された管理情報とを結合して記録媒体に記録するという記録機能を備えればよい。このような動画像記録装置(あるいは、動画像記録方法)によって、本明細書で開示されている記録媒体が作成される。
図54は、本実施の形態における記録媒体に格納された多重化データを再生するプレーヤ(動画像再生装置)において、再生区間の切替わり時に、輝度キーによる透過処理を実施する動作を示すフローチャートである。
まず、ステップS5401において、プレーヤは、プレイアイテムにより指される現在の再生区間と次の再生区間とがシームレス接続されるかどうかを判定し、シームレス接続されると判定されればステップS5405に進み、シームレス接続されないと判定されればステップS5402に進む。具体的な判断例として、プレーヤは、映像ストリームに対応する管理情報を取得し、取得した管理情報に、上記閾値が固定であることを示すフラグ情報が含まれるか否かを判断する(S5401)。管理情報にフラグ情報が含まれる場合には、現再生区間と次再生区間とはシームレスに接続されると判断し(S5401でyes)、一方、管理情報にフラグ情報が含まれない場合には、現再生区間と次再生区間とはシームレスに接続されないと判断する(S5401でno)。
ステップS5402では、プレーヤは、次の再生区間において輝度キーが有効であるかどうか判定し、輝度キーが有効と判定されればステップS5403に進み、輝度キーが有効でないと判定されればステップS5406に進む。ステップS5403では、輝度キーの閾値を取得し、ステップS5404では、ステップS5403で取得した閾値に基づいて、セカンダリ・ビデオに対して透過処理を実施する。
ステップS5405では、プレーヤは、現在の再生区間と同一の条件(上記閾値が同一)に基づいてセカンダリ・ビデオに対して透過処理を実施する。具体的には、セカンダリ・ビデオのうち、輝度が上記閾値以下の画素については完全に透過させる処理を施す。このとき、現在の再生区間において輝度キーが有効でなければ、セカンダリ・ビデオに対する透過処理は行われない。
ステップS5406では、プレーヤは、ステップS5404又はステップS5405の出力結果、あるいは、ステップS5402において輝度キーが有効でないと判定された場合には透過処理を実施していないセカンダリ・ビデオの復号結果を、プライマリ・ビデオにオーバーレイして表示する。
なお、図54において説明した動作は、本実施の形態1の図20および図21で説明したBDディスクを再生するプレーヤにおいて実現できる。例えば、図20のプレゼンテーション処理部208において輝度キーの透過処理を行う。
また、プレーヤは所定の再生手順に従って、再生するプレイアイテムの順序を決定してもよい。例えば、複数プレイアイテムの連続再生時には、輝度キーの閾値が一定となるプレイアイテムを優先的に選択する。このとき、リモコン動作などでユーザから特定プレイアイテムの再生要求があった場合には、輝度キーの閾値が異なるプレイアイテムを連続再生してもよい。さらに、本実施の形態2の多重化方法および多重化装置は、所定の再生手順において連続再生されるプレイアイテム間では輝度キーの閾値が一定となるようにしてもよい。ここで、1つのプレイアイテムは1つの再生単位に対応する。
(実施の形態3)
さらに、上記各実施の形態で示した記録媒体、その再生方法および記録方法を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図55A〜図55Cは、上記各実施の形態の再生方法および記録方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図55Bは、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図55Aは、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。
また、図55Cは、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。再生方法および記録方法を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブFDDを介して書き込む。また、フレキシブルディスク内のプログラムにより再生方法および記録方法を実現する再生方法および記録方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
なお、図12、図20、図21、図25、図51等に示したブロック図の各機能ブロックは典型的には集積回路装置であるLSIとして実現される。このLSIは1チップ化されても良いし、複数チップ化されても良い(例えばメモリ以外の機能ブロックが1チップ化されていても良い。)。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、データを格納するユニットだけ1チップ化せずに、本実施形態の記録媒体のように別構成としても良い。
以上、本発明に係る動画像符号化方法等について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。これらの実施の形態に対して当業者が思いつく変更を施して実現される他の形態や、実施の形態における各構成要素を任意に組み合わせて実現される他の形態等も本発明に含まれる。
なお、図12、図20、図21、図25、図51等に示したブロック図の各機能ブロックおよび図11、図13〜図17、図40〜図43、図49、図50、図54などに示したフローチャートにおいて、中心的な部分はプロセッサおよびプログラムによっても実現される。
このように、上記実施の形態で示した動画像符号化方法あるいは動画像復号化方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
本発明に係る動画像符号化方法は、管理情報により示される連続再生単位を構成する動画像の符号化データにおいて、画素を透過して表示するかどうかを輝度値により判定する際の閾値を固定としたことで、閾値の切り替わりに起因する復号時の遅延をなくしてシームレスな再生を実現できるため、動画像、グラフィクス、あるいは静止画などに動画像をオーバーレイして表示させるパッケージメディア、あるいは配信アプリケーションなどに適しており、例えば、動画像エンコーダ用LSI、ムービーカメラ、動画像レコーダ、動画像記録機能付きテレビ、コンピュータプログラム等として利用できる。
104、201 BDディスク
202 光ピックアップ
203 プログラム記録メモリ
204 管理情報記録メモリ
205 AV記録メモリ
206 プログラム処理部
207 管理情報処理部
208 プレゼンテーション処理部
209 イメージプレーン
210 ビデオプレーン
211 合成処理部
301 プログラム記録メモリ
302 プログラムプロセッサ
303 UOPマネージャ
304 管理情報記録メモリ
305 シナリオプロセッサ
306 プレゼンテーションコントローラ
307 クロック
308 イメージメモリ
309 トラックバッファ
310 デマルチプレクサ
311 イメージプロセッサ
312 ビデオプロセッサ
313 サウンドプロセッサ
314 イメージプレーン
315 ビデオプレーン
316 合成処理部
317 ドライブコントローラ
S101 ディスク挿入ステップ
S102 BD.INFO読み込みステップ
S103 BD.PROG読み込みステップ
S104 ファーストイベント生成ステップ
S105 イベントハンドラ実行ステップ
S201 UOP受付判定ステップ
S202 UOPイベント生成ステップ
S203 メニューコール判定ステップ
S204 イベント生成ステップ
S205 イベントハンドラ実行ステップ
S301 プレイリスト再生開始ステップ
S302 プレイリスト情報(XXX.PL)読み込みステップ
S303 プレイリストプログラム(XXX.PROG)読み込みステップ
S304 セル再生開始ステップ
S305 AV再生開始ステップ
S401 AV再生開始ステップ
S402 VOB情報(YYY.VOBI)読み込みステップ
S403 VOB(YYY.VOB)読み込みステップ
S404 VOB再生開始ステップ
S405 VOB再生終了ステップ
S406 次セル存在判定ステップ
S501 プレイリスト再生開始ステップ
S502 プレイリスト再生終了判定ステップ
S503 タイムイベント時刻判定ステップ
S504 イベント生成ステップ
S505 イベントハンドラ実行ステップ
S601 プレイリスト再生開始ステップ
S602 プレイリスト再生終了判定ステップ
S603 UOP受付判定ステップ
S604 UOPイベント生成ステップ
S605 メニューコール判定ステップ
S606 ユーザイベント有効期間判定ステップ
S607 イベント生成ステップ
S608 イベントハンドラ実行ステップ
S701 プレイリスト再生開始ステップ
S702 プレイリスト再生終了判定ステップ
S703 字幕描画開始判定ステップ
S704 字幕描画ステップ
S705 字幕表示終了判定ステップ
S706 字幕消去ステップ

Claims (5)

  1. 第1動画像と、前記第1動画像にオーバーレイするための第2動画像とを含む映像ストリームを符号化する動画像符号化方法であって、
    前記オーバーレイでは、前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけが前記第1動画像にオーバーレイされ、
    前記動画像符号化方法は、
    前記映像ストリームのうち、部分区間の集まりであって、連続再生の対象となる区間である連続再生区間を決定する連続再生区間決定ステップと、
    前記連続再生区間決定ステップで決定された連続再生区間においては前記閾値を変更しないという制約を満たすように、前記連続再生区間を構成する複数の部分区間における前記第1及び第2動画像を符号化する符号化ステップと、
    前記連続再生区間においては前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とを含む管理情報を作成する管理情報作成ステップと、
    前記符号化ステップで符号化された前記第1及び第2動画像と前記管理情報作成ステップで作成された管理情報とを結合して出力する結合ステップと
    を含むことを特徴とする動画像符号化方法。
  2. 第1動画像と、前記第1動画像にオーバーレイするための第2動画像とを含む映像ストリームを符号化する動画像符号化装置であって、
    前記オーバーレイでは、前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけが前記第1動画像にオーバーレイされ、
    前記動画像符号化装置は、
    前記映像ストリームのうち、部分区間の集まりであって、連続再生の対象となる区間である連続再生区間を決定する連続再生区間決定部と、
    前記連続再生区間決定部で決定された連続再生区間においては前記閾値を変更しないという制約を満たすように、前記連続再生区間を構成する複数の部分区間における前記第1及び第2動画像を符号化する符号化部と、
    前記連続再生区間においては前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とを含む管理情報を作成する管理情報作成部と、
    前記符号化部で符号化された前記第1及び第2動画像と前記管理情報作成部で作成された管理情報とを結合して出力する結合部と
    を備えることを特徴とする動画像符号化装置。
  3. 第1動画像と、前記第1動画像にオーバーレイするための第2動画像とを含む映像ストリームを符号化して記録媒体に記録する動画像記録方法であって、
    前記オーバーレイでは、前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけが前記第1動画像にオーバーレイされ、
    前記動画像記録方法は、
    前記映像ストリームのうち、部分区間の集まりであって、連続再生の対象となる区間である連続再生区間を決定する連続再生区間決定ステップと、
    前記連続再生区間決定ステップで決定された連続再生区間においては前記閾値を変更しないという制約を満たすように、前記連続再生区間を構成する複数の部分区間における前記第1及び第2動画像を符号化する符号化ステップと、
    前記連続再生区間においては前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とを含む管理情報を作成する管理情報作成ステップと、
    前記符号化ステップで符号化された前記第1及び第2動画像と前記管理情報作成ステップで作成された管理情報とを結合して記録媒体に記録する結合ステップと
    を含むことを特徴とする動画像記録方法。
  4. 符号化された第1及び第2動画像を含む映像ストリームを復号化し、前記第2動画像を前記第1動画像にオーバーレイして表示する動画像再生方法であって、
    前記映像ストリームに対応する管理情報を取得し、取得した管理情報を解釈する管理情報処理ステップと、
    前記管理情報処理ステップでの解釈に従って、前記第1及び第2動画像を復号化する復号化ステップと、
    復号化された前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけを、復号化された前記第1動画像にオーバーレイして表示する表示ステップとを含み、
    前記管理情報処理ステップでは、前記管理情報に、前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報が含まれるか否かを判断し、
    前記表示ステップでは、前記管理情報処理ステップで前記管理情報に前記フラグ情報と、前記閾値を示す情報とが含まれると判断された場合に、前記閾値を示す情報を用いて、現部分区間における前記オーバーレイ表示をする
    ことを特徴とする動画像再生方法。
  5. 符号化された第1及び第2動画像を含む映像ストリームを復号化し、前記第2動画像を前記第1動画像にオーバーレイして表示する動画像再生装置であって、
    前記映像ストリームに対応する管理情報を取得し、取得した管理情報を解釈する管理情報処理部と、
    前記管理情報処理部による解釈に従って、前記第1及び第2動画像を復号化する復号化部と、
    復号化された前記第2動画像のうち、予め定められた閾値を超える輝度を有する画像領域だけを、復号化された前記第1動画像にオーバーレイして表示する表示部とを備え、
    前記管理情報処理部は、前記管理情報に、前記閾値が固定であることを示すフラグ情報と、前記閾値を示す情報とが含まれるか否かを判断し、
    前記表示部は、前記管理情報処理部で前記管理情報に前記フラグ情報と、前記閾値を示す情報とが含まれると判断された場合に、前記閾値を示す情報を用いて、現部分区間における前記オーバーレイ表示をする
    ことを特徴とする動画像再生装置。
JP2010276445A 2006-12-14 2010-12-10 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置 Expired - Fee Related JP4841688B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010276445A JP4841688B2 (ja) 2006-12-14 2010-12-10 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006337426 2006-12-14
JP2006337426 2006-12-14
JP2010276445A JP4841688B2 (ja) 2006-12-14 2010-12-10 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008549341A Division JP4718616B2 (ja) 2006-12-14 2007-12-12 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置

Publications (2)

Publication Number Publication Date
JP2011097612A JP2011097612A (ja) 2011-05-12
JP4841688B2 true JP4841688B2 (ja) 2011-12-21

Family

ID=39511686

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2008549341A Active JP4718616B2 (ja) 2006-12-14 2007-12-12 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置
JP2010276445A Expired - Fee Related JP4841688B2 (ja) 2006-12-14 2010-12-10 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置
JP2010276446A Expired - Fee Related JP4841689B2 (ja) 2006-12-14 2010-12-10 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008549341A Active JP4718616B2 (ja) 2006-12-14 2007-12-12 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2010276446A Expired - Fee Related JP4841689B2 (ja) 2006-12-14 2010-12-10 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置

Country Status (12)

Country Link
US (4) US8023804B2 (ja)
EP (1) EP2079241B1 (ja)
JP (3) JP4718616B2 (ja)
KR (1) KR101362653B1 (ja)
CN (5) CN101815214B (ja)
AR (1) AR064274A1 (ja)
BR (2) BRPI0722391A2 (ja)
CA (1) CA2671557C (ja)
RU (2) RU2475997C2 (ja)
TW (2) TW201108747A (ja)
WO (1) WO2008072669A1 (ja)
ZA (1) ZA200903806B (ja)

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7519274B2 (en) 2003-12-08 2009-04-14 Divx, Inc. File format for multiple track digital data
US8472792B2 (en) 2003-12-08 2013-06-25 Divx, Llc Multimedia distribution system
EP1999883A4 (en) 2006-03-14 2013-03-06 Divx Llc FEDERATED DIGITAL RIGHTS MANAGEMENT SYSTEM COMPRISING CONFIDENCE SYSTEMS
AR064274A1 (es) * 2006-12-14 2009-03-25 Panasonic Corp Metodo de codificacion de imagenes en movimiento, dispositivo de codificacion de imagenes en movimiento, metodo de grabacion de imagenes en movimiento, medio de grabacion, metodo de reproduccion de imagenes en movimiento, dispositivo de reproduccion de imagenes en movimiento, y sistema de reproducci
US8233768B2 (en) 2007-11-16 2012-07-31 Divx, Llc Hierarchical and reduced index structures for multimedia files
US8997161B2 (en) * 2008-01-02 2015-03-31 Sonic Ip, Inc. Application enhancement tracks
US8510303B2 (en) 2009-01-07 2013-08-13 Divx, Llc Singular, collective and automated creation of a media guide for online content
EP2434769B1 (en) 2009-05-19 2016-08-10 Panasonic Intellectual Property Management Co., Ltd. Recording method and playback method
CA2782825C (en) 2009-12-04 2016-04-26 Divx, Llc Elementary bitstream cryptographic material transport systems and methods
KR101721261B1 (ko) * 2010-08-20 2017-03-30 엘지디스플레이 주식회사 액정표시장치와 그의 데이터전송방법
JP2012060238A (ja) * 2010-09-06 2012-03-22 Sony Corp 動画像処理装置、動画像処理方法およびプログラム
US9247312B2 (en) 2011-01-05 2016-01-26 Sonic Ip, Inc. Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol
KR101672662B1 (ko) * 2011-06-20 2016-11-03 가부시키가이샤 제이브이씨 켄우드 화상 부호화 장치, 화상 부호화 방법 및 화상 부호화 프로그램, 또한 화상 복호 장치, 화상 복호 방법 및 화상 복호 프로그램
JP2013038766A (ja) * 2011-07-12 2013-02-21 Sharp Corp 送信装置、送信装置の制御方法、制御プログラム、及び記録媒体
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
US8818171B2 (en) 2011-08-30 2014-08-26 Kourosh Soroushian Systems and methods for encoding alternative streams of video for playback on playback devices having predetermined display aspect ratios and network connection maximum data rates
KR101928910B1 (ko) 2011-08-30 2018-12-14 쏘닉 아이피, 아이엔씨. 복수의 최대 비트레이트 레벨들을 사용하여 인코딩된 비디오를 인코딩하고 스트리밍하기 위한 시스템들 및 방법들
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
US8964977B2 (en) 2011-09-01 2015-02-24 Sonic Ip, Inc. Systems and methods for saving encoded media streamed using adaptive bitrate streaming
US9049496B2 (en) * 2011-09-01 2015-06-02 Gracenote, Inc. Media source identification
JP5698644B2 (ja) * 2011-10-18 2015-04-08 株式会社Nttドコモ 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム、動画像予測復号方法、動画像予測復号装置及び動画像予測復号プログラム
PL3598753T3 (pl) 2011-12-15 2021-07-19 Tagivan Ii Llc Sygnalizowanie znaczników zakodowanych bloków (CBF) luminancji-chrominancji w kodowaniu wideo
US8918908B2 (en) 2012-01-06 2014-12-23 Sonic Ip, Inc. Systems and methods for accessing digital content using electronic tickets and ticket tokens
US9197685B2 (en) * 2012-06-28 2015-11-24 Sonic Ip, Inc. Systems and methods for fast video startup using trick play streams
US9143812B2 (en) 2012-06-29 2015-09-22 Sonic Ip, Inc. Adaptive streaming of multimedia
US10452715B2 (en) 2012-06-30 2019-10-22 Divx, Llc Systems and methods for compressing geotagged video
JP5885604B2 (ja) * 2012-07-06 2016-03-15 株式会社Nttドコモ 動画像予測符号化装置、動画像予測符号化方法、動画像予測符号化プログラム、動画像予測復号装置、動画像予測復号方法及び動画像予測復号プログラム
WO2014015110A1 (en) 2012-07-18 2014-01-23 Verimatrix, Inc. Systems and methods for rapid content switching to provide a linear tv experience using streaming content distribution
US8914836B2 (en) 2012-09-28 2014-12-16 Sonic Ip, Inc. Systems, methods, and computer program products for load adaptive streaming
US8997254B2 (en) 2012-09-28 2015-03-31 Sonic Ip, Inc. Systems and methods for fast startup streaming of encrypted multimedia content
JP6094126B2 (ja) * 2012-10-01 2017-03-15 富士通株式会社 動画像復号装置
TWI456985B (zh) * 2012-10-17 2014-10-11 Vivotek Inc 多攝影機的整合處理系統及其方法
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US9264475B2 (en) 2012-12-31 2016-02-16 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US9906785B2 (en) 2013-03-15 2018-02-27 Sonic Ip, Inc. Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata
US10397292B2 (en) 2013-03-15 2019-08-27 Divx, Llc Systems, methods, and media for delivery of content
US9344517B2 (en) 2013-03-28 2016-05-17 Sonic Ip, Inc. Downloading and adaptive streaming of multimedia content to a device with cache assist
US9094737B2 (en) 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
US9247317B2 (en) 2013-05-30 2016-01-26 Sonic Ip, Inc. Content streaming with client device trick play index
US9967305B2 (en) 2013-06-28 2018-05-08 Divx, Llc Systems, methods, and media for streaming media content
AU2014294215B2 (en) * 2013-07-22 2018-10-04 Sony Corporation Image processing device and method
US9343112B2 (en) 2013-10-31 2016-05-17 Sonic Ip, Inc. Systems and methods for supplementing content from a server
JP6070524B2 (ja) * 2013-12-04 2017-02-01 ソニー株式会社 表示パネル、駆動方法、および電子機器
US9866878B2 (en) 2014-04-05 2018-01-09 Sonic Ip, Inc. Systems and methods for encoding and playing back video at different frame rates using enhancement layers
JP6410495B2 (ja) * 2014-07-07 2018-10-24 ルネサスエレクトロニクス株式会社 画像符号化装置、画像復号装置、および画像通信システム
EP4280598A3 (en) * 2014-09-12 2024-02-21 Panasonic Intellectual Property Corporation of America Recording medium, playback device, and playback method
CN104735385B (zh) * 2015-03-31 2018-10-12 小米科技有限责任公司 播放控制方法及装置、电子设备
US20160360205A1 (en) * 2015-06-08 2016-12-08 Industrial Technology Research Institute Video encoding methods and systems using adaptive color transform
US10075292B2 (en) 2016-03-30 2018-09-11 Divx, Llc Systems and methods for quick start-up of playback
US10148989B2 (en) 2016-06-15 2018-12-04 Divx, Llc Systems and methods for encoding video content
US10498795B2 (en) 2017-02-17 2019-12-03 Divx, Llc Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming
JP7077812B2 (ja) * 2018-06-19 2022-05-31 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
WO2020039593A1 (ja) * 2018-08-24 2020-02-27 オリンパス株式会社 画像記録再生装置及び内視鏡システム
CN114175662B (zh) 2019-07-20 2023-11-24 北京字节跳动网络技术有限公司 调色板模式使用指示的条件相关编解码
CN114208174B (zh) 2019-07-29 2023-11-28 北京字节跳动网络技术有限公司 预测过程中的调色板模式编解码
TWI784446B (zh) * 2021-03-18 2022-11-21 圓展科技股份有限公司 顯示系統、顯示方法及影像擷取裝置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG74566A1 (en) 1995-08-23 2000-08-22 Sony Corp Encoding/decoding fields of predetermined field polarity apparatus and method
FR2749116B1 (fr) * 1996-05-24 1998-06-19 Thomson Multimedia Sa Camera a effets speciaux
JP3058870B1 (ja) 1999-02-05 2000-07-04 株式会社次世代デジタルテレビジョン放送システム研究所 Afc回路
JP2002108325A (ja) * 2000-09-26 2002-04-10 Fuji Film Microdevices Co Ltd 画像処理装置及び画像処理方法
CN1364033A (zh) * 2000-11-28 2002-08-14 国枝博昭 动态图像信息的高性能编码压缩系统
JP4622141B2 (ja) 2001-04-13 2011-02-02 ソニー株式会社 画像処理装置および画像処理方法、記録媒体、並びにプログラム
US7187785B2 (en) * 2001-08-28 2007-03-06 Nippon Telegraph And Telephone Corporation Image processing method and apparatus
JP2003111094A (ja) * 2001-10-01 2003-04-11 Megafusion Corp 合成撮影システム、合成画像生成法および画像合成装置
EP1474932B1 (en) 2002-02-01 2011-01-19 Koninklijke Philips Electronics N.V. An apparatus and a record carrier for, and a method of recording a sequence of video data signals
JP4240283B2 (ja) * 2002-10-10 2009-03-18 ソニー株式会社 復号装置及び復号方法
JP2004172862A (ja) * 2002-11-19 2004-06-17 Megachips System Solutions Inc 画像合成方法および合成画像配信システム
KR20030051545A (ko) * 2003-06-04 2003-06-25 경민규 동영상 씨디롬 제작장치
JP2005123775A (ja) 2003-10-15 2005-05-12 Sony Corp 再生装置、再生方法、再生プログラムおよび記録媒体
KR100561404B1 (ko) 2003-10-30 2006-03-16 삼성전자주식회사 재생 모드 정보가 설정된 동영상 재생 장치, 저장 매체 및그 재생방법
CN101790067B (zh) * 2004-02-17 2013-09-11 松下电器产业株式会社 记录方法和再现装置
US7577340B2 (en) * 2004-07-21 2009-08-18 Panasonic Corporation Device and method for recording real-time data
KR101148701B1 (ko) * 2004-08-31 2012-05-23 파나소닉 주식회사 동화상 부호화 방법 및 장치
AR064274A1 (es) * 2006-12-14 2009-03-25 Panasonic Corp Metodo de codificacion de imagenes en movimiento, dispositivo de codificacion de imagenes en movimiento, metodo de grabacion de imagenes en movimiento, medio de grabacion, metodo de reproduccion de imagenes en movimiento, dispositivo de reproduccion de imagenes en movimiento, y sistema de reproducci

Also Published As

Publication number Publication date
US8526797B2 (en) 2013-09-03
CN101800896A (zh) 2010-08-11
CN101554057A (zh) 2009-10-07
RU2010145129A (ru) 2012-05-10
KR101362653B1 (ko) 2014-02-13
CN101800896B (zh) 2012-08-29
US7974521B2 (en) 2011-07-05
CN101554057B (zh) 2011-07-20
US8023804B2 (en) 2011-09-20
JP2011103669A (ja) 2011-05-26
TWI446794B (zh) 2014-07-21
JP2011097612A (ja) 2011-05-12
RU2475997C2 (ru) 2013-02-20
CA2671557A1 (en) 2008-06-19
AR064274A1 (es) 2009-03-25
TW201108747A (en) 2011-03-01
CN101815213B (zh) 2013-01-09
EP2079241B1 (en) 2012-10-31
JPWO2008072669A1 (ja) 2010-04-02
RU2009120317A (ru) 2010-12-10
JP4841689B2 (ja) 2011-12-21
US20100054710A1 (en) 2010-03-04
EP2079241A1 (en) 2009-07-15
EP2079241A4 (en) 2011-11-09
CN101848384A (zh) 2010-09-29
BRPI0719335A2 (pt) 2011-05-10
CN101815214A (zh) 2010-08-25
RU2483467C2 (ru) 2013-05-27
US20100040348A1 (en) 2010-02-18
TW200845761A (en) 2008-11-16
CA2671557C (en) 2016-01-12
US20100040351A1 (en) 2010-02-18
ZA200903806B (en) 2010-05-26
CN101815213A (zh) 2010-08-25
CN101815214B (zh) 2012-11-21
WO2008072669A1 (ja) 2008-06-19
BRPI0722391A2 (pt) 2012-06-12
JP4718616B2 (ja) 2011-07-06
KR20090098802A (ko) 2009-09-17
US20110299831A1 (en) 2011-12-08

Similar Documents

Publication Publication Date Title
JP4841688B2 (ja) 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置
JP4201213B2 (ja) 動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110906

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111004

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4841688

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141014

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees