JP2008301512A - 動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システム - Google Patents

動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システム Download PDF

Info

Publication number
JP2008301512A
JP2008301512A JP2008183938A JP2008183938A JP2008301512A JP 2008301512 A JP2008301512 A JP 2008301512A JP 2008183938 A JP2008183938 A JP 2008183938A JP 2008183938 A JP2008183938 A JP 2008183938A JP 2008301512 A JP2008301512 A JP 2008301512A
Authority
JP
Japan
Prior art keywords
picture
encoding
information
variable
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008183938A
Other languages
English (en)
Other versions
JP4201213B2 (ja
Inventor
Tadamasa Toma
正真 遠間
Shinya Sumino
眞也 角野
Masayasu Iguchi
雅保 井口
Tomoyuki Okada
智之 岡田
Yoshinori Matsui
義徳 松井
Toshiyuki Kondo
敏志 近藤
Hiroshi Yabaneta
洋 矢羽田
Ko Ikeda
航 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2008183938A priority Critical patent/JP4201213B2/ja
Publication of JP2008301512A publication Critical patent/JP2008301512A/ja
Application granted granted Critical
Publication of JP4201213B2 publication Critical patent/JP4201213B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2541Blu-ray discs; Blue laser DVR discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal

Abstract

【課題】復号時の処理負荷を増大させることなく再生途切れを発生させない動画像符号化方法を提供する。
【解決手段】本発明の動画像符号化方法は、周囲の状況に応じて、適応的に符号化を行う可変長符号化方式と、周囲の状況に応じて、適応的に符号化を行う2値の算術符号化方式とを切り替えて動画像を符号化する動画像符号化方法であって、シームレスな連続再生の対象となる連続区間を決定し、前記連続区間を構成し、復号順で先頭のピクチャが画面内符号化ピクチャである各再生区間において、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方を用いて、動画像を符号化することにより動画像ストリームを生成し、連続する前記再生区間における符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方に固定されていることを、前記再生区間ごとに示す第1フラグ情報を含む管理情報を生成する。
【選択図】図11

Description

本発明は、可変長符号化の方式を切り替えて動画像を符号化する動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システムに関する。
従来の技術である、DVD−Videoディスク(以下単にDVDと呼ぶ)について説明する。
図1は、DVDの構造を示した図である。図1の下段に示すように、DVDディスク上にはリード・インからリード・アウトまでの間に論理アドレス空間が設けられ、論理アドレス空間の先頭からファイルシステムのボリューム情報が記録され、続いて映像音声などのアプリケーションデータが記録されている。
ファイルシステムとは、ISO9660やUDF(Universal Disc Format)のことであり、ディスク上のデータをディレクトリまたはファイルと呼ばれる単位で表現する仕組みである。日常使っているPC(パーソナルコンピュータ)の場合でも、FATまたはNTFSと呼ばれるファイルシステムを通すことにより、ディレクトリやファイルという構造でハードディスクに記録されたデータがコンピュータ上で表現され、ユーザビリティを高めている。
DVDの場合、UDFおよびISO9660両方を使用しており(両方を合わせて「UDFブリッジ」と呼ぶ事がある)、UDFまたはISO9660どちらのファイルシステムドライバによってもデータの読み出しができるようになっている。勿論、書き換え型のDVDディスクであるDVD−RAM/R/RWでは、これらファイルシステムを介し、物理的にデータの読み、書き、削除が可能である。
DVD上に記録されたデータは、UDFブリッジを通して、図1左上に示すようなディレクトリまたはファイルとして見ることができる。ルートディレクトリ(図中「ROOT」)の直下に「VIDEO_TS」と呼ばれるディレクトリが置かれ、ここにDVDのアプリケーションデータが記録されている。アプリケーションデータは、複数のファイルとして記録され、主なファイルとして以下のものがある。
VIDEO_TS.IFO ディスク再生制御情報ファイル
VTS_01_0.IFO ビデオタイトルセット#1再生制御情報ファイル
VTS_01_0.VOB ビデオタイトルセット#1ストリームファイル
.....
拡張子として2つの種類が規定されており、「IFO」は再生制御情報が記録されたファイルであって、「VOB」はAVデータであるMPEGストリームが記録されたファイルである。再生制御情報とは、DVDで採用されたインタラクティビティ(ユーザの操作に応じて再生を動的に変化させる技術)を実現するための情報や、メタデータのようなタイトルやAVストリームに付属する情報などのことである。また、DVDでは一般的に再生制御情報のことをナビゲーション情報と呼ぶことがある。
再生制御情報ファイルは、ディスク全体を管理する「VIDEO_TS.IFO」と、個々のビデオタイトルセット(DVDでは複数のタイトル、言い換えれば異なる映画や異なるバージョンの映画を1枚のディスクに記録することが可能である。)毎の再生制御情報である「VTS_01_0.IFO」がある。ここで、ファイル名ボディにある「01」はビデオタイトルセットの番号を示しており、例えば、ビデオタイトルセット#2の場合は、「VTS_02_0.IFO」となる。
図1の右上部は、DVDのアプリケーション層でのDVDナビゲーション空間であり、前述した再生制御情報が展開された論理構造空間である。「VIDEO_TS.IFO」内の情報は、VMGI(Video Manager Information)として、「VTS_01_0.IFO」または、他のビデオタイトルセット毎に存在する再生制御情報はVTSI(Video Title Set Information)としてDVDナビゲーション空間に展開される。
VTSIの中にはPGC(Program Chain)と呼ばれる再生シーケンスの情報であるPGCI(Program Chain Information)が記述されている。PGCIは、Cellの集合とコマンドと呼ばれる一種のプログラミング情報によって構成されている。Cell自身はVOB(Video Objectの略であり、MPEGストリームを指す)の一部区間または全部区間の集合であり、Cellの再生は、当該VOBのCellによって指定された区間を再生することを意味している。
コマンドは、DVDの仮想マシンによって処理されるものであり、ブラウザ上で実行されるJava(登録商標)スクリプトなどに近いものである。しかしながらJava(登録商標)スクリプトが論理演算の他にウィンドウやブラウザの制御(例えば、新しいブラウザのウィンドウを開くなど)を行うのに対して、DVDのコマンドは、論理演算の他にAVタイトルの再生制御、例えば、再生するチャプタの指定などを実行するだけのものである点で異なっている。
Cellはディスク上に記録されているVOBの開始および終了アドレス(ディスク上での論理記録アドレス)をその内部情報として有しており、プレーヤは、Cellに記述されたVOBの開始および終了アドレス情報を使ってデータの読み出し、再生を実行する。
図2はAVストリーム中に埋め込まれているナビゲーション情報を説明する概略図である。DVDの特長であるインタラクティビティは前述した「VIDEO_TS.IFO」や「VTS_01_0.IFO」などに記録されているナビゲーション情報だけによって実現されているのではなく、幾つかの重要な情報はナビゲーション パック(ナビパックまたは、NV_PCKと称する)と呼ばれる専用キャリアを使いVOB内に映像、音声データと一緒に多重化されている。
ここでは簡単なインタラクティビティの例としてメニューを説明する。メニュー画面上には、幾つかのボタンが現れ、夫々のボタンには当該ボタンが選択実行された時の処理が定義されている。また、メニュー上では一つのボタンが選択されており(ハイライトによって選択ボタン上に半透明色がオーバーレイされており該ボタンが選択状態であることをユーザに示す)、ユーザは、リモコンの上下左右キーを使って、選択状態のボタンを上下左右の何れかのボタンに移動させることが出来る。リモコンの上下左右キーを使って、選択実行したいボタンまでハイライトを移動させ、決定する(決定キーを押す)ことによって対応するコマンドのプログラムが実行される。一般的には対応するタイトルやチャプタの再生がコマンドによって実行されている。
図2の左上部はNV_PCK内に格納される制御情報の概要を示している。
NV_PCK内には、ハイライトカラー情報と個々のボタン情報などが含まれている。ハイライトカラー情報には、カラーパレット情報が記述され、オーバーレイ表示されるハイライトの半透明色が指定される。ボタン情報には、個々のボタンの位置情報である矩形領域情報と、当該ボタンから他のボタンへの移動情報(ユーザの上下左右キー操作夫々に対応する移動先ボタンの指定)と、ボタンコマンド情報(当該ボタンが決定された時に実行されるコマンド)が記述されている。
メニュー上のハイライトは、図2の中央右上部に示すように、オーバーレイ画像として作られる。オーバーレイ画像は、ボタン情報の矩形領域情報にカラーパレット情報の色をつけた物である。このオーバーレイ画像は図2の右部に示す背景画像と合成されて画面上に表示される。
上述のようにして、DVDではメニューを実現している。また、何故、ナビゲーションデータの一部をNV_PCKを使ってストリーム中に埋め込んでいるのは、ストリームと同期して動的にメニュー情報を更新したり(例えば、映画再生の途中5分〜10分の間にだけメニューが表示されるなど)、同期タイミングが問題となりやすいアプリケーションの場合でも、問題なく実現できるようにしたためである。また、もう一つの大きな理由は、NV_PCKには特殊再生を支援するための情報を格納し、DVD再生時の早送り、巻き戻しなどの非通常再生時にも円滑にAVデータをデコードし再生させる等、ユーザの操作性を向上させるためである。
図3は、DVDのストリームであるVOBのイメージである。図に示すように、映像、音声、字幕などのデータ(A段)は、MPEGシステム規格(ISO/IEC13818−1)に基づいて、パケットおよびパック化し(B段)、夫々を多重化して1本のMPEGプログラムストリームにしている(C段)。また、前述した通りインタラクティブを実現するためのボタンコマンドを含んだNV_PCKも一緒に多重化をされている。
MPEGシステムの多重化の特徴は、多重化する個々のデータは、そのデコード順に基づくビット列になっているが、多重化されるデータ間、即ち、映像、音声、字幕の間は必ずしも再生順に基づいてビット列が形成されている訳ではない。これは多重化したMPEGシステムストリームのデコーダモデル(一般にSystem Target Decoder、またはSTDと呼ばれる(図3のD段))が多重化を解いた後に個々のエレメンタリーストリームに対応するデコーダバッファを持ち、デコードタイミングまでに一時的にデータを蓄積している事に由来している。例えばDVD−Videoで規定されるデコーダバッファは、個々のエレメンタリーストリーム毎にサイズが異なり、映像に対しては、232KB、音声に対しては4KB、字幕に対しては52KBを夫々有している。
即ち、映像データと並んで多重化されている字幕データが必ずしも同一タイミングでデコードもしくは再生されているわけでは無い。
一方、次世代DVD規格としてBD(Blu−ray Disc)がある。
DVDでは、標準画質(Standard Definition画質)の映像に対する、パッケージ配信(DVD−Video規格)やアナログ放送の記録(DVD Video Recording規格)を目的としてきたが、BDでは、高精度画質(High Definition画質)のデジタル放送をそのまま記録する(Blu−ray Disc Rewritable規格、以下BD−RE)ことができる。
しかしながら、BD−RE規格は広くデジタル放送の記録を目的としているため、特殊
再生の支援情報などが最適化されていない。将来的に、高精度映像をデジタル放送よりも高レートでパッケージ配信させることを考えると(BD−ROM規格)、非通常再生時でもユーザにストレスを与えない仕組みが必要となってくる。
また、BDにおける動画像の符号化方式の1つとして、MPEG−4 AVC(Advanced Video Coding)が採用されている。MPEG−4 AVCとは、ISO/IEC(国際標準化機構 国際電気標準会議)のJTC1/SC29/WG11とITU−T(国際電気通信連合 電気通信標準化部門)が共同で策定した高圧縮率の次世代符号化方式である。
一般に動画像の符号化では、時間方向および空間方向の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、ピクチャとは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インタレース画像ではフレームもしくはフィールドを意味する。ここで、インタレース画像とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。インタレース画像の符号化や復号化処理においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造として処理したりすることができる。
参照画像を持たず画面内予測符号化を行うものをIピクチャと呼ぶ。また、1枚のピクチャのみを参照し画面間予測符号化を行うものをPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことのできるものをBピクチャと呼ぶ。Bピクチャは表示時間が前方もしくは後方から任意の組み合わせとして2枚のピクチャを参照することが可能である。参照画像(参照ピクチャ)は符号化および復号化の基本単位であるブロックごとに指定することができるが、符号化を行ったビットストリーム中に先に記述される方の参照ピクチャを第1参照ピクチャ、後に記述される方を第2参照ピクチャとして区別する。ただし、これらのピクチャを符号化および復号化する場合の条件として、参照するピクチャが既に符号化および復号化されている必要がある。
符号化する画像から、画面内予測、あるいは画面間予測から得られた予測信号を引き算した残差信号は、周波数変換して量子化した後に、可変長符号化されて符号化ストリームとして出力される。MPEG−4 AVCには、可変長符号化の方式としてCAVLC(Context-Adaptive Variable Length Coding:コンテキスト適応型可変長符号化)とCABAC(Context-Adaptive Binary Arithmetic Coding:コンテキスト適応型2値算術符号化)の2種類があり、ピクチャ単位で切り替えることができる。ここで、コンテキスト適応型とは、周囲の状況に応じて効率の良い符号化方式を適応的に選択する方式である。
図4は、MPEG−4 AVCのストリームにおいて、ランダムアクセス可能な単位を構成するピクチャに適用される可変長符号化の方式を示す例である。ここで、MPEG−4 AVCでは、MPEG−2ビデオのGOP(Group of Pictures)に相当する概念は無いが他のピクチャに依存せずに復号化できる特別なピクチャ単位でデータを分割すればGOPに相当するランダムアクセス可能な単位が構成できるので、これをランダムアクセス単位 (RAU)と呼ぶことにする。図4に示すように、可変長符号化の方式としてCABAC、あるいはCAVLCが適用されるかがピクチャ単位で切り替わる。
次に、CABACとCAVLCとでは可変長復号時の処理が異なるため、図5Aから図5Cを参照してそれぞれの可変長復号処理について説明する。図5Aは、CABACにより可変長符号化されたデータの復号処理であるCABAD(Context-Adaptive Binary Arithmetic Decoding:コンテキスト適応型2値算術復号)と、CAVLCにより可変長符号化されたデータの復号処理であるCAVLD(Context-Adaptive Variable Length Decoding:コンテキスト適応型可変長復号)とを行う画像復号化装置のブロック図を示す。
CABADを伴う画像復号化処理は次のように行われる。まず、CABACが適用された符号化データVinがストリームバッファ5001に入力される。続いて、算術復号部5002は、ストリームバッファから符号化データVrを読み出して算術復号を行い、2値データBin1を2値データバッファ5003に入力する。2値データ復号処理部5004は、2値データバッファ5003から2値データBin2を取得して、2値データを復号し、復号後の2値データDin1を画素復元部5005に入力する。画素復元部5005は、2値復号データDin1に対して逆量子化、逆変換、および動き補償などを行い、画素を復元し、復号データ Voutを出力する。
図5Bは、CABACが適用された符号化データを復号開始してから、画素復元処理を実施するまでの動作を示すフローチャートである。まず、ステップ5001において、CABACが適用された符号化データVinを算術復号して、2値データを生成する。次に、ステップ5002において、1以上のピクチャなど、所定のデータ単位分の2値データが揃ったかどうか判定し、揃った際にはステップS5003に進み、揃っていない場合にはステップS5002の処理を繰り返す。ここで、2値データのバッファリングを行うのは、CABACでは、ピクチャあるいはマクロブロックあたりの2値データの符号量が著しく大きくなることがあり、それに伴い算術復号の処理負荷も著しく増加し得るため、ワーストケースにおいても途切れのない再生を実現するためには、予め一定量の算術復号処理を行っておく必要があるためである。ステップS5003では、2値データを復号し、ステップS5004において画素復元処理を実施する。このように、CABADにおいては、ステップS5001およびステップS5002において所定のデータ単位分の2値データが揃うまで画素復元処理を開始できないため、復号開始時に遅延が発生する。
CAVLDを伴う画像復号化処理は次のように行われる。まず、CAVLCが適用された符号化データVinがストリームバッファ5001に入力される。続いて、CAVLD部5006は、可変長復号処理を行い、VLD復号データDin2を画素復元部5005に入力する。画素復元部5005は、逆量子化、逆変換、および動き補償などを行い、画素を復元し、復号データVoutを出力する。図5Cは、CAVLCが適用された符号化データを復号開始してから、画素復元処理を実施するまでの動作を示すフローチャートである。まず、ステップS5005においてCAVLDを行い、続いて、ステップS5004において画素復元処理を実施する。このように、CAVLDにおいては、CABADとは異なり、画素復元処理を開始する前に、所定のデータ単位分のデータが揃うまで待つ必要がないとともに、2値データバッファ5003のような、可変長復号処理における中間バッファをもつ必要がない。
図6は、図4の例のように、ストリームの途中で可変長符号化の方式が切り替わるストリームを復号する、従来の復号装置の動作を示すフローチャートである。まず、ステップS5101において、ピクチャに適用された可変長符号化方式を示す情報を取得して、ステップS5102に進む。ステップS5102では、復号順で直前のピクチャと現ピクチャとで可変長符号化の方式が切り替わったかどうかを判定する。CABADとCAVLDとでは、可変長復号処理におけるバッファの管理方法が異なるため、可変長符号化の方式が切り替わった際には、ステップS5103に進んでバッファ管理の切替え処理を行い、可変長符号化の方式が切り替わっていなければステップS5104に進む。ステップS5104において可変長符号化方式がCAVLCであるかどうか判定し、CAVLCである際にはステップS5105に進んでCAVLD処理を行い、CABACである際にはステップS5106に進む。ステップS5106では、復号順で直前のピクチャと現ピクチャとで可変長符号化の方式が切り替わったかどうか判定し、切り替わった際にはステップS5107に進み、図5のステップS5001とステップS5002に示すように、所定のデータ単位分の2値データが揃うまで算術復号を行ってから、2値データを復号する。ステップS5106で可変長符号化の方式が切り替わっていないと判定された際には、ステップS5108に進み、通常のCABAD処理を行う。ここで、通常のCABAD処理とは、CAVLCからCABACに切り替わる、あるいはCABACが適用されたストリームの復号を開始する際に必要であった2値データのバッファリングを行わない処理である。最後に、ステップS5109において画素復元処理を実施する。
特開2000−228656号公報 Proposed SMPTE Standard for Television: VC-1 Compressed Video Bitstream Format and Decoding Process, Final Committee Draft 1 Revision 6, 2005.7.13
このように、従来のMPEG−4 AVCのストリームが多重化された従来の情報記録媒体を再生する際には、ピクチャ単位で可変長符号化の方式が切り替わるため、CAVLCからCABACに切り替わる際には、2値データのバッファリングに伴い遅延が発生するという第1の課題があった。特に、切り替わりの頻度が高くなると遅延が累積し、再生が途切れてしまうことがある。また、CABACとCAVLCとでは、バッファ管理の方法が異なるため、可変長符号化の方式が切り替わるたびにバッファ管理の方式を切り替える必要があり、復号時の処理負荷が増大するという第2の課題があった。
本発明は、復号時の処理負荷を増大させることなく再生途切れを発生させない動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システムを提供することを目的とする。
上記目的を達成する画像符号化方法は、可変長符号化の方式を切り替えて動画像を符号化する動画像符号化方法であって、連続再生の対象となる連続区間を決定し、前記連続区間において可変長符号化の方式を切り替えないで、動画像を符号化することによりストリームを生成し、前記連続区間における可変長符号化の方式が固定であることを示す第1フラグ情報を含む管理情報を生成する。
この構成によれば、連続再生の対象となる区間において可変長符号化の方式を固定にしているので、可変長符号化の方式の切り替わりに起因する復号時の遅延をなくすことができ、復号時の再生品質を向上させることができる。また、バッファ管理方法の切替えに伴う処理負荷を軽減することができる。
ここで、前記連続区間は、1つのストリームに対応し、トランスポートストリームのパケット識別子によって特定される区間としてもよい。
ここで、前記連続区間を構成するストリームは、トランスポートストリームのパケット識別子によって特定されるようにしてもよい。
ここで、前記連続区間は、シームレス接続の対象となるストリームを含む区間としてもよい。
ここで、前記連続区間は、シームレスなマルチアングルを構成する各アングルに対応するストリームを含む区間としてもよい。
ここで、前記連続区間は、ノンシームレス・マルチアングルを構成する各アングルに対応するストリームを含む区間としてもよい。
ここで、動画像符号化方法は、さらに、符号化された動画像の所定単位毎に、可変長符号化の方式を示す第2フラグ情報をストリームに挿入するようにしてもよい。
ここで、前記管理情報は、ストリームの全部または一部を再生区間として、1つ以上の再生区間の再生順を示すプレイリストを含み、前記第1フラグ情報は、プレイリストに示される再生区間毎に生成され、前記所定単位は、MPEG-4 AVCで符号化されたストリームにおけるピクチャ・パラメータ・セットが付加される単位であるとしてもよい。
この構成によれば、MPEG−4 AVCなどストリーム内で可変長符号化の方式を切り替えられる符号化を用いて、復号時の処理負荷を増大させることなく再生途切れを防止することができる。
ここで、前記管理情報は、ストリームの全部または一部を再生区間として、1つ以上の再生区間の再生順を示すプレイリストを含み、前記第1フラグ情報は、プレイリストに示される再生区間毎に生成され、前記第2フラグ情報は、マクロブロック単位の情報についての可変長符号化方式を示し、前記所定単位は、ストリームにおけるピクチャ単位であり、前記マクロブロック単位の情報は、可変長符号化方式がビットプレーン符号化における第1の方式である場合には、ストリームにおけるマクロブロック単位で付加され、可変長符号化方式がビットプレーン符号化における第2の方式である場合には、ストリームにおけるピクチャ単位で付加され、前記第2の方式では、ピクチャ内の全マクロブロックに対応する第2フラグ情報がストリームにおけるピクチャの先頭に挿入されるようにしてもよい。
この構成によれば、VC−1などストリーム内で可変長符号化の方式を切り替えられる符号化を用いて、復号時の処理負荷を増大させることなく再生途切れを防止することができる。
ここで、前記第1フラグ情報は、前記連続区間における可変長符号化の方式が固定であることを示し、かつ、当該ストリームがシームレスの対象であることを示すようにしてもよい。
この構成によれば、管理情報のデータ量を削減することができる。
また、本発明の画像符号化装置は、上記画像符号化方法と同様の手段を備えるので、詳細は省略する。
また、本発明における、コンピュータ読取可能な構造を有するデータは、管理情報と、符号化された動画像を示すストリームとを含み、前記管理情報は、連続再生の対象となる連続区間における可変長符号化の方式が固定であることを示す第1フラグ情報を含み、前記ストリームは、符号化された動画像の所定単位毎に、可変長符号化の方式を示す第2フラグ情報とを含む。
この構成によれば、連続再生の対象となる区間において可変長符号化の方式を固定にしているので、可変長符号化の方式の切り替わりに起因する復号時の遅延をなくすことができ、復号時の再生品質を向上させることができる。また、バッファ管理方法の切替えに伴う処理負荷を軽減することができる。
ここで、前記管理情報は、ストリームの全部または一部を再生区間として、1つ以上の再生区間の再生順を示すプレイリストを含み、前記第1フラグ情報は、プレイリストに示される各ストリームに対応し、前記所定単位は、ストリームにおけるピクチャ・パラメータ・セットが付加される単位としてもよい。
ここで、前記管理情報は、ストリームの全部または一部を再生区間として、1つ以上の再生区間の再生順を示すプレイリストを含み、前記第1フラグ情報は、プレイリストに示される各ストリームに対応し、前記第2フラグ情報は、マクロブロック毎の可変長符号化方式を示し、前記所定単位は、可変長符号化方式が第1の方式である場合には、ストリームにおけるマクロブロック単位であり、可変長符号化方式が第2の方式である場合には、ストリームにおけるピクチャ単位であり、可変長符号化方式が前記第2の方式である場合に、ピクチャ内の全マクロブロックに対応する第2フラグ情報がストリームにおけるピクチャの先頭に挿入されるようにしてもよい。
以上のように、本発明の動画像符号化方法によれば、連続区間において動画像の符号化データに適用される可変長符号化の方式を固定としたことで、可変長符号化の方式の切り替わりに起因する復号時の遅延をなくすことができるとともに、バッファ管理方法の切替えに伴う処理負荷を軽減できる。例えば、MPEG−4 AVCや、VC−1などストリーム内で可変長符号化の方式を切り替えられるストリームが多重化されたパッケージメディアの再生品質を向上させることができるとともに、再生装置の処理負荷を軽減でき、その実用的価値が高い。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
まず本発明の第1の実施の形態について説明する。
本実施の形態では、BD−ROMなどのパッケージメディアなどにおいて、動画像の符号化データを復号する際に、可変長符号化方式が切り替わることによる復号動作の遅延、また、同時に必要となるバッファ管理方法の切替えに伴う処理負荷の増加を抑えることのできる情報記録媒体、およびその再生装置について説明する。ここで、動画像の符号化方式はMPEG−4 AVCとするが、ストリームの途中で可変長符号化方式を切り替えることのできる他の符号化方式であってもよい。
本実施の形態の情報記録媒体に格納されるMPEG−4 AVCストリームにおいては、可変長符号化の方式を切り替えることのできる単位が制約されるとともに、切替え単位が制約されていること、あるいは制約された切替え単位を示す情報が管理情報に格納される。
図7は、MPEG−4 AVCのストリームにおける、可変長符号化方式の切替え単位の制約例を示す。BD−ROMなどのパッケージメディアにおいては、プレイリストなどによって、動画像の符号化データを連続して再生する単位(以降、連続再生単位と呼ぶ)が示されるため、連続再生単位において可変長符号化方式を固定とすれば、連続して再生される区間において、可変長符号化方式の切替えに伴う復号動作の遅延や、バッファ管理方法の切り替わりは発生しない。従って、本実施の形態では、連続再生単位において可変長符号化方式を固定とする。図7(a)と(b)は、それぞれ、連続再生単位において可変長符号化の方式をCAVLCのみ、CABACのみに制限した例を示す。さらに、連続して再生されるクリップの接続条件には、シームレス接続と、非シームレス接続の2種類がある。ここでの接続とは、同一クリップ内の複数の区間を接続するケースを含めるものとする。非シームレス接続においては、例えば、オープンGOPへの接続時のように復号動作にギャップが発生することがあるため、可変長符号化方式の切り替わりも許容することにして、シームレス接続される連続再生単位において可変長符号化の方式を固定としてもよい。
なお、クリップやランダムアクセス単位(RAU)など連続再生単位とは異なる単位において可変長符号化の方式を固定としてもよい。図7(c)と(d)は、クリップ単位で固定とした例、図7(e)はランダムアクセス単位で固定とした例を示す。
次に、管理情報においては、MPEG−4 AVCのストリームにおいて、可変長符号化方式の切替え単位が制約されていることを示すフラグ情報が格納される。ここでは、符号化方式の識別情報をフラグとして使用する。図8は、BD−ROMにおけるフラグの格納例を示す。BD−ROMにおいては、プレイリストから参照される各クリップの符号化方式は、管理情報内のStreamCodingInfoと呼ばれる領域に格納されるため、ここで符号化方式がMPEG−4 AVCであることが示される際には、連続再生単位において可変長符号化の方式が固定であるとする。なお、可変長符号化の方式がCABACであるかCAVLCであるかを別途示してもよい。
なお、可変長符号化方式の切替え単位が制約されていることを示すフラグを別途規定して格納してもよいし、さらに、切替え単位を示す情報を格納してもよい。また、これらの情報は、MPEG−4 AVCのストリーム内に格納してもよい。例えば、ランダムアクセス単位内のピクチャにおいて可変長符号化の方式が固定であることを示す情報を、ランダムアクセス単位の先頭ピクチャにおけるSEI(Supplemental Enhancement Information)、あるいはUnspecifiedのタイプを持つNAL(Network Abstraction Layer)ユニットに格納できる。
なお、MPEG−4 AVCでは、ピクチャ単位の初期化情報を示すPPS(Picture Parameter Set)内の entropy_coding_mode_flagにおいて、可変長符号化の方式がCAVLCであるかCABACであるかが示される。従って、一定の区間において可変長符号化の方式が固定である際には、当該区間におけるピクチャが参照する全てのPPSにおいて、 entropy_coding_mode_flagのフィールド値が固定となる。MPEG−4 AVCでは、復号順で所定の区間に存在するピクチャから参照されないPPSを、前記所定の区間に格納することも許されるが、区間内のピクチャから参照されないPPSにおけるentropy_coding_mode_flagのフィールド値については特に制限する必要はない。例えば、ランダムアクセス単位RAU内のピクチャが参照するPPSは、全てランダムアクセス単位RAU内に存在することが保証されるが、ランダムアクセス単位RAU内のピクチャから参照されないPPSがランダムアクセス単位内に存在してもよい。このとき、参照されないPPSは復号に影響しないため、 entropy_coding_mode_flagのフィールド値については制限しなくてもよい。ただし、所定区間に含まれるPPSにおけるentropy_coding_mode_flagのフィールド値を一意に定めたほうが扱いが簡単であるため、参照されないPPSも含めてフィールド値を固定としてもよい。
図9は、本実施の形態の情報記録媒体における連続再生単位の復号動作を示すフローチャートである。連続再生単位においては可変長符号化の方式が固定であるため、図6の従来の復号動作とは異なり、復号途中での2値データのバッファリング、およびバッファ管理方法の切替えは不要となる。各ステップの動作については、図6において同一符号を附したステップと同一であるため、説明を省略する。
さらに、新規の符号化方式として、現在、SMPTE(The Society of Motion Picture andTelevision Engineers)でVC-1(非特許文献1)の規格が策定中である。VC-1では、マクロブロック(16×16画素の大きさを有する単位)の符号化方法を示す種々のフラグが定義されている。フラグとしては例えば、スキップマクロブロックであるか否か、フィールドモード/フレームモードのいずれであるか、ダイレクトモードマクロブロックであるか否か、等がある。
拡張された符号化ツールの一つに、ビットプレーン符号化がある。ビットプレーン符号化は、上記のマクロブロックの符号化方法を示すフラグを示す際に用いられる。ビットプレーン符号化では、これらのフラグを1ピクチャ分まとめて、ピクチャヘッダで示すことができる。一般的に隣接するマクロブロックは相関が高いため、フラグにも相関が高くなる。よって、隣接する複数のマクロブロックのフラグをまとめて符号化することにより、フラグを表現する符号量を削減することができる。
ビットプレーン符号化では、7種類の符号化方法が規定されている。うち1つはマクロブロックヘッダで各フラグを符号化する方法であり、この方法はローモード(RAW MODE)と呼ばれ、MPEG-2ビデオ方式やMPEG-4ビジュアル方式と同様の方法となる。残りの6つの方法は、1ピクチャ分のフラグをまとめて符号化する方法であり、隣接するマクロブロックのフラグをどのようにまとめて符号化するかにより、異なる方法が定義されている。この6つの方法としては、例えば、左右に隣接する2つのマクロブロックのフラグをまとめて符号化する方法、水平方向に並ぶ一列のマクロブロックのフラグがすべて「0」であればそれを1ビットの「0」で表し、一列のマクロブロックのフラグに1つでも「1」があれば各フラグをそのまま符号化する方法、等がある。
ビットプレーン符号化でこの7種類のいずれの方法を用いるかは、フラグ毎に独立して、ピクチャ単位で変更することができる。
ここで、ビットプレーン符号化において、マクロブロックヘッダで各フラグを符号化する方法のみを使う場合をモード1、1ピクチャ分のフラグをまとめて符号化する方法のみを使う場合をモード2とすると、モード1とモード2とでは復号時の動作が異なるため、モードの切り替わり部分において処理の負荷が増大し、遅延が発生することがある。そこで、上記可変長符号化の切り替わり単位を制約したのと同様に、ビットプレーン符号化についてもモード1とモード2の切り替わり単位を制約してもよい。例えば、連続再生単位、あるいはシームレス接続される連続再生単位において、モードを固定とする。また、ビットプレーン符号化のモードが所定の単位において固定であることを示すフラグ情報を管理情報に含めてもよい。例えば、StreamCodingInfoにより示される符号化方式をフラグ情報として使用し、符号化方式がVC -1であると示される際には所定の単位においてビットプレーン符号化のモードが固定であるとできる。
さらに、マクロブロックヘッダで各フラグを符号化する方法と1ピクチャ分のフラグをまとめて符号化する方法を共に使える場合をモード3とすると、VC- 1の使用される環境
に応じて、モード1とモード3を使い分けるケースがある。例えば、処理能力が低い端末向けにはモード1を使い、処理能力が高い端末向けにはモード3を使うことができる。このようなケースでは、所定の再生単位においてモード1、あるいはモード3のどちらか一方に固定することが有効である。さらに、モード1、あるいはモード3のどちらか一方に固定されていることを示すフラグ情報、あるいは、どちらのモードに固定されているかを示す情報を、管理情報、あるいは符号化ストリームに格納できる。なお、モード2とモード3を使い分けてもよい。
図10は、本実施の形態の多重化方法を実現する多重化装置5100の構成を示すブロック図である。多重化装置5100は、切替え単位決定部5101、切替え情報生成部5102、符号化部5103、システム多重化部5104、管理情報作成部5105、結合部5106を備える。以下に、各部の動作について説明する。
切替え単位決定部5101は、可変長符号化の方式を切り替えられる単位を決定し、決定した切替え単位Unitを切替え情報生成部5102、および符号化部5103に入力する。切替え単位は予め定められているものとするが、外部から設定できるようにしてもよい。切替え情報生成部5102は、切替え単位Unitに基づいて、可変長符号化を切替え可能な単位を示す切替え情報SwInfを生成し、管理情報作成部5105に入力する。符号化部5103は、切替え単位Unitの制約を満たすように各クリップのデータを符号化し、符号化データCdata1をシステム多重化部5104に入力する。システム多重化部5104は、符号化データCdata1をシステム多重化し、ストリーム情報StrInf1を管理情報作成部5105に入力し、多重化データMdata1を結合部5106に入力する。BD−ROMではシステム多重化の方式として、ソースパケットと呼ばれる、MPEG−2のトランスポートストリームに4バイトのヘッダを付加した方式が用いられる。また、ストリーム情報StrInf1は、タイムマップなど、多重化データMdata1についての管理情報を生成するための情報を含む。管理情報作成部5105は、ストリーム情報StrInf1に基づいて生成したタイムマップ、および切替え情報SwInfなどを含む管理情報CtrInf1を生成し、結合部5106に入力する。結合部5106は、管理情報CtrlInf1と多重化データMdata1を結合して記録データDout1として出力する。
なお、オーサリングツールなどでデータを作成する際には、符号化データの生成と、システム多重化あるいは管理情報の作成を別々の装置で行うことがあるが、そのような場合でも、各装置の動作は多重化装置5100における各部と同一にすればよい。
図11は、本実施の形態における情報記録媒体に格納された多重化データを作成するための多重化方法の動作を示すフローチャートである。本実施の形態の多重化方法は、可変長符号化の方式を切り替えられる単位を決定するステップ(ステップS5201)、決定した単位に基づいてクリップを符号化するステップ(ステップS5202)、および可変長符号化の切替え単位を示すフラグ情報を生成するステップ(ステップS5204)とを備える点において、従来の多重化方法と異なる。
まず、ステップS5201において、可変長符号化の方式を切り替えられる単位を決定する。すなわち、連続再生単位、クリップ、あるいはランダムアクセス単位のいずれの単位で切替え可能であるかを決定する。続いて、ステップS5202では、ステップS5201で決定した切替え単位に基づいてMPEG−4 AVCのクリップのデータを符号化する。ステップS5203では、最終クリップの符号化が終了したかどうかを判定し、終了したと判定された際にはステップS5204に進み、終了していないと判定されればステップS5202に戻りクリップの符号化を繰り返す。ステップS5204では、可変長符号化の切替え単位を示すフラグ情報を生成し、ステップS5205に進む。ステップS5205では、ステップS5204において生成したフラグ情報を含む管理情報を作成し、管理情報とクリップのデータとを多重化して出力する。
図12は、図11中の可変長符号の方式を切り替えられる単位を決定するステップ(S5201)の具体例を示すフローチャートである。同図では、可変長符号の方式を切り替えられる最小単位を図7(c)、(d)に示したクリップとしている。ここで、クリップとは、記録媒体上ではAVデータのファイルとして格納され、例えば、MPEG−4 AVCの1つのストリームや、VC-1の1つのストリームを格納した1つのファイルを指す。
また、クリップは、トランスポートストリームでは、TSパケットの識別子によって特定されるストリームを指す。
図12において、切り替え単位決定部5101は、符号化対象のピクチャがクリップの開始ピクチャであるか否かを判定し(S5201a)、開始ピクチャでない場合つまりクリップの途中のピクチャである場合には、当該クリップの符号化では可変長符号の方式を切り替え不可と決定する(S5201f)。
開始ピクチャである場合、切り替え単位決定部5101は、開始ピクチャのクリップが、符号化済の直前のクリップとシームレス接続されるか否かを判定し(S5201b)、シームレス接続される場合には、開始ピクチャのクリップの符号化では可変長符号の方式を切り替え不可と決定する(S5201f)。
シームレス接続されない場合、切り替え単位決定部5101は、開始ピクチャのクリップが、マルチアングルを構成するアングルに対応するクリップであるか否かを判定し(S5201c)、当該アングルに対応するクリップである場合には開始ピクチャのクリップの符号化では、当該マルチアングルを構成するアングル間では可変長符号の方式を切り替え不可と決定する(S5201f)。ここで、各アングルにシームレスに接続できるシームレス・マルチアングルにおいては、各アングルの可変長符号化の方式は、マルチアングル区間の直前のクリップと同一の方式に決定される。一方、各アングルにシームレスに接続できることが保証されないノンシームレス・マルチアングルにおいては、各アングルにおいて可変長符号化の方式が同一であれば、当該方式がマルチアングル区間の直前のクリップと異なっていてもよい。
また、切り替え単位決定部5101は、符号化対象のピクチャがクリップの開始ピクチャであって、S5101b〜S5101cのいずれにも該当しない場合(noの場合)には、開始ピクチャのクリップの可変長符号化方式を、符号化済の直前のクリップに対して切り替え可能と決定する(S5201e)。
このように図12のフローチャートでは、切り替え単位決定部5101において切り替えられないと決定されるクリップは、(a)トランスポートストリームのパケット識別子によって特定されるクリップ、(b)シームレス接続の対象となる複数のクリップ、(c)マルチアングルを構成する各アングルに対応する複数のクリップと決定される。なお、S5201a〜S5201cの判定は、どの順序で行ってもよい。なお、マルチアングルの場合についても、シームレス・マルチアングルにおいてのみ、可変長符号化方式を切り替え不可としてもよい。また、クリップはファイル名などパケット識別子とは異なる情報により識別してもよい。また、図12において可変長符号の方式を切り替えられる最小単位が図7(c)、(d)に示したクリップである場合を説明したが、図7(e)のようなRAUを最小単位としてもよい。その場合、図中の「クリップ」を「RAU」に読み替えた処理を行えばよい。
図13は、図11中のクリップ符号化ステップ(S5202)の具体例を示すフローチャートである。図13では、MPEG−4 AVCの符号化を行う場合を示している。同図において、符号化部5103は、クリップの符号化開始に先立って当該クリップの可変長符号の方式を切り替え可能か否かを判定する(S5202a)。この判定は、図12での決定に従う。符号化部5103は、切り替え可能と判定された場合には当該クリップの可変長符号化方式を任意に決定し(S5202b)、切り替え可能でないと判定された場合には当該クリップの可変長符号化方式を互いにシームレス接続される直前の、あるいは同一のマルチアングルを構成する他のクリップと同じ方式に決定する(S5202c)。さらに、符号化部5103は、決定された可変長符号化方式を示すフラグをピクチャ・パラメータ・セットPPSに設定し(S5202d)、決定された可変長符号化方式に従って当該クリップを符号化する(S5202e)。このフラグは、MPEG4−AVCでは、entropy_coding_mode_flagと呼ばれる。
このように、符号化部5103は、切り替え可能でないと判定された連続区間のクリップに対して可変長符号化の方式を切り替えないで、動画像を符号化することにより符号化データCdata1を生成する。
図14は、図11中のフラグ情報生成ステップ(S5204)および管理情報生成ステップ(S5205)の具体例を示すフローチャートである。
同図において切替え情報生成部5102は、符号化部5103によって符号化されたクリップが、可変長符号化方式を切り替え可能と判定されたクリップであるか否かを判定し(S5204a)、切り替え可能と判定されたクリップである場合には、可変長符号化の方式が固定であることを示すフラグ情報を生成し、当該クリップに対応付けてフラグ情報をメモリのワーク領域に蓄積し(S5204b)、切り替え可能と判定されたクリップでない場合には、可変長符号化の方式が固定でないことを示すフラグ情報を生成し、当該クリップに対応付けてフラグ情報をメモリのワーク領域に蓄積する(S5204b)。さらに、切替え情報生成部5102は、当該クリップが、符号化部5103によって符号化された最後のクリップであるか否かを判定し(S5204d)、最後のクリップでなければ上記S5204a〜S5204cを繰り返し、最後のクリップであればメモリのワーク領域に蓄積されたフラグ情報を切り替え情報SwInfとして管理情報作成部5105に出力する。
さらに、管理情報作成部5105は、プレイリストを含む管理情報を生成し(S5205a)、切り替え情報SwInfを参照して、プレイリストに含まれるプレイアイテムに可変長符号化の方式が固定であることを示すフラグ情報を付加する(S5205b)。なお、フラグ情報は、直前のプレイアイテムにより参照される再生区間と可変長符号化の方式が同一であるかどうかを示すものであってもよい。ここで、プレイリストは、1つ以上のプレイアイテムの再生順を示す。プレイアイテムは、再生すべきクリップを指す情報であり、1つのクリップの全部または一部を再生区間として指す。また、上記フラグ情報は、プレイアイテムに付加されている他のパラメータと兼用してもよい。その場合、例えば、クリップがシームレス接続されることを意味するパラメータ(例えば” connection_condition=5”)を上記フラグ情報と兼用することができる。なぜなら、図12において、切り替えられないと決定される連続区間(可変長符号化の方式が固定である区間)は、(a)トランスポートストリームのパケット識別子によって特定されるクリップ、(b)シームレス接続の対象となる複数のクリップ、(c)マルチアングルを構成する各アングルに対応する複数のクリップであり、このうち(c)はシームレス接続が前提だからである。また、マルチアングル区間であるかどうかは、”is_multi_angle”と呼ばれるフラグによって示すことができるため、本フラグを可変長符号化の方式が固定であることを示すフラグと兼用してもよい。これにより、管理情報のデータ量を削減することができる。
図15は、図11中のクリップ符号化ステップ(S5202)の他の具体例を示すフローチャートである。図15では、VC-1の符号化を行う場合を示している。同図において、符号化部5103は、クリップの符号化開始に先立って当該クリップの可変長符号の方式を、ローモードとそれ以外のモードとの間で切り替え可能か否かを判定する(S5202a)。この判定は、図12での決定に従う。符号化部5103は、切り替え可能と判定された場合には当該クリップのビットプレーン符号化の方式を任意に決定し(S5202f)、切り替え可能でないと判定された場合には当該クリップのビットプレーン符号化方式を直前のクリップと同じ方式に決定する(S5202g)。符号化部5103は、決定されたビットプレーン符号化方式がローモード(RAW MODE)であるかそれ以外の方式であるかを判定する(S5202h)。符号化部5103は、モードを示す情報をピクチャ単位に付加し、ローモード(RAW MODE)であると判定された場合、マクロブロックMB毎の所定の情報を各マクロブロックにおいて符号化し(S5202i)、ローモード(RAW MODE)でないと判定された場合、マクロブロックMB毎の所定の情報をピクチャの先頭にまとめて設定し、当該クリップを符号化する(S5202j)。なお、前記モードを示す情報は、VC-1においてはIMODEと呼ばれるフィールドにより示される。
このように、符号化部5103は、切り替え可能でないと判定された連続区間のクリップに対してビットプレーン符号化の方式を切り替えないで、動画像を符号化することにより符号化データCdata1を生成する。
なお、上記プレイリストは光ディスクにおける使用に限定されるものではなく、ネットワーク経由でストリームを受信する際に、まずプレイリストを受信して解析し、受信するストリームを決定した後に、実際のストリームの受信を開始するような使い方も可能である。また、ストリームをRTP(Real-time Transport Protocol)のパケットやTSパケットなどにパケット化してからIP(Internet Protocol)網で伝送する際にも、再生制御情報として、例えばSDP(Session Description Protocol)などにより、再生区間において可変長符号化の方式が固定であるかどうかを示してもよい。
以下に、本実施の形態に係る画像符号化方法により生成したデータを格納したBD-ROMディスクのデータ構造、および当該ディスクを再生するプレーヤの構成について示す。
(ディスク上の論理データ構造)
図16は、BD−ROMの構成、特にディスク媒体であるBDディスク(104)と、ディスクに記録されているデータ(101、102、103)の構成を示す図である。BDディスク(104)に記録されるデータは、AVデータ(103)と、AVデータに関する管理情報およびAV再生シーケンスなどのBD管理情報(102)と、インタラクティブを実現するBD再生プログラム(101)である。本実施の形態では、説明の都合上、映画のAVコンテンツを再生するためのAVアプリケーションを主眼においてのBDディスクの説明を行うが、他の用途として用いても勿論同様である。
図17は、上述したBDディスクに記録されている論理データのディレクトリ・ファイル構成を示した図である。BDディスクは、他の光ディスク、例えばDVDやCDなどと同様にその内周から外周に向けてらせん状に記録領域を持ち、内周のリード・インと外周のリード・アウトの間に論理データを記録できる論理アドレス空間を有している。また、リード・インの内側にはBCA(Burst Cutting Area)と呼ばれるドライブでしか読み出せない特別な領域がある。この領域はアプリケーションから読み出せないため、例えば著作権保護技術などに利用されることがある。
論理アドレス空間には、ファイルシステム情報(ボリューム)を先頭に映像データなどのアプリケーションデータが記録されている。ファイルシステムとは従来技術で説明した通り、UDFやISO9660などのことであり、通常のPCと同じように記録されている論理データをディレクトリ、ファイル構造を使って読み出しする事が可能になっている。
本実施例の場合、BDディスク上のディレクトリ、ファイル構造は、ルートディレクトリ(ROOT)直下にBDVIDEOディレクトリが置かれている。このディレクトリはBDで扱うAVコンテンツや管理情報などのデータ(図16で説明した101、102、103)が格納されているディレクトリである。
BDVIDEOディレクトリの下には、次の7種類のファイルが記録されている。
BD.INFO(ファイル名固定)
「BD管理情報」の一つであり、BDディスク全体に関する情報を記録したファイルである。BDプレーヤは最初にこのファイルを読み出す。
BD.PROG(ファイル名固定)
「BD再生プログラム」の一つであり、BDディスク全体に関わる再生制御情報を記録したファイルである。
XXX.PL(「XXX」は可変、拡張子「PL」は固定)
「BD管理情報」の一つであり、シナリオ(再生シーケンス)であるプレイリスト情報を記録したファイルである。プレイリスト毎に1つのファイルを持っている。
XXX.PROG(「XXX」は可変、拡張子「PL」は固定)
「BD再生プログラム」の一つであり、前述したプレイリスト毎の再生制御情報を記録したファイルである。プレイリストとの対応はファイルボディ名(「XXX」が一致する)によって識別される。
YYY.VOB(「YYY」は可変、拡張子「VOB」は固定)
「AVデータ」の一つであり、VOB(従来例で説明したVOBと同じ)を記録したファイルである。VOB毎に1つのファイルを持っている。
YYY.VOBI(「YYY」は可変、拡張子「VOBI」は固定)
「BD管理情報」の一つであり、AVデータであるVOBに関わるストリーム管理情報を記録したファイルである。VOBとの対応はファイルボディ名(「YYY」が一致する)によって識別される。
ZZZ.PNG(「ZZZ」は可変、拡張子「PNG」は固定)
「AVデータ」の一つであり、字幕およびメニューを構成するためのイメージデータPNG(W3Cによって標準化された画像フォーマットであり「ピング」と読む)を記録したファイルである。1つのPNGイメージ毎に1つのファイルを持つ。
(プレーヤの構成)
次に、前述したBDディスクを再生するプレーヤの構成について図18および図19を用いて説明する。
図18は、プレーヤの大まかな機能構成を示すブロック図である。
BDディスク(201)上のデータは、光ピックアップ(202)を通して読み出される。読み出されたデータは夫々のデータの種類に応じて専用のメモリに転送される。BD再生プログラム(「BD.PROG」または「XXX.PROG」ファイルの中身)はプログラム記録メモリ(203)に、BD管理情報(「BD.INFO」、「XXX.PL」または「YYY.VOBI」)は管理情報記録メモリ(204)に、AVデータ(「YYY.VOB」または「ZZZ.PNG」)はAV記録メモリ(205)に夫々転送される。
プログラム記録メモリ(203)に記録されたBD再生プログラムはプログラム処理部(206)によって、管理情報記録メモリ(204)に記録されたBD管理情報は管理情報処理部(207)によって、また、AV記録メモリ(205)に記録されたAVデータはプレゼンテーション処理部(208)によって夫々処理される。
プログラム処理部(206)は、管理情報処理部(207)より再生するプレイリストの情報やプログラムの実行タイミングなどのイベント情報を受け取りプログラムの処理を行う。また、プログラムでは再生するプレイリストを動的に変える事が可能であり、この場合は管理情報処理部(207)に対してプレイリストの再生命令を送ることで実現する。プログラム処理部(206)は、ユーザからのイベント、即ちリモコンキーからのリクエストを受け、ユーザイベントに対応するプログラムがある場合は、それを実行する。
管理情報処理部(207)は、プログラム処理部(206)の指示を受け、対応するプレイリストおよびプレイリストに対応したVOBの管理情報を解析し、プレゼンテーション処理部(208)に対象となるAVデータの再生を指示する。また、管理情報処理部(207)は、プレゼンテーション処理部(208)より基準時刻情報を受け取り、時刻情報に基づいてプレゼンテーション処理部(208)にAVデータ再生の停止指示を行い、また、プログラム処理部(206)に対してプログラム実行タイミングを示すイベントを生成する。
プレゼンテーション処理部(208)は、映像、音声、字幕/イメージ(静止画)の夫々に対応するデコーダを持ち、管理情報処理部(207)からの指示に従い、AVデータのデコードおよび出力を行う。映像データ、字幕/イメージの場合は、デコード後に夫々の専用プレーン、ビデオプレーン(210)およびイメージプレーン(209)に描画され、合成処理部(211)によって映像の合成処理が行われTVなどの表示デバイスへ出力される。
このように図18に示すように、BDプレーヤは図16で示したBDディスクに記録されているデータ構成に基づいた機器構成をとっている。
図19は前述したプレーヤ構成を詳細化したブロック図である。図19では、AV記録メモリ(205)はイメージメモリ(308)とトラックバッファ(309)に、プログラム処理部(206)はプログラムプロセッサ(302)とUOPマネージャ(303)に、管理情報処理部(207)はシナリオプロセッサ(305)とプレゼンテーションコントローラ(306)に、プレゼンテーション処理部(208)はクロック(307)、デマルチプレクサ(310)、イメージプロセッサ(311)、ビデオプロセッサ(312)とサウンドプロセッサ(313)に夫々対応/展開している。
BDディスク(201)から読み出されたVOBデータ(MPEGストリーム)はトラックバッファ(309)に、イメージデータ(PNG)はイメージメモリ(308)に夫々記録される。デマルチプレクサ(310)がクロック(307)の時刻に基づき、トラックバッファ(309)に記録されたVOBデータを抜き出し、映像データをビデオプロセッサ(312)に音声データをサウンドプロセッサ(313)に夫々送り込む。ビデオプロセッサ(312)およびサウンドプロセッサ(313)は夫々MPEGシステム規格で定める通りに、デコーダバッファとデコーダから夫々構成されている。即ち、デマルチプレクサ(310)から送りこまれる映像、音声夫々のデータは、夫々のデコーダバッファに一時的に記録され、クロック(307)に従い個々のデコーダでデコード処理される。
イメージメモリ(308)に記録されたPNGは、次の2つの処理方法がある。
イメージデータが字幕用の場合は、プレゼンテーションコントローラ(306)によってデコードタイミングが指示される。クロック(307)からの時刻情報をシナリオプロセッサ(305)が一旦受け、適切な字幕表示が行えるように、字幕表示時刻(開始および終了)になればプレゼンテーションコントローラ(306)に対して字幕の表示、非表示の指示を出す。プレゼンテーションコントローラ(306)からデコード/表示の指示を受けたイメージプロセッサ(311)は対応するPNGデータをイメージメモリ(308)から抜き出し、デコードし、イメージプレーン(314)に描画する。
次に、イメージデータがメニュー用の場合は、プログラムプロセッサ(302)によってデコードタイミングが指示される。プログラムプロセッサ(302)が何時イメージのデコードを指示するかは、プログラムプロセッサ(302)が処理しているBDプログラムに因るものであって一概には決まらない。
イメージデータおよび映像データは、図18で説明したように夫々デコード後にイメージプレーン(314)、ビデオプレーン(315)に出力され、合成処理部(316)によって合成後出力される。
BDディスク(201)から読み出された管理情報(シナリオ、AV管理情報)は、管理情報記録メモリ(304)に格納されるが、シナリオ情報(「BD.INFO」および「XXX.PL」)はシナリオプロセッサ(305)へ読み込み処理される。また、AV管理情報(「YYY.VOBI」)はプレゼンテーションコントローラ(306)によって読み出され処理される。
シナリオプロセッサ(305)は、プレイリストの情報を解析し、プレイリストによって参照されているVOBとその再生位置をプレゼンテーションコントローラ(306)に指示し、プレゼンテーションコントローラ(306)は対象となるVOBの管理情報(「YYY.VOBI」)を解析して、対象となるVOBを読み出すようにドライブコントローラ(317)に指示を出す。
ドライブコントローラ(317)はプレゼンテーションコントローラ(306)の指示に従い、光ピックアップを移動させ、対象となるAVデータの読み出しを行う。読み出されたAVデータは、前述したようにイメージメモリ(308)またはトラックバッファ(309)に読み出される。
また、シナリオプロセッサ(305)は、クロック(307)の時刻を監視し、管理情報で設定されているタイミングでイベントをプログラムプロセッサ(302)に投げる。
プログラム記録メモリ(301)に記録されたBDプログラム(「BD.PROG」または「XXX.PROG」)は、プログラムプロセッサ302によって実行処理される。プログラムプロセッサ(302)がBDプログラムを処理するのは、シナリオプロセッサ(305)からイベントが送られてきた場合か、UOPマネージャ(303)からイベントが送られてきた場合である。UOPマネージャ(303)は、ユーザからリモコンキーによってリクエストが送られてきた場合に、プログラムプロセッサ(302)に対するイベントを生成する。
(アプリケーション空間)
図20は、BDのアプリケーション空間を示す図である。
BDのアプリケーション空間では、プレイリスト(PlayList)が一つの再生単位になっている。プレイリストはセル(Cell)の連結で、連結の順序により決定される再生シーケンスである静的なシナリオと、プログラムによって記述される動的なシナリオを有している。プログラムによる動的なシナリオが無い限り、プレイリストは個々のセルを順に再生するだけであり、また、全てのセルの再生を終了した時点でプレイリストの再生は終了する。一方で、プログラムは、プレイリストを超えての再生記述や、ユーザ選択またはプレーヤの状態によって再生する対象を動的に変えることが可能である。典型的な例としてはメニューがあげられる。BDの場合、メニューとはユーザの選択によって再生するシナリオと定義でき、プログラムによってプレイリストを動的に選択することである。
ここで言うプログラムとは、時間イベントまたはユーザイベントによって実行されるイベントハンドラの事である。
時間イベントは、プレイリスト中に埋め込まれた時刻情報に基づいて生成されるイベントである。図19で説明したシナリオプロセッサ(305)からプログラムプロセッサ(302)に送られるイベントがこれに相当する。時間イベントが発行されると、プログラムプロセッサ(302)はIDによって対応付けられるイベントハンドラを実行処理する。前述した通り、実行されるプログラムが他のプレイリストの再生を指示することが可能であり、この場合には、現在再生されているプレイリストの再生は中止され、指定されたプレイリストの再生へと遷移する。
ユーザイベントは、ユーザのリモコンキー操作によって生成されるイベントである。ユーザイベントは大きく2つのタイプに分けられる。一つ目は、カーソルキー(「上」「下」「左」「右」キー)または「決定」キーの操作によって生成されるメニュー選択のイベントである。メニュー選択のイベントに対応するイベントハンドラはプレイリスト内の限られた期間でのみ有効であり(プレイリストの情報として、個々のイベントハンドラの有効期間が設定されている)、リモコンの「上」「下」「左」「右」キーまたは「決定」キーが押された時に有効なイベントハンドラを検索して、有効なイベントハンドラがある場合は当該イベントハンドラが実行処理される。他の場合は、メニュー選択のイベントは無視されることになる。
二つ目のユーザイベントは、「メニュー」キーの操作によって生成されるメニュー呼び出しのイベントである。メニュー呼び出しのイベントが生成されると、グローバルイベントハンドラが呼ばれる。グローバルイベントハンドラはプレイリストに依存せず、常に有効なイベントハンドラである。この機能を使うことにより、DVDのメニューコール(タイトル再生中に音声、字幕メニューなどを呼び出し、音声または字幕を変更後に中断した地点からのタイトル再生を実行する機能等)を実装することができる。
プレイリストで静的シナリオを構成する単位であるセル(Cell)はVOB(MPEGストリーム)の全部または一部の再生区間を参照したものである。セルはVOB内の再生区間を開始、終了時刻の情報として持っている。個々のVOBと一対になっているVOB管理情報(VOBI)は、その内部にデータの再生時刻に対応した記録アドレスのテーブル情報であるタイムマップ(Time MapまたはTMAP)を有しており、このタイムマップによって前述したVOBの再生、終了時刻をVOB内(即ち対象となるファイル「YYY.VOB」内)での読み出し開始アドレスおよび終了アドレスを導き出すことが可能である。なおタイムマップの詳細は後述する。
(VOBの詳細)
図21は、本実施例で使用するMPEGストリーム(VOB)の構成図である。
図21に示すように、VOBは複数のVOBU(Video Object Unit)によって構成されている。VOBUは、MPEGビデオストリームで言うGOP(Gr
oup Of Pictures)を基準として、音声データも含んだ多重化ストリームとしての一再生単位である。VOBUは1.0秒以下のビデオ再生時間を持ち、通常は0.5秒程度の再生時間を持っている。
VOBU先頭のTSパケット(MPEG−2 Transport Stream Packet)は、シーケンスヘッダとそれに続くGOPヘッダとIピクチャ(Intra−coded)を格納しており、このIピクチャからの復号が開始可能なようになっている。また、このVOBU先頭のIピクチャの先頭を含むTSパケットのアドレス(開始アドレス)と、この開始アドレスからIピクチャの最後を含むTSパケットまでのアドレス(終了アドレス)と、このIピクチャの再生開始時刻(PTS)をタイムマップで管理している。したがって、タイムマップのエントリはVOBU先頭のTSパケットごとに与えられている。
VOBUは、その内部にビデオパケット(V_PKT)とオーディオパケット(A_PKT)を有している。各パケットは188バイトであり、図21に図示してはいないが、各TSパケットの直前には、そのTSパケットの相対的なデコーダ供給開始時刻であるATS(Arrival Time Stamp)が付与されている。
ATSを各TSパケットごとに付与するのは、このTSストリームのシステムレートが固定レートでなく、可変レートであるためである。一般的にシステムレートを固定にする場合にはNULLパケットと呼ばれるダミーのTSパケットを挿入することになるが、限られた記録容量の中に高画質で記録するためには、可変レートが適しており、BDではATS付きのTSストリームとして記録している。
図22は、TSパケットの構成を示した図である。
図22に示すように、TSパケットは、TSパケットヘッダと、適用フィールドと、ペイロード部から構成される。TSパケットヘッダにはPID(Packet Identifier)が格納され、これにより、TSパケットがどのような情報を格納しているのか識別される。適用フィールドにはPCR(Program Clock Reference)が格納される。PCRはストリームをデコードする機器の基準クロック(System Time Clock、STCと呼ぶ)の参照値である。機器は典型的にはPCRのタイミングでシステムストリームをデマルチプレクスし、ビデオストリーム等の各種ストリームを再構築する。ペイロードにはPESパケットが格納される。
PESパケットヘッダには、DTS(Decoding Time Stamp)とPTS(Presentation Time Stamp)が格納される。DTSは当該PESパケットに格納されるピクチャ/オーディオフレームのデコードタイミングを示し、PTSは映像音声出力等のプレゼンテーションタイミングを示す。ビデオデータおよびオーディオデータといったエレメンタリデータは、PESパケットペイロード(PES Packet Payload)と呼ばれるパケット(PES Packet)のデータ格納領域に先頭から順次入れられていく。PESパケットヘッダには、ペイロードに格納してあるデータがどのストリームなのかを識別するためのID(stream_id)も記録されている。
TSストリームの詳細についてはISO/IEC13818−1で規定されており、BDで特徴的なのはATSを各TSパケットごとに付与したことである。
(VOBのインターリーブ記録)
次に図23および図24を用いてVOBファイルのインターリーブ記録について説明する。
図23上段は、前述したプレーヤ構成図の一部である。図の通り、BDディスク上のデータは、光ピックアップを通してVOB即ちMPEGストリームであればトラックバッファへ入力され、PNG即ちイメージデータであればイメージメモリへと入力される。
トラックバッファはFIFOであり、入力されたVOBのデータは入力された順にデマルチプレクサへと送られる。この時、前述したATSに従って個々のTSパケットはトラックバッファから引き抜かれデマルチプレクサを介してビデオプロセッサまたはサウンドプロセッサへとデータが送り届けられる。一方で、イメージデータの場合は、どのイメージを描画するかはプレゼンテーションコントローラによって指示される。また、描画に使ったイメージデータは、字幕用イメージデータの場合は同時にイメージメモリから削除されるが、メニュー用のイメージデータの場合は、そのメニュー描画中はイメージメモリ内にそのまま残される。これはメニューの描画はユーザ操作に依存しており、ユーザの操作に追従してメニューの一部分を再表示もしくは異なるイメージに置き換えることがあり、その際に再表示される部分のイメージデータをデコードし易くするためである。
図23下段は、BDディスク上でのVOBファイルおよびPNGファイルのインターリーブ記録を示す図である。一般的にROM、例えばCD−ROMやDVD−ROMの場合、一連の連続再生単位となるAVデータは連続記録されている。これは、連続記録されている限り、ドライブは順次データを読み出し、デコーダに送り届けるだけで良いが、連続データが分断されてディスク上に離散配置されている場合は、個々の連続区間の間でシーク操作が入ることになり、この間データの読み出しが止まることになり、データの供給が止まる可能性があるからである。BDの場合も同様に、VOBファイルは連続領域に記録することができる方が望ましいが、例えば字幕データのようにVOBに記録されている映像データと同期して再生されるデータがあり、VOBファイルと同様に字幕データも何らかの方法によってBDディスクから読み出す事が必要になる。
字幕データの読み出し方法の一手段として、VOBの再生開始前に一まとめで字幕用のイメージデータ(PNGファイル)を読み出してしまう方法がある。しかしながら、この場合には大量のメモリが必要となり、非現実的である。
そこで、VOBファイルを幾つかのブロックに分けて、イメージデータとインターリーブ記録する方式を使用している。図23下段はそのインターリーブ記録を説明した図である。
VOBファイルとイメージデータを適切にインターリーブ配置することで、前述したような大量の一時記録メモリ無しに、必要なタイミングでイメージデータをイメージメモリに格納することが可能になる。しかしながらイメージデータを読み出している際には、VOBデータの読み込みは当然のことながら停止することになる。
図24は、この問題を解決するトラックバッファを使ったVOBデータ連続供給モデルを説明する図である。
既に説明したように、VOBのデータは、一旦トラックバッファに蓄積される。トラックバッファへのデータ入力レート(Va)とトラックバッファからのデータ出力レート(Vb)の間に差(Va>Vb)を設けると、BDディスクからデータを読み出し続けている限り、トラックバッファのデータ蓄積量は増加をしていくことになる。
図24の上段に記すようにVOBの一連続記録領域が論理アドレスの”a1”から”a2”まで続くとする。”a2”から”a3”の間は、イメージデータが記録されていて、VOBデータの読み出しが行えない区間であるとする。
図24の下段は、トラックバッファの内部を示す図である。横軸が時間、縦軸がトラックバッファ内部に蓄積されているデータ量を示している。時刻”t1” がVOBの一連続記録領域の開始点である”a1”の読み出しを開始した時刻を示している。この時刻以降、トラックバッファにはレートVa−Vbでデータが蓄積されていくことになる。このレートは言うまでもなくトラックバッファの入出力レートの差である。時刻”t2”は一連続記録領域の終了点である”a2” のデータを読み込む時刻である。即ち時刻”t1”から”t2”の間レートVa−Vbでトラックバッファ内はデータ量が増加していき、時刻”t2”でのデータ蓄積量B(t2)は下式によって求めることができる。
B(t2) = (Va−Vb)×(t2−t1) (式1)
この後、BDディスク上のアドレス”a3”まではイメージデータが続くため、トラックバッファへの入力は0となり、出力レートである”−Vb”でトラックバッファ内のデータ量は減少していくことになる。これは読み出し位置”a3”まで、時刻でいう”t3”までになる。
ここで大事なことは、時刻”t3”より前にトラックバッファに蓄積されているデータ量が0になると、デコーダへ供給するVOBのデータが無くなってしまい、VOBの再生がストップしてしまう可能性がある。しかしながら、時刻”t3”でトラックバッファにデータが残っている場合には、VOBの再生がストップすることなく連続できることを意味している。
この条件は下式によって示すことができる。
B(t2) ≧ −Vb×(t3−t2) (式2)
即ち、式2を満たすようにイメージデータ(非VOBデータ)の配置を決めればよい事になる。
(ナビゲーションデータ構造)
図25から図31を用いて、BDのナビゲーションデータ(BD管理情報)構造について説明をする。
図25は、VOB管理情報ファイル(”YYY.VOBI”)の内部構造を示した図である。
VOB管理情報は、当該VOBのストリーム属性情報(Attribute)とタイムマップを有している。ストリーム属性は、ビデオ属性(Video)、オーディオ属性(Audio#0〜Audio#m)個々に持つ構成となっている。特にオーディオストリームの場合は、VOBが複数本のオーディオストリームを同時に持つことができることから、オーディオストリーム数(Number)によって、データフィールドの有無を示している。
下記はビデオ属性(Video)の持つフィールドと夫々が持ち得る値である。
圧縮方式(Coding):
MPEG1
MPEG2
MPEG4
MPEG4−AVC(Advanced Video Coding)

解像度(Resolution):
1920x1080
1440x1080
1280x720
720x480
720x565

アスペクト比(Aspect):
4:3
16:9

フレームレート(Framerate):
60
59.94(60/1.001)
50
30
29.97(30/1.001)
25
24
23.976(24/1.001)

下記はオーディオ属性(Audio)の持つフィールドと夫々が持ち得る値である。
圧縮方式(Coding):
AC3
MPEG1
MPEG2
LPCM

チャンネル数(Ch):
1〜8

言語属性(Language):
タイムマップ(TMAP)はVOBU毎の情報を持つテーブルであって、当該VOBが有するVOBU数(Number)と各VOBU情報(VOBU#1〜VOBU#n)を持つ。個々のVOBU情報は、VOBU先頭TSパケット(Iピクチャ開始)のアドレスI_startと、そのIピクチャの終了アドレスまでのオフセットアドレス(I_end)、およびそのIピクチャの再生開始時刻(PTS)から構成される。
なお、I_endの値はオフセット値、すなわちIピクチャのサイズを持たせるのではなく、実際のIピクチャの終了アドレスを持たせてもよい。
図26はVOBU情報の詳細を説明する図である。
広く知られているように、MPEGビデオストリームは高画質記録するために可変ビットレート圧縮されることがあり、その再生時間とデータサイズ間に単純な相関はない。逆に、音声の圧縮規格であるAC3は固定ビットレートでの圧縮を行っているため、時間とアドレスとの関係は1次式によって求めることができる。しかしながらMPEGビデオデータの場合は、個々のフレームは固定の表示時間、例えばNTSCの場合は1フレームは1/29.97秒の表示時間を持つが、個々のフレームの圧縮後のデータサイズは絵の特性や圧縮に使ったピクチャタイプ、いわゆるI/P/Bピクチャによってデータサイズは大きく変わってくる。従って、MPEGビデオの場合は、時間とアドレスの関係は一次式の形で表現することは不可能である。
当然の事として、MPEGビデオデータを多重化しているMPEGシステムストリーム、即ちVOBも時間とデータサイズとを一次式の形で表現することは不可能である。このため、VOB内での時間とアドレスとの関係を結びつけるのがタイムマップ(TMAP)である。
このようにして、ある時刻情報が与えられた場合、先ずは当該時刻がどのVOBUに属するのかを検索(VOBU毎のPTSを追っていく)して、当該時刻の直前のPTSをTMAPに持つVOBUに飛びこみ(I_startで指定されたアドレス)、VOBU先頭のIピクチャから復号を開始し、当該時刻のピクチャから表示を開始する。
次に図27を使って、プレイリスト情報(”XXX.PL”)の内部構造を説明する。
プレイリスト情報は、セルリスト(CellList)とイベントリスト(EventList)から構成されている。
セルリスト(CellList)は、プレイリスト内の再生セルシーケンスであり、本リストの記述順でセルが再生される事になる。セルリスト(CellList)の中身は、セルの数(Number)と各セル情報(Cell#1〜Cell#n)である。
セル情報(Cell#)は、VOBファイル名(VOBName)、当該VOB内での開始時刻(In)および終了時刻(Out)と、字幕テーブル(SubtitleTable)を持っている。開始時刻(In)および終了時刻(Out)は、夫々当該VOB内でのフレーム番号で表現され、前述したタイムマップを使うことによって再生に必要なVOBデータのアドレスを得る事ができる。
字幕テーブル(SubtitleTable)は、当該VOBと同期再生される字幕情報を持つテーブルである。字幕は音声同様に複数の言語を持つことができ、字幕テーブル(SubtitleTable)最初の情報も言語数(Number)とそれに続く個々の言語ごとのテーブル(Language#1〜Language#k)から構成されている。
各言語のテーブル(Language#)は、言語情報(Lang)と、個々に表示される字幕の字幕情報数(Number)と、個々に表示される字幕の字幕情報(Speech#1〜Speech#j)から構成され、字幕情報(Speech#)は対応するイメージデータファイル名(Name)、字幕表示開始時刻(In)および字幕表示終了時刻(Out)と、字幕の表示位置(Position)から構成されている。
イベントリスト(EventList)は、当該プレイリスト内で発生するイベントを定義したテーブルである。イベントリストは、イベント数(Number)に続いて個々のイベント(Event#1〜Event#m)から構成され、個々のイベント(Event#)は、イベントの種類(Type)、イベントのID(ID)、イベント発生時刻(Time)と有効期間(Duration)から構成されている。
図28は、個々のプレイリスト毎のイベントハンドラ(時間イベントと、メニュー選択用のユーザイベント)を持つイベントハンドラテーブル(”XXX.PROG”)である。
イベントハンドラテーブルは、定義されているイベントハンドラ/プログラム数(Number)と個々のイベントハンドラ/プログラム(Program#1〜Program#n)を有している。各イベントハンドラ/プログラム(Program#)内の記述は、イベントハンドラ開始の定義(<event_handler>タグ)と前述したイベントのIDと対になるイベントハンドラのID(ID)を持ち、その後に当該プログラムもFunctionに続く括弧”{”と”}”の間に記述する。前述の”XXX.PL”のイベントリスト(EventList)に格納されたイベント(Event#1〜Event#m)は”XXX.PROG”のイベントハンドラのID(ID)を用いて特定される。
次に図29を用いてBDディスク全体に関する情報(”BD.INFO”)の内部構造を説明する。
BDディスク全体情報は、タイトルリスト(TitleList)とグローバルイベント用のイベントテーブル(EventList)から構成されている。
タイトルリスト(TitleList)は、ディスク内のタイトル数(Number)と、これに続く各タイトル情報(Title#1〜Title#n)から構成されている。個々のタイトル情報(Title#)は、タイトルに含まれるプレイリストのテーブル(PLTable)とタイトル内のチャプタリスト(ChapterList)を含んでいる。プレイリストのテーブル(PLTable)はタイトル内のプレイリストの数(Number)と、プレイリスト名(Name)即ちプレイリストのファイル名を有している。
チャプタリスト(ChapterList)は、当該タイトルに含まれるチャプタ数(Number)と個々のチャプタ情報(Chapter#1〜Chapter#n)から構成され、個々のチャプタ情報(Chapter#)は当該チャプタが含むセルのテーブル(CellTable)を持ち、セルのテーブル(CellTable)はセル数(Number)と個々のセルのエントリ情報(CellEntry#1〜CellEntry#k)から構成されている。セルのエントリ情報(CellEntry#)は当該セルを含むプレイリスト名と、プレイリスト内でのセル番号によって記述されている。
イベントリスト(EventList)は、グローバルイベントの数(Number)と個々のグローバルイベントの情報を持っている。ここで注意すべきは、最初に定義されるグローバルイベントは、ファーストイベント(FirstEvent)と呼ばれ、BDディスクがプレーヤに挿入された時、最初に呼ばれるイベントである。グローバルイベント用イベント情報はイベントタイプ(Type)とイベントのID(ID)だけを持っている。
図30は、グローバルイベントハンドラのプログラムのテーブル(”BD.PROG”)である。
本テーブルは、図28で説明したイベントハンドラテーブルと同一内容である。
(イベント発生のメカニズム)
図31から図33を使ってイベント発生のメカニズムについて説明する。
図31はタイムイベントの例である。
前述したとおり、タイムイベントはプレイリスト情報(”XXX.PL”)のイベントリスト(EventList)で定義される。タイムイベントとして定義されているイベント、即ちイベントタイプ(Type)が”TimeEvent”の場合、イベント生成時刻(”t1”)になった時点で、ID”Ex1”を持つタイムイベントがシナリオプロセッサからプログラムプロセッサに対してあげられる。プログラムプロセッサは、イベントID”Ex1”を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施例の場合では、2つのボタンイメージの描画を行うなどを行うことができる。
図32はメニュー操作を行うユーザイベントの例である。
前述したとおり、メニュー操作を行うユーザイベントもプレイリスト情報(”XXX.PL”)のイベントリスト(EventList)で定義される。ユーザイベントとして定義されるイベント、即ちイベントタイプ(Type)が”UserEvent”の場合、イベント生成時刻(”t1”)になった時点で、当該ユーザイベントがレディとなる。この時、イベント自身は未だ生成されてはいない。当該イベントは、有効期間情報(Duration)で記される期間レディ状態にある。
図32に描くように、ユーザがリモコンキーの「上」「下」「左」「右」キーまたは「決定」キーを押した場合、先ずUOPイベントがUOPマネージャによって生成されプログラムプロセッサに上げられる。プログラムプロセッサは、シナリオプロセッサに対してUOPイベントを流し、シナリオプロセッサはUOPイベントを受け取った時刻に有効なユーザイベントが存在するかを検索し、対象となるユーザイベントがあった場合は、ユーザイベントを生成し、プログラムプロセッサに持ち上げる。プログラムプロセッサでは、イベントID”Ev1”を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施例の場合では、プレイリスト#2の再生を開始する。
生成されるユーザイベントには、どのリモコンキーがユーザによって押されたかの情報は含まれていない。選択されたリモコンキーの情報は、UOPイベントによってプログラムプロセッサに伝えられ、仮想プレーヤが持つレジスタSPRM(8)に記録保持される。イベントハンドラのプログラムは、このレジスタの値を調べ分岐処理を実行することが可能である。
図33はグローバルイベントの例である。
前述したとおり、グローバルイベントはBDディスク全体に関する情報(”BD.INFO”)のイベントリスト(EventList)で定義される。グローバルイベントとして定義されるイベント、即ちイベントタイプ(Type)が”GlobalEvent”の場合、ユーザのリモコンキー操作があった場合にのみイベントが生成される。
ユーザが”メニュー”を押した場合、先ずUOPイベントがUOPマネージャによって生成されプログラムプロセッサに上げられる。プログラムプロセッサは、シナリオプロセッサに対してUOPイベントを流し、シナリオプロセッサは、該当するグローバルイベントを生成し、プログラムプロセッサに送る。プログラムプロセッサでは、イベントID”menu”を持つイベントハンドラを探し、対象のイベントハンドラを実行処理する。例えば、本実施例の場合ではプレイリスト#3の再生を開始している。
本実施例では、単に”メニュー”キーと呼んでいるが、DVDのように複数のメニューキーがあってもよい。各メニューキーに対応するIDを夫々定義することで対応することが可能である。
(仮想プレーヤマシン)
図34を用いてプログラムプロセッサの機能構成を説明する。
プログラムプロセッサは、内部に仮想プレーヤマシンを持つ処理モジュールである。仮想プレーヤマシンはBDとして定義された機能モデルであって、各BDプレーヤの実装には依存しないものである。即ち、どのBDプレーヤにおいても同様の機能を実行するできることを保証している。
仮想プレーヤマシンは大きく2つの機能を持っている。プログラミング関数とプレーヤ変数(レジスタ)である。プログラミング関数は、Java(登録商標)Scriptをベースとして、以下に記す2つの機能をBD固有関数として定義している。
リンク関数:現在の再生を停止し、指定するプレイリスト、セル、時刻からの再生を開始する
Link(PL#,Cell#,time)
PL# : プレイリスト名
Cell# : セル番号
time : セル内での再生開始時刻

PNG描画関数:指定PNGデータをイメージプレーンに描画する
Draw(File,X,Y)
File : PNGファイル名
X : X座標位置
Y : Y座標位置

イメージプレーンクリア関数:イメージプレーンの指定領域をクリアする
Clear(X,Y,W,H)
X : X座標位置
Y : Y座標位置
W : X方向幅
H : Y方向幅
プレーヤ変数は、プレーヤの状態を示すシステムパラメータ(SPRM)と一般用途として使用可能なゼネラルパラメータ(GPRM)とがある。
図35はシステムパラメータ(SPRM)の一覧である。
SPRM(0) : 言語コード
SPRM(1) : 音声ストリーム番号
SPRM(2) : 字幕ストリーム番号
SPRM(3) : アングル番号
SPRM(4) : タイトル番号
SPRM(5) : チャプタ番号
SPRM(6) : プログラム番号
SPRM(7) : セル番号
SPRM(8) : 選択キー情報
SPRM(9) : ナビゲーションタイマー
SPRM(10) : 再生時刻情報
SPRM(11) : カラオケ用ミキシングモード
SPRM(12) : パレンタル用国情報
SPRM(13) : パレンタルレベル
SPRM(14) : プレーヤ設定値(ビデオ)
SPRM(15) : プレーヤ設定値(オーディオ)
SPRM(16) : 音声ストリーム用言語コード
SPRM(17) : 音声ストリーム用言語コード(拡張)
SPRM(18) : 字幕ストリーム用言語コード
SPRM(19) : 字幕ストリーム用言語コード(拡張)
SPRM(20) : プレーヤリージョンコード
SPRM(21) : 予備
SPRM(22) : 予備
SPRM(23) : 再生状態
SPRM(24) : 予備
SPRM(25) : 予備
SPRM(26) : 予備
SPRM(27) : 予備
SPRM(28) : 予備
SPRM(29) : 予備
SPRM(30) : 予備
SPRM(31) : 予備
なお、本実施例では、仮想プレーヤのプログラミング関数をJava(登録商標)Scriptベースとしたが、Java(登録商標)Scriptではなく、UNIX(登録商標) OSなどで使われているB−Shellや、Perl Scriptなど他のプログラミング関数であっても構わなく、言い換えれば、本発明はJava(登録商標)Scriptに限定されるものでは無い。
(プログラムの例)
図36および図37は、イベントハンドラでのプログラムの例である。
図36は、2つの選択ボタンを持ったメニューの例である。
セル(PlayList#1.Cell#1)先頭でタイムイベントを使って図36左側のプログラムが実行される。ここでは、最初にゼネラルパラメータの一つGPRM(0)に”1”がセットされている。GPRM(0)は、当該プログラムの中で、選択されているボタンを識別するのに使っている。最初の状態では、左側に配置するボタン1が選択されている事を初期値として持たされている。
次に、PNGの描画を描画関数であるDrawを使ってボタン1、ボタン2夫々について行っている。ボタン1は、座標(10、200)を起点(左端)としてPNGイメージ”1black.png”を描画している。ボタン2は、座標(330,200)を起点(左端)としてPNGイメージ”2white.png”を描画している。
また、本セル最後ではタイムイベントを使って図36右側のプログラムが実行される。ここでは、Link関数を使って当該セルの先頭から再度再生するように指定している。
図37は、メニュー選択のユーザイベントのイベントハンドラの例である。
「左」キー、「右」キー、「決定」キー何れかのリモコンキーが押された場合夫々に対応するプログラムがイベントハンドラに書かれている。ユーザがリモコンキーを押した場合、図32で説明したとおり、ユーザイベントが生成され、図37のイベントハンドラが起動されることになる。本イベントハンドラでは、選択ボタンを識別しているGPRM(0)の値と、選択されたリモコンキーを識別するSPRM(8)を使って分岐処理を行っている。
条件1)ボタン1が選択されている、かつ、選択キーが「右」キーの場合
GPRM(0)を2に再設定して、選択状態にあるボタンを右ボタン2に変更する。
ボタン1、ボタン2のイメージを夫々書き換える。
条件2)選択キーが「決定(OK)」の場合で、ボタン1が選択されている場合
プレイリスト#2の再生を開始する
条件3)選択キーが「決定(OK)」の場合で、ボタン2が選択されている場合
プレイリスト#3の再生を開始する
上記のようにして実行処理が行われる。
(プレーヤ処理フロー)
次に図38から図41を用いてプレーヤでの処理フローを説明する。
図38は、AV再生までの基本処理フローである。
BDディスクを挿入すると(S101)、BDプレーヤはBD.INFOファイルの読み込みと解析(S102)、BD.PROGの読み込み(S103)を実行する。BD.INFOおよびBD.PROGは共に管理情報記録メモリに一旦格納され、シナリオプロセッサによって解析される。
続いて、シナリオプロセッサは、BD.INFOファイル内のファーストイベント(FirstEvent)情報に従い、最初のイベントを生成する(S104)。生成されたファーストイベントは、プログラムプロセッサで受け取られ、当該イベントに対応するイベントハンドラを実行処理する(S105)。
ファーストイベントに対応するイベントハンドラには、最初に再生するべきプレイリスト情報が記録されていることが期待される。仮に、プレイリスト再生が指示されていない場合には、プレーヤは何も再生することなく、ユーザイベントを受け付けるのを待ち続けるだけになる。(S201)。BDプレーヤはユーザからのリモコン操作を受け付けると、UOPマネージャはプログラムマネージャに対してUOPイベントを立ち上げる(S202)。
プログラムマネージャは、UOPイベントがメニューキーかを判別し(S203)、メニューキーの場合は、シナリオプロセッサにUOPイベントを流し、シナリオプロセッサがユーザイベントを生成する(S204)。プログラムプロセッサは生成されたユーザイベントに対応するイベントハンドラを実行処理する(S205)。
図39は、PL再生開始からVOB再生開始までの処理フローである。
前述したように、ファーストイベントハンドラまたはグローバルイベントハンドラによってプレイリスト再生が開始される(S301)。シナリオプロセッサは、再生対象のプレイリスト再生に必要な情報として、プレイリスト情報”XXX.PL”の読み込みと解析(S302)、プレイリストに対応するプログラム情報”XXX.PROG”の読み込みを行う(S303)。続いてシナリオプロセッサは、プレイリストに登録されているセル情報に基づいてセルの再生を指示する(S304)。セル再生は、シナリオプロセッサからプレゼンテーションコントローラに対して要求が出さる事を意味し、プレゼンテーションコントローラはAV再生を開始する(S305)。
AV再生の開始(S401)を開始すると、プレゼンテーションコントローラは再生するセルに対応するVOBの情報ファイル(XXX.VOBI)を読み込みおよび解析をする(S402)。プレゼンテーションコントローラは、タイムマップを使って再生開始するVOBUとそのアドレスを特定し、ドライブコントローラに読み出しアドレスを指示し、ドライブコントローラは対象となるVOBデータを読み出し(S403)、VOBデータがデコーダに送られ再生が開始される(S404)。
VOB再生は、当該VOBの再生区間が終了するまで続けられ(S405)、終了すると次のセル再生(S304)へ移行する。次にセルが無い場合は、再生が停止する(S406)。
図40は、AV再生開始後からのイベント処理フローである。
BDプレーヤはイベントドリブン型のプレーヤモデルである。プレイリストの再生を開始すると、タイムイベント系、ユーザイベント系、字幕表示系のイベント処理プロセスが夫々起動され、平行してイベント処理を実行するようになる。
S500系の処理は、タイムイベント系の処理フローである。
プレイリスト再生開始後(S501)、プレイリスト再生が終了しているかを確認するステップ(S502)を経て、シナリオプロセッサは、タイムイベント発生時刻になったかを確認する(S503)。タイムイベント発生時刻になっている場合には、シナリオプロセッサはタイムイベントを生成し(S504)、プログラムプロセッサがタイムイベントを受け取りイベントハンドラを実行処理する(S505)。
ステップS503でタイムイベント発生時刻になっていない場合、または、ステップS504でイベントハンドラ実行処理後は再度ステップS502へ戻り、上述した処理を繰り返す。また、ステップS502でプレイリスト再生が終了したことが確認されると、タイムイベント系の処理は強制的に終了する。
S600系の処理は、ユーザイベント系の処理フローである。
プレイリスト再生開始後(S601)、プレイリスト再生終了確認ステップ(S602)を経て、UOP受付確認ステップの処理に移る(S603)。UOPの受付があった場合、UOPマネージャはUOPイベントを生成し(S604)、UOPイベントを受け取ったプログラムプロセッサはUOPイベントがメニューコールであるかを確認し(S605)、メニューコールであった場合は、プログラムプロセッサはシナリオプロセッサにイベントを生成させ(S607)、プログラムプロセッサはイベントハンドラを実行処理する(S608)。
ステップS605でUOPイベントがメニューコールで無いと判断された場合、UOPイベントはカーソルキーまたは「決定」キーによるイベントである事を示している。この
場合、現在時刻がユーザイベント有効期間内であるかをシナリオプロセッサが判断し(S606)、有効期間内である場合には、シナリオプロセッサがユーザイベントを生成し(S607)、プログラムプロセッサが対象のイベントハンドラを実行処理する(S608)。
ステップS603でUOP受付が無い場合、ステップS606で現在時刻がユーザイベント有効期間に無い場合、または、ステップS608でイベントハンドラ実行処理後は再度ステップS602へ戻り、上述した処理を繰り返す。また、ステップS602でプレイリスト再生が終了したことが確認されると、ユーザイベント系の処理は強制的に終了する。
図41は字幕処理のフローである。
プレイリスト再生開始後(S701)、プレイリスト再生終了確認ステップ(S702)を経て、字幕描画開始時刻確認ステップに移る(S703)。字幕描画開始時刻の場合、シナリオプロセッサはプレゼンテーションコントローラに字幕描画を指示し、プレゼンテーションコントローラはイメージプロセッサに字幕描画を指示する(S704)。ステップS703で字幕描画開始時刻で無いと判断された場合、字幕表示終了時刻であるかを確認する(S705)。字幕表示終了時刻であると判断された場合は、プレゼンテーションコントローラがイメージプロセッサに字幕消去指示を行い、描画されている字幕をイメージプレーンから消去する(S706)。
字幕描画ステップS704終了後、字幕消去ステップS706終了後、または、字幕表示終了時刻確認ステップS705で当該時刻でないことが判断された場合、ステップS702に戻り、上述した処理を繰り返す。また、ステップS702でプレイリスト再生が終了したことが確認されると、字幕表示系の処理は強制的に終了する。
(実施の形態2)
次に本発明の第2の実施の形態について説明する。
第2の実施の形態は、上記のアプリケーションを応用して、静止画によるスライドショーを実現するための説明である。基本的には実施例1に基づく内容であり、拡張または異なる部分を中心に説明する。
(Iピクチャの参照)
図42はスライドショー(静止画アプリケーション)とタイムマップの関係を示している。通常スライドショーは静止画(Iピクチャ)のみから構成されている。タイムマップは静止画データの位置とサイズ情報を持っており、ある静止画が選ばれた場合、必要なデータを取り出してデコーダに送ることにより、1枚の静止画を表示する。通常スライドショーは動画のように順番に表示されるとは限らず、ユーザのインタラクションのより、表示順序が決まっていないため、どこからでも表示できることを保証するために、単独でデコード可能なイントラ符号化されたIピクチャを利用している。
しかし、データ量を抑えるために、Iピクチャを参照して圧縮するPピクチャや2枚以上の前後のピクチャを参照して圧縮するBピクチャであってもスライドショーを実現することは可能である。
ところが、PピクチャやBピクチャは参照しているピクチャがないとデコードすることができない。そのため、ユーザのインタラクションにより、途中にあるPピクチャやBピクチャから再生を開始しようとしてもデコードできない。そこで、図43に示すように、
タイムマップが指しているピクチャがIピクチャであること、他のどの画像も参照していないことを示すフラグを用意する。このフラグを参照することにより、参照画像が必要ない場合、すなわち独立してデコード可能な場合には、前後の表示に関係なくその画像からデコードおよび表示することは可能だが、参照画像が必要な場合には、関連する画像がそれまでにデコードされていなければ表示できないため、表示順序によっては画像が表示できないことを示している。
なお、タイムマップ全体として、タイムマップから参照されるピクチャが必ずIピクチャであること、つまりどのピクチャも独立してデコードすることが可能であることを示すフラグを、図44のようにタイムマップあるいは関連するナビゲーション情報内の一箇所に記録されていてもよい。このフラグが立っていない場合には、タイムマップのエントリが必ずIピクチャを指しているとは限らないため、参照されているピクチャをデコードできるかどうかは保証されないことになる。
なお、これまでの説明ではMPEG2ビデオストリームをもとにIピクチャとして説明していたが、MPEG4−AVC(H.264やJVTとも呼ばれる)の場合では、IDR(Instantaneous Decoder refresh)ピクチャ、あるいはIDRピクチャ以外のIピクチャであってもよく、また、その他の形式の画像の場合でも単独でデコード可能な画像であれば、容易に応用可能である。
(すべてのIピクチャの参照の保証)
図45は動画アプリケーションと静止画アプリケーション(スライドショー)の違いを示している。図45(a)が示すように、動画アプリケーションの場合は一度再生を開始すれば、以降のピクチャを連続的にデコードするため、すべてのIピクチャにタイムマップから参照を設定しておく必要はなく、最低限再生開始したい点にのみタイムマップのエントリが設定されていればよい。
図45(b)はスライドショーの例である。スライドショーの場合は、ユーザの操作により前後の映像を表示せず、スキップ操作などのより順序に関係なく静止画を表示する必要がある。そのため、すべてのIピクチャに対してタイムマップのエントリを登録しておかなければ、実際にストリームをすべて解析しなければ表示すべきIピクチャのデータをデコーダに流すことができないため、効率が悪い。各Iピクチャにタイムマップのエントリがあれば、必要なIピクチャのデータのみを直接アクセスしてデータを読み込み、デコーダに流すことができるため、アクセス効率がよく、表示までの時間も短くてすむため効率がよい。
すべてのIピクチャに対してエントリが存在することが識別できれば、どのIピクチャにアクセスする際にでもタイムマップのエントリを参照することにより、読み出すデータの範囲が分かるため、前後のストリームを余分に解析する必要がなくなる。
すべてのIピクチャに対してエントリが存在することが保証されていない場合、タイムマップに登録されていないIピクチャの表示を指定された場合、その前後のストリームを解析しながら必要なデータを抜き出さなければならず、アクセス効率が悪く、表示するまでに時間がかかるため効率が悪い。
そこで、図46に示すように、すべてのIピクチャがタイムマップから参照されていることが保証されているか否かを示すフラグを用意することにより、前後のストリームを解析しなければいけないか、あるいは必要ないか、静的データを解析するだけで識別できるようになるため、このようなフラグは有効である。
なお、このフラグはスライドショーのような静止画アプリケーションだけではなく、動画アプリケーションにおいても有効であり、どのIピクチャからでも再生を開始できることが保証されるフラグとなる。
(実施の形態3)
実施の形態2において、静止画アプリケーションを実現するための符号化方式としてMPEG‐4 AVCを使用できることを述べた。MPEG−4 AVCの静止画は、MPEG−4AVC規格自体ではなく、MPEG−2システムのMPEG−4 AVC向け拡張規格(ISO/IEC 13818−1 Amendment 3)においてAVC Still Pictureとして規定されている。しかしながら、MPEG−2システム規格では静止画の再生方法について規定しておらず、静止画アプリケーションにおいて使用するためには再生方法を別途規定する必要がある。本実施の形態では、MPEG−4 AVCを静止画アプリケーションに適用するための静止画のデータ構造、および表示方法について説明する。
MPEG−2システム規格におけるAVC Still Pictureは、IDRピクチャ、および当該IDRピクチャから参照されるSPS(Sequence Parameter Set)、および(Picture Parameter Set)を含むと規定されている。図47は、本実施の形態におけるMPEG−4 AVCの静止画(以降、AVC静止画と呼ぶ)のデータ構造を示す。図中のボックスは、それぞれNALユニット(Network Abstraction Unit)を示す。AVC静止画では、End of SequenceのNALユニットを必ず含めることにする。End of Sequenceは、MPEG−4 AVCにおけるシーケンスの終端を示す識別情報であるため、End of SequenceのNALユニットを配置してシーケンスを終了させることにより、AVC静止画の表示方法についてはMPEG−4 AVC規格外で独自に定義することができる。ここで、各NALユニットの出現順序についてはMPEG−4 AVC規格において定められた規定に従うものとする。
次に、図48を参照してAVC静止画の表示方法について説明する。静止画アプリケーションにおいては、静止画の表示時刻、および静止画の表示時間長を規定する必要がある。AVC静止画の表示時刻(PTS:Presentation Time Stamp)は、タイムマップ、あるいはPES(Packetized Elemantary Stream)パケットのヘッダから取得する。ここで、タイムマップにより全ての静止画の表示時刻が示される際には、タイムマップのみを参照して表示時刻を取得することができる。N番目のAVC静止画の表示時刻から、N+1番目のAVC静止画の表示時刻までの間は、N番目のAVC静止画の表示をフリーズする、すなわち、N番目のAVC静止画を繰り返し表示することにする。
AVC静止画を再生する際には、AVC静止画のデータからフレームレートを取得できることが望ましい。MPEG−4 AVCにおいては、動画ストリームの表示レートを、SPS内のVUI(Video Usability Information)により示すことができる。具体的には、num_units_in_tick、time_scale、fixed_frame_rate_flagの3つのフィールドを参照する。ここで、time_scaleはタイムスケールを示し、例えば、30000Hzで動作するクロックのtime_scaleは30000とできる。num_units_in_tickは、クロックが動作する時間を示す基本単位であり、例えば、time_scaleが30000であるクロックのnum_units_in_tickが1001であれば、クロックが動作する際の基本周期が29.97Hzであることを示せる。また、fixed_frame_rate_flagをセットすることにより、フレームレートが固定であると示すことができる。MPEG−4 AVCにおいては、これらのフィールドを用いて、連続する2枚のピクチャの表示時刻の差分値を示すことができるが、本実施の形態では、これらのフィールドを用いて、AVC静止画を繰り返し表示する際のフレームレートを示すことにする。まず、fixed_frame_rate_flagを1にセットすることにより、フレームレートが固定であることを示す。次に、フレームレートを23.976Hzに設定する際には、例えばnum_units_in_tickを1001に、time_scaleを24000に、それぞれセットする。つまり、フレームレート=time_scale/num_units_in_tick となるように両フィールドを設定する。さらに、VUI、およびVUIにおける上記3つのフィールドが存在することを保証するために、SPS内のvui_parameters_present_flag、およびVUI内のtiming_info_present_flagを共に1にセットする。N番目のAVC静止画が、最終のAVC静止画である際には、ユーザ動作があるまで、あるいは、プログラムにより予め定められた次の動作等が開始するまで表示をフリーズさせることとする。なお、フレームレートの設定方法は、time_scale/num_units_in_tickに制限されるものではない。例えば、MPEG−4 AVCの動画ストリームにおいては、time_scale/num_units_in_tickはフィールドのレート(フィールドの表示間隔を示すパラメータ)を示すため、フレームレートはtime_scale/num_units_in_tick/2となる。従って、静止画においてもフレームレートをtime_scale/num_units_in_tic/2としてもよい。
上記の方法により示されるフレームレートは、BD管理情報内で示されるフレームレート値と一致するものとする。具体的には、StreamCodingInfoにおけるframe_rateフィールドにより示される値と一致する。
なお、AVC静止画を繰り返し表示する際の表示周期は、上記の方法により示されるフレームレートから取得できる。この表示周期を、フレームグリッド、あるいはフィールドグリッドの整数倍とすることにしてもよい。こうすることで、ビデオ、グラフィックスなど他の映像ソースとの同期再生を保証することができる。ここで、フレームグリッド、あるいはフィールドグリッドはビデオなど特定のストリームのフレームレートを基準として生成される。さらに、N番目とN+1番目のAVC静止画の表示時刻の差分値は、フレームグリッド、あるいはフィールドグリッドの整数倍とすることにしてもよい。
AVC静止画を再生する際に参照するタイムマップとしては、実施の形態2におけるタイムマップを使用する。
なお、BD ROM規格などにおいて、num_units_in_tick、time_scale、fixed_frame_rate_flagのデフォルト値を規定することにより、これらのフィールドを省略することにしてもよい。
なお、ビデオストリームの場合にはストリーム内で解像度を変更することは禁止されているが、静止画のストリームでは解像度を変換しても復号動作におけるバッファ管理などを破綻なく実現できるため、ストリーム内で解像度を変更できることにしてもよい。ここで、解像度はSPS内のフィールドにより示される。
なお、MPGE−4 AVC以外の符号化方式であっても、同様のデータ構造をもつ場合には、本実施の形態のデータ構造、および再生方法を適用できる。
(実施の形態4)
実施の形態2および実施の形態3において、静止画アプリケーションを実現するための符号化方式としてMPEG‐4 AVCを使用できることを述べた。本実施の形態4では、BD‐ROMなどのパッケージメディアなどにおいて、動画再生時の処理量を抑えつつ、静止画を高画質に符号化できる情報記録媒体、およびその再生装置について説明する。
まず、従来の情報記録媒体について説明する。MPEG−4 AVCではピクチャの符号量の最大値が規定されている。BDなどのアプリケーション規格では、MPEG−4 AVCにおける規定値、あるいはアプリケーションにおいて独自に設定した値をピクチャの符号量の上限値としている。上限値は、MPEG−4 AVC規格において規定された、MinCR(Minimum Compression Ratio)と呼ばれるパラメータにより制限できる。MinCRとは、原画に対する符号化ピクチャの圧縮率の下限を示すパラメータである。例えば、MinCRが2であれば、符号化ピクチャの符号量は、原画のサイズの2分の1以下であることを示す。
従来の情報記録媒体では、動画アプリケーションと静止画アプリケーションにおいて、MinCRとして同一の値を使用していた。動画においては、符号化データを復号する際の処理量が大きくなることから、特に、1ピクチャを復号する際の演算量が規格で定められた上限値となるようなワーストケースにおいても動作を保証できるように、MinCRが決定される。一方、静止画では、動画に比べて表示間隔が長いことから、復号時の処理量よりも、むしろ画質が重要となる。しかしながら、静止画を高画質に符号化すると符号量が増加するため、静止画と動画でMinCRが同一である従来の情報記録媒体では、特にイントラ符号化時に、ピクチャに対して十分なビットを割り当てられないという課題があった。
本実施の形態4における情報記録媒体では、動画と静止画のそれぞれに異なるMinCRを適用することにより、動画については復号時の処理量を鑑みてMinCR値を大きくし、静止画については、高画質に符号化するために十分なピクチャサイズを保証できるように、動画よりもMinCR値を小さくする。
図49は、本実施の形態4の情報記録媒体のデータ構造例を示す。BD管理情報におけるストリーム管理情報には、ClipInfoと呼ばれるデータ・オブジェクトにおいてクリップの属性情報が示される。なお、クリップとは、AVデータのファイルを指し、例えば、MPEG−4 AVCの静止画ストリームを格納した1つのファイルが、1クリップとなる。動画と静止画とで異なるMinCRが適用されていることを示すには、クリップ毎のMinCR値を示す情報が必要となる。従って、ClipInfoには、参照するクリップにおいて適用されるMinCR値を示す情報が付加される。ここでは、静止画のクリップと動画のクリップに対して適用されるMinCR値が予め定められているものとして、参照するクリップが動画であるか静止画であるかを示すフラグ情報を格納することにより、クリップに適用されるMinCR値を示すことにする。図49の例では、ディスク内に少なくとも静止画と動画のクリップが格納されており、それぞれClipInfo#1とClipInfo#2から参照される。ここで、ClipInfo #1にはクリ
ップが静止画であることを示すフラグ情報、ClipInfo #2にはクリップが動画
であることを示すフラグ情報が格納される。このフラグ情報を参照することにより、クリップを構成するピクチャにおけるMinCR値を取得することができる。図49の例では、静止画のクリップにおけるMinCRを2、動画のクリップにおけるMinCRを4とすることにより、静止画の高画質化と動画復号時の処理量の抑制を両立している。なお、ここでのMinCR値は一例であり、この他の組み合わせを使用してもよく、再生装置の処理量に余裕があるアプリケーションにおいては、静止画と動画のMinCR値を同一にしてもよい。また、予め、静止画用と動画用のMinCR値の組み合わせを複数定めておき、特定の組み合わせを示すパラメータを導入することによりMinCR値を示してもよい。また、クリップが静止画であることが示される際には、連続する2枚のピクチャを復号、あるいは表示する際の間隔が予め定められた値以上、あるいは大きくなることを保証してもよい。例えば、静止画の場合には連続する2枚のピクチャの表示間隔が0.5秒以上であるとする。これにより、MinCR値が2であり、1ピクチャあたりの符号量が大きくなる際にも、表示間隔が0.5秒以上と十分に長いため、各ピクチャの復号が保証できる。
なお、ClipInfoには、application_typeと呼ばれる、クリップを再生するアプリケーションのタイプを示すフィールドが存在する。本フィールドでは、アプリケーションが動画、静止画のどちらであるか、また、静止画である場合にはタイム・ベース、ブラウザブルのどちらであるかを示すことができる。ここで、タイム・ベースとは、予め定められた間隔で静止画を表示するものであり、ブラウザブルとは、ユーザが静止画の表示タイミングを決定できるアプリケーションである。従って、application_typeのフィールド値が、タイム・ベース、あるいはブラウザブルの静止画アプリケーションを指す際には、静止画用のMinCR値が適用され、動画アプリケーションを指す際には、動画用のMinCR値が適用されるとしてもよい。
なお、MinCR値は、動画と静止画で切り替える以外にも、異なる動画のクリップ間でも切り替えることができる。例えば、主映像と副映像が含まれる際には、主映像についてはMinCR値を小さく設定して高画質に符号化し、副映像については処理量を考慮してMinCR値を大きく設定することができる。このときは、MinCR値を示す情報としては、静止画であるか動画であるかを示すフラグ情報ではなく、クリップ毎のMinCR値を示す情報を使用する。
なお、動画あるいは静止画の符号量の上限を示すパラメータはMinCRに制限されるものではなく、符号量の上限値をデータサイズとして直接示すなど、他のパラメータであってもよい。
なお、クリップにおけるピクチャの符号量の上限値を示す情報は、ClipInfo以外のBD管理情報に格納してもよいし、符号化データ内に格納してもよい。符号化データに格納する際には、GOP(Group Of Picture)などのランダムアクセス単位毎に格納でき、例えば、MPEG−4 AVCでは、ユーザデータを格納するためのデータ単位を使用することができる。なお、ユーザデータ格納用のデータ単位としては、特定のタイプをもつNAL(Network Abstraction Layer)ユニット、あるいは、ユーザデータ格納用のSEI(Supplemental Enhancement Information)メッセージなどがある。また、ピクチャの符号量の上限値は、ランダムアクセス単位など、クリップとは異なる単位で切り替え可能としてもよい。
また、データ再生装置によっては、動画を復号する際に、1ピクチャの符号化データを復号にかかる時間が予め定められた時間、あるいは、ピクチャの表示間隔を超えると判定されると、当該ピクチャの復号をスキップして次ピクチャの復号を開始することがある。あるいは、動画の復号時にはワーストケースにも対応できる場合でも、本実施の形態の情報記録媒体における静止画を再生する際には、静止画の符号量の上限が動画よりも大きくなり、符号量が大きくなると復号に要する時間も増加するため、結果として静止画の復号がスキップされることがある。ここで、一般的に、静止画の表示間隔は動画に比べて長いために、予め設定された表示開始時刻までに復号が完了していなくても、復号完了後に表示すれば再生品質の低下は軽微である。従って、静止画の復号時は、予め設定された表示開始時刻までに復号が完了しない場合にも、復号をスキップせずに、復号完了後に表示すればよい。
なお、上記においてはBDについて説明したが、静止画と動画を格納することのできる情報記録媒体であれば、同様の方法を用いることができる。また、符号化方式もMPEG−4 AVCに限定されるものではなく、MPEG−2 Videoなど他の符号化方式にも適用できる。
(実施の形態5)
図50は、本実施の形態4における情報記録媒体に格納されたデータを作成するための多重化方法を示すフローチャートである。本実施の形態の多重化方法は、クリップの種類に応じてMinCR値を切り替えるステップ(ステップS2001、ステップS2002、およびステップS2003)、および、MinCR値を特定するためのフラグ情報を生成して管理情報に含めるステップ(ステップS2004とステップS2005)とを備える点において、従来の多重化方法と異なる。
まず、ステップS2001において、生成するクリップが動画であるか静止画であるか判定する。クリップが静止画である際には、ステップS2002に進み、予め定められた静止画クリップ用のMinCR値を設定し、クリップが動画である際には、ステップS2003進み、予め定められた動画クリップ用のMinCR値を設定する。次に、ステップS1001において、ステップS2002、あるいはステップS2003において設定されたMinCR値を満たすように、クリップを構成するピクチャを符号化し、ステップS1002に進む。ステップS1002では、ステップS1001において符号化されたデータをシステム多重化する。BDでは、システム多重化の方式としてMPEG−2のトランスポートストリームを用いる。次に、ステップS2004では、クリップを構成するピクチャに適用されるMinCR値を特定するためのフラグ情報を生成し、ステップS2005において、ステップS2004において生成したフラグ情報を含んだ管理情報を生成する。最後に、ステップS1003において、管理情報と、システム多重化された符号化データとを結合して出力する。また、MinCR値を特定するための情報としては、ピクチャの符号量の最大値を直接格納するなど、フラグ情報以外であってもよい。
なお、音声、グラフィックスなどのデータについても、動画あるいは静止画とともに多重化することができるが、ここでは説明を省略する。
図51は、本実施の形態5の多重化方法を実現する多重化装置2000の構成を示すブロック図である。多重化装置2000は、MinCR決定部2001、MinCR情報生成部2002、符号化部1001、システム多重化部1002、管理情報作成部2003、結合部1003を備え、MinCR決定部2001、MinCR情報生成部2002を備える点、および、管理情報作成部2003においてMinCR値を特定するためのフラグ情報を含む管理情報を生成する点において、従来の多重化装置と異なる。
以下に、各部の動作について説明する。MinCR決定部は、クリップが動画であるか静止画であるかを示すクリップ属性ClipCharに基づいて、クリップを構成するピクチャに適用するMinCR値を決定し、決定したMinCR値crを符号化部1001とMinCR情報生成部2002に入力する。符号化部1001は、MinCR決定部により決定されたMinCR値crに基づいて、入力の動画像あるいは画像データVinを符号化し、符号化データCdataをシステム多重化部1002に入力する。システム多重化部1002は、符号化データCdataをシステム多重化して多重化データMdataを結合部1003に入力する。一方、MinCR情報生成部は、MinCR値crに基づいて、クリップを構成するピクチャに適用されたMinCR値を特定するためのフラグ情報であるMinCR情報crInfを生成し、管理情報作成部2003に入力する。管理情報生成部は、タイムマップなど、多重化データMdataについての管理情報を生成するためのストリーム情報StrInfをシステム多重化部1002から取得して、MinCR情報crInfを含む管理情報CtrInfを生成し、結合部1003に出力する。結合部1003は、管理情報CtrInfと多重化データMdataとを結合して記録データDoutとして出力する。ここで、符号化部1001は、クリップの種類、あるいはMinCR値に基づいて、連続する2枚のピクチャの復号、あるいは表示間隔の下限を設定してもよい。
なお、オーサリングツールなどでデータを作成する際には、符号化データの生成と、システム多重化あるいは管理情報の作成を別々の装置で行うことがあるが、そのような場合でも、各装置の動作は多重化装置2000における各部と同一にすればよい。
(実施の形態6)
さらに、上記各実施の形態で示した情報記録媒体、その再生方法および記録方法を実現するためのプログラムを、フレキシブルディスク等の記録媒体に記録するようにすることにより、上記各実施の形態で示した処理を、独立したコンピュータシステムにおいて簡単に実施することが可能となる。
図52A〜図52Cは、上記各実施の形態の再生方法および記録方法を、フレキシブルディスク等の記録媒体に記録されたプログラムを用いて、コンピュータシステムにより実施する場合の説明図である。
図52Bは、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示し、図52Aは、記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。フレキシブルディスクFDはケースF内に内蔵され、該ディスクの表面には、同心円状に外周からは内周に向かって複数のトラックTrが形成され、各トラックは角度方向に16のセクタSeに分割されている。従って、上記プログラムを格納したフレキシブルディスクでは、上記フレキシブルディスクFD上に割り当てられた領域に、上記プログラムが記録されている。
また、図52Cは、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。再生方法および記録方法を実現する上記プログラムをフレキシブルディスクFDに記録する場合は、コンピュータシステムCsから上記プログラムをフレキシブルディスクドライブを介して書き込む。また、フレキシブルディスク内のプログラムにより再生方法および記録方法を実現する再生方法および記録方法をコンピュータシステム中に構築する場合は、フレキシブルディスクドライブによりプログラムをフレキシブルディスクから読み出し、コンピュータシステムに転送する。
なお、上記説明では、記録媒体としてフレキシブルディスクを用いて説明を行ったが、光ディスクを用いても同様に行うことができる。また、記録媒体はこれに限らず、ICカード、ROMカセット等、プログラムを記録できるものであれば同様に実施することができる。
なお、図10、図18、図19、図23、図51等に示したブロック図の各機能ブロックは典型的には集積回路装置であるLSIとして実現される。このLSIは1チップ化されても良いし、複数チップ化されても良い。(例えばメモリ以外の機能ブロックが1チップ化されていても良い。)ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、データを格納するユニットだけ1チップ化せずに、本実施形態の記録媒体のように別構成としても良い。
なお、図10、18、19、23、51等に示したブロック図の各機能ブロックおよび図9、11〜15、38〜41、50に示したフローチャートにおいて、中心的な部分はプロセッサおよびプログラムによっても実現される。
このように、上記実施の形態で示した画像符号化方法あるいは画像復号化方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記実施の形態で説明した効果を得ることができる。
本発明に係る画像符号化方法は、管理情報により示される連続再生単位において、動画像の符号化データに適用される可変長符号化の方式を固定としたことで、可変長符号化の方式の切り替わりに起因する復号時の遅延をなくすことができるとともに、バッファ管理方法の切替えに伴う処理負荷を軽減できるため、MPEG−4 AVCなどストリーム内で可変長符号化の方式を切り替えられるストリームが多重化されたパッケージメディアなどに適している。
図1は、DVDの構成図である。 図2は、ハイライトの構成図である。 図3は、DVDでの多重化の例を示す図である。 図4は、従来のMPEG−4 AVCストリームにおいてピクチャ単位に適用される可変長符号化方式の例を示す図である。 図5Aは、CABACとCAVLCが適用された符号化ストリームを復号する復号装置の構成を示すブロック図である。 図5Bは、CABACが適用された符号化ストリームを復号する動作を示すフローチャートである。 図5Cは、CAVLCが適用された符号化ストリームを復号する動作を示すフローチャートである。 図6は、従来の復号装置の動作を示すフローチャートである。 図7は、実施の形態1の情報記録媒体に格納されるMPEG−4 AVCストリームにおいてピクチャ単位に適用される可変長符号化の方式の例を示す図である。 図8は、情報記録媒体において、可変長符号化の方式が固定である単位を示すフラグ情報の格納例を示す図である。 図9は、情報記録媒体を再生する復号装置の動作を示すフローチャートである。 図10は、多重化装置の構成を示すブロック図である。 図11は、多重化装置の動作を示すフローチャートである。 図12は、図11中のS5201の具体例を示すフローチャートである。 図13は、図11中のS5202の具体例を示すフローチャートである。 図14は、図11中のS5203の他の具体例を示すフローチャートである。 図15は、図11中のS5204の具体例を示すフローチャートである。 図16は、HD−DVDのデータ階層図である。 図17は、HD−DVD上の論理空間の構成図である。 図18は、HD−DVDプレーヤの概要ブロック図である。 図19は、HD−DVDプレーヤの構成ブロック図である。 図20は、HD−DVDのアプリケーション空間の説明図である。 図21は、MPEGストリーム(VOB)の構成図である。 図22は、パックの構成図である。 図23は、AVストリームとプレーヤ構成の関係を説明する図である。 図24は、トラックバッファへのAVデータ連続供給モデル図である。 図25は、VOB情報ファイル構成図である。 図26は、タイムマップの説明図である。 図27は、プレイリストファイルの構成図である。 図28は、プレイリストに対応するプログラムファイルの構成図である。 図29は、BDディスク全体管理情報ファイルの構成図である。 図30は、グローバルイベントハンドラを記録するファイルの構成図である。 図31は、タイムイベントの例を説明する図である。 図32は、ユーザイベントの例を説明する図である。 図33は、グローバルイベントハンドラの例を説明する図である。 図34は、仮想マシンの構成図である。 図35は、プレーヤ変数テーブルの図である。 図36は、イベントハンドラ(タイムイベント)の例を示す図である。 図37は、イベントハンドラ(ユーザイベント)の例を示す図である。 図38は、プレーヤの基本処理のフローチャートである。 図39は、プレイリスト再生処理のフローチャートである。 図40は、イベント処理のフローチャートである。 図41は、字幕処理のフローチャートである。 図42は、実施の形態2のタイムマップと静止画の関係を説明する図である。 図43は、参照するピクチャがデコード可能か否かを示すフラグを説明する図である。 図44は、すべてのエントリがIピクチャを参照することを示すフラグを説明する図である。 図45は、動画アプリケーションとスライドショーの違いを説明する図である。 図46は、すべてのIピクチャが参照されていることを保証するフラグを説明する図である。 図47は、実施の形態3のMPEG−4 AVCにおける静止画のデータ構造を示す図である。 図48は、MPEG−4 AVCにおける静止画の再生方法を説明する図である。 図49は、クリップに対して特定のMinCR値が適用されることを示すフラグ、およびデータ構造を説明する図である。 図50は、実施の形態5の多重化方法の動作を示すフローチャートである。 図51は、多重化装置の構成を示すブロック図である。 図52Aは、実施の形態6における記録媒体本体であるフレキシブルディスクの物理フォーマットの例を示している。 図52Bは、フレキシブルディスクの正面からみた外観、断面構造、及びフレキシブルディスクを示す。 図52Cは、フレキシブルディスクFDに上記プログラムの記録再生を行うための構成を示す。
符号の説明
201 BDディスク
202 光ピックアップ
203 プログラム記録メモリ
204 管理情報記録メモリ
205 AV記録メモリ
206 プログラム処理部
207 管理情報処理部
208 プレゼンテーション処理部
209 イメージプレーン
210 ビデオプレーン
211 合成処理部
301 プログラム記録メモリ
302 プログラムプロセッサ
303 UOPマネージャ
304 管理情報記録メモリ
305 シナリオプロセッサ
306 プレゼンテーションコントローラ
307 クロック
308 イメージメモリ
309 トラックバッファ
310 デマルチプレクサ
311 イメージプロセッサ
312 ビデオプロセッサ
313 サウンドプロセッサ
314 イメージプレーン
315 ビデオプレーン
316 合成処理部
317 ドライブコントローラ
3207 動画ダウンコンバータ
3215 字幕ダウンコンバータ
3223 静止画ダウンコンバータ
3228 音声ダウンコンバータ
S101 ディスク挿入ステップ
S102 BD.INFO読み込みステップ
S103 BD.PROG読み込みステップ
S104 ファーストイベント生成ステップ
S105 イベントハンドラ実行ステップ
S201 UOP受付ステップ
S202 UOPイベント生成ステップ
S203 メニューコール判定ステップ
S204 イベント生成ステップ
S205 イベントハンドラ実行ステップ
S301 プレイリスト再生開始ステップ
S302 プレイリスト情報(XXX.PL)読み込みステップ
S303 プレイリストプログラム(XXX.PROG)読み込みステップ
S304 セル再生開始ステップ
S305 AV再生開始ステップ
S401 AV再生開始ステップ
S402 VOB情報(YYY.VOBI)読み込みステップ
S403 VOB(YYY.VOB)読み込みステップ
S404 VOB再生開始ステップ
S405 VOB再生終了ステップ
S406 次セル存在判定ステップ
S501 プレイリスト再生開始ステップ
S502 プレイリスト再生終了判定ステップ
S503 タイムイベント時刻判定ステップ
S504 イベント生成ステップ
S505 イベントハンドラ実行ステップ
S601 プレイリスト再生開始ステップ
S602 プレイリスト再生終了判定ステップ
S603 UOP受付判定ステップ
S604 UOPイベント生成ステップ
S605 メニューコール判定ステップ
S606 ユーザイベント有効期間判定ステップ
S607 イベント生成ステップ
S608 イベントハンドラ実行ステップ
S701 プレイリスト再生開始ステップ
S702 プレイリスト再生終了判定ステップ
S703 字幕描画開始判定ステップ
S704 字幕描画ステップ
S705 字幕表示終了判定ステップ
S706 字幕消去ステップ

Claims (6)

  1. 周囲の状況に応じて、適応的に符号化を行う可変長符号化方式と、周囲の状況に応じて、適応的に符号化を行う2値の算術符号化方式とを切り替えて動画像を符号化する動画像符号化方法であって、
    シームレスな連続再生の対象となる連続区間を決定する決定ステップと、
    前記連続区間を構成し、復号順で先頭のピクチャが画面内符号化ピクチャである各再生区間において、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方を用いて、動画像を符号化することにより動画像ストリームを生成する生成ステップと、
    連続する前記再生区間における符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方に固定されていることを、前記再生区間ごとに示す第1フラグ情報を含む管理情報を生成する管理情報生成ステップと
    を有することを特徴とする動画像符号化方法。
  2. 周囲の状況に応じて、適応的に符号化を行う可変長符号化方式と、周囲の状況に応じて、適応的に符号化を行う2値の算術符号化方式とを切り替えて動画像を符号化する動画像符号化装置であって、
    シームレスな連続再生の対象となる連続区間を決定する決定手段と、
    前記連続区間を構成し、復号順で先頭のピクチャが画面内符号化ピクチャである各再生区間において、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方を用いて、動画像を符号化することにより動画像ストリームを生成する符号化手段と、
    連続する前記再生区間における符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方に固定されていることを、前記再生区間ごとに示す第1フラグ情報を含む管理情報を生成する生成手段と
    を備えることを特徴とする動画像符号化装置。
  3. 周囲の状況に応じて、適応的に符号化を行う可変長符号化方式と、周囲の状況に応じて、適応的に符号化を行う2値の算術符号化方式とを切り換えて符号化された動画像と、その他の情報とを含む動画像ストリームと、管理情報とから動画像を復号する動画像復号化方法であって、
    シームレスな連続再生の対象となる連続区間を構成し、復号順で先頭のピクチャが画面内符号化ピクチャである再生区間において、連続する前記再生区間における符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方に固定されていることを示す第1フラグ情報を、前記管理情報から前記再生区間ごとに抽出する第1の抽出ステップと、
    前記第1フラグ情報を抽出した場合に、同一の符号化方式を用いて復号を行うことを決定する決定ステップと、
    前記動画像ストリームから、符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれであるかを示す第2フラグ情報を抽出する第2の抽出ステップと、
    前記決定ステップにおいて同一の符号化方式を用いて復号すると決定した場合に、前記第2フラグが示す符号化方式を用いて、連続する前記再生区間の接続点においてシームレスに復号を行う復号ステップと
    を有することを特徴とする動画像復号化方法。
  4. 周囲の状況に応じて、適応的に符号化を行う可変長符号化方式と、周囲の状況に応じて、適応的に符号化を行う2値の算術符号化方式とを切り換えて符号化された動画像と、その他の情報とを含む動画像ストリームと、管理情報とから動画像を復号する動画像復号化装置であって、
    シームレスな連続再生の対象となる連続区間を構成し、復号順で先頭のピクチャが画面内符号化ピクチャである再生区間において、連続する前記再生区間における符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方に固定されていることを示す第1フラグ情報を、前記管理情報から前記再生区間ごとに抽出する第1の抽出手段と、
    前記第1フラグ情報を抽出した場合に、同一の符号化方式を用いて復号を行うことを決定する決定手段と、
    前記動画像ストリームから、符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれであるかを示す第2フラグ情報を抽出する第2の抽出手段と、
    前記決定手段において同一の符号化方式を用いて復号すると決定した場合に、前記第2フラグが示す符号化方式を用いて、連続する前記再生区間の接続点においてシームレスに復号を行う復号手段と
    を有することを特徴とする動画像復号化装置。
  5. 周囲の状況に応じて、適応的に符号化を行う可変長符号化方式と、周囲の状況に応じて、適応的に符号化を行う2値の算術符号化方式とを切り替えて符号化した動画像を含む動画像ストリームと、管理情報とをコンピュータ読み取り可能な記録媒体に記録する記録方法であって、
    シームレスな連続再生の対象となる連続区間を決定する決定ステップと、
    前記連続区間を構成し、復号順で先頭のピクチャが画面内符号化ピクチャである各再生区間において、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方を用いて、動画像を符号化することにより動画像ストリームを生成する生成ステップと、
    連続する前記再生区間における符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方に固定されていることを、前記再生区間ごとに示す第1フラグ情報を含む管理情報を生成する管理情報生成ステップと、
    前記動画像ストリームと管理情報とを記録媒体に記録する記録ステップと、
    を有することを特徴とする記録媒体への記録方法。
  6. 周囲の状況に応じて、適応的に符号化を行う可変長符号化方式と、周囲の状況に応じて、適応的に符号化を行う2値の算術符号化方式とを切り替えて符号化された動画像と、その他の情報とを含む動画像ストリームと、管理情報とを含むデータが記録されたコンピュータ読み取り可能な記録媒体と、
    前記記録媒体から、前記データを読み取り復号を行う動画像復号化装置とから構成される動画像復号化システムであって、
    前記記録媒体に記録されたデータは、
    シームレスな連続再生の対象となる連続区間を構成し、復号順で先頭のピクチャが画面内符号化ピクチャである各再生区間において、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方を用いて、動画像を符号化されており、
    連続する前記再生区間における符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれか一方に固定されていることを、前記再生区間ごとに示す第1フラグ情報を含む管理情報と、
    符号化された動画像、及び、前記符号化された動画像の所定単位毎に、符号化方式が、前記可変長符号化方式、または、前記算術符号化方式のいずれであるかを示す第2フラグ情報を含む動画像ストリームとを有し、
    前記動画像復号化装置は、
    前記第1フラグ情報を、前記管理情報から前記再生区間ごとに抽出する第1の抽出手段と、
    前記第1フラグ情報を抽出した場合に、同一の符号化方式を用いて復号を行うことを決定する決定手段と、
    前記動画像ストリームから前記第2フラグ情報を抽出する第2の抽出手段と、
    前記決定手段において同一の符号化方式を用いて復号すると決定した場合に、前記第2フラグが示す符号化方式を用いて、連続する前記再生区間の接続点においてシームレスに復号を行う復号手段と
    を有することを特徴とする動画像復号化システム。
JP2008183938A 2004-08-31 2008-07-15 動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システム Active JP4201213B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008183938A JP4201213B2 (ja) 2004-08-31 2008-07-15 動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004251870 2004-08-31
JP2008183938A JP4201213B2 (ja) 2004-08-31 2008-07-15 動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007338102A Division JP4516109B2 (ja) 2004-08-31 2007-12-27 多重化方法、多重化装置、逆多重化方法、逆多重化装置および記録方法

Publications (2)

Publication Number Publication Date
JP2008301512A true JP2008301512A (ja) 2008-12-11
JP4201213B2 JP4201213B2 (ja) 2008-12-24

Family

ID=36000038

Family Applications (6)

Application Number Title Priority Date Filing Date
JP2006532721A Active JP4099512B2 (ja) 2004-08-31 2005-08-30 動画像符号化方法、動画像符号化装置、動画像復号化方法、動画像復号化装置、記録媒体、記録方法および動画像復号化システム
JP2007338102A Expired - Fee Related JP4516109B2 (ja) 2004-08-31 2007-12-27 多重化方法、多重化装置、逆多重化方法、逆多重化装置および記録方法
JP2008183938A Active JP4201213B2 (ja) 2004-08-31 2008-07-15 動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システム
JP2009251495A Active JP4813592B2 (ja) 2004-08-31 2009-10-30 動画像符号化方法および装置、動画像復号化方法および装置並びに記録方法
JP2009251494A Active JP4813591B2 (ja) 2004-08-31 2009-10-30 動画像符号化方法および装置、動画像復号化方法および装置並びに記録方法
JP2009251496A Expired - Fee Related JP4813593B2 (ja) 2004-08-31 2009-10-30 動画像符号化方法および装置、動画像復号化方法および装置並びに記録方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2006532721A Active JP4099512B2 (ja) 2004-08-31 2005-08-30 動画像符号化方法、動画像符号化装置、動画像復号化方法、動画像復号化装置、記録媒体、記録方法および動画像復号化システム
JP2007338102A Expired - Fee Related JP4516109B2 (ja) 2004-08-31 2007-12-27 多重化方法、多重化装置、逆多重化方法、逆多重化装置および記録方法

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP2009251495A Active JP4813592B2 (ja) 2004-08-31 2009-10-30 動画像符号化方法および装置、動画像復号化方法および装置並びに記録方法
JP2009251494A Active JP4813591B2 (ja) 2004-08-31 2009-10-30 動画像符号化方法および装置、動画像復号化方法および装置並びに記録方法
JP2009251496A Expired - Fee Related JP4813593B2 (ja) 2004-08-31 2009-10-30 動画像符号化方法および装置、動画像復号化方法および装置並びに記録方法

Country Status (9)

Country Link
US (4) US7756205B2 (ja)
EP (2) EP1791358B1 (ja)
JP (6) JP4099512B2 (ja)
KR (5) KR101138047B1 (ja)
CN (6) CN101841714B (ja)
AT (1) ATE511314T1 (ja)
ES (1) ES2362787T3 (ja)
PL (1) PL1791358T4 (ja)
WO (1) WO2006025388A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108965993A (zh) * 2017-07-20 2018-12-07 北京视联动力国际信息技术有限公司 一种多路视频流的解码方法和装置

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7370212B2 (en) 2003-02-25 2008-05-06 Microsoft Corporation Issuing a publisher use license off-line in a digital rights management (DRM) system
US7483532B2 (en) * 2003-07-03 2009-01-27 Microsoft Corporation RTP payload format
US20080002947A1 (en) * 2004-02-06 2008-01-03 Wataru Ikeda Recording medium, reproduction device, program and reproduction method
US8391672B2 (en) * 2004-02-06 2013-03-05 Panasonic Corporation Recording medium, reproduction device, program, and reproduction method
EP1858014B1 (en) * 2004-06-02 2009-11-18 Panasonic Corporation Recording medium, reproduction device, program, and reproduction method
US8438645B2 (en) 2005-04-27 2013-05-07 Microsoft Corporation Secure clock with grace periods
US8725646B2 (en) 2005-04-15 2014-05-13 Microsoft Corporation Output protection levels
US20060265758A1 (en) 2005-05-20 2006-11-23 Microsoft Corporation Extensible media rights
US7684566B2 (en) 2005-05-27 2010-03-23 Microsoft Corporation Encryption scheme for streamed multimedia content protected by rights management system
US7769880B2 (en) * 2005-07-07 2010-08-03 Microsoft Corporation Carrying protected content using a control protocol for streaming and a transport protocol
US7561696B2 (en) * 2005-07-12 2009-07-14 Microsoft Corporation Delivering policy updates for protected content
US7634816B2 (en) 2005-08-11 2009-12-15 Microsoft Corporation Revocation information management
US8321690B2 (en) 2005-08-11 2012-11-27 Microsoft Corporation Protecting digital media of various content types
US7720096B2 (en) * 2005-10-13 2010-05-18 Microsoft Corporation RTP payload format for VC-1
WO2007058470A1 (en) * 2005-11-15 2007-05-24 Electronics And Telecommunications Research Institute A method of scalable video coding for varying spatial scalability of bitstream in real time and a codec using the same
US20070147496A1 (en) * 2005-12-23 2007-06-28 Bhaskar Sherigar Hardware implementation of programmable controls for inverse quantizing with a plurality of standards
JP2008048240A (ja) * 2006-08-18 2008-02-28 Nec Electronics Corp ビットプレーン復号装置およびビットプレーン復号方法
JP4902854B2 (ja) * 2006-09-12 2012-03-21 パナソニック株式会社 動画像復号化装置、動画像復号化方法、動画像復号化プログラム、動画像符号化装置、動画像符号化方法、動画像符号化プログラム、及び動画像符号化復号化装置
CN101193321B (zh) * 2006-11-27 2012-02-22 汤姆森许可贸易公司 编码设备、解码设备、记录设备、音频/视频数据传送系统
AR064274A1 (es) * 2006-12-14 2009-03-25 Panasonic Corp Metodo de codificacion de imagenes en movimiento, dispositivo de codificacion de imagenes en movimiento, metodo de grabacion de imagenes en movimiento, medio de grabacion, metodo de reproduccion de imagenes en movimiento, dispositivo de reproduccion de imagenes en movimiento, y sistema de reproducci
JP4823090B2 (ja) * 2007-02-01 2011-11-24 パナソニック株式会社 画像符号化装置
WO2008111136A1 (ja) * 2007-03-15 2008-09-18 Fujitsu Limited 動画配信装置
JP5170708B2 (ja) * 2008-01-24 2013-03-27 日本電気株式会社 動画像ストリーム加工方法及び装置、それを用いた動画像再生装置並びに動画像配信装置
KR101567814B1 (ko) * 2009-01-21 2015-11-11 삼성전자주식회사 슬라이드 쇼를 제공하는 방법, 장치, 및 컴퓨터 판독가능 저장매체
JP2011223247A (ja) * 2010-04-08 2011-11-04 Sony Corp 情報処理装置、情報記録媒体、および情報処理方法、並びにプログラム
JP2011223248A (ja) * 2010-04-08 2011-11-04 Sony Corp 情報処理装置、情報記録媒体、および情報処理方法、並びにプログラム
JP5601006B2 (ja) * 2010-04-08 2014-10-08 ソニー株式会社 情報処理装置、情報記録媒体、および情報処理方法、並びにプログラム
KR20130058584A (ko) * 2011-11-25 2013-06-04 삼성전자주식회사 복호화기의 버퍼 관리를 위한 영상 부호화 방법 및 장치, 그 영상 복호화 방법 및 장치
LT3197162T (lt) * 2011-12-15 2020-05-11 Tagivan Ii Llc Skaisčio-spalvio koduoto bloko žymų (cbf) signalo perdavimas vaizdo kodavime
US9648317B2 (en) 2012-01-30 2017-05-09 Qualcomm Incorporated Method of coding video and storing video content
US9716892B2 (en) * 2012-07-02 2017-07-25 Qualcomm Incorporated Video parameter set including session negotiation information
US9426462B2 (en) 2012-09-21 2016-08-23 Qualcomm Incorporated Indication and activation of parameter sets for video coding
JP6094126B2 (ja) * 2012-10-01 2017-03-15 富士通株式会社 動画像復号装置
US9369711B2 (en) * 2013-01-07 2016-06-14 Qualcomm Incorporated Conditional signaling of picture order count timing information for video timing in video coding
CN110572650B (zh) 2014-01-08 2023-10-27 索尼公司 解码设备和解码方法、以及编码设备和编码方法
US9348495B2 (en) 2014-03-07 2016-05-24 Sony Corporation Control of large screen display using wireless portable computer and facilitating selection of audio on a headphone
US9911460B2 (en) 2014-03-24 2018-03-06 Microsoft Technology Licensing, Llc Fast and smart video trimming at frame accuracy on generic platform
JP6410495B2 (ja) * 2014-07-07 2018-10-24 ルネサスエレクトロニクス株式会社 画像符号化装置、画像復号装置、および画像通信システム
US10283091B2 (en) * 2014-10-13 2019-05-07 Microsoft Technology Licensing, Llc Buffer optimization
MX2019004302A (es) * 2014-10-17 2019-10-21 Panasonic Ip Corp America Medio de grabacion, metodo de reproduccion y dispositivo de reproduccion.
CN106507115B (zh) * 2016-11-30 2019-10-15 上海音绮文化发展有限公司 基于iOS设备的VR视频的解码方法、装置及终端设备

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0464839B1 (en) * 1990-07-05 2000-09-27 Fujitsu Limited Digitally multiplexed transmission system
TW303570B (ja) 1995-09-29 1997-04-21 Matsushita Electric Ind Co Ltd
US20030093790A1 (en) * 2000-03-28 2003-05-15 Logan James D. Audio and video program recording, editing and playback systems using metadata
JP3058870B1 (ja) 1999-02-05 2000-07-04 株式会社次世代デジタルテレビジョン放送システム研究所 Afc回路
KR100746821B1 (ko) * 2000-04-21 2007-08-06 소니 가부시끼 가이샤 정보 처리 장치와 방법, 기록매체
EP1347651A1 (en) * 2000-12-20 2003-09-24 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for decoding motion video image
JP4409792B2 (ja) 2001-06-22 2010-02-03 ソニー株式会社 データ伝送装置および方法、記録媒体並びにプログラム
JP4447197B2 (ja) 2002-01-07 2010-04-07 三菱電機株式会社 動画像符号化装置および動画像復号装置
US20040125204A1 (en) 2002-12-27 2004-07-01 Yoshihisa Yamada Moving picture coding apparatus and moving picture decoding apparatus
US7428338B2 (en) * 2002-01-10 2008-09-23 Ricoh Co., Ltd. Header-based processing of images compressed using multi-scale transforms
JP2003228921A (ja) 2002-01-31 2003-08-15 Toshiba Corp 情報記録媒体、情報記録装置及び情報再生装置
JP4090862B2 (ja) * 2002-04-26 2008-05-28 松下電器産業株式会社 可変長符号化方法および可変長復号化方法
JP4230188B2 (ja) 2002-06-06 2009-02-25 パナソニック株式会社 可変長符号化方法および可変長復号化方法
KR101049754B1 (ko) 2002-09-26 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 디지털 정보신호 수신장치
JP4240283B2 (ja) 2002-10-10 2009-03-18 ソニー株式会社 復号装置及び復号方法
WO2004049710A1 (ja) 2002-11-28 2004-06-10 Sony Corporation 再生装置、再生方法、再生プログラムおよび記録媒体
US8194751B2 (en) * 2003-02-19 2012-06-05 Panasonic Corporation Moving picture coding method and moving picture decoding method
JP4699685B2 (ja) * 2003-08-21 2011-06-15 パナソニック株式会社 信号処理装置及びそれを用いた電子機器
US7092576B2 (en) * 2003-09-07 2006-08-15 Microsoft Corporation Bitplane coding for macroblock field/frame coding type information
US7660355B2 (en) * 2003-12-18 2010-02-09 Lsi Corporation Low complexity transcoding between video streams using different entropy coding
EP1578137A2 (en) * 2004-03-17 2005-09-21 Matsushita Electric Industrial Co., Ltd. Moving picture coding apparatus with multistep interpolation process

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108965993A (zh) * 2017-07-20 2018-12-07 北京视联动力国际信息技术有限公司 一种多路视频流的解码方法和装置

Also Published As

Publication number Publication date
ATE511314T1 (de) 2011-06-15
JP4813591B2 (ja) 2011-11-09
EP2346243B1 (en) 2013-11-06
KR20100092525A (ko) 2010-08-20
JP2010028863A (ja) 2010-02-04
EP2346243A1 (en) 2011-07-20
US20070274393A1 (en) 2007-11-29
CN101820544A (zh) 2010-09-01
US8660189B2 (en) 2014-02-25
KR101138047B1 (ko) 2012-04-23
KR101148701B1 (ko) 2012-05-23
PL1791358T4 (pl) 2012-02-29
JP4201213B2 (ja) 2008-12-24
KR101138093B1 (ko) 2012-04-24
KR20100092526A (ko) 2010-08-20
JP2008148337A (ja) 2008-06-26
KR20070056059A (ko) 2007-05-31
KR101116965B1 (ko) 2012-03-14
EP1791358B1 (en) 2011-05-25
JPWO2006025388A1 (ja) 2008-05-08
EP1791358A4 (en) 2008-12-03
KR20100092527A (ko) 2010-08-20
ES2362787T3 (es) 2011-07-13
WO2006025388A1 (ja) 2006-03-09
US20100290758A1 (en) 2010-11-18
US8085851B2 (en) 2011-12-27
CN101800900A (zh) 2010-08-11
CN101848389A (zh) 2010-09-29
JP4813593B2 (ja) 2011-11-09
JP2010028861A (ja) 2010-02-04
CN101010951B (zh) 2010-06-16
CN101820544B (zh) 2012-07-04
KR20100092524A (ko) 2010-08-20
EP1791358A1 (en) 2007-05-30
CN101010951A (zh) 2007-08-01
CN101841714B (zh) 2012-12-26
CN101835046A (zh) 2010-09-15
JP4516109B2 (ja) 2010-08-04
JP4099512B2 (ja) 2008-06-11
CN101841714A (zh) 2010-09-22
US7756205B2 (en) 2010-07-13
US20100290523A1 (en) 2010-11-18
JP2010028862A (ja) 2010-02-04
JP4813592B2 (ja) 2011-11-09
US20100027971A1 (en) 2010-02-04
PL1791358T3 (pl) 2011-10-31
CN101835046B (zh) 2013-01-23

Similar Documents

Publication Publication Date Title
JP4201213B2 (ja) 動画像符号化方法および装置、動画像復号化方法および装置、記録方法並びに動画像復号化システム
JP4841688B2 (ja) 動画像符号化方法、動画像符号化装置、動画像記録方法、動画像再生方法および動画像再生装置
JP2007336573A (ja) 画像符号化装置、画像復号化装置
JP2006087081A (ja) 画像符号化装置、画像復号化装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080909

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081002

R150 Certificate of patent or registration of utility model

Ref document number: 4201213

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111017

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121017

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131017

Year of fee payment: 5