JP4846502B2 - 音声出力装置及び音声出力方法 - Google Patents

音声出力装置及び音声出力方法 Download PDF

Info

Publication number
JP4846502B2
JP4846502B2 JP2006268268A JP2006268268A JP4846502B2 JP 4846502 B2 JP4846502 B2 JP 4846502B2 JP 2006268268 A JP2006268268 A JP 2006268268A JP 2006268268 A JP2006268268 A JP 2006268268A JP 4846502 B2 JP4846502 B2 JP 4846502B2
Authority
JP
Japan
Prior art keywords
audio
stream
encoding
audio stream
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006268268A
Other languages
English (en)
Other versions
JP2008090890A (ja
Inventor
晃司 丸山
隆信 向出
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006268268A priority Critical patent/JP4846502B2/ja
Publication of JP2008090890A publication Critical patent/JP2008090890A/ja
Application granted granted Critical
Publication of JP4846502B2 publication Critical patent/JP4846502B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本発明は光ディスク等の情報記録媒体から音声情報を再生する音声出力装置及び音声出力方法に関する。
DVDに比べて3倍から4倍の記録容量と最大データ転送速度を実現した次世代光ディスクと呼ばれる情報記録媒体が実現されている。次世代光ディスクは1枚のディスクに標準コンテンツとアドバンストコンテンツの2種類のコンテンツを記録可能である。アドバンスドコンテンツはメインビデオとサブビデオとサブピクチャの3種類の映像情報を記録可能であり、それに応じて音声情報としても、メインビデオに対応するメインオーディオ、サブビデオに対応するサブオーディオ、およびエフェクトオーディオの3種類のストリームが記録可能である。
再生した3種類のオーディオストリームはミキシングされてD/A変換器を介してアナログ音声信号としてスピーカに出力され、あるいは再エンコードされてディジタル音声信号として外部アンプ等に出力される。
ディスクに記録されているメインオーディオとサブオーディオの符号化の例は、非圧縮方式のリニアPCM方式、True HD(MLPとも称される)方式、圧縮方式のドルビーディジタルプラス(DD+と略称する)方式、DTS HD Lossless(以下、DTS HDと称する)方式、MPEGオーディオ方式等がある。エフェクトオーディオはWAVファイルであることが一般的である。
このようにディスクに記録される3種類の音声情報は異なる符号化が施されている。しかし、ディスクから再生しデコードしミキシングした後に外部にディジタル出力する際は、3種類とも同じ方式、例えばDTS方式で符号化(再エンコード)される。ディスクに記録される音声情報の符号化の方式は規格で定められている複数の符号化方式からタイトル毎に選ぶことができる。しかし、再エンコード符号化方式は外部アンプとの互換性を考慮すると、圧縮率の高い符号化方式を選ぶことが好ましい。このため、メインオーディオやサブオーディオが非圧縮の符号化方式であっても、再エンコード方式はDTS方式等の高圧縮符号化方式に一意的に決められている。
この場合、ディスクのパッケージ等にはメインオーディオはリニアPCM方式、True HD方式等と記載されていても、外部アンプの表示部の符号化方式の表示欄に「DTS」が表示され、ユーザに違和感や戸惑いを与えることになる。
なお、複数種類の入出力インターフェースに対応可能な映像音声出力装置であって、複数種類の入出力インターフェースのいずれかに外部機器が接続された場合、外部機器が接続されたことを認証し、その機器が対応可能なフォーマットを判定することにより、出力すべき映像音声信号のフォーマットを決定する映像音声出力装置が実用されている(例えば、特許文献1参照)。
この装置によれば、接続機器の信号処理能力に応じた映像、音声出力が可能で、かつ、ユーザがフォーマット設定を行なう手間が軽減された映像音声出力装置を提供できる。しかし、この装置は、複数種類の音声情報をミキシングした後、再エンコードしてビットストリームを出力するものではない。
特開2005−51547号公報(段落0015)
このように従来の音声出力装置には、複数のストリームをミキシングした後、符号化して外部機器に1つのストリームを出力する際に、符号化方式が一意的に決められて、外部出力されたオーディオストリームの種類がもともとのディスクに記録されているオーディオストリームの種類と全く変わってしまうという問題点がある。
本発明の目的は、複数のストリームをミキシングした後、符号化して外部機器に1つのストリームを出力する際に、元の複数のストリームの符号化方式に応じた符号化方式を自動的に選択することができる音声出力装置及び音声出力方法を提供することである。
本発明の一態様によれば、音声出力装置は符号化されたメインオーディオストリームとサブオーディオストリームとを記録する記録媒体から再生したメインオーディオストリームとサブオーディオストリームとを1つのストリームに混合するミキシング手段と、前記ミキシング手段から出力された混合ストリームを複数の符号化方式の中から選ばれた符号化方式で符号化するエンコーダ手段と、前記メインオーディオストリームの符号化方式に基づいて前記エンコーダ手段の符号化方式を選択する選択手段と、を具備し、前記選択手段は、ストリーム切換要求に応じたタイミングで、前記メインオーディオストリームの符号化方式と同じ系列で圧縮率が高い符号化方式を選択する。
本発明の一態様によれば、音声出力方法は記録媒体からメインオーディオストリームとサブオーディオストリームを読出してデコードし、デコード後の2つのオーディオストリームを混合して1つのオーディオストリームを作り、ストリーム切換要求に応じたタイミングで、複数の符号化方式の中から前記メインオーディオストリームの符号化方式と同じ系列で圧縮率が高い符号化方式を選択し、前記1つのオーディオストリームを前記メインオーディオストリームの符号化方式に応じて前記複数の符号化方式の中から選ばれた符号化方式で再エンコードし、再エンコードされた1つのオーディオストリームを外部へ出力する。
以上説明したように本発明によれば、複数のオーディオストリームの中の所定のオーディオストリームの符号化方式に基づいて符号化方式を選択するので、外部出力されたオーディオストリームの種類が記録媒体に記録されているもともとのオーディオストリームの種類と全く変わってしまうということが防止される。
以下、図面を参照して本発明による音声出力装置及び音声出力方法の実施の形態を説明する。
第1の実施の形態
図1は本発明の第1の実施の形態に係る音声出力装置及び音声出力方法を含む動画像再生装置10の構成を示す図である。
動画像再生装置10は、情報記録媒体としてのHD DVD規格に則ったディスク1から、そこに格納されている動画像情報を読み出して再生するものである。ディスク1はディスクドライブ部101に装着される。ディスクドライブ部101は、その装着されたディスク1を回転駆動し、光ピックアップ(図示せず)を用いてディスク1に格納されている情報を読み取る。
ディスクドライブ部101で取得した情報は、データプロセッサ部102に供給され、エラー訂正処理が施された後、該データプロセッサ部102内のバッファ(図示せず)に格納される。バッファに格納された情報のうち、詳細は後述するような管理情報は、メモリ部104に記録され、再生制御やデータ管理等に利用される。バッファに格納された情報のうち、動画像情報は、分離部103に転送され、メインビデオ/メインオーディオストリーム情報、サブビデオ/サブオーディオストリーム情報、サブピクチャストリーム情報、
エフェクトオーディオストリーム情報に分離される。メインビデオストリームはメインビデオデコーダ部108、サブビデオストリームはサブビデオデコーダ部109、サブピクチャストリームはサブピクチャデコーダ部110、メインオーディオストリームはメインオーディオデコーダ部111、サブオーディオストリームはサブオーディオデコーダ部112、エフェクトオーディオストリームはエフェクトオーディオデコーダ部113にそれぞれ供給され、デコード処理が行なわれる。なお、サブピクチャとは、字幕等の画像のことである。メインオーディオストリームは最大7.1チャンネル、サブオーディオストリームは最大2チャンネル、エフェクトオーディオストリームは最大2チャンネルの情報を含む。
メインビデオデコーダ部108でデコード処理されたメインビデオストリームと、サブビデオデコーダ部109でデコード処理されたサブビデオストリームと、サブピクチャデコーダ部110でデコード処理されたサブピクチャストリームは、ビデオプロセッサ部114に供給されて重畳処理が施された後、D/A(ディジタル/アナログ)変換器115でアナログ化され、アナログビデオ出力として図示しない映像表示装置(例えばCRTや液晶ディスプレイ、プラズマディスプレイ等)に出力される。ビデオプロセッサ部114の出力はそのままHDMI Tx(High Definition Multimedia Interface Transmitter)部116を介してHDMI出力として映像表示装置にも出力される。
メインオーディオデコーダ部111でデコード処理されたメインオーディオストリームと、サブオーディオデコーダ部112でデコード処理されたサブオーディオストリームと、エフェクトオーディオデコーダ部113でデコード処理されたエフェクトオーディオストリームは、オーディオミキサ部117に供給されてミキシング処理が施された後、D/A(ディジタル/アナログ)変換器118でアナログ化され、アナログ音声出力として図示しないスピーカに出力される。
オーディオミキサ部117の出力ストリームはそのまま再エンコーダ部119に供給され、再エンコードされ、HDMI Tx部116を介してHDMI出力として音声再生装置にも出力されるとともに、DTI部120を介してディジタル音声出力として図示しない外部アンプ等にも出力される。
上記のようなディスク1に対する一連の再生動作は、制御部としてのMPU部106によって統括的に制御されている。なお、MPU部106は、キー入力部107からの操作情報を受け、ROM部105に格納されたプログラムに基づいて、各部を制御している。
次に、本実施形態に係る動画像再生装置10が取り扱うコンテンツについて説明する。
コンテンツには、標準コンテンツ(Standard Content)とアドバンスドコンテンツ(Advanced Content)の2種類のコンテンツが存在する。標準コンテンツはナビゲーションデータとディスク上のビデオオブジェクトで構成され、これはDVD−ビデオ規格第1.1版を拡張したものである。一方、アドバンスドコンテンツはプレイリスト(Playlist),マニフェスト(Manifest),マークアップ(Markup),スクリプトファイル(Script files)等のアドバンスドナビゲーション(Navigation data)と、プライマリ/セカンダリビデオセット(Primary/Secondary Video Set)等のアドバンスドデータ(Advanced data)と、アドバンスドエレメント(Advanced Element)(画像、オーディオ、テキストなど)とで構成される。アドバンスドコンテンツに関しては、少なくとも1つのプレイリストファイルとプライマリビデオセットをディスク1上に位置づける必要があり、その他のデータはディスク1上に置いても、ネットワークサーバやストレージメディアから取り込んでも良い。アドバンスドコンテンツは、標準コンテンツで実現されるオーディオとビデオの拡張に加え、より高度なインタラクティブ性(interactivity)を実現する。
プレイリストは、XMLで記述されてディスク1上に記録され、ディスク1上にアドバンスドコンテンツがある場合、動画像再生装置10はまずこのプレイリストを実行する。プレイリストは次の情報を提供する。
・オブジェクトマッピング情報(Object Mapping Information):タイトルタイムライン(Title Timeline)上にマッピングされたプレゼンテーションオブジェクトのためのタイトル内の情報
・再生シーケンス(Playback Sequence):タイトルタイムラインにより記述される、各タイトル用の再生情報
プレイリストの記述に従って最初のアプリケーションが、プライマリ/セカンダリビデオセットなどがある場合はこれらを参照しつつ、実行される。1つのアプリケーションは、マニフェスト、マークアップ(これにはコンテンツ/スタイリング/タイミング情報が含まれる)、スクリプト、アドバンスドデータで構成される。アプリケーションを構成する、最初の1つのマークアップファイル、スクリプトファイルやその他のリソースは、1つのマニフェストの中で参照する。マークアップにより、プライマリ/セカンダリビデオセットなどのアドバンスドデータ、及びアドバンスドエレメントの再生が開始される。
アドバンスドデータは、アドバンスドコンテンツ用のプレゼンテーションデータのデータタイプである。アドバンスドデータは次の4つのタイプに分類できる。
・プライマリビデオセット
・セカンダリビデオセット
・アドバンスドエレメント
・その他。
プライマリビデオセットは、プライマリビデオ用の一組のデータである。プライマリビデオセットのデータ構造は、ナビゲーションデータ(ビデオタイトルセット情報(VTSI)(詳細は後述する)、タイムマップ(TMAP)、等)とプレゼンテーションデータ(プライマリエンハンスドビデオオブジェクト(P−EVOB)等)で構成される。プライマリビデオセットは、ディスク1上に保存される。プライマリビデオセットは、その中に様々なプレゼンテーションデータを含めることができる。考えられるプレゼンテーションストリームタイプとしては、メインビデオ、メインオーディオ、サブビデオ、サブオーディオ、サブピクチャ、エフェクトオーディオがある。ここで、プライマリビデオセットは、1つのメインビデオストリーム、1つのサブビデオストリーム、8つのメインオーディオストリーム、8つのサブオーディオストリームを保持することができる。本動画像再生装置10は、プライマリビデオ及びオーディオ以外に、同時にサブビデオ及びオーディオを再生することができる。サブビデオとサブオーディオの再生中にセカンダリビデオセットのサブビデオとサブオーディオを再生することはできない。
セカンダリビデオセットは、プライマリビデオセットにビデオ/オーディオデータを追加する際に使用し、またオーディオデータだけを追加する場合にも使用する。セカンダリビデオセットは、ディスク1上に記録されるか、あるいは1つ又は複数のファイルとしてネットワークサーバやストレージメディアから取り込まれる。このファイルは、データがディスク1上に記録されており、しかもプライマリビデオセットとともに、同時に再生する必要がある場合は、再生前に一旦ファイルキャッシュに保存される。一方、セカンダリビデオセットがウェブサイト等のネットワークサーバ上にある場合は、このデータ全体を一旦ファイルキャッシュに保存するか(「ダウンローディング」)、又はこのデータの一部をストリーミングバッファに連続的に保存する(「ストリーミング」)必要があり、保存されたデータは、ネットワークサーバからデータをダウンロードする間にバッファオーバフローを起こすことなく、同時に再生される。
即ち、セカンダリビデオセットは、ネットワークストリーミングとファイルキャッシュ上のプレダウンロードされたコンテンツ用の一組のデータである。セカンダリビデオセットのデータ構造は、アドバンスドVTSの簡単化された構造であり、タイムマップ(TMAP)とプレゼンテーションデータ(セカンダリエンハンスドビデオオブジェクト(S−EVOB))で構成される。セカンダリビデオセットには、サブビデオ、サブオーディオ、コンプリメンタリオーディオ、コンプリメンタリサブタイトルを含めることができる。コンプリメンタリオーディオは、プライマリビデオセット内のメインオーディオに代わる代替オーディオストリームとして使用する。コンプリメンタリサブタイトルは、プライマリビデオセット内のサブピクチャに代わる代替サブタイトルストリームとして使用する。コンプリメンタリサブタイトルのデータフォーマットはアドバンスドサブタイトルである。
アドバンスドエレメントは、グラフィック平面、効果音、及びアドバンスドナビゲーション、プレゼンテーションエンジンで生成され、あるいはデータソースから受け取る各種タイプのファイルを作成するために使用するプレゼンテーションの材料である。使用可能なデータフォーマットは次の通りである。
・画像/アニメーション
*PNG
*JPG
*MNG
・オーディオ
*WAV
・テキスト/フォント
*UNICODEフォーマット、UTF−8又はUTF−16
*オープンフォント。
アドバンスドデータには、その他として、アドバンスドナビゲーション内のスクリプトで生成されるゲームスコア用のテキストファイルや、あるいはアドバンスドコンテンツが特定のネットワークサーバへのアクセスを開始するときに受け取るクッキーなどがある。これらのデータファイルは、アドバンスドナビゲーションの指示によりプライマリビデオ再生の際に取り込む画像ファイルなど、その種類によってはアドバンスドエレメントとして処理されるものがある。
次に、HD DVD規格に則ったディスク1に関連するファイルとディレクトリについて、図2を参照して説明する。
ルートディレクトリのすぐ下には、「HVDVD_TS」ディレクトリと「ADV_OBJ」ディレクトリとがある。
「HVDVD_TS」ディレクトリには、1つのビデオマネージャ(VMG)に関連する全ファイル、1つ又は複数の標準ビデオセット(標準VTS;Standard Video Title Set)、1つのアドバンスドVTS(プライマリビデオセット)がある。
ここで、ビデオマネージャ(VMG)に関連するファイルとしては、1つのビデオマネージャ情報(VMGI)、1つのファーストプレイプログラムチェーンメニュー用エンハンスドビデオオブジェクト(FP_PGCM_EVOB)、1つのバックアップ用ビデオマネージャ情報(VMGI_BUP)がある。1つのビデオマネージャメニュー用エンハンスドビデオオブジェクトセット(VMGM_EVOBS)のサイズが1GB(=230バイト)以上あるときは、「HVDVD_TS」ディレクトリ以下でファイル数が最大で98になるよう分割する必要がある。1つのVMGM_EVOBSのこれらのファイルについては、どのファイルも連続的に割り振ることが必要である。
また、1つのビデオタイトルセット情報(VTSI)と1つのバックアップ用ビデオタイトルセット情報(VTSI_BUP)が、それぞれ標準VTSの構成ファイルとして「HVDVD_TS」ディレクトリ以下に記録される。ビデオタイトルセットメニュー用エンハンスドビデオオブジェクトセット(VTSM_EVOBS)と、タイトル用エンハンスドビデオオブジェクトセット(VTSTT_VOBS)のサイズが1GB(=230バイト)以上あるときは、どのファイルのサイズも1GBより小さくなるように、最大で99のファイルに分割する必要がある。これらのファイルは「HVDVD_TS」ディレクトリ以下の構成ファイルである。1つのVTSM_EVOBSと1つのVTSTT_EVOBSのこれらのファイルについては、どのファイルも連続的に割り振ることが必要とされる。
また、アドバンスドビデオタイトルセット(アドバンスドVTS)は、1つのビデオタイトルセット情報(VTSI)と1つのバックアップ用ビデオタイトルセット情報(VTSI_BUP)を、それぞれ構成ファイルとする。1つのビデオタイトルセットタイムマップ情報(VTS_TMAP)と、1つのバックアップ用ビデオタイトルセットタイムマップ情報(VTS_TMAP_BUP)は、それぞれ「HVDVD_TS」ディレクトリ以下で最大99のファイルで構成することができる。タイトル用エンハンスドビデオオブジェクトセット(VTSTT_VOBS)のサイズが1GB(=230バイト)以上あるときは、どのファイルのサイズも1GBより小さくなるように、最大で99のファイルに分割する必要がある。これらのファイルは「HVDVD_TS」ディレクトリ以下の構成ファイルである。1つのVTSTT_EVOBS内のこれらのファイルについては、どのファイルも連続的に割り振ることが必要とされる。
なお、「HVDVD_TS」ディレクトリ以下のファイル名とディレクトリ名には、次の規則が適用される。
1) ディレクトリ名
DVD−ビデオの固定ディレクトリ名は「HVDVD_TS」とする。
2) ビデオマネージャ(VMG)用ファイル名
ビデオマネージャ情報の固定ファイル名は「HV000I01.IFO」とする。
FP_PGCメニュー用エンハンスドビデオオブジェクトの固定ファイル名は「HV000M01.EVO」とする。
VMGメニュー用エンハンスドビデオオブジェクトセットのファイル名は「HV000M%%.EVO」とする。
バックアップ用ビデオマネージャ情報の固定ファイル名は「HV000I01.BUP」とする。
なお、「%%」は、VMGメニュー用の各エンハンスドビデオオブジェクトセットに対して「02」から「99」まで昇順で連続的に割り当てられる。
3) 標準ビデオタイトルセット(標準VTS)用ファイル名
ビデオタイトルセットのファイル名は「HV@@@I01.IFO」とする。
VTSメニュー用エンハンスドビデオオブジェクトセットのファイル名は「HV@@@M##.EVO」とする。
タイトル用エンハンスドビデオオブジェクトセットのファイル名は「HV@@@T##.EVO」とする。
バックアップ用ビデオタイトルセット情報のファイル名は「HV@@@I01.BUP」とする。
なお、「@@@」は、ビデオタイトルセット番号のファイルに割り当てられる3つの文字で、「001」から「511」までとする。
また、「##」は、VTSメニュー用の各エンハンスドビデオオブジェクトセット又はタイトル用の各エンハンスドビデオオブジェクトセットに対して「01」から「99」まで昇順で連続的に割り当てられる。
4) アドバンスドビデオタイトルセット(アドバンスドVTS)用ファイル名
ビデオタイトルセットのファイル名は「HVA00001.VTI」とする。
タイトル用エンハンスドビデオオブジェクトセットのファイル名は「TITLE0&&.EVO」とする。
タイムマップ情報のファイル名は「TITLE0$$.MAP」とする。
バックアップ用ビデオタイトルセット情報のファイル名は「HAV00001.BUP」とする。
バックアップ用タイムマップ情報のファイル名は「TITLE0$$.BUP」とする。
なお、「&&」は、タイトル用エンハンスドビデオオブジェクトセットに対して「01」から「99」まで昇順で連続的に割り当てられる。
また、「$$」は、タイムマップ情報に対して「01」から「99」まで昇順で連続的に割り当てられる。
一方、「ADV_OBJ」ディレクトリには、プレイリストファイルがすべてこのディレクトリ下に置かれる。また、アドバンスドナビゲーション、アドバンスドエレメント、セカンダリビデオセットのファイルは、どれでもこのディレクトリ下に置くことができる。
各プレイリストファイルは、この「ADV_OBJ」ディレクトリに「PLAYLIST%%.XML」というファイル名で置くことができる。「%%」は、「00」から「99」まで昇順で連続的に割り当てられる。(ディスクをロードしたときに)最大の番号をもつプレイリストファイルが最初に処理される。
この「ADV_OBJ」ディレクトリには、サブディレクトリとして「アドバンスドコンテンツ用ディレクトリ」が置かれる。このディレクトリは、「ADV_OBJ」ディレクトリ下にのみ置くことができる。「アドバンスドコンテンツ用ディレクトリ」には、アドバンスドナビゲーション、アドバンスドエレメント、セカンダリビデオセットのファイルは、どれでも置くことができる。このディレクトリ名はd文字とd1文字で構成される。「ADV_OBJ」下のサブディレクトリの総数(「ADV_OBJ」ディレクトリを除く)は512未満とする。ディレクトリ階層の深さは8又はそれ以下とする。
「ADV_OBJ」ディレクトリ以下のアドバンスドコンテンツ用ファイルの総数は512×2047に制限され、各ディレクトリ内にあるファイルの総数は2048未満とする。このファイル名はd文字又はd1文字で構成し、このファイル名は本体、「.」(ピリオド)、拡張子で構成される。
図3は、アドバンスドコンテンツ(Advanced Content)の構成例を説明する図である。なお、アドバンスドコンテンツは、必ずしもディスク1に記憶されている必要はなく、ネットワークサーバやストレージメディアから提供されるものであってもよい。
アドバンスドコンテンツは、プレイリストファイル、アドバンスドアプリケーション(Advanced Application)、プライマリビデオセット(Primary video set)、セカンダリビデオセット(Secondary video set)、アドバンスドサブタイトル(Advanced Subtitle)、コンフィギュレーションファイル(Configuration File)を含んで構成されている。
アドバンスドアプリケーションは、画像(Image)、エフェクトオーディオ(Effect Audio)、フォント(Font)、その他(Others)を管理するアドバンスドナビゲーション(Advanced Navigation)と、アドバンスドナビゲーションにより管理されるこれらデータからなるアドバンスドエレメント(Advanced Element)を含んで構成されている。アドバンスドナビゲーションは、マニフェストファイルズ(Manifest files)、マークアップファイルズ(Markup files)及びスクリプトファイルズ(Script files)を含んでいる。
プライマリビデオセットは、ビデオタイトルセット情報(VTSI)、タイムマップ(Time Map: TMAP)、プライマリエンハンスドビデオオブジェクト(P−EVOB)を含むプライマリオーディオビデオを含んで構成されている。
セカンダリビデオセットは、タイムマップ、セカンダリエンハンスドビデオオブジェクト(S−EVOB)を含むサブスティチュートオーディオビデオ、サブスティチュートオーディオ、セカンダリオーディオビデオを含んで構成されている。
アドバンスドサブタイトルは、画像(Image)、フォント(Font)を管理するアドバンスドナビゲーションと、アドバンスドナビゲーションにより管理されるこれらデータからなるアドバンスドエレメントを含んで構成されている。アドバンスドナビゲーションは、マニフェストファイルズ、マークアップファイルズを含んでいる。
プライマリビデオセットは、図4に示すように、ビデオタイトルセット情報(VTSI)、P−EVOBであるビデオタイトルセット用エンハンスドビデオオブジェクトセット(VTS_EVOBS)、ビデオタイトルセットタイムマップ情報(VTS_TMAP)、及びVTSIのバックアップ(VTSI_BUS)とVTS_TMAPのバックアップ(VTS_TMAP_BUS)を含んで構成されている。このVTS_TMAPは、図3に示すタイムマップ(Time Map)に相当し、アドレス及びサイズの情報を含む。図3に示すタイムマップは、VOB毎に存在する。
ビデオタイトルセット情報(VTSI)は、1つのビデオタイトル用の情報を記述するもので、この情報により各EVOBの属性情報を記述することができるようになっている。このVTSIは、図4に示すように、ビデオタイトルセット情報管理テーブル(VTSI_MAT)から始まり、その後にビデオタイトルセットエンハンスドビデオオブジェクトアトリビュートテーブル(VTS_EVOB_ATRT)とビデオタイトルセットエンハンスドビデオオブジェクト情報テーブル(VTS_EVOBIT)が続いている。ここで、各テーブルは、隣接する論理ブロックの境界にアラインされる。この境界アラインのために、各テーブルは2047バイト(00hを含み得る)までフォローアップすることができるようになっている。
上記ビデオタイトルセット情報管理テーブル(VTSI_MAT)は、VTS及びVTSIのサイズ、VTSI中の各情報のスタートアドレス、VTS中のEVOBSのアトリビュート、等が記述されたテーブルである。
上記ビデオタイトルセットエンハンスドビデオオブジェクトアトリビュートテーブル(VTS_EVOB_ATRT)は、プライマリビデオセット下の各EVOBに定義されたアトリビュート情報が記述されたテーブルである。このVTS_EVOB_ATRTは、図5に示すように、VTS_EVOB_ATRT情報(VTS_EVOB_ATRTI)から始まり、その後に各VTS_EVOB_ATRのサーチポインタ(VTS_EVOB_ATR_SRP #1〜#n)と、実際の各ビデオタイトルセットエンハンスドビデオオブジェクトアトリビュート(VTS_EVOB_ATR #1〜#n)が続いている。
図6(A)は、上記VTS_EVOB_ATRT情報(VTS_EVOB_ATRTI)の構成例を説明する図である。このテーブル内において、相対バイト位置(RBP)で最初に配置されるVTS_EVOB_ATR_Nsは、VTS_EVOB_ATRの数を記述している。次のVTSI_EVOB_ATRT_EAは、該当VTS_EVOB_ATRTの先頭アドレスからの相対ブロック番号でこのVTS_EVOB_ATRTのエンドアドレスを記述している。
また、上記VTS_EVOB_ATRサーチポインタ(VTS_EVOB_ATR_SRP)は、図6(B)に示すように、該当VTS_EVOB_ATRTの先頭アドレスからの相対ブロック番号でこのEVOBに対応するVTS_EVOB_ATRのスタートアドレスを記述している。
上記ビデオタイトルセットエンハンスドビデオオブジェクトアトリビュート(VTS_EVOB_ATR)は、プライマリビデオセット下の何れか1つ以上のEVOBのアトリビュートに対応するものである。このVTS_EVOB_ATRには、図6(C)に示すように、相対バイト位置(RBP)で最初からEVOBタイプ(EVOB_TY)、EVOBのメインビデオアトリビュート(EVOB_VM_ATR)、EVOBのサブビデオアトリビュート(EVOB_VS_ATR)、EVOBのサブビデオ用Luma値(EVOB_VS_LUMA)、EVOBのメインオーディオストリームの数(EVOB_AMST_Ns)、EVOBのメインオーディオストリームアトリビュートテーブル(EVOB_AMST_ATRT)、EVOBのオーディオストリーム用ダウンミックス係数テーブル(EVOB_DM_COEFTS)、EVOBのサブオーディオストリームの数(EVOB_ASST_Ns)、EVOBのサブオーディオストリームアトリビュートテーブル(EVOB_ASST_ATRT)、EVOBのサブピクチャストリームの数(EVOB_SPST_Ns)、EVOBのサブピクチャストリームアトリビュートテーブル(EVOB_SPST_ATRT)、EVOBのSD用サブピクチャパレット(EVOB_SDSP_PLT)、EVOBのHD用サブピクチャパレット(EVOB_HDSP_PLT)、等が配置されている。
ここで、上記EVOBのメインオーディオストリームアトリビュートテーブル(EVOB_AMST_ATRT)は、EVOBの各メインオーディオアトリビュートを記述するもので、図7(A)に示す通りである。1つのEVOB_AMST_ATRは各メインオーディオストリームのために記述され、常に、オーディオストリーム#0〜#7の8個のオーディオストリームのEVOB_AMST_ATRを記述する。メインオーディオストリームの数が8よりも少ない場合には、使用されないストリームのEVOB_AMST_ATRの全ビットが“0b”とされる。
1つのEVOB_AMST_ATRの内容は、図7(B)に示す通りである。即ち、ビット31〜26に割り当てられたオーディオ符号化モード(Audio coding mode)は、インターオペラブルVTS中のドルビィ(Dolby)AC−3のためにリザーブドとするならば“000000b”が、True HD(MLP)オーディオならば“000001b”が、MPEG−1又は拡張ビットストリーム無しのMPEG−2ならば“000010b”が、
拡張ビットストリーム付きのMPEG−2ならば“000011b”が、
インターオペラブルVTS中の1/600秒のサンプルデータを用いるリニアPCMオーディオのためにリザーブドとするならば“000100b”が、1/1200秒のサンプルデータを用いるリニアPCMオーディオであれば“000101b”が、DTS−HDであれば“000110b”が、ドルビィデジタルプラス(DD+)であれば“000111b”が記述され、その他はリザーブドとされる。
なお、特に図示及び説明はないが、セカンダリビデオセットや、アドバンスドアプリケーション、アドバンスドサブスティチュートに関しても、上記プライマリビデオセットの構成と同様の構成により記述される。
以上のように構成された音声出力装置の再エンコードについて説明する。本実施形態の再エンコーダ部119は、一種類の符号化方式に固定された従来例とは異なり、いくつかの符号化方式の中から選択可能であり、入力オーディオストリームの種類に応じて自動的に再エンコード方式を決定する。図8にデータソースの種類毎に選択される再エンコード方式を示す。本実施の形態ではサブオーディオストリーム、エフェクトオーディオストリームの方式に関わらずメインオーディオストリームの方式に応じて再エンコード方式が決定される。ただし、メインオーディオストリームの符号化方式と全く同じ方式を選ぶと、特に非圧縮方式の場合、外部アンプが適応していない場合があるので、同じ系列(ドルビー方式、DTS方式)で圧縮率が高い方式が選ばれている。例えば、メインオーディオストリームがドルビーディジタルプラス方式であれば再エンコード方式はドルビーディジタル方式が、メインオーディオストリームがTrue HD方式であれば再エンコード方式はドルビーディジタル方式が、メインオーディオストリームがDTS HD方式であれば再エンコード方式はDTS方式が、メインオーディオストリームがドルビーディジタル方式であれば再エンコード方式はドルビーディジタル方式が選ばれる。なお、メインオーディオストリームが存在しない場合は、エフェクトオーディオストリームの方式に関わらずサブオーディオストリームの方式に応じて再エンコード方式が決定される。例えば、サブオーディオストリームがドルビーディジタルプラス方式であれば再エンコード方式はドルビーディジタル方式が、サブオーディオストリームがDTS HD方式であれば再エンコード方式はDTS方式が選ばれる。
次に、再エンコード方式の決定/切替えのタイミングについて説明する。図1の動画像再生装置10のキー入力部107はキー入力の一部としてリモコンユニットからのキー入力も含む。ユーザがリモコンユニットから音声切り替え操作(オーディオ1、オーディオ2、オーディオ3を切り替える)や、日本語/英語音声切替え、同じタイトルに異なる音質の音声情報が記録されている際の音質切替え(DD+からDTSに変更)、タイトル(映画等)の切替わり時に、ナビゲーションからストリーム切替え要求が出される。このストリーム切替え要求をトリガとして図9に示す切替え処理が開始する。処理が開始すると、プライマリビデオセット内のビデオタイトルセット情報VTSI内の図7に示す6ビットのオーディオコーディングモード情報を調べる。ステップS12でメインオーディオストリームがドルビーディジタルプラス方式である(000111b)か否か判定する。イエスの場合は、ステップS20で再エンコード方式をドルビーディジタル方式に設定する。ステップS12でノーの場合は、ステップS14でメインオーディオストリームがTrue HD方式である(000001b)か否か判定する。イエスの場合は、ステップS22で再エンコード方式をドルビーディジタル方式に設定する。ステップS14でノーの場合は、ステップS16でメインオーディオストリームがドルビーディジタル方式である(000000b)か否か判定する。イエスの場合は、ステップS24で再エンコード方式をドルビーディジタル方式に設定する。ステップS16でノーの場合は、ステップS18でメインオーディオストリームがDTS HD方式である(000110b)か否か判定する。イエスの場合は、ステップS28で再エンコード方式をDTS方式に設定する。
これにより、再エンコードがメインオーディオストリームの符号化方式に近い方式で行われるので、再エンコード結果が供給される外部機器の音声情報の符号化方式の表示欄にもメインオーディオストリームの符号化方式に近い方式が表示されるので、ユーザに違和感や戸惑いを与えることがない。また、複数の再エンコード方式のいずれかがメインオーディオストリームの符号化方式に基づいて自動的に選択されるので、ユーザが外部機器の種類を考慮して選択する煩雑さを省くことができる。
変形例
メインオーディオストリームの符号化方式をビデオタイトルセット情報VTSI内のオーディオコーディングモードで判別したが、これに限らず、以下の情報を参照しても判別することができる。
(1)プライマリエンハンスドビデオオブジェクト(P−EVOB)内のエンハンスドビデオオブジェクト(EVOB)内のエンハンスドビデオオブジェクトユニット(EVOBU)内のメインオーディオパックAM_PKC内のパックヘッダ内のストリームIDとパケットヘッダ内のサブストリームIDの組み合わせもオーディオストリームのタイプを示す。
リニアPCMは、ストリームIDが10111101bで、サブストリームIDが10100***bである。*は0、1のいずれでも良いことを示す。
ドルビーディジタルプラスはストリームIDが10111101bで、サブストリームIDが11000***bである。
MPEGオーディオはストリームIDが11000***bあるいは10110***b(サブストリームIDは無し)である。
True HDはストリームIDが11001101bで、サブストリームIDが10110***bである。
(2)エレメンタリストリーム内のsyncwordもオーディオストリームのタイプを示す。
なお、(1)のパックヘッダとパケットヘッダ内のIDも実施の形態の例のオーディオコーディングモードと同様にナビゲーションから与えられる。また、(1)と(2)の情報はメインオーディオデコーダ部111に入力されたストリームから自動的に検出することが可能であり、実施の形態で説明したユーザがリモコンユニットから音声切り替え操作等をすることなく、メインオーディオデコーダ部111のコーデックの変化をトリガとして図9に示した再エンコード方式切替え処理を開始する。
なお、この発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。
また、本発明は、コンピュータに所定の手段を実行させるための(あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるための)プログラムを記録したコンピュータ読取り可能な記録媒体としても実施することもできる。
また、上述の説明は個々の実施例それぞれについて行ったが、複数の実施例を適宜組み合わせてもよい。
本発明による音声再生装置及び音声再生方法の第1の実施の形態を含む動画像再生装置のブロック図。 ディスクのディレクトリ及びファイルの例を示す説明図。 アドバンスドコンテンツの構成例を説明する図。 プライマリビデオセットの構成例を説明する図。 ビデオタイトルセットエンハンスドビデオオブジェクトアトリビュートテーブル(VTS_EVOB_ATRT)の構成例を説明する図。 (A)はVTS_EVOB_ATRT情報(VTS_EVOB_ATRTI)の構成例を説明する図、(B)はVTS_EVOB_ATRサーチポインタ(VTS_EVOB_ATR_SRP)の構成例を説明する図、(C)はビデオタイトルセットエンハンスドビデオオブジェクトアトリビュート(VTS_EVOB_ATRT)の構成例を説明する図。 (A)はEVOBのメインオーディオストリームアトリビュートテーブル(EVOB_AMST_ATRT)の構成例を説明する図、(B)は1つのEVOB_AMST_ATRの内容の構成例を説明する図。 データソースであるメインオーディオストリーム、サブオーディオストリーム、エフェクトオーディオストリームの種類に対する再エンコード方式を示す図。 再エンコード方式の切替え処理を示すフローチャート。
符号の説明
10…動画像再生装置、103…分離部、108…メインビデオデコーダ部、109…サブビデオデコーダ部、110…サブピクチャデコーダ部、111…メインオーディオデコーダ部、112…サブオーディオデコーダ部、113…エフェクトオーディオデコーダ部、114…ビデオプロセッサ部、117…オーディオミキサー部、119…再エンコーダ部。

Claims (10)

  1. 符号化されたメインオーディオストリームとサブオーディオストリームとを記録する記録媒体から再生したメインオーディオストリームとサブオーディオストリームとを1つのストリームに混合するミキシング手段と、
    前記ミキシング手段から出力された混合ストリームを複数の符号化方式の中から選ばれた符号化方式で符号化するエンコーダ手段と、
    前記メインオーディオストリームの符号化方式に基づいて前記エンコーダ手段の符号化方式を選択する選択手段と、
    を具備し、
    前記選択手段は、ストリーム切換要求に応じたタイミングで、前記メインオーディオストリームの符号化方式と同じ系列で圧縮率が高い符号化方式を選択する音声出力装置。
  2. 前記メインオーディオストリームの符号化方式を判断する判断手段をさらに具備し、
    前記選択手段は前記判断手段の判断結果に基づいて前記エンコーダ手段の符号化方式を選択する請求項1に記載の音声出力装置。
  3. 前記判断手段は前記記録媒体から再生した管理情報内のオーディオ属性情報内のオーディオコーディングモード情報に基づいて符号化方式を判断する請求項2に記載の音声出力装置。
  4. 前記判断手段は前記記録媒体から再生したオーディオストリームのヘッダ内のストリーム識別情報とサブストリーム識別情報に基づいて符号化方式を判断する請求項2に記載の音声出力装置。
  5. 前記メインオーディオストリームの符号化方式はドルビーディジタルプラス方式、ツルーHD方式、ドルビーディジタル方式、DTS HD方式のいずれかであり、
    前記エンコーダ手段の符号化方式はドルビーディジタル方式、DTS方式のいずれかである請求項1に記載の音声出力装置。
  6. 記録媒体からメインオーディオストリームとサブオーディオストリームを読出してデコードし、
    デコード後の2つのオーディオストリームを混合して1つのオーディオストリームを作り、
    ストリーム切換要求に応じたタイミングで、複数の符号化方式の中から前記メインオーディオストリームの符号化方式と同じ系列で圧縮率が高い符号化方式を選択し、
    前記1つのオーディオストリームを前記メインオーディオストリームの符号化方式に応じて前記複数の符号化方式の中から選ばれた符号化方式で再エンコードし、
    再エンコードされた1つのオーディオストリームを外部へ出力する音声出力方法。
  7. 前記メインオーディオストリームの符号化方式を判断することと、
    この判断結果に基づいて前記再エンコードの符号化方式を選択することをさらに具備する請求項6に記載の音声出力方法。
  8. 前記判断することは前記記録媒体から再生した管理情報内のオーディオ属性情報内のオーディオコーディングモード情報に基づいて符号化方式を判断する請求項7に記載の音声出力方法。
  9. 前記判断することは前記記録媒体から再生したオーディオストリームのヘッダ内のストリーム識別情報とサブストリーム識別情報に基づいて符号化方式を判断する請求項7に記載の音声出力方法。
  10. 前記メインオーディオストリームの符号化方式はドルビーディジタルプラス方式、ツルーHD方式、ドルビーディジタル方式、DTS HD方式のいずれかであり、
    前記再エンコードの符号化方式はドルビーディジタル方式、DTS方式のいずれかである請求項6に記載の音声出力方法。
JP2006268268A 2006-09-29 2006-09-29 音声出力装置及び音声出力方法 Expired - Fee Related JP4846502B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006268268A JP4846502B2 (ja) 2006-09-29 2006-09-29 音声出力装置及び音声出力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006268268A JP4846502B2 (ja) 2006-09-29 2006-09-29 音声出力装置及び音声出力方法

Publications (2)

Publication Number Publication Date
JP2008090890A JP2008090890A (ja) 2008-04-17
JP4846502B2 true JP4846502B2 (ja) 2011-12-28

Family

ID=39374896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006268268A Expired - Fee Related JP4846502B2 (ja) 2006-09-29 2006-09-29 音声出力装置及び音声出力方法

Country Status (1)

Country Link
JP (1) JP4846502B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4013800B2 (ja) * 2003-03-18 2007-11-28 松下電器産業株式会社 データ作成方法及びデータ記録装置
JP2005051547A (ja) * 2003-07-29 2005-02-24 Matsushita Electric Ind Co Ltd 映像音声出力装置、映像音声受信装置、映像音声出力方法、映像音声受信方法、およびコンピュータプログラム
KR101226487B1 (ko) * 2004-12-01 2013-01-28 파나소닉 주식회사 기록매체, 재생장치, 재생방법
JP2006260611A (ja) * 2005-03-15 2006-09-28 Toshiba Corp 情報記憶媒体、情報再生装置、情報再生方法、及びネットワーク通信システム

Also Published As

Publication number Publication date
JP2008090890A (ja) 2008-04-17

Similar Documents

Publication Publication Date Title
US7792012B2 (en) Information recording medium, and data reproduction device
KR100833641B1 (ko) 정보 기억 매체, 정보 재생 장치, 정보 재생 방법 및네트워크 통신 시스템
US7680182B2 (en) Image encoding device, and image decoding device
US8306384B2 (en) Information recording medium, data sorting device, and data reproduction device
JP6625094B2 (ja) 記録媒体
JP2002152636A (ja) 自動チャプタ作成機能付き記録再生装置
CN111798880B (zh) 记录介质、再现方法以及再现装置
CN106463150B (zh) 记录介质、再现方法以及再现装置
JP2006211274A (ja) 記録媒体、この記録媒体を再生する方法並びにその再生装置及び記録媒体に映像データを記録する記録装置並びにその記録方法
JP2019075819A (ja) デコーダシステムおよびデコード方法
CN111599385B (zh) 记录介质、再现方法以及再现装置
CN111899769B (zh) 非暂时性计算机可读介质、再现装置以及再现方法
JP4846502B2 (ja) 音声出力装置及び音声出力方法
JP2007133938A (ja) オーディオミキシング出力の可否を示すフラグを持った情報記録媒体、および、その再生装置、再生方法
US20070147791A1 (en) Moving image reproducing apparatus
WO2006090664A1 (ja) 情報記録媒体、再生装置および再生方法
JP2007235185A (ja) ランダムアクセスに適した情報記録媒体、およびその記録/再生装置、記録/再生方法
JP2002152666A (ja) チャプタ作成ガイド機能付き記録再生装置
JP2006221754A (ja) 情報記憶媒体、情報記録方法、および情報再生方法
JP2006216103A (ja) 情報記憶媒体、情報記録方法、および情報再生方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110920

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111012

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141021

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

Free format text: JAPANESE INTERMEDIATE CODE: R313121

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees