JP2022156728A - 映像再生装置および映像記録媒体 - Google Patents
映像再生装置および映像記録媒体 Download PDFInfo
- Publication number
- JP2022156728A JP2022156728A JP2021060565A JP2021060565A JP2022156728A JP 2022156728 A JP2022156728 A JP 2022156728A JP 2021060565 A JP2021060565 A JP 2021060565A JP 2021060565 A JP2021060565 A JP 2021060565A JP 2022156728 A JP2022156728 A JP 2022156728A
- Authority
- JP
- Japan
- Prior art keywords
- slice
- data
- video
- playback
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
【課題】放送ストリームの特殊再生が行われている期間における、映像シーンの把握が困難である状況の発生を抑制する。【解決手段】映像シーンを構成する複数のスライスセグメントは、最重要スライスセグメントを含む。最重要スライスセグメントは、複数のスライスセグメントのうち、重要度が最も高いスライスセグメントである。映像再生装置100が放送ストリームの特殊再生を行っている期間において、当該映像再生装置100は、複数のスライスセグメントのうち、最重要スライスセグメント以外のスライスセグメントより当該最重要スライスセグメントを優先して再生する。【選択図】図33
Description
本開示は、映像再生装置および映像記録媒体に関する。
近年、映像圧縮技術、放送波の変調技術等の進歩に伴い、各国で新しいテレビ放送方式の導入が検討されている。以下においては、新しいテレビ放送方式を、「新放送方式」ともいう。新放送方式によって、映像の伝送効率が向上する。このため、これまでと同じ電波帯域を用いて、より高品質な映像を放送することが可能になる。また、これまでと同じ品質の映像を、より狭い電波帯域で放送することも可能である。新放送方式の導入に伴い、受信機とネットワークとの連携が検討されている。また、受信機に蓄積されて動作する、アプリケーション、コンテンツなども検討されている。
テレビ放送を録画するための録画方式は、通常のテレビ放送方式と密接に関係している。新放送方式が採用された場合には、当該新放送方式の番組を、そのまま録画することはできない。そのため、テレビ放送方式が変更される際には、録画方式も新放送方式に対応した方式に変更する必要がある。
特に、可換型記録メディアを使用する場合には、他の再生装置との互換性も含めて考慮する必要がある。可換型記録メディアは、例えば、DVD(登録商標:Digital Versatile Disc)、ブルーレイディスク(登録商標:BLU-RAY DISC)などである。
現在採用されている録画方式では、新放送方式の番組を、そのまま記録することは困難である。このため、新放送方式に対応した録画方式が必要となっている。
例えば、特許文献1には、BDAV方式を用いたテレビ放送の記録方式、大容量の記録データを分割記録する方法、および、大容量の記録データにアクセスする方法が記載されている。また、特許文献1には、圧縮された映像データおよび音声データを、MPEG2TSに格納して記録する方法が記載されている。また、特許文献1には、MPEG2TSの形式で送信されたテレビ放送を受信して、MPEG2TSの形式で記録する方法が記載されている。
新放送方式に対応した録画方式によりディスク等の映像記録媒体に記録された放送ストリームに対し、早送り再生または巻き戻し再生である特殊再生が行われる際には、ユーザーが、当該放送ストリームに対応する映像シーンを把握しやすいことが望まれる。
放送ストリームの特殊再生が行われる際には、一般的に、当該放送ストリームに対応する映像シーンを構成する複数のスライスセグメントが、規定の順番で順次再生される。すなわち、放送ストリームの特殊再生が行われている期間において、複数のスライスセグメントの各々は、同じ確率で再生される。映像シーンの内容によっては、複数のスライスセグメントの各々の重要度が異なる場合がある。この場合、複数のスライスセグメントの各々が同じ確率で再生されると、放送ストリームの特殊再生が行われている期間における、映像シーンの把握が困難である状況が発生するという問題がある。
本開示は、このような問題を解決するためになされたものであり、放送ストリームの特殊再生が行われている期間における、映像シーンの把握が困難である状況の発生を抑制することが可能な映像再生装置等を提供することを目的とする。
上記目的を達成するために、本開示の一態様に係る映像再生装置は、映像ストリームを含む放送ストリームを含む記録データの当該放送ストリームの特殊再生を行う。前記特殊再生は、早送り再生または巻き戻し再生であり、前記記録データは、Iピクチャを有する前記映像ストリームと、前記Iピクチャの開始位置を示す情報と、前記Iピクチャを構成する複数のスライスセグメントの開始位置を示す情報と、前記放送ストリームの再生により表現される映像シーンを構成する前記複数のスライスセグメントの各々の意味的な重要度を示すスライス重要度情報とを含み、前記複数のスライスセグメントは、最重要スライスセグメントを含み、前記最重要スライスセグメントは、前記複数のスライスセグメントのうち、前記重要度が最も高いスライスセグメントであり、前記映像再生装置が前記放送ストリームの前記特殊再生を行っている期間である特殊再生期間において、当該映像再生装置は、前記スライス重要度情報に基づいて、前記複数のスライスセグメントのうち、前記最重要スライスセグメント以外のスライスセグメントより当該最重要スライスセグメントを優先して再生する。
本開示によれば、映像シーンを構成する複数のスライスセグメントは、最重要スライスセグメントを含む。前記最重要スライスセグメントは、前記複数のスライスセグメントのうち、重要度が最も高いスライスセグメントである。映像再生装置が放送ストリームの特殊再生を行っている期間において、当該映像再生装置は、前記複数のスライスセグメントのうち、前記最重要スライスセグメント以外のスライスセグメントより当該最重要スライスセグメントを優先して再生する。
これにより、放送ストリームの特殊再生が行われている期間における、映像シーンの把握が困難である状況の発生を抑制することができる。
テレビ放送の楽しみ方の1つとして、テレビ放送の番組を録画して、後日、再生して視聴することは、従来から行われてきた。番組の録画は、言い換えれば、番組の記録である。録画の楽しみ方は、大きく分けて2種類ある。1つ目の録画の楽しみ方は、「タイムシフト」と呼ばれるものである。タイムシフトは、放送が行われている時間に番組を視聴することができない場合に、番組を録画しておき、後で番組を再生するものである。2つ目の録画の楽しみ方は、「アーカイブ」と呼ばれるものである。アーカイブは、番組を録画して、保管しておくものである。そのため、録画した番組を、いつでも見ることができる。
タイムシフトを利用する場合には、番組を録画した後に、短期間で当該番組の利用が終了する事が多い。一方、アーカイブを利用する場合には、番組を録画した後に、当該番組を長期間保存して利用されることが多い。
テレビ放送以外にも、利用者自身が撮影した映像を記録することも行われている。家庭用ビデオカメラなどで撮影された映像データは、光ディスク、ハードディスク等に記録されて保管される。
最近では、ネットワークなどで収集された映像が記録されることもある。また、家庭での録画以外にも、美術館、博物館、デジタル・サイネージ等においても、録画された映像が使用されている。「デジタル・サイネージ」とは、表示および通信にデジタル技術を活用して、平面ディスプレイ、プロジェクタなどによって、映像、情報等を表示する広告媒体である。
映画などの市販コンテンツとしては、コンテンツを記録した読み出し専用のDVD、ブルーレイディスクなどがある。最近では、パッケージ入りの光ディスクの他に、ネットワーク経由でコンテンツのダウンロードを行うサービスも増えている。
放送されたコンテンツを記録するフォーマットと、市販されているコンテンツの記録フォーマットとは、異なることがある。たとえば、ブルーレイディスクについては、2種類のフォーマットが規定されている。第1のフォーマットとしてのBDAVは、放送されたコンテンツの記録用フォーマットである。BDAVは、放送波をそのまま記録することができる。第2のフォーマットとしてのBDMV、AVCHD等は、市販されているコンテンツ向けのフォーマットである。BDMVは、高度な再生制御機能を持っている。また、AVCHDは、カメラ等で用いられる、HDD、メモリーカードなどに映像を記録する場合に用いられている。AVCHDは、BDMVを基にして変更が加えられている。
テレビ放送では、従来方式の4倍の解像度を持つ4K映像に対応したウルトラハイビジョン方式の導入が予定されている。また、さらに高品質な8K映像の放送も検討されている。同様に、北米地域、欧州地域等でも、現在の放送方式を拡張する形で、新しいテレビ放送方式の導入が検討されている。
地域ごとに差異はあるが、従来のテレビ放送方式は、映像圧縮方式として、MPEG2、AVC(すなわち、h.264)を採用している。また、従来のテレビ放送方式は、多重化方式としてMPEG2TSを採用していた。MPEG2TSは、放送という単一の伝送路を前提としており、映像、音声などを放送局が1つにまとめて送るために使用される。MPEG2TSでは、伝送単位として、同期マーク付きの固定長パケット方式が採用されている。そのため、録画方式でもMPEG2TSの方式が採用されることが多い。
一方、新放送方式では、映像圧縮方式として、MPEG2、AVC、HEVC(High Efficiency Video Coding)(すなわち、h.265)を取り入れる規格が多い。HEVCは、同一の画質で比べた場合には、圧縮効率がMPEG2の4倍であり、AVCの2倍である。HEVCは、高画質化、狭帯域化等を目指す新放送方式に必要な圧縮技術である。
また、新放送方式では、ネットワーク技術との整合性を重視している。そのため、新放送方式では、多重化方式として、MMT(MPEG Media Transport)の採用が検討されている。MMTは、複数の伝送路で情報を提供できる方式である。MMTでは、映像および音声を別々に伝送し、受信機が映像および音声を選択して受信できる。また、MMTは、可変長パケットを採用している。また、受信状況に応じて、再生対象の映像ストリームを変更する方式も検討されている。
上述のように、現在採用されている録画方式では、新放送方式の番組をそのまま記録することは困難である。このため、新放送方式に対応した録画方式が必要となっている。
ここで、新しく記録方式を作る場合には、いくつかのアプローチが考えられる。
第1の方法は、新放送方式の番組を、従来方式の映像に変換して記録する方法である。この場合には、記録方式の変更は必要なく、従来の再生装置との互換もとれる。しかし、高画質などの、新放送方式のメリットを受けることはできない。
第2の方法は、従来の録画方式をできるだけ踏襲して、テレビ放送の情報の中心となる映像および音声を、新放送方式に従って、変換して記録する方法である。この場合には、映像および音声に関しては、新放送方式のメリットを受けることができる。しかし、字幕、データ放送などを楽しむことはできない。
第3の方法は、新放送方式の番組データをそのまま記録する方法である。ネットワークサービスなど外部に依存する部分を除けば、新放送方式のメリットの多くを利用することができる。
実施の形態1.
図1は、実施の形態1に係る映像再生装置100の構成を示すブロック図である。本実施の形態の映像再生装置100は、番組の録画、および、番組の再生を行う機能を有する録画再生装置である。番組は、映像で表現される映像コンテンツである。なお、映像再生装置100は、番組の再生機能を有さない録画装置であってもよい。
図1は、実施の形態1に係る映像再生装置100の構成を示すブロック図である。本実施の形態の映像再生装置100は、番組の録画、および、番組の再生を行う機能を有する録画再生装置である。番組は、映像で表現される映像コンテンツである。なお、映像再生装置100は、番組の再生機能を有さない録画装置であってもよい。
映像再生装置100は、チューナー・復調部11と、多重化解除部21と、記録再生制御部41とを備える。
また、映像再生装置100は、デコーダーとしての、映像デコード部32と、音声デコード部31と、字幕デコード・レンダリング部33と、データ放送・EPG処理部34とをさらに備える。
また、映像再生装置100は、内蔵記録装置51と、光ディスクドライブ52とをさらに備える。
また、映像再生装置100は、外部入力部12と、ネットワーク部13とをさらに備える。外部入力部12およびネットワーク部13は、外部から、信号を受信する機能を有している。また、チューナー・復調部11も、外部から、信号を受信する機能を有している。
<映像再生装置100の動作>
チューナー・復調部11は、放送波Baを受信する。そして、チューナー・復調部11は、放送波Baを復調する。外部入力部12は、外部装置Eiからデータを受信する。外部装置Eiは、例えば、ビデオカメラなどの撮影装置である。なお、映像再生装置100が、外部から受信する「データ」は、映像データ、音声データ、字幕データ、データ放送のデータ、制御情報等である。
チューナー・復調部11は、放送波Baを受信する。そして、チューナー・復調部11は、放送波Baを復調する。外部入力部12は、外部装置Eiからデータを受信する。外部装置Eiは、例えば、ビデオカメラなどの撮影装置である。なお、映像再生装置100が、外部から受信する「データ」は、映像データ、音声データ、字幕データ、データ放送のデータ、制御情報等である。
ネットワーク部13は、ネットワークNeからデータを受信する。ネットワークNeは、例えば、複数のコンピュータ、電子機器などが、信号、データ、情報等の送受信を行うためのネットワークである。ネットワーク部13は、例えば、コンピュータネットワーク、通信ネットワーク等である。
多重化解除部21は、多重化ストリームSmの多重化を解除する。つまり、多重化解除部21は、多重化ストリームSmから、各種のデータを取り出す。
音声デコード部31は、圧縮された音声データを伸長する。音声デコード部31は、エレメンタリーストリームSeに含まれる圧縮された音声データを伸長する。
映像デコード部32は、圧縮された映像データを伸長する。映像デコード部32は、エレメンタリーストリームSeに含まれる圧縮された映像データを伸長する。
字幕デコード・レンダリング部33は、圧縮された字幕データを伸長する。字幕デコード・レンダリング部33は、エレメンタリーストリームSeに含まれる圧縮された字幕データを伸長する。
データ放送・EPG処理部34は、圧縮されたデータ放送のデータを伸長する。データ放送・EPG処理部34は、エレメンタリーストリームSeに含まれる圧縮されたデータ放送のデータを伸長する。
記録再生制御部41は、映像再生装置100内の構成要素を制御する機能を有する制御部である。記録再生制御部41は、記録用の映像データ、音声データ、制御情報などを収集する。記録再生制御部41は、収集したデータを記録用のデータフォーマットに変換する。
内蔵記録装置51は、映像再生装置100に内蔵された記録装置である。内蔵記録装置51は、例えば、ハードディスクドライブ、揮発性メモリ、不揮発性メモリ等である。
光ディスクドライブ52は、映像記録媒体である光ディスク53にデータを記録する。また、光ディスクドライブ52は、光ディスク53からデータを読み出す。光ディスク53は、例えば、ブルーレイディスク、DVDなどである。
<データを記録しない場合のデータ処理の流れ>
まず、番組を記録せずに、当該番組をテレビに表示する場合の処理の流れを説明する。当該テレビは、表示装置Ddおよび音響装置Esを含む。表示装置Ddは、映像を表示する装置である。表示装置Ddは、例えば、ディスプレイである。音響装置Esは、音声を出力する装置である。音響装置Esは、例えば、スピーカーである。ここでは、放送波を使用した処理の一例として、放送波の受信から映像および音声の出力までについて説明する。
まず、番組を記録せずに、当該番組をテレビに表示する場合の処理の流れを説明する。当該テレビは、表示装置Ddおよび音響装置Esを含む。表示装置Ddは、映像を表示する装置である。表示装置Ddは、例えば、ディスプレイである。音響装置Esは、音声を出力する装置である。音響装置Esは、例えば、スピーカーである。ここでは、放送波を使用した処理の一例として、放送波の受信から映像および音声の出力までについて説明する。
映像再生装置100が外部から受信する入力信号は、例えば、アンテナで受信された放送波Baである。また、入力信号は、例えば、ビデオカメラとしての外部装置Eiからの映像信号である。また、入力信号は、例えば、ネットワークNeからの映像データである。利用者は、リモコン(リモート・コントローラー)、操作ボタンなどを用いて、入力部を選択する。当該入力部は、チューナー・復調部11、外部入力部12またはネットワーク部13である。当該リモコンは、利用者が操作する遠隔操作機器である。
また、放送波Baが使用される場合、放送局、選局対象の番組などが設定される。また、ネットワークNeが使用される場合、データ取得先、データへのアクセス情報などが設定される。ここで、利用者が視聴したい映像サービス、利用者が記録したい映像サービスは、特定されているものとする。また、利用者が視聴したい映像サービス、利用者が記録したい映像サービスは、映像再生装置100が受信できる状態になっているとする。
アンテナで受信した放送波Baは、チューナー・復調部11に入力される。チューナー・復調部11は、放送波Baから、指定された放送局の電波を取り出す。そして、チューナー・復調部11は、規定された復調方式で、放送波Baを復調する。これにより、チューナー・復調部11は、放送波Baから多重化ストリームSmを取り出す。
多重化ストリームSmは、映像データ、音声データ、字幕データ、制御情報などが多重化されたストリームである。なお、1つの多重化ストリームSmに、複数の番組が格納されていてもよい。
「ストリーム」とは、時間の流れを持ったデータ、時間的な流れを持った形で伝送されるデータ等である。例えば、映像データを含むストリームは、映像ストリームである。音声データを含むストリームは、音声ストリームである。また、その他のストリームには、字幕ストリーム、多重化ストリーム、受信ストリーム、データストリームなどが存在する。
多重化ストリームSmは、チューナー・復調部11で取り出される。チューナー・復調部11で取り出された多重化ストリームSmは、多重化解除部21に送られる。多重化解除部21は、多重化ストリームSmから、各種のデータ、各種の制御情報などを取り出す。当該データは、例えば、番組を直接構成するデータである。当該データは、例えば、映像ストリーム、音声ストリーム、字幕ストリームなどである。当該データは、例えば、多重化ストリームSmに格納された、データ放送用のプログラム、データ等である。
多重化を解除された各種のデータは、エレメンタリーストリームSeである。当該各種のデータは、圧縮されたデータである。
映像ストリームは、圧縮された映像データである。映像デコード部32は、圧縮された映像データを伸長する。伸長された映像データは、テレビの表示装置Ddから映像として出力される。
音声ストリームは、圧縮された音声データである。音声デコード部31は、圧縮された音声データを伸長する。伸長された音声データは、テレビの音響装置Esから音声として出力される。
表示装置Ddおよび音響装置Esから映像および音声が出力される際に、映像データDi1および音声データDsに対し、バッファリングおよび同期が行われる。これによって、映像および音声の出力のタイミングにずれが生じない。映像データおよび音声データの出力のタイミングは、制御情報、システムクロック等により指定されたタイミング、または、算出されたタイミングである。
字幕ストリームは、圧縮された字幕データである。字幕デコード・レンダリング部33は、圧縮された字幕データを伸長する。字幕デコード・レンダリング部33は、伸長された字幕データを解釈する。字幕デコード・レンダリング部33は、解釈された字幕データを映像化する。映像化された字幕データは、指定されたタイミングで、映像データまたは音声データに合成される。合成された字幕データは、例えば、表示装置Ddから映像として出力される。
データ放送のストリームは、圧縮されたデータである。データ放送・EPG処理部34は、圧縮されたデータ放送のデータを伸長する。データ放送・EPG処理部34は、指定されたタイミングで、伸長された映像データと、伸長された音声データとを合成する。合成された映像データおよび音声データは、テレビなどから映像および音声として出力される。
以上のように、映像再生装置100は、受信した放送波Baを使用して、同期の取れた映像および音声として出力する。
<データの記録>
次に、映像データを記録する処理について説明する。
次に、映像データを記録する処理について説明する。
記録再生制御部41は、前述した、放送波Baの受信から映像の表示までの流れの中で、記録用の映像データ、音声データ、制御情報などを収集する。収集されたデータは、記録用のデータフォーマットに変換される。記録用のデータフォーマットに変換されたデータは、例えば、光ディスクドライブ52により光ディスク53に記録される。また、当該変換されたデータは、例えば、内蔵記録装置51に記録される。
記録再生制御部41が、映像データ、音声データ等を取り出すための位置は、様々な位置が考えられる。ここでは、説明を容易にするために、経路Ta,Tb,Tcを使用した処理について説明する。経路Taは、多重化ストリームSmを取り出すための経路である。経路Tbは、多重化が解除されたエレメンタリーストリームSeを取り出すための経路である。経路Tcは、伸長された映像データDi1を取り出すための経路である。
以下においては、経路Taおよび経路Tbに関して説明する。
≪(A-1)多重化ストリームSmの状態でのデータの記録(1)≫
多重化ストリームSmの状態でのデータの取り出し、および、光ディスク53であるブルーレイディスクへの多重化ストリームSmの記録について説明する。多重化ストリームSmは、図1の経路Taを使って取り出される。
多重化ストリームSmの状態でのデータの取り出し、および、光ディスク53であるブルーレイディスクへの多重化ストリームSmの記録について説明する。多重化ストリームSmは、図1の経路Taを使って取り出される。
例えば、日本の従来の放送方式に基づいて、チューナー・復調部11から取り出される多重化ストリームSmは、MPEG2TSの多重化ストリーム内にMPEG2形式で圧縮された映像信号が格納されたデータである。
MPEG2TSの放送用ストリームは、192バイトの固定長のパケットで表現される。また、このパケットを、受信順に結合することによって、記録フォーマット用のデータファイルを作成することができる。このようにして作成されたデータファイルは、ストリームファイルと呼ばれる。
実際に放送されているストリームには、複数の番組が多重化されている。当該複数の番組から目的の番組を取り出す過程が必要となる。ここでは、当該過程の説明を省略する。
まず、ブルーレイディスクのBDAVフォーマットに基づいた番組の取り出しについて説明する。
ブルーレイディスクのBDAVフォーマットに基づいた番組の取り出しには、ストリームファイルの他に、クリップファイル、プレイリストファイル、インフォファイルなどが必要である。クリップファイルは、ストリームファイル内のデータにアクセスするための詳細情報を記録したファイルである。プレイリストファイルは、時系列の情報を管理するためのファイルである。当該時系列の情報は、例えば、一つの番組の開始点、当該番組の終了点、再生ストリームの切り替えなどの情報である。インフォファイルは、例えば、ディスク全体の情報を管理するためのファイルである。インフォファイルは、例えば、再生可能な番組リストである。
これらの情報は、ストリーム内の管理情報、利用者が設定した予約情報、チューナー・復調部11から得られる管理情報などから作成される。上記の情報の作成に関しては、例えば、特許文献1に詳しく書かれている。
次に、日本の新放送方式に基づいた番組の取り出しについて説明する。
日本の新放送方式は、例えば、放送サービス高度化推進協会の「高度高帯域衛星デジタル放送 運用規定1.1版 NEXTVF TR-004」(2016年3月30日発行、第一部・第二編・第5章、2-31~2-40ページ、図5-1)に記載されている。
日本の新放送方式は、4K、8K等の高解像度映像に対応している。また、新放送方式は、色域および輝度域拡大に対応している。新放送方式では、映像圧縮方式として、HEVCが採用されている。また、新放送方式では、多重化方式として、MMTとTLVとを組み合わせた方式が採用されている。
MMTおよびTLVは、ネットワークで用いられているIPパケットとの整合性を考えて設計されている。TLVは、IPパケットの放送波を用いた伝送方式である。MMTは、IPパケットを用いて映像データを転送する方式、および、そのデータ形式を規定している。MMTでは、IPパケットは、可変長パケットを採用している。このため、MMTおよびTLVも可変長パケットを採用している。
図2を用いてこの方式での多重化解除手順を説明する。図2は、多重化解除手順を説明するための図である。
図2において、横軸Ha方向は、データの受信の順番を示している。横軸Ha方向には、データが受信された順番に、当該データが左から右に向かって並べられている。以下においては、縦軸に沿った方向を、「縦軸Va方向」ともいう。縦軸Va方向は、データの処理の流れを示している。縦軸Va方向には、パケット解析によるデータの取り出しの順番が示されている。縦軸Va1の範囲では、多重化ストリームSmの多重化を解除している。縦軸Va2の範囲では、エレメンタリーストリームSeの多重化を解除している。
TLVパケットのデータは、放送波Baの復調によって得られる。TLVパケットは、放送に関する情報を含んでいる。放送に関する情報は、例えば、放送の識別子、チャンネル、放送局名、IPアドレス、ポート番号、使用対象の電波の情報などである。「使用対象の電波」とは、地上波、BS放送、CS放送などである。「使用対象の電波の情報」とは、放送の形態、変調方式、周波数、偏向方向、旋回方向などである。
ペイロードは、データ伝送におけるデータ部分を指す。つまり、ペイロードは、伝送されるデータ全体のうち、伝送処理のための管理情報を除いたものに相当する。管理情報は、例えば、ヘッダ、メタデータなどである。
また、TLV(Type-Length-Value)は、情報の種類、長さおよび値をまとめて表現するフォーマットである。UDP(User Datagram Protocol)は、IPの上位プロトコルのトランスポート層で動作するプロトコルである。UDPは、ネットワーク層のIPとセッション層以上のプロトコルの橋渡しをするかたちで動作する。MMTP(登録商標)は、マルチメディア多重化伝送プロトコルである。
チューナー・復調部11は、放送局の情報、IPアドレスの情報、ポート番号の情報等をTLVパケットから取り出す。チューナー・復調部11は、IPアドレスの情報を用いて、必要なIPパケットを取り出す。次に、チューナー・復調部11は、ポート番号の情報を用いてUDPパケットを取り出す。
この時点で、チューナー・復調部11は、放送局から送られてきた放送波Baの多重化を解除している。そして、チューナー・復調部11は、UDPパケットのデータを取り出している。チューナー・復調部11は、UDPパケットからUDPヘッダを取り除く。そして、チューナー・復調部11は、UDPパケットからUDPペイロードを取り出す。これによって、チューナー・復調部11は、UDPパケットからMMTPパケットを取り出すことができる。
日本の新しい放送規格では、1つのMMTPパケットは、1つのUDP/IPパケットに格納されている。さらに、1つのUDP/IPパケットは、1つのTLVパケットに格納されている。そのため、制御用データを分離した後のMMTPを伝送しているパケットにおけるMMTPパケットは、TLVパケットから単純にTLVヘッダ、IPヘッダおよびUDPヘッダを取り除くことによって取り出される。
MMTPパケットとして取り出された時点で、放送局から送られてきた放送波Baの多重化は解除されている。しかし、放送波Baは、複数の番組をまとめた一連のMMTPパケットとして多重化されていることもある。その場合には、目的の番組だけを取り出すために、まず、制御情報を取り出して、その制御情報の記載に従って、MMTPパケットを選択して取り出す。
MMTPパケットとして送られてくる制御信号の1つにPLT(Package List Table)がある。全ての情報が放送波で送信されてくる場合には、PLTの中の「MMT_general_location_info」によって指定された「packet_id」を参照する。この「packet_id」を用いて、MMTPパケットをフィルタリングする。これによって、目的とする番組の管理情報を含むMMTPパケットを選択することができる。「目的とする番組」とは、視聴する予定の番組である。
ネットワークから番組の管理情報を取得する場合には、「MMT_general_location_info」に記載されているIPアドレスおよびポート番号が指定される。また、「MMT_general_location_info」によって、URLにより表現される、番組の取得先が指定される。
次に、選択されたMMTPパケットからMPT(MMT_Package_Table)を含むデータを取り出す。MPTには、目的とする番組を構成する映像、音声、字幕などのアセットの組合せおよび取得先が記述されている。それぞれのアセットの取得先は、「MMT_general_location_info」によって、「packet_id」、ネットワーク情報等で示されている。ここで、ネットワーク情報は、IPアドレス、ポート番号、URL等である。
このようにして、PLTで示された制御データと、MPTで示された番組を構成するアセットとを、例えば、「packet_id」でフィルタリングする。これよって、目的とする番組のMMTPパケットを取り出すことができる。
ここで、TLVパケットから、MMTPパケット、MMTPペイロード等を取りだす過程において、1つのパケットに着目する。この場合、パケットヘッダは、取り除かれる。しかし、パケット内のデータは変化しない。ところが、実際には、制御情報と各段階でのパケットヘッダの内容とから、パケットの取捨選択および分類が行われている。
[標準フォーマットを用いないで記録する場合]
番組を記録する方法として、例えば、受信した放送のパケットを、そのまま記録する方法を説明する。
番組を記録する方法として、例えば、受信した放送のパケットを、そのまま記録する方法を説明する。
図4は、複数のTLVパケットを結合して記録した状況を示す模式図である。
図4に示す例では、TLVパケットの時点で、放送局から送られてきた多重化ストリームSmの多重化は解除されている。番組のTLVパケットは、そのまま結合されている。結合されたTLVパケットは、ファイルを構成している。
図4は、TLVパケットTP-0,TP-1,TP-2,TP-3を示している。例えば、「TLVパケットTP-0」の「-0」などは、TLVパケットTPの受信の順番を表わしている。例えば、TLVパケットTP-0は、最初に受信したTLVパケットTPである。すなわち、図4の横軸Haは、TLVパケットTPの受信の順番を表わしている。
最初に受信したTLVパケットTP-0の後ろには、TLVパケットTP-0の後に受信したTLVパケットTP-1,TP-2,TP-3が結合している。そして、結合されたTLVパケットTP-0,TP-1,TP-2,TP-3は記録される。TLVパケットTPは、可変長パケットを採用している。
データをパケット単位で受信するため、受信時点で、パケットの先頭は明確である。しかし、複数のパケットを結合して、1つのファイルを作成する場合には、複数のパケットの先頭位置を判別する必要がある。
第1の方法は、パケットを記録する時点で、当該パケットの先頭位置のリストを、管理用ファイルAfとして作成する方法である。
これは、パケットを記録する時点では、当該パケットのファイル内での先頭位置が判明するためである。この場合には、パケット番号などと関連付けてパケットの先頭位置のリストを作成しても良い。
第2の方法は、ファイルの先頭からデータを読み込み、先頭のデータHmが存在する場合には、データHmが存在する位置を、TLVパケットTPの先頭と判断する。そして、TLVパケットTPが結合したデータを読み込む。
TLVパケットTPの先頭を識別するために、TLVパケットTPの最初の1バイトには、固定値「0x7F」が格納されている。そして、当該最初の1バイトである先頭バイトの後ろには、パケット種別を表す1バイトのデータが格納されている。そして、当該1バイトのデータの後ろには、データ長を示す2バイトのデータが格納されている。
ここで、TLVパケットTPの先頭のデータHmは、固定値「0x7F」である。
先頭のデータHmである固定値「0x7F」が読み込まれれば、直前に読み込まれたデータを、TLVパケットTPとして解釈して処理を行う。
固定値「0x7F」は、特別な値ではない。固定値「0x7F」は、データ中にも存在している。そのため、間違った位置からデータを読み込む可能性がある。この場合でも、TLVパケットTPのデータとしての矛盾の有無を確認する。また、固定長のデータを読み込んだ後に、次のデータの先頭が、毎回、固定値「0x7F」になっているか否かを確認する。これらによって、正しいデータの区切りで、パケットを読み込むことができる。
この例では、TLVパケットを記録する方法を示した。なお、UDP/IPパケットを記録する方法を採用してもよい。また、MMTPパケットを、そのまま記録する方法などを採用してもよい。
上記の説明の対象のパケットとして、TLVパケットを選んだ理由は、TLVパケットの先頭に識別用の固定バイトが用意されていて、パケットの識別が比較的に容易だからである。
他のパケットを記録する方法では、識別のためのマークが挿入されていない場合がある。そこで、識別子を独自に挿入する手法も採用できる。UDP/IPパケットの記録については、例えば、IPアドレス情報を用いて、識別のためのマークとする方法も採用できる。当該IPアドレス情報は、同じ番組中では変化しない。
≪(A-2)多重化ストリームSmの状態でのデータの記録(2)≫
MPTは、MMTPパケットに格納されて伝送される。MPTは、制御情報を含んでいる。多重化解除部21は、MPTに記載された情報に基づいて、パケットを振り分ける。MPTに記載された情報は、例えば、MMTPヘッダに含まれるパケットID情報である。これによって、多重化解除部21は、映像情報としての映像ストリーム、音声情報としての音声ストリームなどを個別に取り出すことができる。すなわち、多重化解除部21は、多重化ストリームSmの多重化を解除することができる。
MPTは、MMTPパケットに格納されて伝送される。MPTは、制御情報を含んでいる。多重化解除部21は、MPTに記載された情報に基づいて、パケットを振り分ける。MPTに記載された情報は、例えば、MMTPヘッダに含まれるパケットID情報である。これによって、多重化解除部21は、映像情報としての映像ストリーム、音声情報としての音声ストリームなどを個別に取り出すことができる。すなわち、多重化解除部21は、多重化ストリームSmの多重化を解除することができる。
MFUは、MMTPパケットに格納されている。複数のMFUが1つのMMTPパケットに格納されている場合がある。また、1つのMFUが1つのMMTPパケットに格納されている場合がある。また、1つのMFUが複数のMMTPパケットに格納されている場合がある。
MMTPに含まれる、映像データのMFU、音声データのMFU等は、アクセスユニット、または、NAL(Network Abstraction Layer)ユニットと呼ばれる処理単位になっている。以下においては、アクセスユニットを、「AU」ともいう。NALユニットは、AUをさらに細かく分割したデータである。
MFUに直接映像データを格納する場合には、MFUにAUを格納する場合とMFUにNALユニットを格納する場合とが定義されている。日本の新放送方式では、NALユニットで格納する方式を採用している。そのため、以降の説明では、MFUにNALユニットが格納されているものとして説明する。
図2では、NALユニットを直接MFUに格納した場合を示している。NALユニットには、映像データのみを含んだVCL(Video Coding Layer)-NALユニットと、映像データを含まず管理情報を格納した非VCL-NALユニットとがある。
非VCL-NALユニットは、NALヘッダを取り除くと、制御情報が得られる。
VCL-NALユニットは、NALヘッダを取り除くと、分割された映像データが取り出される。これらの分割された映像データを結合することによって、1フレーム分の圧縮された映像データが生成される。
通常、1フレーム分の管理情報および映像データを含む複数のNALユニットが、一式のデータとして扱われる。当該一式のデータは、AUと呼ばれている。多重化解除部21が処理するデータが映像データである場合、AUは、映像データを含んでいる。多重化解除部21は、ES(エレメンタリーストリーム)を再構築することができる。
映像データのAUは、基本的には、1フレーム分の映像単位である。1フレーム分の映像単位は、ピクチャを表現する単位である。映像装置では、このピクチャを時系列的に順次切り替えながら表示することで動画として表示している。ピクチャには、Iピクチャ、PピクチャおよびBピクチャが存在する。
Iピクチャは、当該Iピクチャ単独で、1枚のピクチャを再現できる。
PピクチャおよびBピクチャは、他のピクチャに依存している。そのため、PピクチャおよびBピクチャは、単独では1枚のピクチャを再現できない。PピクチャおよびBピクチャは、他のピクチャを参照することによって、ピクチャを再現できる。Pピクチャは、1枚の他のピクチャを参照する。Bピクチャは、2枚の他のピクチャを参照する。
テレビ放送、映像再生装置などでは、番組の途中から視聴できることが求められている。また、テレビ放送、映像再生装置などでは、ランダムアクセスできることが求められている。そのため、参照対象となるピクチャの範囲が広範囲であると都合が悪い。
そこで、所定の時間のデータ、または、所定のフレーム枚数のデータが、一式のデータとして扱われる。この一式のデータの中で、参照するピクチャが完結するように定められている。
この一式のデータは、GOP(Group Of Pictures)と呼ばれている。GOPは、少なくとも1つのIピクチャを含んでいる。番組の途中から視聴する際には、取得したストリームデータが映像を再現できない不完全な位置から始まっている場合でも、次のGOPの始まりからは映像を再現して表示することができる。
例えば、日本の新放送方式は、2K放送では0.5秒毎に、GOPを作成することを求めている。また、当該新放送方式は、4K放送では1秒毎に、GOPを作成することを求めている。これによって、テレビの電源がオンされた際、または、チャンネルが切り替えられた際に、1秒から2秒で、映像を表示できる。
また、映像が、画面の全体で切り替わる場合には、切り替わりの前後でGOPを分けた方が、効率が良い。例えば、圧縮率、画像再生などの効率等が向上する。映像が、画面の全体で切り替わる場合は、例えば、シーンの切り替わりである。そのため、GOP長は、固定した値ではなく、柔軟に運用される。つまり、状況に応じて、GOP長は、変更される。
また、通信、ネット配信等では、日本の新放送方式よりも長い単位のGOPが使用されることもある。
記録された映像を再生する際には、表示したいフレームを含むGOPの先頭から映像にアクセスする。これによって、スムーズなランダムアクセスが可能になる。また、早送りなどが行われる場合、GOPごとにIピクチャのみが表示される。GOPは、動画として再生できる映像データの一固まりの単位である。また、GOPは、再生が可能な位置を示す単位である。また、GOPは、ランダムアクセスが可能な位置を示す単位である。
映像再生装置は、放送波Baを受信する際には、PLT(Package List Table)を受信する。PLTは、MMTPパケットとして送られてくる制御信号である。
全ての情報が放送波Baで送られてくる場合には、PLT内の「MMT_general_location_info」で指定された「packet_id」が参照される。そして、この「packet_id」でMMTPパケットがフィルタリングされる。これによって、目的とする番組の管理情報を含むMMTPパケットを選択することができる。
ネットワークNeから番組の管理情報を取得する場合には、「MMT_general_location_info」に記載されているIPアドレスおよびポート番号によって番組の取得先が指定される。また、「MMT_general_location_info」に記載されているURLによって番組の取得先が指定される。
次に、選択したMMTPパケットの中から、MPT(MMT_Package_Table)を含むデータが選択される。MPTには、番組を構成する映像、音声、字幕などのアセットの組合せおよび取得先が記述されている。各アセットの取得先は、「MMT_general_location_info」に記載されている「packet_id」、または、ネットワーク情報に示されている。ネットワーク情報は、例えば、IPアドレス、ポート番号等である。また、ネットワーク情報は、例えば、URLである。
また、それぞれの映像、音声、字幕などの時間で同期する必要のあるアセットに関しては、アセットごとに、MPUタイムスタンプ記述子およびMPU拡張タイムスタンプ記述子が定義されている。
アセットについては、アセットが放送波Baに含まれて送られてくる場合と、ネットワークNeからアセットを取得する場合とが定められている。ここでは、説明の簡略化のため、アセットが放送波Baに含まれて送られてくる場合を一例として説明する。
日本の新放送方式では、映像データおよび音声データに関しては、MFUに直接NALユニットを格納して送出する方式が採用される。また、日本の新放送方式では、「RAP_flag」が付加されたMMTPパケットから次の「RAP_flag」が付加されたMMTPパケットの直前までが、1つのデータの集まりとして取り扱われる。そして、その1つのデータの集まりは、MPUとして取り扱われる。「RAP_flag」は、ランダムアクセス可能なデータの開始点を示す。
新放送方式では、MMTPパケットの「RAP_flag」の有無の調査によって、同一MPUに属していることを識別できる。また、新放送方式では、MMTPパケットの「MPU_sequence_number」によって、同一MPUに属していることを識別できる。この新放送方式におけるMPUを、ここでは、仮に「ストリーム伝送単位MPU」と呼ぶ。
この「ストリーム伝送単位MPU」は、ランダムアクセス可能なデータを先頭としている。このため、映像の観点から考えると、ストリーム伝送単位MPUは、GOP単位になっている。つまり、「ストリーム伝送単位MPU」は、MMTPの観点から、1GOPを構成するMMTPパケットの集まりと考えることができる。
前述のMPUタイムスタンプ記述子およびMPU拡張タイムスタンプ記述子は、この「ストリーム伝送単位MPU」に関連付けて、同期する時間の情報を与えている。
MPUタイムスタンプ記述子には、映像、音声などのMPUの中で最初に再生されるタイミングがNTP(Network Time Protocol)形式の時刻で示されている。NTPは、コンピュータに内蔵されているシステムクロックを、ネットワークを介して、他のコンピュータのシステムクロックと同期させるためのプロトコルである。すなわち、NTPは、複数のコンピュータ間において、時刻を正しく同期させるためのプロトコルである。
MPU拡張タイムスタンプ記述子には、MPUの中のAUごとに、再生されるタイミングがMPU内での相対的な時間として記述されている。MPU内での相対的な時間は、AU内での先頭からの差分、直前のAUからの差分などである。「差分」とは、2つの値の差のことである。例えば、ここでは、2つの値は時刻である。例えば、映像のAUについては、MPU拡張タイムスタンプ記述子には、MPUの中のフレームごとに、再生されるタイミングが記述されている。
これらの記述によって、映像、音声、字幕などの組合せを指定することができる。そして、映像、音声、字幕などを、時間的な同期を取りながら再生することができる。
テレビ放送では、テレビの電源を入れた後に、短時間で番組を表示するために、PLTおよびMPTは比較的に短い周期で再送されている。日本の新放送方式では、PLTおよびMPTは、100msごとに送られる。
これまで、TLVパケット、TCPパケットおよびMMTPパケットを結合したファイルを記録する方法を説明した。また、TLVパケット、UDPパケットおよびMMTPパケットを結合したファイルを記録する方法を説明した。
しかし、上記のような、パケットを結合したファイルを記録する方法では、再生時刻の情報、ランダムアクセス可能な位置を示す情報などが、ファイル内の各所に分散して記録される。これは、情報へのアクセスにとっては、適していない。また、同じ情報が何度も記録されるため冗長である。
放送では、どの時点から番組の受信を開始しても、短時間で情報をそろえて、表示を開始する必要がある。そのため、情報がファイルに分散して記録されることは、不適切である。このため、ストリーム中の各所に分散して情報を持たせている。また、放送では、記録およびランダムアクセスを考慮する必要がない。
記録した番組を視聴する際には、頭出し、シーンの検索、編集による映像間の接続などが行われる。そのためランダムアクセスが必要となる。そこで、ランダムアクセスに必要な情報が、情報の記録時または情報の記録後に、独自に作成される。
図5、図6および図7を用いて、ランダムアクセスのためのデータ生成について説明する。
ここでは、MMTPパケットが結合したファイルとして、映像、音声などを含む映像データを作成する例を説明する。なお、TLVまたはUDP/IPパケットを使用して映像データを作成する場合も同様である。
図5は、パケットの選択、および、時間の同期を説明するための概念図である。四角で表わしたものが、MMTPパケットである。
図5において、横軸Ha方向は、データの受信の順番を示している。つまり、横軸Ha方向には、データが受信された順番に、当該データが左から右に向かって並べられている。
映像のMMTPパケットにおいて、「R」を示すパケットは、「RAP_flag」が設定されている。また、「R」を示すパケットは、GOPの先頭を含んでいる。
図5において、MPTから引き出されている矢印は、当該MPTのMPUタイムスタンプ記述子に基づいて再生時刻を決めるためのMPUが、どのMPUであるかを表している。
例えば、最初に現れるMPT-0は、映像アセットとして、「packet_ID」を指定する。図5では、一例として、MPT-0は、MPU-v0およびMPU-v1の再生タイムスタンプを指定している。MPUは、複数のMMTPパケットで構成されている。
また、MPT-0は、音声アセットとして「packet_ID」を指定する。図5では、一例として、MPT-0は、MPU-a0およびMPU-a1の再生タイムスタンプを指定している。なお、音声のMPUについては、1つのMMTPパケットに1つの音声のMPUが使用されるとは限らない。また、音声のMPUは、映像のMPUと同頻度で出現するとも限らない。図5では、一例として、1つのMMTPパケットに1つの音声のMPUが使用されるとしている。また、図5では、映像のMPUの出現頻度と音声のMPUの出現頻度とを同程度として描画している。
図5では、一例として、音声、映像および制御情報である3つのデータの流れが示される。実際には、映像再生装置100は、1つのデータの流れにおいて音声、映像、制御情報等が混在した状態で、音声、映像、制御情報等を受信している。
このような異なる種類の複数の情報が、一つのデータに混在している状態を「多重化された状態」という。多重化された状態から、「packet_ID」、各種のフラグ、各種の識別子などを用いて、目的とするデータの流れであるストリームを抽出して、分離することができる。「packet_ID」、各種のフラグ、各種の識別子などは、MMTPパケットに付加されている。多重化されたデータから目的のデータを取り出すことを多重化の解除という。
対象とする番組の多重化されたデータから、MPTを含むMMTPパケットが抽出される。そして、MMTPパケットからMPTが取り出される。MPTには、番組を構成する各種アセットのリストおよび各種アセットの取得方法が格納されている。
これにより、例えば、映像の種類と、映像のデータを格納している「packet_ID」とを知ることができる。また、音声の種類と、音声のデータを格納している「packet_ID」とを知ることができる。これらの「packet_ID」で、受信したMMTPパケットを選択し、分類する。これらによって、番組を構成する映像データ、音声データ等を個別に取出すことができる。つまり、多重化を解除できる。
コンテナフォーマットは、異なるデータを一組にまとめて多重化して取り扱いやすくすることを目的として使用される。コンテナフォーマットは、例えば、MMT、MPEG2TSなどである。
図5では、受信したストリームデータを、MPTストリーム、映像ストリームおよび音声ストリームとしての3つのストリームに分けている。
また、コンテナフォーマットは、タイミングを合わせてこれらのストリームデータを再生することを目的として使用される。つまり、コンテナフォーマットは、これらのストリームデータを同期して再生することを目的として使用される。
図5では、MPT-0の受信により、この番組を構成する映像、音声などのアセット情報を得ることができる。また、これらのアセットごとにタイムスタンプ情報が記載されている。タイムスタンプ情報は、映像の表示、音声の再生などのタイミングを示す情報である。タイムスタンプ情報は、MPT内に記載されている。タイムスタンプ情報は、アセットごとの「ストリーム伝送単位MPU」の番号に対しての再生時刻である。
例えば、映像に対しては、MPT-0に、MPU-v0の最初のフレームの再生時刻およびMPU-v1の最初のフレームの再生時刻が記載されている。また、MPT-1に、MPU-v1およびMPU-v2の各々の最初のフレームの再生時刻が記載されている。
音声に対しても、同様に、MPT-0に、MPU-a0の再生時刻およびMPU-a1の再生時刻が記載されている。また、MPT-1に、MPU-a1再生時刻およびMPU-a2の再生時刻が記載されている。
ここでは、説明のために、アセットごとに「ストリーム伝送単位MPU」の2つ分のタイムスタンプを持っているものとして説明した。しかし、実際には、さらに多くのタイムスタンプを持たせることもできる。
このようにして、MPUによって「ストリーム伝送単位MPU」の再生時刻を指定することができる。そのため、映像と音声とを同期して再生することができる。ここでは説明しなかったが、字幕に関しても同様である。
これらの情報を記録する処理について、図6を用いて説明する。図6は、MMTP方式でのMPUタイムスタンプ記述子を用いた同期方式を説明するための図である。図6には、アセットテーブル、タイムテーブルおよびデータファイルが記載されている。データファイルの上側は、データの先頭である。
データファイルには、番組を構成するMMTPパケットが順次記録される。単純に、MMTPパケットを受信順に記録した場合には、映像データ、音声データ、制御情報等が混在した状態で記録される。ここでは、説明のために「ストリーム伝送単位MPU」ごとにまとめた形で記載している。
例えば、図6の「MPT-0」は、MPTである。「MPT」には、受け取られた順番が付されている。「MPT-0」の順番は、「0」であるため、「MPT-0」は、最初に受け取られたことを示している。
例えば、「MPU-v0」は、ビデオストリームとして選択されたMMTPパケットである。MMTPパケットについては、複数のMMTPパケットで構成されるMPUとして扱われる。「MPU」には、受け取られた順番が付されている。「MPU-v0」の順番は、「0」であるため、「MPU-v0」は、最初に受け取られたことを示している。
例えば、「MPU-a0」は、音声ストリームとして選択されたMMTPパケットである。音声のMPUについては、1つのMMTPパケットに1つの音声のMPUが使用されるとは限らない。また、音声のMPUは、映像のMPUと同頻度で出現するとも限らない。しかし、説明を簡単にするため、音声のMPUが映像のMPUと同じ頻度で発生するとしている。また、1つのMMTPパケットに1つの音声のMPUが使用されるとしている。
データファイルにおいて、「R」を示すパケットは、「RAP_flag」が設定されている。また、「R」を示すパケットは、GOPの先頭を含んでいる。そのため、このパケットからデータを読み始めることによって、効率よく映像を再生できる。
また、GOPの先頭を含むパケットからデータを読み始めることによって、不完全なデータを破棄することが低減される。映像データは、GOPを構成している。このため、仮に、先頭のIピクチャ部分のデータを取り損ねると後続の数十枚のピクチャは映像として再現できない。GOPの先頭のデータを取り損ねた場合には、読み取ったデータを破棄しながら、次のGOPの先頭が来るのを待つ必要がある。そこで、GOPの先頭を含むパケットからデータを読み始めることによって、データの破棄を低減することができる。このようなデータの破棄は、頭出し、ランダムアクセス等が行われる際に、表示の遅延を発生せる原因となる。このため、データの破棄の低減によって、スムーズな再生が可能になる。
前述の通り、このように記録したデータファイルは、ランダムアクセスを行うには適していない。
第1の理由は、映像データは可変長データであるという理由である。このため、目的とする映像を再生するためのデータがどこに存在するのかを特定することができない。第2の理由は、「RAP_flag」が設定されているパケットを直接呼び出すことができないという理由である。
そこで、ランダムアクセス用の検索テーブルを用意する。
図6のアセットテーブルには、「packet_id」を格納しておく。「packet_id」を用いて、データファイル内のMMTPパケットから必要なアセットを取りだすことができる。
タイムテーブルは、「RAP_flag」を含むパケットのファイル内での記録位置を格納する。また、タイムテーブルは、このパケットを含む「ストリーム伝送単位MPU」の指定された再生時間を格納する。タイムテーブルでは、これらの情報が再生時間の時系列順に並べられる。
アセットテーブルおよびタイムテーブルの内容は、例えば、MPTに記載されている情報と映像再生装置100に記録される際の情報とから作成することができる。
時刻を決めて再生を行う場合について説明する。
例えば、図6において、時刻「0:0:1.00」からの映像を表示する場合には、まず、タイムテーブルの時刻が検索される。そして、時刻が一致する欄からファイル上の位置である「25000000」が読み出される。
そこで、データファイルの位置「25000000」から、データが読み込まれる。そして、データの再生処理が行われる。これによって、指定された位置から、データを再生することができる。
データファイルは、映像データ、音声データ、その他のデータ等がパケット単位で混在した状態である。しかし、アセットテーブルおよびMPTを参照して、パケットの分類を行うことによって、映像データ、音声データ等を分離して再生することが可能である。
再生を開始したい時刻と同一の時刻が、タイムテーブルに無い場合もある。この場合には、タイムテーブルに記載されている時刻から、再生を開始したい時刻に近いものを選び、そこからデータを再生する。
例えは、再生開始時刻として「0:0:1.70」が指定された場合には、タイムテーブルに記載されている「0:0:1.50」および「0:0:2.00」のうち、指定された時刻に近い「0:0:1.50」を選ぶ。そして、データファイル上の位置「33000000」からデータを再生する。
データファイル上の位置は、例えば、ファイルの先頭からのバイト単位での位置である。また、データファイル上の位置は、例えば、ブロック単位での位置である。また、データファイル上の位置は、例えば、セクタ単位での位置である。
映像再生装置100が、特殊再生を行う場合について説明する。特殊再生は、例えば、早送り再生または巻き戻し再生である。例えば、早送り再生を行う場合には、タイムテーブルを順に読み出し、指定された位置からファイルを読み出す。そして、1フレーム分のデータを再生した時点で、次の時刻の位置に移る。これによって、データを早送り再生できる。
図7は、タイムテーブルを作成する手順を示すフローチャートである。
日本の新放送方式では、MPTは100msごとに再送される。1GOPが0.5秒であれば、その間にMPTを5回受信する。1GOPは、一つの「ストリーム伝送単位MPU」である。
また、1つのMPTの1つのアセットにタイムスタンプを15個格納することが許されている。つまり、タイムスタンプは重複して送出されている。
ステップS7001において、ストリームデータを受信する際に、チューナー・復調部11が、MMTPパケットを取り出す。そして、MMTPパケットがMPTを含む場合には、タイムスタンプ処理が実施される。
ステップS7002において、MMTPパケットからMPTが取り出される。そして、アセットごとの「ストリーム伝送単位MPU」のシーケンス番号とタイムスタンプ情報との組合せが取り出される。
ステップS7003において、タイムスタンプ情報の重複が取り除かれる。前述のように、タイムスタンプ情報は重複して送出されているためである。この時点で、「ストリーム伝送単位MPU」のシーケンス番号と再生時刻を示すタイムスタンプのリストとが得られる。
このフローチャートには含まれていないが、映像データ、音声データ等を含むMMTPパケットは、順次、データファイルとして、内蔵記録装置51または光ディスク53に記録される。そのため、データファイル上の位置は記録時に判明する。
ステップS7004において、「RAP_flag」が設定されているMMTPパケットを記録する際に、記録再生制御部41が、このパケットのファイル上での位置と、このMMTPパケットが属する「ストリーム伝送単位MPU」のシーケンス番号とを取り出す。記録再生制御部41が、タイムスタンプのリストの中で、同じ「ストリーム伝送単位MPU」のシーケンス番号を持つタイムスタンプ情報に、ファイル上に記録した位置の情報を追加する。
ステップS7005において、記録再生制御部41が、これらの処理が終了したか否かを確認する。処理が終了していない場合(S7005:no)、ステップS7001に進む。処理が終了した場合(S7005:yes)、ステップS7006に進む。
ステップS7006において、記録再生制御部41は、作成したデータを、内蔵記録装置51または光ディスク53に書き込む。
このようにして、タイムテーブルを作成することができる。
ここでは、GOPごとに設定されているMPUタイムスタンプ記述子のタイムスタンプ情報を使って、ランダムアクセスを実現している。GOPは、「ストリーム伝送単位MPU」である。そのため、データの再生を開始できる位置は、GOP単位となる。つまり、0.5秒、1秒などの単位でしか再生位置を指定できない。例えば、時間指定による頭出し、早送り再生、巻き戻し再生等が行われる場合には、GOP単位の精度で十分である。
しかし、内蔵記録装置51、光ディスク53などにデータが記録された後に、編集などを行う場合、GOP単位での位置指定では不十分である。例えば、同一番組の別の位置どうしを組み合わせて連続して再生する場合では、このような組み合せによって、お気に入りシーン集などを作成することができる。
そこで、MPT内のMPU拡張タイムスタンプ記述子を利用する。
図8は、フレーム単位の時刻で検索できるタイムテーブルを示す図である。
図8に示したタイムテーブルは、通常のタイムテーブルを拡張して、フレーム単位の時刻で検索できるようにしたタイムテーブルである。図8に示すタイムテーブルは、再生時刻、ファイル上のデータの位置およびAU番号の情報を持つ。
AU番号は、同一の「ストリーム伝送単位MPU」に属するデータの中の何番目のAUであるかを示す。デコード対象のデータが映像データである場合には、AUはピクチャに相当する。しかし、デコードの効率のために、GOP内でのAUの並びの順は、ピクチャの表示順とは必ずしも一致していない。
このタイムテーブルでは、再生時刻の順番でAU番号は並べられている。このため、AU番号は、昇順または降順に並んでいない。
MPU拡張タイムスタンプ記述子には、各「ストリーム伝送単位MPU」内のAUに対して、最初に表示されるAUからの差分で再生時刻が与えられている。また、MPU拡張タイムスタンプ記述子には、各「ストリーム伝送単位MPU」内のAUに対して、再生時刻の間隔が与えられている。
そこで、MPUタイムスタンプ記述子の再生時刻と、MPU拡張タイムスタンプ記述子の差分時刻とから各AUの再生時刻を算出することが出来る。また、MPUタイムスタンプ記述子の再生時刻と、MPU拡張タイムスタンプ記述子の再生時刻の間隔とから各AUの再生時刻を算出することが出来る。
図8では、説明のために、再生時刻は、一例として、100分の1秒単位で記載してある。
MPU拡張タイムスタンプ記述子の中では、タイムスケール(timescale)として、1秒を分割する数を定義している。そして、各AUの再生時刻は、このタイムスケールを用いて表記する。映像で使用されるフレームレートは、毎秒60枚または毎秒24枚である。そして、1フレームの再生時刻を秒の小数単位で表記しようとすると、割り切れず、誤差が発生する。このため、タイムスケールを用いる。そこで、タイムテーブルのフレーム単位での時刻欄に、このタイムスケールを用いた値を採用することもできる。
GOPの途中からデータの再生を開始したい場合でも、デコードは必ずGOPの先頭から行う。そのため、データの読み込み開始位置は、同一の「ストリーム伝送単位MPU」内では同一となる。
このタイムテーブルを使ってデータを再生する場合の一例を説明する。
時刻「00:00:01.04」を指定して検索した場合には、この時刻に相当するピクチャは存在しない。このため、直前のピクチャとなる「00:00:01.03」のピクチャから再生を行う。
タイムテーブルを参照すると、このピクチャは、ファイル上の位置「25000000」から始まる「ストリーム伝送単位MPU」のAU番号「2」のAUである。つまり、このピクチャのAUは、3番目のAUである。
そこで、ファイル上の位置「25000000」から読み出しを開始すると共に、デコードを開始する。1番目のAUのデコードが完了して、ピクチャのデータが作成される。この後に、この作成されたピクチャを表示しない。そして、差分情報しか持たない後続のAUのデコードを行う。そして、3番目のAUのデコードが完了した後に、この3番目のAUの映像から再生を開始する。このようにして、GOPの途中から、データとしての映像の再生を行うことができる。
この例では、詳細な情報を持つタイムテーブルを1つ用いて再生するようにした。しかし、例えば、前述の早送り再生が行われる場合などでは、必ずしも効率の良い方法とはいえない。そこで、標準のタイムテーブルと詳細なタイムテーブルとの2段階で検索を行う方法を取ることもできる。
日本の新放送方式は、MPU拡張タイムスタンプ記述子は、AU間の再生間隔を指定している。その間隔は、60分の1秒または120分の1秒である。この間隔は可変である。しかし、番組内では同一のフレームレートを用いている。そのため、詳細なタイムテーブルを用いずに、計算によって各フレームの再生時刻を求めることが出来る。
この場合には、図6に示した「ストリーム伝送単位MPU」ごとのタイムテーブルを利用して検索する。そして、再生を開始したい時刻を含む「ストリーム伝送単位MPU」を特定する。そして、この再生時刻と再生を開始したい時刻との差を求める。この時刻の差とフレームレートとから、この「ストリーム伝送単位MPU」内の表示順で、何枚目のピクチャであるのかを求めることが出来る。
指定された時刻にフレームがない場合には、表示の順番で指定時刻の直前のフレーム、または指定時刻の直後のフレームとする。つまり、指定時刻の直前のフレーム、または指定時刻の直後のフレームを採用する。
前述のように、AUの並び順とピクチャの再生時刻の順番とが異なる。しかし、「ストリーム伝送単位MPU」の先頭からデコードを開始する。そして、算出された再生の順番を持つピクチャのデコードが完了する。デコードが完了したピクチャから再生を開始する。これによって、ピクチャ単位の精度での頭出しを行うことが出来る。
ここで、説明したタイムテーブルを別ファイルとして作成して録画を行った場合には、番組内容を記録するデータファイルにタイムスタンプを記録する必要はない。
MPTは、タイムスタンプ以外の制御情報を含んでいる。MPTは、例えば、アセット情報などを含んでいる。タイムスタンプは、例えば、MPUタイムスタンプ記述子またはMPU拡張タイムスタンプ記述子などである。つまり、MPTは、MPUタイムスタンプ記述子またはMPU拡張タイムスタンプ記述子以外にも、アセット情報などのタイムスタンプ以外の制御情報を含んでいる。
これらの情報は、番組の途中で変更される性格のものではない。このため、別ファイルなどで1箇所に記録しておくことで、MPTそのものは記録を省略することが出来る。例えば、図6では、アセットテーブルは、管理情報として、「Packet_id」を保持している。
MPTが単独でMMTPパケットに格納されている場合には、データファイルにMMTPパケットを記録する際に、MPTを格納したMMTPパケットを記録する必要がなくなる。
MPTが他の管理情報と一緒にMMTPパケットに格納されている場合には、MPTを除いた管理情報でMMTPパケットを再構成する。そして、再構成されたMMTPパケットを記録することが出来る。
MPUタイムスタンプ記述子またはMPU拡張タイムスタンプ記述子は、放送時には重複度の高いデータである。このため、MPUタイムスタンプ記述子またはMPU拡張タイムスタンプ記述子を省略することが出来れば、記録するデータサイズを小さくすることが可能となる。
前述では、MPTを記録する必要はないとした。しかし、MPTを、映像ストリーム、音声ストリームなどのストリームを含むMMTPパケットと一緒に記録しておいた方が便利なこともある。
例えば、多重化解除部21と、デコーダーとしての、映像デコード部32、音声デコード部31、字幕デコード・レンダリング部33およびデータ放送・EPG処理部34とが一体となったLSIを用いてデコード処理を行う場合には、MPTを含んだデータを多重化解除部21に入力することで、多重化解除、デコードおよび同期処理を一括して行うことができる。
また、フレーム単位の頭出しを行う場合にも、「ストリーム伝送単位MPU」の前または先頭にMPTがあれば、このMPTを参照して、再生を開始する前に、フレーム単位での再生時刻を求めて頭出しを行うことが出来る。MPTは、「ストリーム伝送単位MPU」の先頭付近にあってもよい。
この場合にも、テレビ局から送信されてきたMPTの全てを記録する必要はない。MPTの一部だけを記録することで処理することも出来る。
図9は、MMTP方式でのMPUタイムスタンプ記述子を用いた同期方式を説明するための図である。図9では、「ストリーム伝送単位MPU」の直前にMPTを格納している。タイムテーブルは、「ストリーム伝送単位MPU」の先頭の位置ではなく、このMPTの位置を示している。
従来のブルーレイディスクの記録方式では、これらのタイムテーブルに相当する情報としてクリップファイル内に「EP_map」を格納していた。しかし、「EP_map」は、固定長パケットとパケットごとのタイムスタンプとを持つMPEG2TSを前提とした構造になっている。そのため、「EP_map」を使用した構成ではMMTのデータに適用できない。
そこで、前述のタイムテーブルを「EP_map」の代わりに使用する。これによって、MMTのデータをブルーレイディスクに記録した際に、データアクセスを容易にすることができる。
この例では、MMTPパケットを結合して記録する説明を行った。しかし、TLVパケット、IPパケットおよびUDPパケットのそれぞれの状態で、パケットを結合して記録することもできる。また、タイムテーブルを拡張して、アセットごとに記録することも可能である。つまり、映像データ、音声データ等の読み出し開始位置を検索できるようにする。そして、MFUの羅列としてデータを結合して記録する。
[標準フォーマットを用いて記録する場合]
MMTでは、前述のように伝送フォーマットとは別に、蓄積フォーマットが規定されている。MMTの蓄積フォーマットでは、BMFF(ISO/IEC 14496-12 ISO Base Media File Format)形式をベースに、データを格納する。この場合には、データのレイアウトは、図3に示された論理構造で表現される。図3は、データの論理構造を示した図である。
MMTでは、前述のように伝送フォーマットとは別に、蓄積フォーマットが規定されている。MMTの蓄積フォーマットでは、BMFF(ISO/IEC 14496-12 ISO Base Media File Format)形式をベースに、データを格納する。この場合には、データのレイアウトは、図3に示された論理構造で表現される。図3は、データの論理構造を示した図である。
図3に示されるデータの塊は、MPUと呼ばれている。このMPUは前述の「ストリーム伝送単位MPU」とは異なるものである。以下においては、図3に示さるデータを、「番組蓄積用MPU」と呼ぶ。「番組蓄積用MPU」は、通常ファイルとして格納され、管理されている。
図3の論理構造を用いて「番組蓄積用MPU」の構造を説明する。
MPUメタデータは、ファイルの管理データ、アセット情報、各種パラメーター、ヒント情報などを含んでいる。アセット情報は、映像データと音声データとの組み合わせなどを管理する情報である。各種パラメーターは、デコーダーの動作モード等を設定するためのパラメーターである。ヒント情報は、MPUファイルに格納されたMFUからMMTPパケットを再構成するための情報である。
ムービーフラグメントメタデータは、再生時間で区切られた、映像データ、音声データなどにアクセスするための情報である。また、ムービーフラグメントメタデータは、映像データ、音声データなどを再生するための情報である。
実際の映像データおよび音声データは、MFUの羅列として格納されている。1つのムービーフラグメントメタデータとそれによって管理される一塊のMFUとは、まとめてムービーフラグメントと呼ばれている。一般的には、複数のムービーフラグメントで1つのコンテンツを構成している。ネットワークストリーミング等では、一般的には、1フラグメントは10秒から15秒で構成されている。
MPUメタデータおよびムービーフラグメントメタデータが放送波Ba等で送られてくる場合には、これらを利用してMPUを構成することができる。PLT、MPT、その他の制御情報、MFU等を取り出すための各種ヘッダ情報は、冗長になるため、記録する必要はない。
一方、日本の新放送方式では、MPUメタデータおよびムービーフラグメントメタデータは、放送時に送出されない。そのため、PLT情報、MPT情報および各種のヘッダ情報を組み合わせて、独自にMPUメタデータ等を作成する。
光ディスク53への記録にも、上記の蓄積フォーマットを使用することを考える。光ディスク53では、物理的に連続して格納されたデータを比較的高速に読み出すことが可能である。しかし、光ディスク53上の直径方向に離れた位置にあるデータを読み出す場合には、ヘッドシークを伴うため、データの読み出しに時間を要する。つまり、光ディスク53では、前後して使用される可能性の高いデータを、連続した領域または光ディスク53上の近い位置に配置した方が、効率よくデータを読み出すことが可能になる。
図3に示された論理構造そのままのデータ配置で、データを記録すると、MPUメタデータ、ムービーフラグメントメタデータおよびMFUが、物理的な配置として分散して格納される。MPUメタデータは、再生に必要なデータである。MFUは、映像データを格納している。このため、光ディスクの特性上、図3に示された論理構造のままのデータ配置は、不利なデータ配置となる。
多くのファイルシステムでは、蓄積されるデータの論理構造と物理配置とを別々に管理することができる。ブルーレイディスクで採用しているUDFも同様である。
そこで、論理構造は規格通りとして、物理配置では、MPUメタデータとムービーフラグメントメタデータとをまとめて記録する。
図3の物理配置に示したデータ構造は、光ディスク上の物理的なデータ配置として、管理情報をまとめて配置した例である。このようなデータ配置とすることで、MPUメタデータとムービーフラグメントメタデータとを一度に読み込むことが可能となる。
図3の「データ構造」は、ここでは、ファイルシステムよりも上位からみた構造を示している。例えば、論理的なデータ構造、ディレクトリ、1つのファイル内でのデータの並びなどである。一方、「データ配置」は、ファイルシステムよりも下位から見た配置を示している。「データ配置」は、例えば、物理的なデータのレイアウトなどである。「データ配置」は、ファイル名とファイル名とで結び付けられたブロック、データのつながりを示すブロック同士のリンク情報などで構成されている。ブロックは、ディスク上の物理的な位置と結びついて管理されているデータの集合である。ファイルシステムによっては、他の名称が用いられる事もある。
そして、図3の物理配置に示したデータ配置は、ヘッドシーク回数を減らす。そして、図3の物理配置に示したデータ配置は、再生を開始する際にかかる時間およびランダムアクセスの際にかかる時間を短くすることができる。
また、論理構造と物理配置とを分けて考えることはせずに、単純に管理情報のコピーを別ファイルにもたせることも考えられる。図3に示した追加クリップファイルは、そのような場合の一例である。この場合には、例えば、ランダムアクセスを容易にするための追加情報等を、ファイルに追加することも可能である。
これまで示した例では、フラグメントを用いたデータ構造の例で説明した。しかし、フラグメント単位での送出を想定しない場合には、ムービーフラグメントメタデータをもたないデータ構造での記録も可能である。
BMFFによるファイルフォーマットでは、管理情報とストリームデータとは、同一ファイルにまとめて記録されている。一方、従来のブルーレイディスクの記録方式では、管理情報とストリームデータとは、分けて管理されていた。
これは、管理情報をまとめて読み込み、再生するデータにあわせて機器を設定した後に、ストリームデータの再生を行うことが、光ディスクの機器に適しているためである。管理情報とストリーム情報とは、光ディスク上では、領域を分けて記録されている。また、光ディスクの損傷の発生を考慮して、管理情報を、光ディスク上に2重に記録して、バックアップデータとしているためでもある。このバックアップデータは、光ディスク上の離れた位置に記録されている。
BMFFにおける管理情報としての管理データは、ブルーレイディスクでは、主にクリップファイルで管理されている情報である。そこで、BMFFとして記録する際に、番組の管理データ部分をファイルシステム上の別ファイルから参照する。つまり、見かけ上、番組の管理データ部分を別のファイルとすることができる。
図10は、BMFFとしてストリームデータを光ディスク53に記録した場合の説明図である。
図10は、BMFFとしてストリームデータを光ディスク53に記録した場合の例を示す。
物理的な配置としては、管理データは、光ディスク53上の管理データ領域に記録される。ストリームデータは、光ディスク53上のストリームデータ領域に記録される。
ストリームファイルとして、このデータにアクセスする際には、ファイルシステムが管理データ部分とストリームデータ部分とを関連付けて、論理的に1つのBMFFファイルとして見えるようにする。
一方、ブルーレイディスクの管理データであるクリップファイルとして、このデータにアクセスする際には、BMFFファイルの管理データ部分のみをファイルとして見えるようにする。クリップファイルは、ブルーレイディスクの管理データである。
このような配置とすることによって、MMTの標準記録フォーマットとしてBMFF形式のファイルを作成することができる。また、ブルーレイディスクの管理方法とも整合性のあるデータ形式とすることができる。
このようにして、BMFFとして記録されたデータのヘッダ部分を、別のファイルとして参照できるようにすると、光ディスク53上でのデータ管理においても有利になる。また、管理データのバックアップデータの作成も容易になる。
例えば、PCなどで映像データを取り出す際には、BMFFファイルをコピーすれば管理情報とストリームデータとの両方を含むBMFFファイルとしてコピーできる。一方、光ディスク内の管理情報のバックアップを作成する際には、BMFFCLIPファイルからコピーを作成すれば、バックアップの必要な管理データ部分のみのデータがコピーできる。
また、管理データとストリームデータとを分けて保管している光ディスクのフォーマットに合わせて、BMFFの管理データ部分を光ディスク53の他の管理データを格納している領域に格納できる。このため、再生を準備する際のヘッドシーク量を減らすことが出来る。
≪(B)多重化が解除されたエレメンタリーストリームの状態でのデータの記録≫
前述の例では、受け取ったデータに対して、部分的に多重化を解除しながら、蓄積用フォーマットに変換する方法について説明した。受け取ったデータは、放送波Ba、外部装置Ei、ネットワークNeなどから映像再生装置が受け取ったデータである。
前述の例では、受け取ったデータに対して、部分的に多重化を解除しながら、蓄積用フォーマットに変換する方法について説明した。受け取ったデータは、放送波Ba、外部装置Ei、ネットワークNeなどから映像再生装置が受け取ったデータである。
しかし、多重化解除部21がハードウェアとして作られている場合などには、映像、音声などに分離されたES(Elementary stream)の状態でデータを取り出して、記録することができる。ESは、図1ではエレメンタリーストリームSeとして示されている。
ESは、圧縮された映像データのストリームまたは音声データのストリームである。ESは単位ごとに区切られる。ここで「単位」は、処理において意味のある単位である。この単位は、例えば、映像データの場合にはピクチャあるいはNALである。また、この単位は、例えば、音声データの場合にはブロックである。
以下において、映像記録フォーマットは、ISO BMFFを例に取って説明する。
BMFFにおいて、多重化された状態でデータを記録する方式では、時間の流れを持ったデータを管理するデータをトラックと呼ぶ。
前述の多重化が解除されていない状態で記録する方式では、トラックは1つである。これは、例えば、映像データと音声データとが多重化された状態であるため、時間の流れを持ったデータは、1つの多重化ストリームSmである。多重化ストリームSmは、MFUの羅列として表現されている。
一方、エレメンタリーストリームSeの状態では、例えば、映像データと音声データとは分離されたESストリームデータとして存在する。そのため、映像データのトラックと音声データのトラックとを個別に作成する。映像データのトラックと音声データのトラックとは、データファイル上の管理データを格納する領域に記録される。そして、映像データと音声データとは、メディアデータを格納する領域に格納される。
各トラックは、再生時刻を示している。また、各トラックは、再生時刻に対応したメディアデータを格納する領域の位置を示している。メディアデータは、映像データ、音声データなどである。
そして、映像データと音声データとは、時間的に同期を取った状態で関係付けが行われる。また、字幕なども、同様に、表示タイミングを含めて関係付けが行われる。
日本の新放送方式では、MMTPパケットのMTP内に、番組としての映像、音声、字幕などの組合せが示されている。また、MMTPパケットのMTP内に、映像、音声、字幕などの表示タイミングまたは再生タイミングが示されている。また、MMTPパケットのMTP内に、映像、音声、字幕などのデータの格納位置が示されている。
番組を構成するデータファイルなどをMMTで送る場合には、1つのファイルを1つのMPUに格納する。当該データファイルは、データ放送の部品等である。このMPUを「データ要素MPU」と呼ぶ。そして、この1つの「データ要素MPU」を分割して、MFUとしてMMTPで送付する。この場合には、MPUヘッダまたはMPUメタデータも同時に送付される。
また、映像、音声などのストリームデータでは、オーバーヘッドを回避するために、データ要素MPUを使用しない。その代わりに、AUまたはNALを直接MFUに入れてMMTPで送付する。
しかし、日本の新放送方式の時間管理では、ランダムアクセスフラグの単位でMPUを構成することになっている。時間の指定は、MPUに対して行う。このため、1つのGOPが0.5秒から1秒の単位であれば、時間指定の単位として問題はない。この場合には、MPUヘッダ、MPUメタデータ等は送付されない。このランダムアクセスフラグを区切りとした一式のMMTPパケットの集合を、前述したように、「ストリーム伝送単位MPU」と呼んでいる。
また、多重化されたデータを受信して、ファイルに記録する。このファイルに記録する際に用いられるデータ構造もMPUである。例えば、ファイルに記録する際に、番組全体で1つのMPUとする用法がある。この用法でのMPUを、ここでは、仮に「番組蓄積用MPU」と呼ぶ。また、ストリーム伝送単位MPU単位でデータを記録することもできる。この場合には、MPUのファイルの数が膨大になる。また、ストリーム伝送単位MPUを束ねてMPUに格納することもできる。このストリーム伝送単位MPUを束ねたMPUを、ここでは、仮に「番組蓄積用MPU」と呼ぶ。
日本の新放送方式の場合には、GOP単位で「ストリーム伝送単位MPU」を構成している。MPT内の「MPUタイムスタンプ記述子」によって、先頭のフレームの表示時刻が指定されている。ここでの時刻は、NTP時刻である。「拡張タイムスタンプ記述子」によって、GOP内の後続のフレームの表示時刻が指定されている。後続のフレームの表示時刻は、先頭のフレームの表示時刻からの差で示される。
多重化が解除され、エレメンタリーストリームSeが取り出された状態ではMPTが取り除かれている。そのため、MPTとその他の制御情報とを組み合わせて、トラックなどの管理情報を作成して、記録する必要がある。トラックは、時間の流れを持ったデータの管理情報である。時間の流れを持ったデータは、例えば、映像データ、音声データなどである。トラックは、データの種類、再生時刻、実際のデータの記録位置へのポインタなどを含んでいる。これらのデータは、前述のタイムテーブルの作成と同様の手順で作成することが出来る。
トラックでは、細かな時間単位でデータの取り出し位置を指定することが出来る。そのため、再生時間の順番またはデコード時間の順番に、映像データと音声データとを混在させて並べることが出来る。このような構造を取ることによって、同時に再生する必要のある映像データおよび音声データを、ヘッドシークを抑えて取り出すことができる。
このようにして、MMTで送出された番組を、BMFF形式のファイルとして記録することが出来る。
実施の形態2.
実施の形態2では、MMTPパケットを順次記録する。MMTPパケットは、受信した放送を番組レベルで選別したものである。
実施の形態2では、MMTPパケットを順次記録する。MMTPパケットは、受信した放送を番組レベルで選別したものである。
1つの送信機から送信されるデータは、複数の放送局の複数の番組を多重化できるように作られている。そのため、ユーザーが特定の番組を視聴する場合、または、特定の番組を録画する場合には、放送局のレベルでの分離と、番組のレベルでの分離とが必要となる。
ここでは、番組のレベルまでの分離が完了しており、録画の対象となる1つの番組を構成するMMTPが順次取り出されて、記録されているものとする。この状態は、部分的にデータの多重化が解除されている状態である。つまり、番組の単位まではデータの多重化が解除されている。しかし、番組を構成する映像、音声、字幕ストリーム、制御データ等は多重化されている。
図11は、実施の形態2に係る、MMTP方式でのMPTによる多重化の解除を説明するための図である。図12は、タイムテーブルと映像データとの関係を説明するための図である。図13は、MMTP方式でのMPTデータの構造の例を示す図である。図14は、映像を中心に考えた場合のアライメントを説明するための図である。
図11に示したMMTストリームは、番組を構成するMMTPパケット列の例である。このMMTストリームでは、例えば、映像、音声および字幕が、それぞれ一本ずつ多重化されている。実際の放送では、複数の映像、音声および字幕が多重化されることもある。
映像、音声、字幕などは、番組を構成する要素である。これらの番組を構成する要素をアセットと呼ぶ。MMTストリームでは、MMTPパケットの単位で多重化されている。このため、MMTストリームには、サービスインフォメーションのパケットとアセットデータのパケットとが混在している。
サービスインフォメーションのパケットは、多重化ストリームのための制御信号である。サービスインフォメーションは、例えば、映像、音声、字幕等を分離するための制御情報である。また、サービスインフォメーションは、映像、音声および字幕を同期して再生するための制御情報である。また、サービスインフォメーションは、各アセットの名称を表示するための情報である。
アセットデータのパケットは、例えば、映像、音声および字幕のアセットを構成する。実施の形態2では、記録媒体上にこれらのパケットを順次記録する。ここでは、簡単のため、ファイルとしてMMTストリームを構成するこれらのパケットを順次記録することとする。以下においては、制御パケットを、「制御パケットSI」ともいう。また、以下においては、MPTが付いている制御パケットSIを、「制御パケットSI(MPT)」ともいう。また、以下においては、RAPフラグが付いている映像パケットを、「映像パケットV(RAP)」ともいう。
図11に示すように、MMTストリームは、制御パケットSI(MPT)、映像パケットV、映像パケットV(RAP)、音声パケットAおよび字幕パケットTを含んでいる。制御パケットSI(MPT)は、サービスインフォメーションの一種である。
実際には、制御パケットSIとして多くの種類のパケットが送信されている。ここでは、説明を容易にするために、MPTに注目して記載してある。MPTは、放送規格では約100ms間隔で定期的に送信することになっている。
MMTストリームを先頭から順次再生する場合には、MMTストリームを記録したファイルの先頭からデータを順次取り出す。そして、順次、MMTストリームを多重化解除部21に送り込むことで、データの再生を行うことができる。例えば、MMTストリームを、図1に示す多重化ストリームSmとして多重化解除部21に入力する。
多重化解除部21は、受け取ったデータを順次解析する。多重化解除部21は、MPTを含むデータパケットを受け取ると、MPTの記述に基づいて、多重化解除に用いる情報、および、映像を表示するタイミングの情報を取り出す。そして、多重化解除部21は、多重化解除部21の設定と、音声デコード部31、映像デコード部32、字幕デコード・レンダリング部33およびデータ放送・EPG処理部34の設定とを行う。
図13に、MPTに記述されているデータの一例を示す。図13に示すデータは、ARIB規格STD-B60に基づいている。例えば、MPTには、複数のアセットを取りだすための情報が記述されている。各アセットは、MMT内の識別情報によって、データを取得するための情報とデータを分離するための情報とを得る。MMT内の識別情報は、例えば、ロケーション情報である。ロケーション情報は、「MMT_general_location_info()」と表現される。
また、図13では省略してあるが、コンポーネント記述子の情報から各アセットのストリームの詳細情報を得ることができる。この詳細情報を基に、図11に示したように、多重化されている各種ストリームを分離して、再生する。
放送を記録する場合にも、図11のMMTストリームのデータは、ファイルに順次記録される。そして、MMTストリームのデータは、ファイルの先頭から順次取出されて再生される。この場合には、必ずしも、MMTパケットそのものが記録される必要はない。MMTパケットの内部のデータが取り出された状態で記録されてもよい。また、IPパケットの状態またはTLVパケットの状態で記録されてもよい。
次に、ランダムアクセスを考える。ここでは、一例として、時刻指定ジャンプを説明する。なお、チャプターサーチ、早送り再生、巻き戻し再生などでも、時刻指定ジャンプの動作と同様な動作が行われる。
図12を用いてランダムアクセスの動作について説明する。タイムテーブルTMは、番組上の時刻情報と、その時刻情報に対応する再生位置とを対応付けるデータである。ここでは、再生位置を、MMTストリームのデータを記録したファイルの先頭からのオフセットとして説明する。なお、再生位置として、セクタアドレス、ブロックアドレスなどが用いられることもある。
このタイムテーブルTMを用いて、時刻に対応した再生位置からデータを取り出して再生する。これによって、時刻指定ジャンプを行うことができる。つまり、時刻を指定した再生を行うことができる。
通常、映像データはGOP単位で構成されている。GOPは、例えば、0.5秒から1秒間程度の映像をまとめて圧縮したものである。GOPは、例えば、数十枚の画像を含んでいる。1つのGOPは、1枚または複数枚の完全な画像と、数十枚の差分画像とを含んでいる。GOPは、圧縮された差分画像を含んでいるため圧縮効率が良い。
また、表示される画像の順番とデコードされる画像の順番とは、必ずしも対応していない。そのため、GOPの途中から再生したい場合でも、必ずGOPの先頭からデータをデコードする必要がある。そのため、MMTPパケットでは、GOPの先頭に、RAPフラグを付けることができる。RAPフラグは、ランダムアクセスが可能であることを示すフラグである。図12では、このRAPフラグの付いているパケットの位置を、GOPの先頭としてタイムテーブルに格納している。これによって、ランダムアクセスを実現している。
1枚の画像データから完全な画像を再現できる当該画像データをIピクチャと呼ぶ。Iピクチャは、1つのGOP内に必ず1つ存在する。しかし、1つのGOP内に複数のIピクチャが存在することもある。Iピクチャのうち、他の画像との依存関係から、GOP内で最初にデコードされるIピクチャはIRAPと呼ばれている。このIピクチャから再生することで、後続の画像データを正しく表示できる。
MMTPパケットのRAPフラグは、IRAPの画像データの先頭パケットまたは制御パケットに付けられている。1つのIピクチャとの差分データで構成された画像データはPピクチャと呼ばれている。参照先のIピクチャと、Pピクチャの画像データとを合成することで、このPピクチャの画像を再現できる。複数の他の画像を参照して画像を再現できる画像データをBピクチャと呼ぶ。
映像データと同様に、音声データでも一つのかたまりのデータの先頭の概念が存在する。そして、音声データの先頭にRAPフラグが付けられている。しかし、説明を単純にするために、ここでは映像データのGOPの区切りで音声データパケットも区切る。
図11に示すパケットレベルでの読み出しに対応した、図12に示すランダムアクセスの動作を考えてみる。
タイムテーブルTMから再生位置の情報を取出す。そして、図11のMMTストリームの位置P1からパケットを取り出して再生を行う。位置P1は、最初の映像パケットV(RAP)の位置である。この時点では、MPT情報が取得できていない。そのため、映像、音声、字幕などをアセット単位で分離を行うことができない。
順次読み出しが行われて位置P2で制御パケットSI(MPT)が読み出される。これによって、アセットを分離するためのパラメーターが取得される。つまり、映像、音声、字幕などを分離することができる。
この時、位置P1から位置P2までのデータが分離できず、結果として当該データが読み出されなかった場合には、GOPの先頭のデータが失われることになる。この場合、このGOPをデコードすることができない。
位置P3以降のGOPは、位置P2で既に取得済みのMPT情報があるためデコードが可能となる。位置P3は、位置P1のGOPの次のGOPの先頭である。そのため、本来、再生を開始したいGOPからではなく、次のGOPから再生されることがある。
同一の番組内でのチャプターサーチ、早送り再生等が行われる場合において、再生に使用していたMPTのアセット情報がジャンプ先のMPTのアセット情報と一致する場合には、ジャンプ先の先頭である位置P1から始まるGOPから再生することが可能である。しかし、CM(コマーシャル)、番組の変更などを挟んで番組を再生する場合には、ジャンプ前のMPTとジャンプ後のMPTとでアセットが同一である保証はない。また、録画済みの異なる複数の番組を繋ぐ編集が行われている場合には、ジャンプ前のMPTとジャンプ後のMPTとでアセットが同一である保証はない。
また、アセットの変更が行われる場合には、放送規格案は、以下の理由により、実際のデータが再生される0.5秒前からMPTを更新するように求めている。当該理由は、例えば、アセットを分離するためのフィルタの設定などには時間がかかるためである。また、当該理由は、例えば、音声が切り替わる時のミュート処理などには時間がかかるためである。また、当該理由は、例えば、映像が切り替わる時のミュート処理などには時間がかかるためである。また、当該理由は、例えば、フィルタの切り替え、ミュート処理などには時間がかかるために、実際のデータが切り替わる直前のタイミングでMPTを変更しても、フィルタの切り替え、ミュート等を行うための処理が間に合わない可能性があるためである。
これは、ランダムアクセスの時も同様である。ジャンプ先ですぐにMPTを取得することができても処理系の切り替えが間に合わず、最初のGOPを正しく表示できない可能性がある。また、データの切り替えに必要な時間を確保するために、表示を遅延させる必要がある。ここで、「処理系」とは、例えば、多重化解除部21、音声デコード部31、映像デコード部32、字幕デコード・レンダリング部33、データ放送・EPG処理部34等である。
そこで、この実施の形態2では、図12に示したように、まず、MPTの情報をタイムテーブルTM内に格納する。そして、時刻を指定してジャンプをする時には、MPTの情報を、多重化解除部21、音声デコード部31、映像デコード部32、字幕デコード・レンダリング部33およびデータ放送・EPG処理部34に設定する。その後、再生を開始する位置のデータを読み出す。
このようにすることで、シークなどのデータの読み出しの準備と並行して、処理系の切り替えを行うことがでる。処理系は、多重化解除部21、音声デコード部31、映像デコード部32、字幕デコード・レンダリング部33、データ放送・EPG処理部34等である。また、データの切り替えに必要な時間を短縮することができる。
この例では、MPTそのものをタイムテーブルTMに格納している。他の方法として、MPT内に記載されているアセットを分離するための情報と、GOPの表示開始の時刻とを、タイムテーブルTMに格納する方法がある。また、GOPの表示を開始する時刻をタイムテーブルTMの時刻として使用することもできる。このように、アセット情報を取出してタイムテーブルTMに格納する方法がある。
また、他の方法として、別のテーブルにMPTまたはアセット情報を記録する方法がある。また、タイムテーブルTMに、該当するMPT情報またはアセット情報への参照情報を持たせる方法がある。また、参照情報ではなく、同一の時刻で検索できる別のタイムテーブルを用意して、そちらにMPTまたはアセット情報を記録する方法がある。MPTには複数のGOPの表示開始の時刻が格納されている。これらの一部またはすべてをタイムテーブルTMに格納しても良い。
同様に、HDRパラメーター等によってテレビの制御を変更する場合でも、バックライトの輝度の変更、液晶の駆動電圧の設定変更等に時間がかかる場合がある。その場合には、HDRパラメーター等をタイムテーブルTMに格納する。これによって、事前にテレビの制御を行うことが可能となる。図12では、タイムテーブルTMのメタデータ領域が、これらのパラメーターを格納する領域の一例として示されている。
特殊再生を行う場合には、GOP内でIRAP画像(すなわち、IRAPピクチャ)のみを再生して、他の画像を表示しない場合がある。特殊再生は、例えば、早送り再生、巻き戻し再生等である。IRAP画像は、デコードの順番で最初にデコードされる画像である。また、IRAP画像は、データ配置の順番でもGOPの先頭に置かれる。つまり、IRAP画像は、GOPの先頭に存在する。また、IRAP画像は、他の画像に依存しない。このため、IRAP画像は、単独でデコード可能である。この場合には、IRAP画像の位置は、タイムテーブルTMから読み取れる。
しかし、効率よく読み飛ばすためには、IRAP画像の末尾がわかる方が便利である。そこで、IRAP画像のサイズまたはIRAP画像の末尾をタイムテーブルTMに格納する。これによって、効率よく特殊再生を行うことができる。図12では、タイムテーブルTMのIRAPサイズ欄がIRAP画像のサイズ、IRAP画像の末尾等を格納する領域の一例として示されている。
映像を構成する画像データがスライスとして記録されている場合には、スライス単位でデータにアクセスできた方が良い場合がある。「スライス」とは、独立して画像として表現できる単位である。また、「スライス」とは、画像データがデコード可能な状態で分割されていることである。特殊再生用として考えた場合には、例えば、GOP内のIRAP画像の特定のスライスのみを再生して、他のスライスを表示しない方法がある。特殊再生は、例えば、早送り再生、巻き戻し再生などである。
この場合には、GOPの先頭にあるIRAP画像のデータの位置およびサイズと、スライスの位置およびサイズとをタイムテーブルTMに格納する。これによって、効率よく特殊再生を行うこと可能となる。図12では図示していないが、例えば、タイムテーブルTMのIRAPサイズ欄を拡張して、上記の情報を格納することができる。
早送り再生、巻き戻し再生等をなめらかに行うために、IRAP画像に加えて、GOPに含まれている非IRAPのIピクチャ、非IRAPのPピクチャ等を表示することもある。この場合には、IピクチャおよびPピクチャの各々の開始位置と、IピクチャおよびPピクチャの各々のサイズまたは末尾の位置とをタイムテーブルTMに格納する。これによって、効率よく特殊再生を行うことが可能となる。
図12では図示していないが、例えば、タイムテーブルTMのIRAPサイズ欄を拡張して、上記の情報を格納することができる。また、別途、IピクチャおよびPピクチャの各々の開始位置と、IピクチャおよびPピクチャの各々のサイズまたは末尾の位置とを示すテーブルを用意する。そして、タイムテーブルTMには、このテーブルへの参照情報を格納することもできる。
次に、HDD、光ディスク等のディスクデバイスに、この実施の形態2でのMMTストリームを格納することを考える。
多くのディスクフォーマットでは、固定サイズのデータブロックをアクセス単位としている。このアクセス単位は、セクタ、ブロック、クラスタ、ページ等と呼ばれている。ここでは、単に「ブロック」と呼ぶ。例えば、ブルーレイディスク規格では6144Byteをアラインドユニット(Aligned Unit)と呼び、1つの記録単位として取り扱う。また、ブルーレイディスク規格およびUDF規格では、1ブロック2048Byteが良く使われる。UDF(Universal Disk Format)は、光ディスク用のファイルシステムである。
ランダムアクセスを行う場合には、データの境界をこのブロックに合わせることで効率よくアクセスする事ができる。また、ディスクデバイスの構造だけでなく、例えば、暗号化の単位としてブロックサイズが決められることもある。この場合でも、アクセスの単位としてブロックの境界に合わせてデータにアクセスできると効率が良い。このようなアクセス効率などを考慮してデータのサイズまたはデータを格納する位置を決めることをアライメントと呼ぶ。
トランスポートストリーム(TS)を記録する場合には、32個のTSパケットが接続されて、6144Byteのデータとなる。TSパケットは、192Byteである。これによって、UDFの3つのブロックに効率よく記録できる。UDFの1つのブロックは、2048Byteである。MMTPパケットは、可変長パケットである。このため、単純にパケットの数でブロックの境界に合わせることができない。
図12で示したように、ランダムアクセスを行う場合には、GOPの先頭へのアクセスを効率的に行うことが望ましい。しかし、GOP内のどの画像から再生する場合でも、GOPの先頭からデータを読み出す必要がある。そこで、GOP単位でブロックの境界に合わせて記録することを考える。
図14(a)に、GOPをデータアクセスの単位として、GOPの先頭がブロックサイズの整数倍になるようにしたMMTストリームを記録したファイルの一例を示す。
図14(a)は、MMTストリームを記録したファイルのデータの一部を示している。図14(a)の左側がファイル前方に対応し、図14(a)の右側がファイル後方に対応している。MMTストリームのパケットは、例えば、図14(a)の左側から右側に向けて順次記録されている。図14(a)は記録されているデータの一部のみを記載している。実際には、このデータ構造が多数繰り返して記録されている。
図14(a)中の符号Bbはブロック境界を示している。また、「n1」、「n2」、「n3」、「n4」、「n5」および「nm」は整数を示している。「m」は正の整数である。「×」は乗算を示している。そのため、「ブロック×n」は、データがブロックサイズの整数倍になっている事を示している。
GOPの先頭がブロックの境界となるようにアライメントする場合には、GOPのデータサイズが必ずしもブロックサイズの整数倍とならない。このため、図14において、「Pad」で表現されるパディングを用いる。「パディング」とは、データをアライメントするために、意図的に無効領域を作ることである。パディングにはいくつかの方式がある。当該方式は、例えば、無効を示すデータを記録する方式である。また、他の方式として、OSまたはファイルシステムが無効なデータ領域を管理する方式などがある。
図14(a)の例では、GOP単位でブロックにアライメントしている。このため、GOP単位でのランダムアクセスを効率よく行うことができる。図14(a)の例では、映像データについてのみ説明を行っている。図14(a)のデータには、実際には、図11に示すように、映像データ、音声データ、字幕データなどが多重化され混在している。
そのため、映像データの区切り位置でストリームデータを分割した場合には、映像以外の音声データ、字幕データ等に関しては、適切な区切り位置で分割されるとは限らない。そのため、ランダムアクセス時に音声、字幕等が遅れて再生される可能性がある。通常、音声、字幕等の再生が遅れても、映像とのずれが発生しなければ問題とならない。このため、ここでは、映像の区切り位置を基に、音声、字幕等のデータも一固まりのデータとして取り扱う。
図14(b)は、画像単位でアライメントしたMMTストリームを記録したファイルの一例を示す。図14(b)では、AUとしてのピクチャを、「ピクチャ(AU)」と表記している。図14(b)では、ピクチャ(AU)とパディングとの組み合わせがブロックの整数倍となっている。この場合には、画像単位でのアクセスが必要な時に効率が良い。
AUは、圧縮データとしての意味のある固まりである。ピクチャとしての画像のデータにおけるAUは、1枚分の画像である。つまり、AUは、IRAPピクチャ、Iピクチャ、Pピクチャ、Bピクチャ等である。
この図14(b)では、画像の単位ですべてのアライメントを行った。しかし、ランダムアクセスの時に重要になるのはIRAPピクチャである。IRAPピクチャは、GOPの先頭に置かれる。そのため、IRAPピクチャとそれ以外のピクチャをまとめたものとを分けてアライメントを行うこともできる。
図14(c)は、IRAPピクチャの先頭、Iピクチャの先頭およびPピクチャの先頭をブロック境界にアライメントを行った状態を示す。図14(c)は、Iピクチャを「I」と示し、Pピクチャを「P」と示し、Bピクチャを「B」と示す。早送り再生、巻き戻し再生などが行われる場合に、IRAPピクチャだけではなく、Iピクチャ、Pピクチャ等を利用する場合に効率が良い。この図14(c)では、IRAPピクチャの先頭、Pピクチャの先頭、および、非IRAPのIピクチャの先頭でアライメントを行っている。なお、Pピクチャ先頭またはIピクチャ先頭でのアライメントを省略しても良い。
図14(d)に、スライス単位でアクセスすることを考えてアライメントを設定したMMTストリームを記録したファイルの一例を示す。映像がスライス構成となっている場合には、スライス単位でのアクセスを効率よく行うことができる。
図14(d)で、ピクチャとしての画像のデータの最初には、非VCLデータが記載されている。非VCLデータは、AUD、VPS、SPSなどのパラメーター類である。後続のスライス#1からスライス#4は、VCLデータである。VCLデータは、圧縮された画像データである。
スライス単位でデコードを行う際にも、非VCLデータは、各スライスをデコードする際に必要となる。例えば、スライス#2をデコードする際には、非VCLデータとスライス#2のデータとを組み合わせてデコードする。そのため、ここでは非VCLデータと、スライス#1からスライス#4とでそれぞれアライメントを行っている。
実際には、非VCLデータは各スライスと比べて非常に小さいことが多い。また、スライス#1のデコードを行う前には、非VCLデータを必要とする。このことから、非VCLデータとスライス#1とをまとめてアライメントを行うことも考えられる。
スライス単位でのアライメントは、必ずしも全てのピクチャで行う必要はない。例えば、IRAPピクチャのみをスライス単位でのアライメントに用いることも考えられる。なぜなら、IRAPピクチャは、サイズが大きく、ランダムアクセスに用いられるからである。以下においては、スライスを、「スライスセグメント」ともいう。また、以下においては、スライス#1、スライス#2、スライス#3およびスライス#4を、それぞれ、スライスセグメント#1、スライスセグメント#2、スライスセグメント#3およびスライスセグメント#4ともいう。
MMTPパケット単位でアライメントする方法も考えられる。MMTPパケットは、規格によってデータ量が異なる。例えば、放送規格案でのMMTPパケットの最大値は、約1500Byteである。
例えば、2048Byteのブロックを想定してアライメントを行った場合には、全データ量に占めるパディングの量が大きくなる。そのため、記録効率が悪くなる。
一方、パケット単位でのアクセスは効率よく行える。つまり、MMTPパケット単位でのアライメントは、パケット単位でのデータ加工が必要となる場合などの一時的なデータの格納に適している。パケット単位でのデータ加工は、例えば、記録再生時、編集時などに行われる。
タイムテーブルTMおよびアライメントを用いることによって、時刻を指定したデータの再生を効率よく行うことができる。
ブルーレイディスクは、この実施の形態2のタイムテーブルTMに相当する対応表としてのEPマップ(EP_map)を持っている。このEPマップは、再生位置をシステムクロックとTSパケットの位置とで示している。再生位置は、PTS、および、そのデータを読み出すための位置である。PTSは、表示開始の時刻である。
EPマップは、時刻を指定したジャンプ、ランダムアクセス、プレイリストによる再生などに用いられている。ランダムアクセスは、例えば、早送り再生、巻き戻し再生などである。プレイリストは、ストリームの再生部分および再生順を示すリストである。
ブルーレイディスクのEPマップでは、時刻および再生位置のデータ形式がMMTの場合とは異なっている。しかし、時刻を指定して再生位置のデータを取得する処理は、この実施の形態2で説明した、タイムテーブルTMを用いる処理と同様な処理である。
タイムテーブルTMをEPマップと類似の構造とすることによって、これらの再生の仕組みを大幅に変更することなく、ブルーレイディスクにMMT形式の放送を記録し再生することができる。
例えば、MMTの再生の時刻形式は、放送時の絶対時刻(すなわち、世界時刻)である。一方、ブルーレイディスクのEPマップでは、内部クロックを用いた相対時刻が使用される。そこで、タイムテーブルTMの時刻の表記を相対時刻の表記に換算する。また、絶対時刻と相対時刻との換算用のデータを別途持たせてもよい。また、ブルーレイディスクで使用する再生の時刻情報を、絶対時刻の形式に変更してもよい。
実施の形態3.
日本の新放送方式では、多重化方式およびエンコード方式が変更されている。また、日本の新放送方式では、伝送レートも引きあげられている。例えば、ARIB TR B-39によると、4K放送では35Mbpsの伝送レートが想定され、8K放送では100Mbpsの伝送レートが想定されている。
日本の新放送方式では、多重化方式およびエンコード方式が変更されている。また、日本の新放送方式では、伝送レートも引きあげられている。例えば、ARIB TR B-39によると、4K放送では35Mbpsの伝送レートが想定され、8K放送では100Mbpsの伝送レートが想定されている。
一方、現在市販されているBDXL(登録商標)の光ディスクの伝送レートは、140Mbps前後である。
そのため、8K放送を録画したディスクを再生する場合には、通常の再生では問題がなく、再生可能である。しかし、8K放送を録画したディスクで早送り再生などの特殊再生を行うと、1コマ分の画像を表示するのに時間がかかってしまうという問題がある。
特開2000-125259号公報では、記録媒体の記録領域を所定のデータサイズに分割し、記録時にストリームを解読する。そして、Iピクチャであることを表すPCT(ピクチャタイプコード)を含むTSパケットを、セクタの先頭から記録すると共に、そのセクタの先頭アドレスを示すポインタを、記録媒体上に設けたテーブルに登録する。そして、この様に記録した記録媒体を用いた早送り、早戻し等の特殊再生が行われる際には、ポインタテーブルからポインタのアドレスを読み出し、そのポインタが示すセクタから一枚のIピクチャのみを再生する。その後、次々とポインタが示すセクタを順次再生する。
このように、早送り再生などの特殊再生が行われる際には、Iピクチャのみを再生する方法が採用される事が多い。Iピクチャは、映像ストリームのランダムアクセスポイントにある。早送り速度に応じて、通常の早送り(以下、「FF(Fast Foward)」ともいう)では、全てのIピクチャを表示する。また、2倍速の早送り(以下、「FF×2」ともいう)では、Iピクチャを1つ飛ばしで表示する。また、3倍速の早送り(以下、「FF×3」ともいう)では、Iピクチャを2つ飛ばしで表示する。このようにして、早送り再生時の再生速度の調整を行う。
しかしながら、GOP内でのIピクチャの比率が大きい場合には、Iピクチャの読み出しに時間がかかり、画像としてのIピクチャの更新間隔が長くなる。
実施の形態3に係る映像再生装置は、特殊再生が行われる際に、Iピクチャの読み出し時間を短くし、画像としてのIピクチャの更新間隔を短くすることができる。
従来の早送り再生では、再生可能なIピクチャのディスク上の位置をテーブルで管理している。そして、そのテーブルを用いて、順次、Iピクチャのデータを読み出している。
光ディスクでは、読み出し位置を変更する際には、ヘッドの移動に時間が必要である。このヘッドの移動時間をシークタイムと呼ぶ。
画面上での早送り画像の更新間隔は、以下の式(1)で表現される。
4K/8K放送では、従来の2K放送よりもIピクチャのサイズが大きい。Iピクチャのサイズが大きい場合には、Iピクチャの読み出しに時間がかかり、画像としてのIピクチャの更新間隔が長くなる。
また、映像ストリームのデータレートとディスクからの最高読み出し速度との差が少ない場合にも、Iピクチャの読み出し時間が長くなり、画像の更新間隔が長くなる。例えば、100Mbpsの放送ストリームを最高読み出し速度140Mbpsの光ディスクから読み出す場合には、当該放送ストリームを1.4倍の速度でしか読み出す事ができない。
このように、4K/8K映像を光ディスクに記録した場合には、特殊再生の実行時の画像の更新間隔が従来よりも長くなる。その一方で、放送を記録した映像の再生時には、早送り再生などの特殊再生の操作が行われる事が多い。そして、利用者が目的のシーンを特定する際には、画像の更新間隔は短い方が望ましい。
画像の更新間隔が長い場合には、利用者が早送り再生を使ってシーンを検索する際に、目的のシーンを見つける事が難しくなってしまう。
この実施の形態3では、早送り再生などの特殊再生が行われる際に、目的のシーンを見つける事が容易で、操作性の良い映像再生装置を提供する事を目的としている。
利用者の観点から、早送り再生が行われる際の画像の更新間隔について整理する。例えば、本来の再生時間が100秒の映像を10秒で再生する早送り再生を考える。ここでは当該早送り再生を仮に10倍速早送りと呼ぶ。
通常、利用者は早送り再生中の映像を確認して、目的のシーンが現れた時点で早送り再生を解除する。つまり、映像の再生の速度を通常の再生速度に戻す。早送り再生の実行時には、表示される映像は間欠的な映像となる。表示されるシーンを利用者が認識するためには、時間的な情報の欠落は少ない方が望ましい。また、早送り操作が終了した後、早送り再生が解除されて通常再生に戻る位置のずれも少なくできる。
例えば、10倍速早送りに対して考える。早送り再生中の画像の更新間隔が1秒であれば、通常の再生時間の10秒に対して1コマ表示される。これに対して、早送り再生中の画像の更新間隔が0.5秒であれば、通常の再生時間の5秒に対して1コマが表示される。
早送り再生の実行時に、利用者が目的のシーンを見つけるためには、通常の再生時間に対して、表示されるコマ数(すなわち、画像数)が多い方が有利である。このように、早送り再生の実行時に、多くの画像を表示することによって、操作性を向上させる事ができる。つまり、画像の更新間隔を短くすることによって、操作性を向上させる事ができる。
4K/8K放送では、分割デコードを想定して、複数のスライスセグメントを持ったストリーム形式を規定している。
例えば、1つの画像を4分割する場合には、当該画像を縦方向および横方向に2分割して4分割の画像を作成する。また、1つの画像を縦方向に4分割する場合もある。これらの場合、スライスセグメント単位で、独立してデコードできるようになっている。これは、2K用のデコーダーを4つ用いて4K映像のデコードを行い、4K用のデコーダーを4つ用いて8K映像のデコードを行えるようにするための配慮である。
これらの複数のスライスセグメントを持つ放送ストリームを光ディスクに記録した状況において、スライスセグメント単位でデータを読む出す事が出来れば、一部のスライスセグメントだけを再生することが可能である。
一部のスライスセグメントだけを再生する処理を特殊再生の実行時に使用すれば、更新される画像は通常の再生で表示されている画像の一部になる。そのため、前述の式(1)の「Iピクチャデータの読み出し時間」を4分の1にすることができる。また、特殊再生の実行時の画像の更新間隔を短縮することができる。
図15は、実施の形態3に係る映像ストリームの模式図である。
多重化方式としてはTS方式およびMMT方式の両方が考えられる。図15では、固有のヘッダ情報などを省略している。また、図15では、パディング等も省略している。
放送の場合には、1つのGOPは約60枚のフレームを含む事ができる。当該フレームは、画像またはピクチャである。1つのGOPは、少なくとも1つのIピクチャを含む。デコードの際に開始点となるIピクチャは、IRAPピクチャまたはIRAP画像と呼ばれる。通常、IRAPピクチャはGOPの先頭に配置されている。
IRAPピクチャを含むIピクチャ、BピクチャおよびPピクチャは、それぞれフレームを表す。当該フレームは、画像またはピクチャである。
Iピクチャは、単独でデコード可能な独立した画像である。一方、BピクチャおよびPピクチャは、他の画像に依存している。BピクチャおよびPピクチャは、他の画像との差分データである。このため、BピクチャおよびPピクチャは、単独ではデコードすることができない。
GOPは、当該GOPの中で画像間の依存関係が完結している。つまり、GOP内のすべての画像は、デコード可能となるデータのセットを構成している。以下においては、表示装置Ddが表示するための画像を、「画像Gp」ともいう。画像Gpは、例えば、Iピクチャである。また、画像Gpは、例えば、動画像である。
1つの画像Gpが複数のスライスセグメントで構成されている場合には、GOP内の各画像はパラメータセットと複数のスライスセグメントとで構成されている。パラメータセットと1つのスライスセグメントとを組み合わせる事で、スライスセグメントはデコード可能な単位となる。図15では、IRAPピクチャのみスライスセグメントの構造で記載している。BピクチャおよびPピクチャも、IRAPピクチャと同様の構造を取ることができる。以下においては、スライスセグメントをデコードすることにより得られる画像を、「画像Gs」または「スライス画像」ともいう。
デコーダーを4つ用いて並列でデコードする場合には、スライスセグメントごとにデータを取り出す。そして、各データにパラメータセットを追加する。その後、各データを当該データに対応するデコーダーに与える事によって、1つの画像を分割した状態でデコードすることができる。画像を表示する際には、個別にデコードされた画像を結合し、1つの画像を生成して表示する。
以下においては、ピクチャとしての画像を、複数のスライスセグメントに分割した構成を、「分割スライスセグメント構成」ともいう。分割スライスセグメント構成の種類には、「田の字型」、「目の字型」等が存在する。以下においては、分割スライスセグメント構成の種類が、田の字型である状況における当該分割スライスセグメント構成を、「田の字型分割スライスセグメント構成」ともいう。また、以下においては、分割スライスセグメント構成の種類が、目の字型である状況における当該分割スライスセグメント構成を、「目の字型分割スライスセグメント構成」ともいう。
図16は、田の字型分割スライスセグメント構成を説明するための図である。田の字型分割スライスセグメント構成は、画像Gpを、田の字型に分割した構成である。画像Gpの左上には、スライス#1の画像Gsが表示されている。画像Gpの右上には、スライス#2の画像Gsが表示されている。画像Gpの左下には、スライス#3の画像Gsが表示されている。画像Gpの右下には、スライス#4の画像Gsが表示されている。
以下においては、スライス#1に対応する画像Gsを、「画像Gs1」ともいう。また、以下においては、スライス#2に対応する画像Gsを、「画像Gs2」ともいう。また、以下においては、スライス#3に対応する画像Gsを、「画像Gs3」ともいう。また、以下においては、スライス#4に対応する画像Gsを、「画像Gs4」ともいう。
図17は、目の字型分割スライスセグメント構成を説明するための図である。目の字型分割スライスセグメント構成は、画像Gpを目の字型に分割した構成である。目の字型分割スライスセグメント構成は、画像Gpを縦方向に4分割した構成である。図17の画像Gpは、縦方向に並ぶ4つの画像Gsである、画像Gs1,Gs2,Gs3,Gs4で構成される。画像Gs1は、スライス#1に対応する画像である。画像Gs2は、スライス#2に対応する画像である。画像Gs3は、スライス#3に対応する画像である。画像Gs4は、スライス#4に対応する画像である。
分割されていない映像ストリームには、1つのピクチャデータ内にスライスセグメントが1つだけ存在している。
このような分割スライスセグメント構成を持った映像ストリームでの特殊再生を考える。
前述の通り、操作性を向上させるためには、画像の更新間隔を短くする必要がある。従来では、Iピクチャ全体のデータを読み込み、Iピクチャ全体を表示していた。しかし、Iピクチャの第1スライスセグメント(例えば、スライスセグメント#1)のデータのみを読み込み、Iピクチャの第1スライスセグメント(例えば、スライスセグメント#1)のみを表示する事を考える。以下においては、分割スライスセグメント構成における各スライスセグメントを、「分割スライスセグメント」ともいう。また、以下においては、分割スライスセグメントに対応したタイムテーブルを、「タイムテーブルTMS」ともいう。
図18は、分割スライスセグメントに対応したタイムテーブルTMSの一例を示す図である。タイムテーブルTMSは、分割スライスセグメントの単位での読み出しに対応したテーブルである。タイムテーブルTMSは、複数のエントリーを示す。各エントリーは、タイムテーブルTMSにおいて、行方向に並ぶ複数の情報を含む。図18のタイムテーブルTMSは、例えば、6つのエントリーを示す。図19は、タイムテーブルTMSの各項目とデータとの対応関係を示す図である。映像ストリームを記録する際に、映像ストリームの解析が行われる。そして、時刻情報、データ区切り位置の情報などが取出されてタイムテーブルTMSが作成される。
タイムテーブルTMSは、映像ストリームと一緒に記録メディアに記録される。記録メディアは、例えば、光ディスクなどである。
図18および図19のタイムテーブルTMSの各項目について説明する。
タイムテーブルTMSの「時刻」は、GOPの表示時刻である。時刻は、システムクロック形式の時刻情報、ntp形式の時刻情報、ストリームの先頭からの差分時間などの形式で記録されている。時間を指定して再生を開始する場合には、この時刻欄を検索し、指定時間の近傍のデータから再生を開始する。
前述したように、タイムテーブルTMSの「時刻」は、GOPの表示時刻である。1つのGOPには、通常、複数の画像が含まれている。そして、複数の画像の表示時刻があるため、GOPには表示時刻が複数存在する。GOPの表示時刻をタイムテーブルに記録する場合には、GOP内での表示の順番で先頭になる画像の表示時刻を使用することができる。また、タイムテーブルに記録される表示時刻として、デコードの順番で先頭になる画像の表示時刻を使用することができる。この場合には、先頭になる画像は、IRAPピクチャである。
また、タイムテーブルに格納する「時刻」は、必ずしも、画像の表示時刻に一致する必要はない。例えば、画像の表示時刻そのものではなく、精度を落とした時刻情報、他のデータに対する時刻情報などを用いることができる。これらは、例えば、再生装置のシステムクロックの精度、データアクセスとの関係、タイムテーブルに格納可能なデータ長などが考慮されて、用いられる。
「IRAP開始位置」は、IRAPピクチャの格納位置である。IRAPピクチャの格納位置は、GOPのランダムアクセスポイントとなる。IRAPピクチャの格納位置は、通常、GOPの開始位置と同一となる。「IRAP終了位置」は、IRAPピクチャ全体のデータ末尾を示す。IRAP開始位置からIRAP終了位置までのデータを読み出すことによって、IRAPピクチャをデコードできるデータがそろう。
「#2開始位置」は、2番目のスライスセグメントであるスライス#2の開始位置を示す。また、「#2開始位置」は、1番目のスライスセグメントであるスライス#1の終了位置を示す。「#3開始位置」は、3番目のスライスセグメントであるスライス#3の開始位置を示す。また、「#3開始位置」は、2番目のスライスセグメントであるスライス#2の終了位置を示す。「#4開始位置」は、4番目のスライスセグメントであるスライス#4の開始位置を示す。また、「#4開始位置」は、3番目のスライスセグメントであるスライス#3の終了位置を示す。「#4終了位置」は、4番目のスライスセグメントであるスライス#4の終了位置を表す。通常、この位置はIRAPピクチャの終了位置と同じである。
「パラメータセット」には、IRAPピクチャのデータのパラメータセットが格納されている。パラメータセットには、例えば、AUD(Access Unit Delimiter)、VPS(Video Parameter Set)、SPS(Sequence Parameter Set)、PPS(Picture Parameter Set)、SEI(Supplemental Enhancement Information)、EOS(End of Stream)などが含まれている。
図19に示したタイムテーブルTMSは、スライスセグメントの終了位置を格納している。スライスセグメントの終了位置は、例えば、IRAPピクチャの終了位置およびスライス#4の終了位置である。なお、終了位置の代わりにデータサイズをテーブルに格納し利用する方法を取ることもできる。
開始位置および終了位置は、データの先頭からのバイト位置、ブロック位置などの形で記録されている。また、多重化方式にTSを採用している場合には、開始位置および終了位置は、TSパケットの位置などの形で記録されている。開始位置および終了位置は、データを読み出すのに必要な位置として記録されている。
セグメントのデータ位置を示す情報に関しては、GOPの先頭からの相対位置とすることができる。これによって、位置情報のデータサイズを小さくする事が出来る。
光ディスクでは、ある程度まとまったデータ単位でデータの読み込みを行う。このため、データの位置に関しては必ずしも厳密である必要はない。データの位置を示す単位を大きくすれば、位置情報のデータ量を削減することも可能である。
この例では、単一のタイムテーブルにスライスセグメントに関する情報も記録している。なお、スライスセグメント情報を別のテーブルに格納することも可能である。この場合には、タイムスタンプ情報、テーブル内でのエントリー位置などで、同一のGOPおよびIRAPピクチャに関する情報を取り出せるようにしておく。
パラメータセットを、さらに別のテーブルに格納する方法も考えられる。なぜなら、パラメータセットは、位置情報に比べるとサイズが大きいからである。また、パラメータセットは、画像の種類によってデータ長が変化するからである。以下においては、パラメータセットを、「パラメータセット(PS)」または「PS」とも表記する。
Iピクチャのスライスセグメント#1のみを用いて早送り再生を行う場合には、タイムテーブルで必要な情報は、時刻、IRAP開始位置および#2開始位置である。この場合には、#2開始位置はスライスセグメント#1の終了位置として利用される。
図20を用いてスライスセグメント#1のみを用いた早送り再生の説明を行う。図20では、一例として、ストリームデータを構成する6つのGOPが示される。以下においては、6つのGOPを、それぞれ、GOP(01)、GOP(02)、GOP(03)、GOP(04)、GOP(05)およびGOP(06)と表記する。GOP(01)からGOP(06)により、ストリームデータが構成される。本来、ストリームデータは一続きのデータファイルである。図20では、説明を容易にするため、GOP単位で行を変えて当該GOPを表わしている。図20のタイムテーブルTMSは、図18のタイムテーブルTMSである。タイムテーブルTMSは、時刻情報と画像データの位置とを対応付けている。図20では、図18のタイムテーブルTMSの一部が示される。
以下においては、スライス#1の開始位置を、「#1開始位置」ともいう。また、以下においては、スライス#1の終了位置を、「#1終了位置」ともいう。IRAP開始位置および#1開始位置は、同じ値としてタイムテーブルTMSにおいて兼用している。必要な値は、スライス#1の開始位置および終了位置である。IRAP開始位置を#1開始位置とみなし、#2開始位置を#1終了位置とみなしている。
早送り再生が行われる場合には、タイムテーブルTMSのエントリーを順次読み出す。各GOPのIRAP開始位置および#2開始位置に基づいて、このGOPのIピクチャの1番目のスライスセグメントのデータを読み出す。そして、このデータをデコードし、画像を表示する。IRAP開始位置は、スライスセグメント#1の開始位置である。#2開始位置は、スライスセグメント#1の終了位置である。
上記の処理を繰り返す事によって、早送り再生を行うことができる。この場合には、Iピクチャを全て表示する場合に比べて、読み出しデータ量が4分の1になっている。このため、早送り再生時の画像の更新間隔を短くする事ができる。
この例の場合には、表示が更新される領域は画像Gpの一部である。つまり、1番目のスライスセグメントの位置の画像Gs1のみが表示される。田の字型分割スライスセグメント構成において、更新される領域は、例えば、図20の画像Gs1の領域である。目の字型分割スライスセグメント構成において、更新される領域は、図17の画像Gs1の領域である。画像Gs2,Gs3,Gs4に対応する領域は更新されない。また、画像Gs2,Gs3,Gs4にそれぞれ対応する3つの領域では画像Gs2,Gs3,Gs4が表示されない。
利用者が早送り操作を行う場合には、目的のシーンを判別できればよい。そのため、画像全体が見える事よりも、画像の更新間隔の短い方が操作性を考慮すると良い場合も多い。
また、上記と同様な方法で、画像Gpにおいて、1番目のスライスセグメントの画像Gs1、および、2番目のスライスセグメントの画像Gs2を表示してもよい。このようにすれば、画像Gpの半分を利用して早送り再生を行うこともできる。
さらに、高速で早送り再生を行う場合には、表示するGOPを間引きして再生することができる。つまり、GOPを、1つ飛ばし、2つ飛ばし等で表示する。
早送り再生の操作では、リモコンの早送りボタンを複数回押す事で早送り速度を調整する事が出来るものが多い。従来のIピクチャ全体を表示する早送り再生と組み合わせて使う場合には、リモコンボタンを押す回数によって表示方式を選択することができる。
例えば、ボタンを1回押すと、全てのGOPのIピクチャの全体を表示して早送り再生を行う。ボタンを2回押すと、全てのGOPのIピクチャの一部のスライスセグメントのみを表示して早送り再生を行う。ボタンを3回押すと、GOPの1つ飛ばしを行って、Iピクチャの一部のスライスセグメントのみを表示して早送り再生を行う。ボタンを4回押すと、GOPの2つ飛ばしを行って、Iピクチャの一部のスライスセグメントのみを表示して早送り再生を行う。
放送ストリームが複数のスライスセグメントを持たない場合には、GOPの飛ばしを伴う特殊再生を行うことができない。放送を記録する際に、再圧縮またはフォーマット変換を行うことも多い。その際に、複数のスライスセグメントを持つHEVC映像ストリームとして再構成する事も可能である。放送以外の外部入力の映像を記録する場合でも、同様に、複数のスライスセグメントを持つHEVC映像ストリームとして圧縮データを作成する事で、GOPの飛ばしを伴う特殊再生を行う事ができる。
<変形例1>
これまでの説明では、早送り再生などの特殊再生の実行時に画像Gpの一部のみの更新でも良いとした。しかし、画像Gp全体が更新された方が目的のシーンを見つけやすいことも考えられる。そこで、読み出すデータは一部のスライスセグメントとしながら、画像Gp全体を更新する方法を考える。
これまでの説明では、早送り再生などの特殊再生の実行時に画像Gpの一部のみの更新でも良いとした。しかし、画像Gp全体が更新された方が目的のシーンを見つけやすいことも考えられる。そこで、読み出すデータは一部のスライスセグメントとしながら、画像Gp全体を更新する方法を考える。
図21は、変形例1に係る早送り再生の説明するための図である。本変形例では、タイムテーブルTMSにおける全てのスライスの位置情報を利用する。
早送り再生が行われる場合には、タイムテーブルTMSのエントリーを順次読み出す。最初のGOPのIRAP開始位置および#2開始位置に基づいて、このGOPのIピクチャの1番目のスライスセグメントのデータを読み出す。IRAP開始位置は、スライスセグメント#1の開始位置である。#2開始位置は、スライスセグメント#1の終了位置である。読み出されたデータをデコードして、図21のように、1番目のスライスセグメントに基づく画像Gs1を表示する。
次のGOPの#2開始位置および#3開始位置に基づいて、このGOPのIピクチャの2番目のスライスセグメントのデータを読み出す。#2開始位置は、スライスセグメント#2の開始位置である。#3開始位置は、スライスセグメント#2の終了位置である。このデータをデコードして、図21のように、2番目のスライスセグメントに基づく画像Gs2を表示する。
この時、スライスセグメント#2のデコードには、このGOPのピクチャのパラメータセット(PS)のデータが必要になる。パラメータセット(PS)は、ピクチャの先頭に配置されている。つまり、パラメータセット(PS)は、スライスセグメント#1の前に配置されている。このため、パラメータセット(PS)をスライスセグメント#1と同時に読み込む場合には、1度に読み込める。しかし、パラメータセット(PS)とスライスセグメント#2とを読み込む場合には、2回の読み込みが発生する。
光ディスクの読み出し動作では、読み出し位置の変更に時間がかかる。そのため、この時の読み込み動作としては次の3つの方法が考えられる。
1つ目の方法では、パラメータセット(PS)とスライスセグメント#2との2回の読み込み動作を行う。2つ目の方法では、パラメータセット(PS)、スライスセグメント#1およびスライスセグメント#2を一度に読み込む。3つ目の方法では、パラメータセット(PS)とスライスセグメント#2のデータとを使用する。そして、タイムテーブルを作成する時に、Iピクチャのデコードに必要なパラメータセット(PS)のデータのコピーをタイムテーブルに格納する。
ここでは、3つ目の方法を説明する。つまり、タイムテーブル内にパラメータセット(PS)のデータのコピーが格納されているものとして説明する。この場合には、タイムテーブルに格納されていたパラメータセット(PS)のデータとスライスセグメント#2のデータとをデコーダーに入力して、デコードを行う。
次のGOPでは、同様にスライスセグメント#3のデータを取り出し、図21のように、画像Gpにおけるスライスセグメント#3に対応する画像Gs3を更新する。これにより、より操作性の良い特殊再生を実現することができる。
このように画像Gsの更新のたびに、表示する画像Gsをずらしていく事によって、一回の更新は画像Gpの一部の更新であっても、数回の画像Gsの更新によって画像Gp全体を更新することができる。画像Gsの位置によって、異なる時刻の画像Gsが表示される。スライスセグメントごとに、異なる時刻の画像Gsが表示される。そのため、一部分の画像Gsの表示よりも、シーンの把握が容易になる。つまり、より操作性の良い特殊再生を実現することができる。
上記の処理では、1つのスライスセグメントで画像Gsの更新を行った。しかし、1つのGOPで複数のスライスセグメントの画像Gsを更新することができる。例えば、画像Gpの半分を交互に更新する事もできる。
上記の説明では、スライス番号の順にスライス#1、スライス#2、スライス#3、スライス#4の順番で画像Gsの更新を行った。画像Gsの更新の順番は、必ずしもスライス番号の順である必要はない。画像Gsの更新の順番は、任意の順番とすることができる。
図22は、田の字型分割スライスセグメント構成における画像Gsの更新の順番の例を示す図である。図22(a)は、スライス#1、スライス#2、スライス#3、スライス#4の順で画像Gsを更新する例である。図22(b)は、スライス#1、スライス#2、スライス#4、スライス#3の順で画像Gsを更新する例である。図22(b)では、時計回り方向で画像Gsを更新している。図22(c)は、スライス#1、スライス#4、スライス#3、スライス#2の順で画像Gsを更新する例である。図22(d)は、スライス#1、スライス#3、スライス#4、スライス#2の順で画像Gsを更新する例である。図22(d)では、反時計回り方向で画像Gsを更新している。
再生の時に表示対象となる、スライスセグメントの画像Gsを選択できる場合には、早送り再生の実行時と巻き戻し再生の実行時とで、画像Gsを更新する順番を逆にすることもできる。例えば、早送り再生の実行時には、画像Gsの更新の順番を、図22(b)の時計回り方向とする。一方、巻き戻し再生の実行時には、画像Gsの更新の順番を、図22(d)の反時計回り方向とする。このように、早送り再生と巻き戻し再生とで画像Gsの更新の順番を逆にすることによって、早送り再生の操作と巻き戻し再生の操作とを繰り返した場合でも、特殊再生の状態の把握が容易になり、操作性が向上する。
図23は、目の字型分割スライスセグメント構成における画像Gsの更新の順番の例を示す図である。目の字型分割スライスセグメント構成でも、早送り再生の実行時と巻き戻し再生の実行時とで、画像の更新の順番を逆にすることで、早送り再生および巻き戻し再生の把握が容易になる。例えば、早送り再生では、スライス#1からスライス#4に向けてスライスを順次更新する(図23(a))。そして、巻き戻し再生では、スライス#4からスライス#1に向けてスライスを順次更新する(図23(b))。
<変形例2>
前述の説明では、タイムテーブルTMSに全てのスライスセグメントへの読み出し位置情報を格納していた。タイムテーブルTMSのサイズを小さくするために、一部のスライスセグメントの読み出し位置情報だけをタイムテーブルTMSに記録する方法も考えられる。
前述の説明では、タイムテーブルTMSに全てのスライスセグメントへの読み出し位置情報を格納していた。タイムテーブルTMSのサイズを小さくするために、一部のスライスセグメントの読み出し位置情報だけをタイムテーブルTMSに記録する方法も考えられる。
図24では、1つのスライスセグメントの読み出し位置情報を格納したタイムテーブルTMSを示している。
この例では、タイムテーブルTMSに、当該タイムテーブルTMSの各時刻に対応するスライスセグメントの読み出し位置の情報を格納している。例えば、タイムテーブルTMSにおいて、GOP(01)およびGOP(05)に対応する行には、スライスセグメント#1の読み出し位置情報が格納されている。図24では、例えば、GOP(01)の情報はタイムテーブルTMSの1行目に記載されている。また、GOP(05)の情報はタイムテーブルTMSの5行目に記載されている。
ストリームを記録する際に、記録するGOPを順次カウントする。そして、このGOPのカウント値を1つの画像Gpにおけるスライスセグメント数で割った余りである剰余を求める。図24では、1つの画像Gpにおけるスライスセグメント数は4である。この剰余としての値に1を足した値をスライスセグメントの値とする。そして、当該スライスセグメントの位置をタイムテーブルTMSに記録する。
この例では、各時刻のスライス開始位置とスライス終了位置とには情報が記載されている。スライスの順番は、スライス#1、スライス#2、スライス#3、スライス#4の順番である。図24では記載を省略しているが、IRAP開始位置およびIRAP終了位置などもタイムテーブルTMSに記録される。これは、他の特殊再生または従来のIRAP画像全体の表示との互換のためである。
このタイムテーブルTMSを用いて早送り再生などの特殊再生を行う場合には、GOPを飛ばさずに早送り再生を行うと、画像Gp全体が更新される。また、例えば、GOPを1つずつ飛ばして再生すると、スライス#1とスライス#3とが更新される。また、例えば、GOPを3つずつ飛ばしで再生すると、スライス#1が更新される。
早送り再生の倍速にかかわらず、画像Gp全体を更新するためには、タイムテーブルTMSに読み出し位置情報を格納する際に、乱数、疑似乱数などを用いてスライスセグメントを選択することもできる。この場合には、画像Gpにおいて更新されるスライスセグメントは不規則である。しかし、早送り再生の倍数などによらず、画像Gp全体を更新することができる。
疑似乱数の生成手段としては、例えば、M系列を用いた線形帰還シフトレジスタなどが挙げられる。
M系列を用いた疑似乱数生成では、値数および回数を指定して、各値の出現確率が一様で指定回数の間に周期性の無いデータ列を生成することができる。値数は、例えば、1から4の4値である。回数は、例えば、1000回である。
例えば、これらの疑似乱数の生成手段を用いてタイムテーブルTMSを作成すれば、タイムテーブルTMSの中で同じパターンの繰り返しが発生しないように、スライスセグメントを選択することができる。これによって、早送り再生の倍速を変更した場合でも、特定のスライスセグメントだけが更新されることを防ぐことができる。必ずしも、タイムテーブルTMSの全体で同じパターンの繰り返しを無くす必要はない。十分に長い周期で同じパターンを繰り返せば、実用上問題は無い。十分に長い周期は、例えば、1000行程度である。
タイムテーブルTMS全体で周期性が発生しないように、この疑似乱数の回数を選択する。しかし、疑似乱数の周期性を長く設定すると演算量が多くなる。そして、乱数のデータ列として予め与える場合でも、データ量が多くなる。
早送り再生の操作または巻き戻し再生の操作の際には、主にスキップ量の少ない早送り再生または巻き戻し再生が利用される。例えば、GOPのスキップを行わない処理、1から数十程度のGOPのスキップを行う処理等が行われる。そのため、疑似乱数の周期を短く設定することができる。
一例として、1000行程度の周期性を持つタイムテーブルTMSを使用する場合を考える。このタイムテーブルTMSでは、999のGOPをスキップした時に、一部の画像Gsのみが更新されるという問題が発生する。しかし、999のGOPをスキップした時の早送り再生と巻き戻し再生とは、周期性を持つタイムテーブルTMSはあまり利用されない。また、999のGOPをスキップする場合に代わって、1000のGOPをスキップすることを採用しても、利用者から見た早送り再生の倍速は、ほとんど変わらない。このため、上記の問題を容易に回避できる。
GOPの長さの平均を0.5秒とすると、2時間の映像は14400個のGOPで構成される。そして、1000行の周期性は、2時間の映像で15回程度発生することになる。周期性が問題になるのは、2時間の映像を15コマで再生する早送り再生の時である。通常は、このような高速の早送り再生の操作は行われない。
この場合の疑似乱数列を事前に、計算済み乱数表として制御プログラムに与える場合の乱数表のサイズを見積もる。値数が4値で、回数が1000回の乱数列において、各乱数を2ビットで表現する。この場合には、乱数表のサイズは、250バイトのサイズとなる。疑似乱数の周期性の長さは、操作性と装置実装との関係で設定することができる。
<変形例3>
これまでの例では、スライスセグメントの表示位置を変更する場合には、タイムテーブルTMSにスライスセグメントの読み出し位置および終了位置を格納していた。また、必要な場合には、タイムテーブルTMSにパラメータセット(PS)を格納していた。そのため、タイムテーブルTMSのデータが大きくなる。また、パラメータセット(PS)およびスライスセグメントの読み出しという、2回の読み出しが発生する。
これまでの例では、スライスセグメントの表示位置を変更する場合には、タイムテーブルTMSにスライスセグメントの読み出し位置および終了位置を格納していた。また、必要な場合には、タイムテーブルTMSにパラメータセット(PS)を格納していた。そのため、タイムテーブルTMSのデータが大きくなる。また、パラメータセット(PS)およびスライスセグメントの読み出しという、2回の読み出しが発生する。
映像ストリームの記録の際に、スライスセグメントの順序を入れ替えることによって、これらの余分な作業を回避し、効率のよい特殊再生を行うことができる。
図25は、変形例3に係る早送り再生を説明するための図である。図20と同様にGOP(01)からGOP(06)により、ストリームデータが構成される。本来、ストリームデータは一続きのデータファイルである。図25では、説明を容易にするために、GOP単位で行を変えて当該GOPを表わしている。図25では、タイムテーブルTMSの一部が示される。
図25のストリームでは、GOPの先頭にあるIRAPピクチャごとに、スライスセグメントの格納順を変更している。ここで、スライスセグメントの番号(例えば、#1)は、画像Gpの表示位置を示している。この表示位置に表示されるスライスセグメントの番号を、ストリームデータ上の番号として示している。
図25では、一例として、次のようにデータを配置している。GOP(01)には、IRAPピクチャの先頭にスライスセグメント#1を配置している。GOP(02)には、IRAPピクチャの先頭にスライスセグメント#2を配置している。GOP(03)には、IRAPピクチャの先頭にスライスセグメント#3を配置している。GOP(04)には、IRAPピクチャの先頭にスライスセグメント#4を配置している。GOP(05)には、IRAPピクチャの先頭にスライスセグメント#1を配置している。GOP(06)には、IRAPピクチャの先頭にスライスセグメント#2を配置している。
これまでの説明では、データ分割の観点から、単にスライスセグメントを使用して説明してきた。しかし、表示位置も含めた管理は、HEVC規格のスライスセグメントの他に、タイルを用いて実現されている。そのため、タイムテーブルのスライスセグメントの格納位置を入れ替える場合には、必要に応じて、各スライスセグメントのスライスヘッダ情報、タイル情報などを修正して、整合性を取る必要がある。タイル情報は、パラメータセットに含まれている。
早送り再生が行われる場合の処理は、図20を用いて説明した処理と同一である。図20を用いて説明した処理は、スライスセグメント#1のみの再生を行う処理である。ただし、図25の例では、各GOPのIRAPピクチャの先頭に置かれるスライスセグメントが入れ替えられている。このため、画像Gsの更新のためにスライスセグメントが変化し、画像Gp全体が更新される。
単純な順序で先頭に配置されたスライスセグメントを選択する場合には、早送り再生によって一部のスライスセグメントの画像Gsだけが更新される。そこで、前述の乱数、疑似乱数などを用いる方式で、先頭に配置するスライスセグメントを決定することができる。
このように、記録時のスライスセグメントの順番を入れ替える事によって、早送り再生、巻き戻し再生等の特殊再生によるシーンサーチの操作性を向上する事が可能である。
これまで、スライスセグメントの分割形態として4分割を例にして説明をしてきた。これは、日本の4K/8K放送で採用されているためである。
実際には、放送の録画時または光ディスクへの記録時に、再圧縮またはフォーマット変換などを行うこともある。この場合には、4分割だけでなく、スライスセグメントの分割の形式を自由に変更することができる。
例えば、1つの画像Gpを3×3の9分割にすることもできる。この場合には、中心のセグメントのみを特殊再生で更新することも考えられる。なぜなら、中心のセグメントには重要な情報が含まれる可能性が高いからである。また、単純に2分割のスライスセグメントとすることができる。2つのセグメントを交互に更新することで特殊再生を行うこともできる。
また、これまでの説明では、記憶デバイスとして光ディスクを使用した例で説明したが、ハードディスクドライブ(HDD)、SSD(solid state drive)など、他の記憶デバイスを使用しても、同様の効果が得られる。
ネットワークなど伝送帯域で制限があり、データ転送の遅延が大きい場合でも、特殊再生の実行時のデータ転送量を抑制し、操作性を向上させることも可能である。
実施の形態4.
実施の形態4の課題は、実施の形態3の課題と同様である。つまり、実施の形態4は、8K放送を録画したディスクで早送り再生などの特殊再生を行うと、1コマ分の画像Gpを表示するのに時間がかかってしまうという課題に対応する。以下においては、画像Gpを、「画面」ともいう。また、以下においては、表示するための画像を、「表示画面」ともいう。表示画面は、画像Gsまたは画面である。
実施の形態4の課題は、実施の形態3の課題と同様である。つまり、実施の形態4は、8K放送を録画したディスクで早送り再生などの特殊再生を行うと、1コマ分の画像Gpを表示するのに時間がかかってしまうという課題に対応する。以下においては、画像Gpを、「画面」ともいう。また、以下においては、表示するための画像を、「表示画面」ともいう。表示画面は、画像Gsまたは画面である。
例えば、特開2006-245744号公報(段落0016-0020、第2図)には、情報記録媒体に保存されたIピクチャのアドレスと、算出されたIピクチャの再生予定時刻を含むアクセスタイムテーブルを作成することが記載されている。そして、特殊再生の実行時に、アクセスタイムテーブルの再生予定時間を参照して、Iピクチャの再生が行われる。もしIピクチャの復号に時間がかかれば再生予定時間に再生が行えなくなってしまう。
実施の形態3では、画面としての画像Gpを複数のスライスセグメントに分割する。そして、特殊再生の実行時にはスライスセグメント単位で部分的に表示画面を更新する。これによって、画像としてのIピクチャの更新間隔を短くし、特殊再生の実行時の応答性を向上させている。以下においては、映像のシーンを、「映像シーン」ともいう。
しかしながら、画面としての画像Gpの一部を更新する場合には、映像シーンの視認性が低下する場合がある。例えば、異なるシーンの画像が画面に混在する場合である。
実施の形態4では、実施の形態3の方法を利用しつつ、表示されている映像シーンを把握しやすいように構成した。実施の形態4に係る映像再生装置は、特殊再生が行われる際にスライスセグメント単位で表示画面の更新をする場合でも、映像シーンの視認性の低下を抑えることができる。以下においては、表示画面の更新を、「表示更新」ともいう。
また、実施の形態4では、タイムテーブルTMSに「映像シーンの連続性」の情報を付与する。「映像シーンの連続性」の情報は、図26の「シーン連続性番号」である。また、タイムテーブルTMSに「画面表示更新すべき優先スライスセグメント」の情報を付与する。「画面表示更新すべき優先スライスセグメント」の情報は、図26の「優先スライス情報」である。
以下においては、実施の形態4において使用するタイムテーブルTMSを、「タイムテーブルTMSN」ともいう。「タイムテーブルTMSN」は、図18のタイムテーブルTMSに対して、「シーン連続性番号2601」および「優先スライス情報2602」を付与した当該タイムテーブルTMSである。
実施の形態4では、目の字型分割スライスセグメント構成を使用する処理について説明する。なお、本実施の形態は、田の字型分割スライスセグメント構成にも適用可能である。また、本実施の形態は、画像が縦方向に8分割された構成のように、5つ以上の分割スライスセグメントを使用した構成にも適用可能である。ここで、分割の構成を「行列」で説明すると、目の字型分割スライスセグメント構成は画像Gpを4行に分割した構成である。同様に、田の字型分割スライスセグメント構成は画像Gpを2行2列に分割した構成である。
図26は、実施の形態4に係るタイムテーブルTMSNの一例を示す図である。タイムテーブルTMSNにおける「シーン連続性番号2601」および「優先スライス情報2602」以外の構成要素については、図18と同様のため説明を省略する。タイムテーブルTMSNは、複数のエントリーを示す。各エントリーはランダムアクセス可能なIピクチャの情報を示す。また、各エントリーには当該Iピクチャが関連付けられている。
シーン連続性番号2601は、「映像シーンの連続性」を示す指標となる情報である。シーン連続性番号2601は、数値情報でもよく、フラグなどの情報でもよい。実施の形態4では、シーン連続性番号2601に0から255までの数値が設定されるものとして説明する。この指標となる情報を作成する場合には、まず、各エントリーに対応するIピクチャの画像毎にヒストグラムを作成する。ヒストグラムは画像中の各色のピクセル数を測定した色分布情報である。各画像のヒストグラムを比較することによって、容易に類似画像か否かを判別できる。
このような比較を用いて、前のエントリーの画像と現在のエントリーの画像とが類似画像であるか否かを判別する。類似画像である場合、前のエントリーおよび現在のエントリーの各々のシーン連続性番号2601を同じ値に設定する。類似画像でない場合には、前のエントリーのシーン連続性番号2601の値をインクリメントして値を設定する。つまり、シーン連続性番号2601の値を1増やす演算を行う。
本実施の形態4では、シーン連続性番号2601の値を0から255の範囲で設定している。このため、最大値である255をインクリメントする場合には、巡回して0の値がシーン連続性番号2601に設定されるものとする。本実施の形態ではシーン連続性番号2601の値を0から255までの範囲の値としている。しかし、シーン連続性番号2601の値の範囲は0から255までの範囲より狭くてもよい。また、シーン連続性番号2601の値の範囲は0から255までの範囲より広くてもよい。
実施の形態4では、比較的簡単で処理負荷が少ないヒストグラムによる類似画像の比較を行っている。なお、画像内のオブジェクト形状、テクスチャまたは特徴量を用いて類似画像か否かを判別してもよい。
優先スライス情報2602は、画面の把握に重要な情報が当該画面のどの部分に集中しているかを示す。そのため、優先スライス情報2602は、特殊再生の実行時にどのスライスセグメントを更新させるかを決定する際に用いられる。以下においては、更新の対象となる、スライスセグメントの表示画面を、「優先スライスセグメント」または「優先スライス」ともいう。優先スライス情報2602は、「画面表示更新すべき優先スライスセグメント」を示す情報である。以下においては、画面の中央を、「画面中央」ともいう。
優先スライス情報は、画面中央が重要であることを示す1ビットのフラグ情報としてもよい。また、優先スライス情報は、画面を複数に分割して、分割された画面毎に重要性を示す数値情報でもよい。
実施の形態4では、優先スライス情報2602が、画面中央が重要であることを示す1ビットフラグであるとして説明する。ここで、目の字型分割スライスセグメント構成を使用するとする。例えば、映画のように、画面の上部および下部に黒帯が存在するコンテンツの場合には、画面の最上部のスライスセグメント#1と画面の最下部のスライスセグメント#4は、黒帯を含む。そのため、スライスセグメント#1とスライスセグメント#4とは、ユーザーが画像を認識するための有用な映像情報が少ない。また一般的な番組でもユーザーに提示したい情報を画面の中央部に配置することが多い。
このような番組の場合には、表示画面の更新を行う箇所を、画面の中央部に制限した方が、ユーザーは映像シーンを認識しやすくなる。
実施の形態4では、図23の目の字型分割スライスセグメント構成を使用する処理について説明する。また、タイムテーブルTMSNのエントリー毎に1ビットの優先スライス情報2602を持つものとして説明する。以下においては、ビット値が「1」である当該ビット値を「1b」と表現する。また、以下においては、ビット値が「0」である当該ビット値を「0b」と表現する。
例えば、優先スライス情報2602の値が「1b」である場合には、更新対象を、画面中央のスライスセグメントであるスライスセグメント#2およびスライスセグメント#3に限定して、順番に表示画面を更新する。一方、優先スライス情報2602の値が「0b」である場合には、表示画面の更新の制限を行わない。つまり、スライスセグメント#1からスライスセグメント#4までの表示画面を順番に更新する。
優先スライス情報2602を生成する際には、スライスセグメントの表示画面毎にヒストグラムを作成する。例えば、スライスセグメント#1の表示画面およびスライスセグメント#4の表示画面に黒色のピクセルが多く含まれている場合には、画面が示す番組は、当該画面の上部および下部に黒帯がある映画であると判定できる。その場合には、優先スライス情報2602に「1b」を設定する。
実施の形態4では、優先スライス情報2602として1ビット情報を持つものとして説明する。なお、優先スライス情報2602は、画像が4分割された状況において、スライスセグメント毎に当該スライスセグメントの表示画面の更新の有無を設定するための4ビット情報であっても良い。また、優先スライス情報2602は、2ビット情報であってもよい。この場合、例えば、「00」を示す優先スライス情報2602は優先スライスがないことを示す。「01」を示す優先スライス情報2602は画像の縦方向の中央部分が優先スライスであることを示す。「10」を示す優先スライス情報2602は画像の横方向の中央部分が優先スライスであることを示す。「11」を示す優先スライス情報2602は画像の縦方向および横方向の中央部分が優先スライスであることを示す。
また、実施の形態4では、目の字型分割スライスセグメント構成において中央部分のスライスセグメント#2,#3が重要であることをフラグ情報として記録する例を示す。なお、別の例として、画像が横方向に4分割された構成における4つのスライスセグメントのうち中央部分のスライスセグメントが重要であることをフラグ情報として記録させても良い。さらに、画面を縦3×横3(すなわち、3行3列)の9つの部分にスライスセグメントを分割する場合には、当該画面の中央部分だけが重要であることをフラグ情報が示しても良い。
また、実施の形態4では、タイムテーブルTMSNにおいてエントリー毎に優先スライス情報2602を持つ例を示している。なお、タイムテーブルTMSNの全てのエントリーに対して1つの優先スライス情報2602を設定しても良い。
図27は、シーン連続性番号を使用した処理の効果を説明するための図である。図27は、特殊再生の実行時の映像シーンを示す。映像シーン2700は、オリジナル画像である。特殊再生の実行時の映像シーン2700は、映像シーン#01から映像シーン#05に順番に切り換わる。映像シーン#01から映像シーン#03までは類似の映像シーンである。映像シーン#01から映像シーン#03まででは、一例として、数字の「1」が右側に移動している。同様に、映像シーン#04から映像シーン#05は類似の映像シーンである。映像シーン#04から映像シーン#05まででは、一例として、数字の「2」が右側に移動している。また、表示画面の更新対象となる、スライスセグメントの位置を更新スライス箇所2710として、矢印で示している。
シーンの連続性制御を行わない場合の映像シーンの表示例を映像シーン2701に示す。映像シーン#11は、映像シーン#01と同じである。映像シーン#12では、映像シーン#11に対して、スライスセグメント#2のみが映像シーン#02のスライスセグメント#2に切り換わっている。映像シーン#13では、映像シーン#12に対して、スライスセグメント#3のみが映像シーン#03のスライスセグメント#3に切り換わっている。映像シーン#14では、映像シーン#13に対して、スライスセグメント#4のみが映像シーン#04のスライスセグメント#4に切り換わっている。映像シーン#15では、映像シーン#14に対して、スライスセグメント#1のみが映像シーン#05のスライスセグメント#1に切り換わっている。
映像シーン#13に対し類似の映像シーンでなくなった映像シーン#14は、オリジナルの映像シーン#04とかなり異なる映像になる。類似の映像シーンでないとは、つまりシーンが連続でなくなったことである。同様に、映像シーン#15もオリジナルの映像シーン#05とかなり異なる映像になる。
また、映像シーン#14および映像シーン#15には、オリジナル画像の類似映像である映像シーン#01から#03までの画像と、全く別の映像シーン#04から#05のスライスセグメントの表示画面が混在して表示されている。そのため、ユーザーは映像シーンの把握が困難となる。
シーンの連続性制御を行う場合の映像シーンの表示例を映像シーン2702に示す。映像シーン#21は、映像シーン#01と同じである。映像シーン#22では、映像シーン#21に対して、スライスセグメント#2のみが映像シーン#02のスライスセグメント#2に切り換わっている。つまり、映像シーン#22は、映像シーン#12と同じである。映像シーン#23では、映像シーン#22に対して、スライスセグメント#3のみが映像シーン#03のスライスセグメント#3に切り換わっている。つまり、映像シーン#23は、映像シーン#13と同じである。映像シーン#24では、スライスセグメント#1から#4までの全てが映像シーン#04に切り換わっている。つまり、映像シーン#24は、映像シーン#04と同じである。映像シーン#25では、映像シーン#24に対して、スライスセグメント#2のみが映像シーン#05のスライスセグメント#2に切り換わっている。
シーンの連続性制御を行う場合には、類似の映像シーンが切り換わった後の映像シーン#24では、スライスセグメント#1から#4に対して表示画面の更新を行う。このように構成することによって、ユーザーは、類似の映像シーンが切り換わっても映像シーンを把握しやすくなる。
図28は、シーン連続性番号2601を用いた表示画面の更新を行うシーケンスを示すフローチャートである。
特殊再生の実行が指示されると、まず、タイムテーブルTMSNから、表示画面に対応するエントリーのシーン連続性番号2601を読み込む。その後、Iピクチャの全てのスライスセグメントに対して表示画面を更新する(S2801)。
次に、特殊再生の停止の指示の有無を確認する(S2802)。特殊再生の停止の指示があれば(S2802:yes)、特殊再生の処理を停止する(S2809)。特殊再生の停止の指示がない場合には(S2802:no)、ステップS2803に移る。
ステップS2803では、タイムテーブルTMSNから再生位置のエントリーの読み込みを行う(S2803)。再生位置とは、タイムテーブルTMSNにおける、「時刻」に対応する位置である。エントリーの読み込みの際、特殊再生の再生速度に応じて、エントリーの読み込み方法を決める。例えば、全てのエントリーを読み込むか、一部のエントリーを読み込むか等を決定する。一部のエントリーとは、再生速度に応じて、エントリーを1つおきに読み込んだり、2つおきに読み込んだりすることで、間引かれたエントリーを示す。
そして、読込んだエントリーのシーン連続性番号2601の読込みを行う。そして、読込んだシーン連続性番号2601と、1つ前の再生位置のシーン連続性番号2601とを比較する(S2804)。1つ前の再生位置のシーン連続性番号2601とは、当該読込んだエントリーの1つ前のエントリーのシーン連続性番号2601である。
そして、2つのシーン連続性番号2601を比較して、当該2つのシーン連続性番号2601に対応する2つの映像シーンが同じであるか否かを判定する(S2805)。比較対象の2つのシーン連続性番号2601の値が同じである場合、映像シーンが同じであると判定する。一方、比較対象の2つのシーン連続性番号2601の値が異なる場合、映像シーンが異なると判定する。
ステップS2805で映像シーンが同じであると判定した場合には、次のスライスセグメントだけを読み出す。そして、読み出したスライスセグメントの表示画面の更新を行う(S2806)。
ステップS2805で映像シーンが異なると判定した場合には、特殊再生の再生速度が低速か否かを判定する(S2807)。例えば、特殊再生の速度が10倍速以下の速度を低速とする。同様に、特殊再生の速度が10倍速を超える場合の当該速度を高速とする。なお、高速と低速の境は10倍速に限定しない。
ステップS2807で特殊再生の再生速度が高速であると判定された場合には、映像シーンを飛ばす幅が大きくなる。この場合には、比較の対象となる2つのシーン連続性番号2601の値が異なる可能性が高くなる。このような場合には、表示更新の応答性を重視して、ステップS2806に移動する。そして、次のスライスセグメントの表示画面の更新を行う。ステップS2806の処理の後は、ステップS2802に戻る。
ステップS2807で特殊再生の再生速度が低速であると判定された場合には、全てのスライスセグメントに対して表示画面を更新する(S2808)。特殊再生の速度が低速である場合には、ユーザーは所望の映像シーンを探している可能性が高い。そのため、応答性よりも画面の把握性を重視する。
なお、ステップS2807の特殊再生の再生速度に基づいた処理を行わず、ステップS2808へ移動してもよい。この場合、ステップS2808の処理の後は、ステップS2802に戻る。
図29は、優先スライス情報を使用した処理の効果を説明するための図である。図29は、優先スライス情報2602を用いた処理における映像シーンの表示例を示す。映像シーン2900は、オリジナル画像である。特殊再生の実行時の映像シーン2900は、映像シーン#A1から映像シーン#A5に順番に切り換わる。映像シーン#A1から映像シーン#A3は類似の映像シーンである。映像シーン#A1から映像シーン#A3まででは、一例として、アルファベットの「A」が右側に移動している。同様に、映像シーン#A4から映像シーン#A5は類似の映像シーンである。映像シーン#A4から映像シーン#A5まででは、一例として、アルファベットの「B」が右側に移動している。また、図29における映像シーン#A1から映像シーン#A5には、画面の上下に黒帯が付与されている。また、表示画面の更新対象となる、スライスセグメントの位置を更新スライス箇所2710として、矢印で示している。
優先スライス制御を行わない場合の映像シーンの表示例を映像シーン2901に示す。映像シーン#B1は、映像シーン#A1と同じである。映像シーン#B2では、映像シーン#B1に対して、スライスセグメント#2のみが映像シーン#A2のスライスセグメント#2に切り換わっている。映像シーン#B3では、映像シーン#B2に対して、スライスセグメント#3のみが映像シーン#A3のスライスセグメント#3に切り換わっている。映像シーン#B4では、映像シーン#B3に対して、スライスセグメント#4のみが映像シーン#A4のスライスセグメント#4に切り換わっている。映像シーン#B5では、映像シーン#B4に対して、スライスセグメント#1のみが映像シーン#A5のスライスセグメント#1に切り換わっている。
映像シーン#B3に対し類似の映像シーンでなくなった映像シーン#B4は、オリジナルの映像シーン#A4とかなり異なる映像になる。類似の映像シーンでないとは、つまりシーンが連続でなくなったことである。同様に、映像シーン#B5もオリジナルの映像シーン#A5とかなり異なる映像になる。
異なる映像になる理由として、映像シーン#B4および映像シーン#B5において、画面の上下に存在する黒帯部分の表示領域の更新を行っていることが挙げられる。ユーザーが画面を把握するための領域は黒帯部分以外の表示領域である。このため、黒帯部分の更新だけでは、ユーザーは画面の更新を認識できない。その結果、映像シーン#B4および映像シーン#B5には、オリジナル画像である映像シーン#A4および映像シーン#A5の画面情報がほとんど表示されない。このため、ユーザーがオリジナルの画像を認識することは困難となる。
優先スライス制御を行う場合の映像シーンの表示例を映像シーン2902に示す。映像シーン#C1は、映像シーン#A1と同じである。映像シーン#C2では、映像シーン#C1に対して、スライスセグメント#3のみが映像シーン#A2のスライスセグメント#3に切り換わっている。映像シーン#C3では、映像シーン#C2に対して、スライスセグメント#2のみが映像シーン#A3のスライスセグメント#2に切り換わっている。映像シーン#C4では、映像シーン#C3に対して、スライスセグメント#3のみが映像シーン#A4のスライスセグメント#3に切り換わっている。映像シーン#C5では、映像シーン#C4に対して、スライスセグメント#2のみが映像シーン#A5のスライスセグメント#2に切り換わっている。
この例では、画面の把握に不要なスライスセグメントの表示画面の更新を行わない。これによって、画面の更新頻度と画面の認識性とを両立した特殊再生の表示方式となる。この例の映像シーン#C5部分では、オリジナル画像である映像シーン#A5に近い画像が表示されている。
図30は、優先スライス情報2602を用いた表示画面の更新を行うシーケンスを示すフローチャートである。
特殊再生の実行が指示されると、表示画面に対応するエントリーの優先スライス情報2602を読み込む。
優先スライス情報2602が「0b」の場合には、全てのスライスセグメントに対して表示画面を更新する。一方、優先スライス情報2602が「1b」の場合には、画面の中央部分にあるスライスセグメント#2およびスライスセグメント#3に限定して表示画面を更新する(S3001)。
次に、特殊再生の停止の指示の有無を確認する(S3002)。特殊再生の停止の指示があった場合には(S3002:yes)、特殊再生の処理を終了する(S3008)。特殊再生の停止の指示がない場合には(S3002:no)、ステップS3003に移る。
ステップS3003では、ステップS2803と同様に、タイムテーブルTMSNから再生位置のエントリーの読込みを行う(S3003)。エントリーの読み込みの際、特殊再生の再生速度に応じて、エントリーの読み込み方法を決める。例えば、全てのエントリーを読み込むか、一部のエントリーを読み込むか等を決定する。一部のエントリーとは、再生速度に応じて、エントリーを1つおきに読み込んだり、2つおきに読み込んだりすることで、間引かれたエントリーを示す。
そして、読込んだエントリーに優先スライス情報2602があるか否かを判定する(S3004)。エントリーに優先スライス情報2602がある場合、当該優先スライス情報2602の設定値に基づく、表示領域の制限が確認される。
ステップS3004で優先スライス情報2602の値が「1b」であれば、スライスセグメント#1およびスライスセグメント#4の画面の表示領域を黒塗りする(S3005)。
上述のように、例えば、優先スライス情報2602の値が「1b」である場合には、画面中央のスライスセグメントであるスライスセグメント#2およびスライスセグメント#3に限定して、順番に表示画面を更新する。一方、優先スライス情報2602の値が「0b」である場合には、スライスセグメント#1からスライスセグメント#4までの表示画面を順番に更新する。
実施の形態4では、優先スライス情報が設定されていれば画面の中央部に限定して表示画面の更新を行う。このため、画面の最上部および最下部のスライスセグメントの表示領域を黒塗りする。なお、ステップS3005の画面の黒塗り処理を行わなくてもよい。この場合には、例えば、以前のスライスセグメントの画像がそのまま表示される。
そして、画面の中央部であるスライスセグメント#2およびスライスセグメント#3に限定して、順次、スライスセグメントの表示画面の更新を行う(S3006)。
一方、ステップS3004で優先スライス情報2602の値が「0b」であれば、全てのスライスセグメントに対し、順次、スライスセグメントの表示画面の更新を行う(S3007)。つまり、この場合には、特に画面の表示制限はない。
実施の形態4のように構成することで、特殊再生の実行時にスライスセグメント単位で表示画面の更新を実施する際でも、表示画面の更新の応答性に優れ、表示画面の映像シーンが把握しやすい映像再生装置を提供することができる。
また、シーン連続性番号2601と優先スライス情報2602との両方を用いて特殊再生の実行時の表示制御を行ってもよい。この場合、ステップS3006の処理時にシーンが連続でなければ、すべての優先スライスが更新される。同様に、ステップS3007の処理時にシーンが連続でなければ、全てのスライスが更新される。
なお、タイムテーブルTMとタイムテーブルTMSNとを同一のテーブル情報として記録してもよい。また、タイムテーブルTMとタイムテーブルTMSNとを別テーブルとして管理し、別ファイルとして記録してもよい。
タイムテーブルTMとタイムテーブルTMSNとを別ファイルとして記録した場合には、タイムテーブルTMを構成しているエントリーとタイムテーブルTMSNとを同一のエントリーとして関連付けて記録する。タイムテーブルTMが編集されるとタイムテーブルTMSNとの情報のマッチングがとれなくなる。このため、タイムテーブルTMSNにタイムテーブルTMのハッシュ情報を記録しておき、再生前にタイムテーブルTMSNとタイムテーブルTMとの関連付けが正常であるか否かを確認するよう構成しても良い。
優先スライス情報2602が、タイムテーブルTMSNに存在する例を示したが、優先スライス情報2602は、タイムテーブルTMSNの外に保持されてもよい。この場合、エントリー毎に優先スライスを設定できないため、関連するすべてのエントリーで同一の設定が行われる。
実施の形態5.
実施の形態5の課題は、実施の形態4の課題と同様である。つまり、実施の形態5は、8K放送等を録画したディスクで早送り再生などの特殊再生を行うと、1コマ分の画像を表示するのに時間がかかってしまうという課題に対応する。
実施の形態5の課題は、実施の形態4の課題と同様である。つまり、実施の形態5は、8K放送等を録画したディスクで早送り再生などの特殊再生を行うと、1コマ分の画像を表示するのに時間がかかってしまうという課題に対応する。
以下においては、放送ストリームの再生により表現される映像シーンを把握するための、意味的な重要度を、「意味的重要度」ともいう。また、以下においては、意味的重要度を示す情報を、「スライス重要度情報」ともいう。また、以下においては、意味的重要度を、簡略化して、「重要度」ともいう。スライス重要度情報は、映像シーン毎に当該映像シーンを構成する複数のスライスセグメントの各々の意味的重要度を示す。
実施の形態5では、実施の形態4の方法を利用しつつ、表示されている映像シーンを把握しやすいように構成した。実施の形態5に係る映像再生装置100は、特殊再生を行う際にスライスセグメント単位で表示画面の更新を行う場合でも、映像シーンの意味的重要度が高いスライスセグメントを優先して再生し、当該スライスセグメントを表示する。そのため、映像シーンの検索性を上げることができる。
実施の形態4では、画面の上部から画面の下部に向けて、順番に、スライスセグメントの表示更新を行う。そのため、各スライスセグメントにおいて、表示更新が行われる確率が均一の確率となるよう構成されている。例えば画面の特定箇所に、映像シーンを把握するための重要な情報が配置されている場合であっても、表示するスライスセグメントの表示画面は所定の均一な割合で更新される。画面の特定箇所は、例えば、画面における最上部のスライスセグメントである。
例えば、野球、サッカーなどを示す画面の最上部には、得点、時間等の表示が行われる。そのため、画面の最上部の表示更新が多くなるほど映像シーンの把握が容易となる。また、ドラマ、映画などでは、画面中央のスライスセグメントに演者が配置される可能性が高いため、画面中央が重要となる。また、ニュースなどの、字幕表示が多い番組であれば、画面下部の情報が映像シーンの把握には重要となる。
実施の形態5では、映像シーンにおける、当該映像シーンの把握に重要なスライスセグメントを優先して再生して表示するとともに、他のスライスセグメントと比較して、表示頻度を高くするよう構成する。その結果、ユーザーは映像シーンを把握することが容易となり、映像シーンの検索性を上げることができる。
実施の形態5では、タイムテーブルTMSに「スライスセグメントの意味的な重要度」の情報を付与する。「スライスセグメントの意味的な重要度」の情報は、図31の「スライス重要度情報」である。
以下においては、実施の形態5において使用するタイムテーブルTMSを、「タイムテーブルTMSN2」ともいう。「タイムテーブルTMSN2」は、図18のタイムテーブルTMSに対して、「スライス重要度情報3101」を付与した当該タイムテーブルTMSである。
実施の形態5では、目の字型分割スライスセグメント構成を使用する処理について説明する。なお、本実施の形態は、田の字型分割スライスセグメント構成にも適用可能である。また、本実施の形態は、画像が縦方向に8分割された構成のように、5つ以上の分割スライスセグメントを使用した構成にも適用可能である。ここで、分割の構成を「行列」で説明すると、目の字型分割スライスセグメント構成は画像Gpを4行に分割した構成である。同様に、田の字型分割スライスセグメント構成は画像Gpを2行2列に分割した構成である。
図31は、実施の形態5に係るタイムテーブルTMSN2を示す図である。タイムテーブルTMSN2におけるスライス重要度情報3101以外の構成要素については、図18と同様のため説明を省略する。タイムテーブルTMSN2は、複数のエントリーを示す。各エントリーはランダムアクセス可能なIピクチャの情報を示す。また、各エントリーには当該Iピクチャが関連付けられている。
スライス重要度情報3101は、映像シーンを把握するための重要度を示す情報である。スライス重要度情報3101の重要度は、数値、フラグなどの情報で表現される。実施の形態5では、スライス重要度情報3101の重要度は、0から99までの数値で表現されるものとして説明する。スライス重要度情報3101の重要度が数値で表現される場合、当該数値が大きいほど、当該スライス重要度情報3101に対応する映像シーンの重要度は高い。
なお、重要度を表現する数値の範囲は、0から99までの範囲に限定されず、0から99までの範囲よりも狭い範囲または広い範囲であってもよい。
スライス重要度情報3101の重要度は、例えば、各映像シーンを画像解析することにより、当該映像シーンごとに算出される。なお、重要度は、録画する番組のジャンル情報に基づいて、決定されてもよい。また、番組のジャンルが、例えば、スポーツである場合、得点、時間等が、画面の最上部のスライスセグメントに示される可能性が高い。そのため、最上部のスライスセグメントに対応する、スライス重要度情報3101の重要度に対して、高い数値が設定される。
図32は、実施の形態5に係るスライス重要度情報3101のシンタックスを示す図である。“num_of_slice3201”は、映像シーンを構成するスライスセグメントの数を示す。本実施の形態では、目の字型分割スライスセグメント構成が使用されるため、“num_of_slice3201”には、「4」が設定される。
slicesegment_type3202”は、分割スライスセグメント構成の種類である分割タイプが、目の字型または田の字型であるかを示す情報である。“slicesegment_type3202”の次のループ文(すなわち、for以降の文)は、“num_of_slice3201”の数だけ繰り返される。スライスセグメントごとに、“implevel3203”が記録される。
“implevel3203”は、スライス重要度情報3101の重要度である。“implevel3203”は、スライスセグメント毎の意味的な重要度である。本実施の形態では、“implevel3203”には、0から99までの数値が設定される。
“implevel3203”は、4つの配列で表現される。当該4つの配列は、図33のimplevel[0]、implevel[1]、implevel[2]およびimplevel[3]である。
本実施の形態では、分割スライスセグメント構成の種類である分割タイプは、目の字型である。そのため、スライスセグメント#1、スライスセグメント#2、スライスセグメント#3およびスライスセグメント#4は、例えば、図23(a)のように、配置される。スライスセグメント#1は、画面の最上部のスライスセグメントである。スライスセグメント#4は、画面の最下部のスライスセグメントである。
implevel[0]は、スライスセグメント#1の重要度である。implevel[1]は、スライスセグメント#2の重要度である。implevel[2]は、スライスセグメント#3の重要度である。implevel[3]は、スライスセグメント#4の重要度である。スライス重要度情報3101は、映像シーン毎に、重要度としての、implevel[0]、implevel[1]、implevel[2]およびimplevel[3]を示す。すなわち、スライス重要度情報3101は、映像シーン毎に、4つの重要度を示す。
実施の形態5では、タイムテーブルTMSN2において、エントリー毎にスライス重要度情報3101を持つ例を示している。なお、タイムテーブルTMSN2の全てのエントリーに対して1つのスライス重要度情報3101を設定しても良い。
図33は、実施の形態5に係る、スライスセグメントの更新順序の例を示す図である。以下においては、実施の形態5に係る処理を説明するための画面を、「表示更新画面3301」ともいう。表示更新画面3301は、映像シーンである。映像シーンである表示更新画面3301は、当該映像シーンを構成する4つのスライスセグメントの内、どのスライスセグメントが表示更新されているかを示す。
本実施の形態では、映像シーンである6つの表示更新画面3301を使用して、処理の一例を説明する。以下においては、6つの表示更新画面3301を、表示更新画面3301(#1)、表示更新画面3301(#2)、表示更新画面3301(#3)、表示更新画面3301(#4)、表示更新画面3301(#5)および表示更新画面3301(#6)と表記する。
例えば、表示更新画面3301(#1)は、最上部のスライスセグメントであるスライスセグメント#1が更新されることを示す。また、表示更新画面3301(#6)は、スライスセグメント#3が表示更新されることを示している。
図33には、説明を分かりやすくするために、映像シーンである6つの表示更新画面3301の各々に対し、重要度としての、implevel[0]、implevel[1]、implevel[2]およびimplevel[3]が対応づけて示されている。重要度としての、implevel[0]、implevel[1]、implevel[2]およびimplevel[3]の各々には、一例として、0から99までの数値が設定される。
以下においては、スライスセグメントの更新順の形態を、「表示更新モード」ともいう。表示更新モードは、スライスセグメントを更新するための更新処理の種類である。映像シーン毎の4つの重要度の値により、表示更新モードが規定される。
本実施の形態
では、表示更新の対象ではないスライスセグメントは、実施の形態4の図27を使用して説明した処理のように、過去に表示したスライスセグメントの画像を引き継いで表示するものとする。
では、表示更新の対象ではないスライスセグメントは、実施の形態4の図27を使用して説明した処理のように、過去に表示したスライスセグメントの画像を引き継いで表示するものとする。
特殊再生の実行時には、映像シーンである表示更新画面3301(#1)から表示更新画面3301(#6)まで、順番に表示される。
図34は、実施の形態5に係る、スライス重要度情報3101を用いた表示画面の更新を行うシーケンスを示すメインフローチャートである。以下においては、図34に示される処理を、「特殊再生制御処理」ともいう。すなわち、図34は、特殊再生制御処理のフローチャートである。
特殊再生の実行が指示されると、記録再生制御部41は、タイムテーブルTMSN2から、表示画面に対応するエントリーのスライス重要度情報3101を読み込む。記録再生制御部41は、スライス重要度情報3101が示す重要度に基づいて、更新処理の初期の形態として、表示更新モードを設定する(S4001)。なお、ステップS4001の処理は行われなくてもよい。
次に、記録再生制御部41が、特殊再生の停止の指示の有無を確認する(S4002)。特殊再生の停止の指示があった場合(S4002:yes)、特殊再生の処理を終了する(S4007)。特殊再生の停止の指示がない場合(S4002:no)、ステップS4003に移る。
ステップS4003では、記録再生制御部41が、タイムテーブルTMSN2から再生位置のエントリーの読込みを行う(S4003)。再生位置とは、タイムテーブルTMSN2における、「時刻」に対応する位置である。エントリーの読み込みの際、特殊再生の再生速度に応じて、エントリーの読み込み方法を決める。例えば、全てのエントリーを読み込むか、一部のエントリーを読み込むか等を決定する。一部のエントリーとは、再生速度に応じて、エントリーを1つおきに読み込んだり、2つおきに読み込んだりすることで、間引かれたエントリーを示す。
そして、記録再生制御部41が、読込んだエントリーに、スライス重要度情報3101があるか否かを判定する(S4004)。
ステップS4004でエントリーにスライス重要度情報3101が存在しない場合には、映像再生装置100は、実施の形態3の図23(a)に示すような通常の順番でスライスセグメントの表示更新処理を行う(S4006)。
一方、ステップS4004でエントリーにスライス重要度情報3101が存在する場合には、選択スライス更新処理が行われる(S4005)。選択スライス更新処理は、スライス重要度情報3101に基づいたスライスセグメントの更新処理である。選択スライス更新処理は、スライス重要度情報3101が示す、映像シーン毎の4つの重要度により規定される表示更新モードに基づいた更新処理を行う処理である。
図35は、実施の形態5に係る選択スライス更新処理のフローチャートを示す図である。ここでは、選択スライス更新処理における処理の流れを簡略的に説明し、選択スライス更新処理の具体的な例は、後述する。
以下においては、選択スライス更新処理において、同一のスライスセグメントが選択された回数を、「選択総数」または「選択総数3302」ともいう。選択総数は、映像シーンを構成する複数のスライスセグメントのいずれかのスライスセグメントが選択された回数である。
本実施の形態では、選択総数は、4つの配列で表現される。当該4つの配列は、SEL_Cnt[0]、SEL_Cnt[1]、SEL_Cnt[2]およびSEL_Cnt[3]である。
SEL_Cnt[0]は、スライスセグメント#1の選択総数である。SEL_Cnt[1]は、スライスセグメント#2の選択総数である。SEL_Cnt[2]は、スライスセグメント#3の選択総数である。SEL_Cnt[3]は、スライスセグメント#4の選択総数である。SEL_Cnt[0]、SEL_Cnt[1]、SEL_Cnt[2]およびSEL_Cnt[3]の初期値は、「0」である。
図33には、説明を分かりやすくするために、映像シーンである6つの表示更新画面3301の各々に対し、選択総数3302としての、SEL_Cnt[0]、SEL_Cnt[1]、SEL_Cnt[2]およびSEL_Cnt[3]が対応づけて示されている。選択総数3302としての、SEL_Cnt[0]、SEL_Cnt[1]、SEL_Cnt[2]およびSEL_Cnt[3]の値は、例えば、図33のように設定される。
以下においては、選択スライス更新処理において、同一のスライスセグメントを選択する回数の上限値を、「最大規定数」ともいう。最大規定数は、例えば、「3」である。
図35の選択スライス更新処理では、まず、ステップS5001が行われる。ステップS5001では、記録再生制御部41が、選択総数が最大規定数以上であるか否かを判定する(S5001)。選択総数が最大規定数以上であると判定された場合、ステップS5004に遷移する。一方、選択総数が最大規定数未満であると判定された場合、ステップS5002に遷移する。
以下においては、映像シーンを構成する複数のスライスセグメントのうち、重要度が最も高いスライスセグメントを、「最重要スライスセグメント」ともいう。また、以下においては、映像シーンを構成する複数のスライスセグメントのうち、最重要スライスセグメント以外のスライスセグメントを、「非最重要スライスセグメント」ともいう。最重要スライスセグメントは、映像シーンを構成する複数のスライスセグメントのうち、ユーザーが当該映像シーンを把握するために最も重要なスライスセグメントである。
ステップS5002では、最重要スライス更新処理が行われる。最重要スライス更新処理では、映像再生装置100が、最重要スライスセグメントを再生する。具体的には、まず、記録再生制御部41が、映像シーンを構成する複数のスライスセグメントから、最重要スライスセグメントを選択する。記録再生制御部41は、実施の形態4と同様に、選択した最重要スライスセグメントを、オリジナル画像のスライスセグメントに更新する。すなわち、映像再生装置100は、最重要スライスセグメントを再生する。
ステップS5003では、選択総数インクリメント処理が行われる。選択総数インクリメント処理では、記録再生制御部41が、選択した最重要スライスセグメントの選択総数を1インクリメントする。
次に、この選択スライス更新処理は終了し、再度、図34のステップS4002へ戻る。
図35の前述のステップS5001で、選択総数が最大規定数以上であると判定された場合、ステップS5004に遷移する。
以下においては、映像シーンを構成する複数のスライスセグメントのうち、最重要スライスセグメント以外の、1度も選択されていないスライスセグメントであって、かつ、最も重要度が高いスライスセグメントを、「重要スライスセグメント」ともいう。重要スライスセグメントは、非最重要スライスセグメントである。
ステップS5004では、スライス更新処理が行われる。スライス更新処理では、映像再生装置100が、非最重要スライスセグメントである重要スライスセグメントを再生する。具体的には、まず、記録再生制御部41が、重要スライスセグメントを選択する。記録再生制御部41は、実施の形態4と同様に、選択した重要スライスセグメントを、オリジナル画像のスライスセグメントに更新する。すなわち、映像再生装置100は、非最重要スライスセグメントである重要スライスセグメントを再生する。
次に、ステップS5005では、選択総数インクリメント処理が行われる。選択総数インクリメント処理では、記録再生制御部41が、選択した重要スライスセグメントの選択総数を1インクリメントする。
次に、ステップS5006では、記録再生制御部41が、全ての選択総数が1以上であるか否かを判定する。全ての選択総数は、SEL_Cnt[0]、SEL_Cnt[1]、SEL_Cnt[2]およびSEL_Cnt[3]である。全ての選択総数が1以上である場合(S5006:yes)、ステップS5007に遷移する。一方、全ての選択総数が1以上でない場合(S5006:no)、この選択スライス更新処理は終了し、再度、図34のステップS4002へ戻る。ステップS4003では、次のエントリーの読み込みが行われる。
ステップS5007では、選択総数リセット処理が行われる。選択総数リセット処理では、記録再生制御部41が、全ての選択総数をリセットする。具体的には、記録再生制御部41が、全ての選択総数に「0」を設定する。そして、この選択スライス更新処理は終了し、再度、図34のステップS4002へ戻る。
次に、選択スライス更新処理の具体的な例について説明する。ここで、選択スライス更新処理の一例を分かりやすくするために、以下の前提Pm1のもとで行われる特殊再生制御処理および選択スライス更新処理について説明する。
以下においては、光ディスク53に記録されているデータを、「記録データ」ともいう。映像記録媒体である光ディスク53は、映像再生装置100により再生される放送ストリームを記録するための媒体である。
前提Pm1では、映像記録媒体である光ディスク53に、記録データが記録されている。記録データは、放送ストリームと、図12のタイムテーブルTMと、図31のタイムテーブルTMSN2とを含む。当該放送ストリームは、映像シーンであるIピクチャを有する映像ストリームを含む。タイムテーブルTMは、Iピクチャの開始位置を示す情報である。Iピクチャである映像シーンは、放送ストリームの再生により表現される。
すなわち、映像記録媒体である光ディスク53には、放送ストリームと、Iピクチャの開始位置を示す情報と、Iピクチャを構成する複数のスライスセグメントの開始位置を示す情報と、スライス重要度情報3101とが記録されている。
また、前提Pm1では、映像再生装置100は、映像記録媒体である光ディスク53に記録されている放送ストリームの特殊再生を行う。特殊再生は、早送り再生である。なお、特殊再生は、巻き戻し再生であってもよい。以下においては、映像再生装置100が放送ストリームの特殊再生を行っている期間を、「特殊再生期間」ともいう。特殊再生期間において、前提Pm1における特殊再生制御処理、および、前提Pm1における選択スライス更新処理は行われる。
また、前提Pm1では、映像シーンは、図23(a)のように、目の字型に分割されている。すなわち、映像シーンは、4分割されている。前提Pm1では、映像シーンは、スライスセグメント#1、スライスセグメント#2、スライスセグメント#3およびスライスセグメント#4で構成される。
タイムテーブルTMSN2は、Iピクチャである映像シーンを構成するスライスセグメント#1、スライスセグメント#2、スライスセグメント#3およびスライスセグメント#4の開始位置を示す情報と、スライス重要度情報3101とを含む。
スライス重要度情報3101は、映像シーン毎に当該映像シーンを構成するスライスセグメント#1、スライスセグメント#2、スライスセグメント#3およびスライスセグメント#4の各々の意味的重要度を示す。
また、前提Pm1では、特殊再生期間において、図33のように、映像シーンである表示更新画面3301(#1)から表示更新画面3301(#6)まで、順番に遷移する。また、前提Pm1では、スライス重要度情報3101が示す映像シーン毎のimplevel[0]、implevel[1]、implevel[2]およびimplevel[3]は、一例として、図33のように設定されている。
以下においては、ユーザーによる映像シーンの把握の容易さの度合いを、「シーン把握度」ともいう。シーン把握度が高い程、ユーザーは、映像シーンの把握が容易になる。また、意味的重要度の値が大きい程、映像シーンに含まれるスライスセグメントであって、かつ、当該意味的重要度に対応するスライスセグメントの重要度は高い。また、映像シーンに含まれるスライスセグメントの重要度が高い程、当該スライスセグメントが再生された状況におけるシーン把握度は高い。
また、前提Pm1では、前述の最大規定数は、「3」である。最大規定数が大きいほど、選択スライス更新処理により選択されたスライスセグメントが、他のスライスセグメントよりも、高い頻度で表示更新が行われる。
図33、図34および図35を参照して、前提Pm1における特殊再生制御処理では、記録再生制御部41が、図31のタイムテーブルTMSN2から、映像シーンである表示更新画面3301(#1)に対応する1番目のエントリーを読み込み(S4003)、図35のステップS5002が行われる。
ステップS5002の最重要スライス更新処理では、映像再生装置100が、読み込まれたエントリーに含まれるスライス重要度情報3101に基づいて、最重要スライスセグメントを再生する。
具体的には、まず、記録再生制御部41が、スライス重要度情報3101が示す、重要度としてのimplevel[0]、implevel[1]、implevel[2]およびimplevel[3]に基づいて、映像シーンである表示更新画面3301(#1)を構成するスライスセグメント#1,#2,#3,#4から、最重要スライスセグメントを選択する。選択された当該最重要スライスセグメントは、重要度であるimplevel[0]が最も高いスライスセグメント#1である。この場合、スライスセグメント#2,#3,#4は、非最重要スライスセグメンである。
そして、記録再生制御部41は、実施の形態4と同様に、選択した最重要スライスセグメントを、オリジナル画像のスライスセグメントに更新する。例えば、表示更新画面3301(#1)のスライスセグメント#1を、オリジナル画像である映像シーンのスライスセグメント#1に更新する。すなわち、映像再生装置100は、最重要スライスセグメントを再生する。つまり、特殊再生期間において、映像再生装置100は、スライス重要度情報3101に基づいて、非最重要スライスセグメンより最重要スライスセグメントを優先して再生する。
次に、記録再生制御部41は、スライスセグメント#1の選択総数であるSEL_Cnt[0]を、1インクリメントする(S5003)。これにより、SEL_Cnt[0]は、「1」となる。
表示更新画面3301(#2)についても、表示更新画面3301(#1)に対する上記の処理と同様な処理が行われる。この場合、表示更新画面3301(#2)に対応する、implevel[0]が最も高いため、表示更新画面3301(#2)のスライスセグメント#1が選択されて、更新される(S5002)。そして、記録再生制御部41は、スライスセグメント#1の選択総数であるSEL_Cnt[0]を、1インクリメントする(S5003)。これにより、SEL_Cnt[0]は、「2」となる。
表示更新画面3301(#3)についても、表示更新画面3301(#1)に対する上記の処理と同様な処理が行われる。この場合、表示更新画面3301(#3)に対応する、implevel[3]が最も高いため、表示更新画面3301(#3)のスライスセグメント#3が選択されて、更新される(S5002)。そして、記録再生制御部41は、スライスセグメント#3の選択総数であるSEL_Cnt[3]を、1インクリメントする(S5003)。これにより、SEL_Cnt[3]は、「1」となる。
表示更新画面3301(#4)についても、表示更新画面3301(#1)に対する上記の処理と同様な処理が行われる。この場合、表示更新画面3301(#4)に対応する、implevel[0]が最も高いため、表示更新画面3301(#4)のスライスセグメント#1が選択されて、更新される(S5002)。そして、記録再生制御部41は、スライスセグメント#1の選択総数であるSEL_Cnt[0]を、1インクリメントする(S5003)。これにより、SEL_Cnt[0]は、「3」となる。
表示更新画面3301(#5)については、以下の処理が行われる。選択総数であるSEL_Cnt[0]が、最大規定数である「3」以上であるため、ステップS5001の処理により、ステップS5004に遷移する。
ステップS5004のスライス更新処理では、映像再生装置100が、スライス重要度情報3101に基づいて、重要スライスセグメントを再生する。重要スライスセグメントは、映像シーンを構成する複数のスライスセグメントのうち、最重要スライスセグメント以外の、1度も選択されていないスライスセグメントであって、かつ、最も重要度が高いスライスセグメントである。
以下においては、映像シーンを構成する複数のスライスセグメントのうち、選択総数が最大規定数以上であるスライスセグメントを、「多選択スライスセグメント」ともいう。
重要スライスセグメントは、映像シーンを構成する複数のスライスセグメントのうち、多選択スライスセグメント以外のスライスセグメントである。また、重要スライスセグメントは、非最重要スライスセグメントでもある。
具体的には、スライス更新処理では、まず、記録再生制御部41が、スライス重要度情報3101が示す、重要度としてのimplevel[0]、implevel[1]、implevel[2]およびimplevel[3]に基づいて、表示更新画面3301(#5)における重要スライスセグメントを選択する。選択された重要スライスセグメントは、選択総数が「0」であるスライスセグメント#2,3のうち、最も重要度が高いスライスセグメント#2である。スライスセグメント#2,3の重要度は、それぞれ、「50」および「40」である。
記録再生制御部41は、実施の形態4と同様に、選択したスライスセグメント#2を、オリジナル画像のスライスセグメント#2に更新する。例えば、記録再生制御部41は、表示更新画面3301(#5)のスライスセグメント#2を、オリジナル画像である映像シーンのスライスセグメント#2に更新する。すなわち、映像再生装置100は、非最重要スライスセグメントである重要スライスセグメントを再生する。そして、記録再生制御部41は、スライスセグメント#2の選択総数であるSEL_Cnt[1]を、1インクリメントする(S5005)。これにより、SEL_Cnt[1]は、「1」となる。
この段階では、全ての選択総数が1以上でないため、ステップS5006の判定により、選択スライス更新処理は終了し、再度、図34のステップS4002へ戻る。
表示更新画面3301(#6)については、以下の処理が行われる。選択総数であるSEL_Cnt[0]が、最大規定数である「3」以上であるため、ステップS5001の処理により、ステップS5004に遷移する。
ステップS5004のスライス更新処理では、記録再生制御部41は、表示更新画面3301(#6)における重要スライスセグメントを選択する。選択された重要スライスセグメントは、スライスセグメント#3である。そして、スライスセグメント#3が更新される。そして、記録再生制御部41は、スライスセグメント#3の選択総数であるSEL_Cnt[2]を、1インクリメントする(S5005)。これにより、SEL_Cnt[2]は、「1」となる。
この段階では、全ての選択総数が1以上であるため、ステップS5006の判定により、ステップS5007へ遷移する。全ての選択総数が1以上である場合は、スライスセグメント#1、スライスセグメント#2、スライスセグメント#3およびスライスセグメント#4の全てが再生された場合である。
ステップS5007の選択総数リセット処理では、記録再生制御部41が、全ての選択総数をリセットする。具体的には、記録再生制御部41が、全ての選択総数である、SEL_Cnt[0]、SEL_Cnt[1]、SEL_Cnt[2]およびSEL_Cnt[3]に「0」を設定する。
上記のように、スライスセグメントの選択、および、スライスセグメントの更新処理が行われる。前提Pm1における特殊再生制御処理、および、前提Pm1における選択スライス更新処理により、以下の処理が行われる。
特殊再生期間において、映像再生装置100は、スライス重要度情報3101に基づいて、映像シーンを構成する複数のスライスセグメントのいずれかのスライスセグメントを選択して、選択された当該スライスセグメントを再生する処理を繰り返して行う。また、特殊再生期間において、選択総数が最大規定数以上になった場合、映像再生装置100は、映像シーンを構成する複数のスライスセグメントのうち、多選択スライスセグメント以外のスライスセグメントである重要スライスセグメントを再生する。また、特殊再生期間において、映像シーンを構成する複数のスライスセグメントの全てが再生された場合、記録再生制御部41が、当該複数のスライスセグメントの各々の選択総数をリセットする。
また、本実施の形態に係る光ディスク53は、特殊再生期間において、映像再生装置100が、スライス重要度情報3101に基づいて、非最重要スライスセグメンより最重要スライスセグメントを優先して再生する処理に用いられる。
以上説明したように、本実施の形態によれば、映像シーンを構成する複数のスライスセグメントは、最重要スライスセグメントを含む。最重要スライスセグメントは、複数のスライスセグメントのうち、重要度が最も高いスライスセグメントである。映像再生装置100が放送ストリームの特殊再生を行っている期間において、当該映像再生装置100は、複数のスライスセグメントのうち、最重要スライスセグメント以外のスライスセグメントより当該最重要スライスセグメントを優先して再生する。
これにより、放送ストリームの特殊再生が行われている期間における、映像シーンの把握が困難である状況の発生を抑制することができる。
また、本実施の形態によれば、特殊再生の実行時の応答性を向上させるとともに、映像シーンの視認性を高くすることができる。そのため、特殊再生の実行時にスライスセグメント単位で表示画面を更新する際に、表示画面の更新の応答性に優れ、画面の映像シーンが把握しやすい映像再生装置を提供することができる。
また、本実施の形態によれば、スライス重要度情報3101を用いて、最重要スライスセグメントを優先的に選択し、再生する。そのため、最重要スライスセグメントの表示頻度を上げることができる。したがって、映像シーンの把握が行いやすい表示制御を行うことができる。
なお、本実施の形態では、特殊再生が早送り再生である場合の処理を説明したが、本実施の形態は、特殊再生が巻き戻し再生である場合にも適用可能である。特殊再生が巻き戻し再生である場合、特殊再生が早送り再生である場合における前述した処理と同様な処理が行われる。
また、タイムテーブルTMとタイムテーブルTMSN2とを同一のテーブル情報として記録してもよい。また、タイムテーブルTMとタイムテーブルTMSN2とを別テーブルとして管理し、別ファイルとして記録してもよい。
また、本実施の形態では、スライス重要度情報3101が、タイムテーブルTMSN2に存在する例を示したが、スライス重要度情報3101は、タイムテーブルTMSN2の外に保持されてもよい。この場合、エントリー毎に優先スライスを設定できないため、関連するすべてのエントリーで同一の設定が行われる。
なお、各実施の形態、各変形例を自由に組み合わせたり、各実施の形態、各変形例を適宜、変形、省略することが可能である。
41 記録再生制御部、53 光ディスク、100 映像再生装置。
Claims (4)
- 映像ストリームを含む放送ストリームを含む記録データの当該放送ストリームの特殊再生を行う映像再生装置であって、
前記特殊再生は、早送り再生または巻き戻し再生であり、
前記記録データは、
Iピクチャを有する前記映像ストリームと、
前記Iピクチャの開始位置を示す情報と、
前記Iピクチャを構成する複数のスライスセグメントの開始位置を示す情報と、
前記放送ストリームの再生により表現される映像シーンを構成する前記複数のスライスセグメントの各々の意味的な重要度を示すスライス重要度情報とを含み、
前記複数のスライスセグメントは、最重要スライスセグメントを含み、
前記最重要スライスセグメントは、前記複数のスライスセグメントのうち、前記重要度が最も高いスライスセグメントであり、
前記映像再生装置が前記放送ストリームの前記特殊再生を行っている期間である特殊再生期間において、当該映像再生装置は、前記スライス重要度情報に基づいて、前記複数のスライスセグメントのうち、前記最重要スライスセグメント以外のスライスセグメントより当該最重要スライスセグメントを優先して再生する、
映像再生装置。 - 前記特殊再生期間において、前記映像再生装置は、前記スライス重要度情報に基づいて、前記複数のスライスセグメントのいずれかのスライスセグメントを選択して、選択された当該スライスセグメントを再生する処理を繰り返して行い、
前記特殊再生期間において、前記複数のスライスセグメントのいずれかのスライスセグメントが選択された回数である選択総数が最大規定数以上になった場合、前記映像再生装置は、前記複数のスライスセグメントのうち、前記選択総数が前記最大規定数以上であるスライスセグメント以外のスライスセグメントを再生する、
請求項1に記載の映像再生装置。 - 前記映像再生装置は、
前記特殊再生期間において、前記複数のスライスセグメントの全てが再生された場合、当該複数のスライスセグメントの各々の前記選択総数をリセットする制御部を備える、
請求項2に記載の映像再生装置。 - 放送ストリームの特殊再生を行う映像再生装置により再生される当該放送ストリームを記録するための映像記録媒体であって、
前記特殊再生は、早送り再生または巻き戻し再生であり、
前記映像記録媒体には、
Iピクチャを有する映像ストリームを含む前記放送ストリームと、
前記Iピクチャの開始位置を示す情報と、
前記Iピクチャを構成する複数のスライスセグメントの開始位置を示す情報と、
前記放送ストリームの再生により表現される映像シーンを構成する前記複数のスライスセグメントの各々の意味的な重要度を示すスライス重要度情報とが記録されており、
前記複数のスライスセグメントは、最重要スライスセグメントを含み、
前記最重要スライスセグメントは、前記複数のスライスセグメントのうち、前記重要度が最も高いスライスセグメントであり、
前記映像記録媒体は、前記映像再生装置が前記放送ストリームの前記特殊再生を行っている期間である特殊再生期間において、当該映像再生装置が、前記スライス重要度情報に基づいて、前記複数のスライスセグメントのうち、前記最重要スライスセグメント以外のスライスセグメントより当該最重要スライスセグメントを優先して再生する処理に用いられる、
映像記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021060565A JP2022156728A (ja) | 2021-03-31 | 2021-03-31 | 映像再生装置および映像記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021060565A JP2022156728A (ja) | 2021-03-31 | 2021-03-31 | 映像再生装置および映像記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022156728A true JP2022156728A (ja) | 2022-10-14 |
Family
ID=83559018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021060565A Pending JP2022156728A (ja) | 2021-03-31 | 2021-03-31 | 映像再生装置および映像記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022156728A (ja) |
-
2021
- 2021-03-31 JP JP2021060565A patent/JP2022156728A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4270379B2 (ja) | デジタル情報の効率的な伝送および再生 | |
US8676038B2 (en) | Recording/reproducing apparatus, recording apparatus, reproducing apparatus, recording method, reproducing method and computer program | |
US20080181583A1 (en) | Method and apparatus for recording and reproducing video data, and information storage medium in which video data is recorded by the same | |
US20060165375A1 (en) | Recordable PVR using metadata and recording control method thereof | |
JP2000041066A (ja) | マルチメディア蓄積装置 | |
US20130209063A1 (en) | Digital receiver and content processing method in digital receiver | |
KR100770908B1 (ko) | 디지털 방송 스트림의 변속 재생 장치 및 방법 | |
KR101181777B1 (ko) | 방송 시스템 및 방법 | |
KR100405975B1 (ko) | Pvr에서의 스트림 점프 방법 | |
WO2013011696A1 (ja) | 送信装置、受信再生装置、送信方法及び受信再生方法 | |
US7778526B2 (en) | System and method for maintaining DVD-subpicture streams upon conversion to higher compressed data format | |
JP6964436B2 (ja) | 映像記録装置及び映像再生装置 | |
JP6415652B1 (ja) | 映像再生装置、映像記録装置および映像記録方法 | |
JP2004536480A (ja) | 多視点即時リプレイ機能を実現するシステムと方法 | |
JP6600059B2 (ja) | 映像再生装置および映像記録装置 | |
KR101731829B1 (ko) | 디지털 영상 수신기의 디지털 콘텐츠 처리 장치 및 방법 | |
JP2005018925A (ja) | 録画再生装置及び録画再生方法 | |
JP6991185B2 (ja) | 映像再生装置および映像記録装置 | |
JP2022156728A (ja) | 映像再生装置および映像記録媒体 | |
RU2525482C2 (ru) | Устройство воспроизведения, способ воспроизведения, устройство записи, способ записи, программа и структура данных | |
US20030091331A1 (en) | Method for implementing low-speed playback of a digital broadcast program | |
JP6982829B2 (ja) | 記録装置、記録方法および記録媒体 | |
JPH11312381A (ja) | 記録装置および方法、再生装置および方法、記録再生装置および方法、記録媒体、並びに提供媒体 | |
KR100846794B1 (ko) | 양방향 디지털 방송 신호의 저장방법, 재생방법, 그 장치 및 기록매체 | |
CN1993762A (zh) | 改善特技播放期间和之后的图形可访问性 |