JP4954901B2 - 24Hzフレーム周波数のビデオ信号に基づくオーディオ/ビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を再生するための方法および装置 - Google Patents

24Hzフレーム周波数のビデオ信号に基づくオーディオ/ビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を再生するための方法および装置 Download PDF

Info

Publication number
JP4954901B2
JP4954901B2 JP2007553582A JP2007553582A JP4954901B2 JP 4954901 B2 JP4954901 B2 JP 4954901B2 JP 2007553582 A JP2007553582 A JP 2007553582A JP 2007553582 A JP2007553582 A JP 2007553582A JP 4954901 B2 JP4954901 B2 JP 4954901B2
Authority
JP
Japan
Prior art keywords
video
audio
frame
presentation
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007553582A
Other languages
English (en)
Other versions
JP2008530839A (ja
Inventor
ヴィンター,マルコ
ペーテルス,ハルトムート
ベーム,ヨーハネス
シュレーダー,エルンスト,エフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36777591&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP4954901(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Priority claimed from EP05090020A external-priority patent/EP1689179A1/en
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2008530839A publication Critical patent/JP2008530839A/ja
Application granted granted Critical
Publication of JP4954901B2 publication Critical patent/JP4954901B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4305Synchronising client clock from received content stream, e.g. locking decoder clock with encoder clock, extraction of the PCR packets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440218Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440281Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by altering the temporal resolution, e.g. by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0112Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level one of the standards corresponding to a cinematograph film standard
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/7921Processing of colour television signals in connection with recording for more than one processing mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Television Signal Processing For Recording (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Systems (AREA)
  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

本発明は、ビデオ信号についての24Hzフレーム周波数および該24Hzフレーム周波数に対応するオーディオ信号スピードに基づくオーディオ/ビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を一緒に再生するための方法および装置に関する。
映画は35mmフィルムの世界的な規格に従って、映画館での映写のために24Hzフレーム周波数、順次走査フォーマット(24pと表される)で製作される。映写スピードは、何十年も前から、毎秒24枚の完全な映像に固定されてきた。付随する音声信号は、典型的には同じ材料上のオプチカル・トラックとして存在し、同じスピードで再生される。そのような再生は事実上、世界のどんな既存の映画館でも実行できる。
そのような映画がテレビジョン・システムを介して、たとえば放送局によって再生されるときには、状況は一変する。世界の主要なテレビ・システムはインターレース式走査および50Hzのフィールド周波数(50iと表される;たとえばヨーロッパ、中国およびオーストラリアでPALおよびSECAMの場合)または60Hzのフィールド周波数(60iと表される;たとえば米国および日本でNTSCの場合)を使用する。
60iの国では、テレビ・システムは、毎秒30枚の完全なビデオ・フレームが表示されるよう構築される。映画の再生は、3:2のプルダウンを使って、一つのフィルム・フレームを交互に2ビデオ・フィールドまたは3ビデオ・フィールドにわたって呈示することによって、基本的に、全体としては正しいスピードで実行できる。NTSCカラー・テレビ・システムでは、実際のフィールド・レートは59.94Hzであることを注意しておくべきであろう。これは、映画は実際には毎秒23.976フレームで、すなわち元来のスピードより1000/1001だけ遅いスピードで放送されているということを意味する。これは、一般にはテレビ視聴者は気づかない。
50Hzの国では、状況はより難しくなる。最も簡単な解決策は、映画を毎秒25フレームで、すなわち4.2%速いスピードで上映することである。この方法では音声はピッチが4.2%(ほぼ半音)高くなるが、典型的には消費者が苦情を言うことはない。映画がA/Vメディア(たとえばVCRビデオ、CDIおよびDVD)に記録され、該メディアがテレビ受信機を呈示装置として使って再生されるとすると、一般に、同じ原則が当てはまる。媒体上に存在する付随する音声がデジタル形式(たとえばリニアPCMまたはAC-3コードまたはDTSコード)であれば、再生装置はそのオーディオ情報を4.2%大きいスピードでデコードおよび呈示するという一般には問題のない方法をとるか、あるいは50Hzの国で販売されるDVDビデオやCDIのディスクが、ビデオ信号が4.2%大きいスピードで出力される間、プレーヤーのオーディオ・デコーダが自動的にオーディオ信号の正しいスピードおよびピッチを出力するようあらかじめエンコードされたオーディオ・データ・ストリームを含んでいる必要がある。
まとめると、AVストリーム(オーディオ・ビデオ・ストリーム)について、現在のところ三つの確立された再生スピードがある:映画館で使われる順次走査の24フレーム毎秒(24p)、インターレース式の50フィールド毎秒(50i)およびインターレース式の60フィールド毎秒(60i)である。
代替案は、プレーヤーにおいて、オーディオのデコード、ピッチ変換およびオーディオの再エンコードを実行することであるが、これは、追加的なオーディオ・エンコードのため、非常に高価なプレーヤー・ハードウェアおよびより高いライセンス費用を必要とする。
ディスク製造業者が二つ以上の異なるスピードについてレコードを製作する場合、一つのスピードから他のスピードの一つへの変換が第一の選択であろう。新しいスピードで映画を製作し直すのは時間および費用がかかりすぎるので、元の映画が再使用される。すなわち、元のレコードが新しいスピードにトランスコードされる。通例、映画制作者は24pの映画を60iのDVDビデオおよび50iのDVDビデオにトランスコードする。現代的なテレビ受信機は、同じカラー・システムPAL、NTSCまたはSECAMを保ちながら異なる再生スピードを扱うことができる。たとえば、現在ヨーロッパで販売されている多くのテレビは、再生された60iレコードを呈示できる。しかし、多くの旧式のテレビはそのようなスピード・シフトを有する入力信号を扱うことができない。一部の現代的な100Hzテレビでさえ、60iの入力データを受け取るときには誤動作している。いくつかの旧式の装置はカラーの60iのコンテンツを色なしで再生するし、他の装置は固定した映像さえ再生できない。そうした理由のため、たとえばDVDビデオ・フォーマットは、50iと60iの国が好ましい/サポートされるスピードのディスクを入手するよう、50iと60iの国の間で区別をしている。
(アナログ)カラー・システムは、どうせ記録される(MPEG)ビットストリームの一部ではないので、問題ではないことを注意しておく。適切なカラー・システムは、ビデオ・コンテンツの圧縮解除後に適用またはエンコードされる。
上述したように、24pから60iにトランスコードするためには3:2のプルダウンが使用される。60iの国の消費者は、フィールド反復に起因するややがくがくしたビデオ再生のような結果的な欠点は知っており、広く受け容れている。24pから50iにトランスコードするためには、4.2%速い再生スピードが使われる。50iの国の大半の消費者は、50iのフリッカーおよび上昇されたピッチのような結果的な欠点を受け容れている。一部の欠点は、たとえば洗練された動き補償をもつ100Hzのテレビを使うことにより、すでに軽減、またさらには解消されている。しかし、全再生時間は映画館より4.2%短い。そのような高速化の利点は、ビデオ再生ががくがくしないことであるが、そのより高速の再生を実行するためにオーディオ・ストリームをトランスコードする必要がある。よって、同じ映画でもオーディオ・ストリームは50iのディスクと60iのディスクの間で著しく異なる。だが、(MPEG)ビデオ・ストリームは非常に似通っている。ビデオ・ストリームの主たる相違は、60iのビデオ・ストリームは追加的な3:2プルダウン・フラグおよび異なるタイムスタンプを含んでいるということである。MPEGとは、たとえばMPEG-2ビデオ、MPEG-4ビデオまたはMPEG-4 AVCを意味する。消費者は自国で使われているトランスコード法の欠点を受け容れているが、他国の異なる欠点は好まない。60iの消費者は50iのテレビのフリッカーを好まない(理論的には、これは現行の60iのテレビを、100Hz技法の適用または遅いLCDディスプレイの使用によって50iにも対応するテレビで置き換えることによって克服できる)。50iの消費者は60iのビデオのがくつきを好まない(理論的には、これは現行のディスク、プレーヤーおよびテレビを24p対応のディスク、プレーヤーおよびテレビで置き換えることによって克服できる)。
図1は、左側に、既知の50iディスク50iDVDが挿入された既知のDVDプレーヤーDVDPを示している。プレーヤーは50iのAVを出力する。右側は、50iディスクのコンテンツがどのようにして呈示されるかを描いている:旧型の(old-fashion)50iのみのテレビOLDFでは50iとして、現在(currently)生産されている50i(および60i対応)テレビCURでは50iとして、および現代的な(modern)24p(および50iおよび60i対応)テレビMODでは50iとしてである。上記テレビまたはディスプレイはプレーヤーまたはレコーダーDVDPに接続されている。
図2は、左側に、既知の60iディスク60iDVDが挿入された既知のDVDプレーヤーDVDPを示している。プレーヤーは60iのAVを出力する。右側は、60iディスクのコンテンツがどのように呈示されるかを描いている:前記旧型のテレビOLDでは呈示なし、前記現在生産されているテレビCURでは60iとして、および前記現代的なテレビMODでは60iとしてである。上記テレビまたはディスプレイはプレーヤーまたはレコーダーDVDPに接続されている。唯一の制約は、ディスクのリージョン・コードから生じうる。
図3は、左側に、3:2プルダウンのフラグを含む既知の24pディスク24pDVD32FLが挿入された既知の24pのDVDプレーヤーDVDP24pを示している。プレーヤーは24pまたは60iのAVを出力する。右側は、24pまたは60iのディスクのコンテンツがどのように呈示されるかを描いている:前記旧型のテレビOLDでは呈示なし、前記現在生産されているテレビCURでは60iとして、および前記現代的なテレビMODでは24pとしてである。上記テレビまたはディスプレイはプレーヤーまたはレコーダーDVDP24pに接続されている。
DVDプレーヤーは24p再生をサポートしない。しかし、DVDが24p再生をサポートしたとして、図4の左側に、3:2プルダウンのフラグのない24pディスク24pDVDが挿入されたそのような24pのDVDプレーヤーDVDP24pを示している。プレーヤーは24pのAVを出力する。右側は、24pのディスクのコンテンツがどのように呈示されるかを描いている:前記旧型のテレビOLDおよび前記現在生産されているテレビCURでは呈示なし、だが前記現代的なテレビMODでは24pとして呈示される。
EP04300722.8は、60iの呈示のためには3:2のプルダウンを、50iの呈示のためには24:1のプルダウンを使う24pディスク再生を記載している。しかし、50iの呈示におけるビデオ・フィールド反復は、強い動きのあるシーンでがくつきを生じることがある。これは50iの国では以前には視聴者に知られていなかったことである。
PCT/EP2004/012483は、50i呈示のための24pディスクの再生を記載しているが、それによると、ディスクが再生される際、オーディオは元来のピッチで呈示されるがビデオのフィールドまたはフレームが適応的に挿入されて目に見える動きジャダーを最小にするようにされている。
EP04006792.8は、50i呈示のための24pディスクの再生を記載しているが、それによると、ビデオは25/24だけ速く再生され、再生に際して平均的に元来のオーディ・ピッチを達成するためにオーディオの一部が脱落させられる。脱落は、目印の情報信号によって制御される。しかし、そのようなオーディオ・フレーム脱落は調和的なオーディオ・フェーズの際のつまづき(stumbles)につながることがある。
コンテンツ提供者は、世界の大半で再生できる単一映像周波数・単一オーディオ・スピードのAVディスクを提供するほうを好むであろう。もちろん、世界で販売されるすべてのディスクについてそうするわけにはいかないだろう。それは、多様な言語でオーディオを提供する必要性のため、また、たとえば1枚のDVDディスクにはビデオと一緒にあらゆるオーディオ言語を保存するための十分な利用可能メモリがないためである。しかし、HD-DVDまたはブルーレイといった新しいディスク・フォーマットはAVコンテンツのためにより大きなディスク容量を提供する。ブルーレイ・レコーダーは2003年4月以来日本の市場にある。また、市場にあるますます多くの新しいテレビが24pフォーマットのビデオさえ処理および呈示できる。
本発明によって解決されるべき問題は、世界中の50i、60iおよび24pのフォーマットのディスプレイ/スピーカーまたはテレビ受信機で、ビデオおよびオーディオの高い主観的な品質をもってAVコンテンツが呈示できるような、24pフォーマット記憶媒体および対応する記憶媒体プレーヤーを提供することである。この問題は、請求項1に開示される方法によって解決される。該方法を利用する装置は請求項2で開示される。
上述したように、異なる国については異なるオーディオ「スピード」が求められる。今日のAV記憶媒体は圧縮されたオーディオ・ストリームを使うので、オーディオ・ストリームの自動ピッチ変換による単純なスピード・シフトは現実的ではない。プレーヤーは、すべてのチャネルについて、オーディオ・ストリームをデコードし、ピッチ変換を実行し、そのオーディオ・ストリームを再エンコードおよび再圧縮した上で、その適切な標準化されたデジタル・オーディオ・ストリームを外部オーディオ・デコーダに送達する必要があるであろう。これは受け容れがたいほどの高価なディスクプレやーにつながる。それは、異なるオーディオ・ストリーム・コード種別(たとえばDTS、AC-3、MPEG)をデコードおよびエンコードするための追加的な必要ハードウェアのため、そしてオーディオ再エンコードのための追加的なライセンス費用のためである。
本発明によれば、メディア・プレーヤーまたはレコーダーでは、現在のビデオおよびオーディオ・コンテンツに依存して、オーディオ信号フレームが適応的に脱落させられるか(A脱落[A-drop])、および/またはビデオ・フィールドまたはフレームが適応的に反復されるか(V反復[V-repeat])する。脱落および反復がビデオおよびオーディオ信号の現在のコンテンツに依存するのは、脱落または反復がそれぞれより顕著な信号が、ビデオおよびオーディオ信号の間の同期をそれらの共通の呈示のために制御するようにである。時には、最良の品質を提供するために複数に分離されたAVストリーム片が利用可能である。特別なビデオ・フィールドまたはフレームを反復し、特別なオーディオ・フレームを脱落させることが同期されたAVストリームにつながる。そのAVストリームは、24pのコンテンツや60iのスピードをもつ24pコンテンツを処理も呈示もできないディスプレイ/スピーカー・セットまたはモニタまたはテレビに対応している。
よって、ユーザーは、自分のディスプレイまたはテレビによって、可能な限り最高の映像およびオーディオ品質でディスク・コンテンツを再生できる。再生品質の制限は、ディスク・コンテンツのフォーマットには依存せず、ユーザーのディスプレイの型に依存する。有利なことに、プレーヤーまたはレコーダーに追加的なハードウェアはほとんど必要とされない。
ディスクまたは記憶媒体は、元の24pビデオおよび元来の再生スピードを容易にする適切なコード化されたオーディオ・データ、さらに特定のオーディオ信号フレームまたはブロックについておよび特定のビデオ信号フレームまたはフィールドについて媒体に記憶されているかプレーヤーが生成する追加的情報を含む:
・24p対応のディスプレイ/スピーカーまたはテレビについては、コンテンツを再生するために元のAVデータが使用され、それにより最高の映像品質を達成する。
・60iのディスプレイ/スピーカーまたはテレビについては、AVストリームを再生するためにAVデータストリームに埋め込まれた既知の3:2プルダウン情報またはデータ項目が使用される。たとえば、60iのDVDビデオのディスクについて適用されるMPEGビデオ・ストリーム中の特別なフラグである。
・50iのディスプレイ/スピーカーまたはテレビについては、AVストリームを再生するために特別なA脱落およびV反復の情報またはデータ項目が使用され、それによりその24pAVストリームの50iのテレビまたはディスプレイ/スピーカーでの結果的な平均再生スピードは、48iから50iのスピードの間のどこかとなり、その範囲内で可変となる。
原理的には、本発明の方法は、ビデオ信号についての24Hzフレーム周波数および該24Hzフレーム周波数に対応するオーディオ信号スピードに基づくオーディオ/ビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を一緒に再生するために好適であり:
・前記ビデオ信号が前記24Hzフレーム周波数に対応して呈示されるべきであれば、前記ビデオおよびオーディオ・データを共通の呈示のために前記24Hzフレーム周波数に対応して処理する段階と;
・前記ビデオ信号が60Hzまたはほぼ60Hzのフィールド周波数に対応して呈示されるべきであれば、前記オーディオ・データを共通の呈示のために24Hzまたはほぼ24Hzのフレーム周波数に対応するスピードで処理し、前記ビデオ・データを共通の呈示のために3:2プルダウンを使って60Hzまたはほぼ60Hzのフィールド周波数に対応して処理する段階と;
・前記ビデオ信号が50Hzまたはほぼ50Hzのフィールド周波数に対応して呈示されるべきであれば、前記オーディオ・データおよび前記ビデオ・データを呈示のために処理するときに、オーディオ信号フレームを適応的に脱落させ、および/またはビデオ・フィールドまたはフレームを適応的に反復させる段階であって、該脱落および/または反復が前記ビデオおよびオーディオ信号の現在のコンテンツに依存し、脱落または反復がそれぞれより顕著な信号が、前記ビデオおよびオーディオ信号の間の同期を共通の呈示のために制御するような段階、
を含む。
原理的には、本発明の装置は、ビデオ信号についての24Hzフレーム周波数および該24Hzフレーム周波数に対応するオーディオ信号スピードに基づくオーディオ/ビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を一緒に再生するために好適であり、当該装置は前記オーディオおよびビデオ・データのための処理手段を以下のように制御するコントローラを含んでいる:
・前記ビデオ信号が前記24Hzフレーム周波数に対応して呈示されるべきであれば、前記処理手段は、前記ビデオおよびオーディオ・データを共通の呈示のために前記24Hzフレーム周波数に対応して処理し;
・前記ビデオ信号が60Hzまたはほぼ60Hzのフィールド周波数に対応して呈示されるべきであれば、前記処理手段は、前記オーディオ・データを共通の呈示のために24Hzまたはほぼ24Hzのフレーム周波数に対応するスピードで処理し、前記処理手段は、前記ビデオ・データを共通の呈示のために3:2プルダウンを使って60Hzまたはほぼ60Hzのフィールド周波数に対応して処理し;
・前記ビデオ信号が50Hzまたはほぼ50Hzのフィールド周波数に対応して呈示されるべきであれば、前記処理手段が前記オーディオ・データおよび前記ビデオ・データを呈示のために処理するときに、オーディオ信号フレームを適応的に脱落させ、および/またはビデオ・フィールドまたはフレームを適応的に反復させ、該脱落および/または反復が前記ビデオおよびオーディオ信号の現在のコンテンツに依存し、脱落または反復がそれぞれより顕著な信号が、前記ビデオおよびオーディオ信号の間の同期を共通の呈示のために制御するようにする。
本発明の有利なさらなる実施形態は、個別の従属請求項において開示される。
本発明の例示的な実施形態について、付属の図面を参照しつつ述べる。
図5は、本発明の24pディスク24pDVD32FLAVFLが挿入された本発明のディスク・プレーヤーDVDPIを示している。該ディスクは3:2プルダウンのフラグとともにa-dフラグおよびv-rフラグも含んでおり、これについては後述する。プレーヤーは、接続されたいかなるテレビ受信機またはディスプレイ上でも、可能な最良の呈示モードに従って、50i、60iまたは24pのAVを出力する。この24pディスクのコンテンツは、旧型のテレビOLDFでは50iとして、現在生産されているテレビCURではユーザーの選択に従って50iまたは60iとして、および現代的なテレビMODでは24pとして呈示される。
適応的なA脱落およびV反復についての以下の記述は、三つの関係した節を含む。節Aは、24pフォーマットのコンテンツを連続的に50iフォーマットで呈示する理論的な原理および背景について述べる。節Bは、たとえばディスク上に配置され、本発明の50i呈示のために必要とされる、上述した追加的な情報またはデータ項目について述べる。節Cは、MPEG-2、MPEG-4およびVC-1のようないくつかの既知の型のビデオ・ストリームの保存について、若干のより詳細な要件について述べる。
A)24pフォーマットのコンテンツを連続的に50iフォーマットで呈示する理論的な原理および背景
何らビデオ/オーディオ・スピード変換を実行せず24pを50iのディスプレイで再生すると、オーディオとビデオの間の同期が失われることになる。というのも、ビデオ再生は、48i(24p)ではなく50i(25p)として実現される、すなわち元来のスピードより4.2%速いが、オーディオ再生は元来のスピードで行われるからである。
図6ないし図8は、何が起こるかを時間軸に沿って示している。図7および図8におけるビデオ呈示の鋸歯は、呈示される各フィールドまたはフレームは実際のシーンの時間の一点である、すなわち1/24秒ごとのスチール映像であるという事実の結果である。しかし、オーディオ・データは時間連続な表現関数である。単一のオーディオ・フレームは連続的なオーディオを含んでいる、すなわち単に時間軸上の単一の点ではないのである。図6のaは、逐次のフレームf0ないしf25をもつ元の24pフォーマットの呈示を記載している。図6のbは、50iのディスクの50iのテレビでの既知のDVDビデオ呈示を示している。ここで、たとえば「t0」は「フレーム0の上(top)フィールド」を意味し、「b0」は「フレーム0の下(bottom)フィールド」を意味する。これによると、平均的なビデオ呈示スピードは元来のスピードより4.2%速い。図6cは、24:1のフィールド・プルダウンを示している。すなわち、元の24pストリームの24番目ごとのフィールドが反復されて、平均的なビデオ呈示スピードが元来のスピードに等しくなる。
図7は、映画時間tmovieの軸を実時間trealの軸に対して示している。テレビの正面にある実際の呈示ハードウェア時計が実時間を指示するのに対し、ビデオ・データそのものの中のクロック(すなわち記録された時計)は映画時間を表す。図中の段は、ビデオ・フィールドの実呈示時間(実時間)と呈示されているシーンにおいて表されている時間(映画時間)との間の関係を示している。人間の目が遅いため、鋸歯の呈示はなめらかなビデオとして見える。すなわち、人間の目は、がたつきのない線形でなめらかなビデオ呈示を知覚するのである。いずれにせよ、オーディオは前記スピード(元来のスピードまたは4.2%速いスピードのいずれでも)とは独立して連続的に呈示される。したがって、オーディオ時間関数は直線で表されている。単純化のため、図7bおよび図7cでは、諸関数の特別な呈示が導入されていて、上の諸関数から関数treal(tmovie)=tmovieを引いたものを示している。この種の図では、水平線が、元来のスピードと比べて遅れも進みも全くない理想的な関数を意味する。増加関数は、元来のスピードに比べて映画のより速い呈示を表す。減少関数は、元来のスピードに比べて映画のより遅い呈示を表す。
図8は、ビデオおよびオーディオについて、その種の図呈示のみを使っている。諸呈示関数の垂直線はビデオ呈示の実際の継続時間を表すのではなく、最後に呈示されたビデオ片(time=t0)と次に呈示されたビデオ片(time=t1>t0)との間のつながりを示すのみである。図8のaは、映画呈示の映画館版、すなわち元来のスピードでの呈示を示している。この元来版でさえ、鋸歯が存在する。呈示されるフレームがいまだ1/24s周期の離散的な時間の一点だからである。
図8のbに基づく呈示は、24pから50iフォーマットへの理想的な変換である。しかし、そのような変換は完全な形で実現可能ではなく、コンテンツ提供者にとって経済的でもない。というのも、要求されるコンピュータ・パワーおよび人間の操作者による追加的な作業が大きすぎるからである。
図8のcは、元来のオーディオ・スピードより4.2%速いビデオ再生を描いており、オーディオとビデオが同期を失うことを示している。
図8のdは、現在のDVDビデオのディスクについての解決策、すなわちビデオおよび50iフォーマットでのオーディオの4.2%速い再生を描いている。そのようなAVストリームのオーサリングは、オーサリングの間に、元のオーディオ・ストリームの、4.2%速いオーディオ・ストリームへの変換をすでに実行している。したがって、オーディオとビデオはよく同期されているが、そのようなディスクは、非標準的なオーディオ・スピードのため、現在利用可能な外部オーディオ・デコーダでは、元来のオーディオおよびビデオ・スピードで再生可能ではない。
図8のeは、4.2%速いスピードのビデオ出力を示しているが、呈示されるオーディオ・フレームは元来のスピードである。いくつかのオーディオ・フレームを脱落させることにより、通常スピードのオーディオがより速いスピードのビデオ呈示と同期される。これはEP04006792.8に記載されている。
図8のfはその逆である。いくつかのビデオ・フィールドが24:1のプルダウンで反復されて、ビデオ呈示が元来のスピードまで遅くされる。これにより、オーディオは元来のスピードでエンコードおよび再生される。これはPCT/EP2004/012483およびEP04300722.8に記載される。
図8のgは、図8のeおよびfの処理の組み合わせを使っており、本発明の処理を説明している――いくつかのオーディオ・フレームが脱落させられ、いくつかのビデオ・フィールドが反復される。結果として得られる平均的な呈示スピードは、元来のスピードと4.2%速いスピードとの間のどこかになるよう制御されうる。
特別なオーディオ脱落(a-d)およびビデオ反復(v-r)指標またはフラグがAVストリームに割り当てられる。好ましくは、コンテンツ提供者がこの情報をオーサリングの際にディスク上に入れる。すなわち、再生装置はそのようなフラグを計算する必要はなく、その場合、関係する必要なプレーヤー・ハードウェアまたはソフトウェアはより簡単かつより安価になる。
a-d指標およびv-r指標はフラグであることができる:
・各a-dフラグは単一のオーディオ・ストリーム(たとえばAC-3)またはいくつかのパラレルなオーディオ・ストリーム(たとえばLPCM、DTS、AC-3およびMPEG)の特別なオーディオ・フレームを指示し;
・各v-rフラグは、フィールド・エンコードされるビデオ・ストリームの場合には特別なビデオ・フィールドを、フレーム・エンコードされるビデオ・ストリームの場合には特別なビデオ・フレームを指示する。
再生装置のデコーダは、再生の際にこれらのフラグを使って、ビデオ・デバイスの4.2%速い50iでの再生を、元来のスピードのオーディオ・ストリームと同期させる。その同期は、適切なビデオ・フィールドまたはフレームを反復することによって、およびオーディオ・ストリームの適切なフレームまたは変換に関係したブロックを脱落させることによって実行される。a-dおよびv-rのフラグまたは指標は、ビデオ再生スピードの低下およびオーディオ再生スピードの上昇につながる。有利には、オーディオ・フレーム丸ごとの脱落により、オーディオ・ピッチが保たれる。すなわち、ピッチ変換が必要でなくなる。有利なことに、MPEG、AC-3およびDTSのよう大半のストリーム・フォーマットでは、関係したビデオ・フィールド/フレームおよびオーディオ・フレーム/ブロックは簡単な方法で同定できる。したがって、これらのフィールド/フレーム/ブロックを検出するために追加的なデコードまたはエンコード処理や追加的なライセンスが必要とされることはない。
実際上は、ビデオ・ストリーム再生スピードVvは、50iから48iのより近くに低下させられ(48i≦Vv≦50i)、オーディオ・ストリーム再生スピードVaは48iから50iのより近くに上げられ(48i≦Va≦50i)、結果として平均的にVvはVaに等しくなる(ただし、再生の始まりと終わりに可能性として小さな時間ギャップが生じうる)。VaおよびVvはAVストリーム内で変動しうる(頻繁に変動するであろう)。換言すれば、24pのAVストリームの50iのテレビまたはディスプレイ/スピーカーでの結果的な平均再生スピードは48iと50iの間のどこかにある。すなわち、平均再生スピードは0%ないし4.2%、上げられる。局所的には、短い時間期間の間、ビデオまたはオーディオ・スピードが48iより遅くなったり、50iより速くなったりすることもありうる。
反復するのに最も適切なビデオ・フィールド/フレームおよび脱落させるのに最も適切なオーディオ・フレームは、次のようにして見出せる:
・好ましくは、オーサリング・ツールは、映像コンテンツに小さな動きスピードしか含まないビデオ・フィールドまたはフレームを、反復(v-rフラグ)のために選択する。そのようなシーンではビデオ・フィールドまたはフレームの反復はほとんど、あるいは全く目につかないからである。
・好ましくは、オーサリング・ツールは、シーンの終わりの、または新しいシーンの始めの、または暗いシーンの、たとえばシーンの切れ目の繰り返される黒い画面の間のビデオ・フィールドまたはフレームを、反復(v-rフラグ)のために選択する。
・好ましくは、オーサリング・ツールは、より少ない調和オーディオを含む、低い音量を含む、唇と同期した部分を含まない、および/またはノイズ様のオーディオ期間を含むオーディオ・フレームを、脱落(a-dフラグ)のために選択する。そのようなシーンでは、オーディオ・フレーム/ブロックの脱落はほとんど、あるいは全く知覚できないからである。
四種類のシーンが存在する:
・ビデオ・フィールド/フレーム反復およびオーディオ・フレーム脱落に好適なシーン(VAS);
・ビデオ・フィールド/フレーム反復には好適だがオーディオ・フレーム脱落には好適でないシーン(VaS);
・ビデオ・フィールド/フレーム反復には好適でないがオーディオ・フレーム脱落に好適なシーン(vAS);
・ビデオ・フィールド/フレーム反復にもオーディオ・フレーム脱落にも好適でないシーン(vaS)。
多くのシーンは厳密な同期は必要としない。たとえば、背景音楽のある風景のビデオがそうである。そのようなシーンでは、オーディオと同期を取るために(すなわち、ビデオは50iだがオーディオは48i)、二つのシーンの切れ目がいくつかの黒いビデオ・フレームを反復してもよい。さらに、大半のシーンはVAS、VaSまたはvASの型である。
・シーンの切れ目も同期のために使用できる。
・好ましくは、VASシーンについては、オーディオ・フレーム脱落およびビデオ・フィールド/フレーム反復は均一に使用される。その結果、オーディオ&ビデオは約49iとなる。
・VaSシーンについては、ビデオ・フィールド/フレーム反復が好ましく、その結果、オーディオ&ビデオは約48iとなる。
・vASシーンについては、オーディオ・フレーム脱落が好ましく、その結果、オーディオ&ビデオは約50iとなる。
・vaSのケースは比較的まれに生起する。たとえば、バイオリンのようなハーモニックな音楽を伴う唇に同期したシーンがそうである。したがって、そのようなシーンでは、ビデオ・フィールド/フレーム反復およびオーディオ・フレーム脱落は適用されない。
・好ましくは、オーサリング・ツールは、異なるシーン種別、たとえばVaS、vaS、vASのシーケンスの面倒を見る。きわどい(critical)シーンでのわずらわしいがたつきやオーディオ脱落を軽減または回避するために、きわどいシーン(vaS)に隣接するそれほどきわどくないシーン(VAS、VaS、vAS)が使われる。たとえば、オーサリング・ツールが、vaSシーンの前でのビデオ再生の時間進みと、該vaSシーンの終わりでのオーディオ再生の時間進みを提供する。これは可能な限りビデオのがくつきおよびオーディオの口ごもりを軽減する。きわどいvaSシーンの間のシーンの切れ目も、該きわどいシーンの間のv-rフラグおよびa-dフラグの必要性を軽減または解消するために使用されるべきである。
必要なビデオ・フィールド/フレーム反復フラグおよびオーディオ・フレーム脱落フラグは、可能な限り頻繁にシーンの切れ目に置かれるべきであり、vaSシーンに置かれるのは可能な限り少なくするべきである。
非常にきわどいシーン部分がある場合、そのような特別なAVストリーム部分については、異なるAVストリーム片が使用されてもよい。たとえば、50i呈示および24p/60i呈示について、異なる(DVDビデオの呼び方では)プログラム・チェーンが使用されてもよい。非常にきわどいシーンについては、これらのプログラム・チェーンは、媒体上に記憶されているそれぞれ独自の別個のAVストリーム部分を使用する。図22に一例が示される。上の水平な矢印は、AVストリームのどの部分が24pまたは60iの再生のために使用されるかを示している。その下の水平な矢印は、AVストリームのどの部分が50iの再生のために使用されるかを示している。これらの矢印の下の長方形の領域は、ディスクに記録されている形のAVストリーム・データ、たとえばDVDビデオVOBファイルの連続するセクタを示す。DVDビデオでは、そのような異なる呈示はプログラム・チェーンによって容易にされる。すなわち、DVDビデオにおけるマルチアングル呈示と同様である。AVストリームの主要なパーティションは、24p、60iおよび50iでの再生のために共通に使用される。共通部分のAVストリーム項目に対して、特異的な24p/60iのAVストリーム項目および特異的な50iのAVストリーム項目が取り付けられる。24p/60i再生のためには、共通AVストリーム部分および特異的な24p/60iのAVストリーム項目が再生されるのに対し、50i再生のためには、共通AVストリーム部分および特異的な50iのAVストリーム項目が再生される。そのような目的のため、ナビゲーション情報または高レベル情報(たとえばDVDビデオの.IFOファイル)がこの特徴を扱うよう適応される。そのような解決策は、あらゆる利用可能なテレビまたはディスプレイ/モニタ/オーディオ設備装置について最大限の柔軟性を提供する。したがって、記憶媒体上で追加的に要求されるメモリ容量が最小という観点で最大の呈示品質が提供される。
B)3:2プルダウン、a-dフラグおよびv-rフラグをどこに、どのように保存すべきか
いくつかの可能な場所がある。好ましい場所はAVストリームそのものの中である。すなわち、フラグが、MPEGビデオ・ストリームで3:2プルダウン・フラグについてすでに使われているように、当該AVストリームの一部となるのである。特別な用途については、AVストリームの外の場所を適用することも有用でありうる。そのような特別な用途は、特別なプレーヤー装置でありうる。該特別なプレーヤーは順次走査ソースの24pビデオに基づく既知の3:2プルダウン60iのDVDビデオを再生するのに、該60iのDVDビデオのディスクのためのa-dフラグおよびv-rフラグの位置情報を含む追加的な外部情報データブロックを適用し、それにより該AVストリームを50i装置のために変換する。この情報データブロックは、特別なプロバイダーからインターネット経由で配送されてもよい。
図9は、適切なa-dフラグおよびv-rフラグの生成のために評価することのできるビデオおよびオーディオ信号特性をもつ24pのAVレコード部分の例示的なオーサリングを示している。
図9のaは、ビデオ・シーケンス中の動きの度合い、たとえばカメラ・パン、ほとんど動きなしおよび速い背景の動きと、いくつかのシーンの切れ目とを示している。カメラ・パンは強い動き、すなわち度合いの高い動きを生成する。強い動きの間、ビデオ・フィールド/フレーム反復は可能なら回避すべきである。背景だけが強く動いている場合も動きの度合いは高い。
図9のbは、示されたビデオ信号とそれに割り当てられたオーディオ信号との間の相関の度合いを示している。オーディオ信号はドアが閉じる音および人物の発話を含んでおり、これはいずれも強い相関を表す。この場合、オーディオとビデオは可能な限り同期を保たせるべきである。
図9のcは、オーディオのハーモニック・レベルの度合いを示している。高い度合いのハーモニック・レベルを表す、バイオリンが背景音楽として含まれている。そのようなシーンではオーディオ脱落は避けるべきである。図9のaないしcで言及した特性、すなわちそのAVコンテンツの特別な属性は、人間の操作者によって生成されることもできるし、自動画像解析ソフトウェアによって生成されることもできる。
図9のdは、50iのテレビについての結果的なAV呈示を示している。現実のビデオ関数の鋸歯は、図面を簡単にするため、なめらかな関数で置き換えてある。それにより、この簡略化されたビデオ関数は、関係するオーディオ関数と直接比較可能になる。
描かれているレコード時間全体の間、オーディオとビデオは完全に同期されてはいない。オーディオとビデオの同期を保つ必要がない部分は、音声およびビデオが最もよく見えるようにエンコードされる。同期を必要とする期間についてのみ、ビデオ・フィールド反復およびオーディオ・フレーム脱落が適用される。さらに、同期を保つため、および/または回復するために、シーンの切れ目および音が静かなシーンが利用される。オーサリング・ツールは、オーディオおよびビデオの所望の時間関数を得るために、適切なa-dフラグおよびv-rフラグを設定する。
a-dフラグおよびv-rフラグの対応する例示的な導出が図9に基づく図10に示されている。図10の下の部分は、図9のdの時間関数を繰り返したものである。上の部分は、対応するa-dフラグおよびv-rフラグの位置を示す。
第一、第三、第四、第五および第六のシーンの切れ目では、二つ以上のフィールド(またはフレーム)が反復され、これはv-rフラグ関数における記号「◆」によって表されている。第一のシーンの切れ目から第三のシーンの切れ目までの間では、第一の部分では時間単位当たりのv-rフラグの割合はビデオ・スピードが48iに対応するようなものであるのに対し、第二の部分では、時間単位当たりのv-rフラグの割合はビデオ・スピードが49iに対応するようなものである。第四のシーンの切れ目から、および第六のシーンの切れ目の先では、時間単位当たりのv-rフラグの割合はビデオ・スピードが49iよりやや低い値に対応するようなものである。残りの部分、すなわちビデオ・シーケンスの「50i部分」では、v-rフラグはないか、あるいはv-rフラグは「0」に設定されている。
第一および第五のシーンの切れ目では、二つ以上のオーディオ・フレーム(またはブロック)が脱落させられ、これはa-dフラグ関数における記号「◆」によって表されている。第三のシーンの切れ目から第四のシーンの切れ目までの間では、ある第一の部分では時間単位当たりのa-dフラグの割合はオーディオ・スピードが50i超に対応するようなものである。第四のシーンの切れ目から第六のシーンの切れ目までの間では、時間単位当たりのa-dフラグの割合は、オーディオ・スピードは、第一の部分では48iをやや上回る値に、第二の部分では50iをやや上回る値に、第三の部分では48iに対応するようなものである。残りの部分、すなわちオーディオ信号の「48i部分」では、a-dフラグはないか、あるいはa-dフラグは「0」に設定されている。好ましくは、各a-dフラグはすべてのオーディオ・ストリームについて有効である(DTS、AC3、MPEG、…)。ただし、短い時間期間については、異なる構成の(differently arranged)a-dフラグがその他のオーディオ・ストリームについて使用されることも可能である。
AVストリームそのものがa-dフラグおよびv-rフラグのための位置として使われる場合、MPEGストリームにおけるuser_data()フィールドがこの目的のために使用できる。あるいは、MPEGストリーム・データの外だがそれでもAVストリーム内にある情報項目が適切なビデオ・フィールド/フレームおよびオーディオ・フレームを指示する。たとえば、DVDビデオのストリームのパック・ヘッダまたはナビゲーション・パックを拡張して、これらのパックが、該ナビゲーション・パックが属するビデオ・オブジェクト・ユニット(video object unit)VOBU全体の内部での適切なビデオ・フィールド/フレームおよびオーディオ・フレームの正確な位置を含むようにすることができる。対応する例は図13および図14に示される。
図13は、DVDビデオのVOB構造と同様な構造を有するAVストリーム中でa-dフラグおよびv-rフラグを実装する実施例を記載している。左側には、ビデオ・デコードの解決策が示されているのに対し、右側にはオーディオ・デコードの解決策が示されている。VOBU全体のa-dフラグおよびv-rフラグはVOBUのヘッダ(ナビゲーション・パックNV_PCK)内に保存される。v-rフラグはビデオのフィールド番号またはフレーム番号のテーブルをなす。この番号がビデオ・デコーダの後処理部分に与えられる。ビデオ・フィールドまたはフレーム・カウンタが、デコードされたフィールド/フレームを数えて、v-rフラグの状態または存在によって指示されるようにフィールド/フレームの反復を制御する。これはハードウェア解決策であってもよいし、あるいはソフトウェア解決策およびハードウェア解決策の組み合わせであってもよい。
a-dフラグは、それぞれがこのVOBUのオーディオ・ストリーム全体の適切なフレーム/ブロック番号を指示するフレーム番号またはブロック番号のテーブルをなす。a-dフラグによって指示されるオーディオ・フレーム/ブロックが50i再生のために脱落させられることになる。脱落はオーディオ・デコーダ自身の中で実行されることもできるし、あるいは適切なオーディオ・フレーム/ブロックをスキップすることによってデコーダ入力ストリーム・デマルチプレクサの中で実行されることもできる。異なるフレーム構造をもついくつかのオーディオ・ストリームがある場合には(たとえば、LPCM、AC-3またはDTSを並列にデコードするとき)、二つ以上のa-dフラグ・テーブルが使用されることもできる。
図14は、DVDビデオのVOB構造と同様の構造を有するAVストリーム中でa-dフラグおよびv-rフラグを実装するためのもう一つの解決策を記載している。VOBU全体のa-dフラグおよびv-rフラグはVOBUのヘッダ(ナビゲーション・パックNV_PCK)内に保存される。左側では、v-rフラグが、相対セクタ番号、バイト・アドレスおよびバイト値のテーブルをなす。そのような3つの値の各組が一つのv-rフラグを表す。相対セクタ番号はこのVOBU内でのセクタをアドレス指定する。バイト・アドレスはこのセクタ内での正確なバイトを指示する。50i出力の場合、このバイトが、v-rフラグのバイト値によって置換される。このバイトは、top_field_firstおよびrepeat_first_fieldのビットを適切にセットし、一方でまわりの他のビットは不変のままにされうる。結果として得られるビデオ・ストリーム片はビデオ・デコーダに送られる。バイト置換はビデオ・データをハードウェア・デコーダに送る前にソフトウェア・デマルチプレクサによって実行できるので、この解決策は、現行のMPEG-2デコーダ・ハードウェアの実装を著しく簡単にする。すなわち、現在利用可能なデコーダ・ハードウェアを使うことができるのである。よって、製造業者は、ハードウェアとして実装するかソフトウェア解決策として実装するかを問わない。この手順は、ナビゲーション・パックNV_PCK内の追加的なテーブルを用いて3:2のプルダウン・フラグを適用するためにも使える。それにより、ビデオ・ストリームにはプルダウン・フラグが全くなくなり、適切なプルダウン・フラグ(3:2のプルダウンまたはv-rフラグとして)は再生の際にリアルタイムで挿入されることになる。逆も可能である。すなわち、ストリームにすでに3:2プルダウン・フラグが挿入されていて、再生中にv-rフラグがこれらの3:2プルダウン・フラグを除去するのである。両者の混合も可能である。これは、選択された呈示モード50i、60iまたは24pとは独立して、VOBU当たりの必要とされるバイト置換の最大をできる限り低く保つことになる。有利には、これはプロセッサ要件を軽減する。すなわち、このモードのソフトウェア実装を簡単にする。
代替として、ビデオ・ストリームについてのバイト置換は、特別なビットが同じバイト内に位置していない場合、代わりに語置換であってもよい。
右側では、a-dフラグが、相対セクタ番号および相対フレーム/ブロック番号のテーブルをなす。一つのa-dフラグは、一つの相対セクタ番号と一つの相対フレーム番号からなる。相対セクタ番号は、このVOBU内での適切なセクタを指示し、相対フレーム番号はこのセクタ内で始まる当該フレームの相対番号である。このアドレス指定されるオーディオ・フレームが脱落させられる。脱落はオーディオ・デコーダ自身の中で実行されることもできるし、あるいは適切なオーディオ・フレーム/ブロックをスキップすることによってデコーダ入力ストリーム・デマルチプレクサの中で実行されることもできる。異なるフレーム構造をもついくつかのオーディオ・ストリームがある場合には(たとえば、LPCM、AC-3またはDTSが同じディスクに並列に保存されるとき)、二つ以上のa-dフラグ・テーブルが使用されることもできる。
図13および図14に記載されたオーディオ・ストリームおよびビデオ・ストリームを扱う例は変更できる。a-dフラグおよびv-rフラグまたはデータ項目をマークする最善の方法は、好ましくは、オーディオ・デコーダおよびビデオ・デコーダの選択された実現に依存する。たとえば、ビデオ・デコーダが既知のMPEG-2ビデオ・デコーダであれば、入力ストリーム・デマルチプレクサは単なるMPEG-2ビデオ・ストリームをそのハードウェア・デコーダに届ける。該デコーダは何ら追加的なレジスタ設定は必要ない。他方、特別なレジスタ設定(たとえば、ignore_3_2pull_down_flags〔3:2プルダウン・フラグを無視〕またはuse_a_d_and_v_r_flags_instead_of_3_2pull_down_flags〔3:2プルダウン・フラグの代わりにa-dフラグおよびv-rフラグを使用〕)を扱えるMPEG-2デコーダなら、入力ストリーム・デマルチプレクサのタスクが簡単になる。
有利には、そのような拡張されたナビゲーション・パックは、のちに説明するように、このビデオ片、たとえばVOBUの最初の時刻においてオーディオ・ストリームとビデオ・ストリームとの間の意図されるtmovie軸のオフセット距離をも含むべきである(図13および図14には示さず)。それは、タイトル・チャプターへ、アングル・スイッチへ(マルチアングルの場合)、トリック・モードへ(たとえばいくつかのトムソンDVDプレーヤーによって提供される、オーディオのある早送り)あるいは早送りトリック・モードの直後の再生態様への直接ジャンプを処理するために必要である。それにより、DVDビデオの.IFOファイル定義に何の特別な適応も必要でない。
実際の連続的な再生同期は、プレーヤーまたはレコーダー装置の多重化解除部(demux)によって制御される。このdemux部はAVストリームを読む、すなわち:
・たとえば上述したような拡張されたナビゲーション・パックを読むことにより、オーディオとビデオ呈示の間の開始時間オフセットを認識し;
・ビデオ・データ部分を読み;
・顧慮されるべきオフセットがない場合、あるいはオフセットがオーディオ呈示についての遅れた開始を指示している場合、ビデオ呈示を開始し;
・オーディオ・データ部分を読み;
・顧慮されるべきオフセットがない場合、あるいはオフセットがビデオ呈示についての遅れた開始を指示している場合、オーディオ呈示を開始し;
・オフセット時間が経過したときに残りのストリーム(オーディオまたはビデオ)を開始する。この時点で、呈示はオーサリングによって意図されているとおりになる。すなわち、この時点において上記の同期(「実際の同期」)が実行される。
AVストリームのデコードのはじめにおける追加的な同期ステップは、図11および図12にも描かれている。図11は、ストリームの記録順(オーサリングの際の)と再生順との間の違いを示している。記録順はtmovie方向であるのに対し、再生順はtreal順である。したがって、DVDビデオのディスクの各VOBUは、約0.5秒をカバーする、二つの記録時間線の間の完全なビデオおよびオーディオ・ストリーム・データを含む
図11のbは、tmovie‐treal図への変換が示されている。AVストリームの再生順はやはりtreal方向であるが、AVストリーム記録時間線の方向は右に(すなわち時計回りに)45度回転される。図11のaにおいてオーディオおよびビデオ・ストリームが互いに接近している限り、問題はない。すなわち、オーディオとビデオの交点、そして記録時間線と再生時間線の交点が常に存在する。しかし、オーディオおよびビデオの関数の間の距離が大きくなると、図12に描かれるように、記録時間線と再生時間線の間に、オーディオとビデオについての共通の交点はない。
図12の例は、図9のdの左側よりも詳細に、24pのAVストリームを50iのAVストリームとして再生し、それによりa-dフラグおよびv-rフラグを適用するときの時間的な関係を示している。AVストリームの24p呈示のためには、記録順と再生順は互いに接近しており(図示せず)、再生は容易に実行される。しかし、24pのAVストリームがa-dフラグおよびv-rフラグを適用することによって50iのテレビのために再生される場合、オーディオ呈示とビデオ呈示は、図に示されるように、その非常に接近したタイミングを去る。この例では、再生時間の線が記録時間の線と交差するのは、オーディオ・ストリームについてはある点SRPAにおいてである。しかし、ビデオ・ストリームは異なる点:SRV(記録時間線)およびSPV(再生時間線)において交差される。したがって、装置が再生時間線において(すなわち、チャプターへの直接ジャンプ後に)呈示を開始する必要がある場合には、特別な対応が必要になる。というのも、装置はAVストリームを記録時間線に従って見出すであろうからである。すなわち、適切な50iに従う呈示を実行するためには、装置はまず、a-dフラグおよびv-rフラグによって意図されているtmovie軸上での所望の時間的距離を得るためにオーディオ・ストリームおよびビデオ・ストリームを同期させる必要があるのである。この初期同期に続いて、(a-dフラグおよびv-rフラグを適用することによる)50iでの再生が連続的に実行されることができる。その様子が図10の下部に示されている。
換言すれば、図11および図12は、同期された呈示を準備するための初期プロセスを説明しており、このあとに連続的な(かつ長続きする)呈示が続く。
図12では、demuxはAVストリーム中のどこかに、たとえばDVDビデオのタイトル・セットのある特定のVOBUにジャンプする。この例では、記録されたAVストリームの入口点は、記録時間線に従って始まるAVストリーム・データを含む。すなわち、AVストリームが再生時間線(すなわち点SPVおよびSRPA)において始まることが好ましいであろう。しかし、残念ながらAVストリームは、ストリーム記録線(すなわち点SRVおよびSRPA)に従ったAVデータで始まる。したがって、装置は、SRVとSPVの間の最初の数ビデオ・フィールドを脱落させなければならない。これらのビデオ・フィールドの脱落に続いて、適切な50i呈示がSPVおよびSPRAにおいて始まる。上述したように、入口点が、tmovie軸上でのビデオ・ストリームとオーディオ・ストリームの間の所望の距離を得るために最初の数オーディオ・フレームの初期脱落につながることもありうる。
「記録順」とは、記録されるオーディオ・フレームおよびビデオ・フィールド/フレームの呈示時間上での順序に基づいていることを意味する。あるストリーム種別の内部構造が呈示順とは異なるデータを組織化する場合、本発明の開示の定義および図面は、そのコンテンツの呈示時間に関係する。たとえば、BフレームをもつMPEG-2ビデオのストリームのストリーム・データ・バイト順(デコード順)(I0,P1,B2,B3,P4,B5,B6,...)は呈示順(I0, B2,B3,P1,B5,B6,P4,...)とは異なる。したがって、諸図面におけるビデオ・ストリーム・タイミングは呈示時間に対応する。すなわち、図12におけるタイミングは、デコードされるAVストリーム・データに基づくのであって、エンコードされるAVストリーム・データに基づくのではない。
図21では、ディスクのデコードされたデータ(たとえば、オーディオ・バッファ内のPCMオーディオ値およびフレーム・バッファ内のビデオ・フィールド/フレーム)と比較してのビデオおよびオーディオの呈示が示されている。この図は、ビデオ/オーディオ呈示の3つの型24p、50iおよび60iに依存するさまざまな反復および脱落動作に起因して必要とされる再生制御を理解するための役に立つ。図21のaは、デコードされたビデオに関係しており、図21のbはデコードされたオーディオ・ストリームに関係している。網掛けまたは灰色の部分は、多重化されたAVストリーム片、たとえば約1秒の呈示を表すAVデータ(たとえばDVDビデオのVOBU二つ)の、デコードされた正味のビデオまたは正味のオーディオ・ストリーム部分の例を示している。網掛けまたは灰色の部分の内部の矢印は、デコードされたストリームのどの部分が再生され、どの部分が反復され、どの部分が脱落させられるかを記述している。これらの矢印は、再生モードに、すなわち24p、50iまたは60iの呈示に依存する。60iのビデオ再生矢印については、均一に分担されたビデオ・フィールド反復によって、3:2のプルダウンがよく見える(真のAVストリームは別の順、たとえばMPEG-2についてなら再生順のI、B、B、PでなくI、P、B、B順にエンコードされることもありえ、したがって灰色のビデオ・ストリーム部分は、そのディスクの真のエンコードされたビデオ・データを記述するのではなく、デコードされたフレーム/フィールドを記述する)。現在のビデオおよびオーディオ内容に依存しての特別なビデオ・フィールド反復および特別なオーディオ・フレーム脱落が50iでの再生を実現する。24pの再生は、オーディオおよびビデオをそのまま、すなわちビデオ・フィールド/フレーム反復もオーディオ・フレーム脱落もなしに再生することを意味する。
代替として、意図された50i呈示のはじめにオーディオおよびビデオを同期させるために、上記以外の処理が使われることもできる。たとえばAVストリーム内において、先行するストリーム種別(オーディオまたはビデオ)のためのより早い入口点を示す追加的情報が利用可能であることができる。他方のストリーム種別はミュートされ、無音のオーディオまたは黒い画面となる。これはいくつかの種類のシーンについては受容可能であってもおかしくない。たとえば、シーンの切れ目で始まるシーンである。よって、ジャンプ後、たとえばチャプターまたは異なる視点アングルへのジャンプ後、早送りモード後の再生モードへの変化後などの再生の、まさにはじめの時刻における一時停止が軽減されうる。これは、よりなめらかでより消費者に便利な再生挙動につながる。
AVストリーム全体のはじめの部分でさえ、50iでの呈示のために、オーディオとビデオのストリームのタイミングの間にtmovie軸の時間距離をもって始まることができる。
また、黒いビデオ・フィールドまたはフレームの反復を指示するために特別なインジケータが使用されることができる。もともと黒いビデオ・フィールドまたはフレームが存在していなくてもよい。demuxまたはビデオ・デコーダが人工的な黒い画面をビデオ呈示の途中に挿入する。それは、特にシーンの切れ目では理にかなったことである。もともとの24pのビデオ・ストリームがフィールド位置Xにおいて黒い画面を含んでいない場合、demuxまたはビデオ・デコーダはそれぞれ、50iでの再生の間に、もし適切なフラグによって50i出力のために要求されれば、人工的な黒い画面を挿入する。黒い画面は簡単な方法で生成できるので、この実施形態は最小限の実装努力(ソフトウェアの変更はあるがハードウェア変更はなし)しか必要とせず、追加的なプレーヤー・パフォーマンスは必要とされず、むしろより少なくてすむことさえある。
非常にきわどいシーン(たとえば長続きするvaSシーン)については、二種類のオーディオ・ストリームが利用可能にされることができる。すなわち、生成されるべき出力24p、50iまたは60iに依存してプレーヤーが適切なオーディオ・ストリームに切り換えるのである。そのようなシーンは非常にまれにしか起こらないであろうから、ディスク上で必要とされる追加的な記憶容量は受容可能である。この特徴は、消費者に対して非常に心地よい再生を提供する。
上述したように、AVストリーム内の3:2プルダウン・フラグを、ビデオ・フィールド/フレーム反復を提供するために使うことができる。この場合、再生中にどの3:2プルダウン・フラグが適用され、どれが無視されるかをデコーダが知らされるようにビデオ・デコーダを制御するための追加的な情報が必要である。そのような種類の情報項目は、たとえばDVDストリームのナビゲーション・パックまたは他のAVストリーム内の適切な位置に保存されうる。
すべてのMPEGビデオ・デコーダが、50iでの再生中に3:2プルダウン・フラグを無視できるわけではないので、3:2プルダウン・フラグは、実際のMPEGストリームの外だがそれでもAVストリーム内であるところに保存されることができる。たとえば、DVDビデオ規格で使われているナビゲーション・パック内に、またはパック・ヘッダ内にである。これらの情報項目は、デコーダがどのビデオ・フィールド/フレームが反復される必要があり、どれがそうでないかを自動的に知るように保存されうる。demuxがこの情報をMPEGデコーダに、たとえば何らかのハードウェア・レジスタを設定することによって提供する。純粋なMPEGストリームはいかなる3:2プルダウン・フラグもv-rフラグも含まない。そのような解決策は、ビデオ・デコーダのためのハードウェア要件を軽減しうるが、再生中のdemuxによるより多くの動作を要求する。
あるさらなる実施形態によれば、50i(60i)呈示はAVストリームのネイティブな記録である。すなわち、フラグは、AVストリームを60i(50i)呈示に、あるいは24p呈示にでさえ適応させるのに使われるのである。この目的のため、いくつかのビデオ・フィールドが脱落させられ(v-dフラグ)、いくつかが反復され(v-rフラグ)てもよく、オーディオ・フレームが脱落させられ(a-dフラグ)または反復され(a-rフラグ)てもよい。これらのフラグは、上記のv-rフラグおよびa-dフラグと類似の仕方で使われる。好ましくは、再生中のわずらわしい櫛効果(comb effects)(24p)またはがたつき(60i/50i)を避けるために動き補償が適用される。
あるさらなる実施形態によれば、60iでコーディングされたAVストリームはインターレースされたビデオ・フィールド/フレームを含みうる。この場合、24pの再生は、順次走査ディスプレイ上での結果的な櫛アーチファクトを補償する動き補償が利用可能である場合にのみ有用である。
しかしながら、50i再生は次のことによって実施可能である:
a1)60iのビデオ・シーケンスをそのまま、すなわち20%速く再生するが、オーディオ・フレーム(a-rフラグで指示される)は適切に反復する,
a2)または、オーディオ・シーケンスはそのまま再生するが、時々二つの連続した、または2の倍数の連続したビデオ・フィールド(v-dフラグによって指示される)を脱落させる、
b)時々いくつかのオーディオ・フレーム(a-rフラグによって指示される)を反復し、時々二つの連続した、または2の倍数の連続したビデオ・フィールド(v-dフラグによって指示される)を脱落させる。
さらに、以前のシーンが適切なa-rフラグおよびv-dフラグによってコードされうる。すなわち、この目的のために、いくつかのa-rフラグおよびv-dフラグが前のおよび/または後の順次走査シーンに移る。前のおよび/または後の順次走査シーンにおけるa-dフラグおよびv-rフラグの数の減少さえ、そのような効果につながる。
あるさらなる実施形態によれば、24p/60iでコードされたAVストリームは、字幕、たとえばDVDのサブピクチャーを含みうる。字幕は一般に話される言葉について使われるので、デフォルトとして、オーディオ呈示と同期されるべきである。しかし、時には字幕はビデオ内容に関係している。たとえば、字幕が表示された城の名前を記述する場合がそうである。したがって、字幕の対応する同期を示すための機構が存在すべきである。
一つの方法は、字幕がビデオまたはオーディオに、あるいはビデオとオーディオの平均タイミングにでもいいが、同期されるべきかどうかを指示することである。その解決策はいくぶん制約されるが、あらゆる場合のうち95%超において十分であろう。
もう一つの方法は、すでに記録されている字幕情報に特別な開始時刻および終了時刻、たとえば、開始時刻のための時間オフセットとDVDサブピクチャー・ユニットの継続時間を、しかるべきVOBUのNV_PCK内で指示することである。
第三の方法は、50i再生のための追加的な字幕ストリームを使用することである。すなわち、50iでの再生のためには、通常の24p/60i字幕ストリームの代わりにそのような字幕ストリームが使われるのである。たとえば、DVDについては、これは、正しいサブピクチャー・ユニットを選択する、50iのための別個のPGCを使うことによって実現できる。特別な用途のためには、オーディオ・ストリームのスピードをオーサリングの間に(たとえばピッチ変換によって)約2.1%上げることができる。24p/60i再生のためには、いくつかのオーディオ・フレームが反復され、50iの再生のためにはいくつかのオーディオ・フレームが脱落させられる。それは50i再生のための必要とされる同期プロセスを軽減する。しかし、この実施形態は、元の再生モード(24p)のスピードを上げる、すなわち24p/60iでの再生のために追加的な同期が必要とされる。平均して、同期は最小化される。欠点は、元の24p再生スピードを達成するのが非常に難しくなるということである。
VC-1コーディングの構造は、MPEGビデオのコーディングの構造に非常に似ているので、MPEGビデオに関する上記の陳述はVC-1についても有効である。ただ、VC-1における関係する諸フラグは異なる呼び方がされる。
脱落させるのに最も適するオーディオ・フレームをいかにして決めるかはEP04006792.8にも示されている。がたつきがかろうじて見える程度の、あるいは知覚できるがたつきがないことさえありうるような反復するのに最も適するビデオ・フィールド/フレームをいかにして決めるかは、PCT/EP2004/012483に示されている。EP04006792.8は、24:1プルダウンを使った24pコンテンツからの50i出力の簡単に実装できる方法を示している。本発明は、上記三つの出願の利点を巧妙な仕方で組み合わせるが、その主たる欠点は回避している。
本発明は、追加的特徴として現行のDVDプレーヤーに適用可能であるが、適切なa-dフラグおよびv-rフラグについての追加的情報を必要とする。そのような情報はインターネットからダウンロードできるし、あるいはDVDディスク上の別個のデータとして、既知のDVDビデオ準拠データとは切り離して添付されることもできる。本発明は、HD-DVDおよびブルーレイのような将来のディスク・フォーマットにも適用可能である。本発明のディスクは古い50iのテレビに対して完全に上位互換であり、24p互換のテレビに対して将来への互換性もある。古いテレビからHDTVテレビへの変化は著しく単純化される。24p互換のHDTVテレビを所有する、50i(または60i)の国の消費者は、元の再生スピードで映画を見ることができる。
C)いくつかの既知のビデオ・コーデックについての特別な制約
上述したように、ビデオ・フィールドおよびビデオ/オーディオ・フレームが必要に応じて反復または脱落させられるよう、既知のデコーダ外のコントローラが再生を制御することができる。すなわち、デコーダがスレーブ・モードで作動するのである。そのような装置の、特に50iでの再生のための呈示プロセスが図13および図17によって示されている。図19は50i、60iおよび24pについての適切なビデオ呈示プロセスを示している。
図17は、24pのAVストリームの50iでの呈示、特にフレームまたはフィールドのデコードに続くストリーム・データの制御のための流れ図を示している。これは、ビデオ・デコーダのビデオ出力を操作することによる50iでのビデオ出力についての一例である。この解決策は、図13のビデオ部分に示されている処理に対応する。この解決策の欠点は、ビデオ・デコーダが出力のために追加的な制御を必要とすることである。しかし、有利なことに、そのような追加的な制御は、トリックプレイのために必要なため、現在利用可能なMPEG-2ビデオ・デコーダの大半(または全部)で実施可能である。
図19は、24pビデオ・ストリームの24p、50iおよび60iでのビデオ呈示を表す流れ図である。これは図13のビデオ部分に関係しており、50iとの関係では図17に対応する。ストリームは3:2プルダウンのフラグを含んでいる。ネイティブまたはオリジナルの24p呈示のためには、3:2プルダウンのフラグは無視される。60iでの出力のためには3:2プルダウンのフラグは、ビデオ・ストリーム中にコードされているとおりに使用される。50iでの出力のためには、3:2プルダウンのフラグは無視され、代わりにそのビデオ・ストリーム片(たとえばVOBU)のフィールドについての追加的な情報項目(たとえばNV_PCK内の)が使用される。この情報項目は特別なビデオ・フィールド/フレームおよびそれらのフィールドについての反復数を指示する。追加的に、50iでの出力のためのオーディオおよびビデオのデコード・ストリーム間の初期オフセットが得られる。オーディオ・デコードそのものはこの図の一部ではない。
あるいはまた、意図された出力50i、60iまたは24pに従った再生の間、ストリームが操作されうる。そのようなビデオ呈示プロセスは上記の図14との関連で図18に示されている。
24pのAVストリームの50iでの呈示において、図18はストリーム・データの、実際のビデオ・デコーダにデコードのために送られる前の制御を示している。すなわち、24pのビデオ・ストリームはデコードされる前に操作される。この解決策は、図14のビデオ部分に示された発想に対応する。本図ではオーディオ・デコードも24pおよび60i出力も示されていない。この解決策の一つの欠点は、操作されたビデオ・ストリームでさえ、単一のビデオ・フィールドまたはビデオ・フレームを数回繰り返すために使われることはできないということである。その機能は、MPEGでもVC-1でもサポートされていない。したがって、ビデオ・でコード・プロセスに対する追加的な制御が必要とされることができる。
以下、三つのサブセクションで、このリアルタイムの操作を実行するためのビデオ・ストリームについての追加的な要件/制約について述べる。この種のストリームを60iとしてのほか50iとしても再生する機能を提供するために、実際のビデオ・ストリーム・データと組み合わされた(すなわち、まだAVストリーム内)追加的な情報項目が必要である。その目的のために、デコーダに、該デコーダ自身の型に依存した特別な制約が必要になる。MPEG-2、MPEG-4 AVCおよびSMPTE VC-1コーデックについての本質的な制約を記載する。追加的情報項目は、DVDビデオ・ストリーム(VOBファイル)におけるナビゲーション・パックのような特別な情報ブロックに配置されうる。
C.1)MPEG-2
有利には、24p、50iおよび60iのストリームは同じビット構造を有する。すなわち、これら3つの異なる呈示モードをコーディングするために必要とされるビットの量は、VC-1では異なるが、異なる必要がない。しかしながら、いくつかのフラグが異なる呈示モードについて異なる値を必要とする。これらの要請のため、以下の属性が24pの内容をもつすべてのMPEG-2ビデオ・ストリームについて要求される:
・sequence_extension()のフラグprogressive_sequenceは、現行のDVDビデオについてすでに規定されているように「0」にセットされる。
・picture_coding_extension()のprogressive_frameは24pコンテンツについては「1」にセットされる。progressive_frameが「0」にセットされるのは、真にインターレースされたソース素材についてのみである。
・picture_structureはフレーム映像を示すため「11」(二進形式)にセットされる。picture_structureが「10」または「01」にそれぞれセットされるのは、真にインターレースされたソース素材についてのみである。
・picture_coding_extension()iのrepeat_first_fieldが「0」にセットされる。24pコンテンツはプルダウンを必要としないからである。
・同じビデオ・ストリーム中のすべてのpicture_coding_extension()ブロックのすべてのtop_field_firstの値は同一、すなわち「0」または「1」である。
・デコードの間に、意図された再生、たとえば3:2プルダウンまたはv-rフラグによる可変プルダウンを強制するためにdemuxがストリーム中の適切なフラグを置換する。もう一つの代替は、適切な追加的レジスタによって制御される、すなわちレジスタを介してtop_field_firstおよびrepeat_first_fieldの設定を許容するより柔軟なデコーダである。
さらに、異なる再生スピード24p、50iおよび60iのため、タイムスタンプが適切に扱われなければならない。記録されているタイムスタンプが適切なのは、再生スピードの一つについてのみである。ストリーム中のすべてのタイムスタンプの再設定は膨大な作業であるため、よりよい解決策は、ビデオ・デコーダ・クロックを変更することである。最も適切な処理は、選択されたハードウェアに依存する。
パラメータframe_rateも変更することが有用でありうる。
これらのストリーム・データがビデオ・デコーダに送られる前、24p、50iまたは60iでの呈示のためのデコードの間に、top_field_firstおよびrepeat_first_fieldについての適切な再設定が実行される:
・50iでの呈示のためには、v-rフラグが対応するtop_field_firstおよびrepeat_first_field設定に翻訳される;
・60iでの呈示のためには、適切な3:2プルダウンが対応するtop_field_firstおよびrepeat_first_field設定に翻訳される;
・24pでの再生のためには、ビデオ・ストリームはその元々のフォーマットでデコーダに送られる(たとえば、常にrepeat_first_field=0)。
図15は、フラグ設定と結果として得られるビデオ出力のいくつかの組合せを示している。結果として得られる出力とは、すなわちフィールド(TまたはB)またはフレーム(Fr)が何回繰り返されるか、および上フィールド(T)および下フィールド(B)の出力順である。「T」は上(top)フィールドの呈示を、「B」は下(bottom)フィールドの呈示を、「Fr」はフレーム全体の呈示を示す。「T-B」は上フィールド‐下フィールドの呈示の順を示す。すなわち、「T-B」については上フィールドが先である。この表の一つのセル内で「T」「B」または「Fr」が二回以上現れたら、それはそれぞれ同一のフィールドまたはフレームの繰り返しを意味する。MPEG-2ビデオは、ビデオ・ストリーム中に特別なフラグを設定することによって3:2プルダウンを適用する。ビデオ・ソースがフレームに基づいていれば(24pの映画についてそうであるように)、設定5ないし8が適切に使用される。網掛けまたは灰色の背景の行を参照されたい。これらの設定は、v-rフラグについても使用されることができる。残念ながら、これらのフラグを、60i出力(3:2プルダウンによる)についてと同様50i出力についても同じビデオ・ストリーム中で提供することはできない。よって、これらのフラグを使用しうるのは、3:2プルダウンについて、v-rフラグについて、両者の混合について、あるいは全くなしすなわち何のフラグもなしである。
progressive_frameフラグがインターレースのソース、たとえばテレビ録画を示す場合、そのようなビデオ・ストリームは、本発明に従って種々のスピードで呈示されることはできない。そのようなコンテンツは、各呈示フォーマットについて別個にエンコードされる必要がある。それは、(インターレースされた)テレビ・コンテンツは通常、非常に限られた地域のみのために、すなわちたいていの場合、単一の国のために、放送または配信されるのに対し、販売されているビデオ・ディスクの主たる内容は世界のあらゆる部分で頒布されている24pソースの映画なので、受け容れられる。
C.2)MPEG-4 AVC
有利には、24p、50iおよび60iのストリームは同じビット構造を有する。すなわち、これら3つの異なる呈示モードをコーディングするために必要とされるビットの量は、VC-1では異なるが、異なる必要がない。残念ながら、各MPEGスライスはエンコードされる方法が異なりうる。したがって、各スライスについてのビットストリーム変化は必要とされうる。24pの内容についてのすべてのMPEG-4 AVCビデオ・ストリームについて、以下の属性が要求される:
・seq_parameter_set_rbsp()内のフラグvui_parameters_present_flagは「1」に設定される;
・VUI_parameters()内のフラグpic_struct_present_flagは「1」にセットされる;
・slice_header()内のフラグfield_pic_flagは「0」にセットされる;
・デコードの間に、意図された再生、たとえば3:2プルダウンまたはv-rフラグによる可変プルダウンを強制するためにdemuxがストリーム中の適切なフラグ(pic_timing(payloadSize)内のpic_struct)を置換する。もう一つの代替は、適切な追加的レジスタによって制御される、すなわちレジスタを介してtop_field_firstおよびrepeat_first_fieldの設定を許容するより柔軟なデコーダである。
さらに、異なる再生スピード24p、50iおよび60iのため、タイムスタンプが適切に扱われなければならない。記録されているタイムスタンプが適切なのは、再生スピードの一つについてのみである。ストリーム中のすべてのタイムスタンプの再設定は膨大な作業であるため、よりよい解決策は、ビデオ・デコーダ・クロックを変更することである。最も適切な処理は、選択されたハードウェアに依存する。
これらのストリーム・データがビデオ・デコーダに送られる前、24p、50iまたは60iでの呈示のためのデコードの間に、pic_structについての適切な再設定が実行される:
・50iでの呈示のためには、v-rフラグが対応するpic_struct設定に翻訳される;
・60iでの呈示のためには、適切な3:2プルダウンが対応するpic_struct設定に翻訳される;
・24pでの再生のためには、ビデオ・ストリームはその元々のフォーマットでデコーダに送られる。
ここでもまた、図15が、フラグ設定と結果として得られるビデオ出力のいくつかの組合せを示す。結果として得られる出力とは、すなわちフィールド(TまたはB)またはフレーム(Fr)が何回繰り返されるか、および上フィールド(T)および下フィールド(B)の出力順である。
progressive_frameフラグがインターレースのソース(たとえばテレビ記録)を示す場合、そのようなビデオ・ストリームは、本発明によって種々のスピードで呈示されることはできない。すなわち、そのようなコンテンツは、50i、60iまたは24pでの呈示についてさえコードされる必要がある。
C.3)SMPTE VC-1
ストリーム内のいくつかのフラグの値に依存して、他のいくつかの(次の)フラグが現れたり現れなかったりする。たとえば、FCMフラグは、INTERLACEが「1」にセットされている場合にのみ現れる。すべての再生態様について完全な制御を得るためには、ストリームは、できる限り、関係するフラグが記録されたストリームに現れるようにコードされる。これらの要請のため、次の属性がすべてのVC-1ストリームについて定義される:
Advanced Profileのみが使用されねばならない。
・24pビデオ・ストリームはAdvanced ProfileについてはSequence層ビットストリームを含む;
・PULLDOWNフラグは「1」にセットされる。これはフラグTFFおよびRFFの出現を強制するために必要である。
・INTERLACEフラグは「1」にセットされねばならない。これは、フラグFCM、TFFおよびRFFの出現を強制するために必要である。
・デコーダは、FCMのような追加的フラグを無視することによってビデオ・ストリームをINTERLACE=0として扱うように制御できる必要がある。これが必要なのは、通常、デコーダはFCMフラグを期待しないからである。したがって、そのような特殊モードなしでは、デコーダは混乱してしまう。それにもかかわらず、ストリームは常にINTERLACE=1を示す。これは、適切なデコーダ・レジスタ設定によって実現できる。
・デコードの間に、意図された再生、たとえば3:2プルダウンまたはv-rフラグによる可変プルダウンを強制するためにdemuxがストリーム中の適切なフラグを置換する。もう一つの代替は、適切な追加的レジスタによって制御できる、すなわちレジスタを介してTFF、RFF、RPTFRMの設定を許容するより柔軟なデコーダである。
さらに、異なる再生スピード24p、50iおよび60iのため、タイムスタンプが適切に扱われなければならない。記録されているタイムスタンプが適切なのは、再生スピードの一つについてのみである。ストリーム中のすべてのタイムスタンプの再設定は膨大な作業であるため、よりよい解決策は、ビデオ・デコーダ・クロックを変更することである。最も適切な処理は、選択されたハードウェアに依存する。
デコードの間:
24pの再生については、デコーダは「INTERLACE=0」モードにスイッチされる。すなわち、デコーダは、「INTERLACE=1」の場合にのみ現れることが意図されているフラグの出現を期待する。しかし、24p再生のために、デコーダはそのようなフラグ、たとえばピクチャー層におけるFCMフラグをスキップする。
図16は、フラグ設定と結果として得られるビデオ出力のいくつかの組合せを示している。結果として得られる出力とは、すなわちフィールド(TまたはB)またはフレーム(Fr)が何回繰り返されるか、および上フィールド(T)および下フィールド(B)の出力順である。「T」は上(top)フィールドの呈示を、「B」は下(bottom)フィールドの呈示を、「Fr」はフレーム全体の呈示を示す。「T-B」は上フィールド‐下フィールドの呈示の順を示す。すなわち、「T-B」については上フィールドが先である。この表の一つのセル内で「T」「B」または「Fr」が二回以上現れたら、それはそれぞれ同一のフィールドまたはフレームの繰り返しを意味する。
SMPTE VC-1ビデオは、ビデオ・ストリーム中に特別なフラグを設定することによって3:2プルダウンを適用する。ビデオ・ソースがフレームに基づいていれば(24pの映画についてそうであるように)、設定8ないし11が適切に使用される。網掛けまたは灰色の背景の行を参照されたい。これらの設定は、v-rフラグについても使用されることができる。残念ながら、これらのフラグを、60i出力(3:2プルダウンによる)についてと同様50i出力についても同じビデオ・ストリーム中で提供することはできない。よって、これらのフラグを使用しうるのは、3:2プルダウンについて、v-rフラグについて、両者の混合について、あるいは全くなしすなわち何のフラグもなしである。
図20は、デマルチプレクサDEMUXを含むディスク・プレーヤーまたは再生エンジンを示している。デマルチプレクサDEMUXは、AVデータストリームAVSTRを受信し、フレームまたはフィールドをデコードするためのビデオ・デコーダVDECにビデオ・ストリームVSTRを提供し、デコードされたオーディオ出力信号(decoded audio output signal or signals)DAOSを提供するオーディオ・デコーダADECにオーディオ・フレーム・コントロールAFCTRLを介してオーディオ・ストリームASTRを提供する。オーディオ・フレーム・コントロールAFCTRLは、外部のオーディオ・デコーダのためにデジタル・オーディオ出力AOを提供できる。ビデオ・デコーダVDECの出力信号はフィールドまたはフレーム・バッファFIFRBUFを通過して、デコードされたビデオ出力信号DVOSを提供する呈示コントロールPRESCTRLに行く。FIFRBUFはVDEC内に含められることもできる。サブピクチャー・デコーダは示していない(簡単のため)。このディスク・プレーヤーの動作は、図19の流れ図の動作に従うことができる。再生コントロールPBCTRLは、ユーザーから、図示していないユーザーインターフェースを介して、必要なユーザー・アクセス情報UAIを取得して、ディスクについての一般的な情報項目GENDI(一般的な内容情報、たとえばDVDビデオのディスクのVIDEO_TS.IFO)およびナビゲーション情報項目NAVI(たとえばDVDビデオのディスクのNV_PCK)を、AVストリーム自身から、デマルチプレクサDEMUXを介して受け取る。プレーヤーへのディスプレイの属性についての情報源は示していない。必要とされるディスプレイ情報項目は、ユーザーによってUAIを介して、あるいは自動ディスプレイ認識を介してPBCTRLに入力されることができる。セットされたデコーダ・クロック信号SDCLKによって、再生コントロールPBCTRLは24p、50iまたは60iでの出力のためにデコーダ・クロックDCLKのクロックを制御する。これにより、ビデオ・ストリーム内のタイムスタンプは呈示コントロールPRESCTRL内で適切に扱われる。
再生コントロールPBCTRLはまた、50i呈示のために強制ビデオ反復コマンドVFREPによって呈示コントロールPRESCTRLにおけるフレームまたはフィールド反復を制御し、強制オーディオ・フレーム脱落コマンドAFREPによってオーディオ・フレーム・コントロールAFCTRLにおけるフレーム脱落を制御し、60i呈示のために3:2プルダウン・フラグ処理(pull-down flag handling)コマンドPDFHによってビデオ・デコーダVDECにおける3:2プルダウン処理を制御しもする。
種々のフォーマットのテレビでの既知の50iディスクのコンテンツの呈示を示す図である。 種々のフォーマットのテレビでの既知の60iディスクのコンテンツの呈示を示す図である。 種々のフォーマットのテレビでの既知の24pおよび3:2プルダウン・フラグのディスクのコンテンツの呈示を示す図である。 種々のフォーマットのテレビでの3:2プルダウン・フラグのない既知の24pおよびディスクのコンテンツの呈示を示す図である。 本発明の、3:2プルダウン・フラグ、A脱落フラグおよびV反復フラグを使った24pディスクのコンテンツの、種々のフォーマットのテレビでの呈示を示す図である。 既知の24p/50iフォーマットの呈示を示す図である。 呈示映画時間tmovieと実時間trealの関係を示す図である。 元来のスピードと比べた、映画の呈示スピードの距離を示す図である。 適切なa-dフラグおよびv-rフラグを生成するために評価されることのできる、ビデオおよびオーディオ信号特性をもつ24pのAV記録部分の例示的なオーサリングを示す図である。 そのビデオ・シーケンスおよび関係したオーディオ信号に沿ってのa-dフラグおよびv-rフラグの例示的な分布を示す図である。 ストリームの記録順と再生順の違いを示す図である。 24pのAVストリームを50iのAVストリームとして再生するときのより詳細な時間的関係を示す図である。 DVDビデオのVOB構造と同様な構造を有するAVストリームにおけるa-dフラグおよびv-rフラグの配置を示す図である。 図13とは異なる実装を示す図である。 MPEG-2およびMPEG-4 AVCについて、フラグ設定の組み合わせと結果的なビデオ出力、すなわちフィールドまたはフレームが何回反復されるかを示す図である。 VC-1について、フラグ設定の組み合わせと結果的なビデオ出力、すなわちフィールドまたはフレームが何回反復されるかを示す図である。 24pのAVストリームの50iの呈示のための流れ図である。 24pのAVストリームの50iの呈示のための流れ図であって、実際のビデオ・デコーダに送られる前のストリーム・データの制御を示す図である。 24pのビデオ・ストリームの24p、50iおよび60iでのビデオ呈示を表す流れ図である。 本発明のビデオ・ストリーム・プレーヤーを示す図である。 ビデオおよびオーディオの呈示を、ディスクのデコードされたデータと比較して示す図である。 非常にきわどいシーンについて、24p/60i固有または50i固有のプログラム・チェーンの再生を示す図である。

Claims (24)

  1. ビデオ信号についての24Hzビデオ・フレーム周波数および該24Hzフレーム周波数に対応するオーディオ信号スピードに基づくオーディオおよびビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を一緒に再生するための方法であって:
    ・前記ビデオ信号が前記24Hzフレーム周波数に対応して呈示されるべきであれば、前記ビデオおよびオーディオ・データを共通の呈示のために前記24Hzフレーム周波数に対応して処理する段階と;
    ・前記ビデオ信号が60Hzまたはほぼ60Hzのフィールド周波数に対応して呈示されるべきであれば、前記オーディオ・データを共通の呈示のために24Hzまたはほぼ24Hzのフレーム周波数に対応するスピードで処理し、前記ビデオ・データを共通の呈示のために3:2プルダウンを使って60Hzまたはほぼ60Hzのフィールド周波数に対応して処理する段階と;
    ・前記ビデオ信号が50Hzまたはほぼ50Hzのフィールド周波数に対応して呈示されるべきであれば、前記オーディオ・データおよび前記ビデオ・データを呈示のために処理するときに、オーディオ信号フレームを適応的に脱落させまたはビデオ・フィールドまたはフレームを適応的に反復させる段階であって、該脱落または反復が前記ビデオおよびオーディオ信号の現在のコンテンツに依存し、これら両信号種別のうち、脱落または反復がそれぞれ他方の信号種別についてよりも顕著になる信号種別が、前記ビデオおよびオーディオ信号の間の同期を共通の呈示のために制御するために使用されない、段階とを含み
    特定のシーン部分について、前記24Hzのフレーム周波数または前記60Hzもしくはほぼ60Hzのフィールド周波数での呈示のために使われるべき対応する映像シーケンスの代わりに、前記オーディオおよびビデオ・データの前記50Hzもしくはほぼ50Hzのフィールド周波数での呈示のために特に利用可能な対応する追加的な映像シーケンスが該呈示のために使われるが、前記24Hzのフレーム周波数または前記60Hzもしくはほぼ60Hzのフィールド周波数での呈示のための前記対応する映像シーケンスは使われず、
    特定のオーディオ・フレームについて、前記24Hzのフレーム周波数または前記60Hzもしくはほぼ60Hzのフィールド周波数での呈示のために使われるべき対応するオーディオ・フレームの代わりに、前記オーディオおよびビデオ・データの前記50Hzもしくはほぼ50Hzのフィールド周波数での呈示のための対応する特定のオーディオ・フレームが該呈示のために使われる、
    ことを特徴とする方法。
  2. 前記50Hzまたはほぼ50Hzのフィールド周波数に対応した呈示の場合、現在フィールド周波数が可変であり、平均フィールド周波数が48Hzないし50Hzの範囲にある、請求項1記載の方法。
  3. 前記のビデオ・フィールドまたはフレームの反復が、映像内容に小さな動きスピードのみを含むフィールドもしくはフレームについて、あるいはシーンの終わりもしくは新しいシーンの始めもしくは暗いシーンの途中に位置するフィールドもしくはフレームについて実行され、
    前記のオーディオ・フレームの脱落が、平均より少ない倍音のオーディオを含むフレーム、平均より低い音量を含むフレーム、唇同期部分を含まないフレームまたはノイズ様のオーディオ期間を含むフレームについて実行される、
    請求項1または2記載の方法。
  4. シーンの切れ目において、前記のビデオ・フィールドまたはフレームの反復の代わりに、一つまたは複数の黒または灰色のフィールドまたはフレームの挿入が実行される、請求項1ないし3のうちいずれか一項記載の方法。
  5. 前記のビデオ・フィールドまたはフレームの反復が、前記オーディオおよびビデオ・データに含まれるビデオ反復フラグを評価することによって制御され
    たは前記のオーディオ・フレームの脱落が、前記オーディオおよびビデオ・データに含まれるオーディオ脱落フラグを評価することによって制御される、
    請求項1記載の方法。
  6. 前記オーディオ信号のうち異なるオーディオ信号においては前記オーディオ・フレームのうち異なるオーディオ・フレームが脱落させられる、請求項1ないし5のうちいずれか一項記載の方法。
  7. 前記50Hzもしくはほぼ50Hzのフィールド周波数での呈示のために特に利用可能な前記映像シーケンスまたは前記特定のオーディオ・フレームが、対応するプロバイダーからインターネットを介してロードされる、請求項記載の方法。
  8. 前記オーディオおよびビデオ・データが記憶媒体上に記憶されており、前記ビデオ反復フラグが前記記憶媒体のセクタ番号または相対セクタ番号、バイト・アドレスおよびバイト値の表をなし、そのような3つの値の各組が一つのビデオ反復フラグを表現し、前記バイト・アドレスはセクタ内での正確なバイトを指示し、前記50Hzもしくはほぼ50Hzのフィールド周波数での呈示について、このバイトが対応するビデオ反復フラグのバイト値によって置き換えられる、請求項記載の方法。
  9. 高速のビデオ/オーディオ同期のために必要であれば、オーディオおよびビデオ呈示の間の開始オフセットが、呈示の始めに適用される、請求項1ないし8のうちいずれか一項記載の方法。
  10. オーディオおよびビデオ呈示の間の前記開始オフセットが、呈示の始めに、再生開始に際して特定のシーンへの直接ジャンプ後に、適用される、請求項9記載の方法。
  11. 前記オーディオおよびビデオ・データが前記開始オフセットとして適用されるべき追加的な同期情報を含んでいる、請求項9または10記載の方法。
  12. 前記オーディオおよびビデオ・データ・ストリーム全体の50Hzまたはほぼ50Hzでの呈示の始めに、オーディオとビデオの間に基本的な開始オフセットが適用される、請求項1ないし11のうちいずれか一項記載の方法。
  13. ビデオ信号についての24Hzビデオ・フレーム周波数および該24Hzフレーム周波数に対応するオーディオ信号スピードに基づくオーディオおよびビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を一緒に再生するための装置であって、当該装置はコントローラを含んでおり、該コントローラは、前記オーディオおよびビデオ・データのための処理手段の制御を:
    ・前記ビデオ信号が前記24Hzフレーム周波数に対応して呈示されるべきであれば、前記処理手段は、前記ビデオおよびオーディオ・データを共通の呈示のために前記24Hzフレーム周波数に対応して処理し;
    ・前記ビデオ信号が60Hzまたはほぼ60Hzのフィールド周波数に対応して呈示されるべきであれば、前記処理手段は、前記オーディオ・データを共通の呈示のために24Hzまたはほぼ24Hzのフレーム周波数に対応するスピードで処理し、前記処理手段は、前記ビデオ・データを共通の呈示のために3:2プルダウンを使って60Hzまたはほぼ60Hzのフィールド周波数に対応して処理し;
    ・前記ビデオ信号が50Hzまたはほぼ50Hzのフィールド周波数に対応して呈示されるべきであれば、前記処理手段が前記オーディオ・データおよび前記ビデオ・データを呈示のために処理するときに、前記処理手段は、オーディオ信号フレームを適応的に脱落させ、またはビデオ・フィールドまたはフレームを適応的に反復させ、該脱落または反復は前記ビデオおよびオーディオ信号の両信号種別のうち、脱落または反復がそれぞれ他方の信号種別についてよりも顕著になる信号種別が前記ビデオおよびオーディオ信号の間の同期を共通の呈示のために制御するために使用されない形で、前記ビデオおよびオーディオ信号の現在のコンテンツに依存する、
    ように行
    特定のシーン部分について、前記24Hzのフレーム周波数または前記60Hzもしくはほぼ60Hzのフィールド周波数での呈示のために使われるべき対応する映像シーケンスの代わりに、前記オーディオおよびビデオ・データの前記50Hzもしくはほぼ50Hzのフィールド周波数での呈示のために特に利用可能な対応する追加的な映像シーケンスが該呈示のために使われるが、前記24Hzのフレーム周波数または前記60Hzもしくはほぼ60Hzのフィールド周波数での呈示のための前記対応する映像シーケンスは使われず、
    特定のオーディオ・フレームについて、前記24Hzのフレーム周波数または前記60Hzもしくはほぼ60Hzのフィールド周波数での呈示のために使われるべき対応するオーディオ・フレームの代わりに、前記オーディオおよびビデオ・データの前記50Hzもしくはほぼ50Hzのフィールド周波数での呈示のための対応する特定のオーディオ・フレームが該呈示のために使われる、
    装置。
  14. 前記50Hzまたはほぼ50Hzのフィールド周波数に対応した呈示の場合、現在フィールド周波数が可変であり、平均フィールド周波数が48Hzないし50Hzの範囲にある、請求項13記載の装置。
  15. 前記のビデオ・フィールドまたはフレームの反復が、映像内容に小さな動きスピードのみを含むフィールドもしくはフレームについて、あるいはシーンの終わりもしくは新しいシーンの始めもしくは暗いシーンの途中に位置するフィールドもしくはフレームについて実行され、
    前記のオーディオ・フレームの脱落が、平均より少ない倍音のオーディオを含むフレーム、平均より低い音量を含むフレーム、唇同期部分を含まないフレームまたはノイズ様のオーディオ期間を含むフレームについて実行される、
    請求項13または14記載の装置。
  16. シーンの切れ目において、前記のビデオ・フィールドまたはフレームの反復の代わりに、一つまたは複数の黒または灰色のフィールドまたはフレームの挿入が実行される、請求項13ないし15のうちいずれか一項記載の装置。
  17. 前記のビデオ・フィールドまたはフレームの反復が、前記オーディオおよびビデオ・データに含まれるビデオ反復フラグを評価することによって制御され、
    または前記のオーディオ・フレームの脱落が、前記オーディオおよびビデオ・データに含まれるオーディオ脱落フラグを評価することによって制御される、
    請求項13記載の装置。
  18. 前記オーディオ信号のうち異なるオーディオ信号においては前記オーディオ・フレームのうち異なるオーディオ・フレームが脱落させられる、請求項13ないし17のうちいずれか一項記載の装置。
  19. 前記50Hzもしくはほぼ50Hzのフィールド周波数での呈示のために特に利用可能な前記映像シーケンスまたは前記特定のオーディオ・フレームが、対応するプロバイダーからインターネットを介してロードされる、請求項13記載の装置。
  20. 前記オーディオおよびビデオ・データが記憶媒体上に記憶されており、前記ビデオ反復フラグが前記記憶媒体のセクタ番号または相対セクタ番号、バイト・アドレスおよびバイト値の表をなし、そのような3つの値の各組が一つのビデオ反復フラグを表現し、前記バイト・アドレスはセクタ内での正確なバイトを指示し、前記50Hzもしくはほぼ50Hzのフィールド周波数での呈示について、このバイトが対応するビデオ反復フラグのバイト値によって置き換えられる、請求項17記載の装置。
  21. 高速のビデオ/オーディオ同期のために必要であれば、オーディオおよびビデオ呈示の間の開始オフセットが、呈示の始めに適用される、請求項13ないし20のうちいずれか一項記載の装置。
  22. オーディオおよびビデオ呈示の間の前記開始オフセットが、呈示の始めに、再生開始に際して特定のシーンへの直接ジャンプ後に、適用される、請求項21記載の装置。
  23. 前記オーディオおよびビデオ・データが前記開始オフセットとして適用されるべき追加的な同期情報を含んでいる、請求項21または22記載の装置。
  24. 前記オーディオおよびビデオ・データ・ストリーム全体の50Hzまたはほぼ50Hzでの呈示の始めに、オーディオとビデオの間に基本的な開始オフセットが適用される、請求項13ないし23のうちいずれか一項記載の装置。
JP2007553582A 2005-02-07 2006-01-24 24Hzフレーム周波数のビデオ信号に基づくオーディオ/ビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を再生するための方法および装置 Expired - Fee Related JP4954901B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP05090020A EP1689179A1 (en) 2005-02-07 2005-02-07 Method and apparatus for replaying a video signal and one or more audio signals related to audio/video data that are based on a 24Hz frame frequency video signal
EP05090020.8 2005-02-07
EP05090056.2 2005-03-04
EP05090056 2005-03-04
PCT/EP2006/050394 WO2006082150A2 (en) 2005-02-07 2006-01-24 METHOD AND APPARATUS FOR REPLAYING A VIDEO SIGNAL AND ONE OR MORE AUDIO SIGNALS RELATED TO AUDIO/VIDEO DATA THAT ARE BASED ON A 24Hz FRAME FREQUENCY VIDEO SIGNAL

Publications (2)

Publication Number Publication Date
JP2008530839A JP2008530839A (ja) 2008-08-07
JP4954901B2 true JP4954901B2 (ja) 2012-06-20

Family

ID=36777591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007553582A Expired - Fee Related JP4954901B2 (ja) 2005-02-07 2006-01-24 24Hzフレーム周波数のビデオ信号に基づくオーディオ/ビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を再生するための方法および装置

Country Status (6)

Country Link
US (1) US8244094B2 (ja)
EP (1) EP1854293A2 (ja)
JP (1) JP4954901B2 (ja)
CN (1) CN101116335B (ja)
BR (1) BRPI0607288A2 (ja)
WO (1) WO2006082150A2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010283605A (ja) * 2009-06-04 2010-12-16 Canon Inc 映像処理装置及び方法
JP2011259110A (ja) * 2010-06-07 2011-12-22 Panasonic Corp 動画再生方法および動画再生装置
KR20150037949A (ko) * 2012-08-01 2015-04-08 톰슨 라이센싱 화상 프레임 속도에 오디오 지연을 적응시키는 방법 및 장치
KR102051798B1 (ko) * 2013-07-30 2019-12-04 돌비 레버러토리즈 라이쎈싱 코오포레이션 장면 안정 메타데이터를 발생하기 위한 시스템 및 방법들
CN104038759B (zh) * 2014-06-09 2017-11-17 华为技术有限公司 视频编码方法和解码方法和相关装置
GB201516553D0 (en) 2015-09-18 2015-11-04 Microsoft Technology Licensing Llc Inertia audio scrolling
US9940968B2 (en) 2016-08-30 2018-04-10 The Nielsen Company (Us), Llc Methods and apparatus to perform speed-enhanced playback of recorded media
US10726851B2 (en) * 2017-08-31 2020-07-28 Sony Interactive Entertainment Inc. Low latency audio stream acceleration by selectively dropping and blending audio blocks

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4523227A (en) * 1980-10-28 1985-06-11 Rca Corporation System for synchronizing a video signal having a first frame rate to a second frame rate
MY115648A (en) * 1995-08-23 2003-08-30 Sony Corp Encoding/decoding fields of predetermined field polarity apparatus and method
JPH0965303A (ja) * 1995-08-28 1997-03-07 Canon Inc 映像音声同期方法及び装置
US6957350B1 (en) * 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US6209028B1 (en) * 1997-03-21 2001-03-27 Walker Digital, Llc System and method for supplying supplemental audio information for broadcast television programs
US20040071211A1 (en) * 1997-04-07 2004-04-15 Kinya Washino Video production system with mixed frame removal
JP3744118B2 (ja) * 1997-04-30 2006-02-08 ソニー株式会社 映像音声信号記録再生装置および方法
JP4008580B2 (ja) * 1998-06-25 2007-11-14 株式会社東芝 表示制御装置およびインターレースデータ表示制御方法
IL143467A (en) * 1998-12-02 2005-05-17 Newport Corp Specimen holding robotic arm and effector
AU2728400A (en) * 1999-03-30 2000-10-16 Sony Electronics Inc. Digital video decoding, buffering and frame-rate converting method and apparatus
US6810198B1 (en) * 1999-11-15 2004-10-26 Matsushita Electric Industrial Co., Ltd. Record and playback device
EP1279111A4 (en) 2000-04-07 2005-03-23 Dolby Lab Licensing Corp IMPROVED TIME AND RESOLUTION STRUCTURE FOR ADVANCED TELEVISION
US7023486B2 (en) * 2000-08-10 2006-04-04 Sony Corporation Video signal processing device and method
US6680774B1 (en) * 2001-10-09 2004-01-20 Ultratech Stepper, Inc. Method and apparatus for mechanically masking a workpiece
US6625387B1 (en) * 2002-03-01 2003-09-23 Thomson Licensing S.A. Gated silence removal during video trick modes
US20040247185A1 (en) 2002-06-27 2004-12-09 Yutaka Sato Image processing apparatus and image processing method
AU2003264457A1 (en) 2002-10-01 2004-04-23 Sony Corporation Information processing device and method, program, and recording medium
US20040150745A1 (en) * 2003-01-20 2004-08-05 Hideki Aiba Video data transmitting/receiving method
JP2004289484A (ja) * 2003-03-20 2004-10-14 Sanyo Electric Co Ltd 映像再生装置
EP1613075A4 (en) 2003-04-04 2011-12-21 Victor Company Of Japan AUDIO / VIDEO RECORDING APPARATUS, RECORDING METHOD, PLAYING APPARATUS, READING METHOD, READING PROGRAM, AND RECORDING PROGRAM
EP1558033A1 (en) * 2004-01-21 2005-07-27 Deutsche Thomson-Brandt Gmbh Method and apparatus for controlling the insertion of additional fields or frames into a picture sequence to change its format

Also Published As

Publication number Publication date
EP1854293A2 (en) 2007-11-14
JP2008530839A (ja) 2008-08-07
CN101116335B (zh) 2012-07-04
US20090122191A1 (en) 2009-05-14
US8244094B2 (en) 2012-08-14
CN101116335A (zh) 2008-01-30
WO2006082150A3 (en) 2007-07-26
BRPI0607288A2 (pt) 2009-08-25
WO2006082150A2 (en) 2006-08-10

Similar Documents

Publication Publication Date Title
JP4071812B2 (ja) 多重化装置および逆多重化装置
JP4954901B2 (ja) 24Hzフレーム周波数のビデオ信号に基づくオーディオ/ビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を再生するための方法および装置
JP5011278B2 (ja) 24pオーディオ/ビデオデータストリームを更なる50iフォーマットのデータアイテムで補充することで24pオーディオ/ビデオデータストリームをオーサリングする方法及び装置
GB2424160A (en) Digital information reproducing apparatus and method
JP4766567B2 (ja) 第1のフォーマットのピクチャ・シーケンスから第2のフォーマットのピクチャ・シーケンスを構築するための、第1のフォーマットのピクチャ・シーケンスへの追加フィールドまたは追加フレームの挿入を制御する方法および装置
JP2009507447A (ja) 異なる解像度におけるビデオ再生システム
EP1689179A1 (en) Method and apparatus for replaying a video signal and one or more audio signals related to audio/video data that are based on a 24Hz frame frequency video signal
JP2008508766A (ja) トリック再生中およびトリック再生後におけるグラフィックのアクセス性の改善
EP1549065A1 (en) Method and apparatus for selecting the replay mode for a picture sequence that is stored or recorded in a first format on a storage medium
KR100265238B1 (ko) 다중각도 영상동시 재생장치
EP1549066A2 (en) Method and apparatus for replay mode selection
JP2009232087A (ja) 映像情報再生装置及び方法、映像情報再生システム、映像情報再生システムの制御方法、並びにコンピュータプログラム
JP2008301275A (ja) 映像出力装置及び映像出力方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120228

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120314

R150 Certificate of patent or registration of utility model

Ref document number: 4954901

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371