JPH0730886A - 画像および音声信号処理方法とその装置 - Google Patents

画像および音声信号処理方法とその装置

Info

Publication number
JPH0730886A
JPH0730886A JP17052093A JP17052093A JPH0730886A JP H0730886 A JPH0730886 A JP H0730886A JP 17052093 A JP17052093 A JP 17052093A JP 17052093 A JP17052093 A JP 17052093A JP H0730886 A JPH0730886 A JP H0730886A
Authority
JP
Japan
Prior art keywords
audio signal
video signal
signal
data
time stamp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP17052093A
Other languages
English (en)
Other versions
JP3552249B2 (ja
Inventor
Fuerutoman Maaku
フェルトマン マーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP17052093A priority Critical patent/JP3552249B2/ja
Publication of JPH0730886A publication Critical patent/JPH0730886A/ja
Application granted granted Critical
Publication of JP3552249B2 publication Critical patent/JP3552249B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Television Signal Processing For Recording (AREA)
  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 既存のMPEGを改善し、種々の復号処理装
置が復号可能な方式を提供する。 【構成】 既存のMPEGに規定されているバッファリ
ング遅延時間、1秒の制限を排除し、入力されるビデオ
信号のビットストリームレートとバッファリング処理時
間とによって規定されるバッファリング遅延許容時間を
用いる。復号処理装置(デコーダ)60に入力されるビ
ットストリームは、圧縮されたビデオ信号およびオーデ
ィオ信号について、パケットごとにビデオ信号とオーデ
ィオ信号との同期をとるためのタイムスタンプが付加さ
れて連続して入力される。ビデオ信号用タイムスタンプ
バッファ72の容量として、ビデオ信号のビットストリ
ームレートと、バッファリング遅延許容時間に応じた容
量とする。このタイムスタンプの記録量は、ビデオ信号
の記録量より多いので、かりに長時間ビデオ信号の喪失
が生じても同期回復が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は画像および音声信号処理
方法とその装置に関する。本発明は特に、動画像信号と
この動画像信号に同期している音声信号とを圧縮・符号
化してデータ伝送系またはデータ蓄積系にビットストリ
ームとして提供し、さらにデータ伝送系またはデータ蓄
積系からこのビットストリームを入力して伸長・復号す
るオーディオ・ビデオ(AV)信号処理などの画像およ
び音声データを処理する方法と装置に関する。さらに本
発明は上記信号処理を行う際、遅延時間の制限を廃止
し、復号系において画像と音声データとの同期などに使
用するタイムスタンプを記録するタイムスタンプバッフ
ァの容量を大きくする方法とその装置に関する。
【0002】
【従来の技術】コンパクトディスク・リードオンリーメ
モリ(CD−ROM)、レーザディスク(LD)、ビデ
オテープ、磁気光学式記録媒体(MO)、DCCなどの
ディジタルデータ蓄積媒体に映像信号(ビデオ信号)お
よび音声信号(オーディオ信号)を圧縮し多重化(マル
チプレクシング)してビットストリームとして直接記録
し、再び、データ蓄積媒体から多重化されたビットスト
リームを読み出してデマルチプレクシングをして圧縮と
逆の伸長処理をし、圧縮処理前の元のビデオ信号(原ビ
デオ信号)および元のオーディオ信号を再生する(復号
する)ことが、ビデオテープ記録再生装置、マルチメデ
ィアシステム、その他の画像および音声データ処理装置
において行われている。またテレビジョン放送、衛星放
送、マルチメディアシステムなどにおいても、ビデオ信
号とオーディオ信号とを圧縮して符号化し、多重化した
ビットストリームとしてデータ伝送系またはデータ蓄積
系に出力し、その後、多重化されたビットストリームを
入力してデマルチプレクシングした後、圧縮の逆の伸長
処理をして元のビデオ信号とオーディオ信号とを復号す
ることが行われている。
【0003】CD−ROM、LD、ビデオテープなどの
データ蓄積媒体にビデオ信号およびオーディオ信号を圧
縮して符号化して記録し、データ蓄積媒体に記録された
符号化されたビデオ信号およびオーディオ信号を伸長し
て元のビデオ信号およびオーディオ信号に復号する蓄積
用動画符号化標準としての国際的な規格として、ISO
とJECのデータ処理分野における共通事項を取り扱う
JTCIの傘下にあるSC2の中のワーキンググループ
(WG)11において、MPEG(Motion Pictrure Im
age Coding Expert Group )が定めた規格MPEG1、
および、規格MPEG2が知られている。
【0004】MPEGは、広範囲な適用を前提とした標
準であり、位相同期(フェーズロック)をとる場合と位
相同期をとらない(アンロックする)場合とを予定して
いる。位相同期をとる場合は、ビデオ信号符号化クロッ
ク(つまり、フレームレート)とオーディオ信号符号化
クロック(つまり、オーディオ信号サンプリングレー
ト)とが共通のシステムクロック基準(System Clock R
eferense)SCRに位相同期される。MPEGはこの場
合、0.7秒の周期でタイムスタンプを多重化ビットス
トリームに付加することを要求している。位相同期をと
らない場合は、ビデオ信号とオーディオ信号とは独立に
処理され、これらは符号化の際付加されたそれぞれのタ
イムスタンプに基づいて復号される。またMPEGは、
システムターゲットデコーダのバッファリング遅延時間
として、1秒を規定している。さらにMPEGは、復号
の際、ビデオ信号およびオーディオ信号を検索するため
のディレクトリを設けること規定している。
【0005】図15はそのようなMPEG1またはMP
EG2をビデオ信号およびオーディオ信号処理装置に適
用した場合の構成例を示す図であり、いかにして符号処
理系100が非圧縮ビデオ信号S2および非圧縮オーデ
ィオ信号S3を入力して、いかにして拘束パラメータシ
ステムターゲットデコーダ400についてのある情報を
生成し、いかにして種々の復号処理系に適した拘束ビッ
トストリームを形成するかについて示している。このビ
デオ信号およびオーディオ信号処理装置は、圧縮処理前
の元のビデオ信号(原ビデオ信号)を提供する非圧縮ビ
デオ信号源2、圧縮処理前の原オーディオ信号を提供す
る非圧縮オーディオ信号源3、これら非圧縮ビデオ信号
S2および非圧縮オーディオ信号S3を入力し、所定の
圧縮処理をして符号化しさらに多重化処理(マルチプレ
クシング)してビットストリーム形態の圧縮符号化信号
S100を出力する符号処理系100、および、この符
号処理系100からのビットストリーム形態の圧縮符号
化信号S1を伝送または蓄積するデータ伝送系またはデ
ータ蓄積系5を有する。データ伝送系またはデータ蓄積
系5としては、データ蓄積を行う場合はたとえば、CD
−ROM、LD、ビデオテープなどであり、データ伝送
を行う場合はたとえば、テレビジョン放送通信系、通信
衛星系、データ通信系などである。ビデオ信号およびオ
ーディオ信号処理装置はまた、データ伝送系またはデー
タ蓄積系5から送出されるビットストリーム形態の圧縮
符号化信号S5を入力し、符号処理系100における多
重化処理(マルチプレクシング)と逆の分解処理(デマ
ルチプレクシング)し、符号処理系100における圧縮
と逆の伸長処理をして、符号処理系100に入力される
前の非圧縮ビデオ信号S2および非圧縮オーディオ信号
S3と同等の復号化非圧縮ビデオ信号S6Aおよび復号
化非圧縮オーディオ信号S6Bを復号する復号処理系6
00を有する。ビデオ信号およびオーディオ信号処理装
置はさらに、符号処理系100および復号処理系600
の処理を規定するため、それぞれ、符号処理系100へ
のガイドライン(基準信号)S4Aおよび復号処理系6
00へのガイドライン(基準信号)S4Bを送出する拘
束パラメータ(Constraint Parameter)・システムター
ゲットデコーダ(STD:System Target Decoder )4
00を有する。
【0006】拘束パラメータシステムターゲットデコー
ダ400は、仮想的な(Hypothical) システムターゲッ
トデコーダ、システム基準(Reference)デコーダ、ある
いは、基準復号処理系などとも呼ばれるが、ここでは、
以下、拘束パラメータシステムターゲットデコーダ、あ
るいは、簡単に、システムターゲットデコーダなどと呼
ぶ。拘束パラメータシステムターゲットデコーダ400
は、CCITT H.261およびMPEG1ビデオ標
準などの国際標準規格において使用されており、ビデオ
信号符号器およびビデオ信号復号器(デコーダ)の設計
者のための指針を与えている。MPEG1システム標準
において、システムターゲットデコーダ(STD)も基
準オーディオ信号デコーダを有している。これらの基準
モデルにおいて、各ビデオ信号およびオーディオ信号デ
コーダもまた推奨されているバッファの大きさを有する
バッファ、および、いかにしてビデオ信号およびオーデ
ィオ信号デコーダを動作させるかについて記述する標準
を有している。推奨されているバッファの大きさを有す
るモデルは「拘束パラメータ・システムターゲットデコ
ーダ(STD)」と呼ばれている。実用的には、拘束パ
ラメータ・システムターゲットデコーダ(STD)以上
の性能を持たない非常に多くの実際の復号システムが存
在しないことが期待されている。したがって、ビットス
トリームが形成されたとき、そして、多くの数の実際の
デコーダに到達することが必要なとき、符号化システム
が一般的に、拘束パラメータ・システムターゲットデコ
ーダに適したビットストリームを作成する。これらの多
重化ビットストリームは拘束システムパラメータ・スト
リーム:Constraint System Parameter Stream:CSP
S)と呼ばれている。
【0007】拘束パラメータシステムターゲットデコー
ダ400は、デマルチプレクシング部401、ビデオ信
号バッファ402、オーディオ信号バッファ403、ビ
デオ信号デコーダ404、および、オーディオ信号デコ
ーダ405を有する。この例においては、ビデオ信号バ
ッファ402は46Kバイトの記憶容量を有し、オーデ
ィオ信号バッファ403は4Kバイトの記憶容量を有す
る。デマルチプレクシング部401はスイッチング回路
を有し、ビデオ信号デコーダ404、および、オーディ
オ信号デコーダ405は高速演算処理に適した構成をと
る高速ディジタル信号処理装置(DSP)で一体構成さ
れることが、装置構成の面、フレキシブルの観点から望
ましい。DSPは信号処理を高速処理可能なように特別
な手法で回路構成されているが、その反面、大きな記憶
容量を有する記憶装置を設けるには適していない。した
がって、DSPに設けられるビデオ信号バッファ40
2、および、オーディオ信号バッファ403の記憶容量
はある程度制限される。しかしながら、ビデオ信号バッ
ファ402およびオーディオ信号バッファ403の記憶
容量は、MPEGの規定に従って上述した容量を持つ必
要がある。
【0008】図16(A)は拘束パラメータシステムタ
ーゲットデコーダ400に入力される拘束パラメータ
(マルチプレクシング)・システムビットストリームC
PSPのフォーマットを示す。このビットストリーム
は、時系列的に配置された複数のパック(PACK)で
構成され、それぞれのパックは、ヘッダ(HEADE
R)、ビデオ信号パッケット(PACKET)、およ
び、オーディオ信号パッケットを含んでいる。それぞれ
のビデオ信号パッケットは、ビデオ信号のフレームごと
のビデオ信号と、そのフレームの時刻を示すタイムスタ
ンプ(TIME STAMP)を含むパッケットヘッダ
(PACKET HEADER)から構成されている。
それぞれのオーディオ信号パッケットは、所定の単位
(ユニット)ごとのオーディオ信号とそのユニットの時
刻を示すタイムスタンプを含むパッケットヘッダとで構
成されている。ビデオ信号についてのフレームn+1の
タイムスタンプをビデオタイムスタンプvtsと呼び、
オーディオ信号についてユニットm+1のタイムスタン
プをオーディオタイムスタンプatsと呼ぶ。つまり、
符号処理系100は、非圧縮ビデオ信号S2および非圧
縮オーディオ信号S3を符号化して、図16(A)に示
したフォーマットのマルチプレクシング・ビットストリ
ームにしてデータ伝送系またはデータ蓄積系5に送出
し、拘束パラメータシステムターゲットデコーダ400
はこのビットストリームに基づく圧縮符号化信号を含む
多重化ビットストリームS5を入力して復号する。
【0009】符号処理系100に入力される非圧縮ビデ
オ信号S2と非圧縮オーディオ信号S3とは、データ
数、速度が異なる他、圧縮率も異なる。したがって、同
じ時刻に符号処理系100に入力されたビデオ信号とオ
ーディオ信号を圧縮処理しても同じ速度、同じ大きさの
符号化ビデオ信号と符号化オーディオ信号が提供される
訳ではない。また、たとえば、ビデオ信号についてみて
も、ビデオ信号の内容によって圧縮率は異なる。オーデ
ィオ信号についても同様である。したがって、符号処理
系100からは固定した状態(条件)の符号化ビデオ信
号および符号化オーディオ信号が出力される訳ではな
い。復号処理系600において、これら元のビデオ信号
およびオーディオ信号を復号化非圧縮ビデオ信号S6A
および復号化非圧縮オーディオ信号S6Bとして復号す
る際、タイミング的に同期をとる必要がある。そこで、
同期を実現するため、MPEGは上述したタイムスタン
プをビデオ信号とオーディオ信号のそれぞれにフレーム
ごとに付加することを規定している。つまり、ビデオ信
号タイムスタンプとオーディオ信号タイムスタンプとは
ビデオ信号とオーディオ信号との同期をとった復号を行
うためのクロックを規定する時刻を示しており、オーデ
ィオ信号タイムスタンプはオーディオ信号の復号を行う
ためのクロックを生成する時刻を示している。なお、タ
イムスタンプを使用する目的としては、上述した同期を
とるための他、バッファリングの問題を解消するため、
および、符号系におけるデータの複写のためである。
【0010】図17は復号処理系600の構成図であ
る。復号処理系600は、デマルチプレクシング部60
1、ビデオ信号ビットストリーム構成変換処理部60
2、ビデオ信号受信バッファ603、ビデオ信号復号器
(デコーダ)604、ピクチャーレート制御回路60
5、オーディオ信号ビットストリーム構成変換処理部6
06、オーディオ信号受信バッファ607、オーディオ
信号復号器(デコーダ)608、および、サンプリング
レート制御回路609を有する。デマルチプレクシング
部601は、上述したフォーマットの多重化ビットスト
リームS5を入力し、ビデオ信号、ビデオタイムスタン
プvts、オーディオ信号、オーディオタイムスタンプ
atsに分解(分離)する。ビデオ信号ビットストリー
ム構成変換処理部602は分離されたビデオ信号とビデ
オタイムスタンプvtsを入力し、図16(B)に示す
フォーマットに変換する。ビデオ信号受信バッファ60
3は変換されたビデオ信号を順次記憶し、記憶した順序
に従ってビデオ信号復号器604に出力する。同様に、
オーディオ信号ビットストリーム構成変換処理部606
は分解されたオーディオ信号とオーディオタイムスタン
プatsを入力して図16(B)に示すフォーマットに
変換する。オーディオ信号受信バッファ607は変換さ
れたオーディオ信号を順次記憶し、記憶した順序に従っ
てオーディオ信号復号器608に出力する。ビデオ信号
復号器604は、ピクチャーレート制御回路605から
出力されるタイミング信号に基づいてビデオ信号受信バ
ッファ603から出力されたビデオ信号を復号する。オ
ーディオ信号復号器608は、サンプリングレート制御
回路609から出力されるタイミング信号に基づいてオ
ーディオ信号受信バッファ607から出力されたオーデ
ィオ信号を復号する。
【0011】上述したビデオ信号受信バッファ603お
よびオーディオ信号受信バッファ607について述べ
る。復号に際して完全に一致したクロックを用いてビデ
オ信号とオーディオ信号とを復号することはできない。
第1の理由は、上述したように圧縮率が異なるからであ
る。第2の理由は、たとえば、オーディオ信号復号器6
08におけるオーディオ信号の復号について述べると、
固定のビデオレートで復号するオーディオ信号復号器6
08に入力されるオーディオ信号の入力データレート
と、データ伝送系またはデータ蓄積系5から出力された
オーディオ信号の転送ビデオレートとはサンプリングレ
ートクロックの誤差に依存して変化する。さらに、オー
ディオ信号復号器608には一般に、一度に1つのオー
ディオ信号、アクセスユニットが入力されるので、デー
タ伝送系またはデータ蓄積系5からの多重化ビットスト
リームS5の転送レートと、オーディオ信号復号器60
8に入力されるオーディオ信号とのデータレートとは一
致しないからである。そこで、オーディオ信号復号器6
08の前段にオーディオ信号受信バッファ607が設け
られ、上述したデータレートの不一致を調整するように
構成されている。図18に上述した関係を図解する。
【0012】図19に図解したように、ビデオ信号は符
号処理系100においてフレームごとに(あるいは、フ
ィールドごとに)圧縮され、可変長符号化処理されるた
めに、ビデオ信号復号器604に対する入力データレー
トは符号処理系100におけるビデオ信号の圧縮に依存
して大きく変化する。したがって、ビデオ信号受信バッ
ファ603の記憶容量はオーディオ信号受信バッファ6
07の記憶容量より大きくなる。たとえば、ビデオ信号
受信バッファ603の記憶容量は46Kバイトに対し
て、オーディオ信号受信バッファ607の記憶容量は4
Kバイトである。図20にビデオ信号受信バッファ60
3またはオーディオ信号受信バッファ607の受信バッ
ファとしては(以下、ビデオ信号受信バッファ603を
例示する)のバッファリングタイミングを示す。図20
(A)に示したように、このバッファリングとしては、
ビデオ信号受信バッファ603に入力されたデータの量
から、破線で示したビデオ信号受信バッファ603の記
憶容量を減じたデータ量がビデオ信号受信バッファ60
3から読み出されるデータの量を越えない状態、つま
り、アンダーフローを生じさせず、かつ、ビデオ信号受
信バッファ603から読み出されたデータの量がビデオ
信号受信バッファ603に入力されるデータの量を越え
ない状態、つまり、オーバーフローを生じさせない状態
が理想的である。しかしながら、図20(B)に図解し
たように、このバッファリングにはオーバーフローまた
はアンダーフローが生ずることがある。
【0013】このバッファリングにおけるオーバーフロ
ーまたはアンダーフローを防止する方法としては、図2
1(A)〜(C)に図解した方法が行われる。第1の方
法は、図21(A)に図解したように、「蓄積メディア
スレーブ方法」と呼ばれるものであり、ビデオ信号受信
バッファ603に入力されたデータ量L1からビデオ信
号受信バッファ603の記憶容量がビデオ信号受信バッ
ファ603から読み出されたデータの量L3を越えず、
かつ、ビデオ信号受信バッファ603から読み出された
データの量L3がビデオ信号受信バッファ603に入力
されたデータの量L1を越えないように曲線L1’で示
したようにビデオ信号受信バッファ603に入力される
データの量を制御する。曲線L2はビデオ信号受信バッ
ファ603に入力されたデータL1からビデオ信号受信
バッファ603の記憶容量を減じた量の変化を示し、曲
線L2’は制御された実際にビデオ信号受信バッファ6
03に入力されたデータの量の変化を示す。第2の方法
は、図21(B)に図解したように、「デコーダスレー
ブ方法」と呼ばれるものであり、ビデオ信号受信バッフ
ァ603に入力されたデータ量L1が、ビデオ信号受信
バッファ603の記憶容量を減じたデータ量L2が、ビ
デオ信号受信バッファ603から読み出されるデータの
量L3を越えず、かつ、ビデオ信号受信バッファ603
から読み出されたデータの量L3がビデオ信号受信バッ
ファ603に入力されるデータの量L1を越えないよう
にビデオ信号復号器604のフレームレートを変更して
ビデオ信号受信バッファ603からデータを読み出す。
実際にビデオ信号受信バッファ603から読み出された
データの量の変化を曲線L3’として示す。以上、ビデ
オ信号について述べたが、オーディオ信号の場合も、オ
ーディオ信号復号器608のサンプリングレートを変化
させてオーディオ信号受信バッファ607から読み出す
データの量を調整する。第3の方法は、図21(C)に
図解したように、ビデオ信号受信バッファ603から読
み出すデータの量を調整するものであり、たとえば、ア
クセスユニットをスキップしたり、再表示してビデオ信
号受信バッファ603から読み出されるデータの量を調
整する。曲線L3’が調整されてビデオ信号受信バッフ
ァ603から読み出されたデータの量の変化を示す。
【0014】しかしながら、上述したデコーダのフレー
ムレートまたはサンプリングレート、あるいは、データ
伝送系またはデータ蓄積系5からの転送レートを変更す
ることは、ビデオ信号およびオーディオ信号処理装置の
外部の関連する装置に影響を与えるから、自由には変更
することができず、ある範囲に制限される。その結果、
バッファリングにおいてオーバーフローまたはアンダー
フローが頻繁に発生するような場合には、それを完全に
防止することができない。バッファリングにおけるオー
バーフローまたはアンダーフローに起因する復号処理の
誤動作は、特に、復号開始時点に生ずる。よって、デコ
ーダにおいて、「スタートアップディレー」という、再
生初期時に復号処理を遅延する処理を行う。図22にス
タートアップディレーに基づくバッファリングの諸態様
を示す。図22(A)は、スタートアップディレーに無
関係に理想的にバッファリングが行われた場合、図22
(B)は、適切にスタートアップディレーが行われた場
合のバッファリング、図22(C)はスタートアップデ
ィレーが長くビデオ信号受信バッファ603がオーバー
フローする場合、図22(D)はスタートアップディレ
ーが短くアンダーフローが生じる場合を示す。
【0015】MPEGにおいては、上述したようにそれ
ぞれのパックのヘッダに位相同期をとるためのシステム
クロック基準SCRを記述することができ、システムク
ロック基準SCRは転送ビットレートを定義するために
使用できる。さらにMPEGにおいては、ビデオ信号パ
ッケットだはオーディオ信号パッケットのヘッダに記述
されるタイムスタンプは、フレームレートまたはサンプ
リングレートを制御するために使用できる。つまり図2
3に図解したように、システムクロック基準SCRはデ
ータ伝送系またはデータ蓄積系5から復号処理系600
に入力された多重化ビットストリームS5の時刻を示
し、ビデオ信号パッケットまたはオーディオ信号パッケ
ットのタイムスタンプはビデオ信号またはオーディオ信
号がビデオ信号受信バッファ603またはオーディオ信
号受信バッファ607から出力された時刻を示す。これ
らの時刻は、たとえば、水晶発振器を用いて90KHZ
の基準クロックを用いて絶対時刻で記録することができ
る。このように、システムクロック基準SCRとタイム
スタンプとの差をスタートアップディレーに使用でき
る。図23において、記号DTSは復号時刻を意味する
デコーダタイムスタンプを示し、記号PTSはビデオ信
号、つまり、ピクチャーの復号時刻を意味するピクチャ
ータイムスタンプを示し、記号Hはヘッダを示す。
【0016】上述したように、MPEGにおけるオーデ
ィオ信号の復号とビデオ信号の復号に際しては、これら
両者の復号結果を同期させる必要があり、この同期にタ
イムスタンプを用いる。ビデオ信号およびオーディオ信
号の復号処理時刻を0秒と仮定する。図24に示したよ
うに、IピクチャーおよびPピクチャーとしてのフレー
ム以外、つまり、Bピクチャーとしてのフレームにおい
ては、タイムスタンプによって示されるアクセスユニッ
トの復号時刻は、Bピクチャーが表示される表示時刻と
同じになる。つまり、デマルチプレクシング部601を
介してビデオ信号受信バッファ603に順次入力されて
いるビデオ信号のうち、第m番目のビデオ信号パッケッ
トの第i番目のフレームのIピクチャーのビデオ信号:
Frame i(I)が時刻DTSm にビデオ信号受信
バッファ603から読み出されて復号された後、ビデオ
信号復号器604の後段に設けられたIピクチャーおよ
びPピクチャーのビデオ信号(フレーム)を一時的に記
憶するI/Pバッファに記憶する。Iピクチャーのビデ
オ信号とPピクチャーのビデオ信号とでは復号時刻と表
示時刻とが異なる。そこで、そのビデオ信号に対応する
ビデオ信号パッケットのヘッダには、それぞれ復号時刻
および表示時刻を示すタイムスタンプとしてのDTSと
PTSとが記録されるが、IピクチャーとPピクチャー
のビデオ信号の表示時刻PTSとは次のIピクチャーと
PピクチャーのDTSとは同じであるから、表示時刻P
TSは省略できる。
【0017】しかしながら、上述したMPEGに基づく
ビデオ信号およびオーディオ信号処理装置においては、
ビデオ信号ビットストリーム構成変換処理部602およ
びオーディオ信号ビットストリーム構成変換処理部60
6の回路構成が複雑になるという問題に遭遇している。
さらに上述したビデオ信号およびオーディオ信号処理装
置は、復号処理系600に入力されるデータがマルチプ
レクシングされたビットストリームであることを前提と
しており、たとえば、ビデオ信号またはオーディオ信号
のいずれかがマルチプレクシングされずに入力された場
合には、復号することができず、復号処理系として種々
の復号処理を行うことを考慮すると、その汎用性に問題
があった。
【0018】そこで本願出願人は、上述した問題を解決
するビデオ信号およびオーディオ信号復号装置を提案し
た(たとえば、平成5年2月26日出願の特願平5−6
3293号、「データ復号化装置」を参照)。図25に
この復号装置の構成を示す。このときのビットストリー
ムを図16または図26に示す。図26に示したビット
ストリームは、複数のビデオ信号パッケットと、オーデ
ィオ信号パッケットとが連続し、それぞれの複数のビデ
オ信号パッケットは、第1のビデオ信号パッケットヘッ
ダ、第1のピクチャーグループGOP0〜第4のビデオ
信号パッケットヘッダ、第4のピクチャーグループGO
P3が配列されている。各々のビデオ信号パッケットヘ
ッダにはこのビデオ信号のタイムスタンプが格納されて
いる。それぞれのピクチャーグループには20個のフレ
ームのビデオ信号が格納されている。オーディオ信号パ
ッケットにはオーディオ信号タイムスタンプ、および、
オーディオ信号アクセスユニットAAUが格納されてい
る。
【0019】この復号装置は、デマルチプレクシング5
01、DSP502、90KHZ のクロックを発生する
クロック発生器503、全体時刻レジスタ504、ビデ
オ信号受信バッファ505a、オーディオ信号受信バッ
ファ505b、ビデオ信号復号器506a、オーディオ
信号復号器506b、ビデオ信号タイムスタンプバッフ
ァ507a、オーディオ信号タイムスタンプバッファ5
07b、ビデオ信号クロック用位相同期回路(PLL)
508a、オーディオ信号クロック用PLL508bを
有する。デマルチプレクシング501においてビットス
トリームから分解されたビデオ信号タイムスタンプがビ
デオ信号タイムスタンプバッファ507a、オーディオ
信号タイムスタンプがオーディオ信号タイムスタンプバ
ッファ507bに格納される。またビットストリームか
ら分解されたビデオ信号がビデオ信号受信バッファ50
5aに格納され、分解されたオーディオ信号がオーディ
オ信号受信バッファ505bに格納される。これらバッ
ファ505a、505bに格納されたデータがそれぞ
れ、PLL508a、508bからのクロックによって
復号器506a、506bにおいて同期状態で復号され
る。このように、簡単な回路構成にすることができる。
【0020】図27に多重化ビットストリームのフォー
マットとその処理を図解する。ただし、このビットスト
リームはビデオ信号についてのみ示し、オーディオ信号
については省略している。図28にこのビットストリー
ムに基づくMPEGによるビデオ信号およびオーディオ
信号処理装置の構成を示す。拘束パラメータシステムタ
ーゲットデコーダ410はデマルチプレクシング部41
1、ビデオ信号バッファ412、オーディオ信号バッフ
ァ413、ディレクトリデータバッファ414、ビデオ
信号デコーダ415、オーディオ信号デコーダ416、
ディレクトリデコーダ417を有する。復号処理系61
0は拘束パラメータシステムターゲットデコーダ410
と同様に構成されている。符号処理系110は、図27
(A)に図解したビットストリームを生成する。このビ
ットストリームは、第1のディレクトリパッケットとこ
のディレクトリパッケットに対応する第1のビデオ信号
パッケットとが一対になっている。ディレクトリパッケ
ット内は最初の位置にディレクトリパッケットヘッダ、
続いて、第1〜第20のポインタP0〜P19が格納さ
れている。ビデオ信号パッケットの最初の位置にビデオ
信号パッケットヘッダ、続けて第1〜第20のピクチャ
ーグループGOP0〜GOP19が格納されている。第
1のポインタP0が第1のピクチャーグループGOP0
の記録位置などを指定している。他のポインタも対応す
るピクチャーグループの位置を指定している。
【0021】具体例として、ビデオテープ記録再生装置
における再生動作を例示する。この場合、符号処理系1
10はビデオテープ記録再生装置の記録系であり、デー
タ伝送系またはデータ蓄積系5はビデオテープであり、
復号処理系610は再生系である。図27(B)に示す
ように、ユーザーがファーストフォワード(First Forw
ard :FF)動作またはファーストリバース(First Re
verse :FR))動作を要求する前は、復号処理系61
0はビデオテープ5から、順次、ディレクトリパッケッ
トヘッダの記録内容、ポインタの指定内容に基づいて、
ピクチャーグループが連続的に読みだし、ディレクトリ
バッファにポインタ、ビデオ信号バッファにビデオ信号
を格納し、ビデオ信号復号器においてビデオ信号を復号
する。図27(C)に示すように、ユーザーがファース
トフォワード動作を要求すると、ディレクトリバッファ
に格納されたディレクトリデータが空になるまでスキッ
プ動作が行われ、ピクチャーグループを飛ばしていく。
そして、図27(D)に示したように、ディレクトリバ
ッファに新たなディレクトリが格納された位置のポイン
タまで戻る。図27(E)に示したように、ファースト
フォワード動作においては上述した動作、つまり、フィ
ードバック動作が行われる。
【0022】また、MPEGにおいては、上述したよう
にバッファリングの遅延時間を規定しており、位相同期
をとらない場合のこのバッファリング遅延時間は1秒以
内と制限している。
【0023】
【発明が解決しようとする課題】しかしながら、図26
および図16を参照して述べたフレームごとにタイムス
タンプを用いる方法は、非常に多くのタイムスタンプを
用い、1秒程度遅延させるために、タイムスタンプを格
納するバッファがオーバーフローまたはアンダーフロー
するという問題がある。特に、DSPを用いた場合、搭
載されるメモリ容量が限定されるから、オーバーフロー
またはアンダーフローが発生する可能性が高い。図26
に示したビットストリームを用いる場合もタイムスタン
プが多く、同じ問題が発生する。また数多くのタイムス
タンプを格納するタイムスタンプバッファ507a、5
07bを設ける必要があるが、全ての復号装置において
は大きなメモリを設けることが困難である。特に、DS
Pを用いて復号装置を構成する場合はこの問題が顕著で
ある。さらに、多くのタイムスタンプを用いることはス
タートアップディレーを長くするという問題がある。し
たがって、できるだけ少ない数のタイムスタンプを用い
てビデオ信号とオーディオ信号との同期をとることが要
求されている。
【0024】上述したMPEGに基づく規定は広範囲の
適用が可能なように規定していることの裏返しとして、
非常に基準が甘過ぎる点がある。図28に示した符号処
理系110における多重化ビットストリームソース5へ
のビットストリームのフォーマット(多重化シンタック
ス)の容量などが明確に規定されていない。一方、多重
化ビットストリームソース5からビットストリームを入
力して復号する復号処理系610も種々のものがあり、
種々の形態で使用される。その結果として、多重化ビッ
トストリームソース5から出力されたビットストリーム
が適用できる復号処理系もあれば、そのビットストリー
ムでは実質的に復号が困難な復号処理系も存在する。
【0025】また、図27を参照して述べたように、フ
ァーストフォワード動作において、ディレクトリバッフ
ァが空になり、新たに格納されたポインタまでフィード
バックする場合には、ビデオテープを巻き戻すことにな
り、復号処理動作が非常に遅くなるという問題がある。
【0026】また上述したMPEGにおいては、バッフ
ァリング遅延時間を1秒として規定しているが、この固
定した1秒という遅延時間についても問題がある。たと
えば、非常に性能のよい復号を行う場合は1秒の遅延時
間では不十分であり、たとえば、0.2秒程度の迅速な
応答が必要な場合もある。その反面、高解像度の画像を
必要とする場合は応答性よりも解像度が重要であり、バ
ッファリング遅延時間を1秒以内でてければならないと
いう応答性を要求せず、たとえば、5秒程度の遅延時間
でよい場合がある。このような場合にバッファリング遅
延時間として全ての用途に対して固定の1秒という制限
を課すと、高解像度の画像処理にはMPEGを適用でき
ないという問題がある。
【0027】このようにMPEGの規格は種々の広範囲
な適用に適合させることを意図した規格である反面、実
際の適用においては、種々の観点から問題を含んでい
る。
【0028】上述したように、たとえば、非常に緩慢な
動画像を表示するような場合、あるいは、5秒間のスチ
ル画像を表示するようにな場合に、1秒以上の遅延時間
が好ましく、MPEGの規格で定めた1秒の遅延時間を
廃止することが望ましい。この1秒の遅延時間の制約を
設けない他の用途がある。たとえば、符号化系が1秒当
たり最大4.5メガビットのビットレートのデータ送信
またはディジタル記録媒体へのデータ伝送をサポートで
きる場合、画像の品質はスタートアップディレーおよび
圧縮レートよりも高くなり、復号系におけるバッファリ
ングを実現する装置の価格が高くなる。この場合、ビデ
オビットストリームは2部分になる。第1の部分は比較
的容易な圧縮を行う5秒のビデオシーケンスであり、第
2の部分は圧縮が難しい5秒のビデオシーケンスであ
る。この用途は可変ビットレートの用途ではあるが、符
号化系が10秒間について連続的に最大通信ビットレー
ト、すなわち、1秒当たり4.5メガビットを用いるこ
とを決定するから、これら2つのシーケンスについては
10秒x4.5メガビット/秒=45メガビット/秒が
可能である。符号化系は、第1部分シーケンスについて
150ピクチャーデータのために15メガビット、第2
部分シーケンスについて150ピクチャーデータのため
に30メガビットを許可することを決定する。したがっ
て、第1部分のシーケンスについてのビデオ・ビットレ
ートは15メガビット/5秒=3メガビット/秒であ
り、第2部分のシーケンスについてのビデオ・ビットレ
ートは、30メガビット/5秒=6メガビット/秒であ
る。
【0029】これらの値はISOの規定に基づく実際の
ビデオシーケンスに基づいている。第1部分は、バレー
ダンスのような動きの速い画像データを記録するビデ信
号オであり、第2の部分は人間が自転車に乗っているよ
うな比較的動きが遅い画像データ記録するビデオ信号で
ある。他のISO規格のビデオシーケンスもまた、数秒
の大きなビットレートビデオに続けて、数秒の低いビッ
トレートビデオを持っている。図29は、上記第1部分
を復号化する場合初期値が3メガビット/秒であり、第
2部分を復号化する場合初期値が6メガビット/秒であ
る、×印で示したビデオデコーダバッファ入力レート、
および、○で示したビデオデコーダバッファ出力レート
を図解するグラフである。時間t=0において、バッフ
ァへの入力データは4.5メガビット/秒であり、バッ
ファからの出力データは3メガビット/秒である。時間
t=3.33秒経過時点において、バッファへの入力デ
ータは3.33秒x4.5メガビット/秒=15メガビ
ット/秒であるから、第1部分の最後のバイトデータが
バッファに入り、第2部分のデータから4.5メガビッ
ト/秒でバッファに入る。時間t=5秒経過時点におい
て、バッファからの出力データは5秒x3メガビット/
秒=15メガビット/秒であるから、第1部分の最後の
バイトがバッファから出ていく。ビデオデコーダ(復号
系)が動作開始し、6メガビット/秒のデータレートで
第2部分の復号を行う。復号系への入力データレートが
4.5メガビット/秒のままであるから、ここから、
(6−4.5)=1.5メガビット/秒のレートでバッ
ファの満杯状態が少なくなっていく。この時点では、バ
ッファには第2部分のデータのみが入っていることに留
意されたい。これらのデータは時刻t=3.33秒経過
以来、4.5メガビット/秒のデータレートでバッファ
に記録されているから、バッファ内のビットの数は(5
−3.33)秒x4.5メガビット/秒=7.5メガビ
ットである。これら7.5メガビットのバッファに満杯
になっているデータは1.5メガビット/秒のレートで
減少していき、(7.5メガビット/1.5メガビット
/秒)=5秒で終わる。時間t=10秒が経過して時点
で、バッファが空になり、もし存在するなら後続するビ
デオが4.5メガビット/秒またはそれ以下で符号化さ
れる。この場合、第1部分の最後のビデオ信号のバイト
についての遅延、および、この最後のバイトに続く第2
の部分の最初のバイト遅延が約(5−3.33)秒=
1.67秒であり、MPEGの規定におけるバッファリ
ング遅延時間である1秒を越えているという問題に遭遇
する。
【0030】ビットストリーム受容性(compliance)を
形成するため、伝送レートは図30を参照して下記に述
べるように、低減すべきである。時間t=0において、
バッファへの入力データは3.75メガビット/秒であ
り、バッファからの出力データは3メガビット/秒であ
る。時間t=4秒経過時点において、バッファへの入力
データは4秒x3.75メガビット/秒=15メガビッ
ト/秒であるから、第1部分の最後のバイトがバッファ
に入り、次いで、第2部分のデータから4.5メガビッ
ト/秒でバッファに入る。時間t=5秒経過時点におい
て、バッファからの出力データは5秒x3メガビット/
秒=15メガビット/秒であるから、第1部分の最後の
バイトがバッファから出ていく。ビデオデコーダが動作
開始し6メガビット/秒のデータレートで第2部分の復
号を行う。入力データレートが4.5メガビット/秒で
あるから、ここから、(6−4.5)=1.5メガビッ
ト/秒のレートでバッファの満杯状態が少なくなってい
く。この時点では、バッファには第2部分のデータのみ
が入っていることに留意されたい。これらのデータは時
刻t=4秒経過以来4.5メガビット/秒のビットレー
トでバッファに記録されているから、バッファ内のビッ
トの数は4.5メガビットである。これら4.5メガビ
ットのバッファに満杯になっているデータは1.5メガ
ビット/秒のレートで減少していき、3秒で終わる。時
間t=8秒が経過した時点で、バッファが空になる。も
しビデオデコーダが6メガビット/秒でデータを読み続
けるならば、ここでアンダーフローが起こる。このアン
ダーフローを防止するため、ビデオデコータは第2部分
の残っている2秒分のデータについてビットレートを6
メガビット/秒から4.5メガビット/秒に低下させな
ければならない。
【0031】このビットストリームは、前に述べた30
メガビットではなく第2部分が6秒x4.5メガビット
/秒=27メガビットであるから、圧縮率が高く、スタ
ートアップディレーが短く、小さな容量のビデオデコー
ダバッファでプレーバックできるという利点を有するも
のの、1秒のバッファリング遅延により希望するビデオ
信号の表示品質を提供できないという問題に遭遇する。
したがって、この観点からも、通常のビデオ信号につい
て高い表示画像品質を実現するためには、MPEGで規
定する1秒のバッファリング遅延時間に限定することは
好ましくない。
【0032】たとえば、あるビデオバイトのバッファリ
ング遅延時間が1秒であり、レートが30HZ のビデオ
信号の場合1秒当たり30枚分のピクチャーを復号系内
のバッファから取り出すから、最悪の場合として30枚
分のピクチャーデータがバッファに存在する。かりにあ
るビデオ信号バイトのバッファリング遅延が上述したよ
うに最悪の場合として1.67秒であるなら、このバイ
トの前に、1.67秒x30=50枚分のピクチャーデ
ータがあることになる。
【0033】従来は30HZ のレートについては固定の
値としてピクチャーデータ30枚分のタイムスタンプを
記録するバッファ容量であったが、上述した例では、ビ
デオ信号のレートが30HZ の場合、たとえば、50分
のタイムスタンプをバッファに記録することが望まし
い。ただし、ピクチャーデータの圧縮率は可変であるか
ら、復号系に入力されるピクチャーデータとタイムスタ
ンプとは必ずしも一致しない。そこで、かりに1秒のバ
ッファリング遅延時間として30HZ の場合に通常、1
秒間に30枚分のピクチャーデータが復号系に到来する
として、30個分のタイムスタンプを記録するバッファ
の容量とすると、ピクチャーデータに対応できなくなる
場合がある。したがって、タイムスタンプを記録するバ
ッファの容量としては、ピクチャーデータの圧縮率をも
考慮することが望ましい。
【0034】ここで、さらに次の問題に遭遇する。符号
化系からデータ蓄積系またはデータ伝送系に送出するデ
ータ、またはデータ蓄積系またはデータ伝送系において
誤りが生ずる。非常に多くの誤りが生じた場合、全ての
ピクチャーデータについてタイムスタンプを持っている
ことが復号系において正確に復号する点で好ましい。し
かしながら、ビデオビットストリームの遅延が1.67
秒より長く、全てのピクチャーが1つのタイムスタンプ
を持っている場合、30分のタイムスタンプバッファは
オーバーフローしてしまう。
【0035】したがって、本発明はビデオ信号およびオ
ーディオ信号をビットストリームとしてデータ伝送系ま
たはデータ蓄積系に提供し、さらにビデオ信号とオーデ
ィオ信号を同期させつつ復号する観点において、上述し
て問題を解決して、一定の標準化を図りつつ、大規模な
回路構成にならず広範囲な適用を可能にする、画像およ
び音声信号処理方法とその装置を提供することを目的と
する。
【0036】
【課題を解決するための手段】いずれにしても、種々の
適用を考慮すると、タイムスタンプのバッファリング遅
延時間を1秒に固定して限定することは好ましくないか
ら、本発明においては、バッファリング遅延時間を1秒
に固定せず、その目的に沿った許容遅延時間とする。し
たがって、本発明においては、高品質の画像データはも
とより、通常のビデオ信号についても1秒の遅延時間を
排除する。
【0037】次いで、最後に述べた問題点について述べ
ると、たとえば、30HZ のビデオ信号の場合、システ
ムターゲットデコーダのタイムスタンプバッファの容量
を、できるだけ多く、少なくともピクチャーデータ50
枚分以上にすることが望ましい。25HZ のビデオ信号
の場合には、たとえば、少なくともピクチャーデータを
41枚分以上とする。つまり、このタイムスタンプバッ
ファの容量としては、少なくともビデオ信号のレート、
実質的な遅延時間に依存して決定することが望ましい。
好適には、さらに圧縮率をも考慮して充分余裕を持った
値とすることが望ましい。しかしながら、圧縮率はピク
チャーデータの内容によって異なるから事前に明確に規
定することができない。そのためには、標準的な圧縮率
を想定しておき、この標準的な圧縮率と、ビデオ信号の
伝送レートと、許容遅延時間とを考慮して、復号系にお
けるタイムスタンプを記録するバッファの最大容量を決
定する。
【0038】また本発明においては、ディレクトリの数
を少ない数に分割し、ファーストフォワード動作におけ
るフィードバックが生じても、またはファーストリバー
ス動作によって、最初の位置まで戻る必要がないように
する。さらに本発明においては、上述したタイムスタン
プのバッファリング数を増加させるという観点とは異な
る観点から、復号に使用するタイムスタンプの数を減少
させ、バッファの記憶容量を低減し、さらにオーバーフ
ローまたはアンダーフローを生じさせない。また本発明
においては、復号におけるバッファ処理の遅延時間に制
限をつけない一方で、性能のよい復号に適合するように
遅延時間を短縮する。また本発明は極力スタートアップ
ディレーを生じさせない。
【0039】したがって、本発明の第1の形態によれ
ば、画像信号および音声信号をそれぞれ同時的に圧縮処
理をし、これら圧縮された画像信号および音声信号にタ
イムスタンプを付加し、順次マルチプレクシングしたビ
ットストリームとして送出する符号処理系と、該符号処
理系から送出されたビットストリームを伝送または蓄積
するデータ伝送系またはデータ蓄積系と、該データ伝送
系またはデータ蓄積系からのビットストリームを入力
し、デマルチプレクシングして前記圧縮画像信号、前記
圧縮音声信号、前記タイムスタンプをバッファリング
し、該タイムスタンプを参照して前記圧縮画像信号およ
び前記圧縮音声信号を同期させて復号する復号処理系と
を有し、前記復号処理系における前記タイムスタンプを
バッファリングする遅延時間を少なくとも前記画像デー
タが正常にバッファリングされる遅延許容時間に設定
し、前記タイムスタンプを分離してバッファリングする
バッファメモリの容量を該遅延許容時間と少なくとも前
記画像データが入力されるビットストリームの速度で規
定される大きさ以上の容量とする画像および音声信号処
理装置が提供される。また本発明によれば、画像信号お
よび音声信号がそれぞれ同時的に圧縮処理され、これら
圧縮された画像信号および音声信号にタイムスタンプが
付加され、順次マルチプレクシングしたビットストリー
ムとして入力される信号を、デマルチプレクシングして
前記圧縮画像信号、前記圧縮音声信号、前記タイムスタ
ンプを分離してバッファリングし、該タイムスタンプを
参照して前記圧縮画像信号および前記圧縮音声信号を同
期させて復号する復号処理方法であって、前記タイムス
タンプをバッファリングする遅延時間を、少なくとも前
記画像データが正常にバッファリングされる遅延許容時
間に設定し、前記タイムスタンプをバッファリングする
バッファメモリの容量を該遅延許容時間と少なくとも前
記画像データが入力されるビットストリームの速度で規
定される大きさ以上の容量とする復号処理方法が提供さ
れる。
【0040】また本発明の第2の形態によれば、画像信
号および音声信号をそれぞれ同時的に圧縮処理をし、こ
れら圧縮された所定数の画像信号および所定数の音声信
号に、該画像信号および該音声信号の配置を示すポイン
タを含むディレクトリデータを付加して1組のパッケッ
トとして順次マルチプレクシングしたビットストリーム
として送出する符号処理系と、該符号処理系から送出さ
れたビットストリームを伝送または蓄積するデータ伝送
系またはデータ蓄積系と、該データ伝送系またはデータ
蓄積系からのビットストリームを前記1組のパッケット
ごと入力し、デマルチプレクシングして前記圧縮画像信
号、前記圧縮音声信号、前記ディレクトリデータごと独
立してバッファリングし、該ディレクトリデータを参照
して前記圧縮画像信号および前記圧縮音声信号を同期さ
せて復号する復号処理系とを有する画像および音声信号
処理装置が提供される。好適には、前記1組のパッケッ
トは、前記復号処理系を高速ディジタル信号処理回路
(DSP)を用いて構成した場合、前記バッファリング
に用いる独立したバッファの全体の記憶容量を所定の範
囲の値以下にする数個〜10個程度の圧縮画像信号およ
び圧縮音声信号で構成されている。さらに本発明によれ
ば、同時的に画像信号および音声信号信号を圧縮し、こ
れら圧縮された所定数の画像信号と所定数の音声信号に
それぞれの配置を示す固定長のポインタを付加して構成
したパッケットを組にして多重化し、順次、ビットスト
リームとして出力する画像および音声信号符号化方法が
提供される。また本発明によれば、圧縮された所定数の
画像信号および所定数の音声信号に、該画像信号および
音声信号の配置を示すポインタを含むディレクトリデー
タが付加された1組のパッケットとして順次、マルチプ
レクシングされたビットストリームを1組のパッケット
ごと入力し、デマルチプレクシングして前記圧縮画像信
号、前記圧縮音声信号、前記ディレクトリデータごと独
立してバッファリングし、該ディレクトリデータを参照
して前記圧縮画像信号および前記圧縮音声信号を同期さ
せて復号する画像および音声信号復号方法が提供され
る。
【0041】本発明の第3の形態によれば、画像信号お
よび音声信号をそれぞれ同時的に圧縮し、所定数の圧縮
された画像信号の最初の時刻を示す第1のタイムスタン
プと所定数の圧縮された音声信号の最初の時刻を示す第
2のタイムスタンプとが記述されたそれぞれのパッケッ
トヘッダと前記所定数の圧縮画像信号および所定数の圧
縮音声信号とをパッケットとしてマルチプレクシングし
たビットストリームとして出力する符号処理系と、該符
号処理系から送出されたビットストリームを伝送または
蓄積するデータ伝送系またはデータ蓄積系と、該データ
伝送系またはデータ蓄積系からのビットストリーム形態
のデータを入力し、デマルチプレクシングして前記圧縮
画像信号、前記圧縮音声信号および前記タイムスタンプ
ごと独立に、少なくとも該タイムスタンプについて遅延
時間の制限なくバッファリングし、該タイムスタンプを
用いて復号用のクロックを生成して前記画像信号および
前記音声信号を同期させて復号する復号処理系とを有す
る画像および音声信号処理装置が提供される。さらに本
発明によれば、画像信号および音声信号をそれぞれ同時
的に圧縮し、所定数の圧縮された画像信号の最初の時刻
を示す第1のタイムスタンプと所定数の圧縮された音声
信号の最初の時刻を示す第2のタイムスタンプが記述さ
れたそれぞれのパッケットヘッダと前記所定数の圧縮画
像信号および所定数の圧縮音声信号とをパッケットとし
てマルチプレクシングしたビットストリームとして出力
し、該ビットストリーム形態のデータを入力してデマル
チプレクシングして前記圧縮画像信号、前記圧縮音声信
号および前記タイムスタンプごと独立に、少なくとも該
タイムスタンプについて遅延時間の制限なくバッファリ
ングし、該タイムスタンプを用いて復号用のクロックを
生成して前記画像信号および前記音声信号を同期させて
復号する画像および音声信号処理方法が提供される。
【0042】本発明の第4の形態によれば、所定数の圧
縮された画像信号と音声信号とがパッケットとして構成
され、該画像信号の時刻を示す第1のタイムスタンプと
該音声信号の時刻を示す第2のタイムスタンプが付加さ
れてビットストリームとして入力されるデータを入力
し、最初の画像信号についてのタイムスタンプ、およ
び、最初の音声信号についてのタイムスタンプのみ取り
込み、該それぞれのタイムスタンプを用いて復号クロッ
クを生成し、該それぞれのクロックを用いて入力した圧
縮画像信号および圧縮音声信号を同期させて復号する画
像および音声信号復号方法が提供される。
【0043】
【作用】本発明の第1の形態においては、バッファリン
グ遅延時間を1秒に固定せず、ピクチャーデータおよび
オーディオデータ、特に、ピクチャーデータのビットス
トリームレートに則して規定される許容バッファリング
遅延時間で必要な数のタイムスタンプをバッファリング
する。特に、非常に多くのピクチャーデータが失われた
ような場合にも、多くのタイムスタンプを用いて、その
救済を図ることができる。
【0044】本発明の第2の形態においては、バッファ
の容量が小さく、復号処理速度がそほど高速でない小規
模の復号処理系においても種々のビットストリームを復
号可能なように、符号処理系において、画像信号および
音声信号をそれぞれ同時的に圧縮処理をしたとき、比較
的少ない数の圧縮された画像信号および音声信号に、該
画像信号および音声信号の配置または処理時刻を示すポ
インタを含むディレクトリデータを付加して1組のパッ
ケットとして順次、マルチプレクシングしたビットスト
リームとしてデータ伝送系またはデータ蓄積系に送出す
る。復号処理系は、該データ伝送系またはデータ蓄積系
からのビットストリームを前記1組のパッケットごと入
力し、デマルチプレクシングして前記圧縮画像信号、圧
縮音声信号、ディレクトリデータごと独立してバッファ
リングする。ディレクトリの数はさほど大きくないか
ら、そのバッファは大きな記憶容量を必要とせず、オー
バーフローまたはアンダーフローは生じない。復号処理
系はディレクトリデータを参照して前記圧縮画像信号お
よび前記圧縮音声信号を同期させて復号する。
【0045】本発明の第3の形態においては、タイムス
タンプを用いるが、そのタイムスタンプの数を極力減ら
す。そのため、符号処理において、所定数の圧縮された
画像信号の最初の時刻と所定数の圧縮された音声信号の
最初の時刻を示すタイムスタンプが格納されたそれぞれ
のパッケットヘッダと前記所定数の圧縮画像信号および
所定数の圧縮音声信号とをパッケットとしてマルチプレ
クシングしたビットストリームとして出力する。復号処
理において、ビットストリーム形態のデータを入力して
デマルチプレクシングして前記圧縮画像信号、圧縮音声
信号およびタイムスタンプごと独立にバッファリングす
る。タイムスタンプの数はさほど多くないから、タイム
スタンプのバッファの記憶容量は大きくならず、オーバ
ーフローまたはアンダーフローを防止できる。そして、
これらタイムスタンプを用いて復号用のクロックを生成
して前記画像信号および音声信号を同期させて復号す
る。
【0046】本発明の第4の形態においては、復号処理
において、最初の画像信号についてのタイムスタンプ、
および、最初の音声信号についてのタイムスタンプのみ
取り込む。つまり、その後にタイムスタンプが存在して
いても、存在していなくても、最初のタイムスタンプき
み取り込む。そして、取り込んだタイムスタンプを用い
て復号クロックを生成し、それぞれのクロックを用いて
入力した圧縮画像信号および圧縮音声信号を同期させて
復号する。
【0047】
【実施例】本発明の画像および音声信号処理方法とその
装置の第1実施例について述べる。第1実施例は、通常
のビットストリームレートのビデオ信号についても、M
PEGで規定する1秒のバッファリング遅延時間の制限
を排除し、さらにタイムスタンプをバッファリングする
容量をビデオ信号がバッファリングされる数よりも大き
くして、かりに大きな(長時間の)ビデオ信号の喪失が
発生しても、余分のタイムスタンプを用いて,同期回復
を可能とする場合について述べる。
【0048】図1は第1実施例としてのビデオ信号およ
びオーディオ信号処理装置の構成を示す図である。この
ビデオ信号およびオーディオ信号処理装置は、圧縮処理
前の原ビデオ信号、つまり、非圧縮ビデオ信号を提供す
る非圧縮ビデオ信号源2、圧縮処理前の原オーディオ信
号を提供する非圧縮オーディオ信号源3、これら非圧縮
ビデオ信号源2および非圧縮オーディオ信号源3から送
出された非圧縮ビデオ信号S2および非圧縮オーディオ
信号S3を入力し、所定の圧縮処理をして、ビデオ信号
とオーディオ信号とを多重化して符号化した拘束パラメ
ータビットストリーム形態の圧縮符号化信号S1を出力
する符号処理系10、および、符号処理系10からの拘
束パラメータ・ビットストリーム形態の圧縮符号化信号
S1を伝送または蓄積するデータ伝送系またはデータ蓄
積系5を有する。データ伝送系またはデータ蓄積系5と
しては、データ伝送系として、たとえば、衛星通信系、
データ通信系などが対象となり、データ蓄積系として、
たとえば、CD−ROM、LD、ビデオテープなどが対
象となる。以下、本実施例においては、データ伝送系ま
たはデータ蓄積系5として、ビデオテープを用いる場合
について述べる。またこのデータ伝送系またはデータ蓄
積系5は、後述する復号処理系60に対して、多重化ビ
ットストリームを提供するソースでもあるので、多重化
ビットストリームソース5とも呼ぶ。符号処理系10
は、この例では、ビットストリーム内のビデオ信号およ
びオーディオ信号ごとに、換言すれば、パケットごと
に、タイムスタンプを付与する。したがって、データ伝
送系またはデータ蓄積系5からも、パケットごとに、タ
イムスタンプを付与したビットストリームが送出され
る。
【0049】このビデオ信号およびオーディオ信号処理
装置はまた、多重化ビットストリームソース5、つま
り、本実施例では、ビデオテープから送出されるパケッ
トごとに、タイムスタンプが付与された圧縮符号化信号
S5を入力し、符号処理系10における圧縮と逆のデマ
ルチプレクシングおよび伸長処理をして、符号処理系1
0に入力される前の非圧縮ビデオ信号S2および非圧縮
オーディオ信号S3と同等の復号化非圧縮ビデオ信号S
6Aおよび復号化非圧縮オーディオ信号S6Bを復号す
る復号処理系60を有する。このビデオ信号およびオー
ディオ信号処理装置はさらに、符号処理系10および復
号処理系60の処理を制御するため、それぞれ、符号処
理系10への基準信号および復号処理系6への基準信号
を送出する拘束パラメータシステムターゲットデコーダ
40を有する。拘束パラメータシステムターゲットデコ
ーダ40は、デマルチプレクシング部41、ビデオ信号
バッファ42、オーディオ信号バッファ43、ビデオ信
号デコーダ45、ビデオ信号用タイムスタンプバッファ
52、オーディオ信号用タイムスタンプバッファ53、
ビデオ信号用位相同期(Phase Lock Loop :PLL)回
路55、オーディオ信号用位相同期回路56を有する。
【0050】図2に復号処理系60の構成を示す。復号
処理系60は拘束パラメータシステムターゲットデコー
ダ40に対応して構成されるから、復号処理系60は、
デマルチプレクシング部61、ビデオ信号バッファ6
2、オーディオ信号バッファ63、ビデオ信号タイムス
タンプバッファ72、オーディオ信号タイムスタンプバ
ッファ73、ビデオ信号デコーダ65、オーディオ信号
デコーダ66およびビデオ信号PLL回路75、およ
び、オーディオ信号PLL回路76から構成されてい
る。スイッチング回路で構成されたデマルチプレクシン
グ部61は、入力したビットストリームを分離して、ビ
デオ信号はビデオ信号バッファ62に出力し、オーディ
オ信号はオーディオ信号バッファ63に出力し、ビデオ
信号タイムスタンプはビデオ信号用タイムスタンプバッ
ファ72に出力し、オーディオ信号タイムスタンプはオ
ーディオ信号用タイムスタンプバッファ73に出力す
る。ビデオ信号デコーダ65はビデオ信号バッファ62
に記録されたビデオ信号を復号する。オーディオ信号デ
コーダ66はオーディオ信号バッファ63に記録された
オーディオ信号を復号する。ビデオ信号PLL回路75
はビデオ信号用タイムスタンプバッファ72に記録され
たタイムスタンプを用いて同期用クロックを生成する。
オーディオ信号PLL回路76はオーディオ信号用タイ
ムスタンプバッファ73に記録されたタイムスタンプを
用いて同期用クロックを生成する。したがって、たとえ
ば、ビデオ信号の到来タイミングとオーディオ信号の到
来タイミングが異なっていても、ビデオ信号用タイムス
タンプとオーディオ信号用タイムスタンプとを用いて、
ビデオ信号とオーディオ信号とを同期させることができ
る。
【0051】ビデオ信号のバッファリングの容量を、ビ
デオ信号のビットストリームレートと、許容バッファリ
ング遅延時間に応じた容量とする。ビデオ信号バッファ
62の記憶容量は、30HZ のビットストリームレート
の場合、たとえば、30枚のピクチャーデータを記憶可
能な容量とする。オーディオ信号バッファ63の記憶容
量は、オーディオ信号の大きさがビデオ信号の大きさよ
り小さく長い時間のオーディオ信号を記録してもメモリ
容量的にはあまり問題とならないこと、および、到来す
るビデオ信号とのタイミングを合わせるため、ビデオ信
号の時間よりは長い時間のオーディオ信号を記録可能な
容量であるが、実質的にビデオ信号バッファ62の容量
を越えない程度の容量としておく。たとえば、ビデオ信
号バッファ62の記憶容量を46Kバイト、オーディオ
信号バッファ63の記憶容量を4Kバイトとする。
【0052】タイムスタンプ自体の大きさは、ビデオ信
号およびオーディオ信号のいずれよりも小さい。ここで
は、ビデオ信号用タイムスタンプバッファ72、およ
び、オーディオ信号用タイムスタンプバッファ73の容
量を、従来のバッファリング遅延時間、1秒に限定され
ない大きさとする。タイムスタンプおよびその記憶容量
についてついて述べる。タイムスタンプは、符号処理系
における圧縮前の同時的に圧縮処理されるビデオ信号と
オーディオ信号を復号処理系において同期をとるため、
バッファリングの問題を解決するため、さらには、符号
処理系における複写のために設けられている。ここで
は、タイムスタンプは特に、同期のため、および、バッ
ファリングの問題を解決するために使用される場合につ
いて例示する。より特定的には、タイムスタンプはここ
では、非常に大きなピクチャーデータの喪失が発生し
た、ピクチャーデータとタイムスタンプとを1対1に対
応させただけでは、その救済処理にタイムスタンプが不
十分になる場合を解決するために、復号処理系における
バッファの容量を非常に多くする場合を例示する。
【0053】再び、図29および図30を参照して述べ
る。たとえば、符号化処理系が1秒当たり最大4.5メ
ガビットのビットレートのデータ送信またはディジタル
記録媒体5へのデータ伝送をサポートできる場合、画像
の品質はスタートアップデレィおよび圧縮レートよりも
高くなり、復号系におけるバッファリングの価格が高く
なる。この場合、ビデオビットストリームは2部分にな
る。第1の部分は比較的容易な圧縮を行う5秒のビデオ
シーケンスであり、第2の部分は圧縮が難しい5秒のビ
デオシーケンスである。この用途は可変ビットレートの
用途ではあるが、符号化処理系10が10秒間について
連続的に最大通信ビットレート、すなわち、1秒当たり
4.5メガビットを用いることを決定するから、これら
2つのシーケンスについては10x4.5メガビット/
秒=45メガビット/秒が可能である。符号化処理系1
0は、第1部分シーケンスについて150ピクチャーの
ために15メガビット、第2部分シーケンスについて1
50ピクチャーのために30メガビットを許可すること
を決定する。したがって、第1部分のシーケンスについ
てのビデオ信号・ビットレートは15メガビット/5秒
=3メガビット/秒であり、第2部分のシーケンスにつ
いてのビデオ・ビットレートは、30メガビット/5秒
=6メガビット/秒である。図29は、第1部分を復号
化する場合初期値が3メガビット/秒であり、第2部分
を復号化する場合初期値が6メガビット/秒である、星
印で示したビデオデコーダバッファ入力レート、およ
び、ビデオデコーダバッファ出力レートを図解するグラ
フである。時間t=0において、バッファへの入力デー
タは4.5メガビット/秒であり、バッファからの出力
データは3メガビット/秒である。時間t=3.33秒
経過時点において、バッファへの入力データは3.33
秒x4.5メガビット/秒=15メガビット/秒である
から、第1部分の最後のバイトがタイムスタンプバッフ
ァ72に入り、第2部分のデータから4.5メガビット
/秒でタイムスタンプバッファ72に入る。時間t=5
秒経過時点において、タイムスタンプバッファ72から
の出力データは5秒x3メガビット/秒=15メガビッ
ト/秒であるから、第1部分の最後のバイトがタイムス
タンプバッファ72から出ていく。ビデオデコーダが動
作開始し、6メガビット/秒のデータレートで第2部分
の復号を行う。入力デコーダレートが4.5メガビット
/秒のままであるから、ここから、(6−4.5)=
1.5メガビット/秒のレートでバッファの満杯状態が
少なくなっていく。この時点では、バッファには第2部
分のデータのみが入っていることに留意されたい。これ
らのデータは時刻t=3.33秒経過以来、4.5メガ
ビット/秒のデータレートでバッファに記録されている
から、バッファ内のビットの数は(5−3.33)秒x
4.5メガビット/秒=7.5メガビットである。これ
ら7.5メガビットのタイムスタンプバッファ72に満
杯になっているデータは1.5メガビット/秒のレート
で減少していき、(7.5メガビット/1.5メガビッ
ト/秒)=5秒で終わる。時間t=10秒が経過して時
点で、タイムスタンプバッファ72が空になり、もし存
在するなら後続するビデオ信号が4.5メガビット/秒
またはそれ以下で符号化される。この場合、第1部分の
最後のバイトについての遅延、および、この最後のバイ
トに続く第2の部分の最初のバイト遅延が約(5−3.
33)秒=1.67秒であり、MPEGの規定における
遅延時間である1秒を越えているという問題に遭遇す
る。
【0054】ビットストリーム受容性(compliance)を
形成するため、伝送レートは図30を参照して下記に述
べるように、低減すべきである。時間t=0において、
タイムスタンプバッファ72への入力データは3.75
メガビット/秒であり、バッファからの出力データは3
メガビット/秒である。時間t=4秒経過時点におい
て、タイムスタンプバッファ72への入力データは4秒
x3.75メガビット/秒=15メガビット/秒である
から、第1部分の最後のバイトがバッファに入り、次い
で、第2部分のデータから4.5メガビット/秒でバッ
ファに入る。時間t=5秒経過時点において、バッファ
からの出力データは5秒x3メガビット/秒=15メガ
ビット/秒であるから、第1部分の最後のバイトがバッ
ファから出ていく。ビデオデコーダが動作開始し6メガ
ビット/秒のデータレートで第2部分の復号を行う。入
力データレートが4.5メガビット/秒であるから、こ
こから、(6−4.5)=1.5メガビット/秒のレー
トでバッファの満杯状態が少なくなっていく。この時点
では、タイムスタンプバッファ72には第2部分のデー
タのみが入っていることに留意されたい。これらのデー
タは時刻t=4秒経過以来4.5メガビット/秒のデー
タレートでバッファに記録されているから、タイムスタ
ンプバッファ72内のビットの数は4.5メガビットで
ある。これら4.5メガビットのバッファに満杯になっ
ているデータは1.5メガビット/秒のレートで減少し
ていき、3秒で終わる。時間t=8秒が経過した時点
で、バッファが空になる。もしビデオデコーダが6メガ
ビット/秒でデータを読み続けるならば、ここでアンダ
ーフローが起こる。このアンダーフローを防止するた
め、ビデオデコータ60は第2部分の残っている2秒分
のデータについてビットレートを6メガビット/秒から
4.5メガビット/秒に低下させなければならない。
【0055】このビットストリームは、前に述べた30
メガビットではなく第2部分が6秒x4.5=27メガ
ビットであるから、圧縮率が高く、スタートアップ遅延
が短く、小さな容量のビデオデコーダバッファでプレー
バックできるという利点を有するものの、1秒のバッフ
ァリング遅延により希望するビデオ品質を提供できない
という問題に遭遇する。したがって、この観点からも、
通常のビデオ信号について高いピクチャー品質を実現す
るためには、1秒のバッファリング遅延時間に限定する
ことは好ましくない。したがって、本発明においては、
通常のビットストリームレートのビデオ信号についても
1秒のバッファリング遅延時間を排除した。
【0056】たとえば、あるビデオバイトのバッファリ
ング遅延時間が1秒であり、レートが30HZ のビデオ
信号の場合1秒当たり30枚分のピクチャーをビデオデ
コーダが取り出すから、最悪の場合として30枚分のピ
クチャーデータがバッファ62に存在する。かりにある
ビデオ信号バイトのバッファリング遅延が上述したよう
に最悪の場合として1.67秒であるなら、このバイト
の前に、1.67x30=50枚分のピクチャーデータ
があることになる。従来は30HZ のレートについては
30分のタイムスタンプを記録するバッファ容量であっ
たが、ビデオ信号のレートが30HZ の場合、たとえ
ば、ビデオ信号50枚分のタイムスタンプをバッファに
記録することが望ましい。したがって、この例では、ビ
デオ信号用タイムスタンプバッファ72の容量として
は、50枚分のビデオ信号に相当する容量とする。
【0057】さらに、符号化処理系10からデータ蓄積
系またはデータ伝送系5に送出するデータ、またはデー
タ蓄積系またはデータ伝送系5において誤りが生ずる。
非常に多くの誤りが生じた場合、全てのビデオ信号につ
いてタイムスタンプを持っていることが復号系において
正確に復号する点で好ましい。しかしながら、ビデオビ
ットストリームの遅延が1.67秒より長く、全てのビ
デオ信号が1つのタイムスタンプを持っている場合、3
0枚分の容量では、タイムスタンプバッファ72はオー
バーフローしてしまう。したがって、たとえば、ビット
ストリームレートが30HZ のビデオ信号の場合、タイ
ムスタンプバッファ72の容量を、できるだけ多く、少
なくとも上述した50枚分以上にすることが望ましい。
ビデオ信号の長時間の障害に対して救済を行うには、タ
イムスタンプバッファ72の大きさは極力大きいほうが
好ましい。しかしながら、実用上、バッファの容量には
限度があるから、このタイムスタンプバッファの容量
は、ビデオ信号のレート、実質的な遅延時間に依存して
決定することが望ましい。
【0058】タイムスタンプ自体の大きさはビデオ信号
に比較すると小さいから、符号化処理系60を搭載する
メモリに制限のあるDSPで実現した場合でも、上記程
度のタイムスタンプバッファ72の容量なら特に問題は
ない。しかしながら、上述した例示以上の容量の大量の
タイムスタンプを記録させることもでき、その場合は、
DSP内のメモリを使用せず、DSPの外部にSRAM
あるいはDRAMを設けて、大量のタイムスタンプを記
憶させることもできる。
【0059】以上述べたように、第1実施例によれば、
タイムスタンプのオーバーフローまたはアンダーフロー
を防止でき、事実上、ビットストリームレートに依存さ
れずに、かりに長時間のデータ障害が発生したとして
も、高い品質のビデオ信号をオーディオ信号に同期させ
て復号することができる。
【0060】図3は本発明の画像および音声信号処理装
置の第2実施例としてのビデオ信号およびオーディオ信
号処理装置の構成図である。第2実施例は、上述したM
PEGにおける多重化シンタックス(多重化フォーマッ
ト)、特に、ディレクトリの長さに起因した問題を解決
する。このビデオ信号およびオーディオ信号処理装置
は、図15に示したビデオ信号およびオーディオ信号処
理装置に類似した構成をしているが、第1実施例のビデ
オ信号およびオーディオ信号処理装置には、拘束パラメ
ータシステムターゲットデコーダ4にディレクトリデー
タバッファ44およびディレクトリデコーダ47が付加
されている。
【0061】ビデオ信号およびオーディオ信号処理装置
は、圧縮処理前の原ビデオ信号、つまり、非圧縮ビデオ
信号を提供する非圧縮ビデオ信号源2、圧縮処理前の原
オーディオ信号を提供する非圧縮オーディオ信号源3、
これら非圧縮ビデオ信号源2および非圧縮オーディオ信
号源3から送出された非圧縮ビデオ信号S2および非圧
縮オーディオ信号S3を入力し、所定の圧縮処理をし
て、ビデオ信号とオーディオ信号とを多重化して符号化
した拘束パラメータビットストリーム形態の圧縮符号化
信号S1を出力する符号処理系1、および、符号処理系
1からの拘束パラメータ・ビットストリーム形態の圧縮
符号化信号S1を伝送または蓄積するデータ伝送系また
はデータ蓄積系5を有する。データ伝送系またはデータ
蓄積系5としては、データ伝送系として、たとえば、衛
星通信系、データ通信系などが対象となり、データ蓄積
系として、たとえば、CD−ROM、LD、ビデオテー
プなどが対象となる。以下、本実施例においては、デー
タ伝送系またはデータ蓄積系5として、ビデオテープを
用いる場合について述べる。またこのデータ伝送系また
はデータ蓄積系5は、後述する復号処理系6に対して、
多重化ビットストリームを提供するソースでもあるの
で、多重化ビットストリームソース5とも呼ぶ。
【0062】このビデオ信号およびオーディオ信号処理
装置はまた、多重化ビットストリームソース5、つま
り、本実施例では、ビデオテープから送出される拘束ビ
ットストリーム形態の圧縮符号化信号S5を入力し、符
号処理系1における圧縮と逆のデマルチプレクシングお
よび伸長処理をして、符号処理系1に入力される前の非
圧縮ビデオ信号S2および非圧縮オーディオ信号S3と
同等の復号化非圧縮ビデオ信号S6Aおよび復号化非圧
縮オーディオ信号S6Bを復号する復号処理系6を有す
る。このビデオ信号およびオーディオ信号処理装置はさ
らに、符号処理系1および復号処理系6の処理を制御す
るため、それぞれ、符号処理系1への基準信号S4Aお
よび復号処理系6への基準信号S4Bを送出する拘束パ
ラメータシステムターゲットデコーダ4を有する。拘束
パラメータシステムターゲットデコーダ4は、デマルチ
プレクシング部41、ビデオ信号バッファ42、オーデ
ィオ信号バッファ43、ディレクトリデータバッファ4
4、ビデオ信号デコーダ45、オーディオ信号デコーダ
46、および、ディレクトリデコーダ47を有する。
【0063】図4に復号処理系6の構成を示す。復号処
理系6は拘束パラメータシステムターゲットデコーダ4
に対応して構成されるから、復号処理系6は、デマルチ
プレクシング部61、ビデオ信号バッファ62、オーデ
ィオ信号バッファ63、ディレクトリデータバッファ6
4、ビデオ信号デコーダ65、オーディオ信号デコーダ
66およびディレクトリデコーダ67から構成されてい
る。図17に図解した復号処理系600と比較すると、
ディレクトリデータバッファ64およびディレクトリデ
コーダ67が付加されている。
【0064】図5に多重化ビットストリームソース5、
この実施例ではビデオテープから復号処理系6に入力さ
れるビットストリームを示す。このビットストリーム
は、図27(A)に示したビットストリームを変形した
ものであり、ディレクトリパッケットとビデオパッケッ
トとの対が連続するようにフォーマットが構成されてい
る。ディレクトリパッケットには、ディレクトリパッケ
ットヘッダ、および、ビデオパッケット内のピクチャー
グループのポインタが記述されている。ビデオパッケッ
トにはそのビデオパッケットのヘッダ(ビデオパッケッ
トヘッダ)が設けられ、次いでこのビデオパッケットヘ
ッダに続けて、第(−1)番目のピクチャーグループ
(Group Of Picture) GOP−1が設けられ、さらに1
0個のピクチャーグループ、つまり、第0番目のピクチ
ャーグループGOP0〜第9番目ピクチャーグループG
OP9が設けられている。ピクチャーグループとは、た
とえば、符号内(INTRAフレーム)符号化方法)に
おいて符号化した一連のピクチャー、または、符号間
(INTERフレーム)符号化方法において符号化した
一連のピクチャーをいう。また、ピクチャーとは表示装
置に表示される画像をいう。ビデオパッケット内には1
0個のピクチャーグループGOP0〜GOP9が設けら
れているから、ディレクトリパッケット内のポインタも
10個のポインタ、P0〜P9が設けられている。
【0065】スイッチング回路で構成されたデマルチプ
レクシング部61は、図5に示したビットストリームを
分離して、ビデオ信号はビデオ信号バッファ62に出力
し、ディレクトリデータはディレクトリデータバッファ
64に出力する。ビデオ信号バッファ62の記憶容量
は、上述した例と同様、46Kバイトである。ディレク
トリデータバッファ64は、1ポインタ当たり100ビ
ット必要であるから、10ポインタ合計で1Kビットの
記憶容量となる。このように、ディレクトリデータバッ
ファ64の記憶容量はビデオ信号バッファ62の記憶容
量に比較して非常に少ない。ビデオ信号デコーダ65、
オーディオ信号デコーダ66およびディレクトリデコー
ダ67は高速演算処理が必要とされ、これらビデオ信号
デコーダ65、オーディオ信号デコーダ66およびディ
レクトリデコーダ67は高速演算に適した回路構成のデ
ィジタル信号処理装置(DSP)で一体構成される場合
が多い。その反面、DSPには大きな記憶容量のメモリ
を搭載することが難しい場合が多い。したがって、DS
Pに接続されるビデオ信号バッファ62、オーディオ信
号バッファ63およびディレクトリデータバッファ64
の記憶容量はある程度制限される。しかしながら、ビデ
オ信号バッファ62およびオーディオ信号バッファ63
の記憶容量は、MPEGの規定に従った記憶容量を有す
る必要があるから、結局、ディレクトリデータバッファ
64の記憶容量を極力小さくする必要がある。その反
面、ディレクトリデータバッファ64に記憶されるディ
レクトリのオーバーフローおよびアンダーフローを考慮
する必要もある。そこで、本実施例においては、ディレ
クトリデータバッファ64の記憶容量を1Kビットとし
ている。このように、ディレクトリデータバッファ64
の記憶容量が比較的少ないので、ディレクトリデータバ
ッファ64を付加してもDSPにとって大きな負担には
ならない。本実施例においては、ビデオ信号バッファ6
2は46Kバイトの記憶容量を有するスタテックランダ
ムアクセスメモリ(SRAM)で構成され、オーディオ
信号バッファ63は4Kバイトの記憶容量を有するSR
AMで構成され、ディレクトリデータバッファ64は1
Kビットの記憶容量を有するSRAMで構成されてい
る。
【0066】図5はビデオ信号のビットストリームにつ
いて述べたが、オーディオ信号についても上記同様のフ
ォーマットで多重化ビットストリームソース5から復号
処理系6に入力される。
【0067】図6(A)はビデオ信号バッファ62に入
力される出力されるビデオ信号の経時変化を示すグラフ
である。図6(B)はディレクトリデータバッファ64
に入力され出力されるディレクトリデータの経時変化を
示すグラフである。図6(A)、(B)において、横軸
は時間変化を示し、縦軸はビデオ信号バッファ62およ
びディレクトリデータバッファ64に蓄積されているビ
デオ信号とディレクトリデータの量を示す。図6(B)
の破線で示した曲線はバッファリングにおいてオーバー
フローする限界を示し、実線で示した曲線はアンダーフ
ローする限界を示す。図7は図5に示したフォーマット
の圧縮符号化信号を含む多重化ビットストリームS5が
復号処理系6に入力されたときのビデオ信号バッファ6
2とディレクトリデータバッファ64の動作を示す。図
6(A)および図7において、ビデオ信号バッファ62
に入力するビデオ信号の量の変化が2段階になってい
る。最初の傾斜は第1のビデオパッケット内のピクチャ
ーグループGOP0〜GOP9が連続的にビデオ信号バ
ッファ62に入力される状態を示しており、第2の傾斜
は第2のビデオパッケット内のピクチャーグループGO
P10〜GOP19が連続的にビデオ信号バッファ62
に入力される状態を示している。
【0068】ディレクトリデータバッファ64は一度に
最大10個のポインタを入力する容量を有しているの
で、ディレクトリデータバッファ64においてオーバー
フローもアンダーフローも発生しない。ピクチャーグル
ープの大きさは変化する場合がある。しかしながら、一
度にビデオ信号バッファ62に入力されるピクチャーグ
ループは最大10個であり、この最大10個についてビ
デオ信号デコーダ65において順次復号処理が行われ
る。したがって、ビデオ信号バッファ62にはオーバー
フローまたはアンダーフローが発生しない。特に、一度
に処理する最大数を10個と制限しているので、ビデオ
信号バッファ62の記憶容量を、上述し、従来と同等の
大きさとして、47Kバイトにした記憶容量を少なくす
ることができる。このことは、多重化ビットストリーム
ソース5に対して種々の復号処理系6で処理することを
考えると、ビデオ信号バッファ62およびディレクトリ
データバッファ64の記憶容量が小さく、また、ビデオ
信号デコーダ65およびディレクトリデコーダ67の処
理能力が低い復号処理系6においても、オーバーフロー
またはアンダーフローを生じさせずに復号処理が可能に
なるという利点を意味している。つまり、多重化ビット
ストリームソース5から、図5に示したような、ディレ
クトリデータおよびこれに対応するピクチャーグループ
を分割した信号伝送形態(フォーマット)で復号処理系
6に提供することにより、種々の復号処理系6がそのフ
ォーマットに追従して復号処理可能になる。もちろん、
このようなフォーマットは符号処理系1において多重化
ビットストリームソース5に提供されるから、元々、符
号処理系1において、このようなビットストリームにな
るように多重化ビットストリームソース5に出力する。
【0069】図8はユーザーによるピクチャーのスキッ
プ動作がある場合のビデオ信号バッファ62に入力され
るピクチャーグループの経緯を示す。ピクチャーグルー
プをいかにスキップさせるかは、ディレクトリパッケッ
ト内に記述されたポインタに従って行われる。本実施例
においては、一度に最大、10ポインタ、10ピクチャ
ーグループごと処理している。したがって、破線で示し
たように、かりに、ピクチャーグループ12からピクチ
ャーグループ10に戻すような場合でも、第1のディレ
クトリパッケットに戻るでもなく、ディレクトリデータ
バッファ64に記憶されている第2ディレクトリパッケ
ット内のポインタを参照してピクチャーグループGOP
10の表示についての復号処理を行えばよい。たとえ
ば、ビデオテープについて小さな範囲で巻き戻ししてプ
レーバックする場合、このように、多重化ビットストリ
ームソース5から多重化ビットストリームS5を読み返
すことなく行われることが多い。従来の方法では、図2
7に図解したように、最初のディレクトリパッケットま
で戻ることになり、即時性に問題がある。本実施例で
は、すでにディレクトリデータバッファ64に格納され
ているポインタを用いて、ビデオ信号バッファ62に格
納されているビデオ信号を用いて迅速なスキップ動作が
可能になる。特に、多重化ビットストリームソース(デ
ータ伝送系またはデータ蓄積系)5として、ビデオテー
プを用いたような場合には、最初のディレクトリまで戻
すの時間がかかるという問題があったが、本実施例で
は、データ伝送系またはデータ蓄積系5がビデオテープ
であっても、プレイバックに大きな時間を要しないとい
う利点がある。データ伝送系またはデータ蓄積系5とし
て、LDなどを使用した場合も、ディレクトリデータお
よびピクチャーグループの再読みだし回数が減少するか
ら、迅速なスキップ動作が実現できる。
【0070】上述した第2実施例においては、一度にデ
ィレクトリデータバッファ64に格納可能なディレクト
リデータを10個まで許容する例を示したが、本発明は
最大格納ディレクトリデータの数を10には限定するも
のではなく、本発明においては、より少ない数、たとえ
ば、最大ディレクトリデータ数を5個にすることもでき
る。ディレクトリデータ数を5個にした場合、ディレク
トリデータバッファ64の記憶容量は0.5Kビット
(500ビット)になる。ディレクトリデータバッファ
64の記憶容量が小さくなれば、ビデオ信号バッファ6
2の記憶容量を小さくすることができる。このことは、
バッファの記憶容量が小さく、復号処理の性能が低い復
号処理系にも問題なく適用できることを意味している。
つまり、符号処理系1において、多重化ビットストリー
ムソース5に一度に出力するビットストリームの数を極
力小さくすると、種々の復号処理系6において、問題な
く多重化ビットストリームソース5から出力される圧縮
符号化信号を含む多重化ビットストリームS5を問題な
く復号できることになる。もちろん、一度に格納できる
ディレクトリデータの数を極端に小さくすると、たとえ
ば、1にすると、多重化ビットストリームソース5から
復号処理系6に入力される多重化ビットストリームS5
の伝送頻度が高くなり、多重化ビットストリームソース
5と復号処理系6との間の通信(伝送)速度がボトルネ
ックになる可能性もある。したがって、一度に格納でき
るディレクトリデータの数は数個〜10個程度が好まし
い。
【0071】本発明の画像および音声信号処理方法とそ
の装置の第3実施例について述べる。上述したように、
MPEGの標準においてはバッファリング遅延時間が1
秒と規定されているが、本実施例においては、このバッ
ファリング遅延時間を排除する。その一方で、ビットス
トリーム内のビデオ信号およびオーディオ信号ごとにタ
イムスタンプを付与する。ただし、極力少ない数のタイ
ムスタンプを用いる。図9は第2実施例としてのビデオ
信号およびオーディオ信号処理装置の構成を示す図であ
る。このビデオ信号およびオーディオ信号処理装置は、
符号処理系1A、非圧縮ビデオ信号源2、非圧縮オーデ
ィオ信号源3、拘束パラメータシステムターゲットデコ
ーダ4A、データ伝送系またはデータ蓄積系5、およ
び、復号処理系6Aを有する。非圧縮ビデオ信号源2、
非圧縮オーディオ信号源3およびデータ伝送系またはデ
ータ蓄積系5は上述したものと実質的に同じである。符
号処理系1Aは符号処理系1と同様、拘束パラメータシ
ステムターゲットデコーダ4Aは拘束パラメータシステ
ムターゲットデコーダ4と同様、復号処理系6Aは復号
処理系6と同様であるが、下記に述べる点が異なる。
【0072】拘束パラメータシステムターゲットデコー
ダ4Aは、デマルチプレクシング部41、ビデオ信号バ
ッファ42、オーディオ信号バッファ43、ビデオ信号
デコーダ45に加えて、ビデオ信号用タイムスタンプバ
ッファ52、オーディオ信号用タイムスタンプバッファ
53、ビデオ信号用位相同期(Phase Lock Loop :PL
L)回路55、オーディオ信号用位相同期回路56を有
する。
【0073】図10に復号処理系6Aの構成を示す。復
号処理系6Aは拘束パラメータシステムターゲットデコ
ーダ4Aに対応して構成されるから、デマルチプレクシ
ング部61、ビデオ信号バッファ62、オーディオ信号
バッファ63、ビデオ信号デコーダ65、オーディオ信
号デコーダ66に加えて、ビデオ信号用タイムスタンプ
バッファ72、オーディオ信号用タイムスタンプバッフ
ァ73、ビデオ信号用位相同期(PLL)回路75、オ
ーディオ信号用位相同期回路76を有する。第3実施例
では、ビデオ信号バッファ62の記憶容量を46Kバイ
ト、オーディオ信号バッファ63の記憶容量を4Kバイ
ト、ビデオ信号用タイムスタンプバッファ72の記憶容
量を30タイムスタンプ分、同じくオーディオ信号用タ
イムスタンプバッファ73の記憶容量を30タイムスタ
ンプ分に設定している。
【0074】図11に符号処理系1Aで符号化され、デ
ータ伝送系またはデータ蓄積系5に送出されたビデオ信
号についてのビットストリームを示す。このビットスト
リームは、複数のピクチャーグループからなり、それぞ
れのピクチャーグループは、ビデオ信号パッケットヘッ
ダ、そのピクチャーグループ、そのピクチャーグループ
内の10個のフレームからなる。ビデオ信号パッケット
ヘッダには、そのピクチャーグループのタイムスタンプ
が記述されている。図12(A)は図11に示したビッ
トストリームを示し、図12(B)はビデオ信号バッフ
ァ62に格納されるビデオ信号の格納状態を示し、図1
2(C)はビデオ信号用タイムスタンプバッファ52に
格納されるビデオ信号のタイムスタンプの格納状態を示
す。つまり、図11に示したビデオ信号のビットストリ
ームが、図8に示した復号処理系6Aに入力され、デマ
ルチプレクシング部61で分解されて、図12(B)の
実線で示したようにビデオ信号はオーバーフローなしに
ビデオ信号バッファ62に格納され、図12(C)に太
い実線で示したようにビデオ信号についてのタイムスタ
ンプはオーバーフローなしにビデオ信号用タイムスタン
プバッファ52に格納される。図12(B)において、
実線で示したビデオ信号の出力タイミングは、ビデオ信
号バッファ62の出力遅延時間に基づいて4秒遅延して
ビデオ信号デコーダ65に入力されている。同様に、図
12(C)において、ビデオ信号のタイムスタンプはビ
デオ信号用タイムスタンプバッファ72において4秒遅
延されてビデオ信号用位相同期回路75に入力されてい
る。
【0075】図10において、ビデオ信号用位相同期回
路55はビデオ信号用タイムスタンプバッファ52に格
納されてタイムスタンプに基づいて正確に位相同期して
クロックを発生する。ビデオ信号デコーダ45はビデオ
信号用タイムスタンプバッファ52に格納されたビデオ
信号を復号する。上述した実施例は、ビデオ信号につい
て述べたが、オーディオ信号についても上記ビデオ信号
と同様に処理される。
【0076】第3実施例においてはバッファリング遅延
時間に限度を設けていない。したがって、復号処理系6
Aは入力されたビットストリームで規定されたタイムス
タンプに基づいて生成される位相同期されたクロックに
基づいて、遅延時間の制約を受けないで、復号処理を行
う。その結果として、種々の復号処理系6Aが上述した
ビットストリームのビデオ信号およびオーディオ信号を
復号できる。遅延時間に限度をつけない場合の利点とし
ては、たとえば、MO、DCCなどにビデオ信号とオー
ディオ信号とを記録し、復号する場合、そのバッファリ
ング遅延時間は1秒以上、たとえば、2〜5秒程度の許
容時間があるから、このような応答時間の長い復号に本
実施例を適用することが好適である。また、このバッフ
ァリング遅延時間を排除することにより、高解像度の画
像を必要とし応答性をさほど問題にしない用途において
も、画像符号および復号技術を適用できる。ビデオ信号
のタイムスタンプとオーディオ信号のタイムスタンプに
基づいてそれぞれ生成されたクロックに基づいて復号さ
れるから、復号されたビデオ信号とオーディオ信号とは
同期している。
【0077】本発明の画像および音声信号処理方法とそ
の装置の第4実施例について述べる。図13は本発明の
第4実施例についてのビットストリームを示す。図13
に示したビットストリームは、第1のビデオ信号パッケ
ットは、第1のオーディオ信号パッケット、第2のビデ
オ信号パッケット、第2のオーディオ信号パッケット、
以下、同様に、ビデオ信号パッケットとオーディオ信号
パッケットが続けられて構成されている。第1のビデオ
信号パッケットは、ビデオ信号パッケットヘッダ、第0
番目のピクチャーグループGOP0、このピクチャーグ
ループGOP0に関係する第0〜第19のフレームF0
〜F19、〜、第3番目のピクチャーグループGOP
3、このピクチャーグループGOP3に関係する第0〜
第19のフレームF0〜F19で構成されている。この
第1のビデオ信号パッケットの後に、第1のオーディオ
信号パッケットが続いている。ビデオ信号パッケット
は、オーディオ信号パッケットヘッダ、オーディオ信号
アクセスユニットAAUを有する。第1のビデオ信号パ
ッケットのビデオ信号パッケットヘッダに、ビデオ信号
タイムスタンプが記述され、第1のオーディオ信号パッ
ケットヘッダにオーディオ信号タイムスタンプが記述さ
れている。第2ビデオ信号パッケットのビデオ信号パッ
ケットヘッダ、第2のオーディオ信号パッケットのオー
ディオ信号パッケットヘッダ以降にも、それぞれ、ビデ
オ信号タイムスタンプ、オーディオ信号タイムスタンプ
を記述することができるが、これらはオプションであ
り、本実施例においては、第1のビデオ信号パッケット
のビデオ信号パッケットヘッダにビデオ信号タイムスタ
ンプを記述し、第1のオーディオ信号パッケットヘッダ
にオーディオ信号タイムスタンプを記述することが本質
的である。
【0078】このビットストリームを符号処理する復号
処理系は、図10に図示した復号処理系6Aと同様な構
成となるが、ビデオ信号タイムスタンプおよびオーディ
オ信号タイムスタンプTIME−STAMPが最小でそ
れぞれ1つであるから、ビデオ信号用タイムスタンプバ
ッファ72およびオーディオ信号用タイムスタンプバッ
ファ73の記憶容量はそれぞれ1つのタイムスタンプを
記憶するに充分な記憶容量でよい。つまり、第4実施例
においては、タイムスタンプの記憶容量を減少でき、復
号処理系をDSPで構成するのに適している。第4実施
例においては、初期状態のみ印加されるビデオ信号のタ
イムスタンプに基づいてビデオ信号用位相同期回路75
が位相同期されたクロックを生成し、それ以降、このク
ロックを基準に位相同期されたビデオ信号のクロックが
順次生成されていく。同様に、オーディオ信号のクロッ
クについても、初期状態のみ印加されるオーディオ信号
のタイムスタンプに基づいてオーディオ信号用位相同期
回路76が位相同期されたクロックを生成し、それ以
降、このクロックを基準に位相同期されたオーディオ信
号のクロックが順次生成されていく。
【0079】第4実施例においても第3実施例と同様
に、復号処理系に印加されたタイムスタンプに基づいて
ビデオ信号およびオーディオ信号が復号される。これら
復号されたビデオ信号およびオーディオ信号は位相同期
されたクロックを用いて復号されるから、復号されたビ
デオ信号と復号されたオーディオ信号とは同期してい
る。
【0080】本発明の画像および音声信号処理方法とそ
の装置の第5実施例について述べる。第3実施例におい
て、MPEG基準における1秒のバッファリング遅延時
間の限度をなくすことを提案した。その一方で、たとえ
ば、業務用などの専門家向けの復号系など性能のよい復
号処理系を用いる場合は、遅延時間をMPEGが規定す
る1秒より短くする必要がある。たとえば、0.2秒の
遅延時間が必要とされる場合がある。本実施例では、た
とえば、バッファリング遅延時間を0.2秒以内とす
る。第5実施例においては、復号処理系におけるビデオ
信号バッファ、オーディオ信号バッファの記憶容量を非
常に小さくし、バッファにおけるバッファリング遅延時
間を短くし、ビデオ信号復号器およびおよび復号器の処
理時間を高速にする。
【0081】本発明の画像および音声信号処理方法とそ
の装置の第6実施例について述べる。第6実施例におい
ては、図14に示した多重化シンタックスによるビット
ストリームのデータが復号処理系に入力された時に、最
初のビデオ信号タイムスタンプ、および、最初のオーデ
ィオ信号タイムスタンプのみを取り込んで、このタイム
スタンプを用いて復号のためのクロックを生成する。こ
の時の復号処理系は、図10に示した復号処理系の構成
と同様の構成になるが、ビデオ信号タイムスタンプバッ
ファ、および、オーディオ信号タイムスタンプバッファ
の記憶容量は非常に小さくできる。また第6実施例によ
れば、ビデオ信号タイムスタンプ、および、オーディオ
信号タイムスタンプはいかなる多重化シンタックスのビ
ットストリームにおいても必ず最初のヘッダに記述され
ているから、ビットストリームの形態に依存せず、復号
が可能となる。
【0082】以上、本発明の実施例において、画像信号
としてテレビジョンなどにおけるビデオ信号を用いた場
合について述べたが、本発明の実施に際しては、上述し
たビデオ信号に限らず種々の画像データについても適用
できる。また本発明の実施例として、1つのビデオ信号
と1つのオーディオ信号との符号処理および復号処理に
ついて述べたが、たとえば、マルチメディアシステムな
どにおけるように、複数のビデオ信号、複数のオーディ
オ信号について多重化し符号化してディジタルデータ蓄
積媒体に記録し、再び、複数のビデオ信号および複数の
オーディオ信号に復号する場合についても適用できる。
さらに、本発明はディジタルデータを蓄積する場合に限
らず、データ通信(またはデータ伝送)を行う場合につ
いても適用できる。また圧縮および復号技術の例とし
て、MPEGを例示したが、本発明は上述したMPEG
と同様の他の圧縮および復号技術を適用することができ
る。
【0083】
【発明の効果】本発明によれば、通常の画像データにつ
いても復号処理系におけるバッファリング遅延時間の制
限をなくし、少なくとも画像データのビットストリーム
レートと許容遅延時間で規定される容量のタイムスタン
プを復号処理系のバッファメモリに記憶することを可能
にしているから、バッファリングの問題が解決され、さ
らに、非常に多くの画像データの喪失が生じても、復号
処理系においてタイムスタンプを用いて同期回復を行う
ことができる。
【0084】また本発明によれば、種々の拘束パラメー
タ・ビットストリームの多重化シンタックスデータにつ
いて、種々の復号を可能とする。したがって、種々の符
号化に依存されず効率よく復号できる。
【0085】さらに本発明によれば、バッファリング制
限時間の限度なく、フレキシブルに多重化シンタックス
データを復号することができる。
【0086】本発明によれば、復号装置の構成を簡単に
できる。特に、本発明によれば、記憶容量の小さなメモ
リを有するDSPで構成できる。
【0087】また本発明によれば、ファーストフォワー
ド、フィードバックなどの動作においても迅速な動作が
可能になる。
【0088】さらに本発明によればさらに、長いスター
トアップディレーを排除できる。
【図面の簡単な説明】
【図1】本発明の画像および音声信号処理装置の第1実
施例としてのビデオ信号およびオーディオ信号処理装置
の構成図である。
【図2】図1に示したビデオ信号およびオーディオ信号
処理装置における復号処理系の構成図である。
【図3】本発明の画像および音声信号処理装置の第2実
施例としてのビデオ信号およびオーディオ信号処理装置
の構成図である。
【図4】図3に示したビデオ信号およびオーディオ信号
処理装置における復号処理系の構成図である。
【図5】図3に示したビデオ信号およびオーディオ信号
処理装置における多重化シンタックス(フォーマット)
を示す図である。
【図6】図4に示した復号処理系におけるディレクトリ
バッファ、および、ディレクトリデコーダの動作を示す
グラフである。
【図7】図3に示した復号処理系の動作を示す図であ
る。
【図8】図3に示す復号処理系におけるスキップ動作を
示す図である。
【図9】本発明の画像および音声信号処理装置の第3実
施例としてのビデオ信号およびオーディオ信号処理装置
の構成図である。
【図10】図3に示したビデオ信号およびオーディオ信
号処理装置における復号処理系の構成図である。
【図11】図9に示したビデオ信号およびオーディオ信
号処理装置における多重化シンタックス(フォーマッ
ト)を示す図である。
【図12】図4に示した復号処理系におけるディレクト
リバッファ、および、ディレクトリデコーダの動作を示
すグラフである。
【図13】本発明の第4実施例としてのビットストリー
ムを図解する図である。
【図14】本発明の第6実施例としてのビットストリー
ムを図解する図である。
【図15】従来のMPEGに基づくビデオ信号およびオ
ーディオ信号処理装置の構成図である。
【図16】図15における拘束パラメータビットストリ
ームのフォーマットを示す図であり、(A)は図15に
おける符号処理系においてマルチプレクシングしたビッ
トストリームを示し、(B)は復号処理系においてフォ
ーマット変換した信号フォーマットを示す。
【図17】図15に示した復号処理系の構成図である。
【図18】従来の復号処理系におけるオーディオ信号受
信バッファに入力されるオーディオ信号とオーディオ信
号復号器に入力されるオーディオ信号とのタイミングの
関係を示す図である。
【図19】従来の復号処理系におけるオーディオ信号受
信バッファに入力されるオーディオ信号とオーディオ信
号復号器に入力されるオーディオ信号との他のタイミン
グの関係を示す図である。
【図20】バッファにおけるオーバーフローとアンダー
フローを示す図である。
【図21】図20に示したオーバーフローまたはアンダ
ーフローを防止する方法を示す図である。
【図22】スタートアップディレーを説明する図であ
る。
【図23】他のバッファリング処理を示す図である。
【図24】さらに他のバッファリング処理を示す図であ
る。
【図25】先行出願の復号器の構成図である。
【図26】図25に示した復号器で処理するビットスト
リームを示す図である。
【図27】従来の他のビットストリームを示す図であ
る。
【図28】MPEGに基づく他の従来のビデオ信号およ
びオーディオ信号処理装置の構成図である。
【図29】従来の他のバッファリングの問題を図解する
図である。
【図30】図29に示した問題を解決するバッファリン
グの方法を図解する図である。
【符号の説明】
1,10・・符号処理系 2・・非圧縮ビデオ信号源 3・・非圧縮オーディオ信号源 4,40・・拘束パラメータシステムターゲットデコー
ダ 41・・デマルチプレクシング部 42・・ビデオ信号バッファ 43・・オーディオ信号バッファ 44・・ディレクトリデータバッファ 45・・ビデオ信号デコーダ 46・・オーディオ信号デコーダ 47・・ディレクトリデコーダ 52・・ビデオ信号用タイムスタンプバッファ 53・・オーディオ信号用タイムスタンプバッファ 55・・ビデオ信号用位相同期回路 56・・オーディオ信号用位相同期回路 5・・データ伝送系またはデータ蓄積系 多重化ビットストリームソース 6,60・・復号処理系 61・・デマルチプレクシング部 62・・ビデオ信号バッファ 63・・オーディオ信号バッファ 64・・ディレクトリデータバッファ 65・・ビデオ信号デコーダ 66・・オーディオ信号デコーダ 67・・ディレクトリデコーダ 72・・ビデオ信号用タイムスタンプバッファ 73・・オーディオ信号用タイムスタンプバッファ 75・・ビデオ信号用位相同期回路 76・・オーディオ信号用位相同期回路 S1・・符号処理系からの圧縮符号化信号 S2・・非圧縮ビデオ信号 S3・・非圧縮オーディオ信号 S5・・圧縮符号化信号を含む多重化ビットストリーム S6A・・復号化非圧縮ビデオ信号 S6B・・復号化非圧縮オーディオ信号 CSPS:Constraint System Parameter Stream (拘束システムパラメータ・ストリーム) (多重化ビットストリーム) STD:System Target Decoder(システムターゲットデ
コーダ) SCR:System Clock Reference(システムクロック基
準) DTS:Decode Time Stamp ( デコーダタイムスタン
プ) PTS:Picture Time Stamp( ピクチャータイムスタン
プ) GOP:Group Of Picture( ピクチャーグループ)
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04N 5/91 5/92 7/08 7/081 7734−5C H04N 5/92 H 6942−5C 7/08 101

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】画像信号および音声信号をそれぞれ同時的
    に圧縮処理をし、これら圧縮された画像信号および音声
    信号にタイムスタンプを付加し、順次マルチプレクシン
    グしたビットストリームとして送出する符号処理系と、 該符号処理系から送出されたビットストリームを伝送ま
    たは蓄積するデータ伝送系またはデータ蓄積系と、 該データ伝送系またはデータ蓄積系からのビットストリ
    ームを入力し、デマルチプレクシングして前記圧縮画像
    信号、前記圧縮音声信号、前記タイムスタンプをバッフ
    ァリングし、該タイムスタンプを参照して前記圧縮画像
    信号および前記圧縮音声信号を同期させて復号する復号
    処理系とを有し、 前記復号処理系における前記タイムスタンプをバッファ
    リングする遅延時間を少なくとも前記画像データが正常
    にバッファリングされる許容遅延時間に設定し、前記タ
    イムスタンプを分離してバッファリングするバッファメ
    モリの容量を該遅延許容時間と少なくとも前記画像デー
    タが入力されるビットストリームの速度とで規定される
    大きさ以上の容量とする画像および音声信号処理装置。
  2. 【請求項2】画像信号および音声信号がそれぞれ同時的
    に圧縮処理され、これら圧縮された画像信号および音声
    信号にタイムスタンプが付加され、順次マルチプレクシ
    ングしたビットストリームとして入力される信号を、デ
    マルチプレクシングして前記圧縮画像信号、前記圧縮音
    声信号、前記タイムスタンプを分離してバッファリング
    し、該タイムスタンプを参照して前記圧縮画像信号およ
    び前記圧縮音声信号を同期させて復号する復号処理方法
    であって、 前記タイムスタンプをバッファリングする遅延許容時間
    を、少なくとも前記画像データが正常にバッファリング
    される遅延許容時間に設定し、 前記タイムスタンプをバッファリングするバッファメモ
    リの容量を該遅延許容時間と少なくとも前記画像データ
    が入力されるビットストリームの速度で規定される大き
    さ以上の容量とする復号処理方法。
  3. 【請求項3】画像信号および音声信号をそれぞれ同時的
    に圧縮処理をし、これら圧縮された所定数の画像信号お
    よび所定数の音声信号に、該画像信号および該音声信号
    の配置を示すポインタを含むディレクトリデータを付加
    して1組のパッケットとして順次マルチプレクシングし
    たビットストリームとして送出する符号処理系と、 該符号処理系から送出されたビットストリームを伝送ま
    たは蓄積するデータ伝送系またはデータ蓄積系と、 該データ伝送系またはデータ蓄積系からのビットストリ
    ームを前記1組のパッケットごと入力し、デマルチプレ
    クシングして前記圧縮画像信号、前記圧縮音声信号、前
    記ディレクトリデータごと独立してバッファリングし、
    該ディレクトリデータを参照して前記圧縮画像信号およ
    び前記圧縮音声信号を同期させて復号する復号処理系と
    を有する画像および音声信号処理装置。
  4. 【請求項4】同時的に画像信号および音声信号信号を圧
    縮し、 これら圧縮された所定数の画像信号と所定数の音声信号
    にそれぞれの配置を示す固定長のポインタを付加して構
    成したパッケットを組にして多重化し、順次、ビットス
    トリームとして出力する画像および音声信号符号化方
    法。
  5. 【請求項5】圧縮された所定数の画像信号および所定数
    の音声信号に、該画像信号および音声信号の配置を示す
    ポインタを含むディレクトリデータが付加された1組の
    パッケットとして順次、マルチプレクシングされたビッ
    トストリームを1組のパッケットごと入力し、 デマルチプレクシングして前記圧縮画像信号、前記圧縮
    音声信号、前記ディレクトリデータごと独立してバッフ
    ァリングし、 該ディレクトリデータを参照して前記圧縮画像信号およ
    び前記圧縮音声信号を同期させて復号する画像および音
    声信号復号方法。
  6. 【請求項6】画像信号および音声信号をそれぞれ同時的
    に圧縮し、所定数の圧縮された画像信号の最初の時刻を
    示す第1のタイムスタンプと所定数の圧縮された音声信
    号の最初の時刻を示す第2のタイムスタンプとが記述さ
    れたそれぞれのパッケットヘッダと前記所定数の圧縮画
    像信号および所定数の圧縮音声信号とをパッケットとし
    てマルチプレクシングしたビットストリームとして出力
    する符号処理系と、 該符号処理系から送出されたビットストリームを伝送ま
    たは蓄積するデータ伝送系またはデータ蓄積系と、 該データ伝送系またはデータ蓄積系からのビットストリ
    ーム形態のデータを入力し、デマルチプレクシングして
    前記圧縮画像信号、前記圧縮音声信号および前記タイム
    スタンプごと独立に、少なくとも該タイムスタンプにつ
    いて遅延時間の制限なくバッファリングし、該タイムス
    タンプを用いて復号用のクロックを生成して前記画像信
    号および前記音声信号を同期させて復号する復号処理系
    とを有する画像および音声信号処理装置。
  7. 【請求項7】画像信号および音声信号をそれぞれ同時的
    に圧縮し、 所定数の圧縮された画像信号の最初の時刻を示す第1の
    タイムスタンプと所定数の圧縮された音声信号の最初の
    時刻を示す第2のタイムスタンプが記述されたそれぞれ
    のパッケットヘッダと前記所定数の圧縮画像信号および
    所定数の圧縮音声信号とをパッケットとしてマルチプレ
    クシングしたビットストリームとして出力し、 該ビットストリーム形態のデータを入力してデマルチプ
    レクシングして前記圧縮画像信号、前記圧縮音声信号お
    よび前記タイムスタンプごと独立に、少なくとも該タイ
    ムスタンプについて遅延時間の制限なくバッファリング
    し、 該タイムスタンプを用いて復号用のクロックを生成して
    前記画像信号および前記音声信号を同期させて復号する
    画像および音声信号処理方法。
  8. 【請求項8】所定数の圧縮された画像信号と音声信号と
    がパッケットとして構成され、該画像信号の時刻を示す
    第1のタイムスタンプと該音声信号の時刻を示す第2の
    タイムスタンプが付加されてビットストリームとして入
    力されるデータを入力し、 最初の画像信号についてのタイムスタンプ、および、最
    初の音声信号についてのタイムスタンプのみ取り込み、 該それぞれのタイムスタンプを用いて復号クロックを生
    成し、 該それぞれのクロックを用いて入力した圧縮画像信号お
    よび圧縮音声信号を同期させて復号する画像および音声
    信号復号方法。
JP17052093A 1993-07-09 1993-07-09 画像および音声信号処理方法とその装置 Expired - Fee Related JP3552249B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17052093A JP3552249B2 (ja) 1993-07-09 1993-07-09 画像および音声信号処理方法とその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17052093A JP3552249B2 (ja) 1993-07-09 1993-07-09 画像および音声信号処理方法とその装置

Publications (2)

Publication Number Publication Date
JPH0730886A true JPH0730886A (ja) 1995-01-31
JP3552249B2 JP3552249B2 (ja) 2004-08-11

Family

ID=15906469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17052093A Expired - Fee Related JP3552249B2 (ja) 1993-07-09 1993-07-09 画像および音声信号処理方法とその装置

Country Status (1)

Country Link
JP (1) JP3552249B2 (ja)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09232966A (ja) * 1996-02-28 1997-09-05 Nec Corp 音声信号処理回路
US5845021A (en) * 1994-12-28 1998-12-01 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6009202A (en) * 1994-12-28 1999-12-28 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6047027A (en) * 1996-02-07 2000-04-04 Matsushita Electric Industrial Co., Ltd. Packetized data stream decoder using timing information extraction and insertion
WO2001033832A1 (fr) * 1999-10-29 2001-05-10 Fujitsu Limited Appareil de reproduction d'images et appareil d'enregistrement/reproduction d'images
CN1085008C (zh) * 1995-03-29 2002-05-15 株式会社日立制作所 多路压缩图象声音数据的解码装置、应用程序实施装置和编码化图像声音数据接收装置
KR100345488B1 (ko) * 1999-07-30 2002-07-26 엘지전자주식회사 사후 기록 오디오 데이터의 기록/재생 방법
JP2003510912A (ja) * 1999-09-21 2003-03-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クロック回復
KR100393337B1 (ko) * 1998-04-08 2003-07-31 마츠시타 덴끼 산교 가부시키가이샤 광디스크, 광디스크 기록방법과 장치, 및 광디스크재생방법과 장치
KR20040038184A (ko) * 2002-10-31 2004-05-08 엘지전자 주식회사 A/v 동기화를 위한 오디오 패킷 디코딩 방법
KR100584183B1 (ko) * 1998-07-09 2006-10-04 엘지전자 주식회사 재 기록가능 기록매체의 데이터 기록방법
JP3920769B2 (ja) * 2000-08-17 2007-05-30 株式会社日立製作所 車両用計測制御装置
US7240013B2 (en) 2002-05-04 2007-07-03 Samsung Electronics Co., Ltd. Method and apparatus for controlling buffering of audio stream
JPWO2016139808A1 (ja) * 2015-03-05 2017-06-01 三菱電機株式会社 データ処理装置及びデータ処理方法及びデータ処理プログラム
JPWO2021241111A1 (ja) * 2020-05-29 2021-12-02

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04104677A (ja) * 1990-08-24 1992-04-07 Hitachi Ltd 情報記録再生方式および装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04104677A (ja) * 1990-08-24 1992-04-07 Hitachi Ltd 情報記録再生方式および装置

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6081208A (en) * 1994-12-28 2000-06-27 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US5995667A (en) * 1994-12-28 1999-11-30 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6018594A (en) * 1994-12-28 2000-01-25 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6009202A (en) * 1994-12-28 1999-12-28 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6011867A (en) * 1994-12-28 2000-01-04 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6016363A (en) * 1994-12-28 2000-01-18 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6016364A (en) * 1994-12-28 2000-01-18 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US5845021A (en) * 1994-12-28 1998-12-01 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6021226A (en) * 1994-12-28 2000-02-01 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6044175A (en) * 1994-12-28 2000-03-28 Kabushiki Kaisha Toshiba Image information encoding/decoding system
US6047086A (en) * 1994-12-28 2000-04-04 Kabushiki Kaisha Toshiba Image information encoding/decoding system
CN1085008C (zh) * 1995-03-29 2002-05-15 株式会社日立制作所 多路压缩图象声音数据的解码装置、应用程序实施装置和编码化图像声音数据接收装置
US6047027A (en) * 1996-02-07 2000-04-04 Matsushita Electric Industrial Co., Ltd. Packetized data stream decoder using timing information extraction and insertion
JPH09232966A (ja) * 1996-02-28 1997-09-05 Nec Corp 音声信号処理回路
KR100393337B1 (ko) * 1998-04-08 2003-07-31 마츠시타 덴끼 산교 가부시키가이샤 광디스크, 광디스크 기록방법과 장치, 및 광디스크재생방법과 장치
KR100584183B1 (ko) * 1998-07-09 2006-10-04 엘지전자 주식회사 재 기록가능 기록매체의 데이터 기록방법
KR100345488B1 (ko) * 1999-07-30 2002-07-26 엘지전자주식회사 사후 기록 오디오 데이터의 기록/재생 방법
JP2003510912A (ja) * 1999-09-21 2003-03-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クロック回復
WO2001033832A1 (fr) * 1999-10-29 2001-05-10 Fujitsu Limited Appareil de reproduction d'images et appareil d'enregistrement/reproduction d'images
US6807363B1 (en) 1999-10-29 2004-10-19 Fujitsu Limited Digital moving picture data player system having a time-based access list
JP3920769B2 (ja) * 2000-08-17 2007-05-30 株式会社日立製作所 車両用計測制御装置
US7240013B2 (en) 2002-05-04 2007-07-03 Samsung Electronics Co., Ltd. Method and apparatus for controlling buffering of audio stream
KR20040038184A (ko) * 2002-10-31 2004-05-08 엘지전자 주식회사 A/v 동기화를 위한 오디오 패킷 디코딩 방법
JPWO2016139808A1 (ja) * 2015-03-05 2017-06-01 三菱電機株式会社 データ処理装置及びデータ処理方法及びデータ処理プログラム
JPWO2021241111A1 (ja) * 2020-05-29 2021-12-02

Also Published As

Publication number Publication date
JP3552249B2 (ja) 2004-08-11

Similar Documents

Publication Publication Date Title
JP3605826B2 (ja) ビデオおよびオーディオ信号処理システムにおける補助情報のための合理的入力バッファの回路配列
US7058129B2 (en) Decoding method and apparatus and recording method and apparatus for moving picture data
US5905768A (en) MPEG audio synchronization system using subframe skip and repeat
RU2273111C2 (ru) Способ преобразования пакетизированного потока информационных сигналов в поток информационных сигналов с временными отметками и наоборот
US7292610B2 (en) Multiplexed data producing apparatus, encoded data reproducing apparatus, clock conversion apparatus, encoded data recording medium, encoded data transmission medium, multiplexed data producing method, encoded data reproducing method, and clock conversion method
US5481543A (en) Rational input buffer arrangements for auxiliary information in video and audio signal processing systems
US7359006B1 (en) Audio module supporting audio signature
JP3552249B2 (ja) 画像および音声信号処理方法とその装置
JP3438223B2 (ja) 多重化装置および多重化方法、並びに伝送装置および伝送方法
CN100416689C (zh) 再现设备和方法以及记录介质
JP4613860B2 (ja) Mpeg符号化ストリーム復号装置
JP3404808B2 (ja) 復号方法と復号装置
RU2308098C2 (ru) Воспроизводящее устройство и способ и записывающий носитель
JPH11205789A (ja) Mpeg2トランスポートストリーム伝送レート変換装 置
JPH09312656A (ja) 伝送装置およびその方法
JP3536493B2 (ja) オーサリングシステム,このシステムで使用される符号化装置及び多重化装置並びに多重ビットストリームを生成する方法
RU2401465C2 (ru) Устройство и способ воспроизведения
Lu et al. Mechanisms of MPEG stream synchronization
JPH099215A (ja) データ多重方法、データ伝送方法、及び多重データ復号方法、多重データ復号装置
KR0181081B1 (ko) 시스템 복호화기의 이에스씨알 재생장치
JP2001309306A (ja) 再生装置および方法、並びに記録媒体
JPH0832621A (ja) 画像音声符号化データ伝送装置
JPH09270994A (ja) ストリーム制御方式
JPH10126274A (ja) データ復号方法及びデータ復号装置、クロック変換方法及びクロック変換装置
JP2005198347A (ja) アフレコ信号生成方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040322

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040426

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090514

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100514

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110514

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120514

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees