JPH0863890A - 多重化データの復号装置 - Google Patents
多重化データの復号装置Info
- Publication number
- JPH0863890A JPH0863890A JP20233794A JP20233794A JPH0863890A JP H0863890 A JPH0863890 A JP H0863890A JP 20233794 A JP20233794 A JP 20233794A JP 20233794 A JP20233794 A JP 20233794A JP H0863890 A JPH0863890 A JP H0863890A
- Authority
- JP
- Japan
- Prior art keywords
- video
- buffer
- audio
- signal
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
号の同期補償を簡単な構成で実現できる復号装置を得
る。 【構成】 光ディスクから読みだされた符号化多重デー
タをバッファ2に一時的に蓄える。蓄えられたデータは
符号化映像信号と符号化音声信号に分離されて、それぞ
れ映像バッファ5、音声バッファ9に蓄積されて復号さ
れる。マイクロコンピュータ13は音声バッファ9の蓄
積量を監視している。その蓄積量が第一のレベル以上に
なると、符号化音声信号が映像信号に対して遅延してい
ると判別し、第二のレベル以下になると符号化音声信号
が映像信号に対して先行していることを判別する。判別
後、マイクロコンピュータ13は音声バッファ9の蓄積
量が第三のレベルになるように、それぞれのバッファの
出力を制御する。
Description
ータが時系列的に多重化されたデータを復号する復号装
置に関するものである。
は、放送、通信、情報機器等の多くのメディアで利用さ
れている。特にAV機器の分野では、MPEG(Mov
ingPictures Expert Group)
を利用して、一枚のCD(Compact Disk)
に最大74分のディジタル化した音声と動画を記録でき
る「ビデオCD」が規格化され、普及しつつある。
マットを示す図である。ビデオCDのデータは、一つの
パックの中に一つのパケットを含む構成になっている。
1パックは1セクタ中の2324バイトで構成されてい
る。映像データのフォーマットと音声データのフォーマ
ットは基本的には同じであるが、音声データの場合、デ
ータ部として2279バイト、ゼロを記録する余剰の2
0バイトを付加して映像データと同じ2324バイトを
1パックとしている。なお、個々のヘッダについてはそ
の説明を省略する。
列多重記録しており、平均すると6対1の割合で配置さ
れている。
Rとは異なり、映像と音声データが時系列に並ぶため、
これらの同期を行なうための時間情報(タイムスタン
プ)が必要になる。例えばMPEGではこれを3つの時
間情報で制御を行なう。まず、パックヘッダ内にあり、
装置の基準クロックであるSCR(System Cl
ock Reference)、次にパケットヘッダ内
にあり、SCRの基準に従って、映像と音声データのデ
コードの開始時刻を提示するDTS(Decodinn
g Time Stamp)、そして同じくパケットヘ
ッダ内にあり、デコード結果を提示するPTS(pre
sentetion Time Stamp)がある。
多重データのヘッダ構成を示す図であり、記録媒体であ
る光ディスク1から出力される符号化多重のデータは、
デマルチプレクサ部4にて映像と音声の符号化データに
分離され、それぞれ映像デコーダ部7、音声デコーダ部
11に入力される。と同時に、必要に応じて時間情報で
あるSCR、DTS、PTSを多重データから分離し、
それらの情報を用いて、映像遅延部18と音声遅延部1
9からの出力信号の出力時刻をタイムスタンプ制御部2
0にて決定する。
は、タイムスタンプの精度で決まることになり、高い精
度で同期を行なうことが可能であるが、タイムスタンプ
を挿入したり、分離、検出する装置等が必要になり、構
成が複雑で装置が高価になるといった問題点があった。
めになされたもので、タイムスタンプが不用で、かつ、
簡単な構成で映像と音声の同期制御を行なう多重化デー
タの復号化装置を得ることを目的とする。
多重化データの復号装置は、符号化多重信号を一時的に
蓄積する第一のバッファ手段と、符号化多重信号から分
離された符号化映像信号を一時的に蓄える映像バッファ
手段と、前記分離手段から分離された符号化音声信号を
一時的に蓄える音声バッファ手段と、前記映像バッファ
手段の符号化映像信号の蓄積量が所定の範囲内になるよ
うに、前記第一のバッファ手段の出力を制御するバッフ
ァ制御手段を備えたものである。
タの復号装置は、符号化多重信号から符号化映像信号の
符号化レートを分離する分離手段と、前記分離された符
号化映像レートに従って前記映像バッファ手段の所定の
範囲を設定する手段を備えたものである。
タの復号装置は、符号化多重信号を一時的に蓄積する第
一のバッファ手段と、前記分離手段によって分離された
符号化映像信号を一時的に蓄える映像バッファ手段と、
前記分離手段から分離された符号化音声信号を一時的に
蓄える音声バッファ手段と、音声バッファ手段の符号化
音声信号の蓄積量が所定の第一のレベル以上になったこ
とを検知する第一の検知手段と、前記検知手段の結果に
基づいて符号化映像信号の欠落を判別する第一の判別手
段と、音声バッファ手段の符号化音声信号の蓄積量が所
定の第二のレベル以下になったことを検知する第二の検
知手段と、前記検知手段の結果に基づいて符号化音声信
号の欠落を判別する第二の判別手段を備え、前記検知手
段の検知レベルが、100%>第一のレベル>第三のレ
ベル>第二のレベル>0%であり、かつ、第三のレベル
は符号化映像信号が欠落していないときの前記音声バッ
ファ手段の蓄積量と概略等しいレベルであり、前記第一
の判別手段が符号化映像信号の欠落、あるいは、前記第
二の判別手段が符号化音声信号の欠落を判別したときに
は、音声バッファの蓄積量を概略第三のレベルに近づけ
るように、前記第一のバッファ手段と映像バッファ手段
と音声バッファ手段の出力を制御する制御手段を備えた
ものである。
タの復号装置は、前記第一のレベル、第三のレベルを前
記分レート離手段によって分離された符号化映像信号の
符号化レートに従って設定する手段を備えたものであ
る。
置においては、映像バッファの蓄積量が所定の範囲内に
納まるように第一のバッファの出力を制御することで、
映像バッファと音声バッファの蓄積量を安定に保つこと
ができるようになり、バッファ制御が容易になる。
号装置においては、映像バッファの所定の範囲を、映像
信号の符号化レートによって可変にすることで、バッフ
ァ制御が映像符号化レートに従って細かく制御すること
ができる。
号装置においては、音声バッファの蓄積量が所定の第一
のレベル以上になったことを検知、あるいは、音声バッ
ファの蓄積量が所定の第二のレベル以下になったことを
検知することで、符号化音声信号の欠落を判別し、映像
信号と映像信号との同期ずれを検出することができとと
もに、音声バッファの蓄積量が第一のレベル以上、ある
いは第二のレベル以下になったときには、その蓄積量を
概略第三のレベルに近づけるように、第一のバッファと
映像バッファと音声バッファの出力を制御するようする
ようにもしたので、大幅な符号化信号の欠落によって生
じる不平衡状態を正常な状態に戻して、映像信号と音声
信号の同期のずれを少なくすることができる。
号装置においては、音声バッファの蓄積量の第一のレベ
ルと第二のレベルを、映像信号の符号化レートによって
可変にするようにしたので、音声バッファの蓄積量の上
下の裕度をほば同じに保てるようになり、大幅な符号化
信号の欠落によって生じる不平衡状態を正常な状態に戻
して、映像信号と音声信号の同期のずれを少なくするこ
とができる。
の復号装置の構成を示すブロック図である。図におい
て、1は符号化映像データと音声データが時系列多重化
されて記録されている光ディスク、2は光ディスクから
のデータを蓄えるバッファ部、3はバッファ部2の出力
信号を制御するバッファ切換部、4は光ディスクに記録
されている符号化多重データから符号化映像データと符
号化音声データとを分離して出力するデマルチプレクサ
部、5は符号化映像データを蓄える映像バッファ部、6
は映像バッファ5の出力信号を制御する映像切換部、7
は符号化映像データを復号する映像デコーダ部、8は復
号された映像データをアナログ信号に変換する映像D/
A部、9は符号化音声データを蓄える音声バッファ部、
10は音声バッファ9の出力信号を制御する音声切換
部、11は符号化音声データを復号する音声デコーダ
部、12は復号された音声データをアナログ信号に変換
する音声D/A部、13は音声バッファ部9の蓄積量を
監視するマイクロコンピュータである。
図を用いてアナログ信号である映像信号と音声信号を符
号化多重データに変換する方法について説明する。
号の先頭のピクチャを1ピクチャとし、12個のピクチ
ャを1つの単位(GOP:Group of Pict
ures)として切り分ける。このピクチャとは、およ
そ1/30sごとの映像信号のことである。よくVTR
やTVでは、フレームという言葉を使用するが、後述す
る音声でのフレームと区別するため、以下ピクチャを用
いることとする。1GOPは時間にして約0.4sであ
る。次に、アナログ音声信号を、映像信号の先頭ピクチ
ャと時間的に一致した箇所から1フレームごとに分け
る。1フレームとは、48kHzサンプリングで115
2サンプル分のことを表わし、1フレームは時間にして
およそ24msである。
で符号化する。すなわち、1GOPは225000バイ
トである。なお、符号化した絵柄によっては1GOP当
りの符号バイト数は多少変動するので、この22500
0バイトは平均の値としている。さらに1GOPである
符号映像データは、32768バイトを1単位としてV
1,V2,V3・・・と切り分ける。そして個々に順次
パケット化を行い、余りのV7の28392バイトもこ
のままパケット化する。この結果、1GOP分のデータ
が7個のパケットで構成されることになる。その後、こ
れらのパケットにパックヘッダを設けてパック化する。
従来例と同様に1パック内に1パケットの構成になる。
で符号化する。すなわち、1フレームは768バイトで
ある。符号音声データは概略1GOP分に相当する時間
長のフレーム数を1単位としてパケット化するが、端数
についてはそのパケットには含めず、次のパケットに入
れる。図2によれば、1フレームから16フレームの1
6個のフレームを1パケット(A1)とし、端数である
17フレームから33フレームの17個のフレームを次
の1パケット(A2)、34フレームから50フレーム
からの17個のフレームを1パケット(A3)、以後同
様に順次パケット化を行なう。映像データと同様に、こ
れらのパケットにもパックヘッダを設けてパック化す
る。
長の符号化音声データを含むパックの後に、概略、同一
時刻、同一時間長に相当する1GOP分の符号化映像デ
ータを構成する数パックを並べるようにする。つまり、
A1,V1,V2,V3,V4,V5,V6,V7,A
2,V8・・・V14,A3,V15・・・となる。こ
のような手順で構成された符号化多重データを図3に示
す。このような構成では、先頭の1GOP分の時間長の
映像(V1からV7)とオーディオデータ(A1)は同
期がとれているが、2番目以降の1GOP分の時間長の
映像(V8からV14)と音声データ(A3)は、最大
1フレーム(約24ms)の時間差だけ音声データが遅
延して多重化されている。人間の耳の検知限は20ms
の先行ないし、50msの遅延とされているので、最大
1フレームの音声信号の遅延は問題のない範囲であり、
この1GOPの単位で音声と映像の同期が取れている。
成を示す。映像、音声とも同じヘッダ構成になるが、1
パックのデータ量は異なる。なお、SCRとPTSの領
域がヘッダの中に設けられているが、後述する理由から
省略しても良いし、あるいは意味のない値(例えばオー
ル0)としても良い。
光ディスク1に記録されている。図5はマイクロコンピ
ュータ13の処理を示すフローチャートである。以下、
このフローチャートを用いて動作を説明する。光ディス
ク1から読み出された符号化多重データは、バッファ部
2に一時蓄えられる。ある程度蓄えられると、マイクロ
コンピュータ13はバッファ切換部3を閉じ、映像切換
部6と音声切換部10を開いて符号化映像データ待ちの
状態になる(ステップ100)。読みだされた符号化多
重データは、出力レートを制御されながらバッファ切換
部3を通ってデマルチプレクサ部4に入力される。デマ
ルチプレクサ部の内部構成を図6に、その動作を図7に
示す。分離制御部14は符号化多重データaのパケット
ヘッダの情報を読み込み、パケットヘッダ以降のデータ
が符号化映像データのときのみ切り換え信号bを用いて
第一の切り換え部15を閉じる。その他のデータでは第
一の切換部15を開く。一方、符号化音声データのとき
は、そのデータのときのみ第二の切換部16を閉じ、そ
れ以外のデータのときは、第二の切換部16を開く。こ
の結果、出力eには符号化映像データのみの不連続なデ
ータが出力され、後段の映像バッファ部5に入力され
る。出力fには符号化音声データのみの不連続なデータ
が出力され、後段の音声バッファ部9に入力される。映
像と音声バッファは不連続な入力データを連続なデータ
として後段のデコーダ部に出力するためのバッファであ
る。
離制御部14は例えば、パケットヘッダ内にあるSCR
を分離したり、後述する符号化映像レート信号を分離す
るための信号を作成し、分離されたデータをgとして出
力する。
で構成されているとすれば、4.5Mbpsの符号化レ
ートで約0.9s(2GOP強)分の符号化映像データ
を蓄えることができる。一方、音声バッファ部9は約4
00kビット(64フレーム分)のRAMで構成されて
いるとすれば、256kbpsの符号化レートで約1.
5s分の符号化音声データを蓄えることができる。
蓄積量の変化を図8に示す。なお、符号化音声データ
は、16フレーム(983.04kビット)、あるい1
7フレーム(104.448kビット)のデータがパケ
ットされているが、図8以降では計算の簡略化のため
に、1パケットに0.4s分のデータ、すなわち10
2.4kビットのデータをパケットしているものとす
る。また、映像バッファ部5の蓄積量の変化はピクチャ
ーごとに変動するが、ここでは説明の簡略化のために、
平均の変化値を用いるものとする。
入力レート(以下、システムレートという)が6.5M
bpsの場合、ステップ100の状態では、音声バッフ
ァ部9には符号化音声データが6.5Mbpsで蓄積す
る。すなわち、1GOP分の102.4kビットのデー
タがおよそ15.75msで蓄積される。その間は映像
バッファ部5には符号化映像データは蓄積されない。そ
して、符号化映像データも6.5Mbpsで蓄積され、
1GOPである1.8Mビットのデータがおよそ280
msで蓄積される。その間は音声バッファ部9には符号
化音声データは蓄積されない。
ファ5の蓄積量を監視している。ステップ101で映像
バッファ部5の符号化映像データの蓄積量が、例えば5
0%になるまで待つものとする。映像バッファが50%
に達すると、映像切換部6を閉じて符号化映像データを
映像バッファ部5から出力する(ステップ102)。こ
のとき音声バッファには2GOP分の時間長に相当する
2パケット分の33フレーム(音声バッファの全容量の
およそ50%)のデータが蓄積されている。ステップ1
02で音声切換部10も閉じることによって、蓄積され
た符号化音声データを音声バッファ部9から出力する。
化映像データを出力するタイミングと、映像デコーダ部
7で復号動作を行なうタイミングは異なる。ここでは説
明の簡略化のために、映像切換部6を閉じるという動作
だけで、映像バッファ部5から符号化映像データを出力
する、あるいは映像デコーダ7において復号を行なうこ
との両方の意味を表わすものとする。なお、このことは
音声切換部10についても同様である。
/A部8にてアナログ映像信号に変換されて出力され
る。また、復号された音声データは、音声D/A部12
にてアナログ映像信号に変換されて出力される。
像バッファ部5の蓄積量は平均2.0Mbpsで増大
し、符号化映像データが入力されないときは、その蓄積
量は4Mbpsで減少する。しかし、符号化映像レート
よりシステムレートが高いために、映像切換部6が閉じ
た状態のままでは、映像バッファ部5はオーバーフロー
を引き起こす。オーバーフローを起こすと、映像デコー
ダ7で復号動作ができなくなる。これを防ぐために、ス
テップ103で映像バッファ部5の蓄積量が例えば75
%以上になると、バッファ切換部3を開いて映像バッフ
ァ部5へのデータ入力を停止する(ステップ104)。
入力を停止すると、映像バッファ部5の蓄積量は平均
4.5Mbpsで減少し続け、このままではアンダーフ
ローが生じる。ステップ105で映像バッファ部5の蓄
積量が例えば50%以下になると、バッファ切換部3を
閉じて映像バッファへのデータ入力を再び行なう(ステ
ップ106)。このような一連の動作により、映像バッ
ファ部5がオーバーフローもアンダーフローを起こすこ
となく、映像デコーダ部7に連続した符号化映像データ
を供給し、安定した復号動作を行なうことができる。
声バッファ部9の蓄積量は平均6.244Mbpsで増
大する。そして、符号化音声データが入力されないとき
は、その蓄積量は256kbpsで減少する。音声バッ
ファについては、映像バッファに比べて2倍程度の時間
長のデータを蓄えることができる。映像バッファの蓄積
量を2Mビットから3Mビットの範囲になるように制御
することで、音声バッファ部9の蓄積量を100kビッ
トから300kビットの範囲にすることができる。
ーダ部11に連続した符号化音声データを供給し、安定
した復号動作を行なうことができる。
れば、概略、同一時刻、同一時間長に相当する単位で映
像と音声データを多重化し、しかも、映像と音声のそれ
ぞれの先頭のパックに含まれるデータは必ず同一時刻に
なるように符号化している。このような符号化の場合、
符号化映像データが映像バッファ部5から出力して、映
像デコーダ部7にて復号され、そしてアナログ映像信号
として映像D/A部8から出力される時間と、符号化音
声データが音声バッファ部9から出力して、音声デコー
ダ部11にて復号され、そしてアナログ音声信号として
音声D/A部11から出力される時間との差が数ms以
内であれば、ステップ102にて、映像切換部6と音声
切換部10をほぼ同時に閉じてそれぞれのバッファから
符号化データを出力してほぼ同時に復号動作を行なって
も実用上問題はない。もし、その時間差が数十msなら
ば、その時間差だけ映像切換部6と音声切換部10とを
閉じる時間をマイクロコンピュータ13にて制御すれ
ば、先頭のパックに符号化されている映像と音声のデー
タは、同一時刻にそれぞれのD/Aから出力され、以後
同期動作を行なわなくとも映像と音声の同期が可能であ
る。
GOP分の時間長の映像と音声の多重データは、最大1
フレーム(約24ms)の時間差だけ音声データが遅延
して多重化されている。人間の耳の検知限は20msの
先行ないし、50msの遅延とされいるので、最大1フ
レームの音声信号の遅延は問題のない範囲であり、この
1GOPの時間長の単位で音声と映像の同期が取れてい
る。このことは、図5のフローチャートを用いて、途中
からの符号化音声データから復号動作を行なっても、必
要十分な映像と音声データの同期が取れることになる。
時間長に相当する単位で多重化したデータをそれぞれの
バッファに入力して、映像バッファ部5のみを所定の範
囲内になるように制御するようにしたので、音声バッフ
ァ部9をオーバーフロー、アンダーフローしないように
することが可能である。
トを4.5Mbpsで、映像バッファ部5の蓄積量の所
定範囲が、それぞれ上限値3Mビット、下限値2Mビッ
トの場合について説明した。しかし、システムレートが
6.5Mbpsのままで、符号化映像レートが小さくな
った場合は、音声バッファの蓄積量にアンバランスを生
じる。図9に符号化映像レートが2.0Mbpsのとき
の映像バッファ音声バッファの蓄積量の変化を示す。こ
の場合、符号化音声データ1GOP分は102.4kビ
ット、符号化映像データ1GOP分は0.8Mビットに
なる。映像切換部6、音声切換部10を閉じた後、復号
を開始して、映像バッファ部5の蓄積量が上限値である
3Mビットになるまでに、音声バッファ部9には5個の
パケットの符号化音声データが蓄積されてしまい、音声
バッファ部9の蓄積容量を大きくできない場合は、オー
バーフローを引き起こす。
ータ13は符号化映像レートを監視し、得られる符号化
映像レート値に従って最適な範囲である上限値と下限値
を設定する。たとえば、得られる符号化映像レートが2
Mbpsの場合に、映像バッファ部5の蓄積量の上限値
を2.0Mビット、下限値を1.0Mビットにしたとき
のそれぞれのバッファの変化を図10に示す。映像切換
部6、音声切換部10を閉じた後、復号を開始して、映
像バッファ部5の蓄積量が上限値である2Mビットにな
るまでに、音声バッファ部9には4個のパケットの符号
化音声データが蓄積され、5個目のパケットが入力され
るまでにバッファ切換部3が開くので、音声バッファ部
9はオーバーフローが生じない。
て、可変になるレート(この場合では映像符号化レー
ト)を監視し、音声バッファ部9の蓄積量がオーバフロ
ーやアンダーフローしないように、符号化映像レート値
に合わせて映像バッファ部5の上限値と下限値を設定す
るようにしたので、最適な映像バッファと音声バッファ
の制御を行なうことができる。
多重データが再生されて、映像バッファ5の制御だけで
映像と音声の同期を補償する場合について説明した。し
かしながら、光ディスクから映像バッファと音声バッフ
ァにデータが到達するまでに何らかの理由によりデータ
が欠落した場合は、厳密な意味で映像と音声の同期が補
償できなくなってしまう。例えば、数バイトの欠落が符
号化映像データや音声データの中で生じた場合、映像と
音声との同期という点では人間の検知限以下であり、ほ
とんど無視できるが、パックヘッダやパケットヘッダの
中で数バイト欠落した場合では、デマルチプレクサ4に
て正常な分離動作が行なわれず、デマルチプレクサ4の
出力データはパック単位で符号化データが欠落し、パッ
ク単位での同期ずれを生じる。
像レート4.5Mbps、符号化音声レート256kb
psの場合、前述したように、映像バッファ部5の蓄積
量が50%で復号動作を開始(ステップ102)し、そ
の後映像バッファ部5がオーバーフローやアンダーフロ
ーしないように制御(ステップ103からステップ10
6)されている範囲では、音声バッファ部9の蓄積量は
概ね50%を中心にして100kビットから300Kビ
ットの範囲で変動している。1GOP分の符号化映像デ
ータが欠落した場合、1パケットの符号化音声データが
余分に蓄積され、蓄積量が300Mビットを上回る。こ
のため、音声は約0.4s分遅れて出力される。符号化
音声データが1パケット欠落した場合は音声バッファ部
9の蓄積量は100kビットを下回る。このため、音声
は約0.4s早く出力される。
を、図11のフローチャートを用いて説明する。ステッ
プ110以降では、大幅な同期ずれを補償するために音
声バッファ9の蓄積量を監視している。ステップ110
で音声バッファ部9の蓄積量が例えば80%(およそ3
20kビット)を越えた場合、まずステップ111でバ
ッファ切換部3の状態を記憶する。その後、ステップ1
12でバッファ切換部3を強制的に開いてバッファ部2
から多重符号化データを出力しないようすると同時に、
映像切換部6を開いて映像バッファ部5から符号化映像
データの出力しないようにして映像デコーダ部7の復号
動作を停止する。この状態では映像バッファ部5の蓄積
量は変わらず、音声バッファ部9の蓄積量のみが音声デ
コーダ部11の復号動作のために減少していく。
ているときの音声バッファ部9の蓄積量はおよそ50%
である。そこで、ステップ114にて減少している音声
バッファ部9の蓄積量が50%になると、同期ずれが小
さくなったとみなして映像切換部6を閉じて映像デコー
ダ7の復号動作を開始する。その後、バッファ切換部3
の状態をステップ111で記憶した状態に戻す。
量が20%(およそ80kビット)以下になった場合、
まずステップ121でバッファ切換部3の状態を記憶す
る。その後、ステップ122でバッファ切換部3を強制
的に閉じてバッファ部2から符号化多重データを出力す
る、と同時に音声切換部10を開いて音声バッファ部9
から復号音声データを出力しないようにして音声データ
の復号動作を停止する(ステップ123)。この状態で
は、映像デコーダ部7は連続して復号動作を行い、映像
バッファ部5の蓄積量は正常に変動しているが、音声バ
ッファ部9の蓄積量は増加していく
ファ部9の蓄積量が50%になると、同期ずれが小さく
なったとみなして音声切換部10を閉じて音声デコーダ
部11の復号動作を開始する(ステップ125)。その
後、バッファ切換部3の状態をステップ121で記憶し
た状態に戻して、一連の同期合わせの動作を終了する。
タ、あるいは符号化音声データにデータの欠落が発生し
て大幅な同期ずれが生じても、同期ずれを小さくするこ
とができる。
ートを4.5Mbpsとしているが、例えば、3.0M
bps、音声の符号化レートが256kbpsの場合を
考える。この場合、符号化音声データ1GOP分は10
2.4kビット、符号化映像データ1GOP分は1.2
Mビットになる。このとき、映像符号化データが映像バ
ッファ部5の75%蓄積されたときには、音声バッファ
部9の蓄積量は300kビットを上回る。以降、音声バ
ッファ部9の蓄積量は150kビットから350kビッ
トの範囲で変化する。このことは、同じ蓄積量を持つバ
ッファでも、システムレート、符号化映像レート、符号
化音声レート、そして、パケット化されるデータ量によ
って、蓄積されるデータ量の割合が変わることを意味す
る。符号化映像レートが小さくなると、音声バッファ部
9の蓄積量は増大する。符号化レートが大きくなると、
音声バッファ部9の蓄積量は減少する。そして、符号化
映像データと符号化音声データが欠落したときの音声バ
ッファ蓄積量の上下の裕度に、アンバランスを生じる。
ータ13にて、可変になるレート(この場合では映像符
号化レート)を監視し、それぞれのレート値で音声バッ
ファの蓄積量を最適な裕度を設定すればよい。この場合
であれば、ステップ110の蓄積量の上限レベル値を例
えば90%(およそ360kビット)、ステップ120
の蓄積量の下限レベル値を例えば40%(およそ160
kビット)とすれば、同様な裕度を確保することができ
る。そして、ステップ114、124で設定するレベル
値を、蓄積量の上限レベル値と下限レベル値とのほぼ半
分の60%程度(およそ240kビット)に設定すれ
ば、符号化映像データ、あるいは符号化音声データが欠
落しても、同期ずれを小さくすることができる。
は、映像バッファの蓄積量の上限値と下限値を、それぞ
れ3Mビット、2Mビットとしているが、例えば、映像
符号化レート3MbpsN場合は、映像バッファ部5の
蓄積量の上限値を2.5Mビット、下限値を1.5Mビ
ットに設定するものとする。このようにすると、符号化
映像データを蓄積し始めて、上限値である2.5Mビッ
トになるまでに、音声バッファ9の中に3個のパケット
のデータしか蓄積されなくなる。図13に示すように、
音声バッファ部9の蓄積量の裕度は上下ともほぼ同じに
なり、100kビットから300kビットの範囲で変化
する。従って、ステップ110の蓄積量の上限レベル値
は例えば80%(およそ320kビット)、ステップ1
20の蓄積量の下限レベル値は例えば20%(およそ8
0kビット)とし、ステップ114、124で設定する
レベル値は蓄積量の上限レベル値と下限レベル値とのほ
ぼ半分の50%程度(およそ200kビット)の一定に
しておけばよい。
ある上限値と下限値を、符号化映像レートに合わせて設
定するようしたので、音声バッファの蓄積量の上限値と
下限値は一定のままで、映像と音声の同期補償を簡単に
行なうことができる。
トの値はそれぞれのデータの先頭にヘッダという形で挿
入されている場合が多いので、デマルチプレクサ部4内
の切換部17にてそのレート情報を抜き出し、マイクロ
コンピュータ13にてその値を監視すればよい。
像データと符号化音声データの同期ずれを補償する構成
について説明したが、記録されるデータはこれに限るも
のではない。例えば、様々な楽器からの音楽信号や、ボ
ーカルの音声信号をミキシング記録して、同期再生して
も良い。
光ディスクから読み出すよう構成した場合について説明
したが、これに限るものではない。例えば、ディスクア
レイに記録されているものを読みだしても良いし、ケー
ブルテレビ等の放送から読みだしても良い。
レベルを符号化映像レートの合わせて設定する場合につ
いて説明したが、例えば符号化音声レートでもよく、こ
れに限るものではない。
からの分離動作をマイクロコンピュータの外部のデマル
チプレクサ部で行なう場合について説明したが、同一の
マイクロコンピュータ内で分離動作を行なっても良い。
多重化データの復号装置によれば、映像バッファの蓄積
量が所定の範囲内に納まるように第一のバッファの出力
を制御するように構成したので、容易なバッファ制御で
映像バッファと音声バッファの蓄積量を安定に保つこと
ができる効果がある。
タの復号装置によれば、映像バッファの所定の範囲を、
映像信号の符号化レートによって可変にするように構成
したので、バッファ制御が映像符号化レートに従って細
かく制御することができる効果がある。
タの復号装置によれば、音声バッファの蓄積量が所定の
第一のレベル以上になったことを検知、または、所定の
第二のレベル以下になったことを検知するように構成し
たので、符号化音声信号の欠落を判別するように構成し
たので、符号化映像信号の欠落を判別し、さらに、音声
バッファの蓄積量が第一のレベル以上、あるいは第三の
レベル以下になったときには、その蓄積量を概略第二の
レベルに近づけるように、第一のバッファと映像バッフ
ァと音声バッファの出力を制御するように構成したの
で、大幅な符号化信号の欠落によって生じる不平衡状態
を正常な状態に戻して、映像信号と音声信号の同期のず
れを少なくする効果がある。
タの復号装置によれば、音声バッファの蓄積量の第一の
レベルと第二のレベルを、映像信号の符号化レートによ
って可変にするようにしたので、音声バッファの蓄積量
の上下の裕度をほぼ同じに保てるようになり、大幅な符
号化信号の欠落によって生じる不平衡状態を正常な状態
に戻して、映像信号と音声信号の同期のずれを少なくす
る効果がある。
装置を示すブロック図である。
る。
示す図である。
構成を示す図である。
ートである。
る。
る。
示す図である。
示す図である。
を示す図である。
の同期ずれを補償するフローチャートである。
を示す図である。
を示す図である。
示す図である。
す図である。
部、4 デマルチプレクサ部、5 映像バッファ部、6
映像切換部、7 映像デコーダ部、9 音声バッファ
部、10 音声切換部、11 音声デコーダ部、13
マイクロコンピュ
Claims (4)
- 【請求項1】 符号化多重信号から符号化映像信号と符
号化音声信号とを分離する分離手段と、前記分離された
符号化映像信号を復号する映像復号手段と、前記分離さ
れた符号化音声信号を復号する音声復号手段とを備えた
多重化データの復号装置において、再生される符号化多
重信号を一時的に蓄積する第一のバッファ手段と、前記
分離手段によって分離された符号化映像信号を一時的に
蓄える映像バッファ手段と、前記分離手段から分離され
た符号化音声信号を一時的に蓄える音声バッファ手段
と、前記映像バッファ手段の符号化映像信号の蓄積量が
所定の範囲内になるように、前記第一のバッファ手段の
出力を制御するバッファ制御手段を備えたことを特徴と
する多重化データの復号装置。 - 【請求項2】 前記符号化多重信号から符号化映像信号
の符号化レートを分離する分離手段と、前記分離された
符号化映像レートに従って前記映像バッファ手段の所定
の範囲を設定する手段を備えたことを特徴とする請求項
1記載の多重化データの復号装置。 - 【請求項3】 符号化多重信号から符号化映像信号と符
号化音声信号とを分離するレート信号分離手段と、前記
分離された符号化映像信号を復号する映像復号手段と、
前記分離された符号化音声信号を復号する音声復号手段
とを備えた多重化データの復号装置において、再生され
る符号化多重信号を一時的に蓄積する第一のバッファ手
段と、前記分離手段によって分離された符号化映像信号
を一時的に蓄える映像バッファ手段と、前記分離手段か
ら分離された符号化音声信号を一時的に蓄える音声バッ
ファ手段と、音声バッファ手段の符号化音声信号の蓄積
量が所定の第一のレベル以上になったことを検知する第
一の検知手段と、前記検知手段の結果に基づいて符号化
映像信号の欠落を判別する第一の判別手段と音声バッフ
ァ手段の符号化音声信号の蓄積量が所定の第二のレベル
以下になったことを検知する第二の検知手段と、前記検
知手段の結果に基づいて符号化音声信号の欠落を判別す
る第二の判別手段を備え、前記第一及び第二の検知手段
の検知レベルは、100%>第一のレベル>第三のレベ
ル>第二のレベル>0%であり、かつ、第三のレベルは
符号化映像信号が欠落していないときの前記音声バッフ
ァ手段の蓄積量と概略等しいレベルであり、前記第一の
判別手段が符号化映像信号の欠落、あるいは、前記第二
の判別手段が符号化音声信号の欠落を判別したときに
は、音声バッファの蓄積量を概略第三のレベルに近づけ
るように、前記第一のバッファ手段と映像バッファ手段
と音声バッファ手段の出力を制御する制御手段を備えた
ことを特徴とする多重化データの復号装置。 - 【請求項4】前記第一のレベル、第三のレベルを前記レ
ート信号分離手段によって分離された符号化映像信号の
符号化レートに従って設定する手段を備えたことを特徴
とする請求項3記載の多重化データの復号装置
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20233794A JP3622235B2 (ja) | 1994-08-26 | 1994-08-26 | 多重化データの復号装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20233794A JP3622235B2 (ja) | 1994-08-26 | 1994-08-26 | 多重化データの復号装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0863890A true JPH0863890A (ja) | 1996-03-08 |
JP3622235B2 JP3622235B2 (ja) | 2005-02-23 |
Family
ID=16455878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20233794A Expired - Fee Related JP3622235B2 (ja) | 1994-08-26 | 1994-08-26 | 多重化データの復号装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3622235B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0917147A2 (de) * | 1997-11-11 | 1999-05-19 | Deutsche Thomson-Brandt Gmbh | Verfahren und Vorrichtung zur Steuerung eines Daten-Zwischenspeichers |
JPH11187367A (ja) * | 1997-12-19 | 1999-07-09 | Nec Corp | 映像送信装置,映像受信装置及びこれらを用いた映像伝送システム |
EP0871293A3 (en) * | 1997-04-11 | 2002-05-29 | Matsushita Electric Industrial Co., Ltd. | Audio processing for audio visual equipment |
JP2002165148A (ja) * | 2000-11-29 | 2002-06-07 | Sony Corp | データ処理装置および方法、並びに記録媒体 |
US6584125B1 (en) | 1997-12-22 | 2003-06-24 | Nec Corporation | Coding/decoding apparatus, coding/decoding system and multiplexed bit stream |
EP1330071A2 (fr) * | 2002-01-17 | 2003-07-23 | Alcatel | Système de gestion de réseau ou de services pour la détermination de la synchronisation entre deux flots de paquets |
JP2006340102A (ja) * | 2005-06-02 | 2006-12-14 | Nec Electronics Corp | 同期再生装置および同期再生方法 |
JP2010051002A (ja) * | 2009-10-19 | 2010-03-04 | Hitachi Ltd | ビデオ・オーディオデータの再生復号方法 |
KR100984818B1 (ko) * | 2002-11-07 | 2010-10-05 | 톰슨 라이센싱 | 버퍼 연산을 사용하는 디지털 환경에서 오디오와 비디오간의 립싱크를 결정하기 위한 방법 및 시스템 |
-
1994
- 1994-08-26 JP JP20233794A patent/JP3622235B2/ja not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0871293A3 (en) * | 1997-04-11 | 2002-05-29 | Matsushita Electric Industrial Co., Ltd. | Audio processing for audio visual equipment |
EP0917147A3 (de) * | 1997-11-11 | 1999-12-22 | Deutsche Thomson-Brandt Gmbh | Verfahren und Vorrichtung zur Steuerung eines Daten-Zwischenspeichers |
EP0917147A2 (de) * | 1997-11-11 | 1999-05-19 | Deutsche Thomson-Brandt Gmbh | Verfahren und Vorrichtung zur Steuerung eines Daten-Zwischenspeichers |
JPH11187367A (ja) * | 1997-12-19 | 1999-07-09 | Nec Corp | 映像送信装置,映像受信装置及びこれらを用いた映像伝送システム |
US6584125B1 (en) | 1997-12-22 | 2003-06-24 | Nec Corporation | Coding/decoding apparatus, coding/decoding system and multiplexed bit stream |
US7933949B2 (en) | 2000-11-29 | 2011-04-26 | Sony Corporation | Data processing apparatus which prevents data overflow and underflow |
JP2002165148A (ja) * | 2000-11-29 | 2002-06-07 | Sony Corp | データ処理装置および方法、並びに記録媒体 |
EP1330071A2 (fr) * | 2002-01-17 | 2003-07-23 | Alcatel | Système de gestion de réseau ou de services pour la détermination de la synchronisation entre deux flots de paquets |
EP1330071A3 (fr) * | 2002-01-17 | 2003-11-12 | Alcatel | Système de gestion de réseau ou de services pour la détermination de la synchronisation entre deux flots de paquets |
KR100984818B1 (ko) * | 2002-11-07 | 2010-10-05 | 톰슨 라이센싱 | 버퍼 연산을 사용하는 디지털 환경에서 오디오와 비디오간의 립싱크를 결정하기 위한 방법 및 시스템 |
JP2006340102A (ja) * | 2005-06-02 | 2006-12-14 | Nec Electronics Corp | 同期再生装置および同期再生方法 |
JP2010051002A (ja) * | 2009-10-19 | 2010-03-04 | Hitachi Ltd | ビデオ・オーディオデータの再生復号方法 |
JP4636203B2 (ja) * | 2009-10-19 | 2011-02-23 | 株式会社日立製作所 | ビデオ・オーディオデータの再生復号方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3622235B2 (ja) | 2005-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100290331B1 (ko) | 오디오-비디오 신호의 동기 재생 장치 | |
US6078725A (en) | Apparatus for a synchronized playback of audio-video signals | |
US6163647A (en) | Apparatus for synchronized playback of audio-video signals | |
EP0783824B1 (en) | Programmable audio-video synchronization method and apparatus for multimedia systems | |
EP0668700B1 (en) | Audio/video decoding system and method | |
JP3264290B2 (ja) | 復号方法および復号装置 | |
EP0634867B1 (en) | Compressed and coded data recording method | |
US7881584B2 (en) | Reproducing apparatus and method, and recording medium | |
JP5059301B2 (ja) | 同期再生装置および同期再生方法 | |
JPH08168042A (ja) | データ復号化装置およびデータ復号化方法 | |
US6041067A (en) | Device for synchronizing data processing | |
JP2003046949A (ja) | データ多重化方法、データ記録媒体、データ記録装置及びデータ記録プログラム | |
CN100536555C (zh) | 数据处理装置 | |
JPH0863890A (ja) | 多重化データの復号装置 | |
US6718119B1 (en) | Video/audio decoding apparatus and method | |
JP3133630B2 (ja) | Mpegシステムデコーダ | |
KR100428921B1 (ko) | 가변비트레이트데이터의기록장치및기록방법과,재생장치및재생방법 | |
CA2490879C (en) | Reproducing apparatus and method, and recording medium | |
JPH0863884A (ja) | ディジタル情報符号化・復号装置 | |
CA2725177C (en) | Reproducing apparatus and method, and recording medium | |
JP2998786B2 (ja) | 画像音声の同期再生方法及び装置 | |
JP2000165863A (ja) | データ符号化・復号化装置 | |
JP2001145058A (ja) | 映像音声記録再生装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040427 |
|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20040428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040624 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20040714 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041115 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071203 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081203 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101203 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111203 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |