実施の形態1.
図1は実施の形態1によるディジタル情報符号化装置の構成を示すブロック図である。図1を従来例の図15と比べると、マルチプレクサ7が簡易型マルチプレクサ7になっている以外は図15と同じである。
ここで、簡易型マルチプレクサ7の動作について図2を用いて説明する。
まず、図2のように、符号化する映像信号と音声信号を適当な時間で切り分ける。実施の形態1では、0.5秒ごとに切り分けるものとする。このとき、映像信号と音声信号の先頭時刻は、一致するようにする。
次に、簡易型マルチプレクサ7では、同じ時刻のそれぞれ分割された符号化ビデオデータとオーディオ符号化データを、オーディオデータの次にビデオデータが配列した符号化多重データを作成し、出力する。
簡易型マルチプレクサ7の出力の様子を、図3を用いて説明する。まず、それぞれのオーディオ符号化データとビデオ符号化データの先頭には、データの長さやオーディオ符号化データかビデオ符号化データかの区別を表わす情報などを含んだパックヘッダおよびパケットヘッダが付加される。
そして、はじめにオーディオ符号化データが簡易型マルチプレクサより出力される。
次に、ビデオ符号化データが出力される。図3では、0.5秒分に分割されたオーディオ符号化データをさらにN個に分割し、それぞれにパックヘッダとパケットヘッダを付加して出力している。
図3では、ビデオ符号化データがビデオ符号化データ1.1からビデオ符号化データ1.NまでのN個に分割されているが、分割せずに1つのデータとして出力してもよい。
一組のオーディオ符号化データとビデオ符号化データが出力された後、繰り返し、オーディオ符号化データ、ビデオ符号化データの順番でデータが出力される。
次に、パックヘッダおよびパケットヘッダの一例を図4に示す。パケットヘッダの中のIDは、そのパケットに含まれているデータがビデオデータなのかオーディオデータなのかを示している。また、SCR・PTSといった時間情報のフィールドを設定しているが、簡易型マルチプレクサでは、“0”といった意味の無いデータを出力してもよい。ただし、SCR・PTSといった時間情報を必要とする復号装置においても復号を行ないたい場合、すなわち互換性を持たせたい場合は、簡易型マルチプレクサにおいて時間情報を出力する。
次に、図5を用いて復号回路の動作について説明する。ディジタル記録媒体8より読み出された符号化多重信号はバッファ9に入力される。バッファ9は、ディジタル記録媒体8からのデータ読み出し速度と、ビデオデコーダ14およびオーディオデコーダ18におけるデコード処理に必要なデータの速度との差を吸収するものである。
バッファ9から読み出された符号化多重データは、切り換え器10を通って簡易型デマルチプレクサ11に入力される。簡易型デマルチプレクサ11は、符号化多重データのパケットヘッダを読み取り、オーディオ符号化データのパケットかビデオ符号化データのパケットかを判断し、ビデオ符号化データはビデオバッファ12に出力し、オーディオ符号化データはオーディオバッファ16に出力する。
ビデオバッファ12およびオーディオバッファ16は、簡易型デマルチプレクサ11から出力される不連続なビデオデータおよびオーディオデータを、連続なデータとしてビデオデコーダ、オーディオデコーダのそれぞれが必要とするデータ読み出し速度でそれぞれのデコーダに出力するためのものである。
マイクロコンピュータ20は、常にビデオバッファ12のデータ蓄積量を監視する。ビデオバッファ12のデータ蓄積量があらかじめ定めた閾値以上になると、ビデオ切り換え器13を閉じてビデオ符号化データをビデオバッファ12からビデオデコーダ14に出力し、ビデオデコーダ14でのデコードを開始する。
また、同時にオーディオ切り換え器17を閉じて符号化オーディオデータをオーディオバッファ16からオーディオデコーダに出力し、オーディオデコーダ18でのデコードを開始する。すなわち、ビデオデコーダとオーディオデコーダでのデコードが、同時に開始される。これにより、映像と音声の同期のあった出力信号を得ることができる。
ビデオデコーダに符号化ビデオデータを入力してから映像データが出力されるまでの時間、すなわちビデオデコーダディレイと、オーディオデコーダに符号化オーディオデータが入力してから音声データが出力されるまでの時間、すなわちオーディオデコーダディレイとの間に差がある場合、ビデオ切り換え器13とオーディオ切り換え器17を閉じるタイミングをずらす。例えば、ビデオデコーダディレイがオーディオデコーダディレイよりt[sec]長い場合、ビデオ切り換え器13を閉じたt[sec]後にオーディオ切り換え器17を閉じるものとする。これにより、ビデオデコーダとオーディオデコーダのディレイに差がある場合でも、映像と音声の同期のあった出力信号を得ることができる。
符号化ビデオデータは、ビデオデコーダ14によって復号され、ビデオD/A変換器15によってアナログビデオ信号に変換されて出力される。符号化オーディオデータは、オーディオデコーダ18によって復号され、オーディオD/A変換器19によってアナログオーディオ信号に変換されて出力される。
ここで、符号化多重データは同じ時刻のオーディオデータがビデオデータより先に出力されるようになっている。符号化多重データは同じ時刻のオーディオデータとビデオデータが、時系列に多重化されている。ここで、時系列の多重化としては、大きく分けて、オーディオデータを先に送る場合と、ビデオデータを先に送る場合の2つの場合が考えられる。例えば、ビデオデータが先に送られた場合、復号装置側ではビデオデータを受け取った後に同じ時刻のオーディオデータが送られて来るまで、先に受け取ったビデオデータをデコードせずに保持している必要がある。ここで、オーディオデータとビデオデータのデータ量を比べると、通常の場合、オーディオデータの方がビデオデータよりはるかに少ない。そのため、一定時間の情報を蓄えるとき、ビデオデータを蓄えるよりオーディオデータを蓄えた方が必要とするメモリ量がはるかに少ないものとなる。
実施の形態1のように、同じ時刻のオーディオデータをビデオデータより先に送ることにより、復号装置全体で必要となるメモリの量が非常に少ないものとなる。その結果、非常に簡単な構成で復号装置を構成することができる。
また、図5に示したディジタル情報復号装置において、ディジタル蓄積メディア8から符号化多重データを読み出すときに、データの途中から読み出す場合を考える。これは、記録した映像および音声信号の途中からの復号を行なう場合である。データの途中からの復号を考えたとき、一組となっているオーディオ符号化データとビデオ符号化データをもってデコードを始めれば、すなわち図3に示すA点から読み出したとき、ビデオデータとオーディオデータは図2で示したように同じ時刻のデータが一組になって記録されているので、映像と音声の同期の合った復号信号を得ることができる。
なお、実施の形態1では、ディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態1では、符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
さらに、上記実施の形態1では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けをマイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
実施の形態2.
次に、実施の形態1に示したディジタル情報符号化・復号装置において、ビデオ符号化データとオーディオ符号化データが全く同じ時刻で分割できない場合にも、映像と音声の同期のあった復号信号を得ることができる機能を組み入れた場合について説明する。
なお、ディジタル情報符号化装置は、図1に示した実施の形態1のディジタル情報符号化装置と同じ構成である。ただし、ビデオデータおよびオーディオデータの構成が制限を受けたものになっている。これについて以下に説明する。
まず、図6にビデオデータおよびオーディオデータの構成を示し、あわせて実施の形態2による簡易型マルチプレクサ7によるデータ分割の様子を示す。図6のように、符号化する映像信号の1フレームを1ピクチャという単位とし、例えば15ピクチャを1つのGOP(グループ・オブ・ピクチャ)という単位として映像信号全体を切り分ける。1GOPは、時間にして約0.5secである。
ここで、図7を用いて実施の形態2における画像符号化データの構成について説明する。実施の形態2では、各GOPの先頭に画像符号化データの先頭を表わすシーケンスヘッダを付加するものとする。シーケンスヘッダの次にGOPヘッダが続き、その後に15ピクチャ分のピクチャデータが続く。これらシーケンスヘッダではじまる一連の画像符号化データを1GOPの画像符号化データとする。
なお、実施の形態2では映像信号の1GOPを15ピクチャで構成するものとしているが、これに限るものではない。
また、図6より、音声信号は映像信号の先頭のピクチャと時間的に一致したところから1フレーム毎に分ける。ここでの1フレームとは、例えば、48kHzサンプリングされたディジタルオーディオデータの1152サンプル分のことを表わしている。
なお、実施の形態2では音声信号の1フレームを48kHzサンプリングの1152サンプル分としたが、サンプリング周波数や1フレームのサンプル数はこれに限るものではない。
簡易型マルチプレクサ7では、ビデオエンコーダ2によって作成されたビデオ符号化データを1GOPごとに分割する。
またオーディオエンコーダ5によって作成されたオーディオ符号化データは、ビデオ符号化データの時間的なGOPの境界線と必ず一致させてデータを分割することは不可能である。よって、実施の形態2では、オーディオ符号化データは、ビデオ符号化データの時間的なGOPの境界線と一致するオーディオフレームの境界線、もしくは境界線が一致しない場合はGOPの境界線よりも時間的に先行するオーディオフレームの境界線のなかでGOPの境界線に最も近いオーディオフレームの境界線で分割する。
図6において、ビデオデータは0.5秒と1.0秒のところにあるGOPの境界線で分割される。オーディオデータはオーディオフレームの20と21の間、そしてオーディオフレーム41と42の間で分割される。すなわち、ビデオ符号化データの最初の分割されたデータは、第1ピクチャから第15ピクチャにより構成されるGOPであり、オーディオ符号化データの最初の分割されたデータは、第1フレームから第20フレームで構成される一連のオーディオ符号化データである。この分割方法では、オーディオ符号化データの1分割単位中にあるフレーム数は20または21となる。
次に、簡易型マルチプレクサ7では、ほぼ同じ時刻のそれぞれの分割されたビデオ符号化データとオーディオ符号化データを、オーディオデータの次にビデオデータが出力されるような順番で出力する。
簡易型マルチプレクサ7の出力の様子を、図8を用いて説明する。まず、それぞれのオーディオ符号化データとビデオ符号化データの先頭には、データの長さやオーディオデータかビデオデータかの区別を表わす情報などを含んだパックヘッダ、およびパケットヘッダが付加される。
そして、はじめに、オーディオの第1フレームから第20フレームを符号化したデータが出力される。
次に、ビデオの1GOP分のデータ、すなわち第1ピクチャから第15ピクチャを符号化したデータが適度な大きさに分割されて出力される。なお、実施の形態2では、ビデオ符号化データを適度な大きさに分割して出力しているが、分割せずに出力してもよい。
一組のオーディオデータとビデオデータが出力された後、繰り返し、オーディオデータ、ビデオデータの順番でデータが出力される。
図6より、それぞれの一組のオーディオデータとビデオデータの先頭時刻のずれは、オーディオデータの1フレーム分以下になっている。実施の形態2では、オーディオデータの1フレームは48kHzサンプリングの1152サンプル分なので、時間として24msecである。すなわち、オーディオデータの先頭は、ビデオデータの先頭に対して24msec以下のずれで先行したものとなっている。
また、パックヘッダおよびパケットヘッダについては、実施の形態1で示した図4と同じものを用いる。
さらに、ディジタル情報復号装置については、実施の形態1で示した図5と同じものを用いる。
ここで、図5に示したディジタル情報復号装置において、ディジタル蓄積メディア8から符号化多重データを読み出すときに、データの途中から読み出す場合を考える。これは、記録した映像および音声信号の途中からの復号を行なう場合である。データの途中からの復号を考えたとき、一組となっているオーディオ符号化データとビデオ符号化データをもってデコードを始めれば、すなわち図8に示すA点から読み出したとき、ビデオデータとオーディオデータは図6で示したようにほぼ同じ時刻のデータが一組になって記録されているので、ほぼ同期の合った復号信号を得ることができる。
また、ビデオ符号化データの1GOPの境界線とオーディオ符号化データの分割の境界線との時間的なずれが、最大でオーディオ符号化データの1フレーム分、すなわち24msecなので、復号される映像信号と音声信号の同期のずれは、最大24msecである。
また、オーディオ符号化データの分割の境界線は、必ずビデオ符号化データの境界線より早い時刻に設定してあるので、復号信号で同期ずれが発生した場合、必ず音声が遅れる方向になり、音声が映像より早く出力されることはない。
以上、2つのことがらより、一組となっているオーディオ符号化データとビデオ符号化データをもってデコードを始めれば、同期ずれが発生した場合でも、必ず音声が遅れる方向で、最大でも24msecの遅れとなる。これは、人間が映像と音声の同期ずれを検知できる能力以下であり、同期がずれていることに気がつかない程度のものである。よって、実施の形態2によるディジタル信号符号化・復号装置を用いれば、簡単な回路構成でありながら、データの途中から読み出した場合でも映像信号と音声信号のほとんど同期の合った復号信号を得ることができる。
なお、実施の形態2ではディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態2では符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
さらに、実施の形態2では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けをマイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
実施の形態3.
次に、実施の形態2に示したディジタル情報符号化・復号装置において、符号化多重データの途中から読み出しても映像と音声の同期がほとんどあった復号信号が得られる機能を組み入れた場合について説明する。
なお、ディジタル情報符号化装置は、図1に示した実施の形態1のディジタル情報符号化装置と同じものを用いるものとする。
図9は、実施の形態3によるディジタル情報復号装置の構成を示すブロック図である。図9を実施の形態1の図5と比べると、ビデオデコーダ14が改良型ビデオデコーダ22になっている以外は図5と同じである。
ここで、改良型ビデオデコーダ22の動作について説明する。簡易型デマルチプレクサで分割されビデオバッファ12、ビデオ切り換え器13を通って改良型ビデオデコーダ22に入力されるデータは図7に示すようなビデオ符号化データである。改良型ビデオデコーダ22は、図7で示されるデータの中で、シーケンスヘッダをスタートコードとして、シーケンスヘッダを入力されることによりデコードを開始する。すなわち、ビデオ符号化データの途中からのデータを受け取った場合、最初にシーケンスヘッダを探し、シーケンスヘッダを見つけた後にそれに続くデータのデコードを開始する。
ここで、以上に示したディジタル情報符号化・復号装置を用いて、ディジタル蓄積メディア8の途中の位置からデータを読み出した場合の動作について説明する。
図8において、ビデオ符号化データの途中であるB点からデータを読み出した場合を考える。このときには、途中から読み出されたビデオ符号化データは、パックヘッダ・パケットヘッダが無いため、簡易型デマルチプレクサ11でビデオ符号化データともオーディオ符号化データとも判断されず、破棄される。次に、パックヘッダ・パケットヘッダを伴っているビデオ符号化データは、デマルチプレクサ11によってビデオバッファ12に出力される。
それ以降、正常に読み出されたオーディオ符号化データおよびビデオ符号化データは、順次、オーディオバッファ16およびビデオバッファ12に出力される。
マイクロコンピュータ20では、ビデオバッファ12のデータ蓄積量を常に監視しており、ビデオバッファ12のデータ蓄積量があらかじめ定めた閾値以上になると、ビデオ切り換え部を閉じて、ビデオ符号化データをビデオバッファ12から改良型ビデオデコーダ22に出力する。
改良型ビデオデコーダ22には、最初に図8に示すビデオ符号化データの中で、1つめのGOPのデータの一部が入力される。ここで、改良型ビデオデコーダ22は、シーケンスヘッダをスタートコードとしてデコードをスタートするようになっている。そのため、最初に入力されたビデオ符号化データにはシーケンスヘッダが無いため、シーケンスヘッダが入力されるまでビデオ符号化データを読み飛ばし、デコードを行わない。そして、次に表われる第2シーケンスヘッダが入力されたときに、それに続くビデオ符号化データのデコードを開始する。すなわち、改良型ビデオデコーダ22では、ビデオ符号化データの途中からのデータが入力された場合、次のGOPの先頭からデコードを開始する。
オーディオ符号化データは、ビデオ符号化データの2番目のGOPデータと時刻がほぼ一致するデータから正常に読み出されることになる。改良型ビデオデコーダ22がデコードを開始すると同時にオーディオデコーダ18もデコードを開始する。その結果、対になった2番目のオーディオ符号化データとビデオ符号化データから読み出されたのと同じ状態になる。
この場合、図6に示すように、対になったオーディオ符号化データとビデオ符号化データは、オーディオ符号化データの1フレーム分以下の時間、すなわち24msec以下のずれでオーディオ符号化データが時間的に先行したものとなっている。そのため、これらのデータを同時にデコードを開始すると、24msec以下の同期ずれでオーディオ信号出力が遅れたものになる。24msecいかのオーディオ信号出力の遅れは、検知限界以下であり、同期ずれは分からない。以上のことから、同期ずれの分からない再生信号が得られることになる。
以上で示したように、実施の形態3によれば、符号化多重データを途中から読み出し、映像と音声の同期のあった復号化信号を得ようとするとき、対になったオーディオ符号化データとビデオ符号化データの先頭から正確に読み出す必要はなく、オーディオ符号化データとビデオ符号化データの先頭の大体の位置が分かっていれば、その位置の少し前の適当な位置から読み出せばよい。
なお、実施の形態3では改良型ビデオデコーダ22はシーケンスヘッダをスタートコードとしてデコードスタートすると説明したが、これに限るものではなく、シーケンスヘッダをGOPヘッダ、ピクチャヘッダに置き換えてもよい。
また、実施の形態3ではディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態3では符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
さらに、実施の形態3では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けをマイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
実施の形態4.
次に、実施の形態3に示したディジタル情報符号化・復号装置において、符号化多重データの任意の位置から読み出しても映像と音声の同期がとれる機能を組み入れた場合について説明する。
なお、ディジタル情報復号装置は、図9に示した実施の形態3のディジタル情報復号装置と同じものを用いるものとする。
図10は、実施の形態4によるディジタル情報符号化装置の構成を示すブロック図である。図10を実施の形態1の図1と比べると、簡易型マルチプレクサ7が改良型マルチプレクサ21になっている以外は図1と同じである。
ここで、改良型マルチプレクサ21の動作は、図6に示すビデオ符号化データおよびオーディオ符号化データの分割、図7に示すビデオ符号化データの構成、図4に示すパックヘッダおよびパケットヘッダの構成については、実施の形態3の図1に示した簡易型マルチプレクサ7と同じである。ただし、パケットヘッダに続くデータの構成が簡易型マルチプレクサ7とは異なる。改良型マルチプレクサ21が作成するデータの構成について図11を用いて説明する。
ここで、最初に出力される1GOP分のビデオ符号化データについては、図7に示したシーケンスヘッダで始まり、GOPヘッダ、15個分のピクチャデータが続き、最後に次のGOPのシーケンスヘッダまでを含むものとする。そして、2つ目以降に出力される1GOP分のビデオ符号化データでは、GOPヘッダで始まり、15個分のピクチャデータが続き、最後に次のGOPのシーケンスヘッダまでを含むものとする。
ここで、以上に示したディジタル情報符号化・復号装置を用いて、ディジタル蓄積メディア8の途中の任意の位置からデータを読み出した場合の動作について説明する。
図11において、実施の形態3と同じビデオ符号化データの途中であるB点からデータを読み出した場合を考える。この時には、第2シーケンスヘッダが読み出されるため、実施の形態3と同様に、2つめのGOPから映像と音声の同期がほとんどあった復号信号を得ることができる。
次に、図11において、オーディオ符号化データの途中であるC点からデータを読み出した場合を考える。そのときには、途中から読み出されたオーディオデータはパックヘッダ・パケットヘッダが読み込まれていないため、簡易型デマルチプレクサ11でビデオ符号化データでもオーディオ符号化データでもないデータとして、破棄される。
次に、ビデオ符号化データが読み込まれ、簡易型デマルチプレクサ11によってビデオバッファ12に送られ、それに続くオーディオ符号化データ・ビデオ符号化データが順次簡易型デマルチプレクサ11によってオーディオバッファ16とビデオバッファ12に送られる。
改良型ビデオデコーダ22では、最初に図11に示す第2GOPヘッダで始まる一連のデータを読み込む。しかし、シーケンスヘッダが無いために、シーケンスヘッダが現れるまでビデオ符号化データを読み飛ばし、デコードを行わない。そして、次に現れる第3シーケンスヘッダを受け取ったときに、それに続くビデオ符号化データのデコードを開始する。すなわち、改良型ビデオデコーダ22では、3番目のGOPデータからデコードを始めることになる。
オーディオ符号化データは、ビデオ符号化データの3番目のGOPデータと時刻が一致するデータから正常に読み出されることになる。改良型ビデオデコーダ22がデコードを開始すると同時にオーディオデコーダ18もデコードを開始する。その結果、対になった3番目のオーディオ符号化データとビデオ符号化データから読み出されたのと同じ状態になる。この場合、図6に示すように、対になったオーディオ符号化データとビデオ符号化データは、オーディオ符号化データの1フレーム分以下の時間、すなわち24msec以下のずれでオーディオ符号化データが時間的に先行したものとなっている。そのため、これらのデータを同時にデコードを開始すると、24msec以下の同期ずれでオーディオ信号出力が遅れたものになる。24msec以下のオーディオ信号出力の遅れは、検知限界以下であり、同期ずれは分からない。以上のことから、同期ずれの分からない再生信号が得られることになる。
以上のように、実施の形態4のディジタル情報符号化・復号装置によれば、簡単な回路構成で、ディジタル蓄積メディア8の任意の位置から読み出しても映像と音声の同期ずれがほとんど無い復号信号を得ることができる。
なお、実施の形態4では改良型ビデオデコーダ22はシーケンスヘッダをスタートコードとしてデコードスタートすると説明したが、これに限るものではなく、シーケンスヘッダをGOPヘッダ、ピクチャヘッダに置き換えてもよい。
また、実施の形態4ではディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態4では符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
さらに、実施の形態4では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けをマイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
実施の形態5.
次に、実施の形態4に示したディジタル情報符号化・復号装置において、デマルチプレクサを改良した例について説明する。なお、ディジタル情報符号化装置は、図10に示した実施の形態4のディジタル情報符号化装置を用いることとする。
図12は、実施の形態5によるディジタル情報復号装置の構成を示すブロック図である。図12を実施の形態4の図9と比べると、簡易型デマルチプレクサ11が改良型デマルチプレクサ23になっている以外は図9と同じである。
ここで、改良型デマルチプレクサ23の動作について説明する。改良型デマルチプレクサ23には、実施の形態4と同じように図11に示されるような符号化多重データが入力される。図11で示したような多重化構造の場合、符号化オーディオデータが含まれているデータのパックヘッダの先頭、すなわちD点から読み出した場合、最初に読み出されるオーディオ符号化データはデコードされるが、それに続くビデオ符号化データはシーケンスヘッダが無いためにデコードされず、その結果、復号信号における映像信号と音声信号の同期が1GOP分ずれてしまうという現象が起こってしまう。
そのため、実施の形態5では、改良型デマルチプレクサ23の動作を図13のフローチャートで示されるようなものにする。まず、読み出し開始時にビデオ符号化データが入力された場合、通常の動作をすることにより映像信号と音声信号の同期のとれた復号信号を得ることができる。次に、読み出し開始時にオーディオ符号化データが入力された場合、すなわち、符号化多重データの先頭から読み出すか、またはD点から読み出した場合は、入力されたオーディオ符号化データをオーディオバッファ16に出力した後、入力されるビデオ符号化データの先頭を確認し、シーケンスヘッダが存在した場合、すなわち符号化多重データの先頭から読み出していると確認できた場合は通常の処理を行なう。シーケンスヘッダが存在しなかった場合は、D点から読み出したものと判断し、オーディオバッファ16に対して現在保持しているデータをすべて破棄するように指示する。以上の処理により、符号化多重データのどの位置から読み出しても、同期のあった復号信号を得ることができる。
また、オーディオバッファ16に対して現在保持しているデータを破棄するように指示するという処理は、改良型デマルチプレクサ23がオーディオバッファ16にオーディオ符号化データを出力しないという処理に置き換えることもできる。
以上のように、実施の形態5のディジタル情報符号化・復号装置によれば、簡単な回路構成で、ディジタル蓄積メディア8の任意の位置から読み出しても同期ずれの無い再生信号が得られる。
なお、実施の形態5では改良型ビデオデコーダ22はシーケンスヘッダをスタートコードとしてデコードスタートすると説明したが、これに限るものではなく、シーケンスヘッダをGOPヘッダ、ピクチャヘッダに置き換えてもよい。
また、実施の形態5ではディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を、同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態5では符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
また、実施の形態5では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けを、マイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
さらに、実施の形態5では、オーディオ符号化データを破棄する一連の処理を、マイクロコンピュータの外部の改良型デマルチプレクサで行なう構成を説明したが、同一のマイクロコンピュータ内で行なってもよい。
1 ビデオA/D変換器、 2 ビデオエンコーダ、 3 ビデオバッファ、 4 オーディオA/D変換器、 5 オーディオエンコーダ、 6 オーディオバッファ、 7 簡易型マルチプレクサ、 8 ディジタル蓄積メディア、 9 バッファ、 10 切り換え器、 11 簡易型デマルチプレクサ、 12 ビデオバッファ、 13 ビデオ切り換え器、 14 ビデオデコーダ、 15 ビデオD/A変換器、 16 オーディオバッファ、 17 オーディオ切り換え器、 18 オーディオデコーダ、 19 オーディオD/A変換器、 20 マイクロコンピュータ、 21 改良型マルチプレクサ、 22 改良型ビデオデコーダ。