JP2005168048A - ディジタル情報符号化・復号装置 - Google Patents

ディジタル情報符号化・復号装置 Download PDF

Info

Publication number
JP2005168048A
JP2005168048A JP2005011693A JP2005011693A JP2005168048A JP 2005168048 A JP2005168048 A JP 2005168048A JP 2005011693 A JP2005011693 A JP 2005011693A JP 2005011693 A JP2005011693 A JP 2005011693A JP 2005168048 A JP2005168048 A JP 2005168048A
Authority
JP
Japan
Prior art keywords
video
audio
data
encoded data
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005011693A
Other languages
English (en)
Inventor
Shuji Toda
修司 外田
Nobuo Ueda
信夫 植田
Osamu Watanabe
修 渡辺
Noritaka Kishida
教敬 岸田
Akifumi Kodama
昌文 児玉
Tomoaki Ryu
智明 龍
Seiki Yamamoto
清貴 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2005011693A priority Critical patent/JP2005168048A/ja
Publication of JP2005168048A publication Critical patent/JP2005168048A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】簡単な構成で映像と音声の同期のとれた復号信号を得ることができるディジタル情報符号化・復号装置を提供する。
【解決手段】オーディオ符号化データ列を、ビデオ符号化データ列の分割箇所と同じ時刻か、あるいは、映像と音声の同期ずれが、人間の検知できない程度の時間差だけ前記ビデオ符号化データ列の分割箇所よりも早い時刻で分割し、オーディオ符号化データ列を同じ時刻のビデオ符号化データ列より先に配列し、分割されたビデオ符号化データ列の先頭にスタートコードを挿入する符号化多重データを作成するマルチプレクサ11と、ビデオ符号化データ列中のスタートコードを受け取ることによりデコードを開始するビデオデコーダ22と、ビデオデコーダ22のデコード開始と同時にデコードを開始するオーディオデコーダ18とを備えた。
【選択図】 図9


Description

本発明は、ディジタル画像信号および音声信号の符号化・復号装置に関するものである。
近年、映像信号および音声信号のディジタル符号化技術は、放送、通信、情報機器等の多くのメディアで利用されている。特にAV機器の分野では、MPEGによるディジタル符号化方式を利用し、1枚のCDに最大74分の動画像と音声を記録できる「ビデオCD」が規格化され、普及しつつある。
図14にビデオCDのセクタフォーマットを示す。ビデオCDのディジタルデータは、1つのパックの中に1つのパケットを含む構成になる。1パックは1セクタ中の2324バイトで構成される。
ディスク上では、MPEGのビデオとオーディオのデータを時系列記録しており、平均すると6対1の割合で配置されている。
ディジタルデータを蓄積媒体に記録する場合、VHSに代表されるアナログ記録のVTRとは異なり、ビデオデータとオーディオデータが時系列に並ぶ。そのため、出力される映像信号と音声信号の同期処理を行う必要がある。
ビデオCDにおいては、これらの同期処理を行うために、3つの時間情報を用いている。まず、パックヘッダ内にあって復号装置の基準クロックを設定するSCR(システム・クロック・リファレンス)、次にパケットヘッダ内にあってビデオ・オーディオ信号のデコード開始時刻を示すDTS(デコーディング・タイム・スタンプ)、そして同じくパケットヘッダ内にあってデコード結果の出力時刻を示すPTS(プレゼンテーション・タイム・スタンプ)である。
図15にビデオCDの符号化回路の構成を示す。1はアナログビデオ信号入力をディジタルビデオ信号に変換するビデオA/D変換器、2はディジタルビデオ信号を符号化ビデオ信号に変換するビデオエンコーダ、3は符号化ビデオ信号を一時的に蓄えるビデオバッファ、4はアナログオーディオ信号入力をディジタルオーディオ信号に変換するオーディオA/D変換器、5はディジタルオーディオ信号を符号化ビデオ信号に変換するオーディオエンコーダ、6は符号化オーディオ信号を一時的に蓄えるオーディオバッファ、24は符号化ビデオデータと符号化オーディオデータを時系列に並べ、SCR・DTS・PTSを付加して符号化多重データを作成するマルチプレクサ、8は符号化多重データを蓄積するディジタル蓄積メディアである。
ビデオエンコーダ2で作成された符号化ビデオデータはビデオバッファ3に、オーディオエンコーダ5で作成された符号化オーディオデータはオーディオバッファ6に、それぞれ一時的に蓄積される。マルチプレクサ24は、符号化ビデオデータと符号化オーディオデータを、図14に示した符号化多重データのフォーマットに合うように分割し、並べ換え、それぞれのデータに時間情報を付加することにより、図14に示した符号化多重データを出力する。
図16にビデオCDの復号回路の構成を示す。8は図14に示した符号化多重データを蓄積するディジタル蓄積メディアと同じものである。9はディジタル蓄積メディア8からのデータを蓄えるバッファ、10はバッファ9の出力信号を制御するバッファ切り換え器、25はディジタル蓄積メディアに記録されている符号化多重データから符号化ビデオデータと、符号化オーディオデータと、SCR・DTS・PTSなどの時間情報とを分離して出力するデマルチプレクサ、12は符号化ビデオデータを蓄えるビデオバッファ、13はビデオバッファ12の出力信号を制御するビデオバッファ切り換え器、14は符号化ビデオデータを復号するビデオデコーダ、15は復号されたビデオデータをアナログ信号に変換するビデオD/A変換器、16は符号化オーディオデータを蓄えるオーディオバッファ、17はオーディオバッファ16の出力信号を制御するオーディオバッファ切り換え器、18は符号化オーディオデータを復号するオーディオデコーダ、19は復号されたオーディオデータをアナログ信号に変換するオーディオD/A変換器、20はデマルチプレクサ11から出力されたSCR・DTS・PTSなどの時間情報をもとにビデオバッファ制御器13とオーディオバッファ制御器17を制御するマイクロコンピュータである。
ディジタル蓄積メディア8から読み出されたデータはバッファ9に入力される。バッファ9はディジタル蓄積メディア8からのデータ読み出し速度とデマルチプレクサのデータ読み出し速度の差を吸収する。デマルチプレクサ25では、ディジタル蓄積メディア8から読み出されたデータからビデオデータ、オーディオデータ、SCR・DTS・PTSの時間情報等を分離する。その結果、ビデオデータはビデオバッファ12に、オーディオデータはオーディオバッファ16に、SCR・DTS・PTSの時間情報はマイクロコンピュータ20に、それぞれ出力される。
ビデオバッファ12は、デマルチプレクサ25から間欠的に出力されるビデオ符号化データを、ビデオバッファ切り換え器13を通して、連続してビデオデコーダに出力する。ビデオデコーダ14は、入力されたビデオ符号化データをデコードし、ディジタル映像信号をビデオD/A変換器15に出力する。ビデオD/A変換器15は、ビデオデコーダ14から出力されたディジタル映像信号をアナログ映像信号に変換し、映像信号出力として出力する。
一方、オーディオバッファ16は、デマルチプレクサ25から間欠的に出力されるオーディオデータを、オーディオバッファ切り換え器17を通して、連続してオーディオデコーダに出力する。オーディオデコーダ18は、入力されたオーディオ符号化データをデコードし、ディジタル音声信号をオーディオD/A変換器19に出力する。オーディオD/A変換器19は、オーディオデコーダ18から出力されたディジタル音声信号をアナログ音声信号に変換し、音声信号出力として出力する。
デマルチプレクサ25から出力されたSCR・DTS・PTSの時間情報は、マイクロコンピュータ20に入力される。マイクロコンピュータ20では、SCRをもとにシステム全体のクロックの時刻を合わせる。そして、DTSまたはPTSの情報を用いてビデオバッファ切り換え器13とオーディオバッファ切り換え器17の接続を調整し、出力信号の出力タイミングを調整することにより、映像信号と音声信号の出力を同期させる。
図15、図16に示したようなビデオCDの符号化・復号回路における同期処理では、映像と音声の同期の精度は同期に用いるクロックの周波数で決定され、非常に高い精度で同期を行うことが可能になる。しかし、マルチプレクサによるタイムスタンプの挿入、デマルチプレクサによる時間情報の分離、タイムスタンプ制御部による同期処理などが必要になり、復号装置が複雑なものになり、高価なものになってしまうという問題があった。
本発明は、このような問題点を解消すべくなされたものであり、タイムスタンプが不用で、かつ、簡単な構成でビデオとオーディオの同期制御を行なう装置を得ることを目的とする。
請求項1に係るディジタル情報符号化・復号装置は、オーディオ符号化データ列を、ビデオ符号化データ列の分割箇所と同じ時刻か、あるいは、映像と音声の同期ずれが、人間の検知できない程度の時間差だけ前記ビデオ符号化データ列の分割箇所よりも早い時刻で分割し、上記オーディオ符号化データ列を同じ時刻の上記ビデオ符号化データ列より先に配列し、分割された上記ビデオ符号化データ列の先頭にスタートコードを挿入する符号化多重データを作成するマルチプレクサと、上記ビデオ符号化データ列中の上記スタートコードを受け取ることによりデコードを開始するビデオデコーダと、上記ビデオデコーダのデコード開始と同時にデコードを開始するオーディオデコーダとを備えたものである。
請求項2に係るディジタル情報符号化・復号装置は、オーディオ符号化データ列を、ビデオ符号化データ列の分割箇所と同じ時刻か、あるいは、映像と音声の同期ずれが、人間の検知できない程度の時間差だけ前記ビデオ符号化データ列の分割箇所よりも早い時刻で分割し、上記オーディオ符号化データ列を同じ時刻の上記ビデオ符号化データ列より先に配列し、分割された上記ビデオ符号化データ列のスタートコードを同じ時刻のオーディオ符号化データ列の直前に挿入する符号化多重データを作成するマルチプレクサと、上記ビデオ符号化データ列中の上記スタートコードを受け取ることによりデコードを開始するビデオデコーダと、上記ビデオデコーダのデコード開始と同時にデコードを開始するオーディオデコーダとを備えたものである。
請求項3に係るディジタル情報符号化・復号装置は、オーディオ符号化データ列を、ビデオ符号化データ列の分割箇所と同じ時刻か、あるいは、映像と音声の同期ずれが、人間の検知できない程度の時間差だけ前記ビデオ符号化データ列の分割箇所よりも早い時刻で分割し、上記オーディオ符号化データ列を同じ時刻の上記ビデオ符号化データ列より先に配列し、分割された上記ビデオ符号化データ列のスタートコードを同じ時刻のオーディオ符号化データ列の直前に挿入する符号化多重データを作成するマルチプレクサと、最初に上記オーディオ符号化データ列が入力され、その直後の上記ビデオ符号化データ列の先頭に上記スタートコードが存在しないときに、最初に入力された上記オーディオ符号化データ列を破棄するデマルチプレクサと、上記ビデオ符号化データ列中の上記スタートコードを受け取ることによりデコードを開始するビデオデコーダと、上記ビデオデコーダのデコード開始と同時にデコードを開始するオーディオデコーダとを備えたものである。
請求項1の発明によれば、ビデオ符号化データ中のスタートコードを受信することによりビデオデコーダでのデコードを開始し、ビデオデコーダのデコード開始と同時にオーディオデコーダのデコードを開始することにより、符号化多重データの途中から復号を開始しても、映像と音声の同期ずれがほとんど無い復号信号を得ることができる。
請求項2の発明によれば、ビデオ符号化データのスタートコードをオーディオデータの直前に配置することにより、符号化多重データの途中の任意の位置から復号したときにも、映像と音声の同期ずれがほとんど発生しない復号信号を得ることができる。
請求項3の発明によれば、ビデオ符号化データのスタートコードをオーディオデータの直前に配置して符号化多重データを作成し、ビデオ符号化データのスタートコードがビデオデコーダに入力されないときに対応するオーディオ符号化データを破棄することにより、符号化多重データの途中の任意の位置から復号したときにも、同期ずれのほとんど無い復号信号を得ることができる。
実施の形態1.
図1は実施の形態1によるディジタル情報符号化装置の構成を示すブロック図である。図1を従来例の図15と比べると、マルチプレクサ7が簡易型マルチプレクサ7になっている以外は図15と同じである。
ここで、簡易型マルチプレクサ7の動作について図2を用いて説明する。
まず、図2のように、符号化する映像信号と音声信号を適当な時間で切り分ける。実施の形態1では、0.5秒ごとに切り分けるものとする。このとき、映像信号と音声信号の先頭時刻は、一致するようにする。
次に、簡易型マルチプレクサ7では、同じ時刻のそれぞれ分割された符号化ビデオデータとオーディオ符号化データを、オーディオデータの次にビデオデータが配列した符号化多重データを作成し、出力する。
簡易型マルチプレクサ7の出力の様子を、図3を用いて説明する。まず、それぞれのオーディオ符号化データとビデオ符号化データの先頭には、データの長さやオーディオ符号化データかビデオ符号化データかの区別を表わす情報などを含んだパックヘッダおよびパケットヘッダが付加される。
そして、はじめにオーディオ符号化データが簡易型マルチプレクサより出力される。
次に、ビデオ符号化データが出力される。図3では、0.5秒分に分割されたオーディオ符号化データをさらにN個に分割し、それぞれにパックヘッダとパケットヘッダを付加して出力している。
図3では、ビデオ符号化データがビデオ符号化データ1.1からビデオ符号化データ1.NまでのN個に分割されているが、分割せずに1つのデータとして出力してもよい。
一組のオーディオ符号化データとビデオ符号化データが出力された後、繰り返し、オーディオ符号化データ、ビデオ符号化データの順番でデータが出力される。
次に、パックヘッダおよびパケットヘッダの一例を図4に示す。パケットヘッダの中のIDは、そのパケットに含まれているデータがビデオデータなのかオーディオデータなのかを示している。また、SCR・PTSといった時間情報のフィールドを設定しているが、簡易型マルチプレクサでは、“0”といった意味の無いデータを出力してもよい。ただし、SCR・PTSといった時間情報を必要とする復号装置においても復号を行ないたい場合、すなわち互換性を持たせたい場合は、簡易型マルチプレクサにおいて時間情報を出力する。
次に、図5を用いて復号回路の動作について説明する。ディジタル記録媒体8より読み出された符号化多重信号はバッファ9に入力される。バッファ9は、ディジタル記録媒体8からのデータ読み出し速度と、ビデオデコーダ14およびオーディオデコーダ18におけるデコード処理に必要なデータの速度との差を吸収するものである。
バッファ9から読み出された符号化多重データは、切り換え器10を通って簡易型デマルチプレクサ11に入力される。簡易型デマルチプレクサ11は、符号化多重データのパケットヘッダを読み取り、オーディオ符号化データのパケットかビデオ符号化データのパケットかを判断し、ビデオ符号化データはビデオバッファ12に出力し、オーディオ符号化データはオーディオバッファ16に出力する。
ビデオバッファ12およびオーディオバッファ16は、簡易型デマルチプレクサ11から出力される不連続なビデオデータおよびオーディオデータを、連続なデータとしてビデオデコーダ、オーディオデコーダのそれぞれが必要とするデータ読み出し速度でそれぞれのデコーダに出力するためのものである。
マイクロコンピュータ20は、常にビデオバッファ12のデータ蓄積量を監視する。ビデオバッファ12のデータ蓄積量があらかじめ定めた閾値以上になると、ビデオ切り換え器13を閉じてビデオ符号化データをビデオバッファ12からビデオデコーダ14に出力し、ビデオデコーダ14でのデコードを開始する。
また、同時にオーディオ切り換え器17を閉じて符号化オーディオデータをオーディオバッファ16からオーディオデコーダに出力し、オーディオデコーダ18でのデコードを開始する。すなわち、ビデオデコーダとオーディオデコーダでのデコードが、同時に開始される。これにより、映像と音声の同期のあった出力信号を得ることができる。
ビデオデコーダに符号化ビデオデータを入力してから映像データが出力されるまでの時間、すなわちビデオデコーダディレイと、オーディオデコーダに符号化オーディオデータが入力してから音声データが出力されるまでの時間、すなわちオーディオデコーダディレイとの間に差がある場合、ビデオ切り換え器13とオーディオ切り換え器17を閉じるタイミングをずらす。例えば、ビデオデコーダディレイがオーディオデコーダディレイよりt[sec]長い場合、ビデオ切り換え器13を閉じたt[sec]後にオーディオ切り換え器17を閉じるものとする。これにより、ビデオデコーダとオーディオデコーダのディレイに差がある場合でも、映像と音声の同期のあった出力信号を得ることができる。
符号化ビデオデータは、ビデオデコーダ14によって復号され、ビデオD/A変換器15によってアナログビデオ信号に変換されて出力される。符号化オーディオデータは、オーディオデコーダ18によって復号され、オーディオD/A変換器19によってアナログオーディオ信号に変換されて出力される。
ここで、符号化多重データは同じ時刻のオーディオデータがビデオデータより先に出力されるようになっている。符号化多重データは同じ時刻のオーディオデータとビデオデータが、時系列に多重化されている。ここで、時系列の多重化としては、大きく分けて、オーディオデータを先に送る場合と、ビデオデータを先に送る場合の2つの場合が考えられる。例えば、ビデオデータが先に送られた場合、復号装置側ではビデオデータを受け取った後に同じ時刻のオーディオデータが送られて来るまで、先に受け取ったビデオデータをデコードせずに保持している必要がある。ここで、オーディオデータとビデオデータのデータ量を比べると、通常の場合、オーディオデータの方がビデオデータよりはるかに少ない。そのため、一定時間の情報を蓄えるとき、ビデオデータを蓄えるよりオーディオデータを蓄えた方が必要とするメモリ量がはるかに少ないものとなる。
実施の形態1のように、同じ時刻のオーディオデータをビデオデータより先に送ることにより、復号装置全体で必要となるメモリの量が非常に少ないものとなる。その結果、非常に簡単な構成で復号装置を構成することができる。
また、図5に示したディジタル情報復号装置において、ディジタル蓄積メディア8から符号化多重データを読み出すときに、データの途中から読み出す場合を考える。これは、記録した映像および音声信号の途中からの復号を行なう場合である。データの途中からの復号を考えたとき、一組となっているオーディオ符号化データとビデオ符号化データをもってデコードを始めれば、すなわち図3に示すA点から読み出したとき、ビデオデータとオーディオデータは図2で示したように同じ時刻のデータが一組になって記録されているので、映像と音声の同期の合った復号信号を得ることができる。
なお、実施の形態1では、ディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態1では、符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
さらに、上記実施の形態1では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けをマイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
実施の形態2.
次に、実施の形態1に示したディジタル情報符号化・復号装置において、ビデオ符号化データとオーディオ符号化データが全く同じ時刻で分割できない場合にも、映像と音声の同期のあった復号信号を得ることができる機能を組み入れた場合について説明する。
なお、ディジタル情報符号化装置は、図1に示した実施の形態1のディジタル情報符号化装置と同じ構成である。ただし、ビデオデータおよびオーディオデータの構成が制限を受けたものになっている。これについて以下に説明する。
まず、図6にビデオデータおよびオーディオデータの構成を示し、あわせて実施の形態2による簡易型マルチプレクサ7によるデータ分割の様子を示す。図6のように、符号化する映像信号の1フレームを1ピクチャという単位とし、例えば15ピクチャを1つのGOP(グループ・オブ・ピクチャ)という単位として映像信号全体を切り分ける。1GOPは、時間にして約0.5secである。
ここで、図7を用いて実施の形態2における画像符号化データの構成について説明する。実施の形態2では、各GOPの先頭に画像符号化データの先頭を表わすシーケンスヘッダを付加するものとする。シーケンスヘッダの次にGOPヘッダが続き、その後に15ピクチャ分のピクチャデータが続く。これらシーケンスヘッダではじまる一連の画像符号化データを1GOPの画像符号化データとする。
なお、実施の形態2では映像信号の1GOPを15ピクチャで構成するものとしているが、これに限るものではない。
また、図6より、音声信号は映像信号の先頭のピクチャと時間的に一致したところから1フレーム毎に分ける。ここでの1フレームとは、例えば、48kHzサンプリングされたディジタルオーディオデータの1152サンプル分のことを表わしている。
なお、実施の形態2では音声信号の1フレームを48kHzサンプリングの1152サンプル分としたが、サンプリング周波数や1フレームのサンプル数はこれに限るものではない。
簡易型マルチプレクサ7では、ビデオエンコーダ2によって作成されたビデオ符号化データを1GOPごとに分割する。
またオーディオエンコーダ5によって作成されたオーディオ符号化データは、ビデオ符号化データの時間的なGOPの境界線と必ず一致させてデータを分割することは不可能である。よって、実施の形態2では、オーディオ符号化データは、ビデオ符号化データの時間的なGOPの境界線と一致するオーディオフレームの境界線、もしくは境界線が一致しない場合はGOPの境界線よりも時間的に先行するオーディオフレームの境界線のなかでGOPの境界線に最も近いオーディオフレームの境界線で分割する。
図6において、ビデオデータは0.5秒と1.0秒のところにあるGOPの境界線で分割される。オーディオデータはオーディオフレームの20と21の間、そしてオーディオフレーム41と42の間で分割される。すなわち、ビデオ符号化データの最初の分割されたデータは、第1ピクチャから第15ピクチャにより構成されるGOPであり、オーディオ符号化データの最初の分割されたデータは、第1フレームから第20フレームで構成される一連のオーディオ符号化データである。この分割方法では、オーディオ符号化データの1分割単位中にあるフレーム数は20または21となる。
次に、簡易型マルチプレクサ7では、ほぼ同じ時刻のそれぞれの分割されたビデオ符号化データとオーディオ符号化データを、オーディオデータの次にビデオデータが出力されるような順番で出力する。
簡易型マルチプレクサ7の出力の様子を、図8を用いて説明する。まず、それぞれのオーディオ符号化データとビデオ符号化データの先頭には、データの長さやオーディオデータかビデオデータかの区別を表わす情報などを含んだパックヘッダ、およびパケットヘッダが付加される。
そして、はじめに、オーディオの第1フレームから第20フレームを符号化したデータが出力される。
次に、ビデオの1GOP分のデータ、すなわち第1ピクチャから第15ピクチャを符号化したデータが適度な大きさに分割されて出力される。なお、実施の形態2では、ビデオ符号化データを適度な大きさに分割して出力しているが、分割せずに出力してもよい。
一組のオーディオデータとビデオデータが出力された後、繰り返し、オーディオデータ、ビデオデータの順番でデータが出力される。
図6より、それぞれの一組のオーディオデータとビデオデータの先頭時刻のずれは、オーディオデータの1フレーム分以下になっている。実施の形態2では、オーディオデータの1フレームは48kHzサンプリングの1152サンプル分なので、時間として24msecである。すなわち、オーディオデータの先頭は、ビデオデータの先頭に対して24msec以下のずれで先行したものとなっている。
また、パックヘッダおよびパケットヘッダについては、実施の形態1で示した図4と同じものを用いる。
さらに、ディジタル情報復号装置については、実施の形態1で示した図5と同じものを用いる。
ここで、図5に示したディジタル情報復号装置において、ディジタル蓄積メディア8から符号化多重データを読み出すときに、データの途中から読み出す場合を考える。これは、記録した映像および音声信号の途中からの復号を行なう場合である。データの途中からの復号を考えたとき、一組となっているオーディオ符号化データとビデオ符号化データをもってデコードを始めれば、すなわち図8に示すA点から読み出したとき、ビデオデータとオーディオデータは図6で示したようにほぼ同じ時刻のデータが一組になって記録されているので、ほぼ同期の合った復号信号を得ることができる。
また、ビデオ符号化データの1GOPの境界線とオーディオ符号化データの分割の境界線との時間的なずれが、最大でオーディオ符号化データの1フレーム分、すなわち24msecなので、復号される映像信号と音声信号の同期のずれは、最大24msecである。
また、オーディオ符号化データの分割の境界線は、必ずビデオ符号化データの境界線より早い時刻に設定してあるので、復号信号で同期ずれが発生した場合、必ず音声が遅れる方向になり、音声が映像より早く出力されることはない。
以上、2つのことがらより、一組となっているオーディオ符号化データとビデオ符号化データをもってデコードを始めれば、同期ずれが発生した場合でも、必ず音声が遅れる方向で、最大でも24msecの遅れとなる。これは、人間が映像と音声の同期ずれを検知できる能力以下であり、同期がずれていることに気がつかない程度のものである。よって、実施の形態2によるディジタル信号符号化・復号装置を用いれば、簡単な回路構成でありながら、データの途中から読み出した場合でも映像信号と音声信号のほとんど同期の合った復号信号を得ることができる。
なお、実施の形態2ではディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態2では符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
さらに、実施の形態2では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けをマイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
実施の形態3.
次に、実施の形態2に示したディジタル情報符号化・復号装置において、符号化多重データの途中から読み出しても映像と音声の同期がほとんどあった復号信号が得られる機能を組み入れた場合について説明する。
なお、ディジタル情報符号化装置は、図1に示した実施の形態1のディジタル情報符号化装置と同じものを用いるものとする。
図9は、実施の形態3によるディジタル情報復号装置の構成を示すブロック図である。図9を実施の形態1の図5と比べると、ビデオデコーダ14が改良型ビデオデコーダ22になっている以外は図5と同じである。
ここで、改良型ビデオデコーダ22の動作について説明する。簡易型デマルチプレクサで分割されビデオバッファ12、ビデオ切り換え器13を通って改良型ビデオデコーダ22に入力されるデータは図7に示すようなビデオ符号化データである。改良型ビデオデコーダ22は、図7で示されるデータの中で、シーケンスヘッダをスタートコードとして、シーケンスヘッダを入力されることによりデコードを開始する。すなわち、ビデオ符号化データの途中からのデータを受け取った場合、最初にシーケンスヘッダを探し、シーケンスヘッダを見つけた後にそれに続くデータのデコードを開始する。
ここで、以上に示したディジタル情報符号化・復号装置を用いて、ディジタル蓄積メディア8の途中の位置からデータを読み出した場合の動作について説明する。
図8において、ビデオ符号化データの途中であるB点からデータを読み出した場合を考える。このときには、途中から読み出されたビデオ符号化データは、パックヘッダ・パケットヘッダが無いため、簡易型デマルチプレクサ11でビデオ符号化データともオーディオ符号化データとも判断されず、破棄される。次に、パックヘッダ・パケットヘッダを伴っているビデオ符号化データは、デマルチプレクサ11によってビデオバッファ12に出力される。
それ以降、正常に読み出されたオーディオ符号化データおよびビデオ符号化データは、順次、オーディオバッファ16およびビデオバッファ12に出力される。
マイクロコンピュータ20では、ビデオバッファ12のデータ蓄積量を常に監視しており、ビデオバッファ12のデータ蓄積量があらかじめ定めた閾値以上になると、ビデオ切り換え部を閉じて、ビデオ符号化データをビデオバッファ12から改良型ビデオデコーダ22に出力する。
改良型ビデオデコーダ22には、最初に図8に示すビデオ符号化データの中で、1つめのGOPのデータの一部が入力される。ここで、改良型ビデオデコーダ22は、シーケンスヘッダをスタートコードとしてデコードをスタートするようになっている。そのため、最初に入力されたビデオ符号化データにはシーケンスヘッダが無いため、シーケンスヘッダが入力されるまでビデオ符号化データを読み飛ばし、デコードを行わない。そして、次に表われる第2シーケンスヘッダが入力されたときに、それに続くビデオ符号化データのデコードを開始する。すなわち、改良型ビデオデコーダ22では、ビデオ符号化データの途中からのデータが入力された場合、次のGOPの先頭からデコードを開始する。
オーディオ符号化データは、ビデオ符号化データの2番目のGOPデータと時刻がほぼ一致するデータから正常に読み出されることになる。改良型ビデオデコーダ22がデコードを開始すると同時にオーディオデコーダ18もデコードを開始する。その結果、対になった2番目のオーディオ符号化データとビデオ符号化データから読み出されたのと同じ状態になる。
この場合、図6に示すように、対になったオーディオ符号化データとビデオ符号化データは、オーディオ符号化データの1フレーム分以下の時間、すなわち24msec以下のずれでオーディオ符号化データが時間的に先行したものとなっている。そのため、これらのデータを同時にデコードを開始すると、24msec以下の同期ずれでオーディオ信号出力が遅れたものになる。24msecいかのオーディオ信号出力の遅れは、検知限界以下であり、同期ずれは分からない。以上のことから、同期ずれの分からない再生信号が得られることになる。
以上で示したように、実施の形態3によれば、符号化多重データを途中から読み出し、映像と音声の同期のあった復号化信号を得ようとするとき、対になったオーディオ符号化データとビデオ符号化データの先頭から正確に読み出す必要はなく、オーディオ符号化データとビデオ符号化データの先頭の大体の位置が分かっていれば、その位置の少し前の適当な位置から読み出せばよい。
なお、実施の形態3では改良型ビデオデコーダ22はシーケンスヘッダをスタートコードとしてデコードスタートすると説明したが、これに限るものではなく、シーケンスヘッダをGOPヘッダ、ピクチャヘッダに置き換えてもよい。
また、実施の形態3ではディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態3では符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
さらに、実施の形態3では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けをマイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
実施の形態4.
次に、実施の形態3に示したディジタル情報符号化・復号装置において、符号化多重データの任意の位置から読み出しても映像と音声の同期がとれる機能を組み入れた場合について説明する。
なお、ディジタル情報復号装置は、図9に示した実施の形態3のディジタル情報復号装置と同じものを用いるものとする。
図10は、実施の形態4によるディジタル情報符号化装置の構成を示すブロック図である。図10を実施の形態1の図1と比べると、簡易型マルチプレクサ7が改良型マルチプレクサ21になっている以外は図1と同じである。
ここで、改良型マルチプレクサ21の動作は、図6に示すビデオ符号化データおよびオーディオ符号化データの分割、図7に示すビデオ符号化データの構成、図4に示すパックヘッダおよびパケットヘッダの構成については、実施の形態3の図1に示した簡易型マルチプレクサ7と同じである。ただし、パケットヘッダに続くデータの構成が簡易型マルチプレクサ7とは異なる。改良型マルチプレクサ21が作成するデータの構成について図11を用いて説明する。
ここで、最初に出力される1GOP分のビデオ符号化データについては、図7に示したシーケンスヘッダで始まり、GOPヘッダ、15個分のピクチャデータが続き、最後に次のGOPのシーケンスヘッダまでを含むものとする。そして、2つ目以降に出力される1GOP分のビデオ符号化データでは、GOPヘッダで始まり、15個分のピクチャデータが続き、最後に次のGOPのシーケンスヘッダまでを含むものとする。
ここで、以上に示したディジタル情報符号化・復号装置を用いて、ディジタル蓄積メディア8の途中の任意の位置からデータを読み出した場合の動作について説明する。
図11において、実施の形態3と同じビデオ符号化データの途中であるB点からデータを読み出した場合を考える。この時には、第2シーケンスヘッダが読み出されるため、実施の形態3と同様に、2つめのGOPから映像と音声の同期がほとんどあった復号信号を得ることができる。
次に、図11において、オーディオ符号化データの途中であるC点からデータを読み出した場合を考える。そのときには、途中から読み出されたオーディオデータはパックヘッダ・パケットヘッダが読み込まれていないため、簡易型デマルチプレクサ11でビデオ符号化データでもオーディオ符号化データでもないデータとして、破棄される。
次に、ビデオ符号化データが読み込まれ、簡易型デマルチプレクサ11によってビデオバッファ12に送られ、それに続くオーディオ符号化データ・ビデオ符号化データが順次簡易型デマルチプレクサ11によってオーディオバッファ16とビデオバッファ12に送られる。
改良型ビデオデコーダ22では、最初に図11に示す第2GOPヘッダで始まる一連のデータを読み込む。しかし、シーケンスヘッダが無いために、シーケンスヘッダが現れるまでビデオ符号化データを読み飛ばし、デコードを行わない。そして、次に現れる第3シーケンスヘッダを受け取ったときに、それに続くビデオ符号化データのデコードを開始する。すなわち、改良型ビデオデコーダ22では、3番目のGOPデータからデコードを始めることになる。
オーディオ符号化データは、ビデオ符号化データの3番目のGOPデータと時刻が一致するデータから正常に読み出されることになる。改良型ビデオデコーダ22がデコードを開始すると同時にオーディオデコーダ18もデコードを開始する。その結果、対になった3番目のオーディオ符号化データとビデオ符号化データから読み出されたのと同じ状態になる。この場合、図6に示すように、対になったオーディオ符号化データとビデオ符号化データは、オーディオ符号化データの1フレーム分以下の時間、すなわち24msec以下のずれでオーディオ符号化データが時間的に先行したものとなっている。そのため、これらのデータを同時にデコードを開始すると、24msec以下の同期ずれでオーディオ信号出力が遅れたものになる。24msec以下のオーディオ信号出力の遅れは、検知限界以下であり、同期ずれは分からない。以上のことから、同期ずれの分からない再生信号が得られることになる。
以上のように、実施の形態4のディジタル情報符号化・復号装置によれば、簡単な回路構成で、ディジタル蓄積メディア8の任意の位置から読み出しても映像と音声の同期ずれがほとんど無い復号信号を得ることができる。
なお、実施の形態4では改良型ビデオデコーダ22はシーケンスヘッダをスタートコードとしてデコードスタートすると説明したが、これに限るものではなく、シーケンスヘッダをGOPヘッダ、ピクチャヘッダに置き換えてもよい。
また、実施の形態4ではディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態4では符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
さらに、実施の形態4では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けをマイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
実施の形態5.
次に、実施の形態4に示したディジタル情報符号化・復号装置において、デマルチプレクサを改良した例について説明する。なお、ディジタル情報符号化装置は、図10に示した実施の形態4のディジタル情報符号化装置を用いることとする。
図12は、実施の形態5によるディジタル情報復号装置の構成を示すブロック図である。図12を実施の形態4の図9と比べると、簡易型デマルチプレクサ11が改良型デマルチプレクサ23になっている以外は図9と同じである。
ここで、改良型デマルチプレクサ23の動作について説明する。改良型デマルチプレクサ23には、実施の形態4と同じように図11に示されるような符号化多重データが入力される。図11で示したような多重化構造の場合、符号化オーディオデータが含まれているデータのパックヘッダの先頭、すなわちD点から読み出した場合、最初に読み出されるオーディオ符号化データはデコードされるが、それに続くビデオ符号化データはシーケンスヘッダが無いためにデコードされず、その結果、復号信号における映像信号と音声信号の同期が1GOP分ずれてしまうという現象が起こってしまう。
そのため、実施の形態5では、改良型デマルチプレクサ23の動作を図13のフローチャートで示されるようなものにする。まず、読み出し開始時にビデオ符号化データが入力された場合、通常の動作をすることにより映像信号と音声信号の同期のとれた復号信号を得ることができる。次に、読み出し開始時にオーディオ符号化データが入力された場合、すなわち、符号化多重データの先頭から読み出すか、またはD点から読み出した場合は、入力されたオーディオ符号化データをオーディオバッファ16に出力した後、入力されるビデオ符号化データの先頭を確認し、シーケンスヘッダが存在した場合、すなわち符号化多重データの先頭から読み出していると確認できた場合は通常の処理を行なう。シーケンスヘッダが存在しなかった場合は、D点から読み出したものと判断し、オーディオバッファ16に対して現在保持しているデータをすべて破棄するように指示する。以上の処理により、符号化多重データのどの位置から読み出しても、同期のあった復号信号を得ることができる。
また、オーディオバッファ16に対して現在保持しているデータを破棄するように指示するという処理は、改良型デマルチプレクサ23がオーディオバッファ16にオーディオ符号化データを出力しないという処理に置き換えることもできる。
以上のように、実施の形態5のディジタル情報符号化・復号装置によれば、簡単な回路構成で、ディジタル蓄積メディア8の任意の位置から読み出しても同期ずれの無い再生信号が得られる。
なお、実施の形態5では改良型ビデオデコーダ22はシーケンスヘッダをスタートコードとしてデコードスタートすると説明したが、これに限るものではなく、シーケンスヘッダをGOPヘッダ、ピクチャヘッダに置き換えてもよい。
また、実施の形態5ではディジタル記録媒体に記録されたビデオ符号化データとオーディオ符号化データの復号を、同期ずれを起こすことなく行なう装置について説明したが、記録されるデータはこれに限るものではない。例えば、様々な楽器からの音声信号や、ボーカルの音声信号を個別に符号化し、同期再生を行なってもよい。
また、実施の形態5では符号化多重データをディジタル蓄積メディアから読み出す構成について説明したが、これ限るものではない。例えば、ケーブルテレビ等の通信メディアから符号化多重データを読み出してもよい。
また、実施の形態5では、符号化多重データからのビデオ符号化データとオーディオ符号化データの切り分けを、マイクロコンピュータの外部のマルチプレクサを用いて行なう構成を説明したが、同一のマイクロコンピュータ内で切り分けを行なってもよい。
さらに、実施の形態5では、オーディオ符号化データを破棄する一連の処理を、マイクロコンピュータの外部の改良型デマルチプレクサで行なう構成を説明したが、同一のマイクロコンピュータ内で行なってもよい。
実施の形態1〜3によるディジタル情報符号化装置の構成を示すブロック図である。 実施の形態1によるビデオ符号化データとオーディオ符号化データの分割の様子を説明するための図である。 実施の形態1による符号化多重データの構成を示す図である。 実施の形態1,2および4によるパックヘッダおよびパケットヘッダの構成を示す図である。 実施の形態1および2によるディジタル情報復号装置の構成を示すブロック図である。 実施の形態2〜4によるビデオ符号化データとオーディオ符号化データの分割の様子を説明するための図である。 実施の形態2〜4によるビデオ符号化データの構成を示す図である。 実施の形態2〜4による符号化多重データの構成を示す図である。 実施の形態3および4によるディジタル情報復号装置の構成を示すブロック図である。 実施の形態4および5によるディジタル情報符号化装置の構成を示すブロック図である。 実施の形態4および5による符号化多重データの構成を示す図である。 実施の形態5によるディジタル情報符号化装置の構成を示すブロック図である。 実施の形態5によるデマルチプレクサの初期動作を説明するフローチャートである。 従来例における符号化多重データの構成を示す図である。 従来例における符号化装置の構成を示すブロック図である。 従来例における復号装置の構成を示すブロック図である。
符号の説明
1 ビデオA/D変換器、 2 ビデオエンコーダ、 3 ビデオバッファ、 4 オーディオA/D変換器、 5 オーディオエンコーダ、 6 オーディオバッファ、 7 簡易型マルチプレクサ、 8 ディジタル蓄積メディア、 9 バッファ、 10 切り換え器、 11 簡易型デマルチプレクサ、 12 ビデオバッファ、 13 ビデオ切り換え器、 14 ビデオデコーダ、 15 ビデオD/A変換器、 16 オーディオバッファ、 17 オーディオ切り換え器、 18 オーディオデコーダ、 19 オーディオD/A変換器、 20 マイクロコンピュータ、 21 改良型マルチプレクサ、 22 改良型ビデオデコーダ。

Claims (3)

  1. オーディオ符号化データ列を、ビデオ符号化データ列の分割箇所と同じ時刻か、あるいは、映像と音声の同期ずれが、人間の検知できない程度の時間差だけ前記ビデオ符号化データ列の分割箇所よりも早い時刻で分割し、上記オーディオ符号化データ列を同じ時刻の上記ビデオ符号化データ列より先に配列し、分割された上記ビデオ符号化データ列の先頭にスタートコードを挿入する符号化多重データを作成するマルチプレクサと、
    上記ビデオ符号化データ列中の上記スタートコードを受け取ることによりデコードを開始するビデオデコーダと、
    上記ビデオデコーダのデコード開始と同時にデコードを開始するオーディオデコーダと
    を備えたことを特徴とするディジタル情報符号化・復号装置。
  2. オーディオ符号化データ列を、ビデオ符号化データ列の分割箇所と同じ時刻か、あるいは、映像と音声の同期ずれが、人間の検知できない程度の時間差だけ前記ビデオ符号化データ列の分割箇所よりも早い時刻で分割し、上記オーディオ符号化データ列を同じ時刻の上記ビデオ符号化データ列より先に配列し、分割された上記ビデオ符号化データ列のスタートコードを同じ時刻のオーディオ符号化データ列の直前に挿入する符号化多重データを作成するマルチプレクサと、
    上記ビデオ符号化データ列中の上記スタートコードを受け取ることによりデコードを開始するビデオデコーダと、
    上記ビデオデコーダのデコード開始と同時にデコードを開始するオーディオデコーダと
    を備えたことを特徴とするディジタル情報符号化・復号装置。
  3. オーディオ符号化データ列を、ビデオ符号化データ列の分割箇所と同じ時刻か、あるいは、映像と音声の同期ずれが、人間の検知できない程度の時間差だけ前記ビデオ符号化データ列の分割箇所よりも早い時刻で分割し、上記オーディオ符号化データ列を同じ時刻の上記ビデオ符号化データ列より先に配列し、分割された上記ビデオ符号化データ列のスタートコードを同じ時刻のオーディオ符号化データ列の直前に挿入する符号化多重データを作成するマルチプレクサと、
    最初に上記オーディオ符号化データ列が入力され、その直後の上記ビデオ符号化データ列の先頭に上記スタートコードが存在しないときに、最初に入力された上記オーディオ符号化データ列を破棄するデマルチプレクサと、
    上記ビデオ符号化データ列中の上記スタートコードを受け取ることによりデコードを開始するビデオデコーダと、
    上記ビデオデコーダのデコード開始と同時にデコードを開始するオーディオデコーダと
    を備えたことを特徴とするディジタル情報符号化・復号装置。
JP2005011693A 2005-01-19 2005-01-19 ディジタル情報符号化・復号装置 Pending JP2005168048A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005011693A JP2005168048A (ja) 2005-01-19 2005-01-19 ディジタル情報符号化・復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005011693A JP2005168048A (ja) 2005-01-19 2005-01-19 ディジタル情報符号化・復号装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP6198458A Division JPH0863884A (ja) 1994-08-23 1994-08-23 ディジタル情報符号化・復号装置

Publications (1)

Publication Number Publication Date
JP2005168048A true JP2005168048A (ja) 2005-06-23

Family

ID=34737555

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005011693A Pending JP2005168048A (ja) 2005-01-19 2005-01-19 ディジタル情報符号化・復号装置

Country Status (1)

Country Link
JP (1) JP2005168048A (ja)

Similar Documents

Publication Publication Date Title
KR100296528B1 (ko) 다중화데이타분리장치및방법
JP5059301B2 (ja) 同期再生装置および同期再生方法
US7881584B2 (en) Reproducing apparatus and method, and recording medium
JPH10164508A (ja) オーディオ・ビデオ同期再生装置
JP3692164B2 (ja) Mpegデコーダ
JP2008123693A (ja) 再生装置、再生方法及びその記録媒体
JPH0863884A (ja) ディジタル情報符号化・復号装置
KR100240331B1 (ko) 디코더 시스템의 비디오/오디오 동기화 장치
JP3592906B2 (ja) データ処理同期装置
JP2005168048A (ja) ディジタル情報符号化・復号装置
JP2008176918A (ja) 再生装置、再生方法及びその記録媒体
JP2003348543A (ja) データ復号器およびデータ復号化方法
JP4690965B2 (ja) データ記録再生装置
JP2001111610A (ja) 情報データ伝送システムの受信装置
JP4241220B2 (ja) ディジタル記録再生装置及び再生レート制御方法
JP5168105B2 (ja) 音声再生装置、及び音声再生方法
JP2002318600A (ja) 音声信号再生装置
JP2003087749A (ja) 画像データ再生装置および画像データ再生方法
JP2004200798A (ja) Mpegトランスポートストリーム生成装置、mpegトランスポートストリーム記録再生装置
JP2001268519A (ja) 記録装置
JP2002027407A (ja) トランスポートストリーム記録再生装置
JPH1023401A (ja) データ多重化方法及び多重データ再生方法、多重データ再生装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061017

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061208

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070305

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070406

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070511