JPH10200858A - 映像信号および音声信号の符号化装置、符号化方法、復号装置および復号方法並びに記録媒体 - Google Patents

映像信号および音声信号の符号化装置、符号化方法、復号装置および復号方法並びに記録媒体

Info

Publication number
JPH10200858A
JPH10200858A JP121797A JP121797A JPH10200858A JP H10200858 A JPH10200858 A JP H10200858A JP 121797 A JP121797 A JP 121797A JP 121797 A JP121797 A JP 121797A JP H10200858 A JPH10200858 A JP H10200858A
Authority
JP
Japan
Prior art keywords
data
audio data
gop
audio
video data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP121797A
Other languages
English (en)
Inventor
Masahiro Shigenobu
正大 重信
Koji Inoue
光司 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP121797A priority Critical patent/JPH10200858A/ja
Publication of JPH10200858A publication Critical patent/JPH10200858A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

(57)【要約】 【課題】 MPEG2で圧縮された映像データと、AT
RACで符号化された音声データとの同期を取り記録媒
体に記録/再生を行うとができる。 【解決手段】 記録媒体13には、GOP単位で記録/
再生を行う。GOPは、ヘッダ情報、映像データおよび
音声データから構成される。1GOPは、例えば15フ
レーム(約0.5秒)からなり、音声データのサンプル
数を整数個とするために、サンプリング周波数を48.
0kHz と設定される。このときのサンプル数が24,0
24個であり、このサンプル数を47個のサウンドグル
ープに分ける。1サウンドグループのサンプル数は、5
11個または512個となる。511個のサンプル数の
サウンドグループを扱うときは、例外処理として、1つ
前のサンプルをダミーとして用い、512個のサウンド
グループとして処理を行う。このサウンドグループが5
11個か512個かは、ヘッダ情報に記録される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、異なる単位で圧
縮が施された映像信号および音声信号を同期させること
が可能な映像信号および音声信号の符号化装置、符号化
方法、復号装置および復号方法並びに記録媒体に関す
る。
【0002】
【従来の技術】現在、音声信号に圧縮処理を施し、ディ
スクまたはテープ等の記録媒体に記録/再生を行う手法
として、標準化されたATRAC(Adaptive Transform
Acoustic Coding)が知られている。このATRAC
は、MD(Mini Disk )に採用されている。また、映像
信号と音声信号とに圧縮処理を施し、ディスクまたはテ
ープ等の記録媒体に記録/再生を行う手法として、標準
化されたMPEG2(Moving Picture Experts Group p
hase 2)が知られている。このMPEG2は、DVD
(Digital Video Disk)やディジタル放送等に採用され
ている。
【0003】
【発明が解決しようとする課題】映像信号を圧縮してデ
ィスクやテープ等のメディアに記録する方式が多数提案
されている。その1つが上述したMPEG2であり、こ
のMPEG2では、映像信号の圧縮が15フレーム(約
0.5秒)単位で行われるものが主流となりつつある。
この圧縮の単位をGOP(Group of Pictures )と呼
ぶ。NTSC方式において、GOPの時間は、正確に
は、1001/2000秒と規定されており、この単位
で映像信号と音声信号の同期を取るためには、音声信号
のサンプリング周波数とGOP周波数(2000/10
01Hz)がある関係、例えば整数比の関係になければい
けない。
【0004】具体的には、MDやCD等で用いられるサ
ンプリング周波数は、44.1kHzであるが、この周波
数では、1GOP(1001/2000秒)の中のサン
プル数が22,072.05個と小数になり、映像信号
と音声信号の同期を取るのは困難であった。すなわち、
これら標準化された圧縮の手法において、相互間で利用
することは困難であった。
【0005】従って、この発明の目的は、例えば上述の
ATRACおよびMPEG2のように、異なる単位で圧
縮された映像信号および音声信号を同期させることが可
能な映像信号および音声信号の符号化装置、符号化方
法、復号装置および復号方法並びに記録媒体を提供する
ことにある。
【0006】
【課題を解決するための手段】請求項1に記載の発明
は、映像データをMPEGで符号化し、圧縮映像データ
を生成する映像符号化手段と、圧縮映像データのGOP
単位で一定となるサンプル数が含まれるように、音声信
号のサンプリング周波数を設定し、サンプリング周波数
で音声信号をディジタル化するA/D変換手段と、A/
D変換手段からの音声データを符号化し、符号化音声デ
ータを生成する音声符号化手段と、符号化音声データを
複数個のグループに分け、圧縮映像データおよび複数の
グループに分けられた符号化音声データをGOP毎に記
録媒体に記録する記録手段とからなることを特徴とする
映像信号および音声信号の符号化装置である。
【0007】請求項4に記載の発明は、記録媒体に記録
された圧縮映像データおよび符号化音声データをGOP
単位で読み出す読み出し手段と、圧縮映像データをMP
EGで復号し、映像データを復号する映像復号手段と、
符号化音声データをGOPのヘッダ情報に基づいて復号
し、音声データを復号する音声復号手段と、映像データ
および音声データをGOP単位で同期させる手段とから
なることを特徴とする映像信号および音声信号の復号装
置である。
【0008】請求項6に記載の発明は、映像データをM
PEGで符号化し、圧縮映像データを生成するステップ
と、圧縮映像データのGOP単位で一定となるサンプル
数が含まれるように、音声信号のサンプリング周波数を
設定し、サンプリング周波数で音声信号をディジタル化
するステップと、ディジタル化された音声データを符号
化し、符号化音声データを生成するステップと、符号化
音声データを複数個のグループに分け、圧縮映像データ
および複数のグループに分けられた符号化音声データを
GOP毎に記録媒体に記録するステップとからなること
を特徴とする映像信号および音声信号の符号化方法であ
る。
【0009】請求項7に記載の発明は、記録媒体に記録
された圧縮映像データおよび符号化音声データをGOP
毎に読み出すステップと、圧縮映像データをMPEGで
復号し、映像データを復号するステップと、符号化音声
データをGOPのヘッダ情報に基づいて復号し、音声デ
ータを復号するステップと、映像データおよび音声デー
タをGOP単位で同期させるステップとからなることを
特徴とする映像信号および音声信号の復号方法である。
【0010】請求項8に記載の発明は、MPEGが施さ
れた圧縮映像データと、符号化が施された符号化音声デ
ータとを記録するようにした記録媒体において、圧縮映
像データおよび符号化音声データを記録する記録部を有
し、記録部には、GOPを単位として、ヘッダ情報と、
圧縮映像データと、符号化音声データが記憶され、符号
化音声データは、GOP単位で一定となるようにディジ
タル化された音声データを符号化すると共に、GOP単
位のサンプル数が複数個のグループに分けられるように
形成されたことを特徴とする記録媒体である。
【0011】この発明は、映像信号をMPEGで圧縮を
施し、音声信号をATRACで圧縮を施した後、1GO
Pを単位として、同期が取られ、記録媒体に記録するこ
とができる。また、記録媒体に記録されたデータは、1
GOP毎に再生することができ、そのときの映像信号と
音声信号との同期も容易にとることができる。そして、
記録媒体に記録されたデータは、1GOP毎にアフレコ
(アフターレコーディング)を行うこもでき、映像信号
および音声信号、また音声信号のみでも容易にアフレコ
を行うことができる。
【0012】
【発明の実施の形態】以下、この発明の一実施例を図面
を参照して説明する。この一実施例では、ATRACに
より圧縮されるオーディオデータのサンプリング周波数
をDVD等で用いられている48.0kHz とする。4
8.0kHz のサンプリング周波数では、1GOPの中に
24,024個の整数個のサンプリング点が存在するこ
とになる。それによって、映像信号と音声信号との同期
をとることを可能とするものである。なお、サンプリン
グ周波数としては、48.0kHz に限らず他の周波数、
例えば96.0kHz を使用しても良い。
【0013】この発明の一実施例の全体ブロック図を図
1に示す。まず、記録側において、1で示すビデオカメ
ラから音声信号および映像信号が出力される。ビデオカ
メラ1から出力される音声信号はMIC.OUTとし
て、Lチャンネルの音声信号がA/D変換器2へ供給さ
れ、Rチャンネルの音声信号がA/D変換器3へ供給さ
れる。A/D変換器2および3は、クロック発生器(C
LK GEN)5から供給された48.0kHz の周波数
のサンプリングクロックによって、ディジタル化を行
う。
【0014】A/D変換器2および3からの音声データ
は、メモリ6へ供給される。メモリ6は、映像データと
音声データのタイミングを調整するためのものである。
CPU12の制御によって、メモリ6から音声データが
ATRACエンコーダ8へ供給される。音声データは、
例えば16ビットからなるリニアPCM(Pulse CodeMo
dulation )データであり、時分割されたLチャンネル
とRチャンネルの音声信号である。ATRACエンコー
ダ8では、CPU12からのコントロール信号に基づい
て、後述するようにGOPに対応する音声データが47
個のサウンドグループに分けられる。サウンドグループ
に分けられた音声信号は、マルチプレクサ(MUX)1
0へ供給される。
【0015】映像信号は、ビデオカメラ1からCCD
OUTとして、A/D変換器4へ供給される。A/D変
換器4には、クロック発生器5から13.5kHz の周波
数のサンプリングクロックが供給され、映像信号がディ
ジタル化される。ディジタル化された映像データは、カ
メラプロセス回路7へ供給される。カメラプロセス回路
7では、γ補正およびアパーチャ補正等のカメラ信号処
理が行われ、輝度データYおよび色差データCが生成さ
れる。この色差データCは、時分割された色差データC
b(青の色差データ)および色差データCr(赤の色差
データ)からなる。輝度データYおよび色差データC
は、それぞれ8ビットのデータとしてMPEGエンコー
ダ9へ供給される。MPEGエンコーダ9では、CPU
12からのGOPを指示する信号等のコントロール信号
に基づいて、輝度データYおよび色差データCがMPE
G2で符号化される。符号化された映像データは、マル
チプレクサ10へ供給される。
【0016】マルチプレクサ10は、符号化された音声
データと符号化された映像データとCPU12からのヘ
ッダ情報とが供給され、ヘッダ情報の付加、音声信号の
例外処理を行う。マルチプレクサ10からは、図2に示
すように映像信号と音声信号とヘッダ情報が合成された
記録データが出力される。記録データは、チャンネルコ
ーディング回路11へ供給される。チャンネルコーディ
ング回路11では、(1,7)RLLの変調、スクラン
ブルおよびエラー訂正のエンコーディング等の処理が行
われる。これらの処理が施されたデータは、ビットスト
リームで記録媒体13へ記録される。この記録媒体13
は、磁気または光テープ、MO(光磁気)ディスク等の
記録可能なディスク、メモリカード等の半導体メモリ等
である。
【0017】次に再生側において、記録媒体13からビ
ットストリームで読み出されたデータは、チャンネルデ
コーディング回路21へ供給される。チャンネルデコー
ディング回路21では、(1,7)RLLの復調、ディ
スクランブルおよびエラー訂正等の処理が行われる。こ
れらの処理が行われたデータは、ディマルチプレクサ2
2へ供給される。ディマルチプレクサ22では、供給さ
れたデータからヘッダ情報、映像データおよび音声デー
タが分離され、音声データはATRACデコーダ23へ
供給され、映像データはMPEGデコーダ24へ供給さ
れる。また、ディマルチプレクサ22で分離されるヘッ
ダ情報は、CPU12へ供給される。CPU12では、
供給されたヘッダ情報から音声信号の例外処理の位置等
の復号に必要な情報が検出され、その情報はコントロー
ル信号としてATRACデコーダ23およびMPEGデ
コーダ24へ供給される。
【0018】ATRACデコーダ23では、CPU12
からのコントロール信号に基づいて、ATRACで符号
化された音声データが復号される。復号された音声デー
タは、時分割されたLチャンネルとRチャンネルの音声
信号であり、メモリ25へ供給される。メモリ25は、
CPU12の制御によって、映像データと音声データの
タイミングを調整するものである。メモリ25から読み
出された音声データは、ディジタルフィルタ27へ供給
される。ディジタルフィルタ27は、後段のD/A変換
器28および29に対するプリフィルタであり、Lチャ
ンネルの音声データは、D/A変換器28へ供給され、
Rチャンネルの音声データは、D/A変換器29へ供給
される。アナログ化された音声信号は、それぞれ出力端
子30および31を介してTVモニタ33の音声信号入
力端子へ供給される。
【0019】ディマルチプレクサ22から映像データが
供給されたMPEGデコーダ24では、CPU12から
のGOPを指示する信号等のコントロール信号に基づい
て、MPEG2の復号を行う。復号された輝度データY
および色差データCは、それぞれ8ビットのデータとし
てビデオエンコーダ26へ供給される。復号された色差
データCは、時分割された色差データCrおよび色差デ
ータCbである。ビデオエンコーダ26では、供給され
た輝度データYと色差データCからNTSC信号または
RGB信号が復号される。ビデオエンコーダ26には、
D/A変換器が含まれビデオエンコーダ26からアナロ
グのNTSC信号またはRGB信号が出力される。NT
SC信号またはRGB信号は、出力端子32を介してT
Vモニタ33の映像信号入力端子へ供給される。
【0020】ここで、この発明の要旨となる、MPEG
2によって圧縮された映像データとATARCによって
圧縮された音声データとを同期して記録する方法の一例
を具体的に説明する。音声信号のサンプリング周波数
は、GOP周波数(2000/1001Hz)の整数倍の
周波数が設定される。具体的には、GOP周波数とサン
プリング周波数の最小公倍数が小さく、一般的に用いら
れている48.0kHz を音声信号のサンプリング周波数
とする。このサンプリング周波数から求められる1GO
P中の音声データのサンプル数は、24,024個であ
る。ATRACエンコーダは、8通りのモードが定義さ
れており、この実施例では、一例としてコーディングモ
ード:ATRAC(1),Level1,Channe
lNo.=2について説明する。
【0021】このコーディングモードは、音声データの
片チャンネルの512個のサンプル数を212バイトの
圧縮データにエンコードするものである。この512個
のサンプル数のATRACの処理単位をサウンドグルー
プ(SG)と呼ぶことにする。以下、説明を容易とする
ためにLチャンネルのみについて説明する。24,02
4個の音声データのサンプル数を512個のサンプル単
位に区切ると、46個のサウンドグループ+472個の
音声データのサンプル数となる。従って、サウンドグル
ープを47個分用意すれば、端数は生じるが、1GOP
分の音声データを格納することができる。
【0022】この48.0kHz のサンプリング周波数で
サンプリングされた1GOP分の音声データのサンプル
数の24,024個と1GOP分の音声データのサンプ
ルとを比較すると、1GOP分の音声データのサンプル
数は、 47(SG)×512(サンプル)=24064(サン
プル) であるから、1GOPのサンプル数(24,024個)
に対して40個のサンプルの端数が生じる。
【0023】この40個のサンプルを吸収するために、
この実施例では、47個のサウンドグループのうち40
個のサウンドグループについて、実際に使用される音声
データのサンプル数を1個減らして511個として、符
号化が実行される。このように、有効なサンプル数を1
個減少させる処理が例外処理である。残りの7個のサウ
ンドグループについては、音声データのサンプル数を5
12個として、符号化が実行される。この512個の音
声データのサンプル数からなるサウンドグループは、出
来るだけ47個のサウンドグループ中に均等に配置させ
る。例えば、0、7、14、21、27、34、41番
目に512個の音声データのサンプルからなるサウンド
グループを配置させることによって、ほぼ均等に音声デ
ータを配置することができる。
【0024】40(SG)×511(サンプル)+7
(SG)×512(サンプル)=24024(サンプ
ル) となり、1GOP分の音声データのサンプル数となる。
すなわち、1GOP(約0.5秒)を単位として、映像
データおよび音声データが完結することになる。
【0025】ここで、音声データのサンプル数が511
個のサウンドグループをATRACでエンコードすると
きの手法を簡単に説明する。上述したように、この実施
例で使われているATRACのエンコードでは、1サウ
ンドグループについて、512個の音声データのサンプ
ル数が必要である。しかしながら、1GOP分の音声デ
ータのサンプル数が24,024個のため、サンプル数
が511個のサウンドグループを40個作るようにし
た。このサンプル数が511個のサウンドグループをA
TRACでエンコードする場合、1つ前のサウンドグル
ープの512番目のサンプルをダミーデータとして使用
する。そのダミーデータ1個を加えて、サンプル数が5
12個となったサウンドグループがATARCでエンコ
ードされる。
【0026】次に再生について、説明する。再生時、す
なわちデコード時は、ATRACのデコーダから出力さ
れる512個のサンプルのうち、後半511個のサンプ
ルを実データとして使用すれば良い。最初の1サンプル
は、エンコード時、ダミーデータという扱いだったので
捨てる。サウンドグループの境目は、後述するように、
オーバーラップ分があり、窓関数の掛ける処理がなされ
るので、波形の連続性は、保たれる。よって、ダミーデ
ータとなる1サンプルの処理は、従来に比べてオーバー
ラップのサンプル数が1サンプルだけ増えると考えれば
良い。ただし、どのサウンドグループが511個のサン
プルを出力するのか、または512個のサンプルを出力
するのかは、エンコード時にヘッダ情報に記録しておく
必要がある。
【0027】図2に示すように、記録媒体には、上述し
たようにGOPのヘッダ情報、15フレームからなる1
GOP分(約0.5秒)の映像データおよび約0.5秒
(1GOP分)に相当する47サウンドグループからな
る音声データが最小単位として、扱われる。このとき、
1サウンドグループは、511個または512個のサン
プルからなり、1GOPで24,024個のサンプルが
存在する。そして、15フレームからなる映像データ
は、MPEG2で圧縮処理が施され、47サウンドグル
ープからなる音声データは、ATRACで圧縮処理が施
される。また、例外処理によって有効な音声データのサ
ンプル数が511個とされたサウンドグループの位置の
情報がヘッダ情報に記憶される。このヘッダ情報と、圧
縮が施された映像データと音声データとからなる記録デ
ータ(ビットストリーム)が(1,7)RLLの変調さ
れ、記録媒体へ記録される。
【0028】この記録媒体に対して、1GOP単位で映
像データと音声データとが記録される。まず、ヘッダ情
報に続いて、1GOP分の圧縮映像データ、さらに続い
て2チャンネル分の音声データが1GOPの期間で記録
される。ヘッダ情報には、どのサウンドグループが51
1個または512個のサンプル数かが記録されている。
この記録される音声データは、(47(SG)×2(c
h)=)94サウンドグループからなる。さらに、GO
P単位で映像データと音声データの位相は、常に合致し
ている。
【0029】そして、ユーザからGOP単位で再生箇所
の指定を受け取ると、指定場所からのビットストリーム
を復調した後、復調されたビットストリームは、映像デ
ータおよび音声データのデコーダへ入力される。映像デ
ータのデコーダは、MPEGデコーダ24であり、音声
データのデコーダは、ATRACデコーダ23である。
ATRACデコーダ23の出力は、一旦メモリ25に入
力される。この音声データは、デコードがなされた後、
メモリ25に記憶され、映像データとのタイミング合わ
せを行って後段へ出力される。ATRACデコーダ23
およびMPEGデコーダ24の出力は、GOP単位で完
結するので、一度同期を取ればずれることはない。
【0030】また、ATRACデコーダ23から受け取
る音声データは、サウンドグループ当り512個のサン
プル数であったり、511個のサンプル数であったりす
るが、上述したように、この例外処理のなされたサウン
ドグループが1GOP毎にヘッダ情報に書き込まれてい
るので、これを読み込むことによって、1GOP内のサ
ンプル数が丁度24,024個である音声データが得ら
れる。
【0031】このように、この一実施例では、1GOP
で映像データおよび音声データが完結しているので、イ
ンサートやアフレコ等をGOP単位で行うことは全く問
題なくできる。
【0032】図1中のATRACエンコーダ8の詳細な
ブロック図を図3に示す。メモリ6からの各サンプルが
16ビットからなるPCMデータ(リニアPCM)が入
力端子41を介してATRAC8へ供給される。このP
CMデータは、リングバッファ46へ供給される。ま
た、入力端子42からサウンドグループのサンプル数情
報がATRACエンコーダ8へ供給されると共に、出力
端子45から後段のマルチプレクサ10へ供給される。
このサウンドグループのサンプル数情報は、アドレス・
コントロール回路47へ供給される。
【0033】アドレス・コントロール回路47では、供
給されたサウンドグループのサンプル数情報からこのサ
ウンドグループが511個のサンプルからなるものか、
512個のサンプルからなるものかが判断される。この
アドレス・コントロール回路47でこのサウンドグルー
プは、511個のサンプルからなるサウンドグループで
あると判断されると、リングバッファ46から読み出さ
れる開始アドレスが1つ前にずらされる。リングバッフ
ァ46は、図4Aに示すように、サウンドグループ3個
分の容量からなり、入力PCMデータが記憶される。
【0034】乗算器48では、図4Aに示すように、リ
ングバッファ46から読み出されたPCMデータと窓関
数とが乗算される。この図4Aにおいて、実線部は、今
回の1サウンドグループ分の処理であり、破線部は、次
回の1サウンドグループ分の処理である。その乗算結果
は、帯域分割フィルタ49へ供給され、高域成分(H)
と中域成分(M)および低域成分(L)へ分割される。
高域成分(H)は、MDCT(Modified Discrete Cosi
ne Transform)51へ供給され、その他の成分は、帯域
分割フィルタ50へ供給される。帯域分割フィルタ50
では、供給された成分が中域成分(M)と低域成分
(L)へ分割される。分割された中域成分(M)は、M
DCT52へ供給され、低域成分(L)は、MDCT5
3へ供給される。
【0035】MDCT51、52および53では、供給
された高域成分、中域成分および低域成分に対して変形
DCTの演算が施され、各周波数成分に分解される。M
DCT51、52および53の出力は、ビット割当計算
回路54および正規化/量子化回路55へ供給される。
ビット割当計算回路54では、供給された各成分から計
算によって、割り当てられる量子化ビット数が算出され
る。量子化ビット数を表す情報は、正規化/量子化回路
55へ供給されるとともに、出力端子43から出力さ
れ、後段のマルチプレクサ10へ供給される。
【0036】正規化/量子化回路55では、量子化ビッ
ト数の情報から量子化ビット数を決定し、その量子化ビ
ット数を用いてMDCT51、52および53から供給
された高域成分、中域成分および低域成分(AC成分)
に対して量子化が実行される。さらに、量子化がなされ
た各AC成分に対して正規化が実行される。また、正規
化/量子化回路55からは、処理後のAC成分がスペク
トル情報として、DC成分とともに出力され、この出力
が出力端子44を介して後段のマルチプレクサ10へ供
給される。
【0037】ここで、音声データのサンプル数が511
個のサウンドグループをATRACでエンコードする手
法を具体的に説明する。この実施例で使われているAT
RACのエンコードは、1サウンドグループすなわち5
12個の音声データのサンプル数を単位として実行され
る。しかしながら、実際には、この512個のサンプル
以外に前後をそれぞれ256個のサンプルを加えて、合
計1024個のサンプルのデータを持ってきて、窓関数
を掛けてATRACのエンコードは行われる。この窓関
数は、図4に示すように、1024個の全サンプル数の
両端を0でうめるような関数である。
【0038】当然、511個のサンプルを扱うときも1
024個のサンプルをATRACエンコーダの入力とし
て用いる。ただし、この場合の有効サンプル数は、1サ
ンプル減り、258番目から768番目までの511個
のサンプルとなる。すなわち、図4Bに示すように、n
番目のサウンドグループをエンコードする場合、中心と
なるサウンドグループのサンプル数の512個と、その
サウンドグループの前後の256個のサンプルの合計
1,024個がATRACエンコーダに入力される。
【0039】しかしながら、次のn+1番目のサウンド
グループをエンコードする場合、サウンドグループのサ
ンプル数は511個のため、n番目のサウンドグループ
の512番目を含めてサンプルを512個とし、その5
12個のサウンドグループの前後の256個のサンプル
の合計1,024個がATRACエンコーダに入力され
る。すなわち、サウンドグループのサンプルが511個
の場合、1サンプルだけ重なって、処理されるが、この
重なった部分は、n番目のサウンドグループの符号化の
処理においては、本来の処理であり、今回(n+1番
目)のサウンドグループの符号化の処理では、ダミーデ
ータとして処理される。
【0040】図1中のATRACデコーダ24の詳細な
ブロック図を図5に示す。入力端子61から量子化ビッ
ト数の情報および正規化係数の情報がATRACデコー
ダ24へ供給され、同様に入力端子62からスペクトル
情報がATRACデコーダ24へ供給される。また、入
力端子63からサウンドグループのサンプル数情報がA
TRACデコーダ24へ供給されると共に、出力端子6
5を介してCPU12へ供給される。
【0041】ATRACデコーダ24に供給された量子
化ビット数の情報、正規化係数の情報およびスペクトル
情報がスペクトル復元回路71へ供給される。スペクト
ル復元回路71では、供給されたスペクトル情報、正規
化係数の情報および量子化ビット数の情報からAC成分
が生成される。生成されたAC成分の高域成分(H)
は、IMDCT(逆MDCT)72へ供給される。同様
にAC成分の中域成分(M)は、IMDCT73へ供給
される。さらに、低域成分(L)のAC成分およびDC
成分は、IMDCT74へ供給される。
【0042】IMDCT72、73および74では、供
給された各成分に対して逆MDCT処理が施される。I
MDCT72で逆MDCT処理により得られた高域成分
の信号は、帯域合成フィルタ76へ供給される。また、
IMDCT73および74で逆MDCT処理により得ら
れた中域成分および低域成分の信号は、帯域合成フィル
タ75へ供給される。帯域合成フィルタ75では、中域
成分の信号と低域成分の信号とが合成され、その合成信
号は、帯域合成フィルタ76へ供給される。帯域合成フ
ィルタ76では、高域成分と合成信号との合成が行わ
れ、その合成信号は、乗算器77へ供給される。
【0043】乗算器77では、窓関数と合成信号との乗
算が行われ、その乗算結果は、リングバッファ78に記
録される。この窓関数は、図4に示すように、1024
個の全サンプル数の両端を0でうめるような関数であ
る。図4Aに示すように、今回の窓関数により得られた
乗算結果と、次回の窓関数により得られた乗算結果との
オーバーラップとをリングバッファ78に書き込む時
は、前に書き込んだデータを読み出し、読み出したデー
タと現データとを加算する。このように合成された窓関
数は、リングバッファ78に記録される。このリングバ
ッファ78は、サウンドグループ3個分の容量からな
る。アドレス・コントロール回路79では、入力端子6
3から供給されたサウンドグループのサンプル数情報か
らリングバッファ78に記録されたサウンドグループが
511個のサンプルからなるものか、512個のサンプ
ルからなるものかが判断される。このアドレス・コント
ロール回路79でこのサウンドグループは、511個の
サンプルからなるサウンドグループであると判断される
と、リングバッファ78の開始アドレスが1つ前にずら
される。リングバッファ78から16ビットからなるP
CMデータが読み出されるときに、ダミーデータの1サ
ンプル分を取り除き、出力端子64から後段のメモリ2
5へ供給される。
【0044】この一実施例を適用して動き予測を用いた
動画圧縮メディアの場合、映像データあるいは映像デー
タおよび音声データの編集は、GOP単位で行うことが
一般的なので、上述の通り問題は生じない。しかしなが
ら、音声データのみのアフレコ等の場合、GOP単位と
は限らない。この音声データのみのアフレコの場合の1
つの方法は、サウンドグループ(511/512個のサ
ンプル)単位とすることである。これにより、より細か
い単位での編集作業が可能となる。ただし、サンプル数
が511個か512個かを知る必要があるため、編集開
始点がGOP内の何サウンドグループ目かを正しく認識
する必要がある。
【0045】さらに細かい編集作業を要求される場合に
は、記録時に編集開始箇所および編集終了箇所が含まれ
るサウンドグループのデータが読み込まれ、そのデータ
がデコードされた後、メモリに取り込まれる。そして、
更新すべきデータがメモリに書き込まれ、編集がなされ
た後、サウンドグループは、再度エンコードされて記録
媒体へ書き込まれる。という方法がある。この方法の場
合、1サンプル単位で編集が可能となるが、エンコード
/デコードを繰り返すため、編集開始点および編集終了
点を含むサウンドグループが編集の度に劣化する欠点を
持つ。しかしながら、最初から非可逆な圧縮を行ってい
る点、さらにサウンドグループが約10msと極めて短
い点から大きな問題はない。一般的には、サウンドグル
ープ単位のアフレコで十分である。
【0046】上述の実施例では、1サウンドグループの
データを512個のサンプルと仮定して説明したが、1
024個のサンプルの時も同様の考え方を適用できる。
その場合、1GOPが15フレームならば、GOP内の
サウンドグループは1チャンネル24となり、ダミーデ
ータの個数を変更する必要がある。さらに、1サウンド
グループあたりのサンプル数が別の値をとるとき、1G
OPのフレーム数が別の値をとるとき、音声データのサ
ンプリング周波数が異なる時も1GOPあたりの音声デ
ータのサンプル数が整数になりさえすれば、同様の考え
方を適用できる。このときも、GOP内のサウンドグル
ープ数、サウンドグループあたりのダミーデータ数を変
更することで、この発明を問題なく適用することができ
る。
【0047】
【発明の効果】この発明に依れば、MPEG圧縮された
映像データとATRAC圧縮された音声データとを同期
してメディアに記録することができる。
【0048】また、この発明に依れば、GOP単位で記
録/再生を行うことができ、このときどのGOPから再
生を開始しても映像と音声の同期(リップシンク)が守
られる。
【0049】さらに、この発明に依れば、1サウンドフ
レーム(約10.67ms)単位でアフレコを行うこと
ができる。
【図面の簡単な説明】
【図1】この発明の一実施例のブロック図である。
【図2】この発明に係るMPEGで圧縮を行う映像デー
タとATRACで圧縮を行う音声データとを説明するた
めの略線図である。
【図3】この発明に係るATRACエンコーダの一例を
示す略線図である。
【図4】この発明に係るATRACエンコーダを説明す
るための略線図である。
【図5】この発明に係るATRACデコーダの一例を示
す略線図である。
【符号の説明】
1・・・ビデオカメラ、2、3、4・・・A/D変換
器、5・・・クロック発生器、6、25・・・メモリ、
7・・・カメラプロセス回路、8・・・ATRACエン
コーダ、9・・・MPEGエンコーダ、10・・・マル
チプレクサ、11・・・チャンネルコーディング、12
・・・CPU、13・・・記録媒体、21・・・チャン
ネルデコーディング、22・・・逆マルチプレクサ、2
3・・・ATRACデコーダ、24・・・MPEGデコ
ーダ、26・・・ビデオエンコーダ、27・・・ディジ
タルフィルタ、28、29・・・D/A変換器、33・
・・TVモニタ
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04N 7/24 H04N 7/13 Z

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 映像データをMPEGで符号化し、圧縮
    映像データを生成する映像符号化手段と、 上記圧縮映像データのGOP単位で一定となるサンプル
    数が含まれるように、上記音声信号のサンプリング周波
    数を設定し、上記サンプリング周波数で上記音声信号を
    ディジタル化するA/D変換手段と、 上記A/D変換手段からの音声データを符号化し、符号
    化音声データを生成する音声符号化手段と、 上記符号化音声データを複数個のグループに分け、上記
    圧縮映像データおよび上記複数のグループに分けられた
    上記符号化音声データを上記GOP毎に記録媒体に記録
    する記録手段とからなることを特徴とする映像信号およ
    び音声信号の符号化装置。
  2. 【請求項2】 請求項1において、 上記グループ単位で映像データと同期して音声データを
    アフターレコーディングが行えるようにしたことを特徴
    とする映像信号および音声信号の符号化装置。
  3. 【請求項3】 請求項1において、 上記グループのサンプル単位で映像データと同期して音
    声データをアフターレコーディングが行えるようにした
    ことを特徴とする映像信号および音声信号の符号化装
    置。
  4. 【請求項4】 記録媒体に記録された圧縮映像データお
    よび符号化音声データをGOP単位で読み出す読み出し
    手段と、 上記圧縮映像データをMPEGで復号し、映像データを
    復号する映像復号手段と、 上記符号化音声データを上記GOPのヘッダ情報に基づ
    いて復号し、音声データを復号する音声復号手段と、 上記映像データおよび上記音声データを上記GOP単位
    で同期させる手段とからなることを特徴とする映像信号
    および音声信号の復号装置。
  5. 【請求項5】 請求項4において、 上記音声復号手段は、 上記ヘッダ情報から上記符号化音声データを構成するグ
    ループのサンプル数を読み取り、上記読み取られたサン
    プル数に基づいて上記符号化音声データを復号するよう
    にしたことを特徴とする映像信号および音声信号の復号
    装置。
  6. 【請求項6】 映像データをMPEGで符号化し、圧縮
    映像データを生成するステップと、 上記圧縮映像データのGOP単位で一定となるサンプル
    数が含まれるように、上記音声信号のサンプリング周波
    数を設定し、上記サンプリング周波数で上記音声信号を
    ディジタル化するステップと、 上記ディジタル化された音声データを符号化し、符号化
    音声データを生成するステップと、 上記符号化音声データを複数個のグループに分け、上記
    圧縮映像データおよび上記複数のグループに分けられた
    上記符号化音声データを上記GOP毎に記録媒体に記録
    するステップとからなることを特徴とする映像信号およ
    び音声信号の符号化方法。
  7. 【請求項7】 記録媒体に記録された圧縮映像データお
    よび符号化音声データをGOP毎に読み出すステップ
    と、 上記圧縮映像データをMPEGで復号し、映像データを
    復号するステップと、 上記符号化音声データを上記GOPのヘッダ情報に基づ
    いて復号し、音声データを復号するステップと、 上記映像データおよび上記音声データをGOP単位で同
    期させるステップとからなることを特徴とする映像信号
    および音声信号の復号方法。
  8. 【請求項8】 MPEGが施された圧縮映像データと、
    符号化が施された符号化音声データとを記録するように
    した記録媒体において、 上記圧縮映像データおよび上記符号化音声データを記録
    する記録部を有し、 上記記録部には、GOPを単位として、ヘッダ情報と、
    上記圧縮映像データと、上記符号化音声データが記憶さ
    れ、 上記符号化音声データは、上記GOP単位で一定となる
    ようにディジタル化された音声データを符号化すると共
    に、上記GOP単位のサンプル数が複数個のグループに
    分けられるように形成されたことを特徴とする記録媒
    体。
JP121797A 1997-01-08 1997-01-08 映像信号および音声信号の符号化装置、符号化方法、復号装置および復号方法並びに記録媒体 Pending JPH10200858A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP121797A JPH10200858A (ja) 1997-01-08 1997-01-08 映像信号および音声信号の符号化装置、符号化方法、復号装置および復号方法並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP121797A JPH10200858A (ja) 1997-01-08 1997-01-08 映像信号および音声信号の符号化装置、符号化方法、復号装置および復号方法並びに記録媒体

Publications (1)

Publication Number Publication Date
JPH10200858A true JPH10200858A (ja) 1998-07-31

Family

ID=11495309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP121797A Pending JPH10200858A (ja) 1997-01-08 1997-01-08 映像信号および音声信号の符号化装置、符号化方法、復号装置および復号方法並びに記録媒体

Country Status (1)

Country Link
JP (1) JPH10200858A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2006006714A1 (ja) * 2004-07-14 2008-05-01 セイコーエプソン株式会社 映像再生同期信号生成方法、映像再生同期信号生成プログラム、タイミング制御装置、映像音声同期再生方法、映像音声同期再生プログラム及び映像音声同期再生装置
JP2010061803A (ja) * 2003-04-04 2010-03-18 Victor Co Of Japan Ltd オーディオ/ビデオ記録装置、記録方法、再生装置、再生方法、再生プログラム及び記録プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010061803A (ja) * 2003-04-04 2010-03-18 Victor Co Of Japan Ltd オーディオ/ビデオ記録装置、記録方法、再生装置、再生方法、再生プログラム及び記録プログラム
US7941030B2 (en) 2003-04-04 2011-05-10 Victor Company Of Japan, Limited Audio/video recording apparatus, recording method, playback apparatus, playback method, playback program, and recording program
JPWO2006006714A1 (ja) * 2004-07-14 2008-05-01 セイコーエプソン株式会社 映像再生同期信号生成方法、映像再生同期信号生成プログラム、タイミング制御装置、映像音声同期再生方法、映像音声同期再生プログラム及び映像音声同期再生装置

Similar Documents

Publication Publication Date Title
JPH01318390A (ja) 音声映像記録装置
JPH07226916A (ja) 圧縮データ記録装置
JP2827726B2 (ja) ディジタル音声信号記録再生方法および記録再生装置
KR20000035133A (ko) 디지털 신호 처리 장치, 디지털 신호 처리 방법, 디지털신호 기록 장치, 디지털 신호 재생 장치, 디지털비디오-오디오 신호 기록 및 재생 장치
JPH1175157A (ja) 映像信号及び音声信号の記録装置
JPH10200858A (ja) 映像信号および音声信号の符号化装置、符号化方法、復号装置および復号方法並びに記録媒体
JPH1075424A (ja) 圧縮画像データ及び圧縮音声データの記録/再生装置、記録媒体及び伝送システム
JPH0837643A (ja) 量子化コントロール回路
US6285982B1 (en) Sound decompressing apparatus providing improved sound quality during special reproducing such as forward search reproducing and reverse search reproducing
JP3491533B2 (ja) ディジタルオーディオデータの再生方法及び装置
US8154430B2 (en) Digital recording apparatus and method, digital reproduction apparatus and method, and digital data conversion apparatus
WO2002086869A1 (fr) Appareil lecteur/enregistreur numerique
JPH06302103A (ja) デジタル情報記録装置及びデジタル情報再生装置
KR0183723B1 (ko) 두 개 신호 동시 기록 재생 브이티알 장치
KR100357090B1 (ko) 주파수가다른오디오의플레이어장치
KR950003634B1 (ko) 디지탈화상의 기록/재생방법 및 그 장치
US7203012B2 (en) Signal processing apparatus
JP4389402B2 (ja) デジタル映像記録装置及びデジタル映像再生装置
JPH05250813A (ja) 記録媒体及びその情報記録再生システム
JP3430613B2 (ja) 情報信号再生方法及び装置
JP2985586B2 (ja) 記録再生装置
JPH08329605A (ja) デイジタルオーデイオ信号処理方法、デイジタルオーデイオ信号処理装置及び記録再生装置
JP4389403B2 (ja) デジタル音声再生装置
JP3994786B2 (ja) ビデオテープレコーダ
JP2003005796A (ja) デジタル記録再生装置