JP2005208320A - 音声符号化方法と音声符号化装置および音声記録装置 - Google Patents

音声符号化方法と音声符号化装置および音声記録装置 Download PDF

Info

Publication number
JP2005208320A
JP2005208320A JP2004014610A JP2004014610A JP2005208320A JP 2005208320 A JP2005208320 A JP 2005208320A JP 2004014610 A JP2004014610 A JP 2004014610A JP 2004014610 A JP2004014610 A JP 2004014610A JP 2005208320 A JP2005208320 A JP 2005208320A
Authority
JP
Japan
Prior art keywords
signal
audio
encoding
mode
encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004014610A
Other languages
English (en)
Inventor
Tsutomu Seki
力 関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2004014610A priority Critical patent/JP2005208320A/ja
Publication of JP2005208320A publication Critical patent/JP2005208320A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】二音声多重モードの音声信号を音声信号の破棄を行うことなくDVDビデオ規格に対応した信号とする。
【解決手段】音声信号DAinの一方の信号DA-1と他方の信号DA-2を符号化して符号化信号DC-1,DC-2を生成する。信号振り分け部32は、信号DAinがステレオモードのとき、信号DE-2として信号DC-1を選択し、信号DE-1,DE-2として信号DC-2を選択する。モノラルモードのとき、信号DE-1,DE-2,DE-3としてモノラル音声の信号DC-1を選択する。二音声多重モードのとき、信号DE-1として主音声の信号DC-1を選択し、信号DE-2,DE-3として副音声の信号DC-2を選択しする。多重化回路331は信号DC-1,DE-1を多重化してステレオモードの音声ストリームDS-1とする。多重化回路332は信号DE-2,DE-3を多重化してステレオモードの音声ストリームDS-2とする。
【選択図】 図2

Description

この発明は、音声符号化方法と音声符号化装置および音声記録装置に関する。詳しくは、音声信号を符号化して得られた符号化信号を、音声信号の音声モードに応じて音声チャネル単位で第1と第2の系統に振り分けるものとし、この振り分けられた符号化信号を、系統毎に音声ストリームとし、この音声ストリームを記録するものである。
映像や音声の記録に用いられる光ディスク例えばDVD(Digital Versatile Disc)では、DVDビデオ規格とDVDビデオレコーディング規格が設けられている。DVDビデオ規格は、編集済みの映像や音声のコンテンツをディスクに記録しておき、このディスクに記録されているコンテンツを再生するために適した仕様である。このDVDビデオ規格では、タイトルの途中で音声ストリームのモード切り換え、例えばステレオモードからシングルチャネルモードに切り換える等のモード切換を行うことが出来るようにはなされていない。このため、放送番組のように音声モードが途中で切り換えるような音声信号をDVDビデオ規格の信号として記録する場合には、例えば音声モード毎にタイトルを区分して記録しなければならない。一方、DVDビデオレコーディング規格は、映像や音声をディスクにリアルタイム記録したり、記録した映像や音声を編集して再生するために適した仕様であり、タイトルの途中でモードの切り換えが可能とされている。しかし、DVDビデオレコーディング規格に対応したDVD再生装置を使用しないと、DVDビデオレコーディング規格で記録した音声信号を再生できない。
このため、特許文献1の発明では、映像や音声の信号を両規格に共通な信号となるように符号化することで、例えばDVDビデオ規格の信号として記録する際に、DVDビデオレコーディング規格で記録した信号をDVDビデオ規格の信号に変換することなく記録できることが示されている。
特開2003−109306号公報
ところで、DVDビデオレコーディング規格には、二か国語放送の主音声と副音声をそれぞれモノラルで記録するデュアルモノ方式が設けられているが、DVDビデオ規格にはデュアルモノ方式が設けられていない。このため、二か国語放送の音声信号を両規格に共通な信号となるように符号化して記録する場合、特許文献1で開示されているように、主音声あるいは副音声のいずれかの音声信号を選択して、この選択した音声信号に基づいて音声符号化信号を生成して記録することが行われる。このため、選択されていない音声信号は廃棄されてしまい再生することができない。すなわち、DVDビデオ規格にのみ対応したDVD再生装置を用いる場合には、二か国語放送番組の音声をそれぞれの言語で視聴することが出来なくなってしまう。
また、映像や音声のコンテンツを例えばハードディスクに一時記憶させておき、その後DVDに記録する場合、予めどちらの規格でハードディスクにコンテンツを記録するか決めなければならない。このような場合も、DVDビデオ規格を選択すると、上述のように二か国語音声の片方が失われてしまう。
そこで、この発明では、音声信号がステレオ,モノラル,二音声多重のいずれの音声モードであっても、音声信号を破棄することなくDVDビデオ規格に対応した信号を生成できる音声符号化方法と音声符号化装置、および生成した信号を記録媒体に記録する音声記録装置を提供するものである。
この発明に係る音声符号化方法は、音声信号を符号化する符号化ステップと、符号化ステップで得られた符号化信号を、音声信号の音声モードに応じて音声チャネル単位で第1と第2の系統に振り分ける信号振り分け処理ステップと、信号振り分け処理ステップで振り分けられた符号化信号を用いて、系統毎に音声ストリームを生成する音声ストリーム生成ステップとを有するものである。
また、この発明に係る音声符号化装置は、音声信号を符号化する符号化手段と、符号化手段で得られた符号化信号を音声信号の音声モードに応じて音声チャネル単位で第1と第2の系統に振り分ける信号振り分け手段と、音声信号の音声モードに応じて信号振り分け手段の動作を制御する振り分け制御手段と、信号振り分け手段で振り分けられた符号化信号を用いて、系統毎に音声ストリームを生成する音声ストリーム生成手段とを有するものである。
さらに、この発明に係る音声記録装置は、音声信号を符号化する符号化手段と、符号化手段で得られた符号化信号を、音声信号の音声モードに応じて音声チャネル単位で第1と第2の系統に振り分ける信号振り分け手段と、音声信号の音声モードに応じて信号振り分け手段の動作を制御する制御手段と、信号振り分け手段で振り分けられた符号化信号を用いて、系統毎に音声ストリームを生成するストリーム生成手段と、ストリーム生成手段で生成された音声ストリームを記録媒体に記録する信号記録手段を有するものである。
この発明においては、音声モードがステレオモードのとき、ステレオ音声信号の一方のチャネルの音声信号を符号化して得られた第1の符号化信号が第1と第2の系統に振り分けられ、他方のチャネルの音声信号を符号化して得られた第2の符号化信号が第1と第2の系統に振り分けられる。モノラルモードのときは、モノラル音声のチャネルの音声信号を符号化して得られた第3の符号化信号が第1と第2の系統に振り分けられ、二音声多重モードのときは、主音声あるいは副音声のいずれか一方のチャネルの音声信号を符号化して得られた第4の符号化信号が第1の系統に振り分けられ、他方のチャネルの音声信号を符号化して得られた第5の符号化信号が第2の系統に振り分けられる。この第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームが生成されて、第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームが生成される。また、音声モードがステレオモードのとき、左音声信号と右音声信号との和信号を符号化して主チャネルの符号化信号が生成されて、この主チャネルの符号化信号を第1と第2の符号化信号に替えて第1あるいは第2の系統に振り分けて、シングルチャネルモードの音声ストリームが生成される。
さらに、音声モードがステレオモードのとき、左音声信号と右音声信号の相関を利用して例えばAC−3やMPEGオーディオの符号化を行うことで第1と第2の符号化信号が生成されて第1と第2の系統に振り分けられ、音声モードがモノラルモードと二音声多重モードのとき、信号レベルがゼロレベルである音声信号を符号化したゼロレベル符号化信号が第1と第2の系統に振り分けられて、第1の系統に振り分けられた符号化信号を用いたステレオモードの第1の音声ストリームと、第2の系統に振り分けられた符号化信号を用いたステレオモードの第2の音声ストリームが生成される。また、ゼロレベル符号化信号は、予め記憶されているデータや情報を用いて生成される。
このようにして生成されたステレオモードの第1および第2の音声ストリームが記録媒体に記録される。あるいは、第1および第2の音声ストリームの一方がステレオモードで他方がシングルチャネルモードとして音声ストリームの生成が行われて、生成された音声ストリームが記録媒体に記録される。
この発明によれば、音声信号を符号化して得られた符号化信号が音声信号の音声モードに応じて音声チャネル単位で第1と第2の系統に振り分けられて、この振り分けられた符号化信号を用いて、系統毎に音声ストリームが生成される。このため、音声モードがステレオモードやモノラルモード,二音声多重モードに切り換えられても、各音声モードの各音声を再生できる音声ストリームを生成できる。
また、音声モードがステレオモードのとき、ステレオ音声信号の一方のチャネルの音声信号を符号化して得られた第1の符号化信号が第1と第2の系統に振り分けられて、他方のチャネルの音声信号を符号化して得られた第2の符号化信号が第1と第2の系統に振り分けられる。音声モードがモノラルモードのときは、モノラル音声のチャネルの音声信号を符号化して得られた第3の符号化信号が第1と第2の系統に振り分けられる。音声モードが二音声多重モードのときは、主音声あるいは副音声のいずれか一方のチャネルの音声信号を符号化して得られた第4の符号化信号が第1の系統に振り分けられ、他方の音声信号を符号化して得られた第5の符号化信号が第2の系統に振り分けられる。この第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームが生成され、第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームが生成される。このため、音声モードがステレオモードやモノラルモード,二音声多重モードに切り換えられても、音声ストリームのモードと一定とすることができる。
また、音声モードがステレオモードのとき、左音声信号と右音声信号との和信号を符号化して主チャネルの符号化信号が生成されて、この主チャネルの符号化信号が、第1の系統に振り分ける第1の符号化信号と第2の符号化信号あるいは第2の系統に振り分ける第1の符号化信号と第2の符号化信号に替えて振り分けられる。この主チャネルの符号化信号が振り分けられた系統の信号を用いてシングルチャネルモードの音声ストリームが生成され、他の系統の信号を用いてステレオモードの音声ストリームが生成される。このため、音声ストリームの一方をシングルチャネルモードとしても、各音声モードの各音声を再生できる。
また、音声モードがステレオモードのとき、左音声信号と右音声信号の相関を利用した符号化を行うことで第1の符号化信号と第2の符号化信号が生成される。音声モードがモノラルモードと二音声多重モードのときは、信号レベルがゼロレベルである音声信号を符号化したゼロレベル符号化信号が生成されて第1と第2の系統に振り分けられる。この第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームが生成されて、第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームが生成される。このため、圧縮効率の高い符号化を行っても、各音声モードの各音声を再生できる。
さらに、AC−3方式を用いて符号化を行い、ゼロレベル符号化信号を生成するとき、予め記憶されている差分符号化データと、符号化の際に用いたビット割当てパラメータ情報と、このビット割当てパラメータ情報を用いて生成されたビット割当て情報に基づく量子化データを用いてゼロレベル符号化信号が生成されるので、信号レベルがゼロレベルである音声信号を符号化してゼロレベル符号化信号を生成する場合に比べて演算量を少なくできる。
また、ビット割当てパラメータ情報を固定して、あるいは予め設定されている複数のビット割当てパラメータ情報からいずれかの情報を選択して用いることにより音声信号の符号化を行い、ゼロレベル符号化信号の生成では、予めビット割当てパラメータ情報に応じて生成されて記憶されている差分符号化データや量子化データから、音声信号の符号化に用いたビット割当てパラメータ情報に対応する量子化データや差分符号化データを用いて、ゼロレベル符号化信号を生成することで、更に演算量を少なくできる。
また、MPEGオーディオ方式を用いて符号化を行い、ゼロレベル符号化信号を生成するときには、予め記憶されている量子化データとビット割当て情報を用いてゼロレベル符号化信号が生成されるので、信号レベルがゼロレベルである音声信号を符号化してゼロレベル符号化信号を生成する場合に比べて演算量を少なくできる。
また、音声信号の音声モードに係らず第1および第2の音声ストリームがステレオモードとされて、あるいは、第1および第2の音声ストリームの一方がステレオモードで他方がシングルチャネルモードとされるので、DVDビデオ規格の信号として記録媒体に記録できる。
以下、図を参照しながら、この発明の実施の一形態について説明する。図1は記録装置10の構成を示すブロック図である。入力された映像信号DVinは、映像信号処理部20に供給される。映像信号処理部20は、映像信号DVinの圧縮符号化を行い映像ストリームDRを生成してストリームコントローラ40に供給する。入力された音声信号DAinは、音声信号処理部30に供給される。この音声信号処理部30には、入力された音声信号DAinがステレオモード,モノラルモード,二音声多重モードのいずれの音声モードであるかを示すモード信号MDが供給されている。この音声信号処理部30は、音声信号DAinの符号化を行い、得られた符号化信号を、音声信号の音声モードに応じて音声チャネル単位で第1と第2の系統に振り分けて、この振り分けられた符号化信号を用いて、系統毎に音声ストリームDSを生成してストリームコントローラ40に供給する。なお、モード信号MDは、音声信号DAinがアナログ放送番組を受信して得られた信号であるとき、テレビ音声多重信号に含まれている制御チャネル信号を用いて例えばチューナで識別された音声モード識別結果に基づいて生成することができる。また、ディジタル放送番組を受信して得られた信号であるとき、番組の音声ストリームにおけるヘッダ内のモード情報に基づき例えばデコーダで識別された音声モード識別結果に基づいて生成することができる。さらに、ユーザが編集した音声信号であるときは、編集時に指定された音声モードに基づいてモード信号MDを生成できる。
ストリームコントローラ40には、信号記録部50とハードディスク(HDD)60が接続されている。ストリームコントローラ40は、映像ストリームDRと音声ストリームDSをパケット化してパケタイズドエレメンタリストリーム(PES)を生成する。さらに、このPESをパック化して多重することにより、DVDビデオ規格の記録媒体70に記録するためのプログラムストリームPSを生成して信号記録部50に供給する。また、ストリームコントローラ40は、映像ストリームDRや音声ストリームDSおよびプログラムストリームPSをハードディスク60に供給する。
信号記録部50は、ストリームコントローラ40から供給されたプログラムストリームPSを記録媒体70に記録する。
ハードディスク60は、供給された映像ストリームDRや音声ストリームDSおよびプログラムストリームPS等を保持させておき、この保持されている映像ストリームDRや音声ストリームDSおよびプログラムストリームPSを、要求に応じて読み出してストリームコントローラ40に供給する。このように、映像ストリームDRや音声ストリームDSおよびプログラムストリームPSをハードディスク60に保持させておくことで、所望の映像部分の映像ストリームや所望の音声部分の音声ストリームを選択して用いることにより所望のプログラムストリームPSを容易に生成できる。また生成したプログラムストリームPSを、必要に応じてハードディスク60から読み出して記録媒体70に記録することもできる。
図2は、音声信号処理部の第1の構成を示すブロック図である。入力された一方のチャネルの音声信号DA-1は、符号化処理部31の符号化回路311に供給される。また他方のチャネルの音声信号DA-2は符号化回路312に供給される。符号化回路311は、供給された音声信号DA-1の圧縮符号化を行い符号化信号DC-1を生成して、この符号化信号DC-1を信号振り分け部32における信号セレクタ321,322,323の端子a側と、ストリーム生成部33の多重化回路331に供給する。符号化回路312は、供給された音声信号DA-2の圧縮符号化を行い符号化信号DC-2を生成して、この符号化信号DC-2を信号セレクタ321,322,323の端子b側に供給する。
信号振り分け部32は、符号化処理部31から供給された符号化信号を第1の系統と第2の系統に振り分けて、第1の系統に振り分けた符号化信号をストリーム生成部33の多重化回路331に供給し、第2の系統に振り分けた符号化信号を多重化回路332に供給するものである。
信号振り分け部32の信号セレクタ321は、後述する振り分け制御部34からの制御信号CSに基づき可動端子cを端子a側あるいは端子b側に切り換えて符号化信号の選択を行い、選択した信号を符号化信号DE-1として多重化回路331に供給する。
同様に、信号セレクタ322は、制御信号CSに応じて可動端子cを端子a側あるいは端子b側に切り換えて符号化信号の選択を行い、選択した信号を符号化信号DE-2として多重化回路332に供給する。また、信号セレクタ323は、制御信号CSに応じて可動端子cを端子a側あるいは端子b側に切り換えて符号化信号の選択を行い、選択した信号を符号化信号DE-3として多重化回路332に供給する。
多重化回路331は、符号化回路311から供給された符号化信号DC-1と信号セレクタ321から供給された符号化信号DE-1を多重化して音声ストリームDS-1を生成して、この音声ストリームDS-1をストリームコントローラ40に供給する。多重化回路332は、信号セレクタ322,323から供給された符号化信号DE-2,DE-3を多重化して音声ストリームDS-2を生成して、この音声ストリームDS-2をストリームコントローラ40に供給する。
振り分け制御部34は、モード信号MDに基づき、符号化処理部31に入力された音声信号DAinの音声モードに応じた制御信号CSを生成して信号振り分け部32に供給し、信号振り分け部32の信号振り分け動作を制御する。
図3は、音声信号処理部の第1の構成での動作を説明するためのものである。音声信号DAinがステレオ信号であるとき、振り分け制御部34は、信号セレクタ321,323の可動端子cを端子b側に設定し、信号セレクタ322の可動端子cを端子a側に設定するように制御信号CSを生成する。なお、一方のチャネルの音声信号DA-1は左側音声「L」、他方のチャネルの音声信号DA-2は右側音声「R」を示すものとする。
このように設定が行われると、多重化回路331には、左側音声「L」を示す符号化信号DC-1が供給される。また、右側音声「R」を示す符号化信号DC-2が符号化信号DE-1として供給される。このため、音声ストリームDS-1は、ステレオ音声を示すステレオモードの音声ストリームとなる。多重化回路332には、左側音声「L」を示す符号化信号DC-1が符号化信号DE-2として供給される。また、右側音声「R」を示す符号化信号DC-2が符号化信号DE-3として供給される。このため、音声ストリームDS-2もステレオ音声を示すステレオモードの音声ストリームとなる。
次に、音声信号DAinがモノラル信号であるとき、振り分け制御部34は、信号セレクタ321,322,323の可動端子cを端子a側に設定するように制御信号CSを生成する。なお、一方のチャネルの音声信号DA-1はモノラル音声「Mo」を示すチャネルの音声信号、他方のチャネルの音声信号DA-2は無信号とする。
このように設定が行われると、多重化回路331には、モノラル音声「Mo」を示すチャネルの符号化信号DC-1が供給される。また、モノラル音声「Mo」を示すチャネルの符号化信号DC-1が符号化信号DE-1として供給される。このため、音声ストリームDS-1はモノラル音声を示すステレオモードの音声ストリームとなる。多重化回路332には、モノラル音声「Mo」を示すチャネルの符号化信号DC-1が符号化信号DE-2,DE-3として供給される。このため、音声ストリームDS-2もモノラル音声を示すステレオモードの音声ストリームとなる。
音声信号DAinが二音声多重信号であるとき、振り分け制御部34は、信号セレクタ321の可動端子cを端子a側に設定し、信号セレクタ322,323の可動端子cを端子b側に設定するように制御信号CSを生成する。なお、一方のチャネルの音声信号DA-1は主音声「Ma」を示す主チャネルの音声信号、他方のチャネルの音声信号DA-2は副音声「Su」を示す副チャネルの音声信号とする。
このように設定が行われると、多重化回路331には、主音声「Ma」を示す主チャネルの符号化信号DC-1が供給される。また、主音声「Ma」を示す主チャネルの符号化信号DC-1が符号化信号DE-1として供給される。このため、音声ストリームDS-1は、主音声を示すステレオモードの音声ストリームとなる。多重化回路332には、副音声「Su」を示す副チャネルの符号化信号DC-2が符号化信号DE-2,DE-3として供給される。このため、音声ストリームDS-2は副音声を示すステレオモードの音声ストリームとなる。
このように、一方の音声ストリームDS-1は、ステレオ音声とモノラル音声と主音声を示すステレオモードの音声ストリームとなり、他方の音声ストリームDS-2は、ステレオ音声とモノラル音声と副音声を示すステレオモードの音声ストリームとなる。また、音声ストリームDS-1,DS-2のモードは、入力された音声信号DAinの音声モードに係らずステレオモードで一定で、DVDビデオ規格に対応した音声ストリームとなる。このため、音声ストリームDS-1,DS-2をDVDビデオ規格に応じたフォーマットで記録すれば、再生時に音声ストリームDS-1,DS-2の何れかを選択することで、主音声あるいは副音声のいずれか一方を選択的に再生できる。また、ステレオ音声やモノラル音声のときは、音声ストリームDS-1,DS-2のいずれを選択しても、それぞれの音声モードでの再生動作が可能である。
ところで、上述の実施の形態では、音声ストリームDS-1,DS-2の両方をステレオモードの音声ストリームとしたが、一方の音声ストリームをシングルチャネルモードの音声ストリームとしても、ステレオ音声,モノラル音声,主音声および副音声の各音声を再生することができる。
図4は音声信号処理部の第2の構成のブロック図を示しており、一方の音声ストリームをシングルチャネルモードの音声ストリームとする場合である。入力された一方のチャネルの音声信号DA-1は、符号化処理部31aの符号化回路311と加算器313に供給される。また他方のチャネルの音声信号DA-2は、符号化回路312と加算器313に供給される。加算器313は、音声信号DA-1と音声信号DA-2を加算して和信号DB-aを生成し、この和信号DB-aを主チャネルの音声信号として符号化回路314に供給する。
符号化回路311は、供給された音声信号DA-1の圧縮符号化を行い符号化信号DC-1を生成して、この符号化信号DC-1を信号振り分け部32aにおける信号セレクタ321,324の端子a側とストリーム生成部33aの多重化回路331に供給する。符号化回路312は、供給された音声信号DA-2の圧縮符号化を行い符号化信号DC-2を生成して、この符号化信号DC-2を信号セレクタ321,324の端子b側に供給する。符号化回路314は、供給された和信号DB-aの圧縮符号化を行い符号化信号DC-3を生成して、この符号化信号DC-3を信号セレクタ324の端子cに供給する。
信号振り分け部32aの信号セレクタ321は、後述する振り分け制御部34aからの制御信号CSaに基づき可動端子cを端子a側あるいは端子b側に切り換えて符号化信号の選択を行い、選択した信号を符号化信号DE-1として多重化回路331に供給する。
信号セレクタ324は、制御信号CSaに応じて可動端子dを端子a側,端子b側あるいは端子c側に切り換えて符号化信号の選択を行い、選択した信号を符号化信号DE-2としてストリーム生成部33aに供給する。
ストリーム生成部33aの多重化回路331は、符号化回路311から供給された符号化信号DC-1と信号セレクタ321から供給された符号化信号DE-1を多重化して音声ストリームDS-1を生成して、この音声ストリームDS-1をストリームコントローラ40に供給する。また、ストリーム生成部33aは、信号セレクタ324から供給された符号化信号DE-2を音声ストリームDS-2としてストリームコントローラ40に供給する。
振り分け制御部34aは、モード信号MDに基づき符号化処理部31aに入力された音声信号DAinの音声モードに応じた制御信号CSaを生成して信号振り分け部32aに供給し、信号振り分け部32aの信号振り分け動作を制御する。
図5は、音声符号化処理部の第2の構成での動作を説明するための図である。音声信号DAinがステレオ信号であるとき、振り分け制御部34aは、信号セレクタ321の可動端子cを端子b側に設定し、信号セレクタ324の可動端子dを端子c側に設定するように制御信号CSaを生成する。なお、一方のチャネルの音声信号DA-1は左側音声「L」、他方のチャネルの音声信号DA-2は右側音声「R」を示すものとする。
このように設定が行われると、多重化回路331には、左側音声「L」を示す符号化信号DC-1が供給される。また、右側音声「R」を示す符号化信号DC-2が符号化信号DE-1として供給される。このため、音声ストリームDS-1は、ステレオ音声を示すステレオモードの音声ストリームとなる。さらに、左側音声「L」と右側音声「R」を加算した音声「L+R」の符号化信号DC-3が、主チャネルの符号化信号DE-2としてストリーム生成部33aに供給されるので、音声ストリームDS-2は、ステレオ音声を加算したモノラル音声を示すシングルチャネルモードの音声ストリームとなる。
次に、音声信号DAinがモノラル信号であるとき、振り分け制御部34aは、信号セレクタ321の可動端子cを端子a側に設定し、信号セレクタ322の可動端子dを端子a側に設定しするように制御信号CSaを生成する。なお、一方のチャネルの音声信号DA-1はモノラル音声「Mo」を示すチャネルの音声信号、他方のチャネルの音声信号DA-2は無信号とする。
このように設定が行われると、多重化回路331には、モノラル音声「Mo」を示すチャネルの符号化信号DC-1が供給される。また、モノラル音声「Mo」を示すチャネルの符号化信号DC-1が符号化信号DE-1として供給される。このため、音声ストリームDS-1はモノラル音声を示すステレオモードの音声ストリームとなる。さらに、モノラル音声「Mo」を示すチャネルの符号化信号DC-1が符号化信号DE-2としてストリーム生成部33aに供給されるので、音声ストリームDS-2は、モノラル音声を示すシングルチャネルモードの音声ストリームとなる。
音声信号DAinが二音声多重信号であるとき、振り分け制御部34aは、信号セレクタ321の可動端子cを端子a側に設定し、信号セレクタ324の可動端子dを端子b側に設定するように制御信号CSaを生成する。なお、一方のチャネルの音声信号DA-1は主音声「Ma」を示す主チャネルの音声信号、他方のチャネルの音声信号DA-2は副音声「Su」を示す副チャネルの音声信号とする。
このように設定が行われると、多重化回路331には、主音声「Ma」を示す主チャネルの符号化信号DC-1が供給される。また、主音声「Ma」を示す主チャネルの符号化信号DC-1が符号化信号DE-1として供給される。このため、音声ストリームDS-1は、主音声を示すステレオモードの音声ストリームとなる。さらに、副音声「Su」を示す副チャネルの符号化信号DC-2が符号化信号DE-2としてストリーム生成部33aに供給されるので、音声ストリームDS-2は、副音声を示すシングルチャネルモードの音声ストリームとなる。
このように、一方の音声ストリームDS-1は、ステレオ音声とモノラル音声と主音声を示すステレオモードの音声ストリームとなり、他方の音声ストリームDS-2は、左側音声と右側音声を加算した音声とモノラル音声と副音声を示すシングルチャネルモードの音声ストリームとなる。また、音声ストリームDS-1は、入力された音声信号DAinの音声モードに係らずステレオモードで一定であり、音声ストリームDS-2は、入力された音声信号DAinの音声モードに係らずシングルチャネルモードで一定であり、DVDビデオ規格に対応した音声ストリームとなる。このため、音声ストリームDS-1,DS-2をDVDビデオ規格に応じたフォーマットで記録すれば、再生時に音声ストリームDS-1,DS-2の何れかを選択することで、主音声あるいは副音声のいずれか一方を選択的に再生できる。また、モノラルモードのときは、音声ストリームDS-1,DS-2のいずれを選択してもモノラルモードで再生が可能である。なお、ステレオモードのときは、音声ストリームDS-1を選択したときにステレオモード、音声ストリームDS-2を選択したときにモノラルモードでの再生となる。
ところで、音声信号符号化では、一方のチャネルの音声信号と他方のチャネルの音声信号の相関を利用した符号化が用いられている。例えば、左音声信号と右音声信号の和信号と差信号を生成して、この和信号を主チャネルの音声信号、差信号を副チャネルの音声信号としてそれぞれ符号化することが行われており、この符号化では例えばDolby Laboratoriesが開発した「AC−3」(商標)と呼ばれている音声符号化のリマトリクシングや、MPEG(Moving Picture Experts Group)オーディオにおけるMS(Middle/Side)ステレオ符号化が用いられている。また、相関のある信号同士を一つにまとめた信号と、まとめた信号に対する各チャネルの倍率を符号化するAC−3のカップリングや、和信号と各チャネルの信号の比を符号化するMPEGオーディオのインテンシティステレオ符号化等も用いられる。このように、音声信号の相関を利用した符号化を行うことにより、音声信号の圧縮効果を高めることができる。例えば和信号と差信号を符号化する場合、左音声信号と右音声信号の相関が大きいと、和信号と差信号の情報差が大きくなることから、エネルギー偏在により信号の圧縮効果を高めることができる。
次に、音声信号処理部の第3の構成として、音声信号の相関を利用した符号化を行う場合について説明する。図6は、左音声信号と右音声信号の和信号と差信号を用いて符号化を行う場合を示したブロック図である。
入力された一方のチャネルの音声信号DA-1は、符号化処理部31bの和信号生成回路315と差信号生成回路316に供給される。また他方のチャネルの音声信号DA-2も、和信号生成回路315と差信号生成回路316に供給される。
和信号生成回路315は、後述する振り分け制御部34bからの制御信号CMに基づき、入力された音声信号DAinの音声モードがステレオモードであるとき、音声信号DA-1と音声信号DA-2を加算して和信号DB-bを生成し、この和信号DB-bを主チャネルの音声信号として符号化回路311に供給する。また、音声信号DAinの音声モードがモノラルモードあるいは二音声多重モードであるとき、供給された音声信号DA-1を符号化回路311に供給する。
差信号生成回路316は、振り分け制御部34bからの制御信号CMに基づき、入力された音声信号DAinの音声モードがステレオモードであるとき、音声信号DA-1から音声信号DA-2を減算して差信号DB-cを生成し、この差信号DB-cを副チャネルの音声信号として符号化回路312に供給する。また、音声信号DAinの音声モードがモノラルモードあるいは二音声多重モードであるとき、供給された音声信号DA-2を符号化回路312に供給する。
符号化回路311は、供給された和信号DB-bあるいは音声信号DA-1の圧縮符号化を行い符号化信号DC-1を生成して、この符号化信号DC-1を信号振り分け部32における信号セレクタ322の端子a側と、ストリーム生成部33bの多重化回路331に供給する。符号化回路312は、供給された差信号DB-cあるいは音声信号DA-2の圧縮符号化を行い符号化信号DC-2を生成して、この符号化信号DC-2を信号セレクタ321,323の端子a側と信号セレクタ322の端子b側に供給する。
ゼロレベル符号化信号生成回路317は、信号レベルがゼロレベルである音声信号を符号化したゼロレベル符号化信号DC-eを生成して、信号セレクタ321,323の端子b側に供給する。
信号振り分け部32bの信号セレクタ321は、振り分け制御部34bからの制御信号CSbに基づき可動端子cを端子a側あるいは端子b側に切り換えて符号化信号の選択を行い、選択した信号を符号化信号DE-1として多重化回路331に供給する。
同様に、信号セレクタ322は、制御信号CSbに応じて可動端子cを端子a側あるいは端子b側に切り換えて符号化信号の選択を行い、選択した信号を符号化信号DE-2として多重化回路332に供給する。また、信号セレクタ323は、制御信号CSbに応じて可動端子cを端子a側あるいは端子b側に切り換えて符号化信号の選択を行い、選択した信号を符号化信号DE-3として多重化回路332に供給する。
ストリーム生成部33bの多重化回路331は、符号化回路311から供給された符号化信号DC-1と信号セレクタ321から供給された符号化信号DE-1を多重化して、音声ストリームDS-1を生成して、ストリームコントローラ40に供給する。多重化回路332は、信号セレクタ322,323から供給された符号化信号DE-2,DE-3を多重化して、音声ストリームDS-2を生成して、ストリームコントローラ40に供給する。さらに、ストリーム生成部33bは、信号セレクタ322から供給された符号化信号DE-2をシングルチャネルモードの音声ストリームDS-2'としてストリームコントローラ40に供給することもできる。
振り分け制御部34bは、モード信号MDに基づき符号化処理部31bに入力された音声信号DAinの音声モードに応じた制御信号CM,CSbを生成して、制御信号CMを符号化処理部31bに供給し、和信号DB-bと差信号DB-cの生成を制御する。また、生成した制御信号CSbを信号振り分け部32に供給し、信号振り分け部32の信号振り分け動作を制御する。
図7は、音声信号処理部の第3の構成での動作を説明するための図である。音声信号DAinがステレオ信号であるとき、振り分け制御部34bは、和信号生成回路315で和信号DB-bを生成し、差信号生成回路316で差信号DB-cを生成するように制御信号CMを生成する。また、振り分け制御部34bは、信号セレクタ321,322,323の可動端子cを端子a側に設定するように制御信号CSbを生成する。なお、一方のチャネルの音声信号DA-1は左側音声「L」、他方のチャネルの音声信号DA-2は右側音声「R」を示すものとする。
このように設定が行われると、多重化回路331には、音声「L+R」を示す主チャネルの符号化信号DC-1が供給される。また、音声「L−R」を示す副チャネルの符号化信号DC-2が符号化信号DE-1として供給される。このため、音声ストリームDS-1は、音声「L+R」「L−R」を示すステレオモードの音声ストリームとなる。多重化回路332には、和信号の音声「L+R」を示す符号化信号DC-1が符号化信号DE-2として供給される。また、差信号の音声「L−R」を示す符号化信号DC-2が符号化信号DE-3として供給される。このため、音声ストリームDS-2も音声「L+R」「L−R」を示すステレオモードの音声ストリームとなる。さらに、符号化信号DE-2を音声ストリームDS-2’とすれば、音声ストリームDS-2’は、ステレオ音声を加算したモノラル音声である音声「L+R」を示すシングルチャネルモードの音声ストリームとなる。
次に、音声信号DAinがモノラル信号であるとき、振り分け制御部34bは、和信号生成回路315に供給された音声信号DA-1を符号化回路311に供給し、差信号生成回路316に供給された音声信号DA-2を符号化回路312に供給するように制御信号CMを生成する。また、振り分け制御部34は、信号セレクタ321,323の可動端子cを端子b側に設定し、信号セレクタ322の可動端子cを端子a側に設定するように制御信号CSbを生成する。なお、一方のチャネルの音声信号DA-1はモノラル音声「Mo」、他方のチャネルの音声信号DA-2は無信号とする。
このように設定が行われると、多重化回路331には、モノラル音声「Mo」を示すチャネルの符号化信号DC-1が供給される。また、ゼロレベル符号化信号生成回路317で生成されたゼロレベル符号化信号DC-eが符号化信号DE-1として供給される。このため、音声ストリームDS-1は、一方のチャネルがモノラル音声で他方のチャネルが無音とされたステレオモードの音声ストリームとなる。多重化回路332には、モノラル音声「Mo」を示すチャネルの符号化信号DC-1が符号化信号DE-2として供給される。また、ゼロレベル符号化信号生成回路317で生成されたゼロレベル符号化信号DC-eが符号化信号DE-3として供給される。このため、音声ストリームDS-2も音声ストリームDS-1と同様に、一方のチャネルがモノラル音声「Mo」で他方のチャネルが無音とされたステレオモードの音声ストリームとなる。さらに、音声ストリームDS-2’は、モノラル音声「Mo」を示すシングルチャネルモードの音声ストリームとなる。
音声信号DAinが二音声多重信号であるとき、振り分け制御部34bは、和信号生成回路315に供給された音声信号DA-1を符号化回路311に供給し、差信号生成回路316に供給された音声信号DA-2を符号化回路312に供給するように制御信号CMを生成する。また、振り分け制御部34bは、信号セレクタ321,322,323の可動端子cを端子b側に設定するように制御信号CSbを生成する。なお、一方のチャネルの音声信号DA-1は主音声「Ma」、他方のチャネルの音声信号DA-2は副音声「Su」を示すものとする。
このように設定が行われると、多重化回路331には、主音声「Ma」を示す主チャネルの符号化信号DC-1が供給される。また、ゼロレベル符号化信号生成回路317で生成されたゼロレベル符号化信号DC-eが符号化信号DE-1として供給される。このため、音声ストリームDS-1は、一方のチャネルが主音声で他方のチャネルが無音とされたステレオモードの音声ストリームとなる。多重化回路332には、副音声「Su」を示す副チャネルの符号化信号DC-2が符号化信号DE-2として供給される。また、ゼロレベル符号化信号生成回路317で生成されたゼロレベル符号化信号DC-eが符号化信号DE-3として供給される。このため、音声ストリームDS-2は、一方のチャネルが副音声「Su」で他方のチャネルが無音とされたステレオモードの音声ストリームとなる。さらに、符号化信号DE-2を音声ストリームDS-2’とすれば、音声ストリームDS-2’は、副音声「Su」を示すシングルチャネルモードの音声ストリームとなる。
このように、一方の音声ストリームDS-1は、ステレオ音声(和信号と差信号に基づく)とモノラル音声と主音声を示すステレオモードの音声ストリームとなり、他方の音声ストリームDS-2は、ステレオ音声(和信号と差信号に基づく)とモノラル音声と副音声を示すステレオモードの音声ストリームとなる。このため、音声ストリームDS-1,DS-2をDVDビデオ規格に応じたフォーマットで記録すれば、再生時に音声ストリームDS-1,DS-2の何れかを選択することで、主音声あるいは副音声のいずれか一方を選択的に再生できる。また、ステレオモードやモノラルモードのときは、音声ストリームDS-1,DS-2のいずれを選択しても音声モードに対応した再生が可能である。さらに、音声ストリームDS-2’を用いるものとすれば、左側音声と右側音声を加算した音声とモノラル音声と副音声を再生することが可能となる。
また、モノラルモードや二音声多重モードであるときは、ゼロレベル符号化信号生成回路317で生成されたゼロレベル符号化信号DC-eを用いて、音声ストリームDS-1,DS-2が生成される。このため、符号化回路312で音声信号DA-2の符号化信号DC-2をリアルタイムで生成しなくとも良いことから、音声ストリームDSを生成する際の演算量を少なくできる。
次に、演算量を少なくできる理由について説明する。図8と図9は、音声符号化方式としてAC−3を用いたときの符号化回路311の構成を示すブロック図とゼロレベル符号化信号生成回路317の構成を示すブロック図である。
音声信号DA-1,DB-bは、直交変換回路351と詳細ビット割当て回路352に供給される。直交変換回路351は、供給された音声信号に対してMDCT(Modified Discrete Cosine Transform:変形離散コサイン変換)を行い、得られたMDCT係数を浮動小数点表記としたときの仮数値Vmanを仮数量子化回路353に供給する。また、指数値Vexpはスペクトラムエンベロープ符号化回路354と簡易ビット割当て回路355に供給する。
詳細ビット割当て回路352は、供給された音声信号に基づき心理聴覚分析を行い、仮数値Vmanに対するビット割当て情報(量子化ビット数)BTを求め、このビット割当て情報BTを仮数量子化回路353と補正情報生成回路356に供給する。また、詳細ビット割当て回路352は、ビット割当て情報BTを求める際に用いたビット割当てパラメータ情報BPを簡易ビット割当て回路355に供給する。
仮数量子化回路353は、詳細ビット割当て回路352から供給されたビット割当て情報BTに従い、仮数値Vmanの線形量子化を行い量子化データMQを多重化回路357に供給する。
スペクトラムエンベロープ符号化回路354は、指数値Vexpの差分符号化を行い差分符号化データEXを生成して多重化回路357に供給する。簡易ビット割当て回路355は、詳細ビット割当て回路352よりも簡易な方法で、指数値Vexpに対するビット割当て情報BUを、ビット割当てパラメータ情報BPを用いて求め、この求めたビット割当て情報BUを補正情報生成回路356に供給する。
補正情報生成回路356は、ビット割当て情報BTとビット割当て情報BUとの差分を求めてビット割当て補正情報TUを生成し多重化回路357に供給する。
多重化回路357は、詳細ビット割当て回路352と簡易ビット割当て回路355で用いたビット割当てパラメータ情報BPと、仮数量子化回路353で求めた量子化データMQと、スペクトラムエンベロープ符号化回路354で求めた差分符号化データEXと、補正情報生成回路356で生成したビット割当て補正情報TUを、所定のフレーム構成のビットストリームである符号化信号DC-1として出力する。
なお、符号化信号DC-1を再生する場合には、差分符号化データEXを復号化して指数値Vexpを求め、この指数値Vexpに対するビット割当て情報BUを、ビット割当てパラメータ情報BPを用いて求める。さらに、ビット割当て情報BUとビット割当て補正情報TUからビット割当て情報BTを得ることができることから、このビット割当て情報BTを用いて量子化データMQの逆量子化を行うことで仮数値Vmanを求められる。このようにして得られた仮数値Vmanと指数値Vexpを用いてIMDCT(InverseMDCT:逆変形離散コサイン変換)を行うことで音声信号DA-1,DB-bを再生できる。なお、符号化回路312も符号化回路311と同様に構成することで符号化信号DC-2を生成できる。
ゼロレベル符号化信号DC-eを生成するゼロレベル符号化信号生成回路317は、信号レベルがゼロレベルである音声信号を符号化したゼロレベル符号化信号DC-eを生成する。ゼロレベル符号化信号生成回路317のメモリ361には、信号レベルがゼロレベルである音声信号に対してMDCTを行って得られる仮数値と指数値に基づく情報を予め記憶させておく。信号レベルがゼロレベルである音声信号に対してMDCTを行うと、仮数値は「0」,指数値は「負の無限大」となる。ここで、仮数値が「0」であるので、割り当てられるビット数は「0」となる。また、指数値が「負の無限大」であるとき、AC−3のデータとして表現できるなるべく小さな値を用いることとなる。このため、例えば仮数値VmanとAC−3のデータとして表現できる小さな値を指数値Vexpとして予め記憶させておくものとする。さらに、MDCTを行って得られた指数値に対して差分符号化を行い、得られた差分符号化データEXを予め記憶させておく。ゼロレベル符号化信号DC-eを生成するときには、メモリ361に記憶されている差分符号化データEXを読み出して多重化回路364に供給する。また、メモリ361に記憶されている指数値Vexpを読み出して簡易ビット割当て回路362に供給する。さらに、メモリ361に記憶されている仮数値Vmanを読み出して仮数量子化回路363に供給する。
簡易ビット割当て回路362は、メモリ361から読み出された指数値Vexpに対するビット割当てを行う。ここで、ビット割当てパラメータ情報BPは各符号化回路で共通に用いるものであることから、例えばステレオモードであるときは、符号化回路311の詳細ビット割当て回路と符号化回路312の詳細ビット割当て回路で協調して動作を行い、符号化回路311,312で共通なビット割当てパラメータ情報BPを生成し、このビット割当てパラメータ情報BPを簡易ビット割当て回路362で用いるものとする。また、モノラルモードであるときは、モノラル音声「Mo」の音声信号DA-1を符号化する符号化回路311の詳細ビット割当て回路で生成されたビット割当てパラメータ情報BPを用いるものとする。さらに、二音声多重モードのときは、ステレオモードと同様に、符号化回路311の詳細ビット割当て回路と符号化回路312の詳細ビット割当て回路で協調して動作を行い、符号化回路311,312で共通なビット割当てパラメータ情報BPを生成し、このビット割当てパラメータ情報BPを簡易ビット割当て回路362で用いるものとする。あるいは、2つのゼロレベル符号化信号生成回路を設けて、符号化回路311の詳細ビット割当て回路と符号化回路312の詳細ビット割当て回路で個々にビット割当てパラメータ情報BPを生成する。この符号化回路311の詳細ビット割当て回路で生成されたビット割当てパラメータ情報BPを一方のゼロレベル符号化信号生成回路に供給して、このゼロレベル符号化信号生成回路で生成されたゼロレベル符号化信号を信号セレクタ321の端子bに供給する。また符号化回路312の詳細ビット割当て回路で生成されたビット割当てパラメータ情報BPを他方のゼロレベル符号化信号生成回路に供給し、このゼロレベル符号化信号生成回路で生成されたゼロレベル符号化信号を信号セレクタ323の端子bに供給するものとしても良い。
仮数量子化回路363は、簡易ビット割当て回路362で生成したビット割当て情報BUを用いて仮数値Vmanの量子化を行い、生成した量子化データMQを多重化回路364に供給する。すなわち、ビット割当て情報と等しいビット数の「0」データからなる量子化データMQを多重化回路364に供給する
多重化回路364は、メモリ361から読み出した差分符号化データEXと、簡易ビット割当て回路362で用いたビット割当てパラメータ情報BPと、仮数量子化回路363で求めた量子化データMQを、所定のフレーム構成のビットストリームであるゼロレベル符号化信号DC-eとして出力する。なお、ビット割当て補正情報TUは「0」であることから出力する必要がない。
ゼロレベル符号化信号DC-eを再生する場合には、差分符号化データEXを復号化して指数値Vexpを求め、この指数値Vexpに対するビット割当て情報BUを、ビット割当てパラメータ情報BPを用いて求める。さらに、求めたビット割当て情報BUを用いて量子化データMQの逆量子化を行うことで仮数値Vmanを求められる。このようにして得られた仮数値Vmanと指数値Vexpを用いてIMDCT(InverseMDCT:逆変形離散コサイン変換)を行うことで、信号レベルがゼロレベルである音声信号を得ることができる。
このように、差分符号化データEXがメモリ361に予め記憶されており、詳細ビット割当て回路352でのビット割当て情報BTの生成も必要無いことから、ゼロレベル符号化信号DC-eの生成は、符号化回路311,312で符号化信号DC-1,DC-2を生成する場合に比べて、演算量が少なくなる。
さらに、ビット割当てパラメータ情報BPを予め定めた複数の情報の何れかに限定すれば、ビット割当てパラメータ情報毎に量子化データMQや差分符号化データEXを求めて予めメモリ361に記憶させておき、使用するビット割当てパラメータ情報に応じた量子化データMQや差分符号化データEXをメモリ361から読み出して多重化回路364に供給すれば、ビット割当て情報BUの生成も不要となり、更に演算量を少なくできる。また、ビット割当てパラメータ情報BPを固定とすれば、ビット割当てパラメータ情報毎に量子化データMQや差分符号化データEXを記憶させておく必要もなく、メモリ361に記憶させておく情報量も少なくできる。
このように、モノラルモードや二音声多重モードであるときは、信号レベルがゼロレベルである音声信号を符号化したゼロレベル符号化信号DC-eを容易に生成できるので、符号化に必要な演算量を少なくできる。
ところで、上述のAC−3は、ビット割当て情報を符号化信号に含めない方式であるが、MPEGオーディオのように、ビット割当て情報を符号化信号に含める方式を用いるときでも、モノラルモードや二音声多重モードでの演算量を少なくできる。
MPEGオーディオでは、音声信号を時間領域から周波数領域に写像して写像信号を生成する。また、音声信号に基づいたビット割当て情報の生成を行う。このビット割当て情報に基づいて写像信号の量子化を行い量子化データを生成する。さらに、量子化データとビット割当て情報と他の情報等を、所定のフレーム構成のビットストリームである音声符号化信号として出力する。
ここで、音声信号の信号レベルをゼロレベルとしたときの量子化データと、ビット割当て情報とを予めメモリに記憶させておき、ゼロレベル符号化信号DC-eの生成時には、予め記憶されている量子化データとビット割当て情報をメモリから読み出すだけでゼロレベル符号化信号DC-eを生成できる。例えば、写像信号の生成に直交変換を用いるものとしたとき、音声信号の信号レベルをゼロレベルとして直交変換を行ったときの指数部、「0」を示す仮数部とビット割当て情報とメモリに記憶させておけば、これらの情報を読み出すだけで、容易にゼロレベル符号化信号DC-eを生成できるので、ビット割当て情報を音声符号化信号に含めない方式を用いた場合と同様に、モノラルモードや二音声多重モードであるとき、符号化信号の生成に必要な演算量を少なくできる。また、ビット割当て情報を音声符号化信号に含める方式では、ビット割当て情報を音声符号化信号に含めない方式のように、ビット割当てパラメータ情報BPに応じてビット割当て情報を生成する処理も必要ないことから、演算量を更に少なくできる。
なお、上述の構成のブロックは、ハードウェアあるいはソフトウェアのいずれで実現しても良い。
このように、本願発明によれば、音声モードがステレオ,モノラル,二音声多重のいずれであっても、音声データを失うことなくDVDビデオ規格に対応した音声ストリームを生成できる。また、この音声ストリームをDVDディスク、例えばDVD+R/+RW,DVD−R/−RWの規格に対応したディスクに記録して、このDVDディスクをDVDビデオレコーディング規格に対応していない機器で再生するとき、二音声多重モードでの主音声や副音声を選択的に再生できる。
以上のように、本発明は、音声モードの切り換えが行われる音声信号を符号化して記録する場合に有用であり、DVDビデオ規格に対応したフォーマットで音声信号を記録するのに適用している。
記録装置の構成を示す図である。 音声信号処理部の第1の構成を示す図である。 第1の構成での動作を示す図である。 音声信号処理部の第2の構成を示す図である。 第2の構成での動作を示す図である。 音声信号処理部の第3の構成を示す図である。 第3の構成での動作を示す図である。 符号化回路の構成を示す図である。 符号化信号生成回路の構成を示す図である。
符号の説明
10・・・記録装置、20・・・映像信号処理部、30・・・音声信号処理部、31,31a,31b・・・符号化処理部、32,32a・・・信号振り分け部、33,33a,33b・・・ストリーム生成部、34,34a,34b・・・制御部、40・・・ストリームコントローラ、50・・・信号記録部、60・・・ハードディスク、70・・・記録媒体、311,312,314・・・符号化回路、313・・・加算器、315・・・和信号生成回路、316・・・差信号生成回路、317・・・ゼロレベル符号化信号生成回路、321,322,323,324・・・信号セレクタ、331,332・・・多重化回路、351・・・直交変換回路、352・・・詳細ビット割当て回路、353,363・・・仮数量子化回路、354・・・スペクトラムエンベロープ符号化回路、355,362・・・簡易ビット割当て回路、356・・・補正情報生成回路、357,364・・・多重化回路、361・・・メモリ

Claims (30)

  1. 音声信号を符号化する符号化ステップと、
    前記符号化ステップで得られた符号化信号を、前記音声信号の音声モードに応じて音声チャネル単位で第1と第2の系統に振り分ける信号振り分け処理ステップと、
    前記信号振り分け処理ステップで振り分けられた符号化信号を用いて、前記系統毎に音声ストリームを生成する音声ストリーム生成ステップとを有する
    ことを特徴とする音声符号化方法。
  2. 前記信号振り分け処理ステップでは、
    前記音声モードがステレオモードのとき、前記符号化ステップでステレオ音声の一方のチャネルの音声信号を符号化して得られた第1の符号化信号を前記第1と第2の系統に振り分け、他方のチャネルの音声信号を符号化して得られた第2の符号化信号を前記第1と第2の系統に振り分ける
    ことを特徴とする請求項1記載の音声符号化方法。
  3. 前記信号振り分け処理ステップでは、
    前記音声モードがモノラルモードのとき、前記符号化ステップでモノラル音声のチャネルの音声信号を符号化して得られた第3の符号化信号を前記第1と第2の系統に振り分ける
    ことを特徴とする請求項2記載の音声符号化方法。
  4. 前記信号振り分け処理ステップでは、
    前記音声モードが二音声多重モードのとき、前記符号化ステップで主音声あるいは副音声のいずれか一方のチャネルの音声信号を符号化して得られた第4の符号化信号を前記第1の系統に振り分け、他方のチャネルの音声信号を符号化して得られた第5の符号化信号を前記第2の系統に振り分ける
    ことを特徴とする請求項2あるいは請求項3のいずれかに記載の音声符号化方法。
  5. 前記音声ストリーム生成ステップでは、
    前記第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームを生成し、前記第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームを生成する
    ことを特徴とする請求項2記載の音声符号化方法。
  6. 前記符号化ステップでは、前記音声モードがステレオモードのとき、左音声信号と右音声信号との和信号を符号化して主チャネルの符号化信号を生成し、
    前記信号振り分け処理ステップでは、前記音声モードがステレオモードのとき、前記第1の系統に振り分ける前記第1の符号化信号と前記第2の符号化信号、あるいは第2の系統に振り分ける前記第1の符号化信号と前記第2の符号化信号に替えて、前記主チャネルの符号化信号を振り分ける
    ことを特徴とする請求項2記載の音声符号化方法。
  7. 前記音声ストリーム生成ステップでは、前記主チャネルの符号化信号が振り分けられた系統の信号を用いてシングルチャネルモードの音声ストリームを生成し、他の系統に振り分けられた符号化信号を用いてステレオモードの音声ストリームを生成する
    ことを特徴とする請求項6記載の音声符号化方法。
  8. 前記符号化ステップでは、前記音声モードがステレオモードのとき、左音声信号と右音声信号の相関を利用して符号化を行うことで前記第1の符号化信号と第2の符号化信号を生成するものとし、
    前記音声ストリーム生成ステップでは、前記第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームを生成し、前記第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームを生成する
    ことを特徴とする請求項2記載の音声符号化方法。
  9. 前記符号化ステップでは、前記音声モードがモノラルモードのとき、信号レベルがゼロレベルである音声信号を符号化したゼロレベル符号化信号を生成し、
    前記信号振り分け処理ステップでは、前記音声モードがモノラルモードのとき、前記ゼロレベル符号化信号を前記第1と第2の系統に振り分けるものとし、
    前記音声ストリーム生成ステップでは、前記第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームを生成し、前記第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームを生成する
    ことを特徴とする請求項3記載の音声符号化方法。
  10. 前記符号化ステップでは、前記音声モードが二音声多重モードのとき、信号レベルがゼロレベルである音声信号を符号化したゼロレベル符号化信号を生成し、
    前記信号振り分け処理ステップでは、前記音声モードが二音声多重モードのとき、前記ゼロレベル符号化信号を前記第1と第2の系統に振り分けるものとし、
    前記音声ストリーム生成ステップでは、前記第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームを生成し、前記第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームを生成する
    ことを特徴とする請求項4記載の音声符号化方法。
  11. 前記符号化ステップでは、AC−3方式を用いて符号化を行うものとし、前記音声モードがステレオモードのとき、前記左音声信号と前記右音声信号の和信号と差信号をそれぞれ符号化して、前記第1の符号化信号と第2の符号化信号を生成する
    ことを特徴とする請求項8記載の音声符号化方法。
  12. 前記符号化ステップでは、AC−3方式を用いて符号化を行うものとし、前記ゼロレベル符号化信号を生成するとき、予め記憶されている差分符号化データと、前記符号化の際に用いたビット割当てパラメータ情報と、該ビット割当てパラメータ情報を用いて生成されたビット割当て情報に基づく量子化データを用いて前記ゼロレベル符号化信号を生成する
    ことを特徴とする請求項9あるいは請求項10のいずれかに記載の音声符号化方法。
  13. 前記符号化ステップでは、前記ビット割当てパラメータ情報を固定して、あるいは予め設定されている複数のビット割当てパラメータ情報からいずれかの情報を選択して用いることにより前記符号化を行い、前記ビット割当てパラメータ情報に応じて予め生成されて記憶されている差分符号化データと量子化データから、前記符号化で用いた前記ビット割当てパラメータ情報に対応する差分符号化データと量子化データを用いて、前記ゼロレベル符号化信号を生成する
    ことを特徴とする請求項12記載の音声符号化方法。
  14. 前記符号化ステップでは、MPEG(Moving Picture Experts Group)オーディオ方式を用いて符号化を行うものとし、前記音声モードがステレオモードのとき、前記左音声信号と前記右音声信号の和信号と差信号をそれぞれ符号化して、前記第1の符号化信号と第2の符号化信号を生成する
    ことを特徴とする請求項8記載の音声符号化方法。
  15. 前記符号化ステップでは、MPEG(Moving Picture Experts Group)オーディオ方式を用いて符号化を行うものとし、予め記憶されている量子化データとビット割当て情報を用いて前記ゼロレベル符号化信号を生成する
    ことを特徴とする請求項9あるいは請求項10のいずれかに記載の音声符号化方法。
  16. 音声信号を符号化する符号化手段と、
    前記符号化手段で得られた符号化信号を、前記音声信号の音声モードに応じて音声チャネル単位で第1と第2の系統に振り分ける信号振り分け処理手段と、
    前記信号振り分け処理手段で振り分けられた符号化信号を用いて、前記系統毎に音声ストリームを生成する音声ストリーム生成手段とを有する
    ことを特徴とする音声符号化装置。
  17. 前記信号振り分け処理手段は、
    前記音声モードがステレオモードのとき、前記符号化手段でステレオ音声の一方のチャネルの音声信号を符号化して得られた第1の符号化信号を前記第1と第2の系統に振り分け、他方のチャネルの音声信号を符号化して得られた第2の符号化信号を前記第1と第2の系統に振り分ける
    ことを特徴とする請求項16記載の音声符号化装置。
  18. 前記信号振り分け処理手段は、
    前記音声モードがモノラルモードのとき、前記符号化手段でモノラル音声のチャネルの音声信号を符号化して得られた第3の符号化信号を前記第1と第2の系統に振り分ける
    ことを特徴とする請求項17記載の音声符号化装置。
  19. 前記信号振り分け処理手段は、
    前記音声モードが二音声多重モードのとき、前記符号化手段で主音声あるいは副音声のいずれか一方のチャネルの音声信号を符号化して得られた第4の符号化信号を前記第1の系統に振り分け、他方のチャネルの音声信号を符号化して得られた第5の符号化信号を前記第2の系統に振り分ける
    ことを特徴とする請求項17あるいは請求項18のいずれかに記載の音声符号化装置。
  20. 前記音声ストリーム生成手段は、
    前記第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームを生成し、前記第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームを生成する
    ことを特徴とする請求項17記載の音声符号化装置。
  21. 前記符号化手段は、前記音声モードがステレオモードのとき、左音声信号と右音声信号との和信号を符号化して主チャネルの符号化信号を生成し、
    前記信号振り分け処理手段は、前記音声モードがステレオモードのとき、前記第1の系統に振り分ける前記第1の符号化信号と前記第2の符号化信号、あるいは第2の系統に振り分ける前記第1の符号化信号と前記第2の符号化信号に替えて、前記主チャネルの符号化信号を振り分ける
    ことを特徴とする請求項17記載の音声符号化装置。
  22. 前記音声ストリーム生成手段は、前記主チャネルの符号化信号が振り分けられた系統の信号を用いてシングルチャネルモードの音声ストリームを生成し、他の系統に振り分けられた符号化信号を用いてステレオモードの音声ストリームを生成する
    ことを特徴とする請求項21記載の音声符号化装置。
  23. 前記符号化手段は、前記音声モードがステレオモードのとき、左音声信号と右音声信号の相関を利用して符号化を行うことで前記第1の符号化信号と第2の符号化信号を生成するものとし、
    前記音声ストリーム生成手段は、前記第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームを生成し、前記第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームを生成する
    ことを特徴とする請求項17記載の音声符号化装置。
  24. 前記符号化手段は、前記音声モードがモノラルモードのとき、信号レベルがゼロレベルである音声信号を符号化したゼロレベル符号化信号を生成し、
    前記信号振り分け処理手段は、前記音声モードがモノラルモードのとき、前記ゼロレベル符号化信号を前記第1と第2の系統に振り分けるものとし、
    前記音声ストリーム生成手段は、前記第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームを生成し、前記第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームを生成する
    ことを特徴とする請求項18記載の音声符号化装置。
  25. 前記符号化手段は、前記音声モードが二音声多重モードのとき、信号レベルがゼロレベルである音声信号を符号化したゼロレベル符号化信号を生成し、
    前記信号振り分け処理手段は、前記音声モードが二音声多重モードのとき、前記ゼロレベル符号化信号を前記第1と第2の系統に振り分けるものとし、
    前記音声ストリーム生成手段は、前記第1の系統に振り分けられた符号化信号を用いてステレオモードの第1の音声ストリームを生成し、前記第2の系統に振り分けられた符号化信号を用いてステレオモードの第2の音声ストリームを生成する
    ことを特徴とする請求項19記載の音声符号化装置。
  26. 前記符号化手段は、AC−3方式を用いて符号化を行うものとし、前記音声モードがステレオモードのとき、前記左音声信号と前記右音声信号の和信号と差信号をそれぞれ符号化して、前記第1の符号化信号と第2の符号化信号を生成する
    ことを特徴とする請求項23記載の音声符号化装置。
  27. 前記符号化手段は、AC−3方式を用いて符号化を行うものとし、前記ゼロレベル符号化信号を生成するとき、予め記憶されている差分符号化データと、前記符号化の際に用いたビット割当てパラメータ情報と、該ビット割当てパラメータ情報を用いて生成されたビット割当て情報に基づく量子化データを用いて前記ゼロレベル符号化信号を生成する
    ことを特徴とする請求項24あるいは請求項25のいずれかに記載の音声符号化装置。
  28. 前記符号化手段は、前記ビット割当てパラメータ情報を固定して、あるいは予め設定されている複数のビット割当てパラメータ情報からいずれかの情報を選択して用いることにより前記符号化を行い、前記ビット割当てパラメータ情報に応じて予め生成されて記憶されている差分符号化データと量子化データから、前記符号化で用いた前記ビット割当てパラメータ情報に対応する差分符号化データと量子化データを用いて、前記ゼロレベル符号化信号を生成する
    ことを特徴とする請求項27記載の音声符号化装置。
  29. 前記符号化手段は、MPEG(Moving Picture Experts Group)オーディオ方式を用いて符号化を行うものとし、前記音声モードがステレオモードのとき、前記左音声信号と前記右音声信号の和信号と差信号をそれぞれ符号化して、前記第1の符号化信号と第2の符号化信号を生成する
    ことを特徴とする請求項23記載の音声符号化装置。
  30. 前記符号化手段は、MPEG(Moving Picture Experts Group)オーディオ方式を用いて符号化を行うものとし、予め記憶されている量子化データとビット割当て情報を用いて前記ゼロレベル符号化信号を生成する
    ことを特徴とする請求項24あるいは請求項25のいずれかに記載の音声符号化装置。
JP2004014610A 2004-01-22 2004-01-22 音声符号化方法と音声符号化装置および音声記録装置 Pending JP2005208320A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004014610A JP2005208320A (ja) 2004-01-22 2004-01-22 音声符号化方法と音声符号化装置および音声記録装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004014610A JP2005208320A (ja) 2004-01-22 2004-01-22 音声符号化方法と音声符号化装置および音声記録装置

Publications (1)

Publication Number Publication Date
JP2005208320A true JP2005208320A (ja) 2005-08-04

Family

ID=34900349

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004014610A Pending JP2005208320A (ja) 2004-01-22 2004-01-22 音声符号化方法と音声符号化装置および音声記録装置

Country Status (1)

Country Link
JP (1) JP2005208320A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010146006A (ja) * 2008-12-19 2010-07-01 Korea Electronics Telecommun 符号化装置及び復号化装置
JP2010537473A (ja) * 2007-08-16 2010-12-02 韓國電子通信研究院 向上階層の符号化装置並びに復号化装置及びその方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010537473A (ja) * 2007-08-16 2010-12-02 韓國電子通信研究院 向上階層の符号化装置並びに復号化装置及びその方法
JP2012103707A (ja) * 2007-08-16 2012-05-31 Korea Electronics Telecommun 向上階層の符号化装置並びに復号化装置及びその方法
JP2012103706A (ja) * 2007-08-16 2012-05-31 Korea Electronics Telecommun 向上階層の符号化装置並びに復号化装置及びその方法
US8498875B2 (en) 2007-08-16 2013-07-30 Electronics And Telecommunications Research Institute Apparatus and method for encoding and decoding enhancement layer
JP2010146006A (ja) * 2008-12-19 2010-07-01 Korea Electronics Telecommun 符号化装置及び復号化装置

Similar Documents

Publication Publication Date Title
US11501789B2 (en) Encoded audio metadata-based equalization
JP5179881B2 (ja) オーディオソースのパラメトリックジョイント符号化
US6298025B1 (en) Recording and playback of multi-channel digital audio having different resolutions for different channels
US8364497B2 (en) Apparatus and method for coding and decoding multi-object audio signal with various channel
EP2328364B1 (en) A method and encoder for combining digital data sets, a decoding method and decoder for such combined digital data sets and a record carrier for storing such combined digital data set
US7853343B2 (en) Acoustic device and reproduction mode setting method
US20160225376A1 (en) Encoding device and method, decoding device and method, and program
KR20140028094A (ko) 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
JP2004272260A (ja) 帯域拡張技術を利用したデジタルデータの符号化方法、その装置、復号化方法およびその装置
JP2008538239A (ja) データストリームおよびマルチチャネル表現を生成するための装置および方法
WO2008150141A1 (en) A method and an apparatus for processing an audio signal
JPH11330980A (ja) 復号装置及びその復号方法、並びにその復号の手順を記録した記録媒体
CN1469684A (zh) 用于产生多声道声音的方法和装置
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
JP2008288935A (ja) 音声処理装置
JP2005521921A (ja) 信号処理
JP2005208320A (ja) 音声符号化方法と音声符号化装置および音声記録装置
JP2010114803A (ja) 音声処理装置
EP0877369B1 (en) Recording and playback of multi-channel digital audio having different resolutions for different channels
Smyth et al. DTS Coherent Acoustics Delivering High-Quality Multichannel Sound to the Consumer
JP2005519489A (ja) 複数の番組の記録と再生
KR100343667B1 (ko) 보이스 조절 기능을 갖는 디지털 가라오케 시스템
JP6204684B2 (ja) 音響信号再生装置
KR200331881Y1 (ko) 노래방 기능을 갖는 디브이디(dvd) 장치
JPH1153839A (ja) マルチチャンネルオーディオ再生装置