JP2003099095A - オーディオ符号化装置、方法、記録媒体及びプログラム - Google Patents

オーディオ符号化装置、方法、記録媒体及びプログラム

Info

Publication number
JP2003099095A
JP2003099095A JP2001286542A JP2001286542A JP2003099095A JP 2003099095 A JP2003099095 A JP 2003099095A JP 2001286542 A JP2001286542 A JP 2001286542A JP 2001286542 A JP2001286542 A JP 2001286542A JP 2003099095 A JP2003099095 A JP 2003099095A
Authority
JP
Japan
Prior art keywords
audio
encoding
signal
audio encoding
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001286542A
Other languages
English (en)
Inventor
Masanobu Funakoshi
正伸 船越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001286542A priority Critical patent/JP2003099095A/ja
Publication of JP2003099095A publication Critical patent/JP2003099095A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 ドラマや映画などのコンテンツで、台詞を低
ビットレートで符号化しつつ、同時にBGMや効果音を
加えて高音質で階層符号化するオーディオ符号化装置を
提供することを課題とする。 【解決手段】 オーディオ信号の低周波数成分を低ビッ
トレートで符号化する第一のオーディオ符号化部と、第
一のオーディオ符号化部によって符号化された信号と、
入力オーディオ信号との残差成分を高ビットレートかつ
高音質で符号化する際、第一のオーディオ符号化部の残
差成分とともに、入力信号とは別の新たなオーディオ信
号を加算して符号化する第二のオーディオ符号化部と、
第一のオーディオ符号化部と第二のオーディオ符号化部
により符号化されたオーディオ信号を階層化する階層化
部とを有することを特徴とするオーディオ符号化装置が
提供される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、階層符号化を行う
オーディオ符号化技術に関する。
【0002】
【従来の技術】近年、インターネット人口の爆発的な増
加とそれに伴うパーソナルコンピュータ(PC)やデジタル
家電の普及などによって、あらゆるメディアがデジタル
化され、インターネットなどを経由して配布、流通され
ている。
【0003】このような状況において、従来はビデオテ
ープ、LD、DVDなどの記録媒体を通じて流通していた動
画データも、デジタル化して圧縮符号化し、インターネ
ットを通じて流通されるようになった。
【0004】このように圧縮符号化された動画データ
は、ソフトウェア、もしくはハードウェアで構成された
復号再生部を備えた、専用のオーディオ符号化復号化装
置で復号再生することができる。
【0005】現状のインターネットのような比較的狭い
帯域におけるネットワーク配信を狙った動画圧縮符号化
の国際標準規格として、MPEG-4がある。MPEG-4規格で
は、動画圧縮符号化規格とともに、その一部として音声
圧縮符号化規格も規定されている。
【0006】MPEG-4規格では、音声符号化方式として、
音楽などを符号化対象としたAAC(Advanced Audio Codi
ng)、Twin-VQ(Transform domain Weighted INterleave
Vector Quantization)などの高音質符号化方式や、人
間の声を符号化対象としたCELP(Code Excited Linear P
rediction)、HVXC(Harmonic Vector eXcitation Codin
g)などのスピーチ符号化方式などが採用されている。ま
た、複数の方式の符号化器、復号化器を多段構成してビ
ットレートスケーラブルな音声符号化を実現する方式も
規定されている。
【0007】
【発明が解決しようとする課題】従来の階層符号化装置
では、同一のオーディオ信号源を階層符号化している。
その場合、例えば低ビットレートであるCELPなどのスピ
ーチ符号化方式をベースレイヤとし、AACなどの高音質
符号化方式を拡張レイヤとして映画などのコンテンツを
階層符号化すると、ベースレイヤのみの復号再生を行っ
た場合、スピーチ符号化方式では本来うまく符号化でき
ないBGMや効果音もスピーチ信号とともに符号化してし
まうため、台詞などが明瞭に聞き取れなくなってしまう
という問題が生じる。
【0008】本発明は上記問題点を解決するためになさ
れたもので、ドラマや映画、アニメなど、スピーチ信号
とBGM、効果音などが別々に記録されているコンテンツ
を階層符号化する場合に、オーディオ符号化部を多段構
成とし、一段目の符号化方式をHVXCのようなスピーチ符
号化方式とし、二段目の符号化方式をMP3(MPEG AudioLa
yer III)のような高音質符号化方式として構成してお
き、一段目の入力信号としてスピーチ信号のみを入力
し、二段目の入力信号として、一段目の符号化残差成分
にBGMや効果音などを加算して符号化することによっ
て、高ビットレートで復号再生する場合には、高音質で
復号することを実現するとともに、低ビットレートで再
生する場合は、スピーチ信号のみを明瞭に復号再生する
ことを実現し、高音質でありながら、低ビットレート時
にも台詞を明瞭に聞き取ることができるオーディオ符号
化技術を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明の一観点によれ
ば、オーディオ信号の低周波数成分を低ビットレートで
符号化する第一のオーディオ符号化部と、前記第一のオ
ーディオ符号化部によって符号化された信号と、入力オ
ーディオ信号との残差成分を高ビットレートかつ高音質
で符号化する際、前記第一のオーディオ符号化部の残差
成分とともに、入力信号とは別の新たなオーディオ信号
を加算して符号化する第二のオーディオ符号化部と、前
記第一のオーディオ符号化部と前記第二のオーディオ符
号化部により符号化されたオーディオ信号を階層化する
階層化部とを有することを特徴とするオーディオ符号化
装置が提供される。
【0010】本発明の他の観点によれば、オーディオ信
号の低周波数成分を低ビットレートで符号化する第一の
オーディオ符号化ステップと、前記第一のオーディオ符
号化ステップによって符号化された信号と、入力オーデ
ィオ信号との残差成分を高ビットレートかつ高音質で符
号化する際、前記第一のオーディオ符号化ステップの残
差成分とともに、入力信号とは別の新たなオーディオ信
号を加算して符号化する第二のオーディオ符号化ステッ
プと、前記第一のオーディオ符号化ステップと前記第二
のオーディオ符号化ステップにより符号化されたオーデ
ィオ信号を階層化する階層化ステップとを有することを
特徴とするオーディオ符号化方法が提供される。
【0011】本発明のさらに他の観点によれば、オーデ
ィオ信号の低周波数成分を低ビットレートで符号化する
第一のオーディオ符号化手順と、前記第一のオーディオ
符号化手順によって符号化された信号と、入力オーディ
オ信号との残差成分を高ビットレートかつ高音質で符号
化する際、前記第一のオーディオ符号化手順の残差成分
とともに、入力信号とは別の新たなオーディオ信号を加
算して符号化する第二のオーディオ符号化手順と、前記
第一のオーディオ符号化手順と前記第二のオーディオ符
号化手順により符号化されたオーディオ信号を階層化す
る階層化手順とをコンピュータに実行させるためのプロ
グラムを記録したコンピュータ読み取り可能な記録媒体
が提供される。
【0012】本発明のさらに他の観点によれば、オーデ
ィオ信号の低周波数成分を低ビットレートで符号化する
第一のオーディオ符号化手順と、前記第一のオーディオ
符号化手順によって符号化された信号と、入力オーディ
オ信号との残差成分を高ビットレートかつ高音質で符号
化する際、前記第一のオーディオ符号化手順の残差成分
とともに、入力信号とは別の新たなオーディオ信号を加
算して符号化する第二のオーディオ符号化手順と、前記
第一のオーディオ符号化手順と前記第二のオーディオ符
号化手順により符号化されたオーディオ信号を階層化す
る階層化手順とをコンピュータに実行させるためのプロ
グラムが提供される。
【0013】本発明によれば、高ビットレート復号再生
時には高音質なオーディオ信号を再生するとともに、低
ビットレート復号再生時には明瞭にスピーチ信号を再生
できるオーディオ符号化装置を提供することができる。
また、前記第一のオーディオ符号化部をHVXC符号化器で
構成することにより、低ビットレート再生時には、容易
に速度、ピッチ変換再生することができるオーディオ符
号化装置を提供することができる。
【0014】
【発明の実施の形態】以下図面を参照しながら本発明の
実施形態を詳細に説明する。図1は、本発明の第1の実
施形態におけるオーディオ符号化装置の一構成例であ
る。図示の構成において、ダウンサンプリング部1は、
高音質録音された入力スピーチ信号をダウンサンプリン
グして、8KHzサンプリング信号に変換して出力する。
【0015】次に、HVXC(Harmonic Vector eXcitation
Coding)符号化部2は、8KHzサンプリング音声信号をHVX
C符号化して出力する。HVXC符号化ビットストリームは
そのままデマルチプレクサ8と、HVXC複合化部3に出力
される。次に、HVXC複合化部3は、HVXC符号化部2から
出力されたHVXCビットストリームを復号化し、8KHzサン
プリング音声信号に変換する。
【0016】次に、アップサンプリング部4は、HVXC複
合化部3から出力された8KHzサンプリング音声信号を、
入力スピーチ信号と同様なサンプリングレートにアップ
サンプリングして出力する。
【0017】次に、聴覚心理モデル5は、入力音声信号
を用いてMP3(MPEG Audio Layer III)符号化における聴
覚心理モデル計算を行い、ブロック長選択情報とスケー
ルファクタバンドごとの信号対マスク比(SMR)を出力
する。本実施形態において、聴覚心理モデル計算は入力B
GMの左右各チャンネルと入力スピーチ信号に対して各々
行われる。
【0018】次に、HFB部6は、聴覚心理モデル5から
出力されるブロック長選択情報を用いて、入力される音
声信号に対してMP3符号化処理におけるHFB(Hybrid Fil
terBank)処理を行い、周波数領域信号に変換する。
【0019】ここで、本実施形態におけるオーディオ符
号化装置においては、高音質でサンプリングされた入力
BGM信号の左右各チャンネルと、入力スピーチ信号、HVXC
符号化復号化後にアップサンプリングされた入力スピー
チ信号に対して別々にHFB処理が行われ、周波数領域信号
に変換される。その後、入力スピーチ信号を変換した周
波数領域信号からHVXC符号化復号化後の周波数領域信号
を減算することにより、HVXC符号化残差信号が計算さ
れ、それに0.5を乗算したものを入力BGM信号の左右周波
数領域信号と加算する。
【0020】次に、MP3量子化部7は、聴覚心理モデル5
から出力されるスケールファクタバンドごとのSMRを利
用して、ビット割り当てを決定し、入力される周波数領域
信号を量子化する。本実施形態におけるオーディオ符号
化装置において、MP3量子化部7で行われる処理は左右
各チャンネルごとに個別に行われる。
【0021】次に、マルチプレクサ8は、HVXC符号化さ
れたスピーチ信号のビットストリームと、左右各チャン
ネルのMP3ビットストリームを階層化してオーディオビ
ットストリームを形成し、出力する。
【0022】図2は、本実施形態におけるオーディオ復
号化装置の一構成例である。図示の構成において、ま
ず、デマルチプレクサ11は、入力オーディオビットス
トリームを分離して、ヘッダ情報を除去し、MP3の各チ
ャンネルのビットストリームとHVXCビットストリーム
を、それぞれMP3逆量子化部16とHVXC復号部12に送
出する。
【0023】次に、HVXC復号部12は、デマルチプレク
サ11から送出されたHVXCビットストリームを復号して
音声信号に変換する。ここで、低ビットレート再生する
場合は、ポストフィルタ13に音声信号を送出し、高音
質再生する場合は、アップサンプリング部14に音声信
号を送る。
【0024】次に、ポストフィルタ13は、HVXC復号部
12から送出された音声信号に音質を整えるためのポス
トフィルタ処理を行い、ミキサーバッファ18へ送出す
る。なお、本実施形態においてポストフィルタ13は音
声信号が送られた場合、すなわち、低ビットレート再生
の場合のみ動作する。
【0025】次に、アップサンプリング部14は、HVXC
復号部12から送出されたHVXC音声信号をアップサンプ
リングし、MP3ビットストリームのサンプリングレート
に変換し、遅延補償HFB15に送る。ここで、アップサ
ンプリングとは、例えばMP3ビットストリームが48kHzで
サンプリングされている場合、HVXCビットストリームは
常に8kHzサンプリングであるため、足りない40000個/秒
の音声(時間領域)信号サンプルを補間する処理である。
アップサンプリングの具体的な方法は、一定の割合でHV
XC音声信号サンプル列に0を埋め込む事で行われるが、
その詳細は図5を用いて後述する。
【0026】次に、遅延補償HFB部15は、アップサン
プリング部14から送出される音声信号サンプルにMP3
符号化と全く同じHFB(Hybrid Filter Bank)処理を行
い、周波数領域信号に変換する。この際、HFB処理によ
る遅延が発生するため、遅延補償を行って周波数領域信
号を送出する。
【0027】次に、MP3逆量子化部16は、高音質再生
を行う場合のみ、デマルチプレクサ11から送出された
MP3各チャンネルビットストリームを逆量子化し、得ら
れた周波数領域信号を送出する。
【0028】本実施形態において、高音質再生が行われ
る場合、MP3逆量子化部16と遅延補償HFB15から送出
される周波数領域信号は、各チャンネルごとに適宜加算
されて逆HFB17に送出される。具体的には、Lチャンネ
ル、Rチャンネル各々のMP3周波数領域信号に、HVXC周波
数領域信号に0.5を乗じたものが加算される。
【0029】次に、逆HFB17は、入力された各チャン
ネルの周波数領域信号に逆HFB処理を行い、音声信号
(時間領域信号)に変換してミキサーバッファ18に出
力する。なお、逆HFB17は入力信号があるときのみ動
作し、入力信号がない場合は動作しない。
【0030】次に、ミキサーバッファ18は、入力され
る音声信号を適宜切り替えながら一時蓄積し、同期信号
に基づいて出力する。音声信号の切り替えは、入力され
る音声信号によって行う。すなわち、ポストフィルタ1
3からの音声信号入力がある場合は、HVXCビットストリ
ームを復号したモノラル音声信号を一時蓄積、送出す
る。また、逆HFB17からの各チャンネル信号が入力さ
れる場合は、LRチャンネル音声信号を同時に一時蓄積、
送出する。
【0031】以上、かかる本実施形態の構成において、
スピーチ信号とBGM信号を別々に入力して階層符号化す
ることが可能になり、低ビットレートで再生する場合は
明瞭にスピーチ信号を再生することが可能となり、か
つ、BGM信号を含めて高音質で再生することも可能なオ
ーディオ符号化が実現できる。
【0032】以下、本実施形態におけるオーディオ符号
化復号化装置の処理をフローに従って説明する。図3
は、本実施形態におけるオーディオ符号化処理のフロー
チャートである。まず、S1は、高サンプリングレート
で録音された入力スピーチ信号をダウンサンプリングし
て8KHzサンプリング信号にする処理である。この種の処
理は階層符号化処理において一般的であり、公知である
ので、詳細な説明は行わない。処理を終えると、S2へ処
理が進む。
【0033】次に、S2は、S1でダウンサンプリング
されたスピーチ信号をHVXC符号化する処理である。処理
を終えると、S3へ処理が進む。次に、S3は、S2でHVXC
符号化されたビットストリームをHVXC復号化し、8KHzサ
ンプル音声信号に変換する処理である。処理を終える
と、S4へ処理が進む。
【0034】次に、S4は、S3で出力された8KHzサンプ
ル音声信号を、入力スピーチ信号と同じサンプリングレ
ートにアップサンプリングする処理である。処理を終え
ると、S6へ処理が進む。
【0035】S5は、左右各入力BGM信号と入力スピ
ーチ信号の三入力信号に対して、MP3符号化における
聴覚心理モデル計算を行う処理である。この結果、ブロ
ック長選択情報と、スケールファクタバンドごとの信号
対マスク比(SMR)が算出される。処理を終えると、
S6へ処理が進む。
【0036】S6は、入力スピーチ信号、HVXC符号化復
号化したスピーチ信号、左右各入力BGM信号の四信号に
対して、MP3におけるHFB処理を行い、周波数領域信号に
変換する処理である。処理を終えると、S7へ処理が進
む。
【0037】S7は、入力スピーチ信号を変換した周波
数領域成分から、HVXC符号化復号化した信号を変換した
周波数領域成分を減算して、HVXC符号化残差を求める処
理である。処理を終えると、S8へ処理が進む。
【0038】S8は、左右各入力BGM信号を変換した周波
数領域信号に対して、S7で求めたHVXC符号化残差信号に
0.5を乗算したものを各々加算する処理である。処理
を終えると、S9へ進む。
【0039】S9は、左右各チャンネルの周波数領域信
号に対して、S5で求めたSMRを用いてビット割り当てを
決定し、MP3符号化における量子化を行う処理である。こ
の結果、左右各チャンネルごとのMP3ビットストリームが
作成される。処理を終えると、S10へ処理が進む。
【0040】S10は、マルチプレクサ8において、S2
で作成されたHVXC符号化ビットストリームと、S10で作
成された左右各チャンネルのMP3ビットストリームを統
合、階層化し、階層符号化ビットストリームを作成、出
力する処理である。処理を終えると、オーディオ符号化
処理を終了する。
【0041】図4は、オーディオ復号化処理を詳細化し
たフローチャートである。S21は、音声ビットストリ
ームデマルチプレクサ11において、同期信号に基づい
て、入力された音声ビットストリームを分離、解析し、
MP3の各チャンネルビットストリームとHVXCビットスト
リームを生成する処理である。処理を終えると、S22
に処理が進む。
【0042】S22は、HVXC復号部12において、S21
で得られたHVXCビットストリームを8KHzサンプリングの
音声信号に変換する処理である。処理を終えると、S2
3に処理が進む。
【0043】S23では、高音質再生するかどうかの指
示を判定し、その後の処理を決定する。高音質再生する
場合は、S24とS26に処理が進む。高音質再生しな
い場合は、S30へ処理が進む。
【0044】S24は、アップサンプリング部14にお
いて、S22で復号された音声信号をアップサンプリン
グして、MP3ビットストリームのサンプリングレートに
合わせる処理である。この処理は具体的には以下に説明
する方法で行われる。
【0045】図5は代表的なサンプリングレートにおけ
るMP3のフレーム長と、スーパーフレーム長と、スーパ
ーフレームに対するMP3とHVXCフレーム数をまとめた表
である。MP3は576サンプルで1フレームを形成するた
め、サンプリングレートによってフレーム長が変化す
る。一方、HVXCは常に8KHzサンプリングで160サンプ
ル、フレーム長20msで固定である。そこで、MP3フレー
ムとHVXCフレームがちょうど一致するように各フレーム
長を数倍してスーパーフレームを形成すると、表に示す
フレーム長になり、スーパーフレームに含まれるMP3フ
レームとHVXCフレームの数は表に示したようになる。こ
のフレーム数の比率、すなわち、MP3フレーム数÷HVXC
フレーム数の値を、アップサンプリング係数uとする
と、アップサンプリング処理は次式に従って行われる。
【0046】
【数1】
【0047】ただし、XHFB-in[k]はHFBに入力される時
間領域サンプル、XHVXC-out[i] は、HVXCを復号した時
間領域サンプルである。上記アップサンプリング処理を
終えると、S25へ処理が進む。
【0048】S25は、遅延補償HFB部15において、MP
3符合化時と同様なHFB処理を行い、HVXCビットストリー
ムを復号した音声信号を周波数領域信号に変換する処理
である。このとき、HFB処理による遅延が発生するた
め、その後、遅延を補償する処理を行う。処理を終える
と、S27へ処理が進む。
【0049】S26は、MP3逆量子化部16,17におい
て、S21で分離生成された各チャンネルのMP3ビット
ストリームをチャンネルごとに逆量子化して周波数領域
信号に変換する処理である。処理を終えると、S27へ
処理が進む。
【0050】S27は、S25で得られたHVXCビットスト
リームによる周波数領域信号と、S26で得られたMP3ビ
ットストリームによる各チャンネルの周波数領域信号を
適宜加算する処理である。この加算は図2を用いて前述
した要領で行われる。処理を終えると、S28へ処理が
進む。
【0051】S28は、S27で得られた各チャンネル
ごとの周波数領域信号に、適宜逆和差ステレオ計算を行
う処理である。この処理は図2を用いて前述した要領で
行われる。処理を終えると、S29へ処理が進む。
【0052】S29は、S28で得られた周波数領域信
号に対してMP3復号に用いられる逆HFB処理を行い、
時間領域信号(音声信号)に変換する処理である。処理
を終えると、S31へ処理が進む。
【0053】S30は、S23で得られた音声信号に対
して、音質を整えるためのポストフィルタ処理を行う。
これは、具体的にはHVXCフレーム間の信号のギャップを
整えるなどの効果がある。処理を終えると、S31へ処
理が進む。
【0054】S31は、S29で得られた音声信号と、S
30で得られた音声信号を適宜切り替えながらバッファ
リングを行う処理である。処理を終えると、S32へ処
理が進む。
【0055】S32は、S31でバッファリングした音声
信号を、同期信号に従って出力する処理である。処理を
終えると、音声復号再生処理を終了する。
【0056】(第2の実施形態)なお、本発明は上述し
た第1の実施形態に限定されるものではない。上述した
第1の実施形態では、専用のハードウェアを用いて実装
した例であるが、汎用のパーソナルコンピュータ(PC)上
で同様な処理を行うソフトウェアプログラムとして実装
する事も可能である。以下、この場合の第2の実施形態
について述べる。
【0057】本オーディオ符号化復号化処理プログラム
は、図3及び図4に示されるオーディオ符号化復号化処
理手順のフローチャートに基づいてプログラムコード化
されたものである。
【0058】図6は、本オーディオ符号化復号化処理プ
ログラムおよび関連データを記録メディアMEDIAに記録
したときのMEDIA内容の構成図である。なお、本実施形
態におけるMEDIAとは記録メディアであり、これは、具
体的にはDVD-ROM、DVD-RAM、DVD-R、DVD-RW、DVD-VIDE
O、DVD-AUDIO、CD(-AUDIO)、CD-ROM、CD-V、CD-R、CD-R
WなどのDVD規格もしくはCD規格のメディアを総称したも
のである。
【0059】本実施形態において、本オーディオ符号化
復号化処理プログラムおよび関連データはMEDIAに記録
されている。図示したようにMEDIAの先頭領域には、こ
のMEDIAのボリューム情報とディレクトリ情報が記録さ
れており、その後にこのMEDIAのコンテンツである本オ
ーディオ符号化復号化処理プログラムと、オーディオ符
号化復号化処理関連データが記録されている。
【0060】図7は本オーディオ符号化復号化処理プロ
グラムを、一般のPCに導入する場合の模式図である。ME
DIAに記録された本オーディオ符号化復号化処理プログ
ラムおよび関連データは、図8に示したようにメディア
ドライブMEDIADRVを介してPCにロードすることができ
る。まず、MEDIAをメディアドライブMEDIADRVにセット
すると、OS及び基本I/Oプログラムの制御のもとに
本オーディオ符号化復号化処理プログラムおよび関連デ
ータが記録メディアMEDIAから読み出され、PC内のRAM、
もしくはHDなどの記憶装置に複写され、PC上のCPUによ
り実行可能となる。
【0061】図8は、本実施形態における本オーディオ
符号化復号化処理プログラムを実行している状態のPCの
メモリマップを示す。図示したように、ROM上の基本
I/Oプログラムはメモリマップの上位にマップされ、
下位にOS、オーディオ符号化復号化処理プログラム、
RAM上の関連データ、ワークエリアがマップされる。
【0062】本実施形態は、コンピュータがプログラム
を実行することによって実現することができる。また、
プログラムをコンピュータに供給するための手段、例え
ばかかるプログラムを記録したCD−ROM等の記録媒
体又はかかるプログラムを伝送するインターネット等の
伝送媒体も本発明の実施形態として適用することができ
る。上記のプログラム、記録媒体及び伝送媒体は、本発
明の範疇に含まれる。記録媒体としては、例えばフレキ
シブルディスク、ハードディスク、光ディスク、光磁気
ディスク、CD−ROM、磁気テープ、不揮発性のメモ
リカード、ROM等を用いることができる。
【0063】上述の実施形態では、第一の音声復号方式
としてHVXCを選択しているが、これはCELPであっても同
様な機能を持つオーディオ符号化復号化システムを構成
できる。
【0064】また、上述の実施形態では、第二の高音質
音声復号方式としてMP3を選択しているが、これはAACで
あっても良い。また、上述の実施形態ではオーディオデ
ータの著作権を保護する装置や処理などについて一切触
れていないが、そのような装置や処理と組み合わせて実
施することも当然可能である。その他、本発明はその要
旨を逸脱しない範囲で種種変形して実施することができ
る。
【0065】
【発明の効果】以上説明したように、本発明によれば、
オーディオ階層符号化において、第一の音声符号化方式
にHVXCのようなスピーチ用の低ビットレート符号化方式
を選択し、第二の音声符号化方式にMP3のような高音質
ステレオ符号化方式を選択し、台詞などのスピーチ信号
と、BGMや効果音などとともに第一の符号化方式の残差
成分を加算して階層符号化することにより、低ビットレ
ート再生のときには第一の音声符号化方式のみで明瞭な
スピーチ信号のみを復号し、高音質再生時には第二の音
声符号化方式も用いて高音質ステレオ復号することを実
現し、各符号化方式の特徴を生かした音質の良いオーデ
ィオ信号を再生できるオーディオ符号化復号化装置を提
供することを可能にする。
【図面の簡単な説明】
【図1】本発明の第1の実施形態におけるオーディオ符
号化装置の一構成例を示す図である。
【図2】第1の実施形態におけるオーディオ復号化装置
の一構成例を示す図である。
【図3】第1の実施形態におけるオーディオ符号化処理
のフローチャートである。
【図4】第1の実施形態におけるオーディオ復号化処理
のフローチャートである。
【図5】第1の実施形態におけるMP3サンプリングレー
トに対するスーパーフレーム長とMP3・HVXCフレーム数
を示す図である。
【図6】本発明の第2の実施形態におけるオーディオ符
号化復号化処理プログラム格納媒体の内容構成を示す図
である。
【図7】第2の実施形態におけるオーディオ符号化復号
化処理プログラムを記録媒体からPCに導入する場合の模
式図である。
【図8】第2の実施形態におけるオーディオ符号化復号
化処理プログラムをロードしたときのPCのメモリマップ
の内容構成を示す図である。
【符号の説明】
1 ダウンサンプリング部 2 HVXC符号化部 3 HVXC復号化部 4 アップサンプリング部 5 聴覚心理モデル 6 HFB部 7 MP3量子化部 8 マルチプレクサ 11 デマルチプレクサ 12 HVXC復号部 13 ポストフィルタ 14 アップサンプリング部 15 遅延補償HFB 16 MP3逆量子化部 17 逆HFB 18 ミキサーバッファ

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ信号の低周波数成分を低ビッ
    トレートで符号化する第一のオーディオ符号化部と、 前記第一のオーディオ符号化部によって符号化された信
    号と、入力オーディオ信号との残差成分を高ビットレー
    トかつ高音質で符号化する際、前記第一のオーディオ符
    号化部の残差成分とともに、入力信号とは別の新たなオ
    ーディオ信号を加算して符号化する第二のオーディオ符
    号化部と、 前記第一のオーディオ符号化部と前記第二のオーディオ
    符号化部により符号化されたオーディオ信号を階層化す
    る階層化部とを有することを特徴とするオーディオ符号
    化装置。
  2. 【請求項2】 前記第一の音声符号化部がHVXC符号化器
    であることを特徴とする請求項1に記載のオーディオ符
    号化装置。
  3. 【請求項3】 前記第二の音声符号化部がMP3符号化器
    であることを特徴とする請求項1に記載のオーディオ符
    号化装置。
  4. 【請求項4】 オーディオ信号の低周波数成分を低ビッ
    トレートで符号化する第一のオーディオ符号化ステップ
    と、 前記第一のオーディオ符号化ステップによって符号化さ
    れた信号と、入力オーディオ信号との残差成分を高ビッ
    トレートかつ高音質で符号化する際、前記第一のオーデ
    ィオ符号化ステップの残差成分とともに、入力信号とは
    別の新たなオーディオ信号を加算して符号化する第二の
    オーディオ符号化ステップと、 前記第一のオーディオ符号化ステップと前記第二のオー
    ディオ符号化ステップにより符号化されたオーディオ信
    号を階層化する階層化ステップとを有することを特徴と
    するオーディオ符号化方法。
  5. 【請求項5】 前記第一の音声符号化ステップがHVXC符
    号化ステップであることを特徴とする請求項4に記載の
    オーディオ符号化方法。
  6. 【請求項6】 前記第二の音声符号化ステップがMP3符
    号化ステップであることを特徴とする請求項4に記載の
    オーディオ符号化方法。
  7. 【請求項7】 オーディオ信号の低周波数成分を低ビッ
    トレートで符号化する第一のオーディオ符号化手順と、 前記第一のオーディオ符号化手順によって符号化された
    信号と、入力オーディオ信号との残差成分を高ビットレ
    ートかつ高音質で符号化する際、前記第一のオーディオ
    符号化手順の残差成分とともに、入力信号とは別の新た
    なオーディオ信号を加算して符号化する第二のオーディ
    オ符号化手順と、 前記第一のオーディオ符号化手順と前記第二のオーディ
    オ符号化手順により符号化されたオーディオ信号を階層
    化する階層化手順とをコンピュータに実行させるための
    プログラムを記録したコンピュータ読み取り可能な記録
    媒体。
  8. 【請求項8】 前記第一の音声符号化手順がHVXC符号化
    手順であることを特徴とする請求項7に記載の記録媒
    体。
  9. 【請求項9】 前記第二の音声符号化手順がMP3符号化
    手順であることを特徴とする請求項7に記載の記録媒
    体。
  10. 【請求項10】 オーディオ信号の低周波数成分を低ビ
    ットレートで符号化する第一のオーディオ符号化手順
    と、 前記第一のオーディオ符号化手順によって符号化された
    信号と、入力オーディオ信号との残差成分を高ビットレ
    ートかつ高音質で符号化する際、前記第一のオーディオ
    符号化手順の残差成分とともに、入力信号とは別の新た
    なオーディオ信号を加算して符号化する第二のオーディ
    オ符号化手順と、 前記第一のオーディオ符号化手順と前記第二のオーディ
    オ符号化手順により符号化されたオーディオ信号を階層
    化する階層化手順とをコンピュータに実行させるための
    プログラム。
  11. 【請求項11】 前記第一の音声符号化手順がHVXC符号
    化手順であることを特徴とする請求項10に記載のプロ
    グラム。
  12. 【請求項12】 前記第二の音声符号化手順がMP3符号
    化手順であることを特徴とする請求項10に記載のプロ
    グラム。
JP2001286542A 2001-09-20 2001-09-20 オーディオ符号化装置、方法、記録媒体及びプログラム Pending JP2003099095A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001286542A JP2003099095A (ja) 2001-09-20 2001-09-20 オーディオ符号化装置、方法、記録媒体及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001286542A JP2003099095A (ja) 2001-09-20 2001-09-20 オーディオ符号化装置、方法、記録媒体及びプログラム

Publications (1)

Publication Number Publication Date
JP2003099095A true JP2003099095A (ja) 2003-04-04

Family

ID=19109502

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001286542A Pending JP2003099095A (ja) 2001-09-20 2001-09-20 オーディオ符号化装置、方法、記録媒体及びプログラム

Country Status (1)

Country Link
JP (1) JP2003099095A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006035810A1 (ja) * 2004-09-30 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006035810A1 (ja) * 2004-09-30 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法
US7904292B2 (en) 2004-09-30 2011-03-08 Panasonic Corporation Scalable encoding device, scalable decoding device, and method thereof

Similar Documents

Publication Publication Date Title
CN1961351B (zh) 可缩放的无损音频编解码器和创作工具
Neuendorf et al. MPEG unified speech and audio coding-the ISO/MPEG standard for high-efficiency audio coding of all content types
KR100818268B1 (ko) 오디오 데이터 부호화 및 복호화 장치와 방법
EP2250572B1 (en) Lossless multi-channel audio codec using adaptive segmentation with random access point (rap) capability
EP1455345B1 (en) Method and apparatus for encoding and/or decoding digital data using bandwidth extension technology
JP5542306B2 (ja) オーディオ信号のスケーラブル符号化及び復号
JP5171842B2 (ja) 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法
US7974840B2 (en) Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
JP5123303B2 (ja) 不可逆的符号化データ・ストリームと可逆的伸張データ・ストリームを用いて原信号を可逆的に符号化する方法及び装置
EP1960999B1 (en) Method and apparatus encoding an audio signal
JP4056407B2 (ja) スケーラブル無損失オーディオ符号化/復号化装置及びその方法
US8374858B2 (en) Scalable lossless audio codec and authoring tool
KR20160015245A (ko) 오디오 신호를 인코딩하기 위한 방법, 오디오 신호를 인코딩하기 위한 장치, 오디오 신호를 디코딩하기 위한 방법 및 오디오 신호를 디코딩하기 위한 장치
JPH08263096A (ja) 音響信号符号化方法及び復号化方法
JP2013511053A (ja) ダウンミックス信号表現に基づいてアップミックス信号表現を生成するための装置、マルチチャネルオーディオ信号を表現するビットストリームを生成するための装置、歪制御信号化を用いる方法、コンピュータプログラム及びビットストリーム
TWI390502B (zh) 編碼信號之處理方法
EP2228791B1 (en) Scalable lossless audio codec and authoring tool
JP2009536364A (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
JP3964860B2 (ja) ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体
Geiger et al. ISO/IEC MPEG-4 high-definition scalable advanced audio coding
Liebchen An introduction to MPEG-4 audio lossless coding
Yu et al. A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding
JP2003099095A (ja) オーディオ符号化装置、方法、記録媒体及びプログラム
KR20070008211A (ko) 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치