JPH0944198A - 音声の準可逆符号化装置 - Google Patents

音声の準可逆符号化装置

Info

Publication number
JPH0944198A
JPH0944198A JP7209156A JP20915695A JPH0944198A JP H0944198 A JPH0944198 A JP H0944198A JP 7209156 A JP7209156 A JP 7209156A JP 20915695 A JP20915695 A JP 20915695A JP H0944198 A JPH0944198 A JP H0944198A
Authority
JP
Japan
Prior art keywords
code amount
amount
encoding
section
correction value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7209156A
Other languages
English (en)
Inventor
Norihiko Fuchigami
徳彦 渕上
Shoji Ueno
昭治 植野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP7209156A priority Critical patent/JPH0944198A/ja
Publication of JPH0944198A publication Critical patent/JPH0944198A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 本来必要なデータ量を削減することを防止
し、聴感上の音質が悪化することを防止する。 【解決手段】 窓掛け・直交変換部22はフレームデー
タに窓掛けして直交変換し、直交変換係数を複数のバン
ドに分割する。正規化部23はバンド毎の正規化係数を
決定してバンド内の直交変換係数を正規化し、量子化・
符号化部24は正規化後の係数を可逆に必要な精度で量
子化する。符号量制御部26は量子化対象の全区間の可
逆方式による目標符号量と実符号量の差を算出し、各区
間毎の符号量の過不足量に応じた補正値を算出する。量
子化・符号化部24は全区間の平均符号量が目標符号量
になるように符号量補正値に基づいて各区間の信号を可
逆方式で再量子化するとともに聴覚心理分析部25の出
力に基づいて非可逆方式で再量子化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、オーディオ信号を
所定の区間毎に高能率符号化する音声の準可逆符号化装
置に関する。
【0002】
【従来の技術】CD(コンパクトディスク)は1982
年に登場して十数年が経過し、現在では様々な展開によ
りディジタルストレージメディアとして定着している。
オーディオメディアの用途を考えると、サンプリング周
波数fs =44.1kHz、量子化ビット数=16ビッ
トのこのメディアは完全に成熟期に入っている。また、
この数年のスタジオ製作サイドでは、量子化ビット数の
20ビット化、24ビット化やfs =88.2kHz
化、96kHz化などのハイサンプリング化が進んでお
り、より高音質のマスタを基にしてCDを作成する動き
が出てきている。
【0003】その理由としては、編集段階では余裕のあ
るフォーマットで作業を行うことによりCDの出来上が
りの音質を向上させることができるからであり、また、
そもそもfs =44.1kHz、16ビットの情報量で
は満足することができないという傾向が出てきたなどが
考えられる。この要求を受けて、民生用機器においても
再生時に疑似的に16ビット→20ビット変換を行った
り、疑似的に超高域信号を付加する方法などで高音質化
を実現することが行われている。
【0004】一方、ビデオCD、MD(ミニディス
ク)、DCC(デジタル・コンパクト・カセット)のよ
うに、音声信号を高能率符号化することにより伝送効率
を向上させるシステムも実現されており、例えばDCC
では聴覚心理モデルを利用してPCMの1/4の符号量
で聴感上ほとんどCDと遜色のない音質を実現してい
る。
【0005】ここで、高音質の次世代オーディオメディ
アを考えると、必要な情報量としては、 20ビット、fs =88.2kHz(以下「2088」
という。) などが考えられる。この場合の伝送レートはCDの2.
5倍となり、符号化方式として単純なPCMを用いるこ
とは不経済であると言える。なお、PCMに代わる符号
化方式として最近各方面で応用が進んでいる高能率符号
化方式は、 ・可逆符号化(ロスレス符号化、可逆圧縮、無雑音圧縮
など) ・非可逆符号化(非可逆圧縮、有雑音圧縮など) の2つの方式に大きく分類される。前者はテキストデー
タのアーカイバなどで主に実用化されており、後者はM
PEG国際標準が代表例である。
【0006】「2088」のオーディオデータをPCM
に代わって高能率に伝送するためには、できれば可逆符
号化方式が望ましい。しかしながら、この場合の圧縮率
は曲によって大きく異なり、特にノイズライクな曲ほど
圧縮率を上げることができないことは情報理論からも明
らかである。可逆符号化方式による「2088」の圧縮
率は1曲平均で およそ25%〜50%(データ量75%〜50%に圧
縮) になると予想され、設計時には最悪値を想定するので、
25%程度の効率アップとなる。この場合、曲平均を想
定しているので瞬間的には殆ど圧縮することができない
フレームも当然存在し、したがって、可変伝送レート方
式を採る必要がある。この結果、オーサリングも煩雑で
あり、時間を要する。図10は可逆符号化した場合の各
フレームビット数、平均ビット数及び原音ビット数の関
係の例を示す。
【0007】一方、非可逆符号化方式の場合には、聴覚
心理モデルを最適に利用すれば1/4に圧縮しても何ら
聴覚上の劣化は感じられず、「2088」の圧縮率は 75%(データ量25%に圧縮) が十分可能である。但し、実際の高音質次世代メディア
ではおそらくは記録密度が向上することと、非可逆符号
化で編集を繰り返したときの劣化を考えると、これほど
の高圧縮率は必要ない。
【0008】そこで、高音質次世代メディアを考える
と、以下のような選択肢が考えられる。 圧縮率が「0」で可能な場合→従来どおりのPCM 圧縮率が25%以内であって可変伝送レートを用いる
場合→可逆符号化 圧縮率が25%〜50%程度必要であって可変伝送レ
ートを用いる場合→可逆符号化状態から一部又は全部の
フレームの使用可能符号量(ビット数)を減少させて対
応(一部又は全部を非可逆符号化) 圧縮率が50%以上必要な場合→聴覚心理モデルを利
用した非可逆符号化
【0009】ここで、可逆符号化を行う場合には、大き
く分けて次の2つの方法が考えられる。 ・時間領域で線形予測を行い、残差を量子化・符号化す
る方法。 ・信号を周波数領域に変換し、エネルギの偏りを利用し
て正規化し、量子化・符号化する方法。 なお、前者の方法は線形予測の効果に限界があるので、
符号化にエントロピー符号化を用いて効率を高めるのが
一般的であり、そのエンコーダを図11に示す。また、
後者の場合には直交変換と正規化がかなりのデータ削減
効果があり、符号化は補助的な役割で用いられ、そのエ
ンコーダを図12に示す。なお、いずれの場合にも、達
成される圧縮率に大きな差はない。
【0010】図11に示す時間領域処理のエンコーダで
は、線形予測残差出力部1がPCM信号を時間領域で線
形予測を行い、その残差を出力する。最も効果的な方法
は、各フレームにおいて残差が最小となる線形予測計数
を最小二乗法などで算出する方法である。線形予測の例
としては直線予測の場合、以下の式で残差を出力する。 d〔i〕=x〔i〕−(2*x〔i−1〕−x〔i−
2〕) 但し、x〔〕は入力信号系列、d〔〕は予測残差系列
【0011】量子化・符号化部2はこの線形予測残差d
〔〕を予め定めたフレーム毎に正規化し、可逆に必要な
精度で量子化する。この場合、量子化値にはエントロピ
ー符号化(例えばハフマン符号、Lempel-Ziv符号など)
を施して更に符号量を削減するのが一般的である。ま
た、量子化・符号化する場合、符号量制御部3の指示に
より量子化ビット数をほぼ一様に増加又は減少させてそ
のフレームにおいて使用可能な符号量に合わせる必要が
あり、また、符号量が余剰な場合にはパディングビット
を付加して調整することもできる。フォーマット出力部
4は一般に、線形予測残差出力部1の予測方式(予測係
数)と、量子化・符号化部2の正規化係数(場合によっ
ては量子化ビット数)と、符号量制御部3の符号量制御
情報と、それにヘッダなどの補助情報を付加してフォー
マット化(ビットストリーム化)して伝送する。
【0012】図12に示す周波数領域処理のエンコーダ
では、バッファ11は後段の窓掛け・直交変換部12が
直交変換する際に必要なフレーム分のPCM信号をバッ
ファリングする。そして、窓掛け・直交変換部12はこ
のフレームデータに窓掛け(一般にはハニング窓などの
窓掛け)し、MDCT(変形離散コサイン変換)等によ
り直交変換し、この直交変換係数を複数のバンドに分割
する。正規化部13はこのバンド毎の正規化係数(スケ
ールファクタ)を決定し、バンド内の直交変換係数を正
規化する。
【0013】量子化・符号化部14はこの正規化後の係
数を可逆に必要な精度で量子化し、この場合にも必要で
あればエントロピー符号化する。但し、図11に示す時
間領域処理の場合よりエントロピー符号化の効果は一般
に少ない。また、量子化・符号化する場合、符号量制御
部15の指示により量子化ビット数をほぼ一様に増加又
は減少させてそのフレームにおいて使用可能な符号量に
合わせる必要があり、また、符号量が余剰な場合にはパ
ディングビットを付加して調整することもできる。フォ
ーマット出力部16は一般に、正規化係数(場合によっ
ては量子化ビット数)と、符号量制御部3の符号量制御
情報と、それにヘッダ等の補助情報を付加してフォーマ
ット化(ビットストリーム化)して伝送する。
【0014】図13は図12に示すエンコーダにおける
周波数領域の正規化・量子化の処理を示している。この
場合、各バンドの最大値(を1〜2dB刻みで量子化し
た値)を正規化係数<S>とし、可逆に必要なビット数
については、想定されるPCM原信号の量子化ノイズレ
ベル(ホワイトノイズであるのでレベルはフラットなは
ず)と同等以下にノイズレベル<N>を設定し、各バン
ドのS/Nを満足するビット数で再量子化する。
【0015】この時の必要情報量は、図中の矩形領域で
仕切られた面積であり、エネルギに偏りがある信号で
は、原音情報量よりかなり削減できることが分かる。な
お、時間領域処理において線形予測残差をとることは、
信号をフィルタリングして残差スペクトルを平均化する
処理に相当し、図13に示す周波数領域の処理をラフに
実現することと等しい。
【0016】
【発明が解決しようとする課題】しかしながら、上記4
つの選択肢の中で 、及びは特に問題となること
はないが、については伝送レートを調整するために量
子化ビット数を削減する場合に、 (a)曲全体で一様に過剰ビット分を負担して削減す
る。 という方法を用いるのが簡単である。
【0017】ここで、可逆符号化におけるデータ量を考
えると、信号がノイズに近くてエントロピーが大きい場
合にはデータ量が多く(圧縮率が低く)、信号がトーン
ライクであってエントロピーが小さい場合にはデータ量
が少ない(圧縮率が高い)。逆に、聴覚心理モデルから
考えると、信号がノイズライクなほど聴感エントロピー
は小さく、情報量は小さい(圧縮率は高くてもよい)と
言える。すなわち、数学エントロピーと聴感エントロピ
ーは反比例の関係にある。したがって、上記(a)の場
合には、聴感エントロピーが低いフレームの影響が、聴
感エントロピーが高いフレームに影響を及ぼして本来必
要なデータ量を削減してしまうという問題点がある。
【0018】本発明は上記の問題点に鑑み、本来必要な
データ量を削減することを防止し、聴感上の音質が悪化
することを防止することができる音声の準可逆符号化装
置を提供することを目的とする。
【0019】
【課題を解決するための手段】本発明は上記目的を達成
するために、符号化対象の全区間の可逆方式による目標
符号量と実符号量の差を算出して各区間毎の符号量の過
不足量に応じた補正値を算出し、全区間の平均符号量が
目標符号量になるように符号量補正値に基づいて各区間
の信号を可逆方式で量子化するか又は聴覚心理モデル基
づいて非可逆方式で量子化するようにしている。すなわ
ち本発明によれば、オーディオ信号を所定の区間長ごと
にフレーム化する手段と、符号化対象の全区間の可逆方
式による目標符号量と実符号量の差を算出し、各区間毎
の符号量の過不足量に応じた補正値を算出する手段と、
フレーム内の信号を聴覚心理モデルで分析する聴覚心理
分析手段と、全区間の平均符号量が目標符号量になるよ
うに前記符号量補正値に基づいて各区間の信号を可逆方
式で量子化するか又は前記聴覚心理分析手段の出力に基
づいて非可逆方式で量子化する量子化手段とを有する音
声の準可逆符号化装置が提供される。
【0020】
【発明の実施の形態】以下、図面を参照して本発明の準
可逆符号化装置の実施の形態を実施例によって説明す
る。図1は本発明に係る音声の準可逆符号化装置の一実
施例を示すブロック図、図2は図1における符号量補正
値を算出する処理を説明するためのフローチャート、図
3は符号量偏差と符号量補正値の関係を示すグラフ、図
4〜図6は符号量補正前と補正後の符号量偏差ヒストグ
ラムを示す説明図、図7は図1における聴覚心理分析と
符号量調整処理を説明するためのフローチャート、図8
は図1の準可逆符号化装置と従来例における符号量過剰
時の再量子化ノイズレベルの比較例を示す説明図、図9
は図1の準可逆符号化装置と従来例における聴感上の音
質比較例を示す説明図である。
【0021】図1に示す装置では、先ず、図12に示す
周波数領域処理のエンコーダと同様に、バッファ21が
後段の窓掛け・直交変換部22が直交変換する際に必要
なフレーム分のPCM信号をバッファリングし、窓掛け
・直交変換部22はこのフレームデータに窓掛け(一般
にはハニング窓等の窓掛け)し、MDCT(変形離散コ
サイン変換)等により直交変換し、この直交変換係数を
複数のバンドに分割する。正規化部23はこのバンド毎
の正規化係数(スケールファクタ)を決定し、バンド内
の直交変換係数を正規化する。量子化・符号化部24は
この正規化後の係数を可逆に必要な精度で量子化し、こ
の場合にも必要であればエントロピー符号化する。但
し、図11に示す時間領域処理の場合よりエントロピ符
号化の効果は一般に少ない。
【0022】そして、本実施例では、聴覚心理分析部2
5と符号量制御部26及び量子化・符号化部24が区間
毎の符号量補正値Adv に基づいて以下のような処理を行
う。先ず、本発明では、オーディオメディアを制作する
場合に、1曲(例えば4〜6分)又は全曲(例えば40
〜74分)等の長時間平均で符号量が目標値になるよう
に制御する方法であり、エンコード処理は2パスで行
う。具体的には、 (a)可逆符号化を仮定した1回目のエンコード処理を
行う。但し、各区間の使用符号量が得られればよく、実
際に量子化・符号化を行う必要はない。 (b)図2に示すように各区間の使用符号量と目標符号
量の差から各区間の符号量補正値Adv を算出する。 (c)2回目のエンコード処理を行う。この場合、可逆
符号化を仮定したビット割り当てを補正符号量と聴覚心
理モデルにより変更して量子化・符号化を行い、また、
ビット割り当て変更の情報を補助情報としてデコーダに
伝送する。
【0023】次に、図2を参照して上記(b)における
符号量補正値Adv を算出する処理について説明する。 先ず、対象区間の使用符号量を入力して平均符号量T
mを算出し、目標符号量Tdとの差を評価する(ステッ
プS1、S2)。 次いで、符号量過剰な場合(平均符号量Tm>目標符
号量Td)には、各区間の使用符号量と目標符号量との
偏差Delta[bit](但し、過剰な場合に正)を算出し、こ
の偏差Delta[bit]を適当なステップ幅step[bit] で量子
化し、ヒストグラムを作成する(ステップS2→S
3)。 次いで、ヒストグラムの偏差が負の領域の偏差総量S
mと、正の領域の偏差総量Spを以下のように算出する
(ステップS4)。
【0024】
【数1】
【0025】次いで、負の領域の偏差総量Smの比率
Sm/(Sm+Sp)が予め定めた値Bound (例えば
0.33等)より大きい場合には、以下のように各区間
毎の符号量補正値Adv を求める(ステップS5→S
6)。 if Delta ≦0 Adv =0 [bit] else Adv =−{(Sp−Sm)/Sp}*Delta[bit]
【0026】’他方、比率Sm/(Sm+Sp)が値
Bound より小さい場合には、比率Sm/(Sm+Sp)
が値Bound より大きくなるようにヒストグラムのオフセ
ット値Off を決定し(ステップS5→S7)、以下のよ
うに各区間毎の符号量補正値Adv を求める(ステップS
8)。 if Delta ≦Off *step Adv =−Off *step[bit] else Adv =−Off *step−{(Sp−Sm)/Sp}*(De
lta −Off *step)[bit] ここで、この手法を用いる理由は、ヒストグラムが極端
に「過剰」側に偏っている場合には、ある程度全フレー
ムにオフセットを掛けて補正する必要があるからであ
る。
【0027】’また、ステップS2において平均符号
量Tm>目標符号量Tdでない場合には、平均符号量T
mと目標符号量Tdに基づいて以下のように各区間で一
定の符号量補正値Adv を求める(ステップS9)。 Adv =(Td−Tm) [bit]
【0028】図3は符号量偏差Delta[bit]と符号量補正
値Adv の関係を示し、偏差Delta[bit]が正であって大き
い程、補正値Adv も増大する。また、図4〜図6は符号
量補正前(実線)と補正後(破線)のヒストグラムを示
し、横軸がサンプル当たりの偏差(Delta /区間当たり
のサンプル数)を、また、縦軸が度数を示す。詳しくは
図4は上記のように補正値Adv を求めた場合、また、
図5、図6はそれぞれ上記 ’、’のように補正値A
dv を求めた場合を示している。
【0029】次に、図7を参照して聴覚心理分析と符号
量調整処理を説明する。図7において、先ず、量子化・
符号化部24により正規化された係数の1回目(可逆方
式)の量子化ビット数(Bit[i])を決定し、符号量を見
積もって総符号量(Total bit )を算出する(ステップ
S11)。次いでそのフレームの符号量補正値Adv を読
み込み(ステップS12)、補正値Adv が負(Adv <
0)か否かをチェックする(ステップS13)。
【0030】そして、補正値Adv が負の場合(符号量削
減)には、先ず、聴覚心理モデルのマスキング効果と最
小可聴限特性を考慮してバンドパワーp[i] (=正規化
2=scale[i]2 )からマスキングカーブm[i] を算出
する(ステップS14)。この場合、マスキングカーブ
m[i] は基準カーブcurve[i]とバンドパワーp[i] を畳
み込み演算することにより得られる。
【0031】次いで最小可聴限とマスキングカーブから
各バンドの標準ノイズレベルN[i]を算出し(ステップ
S15)、次いで標準ノイズレベルN[i] が高いバンド
から1ビットずつビット削減を行うことにより符号量補
正値を各バンドに振り分ける。但し、バンドiにおいて
1ビット削減を行う毎にN[i] から6.0を減算し、ビ
ット削減が標準ノイズレベルN[i] と相似形になるよう
にする(ステップS16)。そして、このように各バン
ド毎に最終的に決定された量子化ビット数で、量子化・
符号化部24で再量子化及び符号化する(ステップS1
7)。
【0032】また、ステップS3において補正値Adv が
負でない場合(符号量増加)には、余剰ビットを各バン
ドに割り当て又はパディングし(ステップS18)、そ
の量子化ビット数で、量子化・符号化部24で再量子化
及び符号化する(ステップS17)。フォーマット出力
部26は一般に、正規化係数(場合によっては量子化ビ
ット数)と、符号量制御部26の符号量制御情報と、そ
れにヘッダ等の補助情報を付加してフォーマット化(ビ
ットストリーム化)して伝送する。
【0033】したがって、上記実施例によれば、算術エ
ントロピーが大きく、聴感エントロピーが小さい区間ほ
ど、より多くの符号量補正(削減)を受けることにな
り、聴感に対応した符号量配分を行うことができる。ま
た、図8は上記実施例と、図12に示すエンコーダにお
いて符号量過剰時の再量子化ノイズレベルの設定例を比
較した場合を示し、上記実施例によれば、非可逆符号化
されるフレームにおいても再量子化ノイズ聴覚心理モデ
ルに応じてシェーピングされており、ノイズ量が同じで
あっても聴感上ではノイズレベルが下がった場合と同等
の効果を得ることができる。したがって、聴感上の音質
劣化を最小限にして準可逆的に符号化することができ
る。
【0034】図9は従来例(図12)の非可逆符号化を
行った場合と、上記実施例の場合の音質の比較例を示
し、図9(a)はフレームの一部が非可逆となる場合、
図9(b)はフレームの大部分が非可逆となる場合を示
す。図のように非可逆となる区間において太線で示す本
発明の方が細線で示す従来例より音質を改善することが
でき、したがって、符号化全体として安定した音質を得
ることができる。
【0035】
【発明の効果】以上説明したように本発明によれば、符
号化対象の全区間の可逆方式による目標符号量と実符号
量の差を算出して各区間毎の符号量の過不足量に応じた
補正値を算出し、全区間の平均符号量が目標符号量にな
るように符号量補正値に基づいて各区間の信号を可逆方
式で量子化するか又は聴覚心理モデル基づいて非可逆方
式で量子化するので、数学エントロピーが大きく、聴感
エントロピーが小さい区間ほど符号量がより多く削減さ
れ、したがって、聴感に対応した符号量配分を行うこと
ができる。また、非可逆方式で量子化される区間は、聴
覚心理モデルに応じてビット配分されるので、聴感上の
劣化を最小限に抑えることができる。
【図面の簡単な説明】
【図1】本発明に係る音声の準可逆符号化装置の一実施
例を示すブロック図である。
【図2】図1における符号量補正値を算出する処理を説
明するためのフローチャートである。
【図3】符号量偏差と符号量補正値の関係を示すグラフ
である。
【図4】符号量補正前と補正後の符号量偏差ヒストグラ
ムを示す説明図である。
【図5】符号量補正前と補正後の符号量偏差ヒストグラ
ムを示す説明図である。
【図6】符号量補正前と補正後の符号量偏差ヒストグラ
ムを示す説明図である。
【図7】図1における聴覚心理分析と符号量調整処理を
説明するためのフローチャートである。
【図8】図1の準可逆符号化装置と従来例における符号
量不足時の再量子化ノイズレベルの比較例を示す説明図
である。
【図9】図1の準可逆符号化装置と従来例における聴感
上の音質比較例を示す説明図である。
【図10】可逆符号化した場合の各フレームビット数、
平均ビット数及び原音ビット数の関係例を示す説明図で
ある。
【図11】従来の時間領域処理の可逆符号化方式エンコ
ーダを示すブロック図である。
【図12】従来の周波数領域処理の可逆符号化方式エン
コーダを示すブロック図である。
【図13】図12に示すエンコーダにおける周波数領域
処理を示す説明図である。
【符号の説明】
22 窓掛け・直交変換部(フレーム化手段) 23 正規化部 24 量子化・符号化部(量子化手段) 25 聴覚心理分析部(聴覚心理分析手段) 26 符号量制御部(符号量補正値算出手段) 27 フォーマット化出力部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ信号を所定の区間長ごとにフ
    レーム化するフレーム化手段と、 符号化対象の全区間の可逆方式による目標符号量と実符
    号量の差を算出し、各区間毎の符号量の過不足量に応じ
    た補正値を算出する符号量補正値算出手段と、 フレーム内の信号を聴覚心理モデルで分析する聴覚心理
    分析手段と、 全区間の平均符号量が目標符号量になるように前記符号
    量補正値に基づいて各区間の信号を可逆方式で量子化す
    るか又は前記聴覚心理分析手段の出力に基づいて非可逆
    方式で量子化する量子化手段とを有する音声の準可逆符
    号化装置。
  2. 【請求項2】 前記量子化手段は、オーディオ信号が直
    交変換された係数を量子化することを特徴とする請求項
    1記載の音声の準可逆符号化装置。
  3. 【請求項3】 前記量子化手段は、フレーム内のオーデ
    ィオ信号が直交変換された係数が複数のバンドに分割さ
    れ、バンド毎に正規化された係数を可逆方式または非可
    逆方式で量子化することを特徴とする請求項1又は2記
    載の音声の準可逆符号化装置。
JP7209156A 1995-07-25 1995-07-25 音声の準可逆符号化装置 Withdrawn JPH0944198A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7209156A JPH0944198A (ja) 1995-07-25 1995-07-25 音声の準可逆符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7209156A JPH0944198A (ja) 1995-07-25 1995-07-25 音声の準可逆符号化装置

Publications (1)

Publication Number Publication Date
JPH0944198A true JPH0944198A (ja) 1997-02-14

Family

ID=16568250

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7209156A Withdrawn JPH0944198A (ja) 1995-07-25 1995-07-25 音声の準可逆符号化装置

Country Status (1)

Country Link
JP (1) JPH0944198A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004264812A (ja) * 2002-09-04 2004-09-24 Microsoft Corp 統合化不可逆的可逆的音声圧縮
JP2004264813A (ja) * 2002-09-04 2004-09-24 Microsoft Corp 混合の可逆的音声圧縮
JP2007525716A (ja) * 2004-03-01 2007-09-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 量子化器のステップサイズを求める装置および方法
JP2008089651A (ja) * 2006-09-29 2008-04-17 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004264812A (ja) * 2002-09-04 2004-09-24 Microsoft Corp 統合化不可逆的可逆的音声圧縮
JP2004264813A (ja) * 2002-09-04 2004-09-24 Microsoft Corp 混合の可逆的音声圧縮
JP2011154400A (ja) * 2002-09-04 2011-08-11 Microsoft Corp 混合の可逆的音声圧縮
JP2011164638A (ja) * 2002-09-04 2011-08-25 Microsoft Corp 統合化不可逆的可逆的音声圧縮
JP2013257587A (ja) * 2002-09-04 2013-12-26 Microsoft Corp 混合の可逆的音声圧縮
US8630861B2 (en) 2002-09-04 2014-01-14 Microsoft Corporation Mixed lossless audio compression
JP2007525716A (ja) * 2004-03-01 2007-09-06 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 量子化器のステップサイズを求める装置および方法
US8756056B2 (en) 2004-03-01 2014-06-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for determining a quantizer step size
JP2008089651A (ja) * 2006-09-29 2008-04-17 Casio Comput Co Ltd 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム

Similar Documents

Publication Publication Date Title
US11315579B2 (en) Metadata driven dynamic range control
EP1440432B1 (en) Audio encoding and decoding device
US7472069B2 (en) Apparatus for processing framed audio data for fade-in/fade-out effects
US20050157884A1 (en) Audio encoding apparatus and frame region allocation circuit for audio encoding apparatus
EP1072036B1 (en) Fast frame optimisation in an audio encoder
US20050270195A1 (en) Method and apparatus for encoding/decoding digital signal
US6732071B2 (en) Method, apparatus, and system for efficient rate control in audio encoding
US20060136198A1 (en) Method and apparatus for low bit rate encoding and decoding
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
US8086465B2 (en) Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
US20010050959A1 (en) Encoder and communication device
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information
US7409350B2 (en) Audio processing method for generating audio stream
JPH0944198A (ja) 音声の準可逆符号化装置
JP3454394B2 (ja) 音声の準可逆符号化装置
US20040230425A1 (en) Rate control for coding audio frames
JP4409733B2 (ja) 符号化装置、符号化方法、及びその記録媒体
JP2003177797A (ja) ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置
JP3301886B2 (ja) 可変レート音声符号化方法及び装置
JP2002311997A (ja) オーディオ信号符号化装置
JP3389849B2 (ja) 量子化装置
JP2003271199A (ja) オーディオ信号の符号化方法及び符号化装置
KR20020008871A (ko) 디지털 오디오 부호화 방법
JP2003029797A (ja) 符号化装置、復号化装置および放送システム
JPH10228298A (ja) 音声信号符号化方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20021001