JP3301886B2 - 可変レート音声符号化方法及び装置 - Google Patents

可変レート音声符号化方法及び装置

Info

Publication number
JP3301886B2
JP3301886B2 JP11336195A JP11336195A JP3301886B2 JP 3301886 B2 JP3301886 B2 JP 3301886B2 JP 11336195 A JP11336195 A JP 11336195A JP 11336195 A JP11336195 A JP 11336195A JP 3301886 B2 JP3301886 B2 JP 3301886B2
Authority
JP
Japan
Prior art keywords
signal
amount
coding
digital audio
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP11336195A
Other languages
English (en)
Other versions
JPH08307277A (ja
Inventor
信一 小畑
雅文 中村
敏文 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP11336195A priority Critical patent/JP3301886B2/ja
Publication of JPH08307277A publication Critical patent/JPH08307277A/ja
Application granted granted Critical
Publication of JP3301886B2 publication Critical patent/JP3301886B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】高密度記録のディスクに音声を記
録する音声符号化装置に係り、特に決まった伝送レート
や記録媒体上の記録密度の範囲内において、最良の音質
を再現できる符号化データを生成する音声圧縮符号化の
方法及び装置に関する。
【0002】
【従来の技術】音質を一定にして高能率の符号化を行う
方法の一例としては、特開平4−192724に記載さ
れているものがある。
【0003】
【発明が解決しようとする課題】上記の従来方法は、そ
の処理方法の特殊性ゆえにスピーチ音声には有効だが、
一般の音響信号、特にCD並を目標にしたディジタルオ
ーディオシステムではその効果をあまり発揮しない。ま
た、現在ある音声圧縮を利用したディジタルオーディオ
システムは伝送レートを固定にしているので、アタック
音部分では使用可能ビット数の不足により劣化が著しく
なる。更に、音声情報量が少ない部分では、必要以上の
データ容量が確保されてしまっている。従って、データ
容量の有効活用がされておらず、音質の改善される余地
が残っている。
【0004】
【課題を解決するための手段】本発明では、入力された
音声信号の聴覚心理上の情報量を算出し、その情報量の
大小により局所符号化レートを決定する。そしてその局
所符号化レートは、予め決めたフレーム単位で平均を取
った場合に一定となるように制御する。
【0005】
【作用】入力されたディジタル音声信号の聴覚心理上の
情報量である音響情報量を音響情報量算出手段が見積も
る。この音響情報量が符号化単位ごとに増減するのに合
わせて符号化レート配分手段が各符号化単位に対する符
号化レートを増減させる。その結果として、音響情報量
が多い符号化単位には高い符号化レートが割り当てら
れ、音響情報量が少ない符号化単位には低い符号化レー
トが割り当てられる。
【0006】
【実施例】図1は本発明の一実施例であり、7つの処理
ステップによって構成されている符号化処理フローチャ
ートである。順に処理を説明する。
【0007】処理ステップ1で符号化処理の基本単位で
あるフレーム毎にディジタル音声信号の入力処理が行わ
れる。次に処理ステップ2で、そのディジタル音声信号
に対して、一回目の符号化処理を行うことにより、上記
フレーム内のディジタル音声信号に含まれる聴覚心理上
の情報量である音響情報量を算出する。
【0008】ここで0から31番までの32個の周波数
帯域に分割して音響情報量を算出する例を図2に示す。
図2(a)は、信号パワーレベルS(i)と、帯域内マ
スクや帯域間散布等で聞こえなくなる音の閾値レベルで
あるマスクレベルM(i)のレベルを各帯域ごとに示し
たもので、S(i)とM(i)との差SMR(i)の大
きさが網かけの領域で示してある。図2(b)がSMR
(i)を各帯域毎に抜き出したもので、これを帯域sb
maxまで(sbmaxは31でなくとも良い)に渡っ
て加算したものを音響情報量として採用している。
【0009】処理ステップ3では上記一回目の符号化処
理による符号化データと上記音響情報量を示すインデッ
クス番号を保存する。処理ステップ4では、N(Nは2
以上の自然数)フレーム分のデータが溜ったかどうかを
判断し、溜っていない場合はステップ1に進み、次のフ
レームの入力処理を行う。溜った場合はステップ5に進
む。処理ステップ5では保存されていたNフレーム分の
データを呼び戻す。ステップ6では呼び戻された上記音
響情報量を示すインデックス番号によりNフレーム内で
の音響情報量の増減の変化を判断する。そして、個々の
フレームの音響情報量に合わせて符号化レートも変化
し、且つNフレーム間の平均符号化レートが予め決まっ
た指定レートになるように、個々のフレームに対する符
号化レートを決定する。処理ステップ7で上記決定され
た符号化レートに従い、本エンコード処理である2回目
の符号化処理を行い、データストリームを構成する。
【0010】図3に時間軸に相当するフレーム番号と個
々のフレームに対する符号化レートが音響情報量の増減
に伴って調整されている例を具体的に示す。図3(a)
は図2のような手順に従って求められた、個々のフレー
ムに対する音響情報量の変化の様子を示している。これ
に対して符号化レートも、図3(b)のように同様の上
がり下がりの特性を持たせている。これにより、音質は
一定となるが、通常、記録媒体の都合等の制約により、
一定の記録レートが要求される。そこで、この例では1
0フレームを1音声グループとして(N=10)、1音
声グループ内での平均符号化レートが指定レート値にな
るように個々のフレームに対する符号化レートが調整さ
れている。
【0011】このようにNフレームを単位として、各フ
レームごとの音響情報量の変化に合わせて符号化レート
を決めることで、音質の劣化を平均化し、且つ使用可能
なデータ容量の範囲内で最良の音質を保つことができる
符号化データの生成が可能となる。
【0012】図4は別の算出法により音響情報量を求め
た例であり、各帯域の信号パワーS(i)を帯域sbm
ax(sbmaxは31でなくとも良い)までに渡って
加算したものを音響情報量として採用している。この例
では最小可聴限や帯域間マスクを考慮せずに、単純に帯
域毎の音圧レベルの大きさで見積もることになるので高
域の信号や小さめの信号も間引かれずに音響情報量に反
映する。
【0013】図5は図2のようにして得られた帯域別の
SMR(i)に対して帯域ごとに異なる重み付けを施し
た例である。ここでは、K(i)がK(i+1)以上に
なるような実数K(i)を用いて、このK(i)とSM
R(i)との積を帯域毎に求め、それを帯域sbmax
(sbmaxは31でなくとも良い)までに渡って加算
したものを音響情報量として採用している。
【0014】0から31までの帯域が最高周波数までを
等分割したものであるなら、低域ほど1つの帯域が大き
いバーク幅を持ち、聴覚心理上大きな影響を与える。そ
のような場合に対してこの図5のような例の重み付けを
行えば、より的確な音響情報量の見積りができる。
【0015】図6は、図5と同様の重み付けを図4の例
に対して適用したものであり、K(i)とS(i)との
積を帯域毎に求め、それを帯域sbmax(sbmax
は31でなくとも良い)までに渡って加算したものを音
響情報量として採用している。これによってバ−ク軸上
への変換を行わずに、簡易的に聴覚心理上の軸での見積
りを行うことができる。
【0016】図7は本発明による符号化装置の一実施例
を示したものである。ディジタル音声信号8を入力し、
符号化ビットストリーム9と音響情報量を示すインデッ
クス10を出力する音声符号化器11、記録ヘッド1
2、光ディスク、磁気ディスク等の記録媒体13、音響
情報量インデックス10と指定レート信号14を入力
し、修正符号化レートインデックス15を出力する符号
化レート再配分器16、更に音声符号化器11の中身と
してディジタル音声信号8を再量子化する再量子化器1
7とディジタル音声信号8の聴覚心理上の情報量を算出
し、使用するべきデータ容量を見積もる音響情報量算出
器19と、再量子化された信号21を入力し符号化ビッ
トストリーム9を出力するフレーム構成器22とで構成
されている。順に動作を説明する。
【0017】まず第1回目の符号化処理によって音響情
報量が見積もられる。符号化の基本単位であるフレーム
毎にディジタル音声信号8が音声符号化器11に入力さ
れる。音響情報量算出器19は上記1フレームのディジ
タル音声信号8か或いはディジタル音声信号8を時間周
波数変換したスペクトルかであるフレーム音響特性信号
18を入力し、聴覚心理上の情報量である音響情報量を
算出し、上記音響情報量に従って量子化に際してのビッ
ト割り当てを、量子化雑音レベルが検知不能レベル以下
となる様に決定する。そしてビット割り当て信号20と
音響情報量インデックス10を出力する。
【0018】そして次に同じ音声データの2回目の符号
化処理(本エンコード)が行われる。符号化の基本単位
であるフレーム毎にディジタル音声信号8が音声符号化
器11に入力される。音響情報量算出器19では上記フ
レーム音響特性信号18の音響情報量を算出し、上記音
響情報量に従って量子化に際してのビット割り当て20
を決定する。ここで、符号化レート再配分器は1回目の
符号化処理で決まった符号化レートのNフレーム間の平
均値と指定レート信号14とが等しくなるようにNフレ
ーム内で符号化レートの配分を修正し、フレーム毎の新
たな符号化レート15を出力する。この新たな符号化レ
ートに従って音響情報量算出器19内でのビット割り当
て処理を行い、割り当て信号20が決定される。そして
再量子化器では上記割り当て信号20に従い、ディジタ
ル音声信号8を再量子化し、再量子化信号21を出力す
る。フレーム構成器22は再量子化された信号21から
符号化ビットストリーム9を構成して出力する。符号化
ビットストリーム9は記録ヘッド12によって記録媒体
13に記録される。
【0019】このようにして、1回目の符号化処理でN
フレーム内の音響情報量の変化の様子を把握し、2回目
の符号化処理で音響情報量に合わせた符号化レートで符
号化処理が行われる。この結果、音質の劣化の度合いが
平均化されると同時に、制限データ容量内においての最
良の音質が得られるビットストリーム9が生成できる。
また、記録媒体13はディスクに限る必要はなく、テ
ープ、その他でも良い。また更に記録媒体に記録するの
ではなく、伝送路に送出するのでも良い。
【0020】図8は図7での実施例に対し、新たに、入
力信号8を溜めておくNフレーム音声メモリ回路23を
設けている。
【0021】ディジタル音声信号8はメモリ回路23に
入力し、音響情報量の見積もりのための音声信号25と
本エンコード用の音声信号24とが出力される。音響情
報量算出器19は上記音声信号25を入力し、聴覚心理
上の情報量である音響情報量を算出し、音響情報量イン
デックス10を出力する。符号化レート再配分器は音響
情報量インデックス10をNフレーム間溜め込み、符号
化レートのNフレーム間の平均値と指定レート信号14
とが等しくなるように且つ、音響情報量インデックス1
0の増減に合わせて増減する符号化レート15を決定す
る。
【0022】Nフレームのそれぞれの符号化レートが決
定した後に、本エンコード処理として、上記音声信号2
4が再量子化器17に入力し、上記フレーム音響特性信
号18が音響情報量算出器19に送られる。音響情報量
算出器19では上記フレーム音響特性信号18の音響情
報量を算出し、上記音響情報量に従って量子化に際して
のビット割り当て20を決定する。この時、符号化レー
ト15が音声信号24とタイミングが合わされて入力
し、符号化レート15の条件の下に割り当て20が決ま
る。そして再量子化器では上記割り当て信号20に従
い、音声信号24を再量子化し、再量子化信号21を出
力する。フレーム構成器22は再量子化された信号21
から符号化ビットストリーム9を構成して出力する。符
号化ビットストリーム9は記録ヘッド12によって記録
媒体ディスク13に記録される。
【0023】このようにして、Nフレーム内の音響情報
量の変化の様子を把握し、本エンコード処理で音響情報
量に合わせて変動する符号化レートで符号化処理が行わ
れる。この結果、音質の劣化の度合いが平均化されると
同時に、制限データ容量内においての最良の音質が得ら
れるビットストリーム9が生成できる。
【0024】これによって、音響情報量の見積りと本エ
ンコードを一定時間内で交互に行えるため、短時間でよ
り小さい記録処理遅延時間で図4と同様の符号化処理を
行うことができる。
【0025】図9は図7での符号化レート再配分器16
の代わりに、マージン量MARG28と音響情報量26
を入力し、本来必要とされる音響情報量26に対してマ
ージン量MARG28だけ(MARGは実数)余計にデ
ータ容量が確保できるようにフレームに対する符号化レ
ート29を決定する符号化レート決定器27と、現在ま
での符号化レート29の平均値AVE31を出力する平
均値算出器30と、平均値AVE31と予め決めた上限
平均値HIGH32と下限平均値LOW33を入力し、
AVE31がHIGH32以上になったらMARG28
の値を減らし、AVE31がLOW33以下になったら
MARG28の値を増やす様にMARG28の値を制御
するマージン調整回路34を備えた例である。
【0026】符号化の基本単位であるフレーム毎にディ
ジタル音声信号8が音声符号化器11に入力される。音
響情報量算出器19は上記1フレームのディジタル音声
信号8か或いはディジタル音声信号8を時間周波数変換
したスペクトルかであるフレーム音響特性信号18を入
力し、聴覚心理上の情報量である音響情報量26を算出
する。符号化レート決定器27は音響情報量26に対し
て上記マージン量28だけ余裕が取れるように符号化レ
ート29を決める。符号化レート29に従って音響情報
量算出器19は量子化に際してのビット割り当て20を
決定する。そしてビット割り当て信号20と音響情報量
26を出力する。そして再量子化器では上記割り当て信
号20に従い、ディジタル音声信号8を再量子化し、再
量子化信号21を出力する。フレーム構成器22は再量
子化された信号21から符号化ビットストリーム9を構
成して出力する。符号化ビットストリーム9は記録ヘッ
ド12によって記録媒体ディスク13に記録される。
【0027】これと並行して、平均値算出器30は符号
化レート29の現時点までの平均値AVE31を算出す
る。マージン調整器34ではAVE31がHIGH32
以上になったらMARG28の値を減らし、AVE31
がLOW33以下になったらMARG28の値を増や
し、MARG28を符号化レート決定器27に送る。
【0028】このようにして、ほぼリアルタイムで可変
レート符号化処理ができる。また上記音声グループの切
れ目と音響情報量の変化とのタイミングが悪いと、情報
量が上限以上の音声グループと下限以下の音声グループ
が隣接してできてしまう場合があるが、この例では平均
値を通算で算出しているため、そのような不都合を回避
することができる。また、MARG28は正の数である
必要はなく負の数でも良い。MARG28が負の場合は
MARG28の絶対値が劣化の度合いを示すが、MAR
G28が大きいほど、より高い符号化レートが選ばれる
点は変わらない。
【0029】図10は本発明の他の一例であり、ステッ
プ35、ステップ36、ステップ37の3ステップで構
成され、ステップ35は更にステップ38、ステップ3
9、ステップ40の3ステップで構成され、ステップ3
7は更にステップ41、ステップ42の2ステップで構
成されている符号化処理フローチャートである。順に処
理を説明する。
【0030】まず処理ステップ35で1回目の符号化処
理が行われる。処理ステップ38で符号化処理の基本単
位であるフレーム毎にディジタル音声信号の1回目の入
力処理が行われる。次に処理ステップ39で、そのディ
ジタル音声信号に対して、1回目の符号化処理を行うこ
とにより、上記フレーム内のディジタル音声信号に含ま
れる聴覚心理上の情報量である音響情報量を算出する。
【0031】処理ステップ40では上記1回目の符号化
処理による上記音響情報量を示すインデックスを保存す
る。このステップ38、ステップ39、処理ステップ4
0がフレーム毎に繰り返される。
【0032】音声信号の1回目の符号化処理が終わった
あと、処理ステップ36で保存されていた音響情報量イ
ンデックスにより、フレーム毎の音響情報量の増減に合
わせて各フレームに対する符号化レートを決定する。
【0033】続いて処理ステップ37で2回目の符号化
処理が行われる。処理ステップ41でフレーム毎にディ
ジタル音声信号の2回目の入力処理が行われる。処理ス
テップ42で上記決定された各フレームに対する符号化
レートに従い、本エンコード処理である2回目の符号化
処理を行い、データストリームを構成する。このステッ
プ41、ステップ42をフレーム毎に繰り返す。
【0034】このように各フレームごとの音響情報量の
変化に合わせて符号化レートを決めることで、音質の劣
化を平均化し、且つ最良の音質を保つことができる符号
化データの生成が可能となる。
【0035】
【発明の効果】聴覚心理上の情報量に従って符号化レー
トを決定できるため、ビットがあまり必要のない部分で
の余裕がビットを多く必要とする部分に回される形とな
る。これにより、符号化による歪は平均化され且つ最小
限に食い止めることができ、最良の音質を保つことがで
きる。
【図面の簡単な説明】
【図1】本発明を適用したディジタル音声符号化方法の
処理フローの一実施例である。
【図2】本発明での音響情報量として、SMRの見積り
行うを一例である。
【図3】本発明を適用した時の、個々のフレームに対す
る符号化レートの変化の一例である。
【図4】本発明での音響情報量として、信号パワーの見
積りを行う一例である。
【図5】本発明での音響情報量として、帯域毎にSMR
に重み付けを加えた物の見積り行うを一例である。
【図6】本発明での音響情報量として、帯域毎に信号パ
ワーに重み付けを加えた物の見積り行うを一例である。
【図7】本発明を適用したディジタル音声符号化装置の
一実施例である。
【図8】本発明を適用したディジタル音声符号化装置の
一実施例で、入力データメモリ回路を付加した一例であ
る。
【図9】本発明を適用したディジタル音声符号化装置の
一実施例で、リアルタイム処理を可能とした一例であ
る。
【図10】本発明を適用したディジタル音声符号化方法
の処理フローの他の実施例である。
【符号の説明】
8 ディジタル音声信号 9 符号化ビットストリーム 10 音響情報量インデックス 11 音声符号化器 15 修正符号化レートインデックス 16 符号化レート再配分器 19 音響情報量算出器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 竹内 敏文 神奈川県横浜市戸塚区吉田町292番地 株式会社 日立製作所 映像メディア研 究所内 (56)参考文献 特開 平5−313694(JP,A) 特開 平7−46137(JP,A) 特開 平3−191618(JP,A) 特開 平4−192724(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】 ディジタル音声信号を決まった符号化単
    位ずつ入力し、上記ディジタル音声信号の聴覚心理上の
    情報量を見積もって音響情報量を算出し、上記音響情報
    量に基づいて上記ディジタル音声信号を圧縮する際のデ
    ータ容量の割当てを示す割り当て信号を出力し、上記割
    り当て信号に従って上記ディジタル音声信号から再量子
    化信号を生成し、上記再量子化信号から符号化ビットス
    トリームを構成する音声圧縮符号化方法において、 上記符号化単位ごとの上記音響情報量が増大したときに
    は上記符号化単位に対する符号化レートを高くし、減少
    した場合は上記符号化単位に対する符号化レートを低く
    して、且つ予め決めたP個(Pは2以上の自然数)の符
    号化単位で構成される音声グループ内で、上記符号化レ
    ートの平均値が予め定めた指定符号化レートの値になる
    ように上記符号化レートを制御することを特徴とする音
    声符号化方法。
  2. 【請求項2】 請求項記載の音声符号化方法におい
    て、 音響情報量の算出は、入力ディジタル音声を周波数軸上
    でN個の帯域(Nは3以上の自然数)に分け、帯域i内
    (iは最低域0から最高域N−1まで)の信号パワーS
    (i)と聴覚心理分析をした結果のマスクパワーM
    (i)との差SMR(i)をある決まった帯域j(jは
    0以上N−2以下)からある決まった帯域k(kは1以
    上N−1以下)までに渡って加算したものを上記符号化
    単位ごとの上記音響情報量として得ることを特徴とする
    音声符号化方法。
  3. 【請求項3】 請求項記載の音声符号化方法におい
    て、 音響情報量の算出は、入力ディジタル音声を周波数軸上
    でN個の帯域(Nは3以上の自然数)に分け、帯域i内
    (iは最低域0から最高域N−1まで)の信号パワーS
    (i)と聴覚心理分析をした結果のマスクパワーM
    (i)との差SMR(i)を得て、更にK(i)がK
    (i+1)以上となるような実数K(i)を上記SMR
    (i)に乗じたものであるK(i)×SMR(i)をあ
    る決まった帯域j(jは0以上N−2以下)からある決
    まった帯域k(kは1以上N−1以下)までに渡って加
    算したものを上記符号化単位ごとの上記音響情報量とし
    て得ることを特徴とする音声符号化方法。
  4. 【請求項4】 請求項記載の音声符号化方法におい
    て、 音響情報量の算出は、入力ディジタル音声を周波数軸上
    でN個の帯域(Nは3以上の自然数)に分け、帯域i内
    (iは最低域0から最高域N−1まで)の信号パワーS
    (i)をある決まった帯域j(jは0以上N−2以下)
    からある決まった帯域k(kは1以上N−1以下)まで
    に渡って加算したものを上記符号化単位ごとの上記音響
    情報量として得ることを特徴とする音声符号化方法。
  5. 【請求項5】 請求項記載の音声符号化方法におい
    て、 音響情報量の算出は、入力ディジタル音声を周波数軸上
    でN個の帯域(Nは3以上の自然数)に分け、帯域i内
    (iは最低域0から最高域N−1まで)の信号パワーS
    (i)に、K(i)がK(i+1)以上となるような実
    数K(i)を乗じたものであるK(i)×S(i)をあ
    る決まった帯域j(jは0以上N−2以下)からある決
    まった帯域k(kは1以上N−1以下)までに渡って加
    算したものを上記符号化単位ごとの上記音響情報量とし
    て得ることを特徴とする音声符号化方法。
  6. 【請求項6】 ディジタル音声信号を決まった符号化単
    位ずつ入力し、上記ディジタル音声信号の聴覚心理上の
    情報量を見積もって音響情報量を算出し、上記音響情報
    量に基づいて上記ディジタル音声信号を圧縮する際のデ
    ータ容量の割当てを示す割り当て信号を出力し、上記割
    り当て信号に従って上記ディジタル音声信号から再量子
    化信号を生成し、上記再量子化信号から符号化ビットス
    トリームを構成する音声圧縮符号化方法において、 上記音響情報量に対してある一定のマ−ジン量MARG
    (MARGは実数)だけ余計にデータ容量が確保できる
    ように上記符号化単位に対する上記符号化レートを決定
    し、上記符号化単位に対する上記符号化レートの現時点
    までの平均値AVEを求め、上記平均値AVEが予め定
    めた低レート限界値LOWより低くなった場合には上記
    一定のマ−ジン量MARGを増やし、上記平均値AVE
    が予め定めた高レート限界値HIGHより高くなった場
    合には上記一定のマ−ジン量MARGを減らす様にする
    ことを特徴とする音声符号化方法。
  7. 【請求項7】 ディジタル音声信号を決まった符号化単
    位ずつ入力し、上記ディジタル音声信号の聴覚心理上の
    情報量を見積もり、音響情報量として出力する音響情報
    量算出手段と、上記音響情報量に基づいて上記ディジタ
    ル音声信号を圧縮する際のデータ容量の割当てを示す割
    り当て信号を出力する割り当て手段と、上記割り当て信
    号に従って上記ディジタル音声信号から再量子化信号を
    生成する再量子化手段と、上記再量子化信号から符号化
    ビットストリームを構成するストリーム構成手段とを備
    えた音声圧縮符号化装置において、 上記符号化単位ごとの上記音響情報量が増大したときに
    は上記符号化単位に対する符号化レートを高くし、減少
    した場合は上記符号化単位に対する符号化レートを低く
    する様にして、且つ予め決めたP個(Pは2以上の自然
    数)の符号化単位で構成される音声グループ内で、上記
    符号化レートの平均が予め定めた指定符号化レートにな
    るように上記符号化レートを調整する符号化レート配分
    手段を備えることを特徴とする音声符号化装置。
  8. 【請求項8】 ディジタル音声信号を決まった符号化単
    位ずつ入力し、上記ディジタル音声信号の聴覚心理上の
    情報量を見積もり、音響情報量として出力する音響情報
    量算出手段と、上記音響情報量に基づいて上記ディジタ
    ル音声信号を圧縮する際のデータ容量の割当てを示す割
    り当て信号を出力する割り当て手段と、上記割り当て信
    号に従って上記ディジタル音声信号から再量子化信号を
    生成する再量子化手段と、上記再量子化信号から符号化
    ビットストリームを構成するストリーム構成手段とを備
    えた音声圧縮符号化装置において、 上記符号化単位ごとの上記音響情報量が増大したときに
    は上記符号化単位に対する符号化レートを高くし、減少
    した場合は上記符号化単位に対する符号化レートを低く
    する様にして、且つ予め決めたP個(Pは2以上の自然
    数)の符号化単位で構成される音声グループ内で、上記
    符号化レートの平均が予め定めた指定符号化レートにな
    るように調整された符号化レートを設定する符号化レー
    ト配分手段と、上記符号化ビットストリームを調整され
    た符号化レートに従った符号化ビットストリームに構成
    し直す符号化レート変換手段とを備えることを特徴とす
    る音声符号化装置。
  9. 【請求項9】 ディジタル音声信号を決まった符号化単
    位ずつ入力し、上記ディジタル音声信号の聴覚心理上の
    情報量を見積もり、音響情報量として出力する音響情報
    量算出手段と、上記音響情報量に基づいて上記ディジタ
    ル音声信号を圧縮する際のデータ容量の割当てを示す割
    り当て信号を出力する割り当て手段と、上記割り当て信
    号に従って上記ディジタル音声信号から再量子化信号を
    生成する再量子化手段と、上記再量子化信号から符号化
    ビットストリームを構成するストリーム構成手段とを備
    えた音声圧縮符号化装置において、 予め決めたP個(Pは2以上の自然数)の符号化単位分
    の上記ディジタル音声信号を溜めるデータ保持手段と、
    上記符号化単位ごとの上記音響情報量が増大したときに
    は上記符号化単位に対する符号化レートを高くし、減少
    した場合は上記符号化単位に対する符号化レートを低く
    する様にして、且つ予め決めたP個(Pは2以上の自然
    数)の符号化単位で構成される音声グループ内で、上記
    符号化レートの平均が予め定めた指定符号化レートにな
    るように調整された符号化レートを設定する符号化レー
    ト配分手段とを備え、 上記再量子化手段は上記符号化レート配分手段から出力
    される上記調整された符号化レートとタイミングを合わ
    せて、上記ディジタル音声信号を上記データ保持手段か
    ら取り出す様に動作することを特徴とする音声符号化装
    置。
  10. 【請求項10】 ディジタル音声信号を決まった符号化
    単位ずつ入力し、上記ディジタル音声信号の聴覚心理上
    の情報量を見積もり、音響情報量として出力する音響情
    報量算出手段と、上記音響情報量に基づいて上記ディジ
    タル音声信号を圧縮する際のデータ容量の割当てを示す
    割り当て信号を出力する割り当て手段と、上記割り当て
    信号に従って上記ディジタル音声信号から再量子化信号
    を生成する再量子化手段と、上記再量子化信号から符号
    化ビットストリームを構成するストリーム構成手段とを
    備えた音声圧縮符号化装置において、 上記音響情報量に対してある一定のマ−ジン量MARG
    (MARGは実数)だけ余計にデータ容量が確保できる
    ように上記符号化単位に対する上記符号化レートを決定
    する符号化レート決定手段と、上記符号化単位に対する
    上記符号化レートの現時点までの平均値(AVE)を求
    める符号化レート平均値算出手段と、上記平均値(AV
    E)が予め定めた低レート限界値(LOW)より低くな
    った場合には上記一定のマ−ジン量(MARG)を増や
    し、上記平均値(AVE)が予め定めた高レート限界値
    (HIGH)より高くなった場合には上記一定のマ−ジ
    ン量(MARG)を減らすようにするマージン調整手段
    とを備えることを特徴とする音声符号化装置。
JP11336195A 1995-05-11 1995-05-11 可変レート音声符号化方法及び装置 Expired - Fee Related JP3301886B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11336195A JP3301886B2 (ja) 1995-05-11 1995-05-11 可変レート音声符号化方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11336195A JP3301886B2 (ja) 1995-05-11 1995-05-11 可変レート音声符号化方法及び装置

Publications (2)

Publication Number Publication Date
JPH08307277A JPH08307277A (ja) 1996-11-22
JP3301886B2 true JP3301886B2 (ja) 2002-07-15

Family

ID=14610341

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11336195A Expired - Fee Related JP3301886B2 (ja) 1995-05-11 1995-05-11 可変レート音声符号化方法及び装置

Country Status (1)

Country Link
JP (1) JP3301886B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100335609B1 (ko) * 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
KR100651731B1 (ko) * 2003-12-26 2006-12-01 한국전자통신연구원 가변 프레임 음성 부호화/복호화 장치 및 그 방법
KR100682890B1 (ko) * 2004-09-08 2007-02-15 삼성전자주식회사 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치

Also Published As

Publication number Publication date
JPH08307277A (ja) 1996-11-22

Similar Documents

Publication Publication Date Title
JP2908270B2 (ja) 適応的符号化システム
JP3141450B2 (ja) オーディオ信号処理方法
US5537510A (en) Adaptive digital audio encoding apparatus and a bit allocation method thereof
JP3153933B2 (ja) データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3446216B2 (ja) 音声信号処理方法
JP3336618B2 (ja) 高能率符号化方法及び高能率符号化信号の復号化方法
JP3297240B2 (ja) 適応的符号化システム
US6952677B1 (en) Fast frame optimization in an audio encoder
JP2001236099A (ja) 知覚品質の一貫性を改善する知覚音声符号器ビット割付けスキーム
WO1995013660A1 (fr) Appareil de quantification, procede de quantification, codeur a haute efficacite, procede de codage a haute efficacite, decodeur, supports d'enregistrement et de codage a haute efficacite
JP2003233395A (ja) オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
JP3395001B2 (ja) ディジタルオーディオ信号の適応的符号化方法
US6647063B1 (en) Information encoding method and apparatus, information decoding method and apparatus and recording medium
JP3301886B2 (ja) 可変レート音声符号化方法及び装置
JP3371462B2 (ja) オーディオ信号記録・再生装置
JP3942882B2 (ja) ディジタル信号符号化装置およびそれを備えたディジタル信号記録装置
JP3454394B2 (ja) 音声の準可逆符号化装置
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
JP3004664B2 (ja) 可変レート符号化方法
JP2002351500A (ja) ディジタルデータの符号化方法
JPH06324093A (ja) オーディオ信号のスペクトル表示装置
JPH0944198A (ja) 音声の準可逆符号化装置
JP3481918B2 (ja) オーディオ信号符号化・復号化装置
JP2001148632A (ja) 符号化装置、符号化方法、及びその記録媒体
JP3141451B2 (ja) オーディオ信号処理方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees