JPH0535295A - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JPH0535295A
JPH0535295A JP3195171A JP19517191A JPH0535295A JP H0535295 A JPH0535295 A JP H0535295A JP 3195171 A JP3195171 A JP 3195171A JP 19517191 A JP19517191 A JP 19517191A JP H0535295 A JPH0535295 A JP H0535295A
Authority
JP
Japan
Prior art keywords
frame
band
average amplitude
information
allocated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3195171A
Other languages
English (en)
Inventor
Masayuki Misaki
正之 三崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3195171A priority Critical patent/JPH0535295A/ja
Publication of JPH0535295A publication Critical patent/JPH0535295A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 本発明は高能率音声符号化に関するもので、
時間軸方向に対する情報割当を考慮した高能率は音声符
号化方法を目的とする。 【構成】 音声信号を複数のn帯域に分割した後に、所
定の時間長を1フレームとしてmフレームの平均振幅を
求め、n・m個のフレームの平均振幅をベクトルとして
量子化を行い、ビット割当値をコードブックから参照
し、時間軸方向にも情報を配分したビット割当を行うこ
とが可能となり、より能率のよい符号化が行える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声信号を高能率に録音
再生する音声符号化方法に関する。
【0002】
【従来の技術】従来より音声信号に含まれる冗長性を除
き、能率良く符号化して伝送または記録するための音声
符号化方法が提案されている。以下、図面を参照しなが
ら、従来の音声符号化方法について説明を行う。図5は
従来の音声符号化方法のフローチャートを示すものであ
る。この例では、帯域分割数をn帯域として説明する。
処理のアルゴリズムの基本は適応ビット割当を行うサブ
バンドADPCM方式である。
【0003】まず、入力された音声信号は、帯域分割の
ための折返し成分がキャンセルされるフィルタであるQ
MF(Quadrature Mirror Filt
er)などでn個の等しい帯域に分離される(ステップ
31)。そして、n個の帯域ごとに所定の時間区間にお
けるパワーの平均値を求める(ステップ32)。以下、
所定の時間区間の単位をフレームと記すことにする。n
個の平均パワーの比に比例させて、各帯域へ割り当てる
ビット数を計算する(ステップ33)。そして、各帯域
ごとに適応差分PCM(以降ADPCMと記す)符号化
を行う(ステップ34)。ここで、前述した割当ビット
数に従ってADPCMの符号化出力は出力される。すな
わち、量子化ビット数を割当ビット数に応じてフレーム
単位で変更させて符号化する。最後に、帯域毎のビット
割当の情報とADPCM符号化出力を多重化して出力す
る(ステップ35)。処理を続ける場合は再度同じ処理
をくりかえし、(ステップ36)、処理を続けないとき
は終了する。
【0004】図6は、この従来例の適応ビット割当法の
模式図(n=4)を示したものである。図6では、4帯
域のフレームF4 ,F3 ,F2 ,F1 に対して適応的に
ビット割当を行うものであり、F4 ,F3 ,F2 ,F1
に与えられたビット数の総和は常に一定値をとる。これ
を式で表すと次の(数1)のようになる。
【0005】
【数1】
【0006】ここでBk は帯域kのフレームFk に割り
当てられたビット数であり、Cf はフレーム1区間あた
りのビット数でここでは一定値をとるものとする。
【0007】従来例では、各帯域のフレームの平均パワ
ーに比例してビット割当を行うことで、能率のよい情報
割当を行おうとしている。
【0008】
【発明が解決しようとする課題】しかしながら、上記従
来の音声符号化方法では、周波数方向には適切な情報割
当を行うことはできるが、時間軸方向にはいつも同一の
情報割当を行っている。すなわち、n帯域のフレームに
割り当てられるビット数の総和は一定値である。したが
って、時間的に不均一に情報をもっている音声信号に対
しては有効なビット配分が行われていないという問題点
を有していた。
【0009】本発明は上記従来の問題点を解決するもの
で、時間軸方向のビット配分をも考慮したビット割当を
行うことができ、これによりより優れた再生音を得るこ
とができる音声符号化方法を提供することを目的とす
る。
【0010】
【課題を解決するための手段】この目的を達成するため
に本発明の音声符号化方法は、音声信号をn個の帯域に
分割し、その分割された帯域ごとに所定の時間長を1フ
レームとして、この帯域ごとの平均振幅を求め、その平
均振幅をm個のフレーム分保持する。この保持している
平均振幅の値によってあらかじめ学習したコードブック
を参照して各フレームに割り当てる情報を決定し、その
情報量をもとに所定の符号化アルゴリズムで符号化する
ものである。すなわち、時間軸方向にも情報の割当を考
慮するために、時間軸と周波数軸とのマトリックス状の
フレームにおける平均振幅の値に応じて、適応的にビッ
ト割当を行う方法を提案するものである。
【0011】また、時間軸方向のマスキング効果を有効
に用いるために、符号化すべきフレームより以前のデー
タも保持しておく方法も提案している。
【0012】
【作用】上記手順の音声符号化方法は、音声信号を複数
の帯域に分割するとともに、さらに時間軸方向に情報量
を配分するものである。すなわち、時間軸方向にも有効
な情報量を配分することができる。また、継時マスキン
グを効果的に利用してさらに優れた再生音を得ることが
できる。
【0013】
【実施例】以下、本発明の第1の実施例について図面を
参照しながら説明をする。図1は本発明の第1の実施例
における処理の手順を示すフローチャートである。図2
は、本実施例の適応ビット割当法の模式図を示したもの
である。
【0014】ここでは、帯域分割を4帯域とし、平均振
幅を求めるフレーム長は16msec、時間軸方向には1
0フレームを単位として割当を行うものとする。すなわ
ち、4×10のマトリックス状のフレームに対して適応
ビット割当を行うものとする。まず、音声信号をフィル
タで4つの帯域に分離する(ステップ1)。以下は帯域
分割された後の信号に対して処理が行われる。つぎに、
各帯域毎に16msecを1フレームとして平均振幅を計
算する(ステップ2)。ここでいう、平均振幅とは時間
軸波形の絶対値の算術平均値を示すものである。求めた
平均振幅値をメモリに記憶する(ステップ3)。ここ
で、平均振幅を10フレーム分新たに更新したかどうか
判断し(ステップ4)、もし、更新されていない場合に
はステップ1に戻って同様の処理を繰り返す。
【0015】10フレーム分の平均振幅がメモリに蓄積
された時点で適応ビット割当の作業を開始する。まず、
4×10個の平均振幅値を要素とするベクトルを正規化
する(ステップ5)。そして、正規化した平均振幅ベク
トルに最も近いコードをコードブックの中から選択する
ことによって、ベクトル量子化を行う(ステップ6)。
次に選択したコードより、各帯域の各時間のフレームに
対して割り当てられるビット数を与えられる(ステップ
7)。そして、各帯域ごとにADPCM符号化を行う
(ステップ8)。ここで、前述した割当ビット数に従っ
てADPCMの符号化出力は出力される。すなわち、量
子化ビット数を割当ビット数に応じてフレーム単位で変
更させて符号化する。最後に、ビット割当を示すコード
の情報とADPCM符号化出力を多重化して出力する
(ステップ9)。以上の処理を繰り返して行う(ステッ
プ10)。図2では、4帯域の10単位時間、すなわ
ち、F1_1、F1_2、F1_3、F1_4、F2_1、F2_2、…、
F10_4の40フレームに対して適応的にビット割当を行
うものであり、これら40フレームに与えられたビット
数の総和は常に一定値をとる。これを式で表すと次の
(数2)のようになる。
【0016】
【数2】
【0017】ここでBk_j は帯域k のフレームFk_jに
割り当てられたビット数であり、Cbはブロック1区間
あたりのビット数でここでは一定値をとるものとする。
【0018】以上のように本実施例では、各帯域の各時
間におけるフレームでの平均振幅に比例してビット割当
を行うことをブロック単位で管理することで、さらに能
率のよい情報割当を行うものである。なお、本実施例で
は4×10のベクトルでビット割当を行っているがこの
次数に限るものではない。また、符号化にはADPCM
符号化方式を用いているが他の方式でもよい。
【0019】以下、本発明の第2の実施例について図面
を参照しながら説明をする。図3は本発明の第2の実施
例における処理の流れを示すフローチャートである。図
4は、本実施例の適応ビット割当法の模式図を示したも
のである。図4について先に説明をしておくと、これか
ら符号化を行う部分はフレーム1からフレーム10の1
0フレームの部分であり、これをメインブロックと記
す。このメインブロックの前のフレームを補助ブロック
B、後のフレームを補助ブロックAとする。これら補助
ブロックのデータを利用して、メインブロックの両端の
フレームにおける継時マスキング効果を利用している。
【0020】図3のフローチャートについて説明を行
う。ここでは、帯域分割を4帯域とし、平均振幅を求め
るフレーム長は16msec、時間軸方向には10フレー
ムを単位として割当を行うものとする。すなわち、4×
10のマトリックス状のフレームに対して適応ビット割
当を行うものとする。まず、音声信号をフィルタで4つ
の帯域に分離する(ステップ11)。以下は帯域分割さ
れた後の信号に対して処理が行われる。次に、各帯域毎
に16msecを1フレームとして平均振幅を計算する(ス
テップ12)。ここでいう、平均振幅とは時間軸波形の
絶対値の算術平均値を示すものである。求めた平均振幅
値をメモリに記憶する(ステップ13)。ここで、メイ
ンブロックと補助ブロックAの各帯域・各フレームの平
均振幅を新たに更新したかどうか判断し(ステップ1
4)、もし、更新されていない場合にはステップ12に
戻って同様の処理を繰り返す。
【0021】すべてのフレームの平均振幅がメモリに蓄
積された時点で適応ビット割当の作業を開始する。ま
ず、メインブロックと補助ブロックA、Bのすべてのフ
レームに関する4×12個の平均振幅値を要素とするベ
クトルを正規化する(ステップ15)。そして、正規化
した平均振幅ベクトルに最も近いコードをコードブック
の中から選択する(ステップ16)。このコードブック
の作成には、周波数方向のマスキング効果の他にも、補
助ブロックAおよびBの平均振幅を用いて時間軸方向の
聴覚マスキング効果をメインブロックの範囲全てに利用
している。次に選択したコードより、各帯域の各時間の
フレームに対して割り当てられるビット数を得る(ステ
ップ17)。そして、各帯域ごとにADPCM符号化を
行う(ステップ18)。
【0022】ここで、前述した割当ビット数に従ってA
DPCMの符号化出力は出力される。すなわち、量子化
ビット数を割当ビット数に応じてフレーム単位で変更さ
せて符号化する。最後に、ビット割当を示すコードの情
報とADPCM符号化出力を多重化して出力する(ステ
ップ19)。そして、フレーム10の平均振幅の値は次
の補助ブロックBに用いるためデータを転送しておく
(ステップ20)。同様に、フレームAの値も次にフレ
ーム1で用いるために転送する(ステップ21)。以上
の処理を繰り返して行う(ステップ22)。
【0023】以上のように本実施例では、各帯域の各時
間におけるフレームでの平均振幅に比例してビット割当
を行うことをブロック単位で管理するとともに、補助ブ
ロックをメインブロックの前後に設けて、時間軸方向の
マスキング効果をメインブロック全体に利用すること
で、さらに一層能率のよい情報割当を行うものである。
【0024】以上のように本実施例によれば、各帯域の
各時間におけるフレームでの平均振幅に比例してビット
割当を行うことで、より有効な情報割当を行うことがで
きる。なお、本実施例では4×12のベクトルでビット
割当を行っているがこの次数に限るものではない。ま
た、符号化にはADPCMを用いているが他の方式でも
よい。また、本実施例ではブロック単位の情報量を一定
にしているが、これはブロック単位で可変値にしてもよ
い。
【0025】
【発明の効果】本発明は各帯域毎に複数フレーム分の平
均振幅を求めた後に学習したコードブックを参照して各
帯域・各フレームに割り当てる情報量を決定しているた
めに、時間軸方向に対して情報量が一様でない音声に対
して、能率のよい情報割当が可能となり、さらに、n・
m個のフレームの符号化を行うときに、そのブロックの
前後のフレームの平均振幅をも利用することで、時間軸
方向のマスキング効果をそのブロック全体に対して適用
することができる。すなわち、周波数方向にn、時間軸
方向にmのブロック単位で情報割当を行うことで、時間
軸方向にもより最適なビット割当が可能となるため、よ
り能率のよい音声符号化方法を実現できるものである。
【図面の簡単な説明】
【図1】本発明の第1の実施例の音声符号化方法のフロ
ーチャート
【図2】同実施例の適応ビット割当法の模式図
【図3】本発明第2の実施例の音声符号化方法のフロー
チャート
【図4】同実施例の適応ビット割当法の模式図
【図5】従来例の音声符号化方法のフローチャート
【図6】従来例の適応ビット割当法の模式図

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】音声信号を複数のn個の帯域(2≦n)に
    分割した後に、各帯域ごとに所定の時間長を1フレーム
    として平均振幅を求め、前記各帯域ごとの前記平均振幅
    をm個の(2≦m)のフレーム分保持し、保持している
    平均振幅の値によってあらかじめ学習したコードブック
    を参照して前記各帯域の各フレームに割り当てる情報量
    を決定し、前記各フレームに割り当てられた情報量をも
    とに所定の符号化アルゴリズムで符号化を行い、n・m
    個のフレーム単位で符号化処理を行なう音声符号化方
    法。
  2. 【請求項2】音声信号を複数のn個の帯域(2≦n)に
    分割した後に、各帯域ごとに所定の時間長を1フレーム
    として平均振幅を求め、前記各帯域ごとの前記平均振幅
    をM個の(2≦m≦M)のフレーム分保持し、mフレー
    ム時間分の平均ビットレートを与えられると保持してい
    る平均振幅の値と聴覚マスキング効果を考慮して各帯域
    の各フレームに割り当てる情報量を決定し、前記各フレ
    ームに割り当てられた情報量をもとに所定の符号化アル
    ゴリズムで符号化を行い、n・m個のフレーム単位で符
    号化処理を行なう音声符号化方法。
JP3195171A 1991-08-05 1991-08-05 音声符号化方法 Pending JPH0535295A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3195171A JPH0535295A (ja) 1991-08-05 1991-08-05 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3195171A JPH0535295A (ja) 1991-08-05 1991-08-05 音声符号化方法

Publications (1)

Publication Number Publication Date
JPH0535295A true JPH0535295A (ja) 1993-02-12

Family

ID=16336625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3195171A Pending JPH0535295A (ja) 1991-08-05 1991-08-05 音声符号化方法

Country Status (1)

Country Link
JP (1) JPH0535295A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503372B2 (en) 1996-11-07 2013-08-06 Interdigital Technology Corporation Method and apparatus for compressing and transmitting ultra high speed data
JP2016085334A (ja) * 2014-10-24 2016-05-19 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8503372B2 (en) 1996-11-07 2013-08-06 Interdigital Technology Corporation Method and apparatus for compressing and transmitting ultra high speed data
JP2016085334A (ja) * 2014-10-24 2016-05-19 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム

Similar Documents

Publication Publication Date Title
JP3131542B2 (ja) 符号化復号化装置
JP2915238B2 (ja) 信号符号化方法および信号符号化装置
JP3134455B2 (ja) 高能率符号化装置及び方法
US5983172A (en) Method for coding/decoding, coding/decoding device, and videoconferencing apparatus using such device
JP3515903B2 (ja) オーディオ符号化のための動的ビット割り当て方法及び装置
JPH0748697B2 (ja) 信号のディジタル・ブロック・コ−ド化方法
JP3283200B2 (ja) 符号化音声データの符号化レート変換方法および装置
JPH0683395A (ja) 合成による分析技術を利用する低遅延オーディオ信号コーダ
JPH0690208A (ja) 可変レート伝送に適した符号化復号方式及び装置
JP3379610B2 (ja) ビット割当にチャネルのマスキング特性を用いる符号化及び復号化装置及び方法
WO1996035269A1 (en) Non-linearly quantizing an information signal
AU717993B2 (en) Adaptive transform coding system, adaptive transform decoding system and adaptive transform coding/decoding system
JPH0846516A (ja) 情報符号化方法及び装置、情報復号化方法及び装置、並びに記録媒体
JP2705377B2 (ja) 帯域分割符号化方法
JPH08328592A (ja) 音声信号処理回路
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
JPH0535295A (ja) 音声符号化方法
JPH08307281A (ja) 非線形量子化方法及び非線形逆量子化方法
EP0208712B1 (en) Adaptive method and apparatus for coding speech
JP2003195894A (ja) 符号化装置、復号化装置、符号化方法、及び復号化方法
WO1999041844A1 (en) A neural network based method for exponent coding in a transform coder for high quality audio
JP3010637B2 (ja) 量子化装置及び量子化方法
JP3301886B2 (ja) 可変レート音声符号化方法及び装置
JPH0335300A (ja) 音声符号・復号化伝送方式
JP3527758B2 (ja) 情報記録装置