JPS6333025A - 音声符号化法 - Google Patents

音声符号化法

Info

Publication number
JPS6333025A
JPS6333025A JP61177089A JP17708986A JPS6333025A JP S6333025 A JPS6333025 A JP S6333025A JP 61177089 A JP61177089 A JP 61177089A JP 17708986 A JP17708986 A JP 17708986A JP S6333025 A JPS6333025 A JP S6333025A
Authority
JP
Japan
Prior art keywords
information
code
waveform
information code
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61177089A
Other languages
English (en)
Other versions
JPH0761044B2 (ja
Inventor
Takehiro Moriya
健弘 守谷
Masaaki Yoda
雅彰 誉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP61177089A priority Critical patent/JPH0761044B2/ja
Publication of JPS6333025A publication Critical patent/JPS6333025A/ja
Publication of JPH0761044B2 publication Critical patent/JPH0761044B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は音声信号をスペクトル包絡の形状を示すスペ
クトル包絡情報と波形を示す波形情報符号とに分離して
符号化する方法に関するものである。
「従来の技術」 従来から音声波形を能率よく符号化するために、音声信
号の近接サンプル値間の統計的相関を利用することが考
えられており、特に線形予測の手法が有効とされている
。この手法は基本的に音声信号を複数サンプル数ごとに
区間に区切りその区間ごとに音声信号のスペクトル包絡
の形状を反映する予測係数を求め、その係数をスペクト
ル包絡情報符号として符号化し、その区間における音声
信号の予測残差をその区間の音声信号の波形を示す波形
情報符号として符号化し、これら両符号を復号器で合成
するものである。
第6図にそのブロック図を示す。入力端子11から音声
信号の一定時間ごとのサンプル値を示すディジタル音声
信号が予測係数抽出部12及び予測残差抽出部13にそ
れぞれ入力され、それぞれ一定サンプル数ごとの分析区
間に区切られ、その各分析区間ごとに予測係数抽出部1
2で音声信号のスペクトル包絡の形状を示す予測係数が
抽出され、その抽出された予測係数が量子化部14で量
子化され、スペクトル包絡情報符号15が出力される。
このスペクトル包絡情報符号は逆量子化部16で復号さ
れ、復号された予測係数で予測残差抽出部13が制御さ
れ、対応分析区内の予測残差が抽出される。予測残差抽
出部13は音声合成フィルタと逆特性のいわゆる逆フィ
ルタである。この予測残差信号は量子化部17で量子化
されて波形情報符号18が得られる。
スペクトル包絡情報符号15及び波形情報符号18はそ
れぞれ復号器側の復号部21及び22で復号され、復号
部22で復号された予測残差信号を合成フィルタの合成
部23に駆動音源信号として供給され、合成部23のフ
ィルタ特性が復号部21で復号された予測係数で制御さ
れ、合成部23から音声信号が合成出力される。
予測係数すなわちスペクトル包絡情報の表現;去、量子
化法、予測残差信号、すなわち波形情報の表現法、量子
化法に関しては従来よりさまざまな工夫がなされ、各種
符号化法が提案されている。例えば適応予測符号化(電
子通信学会編「ディジタル信号処理の応用」コロナ社1
981年刊183p〜)。
マルチパルス符号化(米国特許4472832“Dig
italSpeech Coder”  1984年9
月)、適応変換符号化(日本特許1258025号「音
声の適応変換符号化方式」)等はすべて第7図に示す構
成が基本となっている。
これらの従来方式ではすべてスペクトル包絡情報符号1
5と波形情報符号18とに配分される情報量は、平均的
に最も望ましいように固定されていた。
しかし、現実の音声においては時々刻々波形のもつ統計
的性質が変化することや、量子化歪が変動することで最
適な情報量配分は分析区間ごとに変化している。つまり
ある二つの分析区間A、 Bについてスペクトル包絡情
報符号と波形情報符号と総情報量を一定とし、1ビツト
きざみでスペクトル包絡情報符号の情報量を変化させた
ときのその分析区間A、 Hの符号化音声のSNRはそ
れぞれ第7図の曲線25.26となった。(256サン
プル/分析区間、総計256ビツト/分析区間)。
曲線25はスペクトル包絡符号の情報量を増加するとS
NRは増加する傾向にあるが、スペクトル包絡符号の情
111116ビツトに対し19ビツトで2dB以上も低
下している。曲線26は比較的平坦であるが、1ビツト
の差でも1dB程度の変動があり、ピント数が比較的大
きく異なると2dB程度異なっている。このようにもと
もとSNRは10〜20dB程度であるから、1dB、
  2dBの差は可成り大きなものである。
しかし従来の符号化法では、このような両符号に対する
情報量の配分によるSNRの変動を考慮しておらず、こ
のことは符号化による歪をさらに小さくできる余地が残
されていると云える。
この発明の目的は総情報量一定のもとでできるだけ波形
歪、あるいは聴感的重み付けされた波形歪を小さくする
音声符号化法を提供することにある。
[問題点を解決するための手段」 この発明は分析区間毎に、刻々変化していく音声信号に
追随させて、スペクトル包絡情報符号の情報量と波形情
報符号の情報量を適応的に配分する。
つまりこの発明ではスペクトル包絡情報を符号化する量
子化器及び波形情報を符号化する量子化器の両者を複数
種類の悄14量で量子化できるようにし、またスペクト
ル包絡情報の符号の情報量と波形情報符号の情報量との
配分を予め複数種類設定しておき、分析区間における量
子化歪が小さくなるように、設定された複数の配分から
1つを適応的に決定する。
「実施例」 第1図はこの発明の実施例を示す。この例では第6図に
示した予測係数抽出部12、予測残差抽出部13、量子
化部14.17、逆量子化部16よりなる符号器31.
32.33の三つが設けられ、これら符号器31,32
.33において、例えば第2図に示すような予め設定さ
れた3種類の情報配分方法で、入力端子11からの音声
信号がそれぞれ量子化される。ここでは1分析区間あた
りの総情報量Tは固定とし、この例では256ビツトと
し、つまり T(総情報量)=E(スペクトル包絡符号情報量)+W
(波形符号情報it) + D (配分情報量)である
。符号器31,32.33はそれぞれ第2図中の第1.
第2.第3情報配分方法で符号化される。
これら符号器31,32.33の各符号化出力は局部復
号化判定部34でそれぞれ復号化し、最も望ましい配分
方法を求め、そのスペクトル包絡情報符号35と波形情
報符号36と配分情報符号37とを復号側に伝送する。
ここでいう最も望ましいとは局部復号信号と局部信号と
を比較して量子化歪を求め、これが最小となるものを意
味する。
その場合用途によって聴感的重みづけを行った量子化歪
を用いてもよい、第3図Aに示すようにまず配分情報符
号37を送出し、これに続き、スペクトル包絡情報符号
35、波形情報符号36を順次送出する。なお配分情報
符号としては第2図の例のような一意解読可能な可変長
符号をその頻度に合わせて使うとさらに効果的である。
つまり第2図では3種類の配分方法があるから、各配分
方法を表示するには2ビツト必要であるが、この3種類
のうち、発生頻度が最も多い第3種類の配分方法を示す
配分情報符号を“1”の1ビ・7トとし、他の2種類の
配分情報符号には2ピントを用いる。
一方、復号化側ではまず配分情報符号37を復号部41
で復号する。この復号された配分情報に従ってスペクト
ル包絡情報符号35、波形情報符号36をそれぞれ復号
部42,43で復号化され、これら復号出力を合成部4
4へ供給して合成し出力音声を得る。
情報配分のひな型を決定するには音声信号サンプルを使
って平均的に歪が小さくなるスペクトル包絡情報符号の
ビット数を選ぶ。この際次の2点で生じるトレード・オ
フを考慮すればよい。
■ 配分情報符号をmビットとすると2一種類の配分ひ
な型を設定することができる。
■ 配分情報符号をmビットとすると総情報量Tが一定
のため、例えば波形情報符号がmビット減少する。この
際1分析区間Nサンプルの場合、SNRは平均的に10
  log+o(2””) CdB) =6、02 m
/ N (dB)減少する。
第1図ではスペクトル包絡情報及び波形情報についてそ
れらをそれぞれ複数種類の情報量で量子化する量子化器
として、その各情報量の量子化器をそれぞれ設けたが、
両量子化器を各1つ設けそれぞれその情報量を情報配分
に応じて変更してもよい。このためには任意のビット数
に対応できる量子化器を必要とするが、これには例えば
ベクトル量子化とスカラ量子化とを組み合わせたベクト
ル・スカラ量子化(特願昭57−204849″ベクト
ル量子化法”)をスペクトル包絡情報量子化と、波形情
報量子化に適用すればよい。
前記特許出願“ベクトル量子化法”に示すようにまずベ
クトル量子化し、次にスカラ量子化するように2段階の
量子化器を用いる場合には例えば第4図に第1図と対応
する部分に同一符号を付けて示すように抽出されたスペ
クトル包絡情報を量子化部14でまずベクトル量子化し
、量子化値から得られる暫定的スペクトル包絡特性から
、判定部51でスペクトル包絡情報符号の情報量を決定
する。例えばベクトル量子化による暫定スペクトル包絡
特性が平坦であれば、スペクトル包絡に対する情報量を
少ない予め決めた値に設定し、その対応情報量でスペク
トル包絡情報に対する第2段階目の量子化、この例では
スカラ量子化を行う。
また判定部51は予め決められた情報量Tの残りの情報
量を量子化器17に与えてその情報量に、波形情報を量
子化する。従ってこの場合は第3図B、Cに示すように
、スペクトル包絡情報符号35中の最初から一定のビッ
ト数が第1段階目の量子化(この例ではベクトル量子化
)符号であり、スペクトル包絡特性が平坦な場合は第3
図已に示すように第2段目の量子化の情報量は少ない予
め決めた値とされ、スペクトル包絡特性が変化の太きい
場合は第3図Cに示すように第2段目の量子化情報量は
大きい予め決めた値となる。このように第1段階目の量
子化でスペクトル包絡情報符号の情報量が決るため、配
分情報は送出する必要はない。
第2段階量子化の情報量の設定は同一の暫定スペク)ル
特性を持つ学習サンプルを集めて統計処理をすればよい
復号化側では受信された符号列中の最初から一定長の符
号、つまりスペクトル包絡情報の第2段階量子化符号か
ら判定部52でその第2段階目の量子化符号の情報量(
符号長)を知り、これに応じて復号部42で第2段階目
の復号を行う。もちろんその前に第1段階目の復号を行
う。これと共に判定部52は波形情報符号36の情報量
を復号部43に与えてその復号を行う。
このようにスペクトル包絡情報を2段階で量子化する場
合にその1段階の量子化符号からスペクトル包絡情報符
号の情報量を制御するには次のようにしてもよい。すな
わち、スペクトル包絡特性に応じた情報配分表を例えば
第5図A、Bに示すように予め用意しておき、第5図中
Aは平坦スペクトル特性に対するもの、Bは変化のある
スペクトル特性に対するものである。スペクトル包絡情
報に対する第1段階量子化(ベクトル量子化)で得られ
た符号351で第5図A、 Bの何れの情報配分表を用
いるかを決定し、その決定された情報配分表を用いて、
この例ではその3通りの情報配分を行って、スペクトル
包絡情報に対する第2段階目の量子化(スカラ量子化)
及び波形情報の量子化を行い、この3通りの量子化符号
中の量子化歪が最も小さいものを判定し、その符号を、
第3図り、Hに示すようにスペクトル包絡情報の第2段
階量子化符号35..配分情報符号37、スペクトル包
絡情報の第1段階量子化符号35□、波形情報符号36
の順に送出する。復号側では符号35、から使用する情
報配分表を決定し、配分情報符号37からその情報配分
表中の情報配分を知って、符号35□、36を取出して
それぞれ復号する。
なおスペクトル包絡情報を多段階に量子化する場合、ベ
クトル量子化とスカラ量子化に限らず、ベクトル量子化
又はスカラ量子化のみで多段階量子化を行ってもよい。
「発明の効果」 以上説明したようにこの発明の方法によれば一定の情報
量のもとで、最終的な歪のより小さい符号化が実現され
る。
8 kHzサンプル、1分析区間256サンプルの音声
信号に対し、配分情報符号を3ビツトとする4、8〜9
.6キロビツト/秒の符号化は、固定配分の符号化より
0.5〜1.0dBSNRが向上することが確かめられ
た。SNRはもともと10〜20dB程度であるからこ
の向上は可成りよいものである。
第7図に示したようなSNHの変動の中で、配分情報符
号3ビツトを使えば8種の中で最適のものを使うことが
できることと、波形情報符号が3ビツト減少することで
最終的SNRが平均的に約10  Iota (2””
”’)=0.07  (dB) Lか減少しないことか
らも前記SNRの向上は予想できることである。
【図面の簡単な説明】
第1図はこの発明の符号化法の実施例を示すブロック図
、第2図は情報配分例を示す図、第3図はこの発明の符
号化法による符号化出力の各種例を示す図、第4図はこ
の発明の符号化法の他の実施例を示すブロック図、第5
図は情報配分例を示す図、第6図は線形予測を用いる従
来の符号化法を示すブロック図、第7図は総情報量一定
でスペクトル包絡情報符号量によるSNHの変化例を示
す図である。

Claims (1)

    【特許請求の範囲】
  1. (1)音声信号を複数サンプル数ごとの分析区間に区切
    り、その分析区間の音声信号のスペクトル包絡の形状を
    示すスペクトル包絡情報符号と、その分析区間の音声信
    号の波形を示す波形情報符号とに分離して符号化する方
    法において、 予め設定された複数種類の情報量で量子化できる上記ス
    ペクトル包絡情報符号のための量子化器と、予め設定さ
    れた複数種類の情報量で量子化できる上記波形情報符号
    のための量子化器とを備え、これら両量子化器に対する
    情報量の配分を予め複数種類設定しておき、 上記各分析区間ごとに量子化歪が小さくなるように上記
    情報量の配分を上記設定した複数の値から適応的に決定
    することを特徴とする音声符号化法。
JP61177089A 1986-07-28 1986-07-28 音声符号化法 Expired - Lifetime JPH0761044B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61177089A JPH0761044B2 (ja) 1986-07-28 1986-07-28 音声符号化法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61177089A JPH0761044B2 (ja) 1986-07-28 1986-07-28 音声符号化法

Publications (2)

Publication Number Publication Date
JPS6333025A true JPS6333025A (ja) 1988-02-12
JPH0761044B2 JPH0761044B2 (ja) 1995-06-28

Family

ID=16024935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61177089A Expired - Lifetime JPH0761044B2 (ja) 1986-07-28 1986-07-28 音声符号化法

Country Status (1)

Country Link
JP (1) JPH0761044B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02170200A (ja) * 1988-12-23 1990-06-29 Nec Corp マルチパルス符号復号化装置
JPH02278300A (ja) * 1989-04-19 1990-11-14 Nec Corp マルチパルス型音声符号化復号化装置
JPH04114516A (ja) * 1990-09-04 1992-04-15 Matsushita Electric Ind Co Ltd 音声符号化装置
US5884252A (en) * 1995-05-31 1999-03-16 Nec Corporation Method of and apparatus for coding speech signal
US7283967B2 (en) 2001-11-02 2007-10-16 Matsushita Electric Industrial Co., Ltd. Encoding device decoding device

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02170200A (ja) * 1988-12-23 1990-06-29 Nec Corp マルチパルス符号復号化装置
JPH02278300A (ja) * 1989-04-19 1990-11-14 Nec Corp マルチパルス型音声符号化復号化装置
JPH04114516A (ja) * 1990-09-04 1992-04-15 Matsushita Electric Ind Co Ltd 音声符号化装置
US5884252A (en) * 1995-05-31 1999-03-16 Nec Corporation Method of and apparatus for coding speech signal
US7283967B2 (en) 2001-11-02 2007-10-16 Matsushita Electric Industrial Co., Ltd. Encoding device decoding device
US7392176B2 (en) 2001-11-02 2008-06-24 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device and audio data distribution system

Also Published As

Publication number Publication date
JPH0761044B2 (ja) 1995-06-28

Similar Documents

Publication Publication Date Title
EP2282310B1 (en) Entropy coding by adapting coding between level and run-length/level modes
KR101278805B1 (ko) 엔트로피 코딩 방법 및 엔트로피 디코딩 방법
EP0768780B1 (en) Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
US7433824B2 (en) Entropy coding by adapting coding between level and run-length/level modes
US7539612B2 (en) Coding and decoding scale factor information
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
US8665945B2 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
KR20080049116A (ko) 오디오 코딩
KR20060113998A (ko) 오디오 부호화
KR20070046752A (ko) 신호 처리 방법 및 장치
JP3353868B2 (ja) 音響信号変換符号化方法および復号化方法
KR20060114002A (ko) 오디오 부호화
US7426462B2 (en) Fast codebook selection method in audio encoding
JP3255022B2 (ja) 適応変換符号化方式および適応変換復号方式
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPS6333025A (ja) 音声符号化法
JP2004246038A (ja) 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
US5875424A (en) Encoding system and decoding system for audio signals including pulse quantization
JPH0934493A (ja) 音響信号符号化装置、音響信号復号装置および音響信号処理装置
JP2683734B2 (ja) 音声符号化法
Liebchen et al. Improved lossless transform coding of audio signals
Wong Issues on speech storage
KR20100114484A (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term