JPH11109997A - 音声符号化方法、音声符号化装置および音声復号化装置 - Google Patents

音声符号化方法、音声符号化装置および音声復号化装置

Info

Publication number
JPH11109997A
JPH11109997A JP9274395A JP27439597A JPH11109997A JP H11109997 A JPH11109997 A JP H11109997A JP 9274395 A JP9274395 A JP 9274395A JP 27439597 A JP27439597 A JP 27439597A JP H11109997 A JPH11109997 A JP H11109997A
Authority
JP
Japan
Prior art keywords
code
audio
quantization
negative
positive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9274395A
Other languages
English (en)
Inventor
Mitsuru Oi
充 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP9274395A priority Critical patent/JPH11109997A/ja
Publication of JPH11109997A publication Critical patent/JPH11109997A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 量子化ビット数を削減し、かつ、再生音の品
質を劣化させない音声符号化を実現する。 【解決手段】 波形符号化された音声サンプル値が正符
号の場合に量子化する手段と負符号の場合に量子化する
手段の2種類の量子化手段を設け、各サンプル値の正負
符号を判別し、該符号に応じてそれぞれの量子化手段を
選択して、サンプル値を量子化し、音声コードを出力す
る。また、該音声コードの量子化手段が、正符号用であ
るか負符号用であるかを復号化装置側に指示するため
に、サンプル値の符号が正から負、負から正に切り替わ
るごとに、音声コードの時系列中に識別コードを挿入す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば携帯電話等
の無線系およびLAN等の有線系のシステムに用いら
れ、音声を波形符号化し、情報圧縮された音声コードを
出力する音声符号化方法、音声符号化装置およびその復
号化装置に関するものである。
【0002】
【従来の技術】ディジタル音声の通信や蓄積では、音声
波形を量子化コードの時系列として表現する波形符号化
方式が用いられている。この方式は他の方式に比べ、演
算量が少なく、遅延が小さい特徴を有している。反面、
全サンプルのデータを使用するため、情報量が大きくな
る欠点がある。
【0003】従来から情報量削減のために、1サンプル
あたりの表現ビット数の削減法として種々の方式が考案
されている。例えば、波形符号化方式として広く利用さ
れているADPCM方式では、音声に対しては1サンプ
ルあたり4ビットで表現し、8KHzでサンプリングし
たデータを扱うので、32Kbpsの情報量となる。これ
以上に削減すると量子化誤差が増加し、音質の劣化が著
しくなることが知られている。
【0004】ここで、量子化ビット数と量子化誤差の関
係について、図を用いて説明する。図5は3ビット量子
化の場合の入力値と量子化後の値の関係を表現してい
る。横軸が入力されるサンプル値、縦軸が量子化後の量
子化値である。例えば、入力値が0からA1の値に対し
ては、A1に量子化される。この数値が例えば3ビット
のコード“000”で表現されることになる。この場合
の量子化誤差として、入力値が0からA2の値について
算出してみる。図6の斜線部分の面積が誤差の総和に相
当するので、この場合の誤差は (A1×A1/2)×2=A1×A1 となる。
【0005】一方、図7は2ビット量子化の場合の入力
値と量子化後の値の関係を表している。量子化の範囲を
図5と同一にとると、この範囲を4レベルに量子化する
ので、量子化値は、A2,A4,A6,A8となる。前
述の3ビットの場合と同様に入力値が0からA2の値に
対して量子化誤差の総和を算出してみる。図8の斜線部
分の面積が誤差の総和に相当するので、この場合の誤差
は (2×A1)×(2×A1)/2=2×(A1×A1) となる。
【0006】以上から、量子化ビット数を1ビット削減
すると、量子化誤差が2倍に増加することがわかる。こ
のように、量子化誤差に関しては、量子化ステップ幅す
なわち図5におけるA1に相当する値が小さいほど、量
子化誤差が小さくなることが言える。
【0007】以上のことは、量子化を行う範囲すなわち
図5では0からA8に相当する値の範囲が一定で量子化
ビット数を増減させる場合である。量子化ビット数が大
きくなれば逆に量子化ステップ幅が小さくなるので、量
子化誤差が小さくなる。一方、量子化ビット数が同じ場
合、量子化を行う値の範囲が狭いほど、量子化ステップ
幅が小さくなるので量子化誤差も小さくなる。
【0008】音声波形は正領域と負領域の値をとるた
め、量子化範囲は正負の両方の領域をカバーする必要が
あるが、従来の手法では、量子化範囲として、正領域と
負領域を合わせた1つの範囲を規定し、固定的にこの範
囲で量子化を行っていた。
【0009】
【発明が解決しようとする課題】図9は音声「あ」を発
声した際のPCM波形の一部であり、図10はこの波形
をADPCM方式で符号化したときのサンプル値の時間
的変化を示したものである。音声の場合、発声の機構か
ら波形が急激に変化することはなく、図9と図10で表
現されるように、サンプル値は正の値や負の値が一定時
間継続する特質を持っている。
【0010】従来の手法では、正のサンプル値を量子化
する場合、負の領域は必要ないにもかかわらず、負の領
域にも量子化値が割り当てられていた。同様に、負のサ
ンプル値を量子化する場合も、必要のない正の量子化値
が割り当てられていた。例えば、4ビット量子化の場
合、16レベルの量子化値のうち正負各領域に8レベル
の量子化値、3ビットの場合には8レベル量子化値のう
ち正負各領域に4レベルの量子化値しか割当られない。
すなわち、量子化ビット数で表現できる量子化値の数の
半分しか使っておらず、半分が無駄になっていることか
ら、情報効率が悪いという問題を有していた。
【0011】本発明は、従来の手法における上記のよう
な無駄を排除することで情報量を削減し、その上で同等
の再生音品質が得られる音声符号化・復号化を達成する
ことを目的とする。
【0012】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明は、入力された音声信号を波形符号
化し、サンプリング周期毎に音声コードを出力する音声
符号化方法において、音声データの正領域と負領域とで
別々に量子化の範囲を設定し、音声サンプル値の正符号
である場合と負符号である場合とで別々に量子化して音
声コードを得ることを特徴とする。
【0013】また、請求項2の発明は、入力された音声
信号を波形符号化し、サンプリング周期毎に音声コード
を出力する音声符号化装置において、音声データの正領
域と負領域とで別々に量子化するための2種類の量子化
手段と、波形符号化後の音声データの各サンプル値の正
負符号を判定する手段と、前記正負符号の判定結果に応
じて、前記2種類の量子化手段から一つを選択する手段
と、前記音声データの各サンプル値に対して前記選択さ
れた量子化手段により符号化された音声コードを出力す
るとともに、サンプル値の正負符号が切り替わるときに
識別コードを挿入して出力する手段とを具備することを
特徴とする。
【0014】さらに、請求項3の発明は、入力された音
声コードを復号化して波形符号化データを得た後、音声
を再生する音声復号化装置において、サンプリング周期
毎の音声コードに対し、正領域の音声コードと負領域の
音声データとで別々に復号するための2種類の復号化手
段と、入力されたコード列における符号切替りの識別コ
ードと音声コードを分離する手段と、前記識別コードの
検出に応じて、前記2種類の復号化手段から一つを選択
する手段と、前記選択された復号化手段により前記音声
コードを復号した波形符号化データを出力する手段とを
具備することを特徴とする。
【0015】本発明の符号化装置によれば、波形符号化
された音声サンプル値が正符号の場合に量子化する手段
と負符号の場合に量子化する手段との2種類の量子化手
段が設けられている。入力された音声信号に対し波形符
号化処理を行った後、各サンプル値毎の正負符号が判別
され、符号に応じてそれぞれの量子化手段が選択され、
量子化が実行される。コード化された音声データの量子
化手段が、正符号用であるか負符号用であるかを、復号
化装置に対し指示する必要があるため、正負の符号が切
り替わるタイミング、すなわち負のデータ値から正のデ
ータ値に変わる場合と、逆に正のデータ値から負のデー
タ値に変わる場合で、コード化データの中に所定の識別
コードが挿入される。一方、復号化装置では、この符号
化装置の正負2種類の量子化手段に対応する2種類の復
号化手段が設けられ、入力される符号化データにおいて
識別コードが検出される毎に正負2種類の復号化手段が
選択されて、復号化が実行される。
【0016】従来の技術では、符号化処理において量子
化の範囲として音声データの正の領域と負の領域を合わ
せたものを使用していたの対し、本発明では量子化の範
囲を音声データの正領域と負領域とを別々に設定し、音
声サンプル値の正負符号に応じて量子化範囲を切り替え
る点が異なる。したがって、従来方式に比べ量子化範囲
は半分となり、従来方式と同等の品質を得るための量子
化ビット数を音声コード当り1ビット削減することがで
きる。
【0017】
【発明の実施の形態】図1に本発明の音声符号化装置の
実施の形態を示す。マイク等からのアナログ音声信号が
入力端子11よりへ入力され、音声入力部12でAD変
換(アナログ・デジタル変換)され、さらに情報圧縮の
ために波形符号化が実行される。波形符号化方式として
はADPCM方式が一般的であるが、本発明ではサンプ
リング周波数毎に信号値がコード化されている方式であ
れば種類は規定しない。入力部12からは情報圧縮され
たサンプル値(波形符号化データ)の時系列が出力され
る。サンプルと量子化値の対応を格納したROM等の量
子化テーブル部15は、サンプル値が正符号である場合
と負符号である場合、すなわち、音声データの正領域用
と負領域用の2種類のテーブル15a,15bからな
る。符号判定部13ではサンプル値毎に正負符号を判定
する。量子化テーブル選択部14は符号判定結果から、
量子化テーブル15のうち、正の量子化テーブル15a
と負の量子化テーブル15bのいずれかを選択する。符
号化部16は、選択された符号化テーブルを用いてサン
プル値を符号化すると同時に、サンプル値の正負符号が
切り替わるとき、あらかじめ定めた符号切替識別コード
をサンプル値のコードデータすなわち音声コードの時系
列に挿入する。結果のコードデータはコード出力部17
より記憶媒体やネットワークなどに出力される。
【0018】サンプル値の時系列が符号化部16により
コードデータに変換される処理内容を図2により説明す
る。図中の(A)は、サンプル値の時間変化を示した例
である。横軸のS1からS10が音声サンプルの時系列
で、縦軸がサンプル値である。縦軸の値dは量子化幅、
“000”から“110”は量子化後のコードを表して
いる。サンプルS1は信号値が0であるので“000”
にコード化される。サンプルS2からS5は信号値が負
か0であり、正負符号は同じなので負領域のコード化が
行なわれ、それぞれ“010”,“100”,“01
0”,“001”となる。サンプルS6は信号値が正
で、直前のサンプルS5の信号値の負符号から切り替わ
るので、符号切替識別コードとして、ここでは“11
1”を挿入した後、正領域のコード化が行なわれ“00
1”となる。サンプルS7、S8は信号値が正か0であ
るので、正領域のコード化がおこなわれ、“011”,
“000”となる。つぎにサンプルS9は正負符号が負
に切り替わるので、信号値のコードデータの前に符号切
替識別コード“111”が挿入され、つぎに信号値が負
領域のコード化が行われて“011”が続く。サンプル
S10は負符号でS9と同じなので、そのまま負領域の
コード化データ“010”が続くことになる。以上か
ら、コード化データの時系列は図2の(B)に示すよう
になる。
【0019】次に、図3に本発明の音声復号化装置の実
施の形態を示す。入力端子31から入力されたコードデ
ータは、分離部32において符号切替識別コードと信号
値コード(音声コード)に分離される。値号値コードと
復号化値の対応を格納したROM等の復号化テーブル部
34は、図1の符号化テーブル部15と同様に、正領域
と負領域用の2種類のテーブル34a、34bからな
る。符号切替識別コードが検出されるごとに、選択部3
3において復号化テーブル34から正の復号化テーブル
34aと負の復号化テーブル34bとを切り替えて選択
し、該選択された復号化テーブルを使用して、復号化部
35において信号値コードが復号化されて波形符号化デ
ータが算出される。さらに出力部36において、波形符
号化データはPCMデータ化され、DA変換後、スピー
カー等から出力される。なお、入力されたコードデータ
に対し、最初に復号化テーブル34aと34bのいずれ
を選択するかは、あらかじめ取り決めておくか、コード
データの時系列の先頭(ヘッダ部)にそのための識別コ
ードを挿入しておければよい。
【0020】図4はコードデータとこれを復号する際に
選択される復号化テーブルについて示したものである。
初めのS1〜S3の3サンプルが復号化テーブル34a
で復号化されているとき、符号切替識別コード“11
1”が検出された後のサンプルに対しては、再び符号切
替識別コードが検出されるまで、すなわちS4〜S5に
対しては、復号化テーブル34bが使用される。そし
て、符号切替識別コードが検出されたサンプルS6以降
は、再びテーブルが切り替わり、復号化テーブル34a
により復号化処理が行われることになる。
【0021】本発明では、正の量子化テーブルと負の量
子化テーブルをサンプル値の正負符号により切り替えて
使用するため、従来と同等の量子化精度を得る場合、コ
ードの量子化ビットを1ビット削減することが可能とな
る。これを図11により説明する。
【0022】図11は3ビット量子化の場合の本発明に
よる方法と従来の方法における量子化範囲の違いを示し
たものである。従来の方法では3ビットで表現できる量
子化値は8個である。これに対し、本発明で従来の方法
と同等の量子化精度を得るには、量子化範囲を正と負の
領域で分けることから、半分の4個の量子化値が得られ
ればよいので、必要な量予化ビット数としては2ビット
となる。このように、本発明では、従来の方法による再
生音と同等の品質を、量子化ビットを1ビット削減して
実現できる。
【0023】本発明を利用する波形符号化方式では、サ
ンプリング周波数分のサンプル数が存在するため、1ビ
ット削減することで全体の情報量の削減効果は大きい。
例えば、ADPCM方式では8KHzサンプリング、4
ビット量子化の条件が一般的であり、この場合の情報量
は32Kbpsとなる。この条件のもとで本発明を適用す
ると、量子化ビット数が3ビットで同等の品質が得られ
る。このときの識別コード分を除いた情報量は24Kbp
sとなり、25%の削減を図ることができる。また、実
際の音声データに関して本発明の方法で符号化すると、
符号切替識別コードが付加されるため、従来方法に比べ
て情報量の削減効果は20%であった。実際の会話音声
では、無音の区間と有音区間があり、無音区間に関して
は信号の変動がなく0レベルであることから、符号切替
識別コードは挿入されない。したがって、無音区間に関
しては情報量の削減効果は、上記の25%であるといえ
る。また、有音区間に関しては、音声データの実測値か
ら削減効果は20%程度と考えられる。以上から、通常
の音声に関して本発明を適用することにより、従来方法
に比べて20から25%の情報量削減を図ることが可能
となる。
【0024】
【発明の効果】以上述べたように、本発明の音声符号化
方法、符号化装置および復号化装置によれば、従来方法
に比べ音声品質を維持したまま情報量を20から25%
削減できることから、装置規模の縮小化や伝送の効率化
が可能となる。
【図面の簡単な説明】
【図1】本発明の音声符号化装置の実施の形態を示すブ
ロック図である。
【図2】サンプル値の時間変化の一例及び該サンプル値
を本発明により符号化した結果の一例を示す図である。
【図3】本発明の音声復号化装置の実施の形態を示すブ
ロック図である。
【図4】コードデータの一例及びこれを復号する際に選
択される複号化テーブルについて説明する図である。
【図5】3ビット量子化における入力値と量子化値の関
係を示す図である。
【図6】3ビット量子化における量子化誤差の総和を示
す図である。
【図7】2ビット量子化における入力値と量子化値の関
係を示す図である。
【図8】2ビット量子化における量子化誤差の総和を示
す図である。
【図9】音声に対するPCMサンプル値の時間変化の例
を示す図である。
【図10】ADPCM方式で符号化した際のサンプル値
の時間変化の例を示す図である。
【図11】本発明と従来方法の量子化範囲の違いを説明
する図である。
【符号の説明】
11 入力端子 12 入力部 13 符号判定部 14 選択部 15 量子化テーブル部 16 符号化部 17 コード出力部 31 入力端子 32 分離部 33 選択部 34 復号化テーブル部 35 復号化部 36 出力部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声信号を波形符号化し、サ
    ンプリング周期毎に音声コードを出力する音声符号化方
    法において、 音声データの正領域と負領域とで別々に量子化の範囲を
    設定し、音声サンプル値の正符号である場合と負符号で
    ある場合とで別々に量子化して音声コードを得ることを
    特徴とする音声符号化方法。
  2. 【請求項2】 入力された音声信号を波形符号化し、サ
    ンプリング周期毎に音声コードを出力する音声符号化装
    置において、 音声データの正領域と負領域とで別々に量子化するため
    の2種類の量子化手段と、 波形符号化後の音声データの各サンプル値の正負符号を
    判定する手段と、 前記正負符号の判定結果に応じて、前記2種類の量子化
    手段から一つを選択する手段と、 前記音声データの各サンプル値に対して前記選択された
    量子化手段により符号化された音声コードを出力すると
    ともに、サンプル値の正負符号が切り替わるときに識別
    コードを挿入して出力する手段とを具備することを特徴
    とする音声符号化装置。
  3. 【請求項3】 入力された音声コードを復号化して波形
    符号化データを得た後、音声を再生する音声復号化装置
    において、 サンプリング周期毎の音声コードに対し、正領域の音声
    コードと負領域の音声データとで別々に復号するための
    2種類の復号化手段と、 入力されたコード列における符号切替りの識別コードと
    音声コードを分離する手段と、 前記識別コードの検出に応じて、前記2種類の復号化手
    段から一つを選択する手段と、 前記選択された復号化手段により前記音声コードを復号
    した波形符号化データを出力する手段とを具備すること
    を特徴とする音声復号化装置。
JP9274395A 1997-10-07 1997-10-07 音声符号化方法、音声符号化装置および音声復号化装置 Pending JPH11109997A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9274395A JPH11109997A (ja) 1997-10-07 1997-10-07 音声符号化方法、音声符号化装置および音声復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9274395A JPH11109997A (ja) 1997-10-07 1997-10-07 音声符号化方法、音声符号化装置および音声復号化装置

Publications (1)

Publication Number Publication Date
JPH11109997A true JPH11109997A (ja) 1999-04-23

Family

ID=17541078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9274395A Pending JPH11109997A (ja) 1997-10-07 1997-10-07 音声符号化方法、音声符号化装置および音声復号化装置

Country Status (1)

Country Link
JP (1) JPH11109997A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007511928A (ja) * 2003-10-08 2007-05-10 ジェイ ダブリュー アソシエイツ 音声データ圧縮システム及び方法
JP2015050659A (ja) * 2013-09-02 2015-03-16 日本電信電話株式会社 信号処理システム及び信号処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007511928A (ja) * 2003-10-08 2007-05-10 ジェイ ダブリュー アソシエイツ 音声データ圧縮システム及び方法
JP4689616B2 (ja) * 2003-10-08 2011-05-25 ジェイ ダブリュー アソシエイツ 音声データ圧縮システム及び方法
JP2015050659A (ja) * 2013-09-02 2015-03-16 日本電信電話株式会社 信号処理システム及び信号処理方法

Similar Documents

Publication Publication Date Title
CA1207906A (en) Speech-adaptive predictive coding system having reflected binary encoder/decoder
US5251261A (en) Device for the digital recording and reproduction of speech signals
JP2006099124A (ja) デジタル無線チャネル上の自動音声/話者認識
JPH11259100A (ja) 励起ベクトルの符号化方法
US7072830B2 (en) Audio coder
JP2002536694A (ja) 音声コーダのための、1/8レート乱数発生のための方法と手段
US20060015330A1 (en) Voice coding/decoding method and apparatus
US6480550B1 (en) Method of compressing an analogue signal
US20010032072A1 (en) Apparatus and method for converting reproducing speed
JPH11109997A (ja) 音声符号化方法、音声符号化装置および音声復号化装置
EP1159738B1 (en) Speech synthesizer based on variable rate speech coding
US9070362B2 (en) Audio quantization coding and decoding device and method thereof
Ding Wideband audio over narrowband low-resolution media
JP2797348B2 (ja) 音声符号化・復号化装置
KR100590769B1 (ko) 상호 부호화 장치 및 그 방법
JP3130834B2 (ja) 移動電話機
JPH1022936A (ja) 補間装置
KR0152341B1 (ko) 멀티미디어에서 출력음성의 깨짐현상 제거장치 및 방법
JP2543345B2 (ja) 音声符号化方式
JPH09149104A (ja) 擬似背景雑音生成方法
JPS6033751A (ja) 符・復号器
JPH0816199A (ja) 録音装置
JP2001094507A (ja) 擬似背景雑音生成方法
JPH06259096A (ja) 音声符号化装置
JPH0969000A (ja) 音声パラメータ量子化装置