JPH05250000A - 音声符号化制御方式 - Google Patents

音声符号化制御方式

Info

Publication number
JPH05250000A
JPH05250000A JP3303116A JP30311691A JPH05250000A JP H05250000 A JPH05250000 A JP H05250000A JP 3303116 A JP3303116 A JP 3303116A JP 30311691 A JP30311691 A JP 30311691A JP H05250000 A JPH05250000 A JP H05250000A
Authority
JP
Japan
Prior art keywords
sound source
information
vocal tract
source information
transmission ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3303116A
Other languages
English (en)
Inventor
Yoshiaki Tanaka
良紀 田中
Tomohiko Taniguchi
智彦 谷口
Yoshihiro Sakai
良広 坂井
Hitoshi Matsuzawa
均 松澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3303116A priority Critical patent/JPH05250000A/ja
Publication of JPH05250000A publication Critical patent/JPH05250000A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 音声信号を符号化して高能率伝送を行う音声
符号化制御方式に関し、再生音声品質の向上を図るもの
である。 【構成】 入力音声信号を加える声道情報分析部1と音
源情報分析部2と、量子化部3,4と、伝送比率決定部
5と、多重化部6とを備え、声道情報分析部1と音源情
報分析部2とによる入力音声信号の同一のフレームに於
ける声道情報と音源情報とを、遅延回路7により遅延さ
せることにより、異なるフレームに於ける声道情報と音
源情報とを組として伝送比率を決定し、量子化部3,4
の量子化ビットを伝送比率に従って割当てて、異なるフ
レームの声道情報と音源情報とを同一のフレームに多重
化して伝送する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を符号化し
て、高能率伝送を可能とする音声符号化制御方式に関す
る。音声信号のディジタル伝送に於いては、8kHzで
サンプリングし、1サンプルを8ビットのμ−law或
いはA−lawの圧伸則で符号化し、64kb/sのビ
ットレートで伝送する方式が一般的である。このビット
レートを数kb/s程度に小さくし、且つ音声品質を低
下させることなく、高能率伝送を可能とすることが要望
されている。
【0002】
【従来の技術】音声信号の高能率符号化は既に各種の方
式が提案されており、例えば、線形予測符号化(LP
C:Linear Predictive Coding )方式は、フレーム
毎に線形予測分析により抽出された線形予測係数と、予
測残差信号とを多重化して伝送し、受信側では、予測残
差信号を線形予測合成フィルタを通すことにより、音声
を再生するものである。この線形予測符号化方式に於い
ては、線形予測合成フィルタが人間の声道部分をモデル
化したものに相当し、予測残差信号が声帯振動や乱気流
等の声道部に入力される音源信号に相当する。
【0003】この予測残差信号を効率的に伝送する為に
予測残差ベクトルをベクトル量子化し、そのインデック
スを伝送するコード駆動線形予測符号化(CELP:C
odeExcited Linear Prediction Coding )方式,
予測残差ベクトルを有限個のパルス列でモデル化し、最
適パルス位置及びパルス振幅として伝送するマルチパル
ス駆動形符号化(MPEC:Multi-pulse Excited
Linear PredictionCoding )方式等の各種の方式が
知られている。
【0004】このような予測符号化方式に於いて伝送さ
れるパラメータは、線形予測係数からなる声道情報と、
予測残差信号からなる音源情報とに大別される。これら
のパラメータは、例えば、20msの一つのフレームの
音声信号に対して分析を行った後、それぞれ同時に、即
ち、同一フレームに於いて伝送される。この場合、分析
を行った同じフレームに於いて伝送する場合や、或るフ
レームに於いて分析された音源パラメータと声道パラメ
ータとを、次のフレームに於いて同時に伝送する場合も
ある。
【0005】又伝送ビットレートは固定とし、入力音声
信号の性質に応じて、音源パラメータと声道パラメータ
とに対する量子化ビットの割当比率を可変にすることに
より、再生音声品質の向上を図る符号化方式も知られて
いる。例えば、伝送比率の異なる符号器を複数動作させ
て、最も特性の良い比率の符号器を選択する方式や、音
源パラメータと声道パラメータとの何れか変化の大きい
方のパラメータに対して多くの量子化ビットを割当てる
方式等がある。
【0006】図3は前述の従来例の可変伝送比率の符号
化方式の説明図であり、31は声道情報分析部、32は
音源情報分析部、35は伝送比率決定部、33,34は
量子化部、36は多重化部であり、声道情報分析部31
と音源情報分析部32と伝送比率決定部35等は、ディ
ジタル・シグナル・プロセッサ(DSP)の演算制御機
能によって実現することができる。入力音声信号は、声
道情報分析部31と音源情報分析部32とに入力され、
例えば、20msのフレーム毎に声道パラメータと音源
パラメータとが求められ、伝送比率決定部35と量子化
部33,34とに入力される。伝送比率決定部35は、
両パラメータの何れか変化の大きい方のパラメータに対
して多くの量子化ビットを割当てるように、量子化器3
3,34を制御し、多重化部36により多重化して送出
する。この場合の伝送比率情報はサイド情報として伝送
される。
【0007】図4は従来例の所要伝送速度の説明図であ
り、(a)は声道情報、(b)は音源情報のそれぞれの
所要伝送速度の時間的変化の一例を示し、(c)はそれ
らを合成したトータルの所要伝送速度を示す。一般的に
声道情報と音源情報との所要伝送速度は、同じフレーム
に於いて大きくなるものである。又伝送レートを固定し
た場合、声道情報と音源情報との所要伝送速度に対応し
て伝送比率限定部35に於いて量子化ビットの割当比率
が制御されることになり、量子化器33,34はそれぞ
れ制御された量子化ステップに従って声道情報と音源情
報とを量子化して、多重化部36に加えることになる。
【0008】
【発明が解決しようとする問題点】伝送比率決定部35
により声道情報と音源情報との伝送比率を可変とする符
号化方式は、固定比率の符号化方式に比較して再生音声
品質の向上を図ることができる利点があるが、図4から
も判るように、声道情報の所要伝送速度と、音源情報の
所要伝送速度との相関が比較的大きいものであり、音声
の過渡部分のように、一方の伝送比率を大きくする必要
があるフレームに於いては、他方の伝送比率も大きくす
る必要が生じることになり、伝送レートが固定の場合に
は、固定比率の符号化方式と大差がないものとなる。従
って、再生音声品質の改善効果を充分に発揮できない欠
点があった。本発明は、音声の過渡部分に於いても再生
音声品質の向上を図ることを目的とする。
【0009】
【課題を解決するための手段】本発明の音声符号化制御
方式は、図1を参照して説明すると、入力音声信号を加
える声道情報分析部1と音源情報分析部2と、これらの
声道情報分析部1と音源情報分析部2とに於いてそれぞ
れ求めた声道情報と音源情報とを量子化する量子化部
3,4と、フレーム毎に声道情報と音情報との伝送比率
を制御する伝送比率決定部5と、量子化部3,4により
量子化された声道情報と音源情報とを多重化する多重化
部6とを備え、それぞれ異なるフレームに於いて求めた
声道情報と音源情報とを同一フレームに多重化して送出
するものである。
【0010】又伝送比率決定部5は、相互に1フレーム
ずれて求められた声道情報と音源情報との組に対して伝
送比率を決定し、声道情報と音源情報とを多重化部6に
より同一フレームに多重化して送出するものである。
【0011】又伝送比率決定部5は、声道情報と音源情
報との時間的変化の大きい方の伝送比率を大きくするよ
うに、伝送比率を決定するものである。
【0012】
【作用】声道情報分析部1と音源情報分析部2とに於い
てそれぞれ異なるフレームに於いて求めた声道情報と音
源情報とを同一のフレームに多重化して送出するもので
あり、換言すれば、声道情報分析部1と音源情報分析部
2とに於いてそれぞれ同一フレームに於いて求めた声道
情報と音源情報とを異なるフレームに多重化して送出す
るものである。従って、音声の過渡部分等に於ける声道
情報と音源情報との所要伝送量が共に多くなるフレーム
に於いて、一方の情報と他方の情報とが異なるフレーム
に於いて送出されるから、それぞれ所望の伝送比率とし
て送出することができることになり、再生音声品質の改
善が可能となる。
【0013】声道情報分析部1と音源情報原籍部2との
何れか一方に1フレーム分の遅延時間の遅延回路を接続
することにより、伝送比率決定部5は、相互に1フレー
ムずれた声道情報と音源情報との組に対して伝送比率を
決定する。そして、決定された伝送比率でこの組の声道
情報と音源情報とを多重化部6により同一フレームに多
重化して送出する。
【0014】又伝送比率決定部5は、声道情報と音源情
報とのそれぞれ前フレームと現フレームとの差を求め
て、差の大きい方の伝送比率を大きくするように伝送比
率を決定して、多重化して送出するものである。
【0015】
【実施例】図1は本発明の実施例の説明図であり、前述
のように、入力音声信号は、声道情報分析部1と音源情
報分析部2とに加えられる。又遅延回路7は声道情報分
析部1に接続しているが、点線で示すように、音源情報
分析部2に接続することも可能である。又伝送比率決定
部5は、声道情報の変化分の検出部8と、音源情報の変
化分の検出部9と、比較部10とを備え、量子化部3,
4の量子化ビットの割当比率を制御し、伝送比率情報を
サイド情報として多重化部6に於いて多重化して受信側
へ伝送するものである。声道情報分析部1,音源情報分
析部2,伝送比率決定部5等の機能は、従来例と同様に
例えばディジタル・シグナル・プロセッサ(DSP)の
演算制御機能によって実現することができる。
【0016】遅延回路7の遅延時間を1フレーム分と
し、実線で示すように、声道情報分析部1に接続した場
合、声道情報分析部1からの声道情報は、音源情報分析
部2からの音源情報に比較して1フレーム分遅延して、
量子化部3,4及び伝送比率決定部5に加えられる。従
って、伝送比率決定部5は、1フレーム分ずれた声道情
報と音源情報とを基に伝送比率を決定し、量子化部3,
4の量子化ビットの割当てを制御することになる。その
場合、声道情報と音源情報とが1フレーム分ずれること
により、それらの相関が小さくなるから、それぞれの所
要伝送速度に対応した量子化ビットの割当てを行うこと
ができる。即ち、遅延回路7の遅延時間は1フレームに
限定されるものではなく、許容できる音声信号の伝送遅
延時間に対応して選定することができるものであり、又
接続個所は、声道情報分析部1又は音源情報分析部2の
入力側に接続することも可能である。
【0017】受信側は、前述の処理と逆の処理を行う構
成を設ければ良いことになり、例えば、サイド情報によ
る伝送比率情報を基に量子化ビットを多重分離し、それ
ぞれ逆量子化して声道情報と音源情報とを再生し、声道
情報により合成フィルタを制御し、音源情報に従った音
源信号を合成フィルタを通すことにより音声信号を再生
することができる。
【0018】前述のCELP方式の場合、符号化器は、
例えば、アダプティブとストキャスティックとの二つの
コードブックを有し、アダプティブ・コードブックのピ
ッチベクトルP及びストキャスティック・コードブック
のコードベクトルCに対して、それぞれゲイン(ピッチ
ゲインb,コードゲインg)を乗じて加えることによ
り、駆動音源信号(b・P+g・C)を形成する。この
アダプティブ・コードブックのピッチベクトルPは、音
声信号のピッチ周期性に依存する部分を発生するもので
あり、又ストキャスティック・コードブックのコードベ
クトルCは、それ以外の非周期性な成分を発生させる為
のものである。
【0019】符号化の過程は、駆動音源信号として最適
なものを一定区間毎に二つのコードブックの中から選択
する処理であり、コードブックの探索は、駆動音源信号
に重み付け合成フィルタを施して得られる再生信号(b
・A・P+g・A・C)と重み付け入力信号(A)との
間の誤差信号の電力を評価関数として行われるものであ
り、この誤差信号の電力を最小とする駆動音源信号が最
適駆動音源信号として決定される。ストキャスティック
・コードブックは、その内容が時間的に変動せずに固定
のものであるのに対して、アダプティブ・コードブック
は、その内容が適応的に変化するものである。このアダ
プティブ・コードブックの各ピッチベクトルPは、その
前のフレームまでに得られている最適駆動音源信号を用
いて生成され、次のフレームに於いて用いられる。即
ち、探索の周期毎にその内容が更新される。
【0020】又声道パラメータである線形予測係数につ
いては、現フレームの予測係数を用いて求めた予測誤差
信号の電力と、前フレームの予測係数を用いて求めた予
測誤差信号の電力とを比較し、その差が予め設定された
値より大きい場合には現フレームの予測係数を伝送し、
そうでない場合は予測係数を伝送しないものであり、予
測係数を伝送しない場合は、前フレームの予測係数を用
いて音声再生を行うことになる。従って、予測係数を伝
送しない場合は、声道情報の所要伝送速度は零となる。
【0021】又音源パラメータについては、入力音声信
号に対して、有声/無声判定を行い、無声音の場合は、
例えば、5ms毎に前述のコードブックの探索を行い、
有声音の場合は、無声音の場合の半分の2.5ms毎に
コードブックの探索を行う。それによって、分析周期が
短い有声音フレームの方が音源情報の所要伝送速度が大
きくなる。
【0022】前述のように、声道パラメータと音源パラ
メータとの所要伝送速度は、それぞれフレーム毎に変化
することになる。固定伝送レートで符号化を行う場合
は、トータルの伝送速度が一定となるように、前述のよ
うに、それぞれの伝送比率を制御することになる。本発
明に於いては、入力音声信号の同一フレームに於ける声
道パラメータと音源パラメータとについて伝送比率を決
定するものではなく、遅延回路7による1フレーム分の
遅延を行い、例えば、入力音声信号の現フレームの音源
パラメータと、前フレームの声道パラメータとを用いて
伝送比率を決定することになる。
【0023】固定伝送レートに於ける声道パラメータと
音源パラメータとの伝送比率の決定に於いて、一方の所
要伝送速度が大きく、他方の所要伝送速度が小さい場合
はそれに対応して伝送比率を決定することができる。又
両方共に所要伝送速度が小さい場合は、何れか一方の伝
送比率を大きくすれば良いことになる。しかし、両方共
に所要伝送速度が大きい場合は、音声品質への影響がよ
り大きい声道パラメータの方の伝送比率を大きくし、音
源パラメータの伝送比率を小さくすることが好適であ
る。
【0024】図2は本発明の実施例の所要伝送速度の説
明図であり、(a)は声道情報の所要伝送速度、(b)
は音源情報の所要伝送速度、(c)はそれらを合成した
トータルの所要伝送速度を示す。(a)の声道情報を図
4の(a)の声道情報と同一とすると、(b)の音源情
報は、図4の(b)の音源情報に比較して、遅延回路に
よりτ(例えば、1フレーム分)の遅延を与えた場合を
示す。従って、図2の(c)に示すように、トータルの
所要伝送速度のピークは図4の(c)と比較すれば明ら
かなように小さくする。即ち、声道情報と音源情報との
相関を小さくすることにより、それぞれの所要伝送速度
に対応した伝送比率の決定を行うことができる。
【0025】又伝送比率限定部5に於ける検出部8,9
により、声道情報と音源情報との変化分を検出し、変化
分の大きい方の伝送比率を大きくすることができる。即
ち、時間的な変化分の大きい方の情報を多く伝送するこ
とにより、再生音声品質の向上を図ることができる。そ
の場合も、前述のように、入力音声信号の異なるフレー
ムに於ける声道情報と音源情報との組についての変化分
を比較することになり、時間的なずれが生じているか
ら、所要伝送速度の大きい方の伝送比率を大きくするこ
とができる。
【0026】
【発明の効果】以上説明したように、本発明は、声道情
報分析部1と音源情報分析部2とに於いて入力音声信号
の同一フレームの声道情報と音源情報とを求めた場合
に、遅延回路7等により遅延させることにより、異なる
フレームに於いて多重化部6により多重化するものであ
り、換言すれば、入力音声信号の異なるフレームに於け
る声道情報と音源情報とを、同一フレームに多重化する
ものである。従って、音声信号の過渡部分等に於ける声
道情報と音源情報との所要伝送速度が共に大きくなるよ
うな場合でも、異なるフレームに於いて多重化するもの
であるから、それぞれの所要伝送速度に対応した伝送比
率で多重化することが可能となる。従って、再生音声品
質の向上を図ることができる利点がある。
【0027】又伝送比率決定部5は、遅延回路7等によ
り相互に1フレームずれか声道情報と音源情報との組に
対して伝送比率を決定するもので、受信側は1フレーム
分のずれを補正するとしても、音声信号の高能率符号化
伝送に於ける遅延は僅かなものとなり、それぞれの所要
伝送速度に対応した伝送比率とすることが容易となる利
点がある。
【0028】又伝送比率決定部5の検出部8,9と比較
部10等により、声道情報と音源情報との時間的変化の
大きい方の伝送比率を大きくするように伝送比率を決定
するものであり、時間的変化の大きい方の情報量を多く
することにより、再生音声品質の向上を図ることができ
る。
【図面の簡単な説明】
【図1】本発明の実施例の説明図である。
【図2】本発明の実施例の所要伝送速度の説明図であ
る。
【図3】従来例の説明図である。
【図4】従来例の所要伝送速度の説明図である。
【符号の説明】
1 声道情報分析部 2 音源情報分析部 3,4 量子化部 5 伝送比率決定部 6 多重化部 7 遅延回路 8,9 検出部 10 比較部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松澤 均 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力音声信号を加える声道情報分析部
    (1)と音源情報分析部(2)と、該音声情報分析部
    (1)と音源情報分析部(2)とに於いてそれぞれ求め
    た声道情報と音源情報とを量子化する量子化部(3),
    (4)と、フレーム毎に前記声道情報と音源情報との伝
    送比率を制御する伝送比率決定部(5)と、前記量子化
    部(3),(4)により量子化された声道情報と音源情
    報とを多重化する多重化部(6)とを備え、 それぞれ異なるフレームに於いて求めた前記声道情報と
    音源情報とを、同一のフレームに多重化して送出するこ
    とを特徴とする音声符号化制御方式。
  2. 【請求項2】 前記伝送比率決定部(5)は、相互に1
    フレームずれて求められた声道情報と音源情報との組に
    対して伝送比率を決定し、該声道情報と音源情報とを前
    記多重化部(6)により同一フレームに多重化して送出
    することを特徴とする請求項1記載の音声符号化制御方
    式。
  3. 【請求項3】 前記伝送比率決定部(5)は、前記声道
    情報と音源情報との時間的変化の大きい方の伝送比率を
    大きくするように、伝送比率を決定することを特徴とす
    る請求項1記載の音声符号化制御方式。
JP3303116A 1991-11-19 1991-11-19 音声符号化制御方式 Withdrawn JPH05250000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3303116A JPH05250000A (ja) 1991-11-19 1991-11-19 音声符号化制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3303116A JPH05250000A (ja) 1991-11-19 1991-11-19 音声符号化制御方式

Publications (1)

Publication Number Publication Date
JPH05250000A true JPH05250000A (ja) 1993-09-28

Family

ID=17917080

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3303116A Withdrawn JPH05250000A (ja) 1991-11-19 1991-11-19 音声符号化制御方式

Country Status (1)

Country Link
JP (1) JPH05250000A (ja)

Similar Documents

Publication Publication Date Title
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
RU93058657A (ru) Вокодер с переменной скоростью кодирования и передачи данных
US8396706B2 (en) Speech coding
EP0731348B1 (en) Voice storage and retrieval system
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
EP0869477B1 (en) Multiple stage audio decoding
JPH10177398A (ja) 音声符号化装置
JP2586043B2 (ja) マルチパルス符号化装置
JP2658816B2 (ja) 音声のピッチ符号化装置
JPH05250000A (ja) 音声符号化制御方式
JPH10207496A (ja) 音声符号化装置及び音声復号装置
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JPH08234795A (ja) 音声符号化装置
JP3010655B2 (ja) 圧縮符号化装置及び方法、並びに復号装置及び方法
US5761633A (en) Method of encoding and decoding speech signals
KR100296409B1 (ko) 다중펄스여기음성부호화방법
JPH0844398A (ja) 音声符号化装置
JP2560860B2 (ja) マルチパルス型音声符号化及び復号化装置
JP2754558B2 (ja) マルチパルス符号化装置のマルチパルス量子化方法
JPH043878B2 (ja)
JP3270146B2 (ja) 音声符号化装置
JP2000020099A (ja) 線形予測分析器,コード励振線形予測符号器及びコード励振線形予測復号器
JP2853126B2 (ja) マルチパルス符号化装置
JPH05167457A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990204