JPH0944195A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH0944195A
JPH0944195A JP7192176A JP19217695A JPH0944195A JP H0944195 A JPH0944195 A JP H0944195A JP 7192176 A JP7192176 A JP 7192176A JP 19217695 A JP19217695 A JP 19217695A JP H0944195 A JPH0944195 A JP H0944195A
Authority
JP
Japan
Prior art keywords
gain
circuit
codebook
speech
code vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7192176A
Other languages
English (en)
Other versions
JP3616432B2 (ja
Inventor
Shinichi Taumi
真一 田海
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP19217695A priority Critical patent/JP3616432B2/ja
Priority to CA002182159A priority patent/CA2182159C/en
Priority to EP96112150A priority patent/EP0756268B1/en
Priority to DE69630177T priority patent/DE69630177T2/de
Priority to US08/686,582 priority patent/US6006178A/en
Publication of JPH0944195A publication Critical patent/JPH0944195A/ja
Application granted granted Critical
Publication of JP3616432B2 publication Critical patent/JP3616432B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 音声符号化装置において伝送ビット数を増や
すことなく、実質的にコードブックサイズを増加させ
る。 【解決手段】 ゲインコードブック切替え回路1120
は短期予測ゲイン計算回路1110から短期予測ゲイン
を、入力端子1050からモード情報を受け、所定のモ
ードの際、短期予測ゲインを所定の閾値と比べゲインコ
ードブック切替情報をゲイン量子化回路1130へ出力
する。ゲイン量子化回路は適応コードベクトル、音源コ
ードベクトル、インパルス応答情報、及びゲインコード
ブック切替え情報を受け、入力端子1060又は入力端
子1070のうちゲインコードブック切替え情報で選択
された入力端子に接続されるゲインコードブックからゲ
インコードベクトルを受け、選択された音源コードベク
トルに対して音源コードベクトルとゲインコードブック
切替え情報とにより切り替えられたゲインコードブック
中のゲインコードベクトルとの組み合わせを選択する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を低遅
延、特に、5ms−10ms以下の短いフレーム単位で
高品質に符号化するための音声符号化装置に関する。
【0002】
【従来の技術】従来、音声信号を符号化する方式とし
て、例えば、K.Ozawa氏らによる”M−LCEL
P Speech Coding at 4 kb/s
with Multi−Mode and Mult
i−Codebook”(IEICE Trans.C
ommun.,vol.E77−B,No.9,pp.
1114−1121,1994年)と題した論文(文献
1)が知られている。
【0003】この従来例では、送信側で、線形予測(L
PC)分析を用いて、フレーム毎(例えば40ms)に
音声信号からスペクトル特性を表すスペクトルパラメー
タを抽出し、フレーム単位の信号又はフレーム単位の信
号に聴感重み付けを行った信号からその特徴量を計算し
て、この特徴量を用いてモード判別(例えば、母音部と
子音部)を行って、モード判別結果に応じてアルゴリズ
ムあるいはコードブックを切りかえて音声符号化を行っ
ている。
【0004】符号化部では、フレームをさらにサブフレ
ーム(例えば8ms)に分割し、サブフレーム毎に過去
の音源信号を基に適応コードブックにおけるパラメータ
(ピッチ周期に対応する遅延パラメータとゲインパラメ
ータ)を抽出し適応コードブックにより前記サブフレー
ムの音声信号をピッチ予測し、ピッチ予測して求めた残
差信号に対して、予め定められた種類の雑音信号からな
る音源コードブック(ベクトル量子化コードブック)か
ら最適音源コードベクトルを選択し最適なゲインを計算
することにより、音源信号を量子化する。音源コードベ
クトルの選択の仕方は、選択した雑音信号により合成し
た信号と、前記残差信号との誤差電力を最小化するよう
に行う。そして、選択されたコードベクトルの種類を表
すインデクスとゲインならびに、前記スペクトルパラメ
ータと適応コードブックのパラメータをマルチプレクサ
部により組み合わせて伝送する。
【0005】
【発明が解決しようとする課題】ところで、従来の音声
符号化では、コードブックサイズが限られている関係
上、十分な音質性能を得ることができないという問題点
がある。
【0006】本発明の目的は、伝送するビット数を増や
すことなしに、数倍のサイズのコードブックを有するこ
とと等しい機能を有する音声符号化装置を提供すること
にある。
【0007】
【課題を解決するための手段】本発明によれば、音声信
号を予め定めたフレーム単位に区切るフレーム分割部
と、前記音声信号から少なくとも1種類の第1の特徴量
を計算しモード判別を行なうモード判別部と、前記モー
ド判別結果に応じて前記音声信号の符号化処理を行う符
号化部を有する音声符号化装置において、予め定められ
たモードが選択された場合に、前記音声信号から求めた
少なくとも1種類の第2の特徴量に応じて、予め格納さ
れた複数の符号帳を切替える符号帳切り替え部を有する
ことを特徴とする音声符号化装置が得られる。
【0008】また、本発明によれば、音声信号を予め定
めたフレーム単位に区切るフレーム分割部と、前記音声
信号から少なくとも1種類の第1の特徴量を計算しモー
ド判別を行なうモード判別部と、前記モード判別結果に
応じて前記音声信号の符号化処理を行う符号化部を有す
る音声符号化装置において、予め定められたモードが選
択された場合に、前記音声信号から求めた少なくとも1
種類の第2の特徴量に応じて、予め格納された複数の符
号帳を切替える符号帳切り替え部を有し、前記第2の特
徴量には、少なくとも1種類以上の特徴量の時間変化比
が特徴量として含まれる音声符号化装置が得られる。
【0009】さらに、本発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から少なくとも1種類の第1の特徴量を計算しモ
ード判別を行なうモード判別部と、前記モード判別結果
に応じて前記音声信号の符号化処理を行う符号化部を有
する音声符号化装置において、予め定められたモードが
選択された場合に、前記音声信号から求めた少なくとも
1種類の第2の特徴量に応じて、予め格納された複数の
符号帳を切替える符号帳切り替え部を有し、前記第2の
特徴量には、現フレーム又は過去の少なくとも1つ以上
のフレームのいずれかの2フレーム分のそれぞれの特徴
量に対して、前記2つの特徴量の比が特徴量として含ま
れる音声符号化装置が得られる。
【0010】加えて、本発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から少なくとも1種類の第1の特徴量を計算しモ
ード判別を行なうモード判別部と、前記モード判別結果
に応じて前記音声信号の符号化処理を行う符号化部を有
する音声符号化装置において、予め定められたモードが
選択された場合に、前記音声信号から求めた少なくとも
1種類の第2の特徴量に応じて、予め格納された複数の
符号帳を切替える符号帳切り替え部を有し、前記第2の
特徴量には、上記の特徴量の時間変化比又は2つの特徴
量の比の他に、ピッチ予測ゲイン、短期予測ゲイン、レ
ベル、及びピッチの少なくとも1種が特徴量として含ま
れる音声符号化装置が得られる。
【0011】そして、本発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から少なくとも1種類の第1の特徴量を計算しモ
ード判別を行なうモード判別部と、前記モード判別結果
に応じて前記音声信号の符号化処理を行う符号化部を有
する音声符号化装置において、予め定められたモードが
選択された場合に、前記音声信号から求めた少なくとも
1種類の第2の特徴量に応じて、予め格納された複数の
符号帳を切替える符号帳切り替え部を有し、前記第2の
特徴量には、上記の特徴量の時間変化比又は2つの特徴
量の比が含まれ、前記複数の符号帳として、複数のRM
Sコードブック、複数のLSPコードブック、複数の適
応コードブック、複数の音源コードブック、及び複数の
ゲインコードブックのいずれかが備えられていることを
特徴とする音声符号化装置が得られる。
【0012】前記構成により、伝送するビット数を増や
すことなしに、予め定められたモードにおいて複数のコ
ードブックを切り替えることにより、数倍のサイズのコ
ードブックを有することと等しい機能を有するため、音
質の改善が行われる。
【0013】
【発明の実施の形態】以下本発明について図面を参照し
て説明する。ここでは、一例として、予め定められたモ
ードにおいて、複数のゲインコードブックを切り替える
例について説明する。
【0014】本発明による音声符号化装置の実施例1を
図1に示す。ここでは、予め定められたモードにおい
て、第2の特徴量を用いてゲインコードブックを切替え
る構成について説明する。
【0015】図1を参照して、入力端子100から音声
信号を入力し、フレーム分割回路110では音声信号を
所定のフレーム長(例えば5ms)毎に分割し、サブフ
レーム分割回路120では、1フレームの音声信号をフ
レームよりも短いサブフレーム(例えば2.5ms)に
分割する。
【0016】スペクトルパラメータ計算回路200で
は、少なくとも1つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓(例えば24ms)を
かけて音声を切り出してスペクトルパラメータをあらか
じめ定められた次数(例えばP=10次)計算する。こ
こでスペクトルパラメータの計算には、周知のLPC分
析又はBurg分析等を用いることができる。ここで
は、Burg分析を用いることとする。Burg分析の
詳細については、例えば、”信号解析とシステム同定”
(コロナ社1988年刊、中溝著)の82〜87頁(文
献2)に記載されているので説明は略する。さらに、ス
ペクトルパラメータ計算部では、Burg法により計算
された線形予測係数αi (i=1,…,10)を量子化
及び補間に適したLSPパラメータに変換する。ここ
で、線形予測係数からLSPへの変換は、菅村他によ
る”線スペクトル対(LSP)音声分析合成方式による
音声情報圧縮”と題した論文(電子通信学会論文誌、J
64−A、pp.599−606、1981年)(文献
3)を参照することができる。つまり、第2サブフレー
ムでBurg法により求めた線形予測係数を、LSPパ
ラメータに変換し、第1サブフレームのLSPを直線補
間により求めて、第1サブフレームのLSPを逆変換し
て線形予測係数に戻し、第1、2サブフレームの線形予
測係数αil(i=1,…,10,l=1,…,5)を聴
感重み付け回路230に出力する。また、第1、2サブ
フレームのLSPをスペクトルパラメータ量子化回路2
10へ出力する。
【0017】スペクトルパラメータ量子化回路210で
は、予め定められたサブフレームのLSPパラメータを
効率的に量子化する。以下では、量子化法として、ベク
トル量子化を用いるものとし、第2サブフレームのLS
Pパラメータを量子化するものとする。LSPパラメー
タのベクトル量子化の手法は周知の手法を用いることが
できる。具体的な方法として、例えば、特開平4−17
1500号公報(文献4)、特開平4−363000号
公報(文献5)、特開平5−6199号公報(文献
6)、又はT.Nomura et al.,による”
LSP Coding Using VQ−SVQWi
th Interpolation in4.075
kbps M−LCELP Speech Code
r”と題した論文(Proc.Mobile Mult
imedia Communications,pp.
B.2.5,1993)(文献7)を参照できるのでこ
こでは説明を省略する。また、スペクトルパラメータ量
子化回路210では、第2サブフレームで量子化したL
SPパラメータをもとに、第1、2サブフレームのLS
Pパラメータを復元する。ここでは、現フレームの第2
サブフレームの量子化LSPパラメータと1つ過去のフ
レームの第2サブフレームの量子化LSPを直線補間し
て、第1、2サブフレームのLSPを復元する。ここ
で、量子化前のLSPと量子化後のLSPとの誤差電力
を最小化するコードベクトルを1種類選択した後に、直
線補間により第1〜第4サブフレームのLSPを復元で
きる。さらに性能を向上させるためには、前記誤差電力
を最小化するコードベクトルを複数候補選択したのち
に、各々の候補について、累積歪を評価し、累積歪を最
小化する候補と補間LSPの組を選択するようにするこ
とができる。
【0018】以上により復元した第1、2サブフレーム
のLSPと第2サブフレームの量子化LSPをサブフレ
ーム毎に線形予測係数α′il(i=1,…,10,l=
1,…,5)に変換し、インパルス応答計算回路310
へ出力する。また、第2サブフレームの量子化LSPの
コードベクトルを表すインデクスをマルチプレクサ40
0に出力する。
【0019】上記において、直線補間のかわりに、LS
Pの補間パターンをあらかじめ定められたビット数(例
えば2ビット)分用意しておき、これらのパターンの各
々に対して1、2サブフレームのLSPを復元して累積
歪を最小化するコードベクトルと補間パターンの組を選
択するようにしてもよい。このようにすると補間パター
ンのビット数だけ伝送情報が増加するが、LSPのフレ
ーム内での時間的な変化をより精密に表すことができ
る。ここで、補間パターンは、トレーニング用のLSP
データを用いて予め学習して作成してもよいし、予め定
められたパターンを格納しておいてもよい。予め定めら
れたパターンとしては、例えば、T.Taniguch
et al による”Improved CELP
speech coding at 4kb/s an
d below”と題した論文(Proc.ICSL
P,pp.41−44,1992)(文献8)に記載さ
れたパターンを用いることができる。また、さらに性能
を改善するためには、補間パターンを選択した後に、予
め定められたサブフレームにおいて、LSPの真の値と
LSPの補間値との誤差信号を求め、前記誤差信号をさ
らに誤差コードブックで表すようにしてもよい。
【0020】聴感重み付け回路230は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に量子
化前の線形予測係数αil(i=1,…,10,l=1,
…,5)を入力し、前記文献1にもとづき、サブフレー
ムの音声信号に対して聴感重み付けを行い、聴感重み付
け信号を出力する。
【0021】モード判別回路250は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号を受取り
ピッチ予測ゲインと、予め定めた閾値に対し、モードを
決め(例えば母音部と子音部)、モード判別結果を適応
コードブック回路500、音源量子化回路350へ出力
する。
【0022】図1にもどり、応答信号計算回路240
は、スペクトルパラメータ計算回路200から、各サブ
フレーム毎に線形予測係数αilを入力し、スペクトルパ
ラメータ量子化回路210から、量子化、補間して復元
した線形予測係数α′ilをサブフレーム毎に入力し、保
存されているフィルタメモリの値を用いて、入力信号d
(n)=0とした応答信号を1サブフレーム分計算し、
減算器235へ出力する。ここで、応答信号xz (n)
は数1で表される。
【0023】
【数1】 ここで、γは、聴感重み付け量を制御する重み係数であ
り、下記の数3と同一の値である。
【0024】減算器235は、数2により、聴感重み付
け信号から応答信号を1サブフレーム分減算し、x′w
(n)を適応コードブック回路300へ出力する。
【0025】
【数2】 インパルス応答計算回路310は、z変換が数3で表さ
れる重み付けフィルタのインパルス応答hw (n)を予
め定められた点数Lだけ計算し、適応コードブック回路
300、音源量子化回路350へ出力する。
【0026】
【数3】 適応コードブック回路500は、ピッチパラメータを求
める。詳細は前記文献2を参照することができる。ま
た、適応コードブックによりピッチ予測を数4に従い行
い、適応コードブック予測残差信号z(n)を出力す
る。
【0027】
【数4】 ここで、b(n)は、適応コードブックピッチ予測信号
であり、数5で表せる。
【0028】
【数5】 ここで、β、Tは、それぞれ、適応コードブックのゲイ
ン、遅延を示す。v(n)は適応コードベクトルであ
る。記号*は畳み込み演算を示す。
【0029】不均一パルス数型スパース音源コードブッ
ク351は、各々のベクトルの0でない成分の個数が異
なるスパースコードブックである。
【0030】音源量子化回路350では、音源コードブ
ック351に格納された音源コードベクトルの全部ある
いは一部に対して、数6を最小化するように、最良の音
源コードベクトルcj (n)を選択する。このとき、最
良のコードベクトルを1種選択してもよいし、2種以上
のコードベクトルを選んでおいて、ゲイン量子化の際
に、1種に本選択してもよい。ここでは、2種以上のコ
ードベクトルを選んでおくものとする。数6において、
z(n)は選ばれた適応コードベクトルとの予測残差信
号である。
【0031】
【数6】 なお、一部の音源コードベクトルに対してのみ、数6を
適用するときには、複数個の音源コードベクトルをあら
かじめ予備選択しておき、予備選択された音源コードベ
クトルに対して、数6を適用することもできる。
【0032】ゲイン量子化回路365は、モード判別回
路250からモード判別情報を、スペクトルパラメータ
計算回路200からスペクトルパラメータを受け取り、
モード判別情報が予め定められたモードのときに、第2
の特徴量を用いてゲインコードブック371とゲインコ
ードブック372のいずれか一方を選択し、選択された
ゲインコードブックからゲインコードベクトルを読みだ
して、インデクスをマルチプレクサ400に出力する。
【0033】図2を参照して、ゲイン量子化回路365
を説明する。短期予測ゲイン計算回路1110は入力端
子1040からスペクトルパラメータを受け取り、第2
の特徴量として、数7に従い短期予測ゲインGを計算
し、ゲインコードブック切替え回路1120に出力す
る。
【0034】
【数7】 ゲインコードブック切替え回路1120は、短期予測ゲ
イン計算回路1110から、短期予測ゲインを、入力端
子1050からモード情報を受け取り、予め定められた
モードの場合に、短期予測ゲインを、予め定めた閾値と
比べてゲインコードブック切替え情報をゲイン量子化回
路1130へ出力する。ゲイン量子化回路1130は、
入力端子1010から適応コードベクトルを、入力端子
1020から音源コードベクトルを、入力端子1030
からインパルス応答情報を、ゲインコードブック切替え
回路1120からゲインコードブック切替え情報を入力
し、入力端子1060あるいは入力端子1070のう
ち、ゲインコードブック切替え情報により選択された入
力端子に接続されるゲインコードブックからゲインコー
ドベクトルを受け取り、選択された音源コードベクトル
に対して、数8を最小化するように、音源コードベクト
ルと、ゲインコードブックに切替え情報により切り替え
られた、ゲインコードブック中のゲインコードベクトル
との組み合わせを選択する。
【0035】
【数8】 ここでβ′k ,γ′k は、ゲインコードブック切り替え
情報により切り替えられたゲインコードブックに格納さ
れた2次元ゲインコードブックにおけるk番目のコード
ベクトルである。選択された音源コードベクトルとゲイ
ンコードベクトルを表すインデクスを出力端子1080
に出力する。
【0036】重み付け信号計算回路360は、スペクト
ルパラメータ計算回路の出力パラメータ及び、それぞれ
のインデクスを入力し、インデクスからそれに対応する
コードベクトルを読みだし、まず、数9にもとづき駆動
音源信号v(n)を求める。
【0037】
【数9】 次に、スペクトルパラメータ計算回路200の出力パラ
メータ、スペクトルパラメータ量子化回路210の出力
パラメータを用いて数10により重み付け信号sw
(n)をサブフレーム毎に計算し、応答信号計算回路2
40へ出力する。
【0038】
【数10】 次に、本発明による音声符号化装置の実施例2について
説明する。
【0039】本実施例は、実施例1のゲイン量子化回路
365のみが異なるため、ここでは、ゲイン量子化回路
の説明のみを図3を用いて行う。
【0040】図において、短期予測ゲイン計算回路21
10は入力端子2040からスペクトルパラメータを受
け取り、第2の特徴量として、数11に従い短期予測ゲ
インGを計算し、短期予測ゲイン比計算回路2140と
遅延器2150に出力する。
【0041】
【数11】 短期予測ゲイン比計算回路2140は、短期予測ゲイン
計算回路2110から現フレームの短期予測ゲインを、
遅延器2150から過去のフレームの短期予測ゲインを
受け取り、その時間比を計算し、ゲインコードブック切
り替え回路2120に出力する。ゲインコードブック切
替え回路2120は、短期予測ゲイン比計算回路214
0から短期予測ゲイン比を、入力端子2050からモー
ド情報を受け取り、予め定められたモードの場合に、短
期予測ゲインを予め定めた閾値と比べてゲインコードブ
ック切替え情報をゲイン量子化回路2130へ出力す
る。ゲイン量子化回路2130は、入力端子2010か
ら適応コードベクトルを、入力端子2020から音源コ
ードベクトルを、入力端子2030からインパルス応答
情報を、ゲインコードブック切り替え回路2120から
ゲインコードブック切替え情報を入力し、入力端子20
60あるいは入力端子2070のうち、ゲインコードブ
ック切替え情報により選択された入力端子に接続される
ゲインコードブックからゲインコードベクトルを受け取
り、選択された音源コードベクトルに対して数12を最
小化するように、音源コードベクトルと、ゲインコード
ベクトル切替え情報により切り替えられた、ゲインコー
ドブック中のゲインコードベクトルとの組み合わせを選
択する。
【0042】
【数12】 ここでβ′k ,γ′k は、ゲインコードブック切り替え
情報により切り替えられたゲインコードブックに格納さ
れた2次元ゲインコードブックにおけるk番目のコード
ベクトルである。選択された音源コードベクトルとゲイ
ンコードベクトルを表すインデクスを出力端子2080
に出力する。
【0043】本発明による音声符号化装置の実施例3に
ついて説明する。
【0044】本実施例は、実施例1に対してゲイン量子
化回路のみが異なるので、ここでは、図4を参照して、
ゲイン量子化回路の説明のみを行う。
【0045】図において、短期予測ゲイン計算回路31
10は入力端子3040からスペクトルパラメータを受
け取り、第2の特徴量として、数13に従い短期予測ゲ
インGを計算し、短期予測ゲイン比計算回路3140と
遅延器3150に出力する。
【0046】
【数13】 短期予測ゲイン比計算回路3140は、短期予測ゲイン
計算回路3110から現フレームの短期予測ゲインを、
遅延器3160から2つ前の過去のフレームの短期予測
ゲインを受け取り、その比を計算し、ゲインコードブッ
ク切替え回路3120に出力する。ゲインコードブック
切替え回路3120は短期予測ゲイン比計算回路314
0から、短期予測ゲイン比を、入力端子3050からモ
ード情報を受け取り、予め定められたモードの場合に、
短期予測ゲインを、予め定めた閾値と比べてゲインコー
ドブック切替え情報をゲイン量子化回路3130へ出力
する。ゲイン量子化回路3130は、入力端子3010
から適応コードベクトルを、入力端子3020から音源
コードベクトルを、入力端子3030からインパルス応
答情報を、ゲインコードブック切替え回路3120から
ゲインコードブック切替え情報を入力し、入力端子30
60あるいは入力端子3070のうち、ゲインコードブ
ック切替え情報により選択された入力端子に接続される
ゲインコードブックからゲインコードベクトルを受け取
り、選択された音源コードベクトルに対して、数14を
最小化するように、音源コードベクトルと、ゲインコー
ドブック切替え情報により切り替えられた、ゲインコー
ドブック中のゲインコードベクトルとの組み合わせを選
択する。
【0047】
【数14】 ここでβ′k ,γ′k は、ゲインコードブック切り替え
情報により切り替えられたゲインコードブック355に
格納された2次元ゲインコードブックにおけるk番目の
コードベクトルである。選択された音源コードベクトル
とゲインコードベクトルを表すインデクスを出力端子3
080に出力する。
【0048】本発明による音声符号化装置の実施例4に
ついて説明する。
【0049】本実施例では、実施例1に対してゲイン量
子化回路のみが異なるので、ここでは、図5を参照し
て、ゲイン量子化回路の説明のみを行う。
【0050】図において、短期予測ゲイン計算回路41
10は入力端子4040からスペクトルパラメータを受
け取り、第2の特徴量として、数15に従い短期予測ゲ
インGを計算し、遅延器4170と遅延器4150に出
力する。
【0051】
【数15】 短期予測ゲイン比計算回路4140は、遅延器4170
から過去のフレームの短期予測ゲインを、遅延器416
0から2つ前の過去のフレームの短期予測ゲインを受け
取り、その比を計算し、ゲインコードブック切替え回路
4120に出力する。ゲインコードブック切替え回路4
120は短期予測ゲイン比計算回路4140から、短期
予測ゲイン比を、入力端子4050からモード情報を受
け取り、予め定められたモードの場合に、短期予測ゲイ
ンを、予め定めた閾値と比べてゲインコードブック切替
え情報をゲイン量子化回路4130へ出力する。ゲイン
量子化回路4130は、入力端子4010から適応コー
ドベクトルを、入力端子4020から音源コードベクト
ルを、入力端子4030からインパルス応答情報を、ゲ
インコードブック切り替え回路4120からゲインコー
ドブック切替え情報を入力し、入力端子4060あるい
は入力端子4070のうち、ゲインコードブック切替え
情報により選択された入力端子に接続されるゲインコー
ドブックからゲインコードベクトルを受け取り、選択さ
れた音源コードベクトルに対して、数16を最小化する
ように、音源コードベクトルと、ゲインコードブック切
替え情報により切り替えられた、ゲインコードブック中
のゲインコードベクトルとの組み合わせを選択する。
【0052】
【数16】 ここで、β′k ,γ′k は、ゲインコードブック切替え
情報により切り替えられたゲインコードブック355に
格納された2次元ゲインコードブックにおけるk番目の
コードベクトルである。選択された音源コードベクトル
とゲインコードベクトルを表すインデクスを出力端子4
080に出力する。
【0053】本発明のよる音声符号化装置の実施例5に
ついて説明する。
【0054】本実施例では、実施例1に対してゲイン量
子化回路とゲインコードブックの構成が異なる。ここで
は、図6及び図7を参照して説明する。
【0055】ゲイン量子化回路9365は、モード判別
回路250からモード判別情報を、スペクトルパラメー
タ計算回路200からスペクトルパラメータを受け取
り、モード判別情報が予め定められたモードのときに、
第2の特徴量を用いてゲインコードブック9371とゲ
インコードブック9372あるいはゲインコードブック
9373のいずれか一方を選択し、選択されたゲインコ
ードブックからゲインコードベクトルを読みだして、イ
ンデクスをマルチプレクサ400に出力する。
【0056】図7において、短期予測ゲイン計算回路5
110は入力端子5040からスペクトルパラメータを
受け取り、第2の特徴量として、数17に従い短期予測
ゲインGを計算し、遅延器5170と遅延器5150に
出力する。
【0057】
【数17】 短期予測ゲイン比計算回路5140は、遅延器5170
から過去のフレームの短期予測ゲインを、遅延器516
0から2つ前の過去のフレームの短期予測ゲインを受け
取り、その比を計算し、ゲインコードブック切替え回路
5120に出力する。ゲインコードブック切替え回路5
120は、短期予測ゲイン比計算回路5140から、短
期予測ゲイン比を、入力端子5050からモード情報を
受け取り、予め定められたモードの場合に、短期予測ゲ
インを、予め定めた閾値と比べてゲインコードブック切
替え情報をゲイン量子化回路5130へ出力する。ゲイ
ン量子化回路5130は、入力端子5010から適応コ
ードベクトルを、入力端子5020から音源コードベク
トルを、入力端子5030からインパルス応答情報を、
ゲインコードブック切替え回路5120からゲインコー
ドブック切替え情報を入力し、入力端子5060あるい
は入力端子5070、入力端子5090のうち、ゲイン
コードブック切替え情報により選択された入力端子に接
続されるゲインコードブックからゲインコードベクトル
を受け取り、選択された音源コードベクトルに対して、
数18を最小化するように、音源コードベクトルと、ゲ
インコードブック切替え情報により切り替えられた、ゲ
インコードブック中のゲインコードベクトルとの組み合
わせを選択する。
【0058】
【数18】 ここで、β′k ,γ′k は、ゲインコードブック切替え
情報により切り替えられたゲインコードブック355に
格納された2次元ゲインコードブックにおけるk番目の
コードベクトルである。選択された音源コードベクトル
とゲインコードベクトルを表すインデクスを出力端子5
080に出力する。
【0059】
【発明の効果】以上説明したように、本発明によれば、
伝送するビット数を増やすことなしに、予め定められた
モードにおいて複数のコードブックを切り替えることに
より、数倍のサイズのコードブックを有することと等し
い機能を有するため、音質の改善が可能となるという効
果がある。
【図面の簡単な説明】
【図1】本発明による音声符号化装置の一実施例を示す
ブロック図である。
【図2】図1に示すゲイン量子化回路の一例を示すブロ
ック図である。
【図3】図1に示すゲイン量子化回路の他の例を示すブ
ロック図である。
【図4】図1に示すゲイン量子化回路のさらに他の例を
示すブロック図である。
【図5】図1に示すゲイン量子化回路の別の例を示すブ
ロック図である。
【図6】本発明による音声符号化装置の他の一実施例を
示すブロック図である。
【図7】図6に示すゲイン量子化回路の一例を示すブロ
ック図である。
【符号の説明】
110 フレーム分割回路 120 サブフレーム分割回路 200 スペクトルパラメータ計算回路 210 スペクトルパラメータ量子化回路 211 LSPコードブック 230 重み付け回路 235 減算回路 240 応答信号計算回路 250 モード判別回路 310 インパルス応答計算回路 350 音源量子化回路 351 不均一パルス数型スパース音源コードブック 360 重み付け信号計算回路 365,9365 ゲイン量子化回路 371,372,9371,9372,9373 ゲイ
ンコードブック 400 マルチプレクサ 500 適応コードブック回路

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を予め定めたフレーム単位に区
    切るフレーム分割部と、前記フレーム単位毎に前記音声
    信号から少なくとも1種類の第1の特徴量を計算しモー
    ド判別を行なうモード判別部と、前記モード判別結果に
    応じて前記音声信号の符号化処理を行う符号化部とを有
    する音声符号化装置において、前記モード判別部で予め
    定められたモードが選択されると前記音声信号から求め
    られた少なくとも1種類の第2の特徴量に応じて予め格
    納された複数の符号帳を切替制御する符号帳切替部を有
    することを特徴とする音声符号化装置。
  2. 【請求項2】 請求項1に記載された音声符号化装置に
    おいて、前記第2の特徴量には、少なくとも1種類以上
    の特徴量の時間変化比が特徴量として含まれていること
    を特徴とする音声符号化装置。
  3. 【請求項3】 請求項1に記載された音声符号化装置に
    おいて、前記第2の特徴量には、現フレーム又は過去の
    少なくとも1つ以上のフレームのいずれかの2フレーム
    分のそれぞれの特徴量に対して、前記2つの特徴量の比
    が特徴量として含まれていることを特徴とする音声符号
    化装置。
  4. 【請求項4】 請求項1乃至3のいずれかに記載された
    音声符号化装置において、前記第2の特徴量には、ピッ
    チ予測ゲイン、短期予測ゲイン、レベル、及びピッチの
    少なくとも1種が特徴量として含まれていることを特徴
    とする音声符号化装置。
  5. 【請求項5】 請求項1乃至3のいずれかに記載された
    音声符号化装置において、前記複数の符号帳は、複数の
    RMSコードブック、複数のLSPコードブック、複数
    の適応コードブック、複数の音源コードブック、及び複
    数のゲインコードブックのいずれかを備えているいるこ
    とを特徴とする音声符号化装置。
JP19217695A 1995-07-27 1995-07-27 音声符号化装置 Expired - Fee Related JP3616432B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP19217695A JP3616432B2 (ja) 1995-07-27 1995-07-27 音声符号化装置
CA002182159A CA2182159C (en) 1995-07-27 1996-07-26 Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
EP96112150A EP0756268B1 (en) 1995-07-27 1996-07-26 Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits
DE69630177T DE69630177T2 (de) 1995-07-27 1996-07-26 Sprachkodierer mit der Fähigkeit zur wesentlichen Vergrösserung der Codebuchgrösse ohne aber die Zahl der übertragenen Bits zu vergrössern
US08/686,582 US6006178A (en) 1995-07-27 1996-07-26 Speech encoder capable of substantially increasing a codebook size without increasing the number of transmitted bits

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19217695A JP3616432B2 (ja) 1995-07-27 1995-07-27 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH0944195A true JPH0944195A (ja) 1997-02-14
JP3616432B2 JP3616432B2 (ja) 2005-02-02

Family

ID=16286951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19217695A Expired - Fee Related JP3616432B2 (ja) 1995-07-27 1995-07-27 音声符号化装置

Country Status (5)

Country Link
US (1) US6006178A (ja)
EP (1) EP0756268B1 (ja)
JP (1) JP3616432B2 (ja)
CA (1) CA2182159C (ja)
DE (1) DE69630177T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000003385A1 (fr) * 1998-07-13 2000-01-20 Nec Corporation Codeur/decodeur vocal
WO2002045078A1 (en) * 2000-11-30 2002-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoder and audio decoding method

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4464488B2 (ja) * 1999-06-30 2010-05-19 パナソニック株式会社 音声復号化装置及び符号誤り補償方法、音声復号化方法
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US7127390B1 (en) * 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
CN1653515A (zh) * 2002-05-13 2005-08-10 迈恩斯比德技术股份有限公司 在分组网络环境中的语音传输编码
EP2224432B1 (en) * 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder, and encoding method
CA2759914A1 (en) * 2009-05-29 2010-12-02 Nippon Telegraph And Telephone Corporation Encoding device, decoding device, encoding method, decoding method and program therefor
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
CN105096958B (zh) * 2014-04-29 2017-04-12 华为技术有限公司 音频编码方法及相关装置
CN106683681B (zh) * 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
CN111226278B (zh) * 2017-08-17 2023-08-25 塞伦妮经营公司 低复杂度的浊音语音检测和基音估计

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612098A (ja) * 1992-03-16 1994-01-21 Sanyo Electric Co Ltd 音声符号化装置
JPH06138898A (ja) * 1992-10-30 1994-05-20 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH06274199A (ja) * 1993-03-22 1994-09-30 Olympus Optical Co Ltd 音声符号化装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
JP3114197B2 (ja) * 1990-11-02 2000-12-04 日本電気株式会社 音声パラメータ符号化方法
JP3151874B2 (ja) 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
JP3143956B2 (ja) 1991-06-27 2001-03-07 日本電気株式会社 音声パラメータ符号化方式
US5657418A (en) * 1991-09-05 1997-08-12 Motorola, Inc. Provision of speech coder gain information using multiple coding modes
WO1993005502A1 (en) * 1991-09-05 1993-03-18 Motorola, Inc. Error protection for multimode speech coders
JP3089769B2 (ja) * 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
US5526464A (en) * 1993-04-29 1996-06-11 Northern Telecom Limited Reducing search complexity for code-excited linear prediction (CELP) coding
US5659659A (en) * 1993-07-26 1997-08-19 Alaris, Inc. Speech compressor using trellis encoding and linear prediction
CA2137756C (en) * 1993-12-10 2000-02-01 Kazunori Ozawa Voice coder and a method for searching codebooks
JP2979943B2 (ja) * 1993-12-14 1999-11-22 日本電気株式会社 音声符号化装置
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5602961A (en) * 1994-05-31 1997-02-11 Alaris, Inc. Method and apparatus for speech compression using multi-mode code excited linear predictive coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612098A (ja) * 1992-03-16 1994-01-21 Sanyo Electric Co Ltd 音声符号化装置
JPH06138898A (ja) * 1992-10-30 1994-05-20 Matsushita Electric Ind Co Ltd 音声符号化装置
JPH06274199A (ja) * 1993-03-22 1994-09-30 Olympus Optical Co Ltd 音声符号化装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000003385A1 (fr) * 1998-07-13 2000-01-20 Nec Corporation Codeur/decodeur vocal
US6856955B1 (en) 1998-07-13 2005-02-15 Nec Corporation Voice encoding/decoding device
WO2002045078A1 (en) * 2000-11-30 2002-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoder and audio decoding method
US7478042B2 (en) 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions

Also Published As

Publication number Publication date
JP3616432B2 (ja) 2005-02-02
EP0756268B1 (en) 2003-10-01
CA2182159C (en) 2002-06-18
CA2182159A1 (en) 1997-01-28
US6006178A (en) 1999-12-21
DE69630177D1 (de) 2003-11-06
EP0756268A3 (en) 1998-05-27
EP0756268A2 (en) 1997-01-29
DE69630177T2 (de) 2004-05-19

Similar Documents

Publication Publication Date Title
JP2746039B2 (ja) 音声符号化方式
JP3094908B2 (ja) 音声符号化装置
JP3196595B2 (ja) 音声符号化装置
JPH0353300A (ja) 音声符号化装置
JP3616432B2 (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2000163096A (ja) 音声符号化方法及び音声符号化装置
JP3308764B2 (ja) 音声符号化装置
JP3179291B2 (ja) 音声符号化装置
JP3303580B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3144284B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3192051B2 (ja) 音声符号化装置
JP3047761B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JPH08320700A (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JP2907019B2 (ja) 音声符号化装置
JP3144244B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20011107

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041105

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071112

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101112

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111112

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111112

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121112

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131112

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees