JP3496618B2 - 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 - Google Patents

複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法

Info

Publication number
JP3496618B2
JP3496618B2 JP2000074515A JP2000074515A JP3496618B2 JP 3496618 B2 JP3496618 B2 JP 3496618B2 JP 2000074515 A JP2000074515 A JP 2000074515A JP 2000074515 A JP2000074515 A JP 2000074515A JP 3496618 B2 JP3496618 B2 JP 3496618B2
Authority
JP
Japan
Prior art keywords
power
amount
representing
voice
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000074515A
Other languages
English (en)
Other versions
JP2001265390A (ja
Inventor
芹沢  昌宏
伊藤  博紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2000074515A priority Critical patent/JP3496618B2/ja
Publication of JP2001265390A publication Critical patent/JP2001265390A/ja
Application granted granted Critical
Publication of JP3496618B2 publication Critical patent/JP3496618B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号等のデジ
タル情報を符号化・復号する装置に関し、特に無音声部
の符号化・復号に関するものである。
【0002】
【従来の技術】この種の音声符号化・復号に関する従来
装置は、音声がない区間(無音声部)を、音声部の符号化
に比べて非常に低いビットレートで符号化することによ
り、伝送する平均ビットレートを低減することを目的と
して用いられている。例えば、「IEEE Communications
Magazine, 頁64-73、Sep 1997」(文献1)に記載され
ている装置がある。
【0003】この従来例では、入力信号を予め定めたフ
レーム(10msec)毎に音声部であるか無音声部であるか
を判別し、音声部である場合は、通常の音声符号化方式
(ITU-T勧告G.729)により入力信号を符号化・復号す
る。無音声部の場合、符号化装置では入力信号の特徴パ
ラメータを間欠的に符号化し、復号装置に伝送する。復
号装置では、全てのフレームではなく間欠的に受信した
特徴パラメータの繰り返し及び平滑化により全フレーム
の特徴パラメータを計算し、これらを用いて信号を復号
する。
【0004】音声部か無音声部かの判別方法として、文
献1に記述されているように、フレーム毎に入力信号か
ら計算する信号パワー、低周波数領域に対応する信号パ
ワー、零交差数、及びスペクトル包絡特性を表すフィル
タ係数を用いる方法がある。これらの変量と各々の無音
声部における平均値との差分に基づき、閾値処理により
判別を行なう。
【0005】音声部を符号化する方法としては、例え
ば、「ITU-T勧告G.729、COM15-152 July 1995」(文
献2)に記述されているCELP (Code Excited Linear
Prediction Coding)方式がある。 CELP方式に関して
は、他に「Code-Excited Linear Prediction : Hig
h Quality Speech at Very Low Bit Rates (IE
EE Proc. ICASSP-85、 pp.937- 940、1985)」(文献
3)に記載されている。従来装置の符号化処理では、入力
信号を予め定めたフレーム毎に線形予測分析して、音声
信号のスペクトル包絡特性を表す線形予測(LP)係数を算
出し、そのスペクトル包絡特性に対応するLP合成フィル
タを駆動して励振信号を算出し、各々符号化する。励振
信号の符号化は、フレームを更にサブフレームに分割し
てサブフレーム毎に行う。ここで、励振信号は、入力信
号のピッチ周期を表す周期成分とその残差成分及びそれ
らのゲインにより構成される。入力信号のピッチ周期を
表す周期成分は、適応コードブックと呼ばれる過去の励
振信号を保持するコードブックに格納された適応コード
ベクトルとして表され、前記残差成分は、複数のパルス
からなるマルチパルス信号として表される。また、復号
処理では、復号した前記ピッチ周期成分と前記残差信号
から得た励振信号を、復号した前記フィルタ係数で構成
する合成フィルタに入力して音声信号を復号する。
【0006】無音声部を符号化する方法としては、例え
ば、文献1に記述されているように、入力信号の特徴パ
ラメータとして信号パワーを表す二乗平均平方根(Root
Mean Square;RMS)とスペクトル特性を表すフィル
タ係数を符号化する方法がある。復号は、乱数信号と乱
数的に生成したパルス性信号との線形和を前記RMSで調
整し、これを前記フィルタ係数を用いて構成した合成フ
ィルタに入力することにより行なう。前記特徴パラメー
タは、無音声部で信号の性質が変化したフレームでのみ
伝送し、それ以外のフレームでは何も伝送しない。この
何も伝送しないフレームでは、過去の伝送された特徴パ
ラメータを繰り返し使用する。但し、波形上での不連続
が生じないように、RMSには平滑化処理を施す。
【0007】図4、5及び6を参照して従来装置を説明す
る。図4は従来の符号化・復号装置を説明するブロック
図である。
【0008】符号化側における動作を説明する。入力端
子51は、入力信号を一定フレーム単位、例えば10msec単
位で入力する。音声検出回路53は、入力端子51からの入
力信号を用いて前記フレームに含まれる信号が音声部か
無音声部かの判定を前述のように行ない、検出結果(VA
D_flag)を切り替え回路52と56及び無音声部符号化回路
54に渡す。切り替え回路52は、入力端子51から渡された
フレーム単位の入力信号を、音声検出回路53から渡され
るVAD_flagが音声部を示す場合は音声部符号化回路55に
渡す。また、VAD_flagが無音声部を示す場合は無音声部
符号化回路54に渡す。
【0009】音声部符号化回路55は、切り替え回路52か
らの入力信号、即ち、入力信号の音声部をフレーム毎に
前述のように符号化し、得た量子化符号列を切り替え回
路56に渡す。無音声部符号化回路54は、切り替え回路52
からの入力信号、即ち、入力信号の無音声部をフレーム
毎に前述のように符号化し、得た量子化符号列を切り替
え回路56に渡す。また、無音声部符号化回路54は、無音
声部において前記量子化符号列を伝送するか否かの判定
を前記特徴パラメータであるRMSとスペクトル特性を表
すフィルタ係数の時間変化に基づき行ない、その判定情
報(TX_flag)をビット列生成回路57に渡す。
【0010】この判定処理では例えば、現フレームまで
の各フレームで計算したRMSを過去数フレームに渡り平
均化した値と最近伝送したRMSとの差分が予め定めた閾
値と比較する。スペクトル特性を表すフィルタ係数に関
しても同様に差分と閾値を比較し、いずれかの差分がそ
の閾値を超える場合は前記量子化符号列を伝送する。い
ずれもその閾値を越えない場合は何も伝送しない。
【0011】切り替え回路56は、音声検出回路53から渡
されるVAD_flagで入力信号が音声部とされた場合は音声
部符号化回路55から渡された量子化符号列を、VAD_flag
で、入力信号が無音声部とされた場合は無音声符号化回
路54から渡された量子化符号列をビット列生成回路57に
渡す。ビット列生成回路57は、無音声部音声検出回路53
から渡されるTX_flagと切り替え回路56から渡される量
子化符号列とからビット列を生成し、出力端子64から出
力する。
【0012】次に復号側における動作を説明する。ビッ
ト列分解回路58は、入力端子65から入力したビット列を
TX_flagと量子化符号列に分解し、前記VAD_flagと前記
量子化符号列を切り替え回路59に渡し、前記TX_flagを
無音声部復号回路60と切り替え回路62に渡す。切り替え
回路59は、ビット列分解回路59から渡された量子化符号
列を、ビット列分解回路58から渡されたTX_flagで入力
信号が音声部とされた場合は音声部復号回路61に渡し、
無音声部とされた場合は無音声部復号回路60に渡す。
【0013】音声部復号回路60は、ビット列分解回路58
から渡されたTX_flagと切り替え回路59から渡された量
子化符号列を用いて無音声部の信号を復号し、切り替え
回路62に渡す。切り替え回路62はビット列分解回路58か
ら渡されたTX_flagに従い、音声部復号回路61あるいは
無音声部復号回路60から渡された復号信号を出力端子63
から出力する。
【0014】以上の音声符号化装置及び復号装置が最近
もっとも使用されているのが、携帯電話システムであ
り、これらの装置は基地局及び通信端末に備えられてい
る。
【0015】図5は従来の符号化・復号装置における無
音声部符号化回路54を説明するブロック図である。入力
端子10は、入力信号をフレーム単位で入力し、LP分析回
路11とパワー計算回路15に渡す。LP分析回路11は、入力
端子10から渡された入力信号を一定区間蓄積し、予め定
めた単位(フレーム)毎に線形予測(LP)分析する。また、
LP分析で得た線形予測(LP)係数をLPC-LSP変換回路12に
渡す。LPC-LSP変換回路12は、LP分析回路11から渡され
たLP係数を線スペクトル対(LSP)に変換し、LSP平滑化回
路13に渡す。LSP平滑化回路13は、LPC-LSP平滑化回路13
から渡されたLSPを平滑化し、変化検出回路24とLSP量子
化回路17に渡す。平滑化は、現フレームと過去の複数フ
レームにおいてLPC-LSP変換回路12で計算されたLSPの平
均値を用いることができるが、この平滑化を行なわず現
フレームの値を直接用いることもできる。LSP量子化回
路17は、LSP平滑化回路13から渡された平滑化LSPを量子
化し、その量子化符号をビット列生成回路19に渡す。量
子化に関しては、文献2に記載されているベクトル量子
化が適用できる。
【0016】パワー計算回路15は、入力端子10から渡さ
れた入力信号を一定区間蓄積し、フレーム毎に入力信号
のRMSを計算する。パワー平滑化回路16は、パワー計算
回路15から渡されたRMSを平滑化し、パワー量子化回路1
8に渡す。平滑化は、LSPと同様に、現フレームと過去の
複数フレームにおいてパワー計算回路15で計算されたパ
ワーの平均値を用いることができるが、この平滑化を行
なわず現フレームの値を直接用いることもできる。パワ
ー量子化回路18は、パワー平滑化回路16から渡された平
滑化パワーあるいは平滑化RMSを量子化し、その量子化
符号をビット列生成回路19に渡す。量子化は、μ-law量
子化等のスカラー量子化が適用できる。
【0017】ビット列生成回路19はLSP量子化回路17と
パワー量子化回路18から各々渡される量子化符号からビ
ット列を生成し、切り替え回路23に渡す。入力端子14は
VAD_flagを入力し変化検出回路24に渡す。変化検出回路
24は、入力端子14から渡されたVAD_flagが無音声部を示
す場合は、LSP平滑化回路13とパワー平滑化回路16から
各々平滑化値を受け取り、平滑化値の量子化符号を伝送
するか否かを検出する。
【0018】この検出処理では、平滑化値の時間変化が
予め定めた値より大きい場合には量子化符号を伝送する
と判定を行なう。また、変化検出回路24は、判定結果を
TX_flagとして出力端子21と切り替え回路23に渡す。切
り替え回路23は、変化検出回路14の判定結果が伝送する
ことを示す場合は、ビット列生成回路19から渡される量
子化符号を無音情報(SID)として出力端子22に渡し、そ
うでない場合は何も出力しない。出力端子22は切り替え
回路23から渡された量子化符号を出力する。
【0019】図6は、従来の符号化・復号装置における
無音声復号回路60を説明するブロック図である。入力端
子30はSIDを入力し、切り替え回路49に渡す。入力端子3
1はTX_flagを入力し、切り替え回路49とLSP平滑化回路3
5とパワー平滑化回路39に渡す。切り替え回路49は入力
端子31から渡されたTX_flagが伝送することを示す場合
は入力端子30から入力したSIDをビット列分解回路33に
渡す。TX_flagが無伝送をを示す場合は何も出力しな
い。ビット列分解回路33は、切り替え回路49から渡され
たSIDからLSPの量子化符号をLSP復号回路34に渡し、RMS
の量子化符号をパワー復号回路38に渡す。
【0020】LSP復号回路34はビット列分解回路33から
渡されたLSPの量子化符号からLSPを復号し、LSP平滑化
回路35に渡す。LSP平滑化回路35は、入力端子31から渡
されたTX_flagに従い、LSP復号回路34から渡されたLSP
を平滑化し、LSP補間回路36に渡す。但し、入力端子31
から渡されたTX_flagが量子化符号を伝送しないことを
示す場合は、前フレームでLSP復号回路34から渡されたL
SPを用いて平滑化を行なう。LSP-LPC変換回路37はLSP補
間回路36から渡された平滑化LSPをLP係数に変換し、合
成フィルタ回路47に渡す。
【0021】パワー復号回路38はビット列分解回路33か
ら渡されたパワーの量子化符号からパワーを復号し、平
滑化回路39に渡す。平滑化回路39は、入力端子31から渡
されたTX_flagに従い、パワー復号回路38から渡された
パワーを平滑化し、ゲイン計算回路40に渡す。但し、入
力端子50から入力されたDTX判定符号で量子化符号列が
伝送されないことが示された場合は、前フレームのRMS
を用いて平滑化を行なう。ゲイン計算回路40はパワー平
滑化回路39から渡された平滑化パワーからパルス信号と
乱数信号に積算するパルスゲインと乱数ゲインを計算
し、各々ゲイン回路44と45に渡す。
【0022】乱数系列発生回路41は、マルチパルスと乱
数を生成するための乱数系列を生成し、マルチパルス生
成回路43と乱数生成回路42に渡す。マルチパルス生成回
路43は、フレームを更に分割したサブフレーム(例えば5
msec長)毎に、乱数系列発生回路41から渡された乱数系
列に基づき各々生成した位置と振幅を有するパルス信号
を生成し、ゲイン回路44に渡す。ゲイン回路44は、マル
チパルス生成回路43から渡されたパルス信号に、ゲイン
計算回路40から渡されたパルスゲインを積算し、加算回
路46に渡す。
【0023】乱数生成回路42は、乱数系列発生回路41か
ら渡された乱数系列に基づき乱数信号を生成し、ゲイン
回路45に渡す。ゲイン回路45は乱数生成回路42から渡さ
れた乱数信号に、ゲイン計算回路40から渡された乱数ゲ
インを積算し、加算回路46に渡す。
【0024】加算回路46は、マルチパルス生成回路43か
ら渡されたゲイン積算済のパルス信号と乱数生成回路42
から渡されたゲイン積算済の乱数信号を加算することに
より合成フィルタの励振信号を生成し、合成フィルタ回
路47に渡す。パルスゲインと乱数ゲインは、例えば、文
献1に記載された様に、励振信号のRMSが前記平滑化RMS
と同一になるように計算できる。合成フィルタ回路47
は、加算回路46から渡される励振信号を、LSP-LPC変換
回路37から渡されるLP係数で構成するフィルタに入力す
ることにより、信号を復号し、出力端子48から出力す
る。
【0025】
【発明が解決しようとする課題】問題点は、無音声部の
符号化・復号装置において、更新が不必要な伝送パラメ
ータを伝送することである。その結果、平均伝送ビット
レートが高くなる。その理由は、特徴パラメータである
RMSとLSPの両方を、いずれか一方の時間変化が検出され
た場合に伝送するためである。
【0026】本発明の目的は、上記問題に関して、無音
声部の平均伝送ビットレートを削減することにより、従
来の音声通信システムに比べてより低い平均伝送ビット
レートのシステムを実現することにある。
【0027】
【課題を解決するための手段】本発明による第1の符号
化装置は、各フレームにおいて入力信号が音声部である
か無音声部であるかの判別をする手段(図1の53)と、そ
の判定結果に従い前記入力信号の特徴パラメータから信
号を復号する方法を切り替える手段(図1の52と56)と、
前記無音声部で前記特徴パラメータのいずれに関する符
号を伝送するかあるいは何も伝送しないかを各フレーム
で切り替える手段(図1の70)を有することを特徴とする
【0028】本発明による第2の符号化装置は、第1の符
号化装置に加えて、前記特徴パラメータとして前記入力
信号に対応するスペクトル包絡を表す量とパワーを表す
量の少なくとも一つを符号化する手段(図2の17と18)を
有することを特徴とする。
【0029】本発明による第3の符号化装置は、第1及び
第2の符号化装置に加えて、前記特徴パラメータのいず
れを伝送するかの判定を前記各特徴パラメータの時間変
化量に基づき行なう手段(図2の25)を有することを特徴
とする。
【0030】本発明による第4の符号化装置は、第1及び
第2の符号化装置に加えて、前記スペクトル包絡を表す
量の時間変化量が予め定めた条件を満たす場合は前記ス
ペクトル包絡を表す量と前記パワーを表す量の両者を伝
送する手段(図2の17、18、19及び20)、前記パワーを表
す量の時間変化量が予め定めた条件を満たす場合は前記
パワーを表す量のみを伝送する手段(図2の18と20)を有
することを特徴とする。
【0031】本発明による第1の復号装置は、各フレー
ムにおいて復号信号が音声部であるか無音声部であるか
の判別結果を受信する手段(図1の58)と、その判別結果
に従い前記復号信号の特徴パラメータから信号を復号す
る方法を切り替える手段(図1の59と62)と、前記無音声
部では前記特徴パラメータのいずれかに関する符号を用
いて復号するかあるいは過去に受信した符号を用いて復
号するかを各フレームで切り替える手段(図1の71)を有
することを特徴とする。
【0032】本発明による第2の復号装置は、第1の復号
装置に加えて、前記特徴パラメータとして前記入力信号
に対応するスペクトル包絡を表す量とパワーを表す量の
少なくとも一つを復号する手段(図3の34と38)を有する
ことを特徴とする。
【0033】本発明による第3の復号装置は、第1及び第
2の復号装置に加えて、前記スペクトル包絡を表す量と
前記パワーを表す量の両者を受信し、復号する手段(図3
の32、33、34及び38)と、前記パワーを表す量のみを受
信し、復号する手段(図3の32と38)を有することを特徴
とする。
【0034】本発明による符号化・復号装置は、第1、
第2、第3あるいは第4の符号化装置と第5、第6あるいは
第7の復号装置を有することを特徴とする。
【0035】
【作用】無音声部の符号化・復号装置において、変化し
たと判定された特徴パラメータのみを伝送する。これに
より、不必要な特徴パラメータの伝送を避けることがで
き、その結果、平均伝送ビットレートを低減できる。
【0036】
【発明の実施の形態】図1、2及び3を参照して本発明に
基づく符号化・復号装置の実施例を説明する。
【0037】図1は本発明の符号化・復号装置を説明す
るブロック図である。図4に示す従来の符号化・復号装
置と異なるのは、無音声部符号化回路54と無音声部復号
回路60が各々無音声部符号化回路70と無音声部復号回路
71になった点のみである。従って、他回路に関する説明
は省略する。
【0038】無音声部符号化回路70は、入力端子51から
の入力信号をフレーム毎に符号化し、得た量子化符号列
を切り替え回路56に渡す。また、無音声部においてどの
特徴パラメータに対応する量子化符号列を伝送するか、
あるいは伝送しないかの判定情報(TX_flag)をビット
列生成回路57に渡す。音声部復号回路71は、ビット列分
解回路58から渡されたTX_flagと切り替え回路59から渡
された量子化符号列を用いて無音声部の信号を復号し、
切り替え回路62に渡す。
【0039】次に、図2を用いて実施例の無音声部符号
化回路70を説明する。図5に示す従来の無音声部符号化
回路54と異なるのは、変化検出回路24と切り替え回路23
が各々変化検出回路25と切り替え回路20になった点のみ
である。従って、他回路に関する説明を省略する。
【0040】変化検出回路25では例えば、現フレームま
での各フレームで計算したRMSを過去数フレームに渡り
平均化した値と最近伝送したRMSとの差分が予め定めた
閾値と比較する。LSPに関しても同様に差分とその閾値
とを比較する。LSPの変化がその閾値を越える場合はLSP
とRMSの量子化符号列を伝送するという判定結果(TX_fla
g;HR-SID)を切り替え回路20と出力端子21に渡す。ま
た、RMSの変化のみがその閾値を越える場合はRMSの量子
化符号を伝送するという判定結果(LR-SID)を渡す。い
ずれもその閾値を越えない場合は何も伝送しないという
判定結果を渡す。音声でスペクトル特性を表すLSPが変
化する場合はRMSも変化する可能性が高いことと、RMSの
情報量がLSPに比べて少ないことを考慮すると頻度の少
ないと考えられるLSPのみ伝送する場合を外すことによ
り、上記3通りを採用しているが、LSPのみを伝送する場
合を含めた4通りにすることも可能である。
【0041】切り替え回路20は、出力端子22に対して、
変化検出回路25から渡されたTX_flagがLSPとRMSの両方
の量子化符号が伝送されたことを示す場合はビット列生
成回路19から渡されたSID (HR-SID)を渡し、RMSのみの
量子化符号が伝送されたことを示す場合は入力端子から
渡されたSID(LR-SID)を渡す。そうでない場合は出力
端子22に何も渡さない。
【0042】最後に、図3を用いて実施例の無音声部復
号回路71を説明する。図6に示す従来の無音声部復号回
路60と異なるには、切り替え回路49が切り替え回路32に
変わった点とパワー復号回路38が切り替え回路32から量
子化符号を直接渡される場合がある点のみである。従っ
て、他回路に関する説明を省略する。
【0043】切り替え回路32は、入力端子31から渡され
たTX_flagがLSPとRMSの両方の量子化符号が伝送された
ことを示す場合(HR-SID)は入力端子30から渡されたSID
をビット列分解回路33に渡し、RMSのみの量子化符号が
伝送されたことを示す場合(LR-SID)は入力端子から渡
されたSIDをパワー復号回路に渡す。そうでない場合は
何も出力しない。
【0044】図7は、本発明をコンピュータを用いて実
現した実施形態を示す図である。同図には、音声符号化
復号化装置A,Bが通信回線を介して接続された様子を
示している。
【0045】音声符号化復号化装置A,Bは、同一構成
であるので、音声符号化装置Aについてのみ説明する。
音声符号化復号化装置装置Aは、音声信号を入力するた
めのマイクロフォン(MIC)と、音声符号化復号化装
置装置Bからの符号列を復号し、再生音声を出力するス
ピーカと、音声符号化復号化装置の本体であるCPU
と、CPUを音声符号化復号化装置本体として動作させ
るためのプログラムを格納した記録媒体とから構成され
る。記録媒体からプログラムをダウンロードすることに
より、既に説明した各実施形態と同様の動作を、CPU
は実行する。なお、記録媒体に格納されているプログラ
ムの構成は、既述の実施形態の説明から、当業者には明
かであるので、重複した説明は省略する。
【0046】
【発明の効果】本発明の効果は、無音声部の符号化・復
号装置において、平均伝送ビットレートを低減できるこ
とである。その理由は、変化したと判定された特徴パラ
メータのみを伝送するためである。
【図面の簡単な説明】
【図1】本発明の実施例による符号化・復号装置の構成
例を説明するブロック図である。
【図2】第1の実施例における無音声部符号化回路の構
成例を説明するブロック図である。
【図3】第1の実施例における無音声部復号回路の構成
例を説明するブロック図である。
【図4】従来の符号化・復号装置の構成例を説明するブ
ロック図である。
【図5】図4の無音声部符号化回路の構成例を説明する
ブロック図である。
【図6】図4の無音声部復号回路の構成例を説明するブ
ロック図である。
【図7】本発明をコンピュータを用いて実現した実施形
態を示す図である。
【符号の説明】
10、14、30、31、51、65 入力端子 11 LP分析回路 12 LPC-LSP変換回路 13 LSP平滑化回路 15 パワー計算回路 16 パワー平滑化回路 17 LSP量子化回路 18 パワー量子化回路 19、57 ビットレート生成回路 21、22、48、63、64 出力端子 20、23、32、49、52、56、59、62 切り替え回路 24、25 変化検出回路 33、58 ビット列分解回路 34 LSP復号回路 35 LSP平滑化回路 36 LSP補間回路 37 LSP-LPC変換回路 38 パワー復号回路 39 パワー平滑化回路 40 ゲイン計算回路 41 乱数系列発生回路 42 乱数生成回路 43 マルチパルス生成回路 44、45 ゲイン回路 46 加算回路 47 合成フィルタ回路 53 音声検出回路 54、70 無音声部符号化回路 55 音声部符号化回路 60、71 無音声部復号回路 61 音声部復号回路
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI G10L 9/00 N 9/14 J (56)参考文献 特開 平9−149104(JP,A) 特開 平1−165235(JP,A) 特開 平5−83285(JP,A) 松尾直樹,他,音声パケット通信にお ける無音区間再生法,昭和63年電子情報 通信学会秋季全国大会講演論文集,1988 年 8月15日,B−252,p.B−2− 130 由比藤光宏,他,音声パケット通信に おけるホス雑音挿入方式の一検討,1990 年電子情報通信学会春季全国大会講演論 文集,1990年 3月 5日,B−563, p.3−141 Masahiro Serizaw a, et al,A Silence Compression Algor ithm for Multi−Rat e/Dual−Bandwidth M PEG−4 CELP Standar d,Proc.2000 IEEE Int ernational Confere nce on Acoustics,S peech, and Signal Process, ICASSP’00, 2000年 6月,p.1173−1176 Masarhiro Serizaw a, et al,A Silence Compression Algor ithm for Multi−Rat e Dual−Bandwidth M PEG−4 CELP Standar d,Trans.IEICE on I nformation and Sys tems,2003年 3月,Vol.E86 −D, No3,p.412−417 (58)調査した分野(Int.Cl.7,DB名) G10L 11/02 G10L 19/00 G10L 19/04 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (17)

    (57)【特許請求の範囲】
  1. 【請求項1】各フレームにおいて入力信号が音声部であ
    るか無音声部であるかの判別に従い前記入力信号に対応
    するスペクトル包絡を表す量とパワーを表す量を少なく
    とも含む特徴パラメータを符号化する方法を切り替える
    音声符号化装置において、 前記無音声部で、前記パワーを表す量に関する符号を伝
    送するか、または、前記パワーを表す量に関する符号と
    前記スペクトル包絡を表す量に関する符号を伝送する
    か、あるいは、何も伝送しないかを各フレームで切り替
    えることを特徴とする音声符号化装置。
  2. 【請求項2】前記無音声部で、前記パワーを表す量に関
    する符号を伝送するか、または、前記パワーを表す量に
    関する符号と前記スペクトル包絡を表す量に関する符号
    を伝送するか、あるいは、何も伝送しないかの判定を
    前記各特徴パラメータの時間変化量に基づき行なうこと
    を特徴とする請求項1に記載の音声符号化装置。
  3. 【請求項3】前記スペクトル包絡を表す量の時間変化量
    が予め定めた条件を満たす場合は前記スペクトル包絡を
    表す量と前記パワーを表す量の両者を伝送し、前記パワ
    ーを表す量の時間変化量が予め定めた条件を満たす場合
    は前記パワーを表す量のみを伝送することを特徴とする
    請求項1に記載の音声符号化装置。
  4. 【請求項4】各フレームにおいて復号信号が音声部であ
    るか無音声部であるかの判別に従い前記復号信号に対応
    するスペクトル包絡を表す量とパワーを表す量を少なく
    とも含む特徴パラメータから前記復号信号を復号化する
    方法を切り替える音声復号装置において、 前記無音声部で、前記パワーを表す量に関する符号を用
    いて復号化するか、または、前記パワーを表す量に関す
    る符号と前記スペクトル包絡を表す量に関する符号を用
    いて復号化するか、あるいは、過去に受信した符号を用
    いて復号化するかを各フレームで切り替えることを特徴
    とする音声復号装置。
  5. 【請求項5】請求項1から3のいずれか一項に記載の音
    声符号化装置と請求項4に記載の音声復号装置を有する
    音声符号化・復号装置。
  6. 【請求項6】各フレームにおいて入力信号が音声部であ
    るか無音声部であるかの判別に従い前記入力信号に対応
    するスペクトル包絡を表す量とパワーを表す量を少なく
    とも含む特徴パラメータを符号化する方法を切り替える
    音声符号化方法において、 前記無音声部で、前記パワーを表す量に関する符号を伝
    送するか、または、前記パワーを表す量に関する符号と
    前記スペクトル包絡を表す量に関する符号を伝送する
    か、あるいは、何も伝送しないかを各フレームで切り替
    えるステップを含むことを特徴とする音声符号化方法。
  7. 【請求項7】前記無音声部で、前記パワーを表す量に関
    する符号を伝送するか、または、前記パワーを表す量に
    関する符号と前記スペクトル包絡を表す量に関する符号
    を伝送するか、あるいは、何も伝送しないかの判定を
    前記各特徴パラメータの時間変化量に基づき行なうこと
    を特徴とする請求項6に記載の音声符号化方法。
  8. 【請求項8】前記スペクトル包絡を表す量の時間変化量
    が予め定めた条件を満たす場合は前記スペクトル包絡を
    表す量と前記パワーを表す量の両者を伝送するステップ
    と、 前記パワーを表す量の時間変化量が予め定めた条件を満
    たす場合は前記パワーを表す量のみを伝送するステップ
    を含むことを特徴とする請求項6に記載の音声符号化方
    法。
  9. 【請求項9】各フレームにおいて復号信号が音声部であ
    るか無音声部であるかの判別に従い前記復号信号に対応
    するスペクトル包絡を表す量とパワーを表す量を少なく
    とも含む特徴パラメータ から前記復号信号を復号化する
    方法を切り替える音声復号方法において、 前記無音声部で、前記パワーを表す量に関する符号を用
    いて復号化するか、または、前記パワーを表す量に関す
    る符号と前記スペクトル包絡を表す量に関する符号を用
    いて復号化するか、あるいは、過去に受信した符号を用
    いて復号化するかを各フレームで切り替えるステップを
    含むことを特徴とする音声復号方法。
  10. 【請求項10】請求項6から8のいずれか一項に記載
    音声符号化方法と請求項9に記載の音声復号方法を有す
    る音声符号化・復号方法
  11. 【請求項11】各フレームにおいて入力信号が音声部で
    あるか無音声部であるかの判別に従い前記入力信号に対
    応するスペクトル包絡を表す量とパワーを表す量を少な
    くとも含む特徴パラメータを符号化する方法を切り替え
    る音声符号化方法において、 前記無音声部で、前記パワーを表す量に関する符号を伝
    送するか、または、前記パワーを表す量に関する符号と
    前記スペクトル包絡を表す量に関する符号を伝送する
    か、あるいは、何も伝送しないかを各フレームで切り替
    えるステップを含むことを特徴とする記録媒体。
  12. 【請求項12】前記無音声部で、前記パワーを表す量に
    関する符号を伝送するか、または、前記パワーを表す量
    に関する符号と前記スペクトル包絡を表す量に関する符
    号を伝送するか、あるいは、何も伝送しないかの判定
    前記各特徴パラメータの時間変化量に基づき行なう
    ことを特徴とする請求項11に記載の記録媒体。
  13. 【請求項13】前記スペクトル包絡を表す量の時間変化
    量が予め定めた条件を満たす場合は前記スペクトル包絡
    を表す量と前記パワーを表す量の両者を伝送するステッ
    プと、 前記パワーを表す量の時間変化量が予め定めた条件を満
    たす場合は前記パワーを表す量のみを伝送するステップ
    を含むことを特徴とする請求項11に記載の記録媒体。
  14. 【請求項14】各フレームにおいて復号信号が音声部で
    あるか無音声部であるかの判別に従い前記復号信号に対
    応するスペクトル包絡を表す量とパワーを表す量を少な
    くとも含む特徴パラメータから前記復号信号を復号化す
    る方法を切り替える音声復号方法において、 前記無音声部で、前記パワーを表す量に関する符号を用
    いて復号化するか、または、前記パワーを表す量に関す
    る符号と前記スペクトル包絡を表す量に関する符号を用
    いて復号化するか、あるいは、過去に受信した符号を用
    いて復号化するかを各フレームで切り替えるステップを
    含むことを特徴とする記録媒体。
  15. 【請求項15】請求項11から13のいずれか一項記載
    の記録媒体と請求項14に記載の記録媒体に記録された
    両方のプログラムを含むことを特徴とする記録媒体。
  16. 【請求項16】請求項1からのいずれかに記載の音声
    符号化装置、音声復号装置、あるいは音声符号化・復号
    装置を備えたことを特徴とする基地局装置。
  17. 【請求項17】請求項1からのいずれかに記載の音声
    符号化装置、音声復号装置、あるいは音声符号化・復号
    装置を備えたことを特徴とする通信端末装置。
JP2000074515A 2000-03-16 2000-03-16 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 Expired - Fee Related JP3496618B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000074515A JP3496618B2 (ja) 2000-03-16 2000-03-16 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000074515A JP3496618B2 (ja) 2000-03-16 2000-03-16 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003319786A Division JP2004078235A (ja) 2003-09-11 2003-09-11 複数レートで動作する無音声符号化を含む音声符号化・復号装置

Publications (2)

Publication Number Publication Date
JP2001265390A JP2001265390A (ja) 2001-09-28
JP3496618B2 true JP3496618B2 (ja) 2004-02-16

Family

ID=18592548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000074515A Expired - Fee Related JP3496618B2 (ja) 2000-03-16 2000-03-16 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法

Country Status (1)

Country Link
JP (1) JP3496618B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4793539B2 (ja) 2005-03-29 2011-10-12 日本電気株式会社 符号変換方法及び装置とプログラム並びにその記憶媒体
JP4978364B2 (ja) * 2007-08-07 2012-07-18 トヨタ自動車株式会社 データ送受信装置
KR101451844B1 (ko) 2013-03-27 2014-10-16 주식회사 시그테크 음성활동감지방법 및 그 방법을 채택한 통신장치
KR101396873B1 (ko) 2013-04-03 2014-05-19 주식회사 크린컴 두 개의 마이크로폰을 포함하는 통신장치에서의 잡음제거방법 및 장치

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Masahiro Serizawa, et al,A Silence Compression Algorithm for Multi−Rate/Dual−Bandwidth MPEG−4 CELP Standard,Proc.2000 IEEE International Conference on Acoustics,Speech, and Signal Process, ICASSP’00,2000年 6月,p.1173−1176
Masarhiro Serizawa, et al,A Silence Compression Algorithm for Multi−Rate Dual−Bandwidth MPEG−4 CELP Standard,Trans.IEICE on Information and Systems,2003年 3月,Vol.E86−D, No3,p.412−417
松尾直樹,他,音声パケット通信における無音区間再生法,昭和63年電子情報通信学会秋季全国大会講演論文集,1988年 8月15日,B−252,p.B−2−130
由比藤光宏,他,音声パケット通信におけるホス雑音挿入方式の一検討,1990年電子情報通信学会春季全国大会講演論文集,1990年 3月 5日,B−563,p.3−141

Also Published As

Publication number Publication date
JP2001265390A (ja) 2001-09-28

Similar Documents

Publication Publication Date Title
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
KR100574031B1 (ko) 음성합성방법및장치그리고음성대역확장방법및장치
US7426465B2 (en) Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality
JP3259759B2 (ja) 音声信号伝送方法及び音声符号復号化システム
EP1096476B1 (en) Speech signal decoding
JPH1097295A (ja) 音響信号符号化方法及び復号化方法
CA2293165A1 (en) Method for transmitting data in wireless speech channels
KR100796836B1 (ko) 코드 변환 방법, 장치 및 이 방법을 실행하는 컴퓨터용 프로그램이 기록된 기록 매체
JP2003249957A (ja) パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP3451998B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
US7584096B2 (en) Method and apparatus for encoding speech
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
US7295974B1 (en) Encoding in speech compression
EP1035538B1 (en) Multimode quantizing of the prediction residual in a speech coder
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JPH0786952A (ja) 音声の予測符号化方法
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JP2004078235A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置
JP3475958B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JPH034300A (ja) 音声符号化復号化方式
JPH01293399A (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JPH01293400A (ja) 音声符号化復号化方法並びに音声符号化装置及び音声復号化装置
JPH0343800A (ja) 音声信号符号化復合化方式
JPH0969000A (ja) 音声パラメータ量子化装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20031028

R150 Certificate of patent or registration of utility model

Ref document number: 3496618

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071128

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081128

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081128

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091128

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091128

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101128

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111128

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121128

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131128

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees