JP3451998B2 - 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 - Google Patents

無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Info

Publication number
JP3451998B2
JP3451998B2 JP29879599A JP29879599A JP3451998B2 JP 3451998 B2 JP3451998 B2 JP 3451998B2 JP 29879599 A JP29879599 A JP 29879599A JP 29879599 A JP29879599 A JP 29879599A JP 3451998 B2 JP3451998 B2 JP 3451998B2
Authority
JP
Japan
Prior art keywords
signal
voice
decoding
section
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP29879599A
Other languages
English (en)
Other versions
JP2001051699A (ja
Inventor
芹沢  昌宏
伊藤  博紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP29879599A priority Critical patent/JP3451998B2/ja
Priority to EP00931614.2A priority patent/EP1199710B1/en
Priority to CA002485547A priority patent/CA2485547A1/en
Priority to CA002373479A priority patent/CA2373479C/en
Priority to PCT/JP2000/003492 priority patent/WO2000074036A1/ja
Priority to US09/980,275 priority patent/US8195469B1/en
Publication of JP2001051699A publication Critical patent/JP2001051699A/ja
Application granted granted Critical
Publication of JP3451998B2 publication Critical patent/JP3451998B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号等のデジ
タル情報を符号化・復号する装置に関し、特に無音声部
の符号化・復号技術に関する。
【0002】
【従来の技術】この種の従来の音声符号化・復号装置
は、音声がない区間(「無音声区間」という)を、音声
区間の符号化に比べて非常に低いビットレートで符号化
することにより、伝送する平均ビットレートを低減する
ものであり、例えば、文献1(IEEE Communications
Magazine, 第64−73頁、Sep、1997)等の記載が参照さ
れる。
【0003】この従来の符号化装置では、入力信号を予
め定めたフレーム(10 msec)毎に音声区間であるか無
音声区間であるかを判別し、音声区間である場合には、
通常の音声符号化方式(ITU−T勧告G.729)により入力
信号を符号化・復号し、一方、無音声区間の場合、符号
化装置では入力信号の特徴パラメータを間欠的に符号化
し、復号装置に伝送する。復号装置では、全てのフレー
ムではなく、間欠的に受信した特徴パラメータの繰り返
しあるいは平滑化を行うことで全フレームの特徴パラメ
ータを計算し、これらを用いて信号を復号する。
【0004】音声区間か無音声区間かを判別する方法と
して、上記文献1記載されているように、フレーム毎に
入力信号から計算する二乗平均平方根(root mean sq
uares;「RMS」という)、低周波数領域に対応するRMS、
零交差数、及びスペクトル包絡特性を表すフィルタ係数
を用いる方法がある。これらの変量と各々の無音声区間
における平均値との差分に基づき、閾値処理により判別
を行なう。
【0005】音声区間を符号化する方法としては、例え
ば、文献2(ITU−T勧告G.729、COM15−152 July 199
5)に記載されているCELP (Code Excited Linear Pr
ediction Coding;符号励振線形予測符号化)方式があ
る。CELP方式については、文献3(Code−Excited Line
ar Prediction : High Quality Speech at Very LowBit
Rates (IEEE Proc. ICASSP−85、 pp.937− 940、198
5) )の記載も参照される。
【0006】従来の装置の符号化処理では、入力信号を
予め定めたフレーム毎に線形予測分析して、音声信号の
スペクトル包絡特性を表す線形予測(フィルタ)係数を算
出し、そのスペクトル包絡特性に対応するLP合成フィ
ルタを駆動して励振信号を算出し、それぞれ符号化す
る。
【0007】励振信号の符号化は、フレームを更にサブ
フレームに分割してサブフレーム毎に行う。ここで、励
振信号は、入力信号のピッチ周期を表す周期成分と残り
の残差成分とそれらのゲインにより構成される。入力信
号のピッチ周期を表す周期成分は、「適応コードブッ
ク」と呼ばれる過去の励振信号を保持するコードブック
に格納された適応コードベクトルとして表され、前記残
差成分は、複数のパルスからなるマルチパルス信号とし
て表される。
【0008】また、復号処理では、復号したピッチ周期
成分と残差信号から得た励振信号を、復号したフィルタ
係数で構成する合成フィルタに入力して音声信号を復号
する。
【0009】無音声区間を符号化する方法として、上記
文献1に記載されているように、まず、符号化装置で、
入力信号の特徴パラメータとしてRMSとスペクトル特性
を表すフィルタ係数を符号化する。
【0010】次に、復号装置では、乱数信号と乱数的に
生成したパルス性信号とピッチ信号の線形和をRMSで調
整し、これをフィルタ係数を用いて構成した合成フィル
タに入力することにより、無音声信号を復号する。
【0011】特徴パラメータは、無音声区間で信号の性
質が変化したフレームでのみ伝送し、それ以外のフレー
ムでは何も伝送しない。但し、特徴パラメータを伝送す
るか否かの情報は別途伝送する。
【0012】この特徴パラメータを何も伝送しないフレ
ームでは、過去の伝送された特徴パラメータを繰り返し
使用する。但し、波形上での不連続が生じないように、
RMSは、平滑化処理を施している。
【0013】図8は、従来の符号化装置の構成を示すブ
ロック図である。図8を参照すると、この符号化装置
は、音声部符号化回路12と、無音声部符号化回路14と、
信号判定回路16と、切り替え回路18と、ビット生成回路
20とを備えている。
【0014】入力端子10は、入力信号を一定フレーム単
位、例えば10msec単位で入力する。信号判定回路16は、
入力端子10からの入力信号を用いてフレームが音声区間
か無音声区間かの判定を行ない、判定結果(VAD判定符
号)を切り替え回路18とビット列生成回路20に渡す。
【0015】音声部符号化回路12は、入力端子10からの
入力信号をフレーム毎に符号化し、信号符号列を切り替
え回路18に渡す。
【0016】無音声部符号化回路14は、入力端子10から
の入力信号をフレーム毎に符号化し、信号符号列を切り
替え回路18に渡す。また、無音声区間において信号符号
列を伝送するか否かの判定情報(DTX判定符号)をビッ
ト生成回路20に渡す。
【0017】切り替え回路18は、信号判定回路16から渡
されるVAD判定符号に基づき、入力信号が音声区間とさ
れた場合には、音声部符号化回路12から渡された信号符
号列を、VAD判定符号で入力信号が無音声区間とされた
場合には、無音声符号化回路14から渡された信号符号列
をビット列生成回路20に渡す。
【0018】ビット列生成回路20は、信号判定回路16か
ら渡されるVAD判定符号と、無音声部符号化回路10から
渡されるDTX判定符号と、切り替え回路18から渡される
信号符号列とを多重して、ビット列を生成し、出力端子
22から出力する。
【0019】図9は、従来の復号装置を説明するブロッ
ク図である。
【0020】図9を参照すると、この復号装置は、ビッ
ト列分解回路26と、切り替え回路28と、音声部復号回路
30と、無音声部復号回路34とを備えて構成される。ビッ
ト列分解回路26は、入力端子24から入力したビット列を
VAD判定符号とDTX判定符号及び信号符号列に分解し、VA
D判定符号と信号符号列を切り替え回路28に渡し、DTX判
定符号を無音声部復号回路34に渡す。
【0021】切り替え回路28は、ビット列分解回路26か
ら渡されたVAD判定符号に基づき、入力信号が音声区間
とされた場合にはビット列分解回路26から渡された信号
符号列を音声部復号回路30に渡し、VAD判定符号で入力
信号が無音声区間とされた場合には無音声部復号回路34
に渡す。
【0022】音声部復号回路30は、切り替え回路28から
渡された信号符号列を用いて信号を復号し、出力端子32
から出力する。
【0023】無音声部復号回路34は、ビット列分解回路
26から渡されたDTX判定符号と切り替え回路28から渡さ
れた信号符号列を用いて、無音声部の信号を復号し、出
力端子32から出力する。
【0024】図10は、従来の復号装置における無音声
復号回路34の構成を示すブロック図である。図10を参
照すると、無音声復号回路34は、パラメータ復号回路54
と、乱数回路56と、パルス回路53と、混合回路61と、平
滑化回路66と、合成回路68とを備えている。
【0025】パラメータ復号回路54は、入力端子52で入
力した信号符号列から求めたフィルタ係数とRMSをそれ
ぞれ合成回路68と平滑化回路66に渡す。
【0026】平滑化回路66は、パラメータ復号回路54か
ら渡されたRMSを平滑化して得た平滑化RMSを、混合回路
61に渡す。但し、入力端子50から入力されたDTX判定符
号で信号符号列が伝送されないことが示された場合に
は、前フレームのRMSを用いて平滑化を行なう。
【0027】各無音声区間中の先頭から数えてnフレー
ム目で使用する平滑化RMS P(n)は、nフレーム目に入力
されたRMS p(n)を用いて次式(1)で計算する。但
し、何も伝送されてこないフレームではp(n)の代わりに
直前に伝送されたRMSを用いて次式(1)を計算する。
【0028】 P(n)=(1−α)・p(n−1)+α・p(n) …(1)
【0029】ここで、αは平滑化の程度を決定する平滑
化係数であり、上記文献1では、固定値0.125を用いて
いる。また、P(−1)=0である。
【0030】乱数回路56は、乱数を生成し、混合回路61
に渡す。パルス回路53は、乱数で各々生成した位置と振
幅を持つパルスから成るパルス列信号を生成し、混合回
路61に渡す。
【0031】ピッチ回路58は、前述の適応コードベクト
ルからなるピッチ信号を生成し、混合回路61に渡す。適
応コードベクトルを規定するピッチ周期は伝送されない
ことから、代わりに乱数信号を用いる。
【0032】混合回路61では、乱数回路56から渡された
乱数信号r(i)と、パルス回路53から渡されたパルス列信
号p(i)と、ピッチ回路58から渡されたピッチ信号q(i)と
線形和処理により、合成フィルタの励振信号x(i)を計
算し、合成回路68に渡す。
【0033】線形和の結合係数を計算する方法として、
例えば、上記文献1に記載された方法が用いられる。
【0034】まず、ピッチ信号の結合係数Gqを制限され
た範囲内の値から乱数で選択する。
【0035】次に、計算したピッチ信号の結合係数Gqを
用いて、ピッチ信号とパルス列信号の線形和から計算し
たRMSが前記平滑化RMSと同一になるように、パルス列信
号の結合係数Gpを計算する。
【0036】以上で計算した結合係数を用いてピッチ信
号とパルス列信号との線形和 e(i)を次式(2)で計算
する。
【0037】e(i) = Gq ・q(i) + Gp・p(i) …(2)
【0038】更に、この線形和 e(i) と乱数信号との
新たな線形和が前記平滑化RMSと同一になるように、
和 e(i) の結合係数Grを計算する。ここで、乱数信
号の結合係数は固定値γ=0.6を用いている。
【0039】従って、合成フィルタの励振信号x(i)は次
式(3)で計算される。
【0040】 x(i) = Gr ・[Gq ・q(i) + Gp・p(i)] + γ・r(i) …(3)
【0041】合成回路68は、混合回路61から渡される励
振信号を、パラメータ復号回路54から渡されるフィルタ
係数で構成するフィルタに入力することにより、信号を
復号し、出力端子70から出力する。
【0042】
【発明が解決しようとする課題】しかしながら、上記し
た従来の装置は下記記載の問題点を有している。
【0043】第1の問題点は、復号装置において、無音
声区間を復号する際に使用するフィルタ係数が不連続に
変化する場合があり、その結果、復号信号の品質が劣化
する、ということである。
【0044】その理由は、間欠的に伝送されるフィルタ
係数をそのまま用いている、ためである。
【0045】第2の問題点は、無音声区間における最初
の区間(例えば数百msec)において直前の有音声区間に
よる影響を受ける場合があり、その結果、復号信号でそ
の振幅が実際より高くなったり、エコーを含むことによ
る復号信号の音質劣化が生じる、ということである。
【0046】その理由は、無音声区間では、無音声区間
における再生信号が不連続にならないように、RMSの平
滑化処理を、常に行なっている、ためである。
【0047】第3の問題点は、無音声区間の復号信号が
入力信号の背景雑音とは聴覚的に著しく異なる場合があ
り、その結果、有音声部に含まれる背景雑音と聴覚的な
不連続が生じる、ということである。
【0048】その理由は、無音声区間において再生フィ
ルタの励振信号を生成する時に、乱数成分に対するパル
ス成分とピッチ成分の比を一定値としている、ためであ
る。
【0049】したがって本発明は、上記問題点に鑑みて
なされたものであって、その主たる目的は、無音声区間
を高性能に符号化することで、無音声部符号化の導入に
より伝送ビットレートの平均値を下げても、高符号化品
質を実現する、装置を提供することにある。
【0050】また本発明の他の目的は、無音声区間復号
時のフィルタ係数の不連続に帰因する復号音質劣化を低
減する復号装置を提供することにある。
【0051】
【課題を解決するための手段】前記目的を達成する第1
の発明は、各フレームにおいて復号信号が音声区間であ
るか無音声区間であるかの判別情報に従い前記復号信号
の特徴パラメータから信号を復号する方法を切り替える
音声復号装置において、前記特徴パラメータの中で前記
復号信号のスペクトル包絡特性を表す特徴パラメータを
時間方向に平滑化した値を用いて復号する手段を備えて
いる。
【0052】第2の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別情報に
従い前記復号信号の特徴パラメータから信号を復号する
方法を切り替える音声復号装置において、音声区間から
無音声区間に切り替わってからの時間経過に応じて、前
記特徴パラメータの少なくとも一つについて時間方向に
平滑化する程度を変更した値を用いて復号する手段を備
える。
【0053】第3の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、音声区間から無音
声区間に切り替わった直後の区間では伝送された特徴パ
ラメータの少なくとも一つを直接使用し、それ以降は、
前記特徴パラメータの内少なくとも一つについて時間方
向に平滑化した値を信号復号で用いて復号する手段を備
える。
【0054】第4の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タの内少なくとも一つに応じて、前記特徴パラメータの
少なくとも一つについて時間方向に平滑化する程度を変
更した値を用いて復号する手段を備える。
【0055】第5の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タの内少なくとも一つ及び音声区間から無音声区間に切
り替わってからの時間経過に応じて、前記特徴パラメー
タの少なくとも一つについて時間方向に平滑化する程度
を変更した値を用いて復号する手段を備える。
【0056】第5の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タが予め定めた条件を満たす区間では伝送された特徴パ
ラメータの内少なくとも一つを直接使用し、それ以降
は、前記特徴パラメータの内少なくとも一つについて時
間方向に平滑化した値を信号復号で用いて復号する手段
を備えたことを特徴とする音声復号装置。
【0057】第6の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、前記特徴パラメー
タの内少なくとも一つ及び音声区間から無音声区間に切
り替わってからの時間経過に応じて、前記特徴パラメー
タの内少なくとも一つについて時間方向に平滑化する程
度を変更した値を用いて復号する手段を備える。
【0058】第7の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別に従い
前記復号信号の特徴パラメータから信号を復号する方法
を切り替える音声復号装置において、音声区間から無音
声区間に切り替わった直後且つ前記特徴パラメータが予
め定めた条件を満たす区間では伝送された特徴パラメー
タの少なくとも一つを直接使用し、それ以降は、前記特
徴パラメータの内少なくとも一つについて時間方向に平
滑化した値を信号復号で用いて復号する手段を備える。
【0059】第8の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別情報に
従い前記復号信号に対応する特徴パラメータから信号を
復号する方法を切り替え、少なくとも一部の区間におい
て、無音声区間の信号を複数種類の信号から成る励振信
号を合成フィルタに入力することにより生成する音声復
号装置において、受信した特徴パラメータの少なくとも
一つに基づき、前記無音声区間における前記複数種類の
信号を加算する際の係数を決定する手段を備える。
【0060】第9の発明は、各フレームにおいて復号信
号が音声区間であるか無音声区間であるかの判別情報に
従い前記復号信号に対応する特徴パラメータから信号を
復号する方法を切り替え、無音声区間の信号を複数種類
の信号から成る励振信号を合成フィルタに入力すること
により生成する音声復号装置において、少なくとも一部
の区間において、受信した特徴パラメータの時間方向に
平滑化した平滑化パラメータの少なくとも一つに基づ
き、前記無音声区間における前記複数種類の信号を加算
する際の係数を決定する。
【0061】第10の発明は、前記第1乃至第9の発明
において、前記特徴パラメータが、前記復号信号に対応
するスペクトル包絡を表す量とパワーを表す量の少なく
とも一つを含む。
【0062】第11の発明は、各フレームにおいて入力
信号が音声区間であるか無音声区間であるかの判別を行
い前記入力信号の特徴パラメータを符号化する符号化装
置と、第1乃至第10のいずれかの音声復号装置とを備
える。
【0063】
【発明の実施の形態】本発明の実施の形態について説明
する。本発明の音声復号装置は、第1の実施の形態にお
いて、各フレームにおいて復号信号が音声区間であるか
無音声区間であるかの判別情報に従い前記復号信号の特
徴パラメータから信号を復号する方法を切り替える手段
(図9の28)と、前記特徴パラメータの中で、前記復号
信号のスペクトル包絡特性を表す特徴パラメータを時間
方向に平滑化する手段(図1の64)と、平滑化した特徴
パラメータを用いて復号処理を行なう手段(図1の56、
53、58、61及び68)とを備えている。
【0064】本発明の音声復号装置は、第2の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号の
特徴パラメータから信号を復号する方法を切り替える手
段(図2の28)と、前記特徴パラメータの内少なくとも
一つ及び音声区間から無音声区間に切り替わってからの
時間経過に応じて、前記特徴パラメータの少なくとも一
つに関して時間方向に平滑化する手段(図2の36、図3
の49と51)と、この平滑化した特徴パラメータを用いて
復号処理を行なう手段(図3の56、53、58、61及び68)
とを備えている。
【0065】本発明の音声復号装置は、第3の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号の
特徴パラメータから信号を復号する方法を切り替える手
段(図2の28)と、音声区間から無音声区間に切り替わ
った直後で前記特徴パラメータが予め定めた条件を満た
す区間では伝送された特徴パラメータの少なくとも一つ
を直接使用し、それ以降は前記特徴パラメータの内少な
くとも一つに関して時間方向に平滑化した値を生成する
手段(図2の36、図3の49と51)、前記平滑化し
た値を用いて復号処理を行なう手段(図3の56、53、5
8、61及び68)とを備えている。
【0066】本発明の音声復号装置は、第4の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号に
対応する特徴パラメータから信号を復号する方法を切り
替える手段(図4の28)と、無音声区間の信号を複数種
類の信号から成る励振信号を合成フィルタに入力するこ
とにより生成する手段(図5の56、53、58、60、68)
と、受信した特徴パラメータの少なくとも一つに基づき
前記無音声区間における前記複数種類の信号を加算する
際の係数を決定する手段(図の38)とを備えている。
【0067】本発明の音声復号装置は、第5の実施の形
態において、各フレームにおいて復号信号が音声区間で
あるか無音声区間であるかの判別に従い前記復号信号に
対応する特徴パラメータから信号を復号する方法を切り
替える手段(図6の28)と、無音声区間の信号を複数種
類の信号から成る励振信号を合成フィルタに入力するこ
とにより生成する手段(図7の56、53、58、60、68)
と、受信した特徴パラメータの時間方向に平滑化した平
滑化パラメータを計算する手段(図7の64と50)と計算
した平滑化パラメータの少なくとも一つに基づき前記無
音声区間における前記複数種類の信号を加算する際の係
数を決定する手段(図6の38)とを備えている。
【0068】本発明の音声復号装置は、第6の実施の形
態において、前記特徴パラメータが前記復号信号に対応
するスペクトル包絡を表す量とパワーを表す量の少なく
とも一つを含む。
【0069】本発明の符号化・復号装置は、その好まし
い実施の形態において、各フレームにおいて入力信号が
音声区間であるか無音声区間であるかの判別を行い前記
入力信号の特徴パラメータを符号化する手段(図8参
照)と、前記した第1乃至第6の実施の形態の音声復号
装置を有する。
【0070】本発明の実施の形態について動作・原理に
ついて以下に説明する。
【0071】本発明においては、音声復号装置におい
て、無音声区間を復号する際に、間欠的に伝送されるフ
ィルタ係数を、RMSと同様に平滑化処理した後に、合成
フィルタで使用する。これにより、間欠的に伝送してい
ることにより生じるフィルタ係数が不連続に変化するこ
とを防ぐことができ、その結果、復号音質を改善でき
る。
【0072】音声復号装置において、無音声区間で平滑
化されたフィルタ係数やRMSを用いる場合、平滑化処理
により過去のフレームで伝送されたフィルタ係数やRMS
の影響を受けることになる。
【0073】無音声区間の先頭区間の信号には、直前の
有音声区間の特性が含まれているため、この区間で平滑
化処理を行なうことにより、その区間の特性を含んだ特
徴パラメータを用いて復号することになる。その結果、
復号信号の波形振幅が実際より大きくなったり、復号信
号がエコーを含む等の復号音声の劣化が生じることがあ
る。
【0074】これを防ぐために、音声区間から無音声区
間に入ってからの一定時間や一定フレーム数や、復号さ
れた特徴パラメータが予め定めた条件を満たす場合、例
えば、振幅を表すRMSが予め定めた値より未だ大きい場
合は平滑化を行なわないように、平滑化係数を設定す
る。これにより、先頭区間において平滑化により生ず
る、直前の有音声区間からの影響を削減することができ
る。
【0075】入力信号に重畳した背景雑音の種類によっ
ては、音声部復号回路で復号される信号に含まれる背景
雑音と、無音声復号回路で復号される信号に聴覚的な差
が生じる場合がある。これは、無音声復号回路で、合成
フィルタの励振信号の加算割合を、そのRMSが伝送され
たRMSの平滑化値と同じになるという条件のみで計算し
ているためである。
【0076】本発明においては、この加算割合を、入力
信号の性質を考慮して決定することにより、前記聴覚的
な差による復号音質の劣化を削減することができる。考
慮の仕方としては、例えば、平均RMSが小さい時は主に
乱数的な雑音を使用し、平均RMSが大きい時、あるいは
フィルタ係数から計算したスペクトルが平坦でない場合
は、主ににパルス性信号あるいはピッチ信号を使用す
る。
【0077】
【実施例】上記した本発明の実施の形態についてさらに
詳細に説明すべく、本発明の実施例について図面を参照
して以下に説明する。以下に説明する本発明の実施例に
おける符号化装置は、その基本構成が図8に示したもの
と同一のものが用いられる。また本発明の一実施例にお
ける復号装置の基本構成は、図9に示したものと同一と
される。
【0078】図1は、本発明の第1の実施例の復号装置
における無音声部復号回路の構成を示すブロック図であ
る。図1を参照すると、本発明の第1の実施例における
無音声部復号回路が、図10に示した無音声部復号回路
34と相違する点は、平滑化回路64をさらに備えているこ
とである。以下では、主に従来の装置との相違点につい
て説明し、同一部分の説明は適宜省略する。
【0079】パラメータ復号回路54は、入力端子52から
入力した信号符号列から求めたフィルタ係数とRMSをそ
れぞれ平滑化回路64と平滑化回路66に渡す。
【0080】平滑化回路64は、パラメータ復号回路54か
ら渡されたフィルタ係数を平滑化し、合成回路68に渡
す。但し、入力端子50から入力されたDTX判定符号で信
号符号列が伝送されないことが示された場合は、前フレ
ームのフィルタ係数を用いて平滑化を行なう。
【0081】各無音声区間中の先頭から数えてnフレー
ム目で使用する平滑化フィルタ係数F(n,i),(i=1,...,M)
は、nフレーム目に入力されたフィルタ係数 f(n,i),(i
=1,...,M)を用いて次式(4)で計算する。但し、何も
伝送されてこないフレームでは、f(n,i)の代わりに直前
に伝送されたフィルタ係数を用いて次式(4)を計算す
る。
【0082】 F(n,i) = (1−β)F(n−1,i) + βf(n,i) …(4)
【0083】ここで、βは平滑化の程度を決定する平滑
化係数である。また、F(−1,i)=0,(i=1,...,M)である。
【0084】Mはフィルタの次数である。合成回路68
は、混合回路61から渡される励振信号を、平滑回路64か
ら渡されるフィルタ係数で構成するフィルタに入力する
ことにより、信号を復号し、出力端子70から出力する。
【0085】図2は、本発明の第2の実施例における復
号装置の構成を示す図である。本発明の第2の実施例
が、図9に示した従来の復号装置と相違する点は、無音
声部復号回路35の構成が相違することと、平滑化制御回
路36を備えていることである。以下では、主に従来の装
置との相違点について説明し、同一部分の説明は適宜省
略する。
【0086】ビット列分解回路26は、入力端子24から入
力したビット列をVAD判定符号、DTX判定符号及び信号符
号列に分解し、VAD判定符号を平滑化制御回路36と切り
替え回路28に渡し、信号符号列を切り替え回路28に渡
し、DTX判定符号を無音声部復号回路35に渡す。
【0087】切り替え回路28は、ビット列分解回路26か
ら渡されたVAD判定符号で入力信号が音声区間とされた
場合はビット列分解回路26から渡された信号符号列を音
声部復号回路30に渡し、VAD判定符号で入力信号が無音
声区間とされた場合は無音声部復号回路35に渡す。
【0088】平滑化制御回路36は、ビット列分解回路26
から渡されるVAD判定符号の変化に応じた平滑化係数α
(n)とβ(n)を無音声部復号回路35に渡す。ここで nは
各無音声区間中の先頭から数えたフレーム番号である。
【0089】例えば、VAD判定符号が無音声区間をある
ことを示す場合、最初の特定フレーム数又は特定時間長
で、平滑化係数α(n)とβ(n)を1とすることにより、無
音声区間における先頭部分に残っている直前の有音声部
による影響を除去することができる。また、同様に伝送
されたフィルタ係数やRMS等が特定の条件を満たす間、
平滑化係数α(n)とβ(n)を1とすることにより、無音声
区間における先頭部分に残っている直前の有音声部によ
る影響を除去することができる。条件の例としては、RM
Sが直前の有音声区間の影響を受けていることを検出す
るための方法として、「RMSが予め定めた閾値以上であ
る」又は「RMSとその無音区間における先頭サブフレー
ムのRMSとが予め定めた閾値以下である」がある。ま
た、フィルタ係数が音声区間の平均スペクトルに類似し
ていることを検出するために、「フィルタ係数が予め定
めた標準フィルタ係数との距離(例えば二乗距離)が予
め定めた閾値以下である」等がある。
【0090】更に、直前の音声区間の長さが一定フレー
ム数あるいは一定時間長よりも短い場合は、その音声区
間の直前の無音声区間と入力信号の性質が類似している
と考えて、フィルタ係数とRMSの平滑化値を計算する時
の初期値P(-1)、F(−1,i),(i=1,...,M)として、直前の
無音声区間の最終フレームでの平滑化値を用いることが
できる。
【0091】無音声部復号回路35は、平滑化制御回路36
から渡された平滑化係数α(n)とβ(n)、ビット列分解回
路26から渡されたDTX判定符号、及び切り替え回路28か
ら渡された信号符号列を用いて無音声区間の信号を復号
し、出力端子32から出力する。
【0092】図3は、本発明の第2の実施例における無
音声部復号回路35の構成を示す図である。本発明の第2
の実施例が、前記第1の実施例における無音声部復号回
路と相違する点は、平滑化回路49と平滑化回路51の構成
である。
【0093】パラメータ復号回路54は、入力端子52で入
力した信号符号列から求めたフィルタ係数とRMSをそれ
ぞれ平滑化回路49と平滑化回路51に渡す。
【0094】平滑化回路49は、パラメータ復号回路54か
ら渡されたフィルタ係数を、入力端子65から入力した平
滑化係数β(n)を用いて平滑化し、合成回路68に渡す。
但し、入力端子50から入力されたDTX判定符号で信号符
号列が伝送されないことが示された場合は、前フレーム
のフィルタ係数を繰り返し使用する。
【0095】各無音声区間中の先頭から数えてnフレー
ム目で使用する平滑化フィルタ係数F(n,i),(i=1,...,M)
は、nフレーム目に入力されたフィルタ係数 f(n,i),(i
=1,...,M)を用いて、上式(4)と同様の次式(5)で計
算する。
【0096】 F(n,i) = (1−β(n))・F(n−1,i) + β(n)・f(n,i) …(5) ここで、β(n)は、各無音声区間中の先頭からの経過フ
レーム数に応じて変化する値であり、経過フレーム数が
少ない時には過去のフレームからの影響を忘却するよう
に1付近の値を取る。例えば、β(1)=β(2)=1.0、β(3)=
β(4)=… =β(L)= 0.7 とすることできる。Lは各無音
声区間のフレーム数である。
【0097】平滑化回路51は、パラメータ復号回路54か
ら渡されたRMSを平滑化し、混合回路61に渡す。但し、
入力端子50から入力されたDTX判定符号で信号符号列が
伝送されないことが示された場合は、直前に伝送された
RMSを用いて平滑化を行なう。各無音声区間中の先頭か
ら数えてnフレーム目で使用する平滑化RMS P(n)は、n
フレーム目に入力されたRMS p(n) を用いて、上式(1)
と同様の次式(6)で計算する。
【0098】 P(n) = (1−α(n))・P(n−1) + α(n)・p(n) …(6) ここで、α(n)は、β(n)と同様に、各無音声区間中の
先頭からの経過フレーム数に応じて変化する値であり、
経過フレーム数が少ない時には過去のフレームからの影
響を忘却するように1付近の値を取る。例えば、α(1)=
α(2)=1.0、α(3)=α(4)=… =α(L)= 0.7 とすることで
きる。Lは各無音声区間のフレーム数である。
【0099】なお、平滑化回路49と平滑化回路51の処理
のいずれか一方の処理のみを行なうこともできる。その
場合は、パラメータ復号回路54から受け渡されるフィル
タ係数あるいはRMSを、直接合成回路68又は混合回路61
に渡すことになる。
【0100】混合回路61では、平滑化回路51から渡され
る平滑化RMSを用いて、乱数回路56から渡された乱数信
号r(i)とパルス回路53から渡されたパルス列信号p(i)と
ピッチ回路58から渡されたピッチ信号q(i)との線形和処
理を行なうことにより、合成フィルタの励振信号x(i)を
計算し、合成回路68に渡す。
【0101】合成回路68は、混合回路61から渡される励
振信号を、平滑化回路49から渡されるフィルタ係数で構
成するフィルタに入力することにより、信号を復号し、
出力端子70から出力する。
【0102】図4は、本発明の第3の実施例における復
号装置の構成を示す図である。本発明の第3の実施例の
復号装置が、従来の復号装置と相違する点は、無音声部
検定回路38と無音声部復号回路37である。
【0103】ビット列分解回路26は、入力端子24から入
力したビット列をVAD判定符号とDTX判定符号及び信号符
号列に分解し、VAD判定符号と信号符号列を切り替え回
路28に渡し、DTX判定符号を無音声部復号回路37に渡
す。
【0104】切り替え回路28は、ビット列分解回路26か
ら渡された信号符号列を、ビット列分解回路26から渡さ
れたVAD判定符号で入力信号が音声区間とされた場合に
は音声部復号回路30に渡し、VAD判定符号で入力信号が
無音声区間とされた場合には無音声部復号回路37に渡
す。
【0105】無音声部検定回路38は、無音声部復号回路
37から渡されたフィルタ係数とRMSを用いて、図5にお
ける混合回路62で用いる線形和の結合係数を調整する設
定パラメータを決定し、無音声部復号回路37に渡す。こ
の調整パラメータの計算に関しては、混合回路62での処
理と合わせて後述する。
【0106】無音声部復号回路37は、ビット列分解回路
26から渡されたDTX判定符号、及び切り替え回路28から
渡された信号符号列を用いて無音声区間の信号を復号
し、出力端子32から出力する。
【0107】図5は、本発明の第3の実施例における無
音声部復号回路37の構成を示す図である。本発明の第3
の実施例における無音声部復号回路37が、前記第1の実
施例における無音声部復号回路35と相違する点は、混合
回路62及びパラメータ復号回路54の出力先である。以下
では、主に従来の装置との相違点について説明し、同一
部分の説明は適宜省略する。
【0108】パラメータ復号回路54は、入力端子52で入
力した信号符号列からフィルタ係数とRMSを求め、フィ
ルタ係数を平滑化回路64と出力端子23に渡し、RMSを平
滑化回路66と出力端子25に渡す。
【0109】平滑化回路66は、パラメータ復号回路54か
ら渡されたRMSを平滑化し、混合回路62に渡す。但し、
入力端子50から入力されたDTX判定符号で信号符号列が
伝送されないことが示された場合は、直前に伝送された
RMSを用いて平滑化を行なう。また、この場合、平滑化
の係数α(n)やβ(n)を零とすることで平滑化したRMSを
更新しないように制御することもできる。
【0110】乱数回路56は、乱数を生成し、混合回路62
に渡す。
【0111】パルス回路53は、乱数で生成した位置と振
幅を持つパルスから成るパルス列信号を生成し、混合回
路62に渡す。ピッチ回路58は、前述の適応コードベクト
ルからなるピッチ信号を生成し、混合回路62に渡す。
【0112】混合回路62は、入力端子60から入力した設
定パラメータと平滑化回路66から渡された平滑化RMSを
用いて、前述の線形和の結合係数を計算する。
【0113】また、この結合係数を用いて、乱数回路56
から渡された乱数信号とパルス回路53から渡されたパル
ス列信号とピッチ回路53から渡されたピッチ信号との
和信号を計算し、合成回路68に渡す。
【0114】合成回路68は、混合回路62から渡される励
振信号を、平滑化回路64から渡されるフィルタ係数で構
成するフィルタに入力することにより、信号を復号し、
出力端子70から出力する。
【0115】無音声部検定回路38と混合回路62について
説明する。
【0116】無音声部検定回路38において無音声部にお
ける背景雑音の性質を決定し、この性質に従って、混合
回路62におけるピッチ信号、パルス列信号及び乱数信号
の結合係数の計算方法を変更する。変更する設定パラメ
ータとしては、結合係数を決定する順番や、結合係数γ
がある。
【0117】無音性部検定回路38が、無音声部における
背景雑音の性質を検定するための情報としては、例え
ば、RMSとフィルタ係数がある。
【0118】この情報から前記設定パラメータを操作す
る方法として、例えば、前記RMSが予め定めた閾値より
も小さく、背景雑音がないと見なした場合や、フィルタ
係数から計算した入力信号のスペクトル傾きが平坦な白
色雑音と見なした場合は、乱数信号の寄与を大きくする
方法がある。これは、結合係数の計算順番はそのままで
γを小さくすることと等価である。
【0119】なお、この無音声信号の設定パラメータを
信号符号列に含めて伝送することもできる。
【0120】図6は、本発明の第4の実施例における復
号装置の構成を示す図である。本発明の第4の実施例に
おける復号装置が、前記第2の実施例における復号装置
と相違する点は、無音声部検定回路38と無音声部復号回
路39である。
【0121】ビット列分解回路26は、入力端子24から入
力したビット列をVAD判定符号とDTX判定符号及び信号符
号列に分解し、VAD判定符号を平滑化制御回路36と切り
替え回路28に渡し、信号符号列を切り替え回路28に渡
し、DTX判定符号を無音声部復号回路39に渡す。
【0122】切り替え回路28は、ビット列分解回路26か
ら渡されたVAD判定符号で入力信号が音声区間とされた
場合にはビット列分解回路26から渡された信号符号列を
音声部復号回路30に渡し、VAD判定符号で入力信号が無
音声区間とされた場合には無音声部復号回路39に渡す。
無音声部検定回路38と無音声部復号回路39に信号符号列
を渡す。
【0123】平滑化制御回路36は、ビット列分解回路26
から渡されるVAD判定符号の変化に応じた前記平滑化係
数α(n)とβ(n)を無音声部復号回路39に渡す。
【0124】無音声部検定回路38は、無音声部復号回路
39から渡された平滑化RMSを用いて、図7における混合
回路62で使用する線形和の結合係数を調整する設定パラ
メータを決定し、無音声部復号回路39に渡す。
【0125】無音声部検定回路39での設定パラメータの
決定処理はRMSを平滑化RMSに置き換えることで、前述し
た無音声部検定回路38と同様の処理を適用できる。
【0126】無音声部復号回路39は、ビット列分解回路
26から渡されたDTX判定符号、及び切り替え回路28から
渡された信号符号列、平滑化制御回路36から渡された平
滑化係数α(n)とβ(n)、及び無音声部検定回路38から渡
された設定パラメータを用いて無音声区間の信号を復号
し、出力端子32から出力する。
【0127】また、図7の平滑化回路50で計算された平
滑化RMSと、平滑化回路64で計算された平滑化フィルタ
係数を無音声部検定回路38に渡す。
【0128】図7は、本発明の第4の実施例における無
音声部復号回路39の構成を示す図である。本発明の本発
明の第4の実施例における無音声部復号回路39が、前記
第2の実施例における無音声部復号回路と相違する点
は、平均化回路50と平滑化回路64からの出力が出力端子
69及び出力端子63から出力される構成とされていること
である。
【0129】上記各実施例では、合成フィルタの励振信
号を計算する時にピッチ信号とパルス列信号と乱数信号
全てを用いているが、いずれかを省く構成としてもよ
い。
【0130】本発明は、従来の技術の欄にて説明した符
号化装置とともに、掲題無線端末や無線基地局に搭載し
て、音声信号圧縮技術を用いた無線音声通信システムを
容易に構築することができる。また、既に説明した復号
方法を実行するためのプログラムをフロッピィディスク
等の記録媒体に格納しておき、スピーカー等が接続され
たパーソナルコンピュータにこのプログラムをロードす
ることにより、音声端末を構築することも容易にでき
る。
【0131】
【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
【0132】本発明の第1の効果は、復号装置におい
て、無音声区間を復号する際に使用するフィルタ係数が
不連続に変化することによる、復号音質の劣化を低減す
る、ということである。
【0133】その理由は、本発明においては、間欠的に
伝送されるフィルタ係数を平滑化処理した後に用いてい
るためである。
【0134】本発明の第2の効果は、復号装置におい
て、無音声区間の先頭部分で直前の有音声区間による影
響を受けることによる復号音質の劣化を低減する、とい
うことである。
【0135】その理由は、本発明においては、無音声区
間の先頭部分では、特徴パラメータの平滑化処理を行な
わないように平滑化係数を設定している、ためである。
【0136】本発明の第3の効果は、復号装置におい
て、音声区間と無音声区間の切り替わりにより生じる聴
覚的な不連続を低減する、ということである。
【0137】その理由は、本発明においては、無音声区
間において再生フィルタの励振信号を生成する時に、乱
数成分に対するパルス成分とピッチ成分の比を入力信号
の性質に応じて変更するためである。
【図面の簡単な説明】
【図1】本発明の第1の実施例における無音声部復号回
路の構成を示す図である。
【図2】本発明の第2の実施例における復号装置の構成
を示す図である。
【図3】本発明の第2の実施例における無音声部復号回
路の構成を示す図である。
【図4】本発明の第3の実施例における復号装置の構成
を示す図である。
【図5】本発明の第3の実施例における無音声部復号回
路の構成を示す図である。
【図6】本発明の第4の実施例における復号装置の構成
を示す図である。
【図7】本発明の第4の実施例における無音声部復号回
路の構成を示す図である。
【図8】従来及び本発明の実施例に係る符号化装置の構
成を示す図である。
【図9】従来の復号装置の構成を示す図である。
【図10】従来の復号装置における無音声部復号回路の
構成を示す図である。
【符号の説明】
10、24、50、52、65、67、60、63 入
力端子 12 音声部符号化回路 14 無音声部符号化回路 18、28 切り替え回路 20 ビット列生成回路 22、23、25、32、70 出力端子 26 ビット列分割回路 30 音声部復号回路 34、35、37、39 無音声部復号回路 36 平滑化制御回路 38 無音声部検定回路 49、51、64、66 平滑化回路 53 パルス回路 54 パラメータ復号回路 56 乱数回路 58 ピッチ回路 61、62 混合回路 68 合成回路
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 11/02 G10L 13/00 G10L 19/00 - 19/14 H04B 14/04 H03M 7/30

Claims (14)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号が音声区間であるか無音声区間で
    あるかに従って、受信した特徴パラメータから信号を復
    号する音声復号装置において、 前記無音声区間では、この無音声区間の信号を複数種類
    の信号から成る励振信号を合成フィルタに入力すること
    により生成する無音声区間復号器を備え、 前記無音声区間復号器は、前記特徴パラメータの少なく
    とも1つに基づき、前記無音声区間における前記複数種
    類の信号のそれぞれを重み付け加算する際の重み付け係
    数を決定する重み付け係数決定手段を備え、 この重み付け係数を用いて生成された励振信号が前記合
    成フィルタに供給されることを特徴とする音声復号装
    置。
  2. 【請求項2】音声信号が音声区間であるか無音声区間で
    あるかに従って、受信した特徴パラメータから信号を復
    号する音声復号装置において、 前記無音声区間では、この無音声区間の信号を複数種類
    の信号から成る励振信号を合成フィルタに入力すること
    により生成する無音声区間復号器を備え、 前記無音声区間復号器は、時間方向に平滑化された前記
    特徴パラメータの少なくとも一つに基づき、前記無音声
    区間における前記複数種類の信号のそれぞれを重み付け
    加算する際の重み付け係数を決定する重み付け係数決定
    手段を備え、 この重み付け係数を用いて生成された励振信号が前記合
    成フィルタに供給されることを特徴とする音声復号装
    置。
  3. 【請求項3】前記特徴パラメータが、前記復号信号に対
    応するスペクトル包絡を表す量とパワーを表す量の少な
    くとも一つを含む、ことを特徴とする請求項1または2
    に記載の音声復号装置。
  4. 【請求項4】各フレームにおいて入力信号が音声区間で
    あるか無音声区間であるかの判別を行い前記入力信号の
    特徴パラメータを符号化して出力する符号化装置と、請
    求項1乃至3のいずれか一項に記載の音声復号装置とを
    備えた音声符号化・復号装置。
  5. 【請求項5】請求項1乃至4の音声符号化・復号装置あ
    るいは復号装置を備えることを特徴とする基地局装置。
  6. 【請求項6】請求項1乃至4の音声符号化・復号装置あ
    るいは復号装置を備えることを特徴とする通信端末装
    置。
  7. 【請求項7】音声信号が音声区間であるか無音声区間で
    あるかに従って、復号方法を変更し、受信した特徴パラ
    メータから信号を復号する音声復号方法であり、前記無
    音区間の少なくとも一部の復号は、前記 特徴パラメータの少なくとも一つに基づき、前記無
    音声区間における励振信号を複数種類の信号のそれぞれ
    重み付け加算して生成するための係数を決定する重み
    付け係数決定ステップと、 決定された係数に基づいて励振信号を生成し、この励振
    信号を合成フィルタに入力することにより前記無音声区
    間の信号を生成するステップとによりなされることを特
    徴とする音声復号方法。
  8. 【請求項8】音声信号が音声区間であるか無音声区間で
    あるかに従って、復号方法を変更し、受信した特徴パラ
    メータから信号を復号する音声復号方法であり、前記無
    音区間の少なくとも一部の復号は、前記 特徴パラメータを平滑化し、平滑化されたパラメー
    タを計算するステップと、 前記平滑化されたパラメータの少なくとも一つに基づ
    き、前記無音声区間における励振信号を複数種類の信号
    のそれぞれを重み付け加算して生成するための係数を決
    定する重み付け係数決定ステップと、 決定された係数を用いて励振信号を生成し、この励振信
    号を合成フィルタに入力することにより前記無音声区間
    の信号を生成するステップによりなされることを特徴と
    する音声復号方法。
  9. 【請求項9】前記特徴パラメータが、前記復号信号に対
    応するスペクトル包絡を表す量とパワーを表す量との少
    なくとも一つを含む、ことを特徴とする請求項7または
    8に記載の音声復号方法。
  10. 【請求項10】各フレームにおいて入力信号が音声区間
    であるか無音声区間であるかの判別を行い前記入力信号
    の特徴パラメータを符号化して出力する符号化ステップ
    と、請求項7乃至9のいずれか一つに記載の音声復号方
    法を実施するステップとを組み合わせてなる音声符号化
    ・復号方法。
  11. 【請求項11】音声信号が音声区間であるか無音声区間
    であるかに従って、復号方法を変更し、受信した特徴パ
    ラメータから信号を復号する音声復号方法を実行するプ
    ログラムを記録した記録媒体であり、前記無音区間の復
    号するためのステップとして、少なくとも一部の区間に
    おいて、前記特徴パラメータの少なくとも一つに基づ
    き、前記無音声区間における励振信号を複数種類の信号
    のそれぞれを重み付け加算して生成するための係数を決
    定する重み付け係数決定ステップと、 決定された係数に基づいて励振信号を生成し、この励振
    信号を合成フィルタに入力することにより前記無音声区
    間の復号信号を生成するステップとを格納した記録媒
    体。
  12. 【請求項12】音声信号が音声区間であるか無音声区間
    であるかに従って、復号方法を変更し、受信した特徴パ
    ラメータから信号を復号する音声復号方法を実行するプ
    ログラムを記録した記録媒体であり、前記無音区間の復
    号のためのステップとして、 少なくとも一部の区間において、前記特徴パラメータを
    平滑化し、平滑化されたパラメータを計算するステップ
    と、 前記計算した平滑化されたパラメータの少なくとも一つ
    に基づき、前記無音声区間における励振信号を複数種類
    の信号のそれぞれを重み付け加算して生成するための係
    数を決定する重み付け係数決定ステップと、 決定された係数を用いて励振信号を生成し、この励振信
    号を合成フィルタに入力することにより前記無音声区間
    の復号信号を生成するステップとを格納した記録媒体。
  13. 【請求項13】前記特徴パラメータが、前記復号信号に
    対応するスペクトル包絡を表す量とパワーを表す量との
    少なくとも一つを含む、ことを特徴とする請求項11ま
    たは12に記載の記録媒体。
  14. 【請求項14】各フレームにおいて入力信号が音声区間
    であるか無音声区間であるかの判別を行い前記入力信号
    の特徴パラメータを符号化して出力する符号化ステップ
    と、請求項11乃至13のいずれか一つに記載の音声復
    号方法ステップとを組み合わせてなるプログラムを格納
    した記録媒体。
JP29879599A 1999-05-31 1999-10-20 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 Expired - Lifetime JP3451998B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP29879599A JP3451998B2 (ja) 1999-05-31 1999-10-20 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
EP00931614.2A EP1199710B1 (en) 1999-05-31 2000-05-31 Device, method and recording medium on which program is recorded for decoding speech in voiceless parts
CA002485547A CA2485547A1 (en) 1999-05-31 2000-05-31 Device, method, and program for encoding/decoding of speech with function of encoding silent period
CA002373479A CA2373479C (en) 1999-05-31 2000-05-31 Device, method and program for encoding/decoding of speech with function of encoding silent period
PCT/JP2000/003492 WO2000074036A1 (en) 1999-05-31 2000-05-31 Device for encoding/decoding voice and for voiceless encoding, decoding method, and recorded medium on which program is recorded
US09/980,275 US8195469B1 (en) 1999-05-31 2000-05-31 Device, method, and program for encoding/decoding of speech with function of encoding silent period

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP11-152380 1999-05-31
JP15238099 1999-05-31
JP29879599A JP3451998B2 (ja) 1999-05-31 1999-10-20 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003062333A Division JP3475958B2 (ja) 1999-05-31 2003-03-07 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2001051699A JP2001051699A (ja) 2001-02-23
JP3451998B2 true JP3451998B2 (ja) 2003-09-29

Family

ID=26481323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29879599A Expired - Lifetime JP3451998B2 (ja) 1999-05-31 1999-10-20 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体

Country Status (5)

Country Link
US (1) US8195469B1 (ja)
EP (1) EP1199710B1 (ja)
JP (1) JP3451998B2 (ja)
CA (1) CA2373479C (ja)
WO (1) WO2000074036A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738739B2 (en) * 2001-02-15 2004-05-18 Mindspeed Technologies, Inc. Voiced speech preprocessing employing waveform interpolation or a harmonic model
KR100760905B1 (ko) 2006-01-06 2007-09-21 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
KR100785471B1 (ko) * 2006-01-06 2007-12-13 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
HRP20201070T1 (hr) * 2011-11-03 2020-10-30 Voiceage Evs Llc Poboljšanje ne-govornog sadržaja za celp dekoder niskog intenziteta
CN105723456B (zh) 2013-10-18 2019-12-13 弗朗霍夫应用科学研究促进协会 自适应编码及解码音频信号的编码器、解码器、编码和解码方法
EP3806094B1 (en) 2013-10-18 2025-08-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
CN107967918A (zh) * 2016-10-19 2018-04-27 河南蓝信科技股份有限公司 一种增强语音信号清晰度的方法
JP2018072723A (ja) * 2016-11-02 2018-05-10 ヤマハ株式会社 音響処理方法および音響処理装置

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60262200A (ja) 1984-06-11 1985-12-25 松下電器産業株式会社 スペクトルパラメ−タ補間方法
JPS62102300A (ja) 1985-10-30 1987-05-12 日本電気株式会社 音声合成器
JPH0731510B2 (ja) 1986-01-28 1995-04-10 日本電気株式会社 音声合成器
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
CA2110090C (en) * 1992-11-27 1998-09-15 Toshihiro Hayata Voice encoder
JPH07129195A (ja) * 1993-11-05 1995-05-19 Nec Corp 音声復号化装置
JP3353994B2 (ja) 1994-03-08 2002-12-09 三菱電機株式会社 雑音抑圧音声分析装置及び雑音抑圧音声合成装置及び音声伝送システム
JPH07261797A (ja) 1994-03-18 1995-10-13 Mitsubishi Electric Corp 信号符号化装置及び信号復号化装置
JPH07334197A (ja) 1994-06-14 1995-12-22 Matsushita Electric Ind Co Ltd 音声符号化装置
GB2317084B (en) * 1995-04-28 2000-01-19 Northern Telecom Ltd Methods and apparatus for distinguishing speech intervals from noise intervals in audio signals
JP3416331B2 (ja) 1995-04-28 2003-06-16 松下電器産業株式会社 音声復号化装置
JP2806308B2 (ja) 1995-06-30 1998-09-30 日本電気株式会社 音声復号化装置
FI105001B (fi) * 1995-06-30 2000-05-15 Nokia Mobile Phones Ltd Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
CA2188369C (en) * 1995-10-19 2005-01-11 Joachim Stegmann Method and an arrangement for classifying speech signals
JP3225256B2 (ja) 1995-11-24 2001-11-05 株式会社ケンウッド 擬似背景雑音生成方法
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
JPH09244695A (ja) 1996-03-04 1997-09-19 Kobe Steel Ltd 音声符号化装置及び復号化装置
GB2312360B (en) * 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus
US5943347A (en) * 1996-06-07 1999-08-24 Silicon Graphics, Inc. Apparatus and method for error concealment in an audio stream
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
US5797120A (en) 1996-09-04 1998-08-18 Advanced Micro Devices, Inc. System and method for generating re-configurable band limited noise using modulation
JP3270922B2 (ja) 1996-09-09 2002-04-02 富士通株式会社 符号化,復号化方法及び符号化,復号化装置
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6011846A (en) * 1996-12-19 2000-01-04 Nortel Networks Corporation Methods and apparatus for echo suppression
US5737695A (en) * 1996-12-21 1998-04-07 Telefonaktiebolaget Lm Ericsson Method and apparatus for controlling the use of discontinuous transmission in a cellular telephone
US6202046B1 (en) * 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US5893056A (en) * 1997-04-17 1999-04-06 Northern Telecom Limited Methods and apparatus for generating noise signals from speech signals
US6026356A (en) * 1997-07-03 2000-02-15 Nortel Networks Corporation Methods and devices for noise conditioning signals representative of audio information in compressed and digitized form
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6453289B1 (en) * 1998-07-24 2002-09-17 Hughes Electronics Corporation Method of noise reduction for speech codecs
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6275798B1 (en) * 1998-09-16 2001-08-14 Telefonaktiebolaget L M Ericsson Speech coding with improved background noise reproduction
CN1149534C (zh) * 1998-12-07 2004-05-12 三菱电机株式会社 声音解码装置和声音解码方法
JP2000267700A (ja) 1999-03-17 2000-09-29 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
US6597961B1 (en) * 1999-04-27 2003-07-22 Realnetworks, Inc. System and method for concealing errors in an audio transmission
GB2356538A (en) * 1999-11-22 2001-05-23 Mitel Corp Comfort noise generation for open discontinuous transmission systems
US6510409B1 (en) * 2000-01-18 2003-01-21 Conexant Systems, Inc. Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders
JP3404350B2 (ja) 2000-03-06 2003-05-06 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ取得方法、音声復号方法及び装置
US6662155B2 (en) * 2000-11-27 2003-12-09 Nokia Corporation Method and system for comfort noise generation in speech communication

Also Published As

Publication number Publication date
US8195469B1 (en) 2012-06-05
CA2373479A1 (en) 2000-12-07
JP2001051699A (ja) 2001-02-23
EP1199710B1 (en) 2016-07-06
EP1199710A4 (en) 2005-08-10
WO2000074036A1 (en) 2000-12-07
CA2373479C (en) 2006-02-07
EP1199710A1 (en) 2002-04-24

Similar Documents

Publication Publication Date Title
JP4851578B2 (ja) 減少レート、可変レートの音声分析合成を実行する方法及び装置
EP1509903B1 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
US7203638B2 (en) Method for interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
US7657427B2 (en) Methods and devices for source controlled variable bit-rate wideband speech coding
US6694293B2 (en) Speech coding system with a music classifier
EP0832482B1 (en) Speech coder
US10083698B2 (en) Packet loss concealment for speech coding
US7324937B2 (en) Method for packet loss and/or frame erasure concealment in a voice communication system
JP4489960B2 (ja) 音声の無声セグメントの低ビットレート符号化
KR20150127041A (ko) 시간 영역 디코더에서 양자화 잡음을 감소시키기 위한 디바이스 및 방법
JPH0850500A (ja) 音声エンコーダ及び音声デコーダ、並びに音声符号化方法及び音声復号化方法
JP3451998B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3722366B2 (ja) パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
US7089180B2 (en) Method and device for coding speech in analysis-by-synthesis speech coders
JP3475958B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
US7133823B2 (en) System for an adaptive excitation pattern for speech coding
EP1808852A1 (en) Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
JP2853170B2 (ja) 音声符号化復号化方式
JP2004004946A (ja) 音声復号装置
JPH10341211A (ja) 音声符号化方法および装置
JPH09146598A (ja) 音声符号化における雑音抑圧方法
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
JP2004078235A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置
JPH01314300A (ja) 音声符号化復号化方法とその装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030617

R150 Certificate of patent or registration of utility model

Ref document number: 3451998

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070718

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080718

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090718

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100718

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110718

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120718

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130718

Year of fee payment: 10

EXPY Cancellation because of completion of term