JP2002099299A - 無音圧縮音声符号化復号化装置 - Google Patents

無音圧縮音声符号化復号化装置

Info

Publication number
JP2002099299A
JP2002099299A JP2000290165A JP2000290165A JP2002099299A JP 2002099299 A JP2002099299 A JP 2002099299A JP 2000290165 A JP2000290165 A JP 2000290165A JP 2000290165 A JP2000290165 A JP 2000290165A JP 2002099299 A JP2002099299 A JP 2002099299A
Authority
JP
Japan
Prior art keywords
compressed
data
audio data
audio
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000290165A
Other languages
English (en)
Other versions
JP3734696B2 (ja
Inventor
Hideaki Ishiba
秀昭 石羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000290165A priority Critical patent/JP3734696B2/ja
Publication of JP2002099299A publication Critical patent/JP2002099299A/ja
Application granted granted Critical
Publication of JP3734696B2 publication Critical patent/JP3734696B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 背景雑音再生の基となる圧縮音声データが損
失した場合にも、それに続く無音区間において違和感が
ないように背景雑音を再生する。 【解決手段】 音声符号化処理部1Xに、フレーム毎に
音声信号が有音部か無音部かを判断して有音部のみを符
号化した圧縮音声データと有音・無音を示すフラグとを
出力する音声符号化部12と、音声符号化処理を行った
フレーム数を検出してフレーム番号を出力するフレーム
番号付加器13とを設ける。音声復号化処理部1Yに、
圧縮音声データおよびフラグをフレーム毎に受信した際
に、伝送された順に圧縮データが受信できたかどうか判
断するフレーム監視器14と、圧縮音声データ非受信の
無音区間における背景雑音を発生させる際に、フレーム
監視器14において有音部の圧縮音声データが受信でき
なかったと判断した場合には、擬似雑音データを選択
し、音声復号化部から擬似雑音を再生出力する選択器1
6とを設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ATM通信網にお
ける電話システムや移動体通信システムなどにあって、
音声信号を圧縮して伝送するための符号化、復号化を行
う無音圧縮音声符号化復号化装置に関するものである。
【0002】
【従来の技術】従来、ATM通信網やフレームリレー用
の音声対応多重化装置においては、無音区間の符号化デ
ータの伝送を行わず、有音区間の符号化データのみを伝
送して、伝送符号化データ量を低減するための無音圧縮
音声符号化復号化装置が用いられている。これにより、
入力音声信号の全部を符号化、伝送する非無音圧縮音声
符号化復号化装置より多くのチャンネル数を多重化する
ことが可能である。
【0003】図4に従来の無音圧縮音声符号化復号化装
置の構成を示す。図4において、4Xは音声符号化処理
部、4Yは音声復号化処理部である。41は入力音声信
号aの有音/無音の判定を行い、有音/無音フラグを出
力する有音/無音判定部、42は有音/無音フラグを基
に入力音声信号aの符号化処理を行って圧縮音声データ
(音声パラメータ)b,cを出力する音声符号化部、4
3は有音/無音フラグを基に圧縮音声データ(音声パラ
メータ)b,cの復号を行って再生音声信号を出力する
音声復号化部である。
【0004】音声符号化処理部4Xでは、入力音声信号
aを一定区間(フレーム)毎に有音/無音判定部41に
おいて有音区間であるか無音区間であるかを判断し、有
音または無音を示す有音/無音フラグを出力する。有音
であると判断された場合、音声符号化部42で符号化処
理を行い、圧縮音声データ(音声パラメータ)bを出力
する。
【0005】一方、無音であると判断された場合、符号
化データは非出力とする。また音声符号化方式の種類に
よっては、有音区間から無音区間への遷移時には有声時
と同様の符号化処理を行い圧縮音声データbの一部のパ
ラメータのみで構成された中間圧縮音声データcを出力
する場合もある。
【0006】音声復号化処理部4Yでは、有音区間を示
す有音フラグが他の無音圧縮音声符号化復号化装置の音
声符号化処理部から入力された場合には圧縮音声データ
bを復号化して再生音声信号を出力する。
【0007】一方、無音区間を示す無音フラグの入力が
通知された場合には、圧縮音声データは非入力となる
が、背景雑音として音声を復号して出力しなければなら
ないので、以前に入力された圧縮音声データbまたは、
有音から無音に遷移した際に入力される中間圧縮音声デ
ータcの音声パラメータを基に背景雑音を再生してい
る。
【0008】
【発明が解決しようとする課題】上記従来の無音圧縮音
声符号化復号化装置では、音声復号化部43における背
景雑音の再生は、まず前フレームの有音区間の圧縮音声
データbまたは、中間圧縮音声データcの音声パラメー
タを基に復号し、以降無音区間が継続した場合には最初
の背景雑音データを連続的に補間して再生していた。
【0009】しかしながら、ATM音声通信網等の伝送
路において、背景雑音再生の基となる有音区間の圧縮音
声データが損失した場合、それに続く無音区間のフレー
ムでは、それより以前の有音区間での圧縮音声データを
用いて背景雑音を再生するため、有音区間から無音区間
への遷移時に異音が発生し、以降の無音区間においても
異音が継続する可能性があり、聴取者に違和感を感じさ
せてしまうという問題があった。
【0010】また、連続している有音区間のうちの一部
の有音区間が損失した場合にも、音声音質の劣化が生じ
るという問題があった。
【0011】本発明は上記従来の問題を解決するもの
で、伝送中の圧縮音声データの損失に対しても音声音質
の劣化を防止することができる無音圧縮音声符号化復号
化装置を提供することである。
【0012】本発明の他の目的は、背景雑音再生の基と
なる圧縮音声データが損失した場合にも、それに続く無
音区間において違和感がないように背景雑音を再生する
ことができる無音圧縮音声符号化復号化装置を提供する
ことを目的とする。
【0013】
【課題を解決するための手段】上記課題を解決するため
に、請求項1記載の無音圧縮音声符号化復号化装置は、
音声データを圧縮し圧縮音声データとして伝送する音声
符号化処理部および伝送された圧縮音声データを復号し
て再生音声データとする音声復号化処理部を備えた無音
圧縮音声符号化復号化装置において、音声符号化処理部
に、一定区間(フレーム)毎に音声信号が有音部か無音
部かを判断して有音部のみを符号化した圧縮音声データ
と有音または無音を示すフラグとを出力する音声符号化
部と、音声符号化処理を行ったフレーム数を検出し、フ
レーム番号を出力するフレーム番号出力手段とを備えた
ことを特徴とする。
【0014】この構成によれば、音声符号化処理を行っ
たフレーム数を検出し、フレーム番号を出力するフレー
ム番号出力手段を設けたので、復号化の際にフレーム番
号を検出することで、伝送された順にデータが受信され
たかどうかが分かり、背景雑音再生の基となる圧縮音声
データが損失した場合にも、それに続く無音区間におい
て違和感がないように背景雑音を再生することができ
る。また、有音区間の損失に対して所定のフレーム損失
処理を行うことが可能となり、有音区間の損失による音
声音質の劣化を防止することができる。
【0015】請求項2記載の無音圧縮音声符号化復号化
装置は、請求項1記載の無音圧縮音声符号化復号化装置
において、フレーム番号出力手段として、繰り返し変化
するフレーム番号を、符号化した圧縮音声データに時系
列順に多重化して出力するフレーム番号付加器を備え、
有音区間から無音区間へ遷移する際には、常に一定のフ
レーム番号から遷移することを特徴とする。
【0016】この構成によれば、フレーム番号付加器を
設け、有音区間から無音区間へ遷移する際には、常に一
定のフレーム番号から遷移するので、復号の際に無音区
間の前フレームのフレーム番号が一定の番号か否かを判
断することで、無音区間の前フレームのデータ損失が発
生していることが分かるので、データ損失時に適切な処
理を行うことが可能となり、背景雑音再生の基となる圧
縮音声データが損失した場合にも、それに続く無音区間
において違和感がないように背景雑音を再生することが
できる。
【0017】請求項3記載の無音圧縮音声符号化復号化
装置は、音声データを圧縮し圧縮音声データとして伝送
する音声符号化処理部および伝送された圧縮音声データ
を復号して再生音声データとする音声復号化処理部を備
えた無音圧縮音声符号化復号化装置において、音声復号
化処理部に、圧縮音声データの復号を行って再生音声デ
ータを出力する音声復号化部と、音声復号化処理部に入
力される圧縮音声データおよび、有音または無音を示す
フラグを一定区間(フレーム)毎に受信した際に、伝送
された順に圧縮データが受信できたかどうか判断する監
視手段と、圧縮音声データ非受信の無音区間における背
景雑音を発生させる際に、監視手段において背景雑音発
生の基となる有音部の圧縮音声データが受信できなかっ
たと判断した場合には、予め用意した擬似雑音データを
選択し、音声復号化部から擬似雑音を再生出力する選択
器とを備えたことを特徴とする。
【0018】この構成によれば、監視手段と選択器を備
えたことにより、無音処理に必要な有音部のデータが損
失した場合にも、異音を発生することなく無音区間での
無音再生音声を出力することが可能となる。また、有音
区間の損失に対して所定のフレーム損失処理を行うこと
が可能となり、有音区間の損失による音声音質の劣化を
防止することができる。
【0019】請求項4記載の無音圧縮音声符号化復号化
装置は、請求項3記載の無音圧縮音声符号化復号化装置
において、監視手段として、入力される圧縮音声データ
および、有音または無音を示すフラグを一定区間(フレ
ーム)毎に受信した際に、圧縮音声データに多重化され
たフレーム番号を分離し、無音フラグを受信した際に、
前フレームのフレーム番号が音声符号化部で付加された
一定のフレーム番号と一致するかどうかを監視するフレ
ーム番号監視器を備えたことを特徴とする。
【0020】この構成によれば、音声復号化処理部で、
圧縮音声データに付加されたフレーム番号を監視するフ
レーム監視器をもつことにより、無音処理に必要な有音
部のデータが損失した場合にも、異音を発生することな
く無音区間での無音再生音声を出力することが可能であ
る。
【0021】請求項5記載の無音圧縮音声符号化復号化
装置は、音声データを圧縮し圧縮音声データとして伝送
する音声符号化処理部および伝送された圧縮音声データ
を復号して再生音声データとする音声復号化処理部を備
えた無音圧縮音声符号化復号化装置において、音声符号
化処理部に、一定区間(フレーム)毎に音声信号が有音
部か無音部かを判断して有音部のみを符号化した圧縮音
声データおよび、無音と判断した場合にも有音部から無
音部への遷移時のみ背景雑音を符号化した中間圧縮音声
データと、有音または中間または無音を示すフラグとを
出力する音声符号化部と、音声復号化処理部に、圧縮音
声データの復号を行って再生音声データを出力する音声
復号化部と、入力される圧縮音声データおよび、有音ま
たは中間または無音を示すフラグを一定区間(フレー
ム)毎に受信した際に、伝送された各圧縮音声データの
フレーム間遷移を時系列順に監視するフレーム遷移監視
器と、圧縮音声データ非受信の無音区間における背景雑
音を発生させる際に、フレーム遷移監視器において背景
雑音発生の基となる中間圧縮音声データが受信できなか
ったと判断した場合には、予め用意した擬似雑音データ
を選択し、音声復号化部から擬似雑音を再生出力させる
選択器とを備えたことを特徴とする。
【0022】この構成によれば、音声復号化処理部で、
フレーム間の遷移を監視するフレーム監視器を持つこと
により、無音処理に必要な中間圧縮音声データが損失し
た場合にも、以前に入力され現在の無音状態とは無関係
な中間圧縮音声データの音声パラメータを基に復号する
ことによる異音の発生を抑え、無音区間での無音再生音
声を出力することが可能である。
【0023】請求項6記載の無音圧縮音声符号化復号化
装置は、請求項5記載の無音圧縮音声符号化復号化装置
において、選択器は、入力される圧縮音声データまたは
中間圧縮音声データおよび、有音または背景雑音または
無音を示すフラグを一定区間(フレーム)毎に受信した
際に、第1番目のフレームが圧縮音声データ非受信の無
音区間であった場合には、予め用意した擬似雑音データ
を選択し、音声復号化部から擬似雑音を再生出力するこ
とを特徴とする。
【0024】この構成によれば、復号処理開始後、第1
番目のフレームフラグの種類を監視する機能をフレーム
監視器に付加することにより、無音処理に必要な音声パ
ラメータが存在しない場合にも、不確定な音声パラメー
タを基に復号することによる異音の発生を抑え、無音区
間での無音再生音声を出力することが可能である。
【0025】請求項7記載の無音圧縮音声符号化復号化
装置は、音声復号化部は、フレーム遷移監視器が背景雑
音発生の基となる中間圧縮音声データを受信できなかっ
たと判断した場合には、そのひとつ前に入力された有音
部の音声圧縮データを基に背景雑音データを発生させる
手段をもつことを特徴とする。
【0026】この構成によれば、無音処理に必要な中間
圧縮音声データが損失した場合にも、以前に入力され現
在の無音状態とは無関係な中間圧縮音声データの音声パ
ラメータを基に復号することによる異音の発生を抑え、
無音区間での無音再生音声を出力することが可能であ
る。
【0027】請求項8記載の無音圧縮音声符号化復号化
装置は、請求項5記載の無音圧縮音声符号化復号化装置
において、音声符号化復号化処理としてITU−T勧告
G.729 Annex B方式およびG.729AA
nnex B方式を適用することを特徴とする。
【0028】この構成によれば、無音処理に必要な中間
圧縮音声データが損失した場合にも、以前に入力され現
在の無音状態とは無関係な中間圧縮音声データの音声パ
ラメータを基に復号することによる異音の発生を抑え、
無音区間での無音再生音声を出力することが可能であ
る。
【0029】以上の構成の無音圧縮音声符号化復号化装
置では、伝送中の圧縮音声データ損失に対しても、音声
音質の劣化を防ぐことが可能となる。
【0030】
【本発明の実施の形態】以下に、本発明の無音圧縮音声
符号化復号化装置の実施の形態について図面を参照しな
がら説明する。
【0031】〔第1の実施の形態〕図1は本発明の第1
の実施の形態の無音圧縮音声符号化復号化装置の構成を
示すブロック図である。本実施の形態は音声符号化処理
部1Xと音声復号化処理部1Yの両方を有するものであ
る。
【0032】音声符号化処理部1Xにおいて、11は入
力音声信号aの有音/無音の判定を行い、有音/無音フ
ラグを出力する有音/無音判定部、12は有音/無音フ
ラグを基に入力音声信号aの符号化処理を行って圧縮音
声データ(音声パラメータ)を出力するとともに、有音
/無音フラグを出力する音声符号化部、13は有音/無
音フラグを基に音声符号化部12より出力された有音部
の圧縮音声データに時系列順に例えば0,1,2,3,
0,1,2,3…と順次繰り返し変化するフレーム番号
を付加し圧縮音声データdを出力するフレーム番号付加
器である。なお、フレーム番号は、上記例だけに限らず
上限値は4以上であってもよい。
【0033】また、音声復号化処理部1Yにおいて、1
4は他の無音圧縮音声符号化復号化装置の音声符号化処
理部からの有音/無音フラグの種類を検出し、有音フラ
グであれば圧縮音声データdに付加されたフレーム番号
を分離し、圧縮音声データdが時系列順に入力されたか
どうかを監視するフレーム監視器、15は予め備えた無
音フレームにおける擬似雑音圧縮音声データ、17は圧
縮音声データ(音声パラメータ)の復号化処理を行って
再生音声データを出力する音声復号化部、16はエラー
情報に基づいて擬似雑音圧縮音声データ15と伝送され
た圧縮音声データbのいずれかを選択して音声復号化部
17に出力する選択器である。
【0034】以上のように構成された無音圧縮音声符号
化復号化装置について、以下にその動作を説明する。
【0035】まず、音声符号化処理部1Xでは、入力音
声信号aを有音/無音判定部11に入力し、ある一定区
間(フレーム)毎に所定の方法で有音区間または、無音
区間を判定し、その結果として有音フラグまたは無音フ
ラグを音声符号化部12へ出力する。なお、上記の有音
区間と無音区間の判定方法としては、例えばフレーム毎
にエネルギーを算出し、そのレベルを無音判定スレッシ
ュホールドレベルとの比較を行う方法が考えられる。
【0036】有音と判定された場合、音声符号化部12
で入力音声信号aの符号化処理を行い圧縮音声データ
(音声パラメータ)をフレーム番号付加器13へ出力す
るとともに、有音フラグを他の無音圧縮音声符号化復号
化装置の音声復号化処理部に出力する。フレーム番号付
加器13に入力された圧縮音声データは時系列順に0,
1,2,3,0,1,…と順に繰り返し変化する2ビッ
トのフレーム番号が付加され圧縮音声データdとして他
の無音圧縮音声符号化復号化装置の音声復号化処理部に
出力される。
【0037】一方、有音/無音判定部11において無音
と判定された場合には、フレーム番号付加器13から入
力されたフレーム番号情報を基に、前フレームが有音区
間でありかつ、フレーム番号が例えば、最終の番号であ
る例えば3である場合は符号化処理を行わず、圧縮音声
データも出力しない。無音フラグのみを他の無音圧縮音
声符号化復号化装置の音声復号化処理部に出力し、圧縮
音声データは出力しない。
【0038】しかし、前フレームが有音フレームであり
かつ、フレーム番号が3以外の場合は有音区間として符
号化処理を行い、圧縮音声データをフレーム番号付加器
13へ出力し、フレーム番号を付加して圧縮音声データ
dを他の無音圧縮音声符号化復号化装置の音声復号化処
理部に出力する。また有音/無音判定部11からの判定
フラグは有音フラグに変更して他の無音圧縮音声符号化
復号化装置の音声復号化処理部に出力する。
【0039】次のフレーム以降、無音区間であれば、前
フレームのフレーム番号が3になるまで上記と同様の無
音区間の有音処理を行い、参照する前フレーム番号が3
になれば、本来の無音区間として符号化処理を止め、圧
縮音声データも出力を停止し、無音フラグのみを音声復
号化処理部に出力する。
【0040】以降有音部データが入力されるまで、継続
して符号化処理を止め、無音フラグのみを他の無音圧縮
音声符号化復号化装置の音声復号化処理部に出力する。
このように音声符号化部12では有音区間から無音区間
へ遷移する場合には必ずフレーム番号が3の有音区間か
ら遷移することになる。
【0041】一方、音声復号化処理部1Yでは、まず有
音/無音フラグおよび、圧縮音声データdがフレーム監
視器14に入力される。有音フラグが入力されれば圧縮
音声データdに付加されたフレーム番号を分離し、本フ
レーム番号を次の圧縮音声データdが入力されるまで保
持する。有音部の圧縮音声データdが連続して入力され
ている間は、フレーム監視器14はエラー無しとして選
択器16に通知するとともに有音フラグを音声符号化部
17に出力する。
【0042】選択器16では入力された圧縮音声データ
dを音声復号化部17に出力し、音声復号化部17にお
いて圧縮音声データを復号して、再生音声信号を出力す
る。
【0043】一方、無音区間を示すフラグが入力された
ときは、フレーム監視器14にて保持している前有音フ
レームのフレーム番号を参照し、フレーム番号が3であ
れば、エラー無しとして選択器16に通知するとともに
無音フラグを音声符号化部17に出力する。音声符号化
部17では前フレームの音声パラメータより背景雑音を
復号する所定の無音処理を行い、再生音声信号を出力す
る。
【0044】しかし、前有音フレームのフレーム番号が
3以外であった場合には、伝送路上でデータ損失が発生
したとして、フレーム監視器14はエラー発生を選択器
16に通知するとともに入力された無音フラグを有音フ
ラグに変更して音声符号化部17に出力する。選択器1
6では予め用意していた擬似雑音圧縮音声データ15を
音声復号化部17に出力する。音声復号化部17では、
有音部の圧縮有音データが入力されたものとして擬似雑
音圧縮音声データ15を復号して、再生音声信号を出力
する。以降、次の有音フレームが入力されるまでは、通
常の無音処理を行い無音に近い再生音声信号を出力す
る。なお、通常の無音処理というのは、前フレームの音
声パラメータより背景雑音を復号する所定の無音処理を
行い、再生音声信号を出力する処理のことである。
【0045】この場合の擬似雑音圧縮音声データは、音
声ゲインのパラメータが最小である圧縮音声データを用
いているため、音声復号化部17では無音に近い再生音
声信号を復号することになる。また、以降の無音フレー
ムの処理では、無音に近い圧縮音声データを基に復号し
ていくため、引き続き無音の再生音声信号を復号でき
る。
【0046】このように音声復号化処理部1Yでは、圧
縮音声データに付加されたフレーム番号を監視するフレ
ーム監視器14をもつことにより、無音処理に必要な有
音部のデータが損失した場合にも、異音を発生すること
なく無音区間での無音再生音声を出力することが可能で
ある。
【0047】なお、有音部の圧縮音声データが連続して
入力されている際に、フレーム監視器14において圧縮
音声データのフレーム番号が時系列順に0,1,2,
3,0,…と遷移しなかった場合にも、フレーム監視器
14がエラー情報を選択器15または、音声符号化処理
部に通知し、所定のフレーム損失処理を動作させること
も可能となる。
【0048】具体的に説明すると、音声符号化部に入力
されたデータがエラーである場合には、音声復号化部に
おいて、入力されたデータの復号をせず、フレーム損失
処理を行う。フレーム損失処理は、前フレームのデータ
を再度復号する処理である。その際、音圧ゲインに1よ
り小さい任意の数値(>0)を乗算することにより、音
圧を下げる。以降、損失処理が続けば、音圧は0に近づ
き無音となる。これによって、音声音質の劣化が防止さ
れる。
【0049】〔第2の実施の形態〕図2は本発明の第2
の実施の形態における無音圧縮音声符号化復号化装置の
構成を示すブロック図である。本実施の形態では音声符
号化処理部2Xと音声復号化処理部2Yの両方を有する
ものである。
【0050】音声符号化処理部2Xにおいて、21は入
力音声信号aの有音/無音の判定を行い、有音/無音フ
ラグを出力する有音/無音判定部、22は有音/無音フ
ラグを基に入力音声信号aの符号化処理を行って圧縮音
声データ(音声パラメータ)を出力するとともに、有音
/中間/無音フラグを出力する音声符号化部である。
【0051】また、音声復号化処理部2Yにおいて、2
3は他の無音圧縮音声符号化復号化装置の音声符号化処
理部からの有音/中間/無音フラグの種類を検出し、所
定のフレーム遷移がされたかどうかを監視するフレーム
監視器、24は予め備えた無音フレームにおける擬似雑
音圧縮音声データ、26は圧縮音声データ(音声パラメ
ータ)の復号を行って再生音声データを出力する音声復
号化部、25は擬似雑音圧縮音声データ24と伝送され
た圧縮音声データeまたはfのいずれかを選択して音声
復号化部26に出力する選択器である。
【0052】以上のように構成された無音圧縮音声符号
化復号化装置について、以下にその動作を説明する。
【0053】まず、音声符号化処理部2Xでは、入力音
声信号aを有音/無音判定部21に入力し、ある一定区
間(フレーム)毎に第1の実施の形態と同様に所定の方
法で有音区間または、無音区間を判定した有音フラグま
たは、無音フラグを音声符号化部22へ出力する。
【0054】有音と判定された場合、音声符号化部22
で入力音声信号aの符号化処理を行い圧縮音声信号(音
声パラメータ)eとともに有音フラグを他の無音圧縮音
声符号化復号化装置の音声復号化処理部に出力する。
【0055】一方、有音/無音判定部21において無音
と判定された場合、有音区間から無音区間へ遷移する最
初の区間では、有音区間と同様の符号化処理を行い、圧
縮音声データeの一部のパラメータのみで構成された中
間圧縮音声データfとともに中間フラグを他の無音圧縮
音声符号化復号化装置の音声復号化処理部に出力する。
それ以外の無音区間では符号化処理を行わず、圧縮音声
データも出力を停止し、無音フラグのみを他の無音圧縮
音声符号化復号化装置の音声復号化処理部に出力する。
【0056】なお、上記した圧縮音声データeの一部の
パラメータのみで構成された中間圧縮音声データfとい
うのは、有音フレームにおける圧縮音声データの中で復
号音声の特徴を決定するパラメータのみで構成された音
声データのことであり、微妙な音圧レベルを決定するパ
ラメータは省略されているということである。
【0057】以降有音部データが入力されるまで、継続
して符号化処理を止め、無音フラグのみを他の無音圧縮
音声符号化復号化装置の音声復号化処理部に出力する。
【0058】このように音声符号化部22では有音区間
から無音区間へ遷移する場合には必ず中間圧縮音声デー
タ区間から遷移することになる。
【0059】音声復号化処理部2Yでは、まず有音/中
間/無音フラグおよび、圧縮音声データe、中間圧縮音
声データfがフレーム監視器23に入力される。有音フ
ラグが入力されれば、本有音フラグを次の区間のフラグ
が入力されるまで保持する。有音部の圧縮音声データe
が連続して入力されている間は、フレーム監視器23は
エラー無しとして選択器25に通知するとともに有音フ
ラグを音声符号化部26に出力する。選択器25では入
力された圧縮音声データeを音声復号化部26に出力
し、音声復号化部26において圧縮音声データを復号し
て、再生音声信号を出力する。
【0060】同様にして中間フラグが入力されれば、本
中間フラグを次の区間のフラグが入力されるまで保持す
る。フレーム監視器23はエラー無しとして選択器25
に通知するとともに中間フラグを音声符号化部26に出
力する。選択器25では入力された中間圧縮音声データ
fを音声復号化部26に出力し、音声復号化部26にお
いて中間圧縮音声データfを復号して、再生音声信号を
出力する。
【0061】一方、無音区間を示すフラグが入力された
ときは、フレーム監視器23にて保持している前フレー
ムのフレームフラグを参照し、フラグの種類が中間フラ
グまたは、無音フラグであれば、エラー無しとして選択
器25に通知するとともに無音フラグを音声復号化部2
6に出力する。音声復号化部26では前フレームの音声
パラメータより背景雑音を復号する所定の無音処理を行
い、再生音声信号を出力する。
【0062】しかし、前フレームのフラグが有音フラグ
であった場合には、伝送路上で中間圧縮音声データの損
失が発生したとして、フレーム監視器23はエラー発生
を選択器25に通知するとともに入力された無音フラグ
を有音フラグに変更して音声符号化部26に出力する。
選択器25では予め用意していた擬似雑音圧縮音声デー
タ24を音声復号化部26に出力する。音声復号化部2
6では、有音部の圧縮有音データが入力されたものとし
て擬似雑音圧縮音声データ24を復号して、再生音声信
号を出力する。
【0063】以降、次の有音フレームが入力されるまで
は、通常の無音処理を行い無音に近い再生音声信号を出
力する。ここで使用する擬似雑音圧縮音声データは第1
の実施の形態で説明したものと同じものである。
【0064】このように音声復号化処理部2Yでは、フ
レーム間の遷移を監視するフレーム監視器23を持つこ
とにより、無音処理に必要な中間圧縮音声データが損失
した場合にも、以前に入力され現在の無音状態とは無関
係な中間圧縮音声データの音声パラメータを基に復号す
ることによる異音の発生を抑え、無音区間での無音再生
音声を出力することが可能である。
【0065】なお、第2の実施の形態の応用例として、
音声復号化処理部2Yにおいて、入力された第1番目の
フレームフラグが無音フラグであった場合には、フレー
ム監視器23よりエラー発生を選択器25に通知すると
ともに入力された無音フラグを有音フラグに変更して音
声復号化部26に出力する。選択器25では予め用意し
ていた擬似雑音圧縮音声データ24を音声復号化部26
に出力する。音声復号化部26では、有音部の圧縮有音
データが入力されたものとして擬似雑音圧縮音声データ
24を復号して、再生音声信号を出力する。
【0066】このように、復号処理開始後、第1番目の
フレームフラグの種類を監視する機能をフレーム監視器
23に付加することにより、無音処理に必要な音声パラ
メータが存在しない場合にも、不確定な音声パラメータ
を基に復号することによる異音の発生を抑え、無音区間
での無音再生音声を出力することが可能である。
【0067】〔第3の実施の形態〕図3は本発明の第3
の実施の形態における無音圧縮音声符号化復号化装置の
構成を示すブロック図である。本実施の形態では音声符
号化処理部3Xと音声復号化処理部3Yの両方を有する
ものであり、音声符号化復号化装置にITU−T勧告
G.729 AnnexB方式を適用したものである。
【0068】音声符号化処理部3Xにおいて、31は入
力音声信号aの有音/無音の判定を行い、判定に対応し
た入力音声信号aの符号化処理を行って圧縮音声データ
(音声パラメータ)g、中間圧縮音声データhおよび、
有音/中間/無音フラグを出力するITU−T勧告G.
729 Annex B方式音声符号化部である。
【0069】また、音声復号化処理部3Yにおいて、3
2は他の無音圧縮音声符号化復号化装置の音声符号化処
理部からの有音/中間/無音フラグの種類を検出し、所
定のフレーム遷移がされたかどうかを監視するフレーム
監視器、33はフレーム監視器32より入力された、有
音/中間/無音フラグおよびエラー情報を基に圧縮音声
データ(音声パラメータ)g,hの復号を行って再生音
声データを出力するITU−T勧告G.729 Ann
ex B方式音声復号化部である。
【0070】以上のように構成された無音圧縮音声符号
化復号化装置について、以下にその動作を説明する。な
お、音声符号化処理部3Xでは、G.729 Anne
xB方式音声符号化部31に有音/無音判定部が含まれ
ており、入力音声信号aをG.729 Annex B
方式音声符号化部に入力した後、第2の実施の形態と同
様に入力音声信号aの符号化処理を行って圧縮音声デー
タ(音声パラメータ)g、中間圧縮音声データhおよ
び、有音/中間/無音フラグを出力する。
【0071】音声復号化処理部3Yのフレーム監視器3
2の動作も第2の実施の形態のフレーム監視器23と同
様のフレーム遷移監視動作を行う。無音フラグを受信し
たフレームでは、前フレームのフラグが有音フラグであ
った場合、伝送路上で中間圧縮音声データhの損失が発
生したとして、フレーム監視器32はエラー発生を通知
するとともに入力された無音フラグを有音フラグに変更
して音声復号化部33に出力する。
【0072】音声復号化部33では、有音フレームかつ
エラー発生の場合、入力された圧縮音声データgを破棄
し、過去の音声パラメータから背景雑音を再生する所定
のフレーム隠蔽処理を行う。フレーム隠蔽処理では、前
フレームの音声パラメータを用いて再度音声を復号する
が、音声ゲインのパラメータ値に1以下の値を乗算した
値を用いて復号することにより再生音声の音圧を下げ、
聴覚上の違和感を軽減している。また、フレーム隠蔽処
理を連続して行うと音声ゲインのパラメータ値は最小値
に近づくため、再生音声は限りなく無音となる。したが
って中間圧縮音声データが損失した後に続く無音区間は
すべてフレーム隠蔽処理とすることで無音の再生が可能
となる。
【0073】このように音声復号化部3Yでは、無音処
理に必要な中間圧縮音声データが損失した場合にも、以
前に入力され現在の無音状態とは無関係な中間圧縮音声
データの音声パラメータを基に復号することによる異音
の発生を抑え、無音区間での無音再生音声を出力するこ
とが可能である。
【0074】なお、上記の各実施の形態では、音声符号
化処理部および音声復号化処理部の両方を有する無音圧
縮音声符号化復号化装置の構成を図示しているが、音声
信号を送る側では、音声符号化処理部があればよく、音
声信号を受ける側では、音声復号化処理部があればよ
い。音声の送受信を行う場合には、両方が必要となる。
【0075】
【発明の効果】本発明の無音圧縮音声符号化復号化装置
によれば、音声復号化部における無音区間での音声再生
に必要な前区間の圧縮音声データが伝送路上で損失した
場合にも、それより以前の無関係な圧縮音声データを使
用することによる異音の発生を防ぐことができる。これ
により、通話時の音声品質を向上させることが可能とな
る。また、圧縮音声での損失に対して、フレーム損失処
理を行うことが可能で、これによっても音声音質の劣化
を防止できる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における無音圧縮音
声符号化復号化装置の構成を示すブロック図である。
【図2】本発明の第2の実施の形態における無音圧縮音
声符号化復号化装置の構成を示すブロック図である。
【図3】本発明の第3の実施の形態における無音圧縮音
声符号化復号化装置の構成を示すブロック図である。
【図4】従来の無音圧縮音声符号化復号化装置の構成を
示すブロック図である。
【符号の説明】
11,21,41 有音/無音判定部 12,22,42 音声符号化部 31 ITU-T G.729 AnnexB方式音声符号化部 13 フレーム番号付加器 14,23,32 フレーム監視器 15,24 擬似雑音圧縮音声データ 16,25 データ選択器 17,26,43 音声復号化部 33 ITU-T G.729 AnnexB方式音声復号化部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 音声データを圧縮し圧縮音声データとし
    て伝送する音声符号化処理部および伝送された圧縮音声
    データを復号して再生音声データとする音声復号化処理
    部を備えた無音圧縮音声符号化復号化装置であって、 前記音声符号化処理部に、一定区間(フレーム)毎に音
    声信号が有音部か無音部かを判断して有音部のみを符号
    化した圧縮音声データと有音または無音を示すフラグと
    を出力する音声符号化部と、音声符号化処理を行ったフ
    レーム数を検出し、フレーム番号を出力するフレーム番
    号出力手段とを備えたことを特徴とする無音圧縮音声符
    号化復号化装置。
  2. 【請求項2】 フレーム番号出力手段として、繰り返し
    変化するフレーム番号を、符号化した圧縮音声データに
    時系列順に多重化して出力するフレーム番号付加器を備
    え、有音区間から無音区間へ遷移する際には、常に一定
    のフレーム番号から遷移することを特徴とする請求項1
    記載の無音圧縮音声符号化復号化装置。
  3. 【請求項3】 音声データを圧縮し圧縮音声データとし
    て伝送する音声符号化処理部および伝送された圧縮音声
    データを復号して再生音声データとする音声復号化処理
    部を備えた無音圧縮音声符号化復号化装置であって、 前記音声復号化処理部に、圧縮音声データの復号を行っ
    て再生音声データを出力する音声復号化部と、前記音声
    復号化処理部に入力される圧縮音声データおよび、有音
    または無音を示すフラグを一定区間(フレーム)毎に受
    信した際に、伝送された順に圧縮データが受信できたか
    どうか判断する監視手段と、圧縮音声データ非受信の無
    音区間における背景雑音を発生させる際に、前記監視手
    段において背景雑音発生の基となる有音部の圧縮音声デ
    ータが受信できなかったと判断した場合には、予め用意
    した擬似雑音データを選択し、前記音声復号化部から擬
    似雑音を再生出力する選択器とを備えたことを特徴とす
    る無音圧縮音声符号化復号化装置。
  4. 【請求項4】 監視手段として、入力される圧縮音声デ
    ータおよび、有音または無音を示すフラグを一定区間
    (フレーム)毎に受信した際に、圧縮音声データに多重
    化されたフレーム番号を分離し、無音フラグを受信した
    際に、前フレームのフレーム番号が音声符号化部で付加
    された一定のフレーム番号と一致するかどうかを監視す
    るフレーム番号監視器を備えたことを特徴とする請求項
    3記載の無音圧縮音声符号化復号化装置。
  5. 【請求項5】 音声データを圧縮し圧縮音声データとし
    て伝送する音声符号化処理部および伝送された圧縮音声
    データを復号して再生音声データとする音声復号化処理
    部を備えた無音圧縮音声符号化復号化装置であって、 前記音声符号化処理部に、一定区間(フレーム)毎に音
    声信号が有音部か無音部かを判断して有音部のみを符号
    化した圧縮音声データおよび、無音と判断した場合にも
    有音部から無音部への遷移時のみ背景雑音を符号化した
    中間圧縮音声データと、有音または中間または無音を示
    すフラグとを出力する音声符号化部と、 前記音声復号化処理部に、圧縮音声データの復号を行っ
    て再生音声データを出力する音声復号化部と、入力され
    る圧縮音声データおよび、有音または中間または無音を
    示すフラグを一定区間(フレーム)毎に受信した際に、
    伝送された各圧縮音声データのフレーム間遷移を時系列
    順に監視するフレーム遷移監視器と、圧縮音声データ非
    受信の無音区間における背景雑音を発生させる際に、前
    記フレーム遷移監視器において背景雑音発生の基となる
    中間圧縮音声データが受信できなかったと判断した場合
    には、予め用意した擬似雑音データを選択し、前記音声
    復号化部から擬似雑音を再生出力させる選択器とを備え
    たことを特徴とする無音圧縮音声符号化復号化装置。
  6. 【請求項6】 選択器は、入力される圧縮音声データま
    たは中間圧縮音声データおよび、有音または背景雑音ま
    たは無音を示すフラグを一定区間(フレーム)毎に受信
    した際に、第1番目のフレームが圧縮音声データ非受信
    の無音区間であった場合には、予め用意した擬似雑音デ
    ータを選択し、音声復号化部から擬似雑音を再生出力す
    ることを特徴とする請求項5記載の無音圧縮音声符号化
    復号化装置。
  7. 【請求項7】 音声復号化処理部は、フレーム遷移監視
    器が背景雑音発生の基となる中間圧縮音声データを受信
    できなかったと判断した場合には、そのひとつ前に入力
    された有音部の音声圧縮データを基に背景雑音データを
    発生させる手段をもつことを特徴とする請求項5記載の
    無音圧縮音声符号化復号化装置。
  8. 【請求項8】 音声符号化復号化処理としてITU−T
    勧告G.729 Annex B方式およびG.729
    AAnnex B方式を適用することを特徴とする請求
    項5記載の無音圧縮音声符号化復号化装置。
JP2000290165A 2000-09-25 2000-09-25 無音圧縮音声符号化復号化装置 Expired - Fee Related JP3734696B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000290165A JP3734696B2 (ja) 2000-09-25 2000-09-25 無音圧縮音声符号化復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000290165A JP3734696B2 (ja) 2000-09-25 2000-09-25 無音圧縮音声符号化復号化装置

Publications (2)

Publication Number Publication Date
JP2002099299A true JP2002099299A (ja) 2002-04-05
JP3734696B2 JP3734696B2 (ja) 2006-01-11

Family

ID=18773434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000290165A Expired - Fee Related JP3734696B2 (ja) 2000-09-25 2000-09-25 無音圧縮音声符号化復号化装置

Country Status (1)

Country Link
JP (1) JP3734696B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011527762A (ja) * 2008-07-09 2011-11-04 サムスン エレクトロニクス カンパニー リミテッド 符号化方式の決定方法及び装置
JP2013528825A (ja) * 2010-04-13 2013-07-11 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン サンプルごとに正確なオーディオ信号表記のための方法、エンコーダ及びデコーダ
WO2014192604A1 (ja) * 2013-05-31 2014-12-04 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011527762A (ja) * 2008-07-09 2011-11-04 サムスン エレクトロニクス カンパニー リミテッド 符号化方式の決定方法及び装置
US9847090B2 (en) 2008-07-09 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for determining coding mode
US10360921B2 (en) 2008-07-09 2019-07-23 Samsung Electronics Co., Ltd. Method and apparatus for determining coding mode
JP2013528825A (ja) * 2010-04-13 2013-07-11 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン サンプルごとに正確なオーディオ信号表記のための方法、エンコーダ及びデコーダ
US9324332B2 (en) 2010-04-13 2016-04-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewan Method and encoder and decoder for sample-accurate representation of an audio signal
WO2014192604A1 (ja) * 2013-05-31 2014-12-04 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JPWO2014192604A1 (ja) * 2013-05-31 2017-02-23 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9905232B2 (en) 2013-05-31 2018-02-27 Sony Corporation Device and method for encoding and decoding of an audio signal

Also Published As

Publication number Publication date
JP3734696B2 (ja) 2006-01-11

Similar Documents

Publication Publication Date Title
JP4518714B2 (ja) 音声符号変換方法
JPH05122165A (ja) 音声信号伝送方法
JPH02288520A (ja) 背景音再生機能付き音声符号復号方式
JPH08335914A (ja) 移動体通信機器
US7443978B2 (en) Method and apparatus for audio coding with noise suppression
JPH10340097A (ja) 快適雑音発生装置及び該装置の構成要素を含む音声エンコーダ及びデコーダ
JPH1049199A (ja) 無音圧縮音声符号化復号化装置
WO2001065542A1 (fr) Dispositif de codage/decodage de la voix et procede associe
JP3061039B2 (ja) 無音圧縮符号復号化方法及びその装置
JPH08314497A (ja) 無音圧縮音声符号化復号化装置
JP2002099299A (ja) 無音圧縮音声符号化復号化装置
JP3649854B2 (ja) 音声符号化装置
JP3487158B2 (ja) 音声符号化伝送システム
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JPH09152899A (ja) 音声符号化切替えシステム
JP3368443B2 (ja) 音声符号化伝送システム及び受信装置
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
JP2006279809A (ja) 音声再生装置および音声再生方法
JP2004053763A (ja) 多地点制御装置の音声符号化伝送システム
JPH0588697A (ja) 欠落音声補間方式
JP4597360B2 (ja) 音声復号装置及び音声復号方法
WO2005057818A1 (ja) 受信装置および方法
JPH07334197A (ja) 音声符号化装置
JPH0736496A (ja) 伝送誤り補償装置
JP3603469B2 (ja) 音声品質改善装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051019

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091028

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091028

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101028

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111028

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121028

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees