JPH1124700A

JPH1124700A - 音声符号化装置

Info

Publication number: JPH1124700A
Application number: JP9172068A
Authority: JP
Inventors: Toshihiro Hayata; 利浩早田
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1997-06-27
Filing date: 1997-06-27
Publication date: 1999-01-29
Anticipated expiration: 2017-06-27
Also published as: JP3119204B2; US6006176A

Abstract

(57)【要約】【課題】音声復号化装置から出力される背景雑音が有
する違和感を低減する音声符号化装置を提供する。【解決手段】有音／無音判定手段２と符号化手段３と
ユニークワード生成手段４とデータ切替手段５とを有
し、入力音声信号が有音であるときにはデータ切替手段
５が符号化手段３の出力を選択し、入力音声信号が無音
であるときには入力音声信号から背景雑音を生成してＶ
ＯＸ処理を行う音声符号化装置であって、振幅レベル判
定手段７とクリップ処理手段８と入力切替手段９とを有
し、入力切替手段９が、入力音声信号が有音であるとき
には入力音声信号を選択し、入力音声信号が無音であっ
て背景雑音を更新するための符号を生成するときにはク
リップ処理が施された入力音声信号を選択する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声符号化装置に関
し、特にＶＯＸ（Voice Operated Transmitter）機能を
有する音声符号化装置に関する。

【０００２】

【従来の技術】従来、この種のＶＯＸ機能を有する音声
符号化装置は、例えば特開平５−１２２１６５号公報に
記載された音声信号伝送方法の発明に示されているよう
に、入力音声が無音のときには符号化側で送信を停止
し、ある種の背景雑音を復号化側で生成するために用い
られている。

【０００３】図７は、従来例における音声符号化装置の
構成を示すブロック図である。図７に示した音声符号化
装置は、音声信号の入力端１と、有音／無音判定部２
と、高能率符号化部３と、ユニークワード生成部４と、
データ切替部５と、出力端６とを有する構成となってい
る。

【０００４】ディジタル無線伝送方式においては、入力
端１から入力された音声信号はフレームと呼ばれる固ま
り毎に切り出されて処理される。このフレームの長さ
は、例えば４０ｍｓである。

【０００５】有音／無音判定部２は、入力端１から１フ
レーム分の音声信号を入力して、現フレームが音声の出
ている有音区間であるか音声の出ていない無音区間であ
るかを判定する。高能率符号化部３は、入力端１から１
フレーム分の音声信号を入力して、高能率符号に変換す
る。ユニークワード生成部４は、プリアンブル信号およ
びポストアンブル信号を生成する。プリアンブル信号
は、無音区間から有音区間に遷移する際に、その遷移を
音声復号化装置（不図示）に知らせるための信号であ
る。ポストアンブル信号は、有音区間から無音区間への
遷移を知らせるとともに、次のフレームで背景雑音更新
用符号が送信されることを示すためにも用いられる。ま
た、ポストアンブル信号は、無音区間が続く間は（Ｔ＋
２）フレーム毎に送信される。なお、プリアンブル信号
およびポストアンブル信号はともに、通常の場合には高
能率符号には存在しないパターンである。データ切替部
５は、有音／無音判定部２の判定結果に従って、高能率
符号化部３から出力される高能率符号と、ユニークワー
ド生成部４から出力されるプリアンブル信号またはポス
トアンブル信号とのうちのどちらかを選択して、出力端
６から出力する。出力端６は、データ切替部５で選択さ
れたデータを、音声復号化装置に送信する。

【０００６】有音／無音判定部２において、現フレーム
が有音区間であると判断された場合には、データ切替部
５は、高能率符号化部３で生成された高能率符号を選択
して出力端６から出力する。一方、現フレームが無音区
間であると判断された場合には、符号化装置が以下に示
すＶＯＸ処理を行う。（１）データ切替部５を切り替えて、ユニークワード生
成部４で生成されたポストアンブル信号を出力端６から
出力する。（２）データ切替部５を切り替えて、高能率符号化部３
で生成された高能率符号を出力端６から出力する。以
下、ポストアンブル信号の次に送信される高能率符号を
背景雑音更新用符号と記述する。（３）出力端６からの出力を一定時間停止する。以下、
この一定時間をＴフレーム（Ｔは定数）とする。（４）一定時間（Ｔフレーム）後、再び（１）以降の処
理を繰り返す。

【０００７】ただし、無音区間中にも、有音／無音判定
部２はフレームごとに有音／無音判定を行う。無音区間
中に有音を検出した場合には、そのフレームでは、ＶＯ
Ｘ処理に関わらず、ユニークワード生成部４でプリアン
ブル信号を生成する。データ切替部５は、ユニークワー
ド生成部４で生成されたプリアンブル信号を選択して出
力端６から出力する。そして、次のフレームから、通常
の有音区間における処理を行う。すなわち、データ切替
部５は、高能率符号化部３で生成した高能率符号を選択
して出力端６から出力する。

【０００８】音声復号化装置は、音声符号化装置の出力
端６から送信される符号化された信号を受信する。ポス
トアンブル信号を受信した場合には、音声復号化装置は
現フレームが無音区間であると認識し、Ｔフレームの
間、ポストアンブル信号の次のフレームで受信する背景
雑音更新用符号を用いて背景雑音を生成する。なお、背
景雑音は、新たな背景雑音更新用符号を受信する度に更
新される。無音区間中にプリアンブル信号を受信した場
合には、次のフレームからは有音区間であると認識し、
受信した高能率符号から復号化音声を生成する。

【０００９】以下、ポストアンブル信号を送信すべきフ
レームをポストアンブル信号送信フレームと記述し、背
景雑音更新用符号を送信すべきフレームを背景雑音更新
フレームと記述し、送信を停止するフレームを送信停止
フレームと記述し、プリアンブル信号を送信すべきフレ
ームをプリアンブル信号送信フレームと記述し、上記以
外のフレームを通常送信フレームと記述する。

【００１０】

【発明が解決しようとする課題】上記従来の技術の問題
点は、無音区間に音声復号化装置で生成される背景雑音
が不自然な音になるということである。

【００１１】第１の理由は、音声符号化装置が出力する
背景雑音更新用符号が（Ｔ＋２）フレーム（（ポストア
ンブル信号送信フレーム）＋（背景雑音更新フレーム）
＋Ｔフレーム）毎に送信されるので、（Ｔ＋２）フレー
ムの間、同一の背景雑音更新用符号から生成された背景
雑音が連続するからである。

【００１２】第２の理由は、背景雑音更新用符号を受信
するとすぐに背景雑音を更新するので、更新前後の背景
雑音の電力値の変動が大きいと、背景雑音の切れ目（更
新時点）で音声復号化装置の受話者に違和感を与えてし
まうからである。

【００１３】本発明の目的は、音声復号化装置から出力
される背景雑音が有する違和感を低減する音声符号化装
置を提供することにある。

【００１４】

【課題を解決するための手段】本発明の音声符号化装置
は、入力音声信号を入力して該入力音声信号が有音であ
るか無音であるかを判定する有音／無音判定手段（２）
と、該入力音声信号を入力して符号化を行う符号化手段
（３）と、ユニークワードを生成するユニークワード生
成手段（４）と、該符号化手段（３）の出力と該ユニー
クワード生成手段（４）の出力とのうちのどちらかを選
択して出力するデータ切替手段（５）とを有し、該入力
音声信号が有音であるときには該データ切替手段（５）
が該符号化手段（３）の出力を選択し、該入力音声信号
が無音であるときには該入力音声信号から背景雑音を生
成してＶＯＸ処理を行う音声符号化装置であって、所定
の期間、該入力音声信号を入力して、該入力音声信号の
平均振幅レベルを算出する振幅レベル判定手段（７）
と、該平均振幅レベルを用いて該入力音声信号の振幅レ
ベルのクリップ値を求め、該クリップ値を用いて該入力
音声信号にクリップ処理を行うクリップ処理手段（８）
と、該入力音声信号と該クリップ処理が施された入力音
声信号とのうちのどちらかを選択して該符号化手段
（３）に入力する入力切替手段（９）とを有し、該入力
切替手段（９）が、該入力音声信号が有音であるときに
は該入力音声信号を選択し、該入力音声信号が無音であ
って背景雑音を更新するための符号を生成するときには
該クリップ処理が施された入力音声信号を選択する。

【００１５】ここでクリップ処理とは、振幅レベルの絶
対値を所定の値に制限する処理のことを意味する。すな
わち、入力音声信号値をｘとし、クリップ値をｃ（ｃ≧
０）とし、クリップ処理後の入力音声信号値をｙとする
と、クリップ処理は以下の式で表現される。

【００１６】

【数１】ここで、ｓｉｇｎ（ｘ）はｘの符号を表す記号であり、
以下のようになる。

【００１７】

【数２】

【００１８】このような構成において、振幅レベル判定
手段（７）は、長期間の入力音声信号を取り込み、その
平均振幅レベルを算出する。クリップ処理手段（８）
は、振幅レベル判定手段（２）から算出された平均振幅
レベルを用いて入力音声信号にクリップ処理を行う。さ
らに入力切替手段（９）は、背景雑音更新用符号の生成
時には、クリップ処理手段（８）においてクリップ処理
が施された入力音声信号を符号化手段（３）に入力す
る。

【００１９】このようにすることによって、背景雑音更
新用符号生成時に使用される入力音声信号の振幅レベル
の変動が少なくなり、音声復号化装置で受話者が感じる
背景雑音の違和感を軽減することが可能となる。

【００２０】また、本発明の音声符号化装置は、入力音
声信号を入力して該入力音声信号が有音であるか無音で
あるかを判定する有音／無音判定手段（２）と、該入力
音声信号を入力して符号化を行う符号化手段（３）と、
ユニークワードを生成するユニークワード生成手段
（４）と、該符号化手段（３）の出力と該ユニークワー
ド生成手段（４）の出力とのうちのどちらかを選択して
出力するデータ切替手段（１２）とを有し、該入力音声
信号が有音であるときには該データ切替手段（１２）が
該符号化手段（３）の出力を選択し、該入力音声信号が
無音であるときには該入力音声信号から背景雑音を生成
してＶＯＸ処理を行う音声符号化装置であって、当該音
声符号化装置が前回出力した信号の第１の符号を保持す
る符号蓄積手段（１０）と、該符号化手段（３）が出力
する第２の符号と該符号蓄積手段（１０）が出力する該
第１の符号とを入力して、該第１の符号の第１の電力符
号と該第２の符号の第２の電力符号とを比較し、該第１
の電力符号と該第２の電力符号との電力値の差が所定の
閾値以下であるときには該第２の符号を出力し、該第１
の電力符号と該第２の電力符号との電力値の差が該所定
の閾値よりも大きいときには、該電力値の差が該所定の
閾値以下となるように該第２の電力符号の値を変更し
て、変更した該第２の電力符号に対応する符号を新たな
該第２の符号として出力する符号変換手段（１１）とを
有し、該データ切替手段（１２）が、該入力音声信号が
無音であって背景雑音を更新するための符号を生成する
ときには該符号変換手段（１１）の出力を選択する。

【００２１】ここで電力符号とは、高能率符号におい
て、入力音声信号の電力値を表す符号である。

【００２２】このような構成において、符号蓄積手段
（１０）は、前回送信した第１の符号を保持する。符号
変換手段（１１）は、背景雑音更新用符号の送信時に、
前回送信した第１の符号の電力符号と今回生成した背景
雑音更新用の第２の符号の電力符号とを比較し、２つの
電力符号の表す電力値の差が所定の閾値よりも大きいと
きには、その差が閾値以下になるように今回生成した第
２の符号の電力符号の値を変更し、変更した電力符号に
対応する符号を新たな第２の符号として送信する。

【００２３】このようにすることによって、背景雑音更
新用符号生成時に使用される音声入力信号の電力レベル
の変動が少なくなり、音声復号化装置で受話者が感じる
背景雑音の違和感を軽減することが可能となる。

【００２４】

【発明の実施の形態】次に、本発明の実施の形態につい
て、図面を参照して詳細に説明する。

【００２５】［第１の実施の形態］［１］構成の説明図１は、本発明の第１の実施の形態における音声符号化
装置の構成を示すブロック図である。図１に示した音声
符号化装置は、音声信号の入力端１と、有音／無音判定
部２と、高能率符号化部３と、ユニークワード生成部４
と、データ切替部５と、出力端６と、振幅レベル判定部
７と、クリップ処理部８と、入力切替部９とを有する構
成となっている。

【００２６】ディジタル無線伝送方式においては、入力
端１から入力された音声信号はフレームと呼ばれる固ま
り毎に切り出されて処理される。このフレームの長さ
は、例えば４０ｍｓである。

【００２７】有音／無音判定部２は、入力端１から１フ
レーム分の音声信号を入力して、入力した現フレームが
有音区間であるか無音区間であるかを判定する。高能率
符号化部３は、入力端１から１フレーム分の入力音声信
号を入力して、１フレームごとに取り出して高能率符号
に変換する。ユニークワード生成部４は、プリアンブル
信号およびポストアンブル信号を生成する。ポストアン
ブル信号は、無音区間が続く間は（Ｔ＋２）フレーム毎
に送信される。なお、プリアンブル信号およびポストア
ンブル信号はともに、通常の場合には高能率符号には存
在しないパターンである。データ切替部５は、有音／無
音判定部２の判定結果に従って、高能率符号化部３から
出力される高能率符号と、ユニークワード生成部４から
出力されるプリアンブル信号またはポストアンブル信号
とのうちのどちらかを選択して出力端６から出力する。
出力端６は、データ切替部５で選択されたデータを、音
声復号化装置（不図示）に送信する。ただし、送信停止
フレーム時には、何も送信しない。

【００２８】振幅レベル判定部７は、長時間にわたって
入力端１から入力音声信号を取り込み、入力音声信号の
平均振幅レベルを算出して、平均振幅レベルをクリップ
処理部８に通知する。クリップ処理部８は、振幅レベル
判定部７で算出された平均振幅レベルを用いて、入力端
１から入力された１フレーム分の入力音声信号に、所定
のクリップ値でクリップ処理を行う。ここでクリップ処
理とは、課題を解決するための手段で説明した処理のこ
とをいう。入力切替部９は、有音／無音判定部２の判定
結果に従って、高能率符号化部３に入力する音声信号の
選択を行う。通常の有音区間であるときには、入力端１
から入力された音声信号をそのまま高能率符号化部３に
入力するが、無音区間であるときには、クリップ処理部
８でクリップ処理が行われた音声信号を高能率符号化部
３に入力する。

【００２９】データ切替部５は、有音区間、無音区間の
変化に応じて、以下の５つのうちのいずれかを選択し
て、出力端６に出力するデータを切り替える。（１）通常送信フレーム時には、高能率符号をそのまま
送信する。（２）背景雑音更新フレーム時には、背景雑音更新用符
号を送信する。（３）プリアンブル信号送信フレーム時には、プリアン
ブル信号を送信する。（４）ポストアンブル信号送信フレーム時には、ポスト
アンブル信号を送信する。（５）送信停止フレーム時には、送信を停止し、何も送
信しない。

【００３０】［２］動作の説明次に図１および図２を参照して、第１の実施の形態の動
作について説明する。図２は、本発明の第１の実施の形
態における音声符号化装置の動作を示すフローチャート
である。

【００３１】最初に、入力端１から１フレーム分の入力
音声信号が入力される（ステップ２１；以下、Ｓ２１と
記述する）。振幅レベル判定部７において、あらかじめ
蓄積されている過去の音声信号と現フレームの入力音声
信号とから平均振幅レベルを算出するとともに、過去の
音声信号を更新する（Ｓ２２）。算出した平均振幅レベ
ルをクリップ処理部８に入力してクリップ値を算出し、
入力された音声信号にクリップ処理を施した音声信号を
生成する（Ｓ２３）。入力音声信号が有音／無音判定部
２に入力され、現フレームが有音区間であるか無音区間
であるかを検査する（Ｓ２４）。

【００３２】Ｓ２４において現フレームが有音区間であ
ると判断されると、現フレームの１つ前のフレームが有
音区間であったか否かを検査する（Ｓ２５）。

【００３３】Ｓ２５において現フレームの１つ前のフレ
ームが無音区間であると判断されると、ユニークワード
生成部４がプリアンブル信号を生成する（Ｓ２６）。生
成されたプリアンブル信号は、データ切替部５で選択さ
れて（Ｓ３２）、出力端６から音声復号化装置に送信さ
れる（Ｓ３３）。これが、プリアンブル信号送信フレー
ム時における動作である。

【００３４】Ｓ２５において現フレームの１つ前のフレ
ームが有音区間であると判断されると、入力音声信号が
高能率符号化部３に入力されて、高能率符号が生成され
る（Ｓ２７）。生成された高能率符号は、データ切替部
５で選択されて（Ｓ３２）、出力端６から音声復号化装
置に送信される（Ｓ３３）。これが、通常送信フレーム
時における動作である。

【００３５】Ｓ２４において現フレームが無音区間であ
ると判断されると、現フレームがポストアンブル信号送
信フレームであるか否かを検査する（Ｓ２８）。

【００３６】Ｓ２８において現フレームがポストアンブ
ル信号送信フレームであると判断されると、ユニークワ
ード生成部４がポストアンブル信号を生成する（Ｓ２
９）。生成されたポストアンブル信号は、データ切替部
５で選択されて（Ｓ３２）、出力端６から音声復号化装
置に送信される（Ｓ３３）。これが、ポストアンブル信
号送信フレーム時における動作である。

【００３７】Ｓ２８において現フレームがポストアンブ
ル信号送信フレームではないと判断されると、現フレー
ムが背景雑音更新フレームであるか否かを検査する（Ｓ
３０）。

【００３８】Ｓ３０において現フレームが背景雑音更新
フレームであると判断されると、入力切替部９の選択を
切り替えて、クリップ処理部８で生成されたクリップ処
理済みの入力音声信号が高能率符号化部３に入力され、
高能率符号が生成される（Ｓ３１）。生成された高能率
符号が背景雑音更新用符号であり、この背景雑音更新用
符号がデータ切替部５で選択されて（Ｓ３２）、出力端
６から音声復号化装置に送信される（Ｓ３３）。これ
が、背景雑音更新フレーム時における動作である。

【００３９】Ｓ３０において現フレームが背景雑音更新
フレームではないと判断されると、現フレームは送信停
止フレームということになるので、現フレームにおいて
は、音声符号化装置の出力端６からの送信を停止する
（Ｓ３４）。これが、送信停止フレーム時における動作
である。

【００４０】［第２の実施の形態］［１］構成の説明図３は、本発明の第２の実施の形態における音声符号化
装置の構成を示すブロック図である。図３に示した音声
符号化装置は、音声信号の入力端１と、有音／無音判定
部２と、高能率符号化部３と、ユニークワード生成部４
と、出力端６と、背景雑音更新用符号蓄積部１０と、電
力符号変換部１１と、出力データ切替部１２とを有する
構成となっている。図３に示した音声符号化装置におい
て、図１に示した音声符号化装置と同じ符号を付したも
のは同様の機能を有するので、説明を省略する。

【００４１】背景雑音更新用符号蓄積部１０は、出力端
６から音声復号化装置（不図示）に前回送信した高能率
符号を蓄積する。ここで、前回送信した高能率符号と
は、ポストアンブル信号、プリアンブル信号または送信
停止時以外に、音声復号化装置に送信する高能率符号の
うちの最も現時点に近い時間に送信された高能率符号を
意味する。例えば、有音区間が連続している箇所であれ
ば前フレームの有音区間の高能率符号となる。一方、無
音区間であれば背景雑音更新用符号となる。

【００４２】電力符号変換部１１は、無音区間におい
て、高能率符号化部３で生成された現フレームの背景雑
音更新用符号と背景雑音更新用符号蓄積部１０に蓄積さ
れている前回送信した高能率符号とを入力する。そし
て、２つの高能率符号のフレームの電力値を表している
電力符号を比較して、２つの電力符号の表す電力値の差
が所定の閾値よりも大きいときには、その差が閾値以下
になるように現フレームの背景雑音更新用符号の電力符
号の値を変更し、変更した電力符号に対応する高能率符
号を新たな背景雑音更新用符号として送信する。

【００４３】出力データ切替部１２は、有音／無音判定
部２の判定結果に従って、出力端６に出力するデータを
切り替える。プリアンブル信号送信フレーム時、ポスト
アンブル信号送信フレーム時および送信停止フレーム時
における動作は、第１の実施の形態と同じであり、通常
送信フレーム時および背景雑音更新フレーム時における
動作のみが異なる。以下に、通常送信フレーム時および
背景雑音更新フレーム時についてのみ説明する。

【００４４】通常送信フレーム時には、入力端１から入
力された入力音声信号が高能率符号化部３に入力されて
高能率符号に変換された後、出力データ切替部１２で選
択されて出力端６から出力される。また、その高能率符
号は、背景雑音更新用符号蓄積部１０に蓄積される。

【００４５】背景雑音更新フレーム時には、入力端１か
ら入力された入力音声信号が高能率符号化部３に入力さ
れて高能率符号に変換される。この高能率符号が、現フ
レームの背景雑音更新用符号となる。そして、現フレー
ムの背景雑音更新用符号と背景雑音更新用符号蓄積部１
０に蓄積されている前回送信された高能率符号とが電力
符号変換部１１に入力される。電力符号変換部１１で
は、入力された２つの高能率符号の電力符号を比較す
る。そして、２つの電力符号の表す電力値の差が大きい
ときには、その差が小さくなるように現フレームの背景
雑音更新用符号の電力符号を変更して、変更した電力符
号に対応する高能率符号を新たな現フレームの背景雑音
更新用符号とする。その後、電力符号変換部１１で算出
された背景雑音更新用符号は、出力データ切替部１２で
選択されて出力端６から出力され、背景雑音更新用符号
蓄積部１０にも保存される。

【００４６】出力データ切替部１２が図１で説明した第
１の実施の形態におけるデータ切替部５と異なる点は、
背景雑音更新フレームのときに、図１に示したデータ切
替部５は高能率符号化部３で生成される高能率符号を選
択したが、図３に示した出力データ切替部１２は電力符
号変換部１１で生成される背景雑音更新用符号を選択す
る点である。

【００４７】［２］動作の説明次に図３および図４を参照して、第２の実施の形態の動
作について説明する。図４は、本発明の第２の実施の形
態における音声符号化装置の動作を示すフローチャート
である。

【００４８】図４に示した第２の実施の形態において、
プリアンブル信号送信フレーム時（Ｓ５４）、ポストア
ンブル信号送信フレーム時（Ｓ５７）および送信停止フ
レーム時（Ｓ６４）における動作は、図２で説明した第
１の実施の形態と同じであり、通常送信フレーム時およ
び背景雑音更新フレーム時における動作のみが異なる。
以下に、通常送信フレーム時および背景雑音更新フレー
ム時における動作についてのみ説明する。

【００４９】最初に、入力端１から１フレーム分の入力
音声信号が入力される（Ｓ５１）。入力音声信号が有音
／無音判定部２に入力され、現フレームが有音区間であ
るか無音区間であるかを検査する（Ｓ５２）。

【００５０】Ｓ５２において現フレームが有音区間であ
ると判断されると、現フレームの１つ前のフレームが有
音区間であったか否かを検査する（Ｓ５３）。

【００５１】Ｓ５３において現フレームの１つ前のフレ
ームが有音区間であると判断されると、入力音声信号が
そのまま高能率符号化部３に入力されて、高能率符号が
生成される（Ｓ５５）。生成された高能率符号は、背景
雑音送信用符号蓄積部１０に蓄積される（Ｓ６１）。ま
た、その高能率符号は、出力データ切替部１２で選択さ
れて（Ｓ６２）、出力端６から音声復号化装置に送信さ
れる（Ｓ６３）。これが、通常送信フレーム時における
動作である。

【００５２】Ｓ５２において現フレームが無音区間であ
ると判断されると、現フレームがポストアンブル信号送
信フレームであるか否かを検査する（Ｓ５６）。

【００５３】Ｓ５６において現フレームがポストアンブ
ル信号送信フレームではないと判断されると、現フレー
ムが背景雑音更新フレームであるか否かを検査する（Ｓ
５８）。

【００５４】Ｓ５８において現フレームが背景雑音更新
フレームであると判断されると、入力音声信号がそのま
ま高能率符号化部３に入力されて、高能率符号が生成さ
れる（Ｓ５９）。生成された高能率符号が現フレームの
背景雑音更新用符号である。現フレームの背景雑音更新
用符号と背景雑音更新用符号蓄積部１０に蓄積されてい
る前回送信された高能率符号とを電力符号変換部１１に
入力し、２つの高能率符号の電力符号を比較する。そし
て、電力符号の表す電力値の差が大きいときには、その
差が小さくなるように現フレームの背景雑音更新用符号
の電力符号を変更して、変更した電力符号に対応する高
能率符号を新たな現フレームの背景雑音更新用符号とす
る（Ｓ６０）。電力符号変換部１１で算出された背景雑
音更新用符号は、背景雑音送信用符号蓄積部１０に蓄積
される（Ｓ６１）。また、その背景雑音更新用符号は、
出力データ切替部１２で選択されて（Ｓ６２）、出力端
６から音声復号化装置に送信される（Ｓ６３）。これ
が、背景雑音更新フレーム時における動作である。

【００５５】

【実施例】［第１の実施例］図１、図２および図５を参照して、本
発明の特徴である振幅レベル判定部７の動作（Ｓ２２）
およびクリップ処理部８の動作（Ｓ２３）を、第１の実
施の形態よりも詳細に説明する。図５は、本発明の第１
の実施例における入力音声信号の平均振幅レベルとクリ
ップ係数との関係を示す図である。

【００５６】Ｓ２２において振幅レベル判定部７は、以
下の式（３）を実行することによって、平均振幅レベル
ａｖｅを求める。また、式（４）を実行することによっ
て、蓄積されている（ｉ＋１）だけ過去の入力音声信号
ｐｒｅ［ｉ］（ｉ＝０〜（Ｎｐｒｅ−１）；ｉの値が大
きい程昔の信号である）を更新する。

【００５７】ここで、各変数は以下のように定義する。 ave ：平均振幅レベルＮ：１フレーム分の音声信号数Ｎpre ：振幅レベル判定部７に蓄積されている過去の音
声信号数（Ｎpre ≧Ｎ） in[i] ：現フレームにおけるｉ番目の音声信号の振幅また、|in[i] |はin[i] の絶対値を表し、|pre[i]|はpr
e[i]の絶対値を表す。

【００５８】

【数３】

【００５９】

【数４】

【００６０】Ｓ２３においてクリップ処理部８は、以下
の式（５）を実行することによって振幅レベルのクリッ
プ値を求める。また、式（６）を実行することによっ
て、入力音声信号にクリップ処理を施したクリップ処理
済みの入力音声信号を求める。

【００６１】ここで、各変数は以下のように定義する。ＣＬ：クリップ値 ave ：平均振幅レベル α(ave) ：クリップ係数ＣＬin[i] ：ｉ番目のクリップ処理済みの入力音声信号 in[i] ：現フレームにおけるｉ番目の音声信号の振幅

【００６２】

【数５】

【００６３】

【数６】ただし、ｓｉｇｎ(in[i]) はin[i] の符号を表す記号と
する。

【００６４】

【数７】

【００６５】数５で用いたクリップ係数α(ave) は、例
えば図５に示したような特性を持つものが考えられる。

【００６６】［第２の実施例］図３、図４および図６を
参照して、本発明の特徴である電力符号変換部１１の動
作（Ｓ６０）を、第２の実施の形態よりも詳細に説明す
る。図６は、本発明の第２の実施例における電力値と電
力値の差の閾値との関係を示す図である。

【００６７】Ｓ６０において電力符号変換部１１は、以
下の式（８）を実行することによって、電力符号ＧＡＩ
Ｎcorrを変換する。

【００６８】ここで、各変数は以下のように定義する。 GAINcorr：電力符号変換部１１によって変換された電力
符号 GAIN：現フレームの背景雑音更新用符号の電力符号 GAINpre ：背景雑音更新用符号蓄積部１０に蓄積されて
いる前回送信した高能率符号中の電力符号ＴＨ(g) ：電力符号がｇのときの電力値の差の閾値ｆ(x) ：電力符号ｘを電力値に変換する関数ｇ(y) ：電力値ｙを電力符号に変換する関数Ａ：ｆ(GAIN)−ｆ(GAINpre)

【００６９】

【数８】

【００７０】数８で用いた電力値の差の閾値ＴＨ(g)
は、例えば図６に示したような特性を持つものが考えら
れる。

【００７１】

【発明の効果】本発明の効果は、ＶＯＸ処理を行う音声
符号化装置において、無音区間での音質を向上させるこ
とができるということである。これによって、音声復号
化装置から出力される背景雑音の違和感を低減すること
ができる。

【００７２】その理由は、請求項１の発明において、背
景雑音更新用符号を生成するときに使用する入力音声信
号にクリップ処理を行うことによって、背景雑音更新時
において音声レベルが急激に変化することによって生じ
る違和感を軽減するからである。

【００７３】その理由は、請求項２の発明において、今
回生成した背景雑音更新用符号の電力符号と前回送信し
た高能率符号の電力符号との電力差が所定の閾値よりも
大きいときには、今回生成した背景雑音更新用符号の電
力符号の値を変更して、変更した電力符号に対応する高
能率符号を新たな背景雑音更新用符号として送信するこ
とによって、背景雑音更新時において音声レベルが急激
に変化することによって生じる違和感を軽減するからで
ある。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態における音声符号化
装置の構成を示すブロック図

【図２】本発明の第１の実施の形態における音声符号化
装置の動作を示すフローチャート

【図３】本発明の第２の実施の形態における音声符号化
装置の構成を示すブロック図

【図４】本発明の第２の実施の形態における音声符号化
装置の動作を示すフローチャート

【図５】本発明の第１の実施例における入力音声信号の
平均振幅レベルとクリップ係数との関係を示す図

【図６】本発明の第２の実施例における電力値と電力値
の差の閾値との関係を示す図

【図７】従来例における音声符号化装置の構成を示すブ
ロック図

【符号の説明】

１入力端２有音／無音判定部３高能率符号化部４ユニークワード生成部５データ切替部６出力端７振幅レベル判定部８クリップ処理部９入力切替部１０背景雑音更新用符号蓄積部１１電力符号変換部１２出力データ切替部

Claims

【特許請求の範囲】

【請求項１】入力音声信号を入力して該入力音声信号
が有音であるか無音であるかを判定する有音／無音判定
手段と、該入力音声信号を入力して符号化を行う符号化
手段と、ユニークワードを生成するユニークワード生成
手段と、該符号化手段の出力と該ユニークワード生成手
段の出力とのうちのどちらかを選択して出力するデータ
切替手段とを有し、該入力音声信号が有音であるときに
は該データ切替手段が該符号化手段の出力を選択し、該
入力音声信号が無音であるときには該入力音声信号から
背景雑音を生成してＶＯＸ処理を行う音声符号化装置に
おいて、所定の期間、該入力音声信号を入力して、該入力音声信
号の平均振幅レベルを算出する振幅レベル判定手段と、該平均振幅レベルを用いて該入力音声信号の振幅レベル
のクリップ値を求め、該クリップ値を用いて該入力音声
信号にクリップ処理を行うクリップ処理手段と、該入力音声信号と該クリップ処理が施された入力音声信
号とのうちのどちらかを選択して該符号化手段に入力す
る入力切替手段とを有し、該入力切替手段が、該入力音声信号が有音であるときに
は該入力音声信号を選択し、該入力音声信号が無音であ
って背景雑音を更新するための符号を生成するときには
該クリップ処理が施された入力音声信号を選択すること
を特徴とする、音声符号化装置。
【請求項２】入力音声信号を入力して該入力音声信号
が有音であるか無音であるかを判定する有音／無音判定
手段と、該入力音声信号を入力して符号化を行う符号化
手段と、ユニークワードを生成するユニークワード生成
手段と、該符号化手段の出力と該ユニークワード生成手
段の出力とのうちのどちらかを選択して出力するデータ
切替手段とを有し、該入力音声信号が有音であるときに
は該データ切替手段が該符号化手段の出力を選択し、該
入力音声信号が無音であるときには該入力音声信号から
背景雑音を生成してＶＯＸ処理を行う音声符号化装置に
おいて、当該音声符号化装置が前回出力した信号の第１の符号を
保持する符号蓄積手段と、該符号化手段が出力する第２の符号と該符号蓄積手段が
出力する該第１の符号とを入力して、該第１の符号の第
１の電力符号と該第２の符号の第２の電力符号とを比較
し、該第１の電力符号と該第２の電力符号との電力値の
差が所定の閾値以下であるときには該第２の符号を出力
し、該第１の電力符号と該第２の電力符号との電力値の
差が該所定の閾値よりも大きいときには、該電力値の差
が該所定の閾値以下となるように該第２の電力符号の値
を変更して、変更した該第２の電力符号に対応する符号
を新たな該第２の符号として出力する符号変換手段とを
有し、該データ切替手段が、該入力音声信号が無音であって背
景雑音を更新するための符号を生成するときには該符号
変換手段の出力を選択することを特徴とする、音声符号
化装置。