JP3119204B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3119204B2
JP3119204B2 JP09172068A JP17206897A JP3119204B2 JP 3119204 B2 JP3119204 B2 JP 3119204B2 JP 09172068 A JP09172068 A JP 09172068A JP 17206897 A JP17206897 A JP 17206897A JP 3119204 B2 JP3119204 B2 JP 3119204B2
Authority
JP
Japan
Prior art keywords
code
audio signal
input audio
output
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09172068A
Other languages
English (en)
Other versions
JPH1124700A (ja
Inventor
利浩 早田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP09172068A priority Critical patent/JP3119204B2/ja
Priority to US09/105,193 priority patent/US6006176A/en
Publication of JPH1124700A publication Critical patent/JPH1124700A/ja
Application granted granted Critical
Publication of JP3119204B2 publication Critical patent/JP3119204B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声符号化装置に関
し、特にVOX(Voice Operated Transmitter)機能を
有する音声符号化装置に関する。
【0002】
【従来の技術】従来、この種のVOX機能を有する音声
符号化装置は、例えば特開平5−122165号公報に
記載された音声信号伝送方法の発明に示されているよう
に、入力音声が無音のときには符号化側で送信を停止
し、ある種の背景雑音を復号化側で生成するために用い
られている。
【0003】図7は、従来例における音声符号化装置の
構成を示すブロック図である。図7に示した音声符号化
装置は、音声信号の入力端1と、有音/無音判定部2
と、高能率符号化部3と、ユニークワード生成部4と、
データ切替部5と、出力端6とを有する構成となってい
る。
【0004】ディジタル無線伝送方式においては、入力
端1から入力された音声信号はフレームと呼ばれる固ま
り毎に切り出されて処理される。このフレームの長さ
は、例えば40msである。
【0005】有音/無音判定部2は、入力端1から1フ
レーム分の音声信号を入力して、現フレームが音声の出
ている有音区間であるか音声の出ていない無音区間であ
るかを判定する。高能率符号化部3は、入力端1から1
フレーム分の音声信号を入力して、高能率符号に変換す
る。ユニークワード生成部4は、プリアンブル信号およ
びポストアンブル信号を生成する。プリアンブル信号
は、無音区間から有音区間に遷移する際に、その遷移を
音声復号化装置(不図示)に知らせるための信号であ
る。ポストアンブル信号は、有音区間から無音区間への
遷移を知らせるとともに、次のフレームで背景雑音更新
用符号が送信されることを示すためにも用いられる。ま
た、ポストアンブル信号は、無音区間が続く間は(T+
2)フレーム毎に送信される。なお、プリアンブル信号
およびポストアンブル信号はともに、通常の場合には高
能率符号には存在しないパターンである。データ切替部
5は、有音/無音判定部2の判定結果に従って、高能率
符号化部3から出力される高能率符号と、ユニークワー
ド生成部4から出力されるプリアンブル信号またはポス
トアンブル信号とのうちのどちらかを選択して、出力端
6から出力する。出力端6は、データ切替部5で選択さ
れたデータを、音声復号化装置に送信する。
【0006】有音/無音判定部2において、現フレーム
が有音区間であると判断された場合には、データ切替部
5は、高能率符号化部3で生成された高能率符号を選択
して出力端6から出力する。一方、現フレームが無音区
間であると判断された場合には、符号化装置が以下に示
すVOX処理を行う。 (1)データ切替部5を切り替えて、ユニークワード生
成部4で生成されたポストアンブル信号を出力端6から
出力する。 (2)データ切替部5を切り替えて、高能率符号化部3
で生成された高能率符号を出力端6から出力する。以
下、ポストアンブル信号の次に送信される高能率符号を
背景雑音更新用符号と記述する。 (3)出力端6からの出力を一定時間停止する。以下、
この一定時間をTフレーム(Tは定数)とする。 (4)一定時間(Tフレーム)後、再び(1)以降の処
理を繰り返す。
【0007】ただし、無音区間中にも、有音/無音判定
部2はフレームごとに有音/無音判定を行う。無音区間
中に有音を検出した場合には、そのフレームでは、VO
X処理に関わらず、ユニークワード生成部4でプリアン
ブル信号を生成する。データ切替部5は、ユニークワー
ド生成部4で生成されたプリアンブル信号を選択して出
力端6から出力する。そして、次のフレームから、通常
の有音区間における処理を行う。すなわち、データ切替
部5は、高能率符号化部3で生成した高能率符号を選択
して出力端6から出力する。
【0008】音声復号化装置は、音声符号化装置の出力
端6から送信される符号化された信号を受信する。ポス
トアンブル信号を受信した場合には、音声復号化装置は
現フレームが無音区間であると認識し、Tフレームの
間、ポストアンブル信号の次のフレームで受信する背景
雑音更新用符号を用いて背景雑音を生成する。なお、背
景雑音は、新たな背景雑音更新用符号を受信する度に更
新される。無音区間中にプリアンブル信号を受信した場
合には、次のフレームからは有音区間であると認識し、
受信した高能率符号から復号化音声を生成する。
【0009】以下、ポストアンブル信号を送信すべきフ
レームをポストアンブル信号送信フレームと記述し、背
景雑音更新用符号を送信すべきフレームを背景雑音更新
フレームと記述し、送信を停止するフレームを送信停止
フレームと記述し、プリアンブル信号を送信すべきフレ
ームをプリアンブル信号送信フレームと記述し、上記以
外のフレームを通常送信フレームと記述する。
【0010】
【発明が解決しようとする課題】上記従来の技術の問題
点は、無音区間に音声復号化装置で生成される背景雑音
が不自然な音になるということである。
【0011】第1の理由は、音声符号化装置が出力する
背景雑音更新用符号が(T+2)フレーム((ポストア
ンブル信号送信フレーム)+(背景雑音更新フレーム)
+Tフレーム)毎に送信されるので、(T+2)フレー
ムの間、同一の背景雑音更新用符号から生成された背景
雑音が連続するからである。
【0012】第2の理由は、背景雑音更新用符号を受信
するとすぐに背景雑音を更新するので、更新前後の背景
雑音の電力値の変動が大きいと、背景雑音の切れ目(更
新時点)で音声復号化装置の受話者に違和感を与えてし
まうからである。
【0013】本発明の目的は、音声復号化装置から出力
される背景雑音が有する違和感を低減する音声符号化装
置を提供することにある。
【0014】
【課題を解決するための手段】本発明の音声符号化装置
は、入力音声信号を入力して該入力音声信号が有音であ
るか無音であるかを判定する有音/無音判定手段(2)
と、該入力音声信号を入力して符号化を行う符号化手段
(3)と、ユニークワードを生成するユニークワード生
成手段(4)と、該符号化手段(3)の出力と該ユニー
クワード生成手段(4)の出力とのうちのどちらかを選
択して出力するデータ切替手段(5)とを有し、該入力
音声信号が有音であるときには該データ切替手段(5)
が該符号化手段(3)の出力を選択し、該入力音声信号
が無音であるときには該入力音声信号から背景雑音を生
成してVOX処理を行う音声符号化装置であって、所定
の期間、該入力音声信号を入力して、該入力音声信号の
平均振幅レベルを算出する振幅レベル判定手段(7)
と、該平均振幅レベルを用いて該入力音声信号の振幅レ
ベルのクリップ値を求め、該クリップ値を用いて該入力
音声信号にクリップ処理を行うクリップ処理手段(8)
と、該入力音声信号と該クリップ処理が施された入力音
声信号とのうちのどちらかを選択して該符号化手段
(3)に入力する入力切替手段(9)とを有し、該入力
切替手段(9)が、該入力音声信号が有音であるときに
は該入力音声信号を選択し、該入力音声信号が無音であ
って背景雑音を更新するための符号を生成するときには
該クリップ処理が施された入力音声信号を選択する。
【0015】ここでクリップ処理とは、振幅レベルの絶
対値を所定の値に制限する処理のことを意味する。すな
わち、入力音声信号値をxとし、クリップ値をc(c≧
0)とし、クリップ処理後の入力音声信号値をyとする
と、クリップ処理は以下の式で表現される。
【0016】
【数1】 ここで、sign(x)はxの符号を表す記号であり、
以下のようになる。
【0017】
【数2】
【0018】このような構成において、振幅レベル判定
手段(7)は、長期間の入力音声信号を取り込み、その
平均振幅レベルを算出する。クリップ処理手段(8)
は、振幅レベル判定手段(2)から算出された平均振幅
レベルを用いて入力音声信号にクリップ処理を行う。さ
らに入力切替手段(9)は、背景雑音更新用符号の生成
時には、クリップ処理手段(8)においてクリップ処理
が施された入力音声信号を符号化手段(3)に入力す
る。
【0019】このようにすることによって、背景雑音更
新用符号生成時に使用される入力音声信号の振幅レベル
の変動が少なくなり、音声復号化装置で受話者が感じる
背景雑音の違和感を軽減することが可能となる。
【0020】また、本発明の音声符号化装置は、入力音
声信号を入力して該入力音声信号が有音であるか無音で
あるかを判定する有音/無音判定手段(2)と、該入力
音声信号を入力して符号化を行う符号化手段(3)と、
ユニークワードを生成するユニークワード生成手段
(4)と、該符号化手段(3)の出力と該ユニークワー
ド生成手段(4)の出力とのうちのどちらかを選択して
出力するデータ切替手段(12)とを有し、該入力音声
信号が有音であるときには該データ切替手段(12)が
該符号化手段(3)の出力を選択し、該入力音声信号が
無音であるときには該入力音声信号から背景雑音を生成
してVOX処理を行う音声符号化装置であって、当該音
声符号化装置が前回出力した信号の第1の符号を保持す
る符号蓄積手段(10)と、該符号化手段(3)が出力
する第2の符号と該符号蓄積手段(10)が出力する該
第1の符号とを入力して、該第1の符号の第1の電力符
号と該第2の符号の第2の電力符号とを比較し、該第1
の電力符号と該第2の電力符号との電力値の差が所定の
閾値以下であるときには該第2の符号を出力し、該第1
の電力符号と該第2の電力符号との電力値の差が該所定
の閾値よりも大きいときには、該電力値の差が該所定の
閾値以下となるように該第2の電力符号の値を変更し
て、変更した該第2の電力符号に対応する符号を新たな
該第2の符号として出力する符号変換手段(11)とを
有し、該データ切替手段(12)が、該入力音声信号が
無音であって背景雑音を更新するための符号を生成する
ときには該符号変換手段(11)の出力を選択する。
【0021】ここで電力符号とは、高能率符号におい
て、入力音声信号の電力値を表す符号である。
【0022】このような構成において、符号蓄積手段
(10)は、前回送信した第1の符号を保持する。符号
変換手段(11)は、背景雑音更新用符号の送信時に、
前回送信した第1の符号の電力符号と今回生成した背景
雑音更新用の第2の符号の電力符号とを比較し、2つの
電力符号の表す電力値の差が所定の閾値よりも大きいと
きには、その差が閾値以下になるように今回生成した第
2の符号の電力符号の値を変更し、変更した電力符号に
対応する符号を新たな第2の符号として送信する。
【0023】このようにすることによって、背景雑音更
新用符号生成時に使用される音声入力信号の電力レベル
の変動が少なくなり、音声復号化装置で受話者が感じる
背景雑音の違和感を軽減することが可能となる。
【0024】
【発明の実施の形態】次に、本発明の実施の形態につい
て、図面を参照して詳細に説明する。
【0025】[第1の実施の形態] [1]構成の説明 図1は、本発明の第1の実施の形態における音声符号化
装置の構成を示すブロック図である。図1に示した音声
符号化装置は、音声信号の入力端1と、有音/無音判定
部2と、高能率符号化部3と、ユニークワード生成部4
と、データ切替部5と、出力端6と、振幅レベル判定部
7と、クリップ処理部8と、入力切替部9とを有する構
成となっている。
【0026】ディジタル無線伝送方式においては、入力
端1から入力された音声信号はフレームと呼ばれる固ま
り毎に切り出されて処理される。このフレームの長さ
は、例えば40msである。
【0027】有音/無音判定部2は、入力端1から1フ
レーム分の音声信号を入力して、入力した現フレームが
有音区間であるか無音区間であるかを判定する。高能率
符号化部3は、入力端1から1フレーム分の入力音声信
号を入力して、1フレームごとに取り出して高能率符号
に変換する。ユニークワード生成部4は、プリアンブル
信号およびポストアンブル信号を生成する。ポストアン
ブル信号は、無音区間が続く間は(T+2)フレーム毎
に送信される。なお、プリアンブル信号およびポストア
ンブル信号はともに、通常の場合には高能率符号には存
在しないパターンである。データ切替部5は、有音/無
音判定部2の判定結果に従って、高能率符号化部3から
出力される高能率符号と、ユニークワード生成部4から
出力されるプリアンブル信号またはポストアンブル信号
とのうちのどちらかを選択して出力端6から出力する。
出力端6は、データ切替部5で選択されたデータを、音
声復号化装置(不図示)に送信する。ただし、送信停止
フレーム時には、何も送信しない。
【0028】振幅レベル判定部7は、長時間にわたって
入力端1から入力音声信号を取り込み、入力音声信号の
平均振幅レベルを算出して、平均振幅レベルをクリップ
処理部8に通知する。クリップ処理部8は、振幅レベル
判定部7で算出された平均振幅レベルを用いて、入力端
1から入力された1フレーム分の入力音声信号に、所定
のクリップ値でクリップ処理を行う。ここでクリップ処
理とは、課題を解決するための手段で説明した処理のこ
とをいう。入力切替部9は、有音/無音判定部2の判定
結果に従って、高能率符号化部3に入力する音声信号の
選択を行う。通常の有音区間であるときには、入力端1
から入力された音声信号をそのまま高能率符号化部3に
入力するが、無音区間であるときには、クリップ処理部
8でクリップ処理が行われた音声信号を高能率符号化部
3に入力する。
【0029】データ切替部5は、有音区間、無音区間の
変化に応じて、以下の5つのうちのいずれかを選択し
て、出力端6に出力するデータを切り替える。 (1)通常送信フレーム時には、高能率符号をそのまま
送信する。 (2)背景雑音更新フレーム時には、背景雑音更新用符
号を送信する。 (3)プリアンブル信号送信フレーム時には、プリアン
ブル信号を送信する。 (4)ポストアンブル信号送信フレーム時には、ポスト
アンブル信号を送信する。 (5)送信停止フレーム時には、送信を停止し、何も送
信しない。
【0030】[2]動作の説明 次に図1および図2を参照して、第1の実施の形態の動
作について説明する。図2は、本発明の第1の実施の形
態における音声符号化装置の動作を示すフローチャート
である。
【0031】最初に、入力端1から1フレーム分の入力
音声信号が入力される(ステップ21;以下、S21と
記述する)。振幅レベル判定部7において、あらかじめ
蓄積されている過去の音声信号と現フレームの入力音声
信号とから平均振幅レベルを算出するとともに、過去の
音声信号を更新する(S22)。算出した平均振幅レベ
ルをクリップ処理部8に入力してクリップ値を算出し、
入力された音声信号にクリップ処理を施した音声信号を
生成する(S23)。入力音声信号が有音/無音判定部
2に入力され、現フレームが有音区間であるか無音区間
であるかを検査する(S24)。
【0032】S24において現フレームが有音区間であ
ると判断されると、現フレームの1つ前のフレームが有
音区間であったか否かを検査する(S25)。
【0033】S25において現フレームの1つ前のフレ
ームが無音区間であると判断されると、ユニークワード
生成部4がプリアンブル信号を生成する(S26)。生
成されたプリアンブル信号は、データ切替部5で選択さ
れて(S32)、出力端6から音声復号化装置に送信さ
れる(S33)。これが、プリアンブル信号送信フレー
ム時における動作である。
【0034】S25において現フレームの1つ前のフレ
ームが有音区間であると判断されると、入力音声信号が
高能率符号化部3に入力されて、高能率符号が生成され
る(S27)。生成された高能率符号は、データ切替部
5で選択されて(S32)、出力端6から音声復号化装
置に送信される(S33)。これが、通常送信フレーム
時における動作である。
【0035】S24において現フレームが無音区間であ
ると判断されると、現フレームがポストアンブル信号送
信フレームであるか否かを検査する(S28)。
【0036】S28において現フレームがポストアンブ
ル信号送信フレームであると判断されると、ユニークワ
ード生成部4がポストアンブル信号を生成する(S2
9)。生成されたポストアンブル信号は、データ切替部
5で選択されて(S32)、出力端6から音声復号化装
置に送信される(S33)。これが、ポストアンブル信
号送信フレーム時における動作である。
【0037】S28において現フレームがポストアンブ
ル信号送信フレームではないと判断されると、現フレー
ムが背景雑音更新フレームであるか否かを検査する(S
30)。
【0038】S30において現フレームが背景雑音更新
フレームであると判断されると、入力切替部9の選択を
切り替えて、クリップ処理部8で生成されたクリップ処
理済みの入力音声信号が高能率符号化部3に入力され、
高能率符号が生成される(S31)。生成された高能率
符号が背景雑音更新用符号であり、この背景雑音更新用
符号がデータ切替部5で選択されて(S32)、出力端
6から音声復号化装置に送信される(S33)。これ
が、背景雑音更新フレーム時における動作である。
【0039】S30において現フレームが背景雑音更新
フレームではないと判断されると、現フレームは送信停
止フレームということになるので、現フレームにおいて
は、音声符号化装置の出力端6からの送信を停止する
(S34)。これが、送信停止フレーム時における動作
である。
【0040】[第2の実施の形態] [1]構成の説明 図3は、本発明の第2の実施の形態における音声符号化
装置の構成を示すブロック図である。図3に示した音声
符号化装置は、音声信号の入力端1と、有音/無音判定
部2と、高能率符号化部3と、ユニークワード生成部4
と、出力端6と、背景雑音更新用符号蓄積部10と、電
力符号変換部11と、出力データ切替部12とを有する
構成となっている。図3に示した音声符号化装置におい
て、図1に示した音声符号化装置と同じ符号を付したも
のは同様の機能を有するので、説明を省略する。
【0041】背景雑音更新用符号蓄積部10は、出力端
6から音声復号化装置(不図示)に前回送信した高能率
符号を蓄積する。ここで、前回送信した高能率符号と
は、ポストアンブル信号、プリアンブル信号または送信
停止時以外に、音声復号化装置に送信する高能率符号の
うちの最も現時点に近い時間に送信された高能率符号を
意味する。例えば、有音区間が連続している箇所であれ
ば前フレームの有音区間の高能率符号となる。一方、無
音区間であれば背景雑音更新用符号となる。
【0042】電力符号変換部11は、無音区間におい
て、高能率符号化部3で生成された現フレームの背景雑
音更新用符号と背景雑音更新用符号蓄積部10に蓄積さ
れている前回送信した高能率符号とを入力する。そし
て、2つの高能率符号のフレームの電力値を表している
電力符号を比較して、2つの電力符号の表す電力値の差
が所定の閾値よりも大きいときには、その差が閾値以下
になるように現フレームの背景雑音更新用符号の電力符
号の値を変更し、変更した電力符号に対応する高能率符
号を新たな背景雑音更新用符号として送信する。
【0043】出力データ切替部12は、有音/無音判定
部2の判定結果に従って、出力端6に出力するデータを
切り替える。プリアンブル信号送信フレーム時、ポスト
アンブル信号送信フレーム時および送信停止フレーム時
における動作は、第1の実施の形態と同じであり、通常
送信フレーム時および背景雑音更新フレーム時における
動作のみが異なる。以下に、通常送信フレーム時および
背景雑音更新フレーム時についてのみ説明する。
【0044】通常送信フレーム時には、入力端1から入
力された入力音声信号が高能率符号化部3に入力されて
高能率符号に変換された後、出力データ切替部12で選
択されて出力端6から出力される。また、その高能率符
号は、背景雑音更新用符号蓄積部10に蓄積される。
【0045】背景雑音更新フレーム時には、入力端1か
ら入力された入力音声信号が高能率符号化部3に入力さ
れて高能率符号に変換される。この高能率符号が、現フ
レームの背景雑音更新用符号となる。そして、現フレー
ムの背景雑音更新用符号と背景雑音更新用符号蓄積部1
0に蓄積されている前回送信された高能率符号とが電力
符号変換部11に入力される。電力符号変換部11で
は、入力された2つの高能率符号の電力符号を比較す
る。そして、2つの電力符号の表す電力値の差が大きい
ときには、その差が小さくなるように現フレームの背景
雑音更新用符号の電力符号を変更して、変更した電力符
号に対応する高能率符号を新たな現フレームの背景雑音
更新用符号とする。その後、電力符号変換部11で算出
された背景雑音更新用符号は、出力データ切替部12で
選択されて出力端6から出力され、背景雑音更新用符号
蓄積部10にも保存される。
【0046】出力データ切替部12が図1で説明した第
1の実施の形態におけるデータ切替部5と異なる点は、
背景雑音更新フレームのときに、図1に示したデータ切
替部5は高能率符号化部3で生成される高能率符号を選
択したが、図3に示した出力データ切替部12は電力符
号変換部11で生成される背景雑音更新用符号を選択す
る点である。
【0047】[2]動作の説明 次に図3および図4を参照して、第2の実施の形態の動
作について説明する。図4は、本発明の第2の実施の形
態における音声符号化装置の動作を示すフローチャート
である。
【0048】図4に示した第2の実施の形態において、
プリアンブル信号送信フレーム時(S54)、ポストア
ンブル信号送信フレーム時(S57)および送信停止フ
レーム時(S64)における動作は、図2で説明した第
1の実施の形態と同じであり、通常送信フレーム時およ
び背景雑音更新フレーム時における動作のみが異なる。
以下に、通常送信フレーム時および背景雑音更新フレー
ム時における動作についてのみ説明する。
【0049】最初に、入力端1から1フレーム分の入力
音声信号が入力される(S51)。入力音声信号が有音
/無音判定部2に入力され、現フレームが有音区間であ
るか無音区間であるかを検査する(S52)。
【0050】S52において現フレームが有音区間であ
ると判断されると、現フレームの1つ前のフレームが有
音区間であったか否かを検査する(S53)。
【0051】S53において現フレームの1つ前のフレ
ームが有音区間であると判断されると、入力音声信号が
そのまま高能率符号化部3に入力されて、高能率符号が
生成される(S55)。生成された高能率符号は、背景
雑音送信用符号蓄積部10に蓄積される(S61)。ま
た、その高能率符号は、出力データ切替部12で選択さ
れて(S62)、出力端6から音声復号化装置に送信さ
れる(S63)。これが、通常送信フレーム時における
動作である。
【0052】S52において現フレームが無音区間であ
ると判断されると、現フレームがポストアンブル信号送
信フレームであるか否かを検査する(S56)。
【0053】S56において現フレームがポストアンブ
ル信号送信フレームではないと判断されると、現フレー
ムが背景雑音更新フレームであるか否かを検査する(S
58)。
【0054】S58において現フレームが背景雑音更新
フレームであると判断されると、入力音声信号がそのま
ま高能率符号化部3に入力されて、高能率符号が生成さ
れる(S59)。生成された高能率符号が現フレームの
背景雑音更新用符号である。現フレームの背景雑音更新
用符号と背景雑音更新用符号蓄積部10に蓄積されてい
る前回送信された高能率符号とを電力符号変換部11に
入力し、2つの高能率符号の電力符号を比較する。そし
て、電力符号の表す電力値の差が大きいときには、その
差が小さくなるように現フレームの背景雑音更新用符号
の電力符号を変更して、変更した電力符号に対応する高
能率符号を新たな現フレームの背景雑音更新用符号とす
る(S60)。電力符号変換部11で算出された背景雑
音更新用符号は、背景雑音送信用符号蓄積部10に蓄積
される(S61)。また、その背景雑音更新用符号は、
出力データ切替部12で選択されて(S62)、出力端
6から音声復号化装置に送信される(S63)。これ
が、背景雑音更新フレーム時における動作である。
【0055】
【実施例】
[第1の実施例]図1、図2および図5を参照して、本
発明の特徴である振幅レベル判定部7の動作(S22)
およびクリップ処理部8の動作(S23)を、第1の実
施の形態よりも詳細に説明する。図5は、本発明の第1
の実施例における入力音声信号の平均振幅レベルとクリ
ップ係数との関係を示す図である。
【0056】S22において振幅レベル判定部7は、以
下の式(3)を実行することによって、平均振幅レベル
aveを求める。また、式(4)を実行することによっ
て、蓄積されている(i+1)だけ過去の入力音声信号
pre[i](i=0〜(Npre−1);iの値が大
きい程昔の信号である)を更新する。
【0057】ここで、各変数は以下のように定義する。 ave :平均振幅レベル N:1フレーム分の音声信号数 Npre :振幅レベル判定部7に蓄積されている過去の音
声信号数(Npre ≧N) in[i] :現フレームにおけるi番目の音声信号の振幅 また、|in[i] |はin[i] の絶対値を表し、|pre[i]|はpr
e[i]の絶対値を表す。
【0058】
【数3】
【0059】
【数4】
【0060】S23においてクリップ処理部8は、以下
の式(5)を実行することによって振幅レベルのクリッ
プ値を求める。また、式(6)を実行することによっ
て、入力音声信号にクリップ処理を施したクリップ処理
済みの入力音声信号を求める。
【0061】ここで、各変数は以下のように定義する。 CL:クリップ値 ave :平均振幅レベル α(ave) :クリップ係数 CLin[i] :i番目のクリップ処理済みの入力音声信号 in[i] :現フレームにおけるi番目の音声信号の振幅
【0062】
【数5】
【0063】
【数6】 ただし、sign(in[i]) はin[i] の符号を表す記号と
する。
【0064】
【数7】
【0065】数5で用いたクリップ係数α(ave) は、例
えば図5に示したような特性を持つものが考えられる。
【0066】[第2の実施例]図3、図4および図6を
参照して、本発明の特徴である電力符号変換部11の動
作(S60)を、第2の実施の形態よりも詳細に説明す
る。図6は、本発明の第2の実施例における電力値と電
力値の差の閾値との関係を示す図である。
【0067】S60において電力符号変換部11は、以
下の式(8)を実行することによって、電力符号GAI
Ncorrを変換する。
【0068】ここで、各変数は以下のように定義する。 GAINcorr:電力符号変換部11によって変換された電力
符号 GAIN:現フレームの背景雑音更新用符号の電力符号 GAINpre :背景雑音更新用符号蓄積部10に蓄積されて
いる前回送信した高能率符号中の電力符号 TH(g) :電力符号がgのときの電力値の差の閾値 f(x) :電力符号xを電力値に変換する関数 g(y) :電力値yを電力符号に変換する関数 A:f(GAIN)−f(GAINpre)
【0069】
【数8】
【0070】数8で用いた電力値の差の閾値TH(g)
は、例えば図6に示したような特性を持つものが考えら
れる。
【0071】
【発明の効果】本発明の効果は、VOX処理を行う音声
符号化装置において、無音区間での音質を向上させるこ
とができるということである。これによって、音声復号
化装置から出力される背景雑音の違和感を低減すること
ができる。
【0072】その理由は、請求項1の発明において、背
景雑音更新用符号を生成するときに使用する入力音声信
号にクリップ処理を行うことによって、背景雑音更新時
において音声レベルが急激に変化することによって生じ
る違和感を軽減するからである。
【0073】その理由は、請求項2の発明において、今
回生成した背景雑音更新用符号の電力符号と前回送信し
た高能率符号の電力符号との電力差が所定の閾値よりも
大きいときには、今回生成した背景雑音更新用符号の電
力符号の値を変更して、変更した電力符号に対応する高
能率符号を新たな背景雑音更新用符号として送信するこ
とによって、背景雑音更新時において音声レベルが急激
に変化することによって生じる違和感を軽減するからで
ある。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における音声符号化
装置の構成を示すブロック図
【図2】本発明の第1の実施の形態における音声符号化
装置の動作を示すフローチャート
【図3】本発明の第2の実施の形態における音声符号化
装置の構成を示すブロック図
【図4】本発明の第2の実施の形態における音声符号化
装置の動作を示すフローチャート
【図5】本発明の第1の実施例における入力音声信号の
平均振幅レベルとクリップ係数との関係を示す図
【図6】本発明の第2の実施例における電力値と電力値
の差の閾値との関係を示す図
【図7】従来例における音声符号化装置の構成を示すブ
ロック図
【符号の説明】
1 入力端 2 有音/無音判定部 3 高能率符号化部 4 ユニークワード生成部 5 データ切替部 6 出力端 7 振幅レベル判定部 8 クリップ処理部 9 入力切替部 10 背景雑音更新用符号蓄積部 11 電力符号変換部 12 出力データ切替部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平9−149104(JP,A) 特開 平5−122165(JP,A) 特開 平8−139688(JP,A) 特開 平7−129195(JP,A) 特許2576782(JP,B2) 特許2808928(JP,B2) 特許2720800(JP,B2) 米国特許6006176(US,A) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 13/08 G10L 19/00 - 21/06 H04J 3/17 H03M 7/30

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声信号を入力して該入力音声信号
    が有音であるか無音であるかを判定する有音/無音判定
    手段と、該入力音声信号を入力して符号化を行う符号化
    手段と、ユニークワードを生成するユニークワード生成
    手段と、該符号化手段の出力と該ユニークワード生成手
    段の出力とのうちのどちらかを選択して出力するデータ
    切替手段とを有し、該入力音声信号が有音であるときに
    は該データ切替手段が該符号化手段の出力を選択し、該
    入力音声信号が無音であるときには該入力音声信号から
    背景雑音を生成してVOX処理を行う音声符号化装置に
    おいて、 所定の期間、該入力音声信号を入力して、該入力音声信
    号の平均振幅レベルを算出する振幅レベル判定手段と、 該平均振幅レベルを用いて該入力音声信号の振幅レベル
    のクリップ値を求め、該クリップ値を用いて該入力音声
    信号にクリップ処理を行うクリップ処理手段と、 該入力音声信号と該クリップ処理が施された入力音声信
    号とのうちのどちらかを選択して該符号化手段に入力す
    る入力切替手段とを有し、 該入力切替手段が、該入力音声信号が有音であるときに
    は該入力音声信号を選択し、該入力音声信号が無音であ
    って背景雑音を更新するための符号を生成するときには
    該クリップ処理が施された入力音声信号を選択すること
    を特徴とする、音声符号化装置。
  2. 【請求項2】 入力音声信号を入力して該入力音声信号
    が有音であるか無音であるかを判定する有音/無音判定
    手段と、該入力音声信号を入力して符号化を行う符号化
    手段と、ユニークワードを生成するユニークワード生成
    手段と、該符号化手段の出力と該ユニークワード生成手
    段の出力とのうちのどちらかを選択して出力するデータ
    切替手段とを有し、該入力音声信号が有音であるときに
    は該データ切替手段が該符号化手段の出力を選択し、該
    入力音声信号が無音であるときには該入力音声信号から
    背景雑音を生成してVOX処理を行う音声符号化装置に
    おいて、 当該音声符号化装置が前回出力した信号の第1の符号を
    保持する符号蓄積手段と、 該符号化手段が出力する第2の符号と該符号蓄積手段が
    出力する該第1の符号とを入力して、該第1の符号の第
    1の電力符号と該第2の符号の第2の電力符号とを比較
    し、該第1の電力符号と該第2の電力符号との電力値の
    差が所定の閾値以下であるときには該第2の符号を出力
    し、該第1の電力符号と該第2の電力符号との電力値の
    差が該所定の閾値よりも大きいときには、該電力値の差
    が該所定の閾値以下となるように該第2の電力符号の値
    を変更して、変更した該第2の電力符号に対応する符号
    を新たな該第2の符号として出力する符号変換手段とを
    有し、 該データ切替手段が、該入力音声信号が無音であって背
    景雑音を更新するための符号を生成するときには該符号
    変換手段の出力を選択することを特徴とする、音声符号
    化装置。
JP09172068A 1997-06-27 1997-06-27 音声符号化装置 Expired - Fee Related JP3119204B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP09172068A JP3119204B2 (ja) 1997-06-27 1997-06-27 音声符号化装置
US09/105,193 US6006176A (en) 1997-06-27 1998-06-26 Speech coding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09172068A JP3119204B2 (ja) 1997-06-27 1997-06-27 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH1124700A JPH1124700A (ja) 1999-01-29
JP3119204B2 true JP3119204B2 (ja) 2000-12-18

Family

ID=15934950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09172068A Expired - Fee Related JP3119204B2 (ja) 1997-06-27 1997-06-27 音声符号化装置

Country Status (2)

Country Link
US (1) US6006176A (ja)
JP (1) JP3119204B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3119204B2 (ja) 1997-06-27 2000-12-18 日本電気株式会社 音声符号化装置
JP4464484B2 (ja) * 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6876965B2 (en) 2001-02-28 2005-04-05 Telefonaktiebolaget Lm Ericsson (Publ) Reduced complexity voice activity detector
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
AUPS102902A0 (en) * 2002-03-13 2002-04-11 Hearworks Pty Ltd A method and system for reducing potentially harmful noise in a signal arranged to convey speech
US20070033042A1 (en) * 2005-08-03 2007-02-08 International Business Machines Corporation Speech detection fusing multi-class acoustic-phonetic, and energy features
US7962340B2 (en) * 2005-08-22 2011-06-14 Nuance Communications, Inc. Methods and apparatus for buffering data for use in accordance with a speech recognition system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2576782B2 (ja) 1993-12-21 1997-01-29 日本電気株式会社 音声通信制御装置
JP2720800B2 (ja) 1994-12-16 1998-03-04 日本電気株式会社 雑音挿入方法および装置
JP2808928B2 (ja) 1991-06-27 1998-10-08 日本電気株式会社 背景雑音電力検出器
US6006176A (en) 1997-06-27 1999-12-21 Nec Corporation Speech coding apparatus

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5926794A (ja) * 1982-08-04 1984-02-13 セイコーインスツルメンツ株式会社 音声装置
JPH0636158B2 (ja) * 1986-12-04 1994-05-11 沖電気工業株式会社 音声分析合成方法及び装置
JP2532618B2 (ja) * 1988-10-31 1996-09-11 松下電器産業株式会社 ピッチ抽出装置
JPH064087A (ja) * 1992-06-17 1994-01-14 Fujitsu Ltd 音声符号化装置
JP2897551B2 (ja) * 1992-10-12 1999-05-31 日本電気株式会社 音声復号化装置
JPH06232957A (ja) * 1993-01-29 1994-08-19 Toshiba Corp 音声通信装置
JP3475446B2 (ja) * 1993-07-27 2003-12-08 ソニー株式会社 符号化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2808928B2 (ja) 1991-06-27 1998-10-08 日本電気株式会社 背景雑音電力検出器
JP2576782B2 (ja) 1993-12-21 1997-01-29 日本電気株式会社 音声通信制御装置
JP2720800B2 (ja) 1994-12-16 1998-03-04 日本電気株式会社 雑音挿入方法および装置
US6006176A (en) 1997-06-27 1999-12-21 Nec Corporation Speech coding apparatus

Also Published As

Publication number Publication date
US6006176A (en) 1999-12-21
JPH1124700A (ja) 1999-01-29

Similar Documents

Publication Publication Date Title
JP5326051B2 (ja) 音声コーデックを備えた補聴器および方法
US5953698A (en) Speech signal transmission with enhanced background noise sound quality
US5937375A (en) Voice-presence/absence discriminator having highly reliable lead portion detection
JP2746033B2 (ja) 音声復号化装置
US6389391B1 (en) Voice coding and decoding in mobile communication equipment
JPWO2005117366A1 (ja) 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
ES2371455T3 (es) Pre-procesamiento de datos digitales de audio para codecs de audio de móvil.
US5809460A (en) Speech decoder having an interpolation circuit for updating background noise
US6424942B1 (en) Methods and arrangements in a telecommunications system
JP3119204B2 (ja) 音声符号化装置
KR100378648B1 (ko) 주변 잡음 레벨 추정 장치, 통신 장치, 데이타 터미날장치 및 주변 잡음 레벨 추정 방법
JPH08314497A (ja) 無音圧縮音声符号化復号化装置
US5555546A (en) Apparatus for decoding a DPCM encoded signal
KR100338606B1 (ko) 피치 강조 방법 및 그 장치
JPH0685767A (ja) ディジタル通信のデコード装置
JP3360423B2 (ja) 音声強調装置
US7031913B1 (en) Method and apparatus for decoding speech signal
JP3649854B2 (ja) 音声符号化装置
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JPH0736496A (ja) 伝送誤り補償装置
JP3225256B2 (ja) 擬似背景雑音生成方法
JP3617503B2 (ja) 音声復号化方法
JP3593183B2 (ja) 音声復号装置
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
JP3113455B2 (ja) 音声復号装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071013

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081013

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091013

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101013

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees