JP2001343984A - 有音/無音判定装置、音声復号化装置及び音声復号化方法 - Google Patents

有音/無音判定装置、音声復号化装置及び音声復号化方法

Info

Publication number
JP2001343984A
JP2001343984A JP2000160723A JP2000160723A JP2001343984A JP 2001343984 A JP2001343984 A JP 2001343984A JP 2000160723 A JP2000160723 A JP 2000160723A JP 2000160723 A JP2000160723 A JP 2000160723A JP 2001343984 A JP2001343984 A JP 2001343984A
Authority
JP
Japan
Prior art keywords
speech
frame
sound
silence
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000160723A
Other languages
English (en)
Inventor
Tadashi Yonezaki
正 米崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000160723A priority Critical patent/JP2001343984A/ja
Publication of JP2001343984A publication Critical patent/JP2001343984A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 復号信号の聴感的な品質の向上を図ると
ともに、有音/無音判定における演算量を削減するこ
と。 【解決手段】 音声合成器201は、逆量子化器103
から出力された復号パラメータに基づいて復号音声を合
成する。特性分析器202は、復号音声の振幅スペクト
ルを分析する。特性保持器203は、有音/無音判定器
104から無音を示す情報を入力した場合には振幅スペ
クトルを更新し、有音を示す情報を入力した場合には振
幅スペクトルを更新せずに保持する。雑音合成器204
は、特性保持器203に保持された振幅スペクトルに基
づいて雑音を合成する。出力切替器205は、通信路誤
りが検出されなかった場合、音声合成器201にて合成
された復号音声を選択し、通信路誤りが検出された場
合、雑音合成器204にて合成された雑音を選択する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自動車電話、携帯
電話等の無線通信システムの通信装置に使用される有音
/無音判定装置、音声復号化装置及び音声復号化方法に
関する。
【0002】
【従来の技術】一般的に音声復号化では受信したパラメ
ータを用いて発声モデルを駆動することにより復号信号
を生成する。
【0003】以下、従来の音声復号化装置の動作につい
て、図14のブロック図を用いて説明する。
【0004】まず、通信路誤り検出器11にて、受信し
たビット系列に対する通信路上での誤り重畳の有無が検
出される。同時に、符号分離器12にて、受信したビッ
ト系列が発声モデルの各モジュールに対応するパラメー
タの符号群に変換される。分割された符号群は、逆量子
化器13にて発声モデルを駆動する入力値(復号パラメ
ータ)に変換される。
【0005】音声復号器14では、通信路誤りの有無に
応じて選択した復号パラメータに基づいて復号音声が合
成される。ここで、通信路誤りが検出されなかった場
合、逆量子化器13から出力された復号パラメータが音
声合成に用いられる。
【0006】一方、通信路誤りが検出された場合、蓄積
されている過去に受信した誤りのない復号パラメータに
基づいて推定された復号パラメータが音声合成に用いら
れる。このパラメータ推定処理は、復号信号の異音を防
ぐため、復号信号の電力を前フレームに対して減衰させ
るようなパラメータとなるように行われる。
【0007】有音/無音判定器15では、復号音声の分
析により音声の状態が有音であるか無音であるかが判定
される。判定結果は、音声復号器14に出力される。音
声復号器14に蓄積されている復号パラメータは、有音
/無音判定器15の判定結果が無音であった場合に随時
更新される。
【0008】このように、従来の音声復号化装置は、無
音時の復号パラメータを蓄積して誤りが検出された場合
にこれを用いることにより、通信路で誤りがある場合に
有音/無音双方の区間で復号音声品質の劣化を抑えてい
る。
【0009】
【発明が解決しようとする課題】しかしながら、上記従
来の音声復号化装置は、通信路誤りに対する補償処理を
有音/無音判定と独立して行い、無音時の復号パラメー
タを繰り返し利用しているため、復号信号の自然性を欠
いてしまうという問題、及び、有音/無音判定における
演算量が多いという問題を有する。
【0010】本発明はかかる点に鑑みてなされたもので
あり、復号信号の聴感的な品質の向上を図ることができ
る音声復号化装置及び音声復号化方法を提供し、有音/
無音判定における演算量を削減することができる有音/
無音判定装置を提供することを目的とする。
【0011】
【課題を解決するための手段】本発明の有音/無音判定
装置は、対象となる信号の特性を予め学習した複数の統
計モデルを有し、入力された符号を出力する各モデルの
確率を前記統計モデルに基づいて算出する生成確率算出
手段と、この生成確率算出手段にて算出された確率に基
づき最大確率のモデルの特性が有音のものか無音のもの
かにより有音/無音の判定を行う特性判定手段とを具備
する構成を採る。
【0012】この構成により、統計モデルを用いること
ができるので、有音/無音判定における演算量を削減す
ることができる。
【0013】本発明の有音/無音判定装置は、対象とな
る信号の特性を予め学習した複数の無音信号モデルのみ
の統計モデルを有し、入力された符号を出力する各モデ
ルの確率を前記統計モデルに基づいて算出する生成確率
算出手段と、この生成確率算出手段にて算出された各モ
デルの確率分布に基づいて無音度を多値判定する無音性
算出手段とを具備する構成を採る。
【0014】この構成により、有音/無音判定情報を2
値でなく、ある確率として出力することができるので、
有音と無音とが切り替わる区間において音声復号化処理
を滑らかに変化させることができる。
【0015】本発明の有音/無音判定装置は、対象とな
る信号の特性を予め学習した統計モデルを有し、入力さ
れた符号を出力する各モデルの確率を前記統計モデルに
基づいて算出する生成確率算出手段と、この生成確率算
出手段にて算出された確率が予め設定された閾値以上か
否かにより有音/無音の判定を行う閾値判定手段とを具
備する構成を採る。
【0016】この構成により、有音/無音判定にヒステ
リシスを持たせることができるので、安定した有音/無
音判定を行うことができる。
【0017】本発明の有音/無音判定装置は、閾値判定
手段は、生成確率算出手段にて算出された確率を正規化
し、正規化後の確率が予め設定された閾値以上か否かに
より有音/無音の判定を行う構成を採る。
【0018】この構成により、モデルの学習を有音/無
音判定と独立させることができるので、閾値設定を容易
に行うことができる。
【0019】本発明の有音/無音判定装置は、生成確率
算出手段は、複数の統計モデルを有する構成を採る。
【0020】この構成により、有音/無音判定の精度を
向上させることができる。
【0021】本発明の有音/無音判定装置は、生成確率
算出手段は、統計モデルとして隠れマルコフモデルを有
し、隠れマルコフモデルの状態を記憶し、入力信号に従
って前記記憶しているモデルの状態を更新し、入力信号
が生起する確率を算出する構成を採る。
【0022】この構成により、隠れマルコフモデルを用
いることができるので、受信した符号の出力確率をその
まま算出することができ、少ない処理量で有音/無音判
定を行うことができる。
【0023】本発明の有音/無音判定装置は、生成確率
算出手段は、各ストリームに対応する入力信号が同時に
生起する確率を算出する構成を採る。
【0024】この構成により、生起確率算出精度を高め
ることができる。
【0025】本発明の有音/無音判定装置は、生成確率
算出手段は、入力信号の種類に従ってストリームを切替
え、入力信号が同時に生起する確率を算出する構成を採
る。
【0026】この構成により、隠れマルコフモデルの各
ストリームを各々のレートで符号化して得られる符号列
に対応させることができるので、通信路の条件によって
符号化レートが適応的に変化する適応マルチレート音声
コーディックに適用することができる。
【0027】本発明の有音/無音判定装置は、生成確率
算出手段は、算出した確率が0であった場合、一定フレ
ーム間、入力信号が生起する確率を0として出力する構
成を採る。
【0028】この構成により、入力信号が生起する確率
が0になった時点から一定フレーム間において、モデル
状態を更新しつつ出力確率を強制的に0にすることがで
きるので、モデル状態が情報源状態に対応していないと
考えられる区間において、誤った有音/無音判定を行っ
てしまうことを防ぐことができる。
【0029】本発明の音声復号化装置は、分離された符
号群を復号パラメータ値へ変換する逆量子化手段と、有
音フレームであるか無音フレームであるかを判定する有
音/無音判定手段と、前記逆量子化手段から出力された
復号パラメータを用いて復号音声を合成し、前記有音/
無音判定手段の判定結果に基づいて復号音声の特性を分
析して雑音を合成する音声復号手段とを具備する構成を
採る。
【0030】本発明の音声復号化装置は、音声復号手段
は、分析した復号音声の特性を一時的に保持し、有音/
無音判定手段が無音フレームと判定した場合に復号音声
の特性を更新し、雑音を合成する構成を採る。
【0031】これらの構成により、復号音声合成前に有
音/無音判定を行い、その結果を用いることができるの
で、有音フレーム及び無音フレームでそれぞれ適した誤
り補償処理を行うことができる。また、復号音声に基づ
いて判定している従来に比べて演算量を削減することが
できる。
【0032】本発明の音声復号化装置は、誤りの有無を
検出する誤り検出手段を具備し、音声復号手段は、前記
誤り検出手段にて誤りが検出された場合、合成した雑音
を出力する構成を採る。
【0033】この構成により、誤りを検出した場合に雑
音を出力することができるので、音切れ感をなくして復
号音声信号の聴感的な品質向上を図ることができる。
【0034】本発明の音声復号化装置は、分離された符
号群を復号パラメータ値へ変換する逆量子化手段と、有
音フレームであるか無音フレームであるかを判定する有
音/無音判定手段と、前記逆量子化手段から出力された
復号パラメータを用いて復号音声を合成する音声復号手
段と、前記有音/無音判定手段の判定結果に基づいて復
号音声に後処理を施す後処理手段とを具備する構成を採
る。
【0035】この構成により、復号音声合成前に有音/
無音判定を行い、その結果を用いることができるので、
有音フレーム及び無音フレームでそれぞれ適した誤り補
償処理を行うことができる。また、復号音声に基づいて
判定している従来に比べて演算量を削減することができ
る。さらに、既成の音声復号器を用いることができる。
【0036】本発明の音声復号化装置は、後処理手段
は、有音/無音判定手段の判定結果に基づいてフィルタ
係数を切替えてフィルタリングする構成を採る。
【0037】この構成により、有音/無音判定結果に基
づいてフィルタ係数を切替えてノイズシェービングを行
うことができるので、高品質な復号信号を得ることがで
きる。
【0038】本発明の音声復号化装置は、後処理手段
は、フィルタ係数を平滑化する構成を採る。
【0039】この構成により、零入力応答のエネルギー
を徐々に減衰させ、フレーム間での異音を感じられない
ようにすることができる。
【0040】本発明の音声復号化装置は、誤りの有無を
検出する誤り検出手段を具備し、後処理手段は、前記誤
り検出手段にて誤りが検出された場合、雑音を出力する
構成を採る。
【0041】この構成により、音切れ感がない高品質な
復号信号を得ることができる。
【0042】本発明の音声復号化装置は、有音/無音判
定手段は、統計モデルを用いて有音フレームであるか無
音フレームであるかを判定する構成を採る。
【0043】この構成により、有音/無音判定におい
て、さらに演算量を削減することができる。
【0044】本発明の音声復号化装置は、有音/無音判
定手段は、分離された符号群に基づいて有音フレームで
あるか無音フレームであるかを判定する構成を採る。
【0045】この構成により、有音/無音判定におい
て、復号パラメータを用いた場合に比べ、さらに演算量
を削減することができる。
【0046】本発明の通信端末装置は、上記いずれかの
有音/無音判定装置を搭載する構成を採る。また、本発
明の通信端末装置は、上記いずれかの音声復号化装置を
搭載する構成を採る。また、本発明の基地局装置は、こ
れらの通信端末装置と無線通信を行う構成を採る。
【0047】これらの構成により、有音フレーム及び無
音フレームでそれぞれ適した誤り補償処理を行うことが
できる。また、復号音声に基づいて判定している従来に
比べて演算量を削減することができる。
【0048】本発明の記録媒体は、コンピュータに、分
離された符号群を復号パラメータ値へ変換する手順と、
有音フレームであるか無音フレームであるかを判定する
手順と、復号パラメータを用いて復号音声を合成し、有
音フレームであるか無音フレームであるかに基づいて復
号音声の特性を分析して雑音を合成する手順とを実行さ
せるための音声復号化プログラムを記録した機械読み取
り可能なものである。
【0049】これにより、有音フレーム及び無音フレー
ムでそれぞれ適した誤り補償処理を行うことができる。
また、復号音声に基づいて判定している従来に比べて演
算量を削減することができる。
【0050】本発明の記録媒体は、分離された符号群を
復号パラメータ値へ変換する手順と、有音フレームであ
るか無音フレームであるかを判定する手順と、復号パラ
メータを用いて復号音声を合成する手順と、有音フレー
ムであるか無音フレームであるかに基づいて復号音声に
後処理を施す手順とを実行させるための音声復号化プロ
グラムを記録した機械読み取り可能なものである。
【0051】これにより、有音フレーム及び無音フレー
ムでそれぞれ適した誤り補償処理を行うことができる。
また、復号音声に基づいて判定している従来に比べて演
算量を削減することができる。さらに、既成の音声復号
器を用いることができる。
【0052】本発明の音声復号化方法は、分離された符
号群を復号パラメータ値へ変換する工程と、有音フレー
ムであるか無音フレームであるかを判定する工程と、復
号パラメータを用いて復号音声を合成し、有音フレーム
であるか無音フレームであるかに基づいて復号音声の特
性を分析して雑音を合成する工程とを具備する方法を採
る。
【0053】この方法により、有音フレーム及び無音フ
レームでそれぞれ適した誤り補償処理を行うことができ
る。また、復号音声に基づいて判定している従来に比べ
て演算量を削減することができる。
【0054】本発明の音声復号化方法は、分離された符
号群を復号パラメータ値へ変換する工程と、有音フレー
ムであるか無音フレームであるかを判定する工程と、復
号パラメータを用いて復号音声を合成する工程と、有音
フレームであるか無音フレームであるかに基づいて復号
音声に後処理を施す工程とをとを具備する方法を採る。
【0055】この方法により、有音フレーム及び無音フ
レームでそれぞれ適した誤り補償処理を行うことができ
る。また、復号音声に基づいて判定している従来に比べ
て演算量を削減することができる。さらに、既成の音声
復号器を用いることができる。
【0056】
【発明の実施の形態】本発明の骨子は、復号音声合成前
に有音/無音判定を行うこと、及び、通信路誤りがあっ
た場合に有音フレーム及び無音フレームでそれぞれ適し
た補償処理を行うことである。
【0057】以下、本発明の実施の形態について、添付
図面を参照して詳細に説明する。
【0058】(実施の形態1)図1は、本発明の実施の
形態1に係る音声復号化装置の構成を示すブロック図で
ある。
【0059】図1において、通信路誤り検出器101
は、通信路より受信したビット列を入力して通信路で生
じた誤りを検出し、通信路誤りの有無を示す通信路誤り
情報を音声復号器105に出力する。
【0060】符号分離器102は、通信路より受信した
ビット列を復号化に用いるモデルに対応するパラメータ
の符号群へ分割し、逆量子化器103に出力する。逆量
子化器103は、符号分離器102にて分離された符号
群を復号パラメータ値へ変換し、有音/無音判定器10
4及び音声復号器105に出力する。
【0061】有音/無音判定器104は、逆量子化器1
03から出力された復号パラメータに基づいて、有音フ
レームであるか無音フレームであるかを判定し、判定結
果を示す有音/無音情報を音声復号器105に出力す
る。
【0062】音声復号器105は、逆量子化器103か
ら出力された復号パラメータを用いて復号音声を合成
し、有音/無音情報の内容に応じて復号パラメータの特
性に基づく雑音を合成する。そして、音声復号器105
は、通信路誤り情報の内容に応じて、復号音声又は雑音
を出力する。
【0063】以下、音声復号器105の内部構成につい
て、図2に示すブロック図を用いて具体的に説明する。
【0064】図2において、音声合成器201は、逆量
子化器103から出力された復号パラメータに基づいて
復号音声を合成し、特性分析器202及び出力切替器2
05に出力する。
【0065】特性分析器202は、音声合成器201か
ら出力された復号音声の振幅スペクトルを分析し、振幅
スペクトルを特性保持器203に出力する。
【0066】特性保持器203は、特性分析器202か
ら出力された振幅スペクトルを一時的に保持する。そし
て、特性保持器203は、有音/無音判定器104から
無音を示す有音/無音情報を入力した場合には振幅スペ
クトルを更新し、有音を示す有音/無音情報を入力した
場合には振幅スペクトルを更新せずに保持する。
【0067】雑音合成器204は、特性保持器203か
ら出力された振幅スペクトルに基づいて雑音を合成し、
出力切替器205に出力する。
【0068】出力切替器205は、通信路誤り検出器1
01から誤りが無かった旨を示す通信路誤り情報を入力
した場合、音声合成器201にて合成された復号音声を
選択し、通信路誤り検出器101から誤りが有った旨を
示す通信路誤り情報を入力した場合、雑音合成器204
にて合成された雑音を選択する。
【0069】このように、復号音声合成前に有音/無音
判定を行い、その結果を用いることにより、有音フレー
ム及び無音フレームでそれぞれ適した誤り補償処理を行
うことができる。そして、誤りを検出した場合に合成雑
音を出力することにより、音切れ感をなくして復号音声
信号の聴感的な品質向上を図ることができる。また、有
音/無音判定器104が、復号パラメータに基づいて判
定しているので、復号音声に基づいて判定している従来
に比べて演算量を削減することができる。
【0070】(実施の形態2)ここで、一般的に音声復
号化装置は、物理モデルを用いて量子化レベルで有音/
無音の判定を行っているが、復号パラメータに基づいて
有音/無音の判定を行う場合、HMM(隠れマルコフモ
デル)等の統計モデルを用いることもできる。
【0071】実施の形態2は、統計モデルを用いる場合
における有音/無音の判定について説明する。なお、本
実施の形態に係る音声復号化装置の構成は、上記図1と
同様である。
【0072】図3は、本実施の形態に係る有音/無音判
定器の内部構成の第1例を示すブロック図である。
【0073】図3に示す有音/無音判定器104は、パ
ラメータ生成確率算出器301と特性判定器302とか
ら主に構成されている。
【0074】パラメータ生成確率算出器301は、対象
となる信号の特性を予め学習した複数の統計モデル有
し、各モデルについて、入力されたパラメータ(あるい
は符号)を出力する確率を算出する。なお、パラメータ
生成確率算出器301が有する統計モデルは、有音信号
モデルと無音信号モデルに分類される。また、統計モデ
ルは特性に従って状態が更新される。
【0075】特性判定器302は、パラメータ生成確率
算出器301にて算出された確率に基づき最大確率のモ
デルの特性が有音のものか無音のものかによって有音/
無音の判定を行う。
【0076】このように、複数の統計モデル有し、入力
されたパラメータを出力する確率が最大のモデルの特性
に基づいて有音/無音判定を行うことにより有音/無音
判定器104における演算量をさらに削減することがで
きる。
【0077】なお、図4に示すように、有音/無音判定
器104は、特性判定器302の代りに無音性算出器3
11を備えても良い。この場合、パラメータ生成確率算
出器301は、統計モデルとして無音信号モデルのみを
用いる。そして、無音性算出器311は、無音信号モデ
ルがパラメータを出力する確率分布を無音度指数として
出力する。
【0078】これにより、有音/無音判定情報を2値で
なく、ある確率として出力することができるので、有音
と無音とが切り替わる区間において音声復号化処理を滑
らかに変化させることができる。
【0079】また、図5に示すように、有音/無音判定
器104は、特性判定器302の代りに閾値判定器32
1を備えても良い。この場合、閾値判定器321は、パ
ラメータ生成確率算出器301から出力された特性の確
率が予め設定された閾値以上であるか否かにより有音/
無音判定を行う。
【0080】これにより、有音/無音判定にヒステリシ
スを持たせることができるので、安定した有音/無音判
定を行うことができる。また、パラメータ生成確率算出
器301に複数の統計モデルを持たせることにより有音
/無音判定の精度を向上させることができる。
【0081】また、図6に示すように、有音/無音判定
器104は、特性判定器302の代りに信号特性算出器
331を備えても良い。この場合、信号特性算出器33
1は、パラメータ生成確率算出器301から出力された
特性の確率を正規化し、正規化された確率が予め設定さ
れた閾値以上であるか否かにより有音/無音の判定を行
う。
【0082】これにより、モデルの学習を有音/無音判
定と独立させることができるので、閾値設定を容易に行
うことができる。また、パラメータ生成確率算出器30
1に複数の統計モデルを持たせることにより有音/無音
判定の精度を向上させることができる。
【0083】次に、パラメータ生成確率算出器301の
内部構成の一例について、図7に示すブロック図を用い
て説明する。
【0084】図7に示すパラメータ生成確率算出器30
1は、HMMの状態を記憶するモデル状態記憶器401
と、入力信号が生起する確立を算出する信号生起算出器
402と、入力信号に基づいてHMMの状態を更新する
モデル状態更新器403とから主に構成されている。H
MMは、統計モデルとして複数の定常状態への重み付け
により非定常状態を表現することができ、情報源の状態
を正確にモデル化することができるモデルである。
【0085】HMMでは、それぞれの状態に遷移してい
る確率の分布によって情報源の状態を推定する。すなわ
ち、モデル状態記憶器401は確率分布を記憶する。
【0086】以下の説明では、HMMの状態数をN状態
とし、モデル状態すなわち確率分布をπ(t)={πs(t)
│s=1,2,…,N状態}と記す。また、初期状態をπ(0)
={πs(0)=1/N状態│s=1,2,…,N状態}とする。さ
らに、本実施の形態では1状態遷移でN符号個の符号を
同時に出力するものとする。
【0087】信号生起算出器402は、モデル状態記憶
器401に記憶されているモデル状態π(t)を用いて、
受信符号C(t)={πi(t)│i=1,2,…,N符号}を出力
する確率を以下の式(1)にて算出する。
【0088】
【数1】 式(1)において、αi jは状態iからjに遷移する確
率であり、βi j(Ck(t))は状態iからjの遷移で第
kストリームからCk(t)が出力される確率である。
【0089】モデル状態更新器403は、受信符号を用
いて、以下に示す式(2)にてモデル状態の更新すなわ
ち受信符号を出力した後の確率分布を算出する。
【0090】
【数2】 このように、HMMを用いることにより受信した符号の
出力確率をそのまま算出することができるので、少ない
処理量で有音/無音判定を行うことができる。
【0091】また、各ストリームに対応する入力信号が
同時に生起する確率を算出することにより、生起確率算
出精度を高めることができる。
【0092】なお、パラメータ生成確率算出器301
は、図8に示すように、入力される符号の種類に応じて
確率算出に用いるストリームを切替えるストリーム選択
器404を追加具備することもできる。
【0093】この場合、信号生起算出器402は、スト
リーム選択器404にて選択されたストリームにより、
入力信号が同時に生起する確率を以下に示す式(3)に
て算出する。
【0094】
【数3】 モデル状態更新器403は、受信符号を用いて、以下に
示す式(4)にてモデル状態の更新すなわち受信符号を
出力した後の確率分布を算出する。
【0095】
【数4】 この場合、HMMの各ストリームを各々のレートで符号
化して得られる符号列に対応させることにより、通信路
の条件によって符号化レートが適応的に変化する適応マ
ルチレート音声コーディックに適用することができる。
【0096】さらに、パラメータ生成確率算出器301
は、図9に示すように、カウンタ設定器411と、カウ
ンタ減算器412と、生起確率設定器413とを追加具
備することもできる。
【0097】カウンタ設定器411は、信号生起算出器
402において算出された入力信号が生起する確率が0
になったことを検知した場合、その旨を生起確率設定器
413に出力し、カウンタ減算器412に内蔵されたカ
ウンタを所定の値に設定する。
【0098】カウンタ減算器412は、内蔵するカウン
タをフレーム単位でデクリメントし、カウンタ値が0と
なった場合、その旨を示す信号を生起確率設定器413
に出力する。
【0099】生起確率設定器413は、カウンタ設定器
411において入力信号が生起する確率が0になったこ
とを検知してからカウンタ値が0となるまで、入力信号
が生起する確率を0として出力する。
【0100】これにより、入力信号が生起する確率が0
になった時点から一定フレーム間において、モデル状態
を更新しつつ出力確率を強制的に0にすることができる
ので、モデル状態が情報源状態に対応していないと考え
られる区間において、誤った有音/無音判定を行ってし
まうことを防ぐことができる。
【0101】なお、有音/無音判定器104は、統計モ
デルを用いた場合、図10に示すように、符号分離器1
02にて分離された符号群に基づいて有音/無音判定を
行うこともできる。これにより有音/無音判定器104
における演算量をさらに削減することができる。
【0102】(実施の形態3)図11は、本発明の実施
の形態3に係る音声復号化装置の構成を示すブロック図
である。なお、図11に示す音声復号化装置において、
図1に示した音声復号化装置と共通する構成部分には、
図1と同一符号を付して説明を省略する。
【0103】図11に示す音声復号化装置は、図1と比
較して、音声復号器501の作用が音声復号器105と
異なり、後処理器502を追加した構成を採る。
【0104】音声復号器501は、従来と同様に逆量子
化器103から出力された復号パラメータを用いて復号
音声を合成し、後処理器502に出力する。
【0105】後処理器502は、有音/無音情報の内容
及び通信路誤り情報の内容に応じて、音声復号器501
から出力された復号音声に対して後処理を行う。後処理
器502を備えることにより、既成の音声復号器を用い
ることができる。
【0106】以下、後処理器502の内部構成の第1例
について、図12に示すブロック図を用いて具体的に説
明する。
【0107】図12において、無音パワー算出器601
は、誤りが検出されていない無音区間の信号の電力を測
定し一定区間に渡って平均化する。
【0108】雑音付加器602は、誤りが検出された無
音区間に白色雑音を付加し、無音パワー算出器601で
算出された最新の誤りが検出されていない無音区間の信
号の電力で白色雑音を付加した信号を出力する。
【0109】これにより、音切れ感がない高品質な復号
信号を得ることができる。
【0110】なお、上記図4に示したように、有音/無
音判定器104が無音性算出器311を備える場合、有
音/無音判定情報を2値でなく無音区間である確率とし
て出力することができるので、雑音付加器602は、誤
りが検出された無音区間に、無音度に応じて白色雑音を
付加することができる。
【0111】ここで、音声コーデックにおいては、量子
化誤差を聴感上目立たなくするために、ポストフィルタ
と呼ばれる極強調のフィルタリング処理であるノイズシ
ェービングが行われる場合がある。
【0112】音声信号に対してノイズシェービングを行
うことにより、聴感品質を向上させることができる。た
だし、無音信号に対して音声信号と同様の極強調を行う
と不自然な復号信号となってしまう。
【0113】図13は、有音/無音に応じたノイズシェ
ービングを行うための後処理器502の構成を示すブロ
ック図である。図13に示す後処理器502は、上記図
12に対し、有音係数帳611と、無音係数帳612
と、係数選択器613と、係数平滑化器614と、フィ
ルタ615とを追加した構成を採る。
【0114】有音係数帳611は有音区間に対するフィ
ルタ係数を蓄積し、無音係数帳612は無音区間に対す
るフィルタ係数を蓄積する。特に無音係数帳612は、
極が強調されないようにするため、係数として0又は0
に近い値を蓄積する。
【0115】係数選択器613は、有音/無音判定結果
に基づいて、有音係数帳611あるいは無音係数帳61
2に蓄積されているフィルタ係数のいずれか一方を選択
し、係数平滑化器614に出力する。
【0116】係数平滑化器614は、係数選択器613
からフィルタ係数を、係数選択器613におけるフィル
タ係数の切替えによって復号信号の品質劣化が生じない
ように平滑化する。これにより、零入力応答のエネルギ
ーを徐々に減衰させ、フレーム間での異音を感じられな
いようにすることができる。係数平滑化器614は、平
滑化後のフィルタ係数をフィルタ615に出力する。
【0117】フィルタ615は、音声復号器501から
出力された復号音声に対して、係数平滑化器614から
出力されたフィルタ係数を用いてノイズシェービングを
行う。
【0118】このように、有音/無音判定結果に基づい
てフィルタ係数を切替えてノイズシェービングを行うこ
とにより、高品質な復号信号を得ることができる。
【0119】
【発明の効果】以上説明したように、本発明によれば、
復号音声合成前に有音/無音判定を行い、その結果を用
いることにより、有音フレーム及び無音フレームでそれ
ぞれ適した誤り補償処理を行うことができる。そして、
誤りを検出した場合に合成雑音を出力することにより、
音切れ感をなくして復号音声信号の聴感的な品質向上を
図ることができる。また、復号音声合成前に有音/無音
判定を行うことにより、復号音声に基づいて判定してい
る従来に比べて演算量を削減することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る音声復号化装置の
構成を示すブロック図
【図2】上記実施の形態に係る音声復号化装置の音声復
号器の内部構成を示すブロック図
【図3】本発明の実施の形態2に係る音声復号化装置の
有音/無音判定器の内部構成の第1例を示すブロック図
【図4】上記実施の形態に係る音声復号化装置の有音/
無音判定器の内部構成の第2例を示すブロック図
【図5】上記実施の形態に係る音声復号化装置の有音/
無音判定器の内部構成の第3例を示すブロック図
【図6】上記実施の形態に係る音声復号化装置の有音/
無音判定器の内部構成の第4例を示すブロック図
【図7】上記実施の形態に係る音声復号化装置のパラメ
ータ生成確率算出器の内部構成の第1例を示すブロック
【図8】上記実施の形態に係る音声復号化装置のパラメ
ータ生成確率算出器の内部構成の第2例を示すブロック
【図9】上記実施の形態に係る音声復号化装置のパラメ
ータ生成確率算出器の内部構成の第3例を示すブロック
【図10】上記実施の形態に係る音声復号化装置の構成
を示すブロック図
【図11】本発明の実施の形態3に係る音声復号化装置
の構成を示すブロック図
【図12】上記実施の形態に係る音声復号化装置の後処
理器の内部構成の第1例を示すブロック図
【図13】上記実施の形態に係る音声復号化装置の後処
理器の内部構成の第2例を示すブロック図
【図14】従来の音声復号化装置の構成を示すブロック
【符号の説明】
101 通信路誤り検出器 104 有音/無音判定器 105、501 音声復号器 201 音声合成器 202 特性分析器 203 特性保持器 204 雑音合成器 205 出力切替器 301 パラメータ生成確率算出器 302 特性判定器 311 無音性算出器 321 閾値判定器 331 信号特性算出器 502 後処理器 601 無音パワー算出器 602 雑音付加器 611 有音係数帳 612 無音係数帳 613 係数選択器 614 係数平滑化器 615 フィルタ
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D015 DD03 5D045 DA20 5J064 AA01 BB08 BB12 BC02 BC11 BC17 BC21 BC22 BC28 BD02 BD03 5K041 AA04 BB08 CC01 DD02 FF32 GG11 HH24 HH43

Claims (25)

    【特許請求の範囲】
  1. 【請求項1】 対象となる信号の特性を予め学習した複
    数の統計モデルを有し、入力された符号を出力する各モ
    デルの確率を前記統計モデルに基づいて算出する生成確
    率算出手段と、この生成確率算出手段にて算出された確
    率に基づき最大確率のモデルの特性が有音のものか無音
    のものかにより有音/無音の判定を行う特性判定手段と
    を具備することを特徴とする有音/無音判定装置。
  2. 【請求項2】 対象となる信号の特性を予め学習した複
    数の無音信号モデルのみの統計モデルを有し、入力され
    た符号を出力する各モデルの確率を前記統計モデルに基
    づいて算出する生成確率算出手段と、この生成確率算出
    手段にて算出された各モデルの確率分布に基づいて無音
    度を多値判定する無音性算出手段とを具備することを特
    徴とする有音/無音判定装置。
  3. 【請求項3】 対象となる信号の特性を予め学習した統
    計モデルを有し、入力された符号を出力する各モデルの
    確率を前記統計モデルに基づいて算出する生成確率算出
    手段と、この生成確率算出手段にて算出された確率が予
    め設定された閾値以上か否かにより有音/無音の判定を
    行う閾値判定手段とを具備することを特徴とする有音/
    無音判定装置。
  4. 【請求項4】 閾値判定手段は、生成確率算出手段にて
    算出された確率を正規化し、正規化後の確率が予め設定
    された閾値以上か否かにより有音/無音の判定を行うこ
    とを特徴とする請求項3記載の有音/無音判定装置。
  5. 【請求項5】 生成確率算出手段は、複数の統計モデル
    を有することを特徴とする請求項3又は請求項4記載の
    有音/無音判定装置。
  6. 【請求項6】 生成確率算出手段は、統計モデルとして
    隠れマルコフモデルを有し、隠れマルコフモデルの状態
    を記憶し、入力信号に従って前記記憶しているモデルの
    状態を更新し、入力信号が生起する確率を算出すること
    を特徴とする請求項1から請求項5のいずれかに記載の
    有音/無音判定装置。
  7. 【請求項7】 生成確率算出手段は、各ストリームに対
    応する入力信号が同時に生起する確率を算出することを
    特徴とする請求項6記載の有音/無音判定装置。
  8. 【請求項8】 生成確率算出手段は、入力信号の種類に
    従ってストリームを切替え、入力信号が同時に生起する
    確率を算出することを特徴とする請求項7記載の有音/
    無音判定装置。
  9. 【請求項9】 生成確率算出手段は、算出した確率が0
    であった場合、一定フレーム間、入力信号が生起する確
    率を0として出力することを特徴とする請求項6から請
    求項8のいずれかに記載の有音/無音判定装置。
  10. 【請求項10】 分離された符号群を復号パラメータ値
    へ変換する逆量子化手段と、有音フレームであるか無音
    フレームであるかを判定する有音/無音判定手段と、前
    記逆量子化手段から出力された復号パラメータを用いて
    復号音声を合成し、前記有音/無音判定手段の判定結果
    に基づいて復号音声の特性を分析して雑音を合成する音
    声復号手段とを具備することを特徴とする音声復号化装
    置。
  11. 【請求項11】 音声復号手段は、分析した復号音声の
    特性を一時的に保持し、有音/無音判定手段が無音フレ
    ームと判定した場合に復号音声の特性を更新し、雑音を
    合成することを特徴とする請求項10記載の音声復号化
    装置。
  12. 【請求項12】 誤りの有無を検出する誤り検出手段を
    具備し、音声復号手段は、前記誤り検出手段にて誤りが
    検出された場合、合成した雑音を出力することを特徴と
    する請求項10又は請求項11記載の音声復号化装置。
  13. 【請求項13】 分離された符号群を復号パラメータ値
    へ変換する逆量子化手段と、有音フレームであるか無音
    フレームであるかを判定する有音/無音判定手段と、前
    記逆量子化手段から出力された復号パラメータを用いて
    復号音声を合成する音声復号手段と、前記有音/無音判
    定手段の判定結果に基づいて復号音声に後処理を施す後
    処理手段とを具備することを特徴とする音声復号化装
    置。
  14. 【請求項14】 後処理手段は、有音/無音判定手段の
    判定結果に基づいてフィルタ係数を切替えてフィルタリ
    ングすることを特徴とする請求項13記載の音声復号化
    装置。
  15. 【請求項15】 後処理手段は、フィルタ係数を平滑化
    することを特徴とする請求項14記載の音声復号化装
    置。
  16. 【請求項16】 誤りの有無を検出する誤り検出手段を
    具備し、後処理手段は、前記誤り検出手段にて誤りが検
    出された場合、雑音を出力することを特徴とする請求項
    13から請求項15のいずれかに記載の音声復号化装
    置。
  17. 【請求項17】 有音/無音判定手段は、統計モデルを
    用いて有音フレームであるか無音フレームであるかを判
    定することを特徴とする請求項10から請求項16のい
    ずれかに記載の音声復号化装置。
  18. 【請求項18】 有音/無音判定手段は、分離された符
    号群に基づいて有音フレームであるか無音フレームであ
    るかを判定することを特徴とする請求項17記載の音声
    復号化装置。
  19. 【請求項19】 請求項1から請求項9のいずれかに記
    載の有音/無音判定装置を搭載することを特徴とする通
    信端末装置。
  20. 【請求項20】 請求項10から請求項18のいずれか
    に記載の音声復号化装置を搭載することを特徴とする通
    信端末装置。
  21. 【請求項21】 請求項19又は請求項20記載の通信
    端末装置と無線通信を行うことを特徴とする基地局装
    置。
  22. 【請求項22】 コンピュータに、分離された符号群を
    復号パラメータ値へ変換する手順と、有音フレームであ
    るか無音フレームであるかを判定する手順と、復号パラ
    メータを用いて復号音声を合成し、有音フレームである
    か無音フレームであるかに基づいて復号音声の特性を分
    析して雑音を合成する手順とを実行させるための音声復
    号化プログラムを記録した機械読み取り可能な記録媒
    体。
  23. 【請求項23】 分離された符号群を復号パラメータ値
    へ変換する手順と、有音フレームであるか無音フレーム
    であるかを判定する手順と、復号パラメータを用いて復
    号音声を合成する手順と、有音フレームであるか無音フ
    レームであるかに基づいて復号音声に後処理を施す手順
    とを実行させるための音声復号化プログラムを記録した
    機械読み取り可能な記録媒体。
  24. 【請求項24】 分離された符号群を復号パラメータ値
    へ変換する工程と、有音フレームであるか無音フレーム
    であるかを判定する工程と、復号パラメータを用いて復
    号音声を合成し、有音フレームであるか無音フレームで
    あるかに基づいて復号音声の特性を分析して雑音を合成
    する工程とを具備することを特徴とする音声復号化方
    法。
  25. 【請求項25】 分離された符号群を復号パラメータ値
    へ変換する工程と、有音フレームであるか無音フレーム
    であるかを判定する工程と、復号パラメータを用いて復
    号音声を合成する工程と、有音フレームであるか無音フ
    レームであるかに基づいて復号音声に後処理を施す工程
    とをとを具備することを特徴とする音声復号化方法。
JP2000160723A 2000-05-30 2000-05-30 有音/無音判定装置、音声復号化装置及び音声復号化方法 Pending JP2001343984A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000160723A JP2001343984A (ja) 2000-05-30 2000-05-30 有音/無音判定装置、音声復号化装置及び音声復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000160723A JP2001343984A (ja) 2000-05-30 2000-05-30 有音/無音判定装置、音声復号化装置及び音声復号化方法

Publications (1)

Publication Number Publication Date
JP2001343984A true JP2001343984A (ja) 2001-12-14

Family

ID=18664872

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000160723A Pending JP2001343984A (ja) 2000-05-30 2000-05-30 有音/無音判定装置、音声復号化装置及び音声復号化方法

Country Status (1)

Country Link
JP (1) JP2001343984A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008932A1 (ja) * 2004-07-23 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
WO2011010604A1 (ja) * 2009-07-21 2011-01-27 日本電信電話株式会社 音声信号区間推定装置と音声信号区間推定方法及びそのプログラムと記録媒体

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008932A1 (ja) * 2004-07-23 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
JPWO2006008932A1 (ja) * 2004-07-23 2008-05-01 松下電器産業株式会社 音声符号化装置および音声符号化方法
US8670988B2 (en) 2004-07-23 2014-03-11 Panasonic Corporation Audio encoding/decoding apparatus and method providing multiple coding scheme interoperability
WO2011010604A1 (ja) * 2009-07-21 2011-01-27 日本電信電話株式会社 音声信号区間推定装置と音声信号区間推定方法及びそのプログラムと記録媒体
CN102473412A (zh) * 2009-07-21 2012-05-23 日本电信电话株式会社 语音信号区间估计装置与语音信号区间估计方法及其程序与记录介质
JP5411936B2 (ja) * 2009-07-21 2014-02-12 日本電信電話株式会社 音声信号区間推定装置と音声信号区間推定方法及びそのプログラムと記録媒体
US9208780B2 (en) 2009-07-21 2015-12-08 Nippon Telegraph And Telephone Corporation Audio signal section estimating apparatus, audio signal section estimating method, and recording medium

Similar Documents

Publication Publication Date Title
US6202046B1 (en) Background noise/speech classification method
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
US6134518A (en) Digital audio signal coding using a CELP coder and a transform coder
JP4213243B2 (ja) 音声符号化方法及び該方法を実施する装置
JP4438127B2 (ja) 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
JPH07319496A (ja) 入力音声信号の速度を変更する方法
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
JP4040126B2 (ja) 音声復号化方法および装置
KR100216018B1 (ko) 배경음을 엔코딩 및 디코딩하는 방법 및 장치
JP6626123B2 (ja) オーディオ信号を符号化するためのオーディオエンコーダー及び方法
EP1619666B1 (en) Speech decoder, speech decoding method, program, recording medium
JP3905706B2 (ja) 音声符号化装置、音声処理装置及び音声処理方法
JP2001343984A (ja) 有音/無音判定装置、音声復号化装置及び音声復号化方法
US8762136B2 (en) System and method of speech compression using an inter frame parameter correlation
JP4230550B2 (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置
WO2012153165A1 (en) A pitch estimator
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP2762938B2 (ja) 音声符号化装置
JP3896654B2 (ja) 音声信号区間検出方法及び装置
JPH08211895A (ja) ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
JP2023521476A (ja) サウンドコーデックにおける音声/音楽分類およびコアエンコーダ選択のための方法およびデバイス
JP2003522981A (ja) ピッチ変化検出を伴なう誤り訂正方法
CN113826161A (zh) 用于检测待编解码的声音信号中的起音以及对检测到的起音进行编解码的方法和设备