JP2003029790A

JP2003029790A - 音声符号化装置及び音声復号化装置

Info

Publication number: JP2003029790A
Application number: JP2001214428A
Authority: JP
Inventors: Tadashi Yonezaki; 正米崎; Koji Yoshida; 幸司吉田; Shigeaki Sasaki; 茂明佐々木; Kazunori Mano; 一則間野; Akitoshi Kataoka; 章俊片岡
Original assignee: Nippon Telegraph and Telephone Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Nippon Telegraph and Telephone Corp; Panasonic Holdings Corp
Priority date: 2001-07-13
Filing date: 2001-07-13
Publication date: 2003-01-31

Abstract

(57)【要約】【課題】有音検出の判定結果を符号化装置から復
号化装置に送信する必要のなく符号化及び復号化を行う
こと。【解決手段】切替え部１０１は、有音検出装置１０４
の判定結果に従って入力音声を音声符号化部１０２また
は音声符号化部１０３に出力する。音声符号化部１０２
は、入力信号を符号化してスペクトル情報、パワー情報
音源情報を多重化部１０５に出力する。音声符号化部１
０３は、入力信号を符号化してスペクトル情報、パワー
情報、及び音源情報を多重化部１０５に出力する。有音
検出装置１０４は、音声符号化部１０２または音声符号
化部１０３から出力される符号化された入力信号の情報
に基づいて入力信号が有音か否かを判定する。そして、
有音検出装置１０４は、判定結果を切替え部１０１に出
力する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声符号化装置及
び音声復号化装置に関し、特にＣＥＬＰ（Code-Excited
Linear Prediction）型音声符号化装置及び音声復号化
装置に関する。

【０００２】

【従来の技術】音声通信では、音声信号に含まれる雑音
信号の抑圧が重要である。この雑音信号の抑圧を行うに
は、音声信号と雑音信号を区別する必要がある。一般に
は、通信装置に音声信号と雑音信号の区別を行う有音検
出装置を備えて雑音信号の抑圧を行う。

【０００３】以下、従来の有音検出装置について説明す
る。図７は、従来の有音検出装置の構成を示すブロック
図である。図７の有音検出装置１０は、周波数分析部１
１と、特徴パラメータ抽出部１２と、有音検出部１３
と、パワー推定部１４と、ＳＮ比算出部１５と、有音検
出部１６とから主に構成される。

【０００４】周波数分析部１１は、入力信号を帯域分割
フィルタに通して周波数帯域毎の信号にろ波する。特徴
パラメータ抽出部１２は、入力信号または周波数分析部
１１において、ろ波された入力信号を分析して一つ、ま
たは複数の特徴パラメータを抽出し、有音検出部１３に
出力する。有音検出部１３は、特徴パラメータから有音
のフレームを検出してパワー推定部１４に出力する。

【０００５】パワー推定部１４は、検出された有音のフ
レームと周波数帯域毎にろ波された信号から帯域毎の背
景雑音のパワーを推定する。ＳＮ比算出部１５は、推定
された背景雑音のパワーと周波数帯域毎にろ波された信
号から帯域毎のＳＮ（Signalto Noise）比を算出する。
有音検出部１６は、帯域毎に算出されたＳＮ比から有音
のフレームか否かを判定する。

【０００６】このように、従来の有音検出装置は、入力
された音声信号から有音検出に必要なパラメータを抽出
して有音検出の判定を行っている。

【０００７】

【発明が解決しようとする課題】しかしながら、従来の
有音検出装置においては、入力信号を分析しパラメータ
抽出するため大きな処理量を必要とする。また、音声信
号が有音か無音かで異なる符号化方式を用いて符号化す
る場合、音声符号化装置から音声復号化装置に検出結果
を送信する必要があるという問題がある。

【０００８】本発明はかかる点に鑑みてなされたもので
あり、有音検出における処理量を低減する有音検出装
置、有音検出の判定結果を音声符号化装置から音声復号
化装置に送信する必要のない符号化及び復号化を行うこ
とができる音声符号化装置及び音声復号化装置を提供す
ることを目的とする。

【０００９】

【課題を解決するための手段】本発明の音声符号化装置
は、音声信号を符号化する符号化手段と、符号化された
音声信号の有音、無音を検出する有音検出手段と、を具
備し、前記符号化手段は、再帰的に前記判定の結果に基
づいて符号化方式を決定して音声信号を符号化する構成
をとる。

【００１０】この構成によれば、符号化した結果得られ
る量子化されたパラメータを用いて有音検出の判定を行
い、判定結果に基づいて符号化方式を選択することによ
り、有音検出の判定結果を音声符号化装置から音声復号
化装置に送信する必要なく符号化を行うことができる。

【００１１】本発明の音声符号化装置は、符号化手段
は、有音検出手段の判定結果が音声成分を含む場合と、
前記判定結果が音声成分を含まない場合とで異なる符号
化方式を選択する構成をとる。

【００１２】この構成によれば、音声信号に適切な符号
化を行うことができる。

【００１３】本発明の音声符号化装置は、有音検出手段
は、符号化された音声信号の音源情報に基づいて判断す
る構成をとる。

【００１４】この構成によれば、符号化した結果得られ
る量子化されたパラメータを用いて有音検出の判定を行
うことにより、入力信号を分析しパラメータ抽出する必
要がないので、有音検出における処理量を低減すること
ができる。

【００１５】本発明の音声復号化装置は、符号化された
音声信号を復号する複数の復号化手段と、符号化された
音声信号の有音、無音を検出する有音検出手段と、前記
判定の結果に基づいて復号化された音声信号を選択して
出力する切替え手段と、を具備する構成をとる。

【００１６】この構成によれば、符号化した結果得られ
る量子化されたパラメータを用いて有音検出の判定を行
い、判定結果に基づいて復号化方式を選択することによ
り、有音検出の判定結果を音声符号化装置から音声復号
化装置に送信する必要なく復号化を行うことができる。

【００１７】本発明の音声復号化装置は、各復号化手段
は、相異なる復号化方式で復号化する構成をとる。

【００１８】この構成によれば、音声信号に適切な復号
化を行うことができる。

【００１９】本発明の音声復号化装置は、有音検出手段
は、符号化された音声信号の音源情報に基づいて判断す
る構成をとる。

【００２０】この構成によれば、符号化した結果得られ
る量子化されたパラメータを用いて有音検出の判定を行
うことにより、入力信号を分析しパラメータ抽出する必
要がないので、有音検出における処理量を低減すること
ができる。

【００２１】本発明の符復号方法は、符号化側におい
て、音声信号を符号化し、符号化した音声信号に音声成
分が含まれるか否か判定し、再帰的に前記判定の結果に
基づいて符号化方式を決定して音声信号を符号化し、復
号化側において、前記符号化された音声信号に音声成分
が含まれるか否か判定し、前記判定の結果に基づいて復
号化方式を決定して符号化された音声信号を復号化する
ようにした。

【００２２】この方法によれば、符号化側と復号化側で
個々に符号化した結果得られる量子化されたパラメータ
を用いて有音検出の判定を行い、判定結果に基づいて符
号化方式及び復号化方式を選択することにより、有音検
出の判定結果を音声符号化装置から音声復号化装置に送
信する必要なく符号化及び復号化を行うことができる。

【００２３】

【発明の実施の形態】本発明の骨子は、符号化側と復号
化側とで符号化した結果得られる量子化されたパラメー
タを用いて有音検出の判定を行い、判定結果に基づいて
符号化方式及び復号化方式を選択することである。

【００２４】（実施の形態１）本実施の形態の音声符号
化装置は、有音検出装置の判定結果に基づく符号化方法
で符号化された音声信号を送信する。

【００２５】そして、本実施の形態の音声復号化装置
は、符号化された音声信号を受信し、音声符号化装置と
同じ有音検出装置を用いて有音検出の判定を行い、判定
結果に基づいて復号化方法を決定する。

【００２６】決定された復号化方法は、音声符号化装置
で選択された符号化方式に対応するものとなるので、有
音復号化装置は、符号化された信号を適切に復号するこ
とができる。

【００２７】なお、有音とは、信号が音声成分を含むこ
とを示し、無音とは、信号が音声成分を含まず雑音成分
のみであることを示す。

【００２８】以下、音声信号をフレーム単位で処理する
例を用いて説明する。図１は、本発明の実施の形態１に
係る音声符号化装置の構成を示すブロック図である。図
１の音声符号化装置１００は、切替え部１０１と、音声
符号化部１０２と、音声符号化部１０３と、有音検出装
置１０４と、多重化部１０５と、送信部１０６とから主
に構成される。

【００２９】また、音声符号化部１０２は、符号化部１
２１と、量子化部１２２とから主に構成され、音声符号
化部１０３は、符号化部１３１と、量子化部１３２とか
ら主に構成される。符号化部１２１及び符号化部１３１
は、入力信号を符号化し、量子化部１２２及び量子化部
１３２は、符号化された入力信号を量子化する。

【００３０】図１において、切替え部１０１は、有音検
出装置１０４の判定結果に従って入力音声を音声符号化
部１０２または音声符号化部１０３に出力する。例え
ば、有音検出装置１０４の判定結果から先に符号化した
フレームに有音が検出される場合、切替え部１０１は、
入力信号を音声符号化部１０２に出力する。そして、有
音検出装置１０４の判定結果から先に符号化したフレー
ムに有音が検出されない場合、切替え部１０１は、入力
信号を音声符号化部１０３に出力する。

【００３１】音声符号化部１０２は、入力信号を符号化
してスペクトル情報、パワー情報音源情報を多重化部１
０５に出力する。音声符号化部１０３は、入力信号を符
号化してスペクトル情報、パワー情報、及び音源情報を
多重化部１０５に出力する。

【００３２】ここで、音声符号化部１０２と音声符号化
部１０３は、異なる符号化方式を用いて入力信号を符号
化する。例えば、音声符号化部１０２は、有音の入力信
号に適した符号化を行い、音声符号化部１０３は有音で
はない入力信号に適した符号化を行う。

【００３３】有音検出装置１０４は、音声符号化部１０
２または音声符号化部１０３から出力される符号化され
た入力信号の情報、例えば、スペクトル情報、パワー情
報、及び音源情報に基づいて入力信号が有音か否かを判
定する。そして、有音検出装置１０４は、判定結果を切
替え部１０１に出力する。

【００３４】多重化部１０５は、音声符号化部１０２ま
たは音声符号化部１０３から出力される符号化された入
力信号の情報、例えば、スペクトル情報、パワー情報、
及び音源情報を多重化して送信部１０６に出力する。送
信部１０６は、多重化部１０５から出力された入力信号
の情報を変調、周波数変換等を行い、音声復号化装置２
００に送信する。

【００３５】次に、本実施の形態の音声復号化装置につ
いて説明する。図２は、本実施の形態に係る音声復号化
装置の構成を示すブロック図である。図２の音声復号化
装置２００は、受信部２０１と、分離部２０２と、音声
復号化部２０３と、音声復号化部２０４と、有音検出装
置２０５と、切替え部２０６とから主に構成される。

【００３６】また、音声復号化部２０３は、逆量子化部
２３１と、復号化部２３２とから主に構成され、音声復
号化部２０４は、逆量子化部２４１と、復号化部２４２
とから主に構成される。逆量子化部２３１及び逆量子化
部２４１は、受信信号を逆量子化し、復号化部２３２及
び復号化部２４２は、逆量子化された受信信号を復号す
る。

【００３７】図２において、受信部２０１は、音声符号
化装置１００から送信された信号を受信し、周波数変
換、復調等を行い、受信信号を分離部２０２に出力す
る。

【００３８】分離部２０２は、受信信号をスペクトル情
報、パワー情報、及び音源情報にそれぞれ分離して音声
復号化部２０３、音声復号化部２０４、及び有音検出装
置２０５に出力する。

【００３９】音声復号化部２０３は、スペクトル情報、
パワー情報、及び音源情報から音声信号を復号して切替
え部２０６に出力する。例えば、音声復号化部２０３
は、有音の信号に適した符号化方式で処理された信号を
復号化する。本実施の形態の場合、図１の音声符号化部
１０２が用いる符号化方式で符号化された信号を復号化
する。

【００４０】音声復号化部２０４は、スペクトル情報、
パワー情報、及び音源情報から音声信号を復号して切替
え部２０６に出力する。例えば、音声復号化部２０３
は、有音ではない信号に適した符号化方式で処理信号を
復号化する。本実施の形態の場合、図１の音声符号化部
１０３が用いる符号化方式で符号化された信号を復号化
する。

【００４１】有音検出装置２０５は、分離部２０２から
出力されたスペクトル情報、パワー情報、及び音源情報
から受信信号が有音か否か判定し、判定した結果を切替
え部２０６に出力する。

【００４２】切替え部２０６は、音声復号化部２０３ま
たは音声復号化部２０４において復号された音声信号を
有音検出装置２０５の判定結果に基づいて選択して出力
する。具体的には、切替え部２０６は、先に受信した信
号が有音であると判定した場合、音声復号化部２０３に
おいて復号された音声信号を出力する。また、先に受信
した信号が有音であると判定した場合、音声復号化部２
０３において復号された音声信号を出力する。

【００４３】次に、音声符号化装置１００と音声復号化
装置２００の信号処理について説明する。図３は、本実
施の形態の音声符号化装置と音声復号化装置のやり取り
の一例を示すシーケンス図である。

【００４４】音声符号化装置１００は、音声信号のスペ
クトル情報、パワー情報、及び音源情報から有音検出の
判定を行い、次に送信する音声信号の符号化方式選択に
判定の結果を用いる。そして、音声復号化装置２００
も、受信した音声信号のスペクトル情報、パワー情報、
及び音源情報から有音検出の判定を行い、次に受信する
音声信号の復号化方式選択に判定の結果を用いる。

【００４５】以下、送信する音声信号に有音が検出され
た場合に用いる符号化方式をＡ、有音が検出されなかっ
た場合に用いる符号化方式をＢとして説明する。また、
最初に送信する音声信号の符号化方式をＡとする。

【００４６】最初に、時刻Ｔ３０１では、送信する音声
信号Ｓ３０２の符号化方式を予め決定しておいた方式で
符号化して送信する。ここでは、音声符号化装置１００
は、時刻Ｔ３０１において音声信号Ｓ３０２をＡ方式で
符号化して音声復号化装置２００に送信する。そして、
音声信号Ｓ３０２をＡ方式で符号化した結果得られるス
ペクトル情報、パワー情報、及び音源情報から有音検出
の判定を行い、次に受信する音声信号の符号化方式選択
に判定の結果を用いる。時刻Ｔ３０１での、符号化した
音声信号Ｓ３０２を有音検出の判定結果を無音とする。

【００４７】音声復号化装置２００は、音声信号Ｓ３０
２を受信し、Ａ方式で復号する。また、音声復号化装置
２００は、受信した音声信号に含まれるスペクトル情
報、パワー情報、及び音源情報から有音検出の判定を行
い、次に受信する音声信号の復号化方式選択に判定の結
果を用いる。

【００４８】受信した音声信号に含まれるスペクトル情
報、パワー情報、及び音源情報は、音声符号化装置１０
０において量子化されているので、連続した値と異なり
伝送中に誤る率が少ない。また、誤りが発生した場合で
も誤り訂正を行うことにより正しい値に補正することも
できる。

【００４９】時刻Ｔ３１１において、音声符号化装置１
００は、時刻Ｔ３０１での判定結果に従って符号化方式
を選択し、送信する音声信号Ｓ３１２を符号化して送信
する。ここでは、時刻Ｔ３０１での判定結果が無音なの
で音声信号Ｓ３１２をＢ方式で符号化して送信する。

【００５０】時刻Ｔ３１３において、音声復号化装置２
００は、時刻Ｔ３０３での判定結果に従い、音声信号Ｓ
３１２をＢ方式で復号する。

【００５１】以降同様に、音声符号化装置１００は、過
去に符号化した音声信号の有音検出の判定結果に基づい
て符号化方式を選択し、符号化した音声信号を送信す
る。そして、音声復号化装置２００は、過去に受信した
音声信号の有音検出の判定結果に基づいて復号化方式を
選択し、音声信号を復号する。

【００５２】符号化された音声信号は、スペクトル情
報、パワー情報、及び音源情報等の量子化したパラメー
タとして送信されるので、送信側と受信側でこれらの量
子化したパラメータを用いて有音検出の判定を行う場
合、送信側と受信側で同じ判定結果が得られる。

【００５３】このように、本実施の形態の音声符号化装
置によれば、符号化した結果得られる量子化されたパラ
メータを用いて有音検出の判定を行い、判定結果に基づ
いて符号化方式を選択することにより、有音検出の判定
結果を音声符号化装置から音声復号化装置に送信する必
要なく符号化を行うことができる。

【００５４】また、本実施の形態の音声復号化装置によ
れば、符号化した結果得られる量子化されたパラメータ
を用いて有音検出の判定を行い、判定結果に基づいて復
号化方式を選択することにより、有音検出の判定結果を
音声符号化装置から音声復号化装置に送信する必要なく
復号化を行うことができる。

【００５５】（実施の形態２）本発明の実施の形態２で
は、図１の音声符号化装置１００がそなえる有音検出装
置１０４及び図２の音声復号化装置２００が備える有音
検出装置２０５について説明する。図４は、本発明の実
施の形態２に係る有音検出装置の構成を示すブロック図
である。図４の有音検出装置１０４、２０５は、入力信
号をフレーム単位で有音または無音であるか判定する。

【００５６】ここで、有音とは入力信号に音声が含まれ
ている状態を示し、無音とは、入力信号に音声が含まれ
てない状態を示す。この有音検出装置１０４、２０５
は、入力したフレームのスペクトル情報と、パワー情報
と、音源情報とから有音であるか無音であるかを判定す
る。

【００５７】図４において、有音検出装置１０４、２０
５は、音源比率算出部４０１と、有音検出部４０２と、
推定スペクトル更新部４０３と、スペクトル情報距離算
出部４０４と、有音検出部４０５と、パワー推定部４０
６と、ＳＮ比算出部４０７と、有音検出部４０８と、更
新判定部４０９とから主に構成される。

【００５８】音源比率算出部４０１は、音源情報から音
源生成における音声信号と符号帳に登録された信号波形
の相関成分の寄与率を算出して有音検出部４０２に出力
する。例えば、ＣＥＬＰ（Code-Excited Linear Predic
tion）型音声合成モデルでは、相関成分を表す適応ベク
トルと相関のない信号を生成する雑音ベクトルとの重み
付け和で音源情報を生成する。そして、寄与率は、以下
に示す式（１）より算出される。ここで、ｒａｔｉｏは、寄与率を示し、ｅｎｅｒｇｙ_AC
は、適応ベクトルエネルギー、ｅｎｅｒｇｙ_SCは、雑音
ベクトルエネルギーを示す。

【００５９】有音検出部４０２は、音源比率算出部４０
１において算出された相関成分の寄与率より有音と判定
されたフレームを推定スペクトル更新部４０３、パワー
推定部４０６、及び更新判定部４０９に出力する。具体
的には、有音検出部４０２は、相関成分の寄与率が所定
の閾値以上であるフレームを有音と判定する。

【００６０】推定スペクトル更新部４０３は、雑音スペ
クトルの情報を記憶し、後述する更新判定部４０９の判
定結果に従って、雑音スペクトルの情報を更新する。そ
して、推定スペクトル更新部４０３は、雑音スペクトル
の情報をスペクトル情報距離算出部４０４に出力する。

【００６１】スペクトル情報距離算出部４０４は、有音
判定を行う現フレームのスペクトル情報と、推定スペク
トル更新部４０３に記憶された推定雑音スペクトルの情
報からスペクトル間距離を算出して有音検出部４０５に
出力する。

【００６２】具体的には、スペクトル情報距離算出部４
０４は、スペクトル情報として線スペクトル対（LSP:Li
ne Spectrum Pair）を用い、以下に示す式（２）よりス
ペクトル間距離を算出する。ここで、ｄｉｓｔは、スペクトル間距離、ＬＳＰ
_currentは、現フレームの線スペクトル対、そしてＬＳ
Ｐ_noiseは、雑音スペクトルの線スペクトル対を示す。
また、Ｐは、ＬＳＰパラメータの次数を示す。

【００６３】有音検出部４０５は、有音検出を行うフレ
ームのスペクトルと、推定雑音スペクトル情報とのスペ
クトル間距離から有音と判定したフレーをパワー推定部
４０６に出力する。具体的には、有音検出部４０５は、
スペクトル間距離ｄｉｓｔが所定の閾値以上であるフレ
ームを有音と判定する。

【００６４】パワー推定部４０６は、音源情報による有
音検出結果と、スペクトル情報による有音検出結果とに
基づいて雑音成分のパワーを推定する。そして、パワー
推定部４０６は、雑音成分のパワーの推定結果をＳＮ比
算出部４０７に出力する。

【００６５】ＳＮ比算出部４０７は、雑音パワーの推定
結果と、現フレームのパワーからＳＮ比を算出して、有
音検出部４０８に出力する。具体的には、ＳＮ比算出部
４０７は、現フレームのパワーをパワー推定部４０６に
おいて推定された雑音パワーで除算してＳＮ比を算出す
る。

【００６６】有音検出部４０８は、ＳＮ比算出部４０７
において算出されたＳＮ比から現フレームが有音か無音
かを判定する。具体的には、有音検出部４０８は、ＳＮ
比が所定の閾値以上である場合、現フレームが有音のフ
レームであると判定する。そして、有音検出部４０８
は、判定結果を更新判定部４０９に出力する。

【００６７】更新判定部４０９は、音源情報による有音
検出結果と、ＳＮ比による有音検出結果とから雑音スペ
クトル情報を更新するか否かを判定し、判定結果を推定
スペクトル更新部４０３に出力する。

【００６８】次に、雑音成分のパワーの算出について説
明する。図５は、本実施の形態の有音検出装置の動作の
一例を示すフロー図である。図５では、有音検出の結果
に適応して雑音成分のパワーを推定する例について説明
する。

【００６９】ステップ（以下「ＳＴ」と言う）５０１で
は、有音検出部４０２が、音源情報に基づいてフレーム
に有音が検出されるか否か判定する。有音が検出されな
い場合、ＳＴ５０２に進み、スペクトル情報に基づく有
音検出の判定処理を行う。また、有音が検出される場
合、ＳＴ５０３に進む。

【００７０】ＳＴ５０２では、有音検出部４０５が、ス
ペクトル情報に基づいてフレームに有音が検出されるか
否か判定する。有音が検出されない場合、ＳＴ５０４に
進み、雑音パワーの変動測定処理を行う。また、有音が
検出される場合、ＳＴ５０３に進む。

【００７１】ＳＴ５０３では、パワー推定部４０６が、
現フレームを用いて雑音パワーを推定せず、雑音パワー
の情報を更新せずに、過去に推定した雑音パワーの情報
を保持する。

【００７２】ＳＴ５０４では、パワー推定部４０６が、
現フレームのパワーと雑音スペクトルのパワーの差が所
定の閾値より大きいか判定する。現フレームのパワーと
雑音スペクトルのパワーの差が所定の閾値より大きい場
合、ＳＴ５０５では、パワー推定部４０６が、以下に示
す式（３）を用いて雑音パワーの情報を更新する。ここで、式（３）は、右辺の計算結果を左辺に代入する
ことを示す。左辺のgain _noiseは、更新した結果の雑音
パワーを示し、右辺のgain_noiseは、過去に推定した雑
音パワーを示す。また、右辺のgain_currentは、現フレ
ームのパワーを示す。

【００７３】ＳＴ５０６では、パワー推定部４０６が、
以下に示す式（４）を用いて雑音パワーの情報を更新す
る。このように、パワー推定部４０６は、有音検出の判定結
果と、雑音スペクトルの変動に適応した係数で雑音パワ
ーに重み付けして加算し、雑音スペクトルのパワー情報
を更新する。

【００７４】次に、雑音スペクトルの情報更新について
説明する。図６は、本実施の形態の有音検出装置の動作
の一例を示すフロー図である。図６では、有音検出の結
果に適応して雑音スペクトルの情報を更新する例につい
て説明する。

【００７５】ＳＴ６０１では、有音検出部４０８が、Ｓ
Ｎ比に基づいてフレームに有音が検出されるか否か判定
する。有音が検出される場合、ＳＴ６０２に進み、音源
情報に基づく有音検出の判定処理を行う。また、有音が
検出されない場合、ＳＴ６０５に進む。

【００７６】ＳＴ６０２では、有音検出部４０２が、音
源情報に基づいてフレームに有音が検出されるか否か判
定する。有音が検出される場合、ＳＴ６０３に進む。ま
た、有音が検出されない場合、ＳＴ６０４に進む。

【００７７】ＳＴ６０３では、更新判定部４０９が、Ｓ
Ｎ比に基づく判定結果と音源情報に基づく判定結果か
ら、現フレームを用いて雑音スペクトルを更新せず、過
去の雑音スペクトルの情報を保持することを推定スペク
トル更新部４０３に指示する。

【００７８】ＳＴ６０４では、更新判定部４０９が、Ｓ
Ｎ比に基づく判定結果と音源情報に基づく判定結果か
ら、以下に示す式（５）を用いてスペクトルの更新を行
う。ここで、式（３）は、右辺の計算結果を左辺に代入する
ことを示す。左辺のLSP_n _oiseは、更新した結果の雑音成
分の線スペクトル対を示し、右辺のLSP_noiseは、過去に
推定した雑音成分の線スペクトル対を示す。また、右辺
のLSP_currentは、現フレームの線スペクトル対を示す。

【００７９】ＳＴ６０５では、更新判定部４０９が、Ｓ
Ｎ比に基づく判定結果と音源情報に基づく判定結果か
ら、以下に示す式（６）を用いてスペクトルの更新を行
う。以上、更新判定部４０９は、有音検出の判定結果に適応
した係数で雑音スペクトルに現スペクトルを重み付けし
て加算し、雑音スペクトルの情報を更新する。

【００８０】このように、本実施の形態の有音検出装置
によれば、符号化した結果得られる量子化されたパラメ
ータを用いて有音検出の判定を行うことにより、入力信
号を分析しパラメータ抽出する必要がないので、有音検
出における処理量を低減することができる。

【００８１】なお、本発明では、有音と無音の判定結果
でデータの音声符号化を切替えているが、音声符号化切
替えを行うデータの範囲は限定されず、データの一部に
ついて音声符号化方式を切替えても良い。また、本発明
は上記実施の形態に限定されず、種々変更して実施する
ことが可能である。

【００８２】

【発明の効果】以上説明したように、本発明の音声符号
化装置及び音声復号化装置によれば、符号化側と復号化
側で個々に符号化した結果得られる量子化されたパラメ
ータを用いて有音検出の判定を行い、判定結果に基づい
て符号化方式及び復号化方式を選択することにより、有
音検出の判定結果を音声符号化装置から音声復号化装置
に送信する必要なく符号化及び復号化を行うことができ
る。また、本発明の有音検出装置によれば、符号化した
結果得られる量子化されたパラメータを用いて有音検出
の判定を行うことにより、入力信号を分析しパラメータ
抽出する必要がないので、有音検出における処理量を低
減することができる。

【図面の簡単な説明】

【図１】本発明の実施の形態１に係る音声符号化装置の
構成を示すブロック図

【図２】上記実施の形態に係る音声復号化装置の構成を
示すブロック図

【図３】上記実施の形態の音声符号化装置と音声復号化
装置のやり取りの一例を示すシーケンス図

【図４】本発明の実施の形態２に係る有音検出装置の構
成を示すブロック図

【図５】上記実施の形態に係る有音検出装置の動作の一
例を示すフロー図

【図６】上記実施の形態に係る有音検出装置の動作の一
例を示すフロー図

【図７】従来の有音検出装置の構成を示すブロック図

【符号の説明】

１０１、２０６切替え部１０２、１０３音声符号化部１０４、２０５有音検出装置１０５多重化部１２１、１３１符号化部１２２、１３２量子化部２０２分離部２０３、２０４音声復号化部２３１、２４１逆量子化部２３２、２４２復号化部４０１音源比率算出部４０２、４０５、４０８有音検出部４０３推定スペクトル更新部４０４スペクトル情報距離算出部４０６パワー推定部４０７ＳＮ比算出部４０９更新判定部

───────────────────────────────────────────────────── フロントページの続き (72)発明者吉田幸司神奈川県横浜市港北区綱島東四丁目３番１号松下通信工業株式会社内 (72)発明者佐々木茂明東京都千代田区大手町二丁目３番１号日本電信電話株式会社内 (72)発明者間野一則東京都千代田区大手町二丁目３番１号日本電信電話株式会社内 (72)発明者片岡章俊東京都千代田区大手町二丁目３番１号日本電信電話株式会社内Ｆターム(参考） 5D045 CA01 DA20

Claims

【特許請求の範囲】

【請求項１】音声信号を符号化する符号化手段と、符
号化された音声信号の有音、無音を検出する有音検出手
段と、を具備し、前記符号化手段は、再帰的に前記判定
の結果に基づいて符号化方式を決定して音声信号を符号
化することを特徴とする音声符号化装置。
【請求項２】符号化手段は、有音検出手段の判定結果
が音声成分を含む場合と、前記判定結果が音声成分を含
まない場合とで異なる符号化方式を選択することを特徴
とする請求項１記載の音声符号化装置。
【請求項３】有音検出手段は、符号化された音声信号
の音源情報に基づいて判断することを特徴とする請求項
１または請求項２に記載の音声符号化装置。
【請求項４】符号化された音声信号を復号する複数の
復号化手段と、符号化された音声信号の有音、無音を検
出する有音検出手段と、前記判定の結果に基づいて復号
化された音声信号を選択して出力する切替え手段と、を
具備することを特徴とする音声復号化装置。
【請求項５】各復号化手段は、相異なる復号化方式で
復号化することを特徴とする請求項４記載の音声復号化
装置。
【請求項６】有音検出手段は、符号化された音声信号
の音源情報に基づいて判断することを特徴とする請求項
４または請求項５に記載の音声復号化装置。
【請求項７】符号化側において、音声信号を符号化
し、符号化した音声信号に音声成分が含まれるか否か判
定し、再帰的に前記判定の結果に基づいて符号化方式を
決定して音声信号を符号化し、復号化側において、前記
符号化された音声信号に音声成分が含まれるか否か判定
し、前記判定の結果に基づいて復号化方式を決定して符
号化された音声信号を復号化する符復号方法。