JP2003029790A - 音声符号化装置及び音声復号化装置 - Google Patents

音声符号化装置及び音声復号化装置

Info

Publication number
JP2003029790A
JP2003029790A JP2001214428A JP2001214428A JP2003029790A JP 2003029790 A JP2003029790 A JP 2003029790A JP 2001214428 A JP2001214428 A JP 2001214428A JP 2001214428 A JP2001214428 A JP 2001214428A JP 2003029790 A JP2003029790 A JP 2003029790A
Authority
JP
Japan
Prior art keywords
voice
decoding
signal
speech
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001214428A
Other languages
English (en)
Inventor
Tadashi Yonezaki
正 米崎
Koji Yoshida
幸司 吉田
Shigeaki Sasaki
茂明 佐々木
Kazunori Mano
一則 間野
Akitoshi Kataoka
章俊 片岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Panasonic Holdings Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, Matsushita Electric Industrial Co Ltd filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001214428A priority Critical patent/JP2003029790A/ja
Publication of JP2003029790A publication Critical patent/JP2003029790A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 有音検出の判定結果を符号化装置から復
号化装置に送信する必要のなく符号化及び復号化を行う
こと。 【解決手段】 切替え部101は、有音検出装置104
の判定結果に従って入力音声を音声符号化部102また
は音声符号化部103に出力する。音声符号化部102
は、入力信号を符号化してスペクトル情報、パワー情報
音源情報を多重化部105に出力する。音声符号化部1
03は、入力信号を符号化してスペクトル情報、パワー
情報、及び音源情報を多重化部105に出力する。有音
検出装置104は、音声符号化部102または音声符号
化部103から出力される符号化された入力信号の情報
に基づいて入力信号が有音か否かを判定する。そして、
有音検出装置104は、判定結果を切替え部101に出
力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声符号化装置及
び音声復号化装置に関し、特にCELP(Code-Excited
Linear Prediction)型音声符号化装置及び音声復号化
装置に関する。
【0002】
【従来の技術】音声通信では、音声信号に含まれる雑音
信号の抑圧が重要である。この雑音信号の抑圧を行うに
は、音声信号と雑音信号を区別する必要がある。一般に
は、通信装置に音声信号と雑音信号の区別を行う有音検
出装置を備えて雑音信号の抑圧を行う。
【0003】以下、従来の有音検出装置について説明す
る。図7は、従来の有音検出装置の構成を示すブロック
図である。図7の有音検出装置10は、周波数分析部1
1と、特徴パラメータ抽出部12と、有音検出部13
と、パワー推定部14と、SN比算出部15と、有音検
出部16とから主に構成される。
【0004】周波数分析部11は、入力信号を帯域分割
フィルタに通して周波数帯域毎の信号にろ波する。特徴
パラメータ抽出部12は、入力信号または周波数分析部
11において、ろ波された入力信号を分析して一つ、ま
たは複数の特徴パラメータを抽出し、有音検出部13に
出力する。有音検出部13は、特徴パラメータから有音
のフレームを検出してパワー推定部14に出力する。
【0005】パワー推定部14は、検出された有音のフ
レームと周波数帯域毎にろ波された信号から帯域毎の背
景雑音のパワーを推定する。SN比算出部15は、推定
された背景雑音のパワーと周波数帯域毎にろ波された信
号から帯域毎のSN(Signalto Noise)比を算出する。
有音検出部16は、帯域毎に算出されたSN比から有音
のフレームか否かを判定する。
【0006】このように、従来の有音検出装置は、入力
された音声信号から有音検出に必要なパラメータを抽出
して有音検出の判定を行っている。
【0007】
【発明が解決しようとする課題】しかしながら、従来の
有音検出装置においては、入力信号を分析しパラメータ
抽出するため大きな処理量を必要とする。また、音声信
号が有音か無音かで異なる符号化方式を用いて符号化す
る場合、音声符号化装置から音声復号化装置に検出結果
を送信する必要があるという問題がある。
【0008】本発明はかかる点に鑑みてなされたもので
あり、有音検出における処理量を低減する有音検出装
置、有音検出の判定結果を音声符号化装置から音声復号
化装置に送信する必要のない符号化及び復号化を行うこ
とができる音声符号化装置及び音声復号化装置を提供す
ることを目的とする。
【0009】
【課題を解決するための手段】本発明の音声符号化装置
は、音声信号を符号化する符号化手段と、符号化された
音声信号の有音、無音を検出する有音検出手段と、を具
備し、前記符号化手段は、再帰的に前記判定の結果に基
づいて符号化方式を決定して音声信号を符号化する構成
をとる。
【0010】この構成によれば、符号化した結果得られ
る量子化されたパラメータを用いて有音検出の判定を行
い、判定結果に基づいて符号化方式を選択することによ
り、有音検出の判定結果を音声符号化装置から音声復号
化装置に送信する必要なく符号化を行うことができる。
【0011】本発明の音声符号化装置は、符号化手段
は、有音検出手段の判定結果が音声成分を含む場合と、
前記判定結果が音声成分を含まない場合とで異なる符号
化方式を選択する構成をとる。
【0012】この構成によれば、音声信号に適切な符号
化を行うことができる。
【0013】本発明の音声符号化装置は、有音検出手段
は、符号化された音声信号の音源情報に基づいて判断す
る構成をとる。
【0014】この構成によれば、符号化した結果得られ
る量子化されたパラメータを用いて有音検出の判定を行
うことにより、入力信号を分析しパラメータ抽出する必
要がないので、有音検出における処理量を低減すること
ができる。
【0015】本発明の音声復号化装置は、符号化された
音声信号を復号する複数の復号化手段と、符号化された
音声信号の有音、無音を検出する有音検出手段と、前記
判定の結果に基づいて復号化された音声信号を選択して
出力する切替え手段と、を具備する構成をとる。
【0016】この構成によれば、符号化した結果得られ
る量子化されたパラメータを用いて有音検出の判定を行
い、判定結果に基づいて復号化方式を選択することによ
り、有音検出の判定結果を音声符号化装置から音声復号
化装置に送信する必要なく復号化を行うことができる。
【0017】本発明の音声復号化装置は、各復号化手段
は、相異なる復号化方式で復号化する構成をとる。
【0018】この構成によれば、音声信号に適切な復号
化を行うことができる。
【0019】本発明の音声復号化装置は、有音検出手段
は、符号化された音声信号の音源情報に基づいて判断す
る構成をとる。
【0020】この構成によれば、符号化した結果得られ
る量子化されたパラメータを用いて有音検出の判定を行
うことにより、入力信号を分析しパラメータ抽出する必
要がないので、有音検出における処理量を低減すること
ができる。
【0021】本発明の符復号方法は、符号化側におい
て、音声信号を符号化し、符号化した音声信号に音声成
分が含まれるか否か判定し、再帰的に前記判定の結果に
基づいて符号化方式を決定して音声信号を符号化し、復
号化側において、前記符号化された音声信号に音声成分
が含まれるか否か判定し、前記判定の結果に基づいて復
号化方式を決定して符号化された音声信号を復号化する
ようにした。
【0022】この方法によれば、符号化側と復号化側で
個々に符号化した結果得られる量子化されたパラメータ
を用いて有音検出の判定を行い、判定結果に基づいて符
号化方式及び復号化方式を選択することにより、有音検
出の判定結果を音声符号化装置から音声復号化装置に送
信する必要なく符号化及び復号化を行うことができる。
【0023】
【発明の実施の形態】本発明の骨子は、符号化側と復号
化側とで符号化した結果得られる量子化されたパラメー
タを用いて有音検出の判定を行い、判定結果に基づいて
符号化方式及び復号化方式を選択することである。
【0024】(実施の形態1)本実施の形態の音声符号
化装置は、有音検出装置の判定結果に基づく符号化方法
で符号化された音声信号を送信する。
【0025】そして、本実施の形態の音声復号化装置
は、符号化された音声信号を受信し、音声符号化装置と
同じ有音検出装置を用いて有音検出の判定を行い、判定
結果に基づいて復号化方法を決定する。
【0026】決定された復号化方法は、音声符号化装置
で選択された符号化方式に対応するものとなるので、有
音復号化装置は、符号化された信号を適切に復号するこ
とができる。
【0027】なお、有音とは、信号が音声成分を含むこ
とを示し、無音とは、信号が音声成分を含まず雑音成分
のみであることを示す。
【0028】以下、音声信号をフレーム単位で処理する
例を用いて説明する。図1は、本発明の実施の形態1に
係る音声符号化装置の構成を示すブロック図である。図
1の音声符号化装置100は、切替え部101と、音声
符号化部102と、音声符号化部103と、有音検出装
置104と、多重化部105と、送信部106とから主
に構成される。
【0029】また、音声符号化部102は、符号化部1
21と、量子化部122とから主に構成され、音声符号
化部103は、符号化部131と、量子化部132とか
ら主に構成される。符号化部121及び符号化部131
は、入力信号を符号化し、量子化部122及び量子化部
132は、符号化された入力信号を量子化する。
【0030】図1において、切替え部101は、有音検
出装置104の判定結果に従って入力音声を音声符号化
部102または音声符号化部103に出力する。例え
ば、有音検出装置104の判定結果から先に符号化した
フレームに有音が検出される場合、切替え部101は、
入力信号を音声符号化部102に出力する。そして、有
音検出装置104の判定結果から先に符号化したフレー
ムに有音が検出されない場合、切替え部101は、入力
信号を音声符号化部103に出力する。
【0031】音声符号化部102は、入力信号を符号化
してスペクトル情報、パワー情報音源情報を多重化部1
05に出力する。音声符号化部103は、入力信号を符
号化してスペクトル情報、パワー情報、及び音源情報を
多重化部105に出力する。
【0032】ここで、音声符号化部102と音声符号化
部103は、異なる符号化方式を用いて入力信号を符号
化する。例えば、音声符号化部102は、有音の入力信
号に適した符号化を行い、音声符号化部103は有音で
はない入力信号に適した符号化を行う。
【0033】有音検出装置104は、音声符号化部10
2または音声符号化部103から出力される符号化され
た入力信号の情報、例えば、スペクトル情報、パワー情
報、及び音源情報に基づいて入力信号が有音か否かを判
定する。そして、有音検出装置104は、判定結果を切
替え部101に出力する。
【0034】多重化部105は、音声符号化部102ま
たは音声符号化部103から出力される符号化された入
力信号の情報、例えば、スペクトル情報、パワー情報、
及び音源情報を多重化して送信部106に出力する。送
信部106は、多重化部105から出力された入力信号
の情報を変調、周波数変換等を行い、音声復号化装置2
00に送信する。
【0035】次に、本実施の形態の音声復号化装置につ
いて説明する。図2は、本実施の形態に係る音声復号化
装置の構成を示すブロック図である。図2の音声復号化
装置200は、受信部201と、分離部202と、音声
復号化部203と、音声復号化部204と、有音検出装
置205と、切替え部206とから主に構成される。
【0036】また、音声復号化部203は、逆量子化部
231と、復号化部232とから主に構成され、音声復
号化部204は、逆量子化部241と、復号化部242
とから主に構成される。逆量子化部231及び逆量子化
部241は、受信信号を逆量子化し、復号化部232及
び復号化部242は、逆量子化された受信信号を復号す
る。
【0037】図2において、受信部201は、音声符号
化装置100から送信された信号を受信し、周波数変
換、復調等を行い、受信信号を分離部202に出力す
る。
【0038】分離部202は、受信信号をスペクトル情
報、パワー情報、及び音源情報にそれぞれ分離して音声
復号化部203、音声復号化部204、及び有音検出装
置205に出力する。
【0039】音声復号化部203は、スペクトル情報、
パワー情報、及び音源情報から音声信号を復号して切替
え部206に出力する。例えば、音声復号化部203
は、有音の信号に適した符号化方式で処理された信号を
復号化する。本実施の形態の場合、図1の音声符号化部
102が用いる符号化方式で符号化された信号を復号化
する。
【0040】音声復号化部204は、スペクトル情報、
パワー情報、及び音源情報から音声信号を復号して切替
え部206に出力する。例えば、音声復号化部203
は、有音ではない信号に適した符号化方式で処理信号を
復号化する。本実施の形態の場合、図1の音声符号化部
103が用いる符号化方式で符号化された信号を復号化
する。
【0041】有音検出装置205は、分離部202から
出力されたスペクトル情報、パワー情報、及び音源情報
から受信信号が有音か否か判定し、判定した結果を切替
え部206に出力する。
【0042】切替え部206は、音声復号化部203ま
たは音声復号化部204において復号された音声信号を
有音検出装置205の判定結果に基づいて選択して出力
する。具体的には、切替え部206は、先に受信した信
号が有音であると判定した場合、音声復号化部203に
おいて復号された音声信号を出力する。また、先に受信
した信号が有音であると判定した場合、音声復号化部2
03において復号された音声信号を出力する。
【0043】次に、音声符号化装置100と音声復号化
装置200の信号処理について説明する。図3は、本実
施の形態の音声符号化装置と音声復号化装置のやり取り
の一例を示すシーケンス図である。
【0044】音声符号化装置100は、音声信号のスペ
クトル情報、パワー情報、及び音源情報から有音検出の
判定を行い、次に送信する音声信号の符号化方式選択に
判定の結果を用いる。そして、音声復号化装置200
も、受信した音声信号のスペクトル情報、パワー情報、
及び音源情報から有音検出の判定を行い、次に受信する
音声信号の復号化方式選択に判定の結果を用いる。
【0045】以下、送信する音声信号に有音が検出され
た場合に用いる符号化方式をA、有音が検出されなかっ
た場合に用いる符号化方式をBとして説明する。また、
最初に送信する音声信号の符号化方式をAとする。
【0046】最初に、時刻T301では、送信する音声
信号S302の符号化方式を予め決定しておいた方式で
符号化して送信する。ここでは、音声符号化装置100
は、時刻T301において音声信号S302をA方式で
符号化して音声復号化装置200に送信する。そして、
音声信号S302をA方式で符号化した結果得られるス
ペクトル情報、パワー情報、及び音源情報から有音検出
の判定を行い、次に受信する音声信号の符号化方式選択
に判定の結果を用いる。時刻T301での、符号化した
音声信号S302を有音検出の判定結果を無音とする。
【0047】音声復号化装置200は、音声信号S30
2を受信し、A方式で復号する。また、音声復号化装置
200は、受信した音声信号に含まれるスペクトル情
報、パワー情報、及び音源情報から有音検出の判定を行
い、次に受信する音声信号の復号化方式選択に判定の結
果を用いる。
【0048】受信した音声信号に含まれるスペクトル情
報、パワー情報、及び音源情報は、音声符号化装置10
0において量子化されているので、連続した値と異なり
伝送中に誤る率が少ない。また、誤りが発生した場合で
も誤り訂正を行うことにより正しい値に補正することも
できる。
【0049】時刻T311において、音声符号化装置1
00は、時刻T301での判定結果に従って符号化方式
を選択し、送信する音声信号S312を符号化して送信
する。ここでは、時刻T301での判定結果が無音なの
で音声信号S312をB方式で符号化して送信する。
【0050】時刻T313において、音声復号化装置2
00は、時刻T303での判定結果に従い、音声信号S
312をB方式で復号する。
【0051】以降同様に、音声符号化装置100は、過
去に符号化した音声信号の有音検出の判定結果に基づい
て符号化方式を選択し、符号化した音声信号を送信す
る。そして、音声復号化装置200は、過去に受信した
音声信号の有音検出の判定結果に基づいて復号化方式を
選択し、音声信号を復号する。
【0052】符号化された音声信号は、スペクトル情
報、パワー情報、及び音源情報等の量子化したパラメー
タとして送信されるので、送信側と受信側でこれらの量
子化したパラメータを用いて有音検出の判定を行う場
合、送信側と受信側で同じ判定結果が得られる。
【0053】このように、本実施の形態の音声符号化装
置によれば、符号化した結果得られる量子化されたパラ
メータを用いて有音検出の判定を行い、判定結果に基づ
いて符号化方式を選択することにより、有音検出の判定
結果を音声符号化装置から音声復号化装置に送信する必
要なく符号化を行うことができる。
【0054】また、本実施の形態の音声復号化装置によ
れば、符号化した結果得られる量子化されたパラメータ
を用いて有音検出の判定を行い、判定結果に基づいて復
号化方式を選択することにより、有音検出の判定結果を
音声符号化装置から音声復号化装置に送信する必要なく
復号化を行うことができる。
【0055】(実施の形態2)本発明の実施の形態2で
は、図1の音声符号化装置100がそなえる有音検出装
置104及び図2の音声復号化装置200が備える有音
検出装置205について説明する。図4は、本発明の実
施の形態2に係る有音検出装置の構成を示すブロック図
である。図4の有音検出装置104、205は、入力信
号をフレーム単位で有音または無音であるか判定する。
【0056】ここで、有音とは入力信号に音声が含まれ
ている状態を示し、無音とは、入力信号に音声が含まれ
てない状態を示す。この有音検出装置104、205
は、入力したフレームのスペクトル情報と、パワー情報
と、音源情報とから有音であるか無音であるかを判定す
る。
【0057】図4において、有音検出装置104、20
5は、音源比率算出部401と、有音検出部402と、
推定スペクトル更新部403と、スペクトル情報距離算
出部404と、有音検出部405と、パワー推定部40
6と、SN比算出部407と、有音検出部408と、更
新判定部409とから主に構成される。
【0058】音源比率算出部401は、音源情報から音
源生成における音声信号と符号帳に登録された信号波形
の相関成分の寄与率を算出して有音検出部402に出力
する。例えば、CELP(Code-Excited Linear Predic
tion)型音声合成モデルでは、相関成分を表す適応ベク
トルと相関のない信号を生成する雑音ベクトルとの重み
付け和で音源情報を生成する。そして、寄与率は、以下
に示す式(1)より算出される。 ここで、ratioは、寄与率を示し、energyAC
は、適応ベクトルエネルギー、energySCは、雑音
ベクトルエネルギーを示す。
【0059】有音検出部402は、音源比率算出部40
1において算出された相関成分の寄与率より有音と判定
されたフレームを推定スペクトル更新部403、パワー
推定部406、及び更新判定部409に出力する。具体
的には、有音検出部402は、相関成分の寄与率が所定
の閾値以上であるフレームを有音と判定する。
【0060】推定スペクトル更新部403は、雑音スペ
クトルの情報を記憶し、後述する更新判定部409の判
定結果に従って、雑音スペクトルの情報を更新する。そ
して、推定スペクトル更新部403は、雑音スペクトル
の情報をスペクトル情報距離算出部404に出力する。
【0061】スペクトル情報距離算出部404は、有音
判定を行う現フレームのスペクトル情報と、推定スペク
トル更新部403に記憶された推定雑音スペクトルの情
報からスペクトル間距離を算出して有音検出部405に
出力する。
【0062】具体的には、スペクトル情報距離算出部4
04は、スペクトル情報として線スペクトル対(LSP:Li
ne Spectrum Pair)を用い、以下に示す式(2)よりス
ペクトル間距離を算出する。 ここで、distは、スペクトル間距離、LSP
currentは、現フレームの線スペクトル対、そしてLS
noiseは、雑音スペクトルの線スペクトル対を示す。
また、Pは、LSPパラメータの次数を示す。
【0063】有音検出部405は、有音検出を行うフレ
ームのスペクトルと、推定雑音スペクトル情報とのスペ
クトル間距離から有音と判定したフレーをパワー推定部
406に出力する。具体的には、有音検出部405は、
スペクトル間距離distが所定の閾値以上であるフレ
ームを有音と判定する。
【0064】パワー推定部406は、音源情報による有
音検出結果と、スペクトル情報による有音検出結果とに
基づいて雑音成分のパワーを推定する。そして、パワー
推定部406は、雑音成分のパワーの推定結果をSN比
算出部407に出力する。
【0065】SN比算出部407は、雑音パワーの推定
結果と、現フレームのパワーからSN比を算出して、有
音検出部408に出力する。具体的には、SN比算出部
407は、現フレームのパワーをパワー推定部406に
おいて推定された雑音パワーで除算してSN比を算出す
る。
【0066】有音検出部408は、SN比算出部407
において算出されたSN比から現フレームが有音か無音
かを判定する。具体的には、有音検出部408は、SN
比が所定の閾値以上である場合、現フレームが有音のフ
レームであると判定する。そして、有音検出部408
は、判定結果を更新判定部409に出力する。
【0067】更新判定部409は、音源情報による有音
検出結果と、SN比による有音検出結果とから雑音スペ
クトル情報を更新するか否かを判定し、判定結果を推定
スペクトル更新部403に出力する。
【0068】次に、雑音成分のパワーの算出について説
明する。図5は、本実施の形態の有音検出装置の動作の
一例を示すフロー図である。図5では、有音検出の結果
に適応して雑音成分のパワーを推定する例について説明
する。
【0069】ステップ(以下「ST」と言う)501で
は、有音検出部402が、音源情報に基づいてフレーム
に有音が検出されるか否か判定する。有音が検出されな
い場合、ST502に進み、スペクトル情報に基づく有
音検出の判定処理を行う。また、有音が検出される場
合、ST503に進む。
【0070】ST502では、有音検出部405が、ス
ペクトル情報に基づいてフレームに有音が検出されるか
否か判定する。有音が検出されない場合、ST504に
進み、雑音パワーの変動測定処理を行う。また、有音が
検出される場合、ST503に進む。
【0071】ST503では、パワー推定部406が、
現フレームを用いて雑音パワーを推定せず、雑音パワー
の情報を更新せずに、過去に推定した雑音パワーの情報
を保持する。
【0072】ST504では、パワー推定部406が、
現フレームのパワーと雑音スペクトルのパワーの差が所
定の閾値より大きいか判定する。現フレームのパワーと
雑音スペクトルのパワーの差が所定の閾値より大きい場
合、ST505では、パワー推定部406が、以下に示
す式(3)を用いて雑音パワーの情報を更新する。 ここで、式(3)は、右辺の計算結果を左辺に代入する
ことを示す。左辺のgain noiseは、更新した結果の雑音
パワーを示し、右辺のgainnoiseは、過去に推定した雑
音パワーを示す。また、右辺のgaincurrentは、現フレ
ームのパワーを示す。
【0073】ST506では、パワー推定部406が、
以下に示す式(4)を用いて雑音パワーの情報を更新す
る。 このように、パワー推定部406は、有音検出の判定結
果と、雑音スペクトルの変動に適応した係数で雑音パワ
ーに重み付けして加算し、雑音スペクトルのパワー情報
を更新する。
【0074】次に、雑音スペクトルの情報更新について
説明する。図6は、本実施の形態の有音検出装置の動作
の一例を示すフロー図である。図6では、有音検出の結
果に適応して雑音スペクトルの情報を更新する例につい
て説明する。
【0075】ST601では、有音検出部408が、S
N比に基づいてフレームに有音が検出されるか否か判定
する。有音が検出される場合、ST602に進み、音源
情報に基づく有音検出の判定処理を行う。また、有音が
検出されない場合、ST605に進む。
【0076】ST602では、有音検出部402が、音
源情報に基づいてフレームに有音が検出されるか否か判
定する。有音が検出される場合、ST603に進む。ま
た、有音が検出されない場合、ST604に進む。
【0077】ST603では、更新判定部409が、S
N比に基づく判定結果と音源情報に基づく判定結果か
ら、現フレームを用いて雑音スペクトルを更新せず、過
去の雑音スペクトルの情報を保持することを推定スペク
トル更新部403に指示する。
【0078】ST604では、更新判定部409が、S
N比に基づく判定結果と音源情報に基づく判定結果か
ら、以下に示す式(5)を用いてスペクトルの更新を行
う。 ここで、式(3)は、右辺の計算結果を左辺に代入する
ことを示す。左辺のLSPn oiseは、更新した結果の雑音成
分の線スペクトル対を示し、右辺のLSPnoiseは、過去に
推定した雑音成分の線スペクトル対を示す。また、右辺
のLSPcurrentは、現フレームの線スペクトル対を示す。
【0079】ST605では、更新判定部409が、S
N比に基づく判定結果と音源情報に基づく判定結果か
ら、以下に示す式(6)を用いてスペクトルの更新を行
う。 以上、更新判定部409は、有音検出の判定結果に適応
した係数で雑音スペクトルに現スペクトルを重み付けし
て加算し、雑音スペクトルの情報を更新する。
【0080】このように、本実施の形態の有音検出装置
によれば、符号化した結果得られる量子化されたパラメ
ータを用いて有音検出の判定を行うことにより、入力信
号を分析しパラメータ抽出する必要がないので、有音検
出における処理量を低減することができる。
【0081】なお、本発明では、有音と無音の判定結果
でデータの音声符号化を切替えているが、音声符号化切
替えを行うデータの範囲は限定されず、データの一部に
ついて音声符号化方式を切替えても良い。また、本発明
は上記実施の形態に限定されず、種々変更して実施する
ことが可能である。
【0082】
【発明の効果】以上説明したように、本発明の音声符号
化装置及び音声復号化装置によれば、符号化側と復号化
側で個々に符号化した結果得られる量子化されたパラメ
ータを用いて有音検出の判定を行い、判定結果に基づい
て符号化方式及び復号化方式を選択することにより、有
音検出の判定結果を音声符号化装置から音声復号化装置
に送信する必要なく符号化及び復号化を行うことができ
る。また、本発明の有音検出装置によれば、符号化した
結果得られる量子化されたパラメータを用いて有音検出
の判定を行うことにより、入力信号を分析しパラメータ
抽出する必要がないので、有音検出における処理量を低
減することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る音声符号化装置の
構成を示すブロック図
【図2】上記実施の形態に係る音声復号化装置の構成を
示すブロック図
【図3】上記実施の形態の音声符号化装置と音声復号化
装置のやり取りの一例を示すシーケンス図
【図4】本発明の実施の形態2に係る有音検出装置の構
成を示すブロック図
【図5】上記実施の形態に係る有音検出装置の動作の一
例を示すフロー図
【図6】上記実施の形態に係る有音検出装置の動作の一
例を示すフロー図
【図7】従来の有音検出装置の構成を示すブロック図
【符号の説明】
101、206 切替え部 102、103 音声符号化部 104、205 有音検出装置 105 多重化部 121、131 符号化部 122、132 量子化部 202 分離部 203、204 音声復号化部 231、241 逆量子化部 232、242 復号化部 401 音源比率算出部 402、405、408 有音検出部 403 推定スペクトル更新部 404 スペクトル情報距離算出部 406 パワー推定部 407 SN比算出部 409 更新判定部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 吉田 幸司 神奈川県横浜市港北区綱島東四丁目3番1 号 松下通信工業株式会社内 (72)発明者 佐々木 茂明 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 間野 一則 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 片岡 章俊 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5D045 CA01 DA20

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 音声信号を符号化する符号化手段と、符
    号化された音声信号の有音、無音を検出する有音検出手
    段と、を具備し、前記符号化手段は、再帰的に前記判定
    の結果に基づいて符号化方式を決定して音声信号を符号
    化することを特徴とする音声符号化装置。
  2. 【請求項2】 符号化手段は、有音検出手段の判定結果
    が音声成分を含む場合と、前記判定結果が音声成分を含
    まない場合とで異なる符号化方式を選択することを特徴
    とする請求項1記載の音声符号化装置。
  3. 【請求項3】 有音検出手段は、符号化された音声信号
    の音源情報に基づいて判断することを特徴とする請求項
    1または請求項2に記載の音声符号化装置。
  4. 【請求項4】 符号化された音声信号を復号する複数の
    復号化手段と、符号化された音声信号の有音、無音を検
    出する有音検出手段と、前記判定の結果に基づいて復号
    化された音声信号を選択して出力する切替え手段と、を
    具備することを特徴とする音声復号化装置。
  5. 【請求項5】 各復号化手段は、相異なる復号化方式で
    復号化することを特徴とする請求項4記載の音声復号化
    装置。
  6. 【請求項6】 有音検出手段は、符号化された音声信号
    の音源情報に基づいて判断することを特徴とする請求項
    4または請求項5に記載の音声復号化装置。
  7. 【請求項7】 符号化側において、音声信号を符号化
    し、符号化した音声信号に音声成分が含まれるか否か判
    定し、再帰的に前記判定の結果に基づいて符号化方式を
    決定して音声信号を符号化し、復号化側において、前記
    符号化された音声信号に音声成分が含まれるか否か判定
    し、前記判定の結果に基づいて復号化方式を決定して符
    号化された音声信号を復号化する符復号方法。
JP2001214428A 2001-07-13 2001-07-13 音声符号化装置及び音声復号化装置 Pending JP2003029790A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001214428A JP2003029790A (ja) 2001-07-13 2001-07-13 音声符号化装置及び音声復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001214428A JP2003029790A (ja) 2001-07-13 2001-07-13 音声符号化装置及び音声復号化装置

Publications (1)

Publication Number Publication Date
JP2003029790A true JP2003029790A (ja) 2003-01-31

Family

ID=19049251

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001214428A Pending JP2003029790A (ja) 2001-07-13 2001-07-13 音声符号化装置及び音声復号化装置

Country Status (1)

Country Link
JP (1) JP2003029790A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006194959A (ja) * 2005-01-11 2006-07-27 Sony Corp 音声検出装置、自動撮像装置、および音声検出方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006194959A (ja) * 2005-01-11 2006-07-27 Sony Corp 音声検出装置、自動撮像装置、および音声検出方法

Similar Documents

Publication Publication Date Title
US6704702B2 (en) Speech encoding method, apparatus and program
US8255210B2 (en) Audio/music decoding device and method utilizing a frame erasure concealment utilizing multiple encoded information of frames adjacent to the lost frame
US7031912B2 (en) Speech coding apparatus capable of implementing acceptable in-channel transmission of non-speech signals
EP2030199B1 (en) Linear predictive coding of an audio signal
EP1062661B1 (en) Speech coding
US11195538B2 (en) Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
KR100798668B1 (ko) 무성 음성의 코딩 방법 및 장치
KR101038964B1 (ko) 에코 제거/억제 방법 및 장치
US7590532B2 (en) Voice code conversion method and apparatus
KR20060131851A (ko) 통신 장치 및 신호 부호화/복호화 방법
WO1998050910A1 (en) Speech coding
KR100351484B1 (ko) 음성 부호화 장치, 음성 복호화 장치, 음성 부호화 방법 및 기록 매체
JP2004138756A (ja) 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム
EP1073039B1 (en) Speech signal decoding
JPH1097295A (ja) 音響信号符号化方法及び復号化方法
JP2003029790A (ja) 音声符号化装置及び音声復号化装置
JP4236675B2 (ja) 音声符号変換方法および装置
EP3186808B1 (en) Audio parameter quantization
US20050102136A1 (en) Speech codecs
KR100554164B1 (ko) 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법
CN114171035B (zh) 抗干扰方法及装置
JP2001265390A (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2004061558A (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
Perkis et al. A robust, low complexity 5.0 kbps stochastic coder for a noisy satellite channel
JPH10105196A (ja) 音声符号化装置