JP2000357000A - 雑音信号符号化装置および音声信号符号化装置 - Google Patents

雑音信号符号化装置および音声信号符号化装置

Info

Publication number
JP2000357000A
JP2000357000A JP11168545A JP16854599A JP2000357000A JP 2000357000 A JP2000357000 A JP 2000357000A JP 11168545 A JP11168545 A JP 11168545A JP 16854599 A JP16854599 A JP 16854599A JP 2000357000 A JP2000357000 A JP 2000357000A
Authority
JP
Japan
Prior art keywords
signal
noise
voice
speech
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11168545A
Other languages
English (en)
Other versions
JP4464484B2 (ja
Inventor
Koji Yoshida
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP16854599A priority Critical patent/JP4464484B2/ja
Priority to AU51037/00A priority patent/AU5103700A/en
Priority to PCT/JP2000/003526 priority patent/WO2000077774A1/ja
Priority to EP00935511A priority patent/EP1120775A4/en
Priority to CN00801092.7A priority patent/CN1313983A/zh
Publication of JP2000357000A publication Critical patent/JP2000357000A/ja
Application granted granted Critical
Publication of JP4464484B2 publication Critical patent/JP4464484B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02168Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses

Abstract

(57)【要約】 【課題】 背景雑音が重畳された音声信号に対して
も復号音声の劣化を抑えること。 【解決手段】 雑音信号分析部301により算出された
入力雑音信号に対する統計的特徴量に対して、入力雑音
信号に関する統計的特徴量を表現できるような雑音モデ
ルに関する情報を記憶する雑音モデル記憶部302を用
いて、入力雑音信号を表す雑音モデルパラメータが変化
したかどうの検出を、雑音モデル変化検出部303にお
いて行い、雑音モデル更新部304により、雑音モデル
の更新を行い更新後のモデル情報を出力する。上記で構
成された雑音信号符号器を用いて、入力信号の無音区間
(雑音のみの区間)又は音声信号から分離された雑音信
号に対して符号化を行い、有音区間においては音声符号
器により符号化を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声信号を符号化
して伝送する移動通信システムや音声録音装置等の用途
に用いられる低ビットレート音声信号符号化装置に関す
る。
【0002】
【従来の技術】ディジタル移動通信や音声蓄積の分野に
おいては、電波や記憶媒体の有効利用のために音声情報
を圧縮し、低いビットレートで符号化する音声符号化装
置が用いられている。そのような従来の技術として、I
TU−T勧告G.729("Coding of speech at 8kbit
/s using conjugate-structure algebraic-code-excite
d linear-prediction(CS-ACELP)")のCS−ACELP
符号化方式や、同じくITU−T勧告のG.729 An
nex B("A silence compression scheme for G.729 opt
imized for terminals conforming to Recommendation
V.70")のDTX(Discontinuous Transmission)制御付
きのCS−ACELP符号化方式がある。
【0003】図13は、従来のCS−ACELP符号化
方式の符号化装置の構成を示すブロック図である。図1
3において、入力音声信号に対してLPC分析・量子化
器1でLPC(線形予測)分析および量子化を行い、L
PC係数およびLPC量子化符号を出力する。
【0004】そして、適応音源符号帳2および固定音源
符号帳3から取り出された適応音源信号および固定音源
信号にゲイン符号帳4から取り出されたゲインを乗じて
加算し、LPC合成フィルタ7により音声合成を行い、
入力信号に対する誤差信号を聴覚重み付けフィルタ9に
より重み付けを行い、重み付け後の誤差が最小となる適
応音源符号、固定音源符号、ゲイン符号をLPC量子化
符号と共に符号化データとして出力する。なお、図13
において、5は乗算器であり、6は加算器であり、8は
減算器である。
【0005】図14は、従来のDTX制御付きCS−A
CELP符号化方式の符号化装置の構成を示すブロック
図である。まず、有音/無音判定器11により入力信号
が有音区間か無音区間(背景雑音のみの区間)かの判定
を行う。そして、有音/無音判定器11により有音と判
定された場合、CS−ACELP音声符号化器12によ
り有音区間の音声符号化を行う。なお、CS−ACEL
P音声符号化器12は、図13に示す構成となってい
る。
【0006】一方、有音/無音判定器11により無音と
判定された場合、無音区間符号化器13により符号化を
行う。この無音区間符号化器13は、入力信号から有音
区間の符号化と同様なLPC係数と入力信号のLPC予
測残差エネルギーを算出し、それらを無音区間の符号化
データとして出力する。
【0007】DTX制御および多重化器14は、有音/
無音判定器11、CS−ACELP音声符号化器12お
よび無音区間符号化器13の出力から、送信データとし
て送信すべきデータを制御し、多重化して送信データと
して出力する。
【0008】
【発明が解決しようとする課題】しかしながら、上記従
来のCS−ACELP符号化器では、音声符号化器が音
声特有の冗長性を利用して8kbpsという低ビットレ
ートで符号化を行っているため、背景雑音が重畳されな
いクリーンな音声信号が入力された場合には、高品質な
符号化が可能であるが、入力信号として周囲の背景雑音
が重畳された音声信号が入力された場合、背景雑音信号
を符号化した際にその復号信号の品質が劣化するという
問題がある。
【0009】また、上記従来のDTX制御付きCS−A
CELP符号化器においては、有音区間のみCS−AC
ELP符号化器により符号化を行い、無音区間(雑音の
みの区間)は、専用の無音区間符号化器で音声符号化器
より少ないビットレートで符号化を行うことで、伝送す
る平均ビットレートを低減する。しなしながら、無音区
間符号化器が音声符号化器と同様な信号モデル(短区間
(10〜50ms程度)毎にAR型の合成フィルタ(L
PC合成フィルタ)を雑音信号で駆動することで復号信
号を生成する)で符号化を行っているため、上記従来の
CS−ACELP符号化器と同様に、背景雑音が重畳さ
れた音声信号に対しては復号信号の品質が劣化するとい
う問題がある。
【0010】本発明はかかる点に鑑みてなされたもので
あり、背景雑音が重畳された音声信号に対しても復号信
号の品質の劣化が少なく、かつ伝送に必要な平均ビット
レートも低減することのできる音声信号の符号化装置お
よび復号装置を提供することを目的とする。
【0011】
【課題を解決するための手段】本発明の骨子は、無音区
間(雑音のみの区間)の入力信号に対する統計的特徴量
を算出し、入力雑音信号に関する統計的特徴量を表現で
きるような雑音モデルに関する情報を記憶し、入力雑音
信号を表す雑音モデルパラメータが変化したかどうかを
検出し、雑音モデルの更新を行うことにより、背景雑音
が重畳された音声信号に対しても復号信号の品質の劣化
が少なく、かつ伝送に必要な平均ビットレートも低減す
ることである。
【0012】
【発明の実施の形態】本発明の第1の態様に係る雑音信
号符号化装置は、雑音信号を含む音声信号の前記雑音信
号に対して信号分析を行う分析手段と、前記雑音信号を
表わす雑音モデルに関する情報を記憶する記憶手段と、
現入力の雑音信号の信号分析結果に基づいて、記憶され
た雑音モデルに関する情報の変化を検出する検出手段
と、雑音モデルに関する情報の変化が検出された場合
に、前記変化の変化量分だけ前記記憶された雑音モデル
に関する情報を更新する更新手段と、を具備する構成を
採る。
【0013】この構成によれば、雑音信号を統計的特徴
量で表現できるような雑音モデルでモデル化することに
より、背景雑音信号に対して聴感的に劣化の少ない復号
信号を生成することができる。また、このモデル化によ
り、入力信号波形に対する忠実な符号化が不要となるの
で、入力信号に対応する雑音モデルパラメータが変化す
る区間のみ伝送することにより、低ビットレートで高効
率な符号化を行うことができる。
【0014】本発明の第2の態様に係る雑音信号符号化
装置は、第1の態様において、分析手段が、雑音信号に
関する統計的特徴量を抽出し、記憶手段は、前記統計的
特徴量を表現できる情報を雑音モデルに関する情報とし
て記憶する構成を採る。
【0015】この構成によれば、雑音信号を適切にモデ
ル化することができ、低ビットレートで高効率な符号化
を効率良く行うことができる。
【0016】本発明の第3の態様に係る音声信号符号化
装置は、入力音声信号に対して有音区間か雑音信号のみ
を含む無音区間かを判定する有音/無音判定手段と、判
定結果が有音である場合に前記入力音声信号に対して音
声符号化を行う音声符号化手段と、判定結果が無音であ
る場合に前記入力信号に対して雑音信号の符号化を行う
第1又は第2の態様の雑音信号符号化装置と、前記有音
/無音判定手段、前記音声符号化手段、および前記雑音
信号符号化装置からの出力を多重化する多重化手段と、
を具備する構成を採る。
【0017】この構成によれば、有音区間では音声信号
を高品質で符号化できる音声符号化手段で符号化を行
い、無音区間では高効率で聴感的に劣化が少ない第1の
態様の雑音信号符号化装置で符号化を行うことにより、
背景雑音環境下においても高品質・高効率な符号化を行
うことができる。
【0018】本発明の第4の態様に係る音声信号符号化
装置は、入力音声信号を、音声信号とこの音声信号に重
畳している背景雑音信号とに分離する音声/雑音信号分
離手段と、前記入力音声信号又は前記音声/雑音信号分
離手段により得られる音声信号から有音区間か雑音信号
のみを含む無音区間かを判定する有音/無音判定手段
と、判定結果が有音である場合に前記入力音声信号に対
して音声符号化を行う音声符号化手段と、前記音声/雑
音信号分離手段により得られる背景雑音信号の符号化を
行う第1又は第2の態様の雑音信号符号化装置と、前記
有音/無音判定手段、前記音声符号化手段、および前記
雑音信号符号化装置からの出力を多重化する多重化手段
と、を具備する構成を採る。
【0019】この構成によれば、有音区間では音声信号
を高品質で符号化できる音声符号化手段で符号化を行
い、雑音信号に対しては高効率で聴感的に劣化が少ない
第1の態様の雑音信号符号化装置で符号化を行うことに
より、背景雑音環境下においても高品質・高効率な符号
化を行うことができる。また、音声/雑音信号分離手段
を設けることにより、前記音声符号化手段に入力される
音声信号から重畳された背景雑音を除去することがで
き、有音区間をより高品質に又はより高効率に符号化す
ることができる。
【0020】本発明の第5の態様に係る音声信号符号化
装置は、入力音声信号に対して信号分析を行う分析手段
と、前記入力音声信号が有音信号であるかどうかを判定
するために必要な音声の特徴パターンを記憶する音声モ
デル記憶手段と、前記入力音声信号に含まれる雑音信号
を表現する雑音モデルに関する情報を記憶する雑音モデ
ル記憶手段と、前記分析手段、音声モデル記憶手段およ
び雑音モデル記憶手段の出力を用いて、前記入力音声信
号が有音区間か雑音信号のみを含む無音区間かを判定す
ると共に、前記無音区間の場合に雑音モデルを更新する
かどうかの判定を行うモード判定手段と、前記モード判
定手段が有音区間と判定した場合に入力音声信号に対し
て音声符号化を行う音声符号化手段と、前記モード判定
手段が無音区間でかつ雑音モデルを更新すると判定した
場合にその雑音モデルの更新を行う雑音モデル更新手段
と、音声符号化手段および雑音モデル更新手段からの出
力を多重化する多重化手段と、を具備する構成を採る。
【0021】この構成によれば、モード判定手段を設け
ることにより、入力信号の統計的特徴量の変化および音
声の特徴パターンを用いて判定を行うことができる。し
たがって、より正確なモード判定を行うことができ、判
定誤りによる品質劣化を抑えることができる。
【0022】本発明の第6の態様に係る基地局装置は、
第3から第5のいずれかの態様の音声信号符号化装置を
備えたことを特徴とする。本発明の第7の態様に係る通
信端末装置は、第3から第5のいずれかの態様の音声信
号符号化装置を備えたことを特徴とする。
【0023】本発明の第8の態様に係る雑音信号生成装
置は、符号化側で入力雑音信号に対して符号化された雑
音モデルパラメータおよび雑音モデル更新フラグにした
がって、必要な場合に雑音モデルの更新を行う雑音モデ
ル更新手段と、前記雑音モデル更新手段の出力を用いて
更新後の雑音モデルに関する情報を記憶する雑音モデル
記憶手段と、前記雑音モデル記憶手段で記憶している雑
音モデルに関する情報から雑音信号を生成する雑音信号
生成手段と、を具備する構成を採る。
【0024】この構成によれば、背景雑音信号に対して
聴感的に劣化の少ない復号信号を生成することができ
る。
【0025】本発明の第9の態様に係る雑音信号生成装
置は、第8の態様において、前記雑音モデル更新手段へ
入力する雑音モデルパラメータおよび前記雑音モデル記
憶手段で記憶する情報が、生成する雑音信号に関する統
計的特徴量を表現できる情報である構成を採る。
【0026】この構成によれば、雑音信号を統計的特徴
量で表現できるような雑音モデルでモデル化することに
より、背景雑音信号に対して聴感的に劣化の少ない復号
信号を生成することができる。
【0027】本発明の第10の態様に係る音声信号復号
化装置は、符号化側で符号化された音声データ、雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグを含む信号を受信し、前記信号から雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグを分離する分離手段と、前記有音/無音判
定フラグが有音区間を示す場合に、前記音声データに対
して音声復号を行う音声復号化手段と、前記有音/無音
判定フラグが無音区間を示す場合に、前記雑音モデルパ
ラメータおよび雑音モデル更新フラグから雑音信号の生
成を行う第8又は第9の態様の雑音信号生成装置と、前
記音声復号化手段から出力される復号音声と前記雑音信
号生成装置から出力される雑音信号のいずれかを、前記
有音/無音判定フラグに応じて切り替えて出力信号とし
て出力する出力切り替え手段と、を具備する構成を採
る。
【0028】この構成によれば、背景雑音信号に対して
聴感的に劣化の少ない復号信号を生成することができ
る。
【0029】本発明の第11の態様に係る音声信号復号
化装置は、符号化側で符号化された音声データ、雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグを含む信号を受信し、前記信号から雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグを分離する分離手段と、前記有音/無音判
定フラグが有音区間を示す場合に、前記音声データに対
して音声復号を行う音声復号化手段と、前記有音/無音
判定フラグが無音区間を示す場合に、前記雑音モデルパ
ラメータおよび雑音モデル更新フラグから雑音信号の生
成を行う第8又は第9の態様の雑音信号生成装置と、前
記音声復号化手段から出力される復号音声と前記雑音信
号生成装置から出力される雑音信号とを加算する音声/
雑音信号加算手段と、を具備する構成を採る。
【0030】この構成によれば、背景雑音信号に対して
聴感的に劣化の少ない復号信号を生成することができ
る。また、符号化側で音声信号とそれに重畳する雑音信
号を分離した後に、それぞれの信号に適した符号器で符
号化し、復号側でそれらを加算して復号信号を生成する
ので、有音区間の音声信号をより高品質に符号化するこ
とができる。
【0031】本発明の第12の態様に係る音声信号符号
化方法は、入力音声信号に対して有音区間か雑音信号の
みを含む無音区間かを判定する有音/無音判定工程と、
判定結果が有音である場合に前記入力音声信号に対して
音声符号化を行う音声符号化工程と、判定結果が無音で
ある場合に前記入力信号に対して雑音信号の符号化を行
う雑音信号符号化工程と、前記有音/無音判定工程、前
記音声符号化工程、および前記雑音信号符号化工程にお
ける出力を多重化する多重化工程と、を具備し、雑音信
号符号化工程は、雑音信号を含む音声信号の前記雑音信
号に対して信号分析を行う分析工程と、前記雑音信号を
表わす雑音モデルに関する情報を記憶する記憶工程と、
現入力の雑音信号の信号分析結果に基づいて、記憶され
た雑音モデルに関する情報の変化を検出する検出工程
と、雑音モデルに関する情報の変化が検出された場合
に、前記変化の変化量分だけ前記記憶された雑音モデル
に関する情報を更新する更新工程と、を含む。
【0032】この方法によれば、有音区間では音声信号
を高品質で符号化できる音声符号化手段で符号化を行
い、無音区間では高効率で聴感的に劣化が少ない第1の
態様の雑音信号符号化装置で符号化を行うことにより、
背景雑音環境下においても高品質・高効率な符号化を行
うことができる。
【0033】本発明の第13の態様に係る音声信号符号
化方法は、入力音声信号を、音声信号とこの音声信号に
重畳している背景雑音信号とに分離する音声/雑音信号
分離工程と、前記入力音声信号又は前記音声/雑音信号
分離工程において得られる音声信号から有音区間か雑音
信号のみを含む無音区間かを判定する有音/無音判定工
程と、判定結果が有音である場合に前記入力音声信号に
対して音声符号化を行う音声符号化工程と、判定結果が
無音である場合に前記入力信号に対して雑音信号の符号
化を行うと共に、前記音声/雑音信号分離工程において
得られる背景雑音信号の符号化を行う雑音信号符号化工
程と、前記有音/無音判定工程、前記音声符号化工程、
および前記雑音信号符号化工程における出力を多重化す
る多重化工程と、を具備し、雑音信号符号化工程は、雑
音信号を含む音声信号の前記雑音信号に対して信号分析
を行う分析工程と、前記雑音信号を表わす雑音モデルに
関する情報を記憶する記憶工程と、現入力の雑音信号の
信号分析結果に基づいて、記憶された雑音モデルに関す
る情報の変化を検出する検出工程と、雑音モデルに関す
る情報の変化が検出された場合に、前記変化の変化量分
だけ前記記憶された雑音モデルに関する情報を更新する
更新工程と、を含む。
【0034】この方法によれば、有音区間では音声信号
を高品質で符号化できる音声符号化手段で符号化を行
い、無音区間では高効率で聴感的に劣化が少ない第1の
態様の雑音信号符号化装置で符号化を行うことにより、
背景雑音環境下においても高品質・高効率な符号化を行
うことができる。また、音声/雑音信号分離手段を設け
ることにより、前記音声符号化手段に入力される音声信
号から重畳された背景雑音を除去することができ、有音
区間をより高品質に又はより高効率に符号化することが
できる。
【0035】本発明の第14の態様に係る音声信号符号
化方法は、入力音声信号に対して信号分析を行う分析工
程と、前記入力音声信号が有音信号であるかどうかを判
定するために必要な音声の特徴パターンを記憶する音声
モデル記憶工程と、前記入力音声信号に含まれる雑音信
号を表現する雑音モデルに関する情報を記憶する雑音モ
デル記憶工程と、前記分析手段、音声モデル記憶手段お
よび雑音モデル記憶手段の出力を用いて、前記入力音声
信号が有音区間か雑音信号のみを含む無音区間かを判定
すると共に、前記無音区間の場合に雑音モデルを更新す
るかどうかの判定を行うモード判定工程と、前記モード
判定手段が有音区間と判定した場合に入力音声信号に対
して音声符号化を行う音声符号化工程と、前記モード判
定手段が無音区間でかつ雑音モデルを更新すると判定し
た場合にその雑音モデルの更新を行う雑音モデル更新工
程と、音声符号化手段および雑音モデル更新手段からの
出力を多重化する多重化工程と、を具備する。
【0036】この方法によれば、モード判定手段を設け
ることにより、入力信号の統計的特徴量の変化および音
声の特徴パターンを用いて判定を行うことができる。し
たがって、より正確なモード判定を行うことができ、判
定誤りによる品質劣化を抑えることができる。
【0037】本発明の第15の態様に係る記録媒体は、
コンピュータに、入力雑音信号に対して統計的特徴量の
分析を行う手順と、入力雑音信号に対する統計的特徴量
を表現する雑音モデルに関する情報を記憶する手順と、
入力雑音信号を表す雑音モデルの変化を検出する手順
と、必要な場合に雑音モデルの更新を行い更新後の雑音
モデルに関する情報を出力する手順、を実行させるため
のプログラムを記録した機械読みとり可能なものであ
る。
【0038】以下、本発明の実施の形態について、添付
図面を参照して詳細に説明する。 (実施の形態1)図1は、本発明の実施の形態1に係る
音声信号符号化装置を備えた無線通信装置の構成を示す
ブロック図である。
【0039】この無線通信装置において、送信側で音声
がマイクなどの音声入力装置101によって電気的アナ
ログ信号に変換され、A/D変換器102に出力され
る。アナログ音声信号は、A/D変換器102によって
ディジタル音声信号に変換され、音声符号化部103に
出力される。音声符号化部103は、ディジタル音声信
号に対して音声符号化処理を行い、符号化した情報を変
復調部104に出力する。変復調部104は、符号化さ
れた音声信号をディジタル変調して、無線送信部105
に送る。無線送信部105では、変調後の信号に所定の
無線送信処理を施す。この信号は、アンテナ106を介
して送信される。
【0040】一方、無線通信装置の受信側では、アンテ
ナ107で受信した受信信号は、無線受信部108で所
定の無線受信処理が施され、変復調部104に送られ
る。変復調部104では、受信信号に対して復調処理を
行い、復調後の信号を音声復号化部109に出力する。
音声復号化部109は、復調後の信号に復号処理を行っ
てディジタル復号音声信号を得て、そのディジタル復号
音声信号をD/A変換器110へ出力する。D/A変換
器110は、音声復号化部109から出力されたディジ
タル復号音声信号をアナログ復号音声信号に変換してス
ピーカなどの音声出力装置111に出力する。最後に音
声出力装置111が電気的アナログ復号音声信号を復号
音声に変換して出力する。
【0041】図1に示す音声符号化部103は、図2に
示す構成を有する。図2は、本発明の実施の形態1に係
る音声符号化部の構成を示すブロック図である。
【0042】有音/無音判定器201において、入力音
声信号に対して有音区間か無音区間(雑音のみの区間)
かを判定し、その判定結果をDTX制御および多重化器
204に出力する。有音/無音判定器201は任意のも
のでよく、一般には、入力信号のパワー、スペクトルや
ピッチ周期などの複数のパラメータの瞬時量または変化
量等を用いて判定が行われる。
【0043】そして、前記有音/無音判定器201によ
る判定結果が有音である場合には、音声符号化器202
により、音声信号と雑音信号が含まれる有音区間におい
て入力音声信号に対して音声符号化を行い、その符号化
データをDTX制御および多重化器204に出力する。
この音声符号化器202は、有音区間用の符号化器であ
り、音声を高能率に符号化するものであれば任意の符号
化器でよい。
【0044】一方、前記有音/無音判定器201による
判定結果が無音である場合には、雑音信号符号化器20
3により、雑音信号のみが含まれる無音区間において入
力信号に対して雑音信号の符号化を行い、入力雑音信号
を表現する雑音モデルに関する情報と、雑音モデルの更
新をするかどうかのフラグとをDTX制御および多重化
器204に出力する。最後に、DTX制御および多重化
器204により、前記有音/無音判定器201、音声符
号化器202および雑音信号符号化器203からの出力
を用いて送信データとして送信すべき情報の制御と送信
情報の多重化を行い、送信データとして出力する。
【0045】図2における雑音信号符号化器203は、
図3に示す構成を有する。図3は、本発明の実施の形態
1に係る音声符号化部の雑音信号符号化器の構成を示す
ブロック図である。
【0046】雑音信号分析部301により、ある一定区
間毎に入力された雑音信号に対して信号分析を行い、雑
音信号に対する分析パラメータを算出する。抽出する分
析パラメータとしては、入力信号に関する統計的特徴量
を表すのに必要なパラメータであり、例えば、短区間信
号に対してFFT(Fast Fourier Transform)により求め
た短時間スペクトルや、入力パワー、LPCスペクトル
パラメータ等がある。
【0047】次に、雑音モデル変化検出部303におい
て、現在入力された雑音信号を表すべき雑音モデルパラ
メータが、雑音モデル記憶部302により保持されてい
る雑音モデルパラメータから変化しているかどうかを検
出する。
【0048】ここで、雑音モデルパラメータとは、入力
雑音信号に関する統計的特徴量を表現できるような雑音
モデルに関する情報であり、例えば、短時間スペクトル
の平均スペクトルや分散値、等の統計的特徴量を、例え
ばHMMのような統計モデルで表現した際の情報であ
る。
【0049】そして、雑音モデル変化検出部303は、
雑音信号分析部301により得られた現入力信号に対す
る分析パラメータが、それ以前の入力信号を表す雑音モ
デルとして記憶された雑音モデルからの出力として妥当
かどうか(例えば、HMMモデルであれば現入力信号に
対する分析パラメータの出力確率が規定値以上である
か)を判定し、現在入力された雑音信号を表すべき雑音
モデルパラメータが記憶された雑音モデルから変化して
いると判定された場合に、雑音モデルの更新を行うかど
うかのフラグと更新すべき情報(更新情報)を雑音モデ
ル更新部304に出力する。
【0050】なお、外部更新許可フラグは、雑音モデル
更新を許可するかどうかを外部から指示するフラグで、
後述する本発明における音声符号化部において、有音区
間中の符号化データを送信する期間中等、雑音モデルパ
ラメータの送信を行わないようにする際には、雑音モデ
ルの更新を不許可とする。
【0051】そして、雑音モデル更新部304におい
て、雑音モデル更新フラグが更新を示す場合には、雑音
モデル更新情報として、更新後の雑音モデルパラメータ
または以前に雑音モデル記憶部302に記憶されている
雑音モデルパラメータからの変化分のみの情報を出力す
ると共に、その出力情報を用いて雑音モデル記憶部30
2の更新を行う。一方、雑音モデル更新フラグが非更新
を示す場合には、更新を行わず、更新情報を出力しな
い。
【0052】次に、図1に示す音声復号化部109は、
図4に示す構成を有する。図4は、本発明の実施の形態
1に係る音声復号化装置の構成を示すブロック図であ
る。
【0053】分離およびDTX制御器401において、
符号化側で入力信号に対して符号化され送信された送信
データを受信データとして受信し、この受信データを音
声復号および雑音生成に必要な、音声符号化データまた
は雑音モデルパラメータ、有音/無音判定フラグおよび
雑音モデル更新フラグに分離する。
【0054】次いで、前記有音/無音判定フラグが有音
区間を示す場合には、音声復号化器402により前記音
声符号化データから音声復号を行い復号音声を出力切替
え器404に出力する。
【0055】一方、前記有音/無音判定フラグが無音区
間を示す場合には、雑音信号生成器403により前記雑
音モデルパラメータおよび雑音モデル更新フラグから雑
音信号の生成を行し、雑音信号を出力切替え器404に
出力する。そして、出力切り替え器404により、前記
音声復号化器402の出力と前記雑音信号生成器403
の出力を、有音/無音判定フラグの結果に応じて切り替
えて出力し、出力信号とする。
【0056】図4における雑音信号生成器403は、図
5に示す構成を有する。図5は、本発明の実施の形態1
に係る音声復号化装置の雑音信号生成器の構成を示すブ
ロック図である。
【0057】図3に示す雑音信号符号化器203から出
力された、雑音モデル更新フラグおよび雑音モデルパラ
メータ(モデル更新の場合)が雑音モデル更新部501
に入力される。雑音モデル更新部501においては、前
記雑音モデル更新フラグが更新を示している場合、前記
入力雑音モデルパラメータおよび雑音モデル記憶部50
2で保持されている以前の雑音モデルパラメータを用い
て、雑音モデルの更新を行い、更新後の雑音モデルパラ
メータを雑音モデル記憶部502にて新たに記憶する。
【0058】雑音信号生成部503では、雑音モデル記
憶部502の情報をもとに、雑音信号を生成し出力す
る。雑音生成は、統計的特徴量をパラメータにモデル化
された情報をもとに、生成される雑音信号がそのモデル
からの出力として妥当な信号となるように生成される。
例えば、統計モデルとしてHMMを用いた場合、その状
態遷移確率およびパラメータ出力確率等に従って、生成
に必要な信号パラメータ(例えば、短時間スペクトル)
を確率的に出力し、それに基づき雑音信号を生成・出力
する。
【0059】次に、上記構成を有する音声符号化部およ
び音声復号化部の動作について説明する。図6は、実施
の形態1に係る音声信号の符号化方法の処理の流れを示
すフロー図である。なお、本方法では、図6に示す本処
理を、一定短区間(例えば、10〜50ms程度)のフ
レーム毎に繰り返して行うものとする。
【0060】まず、ステップ(以下STと省略する)1
01において、フレーム単位の音声信号を入力する。次
に、ST102にて、入力信号に対する有音/無音判定
を行い、その判定結果を出力する。そして、その判定結
果が有音である場合には、ST104により入力音声信
号に対して音声符号化処理を行いその符号化データを出
力する。
【0061】一方、ST103における判定結果が無音
である場合には、ST105にて、入力信号に対して雑
音信号符号化器による雑音信号符号化処理を行い、入力
雑音信号を表現する雑音モデルに関する情報と雑音モデ
ルの更新を行うかどうかのフラグを出力する。なお、雑
音信号の符号化処理については後述する。
【0062】そして、ST106において、前記有音/
無音判定、音声符号化処理および雑音信号符号化処理の
結果得られた出力を用いて送信データとして送信すべき
情報の制御と送信情報の多重化を行い、最後にST10
7にて、送信データとして出力する。
【0063】図7は、本実施の形態に係る音声信号の符
号化方法における雑音信号符号化方法の処理の流れを示
すフロー図である。なお、本方法では、図7に示す本処
理を、一定短区間(例えば、10〜50ms程度)のフ
レーム毎に繰り返して行うものとする。
【0064】ST201において、フレーム単位の雑音
信号を入力する。次に、ST202において、フレーム
単位の雑音信号に対して信号分析を行い、雑音信号に対
する分析パラメータを算出する。そして、ST203に
おいて、分析パラメータから雑音モデルの変化があるか
どうかの検出を行い、雑音モデルが変化したと判定され
た場合、ST205にて、雑音モデルの更新をするかど
うかのフラグ(更新あり)と更新すべき情報(更新情
報)を出力すると共に、ST206にて、その出力情報
を用いて雑音モデル記憶部302の更新を行う。
【0065】一方、ST204にて、雑音モデルの変化
なしと判定された場合には、ST207にて、雑音モデ
ルの更新をするかどうかのフラグ(更新なし)のみ出力
する。なお、ST203において、外部から別途入力さ
れる外部更新許可フラグが不許可の場合、モデル変化な
しとして雑音モデルパラメータの送信を行わないように
する。
【0066】このように、本実施の形態に係る雑音符号
化方法によれば、雑音信号を統計的特徴量で表現できる
ような雑音モデルでモデル化することにより、背景雑音
信号に対して聴感的に劣化の少ない復号信号を生成する
ことができる。また、入力信号波形に対する忠実な符号
化が不要であると共に、入力信号に対応する雑音モデル
パラメータが変化する区間のみ伝送することにより、低
ビットレートで高効率な符号化を行うことができる。
【0067】また、本実施の形態に係る音声信号の符号
化方法によれば、有音区間では音声信号を高品質で符号
化できる音声符号化器で符号化を行い、無音区間では高
効率で聴感的に劣化が少ない雑音信号符号化器で符号化
を行うことにより、背景雑音環境下においても高品質・
高効率な符号化を行うことができる。
【0068】(実施の形態2)図8は、本発明の実施の
形態2に係る音声信号の符号化部の構成を示すブロック
図である。
【0069】この音声符号化部103においては、音声
/雑音信号分離器801で、入力音声信号を、音声信号
と音声信号に重畳している背景雑音信号とに分離する。
音声/雑音信号分離器801は、任意のものでよい。こ
の分離方法としては、スペクトルサブトラクションと呼
ばれる、入力信号から周波数領域で雑音スペクトルを減
ずることで、入力信号を雑音抑圧後の音声信号と雑音信
号とに分離する方法や、複数の信号入力器からの入力信
号から音声と雑音の分離を行う方法などが考えられる。
【0070】次に、有音/無音判定器802において、
前記音声/雑音信号分離器801から得られる分離後の
音声信号から有音区間か無音区間(雑音のみの区間)か
を判定し、その判定結果を音声符号化器803およびD
TX制御および多重化器805に出力する。なお、分離
前の入力信号を用いて判定を行う構成でもよい。有音/
無音判定器802は任意のものでよい。この判定は、一
般には、入力信号のパワー、スペクトルやピッチ周期な
どの複数のパラメータの瞬時量または変化量等を用いて
判定が行われる。
【0071】そして、前記有音/無音判定器802によ
る判定結果が有音である場合には、音声符号化器803
により、前記音声/雑音信号分離器801から得られる
分離後の音声信号に対して有音区間のみ音声符号化器8
03で音声信号の符号化を行い、その符号化データをD
TX制御および多重化器805に出力する。この音声符
号化器803は、有音区間用の符号化器で、音声を高能
率に符号化する任意の符号化器でよい。
【0072】一方、雑音信号符号化器804により、前
記音声/雑音信号分離器801から得られる分離後の雑
音信号に対して全区間にわたって雑音信号符号化器80
4で雑音信号の符号化を行い、入力雑音信号表現する雑
音モデルに関する情報と雑音モデルの更新をするかどう
かのフラグを出力する。音声/雑音信号符号化器801
は、実施の形態1にて説明した図3に示すものである。
【0073】なお、有音/無音判定結果が有音である場
合、雑音信号符号化器804に入力される有音/無音判
定結果フラグを雑音信号符号化器804における雑音モ
デル更新不許可フラグとして、モデル更新を行わないよ
うにする。
【0074】最後に、DTX制御および多重化器805
により、前記有音/無音判定器802、音声符号化器8
03および雑音信号符号化器804からの出力を用いて
送信データとして送信すべき情報の制御と送信情報の多
重化を行い、送信データとして出力する。
【0075】図9は、実施の形態2に係る音声信号の復
号化装置の構成を示すブロック図である。図9に示す復
号化装置においては、分離およびDTX制御器901に
おいて、符号化側で入力信号に対して符号化され送信さ
れた送信データを受信データとして受信し、音声復号お
よび雑音生成に必要な、音声符号化データまたは雑音モ
デルパラメータ、有音/無音判定フラグおよび雑音モデ
ル更新フラグに分離する。
【0076】次に、前記有音/無音判定フラグが有音区
間を示す場合には、音声復号化器902により前記音声
符号化データから音声復号を行い復号音声を音声/雑音
信号加算器904に出力する。
【0077】一方、雑音信号生成器903により前記雑
音モデルパラメータおよび雑音モデル更新フラグから雑
音信号の生成を行い、雑音信号を音声/雑音信号加算器
904に出力する。そして、音声/雑音信号加算器90
4により、前記音声復号化器902の出力と前記雑音信
号生成器903の出力とを加算し、出力信号とする。
【0078】次に、図10を参照して、実施の形態2に
係る音声信号の符号化方法の処理の流れを説明する。な
お、本方法では、図10に示す本処理を、一定短区間
(例えば、10〜50ms程度)のフレーム毎に繰り返
して行うものとする。
【0079】まず、ST301において、フレーム単位
の入力信号を入力する。次いで、ST302にて、入力
音声信号を、音声信号と音声信号に重畳している背景雑
音信号とに分離する。そして、ST303において、入
力信号またはST302で得られた分離後の音声信号に
対して有音/無音判定を行い、その判定結果を出力する
(ST304)。
【0080】そして、判定結果が有音である場合には、
ST305において、ST302で得られた分離後の音
声信号に対して音声符号化器による音声符号化処理を行
い、その符号化データを出力する。次いで、ST302
で得られた分離後の雑音信号に対して、ST306に
て、雑音信号符号化器による雑音信号符号化処理を行
い、入力雑音信号表現する雑音モデルに関する情報と雑
音モデルの更新をするかどうかのフラグを出力する。
【0081】ST303における有音/無音判定結果が
有音である場合、ST306にて行う雑音信号符号化処
理において、モデル更新を行わないようにする。そし
て、ST307において、前記有音/無音判定、音声符
号化処理および雑音信号符号化処理の結果得られた出力
を用いて送信データとして送信すべき情報の制御と送信
情報との多重化を行い、最後にST308にて送信デー
タとして出力する。
【0082】このように、本実施の形態の音声信号の符
号化装置によれば、有音区間では音声信号を高品質で符
号化できる音声符号化器で符号化を行い、雑音信号に対
しては高効率で聴感的に劣化が少ない実施の形態1記載
の雑音信号符号化器で符号化を行うことにより、背景雑
音環境下においても高品質・高効率な符号化を行うこと
ができ、さらに音声/雑音信号分離器を設けることによ
り、前記音声符号化器に入力される音声信号から重畳さ
れた背景雑音が除去され、有音区間をより高品質にまた
はより高効率に符号化することができる。
【0083】(実施の形態3)図11は、本発明の実施
の形態3に係る音声符号化部の構成を示すブロック図で
ある。なお、本実施の形態における復号側の構成は、図
4に示す音声信号の復号装置の構成と同一である。
【0084】入力信号分析器1101により、ある一定
区間毎に入力された入力信号に対して信号分析を行い、
入力信号に対する分析パラメータを算出する。抽出する
特徴パラメータとしては、入力信号に関する統計的特徴
量を表すのに必要なパラメータおよび音声的な特徴を表
すパラメータである。統計的特徴量を表すのに必要なパ
ラメータとしては、例えば、短区間信号に対してFFT
により求めた短時間スペクトルや、入力パワー、LPC
スペクトルパラメータ、等がある。また、音声的な特徴
を表すパラメータとしては、LPCパラメータ、入力パ
ワーやピッチ周期性情報、等がある。
【0085】次に、モード判定器1104により、前記
入力信号分析器1101で得られた分析パラメータに対
して、音声モデル記憶器1102で保持されている音声
的な特徴パターンおよび雑音モデル記憶器1103で保
持されている雑音モデルパラメータを用いて、入力信号
が有音区間か無音区間(雑音のみの区間)か、および無
音区間の場合に雑音モデルを更新して更新情報を伝送す
るかどうかの判定を行う。
【0086】ここで、音声モデル記憶器1102は、音
声的な特徴パターンを予め作成記憶しているもので、音
声的な特徴パターンとしては、例えば、音声(有音)区
間中のLPCパラメータ、入力信号パワーやピッチ周期
性情報等の分布などの情報である。また、雑音モデルパ
ラメータとは、入力雑音信号に関する統計的特徴量を表
現できるような雑音モデルに関する情報であり、例え
ば、短時間スペクトルの平均スペクトルや分散値、等の
統計的特徴量を、例えばHMMのような統計モデルで表
現した際の情報である。
【0087】そして、入力信号分析器1101により得
られた現入力信号に対する統計的分析パラメータが、そ
れ以前の雑音区間中の信号を表す雑音モデルとして記憶
された雑音モデルからの出力として妥当かどうか(例え
ば、HMMモデルであれば現入力信号に対する分析パラ
メータの出力確率が規定値以上であるか)を判定すると
共に、入力信号に対する音声的特徴を表すパラメータか
ら音声(有音)区間かどうかを判定する。
【0088】前記モード判定器1104が有音区間であ
ると判定した場合には、音声符号化器1105により、
入力信号に対して音声符号化を行いその符号化データを
DTX制御および多重化器1107に出力する。一方、
前記モード判定器1104が無音区間でかつ雑音モデル
更新情報を伝送すると判定した場合には、雑音モデル更
新器1106により、その雑音モデルの更新を行い、更
新後の雑音モデルに関する情報をDTX制御および多重
化器1107に出力する。
【0089】最後に、DTX制御および多重化器110
7により、音声符号化器および雑音モデル更新器110
6からの出力を用いて送信データとして送信すべき情報
の制御と送信情報の多重化を行い、送信データを出力す
る。
【0090】次に、図12を参照して、本実施の形態に
係る音声信号の符号化方法の処理の流れを説明する。な
お、本方法では、図12に示す本処理を、一定短区間
(例えば、10〜50ms程度)のフレーム毎に繰り返
して行うものとする。
【0091】まず、ST401において、フレーム単位
の入力信号を入力する。次に、ST402において、あ
る一定区間毎に入力された入力信号に対して信号分析を
行い、その分析パラメータを算出し出力する。
【0092】そして、ST403において、現在入力さ
れた統計的分析パラメータが、図11における雑音モデ
ル記憶器1103により保持されている雑音モデルから
の出力として妥当かどうかその適合性を判定する(ST
404)。その結果、適合しない、すなわち現入力信号
が現時点で保持されている雑音モデルでは表現できない
と判定された場合には、次のST405に進み、入力信
号に対して分析して得られた音声的特徴パラメータから
音声(有音)区間かどうか判定する。そして、音声区間
と判定された場合、ST406にて、音声符号化器によ
る音声符号化処理を行い、その符号化データを出力す
る。
【0093】一方、ST405にて、音声区間ではない
と判定された場合、ST407にて、雑音モデルの更新
を行い、更新後の雑音モデルに関する情報を出力する。
ST403にて、現入力が現時点で保持されている雑音
モデルで表現できると判定された場合は、何も処理をせ
ず次ステップに進む。そして、ST408において、音
声符号化器および雑音モデル更新器からの出力を用いて
送信データとして送信すべき情報の制御と送信情報の多
重化を行い、ST409にて送信データを出力する。
【0094】このように、本実施の形態に係る音声信号
の符号化装置によれば、モード判定器を設けることによ
り、入力信号の統計的特徴量の変化および音声の特徴パ
ターンを用いて判定を行うことができる。したがって、
より正確なモード判定を行うことができ、判定誤りによ
る品質劣化を抑えることができる。
【0095】
【発明の効果】以上説明したように本発明の雑音信号符
号化装置では、雑音信号を統計的特徴量で表現できるよ
うな雑音モデルでモデル化することにより、背景雑音信
号に対して聴感的に劣化の少ない復号信号を生成するこ
とができる。また、入力信号波形に対する忠実な符号化
が不要となるので、入力信号に対応する雑音モデルパラ
メータが変化する区間のみ伝送することにより、低ビッ
トレートで高効率な符号化を行うことができる。
【0096】また、本発明の音声信号符号化装置におい
ては、有音区間では音声信号を高品質で符号化できる音
声符号化器で符号化を行い、無音区間では高効率で聴感
的に劣化が少ない前記雑音信号符号化器で符号化を行う
ことにより、背景雑音環境下においても高品質・高効率
な符号化を行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る音声信号符号化装置
及び音声信号復号化装置を備えた無線通信システムの構
成を示すブロック図
【図2】本発明の実施の形態1に係る音声信号符号化装
置の構成を示すブロック図
【図3】本発明の実施の形態1に係る雑音信号符号化装
置の構成を示すブロック図
【図4】本発明の実施の形態1に係る音声信号復号化装
置の構成を示すブロック図
【図5】本発明の実施の形態1に係る音声信号復号化装
置における雑音信号生成器の構成を示すブロック図
【図6】本発明の実施の形態1に係る音声信号符号化方
法の処理の流れを示すフロー図
【図7】本発明の実施の形態1に係る雑音信号符号化方
法の処理の流れを示すフロー図
【図8】本発明の実施の形態2に係る音声信号符号化装
置の構成を示すブロック図
【図9】本発明の実施の形態2に係る音声信号復号化装
置の構成を示すブロック図
【図10】本発明の実施の形態2に係る音声信号符号化
方法の処理の流れを示すフロー図
【図11】本発明の実施の形態3に係る音声信号符号化
装置の構成を示すブロック図
【図12】本発明の実施の形態3に係る音声信号符号化
方法の処理の流れを示すフロー図
【図13】従来の音声信号符号化装置の構成を示すブロ
ック図
【図14】従来の音声信号符号化装置の構成を示すブロ
ック図
【符号の説明】
201 有音/無音判定器 202 音声符号化器 203 雑音信号符号化器 204 DTX制御および多重化器 301 雑音信号分析部 302,502 雑音モデル記憶部 303 雑音モデル変化検出部 304,501 雑音モデル更新部 401 分離およびDTX制御器 402 音声復号化器 403 雑音信号生成器 404 出力切り替え器 503 雑音信号生成部

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 雑音信号を含む音声信号の前記雑音信号
    に対して信号分析を行う分析手段と、前記雑音信号を表
    わす雑音モデルに関する情報を記憶する記憶手段と、現
    入力の雑音信号の信号分析結果に基づいて、記憶された
    雑音モデルに関する情報の変化を検出する検出手段と、
    雑音モデルに関する情報の変化が検出された場合に、前
    記変化の変化量分だけ前記記憶された雑音モデルに関す
    る情報を更新する更新手段と、を具備することを特徴と
    する雑音信号符号化装置。
  2. 【請求項2】 分析手段は、雑音信号に関する統計的特
    徴量を抽出し、記憶手段は、前記統計的特徴量を表現で
    きる情報を雑音モデルに関する情報として記憶すること
    を特徴とする請求項1記載の雑音信号符号化装置。
  3. 【請求項3】 入力音声信号に対して有音区間か雑音信
    号のみを含む無音区間かを判定する有音/無音判定手段
    と、判定結果が有音である場合に前記入力音声信号に対
    して音声符号化を行う音声符号化手段と、判定結果が無
    音である場合に前記入力信号に対して雑音信号の符号化
    を行う請求項1又は請求項2記載の雑音信号符号化装置
    と、前記有音/無音判定手段、前記音声符号化手段、お
    よび前記雑音信号符号化装置からの出力を多重化する多
    重化手段と、を具備することを特徴とする音声信号符号
    化装置。
  4. 【請求項4】 入力音声信号を、音声信号とこの音声信
    号に重畳している背景雑音信号とに分離する音声/雑音
    信号分離手段と、前記入力音声信号又は前記音声/雑音
    信号分離手段により得られる音声信号から有音区間か雑
    音信号のみを含む無音区間かを判定する有音/無音判定
    手段と、判定結果が有音である場合に前記入力音声信号
    に対して音声符号化を行う音声符号化手段と、前記音声
    /雑音信号分離手段により得られる背景雑音信号の符号
    化を行う請求項1又は請求項2記載の雑音信号符号化装
    置と、前記有音/無音判定手段、前記音声符号化手段、
    および前記雑音信号符号化装置からの出力を多重化する
    多重化手段と、を具備することを特徴とする音声信号符
    号化装置。
  5. 【請求項5】 入力音声信号に対して信号分析を行う分
    析手段と、前記入力音声信号が有音信号であるかどうか
    を判定するために必要な音声の特徴パターンを記憶する
    音声モデル記憶手段と、前記入力音声信号に含まれる雑
    音信号を表現する雑音モデルに関する情報を記憶する雑
    音モデル記憶手段と、前記分析手段、音声モデル記憶手
    段および雑音モデル記憶手段の出力を用いて、前記入力
    音声信号が有音区間か雑音信号のみを含む無音区間かを
    判定すると共に、前記無音区間の場合に雑音モデルを更
    新するかどうかの判定を行うモード判定手段と、前記モ
    ード判定手段が有音区間と判定した場合に入力音声信号
    に対して音声符号化を行う音声符号化手段と、前記モー
    ド判定手段が無音区間でかつ雑音モデルを更新すると判
    定した場合にその雑音モデルの更新を行う雑音モデル更
    新手段と、音声符号化手段および雑音モデル更新手段か
    らの出力を多重化する多重化手段と、を具備することを
    特徴とする音声信号符号化装置。
  6. 【請求項6】 請求項3から請求項5のいずれかに記載
    の音声信号符号化装置を備えたことを特徴とする基地局
    装置。
  7. 【請求項7】 請求項3から請求項5のいずれかに記載
    の音声信号符号化装置を備えたことを特徴とする通信端
    末装置。
  8. 【請求項8】 符号化側で入力雑音信号に対して符号化
    された雑音モデルパラメータおよび雑音モデル更新フラ
    グにしたがって、必要な場合に雑音モデルの更新を行う
    雑音モデル更新手段と、前記雑音モデル更新手段の出力
    を用いて更新後の雑音モデルに関する情報を記憶する雑
    音モデル記憶手段と、前記雑音モデル記憶手段で記憶し
    ている雑音モデルに関する情報から雑音信号を生成する
    雑音信号生成手段と、を具備することを特徴とする雑音
    信号生成装置。
  9. 【請求項9】 前記雑音モデル更新手段へ入力する雑音
    モデルパラメータおよび前記雑音モデル記憶手段で記憶
    する情報が、生成する雑音信号に関する統計的特徴量を
    表現できる情報であることを特徴とする請求項8記載の
    雑音信号生成装置。
  10. 【請求項10】 符号化側で符号化された音声データ、
    雑音モデルパラメータ、有音/無音判定フラグおよび雑
    音モデル更新フラグを含む信号を受信し、前記信号から
    雑音モデルパラメータ、有音/無音判定フラグおよび雑
    音モデル更新フラグを分離する分離手段と、前記有音/
    無音判定フラグが有音区間を示す場合に、前記音声デー
    タに対して音声復号を行う音声復号化手段と、前記有音
    /無音判定フラグが無音区間を示す場合に、前記雑音モ
    デルパラメータおよび雑音モデル更新フラグから雑音信
    号の生成を行う請求項8又は請求項9記載の雑音信号生
    成装置と、前記音声復号化手段から出力される復号音声
    と前記雑音信号生成装置から出力される雑音信号のいず
    れかを、前記有音/無音判定フラグに応じて切り替えて
    出力信号として出力する出力切り替え手段と、を具備す
    ることを特徴とする音声信号復号化装置。
  11. 【請求項11】 符号化側で符号化された音声データ、
    雑音モデルパラメータ、有音/無音判定フラグおよび雑
    音モデル更新フラグを含む信号を受信し、前記信号から
    雑音モデルパラメータ、有音/無音判定フラグおよび雑
    音モデル更新フラグを分離する分離手段と、前記有音/
    無音判定フラグが有音区間を示す場合に、前記音声デー
    タに対して音声復号を行う音声復号化手段と、前記有音
    /無音判定フラグが無音区間を示す場合に、前記雑音モ
    デルパラメータおよび雑音モデル更新フラグから雑音信
    号の生成を行う請求項8又は請求項9記載の雑音信号生
    成装置と、前記音声復号化手段から出力される復号音声
    と前記雑音信号生成装置から出力される雑音信号とを加
    算する音声/雑音信号加算手段と、を具備することを特
    徴とする音声信号復号化装置。
  12. 【請求項12】 入力音声信号に対して有音区間か雑音
    信号のみを含む無音区間かを判定する有音/無音判定工
    程と、判定結果が有音である場合に前記入力音声信号に
    対して音声符号化を行う音声符号化工程と、判定結果が
    無音である場合に前記入力信号に対して雑音信号の符号
    化を行う雑音信号符号化工程と、前記有音/無音判定工
    程、前記音声符号化工程、および前記雑音信号符号化工
    程における出力を多重化する多重化工程と、を具備し、 雑音信号符号化工程は、雑音信号を含む音声信号の前記
    雑音信号に対して信号分析を行う分析工程と、前記雑音
    信号を表わす雑音モデルに関する情報を記憶する記憶工
    程と、現入力の雑音信号の信号分析結果に基づいて、記
    憶された雑音モデルに関する情報の変化を検出する検出
    工程と、雑音モデルに関する情報の変化が検出された場
    合に、前記変化の変化量分だけ前記記憶された雑音モデ
    ルに関する情報を更新する更新工程と、を含むことを特
    徴とする音声信号符号化方法。
  13. 【請求項13】 入力音声信号を、音声信号とこの音声
    信号に重畳している背景雑音信号とに分離する音声/雑
    音信号分離工程と、前記入力音声信号又は前記音声/雑
    音信号分離工程において得られる音声信号から有音区間
    か雑音信号のみを含む無音区間かを判定する有音/無音
    判定工程と、判定結果が有音である場合に前記入力音声
    信号に対して音声符号化を行う音声符号化工程と、判定
    結果が無音である場合に前記入力信号に対して雑音信号
    の符号化を行うと共に、前記音声/雑音信号分離工程に
    おいて得られる背景雑音信号の符号化を行う雑音信号符
    号化工程と、前記有音/無音判定工程、前記音声符号化
    工程、および前記雑音信号符号化工程における出力を多
    重化する多重化工程と、を具備し、 雑音信号符号化工程は、雑音信号を含む音声信号の前記
    雑音信号に対して信号分析を行う分析工程と、前記雑音
    信号を表わす雑音モデルに関する情報を記憶する記憶工
    程と、現入力の雑音信号の信号分析結果に基づいて、記
    憶された雑音モデルに関する情報の変化を検出する検出
    工程と、雑音モデルに関する情報の変化が検出された場
    合に、前記変化の変化量分だけ前記記憶された雑音モデ
    ルに関する情報を更新する更新工程と、を含むことを特
    徴とする音声信号符号化方法。
  14. 【請求項14】 入力音声信号に対して信号分析を行う
    分析工程と、前記入力音声信号が有音信号であるかどう
    かを判定するために必要な音声の特徴パターンを記憶す
    る音声モデル記憶工程と、前記入力音声信号に含まれる
    雑音信号を表現する雑音モデルに関する情報を記憶する
    雑音モデル記憶工程と、前記分析手段、音声モデル記憶
    手段および雑音モデル記憶手段の出力を用いて、前記入
    力音声信号が有音区間か雑音信号のみを含む無音区間か
    を判定すると共に、前記無音区間の場合に雑音モデルを
    更新するかどうかの判定を行うモード判定工程と、前記
    モード判定手段が有音区間と判定した場合に入力音声信
    号に対して音声符号化を行う音声符号化工程と、前記モ
    ード判定手段が無音区間でかつ雑音モデルを更新すると
    判定した場合にその雑音モデルの更新を行う雑音モデル
    更新工程と、音声符号化手段および雑音モデル更新手段
    からの出力を多重化する多重化工程と、を具備すること
    を特徴とする音声信号符号化方法。
  15. 【請求項15】 コンピュータに、入力雑音信号に対し
    て統計的特徴量の分析を行う手順と、入力雑音信号に対
    する統計的特徴量を表現する雑音モデルに関する情報を
    記憶する手順と、入力雑音信号を表す雑音モデルの変化
    を検出する手順と、必要な場合に雑音モデルの更新を行
    い更新後の雑音モデルに関する情報を出力する手順、を
    実行させるためのプログラムを記録した機械読みとり可
    能な記憶媒体。
JP16854599A 1999-06-15 1999-06-15 雑音信号符号化装置および音声信号符号化装置 Expired - Fee Related JP4464484B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP16854599A JP4464484B2 (ja) 1999-06-15 1999-06-15 雑音信号符号化装置および音声信号符号化装置
AU51037/00A AU5103700A (en) 1999-06-15 2000-06-01 Noise signal encoder and voice signal encoder
PCT/JP2000/003526 WO2000077774A1 (fr) 1999-06-15 2000-06-01 Codeur de signaux de bruit et codeur de signaux vocaux
EP00935511A EP1120775A4 (en) 1999-06-15 2000-06-01 NOISE SIGNAL ENCODER AND VOICE SIGNAL ENCODER
CN00801092.7A CN1313983A (zh) 1999-06-15 2000-06-01 噪声信号编码装置及语音信号编码装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16854599A JP4464484B2 (ja) 1999-06-15 1999-06-15 雑音信号符号化装置および音声信号符号化装置

Publications (2)

Publication Number Publication Date
JP2000357000A true JP2000357000A (ja) 2000-12-26
JP4464484B2 JP4464484B2 (ja) 2010-05-19

Family

ID=15870014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16854599A Expired - Fee Related JP4464484B2 (ja) 1999-06-15 1999-06-15 雑音信号符号化装置および音声信号符号化装置

Country Status (5)

Country Link
EP (1) EP1120775A4 (ja)
JP (1) JP4464484B2 (ja)
CN (1) CN1313983A (ja)
AU (1) AU5103700A (ja)
WO (1) WO2000077774A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304505A (ja) * 2006-05-15 2007-11-22 Nippon Telegr & Teleph Corp <Ntt> サーバ・クライアント型音声認識方法、装置およびサーバ・クライアント型音声認識プログラム、記録媒体
JP2014505907A (ja) * 2011-02-14 2014-03-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
JP2022036998A (ja) * 2016-05-30 2022-03-08 ソニーグループ株式会社 映像音響処理装置および方法、並びにプログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9118805B2 (en) 2007-06-27 2015-08-25 Nec Corporation Multi-point connection device, signal analysis and device, method, and program
CN101546557B (zh) * 2008-03-28 2011-03-23 展讯通信(上海)有限公司 用于音频内容识别的分类器参数更新方法
US20120095760A1 (en) * 2008-12-19 2012-04-19 Ojala Pasi S Apparatus, a method and a computer program for coding
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
CN104469250B (zh) * 2013-09-23 2019-07-26 联想(北京)有限公司 一种信息处理方法及电子设备
EP3010017A1 (en) * 2014-10-14 2016-04-20 Thomson Licensing Method and apparatus for separating speech data from background data in audio communication
CN106971741B (zh) * 2016-01-14 2020-12-01 芋头科技(杭州)有限公司 实时将语音进行分离的语音降噪的方法及系统

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2692104B2 (ja) * 1988-02-12 1997-12-17 株式会社日立製作所 音声多重化システム
JPH07129195A (ja) * 1993-11-05 1995-05-19 Nec Corp 音声復号化装置
JP3173639B2 (ja) * 1995-05-26 2001-06-04 株式会社エヌ・ティ・ティ・ドコモ 背景雑音更新システムおよび方法
JP2806308B2 (ja) * 1995-06-30 1998-09-30 日本電気株式会社 音声復号化装置
JP3259759B2 (ja) * 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JP3575967B2 (ja) * 1996-12-02 2004-10-13 沖電気工業株式会社 音声通信システムおよび音声通信方法
JP3119204B2 (ja) * 1997-06-27 2000-12-18 日本電気株式会社 音声符号化装置
JP2000122698A (ja) * 1998-10-19 2000-04-28 Mitsubishi Electric Corp 音声符号化装置
DE10084675T1 (de) * 1999-06-07 2002-06-06 Ericsson Inc Verfahren und Vorrichtung zur Erzeugung von künstlichem Geräusch unter Verwendung von parametrischen Geräuschmodell-Masszahlen

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007304505A (ja) * 2006-05-15 2007-11-22 Nippon Telegr & Teleph Corp <Ntt> サーバ・クライアント型音声認識方法、装置およびサーバ・クライアント型音声認識プログラム、記録媒体
JP2014505907A (ja) * 2011-02-14 2014-03-06 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
JP2022036998A (ja) * 2016-05-30 2022-03-08 ソニーグループ株式会社 映像音響処理装置および方法、並びにプログラム
US11902704B2 (en) 2016-05-30 2024-02-13 Sony Corporation Apparatus and method for video-audio processing, and program for separating an object sound corresponding to a selected video object

Also Published As

Publication number Publication date
JP4464484B2 (ja) 2010-05-19
EP1120775A1 (en) 2001-08-01
EP1120775A4 (en) 2001-09-26
WO2000077774A1 (fr) 2000-12-21
AU5103700A (en) 2001-01-02
CN1313983A (zh) 2001-09-19

Similar Documents

Publication Publication Date Title
EP0770987B1 (en) Method and apparatus for reproducing speech signals, method and apparatus for decoding the speech, method and apparatus for synthesizing the speech and portable radio terminal apparatus
JP4870313B2 (ja) 可変レート音声符号器におけるフレーム消去補償方法
JP5373217B2 (ja) 可変レートスピーチ符号化
JP5226777B2 (ja) 音声信号中に埋め込まれた隠れデータの回復
JP2000357000A (ja) 雑音信号符号化装置および音声信号符号化装置
JP2009069856A (ja) 音声コーデックにおける擬似高帯域信号の推定方法
JP4438127B2 (ja) 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
JP2003510644A (ja) スーパーフレーム構造のlpcハーモニックボコーダ
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
EP1204968B1 (en) Method and apparatus for subsampling phase spectrum information
JPH10149199A (ja) 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
JP2007279754A (ja) 音声符号化装置
JP2002509294A (ja) 暗騒音条件下における音声符号化の方法
JP3223966B2 (ja) 音声符号化/復号化装置
JP3670217B2 (ja) 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法
JP2001242896A (ja) 音声符号化/復号装置およびその方法
US20090018823A1 (en) Speech coding
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JP4373693B2 (ja) 音響信号の階層符号化方法および階層復号化方法
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体
JP3576485B2 (ja) 固定音源ベクトル生成装置及び音声符号化/復号化装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP4230550B2 (ja) 音声符号化方法及び装置、並びに音声復号化方法及び装置
JPH1049200A (ja) 音声情報圧縮蓄積方法及び装置
JP3896654B2 (ja) 音声信号区間検出方法及び装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060614

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100126

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100219

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4464484

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130226

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140226

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees