JP2001242899A - 音声符号化方法及び装置並びに及び音声復号方法及び装置 - Google Patents

音声符号化方法及び装置並びに及び音声復号方法及び装置

Info

Publication number
JP2001242899A
JP2001242899A JP2000054994A JP2000054994A JP2001242899A JP 2001242899 A JP2001242899 A JP 2001242899A JP 2000054994 A JP2000054994 A JP 2000054994A JP 2000054994 A JP2000054994 A JP 2000054994A JP 2001242899 A JP2001242899 A JP 2001242899A
Authority
JP
Japan
Prior art keywords
pitch
signal
speech
weighting
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000054994A
Other languages
English (en)
Other versions
JP3612260B2 (ja
Inventor
Katsumi Tsuchiya
勝美 土谷
Kimio Miseki
公生 三関
Ko Amada
皇 天田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2000054994A priority Critical patent/JP3612260B2/ja
Publication of JP2001242899A publication Critical patent/JP2001242899A/ja
Application granted granted Critical
Publication of JP3612260B2 publication Critical patent/JP3612260B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】本発明は符号化雑音の調和構造を入力音声の調
和構造に近づけることで復号音声の音質を向上させる音
声符号化及び復号方法を提供することを目的とする。 【解決手段】入力音声情報信号100とこの入力音声情
報信号に対応する合成音声情報信号107との差を表す
誤差信号102を生成し、周波数に従って前記誤差信号
に対するピッチ重み付けの度合いを変えて重み付け信号
119を生成し、この重み付け信号に基づきインデック
ス情報121を生成する。符号化音声情報からインデッ
クス情報を抽出し、このインデックス情報に基づき復号
音声信号を生成し、周波数に応じてピッチ強調の度合を
変化させて前記復号音声信号にピッチ強調処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電話帯域の音声、
広帯域音声及びオーディオ信号等の音声信号の圧縮符号
化方法及び装置並びに復号方法及び装置に関する。
【0002】
【従来の技術】低ビットレートでも比較的高音質の音声
を再生できる音声符号化方式として、CELP(Code E
xcited Linear Prediction)方式が知られている。CE
LP方式の詳細は例えばM.R.Schroeder and Ata1. ”Co
de-Exited Linear Prediction(CELP):high quq1ity spe
ech a very 1ow bit rates”、in Proc. ICASSP‘85. p
p.937-939,1985(文献1)に示されている。CELP方
式の構成を図15に示す。図15に示されるように、C
ELP方式では聴覚重みフィルタを用いて符号化による
音声に混入する雑音(符号化雑音)の評価を行い、符号
化雑音が現フレームの音声のスペクトルから決まる形状
のマスキング特性にマスクされる原理(同時マスキン
グ)を用いて雑音が聞こえにくくなるような音源の符号
を選択することを特徴としている。一般に、CELPに
用いる聴覚重みフィルタはホルマント重みフィルタとピ
ッチ重みフィルタの縦続接続で構成される。ホルマント
重みフィルタは入力音声のホルマントによるマスキング
特性を利用し、ピッチ重みフィルタは入力音声の調和構
造(ハーモニクス)によるマスキング特性を利用してい
る。聴覚重みフィルタの伝達関数w(z)は、ホルマン
ト重みフィルタの伝達関数Ws(z)及びピッチ重みフ
ィルタの伝達関数Wp(z)を用いて
【0003】
【数1】
【0004】と表される。ピッチ重みフィルタはピッチ
調和周波数成分に小さな重み、調和周波数間の成分に大
きな重みをそれぞれかけることにより、符号化雑音のス
ペクトルを入力音声と同じピッチの調和構造に整形する
働きをする。ここで、ピッチ重みフィルタの伝達関数W
p(z)はピッチ周期T0及びピッチ予測により求めら
れたピッチ予測係数βiを用いて
【0005】
【数2】
【0006】と表される。ただし、Mはピッチ予測次数
を制御する定数、γは雑音整形の度合を制御する定数で
ある。
【0007】このようにして求めたピッチ重みフィルタ
の周波数特性を図16に示す。図16において、ピッチ
重みフィルタの周波数特性はW(f)、音声の周波数特
性はS(f)で表される。この図からも分かるように、
ピッチ重みフィルタはピッチ調和周波数では谷の特性を
持ち、調和周波数間では山の特性を持つ。従って、符号
化雑音をピッチ重みフィルタで重み付けを行うことによ
り、音声のピッチ調和周波数では小さな重みを付け、逆
に調和周波数間では大きな重みを付けて評価することが
できる。
【0008】このようにフレーム内で周波数毎の相対的
な重み付けを用いて、音源の符号選択を行うことによ
り、符号化により生じる符号化雑音のスペクトルを図1
6のE(f)に示すように音声と同じピッチ周期の調和
構造にすることができる。こうすると、符号化雑音は音
声のスペクトルの凹凸にマスクされて聞こえにくいもの
となる。このようにピッチ重みフィルタは比較的簡単な
分析により得られ、かつ、主観的な符号化雑音を抑えた
音声符号化を行うことができるため、CELPで用いら
れてきた。
【0009】また、CELP方式では復号音声の主観品
質を向上させるために、音声を復号した後にポストフィ
ルタが用いられることが多い。一般に、CELPに用い
るポストフィルタはホルマント強調フィルタとピッチ強
調フィルタの縦続接続で構成される。ポストフィルタ伝
達関数Hpf(z)は、ホルマント強調フィルタの伝達
関数Hs(z)及びピッチ強調フィルタの伝達関数Hp
(z)を用いて
【0010】
【数3】
【0011】と表される。ここで、ピッチ強調フィルタ
の伝達関数Hp(z)はピッチ周期T0及びピッチ予測
係数λを用いて、
【0012】
【数4】
【0013】と表される。ただし、λはピッチ強調の度
合を制御する定数である。
【0014】
【発明が解決しようとする課題】しかし、実際の音声は
帯域によって調和構造の強さが異なっており、図17の
S(f)のように調和構造が弱い帯域が存在することも
ある。従来のピッチ重みフィルタを用いたピッチ重み付
けでは、図17のW(f)のように全帯域で整形の強さ
が同じであるピッチ重みフィルタを使用するためにE
(f)に示される符号化雑音の調和構造と入力音声の調
和構造とが異なり、復号音声の音質が劣化するという問
題があった。
【0015】また、ポストフィルタ処理におけるピッチ
強調においても同様で、式5に示す伝達関数のフィルタ
を用いた従来のピッチ強調では、全帯域でピッチ強調の
強さが同じであるためピッチ強調の不要な帯域に対して
もピッチ強調が行われ、復号音声の音質が劣化するとい
う問題があった。
【0016】本発明は、このような問題点を解消し、図
18に示すように、符号化雑音の調和構造を入力音声の
調和構造に近づけることで復号音声の音質を向上させる
音声符号化及び復号方法並びに音声符号化及び復号化装
置を提供することを目的とする。
【0017】
【課題を解決するための手段】第1の本発明は、入力音
声情報信号とこの入力音声情報信号に対応する合成音声
情報信号との差を表す誤差信号を生成し、周波数に従っ
て前記誤差信号に対するピッチ重み付けの度合いを変え
て重み付け信号を生成し、この重み付け信号に基づきイ
ンデックス情報を生成することを特徴とする音声符号化
方法を提供する。
【0018】このようにピッチ重み付けの度合を周波数
によって変化させることにより、各周波数に適したピッ
チ重み付けを行い、符号化雑音の調和構造を各周波数で
制御することが可能となり、復号音声の音質を向上させ
ることができる。
【0019】また、第2の発明は、第1の発明に係る音
声符号化方法おいて、入力音声の特性に従って各周波数
のピッチ重み付けの度合を変化させることを特徴とする
音声符号化方法を提供する。
【0020】このように、各周波数のピッチ重み付けの
度合を入力信号の特性に従って変化させることにより、
符号化雑音の調和構造を入力音声の調和構造に対応して
変化させることが可能となり、復号音声の音質を向上さ
せることができる。
【0021】また、第3の発明は、第2の発明に係る音
声符号化方法おいて、入力音声を分析して各周波数の有
声度を求め、有声度に従って各周波数のピッチ重み付け
の度合を変化させることを特徴とする音声符号化方法を
提供する。
【0022】このように、各周波数のピッチ重み付けの
度合を入力信号の各周波数の有声度に従って変化させる
ことにより、符号化雑音の調和構造を入力音声の調和構
造に対応して変化させることが可能となり、復号音声の
音質を向上させることができる。
【0023】また、第4の発明は、第3の発明に係るに
係る音声符号化方法において、有声度が高い周波数では
ピッチ重み付けの度合を強くし、有声度が低い周波数で
はピッチ重み付けの度合を弱くすることを特徴とする音
声符号化方法を提供する。
【0024】このような重み付けを行うことで、符号化
雑音の調和構造を入力音声の調和構造に近づけることが
でき、復号音声の音質を向上させることができる。
【0025】また、第5の発明は、入力音声情報信号と
この入力音声情報信号に対応する合成音声情報信号との
差を表す誤差信号を生成し、前記入力音声情報信号を少
なくとも2つの周波数帯域に分割し、該周波数帯域毎に
前記誤差信号に対するピッチ重み付けの度合いを変えて
重み付け信号を生成し、この重み付け信号に基づきイン
デックス情報を生成することを特徴とする音声符号化方
法を提供する。
【0026】このように、ピッチ重み付けの度合を帯域
毎に変化させることにより、各帯域に適したピッチ重み
付けを行うことができ、符号化雑音の調和構造を帯域毎
に制御し、復号音声の音質を向上させることができる。
【0027】また、第6の発明は、第5の発明に係る方
法おいて、入力音声を分析して各帯域の有声度を求め、
有声度に従って各帯域のピッチ重み付けの度合を変化さ
せることを特徴とする音声符号化方法を提供する。
【0028】このように、各帯域のピッチ重み付けの度
合を入力信号の各帯域の有声度に従って変化させること
により、符号化雑音の調和構造を入力音声の調和構造に
対応して変化させることができ、復号音声の音質を向上
させることができる。
【0029】また、第7の発明は、第6の発明に係る音
声符号化方法において、有声度が高い帯域ではピッチ重
み付けの度合を強くし、有声度が低い帯域ではピッチ重
み付けの度合を弱くすることを特徴とする音声符号化方
法を提供する。
【0030】このような重み付けを行うことで、符号化
雑音の調和構造を入力音声の調和構造に近づけることが
でき、復号音声の音質を向上させることができる。
【0031】また、第8の発明は、第5の発明に係る音
声符号化方法において、入力音声を分析して各帯域の有
声/無声判定を行い、有声と判定された帯域に対しては
ピッチ重み付けを行い、無声と判定された帯域に対して
はピッチ重み付けを行わないことを特徴とする音声符号
化方法を提供する。
【0032】このように、帯域によってピッチ重み付け
の度合を変化させることによって符号化雑音の調和構造
を入力音声の調和構造に近づけることができるようにな
り、復号音声の品質を向上させることができる。
【0033】ここで、ピッチ重み付けの度合とは、雑音
のピッチ整形の強さを指し、雑音のピッチ整形の強さ
は、例えば、ピッチ重みフィルタのフィルタ係数によっ
て制御することができる。
【0034】また、第9の発明は、符号化音声情報から
インデックス情報を抽出し、このインデックス情報に基
づき復号音声信号を生成し、周波数に応じてピッチ強調
の度合を変化させて前記復号音声信号にピッチ強調処理
を行うことを特徴とする音声復号方法を提供する。
【0035】このように、ポストフィルタのピッチ強調
の度合を周波数によって変化させることにより、各周波
数に適したピッチ強調を行うことができ、復号音声の品
質を向上させることができる。
【0036】また、第10の発明は、第9の発明に係る
音声復号方法において、復号音声の特性に従って各周波
数のピッチ強調の度合を変化させることを特徴とする音
声復号方法を提供する。
【0037】このように、復号音声の特性に従って各周
波数のピッチ強調の度合を変化させることで、復号音声
にあったピッチ強調を行うことができる。
【0038】また、第11の発明は、第10の発明に係
る音声復号方法において、復号音声の各周波数の有声度
に従って各周波数のピッチ強調の度合を変化させること
を特徴とする音声復号方法を提供する。
【0039】また、第12の発明は、第11の発明に係
る音声復号方法において、有声度が高い周波数ではピッ
チ強調の度合を強くし、有声度が低い周波数ではピッチ
強調の度合を弱くすることを特徴とする音声復号方法を
提供する。
【0040】また、第13の発明は、符号化音声情報か
らインデックス情報を抽出し、このインデックス情報に
基づき復号音声信号を生成し、前記復号音声信号を少な
くとも2つの周波数帯域に分割し、周波数帯域毎にピッ
チ強調の度合を変化させて前記復号音声信号にピッチ強
調処理を行うことを特徴とする音声復号方法を提供す
る。
【0041】また、第14の発明は、第13の発明に係
る音声復号方法において、復号音声の各帯域の有声度に
従って各帯域のピッチ強調の度合を変化させることを特
徴とする音声復号方法を提供する。
【0042】また、第15の発明は、第14の発明に係
る音声復号方法において、有声度が高い帯域ではピッチ
強調の度合を強くし、有声度が弱い帯域ではピッチ強調
の度合を弱くすることを特徴とする音声復号方法を提供
する。
【0043】また、第16の発明は、第13の発明に係
る音声復号方法において、復号音声の各帯域の有声/無
声判定を行い、有声と判定された帯域に対してはピッチ
強調を行い、無声と判定された帯域に対してはピッチ強
調を行わないことを特徴とする音声復号方法を提供す
る。
【0044】この第16の発明によれば、必要な帯域に
対してのみピッチ強調を行うことができるので、復号音
声の品質を向上させることができる。
【0045】ここで、ピッチ強調の度合とは、復号音声
のピッチ整形の強さを指し、ピッチ整形の強さは、例え
ば、ピッチ強調フィルタのフィルタ係数によって制御す
ることができる。
【0046】また、第17の発明は、入力音声情報信号
とこの入力音声情報信号に対応する合成音声情報信号と
の差を表す誤差信号を生成する合成フィルタ手段と、周
波数に従って前記誤差信号に対するピッチ重み付けの度
合いを変えて重み付け信号を生成する重み付けフィルタ
手段と、この重み付け信号に基づきインデックス情報を
生成するインデックス情報発生手段とにより構成される
ことを特徴とする音声符号化装置を提供する。
【0047】また、第18の発明は、入力音声情報信号
とこの入力音声情報信号に対応する合成音声情報信号と
の差を表す誤差信号を生成する合成フィルタ手段と、前
記入力音声情報信号を少なくとも2つの周波数帯域に分
割する帯域分割手段と、該周波数帯域毎に前記誤差信号
に対するピッチ重み付けの度合いを変えて重み付け信号
を生成する重み付けフィルタ手段と、この重み付け信号
に基づきインデックス情報を生成するインデックス情報
発生手段とにより構成されることを特徴とする音声符号
化装置を提供する。
【0048】また、第19の発明は、符号化音声情報か
らインデックス情報を抽出する分離手段と、このインデ
ックス情報に基づき復号音声信号を生成する合成フィル
タ手段と、周波数に応じてピッチ強調の度合を変化させ
て前記復号音声信号にピッチ強調処理を行うポストフィ
ルタ手段とで構成されることを特徴とする音声復号装置
を提供する。
【0049】また、第20の発明は、符号化音声情報か
らインデックス情報を抽出し、このインデックス情報に
基づき復号音声信号を生成する合成フィルタ手段と、前
記復号音声信号を少なくとも2つの周波数帯域に分割
し、周波数帯域毎にピッチ強調の度合を変化させて前記
復号音声信号にピッチ強調処理を行うポストフィルタ手
段とにより構成されることを特徴とする音声復号装置を
提供する。
【0050】
【発明の実施の形態】(第1の実施形態)本発明の音声
符号化法をCELP方式に適用した第1の実施形態につ
いて説明する。CELP方式の符号化は、音声のスペク
トル包絡情報の符号化と音源信号の符号化に大きく分け
ることができる。聴覚重みフィルタは音源信号の符号化
に用いる。CELP方式ではフレーム単位に音声の分析
・符号化を行う。方式によっては、フレームをさらに小
さなサブフレームに分割し、サブフレーム毎に音源信号
の符号化を行う方法もあるが、ここでは説明の簡単のた
めに音源信号の符号化もフレーム単位で行うことにす
る。
【0051】図1に、本実施形態に係る音声符号化方法
を適用した音声符号化システムの構成を示す。この音声
符号化システムによると、入力音声100の線形予測係
数101を計算する線形予測分析部10及び帯域分割部
の広域通過フィルタ20及び低域通過フィルタ21に入
力される。広域通過フィルタ20及び低域通過フィルタ
21の出力は各帯域のピッチ重みフィルタ係数112、
113を求めるピッチ重みフィルタ係数算出部22,2
3にそれぞれ接続される。 ピッチ重みフィルタ係数算
出部22,23の出力は聴覚重み付けフィルタ33のピ
ッチ重みフィルタ29,30にそれぞれ接続される。
【0052】線形予測分析部10の出力は線形予測係数
101を符号化する線形予測係数符号化部17及び入力
音声100と復号音声107の差信号108にホルマン
ト重み付けを行うホルマント重みフィルタ25に接続さ
れる。線形予測係数符号化部17の出力は駆動音源10
5から復号音声107を生成する合成フィルタ18及び
マルチプレクサ34に接続される。ホルマント重みフィ
ルタ25の出力は広域通過フィルタ26及び低域通過フ
ィルタ27を介してピッチ重みフィルタ29,30にそ
れぞれ接続される。帯域分割されたホルマント重み付き
の差信号115、116にピッチ重み付けを行うピッチ
重みフィルタ29,30の出力は加算器31に入力さ
れ、この加算器31の出力は歪み計算部32に接続され
る。この歪み計算部32の出力は音声のピッチ周期成分
を符号化するための適応符号帳11,音声のピッチ周期
以外の成分を符号化するための雑音符号帳12及び適応
符号帳11から出力された適応符号ベクトル102及び
雑音符号帳12から出力された雑音符号ベクトル103
のクインを符号化するためのゲイン符号帳13に接続さ
れると共にマルチプレクサ34に接続される。
【0053】適応符号帳11及び雑音符号帳12の出力
はゲイン符号帳13の出力と共にゲイン乗算器14,1
5にそれぞれ接続される。ゲイン乗算器14,15の出
力は加算器16に接続され、この加算器16の出力は線
形予測係数符号化部17の出力と共に合成フィルタ18
に接続される。この合成フィルタ18の出力は入力音声
と共に加算器19に入力される。加算器19の出力はホ
ルマント重みフィルタ25に接続される。
【0054】即ち、この実施形態では、図15に示す従
来の音声符号化システムに対して更に高域成分を求める
高域通過フィルタ20及び26、低域成分を求める低域
通過フィルタ21及び27が追加されている。この構成
において、帯域毎に算出されたピッチ重み係数112及
び113を用いてピッチ重み付けを行う点が大きく異
る。
【0055】この音声符号化システムでは、まず入力音
声100が5〜20ms程度の一定間隔のフレーム単位
に分割されて入力される。フレーム単位の入力音声は線
形予測分析部10に入力され、その周波数スペクトルの
包絡形状を表す線形予測係数101が計算される。線形
予測係数101は線形予測係数符号化部17で符号化さ
れた後、合成フィルタ18にフィルタ係数106として
与えられる。また、線形予測係数101はホルマント重
み付けを行うためにホルマント重みフィルタ25にも供
給される。
【0056】線形予測係数101の符号化の後、音源信
号の符号化が行われる。音源信号の符号化では、適応符
号帳11から選択された適応符号ベクトル102と雑音
符号帳12から選択された雑音符号ベクトル103の各
々にゲイン符号帳13から選択されたゲイン104が乗
じられて足し合わされることによって駆動音源105が
生成される。このようにして生成された駆動音源105
は、線形予測係数符号化部17の出力により特徴づけら
れた合成フィルタ18に入力され復号音声107が生成
される。
【0057】入力音声100と復号音声107の差信号
108が計算される。差信号108は、先ず、ホルマン
ト重みフィルタ25に入力され、ホルマント重み付けが
行われる。ホルマント重みフィルタ25は、線形予測分
析部10で求められた線形予測係数101から算出され
るホルマント重みフィルタ係数により特徴づけられる。
例えば、ホルマント重みフィルタの伝達関数Ws(z)
は、線形予測分析部10で求められたLPC係数から構
成される予測フィルタの伝達関数A(z)を用いて
【0058】
【数5】
【0059】と表される。定数γ1,γ2の値として
は、例えばr1=0.9、r2=0.4を用いることが
できる。なお、γ1,γ2はこの値に限定される必要は
なく、異なる値を用いても良い。
【0060】次に、ホルマント重み付けされた差信号1
14は高域通過フィルタ26及び低域通過フィルタ27
に入力され、2つの帯域に分割された後、各帯域のピッ
チ重みフィルタ24、30に入力される。一方、入力音
声100も高域通過フィルタ20及び低域通過フィルタ
21に入力され、2つの帯域に分割された後、各帯域成
分110、111はそれぞれピッチ重みフィルタ係数算
出部22、23に入力される。ピッチ重みフィルタ係数
算出部22、23では、入力された信号をピッチ予測し
て、ピッチ予測係数112、113が算出される。算出
されたピッチ予測係数112、113はピッチ重みフィ
ルタ24、30に供給される。
【0061】ピッチ重みフィルタでは、各帯域成分に対
してそれぞれ異るピッチ重み付けが行われる。ピッチ重
みフィルタはピッチ重みフィルタ係数算出部で求められ
たピッチ重みフィルタ係数によって特徴づけられる。例
えば、高域のピッチ重みフィルタの伝達関数WHp、及
び低域のピッチ重みフィルタの伝達関数WLpは、ピッ
チ周期及びピッチ予測係数βHi,βLiを用いて、
【0062】
【数6】
【0063】と表される。ただし、Mはピッチ予測次数
を制御する定数、γは雑音整形の度合を制御する定数で
ある。定数γH,γLの値としては、例えばγH=γL
0.4を用いることができる。なお、γH,γLは別々の
値を設定しても構わないし、γH,γLを各帯域のピッチ
強度SH,SLの関数として定義し、ピッチ強度を用いて
各帯域毎に制御することもできる。例えば、
【0064】
【数7】
【0065】と定義することができる。ただし、ζH
ζLは定数である。また、ピッチ強度S H,SLは予測係
数βHi,βLiを用いて
【0066】
【数8】
【0067】と定義することができる。ただし、ピッチ
強度SH,SLは上式に限定されず、信号のピッチ周期の
強さを示すパラメータであれば良い。
【0068】次に、ピッチ重み付けされた高域成分11
7及び低域成分118は加算部31で加算され、歪み計
算部32に入力される。歪み計算部32では、歪みが最
小となる適応符号ベクトル、雑音符号ベクトル及びゲイ
ンベクトルが選択され、これらのベクトルを表すインデ
ックスがマルチプレクサ34に入力される。また、マル
チプレクサ34には歪み計算部32から入力されるイン
デックスとともに、線形予測係数符号化部17からも線
形予測係数を符号化して得られるインデックスが入力さ
れる。マルチプレクサ34では、入力されたインデック
スから符号化ビットストリーム122が生成され、この
符号化ビットストリーム122が伝送路または蓄積媒体
を経て復号側に伝送される。
【0069】上述したように、本実施形態では帯域毎に
ピッチ重み付けの度合を制御できるので、入力音声が図
2のS(f)に示す周波数特性を持つ場合でも、低域で
はピッチ重み付けの度合を強くし、高域ではピッチ重み
付けの度合を弱くすることで、符号化雑音の周波数特性
を図2のE(f)のような形にすることができる。この
ように、符号化雑音の調和構造を入力音声の調和構造に
近づけることが可能となり、復号音声の音質を向上させ
ることができる。
【0070】(第2の実施形態)本発明の音声符号化法
をCELP方式に適用した第2の実施形態について説明
する。図3に本実施形態に係る音声符号化方法を適用し
た音声符号化システムの構成を示す。図3に示される本
実施形態の音声符号化システムは、図1に示した第1の
実施形態の音声符号化システムに有声/無声判定部4
0、41と切り替え部44、45が追加された構成とな
っている。図3において図1と同一の番号が付されてい
る部分は同じ動作をするものとして、ここでは本実施形
態の特徴的な部分を中心に説明する。
【0071】本実施形態では、高域と低域に分割された
入力音声は、それぞれ各帯域の有声/無声判定部40、
41とピッチ重みフィルタ係数算出部22、23に入力
され、有声/無声判定部40、41では入力された帯域
制限された信号110、111を分析して、その帯域の
信号が有声であるか無声であるかを判定する。有声/無
声の判定は、例えばIMBE(Improved Mu1ti=Band Ex
citation vocoder)で用いられているアルゴリズムを使
用することで実現できる。なお、IMBEの詳細は、例
えばD.W.Griffin and J.S.Lim ”Multiband Exctation
Vocoder”, IEEE Trans. Acoust., Speech, Signal Pro
cessing,vo1.ASSP-36, pp.1223-1235,Aug.1988(文献
2)に示されている。有声/無声の判定結果はピッチ重
みフィルタ係数算出部22、23と切り替え部44、4
5に送られる。
【0072】有声/無声の判定結果140、141が有
声の場合、ピッチ重みフィルタ係数算出部22、23で
は入力信号を分析して、ピッチ重みフィルタ係数11
2、113が算出され、ピッチ重みフィルタ係数がピッ
チ重みフィルタに入力される。逆に、有声/無声の判定
結果140、141が無声の場合、ピッチ重みフィルタ
係数算出部22、23ではピッチ重みフィルタ係数11
2、113の算出は行われない。
【0073】一方、切り替え部44、45では有声/無
声の判定結果142、143に従って、出力の切り替え
が行われる。有声/無声の判定結果が有声の場合、切り
替え部の出力はピッチ重みフィルタ24,30に入力さ
れる。逆に、有声/無声の判定結果が無声の場合、切り
替え部の出力はそのまま加算部46、47に入力され
る。このようにして各帯域でピッチ重み付けの有/無が
制御される。
【0074】ピッチ重み付けされた高域成分及び低域成
分は加算部31で加算され、歪み計算部32に入力され
る。歪み計算部32では、歪みが最小となる適応符号ベ
クトル、雑音符号ベクトル及びゲインベクトルが選択さ
れ、これらのベクトルを表すインデックスがマルチプレ
クサ34に入力される。
【0075】また、マルチプレクサ34には歪み計算部
32から入力されるインデックスとともに、線形予測係
数符号化部17からも線形予測係数を符号化して得られ
るインデックスが入力される。マルチプレクサ34で
は、入力されたインデックスから符号化ビットストリー
ム122が生成され、この符号化ビットストリーム12
2が伝送路または蓄積媒体を経て符号化側に伝送され
る。
【0076】上述したように、本実施形態では帯域毎に
ピッチ重み付けの有/無を制御できるので、入力音声が
図4のS(f)に示す周波数特性を持つ場合でも、低域
のみピッチ重み付けを行い、高域ではピッチ重み付けを
行わないようにすることで、符号化雑音の周波数特性を
図4のE(f)のような形にすることができる。このよ
うに、符号化雑音の調和構造を入力音声の調和構造に近
づけることが可能となり、復号音声の音質を向上させる
ことができる。
【0077】なお、本発明の第2の実施形態は帯域毎に
ピッチ重み付けの有/無の制御を行う部分が特徴的な部
分であり、帯域毎にピッチ重み付けの有/無の制御が行
えるような構成であれば良く、図3の構成に限定されな
い。例えば、図5に示すように、図3から切り替え部4
4、45を取り除いた構成で、ピッチ重みフィルタ係数
算出部22,23において、有声/無声判定結果に基づ
いてピッチ重みフィルタ係数を求めるように変更するこ
ともできる。
【0078】ここで、無声の場合はピッチ重み付けを行
わないピッチ重みフィルタ係数を出力するようにしてお
くことで、ピッチ重み付けの有/無の切り替えと同様の
操作を行うことができる。
【0079】(第3の実施形態)本発明の音声符号化法
をCELP方式に適用した第3の実施形態について説明
する。図6に本実施形態に係る音声符号化方法を適用し
た音声符号化システムの構成を示す。この音声符号化シ
ステムは、図15に示す従来のCELP方式と異なっ
て、聴覚重み付け部分にピッチ重み制御フィルタ60、
61、加算部62及び減算部63が追加された構成とな
っている。なお、ここでは本実施形態の特徴的な部分を
中心に説明する。
【0080】ホルマント重み付けされた差信号114は
ピッチ重みフィルタ50、ピッチ重み制御フィルタ61
及び減算部63に入力される。ピッチ重みフィルタ50
ではホルマント重み付けされた差信号114に対してピ
ッチ重み付けが行われ、処理された信号151がピッチ
重み制御フィルタ60に入力される。ピッチ重み制御フ
ィルタ60では入力された信号151をフィルタ処理し
た後、信号152として加算部62に供給する。
【0081】一方、減算部63では、ホルマント重み付
けされた差信号114とホルマント重み付けされた差信
号114をピッチ重み制御フィルタ61でフィルタ処理
した信号153の差信号154が求められ、この信号1
54が加算部62に入力される。加算部62では入力さ
れた2つの信号が加算され、加算された信号155が歪
み計算部32に入力される。歪み計算部32では、歪み
が最小となる適応符号ベクトル、雑音符号ベクトル及び
ゲインベクトルが選択され、これらのベクトルを表すイ
ンデックスがマルチプレクサ34に入力される。また、
マルチプレクサ34には歪み計算部32から入力される
インデックスとともに、線形予測係数符号化部17から
も線形予測係数を符号化して得られるインデックスが入
力される。マルチプレクサ34では、入力されたインデ
ックスから符号化ビットストリーム122が生成され、
この符号化ビットストリーム122が伝送路または蓄積
媒体を経て符号化側に伝送される。
【0082】第3の本実施形態では、ピッチ重み制御フ
ィルタ60、61は周波数に対してピッチの重み付けの
度合を滑らかに変化させる役割をしている。例えば、ピ
ッチ重みフィルタの周波数特性が図7のWp(f)で表
され、ピッチ重み制御フィルタの周波数特性が図8のH
(f)で表されるような低域通過特性となるとき、変形
ピッチ重み付けフィルタの周波数特性は図9のW(f)
のように周波数が高くなるに従ってピッチ重み付けの度
合が弱くなっている。このような重み付けを行った場
合、符号化により生じる符号化雑音のスペクトルは図9
のE(f)に示すように周波数が高くなるに従って調和
構造が弱くなる。また、ピッチ重みフィルタの周波数特
性が図7のWp(f)で表され、ピッチ制御フィルタの
周波数特性が図10のH(f)で表されるような特性と
なるとき、変形ピッチ重み付けフィルタの周波数特性は
図11のW(f)のように中域の周波数でピッチ重み付
けの度合が弱くなっている。このような重み付けを行っ
た場合、符号化により生じる符号化雑音のスペクトルは
図11のE(f)に示すように中域の周波数で調和構造
が弱くなる。
【0083】このように、ピッチ重み制御フィルタを用
いることで、変形ピッチ重み付けフィルタのピッチ重み
付けの度合を周波数で滑らかに変化させることができ
る。また、入力音声の特性に応じてピッチ重み制御フィ
ルタの特性を変化させることもできる。例えば、入力音
声を分析して周波数に対する調和構造の強さを求め、周
波数に対する調和構造の強さを基にピッチ重み制御フィ
ルタの特性を決定する。ピッチ制御フィルタの特性を調
和構造が弱い周波数を減衰させるような特性にすること
で、符号化雑音の調和構造を入力音声の調和構造に近づ
けることが可能となり、復号音声の音質を更に向上させ
ることができる。
【0084】(第4の実施形態)本発明の音声復号方法
をCELP方式に適用した実施形態を説明する。図12
には、第4の実施形態に係る音声復号方法を適用した音
声復号システムの構成が示されている。この音声復号シ
ステムでは、デマルチプレクサ70の出力が、適応符号
帳11、雑音符号帳12及びゲイン符号帳13並びに線
形予測係数復号部71に接続される。
【0085】適応符号帳11及び雑音符号帳12の出力
はゲイン符号帳13の出力と共にゲイン乗算部14、1
5にそれぞれ接続される。ゲイン乗算部14,15の出
力は加算部16に接続される。この加算部16の出力は
適合符号帳11に帰還され、更に線形予測係数復号部7
1の出力と共に合成フィルタ18に接続される。線形予
測係数復号部71の出力はポストフィルタ78に接続さ
れる。
【0086】ポストフィルタ78は、ホルマント強調フ
ィルタ72及び変形ピッチ強調フィルタ77から構成さ
れており、変形ピッチ強調フィルタ47はピッチ強調制
御フィルタ73、ピッチ強調フィルタ74、75及び加
算部76から構成されている。
【0087】この音声復号システムでは、先ず、伝送路
または蓄積媒体から得られたビットストリーム170が
デマルチプレクサ70に入力される。デマルチプレクサ
70では、入力されたビットストリーム170から線形
予測係数を表す線形予測係数インデックス171、適応
符号ベクトルを表す適応符号ベクトルインデックス17
2、雑音符号ベクトルを表す雑音符号ベクトルインデッ
クス173、及びゲインベクトルを表すインデックス1
74が分離生成される。これらのインデックスのうち、
線形予測係数インデックス171は線形予測係数復号部
71に、適応符号ベクトルインデックス172は適応符
号帳11に、雑音符号ベクトルインデックス173は雑
音符号帳12に、ゲインインデックス174はゲイン符
号帳13にそれぞれ入力される。
【0088】線形予測係数復号部71では、入力された
線形予測係数インデックス171から線形予測係数が復
号され、これが合成フィルタ18にフィルタ係数として
与えられる。また、適応符号ベクトルインデックス17
2に従って適応符号帳11から適応符号ベクトル102
が選択され出力される。また、雑音符号ベクトルインデ
ックス173に従って雑音符号帳12から雑音符号ベク
トル103が選択され出力される。
【0089】さらに、ゲインインデックス174に従っ
てゲイン符号帳13から適応符号ベクトル及び雑音符号
ベクトルに乗じるべきゲイン104が選択され出力され
る。このゲインが乗算部14、15で適応符号ベクトル
102及び雑音符号ベクトル103に乗じられた後、こ
れら2つのベクトルが加算部16で足し合わされること
によって復号残差波形信号105が生成され、この信号
が駆動音源信号として合成フィルタ18及び適応符号帳
11に入力される。
【0090】線形予測係数復号部71で復号された線形
予測係数により決定された合成フィルタ18が駆動音源
信号により駆動され、復号音声信号107が生成され
る。その後、復号音声107の主観品質を向上させるた
めに復号音声107に対してポストフィルタ処理が行わ
れる。従来のポストフィルタはホルマント強調フィルタ
とピッチ強調フィルタの従属接続で構成されているが、
本実施形態におけるポストフィルタ48はホルマント強
調フィルタ72と変形ピッチ強調フィルタ73の従属接
続で構成されている。変形ピッチ強調フィルタ73は図
12に示されるように、ピッチ強調の度合を周波数毎に
制御できるように、ピッチ強調フィルタ73、ピッチ強
調制御フィルタ74、75及び加算部76から構成され
ている。この場合、変形ピッチ強調フィルタ77の伝達
関数H’p(z)は、ピッチ強調フィルタ73の伝達関
数H’p(z)、ピッチ強調制御フィルタ74、75の
伝達関数H(z)を用いて、
【0091】
【数9】
【0092】と表される。なお、ホルマント強調フィル
タ72は公知の技術を用いて構成できる。
【0093】ここで、ピッチ強調フィルタ73の伝達関
数は式5で表され、その特性が図13であり、また、ピ
ッチ制御フィルタ74、75の特性が図8に示されるよ
うな低域通過の特性であるとき、変形ピッチ強調フィル
タ47の周波数特性は、図14のH’p(z)に示され
るような、高域ほど山谷の小さいものになる。このよう
な変形ピッチ強調フィルタを用いれば、低域で強く高域
で弱いピッチ強調を行うことができ、強いピッチ強調を
行っても高域のスペクトルが変形しにくくなり、高域の
品質の劣化を抑えたピッチ強調を行うことができる。
【0094】図12に戻りポストフィルタ78の動作を
説明する。合成フィルタ18から出力された復号音声1
07はホルマント強調フィルタ72に入力され、ホルマ
ント強調フィルタ72でホルマント強調された復号音声
175は加算部76、ピッチ強調制御フィルタ73及び
ピッチ強調フィルタ74に入力される。ピッチ強調フィ
ルタ73に入力されたホルマント強調され本復号音声1
75は、ピッチ強調フィルタ73でピシチ強調された
後、ピッチ強調制御フィルタ75で処理され加算部76
に入力される。
【0095】また、ピッチ強調制御フィルタ74に入力
されたホルマント強調された復号音声175はピッチ強
調制御フィルタ処理され、加算部76に入力される。加
算部76では供給された3つの信号175、176、1
78が加算され、その結果が最終的な復号音声179と
なって出力される。
【0096】上述したように、本実施形態におけるポス
トフィルタ78は、従来のポストフィルタにピッチ強調
制御フィルタ74を追加することでピッチ強調の度合を
周波数毎に制御できるようにしたものである。ピッチ強
調制御フィルタ74はその特性を変化させることでピッ
チ強調の度合を自由に変化させることができ、復号音声
の特性に従いピッチ強調制御フィルタの特性を変化させ
れば、復号音声の周波数にあった強さのピッチ強調を行
うことができ、復号音声の品質を更に向上させることが
できる。
【0097】なお、本発明の特徴的な部分はポストフィ
ルタのピッチ強調に関する部分であって、音声復号方式
はCELP方式に限定される必要はなく、他の復号方式
を用いても構わない。
【0098】また、ここで述べたピッチ強調方法を音声
符号化の駆動音源信号を生成する部分に適用することも
可能である。
【0099】以上、本発明の実施形態を幾つか説明した
が、本発明は上述した実施形態に限定される必要はな
く、種々変形して実施が可能である。
【0100】例えば、上述した第1の実施形態及び第2
の実施形態では簡単のため高域と低域の2つの帯域に分
割しているが、分割される帯域の数は2つに限定される
必要はなく、2つ以上であれば構わない。また、帯域分
割部は図1〜図5に示した構成に限定されない。帯域分
割する方法として、信号を一旦FFTして、FFT上で
周波数分割した後に逆FFTする方法や、QMFフィル
タを用いて帯域分割する方法などを用でも構わない。
【0101】さらに、本実施形態では入力音声と再生音
声の差信号に対して聴覚重み付けフィルタ処理を行い聴
覚重み付け歪みを求めているが、入力音声及び再生音声
それぞれに聴覚重み付けを行った後に差信号を求め、聴
覚重み付け歪みを求めるような構成に変形することも可
能である。
【0102】
【発明の効果】以上詳述したように、本発明によれば符
号化雑音の調和構造を入力音声に類似させることができ
るようにになり、再生音声の品質を向上させることがで
きる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における音声符号化方
法を用いた音声符号化システムの構成を示す図。
【図2】本発明の第1の実施形態における符号化雑音の
周波数特性を示す図。
【図3】本発明の第2の実施形態における音声符号化方
法を用いた音声符号化システムの構成を示す図。
【図4】本発明の第2の実施形態における符号化雑音の
周波数特性を示す図。
【図5】本発明の第2の実施形態における音声符号化方
法を用いた他の音声符号化システムの構成を示す図。
【図6】本発明の第3の実施形態における音声符号化方
法を用いた音声符号化システムの構成を示す図。
【図7】本発明の第3の実施形態におけるピッチ重みフ
ィルタの周波数特性を示す図。
【図8】本発明の第3の実施形態におけるピッチ重み制
御フィルタの周波数特性を示す図。
【図9】本発明の第3の実施形態における符号化雑音の
周波数特性を示す図。
【図10】本発明の第3の実施形態におけるピッチ重み
制御フィルタの周波数特性を示す図。
【図11】本発明の第3の実施形態における符号化雑音
の周波数特性を示す図。
【図12】本発明の第4の実施形態における音声復号方
法を用いた音声復号化システムの構成を示す図。
【図13】本発明の第4の実施形態におけるピッチ強調
フィルタの周波数特性を示す図。
【図14】本発明の第4の実施形態における変形ピッチ
強調フィルタの周波数特性を示す図。
【図15】従来の音声符号化の構成を示す図である。
【図16】従来の音声符号化における符号化雑音の周波
数特性を示す第1の図。
【図17】従来の音声符号化における符号化雑音の他の
周波数特性を示す図。
【図18】本発明の音声符号化における符号化雑音の周
波数時性を示す図。
【符号の説明】
10…線形予測分析部 11…適応符号帳 12…雑音符号帳 13…ゲイン符号帳 14、15…ゲイン乗算部 16…加算器 17…線形予測係数符号化部 18…合成フィルタ 19…加算器 20…広域通過フィルタ 21…低域通過フィルタ 22、23…ピッチ重みフィルタ係数算出部 24…帯域分割部 25…ホルマント重みフィルタ 26…広域通過フィルタ 27…低域通過フィルタ 28…帯域分割部 29、30…ピッチ重みフィルタ 31…加算器 32…歪み計算部 33…聴覚重み付けフィルタ 34…マルチプレクサ 40、41…有声/無声判定部 44,45…切り替え部 71…線形予測係数復号部 72…ホルマント強調フィルタ 73…ピッチ強調フィルタ 74…ピッチ強調制御フィルタ 75…ピッチ強調制御フィルタ 76…加算器 77…変形ピッチ強調フィルタ 78…ポストフィルタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 天田 皇 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 Fターム(参考) 5D045 CA01 5J064 AA01 BB03 BB12 BC02 BC12 BC14 BC25 BD01 9A001 BB06 EE04 HH15 HH18 JJ73

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 入力音声情報信号とこの入力音声情報信
    号に対応する合成音声情報信号との差を表す誤差信号を
    生成し、周波数に従って前記誤差信号に対するピッチ重
    み付けの度合いを変えて重み付け信号を生成し、この重
    み付け信号に基づきインデックス情報を生成することを
    特徴とする音声符号化方法。
  2. 【請求項2】 前記入力音声情報信号の特性に従って周
    波数毎に前記誤差信号に対するピッチ重み付けの度合を
    変化させることを特徴とする請求項1記載の音声符号化
    方法。
  3. 【請求項3】 前記入力音声情報信号を分析して各周波
    数の有声度を求め、前記有声度に従って周波数毎に前記
    誤差信号に対するピッチ重み付けの度合を変化させるこ
    とを特徴とする請求項2記載の音声符号化方法。
  4. 【請求項4】 前記有声度が高い周波数ではピッチ重み
    付けの度合を強くし、前記有声度が低い周波数ではピッ
    チ重み付けの度合を弱くすることを特徴とする請求項3
    記載の音声符号化方法。
  5. 【請求項5】 入力音声情報信号とこの入力音声情報信
    号に対応する合成音声情報信号との差を表す誤差信号を
    生成し、前記入力音声情報信号を少なくとも2つの周波
    数帯域に分割し、該周波数帯域毎に前記誤差信号に対す
    るピッチ重み付けの度合いを変えて重み付け信号を生成
    し、この重み付け信号に基づきインデックス情報を生成
    することを特徴とする音声符号化方法。
  6. 【請求項6】 前記入力音声情報信号を分析して各帯域
    の有声度を求め、前記有声度に従って帯域毎にピッチ重
    み付けの度合を変化させることを特徴とする請求項5記
    載の音声符号化方法。
  7. 【請求項7】 前記有声度が高い帯域ではピッチ重み付
    けの度合を強くし、前記有声度が低い帯域ではピッチ重
    み付けの度合を弱くすることを特徴とする請求項6記載
    の音声符号化方法。
  8. 【請求項8】 前記入力音声情報信号を分析して帯域毎
    に有声/無声を判定し、有声と判定された帯域に対して
    はピッチ重み付けを行い、無声と判定された帯域に対し
    てはピッチ重み付けを行わないことを特徴とする請求項
    5記載の音声符号化方法。
  9. 【請求項9】 符号化音声情報からインデックス情報を
    抽出し、このインデックス情報に基づき復号音声信号を
    生成し、周波数に応じてピッチ強調の度合を変化させて
    前記復号音声信号にピッチ強調処理を行うことを特徴と
    する音声復号方法。
  10. 【請求項10】 復号音声信号の特性に従って周波数毎
    にピッチ強調の度合を変化させることを特徴とする請求
    項9記載の音声復号方法。
  11. 【請求項11】 前記復号音声信号の各周波数の有声度
    に従って各周波数のピッチ強調の度合を変化させること
    を特徴とする請求項10記載の音声復号方法。
  12. 【請求項12】 前記有声度が高い周波数ではピッチ強
    調の度合を強くし、前記有声度が低い周波数ではピッチ
    強調の度合を弱くすることを特徴とする請求項11記載
    の音声復号方法。
  13. 【請求項13】 符号化音声情報からインデックス情報
    を抽出し、このインデックス情報に基づき復号音声信号
    を生成し、前記復号音声信号を少なくとも2つの周波数
    帯域に分割し、周波数帯域毎にピッチ強調の度合を変化
    させて前記復号音声信号にピッチ強調処理を行うことを
    特徴とする音声復号方法。
  14. 【請求項14】 前記復号音声の各帯域の有声度に従っ
    て各帯域のピッチ強調の度合を変化させることを特徴と
    する請求項13記載の音声復号方法。
  15. 【請求項15】 前記有声度が高い帯域ではピッチ強調
    の度合を強くし、前記有声度が低い帯域ではピッチ強調
    の度合を弱くすることを特徴とする請求項14記載の音
    声復号方法。
  16. 【請求項16】 前記復号音声信号の帯域毎に有声/無
    声の判定を行い、有声と判定された帯域に対してはピッ
    チ強調を行い、無声と判定された帯域に対してはピッチ
    強調を行わないことを特徴とする請求項13記載の音声
    復号方法。
  17. 【請求項17】 入力音声情報信号とこの入力音声情報
    信号に対応する合成音声情報信号との差を表す誤差信号
    を生成する合成フィルタ手段と、周波数に従って前記誤
    差信号に対するピッチ重み付けの度合いを変えて重み付
    け信号を生成する重み付けフィルタ手段と、この重み付
    け信号に基づきインデックス情報を生成するインデック
    ス情報発生手段とにより構成されることを特徴とする音
    声符号化装置。
  18. 【請求項18】 入力音声情報信号とこの入力音声情報
    信号に対応する合成音声情報信号との差を表す誤差信号
    を生成する合成フィルタ手段と、前記入力音声情報信号
    を少なくとも2つの周波数帯域に分割する帯域分割手段
    と、該周波数帯域毎に前記誤差信号に対するピッチ重み
    付けの度合いを変えて重み付け信号を生成する重み付け
    フィルタ手段と、この重み付け信号に基づきインデック
    ス情報を生成するインデックス情報発生手段とにより構
    成されることを特徴とする音声符号化装置。
  19. 【請求項19】 符号化音声情報からインデックス情報
    を抽出する分離手段と、このインデックス情報に基づき
    復号音声信号を生成する合成フィルタ手段と、周波数に
    応じてピッチ強調の度合を変化させて前記復号音声信号
    にピッチ強調処理を行うポストフィルタ手段とで構成さ
    れることを特徴とする音声復号装置。
  20. 【請求項20】 符号化音声情報からインデックス情報
    を抽出し、このインデックス情報に基づき復号音声信号
    を生成する合成フィルタ手段と、前記復号音声信号を少
    なくとも2つの周波数帯域に分割し、周波数帯域毎にピ
    ッチ強調の度合を変化させて前記復号音声信号にピッチ
    強調処理を行うポストフィルタ手段とにより構成される
    ことを特徴とする音声復号装置。
JP2000054994A 2000-02-29 2000-02-29 音声符号化方法及び装置並びに及び音声復号方法及び装置 Expired - Lifetime JP3612260B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000054994A JP3612260B2 (ja) 2000-02-29 2000-02-29 音声符号化方法及び装置並びに及び音声復号方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000054994A JP3612260B2 (ja) 2000-02-29 2000-02-29 音声符号化方法及び装置並びに及び音声復号方法及び装置

Publications (2)

Publication Number Publication Date
JP2001242899A true JP2001242899A (ja) 2001-09-07
JP3612260B2 JP3612260B2 (ja) 2005-01-19

Family

ID=18576182

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000054994A Expired - Lifetime JP3612260B2 (ja) 2000-02-29 2000-02-29 音声符号化方法及び装置並びに及び音声復号方法及び装置

Country Status (1)

Country Link
JP (1) JP3612260B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004097798A1 (ja) * 2003-05-01 2004-11-11 Fujitsu Limited 音声復号化装置、音声復号化方法、プログラム、記録媒体
JP2005157390A (ja) * 2003-11-26 2005-06-16 Samsung Electronics Co Ltd 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置
JP2005528647A (ja) * 2002-05-31 2005-09-22 ヴォイスエイジ・コーポレーション 合成発話の周波数選択的ピッチ強調方法およびデバイス
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法
CN1875401B (zh) * 2003-10-30 2011-01-12 摩托罗拉公司(在特拉华州注册的公司) 在数字语音编码器中执行谐波噪声加权的方法和装置
CN110390953A (zh) * 2019-07-25 2019-10-29 腾讯科技(深圳)有限公司 啸叫语音信号的检测方法、装置、终端及存储介质
CN112992165A (zh) * 2014-07-28 2021-06-18 日本电信电话株式会社 编码方法、装置、程序以及记录介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005528647A (ja) * 2002-05-31 2005-09-22 ヴォイスエイジ・コーポレーション 合成発話の周波数選択的ピッチ強調方法およびデバイス
WO2004097798A1 (ja) * 2003-05-01 2004-11-11 Fujitsu Limited 音声復号化装置、音声復号化方法、プログラム、記録媒体
US7606702B2 (en) 2003-05-01 2009-10-20 Fujitsu Limited Speech decoder, speech decoding method, program and storage media to improve voice clarity by emphasizing voice tract characteristics using estimated formants
CN1875401B (zh) * 2003-10-30 2011-01-12 摩托罗拉公司(在特拉华州注册的公司) 在数字语音编码器中执行谐波噪声加权的方法和装置
US7974840B2 (en) 2003-11-26 2011-07-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information
JP2005157390A (ja) * 2003-11-26 2005-06-16 Samsung Electronics Co Ltd 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法
CN101199005B (zh) * 2005-06-17 2011-11-09 松下电器产业株式会社 后置滤波器、解码装置以及后置滤波处理方法
JP4954069B2 (ja) * 2005-06-17 2012-06-13 パナソニック株式会社 ポストフィルタ、復号化装置及びポストフィルタ処理方法
US8315863B2 (en) 2005-06-17 2012-11-20 Panasonic Corporation Post filter, decoder, and post filtering method
CN112992165A (zh) * 2014-07-28 2021-06-18 日本电信电话株式会社 编码方法、装置、程序以及记录介质
CN110390953A (zh) * 2019-07-25 2019-10-29 腾讯科技(深圳)有限公司 啸叫语音信号的检测方法、装置、终端及存储介质
CN110390953B (zh) * 2019-07-25 2023-11-17 腾讯科技(深圳)有限公司 啸叫语音信号的检测方法、装置、终端及存储介质

Also Published As

Publication number Publication date
JP3612260B2 (ja) 2005-01-19

Similar Documents

Publication Publication Date Title
JP3653826B2 (ja) 音声復号化方法及び装置
JP3678519B2 (ja) オーディオ周波数信号の線形予測解析方法およびその応用を含むオーディオ周波数信号のコーディングならびにデコーディングの方法
JP2002023800A (ja) マルチモード音声符号化装置及び復号化装置
JP4040126B2 (ja) 音声復号化方法および装置
JP3612260B2 (ja) 音声符号化方法及び装置並びに及び音声復号方法及び装置
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JP2004151424A (ja) トランスコーダ及び符号変換方法
JP3598111B2 (ja) 広帯域音声復元装置
JP2010186190A (ja) 量子化lspパラメータ動的特徴抽出器及び量子化lspパラメータ動的特徴抽出方法
JP3770901B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP4447546B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3468862B2 (ja) 音声符号化装置
JP3748081B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3560964B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP3598112B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3773509B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法
JP3748080B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3636327B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3770899B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3770900B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005321828A (ja) 広帯域音声復元方法及び広帯域音声復元装置
JPH06195098A (ja) 音声符号化方法
JP2005092246A (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP2005284314A (ja) 広帯域音声復元方法及び広帯域音声復元装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041022

R151 Written notification of patent or utility model registration

Ref document number: 3612260

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081029

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091029

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101029

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111029

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111029

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121029

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 9

EXPY Cancellation because of completion of term