JPH05122164A - 音声符号化装置 - Google Patents
音声符号化装置Info
- Publication number
- JPH05122164A JPH05122164A JP3281339A JP28133991A JPH05122164A JP H05122164 A JPH05122164 A JP H05122164A JP 3281339 A JP3281339 A JP 3281339A JP 28133991 A JP28133991 A JP 28133991A JP H05122164 A JPH05122164 A JP H05122164A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- prediction
- tone signal
- burst
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Devices For Supply Of Signal Current (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
(57)【要約】
【目的】 線形予測を利用した符号化装置においてDT
MF信号等のバースト性のトーン信号を符号化するとき
に、符号化で得られる合成信号のバーストの終わりに直
後に生じる発振を防止する符号化装置を提供する。 【構成】 トーン信号を生成するトーン信号生成部12
と、雑音を発生する雑音発生部13と、トーン信号生成部
12及び雑音発生部13に接続されておりトーン信号と雑音
を加算して合成音を生成する加算部14と、加算部14で生
成された合成音を符号化する符号化部17とを備えてい
る。
MF信号等のバースト性のトーン信号を符号化するとき
に、符号化で得られる合成信号のバーストの終わりに直
後に生じる発振を防止する符号化装置を提供する。 【構成】 トーン信号を生成するトーン信号生成部12
と、雑音を発生する雑音発生部13と、トーン信号生成部
12及び雑音発生部13に接続されておりトーン信号と雑音
を加算して合成音を生成する加算部14と、加算部14で生
成された合成音を符号化する符号化部17とを備えてい
る。
Description
【0001】
【産業上の利用分野】本発明は、メロディ等の音声及び
それ以外の音を符号化する音声符号化装置に関する。
それ以外の音を符号化する音声符号化装置に関する。
【0002】
【従来技術】ディジタル電話に使われる音声符号化装置
に、線形予測を利用した低ビットレート(数キロ・ビッ
ト・パ−・セコンド(kbps))の符号化方法が採用され
ている。例えば、日本では、セルラ電話に6.7kbps のベ
クトル・サム・エキサイテッド・リニア・プレディクシ
ョン((Vector Sum Excited Linear Prediction)以下、
VSELPと称する)の採用が決定された。
に、線形予測を利用した低ビットレート(数キロ・ビッ
ト・パ−・セコンド(kbps))の符号化方法が採用され
ている。例えば、日本では、セルラ電話に6.7kbps のベ
クトル・サム・エキサイテッド・リニア・プレディクシ
ョン((Vector Sum Excited Linear Prediction)以下、
VSELPと称する)の採用が決定された。
【0003】上述の線形予測を利用した符号化方法は、
声帯で発生する気流に対応する励起信号を、声道での調
音に対応する全極型予測フィルタリングにより音声を生
成する音声生成モデルを利用したものであり、音声に含
まれる多くの冗長な情報の中から、励起信号、予測フィ
ルタの係数(以下、線形予測係数と称する)及び他の情
報を符号化することにより、低ビットレート化を図って
高品質な合成音声を維持している。この線形予測係数
は、線形予測分析により、ある一定区間(以下、フレー
ムと称する)毎に原音声信号から求められる。
声帯で発生する気流に対応する励起信号を、声道での調
音に対応する全極型予測フィルタリングにより音声を生
成する音声生成モデルを利用したものであり、音声に含
まれる多くの冗長な情報の中から、励起信号、予測フィ
ルタの係数(以下、線形予測係数と称する)及び他の情
報を符号化することにより、低ビットレート化を図って
高品質な合成音声を維持している。この線形予測係数
は、線形予測分析により、ある一定区間(以下、フレー
ムと称する)毎に原音声信号から求められる。
【0004】得られた線形予測係数は、他の表現方法
(偏自己相関関数、線ベクトル周波数、対数面積比)に
変換された後、スカラ−またはベクトル量子化されて符
号化される。
(偏自己相関関数、線ベクトル周波数、対数面積比)に
変換された後、スカラ−またはベクトル量子化されて符
号化される。
【0005】上記励起信号を用いて、例えば、コードブ
ックとしてあらかじめ励起信号の候補を複数有してお
り、その励起信号の候補を、フレームを更に分割したサ
ブフレーム毎に上記量子化された線形予測係数をサブフ
レーム単位で補間して求めた補間線形予測係数を有する
フィルタにかけて音声を合成し、合成音声が原音声(こ
の原音声をターゲット信号と呼ぶ。)に聴覚的に最も似
ている1つの励起信号候補を捜し出すためのベクトル量
子化及び符号化が行われる。
ックとしてあらかじめ励起信号の候補を複数有してお
り、その励起信号の候補を、フレームを更に分割したサ
ブフレーム毎に上記量子化された線形予測係数をサブフ
レーム単位で補間して求めた補間線形予測係数を有する
フィルタにかけて音声を合成し、合成音声が原音声(こ
の原音声をターゲット信号と呼ぶ。)に聴覚的に最も似
ている1つの励起信号候補を捜し出すためのベクトル量
子化及び符号化が行われる。
【0006】実際には、コードブックの中から、最適な
励起信号の候補を捜し出す処理(以下、コードブック・
サーチと称する)前には、前のサブフレームでの予測フ
ィルタの内部メモリの影響を除くため、予測フィルタの
ゼロ(0)入力応答信号を求める。
励起信号の候補を捜し出す処理(以下、コードブック・
サーチと称する)前には、前のサブフレームでの予測フ
ィルタの内部メモリの影響を除くため、予測フィルタの
ゼロ(0)入力応答信号を求める。
【0007】ここで、予測フィルタのゼロ(0)入力応
答信号とは、予測係数のみ現サブフレームで用いる係数
に更新した前サブフレームで用いた予測フィルタにゼロ
(0)を入力して得た予測フィルタの出力信号を言う。
答信号とは、予測係数のみ現サブフレームで用いる係数
に更新した前サブフレームで用いた予測フィルタにゼロ
(0)を入力して得た予測フィルタの出力信号を言う。
【0008】原音声信号からこのゼロ(0)入力応答信
号を引いた信号を新たなターゲット信号とし、一つの励
起信号候補から合成信号を求めるごとに最初に内部メモ
リをゼロ(0)にする(0状態応答)予測フィルタを使
う。
号を引いた信号を新たなターゲット信号とし、一つの励
起信号候補から合成信号を求めるごとに最初に内部メモ
リをゼロ(0)にする(0状態応答)予測フィルタを使
う。
【0009】
【発明が解決しようとする課題】一般にディジタル電話
では、音声符号化装置を用いてメロディー等のトーン信
号を再生する場合がある。例えば、保留時にメロディー
を流したり、2周波(デュアル・ト−ン・マルチ・フリ
クエンシ(Dual Tone Multi-Frequency )(以下、DT
MFと称する)信号が、ダイヤリングや各種電話サービ
スに使われる。電話のマイクから音声信号を得るときに
生じる息の音などの低域雑音を除去するために、音声符
号化装置内部の前段において、あらかじめ高域フィルタ
(以下、ハイパスフィルタと称する)を設ける場合があ
る。
では、音声符号化装置を用いてメロディー等のトーン信
号を再生する場合がある。例えば、保留時にメロディー
を流したり、2周波(デュアル・ト−ン・マルチ・フリ
クエンシ(Dual Tone Multi-Frequency )(以下、DT
MFと称する)信号が、ダイヤリングや各種電話サービ
スに使われる。電話のマイクから音声信号を得るときに
生じる息の音などの低域雑音を除去するために、音声符
号化装置内部の前段において、あらかじめ高域フィルタ
(以下、ハイパスフィルタと称する)を設ける場合があ
る。
【0010】しかしながら、上述した従来の音声符号化
装置では、バースト性のトーン信号を符号化するとき
に、バーストの終わり直後の無音区間で、ハイパスフィ
ルタ内部のメモリに残っている信号成分により、振幅は
急激に小さくなるが自己相関の高い信号がハイパスフィ
ルタから出力される。
装置では、バースト性のトーン信号を符号化するとき
に、バーストの終わり直後の無音区間で、ハイパスフィ
ルタ内部のメモリに残っている信号成分により、振幅は
急激に小さくなるが自己相関の高い信号がハイパスフィ
ルタから出力される。
【0011】従って、このバーストの終わり直後の無音
の符号化では、予測フィルタの予測利得が非常に大きく
なり、不安定な(即ち、発振しやすい)状態になる。他
方、予測フィルタの内部メモリには、振幅の大きい合成
されたトーン信号が残っており、入力の励起信号がどの
ような場合であっても、この内部メモリの信号により、
予測フィルタの出力が発振することがある。このため、
コードブック・サーチによりゼロ(0)入力応答で得た
ターゲット信号は、元の原信号(無音区間でのハイパス
フィルタ出力)とは全く異なる発振した信号となってし
まう。
の符号化では、予測フィルタの予測利得が非常に大きく
なり、不安定な(即ち、発振しやすい)状態になる。他
方、予測フィルタの内部メモリには、振幅の大きい合成
されたトーン信号が残っており、入力の励起信号がどの
ような場合であっても、この内部メモリの信号により、
予測フィルタの出力が発振することがある。このため、
コードブック・サーチによりゼロ(0)入力応答で得た
ターゲット信号は、元の原信号(無音区間でのハイパス
フィルタ出力)とは全く異なる発振した信号となってし
まう。
【0012】即ち、上述した従来の音声符号化装置で
は、得られるトーンの合成信号がバーストの終わり直後
で発振してしまい大きな歪みが生じて聴覚的にも不快に
聞こえるという問題点があった。
は、得られるトーンの合成信号がバーストの終わり直後
で発振してしまい大きな歪みが生じて聴覚的にも不快に
聞こえるという問題点があった。
【0013】本発明は、上述した従来の音声符号化装置
における問題点に鑑み、合成信号の品質の劣化を防止す
ることができる音声符号化装置を提供する。
における問題点に鑑み、合成信号の品質の劣化を防止す
ることができる音声符号化装置を提供する。
【0014】
【課題を解決するための手段】第1発明は、トーン信号
を生成するトーン信号生成手段と、雑音を発生する雑音
発生手段と、トーン信号生成手段及び雑音発生手段に接
続されておりトーン信号と雑音を加算して合成音を生成
する加算手段と、加算手段で生成された合成音を符号化
する符号化手段とを備えている音声符号化装置によって
達成される。
を生成するトーン信号生成手段と、雑音を発生する雑音
発生手段と、トーン信号生成手段及び雑音発生手段に接
続されておりトーン信号と雑音を加算して合成音を生成
する加算手段と、加算手段で生成された合成音を符号化
する符号化手段とを備えている音声符号化装置によって
達成される。
【0015】第2発明は、入力信号の所定区間を予測分
析して予測係数を出力する予測分析手段と、予測分析手
段で得られた予測に基づいて予測利得を算出する予測利
得算出手段と、予測分析手段で予測分析された入力信号
の所定区間のパワーを算出するパワー算出手段と、予測
利得算出手段で算出された予測利得を第1しきい値と比
較すると共にパワー算出手段で算出されたパワーを第2
しきい値と比較して各比較結果を判定する判定手段と、
各判定結果に基づいて特定の予測係数を用いて入力音声
の所定区間を符号化する励起信号符号化手段とを備えて
いる音声符号化装置によって達成される。
析して予測係数を出力する予測分析手段と、予測分析手
段で得られた予測に基づいて予測利得を算出する予測利
得算出手段と、予測分析手段で予測分析された入力信号
の所定区間のパワーを算出するパワー算出手段と、予測
利得算出手段で算出された予測利得を第1しきい値と比
較すると共にパワー算出手段で算出されたパワーを第2
しきい値と比較して各比較結果を判定する判定手段と、
各判定結果に基づいて特定の予測係数を用いて入力音声
の所定区間を符号化する励起信号符号化手段とを備えて
いる音声符号化装置によって達成される。
【0016】
【作用】第1発明の音声符号化装置では、トーン信号生
成手段はトーン信号を生成し、雑音発生手段は雑音を発
生し、加算手段はトーン信号生成手段及び雑音発生手段
に接続されておりトーン信号と雑音を加算して合成音を
生成し、符号化手段は加算手段で生成された合成音を符
号化する。
成手段はトーン信号を生成し、雑音発生手段は雑音を発
生し、加算手段はトーン信号生成手段及び雑音発生手段
に接続されておりトーン信号と雑音を加算して合成音を
生成し、符号化手段は加算手段で生成された合成音を符
号化する。
【0017】第2発明の音声符号化装置では、予測分析
手段は入力信号の所定区間を予測分析して予測係数を出
力し、予測利得算出手段は予測分析手段で得られた予測
に基づいて予測利得を算出し、パワー算出手段は予測分
析手段で予測分析された入力信号の所定区間のパワーを
算出し、判定手段は予測利得算出手段で算出された予測
利得を第1しきい値と比較すると共にパワー算出手段で
算出されたパワーを第2しきい値と比較して各比較結果
を判定し、励起信号符号化手段は各判定結果に基づいて
特定の予測係数を用いて入力音声の所定区間を符号化す
る。
手段は入力信号の所定区間を予測分析して予測係数を出
力し、予測利得算出手段は予測分析手段で得られた予測
に基づいて予測利得を算出し、パワー算出手段は予測分
析手段で予測分析された入力信号の所定区間のパワーを
算出し、判定手段は予測利得算出手段で算出された予測
利得を第1しきい値と比較すると共にパワー算出手段で
算出されたパワーを第2しきい値と比較して各比較結果
を判定し、励起信号符号化手段は各判定結果に基づいて
特定の予測係数を用いて入力音声の所定区間を符号化す
る。
【0018】
【実施例】以下、図面を参照して、本発明の音声符号化
装置の実施例を説明する。
装置の実施例を説明する。
【0019】図1は、第1発明の音声符号化装置の一実
施例の構成を示すブロック図である。
施例の構成を示すブロック図である。
【0020】図1の音声符号化装置は、ディジタル化さ
れた入力音声信号を入力する音声入力用端子11、DTM
F信号やメロディ等のトーン信号を生成させるトーン信
号生成部12、雑音を発生させる雑音発生部13、トーン信
号生成部12及び雑音発生部13に接続されておりトーン信
号と雑音を加算する加算器14、音声入力用端子11及び加
算器14に接続されており符号化する信号として音声信号
またはトーン信号のいずれかを選択するスイッチ15、ス
イッチ15に接続されており音声信号に含まれる息などの
数10ヘルツ(Hz)の低域雑音を除くための高域(ハイ
パス)フィルタ16、ハイパスフィルタ16に接続されてお
り音声信号またはトーン信号を符号化して出力する符号
化部17によって構成されている。
れた入力音声信号を入力する音声入力用端子11、DTM
F信号やメロディ等のトーン信号を生成させるトーン信
号生成部12、雑音を発生させる雑音発生部13、トーン信
号生成部12及び雑音発生部13に接続されておりトーン信
号と雑音を加算する加算器14、音声入力用端子11及び加
算器14に接続されており符号化する信号として音声信号
またはトーン信号のいずれかを選択するスイッチ15、ス
イッチ15に接続されており音声信号に含まれる息などの
数10ヘルツ(Hz)の低域雑音を除くための高域(ハイ
パス)フィルタ16、ハイパスフィルタ16に接続されてお
り音声信号またはトーン信号を符号化して出力する符号
化部17によって構成されている。
【0021】次に、上記各構成部分を詳述する。
【0022】音声入力用端子11は、マイク等から入力さ
れた音声信号がディジタル化された信号を入力し、トー
ン信号生成部12は、DTMF信号やメロディ等のトーン
信号を生成する。
れた音声信号がディジタル化された信号を入力し、トー
ン信号生成部12は、DTMF信号やメロディ等のトーン
信号を生成する。
【0023】雑音発生部13は、は自己相関の低い雑音
(例えば白色雑音)を発生する。発生される雑音の振幅
レベルは、トーン信号のレベルに比べ聴覚的にほとんど
知覚されない程度(信号対雑音(SN)比で40〜50デシ
ベル(dB))に調整される。また、加算器14は、トーン
信号と雑音とを加算して合成信号を生成する。
(例えば白色雑音)を発生する。発生される雑音の振幅
レベルは、トーン信号のレベルに比べ聴覚的にほとんど
知覚されない程度(信号対雑音(SN)比で40〜50デシ
ベル(dB))に調整される。また、加算器14は、トーン
信号と雑音とを加算して合成信号を生成する。
【0024】スイッチ15は、音声信号またはトーン信号
を符号化する信号として選択し、ハイパスフィルタ16
は、音声信号に含まれる息などの数10Hzの低域雑音を除
き、無限応答(IIR(Infinite impulse Response
))型のものである。ハイパスフィルタ16の内部には
過去のフィルタ出力及び入力データを格納するメモリが
存在する。
を符号化する信号として選択し、ハイパスフィルタ16
は、音声信号に含まれる息などの数10Hzの低域雑音を除
き、無限応答(IIR(Infinite impulse Response
))型のものである。ハイパスフィルタ16の内部には
過去のフィルタ出力及び入力データを格納するメモリが
存在する。
【0025】符号化部17は、VSELP等の線形予測を
用いた符号化方法により音声信号やトーン信号を符号化
してその符号化された符号データを出力する。
用いた符号化方法により音声信号やトーン信号を符号化
してその符号化された符号データを出力する。
【0026】図2は、本実施例の音声符号化装置におけ
る符号化部17の一構成例を示すブロック図である。
る符号化部17の一構成例を示すブロック図である。
【0027】図2の符号化部17は、入力信号を線形予測
分析して、線形予測係数を求め符号化する線形予測分析
部18、線形予測分析部18に接続されており線形予測分析
部18で得られた線形予測係数を有する予測フィルタを内
部に備えており最適な(予測フィルタ出力が聴覚的に符
号化部17の入力信号に最も近い)励起信号を符号化する
励起信号符号化部19、線形予測分析部18及び励起信号符
号化部19に接続されており線形予測分析部18及び励起信
号符号化部19からそれぞれ出力される符号をマルチプレ
クスするマルチプレクサ20によって構成されている。
分析して、線形予測係数を求め符号化する線形予測分析
部18、線形予測分析部18に接続されており線形予測分析
部18で得られた線形予測係数を有する予測フィルタを内
部に備えており最適な(予測フィルタ出力が聴覚的に符
号化部17の入力信号に最も近い)励起信号を符号化する
励起信号符号化部19、線形予測分析部18及び励起信号符
号化部19に接続されており線形予測分析部18及び励起信
号符号化部19からそれぞれ出力される符号をマルチプレ
クスするマルチプレクサ20によって構成されている。
【0028】次に、本実施例の音声符号化装置によりバ
ースト性のトーン信号を符号化するときに動作を図3の
フロ−チャ−トを参照して説明する。
ースト性のトーン信号を符号化するときに動作を図3の
フロ−チャ−トを参照して説明する。
【0029】まず、符号化する信号の種類がト−ン信号
かまたは音声信号かを判定し(ステップS1)、上記ス
テップS1で符号化する信号の種類がト−ン信号である
と判定された場合にはスイッチ15により加算器14側を選
択し、トーン信号生成部12で、図4(a)に示すような
バースト性のトーン信号を生成し(ステップS2)、加
算器14により、トーン信号生成部12で生成されたトーン
信号に、雑音発生部13により発生された図4(b)に示
すような雑音が加えられて、図4(c)に示すような合
成信号が出力される(ステップS3)。ここで、トーン
信号の方が雑音に比べてはるかにレベルが高いのでこの
雑音は無視できる。
かまたは音声信号かを判定し(ステップS1)、上記ス
テップS1で符号化する信号の種類がト−ン信号である
と判定された場合にはスイッチ15により加算器14側を選
択し、トーン信号生成部12で、図4(a)に示すような
バースト性のトーン信号を生成し(ステップS2)、加
算器14により、トーン信号生成部12で生成されたトーン
信号に、雑音発生部13により発生された図4(b)に示
すような雑音が加えられて、図4(c)に示すような合
成信号が出力される(ステップS3)。ここで、トーン
信号の方が雑音に比べてはるかにレベルが高いのでこの
雑音は無視できる。
【0030】加算器14から出力された合成信号は、ハイ
パスフィルタ26に入力されてフィルタリングされる(ス
テップS4)。通常のトーン信号の周波数は、数 100Hz
以上なので、ハイパスフィルタ16はトーン信号に対して
影響を与えない。
パスフィルタ26に入力されてフィルタリングされる(ス
テップS4)。通常のトーン信号の周波数は、数 100Hz
以上なので、ハイパスフィルタ16はトーン信号に対して
影響を与えない。
【0031】図4(d)に示すフィルタリングされたト
ーン信号は、符号化部17によりで符号化されて符号デー
タになる(ステップS5)。
ーン信号は、符号化部17によりで符号化されて符号デー
タになる(ステップS5)。
【0032】バーストが終わって無音区間に入ると、ト
ーン信号生成部12から信号は出力されない。しかし、雑
音発生部13からは雑音が出力され、加算器14を経て、ハ
イパスフィルタ16に入力される。この無音区間に入った
瞬間は、ハイパスフィルタ16の内部メモリには、トーン
信号成分が残っており、この内部メモリによりハイパス
フィルタ16は急速に振幅を下げながらトーン信号を出力
する。
ーン信号生成部12から信号は出力されない。しかし、雑
音発生部13からは雑音が出力され、加算器14を経て、ハ
イパスフィルタ16に入力される。この無音区間に入った
瞬間は、ハイパスフィルタ16の内部メモリには、トーン
信号成分が残っており、この内部メモリによりハイパス
フィルタ16は急速に振幅を下げながらトーン信号を出力
する。
【0033】上記の無音区間に雑音成分が無かったら、
振幅は小さいが自己相関の高い信号が出力されるので、
符号化部17で得られる線形予測係数を持った予測フィル
タの予測利得は非常に高くなり、不安定な(発振しやす
い)状態なので符号データを復号化して得られるトーン
信号のバーストの終わりには発振が見られる。
振幅は小さいが自己相関の高い信号が出力されるので、
符号化部17で得られる線形予測係数を持った予測フィル
タの予測利得は非常に高くなり、不安定な(発振しやす
い)状態なので符号データを復号化して得られるトーン
信号のバーストの終わりには発振が見られる。
【0034】しかし、本実施例の音声符号化装置では、
自己相関の低い無音区間には雑音が存在するので、ハイ
パスフィルタ16の内部メモリに残るトーン信号成分によ
るフィルタ出力は雑音成分の中にすぐに埋もれてしま
い、符号化部17での予測フィルタの予測利得はかなり小
さく、予測フィルタは安定な状態になるので符号データ
を復号化して得られるトーン信号のバーストの立ち下が
り部の発振を防止することができる。
自己相関の低い無音区間には雑音が存在するので、ハイ
パスフィルタ16の内部メモリに残るトーン信号成分によ
るフィルタ出力は雑音成分の中にすぐに埋もれてしま
い、符号化部17での予測フィルタの予測利得はかなり小
さく、予測フィルタは安定な状態になるので符号データ
を復号化して得られるトーン信号のバーストの立ち下が
り部の発振を防止することができる。
【0035】雑音発生部13は、トーン信号が出力されて
いる間は休止(雑音を出力しない)し、無音区間に入っ
たときにだけ稼動するように構成してもよい。
いる間は休止(雑音を出力しない)し、無音区間に入っ
たときにだけ稼動するように構成してもよい。
【0036】他方、上記ステップS1で符号化する信号
の種類が音声信号であると判定された場合にはスイッチ
15によりハイパスフィルタ16側を選択して(ステップS
6)、上述したステップS4及びステップS5により符
号化されて出力される。
の種類が音声信号であると判定された場合にはスイッチ
15によりハイパスフィルタ16側を選択して(ステップS
6)、上述したステップS4及びステップS5により符
号化されて出力される。
【0037】図5は、第2発明の音声符号化装置の主要
部である符号化部21の構成を示すブロック図である。
部である符号化部21の構成を示すブロック図である。
【0038】図5の符号化部21は、入力信号をある一定
の分析区間に分割し、この分析区間で予測分析である線
形予測分析を行なって、予測係数である線形予測係数を
求め符号化する予測分析手段である線形予測分析部22、
線形予測分析部22に接続されており線形予測分析部22で
求められた線形予測係数より予測利得を計算する予測利
得算出部である予測利得計算部23、分析区間のパワーを
求めるパワー算出部であるパワー計算部24、線形予測分
析部22、予測利得計算部23及びパワー計算部24に接続さ
れており分析区間が発振しやすい無音区間かどうかを判
定して判定結果に基づいて線形予測分析部22で求めた線
形予測係数を出力する判定手段である判定部25、判定部
25に接続されており最適な励起信号を求めて符号化する
励起信号符号化手段である励起信号符号化部26、判定部
25及び励起信号符号化部26に接続されており励起信号符
号化部26から出力される符号をマルチプレクスし符号デ
ータを出力するマルチプレクサ27によって構成されてい
る。
の分析区間に分割し、この分析区間で予測分析である線
形予測分析を行なって、予測係数である線形予測係数を
求め符号化する予測分析手段である線形予測分析部22、
線形予測分析部22に接続されており線形予測分析部22で
求められた線形予測係数より予測利得を計算する予測利
得算出部である予測利得計算部23、分析区間のパワーを
求めるパワー算出部であるパワー計算部24、線形予測分
析部22、予測利得計算部23及びパワー計算部24に接続さ
れており分析区間が発振しやすい無音区間かどうかを判
定して判定結果に基づいて線形予測分析部22で求めた線
形予測係数を出力する判定手段である判定部25、判定部
25に接続されており最適な励起信号を求めて符号化する
励起信号符号化手段である励起信号符号化部26、判定部
25及び励起信号符号化部26に接続されており励起信号符
号化部26から出力される符号をマルチプレクスし符号デ
ータを出力するマルチプレクサ27によって構成されてい
る。
【0039】次に、バースト性のトーン信号を符号化す
るときの本実施例の音声符号化装置の符号化部21の動作
を図6のフロ−チャ−トを参照して詳述する。
るときの本実施例の音声符号化装置の符号化部21の動作
を図6のフロ−チャ−トを参照して詳述する。
【0040】まず、一定の分析区間に分割された入力信
号を線形予測分析部22により線形予測分析して線形予測
係数を算出し(ステップT1)、線形予測分析部22で求
められた線形予測係数を用いて予測利得計算部23により
予測利得Gを算出し(ステップT2)、パワー計算部24
により分析区間のパワーPを算出し(ステップT3)、
予測利得計算部23で算出された予測利得Gとパワー計算
部13で算出されたパワーPに基づいて判定部25により分
析区間が発振しやすい無音区間か否かを判定し(ステッ
プT4)、発振しやすい無音区間でないと判定すると線
形予測分析部22で求めた線形予測係数を励起信号符号化
部26に送り、この線形予測係数の符号をマルチプレクサ
27に送り(ステップT5)、他方、発振しやすい無音区
間であると判定するとある定めた線形予測係数を励起信
号符号化部26に送り、この線形予測係数の符号をマルチ
プレクサ27に送り(ステップT6)、励起信号符号化部
26により最適な励起信号を符号化し(ステップT7)、
マルチプレクサ27により判定部25と励起信号符号化部26
から出力される符号をマルチプレクスして符号データを
出力する(ステップT8)。
号を線形予測分析部22により線形予測分析して線形予測
係数を算出し(ステップT1)、線形予測分析部22で求
められた線形予測係数を用いて予測利得計算部23により
予測利得Gを算出し(ステップT2)、パワー計算部24
により分析区間のパワーPを算出し(ステップT3)、
予測利得計算部23で算出された予測利得Gとパワー計算
部13で算出されたパワーPに基づいて判定部25により分
析区間が発振しやすい無音区間か否かを判定し(ステッ
プT4)、発振しやすい無音区間でないと判定すると線
形予測分析部22で求めた線形予測係数を励起信号符号化
部26に送り、この線形予測係数の符号をマルチプレクサ
27に送り(ステップT5)、他方、発振しやすい無音区
間であると判定するとある定めた線形予測係数を励起信
号符号化部26に送り、この線形予測係数の符号をマルチ
プレクサ27に送り(ステップT6)、励起信号符号化部
26により最適な励起信号を符号化し(ステップT7)、
マルチプレクサ27により判定部25と励起信号符号化部26
から出力される符号をマルチプレクスして符号データを
出力する(ステップT8)。
【0041】以下、上記各ステップを詳述する。
【0042】線形予測分析部22により、符号化部21の入
力信号をある一定の分析区間に分割し、この分析区間で
線形予測分析して線形予測係数を求め符号化する。
力信号をある一定の分析区間に分割し、この分析区間で
線形予測分析して線形予測係数を求め符号化する。
【0043】予測利得計算部23により、線形予測分析部
22で求められた線形予測係数より、予測利得Gを計算す
る。予測利得Gの計算方法としては、線形予測係数をパ
−コ−ル(PARCOR(Partial Correlation ))係
数ki (iは次数を表す)に変換して次式より求める。
22で求められた線形予測係数より、予測利得Gを計算す
る。予測利得Gの計算方法としては、線形予測係数をパ
−コ−ル(PARCOR(Partial Correlation ))係
数ki (iは次数を表す)に変換して次式より求める。
【0044】
【数1】
【0045】パワー計算部24により、分析区間のパワー
Pを計算し、判定部25は、予測利得計算部23で算出され
た予測利得Gとパワー計算部13で算出されたパワーPに
より分析区間が発振しやすい無音区間か否かを判定し、
発振しやすい無音区間でないと判定すると線形予測分析
部22で求めた線形予測係数を励起信号符号化部26に送
り、発振しやすい無音区間であると判定すると、ある定
めた線形予測係数を励起信号符号化部26に送る。また、
線形予測係数に対応する符号も出力する。
Pを計算し、判定部25は、予測利得計算部23で算出され
た予測利得Gとパワー計算部13で算出されたパワーPに
より分析区間が発振しやすい無音区間か否かを判定し、
発振しやすい無音区間でないと判定すると線形予測分析
部22で求めた線形予測係数を励起信号符号化部26に送
り、発振しやすい無音区間であると判定すると、ある定
めた線形予測係数を励起信号符号化部26に送る。また、
線形予測係数に対応する符号も出力する。
【0046】励起信号符号化部26により、判定部25より
送られてきた線形予測係数を有する予測フィルタを内部
に備えており、最適な(予測フィルタ出力が聴覚的に符
号化部21の入力信号に最も近い)励起信号を符号化す
る。
送られてきた線形予測係数を有する予測フィルタを内部
に備えており、最適な(予測フィルタ出力が聴覚的に符
号化部21の入力信号に最も近い)励起信号を符号化す
る。
【0047】マルチプレクサ27により、判定部25と励起
信号符号化部26から出力される符号をマルチプレクスし
て符号データを出力する。
信号符号化部26から出力される符号をマルチプレクスし
て符号データを出力する。
【0048】次に、上記判定部25の動作を詳述する。
【0049】判定部25は、2つのしきい値を有してい
る。1つのしきい値は第1しきい値である予測利得しき
い値SG であり、予測利得しきい値SG は、符号化部21
に入力されるトーン信号のバースト直後ではない通常の
無音区間の符号化部21までに加わった雑音等の信号の予
測利得から求めた値であり、予測利得しきい値SG より
実際の分析区間の予測利得Gが大きい場合には、励起信
号符号化部26の予測フィルタが発振する恐れがあると判
定する。
る。1つのしきい値は第1しきい値である予測利得しき
い値SG であり、予測利得しきい値SG は、符号化部21
に入力されるトーン信号のバースト直後ではない通常の
無音区間の符号化部21までに加わった雑音等の信号の予
測利得から求めた値であり、予測利得しきい値SG より
実際の分析区間の予測利得Gが大きい場合には、励起信
号符号化部26の予測フィルタが発振する恐れがあると判
定する。
【0050】他のしきい値は、第2しきい値であるパワ
ーしきい値SP であり、通常の無音区間の信号のパワー
から求めた値であり、パワーしきい値SP より実際の分
析区間のパワーPが小さい場合に分析区間が無音である
と判定する。
ーしきい値SP であり、通常の無音区間の信号のパワー
から求めた値であり、パワーしきい値SP より実際の分
析区間のパワーPが小さい場合に分析区間が無音である
と判定する。
【0051】従って、分析区間が発振しやすい無音区間
かどうかを判定する方法は、パワーP<パワーしきい値
SP かつ予測利得G>予測利得しきい値SG のとき分析
区間が発振しやすい無音区間であると判定し、これ以外
のときは分析区間が発振しやすい無音区間でないと判定
する。
かどうかを判定する方法は、パワーP<パワーしきい値
SP かつ予測利得G>予測利得しきい値SG のとき分析
区間が発振しやすい無音区間であると判定し、これ以外
のときは分析区間が発振しやすい無音区間でないと判定
する。
【0052】また、分析区間が発振しやすい無音区間で
あると判定したときに励起信号符号化部26に送る線形予
測係数としては、無音区間の符号化であることを考慮す
れば(無音とみなせるぐらいレベルが小さいので、原信
号と比べて合成したときの信号が大きく違っても聴覚的
には何も知覚されない)、予測フィルタが発振しなけれ
ばよく、一例として、符号化したときに最も予測利得が
小さくなるような線形予測係数に設定する。
あると判定したときに励起信号符号化部26に送る線形予
測係数としては、無音区間の符号化であることを考慮す
れば(無音とみなせるぐらいレベルが小さいので、原信
号と比べて合成したときの信号が大きく違っても聴覚的
には何も知覚されない)、予測フィルタが発振しなけれ
ばよく、一例として、符号化したときに最も予測利得が
小さくなるような線形予測係数に設定する。
【0053】図7は、図5の符号化部21を含む音声符号
化装置の一実施例の構成を示すブロック図である。
化装置の一実施例の構成を示すブロック図である。
【0054】図7の音声符号化装置は、マイク等から入
力された音声信号がディジタル化された信号を入力する
端子である音声入力用端子28、DTMF信号やメロディ
等のトーン信号を生成させるためのトーン信号生成部2
9、音声入力用端子28及びトーン信号生成部29に接続さ
れており符号化する信号として音声信号またはトーン信
号を選択するスイッチ30、スイッチ30に接続されており
音声信号に含まれる息などの低域雑音を除くためのハイ
パスフィルタ31、ハイパスフィルタ31に接続されている
上述した符号化部21によって構成されている。
力された音声信号がディジタル化された信号を入力する
端子である音声入力用端子28、DTMF信号やメロディ
等のトーン信号を生成させるためのトーン信号生成部2
9、音声入力用端子28及びトーン信号生成部29に接続さ
れており符号化する信号として音声信号またはトーン信
号を選択するスイッチ30、スイッチ30に接続されており
音声信号に含まれる息などの低域雑音を除くためのハイ
パスフィルタ31、ハイパスフィルタ31に接続されている
上述した符号化部21によって構成されている。
【0055】以下、上記各構成部分を説明する。
【0056】音声入力用端子28は、マイク等から入力さ
れた音声信号がディジタル化された信号を入力し、トー
ン信号生成部29は、DTMF信号やメロディ等のトーン
信号を生成する。
れた音声信号がディジタル化された信号を入力し、トー
ン信号生成部29は、DTMF信号やメロディ等のトーン
信号を生成する。
【0057】スイッチ30は、符号化する信号として音声
信号またはトーン信号を選択し、ハイパスフィルタ31
は、音声信号に含まれる息などの数10Hzの低域雑音を除
く無限応答(IIR(Infinite impulse Response ))
型のものであり、ハイパスフィルタ31の内部には過去の
フィルタ出力と入力データを格納する内部メモリ(図示
省略)が存在する。
信号またはトーン信号を選択し、ハイパスフィルタ31
は、音声信号に含まれる息などの数10Hzの低域雑音を除
く無限応答(IIR(Infinite impulse Response ))
型のものであり、ハイパスフィルタ31の内部には過去の
フィルタ出力と入力データを格納する内部メモリ(図示
省略)が存在する。
【0058】符号化部21は、上述したように音声信号ま
たはトーン信号を符号化してその符号化データを出力す
る。
たはトーン信号を符号化してその符号化データを出力す
る。
【0059】次に、本実施例の音声符号化装置の動作、
特にバースト性のトーン信号を本実施例の音声符号化装
置で符号化するときの動作を説明する。
特にバースト性のトーン信号を本実施例の音声符号化装
置で符号化するときの動作を説明する。
【0060】まず、スイッチ30は、トーン信号生成部29
側が選択される。
側が選択される。
【0061】トーン信号生成部29によりバースト性のト
ーン信号が生成され、ハイパスフィルタ31に入力され
る。通常のトーン信号の周波数は数100Hz以上であるの
で、このハイパスフィルタ31は、トーン信号に対しては
影響を与えない。そして、このトーン信号は、符号化部
21で符号化されて符号データになる。
ーン信号が生成され、ハイパスフィルタ31に入力され
る。通常のトーン信号の周波数は数100Hz以上であるの
で、このハイパスフィルタ31は、トーン信号に対しては
影響を与えない。そして、このトーン信号は、符号化部
21で符号化されて符号データになる。
【0062】バーストが終わって無音区間に入ると、ト
ーン信号生成部29からは信号は出力されない。この無音
区間に入った瞬間は、ハイパスフィルタ31の内部メモリ
には、トーン信号成分が残っており、この内部メモリに
よりハイパスフィルタ31は、急速に振幅を下げながら信
号を出力する。この信号は振幅は小さいが自己相関の高
い信号で、符号化部21の線形予測分析部22で得られる線
形予測係数の予測利得は非常に高くなるが、パワーが小
さいので判定部25により発振しやすい無音区間と判定さ
れるので、励起信号符号化部26で使われる線形予測係数
は安定したものが使われ、符号データを復合化して得ら
れるトーン信号のバーストの立ち下がり部の発振を防止
できる。
ーン信号生成部29からは信号は出力されない。この無音
区間に入った瞬間は、ハイパスフィルタ31の内部メモリ
には、トーン信号成分が残っており、この内部メモリに
よりハイパスフィルタ31は、急速に振幅を下げながら信
号を出力する。この信号は振幅は小さいが自己相関の高
い信号で、符号化部21の線形予測分析部22で得られる線
形予測係数の予測利得は非常に高くなるが、パワーが小
さいので判定部25により発振しやすい無音区間と判定さ
れるので、励起信号符号化部26で使われる線形予測係数
は安定したものが使われ、符号データを復合化して得ら
れるトーン信号のバーストの立ち下がり部の発振を防止
できる。
【0063】
【発明の効果】第1発明の音声符号化装置では、トーン
信号を生成するトーン信号生成手段と、雑音を発生する
雑音発生手段と、トーン信号生成手段及び雑音発生手段
に接続されておりトーン信号と雑音を加算して合成音を
生成する加算手段と、加算手段で生成された合成音を符
号化する符号化手段とを備えているので、バースト性の
トーン信号を符号化したときに、バーストの終わり直後
の無音区間での相関の高い信号を雑音が隠すので、符号
化により得られる合成信号のバースト直後での発振を防
ぐことができる。
信号を生成するトーン信号生成手段と、雑音を発生する
雑音発生手段と、トーン信号生成手段及び雑音発生手段
に接続されておりトーン信号と雑音を加算して合成音を
生成する加算手段と、加算手段で生成された合成音を符
号化する符号化手段とを備えているので、バースト性の
トーン信号を符号化したときに、バーストの終わり直後
の無音区間での相関の高い信号を雑音が隠すので、符号
化により得られる合成信号のバースト直後での発振を防
ぐことができる。
【0064】第2発明の音声符号化装置では、入力信号
の所定区間を予測分析して予測係数を出力する予測分析
手段と、予測分析手段で得られた予測に基づいて予測利
得を算出する予測利得算出手段と、予測分析手段で予測
分析された入力信号の所定区間のパワーを算出するパワ
ー算出手段と、予測利得算出手段で算出された予測利得
を第1しきい値と比較すると共にパワー算出手段で算出
されたパワーを第2しきい値と比較して各比較結果を判
定する判定手段と、各判定結果に基づいて特定の予測係
数を用いて入力音声の所定区間を符号化する励起信号符
号化手段とを備えているので、バースト性のトーン信号
を符号化したときに、バーストの終わり直後の無音区間
での振幅は小さいが相関の高い信号を符号化するとき
に、予測利得の小さい線形予測係数が使われて符号化に
より得られる合成信号のバーストの立ち下がり部での発
振を防ぐことができる。
の所定区間を予測分析して予測係数を出力する予測分析
手段と、予測分析手段で得られた予測に基づいて予測利
得を算出する予測利得算出手段と、予測分析手段で予測
分析された入力信号の所定区間のパワーを算出するパワ
ー算出手段と、予測利得算出手段で算出された予測利得
を第1しきい値と比較すると共にパワー算出手段で算出
されたパワーを第2しきい値と比較して各比較結果を判
定する判定手段と、各判定結果に基づいて特定の予測係
数を用いて入力音声の所定区間を符号化する励起信号符
号化手段とを備えているので、バースト性のトーン信号
を符号化したときに、バーストの終わり直後の無音区間
での振幅は小さいが相関の高い信号を符号化するとき
に、予測利得の小さい線形予測係数が使われて符号化に
より得られる合成信号のバーストの立ち下がり部での発
振を防ぐことができる。
【図1】第1発明の音声符号化装置の一実施例の構成を
示すブロック図である。
示すブロック図である。
【図2】図1の音声符号化装置の符号化部の一構成例を
示すブロック図である。
示すブロック図である。
【図3】図1の音声符号化装置によりバースト性のトー
ン信号を符号化するときの動作を説明するためのフロ−
チャ−トである。
ン信号を符号化するときの動作を説明するためのフロ−
チャ−トである。
【図4】図1の各構成部分における信号の説明図であ
る。
る。
【図5】第2発明の音声符号化装置の主要部である符号
化部の一実施例の構成を示すブロック図である。
化部の一実施例の構成を示すブロック図である。
【図6】図5の符号化部によりバースト性のトーン信号
を符号化するときの動作を説明するためのフロ−チャ−
トである。
を符号化するときの動作を説明するためのフロ−チャ−
トである。
【図7】図5の符号化部を含む音声符号化装置の一実施
例の構成を示すブロック図である。
例の構成を示すブロック図である。
11 音声入力用端子 12 トーン信号生成部 13 雑音発生部 14 加算器 15 スイッチ 16 ハイパスフィルタ 17 符号化部
Claims (2)
- 【請求項1】 トーン信号を生成するトーン信号生成手
段と、雑音を発生する雑音発生手段と、前記トーン信号
生成手段及び前記雑音発生手段に接続されており前記ト
ーン信号と前記雑音を加算して合成音を生成する加算手
段と、前記加算手段で生成された前記合成音を符号化す
る符号化手段とを備えていることを特徴とする音声符号
化装置。 - 【請求項2】 入力信号の所定区間を予測分析して予測
係数を出力する予測分析手段と、前記予測分析手段で得
られた予測に基づいて予測利得を算出する予測利得算出
手段と、前記予測分析手段で予測分析された前記入力信
号の所定区間のパワーを算出するパワー算出手段と、前
記予測利得算出手段で算出された前記予測利得を第1し
きい値と比較すると共に前記パワー算出手段で算出され
た前記パワーを第2しきい値と比較して該各比較結果を
判定する判定手段と、前記各判定結果に基づいて特定の
予測係数を用いて前記入力音声の所定区間を符号化する
励起信号符号化手段とを備えていることを特徴とする音
声符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3281339A JPH05122164A (ja) | 1991-10-28 | 1991-10-28 | 音声符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3281339A JPH05122164A (ja) | 1991-10-28 | 1991-10-28 | 音声符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05122164A true JPH05122164A (ja) | 1993-05-18 |
Family
ID=17637732
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3281339A Pending JPH05122164A (ja) | 1991-10-28 | 1991-10-28 | 音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05122164A (ja) |
-
1991
- 1991-10-28 JP JP3281339A patent/JPH05122164A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5873059A (en) | Method and apparatus for decoding and changing the pitch of an encoded speech signal | |
EP0714089B1 (en) | Code-excited linear predictive coder and decoder, and method thereof | |
EP0763818B1 (en) | Formant emphasis method and formant emphasis filter device | |
JP2002533772A (ja) | 可変レートスピーチコーディング | |
JP4438127B2 (ja) | 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体 | |
JPH0962299A (ja) | コード励振線形予測符号化装置 | |
JPH1145100A (ja) | フィルタリング方法と低ビット速度音声通信システム | |
JP4464707B2 (ja) | 通信装置 | |
JP2003223189A (ja) | 音声符号変換方法及び装置 | |
US20040128126A1 (en) | Preprocessing of digital audio data for mobile audio codecs | |
JP2903533B2 (ja) | 音声符号化方式 | |
US6424942B1 (en) | Methods and arrangements in a telecommunications system | |
JP4558734B2 (ja) | 信号復号化装置 | |
EP1076895B1 (en) | A system and method to improve the quality of coded speech coexisting with background noise | |
JP3064947B2 (ja) | 音声・楽音符号化及び復号化装置 | |
EP0856185A1 (en) | Repetitive sound compression system | |
KR100498177B1 (ko) | 신호양자화기 | |
JP3451998B2 (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
JP3050978B2 (ja) | 音声符号化方法 | |
JP4373693B2 (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
JPH05122164A (ja) | 音声符号化装置 | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JPH06202698A (ja) | 適応ポストフィルタ | |
JP2001083996A (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 |