JP3566220B2

JP3566220B2 - 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法

Info

Publication number: JP3566220B2
Application number: JP2001067631A
Authority: JP
Inventors: 正山浦; 裕久田崎
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2001-03-09
Filing date: 2001-03-09
Publication date: 2004-09-15
Anticipated expiration: 2021-03-09
Also published as: CN1375818A; EP1239464A2; JP2002268690A; CN1172294C; EP1239464A3; DE60201766T2; US20020128829A1; TW550541B; DE60201766D1; EP1239464B1; IL148413A0; US7006966B2

Description

【０００１】
【発明の属する技術分野】
この発明は、ディジタル音声信号を少ない情報量に圧縮する音声符号化装置及び音声符号化方法に関し、また、上記音声符号化装置により生成された音声符号を復号化してディジタル音声信号を生成する音声復号化装置及び音声復号化方法に関するものである。
【０００２】
【従来の技術】
従来の多くの音声符号化方法及び音声復号化方法では、入力音声をスペクトル包絡情報と音源情報に分けて、所定長区間のフレーム単位で各々を符号化して音声符号を生成し、この音声符号を復号化して、合成フィルタによってスペクトル包絡情報と音源情報を合わせることで復号音声を得る構成をとっている。最も代表的な音声符号化方法及び音声復号化方法を適用した音声符号化装置及び音声復号化装置としては、符号駆動線形予測符号化（Ｃｏｄｅ−ＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ：ＣＥＬＰ）方式を用いたものがある。
【０００３】
図１３は従来のＣＥＬＰ系の音声符号化装置を示す構成図であり、図において、１は入力音声を分析して、その入力音声のスペクトル包絡情報である線形予測係数を抽出する線形予測分析手段、２は線形予測分析手段１により抽出された線形予測係数を符号化して多重化手段６に出力する一方、その線形予測係数の量子化値を適応音源符号化手段３、駆動音源符号化手段４及びゲイン符号化手段５に出力する線形予測係数符号化手段である。
【０００４】
３は線形予測係数符号化手段２から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と入力音声の距離が最小になる適応音源符号を選択して多重化手段６に出力するとともに、その適応音源符号に対応する適応音源信号（過去の所定長の音源信号が周期的に繰り返された時系列ベクトル）をゲイン符号化手段５に出力する適応音源符号化手段、４は線形予測係数符号化手段２から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と符号化対象信号（入力音声から適応音源信号による合成音を差し引いた信号）との距離が最小になる駆動音源符号を選択して多重化手段６に出力するとともに、その駆動音源符号に対応する時系列ベクトルである駆動音源信号をゲイン符号化手段５に出力する駆動音源符号化手段である。
【０００５】
５は適応音源符号化手段３から出力された適応音源信号と駆動音源符号化手段４から出力された駆動音源信号にゲインベクトルの各要素を乗算し、各乗算結果を相互に加算して音源信号を生成する一方、線形予測係数符号化手段２から出力された線形予測係数の量子化値を用いて、その音源信号から仮の合成音を生成し、仮の合成音と入力音声の距離が最小になるゲイン符号を選択して多重化手段６に出力するゲイン符号化手段、６は線形予測係数符号化手段２により符号化された線形予測係数の符号と、適応音源符号化手段３から出力された適応音源符号と、駆動音源符号化手段４から出力された駆動音源符号と、ゲイン符号化手段５から出力されたゲイン符号とを多重化して音声符号を出力する多重化手段である。
【０００６】
図１４は駆動音源符号化手段４の内部を示す構成図であり、図において、１１は駆動音源符号帳、１２は合成フィルタ、１３は歪み計算手段、１４は歪み評価手段である。
【０００７】
図１５は従来のＣＥＬＰ系の音声復号化装置を示す構成図であり、図において、２１は音声符号化装置から出力された音声符号を分離して、線形予測係数の符号を線形予測係数復号化手段２２に出力し、適応音源符号を適応音源復号化手段２３に出力し、駆動音源符号を駆動音源復号化手段２４に出力し、ゲイン符号をゲイン復号化手段２５に出力する分離手段、２２は分離手段２１から出力された線形予測係数の符号を復号化し、その復号結果である線形予測係数の量子化値を合成フィルタ２９に出力する線形予測係数復号化手段である。
【０００８】
２３は分離手段２１から出力された適応音源符号に対応する適応音源信号（過去の音源信号が周期的に繰り返された時系列ベクトル）を出力する適応音源復号化手段、２４は分離手段２１から出力された駆動音源符号に対応する時系列ベクトルである駆動音源信号を出力する駆動音源復号化手段、２５は分離手段２１から出力されたゲイン符号に対応するゲインベクトルを出力するゲイン復号化手段である。
【０００９】
２６はゲイン復号化手段２５から出力されたゲインベクトルの要素を適応音源復号化手段２３から出力された適応音源信号に乗算する乗算器、２７はゲイン復号化手段２５から出力されたゲインベクトルの要素を駆動音源復号化手段２４から出力された駆動音源信号に乗算する乗算器、２８は乗算器２６の乗算結果と乗算器２７の乗算結果を加算して音源信号を生成する加算器、２９は加算器２８により生成された音源信号に対する合成フィルタリング処理を実行して出力音声を生成する合成フィルタである。
【００１０】
図１６は駆動音源復号化手段２４の内部を示す構成図であり、図において、３１は駆動音源符号帳である。
【００１１】
次に動作について説明する。
従来の音声符号化装置及び音声復号化装置では、５〜５０ｍｓ程度を１フレームとして、フレーム単位で処理を行う。
【００１２】
まず、音声符号化装置の線形予測分析手段１は、音声を入力すると、その入力音声を分析して、音声のスペクトル包絡情報である線形予測係数を抽出する。
線形予測係数符号化手段２は、線形予測分析手段１が線形予測係数を抽出すると、その線形予測係数を符号化し、その符号を多重化手段６に出力する。また、その線形予測係数の量子化値を適応音源符号化手段３、駆動音源符号化手段４及びゲイン符号化手段５に出力する。
【００１３】
適応音源符号化手段３は、過去の所定長の音源信号を記憶する適応音源符号帳を内蔵し、内部で発生させる各適応音源符号（適応音源符号は数ビットの２進数で示される）に応じて、過去の音源信号が周期的に繰り返された時系列ベクトルを生成する。
次に、各時系列ベクトルに適切なゲインを乗じた後、線形予測係数符号化手段２から出力された線形予測係数の量子化値を用いる合成フィルタに各時系列ベクトルを通すことにより、仮の合成音を生成する。
【００１４】
そして、適応音源符号化手段３は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とする適応音源符号を選択して多重化手段６に出力するとともに、その選択した適応音源符号に対応する時系列ベクトルを適応音源信号として、ゲイン符号化手段５に出力する。
また、入力音声から適応音源信号による合成音を差し引いた信号を符号化対象信号として、駆動音源符号化手段４に出力する。
【００１５】
次に、駆動音源符号化手段４の動作について説明する。
駆動音源符号化手段４の駆動音源符号帳１１は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、歪み評価手段１４から出力される各駆動音源符号（駆動音源符号は数ビットの２進数値で示される）に応じて、時系列ベクトルを順次出力する。次に、各時系列ベクトルは適切なゲインを乗じられた後、合成フィルタ１２に入力される。
合成フィルタ１２は、線形予測係数符号化手段２から出力された線形予測係数の量子化値を用いて、ゲインが乗じられた各時系列ベクトルの仮の合成音を生成して出力する。
【００１６】
歪み計算手段１３は、符号化歪みとして、例えば、仮の合成音と、適応音源符号化手段３から出力された符号化対象信号との距離を計算する。
歪み評価手段１４は、歪み計算手段１３により計算された仮の合成音と符号化対象信号との距離を最小とする駆動音源符号を選択して多重化手段６に出力するとともに、その選択した駆動音源符号に対応する時系列ベクトルを駆動音源信号としてゲイン符号化手段５に出力する旨の指示を駆動音源符号帳１１に出力する。
【００１７】
ゲイン符号化手段５は、ゲインベクトルを格納するゲイン符号帳を内蔵し、内部で発生させる各ゲイン符号（ゲイン符号は数ビットの２進数値で示される）に応じて、そのゲイン符号帳からのゲインベクトルの読み出しを順次実行する。
そして、各ゲインベクトルの要素を、適応音源符号化手段３から出力された適応音源信号と、駆動音源符号化手段４から出力された駆動音源信号にそれぞれ乗算し、各乗算結果を相互に加算して音源信号を生成する。
次に、その音源信号を線形予測係数符号化手段２から出力された線形予測係数の量子化値を用いる合成フィルタに通すことにより、仮の合成音を生成する。
【００１８】
そして、ゲイン符号化手段５は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とするゲイン符号を選択して多重化手段６に出力する。また、そのゲイン符号に対応する音源信号を適応音源符号化手段３に出力する。これにより、適応音源符号化手段３は、ゲイン符号化手段５により選択されたゲイン符号に対応する音源信号を用いて、内蔵する適応音源符号帳の更新を行う。
【００１９】
多重化手段６は、線形予測係数符号化手段２により符号化された線形予測係数の符号と、適応音源符号化手段３から出力された適応音源符号と、駆動音源符号化手段４から出力された駆動音源符号と、ゲイン符号化手段５から出力されたゲイン符号とを多重化し、その多重化結果である音声符号を出力する。
【００２０】
音声復号化装置の分離手段２１は、音声符号化装置が音声符号を出力すると、その音声符号を分離して、線形予測係数の符号を線形予測係数復号化手段２２に出力し、適応音源符号を適応音源復号化手段２３に出力し、駆動音源符号を駆動音源復号化手段２４に出力し、ゲイン符号をゲイン復号化手段２５に出力する。線形予測係数復号化手段２２は、分離手段２１から線形予測係数の符号を受けると、その符号を復号化し、その復号結果である線形予測係数の量子化値を合成フィルタ２９に出力する。
【００２１】
適応音源復号化手段２３は、過去の所定長の音源信号を記憶する適応音源符号帳を内蔵し、分離手段２１から出力された適応音源符号に対応する適応音源信号（過去の音源信号が周期的に繰り返された時系列ベクトル）を出力する。
また、駆動音源復号化手段２４の駆動音源符号帳３１は、雑音的な複数の時系列ベクトルである駆動符号ベクトルを格納し、分離手段２１から出力された駆動音源符号に対応する時系列ベクトルを駆動音源信号として出力する。
ゲイン復号化手段２５は、ゲインベクトルを格納するゲイン符号帳を内蔵し、分離手段２１から出力されたゲイン符号に対応するゲインベクトルを出力する。
【００２２】
そして、適応音源復号化手段２３から出力された適応音源信号と駆動音源復号化手段２４から出力された駆動音源信号は、乗算器２６，２７により当該ゲインベクトルの要素が乗算され、加算器２８により乗算器２６，２７の乗算結果が相互に加算される。
【００２３】
合成フィルタ２９は、加算器２８の加算結果である音源信号に対する合成フィルタリング処理を実行して出力音声を生成する。なお、フィルタ係数としては、線形予測係数復号化手段２２により復号化された線形予測係数の量子化値を用いる。
最後に、適応音源復号化手段２３は、上記音源信号を用いて、内蔵する適応音源符号帳の更新を行う。
【００２４】
次に、上述したＣＥＬＰ系の音声符号化装置及び音声復号化装置の改良を図った従来の技術について説明する。
Ｗａｎｇ他「Ｉｍｐｒｏｖｅｄｅｘｃｉｔａｔｉｏｎｆｏｒｐｈｏｎｅｔｉｃａｌｌｙ−ｓｅｇｍｅｎｔｅｄＶＸＣｓｐｅｅｃｈｃｏｄｉｎｇｂｅｌｏｗ４ｋｂ／ｓ」Ｐｒｏｃ．ＧＬＯＢＥＣＯＭ’９０、ｐｐ．９４６〜９５０（文献１）や特開平８−４４３９７号公報（文献２）には低ビットレートでも高品質な音声を得ることを目的として、音源信号のピッチ性を強調させる方法が提案されている。
また、これと同様の方法が３ＧＰＰ技術仕様書３ＧＴＳ２６．０９０（文献３）やＩＴＵ−Ｔ勧告Ｇ．７２９に記載の音声符号化方式で採用されている。
【００２５】
図１７は音源信号のピッチ性を強調する駆動音源符号化手段４の内部を示す構成図であり、図において、図１４と同一符号は同一または相当部分を示すので説明を省略する。なお、駆動音源符号化手段４の内部構成以外は図１３と同様の構成とする。
図１７において、１５は駆動符号ベクトルにピッチ性を与える周期化手段である。
【００２６】
図１８は音源信号のピッチ性を強調する駆動音源復号化手段２４の内部を示す構成図であり、図において、図１６と同一符号は同一または相当部分を示すので説明を省略する。なお、駆動音源復号化手段２４の内部構成以外は図１５と同様の構成とする。図１８において、３２は駆動符号ベクトルにピッチ性を与える周期化手段である。
【００２７】
次に動作について説明する。
ただし、駆動音源符号化手段４の周期化手段１５及び駆動音源復号化手段２４の周期化手段３２が付加されている点以外は、上述したＣＥＬＰ系の音声符号化装置及び音声復号化装置と同様であるため相違点のみ説明する。
【００２８】
周期化手段１５は、駆動音源符号帳１１から出力された時系列ベクトルのピッチ周期性を強調して出力する。
周期化手段３２は、駆動音源符号帳３１から出力された時系列ベクトルのピッチ周期性を強調して出力する。
【００２９】
周期化手段１５及び周期化手段３２における時系列ベクトルのピッチ周期性の強調は、例えば、コムフィルタにより実現する。
文献１ではコムフィルタのゲイン（周期強調係数）を一定値としており、また、文献２では周期強調係数として、符号化するフレームにおける音声信号の長周期予測ゲインを用い、さらに、文献３では過去のフレームで符号化された適応音源信号に対するゲインを用いている。
【００３０】
【発明が解決しようとする課題】
従来の音声符号化装置及び音声復号化装置は以上のように構成されているので、ピッチ周期性を強調するための周期強調係数を、全ての駆動符号ベクトルに対して同じ値としている。したがって、この周期強調係数が不適当な値であった場合には全ての駆動符号ベクトルがその悪影響を受けるので、周期強調による十分な品質改善が得られず、また、逆に劣化する場合もあるなどの課題があった。
【００３１】
例えば、図１９に示すように、符号化対象信号が周期Ｔの強い周期性を示しているのに対し、駆動符号ベクトルを周期化するコムフィルタのインパルス応答が弱い周期性を示すように周期強調係数が設定されている場合、全ての駆動符号ベクトルが弱い周期強調しかされないので、強い周期性を示す符号化対象信号に対する符号化歪みが大きく、品質劣化が起こっていた。
また、逆に、符号化対象信号が弱い周期性を示しているのに対し、駆動符号ベクトルに強い周期性を与えるように周期強調係数が設定されている場合も、同様に符号化歪みが大きく、品質劣化が起こっていた。
【００３２】
音声符号化の情報量圧縮率を上げるためには、フレーム長を長くすることが有効であるが、この場合には、フレーム長が長いために分析フレーム内にピッチ変動などの周期強調係数の計算に悪影響を与える要因が入りやすくなり（文献２の構成）、また、過去のフレームのゲインと現在のフレームに適当な周期強調係数との相関が小さくなる（文献３の構成）。このことより周期強調係数が不適当になることが多くなり、上記課題がより顕著であった。
【００３３】
また、音声符号化の情報量圧縮率を上げるためには、格納している駆動符号ベクトルの性質が異なる複数の駆動音源符号帳を用いることが有効であるが、この場合には、適当な周期強調係数は駆動音源符号帳毎に異なり、上記の単一の周期強調係数を用いることによる品質劣化という課題がより顕著であった。
例えば、雑音的な駆動符号ベクトルを格納する駆動音源符号帳と、フレーム内に少数のパルスしかない非雑音的（パルス的）な駆動符号ベクトルを格納する駆動音源符号帳とを備えた場合、雑音的な駆動符号ベクトルは常に強い周期化を行った方が、出力音声の雑音的な音質が軽減され、主観的な品質が向上するが、同様に非雑音的な駆動符号ベクトルも常に強い周期化を行うと、本来周期的でない雑音的な入力音声に対しては出力音声がパルス的な音質になり、主観的な品質劣化につながるという課題があった。
【００３４】
また、例えば、フレーム前半にのみ信号があり、フレーム後半は零信号であるなど、時間的なパワー分布に偏りがある駆動符号ベクトルを格納する駆動音源符号帳を備えた場合、当該駆動符号ベクトルに対しては常に強い周期化を行わないと、フレーム後半における符号化特性の劣化が顕著となるなど、パワーが小さい部分で主観的な品質劣化が起こるという課題があった。
【００３５】
この発明は上記のような課題を解決するためになされたもので、主観的に品質の高い出力音声を得ることができる音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法を得ることを目的とする。
【００３６】
【課題を解決するための手段】
この発明に係る音声符号化装置は、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化手段と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化手段とを備えるようにしたものである。
【００３７】
この発明に係る音声符号化方法は、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化工程と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化工程とを備えるようにしたものである。
【００３８】
この発明に係る音声符号化方法は、入力音声を分析して第１の周期強調係数を決定するようにしたものである。
【００３９】
この発明に係る音声符号化方法は、音声符号から第１の周期強調係数を決定するようにしたものである。
【００４０】
この発明に係る音声符号化方法は、音声の様態を判定し、その判定結果に応じて第１の周期強調係数を決定するようにしたものである。
【００４１】
この発明に係る音声符号化方法は、音声の摩擦音区間を判定し、その摩擦音区間では第１の周期強調係数の強調度合を弱めるようにしたものである。
【００４２】
この発明に係る音声符号化方法は、音声の有声定常区間を判定し、その有声定常区間では第１の周期強調係数の強調度合を強めるようにしたものである。
【００４３】
この発明に係る音声符号化方法は、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するようにしたものである。
【００４４】
この発明に係る音声符号化方法は、駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するようにしたものである。
【００４５】
この発明に係る音声復号化装置は、駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化手段と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化手段とを備えるようにしたものである。
【００４６】
この発明に係る音声復号化方法は、駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化工程と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化工程とを備えるようにしたものである。
【００４７】
この発明に係る音声復号化方法は、音声符号に含まれている周期強調係数の符号を復号化して第１の周期強調係数を求めるようにしたものである。
【００４８】
この発明に係る音声復号化方法は、音声符号から第１の周期強調係数を決定するようにしたものである。
【００４９】
この発明に係る音声復号化方法は、音声の様態を判定し、その判定結果に応じて第１の周期強調係数を決定するようにしたものである。
【００５０】
この発明に係る音声復号化方法は、音声の摩擦音区間を判定し、その摩擦音区間では第１の周期強調係数の強調度合を弱めるようにしたものである。
【００５１】
この発明に係る音声復号化方法は、音声の有声定常区間を判定し、その有声定常区間では第１の周期強調係数の強調度合を強めるようにしたものである。
【００５２】
この発明に係る音声復号化方法は、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するようにしたものである。
【００５３】
この発明に係る音声復号化方法は、駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するようにしたものである。
【００５４】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態１．
図１はこの発明の実施の形態１による音声符号化装置を示す構成図であり、図において、４１は入力音声を分析して、その入力音声のスペクトル包絡情報である線形予測係数を抽出する線形予測分析手段、４２は線形予測分析手段４１により抽出された線形予測係数を符号化して多重化手段４６に出力する一方、その線形予測係数の量子化値を適応音源符号化手段４３、駆動音源符号化手段４４及びゲイン符号化手段４５に出力する線形予測係数符号化手段である。
なお、線形予測係数分析手段４１及び線形予測係数符号化手段４２からスペクトル包絡情報符号化手段が構成されている。
【００５５】
４３は線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と入力音声の距離が最小になる適応音源符号を選択して多重化手段４６に出力するとともに、その適応音源符号に対応する適応音源信号（過去の所定長の音源信号が周期的に繰り返された時系列ベクトル）をゲイン符号化手段４５に出力する適応音源符号化手段、４４は入力音声を分析して周期強調係数を求め、この周期強調係数を符号化して多重化手段４６に出力する一方、その周期強調係数の量子化値及び線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と符号化対象信号（入力音声から適応音源信号による合成音を差し引いた信号）との距離が最小になる駆動音源符号を選択して多重化手段４６に出力するとともに、その駆動音源符号に対応する時系列ベクトルである駆動音源信号をゲイン符号化手段４５に出力する駆動音源符号化手段である。
【００５６】
４５は適応音源符号化手段４３から出力された適応音源信号と駆動音源符号化手段４４から出力された駆動音源信号にゲインベクトルの各要素を乗算し、各乗算結果を相互に加算して音源信号を生成する一方、線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いて、その音源信号から仮の合成音を生成し、仮の合成音と入力音声の距離が最小になるゲイン符号を選択して多重化手段４６に出力するゲイン符号化手段である。なお、適応音源符号化手段４３、駆動音源符号化手段４４及びゲイン符号化手段４５から音源情報符号化手段が構成されている。
【００５７】
４６は線形予測係数符号化手段４２により符号化された線形予測係数の符号と、適応音源符号化手段４３から出力された適応音源符号と、駆動音源符号化手段４４から出力された周期強調係数の符号及び駆動音源符号と、ゲイン符号化手段４５から出力されたゲイン符号とを多重化して音声符号を出力する多重化手段である。
【００５８】
図２は駆動音源符号化手段４４の内部を示す構成図であり、図において、５１は入力音声を分析して周期強調係数（第１の周期強調係数）を決定する周期強調係数計算手段、５２は周期強調係数計算手段５１により求められた周期強調係数を符号化する一方、その周期強調係数の量子化値を第１の周期化手段５４に出力する周期強調係数符号化手段、５３は複数の非雑音的（パルス的）な時系列ベクトル（駆動符号ベクトル）を格納する第１の駆動音源符号帳、５４は周期強調係数符号化手段５２から出力された周期強調係数の量子化値を用いて各時系列ベクトルの周期性を強調する第１の周期化手段、５５は線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いて各時系列ベクトルの仮の合成音を生成する第１の合成フィルタ、５６は仮の合成音と適応音源符号化手段４３から出力された符号化対象信号との距離を計算する第１の歪み計算手段である。
【００５９】
５７は複数の雑音的な時系列ベクトル（駆動符号ベクトル）を格納する第２の駆動音源符号帳、５８は予め定めた固定の周期強調係数（第２の周期強調係数）を用いて各時系列ベクトルの周期性を強調する第２の周期化手段、５９は線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いて各時系列ベクトルの仮の合成音を生成する第２の合成フィルタ、６０は仮の合成音と適応音源符号化手段４３から出力された符号化対象信号との距離を計算する第２の歪み計算手段、６１は第１の歪み計算手段５６の計算結果と第２の歪み計算手段６０の計算結果を比較評価して駆動音源符号を選択する歪み評価手段である。
【００６０】
図３はこの発明の実施の形態１による音声復号化装置を示す構成図であり、図において、７１は音声符号化装置から出力された音声符号を分離して、線形予測係数の符号を線形予測係数復号化手段７２に出力し、適応音源符号を適応音源復号化手段７３に出力し、周期強調係数の符号及び駆動音源符号を駆動音源復号化手段７４に出力し、ゲイン符号をゲイン復号化手段７５に出力する分離手段、７２は分離手段７１から出力された線形予測係数の符号を復号化し、その復号結果である線形予測係数の量子化値を合成フィルタ７９に出力する線形予測係数復号化手段である。
【００６１】
７３は分離手段７１から出力された適応音源符号に対応する適応音源信号（過去の音源信号が周期的に繰り返された時系列ベクトル）を出力する適応音源復号化手段、７４は分離手段７１から出力された周期強調係数の符号及び駆動音源符号に対応する時系列ベクトルである駆動音源信号を出力する駆動音源復号化手段、７５は分離手段７１から出力されたゲイン符号に対応するゲインベクトルを出力するゲイン復号化手段である。
【００６２】
７６はゲイン復号化手段７５から出力されたゲインベクトルの要素を適応音源復号化手段７３から出力された適応音源信号に乗算する乗算器、７７はゲイン復号化手段７５から出力されたゲインベクトルの要素を駆動音源復号化手段７４から出力された駆動音源信号に乗算する乗算器、７８は乗算器７６の乗算結果と乗算器７７の乗算結果を加算して音源信号を生成する加算器、７９は加算器７８により生成された音源信号に対する合成フィルタリング処理を実行して出力音声を生成する合成フィルタである。
【００６３】
図４は駆動音源復号化手段７４の内部を示す構成図であり、図において、８１は分離手段７１から出力された周期強調係数の符号を復号化し、その復号結果である周期強調係数（第１の周期強調係数）の量子化値を第１の周期化手段８３に出力する周期強調係数復号化手段、８２は複数の非雑音的（パルス的）な時系列ベクトル（駆動符号ベクトル）を格納する第１の駆動音源符号帳、８３は周期強調係数復号化手段８１から出力された周期強調係数の量子化値を用いて各時系列ベクトルの周期性を強調する第１の周期化手段、８４は複数の雑音的な時系列ベクトル（駆動符号ベクトル）を格納する第２の駆動音源符号帳、８５は予め定めた固定の周期強調係数（第２の周期強調係数）を用いて各時系列ベクトルの周期性を強調する第２の周期化手段である。
【００６４】
次に動作について説明する。
音声符号化装置では、５〜５０ｍｓ程度を１フレームとして、フレーム単位で処理を行う。
【００６５】
まず、スペクトル包絡情報の符号化について説明する。
線形予測分析手段４１は、音声を入力すると、その入力音声を分析して、音声のスペクトル包絡情報である線形予測係数を抽出する。
線形予測係数符号化手段４２は、線形予測分析手段４１が線形予測係数を抽出すると、その線形予測係数を符号化し、その符号を多重化手段４６に出力する。また、その線形予測係数の量子化値を適応音源符号化手段４３、駆動音源符号化手段４４及びゲイン符号化手段４５に出力する。
【００６６】
次に、音源情報の符号化について説明する。
適応音源符号化手段４３は、過去の所定長の音源信号を記憶する適応音源符号帳を内蔵し、内部で発生させる各適応音源符号（適応音源符号は数ビットの２進数で示される）に応じて、過去の音源信号が周期的に繰り返された時系列ベクトルを生成する。
次に、各時系列ベクトルに適切なゲインを乗じた後、線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いる合成フィルタに各時系列ベクトルを通すことにより、仮の合成音を生成する。
【００６７】
そして、適応音源符号化手段４３は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とする適応音源符号を選択して多重化手段４６に出力するとともに、その選択した適応音源符号に対応する時系列ベクトルを適応音源信号として、ゲイン符号化手段４５に出力する。
また、選択した適応音源符号に対応するピッチ周期と、入力音声から適応音源信号による合成音を差し引いた信号である符号化対象信号を、駆動音源符号化手段４４に出力する。
【００６８】
次に、駆動音源符号化手段４４の動作について説明する。
周期強調係数計算手段５１は、入力音声を分析して周期強調係数を決定する。周期強調係数は、例えば、入力音声の長周期予測ゲインを基に、スペクトル特徴が有声的であれば強調の度合を強め、無声的であれば強調の度合を弱め、また、長周期予測ゲイン及びピッチ周期の時間変動が小さければ強調の度合を強め、時間変動が大きければ強調の度合を弱めるなどして決定する。
周期強調係数符号化手段５２は、周期強調係数計算手段５１が周期強調係数を決定すると、その周期強調係数を符号化し、その符号を多重化手段４６に出力する。また、その周期強調係数の量子化値を第１の周期化手段５４に出力する。
【００６９】
第１の駆動音源符号帳５３は、複数の非雑音的（パルス的）な時系列ベクトルである駆動符号ベクトルを格納し、歪み評価手段６１から出力される各駆動音源符号に応じて、時系列ベクトルを順次出力する。第１の周期化手段５４は、周期強調係数符号化手段５２から出力された周期強調係数の量子化値を用いて、第１の駆動音源符号帳５３から出力された時系列ベクトルの周期性を強調して出力する。第１の周期化手段５４における時系列ベクトルの周期性の強調は、例えば、コムフィルタにより実現する。次に、周期性を強調された各時系列ベクトルは適切なゲインが乗じられた後、第１の合成フィルタ５５に入力される。
【００７０】
第１の合成フィルタ５５は、線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いて、ゲインが乗じられた各時系列ベクトルの仮の合成音を生成して出力する。
そして、第１の歪み計算手段５６は、符号化歪みとして、例えば、仮の合成音と適応音源符号化手段４３から出力された符号化対象信号との距離を計算し、歪み評価手段６１に出力する。
【００７１】
一方、第２の駆動音源符号帳５７は、複数の雑音的な時系列ベクトルである駆動符号ベクトルを格納し、歪み評価手段６１から出力される各駆動音源符号に応じて、時系列ベクトルを順次出力する。第２の周期化手段５８は、予め定めた固定の周期強調係数を用いて、第２の駆動音源符号帳５７から出力された時系列ベクトルの周期性を強調して出力する。第２の周期化手段５８における時系列ベクトルの周期性の強調は、例えば、コムフィルタにより実現する。
【００７２】
ここで、第２の周期化手段５８が用いる固定の周期強調係数は、例えば、学習用の入力音声を符号化し、第１の周期化手段５４が用いる周期強調係数が不適当であるフレームを抽出し、このフレームにおける符号化品質が平均的によくなるように決定するなどの方法により、予め設定しておく。
【００７３】
次に、周期性を強調された各時系列ベクトルは適切なゲインが乗じられた後、第２の合成フィルタ５９に入力される。
第２の合成フィルタ５９は、線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いて、ゲインが乗じられた各時系列ベクトルの仮の合成音を生成して出力する。
そして、第２の歪み計算手段６０は、符号化歪みとして、例えば、仮の合成音と適応音源符号化手段４３から入力された符号化対象信号との距離を計算し、歪み評価手段６１に出力する。
【００７４】
歪み評価手段６１は、前記仮の合成音と符号化対象信号との距離を最小とする駆動音源符号を選択して多重化手段４６に出力する。また、その選択した駆動音源符号に対応する時系列ベクトルを出力する旨の指示を第１の駆動音源符号帳５３又は第２の駆動音源符号帳５７に出力する。第１の周期化手段５４又は第２の周期化手段５８は、第１の駆動音源符号帳５３又は第２の駆動音源符号帳５７から出力された時系列ベクトルのピッチ周期性を強調し、駆動音源信号としてゲイン符号化手段４５に出力する。
【００７５】
上記のようにして、駆動音源符号化手段４４が駆動音源信号を出力すると、ゲイン符号化手段４５は、ゲインベクトルを格納するゲイン符号帳を内蔵し、内部で発生させる各ゲイン符号（ゲイン符号は数ビットの２進数値で示される）に応じて、そのゲイン符号帳からゲインベクトルの読み出しを順次実行する。そして、各ゲインベクトルの要素を、適応音源符号化手段４３から出力された適応音源信号と、駆動音源符号化手段４４から出力された駆動音源信号にそれぞれ乗算し、各乗算結果を相互に加算して音源信号を生成する。
次に、その音源信号を線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いる合成フィルタに通すことにより、仮の合成音を生成する。
【００７６】
そして、ゲイン符号化手段４５は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とするゲイン符号を選択して多重化手段４６に出力する。また、そのゲイン符号に対応する音源信号を適応音源符号化手段４３に出力する。これにより、適応音源符号化手段４３は、ゲイン符号化手段４５により選択されたゲイン符号に対応する音源信号を用いて、内蔵する適応音源符号帳の更新を行う。
【００７７】
多重化手段４６は、線形予測係数符号化手段４２により符号化された線形予測係数の符号と、適応音源符号化手段４３から出力された適応音源符号と、駆動音源符号化手段４４から出力された周期強調係数の符号及び駆動音源符号と、ゲイン符号化手段４５から出力されたゲイン符号とを多重化し、その多重化結果である音声符号を出力する。
【００７８】
音声復号化装置の分離手段７１は、音声符号化装置が音声符号を出力すると、その音声符号を分離して、線形予測係数の符号を線形予測係数復号化手段７２に出力し、適応音源符号を適応音源復号化手段７３に出力し、周期強調係数の符号及び駆動音源符号を駆動音源復号化手段７４に出力し、ゲイン符号をゲイン復号化手段７５に出力する。
線形予測係数復号化手段７２は、分離手段７１から線形予測係数の符号を受けると、その符号を復号化し、その復号結果である線形予測係数の量子化値を合成フィルタ７９に出力する。
【００７９】
適応音源復号化手段７３は、過去の所定長の音源信号を記憶する適応音源符号帳を内蔵し、分離手段７１から出力された適応音源符号に対応する適応音源信号（過去の音源信号が周期的に繰り返された時系列ベクトル）を出力する。
【００８０】
次に、駆動音源復号化手段７４の動作について説明する。周期強調係数復号化手段８１は、分離手段７１から周期強調係数の符号を受けると、その符号を復号化し、その復号結果である周期強調係数の量子化値を第１の周期化手段８３に出力する。
第１の駆動音源符号帳８２は、複数の非雑音的（パルス的）な時系列ベクトルを格納し、また、第２の駆動音源符号帳８４は、複数の雑音的な時系列ベクトルを格納している。そして、第１の駆動音源符号帳８２又は第２の駆動音源符号帳８４は、分離手段７１から出力された駆動音源符号に対応する時系列ベクトルを出力する。
【００８１】
第１の駆動音源符号帳８２が駆動音源符号に対応する時系列ベクトルを出力した場合、第１の周期化手段８３は、周期強調係数復号化手段８１から出力された周期強調係数の量子化値を用いて、第１の駆動音源符号帳８２から出力された時系列ベクトルの周期性を強調し、駆動音源信号として出力する。
一方、第２の駆動音源符号帳８４が駆動音源符号に対応する時系列ベクトルを出力した場合、第２の周期化手段８５は、予め定めた固定の周期強調係数を用いて、第２の駆動音源符号帳８４から出力された時系列ベクトルの周期性を強調し、駆動音源信号として出力する。
【００８２】
ゲイン復号化手段７５は、ゲインベクトルを格納するゲイン符号帳を内蔵し、分離手段７１から出力されたゲイン符号に対応するゲインベクトルを出力する。そして、適応音源復号化手段７３から出力された適応音源信号と駆動音源復号化手段７４から出力された駆動音源信号は、乗算器７６，７７により当該ゲインベクトルの要素が乗算され、加算器７８により乗算器７６，７７の乗算結果が相互に加算される。
【００８３】
合成フィルタ７９は、加算器７８の加算結果である音源信号に対する合成フィルタリング処理を実行して出力音声を生成する。なお、フィルタ係数としては、線形予測係数復号化手段７２により復号化された線形予測係数の量子化値を用いる。
最後に、適応音源復号化手段７３は、上記音源信号を用いて、内蔵する適応音源符号帳の更新を行う。
【００８４】
以上で明らかなように、この実施の形態１によれば、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化手段と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化手段とを備えるように構成したので、図５に示すように、第１の周期強調係数又は第２の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果を奏する。
【００８５】
また、入力音声を分析して求めたパラメータを基に第１の周期強調係数を決定するように構成したので、入力音声から抽出できる数多くのパラメータを使用し、精密な規則により周期強調係数を決定することができる。そのため、不適当な周期強調係数が求まる頻度が軽減され、主観的に品質の高い出力音声を得ることができる効果を奏する。
【００８６】
さらに、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、雑音的な駆動符号ベクトルは常に強い周期化を行うことができ、出力音声の雑音的な音質が軽減される。また、非雑音的な駆動符号ベクトルは常には強い周期化を行うことがなく、出力音声がパルス的な音質になることを回避でき、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【００８７】
実施の形態２．
図６はこの発明の実施の形態２による音声符号化装置を示す構成図であり、図において、図１と同一符号は同一または相当部分を示すので説明を省略する。
４７は適応音源信号のゲインから周期強調係数を求め、その周期強調係数及び線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いて仮の合成音を生成し、仮の合成音と符号化対象信号（入力音声から適応音源信号による合成音を差し引いた信号）との距離が最小になる駆動音源符号を選択して多重化手段４９に出力するとともに、その駆動音源符号に対応する時系列ベクトルである駆動音源信号をゲイン符号化手段４８に出力する駆動音源符号化手段である。
【００８８】
４８は適応音源符号化手段４３から出力された適応音源信号と駆動音源符号化手段４７から出力された駆動音源信号にゲインベクトルの各要素を乗算し、各乗算結果を相互に加算して音源信号を生成する一方、線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いて、その音源信号から仮の合成音を生成し、仮の合成音と入力音声の距離が最小になるゲイン符号を選択して多重化手段４９に出力するゲイン符号化手段である。
【００８９】
図７は駆動音源符号化手段４７の内部を示す構成図であり、図において、図２と同一符号は同一または相当部分を示すので説明を省略する。
６２は適応音源信号のゲインから周期強調係数を求める周期強調係数計算手段である。
【００９０】
図８はこの発明の実施の形態２による音声復号化装置を示す構成図であり、図において、図３と同一符号は同一または相当部分を示すので説明を省略する。
８０は適応音源信号のゲインから周期強調係数を求め、その周期強調係数及び分離手段７１から出力された駆動音源符号に対応する時系列ベクトルである駆動音源信号を出力する駆動音源復号化手段である。
【００９１】
図９は駆動音源復号化手段８０の内部を示す構成図であり、図において、図４と同一符号は同一または相当部分を示すので説明を省略する。
８６は適応音源信号のゲインから周期強調係数を求める周期強調係数計算手段である。
【００９２】
次に動作について説明する。
ただし、駆動音源符号化手段４７の周期強調係数計算手段６２、ゲイン符号化手段４８及び駆動音源復号化手段８０の周期強調係数計算手段８６以外は、上記実施の形態１と同様であるため相違点のみ説明する。
【００９３】
周期強調係数計算手段６２は、ゲイン符号化手段４８から出力された適応音源信号に対するゲインから、例えば、前フレームの適応音源信号に対するゲインを用いるなどして、周期強調係数を決定し、その周期強調係数を第１の周期化手段５４に出力する。
【００９４】
ゲイン符号化手段４８は、ゲインベクトルを格納するゲイン符号帳を内蔵し、内部で発生させる各ゲイン符号（ゲイン符号は数ビットの２進数値で示される）に応じて、そのゲイン符号帳からゲインベクトルの読み出しを順次実行する。
そして、各ゲインベクトルの要素を、適応音源符号化手段４３から出力された適応音源信号と、駆動音源符号化手段４７から出力された駆動音源信号にそれぞれ乗算し、各乗算結果を相互に加算して音源信号を生成する。
次に、その音源信号を線形予測係数符号化手段４２から出力された線形予測係数の量子化値を用いる合成フィルタに通すことにより、仮の合成音を生成する。
【００９５】
そして、ゲイン符号化手段４８は、符号化歪みとして、例えば、仮の合成音と入力音声との距離を調査し、この距離を最小とするゲイン符号を選択して多重化手段４９に出力する。また、そのゲイン符号に対応する音源信号を適応音源符号化手段４３に出力する一方、そのゲイン符号に対応する適応音源信号のゲインを駆動音源符号化手段４７に出力する。
【００９６】
周期強調係数計算手段８６は、ゲイン復号化手段７５から出力された適応音源信号のゲインから、駆動音源符号化手段４７の周期強調係数計算手段６２と同様にして、周期強調係数を決定し、その周期強調係数を第１の周期化手段８３に出力する。
【００９７】
以上で明らかなように、この実施の形態２によれば、音声符号から求めることができるパラメータを基に第１の周期強調係数を決定するように構成したので、周期強調係数を個別に符号化する必要はなく、低ビットレートでも所定の規則に基づき適応的に求めた第１の周期強調係数又は予め定めた固定の第２の周期強調係数を用いて駆動符号ベクトルに対する周期性の強調を行うことができ、主観的に品質の高い出力音声を得ることができる効果を奏する。
【００９８】
実施の形態３．
図１０は駆動音源符号化手段４７の内部を示す構成図であり、図２と同一符号は同一または相当部分を示すので説明を省略する。
６３は線形予測係数の量子化値、ピッチ周期及び適応音源信号のゲインから音声の様態を判定する音声様態判定手段、６４は音声様態の判定結果と適応音源信号のゲインから周期強調係数を決定する周期強調係数計算手段である。
【００９９】
図１１はこの発明の実施の形態３による音声復号化装置を示す構成図であり、図において、図３と同一符号は同一または相当部分を示すので説明を省略する。９１は線形予測係数の量子化値、ピッチ周期及び適応音源信号のゲインから音声の様態を判定し、その音声様態の判定結果と適応音源信号のゲインから周期強調係数を求め、その周期強調係数と分離手段７１から出力された駆動音源符号に対応する時系列ベクトルである駆動音源信号を出力する駆動音源復号化手段である。
【０１００】
図１２は駆動音源復号化手段９１の内部を示す構成図であり、図４と同一符号は同一または相当部分を示すので説明を省略する。
８７は線形予測係数の量子化値、ピッチ周期及び適応音源信号のゲインから音声の様態を判定する音声様態判定手段、８８は音声様態の判定結果と適応音源信号のゲインから周期強調係数を決定する周期強調係数計算手段である。
【０１０１】
次に動作について説明する。
ただし、駆動音源符号化手段４７の音声様態判定手段６３及び周期強調係数計算手段６４、駆動音源復号化手段９１の音声様態判定手段８７及び周期強調係数計算手段８８以外は、上記実施の形態２と同様であるため相違点のみ説明する。
【０１０２】
音声様態判定手段６３は、線形予測係数符号化手段４２から出力された線形予測係数の量子化値、適応音源符号化手段４３から出力されたピッチ周期及びゲイン符号化手段４８から出力された適応音源信号のゲインから、入力音声の様態を、例えば、摩擦音、有声定常又はそれ以外に判定し、その判定結果を周期強調係数計算手段６４に出力する。
音声様態の判定は、例えば、線形予測係数の量子化値からスペクトルの傾斜を求め、それが周波数低域より高域に向かって音声のパワーが増大するような様態を示していれば摩擦音とし、ピッチ周期及びゲインの時間変動を求め、変動が小さければ有声定常とし、以上の条件に合致しなければその他とするなどとする。
【０１０３】
周期強調係数計算手段６４は、音声様態判定手段６３から出力された音声様態の判定結果とゲイン符号化手段４８から出力された適応音源信号に対するゲインから、例えば、前フレームの適応音源信号に対するゲインを用いて周期強調係数を決定し、その周期強調係数を第１の周期化手段５４に出力する。
【０１０４】
ここで、前記周期強調係数は、音声様態が摩擦音であれば強調の度合を弱め、音声様態が有声定常であれば強調の度合を強める。
これにより、本来は入力音声に周期性がない摩擦音区間で駆動音源ベクトルに対して強い周期強調を行ったり、あるいは、本来は入力音声の周期性が強い有声定常区間で駆動音源ベクトルに対して弱い周期強調しか行われないなどの、不適当な周期強調を行うことがなくなり、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【０１０５】
音声様態判定手段８７は、線形予測係数復号化手段７２から出力された線形予測係数の量子化値、適応音源復号化手段７３から出力されたピッチ周期及びゲイン復号化手段７５から出力された適応音源信号のゲインから、駆動音源符号化手段４７の音声様態判定手段６３と同様にして、音声の様態を判定し、その判定結果を周期強調係数計算手段８８に出力する。
【０１０６】
周期強調係数計算手段８８は、音声様態判定手段８７から出力された音声様態の判定結果とゲイン復号化手段７５から出力された適応音源信号に対するゲインから、駆動音源符号化手段４７の周期強調係数計算手段６４と同様にして、周期強調係数を決定し、その周期強調係数を第１の周期化手段８３に出力する。
【０１０７】
これにより、音声符号から求めることができるパラメータから音声様態を判定して、この判定結果に応じて周期強調係数を決定しているので、伝送情報量を増やすことなく、より細かく周期強調係数を制御でき、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【０１０８】
また、音声様態の判定結果が、本来は周期性がない摩擦音のときには、周期強調係数の強調の度合を弱めるようにしたので、主観的に品質の高い符号化音声を得ることができる効果を奏する。
さらに、音声様態の判定結果が、本来周期性が強い有声定常のときには、周期強調係数の強調の度合を強めるようにしたので、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【０１０９】
実施の形態４．
上記実施の形態１〜３では、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するものについて示したが、第１の駆動音源符号帳５３，８２は時間的なパワー分布が平坦な複数の時系列ベクトル（駆動符号ベクトル）を格納し、第２の駆動音源符号帳５７，８４は時間的なパワー分布がフレーム前半に偏っている複数の時系列ベクトル（駆動符号ベクトル）を格納するように構成してもよい。
【０１１０】
このように構成したことにより、パワー分布に偏りがある駆動符号ベクトルは常に強い周期化を行うことができ、周期化後の駆動符号ベクトルのパワー分布の偏りが軽減し、主観的に品質の高い符号化音声を得ることができる効果を奏する。
【０１１１】
実施の形態５．
上記実施の形態１〜４では、駆動音源符号帳を２個用意しているが、３つ以上の駆動音源符号帳を用意して駆動音源符号化手段４４，４７及び駆動音源復号化手段７４，８０，９１を構成するようにしてもよい。
【０１１２】
また、上記実施の形態１〜４では、明示的に複数個の駆動音源符号帳を備えるものについて示したが、単一の駆動音源符号帳に格納される時系列ベクトルを複数の部分集合に分割して、各部分集合を個別の駆動音源符号帳と見倣すようにしてもよい。
【０１１３】
また、上記実施の形態１〜４では、第１の駆動音源符号帳５３，８２と第２の駆動音源符号帳５７，８４とが異なる駆動符号ベクトルを格納しているが、同一の符号ベクトルを格納するとしてもよい。即ち、単一の駆動音源符号帳に対して第１の周期化工程及び第２の周期化工程を適用するとしてもよい。
【０１１４】
また、上記実施の形態１〜４では、第１の合成フィルタ５５と第２の合成フィルタ５９の２つの合成フィルタを備える構成としているが、これらは同一の動作をすることから、一つの合成フィルタを共通に用いる構成としてもよい。同様に、第１の歪み計算手段５６と第２の歪み計算手段６０も、一つの歪み計算手段を共通に用いる構成としてもよい。
【０１１５】
【発明の効果】
以上のように、この発明によれば、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化手段と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化手段とを備えるように構成したので、第１の周期強調係数又は第２の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果がある。
【０１１６】
この発明によれば、駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化工程と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化工程とを備えるように構成したので、第１の周期強調係数又は第２の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果がある。
【０１１７】
この発明によれば、入力音声を分析して第１の周期強調係数を決定するように構成したので、不適当な周期強調係数が求まる頻度が軽減され、主観的に品質の高い出力音声を得ることができる効果がある。
【０１１８】
この発明によれば、音声符号から第１の周期強調係数を決定するように構成したので、周期強調係数を個別に符号化することなく、すなわち、伝送情報量を増やすことなく駆動符号ベクトルに対する周期性の強調を行うことができ、主観的に品質の高い出力音声を得ることができる効果がある。
【０１１９】
この発明によれば、音声の様態を判定し、その判定結果に応じて第１の周期強調係数を決定するように構成したので、より細かく周期強調係数を制御でき、主観的に品質の高い符号化音声を得ることができる効果がある。
【０１２０】
この発明によれば、音声の摩擦音区間を判定し、その摩擦音区間では第１の周期強調係数の強調度合を弱めるように構成したので、主観的に品質の高い符号化音声を得ることができる効果がある。
【０１２１】
この発明によれば、音声の有声定常区間を判定し、その有声定常区間では第１の周期強調係数の強調度合を強めるように構成したので、主観的に品質の高い符号化音声を得ることができる効果がある。
【０１２２】
この発明によれば、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、出力音声の雑音的な音質が軽減され、また、出力音声がパルス的な音質になることが回避され、主観的に品質の高い符号化音声を得ることができる効果がある。
【０１２３】
この発明によれば、駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、周期化後の駆動符号ベクトルのパワー分布の偏りが軽減し、主観的に品質の高い符号化音声を得ることができる効果がある。
【０１２４】
この発明によれば、駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化手段と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化手段とを備えるように構成したので、第１の周期強調係数又は第２の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果がある。
【０１２５】
この発明によれば、駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化工程と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化工程とを備えるように構成したので、第１の周期強調係数又は第２の周期強調係数のどちらか一方が不適当な値であっても、その不適当な周期強調係数による悪影響が一部の駆動符号ベクトルに限定され、主観的に品質の高い出力音声を得ることができる効果がある。
【０１２６】
この発明によれば、音声符号に含まれている周期強調係数の符号を復号化して第１の周期強調係数を求めるように構成したので、主観的に品質の高い出力音声を得ることができる効果がある。
【０１２７】
この発明によれば、音声符号から第１の周期強調係数を決定するように構成したので、周期強調係数を個別に符号化することなく、すなわち、伝送情報量を増やすことなく駆動符号ベクトルに対する周期性の強調を行うことができ、主観的に品質の高い出力音声を得ることができる効果がある。
【０１２８】
この発明によれば、音声の様態を判定し、その判定結果に応じて第１の周期強調係数を決定するように構成したので、より細かく周期強調係数を制御でき、主観的に品質の高い符号化音声を得ることができる効果がある。
【０１２９】
この発明によれば、音声の摩擦音区間を判定し、その摩擦音区間では第１の周期強調係数の強調度合を弱めるように構成したので、主観的に品質の高い符号化音声を得ることができる効果がある。
【０１３０】
この発明によれば、音声の有声定常区間を判定し、その有声定常区間では第１の周期強調係数の強調度合を強めるように構成したので、主観的に品質の高い符号化音声を得ることができる効果がある。
【０１３１】
この発明によれば、駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、出力音声の雑音的な音質が軽減され、また、出力音声がパルス的な音質になることが回避され、主観的に品質の高い符号化音声を得ることができる効果がある。
【０１３２】
この発明によれば、駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用するように構成したので、周期化後の駆動符号ベクトルのパワー分布の偏りが軽減し、主観的に品質の高い符号化音声を得ることができる効果がある。
【図面の簡単な説明】
【図１】この発明の実施の形態１による音声符号化装置を示す構成図である。
【図２】駆動音源符号化手段の内部を示す構成図である。
【図３】この発明の実施の形態１による音声復号化装置を示す構成図である。
【図４】駆動音源復号化手段の内部を示す構成図である。
【図５】駆動符号ベクトルに対する周期強調の説明図である。
【図６】この発明の実施の形態２による音声符号化装置を示す構成図である。
【図７】駆動音源符号化手段の内部を示す構成図である。
【図８】この発明の実施の形態２による音声復号化装置を示す構成図である。
【図９】駆動音源復号化手段の内部を示す構成図である。
【図１０】駆動音源符号化手段の内部を示す構成図である。
【図１１】この発明の実施の形態３による音声復号化装置を示す構成図である。
【図１２】駆動音源復号化手段の内部を示す構成図である。
【図１３】従来のＣＥＬＰ系の音声符号化装置を示す構成図である。
【図１４】駆動音源符号化手段の内部を示す構成図である。
【図１５】従来のＣＥＬＰ系の音声復号化装置を示す構成図である。
【図１６】駆動音源復号化手段の内部を示す構成図である。
【図１７】周期化手段を備える駆動音源符号化手段の内部を示す構成図である。
【図１８】周期化手段を備える駆動音源復号化手段の内部を示す構成図である。
【図１９】駆動符号ベクトルに対する周期強調の説明図である。
【符号の説明】
１線形予測分析手段、２線形予測係数符号化手段、３適応音源符号化手段、４駆動音源符号化手段、５ゲイン符号化手段、６多重化手段、１１駆動音源符号帳、１２合成フィルタ、１３歪み計算手段、１４歪み評価手段、２１分離手段、２２線形予測係数復号化手段、２３適応音源復号化手段、２４駆動音源復号化手段、２５ゲイン復号化手段、２６乗算器、２７乗算器、２８加算器、２９合成フィルタ、３１駆動音源符号帳、４１線形予測分析手段（スペクトル包絡情報符号化手段）、４２線形予測係数符号化手段（スペクトル包絡情報符号化手段）、４３適応音源符号化手段（音源情報符号化手段）、４４駆動音源符号化手段（音源情報符号化手段）、４５ゲイン符号化手段（音源情報符号化手段）、４６多重化手段、４７駆動音源符号化手段（音源情報符号化手段）、４８ゲイン符号化手段（音源情報符号化手段）、４９多重化手段、５１周期強調係数計算手段、５２周期強調係数符号化手段、５３、８２第１の駆動音源符号帳、５４、８３第１の周期化手段、５５第１の合成フィルタ、５６第１の歪み計算手段、５７、８４第２の駆動音源符号帳、５８、８５第２の周期化手段、５９第２の合成フィルタ、６０第２の歪み計算手段、６１歪み評価手段、６２、８６周期強調係数計算手段、６３、８７音声様態判定手段、６４、８８周期強調係数計算手段、７１分離手段、７２線形予測係数復号化手段（スペクトル包絡情報復号化手段）、７３適応音源復号化手段（音源情報復号化手段）、７４駆動音源復号化手段（音源情報復号化手段）、７５ゲイン復号化手段（音源情報復号化手段）、７６、７７乗算器（音源情報復号化手段）、７８加算器（音源情報復号化手段）、７９合成フィルタ、８０駆動音源復号化手段（音源情報復号化手段）、８１周期強調係数復号化手段、９１駆動音源復号化手段（音源情報復号化手段）。

Claims

入力音声のスペクトル包絡情報を抽出し、そのスペクトル包絡情報を符号化するスペクトル包絡情報符号化手段と、上記スペクトル包絡情報符号化手段により抽出されたスペクトル包絡情報を用いて符号化歪みが最小になる合成音を生成する適応音源符号、駆動音源符号及びゲイン符号を決定する音源情報符号化手段と、上記スペクトル包絡情報符号化手段により符号化されたスペクトル包絡情報と上記音源情報符号化手段により決定された適応音源符号、駆動音源符号及びゲイン符号とを多重化して音声符号を出力する多重化手段とを備えた音声符号化装置において、上記音源情報符号化手段は複数の駆動音源符号帳に格納されている駆動符号ベクトルの符号化歪みを評価して駆動音源符号を決定する駆動音源符号化手段を備えるとともに、その駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化手段と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化手段とを備えることを特徴とする音声符号化装置。
入力音声のスペクトル包絡情報を抽出し、そのスペクトル包絡情報を符号化するスペクトル包絡情報符号化工程と、上記スペクトル包絡情報符号化工程で抽出されたスペクトル包絡情報を用いて符号化歪みが最小になる合成音を生成する適応音源符号、駆動音源符号及びゲイン符号を決定する音源情報符号化工程と、上記スペクトル包絡情報符号化工程で符号化されたスペクトル包絡情報と上記音源情報符号化工程で決定された適応音源符号、駆動音源符号及びゲイン符号とを多重化して音声符号を出力する多重化工程とを備えた音声符号化方法において、上記音源情報符号化工程では複数の駆動音源符号帳に格納されている駆動符号ベクトルの符号化歪みを評価して駆動音源符号を決定する駆動音源符号化工程を備えるとともに、その駆動符号ベクトルの符号化歪みを評価する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化工程と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化工程とを備えることを特徴とする音声符号化方法。
入力音声を分析して第１の周期強調係数を決定することを特徴とする請求項２記載の音声符号化方法。
音声符号から第１の周期強調係数を決定することを特徴とする請求項２記載の音声符号化方法。
音声の様態を判定し、その判定結果に応じて第１の周期強調係数を決定することを特徴とする請求項３または請求項４記載の音声符号化方法。
音声の摩擦音区間を判定し、その摩擦音区間では第１の周期強調係数の強調度合を弱めることを特徴とする請求項５記載の音声符号化方法。
音声の有声定常区間を判定し、その有声定常区間では第１の周期強調係数の強調度合を強めることを特徴とする請求項５記載の音声符号化方法。
駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用することを特徴とする請求項２から請求項７のうちのいずれか１項記載の音声符号化方法。
駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用することを特徴とする請求項２から請求項７のうちのいずれか１項記載の音声符号化方法。
音声符号からスペクトル包絡情報と音源情報である適応音源符号、駆動音源符号及びゲイン符号を分離する分離手段と、上記分離手段により分離されたスペクトル包絡情報を復号化するスペクトル包絡情報復号化手段と、上記分離手段により分離された適応音源符号、駆動音源符号及びゲイン符号から音源信号を復号化する音源情報復号化手段とを備えた音声復号化装置において、上記音源情報復号化手段は複数の駆動音源符号帳に格納されている駆動符号ベクトルの中から駆動音源符号に対応する駆動符号ベクトルを抽出する駆動音源復号化手段を備えるとともに、その駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化手段と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化手段とを備えることを特徴とする音声復号化装置。
音声符号からスペクトル包絡情報と音源情報である適応音源符号、駆動音源符号及びゲイン符号を分離する分離工程と、上記分離工程で分離されたスペクトル包絡情報を復号化するスペクトル包絡情報復号化工程と、上記分離工程で分離された適応音源符号、駆動音源符号及びゲイン符号から音源信号を復号化する音源情報復号化工程とを備えた音声復号化方法において、上記音源情報復号化工程では複数の駆動音源符号帳に格納されている駆動符号ベクトルの中から駆動音源符号に対応する駆動符号ベクトルを抽出する駆動音源復号化工程を備えるとともに、その駆動音源符号に対応する駆動符号ベクトルを抽出する際、所定の規則に基づいて適応的に求めた第１の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第１の周期化工程と、予め設定された第２の周期強調係数を用いて、少なくとも一つ以上の駆動音源符号帳が出力する駆動符号ベクトルの周期性を強調する第２の周期化工程とを備えることを特徴とする音声復号化方法。
音声符号に含まれている周期強調係数の符号を復号化して第１の周期強調係数を求めることを特徴とする請求項１１記載の音声復号化方法。
音声符号から第１の周期強調係数を決定することを特徴とする請求項１１記載の音声復号化方法。
音声の様態を判定し、その判定結果に応じて第１の周期強調係数を決定することを特徴とする請求項１３記載の音声復号化方法。
音声の摩擦音区間を判定し、その摩擦音区間では第１の周期強調係数の強調度合を弱めることを特徴とする請求項１４記載の音声復号化方法。
音声の有声定常区間を判定し、その有声定常区間では第１の周期強調係数の強調度合を強めることを特徴とする請求項１４記載の音声復号化方法。
駆動音源符号帳が格納する駆動符号ベクトルの雑音性の度合に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用することを特徴とする請求項１１から請求項１６のうちのいずれか１項記載の音声復号化方法。
駆動音源符号帳が格納する駆動符号ベクトルの時間的なパワー分布に応じて、第１の周期化工程又は第２の周期化工程の何れか一方を当該駆動音源符号帳に適用することを特徴とする請求項１１から請求項１６のうちのいずれか１項記載の音声復号化方法。