JPH1020896A

JPH1020896A - コード駆動線形予測音声符号化方式

Info

Publication number: JPH1020896A
Application number: JP8195632A
Authority: JP
Inventors: Koichi Shibagaki; 鋼一柴垣
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1996-07-05
Filing date: 1996-07-05
Publication date: 1998-01-23
Anticipated expiration: 2016-07-05
Also published as: JP3092519B2

Abstract

(57)【要約】【課題】有音時の定常区間では符号を生成しないことに
よって情報量を圧縮し、符号化効率を向上するコード駆
動線形予測音声符号化方式の提供。【解決手段】符号化器においては、有音と判定されたフ
レームＡにおいては、定常区間判定器８にてフレームＡ
のパワーとピッチを定常区間開始フレームのパワーとピ
ッチを比較し、パワーとピッチとも同一の場合には、フ
レームＡを定常区間と判定し、符号情報を伝送せず、復
合化器では、符号情報が伝送されてきた時に合成された
音声をメモリに格納しておき、符号情報が伝送されてこ
ない時には、メモリに格納された合成音声をピッチだけ
ずらしていって合成音声を生成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、コード駆動線形予
測音声符号化方式に関し、特に、情報量の低減方式に関
する。

【０００２】

【従来の技術】この種の従来の音声符号化方式として、
例えば特開平６−１２０９８号公報には、符号化の対象
となる音声が有声音か無声音かを予測残差信号に基づい
て駆動音源の生成処理部を選択することにより、計算
量、ビットレートの低減、再生音声の音質向上を図る音
声符号化装置として、コード駆動線形予測（ＣＥＬＰ）
音声符号化方式における、駆動音源生成処理について、
有声音声の場合、ピッチ周期に対応したパルスパターン
信号と、最新の過去の所定時間に記憶された駆動音源信
号と、雑音信号と、の３者のそれぞれに所定のゲインを
乗じた後加算してなる有声駆動音源を生成し、無声音声
の場合、最新の過去の所定時間に記憶された駆動音源信
号と、雑音信号と、の２者にそれぞれ所定のゲインを乗
じて加算してなる無声駆動音源を生成する方式が提案さ
れている。

【０００３】また特開平４−２７０３９７号公報には、
８〜４ｋｂ／ｓ程度の音声符号化方式において、適応コ
ードブックの滑らかな遅延パターンを得ると共に、ＣＥ
ＬＰ系の音声符号化方式の問題点であった雑音感を抑え
ることにより、音質を向上させる音声符号化方式とし
て、コード駆動線形予測音声符号化方式に関し、フレー
ム毎に有声性の判定を行い、有声性と判定されたフレー
ムではコードブック探索を行う時に、過去の音源を遅延
させた音源に、その遅延に応じたコムフィルタを掛け、
コムフィルタの出力と重み付け信号との２乗誤差が最小
になる遅延を求めるようにした方式が提案されている。
この場合、有声性と判定されなかったフレームでは、コ
ムフィルタを使用しない。上記方法により、雑音感を抑
え、音質を向上させる。

【０００４】

【発明が解決しようとする課題】上記従来のコード駆動
線形予測音声符号化方式の問題点として、有音部の定常
区間においては冗長度が高く、符号化効率が悪い、とい
うことがある。

【０００５】その理由は、有音部の定常区間において
は、音声波形に、ほとんど変化がないにもかかわらず、
非定常区間と同じ情報量を割り当てているためである。

【０００６】従って、本発明は、上記問題点に鑑みてな
されたものであって、その目的は、ピッチ情報を用いる
コード駆動線形予測音声符号化方式（ＣＥＬＰ音声符号
化方式）において、有音時の定常区間では、符号情報を
生成しないように構成することによって、情報量を圧縮
する音声符号化方式を提供することにある。

【０００７】

【課題を解決するための手段】前記目的を達成するた
め、本発明に係る音声符号化方式は、符号化側におい
て、有音と判定されたフレームについては、該フレーム
のパワー及びピッチを定常区間開始フレームのパワー及
びピッチを比較し、前記パワー及びピッチが前記定常区
間開始フレームのものと同一の場合には、前記フレーム
を定常区間と判定して符号情報を伝送せず、復号側にお
いては、符号情報が伝送されてきた時に合成された音声
を記憶部に格納しておき、前記符号情報が伝送されてこ
ない時には、前記記憶部に格納された合成音声をピッチ
だけずらしていくことによって合成音声を生成する、こ
とを特徴とする。

【０００８】

【発明の実施の形態】本発明の好ましい実施の形態を以
下に説明する。本発明は、好ましい実施の形態として、
ピッチ情報を用いるコード駆動線形予測音声符号化方式
であって、符号化側では、線形予測分析器（図１の１）
による線形予測フィルタ係数の算出、ピッチ抽出器（図
１の２）によるピッチ情報の算出、コードブック探索器
（図１の３）によるコード探索、パワー算出器（図１の
５）によるパワー検出、有音検出器（図１の６）による
有音検出から、有音と判定されたフレームＡについて
は、定常区間判定器（図１の８）で、フレームＡのパワ
ーとピッチを定常区間開始フレームのパワーとピッチと
比較する。

【０００９】そして、（１）パワーとピッチとも同一の
場合には、フレームＡを定常区間と判定し、定常区間開
始フレームは変更せず、線形予測フィルタ係数、ピッチ
情報およびコードブック探索によって求められたコード
情報を含む符号情報Ｂは伝送しない。

【００１０】（２）パワーとピッチのいずれか１つでも
異なる場合には、上記フレームＡを非定常区間と判定
し、フレームＡを新たに定常区間開始フレームとし、符
号情報を伝送し、有音でないと判定されたフレームＡに
おいては、フレームを非定常区間と判定し、フレームＡ
を新たに定常区間開始フレームとし、符号情報Ｂを伝送
する。

【００１１】一方、復号側では、符号情報Ｂが伝送され
てきた場合には、コード情報に従って、コードブックか
らコードを読み出すことにより、第１の駆動信号を合成
し、ピッチ情報からピッチ再生フィルタを構成し、ピッ
チ情報を第１のメモリに書き込み、第１の駆動信号でピ
ッチ再生フィルタを駆動することによって第２の駆動信
号を合成し、線形予測フィルタ係数から線形予測フィル
タを構成し、第２の駆動信号で線形予測フィルタを駆動
することによって合成音声Ｃを生成し、合成音声Ｃを第
２のメモリに書き込み、上記符号情報Ｂが伝送されてこ
ない場合には、第２のメモリに書き込まれた合成音声Ｃ
または後述するＤを、第１のメモリに書き込まれたピッ
チだけずらすことにより、新たに合成音声Ｄを生成し、
この合成音声Ｄを新たに第２のメモリに書き込む、よう
に構成されてなる復号器を具備する。

【００１２】上記した、本発明の実施の形態をさらに詳
細に説明すべく、本発明の実施例を図面を参照して以下
に説明する。

【００１３】図１は、本発明に係るコード駆動線形予測
音声符号化方式における符号化器の一実施例の構成を示
すブロック図である。

【００１４】図１を参照して、本実施例のコード駆動線
形予測音声符号化方式の符号化器においては、符号化器
入力端子１０に入力された音声信号Ｘ（ｎ）は、線形予
測分析器１と、ピッチ抽出器２と、コードブック探索器
３と、パワー算出器５と、有音検出器６と、に供給され
る。

【００１５】線形予測分析器１は、音声信号Ｘ（ｎ）を
線形予測分析し、線形予測フィルタの係数αを求め、こ
れをコードブック探索器３とエンコーダ７に供給する。

【００１６】ピッチ抽出器２は、音声信号Ｘ（ｎ）から
ピッチ情報を抽出し、これをコードブック探索器３とエ
ンコーダ７に供給する。

【００１７】コードブック探索器３は、ピッチ抽出器２
から供給されたピッチ情報からピッチ再生フィルタを構
成し、線形予測分析器１から供給された線形予測フィル
タの係数αから線形予測フィルタを構成し、ピッチ再生
フィルタと線形予測フィルタの縦続フィルタをコードで
駆動した合成音声が原音声に最も近くなるように、コー
ドブック４からコードを探索し、所定の数のコード情報
を求め、エンコーダ７に供給する。

【００１８】パワー算出器５は、音声信号Ｘ（ｎ）のパ
ワーを算出し、定常区間判定器８に供給する。

【００１９】有音検出器６は、音声信号Ｘ（ｎ）の有音
判定を行い、有音判定情報を定常区間判定器８に供給す
る。

【００２０】定常区間判定器８は、有音と判定されたフ
レームＡにおいては、フレームＡのパワーとピッチを、
定常区間開始フレームのパワーとピッチと比較する。

【００２１】比較の結果、（１）パワーとピッチとも同
一の場合には、このフレームＡを定常区間と判定し、定
常区間開始フレームは変更せず、定常区間判定情報（定
常区間）をエンコーダ７に供給する。

【００２２】一方、（２）パワーとピッチのいずれか１
つでも異なる場合には、フレームＡを非定常区間と判定
し、フレームＡを新たに定常区間開始フレームとし、定
常区間判定情報（非定常区間）をエンコーダ７に供給す
る。

【００２３】また有音でないと判定されたフレームＡに
おいては、このフレームＡを非定常区間と判定し、この
フレームＡを新たに定常区間開始フレームとし、定常区
間判定情報（非定常区間）をエンコーダ７に供給する。

【００２４】エンコーダ７では、定常区間判定情報に従
って、非定常区間と判定されたフレームにおいては、線
形予測フィルタ係数αと、ピッチ情報と、コード情報
と、がエンコード（符号化）され、符号化器出力端子１
１から伝送路に出力される。

【００２５】またエンコーダ７では、定常区間判定情報
に従って、定常区間と判定されたフレームにおいては、
符号化器出力端子１１から伝送路に何も出力しない。

【００２６】図２は、本発明に係るコード駆動線形予測
音声符号化方式における復号器の一実施例の構成を示す
ブロック図である。

【００２７】図２を参照すると、本実施例において、
（１）復号器入力端子３０に、符号化器でエンコーダさ
れた線形予測フィルタ係数αとピッチ情報とコード情報
が入力された場合には、以下の処理が行われる。

【００２８】エンコーダされた、線形予測フィルタ係数
αと、ピッチ情報と、コード情報と、が、デコーダ２１
でデコードされ、線形予測フィルタ係数αは線形予測フ
ィルタ２５に供給され、ピッチ情報はピッチ再生フィル
タ２４とメモリ２６に供給され、コード情報は駆動信号
合成器２２に供給される。

【００２９】駆動信号合成器２２は、コード情報に従っ
て、コードブック２３からコードを読み出すことによっ
て、第１の駆動信号を合成し、ピッチ再生フィルタ２４
に供給する。

【００３０】ピッチ再生フィルタ２４は、駆動信号合成
器２２から供給された第１の駆動信号でピッチ再生フィ
ルタを駆動することによって、第２の駆動信号を合成
し、線形予測フィルタ２５に供給する。

【００３１】線形予測フィルタ２５は、ピッチ再生フィ
ルタ２４から供給された第２の駆動信号で線形予測フィ
ルタを駆動することによって、合成音声を生成し、合成
音声をメモリ２７に書き込むと共に復号器出力端子４０
に出力する。

【００３２】（２）復号器入力端子３０に、エンコーダ
された線形予測フィルタ係数αとピッチ情報とコード情
報が入力されない場合には以下の処理が行われる。

【００３３】音声生成部２８において、メモリ２７に書
き込まれた合成音声をメモリ２６に書き込まれたピッチ
だけずらすことによって，新たに合成音声を生成し、合
成音声をメモリ２７に書き込むと共に復号器出力端子４
０に出力する。

【００３４】図３は、復号器入力端子３０に、エンコー
ダされた線形予測フィルタ係数αと、ピッチ情報と、コ
ード情報と、が入力されない場合の合成音声生成方法の
一実施例を説明するための図である。

【００３５】図３を参照して、区間Ｘに、最後に伝送さ
れてきた符号情報から合成された音声を示す。これは、
メモリ２７に書き込まれている。初めて符号情報が伝送
されてこないフレームの先頭のサンプルａｔ０＋Ｔは、
先頭のサンプルからメモリ２６に書き込まれたピッチＴ
だけ前のサンプルａｔ０をコピーし、同様の方法で次々
に、ピッチＴだけ前のサンプルをコピーすることによっ
て、符号情報が伝送されてこないフレーム全体（区間
Ｙ）の合成音声を生成し、メモリ２７に書き込むと共
に、復号器出力端子４０に出力する。

【００３６】次のフレームについても、符号情報が伝送
されてこない場合には、メモリ２７に書き込まれた合成
音声から、新たな合成音声を生成し、新たな合成音声を
メモリ２７に書き込むと共に、復号器出力端子４０に出
力する。

【００３７】

【発明の効果】以上説明したように、本発明によれば、
ピッチ情報を用いるコード駆動線形予測音声符号化方式
（ＣＥＬＰ音声符号化方式）において、有音時の定常区
間では、符号情報を生成しないことにより情報量を圧縮
することができる。

【００３８】その理由は、復号器において、有音時の定
常区間で符号情報が伝送されてこない場合には、最後に
伝送されてきた符号情報から合成された音声を、ピッチ
だけずらしていくことによって音声を合成するように、
構成したことによる。

【図面の簡単な説明】

【図１】本発明に係るコード駆動線形予測音声符号化方
式における符号化器の一実施例の構成を示すブロック図
である。

【図２】本発明に係るコード駆動線形予測音声符号化方
式における復号器の一実施例の構成を示すブロック図で
ある。

【図３】本発明の実施例の動作を説明するための図であ
り、本発明に係るコード駆動線形予測音声符号化方式の
復号器において、符号情報が入力されない場合の合成音
声生成方法を説明するための図である。

【符号の説明】

１線形予測分析器２ピッチ抽出器３コードブック探索器４コードブック５パワー算出器６有音検出器７エンコーダ８定常区間判定器１０符号化器入力端子１１符号化器出力端子２１デコーダ２２駆動信号合成器２３コードブック２４ピッチ再生フィルタ２５線形予測フィルタ２６メモリ２７メモリ２８音声生成部３０復号器入力端子４０復号器出力端子

Claims

【特許請求の範囲】

【請求項１】符号化側において、有音と判定されたフレ
ームについては、該フレームのパワー及びピッチを、定
常区間開始フレームのパワー及びピッチと比較し、前記
フレームのパワー及びピッチが前記定常区間開始フレー
ムのものと同一の場合には、前記フレームを定常区間と
判定して符号情報を伝送せず、復号側においては、符号情報が伝送されてきた時に合成
された音声を記憶部に格納しておき、前記符号情報が伝
送されてこない時には、前記記憶部に格納された合成音
声をピッチだけずらしていくことによって合成音声を生
成する、ことを特徴とするコード駆動線形予測音声符号化方式。
【請求項２】有音と判定されたフレームについては、該
フレームのパワー及びピッチを定常区間開始フレームの
パワー及びピッチを比較し、前記フレームのパワー及び
ピッチが前記定常区間開始フレームのものと同一の場合
には、前記フレームを定常区間と判定して符号情報を伝
送しないように構成されてなる符号化器を含むことを特
徴とするコード駆動線形予測音声符号化方式。
【請求項３】符号情報が伝送されてきた時に合成された
音声を記憶部に格納しておき、前記符号情報が伝送され
て来ない時には、前記記憶部に格納された合成音声をピ
ッチだけずらしていくことによって合成音声を生成する
復号器を含むことを特徴とするコード駆動線形予測音声
符号化方式。
【請求項４】前記復号器が、有音時の定常区間で符号情
報が伝送されてこない場合には、最後に伝送されてきた
符号情報から合成されて音声をピッチだけずらしていく
ことによって合成音声を生成することを特徴とする請求
項３記載のコード駆動線形予測音声符号化方式。
【請求項５】ピッチ情報を用いるコード駆動線形予測音
声符号化方式であって、符号化側では、線形予測フィルタ係数の算出と、ピッチ
情報の算出と、コードブックの探索と、パワーの検出
と、有音の検出と、を行い、有音と判定されたフレームについて、該フレームのパワ
ー及びピッチを、定常区間開始フレームのパワー及びピ
ッチと比較し、比較の結果、パワー及びピッチがともに同一の場合に
は、前記フレームを定常区間と判定し、定常区間開始フ
レームは変更せず、前記線形予測フィルタ係数、前記ピ
ッチ情報、および前記コードブック探索によって求めら
れたコード情報を含む符号情報を伝送せず、一方、パワーとピッチの少なくとも一つが異なる場合に
は、前記フレームを非定常区間と判定し、前記フレーム
を新たに定常区間開始フレームとして、前記符号情報を
伝送し、有音でないと判定されたフレームについては、前記フレ
ームを非定常区間と判定し、前記フレームを新たに定常
区間開始フレームとして、前記符号情報を伝送する符号
化器を具備し、復号側では、前記符号情報が伝送されてきた場合には、前記コード情報に従って、コードブックからコードを読
み出すことによって、第１の駆動信号を合成し、前記ピッチ情報からピッチ再生フィルタを構成し、前記ピッチ情報を第１の記憶部に書き込み、前記第１の駆動信号で前記ピッチ再生フィルタを駆動す
ることによって第２の駆動信号を合成し、前記線形予測フィルタ係数から線形予測フィルタを構成
し、前記第２の駆動信号で前記線形予測フィルタを駆動する
ことによって、合成音声を生成し、前記合成音声を第２
の記憶部に書き込み、前記符号情報が伝送されてこない場合には、前記第２の記憶部に書き込まれた合成音声を前記第１の
記憶部に書き込まれたピッチだけずらすことにより、新
たに合成音声を生成し、新たな合成音声を新たに第２の
記憶部に書き込む復号器を具備することを特徴とするコ
ード駆動線形予測音声符号化方式。