JPH1020896A - コード駆動線形予測音声符号化方式 - Google Patents

コード駆動線形予測音声符号化方式

Info

Publication number
JPH1020896A
JPH1020896A JP8195632A JP19563296A JPH1020896A JP H1020896 A JPH1020896 A JP H1020896A JP 8195632 A JP8195632 A JP 8195632A JP 19563296 A JP19563296 A JP 19563296A JP H1020896 A JPH1020896 A JP H1020896A
Authority
JP
Japan
Prior art keywords
pitch
frame
code
code information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8195632A
Other languages
English (en)
Other versions
JP3092519B2 (ja
Inventor
Koichi Shibagaki
鋼一 柴垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP08195632A priority Critical patent/JP3092519B2/ja
Publication of JPH1020896A publication Critical patent/JPH1020896A/ja
Application granted granted Critical
Publication of JP3092519B2 publication Critical patent/JP3092519B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】有音時の定常区間では符号を生成しないことに
よって情報量を圧縮し、符号化効率を向上するコード駆
動線形予測音声符号化方式の提供。 【解決手段】符号化器においては、有音と判定されたフ
レームAにおいては、定常区間判定器8にてフレームA
のパワーとピッチを定常区間開始フレームのパワーとピ
ッチを比較し、パワーとピッチとも同一の場合には、フ
レームAを定常区間と判定し、符号情報を伝送せず、復
合化器では、符号情報が伝送されてきた時に合成された
音声をメモリに格納しておき、符号情報が伝送されてこ
ない時には、メモリに格納された合成音声をピッチだけ
ずらしていって合成音声を生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、コード駆動線形予
測音声符号化方式に関し、特に、情報量の低減方式に関
する。
【0002】
【従来の技術】この種の従来の音声符号化方式として、
例えば特開平6−12098号公報には、符号化の対象
となる音声が有声音か無声音かを予測残差信号に基づい
て駆動音源の生成処理部を選択することにより、計算
量、ビットレートの低減、再生音声の音質向上を図る音
声符号化装置として、コード駆動線形予測(CELP)
音声符号化方式における、駆動音源生成処理について、
有声音声の場合、ピッチ周期に対応したパルスパターン
信号と、最新の過去の所定時間に記憶された駆動音源信
号と、雑音信号と、の3者のそれぞれに所定のゲインを
乗じた後加算してなる有声駆動音源を生成し、無声音声
の場合、最新の過去の所定時間に記憶された駆動音源信
号と、雑音信号と、の2者にそれぞれ所定のゲインを乗
じて加算してなる無声駆動音源を生成する方式が提案さ
れている。
【0003】また特開平4−270397号公報には、
8〜4kb/s程度の音声符号化方式において、適応コ
ードブックの滑らかな遅延パターンを得ると共に、CE
LP系の音声符号化方式の問題点であった雑音感を抑え
ることにより、音質を向上させる音声符号化方式とし
て、コード駆動線形予測音声符号化方式に関し、フレー
ム毎に有声性の判定を行い、有声性と判定されたフレー
ムではコードブック探索を行う時に、過去の音源を遅延
させた音源に、その遅延に応じたコムフィルタを掛け、
コムフィルタの出力と重み付け信号との2乗誤差が最小
になる遅延を求めるようにした方式が提案されている。
この場合、有声性と判定されなかったフレームでは、コ
ムフィルタを使用しない。上記方法により、雑音感を抑
え、音質を向上させる。
【0004】
【発明が解決しようとする課題】上記従来のコード駆動
線形予測音声符号化方式の問題点として、有音部の定常
区間においては冗長度が高く、符号化効率が悪い、とい
うことがある。
【0005】その理由は、有音部の定常区間において
は、音声波形に、ほとんど変化がないにもかかわらず、
非定常区間と同じ情報量を割り当てているためである。
【0006】従って、本発明は、上記問題点に鑑みてな
されたものであって、その目的は、ピッチ情報を用いる
コード駆動線形予測音声符号化方式(CELP音声符号
化方式)において、有音時の定常区間では、符号情報を
生成しないように構成することによって、情報量を圧縮
する音声符号化方式を提供することにある。
【0007】
【課題を解決するための手段】前記目的を達成するた
め、本発明に係る音声符号化方式は、符号化側におい
て、有音と判定されたフレームについては、該フレーム
のパワー及びピッチを定常区間開始フレームのパワー及
びピッチを比較し、前記パワー及びピッチが前記定常区
間開始フレームのものと同一の場合には、前記フレーム
を定常区間と判定して符号情報を伝送せず、復号側にお
いては、符号情報が伝送されてきた時に合成された音声
を記憶部に格納しておき、前記符号情報が伝送されてこ
ない時には、前記記憶部に格納された合成音声をピッチ
だけずらしていくことによって合成音声を生成する、こ
とを特徴とする。
【0008】
【発明の実施の形態】本発明の好ましい実施の形態を以
下に説明する。本発明は、好ましい実施の形態として、
ピッチ情報を用いるコード駆動線形予測音声符号化方式
であって、符号化側では、線形予測分析器(図1の1)
による線形予測フィルタ係数の算出、ピッチ抽出器(図
1の2)によるピッチ情報の算出、コードブック探索器
(図1の3)によるコード探索、パワー算出器(図1の
5)によるパワー検出、有音検出器(図1の6)による
有音検出から、有音と判定されたフレームAについて
は、定常区間判定器(図1の8)で、フレームAのパワ
ーとピッチを定常区間開始フレームのパワーとピッチと
比較する。
【0009】そして、(1)パワーとピッチとも同一の
場合には、フレームAを定常区間と判定し、定常区間開
始フレームは変更せず、線形予測フィルタ係数、ピッチ
情報およびコードブック探索によって求められたコード
情報を含む符号情報Bは伝送しない。
【0010】(2)パワーとピッチのいずれか1つでも
異なる場合には、上記フレームAを非定常区間と判定
し、フレームAを新たに定常区間開始フレームとし、符
号情報を伝送し、有音でないと判定されたフレームAに
おいては、フレームを非定常区間と判定し、フレームA
を新たに定常区間開始フレームとし、符号情報Bを伝送
する。
【0011】一方、復号側では、符号情報Bが伝送され
てきた場合には、コード情報に従って、コードブックか
らコードを読み出すことにより、第1の駆動信号を合成
し、ピッチ情報からピッチ再生フィルタを構成し、ピッ
チ情報を第1のメモリに書き込み、第1の駆動信号でピ
ッチ再生フィルタを駆動することによって第2の駆動信
号を合成し、線形予測フィルタ係数から線形予測フィル
タを構成し、第2の駆動信号で線形予測フィルタを駆動
することによって合成音声Cを生成し、合成音声Cを第
2のメモリに書き込み、上記符号情報Bが伝送されてこ
ない場合には、第2のメモリに書き込まれた合成音声C
または後述するDを、第1のメモリに書き込まれたピッ
チだけずらすことにより、新たに合成音声Dを生成し、
この合成音声Dを新たに第2のメモリに書き込む、よう
に構成されてなる復号器を具備する。
【0012】上記した、本発明の実施の形態をさらに詳
細に説明すべく、本発明の実施例を図面を参照して以下
に説明する。
【0013】図1は、本発明に係るコード駆動線形予測
音声符号化方式における符号化器の一実施例の構成を示
すブロック図である。
【0014】図1を参照して、本実施例のコード駆動線
形予測音声符号化方式の符号化器においては、符号化器
入力端子10に入力された音声信号X(n)は、線形予
測分析器1と、ピッチ抽出器2と、コードブック探索器
3と、パワー算出器5と、有音検出器6と、に供給され
る。
【0015】線形予測分析器1は、音声信号X(n)を
線形予測分析し、線形予測フィルタの係数αを求め、こ
れをコードブック探索器3とエンコーダ7に供給する。
【0016】ピッチ抽出器2は、音声信号X(n)から
ピッチ情報を抽出し、これをコードブック探索器3とエ
ンコーダ7に供給する。
【0017】コードブック探索器3は、ピッチ抽出器2
から供給されたピッチ情報からピッチ再生フィルタを構
成し、線形予測分析器1から供給された線形予測フィル
タの係数αから線形予測フィルタを構成し、ピッチ再生
フィルタと線形予測フィルタの縦続フィルタをコードで
駆動した合成音声が原音声に最も近くなるように、コー
ドブック4からコードを探索し、所定の数のコード情報
を求め、エンコーダ7に供給する。
【0018】パワー算出器5は、音声信号X(n)のパ
ワーを算出し、定常区間判定器8に供給する。
【0019】有音検出器6は、音声信号X(n)の有音
判定を行い、有音判定情報を定常区間判定器8に供給す
る。
【0020】定常区間判定器8は、有音と判定されたフ
レームAにおいては、フレームAのパワーとピッチを、
定常区間開始フレームのパワーとピッチと比較する。
【0021】比較の結果、(1)パワーとピッチとも同
一の場合には、このフレームAを定常区間と判定し、定
常区間開始フレームは変更せず、定常区間判定情報(定
常区間)をエンコーダ7に供給する。
【0022】一方、(2)パワーとピッチのいずれか1
つでも異なる場合には、フレームAを非定常区間と判定
し、フレームAを新たに定常区間開始フレームとし、定
常区間判定情報(非定常区間)をエンコーダ7に供給す
る。
【0023】また有音でないと判定されたフレームAに
おいては、このフレームAを非定常区間と判定し、この
フレームAを新たに定常区間開始フレームとし、定常区
間判定情報(非定常区間)をエンコーダ7に供給する。
【0024】エンコーダ7では、定常区間判定情報に従
って、非定常区間と判定されたフレームにおいては、線
形予測フィルタ係数αと、ピッチ情報と、コード情報
と、がエンコード(符号化)され、符号化器出力端子1
1から伝送路に出力される。
【0025】またエンコーダ7では、定常区間判定情報
に従って、定常区間と判定されたフレームにおいては、
符号化器出力端子11から伝送路に何も出力しない。
【0026】図2は、本発明に係るコード駆動線形予測
音声符号化方式における復号器の一実施例の構成を示す
ブロック図である。
【0027】図2を参照すると、本実施例において、
(1)復号器入力端子30に、符号化器でエンコーダさ
れた線形予測フィルタ係数αとピッチ情報とコード情報
が入力された場合には、以下の処理が行われる。
【0028】エンコーダされた、線形予測フィルタ係数
αと、ピッチ情報と、コード情報と、が、デコーダ21
でデコードされ、線形予測フィルタ係数αは線形予測フ
ィルタ25に供給され、ピッチ情報はピッチ再生フィル
タ24とメモリ26に供給され、コード情報は駆動信号
合成器22に供給される。
【0029】駆動信号合成器22は、コード情報に従っ
て、コードブック23からコードを読み出すことによっ
て、第1の駆動信号を合成し、ピッチ再生フィルタ24
に供給する。
【0030】ピッチ再生フィルタ24は、駆動信号合成
器22から供給された第1の駆動信号でピッチ再生フィ
ルタを駆動することによって、第2の駆動信号を合成
し、線形予測フィルタ25に供給する。
【0031】線形予測フィルタ25は、ピッチ再生フィ
ルタ24から供給された第2の駆動信号で線形予測フィ
ルタを駆動することによって、合成音声を生成し、合成
音声をメモリ27に書き込むと共に復号器出力端子40
に出力する。
【0032】(2)復号器入力端子30に、エンコーダ
された線形予測フィルタ係数αとピッチ情報とコード情
報が入力されない場合には以下の処理が行われる。
【0033】音声生成部28において、メモリ27に書
き込まれた合成音声をメモリ26に書き込まれたピッチ
だけずらすことによって,新たに合成音声を生成し、合
成音声をメモリ27に書き込むと共に復号器出力端子4
0に出力する。
【0034】図3は、復号器入力端子30に、エンコー
ダされた線形予測フィルタ係数αと、ピッチ情報と、コ
ード情報と、が入力されない場合の合成音声生成方法の
一実施例を説明するための図である。
【0035】図3を参照して、区間Xに、最後に伝送さ
れてきた符号情報から合成された音声を示す。これは、
メモリ27に書き込まれている。初めて符号情報が伝送
されてこないフレームの先頭のサンプルat0+Tは、
先頭のサンプルからメモリ26に書き込まれたピッチT
だけ前のサンプルat0をコピーし、同様の方法で次々
に、ピッチTだけ前のサンプルをコピーすることによっ
て、符号情報が伝送されてこないフレーム全体(区間
Y)の合成音声を生成し、メモリ27に書き込むと共
に、復号器出力端子40に出力する。
【0036】次のフレームについても、符号情報が伝送
されてこない場合には、メモリ27に書き込まれた合成
音声から、新たな合成音声を生成し、新たな合成音声を
メモリ27に書き込むと共に、復号器出力端子40に出
力する。
【0037】
【発明の効果】以上説明したように、本発明によれば、
ピッチ情報を用いるコード駆動線形予測音声符号化方式
(CELP音声符号化方式)において、有音時の定常区
間では、符号情報を生成しないことにより情報量を圧縮
することができる。
【0038】その理由は、復号器において、有音時の定
常区間で符号情報が伝送されてこない場合には、最後に
伝送されてきた符号情報から合成された音声を、ピッチ
だけずらしていくことによって音声を合成するように、
構成したことによる。
【図面の簡単な説明】
【図1】本発明に係るコード駆動線形予測音声符号化方
式における符号化器の一実施例の構成を示すブロック図
である。
【図2】本発明に係るコード駆動線形予測音声符号化方
式における復号器の一実施例の構成を示すブロック図で
ある。
【図3】本発明の実施例の動作を説明するための図であ
り、本発明に係るコード駆動線形予測音声符号化方式の
復号器において、符号情報が入力されない場合の合成音
声生成方法を説明するための図である。
【符号の説明】
1 線形予測分析器 2 ピッチ抽出器 3 コードブック探索器 4 コードブック 5 パワー算出器 6 有音検出器 7 エンコーダ 8 定常区間判定器 10 符号化器入力端子 11 符号化器出力端子 21 デコーダ 22 駆動信号合成器 23 コードブック 24 ピッチ再生フィルタ 25 線形予測フィルタ 26 メモリ 27 メモリ 28 音声生成部 30 復号器入力端子 40 復号器出力端子

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】符号化側において、有音と判定されたフレ
    ームについては、該フレームのパワー及びピッチを、定
    常区間開始フレームのパワー及びピッチと比較し、前記
    フレームのパワー及びピッチが前記定常区間開始フレー
    ムのものと同一の場合には、前記フレームを定常区間と
    判定して符号情報を伝送せず、 復号側においては、符号情報が伝送されてきた時に合成
    された音声を記憶部に格納しておき、前記符号情報が伝
    送されてこない時には、前記記憶部に格納された合成音
    声をピッチだけずらしていくことによって合成音声を生
    成する、 ことを特徴とするコード駆動線形予測音声符号化方式。
  2. 【請求項2】有音と判定されたフレームについては、該
    フレームのパワー及びピッチを定常区間開始フレームの
    パワー及びピッチを比較し、前記フレームのパワー及び
    ピッチが前記定常区間開始フレームのものと同一の場合
    には、前記フレームを定常区間と判定して符号情報を伝
    送しないように構成されてなる符号化器を含むことを特
    徴とするコード駆動線形予測音声符号化方式。
  3. 【請求項3】符号情報が伝送されてきた時に合成された
    音声を記憶部に格納しておき、前記符号情報が伝送され
    て来ない時には、前記記憶部に格納された合成音声をピ
    ッチだけずらしていくことによって合成音声を生成する
    復号器を含むことを特徴とするコード駆動線形予測音声
    符号化方式。
  4. 【請求項4】前記復号器が、有音時の定常区間で符号情
    報が伝送されてこない場合には、最後に伝送されてきた
    符号情報から合成されて音声をピッチだけずらしていく
    ことによって合成音声を生成することを特徴とする請求
    項3記載のコード駆動線形予測音声符号化方式。
  5. 【請求項5】ピッチ情報を用いるコード駆動線形予測音
    声符号化方式であって、 符号化側では、線形予測フィルタ係数の算出と、ピッチ
    情報の算出と、コードブックの探索と、パワーの検出
    と、有音の検出と、を行い、 有音と判定されたフレームについて、該フレームのパワ
    ー及びピッチを、定常区間開始フレームのパワー及びピ
    ッチと比較し、 比較の結果、パワー及びピッチがともに同一の場合に
    は、前記フレームを定常区間と判定し、定常区間開始フ
    レームは変更せず、前記線形予測フィルタ係数、前記ピ
    ッチ情報、および前記コードブック探索によって求めら
    れたコード情報を含む符号情報を伝送せず、 一方、パワーとピッチの少なくとも一つが異なる場合に
    は、前記フレームを非定常区間と判定し、前記フレーム
    を新たに定常区間開始フレームとして、前記符号情報を
    伝送し、 有音でないと判定されたフレームについては、前記フレ
    ームを非定常区間と判定し、前記フレームを新たに定常
    区間開始フレームとして、前記符号情報を伝送する符号
    化器を具備し、 復号側では、前記符号情報が伝送されてきた場合には、 前記コード情報に従って、コードブックからコードを読
    み出すことによって、第1の駆動信号を合成し、 前記ピッチ情報からピッチ再生フィルタを構成し、 前記ピッチ情報を第1の記憶部に書き込み、 前記第1の駆動信号で前記ピッチ再生フィルタを駆動す
    ることによって第2の駆動信号を合成し、 前記線形予測フィルタ係数から線形予測フィルタを構成
    し、 前記第2の駆動信号で前記線形予測フィルタを駆動する
    ことによって、合成音声を生成し、前記合成音声を第2
    の記憶部に書き込み、 前記符号情報が伝送されてこない場合には、 前記第2の記憶部に書き込まれた合成音声を前記第1の
    記憶部に書き込まれたピッチだけずらすことにより、新
    たに合成音声を生成し、新たな合成音声を新たに第2の
    記憶部に書き込む復号器を具備することを特徴とするコ
    ード駆動線形予測音声符号化方式。
JP08195632A 1996-07-05 1996-07-05 コード駆動線形予測音声符号化方式 Expired - Fee Related JP3092519B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP08195632A JP3092519B2 (ja) 1996-07-05 1996-07-05 コード駆動線形予測音声符号化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP08195632A JP3092519B2 (ja) 1996-07-05 1996-07-05 コード駆動線形予測音声符号化方式

Publications (2)

Publication Number Publication Date
JPH1020896A true JPH1020896A (ja) 1998-01-23
JP3092519B2 JP3092519B2 (ja) 2000-09-25

Family

ID=16344399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP08195632A Expired - Fee Related JP3092519B2 (ja) 1996-07-05 1996-07-05 コード駆動線形予測音声符号化方式

Country Status (1)

Country Link
JP (1) JP3092519B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002045078A1 (en) * 2000-11-30 2002-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoder and audio decoding method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002045078A1 (en) * 2000-11-30 2002-06-06 Matsushita Electric Industrial Co., Ltd. Audio decoder and audio decoding method
US7478042B2 (en) 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions

Also Published As

Publication number Publication date
JP3092519B2 (ja) 2000-09-25

Similar Documents

Publication Publication Date Title
US5729655A (en) Method and apparatus for speech compression using multi-mode code excited linear predictive coding
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
US5060269A (en) Hybrid switched multi-pulse/stochastic speech coding technique
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP2004508597A (ja) オーディオ信号における伝送エラーの抑止シミュレーション
US7302387B2 (en) Modification of fixed codebook search in G.729 Annex E audio coding
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
JP3211762B2 (ja) 音声及び音楽符号化方式
JP3806344B2 (ja) 定常雑音区間検出装置及び定常雑音区間検出方法
JP2002140099A (ja) 音声復号化装置
JPH04344699A (ja) 音声符号化・復号化方法
JP3092519B2 (ja) コード駆動線形予測音声符号化方式
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
JP3299099B2 (ja) 音声符号化装置
JP2943983B1 (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JP2005532585A (ja) オーディオコーディング
JP3410931B2 (ja) 音声符号化方法及び装置
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP3099836B2 (ja) 音声の励振周期符号化方法
JP2700974B2 (ja) 音声符号化法
JP2008090311A (ja) 音声符号化方法
JP3515216B2 (ja) 音声符号化装置
JPH05165497A (ja) コード励振線形予測符号化器及び復号化器

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000627

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees