JPH1020896A - コード駆動線形予測音声符号化方式 - Google Patents
コード駆動線形予測音声符号化方式Info
- Publication number
- JPH1020896A JPH1020896A JP8195632A JP19563296A JPH1020896A JP H1020896 A JPH1020896 A JP H1020896A JP 8195632 A JP8195632 A JP 8195632A JP 19563296 A JP19563296 A JP 19563296A JP H1020896 A JPH1020896 A JP H1020896A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- frame
- code
- code information
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
よって情報量を圧縮し、符号化効率を向上するコード駆
動線形予測音声符号化方式の提供。 【解決手段】符号化器においては、有音と判定されたフ
レームAにおいては、定常区間判定器8にてフレームA
のパワーとピッチを定常区間開始フレームのパワーとピ
ッチを比較し、パワーとピッチとも同一の場合には、フ
レームAを定常区間と判定し、符号情報を伝送せず、復
合化器では、符号情報が伝送されてきた時に合成された
音声をメモリに格納しておき、符号情報が伝送されてこ
ない時には、メモリに格納された合成音声をピッチだけ
ずらしていって合成音声を生成する。
Description
測音声符号化方式に関し、特に、情報量の低減方式に関
する。
例えば特開平6−12098号公報には、符号化の対象
となる音声が有声音か無声音かを予測残差信号に基づい
て駆動音源の生成処理部を選択することにより、計算
量、ビットレートの低減、再生音声の音質向上を図る音
声符号化装置として、コード駆動線形予測(CELP)
音声符号化方式における、駆動音源生成処理について、
有声音声の場合、ピッチ周期に対応したパルスパターン
信号と、最新の過去の所定時間に記憶された駆動音源信
号と、雑音信号と、の3者のそれぞれに所定のゲインを
乗じた後加算してなる有声駆動音源を生成し、無声音声
の場合、最新の過去の所定時間に記憶された駆動音源信
号と、雑音信号と、の2者にそれぞれ所定のゲインを乗
じて加算してなる無声駆動音源を生成する方式が提案さ
れている。
8〜4kb/s程度の音声符号化方式において、適応コ
ードブックの滑らかな遅延パターンを得ると共に、CE
LP系の音声符号化方式の問題点であった雑音感を抑え
ることにより、音質を向上させる音声符号化方式とし
て、コード駆動線形予測音声符号化方式に関し、フレー
ム毎に有声性の判定を行い、有声性と判定されたフレー
ムではコードブック探索を行う時に、過去の音源を遅延
させた音源に、その遅延に応じたコムフィルタを掛け、
コムフィルタの出力と重み付け信号との2乗誤差が最小
になる遅延を求めるようにした方式が提案されている。
この場合、有声性と判定されなかったフレームでは、コ
ムフィルタを使用しない。上記方法により、雑音感を抑
え、音質を向上させる。
線形予測音声符号化方式の問題点として、有音部の定常
区間においては冗長度が高く、符号化効率が悪い、とい
うことがある。
は、音声波形に、ほとんど変化がないにもかかわらず、
非定常区間と同じ情報量を割り当てているためである。
されたものであって、その目的は、ピッチ情報を用いる
コード駆動線形予測音声符号化方式(CELP音声符号
化方式)において、有音時の定常区間では、符号情報を
生成しないように構成することによって、情報量を圧縮
する音声符号化方式を提供することにある。
め、本発明に係る音声符号化方式は、符号化側におい
て、有音と判定されたフレームについては、該フレーム
のパワー及びピッチを定常区間開始フレームのパワー及
びピッチを比較し、前記パワー及びピッチが前記定常区
間開始フレームのものと同一の場合には、前記フレーム
を定常区間と判定して符号情報を伝送せず、復号側にお
いては、符号情報が伝送されてきた時に合成された音声
を記憶部に格納しておき、前記符号情報が伝送されてこ
ない時には、前記記憶部に格納された合成音声をピッチ
だけずらしていくことによって合成音声を生成する、こ
とを特徴とする。
下に説明する。本発明は、好ましい実施の形態として、
ピッチ情報を用いるコード駆動線形予測音声符号化方式
であって、符号化側では、線形予測分析器(図1の1)
による線形予測フィルタ係数の算出、ピッチ抽出器(図
1の2)によるピッチ情報の算出、コードブック探索器
(図1の3)によるコード探索、パワー算出器(図1の
5)によるパワー検出、有音検出器(図1の6)による
有音検出から、有音と判定されたフレームAについて
は、定常区間判定器(図1の8)で、フレームAのパワ
ーとピッチを定常区間開始フレームのパワーとピッチと
比較する。
場合には、フレームAを定常区間と判定し、定常区間開
始フレームは変更せず、線形予測フィルタ係数、ピッチ
情報およびコードブック探索によって求められたコード
情報を含む符号情報Bは伝送しない。
異なる場合には、上記フレームAを非定常区間と判定
し、フレームAを新たに定常区間開始フレームとし、符
号情報を伝送し、有音でないと判定されたフレームAに
おいては、フレームを非定常区間と判定し、フレームA
を新たに定常区間開始フレームとし、符号情報Bを伝送
する。
てきた場合には、コード情報に従って、コードブックか
らコードを読み出すことにより、第1の駆動信号を合成
し、ピッチ情報からピッチ再生フィルタを構成し、ピッ
チ情報を第1のメモリに書き込み、第1の駆動信号でピ
ッチ再生フィルタを駆動することによって第2の駆動信
号を合成し、線形予測フィルタ係数から線形予測フィル
タを構成し、第2の駆動信号で線形予測フィルタを駆動
することによって合成音声Cを生成し、合成音声Cを第
2のメモリに書き込み、上記符号情報Bが伝送されてこ
ない場合には、第2のメモリに書き込まれた合成音声C
または後述するDを、第1のメモリに書き込まれたピッ
チだけずらすことにより、新たに合成音声Dを生成し、
この合成音声Dを新たに第2のメモリに書き込む、よう
に構成されてなる復号器を具備する。
細に説明すべく、本発明の実施例を図面を参照して以下
に説明する。
音声符号化方式における符号化器の一実施例の構成を示
すブロック図である。
形予測音声符号化方式の符号化器においては、符号化器
入力端子10に入力された音声信号X(n)は、線形予
測分析器1と、ピッチ抽出器2と、コードブック探索器
3と、パワー算出器5と、有音検出器6と、に供給され
る。
線形予測分析し、線形予測フィルタの係数αを求め、こ
れをコードブック探索器3とエンコーダ7に供給する。
ピッチ情報を抽出し、これをコードブック探索器3とエ
ンコーダ7に供給する。
から供給されたピッチ情報からピッチ再生フィルタを構
成し、線形予測分析器1から供給された線形予測フィル
タの係数αから線形予測フィルタを構成し、ピッチ再生
フィルタと線形予測フィルタの縦続フィルタをコードで
駆動した合成音声が原音声に最も近くなるように、コー
ドブック4からコードを探索し、所定の数のコード情報
を求め、エンコーダ7に供給する。
ワーを算出し、定常区間判定器8に供給する。
判定を行い、有音判定情報を定常区間判定器8に供給す
る。
レームAにおいては、フレームAのパワーとピッチを、
定常区間開始フレームのパワーとピッチと比較する。
一の場合には、このフレームAを定常区間と判定し、定
常区間開始フレームは変更せず、定常区間判定情報(定
常区間)をエンコーダ7に供給する。
つでも異なる場合には、フレームAを非定常区間と判定
し、フレームAを新たに定常区間開始フレームとし、定
常区間判定情報(非定常区間)をエンコーダ7に供給す
る。
おいては、このフレームAを非定常区間と判定し、この
フレームAを新たに定常区間開始フレームとし、定常区
間判定情報(非定常区間)をエンコーダ7に供給する。
って、非定常区間と判定されたフレームにおいては、線
形予測フィルタ係数αと、ピッチ情報と、コード情報
と、がエンコード(符号化)され、符号化器出力端子1
1から伝送路に出力される。
に従って、定常区間と判定されたフレームにおいては、
符号化器出力端子11から伝送路に何も出力しない。
音声符号化方式における復号器の一実施例の構成を示す
ブロック図である。
(1)復号器入力端子30に、符号化器でエンコーダさ
れた線形予測フィルタ係数αとピッチ情報とコード情報
が入力された場合には、以下の処理が行われる。
αと、ピッチ情報と、コード情報と、が、デコーダ21
でデコードされ、線形予測フィルタ係数αは線形予測フ
ィルタ25に供給され、ピッチ情報はピッチ再生フィル
タ24とメモリ26に供給され、コード情報は駆動信号
合成器22に供給される。
て、コードブック23からコードを読み出すことによっ
て、第1の駆動信号を合成し、ピッチ再生フィルタ24
に供給する。
器22から供給された第1の駆動信号でピッチ再生フィ
ルタを駆動することによって、第2の駆動信号を合成
し、線形予測フィルタ25に供給する。
ルタ24から供給された第2の駆動信号で線形予測フィ
ルタを駆動することによって、合成音声を生成し、合成
音声をメモリ27に書き込むと共に復号器出力端子40
に出力する。
された線形予測フィルタ係数αとピッチ情報とコード情
報が入力されない場合には以下の処理が行われる。
き込まれた合成音声をメモリ26に書き込まれたピッチ
だけずらすことによって,新たに合成音声を生成し、合
成音声をメモリ27に書き込むと共に復号器出力端子4
0に出力する。
ダされた線形予測フィルタ係数αと、ピッチ情報と、コ
ード情報と、が入力されない場合の合成音声生成方法の
一実施例を説明するための図である。
れてきた符号情報から合成された音声を示す。これは、
メモリ27に書き込まれている。初めて符号情報が伝送
されてこないフレームの先頭のサンプルat0+Tは、
先頭のサンプルからメモリ26に書き込まれたピッチT
だけ前のサンプルat0をコピーし、同様の方法で次々
に、ピッチTだけ前のサンプルをコピーすることによっ
て、符号情報が伝送されてこないフレーム全体(区間
Y)の合成音声を生成し、メモリ27に書き込むと共
に、復号器出力端子40に出力する。
されてこない場合には、メモリ27に書き込まれた合成
音声から、新たな合成音声を生成し、新たな合成音声を
メモリ27に書き込むと共に、復号器出力端子40に出
力する。
ピッチ情報を用いるコード駆動線形予測音声符号化方式
(CELP音声符号化方式)において、有音時の定常区
間では、符号情報を生成しないことにより情報量を圧縮
することができる。
常区間で符号情報が伝送されてこない場合には、最後に
伝送されてきた符号情報から合成された音声を、ピッチ
だけずらしていくことによって音声を合成するように、
構成したことによる。
式における符号化器の一実施例の構成を示すブロック図
である。
式における復号器の一実施例の構成を示すブロック図で
ある。
り、本発明に係るコード駆動線形予測音声符号化方式の
復号器において、符号情報が入力されない場合の合成音
声生成方法を説明するための図である。
Claims (5)
- 【請求項1】符号化側において、有音と判定されたフレ
ームについては、該フレームのパワー及びピッチを、定
常区間開始フレームのパワー及びピッチと比較し、前記
フレームのパワー及びピッチが前記定常区間開始フレー
ムのものと同一の場合には、前記フレームを定常区間と
判定して符号情報を伝送せず、 復号側においては、符号情報が伝送されてきた時に合成
された音声を記憶部に格納しておき、前記符号情報が伝
送されてこない時には、前記記憶部に格納された合成音
声をピッチだけずらしていくことによって合成音声を生
成する、 ことを特徴とするコード駆動線形予測音声符号化方式。 - 【請求項2】有音と判定されたフレームについては、該
フレームのパワー及びピッチを定常区間開始フレームの
パワー及びピッチを比較し、前記フレームのパワー及び
ピッチが前記定常区間開始フレームのものと同一の場合
には、前記フレームを定常区間と判定して符号情報を伝
送しないように構成されてなる符号化器を含むことを特
徴とするコード駆動線形予測音声符号化方式。 - 【請求項3】符号情報が伝送されてきた時に合成された
音声を記憶部に格納しておき、前記符号情報が伝送され
て来ない時には、前記記憶部に格納された合成音声をピ
ッチだけずらしていくことによって合成音声を生成する
復号器を含むことを特徴とするコード駆動線形予測音声
符号化方式。 - 【請求項4】前記復号器が、有音時の定常区間で符号情
報が伝送されてこない場合には、最後に伝送されてきた
符号情報から合成されて音声をピッチだけずらしていく
ことによって合成音声を生成することを特徴とする請求
項3記載のコード駆動線形予測音声符号化方式。 - 【請求項5】ピッチ情報を用いるコード駆動線形予測音
声符号化方式であって、 符号化側では、線形予測フィルタ係数の算出と、ピッチ
情報の算出と、コードブックの探索と、パワーの検出
と、有音の検出と、を行い、 有音と判定されたフレームについて、該フレームのパワ
ー及びピッチを、定常区間開始フレームのパワー及びピ
ッチと比較し、 比較の結果、パワー及びピッチがともに同一の場合に
は、前記フレームを定常区間と判定し、定常区間開始フ
レームは変更せず、前記線形予測フィルタ係数、前記ピ
ッチ情報、および前記コードブック探索によって求めら
れたコード情報を含む符号情報を伝送せず、 一方、パワーとピッチの少なくとも一つが異なる場合に
は、前記フレームを非定常区間と判定し、前記フレーム
を新たに定常区間開始フレームとして、前記符号情報を
伝送し、 有音でないと判定されたフレームについては、前記フレ
ームを非定常区間と判定し、前記フレームを新たに定常
区間開始フレームとして、前記符号情報を伝送する符号
化器を具備し、 復号側では、前記符号情報が伝送されてきた場合には、 前記コード情報に従って、コードブックからコードを読
み出すことによって、第1の駆動信号を合成し、 前記ピッチ情報からピッチ再生フィルタを構成し、 前記ピッチ情報を第1の記憶部に書き込み、 前記第1の駆動信号で前記ピッチ再生フィルタを駆動す
ることによって第2の駆動信号を合成し、 前記線形予測フィルタ係数から線形予測フィルタを構成
し、 前記第2の駆動信号で前記線形予測フィルタを駆動する
ことによって、合成音声を生成し、前記合成音声を第2
の記憶部に書き込み、 前記符号情報が伝送されてこない場合には、 前記第2の記憶部に書き込まれた合成音声を前記第1の
記憶部に書き込まれたピッチだけずらすことにより、新
たに合成音声を生成し、新たな合成音声を新たに第2の
記憶部に書き込む復号器を具備することを特徴とするコ
ード駆動線形予測音声符号化方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08195632A JP3092519B2 (ja) | 1996-07-05 | 1996-07-05 | コード駆動線形予測音声符号化方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08195632A JP3092519B2 (ja) | 1996-07-05 | 1996-07-05 | コード駆動線形予測音声符号化方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1020896A true JPH1020896A (ja) | 1998-01-23 |
JP3092519B2 JP3092519B2 (ja) | 2000-09-25 |
Family
ID=16344399
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08195632A Expired - Fee Related JP3092519B2 (ja) | 1996-07-05 | 1996-07-05 | コード駆動線形予測音声符号化方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3092519B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002045078A1 (en) * | 2000-11-30 | 2002-06-06 | Matsushita Electric Industrial Co., Ltd. | Audio decoder and audio decoding method |
-
1996
- 1996-07-05 JP JP08195632A patent/JP3092519B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002045078A1 (en) * | 2000-11-30 | 2002-06-06 | Matsushita Electric Industrial Co., Ltd. | Audio decoder and audio decoding method |
US7478042B2 (en) | 2000-11-30 | 2009-01-13 | Panasonic Corporation | Speech decoder that detects stationary noise signal regions |
Also Published As
Publication number | Publication date |
---|---|
JP3092519B2 (ja) | 2000-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5729655A (en) | Method and apparatus for speech compression using multi-mode code excited linear predictive coding | |
JP3346765B2 (ja) | 音声復号化方法及び音声復号化装置 | |
US5060269A (en) | Hybrid switched multi-pulse/stochastic speech coding technique | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP2004508597A (ja) | オーディオ信号における伝送エラーの抑止シミュレーション | |
US7302387B2 (en) | Modification of fixed codebook search in G.729 Annex E audio coding | |
JP3746067B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JP3211762B2 (ja) | 音声及び音楽符号化方式 | |
JP3806344B2 (ja) | 定常雑音区間検出装置及び定常雑音区間検出方法 | |
JP2002140099A (ja) | 音声復号化装置 | |
JPH04344699A (ja) | 音声符号化・復号化方法 | |
JP3092519B2 (ja) | コード駆動線形予測音声符号化方式 | |
JP2538450B2 (ja) | 音声の励振信号符号化・復号化方法 | |
JP2613503B2 (ja) | 音声の励振信号符号化・復号化方法 | |
JP3088204B2 (ja) | コード励振線形予測符号化装置及び復号化装置 | |
JP3299099B2 (ja) | 音声符号化装置 | |
JP2943983B1 (ja) | 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳 | |
JP2005532585A (ja) | オーディオコーディング | |
JP3410931B2 (ja) | 音声符号化方法及び装置 | |
JP2001147700A (ja) | 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体 | |
JP3099836B2 (ja) | 音声の励振周期符号化方法 | |
JP2700974B2 (ja) | 音声符号化法 | |
JP2008090311A (ja) | 音声符号化方法 | |
JP3515216B2 (ja) | 音声符号化装置 | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000627 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070728 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080728 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090728 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100728 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110728 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |