JPH0546199A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH0546199A
JPH0546199A JP3209164A JP20916491A JPH0546199A JP H0546199 A JPH0546199 A JP H0546199A JP 3209164 A JP3209164 A JP 3209164A JP 20916491 A JP20916491 A JP 20916491A JP H0546199 A JPH0546199 A JP H0546199A
Authority
JP
Japan
Prior art keywords
frame
time axis
speech
sound source
driving sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3209164A
Other languages
English (en)
Inventor
Koji Yoshida
幸司 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3209164A priority Critical patent/JPH0546199A/ja
Publication of JPH0546199A publication Critical patent/JPH0546199A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Error Detection And Correction (AREA)

Abstract

(57)【要約】 【目的】 少ない情報量で高品質な音声を得る音声符号
化装置の提供。 【構成】 入力音声に対し逆フィルタ器2で予測残差を
フレーム単位で求め、時間軸圧縮器4で予測残差をフレ
ーム間の連続性を保ちながら時間軸圧縮し、重み付き合
成フィルタ5で時間軸圧縮された聴覚重み付き入力音声
を生成し、一方、駆動音源生成器8、重み付き合成フィ
ルタ9で合成音声を生成し、駆動音源符号化器10で、
合成音声と重み付き入力音声との自乗誤差を最小にする
ような駆動音源をコードブックから選択し符号化する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ディジタル通信,ボイ
スメール等に利用する音声符号化装置に関する。
【0002】
【従来の技術】図4は従来のCELP(符号化励振法、
Code Excited Linear Predi
ction)音声符号化装置の構成を示すものである。
図4において、(1)は符号化側の構成であり、31は
入力音声のLPC(線形予測分析法Linear Pr
ediction Coding)分析を行なうLPC
分析器、32は入力音声に聴覚重み付けを行なう重み付
けフィルタ33,34は駆動音源を生成するために使用
する適応コードブックおよび確率的コードブック格納
器、35は駆動音源を生成する駆動音源生成器、36は
駆動音源から合成音声を生成する重み付き合成フィル
タ、37は駆動音源を符号化する駆動音源符号化器、3
8は復号化側に伝送するデータを多重化する多重化器で
ある。図4(2)は復号化側の構成であり、39は復号
化側で多重化された音声符号化データを分離する分離
器、40,41は駆動音源を生成するために使用する適
応コードブックおよび確率的コードブック格納器、42
は駆動音源を生成する駆動音源生成器、43は駆動音源
から復号音声を合成する合成フィルタである。
【0003】以上のような構成要素の音声符号化装置の
動作を説明する。図4(1)の符号化側において、入力
音声に対しLPC分析器31で得られた線形予測係数を
用いて、重み付けフィルタ32によって聴覚重み付き入
力音声を生成する。一方、駆動音源生成器35、重み付
き合成フィルタ36を通して合成音声を生成し、駆動音
源符号化器37において、合成音声と32で得られた重
み付き入力音声との自乗誤差を最小にするような駆動音
源を適応コードブックおよび確率的コードブックから選
択し符号化する。そして、復号化側に伝送すべき情報
(線形予測係数、駆動音源)を多重化器38によって多
重化する。図4(2)の復号化側においては、分離器3
9で音声符号化データを線形予測係数,駆動音源の各情
報に分離し、駆動音源情報および適応コードブック・確
率的コードブックから駆動音源生成器42によって駆動
音源を生成し、合成フィルタ43で復号音声を合成す
る。
【0004】
【発明が解決しようとする課題】しかしながら上記の従
来の音声符号化装置では、音声の符号化レートが低い場
合(4〜5kb/s以下)には、符号化情報量が少ない
ために高品質な音声を得られないという問題点を有して
いた。
【0005】本発明は上記従来の問題点を解決するもの
で、少ない情報量で高品質な音声を得ることができる音
声符号化装置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明は上記目的を達成
するために、入力音声の予測残差をフレームごとに求め
る逆フィルタと、その予測残差をフレーム間の連続を保
ちながら、時間軸上でフレーム単位で圧縮する時間軸圧
縮器と、時間軸圧縮された予測残差から聴覚重み付き入
力音声を生成する重み付き合成フィルタと、聴覚重み付
き入力音声に対しフレーム長可変のCELP符号化を行
なうCELP符号化器とを符号化側に備え、前記符号化
側から得られた駆動音源符号から駆動音源を生成する駆
動音源生成器と、駆動音源を時間軸上でフレーム単位で
伸張する時間軸伸張器と、伸張駆動音源から音声を復号
する合成フィルタとを復号化側に備えた構成を有する。
【0007】
【作用】この構成によって、符号化側で入力音声を予測
差上でフレーム間の連続性を保ちながら、フレーム単位
で時間軸圧縮を行ないCELP符号化を行なうことによ
って、時間軸圧縮に伴う付加的な遅延を生じることなく
少ない情報量で高品質な音声を得ることができる。
【0008】
【実施例】図1,2は本発明の一実施例の構成を示した
ものである。図1は符号化側、図2は復号化側の構成で
ある。図1において、1は入力音声のLPC分析を行な
うLPC分析器、2は入力音声の予測残差を求める逆フ
ィルタ、3は予測残差からピッチ周期を求めるピッチ抽
出器、4は予測残差をフレーム単位で時間軸圧縮する時
間軸圧縮器、5は予測残差の聴覚重み付き合成を行なう
重み付き合成フィルタ、6,7は駆動音源を生成するた
めに使用する適応コードブックおよび確率的コードブッ
ク格納器、8は駆動音源を生成する駆動音源生成器、9
は駆動音源から合成音声を生成する重み付き合成フィル
タ器、10は駆動音源を符号化する駆動音源符号化器、
11は復号化側に伝送するデータを多重化する多重化器
である。
【0009】図2において、21は符号化側で多重化さ
れた音声符号化データを分離する分離器、22,23は
駆動音源を生成するために使用する適応コードブックお
よび確率的コードブック格納器、24は駆動音源を生成
する駆動音源生成器、25は駆動音源をフレーム単位で
時間軸伸張する時間軸伸張器、26は駆動音源から復号
音声を合成する合成フィルタである。
【0010】次に上記実施例の動作について説明する。
図1の符号化側において、入力音声に対しLPC分析器
1で得られた線形予測係数を用いて逆フィルタ器2によ
って予測残差をフレーム単位で求める。予測残差から求
められたピッチ周期を用いて時間軸圧縮器4により予測
残差をフレーム単位で時間軸圧縮し、重み付き合成フィ
ルタ器5によって時間軸圧縮された聴覚重み付き入力音
声を生成する。一方、駆動音源生成器8、重み付き合成
フィルタ9を通して合成音声を生成し、駆動音源符号化
器10において、合成音声と重み付き合成フィルタ5で
得られた重み付き入力音声との自乗誤差を最小にするよ
うな駆動音源を適応コードブックおよび確率的コードブ
ックから選択し符号化する。なお、時間軸圧縮はフレー
ム間の連続性を保つように行なうため、時間軸圧縮後の
聴覚重み付き入力音声のフレーム長はフレームごとに可
変となり、上記CELP符号化は可変長フレームに対し
て行なわれる。各フレーム処理の最後に、復号化側に伝
達すべき情報(線形予測係数、ピッチ周期、駆動音源情
報)を多重化器11によって多重化する。図2の復号化
側においては、分離器21で音声符号化データを線形予
測係数、ピッチ周期、駆動音源の各情報に分離し、駆動
音源情報および適応コードブック・確率的コードブック
から駆動音源生成器24により駆動音源を生成し、時間
軸伸張器25によってピッチ周期を用いて駆動音源をフ
レーム単位で時間軸伸張し、合成フィルタ器26で復号
音声を合成する。
【0011】次に図3を用いてフレーム単位の時間軸圧
縮・伸張の動作を説明する。まず時間軸圧縮は図3
(1)においてフレーム単位の予測残差の先頭部の長さ
Lrの区間Aを圧縮せずにそのまま出力する。次に、そ
れに続く各2ピッチ周期区間(Bi,Ci)から加算平
均によって1ピッチ周期信号を生成し(Bi+Ci)、
圧縮残差として出力する。最後にフレームの後端部の長
さLrの区間Dは圧縮せずにそのまま出力しこのフレー
ムの圧縮動作を終了する。また、時間軸伸張は図3
(2)において、フレームの先頭部の長さLrの区間A
を伸張せずにそのまま出力する。次に、それに続く各1
ピッチ周期区間(Bi)からその各区間を2回繰り返す
ことによって2周期分の伸張信号を生成する。最後にフ
レームの後端部の長さLrの区間Dを伸張せずにそのま
ま出力しこのフレームの伸張動作を終了する。なお、時
間軸圧縮・伸張の際のフレームの両端部の区間A,Dの
長さLrは、フレームごとに変わるため、本発明におけ
る時間軸圧縮・伸張での圧縮・伸張率はフレームごとに
可変となる。
【0012】以上のように本発明の実施例の音声符号化
装置によれば、時間軸圧縮後の音声を符号化することに
よって、少ない情報量で高品質な音声符号化が行なえ
る。ここで、時間軸圧縮・伸張はフレーム単位で行なう
ことによって伸縮・伸張に伴う付加的な遅延は発生せ
ず、またフレーム間の連続性を保つような圧縮・伸張を
行なうことによってフレーム単位の時間軸圧伸に伴う音
声品質の劣化を抑えた符号化が実現できる。
【0013】
【発明の効果】以上の実施例から明らかなように本発明
によれば、時間軸圧縮後の音声を符号化することによっ
て、少ない情報量で高品質な音声符号化が行なえるよう
にしてあるので、時間軸圧縮・伸張はフレーム単位で行
なうことによって圧縮・伸張に伴う付加的な遅延は発生
せず、またフレーム間の連続性を保つような圧縮・伸張
を行なうことによってフレーム単位の時間軸圧伸に伴う
音声品質の劣化を抑えた符号化を行なうことができる音
声符号化装置を提供できる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声符号化装置の符
号化側の構成を示すブロック図
【図2】同装置の復号化側の構成を示すブロック図
【図3】(1)は同装置における時間軸圧縮の動作説明
図 (2)は同装置における時間軸伸張の動作説明図
【図4】(1)は従来のCELP音声符号化装置の符号
化側の構成を示すブロック図 (2)は同装置の復号化側の構成を示すブロック図
【符号の説明】
1 LPC分析器 2 逆フィルタ 3 ピッチ抽出器 4 時間軸圧縮器 5 重み付き合成フィルタ 6 適応コードブック格納器 7 確率的コードブック格納器 8 駆動音源生成器 9 重み付き合成フィルタ 10 駆動音源符号化器 11 多重化器 21 分離器 22 適応コードブック格納器 23 確率的コードブック格納器 24 駆動音源生成器 25 時間軸伸張器 26 合成フィルタ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力音声の予測残差をフレムごとに求め
    る逆フィルタと、前記予測残差を時間軸上でフレーム間
    の連続性を保ちながらフレーム単位で圧縮する時間軸圧
    縮器と、時間軸圧縮された予測残差から聴覚重み付き入
    力音声を生成する重み付き合成フィルタと、前記聴覚重
    み付き入力音声に対しフレーム長可変のCELP符号化
    を行なうCELP符号化器とを符号化側に備え、前記符
    号化側から得られた駆動音源符号から駆動音源を生成す
    る駆動音源生成器と、前記駆動音源を時間軸上でフレー
    ム単位で伸張する時間軸伸張器と、伸張駆動音源から音
    声を復号する合成フィルタとを復号化側に備えた音声符
    号化装置。
  2. 【請求項2】 時間軸圧縮器はフレーム単位の予測残差
    をフレームの両端部を除くピッチ周期の各2周期分を1
    周期分に合成し、ピッチ周期の2周期に満たない残りの
    部分(フレームの両端部)は圧縮せずにそのまま出力す
    ることによってフレーム間の連続性を保ちながら、フレ
    ーム単位で時間軸圧縮を行なうようにした請求項1記載
    の音声符号化装置。
  3. 【請求項3】 時間軸伸張器は請求項2記載の時間軸圧
    縮器で圧縮しないで出力したフレームの両端部はそのま
    ま出力し、残りの中央部の各1ピッチ周期分を2回繰り
    返すことにより2周期分として出力することによってフ
    レーム間の連続性を保ちながら、フレーム単位で時間軸
    伸張を行なうようにした請求項1記載の音声符号化装
    置。
JP3209164A 1991-08-21 1991-08-21 音声符号化装置 Pending JPH0546199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3209164A JPH0546199A (ja) 1991-08-21 1991-08-21 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3209164A JPH0546199A (ja) 1991-08-21 1991-08-21 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH0546199A true JPH0546199A (ja) 1993-02-26

Family

ID=16568388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3209164A Pending JPH0546199A (ja) 1991-08-21 1991-08-21 音声符号化装置

Country Status (1)

Country Link
JP (1) JPH0546199A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003500708A (ja) * 1999-05-26 2003-01-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号送信システム
JP2009515207A (ja) * 2005-11-03 2009-04-09 ドルビー スウェーデン アクチボラゲット 音声信号のタイムワープ処理改良変換符号化

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6454497A (en) * 1987-06-26 1989-03-01 American Telephone & Telegraph Core excitation linear prediction vocoder and method therefor
JPH02281300A (ja) * 1989-04-21 1990-11-16 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置及び音声符号化・復号化装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6454497A (en) * 1987-06-26 1989-03-01 American Telephone & Telegraph Core excitation linear prediction vocoder and method therefor
JPH02281300A (ja) * 1989-04-21 1990-11-16 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置及び音声符号化・復号化装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003500708A (ja) * 1999-05-26 2003-01-07 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号送信システム
JP2009515207A (ja) * 2005-11-03 2009-04-09 ドルビー スウェーデン アクチボラゲット 音声信号のタイムワープ処理改良変換符号化
JP2012068660A (ja) * 2005-11-03 2012-04-05 Dolby International Ab 音声信号のタイムワープ処理改良変換符号化
US8412518B2 (en) 2005-11-03 2013-04-02 Dolby International Ab Time warped modified transform coding of audio signals
US8838441B2 (en) 2005-11-03 2014-09-16 Dolby International Ab Time warped modified transform coding of audio signals

Similar Documents

Publication Publication Date Title
RU2584463C2 (ru) Кодирование звука с малой задержкой, содержащее чередующиеся предсказательное кодирование и кодирование с преобразованием
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
US20080077401A1 (en) Transcoding method and system between CELP-based speech codes with externally provided status
CN113223540B (zh) 在声音信号编码器和解码器中使用的方法、设备和存储器
JPH096397A (ja) 音声信号の再生方法、再生装置及び伝送方法
JP3364825B2 (ja) 音声符号化装置および音声符号化復号化装置
JPH0546199A (ja) 音声符号化装置
JP3329216B2 (ja) 音声符号化装置及び音声復号装置
JPS63192100A (ja) マルチパルス符号化装置
JP2797348B2 (ja) 音声符号化・復号化装置
EP1204094A2 (en) Frequency dependent long term prediction analysis for speech coding
JPH05323997A (ja) 音声符号化器、音声復号化器、音声符号化装置
JPH08234795A (ja) 音声符号化装置
JP2004348120A (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JPH10111700A (ja) 音声圧縮符号化方法および音声圧縮符号化装置
JP3770901B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP4447546B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3748081B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP3128226B2 (ja) 音声符号化方法
JPH0458299A (ja) 音声符号化装置
JP2992045B2 (ja) 音声符号化装置
JP3886815B2 (ja) 音声符号化装置、音声復号化装置、音声符号化方法及び音声復号化方法
JP3770900B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JPH1185198A (ja) ボコーダ符号化復号装置