JPH07295596A - 音声符号化方法 - Google Patents

音声符号化方法

Info

Publication number
JPH07295596A
JPH07295596A JP6088207A JP8820794A JPH07295596A JP H07295596 A JPH07295596 A JP H07295596A JP 6088207 A JP6088207 A JP 6088207A JP 8820794 A JP8820794 A JP 8820794A JP H07295596 A JPH07295596 A JP H07295596A
Authority
JP
Japan
Prior art keywords
pulse
speech
main
main pulse
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6088207A
Other languages
English (en)
Inventor
Naoya Tanaka
直也 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6088207A priority Critical patent/JPH07295596A/ja
Publication of JPH07295596A publication Critical patent/JPH07295596A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 伝送情報量の増加を抑制しながら、音声品質
を向上できる音声符号化方法を提供する。 【構成】 ピッチ周期分析手段1で入力音声7のピッチ
周期8を音声フレームごとに抽出し、メインパルス列生
成手段3により前記周期に対応するメインパルス列9を
生成する。サブパルス生成手段により音声フレームのサ
ブフレームごとにメインパルスにサブパルスを付加して
設けることによりパルス音源ベクトル10を生成する。
このパルス音源ベクトル10と線形予測分析手段で算出
した線形予測係数12により合成音声11を生成し、誤
差最小化手段により合成音声11を入力音声7と比較し
た誤差をメインパルス生成手段3およびサブパルス生成
手段4にフィードバックして誤差が最小となるようにサ
ブパルスを付加する。メインパルスは音声フレームごと
に設定し、サブパルスはサブフレームごとに設定して各
メインパルスに付加する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、低ビットレートの音声
符号化方法において、一定周期のメインパルス列とメイ
ンパルスの前後に適応的に立てたサブパルスからなるパ
ルス音源ベクトルを用いることにより、音声品質を向上
させる方法に関する。
【0002】
【従来の技術】近年、音声の蓄積や伝送に効率のよい低
ビットレートのディジタル符号化が用いられるが、その
音声品質が課題である。低ビットレートの符号化方法で
は、入力音声を音声フレームに分割し、各音声フレーム
に対して線形予測分析を行い、得られた線形予測係数と
予測残査とを符号化する方法が主流である。この予測残
査は音源符号帳に蓄えられた音源ベクトルによって符号
化されるが、音源ベクトルを生成する方法の1つとし
て、入力音声のピッチ周期間隔に1本ないしは数本のパ
ルスを立てる方法がある。
【0003】以下、従来のパルス音源ベクトルの生成手
段について説明する。図4は従来の音声符号化方法を実
現する音声符号化装置の構成を示す要部ブロック図で
る。図において、401は入力音声9を所定の時間長に
分割した音声フレームにおけるピッチ周期407を分析
して抽出するピッチ周期分析手段、402は前記音声フ
レームを線形予測により線形予測係数410を演算して
出力する線形予測分析手段、403は前記ピッチ周期4
07を入力して、その周期のパルス列408を生成する
パルス列生成手段、404はパルス列408と線形予測
係数410とに基づいて合成音声409を生成する線形
予測合成手段、405は合成音声409を入力音声40
6と比較した誤差を最小化するようにパルス列生成手段
403にフィードバックする誤差最小化手段である。
【0004】上記構成の音源ベクトル生成手段の処理動
作について説明する。ピッチ周期分析手段401は入力
音声からピッチ周期407を抽出する。パルス列生成手
段403は1本またはあらかじめ定められた形状の数本
のパルスを検出したピッチ周期407の間隔で立てたパ
ルス列408を生成する。線形予測合成手段404はパ
ルス列408をパルス音源として、線形予測分析手段4
02によって算出された線形予測係数410を用いて、
合成音声409を生成する。誤差最小化手段405は入
力音声406と合成音声409とを比較し、その誤差が
最小になるようにパルス列生成手段403にフィードバ
ックをかける。以上の過程により最適なパルス音源ベク
トルが生成される。このようにして生成したパルス音源
ベクトルを音源として用いることは、有声音の立ち上が
り部分などの音声品質の向上に効果がある。
【0005】
【発明が解決しようとする課題】このような従来の音源
ベクトル生成方法では、パルス音源ベクトルが1本また
は、所定の形状の数本のパルスで構成されるため、音声
フレーム単位で検出した特徴的な周期を有するパルス音
源ベクトルだけが再現され、より細かいパルス音源が再
現されないので、予測残査を近似するのに充分なパルス
音源ベクトルが得られないという問題があった。
【0006】本発明は上記の課題を解決するもので、予
測残差を最適に近似でき、表現力の高いパルス音源ベク
トルを生成でき、音声品質を向上できる音声符号化方法
を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明は上記の目的を達
成するために、入力音声をピッチ周期分析し、そのピッ
チに対応するメインパルス列と、前記メインパルス列の
各メインパルスの前後の所定区間内に1ないし複数本の
サブパルスを適応的に立ててパルス音源ベクトルを生成
して音源とし、かつ前記メインパルス列の周期を音声フ
レーム内で一定とし、前記サブパルスは前記音声フレー
ムを分割したサブフレーム単位で前記各メインパルスに
対して立てて符号化するようにした音声符号化方法であ
る。
【0008】
【作用】本発明は上記の構成において、メインパルスに
サブパルスを付加したパルス音源ベクトルは表現力が高
くて音質を向上させ、かつ、メインパルス列の情報は音
声フレームごととし、サブパルスの情報はサブフレーム
ごととすることにより、サブパルスを設けることによる
伝送情報量の増加を抑制する。
【0009】
【実施例】以下、本発明の音声符号化方法の一実施例に
ついて図面を参照しながら説明する。図1は本実施例の
音声符号化方法を実現する音声符号化装置の構成を示す
要部ブロック図である。図において、1は入力音声7を
分析してピッチ周期8を抽出するピッチ周期分析手段、
2は入力音声を線形予測分析して線形予測係数12を演
算して出力する線形予測分析手段、3はピッチ周期8に
基づいてメインパルス列9を生成して出力するメインパ
ルス列生成手段、4はメインパルス列9に対してサブパ
ルスを生成付加し、パルス音源ベクトル10を生成して
出力するサブパルス生成手段、5はパルス音源ベクトル
10と線形予測係数12とにより合成音声11を生成し
て出力する線形予測合成手段、6は合成音声11を入力
音声7と比較した誤差を最小とするようにメインパルス
生成手段3およびサブパルス生成手段4にフィードバッ
クする誤差最小化手段である。また、図3はメインパル
スとサブパルスとの関係を示す模式図であり、図におい
て、301はメインパルス、302はサブパルス、30
3はサブパルス探索区間である。
【0010】上記構成において、その動作を説明する。
ピッチ周期分析手段1は入力音声7を分割した所定時間
長の音声フレームにおけるピッチ周期8を抽出する。メ
インパルス列生成手段3はピッチ周期8をパルス間隔と
するメインパルス列9を符号帳などを用いて生成し、サ
ブパルス生成手段4はメインパルス列9に対して適応的
にサブパルスを立て、パルス音源ベクトル10を生成す
る。線形予測合成手段5は線形予測分析手段2によって
算出された線形予測係数12とパルス音源ベクトル10
とから合成音声11を生成する。誤差最小化手段6は入
力音声7と合成音声11を比較し、その誤差が最小にな
るようにメインパルス列生成手段3およびサブパルス生
成手段4にフィードバックをかける。以上の過程により
最適なパルス音源ベクトル10が生成される。
【0011】上記の動作においてサブパルスを適応的に
立てる方法について説明する。図3はメインパルス30
1とサブパルス302との関係を示す模式図である。図
において、メインパルス301に対して、その時間的前
後のある一定範囲をサブパルス探索区間303と定め、
サブパルス探索区間303内で合成音声11の誤差を最
小とする位置にサブパルス302を立てるようにする。
このサブパルス302はメインパルス301からの距離
を示す符号と、メインパルス301との相対的な大きさ
を示す符号と、その正負を示す符号とによって表現する
ことができる。
【0012】つぎに、パルス音源ベクトル10を符号化
する方法について説明する。入力音声7を、図2に示し
たように、a、b、c・・・で示した音声フレームと、
1、2、3、4で示したサブフレームとに分割する。パ
ルス音源ベクトル10の生成は各サブフレームごとに行
うが、情報量を削減するためにメインパルス列9のパル
ス間隔とパルス位置とは前記音声フレームごとに決定す
る。すなわち、ピッチ周期分析は各音声フレームに対し
て1回行うものとし、同一音声フレーム内におけるパル
ス間隔を一定とすることにより、メインパルス列9は先
頭パルスの位置と各サブフレーム内でのゲインのみで表
すことができる。一方、サブパルスを立てる処理は各サ
ブフレームごとに行い、サブフレーム内に複数のメイン
パルスがある場合には、同一サブフレーム内の全てのメ
インパルスに同じサブパルスを立てるものとする。以上
の方法により、パルス音源ベクトル10は、音声フレー
ム内における先頭メインパルスの位置とメインパルスの
間隔、サブフレーム内におけるメインパルスのゲイン、
サブフレーム内におけるサブパルスの位置、サブパルス
のメインパルスに対する相対的な大きさ、およびサブパ
ルスの正負を示す符号によって符号化される。
【0013】上記構成により、生成されたパルス音源ベ
クトル10は、パルス列の形状が適応的に変化するた
め、従来の固定された形状のパルス列によるパルス音源
ベクトルよりも表現力が高く、合成音声の品質が向上す
る。
【0014】なお、本実施例では、1本のサブパルスを
各メインパルスに対して立てる場合について説明した
が、複数本のサブパルスを設けてもよいことは言うまで
もない。
【0015】
【発明の効果】以上の説明から明らかなように、本発明
は、入力音声をピッチ周期分析し、そのピッチに対応す
るメインパルス列と、前記メインパルス列の各メインパ
ルスの前後の所定区間内に1ないし複数本のサブパルス
を適応的に立ててパルス音源ベクトルを生成して音源と
し、かつ前記メインパルス列の周期を音声フレーム内で
一定とし、前記サブパルスは前記音声フレームを分割し
たサブフレーム単位で前記各メインパルスに対して立て
て符号化するようにしたことにより、情報量の増加を抑
制しながら音声品質を向上させることができる。
【図面の簡単な説明】
【図1】本発明の音声符号化方法を実現する音声符号化
装置の構成を示す要部ブロック図
【図2】本発明の音声符号化方法においてメインパルス
を生成する音声フレームとサブパルスを立てるサブフレ
ームの構成を示す模式図
【図3】本発明の音声符号化方法におけるメインパルス
とサブパルスとの関係を示すスペクトラム図
【図4】従来の音声符号化方法を実現する音声符号化装
置の構成を示す要部ブロック図
【符号の説明】
1 ピッチ周期分析手段 2 線形予測分析手段 3 メインパルス列生成手段 4 サブパルス生成手段 5 線形予測合成手段 6 誤差最小化手段 7 入力音声 8 ピッチ周期 9 メインパルス列 10 パルス音源ベクトル 11 合成音声 12 線形予測係数

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力音声をピッチ周期分析し、そのピッ
    チに対応するメインパルス列と、前記メインパルス列の
    各メインパルスの前後の所定区間内に1ないし複数本の
    サブパルスを適応的に立ててパルス音源ベクトルを生成
    して音源とし、かつ前記メインパルス列の周期を音声フ
    レーム内で一定とし、前記サブパルスは前記音声フレー
    ムを分割したサブフレーム単位で前記各メインパルスに
    対して立てて符号化するようにした音声符号化方法。
JP6088207A 1994-04-26 1994-04-26 音声符号化方法 Pending JPH07295596A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6088207A JPH07295596A (ja) 1994-04-26 1994-04-26 音声符号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6088207A JPH07295596A (ja) 1994-04-26 1994-04-26 音声符号化方法

Publications (1)

Publication Number Publication Date
JPH07295596A true JPH07295596A (ja) 1995-11-10

Family

ID=13936465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6088207A Pending JPH07295596A (ja) 1994-04-26 1994-04-26 音声符号化方法

Country Status (1)

Country Link
JP (1) JPH07295596A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000054258A1 (fr) * 1999-03-05 2000-09-14 Matsushita Electric Industrial Co., Ltd. Generateur de vecteurs de source sonore, et codeur/decodeur vocal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000054258A1 (fr) * 1999-03-05 2000-09-14 Matsushita Electric Industrial Co., Ltd. Generateur de vecteurs de source sonore, et codeur/decodeur vocal
US6928406B1 (en) 1999-03-05 2005-08-09 Matsushita Electric Industrial Co., Ltd. Excitation vector generating apparatus and speech coding/decoding apparatus

Similar Documents

Publication Publication Date Title
US4709390A (en) Speech message code modifying arrangement
KR100264863B1 (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
JP3196595B2 (ja) 音声符号化装置
US6385576B2 (en) Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
US5953697A (en) Gain estimation scheme for LPC vocoders with a shape index based on signal envelopes
JP2002258896A (ja) 音声符号化方法および音声符号化装置
US6581031B1 (en) Speech encoding method and speech encoding system
US20040111256A1 (en) Voice encoding method and apparatus
KR100561018B1 (ko) 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법
JP3558031B2 (ja) 音声復号化装置
US7024355B2 (en) Speech coder/decoder
JPH07295596A (ja) 音声符号化方法
JP3451998B2 (ja) 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP2800599B2 (ja) 基本周期符号化装置
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP3303580B2 (ja) 音声符号化装置
Tanaka et al. Low-bit-rate speech coding using a two-dimensional transform of residual signals and waveform interpolation
JP2956068B2 (ja) 音声符号化復号化方式
JP2853170B2 (ja) 音声符号化復号化方式
JP3515216B2 (ja) 音声符号化装置
KR950001437B1 (ko) 음성부호화방법
Chong-White et al. An intelligibility enhancement for the mixed excitation linear prediction speech coder
JPH09146599A (ja) 音声符号化装置
JPH07295595A (ja) 音声符号化方法