JP2968530B2 - 適応ピッチ予測方法 - Google Patents

適応ピッチ予測方法

Info

Publication number
JP2968530B2
JP2968530B2 JP63000957A JP95788A JP2968530B2 JP 2968530 B2 JP2968530 B2 JP 2968530B2 JP 63000957 A JP63000957 A JP 63000957A JP 95788 A JP95788 A JP 95788A JP 2968530 B2 JP2968530 B2 JP 2968530B2
Authority
JP
Japan
Prior art keywords
pitch
prediction
average
component
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63000957A
Other languages
English (en)
Other versions
JPH01179100A (ja
Inventor
茂 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP63000957A priority Critical patent/JP2968530B2/ja
Publication of JPH01179100A publication Critical patent/JPH01179100A/ja
Application granted granted Critical
Publication of JP2968530B2 publication Critical patent/JP2968530B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は適応ピッチ予測方式に関し、特に音声符号化
方式における音声の適応ピッチ予測方式に関する。
〔従来の技術〕
音声波形を低ビットレイトで表す符号化方式として、
アタルとシュレーダーによって提案され適応予測符号化
(文献1:アタル アンド シュレーダー、「アダプティ
ブ プレディクティブ コーディング オブ スピーチ
シグナルズ」ベルシスト テク ジェイ、49巻、1973
から1986ページ、1970年;Atal B.S.and Schroeder M.
R.,“Adaptive predictive coding of speech signals"
Bell Syst.Tech.J.,vol.49,pp.1973−1986(1970).)
がある。これは音声の短期的相関に基づく線形予測器と
長期的相関に基づくピッチ予測器とから構成されてお
り、以後の予測符号化方式の基本となっている。これら
の符号化においては、音声を定常と見なせる10msecから
30msec間隔のフレームに分割し、各フレーム毎に各予測
器のパラメータを決定している。即ち、各予測器のパラ
メータの更新速度はフレーム単位であり、フレーム内に
おける各パラメータの変動はすべて予測残差に反映され
る形となっている。
〔発明が解決しようとする問題点〕
しかし、一般に音声波形は時間的に大きく変動してい
るため、各パラメータもフレーム内で可変でなければな
らない。特に声帯振動の周期性をモデル化するピッチ予
測器のパラメータを固定にすると、予測残差に声帯振動
の変動がすべて含まれることになり、予測残差の符号化
に高い情報量を必要とする。予測残差の符号化効率を上
げるためにはピッチ変動を組み込んだピッチ予測方式が
必要である。
本発明の目的は、ピッチ予測器において、予測係数の
時間変動を平均的な成分とその平均値からのずれ成分と
で表すことにより、入力信号からピッチ情報を効率的に
削除することのできる適応ピッチ予測方式を提供するこ
とにある。
〔問題を解決するための手段〕
本発明は、一定間隔のフレームに分割された離散的音
声波形を、当該フレームにおける前記入力音声波形を線
形予測係数と線形予測残差成分とに分離した上でそれぞ
れを量子化・符号化する線形予測符号化方法におけるピ
ッチ予測方法であり、 前記線形予測残差成分を符号化する際に、この線形予
測残差成分を、当該フレーム内で一定の値を持つ平均的
ピッチ周期とこのフレーム内の各ピッチ区間の長さと前
記平均的ピッチ周期との差違を示すピッチ周期変動成分
からなるインパルス列とで表すと共に、前記インパルス
列の振幅を当該間隔内で一定の値を持つ平均的ピッチ予
測係数と前記各ピッチ区間毎に値が変わる変動ピッチ予
測係数とで表すピッチ予測方法であり、 前記平均的ピッチ周期と前記変動ピッチ周期成分と前
記平均的ピッチ予測係数と前記変動ピッチ予測係数とを
前記入力音声波形をもとにフレーム毎に決定することを
特徴とする。
〔作用〕
第3図は本発明の原理を説明するための図で、第3図
(a)は本発明におけるピッチ予測器のモデルを示す。
このモデルのインパルス応答は、次のように表せる。
ここで、Tとαはピッチの基本周期成分を表すもの
で、Tは平均的なピッチ周期成分、αは平均ピッチ予測
係数である。また、σとηはピッチの変動成分を表す。
σは、ピッチ周期の当該フレーム内における平均的な値
からのずれを示し、ηはピッチ予測係数の当該フレーム
内における平均的な値からのずれを示している。本明細
書では、σピッチ周期変動成分、ηをピッチ予測係数変
動成分と称する。第3図(b)は第(1)式を模式した
例を示す。ηとσは平均ピッチ周期毎にピッチ予測
係数α並びにピッチ周期Tが変化する量である。ちなみ
に、従来のピッチ予測モデルのインパルス応答は となる。
〔実施例〕
次に本発明の一実施例について第2図を参照して説明
する。
第1図は本発明の適応ピッチ予測方式の一実施例を示
すブロック図である。第1図において、入力端子100か
ら一定間隔のフレームに分割されたNサンプルの離散的
音声波形(例えば、8kHzサンプリングで、N=160(20m
sec))を入力し、線形予測分析器110と線形予測誤差計
算器120に供給する。線形予測分析器110は入力端子100
から入力した音声サンプルからPARCOR係数を求めて量子
化した後、線形予測誤差計算器120とマルチプレクサ180
とに出力する。線形予測誤差計算器120は線形予測分析
器110から入力されるPARCOR係数を逆量子化して線形予
測係数に変換し、線形予測誤差を計算する。計算された
線形予測残差はピッチ変動成分決定器140と平均ピッチ
予測分析器130とに供給される。平均ピッチ予測分析器1
30は当該フレーム内の音声の基本周期成分と平均的なピ
ッチ予測係数を求めるもので、線形予測残差の自己相関
関数から定められる。平均的なピッチ周期成分Tと平均
ピッチ予測係数αを求める手段は、例えば、文献2:古井
著、ディジタル音声処理、東海大学出版会(昭和60)の
第4章に纒められている。求められた各係数はピッチ変
動成分決定器140とマルチプレクサ180とに供給される。
ピッチ変動成分決定器140は平均ピッチ予測分析器130か
ら入力された各パラメータを逆量子化し、それから、ピ
ッチ周期の変動のためにピッチ周期変動成分コードブッ
ク150に予め蓄えられた乱数(例えば正規乱数)と、ピ
ッチ予測係数の変動のためにピッチ予測係数変動成分コ
ードブック160に予め蓄えられた変動パタン(例えば二
次曲線の集合)と、平均ピッチ予測分析器130から入力
する平均ピッチ予測器のパラメータとを入力して、入力
音声に最も適したピッチ予測器の変動成分を上記コード
ブック150と160とから選ぶものである。この選択に際し
て、ピッチ予測残差の電力を評価関数としてとることが
できる。即ち、線形予測誤差計算器120から入力される
線形予測誤差e(n)から、上記コードブック150と160
から供給される各変動成分に対するピッチ予測残差 を計算し、その電力を最も小さくするコードベクトルを
与えるインデックスを出力する。第(3)式で、ηik
ピッチ予測係数変動成分コードブック160にある第i番
目のコードベクトルの成分で、ピッチ予測係数の変動分
を表すものである。σikはピッチ周期変動成分コードブ
ック150にある第j番目のコードベクトルの成分で、ピ
ッチ周期の変動分を表すものである。出力としてマルチ
プレクサ180に送られるインデックスは なるものである。この最適インデックス探索は予め定め
られたコードブックにあるすべてのi,jに対して行われ
る。ピッチ予測残差量子化器170は平均ピッチ予測分析
器130とピッチ変動成分決定器140と線形予測分析器110
とから入力されるPARCOR係数とをもとにピッチ変動成分
決定器140から入力される上記第(2)式のピッチ予測
残差d(n)を量子化するものである。ピッチ予測残差
d(n)を量子化する構成は種々知られており、例えば
スカラー量子化を用いるものは文献3のジャイヤントと
ノルの著書「ディジタル コーディング オブ ウェイ
ブフォームス」プレンティスホール、1984(N.S.Jaiyan
t and Peter Noll,DIGITAL CODING OF WAVEFORMS,Prent
ice−Hall,1984.)の第7章に詳しく記載されている。
第2図にベクトル量子化に基づいた具体例のブロック
図を示す。第2図において、210はピッチ予測残差d
(n)を入力する端子、211は線形予測分析器110の出力
であるPARCOR係数を入力する端子、212は平均ピッチ予
測分析器130の出力である平均ピッチ周期とピッチ予測
係数αとを入力する平均ピッチ予測パラメータ入力端
子、213はピッチ変動成分決定器140で選ばれた最適イン
デックスが指すピッチ周期変動成分コードブック150の
ピッチ周期の変動分σikとピッチ予測係数変動成分コー
ドブック160の予測係数の変動分ηikとを入力する変動
ピッチ予測パラメータ入力端子である。200は予め定め
られたピッチ予測残差を蓄えてあるコードブックであ
る。221と220は線形予測合成器でPARCOR係数入力端子21
1から入力されるPARCOR係数から形成される。230と231
は上記第(1)式のインパルス応答をもつピッチ予測フ
ィルタである。240は入力音声のピッチ予測残差d
(n)から作られる合成音声とピッチ予測残差コードブ
ック200にあるコードベクトルから合成される合成音声
との平均二乗距離を計算する平均二乗誤差計算器であ
る。コードベクトル選択器250はピッチ予測残差コード
ブック200の各コードベクトルに対して作られ各合成音
声の内、ピッチ予測残差d(n)に対して作られる合成
音声との平均二乗距離を最小にするコードベクトルを選
び、そのインデックスをインデックス出力端子260から
マルチプレクサ180に出力する。第1図に示すマルチプ
レクサ180は線形予測分析器110,平均ピッチ予測分析器1
30,ピッチ変動成分決定器140,ピッチ予測残差量子化器1
70から入力される各パラメータの符号を多重して出力端
子190から伝送路へ出力する。
〔発明の効果〕
以上説明したように本発明はフレーム内にあるピッチ
周期やピッチ予測係数の変動を許容するピッチ予測方式
を提供するものである。一般に音声波形は時間的に大き
く変動しているため、パラメータをフレーム内で固定す
る従来方式と比較して、本発明はある特定区間の音声波
形のピッチ構造をその特定区間の平均的な特性を表す基
本周期成分とこの基本周期成分以外の短期的な特性を表
す変動成分とで表すことによりパラメータの時間変動を
許容するので入力信号からより効率的にピッチ情報を削
除することができるという効果を有する。また、この効
果により、本発明においてはピッチ予測残渣の変動成分
が小さくなっており、ピッチ予測残渣の符号化効率を高
めることができるという効果がある。
【図面の簡単な説明】
第1図は本発明の適応ピッチ予測方式の一実施例を示す
ブロック図、第2図はベクトル量子化に基づいた具体例
のブロック図、第3図は本発明の原理を説明するための
図である。 100……入力端子、110……線形予測分析器、120……線
形予測誤差計算器、130……平均ピッチ予測分析器、140
……ピッチ変動成分決定器、150……ピッチ周期変動成
分コードブック、160……ピッチ予測係数変動成分コー
ドブック、170……ピッチ予測残差量子化器、180……マ
ルチプレクサ、190……出力端子、200……ピッチ予測残
差コードブック、210……ピッチ予測残差入力端子、211
……PARCOR係数入力端子、212……平均ピッチ予測パラ
メータ入力端子、213……変動ピッチ予測パラメータ入
力端子、220,221……線形予測合成器、230,231……適応
ピッチ予測フィルタ、240……平均二乗誤差計算器、250
……コードベクトル選択器、260……インデックス出力
端子。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】一定間隔のフレームに分割された離散的音
    声波形を、当該フレームにおける前記入力音声波形を線
    形予測係数と線形予測残差成分とに分離した上でそれぞ
    れを量子化・符号化する線形予測符号化方法におけるピ
    ッチ予測方法であり、 前記線形予測残差成分を符号化する際に、この線形予測
    残差成分を、当該フレーム内で一定の値を持つ平均的ピ
    ッチ周期とこのフレーム内の各ピッチ区間の長さと前記
    平均的ピッチ周期との差違を示すピッチ周期変動成分か
    らなるインパルス列とで表すと共に、前記インパルス列
    の振幅を当該間隔内で一定の値を持つ平均的ピッチ予測
    係数と前記各ピッチ区間毎に値が変わる変動ピッチ予測
    係数とで表すピッチ予測方法であり、 前記平均的ピッチ周期と前記変動ピッチ周期成分と前記
    平均的ピッチ予測係数と前記変動ピッチ予測係数とを前
    記入力音声波形をもとにフレーム毎に決定する適応ピッ
    チ予測方法。
JP63000957A 1988-01-05 1988-01-05 適応ピッチ予測方法 Expired - Lifetime JP2968530B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63000957A JP2968530B2 (ja) 1988-01-05 1988-01-05 適応ピッチ予測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63000957A JP2968530B2 (ja) 1988-01-05 1988-01-05 適応ピッチ予測方法

Publications (2)

Publication Number Publication Date
JPH01179100A JPH01179100A (ja) 1989-07-17
JP2968530B2 true JP2968530B2 (ja) 1999-10-25

Family

ID=11488143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63000957A Expired - Lifetime JP2968530B2 (ja) 1988-01-05 1988-01-05 適応ピッチ予測方法

Country Status (1)

Country Link
JP (1) JP2968530B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
日経エレクトロニクス 1984.7.2 第121〜142頁

Also Published As

Publication number Publication date
JPH01179100A (ja) 1989-07-17

Similar Documents

Publication Publication Date Title
US6345248B1 (en) Low bit-rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
EP2384506B1 (en) Speech coding method and apparatus
EP0718822A2 (en) A low rate multi-mode CELP CODEC that uses backward prediction
JPH0990995A (ja) 音声符号化装置
JPH08179795A (ja) 音声のピッチラグ符号化方法および装置
EP0557940A2 (en) Speech coding system
JPH09258795A (ja) ディジタルフィルタおよび音響符号化/復号化装置
KR100651712B1 (ko) 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
EP0745972B1 (en) Method of and apparatus for coding speech signal
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
CA2233896C (en) Signal coding system
JP2000132194A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2968530B2 (ja) 適応ピッチ予測方法
US6236961B1 (en) Speech signal coder
JP3003531B2 (ja) 音声符号化装置
JP3183944B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
McCree A scalable phonetic vocoder framework using joint predictive vector quantization of melp parameters
EP0713208A2 (en) Pitch lag estimation system
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JP3192051B2 (ja) 音声符号化装置
JPH0844398A (ja) 音声符号化装置
JP2000029499A (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2778035B2 (ja) 音声符号化方式
JP3103108B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070820

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080820

Year of fee payment: 9