JPH04220700A - ピッチ周波数符号化復号化器 - Google Patents
ピッチ周波数符号化復号化器Info
- Publication number
- JPH04220700A JPH04220700A JP2413186A JP41318690A JPH04220700A JP H04220700 A JPH04220700 A JP H04220700A JP 2413186 A JP2413186 A JP 2413186A JP 41318690 A JP41318690 A JP 41318690A JP H04220700 A JPH04220700 A JP H04220700A
- Authority
- JP
- Japan
- Prior art keywords
- pitch frequency
- vector
- frequency vector
- pitch
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims abstract description 110
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 238000010276 construction Methods 0.000 claims description 8
- 230000002123 temporal effect Effects 0.000 claims description 7
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000013139 quantization Methods 0.000 abstract description 23
- 238000009825 accumulation Methods 0.000 abstract 1
- 230000000717 retained effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【0001】
【産業上の利用分野】この発明は音声信号をデジタル伝
送あるいは蓄積するときに用いられる音声符号化復号化
装置内の音声のピッチ周波数符号化復号化器に関し、特
に符号化部の改良に関するものである。
送あるいは蓄積するときに用いられる音声符号化復号化
装置内の音声のピッチ周波数符号化復号化器に関し、特
に符号化部の改良に関するものである。
【0002】
【従来の技術】入力音声信号を一定時間の分析フレーム
毎に分析して得られるピッチ周波数を少ない情報量で符
号化する際に、セグメント(連続する複数のフレームの
かたまり)を音韻上の連続性によって決定し、そのセグ
メント内の複数のピッチ周波数をセグメント長(セグメ
ント内のフレーム数)等の関数で近似する方法が知られ
ており、例えば文献“A SEGMENT VOCOD
ER AT 150 B/S” S.Roucos ,
R.Schwarts,J.Makhoul Proc
.ICASSP−83 ,pp.61−64,(198
3)により報告されている。
毎に分析して得られるピッチ周波数を少ない情報量で符
号化する際に、セグメント(連続する複数のフレームの
かたまり)を音韻上の連続性によって決定し、そのセグ
メント内の複数のピッチ周波数をセグメント長(セグメ
ント内のフレーム数)等の関数で近似する方法が知られ
ており、例えば文献“A SEGMENT VOCOD
ER AT 150 B/S” S.Roucos ,
R.Schwarts,J.Makhoul Proc
.ICASSP−83 ,pp.61−64,(198
3)により報告されている。
【0003】図3は上記文献に基づいた従来のピッチ周
波数符号化復号化器の構成を示すブロック図である。図
3において、51は入力音声信号を一定時間毎に分析し
て得られたピッチ周波数を複数個まとめたピッチ周波数
ベクトルを1単位として符号化し符号化結果を出力する
符号化部、52は符号化部51より出力された符号化結
果からピッチ周波数を復号化する復号化部である。符号
化部51は、ピッチ周波数蓄積手段2、適応量子化手段
26、及び差分逆量子化手段28を備えている。復号化
部52は適応逆量子化手段30を有している。上記各手
段の詳細については次の動作説明において述べる。
波数符号化復号化器の構成を示すブロック図である。図
3において、51は入力音声信号を一定時間毎に分析し
て得られたピッチ周波数を複数個まとめたピッチ周波数
ベクトルを1単位として符号化し符号化結果を出力する
符号化部、52は符号化部51より出力された符号化結
果からピッチ周波数を復号化する復号化部である。符号
化部51は、ピッチ周波数蓄積手段2、適応量子化手段
26、及び差分逆量子化手段28を備えている。復号化
部52は適応逆量子化手段30を有している。上記各手
段の詳細については次の動作説明において述べる。
【0004】次に動作について説明する。ピッチ周波数
蓄積手段2は、音韻の連続性により決定されたセグメン
トのセグメント長25(セグメント長をLとする)が入
力され、L個のピッチ周波数を蓄積し、このL個のピッ
チ周波数で構成されるピッチ周波数ベクトル5を出力す
る。適応量子化手段26は、図4に示すように、入力さ
れたピッチ周波数ベクトル5を、現在のセグメントより
1つ前のセグメントの最終フレームのピッチ周波数29
(以後、前ピッチ周波数と呼ぶ)と現セグメントの最終
フレーム上に仮定したピッチ周波数を結ぶ直線で近似し
た場合に誤差が最小となる最終フレーム上のピッチ周波
数を求め、このピッチ周波数と前ピッチ周波数29の差
分を量子化し、これを差分量子化結果27として出力す
る。差分逆量子化手段28は、差分量子化結果27より
差分を求め、この差分と差分逆量子化手段28内に保持
していた前ピッチ周波数を足すことにより逆量子化後の
Lフレーム目のピッチ周波数を求め、これを新たな前ピ
ッチ周波数29として出力し、またこの値を保持してお
く。
蓄積手段2は、音韻の連続性により決定されたセグメン
トのセグメント長25(セグメント長をLとする)が入
力され、L個のピッチ周波数を蓄積し、このL個のピッ
チ周波数で構成されるピッチ周波数ベクトル5を出力す
る。適応量子化手段26は、図4に示すように、入力さ
れたピッチ周波数ベクトル5を、現在のセグメントより
1つ前のセグメントの最終フレームのピッチ周波数29
(以後、前ピッチ周波数と呼ぶ)と現セグメントの最終
フレーム上に仮定したピッチ周波数を結ぶ直線で近似し
た場合に誤差が最小となる最終フレーム上のピッチ周波
数を求め、このピッチ周波数と前ピッチ周波数29の差
分を量子化し、これを差分量子化結果27として出力す
る。差分逆量子化手段28は、差分量子化結果27より
差分を求め、この差分と差分逆量子化手段28内に保持
していた前ピッチ周波数を足すことにより逆量子化後の
Lフレーム目のピッチ周波数を求め、これを新たな前ピ
ッチ周波数29として出力し、またこの値を保持してお
く。
【0005】適応逆量子化手段30は、符号化部51よ
り出力された差分量子化結果27より差分を求め、この
差分と符号化部51より出力されたセグメント長25(
長さL)及び予め保持してある前ピッチ周波数よりL個
のピッチ周波数を求め、出力ピッチ周波数系列24とし
て出力し、また、最終フレームのピッチ周波数を新たな
前ピッチ周波数として保持しておく。
り出力された差分量子化結果27より差分を求め、この
差分と符号化部51より出力されたセグメント長25(
長さL)及び予め保持してある前ピッチ周波数よりL個
のピッチ周波数を求め、出力ピッチ周波数系列24とし
て出力し、また、最終フレームのピッチ周波数を新たな
前ピッチ周波数として保持しておく。
【0006】
【発明が解決しようとする課題】上述したように従来の
ピッチ周波数符号化復号化器ではピッチ周波数を符号化
する際に、音韻の連続性で決定されたセグメント内の複
数のピッチ周波数を直線で近似しているので、復号化さ
れたピッチ周波数の系列が音韻の変化と独立して現れる
入力音声のピッチ周波数の複雑な時間変化に追従できず
、入力音声のイントネーションが大きく損なわれてしま
うという問題点があった。
ピッチ周波数符号化復号化器ではピッチ周波数を符号化
する際に、音韻の連続性で決定されたセグメント内の複
数のピッチ周波数を直線で近似しているので、復号化さ
れたピッチ周波数の系列が音韻の変化と独立して現れる
入力音声のピッチ周波数の複雑な時間変化に追従できず
、入力音声のイントネーションが大きく損なわれてしま
うという問題点があった。
【0007】この発明は上記のような問題点を解決する
ためになされたもので、入力音声のピッチ周波数の時間
変化を保存したピッチ周波数の符号化を極めて低いビッ
トレートで行なうようにすることにより、入力音声のピ
ッチ周波数の複雑な時間変化にも追従できるようにし、
入力音声のイントネーションを損なうことを抑えること
ができるピッチ周波数符号化復号化器を提供することを
目的とする。
ためになされたもので、入力音声のピッチ周波数の時間
変化を保存したピッチ周波数の符号化を極めて低いビッ
トレートで行なうようにすることにより、入力音声のピ
ッチ周波数の複雑な時間変化にも追従できるようにし、
入力音声のイントネーションを損なうことを抑えること
ができるピッチ周波数符号化復号化器を提供することを
目的とする。
【0008】
【課題を解決するための手段】この発明に係るピッチ周
波数符号化復号化器は、有限M個のピッチ周波数ベクト
ル符号語から成る符号帳8と、入力された音声信号のピ
ッチ周波数系列を蓄積するピッチ周波数蓄積手段2と、
このピッチ周波数蓄積手段2に蓄積されたピッチ周波数
系列からピッチ周波数ベクトルを構成するピッチ周波数
ベクトル構成手段4と、このピッチ周波数ベクトル手段
4で構成されたピッチ周波数ベクトルと上記符号帳8内
のピッチ周波数ベクトル符号語との距離を算出する距離
算出手段6と、この距離算出手段6で算出された距離を
用いて上記符号帳8内のM個のピッチ周波数ベクトル符
号語より最適ピッチ周波数ベクトル符号語を選択しその
最適ピッチ周波数ベクトル符号語をピッチ周波数ベクト
ルの符号化結果として出力する最適符号語選択手段11
とを符号化部41に設け、上記ピッチ周波数蓄積手段2
に蓄積されたピッチ周波数系列の先頭のピッチ周波数か
らピッチ周波数の時間変動において特徴的な最初の点ま
でのピッチ周波数をピッチ周波数ベクトルの初期候補と
し、このピッチ周波数ベクトルと上記最適符号語選択手
段11から出力された最適ピッチ周波数ベクトル符号語
との間の歪が所定値を超えない条件内でピッチ周波数ベ
クトル長が最大となるピッチ周波数ベクトルを探索し構
成する機能を持った上記ピッチ周波数ベクトル構成手段
4を備えたものである。
波数符号化復号化器は、有限M個のピッチ周波数ベクト
ル符号語から成る符号帳8と、入力された音声信号のピ
ッチ周波数系列を蓄積するピッチ周波数蓄積手段2と、
このピッチ周波数蓄積手段2に蓄積されたピッチ周波数
系列からピッチ周波数ベクトルを構成するピッチ周波数
ベクトル構成手段4と、このピッチ周波数ベクトル手段
4で構成されたピッチ周波数ベクトルと上記符号帳8内
のピッチ周波数ベクトル符号語との距離を算出する距離
算出手段6と、この距離算出手段6で算出された距離を
用いて上記符号帳8内のM個のピッチ周波数ベクトル符
号語より最適ピッチ周波数ベクトル符号語を選択しその
最適ピッチ周波数ベクトル符号語をピッチ周波数ベクト
ルの符号化結果として出力する最適符号語選択手段11
とを符号化部41に設け、上記ピッチ周波数蓄積手段2
に蓄積されたピッチ周波数系列の先頭のピッチ周波数か
らピッチ周波数の時間変動において特徴的な最初の点ま
でのピッチ周波数をピッチ周波数ベクトルの初期候補と
し、このピッチ周波数ベクトルと上記最適符号語選択手
段11から出力された最適ピッチ周波数ベクトル符号語
との間の歪が所定値を超えない条件内でピッチ周波数ベ
クトル長が最大となるピッチ周波数ベクトルを探索し構
成する機能を持った上記ピッチ周波数ベクトル構成手段
4を備えたものである。
【0009】
【作用】ピッチ周波数ベクトル構成手段4は、ピッチ周
波数蓄積手段2に蓄積されたピッチ周波数系列の先頭の
ピッチ周波数からピッチ周波数の時間変動において特徴
的な最初の点までのピッチ周波数をピッチ周波数ベクト
ルの初期候補とし、このピッチ周波数ベクトルと最適符
号語選択手段11から出力された最適ピッチ周波数ベク
トル符号語との間の歪が所定値を超えない条件内でピッ
チ周波数ベクトル長が最大となるピッチ周波数ベクトル
を探索し構成する。距離算出手段6は、ピッチ周波数ベ
クトル構成手段4で構成されたピッチ周波数ベクトルと
符号帳8内のピッチ周波数ベクトル符号語との距離を算
出する。最適符号語選択手段11は、距離算出手段6で
算出された距離を用いて符号帳8内のM個のピッチ周波
数ベクトル符号語より最適ピッチ周波数ベクトル符号語
を選択し、その最適ピッチ周波数ベクトル符号語をピッ
チ周波数ベクトルの符号化結果として出力する。
波数蓄積手段2に蓄積されたピッチ周波数系列の先頭の
ピッチ周波数からピッチ周波数の時間変動において特徴
的な最初の点までのピッチ周波数をピッチ周波数ベクト
ルの初期候補とし、このピッチ周波数ベクトルと最適符
号語選択手段11から出力された最適ピッチ周波数ベク
トル符号語との間の歪が所定値を超えない条件内でピッ
チ周波数ベクトル長が最大となるピッチ周波数ベクトル
を探索し構成する。距離算出手段6は、ピッチ周波数ベ
クトル構成手段4で構成されたピッチ周波数ベクトルと
符号帳8内のピッチ周波数ベクトル符号語との距離を算
出する。最適符号語選択手段11は、距離算出手段6で
算出された距離を用いて符号帳8内のM個のピッチ周波
数ベクトル符号語より最適ピッチ周波数ベクトル符号語
を選択し、その最適ピッチ周波数ベクトル符号語をピッ
チ周波数ベクトルの符号化結果として出力する。
【0010】
【実施例】図1はこの発明の一実施例に係るピッチ周波
数符号化復号化器の構成を示すブロック図である。図1
において、41は入力音声信号を一定時間毎に分析して
得られたピッチ周波数を複数個まとめたピッチ周波数ベ
クトルを1単位として符号化し符号化結果を出力する符
号化部、42は符号化部41より出力された符号化結果
からピッチ周波数を復号化する復合化部である。符号化
部41において、8は有限M個のピッチ周波数ベクトル
符号語から成る符号帳、2は入力された音声信号のピッ
チ周波数系列を蓄積するピッチ周波数蓄積手段、4はピ
ッチ周波数蓄積手段2に蓄積されたピッチ周波数系列か
らピッチ周波数ベクトルを構成するピッチ周波数ベクト
ル構成手段、6はピッチ周波数ベクトル構成手段4で構
成されたピッチ周波数ベクトルと符号帳8内のピッチ周
波数ベクトル符号語との距離を算出する距離算出手段、
11は距離算出手段6で算出された距離を用いて符号帳
8内のM個のピッチ周波数ベクトル符号語より最適ピッ
チ周波数ベクトル符号語を選択しその最適ピッチ周波数
ベクトル符号語をピッチ周波数ベクトルの符号化結果と
して出力する最適符号語選択手段、17はピッチ周波数
ベクトル構成手段4からの平均ピッチ周波数を量子化す
る平均ピッチ周波数量子化手段である。復号化部42に
おいて、21は有限M個のピッチ周波数ベクトル符号語
から成る符号帳、11は上記最適符号語選択手段11の
出力を逆量子化する逆量子化手段、22は上記平均ピッ
チ周波数量子化手段17の出力を逆量子化する平均ピッ
チ周波数逆量子化手段である。
数符号化復号化器の構成を示すブロック図である。図1
において、41は入力音声信号を一定時間毎に分析して
得られたピッチ周波数を複数個まとめたピッチ周波数ベ
クトルを1単位として符号化し符号化結果を出力する符
号化部、42は符号化部41より出力された符号化結果
からピッチ周波数を復号化する復合化部である。符号化
部41において、8は有限M個のピッチ周波数ベクトル
符号語から成る符号帳、2は入力された音声信号のピッ
チ周波数系列を蓄積するピッチ周波数蓄積手段、4はピ
ッチ周波数蓄積手段2に蓄積されたピッチ周波数系列か
らピッチ周波数ベクトルを構成するピッチ周波数ベクト
ル構成手段、6はピッチ周波数ベクトル構成手段4で構
成されたピッチ周波数ベクトルと符号帳8内のピッチ周
波数ベクトル符号語との距離を算出する距離算出手段、
11は距離算出手段6で算出された距離を用いて符号帳
8内のM個のピッチ周波数ベクトル符号語より最適ピッ
チ周波数ベクトル符号語を選択しその最適ピッチ周波数
ベクトル符号語をピッチ周波数ベクトルの符号化結果と
して出力する最適符号語選択手段、17はピッチ周波数
ベクトル構成手段4からの平均ピッチ周波数を量子化す
る平均ピッチ周波数量子化手段である。復号化部42に
おいて、21は有限M個のピッチ周波数ベクトル符号語
から成る符号帳、11は上記最適符号語選択手段11の
出力を逆量子化する逆量子化手段、22は上記平均ピッ
チ周波数量子化手段17の出力を逆量子化する平均ピッ
チ周波数逆量子化手段である。
【0011】次にこの実施例の動作について説明する。
ピッチ周波数蓄積手段2には有限K個のピッチ周波数1
が入力される。ピッチ周波数系列は、一般に、単語のア
クセント位置にピークを持つへの字型の形状の連鎖で表
すことができる。このようなピッチ周波数系列に特徴的
な形状を抽出し、これをベクトル量子化することで、量
子化効率を上げることができる。このために、ピッチ周
波数ベクトル構成手段4は、ピッチ周波数蓄積手段2か
らピッチ周波数系列3を読み込み、ピッチ周波数系列の
極小点でセグメンテーションを行いN次元のピッチ周波
数ベクトルを構成し、ピッチ周波数ベクトル5として出
力する。図2はピッチ周波数ベクトル構成手段4の動作
を説明した説明図で、ピッチ周波数蓄積手段2に蓄積さ
れているK個のピッチ周波数をセグメンテーションする
ために、図2(a)に示すように、例えば、ピッチ周波
数系列の最初の極小点Nを探索し、第1フレームからこ
の極小点Nの第Nフレームまでを1つのセグメントとし
、そのセグメント内の平均ピッチ周波数で正規化された
N個のピッチ周波数から成るピッチ周波数ベクトルを構
成し、平均ピッチ周波数16とピッチ周波数ベクトル5
として出力する。次に距離算出手段6は、ピッチ周波数
ベクトル5の次元数と符号語の次元数が一致するように
ピッチ周波数ベクトル5を線形圧縮伸長し、次元数が正
規化されたピッチ周波数ベクトルを求める。次に距離算
出手段6は有限M個のピッチ周波数ベクトル符号語から
成る符号帳8から切り替えスイッチ7を介して順次ピッ
チ周波数ベクトル符号語を読みだし、このピッチ周波数
ベクトル符号語と次元数が正規化されたピッチ周波数ベ
クトルの間の距離(例えばユークリッド距離)を計算し
、その距離9とそれに対応するピッチ周波数ベクトル符
号語の番号10を出力する。最適符号語選択手段11で
は、距離9の中で最小の距離を求め、これを最小距離1
2とし、このときのピッチ周波数ベクトル5のベクトル
次元長13と共にピッチ周波数ベクトル構成手段4に出
力する。また、このときのピッチ周波数ベクトル符号語
番号10及びベクトル次元長13を保持しておく。
が入力される。ピッチ周波数系列は、一般に、単語のア
クセント位置にピークを持つへの字型の形状の連鎖で表
すことができる。このようなピッチ周波数系列に特徴的
な形状を抽出し、これをベクトル量子化することで、量
子化効率を上げることができる。このために、ピッチ周
波数ベクトル構成手段4は、ピッチ周波数蓄積手段2か
らピッチ周波数系列3を読み込み、ピッチ周波数系列の
極小点でセグメンテーションを行いN次元のピッチ周波
数ベクトルを構成し、ピッチ周波数ベクトル5として出
力する。図2はピッチ周波数ベクトル構成手段4の動作
を説明した説明図で、ピッチ周波数蓄積手段2に蓄積さ
れているK個のピッチ周波数をセグメンテーションする
ために、図2(a)に示すように、例えば、ピッチ周波
数系列の最初の極小点Nを探索し、第1フレームからこ
の極小点Nの第Nフレームまでを1つのセグメントとし
、そのセグメント内の平均ピッチ周波数で正規化された
N個のピッチ周波数から成るピッチ周波数ベクトルを構
成し、平均ピッチ周波数16とピッチ周波数ベクトル5
として出力する。次に距離算出手段6は、ピッチ周波数
ベクトル5の次元数と符号語の次元数が一致するように
ピッチ周波数ベクトル5を線形圧縮伸長し、次元数が正
規化されたピッチ周波数ベクトルを求める。次に距離算
出手段6は有限M個のピッチ周波数ベクトル符号語から
成る符号帳8から切り替えスイッチ7を介して順次ピッ
チ周波数ベクトル符号語を読みだし、このピッチ周波数
ベクトル符号語と次元数が正規化されたピッチ周波数ベ
クトルの間の距離(例えばユークリッド距離)を計算し
、その距離9とそれに対応するピッチ周波数ベクトル符
号語の番号10を出力する。最適符号語選択手段11で
は、距離9の中で最小の距離を求め、これを最小距離1
2とし、このときのピッチ周波数ベクトル5のベクトル
次元長13と共にピッチ周波数ベクトル構成手段4に出
力する。また、このときのピッチ周波数ベクトル符号語
番号10及びベクトル次元長13を保持しておく。
【0012】次にピッチ周波数ベクトル構成手段4では
、最小距離12が予め定められた閾値より小さい場合は
、図2(b)に示すように第Nフレームから最終の第K
フレームまでの区間の最初の極小点N’を求め、第1フ
レームから第N’フレームまでのピッチ周波数でピッチ
周波数ベクトルを構成し、これを第1フレームから第N
’フレームまでの平均ピッチ周波数で正規化した後、ピ
ッチ周波数ベクトル5として出力する。次に、距離計算
手段6、符号帳8、及び最適符号語選択手段11を通じ
て、新たに構成されたベクトル次元長13のピッチ周波
数ベクトルでの最小距離12を求める。この最小距離1
2が閾値より小さい場合は最適符号語選択手段11では
保持していたピッチ周波数ベクトル符号語番号10とベ
クトル次元長13の値を更新し、ピッチ周波数ベクトル
構成手段4でN’以後のフレームにおいて極小点を探索
し新たなピッチ周波数ベクトルを構成するという操作を
繰り返す。
、最小距離12が予め定められた閾値より小さい場合は
、図2(b)に示すように第Nフレームから最終の第K
フレームまでの区間の最初の極小点N’を求め、第1フ
レームから第N’フレームまでのピッチ周波数でピッチ
周波数ベクトルを構成し、これを第1フレームから第N
’フレームまでの平均ピッチ周波数で正規化した後、ピ
ッチ周波数ベクトル5として出力する。次に、距離計算
手段6、符号帳8、及び最適符号語選択手段11を通じ
て、新たに構成されたベクトル次元長13のピッチ周波
数ベクトルでの最小距離12を求める。この最小距離1
2が閾値より小さい場合は最適符号語選択手段11では
保持していたピッチ周波数ベクトル符号語番号10とベ
クトル次元長13の値を更新し、ピッチ周波数ベクトル
構成手段4でN’以後のフレームにおいて極小点を探索
し新たなピッチ周波数ベクトルを構成するという操作を
繰り返す。
【0013】最適符号語選択手段11が求める最小距離
12が予め定められた閾値より大きい場合、または、ピ
ッチ周波数ベクトル構成手段4において極小点N’が検
出されない場合は、最適符号語選択手段11は、最適符
号語選択手段11内に保持されているピッチ周波数ベク
トル符号語番号を最適符号語番号14とし、そのときの
ベクトル次元長15と共に外部へ出力する。平均ピッチ
周波数量子化手段17は平均ピッチ周波数16を例えば
線形量子化し平均ピッチ周波数符号語18を出力する。
12が予め定められた閾値より大きい場合、または、ピ
ッチ周波数ベクトル構成手段4において極小点N’が検
出されない場合は、最適符号語選択手段11は、最適符
号語選択手段11内に保持されているピッチ周波数ベク
トル符号語番号を最適符号語番号14とし、そのときの
ベクトル次元長15と共に外部へ出力する。平均ピッチ
周波数量子化手段17は平均ピッチ周波数16を例えば
線形量子化し平均ピッチ周波数符号語18を出力する。
【0014】平均ピッチ周波数逆量子化手段22では平
均ピッチ周波数符号語18より平均ピッチ周波数23を
求める。逆量子化手段19では、最適符号語番号14に
より指定されるピッチ周波数ベクトル符号語を切り替え
スイッチ20を介して符号帳21から読みだし、読みだ
したピッチ周波数ベクトルへ符号語の各次元のサンプル
値に平均ピッチ周波数23を掛け、また、ベクトル次元
帳15と一致するようにこれを線形圧縮伸長し、出力ピ
ッチ周波数系列24として出力する。
均ピッチ周波数符号語18より平均ピッチ周波数23を
求める。逆量子化手段19では、最適符号語番号14に
より指定されるピッチ周波数ベクトル符号語を切り替え
スイッチ20を介して符号帳21から読みだし、読みだ
したピッチ周波数ベクトルへ符号語の各次元のサンプル
値に平均ピッチ周波数23を掛け、また、ベクトル次元
帳15と一致するようにこれを線形圧縮伸長し、出力ピ
ッチ周波数系列24として出力する。
【0015】なお、実施例では、ピッチ周波数の極小点
をセグメント境界として用いてピッチ周波数ベクトルを
構成したが、ピッチ周波数の極大点や、変化率の極小点
、極大点、これらの点の組み合わせ、1フレームずつの
増減等により、セグメント長がより長く、入力ピッチ周
波数系列に対する量子化歪がより小さいという基準にお
いて最適なセグメントの決定を行うことも可能である。
をセグメント境界として用いてピッチ周波数ベクトルを
構成したが、ピッチ周波数の極大点や、変化率の極小点
、極大点、これらの点の組み合わせ、1フレームずつの
増減等により、セグメント長がより長く、入力ピッチ周
波数系列に対する量子化歪がより小さいという基準にお
いて最適なセグメントの決定を行うことも可能である。
【0016】
【発明の効果】以上のように本発明によれば、入力音声
のピッチ周波数を音韻の変化と独立にセグメンテーショ
ンしてピッチ周波数ベクトルを構成し、これをベクトル
量子化し、さらにこのベクトル量子化のときの量子化歪
が制限値を超えない条件内においてセグメント長が最大
になるようにピッチ周波数ベクトルを順次再構成するよ
うにしたので、ピッチ周波数の時間変化を保存したピッ
チ周波数の符号化が極めて低いビットレートで行なえ、
これにより入力音声のピッチ周波数の複雑な時間変化に
も追従でき、したがって入力音声のイントネーションを
損なうことが抑えられ、性能が向上するという効果が得
られる。
のピッチ周波数を音韻の変化と独立にセグメンテーショ
ンしてピッチ周波数ベクトルを構成し、これをベクトル
量子化し、さらにこのベクトル量子化のときの量子化歪
が制限値を超えない条件内においてセグメント長が最大
になるようにピッチ周波数ベクトルを順次再構成するよ
うにしたので、ピッチ周波数の時間変化を保存したピッ
チ周波数の符号化が極めて低いビットレートで行なえ、
これにより入力音声のピッチ周波数の複雑な時間変化に
も追従でき、したがって入力音声のイントネーションを
損なうことが抑えられ、性能が向上するという効果が得
られる。
【図1】この発明の一実施例に係るピッチ周波数符号化
復号化器の構成を示すブロック図である。
復号化器の構成を示すブロック図である。
【図2】この実施例におけるピッチ周波数ベクトル構成
手段の動作を説明するための図である。
手段の動作を説明するための図である。
【図3】従来のピッチ周波数符号化復号化器の構成を示
すブロック図である。
すブロック図である。
【図4】この従来例における適応量子化手段の動作を説
明するための図である。
明するための図である。
2 ピッチ周波数蓄積手段
4 ピッチ周波数ベクトル構成手段
6 距離算出手段
8 符号帳
11 最適符号語選択手段
17 平均ピッチ周波数量子化手段
41 符号化部
42 復号化部
Claims (1)
- 【請求項1】 入力音声信号を一定時間毎に分析して
得られたピッチ周波数を複数個まとめて得られるピッチ
周波数ベクトルを1単位として符号化し、この符号化結
果を出力する符号化部と、この符号化部より出力された
符号化結果からピッチ周波数を復号化する復号化部とか
ら成るピッチ周波数符号化復号化器において、有限M個
のピッチ周波数ベクトル符号語から成る符号帳と、入力
された音声信号のピッチ周波数系列を蓄積するピッチ周
波数蓄積手段と、このピッチ周波数蓄積手段に蓄積され
たピッチ周波数系列からピッチ周波数ベクトルを構成す
るピッチ周波数ベクトル構成手段と、このピッチ周波数
ベクトル構成手段で構成されたピッチ周波数ベクトルと
上記符号帳内のピッチ周波数ベクトル符号語との距離を
算出する距離算出手段と、この距離算出手段で算出され
た距離を用いて上記符号帳内のM個のピッチ周波数ベク
トル符号語より最適ピッチ周波数ベクトル符号語を選択
しその最適ピッチ周波数ベクトル符号語をピッチ周波数
ベクトルの符号化結果として出力する最適符号語選択手
段とを設け、上記ピッチ周波数蓄積手段に蓄積されたピ
ッチ周波数系列の先頭のピッチ周波数からピッチ周波数
の時間変動において特徴的な最初の点までのピッチ周波
数をピッチ周波数ベクトルの初期候補とし、このピッチ
周波数ベクトルと上記最適符号語選択手段から出力され
た最適ピッチ周波数ベクトル符号語との間の歪が所定値
を超えない条件内でピッチ周波数ベクトル長が最大とな
るピッチ周波数ベクトルを探索し構成する機能を持った
上記ピッチ周波数ベクトル構成手段を備えたことを特徴
とするピッチ周波数符号化復号化器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP41318690A JP3305338B2 (ja) | 1990-12-21 | 1990-12-21 | ピッチ周波数符号化復号化器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP41318690A JP3305338B2 (ja) | 1990-12-21 | 1990-12-21 | ピッチ周波数符号化復号化器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04220700A true JPH04220700A (ja) | 1992-08-11 |
JP3305338B2 JP3305338B2 (ja) | 2002-07-22 |
Family
ID=18521872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP41318690A Expired - Fee Related JP3305338B2 (ja) | 1990-12-21 | 1990-12-21 | ピッチ周波数符号化復号化器 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3305338B2 (ja) |
-
1990
- 1990-12-21 JP JP41318690A patent/JP3305338B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP3305338B2 (ja) | 2002-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4625286A (en) | Time encoding of LPC roots | |
US7222069B2 (en) | Voice code conversion apparatus | |
US5819213A (en) | Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks | |
KR100487136B1 (ko) | 음성복호화방법및장치 | |
US5012518A (en) | Low-bit-rate speech coder using LPC data reduction processing | |
EP1224662B1 (en) | Variable bit-rate celp coding of speech with phonetic classification | |
US6202046B1 (en) | Background noise/speech classification method | |
JP4649208B2 (ja) | オーディオコーディング | |
JP3114197B2 (ja) | 音声パラメータ符号化方法 | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
JPH09127989A (ja) | 音声符号化方法及び音声符号化装置 | |
US5806027A (en) | Variable framerate parameter encoding | |
CA2090205C (en) | Speech coding system | |
US7039584B2 (en) | Method for the encoding of prosody for a speech encoder working at very low bit rates | |
KR100416363B1 (ko) | 선형 예측 분석 대 합성 엔코딩 방법 및 엔코더 | |
JP3088163B2 (ja) | Lsp係数の量子化方法 | |
JP2797348B2 (ja) | 音声符号化・復号化装置 | |
JP3305338B2 (ja) | ピッチ周波数符号化復号化器 | |
EP0483882B1 (en) | Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits | |
JPH09179593A (ja) | 音声符号化装置 | |
JPH08137498A (ja) | 音声符号化装置 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 | |
JPH10124093A (ja) | 音声圧縮符号化方法および装置 | |
GB2368761A (en) | Codec and methods for generating a vector codebook and encoding/decoding signals, e.g. speech signals | |
JPH10133696A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |