JPH09134196A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH09134196A
JPH09134196A JP7289730A JP28973095A JPH09134196A JP H09134196 A JPH09134196 A JP H09134196A JP 7289730 A JP7289730 A JP 7289730A JP 28973095 A JP28973095 A JP 28973095A JP H09134196 A JPH09134196 A JP H09134196A
Authority
JP
Japan
Prior art keywords
pitch
vector
code vector
adaptive
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7289730A
Other languages
English (en)
Inventor
Hiroyuki Ebara
原 宏 幸 江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7289730A priority Critical patent/JPH09134196A/ja
Publication of JPH09134196A publication Critical patent/JPH09134196A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 音声符号化装置、特にピッチ抽出装置、適応
符号帳、符号ベクトル生成器に関し、適応符号帳の符号
ベクトルを符号化対象データ列の前半と後半のピッチラ
グを用いて作成し、符号化対象データ列内でピッチ周期
が変化する場合においても、データ列の前半と後半の双
方に適する符号ベクトルが得られるようにする。 【解決手段】 符号ベクトル生成器105は、自己相関
関数の大きくなる複数のピッチラグ(Pi2)をピッチ
ラグ候補として選出し、それぞれのPi2と過去の(直
前の時間長Lのデータ列で出力された)ピッチラグPi
を用いて適応符号帳109から時間長Lの適応符号ベク
トルを2種類取り出し、取り出された2種類の適応符号
ベクトルを用いて1つの符号ベクトルを生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声符号化装置、
特にピッチ抽出装置、適応符号帳、適応符号ベクトル生
成器に関するものである。
【0002】
【従来の技術】近年、ディジタル移動通信の需要の増加
により音声符号化の低ビットレート化が必要とされてお
り、数々の音声符号化装置が開発されている。その中
で、音声信号を声道情報と音源情報に分離し、声道情報
を線形予測係数から構成されるディジタルフィルタによ
り表現し、音源情報を数百〜数千種類程度の波形パター
ンから構成されている音源符号帳を用いてベクトル量子
化するCELP方式が、低ビットレート(4kb/s〜
8kb/s)においても高品質の音声を実現できる方式
として広く用いられている。このようなCELP方式の
音声符号化方式として、特開昭62−102294号公
報等が知られており、また文献として「TheRCELP Speec
h-Coding Algorithm 」ETT Vol.5,No.5 September-Octo
ber 1994 pp39/573-48/582 等が知られている。
【0003】CELP方式の音源は、適応符号帳と固定
符号帳(確立的符号帳、雑音符号帳)の2種類の符号帳
から選ばれる音源ベクトルから構成される。このうち、
適応符号帳は、音源信号(特に母音部)に含まれる周期
的成分を表現するもので、過去に合成した音源信号波形
を蓄えたものである。一方、固定符号帳は、音源信号か
ら周期的成分を取り除いた後のランダムな波形(音源信
号のランダム成分)を表現するために予め容易されてい
るものである。固定符号帳は、乱数によって作成された
ものや、多数の音声データを用いて学習して作成したも
の、パルス列によって構成されるものなど、多くの種類
のものが提案され、用いられている。一般に、CELP
方式の音声符号化装置においては、音声信号を一定の時
間長に区切って処理を行なう(フレーム処理)。このた
め音源波形の符号化も、ある一定時間長毎に行なわれ
る。しかし、この一定時間長が長くなるとその時間内に
音源信号の周期性が変化してしまい、適応符号帳で音源
信号の周期成分を十分に取り除くことができなくなる。
【0004】以下にCELP方式に基づく従来の音声符
号化装置における代表的なピッチ抽出装置の構成を図6
を参照して説明する。図6において、入力音声信号ベク
トル10は、一般には聴覚的な重み付けを行なった後の
入力音声信号で、一定時間長Lの信号列である。入力音
声信号ベクトル10は、零入力応答除去器11により、
フィルタ係数12により構成される声道特性を表すディ
ジタルフィルタの零入力応答成分が除去される。零入力
応答成分を除去された入力音声信号ベクトルは、ターゲ
ットベクトルと呼ばれ、適応符号帳探索時のターゲット
になる。一方、適応符号帳13からは、位置Piを先頭
とした時間長Lの信号列が符号ベクトルとして取り出さ
れる。インパルス応答畳み込み器14は、この符号ベク
トルに声道特性を表すディジタルフィルタのインパルス
応答ベクトル15を畳み込むことにより、声道特性を表
すディジタルフィルタの零状態応答ベクトルが求められ
る。零状態応答ベクトルは、ピッチ探索範囲に含まれる
全ての適応符号帳符号ベクトルに対して算出され、探索
範囲に含まれる全てのPiについて時間長Lの符号ベク
トルが取り出される。この零状態応答ベクトルとターゲ
ットベクトルの正規化相互相関関数を正規化相互相関算
出器16によって算出し、ピッチ探索器(最大値探索
器)17によって相互相関関数が最大となる零状態応答
ベクトルを出力する適応符号帳符号ベクトルの先頭位置
Piがピッチ周期(ラグ)18として出力される。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来の適応符号帳では、一定時間長Lのデータ列の中でピ
ッチ周期が変化すると、一定時間長Lのデータ列の前半
と後半とで最適なピッチラグが異なってしまうため、デ
ータ列の前半と後半の双方に適する符号ベクトルを得る
ことが難しくなるという問題を有していた。
【0006】上記従来の問題を解決するために、本発明
の第1および第2の目的は、適応符号帳の符号ベクトル
を符号化対象データ列の前半と後半のピッチラグを用い
て作成し、符号化対象データ列内でピッチ周期が変化す
る場合においても、データ列の前半と後半の双方に適す
る符号ベクトルが得られるようにすることにある。
【0007】また、本発明の第3の目的は、符号化対象
データ列の前半と後半でピッチ周期が変化している場
合、適応符号帳探索時に符号化対象データ列のピッチ周
期の候補を少なくとも2つ以上出力し、それぞれのピッ
チ周期に基づいて適応符号帳から取り出された適応符号
ベクトルを用いて固定符号帳探索を行ない、最終的に得
られる復号音声が最も入力音声(符号化対象データ列)
に近くなるものを少なくとも2つ以上のピッチ周期の硬
派の中から最終的に決定することにより、符号化対象デ
ータ列の中でピッチ周期が変化する場合において、ピッ
チ周期を一定するこによる影響を最小限にすることにあ
る。
【0008】
【課題を解決するための手段】上記第1および第2の目
的を達成するために、第1および第2の発明は、前フレ
ームまたは前サブフレームのピッチ周期と現フレームま
たは現サブフレームのピッチ周期を用いて作成される適
応符号ベクトルを用いて現フレームまたは現サブフレー
ムのピッチ周期を決定するようにしたものである。
【0009】上記第3の目的を達成するために、第3の
発明は、入力信号の持つ周期性の特徴によって、ディレ
ードディシジョンを適用するようにしたものである。
【0010】上記構成によって、第1および第2の発明
においては、適応符号ベクトルを2つ以上のピッチ周期
を用いて生成するため、一定時間長のデータ列(1フレ
ームまたは1サブフレーム)の前半と後半でピッチ周期
が変化している場合においても、データ列全体にわたっ
て最適な適応符号ベクトルを得ることが可能となる。
【0011】また上記構成によって、第3の発明におい
ては、一定時間長のデータ列(1フレームまたは1サブ
フレーム)の前半と後半でピッチ周期が変化している場
合においては、ディレードディシジョンを適用すること
によって、ピッチ周期を1つにしてしまうことの影響を
最小限に抑えることがきる。
【0012】
【発明の実施の形態】本発明の請求項1に記載の発明
は、前フレームまたは前サブフレームのピッチ周期と現
フレームまたは現サブフレームのピッチ周期を用いて作
成される適応符号ベクトルを用いて現フレームまたは現
サブフレームのピッチ周期を決定する音声符号化装置に
おけるピッチ抽出装置であり、符号化対象データ列内で
ピッチ周期が変化する場合においても、データ列の前半
と後半の双方に適する符号ベクトルが得られる。
【0013】本発明の請求項2に記載の発明は、請求項
1記載のピッチ抽出装置によって決定された現フレーム
または現サブフレームのピッチ周期と前フレームまたは
前サブフレームのピッチ周期を用いて作成される適応符
号ベクトルを用いて作成される励振音源から構成される
音声符号化装置における適応符号帳であり、符号化対象
データ列内でピッチ周期が変化する場合においても、デ
ータ列の前半と後半の双方に適する符号ベクトルが得ら
れる。
【0014】本発明の請求項3に記載の発明は、請求項
1記載のピッチ抽出装置と請求項2記載の適応符号帳を
有する音声符号化装置であり、符号化対象データ列内で
ピッチ周期が変化する場合においても、データ列の前半
と後半の双方に適する符号ベクトルが得られる。
【0015】本発明の請求項4に記載の発明は、請求項
1記載の適応符号ベクトルを、少なくとも2以上の短い
データ列をつなぎ合わせることによって形成する音声符
号化装置における適応符号ベクトル生成器であり、符号
化対象データ列内でピッチ周期が変化する場合において
も、データ列の前半と後半の双方に適する符号ベクトル
が得られる。
【0016】本発明の請求項5に記載の発明は、請求項
4記載の短いデータ列を各データ列毎に決定されたピッ
チ周期に基づいて過去の音源信号を蓄えた適応符号帳の
中から選択する音声符号化装置における適応符号ベクト
ル生成器であり、符号化対象データ列内でピッチ周期が
変化する場合においても、データ列の前半と後半の双方
に適する符号ベクトルが得られる。
【0017】本発明の請求項6に記載の発明は、請求項
5記載の各データ列毎に決定されたピッチ周期を、前フ
レームまたは前サブフレームの最後のデータ列のピッチ
周期と現フレームまたは現サブフレームの後のデータ列
のピッチ周期を用いた補間処理によって決定する音声符
号化装置における適応符号ベクトル生成器であり、符号
化対象データ列内でピッチ周期が変化する場合において
も、データ列の前半と後半の双方に適する符号ベクトル
が得られる。
【0018】本発明の請求項7に記載の発明は、請求項
6記載の現フレームまたは現サブフレームの最後のデー
タ列のピッチ周期を、最後のデータ列のみを用いるので
はなく、ピッチ周期が補間によって決定されるデータ列
をすべて用いて決定する音声符号化装置におけるピッチ
抽出装置であり、符号化対象データ列内でピッチ周期が
変化する場合においても、データ列の前半と後半の双方
に適する符号ベクトルが得られる。
【0019】本発明の請求項8に記載の発明は、請求項
4または請求項5または請求項6記載の適応符号ベクト
ル生成器または請求項7記載のピッチ抽出装置を有する
音声符号化装置であり、符号化対象データ列内でピッチ
周期が変化する場合においても、データ列の前半と後半
の双方に適する符号ベクトルが得られる。
【0020】本発明の請求項9に記載の発明は、入力信
号の持つ周期性の特徴によって、ディレードディシジョ
ンを適用する音声符号化装置におけるピッチ抽出装置で
あり、符号化対象データ列の中でピッチ周期が変化する
場合において、ピッチ周期を一定することによる影響を
最小限にすることができる。
【0021】本発明の請求項10に記載の発明は、フレ
ーム長またはサブフレーム長よりも短いデータ列を用い
て自己相関関数の算出を行ない、この自己相関関数を請
求項9記載のディレードディシジョンを行なうか否かの
判断基準として用いる音声符号化装置におけるピッチ抽
出装置であり、符号化対象データ列の中でピッチ周期が
変化する場合において、ピッチ周期を一定することによ
る影響を最小限にすることができる。
【0022】本発明の請求項11に記載の発明は、請求
項9または請求項10記載のピッチ抽出装置を有する音
声符号化装置であり、符号化対象データ列の中でピッチ
周期が変化する場合において、ピッチ周期を一定するこ
とによる影響を最小限にすることができる。
【0023】(実施の形態1)以下本発明の第1の実施
の形態について、図1を参照しながら説明する。ここで
は、CELP音声符号化装置のピッチ抽出装置について
説明する。図1において、100は入力音声ベクトルで
あり、101は一定時間長Lの入力音声ベクトル100
とフィルタ係数102を入力として零入力応答除去後の
入力音声ベクトル(ターゲットベクトル)を自己相関算
出器103および正規化相互相関算出器104に出力す
る零入力応答除去器である。102は適応符号帳探索に
先立って行なわれる線形予測分析によって得られた声道
特性を表すディジタルフィルタのフィルタ係数である。
103は零入力応答除去器101から出力されたターゲ
ットベクトルの自己相関関数を算出して符号ベクトル生
成器105に出力する自己相関算出器である。104は
零入力応答除去器101から出力されたターゲットベク
トルとインパルス応答畳み込み器106から出力された
零状態応答ベクトルの正規化相互相関関数を算出し、ピ
ッチ探索器107に出力する正規化相互相関算出器であ
る。105は自己相関算出器103から出力された自己
相関関数と遅延器108から出力された直前の一定時間
長Lにおけるピッチ周期と適応符号帳109から取り出
された時間長Lの符号ベクトルを用いて、現在の時間長
Lの音声ベクトルに対応する適応符号ベクトルを生成
し、インパルス応答畳み込み器106に出力する符号ベ
クトル生成器である。106は符号ベクトル生成器10
5から出力された符号ベクトルにインパルス応答ベクト
ル110を畳み込んで、正規化相互相関算出器104に
出力するインパルス応答畳み込み器である。107は正
規化相互相関算出器104から出力された正規化自己相
関関数を最大とするピッチラグを探索しピッチラグとし
て出力するピッチ探索器である。なお、このとき出力さ
れるピッチラグは遅延器108にも出力される。108
はピッチ探索器107から出力されたピッチラグを後続
の時間長Lの適応符号帳探索時に用いるため、時間長L
の分だけピッチラグを保持し、時間長L経過後に符号ベ
クトル生成器105に出力する遅延器である。109は
過去に生成された励振音源ベクトルのバッファによって
構成される適応符号帳である。110は適応符号帳探索
に先立って算出される声道を表すディジタルフィルタの
インパルス応答ベクトルである。
【0024】以上のように構成されたピッチ抽出装置に
ついて、以下にその動作を説明する。図1において、入
力音声信号ベクトル100は、一般には聴覚的な重み付
けを行なった後の入力音声信号で、一定時間長Lの信号
列である。入力音声信号ベクトル100は、零入力応答
除去器101により、フィルタ係数102(適応符号帳
探索に先立ち、線形予測分析によって算出される。)に
より構成される声道特性を表すディジタルフィルタの零
入力応答成分が除去される。零入力応答成分を除去され
た入力音声信号ベクトルはターゲットベクトルと呼ば
れ、適応符号帳探索時のターゲットになる。ターゲット
ベクトルは、まず自己相関算出器103に出力され、自
己相関関数が符号ベクトル生成器105に出力される。
【0025】符号ベクトル生成器105は、自己相関関
数の大きくなる複数のピッチラグ(Pi2)をピッチラ
グ候補として選出し、それぞれのPi2と過去の(直前
の時間長Lのデータ列で出力された)ピッチラグPiを
用いて適応符号帳109から時間長Lの適応符号ベクト
ルを2種類取り出す。取り出された2種類の適応符号ベ
クトルを用いて1つの符号ベクトルを生成し、インパル
ス応答畳み込み器106に出力する。
【0026】インパルス応答畳み込み器106は、符号
ベクトル生成器105で算出された符号ベクトルにイン
パルス応答ベクトル110(適応符号帳探索に先立って
算出される。)を畳み込み、声道特性を表すディジタル
フィルタの零状態応答ベクトルを算出し、正規化自己相
関算出器104に出力する。正規化自己相関算出器10
4では、零入力応答除去器101で算出されたターゲッ
トベクトルとインパルス応答畳み込み器106で算出さ
れた零状態応答ベクトルの正規化自己相関関数を算出
し、ピッチ探索器(最大値探索器)107に出力する。
【0027】ピッチ探索器107は、正規化自己相関関
数を最大とするPi2をピッチラグとして出力する。ま
た、ピッチ探索器107で出力されるピッチラグは、遅
延器108にも出力され、後続の時間長Lのデータ列に
対する適応符号帳探索時に用いられる。
【0028】図2は第1の実施の形態における符号ベク
トル生成器105の構成を示す。図2において、200
は自己相関算出器103から自己相関関数を入力し、ピ
ッチ候補を符号ベクトル201に出力するピッチ候補選
択器である。201はピッチ候補選択器からPi2を入
力し、Pi2に基づいて適応符号帳109から適応ベク
トルを取り出して、窓掛処理器202に出力する符号ベ
クトル取得器である。202は符号ベクトル取得器20
1から入力した符号ベクトルに窓掛処理を行なって、加
算器205に出力する窓掛処理器である。203は遅延
器108から過去のピッチラグPiを入力し、Piに基
づいて適応符号帳109から適応ベクトルを取り出し
て、窓掛処理器204に出力する符号ベクトル取得器で
ある。204は符号ベクトル取得器203から入力した
符号ベクトルに窓掛処理を行なって、加算器205に出
力する窓掛処理器である。205は窓掛処理器202お
よび204から入力した窓掛後の符号ベクトルを加算し
て出力する加算器である。
【0029】以上のように構成された符号ベクトル生成
器105について、以下にその動作を説明する。図2に
おいて、ピッチ候補選択器200は、自己相関算出器1
03で算出された自己相関関数が大きくなるラグをピッ
チラグの候補として、予め定められた数(例えばK個)
だけ選択し、Pi2として符号ベクトル取得器201に
出力する。符号ベクトル取得器201は、選択されたK
個のPi2に対応する符号ベクトルを適応符号帳109
からKベクトルを取り出し、窓掛処理器202に出力す
る。窓掛処理器202は、符号ベクトル取得器201か
ら出力されたKベクトルに窓掛を行ない、加算器205
に出力する。ここで、窓掛処理器202および204が
有する窓は下記式(1)の性質を有し(時間軸上で反転
した窓関数となる。)、窓掛処理器202の窓関数は符
号ベクトルの後半に重みを持ち、窓掛処理器204の窓
関数は符号ベクトルの前半に重みを持つ。式(1)にお
いて、W1[i]、W2[i]はそれぞれ、窓掛処理器
202の窓関数、窓掛処理器204の窓関数を表す。具
体的な例としては、三角窓、正弦窓(余弦窓)などが挙
げられる。 W1[i]+W2[i]=1.0,i=0,…,L−1 ・・・(1)
【0030】一方、符号ベクトル取得器203では、遅
延器108から出力された過去の(一定時間長Lだけ過
去の)ピッチラグPiに基づいた符号ベクトルを適応符
号帳109から取り出す。符号ベクトル取得器203か
ら出力された符号ベクトル(1ベクトル)は、窓掛処理
器204で窓掛処理が行なわれ、加算器205に出力さ
れる。加算器205では、窓掛処理器202から出力さ
れたKベクトルのコードベクトルと、窓掛処理器204
から出力された1ベクトルのコードベクトルとの加算を
行ない、Kベクトルのコードベクトルおよび各コードベ
クトルに対応するPi2をインパルス応答畳み込み器1
06に出力する。
【0031】このように、上記第1の実施の形態によれ
ば、前フレームまたは前サブフレームのピッチ周期と現
フレームまたは現サブフレームのピッチ周期を用いて作
成される適応符号ベクトルを用いて現フレームまたは現
サブフレームのピッチ周期を決定するようにしたので、
符号化対象データ列内でピッチ周期が変化する場合にお
いても、データ列の前半と後半の双方に適する符号ベク
トルを得ることができる。
【0032】(実施の形態2)次に、本発明の第2の実
施の形態について説明する。第2の実施の形態は第1の
実施の形態における符号ベクトル生成器105の構成を
除いては第1の実施の形態と同じである。図3は本実施
例における符号ベクトル生成器105の構成を示す。こ
の符号ベクトル生成器105は、時間長Lの符号ベクト
ルを、少なくとも2つ以上の符号ベクトルをつなぎ合わ
せることにより生成する。図3では、時間長Lの符号ベ
クトルを4つの短い符号ベクトル(時間長L/4)をつ
なぎ合わせて生成するものを示している。
【0033】図3において、300は自己相関器103
から自己相関関数を入力し、ピッチ候補を決定してピッ
チ候補器301に出力するピッチ候補選択器である。3
01はピッチ候補選択器103からピッチ候補を入力
し、時間長Lだけ過去のピッチラグを遅延器108から
入力し、2つのピッチラグを補間して得られるピッチラ
グを符号ベクトル取得器302、303、304、30
5にそれぞれ出力するピッチ補間器である。302はピ
ッチ補間器301から入力されたピッチラグに基づい
て、適応符号帳109から適応符号ベクトルを取り出
し、符号ベクトル取得器303と符号ベクトル連結器3
06に出力する符号ベクトル取得器である。303はピ
ッチ補間器301から入力されたピッチラグに基づい
て、適応符号帳109および符号ベクトル取得器302
から適応符号ベクトルを取り出し、符号ベクトル取得器
304と符号ベクトル連結器306に出力する符号ベク
トル取得器である。304はピッチ補間器301から入
力されたピッチラグに基づいて、適応符号帳109およ
び符号ベクトル取得器303から適応符号ベクトルを取
り出し、符号ベクトル取得器305と符号ベクトル連結
器306に出力する符号ベクトル取得器である。305
はピッチ補間器301から入力されたピッチラグに基づ
いて、適応符号帳109および符号ベクトル取得器30
4から適応符号ベクトルを取り出し、符号ベクトル取得
器305と符号ベクトル連結器306に出力する符号ベ
クトル取得器である。306は符号ベクトル取得器30
2、303、304、305から出力された符号ベクト
ルを連結して、時間長Lの符号ベクトルを出力する符号
ベクトル連結器である。
【0034】以上のように構成された符号ベクトル生成
器105について、以下にその動作を説明する。図3に
おいて、自己相関算出器103は、ピッチ探索範囲の最
小ピッチラグ値L2(例えば20サンプル)程度または
それ以下のデータ列(以下これを単位ベクトルと呼
ぶ。)を、最新の時間長Lのターゲットベクトルの最後
尾から取り出し、この単位ベクトルを用いて自己相関関
数を算出して、ピッチ候補選択器300に出力する。ピ
ッチ候補選択器300は、自己相関算出器103で算出
された自己相関関数が大きくなるラグをピッチラグの候
補として、予め定められた数(例えばK個)だけ選択
し、Pi2としてピッチ補間器301に出力する。ピッ
チ補間器301は、遅延器108から出力された時間長
Lだけ過去におけるピッチラグと、ピッチ補間器301
から出力されたK個のPi2を用いて、最新のターゲッ
トベクトルの最後尾の単位ベクトル(最小ピッチラグ値
以下の時間長)と時間長Lだけ過去のターゲットベクト
ルの最後尾の単位ベクトル(最小ピッチラグ値以下の時
間長)との間に存在する複数個(図3においては3個
(4個目は最後尾の単位ベクトル))の単位ベクトルタ
ーゲットベクトルに対応するピッチラグを補間処理によ
って決定し、得られたピッチラグ値を符号ベクトル取得
器302、303、304、305にK個ずつそれぞれ
出力する。ここで、符号ベクトル取得器302に出力さ
れるピッチラグは、最新のターゲットベクトルの先頭の
単位ベクトルに対するもので、時間的には最も過去の単
位ベクトルに対応するピッチラグである。以下、符号ベ
クトル取得器303、304、305の順に時間的に新
しい単位ベクトルに対応するピッチラグが出力される。
【0035】符号ベクトル取得器302では、ピッチ補
間器301から出力されたピッチラグに基づいて、適応
符号帳109から時間長L2の単位適応符号ベクトルが
取り出され、符号ベクトル取得器303および符号ベク
トル連結器306に出力される(K個のピッチラグそれ
ぞれについて符号ベクトルは出力される。)。
【0036】符号ベクトル取得器303では、ピッチ補
間器301から出力されたピッチラグに基づいて、適応
符号帳109から時間長L2の単位適応符号ベクトルが
取り出され、符号ベクトル取得器304および符号ベク
トル連結器306に出力される(K個のピッチラグそれ
ぞれについて符号ベクトルは出力される。)。なお、符
号ベクトル取得器302から(符号ベクトル取得器30
3に)入力される適応符号ベクトルは、ピッチ補間器3
01から(符号ベクトル取得器303に)入力されたピ
ッチラグ値が時間長Lより短い場合に用いられる。
【0037】符号ベクトル取得器304では、ピッチ補
間器301から出力されたピッチラグに基づいて、適応
符号帳109から時間長L2の単位適応符号ベクトルが
取り出され、符号ベクトル取得器305および符号ベク
トル連結器306に出力される(K個のピッチラグそれ
ぞれについて符号ベクトルは出力される。)。なお、符
号ベクトル取得器303から(符号ベクトル取得器30
4に)入力される適応符号ベクトルは、ピッチ補間器3
01から(符号ベクトル取得器304に)入力されたピ
ッチラグ値が時間長Lより短い場合に用いられる。
【0038】符号ベクトル取得器305では、ピッチ補
間器301から出力されたピッチラグに基づいて、適応
符号帳109から時間長L2の単位適応符号ベクトルが
取り出され、符号ベクトル連結器306に出力される
(K個のピッチラグそれぞれについて符号ベクトルは出
力される。)。なお、符号ベクトル取得器304から
(符号ベクトル取得器305に)入力される適応符号ベ
クトルは、ピッチ補間器301から(符号ベクトル取得
器305に)入力されたピッチラグ値が時間長Lより短
い場合に用いられる。
【0039】符号ベクトル取得器306では、符号ベク
トル取得器302、303、304、305から出力さ
れた時間長L2の単位適応符号ベクトルを連結して、時
間長Lの適応符号ベクトルを出力する(K個のピッチラ
グそれぞれについて符号ベクトルは出力され、それぞれ
の符号ベクトルに対応する最後尾の単位ベクトルに対す
るピッチラグ情報も合わせて出力される。)。
【0040】このように、上記第2の実施の形態によれ
ば、適応符号ベクトルをターゲットベクトルの前半のピ
ッチと後半のピッチを用いて生成することによって、タ
ーゲットベクトル内でピッチが変化してしまう場合にお
いても、有効な適応ベクトルを得ることができる。
【0041】なお、図2、図3のピッチ候補選択器20
0、300において、倍ピッチ等のピッチが候補として
出力された場合においても、選択された候補の中に適切
なピッチ候補が1つ以上含まれていれば、有効な適応符
号ベクトルがピッチ探索器107で選択されるので、ピ
ッチ候補選択器200、300では、十分な数のピッチ
候補を出力していれば、ピッチの連続性等をチェックす
る必要はない。
【0042】(実施の形態3)次に、本発明の第3の実
施の形態について、図4を参照しながら説明する。ここ
では、CELP音声符号化装置のピッチ抽出装置のみに
ついて説明する。図4において、400は入力部ベクト
ルであり、401は一定時間長Lの入力音声ベクトル4
00とフィルタ係数402を入力として零入力応答除去
後の入力音声ベクトル(ターゲットベクトル)をディレ
ードディシジョン判定器403および正規化相互相関算
出器404に出力する零入力応答除去器である。402
は適応符号帳探索に先立って行なわれる線形予測分析に
よって得られた声道特性を表すディジタルフィルタのフ
ィルタ係数である。403は零入力応答除去器401か
ら出力されたターゲットベクトルを用いて、ディレード
ディシジョンを行なうか否かを判定し、判定結果をピッ
チ探索器405に出力するディレードディシジョン判定
器である。404は零入力応答除去器401から出力さ
れたターゲットベクトルとインパルス応答畳み込み器4
06から出力された零状態応答ベクトル正規化相互相関
関数を算出し、ピッチ探索器405に出力する正規化相
互相関算出器である。405は正規化相互相関算出器4
04から出力された正規化相関関数を最大とするピッチ
ラグを探索し、ピッチラグ409として出力するピッチ
探索器である。406は適応符号帳407からピッチラ
グPiを先頭とする時間長Lの適応符号ベクトルとイン
パルス応答ベクトル408を入力とし、適応符号ベクト
ルにインパルス応答ベクトルを畳み込んで、正規化相互
相関算出器404に出力するインパルス応答畳み込み器
である。407は過去に生成された励振音源ベクトルの
バッファによって構成される適応符号帳である。408
は適応符号帳探索に先立って算出される声道特性を表す
ディジタルフィルタのインパルス応答ベクトルである。
【0043】以上のように構成されたピッチ抽出装置に
ついて、以下にその動作を説明する。図1において、入
力音声信号ベクトル400は、一般には聴覚的な重み付
けを行なった後の入力音声信号で、一定時間長Lの信号
列である。入力音声信号ベクトル401は、零入力応答
除去器402により、フィルタ係数402(適応符号帳
探索に先立ち、線形予測分析によって算出される。)に
より構成される声道特性を表すディジタルフィルタの零
入力応答成分が除去される。零入力応答成分を除去され
た入力音声信号ベクトルは、ターゲットベクトルと呼ば
れ、適応符号帳探索時のターゲットになる。ターゲット
ベクトルを用いて、ディレードディシジョン判定器40
3は、適応符号帳の最終決定をディレードディシジョン
によって行なうか否かを判定し、判定結果をピッチ探索
器に出力する。ここで、ディレードディシジョンを行な
うべきであるとの判定結果が得られた場合には、ピッチ
探索器405は、ピッチラグの候補を少なくとも2候補
以上選択し、固定符号帳(ランダム符号帳)探索部に出
力する。そして、複数の適応符号ベクトルに対して固定
符号帳探索を行なった結果、最終的な合成音声ベクトル
が入力音声ベクトルが入力音声ベクトルに最も近くなる
組み合わせを最終結果(ピッチラグ、固定符号帳インデ
クス、ゲインインデクス)として選択する。
【0044】一方、適応符号帳407からは位置Piを
先頭とした時間長Lの信号列が符号ベクトルとして取り
出される。インパルス応答畳み込み器406は、この符
号ベクトル声道特性を表すディジタルフィルタのインパ
ルス応答ベクトル408を畳み込むことにより、声道特
性を表すディジタルフィルタの零状態応答ベクトルが求
められる。零状態応答ベクトルは、ピッチ探索値に含ま
れる全ての適応符号帳符号ベクトルに対して算出される
(探索範囲に含まれる全てのPiについて時間長Lの符
号ベクトルが取り出される。)。この零状態応答ベクト
ルとターゲットベクトルの正規化相互相関関数を正規化
相互相関算出器404によって算出し、最大値探索器4
05によって相互相関関数が最大となる零状態対応ベク
トルを出力する適応符号帳符号ベクトルの先頭位置Pi
がピッチラグ409として出力される。ここで、前述の
ようにディレードディシジョン判定器403の結果によ
っては、ピッチラグ409は少なくとも2つ以上出力さ
れ、後段の固定符号帳(ランダム符号帳)探索を行なっ
た後に、ディレードディシジョンによって最終的な最適
ピッチラグが決定される。
【0045】図5は第3の実施の形態におけるディレー
ドディシジョン判定器403の構成を示す。図5におい
て、500は零入力応答除去器401から出力されたタ
ーゲットベクトルを少なくとも2つ以上(図においては
4つ)の時間的に連続するサンプルデータ列(ベクト
ル)に分割し、自己相関算出器501、502、50
3、504に出力するベクトル分割器である。501は
ベクトル分割器500により分割されたベクトルの中
で、時間的に先頭のベクトルと、バッファ513のデー
タ列を入力として、自己相関関数を算出し、最大値検出
器505に出力する自己相関算出器である。502はベ
クトル分割器500により分割されたベクトルの中で、
時間的に先頭および2番目のベクトルと、バッファ51
3のデータ列を入力として、自己相関関数を算出し、最
大値検出器506に出力する自己相関算出器である。5
03はベクトル分割器500により分割されたベクトル
の中で、時間的に先頭および2番目および3番目のベク
トルと、バッファ513のデータ列を入力として、自己
相関関数を算出し、最大値検出器507に出力する自己
相関算出器である。504はベクトル分割器500によ
り分割されたベクトルの中で、時間的に先頭および2番
目および3番目および最後のベクトルを用いて自己相関
関数を算出し、最大値検出器508に出力する自己相関
算出器である。505は自己相関算出器501から出力
された自己相関関数の最大値を検出して、比較器509
に出力する最大値検出器である。506は自己相関算出
器502から出力された自己相関関数の最大値を検出し
て、比較器509、510に出力する最大値検出器であ
る。507は自己相関算出器503から出力された自己
相関関数の最大値を検出して、比較器510、511に
出力する最大値検出器である。508は自己相関算出器
504から出力された自己相関関数の最大値を検出し
て、比較器511に出力する最大値検出器である。50
9は最大値検出器505と最大値検出器506の出力を
比較し、両者の値が予め定められた範囲内に存在するか
否かの判定結果を判定器512に出力する比較器であ
る。510は最大値検出器506と最大値検出器507
の出力を比較し、両者の値が予め定められた範囲内に存
在するか否かの判定結果を判定器512に出力する比較
器である。511は最大値検出器507と最大値検出器
508の出力を比較し、両者の値が予め定められた範囲
内に存在するか否かの判定結果を判定器512に出力す
る比較器である。512は比較器509、510、51
1から出力された結果から、ディレードディシジョンを
行なうか否かを判定し、ピッチ探索器405に出力する
判定器である。513は零入力応答除去器401からタ
ーゲットベクトルを入力し、有限時間保持し、自己相関
算出器501、502、503、504に出力するバッ
ファである。
【0046】以上のように、構成されたディレードディ
シジョン判定器403について、以下にその動作を説明
する。ベクトル分割器500は、零入力応答除去器40
1から入力されたターゲットベクトルを時間的に連続し
たサンプル列からなる少なくとも2つ以上(図5におい
ては4つ)のベクトルに分割し、自己相関算出器50
1、502、503、504に出力する。ここで、ター
ゲットベクトルを分割して得られたベクトルのうち、時
間的に先頭のベクトル(第1のベクトルとする。)が自
己相関算出器501に、時間的に先頭および2番目(第
2のベクトルとする。)のベクトルが自己相関算出器5
02に、時間的に先頭および2番目および3番目(第3
のベクトルとする。)のベクトルが自己相関算出器50
3に、時間的に先頭および2番目および3番目および最
後(第4のベクトルとする。)のベクトルが自己相関算
出器504に出力される。また、零入力応答除去器40
1から出力されたターゲットベクトルは、バッファ51
3にも入力され、バッファ513内に存在する有限時間
長BLのデータ列は、ターゲットベクトルの時間長Lだ
けシフトされ(このとき、バッファのデータ列の先頭の
時間長Lのデータは捨てられる。)、有限時間長のデー
タ列の最後の部分(時間長L)に、新たに入力されたタ
ーゲットベクトルが格納される。そして、新たに入力さ
れたターゲットベクトルの部分を除いた有限時間長(B
L−L)のデータ列が、自己相関算出器501、50
2、503、504に出力される。
【0047】自己相関算出器501では、ベクトル分割
器500から出力される第1のベクトルを用いて、この
ベクトルよりも時間的に過去のデータ列との自己相関関
数を計算する。ここで、時間的に過去のデータ列とは、
バッファ513のデータ列そのものである。
【0048】自己相関算出器502では、ベクトル分割
器500から出力される第2のベクトルを用いて、この
ベクトルよりも時間的に過去のデータ列との自己相関関
数を計算する。ここで、時間的に過去のデータ列とは、
バッファ513と第1のベクトルを合わせたものであ
る。
【0049】自己相関算出器503では、ベクトル分割
器500から出力される第3のベクトルを用いて、この
ベクトルよりも時間的に過去のデータ列との自己相関関
数を計算する。ここで、時間的に過去のデータ列とは、
バッファ513と第1および第2のベクトルを合わせた
ものである。
【0050】自己相関算出器504では、ベクトル分割
器500から出力される第4のベクトルを用いて、この
ベクトルよりも時間的に過去のデータ列との自己相関関
数を計算する。ここで、時間的に過去のデータ列とは、
バッファ513と第1および第2および第3のベクトル
を合わせたものである。
【0051】最大値検出器505、506、507、5
08では、それぞれ自己相関算出器501、502、5
03、504で算出された自己相関関数の最大値を検出
し、そのときのラグ値を比較器509、510、511
に出力する。
【0052】比較器509、510、511では、それ
ぞれ入力された2つのラグ値が予め定められた範囲内に
存在する(具体的には2つのラグ値が等しいか非常に近
い値となっているか、または、2つのラグ値が倍数か約
数の関係にあるか非常に近い関係になっている。)場合
にはディレードディシジョンの必要がないと判定し、そ
れ以外の場合はディレードディシジョンの必要があるあ
と判定し、判定結果を判定器512に出力する。
【0053】判定器512では、比較器509、51
0、511の判定結果が全てディレードディシジョンの
必要なしである場合のみ、ディレードディシジョンを行
なわない判定結果をピッチ探索器405に出力、それ以
外の場合はディレードディシジョンを行なう判定結果を
ピッチ探索器405に出力する。
【0054】なお、ベクトル分割器500から出力され
る第1のベクトルと第4のベクトル(分割したベクトル
の中で時間的に最後のベクトル)のみに対して自己相関
関数を算出し、それぞれを最大とするラグ値を比較器に
よって比較するだけでも、ターゲットベクトルの先頭と
最後尾のピッチ変化を判定できる。
【0055】このように、上記第3の実施の形態によれ
ば、ターゲットベクトルを細分化してピッチ探索を行な
うことによって、ターゲットベクトル内でピッチ周期が
変動することを適応符号帳探索時に予め発見しておき、
ターゲットベクトル内でピッチ周期が変動している場合
は、ディレードディシジョンを適応符号帳探索に適用す
ることで、ターゲットベクトル内でピッチ周期を一定と
仮定してしまうことの影響を最小限に抑えることができ
る。
【0056】
【発明の効果】以上のように本発明は、CELP音声符
号化方式において、1フレームまたは1サブフレーム内
でピッチ周期が変動している場合においても、2種類以
上のピッチ周期を持たせた適応符号ベクトルを適用した
り、ディレードディシジョンを適用するなどして、1フ
レームまたはサブフレーム内におけるピッチ周期の変動
の影響を解消あるいは最小限に抑えることができる優れ
た音声符号化装置、ピッチ抽出装置、適応符号帳、適応
符号ベクトル生成器を実現できるものである。
【図面の簡単な説明】
【図1】本発明の第1および第2の実施の形態における
ピッチ抽出装置のブロック図
【図2】本発明の第1の実施の形態における適応符号ベ
クトル生成器のブロック図
【図3】本発明の第2の実施の形態における適応符号ベ
クトル生成器のブロック図
【図4】本発明の第3の実施の形態におけるピッチ抽出
装置のブロック図
【図5】本発明の第3の実施の形態におけるディレード
ディシジョン判定器のブロック図
【図6】従来のCELP音声符号化装置におけるピッチ
抽出装置のブロック図
【符号の説明】
100 入力音声ベクトル 101 零入力応答除去器 102 フィルタ係数 103 自己相関算出器 104 正規化相互相関算出器 105 符号ベクトル生成器 106 インパルス応答畳み込み器 107 ピッチ探索器 108 遅延器 109 適応符号帳 110 インパルス応答ベクトル 200 ピッチ候補選択器 201、203 符号ベクトル取得器 202、204 窓掛け処理器 205 加算器 301 ピッチ補間器 302、303、304、305 符号ベクトル取得器 306 符号ベクトル連結器 401 入力音声ベクトル 402 零入力応答除去器 403 ディレードディシジョン判定器 404 正規化相互相関算出器 405 ピッチ探索器 406 インパルス応答畳み込み器 407 適応符号帳 408 インパスル応答ベクトル 409 ピッチ周期(ラグ) 500 ベクトル分割器 501、502、503、504 自己相関算出器 505、506、507、508 最大値検出器 509、510、511 比較器 512 判定器

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 前フレームまたは前サブフレームのピッ
    チ周期と現フレームまたは現サブフレームのピッチ周期
    を用いて作成される適応符号ベクトルを用いて現フレー
    ムまたは現サブフレームのピッチ周期を決定する音声符
    号化装置におけるピッチ抽出装置。
  2. 【請求項2】 請求項1記載のピッチ抽出装置によって
    決定された現フレームまたは現サブフレームのピッチ周
    期と前フレームまたは前サブフレームのピッチ周期を用
    いて作成される適応符号ベクトルを用いて作成される励
    振音源から構成される音声符号化装置における適応符号
    帳。
  3. 【請求項3】 請求項1記載のピッチ抽出装置と請求項
    2記載の適応符号帳を有する音声符号化装置。
  4. 【請求項4】 請求項1記載の適応符号ベクトルを、少
    なくとも2以上の短いデータ列をつなぎ合わせることに
    よって形成する音声符号化装置における適応符号ベクト
    ル生成器。
  5. 【請求項5】 請求項4記載の短いデータ列を各データ
    列毎に決定されたピッチ周期に基づいて過去の音源信号
    を蓄えた適応符号帳の中から選択する音声符号化装置に
    おける適応符号ベクトル生成器。
  6. 【請求項6】 請求項5記載の各データ列毎に決定され
    るピッチ周期を、前フレームまたは前サブフレームの最
    後のデータ列のピッチ周期と現フレームまたは現サブフ
    レームの最後のデータ列のピッチ周期を用いた補間処理
    によって決定する音声符号化装置における適応符号ベク
    トル生成器。
  7. 【請求項7】 請求項6記載の現フレームまたは現サブ
    フレームの最後のデータ列のピッチ周期を、最後のデー
    タ列のみを用いるのではなく、ピッチ周期が補間によっ
    て決定されるデータ列をすべて用いて決定する音声符号
    化装置におけるピッチ抽出装置。
  8. 【請求項8】 請求項4または請求項5または請求項6
    記載の適応符号ベクトル生成器または請求項7記載のピ
    ッチ抽出装置を有する音声符号化装置。
  9. 【請求項9】 入力信号の持つ周期性の特徴によって、
    ディレードディシジョンを適用する音声符号化装置にお
    けるピッチ抽出装置。
  10. 【請求項10】 フレーム長またはサブフレーム長より
    も短いデータ列を用いて自己相関関数の算出を行ない、
    この自己相関関数を請求項9記載のディレードディシジ
    ョンを行なうか否かの判断基準として用いる音声符号化
    装置におけるピッチ抽出装置。
  11. 【請求項11】 請求項9または請求項10記載のピッ
    チ抽出装置を有する音声符号化装置。
JP7289730A 1995-11-08 1995-11-08 音声符号化装置 Pending JPH09134196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7289730A JPH09134196A (ja) 1995-11-08 1995-11-08 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7289730A JPH09134196A (ja) 1995-11-08 1995-11-08 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH09134196A true JPH09134196A (ja) 1997-05-20

Family

ID=17747018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7289730A Pending JPH09134196A (ja) 1995-11-08 1995-11-08 音声符号化装置

Country Status (1)

Country Link
JP (1) JPH09134196A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000063878A1 (fr) * 1999-04-19 2000-10-26 Fujitsu Limited Codeur de parole, processeur de parole et procede de traitement de la parole
KR100720275B1 (ko) * 2000-03-03 2007-05-22 리켄 비축대칭 비구면 거울의 연삭 가공방법
JP2010181890A (ja) * 1998-08-24 2010-08-19 Mindspeed Technologies Inc 音声符号化用開ループピッチ処理

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010181890A (ja) * 1998-08-24 2010-08-19 Mindspeed Technologies Inc 音声符号化用開ループピッチ処理
WO2000063878A1 (fr) * 1999-04-19 2000-10-26 Fujitsu Limited Codeur de parole, processeur de parole et procede de traitement de la parole
US6470312B1 (en) 1999-04-19 2002-10-22 Fujitsu Limited Speech coding apparatus, speech processing apparatus, and speech processing method
KR100720275B1 (ko) * 2000-03-03 2007-05-22 리켄 비축대칭 비구면 거울의 연삭 가공방법

Similar Documents

Publication Publication Date Title
KR0127901B1 (ko) 음성 인코딩 장치 및 그 방법
US5265190A (en) CELP vocoder with efficient adaptive codebook search
US5781880A (en) Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
US6202046B1 (en) Background noise/speech classification method
KR100426514B1 (ko) 복잡성이감소된신호전송시스템
CA2271410C (en) Speech coding apparatus and speech decoding apparatus
KR100556831B1 (ko) 전역 펄스 교체를 통한 고정 코드북 검색 방법
JP2000515998A (ja) コード励振形線形予測(celp)コーダにおいて励振コードブックを検索する方法およびその装置
US5173941A (en) Reduced codebook search arrangement for CELP vocoders
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP4063911B2 (ja) 音声符号化装置
US7039584B2 (en) Method for the encoding of prosody for a speech encoder working at very low bit rates
JP2000112498A (ja) 音声符号化方法
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
EP0745972B1 (en) Method of and apparatus for coding speech signal
US5937374A (en) System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
JPH09134196A (ja) 音声符号化装置
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
EP0713208B1 (en) Pitch lag estimation system
JPH113098A (ja) 音声符号化方法および装置
JP3296411B2 (ja) 音声符号化方法および復号化方法
JPH08185199A (ja) 音声符号化装置
KR100388488B1 (ko) 유성음 구간에서의 고속 피치 탐색 방법
JP3229784B2 (ja) 音声符号化復号化装置及び音声復号化装置
JP2585214B2 (ja) ピッチ抽出方法