JPH10124091A - 音声符号化装置および情報記憶媒体 - Google Patents

音声符号化装置および情報記憶媒体

Info

Publication number
JPH10124091A
JPH10124091A JP8278234A JP27823496A JPH10124091A JP H10124091 A JPH10124091 A JP H10124091A JP 8278234 A JP8278234 A JP 8278234A JP 27823496 A JP27823496 A JP 27823496A JP H10124091 A JPH10124091 A JP H10124091A
Authority
JP
Japan
Prior art keywords
pulse
sound source
signal
speech
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8278234A
Other languages
English (en)
Inventor
Naoya Tanaka
中 直 也 田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8278234A priority Critical patent/JPH10124091A/ja
Publication of JPH10124091A publication Critical patent/JPH10124091A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【課題】 パルス音源を用いるCELP方式の音声符号
化装置において、パルス音源の性能を向上させることに
よって、符号化音声の品質を向上させる。 【解決手段】 入力音声信号211のピッチ周期に対応
する間隔の複数のパルス列を生成するパルス音源205
の構成を、各パルス列について、その先頭パルスの存在
範囲がサブフレーム内の一部範囲内に制限され、かつ、
その存在範囲が各パルス列毎に独立に割り当てられるよ
うにする。ピッチ周期パルスの性質を利用して、パルス
がサブフレーム内に効率的に配置されるように、先頭パ
ルスの存在範囲を割り当てることによって、パルス音源
信号を効率的に生成し、符号化音声の品質を向上させる
ことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力音声信号を4
〜8kbps程度のビットレートで符号化する音声符号
化装置およびそれをプログラム化して記憶した情報記録
媒体に関する。
【0002】
【従来の技術】4kbps から8kbps 程度のビットレートの
音声符号化方法として、入力音声信号をあらかじめ定め
られた時間長の音声フレームに分割し、各音声フレーム
を分析してスペクトルパラメータを算出し、このスペク
トルパラメータを係数とする合成フィルタを、コードブ
ックから選択した音源信号により駆動することによって
合成音声信号を得る方法がある。この音声符号化方法
は、一般にCELP(CodeExcited Linear Prediction c
oding:符号励振線形予測符号化) と呼ばれており、その
基本的な原理は、M. R. Schroeder and B. S. Atal, "C
ode-Excited Linear Prediction (CELP) : High-Qualit
y Speech at Very Low Bit Rates", Proc.,ICASSP, 19
85, pp. 937-940 に紹介されている。
【0003】CELPを利用した音声符号化方法として
は、音源の構成法を中心に数多くの応用例があるが、過
去の音源信号を蓄えておき、入力音声信号のピッチ周期
に応じて切り出して用いる適応コードブックと、あらか
じめ定められた形状の音源信号を格納してあり、その中
から音源信号として最もふさわしいものを取り出して用
いる雑音コードブックとを備え、合成フィルタの入力と
なる音源信号(以下これを駆動音源信号とする)を、2
つのコードブックから選択した音源信号の線形和として
生成する方法が一般的である。また、駆動音源信号の選
択は、前記音声フレームをさらに細かく分割したサブフ
レーム単位で行うことが多い。これは、音声のスペクト
ル情報が時間的に比較的ゆっくりと変化するのに対し
て、音源情報は変化が激しいため、より短い周期で更新
する必要があるためである。
【0004】以下に従来の駆動音源信号の生成方法を図
7を用いて説明する。図7において、ピッチ周期分析手
段501は、入力音声信号511からピッチ候補512
を抽出する。続いて、適応コードブック504に蓄えら
れた過去の音源信号から、ピッチ候補512に応じて音
源信号を切り出す。適応コードブックから切り出された
適応コードベクトル候補513と、雑音コードブック5
05から取り出された雑音コードベクトル候補514
に、それぞれゲインコードブック506からのゲインを
乗じた線形和により駆動音源候補515を生成する。一
方、線形予測分析手段502は、入力音声511から線
形予測係数を算出し、これを量子化手段503で量子化
して線形予測係数516を得、これと駆動音源候補とか
ら線形予測合成フィルタ507により合成音声517を
得る。この合成音声517と入力音声信号511の差を
とり、聴覚重み付けフィルタ508によって重み付けを
行った後、誤差最小化手段509によって重み付き誤差
519を最小化するような、適応コードベクトル、雑音
コードベクトルおよびゲインコードの組み合わせを決定
する。最終的に、量子化手段503からの線形予測計数
符号、適応コードブック504からの適応符号522、
雑音コードブック505からの雑音符号523、ゲイン
コードブック506からのゲイン符号524がマルチプ
レクサ510によって多重化され、符号化出力525と
して出力される。
【0005】音源の構成法として、雑音コードブック5
05の代わりにピッチ周期パルス音源を用いて、特に有
声部分の音声品質を向上させる方法が知られており、そ
のような例としては、特開平5−108098号公報に
示される方法がある。ピッチ周期パルス音源により生成
される音源信号pc(i)は、図8に示すように、先頭
パルス位置SPとパルス間隔Lを用いて、式(1)のよ
うに表わされる。
【0006】
【数1】 ここで、NSはサブフレームSFのサンプル数、SPは
先頭パルス位置、Lはピッチ周期(パルス間隔)、NP
はサブフレームSFに含まれるパルス数、δ(i)はデ
ルタ関数である。
【0007】図9はm個のパルス列から構成されるパル
ス音源を示す図である。第1パルス列から第mパルス列
までの各パルス列は、すべて等しいパルス間隔Lを持
ち、先頭パルス位置SP1のみが異なるものである。m
個の各パルス列に対してゲインを乗じた後、加算された
パルス列がパルス音源の出力となる。出力パルス音源信
号out(i)はj番目のパルス列をpcj (i)とし
て、式(2)のように表わされる。
【0008】
【数2】
【0009】
【発明が解決しようとする課題】式(2)で表わされる
パルス音源信号を表わすのに必要な情報は、ピッチ周期
L、m個の先頭パルス位置SPj (1 ≦j≦(m)、各
パルス列に対するゲインgpj (1 ≦j≦(m)であ
る。このなかで、ピッチ周期Lに関しては、適応コード
ブックをピッチ周期に応じて切り出す長さ(適応ラグ)
をピッチ周期として利用すれば、符号化して伝送する必
要はない。また、ゲインについては、例えば、ゲインが
+1,−1の2値しかとらない構成にすることで、情報
量の削減が可能である。しかしながら、先頭パルス位置
については、m個すべての位置情報を符号化する必要が
あり、これが伝送情報量の増加、もしくは符号化できる
パルス数の制約となり、音声品質の劣化につながってい
た。
【0010】本発明は、上記従来の問題を解決するもの
で、先頭パルスの存在範囲を限定することにより、先頭
パルス位置を量子化するのに必要な情報量を減少させる
とともに、先頭パルスの存在範囲を効率的に配置するこ
とにより、パルス音源の性能を向上し、符号化音声の品
質を向上させることを目的とするものである。
【0011】
【課題を解決するための手段】上記問題を解決するため
に、本発明の音声符号化装置は、従来のパルス音源を用
いるCELP方式の音声符号化装置に加えて、パルス音
源信号の先頭パルスの存在範囲をサブフレーム内の一部
範囲に制限し、かつ、その存在範囲をパルスが効率的に
配置されるように規定する機能を備えている。この構成
により、パルス音源信号を効率的に符号化し、符号化音
声の品質を向上させることができる。
【0012】
【発明の実施の形態】本発明の請求項1に記載の発明
は、従来のCELP方式の音声符号化装置において、複
数の音源のうち、少なくとも1つの音源が、入力音声信
号のピッチ周期に対応する間隔の複数のパルス列を生成
するパルス音源であり、各パルス列について、先頭パル
スの存在範囲が、サブフレーム内の一部範囲内に制限さ
れ、かつその存在範囲がパルス列毎に独立に規定されて
いることを特徴とする音声符号化装置であり、ピッチ周
期パルスの性質を利用して、パルスがサブフレーム内に
効率的に配置されるように、先頭パルスの存在範囲を規
定することによって、音声品質を向上させるものであ
る。
【0013】また、請求項2に記載の発明は、請求項1
に記載の音声符号化装置において、入力音声信号のピッ
チ周期に対応して、各先頭パルスの存在範囲を適応的に
割り当てる構成としたもので、ピッチ周期パルスの性質
を利用して、パルスをサブフレーム内に効率的に配置す
ることによって、音声品質を向上させるものである。
【0014】また、請求項3に記載の発明は、請求項1
に記載の音声符号化装置において、入力音声信号の性質
を、あらかじめ定められた複数のカテゴリーに分類する
手段を備え、各カテゴリー毎に入力音声信号の性質に適
合するように、先頭パルスの存在範囲を規定しておくこ
とにより、入力音声信号を符号化するのにより適したパ
ルス配置を実現し、音声品質を向上するものである。
【0015】また、請求項4に記載の発明は、請求項3
に記載の音声符号化装置において、入力音声信号の性質
を、あらかじめ定められた複数のカテゴリーに分類する
手段が、入力音声信号が有声であるか無声であるかを判
定する手段であり、入力音声信号が有声のときは、入力
音声信号のピッチ周期に対応して、各パルス列の先頭パ
ルス位置の存在範囲を適応的に割り当て、無声のとき
は、各パルス列の先頭パルス位置の存在範囲が、あらか
じめ定められた位置に固定される構成としたもので、音
源信号として求められるパルス配置が明らかに異なる、
音声の有声区間と無声区間に対して、それぞれに適した
パルス配置を行うことにより、音声品質を向上するもの
である。
【0016】また、請求項5に記載の発明は、本発明に
よる音声符号化装置を、信号処理プロセッサを用いてソ
フトウェアで実現するためのプログラムを記憶させたフ
ロッピディスクなどの記憶媒体であり、例えば、パーソ
ナルコンピュータなどの汎用信号処理装置上でソフトウ
ェアにより本発明による音声符号化装置を実現できるも
のである。
【0017】以下、本発明の実施の形態について、図1
から図6を用いて説明する。 (実施の形態1)図1は本発明の第1の実施の形態にお
ける音声符号化装置の構成を示すものである。図1にお
いて、101は入力音声111からピッチ候補112を
算出するピッチ周期分析手段、102は入力音声111
から線形予測係数を算出する線形予測分析手段、103
は算出された線形予測係数を量子化して線形予測係数1
16を出力する量子化手段、104は過去の音源を蓄え
た適応コードブック、105は従来の雑音コードブック
に代わるパルス音源、106はゲインコードブック、1
07は適応コードブック104から切り出された適応コ
ードベクトル候補113とパルス音源105から生成さ
れたパルス音源ベクトル候補114とを合成して合成音
声117を生成する線形予測合成フィルタ、108は合
成音声117と入力音声111との差を取った誤差11
8を重み付けして聴覚重み付き誤差119を出力する聴
覚重み付けフィルタ、109は聴覚重み付き誤差119
を最小化する誤差最小化手段、110は量子化手段10
3から出力された線形予測係数符号121と、誤差最小
化手段109から出力されたフィードバック120によ
り組み合わせを決定された適応コードブック104から
の適応符号122と、パルス音源105からのパルス符
号123と、ゲインコードブック106からのゲイン符
号124を多重化して符号化出力125を出力するマル
チプレクサである。
【0018】本実施の形態は、図7に示した従来の音声
符号化装置において、雑音コードブックの代わりにパル
ス音源105を使用し、適応コードブック104の適応
ラグを表す適応符号122をパルス音源105に入力し
たものであり、他の構成および動作は従来例と同じなの
で、以下には従来例と異なる部分の動作についてのみ説
明する。
【0019】図1において、ピッチ周期分析手段101
は、入力音声信号111からピッチ候補112を抽出す
る。続いて、適応コードブック104に蓄えられた過去
の音源信号から、ピッチ候補112に応じて音源信号を
切り出し、適応コードベクトル候補113とする。適応
コードベクトル候補113に対応する適応符号122が
パルス音源105に入力され、適応コードベクトル候補
113の適応ラグを周期とする複数のパルス列から構成
されるパルス音源ベクトル候補114が生成される。適
応コードベクトル候補113およびパルス音源ベクトル
候補114に、それぞれゲインコードブック106から
のゲインを乗じた線形和により駆動音源候補115を生
成し、線形予測合成フィルタ107によって合成音声1
17を得る。合成音声117と入力音声信号111の差
をとり、聴覚重み付けフィルタ108によって重み付け
を行った後、誤差最小化手段109によって重み付き誤
差119を最小化するような、適応コードベクトル、雑
音コードベクトルおよびゲインコードの組み合わせを決
定する。
【0020】図2は図1におけるパルス音源105の構
成を示す図である。パルス音源はm個のピッチ周期パル
スを発生する構成である。サブフレームSFはn個のブ
ロックに分割されており、各パルス列の先頭パルスの存
在範囲は、各ブロックを単位として、その範囲内に限定
されている。例えば、第1パルス列の先頭パルス位置S
P1の存在範囲D1は、第1ブロック内に限定され、同
様に第2パルス列から第mパルス列までの先頭パルス位
置も、それぞれ対応する存在範囲内に限定される。ここ
で、ピッチ周期パルス列の性質として、先頭パルス以降
はピッチ周期間隔L毎にパルスが存在する。したがっ
て、先頭パルス位置がサブフレームの前の方にあるほ
ど、サブフレーム内に存在するパルスの数は増加するこ
とになり、また、生成されるパルス音源ベクトルの周期
性も強くなる。生成された音源ベクトルの周期性の強さ
は、特に有声音において、符号化音声の品質と密接に関
係しており、一般的に、強い周期性をもつ音源ベクトル
を生成する能力のある音源のほうが音声品質が高い。よ
って、先頭パルスの存在範囲を、サブフレームの前の方
のブロックに加重をかけて配置する、例えば第1ブロッ
クから第kブロックまでには2個づつ、第k+1ブロッ
ク以降第mブロックまでには1個づつ配置することによ
り、周期性の強い音源ベクトルを生成でき、特に有声音
の音声品質を向上することができる。ただし、前の方の
ブロックに加重をかけすぎ、後の方のブロックにおい
て、パルスが配置されないブロックが存在するような構
成は、符号化音声の品質を局所的に劣化させる可能性が
高く、望ましくない。
【0021】なお、図2においては、分割されたn個の
ブロックは重ならないように配置されているが、これを
重なり合うように配置することも可能であり、また、各
ブロックの長さは均等でも不均等でも構わない。
【0022】(実施の形態2)図3は本発明によるパル
ス音源を使用したCELP方式の音声符号化装置の第2
の実施の形態を示すブロック図である。図1に示した第
1の実施の形態の音声符号化装置に加えて、適応コード
ブック204の適応ラグを表わす適応符号222に対応
して、適応的に先頭パルスの存在範囲を割り当てるため
のパルス存在範囲割当手段226を設けている。駆動音
源信号の生成方法は、パルス存在範囲割当手段226に
よって、パルス音源から生成されるパルス列の先頭パル
スの存在範囲が、ピッチ周期に対応して適応的に割り当
てられる点以外は、実施の形態1と同じであるので、説
明を省略し、以下に、パルス存在範囲割当手段226に
よって、入力される適応符号222に対応して、パルス
存在範囲がどのように割り当てられるかを、図4を用い
て説明する。
【0023】図4は図3におけるパルス音源205の構
成を示す図である。パルス音源はm個のピッチ周期パル
スを発生する構成である。サブフレームSFはn個のブ
ロックに均等に分割されており、各パルス列の先頭パル
スの存在範囲は、各ブロックを単位として、その範囲内
に限定されている。例えば、第1パルス列の先頭パルス
位置SP1の存在範囲D1は、第1ブロック内に限定さ
れ、同様に第2パルス列から第mパルス列までの先頭パ
ルス位置も、それぞれ対応する存在範囲内に限定され
る。ピッチ周期パルス列の性質として、先頭パルス以
降、ピッチ周期間隔L毎にパルスが存在するが、ピッチ
周期がサブフレームSFよりも長い場合には、2番目以
降のパルスはサブフレーム内に存在しない。つまり、m
個の各パルス列はすべて単独パルスとなる。この状態に
おける先頭パルス存在範囲の配置を標準配置とする。標
準配置は、n個の各ブロックに対して少なくとも1本以
上のパルスが存在するような配置とする。図4に示す例
では、標準状態において、第1パルス列の先頭パルス存
在範囲D1は、第1ブロックに割り当てられており、以
下同様に、第2パルス列は第2ブロック、第mパルス列
は第nブロックに割り当てられている。ここで、サブフ
レーム長をNS、ブロック長をNBとして、ピッチ周期
Lが、NS−NB≦L<NSであるとき、第1パルス列
の第2パルス位置SP1−2は第nブロック内に入る。
これに対して、第2パルス列の第2パルス位置SP2−
2は、サブフレームSFの外側に位置することになり、
第2パルス列は単独パルスとなる。同様に、第3パルス
以降についても、2番目のパルスはサブフレームSFの
外側に位置することになるため、この状態では、ピッチ
周期を利用して符号化されるパルス列は第1パルス列の
みである。そこで、第2パルス列の先頭パルス存在範囲
D2を1つ前のブロックにシフトすれば、シフトされた
第2パルス列の第2パルス位置SP2a−2も第nブロ
ック内に入ることになり、ピッチ周期を利用して符号化
されるパルス列を増加させることができる。しかしなが
ら、第2パルス列だけをシフトすると、第2ブロックに
はパルスが存在しないことになり、局所的な音質劣化を
引き起こす可能性がある。そこで、第3パルス列以降、
第mパルス列までの各パルス列についても、前方への1
ブロックシフトを行う。これにより、第1ブロックから
第n−1ブロックまでの各ブロックについて、先頭パル
ス存在範囲が割り当てられることになる。第nブロック
については、先頭パルス存在範囲の割り当てがなくなる
が、第1パルス列の第2パルス位置SP1−2およびシ
フトされた第2パルス列の第2パルスSP2a−2が第
nブロック内に存在することから、全ブロックに関し
て、パルスの含まれないブロックは存在しない。ピッチ
周期LがL<NS−NBのときも、同様に先頭パルス存
在範囲のシフトを行うことができ、第jパルス列に対す
るシフトブロック数NSBj は、標準状態における先頭
パルス存在範囲のブロック番号をIBjとして、式
(3)で与えられる。
【0024】
【数3】
【0025】なお、式(3)によるシフトを行うと、シ
フト数が大きくなると特定のブロック(第1ブロック
と、第1ブロックからピッチ周期Lの倍数だけ離れたブ
ロック)にパルスが集中するので、シフト数が大きくな
るような構成、つまり分割ブロック数が多い構成では、
NSBj =IBj −1を満たすパルス列にのみNSBj
ブロックの前方シフトを行い、1 番目からj−1番目の
パルス列に対してはシフトを行わず、j+1番目以降m
番目までのパルス列に対しては1ブロックの前方シフト
しか行わない構成を用いてもよい。
【0026】以上のような構成により、ピッチ周期に対
応して、適応的に先頭パルス位置を切り替えて、ピッチ
周期を利用してより効率よくパルス列を符号化すること
によって、より周期性の強いパルス音源ベクトルを生成
でき、特に有声音の音声品質を向上することができる。
【0027】(実施の形態3)図5は本発明によるパル
ス音源を使用したCELP方式の音声符号化装置の第3
の実施の形態を示すブロック図である。図1に示した第
1の実施の形態の音声符号化装置において、入力音声信
号311の性質を分類する入力音声分類手段326を設
け、n個のパルス音源を、入力音声分類手段326によ
って制御されるスイッチ327によって切り替える構成
としたものである。入力音声分類手段326は、入力音
声信号311をあらかじめ定められたn個のカテゴリー
に分類するものであり、分類の基準となる音声のパラメ
ータとしては、ピッチ周期、有声/ 無声、フレーム内の
パワの偏り等を用いることができる。n個のパルス音源
305a、305nは、それぞれ、予め定められたカテ
ゴリーに分類される入力音声信号311に対して適する
ように、先頭パルス存在範囲の割り当てを行ったもので
ある。このような構成とすることにより、入力音声信号
311の性質にあわせたパルス音源信号を生成し、符号
化音声の品質を向上させることができる。
【0028】(実施の形態4)図6は本発明によるパル
ス音源を使用したCELP方式の音声符号化装置の第4
の実施の形態を示すブロック図である。図5に示した第
3の実施の形態の音声符号化装置において、入力音声分
類手段として有声/ 無声判定手段426を使用し、有声
音用の第1のパルス音源405aと、無声音用の第2の
パルス音源405bを、有声/ 無声判定手段426によ
って制御される切替スイッチ427によって切り替える
構成としたものである。有声音用の第1のパルス音源4
05aは、実施の形態2で説明したように、適応コード
ブック404の適応ラグを表す適応符号422に対応し
て、適応的に先頭パルスの存在範囲を割り当てるための
パルス存在範囲割当手段428を用いて、入力音声のピ
ッチ周期に対応して適応的に先頭パルス存在位置を割り
当てる構成であり、有声音に適した周期性の強いパルス
音源信号を生成する。これに対して、無声音用の第2の
パルス音源405bは、無声音に適した周期性の無いパ
ルス音源信号を生成するために、実施の形態2で説明し
たパルス音源構成において、ピッチ周期の長短に関わら
ず、標準配置の状態のパルス存在範囲の割り当てのまま
で使用し、かつ、ピッチ周期がサブフレーム長よりも短
いときでもピッチ周期パルス列ではなく、先頭パルス位
置だけで表わされる単独パルスを用いる。したがって、
第2のパルス音源405bは、適応符号422の入力を
必要としない。このような構成とすることにより、入力
音声信号の性質にあわせたパルス音源信号を生成し、符
号化音声の品質を向上させることができる。
【0029】なお、第2のパルス音源405bは、適応
符号422の入力を必要としないため、駆動音源信号4
15を生成するための音源の組み合わせは、図6におい
て説明されている適応コードブック+第1のパルス音源
と、適応コードブック+第2のパルス音源という組み合
わせの他に、適応コードブック+第1のパルス音源と、
第2のパルス音源のみという組み合わせも可能となる。
【0030】(実施の形態5)本発明の第5の実施の形
態では、上記した音声符号化装置の処理アルゴリズムを
プログラミング言語によって記述し、ソフトウェアとし
て実現するものであり、そのプログラムをフロッピディ
スク等の記憶媒体に記録しておき、パーソナルコンピュ
ータ等の汎用信号処理装置に記憶媒体を接続して、プロ
グラムを実行させることにより、本発明の音声符号化装
置の機能を実現することができる。
【0031】
【発明の効果】以上のように本発明は、パルス音源を用
いるCELP方式の音声符号化装置において、パルスの
存在範囲を限定することによって、符号化に必要な情報
量を削減するとともに、複数のパルス存在範囲を固定ま
たは適応的に効率良く配置することによって、パルス音
源の性能を向上し、符号化音声の品質を向上させること
ができるという効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における音声符号化装置
の構成を示すブロック図
【図2】本発明の実施の形態1 におけるパルス音源の構
成を示す概念図
【図3】本発明の実施の形態2における音声符号化装置
の構成を示すブロック図
【図4】本発明の実施の形態2におけるパルス音源の構
成を示す概念図
【図5】本発明の実施の形態3における音声符号化装置
の構成を示すブロック図
【図6】本発明の実施の形態4における音声符号化装置
の構成を示すブロック図
【図7】従来のCELP方式を用いた音声符号化装置の
構成を示すブロック図
【図8】周期パルス列の表現方法を示す概念図
【図9】複数の周期パルス列を用いたパルス音源の構成
を示す概念図
【符号の説明】
101、201、301、401 ピッチ周期分析手段 102、202、302、402 線形予測分析手段 103、203、303、403 量子化手段 104、204、304、404 適応コードブック 105、205、305、405 パルス音源 106、206、306、406 ゲインコードブック 107、207、307、407 線形予測合成フィル
タ 108、208、308、408 聴覚重み付けフィル
タ 109、209、309、409 誤差最小化手段 110、210、310、410 出力符号を多重化す
るマルチプレクサ 111、211、311、411 入力音声信号 112、212、312、412 入力音声から分析さ
れたピッチ周期候補 113、213、313、413 適応コードベクトル
候補 114、214、314、414 パルス音源ベクトル
候補 115、215、315、415 駆動音源候補 116、216、316、416 量子化された線形予
測係数 117、217、317、417 合成音声 118、218、318、418 入力音声と合成音声
の誤差 119、219、319、419 聴覚的に重み付けさ
れた入力音声と合成音声の誤差 120、220、320、420 各コードブックに対
するフィードバック 121、221、321、421 線形予測係数符号 122、222、322、422 適応符号 123、223、323、423 パルス符号 124、224、324、424 ゲイン符号 125、225、325、425 符号化出力 226、428 パルス存在範囲割当手段 326 入力音声分類手段 426 有声/無声判定手段 327、427 切替スイッチ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 定められた時間長のフレームに分割され
    た入力音声信号を、スペクトル情報と音源情報に分離
    し、音源情報を表す駆動音源信号を複数の音源コードブ
    ックを参照して生成し、スペクトル情報を表す合成フィ
    ルタを用いて駆動音源信号から合成音声信号を再生し、
    その合成音声信号と入力音声信号との間の聴覚的に重み
    付けされた誤差を最小化する音源コードベクトルを、音
    源コードブックから選択することによって、音声信号を
    符号化する装置において、複数の音源のうち、少なくと
    も1つの音源が、入力音声信号のピッチ周期に対応する
    間隔の複数のパルス列を生成するパルス音源であり、各
    パルス列について、その先頭パルスの存在範囲が、前記
    フレーム内の一部範囲内に制限され、かつ、その存在範
    囲がパルス列毎に独立に規定されていることを特徴とす
    る音声符号化装置。
  2. 【請求項2】 各パルス列の先頭パルス位置の存在範囲
    が、入力音声信号のピッチ周期に対応して、適応的に割
    り当てられることを特徴とする請求項1に記載の音声符
    号化装置。
  3. 【請求項3】 入力音声信号の性質を、あらかじめ定め
    られた複数のカテゴリーに分類する手段を有し、分類さ
    れたカテゴリー毎に、各パルス列の先頭パルス位置の存
    在範囲を規定することを特徴とする請求項1に記載の音
    声符号化装置。
  4. 【請求項4】 入力音声信号の性質を、あらかじめ定め
    られた複数のカテゴリーに分類する手段が、入力音声信
    号が有声であるか無声であるかを判定する手段であり、
    入力音声信号が有声のときは、入力音声信号のピッチ周
    期に対応して、各パルス列の先頭パルス位置の存在範囲
    を適応的に割り当てられ、無声のときは、各パルス列の
    先頭パルス位置の存在範囲が、あらかじめ定められた位
    置に固定されることを特徴とする請求項3に記載の音声
    符号化装置。
  5. 【請求項5】 請求項1から4のいずれかに記載の音声
    符号化装置を信号処理プロセッサを用いてソフトウェア
    で実現するためのプログラムを記憶した情報記憶媒体。
JP8278234A 1996-10-21 1996-10-21 音声符号化装置および情報記憶媒体 Pending JPH10124091A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8278234A JPH10124091A (ja) 1996-10-21 1996-10-21 音声符号化装置および情報記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8278234A JPH10124091A (ja) 1996-10-21 1996-10-21 音声符号化装置および情報記憶媒体

Publications (1)

Publication Number Publication Date
JPH10124091A true JPH10124091A (ja) 1998-05-15

Family

ID=17594494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8278234A Pending JPH10124091A (ja) 1996-10-21 1996-10-21 音声符号化装置および情報記憶媒体

Country Status (1)

Country Link
JP (1) JPH10124091A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6973424B1 (en) 1998-06-30 2005-12-06 Nec Corporation Voice coder

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6973424B1 (en) 1998-06-30 2005-12-06 Nec Corporation Voice coder

Similar Documents

Publication Publication Date Title
JP3134817B2 (ja) 音声符号化復号装置
JP3196595B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
EP0833305A2 (en) Low bit-rate pitch lag coder
WO1999034354A1 (en) Sound encoding method and sound decoding method, and sound encoding device and sound decoding device
US6094630A (en) Sequential searching speech coding device
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2000163096A (ja) 音声符号化方法及び音声符号化装置
EP1473710B1 (en) Multistage multipulse excitation audio encoding apparatus and method
JP3095133B2 (ja) 音響信号符号化方法
JPH04344699A (ja) 音声符号化・復号化方法
CA2336360C (en) Speech coder
JPH1063300A (ja) 音声復号化装置及び音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JPH10124091A (ja) 音声符号化装置および情報記憶媒体
EP1154407A2 (en) Position information encoding in a multipulse speech coder
JP3153075B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3144284B2 (ja) 音声符号化装置
JP3462958B2 (ja) 音声符号化装置および記録媒体
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP3192051B2 (ja) 音声符号化装置
JP3332132B2 (ja) 音声符号化方法および装置
JP3563400B2 (ja) 音声復号化装置及び音声復号化方法
JPH07160295A (ja) 音声符号化装置