JP3489748B2 - 音声符号化装置及び音声復号化装置 - Google Patents

音声符号化装置及び音声復号化装置

Info

Publication number
JP3489748B2
JP3489748B2 JP14061794A JP14061794A JP3489748B2 JP 3489748 B2 JP3489748 B2 JP 3489748B2 JP 14061794 A JP14061794 A JP 14061794A JP 14061794 A JP14061794 A JP 14061794A JP 3489748 B2 JP3489748 B2 JP 3489748B2
Authority
JP
Japan
Prior art keywords
basis
base
speech
bases
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP14061794A
Other languages
English (en)
Other versions
JPH086600A (ja
Inventor
公生 三関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP14061794A priority Critical patent/JP3489748B2/ja
Publication of JPH086600A publication Critical patent/JPH086600A/ja
Application granted granted Critical
Publication of JP3489748B2 publication Critical patent/JP3489748B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声を少ない情報量で高
能率に符号化または復号化する低ビットレートの音声符
号化装置及び音声復号化装置に関する。
【0002】
【従来の技術】低ビットレートで音声を高能率に符号化
することが出来る方法として、CELP(Code Excited
Linear Prediction)方式が知られている。CELP方
式の詳細は、例えば「M.R.Schroeder and Atal,"Code-E
xcited Linear Prediction (CELP):high quality speec
h at very low bit rates",in Proc. ICASSP'85, pp.93
7-939,1985」に示されている。
【0003】この方式に代表される音声符号化では、再
生信号の音源となる駆動信号の符号化に特徴がある。近
年用いられるCELP方式では、駆動信号の表現に、適応コ
ードブックからの基底ベクトル1個と、雑音コードブッ
クからの基底ベクトル1個を用いる。適応コードブック
は過去の符号化された駆動信号からピッチ成分を表す基
底ベクトルの候補となるベクトルを生成するコードブッ
クである。生成されたベクトルにはそれぞれ符号付けが
予めされており、符号を伝送することにより符号化装置
と復号化装置で同じ基底ベクトルを再生することができ
る構成になっている。この際、再生音声に含まれるピッ
チ成分の聴覚的な歪を最小化するように基底ベクトルの
符号の選択が行われる。
【0004】一方、ピッチ成分以外の雑音成分を表す基
底ベクトルは雑音コードブックの中から選ばれる。雑音
コードブックの中から基底ベクトルを選択する場合も、
再生音声に含まれる雑音成分の聴覚的な歪を最小化する
ように符号の選択が行われる。以上述べたように、CELP
では音源となる駆動信号の表現に、ピッチ成分用に1
個、雑音成分用に1個、合計2個の基底ベクトルを用い
る。
【0005】この基底ベクトルにそれぞれゲインを乗じ
て駆動信号を形成し、これを合成フィルタに通過させる
ことにより合成音声を生成する。駆動信号の符号化が合
成音声の歪を最小化することを指標に、符号の選択が行
われているため、低ビットレートでも比較的高品質な合
成音声を提供できる。
【0006】しかしながら、従来法では2個の基底の組
み合わせで駆動信号を表現していたため、適応コードブ
ックからの基底ベクトルがピッチ成分をうまく表現でき
ない場合、または雑音コードブックからの基底ベクトル
が雑音成分をうまく表現できない場合に、他の基底ベク
トルで補うことができないため、更なる低ビットレート
化を進めると再生音声の品質劣化が使用に耐えない程度
に大きくなってくるという問題点があった。
【0007】また、コードブック内の代表ベクトル毎の
重要度が不明なので、全ての代表ベクトルに対し歪を計
算しなければならず、基底ベクトルの選択に多大な計算
量を要するという問題点があった。
【0008】
【発明が解決しようとする課題】上述の通り、従来用い
られていた音声符号化装置または音声復号化装置におい
ては、基底ベクトルの表現が不十分であると、ビットレ
ートを更に小さくするときに、合成された音声の品質を
確保できない場合があるという問題があった。
【0009】本発明は、1つの基底ベクトルがピッチ成
分または雑音成分をうまく表現できない場合でも、品質
維持ができ、かつ、基底ベクトルの選択が不要で、基底
ベクトル毎の重要度を利用して少ない計算量で効率的に
駆動信号の符号化を行うことのできる音声符号化装置お
よび音声復号化装置を提供することを目的とする。
【0010】
【課題を解決するための手段】上述した目的を達成する
ため、本発明による音声符号化装置においては、ピッチ
周期情報に基づき第1の基底を得る第1の手段と、予め
設定された複数の基底間の結合により第1の基底と独立
化された基底の集合Uを得るための第2の手段と、少な
くとも第1の基底と集合Uとを用いて音声信号または音
源信号を符号化する手段とを有することを特徴とする。
【0011】また本発明の音声符号化装置においては、
ピッチ周期情報に基づき第1の基底を得る第1の手段
と、予め設定された複数の基底の結合により第1の基底
と独立化された基底の集合Uを得るための第2の手段
と、前記基底の集合Uと独立に扱うことのできる基底の
集合Vを得るための第3の手段と、少なくとも集合Vの
基底と集合Uの基底を用いて、音声信号または音源信号
を符号化する手段とを有することを特徴とする。
【0012】 また本発明の音声復号化装置において
は、ピッチ周期情報に基づいて得られた第1の基底と、
め設定された複数の基底間の結合により第1の基底と
独立化された基底の集合Uとから駆動信号を生成する手
段と、この駆動信号を用いて音声信号を合成する手段と
を有することを特徴とする。また、ピッチ周期情報に基
づいて得られた第1の基底と独立化された基底の集合U
と、基底の集合Uと独立に扱うことのできる基底の集合
Vとから駆動信号を生成する手段と、この駆動信号を用
いて音声信号を合成する手段とを有することを特徴とす
る。
【0013】
【作用】本発明では、ピッチ周期の探索で得られるピッ
チベクトルと独立化された、集合Uに属する複数の基底
を用いて駆動信号の雑音成分を表現することを特徴の一
つとする。これにより、従来のCELP方式のような雑音成
分を表す基底を雑音コードブックから唯一つ選択すると
いう処理が不要になる。
【0014】また、基底の係数情報の符号探索では、集
合Uに属する基底は、ピッチベクトルまたはピッチベク
トルを含む集合Vと独立化されているので、集合Uと集
合Vの基底の係数情報を分離して独立に符号化できる。
【0015】これにより、係数情報の符号化に必要なビ
ット数も集合V用と集合U用に分けてより小さなビット
数で係数情報の符号化が行える。このことは結果的に、
係数の量子化に必要なテーブルサイズを小さくできるメ
モリ量の削減効果と、コードブックの符号選択に要する
計算量を大幅に削減できる2重の効果を生む。
【0016】また、集合Uを構成するためにsin、c
os波またはこれらの組み合わせで表現される基底を用
いることで、波形の時間軸、周波数軸での直交性を利用
できるので、更に係数符号化の計算量を削減することが
可能となる。
【0017】また、ピッチベクトルがピッチ成分をうま
く表現できない場合、または集合Uの中の1つの基底ベ
クトルが雑音成分をうまく表現できない場合でも、集合
Uと集合Vに属する他の基底ベクトルで補うことができ
るため、更なる低ビットレート化を進めても、再生音声
の品質劣化の度合いが比較的少なくて済むという効果が
ある。
【0018】さらに、重要度の高い基底ベクトルを選択
する手段により、重要度の高い基底に関係する符号化歪
または符号化歪と相関の高い評価値を指標に係数情報の
符号のふるいがけをすることで、非常に少ない計算量で
良好な符号選択ができる。このことは結果的に、少ない
計算量で高能率に駆動信号の符号化を行うことのできる
音声符号化装置を提供することにつながる。
【0019】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1は、本発明の第1の実施例に係る音声符号化
方法のブロック図である。本実施例は、入力される音声
信号から、合成フィルタ情報、ピッチ周期情報、集合V
の係数情報、集合Uの係数情報、ゲイン情報の5種類の
情報を抽出/符号化する構成の音声符号化装置の例を示
している。
【0020】この音声符号化装置は、集合Vの基底に用
いる係数情報を格納する係数コードブックCBV20
0、集合Uの基底に用いる係数情報を格納する係数コー
ドブックCBU210、過去の駆動信号を格納し指定さ
れたピッチ周期からピッチベクトルを生成するピッチベ
クトル生成部190、固定の基底ベクトルを格納する固
定基底格納部270、集合Uと集合Vを生成する基底変
換部120、基底変換部からの基底ベクトルの係数情報
を符号化する係数符号化部220、230、係数情報与
えられた基底ベクトルのゲイン情報を符号化するゲイン
符号化部250、符号化されたゲイン情報を格納するゲ
インコードブック260、入力音声から合成フィルタ情
報を分析する合成フィルタ情報分析部140、合成フィ
ルタ情報をもとに基底に重みを与える重み出力部280
からなる。
【0021】同図において、合成フィルタ情報分析部1
40は音声を分析して音声のスペクトラムの外形を表す
合成フィルタの情報を抽出・符号化しこれを合成フィル
タ情報として出力するとともに、ピッチベクトル生成部
190、重み出力部280、基底変換部120に合成フ
ィルタ情報を出力する。合成フィルタ情報の分析法とし
ては、例えばLPC(Linea Prediction Coding )分析
法を用いることができる。
【0022】ピッチベクトル生成部190では例えば適
応コードブック探索法によってピッチベクトルを求め
る。すなわち、ゲイン符号化部250で生成される符号
化された過去の駆動信号を入力し、ピッチ周期の候補を
与えて過去の駆動信号から得られるベクトルの歪を合成
フィルタ情報を用いて合成レベルで評価し、歪を最小化
するピッチ周期およびそれに対応するベクトルを選択す
る。ここで選択されたベクトルをピッチベクトルpとす
る。
【0023】次に、基底変換部120について説明す
る。基底変換部120は、固定基底格納部からの基底を
組み合わせてピッチベクトルpと独立化された基底uか
らなる集合Uと、基底uと独立化された基底vからなる
集合Vを生成し出力する。ここでは固定基底としてsi
n、cos波を用いることにする。ここでは表記を簡単
にするため、以下のように基底ベクトルを表すことにす
る。
【0024】 sk =[sin(2 πk*0/L) sin(2 πk*1/L) ... sin(2 πk*(L-1)/L)]t …(1) ck =[cos(2 πk*0/L) cos(2 πk*1/L) ... cos(2 πk*(L-1)/L)]t …(2) ここでLはベクトルの次元を表している。
【0025】ピッチベクトルpを合成したとき得られる
ベクトルは合成フィルタの計算を行列Hで表現するとH
pと表すことができる。sk 、ck を組み合わせたとき
合成レベルでピッチベクトルと直交する基底uk は例え
ば次式で表すことができる。
【0026】uk =ask +bck …(3) a=η(1+η2-1/2 …(4) b= (1+η2 )-1/2 …(5) η=−ptt Hck /ptt Hsk …(6) ここでtは行列の転置を表す。
【0027】一方、uk と巡回畳み込みを用いた合成レ
ベルで直交関係にあるような基底vk は例えば次式で表
せることがわかる。 vk =bsk −ack …(7) このように定義することにより、さらに ( Hvk ) t (Hvj ) =0 …(8a) ( Huk ) t (Huj ) =0 …(8b) ( Hvk ) t (Huj ) =0 …(8c) の直交関係が成立する。これは巡回畳込みHを用いたと
き、任意の基底ak 、aj の合成ベクトル同志の内積
が、離散フーリェ変換領域では ( Ha k ) t ( Haj ) =( 1/L) ΣAk ( m) Aj ( L−m) |H( m) |2 …(9) (但し、Σはm=0 からm=L-1 までの和) のように表すことができ、添字kとjが異なるものは占
有する周波数帯域が異なるような基底をak として用い
ると、k≠jのときに上式の右辺が零になることに基づ
いている。ここでAk ( m) およびH( m) はそれぞれ
k と合成フィルタのインパルス応答の離散フーリェ変
換係数を表している。
【0028】また、k=jのときは上式の右辺はkに関
係する周波数帯域の|H( m) |2の値だけにしか影響
されないので、kと周波数帯域の関係を予め設定してお
くことにより非常に少ない計算量で合成ベクトルの内積
を計算することができる。このことから、|H( m) |
2 は各基底の重要度を示す重みに用いることもできる。
従って線スペクトルを持つsine、cosine波を固定基底と
して用いると畳み込み合成後も基底ベクトルの直交性を
維持することができる。
【0029】次に、基底変換部で求めた基底の係数符号
化を行う係数符号化部220、230について説明す
る。係数符号化部220は係数コードブックCBV20
0を用いて集合Vの基底の係数符号化を行う。この際、
重み出力部280からの基底毎の重み情報、目標とする
音声情報を入力し、符号化歪が小さくなるように係数情
(X)を選択する。同様に、係数符号化部230は係
数コードブックCBU210を用いて集合Uの基底の係
数符号化を行う。この際、基底毎の重み情報、目標とす
る音声情報を入力し、符号化歪が小さくなるように係数
情報(Y)を選択する。
【0030】ゲイン情報の符号化は、ゲインコードブッ
ク260を用いて行う。ゲイン情報の探索に当たって
は、合成音声と原音声との歪が少なくなるようにゲイン
情報を探索するようにする。
【0031】次に、本発明の音声符号化装置を用いて生
成された符号情報から、符号化音声を生成する音声復号
化装置の一構成例について説明する。図2は、音声復号
化装置の構成例を示すブロック図である。同図では、上
述の音声符号化装置で符号化されたパラメータであると
ころの合成フィルタ情報、ピッチ周期情報、係数情報
(X)、係数情報(Y)、およびゲイン情報を入力し、
これらの情報から合成音声を生成する構成を示してい
る。
【0032】まず、駆動信号の再生方法について説明す
る。ピッチベクトル再生部300において、音声符号化
装置から伝送されたピッチ周期情報を基に、符号化装置
で行った方法と同様の方法で過去の駆動信号からピッチ
ベクトルを得る。基底変換部320は、符号化装置のと
ころで説明したのと同様の方法で、固定基底格納部33
0からの基底を組み合わせてピッチベクトルpと独立化
された基底uからなる集合Uと、基底uと独立化された
基底vからなる集合Vを生成し出力する。
【0033】合成フィルタ情報復号部310は伝送され
た合成フィルタ情報から合成フィルタ係数を再生し、合
成部410および基底変換部320に出力する。駆動信
号生成部400は、係数復号部370、380、ゲイン
復号部390で復号された係数情報とゲイン情報を基
に、基底変換部からの基底と組み合わせて駆動信号を出
力する。合成部410は駆動信号と合成フィルタ係数か
ら合成音声を再生する。
【0034】
【発明の効果】以上説明したように本発明の音声符号化
装置は、1つの基底ベクトルがピッチ成分または雑音成
分をうまく表現できない場合でも、品質維持ができ、基
底ベクトル毎の重要度を利用して少ない計算量で効率的
に駆動信号の符号化を行うことができる。
【図面の簡単な説明】
【図1】 本発明による音声符号化装置の一例を示すブ
ロック図。
【図2】 本発明による音声復号化装置の一例を示すブ
ロック図。
【符号の説明】
120・・・基底変換部 280・・・重み出力部 220、230・・・係数符号化部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−265496(JP,A) 特開 平4−264500(JP,A) 特開 平1−243099(JP,A) 特開 平6−132911(JP,A) 特開 平8−234799(JP,A) 特開 平6−209262(JP,A) 特開 平6−186998(JP,A) 特表 平2−502135(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/08 G10L 19/12 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】ピッチ周期情報に基づき第1の基底を得る
    第1の手段と、予め設定された複数の基底間の結合によ
    り第1の基底と独立化された基底の集合Uを得るための
    第2の手段と、少なくとも第1の基底と集合Uとを用い
    て音声信号または音源信号を符号化する手段とを有する
    ことを特徴とする音声符号化装置。
  2. 【請求項2】ピッチ周期情報に基づき第1の基底を得る
    第1の手段と、予め設定された複数の基底の結合により
    第1の基底と独立化された基底の集合Uを得るための第
    2の手段と、前記基底の集合Uと独立に扱うことのでき
    る基底の集合Vを得るための第3の手段と、少なくとも
    集合Vの基底と集合Uの基底を用いて、音声信号または
    音源信号を符号化する手段とを有することを特徴とする
    音声符号化装置。
  3. 【請求項3】前記集合Vの基底に乗じる係数と、集合U
    の基底に乗じる係数を分離して符号化する手段を有する
    ことを特徴とする請求項2記載の音声符号化装置。
  4. 【請求項4】ピッチ周期情報に基づいて得られた第1の
    基底と、予め設定された複数の基底間の結合により第1
    の基底と独立化された基底の集合Uとから駆動信号を生
    成する手段と、この駆動信号を用いて音声信号を合成す
    る手段とを有することを特徴とする音声復号化装置。
  5. 【請求項5】ピッチ周期情報に基づいて得られた第1の
    基底と独立化された基底の集合Uと、基底の集合Uと独
    立に扱うことのできる基底の集合Vとから駆動信号を生
    成する手段と、この駆動信号を用いて音声信号を合成す
    る手段とを有することを特徴とする音声復号化装置。
  6. 【請求項6】集合Vの基底に乗じる係数と、集合Uの基
    底に乗じる係数を復号する手段を有することを特徴とす
    る請求項5記載の音声復号化装置。
JP14061794A 1994-06-23 1994-06-23 音声符号化装置及び音声復号化装置 Expired - Lifetime JP3489748B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14061794A JP3489748B2 (ja) 1994-06-23 1994-06-23 音声符号化装置及び音声復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14061794A JP3489748B2 (ja) 1994-06-23 1994-06-23 音声符号化装置及び音声復号化装置

Publications (2)

Publication Number Publication Date
JPH086600A JPH086600A (ja) 1996-01-12
JP3489748B2 true JP3489748B2 (ja) 2004-01-26

Family

ID=15272879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14061794A Expired - Lifetime JP3489748B2 (ja) 1994-06-23 1994-06-23 音声符号化装置及び音声復号化装置

Country Status (1)

Country Link
JP (1) JP3489748B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69721595T2 (de) 1996-11-07 2003-11-27 Matsushita Electric Ind Co Ltd Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
JP3404016B2 (ja) 2000-12-26 2003-05-06 三菱電機株式会社 音声符号化装置及び音声符号化方法

Also Published As

Publication number Publication date
JPH086600A (ja) 1996-01-12

Similar Documents

Publication Publication Date Title
US8271274B2 (en) Coding/decoding of a digital audio signal, in CELP technique
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
EP0926660B1 (en) Speech encoding/decoding method
CA2430111C (en) Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs
JPH04134400A (ja) 音声符号化装置
JPH07261800A (ja) 変換符号化方法、復号化方法
JP3064947B2 (ja) 音声・楽音符号化及び復号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP3275247B2 (ja) 音声符号化・復号化方法
JP3489748B2 (ja) 音声符号化装置及び音声復号化装置
JP2538450B2 (ja) 音声の励振信号符号化・復号化方法
JP3268750B2 (ja) 音声合成方法及びシステム
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
KR100556278B1 (ko) 벡터탐색방법
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3319551B2 (ja) ベクトル量子化装置
JPH0519796A (ja) 音声の励振信号符号化・復号化方法
JP2002073097A (ja) Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法
JP2853170B2 (ja) 音声符号化復号化方式
JP3092436B2 (ja) 音声符号化装置
JP3099836B2 (ja) 音声の励振周期符号化方法
JPH02282800A (ja) 音声符号化方式
JP3576805B2 (ja) 音声符号化方法及びシステム並びに音声復号化方法及びシステム
JP3184038B2 (ja) 音声符号化/復号化方法および音声符号化/復号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071107

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081107

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091107

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101107

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101107

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111107

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121107

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131107

Year of fee payment: 10

EXPY Cancellation because of completion of term