JP3087591B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3087591B2
JP3087591B2 JP06323454A JP32345494A JP3087591B2 JP 3087591 B2 JP3087591 B2 JP 3087591B2 JP 06323454 A JP06323454 A JP 06323454A JP 32345494 A JP32345494 A JP 32345494A JP 3087591 B2 JP3087591 B2 JP 3087591B2
Authority
JP
Japan
Prior art keywords
delay
code
signal
residual
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06323454A
Other languages
English (en)
Other versions
JPH08179797A (ja
Inventor
慶一 舟木
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP06323454A priority Critical patent/JP3087591B2/ja
Priority to EP95120601A priority patent/EP0724252B1/en
Priority to CA002166138A priority patent/CA2166138C/en
Priority to US08/578,910 priority patent/US5924063A/en
Priority to DE69527345T priority patent/DE69527345T2/de
Publication of JPH08179797A publication Critical patent/JPH08179797A/ja
Application granted granted Critical
Publication of JP3087591B2 publication Critical patent/JP3087591B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声符号化装置に関し、
特に音声信号を低いビットレート、特に8〜4kb/s程度
で高品質に符号化するためのCELP(Code Ex
ited Linear Predictive Co
ding)方式による音声符号化方式に関する。
【0002】
【従来の技術】近年、無線を媒介にした自動車電話やコ
ードレス電話のディジタル化が急がれている。無線では
使用できる周波数帯域が少ないため、音声信号を低ビッ
トレートで符号化する方式の開発は重要である。音声信
号を8〜4kb/s程度の低いビットレートで符号化する方
式として、例えば、アメリカのアタルらによるアイキャ
スプ プロシーディング記載のコードエキサイテッド
リニア ブレディクション:ハイクオリティ スピーチ
アトロウビットレーツ(M.Schroeder a
nd B.S.Atal,”Code−excited
linearprediction:High qu
ality speech at low bit r
ates,”ICASSP proc.85,pp.9
37−940,1985)と題した論文(以後文献1と
呼ぶ)等に記載されているCELP(Code Exc
ited LPC Coding)が知られている。
【0003】この方法において、送信側では次の手順で
符号化処理が行われる。先ず、フレーム毎(例えば20
ms)に音声信号から音声の周波数特性を表す短期予測
符号を抽出する(短期予測)。次にフレームをさらに小
区間のサブフレーム(例えば5ms)に分割する。サブ
フレーム毎に、あらかじめ用意された音声のピッチ相関
を表す遅延符号と過去の音源信号からなる適応コードブ
ックを用いて、最適な遅延符号を次の手順で決定する
(長期予測)。遅延符号をあらかじめ用意された分変化
(試行)させ、各遅延符号に対する遅延値(ピッチ)だ
け、過去の音源信号を遅延させることにより適応コード
ベクトルを抽出する。抽出された適応コードベクトルを
用いて合成信号を生成し音声信号との誤差電力(距離)
を算出する。算出された距離が最小になる最適遅延符号
と、最適遅延符号に対応する適応コードベクトルとその
ゲインを決定する(適応コードブック探索)。
【0004】次に、あらかじめ用意された種類の量子化
符号である雑音信号(音源コードブック)から抽出した
音源コードベクトルによる合成信号と、長期予測して求
められた遅延符号との距離が最小になる音源コードベク
トルとゲインを決定する(音源コードブック探索)。決
定された適応コードベクトル並びに音源コードベクトル
の種類を表すインデクスと各々の音源信号のゲインなら
びにスペクトルパラメータの種類を表すインデックスを
伝送する。
【0005】具体的な適応コードベクトルの遅延符号の
探索法は次の手順で行われる。先ず、入力された音声信
号x〔n〕に対し聴感上の重み付け、過去の影響信号の
減算を行った信号z〔n〕を算出する。次に、短期予測
で求められ、量子化、逆量子化されたスペクトルパラメ
ータで構成される合成フィルタHを遅延符号dに対応す
る適応コードベクトルed 〔n〕で駆動して合成信号H
d 〔n〕を算出する。z〔n〕とHed 〔n〕の誤差
電力(距離)である、次式のEd が最小になる遅延符号
dを求める。
【0006】 Ed =Σ(z〔n〕−gd ・H・ed 〔n〕)2 ………(1) ここで、Σはn=0〜Ns−1の総和(以下同じ)を、
Nsはサブフレーム長を、Hは合成フィルタを実現する
行列を、gd は適応コードベクトルed のゲインを表
す。
【0007】実際には式(1)は、 Ed =Σz〔n〕2 −Cd 2 /Gd ………(2) の様に展開される。
【0008】第(2)式の分子Cd は相互相関、分母G
d は自己相関であり、 Cd =Σz〔n〕・H・ed 〔n〕 ………(3) Gd =Σ(H・ed 〔n〕2 ) ………(4) で表される。
【0009】ここで、ed 〔n〕は、過去のフレームに
おける符号化処理により求められた音源信号を遅延符号
dに相当する遅延値分遅延させたベクトルである。以上
のように、フィルタリング処理を用いて最適な遅延符号
を求める長期予測の方法をクローズドループ処理による
適応コードブック探索と呼ぶ。
【0010】CELP系の音声符号化方式の場合、音質
は長期予測の予測精度に依存する。長期予測の予測精度
を上げる手段として、遅延符号を整数点から小数点に拡
張する少数点遅延化が一般的に行われている。これは、
例えば、アメリカのクルーンらによるアイキャスプ プ
ロシーディング記載のピッチプレディクターズ ウィズ
ハイテンポラル レゾルーション(P.Croon
et.al.,”Pitch Predictors
With High Temporal Resolu
tion,”ICASSP Proc.90,pp.6
61−664,1990)(以下、文献2とする)を参
照できる。
【0011】小数点遅延化により音質がかなり向上する
が、各々のサブフレーム内での最適化であるため、複数
のサブフレームにわたる遅延値の変化、すなわち、ピッ
チパスは必ずしもスムーズにはならず、度々、大きなギ
ャップが生じる。ピッチパスにおけるギャップは符号化
音において不連続音や波形の揺らぎを引き起こし、音質
劣化の原因になっている。
【0012】そこで、各サブフレーム毎に音声信号その
ものの整合であるオープンループ処理で遅延符号の候補
を求め、フレーム全体で遅延値(ピッチ)が滑らかに変
化するようにピッチ変化経路(ピッチパス)を求める方
法が提案されている。
【0013】これは、例えば、アメリカのガーソンらに
よる、アイトリプルイー ジャーナル記載のテクニック
ズ フォーインプルービング ザ パフォーマンス オ
ブセルプ タイプ スピーチ コーダーズ(I.A.G
erson and M.A.Jasiuk,”Tec
hniques for Improving the
Performance of CELP−Type
Speech Coders,”IEEE Jour
nal on Selected Areas)(以
下、文献3とする)で参照できる。
【0014】この方法は、図14に示される方法であ
る。先ず、遅延符号を試行させ(300)、試行させた
各遅延符号dに対し、過去の音声信号または聴感重み付
け信号が蓄積されているオープンループ適応コードブッ
ク(360)より、遅延符号dに相当する遅延音声ベク
トルxd を生成する(310)。
【0015】次に、符号化サブフレームの音声信号また
は聴感重み付け信号xを用いて、相互相関値<x,xd
>と自己相関値<xd ,xd >を算出する(320)。
算出された相関値を用いて、音声信号と遅延音声ベクト
ルとの誤差エネルギを表す距離E=<x,xd 2 /<
d ,xd >を算出する(330−0)。
【0016】300から330−0までの処理を1フレ
ーム内の全サブフレームに対して行い、各サブフレーム
で算出された距離または相関を用いて、滑らかに変化す
るピッチパスを求める(340−0)。求められたピッ
チパスにしたがって、過去の符号化結果である過去の音
源信号(クローズドループ適応コードブック(15
0))を用いる従来のクローズドループ処理による適応
コードブック探索を最後に行い、各サブフレーム毎の最
適遅延符号を求める(350)。この方法により、推定
される遅延符号で表される遅延値(ピッチ)の変化が滑
らかになるため音質が向上する。
【0017】
【発明が解決しようとする課題】文献3で述べられてい
る、オープンループ処理による探索は、過去の音声信号
ベクトルと現在の音声信号ベクトルとの整合により最適
な遅延符号の探索を行うことである。ピッチの違いを両
ベクトルの整合により抽出する場合、現在と過去の信号
ベクトルはスペクトル成分が異なるため、推定に大きな
誤りが生じやすい。 一方、文献1,2に述べられてい
るようなクローズドループ適応コードブック探索を用い
ることにより、より正確な遅延符号を推定することがで
きるが、過去のサブフレームの符号化結果である過去の
音源信号が必要になるため、文献3に述べられているよ
うなピッチパスの推定を行うことは出来ない。
【0018】本発明の目的は、長期予測において、より
滑らかなピッチパスを高精度に推定し、低ビットレート
でも良好な音質を得ることにある。
【0019】
【課題を解決するための手段】本発明における音声符号
化装置は、音声信号の一定区間毎に前記音声信号の周波
数特性を表す短期予測符号を決定する音声分析部と、
記音声信号を前記短期予測符号で決定される逆フィルタ
に通して合成フィルタの残差信号を算出する逆フィルタ
部と、過去の音声区間における前記残差信号を蓄積する
残差コードブックと、前記音声信号のピッチ相関を表す
遅延符号を試行させる遅延符号試行部と、前記残差コー
ドブックを用いて、前記遅延符号に対応する遅延残差ベ
クトルを生成する遅延残差ベクトル生成部と、前記遅延
残差ベクトルを入力として前記短期予測符号で決定され
る合成フィルタで合成信号を生成するフィルタリング部
と、前記音声信号と前記合成信号の距離を算出する距離
算出部と、前記距離を用いて遅延値が滑らかに変化する
最適な遅延符号を求めるピッチパス推定部とを有するこ
とを特徴とする。
【0020】更に本発明における音声符号化装置は、音
声信号の一定区間毎に前記音声信号の周波数特性を表す
短期予測符号を決定する音声分析部と、前記音声信号を
前記短期予測符号で決定される逆フィルタに通して合成
フィルタの残差信号を算出する逆フィルタ部と、過去の
音声区間における前記残差信号を蓄積する残差コードブ
ックと、前記音声信号のピッチ相関を表す遅延符号を試
行させる遅延符号試行部と、前記残差コードブックを用
いて、前記遅延符号に対応する遅延残差ベクトルを生成
する遅延残差ベクトル生成部と、前記遅延残差ベクトル
を入力として前記短期予測符号で決定れされる合成フィ
ルタで合成信号を生成するフィルタリング部と、前記音
声信号と前記合成信号の距離を算出する距離算出部と、
前記距離を用いて遅延値が滑らかに変化する遅延符号を
求めるピッチパス推定部と、前記ピッチパス推定部で求
められた遅延符号をもとに、過去の音源信号により最適
な遅延符号を決定する適応コードブック探索部と、最適
な量子化符号を決定し、音源信号を生成する音源探索部
とを有することを特徴とする。
【0021】また本発明における音声符号化装置は、音
声信号の一定区間毎に前記音声信号の周波数特性を表す
短期予測符号を決定する音声分析部と、前記音声信号を
前記短期予測符号で決定される逆フィルタに通して合成
フィルタのインパルス応答を計算するインパルス応答算
出部と、前記短期予測符号で決定される合成フィルタの
残差信号を算出する逆フィルタ部と、過去の音声区間に
おける前記残差信号を蓄積する残差コードブックと、前
記音声信号のピッチ相関を表す遅延符号を試行させる遅
延符号試行部と、前記残差コードブックを用いて、前記
遅延符号に対応する遅延残差ベクトルを生成する遅延残
差ベクトル生成部と、前記音声信号と前記インパルス応
答と前記遅延残差ベクトルとを用いて距離を算出する距
離算出部と、前記距離を用いて遅延値が滑らかに変化す
る最適な遅延符号を求めるピッチパス推定部とを有する
ことを特徴とする。
【0022】更に本発明における音声符号化装置は、音
声信号の一定区間毎に前記音声信号の周波数特性を表す
短期予測符号を決定する音声分析部と、前記音声信号を
前記短期予測符号から決定される逆フィルタに通して
成フィルタのインパルス応答を計算するインパルス応答
算出部と、前記短期予測符号で決定される合成フィルタ
の残差信号を算出する逆フィルタ部と、過去の音声区間
における前記残差信号を蓄積する残差コードブックと、
前記音声信号のピッチ相関を表す遅延符号を試行させる
遅延符号試行部と、前記残差コードブックを用いて、前
記遅延符号に対応する遅延残差ベクトルを生成する遅延
残差ベクトル生成部と、前記音声信号と前記インパルス
応答と前記遅延残差ベクトルとを用いて距離を算出する
距離算出部と、前記距離を用いて遅延値が滑らかに変化
する遅延符号を求めるピッチパス推定部と、前記ピッチ
パス推定部で求められた遅延符号をもとに、過去の音源
信号により最適な遅延符号を決定する適応コードブック
探索部と、最適な量子化符号を決定し、音源信号を生成
する音源探索部とを有することを特徴とする。
【0023】
【作用】本発明では、長期予測におけるピッチパス推定
を、式(5)のように過去の残差信号を遅延させて得ら
れる遅延残差ベクトルに対し短期予測符号により決定さ
れる合成フィルタでフィルタリングするクローズドルー
プ処理により算出される、距離または相関値を用いて行
う。すなわち、文献1に示されている従来法における、
式(1)に代えて、式(5)で示される距離または相関
を用いて、複数のサブフレームにわたるピッチパスを求
める。
【0024】 Ed =Σ(x〔n〕−g・Hrd 〔n〕)2 =Σ(Hr〔n〕−g・Hrd 〔n〕)2 =<x,x>−<x,Hrd 2 /<Hrd ,Hrd >………(5) rd 〔n〕=r〔n−di〕…………(6) ここで、r〔n〕は現サブフレームの残差信号を、rd
〔n〕はr〔n〕をd遅延させた遅延残差信号ベクトル
を、Hは合成フィルタを、gはゲインを、diは遅延符
号dに相当する遅延値をあらわす。
【0025】式(5)は、 E=(Hr−g・Hrd T ・(Hr−g・Hrd ) =(r−g・rd T ・HT H・(r−g・rd )…………(7) の様にベクトル表現できる。
【0026】式(7)より、この方式ではスペクトル成
分(HT H)は各試行遅延dに対し独立になる。また、
(r−g・rd )は、スペクトルの影響が低減されたピ
ッチ重み付け成分の差になるため、従来のオープンルー
プ処理の音声信号と遅延音声ペクトルの整合に比べ、よ
り精密な整合になる。したがって、従来のオープンルー
プ処理によるピッチパス推定より、誤りの少ないピッチ
パスの推定が実現できる。
【0027】さらに、残差信号を用いて、式(5)の距
離を用いることにより、式(1)のような過去の音源を
用いる距離では実現が不可能であった、文献3に示され
るような、複数サブフレームにわたるピッチパス推定が
実現可能になる。
【0028】
【実施例】以下、図面を用いて本発明の実施例について
説明する。
【0029】図1,図3は本願第1の実施例を表す構成
図である。図1において、本発明は符号化処理部Aと復
号化処理部Bとからなっている。
【0030】図3は図1の長期予測回路160−1の部
分を詳細に表す一例の構成図である。
【0031】最初に各構成モジュールを説明する。入力
端子100は音声入力端子である。バッファ110は音
声信号を記憶する回路である。音声分析回路120は音
声のスペクトルパラメータであるLPC係数を抽出する
回路である。パラメータ量子化回路130はLPC係数
を量子化する回路である。重み付け回路140は音声信
号に対し聴感重み付けを行う回路である。
【0032】長期予測回路160−1は、ピッチ相関を
表す遅延符号(適応コードベクトル)を探索する回路で
ある。ゲインコードブック190−1は、適応コードベ
クトルのゲイン項を表すパラメータが蓄積されているコ
ードブックである。ゲインコードブック探索回路200
−1は、適応コードベクトルの量子化ゲインをゲインコ
ードブックから決定する回路である。マルチプレクサ2
10は符号系列を組み合わせて出力する回路である。
【0033】長期予測復号回路165は、遅延符号から
適応コードベクトルを生成する回路である。デマルチプ
レクサ220は符号化されたコードを符号系列にデコー
ドする回路である。合成フィルタ230は生成された音
源と音声合成フィルタより音声信号を再生する回路であ
る。出力端子240は音声出力端子である。
【0034】図3を参照すると、遅延試行回路300は
遅延符号を変化させる回路である。遅延符号dの遅延残
差ベクトルrd 生成回路310は、設定された遅延符号
dに対して、残差コードブックから遅延符号dに対応す
る遅延値に相当する遅延音声ベクトルを生成する回路で
ある。
【0035】逆フィルタ回路370は、現サブフレーム
の聴感重み付け回路の出力である聴感重み付け信号ベク
トルxを短期予測符号で決定される逆フィルタに通し、
残差信号を生成する回路である。残差コードブック39
0は、逆フィルタ回路370で生成された残差信号を蓄
えておくコードブックである。フィルタリング回路38
0は、遅延残差ベクトルを短期予測符号で決定される合
成フィルタでフィルタリングする回路である。
【0036】距離算出回路330−1は、聴感重み付け
信号ベクトルxとフィルタリング回路で得られたフィル
タリング信号H・rd の距離または相関を算出する回路
である。ピッチパス推定回路340−1は、距離算出回
路330−1で算出された距離または相関を用いて、ピ
ッチが滑らかに変化するピッチパスを推定する回路であ
る。
【0037】この第1の実施例の処理の流れを説明す
る。まず、符号化処理部Aでは、入力ポート100よ
り、音声信号が入力されバッファ110に保存される。
バッファ110に蓄えられた一定サンプルの音声信号を
用いて音声分析回路120で短期予測分析され、音声信
号のスペクトル特性を表すLPC係数を算出する。LP
C分析により求められたスペクトルパラメータはパラメ
ータ量子化回路130で量子化され、LPC係数の量子
化符号がマルチプレクサ210に送られると共に、逆量
子化され以後の符号化処理に用いられる。
【0038】バッファ110に蓄えられた音声信号は量
子化/逆量子化されたLPC係数を用いて重み付け回路
140で聴感上の重み付けがされ、以降のコードブック
探索に用いられる。
【0039】長期予測、ゲインコードブックでコードブ
ック探索が行なわれる。まず、最初に長期予測回路16
0−1で長期予測を行い、ピッチ相関を表す最適遅延符
号を決定し、その符号(遅延符号)をマルチプレクサ2
10に転送するとともに、適応コードベクトルの生成を
行なう。ゲインコードブック探索回路200−1で適応
コードベクトルのゲインを算出し、その符号をマルチプ
レクサ210に転送する。マルチプレクサ210では、
各コードを組み合わせて伝送コードに変換し、出力す
る。
【0040】復号化処理部では、デマルチプレクサ22
0で、入力された伝送符号を各符号に分解する。LPC
係数を表す符号よりフィルタ係数をデコードし、合成フ
ィルタ230に転送する。遅延符号より長期予測復号回
路165を用いて適応コードベクトルを生成する。ゲイ
ンコードよりゲインコードブック190−1を用いて適
応コードベクトルのゲインを算出し、適応コードベクト
ルにゲインを掛け、合成フィルタの入力信号を生成す
る。最後に入力信号を用いて合成フィルタ230で音声
信号の合成を行なう。
【0041】次にこの第1の実施例における長期予測部
を図3を用いて説明する。図3は図1の長期予測回路1
60−1の処理を詳細に記述している。
【0042】まず、370で現サブフレームの聴感重み
付け信号ベクトルxの逆フィルタ信号になる残差信号を
求める。300で整数値を取る遅延符号を試行させ、各
遅延符号毎に310,380,330−1の処理を行
う。310で300で設定された遅延符号dに対応する
遅延残差ベクトルrd を求める。rd は式(6)にした
がって求める。
【0043】次に、380で、310で生成された遅延
残差ベクトルrd を用いて、短期予測符号で決定される
合成フィルタHを用いて、合成信号H・rd を算出す
る。算出された合成信号H・rd と聴感重み付け信号ベ
クトルxを用いて、330−1で距離を算出する。距離
は、合成信号H・rd と聴感重み付け信号ベクトルxの
2乗誤差または、相互相関<x,H・rd >、自己相関
<H・rd ,H・rd >の相関値にする。以上の30
0,310,380,330−1の処理を1フレーム中
の全サブフレームに対し行う。
【0044】最後に、試行回路300による処理ループ
で算出された、各サブフレームの各遅延符号に対応する
距離を用いて、ピッチパス推定回路340−1でピッチ
を表す遅延値が滑らかに変化するピッチパスを求める。
ピッチパスの推定法は、文献3で参照できる従来の方法
を用いる。
【0045】この方法では先ず、全整数点遅延の距離ま
たは相関値を補間またはポリフェーズフィルタリング
し、小数点遅延の距離または相関値を求める。ポリフェ
ーズフィルタリングは文献2の方法を用いる。
【0046】次に、整数点遅延で最も予測効率の高かっ
たサブフレームを最適サブフレームとして決定し、最適
サブフレームで、M個(Mは例えば6個)の候補を距離
または相関値(相互相関の2乗/自己相関)により求め
る。求められた最適サブフレームのM個の候補に対し、
1つ前および1つ後のサブフレームで、遅延の変化が一
定範囲内に収まるように拘束された遅延値の範囲内で最
も距離が良くなる遅延符号を、先に求められた小数点遅
延符号の距離または相関値を用いて求める。
【0047】この手順で1フレーム内にわたるM本のピ
ッチパスを求める。M本のピッチパスの中で、全サブフ
レームの距離の総和が最も良くなるパスをピッチパスと
して決定し、ピッチパスにおける、各サブフレームの遅
延符号を最適遅延符号に決定する。
【0048】図2,図4は第2の実施例を表す構成図で
ある。本例でも符号化処理部Aと復号化処理部Bとから
なる。
【0049】図4は図2の長期予測回路160−2の部
分を詳細に表す構成図である。
【0050】最初に各構成モジュールを説明する。クロ
ーズドループ適応コードブック150は、過去の音源信
号を蓄えておくコードブックである。長期予測回路16
0−2は、ピッチ相関を表す遅延符号(適応コードベク
トル)を探索する回路である。音源コードブック170
は、長期予測残差を表すサブフレーム長の音源コードベ
クトルが蓄えられたコードブックである。音源探索回路
180は音源コードブックから最適な量子化符号(音源
コードベクトル)を決定する回路である。
【0051】ゲインコードブック190−2は、適応コ
ードベクトルのゲイン項と音源コードベクトルのゲイン
項を表すパラメータが蓄積されているコードブックであ
る。ゲインコードブック探索回路200−2は、適応コ
ードベクトルの量子化ゲインと音源コードブックの量子
化ゲインをゲインコードブックから決定する回路であ
る。
【0052】クローズドループ適応コードブック探索回
路350は、各サブフレーム毎にピッチパス推定回路で
決定されたピッチパスに対応する遅延符号の近傍符号の
みを用いて、適応コードブック探索を従来のクローズド
ループ処理で行う回路である。その他の部分は図1の第
1の実施例と同じである。
【0053】第2の実施例の処理の流れを説明する。ま
ず符号化処理部Aでは、入力ポート100より、音声信
号が入力されバッファ110に保存される。バッファ1
10に蓄えられた一定サンプルの音声信号を用いて音声
分析回路120で短期予測分析され、音声信号のスペク
トル特性を表すLPC係数を算出する。LPC分析によ
り求められたスペクトルパラメータはパラメータ量子化
回路130で量子化され、LPC係数の量子化符号がマ
ルチプレクサ210に送られると共に、逆量子化され以
後の符号化処理に用いられる。
【0054】バッファ110で蓄えられた音声信号は量
子化/逆量子化されたLPC係数を用いて重み付け回路
140で聴感上の重み付けがされ、以降のコードブック
探索に用いられる。適応コードブック、音源コードブッ
ク、ゲインコードブックでコードブック探索が行なわれ
る。
【0055】まず、最初に長期予測回路160−2で長
期予測を行い、ピッチ相関を表す最適遅延符号を決定
し、その符号(遅延符号)をマルチプレクサ210に転
送するとともに、適応コードベクトルの生成を行なう。
次に、求められた適応コードベクトルの影響を減算後、
音源探索回路180で音源コードブック探索を行い、量
子化符号を決定し音源コードベクトルを生成すると共
に、その符号(量子化符号)をマルチプレクサ210に
転送する。適応コードベクトルと音源コードベクトルが
求められた後、ゲインコードブック探索回路200−2
で2つの音源のゲインを算出し、その符号をマルチプレ
クサ210に転送する。マルチプレクサ210では各コ
ードを組み合わせて伝送コードに変換し、出力する。
【0056】復号化処理部Bでは、デマルチプレクサ
で、入力された伝送符号を各符号に分解する。LPC係
数を表す符号よりフィルタ係数をデコードし、合成フィ
ルタ230に転送する。遅延符号より適応コードブック
150を用いて適応コードベクトルを生成する。音源の
符号を表す量子化符号より音源コードブック170を用
いて音源コードベクトルを生成する。ゲインコードより
適応コードベクトルと音源コードベクトルのゲインを算
出し、各音源にゲイン項を掛け合わせて合成フィルタの
入力信号を生成する。最後に入力信号を用いて合成フィ
ルタ230で音声信号の合成を行なう。
【0057】次に第2の実施例における長期予測部を、
図4を用いて説明する。図4は図2の長期予測回路16
0−2の処理を詳細に記述している。
【0058】まず、370で現サブフレームの聴感重み
付け信号ベクトルxの逆フィルタ信号になる残差信号を
求める。300で整数値を取る遅延符号を試行させ、各
遅延符号毎に310,380,330−1の処理を行
う。310で300で設定された遅延符号dに対応する
遅延残差ベクトルrd を求める。rd は式(6)にした
がって求める。
【0059】次に、380で、310で生成された遅延
残差ベクトルrd を用いて、短期予測符号で決定される
合成フィルタHを用いて、合成信号H・rd を算出す
る。算出された合成信号H・rd と聴感重み付け信号ベ
クトルxを用いて、330−1で距離を算出する。距離
は、合成信号H・rd と聴感重み付け信号ベクトルxの
2乗誤差または、相互相関<x,H・rd >、自己相関
<H・rd ,H・rd >の相関値にする。以上の30
0,310,380,330−1の処理を1フレーム中
の全サブフレームに対し行う。
【0060】次に、試行回路300による処理ループで
算出された、各サブフレームの各遅延符号に対応する距
離を用いて、ピッチパス推定回路340−1で、ピッチ
を表す遅延値が滑らかに変化するピッチパスを求める。
ピッチパスの推定法は、文献3で参照できる従来の方法
を用いる。
【0061】最後に、クローズドループ適応コードブッ
ク探索回路350で、推定されたピッチパスにおける、
各サブフレームの遅延符号の近傍のみを用いて、過去の
音源信号であるクローズドループ適応コードブック15
0を用いて最適遅延を決定する。
【0062】図1及び図5は第3の実施例を表す構成図
である。図5は図1の長期予測回路160−1の部分を
詳細に表す構成図である。
【0063】最初に各構成モジュールを説明する。イン
パルス応答算出回路400は、短期予測符号で決定され
る合成フィルタのインパルス応答を算出する回路であ
る。距離算出回路330−2は、聴感重み付け信号ベク
トルxとインパルス応答と遅延残差ベクトルrd を用い
て、距離を算出する回路である。
【0064】ピッチパス推定回路340−2は、距離算
出回路330−2で算出された距離を用いて、ピッチが
滑らかに変化するピッチパスを推定する回路である。そ
の他の部分は第1の実施例と同じである。
【0065】第3の実施例の処理の流れを説明する。長
期予測部以外は第1の実施例と全く同じであるので、こ
の第3の実施例における長期予測部のみを、図5を用い
て説明する。図5は図1の長期予測回路160−1の処
理を詳細に記述している。
【0066】まず、370で現サブフレームの聴感重み
付け信号ベクトルxの逆フィルタ信号になる残差信号を
求める。次に、400で合成フィルタHのインパルス応
答を算出する。300で整数値を取る遅延符号を試行さ
せ、各遅延符号毎に310,330−2の処理を行う。
310で300で設定された遅延符号dに対応する遅延
残差ベクトルrd を求める。rd は式(6)にしたがっ
て求める。
【0067】次に330−2で、聴感重み付け信号ベク
トルxとインパルス応答と遅延残差ベクトルを用いて、
距離または相関値を算出する。300の試行回路による
処理ループで算出された、各サブフレームの各遅延符号
に対応する、距離や相関値を用いて、ピッチパス推定回
路340−2で、ピッチを表す遅延値が滑らかに変化す
るピッチパスを求める。ピッチパスの推定法は、文献3
で参照できる従来の方法を用いる。推定されたピッチパ
スにおける、各サブフレームの遅延符号を最適遅延符号
として決定する。
【0068】図2,図6は第4の実施例を表す構成図で
ある。図7は図2の長期予測回路160−2の部分を詳
細に表す構成図である。
【0069】最初に各構成モジュールを説明する。イン
パルス応答算出回路400は、短期予測符号で決定され
る合成フィルタのインパルス応答を算出する回路であ
る。距離算出回路330−2は、聴感重み付け信号ベク
トルxとインパルス応答と遅延残差ベクトルrd を用い
て、距離を算出する回路である。ピッチパス推定回路3
40−2は、距離算出回路330−2で算出された距離
を用いて、ピッチが滑らかに変化するピッチパスを推定
する回路である。その他の部分は第2の実施例と同じで
ある。
【0070】第4の実施例の処理の流れを説明する。長
期予測部以外は第2の実施例と全く同じであるので、こ
の第4の実施例における長期予測部のみを、図7を用い
て説明する。図7は図2の長期予測回路160−2の処
理を詳細に記述している。
【0071】まず、370で現サブフレームの聴感重み
付け信号ベクトルxの逆フィルタ信号になる残差信号を
求める。次に、400で合成フィルタHのインパルス応
答を算出する。300で整数値を取る遅延符号を試行さ
せ、各遅延符号毎に310,330−2の処理を行う。
310で300で設定された遅延符号dに対応する遅延
残差ベクトルrd を求める。rd は式(6)にしたがっ
て求める。
【0072】次に330−2で、聴感重み付け信号ベク
トルxとインパルス応答と遅延残差ベクトルを用いて、
距離または相関値を算出する。300の試行回路による
処理ループで算出された、各サブフレームの各遅延符号
に対応する、距離や相関値を用いて、ピッチパス推定回
路340−2で、ピッチを表す遅延値が滑らかに変化す
るピッチパスを求める。ピッチパスの推定法は、文献3
で参照できる従来の方法を用いる。推定されたピッチパ
スにおける、各サブフレームの遅延符号の近傍のみを用
いて、350で従来のクローズドループ適応コードブッ
ク探索を行い、各サブフレームの最適遅延符号を求め
る。
【0073】図1,図7は第5の実施例を表す構成図で
ある。図7は図1の長期予測回路160−1の部分を詳
細に表す構成図である。
【0074】最初に各構成モジュールを説明する。イン
パルス応答自己相関算出回路410は、インパルス応答
の自己相関関数を算出する回路である。逆方向フィルタ
リング回路420はインパルス応答を用いて、聴感重み
付け信号ベクトルxを逆方向にフィルタリングする回路
である。相互相関算出回路430は、遅延残差ベクトル
と逆方向フィルタリング信号の相関により、相互相関<
x,H・rd >を算出する回路である。
【0075】近似自己相関算出回路440は、自己相関
近似法により自己相関<H・rd ,H・rd >を算出す
る回路である。距離算出回路330−3は自己相関と相
互相関を用いて距離を算出する回路である。ピッチパス
推定回路340−3は、算出された距離または相関を用
いて、ピッチが滑らかに変化するピッチパスを推定する
回路である。その他の部分は第3の実施例と同じであ
る。
【0076】第5の実施例の処理の流れを説明する。長
期予測部以外は第3の実施例と全く同じであるので、こ
の第5の実施例における長期予測部のみを、図7を用い
て説明する。図7は図1の長期予測回路160−1の処
理を詳細に記述している。
【0077】まず、370で現サブフレームの聴感重み
付け信号ベクトルxの逆フィルタ信号になる残差信号を
求める。次に、400で合成フィルタHのインパルス応
答を算出し、410でそのインパルス応答の自己相関関
数を算出する。
【0078】次に420で、聴感重み付け信号ベクトル
xに対し、インパルス応答を用いて逆方向フィルタリン
グ信号を算出する。300で整数値を取る遅延符号を試
行させ、各遅延符号毎に310,430,440,33
0−3の処理を行う。310で300で設定された遅延
符号dに対応する遅延残差ベクトルrd を求める。rd
は式(6)にしたがって求める。
【0079】次に430で、逆方向フィルタリングの出
力と遅延残差ベクトルを用いて、相互相関<x,H・r
d >を算出する。次に440で、自己相関近似法によ
り、自己相関<H・rd ,H・rd >を算出する。
【0080】この方法は、例えば、アメリカのトランス
コ、アタルによるアイキャスプ プロシーディング記載
のエフィシエント プロセジャーズ フォー ファイン
ディングジ オプチマムイノベーション イン ストキ
ャステック コーダー(Efficient Proc
edures For Finding The Op
timum Innovation In Stoca
stic Coders,I.M.Trancoso,
B.S.Atal ICASSP86,2375−23
78,1986.)(以下文献4)等を参照できる。
【0081】2つの相関値を用いて、330−3で相互
相関の2乗/自己相関で表される距離を算出する。30
0,310,430,440,330−3の処理を1フ
レーム内の全サブフレームに対し行う。次に、300の
試行回路による処理ループで算出された、各サブフレー
ムの各遅延符号に対応する、距離や相関値を用いて、ピ
ッチパス推定回路340−3でピッチを表す遅延値が滑
らかに変化するピッチパスを求める。ピッチパスの推定
法は、文献3で参照できる従来の方法を用いる。推定さ
れたピッチパスにおける各サブフレームの遅延符号を最
適遅延として決定する。
【0082】図2,図8は第6の実施例を表す構成図で
ある。図8は図2の長期予測回路160−2の部分を詳
細に表す第6の実施例の構成図である。
【0083】最初に各構成モジュールを説明する。イン
パルス応答自己相関算出回路410は、インパルス応答
の自己相関関数を算出する回路である。逆方向フィルタ
リング回路420はインパルス応答を用いて、聴感重み
付け信号ベクトルxを逆方向にフィルタリングする回路
である。相互相関算出回路430は、遅延残差ベクトル
と逆方向フィルタリング信号の相関により、相互相関<
x,H・rd >を算出する回路である。
【0084】近似自己相関算出回路440は、自己相関
近似法により自己相関<H・rd ,H・rd >を算出す
る回路である。距離算出回路330−3は、自己相関と
相互相関を用いて距離を算出する回路である。ピッチパ
ス推定回路340−3は、算出された距離または相関を
用いて、ピッチが滑らかに変化するピッチパスを推定す
る回路である。その他の部分は第4の実施例と同じであ
る。
【0085】第6の実施例の処理の流れを説明する。長
期予測部以外は第4の実施例と全く同じであるので、こ
の第6の実施例における長期予測部のみを、図8を用い
て説明する。図8は図2の長期予測回路160−2の処
理を詳細に記述している。
【0086】まず、370で現サブフレームの聴感重み
付け信号ベクトルxの逆フィルタ信号になる残差信号を
求める。次に、400で合成フィルタHのインパルス応
答を算出し、410でそのインパルス応答の自己相関関
数を算出する。次に420で、聴感重み付け信号ベクト
ルxに対し、インパルス応答を用いて逆方向フィルタリ
ング信号を算出する。300で整数値を取る遅延符号を
試行させ、各遅延符号毎に310,430,440,3
30−3の処理を行う。310で300で設定された遅
延符号dに対応する遅延残差ベクトルrd を求める。r
d は式(6)にしたがって求める。
【0087】次に430で、逆方向フィルタリングの出
力と遅延残差ベクトルを用いて、相互相関<x,H・r
d >を算出する。次に440で、自己相関近似法によ
り、自己相関<H・rd ,H・rd >を算出する。この
方法は、文献4等を参照できる。 2つの相関値を用い
て、330−3で相互相関の2乗/自己相関で表される
距離を算出する。300,310,430,440,3
30−3の処理を1フレーム内の全サブフレームに対し
行う。次に、300の試行回路による処理ループで算出
された、各サブフレームの各遅延符号に対応する、距離
や相関値を用いて、ピッチパス推定回路340−3でピ
ッチを表す遅延値が滑らかに変化するピッチパスを求め
る。
【0088】ピッチパスの推定法は、文献3で参照でき
る従来の方法を用いる。推定されたピッチパスにおけ
る、各サブフレームの遅延符号の近傍のみを用いて、3
50で従来のクローズドループ適応コードブック探索を
行い、各サブフレームの最適遅延符号を求める。
【0089】図1,図9は第7の実施例を表す構成図で
ある。図9は図1の長期予測回路160−1の部分を詳
細に表す構成図である。
【0090】最初に各構成モジュールを説明する。ピッ
チパス推定回路340−4は遅延符号の差分符号化を行
いながら、滑らかに変化するピッチパスを求める回路で
ある。その他の部分は第5の実施例と同じである。
【0091】第7の実施例の処理の流れを説明する。長
期予測部以外は第5の実施例と全く同じであるので、こ
の第7の実施例における長期予測部のみを、図9を用い
て説明する。図9は図1の長期予測回路160−1の処
理を詳細に記述している。
【0092】まず、370で現サブフレームの聴感重み
付け信号ベクトルxの逆フィルタ信号になる残差信号を
求める。次に、400で合成フィルタHのインパルス応
答を算出し、410でそのインパルス応答の自己相関関
数を算出する。
【0093】次に420で、聴感重み付け信号ベクトル
xに対し、インパルス応答を用いて逆方向フィルタリン
グ信号を算出する。300で整数値を取る遅延符号を試
行させ、各遅延符号毎に310,430,440,33
0−3の処理を行う。310で300で設定された遅延
符号dに対応する遅延残差ベクトルrd を求める。rd
は式(6)にしたがって求める。
【0094】次に430で、逆方向フィルタリングの出
力と遅延残差ベクトルを用いて、相互相関<x,H・r
d >を算出する。次に440で、自己相関近似法によ
り、自己相関<H・rd ,H・rd >を算出する。この
方法は、文献4等を参照できる。 2つの相関値を用い
て、330−3で相互相関の2乗/自己相関で表される
距離を算出する。300,310,430,440,3
30−3の処理を1フレーム内の全サブフレームに対し
行う。次に、300の試行回路による処理ループで算出
された、各サブフレームの各遅延符号に対応する、距離
や相関値を用いて、ピッチパス推定回路340−4でピ
ッチを表す遅延値が滑らかに変化するピッチパスを求め
る。ピッチパスの推定法は、文献3で参照できる従来の
方法を用いる。 ピッチパスを求める時、遅延の差分符
号化を行う。すなわち、差分を行うサブフレームでは、
前サブフレームの遅延符号との差が差分のビット数以内
に収まるよう探索範囲を限定する。推定されたピッチパ
スにおける、各サブフレームの遅延符号を最適遅延符号
にする。
【0095】図2,図10は第8の実施例を表す構成図
である。図10は図2の長期予測回路160−2の部分
を詳細に表す構成図である。
【0096】最初に各構成モジュールを説明する。ピッ
チパス推定回路340−4は遅延符号の差分符号化を行
いながら、滑らかに変化するピッチパスを求める回路で
ある。その他の部分は第6の実施例と同じである。
【0097】第8の実施例の処理の流れを説明する。長
期予測部以外は第6の実施例と全く同じであるので、こ
の第8の実施例における長期予測部のみを、図10を用
いて説明する。図10は図2の長期予測回路160−2
の処理を詳細に記述している。 まず、370で現サブ
フレームの聴感重み付け信号ベクトルxの逆フィルタ信
号になる残差信号を求める。次に、400で合成フィル
タHのインパルス応答を算出し、410でそのインパル
ス応答の自己相関関数を算出する。
【0098】次に420で、聴感重み付け信号ベクトル
xに対し、インパルス応答を用いて逆方向フィルタリン
グ信号を算出する。300で整数値を取る遅延符号を試
行させ、各遅延符号毎に310,430,440,33
0−3の処理を行う。310で300で設定された遅延
符号dに対応する遅延残差ベクトルrd を求める。rd
は式(6)にしたがって求める。
【0099】次に430で、逆方向フィルタリングの出
力と遅延残差ベクトルを用いて、相互相関<x,H・r
d >を算出する。次に440で、自己相関近似法によ
り、自己相関<H・rd ,H・rd >を算出する。この
方法は、文献4等を参照できる。 2つの相関値を用い
て、330−3で相互相関の2乗/自己相関で表される
距離を算出する。300,310,430,440,3
30−3の処理を1フレーム内の全サブフレームに対し
行う。次に、300の試行回路による処理ループで算出
された、各サブフレームの各遅延符号に対応する、距離
や相関値を用いて、ピッチパス推定回路340−4でピ
ッチを表す遅延値が滑らかに変化するピッチパスを求め
る。ピッチパスの推定法は、文献3で参照できる従来の
方法を用いる。 ピッチパスを求める時、遅延の差分符
号化を行う。すなわち、差分を行うサブフレームでは、
前サブフレームの遅延符号との差が差分のビット数以内
に収まるよう探索範囲を限定する。推定されたピッチパ
スにおける、各サブフレームの遅延符号の近傍のみを用
いて、350で従来のクローズドループ適応コードブッ
ク探索を行い、各サブフレームの最適遅延符号を求め
る。差分符号化を行うサブフレームでは前サブフレーム
の遅延符号との差が差分のビットに入る範囲で探索を行
う。
【0100】図2,図11は第9の実施例を表す構成図
である。図11は図2の長期予測回路160−2の部分
を詳細に表す構成図である。
【0101】最初に各構成モジュールを説明する。影響
信号減算回路450−1は、1サブフレーム前の残差信
号による合成フィルタHのゼロ入力応答(影響信号)を
聴感重み付け音声ベクトルxが減算する回路である。そ
の他の部分は第8の実施例と同じである。
【0102】第9の実施例の処理の流れを説明する。長
期予測部以外は第8の実施例と全く同じであるので、こ
の第9の実施例における長期予測部のみを、図11を用
いて説明する。図11は図2の長期予測回路160−2
の処理を詳細に記述している。 まず、370で現サブ
フレームの聴感重み付け信号ベクトルxの逆フィルタ信
号になる残差信号を求める。次に、400で合成フィル
タHのインパルス応答を算出し、410でそのインパル
ス応答の自己相関関数を算出する。450−1で1サブ
フレーム前の残差信号による合成フィルタの影響信号を
算出し、聴感重み付けベクトルxから減算し、以後の処
理に用いる。
【0103】次に420で、聴感重み付け信号ベクトル
xに対し、インパルス応答を用いて逆方向フィルタリン
グ信号を算出する。300で整数値を取る遅延符号を試
行させ、各遅延符号毎に310,430,440,33
0−3の処理を行う。310で300で設定された遅延
符号dに対応する遅延残差ベクトルrd を求める。rd
は式(6)にしたがって求める。
【0104】次に430で、逆方向フィルタリングの出
力と遅延残差ベクトルを用いて、相互相関<x,H・r
d >を算出する。次に440で、自己相関近似法によ
り、自己相関<H・rd ,H・rd >を算出する。この
方法は、文献4等を参照できる。 2つの相関値を用い
て、330−3で相互相関の2乗/自己相関で表される
距離を算出する。300,310,430,440,3
30−3の処理を1フレーム内の全サブフレームに対し
行う。次に、300の試行回路による処理ループで算出
された、各サブフレームの各遅延符号に対応する距離や
相関値を用いて、ピッチパス推定回路340−4でピッ
チを表す遅延値が滑らかに変化するピッチパスを求め
る。ピッチパスの推定法は、文献3で参照できる従来の
方法を用いる。 ピッチパスを求める時、遅延の差分符
号化を行う。すなわち、差分を行うサブフレームでは、
前サブフレームの遅延符号との差が差分のビット数以内
に収まるよう探索範囲を限定する。推定されたピッチパ
スにおける、各サブフレームの遅延符号の近傍のみを用
いて、350で従来のクローズドループ適応コードブッ
ク探索を行い、各サブフレームの最適遅延符号を求め
る。差分符号化を行うサブフレームでは前サブフレーム
の遅延符号との差が差分のビットに入る範囲で探索を行
う。
【0105】図2,図12は第10の実施例を表す構成
図である。図12は図2の長期予測回路160−2の部
分を詳細に表す構成図である。
【0106】最初に各構成モジュールを説明する。影響
信号減算回路450−2は、1サブフレーム前の音源信
号による合成フィルタHのゼロ入力応答(影響信号)を
聴感重み付け音声ベクトルxから減算する回路である。
その他の部分は第8の実施例と同じである。
【0107】第10の実施例の処理の流れを説明する。
長期予測部以外は第8の実施例と全く同じであるので、
この第10の実施例における長期予測部のみを、図12
を用いて説明する。図12は図2の長期予測回路160
−2の処理を詳細に記述している。
【0108】まず、370で現サブフレームの聴感重み
付け信号ベクトルxの逆フィルタ信号になる残差信号を
求める。次に、400で合成フィルタHのインパルス応
答を算出し、410でそのインパルス応答の自己相関関
数を算出する。450−2で1サブフレーム前の音源信
号による合成フィルタの影響信号を算出し、聴感重み付
けベクトルxから減算し、以後の処理に用いる。
【0109】次に420で、聴感重み付け信号ベクトル
xに対し、インパルス応答を用いて逆方向フィルタリン
グ信号を算出する。300で整数値を取る遅延符号を試
行させ、各遅延符号毎に310,430,440,33
0−3の処理を行う。310で300で設定された遅延
符号dに対応する遅延残差ベクトルrd を求める。rd
は式(6)にしたがって求める。
【0110】次に430で、逆方向フィルタリングの出
力と遅延残差ベクトルを用いて、相互相関<x,H・r
d >を算出する。次に440で、自己相関近似法によ
り、自己相関<H・rd ,H・rd >を算出する。この
方法は、文献4等を参照できる。
【0111】2つの相関値を用いて、330−3で相互
相関の2乗/自己相関で表される距離を算出する。30
0,310,430,440,330−3の処理を1フ
レーム内の全サブフレームに対し行う。次に、300の
試行回路による処理ループで算出された、各サブフレー
ムの各遅延符号に対応する、距離や相関値を用いて、ピ
ッチパス推定回路340−4でピッチを表す遅延値が滑
らかに変化するピッチパスを求める。ピッチパスの推定
法は、文献3で参照できる従来の方法を用いる。 ピッ
チパスを求める時、遅延の差分符号化を行う。すなわ
ち、差分を行うサブフレームでは、前サブフレームの遅
延符号との差が差分のビット数以内に収まるよう探索範
囲を限定する。推定されたピッチパスにおける、各サブ
フレームの遅延符号の近傍のみを用いて、350で従来
のクローズドループ適応コードブック探索を行い、各サ
ブフレームの最適遅延符号を求める。差分符号化を行う
サブフレームでは前サブフレームの遅延符号との差が差
分のビットに入る範囲で探索を行う。
【0112】図2,図13は第11の実施例を表す構成
図である。図13は図2の長期予測回路160−2の部
分を詳細に表す構成図である。
【0113】最初に各構成モジュールを説明する。影響
信号減算回路450−3は、1サブフレーム前の最適遅
延残差ベクトルによる合成フィルタHのゼロ入力応答
(影響信号)を聴感重み付け音声ベクトルxから減算す
る回路である。その他の部分は第8の実施例と同じであ
る。
【0114】第11の実施例の処理の流れを説明する。
長期予測部以外は第8の実施例と全く同じであるので、
この第11の実施例における長期予測部のみを、図13
を用いて説明する。図13は図2の長期予測回路160
−2の処理を詳細に記述している。
【0115】まず、370で現サブフレームの聴感重み
付け信号ベクトルxの逆フィルタ信号になる残差信号を
求める。次に、400で合成フィルタHのインパルス応
答を算出し、410でそのインパルス応答の自己相関関
数を算出する。450−3で1サブフレーム前の遅延残
差ベクトルによる合成フィルタの影響信号を算出し、聴
感重み付けベクトルxから減算し、以後の処理に用い
る。
【0116】次に420で、聴感重み付け信号ベクトル
xに対し、インパルス応答を用いて逆方向フィルタリン
グ信号を算出する。300で整数値を取る遅延符号を試
行させ、各遅延符号毎に310,430,440,33
0−3の処理を行う。310で300で設定された遅延
符号dに対応する遅延残差ベクトルrd を求める。rd
は式(6)にしたがって求める。
【0117】次に430で、逆方向フィルタリングの出
力と遅延残差ベクトルを用いて、相互相関<x,H・r
d >を算出する。次に440で、自己相関近似法によ
り、自己相関<H・rd ,H・rd >を算出する。この
方法は、文献4等を参照できる。 2つの相関値を用い
て、330−3で相互相関の2乗/自己相関で表される
距離を算出する。300,310,430,440,3
30−3の処理を1フレーム内の全サブフレームに対し
行う。次に、300の試行回路による処理ループで算出
された、各サブフレームの各遅延符号に対応する、距離
や相関値を用いて、ピッチパス推定回路340−4でピ
ッチを表す遅延値が滑らかに変化するピッチパスを求め
る。ピッチパスの推定法は、文献3で参照できる従来の
方法を用いる。 ピッチパスを求める時、遅延の差分符
号化を行う。すなわち、差分を行うサブフレームでは、
前サブフレームの遅延符号との差が差分のビット数以内
に収まるよう探索範囲を限定する。推定されたピッチパ
スにおける、各サブフレームの遅延符号の近傍のみを用
いて、350で従来のクローズドループ適応コードブッ
ク探索を行い、各サブフレームの最適遅延符号を求め
る。差分符号化を行うサブフレームでは前サブフレーム
の遅延符号との差が差分のビットに入る範囲で探索を行
う。
【0118】なお、実施例では、距離に相互相関2 /自
己相関を用いたが、相互相関2 でも、誤差信号のエネル
ギでも同様な効果が得られる。また、実施例では聴感重
み付け信号xを用いて説明したが、音声信号でも、音声
信号のピッチ強調信号でも同様な効果が得られる。ま
た、実施例では試行遅延を整数遅延にし、ピッチパス推
定部で小数点化する方法で説明を行ったが、最初から小
数点遅延を試行させても同様な効果が得られる。
【0119】また、実施例ではピッチパスをM個求めた
後で、1個に絞り、クローズドループ適応コードブック
探索を行う方法を用いたが、M個のパス全てを用いてク
ローズドループ適応コードブック探索を行っても、同様
な効果が得られる。また、実施例では1フレームでピッ
チパスを求めていたが、複数のフレームでピッチパスを
求めても同様な効果が得られる。
【0120】また、実施例では最適遅延符号を1個に絞
っているが、複数候補求めて、次のステップ(音源コー
ドブック探索やゲインコードブック探索)で本選択を行
っても、以後のコードブック探索で同時最適探索を行っ
ても同様な効果が得られる。また、実施例では音源探索
に音源コードブック探索を用いたが、マルチパルスや残
差の波形が符号化のような音源信号の量子化法を用いて
も同様の効果が得られる。
【0121】また、実施例では遅延符号は小数点遅延で
説明したが、整数遅延に限定しても同様な効果が得られ
る。また、実施例では、音源探索に音源コードブックを
用いた探索を用いたが、マルチパルス等のその他の音源
探索法でも同様な効果が得られる。また、実施例では音
源コードブックを具体的に規定していないが、雑音コー
ドブックでも、ベクトル量子化(VQ)アルゴリズムに
より学習された学習コードブックでも同様な効果が得ら
れる。前者は文献1を参照できる。また、後者は、特願
平2−22955や特願平2−22956等を参照でき
る。
【0122】また、実施例では音声分析回路にLPC分
析を用いて説明を行ったが、スペクトルパラメータを抽
出するBURG法等の他の分析法においても同様な効果
が得られる。また、実施例ではLPC係数を用いて説明
したが、PARCOR(Partial auto−C
orrelation Coefficient)係数
やLSP(Line Spectrum pair)係
数のような他のスペクトルパラメータでも同様な効果が
得られることは明白である。また、実施例では音源コー
ドブック探索回路を1段構成にしたが、多段構成にして
も同様の効果が得られることも明白である。
【0123】尚、請求項の記載に関連して本発明は更に
次の態様をとり得るものである。 (1) 前記ピッチパス推定部または前記適応コードブ
ック探索部の少なくとも一方は、遅延符号を差分で表現
するピッチパス推定部または適応コードブック探索部で
あることを特徴とする請求項2,4,6いずれか記載の
音声符号化装置。 (2) 前サブフレームの残差信号による前記合成フィ
ルタの影響信号を予め減算する影響信号減算部を有する
ことを特徴とする請求項1〜7いずれか記載の音声符号
化装置、または上記(1)項記載の音声符号化装置。 (3) 前サブフレームの最適な音源信号による前記合
成フィルタの影響信号を予め減算する影響信号減算部を
有することを特徴とする請求項2,4,6いずれか記載
の音声符号化装置、または上記(1)項記載の音声符号
化装置。 (4) 前サブフレームの最適な遅延残差ベクトルによ
る前記合成フィルタの影響信号を予め減算する影響信号
減算部を有することを特徴とする請求項1〜7いずれか
記載の音声符号化装置、または上記(1)項記載の音声
符号化装置。
【0124】
【発明の効果】本発明によれば、長期予測をクローズド
ループ処理によるピッチトラッキングにより実現して、
ピッチトラッキングをクローズドループで行うことによ
り、従来のオープンループ処理によるピッチトラッキン
グより、ピッチトラッキング時の推定誤りが少なくなる
ため音質は向上し、クローズドループ処理によるピッチ
トラッキングを行った場合、従来のオープンループでピ
ッチトラッキングを行った場合よりも高いSNR(シグ
ナルノイズレシオ)が得られるという効果がある。
【図面の簡単な説明】
【図1】本発明の音声符号化復号化処理全体の一例の構
成図である。
【図2】本発明の音声符号化復号化処理全体の他の例の
構成図である。
【図3】本発明の第1の実施例の構成図である。
【図4】本発明の第2の実施例の構成図である。
【図5】本発明の第3の実施例の構成図である。
【図6】本発明の第4の実施例の構成図である。
【図7】本発明の第5の実施例の構成図である。
【図8】本発明の第6の実施例の構成図である。
【図9】本発明の第7の実施例の構成図である。
【図10】本発明の第8の実施例の構成図である。
【図11】本発明の第9の実施例の構成図である。
【図12】本発明の第10の実施例の構成図である。
【図13】本発明の第11の実施例の構成図である。
【図14】ピッチパス推定をオープン処理で行う長期予
測の従来の構成図である。
【符号の説明】
100 音声入力ポート 110 バッファ 120 音声分析回路 130 パラメータ量子化回路 140 重み付け回路 150 クローズドループ適応コードブック 160−1,160−2 長期予測回路 165 長期予測復号化回路 170 音源コードブック 180 音源探索回路 190−1,190−2 ゲインコードブック 200−1,200−2 ゲインコードブック探索回路 210 マルチプレクサ 220 デマルチプレクサ 230 合成フィルタ 240 音声出力端子 300 遅延符号試行回路 310 遅延符号dの遅延音声ベクトルxd 生成回路 320 相関算出回路 330−0〜330−3 距離算出回路 340−0〜340−4 ピッチパス推定回路 350 クローズループ適応コードブック探索回路 360 オープンループ適応コードブック 370 逆フィルタ回路 380 フィルタリング回路 390 残差コードブック 400 インパルス応答算出回路 410 インパルス応答自己相関関数算出回路 420 逆方向フィルタリング回路 430 相互相関算出回路 440 近似自己相関算出回路 450−1〜450−3 影響信号減算回路
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−222797(JP,A) 特開 平6−118992(JP,A) 特開 平4−270398(JP,A) 特開 平2−216200(JP,A) 小野「構造化ベクトル量子化に基づく 3.6kb/s音声符号化方式の検討」 信学技報SP92−134,pp9−16 (1993.2.12) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声信号の一定区間毎に前記音声信号の
    周波数特性を表す短期予測符号を決定する音声分析部
    と、前記音声信号を前記短期予測符号で決定される逆フィル
    タに通して 合成フィルタの残差信号を算出する逆フィル
    タ部と、 過去の音声区間における前記残差信号を蓄積する残差コ
    ードブックと、 前記音声信号のピッチ相関を表す遅延符号を試行させる
    遅延符号試行部と、 前記残差コードブックを用いて、前記遅延符号に対応す
    る遅延残差ベクトルを生成する遅延残差ベクトル生成部
    と、 前記遅延残差ベクトルを入力として前記短期予測符号で
    決定される合成フィルタで合成信号を生成するフィルタ
    リング部と、 前記音声信号と前記合成信号の距離を算出する距離算出
    部と、 前記距離を用いて遅延値が滑らかに変化する最適な遅延
    符号を求めるピッチパス推定部と、 を有することを特徴とする音声符号化装置。
  2. 【請求項2】 音声信号の一定区間毎に前記音声信号の
    周波数特性を表す短期予測符号を決定する音声分析部
    と、前記音声信号を前記短期予測符号で決定される逆フィル
    タに通して 合成フィルタの残差信号を算出する逆フィル
    タ部と、 過去の音声区間における前記残差信号を蓄積する残差コ
    ードブックと、 前記音声信号のピッチ相関を表す遅延符号を試行させる
    遅延符号試行部と、 前記残差コードブックを用いて、前記遅延符号に対応す
    る遅延残差ベクトルを生成する遅延残差ベクトル生成部
    と、 前記遅延残差ベクトルを入力として前記短期予測符号で
    決定れされる合成フィルタで合成信号を生成するフィル
    タリング部と、 前記音声信号と前記合成信号の距離を算出する距離算出
    部と、 前記距離を用いて遅延値が滑らかに変化する遅延符号を
    求めるピッチパス推定部と、 前記ピッチパス推定部で求められた遅延符号をもとに、
    過去の音源信号により最適な遅延符号を決定する適応コ
    ードブック探索部と、 最適な量子化符号を決定し、音源信号を生成する音源探
    索部と、 を有することを特徴とする音声符号化装置。
  3. 【請求項3】 音声信号の一定区間毎に前記音声信号の
    周波数特性を表す短期予測符号を決定する音声分析部
    と、前記音声信号を前記短期予測符号で決定される逆フィル
    タに通して 合成フィルタのインパルス応答を計算するイ
    ンパルス応答算出部と、 前記短期予測符号で決定される合成フィルタの残差信号
    を算出する逆フィルタ部と、 過去の音声区間における前記残差信号を蓄積する残差コ
    ードブックと、 前記音声信号のピッチ相関を表す遅延符号を試行させる
    遅延符号試行部と、 前記残差コードブックを用いて、前記遅延符号に対応す
    る遅延残差ベクトルを生成する遅延残差ベクトル生成部
    と、 前記音声信号と前記インパルス応答と前記遅延残差ベク
    トルとを用いて距離を算出する距離算出部と、 前記距離を用いて遅延値が滑らかに変化する最適な遅延
    符号を求めるピッチパス推定部と、を有することを特徴
    とする音声符号化装置。
  4. 【請求項4】 音声信号の一定区間毎に前記音声信号の
    周波数特性を表す短期予測符号を決定する音声分析部
    と、前記音声信号を前記短期予測符号から決定される逆フィ
    ルタに通して 合成フィルタのインパルス応答を計算する
    インパルス応答算出部と、 前記短期予測符号で決定される合成フィルタの残差信号
    を算出する逆フィルタ部と、 過去の音声区間における前記残差信号を蓄積する残差コ
    ードブックと、 前記音声信号のピッチ相関を表す遅延符号を試行させる
    遅延符号試行部と、 前記残差コードブックを用いて、前記遅延符号に対応す
    る遅延残差ベクトルを生成する遅延残差ベクトル生成部
    と、 前記音声信号と前記インパルス応答と前記遅延残差ベク
    トルとを用いて距離を算出する距離算出部と、 前記距離を用いて遅延値が滑らかに変化する遅延符号を
    求めるピッチパス推定部と、 前記ピッチパス推定部で求められた遅延符号をもとに、
    過去の音源信号により最適な遅延符号を決定する適応コ
    ードブック探索部と、 最適な量子化符号を決定し、音源信号を生成する音源探
    索部と、を有することを特徴とする音声符号化装置。
  5. 【請求項5】 前記ピッチパス推定部は、前記距離及び
    前記相関を用いて複数のサブフレームにわたるピッチパ
    スを算出するようにしたことを特徴とする請求項1また
    は3記載の音声符号化装置。
JP06323454A 1994-12-27 1994-12-27 音声符号化装置 Expired - Fee Related JP3087591B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP06323454A JP3087591B2 (ja) 1994-12-27 1994-12-27 音声符号化装置
EP95120601A EP0724252B1 (en) 1994-12-27 1995-12-27 A CELP-type speech encoder having an improved long-term predictor
CA002166138A CA2166138C (en) 1994-12-27 1995-12-27 A celp-type speech encoder having an improved long-term predictor
US08/578,910 US5924063A (en) 1994-12-27 1995-12-27 Celp-type speech encoder having an improved long-term predictor
DE69527345T DE69527345T2 (de) 1994-12-27 1995-12-27 CELP-Sprachkodierer mit verbessertem Langzeit-Prädiktor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06323454A JP3087591B2 (ja) 1994-12-27 1994-12-27 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH08179797A JPH08179797A (ja) 1996-07-12
JP3087591B2 true JP3087591B2 (ja) 2000-09-11

Family

ID=18154858

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06323454A Expired - Fee Related JP3087591B2 (ja) 1994-12-27 1994-12-27 音声符号化装置

Country Status (5)

Country Link
US (1) US5924063A (ja)
EP (1) EP0724252B1 (ja)
JP (1) JP3087591B2 (ja)
CA (1) CA2166138C (ja)
DE (1) DE69527345T2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024355B2 (en) * 1997-01-27 2006-04-04 Nec Corporation Speech coder/decoder
US9058812B2 (en) * 2005-07-27 2015-06-16 Google Technology Holdings LLC Method and system for coding an information signal using pitch delay contour adjustment
US20100049508A1 (en) * 2006-12-14 2010-02-25 Panasonic Corporation Audio encoding device and audio encoding method
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466671B (en) 2009-01-06 2013-03-27 Skype Speech encoding
GB2466669B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466670B (en) 2009-01-06 2012-11-14 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
US8452606B2 (en) 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5359696A (en) * 1988-06-28 1994-10-25 Motorola Inc. Digital speech coder having improved sub-sample resolution long-term predictor
JP2940005B2 (ja) * 1989-07-20 1999-08-25 日本電気株式会社 音声符号化装置
JP3254687B2 (ja) * 1991-02-26 2002-02-12 日本電気株式会社 音声符号化方式
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
小野「構造化ベクトル量子化に基づく3.6kb/s音声符号化方式の検討」信学技報SP92−134,pp9−16(1993.2.12)

Also Published As

Publication number Publication date
US5924063A (en) 1999-07-13
CA2166138A1 (en) 1996-06-28
JPH08179797A (ja) 1996-07-12
EP0724252B1 (en) 2002-07-10
EP0724252A2 (en) 1996-07-31
EP0724252A3 (en) 1998-02-11
DE69527345T2 (de) 2003-03-06
DE69527345D1 (de) 2002-08-14
CA2166138C (en) 2000-08-01

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
JP3490685B2 (ja) 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP3094908B2 (ja) 音声符号化装置
EP0501421B1 (en) Speech coding system
US20060074643A1 (en) Apparatus and method of encoding/decoding voice for selecting quantization/dequantization using characteristics of synthesized voice
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JPH04270400A (ja) 音声符号化方式
JP3087591B2 (ja) 音声符号化装置
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3266178B2 (ja) 音声符号化装置
US7680669B2 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JPH09319398A (ja) 信号符号化装置
JPH08328597A (ja) 音声符号化装置
JPH0830299A (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3249144B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JPH08185199A (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JPH1055198A (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070714

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080714

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090714

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100714

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100714

Year of fee payment: 10

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100714

Year of fee payment: 10

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110714

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110714

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120714

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120714

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130714

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees