JP3167787B2 - ディジタル音声コーダ - Google Patents

ディジタル音声コーダ

Info

Publication number
JP3167787B2
JP3167787B2 JP12643192A JP12643192A JP3167787B2 JP 3167787 B2 JP3167787 B2 JP 3167787B2 JP 12643192 A JP12643192 A JP 12643192A JP 12643192 A JP12643192 A JP 12643192A JP 3167787 B2 JP3167787 B2 JP 3167787B2
Authority
JP
Japan
Prior art keywords
excitation
pulse pattern
term
pulse
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP12643192A
Other languages
English (en)
Other versions
JPH05210399A (ja
Inventor
ハグクヴィスト ヤリ
イェルヴィネン カリ
エストラ カリ−ペッカ
ランタ ユッカ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of JPH05210399A publication Critical patent/JPH05210399A/ja
Application granted granted Critical
Publication of JP3167787B2 publication Critical patent/JP3167787B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声コーディング方法に
関する。より詳しくは、請求項1によって励起された音
声の線形予想コーディングに関する。本発明はまた該方
法を実現するコーダにも関係する。
【0002】
【従来の技術】効率的な音声コーディングの手順は、絶
えず発展している。従来技術において、たとえば、エム
・アール・シュレーデル(M.R.Schroeder)およびビー・
エス・アタル(B.S.Atal) による論文「ハイクオーリテ
ィー スピーチ アット ベリー ロー ビット レイ
ツ(High Quality Speach at Very Low Bit Rates )」
(IEEE 国際音響会議議事録、音声および信号処理(Pr
oceedings of IEEE International Conference of Acou
stics, Speech and Signal Processings)ICASS第3
巻、937 〜940 頁、1985年3月)において詳細に説明さ
れたCELPコーディングが知られている。
【0003】CELP式のアルゴリズムによるコーディング
は、従来技術において有効な手順と考えれるが、不利な
点は必要とする計算の電力が高いことである。CELPコー
ダは音声の発生をモデル化する複数のフィルタからな
り、該フィルタに対し適切な励起信号が1組の励起ベク
トルを有するコードブック(codebook) から選択され
る。CELPコーダは通常は、もとの音声信号の合成音声信
号が発生されるショートターム(short term)およびロ
ングターム(long term )のフィルタからなる。完全な
探索用のCELPコーダにおいて個々の音声ブロックに対し
てコードブックに記憶された各励起ベクトルが合成に適
用される。合成された音声信号はエラー信号を発生する
ためにもとの信号と比較される。つぎにエラー信号は人
間の聴覚応答に応じてエラー信号を形成する重みづけフ
ィルタ(weighting filter)をかけられ、聴覚によりよく
対応するコーディングエラー(coding error) に対する
ものさしとなる。処理される個々の音声ブロックに対す
る最適励起ベクトルすなわち、該当する音声ブロックに
対して最小の加重エラー信号を生成する励起ベクトル
は、コードブックから選択されることによりえられる。
たとえば、サンプリング周波数(sampling rate)が8kH
z であれば5msの長さを有するブロックは40個のサン
プルからなる。
【0004】
【発明が解決しようとする課題】励起に対する所望の変
換率が1サンプルについて0.25ビットであるとき、1024
個のランダムベクトルからなるランダムコードブックが
要求される。これらのベクトルの完全な探索は1秒あた
り120,000,000MAC(Mutiply and Accumulate) もの演算
量となる。そのような計算量は今日の信号処理技術にお
いて明らかに非現実的なタスクである。加えて、640kビ
ットのROM が1024個のベクトル(1024個のベクトルは、
1個のベクトルあたり40個のサンプルを有し各サンプル
が16ビットのワードにより表される)からなるコード
ブックを記憶することが必要とされるので記憶装置の消
費が実用的でない。
【0005】叙上の計算上の問題はよく知られており、
簡略化するために異なった提案が出されている。それに
よると計算負荷および記憶装置の消費が実質的に低減さ
れ、その結果リアルタイムで信号処理装置に関するCELP
アルゴリズムを実現できる。以下に2つの異なったアプ
ローチについて述べる。
【0006】(1)たとえば、離散的フーリエ変換を用
いて変換領域において探索手順を実行する。アイ・エム
・トランコソ(I.M.Trancoso) およびビー・エス・アタ
ル著「エフィーシエント プロシージュア フォア フ
ァインディング ザ オプティマム イノベーション
イン ストカスティック コーダー(Efficient Proced
ures for Finding the Optimum Innovation in Stochas
tic Coders)」(ICASSP議事録、第4巻2375〜2378頁、
1986年4 月)参照。
【0007】(2)ベクトル和の技術の利用;アイ・エ
ー・ゲルスホン(I.A.Gershon )およびエム・エー・ヤ
シウク(M.A.Jasiuk)著「ベクトル サム エキサイテ
ッドリニア プレディクション スピーチ コーディン
グ アット 8 k bit/s(Vector Sum Excited Linear
Prediction Speech Coding at 8 k bit/s )」(ICASSP
議事録、 461〜464 頁、1990年)本発明の目的はCELP式
のコーディング手順および実際的な適用に公知の方法よ
り適している方法を実現する装置を提供することであ
る。とくに本発明は容易に操作されるコードブックを開
発すると共により小さい計算機負荷およびより小さい容
量の記憶装置ですむ計算機能を生成する探索またはルッ
クアップ手順を開発することを目的とする。この目的は
高品質の音声が伝送速度10kbit/s以下で伝送されること
ができ、計算機負荷および記憶装置の消費に面倒な要求
を課すことなく今日の信号処理装置で容易に実行され
る、有効な音声コーディングに帰着する。
【0008】
【課題を解決するための手段】叙上の目的は請求項1の
特徴を有する本発明によるコーディング方法、すなわち (a)各ブロックにおける音声信号のショートタームス
ペクトルを特徴づける1組の予測パラメータa(i)が
ショートタームアナライザーにより発生される工程、 (b)パルスパターン励起v(i)が励起発生器により
発生される工程、 (c)ショートタームおよびロングターム合成フィルタ
がもとの音声信号s(n)から合成された音声信号ss
(n)を生成するために適切に励起される工程、および (d)減算手段においてエラー信号e(n)が、各励起
間隔において前記もとの音声信号s(n)と合成された
音声信号ss(n)の相違を表すように形成され、該励
起発生器が人間の聴覚特性にしたがってフィルタにより
重みづけられたエラー信号の所定の関数を最小にするよ
うに制御される工程、によりCELP式の線形予想コー
ダにおいてブロックごとにディジタル音声信号を処理す
る方法であって、(b-1)パルスパターン励起が励起間隔
に分割された励起発生器により発生され、それにより励
起が所定の数Kのパルスパターンからなる励起ベクトル
(n)であり、該励起ベクトルにより結合された適
切に遅延したパルスパターンがある数Pのパルスパター
ンを含むパルスパターンのコードブックから選択され、
(b-2)各励起間隔のあいだ、前記励起ベクトルによって
パルスパターンの位置を定義した励起パルスパターンの
遅延が選択され、かつ(b-3)パルスパターンの向きが選
択されることを特徴とするディジタル音声信号を処理す
る方法によって達成される。
【0009】本発明による方法をパルスパターン法と呼
んでおり、単純化された方法により有効な励起信号を発
生する手順と言ってよく、音声コーダ用に開発された最
適励起の探索手順と言ってもよい。該方法により励起が
適切に遅延されたパルスパターンの使用に基づき発生さ
れ励起ベクトルの始点に関し一定方向に向けられる。パ
ルスパターン法によるコーダをPPELP 音声コーダ(Pulse
Pattern Excited Linear Prediction) と呼んでいる。
励起ベクトルを有するコードブックは、個々の励起ベク
トルが励起ブロックの始点に関し適切に遅延したパルス
パターンの組み合わせとして形成されるとき有効に扱わ
れうる。ある限定した数(P個)のパルスパターンを有
するコードブックから当該コーダは、所定の数(L個)
のサンプルを有する励起ベクトルを形成するために結合
される所定の数(K個)のパルスパターンを選択する。
すべての励起を評価する代わりに合成フィルタは限られ
た数(P個)のパルスパターンのみを処理するが、該パ
ルスパターンによって形成されたすべての励起ベクトル
の組は処理しない、それにより最適の励起ベクトルを探
索する計算機負荷は低く保持される。本発明は、すべて
の励起ベクトルの代わりに限られた数P個のパルスパタ
ーンのみが記憶装置に記憶されることを要するという利
点を達成する。
【0010】本発明による方法は、3つの工程で実現さ
れる。すなわち、第1工程においてパルスパターン応答
を形成するためにパルスパターンがショートタームおよ
びロングターム合成フィルタによって処理され、第2工
程において固有の相関ベクトルがパルスパターン応答に
対して計算され、第3工程において励起ベクトルの組が
該相関ベクトルの組を用いて評価される。
【0011】本発明はまた、前記方法を実現するコーダ
を提供する。PPELP コーダはショートターム用線形予想
コーディングアナリシス(LPC analysis)、ショートター
ムおよびロングターム合成フィルタ、もとの音声信号と
合成音声信号との相違を表すエラー信号を形成する手
段、人間の聴覚によりエラー信号に重みづけをするフィ
ルタおよびパルスパターンを発生し、重みづけされた異
なる信号を最小にすべく励起発生器を制御する手段から
なる。完全な探索用のCELPコーダにおいて、すべての変
換された励起ベクトルはショートタームおよびロングタ
ーム合成フィルタにおいて処理されなくてはならない
が、本発明によるPPELP コーダにおいては少ないパルス
パターンだけがフィルタをかけられる。本発明により、
最適な結果を探索するあいだ、最小のエラーを生成する
励起ベクトルに対応する励起発生器のパルスパターンの
パラメータが選択される。
【0012】
【作用】本発明によって励起された線形予想のパルスパ
ターンは信号処理装置を用いてCELP式のコーダのリアル
タイムの実行を容易に実行することを可能にする。前述
のばあい(1024個の励起ベクトル)において、本発明に
よるPPELP コーダは全体の探索処理にたいしては1秒あ
たり2,000,000MACの演算量となるので、1信号処理につ
いて容易に実行される。すべての励起ベクトルの代わり
にパルスパターンのみが記憶されるので、コードブック
の必要性が実質的に取り除かれたと言ってよい。こうし
てリアルタイムの操作が通常の電力消費で達成される。
【0013】つぎに、添付図面を参照しながら実施例に
より本発明を詳細に説明する。
【0014】
【実施例】図1は本発明によるパルスパターン法を用い
るCELP式エンコーダの一般的なブロック線図、図2は図
1のエンコーダに対応するデコーダを示しており、図3
はPPELP エンコーダのブロック線図、図4は本発明によ
るパルスパターン発生器を示しており、そして図5はPP
ELP コーダのブロック線図の要部である。
【0015】本発明によるPPELP コーディングを示すた
めに、図1はPPELP 法が実行されるCELP式コーダのブロ
ック線図を示している。該コーダは1組の線形予想パラ
メータa(i)を形成するショートタームアナライザ1
からなる。ここに、i=1,2,...,mであり mはアナリシス
のオーダーである。パラメータの組a(i)は音声信号
のスペクトル量を表し、N個のサンプル(Nの長さは通
常20msの間隔に相当する)について個々の音声ブロック
に対して計算される。図によるコーダはショートターム
合成フィルタ4(フォルマント)以外にロングターム合
成フィルタ5(ピッチ)も利用する。ロングターム合成
フィルタに対するパラメータはアナライザ9において計
算される。フィルタ2は、人間の聴覚の特徴にもとづき
減算手段8により形成されるエラーe(n)が聴覚によ
り重要でない周波数を減じ、そして聴覚によるエラーが
重要である周波数を増幅するために用いられる。L個の
サンプルの個々の励起ブロックに対する励起は励起発生
器3において励起ベクトルの始点に関して適切に遅延し
たパルスパターンを共に結合することにより形成され
る。パルスパターンはコードブック10に記憶される。
CELP式コーダでの完全な探索において、すべての計数化
された(scaled) 励起ベクトルv(n)はショートタ
ームおよびロングターム合成フィルタ4および5で処理
されなくてはならないが、おのおのPPELP コーダにおい
て、フィルタはパルスパターンのみ処理する。コードブ
ック探索制御装置6は励起発生器3を制御し、もとの音
声信号s(n)と合成された音声信号ss(n)との重
みづけられた差違に依存する制御パラメータu(パル
スパターンコードブックにおけるパルスパターンの位
置)、d(励起ベクトルにおけるパルスパターンの位
置、すなわち、ブロックの始点に関する遅延)、o
(パルスパターンの向き(orientation ))を形成す
るために用いられる。評価工程のあいだ重みづけられた
最小エラーe(n)へと導くパルスパターンコードは
最適状態として選択される。乗算手段7にスケールファ
クターgが供給されるが、その最適状態はパルスパタ
ーンパラメータの探索との関連で以下に詳細に述べる。
コードパラメータはブロック11において多重化され
る。エンコード部において用いられるすべてのパラメー
タは合成フィルタにおいて用いられるまえに量子化され
ることは注目されなくてはならない。デコーダの機能は
図2に示されている。復号(decoding)中、デマルチプ
レクサ(demutiplexer)17は量子化されたコーディング
パラメータを供給する。パルスパターンコードブック1
3およびパルスパターン励起発生器12は乗算器14に
おいて計数化されロングターム合成フィルタ15および
出力として復号化された音声信号ss(n)を供給する
ショートターム合成フィルタに供給されるパルスパター
ン励起信号v(n)を形成するために用いられる。PP
ELP エンコーダの基本的なブロック線図が図3に示さ
れ、さまざまな計算を示している。分析されるべき音声
信号はマイクロフォン19に通され、それから代表的に
は帯域型のフィルタ20に通される。帯域のフィルタが
かけられたアナログ信号はA/D変換器24を用いて連
続したディジタル信号に変換される。本実施例において
サンプリング周波数として8kHzが用いられている。もと
の音声信号のディジタル表現はLPC 係数アナライザ21
へと進められ、そこでN個のサンプルを有する各音声ブ
ロックに対して1組のLPC パラメータ(本実施例におい
てN=160)はそれ自体が公知の手順を用いて生成され
る。その結果はショートターム予想パラメータa(i)
である。ここにi=1,2,..,m( 本実施例においてm=10) が
マルチプレクサに通され、チャネルに送られる。パラメ
ータはデコーダのみならずエンコーダにおいて合成手順
に用いられる。
【0016】ショートターム合成フィルタは1/A
(z)の式で表せる。ここにA(z)は式1すなわち
【0017】
【数1】
【0018】で表わされる。
【0019】LPCパラメータを生成する方法は、たと
えばベー.エス.スタル著の論文「低ビット伝送速度で
の音声の予想コーディング」(IEEE 委員会議事録、Vo
l COM-30,600〜614 頁,1982 年4月)において述べられ
ている。
【0020】PPELP コーダにおいてパルスパターンコー
ドブック27に記憶されたパルスパターンは、パルスパ
ターンに対する応答をえるために、ロングターム合成フ
ィルタ28およびショートターム合成フィルタ29にお
いて処理されなければならない。乗算ブロック36にお
いて用いられているスケールファクターgは最適の励
起ベクトルの探索と関連して計算される。更新された音
声信号ss(n)は零入力予想分岐(zero input pred
iction branch)およびロングターム予想分岐e
1tp (n)により修正された音声信号と比較されその結
果、差信号(differencesignal) e(n)が減算手段
38において形成される。該差信号は、アナライザ21
において生成されたロングターム予想係数を利用して重
みづけフィルタブロック30により重みづけられる。式
2すなわち
【0021】
【数2】
【0022】で表される。L個のサンプルを有し、最小
のエラーを与える励起ベクトルv(n)のパルスパタ
ーンパラメータ(uj , dj , oj )は、パルスパター
ンコードブックの制御装置34を用いて探索されると共
に、デコーダ(本実施例のばあいL=40)への最適な励
起パラメータとしてチャネルに伝達される。乗算ブロッ
ク37において用いられる最適スケールファクターg
c,opt も伝達されなければならない。重みづけ係数yは
典型的な例として1.0 よりわずかに小さい値をとる。本
実施例においてyは0.83が選択される。探索手順は励起
コードブック制御装置34により制御される。
【0023】コーダは1/P(z)の式で表される合成
フィルタを有する1タップのロングターム合成フィルタ
をショートターム合成フィルタと別々に用いる。ここに
P(z)は、式3すなわち、 P(z)=1−bz-M (3) で表せる。
【0024】好ましい実施例においてロングターム予想
パラメータbおよびMはB個のサンプル(本実施例にお
いてB=40)の各LTP ブロックに対して解析−合成手順
(閉ループLTP )を用いて評価される。ロングターム合
成フィルタのパラメータはコードブックの検索と似た方
法で計算される。ロングターム合成パラメータ用の閉ル
ープ探索は適合するコードブックを用いると解釈されて
よく、該コードブックにおいて時間遅れMがコードブッ
ク42から選択された励起ベクトルのコードブックにお
ける位置を規定し、bはスケールファクターg1tp に対
応する。ロングターム予想パラメータは実際のパルスパ
ターン励起と同時に計算されるべきであるが、このアプ
ローチは複雑である。したがって、以下に述べる2段階
の手順が本実施例においては好ましい。
【0025】第1工程においてLTP パラメータは重みづ
けられたエラーe1tp (n)を最小にすることによって
計算され、第2工程において最適励起ベクトルe
(n)を最小にすることによって探索される。このこ
とは第2のショートタームおよびロングターム合成フィ
ルタ23および39の組を有する第2の合成分岐、減算
手段40、第2の重みづけフィルタ25およびコードブ
ック探索制御装置26の使用へと導く。乗算器35にお
いて用いられたロングタームスケールファクターg1tp
は最適パラメータとの関係で計算される。合成フィルタ
22から先の励起ベクトルまたは零入力応答no(n)
の効果は、探索処理において減算手段41により入力音
声信号s(n)から減じられうるような効果がないこと
に注意されなければならない。状態変数(ショートター
ム合成フィルタのLTP コードブックおよび状態変数t
(i)、ここにi=1,2,...m)が、励起発生器
31からの最適パルスパターンを乗算器37において適
切に増幅され、ロングタームおよびショートターム合成
フィルタ32および33へ供給することにより更新され
る。
【0026】比較的小規模のLTP コードブックの評価
は、通常のかなり大規模の固定コードブックの評価ほど
複雑なタスクではない。再帰技術およびインパルス応答
の切り捨てを用いれば、ロングターム予想パラメータが
最適化されるとき閉ループ最適化手順における計算上の
要件が合理的にされうる。以下に実際の励起ベクトルを
有するコードブックからの最適励起ベクトルの探索につ
いて述べる。
【0027】図3は主として、エンコーダの機能を示し
ており、簡略化のため以下に述べるパルスパターンにも
とづく励起信号の最適化方法の完全な記述を含んでいな
い。以下に述べる図5は、パルスパターン技術がどのよ
うに用いられるかについてさらに詳細な記述を与えてい
る。
【0028】図4は本発明による励起発生器51を示し
ており、図1における発生器3、図2における発生器1
2および図3の励起発生器31に対応している。PPELP
コーダにおいて各励起ベクトルは、1組のPパルスパタ
ーンp(n)を含むコードブック50からKパルスパ
ターン全体を選択することにより形成される。ここにj
は1≦j≦pである。パルスパターンの選択ブロック5
2により選択されたパルスパターンは加算器55におい
て励起ベクトルv(n)を生成するために遅延ブロッ
ク53および方向化(orientation)ブロック54におい
て採用されている。ここにiは励起ベクトルの連続した
数である。
【0029】(2P)K L K )励起ベクトルの総計は
励起発生器においてパルスパターン方法により発生され
うる。ここに(2P)K L K )は
【0030】
【数3】
【0031】であり、
【0032】
【数4】
【0033】である。すべての励起ベクトルの半分は他
の半分と符号が逆であり、最適励起ベクトルが合成フィ
ルタによって探索されるとき、該励起ベクトルを処理す
る必要はないがスケールファクターgが負の値を有す
るときにえられる。評価された励起ベクトルv(n)
(ここに、i=1,2,...,(2P)K L K )/
2およびn=0,1,2,...,L−1)が式4すな
わち
【0034】
【数5】
【0035】で表される。ここに、u(1≦j≦K)
はパルスパターンコードブック(1≦u≦P)におけ
るj番めのパルスパターンの位置を定義し、dj は励起
ベクトル(0≦d≦L−1)におけるパルスパターン
の位置を定義し、そしてoは向き(+1または−1)
を定義する。パルスパターン技術にもとづくパルスパタ
ーンの励起効果は、合成フィルタにおいて所定の数P個
のパルスパターン(p1(n),p2 (n),...,
P (n))のみを処理することによって評価されう
る。こうして励起ベクトルの評価は、きわめて能率的に
実行されうる。パルスパターン方法のさらに有利な点
は、限られた数のパルスパターンのみが(2P)K L
K )個のベクトルの組全体の代わりに記憶される必要が
あることである。高品質の音声が2種類のパルスパター
ンだけを用いることによって提供されうる。このことに
より探索処理において全体として小規模の計算機負荷を
必要とするにすぎず、2種類のパルスパターンのみが記
憶装置に記憶されなくてはならないことに帰着する。し
たがって、本発明によるコーディングのアルゴリズム
は、全体として小規模の計算機負荷および少ない記憶装
置を必要とするにすぎない。PPELP コーディング方法の
より詳しい記載を与えることが図5の目的である。図5
は、図3のエンコーダの一部を示しておりパルスパター
ン励起の最適化を詳細に示している。式2による重みづ
けフィルタ(図3におけるフィルタ30および25)
は、減算手段(図3における38および40)の出力か
ら離されていることが注意されなければならない。その
結果、対応する機能は、減算手段の前のフィルタ50、
51および57に置かれている。ショートターム予想因
子は、 LPCアナライザ65において計算される。この組
み合わせにおいて、 LTP遅延Mは、パルスパターン励起
ベクトルの長さより大きい値に限られる。ロングターム
予想は先のパルスパターン励起ベクトルにもとづいてい
る。この結果は、ロングターム合成はパルスパターン励
起の探索処理に含まれてはならないことになる。このア
プローチは実質的にコーディングシステムを簡易化す
る。先の音声ブロックの効果は減算手段52により重み
づけられた音声信号sw (n)から減じられる。ロング
ターム合成フィルタの影響は、パルスパターンの最適化
の前の減算手段53において減じられる。パルスパター
ン励起パラメータを最適化するために、コードブック5
4に含まれるパルスパターンの応答は合成フィルタ57
により形成され、パルスパターン励起の品質の実際の評
価は、相関器(correlator)55および58によって実行
される。最適パラメータは、探索制御装置56により供
給され、パルスパターン選択ブロック59、遅延発生器
63および方向化ブロック64により最適励起を生成す
る。合成フィルタの状態変数は、生成された励起が乗算
ブロック60により計数化され合成フィルタ61および
62に通されることにより更新される。パルスパターン
励起パラメータの最適化については以下に述べる。
【0036】パルスパターンコードブックの探索処理
は、式5すなわち
【0037】
【数6】
【0038】を最小にするパルスパターン励起パラメー
タを見出ださなければならない。ここにe1tp (n)は
モデル化される信号である、すなわち重みづけられた音
声信号から零入力応答およびロングターム合成の影響を
減じたあとに重みづけられたもとの音声信号;ssc,i
(n)はi番めの励起ベクトルv(n)を用いて合成
される音声信号である。このことは、式6すなわち Ri 2 /Ai (6) の最大値を探索することへと導く。ここにRi は、式7
すなわち
【0039】
【数7】
【0040】で表され、Ai は、式8すなわち
【0041】
【数8】
【0042】で表される。
【0043】式4を最小にする最適コードベクトルv
iopt(n)は最適励起として選択され、添字ioptは連続
的な数である。最適パルスパターン探索との関係でスケ
ールファクターgが最適化され、最適スケールファク
ターgc,opt をえる。該最適スケールファクターg
c,opt は、式9すなわち wiopt=gc,opt iopt(n) (9) で表される最適励起wioptを生成しデコーダにおける合
成フィルタおよびエンコーダにおける最適分岐に供給さ
れるために用いられる。
【0044】最適スケールファクターgc,opt は、R
iopt/Aioptによりえられる。各励起ベクトルに対して
重みづけられた合成フィルタ応答h(n)は、式10
すなわち
【0045】
【数9】
【0046】によってえられる。ここにnは、0≦n≦
L−1であり、u j (n)はパルスパターンu
j (n)に対する重みづけ合成フィルタ57の応答であ
る。
【0047】コードブック探索はパルスパターンの相関
ベクトルを用いて効率的に実行される。各励起ベクトル
(n)に対する相関項は、式11すなわち
【0048】
【数10】
【0049】によって表されるパルスパターン相関ベク
トルr(n)を用いて計算されうる。ここにnは、0
≦n≦L−1である。
【0050】パルスパターン相関ベクトルは、各パルス
パターン(k=1,2,...,P)に対して計算され
る。モデル化される信号ベクトルに関し個々の励起ベク
トルiに対応して生成される相互相関Rは、単に式1
2すなわち
【0051】
【数11】
【0052】の形で計算されうる。該相互相関Rは、
K個のパルスパターンの組み合わせとして形成され、パ
ルスパターンコードブックにおけるパルスパターンの位
置u、パルスパターンの遅延dおよび向きoによ
り定義される。
【0053】これに対応して、合成された音声信号に対
する自己相関Aは式13すなわち
【0054】
【数12】
【0055】により計算されうる。ここに、パルスパタ
ーンに対する相互相関項は式11すなわち
【0056】
【数13】
【0057】によってえられる。
【0058】パルスパターン励起のテストが、相互相関
項rrk1k2(n1 , n2 )の計算について知覚できる方
法で処理されるとき、前に計算されたパルスパターン相
互相関項が当該計算において利用されることができ、計
算の負荷および記憶装置の消費を低レベルに保つ。励起
パルスパターン技術は励起フレームの終りから始まるパ
ルスパターンの位置決めおよび該パルスパターンに対す
る相関を順に数えることによりパルスパターン励起の最
適化を開始するために利用される。当該最適化において
パルスパターン間の距離を変えることなく1個のサンプ
ルにより励起フレームの始点へと動かされる。そこでパ
ルスパターンの相互相関が、前の値に対する新しい乗算
された項の加えることにより動かされたパルスパターン
の組み合わせに対して計算されうる。
【0059】実施例におけるパルスパターン方法が以下
の3工程からなることは叙上の記載から理解されうる。
【0060】第1工程において、すべてのパルスパター
ンが合成フィルタにかけられ、P個のパルスパターン応
答hk (n)が生じる。ここにk=1,2,...P。
【0061】第2工程おいて、L個のパルスパターン遅
延に対し、ロングターム合成結果が音声信号から減じら
れる信号e1tp と各パルスパターン応答が計算され、そ
の手順により相関ベクトルrk (n)が生じる。該ベク
トルの長さはL個のサンプルであり、P個のパルスパタ
ーンに対して計算される。
【0062】第3工程において、各パルスパターンの効
果はAおよびRを計算し、これにもとづき最適励起
を選択することにより評価される。励起ベクトルとの関
連において、相互相関項rrk1k2(n1 ,n2 )が、各
パルスパターンの組み合わせに対して反復して計算され
る。
【0063】本発明によれば、2工程で最適化またはパ
ルスパターンの位置決めを実行することにより叙上のパ
ルスパターンの最適化の計算機負荷をさらに低減でき
る。第1工程において、励起ブロックの始点に関するパ
ルスパターン遅延(パルスパターン励起における位置決
め)は、各パルスパターンp(n)に対して遅延値を
用いて探索される。
【0064】該遅延値の差異(格子の間隔)はD個の
サンプルまたはDの倍数である。第1工程において、
式15すなわち
【0065】
【数14】
【0066】で表される組み合わせが評価される。ここ
にr=0,1,...,[(L−1)/Dj ]であり、
[ ]内の関数(L−1)/Dj は、ここでは整数値に
切り捨てる手段である。
【0067】叙上の探索は、励起に含められるべき各パ
ルスパターンjに対して、間隔Djを有する格子の最適
遅延値ddj (1≦j≦K)に帰着する。
【0068】第2工程は、工程1において見出だされた
最適遅延値の近傍に位置する遅延値ddj −(Dj
1)、ddj −(Dj −2),...,ddj −2,d
j −1,ddj +1,ddj +2,ddj +(Dj
2),ddj +(Dj −1)のテストからなる。この第
2工程において新しい最適化サイクルは、すべてのパル
スパターンの励起パラメータに対して、第1工程にした
がって実行されるが、該ddj の近傍における前記遅延
値に限られる。その結果最終的なパルスパターンのパラ
メータud、およびoがえられる。
【0069】
【発明の効果】励起ベクトルにおけるパルスパターンの
位置決めに対する該2工程の探索は、もし格子間隔D
が合理的に小規模に保たれておれば、該方法により提供
される本主題の品質を低下することなく、叙上の値から
PPELP コーダの計算機負荷をさらに低減できる。たとえ
ば、K=2に対しD=1およびD=3の格子の間隔
の使用は良好なコーディング結果を生じる。
【0070】当業者にとっては、前記実施例を変更する
ことによる異なった方法で特許請求の範囲およびその範
囲から逸脱することなく本発明の概念を採用できること
は叙上の記載から自明であろう。
【図面の簡単な説明】
【図1】本発明の半導体装置の一実施例を示す斜視図。
【図2】本発明によるパルスパターン法を用いるCELPエ
ンコーダの一般的なブロック線図。
【図3】図1のエンコーダに対応するデコーダ。
【図4】PPELP エンコーダのブロック線図。
【図5】PPELP コーダのブロック線図の要部のブロック
線図。
【符号の説明】
2 重みづけフィルタ 3、12、51 パルスパターン励起発生器 4、16 ショートターム合成フィルタ 5、15 ロングターム合成フィルタ 10、27、54、70 パルスパターンコードブック
───────────────────────────────────────────────────── フロントページの続き (72)発明者 カリ−ペッカ エストラ フィンランド共和国、エスエフ−90140 オウル、リーヒカツ 23 アス 3 (72)発明者 ユッカ ランタ フィンランド共和国、エスエフ−24130 サロ、ラシンプハルタヤンカツ 5 アス 1 (56)参考文献 特開 平1−293400(JP,A) 特開 昭64−40899(JP,A) 特表 平2−502135(JP,A)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 (a)各ブロックにおける音声信号のシ
    ョートタームスペクトルを特徴づける1組の予測パラメ
    ータa(i)がショートタームアナライザーにより発生
    される工程、 (b)パルスパターン励起v(i)が励起発生器により
    発生される工程、 (c)ショートタームおよびロングターム合成フィルタ
    がもとの音声信号s(n)から合成された音声信号ss
    (n)を生成するために適切に励起される工程、および (d)減算手段においてエラー信号e(n)が、各励起
    間隔において前記もとの音声信号s(n)と合成された
    音声信号ss(n)の相違を表すように形成され、該励
    起発生器が人間の聴覚特性にしたがってフィルタにより
    重みづけられたエラー信号の所定の関数を最小にするよ
    うに制御される工程、によりCELP式の線形予想コー
    ダにおいてブロックごとにディジタル音声信号を処理す
    る方法であって、(b-1)パルスパターン励起が励起間隔
    に分割された励起発生器により発生され、それにより励
    起が所定の数Kのパルスパターンからなる励起ベクトル
    (n)であり、該励起ベクトルにより結合された適
    切に遅延したパルスパターンがある数Pのパルスパター
    ンを含むパルスパターンのコードブックから選択され、
    (b-2)各励起間隔のあいだ、前記励起ベクトルによって
    パルスパターンの位置を定義した励起パルスパターンの
    遅延が選択され、かつ(b-3)パルスパターンの向きが選
    択されることを特徴とするディジタル音声信号を処理す
    る方法。
  2. 【請求項2】 該パルスの位置の最適化がPパルスパタ
    ーンの合成フィルタ応答を使用する複合技術により実行
    されることを特徴とする請求項1記載の方法。
  3. 【請求項3】 各励起ブロックにおけるパルスパターン
    が、(b-2a)該パルスパターンのパラメータが該格子点に
    おいてパルスパターンの最適位置ddがえられる等距
    離格子を用いて探索される工程、および(b-2b)該パルス
    パターンの第2最適化が前記工程でえられる位置dd
    付近に限定して実行される工程により最適化される請求
    項1または2記載の方法。
  4. 【請求項4】 請求項1、2または3記載のパルスパタ
    ーン励起コーディングを用いることを特徴とする線形予
    想コーダ。
JP12643192A 1991-05-20 1992-05-19 ディジタル音声コーダ Expired - Fee Related JP3167787B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI912438 1991-05-20
FI912438A FI98104C (fi) 1991-05-20 1991-05-20 Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi

Publications (2)

Publication Number Publication Date
JPH05210399A JPH05210399A (ja) 1993-08-20
JP3167787B2 true JP3167787B2 (ja) 2001-05-21

Family

ID=8532557

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12643192A Expired - Fee Related JP3167787B2 (ja) 1991-05-20 1992-05-19 ディジタル音声コーダ

Country Status (5)

Country Link
US (1) US5327519A (ja)
EP (1) EP0515138B1 (ja)
JP (1) JP3167787B2 (ja)
DE (1) DE69227650T2 (ja)
FI (1) FI98104C (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5717824A (en) * 1992-08-07 1998-02-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear predictor with multiple codebook searches
WO1994007239A1 (en) * 1992-09-16 1994-03-31 Fujitsu Limited Speech encoding method and apparatus
US5864650A (en) * 1992-09-16 1999-01-26 Fujitsu Limited Speech encoding method and apparatus using tree-structure delta code book
FI95086C (fi) * 1992-11-26 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin tehokkaaksi koodaamiseksi
FI96248C (fi) * 1993-05-06 1996-05-27 Nokia Mobile Phones Ltd Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin
FI94810C (fi) * 1993-10-11 1995-10-25 Nokia Mobile Phones Ltd Menetelmä huonon GSM-puhekehyksen tunnistamiseksi
CA2137756C (en) * 1993-12-10 2000-02-01 Kazunori Ozawa Voice coder and a method for searching codebooks
JP2979943B2 (ja) * 1993-12-14 1999-11-22 日本電気株式会社 音声符号化装置
IT1271182B (it) * 1994-06-20 1997-05-27 Alcatel Italia Metodo per migliorare le prestazioni dei codificatori vocali
FR2729244B1 (fr) * 1995-01-06 1997-03-28 Matra Communication Procede de codage de parole a analyse par synthese
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2732148B1 (fr) * 1995-03-24 1997-06-13 Sgs Thomson Microelectronics Determination d'un vecteur d'excitation dans un codeur celp
JPH08272395A (ja) * 1995-03-31 1996-10-18 Nec Corp 音声符号化装置
JPH08292797A (ja) * 1995-04-20 1996-11-05 Nec Corp 音声符号化装置
US5778026A (en) * 1995-04-21 1998-07-07 Ericsson Inc. Reducing electrical power consumption in a radio transceiver by de-energizing selected components when speech is not present
US5864797A (en) * 1995-05-30 1999-01-26 Sanyo Electric Co., Ltd. Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
JP3616432B2 (ja) * 1995-07-27 2005-02-02 日本電気株式会社 音声符号化装置
US5867814A (en) * 1995-11-17 1999-02-02 National Semiconductor Corporation Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method
JP3137176B2 (ja) * 1995-12-06 2001-02-19 日本電気株式会社 音声符号化装置
FR2742568B1 (fr) * 1995-12-15 1998-02-13 Catherine Quinquis Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application
DE19641619C1 (de) * 1996-10-09 1997-06-26 Nokia Mobile Phones Ltd Verfahren zur Synthese eines Rahmens eines Sprachsignals
CN1262994C (zh) * 1996-11-07 2006-07-05 松下电器产业株式会社 噪声消除器
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
CN1124590C (zh) * 1997-09-10 2003-10-15 三星电子株式会社 改善话音信号编码器性能的方法
CN100349208C (zh) * 1997-10-22 2007-11-14 松下电器产业株式会社 扩散矢量生成方法及扩散矢量生成装置
FI980132A (fi) 1998-01-21 1999-07-22 Nokia Mobile Phones Ltd Adaptoituva jälkisuodatin
WO1999041737A1 (en) * 1998-02-17 1999-08-19 Motorola Inc. Method and apparatus for high speed determination of an optimum vector in a fixed codebook
JP3199020B2 (ja) * 1998-02-27 2001-08-13 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
US6782361B1 (en) 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
CN1242379C (zh) 1999-08-23 2006-02-15 松下电器产业株式会社 音频编码装置
US6980948B2 (en) * 2000-09-15 2005-12-27 Mindspeed Technologies, Inc. System of dynamic pulse position tracks for pulse-like excitation in speech coding
US6789059B2 (en) * 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search
ATE520121T1 (de) * 2006-02-22 2011-08-15 France Telecom Verbesserte celp kodierung oder dekodierung eines digitalen audiosignals
JPWO2007129726A1 (ja) * 2006-05-10 2009-09-17 パナソニック株式会社 音声符号化装置及び音声符号化方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
US4910781A (en) * 1987-06-26 1990-03-20 At&T Bell Laboratories Code excited linear predictive vocoder using virtual searching
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
IT1224453B (it) * 1988-09-28 1990-10-04 Sip Procedimento e dispositivo per la codifica decodifica di segnali vocali con l'impiego di un eccitazione a impulsi multipli
CA2019801C (en) * 1989-06-28 1994-05-31 Tomohiko Taniguchi System for speech coding and an apparatus for the same
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
JPH0451199A (ja) * 1990-06-18 1992-02-19 Fujitsu Ltd 音声符号化・復号化方式

Also Published As

Publication number Publication date
DE69227650D1 (de) 1999-01-07
EP0515138A2 (en) 1992-11-25
FI98104C (fi) 1997-04-10
JPH05210399A (ja) 1993-08-20
US5327519A (en) 1994-07-05
FI912438A0 (fi) 1991-05-20
EP0515138B1 (en) 1998-11-25
FI912438A (fi) 1992-11-21
DE69227650T2 (de) 1999-06-24
EP0515138A3 (en) 1993-06-02
FI98104B (fi) 1996-12-31

Similar Documents

Publication Publication Date Title
JP3167787B2 (ja) ディジタル音声コーダ
Spanias Speech coding: A tutorial review
AU656787B2 (en) Auditory model for parametrization of speech
US5265190A (en) CELP vocoder with efficient adaptive codebook search
EP1141946B1 (en) Coded enhancement feature for improved performance in coding communication signals
KR100421226B1 (ko) 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
EP0175752B1 (en) Multipulse lpc speech processing arrangement
EP0673014A2 (en) Acoustic signal transform coding method and decoding method
EP0745971A2 (en) Pitch lag estimation system using linear predictive coding residual
Ding et al. Simultaneous estimation of vocal tract and voice source parameters based on an ARX model
US5884251A (en) Voice coding and decoding method and device therefor
JPH06161498A (ja) 音声信号のディジタルコード化方法およびこの方法を実現するためのエンコーダならびにデコーダ
US5173941A (en) Reduced codebook search arrangement for CELP vocoders
CA1219079A (en) Multi-pulse type vocoder
US5434947A (en) Method for generating a spectral noise weighting filter for use in a speech coder
KR20060030012A (ko) 스피치 코딩 방법 및 장치
US5657419A (en) Method for processing speech signal in speech processing system
Robinson Speech analysis
US5937374A (en) System and method for improved pitch estimation which performs first formant energy removal for a frame using coefficients from a prior frame
JPH0782360B2 (ja) 音声分析合成方法
EP0713208B1 (en) Pitch lag estimation system
JP3552201B2 (ja) 音声符号化方法および装置
JP3163206B2 (ja) 音響信号符号化装置
JP3192051B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees